JP2007520217A - Novel nucleotide and amino acid sequences, and assays and methods of use for breast cancer diagnosis using the same - Google Patents

Novel nucleotide and amino acid sequences, and assays and methods of use for breast cancer diagnosis using the same Download PDF

Info

Publication number
JP2007520217A
JP2007520217A JP2006550364A JP2006550364A JP2007520217A JP 2007520217 A JP2007520217 A JP 2007520217A JP 2006550364 A JP2006550364 A JP 2006550364A JP 2006550364 A JP2006550364 A JP 2006550364A JP 2007520217 A JP2007520217 A JP 2007520217A
Authority
JP
Japan
Prior art keywords
pea
sequence
amino acid
polypeptide
amino acids
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006550364A
Other languages
Japanese (ja)
Other versions
JP2007520217A5 (en
Inventor
トポリク,アミル
ダハリ,ドゥビル
ソレク,ロテム
ポロック,サラ
レビン,ズリット
アキヴァ,ピンチャス
ディベル,アレキサンダー
ノヴィク,アミト
セラ−タヴォル,オスナット
アヤロン−ソファー,マイケル
ワラチ,シラ
サメア−グリーンワルド,シャ−リー
シェメシ,ロネン
ケレン,ナオミ
シクラー,マキシム
Original Assignee
コンピュゲン ユーエスエイ,インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コンピュゲン ユーエスエイ,インク. filed Critical コンピュゲン ユーエスエイ,インク.
Priority claimed from PCT/IB2005/000433 external-priority patent/WO2005072050A2/en
Publication of JP2007520217A publication Critical patent/JP2007520217A/en
Publication of JP2007520217A5 publication Critical patent/JP2007520217A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

高感度、且つ正確な乳癌の新規マ−カ−。これらのマ−カ−は、正常乳房組織と対照的に乳癌において特異的に過剰発現する。患者サンプルについて、これらのマ−カ−の単独または組み合わせての測定は、診断医が適切な乳癌診断と関連付けることができる情報を提供する。本発明のマ−カ−は、単独または組合せて乳癌状態と非癌状態との間で明瞭に区別されて検出される。A new marker for breast cancer with high sensitivity and accuracy. These markers are specifically overexpressed in breast cancer as opposed to normal breast tissue. For patient samples, measurement of these markers alone or in combination provides information that a diagnostician can associate with an appropriate breast cancer diagnosis. The markers of the present invention are detected with a clear distinction between breast and non-cancerous conditions, alone or in combination.

Description

発明の分野
本発明は、乳癌の診断マ−カ−である新規ヌクレオチドおよびタンパク質の配列、ならびにそれを使用するアッセイおよび方法に関する。
The present invention relates to novel nucleotide and protein sequences that are diagnostic markers of breast cancer, as well as assays and methods using them.

発明の背景
乳癌は、女性に発生する最も一般的な癌であり、女性の全悪性腫瘍のほぼ1/3がこれに含まれる。乳癌は米国の40〜55歳の女性における第一の死因であり、米国では8人に1人の女性が、その生涯に乳癌を発症する。
BACKGROUND OF THE INVENTION Breast cancer is the most common cancer that occurs in women and includes almost one third of all malignant tumors in women. Breast cancer is the leading cause of death in women aged 40 to 55 years in the United States, and 1 in 8 women in the United States develop breast cancer during their lifetime.

乳癌の死亡率は過去十年間に、発見、腫瘍のタイプの判定(および、その結果としての治療選択)、治療および再発への応答を促進する分子マ−カ−の利用によって徐々に下がっている。   Breast cancer mortality has been declining gradually over the past decade due to discovery, tumor type determination (and consequent treatment choices), the use of molecular markers to facilitate treatment and response to recurrence .

最も広く用いられている乳癌の血清マ−カ−は、ムチン1(CA15−3として測定される)とCEA(胎児性癌抗原)である。ムチン1(MUC1)は、正常な上皮細胞の上面に在る。その細胞外ドメインは、VNTR(変動数タンデムリピ−ト)と呼ばれる20個のアミノ酸配列が様々な回数反復して作られた、強くO−結合したグリコシル化ペプチドのコアからなる。この変動性によってMUC1には自然多形が存在する。各VTNRは、5カ所の潜在的O−結合部位を有している。乳癌の疾患状態はムチンをグリコシル化する酵素を変化させるため、腫瘍関連MUC1の多糖類側鎖は一般に正常発現した分子のそれに比べ短い。MUC1の異常およびアップレギュレ−ションした発現は共に悪性腫瘍の特徴であり、MUC1関連マ−カ−はこれに基づいたものである。CA15−3は広く用いられている乳癌マ−カ−であるが、CA15−3とCEAの組合せは、単独マ−カ−を用いる場合に比べて、より高感度である。   The most widely used serum markers for breast cancer are mucin 1 (measured as CA15-3) and CEA (fetal cancer antigen). Mucin 1 (MUC1) is on the upper surface of normal epithelial cells. Its extracellular domain consists of a core of strongly O-linked glycosylated peptides made by repeating the 20 amino acid sequence called VNTR (variable number tandem repeat) various times. Due to this variability, natural polymorphism exists in MUC1. Each VTNR has 5 potential O-binding sites. Because the disease state of breast cancer alters the enzyme that glycosylates mucin, the polysaccharide side chain of tumor-associated MUC1 is generally shorter than that of a normally expressed molecule. Both abnormal and up-regulated expression of MUC1 are characteristic of malignant tumors, and MUC1-related markers are based on this. CA15-3 is a widely used breast cancer marker, but the combination of CA15-3 and CEA is more sensitive than using a single marker.

治療反応のモニタリングを目的とする場合、CA15−3、CEAおよびESR(血沈)がパネルとして用いられ、生化学的に評価可能な患者の90%以上に用いられている。転移性乳癌患者の治療反応のモニタリングに用いられる血清マ−カ−では「スパイク現象」が起こる。これは、治療開始当初3ヶ月間に反応例の最大30%に見られる、腫瘍マ−カ−レベルの初期の一過的上昇である。これを、有効な治療の未熟な変化に先行する疾患進行の徴候と解釈しないことが重要である。   For the purpose of monitoring therapeutic response, CA15-3, CEA and ESR (blood sedimentation) are used as panels and are used in more than 90% of biochemically evaluable patients. “Spiking” occurs in serum markers used to monitor treatment response in patients with metastatic breast cancer. This is an initial transient increase in tumor marker levels seen in up to 30% of response cases in the first 3 months of treatment. It is important not to interpret this as a sign of disease progression that precedes immature changes in effective treatment.

C27.29はMUC1の別の部分に対する新規のモノクロ−ナル抗体であり、CA15−3より新しいマ−カ−である。それは、CA15−3とは異なるMUC1のグリコシル化パタ−ンを検出する。CA27.29は、FDAが初めて認可した乳癌再発を対象とする血液検査である。感度と特異性に優れていることから、CA27.29は、乳癌では、好ましい腫瘍マ−カ−としてCA15−3に取って代わりつつある。CA27.29レベルは、初期段階の乳癌(ステ−ジIまたはII)の女性のほぼ1/3と、後期段階の乳癌(ステ−ジIIIまたはIV)女性の2/3で上昇する。CA27.29には、初期段階の乳癌の予測には有効でないことから、この悪性腫瘍のスクリ−ニングまたは診断には用いられていない。CA27.29はまた、乳房、肝臓および腎臓の良性疾患患者でも、また卵巣嚢腫の患者にも見つかることがある。しかしながら、100単位/mLを超える高いCA27.29レベルが良性疾患で見つかることはほとんど無い。   C27.29 is a novel monoclonal antibody against another part of MUC1, a marker newer than CA15-3. It detects a glycosylation pattern of MUC1 that is different from CA15-3. CA27.29 is the first blood test for breast cancer recurrence approved by the FDA. Because of its excellent sensitivity and specificity, CA27.29 is replacing CA15-3 as a preferred tumor marker in breast cancer. CA27.29 levels are elevated in approximately 1/3 of women with early-stage breast cancer (Stage I or II) and 2/3 of women with late-stage breast cancer (Stage III or IV). CA27.29 has not been used for screening or diagnosis of this malignancy because it is not effective in predicting early stage breast cancer. CA27.29 may also be found in patients with benign disease of the breast, liver and kidney, as well as in patients with ovarian cysts. However, high CA27.29 levels exceeding 100 units / mL are rarely found in benign diseases.

最近エストロゲン2(ベ−タ)が乳癌の診断に役立つことが示されている。エストロゲン2の「cx」変異体の発現がホルモン補充治療に対する反応と相関することが示されている。これに加え、ER−1陽性の乳癌の特徴を更に知る上でも(プロゲステロンレセプタ−と共に)役立つことが示されている。   Recently, estrogen 2 (beta) has been shown to be useful in the diagnosis of breast cancer. It has been shown that the expression of a “cx” variant of estrogen 2 correlates with response to hormone replacement therapy. In addition, it has been shown to be useful (along with progesterone receptors) to further characterize ER-1-positive breast cancer.

HER−2(c−erbB2としても知られる)は、内因性のチロシンキナ−ゼ活性を持つ膜性の癌原遺伝子である。HER−2を発現している腫瘍は、生存期間がより短く、再発までの時間が短く、また全体に予後不良である。HER−2を発現している腫瘍は、トラスシズマブ−HER−2の増殖促進作用を遮断する生物学的合併治療の対象になる。HER2の検出には、イムノヒストケミストリ−(IHC)および経口インサイチュ−ハイブリダイゼ−ション(FISH)検査が用いられる。1.IHC:HER2の状態をチェックするのに用いられる最も一般的な検査はイムノヒストケミストリ−(IHC)検査である。IHC検査は、HER2遺伝子が作るタンパク質を測定する。2.FISH:この検査は、腫瘍細胞中に存在するHER2遺伝子のコピ−数を測定する。   HER-2 (also known as c-erbB2) is a membranous proto-oncogene with endogenous tyrosine kinase activity. Tumors expressing HER-2 have a shorter survival time, a shorter time to recurrence, and an overall poor prognosis. Tumors expressing HER-2 are subject to biological combined therapy that blocks the growth-promoting action of trascizumab-HER-2. Immunohistochemistry (IHC) and oral in situ hybridization (FISH) tests are used to detect HER2. 1. The most common test used to check the status of IHC: HER2 is the immunohistochemistry (IHC) test. The IHC test measures the protein made by the HER2 gene. 2. FISH: This test measures the number of copies of the HER2 gene present in tumor cells.

HER−2の細胞外ドメインの測定は、少数の患者においては、CA15.3、CEAおよびESRの測定に基づく生化学的インデックススコアよりも、化学療法に対する反応をよりよく評価すると報告されている。この所見は、より大規模なHER−2発現腫瘍患者群で確認される必要がある。   Measurement of the extracellular domain of HER-2 has been reported to better assess response to chemotherapy in a small number of patients than biochemical index scores based on measurements of CA15.3, CEA and ESR. This finding needs to be confirmed in a larger group of patients with HER-2 expressing tumors.

乳癌以外の癌の診断に主に用いられる他の分子マ−カ−にも、乳癌診断の可能性があることが示されている。例えば、卵巣癌の主要なマ−カ−であるCA125は、また乳癌とも関連している。結腸直腸および膵臓癌の主要なマ−カ−であるCA19−9のレベルは、乳癌患者でも高いことがある。全体的には、これらマ−カ−は、既に記載した他のマ−カ−と比べ劣ることから、乳癌の検出に用いられることは多くない。   Other molecular markers mainly used for diagnosis of cancers other than breast cancer have also been shown to have the potential for breast cancer diagnosis. For example, CA125, a major marker of ovarian cancer, is also associated with breast cancer. The level of CA19-9, a major marker of colorectal and pancreatic cancer, may be high even in breast cancer patients. Overall, these markers are not as often used to detect breast cancer because they are inferior to the other markers already described.

乳癌の診断および型判定するために、上記マ−カ−、およびPCNAを含む乳癌診断にとって有益であることが判明している免疫組織化学マ−カ−のような他マ−カ−の両方を含むマ−カ−のパネルが病理学者によって用いられており、そしてKi−67が乳癌にとって最も重要であり、よく使用されているマ−カ−であろう。E−カドヘリン、カテプシンDおよびTFF1といったその他マ−カ−も、この目的に用いられる。   To diagnose and type breast cancer, both the above markers and other markers such as immunohistochemical markers that have been found to be beneficial for breast cancer diagnosis including PCNA. A panel of markers is used by pathologists, and Ki-67 is the most important and commonly used marker for breast cancer. Other markers such as E-cadherin, cathepsin D and TFF1 are also used for this purpose.

関係研究の努力、および多くの良好な推定予後判定因子が見つかっているにもかかわらず、このうち再発のリスクの小さな患者、予後不良な患者、または特定の治療で便益を得ると思われる患者を識別するのに有用であることが臨床的に証明されているものはほとんどない。これらの大部分は、上皮増殖因子レセプタ−、サイクリンE、p53(この突然変異はヒト乳癌の約40%に後天性の異常として存在する)、bcl−2、血管内皮増殖因子、ウロキナ−ゼ型プラスミノ−ゲンアクチベ−タ1および抗アポト−シスタンパク質のサ−ビビンのように、臨床検査として高い有効性を持つ生体マ−カ−に分類できることが示唆されている。しかしながら、予後良好(または不良)の患者、あるいはある治療法に反応する患者を識別できる、単一の生体マ−カ−は存在しない。高レベルのサイクリンEの発現は、様々なヒトの癌、特に乳癌だけでなく白血病、リンパ腫等において、その発症と進行に関連付けられている。乳癌でのサイクリンEの発現レベルは、他の生体マ−カ−よりも、極めて強い予後指標であることが見出されている。   Despite related research efforts and a number of good prognostic prognostic factors, patients with low risk of recurrence, poor prognosis, or patients who may benefit from certain treatments Few are clinically proven to be useful for identification. Most of these are epidermal growth factor receptor, cyclin E, p53 (this mutation is present as an acquired abnormality in about 40% of human breast cancer), bcl-2, vascular endothelial growth factor, urokinase type It has been suggested that plasminogen activator 1 and anti-apoptotic protein survivin can be classified into biological markers having high efficacy as clinical tests. However, there is no single biomarker that can identify patients with good (or poor) prognosis or who respond to certain treatments. High levels of cyclin E expression are associated with its onset and progression in various human cancers, particularly breast cancer as well as leukemia, lymphoma, and the like. The expression level of cyclin E in breast cancer has been found to be a much stronger prognostic indicator than other biomarkers.

乳癌発生ハイリスク因子である非癌性の病理状態がいくつかある。これら状態の非限定例としては、次のものが挙げられる:
−異形性のない管過形成。これは、最も頻繁に経験する、将来の乳癌発生のリスクが高いことと関連する乳房生検結果である(リスクは2倍上昇)。特に、病変上皮細胞での形質転換増殖因子ベ−タレセプタ−IIの発現消失と、浸潤性乳癌のリスク上昇とは関連している。
−非定型過形成。HER−2の過剰発現を伴う非定型過形成を有する女性は、非増殖性良性乳房疾患を有するが、HER−2増殖がない女性に比べ、浸潤性の乳癌を発症するリスクは7倍高い。
There are several non-cancerous pathological conditions that are high risk factors for developing breast cancer. Non-limiting examples of these states include the following:
-Tube hyperplasia without irregularities. This is the most frequently experienced breast biopsy result associated with an increased risk of developing future breast cancer (risk increased by a factor of 2). In particular, the loss of expression of transforming growth factor beta receptor II in lesional epithelial cells is associated with an increased risk of invasive breast cancer.
-Atypical hyperplasia. Women with atypical hyperplasia with HER-2 overexpression have nonproliferative benign breast disease, but are seven times more likely to develop invasive breast cancer than women without HER-2 proliferation.

乳癌の早期発見を促すためには、これらの病的状態を効果的に診断およびモニタリングしなければならない。   In order to facilitate early detection of breast cancer, these pathological conditions must be effectively diagnosed and monitored.

発明の概要
従来技術は、単独または組合せて、十分な感度および/または正確性を持つ乳癌のマ−カ−を教示または示唆していない。
SUMMARY OF THE INVENTION The prior art, alone or in combination, does not teach or suggest a marker for breast cancer that has sufficient sensitivity and / or accuracy.

本発明は、高感度、且つ正確である乳癌の新規マ−カ−を提供することによって、従来技術の欠点を克服する。これらマ−カ−は、正常乳房組織とは逆に、乳癌において特異的に過剰発現している。これらマ−カ−を、患者(生物学的)サンプルについて単独または組合せて測定することで、診断者が乳癌の推定診断に関連付けることができる情報が得られる。本発明のマ−カ−は、単独または組合せて、乳癌と癌以外の状態とを高度に鑑別検出する。   The present invention overcomes the disadvantages of the prior art by providing a novel marker of breast cancer that is highly sensitive and accurate. These markers are specifically overexpressed in breast cancer, as opposed to normal breast tissue. Measuring these markers, alone or in combination, on patient (biological) samples provides information that a diagnostician can associate with a putative diagnosis of breast cancer. The marker of the present invention can detect a breast cancer and a state other than cancer highly differentially, alone or in combination.

本発明の好ましい態様によれば、本発明の好ましい態様と共に選択的に用いることができる好適生物サンプルの例としては、血液、血清、血漿、血液細胞、尿、喀痰、唾液、便、髄液またはCSF、リンパ液、皮膚、呼吸器、腸および尿生殖管の外部分泌物、涙、母乳、神経組織、乳房組織、主要もしくは正常組織を包含するいずれかのヒト器官もしくは組織、洗浄により得たサンプル(例えば気管支系、もしくは乳管系)、ならびにインビボ細胞培養体のサンプルが挙げられるが、これらに限定されるものではない。好ましい態様では、生物サンプルは、乳房組織および/または血清サンプルおよび/または尿サンプルおよび/または母乳サンプルおよび/またはその他組織もしくは液体サンプルを含む。サンプルは、場合により好適希釈液により、サンプルを抗体に触れさせる前および/またはその他診断アッセイを実施する前に、好適な溶出液で希釈することができる。   According to preferred embodiments of the present invention, examples of suitable biological samples that can be selectively used with preferred embodiments of the present invention include blood, serum, plasma, blood cells, urine, sputum, saliva, stool, spinal fluid or CSF, lymph, skin, respiratory organs, intestinal and genitourinary external secretions, tears, breast milk, nerve tissue, breast tissue, any human organ or tissue including major or normal tissue, sample obtained by lavage ( Examples include, but are not limited to, bronchial or breast ductal systems), and in vivo cell culture samples. In preferred embodiments, the biological sample comprises breast tissue and / or serum samples and / or urine samples and / or breast milk samples and / or other tissue or fluid samples. The sample can be diluted with a suitable eluent, optionally with a suitable diluent, prior to contacting the sample with the antibody and / or prior to performing other diagnostic assays.

細胞局在に関し得られる情報は、四種類のソフトウエア−プログラム:膜貫通領域予測については、(i)tmhmm(Center for Biological Sequence Analysis, Technical University of Denmark DTU, http://www.cbs.dtu.dk/services/TMHMM/TMHMM2.0b.guide.phpより入手)または(ii)tmpred(ISREC Bionformaticsグル−プとLICR Information Technology Office, Ludwig Institute for Cancer Research, Swiss Institute of Bioinformaticsが維持するEMBnet、http://www.ch.embnet.org/software/TMPRED_form.htmlより入手);シグナルペプチド予測については(iii)signalp_hmmまたは(iv)sigalp_nn(共にCenter for Biological Sequence Analysis, Technical University of Denmark DTU, http://www.cbs.dtu.dk/services/SignalP/background/prediction.phpより入手)に基づいて決定した。用語「signalp_hmm」および「signalp_nn」は、プログラムSignalPの二つの運転モ−ドを指す:hmmはHidden Markov Modelを指し、一方nnはニュ−トラルネットワ−クを指す。局在はまた、既知タンパク質局在および/または遺伝子構造の目視検査、および個々研究者による発見的教授法を使用しても決定された。目視検査により細胞局在を予測する場合、研究者はコンピュ−タプラットホ−ム、ProLoc[Einat Hazkani−Covo, Erez Levanon, Galit Rotman, Dan Grauer and Amit Novik; (2004) "Evolution of multicellularity in metazoa: comparative analysis of the subcellular localization of proteins in Saccharomyces, Drosophila and Caenorhabditis." Cell Biology International 2004;28(3):171−8.]を使用したが、これはタンパク質ドメイン(例えば膜貫通領域およびタンパク質内のその局在の推測)、pI、タンパク質長、アミノ酸組成、注釈付け前のタンパク質との相同性、特定細胞内器官へタンパク質を向ける配列パタ−ンの認識(核局在シグナル、NLS、ミトコンドリア局在シグナルのような)、シグナルペプチドならびにシグナルコンパ−トメントに特異的なPfam由来の特有ドメインをモデル化および用いるアンカ−を含む各種パラメ−タに基づいてタンパク質の局在を予測する。   Information on cell localization is available in four software programs: (i) tmhmm (Center for Biological Sequence Analysis, Technical University of Denmark DTU, http: //www.cbs.dtu (obtained from .dk / services / TMHMM / TMHMM2.0b.guide.php) or (ii) tmpred (ISMB Bionformatics Group and LCR Information Technology Office, Ludwig Institute for Cancer Research, EMBnet maintained by Swiss Institute of Bioinformatics, http : //www.ch.embnet.org/software/TMPRED_form.html); For signal peptide prediction (iii) signalp_hmm or (iv) sigalp_nn (both Center for Biological Sequence Analysis, Technical University of Denmark DTU, http: //www.cbs.dtu.dk/services/SignalP/background/prediction.php) The terms “signalp_hmm” and “signalp_nn” refer to the two operating modes of the program SignalP: hmm refers to the Hidden Markov Model, while nn refers to the neutral network. Localization was also determined using visual inspection of known protein localization and / or gene structure and heuristic teaching by individual researchers. When predicting cell localization by visual inspection, researchers use a computer platform, ProLoc [Einat Hazkani-Covo, Erez Levanon, Galit Rotman, Dan Grauer and Amit Novik; (2004) "Evolution of multicellularity in metazoa: comparative Analysis of the subcellular localization of proteins in Saccharomyces, Drosophila and Caenorhabditis. "Cell Biology International 2004; 28 (3): 171-8.], which used protein domains (eg, transmembrane regions and their localities within proteins). Presumption), pI, protein length, amino acid composition, homology with the protein before annotation, recognition of sequence patterns that direct the protein to specific intracellular organs (nuclear localization signal, NLS, mitochondrial localization signal Various parameters, including anchors for modeling and using signal peptides and unique domains derived from Pfam specific for signal compartments. - to predict the localization of the protein based on the data.

情報は、SNP(単一ヌクレオチド多形)に関するデ−タで与えられる。略語の意味は次の通りである。例えば「T−>C」は、SNPが表に示した位置で、TからCへの変更を起こすことを意味する。同様に例えば「M−>Q」は、SNPが対応するアミノ酸配列に、メチオニン(M)からグルタミン(Q)への変更を起こしたことを意味する。ヌクレオチド配列SNPの場合、右側の文字に代わってスペ−スがある場合は、フレ−ムシフトが起こったことを示す。フレ−ムシフトは、ハイフン(−)で表されることもある。ストップコドンは、右手にアステリスク(*)を付けて表示する。SNPの既述の一部として、上記SNPそのものの既述の後にカッコを付けてコメントを付けることもできる。このコメントは、指示されたSNPを使って作られたSwissProtエントリ−に対する識別子であるFTIdを含んでもよい。FTIdは固有の安定した機能識別子であり、属性テ−ブル内の位置特異的注釈から直接、特殊化されたタンパク質関連デ−タベ−スへのリンクを構築できるようにする。FTIdは常に、次のように、デスクリプションフィ−ルド内の属性テ−ブル最後のコンポ−ネントである:FTId=XXX_番号では、XXXは特殊な属性キ−を表す3文字コ−ドであり、アンダ−スコアを挟み6桁の数字が続く。本発明の選択されたスプライス変異体における野生型タンパク質のアミノ酸突然変異の表において、最初の縦列のヘッダ−は「アミノ酸配列のSNP位置」であり、これは既知突然変異体のアミノ酸配列上の位置を表している。SNPは、場合によっては、本発明による診断マ−カ−として、単独または一もしくは複数のその他SNPおよび/もしくはその他診断マ−カ−と組合せて用いてもよい。本発明の好ましい態様は、以下記載の既知(WTまたは野生型)タンパク質配列の新規SNP、ならびに/またはそのようなSNPを用いて形作られる新規核酸および/もしくはアミノ酸配列、ならびに/または本明細書に記載の変位アミノ酸および/もしくは核酸配列上のSNPを包含するが、これらに限定されるものではないSNPを含む。   Information is given in data on SNP (single nucleotide polymorphism). The abbreviations have the following meanings: For example, “T-> C” means that the SNP causes a change from T to C at the position indicated in the table. Similarly, for example, “M-> Q” means that the amino acid sequence corresponding to SNP has changed from methionine (M) to glutamine (Q). In the case of the nucleotide sequence SNP, if there is a space in place of the right-hand letter, it indicates that a frame shift has occurred. The frame shift may be represented by a hyphen (-). Stop codons are displayed with an asterisk (*) on the right. As part of the description of the SNP, you can also add comments with parentheses after the description of the SNP itself. This comment may include an FTId that is an identifier for a SwissProt entry created using the indicated SNP. FTId is a unique and stable function identifier that allows the construction of links to specialized protein-related databases directly from position-specific annotations in attribute tables. FTId is always the last component of the attribute table in the description field as follows: For FTId = XXX_number, XXX is a three-character code that represents a special attribute key Yes, followed by a 6-digit number across the underscore. In the table of amino acid mutations of wild-type protein in selected splice variants of the present invention, the first column header is the “SNP position of the amino acid sequence”, which is the position on the amino acid sequence of the known mutant. Represents. SNPs may optionally be used as a diagnostic marker according to the present invention, alone or in combination with one or more other SNPs and / or other diagnostic markers. Preferred embodiments of the present invention include novel SNPs of known (WT or wild type) protein sequences described below, and / or novel nucleic acid and / or amino acid sequences formed using such SNPs, and / or Including, but not limited to, SNPs on the described displaced amino acids and / or nucleic acid sequences.

既知タンパク質との相同性との関係で提供される情報は、以下の特別な(初期設定値でない)パラメ−タを用いて、Smith−Watermanバ−ジョン5.1.2によって決定される:
−moedl=sw.model
−GAPEXT=0
−GAPOP=100.0
−MATRIX=blosum 100
The information provided in relation to homology with known proteins is determined by Smith-Waterman version 5.1.2 using the following special (non-default) parameters:
−moedl = sw.model
−GAPEXT = 0
−GAPOP = 100.0
−MATRIX = blosum 100

ESTに基づく、癌におけるクラスタの過剰発現に関する情報が得られる。このような過剰発現の分析に関するp値に関するキ−は次の通りである:
−ライブラリ−ベ−スの統計値:細胞株での発現レベルを含まないP−値(P1)
−ライブラリ−ベ−スの統計値:細胞株での発現レベルを含むP−値(P2)
−ESTクロ−ン統計値:細胞株での発現レベルを含まないP−値(SP1)
−ESTクロ−ン統計値:細胞株での発現レベルを含まないP−値(R3)
−ESTクロ−ン統計値:細胞株での発現レベルを含むP−値(SP2)
−ESTクロ−ン統計値:細胞株での発現レベルを含む推定過剰発現率(R4)
Information about cluster overexpression in cancer is obtained based on EST. The key for p-value for such overexpression analysis is as follows:
-Library-based statistics: P-values (P1) without expression levels in cell lines
-Library-based statistics: P-values including expression levels in cell lines (P2)
-EST clone statistics: P-values (SP1) not including expression levels in cell lines
-EST clone statistics: P-values (R3) not including expression levels in cell lines
-EST clone statistics: P-value (SP2) including expression level in cell lines
-EST clone statistics: estimated overexpression rate (R4) including expression levels in cell lines

ライブラリ−ベ−ス統計値とは、ライブラリ−全体を対象とした統計値を指し、一方ESTクロ−ン統計値とは特定組織または癌のESTだけに関する発現を指す。   Library-based statistics refers to statistics for the entire library, while EST clone statistics refers to expression for only a specific tissue or cancer EST.

マイクロアレイに基づく、癌でのクラスタの過剰発現に関する情報が得られる。マイクロアレイを表すものとしては、特別なセグメントパラグラフの中に省略されていない組織名が、測定対象発現別のチップのタイプを表すものとして用いられる。マイクロアレイの結果には二種類ある:即ち、本発明のデザインに従って調製されたマイクロアレイより得られる結果であり、そのマイクロアレイ製造方法は本明細書の材料と実験手順の章で詳しく記載される。マイクロアレイを表すものとしては、特別なセグメントパラグラフの中に省略されていない組織名が、測定対象発現別のチップのタイプを表すものとして用いられる。本発明のデザインに従って調製されたマイクロアレイでは、プロ−ブの名称はクラスタ(遺伝子)の名称で始まり、これに識別番号が続く。Affymetrixデ−タから得たオリゴヌクレオチドマイクロアレイの結果は、Affymetrix Inc、Santa Clara、CA、USAから入手可能なチップによるものであった(例えば、www.affymetrix.com/products/arrays/specific/hgu133.affxにあるHuman Genome U133(HG−U133)セット;www.affymetrix.com/products/arrays/specific/hgu133av2.affxにあるGeneChip Human Genome U133A 2.0 Array;およびwww.affymetrix.com/products/arrays/specific/hgu133plus.affxにあるHuman Genome U133 Plus 2.0 Arrayを参照せよ)。プロ−ブの名前はAffymetrixが便宜的に付けたものである。デ−タは、NCBI Gene Expression Omibus( www.ncbi.nlm.nih.gov/projects/geo/およびEdgarら、Nucleic Acids Research, 2002, Vol.30, No.1 207−210を参照せよ)より入手できる。デ−タセット(結果を含む)は、Series GSE1133デ−タベ−ス(2004年3月公開)については、www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1133より入手できる;これらの結果に関する参考文献は次の通りである:Su et al(Proc Natl Acad Sci U S A. 2004 Apr 20;101(16):6062−7. Epub 2004 Apr 09)。本発明によりデザインしたプロ−ブを以下に掲載する。
>Z21368_0_0_61857 (配列番号:895)
AGTTCATCCTTCTTCAGTGTGACCAGTAAATTCTTCCCATACTCTTGAAG
>HUMGRP5E_0_0_16630 (配列番号:896)
GCTGATATGGAAGTTGGGGAATCTGAATTGCCAGAGAATCTTGGGAAGAG
>HUMGRP5E_0_2_0 (配列番号:897)
TCTCATAGAAGCAAAGGAGAACAGAAACCACCAGCCACCTCAACCCAAGG
>HSENA78_0_1_0 (配列番号:898)
TGAAGAGTGTGAGGAAAACCTATGTTTGCCGCTTAAGCTTTCAGCTCAGC
>M85491_0_0_25999 (配列番号:899)
GACATCTTTGCATATCATGTCAGAGCTATAACATCATTGTGGAGAAGCTC
>M85491_0_14_0 (配列番号:900)
GTCATGAAAATCAACACCGAGGTGCGGAGCTTCGGACCTGTGTCCCGCAG
>HSSTROL3_0_0_12518 (配列番号: 901)
ATGAGAGTAACCTCACCCGTGCACTAGTTTACAGAGCATTCACTGCCCCA
>HSSTROL3_0_0_12517 (配列番号:902)
CAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAA
>HUMCA1XIA_0_0_14909 (配列番号:903)
GCTGCAATCTAAGTTTCGGAATACTTATACCACTCCAGAAATAATCCTCG
>HUMCA1XIA_0_18_0 (配列番号:904)
TTCAGAACTGTTAACATCGCTGACGGGAAGTGGCATCGGGTAGCAATCAG
>R20779_0_0_30670 (配列番号:905)
CCGCGTTGCTTCTAGAGGCTGAATGCCTTTCAAATGGAGAAGGCTTCCAT
>HSS100PCB_0_0_12280 (配列番号:906)
CTCAAAATGAAACTCCCTCTCGCAGAGCACAATTCCAATTCGCTCTAAAA
>HSCOC4_0_0_9892 (配列番号:907)
AAGGACCAGAGTCCATGCCAAGACCACCCTTCAGCTTCCAAGGCCCTCCA
>HSCOC4_0_39_0 (配列番号:908)
ATCCTCCAGCCATGAGGCTGCTCTGGGGGCTGATCTGGGCATCCAGCTTC
>HSCOC4_0_0_9883 (配列番号:909)
CCTGTTTGCTCTGACACCAACTTCCTACCCTCTCAGCCTCAAAGTAACTC
>HSCOC4_0_0_9885 (配列番号:910)
GCTGAGGTGTGGCCGAGGACCTGACCATCTGGAAGTGTGAAAATCCCCTT
>T11628_0_9_0 (配列番号:911)
ACAAGATCCCCGTGAAGTACCTGGAGTTCATCTCGGAATGCATCATCCAG
>T11628_0_0_45174 (配列番号:912)
TAAACAATCAAAGAGCATGTTGGCCTGGTCCTTTGCTAGGTACTGTAGAG
>T11628_0_0_45161 (配列番号:913)
TGCCTCGCCACAATGGCACCTGCCCTAAAATAGCTTCCCATGTGAGGGCT
>M78076_0_7_0 (配列番号:914)
GAGAAGATGAACCCGCTGGAACAGTATGAGCGAAAGGTGAATGCGTCTGT
>HSMUC1A_0_37_0 (配列番号:915)
AAAAGGAGACTTCGGCTACCCAGAGAAGTTCAGTGCCCAGCTCTACTGAG
>HSMUC1A_0_0_11364 (配列番号:916)
AAAGGCTGGCATAGGGGGAGGTTTCCCAGGTAGAAGAAGAAGTGTCAGCA
>HSMUC1A_0_0_11365 (配列番号:917)
AATTAACCCTTTGAGAGCTGGCCAGGACTCTGGACTGATTACCCCAGCCT
Information on overexpression of clusters in cancer is obtained based on microarrays. As a representation of a microarray, a tissue name that is not omitted in a special segment paragraph is used as a representation of the type of chip by expression to be measured. There are two types of microarray results: those obtained from microarrays prepared according to the design of the present invention, and the method of manufacturing the microarray is described in detail in the Materials and Experimental Procedures section herein. As a representation of a microarray, a tissue name that is not omitted in a special segment paragraph is used as a representation of the type of chip by expression to be measured. In microarrays prepared according to the design of the present invention, the probe name begins with the name of the cluster (gene) followed by the identification number. Oligonucleotide microarray results obtained from Affymetrix data were from chips available from Affymetrix Inc, Santa Clara, CA, USA (eg, www.affymetrix.com/products/arrays/specific/hgu133. Human Genome U133 (HG-U133) set at affx; GeneChip Human Genome U133A 2.0 Array at www.affymetrix.com/products/arrays/specific/hgu133av2.affx; and www.affymetrix.com/products/arrays/specific/ (See the Human Genome U133 Plus 2.0 Array at hgu133plus.affx). The probe name is given by Affymetrix for convenience. Data are obtained from NCBI Gene Expression Omibus (see www.ncbi.nlm.nih.gov/projects/geo/ and Edgar et al., Nucleic Acids Research, 2002, Vol. 30, No. 1 207-210). it can. The data set (including the results) is available from www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1133 for the Series GSE1133 database (published in March 2004) Yes; references for these results are as follows: Su et al (Proc Natl Acad Sci US A. 2004 Apr 20; 101 (16): 6062-7. Epub 2004 Apr 09). The probes designed according to the present invention are listed below.
> Z21368_0_0_61857 (SEQ ID NO: 895)
AGTTCATCCTTCTTCAGTGTGACCAGTAAATTCTTCCCATACTCTTGAAG
> HUMGRP5E_0_0_16630 (SEQ ID NO: 896)
GCTGATATGGAAGTTGGGGAATCTGAATTGCCAGAGAATCTTGGGAAGAG
> HUMGRP5E_0_2_0 (SEQ ID NO: 897)
TCTCATAGAAGCAAAGGAGAACAGAAACCACCAGCCACCTCAACCCAAGG
> HSENA78_0_1_0 (SEQ ID NO: 898)
TGAAGAGTGTGAGGAAAACCTATGTTTGCCGCTTAAGCTTTCAGCTCAGC
> M85491_0_0_25999 (SEQ ID NO: 899)
GACATCTTTGCATATCATGTCAGAGCTATAACATCATTGTGGAGAAGCTC
> M85491_0_14_0 (SEQ ID NO: 900)
GTCATGAAAATCAACACCGAGGTGCGGAGCTTCGGACCTGTGTCCCGCAG
> HSSTROL3_0_0_12518 (SEQ ID NO: 901)
ATGAGAGTAACCTCACCCGTGCACTAGTTTACAGAGCATTCACTGCCCCA
> HSSTROL3_0_0_12517 (SEQ ID NO: 902)
CAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAA
> HUMCA1XIA_0_0_14909 (SEQ ID NO: 903)
GCTGCAATCTAAGTTTCGGAATACTTATACCACTCCAGAAATAATCCTCG
> HUMCA1XIA_0_18_0 (SEQ ID NO: 904)
TTCAGAACTGTTAACATCGCTGACGGGAAGTGGCATCGGGTAGCAATCAG
> R20779_0_0_30670 (SEQ ID NO: 905)
CCGCGTTGCTTCTAGAGGCTGAATGCCTTTCAAATGGAGAAGGCTTCCAT
> HSS100PCB_0_0_12280 (SEQ ID NO: 906)
CTCAAAATGAAACTCCCTCTCGCAGAGCACAATTCCAATTCGCTCTAAAA
> HSCOC4_0_0_9892 (SEQ ID NO: 907)
AAGGACCAGAGTCCATGCCAAGACCACCCTTCAGCTTCCAAGGCCCTCCA
> HSCOC4_0_39_0 (SEQ ID NO: 908)
ATCCTCCAGCCATGAGGCTGCTCTGGGGGCTGATCTGGGCATCCAGCTTC
> HSCOC4_0_0_9883 (SEQ ID NO: 909)
CCTGTTTGCTCTGACACCAACTTCCTACCCTCTCAGCCTCAAAGTAACTC
> HSCOC4_0_0_9885 (SEQ ID NO: 910)
GCTGAGGTGTGGCCGAGGACCTGACCATCTGGAAGTGTGAAAATCCCCTT
> T11628_0_9_0 (SEQ ID NO: 911)
ACAAGATCCCCGTGAAGTACCTGGAGTTCATCTCGGAATGCATCATCCAG
> T11628_0_0_45174 (SEQ ID NO: 912)
TAAACAATCAAAGAGCATGTTGGCCTGGTCCTTTGCTAGGTACTGTAGAG
> T11628_0_0_45161 (SEQ ID NO: 913)
TGCCTCGCCACAATGGCACCTGCCCTAAAATAGCTTCCCATGTGAGGGCT
> M78076_0_7_0 (SEQ ID NO: 914)
GAGAAGATGAACCCGCTGGAACAGTATGAGCGAAAGGTGAATGCGTCTGT
> HSMUC1A_0_37_0 (SEQ ID NO: 915)
AAAAGGAGACTTCGGCTACCCAGAGAAGTTCAGTGCCCAGCTCTACTGAG
> HSMUC1A_0_0_11364 (SEQ ID NO: 916)
AAAGGCTGGCATAGGGGGAGGTTTCCCAGGTAGAAGAAGAAGTGTCAGCA
> HSMUC1A_0_0_11365 (SEQ ID NO: 917)
AATTAACCCTTTGAGAGCTGGCCAGGACTCTGGACTGATTACCCCAGCCT

TAAヒストグラムでは、次の組織の略語リストを使用している。用語「TAA」は「腫瘍関連抗原」を表し、本文中のTAAヒストグラムは、下記実施例1〜5に詳しく記載するように、生体マ−カ−選択エンジンにより予測される癌組織発現パタ−ンを表す。
「BONE」は「骨」;
「COL」は「結腸」;
「EPI」は「上皮」;
「GEN」は「全身」;
「LIVER」は「肝臓」;
「LUN」は「肺」;
「LYMPH」は「リンパ節」;
「MARROW」は「骨髄」;
「OVA」は「卵巣」;
「PANCREAS」は「膵臓」;
「PRO」は「前立腺」;
「STOMCH」は「胃」;
「TCELL」は「T細胞」;
「HYROID」は「甲状腺」;
「MAM」は「乳房」;
「BRAIN」は「脳」;
「UTERUS」は「子宮」;
「SKIN」は「皮膚」;
「KIDNEY」は「腎臓」;
「MUSCLE」は「筋肉」;
「ADREN」は「副腎」;
「HEAD」は「頭部および頚部」;
「BLADDER」は「膀胱」;
The TAA histogram uses the following organization abbreviation list: The term “TAA” stands for “tumor associated antigen” and the TAA histogram in the text is a cancer tissue expression pattern predicted by a biomarker selection engine as described in detail in Examples 1-5 below. Represents.
“BONE” is “bone”;
“COL” means “colon”;
“EPI” means “epithelium”;
“GEN” means “whole body”;
“LIVER” means “liver”;
“LUN” means “lung”;
“LYMPH” is “lymph node”;
“MARROW” is “bone marrow”;
“OVA” is “ovary”;
“PANCREAS” means “pancreas”;
"PRO" is "prostate";
"STOMCH" is "stomach";
“TCELL” is “T cell”;
“HYROID” is “thyroid”;
“MAM” is “breast”;
“BRAIN” is “brain”;
“UTERUS” is “uterus”;
“SKIN” is “Skin”;
"KIDNEY" is "kidney";
“MUSCLE” is “muscle”;
“ADREN” is “adrenal”;
“HEAD” means “head and neck”;
“BLADDER” means “bladder”;

用語「セグメント」、「セグ(seg)」および「ノ−ド(node)」は本発明の核酸配列を表す場合には互換的に用いられ、それらは以下記載の特徴の一つまたは複数を有することが示されている核酸配列部分を指す。それらはまた、以下詳細に記載するように、完全な核酸配列を構築するのに用いられる基本単位でもある。選択的および好ましくは、それらは本発明の態様、例えばアンプリコン、ハイブリダイゼ−ション単位、および/またはそれよりプライマ−および/もしくは相補的オリゴヌクレオチドが選択的に得ることができるオリゴヌクレオチド、ならびに/またはその他使用のためのオリゴヌクレオチドの例である。   The terms “segment”, “seg” and “node” are used interchangeably when referring to the nucleic acid sequences of the present invention, which have one or more of the characteristics described below. Refers to the portion of the nucleic acid sequence that has been shown to be. They are also the basic units used to construct complete nucleic acid sequences, as described in detail below. Optionally and preferably, they are embodiments of the present invention, such as amplicons, hybridization units, and / or oligonucleotides from which primer and / or complementary oligonucleotides can be selectively obtained, and / or Other examples of oligonucleotides for use.

本明細書に使用する場合、句「乳癌」は、腺管癌(インサイチュ−または浸潤性)、小葉癌(インサイチュ−または浸潤性)、炎症性乳癌、粘液性癌腫、管状癌、または乳首のペ−ジェット病を含むが、これらに限定されるものではない乳房または周辺組織の癌、ならびに後の乳癌発生のリスク因子が高いことを示す、異形性および非定型過形成を持たない腺管過形成を含むがこれに限定されない、本明細書では総称して「指標状態」と称する状態を指す。   As used herein, the phrase “breast cancer” refers to ductal carcinoma (in situ or invasive), lobular carcinoma (in situ or invasive), inflammatory breast cancer, mucinous carcinoma, tubular cancer, or nipple petal. -Ductal hyperplasia that does not have atypical and atypical hyperplasia, indicating a high risk factor for breast or surrounding tissue, including but not limited to jet disease, and subsequent breast cancer development In the present specification, it refers to a state collectively referred to as an “index state”.

本発明の文脈での用語「マ−カ−」は、乳癌(または上記指標状態)を有さない被検者より得たサンプルと比較して、乳癌(または上記指標状態)を有する被検者(患者)から得たサンプル中に差別的に存在する核酸断片、ペプチドまたはポリペプチドを指す。   The term “marker” in the context of the present invention refers to a subject having breast cancer (or an indicator state) as compared to a sample obtained from a subject who does not have breast cancer (or the indicator state). It refers to a nucleic acid fragment, peptide or polypeptide that is differentially present in a sample obtained from (patient).

句「差別的に存在する」とは、乳癌(または上記指標状態)を有さない被検者より得たサンプルと比較した時に、乳癌(または上記指標状態)を有する被検者(患者)から得たサンプル中に存在するマ−カ−の量の差を指す。例えば、核酸断片は、例えばハイブリダイゼ−ションおよび/またはNAT−ベ−スのアッセイにより測定した時に、一つのサンプル中の核酸断片量が他方のサンプル中の核酸断片量と有意に異なっていれば、場合により二つのサンプルの間で差別的に存在しているだろう。ポリペプチドは、一つのサンプル中のポリペプチド量が他方のサンプル中のポリペプチド量と有意に異なっていれば、二つのサンプルの間で差別的に存在している。マ−カ−が一方のサンプルで検出可能であり、もう一方のサンプルでは検出できない場合、このようなマ−カ−は差別的に存在すると考えられることを述べておかなければならない。   The phrase “present differentially” refers to a subject (patient) having breast cancer (or an indicator condition) when compared to a sample obtained from a subject who does not have breast cancer (or the indicator condition). It refers to the difference in the amount of marker present in the obtained sample. For example, if a nucleic acid fragment is significantly different from the amount of nucleic acid fragments in one sample as measured by, for example, hybridization and / or NAT-based assays, In some cases, there will be a discriminatory presence between the two samples. A polypeptide is differentially present between two samples if the amount of polypeptide in one sample is significantly different from the amount of polypeptide in the other sample. It should be noted that if a marker is detectable in one sample and not in the other sample, such a marker is considered to be differentially present.

本明細書で使用する「診断(的)」とは、病理的状態の存在または性質を明らかにすることを意味する。診断法は、それぞれ感度および特異性が異なる。診断アッセイの「感度」とは、試験結果が陽性である、疾患に罹った個体のパ−センテ−ジである(「真の陽性」のパ−セント)。アッセイにより検出されない疾患に罹った個体は、「偽陰性」である。疾患に罹っておらず、且つアッセイで試験が陰性であった被検者は「真の陰性」と呼ばれる。診断アッセイの「特異性」は、1から偽陽性率を減じたもので、ここで言う「偽陽性」率とは、試験結果が陽性である疾患に罹っていない者の割合として定義される。ある診断法は、疾患に確定的な診断を下さないが、診断を補助する陽性の指標を提供すれば十分である。   As used herein, “diagnostic” means revealing the presence or nature of a pathological condition. Each diagnostic method has different sensitivity and specificity. The “sensitivity” of a diagnostic assay is the percentage of a diseased individual whose test result is positive (the percentage of “true positives”). An individual suffering from a disease not detected by the assay is “false negative”. A subject who is not ill and has a negative test in the assay is called a “true negative”. The “specificity” of a diagnostic assay is 1 minus the false positive rate, where the “false positive” rate is defined as the percentage of those who do not have a disease with a positive test result. Some diagnostic methods do not make a definitive diagnosis of the disease, but it suffices to provide a positive indicator that assists in the diagnosis.

本明細書で使用する「診断する」とは、疾患または症状を分類すること、疾患の重症度を決定すること、疾患の進行をモニタリングすること、疾患の結果および/または回復の見込みを予測することを指す。用語「検出する」もまた、選択的に上記いずれかを包含することができる。   As used herein, “diagnosing” classifies a disease or condition, determines disease severity, monitors disease progression, predicts disease outcome and / or likelihood of recovery. Refers to that. The term “detect” can also optionally include any of the above.

本発明の疾患の診断は、被検者から得た生物サンプル中の、本発明のポリヌクレオチドまたはポリペプチドのレベルを決定することにより実行できるが、この場合決定されたレベルは、疾病素質、疾患の有無と関連付けることができる。「被検者から得た生物サンプル」はまた、選択的に、以下詳しき記載するように、被検者より物理的に取り出されたものでないサンプルも含むことができる。   The diagnosis of the disease of the present invention can be carried out by determining the level of the polynucleotide or polypeptide of the present invention in a biological sample obtained from a subject. Can be associated with or without. A “biological sample obtained from a subject” can also optionally include a sample that has not been physically removed from the subject, as described in detail below.

本明細書で使用する場合、用語「レベル」は、本発明のマ−カ−のRNAおよび/またはタンパク質の発現レベル、あるいはDNAコピ−数を指す。   As used herein, the term “level” refers to the expression level, or the number of DNA copies, of the marker and RNA of the present invention.

一般的には、被検者より得た生物サンプル中のマ−カ−のレベルは、健康な個体から得た同様のサンプルの中にある同一変異体のレベルとは異なっている(即ち増加、または減少している)(生物サンプルの例は本明細書に記載されている)。   In general, the level of a marker in a biological sample obtained from a subject is different from the level of the same variant in a similar sample obtained from a healthy individual (ie, increased, (Or examples of biological samples are described herein).

被検者での関心対象の変異体のDNA、RNAおよび/またはポリペプチドのレベルを決定するために、多くの、周知の組織または液体採取法を用いて被検者から生物サンプルを集めることができる。   To determine the level of DNA, RNA and / or polypeptide of a variant of interest in a subject, a biological sample is collected from the subject using a number of well-known tissue or fluid collection methods. it can.

例としては、これらに限定されるものではないが、細針生検、針生検、コア針生検および手術生検(例えば脳生検)および洗浄が挙げられる。用いた手順にかかわらず、生検/サンプルが得られれば、変異体のレベルは決定でき、かくして診断を下すこともできる。   Examples include, but are not limited to, fine needle biopsy, needle biopsy, core needle biopsy and surgical biopsy (eg, brain biopsy) and lavage. Regardless of the procedure used, once a biopsy / sample is obtained, the level of the mutant can be determined and thus a diagnosis can be made.

同一起源の正常組織での同一変異体のレベルを同時に決定し、正常組織に対する変異体の発現の上昇および/または増幅および/または減少を検出することが好ましい。   Preferably, the level of the same variant in normal tissue of the same origin is determined simultaneously to detect an increase and / or amplification and / or decrease in the expression of the variant relative to normal tissue.

マ−カ−の「試験量」とは、被検者サンプル中のマ−カ−の量を指し、それは乳癌(または上記指標状態の一つ)の診断に一致する。試験量は、絶対値(例えばマイクログラム/ml)または相対値(例えばシグナルの相対強度)のいずれでもよい。   The “test amount” of a marker refers to the amount of the marker in a subject sample, which is consistent with the diagnosis of breast cancer (or one of the above indicator conditions). The test amount can be either an absolute value (eg, microgram / ml) or a relative value (eg, relative intensity of the signal).

マ−カ−の「コントロ−ル量」とは、マ−カ−の試験量と比較される量または量の範囲である。例えば、マ−カ−のコントロ−ル量は、乳癌(または上記指標状態の一つ)を有する患者または乳癌(または上記指標状態の一つ)を有さないヒトでのマ−カ−の量でよい。コントロ−ル量は絶対値(例えばマイクログラム/ml)または相対値(例えばシグナルの相対強度)のいずれでもよい。   The “control amount” of a marker is the amount or range of amounts that is compared to the test amount of the marker. For example, the amount of marker control is the amount of marker in a patient with breast cancer (or one of the above indicator conditions) or in a human who does not have breast cancer (or one of the above indicator conditions). It's okay. The amount of control may be either an absolute value (eg, microgram / ml) or a relative value (eg, relative intensity of signals).

「検出」とは、検出対象物の有無または量を特定することを指す。   “Detection” refers to specifying the presence or absence or amount of an object to be detected.

「標識物」としては、分光学、光化学、生化学、免疫化学または化学的手段により検出可能な成分または項目が挙げられる。例えば、有益な標識物としては、32P、35S、蛍光色素、電子密度試薬、酵素(例えばELISAに一般的に用いられているような)、ビオチン−ストレプトアビジン、ジゴキシゲニン、ハプテンおよび、抗血清またはモノクロ−ナル抗体が利用できるタンパク質、あるいは標的に双方的な配列を有する核酸分子が挙げられる。標識物は、放射活性、発色、または蛍光シグナルのような測定可能なシグナルを生じることが多く、これを用いてサンプル中の結合標識物の量を定量化できる。標識物は、共有結合またはイオン結合、ヴァンデルワ−ルス力、または水素結合を介して、プライマ−またはプロ−ブに組み入れる、または結合でき、例えば放射活性ヌクレオチド、またはストレプトアビジンで認識されるビオチン化ヌクレオチドに組み入れることができる。標識物は、直接または間接的に検出できる。間接的な検出は、第一標識物に第二標識物を、直接または間接的に結合することを含んでよい。例えば、標識物は、ストレプトアビジンの結合相手であるビオチン、または特異的にハイブリダイゼ−ションできる相補的配列の結合相手であるヌクレオチド配列のような結合相手のリガンドでよい。結合相手それ自体を直接検出してもよく、例えば抗体はそれ自体を蛍光分子で標識できる。結合相手は間接的にも検出でき、例えば相補的ヌクレオチド配列を有する核酸は分岐DNA分子の一部でよく、別の標識された核酸分子とハイブリダイゼ−ションすることで検出できるようになる(例えば、P. D. Fahrlander and A. Klausner, Bio/Technology 6:1165(1988)参照)。シグナルの定量化は、例えばシンチレ−ション測定、デンシトメトリ−、またはフロ−サイトメトリ−により達成できる。 “Labels” include components or items detectable by spectroscopy, photochemistry, biochemistry, immunochemistry or chemical means. For example, useful labels include 32 P, 35 S, fluorescent dyes, electron density reagents, enzymes (such as those commonly used in ELISAs), biotin-streptavidin, digoxigenin, haptens and antisera Alternatively, a protein for which a monoclonal antibody can be used, or a nucleic acid molecule having a bilateral sequence at the target can be mentioned. The label often produces a measurable signal, such as a radioactive, chromogenic, or fluorescent signal, which can be used to quantify the amount of bound label in the sample. Labels can be incorporated into or bound to primers or probes via covalent or ionic bonds, van der Waals forces, or hydrogen bonds, for example radioactive nucleotides or biotinylated nucleotides recognized by streptavidin Can be incorporated into. The label can be detected directly or indirectly. Indirect detection may involve binding the second label directly or indirectly to the first label. For example, the label may be a ligand of the binding partner, such as biotin, which is a binding partner for streptavidin, or a nucleotide sequence, which is a binding partner for a complementary sequence that can specifically hybridize. The binding partner itself may be detected directly, for example, an antibody can itself be labeled with a fluorescent molecule. The binding partner can also be detected indirectly, for example, a nucleic acid having a complementary nucleotide sequence can be part of a branched DNA molecule, and can be detected by hybridization with another labeled nucleic acid molecule (e.g., PD Fahrlander and A. Klausner, Bio / Technology 6: 1165 (1988)). Signal quantification can be achieved, for example, by scintillation measurements, densitometry, or flow cytometry.

免疫アッセイと選択的および好ましく使用される例示的な検出可能な標識物としては、磁性ビ−ズ、蛍光色素、放射標識物、酵素(例えば西洋ワサビペルオキシダ−ゼ、アルカリホスファタ−ゼおよびその他ELISAに一般的に用いられるもの)、および金コロイドまたは着色ガラスもしくはプラスチックビ−ズの様な熱量計測標識物を挙げることができるが、これらに限定されるものではない。または、サンプル中のマ−カ−は、間接的アッセイを用いて検出できるが、この場合は、例えば二次標識抗体を用いて、結合したマ−カ−特異的抗体を検出し、そして/または競合もしくは阻害アッセイでは、例えばマ−カ−の特徴的エピト−プに結合するモノクロ−ナル抗体と混合物とを同時にインキュベ−ションする。   Exemplary detectable labels that are selectively and preferably used with immunoassays include magnetic beads, fluorescent dyes, radiolabels, enzymes (eg, horseradish peroxidase, alkaline phosphatase and others). And those commonly used in ELISA), and calorimetric labels such as colloidal gold or colored glass or plastic beads, but are not limited thereto. Alternatively, the marker in the sample can be detected using an indirect assay, in which case, for example, using a secondary labeled antibody, the bound marker specific antibody is detected and / or In competition or inhibition assays, for example, monoclonal antibodies and mixtures that bind to the marker's characteristic epitope are incubated simultaneously.

「免疫アッセイ」は、抗原に特異的に結合する抗体を用いるアッセイである。免疫アッセイは、特定の抗体の特異的な結合特性を用いて、抗原を単離し、標的にし、および/または定量化することを特徴とする。   An “immunoassay” is an assay that uses an antibody that specifically binds to an antigen. An immunoassay is characterized by the use of specific binding properties of a particular antibody to isolate, target, and / or quantify the antigen.

抗体に「特異的(もしくは選択的)に結合する」または「特異的(もしくは選択的)に免疫反応する」という句は、タンパク質またはペプチド(もしくはその他エピト−プ)を指す場合は、異質なタンパク質の集合物、およびその他生物物質中のタンパク質の存在を決定する、結合反応を指す。かくして、指定した免疫アッセイ条件の下では、指定した抗体は特定タンパク質に対し、バックグランド(非特異的シグナル)に比べて少なくとも二倍結合し、さらにサンプル中に存在する他のタンパク質とは、有意な量、実質的に結合しない。このような条件での抗体への特異的結合は、特定のタンパク質に対する特異性について選別された抗体を必要とするだろう。たとえば、ラット、マウスまたはヒトといった特定種に由来する精液塩基性タンパク質に対し作製したポリクロ−ナル抗体は、精液塩基性タンパク質と特異的に免疫反応し、他のタンパク質とは免疫反応しないポリクロ−ナル抗体のみを得るように選択できる。この選択は、他種の精液塩基性タンパク質と交叉反応する抗体を除くことで達成できる。例えば、固相ELISA免疫アッセイは、タンパク質と特異的に免疫反応する抗体を選択するのに日常的に用いられている(例えば、特異的免疫反応を決定するのに用いることができる免疫アッセイの形式および条件の説明については、Harlow & Lane, Antibodies, A Laboratory Manual (1988)を参照せよ)。一般的には、特異的または選択的反応は、バックグランドシグナルまたはノイズの少なくとも二倍、より一般的にはバックグランドの10〜100倍である。   When the phrase “specifically (or selectively) binds” or “specifically (or selectively) immunoreacts” to an antibody refers to a protein or peptide (or other epitope), a heterogeneous protein Refers to a binding reaction that determines the presence of proteins in a collection of and other biological materials. Thus, under the specified immunoassay conditions, the specified antibody binds to the specified protein at least twice compared to the background (non-specific signal) and is significantly different from other proteins present in the sample. Does not bind substantially. Specific binding to an antibody under such conditions will require an antibody that has been screened for specificity for a particular protein. For example, a polyclonal antibody produced against a semen basic protein derived from a specific species such as rat, mouse or human specifically reacts with the semen basic protein but does not react with other proteins. One can choose to obtain only antibodies. This selection can be achieved by removing antibodies that cross-react with other types of seminal basic proteins. For example, solid phase ELISA immunoassays are routinely used to select antibodies that specifically immunoreact with a protein (eg, an immunoassay format that can be used to determine a specific immune response). For a description of conditions and conditions, see Harlow & Lane, Antibodies, A Laboratory Manual (1988)). Generally, a specific or selective reaction is at least twice background signal or noise, more typically 10 to 100 times background.

本発明の好ましい態様によって、下表の核酸配列:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, the nucleic acid sequences in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表の配列を含む下表のアミノ酸配列のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, there is provided an isolated polypeptide comprising an amino acid sequence of the amino acid sequence in the table below, including the sequence in the table below.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、R20779_P2によるアミノ酸配列を含む単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising an amino acid sequence according to R20779_P2.

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、HSS100PCB_P3によるアミノ酸配列を含む単離されたポリペプチドが提供される。   A preferred embodiment of the present invention provides an isolated polypeptide comprising an amino acid sequence according to HSS100PCB_P3.

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、またはR11723_PEA_1_T6よりなる群から選択された配列を有するポリヌクレオチドを含む、単離されたポリヌクレオチドが提供される。   According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising a polynucleotide having a sequence selected from the group consisting of: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, or R11723_PEA_1_T6.

本発明の好ましい態様によって、以下よりなる群から選択される配列を有するノ−ド(node)を含む、単離されたポリヌクレオチドが提供される:
R11723_PEA_1_node_13、R11723_PEA_1_node_16、R11723_PEA_1_node_19、R11723_PEA_1_node_2、R11723_PEA_1_node_22、R11723_PEA_1_node_31、R11723_PEA_1_node_10、R11723_PEA_1_node_11、R11723_PEA_1_node_15、R11723_PEA_1_node_18、R11723_PEA_1_node_20、R11723_PEA_1_node_21、R11723_PEA_1_node_23、R11723_PEA_1_node_24、R11723_PEA_1_node_25、R11723_PEA_1_node_26、R11723_PEA_1_node_27、R11723_PEA_1_node_28、R11723_PEA_1_node_29、R11723_PEA_1_node_3、R11723_PEA_1_node_30、R11723_PEA_1_node_4、R11723_PEA_1_node_5、R11723_PEA_1_node_6、R11723_PEA_1_node_7、またはR11723_PEA_1_node_8。
According to a preferred embodiment of the present invention there is provided an isolated polynucleotide comprising a node having a sequence selected from the group consisting of:
R11723_PEA_1_node_13, R11723_PEA_1_node_16, R11723_PEA_1_node_19, R11723_PEA_1_node_2, R11723_PEA_1_node_22, R11723_PEA_1_node_31, R11723_PEA_1_node_10, R11723_PEA_1_node_11, R11723_PEA_1_node_15, R11723_PEA_1_node_18, R11723_PEA_1_node_20, R11723_PEA_1_node_21, R11723_PEA_1_node_23, R11723_PEA_1_node_24, R11723_PEA_1_node_25, R11723_PEA_1_node_26, R11723_PEA_1_node_27, R11723_PEA_1_node_28, R11723_PEA_1_node_29, R11723_PEA_1_node_3, R11723_PEA_1_node_30, R11723_PEA_1_node_4, R11723_PEA_1_node_5, R11723_PEA_1_node_6, R11723_PEA_1_node_7, Or R11723_PEA_1_node_8.

本発明の好ましい態様によって、以下よりなる群から選択される配列を有するポリペプチドを含む、単離されたポリペプチドが提供される:R11723_PEA_1_P2、R11723_PEA_1_P6、R11723_PEA_1_P7、R11723_PEA_1_P13、またはR11723_PEA_1_P10。   According to a preferred embodiment of the present invention there is provided an isolated polypeptide comprising a polypeptide having a sequence selected from the group consisting of: R11723_PEA_1_P2, R11723_PEA_1_P6, R11723_PEA_1_P7, R11723_PEA_1_P13, or R11723_PEA_1_P10.

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、下表の核酸配列を含む単離されたポリヌクレオチド:

Figure 2007520217
および/または下表の配列を含む核酸配列が提供される。
Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polynucleotide comprising a nucleic acid sequence as shown in the table below:
Figure 2007520217
And / or nucleic acid sequences comprising the sequences in the table below are provided.
Figure 2007520217

本発明の好ましい態様によって、下表のアミノ酸配列を含む単離されたポリペプチドが提供される。

Figure 2007520217
According to a preferred embodiment of the present invention, an isolated polypeptide comprising the amino acid sequence shown in the table below is provided.
Figure 2007520217

本発明の好ましい態様によって、MUC1_HUMANのアミノ酸1〜45に相当するMTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVに少なくとも90%相同である第一アミノ酸配列、およびHSMUC1A_PEA_1_P63のアミノ酸46〜85に相当する配列EEEVSADQVSVGASGVLGSFKEARNAPSFLSWSFSMGPSKを有するポリペプチドと少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸を含み、このとき前記第一アミノ酸配列およびダイにアミノ酸配列は連続して順番につながっている、HSMUC1A_PEA_1_P63をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, a first amino acid sequence that is at least 90% homologous to MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSV corresponding to amino acids 1-45 of MUC1_HUMAN, and a sequence EEEVSADQVSVGASGVLGSFKEARNAPSFLSWSFS peptide with at least 90% homology to amino acids 46-85 of HSMUC1A_PEA_1_P63, If necessary comprises at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous second amino acid, wherein said amino acid sequence is contiguous with said first amino acid sequence and die Thus, an isolated chimeric polypeptide encoding HSMUC1A_PEA_1_P63, which is sequentially linked, is provided.

本発明の好ましい態様によって、HSMUC1A_PEA_1_P63内の配列EEEVSADQVSVGASGVLGSFKEARNAPSFLSWSFSMGPSKと少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSMUC1A_PEA_1_P63の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, it is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence EEEVSADQVSVGASGVLGSFKEARNAPSFLSWSFSMGPSK in HSMUC1A_PEA_1_P63 An isolated polypeptide encoding the tail of HSMUC1A_PEA_1_P63 comprising a polypeptide is provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜498に相当し、またT46984_PEA_1_P2のアミノ酸1〜498にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P2のアミノ酸499〜501に相当する配列VCAを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T46984_PEA_1_P2をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 498 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV which also corresponds to amino acids 1 to 498 of T46984_PEA_1_P2, and amino acids 499-501 of T46984_PEA_1_P2 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably less than the polypeptide having the corresponding sequence VCA An isolated chimeric polypeptide encoding T46984_PEA_1_P2, wherein the first amino acid sequence and the second amino acid sequence are consecutively connected in sequence, Provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜433に相当し、またT46984_PEA_1_P3のアミノ酸1〜433にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P3のアミノ酸434〜444に相当する配列ICHIWKLIFLPを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T46984_PEA_1_P3をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 433 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQ which also corresponds to amino acids 1 to 433 of T46984_PEA_1_P3, and amino acids 434-444 of T46984_PEA_1_P3 A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence ICHIWKLIFLP Seen, this time the first amino acid sequence and a second amino acid sequence are connected in order in series, co the T46984_PEA_1_P3 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、T46984_PEA_1_P3中の配列ICHIWKLIFLPに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T46984_PEA_1_P3の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence ICHIWKLIFLP in T46984_PEA_1_P3 An isolated polypeptide that encodes the tail of T46984_PEA_1_P3, comprising a polypeptide, is provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜498に相当し、またT46984_PEA_1_P10のアミノ酸1〜498にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P10のアミノ酸499〜503に相当する配列LMDQKを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T46984_PEA_1_P10をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 498 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV which also corresponds to amino acids 1 to 498 of T46984_PEA_1_P10, and amino acids 499-503 of T46984_PEA_1_P10 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably low in polypeptides with the corresponding sequence LMDQK An isolated chimeric polypeptide encoding T46984_PEA_1_P10, comprising at least 95% homologous second amino acid sequence, wherein said first amino acid sequence and second amino acid sequence are sequentially linked in sequence Is provided.

本発明の好ましい態様によって、T46984_PEA_1_P10中の配列LMDQKに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T46984_PEA_1_P10の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence LMDQK in T46984_PEA_1_P10 An isolated polypeptide that encodes the tail of T46984_PEA_1_P10, comprising a polypeptide, is provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜628に相当し、またT46984_PEA_1_P11のアミノ酸1〜628にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVADVVIKFPEEEAPSTVLSQNLFTPKQEIQHLFREPEKRPPTVVSNTFTALILSPLLLLFALWIRIGANVSNFTFAPSTIIFHLGHAAMKGLMYVYWTQLNMFQTLKYLAILGSVTFLAGNRMLAQQAVKRに対し少なくとも90%相同である第一アミノ酸配列を含む、T46984_PEA_1_P11をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, a single encoding T46984_PEA_1_P11 comprising a first amino acid sequence corresponding to amino acids 1 to 628 of RIB2_HUMAN and corresponding to amino acids 1 to 628 of T46984_PEA_1_P11 is at least 90% homologous. Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜338に相当し、またT46984_PEA_1_P12のアミノ酸1〜338にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P12のアミノ酸339〜343に相当する配列SQDLHを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T46984_PEA_1_P12をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 338 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMN which also corresponds to amino acids 1 to 338 of T46984_PEA_1_P12, and amino acids 339-343 of T46984_PEA_1_P12 A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence SQDLH In this case, the first amino acid sequence and the second amino acid sequence are consecutive. Has led to turn, co the T46984_PEA_1_P12 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、T46984_PEA_1_P12中の配列SQDLHに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T46984_PEA_1_P12の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence SQDLH in T46984_PEA_1_P12 An isolated polypeptide that encodes the tail of T46984_PEA_1_P12, comprising a polypeptide, is provided.

本発明の好ましい態様によって、T46984_PEA_1_P21のアミノ酸1〜1に相当する配列Mを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列と、RIB2_HUMANのアミノ酸70〜631に相当し、またT46984_PEA_1_P21のアミノ酸2〜563にも相当するKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVADVVIKFPEEEAPSTVLSQNLFTPKQEIQHLFREPEKRPPTVVSNTFTALILSPLLLLFALWIRIGANVSNFTFAPSTIIFHLGHAAMKGLMYVYWTQLNMFQTLKYLAILGSVTFLAGNRMLAQQAVKRTAHに対し少なくとも90%相同である第二アミノ酸配列とを含み、このとき前記第一配列と第二配列は連続して順番につながっている、T46984_PEA_1_P21をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, a polypeptide having the sequence M corresponding to amino acids 1-1 of T46984_PEA_1_P21 is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably Corresponds to amino acids 70 to 631 of RIB2_HUMAN with a first amino acid sequence that is at least 95% homologous and also corresponds to amino acids 2 to 563 of T46984_PEA_1_P21 An isolated chimeric polypeptide that encodes T46984_PEA_1_P21, comprising a second amino acid sequence that is at least 90% homologous to YWTQLNMFQTLKYLAILGSVTFLAGNRMLAQQAVKRTAH, wherein the first sequence and the second sequence are sequentially linked in sequence Is provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜415に相当し、またT46984_PEA_1_P27のアミノ酸1〜415にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFAに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P27のアミノ酸416〜459に相当する配列FGSGLVPMSPTSLLLLARLYFTWDMLLCWDSCMSTGLSSTCSRPを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T46984_PEA_1_P27をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 415 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFA which also corresponds to amino acids 1 to 415 of T46984_PEA_1_P27, and amino acids 416-459 of T46984_PEA_1_P27 A second amino acid that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence FGSGLVPMSPTSLLLLARLYFTWDMLLCWDSCMSTGLSSTCSRP And a acid sequence, this time the first amino acid sequence and a second amino acid sequence are connected in order in series, co the T46984_PEA_1_P27 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、T46984_PEA_1_P27中の配列FGSGLVPMSPTSLLLLARLYFTWDMLLCWDSCMSTGLSSTCSRPに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T46984_PEA_1_P27をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence FGSGLVPMSPTSLLLLARLYFTWDMLLCWDSCMSTGLSSTCSRP in T46984_PEA_1_P27 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding T46984_PEA_1_P27 is provided comprising a polypeptide.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜364に相当し、またT46984_PEA_1_P32のアミノ酸1〜364にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVEに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P32のアミノ酸365〜397に相当する配列GQVRWLTPVIPALWEAKAGGSPEVRSSILAWPTを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T46984_PEA_1_P32をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 364 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVE which also corresponds to amino acids 1 to 364 of T46984_PEA_1_P32, and amino acids 365-397 of T46984_PEA_1_P32 A polypeptide having the corresponding sequence GQVRWLTPVIPALWEAKAGGSPEVRSSILAWPT comprises at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous and a second amino acid sequence that is at least 95% homologous. , Then the first amino acid Column and a second amino acid sequence are connected in order in series, co the T46984_PEA_1_P32 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、T46984_PEA_1_P32中の配列GQVRWLTPVIPALWEAKAGGSPEVRSSILAWPTに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T46984_PEA_1_P32をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence GQVRWLTPVIPALWEAKAGGSPEVRSSILAWPT in T46984_PEA_1_P32 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding T46984_PEA_1_P32 comprising a polypeptide is provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜329に相当し、またT46984_PEA_1_P34のアミノ酸1〜329にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGに対し少なくとも90%相同である第一アミノ酸配列を含む、T46984_PEA_1_P34をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 329 of RIB2_HUMAN, also comprising a first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVG which also corresponds to amino acids 1 to 329 of T46984_PEA_1_P34, co the T46984_PEA_1_P34 - sul Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜287に相当し、またT46984_PEA_1_P35のアミノ酸1〜287にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAIに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P35のアミノ酸288〜334に相当する配列GCWPSRQSREQHISSRRKMEILKTECQEKESRTIHSMRRKMEKKNFIを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T46984_PEA_1_P35をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 287 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAI which also corresponds to amino acids 1 to 287 of T46984_PEA_1_P35, and amino acids 288-334 of T46984_PEA_1_P35 A polypeptide having the corresponding sequence GCWPSRQSREQHISSRRKMEILKTECQEKESRTIHSMRRKMEKKNFI comprises at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous and a second amino acid sequence that is at least 95% homologous. In this case, the first amino acid sequence and the second amino acid sequence are sequentially And Do therefore, co the T46984_PEA_1_P35 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、T46984_PEA_1_P35中の配列GCWPSRQSREQHISSRRKMEILKTECQEKESRTIHSMRRKMEKKNFIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T46984_PEA_1_P35の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence GCWPSRQSREQHISSRRKMEILKTECQEKESRTIHSMRRKMEKKNFI in T46984_PEA_1_P35 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of T46984_PEA_1_P35, comprising a polypeptide, is provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜145に相当し、またT46984_PEA_1_P38のアミノ酸1〜145にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P38のアミノ酸146〜160に相当する配列MDPDWCQCLQLHFCSを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T46984_PEA_1_P38をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 145 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEAL which also corresponds to amino acids 1 to 145 of T46984_PEA_1_P38, and amino acids 146-160 of T46984_PEA_1_P38 A polypeptide having the corresponding sequence MDPDWCQCLQLHFCS comprising at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a second amino acid sequence. In this case, an isolated chimeric polypeptide encoding T46984_PEA_1_P38 is provided, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

本発明の好ましい態様によって、T46984_PEA_1_P38中の配列MDPDWCQCLQLHFCSに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T46984_PEA_1_P38の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence MDPDWCQCLQLHFCS in T46984_PEA_1_P38 An isolated polypeptide that encodes the tail of T46984_PEA_1_P38, comprising a polypeptide, is provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜160に相当し、またT46984_PEA_1_P39のアミノ酸1〜160にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLAに対し少なくとも90%相同である第一アミノ酸配列を含む、T46984_PEA_1_P39をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 160 of RIB2_HUMAN, also comprising a first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLA which also corresponds to amino acids 1 to 160 of T46984_PEA_1_P39, co the T46984_PEA_1_P39 - sul Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜101に相当し、またT46984_PEA_1_P45のアミノ酸1〜101にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P45のアミノ酸102〜116に相当する配列NSPGSADSIPPVPAGを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T46984_PEA_1_P45をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1-101 of RIB2_HUMAN and also corresponding to amino acids 1-101 of T46984_PEA_1_P45 A polypeptide having the corresponding sequence NSPGSADSIPPVPAG at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous and a second amino acid sequence comprising In this case, an isolated chimeric polypeptide encoding T46984_PEA_1_P45 is provided, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

本発明の好ましい態様によって、T46984_PEA_1_P45中の配列NSPGSADSIPPVPAGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T46984_PEA_1_P45の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence NSPGSADSIPPVPAG in T46984_PEA_1_P45 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of T46984_PEA_1_P45 comprising a polypeptide is provided.

本発明の好ましい態様によって、RIB2_HUMANのアミノ酸1〜69に相当し、またT46984_PEA_1_P46のアミノ酸1〜69にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P46のアミノ酸70〜84に相当する配列NSPGSADSIPPVPAGを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T46984_PEA_1_P46をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAK corresponding to amino acids 1 to 69 of RIB2_HUMAN and also corresponding to amino acids 1 to 69 of T46984_PEA_1_P46, and amino acids 1 to 69 of T46984_PEA_1 A polypeptide having the corresponding sequence NSPGSADSIPPVPAG at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous and a second amino acid sequence In this case, an isolated chimeric polypeptide encoding T46984_PEA_1_P46 is provided, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

本発明の好ましい態様によって、T46984_PEA_1_P46中の配列NSPGSADSIPPVPAGに対し少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T46984_PEQ_1_P46の尾部をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence NSPGSADSIPPVPAG in T46984_PEA_1_P46 An isolated chimeric polypeptide encoding the tail of T46984_PEQ_1_P46 is provided, comprising a polypeptide that is

本発明の好ましい態様によって、T11628_PEA_1_P2のアミノ酸1〜55に相当するMGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、およびQ8WVH6のアミノ酸1〜99に相当し、またT11628_PEA_1_P2のアミノ酸56〜154にも相当する配列MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGに対し少なくとも90%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T11628_PEA_1_P2をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDE corresponding to amino acids 1 to 55 of T11628_PEA_1_P2, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A first amino acid sequence that is homologous, and a sequence MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQ when compared to this amino acid and the second amino acid sequence that is homologous to this amino acid sequence of Q8WVH6 An isolated chimeric polypeptide encoding T11628_PEA_1_P2 is provided in which the first amino acid sequence and the second amino acid sequence are sequentially linked.

本発明の好ましい態様によって、T11628_PEA_1_P2の配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEに対し少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T11628_PEA_1_P2の頭部をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDE of T11628_PEA_1_P2 is at least 70% required, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated chimeric polypeptide that encodes the head of T11628_PEA_1_P2 comprising a polypeptide is provided.

本発明の好ましい態様によって、MYG_HUMAN_V1のアミノ酸56〜154に相当し、またT11628_PEA_1_P5のアミノ酸1〜99にも相当する配列MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGに対し少なくとも90%相同である第一アミノ酸配列を含む、T11628_PEA_1_P5をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMAS_1116 contains the sequence MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHQ_SEQ ID NO. Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、MYG_HUMAN_V1のアミノ酸1〜134に相当し、またT11628_PEA_1_P7のアミノ酸1〜134にも相当するMGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKに対し少なくとも90%相同である第一アミノ酸配列と、T11628_PEA_1_P7のアミノ酸135〜135に相当する配列Gを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T11628_PEA_1_P7をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGH is a homologue of amino acids 1-134 of MYG_HUMAN_V1 and also corresponds to amino acids 1-134 of T11628_PEA_1_P7. A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to the polypeptide having the corresponding sequence G An isolated chimeric polypeptide encoding T11628_PEA_1_P7 is provided, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

本発明の好ましい態様によって、T11628_PEA_1_P10のアミノ酸1〜55に相当する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同である第一アミノ酸配列と、Q8WVH6のアミノ酸1〜99に相当し、さらにT11628_PEA_1_P10のアミノ酸56〜154に相当するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGに対し少なくとも90%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T11628_PEA_1_P10をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary, at least about 80%, preferably at least about 85%, more preferably at least about 90% relative to a polypeptide having the sequence MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDE corresponding to amino acids 1-55 of T11628_PEA_1_P10 And most preferably at least about 95% homologous to the first amino acid sequence corresponding to amino acids 1 to 99 of Q8WVH6 and further corresponding to amino acids 56 to 154 of T11628_PEA_1_P10 and at least a second amino acid homologous to MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKKGFGFGADAQGAMNY An isolated chimeric polypeptide encoding T11628_PEA_1_P10 is provided, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

本発明の好ましい態様によって、APP1_HUMANのアミノ酸1〜517に相当し、またM78076_PEA_1_P3のアミノ酸1〜517にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P3のアミノ酸518〜519に相当する配列GEを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T78076_PEA_1_P3をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 517 of APP1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKD which also corresponds to amino acids 1 to 517 of M78076_PEA_1_P3, and corresponds to amino acids 518-519 of M78076_PEA_1_P3 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90% and most preferably Or a second amino acid sequence that is at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are consecutively linked in sequence, and are isolated encoding T78076_PEA_1_P3 Chimeric polypeptides are provided.

本発明の好ましい態様によって、APP1_HUMANのアミノ酸1〜526に相当し、またM78076_PEA_1_P4のアミノ酸1〜526にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P4のアミノ酸527〜541に相当する配列ECLTVNPSLQIPLNPを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、M78076_PEA_1_P4をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 526 of APP1_HUMAN and also corresponds to amino acids 1 to 526 of M78076_PEA_1_P4 and corresponding to amino acids 527 to 541 of M78076_PEA_1_P4 and corresponding to amino acids 527 to 541 of M78076_PEA_1_P4 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90% relative to the polypeptide having the sequence ECLTVNPSLQIPLNP , And most preferably a second amino acid sequence that is at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are consecutively linked in sequence, a single encoding M78076_PEA_1_P4 Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、M78076_PEA_1_P4内の配列ECLTVNPSLQIPLNPに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、M78076_PEA_1_P4の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence ECLTVNPSLQIPLNP in M78076_PEA_1_P4 An isolated polypeptide that encodes the tail of M78076_PEA_1_P4, comprising a polypeptide, is provided.

本発明の好ましい態様によって、APP1_HUMANのアミノ酸1〜526に相当し、またM78076_PEA_1_P12のアミノ酸1〜526にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P12のアミノ酸527〜544に相当する配列ECVCSKGFPFPLIGDSEGを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、M78076_PEA_1_P12をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 526 of APP1_HUMAN and also corresponds to amino acids 1 to 526 of M78076_PEA_1_P12 and corresponding to amino acids 527 to 544 of M78076_PEA_1_P12 and corresponding to amino acids 527 to 544 of M78076_PEA_1_P12 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 70% relative to the polypeptide having the sequence ECVCSKGFPFPLIGDSEG. A second amino acid sequence that is 90%, and most preferably at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are consecutively linked in sequence, encoding M78076_PEA_1_P12 An isolated chimeric polypeptide is provided.

本発明の好ましい態様によって、M78076_PEA_1_P12内の配列ECVCSKGFPFPLIGDSEGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、M78076_PEA_1_P12の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence ECVCSKGFPFPLIGDSEG in M78076_PEA_1_P12 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of M78076_PEA_1_P12 is provided, including a polypeptide.

本発明の好ましい態様によって、APP1_HUMANのアミノ酸1〜570に相当し、またM78076_PEA_1_P14のアミノ酸1〜570にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P14のアミノ酸571〜619に相当する配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、M78076_PEA_1_P14をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 570 of APP1_HUMAN and also corresponds to amino acids 1 to 570 of M78076_PEA_1_P14, corresponding to amino acids 571 to 619 of M78076_PEA_1_P14 and corresponding to amino acids 571 to 619 of M78076_PEA_1_P14 At least 70% for polypeptides with the sequence VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVP, at least 8 if necessary 0%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous second amino acid sequence, wherein said first amino acid sequence and second amino acid sequence are consecutive An isolated chimeric polypeptide encoding M78076_PEA_1_P14 is provided that is linked in sequence.

本発明の好ましい態様によって、M78076_PEA_1_P14内の配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、M78076_PEA_1_P14の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVP in M78076_PEA_1_P14 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of M78076_PEA_1_P14 is provided, including a polypeptide.

本発明の好ましい態様によって、APP1_HUMANのアミノ酸1〜352に相当し、またM78076_PEA_1_P21のアミノ酸1〜352にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEに少なくとも90%相同である第一アミノ酸配列、およびAPP1_HUMANのアミノ酸406〜650に相当し、またM78076_PEA_1_P21のアミノ酸353〜597に相当する配列AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSMLLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERPを有するポリペプチドに対し少なくとも90%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、M78076_PEA_1_P21をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 352 of APP1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNE which also corresponds to amino acids 1 to 352 of M78076_PEA_1_P21, and corresponds to APP1_HUMAN amino acids 406-650 and also at least 90% homologous to a polypeptide having the sequence AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSMLLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP corresponding to amino acids 353-597 of M78076_PEA_1_P21 An isolated chimeric polypeptide encoding M78076_PEA_1_P21 is provided, wherein the first amino acid sequence and the second amino acid sequence are consecutively linked in sequence. The

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がEAを含むポリペプチドを含み、以下の構造を有するM78076_PEA_1_P21の端部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号352−xから352のいずれかより開始し:アミノ酸番号353+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids long, comprises a polypeptide comprising at least two amino acids containing EA, and encodes an end of M78076_PEA_1_P21 having the following structure: : A sequence starting from any of amino acid numbers 352-x to 352: ending at any of amino acid numbers 353 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、APP1_HUMANのアミノ酸1〜481に相当し、またM78076_PEA_1_P24のアミノ酸1〜481にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P24のアミノ酸482〜498に相当する配列RECLLPWLPLQISEGRSを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、M78076_PEA_1_P24をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 481 of APP1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQI which also corresponds to amino acids 1 to 481 of M78076_PEA_1_P24, and corresponds to amino acids 482-498 of M78076_PEA_1_P24 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably less than the polypeptide having the sequence RECLLPWLPLQISEGRS An isolated chimeric poly- gram encoding M78076_PEA_1_P24, wherein the first amino acid sequence and the second amino acid sequence are consecutively linked in sequence, A peptide is provided.

本発明の好ましい態様によって、M78076_PEA_1_P24内の配列RECLLPWLPLQISEGRSに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、M78076_PEA_1_P24の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence RECLLPWLPLQISEGRS in M78076_PEA_1_P24 An isolated polypeptide that encodes the tail of M78076_PEA_1_P24, comprising a polypeptide, is provided.

本発明の好ましい態様によって、APP1_HUMANのアミノ酸1〜449に相当し、またM78076_PEA_1_P2のアミノ酸1〜449にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P2のアミノ酸450〜588に相当する配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、M78076_PEA_1_P2をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 449 of APP1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQV which also corresponds to amino acids 1 to 449 of M78076_PEA_1_P2, and corresponds to amino acids 450-588 of M78076_PEA_1_P2 LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLE if necessary, preferably at least 80%, preferably at least 80% A second amino acid sequence that is 85%, more preferably at least 90%, and most preferably at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence, An isolated chimeric polypeptide encoding M78076_PEA_1_P2 is provided.

本発明の好ましい態様によって、M78076_PEA_1_P2内の配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、M78076_PEA_1_P2の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLE in M78076_PEA_1_P2 is preferred An isolated polypeptide encoding the tail of M78076_PEA_1_P2 comprising a polypeptide is provided.

本発明の好ましい態様によって、APP1_HUMANのアミノ酸1〜448に相当し、またM78076_PEA_1_P25のアミノ酸1〜448にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P25のアミノ酸449〜505に相当する配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、M78076_PEA_1_P25をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 448 of APP1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ which also corresponds to amino acids 1 to 448 of M78076_PEA_1_P25, and corresponds to amino acids 449-505 of M78076_PEA_1_P25 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably An isolated chimera encoding M78076_PEA_1_P25, comprising at least 95% homologous second amino acid sequence, wherein said first amino acid sequence and second amino acid sequence are sequentially linked in sequence A polypeptide is provided.

本発明の好ましい態様によって、M78076_PEA_1_P25内の配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、M78076_PEA_1_P25の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSP within M78076_PEA_1_P25 is at least 70% required, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of M78076_PEA_1_P25, comprising a polypeptide, is provided.

発明の好ましい態様によって、EPB2_HUMANのアミノ酸1〜476に相当し、またM85491_PEA_1_P13のアミノ酸1〜476にも相当するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGATNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDSGGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLAHTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVDSITLSWSQPDQPNGVILDYELQYYEKに少なくとも90%相同である第一アミノ酸配列、およびM85491_PEA_1_P13のアミノ酸477〜496に相当する配列VPIGWVLSPSPTSLRAPLPGを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、M85491_PEA_1_P13をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the invention, it corresponds to amino acids 1 to 476 of EPB2_HUMAN, also corresponds to at least a first amino acid sequence is 90% homologous, and M85491_PEA_1_P13 amino acids 477-496 in MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGATNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDSGGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLAHTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVDSITLSWSQPDQPNGVILDYELQYYEK which also corresponds to amino acids 1 to 476 of M85491_PEA_1_P13 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 70% for polypeptides having the sequence VPIGWVLSPSPTSLRAPLPG An isolated chimeric polypeptide encoding M85491_PEA_1_P13, comprising a second amino acid sequence that is 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are consecutively linked in sequence Is provided.

本発明の好ましい態様によって、M85491_PEA_1_P13内の配列VPIGWVLSPSPTSLRAPLPGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、M85491_PEA_1_P13の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence VPIGWVLSPSPTSLRAPLPG in M85491_PEA_1_P13 An isolated polypeptide that encodes the tail of M85491_PEA_1_P13, comprising a polypeptide, is provided.

発明の好ましい態様によって、EPB2_HUMANのアミノ酸1〜270に相当し、またM85491_PEA_1_P14のアミノ酸1〜270にも相当するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRに少なくとも90%相同である第一アミノ酸配列、およびM85491_PEA_1_P14のアミノ酸271〜301に相当する配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、M85491_PEA_1_P14をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the invention, it corresponds to amino acids 1 to 270 of EPB2_HUMAN, also corresponds to at least a first amino acid sequence is 90% homologous, and M85491_PEA_1_P14 amino acids 271-301 in MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCR which also corresponds to amino acids 1 to 270 of M85491_PEA_1_P14 A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence ERQDLTMLSRLVLNSWPQMILPPQPPKVLEL; At this time, the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence, M85491_PEA_1_ An isolated chimeric polypeptide encoding P14 is provided.

本発明の好ましい態様によって、M85491_PEA_1_P14内の配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、M85491_PEA_1_P14の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence ERQDLTMLSRLVLNSWPQMILPPQPPKVLEL within M85491_PEA_1_P14 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of M85491_PEA_1_P14 is provided, including a polypeptide.

本発明の好ましい態様によって、MM11_HUMANのアミノ酸1〜163に相当し、またHSSTROL3_P4のアミノ酸1〜163に相当するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSAKNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWに少なくとも90%相同である第一アミノ酸配列、HSSTROL3_P4のアミノ酸164に相当するする架橋アミノ酸H、MM11_HUMNAのアミノ酸165〜445に相当し、またHSSTROL3_P4のアミノ酸165〜445にも相当するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKIYFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADGに対し少なくとも90%相同である第二アミノ酸配列、およびHSSTROL3_P4のアミノ酸446〜496に相当する配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三のアミノ酸配列とを含み、このとき前記第一アミノ酸配列、架橋アミノ酸、第二アミノ酸配列および第三アミノ酸配列は連続して順番につながっている、HSSTROL3_P4をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 163 of MM11_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSAKNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYW corresponding to amino acids 1-163 of HSSTROL3_P4, crosslinking amino acids corresponding to amino acid 164 of HSSTROL3_P4 H, corresponds to amino acids 165-445 of MM11_HUMNA, also a second amino acid sequence that is at least 90% homologous to GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKIYFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG which also corresponds to amino acids 165-445 of HSSTROL3_P4, and corresponds to amino acids 446-496 of HSSTROL3_P4 sequence ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSG A third amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having SSSQVLCPEPSALLSVAG; At this time, an isolated chimeric polypeptide encoding HSSTROL3_P4 is provided in which the first amino acid sequence, the bridging amino acid, the second amino acid sequence, and the third amino acid sequence are sequentially connected.

本発明の好ましい態様によって、HSSTROL3_P4内の配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSSTROL3_P4の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAG in HSSTROL3_P4 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HSSTROL3_P4, comprising a polypeptide, is provided.

本発明の好ましい態様によって、MM11_HUMANのアミノ酸1〜163に相当し、またHSSTROL3_P5のアミノ酸1〜163に相当するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSAKNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWに少なくとも90%相同である第一アミノ酸配列、HSSTROL3_P5のアミノ酸164に相当するする架橋アミノ酸H、MM11_HUMNAのアミノ酸165〜358に相当し、またHSSTROL3_P5のアミノ酸165〜358にも相当するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQに対し少なくとも90%相同である第二アミノ酸配列、およびHSSTROL3_P5のアミノ酸359〜382に相当する配列ELGFPSSTGRDESLEHCRCQGLHKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三のアミノ酸配列とを含み、このとき前記第一アミノ酸配列、架橋アミノ酸、第二アミノ酸配列および第三アミノ酸配列は連続して順番につながっている、HSSTROL3_P5をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 163 of MM11_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSAKNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYW corresponding to amino acids 1-163 of HSSTROL3_P5, crosslinking amino acids corresponding to amino acid 164 of HSSTROL3_P5 H, corresponds to amino acids 165-358 of MM11_HUMNA, also a second amino acid sequence that is at least 90% homologous to GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQ which also corresponds to amino acids 165-358 of HSSTROL3_P5, and the corresponding sequence ELGFPSSTGRDESLEHCRCQGLHK to amino acid 359-382 of HSSTROL3_P5 At least 70%, if necessary at least 80%, A third amino acid sequence that is preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous, wherein said first amino acid sequence, bridged amino acid, second amino acid sequence and third An isolated chimeric polypeptide encoding HSSTROL3_P5 is provided in which the amino acid sequences are sequentially linked.

本発明の好ましい態様によって、HSSTROL3_P5内の配列ELGFPSSTGRDESLEHCRCQGLHKに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSSTROL3_P5の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence ELGFPSSTGRDESLEHCRCQGLHK in HSSTROL3_P5 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of HSSTROL3_P5 is provided, including a polypeptide.

本発明の好ましい態様によって、MM11_HUMANのアミノ酸1〜163に相当し、またHSSTROL3_P7のアミノ酸1〜163に相当するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSAKNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWに少なくとも90%相同である第一アミノ酸配列、HSSTROL3_P7のアミノ酸164に相当するする架橋アミノ酸H、MM11_HUMNAのアミノ酸165〜359に相当し、またHSSTROL3_P7のアミノ酸165〜359にも相当するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGに対し少なくとも90%相同である第二アミノ酸配列、およびHSSTROL3_P7のアミノ酸360〜370に相当する配列TTGVSTPAPGVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三のアミノ酸配列とを含み、このとき前記第一アミノ酸配列、架橋アミノ酸、第二アミノ酸配列および第三アミノ酸配列は連続して順番につながっている、HSSTROL3_P7をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 163 of MM11_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSAKNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYW corresponding to amino acids 1-163 of HSSTROL3_P7, crosslinking amino acids corresponding to amino acid 164 of HSSTROL3_P7 H, corresponds to amino acids 165-359 of MM11_HUMNA, also a second amino acid sequence that is at least 90% homologous to GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQG which also corresponds to amino acids 165-359 of HSSTROL3_P7, and the corresponding sequence TTGVSTPAPGV to amino acid 360-370 of HSSTROL3_P7 At least 70%, if necessary at least 80%, preferably Comprising a third amino acid sequence that is at least 85%, more preferably at least 90%, and most preferably at least 95% homologous, wherein said first amino acid sequence, bridging amino acid, second amino acid sequence and third amino acid An isolated chimeric polypeptide encoding HSSTROL3_P7 is provided in which the sequences are sequentially linked.

本発明の好ましい態様によって、HSSTROL3_P7内の配列TTGVSTPAPGVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSSTROL3_P7の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence TTGVSTPAPGV in HSSTROL3_P7 An isolated polypeptide encoding the tail of HSSTROL3_P7 is provided, including a polypeptide.

本発明の好ましい態様によって、MM11_HUMANのアミノ酸1〜163に相当し、またHSSTROL3_P8のアミノ酸1〜163に相当するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSAKNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWに少なくとも90%相同である第一アミノ酸配列、HSSTROL3_P8のアミノ酸164に対応するする架橋アミノ酸H、MM11_HUMNAのアミノ酸165〜286に相当し、またHSSTROL3_P8のアミノ酸165〜286にも相当するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEに対し少なくとも90%相同である第二アミノ酸配列、およびHSSTROL3_P8のアミノ酸287〜301に相当する配列VRPCLPVPLLLCWPLを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三のアミノ酸配列とを含み、このとき前記第一アミノ酸配列、架橋アミノ酸、第二アミノ酸配列および第三アミノ酸配列は連続して順番につながっている、HSSTROL3_P8をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 163 of MM11_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSAKNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYW corresponding to amino acids 1-163 of HSSTROL3_P8, crosslinking amino acids corresponding to amino acid 164 of HSSTROL3_P8 H, which corresponds to amino acids 165 to 286 of MM11_HUMNA, and also corresponds to amino acids 165 to 286 of HSSTROL3_P8, GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTA At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90% And most preferably comprises a third amino acid sequence that is at least 95% homologous, wherein said first amino acid sequence, bridging amino acid, second amino acid sequence and third amino acid sequence are sequentially connected in sequence, An isolated chimeric polypeptide encoding HSSTROL3_P8 is provided.

本発明の好ましい態様によって、HSSTROL3_P8内の配列VRPCLPVPLLLCWPLに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSSTROL3_P8の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence VRPCLPVPLLLCWPL in HSSTROL3_P8 An isolated polypeptide encoding the tail of HSSTROL3_P8 is provided, including a polypeptide.

本発明の好ましい態様によって、MM11_HUMANのアミノ酸1〜96に相当し、またHSSTROL3_P9のアミノ酸1〜96に相当するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSAKNRQKに少なくとも90%相同である第一アミノ酸配列、MM11_HUMNAのアミノ酸113〜163に相当し、またHSSTROL3_P9のアミノ酸97〜147にも相当するRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWに少なくとも90%相同である第二アミノ酸配列、HSSTROL3_P9のアミノ酸148に相当する架橋アミノ酸H、MM11_HUMANのアミノ酸165〜359、またHSSTROL3_P9のアミノ酸149〜343に相当するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGに対し少なくとも90%相同である第三アミノ酸配列、およびHSSTROL3_P9のアミノ酸344〜354に相当する配列TTGVSTPAPGVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第四アミノ酸配列とを含み、このとき前記第一アミノ酸配列、第二アミノ酸配列、架橋アミノ酸、第三アミノ酸配列および第四アミノ酸配列は連続して順番につながっている、HSSTROL3_P9をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSAKNRQK corresponding to amino acids 1 to 96 of MM11_HUMAN and 163 amino acids corresponding to the first amino acid UM of 163 that is at least 90% homologous to NA RISTRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYW second amino acid sequence corresponding to amino acids 97-147 of HSSTROL3_P9, cross-linked amino acid H corresponding to amino acid 148 of HSSTROL3_P9, amino acids 165-359 of MM11_HUMAN, and amino acids 165-359 of HSSTROL3_343 Equivalent to GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRWQ A fourth amino acid sequence that is at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence TTGVSTPAPGV In this case, the isolated first chimeric sequence encoding HSSTROL3_P9, wherein the first amino acid sequence, the second amino acid sequence, the bridging amino acid, the third amino acid sequence and the fourth amino acid sequence are successively connected. A peptide is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がKRを含むポリペプチドを含み、以下の構造を有するHSSTROL3_P9の端部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号96−xから96のいずれかより開始し:アミノ酸番号97+((n−2)−x)のいずれかに終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long and most preferably at least about 50 amino acids long, comprises a polypeptide comprising at least two amino acids KR, and encodes the end of HSSTROL3_P9 having the following structure: Is a sequence starting from any of amino acid numbers 96-x to 96 and ending at any of amino acid numbers 97 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、HSSTROL3_P9内の配列TTGSVSTPAPGVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSSTROL3_P9の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence TTGSVSTPAPGV in HSSTROL3_P9 An isolated polypeptide that encodes the tail of HSSTROL3_P9, comprising a polypeptide, is provided.

発明の好ましい態様によって、LATH_HUMANのアミノ酸1〜33に相当し、またAY180924_PEA_1_P3のアミノ酸1〜33にも対応するMLNVSGLFVLLCGLLVSSSAQEVLAGVSSQLLNに少なくとも90%相同である第一アミノ酸配列と、AY180924_PEA_1_P3のアミノ酸34〜64に相当する配列GETVLLWVMQNPEPMPVKFSLAKYLGHNEHYを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第四アミノ酸配列とを含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、AY180924_PEA_1_P3をコ−ドしている単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the invention, it corresponds to amino acids 1-33 of LATH_HUMAN and also corresponds to amino acids 34-64 of AY180924_PEA_1_P3 and a first amino acid sequence which is at least 90% homologous to MLNVSGLFVLLCGLLVSSSAQEVLAGVSSQLLN corresponding to amino acids 1-33 of AY180924_PEA_1_P3 A polypeptide having the sequence GETVLLWVMQNPEPMPVKFSLAKYLGHNEHY at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous and a fourth amino acid sequence, At this time, an isolated chimeric polypeptide encoding AY180924_PEA_1_P3 is provided in which the first and second amino acid sequences are sequentially connected in sequence.

本発明の好ましい態様によって、AY189024_PEA_1_P3内の配列GETVLLWVMQNPEPMPVKFSLAKYLGHNEHYに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、AY180924_PEA_1_P3の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence GETVLLWVMQNPEPMPVKFSLAKYLGHNEHY within AY189024_PEA_1_P3 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of AY180924_PEA_1_P3, comprising a polypeptide, is provided.

本発明の好ましい態様によって、Q96DR8のアミノ酸1〜74に対応し、またR75793_PEA_1P2のアミノ酸1〜74に対応するMKFLAVLVLLGVSIFLVSAQNPTTAAPADTYPATGPADDEAPDAETTAAATTATTAAPTTATTAASTTARKDIPに少なくとも90%相同である第一アミノ酸配列、およびR75793_PEA_1_P2のアミノ酸75〜76に相当する配列APを有するポリペプチドに対し少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、R75793_PEA_1_P2をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, a first amino acid sequence corresponding to amino acids 1 to 74 of Q96DR8 and corresponding to amino acids 1 to 74 of R75793_PEA_1P2 is at least 90% homologous to MKFLAVLVLLGVSIFLVSAQNPTTAAPADTYPATGPADDEAPDAETTAAATTATTAAPTTATTAASTTARKDIP A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence AP; At this time, an isolated chimeric polypeptide encoding R75793_PEA_1_P2 is provided in which the first and second amino acid sequences are sequentially connected in sequence.

本発明の好ましい態様によって、CA1B_HUMAN_V5のアミノ酸1〜1056に相当し、またHUMCA1XIA_P14のアミノ酸1〜1056にも相当するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMCSYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPPGPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGEVGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQGPKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKPGPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQRGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPGAAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQGPPGPVに少なくとも90%相同である第一アミノ酸配列と、HUMCA1XIA_P14のアミノ酸1057〜1081に相当する配列VSMMIINSQTIMVVNYSSSFITLMLを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、HUMCA1XIA_P14をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1056 of CA1B_HUMAN_V5, also corresponding to amino acids 1 to 1056 of HUMCA1XIA_P14 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMCSYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPPGPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGEVGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPG A first amino acid sequence that is at least 90% homologous to WaiPijiarukyuJipikeijiesutijiefuPijiefuPijieienujiikeijieiarujibuieijikeiPiJipiarujikyuaruJipitiJipiarujiesuarujieiaruJipitijikeiPiJipikeijitiesujijidiJipipijipipijiiaruJipikyuJipikyuJipibuijiefupijipikeiJipipijipipijikeidijierupijieichipijikyuarujiitijiefukyujikeitijipipiJipijijibuibuiJipikyuJipitijiitiJipiaijiiarujieichiPiJipipijipipijiikyujieruPijieieijikeiijieikeijidipiJipikyujiaiesujikeidiJipieijieruarujiefuPijiiRGLPGAQGAPGLKGGEGPQGPPGPV, at least 70% to a polypeptide having a sequence VSMMIINSQTIMVVNYSSSFITLML corresponding to amino acids 1057-1081 of HUMCA1XIA_P14, if required, at least 80%, preferably at least 85%, more preferably An isolation encoding HUMCA1XIA_P14, comprising a second amino acid sequence that is at least 90%, and most preferably at least 95% homologous, wherein said first and second amino acid sequences are sequentially linked Provided is a chimeric polypeptide.

本発明の好ましい態様によって、HUMCA1XIA_P14内の配列VSMMIINSQTIMVVNYSSSFITLMLに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HUMCA1XIA_P14の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence VSMMIINSQTIMVVNYSSSFITLML in HUMCA1XIA_P14 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HUMCA1XIA_P14, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CA1B_HUMANのアミノ酸1〜714に相当し、またHUMCA1XIA_P15のアミノ酸1〜714にも相当するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMCSYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKに少なくとも90%相同である第一アミノ酸配列と、HUMCA1XIA_P15のアミノ酸715〜729に相当する配列MCCNLSFGILIPLQKを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、HUMCA1XIA_P15をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponding to amino acids 1 to 714 of CA1B_HUMAN and corresponding to amino acids 1 to 714 of HUMCA1XIA_P15 and corresponding to amino acids 715 to 729 of HUMCA1XIA_P15 and corresponding to amino acids 715 to 729 of HUMCA1XIA_P15 Array MCCNLSFGILI A second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having PLQK, wherein An isolated chimeric polypeptide encoding HUMCA1XIA_P15 is provided wherein the first and second amino acid sequences are sequentially linked.

本発明の好ましい態様によって、HUMCA1XIA_P15内の配列MCCNLSFGILIPLQKに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HUMCA1XIA_P15の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary, at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence MCCNLSFGILIPLQK in HUMCA1XIA_P15 An isolated polypeptide that encodes the tail of HUMCA1XIA_P15 is provided, including a polypeptide.

本発明の好ましい態様によって、CA1B_HUMANのアミノ酸1〜648に相当し、またHUMCA1XIA_P16のアミノ酸1〜648にも相当するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMCSYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEA少なくとも90%相同である第一アミノ酸配列、CA1B_HUMANのアミノ酸667〜714に相当し、またHUMCA1XIA_P16のアミノ酸649〜696に相当する配列GMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列、およびHUMCA1XIA_P16のアミノ酸697〜738に相当する配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、このとき前記第一アミノ酸配列、第二アミノ酸配列および第三アミノ酸配列は連続して順番につながっている、HUMCA1XIA_P16をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the first amino acid sequence corresponding to amino acids 1 to 648 of CA1B_HUMAN and corresponding to amino acids 1 to 648 of HUMCA1XIA_P16, corresponding to amino acids 667 to 714 of CA1B_HUMAN, corresponding to amino acids 667 to 714 of CA1B_HUMAN Sequence GMAGVDGPPGPKGNMGPQGEPGPPGQ corresponding to amino acids 649 to 696 of HUMCA1XIA_P16 A second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having QGNPGPQGLPGPQGPIGPPGEK, and amino acid 697 of HUMCA1XIA_P16 A third amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYE corresponding to ~ 738 Wherein the first amino acid sequence, the second amino acid sequence, and the third amino acid sequence are sequentially connected in sequence, provided is an isolated chimeric polypeptide encoding HUMCA1XIA_P16.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がAGを含むポリペプチドを含み、以下の構造を有するHUMCA1XIA_P16の端部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号649−xから648のいずれかより開始し:アミノ酸番号649+((n−2)−x)のいずれかに終止する配列で、ここでのxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids in length, comprising a polypeptide in which at least two amino acids comprise AG, and coding the end of HUMCA1XIA_P16 having the following structure: Is a sequence starting from any of amino acid numbers 649-x to 648: ending at any of amino acid numbers 649 + ((n-2) -x), where x is from 0 to n-2 It is a range.

本発明の好ましい態様によって、HUMCA1XIA_P16内の配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HUMCA1XIA_P16の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYE in HUMCA1XIA_P16 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of HUMCA1XIA_P16 is provided, including a polypeptide.

本発明の好ましい態様によって、CA1B_HUMANのアミノ酸1〜260に相当し、またHUMCA1XIA_P17のアミノ酸1〜260にも相当するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDE少なくとも90%相同である第一アミノ酸配列、およびHUMCA1XIA_P17のアミノ酸261〜273に相当する配列VRSTRPEKVFVFQを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HUMCA1XIA_P17をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 260 of CA1B_HUMAN, also corresponds to MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDE first amino acid sequence that is at least 90% homologous, and HUMCA1XIA_P17 amino acids 261-273 that also corresponds to amino acids 1 to 260 of HUMCA1XIA_P17 A polypeptide having the sequence VRSTRPEKVFVFQ comprises a second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous, An isolated chimera encoding HUMCA1XIA_P17, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence Ripepuchido is provided.

本発明の好ましい態様によって、HUMCA1XIA_P17内の配列VRSTRPEKVFVFQに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HUMCA1XIA_P17の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence VRSTRPEKVFVFQ in HUMCA1XIA_P17 An isolated polypeptide that encodes the tail of HUMCA1XIA_P17 is provided, including a polypeptide.

本発明の好ましい態様によって、STC2_HUMANのアミノ酸1〜169に相当し、またR20779_P2のアミノ酸1〜169にも相当するMCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNTAEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGKSFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQENTRVIVEMIHFKDLLLHE少なくとも90%相同である第一アミノ酸配列、およびR20779_P2のアミノ酸170〜187に相当する配列CYKIEITMPKRRKVKLRDを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、R20779_P2をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 169 of STC2_HUMAN, also corresponds to MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNTAEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGKSFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQENTRVIVEMIHFKDLLLHE first amino acid sequence that is at least 90% homologous, and R20779_P2 amino acids 170-187 that also corresponds to amino acids 1 to 169 of R20779_P2 A polypeptide having the sequence CYKIEITMPKRRKVKLRD comprises a second amino acid sequence that is at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous An isolated chimeric polypeptide encoding R20779_P2 is provided in which the first amino acid sequence and the second amino acid sequence are sequentially linked.

本発明の好ましい態様によって、R20779_P2内の配列CYKIEITMPKRRKVKLRDに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HUMCA1XIA_P17の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence CYKIEITMPKRRKVKLRD in R20779_P2 is at least 70% homologous, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HUMCA1XIA_P17, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMANのアミノ酸1〜865に相当し、またHSCOC4_PEA_1_P3のアミノ酸1〜865にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P3のアミノ酸配866〜887に相当する配列RPHRSLSIQELGEPGPSEGWGGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P3をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 865 of CO4_HUMAN, also corresponding to amino acids 1-865 of HSCOC4_PEA_1_P3 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQ A first amino acid sequence that is at least 90% homologous to LELRPVLYNYLDKNLTV, and a polypeptide having the sequence RPHRSLSIQELGEPGPSEGWGG corresponding to amino acid sequence 866-887 of HSCOC4_PEA_1_P3, at least 70%, if necessary at least 80%, preferably at least 85%, more HSCOC4_PEA_1_P3, preferably comprising at least 90%, and most preferably at least 95% homologous second amino acid sequence, wherein said first amino acid sequence and second amino acid sequence are sequentially linked Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P3内の配列RPHRSLSIQELGEPGPSEGWGGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P3の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence RPHRSLSIQELGEPGPSEGWGG in HSCOC4_PEA_1_P3 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of HSCOC4_PEA_1_P3 comprising a polypeptide is provided.

本発明の好ましい態様によって、CO4_HUMANのアミノ酸1〜818に相当し、またHSCOC4_PEA_1_P5のアミノ酸1〜818にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P5のアミノ酸配819〜843に相当する配列DVTLSGPQVTLLPFPCTPAPCSLCSを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P5をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 818 of CO4_HUMAN, also at least 90% homologous to MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKG which also corresponds to amino acids 1 to 818 of HSCOC4_PEA_1_P5 A first amino acid sequence, and a polypeptide having the sequence DVTLSGPQVTLLPFPCTPAPCSLCS corresponding to amino acid sequence 819-843 of HSCOC4_PEA_1_P5, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and An isolated chimera encoding HSCOC4_PEA_1_P5, most preferably comprising a second amino acid sequence that is at least 95% homologous, wherein said first amino acid sequence and second amino acid sequence are consecutively linked in sequence A polypeptide is provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P5内の配列DVTLSGPQVTLLPFPCTPAPCSLCSに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P5の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence DVTLSGPQVTLLPFPCTPAPCSLCS within HSCOC4_PEA_1_P5 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of HSCOC4_PEA_1_P5 comprising a polypeptide is provided.

本発明の好ましい態様によって、CO4_HUMANのアミノ酸1〜1052に相当し、またHSCOC4_PEA_1_P6のアミノ酸1〜1052にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P6のアミノ酸配1053〜1084に相当する配列SGCKGKQEGGQERTVTGRWTAQEATEGKKGGPを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P6をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 1052 of CO4_HUMAN, also corresponding to amino acids 1 to 1052 of HSCOC4_PEA_1_P6 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRF The first amino acid sequence that is at least 90% homologous to IkyueruieruaruPibuieruwaienuwaierudikeienuerutibuiesubuieichibuiesuPibuiijierushierueijijijijierueikyukyubuierubuiPieijiesueiaruPibuieiefuesubuibuiPitieieieieibuiesuerukeibuibuieiarujiesuefuiefuPibuijidieibuiesukeibuierukyuaiikeiijieiaieichiaruiierubuiwaiieruenuPierudieichiarujiarutieruiaiPijienuesudiPienuemuaiPidijidiefuenuesuwaibuiarubuitieiesudiPieruditierujiesuijieieruesuPijijibuieiesuerueruarueruPiarujishijiikyutiemuaiwaierueiPitierueieiesuaruwaiLDKTEQWSTLPPETKDHAVDLIQKG, and at least 70% to a polypeptide having a sequence corresponding to SGCKGKQEGGQERTVTGRWTAQEATEGKKGGP the amino acid distribution 1053-1084 of HSCOC4_PEA_1_P6, if required at least 80%, preferably at least 85%, more A second amino acid sequence that is preferably at least 90% and most preferably at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are linked sequentially in sequence. Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P6内の配列SGCKGKQEGGQERTVTGRWTAQEATEGKKGGPに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P6の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence SGCKGKQEGGQERTVTGRWTAQEATEGKKGGP in HSCOC4_PEA_1_P6 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P6, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1380に相当し、またHSCOC4_PEA_1_P12のアミノ酸1〜1380にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P12のアミノ酸配1381〜1397に相当する配列RAREGVGPGTGGGEGVEを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P12をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1380 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1380 of HSCOC4_PEA_1_P12 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS At least 70%, if necessary at least 80%, preferably at least 85%, more preferred Comprising a second amino acid sequence that is at least 90% and most preferably at least 95% homologous. Acid sequence and a second amino acid sequence are connected in order in series, co the HSCOC4_PEA_1_P12 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P12内の配列RAREGVGPGTGGGEGVEに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P12の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence RAREGVGPGTGGGEGVE in HSCOC4_PEA_1_P12 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P12, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1359に相当し、またHSCOC4_PEA_1_P15のアミノ酸1〜1359にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P15のアミノ酸配1360〜1415に相当する配列VNHSLVNHSLAWVARTPGPRGQARSRPQPPTRGIPAALLPGVFGGRLTSWLRDLELを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P15をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1359 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1359 of HSCOC4_PEA_1_P15 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS The first amino acid sequence that is at least 90% homologous to BuiaruaruefuikyueruieruaruPibuieruwaienuwaierudikeienuerutibuiesubuieichibuiesuPibuiijierushierueijijijijierueikyukyubuierubuiPieijiesueiaruPibuieiefuesubuibuiPitieieieieibuiesuerukeibuibuieiarujiesuefuiefuPibuijidieibuiesukeibuierukyuaiikeiijieiaieichiaruiierubuiwaiieruenuPierudieichiarujiarutieruiaiPijienuesudiPienuemuaiPidijidiefuenuesuwaibuiarubuitieiesudiPieruditierujiesuijieieruesuPijijibuieiesuerueruarueruPiarujishijiikyutiemuaiwaierueiPitierueieiesuaruwaierudikeitiikyudaburyuesutieruPipiitikeidieichieibuidieruaikyukeijiwaiemuaruaikyukyuefuarukeieidijiesuwaieieidaburyueruesuarudiesuesutidaburyuerutieiefubuierukeibuieruesuerueikyuikyubuijijiesuPiikeierukyuitiesuenudaburyuerueruesukyukyukyueidijiesuefukyudiPishiPibuierudiaruesuemukyujijierubuijienudiitibuieierutieiefubuitiaieierueichieichijierueibuiefukyudiijieiiPierukeikyuarubuiieiesuaiesukeieiesuesuefuerujiikeieiesueijieruerujieieichieieieiaitieiwaieierutierutikeieiPieidieruarujibuieieichienuenueruemueiemueikyuitijidienueruwaidaburyujiesubuitijiesukyuesuenueibuiesuPitipiEipiaruenuPiesudipiemuPikyueiPieierudaburyuaiititieiwaieieruerueichierueruerueichiijikeieiiemueidikyueieieidaburyuerutiarukyujiesuefukyujijiefuaruesutikyuditibuiaieierudieieruesueiwaidaburyuaieiesueichititiiiarujieruenubuitieruesuesutiGRNGFKSHALQLNNRQIRGLEEELQ, and at least 70% to a polypeptide having a sequence corresponding to VNHSLVNHSLAWVARTPGPRGQARSRPQPPTRGIPAALLPGVFGGRLTSWLRDLEL the amino acid distribution 1360-1415 of HSCOC4_PEA_1_P15, if required at least 80%, preferably at least 85%, more A second amino acid sequence that is preferably at least 90% and most preferably at least 95% homologous, wherein Serial first amino acid sequence and a second amino acid sequence are connected in order in series, co the HSCOC4_PEA_1_P15 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P15内の配列VNHSLVNHSLAWVARTPGPRGQARSRPQPPTRGIPAALLPGVFGGRLTSWLRDLELに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P15の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence VNHSLVNHSLAWVARTPGPRGQARSRPQPPTRGIPAALLPGVFGGRLTSWLRDLEL in HSCOC4_PEA_1_P15 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P15, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1457に相当し、またHSCOC4_PEA_1_P16のアミノ酸1〜1457にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P16のアミノ酸配1458〜1483に相当する配列AERQGGAVWHGHRGRHPPEWIPRPACを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P16をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1457 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1457 of HSCOC4_PEA_1_P16 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS At least 70%, if necessary, at least 80%, preferably at least 85%, more preferably Is at least 90%, and most preferably at least 95 An isolated chimeric polypeptide encoding HSCOC4_PEA_1_P16 is provided, wherein the first amino acid sequence and the second amino acid sequence are consecutively linked in sequence, the second amino acid sequence being% homologous The

本発明の好ましい態様によって、HSCOC4_PEA_1_P16内の配列AERQGGAVWHGHRGRHPPEWIPRPACに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P16の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence AERGGGGAVWHGHRGRHPPEWIPRPAC in HSCOC4_PEA_1_P16 An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P16, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1303に相当し、またHSCOC4_PEA_1_P20のアミノ酸1〜1303にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P20のアミノ酸配1304〜1349に相当する配列VGAVPGLWRGWVVLRPRACLSPGSTSLGHGDCPGCPVCLLDCLPHHを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P20をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1303 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1303 of HSCOC4_PEA_1_P20 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS The first amino acid sequence that is at least 90% homologous to BuiaruaruefuikyueruieruaruPibuieruwaienuwaierudikeienuerutibuiesubuieichibuiesuPibuiijierushierueijijijijierueikyukyubuierubuiPieijiesueiaruPibuieiefuesubuibuiPitieieieieibuiesuerukeibuibuieiarujiesuefuiefuPibuijidieibuiesukeibuierukyuaiikeiijieiaieichiaruiierubuiwaiieruenuPierudieichiarujiarutieruiaiPijienuesudiPienuemuaiPidijidiefuenuesuwaibuiarubuitieiesudiPieruditierujiesuijieieruesuPijijibuieiesuerueruarueruPiarujishijiikyutiemuaiwaierueiPitierueieiesuaruwaierudikeitiikyudaburyuesutieruPipiitikeidieichieibuidieruaikyukeijiwaiemuaruaikyukyuefuarukeieidijiesuwaieieidaburyueruesuarudiesuesutidaburyuerutieiefubuierukeibuieruesuerueikyuikyubuijijiesuPiikeierukyuitiesuenudaburyuerueruesukyukyukyueidijiesuefukyudiPishiPibuierudiaruesuemukyujijierubuijienudiitibuieierutieiefubuitiaieierueichieichijierueibuiefukyudiijieiiPierukeikyuarubuiieiesuaiesukeieiesuesuefuerujiikeieiesueijieruerujieieichieieieiaitieiwaieierutierutikeieiPieidieruarujibuieieichienuenueruemueiemueikyuitijidienueruwaidaburyujiesubuitijiesukyuesuenueibuiesuPitipiEipiaruenuPiesudipiemuPikyueiPieierudaburyuaiititieiwaieieruerueichierueruerueichiijikeiAEMADQAAAWLTRQGSFQGGFRSTQ, and at least 70% to a polypeptide having a sequence corresponding to VGAVPGLWRGWVVLRPRACLSPGSTSLGHGDCPGCPVCLLDCLPHH the amino acid distribution 1304-1349 of HSCOC4_PEA_1_P20, if required at least 80%, preferably at least 85%, more A second amino acid sequence that is preferably at least 90% and most preferably at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are Has led to sequentially continue to, co the HSCOC4_PEA_1_P20 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P20内の配列VGAVPGLWRGWVVLRPRACLSPGSTSLGHGDCPGCPVCLLDCLPHHに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P20の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence VGAVPGLWRGWVVLRPRACLSPGSTSLGHGDCPGCPVCLLDCLPHH within HSCOC4_PEA_1_P20 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of HSCOC4_PEA_1_P20 comprising a polypeptide is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1529に相当し、またHSCOC4_PEA_1_P9のアミノ酸1〜1529にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P9のアミノ酸配1530〜1533に相当する配列SGERを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P9をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1529 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1529 of HSCOC4_PEA_1_P9 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSV A polypeptide having the first amino acid sequence at least 90% homologous to and a sequence SGER corresponding to amino acid sequence 1530-1533 of HSCOC4_PEA_1_P9, at least 80% if necessary, preferably at least 85%, more preferably Is at least 90% And most preferably an isolated encoding HSCOC4_PEA_1_P9, comprising a second amino acid sequence that is at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence Chimeric polypeptides are provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P9内の配列SEGRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P9の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence SEGR in HSCOC4_PEA_1_P9 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P9, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1653に相当し、またHSCOC4_PEA_1_P22のアミノ酸1〜1653にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQPASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRRALERGLQDEDGYRMKFACYYPRVEYGFQVKVLREDSRAAFRLFETKITQVLHFに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P22のアミノ酸配1654〜1670に相当する配列SMKQTGEAGRAGGRQGGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P22をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1653 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1653 of HSCOC4_PEA_1_P22 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS VRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQPASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRRALERGLQDEDGYRMKFACYYPRVEYGFQVKVLREDSRAAFRLFETKITQVLHF first amino acid sequence that is at least 90% homologous to, and to a polypeptide having a sequence corresponding to SMKQTGEAGRAGGRQGG the amino acid distribution 1654-1670 of HSCOC4_PEA_1_P22 A second amino acid sequence that is at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous, wherein said first amino acid An isolated chimeric polypeptide encoding HSCOC4_PEA_1_P22 is provided in which the sequence and the second amino acid sequence are sequentially linked.

本発明の好ましい態様によって、HSCOC4_PEA_1_P22内の配列SMKQTGEAGRAGGRQGGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P22の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence SMKQTGEAGRAGGRQGG in HSCOC4_PEA_1_P22 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P22, including a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1626に相当し、またHSCOC4_PEA_1_P23のアミノ酸1〜1626にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQPASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRRALERGLQDEDGYRMKFACYYPRVEYGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P23のアミノ酸配1627〜1685に相当する配列QSSHRGPGLTLPRGPAVLVSLGVACSSYRSCTQPVCSDTNFLPSQPQSNSPFPLLLTPSを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P23をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1626 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1626 of HSCOC4_PEA_1_P23 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS The first amino acid sequence that is at least 90% homologous to BuiaruaruefuikyueruieruaruPibuieruwaienuwaierudikeienuerutibuiesubuieichibuiesuPibuiijierushierueijijijijierueikyukyubuierubuiPieijiesueiaruPibuieiefuesubuibuiPitieieieieibuiesuerukeibuibuieiarujiesuefuiefuPibuijidieibuiesukeibuierukyuaiikeiijieiaieichiaruiierubuiwaiieruenuPierudieichiarujiarutieruiaiPijienuesudiPienuemuaiPidijidiefuenuesuwaibuiarubuitieiesudiPieruditierujiesuijieieruesuPijijibuieiesuerueruarueruPiarujishijiikyutiemuaiwaierueiPitierueieiesuaruwaierudikeitiikyudaburyuesutieruPipiitikeidieichieibuidieruaikyukeijiwaiemuaruaikyukyuefuarukeieidijiesuwaieieidaburyueruesuarudiesuesutidaburyuerutieiefubuierukeibuieruesuerueikyuikyubuijijiesuPiikeierukyuitiesuenudaburyuerueruesukyukyukyueidijiesuefukyudiPishiPibuierudiaruesuemukyujijierubuijienudiitibuieierutieiefubuitiaieierueichieichijierueibuiefukyudiijieiiPierukeikyuarubuiieiesuaiesukeieiesuesuefuerujiikeieiesueijieruerujieieichieieieiaitieiwaieierutierutikeieiPieidieruarujibuieieichienuenueruemueiemueikyuitijidienueruwaidaburyujiesubuitijiesukyuesuenueibuiesuPitipiEipiaruenuPiesudipiemuPikyueiPieierudaburyuaiititieiwaieieruerueichierueruerueichiijikeieiiemueidikyueieieidaburyuerutiarukyujiesuefukyujijiefuaruesutikyuditibuiaieierudieieruesueiwaidaburyuaieiesueichititiiiarujieruenubuitieruesuesutijiaruenujiefukeiesueichieierukyueruenuenuarukyuaiarujieruiiierukyuefuesuerujiesukeiaienubuikeibuijijienuesukeijitierukeibuieruarutiwaienubuierudiemukeienutitishikyudierukyuaiibuitibuikeijieichibuiiwaitiemuieienuidiwaiidiwaiiwaidiieruPieikeididiPidieiPierukyuPibuitiPierukyueruefuijiaruaruenuaruaruaruaruieiPikeibuibuiiikyuiesuarubuieichiwaitibuishiaidaburyuaruenujikeibuijieruesujiemueiaieidibuitierueruesujiefueichieieruarueidieruikeierutiesueruesudiaruwaibuiesueichiefuitiiJipieichibuierueruwaiefudiesubuiPitiesuaruishibuijiefuieibuikyuibuiPibuijierubuikyuPieiesueitieruwaidiwaiwaienuPiiaruarushiesubuiefuwaijieiPiesukeiesuarueruerueitierushiesueiibuishikyushieiijikeishiPiarukyuaruarueiLERGLQDEDGYRMKFACYYPRVEYG, and a poly sequence QSSHRGPGLTLPRGPAVLVSLGVACSSYRSCTQPVCSDTNFLPSQPQSNSPFPLLLTPS the corresponding amino acid distribution 1627-1685 of HSCOC4_PEA_1_P23 A second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to the peptide, wherein said first An isolated chimeric polypeptide encoding HSCOC4_PEA_1_P23 is provided in which the amino acid sequence and the second amino acid sequence are sequentially linked.

本発明の好ましい態様によって、HSCOC4_PEA_1_P23内の配列QSSHRGPGLTLPRGPAVLVSLGVACSSYRSCTQPVCSDTNFLPSQPQSNSPFPLLLTPSに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P23の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence QSHSHRGPGLTLPRGPAVLVSLGVACSSYRSCTQPVCSDTNFLPSQPQSNSPFPLLLTPS in HSCOC4_PEA_1_P23 is at least 70%, if required at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P23, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1528に相当し、またHSCOC4_PEA_1_P24のアミノ酸1〜1528にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P24のアミノ酸配1529〜1579に相当する配列SADVLCFTGHQVRADSWPPCVLLKSASVLRGSALASVAPWSGVCRTRMATGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P24をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1528 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1528 of HSCOC4_PEA_1_P24 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS The first amino acid sequence that is at least 90% homologous to BuiaruaruefuikyueruieruaruPibuieruwaienuwaierudikeienuerutibuiesubuieichibuiesuPibuiijierushierueijijijijierueikyukyubuierubuiPieijiesueiaruPibuieiefuesubuibuiPitieieieieibuiesuerukeibuibuieiarujiesuefuiefuPibuijidieibuiesukeibuierukyuaiikeiijieiaieichiaruiierubuiwaiieruenuPierudieichiarujiarutieruiaiPijienuesudiPienuemuaiPidijidiefuenuesuwaibuiarubuitieiesudiPieruditierujiesuijieieruesuPijijibuieiesuerueruarueruPiarujishijiikyutiemuaiwaierueiPitierueieiesuaruwaierudikeitiikyudaburyuesutieruPipiitikeidieichieibuidieruaikyukeijiwaiemuaruaikyukyuefuarukeieidijiesuwaieieidaburyueruesuarudiesuesutidaburyuerutieiefubuierukeibuieruesuerueikyuikyubuijijiesuPiikeierukyuitiesuenudaburyuerueruesukyukyukyueidijiesuefukyudiPishiPibuierudiaruesuemukyujijierubuijienudiitibuieierutieiefubuitiaieierueichieichijierueibuiefukyudiijieiiPierukeikyuarubuiieiesuaiesukeieiesuesuefuerujiikeieiesueijieruerujieieichieieieiaitieiwaieierutierutikeieiPieidieruarujibuieieichienuenueruemueiemueikyuitijidienueruwaidaburyujiesubuitijiesukyuesuenueibuiesuPitipiEipiaruenuPiesudipiemuPikyueiPieierudaburyuaiititieiwaieieruerueichierueruerueichiijikeieiiemueidikyueieieidaburyuerutiarukyujiesuefukyujijiefuaruesutikyuditibuiaieierudieieruesueiwaidaburyuaieiesueichititiiiarujieruenubuitieruesuesutijiaruenujiefukeiesueichieierukyueruenuenuarukyuaiarujieruiiierukyuefuesuerujiesukeiaienubuikeibuijijienuesukeijitierukeibuieruarutiwaienubuierudiemukeienutitishikyudierukyuaiibuitibuikeijieichibuiiwaitiemuieienuidiwaiidiwaiiwaidiieruPieikeididiPidieiPierukyuPibuitiPierukyueruefuijiaruaruenuaruaruaruaruieiPikeibuibuiiikyuiesuarubuieichiwaitibuishiaidaburyuaruenujikeibuijieruesujiemueiaieidibuitierueruesujiefueichieieruarueidieruikeiLTSLSDRYVSHFETEGPHVLLYFDS, and at least 70% to a polypeptide having a sequence corresponding to SADVLCFTGHQVRADSWPPCVLLKSASVLRGSALASVAPWSGVCRTRMATG the amino acid distribution 1529-1579 of HSCOC4_PEA_1_P24, if required at least 80%, and preferably less A second amino acid sequence that is 85%, more preferably at least 90%, and most preferably at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence, An isolated chimeric polypeptide encoding HSCOC4_PEA_1_P24 is provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P24内の配列SADVLCFTGHQVRADSWPPCVLLKSASVLRGSALASVAPWSGVCRTRMATGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P24の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence SADVLCFTGHQVRADSWPPCVLLKSASVLRGSALASVAPWSGVCRTRMATG in HSCOC4_PEA_1_P24 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P24, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1593に相当し、またHSCOC4_PEA_1_P25のアミノ酸1〜1593にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQPASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P25のアミノ酸配1594〜1657に相当する配列ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRLPGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P25をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1593 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1593 of HSCOC4_PEA_1_P25 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS The first amino acid sequence that is at least 90% homologous to BuiaruaruefuikyueruieruaruPibuieruwaienuwaierudikeienuerutibuiesubuieichibuiesuPibuiijierushierueijijijijierueikyukyubuierubuiPieijiesueiaruPibuieiefuesubuibuiPitieieieieibuiesuerukeibuibuieiarujiesuefuiefuPibuijidieibuiesukeibuierukyuaiikeiijieiaieichiaruiierubuiwaiieruenuPierudieichiarujiarutieruiaiPijienuesudiPienuemuaiPidijidiefuenuesuwaibuiarubuitieiesudiPieruditierujiesuijieieruesuPijijibuieiesuerueruarueruPiarujishijiikyutiemuaiwaierueiPitierueieiesuaruwaierudikeitiikyudaburyuesutieruPipiitikeidieichieibuidieruaikyukeijiwaiemuaruaikyukyuefuarukeieidijiesuwaieieidaburyueruesuarudiesuesutidaburyuerutieiefubuierukeibuieruesuerueikyuikyubuijijiesuPiikeierukyuitiesuenudaburyuerueruesukyukyukyueidijiesuefukyudiPishiPibuierudiaruesuemukyujijierubuijienudiitibuieierutieiefubuitiaieierueichieichijierueibuiefukyudiijieiiPierukeikyuarubuiieiesuaiesukeieiesuesuefuerujiikeieiesueijieruerujieieichieieieiaitieiwaieierutierutikeieiPieidieruarujibuieieichienuenueruemueiemueikyuitijidienueruwaidaburyujiesubuitijiesukyuesuenueibuiesuPitipiEipiaruenuPiesudipiemuPikyueiPieierudaburyuaiititieiwaieieruerueichierueruerueichiijikeieiiemueidikyueieieidaburyuerutiarukyujiesuefukyujijiefuaruesutikyuditibuiaieierudieieruesueiwaidaburyuaieiesueichititiiiarujieruenubuitieruesuesutijiaruenujiefukeiesueichieierukyueruenuenuarukyuaiarujieruiiierukyuefuesuerujiesukeiaienubuikeibuijijienuesukeijitierukeibuieruarutiwaienubuierudiemukeienutitishikyudierukyuaiibuitibuikeijieichibuiiwaitiemuieienuidiwaiidiwaiiwaidiieruPieikeididiPidieiPierukyuPibuitiPierukyueruefuijiaruaruenuaruaruaruaruieiPikeibuibuiiikyuiesuarubuieichiwaitibuishiaidaburyuaruenujikeibuijieruesujiemueiaieidibuitierueruesujiefueichieieruarueidieruikeierutiesueruesudiaruwaibuiesueichiefuitiiJipieichibuierueruwaiefudiesubuiPitiesuaruishibuijiefuieibuikyuibuiPibuijierubuikyuPieiesueitieruwaidiwaiwaienuPiiaruarushiesubuiFYGAPSKSRLLATLCSAEVCQCAEG, and the less the polypeptide having a sequence corresponding to ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRLPG the amino acid distribution from 1,594 to 1,657 of HSCOC4_PEA_1_P25 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous second amino acid sequence, wherein said first amino acid sequence and An isolated chimeric polypeptide encoding HSCOC4_PEA_1_P25 is provided in which the second amino acid sequence is sequentially linked.

本発明の好ましい態様によって、HSCOC4_PEA_1_P25内の配列ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRLPGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P25の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRLPG in HSCOC4_PEA_1_P25 is at least 70%, if required at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P25, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1593に相当し、またHSCOC4_PEA_1_P26のアミノ酸1〜1593にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQPASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P26のアミノ酸配1594〜1691に相当する配列ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRSVFPPRPWPDPPSGTGCFGLSGCSLLLLQVMHAACLLを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P26をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1593 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1593 of HSCOC4_PEA_1_P26 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS The first amino acid sequence that is at least 90% homologous to BuiaruaruefuikyueruieruaruPibuieruwaienuwaierudikeienuerutibuiesubuieichibuiesuPibuiijierushierueijijijijierueikyukyubuierubuiPieijiesueiaruPibuieiefuesubuibuiPitieieieieibuiesuerukeibuibuieiarujiesuefuiefuPibuijidieibuiesukeibuierukyuaiikeiijieiaieichiaruiierubuiwaiieruenuPierudieichiarujiarutieruiaiPijienuesudiPienuemuaiPidijidiefuenuesuwaibuiarubuitieiesudiPieruditierujiesuijieieruesuPijijibuieiesuerueruarueruPiarujishijiikyutiemuaiwaierueiPitierueieiesuaruwaierudikeitiikyudaburyuesutieruPipiitikeidieichieibuidieruaikyukeijiwaiemuaruaikyukyuefuarukeieidijiesuwaieieidaburyueruesuarudiesuesutidaburyuerutieiefubuierukeibuieruesuerueikyuikyubuijijiesuPiikeierukyuitiesuenudaburyuerueruesukyukyukyueidijiesuefukyudiPishiPibuierudiaruesuemukyujijierubuijienudiitibuieierutieiefubuitiaieierueichieichijierueibuiefukyudiijieiiPierukeikyuarubuiieiesuaiesukeieiesuesuefuerujiikeieiesueijieruerujieieichieieieiaitieiwaieierutierutikeieiPieidieruarujibuieieichienuenueruemueiemueikyuitijidienueruwaidaburyujiesubuitijiesukyuesuenueibuiesuPitipiEipiaruenuPiesudipiemuPikyueiPieierudaburyuaiititieiwaieieruerueichierueruerueichiijikeieiiemueidikyueieieidaburyuerutiarukyujiesuefukyujijiefuaruesutikyuditibuiaieierudieieruesueiwaidaburyuaieiesueichititiiiarujieruenubuitieruesuesutijiaruenujiefukeiesueichieierukyueruenuenuarukyuaiarujieruiiierukyuefuesuerujiesukeiaienubuikeibuijijienuesukeijitierukeibuieruarutiwaienubuierudiemukeienutitishikyudierukyuaiibuitibuikeijieichibuiiwaitiemuieienuidiwaiidiwaiiwaidiieruPieikeididiPidieiPierukyuPibuitiPierukyueruefuijiaruaruenuaruaruaruaruieiPikeibuibuiiikyuiesuarubuieichiwaitibuishiaidaburyuaruenujikeibuijieruesujiemueiaieidibuitierueruesujiefueichieieruarueidieruikeierutiesueruesudiaruwaibuiesueichiefuitiiJipieichibuierueruwaiefudiesubuiPitiesuaruishibuijiefuieibuikyuibuiPibuijierubuikyuPieiesueitieruwaidiwaiwaienuPiiaruarushiesubuiFYGAPSKSRLLATLCSAEVCQCAEG, and a corresponding sequence ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRSVFPPRPWPDPPSGTGCFGLSGCSLLLLQVMHAACLL the amino acid distribution 1594-1691 of HSCOC4_PEA_1_P26 A second amino acid sequence that is at least 70% homologous to the peptide, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous. An isolated chimeric polypeptide encoding HSCOC4_PEA_1_P26 is provided in which the amino acid sequence and the second amino acid sequence are sequentially linked.

本発明の好ましい態様によって、HSCOC4_PEA_1_P26内の配列ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRSVFPPRPWPDPPSGTGCFGLSGCSLLLLQVMHAACLLに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P26の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRSVFPPRPWPDPPSGTGCFGLSGCSLLLLQVMHAACLL in HSCOC4_PEA_1_P26 is at least about 80%, preferably at least about 85%, more preferably at least about 90% An isolated polypeptide encoding the tail of HSCOC4_PEA_1_P26 comprising a polypeptide is provided.

本発明の好ましい態様によって、CO4_HUMAN_V3のアミノ酸1〜1232に相当し、またHSCOC4_PEA_1_P30のアミノ酸1〜1232にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P30のアミノ酸配1233〜1253に相当する配列RNPVRLLQPRAQMFCVLRGTKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P30をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1232 of CO4_HUMAN_V3, also corresponding to amino acids 1 to 1232 of HSCOC4_PEA_1_P30 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS The first amino acid sequence that is at least 90% homologous to BuiaruaruefuikyueruieruaruPibuieruwaienuwaierudikeienuerutibuiesubuieichibuiesuPibuiijierushierueijijijijierueikyukyubuierubuiPieijiesueiaruPibuieiefuesubuibuiPitieieieieibuiesuerukeibuibuieiarujiesuefuiefuPibuijidieibuiesukeibuierukyuaiikeiijieiaieichiaruiierubuiwaiieruenuPierudieichiarujiarutieruiaiPijienuesudiPienuemuaiPidijidiefuenuesuwaibuiarubuitieiesudiPieruditierujiesuijieieruesuPijijibuieiesuerueruarueruPiarujishijiikyutiemuaiwaierueiPitierueieiesuaruwaierudikeitiikyudaburyuesutieruPipiitikeidieichieibuidieruaikyukeijiwaiemuaruaikyukyuefuarukeieidijiesuwaieieidaburyueruesuarudiesuesutidaburyuerutieiefubuierukeibuieruesuerueikyuikyubuijijiesuPiikeierukyuitiesuenudaburyuerueruesukyukyukyueidijiesuefukyudiPishiPibuierudiaruesuemukyujijierubuijienudiitibuieierutieiefubuitiaieierueichieichijierueibuiefukyudiijieiiPierukeikyuarubuiieiesuaiesukeieiesuesuefuerujiikeieiesueijieruerujieieichieieieiaitieiwaieierutierutikeieipieiDLRGVAHNNLMAMAQETGDNLYWGS, and at least 70% to a polypeptide having a sequence corresponding to RNPVRLLQPRAQMFCVLRGTK the amino acid distribution 1233-1253 of HSCOC4_PEA_1_P30, if required at least 80%, preferably at least 85%, more A second amino acid sequence that is preferably at least 90% and most preferably at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are consecutively linked in sequence. Isolated key Mela polypeptides are provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P30内の配列RNPVRLLQPRAQMFCVLRGTKに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P30の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence RNPVRLLQPRAQMFCVLRGTK in HSCOC4_PEA_1_P30 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of HSCOC4_PEA_1_P30 comprising a polypeptide is provided.

本発明の好ましい態様によって、CO4_HUMANのアミノ酸1〜818に相当し、またHSCOC4_PEA_1_P38のアミノ酸1〜818にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P38のアミノ酸配819〜843に相当する配列DVTLSGPQVTLLPFPCTPAPCSLCSを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P38をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 818 of CO4_HUMAN, also at least 90% homologous to MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKG which also corresponds to amino acids 1 to 818 of HSCOC4_PEA_1_P38 A first amino acid sequence, and a polypeptide having the sequence DVTLSGPQVTLLPFPCTPAPCSLCS corresponding to amino acid sequence 819-843 of HSCOC4_PEA_1_P38, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and An isolated chimera encoding HSCOC4_PEA_1_P38, most preferably comprising a second amino acid sequence that is at least 95% homologous, wherein said first amino acid sequence and second amino acid sequence are sequentially linked A polypeptide is provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P38内の配列DVTLSGPQVTLLPFPCTPAPCSLCSに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P38の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence DVTLSGPQVTLLPFPCTPAPCSLCS within HSCOC4_PEA_1_P38 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of HSCOC4_PEA_1_P38 comprising a polypeptide is provided.

本発明の好ましい態様によって、CO4_HUMANのアミノ酸1〜387に相当し、またHSCOC4_PEA_1_P39のアミノ酸1〜387にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P39のアミノ酸配388〜394に相当する配列VSSRGEGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P39をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 387 of CO4_HUMAN, also the first amino acid sequence that is at least 90% homologous to MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQ which also corresponds to amino acids 1 to 387 of HSCOC4_PEA_1_P39, and amino acid distribution 388-394 of HSCOC4_PEA_1_P39 A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence VSSRGEG Including the first amino acid sequence And a second amino acid sequence are connected in order in series, co the HSCOC4_PEA_1_P39 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P39内の配列VSSRGEGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P39の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence VSSRGEG in HSCOC4_PEA_1_P39 An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P39, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMANのアミノ酸1〜236に相当し、またHSCOC4_PEA_1_P40のアミノ酸1〜236にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P40のアミノ酸配237〜263に相当する配列AGEWTEPHFPLKGRVPGRPFEAEYGHYを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P40をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 236 of CO4_HUMAN, also the first amino acid sequence that is at least 90% homologous to MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKY which also corresponds to amino acids 1 to 236 of HSCOC4_PEA_1_P40, and amino acid distribution 237-263 of HSCOC4_PEA_1_P40 A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence AGEWTEPHFPLKGRVPGRPFEAEYGHY The first amino acid sequence and the second amino acid sequence are consecutively connected in sequence, and the HSCOC4_PEA_1_P40 code is isolated. Chimeric polypeptides are provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P40内の配列AGEWTEPHFPLKGRVPGRPFEAEYGHYに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P40の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence AGEWTEPHFPLKGRVPGRPFEAEYGHY in HSCOC4_PEA_1_P40 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of HSCOC4_PEA_1_P40 comprising a polypeptide is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1529に相当し、またHSCOC4_PEA_1_P41のアミノ酸1〜1529にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSV少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P41のアミノ酸1530〜1533に相当する配列SGERを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HSCOC4_PEA_1_P41をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1529 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1529 of HSCOC4_PEA_1_P41 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS A polypeptide having the first amino acid sequence that is at least 90% homologous and the sequence SGER corresponding to amino acids 1530-1533 of HSCOC4_PEA_1_P41, at least 70% if necessary, preferably at least 85%, preferably at least 85%, more preferably at least 90% Most preferably at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are consecutively linked in sequence, and are isolated to encode HSCOC4_PEA_1_P41 Chimeric polypeptides are provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P41内の配列SGERに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P41の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence SGER in HSCOC4_PEA_1_P41 An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P41, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CO4_HUMAN_V1のアミノ酸1〜1473に相当し、またHSCOC4_PEA_1_P42のアミノ酸1〜1473にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWに少なくとも90%相同である第一アミノ酸配列、HSCOC4_PEA_1_P42のアミノ酸1474〜1511に相当する配列WAPGAALGQGREGRTQAGAGLLEPAQAEPGRQLTRLHRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列、CO4_HUMAN_V1のアミノ酸1474〜1503に相当し、またHSCOC4_PEA_1_P42のアミノ酸1512〜1541に相当するRNGKVGLSGMAIADVTLLSGFHALRADLEKに少なくとも90%相同である第三アミノ酸配列、およびHSCOC4_PEA_1_P42のアミノ酸1542〜1555に相当する配列VWSATQGNPLCPRY有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第四アミノ酸配列を含み、このとき前記第一アミノ酸配列、第二アミノ酸配列、第三配列および第四配列が連続して順番につながっている、HSCOC4_PEA_1_P42をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 1473 of CO4_HUMAN_V1, also corresponding to amino acids 1 to 1473 of HSCOC4_PEA_1_P42 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMS At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 85%. 90%, and most preferably A second amino acid sequence that is at least 95% homologous, a third amino acid sequence that is at least 90% homologous to RNGKVGLSGMAIADVTLLSGFHALRADLEK, corresponding to amino acids 1447-1503 of CO4_HUMAN_V1, and corresponding to amino acids 1512-1541 of HSCOC4_PEA_1_P42, and amino acid 154 of HSCOC4_PEA_1_P42 A fourth amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence VWSATQGNPLCPRY corresponding to ~ 1555 An isolated chimeric polypeptide encoding HSCOC4_PEA_1_P42, wherein the first amino acid sequence, the second amino acid sequence, the third sequence and the fourth sequence are sequentially connected in sequence .

本発明の好ましい態様によって、HSCOC4_PEA_1_P42に対応する、配列WAPGAALGQGREGRTQAGAGLLEPAQAEPGRQLTRLHRをコ−ドする配列に対し少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるアミノ酸配列を含む、HSCOC4_PEA_1_P42の端部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary, at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence coding for the sequence WAPGAALGQGREGRTQAGAGLLEPAQAEPGRQLTRLHR corresponding to HSCOC4_PEA_1_P42, and An isolated polypeptide encoding the end of HSCOC4_PEA_1_P42, most preferably comprising an amino acid sequence that is at least about 95% homologous, is provided.

本発明の好ましい態様によって、HSCOC4_PEA_1_P42内の配列VWSATQGNPLCPRYに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HSCOC4_PEA_1_P42の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence VWSATQGNPLCPRY in HSCOC4_PEA_1_P42 An isolated polypeptide encoding the tail of HSCOC4_PEA_1_P42 comprising a polypeptide is provided.

本発明の好ましい態様によって、TFF3_HUMANのアミノ酸1〜27に相当し、HUMTREFAC_PEA_2_P8のアミノ酸1〜27にも相当するMAARALCMLGLVLALLSSSSAEEYVGLに少なくとも90%相同である第一アミノ酸配列、およびHUMTREFAC_PEA_2_P8のアミノ酸28〜41に相当する配列WKVHLPKGEGFSSGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HUMTREFAC_PEA_2_P8をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1-27 of TFF3_HUMAN, first amino acid sequence that is at least 90% homologous to MAARALCMLGLVLALLSSSSAEEYVGL corresponding to amino acids 1-27 of HUMTREFAC_PEA_2_P8, and corresponds to amino acids 28-41 of HUMTREFAC_PEA_2_P8 Comprising a second amino acid sequence that is at least 70% homologous to a polypeptide having the sequence WKVHLPKGEGFSSG, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous Sometimes an isolated chimeric polypeptide encoding HUMTREFAC_PEA_2_P8 is provided, wherein the first amino acid sequence and the second amino acid sequence are sequentially linked.

本発明の好ましい態様によって、HUMTREFAC_PEA_2_P8内の配列WKVHLPKGEGFSSGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HUMTREFAC_PEA_2_P8の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence WKVHLPKGEGFSSG in HUMTREFAC_PEA_2_P8 An isolated polypeptide that encodes the tail of HUMTREFAC_PEA_2_P8, comprising a polypeptide, is provided.

本発明の好ましい態様によって、OSTP_HUMANのアミノ酸1〜58に相当し、またHUMOSTRO_PEA_1_PEA_1_P21のアミノ酸1〜58にも相当するMRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQKQNLLAPQに少なくとも90%相同である第一アミノ酸配列、およびHUMOSTRO_PEA_1_PEA_1_P21のアミノ酸59〜64に相当する配列VFLNFSを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HUMOSTRO_PEA_1_PEA_1_P21をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the first amino acid sequence that is at least 90% homologous to MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQKQNLLAPQ corresponding to amino acids 1 to 58 of OSTP_HUMAN and also corresponding to amino acids 1 to 58 of HUMOSTRO_PEA_1_PEA_1_P21, and 64 Comprising a second amino acid sequence that is at least 70% homologous to a polypeptide having the sequence VFLNFS, where necessary, preferably at least 85%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% At this time, an isolated chimeric polypeptide encoding HUMOSTRO_PEA_1_PEA_1_P21 is provided in which the first amino acid sequence and the second amino acid sequence are successively connected.

本発明の好ましい態様によって、HUMOSTRO_PEA_1_PEA_1_P21内の配列VFLNFSに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HUMOSTRO_PEA_1_PEA_1_P21の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence VFLNFS in HUMOSTRO_PEA_1_PEA_1_P21 An isolated polypeptide that encodes the tail of HUMOSTRO_PEA_1_PEA_1_P21, comprising a polypeptide, is provided.

本発明の好ましい態様によって、OSTP_HUMANのアミノ酸1〜31に相当し、またHUMOSTRO_PEA_1_PEA_1_P25のアミノ酸1〜31にも相当するMRIAVICFCLLGITCAIPVKQADSGSSEEKQに少なくとも90%相同である第一アミノ酸配列、およびHUMOSTRO_PEA_1_PEA_1_P25のアミノ酸32〜32に相当する配列Hを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HUMOSTRO_PEA_1_PEA_1_P25をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the first amino acid sequence that is at least 90% homologous to MRIAVICFCLLGITCAIPVKQADSGSSEEKQ corresponding to amino acids 1-31 of OSTP_HUMAN and also amino acids 1-31 of HUMOSTRO_PEA_1_PEA_1_P25, and corresponding to amino acids 32-32 of HUMOSTRO_PEA_1_PEA_1_P25 A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence H At this time, an isolated chimeric polypeptide encoding HUMOSTRO_PEA_1_PEA_1_P25 is provided in which the first amino acid sequence and the second amino acid sequence are successively connected.

本発明の好ましい態様によって、OSTP_HUMANのアミノ酸1〜31に相当し、またHUMOSTRO_PEA_1_PEA_1_P30のアミノ酸1〜31にも相当するMRIAVICFCLLGITCAIPVKQADSGSSEEKQに少なくとも90%相同である第一アミノ酸配列、およびHUMOSTRO_PEA_1_PEA_1_P30のアミノ酸32〜39に相当する配列VSIFYVFIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、HUMOSTRO_PEA_1_PEA_1_P30をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the first amino acid sequence that is at least 90% homologous to MRIAVICFCLLGITCAIPVKQADSGSSEEKQ corresponding to amino acids 1-31 of OSTP_HUMAN and also corresponding to amino acids 1-31 of HUMOSTRO_PEA_1_PEA_1_P30, and corresponding to amino acids 32-39 of HUMOSTRO_PEA_1_PEA_1_P30 Comprising a second amino acid sequence that is at least 70% homologous to a polypeptide having the sequence VSIFYVFI to be required, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous, At this time, an isolated chimeric polypeptide encoding HUMOSTRO_PEA_1_PEA_1_P30 is provided in which the first amino acid sequence and the second amino acid sequence are successively connected.

本発明の好ましい態様によって、HUMOSTRO_PEA_1_PEA_1_P30内の配列VSIFYVFIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HUMOSTRO_PEA_1_PEA_1_P30の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence VSIFYVFI in HUMOSTRO_PEA_1_PEA_1_P30 An isolated polypeptide encoding the tail of HUMOSTRO_PEA_1_PEA_1_P30 comprising a polypeptide is provided.

本発明の好ましい態様によって、CEA6_HUMANのアミノ酸1〜319に相当し、またT10888_PEA_1_P2のアミノ酸1〜319にも相当するMGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYRPGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQAHNSATGLNRTTVTMITVSに少なくとも90%相同である第一アミノ酸配列、およびT10888_PEA_1_P2のアミノ酸320〜324に相当する配列DWTRPを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T10888_PEA_1_P2をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 319 of CEA6_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYRPGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQAHNSATGLNRTTVTMITVS which also corresponds to amino acids 1 to 319 of T10888_PEA_1_P2, and corresponds to amino acids 320 to 324 of T10888_PEA_1_P2 Comprising a second amino acid sequence that is at least 70% homologous to a polypeptide having the sequence DWTRP, where required, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% At this time, the first and second amino acid sequences are sequentially connected in sequence, T10888_PEA_1_ An isolated chimeric polypeptide that encodes P2 is provided.

本発明の好ましい態様によって、T10888_PEA_1_P2内の配列DWTRPに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T10888_PEA_1_P2の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence DWTRP in T10888_PEA_1_P2 An isolated polypeptide that encodes the tail of T10888_PEA_1_P2, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CEA6_HUMANのアミノ酸1〜234に相当し、またT10888_PEA_1_P4のアミノ酸1〜234にも相当するMGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLに少なくとも90%相同である第一アミノ酸配列、およびT10888_PEA_1_P4のアミノ酸235〜256に相当する配列LLLSSQLWPPSASRLECWPGWLを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T10888_PEA_1_P4をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 234 of CEA6_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL which also corresponds to amino acids 1 to 234 of T10888_PEA_1_P4, and corresponds to amino acids 235-256 of T10888_PEA_1_P4 Comprising a second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence LLLSSQLWPPSASRLECWPGWL; At this time, the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence, and the isolated chimeric poly- gram encoding T10888_PEA_1_P4 A peptide is provided.

本発明の好ましい態様によって、T10888_PEA_1_P4内の配列LLLSSQLWPPSASRLECWPGWLに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T10888_PEA_1_P4の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence LLLSSQLWPPSASRLECWPGWL in T10888_PEA_1_P4 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of T10888_PEA_1_P4, comprising a polypeptide, is provided.

本発明の好ましい態様によって、Q13774のアミノ酸1〜234に相当し、またT10888_PEA_1_P4のアミノ酸1〜234にも相当するMGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLに少なくとも90%相同である第一アミノ酸配列、およびT10888_PEA_1_P4のアミノ酸235〜256に相当する配列LLLSSQLWPPSASRLECWPGWLを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T10888_PEA_1_P4をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 234 of Q13774, also the first amino acid sequence that is at least 90% homologous to MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL which also corresponds to amino acids 1 to 234 of T10888_PEA_1_P4, and corresponds to amino acids 235-256 of T10888_PEA_1_P4 Comprising a second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence LLLSSQLWPPSASRLECWPGWL At this time, an isolated chimeric polypeptide encoding T10888_PEA_1_P4 is provided in which the first and second amino acid sequences are sequentially connected in sequence. It is.

本発明の好ましい態様によって、T10888_PEA_1_P4内の配列LLLSSQLWPPSASRLECWPGWLに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T10888_PEA_1_P4の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence LLLSSQLWPPSASRLECWPGWL in T10888_PEA_1_P4 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of T10888_PEA_1_P4, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CEA6_HUMANのアミノ酸1〜320に相当し、またT10888_PEA_1_P5のアミノ酸1〜320にも相当するMGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYRPGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQAHNSATGLNRTTVTMITVSGに少なくとも90%相同である第一アミノ酸配列、およびT10888_PEA_1_P5のアミノ酸321〜390に相当する配列KWIHEALASHFQVESGSQRRARKKFSFPTCVQGAHANPKFSPEPSQFTSADSFPLVFLFFVVFCFLISHVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T10888_PEA_1_P5をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 320 of CEA6_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYRPGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQAHNSATGLNRTTVTMITVSG which also corresponds to amino acids 1 to 320 of T10888_PEA_1_P5, and corresponds to amino acids 321-390 of T10888_PEA_1_P5 Comprising a second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence KWIHEALASHFQVESGSQRRARKKFSFPTCVQGAHANPKFSPEPSQFTSADSFPLVFLFFVVFCFLISHV, At this time, the first and second amino acids Columns are connected sequentially in series, co the T10888_PEA_1_P5 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、T10888_PEA_1_P5内の配列KWIHEALASHFQVESGSQRRARKKFSFPTCVQGAHANPKFSPEPSQFTSADSFPLVFLFFVVFCFLISHVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T10888_PEA_1_P5の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence KWIHEALASHFQVESGSQRRARKKFSFPTCVQGAHANPKFSPEPSQFTSADSFPLVFLFFVVFCFLISHV in T10888_PEA_1_P5 is at least about 70%, if required at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95%. An isolated polypeptide that encodes the tail of T10888_PEA_1_P5, comprising a polypeptide, is provided.

本発明の好ましい態様によって、CEA6_HUMANのアミノ酸1〜141に相当し、またT10888_PEA_1_P6のアミノ酸1〜141にも相当するMGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYに少なくとも90%相同である第一アミノ酸配列、およびT10888_PEA_1_P6のアミノ酸142〜183に相当する配列REYFHMTSGCWGSVLLPTYGIVRPGLCLWPSLHYILYQGLDIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている、T10888_PEA_1_P6をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 141 of CEA6_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVY which also corresponds to amino acids 1 to 141 of T10888_PEA_1_P6, and corresponds to amino acids 142-183 of T10888_PEA_1_P6 Comprising a second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence REYFHMTSGCWGSVLLPTYGIVRPGLCLWPSLHYILYQGLDI; At this time, an isolated chimeric polypeptide encoding T10888_PEA_1_P6 is provided in which the first amino acid sequence and the second amino acid sequence are successively connected.

本発明の好ましい態様によって、T10888_PEA_1_P6内の配列REYFHMTSGCWGSVLLPTYGIVRPGLCLWPSLHYILYQGLDIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T10888_PEA_1_P6の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence REYFHMTSGCWGSVLLPTYGIVRPGLCLWPSLHYILYQGLDI within T10888_PEA_1_P6 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of T10888_PEA_1_P6, comprising a polypeptide, is provided.

本発明の好ましい態様によって、VTNC_HUMANのアミノ酸1〜276に相当し、またT39971_ P6のアミノ酸1〜276にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGに少なくとも90%相同である第一アミノ酸配列、およびT39971_P6のアミノ酸277〜283に相当する配列TQGVVGDを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T39971_P6をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 276 of VTNC_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKG which also corresponds to amino acids 1 to 276 of T39971_ P6, and amino acids 277-283 of T39971_P6 A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence TQGVVGD An isolated chimeric polypeptide encoding T39971_P6, wherein the first and second amino acid sequences are sequentially linked in sequence De is provided.

本発明の好ましい態様によって、T39971_P6内の配列TQGVVGDに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T39971_P6の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence TQGVVGD in T39971_P6 An isolated polypeptide that encodes the tail of T39971_P6, comprising a polypeptide, is provided.

本発明の好ましい態様によって、VTNC_HUMANのアミノ酸1〜325に相当し、またT39971_ P9のアミノ酸1〜325にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTに少なくとも90%相同である第一アミノ酸配列、およびVTNC_HUMANのアミノ酸357〜478に相当し、またT39971_P9のアミノ酸326〜447にも相当する配列SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRATWLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLを有するポリペプチドに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T39971_P9をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 325 of VTNC_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRT which also corresponds to amino acids 1 to 325 of T39971_ P9, and VTNC_HUMAN amino acids 357-478 The sequence SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRATWLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHL is the second amino acid sequence in this sequence, Connected, T39971_P9 - sul isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がTSを含むポリペプチドを含み、以下の構造を有するT39971_P9の端部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号325−xから325のいずれかより開始し:アミノ酸番号326+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids long, comprising a polypeptide wherein at least two amino acids comprise TS, and encoding the end of T39971_P9 having the following structure: : A sequence starting from any of amino acid numbers 325-x to 325: ending at any of amino acid numbers 326 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、VTNC_HUMANのアミノ酸1〜326に相当し、またT39971_ P11のアミノ酸1〜326にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSに少なくとも90%相同である第一アミノ酸配列、およびVTNC_HUMANのアミノ酸442〜478に相当し、またT39971_P11のアミノ酸327〜363にも相当する配列DKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLを有するポリペプチドに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T39971_P11をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 326 of VTNC_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTS which also corresponds to amino acids 1 to 326 of T39971_ P11, and VTNC_HUMAN amino acids 442-478 A second amino acid sequence that is at least 90% homologous to a polypeptide having the sequence DKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHL corresponding to amino acids 327 to 363 of T39971_P11, wherein the first and second amino acid sequences are sequentially An isolated chimeric polypeptide encoding T39971_P11 is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がSDを含むポリペプチドを含み、以下の構造を有するT39971_P11の端部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号326−xから326のいずれかより開始し:アミノ酸番号327+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids long, comprising a polypeptide wherein at least two amino acids comprise SD, and coding for the end of T39971_P11 having the structure: Is a sequence starting from any one of amino acid numbers 326-x to 326 and ending at any of amino acid numbers 327 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、Q9BSH7のアミノ酸1〜326に相当し、またT39971_ P11のアミノ酸1〜326にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSに少なくとも90%相同である第一アミノ酸配列、およびQ9BSH7のアミノ酸442〜478に相当し、またT39971_P11のアミノ酸327〜363にも相当する配列DKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLを有するポリペプチドに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T39971_P11をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 326 of Q9BSH7, also the first amino acid sequence that is at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTS which also corresponds to amino acids 1 to 326 of T39971_ P11, and amino acids 442-478 of Q9BSH7 A second amino acid sequence that is at least 90% homologous to a polypeptide having the sequence DKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHL corresponding to amino acids 327 to 363 of T39971_P11, wherein the first and second amino acid sequences are sequentially An isolated chimeric polypeptide encoding T39971_P11 is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がSDを含むポリペプチドを含み、以下の構造を有するT39971_P11の端部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号326−xから326のいずれかより開始し:アミノ酸番号327+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids long, comprising a polypeptide wherein at least two amino acids comprise SD, and coding for the end of T39971_P11 having the structure: Is a sequence starting from any one of amino acid numbers 326-x to 326 and ending at any of amino acid numbers 327 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、VTNC_HUMANのアミノ酸1〜223に相当し、またT39971_ P12のアミノ酸1〜223にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKに少なくとも90%相同である第一アミノ酸配列、およびT39971_P12のアミノ酸224〜238に相当する配列VPGAVGQGRKHLGRVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T39971_P12をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 223 of VTNC_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFK which also corresponds to amino acids 1 to 223 of T39971_ P12, and amino acids 224-238 of T39971_P12 A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence VPGAVGQGRKHLGRV An isolated chimeric polypeptide encoding T39971_P12 is then provided wherein the first and second amino acid sequences are sequentially linked in sequence.

本発明の好ましい態様によって、T39971_P12内の配列VPGAVGQGRKHLGRVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T39971_P12の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence VPGAVGQGRKHLGRV in T39971_P12 is at least 70% homologous, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of T39971_P12 is provided, comprising a polypeptide.

本発明の好ましい態様によって、Q9BSH7のアミノ酸1〜223に相当し、またT39971_ P12のアミノ酸1〜223にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKに少なくとも90%相同である第一アミノ酸配列、およびT39971_P12のアミノ酸224〜238に相当する配列VPGAVGQGRKHLGRVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T39971_P12をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 223 of Q9BSH7, also the first amino acid sequence that is at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFK which also corresponds to amino acids 1 to 223 of T39971_ P12, and amino acids 224-238 of T39971_P12 A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence VPGAVGQGRKHLGRV An isolated chimeric polypeptide encoding T39971_P12 is then provided wherein the first and second amino acid sequences are sequentially linked in sequence.

本発明の好ましい態様によって、T39971_P12内の配列VPGAVGQGRKHLGRVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T39971_P12の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence VPGAVGQGRKHLGRV in T39971_P12 is at least 70% homologous, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of T39971_P12 is provided, comprising a polypeptide.

本発明の好ましい態様によって、SUL1_HUMANのアミノ酸1〜761に相当し、またZ21368_PEA_1_P2のアミノ酸1〜761にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNに少なくとも90%相同である第一アミノ酸配列、およびZ21368_PEA_1_P2のアミノ酸762〜790に相当する配列PHKYSAHGRTRHFESATRTTNGAQKLSRIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、Z21368_PEA_1_P2をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 761 of SUL1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWN which also corresponds to amino acids 1 to 761 of Z21368_PEA_1_P2, and Z21368_PEA_1_P At least 70%, if necessary, at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence PHKYSAHGRTRHFESATRTTNGAQKLSRI corresponding to amino acids 762-790 of 2 An isolated chimeric polypeptide encoding Z21368_PEA_1_P2 is provided that comprises a second amino acid sequence, wherein the first and second amino acid sequences are sequentially connected in sequence.

本発明の好ましい態様によって、Z21368_PEA_1_P2内の配列PHKYSAHGRTRHFESATRTTNGAQKLSRIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、Z21368_PEA_1_P2の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence PHKYSAHGRTRHFESATRTTNGAQKLSRI within Z21368_PEA_1_P2 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of Z21368_PEA_1_P2 comprising a polypeptide is provided.

本発明の好ましい態様によって、Q7Z2W2のアミノ酸1〜57に相当し、またZ21368_PEA_1_P5のアミノ酸1〜57にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELに少なくとも90%相同である第一アミノ酸配列、Aを含む第二架橋アミノ酸配列、およびQ7Z2W2のアミノ酸139〜871に相当し、またZ21368_PEA_1_P5のアミノ酸139〜871にも相当するFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGに少なくとも90%相同である第三アミノ酸配列を含み、このとき前記第一、第二、および第三アミノ酸配列は連続して順番につながっている、Z21368_PEA_1_P5をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, a first amino acid sequence that is at least 90% homologous to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVEL corresponding to amino acids 1 to 57 of Q7Z2W2 and also corresponding to amino acids 1 to 57 of Z21368_PEA_1_P5, And corresponding to amino acids 139 to 871 of Q7Z2W2 and also to amino acids 139 to 871 of Z21368_PEA_1_P5 KLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG A polypeptide is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも三つのアミノ酸がKAFを含むポリペプチドを含み、以下の構造を有するZ21368_PEA_1_P5の端部をコ−ドする単離されたポリペプチドが提供される(Z21368_PEA_1_P5に従った番号付け):アミノ酸番号57−xから57のいずれかより開始し:アミノ酸番号59+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. An isolated polypeptide is provided that is long, and most preferably at least about 50 amino acids in length, comprising a polypeptide wherein at least three amino acids comprise KAF, and coding the end of Z21368_PEA_1_P5 having the following structure: (Numbering according to Z21368_PEA_1_P5): sequence starting from any of amino acid numbers 57-x to 57: ending at any of amino acid numbers 59 + ((n-2) -x), at this time x is in the range of 0 to n−2.

本発明の好ましい態様によって、Z21368_PEA_1_P5のアミノ酸1〜751に対応する配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、およびAAH12997のアミノ酸1〜40に相当し、またZ21368_PEA_1_P5のアミノ酸752〜791にも相当するLRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、Z21368_PEA_1_P5をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70% to a polypeptide having a sequence MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLME corresponding to amino acids 1-751 of Z21368_PEA_1_P5, at least 80% when required, preferably at least 85%, preferred more At least 90% and most preferably at least 95% homologous and at least 90% homologous to LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG corresponding to amino acids 1-40 of AAH12997 and corresponding to amino acids 752-791 of Z21368_PEA_1_P5 An isolated chimeric polypeptide encoding Z21368_PEA_1_P5 is provided that comprises a second amino acid sequence, wherein the first and second amino acid sequences are sequentially linked.

本発明の好ましい態様によって、Z21368_PEA_1_P5の配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、Z21368_PEA_1_P5の頭部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70% sequence MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLME of Z21368_PEA_1_P5, at least about 80% when required, preferably at least about 85%, more preferably at least about 90%, and most preferably An isolated polypeptide encoding the head of Z21368_PEA_1_P5 is provided, comprising a polypeptide that is at least about 95% homologous.

本発明の好ましい態様によって、SUL1_HUMANのアミノ酸1〜57に相当し、またZ21368_PEA_1_P5のアミノ酸1〜57にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELに少なくとも90%相同である第一アミノ酸配列、SUL1_HUMANのアミノ酸138〜871に相当し、またZ21368_PEA_1_P5のアミノ酸58〜791にも相当するAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGに少なくとも90%相同である第二アミノ酸配列を含む、Z21368_PEA_1_P5をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the first amino acid sequence corresponding to amino acids 1 to 57 of SUL1_HUMAN and also corresponding to amino acids 1 to 57 of Z21368_PEA_1_P5, which is at least 90% homologous to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVEL, amino acids 138 to 87 corresponding to SUL1_HUMAN Also corresponds to amino acids 58-791 of Z21368_PEA_1_P5 TAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG containing a second amino acid sequence that is homologous to Z21368_PEA_1_P5

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がLAを含むポリペプチドを含み、以下の構造を有するZ21368_PEA_1_P5の端部をコ−ドする単離されたポリペプチドが提供される(Z21368_PEA_1_P5に従った番号付け):アミノ酸番号57−xから57のいずれかより開始し:アミノ酸番号58+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. An isolated polypeptide is provided that encodes an end of Z21368_PEA_1_P5 having a length, and most preferably at least about 50 amino acids in length, comprising a polypeptide comprising at least two amino acids LA and having the following structure: (Numbering according to Z21368_PEA_1_P5): sequence starting from any of amino acid numbers 57-x to 57: ending at any of amino acid numbers 58 + ((n-2) -x), at this time x is in the range of 0 to n−2.

本発明の好ましい態様によって、SUL1_HUMANのアミノ酸1〜416に相当し、またZ21368_PEA_1_P15のアミノ酸1〜416にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGに少なくとも90%相同である第一アミノ酸配列を含む、Z21368_PEA_1_P15をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 416 of SUL1_HUMAN, also comprising a first amino acid sequence that is at least 90% homologous to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERG which also corresponds to amino acids 1 to 416 of Z21368_PEA_1_P15, co the Z21368_PEA_1_P15 - sul single Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、SUL1_HUMANのアミノ酸1〜397に相当し、またZ21368_PEA_1_P16のアミノ酸1〜397にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRに少なくとも90%相同である第一アミノ酸配列、およびZ21368_PEA_1_P16のアミノ酸398〜410に相当する配列CVIVPPLSQPQIHを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、Z21368_PEA_1_P16をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 397 of SUL1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR which also corresponds to amino acids 1 to 397 of Z21368_PEA_1_P16, and corresponds to amino acids 398-410 of Z21368_PEA_1_P16 A second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence CVIVPPLSQPQIH At this time, the first and An isolated chimeric polypeptide encoding Z21368_PEA_1_P16 is provided wherein the second and second amino acid sequences are sequentially linked.

本発明の好ましい態様によって、Z21368_PEA_1_P16内の配列CVIVPPLSQPQIHに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、Z21368_PEA_1_P16の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence CVIVPPLSQPQIH in Z21368_PEA_1_P16 An isolated polypeptide encoding the tail of Z21368_PEA_1_P16 is provided, including a polypeptide.

本発明の好ましい態様によって、SUL1_HUMANのアミノ酸1〜188に相当し、またZ21368_PEA_1_P22のアミノ酸1〜188にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKに少なくとも90%相同である第一アミノ酸配列、およびZ21368_PEA_1_P22のアミノ酸189〜210に相当する配列ARYDGDQPRCAPRPRGLSPTVFを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、Z21368_PEA_1_P22をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 188 of SUL1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK which also corresponds to amino acids 1 to 188 of Z21368_PEA_1_P22, and corresponds to amino acids 189-210 of Z21368_PEA_1_P22 Comprising a second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence ARYDGDQPRCAPRPRGLSPTVF At this time, an isolated chimeric polypeptide encoding Z21368_PEA_1_P22 is provided in which the first and second amino acid sequences are sequentially connected in sequence.

本発明の好ましい態様によって、Z21368_PEA_1_P22内の配列ARYDGDQPRCAPRPRGLSPTVFに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、Z21368_PEA_1_P22の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence ARYDGDQPRCAPRPRGLSPTVF in Z21368_PEA_1_P22 An isolated polypeptide that encodes the tail of Z21368_PEA_1_P22, comprising a polypeptide, is provided.

本発明の好ましい態様によって、Q7Z2W2のアミノ酸1〜137に相当し、またZ21368_PEA_1_P23のアミノ酸1〜137にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTに少なくとも90%相同である第一アミノ酸配列、およびZ21368_PEA_1_P23のアミノ酸138〜145に相当する配列GLLHRLNHを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、Z21368_PEA_1_P23をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPNCCP1 Comprising a second amino acid sequence that is at least 70% homologous to a polypeptide having the sequence GLLHRLNH to be required, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous, At this time, an isolated chimeric polypeptide encoding Z21368_PEA_1_P23 is provided in which the first and second amino acid sequences are sequentially connected in sequence.

本発明の好ましい態様によって、Z21368_PEA_1_P23内の配列GLLHRLNHに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、Z21368_PEA_1_P23の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence GLLHRLNH within Z21368_PEA_1_P23 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of Z21368_PEA_1_P23 comprising a polypeptide is provided.

本発明の好ましい態様によって、SUL1_HUMANのアミノ酸1〜137に相当し、またZ21368_PEA_1_P23のアミノ酸1〜137にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTに少なくとも90%相同である第一アミノ酸配列、およびZ21368_PEA_1_P23のアミノ酸138〜145に相当する配列GLLHRLNHを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、Z21368_PEA_1_P23をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1-137 of SUL1_HUMAN, and also corresponds to amino acids 1-137 of Z21368_PEA_1_P23, which is equivalent to amino acids 1-137 of Z21368_PEA_1_P23 Comprising a second amino acid sequence that is at least 70% homologous to a polypeptide having the sequence GLLHRLNH to be required, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous, At this time, an isolated chimeric polypeptide encoding Z21368_PEA_1_P23 is provided in which the first and second amino acid sequences are sequentially connected in sequence.

本発明の好ましい態様によって、Z21368_PEA_1_P23内の配列GLLHRLNHに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、Z21368_PEA_1_P23の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence GLLHRLNH within Z21368_PEA_1_P23 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide encoding the tail of Z21368_PEA_1_P23 comprising a polypeptide is provided.

本発明の好ましい態様によって、GILT_HUMANのアミノ酸12〜55に相当し、またT59832_P5のアミノ酸1〜44にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKに少なくとも90%相同である第一アミノ酸配列、およびT59832_P5のアミノ酸45〜189に相当する配列VGTATGRAGWREQAPCRGTRLLLSPQTSQGKTRAPRGRCPCRVPGKTLFSSRRCGHTPSVPFRFRIPHLRGAAASTRLVPPKGSMSAYCVLLGQELGSPFVAQGTSSAAGQGPPACILAATLDAFIPARAGLACLWDLLGRCPRGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P5をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponding to amino acids 12-55 of GILT_HUMAN and also corresponding to amino acids 45-189 of T59832_P5, and a first amino acid sequence at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK corresponding to amino acids 1-44 of T59832_P5 The sequence VGTATGRAGWREQAPCRGTRLLLSPQTSQGKTRAPRGRCPCRVPGKTLFSSRRCGHTPSVPFRFRIPHLRGAAASTRLVPPKGSMSAYCVLLGQELGSPFVAQGTSSAAGQGPPACILAATLDAFIPARAGLACLWDLLGRCPRG is required, preferably at least 90% At this time, an isolated chimeric polypeptide encoding T59832_P5 is provided in which the first and second amino acid sequences are sequentially connected in sequence.

本発明の好ましい態様によって、T59832_P5内の配列VGTATGRAGWREQAPCRGTRLLLSPQTSQGKTRAPRGRCPCRVPGKTLFSSRRCGHTPSVPFRFRIPHLRGAAASTRLVPPKGSMSAYCVLLGQELGSPFVAQGTSSAAGQGPPACILAATLDAFIPARAGLACLWDLLGRCPRGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P5の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence VGTATGRAGWREQAPCRGTRLLLSPQTSQGKTRAPRGRCPCRVPGKTLFSSRRCGHTPSVPFRFRIPHLRGAAASTRLVPPKGSMSAYCVLLGQELGSPFVAQGTSSAAGQGPPACILAATLDAFIPARAGLACLWDLLGRCPRG in T59832_P5, preferably at least about 85% An isolated polypeptide that encodes the tail of T59832_P5, comprising a polypeptide, is provided.

本発明の好ましい態様によって、GILT_HUMANのアミノ酸12〜223に相当し、またT59832_P7のアミノ酸1〜212にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGに少なくとも90%相同である第一アミノ酸配列、およびT59832_P7のアミノ酸213〜238に相当する配列VRIFLALSLTLIVPWSQGWTRQRDQRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P7をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 12-223 of GILT_HUMAN, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNG which also corresponds to amino acids 1 to 212 of T59832_P7, and corresponds to amino acids 213-238 of T59832_P7 Comprising a second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence VRIFLALSLTLIVPWSQGWTRQRDQR At this time, an isolated chimeric polypeptide encoding T59832_P7 is provided in which the first and second amino acid sequences are sequentially connected in sequence.

本発明の好ましい態様によって、T59832_P7内の配列VRIFLALSLTLIVPWSQGWTRQRDQRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P7の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence VRIFLALSLTLIVPWSQGWTRQRDQR in T59832_P7 An isolated polypeptide that encodes the tail of T59832_P7 is provided, including a polypeptide.

本発明の好ましい態様によって、BAC98466のアミノ酸1〜212に相当し、またT59832_P7のアミノ酸1〜212にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGに少なくとも90%相同である第一アミノ酸配列、およびT59832_P7のアミノ酸213〜238に相当する配列VRIFLALSLTLIVPWSQGWTRQRDQRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P7をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 212 of BAC98466, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNG which also corresponds to amino acids 1 to 212 of T59832_P7, and corresponds to amino acids 213-238 of T59832_P7 Comprising a second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence VRIFLALSLTLIVPWSQGWTRQRDQR At this time, an isolated chimeric polypeptide encoding T59832_P7 is provided in which the first and second amino acid sequences are sequentially connected in sequence.

本発明の好ましい態様によって、T59832_P7内の配列VRIFLALSLTLIVPWSQGWTRQRDQRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P7の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence VRIFLALSLTLIVPWSQGWTRQRDQR in T59832_P7 An isolated polypeptide that encodes the tail of T59832_P7 is provided, including a polypeptide.

本発明の好ましい態様によって、T59832_P7のアミノ酸1〜90にも相当する配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、およびBAC85622のアミノ酸1〜148に相当し、またT59832__P7のアミノ酸91〜238にも相当するMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGVRIFLALSLTLIVPWSQGWTRQRDQRに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P7をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, a polypeptide having the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLV, which also corresponds to amino acids 1 to 90 of T59832_P7, is required at least 80%, preferably at least 85%, more preferably at least 85%, Most preferably contains a first amino acid sequence that is at least 95% homologous, and MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPQ An isolated chimeric polypeptide encoding T59832_P7 is then provided wherein the first and second amino acid sequences are sequentially linked.

本発明の好ましい態様によって、T59832_P7の配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P7の頭部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLV of the T59832_P7 is at least about 70% if required, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95%. An isolated polypeptide that encodes the head of T59832_P7 is provided, comprising the polypeptide.

本発明の好ましい態様によって、Q8WU77のアミノ酸1〜212に相当し、またT59832_P7のアミノ酸1〜212にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGに少なくとも90%相同である第一アミノ酸配列、およびT59832_P7のアミノ酸213〜238に相当する配列VRIFLALSLTLIVPWSQGWTRQRDQRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P7をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 1 to 212 of Q8WU77, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNG which also corresponds to amino acids 1 to 212 of T59832_P7, and corresponds to amino acids 213-238 of T59832_P7 Comprising a second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence VRIFLALSLTLIVPWSQGWTRQRDQR At this time, an isolated chimeric polypeptide encoding T59832_P7 is provided in which the first and second amino acid sequences are sequentially connected in sequence.

本発明の好ましい態様によって、T59832_P7内の配列VRIFLALSLTLIVPWSQGWTRQRDQRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P7の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence VRIFLALSLTLIVPWSQGWTRQRDQR in T59832_P7 An isolated polypeptide that encodes the tail of T59832_P7 is provided, including a polypeptide.

本発明の好ましい態様によって、GILT_HUMANのアミノ酸12〜214に相当し、またT59832_P9のアミノ酸1〜203にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEに少なくとも90%相同である第一アミノ酸配列、およびT59832_P9のアミノ酸204〜244に相当する配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P9をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 12-214 of GILT_HUMAN, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHE which also corresponds to amino acids 1 to 203 of T59832_P9, and corresponds to amino acids 204-244 of T59832_P9 Comprising a second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR; At this time, an isolated chimeric polypeptide encoding T59832_P9 is provided in which the first and second amino acid sequences are successively connected.

本発明の好ましい態様によって、T59832_P9内の配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P9の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR within T59832_P9 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of T59832_P9, comprising a polypeptide, is provided.

本発明の好ましい態様によって、BAC98466のアミノ酸1〜203に相当し、またT59832_P9のアミノ酸1〜203にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEに少なくとも90%相同である第一アミノ酸配列、およびT59832_P9のアミノ酸204〜244に相当する配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P9をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 203 of BAC98466, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHE which also corresponds to amino acids 1 to 203 of T59832_P9, and corresponds to amino acids 204-244 of T59832_P9 Comprising a second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR; At this time, an isolated chimeric polypeptide encoding T59832_P9 is provided in which the first and second amino acid sequences are successively connected.

本発明の好ましい態様によって、T59832_P9内の配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P9の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR within T59832_P9 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of T59832_P9, comprising a polypeptide, is provided.

本発明の好ましい態様によって、T59832_P9のアミノ酸1〜90にも相当する配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、BAC85622のアミノ酸1〜113に相当し、またT59832_P9のアミノ酸91〜203にも相当するMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEに少なくとも90%相同である第二アミノ酸配列、およびT59832のアミノ酸204〜244に相当する配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、このとき前記第一、第二および第三アミノ酸配列は連続して順番につながっている、T59832_P9をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, a polypeptide having the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLV, which also corresponds to amino acids 1 to 90 of T59832_P9, is required at least 80%, preferably at least 85%, more preferably at least 90%, Most preferably the first amino acid sequence that is at least 95% homologous, corresponds to amino acids 1-113 of BAC85622, and also corresponds to amino acids 91-203 of T59832_P9 and MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMEAQQ A polypeptide having the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR corresponding to amino acids 204-244 of at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 9 A single amino acid sequence encoding T59832_P9, comprising a third amino acid sequence that is 0%, and most preferably at least 95% homologous, wherein said first, second and third amino acid sequences are sequentially linked Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、T59832_P9の配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYEEALCGGCRAFLIRELFPTWLLVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P9の頭部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYEEALCGGCRAFLIRELFPTWLLV of T59832_P9 is required, at least about 80% if required, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95%. An isolated polypeptide that encodes the head of T59832_P9 is provided, including the polypeptide.

本発明の好ましい態様によって、T59832_P9の配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P9の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the invention, at least 70%, if necessary, at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR of T59832_P9 An isolated polypeptide that encodes the tail of T59832_P9 is provided, comprising the polypeptide.

本発明の好ましい態様によって、Q8WU77のアミノ酸1〜203に相当し、またT59832_P9のアミノ酸1〜203にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEに少なくとも90%相同である第一アミノ酸配列、およびT59832_P9のアミノ酸204〜244に相当する配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P9をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponds to amino acids 1 to 203 of Q8WU77, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHE which also corresponds to amino acids 1 to 203 of T59832_P9, and corresponds to amino acids 204-244 of T59832_P9 Comprising a second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR; At this time, an isolated chimeric polypeptide encoding T59832_P9 is provided in which the first and second amino acid sequences are successively connected.

本発明の好ましい態様によって、T59832_P9内の配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P9の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR within T59832_P9 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of T59832_P9, comprising a polypeptide, is provided.

本発明の好ましい態様によって、GILT_HUMANのアミノ酸12〜141に相当し、またT59832_P12のアミノ酸1〜130にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEに少なくとも90%相同である第一アミノ酸配列、およびGILT_HUMANのアミノ酸173〜261に相当し、またT59832_P12のアミノ酸131〜219にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P12をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNCKTLVSV In addition, CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK is equivalent to amino acids 131 to 219 of T59832_P12. An isolated chimeric polypeptide that encodes is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がECを含むポリペプチドを含み、以下の構造を有するT59832_P12の縁部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号130−xから130のいずれかより開始し:アミノ酸番号131+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids long, comprises a polypeptide wherein at least two amino acids comprise EC, and encodes the edge of T59832_P12 having the following structure: Is a sequence starting from any one of amino acid numbers 130-x to 130 and ending at any of amino acid numbers 131 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、T59832_P12のアミノ酸1〜90にも相当する配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、BAC85622のアミノ酸1〜40に相当し、またT59832_P12のアミノ酸91〜130にも相当するMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEに少なくとも90%相同である第二アミノ酸配列、BAC8562のアミノ酸72〜122に相当し、またT59832_P12のアミノ酸131〜181にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGに少なくとも90%相同である第三アミノ酸配列、およびT59832_P12のアミノ酸182〜219に相当する配列KPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第四アミノ酸配列を含み、このとき前記第一、第二、第三および第四アミノ酸配列は連続して順番につながっている、T59832_P12をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, a polypeptide having the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLV, which also corresponds to amino acids 1 to 90 of T59832_P12, is required at least 80%, preferably at least 85%, more preferably at least 85%, Most preferably a first amino acid sequence that is at least 95% homologous, corresponding to amino acids 1-40 of BAC85622 and also corresponding to amino acids 91-130 of T59832_P12, a second amino acid sequence that is at least 90% homologous to MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVE, BAC8562 A third amino acid sequence that is at least 90% homologous to CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNG, which corresponds to amino acids 72-122 and also corresponds to amino acids 131-181 of T59832_P12, and a sequence KPLEDQTQLLTLVCQLYQPKKPSVCPSSSL, which has the sequence corresponding to amino acids 182-219 of T59832_P12 Comprising a fourth amino acid sequence that is at least 70% homologous to the tide, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95%, wherein the first, An isolated chimeric polypeptide encoding T59832_P12 is provided in which the second, third and fourth amino acid sequences are sequentially linked.

本発明の好ましい態様によって、T59832_P12の配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P12の頭部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLV of the T59832_P12 is at least about 70% if required, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95%. An isolated polypeptide that encodes the head of T59832_P12 is provided, including the polypeptide.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がECを含むポリペプチドを含み、以下の構造を有するT59832_P12の縁部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号130−xから130のいずれかより開始し:アミノ酸番号131+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids long, comprises a polypeptide wherein at least two amino acids comprise EC, and encodes the edge of T59832_P12 having the following structure: Is a sequence starting from any one of amino acid numbers 130-x to 130 and ending at any of amino acid numbers 131 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、T59832_P12内の配列KPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T59832_P12の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence KPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK within T59832_P12 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated polypeptide that encodes the tail of T59832_P12 is provided, including a polypeptide.

本発明の好ましい態様によって、Q8WU77のアミノ酸1〜130に相当し、またT59832_P12のアミノ酸1〜130にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEに少なくとも90%相同である第一アミノ酸配列、およびW8WU77のアミノ酸162〜250に相当し、またT59832_P12のアミノ酸131〜219にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P12をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPHGR In addition, CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK is equivalent to amino acids 131 to 219 of T59832_P12. An isolated chimeric polypeptide that encodes is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がECを含むポリペプチドを含み、以下の構造を有するT59832_P12の縁部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号130−xから130のいずれかより開始し:アミノ酸番号131+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids long, comprises a polypeptide wherein at least two amino acids comprise EC, and encodes the edge of T59832_P12 having the following structure: Is a sequence starting from any one of amino acid numbers 130-x to 130 and ending at any of amino acid numbers 131 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、GILT_HUMANのアミノ酸12〜55に相当し、またT59832_P18のアミノ酸1〜44にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKに少なくとも90%相同である第一アミノ酸配列、およびGILT_HUMANのアミノ酸173〜261に相当し、またT59832_P18のアミノ酸45〜133にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P18をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, it corresponds to amino acids 12-55 of GILT_HUMAN and also corresponds to amino acids 173-261 of GILT_HUMAN and at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK, which also corresponds to amino acids 1-44 of T59832_P18 In addition, CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK is equivalent to amino acids 45 to 133 of T59832_P18. An isolated chimeric polypeptide that encodes is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がKCを含むポリペプチドを含み、以下の構造を有するT59832_P18の縁部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号44−xから44のいずれかより開始し:アミノ酸番号45+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids long, comprising a polypeptide in which at least two amino acids comprise KC, and coding the edge of T59832_P18 having the structure : A sequence starting from any of amino acid numbers 44-x to 44: ending at any of amino acid numbers 45 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、Q8WU77のアミノ酸1〜44に相当し、またT59832_P18のアミノ酸1〜44にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKに少なくとも90%相同である第一アミノ酸配列、およびW8WU77のアミノ酸162〜250に相当し、またT59832_P18のアミノ酸45〜133にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P18をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponding to amino acids 1-44 of Q8WU77 and also corresponding to amino acids 162-250 of W8WU77 In addition, CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK is equivalent to amino acids 45 to 133 of T59832_P18. An isolated chimeric polypeptide that encodes is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がKCを含むポリペプチドを含み、以下の構造を有するT59832_P18の縁部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号44−xから44のいずれかより開始し:アミノ酸番号45+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids long, comprising a polypeptide in which at least two amino acids comprise KC, and coding the edge of T59832_P18 having the structure : A sequence starting from any of amino acid numbers 44-x to 44: ending at any of amino acid numbers 45 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、Q8NE14のアミノ酸1〜44に相当し、またT59832_P18のアミノ酸1〜44にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKに少なくとも90%相同である第一アミノ酸配列、およびW8NE14のアミノ酸162〜250に相当し、またT59832_P18のアミノ酸45〜133にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T59832_P18をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK corresponding to amino acids 1-44 of Q8NE14 and also corresponding to amino acids 1-44 of T59832_P18, and corresponding to amino acids 162-250 of W8NE14 In addition, CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK is equivalent to amino acids 45 to 133 of T59832_P18. An isolated chimeric polypeptide that encodes is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がKCを含むポリペプチドを含み、以下の構造を有するT59832_P18の縁部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号44−xから44のいずれかより開始し:アミノ酸番号45+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long, and most preferably at least about 50 amino acids long, comprising a polypeptide in which at least two amino acids comprise KC, and coding the edge of T59832_P18 having the structure : A sequence starting from any of amino acid numbers 44-x to 44: ending at any of amino acid numbers 45 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、GRP_HUMANのアミノ酸1〜127に相当し、またHUMGRP5E_P4のアミノ酸1〜127にも相当するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKに少なくとも90%相同である第一アミノ酸配列、およびGRP_HUMANのアミノ酸135〜148に相当し、またHUMGRP5E_P4のアミノ酸128〜141にも相当するGSQREGRNPQLNQQに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、HUMGRP5E_P4をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHVGSKSK corresponding to amino acids 1-127 of GRP_HUMAN and corresponding to amino acids 1-127 of HUMGRP5E_P4 HUMGRP5E_P4 comprising a second amino acid sequence that is at least 90% homologous to GSQREGRNPQLNQQ corresponding to amino acids 128 to 141 of HUMGRP5E_P4, wherein the first and second amino acid sequences are sequentially linked in sequence, An isolated chimeric polypeptide that encodes is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がKGを含むポリペプチドを含み、以下の構造を有するHUMGRP5E_P4の縁部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号127−xから127のいずれかより開始し:アミノ酸番号128+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that is long and most preferably at least about 50 amino acids long, comprises a polypeptide comprising at least two amino acids KG, and encodes the edge of HUMGRP5E_P4 having the structure: Is a sequence starting from any of amino acid numbers 127-x to 127 and ending at any of amino acid numbers 128 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、GRP_HUMANのアミノ酸1〜127に相当し、またHUMGRP5E_P5のアミノ酸1〜127にも相当するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKに少なくとも90%相同である第一アミノ酸配列、およびHUMGRP5E_P5のアミノ酸128〜142に相当する配列DSLLQVLNVKEGTPSを含むポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、HUMGRP5E_P5をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHVGKDSH amino acid sequence corresponding to amino acids 1-127 of GRP_HUMAN and corresponding to amino acids 1-127 of HUMGRP5E_P5 Comprising a second amino acid sequence that is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide comprising the sequence DSLLQVLNVKEGTPS Sometimes an isolated chimeric polypeptide encoding HUMGRP5E_P5 is provided, wherein said first and second amino acid sequences are sequentially linked.

本発明の好ましい態様によって、HUMGRP5E_P5内の配列DSLLQVLNVKEGTPSに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、HUMGRP5E_P5の尾部をコ−ドする単離されたポリペプチドが提供される。   According to a preferred embodiment of the invention, at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence DSLLQVLNVKEGTPS in HUMGRP5E_P5 An isolated polypeptide that encodes the tail of HUMGRP5E_P5 is provided, including a polypeptide.

本発明の好ましい態様によって、KLKA_HUMANのアミノ酸1〜146に相当し、またAA155578_PEA_1_P4のアミノ酸1〜146にも相当するMRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGAPCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKPLWARVGDDHLLLLQGEQLRRTTRSVVHPKYHQGSGPILPRRTDEHDLMLLKLARPに少なくとも90%相同である第一アミノ酸配列、およびKIKA_HUMANのアミノ酸184〜276に相当し、またAA155578_PEA_1_P4のアミノ酸147〜239にも相当する配列YNKGLTCSSITILSPKECEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPCGSAQHPAVYTQICKYMSWINKVIRSNに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、AA155578_PEA_1_P4をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the invention, MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGAPCARGSQPWQVSLFNGLSFHCAGHLL In addition, the sequence corresponding to amino acids 147 to 239 of AA155578_PEA_1_P4 YNKGLTCSSITILSPKECEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPCGSAQHPAVYTQICKYMSWINKVIRSN includes a second amino acid sequence that is connected to the first and second P An isolated chimeric polypeptide that encodes is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がPYを含むポリペプチドを含み、以下の構造を有するAA155578_PEA_1_P4の縁部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号146−xから146のいずれかより開始し:アミノ酸番号147+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that encodes the edge of AA155578_PEA_1_P4 having a length, and most preferably at least about 50 amino acids in length, comprising a polypeptide in which at least two amino acids comprise PY and having the following structure: Is a sequence starting from any one of amino acid numbers 146-x to 146 and ending at any of amino acid numbers 147 + ((n−2) −x), where x is 0 to n−2. Range.

本発明の好ましい態様によって、KIKA_HUMANのアミノ酸1〜29に相当し、またAA155578_PEA_1_P6のアミノ酸1〜29にも相当するMRAPHLHLSAASGARALAKLLPLLMAQLWに少なくとも90%相同である第一アミノ酸配列、およびKLKA_HUMANのアミノ酸182〜276に相当し、またAA155578_PEA_1_P6のアミノ酸30〜124にも相当するVKYNKGLTCSSITILSPKECEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPCGSAQHPAVYTQICKYMSWINKVIRSNに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、AA155578_PEA_1_P6をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, corresponding to amino acids 1 to 29 of KIKA_HUMAN and corresponding to amino acids 1 to 29 of AA155578_PEA_1_P6, corresponding to the first amino acid sequence at least 90% homologous to MRAPHLHLSAASGARALAKLLPLLMAQLW, and corresponding to amino acids 182 to 276 of KLKA_HUMAN In addition, VKYNKGLTCSSITILSPKECEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPCGSAQHPAVYTQICKYMSWINKVIRSN which is equivalent to amino acids 30 to 124 of AA155578_PEA_1_P6 includes a second amino acid sequence that is at least 90% homologous to AA155 An isolated chimeric polypeptide that encodes is provided.

本発明の好ましい態様によって、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がWVを含むポリペプチドを含み、以下の構造を有するAA155578_PEA_1_P6の縁部をコ−ドする単離されたキメラポリペプチドが提供される:アミノ酸番号29−xから29のいずれかより開始し:アミノ酸番号30+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   According to a preferred embodiment of the present invention, it has a length “n”, where n is at least about 10 amino acids long, if necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long. Provided is an isolated chimeric polypeptide that encodes the edge of AA155578_PEA_1_P6 having a length, and most preferably at least about 50 amino acids in length, comprising a polypeptide in which at least two amino acids comprise WV and having the following structure: : A sequence starting from any of amino acid numbers 29-x to 29: ending at any of amino acid numbers 30 + ((n−2) −x), where x is 0 to n−2 Range.

本発明の好ましい態様によって、KIKA_HUMANのアミノ酸1〜29に相当し、またAA155578_PEA_1_P8のアミノ酸1〜29にも相当するMRAPHLHLSAASGARALAKLLPLLMAQLWに少なくとも90%相同である第一アミノ酸配列、およびAA155578_PEA_1_P8のアミノ酸30〜35に相当する配列GHCGLEを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、AA155578_PEA_1_P8をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the first amino acid sequence that is at least 90% homologous to MRAPHLHLSAASGARALAKLLPLLMAQLW, corresponding to amino acids 1-29 of KIKA_HUMAN and also corresponding to amino acids 1-29 of AA155578_PEA_1_P8, and corresponding to amino acids 30-35 of AA155578_PEA_1_P8 A second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence GHCGLE Sometimes an isolated chimeric polypeptide encoding AA155578_PEA_1_P8 is provided, wherein said first and second amino acid sequences are sequentially linked.

本発明の好ましい態様によって、AA155578_PEA_1_P8内の配列GHCGLEに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、AA155578_PEA_1_P8の尾部をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence GHCGLE within AA155578_PEA_1_P8 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated chimeric polypeptide encoding the tail of AA155578_PEA_1_P8 comprising a polypeptide is provided.

本発明の好ましい態様によって、KLKA_HUMANのアミノ酸1〜90に相当し、またAA155578_PEA_1_P9のアミノ酸1〜90にも相当するMRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGAPCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKに少なくとも90%相同である第一アミノ酸配列を含む、AA155578_PEA_1_P9をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGAPCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAH_N-like amino acid sequence ______________ 9 Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、SZ05_HUMANのアミノ酸1〜81に相当し、またHSENA78_P2のアミノ酸1〜81にも相当するMSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCVCLQTTQGVHPKMISNLQVFAIGPQCSKVEVVに少なくとも90%相同である第一アミノ酸配列を含む、HSENA78_P2をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the first amino acid sequence comprising at least 90% homologous to HSENA-HSENA78_P2 which is at least 90% homologous to MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCVCLQTTQGVHPKMISNLQVFAIGPQCSKVEVV corresponding to amino acids 1-81 of SZ05_HUMAN Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、Q8TD06のアミノ酸1〜150に相当し、またT94936_PEA_1_P2のアミノ酸1〜150にも相当するMMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEEGLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNLMHETTDKNLSPDGQYVPRIMFVDPSLTVRADIAGRYSNRLYTYEPRDLPLに少なくとも90%相同である第一アミノ酸配列を含む、T94936_PEA_1_P2をコ−ドする、単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention comprises a first amino acid sequence that is at least 90% homologous to MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEEGLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNLMHETTDKNLSPDGQYVPRIMFVDPSLTVRADIAGRYSNRLYTYEPRDLPL corresponds to amino acids 1 to 150 of Q8TD06, also the corresponding to amino acids 1 to 150 of T94936_PEA_1_P2, co the T94936_PEA_1_P2 - sul, Isolated chimeric polypeptides are provided.

本発明の好ましい態様によって、Q8TD06のアミノ酸1〜122に相当し、またT94936_PEA_1_P3のアミノ酸1〜122にも相当するMMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEEGLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNLMHETTDKNLSPDGQYVPRIMFVに少なくとも90%相同である第一アミノ酸配列を含み、T94936_PEA_1_P3のアミノ酸123〜145に相当する配列GMYVISFHQIYKISRNQHSCFYFを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、T94936_PEA_1_P3をコ−ドする、単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEEGLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQ is the amino acid sequence of Q8TD06, which corresponds to amino acids 1-122 of Q8TD06 and amino acids 1-122 of T94936_PEA_1_P3. A second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence GMYVISFHQIYKISRNQHSCFYF An isolated chimeric polypeptide encoding T94936_PEA_1_P3 is then provided wherein the first and second amino acid sequences are sequentially linked in sequence.

本発明の好ましい態様によって、T94936_PEA_1_P3内の配列GMYVISFHQIYKISRNQHSCFYFに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、T94936_PEA_1_P3の尾部をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence GMYVISFHQIYKISRNQHSCFYF within T94936_PEA_1_P3 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated chimeric polypeptide encoding the tail of T94936_PEA_1_P3 comprising a polypeptide is provided.

本発明の好ましい態様によって、SZ14_HUMANのアミノ酸1〜95に相当し、またZ41644_PEA_1_P10のアミノ酸1〜95にも相当するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRに少なくとも90%相同である第一アミノ酸配列を含み、Z41644_PEA_1_P10のアミノ酸96〜123に相当する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、Z41644_PEA_1_P10をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAW44 is the first amino acid sequence of 416 amino acids from amino acid sequence 1 A second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI An isolated chimeric polypeptide encoding Z41644_PEA_1_P10 is then provided wherein the first and second amino acid sequences are sequentially linked in sequence.

本発明の好ましい態様によって、Z41644_PEA_1_P10内の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、Z41644_PEA_1_P10の尾部をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI within Z41644_PEA_1_P10 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated chimeric polypeptide encoding the tail of Z41644_PEA_1_P10 comprising a polypeptide is provided.

本発明の好ましい態様によって、Q9NS21のアミノ酸13〜107に相当し、またZ41644_PEA_1_P10のアミノ酸1〜95にも相当するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRに少なくとも90%相同である第一アミノ酸配列を含み、Z41644_PEA_1_P10のアミノ酸96〜123に相当する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、Z41644_PEA_1_P10をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWPEKZ at least 416 amino acids of amino acids _1 to 96 amino acids from amino acids _1 to 96 amino acids from amino acids 1 to 95 of Z41644_PEA_1_P10 A second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI An isolated chimeric polypeptide encoding Z41644_PEA_1_P10 is then provided wherein the first and second amino acid sequences are sequentially linked in sequence.

本発明の好ましい態様によって、Z41644_PEA_1_P10内の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、Z41644_PEA_1_P10の尾部をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI within Z41644_PEA_1_P10 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated chimeric polypeptide encoding the tail of Z41644_PEA_1_P10 comprising a polypeptide is provided.

本発明の好ましい態様によって、AAQ89265のアミノ酸13〜107に相当し、またZ41644_PEA_1_P10のアミノ酸1〜95にも相当するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRに少なくとも90%相同である第一アミノ酸配列を含み、Z41644_PEA_1_P10のアミノ酸96〜123に相当する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている、Z41644_PEA_1_P10をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWPENKZ at least 416 amino acids of amino acids _1 to 96 amino acids from amino acids 1 to 95 of Z41644_PEA_1_P10 A second amino acid sequence that is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the corresponding sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI An isolated chimeric polypeptide encoding Z41644_PEA_1_P10 is then provided wherein the first and second amino acid sequences are sequentially linked in sequence.

本発明の好ましい態様によって、Z41644_PEA_1_P10内の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、Z41644_PEA_1_P10の尾部をコ−ドする単離されたキメラポリペプチドが提供される。   According to a preferred embodiment of the present invention, the sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI within Z41644_PEA_1_P10 is at least 70%, where necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous. An isolated chimeric polypeptide encoding the tail of Z41644_PEA_1_P10 comprising a polypeptide is provided.

本発明の好ましい態様によって、配列番号:891または894からなる群より選択されるアンプリコンを含む、単離されたオリゴヌクレオチドが提供される。   According to a preferred embodiment of the present invention there is provided an isolated oligonucleotide comprising an amplicon selected from the group consisting of SEQ ID NO: 891 or 894.

本発明の好ましい態様によって、上記を増幅できる単離されたオリゴヌクレオチドのペア−を含む、プライマ−ペア−が提供される。要する場合、単離されたオリゴヌクレオチドのペア−は、配列番号:889と890;または892と893からなる群より選択される・   A preferred embodiment of the present invention provides a primer pair comprising an isolated pair of oligonucleotides capable of amplifying the above. Where necessary, the isolated oligonucleotide pair is selected from the group consisting of SEQ ID NOs: 889 and 890; or 892 and 893.

本発明の好ましい態様によって、本明細書に記載のアミノ酸配列のエピト−プに特異的に結合できる抗体が提供される。要する場合、エピト−プは本明細書に記載の尾部、頭部または縁部を含むことができる。   A preferred embodiment of the present invention provides an antibody capable of specifically binding to an epitope of the amino acid sequence described herein. If required, the epitopes can include a tail, head or edge as described herein.

本発明の好ましい態様によれば、抗体は前記エピト−プを有するスプライシング変異体と、対応する既知タンパク質とを識別できる。   According to a preferred embodiment of the present invention, the antibody can distinguish between the splicing variant having the epitope and the corresponding known protein.

本発明の好ましい態様によって、本明細書に記載のスプライシング変異体の過剰な発現を検知するキットを包含する、乳癌検出用キットが提供される。要する場合は、キットはNATを基本にした技術を含む。好ましくは、キットはさらに、本明細書に記載の核酸配列に選択的にハイブリダイゼ−ションできる、少なくとも一対のプライマ−を含む。要する場合には、キットはさらに、本明細書に記載の核酸配列に選択的にハイブリダイゼ−ションできる少なくとも一つのオリゴヌクレオチドを含む。   According to a preferred embodiment of the present invention, a kit for detecting breast cancer is provided, including a kit for detecting excessive expression of the splicing variants described herein. Where necessary, the kit includes NAT-based technology. Preferably, the kit further comprises at least a pair of primers that can selectively hybridize to the nucleic acid sequences described herein. Where necessary, the kit further comprises at least one oligonucleotide that can be selectively hybridized to the nucleic acid sequences described herein.

必要に応じ、キットは本明細書に記載の抗体を含む。好ましくは、キットはELISAまたはウエスタンブロットを実施するための試薬を少なくとも一つさらに含む。   Optionally, the kit includes an antibody described herein. Preferably, the kit further comprises at least one reagent for performing an ELISA or Western blot.

本発明の好ましい態様によって、本明細書に記載のスプライシング変異体の過剰発現を検出することを含む、乳癌を検出するための方法が提供される。   A preferred embodiment of the present invention provides a method for detecting breast cancer comprising detecting overexpression of a splicing variant described herein.

必要に応じ、過剰発現の検出は、NATを基本にした技術を用いて行われる。好ましくは、過剰発現の検出は、免疫アッセイを用いて行われる。より好ましくは、免疫アッセイは、本明細書に記載の抗体を含む。   If necessary, overexpression is detected using a NAT-based technique. Preferably, detection of overexpression is performed using an immunoassay. More preferably, the immunoassay comprises an antibody described herein.

本発明の好ましい態様によって、上記核酸配列またはその断片のいずれか、あるいは上記アミノ酸配列またはその断片のいずれかを含む、乳癌を検出できる生物マ−カ−が提供される。   A preferred embodiment of the present invention provides a biological marker capable of detecting breast cancer, comprising any of the nucleic acid sequences or fragments thereof, or any of the amino acid sequences or fragments thereof.

本発明の好ましい態様によれば、好ましくは上記核酸および/またはアミノ酸配列のいずれかは、それに対し少なくとも約70%、好ましくは少なくとも約80%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%の相同性を有する配列をさらに含む。   According to a preferred embodiment of the present invention, preferably any of the above nucleic acid and / or amino acid sequences is at least about 70%, preferably at least about 80%, more preferably at least about 90%, most preferably at least about It further includes sequences with 95% homology.

特に記載ない限り、全ての実験デ−タは、試験対象のセグメントに従い命名された、本発明の変異体に関するものである(記載のRT−PCRにより発現を試験した場合)。   Unless otherwise stated, all experimental data relate to the variants of the invention named according to the segment under test (when tested for expression by the described RT-PCR).

本発明の態様として本明細書に示した全ての核酸配列および/またはアミノ酸配列は、単離されたポリヌクレオチド(全ての転写物を包含する)、オリゴヌクレオチド(全てのセグメント、アンプリコンおよびプライマ−を包含する)、ペプチド(全ての尾部、架橋、挿入または頭部を包含し、要する場合には本明細書に記載のその他抗体エピト−プを包含する)ならびに/あるいはポリペプチド(全てのタンパク質を包含する)のような、それらの単離された形状に関するものである。オリゴヌクレオチドおよびポリヌクレオチド、あるいはペプチドおよびポリペプチドは、随意互換的に使用できることに注意するものとする。   All nucleic acid sequences and / or amino acid sequences set forth herein as embodiments of the present invention include isolated polynucleotides (including all transcripts), oligonucleotides (all segments, amplicons and primer sequences). ), Peptides (including all tails, bridges, insertions or heads, including other antibody epitopes as described herein) and / or polypeptides (including all proteins). For the isolated form thereof. It should be noted that oligonucleotides and polynucleotides or peptides and polypeptides can optionally be used interchangeably.

他に規定ないかぎり、本明細書に用いる全ての技術および科学的用語は、本発明が属する技術分野の当業者が通常に理解する意味を持つ。当業者は、次の参考資料より、本発明に用いる多くの用語の一般的定義を知ることができる:Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed, R. Rieger et al. (eds.), Springer Verlag (1991);およびHale & Marham, The Harper Collins Dictionary of Biology (1991)。これらは全て、参照によって本明細書に、本明細書に完全に記載されたものとして組み入れられる。本明細書で使用する場合、次の用語は、特に指定しない限り、これらに記載の意味を持つ。   Unless defined otherwise, all technical and scientific terms used herein have the meaning commonly understood by a person skilled in the art to which this invention belongs. One of ordinary skill in the art can find general definitions of many terms used in the present invention from the following references: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed, R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991). All of which are hereby incorporated by reference as if fully set forth herein. As used herein, the following terms have the meanings ascribed to them unless specified otherwise.

好ましい態様の説明
本発明は、高感度、且つ正確である乳癌の新規マ−カ−である。さらに、少なくともこれらマ−カ−のあるものは、乳癌の各種段階、例えば、単独または組み合わせた状態の、1.腺管癌(インサイチュ−、浸潤性)2.小葉癌(インサイチュ−、浸潤性)3.炎症性乳癌4.粘液性癌腫 5.管状癌 6.乳首のペ−ジェット病、あるいは上記指標状態の一つを区別することができる。
DESCRIPTION OF PREFERRED EMBODIMENTS The present invention is a novel marker of breast cancer that is sensitive and accurate. In addition, at least some of these markers are: 1. Ductal cancer (in situ, invasive), 2. Various lobular cancer (in situ, invasive) in various stages of breast cancer, eg, alone or in combination. 3. Inflammatory breast cancer 4. Mucinous carcinoma 5. Tubular cancer 6. Paget's disease of nipple, or one of the above indicator states can be distinguished.

本発明のマ−カ−は、単独または組み合わせて、乳癌の予後、予測、スクリ−ニング、早期診断、ステ−ジ分類、治療選択および治療モニタリングに用いることができる。例えば、随意および好ましくは、これらマ−カ−を用いて、乳癌のステ−ジを分類し、そして/またはこの疾患の進行をモニタリングできる。さらには、本発明のマ−カ−は、単独または組み合わせて用い、乳房以外の解剖学的部位に見出される転移源を検出することができる。また一もしくは複数のマ−カ−を、随意、一もしくは複数のその他乳癌マ−カ−(本明細書に記載されているもの以外の)と組合わせて用いてもよい。   The markers of the present invention can be used alone or in combination for breast cancer prognosis, prediction, screening, early diagnosis, stage classification, treatment selection and treatment monitoring. For example, and optionally, these markers can be used to classify breast cancer stages and / or monitor the progression of the disease. Furthermore, the markers of the present invention can be used alone or in combination to detect metastatic sources found in anatomical sites other than the breast. One or more markers may optionally be used in combination with one or more other breast cancer markers (other than those described herein).

本発明および本明細書に記載の方法論を用いて明らかにされた生物分子配列(アミノ酸および/または核酸配列)は、疾患の治療または予防のための組織もしくは病理マ−カ−、および/または薬物もしくは薬物の標的として有効に利用することができる。   Biomolecular sequences (amino acids and / or nucleic acid sequences) revealed using the present invention and the methodologies described herein are tissue or pathological markers and / or drugs for the treatment or prevention of disease. Alternatively, it can be effectively used as a drug target.

これらマ−カ−は、乳癌の状態(または上記指標状態)において血流に特異的に放出され、そして/あるいは乳癌組織もしくは細胞、および/または上記指標状態の一つにある組織もしくは細胞で非常に高レベルおよび/または特異的に発現する。患者サンプルについてこれらマ−カ−を単独もしくは組合せての測定することは、乳癌および/または乳癌のリスクが高いことを示す状態の根拠ある診断と相互に関連付けることができる情報を診断医に提供する。   These markers are specifically released into the bloodstream in the breast cancer state (or the above indicator state) and / or are highly expressed in breast cancer tissue or cells and / or tissue or cells in one of the above indicator states Expressed at high levels and / or specifically. Measuring these markers alone or in combination for patient samples provides diagnostic physicians with information that can be correlated with breast cancer and / or an underlying diagnosis of a condition that indicates an increased risk of breast cancer .

それゆえに本発明はまた、乳癌および/または指標状態の診断アッセイ、ならびに、随意および好ましくは被検者(患者)より得たサンプルでの、より好ましくは血液タイプのサンプルでの、そのようなマ−カ−の乳癌および/または指標状態を検知することへの使用方法にも関係する。   Thus, the present invention also provides diagnostic assays for breast cancer and / or indicator status, and optionally such samples in samples obtained from subjects (patients), more preferably in blood type samples. It also relates to the use of the karma for detecting breast cancer and / or indicator status.

本発明の好ましい態様によれば、マ−カ−の使用は、選択的および好ましくは、乳癌および/または指標状態と非癌性の乳房疾患状態とを識別できるようにする。非癌性の乳房疾患状態の非限定例としては、乳腺繊維症および/もしくは嚢胞が挙げられる。本発明の別の好ましい態様によれば、マ−カ−の使用は、選択的および好ましくは、乳癌を指標状態と識別できるようにする。   According to a preferred embodiment of the present invention, the use of a marker allows selective and preferably discrimination between breast cancer and / or indicator states and non-cancerous breast disease states. Non-limiting examples of non-cancerous breast disease states include breast fibrosis and / or cysts. In accordance with another preferred embodiment of the present invention, the use of a marker selectively and preferably allows breast cancer to be distinguished from an indicator condition.

別の態様では、本発明は、架橋、尾部、頭部および/または挿入、ならびに/あるいはこのようなペプチドの類似体、相同体および誘導体に関する。このような架橋、尾部、頭部および/または挿入は、実施例に関係して以下詳しく記載する。   In another aspect, the invention relates to cross-linking, tail, head and / or insertion, and / or analogs, homologues and derivatives of such peptides. Such bridges, tails, heads and / or insertions are described in detail below in connection with the examples.

本明細書で使用する場合、「尾部」は本発明のスプライシング変異体に固有であるアミノ酸配列の終端部にあるペプチド配列を指す。それゆえに、このような尾部を有するスプライシング変異体は、スプライシング変異体の少なくとも第一部分は、一般的に対応する既知タンパク質のある部分に対し極めて相同的である(しばしば100%同一)が、一方変異体の少なくとも第二部分は尾部を含んでいるキメラと考えることができる。   As used herein, “tail” refers to a peptide sequence at the end of an amino acid sequence that is unique to a splicing variant of the invention. Therefore, splicing variants with such tails, at least the first part of the splicing variant is generally very homologous (often 100% identical) to some part of the corresponding known protein, whereas the mutation At least a second part of the body can be considered a chimera containing a tail.

本明細書で使用する場合、「頭部」は本発明のスプライシング変異体に固有であるアミノ酸配列の始端部にあるペプチド配列を指す。それゆえに、このような頭部を有するスプライシング変異体は、スプライシング変異体の少なくとも第一部分は頭部を含み、一方少なくとも第二部分は、一般的に対応する既知タンパク質のある部分に対し極めて相同的である(しばしば100%同一)であるキメラと考えることができる。   As used herein, “head” refers to a peptide sequence at the beginning of an amino acid sequence that is unique to a splicing variant of the invention. Thus, a splicing variant having such a head has at least a first portion of the splicing variant comprising a head, while at least a second portion is generally highly homologous to a portion of the corresponding known protein. Can be considered a chimera that is (often 100% identical).

本明細書で使用する場合、「縁部」は、野生型または既知タンパク質内に連結していない、本発明のスプライシング変異体の2カ所を接続する部分を指す。縁は、例えば、変異体の上記「既知タンパク質」部分と尾部との間を連結して生じてもよく、また/あるいは野生型配列の内部がもはや存在しない場合には、既知タンパク質においては連続していない二つの配列部分がスプライシング変異体の中で連続して生じることもある。「架橋」は、上記縁部にあってもよいが、頭部と変異体の「既知タンパク質」部分の間に連結を、あるいは尾部と変異体の「既知タンパク質」部分の間に連結を、あるいは変異体の挿入と「既知タンパク質」部分の間に連結を含むこともできる。   As used herein, “edge” refers to the portion connecting two places of a splicing variant of the invention that is not linked within a wild-type or known protein. The rim may occur, for example, between the “known protein” portion of the variant and the tail, and / or is continuous in the known protein if the interior of the wild type sequence no longer exists. Two non-sequential sequence parts may occur in succession in the splicing variant. A “crosslink” may be at the edge, but a linkage between the head and the “known protein” portion of the variant, or a linkage between the tail and the “known protein” portion of the variant, or A linkage may also be included between the mutant insertion and the “known protein” portion.

随意でありまた好ましくは、尾部または頭部または固有挿入部と変異体の「既知タンパク質」部分の間の架橋は、少なくとも約10アミノ酸、より好ましくは少なくとも約20アミノ酸、最も好ましくは少なくとも30アミノ酸、そしてさらにより好ましくは少なくとも約40アミノ酸を含み、このとき少なくとも一つのアミノ酸は尾部/頭部/挿入部に由来し、また少なくとも一つのアミノ酸は変異体の「既知タンパク質」部分に由来する。また、架橋は約10〜約40(例えば、10、11、12、13...37、38、39、40アミノ酸長、またはその間のいずれかの数)のいずれかの数のアミノ酸を随意に含むことができる。   Optionally and preferably, the bridge between the tail or head or intrinsic insert and the “known protein” portion of the variant is at least about 10 amino acids, more preferably at least about 20 amino acids, most preferably at least 30 amino acids, Even more preferably, it comprises at least about 40 amino acids, wherein at least one amino acid is derived from the tail / head / insert and at least one amino acid is derived from the “known protein” portion of the variant. Also, the cross-linking is optionally any number of amino acids from about 10 to about 40 (eg, 10, 11, 12, 13, ... 37, 38, 39, 40 amino acids in length, or any number therebetween). Can be included.

架橋部はいずれの方向にも、そのアミノ酸長を超えて伸びることは出来ないことに注意するものとし、また全ての架橋部の既述は、架橋の長さが配列自体を超えて伸びないように読まれるものとする。   It should be noted that the bridge cannot extend in any direction beyond its amino acid length, and that all bridges have been described so that the length of the bridge does not extend beyond the sequence itself. Shall be read by

さらには、架橋部は以下特定の状況では、スライディングウインドウと関連付けて記載される。例えば、架橋部の特定の既述は次の形式で表される:二つの縁部間の架橋(このとき既知タンパク質部分は変位体内に存在していない)は、次のように随意記載できる:長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がXX(架橋の中央にある2アミノ酸、それぞれ縁部の両端のもの)を含むポリペプチドを含み、以下の構造(CONTIG−NAME_P1の配列にしたがった番号付け)を有するCONTIG−NAME_P1(タンパク質の名称を表している)の架橋部:アミノ酸番号49−xから49(例えば)のいずれかより開始し:アミノ酸番号50+((n−2)−x)(例えば)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。この例では、nは10〜50アミノ酸長間にある、いずれかのアミノ酸数である架橋を包含するものとしても読なければならない。さらに、架橋ポリペプチドは、配列を超えて伸びることはできず、従って49−x(例えば)は1より小さくなく、また50+((n−2)−x)(例えば)は全配列長より大きくないものとして読まれるものとする。   Further, the bridging portion is described below in connection with a sliding window in certain situations. For example, a particular description of the cross-link can be expressed in the following form: cross-linking between two edges (where no known protein portion is present in the displacement body) can optionally be described as follows: Having a length “n”, where n is at least about 10 amino acids long, where necessary at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, and most preferably at least It is about 50 amino acids long and contains a polypeptide containing at least two amino acids XX (2 amino acids in the middle of the bridge, each at both ends of the edge), the number according to the sequence of CONTIG-NAME_P1 CONTIG-NAME_P1 (representing the name of a protein) having a cross-link: starting from any of amino acid numbers 49-x to 49 (for example): amino acid numbers 50 + ((n-2) -x) ( A sequence ending at either example, if), this time x is in the range of 0 to n-2. In this example, n must also be read as encompassing any number of amino acid bridges between 10 and 50 amino acids long. Furthermore, cross-linked polypeptides cannot extend beyond the sequence, so 49-x (eg) is not less than 1 and 50 + ((n-2) -x) (eg) is less than the total sequence length. It should be read as not big.

別の態様では、本発明は本発明のスプライシング変異体およびそのポリペプチド断片を特異的に認識する抗体を提供する。そのような抗体は、本発明のスプライシング変異体を区別して認識するが、対応する既知タンパク質(このような既知タンパク質は、それらのスプライシング変異体と関係して以下実施例で論ずる)は認識しないことが好ましい。   In another aspect, the present invention provides antibodies that specifically recognize the splicing variants of the invention and polypeptide fragments thereof. Such antibodies recognize and recognize the splicing variants of the present invention, but do not recognize the corresponding known proteins (such known proteins are discussed in the examples below in connection with those splicing variants). Is preferred.

別の態様では、本発明は、本明細書に掲載した配列のいずれか一つに記載されているヌクレオチド配列またはそれに相補的な配列を有する、本発明のスプライシング変異体をコ−ドする単離された核酸分子を提供する。別の態様では、本発明は、本明細書に掲載した配列のいずれか一つに記載されているヌクレオチド配列またはそれに相補的な配列を有する、単離された核酸分子を提供する。別の態様では、本発明は、本発明の核酸分子と特異的にハイブリダイゼ−ションする、少なくとも12ヌクレオチドのオリゴヌクレオチドを提供する。別の態様では、本発明は、本発明の単離された核酸を含むベクタ−、細胞、リポソ−ムおよび組成物を提供する。   In another aspect, the invention provides an isolation encoding a splicing variant of the invention having a nucleotide sequence set forth in any one of the sequences listed herein or a sequence complementary thereto. Provided nucleic acid molecules. In another aspect, the present invention provides an isolated nucleic acid molecule having a nucleotide sequence set forth in any one of the sequences listed herein or a sequence complementary thereto. In another aspect, the invention provides an oligonucleotide of at least 12 nucleotides that specifically hybridizes with a nucleic acid molecule of the invention. In another aspect, the present invention provides vectors, cells, liposomes and compositions comprising the isolated nucleic acids of the present invention.

別の態様では、本発明は、生物サンプルを本発明のスプライシング変異体を特異的に認識する抗体と、その抗体が生物サンプル中のスプライシング変異体とは特異的に相互作用するが、既知の対応するタンパク質は認識しない(ここでいう既知タンパク質は、以下実施例の中でスプライシング変異体と関係して論じる)条件の下に接触させること、および前記相互作用を検出すること、を含む生物サンプル中の本発明のスプライシング変異体を検出するための方法であって、相互作用の存在が生物サンプル中のスプライシング変異体の存在と相関している方法を提供する。   In another aspect, the present invention relates to an antibody that specifically recognizes a biological sample with a splicing variant of the invention, and the antibody specifically interacts with a splicing variant in the biological sample, but no known correspondence In a biological sample comprising contacting under conditions that do not recognize the protein (known proteins herein discussed in connection with splicing variants in the examples below) and detecting the interaction The present invention provides a method for detecting a splicing variant of the present invention wherein the presence of an interaction correlates with the presence of a splicing variant in a biological sample.

別の態様では、本発明は、少なくともほぼ最低長を持つ単離された核酸分子またはオリゴヌクレオチド断片を生物サンプルの核酸物質にはいぶりすること、およびハイブリダイゼ−ション複合体を検出すること、を含む生物サンプル中のスプライシング変異体の核酸配列を検出するための方法であって、ハイブリダイゼ−ション複合体の存在が生物サンプル中のスプライシング変異体核酸配列の存在と相関している方法を提供する。   In another aspect, the present invention comprises irrigating an isolated nucleic acid molecule or oligonucleotide fragment having at least about a minimum length into the nucleic acid material of a biological sample and detecting a hybridization complex. A method is provided for detecting a splicing variant nucleic acid sequence in a biological sample, wherein the presence of the hybridization complex correlates with the presence of the splicing variant nucleic acid sequence in the biological sample.

本発明によれば、本明細書に記載のスプライシングは乳癌および/または指標状態の診断マ−カ−の非限定例である。本発明の各スプライシング変異体マ−カ−は、乳癌および/または乳癌の指標状態からの移行を含む指標状態の予後、予測、スクリ−ニング、早期診断、進行判定、治療選択および治療モニタリングを含むが、これらに限定されるものではない様々な使用について、単独または組合せて用いることができる。   According to the present invention, splicing as described herein is a non-limiting example of a diagnostic marker for breast cancer and / or indicator status. Each splicing variant marker of the present invention includes the prognosis, prediction, screening, early diagnosis, progression determination, treatment selection and treatment monitoring of the indicator state including transition from breast cancer and / or breast cancer indicator state However, it can be used alone or in combination for various uses that are not limited thereto.

本発明の選択的であるが好ましい態様によれば、本発明のマ−カ−は選択的に単独または組合せて用いることができる。このような組合せは、要する場合にはマ−カ−の補助的組合せ、および/または少なくとも一つのその他マ−カ−、例えば既知マ−カ−を特徴とする組合せも含め、本明細書に記載のマ−カ−を複数随意に含んでよい。さらにまた、このような組合せは、本明細書に記載のあるマ−カ−の、本明細書に記載のその他マ−カ−、および/またはその他既知マ−カ−、および/またはその他マ−カ−に対する定量的または半定量的測定値の比を決定することに関係して、上記のように選択的および好ましく用いることもできる。本明細書に記載のいずれかのマ−カ−(またはその組合せ)と既知マ−カ−とのこの様な比に関しては、既知マ−カ−が各クラスタまたは遺伝子に関連して以下詳細に記載される「既知タンパク質」を含むことがより好ましい。   According to an optional but preferred embodiment of the present invention, the markers of the present invention can be selectively used alone or in combination. Such combinations are described herein, including, where necessary, supplemental combinations of markers and / or combinations characterized by at least one other marker, such as a known marker. Multiple markers may optionally be included. Furthermore, such combinations may include those of the markers described herein, other markers described herein, and / or other known markers, and / or other markers. It can also be used selectively and preferably as described above in connection with determining the ratio of quantitative or semi-quantitative measurements to the car. With respect to such ratios of any of the markers described herein (or combinations thereof) to known markers, the known markers will be described in detail below in relation to each cluster or gene. It is more preferred to include the “known proteins” described.

本発明のさらに別の好ましい態様では、スプライシング変異体タンパク質もしくはその断片、またはスプライシング核酸配列もしくはその断片は、乳癌および/もしくは指標状態を検出するための生物マ−カ−として特徴付けることができ、生物マ−カ−は上記のいずれかを選択的に含むことができる。   In yet another preferred embodiment of the invention, the splicing variant protein or fragment thereof, or the splicing nucleic acid sequence or fragment thereof can be characterized as a biological marker for detecting breast cancer and / or indicator status, The marker can optionally include any of the above.

さらに別の好ましい態様によれば、本発明は、本明細書に記載のスプライシング変異体タンパク質に対応する核酸配列がコ−ドするアミノ酸配列またはその断片を選択的および好んで包含する。このようなアミノ酸配列またはその断片に関連するオリゴペプチドまたはペプチドもまた選択的に(追加的または代替的)、尾部、頭部、挿入部、縁部または架橋部といったこれらタンパク質に固有なアミノ酸配列を包含するが、これらに限定されない生物マ−カ−として用いることができる。本発明はまた、このようなオリゴペプチドまたはペプチドを認識できる、および/またはそれらによって誘導される抗体を選択的に包含する。   According to yet another preferred embodiment, the present invention selectively and preferably includes an amino acid sequence or fragment thereof that encodes a nucleic acid sequence corresponding to a splicing variant protein described herein. Oligopeptides or peptides related to such amino acid sequences or fragments thereof can also be selectively (additional or alternative) to have unique amino acid sequences such as tail, head, insert, edge or bridge. It can be used as a biological marker including but not limited to these. The invention also optionally encompasses antibodies that can recognize and / or derive from such oligopeptides or peptides.

本発明はまた、随意いずれか応用のために、上記の本発明のスプライシング変異体に対応する核酸配列もしくはその断片、またはアミノ酸配列もしくはその断片を、選択的および好んで包含する。   The present invention also optionally and preferably includes a nucleic acid sequence or fragment thereof, or an amino acid sequence or fragment thereof corresponding to the splicing variants of the present invention described above, for any optional application.

方法またはアッセイの非限定例を以下記載する。   Non-limiting examples of methods or assays are described below.

本発明はまた、このような診断方法またはアッセイに基づくキットにも関係する。   The invention also relates to kits based on such diagnostic methods or assays.

核酸配列およびオリゴヌクレオチド
本発明の様々な態様は、本明細書に記載の核酸配列、その断片、それとハイブリダイゼ−ション可能な配列、それに相同的な配列、異なるコドンを用いて同様のポリペプチドをコ−ドしている配列、天然に生じたかまたは無作為または狙いを付けて人工的に誘導された、一または複数のヌクレオチドの欠失、挿入または置換といった突然変異を特徴とする変更した配列を包含する。
Nucleic Acid Sequences and Oligonucleotides Various aspects of the invention can be used to copy similar polypeptides using the nucleic acid sequences described herein, fragments thereof, sequences that can hybridize to it, homologous sequences, and different codons. -Including modified sequences characterized by mutations such as deletions, insertions or substitutions of one or more nucleotides, naturally occurring or randomly or targeted artificially To do.

本発明は、本明細書に記載する核酸配列、その断片、それとハイブリダイゼ−ション可能な配列、それに相同的な配列[例えば、以下記載の核酸配列に少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも95%、またはさらには100%同一である]、異なるコドンを用いて同様のポリペプチドをコ−ドしている配列、天然に生じたかまたは無作為または狙いを付けて人工的に誘導された、一または複数のヌクレオチドの欠失、挿入または置換といった突然変異を特徴とする変更した配列を包含する。本発明はまた、本発明のポリヌクレオチドに固有な配列を含む相同的な核酸配列(即ち本発明のポリヌクレオチドの一部を形つくる配列)も包含する。   The invention includes nucleic acid sequences described herein, fragments thereof, sequences hybridizable thereto, sequences homologous thereto [eg, at least 50%, at least 55%, at least 60% At least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 95%, or even 100% identical], coding for similar polypeptides using different codons Sequences, including altered sequences characterized by mutations such as deletions, insertions or substitutions of one or more nucleotides, either naturally occurring or randomly or manually induced. The invention also encompasses homologous nucleic acid sequences that contain sequences that are unique to the polynucleotides of the invention (ie, sequences that form part of the polynucleotides of the invention).

本発明のポリヌクレオチド配列がまだ同定されていないポリペプチドをコ−ドする場合は、本発明は新規ポリペプチドまたはその一部も包含し、それらは単離された本明細書の上記ポリヌクレオチドおよびそれぞれのその核酸断片によりコ−ドされる。   When coding a polypeptide for which the polynucleotide sequence of the present invention has not yet been identified, the present invention also encompasses novel polypeptides or portions thereof, which are isolated from the above-described polynucleotides and Coded by each of its nucleic acid fragments.

「核酸断片」または「オリゴヌクレオチド」または「ポリヌクレオチド」は、本明細書では互換的に用いられて、核酸の重合体を指す。本発明のポリヌクレオチド配列は、RNA配列、相補的ポリヌクレオチド配列(cDNA)、ゲノムポリヌクレオチド配列および/または合成ポリヌクレオチド配列(例えば上記の組合せ)の形で単離および提供される単鎖または二重鎖核酸配列を指す。   “Nucleic acid fragment” or “oligonucleotide” or “polynucleotide” are used interchangeably herein to refer to a polymer of nucleic acids. The polynucleotide sequences of the present invention may be single or double isolated and provided in the form of RNA sequences, complementary polynucleotide sequences (cDNA), genomic polynucleotide sequences and / or synthetic polynucleotide sequences (eg, combinations of the above). Refers to heavy chain nucleic acid sequence.

本明細書で用いる場合、句「相補的ポリヌクレオチド配列」とは、逆転写酵素またはその他のRNA依存的DNAポリメラ−ゼを用いてメッセンジャ−RNAを逆転写して生じる配列を指す。このような配列は、DNA依存的DNAポリメラ−ゼを用いて、インビボまたはインビトロで実質的に増幅できる。   As used herein, the phrase “complementary polynucleotide sequence” refers to a sequence that results from reverse transcription of messenger RNA using reverse transcriptase or other RNA-dependent DNA polymerase. Such sequences can be substantially amplified in vivo or in vitro using DNA-dependent DNA polymerases.

本明細書で用いる場合、句「ゲノムポリヌクレオチド配列」は、染色体に由来する(単離した)配列を指し、それゆえにそれは染色体の連続部分を表す。   As used herein, the phrase “genomic polynucleotide sequence” refers to a sequence that is derived (isolated) from a chromosome and therefore represents a contiguous portion of a chromosome.

本明細書で用いる場合、句「合成ポリヌクレオチド配列」は、ゲノムおよびcDNA配列からなる配列を指す。合成配列は、本発明のポリペプチドをコ−ドするのに必要ないくつかのエクソン配列ならびにその間に挿入されるいくつかのイントロン配列を含むことができる。イントロン配列は、他の遺伝子を含むいずれの供給源からのものでよいが、一般的には保存されたスプライシングシグナル配列を含んでいる。このようなイントロン配列は、シス作用する発現制御要素をさらに含むことができる。   As used herein, the phrase “synthetic polynucleotide sequence” refers to a sequence consisting of a genomic and cDNA sequence. A synthetic sequence can include several exon sequences necessary to code a polypeptide of the present invention as well as several intron sequences inserted therebetween. Intron sequences can be from any source, including other genes, but generally include a conserved splicing signal sequence. Such intron sequences can further comprise cis-acting expression control elements.

本発明の好ましい態様は、オリゴヌクレオチドプロ−ブを包含する。   Preferred embodiments of the present invention include oligonucleotide probes.

本発明が利用できるオリゴヌクレオチドプロ−ブの例は、本発明の架橋部、尾部、頭部および/または挿入部のアミノ酸配列をコ−ドするヌクレオチド配列、ならびに/あるいは本明細書に記載されているヌクレオチド配列の均等部分(本明細書に記載のノ−ド、セグメントまたはアンプリコンのヌクレオチド配列を含むがこれに限定されるものではない)を含むがこれに限定されるものではない、本発明の変異体の固有配列領域に相補的な配列を含有する単鎖ポリヌクレオチドである。   Examples of oligonucleotide probes that can be used with the present invention include nucleotide sequences that encode the amino acid sequence of the bridge, tail, head and / or insert of the present invention, and / or are described herein. An equivalent portion of a nucleotide sequence (including but not limited to the nucleotide sequence of a node, segment or amplicon described herein), It is a single-stranded polynucleotide containing a sequence complementary to the unique sequence region of the variant.

または、本発明のオリゴヌクレオチドプロ−ブは、上記核酸配列のいずれかに包含される核酸配列、特に、本発明の架橋部、尾部、頭部および/または挿入部のアミノ酸配列をコ−ドするヌクレオチド配列、ならびに/あるいは本明細書に記載されているヌクレオチド配列の均等部分(本明細書に記載のノ−ド、セグメントまたはアンプリコンのヌクレオチド配列を含むがこれに限定されるものではない)を含むがこれに限定されるものではない、上記規定の部分とハイブリダイゼ−ションするように設計できる。   Alternatively, the oligonucleotide probe of the present invention encodes the nucleic acid sequence included in any of the above nucleic acid sequences, particularly the amino acid sequence of the bridge, tail, head and / or insert of the present invention. Nucleotide sequence, and / or equivalent portion of the nucleotide sequence described herein (including but not limited to the nucleotide sequence of a node, segment or amplicon described herein) It can be designed to hybridize with the above defined portion, including but not limited to this.

本発明の教示に従い設計されたオリゴヌクレオチドは、酵素合成法または固相合成法のような当技術分野公知のオリゴヌクレオチド合成法によって作製できる。固相合成法を実施するための装置および試薬は、例えばApplied Biosystemsから市販されている。このような合成のためのその他手段も用いることができる;オリゴヌクレオチドの実際の合成は当業者の能力のまさに範囲内であり、例えば"Molecular Cloning: A laboratory Manual" Sambrook et al., (1989); "Current Protocols in Molecular Biology" Volumes I−III Ausubel, R. M., ed. (1994); Ausubel et al., "Current Protocols in Molecular Biology", John Wiley and Sons, Baltimore, Maryland (1989); Perbal, "A Practical Guide to Molecular Cloning", John Wiley & Sons, New York (1988) および"Oligonucleotide Synthesis" Gait, M. J., ed (1984)に詳述されている確立された方法論によって、固相化学、例えばシアノエチルホスホ−ルアミダイトを用い、続いて脱保護、脱塩、および例えば自動化トリチル−オン法もしくはHPLCにより精製することで達成できる。   Oligonucleotides designed in accordance with the teachings of the present invention can be made by oligonucleotide synthesis methods known in the art, such as enzymatic synthesis methods or solid phase synthesis methods. Equipment and reagents for carrying out the solid phase synthesis method are commercially available, for example, from Applied Biosystems. Other means for such synthesis can also be used; the actual synthesis of oligonucleotides is just within the ability of one skilled in the art, eg "Molecular Cloning: A laboratory Manual" Sambrook et al., (1989) "Current Protocols in Molecular Biology" Volumes I-III Ausubel, RM, ed. (1994); Ausubel et al., "Current Protocols in Molecular Biology", John Wiley and Sons, Baltimore, Maryland (1989); Perbal, " A Practical Guide to Molecular Cloning ", John Wiley & Sons, New York (1988) and" Oligonucleotide Synthesis "Gait, MJ, ed (1984). Can be achieved by using ruamidite followed by deprotection, desalting and purification, for example by the automated trityl-one method or HPLC.

本発明のこの局面に従い用いるオリゴヌクレオチドは、約10〜約200塩基、好ましくは約15〜約150塩基、より好ましくは約20〜約100塩基、最も好ましくは約20〜約50塩基の範囲から選択される長さを持つオリゴヌクレオチドである。好ましくは、本発明のオリゴヌクレオチドは、本発明の生物マ−カ−と特異的にハイブリダイゼ−ションできる、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも22、少なくとも25、少なくとも30、または少なくとも40の塩基を特徴とする。   Oligonucleotides used in accordance with this aspect of the invention are selected from the range of about 10 to about 200 bases, preferably about 15 to about 150 bases, more preferably about 20 to about 100 bases, and most preferably about 20 to about 50 bases. It is an oligonucleotide having a length. Preferably, the oligonucleotide of the invention is at least 17, at least 18, at least 19, at least 20, at least 22, at least 25, at least 30, or at least capable of specifically hybridizing with the biological marker of the invention. Characterized by 40 bases.

本発明のオリゴヌクレオチドは、3'と5'とのホスホジエステル結合で結合したプリンおよびピリミジン塩基からなる複素環式ヌクレオシドを含んでもよい。   The oligonucleotides of the present invention may comprise heterocyclic nucleosides consisting of purine and pyrimidine bases linked by 3 ′ and 5 ′ phosphodiester bonds.

好ましく用いられるオリゴヌクレオチドは、以下広く記載されるように、主鎖、ヌクレオチド間結合、または塩基の一または複数の部位が修飾されているオリゴヌクレオチドである。   Oligonucleotides that are preferably used are oligonucleotides that are modified at one or more sites in the backbone, internucleotide linkages, or bases, as described broadly below.

本発明のこの局面において有用である好ましいオリゴヌクレオチドの具体例としては、修飾された主鎖または非天然のヌクレオチド間結合を含有するオリゴヌクレオチドが挙げられる。修飾された主鎖を有するオリゴヌクレオチドとしては、米国特許第4,469,863号;第4,476,301号;第5,023,243号;第5,177,196号;第5,188,897号;第5,264,423号;第5,276,019号;第5,278,302号;第5,286,717号;第5,321,131号;第5,399,676号;第5,405,939号;第5,453,496号;第5,455,233号;第5,466,677号;第5,476,925号;第5,519,126号;第5,536,821号;第5,541,306号;第5,550,111号;第5,563,253号;第5,571,799号;第5,587,361号;および第5,625,050号に開示されているような、主鎖内に燐原子を保持しているオリゴヌクレオチドである。   Specific examples of preferred oligonucleotides useful in this aspect of the invention include oligonucleotides containing modified backbones or non-natural internucleotide linkages. Oligonucleotides having modified backbones include U.S. Patent Nos. 4,469,863; 4,476,301; 5,023,243; 5,177,196; 5,188,897; 5,264,423; 5,276,019; 5,278,302; 5,286,717; No. 5,321,131; 5,399,676; 5,405,939; 5,453,496; 5,455,233; 5,466,677; 5,476,925; 5,519,126; 5,536,821; 5,541,306; 5,550,111; No .; 5,587,361; and 5,625,050, oligonucleotides carrying a phosphorus atom in the main chain.

好ましい修飾されたオリゴヌクレオチドの主鎖としては、例えばホスホロチオエ−ト、キラルホスホロチオエ−ト、ホスホロジチオエ−ト、ホスホロトリエステル、アミノアルキルホスホロトリエステル、メチルおよび3'−アルキレンホスホネ−トやキラルホスホネ−トを含むその他アルキルホスホネ−ト、ホスフィネ−ト、3'−アミノホスホロアミデ−トやアミノアルキルホスホロアミデ−トを含むホスホロアミデ−ト、チオノホスホルアミデ−ト、チオノアルキルホスホネ−ト、チオノアルキルホスホトリエステル、ならびに通常の3'−5'結合を有するボラノホスフェ−ト、それらの2'−5'結合類似体、および逆の極性を有し、近接するヌクレオシド単位ペア−が3'−5'と5'−3'、または2'−5'と5'−2'と結合しているボラノホスフェ−トが挙げられる。各種の塩、混合塩、および遊離酸の形をしたものも用いることができる。   Preferred modified oligonucleotide backbones include, for example, phosphorothioates, chiral phosphorothioates, phosphorodithioates, phosphorotriesters, aminoalkyl phosphorotriesters, methyl and 3'-alkylene phosphonates and chiral phosphonates. -Other alkyl phosphonates, phosphinates, 3'-amino phosphoramidates and phosphoramidates containing aminoalkyl phosphoramidates, thionophosphoramidates, thio Noalkyl phosphonates, thionoalkyl phosphotriesters, and boranophosphates with normal 3'-5 'linkages, their 2'-5' linkage analogs, and opposite polarity and proximity Examples include boranophosphates in which a nucleoside unit pair is bound to 3'-5 'and 5'-3', or 2'-5 'and 5'-2'. It is. Various salts, mixed salts, and free acid forms can also be used.

または、その中にリン元素を含んでいない修飾型オリゴヌクレオチド主鎖は、単鎖のアルキルもしくはシクロアルキルヌクレオシド間結合によって形成された主鎖、混合型のヘテロ元素およびアルキルもしくはシクロアルキルヌクレオシド結合によって形成された主鎖、または一もしくは複数の単鎖ヘテロ原子もしくは複素環式ヌクレオシド結合を有する。このようなものとしては、モルホリノ結合(ヌクレオシドの糖部分の一部に形成される);シロキサン主鎖;スルフィド、スルホキシドおよびスルホン主鎖;ホルムアセチルおよびチオホルムアセチル主鎖;メチレンホルムアセチルおよびチオホルムアセチル主鎖;アルキレン含有主鎖;スルファメ−トおよびスフホナミド主鎖;アミド主鎖;ならびにN、O、SおよびCH2成分部分を混合して有する、米国特許第5,034,506号;第5,166,315号;第5,185,444号;第5,214,134号;第5,216,141号;第5,235,033号;第5,264,562号;第5,264,564号;第5,405,938号;第5,434,257号;第5,466,677号;第5,470,967号;第5,489,677号;第5,541,307号;第5,561,225号;第5,596,086号;第5,602,240号;第5,610,289号;第5,602,240号;第5,608,046号;第5,610,289号;第5,618,704号;第5,623,070号;第5,663,312号:第5,633,360号;第5,677,437号;および第5,677,439号に開示されているその他のものが挙げられる。 Alternatively, a modified oligonucleotide backbone that does not contain a phosphorus element therein is formed by a backbone formed by a single-chain alkyl or cycloalkyl internucleoside bond, a mixed heteroelement, and an alkyl or cycloalkyl nucleoside bond Having one or more single chain heteroatoms or heterocyclic nucleoside linkages. These include: morpholino linkages (formed on part of the sugar moiety of the nucleoside); siloxane backbone; sulfide, sulfoxide and sulfone backbone; formacetyl and thioformacetyl backbone; methyleneformacetyl and thioform. US Pat. Nos. 5,034,506; 5,166,315; 5,185,444 having an acetyl backbone; an alkylene-containing backbone; a sulfamate and sufonamide backbone; an amide backbone; and a mixture of N, O, S, and CH 2 moieties. No. 5,214,134; No. 5,216,141; No. 5,235,033; No. 5,264,562; No. 5,264,564; No. 5,405,938; No. 5,434,257; No. 5,466,677; No. 5,470,967; No. 5,489,677; 5,596,086; 5,602,240; 5,610,289; 5,602,240; 5,608,046; 5,610,289; 5,618,704; 5,623,070; 5,663,312: 5,633,360; 5,677,437; and others disclosed in 5,677,439.

本発明に従い用いることができるその他オリゴヌクレオチドは、ヌクレオチド単位の糖およびヌクレオシド間結合の両方、即ち主鎖が修飾され、新規の基に置換されているオリゴヌクレオチドである。塩基単位は、そのポリヌクレオチド標的との相補性については維持されている。こにょうなオリゴヌクレオチド模擬体の例としては、ペプチド核酸(PNA)が挙げられる。PNA化合物の調製を教示する米国特許としては、これに限定されるものではないが、米国特許第5,539,082号;第5,714,331号;および第5,719,262号が挙げられ、これらはそれぞれ参照によって本明細書に組み入れられる。本発明で用いることができるその他主鎖修飾は、米国特許第6,303,374号に開示されている。   Other oligonucleotides that can be used in accordance with the present invention are oligonucleotides in which both the sugar and internucleoside linkages of the nucleotide units, ie, the backbone, have been modified and replaced with new groups. The base unit is maintained for complementarity with its polynucleotide target. An example of such an oligonucleotide mimetic is peptide nucleic acid (PNA). US patents that teach the preparation of PNA compounds include, but are not limited to, US Pat. Nos. 5,539,082; 5,714,331; and 5,719,262, each of which is incorporated herein by reference. It is done. Other backbone modifications that can be used in the present invention are disclosed in US Pat. No. 6,303,374.

本発明のオリゴヌクレオチドは、塩基の修飾または置換を含んでもよい。本明細書で用いる場合、「未修飾」または「天然」塩基は、プリン塩基のアデニン(A)およびグアニン(G)、ならびにピリミジン塩基のチミン(T)、シトシン(C)およびウラシル(U)を含む。修飾塩基としては、5−メチルシトシン(5−me−C)、5−ヒドロキシメチルシトシン、キサンチン、ハイポキサンチン、2−アミノアデニン、アデニンおよびグアニンの6−メチルおよびその他アルキル誘導体、アデニンおよびグアニンの2−プロピルおよびその他アルキル誘導体、2−チオウラシル、2−チオチミンおよび2−チオシトシン、5−ハロウラシルおよびシトシン、5−プロピニルウラシルおよびシトシン、6−アゾウラシル、シトシンおよびチミン、5−ウラシル(シュ−ドウラシル)、4−チオウラシル、8−ハロ、8−アミノ、8−チオ−ル、8−チオアルキル、8−ヒドロキシルおよびその他8−置換アデニン及びグアニン、5−ハロ、特には5−ブロモ、5−トリフルオロメチルおよびその他の5−置換ウラシルおよびシトシン、7−メチルグアニンおよび7−メチルアデニン、8−アザグアニンおよび8−アザアデニン、7−デアザグアニンおよび7−デアザアデニン、ならびに3−デアザグアニンおよび3−デアザアデニンのようなその他合成および天然塩基が挙げられるが、これらに限定されるわけではない。発明のオリゴマ−化合物の結合親和性を高めるのに特に有用である更なる塩基としては、5−置換ピリミジン、6−アザピリミジン、ならびに2−アミノプロピルアデニン、5−プロピニルウラシルおよび5−プロピニルシトシンを含むN−2、N−6およびO−6置換プリンが挙げられる。5−メチルシトシン置換は、核酸二重鎖の案呈せを0.6〜1.2℃挙げることが示されており、目下のところ好ましい塩基置換であり、特に2'−O−メトキシエチル糖修飾と組み合わせた時に好ましい。   The oligonucleotides of the invention may contain base modifications or substitutions. As used herein, `` unmodified '' or `` natural '' bases include the purine bases adenine (A) and guanine (G), and the pyrimidine bases thymine (T), cytosine (C) and uracil (U). Including. Modified bases include 5-methylcytosine (5-me-C), 5-hydroxymethylcytosine, xanthine, hypoxanthine, 2-aminoadenine, 6-methyl and other alkyl derivatives of adenine and guanine, 2 of adenine and guanine. -Propyl and other alkyl derivatives, 2-thiouracil, 2-thiothymine and 2-thiocytosine, 5-halouracil and cytosine, 5-propynyluracil and cytosine, 6-azouracil, cytosine and thymine, 5-uracil (sudouracil), 4 -Thiouracil, 8-halo, 8-amino, 8-thiol, 8-thioalkyl, 8-hydroxyl and other 8-substituted adenine and guanine, 5-halo, especially 5-bromo, 5-trifluoromethyl and others 5-substituted uracil and cytosine, 7-methylguanine And other synthetic and natural bases such as, but not limited to, 7-methyladenine, 8-azaguanine and 8-azaadenine, 7-deazaguanine and 7-deazaadenine, and 3-deazaguanine and 3-deazaadenine. Absent. Additional bases that are particularly useful for increasing the binding affinity of the inventive oligomeric compounds include 5-substituted pyrimidines, 6-azapyrimidines, and 2-aminopropyladenine, 5-propynyluracil and 5-propynylcytosine. Including N-2, N-6 and O-6 substituted purines. The 5-methylcytosine substitution has been shown to raise the proposed nucleic acid duplex by 0.6-1.2 ° C. and is currently the preferred base substitution, especially in combination with the 2′-O-methoxyethyl sugar modification Sometimes preferred.

発明のオリゴヌクレオチドの別の修飾には、オリゴヌクレオチドに一または複数の成分または結合物を化学的に結合させることも含まれ、これによりオリゴヌクレオチドの活性、細胞分布または細胞の取り込みが促進される。このような成分としては、コレステロ−ル成分のような脂質成分、コ−ル酸、チオエ−テル、例えばヘキシル−S−トリチルチオ−ル、チオコレステロ−ル、脂肪鎖、例えばドデカジオ−ルもしくはウンデシル残基、リン脂質、例えばジ−ヘキサデシル−ラック−グリセロ−ルもしくはトリエチルアンモニウム1,2−ジ−O−ヘキサデシル−ラック−グリセロ−3−H−ホスホネ−ト、ポリアミンもしくはポリエチレングリコ−ル鎖、またはアダマンタン酢酸、パルミチル成分、あるいは米国特許第6,303,374号に開示されているオクタデシルアミンまたはヘキシルアミノ−カルボニル−オキシコレステロ−ル成分が挙げられるが、これらに限定されるものではない。   Another modification of the oligonucleotide of the invention also includes chemically linking one or more components or conjugates to the oligonucleotide, which promotes oligonucleotide activity, cell distribution or cellular uptake. . Such components include lipid components such as cholesterol components, cholesteric acid, thioethers such as hexyl-S-tritylthiol, thiocholesterol, fatty chains such as dodecadiol or undecyl residues. Groups, phospholipids such as di-hexadecyl-lac-glycerol or triethylammonium 1,2-di-O-hexadecyl-lac-glycero-3-H-phosphonate, polyamine or polyethylene glycol chains, or adamantane Examples include, but are not limited to, acetic acid, palmityl components, or octadecylamine or hexylamino-carbonyl-oxycholesterol components disclosed in US Pat. No. 6,303,374.

あるオリゴヌクレオチド分子中の位置が全て均一に修飾される必要はなく、実際は一つ以上の上記修飾は、オリゴヌクレオチド内の単一の化合物または単一のヌクレオシドにさえ組み入れることができる。   Not all positions in an oligonucleotide molecule need to be uniformly modified, in fact one or more of the above modifications can be incorporated into a single compound or even a single nucleoside within an oligonucleotide.

本発明のオリゴヌクレオチドは、診断薬としてより効果的に使用するため、および/または成体利用度、治療効果を高め、細胞毒性を下げるために更なる修飾を含んでよい。   The oligonucleotides of the present invention may contain further modifications for more effective use as diagnostics and / or to increase adult availability, therapeutic effects and reduce cytotoxicity.

本発明のポリヌクレオチドを細胞で発現できるようにするために本発明の核酸構築体を使用することができ、構築体は少なくとも上記核酸配列の一つのコ−ディング領域を含み、さらに少なくとも一つのシス作用型制御要素を含む。本明細書で用いる場合、句「シス作用型制御要素」とは、トランス作用型制御因子に結合し、その下流に位置するコ−ディング配列の転写を制御するポリヌクレオチド配列、好ましくはプロモ−タを指す。   The nucleic acid construct of the present invention can be used so that the polynucleotide of the present invention can be expressed in cells, and the construct comprises at least one coding region of the above-described nucleic acid sequence, and further comprises at least one cis Includes action type control elements. As used herein, the phrase “cis-acting regulatory element” refers to a polynucleotide sequence, preferably a promoter, that binds to a trans-acting regulator and controls transcription of a coding sequence located downstream thereof. Point to.

本発明の核酸構築体は、いずれの好適プロモ−タ配列も用いることができる。   Any suitable promoter sequence can be used in the nucleic acid construct of the present invention.

本発明の核酸構築体が利用するプロモ−タは、形質転換した特定の細胞集団で活性であるものが好ましい。細胞型特異的および/または組織特異的プロモ−タの例としては、肝臓特異的であるアルブミンのようなプロモ−タ、リンパ特異的系プロモ−タ[Calame et al., (1989) Adv. Immunol. 43:235−275];特にT細胞レセプタ−のプロモ−タ[Winoto et al., (1989) EMBO J. 8:729−733]および免疫グロブリンのプロモ−タ;[Banerji et al. (1983) Cell 33729−740]、神経繊維プロモ−タのような神経細胞特異的プロモ−タ
[Byrne et al. (1989) Proc. Natl. Acad. Sci. USA 86:5473−5477]、膵臓特異的プロモ−タ[Edlunch et al. (1985) Science 230:912−916]または乳精プロモ−タのような乳腺特異的プロモ−タ[米国特許第4,873,316号および欧州特許出願第264,166号]が挙げられる。本発明の核酸構築体は、プロモ−タ配列に近接または離れて位置でき、そこからの転写のアップレギュレ−ションに機能できるエンハンサ−を更に含むことができる。
The promoter used by the nucleic acid construct of the present invention is preferably one that is active in a specific transformed cell population. Examples of cell type specific and / or tissue specific promoters include promoters such as albumin which are liver specific, lymph specific promoters [Calame et al., (1989) Adv. Immunol 43: 235-275]; especially promoters for T cell receptors [Winoto et al., (1989) EMBO J. 8: 729-733] and immunoglobulin promoters; [Banerji et al. (1983 Cell 33729-740], neuron-specific promoters such as nerve fiber promoters [Byrne et al. (1989) Proc. Natl. Acad. Sci. USA 86: 5473-5477], pancreas-specific promoters And mammary gland specific promoters [U.S. Pat. No. 4,873,316 and European Patent Application No. 264,166], such as the milk promoter (Edlunch et al. (1985) Science 230: 912-916). The nucleic acid constructs of the present invention can further comprise an enhancer that can be located close to or away from the promoter sequence and that can function for transcriptional upregulation therefrom.

本発明の核酸構築体は、好ましくは、適当な選択マ−カ−および/または複製起点を含む。好ましくは、用いる核酸構築体は、E.coli(この場合、構築体は適当な選択マ−カ−および複製起点を含む)で継代できると同時に、細胞での継代または選択した遺伝子および組織内に組み込みにも適合しているシャトルベクタ−である。本発明の構築体は、例えば、プラスミド、バクミド、ファ−ジミド、コスミド、ファ−ジ、ウイルスまたは人工染色体でよい。   The nucleic acid construct of the present invention preferably comprises a suitable selection marker and / or origin of replication. Preferably, the nucleic acid construct used can be passaged with E. coli (in which case the construct includes an appropriate selection marker and origin of replication) while being passaged in cells or selected genes and tissues. It is a shuttle vector that is also suitable for incorporation. The construct of the present invention may be, for example, a plasmid, bacmid, phagemid, cosmid, phage, virus or artificial chromosome.

好適な構築体の例としては、これらに限定されるものではないが、pcDNA3、pcDNA3.1(+/−)、pGL3、PzeoSV(+/−)、pDisplay、pEF/myc/cyto、pCMV/myc/cytoを挙げることができ、これらはそれぞれInvitrogen Co. (www.invitrogen.com)より市販されている。レトロウイルスベクタ−およびパッケ−ジングシステムの例は、Retro−Xベクタ−pLNCXおよびpLXSNを含めてClontech、San Diego、Calif.から販売されており、これらにより複数のクロ−ニング位置へのクロ−ニングが可能となり、トランス遺伝子はCMVプロモ−タから転写される。pBabeのようなMo−MuLV由来のベクタ−もまた用いることができ、この場合トランス遺伝子は5'LTRプロモ−タから転写される。   Examples of suitable constructs include, but are not limited to, pcDNA3, pcDNA3.1 (+/−), pGL3, PzeoSV (+/−), pDisplay, pEF / myc / cyto, pCMV / myc each of which is commercially available from Invitrogen Co. (www.invitrogen.com). Examples of retroviral vector and packaging systems are sold by Clontech, San Diego, Calif., Including Retro-X vectors-pLNCX and pLXSN, which allow cloning to multiple cloning locations. Transgenes are transcribed from the CMV promoter. Vectors derived from Mo-MuLV such as pBabe can also be used, in which case the transgene is transcribed from the 5 ′ LTR promoter.

現時点で好ましいインビボ核酸移動技術としては、アデノウイルス、レンチウイルス、単純疱疹ヘルペスIまたはアデノ関連ウイルス(AAV)および脂質をベ−スとしたシステムのようなウイルスまたは非ウイルス構築体を用いたトランスフェクションが挙げられる。脂質を介した遺伝子移動に有用な脂質は、例えばDOTMA、DOPEおよびDC−Cholである[Tonkinson et al., Cancer Investigation, 14(1): 54−65(1996)]。遺伝子治療での使用に最も好ましい構築体はウイルスであり、最も好ましいものはアデノウイルス、AAV、レンチウイルスまたはレトロウイルスである。レトロウイルス構築体のようなウイルス構築体は、少なくとも一つの転写プロモ−タ/エンハンサ−もしくは遺伝子座規定要素、または異なるスプライシング、核RNAの搬出もしくはメッセンジャ−の翻訳後修飾といった別の手段によって遺伝子発現を制御するその他要素を含む。このようなベクタ−構築体はまた、ウイルス構築体内に既に存在していない場合、パッケ−ジングシグナル、ロングタ−ミナルリピ−ト(LTR)もしくはその一部、および用いるウイルスに合ったプラス及びマイナス鎖プライマ−結合部位を含む。好ましくは、この目的に合ったシグナル配列は、哺乳動物シグナル配列または本発明のポリペプチド変異体のシグナル配列である。要する場合は、構築体はポリアデニル化を指示するシグナル、ならびに位置または複数の制限部位および翻訳終止配列を含んでよい。例示的には、このような構築体は、一般的に5'LTR、tRNA結合部位、パッケ−ジングシグナル、第二鎖DNA合成の起点、および3'LTRもしくはその一部を含むだろう。非ウイルス性の、カチオン脂質、ポリリジンおよびデンドリマ−のような別のベクタ−を用いることもできる。   Currently preferred in vivo nucleic acid transfer techniques include transfection using viral or non-viral constructs such as adenovirus, lentivirus, herpes simplex I or adeno-associated virus (AAV) and lipid based systems. Is mentioned. Lipids useful for lipid-mediated gene transfer are, for example, DOTMA, DOPE and DC-Chol [Tonkinson et al., Cancer Investigation, 14 (1): 54-65 (1996)]. The most preferred construct for use in gene therapy is a virus, most preferred is an adenovirus, AAV, lentivirus or retrovirus. Viral constructs, such as retroviral constructs, can express gene expression by at least one transcriptional promoter / enhancer or locus-defining element, or by other means such as differential splicing, nuclear RNA export or messenger post-translational modification. Including other elements that control Such vector constructs may also include packaging signals, long terminal repeats (LTR) or parts thereof, and positive and negative strand primers suitable for the virus used, if not already present in the viral construct. -Contains a binding site. Preferably, the signal sequence for this purpose is a mammalian signal sequence or a signal sequence of a polypeptide variant of the invention. Where necessary, the construct may include a signal to direct polyadenylation, as well as a position or multiple restriction sites and a translation termination sequence. Illustratively, such constructs will generally include a 5 ′ LTR, a tRNA binding site, a packaging signal, an origin of second strand DNA synthesis, and a 3 ′ LTR or a portion thereof. Other vectors such as non-viral, cationic lipids, polylysine and dendrimers can also be used.

ハイブリダイゼ−ションアッセイ
生物サンプル中の関心対象の核酸の検出は、オリゴヌクレオチドプロ−ブを用いるハイブリダイゼ−ションを基本とするアッセイで随意実施できる(本発明のプロ−ブの非限定例は前述している)。
Hybridization Assays Detection of nucleic acids of interest in biological samples can optionally be performed in hybridization-based assays using oligonucleotide probes (non-limiting examples of probes of the invention are described above). )

伝統的なハイブリダイゼ−ションアッセイとしては、PCR、RT−PCR、リアルタイムPCR、RNase保護、インサイチュ−ハイブリダイゼ−ション、プライマ−伸長、サザンブロット(DNA検出)、ドットもしくはスロットブロット(DNA、RNA)およびノ−ザンブロット(RNA検出)がある(NAT型のアッセイを以下詳しく説明する)。より最近には、PNAが報告されている(Nielsen et al. 1999, Current Opin. Biotechnol. 10:71−75)。別の検出法としては、ディップスティック等にプロ−ブを含有させたキットが挙げられる。   Traditional hybridization assays include PCR, RT-PCR, real-time PCR, RNase protection, in situ hybridization, primer extension, Southern blot (DNA detection), dot or slot blot (DNA, RNA) and -There is a Zamblot (RNA detection) (NAT type assay is described in detail below). More recently, PNA has been reported (Nielsen et al. 1999, Current Opin. Biotechnol. 10: 71-75). Another detection method includes a kit containing a probe in a dipstick or the like.

生物サンプル中の関心対象変異体(つまりDNAまたはRNA)を検出できるハイブリダイゼ−ションを基本としたアッセイは、10、15、20または30〜100ヌクレオチド長、好ましくは10〜50ヌクレオチド長、より好ましくは40〜50ヌクレオチド長であるオリゴヌクレオチドを用いる。   Hybridization-based assays that can detect a variant of interest (ie, DNA or RNA) in a biological sample are 10, 15, 20, or 30-100 nucleotides long, preferably 10-50 nucleotides long, more preferably Oligonucleotides that are 40-50 nucleotides in length are used.

かくして、本発明の単離されたポリヌクレオチド(オリゴヌクレオチド)は、中程度から厳密なハイブリダイゼ−ション条件において、本明細書に記載の核酸配列のいずれかと好ましくハイブリダイゼ−ションする。   Thus, the isolated polynucleotides (oligonucleotides) of the present invention preferably hybridize with any of the nucleic acid sequences described herein under moderate to stringent hybridization conditions.

中程度から厳密なハイブリダイゼ−ション条件とは、10%硫酸デキストラン、1M NaCl、1%SDSおよび5×106cpmの32Pで標識されたプロ−ブを含有するようなハイブリダイゼ−ション溶液、0.2×SSCおよび0.1%SDSの最終洗浄溶液、ならびに65℃での最終洗浄を特徴とするが、一方中程度のハイブリダイゼ−ションは10%硫酸デキストラン、1M NaCl、1%SDSおよび5×106cpmの32Pで標識されたプロ−ブを含有するようなハイブリダイゼ−ション溶液を用いて65℃で実施し、1×SSCおよび0.1%SDSの最終洗浄溶液を持ちいて、50℃での最終洗浄を行う。 Moderate to stringent hybridization conditions include a hybridization solution containing 10% dextran sulfate, 1M NaCl, 1% SDS and 5 × 10 6 cpm of 32 P-labeled probe, 0.2 Features a final wash solution of xSSC and 0.1% SDS, and a final wash at 65 ° C., while moderate hybridization consists of 10% dextran sulfate, 1M NaCl, 1% SDS and 5 × 10 6 cpm. Perform at 65 ° C using a hybridization solution that contains a probe labeled with 32 P, with a final wash solution of 1x SSC and 0.1% SDS, and perform a final wash at 50 ° C. .

より一般的には、短い核酸(長さが200bp以下、例えば17〜40bp長)のハイブリダイゼ−ションは、以下の例示的ハイブリダイゼ−ションプロトコ−ルを用いて実施できるが、これは所望する厳密性に従って変更できる;(i)6×SSCおよび1%SDS、または3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDS、100μg/ml変性したサケの精子DNAおよび0.1%脱脂乾燥乳を含むハイブリダイゼ−ション溶液、Tmより1〜1.5℃低いハイブリダイゼ−ション温度、3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDSを含む、Tmより1〜1.5℃低い最終洗浄溶液;(ii) 6×SSCおよび0.1%SDS、または3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDS、100μg/ml変性したサケの精子DNAおよび0.1%脱脂乾燥乳を含むハイブリダイゼ−ション溶液、Tmより2〜2.5℃低いハイブリダイゼ−ション温度、Tmより1〜1.5℃低い3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDSを含む最終洗浄溶液、6×SSCの最終洗浄溶液、および22℃での最終洗浄;(iii) 6×SSCおよび1%SDS、または3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDS、100μg/ml変性したサケの精子DNAおよび0.1%脱脂乾燥乳を含むハイブリダイゼ−ション溶液、ハイブリダイゼ−ション温度。   More generally, hybridization of short nucleic acids (200 bp or less in length, eg, 17-40 bp in length) can be performed using the following exemplary hybridization protocol, which is as stringent as desired. (I) 6 × SSC and 1% SDS, or 3M TMACI, 0.01M sodium phosphate (pH 6.8), 1 mM EDTA (pH 7.6), 0.5% SDS, 100 μg / ml denatured salmon sperm Hybridization solution containing DNA and 0.1% non-fat dry milk, hybridization temperature 1-1.5 ° C. below Tm, 3M TMACI, 0.01M sodium phosphate (pH 6.8), 1 mM EDTA (pH 7.6), 0.5% Final wash solution 1-1.5 ° C. below Tm containing SDS; (ii) 6 × SSC and 0.1% SDS, or 3M TMACI, 0.01M sodium phosphate (pH 6.8), 1 mM EDTA (pH 7.6), 0.5 Hybridization solution containing% SDS, 100 μg / ml denatured salmon sperm DNA and 0.1% non-fat dry milk, 2 to 2.5 ° C lower than Tm Digestion temperature, 3M TMACI 1 ~ 1.5 ° C lower than Tm, 0.01M sodium phosphate (pH6.8), 1mM EDTA (pH7.6), final wash solution containing 0.5% SDS, 6xSSC final wash solution And (iii) 6 × SSC and 1% SDS, or 3M TMACI, 0.01M sodium phosphate (pH 6.8), 1 mM EDTA (pH 7.6), 0.5% SDS, 100 μg / ml Hybridization solution containing denatured salmon sperm DNA and 0.1% non-fat dry milk, hybridization temperature.

ハイブリダイゼ−ションした二重鎖の検出は、様々な方法で行うことができる。一般的には、ハイブリダイゼ−ションした二重鎖は、ハイブリダイゼ−ションしていない核酸から分離され、次に二重鎖に結合した標識物が検出される。このような標識物は放射活性物、蛍光、生物学的または酵素学的タグ、あるいは当技術分野で標準的な標識物である。標識物は、オリゴヌクレオチドプロ−ブまたは生物サンプル由来の核酸のいずれかに結合できる。   The detection of the hybridized duplex can be performed by various methods. In general, the hybridized duplex is separated from non-hybridized nucleic acid, and then the label bound to the duplex is detected. Such labels are radioactive, fluorescent, biological or enzymological tags or standard labels in the art. The label can be bound to either an oligonucleotide probe or a nucleic acid from a biological sample.

プロ−ブは、様々な周知の方法によって標識できる。放射活性標識物の非限定例としては、3H、14C、32Pおよび35Sが挙げられる。検出可能なマ−カ−の非限定例としては、リガンド、蛍光団、化学発光剤、酵素および抗体が挙げられる。プロ−ブとの使用に適した、発明の方法の感度を上げることができる、その他検出可能なマ−カ−としては、ビオチンおよび放射性ヌクレオチドが挙げられる。特定の標識物を選択することで、それをプロ−ブに結合させる様式が指定されることが、当業者に明らかになるだろう。   The probe can be labeled by a variety of well-known methods. Non-limiting examples of radioactive labels include 3H, 14C, 32P and 35S. Non-limiting examples of detectable markers include ligands, fluorophores, chemiluminescent agents, enzymes and antibodies. Other detectable markers suitable for use with the probe that can increase the sensitivity of the inventive methods include biotin and radioactive nucleotides. It will be apparent to those skilled in the art that selecting a particular label specifies the manner in which it is bound to the probe.

例えば、本発明のオリゴヌクレオチドは、合成に続いて、ビオチン化dNTPまたはrNTP、あるいはいくつかの同様の手段(例えばRNAへのビオチンのソラレン誘導体の比較架橋結合)を取り込ませ、次に標識されたストレプトアビジン(例えばフィコエリスリン標識ストレプトアビジン)または均等物を添加することによって標識できる。または、蛍光標識されたオリゴヌクレオチドプロ−ブを使用する場合は、オリゴヌクレオチドへはフルオロセイン、リサミン、フィコエリスリン、ロ−ダミン(Perkin Elmer Cetus)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、FluorX(Amersham)およびその他[例えばKricka et al. (1992), Academic Press San Diego, Calif]が結合できる。   For example, the oligonucleotides of the present invention can be incorporated following biosynthesis with biotinylated dNTP or rNTP, or some similar means (eg, comparative cross-linking of a psoralen derivative of biotin to RNA) and then labeled. It can be labeled by adding streptavidin (eg phycoerythrin labeled streptavidin) or equivalent. Or, when using fluorescently labeled oligonucleotide probes, the oligonucleotides include fluorescein, lysamine, phycoerythrin, rhodamine (Perkin Elmer Cetus), Cy2, Cy3, Cy3.5, Cy5, Cy5 .5, Cy7, FluorX (Amersham) and others [eg Kricka et al. (1992), Academic Press San Diego, Calif] can bind.

当業者は、洗浄段階を用いて過剰な標的DNAまたはプロ−ブだけでなく未結合の標識物も洗い流せることに気づくだろう。さらに、ハイブリッドの検出には、オリゴヌクレオチドプライマ−およびプロ−ブ上に存在する標識物を用いた標準的なヘテロジ−ニアスアッセイ形式が適している。   One skilled in the art will recognize that the wash step can be used to wash away unbound label as well as excess target DNA or probe. In addition, standard heterogeneous assay formats using oligonucleotides and labels present on the probes are suitable for hybrid detection.

ハイブリダイゼ−ションアッセイの正確性を改善するために、様々なコントロ−ルが有益に使用できることが認められる。例えば、サンプルを無関係なプロ−ブとハイブリダイゼ−ションさせ、ハイブリダイゼ−ション前にRNAse Aで処理して偽のハイブリダイゼ−ションを評価してもよい。   It will be appreciated that various controls can be beneficially used to improve the accuracy of the hybridization assay. For example, the sample may be hybridized with an irrelevant probe and treated with RNAse A prior to hybridization to evaluate false hybridization.

本発明は特定の核酸配列の検出について、標識物の使用に特異的に依存するものではないが、このような標識物は、検出感度を上げることから有益であろう。さらに、それは自動化を可能にする。プロ−ブは様々な周知の方法に従い標識できる。   Although the present invention does not depend specifically on the use of a label for the detection of a particular nucleic acid sequence, such a label would be beneficial because it increases detection sensitivity. In addition, it allows automation. The probe can be labeled according to various well-known methods.

公知の如く、放射活性ヌクレオチドは発明のプロ−ブ内に、いくつかの方法により組み入れることができる。放射活性標識物の非限定例としては、3H、14C、32Pおよび35Sが挙げられる。 As is known, radioactive nucleotides can be incorporated into the probes of the invention in several ways. Non-limiting examples of radioactive labels include 3 H, 14 C, 32 P and 35 S.

洗浄段階を用いて過剰な標的DNAまたはプロ−ブだけでなく未結合の標識物も洗い流せることを当業者は理解するであろう。さらに、ハイブリッドの検出には、オリゴヌクレオチドプライマ−およびプロ−ブ上に存在する標識物を用いた標準的なヘテロジ−ニアスアッセイ形式が適している。   One skilled in the art will appreciate that the wash step can be used to wash away unbound label as well as excess target DNA or probe. In addition, standard heterogeneous assay formats using oligonucleotides and labels present on the probes are suitable for hybrid detection.

ハイブリダイゼ−ションアッセイの正確性を改善するために、様々なコントロ−ルが有益に使用できることが認められるだろう。   It will be appreciated that a variety of controls can be beneficially used to improve the accuracy of hybridization assays.

発明のプロ−ブは、天然産の糖−リン酸主鎖に加えて、ホスホロチオエ−ト、ジチオネ−ト、アルキルホスホネ−トおよび非ヌクレオチド等を含む修飾された主鎖と共に用いることができる。発明のプロ−ブは、リボ核酸(RNA)またはデオキシリボ核酸(DNA)から構築できるが、DNAが好ましい。   The probes of the invention can be used with modified backbones including phosphorothioates, dithionates, alkyl phosphonates and non-nucleotides in addition to the naturally occurring sugar-phosphate backbone. The probe of the invention can be constructed from ribonucleic acid (RNA) or deoxyribonucleic acid (DNA), with DNA being preferred.

NATアッセイ
生物サンプル中の関心対象核酸の検出は、例えばPCR(または、例えば、リアルタイムPCRのようなその変形)のような核酸増幅技術を包含する、NATアッセイによっても選択的に実施できる。
NAT Assay Detection of a nucleic acid of interest in a biological sample can also be selectively performed by a NAT assay, including, for example, nucleic acid amplification techniques such as PCR (or variations thereof such as, for example, real-time PCR).

本明細書で用いる場合、「プライマ−」は標的配列にアニ−リング(ハイブリダイゼ−ション)できるオリゴヌクレオチドを規定し、これにより好適条件下でのDNA合成の開始点となることができる二本鎖領域を創り出す。   As used herein, a “primer” defines an oligonucleotide that can be annealed (hybridized) to a target sequence, thereby being a double stranded that can serve as a starting point for DNA synthesis under suitable conditions. Create an area.

選択された、または標的の核酸配列の増幅は、様々な好適な方法によって実施できる。一般的には、Kwoh et al., 1990、Am. Biotechnol. Lab. 8:14を参照せよ。様々な増幅技術が記載されており、また当業者の特別な需要に合うように容易に適合できる。増幅技術の非限定例としては、ポリメラ−ゼチェインリアクション(PCR)、リガ−ゼチェインリアクション(LCR)、ストランドディスプレイスメント増幅(strand displacement amplification:SDA)、転写をベ−スとした増幅、q3レプリカ−ゼシステムおよびNASBAが挙げられる(Kwoh et al., Proc. Natl. Acad. Sci. USA 86, 1173−1177; Lizardi et al., 1988, BioTechnology 6:1197−1202; Malek et al., 1994, Methods Mol. Biol., 28:253−260;およびSambrook et al., 1989、上記)。   Amplification of the selected or target nucleic acid sequence can be performed by a variety of suitable methods. See generally Kwoh et al., 1990, Am. Biotechnol. Lab. 8:14. Various amplification techniques have been described and can be readily adapted to meet the special needs of those skilled in the art. Non-limiting examples of amplification techniques include polymerase chain reaction (PCR), ligase chain reaction (LCR), strand displacement amplification (SDA), transcription-based amplification, q3 replicas -Zesystem and NASBA (Kwoh et al., Proc. Natl. Acad. Sci. USA 86, 1173-1177; Lizardi et al., 1988, BioTechnology 6: 1197-1202; Malek et al., 1994, Methods Mol. Biol., 28: 253-260; and Sambrook et al., 1989, supra).

用語「増幅ペア−」(または「プライマ−ペア−」)は、本明細書では、数多くある増幅プロセスの型の一つによって、選択した核酸配列の増幅、好ましくはポリメラ−ゼチェインリアクションと共に使用するために選択された、本発明のオリゴヌクレオチド(オリゴ)の対を指す。別のタイプの増幅プロセスとしては、以下詳しく説明するようなリガ−ゼチェインリアクション、ストランドディスプレイスメント増幅、または核酸配列をベ−スとした増幅が挙げられる。当技術分野で公知なように、オリゴは選択した条件にて相補的配列に結合できるように設計されている。   The term “amplification pair” (or “primer pair”) is used herein with amplification of a selected nucleic acid sequence, preferably with a polymerase chain reaction, by one of a number of types of amplification processes. Refers to a pair of oligonucleotides (oligos) of the present invention, selected for. Another type of amplification process includes ligase chain reaction, strand displacement amplification, or nucleic acid sequence-based amplification as described in detail below. As is known in the art, oligos are designed to bind to complementary sequences under selected conditions.

一つの特別な態様では、患者由来の核酸サンプルの増幅は、最も多く特異的に発現している核酸の増幅に有利である条件の下で行われる。一つの好ましい態様では、RT−PCRは、最も多いmRNAの増幅に有利な条件の下で患者由来のmRNAサンプルについて行われる。別の好ましい態様では、特異的に発現している複数の核酸の増幅が同時に行われる。当業者は、このような方法が特異的に発現している核酸配列に代わって、特異的に発現しているタンパク質の検出に適合できることに気づくだろう。   In one particular embodiment, the amplification of the nucleic acid sample from the patient is performed under conditions that favor the amplification of the most specifically expressed nucleic acid. In one preferred embodiment, RT-PCR is performed on patient-derived mRNA samples under conditions that favor amplification of the most mRNA. In another preferred embodiment, amplification of a plurality of specifically expressed nucleic acids is performed simultaneously. One skilled in the art will realize that such methods can be adapted to detect specifically expressed proteins instead of specifically expressed nucleic acid sequences.

本発明を実施するための核酸(即ちDNAまたはRNA)は、周知の方法によって得られる。   Nucleic acids (ie DNA or RNA) for practicing the present invention are obtained by well-known methods.

本発明のオリゴヌクレオチドプライマ−は、具体的なアッセイ形式および具体的ニ−ズおよび用いる標的とする遺伝子に応じて、いずれの好適な長さでもよい。任意には、オリゴヌクレオチドプライマ−は少なくとも12ヌクレオチド長、好ましくは15〜24ヌクレオチド長であり、またそれらは選択した核酸増幅システムに特に有利になるように合わせることができる。当技術分野で周知なように、オリゴヌクレオチドプライマ−は、その標的とする配列とそれとのハイブリダイゼ−ションの融解点を考慮して設計できる(Sambrook et al., 1989, Molecular Cloning −A Laboratory Manual, 2nd Edition, CSH Laboratories;Ausubel et al., 1989, in Current Protocols in Molecular Biology, John Wiley & Sons Inc., N.Y.)。   The oligonucleotide primers of the present invention may be of any suitable length depending on the specific assay format and specific needs and the target gene used. Optionally, the oligonucleotide primers are at least 12 nucleotides in length, preferably 15-24 nucleotides in length, and they can be tailored to be particularly advantageous for the selected nucleic acid amplification system. As is well known in the art, an oligonucleotide primer can be designed taking into account its target sequence and the melting point of its hybridization (Sambrook et al., 1989, Molecular Cloning-A Laboratory Manual, 2nd Edition, CSH Laboratories; Ausubel et al., 1989, in Current Protocols in Molecular Biology, John Wiley & Sons Inc., NY).

アンチセンスオリゴヌクレオチドを用いて、関心対象のスプライシングイソ型の発現
を定量するこができる。このような検出は、プレmRNAレベルで実施される。本質的には、関心対象のスプライシング部位からの転写を定量化する能力は、スプライシング部位へのアクセス能力に基づき達成できる。オリゴヌクレオチドは、スプライシング部位の配列について、スプライシング因子と競合するだろう。かくして低活性のアンチセンスオリゴヌクレオチドはスプライシング活性の指標となる。
Antisense oligonucleotides can be used to quantify the expression of the splicing isoform of interest. Such detection is performed at the pre-mRNA level. In essence, the ability to quantify transcription from a splicing site of interest can be achieved based on the ability to access the splicing site. The oligonucleotide will compete with the splicing factor for the sequence of the splicing site. Thus, low activity antisense oligonucleotides are indicative of splicing activity.

ポリメラ−ゼチェインリアクションおよびその他核酸増幅反応は、当技術分野で周知である(これら反応の様々な非限定例は、以下で詳しく説明される)。本発明のこの局面によるオリゴヌクレオチドのペア−は、相適合する溶解温度(Tm)をもつように選択するのが好ましく、例えば溶解温度の差は7℃未満、好ましくは5℃未満、より好ましくは4℃未満、最も好ましくは3℃未満であり、理想的には3℃〜0℃の間である。   Polymerase chain reactions and other nucleic acid amplification reactions are well known in the art (various non-limiting examples of these reactions are described in detail below). The oligonucleotide pairs according to this aspect of the invention are preferably selected to have compatible melting temperatures (Tm), for example, the difference in melting temperatures is less than 7 ° C, preferably less than 5 ° C, more preferably Less than 4 ° C, most preferably less than 3 ° C, ideally between 3 ° C and 0 ° C.

ポリメラ−ゼチェインリアクション(PCR):ポリメラ−ゼチェインリアクション(PCR)は、MullisおよびMullisらに付与された米国特許第4,683,195号および第4,683,202号に記載されているように、クロ−ニングまたは精製することなくゲノムDNAの混合物中にある標的配列のセグメントの濃度を増加させる方法である。この技術は、低濃度の標的配列の問題に対する一つの方法を提供している。PCRを用いて、標的濃度を容易に検知できるレベルまで直接増加させることができる。標的配列を増幅するためのこのプロセスは、所望の標的配列を含有するDNA混合物に、二本鎖標的配列のそれぞれの鎖に対し相補的である二種類のオリゴヌクレオチドプライマ−を過剰モル加えることを含む。混合物を変性し、次にハイブリダイゼ−ションさせる。ハイブリダイゼ−ション後、ポリメラ−ゼを用いてプライマ−を伸長させて相補鎖を形成する。変性、ハイブリダイゼ−ション(アニ−リング)およびポリメラ−ゼ伸長(伸長)の段階は、比較的高濃度の所望標的配列のセグメントを得るために必要な回数繰り返すことができる。   Polymerase chain reaction (PCR): Polymerase chain reaction (PCR) is cloned or purified as described in US Pat. Nos. 4,683,195 and 4,683,202 to Mullis and Mullis et al. Without increasing the concentration of segments of the target sequence in the genomic DNA mixture. This technique provides one method for the problem of low concentrations of target sequences. Using PCR, the target concentration can be increased directly to a level where it can be easily detected. This process for amplifying the target sequence involves adding a molar excess of two oligonucleotide primers that are complementary to each strand of the double-stranded target sequence to the DNA mixture containing the desired target sequence. Including. The mixture is denatured and then allowed to hybridize. After hybridization, the primer is extended using polymerase to form a complementary strand. The steps of denaturation, hybridization (annealing) and polymerase extension (elongation) can be repeated as many times as necessary to obtain a relatively high concentration of segments of the desired target sequence.

所望標的配列のセグメントの長さは、プライマ−の互いの相対位置によって決まり、従ってその長さは制御可能なパラメ−タである。混合物中において標的配列の所望セグメントが優勢(濃度の観点において)な配列となることから、それらは「PCR増幅」されたと呼ばれる。   The length of the segment of the desired target sequence is determined by the relative positions of the primers relative to each other, so that the length is a controllable parameter. They are called “PCR amplified” because the desired segments of the target sequence in the mixture become the dominant (in terms of concentration) sequences.

リガ−ゼチェインリアクション(LCRまたはLAR):リガ−ゼチェインリアクション[LCR;「リガ−ゼ増幅反応」(LAR)と呼ばれることもある]は、核酸を増幅するよく知られた代替法として開発された。LCRでは、四種類のオリゴヌクレオチド、即ち標的DNAの一方の鎖に固有にハイブリダイゼ−ションする近接する二種類のオリゴヌクレオチド、および反対側の鎖にハイブリダイゼ−ションする近接するオリゴヌクレオチドの相補的なセットが混合され、そしてこの混合物にDNAリガ−ゼが加えられる。連結部に完全な相補性がある場合は、リガ−ゼがハイブリダイゼ−ションした分子の各セットを共有結合する。重要なことは、LCRでは二種類のプロ−ブは、それらが標的サンプル中の配列と、ギャップまたはミスマッチなしに塩基対を形成したときだけ一つに連結されることである。変性および連結のサイクルを反復すると、短いDNAリガ−ゼがこの混合物セグメントが増幅される。LCRをPCRと組み合わせて用い、単一円形の変化の検出を高めることもできる:例えばSegev, PCT出願第WO9001069 A1号(1990)を参照せよ。しかしながら、このアッセイで用いる四種類のオリゴヌクレオチドは、対合して短い連結可能なセグメントを形成することから、標的に依存しないバックグランドシグナルを生じる可能性がある。突然変異体スクリ−ニングへのLCRの使用は、特異的な核酸位置の検査に限定される。   Ligase chain reaction (LCR or LAR): Ligase chain reaction [LCR; sometimes referred to as “ligase amplification reaction” (LAR)] was developed as a well-known alternative to amplifying nucleic acids. It was. In LCR, a complementary set of four oligonucleotides, two adjacent oligonucleotides that hybridize specifically to one strand of the target DNA, and adjacent oligonucleotides that hybridize to the opposite strand. Are mixed and DNA ligase is added to the mixture. If the junction is perfectly complementary, each set of molecules hybridized by the ligase is covalently linked. Importantly, in LCR, the two probes are linked together only when they form a base pair with a sequence in the target sample without gaps or mismatches. Upon repeated cycles of denaturation and ligation, short DNA ligases amplify this mixture segment. LCR can also be used in combination with PCR to enhance the detection of single circular changes: see, eg, Segev, PCT Application No. WO9001069 A1 (1990). However, the four types of oligonucleotides used in this assay can generate a target-independent background signal because they combine to form a short ligable segment. The use of LCR for mutant screening is limited to the examination of specific nucleic acid positions.

自立的配列増幅反応(self−sustained sequence replication reaction:3SR/NASBA)は、一定温度においてRNA配列を対数的に増幅できる、転写を基本とするインビトロの増幅システムである。増幅したRNAは次に突然変異体検出に利用できる。この方法では、オリゴヌクレオチドプライマ−を用いて、関心対象配列の5'末端に付ファ−ジRNAポリメラ−ゼプロモ−タを加する。酵素と、二次プライマ−、逆転写酵素、RNaseH、RNAポリメラ−ゼおよびリボ−およびデオキシリボヌクレオシド3リン酸を含む基質とのカクテルの中で、標的配列は、転写、cDNA合成および第二鎖合成のサイクルを繰り返して関心対象域を増幅する。突然変異体検出への3SRの使用は、動態的に、小型のDNAセグメントのスクリ−ニングに限定される(例えば200〜300塩基対)。   The self-sustained sequence replication reaction (3SR / NASBA) is an in vitro amplification system based on transcription that can amplify RNA sequences logarithmically at a constant temperature. The amplified RNA can then be used for mutant detection. In this method, an oligonucleotide primer is used to add a fuzzy RNA polymerase promoter to the 5 'end of the sequence of interest. In a cocktail of enzymes and substrates containing secondary primers, reverse transcriptase, RNaseH, RNA polymerase and ribo- and deoxyribonucleoside triphosphates, the target sequence is transcription, cDNA synthesis and second strand synthesis. Repeat the cycle to amplify the region of interest. The use of 3SR for mutant detection is kinetically limited to the screening of small DNA segments (eg 200-300 base pairs).

Q−ベ−タ(Qβ)レプリカ−ゼ:この方法では、関心対象の配列を認識するプロ−ブは、Qβレプリカ−ゼにとって複製可能なRNA鋳型に取り付けられる。これまでに見つかっている、ハイブリダイゼ−ションしていないプロ−ブが複製することで生ずる偽陽性に伴う大きな問題は、配列特異的な連結段階を利用することによって対処されてきた。しかしながら、利用可能な熱安定的DNAリガ−ゼは、このRNA基質には有効ではなく、その結果T4DNAリガ−ゼを使って低温(37℃)で連結しなければならない。このことがLCRの場合のように特異性を獲得する手段として高い温度を使用できなくしており、連結は接合部の突然変異検出に使用できるが、その他の場所には用いることができない。   Q-beta (Qβ) replicase: In this method, a probe that recognizes the sequence of interest is attached to an RNA template that is replicable for Qβ replicase. The major problems associated with false positives that arise from replicating unhybridized probes that have been found so far have been addressed by utilizing sequence-specific ligation steps. However, available thermostable DNA ligases are not effective for this RNA substrate and must therefore be ligated at low temperature (37 ° C.) using T4 DNA ligase. This makes it impossible to use high temperatures as a means of obtaining specificity, as in LCR, and ligation can be used to detect mutations at the junction, but not elsewhere.

成功した診断方法は、極めて特異的でなければならない。核酸ハイブリダイゼ−ションを制御する直接的な方法は、反応の温度を制御するものである。3SR/NASBAおよびQβシステムはいずれも大量のシグナルを作り出すことができるが、それぞれに関係する一つまたは複数の酵素が高温(即ち>55℃)で使用できない。それゆえに反応温度を上げてプロ−ブの非特異的ハイブリダイゼ−ションを防ぐことはできない。プロ−ブが低温でより溶解しやすいようにするためにプロ−ブを短くすると、複合体ゲノム中で一つより多いものが完全に一致する確率が高くなる。これらの理由より、現在、検出技術の研究分野ではPCRおよびLCRが主流となっている。   A successful diagnostic method must be very specific. A direct method of controlling nucleic acid hybridization is to control the temperature of the reaction. Both 3SR / NASBA and Qβ systems can produce large amounts of signal, but one or more enzymes associated with each cannot be used at high temperatures (ie,> 55 ° C.). Therefore, the reaction temperature cannot be raised to prevent non-specific hybridization of the probe. Shortening the probe to make it more soluble at low temperatures increases the probability that more than one of the complex genomes will be perfectly matched. For these reasons, PCR and LCR are currently mainstream in the research field of detection technology.

PCRおよびLCRでの増幅法の基礎は、1サイクルの産物が続く全てのサイクルにおいて鋳型として使用できるようになり、その結果サイクル毎に二倍になるという事実である。このような倍増システムの最終的収量は:(1+X)n=yとして表すことができ、このとき「X」は平均効率(サイクル毎にコピ−されるパ−セント)、「n」はサイクル数であり、そして「y」は全体の効率、または反応の効率である。標的DNAの全てのコピ−がポリメラ−ゼチェインリアクションの全サイクルで鋳型として利用されるとした場合には、平均効率は100%である。20サイクルのPCRを実施したとすると、収量は出発材料の220または1,048,576コピ−となる。反応条件により効率が85%に低下した場合は、同じ20サイクルの収量は、出発材料のわずかに1.8520または220,513コピ−となるだろう。言い換えると、85%の効率で行ったPCRは、効率100%で行った反応に比べ最終産物の量がわずか21%にしかならない。平均効率が50%にまで低下した反応は、可能な産物の1%未満にしかならない。 The basis of the PCR and LCR amplification methods is the fact that one cycle of product can be used as a template in all subsequent cycles, resulting in a doubling every cycle. The final yield of such a doubling system can be expressed as: (1 + X) n = y, where “X” is the average efficiency (percent copied every cycle) and “n” is Is the number of cycles, and “y” is the overall efficiency, or the efficiency of the reaction. If all copies of the target DNA are used as templates in the entire cycle of the polymerase chain reaction, the average efficiency is 100%. When was performed 20 cycles of PCR, yield is 2 20 or 1,048,576 copies of the starting material - to become. If the efficiency has dropped to 85% due to the reaction conditions, the yield of the same 20 cycles, slightly 1.85 20 or 220,513 copies of the starting material - as will become. In other words, PCR performed at 85% efficiency yields only 21% final product compared to a reaction performed at 100% efficiency. A reaction with an average efficiency reduced to 50% is less than 1% of the possible products.

実際には、通常のポリメラ−ゼチェインリアクションが理論的な最大収量を得ることは稀であり、PCRは通常20サイクルを超えて行われ、低い収量を補償している。平均効率が50%の場合、34サイクル行うことで、理論的には20回で可能となる百万倍の増幅が達成されるが、これより効率が低い場合、必要となるサイクル数は極めて多くなる。これに加え、目的とする標的より高い平均効率で増幅されるバックグランド産物が主要な産物になる。   In practice, normal polymerase chain reaction rarely yields a theoretical maximum yield, and PCR is usually performed over 20 cycles to compensate for the low yield. If the average efficiency is 50%, performing 34 cycles will achieve a million times amplification theoretically possible with 20 cycles, but if the efficiency is lower than this, the number of cycles required is extremely large. Become. In addition, the main product is a background product that is amplified with higher average efficiency than the target of interest.

また、一部の例を挙げると、標的DNAの長さおよび二次構造、プライマ−の長さと設計、プライマ−およびdNTPの濃度、ならびにバッファ−組成を含む多くの変動因子がPCRの平均効率に影響することがある。外因性DNA(例えば研究所表面にこぼれたDNA)による反応液汚染または交叉汚染もまた重大な考慮事象である。反応条件は、プライマ−ペア−および標的配列毎に注意深く最適化しなければならず、そしてその作業には、経験を積んだ研究者でも数日間かかることがある。多くの技術的検討および他の要素を含めた作業の手間が、臨床現場でのPCRの使用にとって大きな欠点となっている。実際、PCRはまだ臨床市場に明瞭な形で浸透していない。LCRでも同様の問題があり、LCRもまた標的配列毎に、異なるオリゴヌクレオチド配列を使用するために最適化を行わなければならない。これに加え、両方法とも、正確な温度サイクリングができる高価な装置を必要とする。   Also, to name a few, many variables, including target DNA length and secondary structure, primer length and design, primer and dNTP concentrations, and buffer composition contribute to the average PCR efficiency. May affect. Reaction solution contamination or cross contamination with exogenous DNA (eg DNA spilled on the laboratory surface) is also a significant consideration. Reaction conditions must be carefully optimized for each primer pair and target sequence, and the work can take several days even for experienced researchers. The labor involved, including many technical considerations and other factors, has become a major drawback for the use of PCR in clinical settings. In fact, PCR has not yet penetrated the clinical market in a clear way. There is a similar problem with LCR, and LCR must also be optimized to use different oligonucleotide sequences for each target sequence. In addition, both methods require expensive equipment capable of accurate temperature cycling.

対立遺伝子変異体の研究といった核酸検出技術の多くの応用では、複雑なバックグランドの中にある特定配列を検出するだけでなく、僅かな、または単一のヌクレオチドの違いを持つ配列を識別することが必要である。PCRによる対立遺伝子特異的変異体を検出する一つの方法は、鋳型鎖とプライマ−の3'末端にミスマッチがある場合、Taqポリメラ−ゼはDNA鎖を合成することが難しいという事実に基づいている。対立遺伝子特異的変異体は、想定される対立遺伝子の一つとのみ完全に一致するプライマ−を用いて検出できるだろう:他の対立遺伝子とのミスマッチによりプライマ−伸長は阻止され、それによってその配列の増幅が阻止される。この方法には、ミスマッチの塩基組成がミスマッチを超えた伸長を阻止する能力に影響し、そしてある種のミスマッチは伸長を阻止しないか、最小の効果しかないという本質的な限界がある。   Many applications of nucleic acid detection techniques, such as allelic variant studies, not only detect specific sequences within a complex background, but also identify sequences with minor or single nucleotide differences. is required. One method of detecting allele-specific variants by PCR is based on the fact that Taq polymerase is difficult to synthesize DNA strands if there is a mismatch between the template strand and the 3 'end of the primer. . Allele-specific variants may be detected using a primer that perfectly matches only one of the supposed alleles: mismatches with other alleles prevent primer extension and thereby the sequence Amplification is prevented. This method has the inherent limitation that the base composition of the mismatch affects the ability to prevent extension beyond the mismatch and that certain mismatches do not prevent extension or have minimal effect.

LCRでは、同様の3'ミスマッチの方策を用いるとより効果的に連結が阻止できる。いずれのミスマッチも、熱安定型リガ−ゼの作用を効果的に阻止するが、それでなおLCRには標的に依存した、増幅を開始するバックグランド連結産生物という欠点がある。さらにまた、PCRに続けてLCRを組み合わせ個々の位置にあるヌクレオチドを特定することは、臨床検査にとっては明らかに煩雑な作業である。   In LCR, the same 3 'mismatch strategy can be used to prevent ligation more effectively. Both mismatches effectively block the action of thermostable ligase, yet LCR still has the disadvantage of a background-linked product that initiates amplification, depending on the target. Furthermore, combining PCR with LCR to identify nucleotides at individual positions is clearly a cumbersome task for clinical testing.

本発明の各種好ましい態様による直接検出法としては、例えばサイクリングプロ−ブ反応(CPR)または分枝DNA分析がある。   Direct detection methods according to various preferred embodiments of the present invention include, for example, cycling probe reaction (CPR) or branched DNA analysis.

検出対象の核酸が十分量入手できる場合には、その標的のコピ−を多数作る代わりに(例えばPCRやLCRでのように)、その配列を直接検出できるという利点がある。最も注目すべきは、シグナルを対数的に増幅しない方法は、定量分析により適していることである。単一のオリゴヌクレオチドに複数の色素を取り付けることによってシグナルを増強した場合でも、最終のシグナル強度と標的量とは直接相関する。このようなシステムには、反応産物それ自体が反応を促進せず、従って研究室表面が産物によって汚染されることがそれほど危惧されないという利点もある。最近開発された技術は、放射活性の使用を排除し、同時に/または自動化形式での感度を向上させることを目指している。「サイクリングプロ−ブ反応」(CPR)および「分枝DNA」(bDNA)はその二つの例である。   If a sufficient amount of the nucleic acid to be detected is available, there is an advantage that the sequence can be directly detected instead of making many copies of the target (for example, in PCR or LCR). Most notably, methods that do not amplify the signal logarithmically are more suitable for quantitative analysis. Even when the signal is enhanced by attaching multiple dyes to a single oligonucleotide, the final signal intensity and the target amount are directly correlated. Such a system also has the advantage that the reaction product itself does not promote the reaction, and therefore the laboratory surface is less susceptible to contamination by the product. Recently developed technologies aim to eliminate the use of radioactivity and at the same time improve sensitivity in an automated format. “Cycling probe reaction” (CPR) and “branched DNA” (bDNA) are two examples.

サイクリングプロ−ブ反応(CPR):サイクリングプロ−ブ反応(CPR)は、その中の中央部はRNAで出来ており、一方両端部はDNAで出来ている長いキメラオリゴヌクレオチドである。標的DNAへのプロ−ブのハイブリダイゼ−ションおよび熱安定型RNase Hへの暴露により、RNA部分が消化される。これにより残った二重鎖DNA部分は不安定化し、標的DNAからプロ−ブの残りが放出されて別のプロ−ブ分枝がこのプロセスを繰り返すことができる。開裂したプロ−ブ分枝の形をしたシグナルは、直線的に蓄積する。プロセスの反復によりシグナルは増加するが、サンプル調製通して、オリゴヌクレオチドのRNA部分がRNaseの攻撃をうけやすい。   Cycling probe reaction (CPR): Cycling probe reaction (CPR) is a long chimeric oligonucleotide made of RNA at the center while DNA is made at both ends. Hybridization of the probe to the target DNA and exposure to thermostable RNase H digests the RNA portion. This destabilizes the remaining double-stranded DNA portion, releasing the remainder of the probe from the target DNA and allowing another probe branch to repeat this process. Signals in the form of cleaved probe branches accumulate linearly. Although the signal increases with repeated processes, the RNA portion of the oligonucleotide is susceptible to RNase attack throughout sample preparation.

分枝DNA:分枝DNA(bDNA)は、それぞれのオリゴヌクレオチドが35〜40個の標識物(例えばアルカリホスファタ−ゼ酵素)を担持できる分岐構造を持つオリゴヌクレオチドを包含する。これがハイブリダイゼ−ションからのシグナルは増強するが、非特異的結合のシグナルも同様に増加する。   Branched DNA: Branched DNA (bDNA) includes oligonucleotides having a branched structure in which each oligonucleotide can carry 35 to 40 labels (for example, alkaline phosphatase enzyme). This enhances the signal from hybridization, but increases the signal of non-specific binding as well.

本発明の各種好ましい態様による、少なくとも一つの配列変化の検出は、例えば、制限断片長多形(RFLP分析)、対立遺伝子特的オリゴヌクレオチド(ASO)分析、変性/温度勾配ゲル電気泳動(DGGE/TGGE)、単鎖立体構造多形(SSCP)分析またはジデオキシフィンガ−プリンティング(ddF)によって達成できる。   Detection of at least one sequence change according to various preferred embodiments of the present invention includes, for example, restriction fragment length polymorphism (RFLP analysis), allele specific oligonucleotide (ASO) analysis, denaturation / temperature gradient gel electrophoresis (DGGE / TGGE), single chain conformational polymorphism (SSCP) analysis or dideoxyfinger-printing (ddF).

臨床診断において、特異的な核酸配列および配列の変化を検出可能な検査に対する需要が急速に高まっている。ヒトおよび病原菌の遺伝子に関する核酸配列のデ−タが集まりつつあることから、特定配列内の突然変異に関する、迅速で経済的、そして使い易い検査への需要が急激に増している。   In clinical diagnostics, there is a rapidly increasing demand for specific nucleic acid sequences and tests that can detect sequence changes. As nucleic acid sequence data is gathering for human and pathogenic genes, the demand for rapid, economical, and easy-to-use tests for mutations within specific sequences is increasing rapidly.

突然変異について核酸セグメントをスキャニングする少数の方法が考案されている。一つの意見は、各試験サンプル(例えば細菌分離株)について遺伝子配列全体を決定するというものである。約600ヌクレオチド以下の配列については、この方法は増幅された材料(例えばPCR反応産物)を用いて達成できる。この方法は関心対象のセグメントのクロ−ニングに伴う時間と経費を排除する。しかしながら、特殊な装置と高度に訓練された要員が必要であり、また方法は臨床現場で実施し効果を上げるには、労力と経費がかかりすぎる。   A few methods have been devised to scan nucleic acid segments for mutations. One opinion is to determine the entire gene sequence for each test sample (eg, bacterial isolate). For sequences of about 600 nucleotides or less, this method can be accomplished using amplified material (eg, PCR reaction products). This method eliminates the time and expense associated with cloning the segment of interest. However, special equipment and highly trained personnel are required, and the method is too labor intensive and expensive to implement and be effective in the clinical setting.

シ−クエンス決定に伴う困難という観点では、核酸のあるセグメントは幾つかの別の方法でも特徴付けできる。最も解像度の低い場合、分子のサイズは同一ゲルにかけた既知標準体と比較することで、電気泳動によって決定できる。より詳しい分子像は、電気泳動前に制限酵素の組合せにより開裂を行うことで達成でき、順序付けされたマップを作ることができる。断片内の特別な配列の存在は、標識プロ−ブのハイブリダイゼ−ションによって検出でき、あるいは正確なヌクレオチド配列を部分的な化学的分解または鎖終止ヌクレオチド類似体存在下にプライマ−伸長することによって決定することができる。   In view of the difficulties associated with sequencing, certain segments of nucleic acids can be characterized in several different ways. In the lowest resolution case, the size of the molecule can be determined by electrophoresis by comparison with a known standard run on the same gel. A more detailed molecular image can be achieved by cleaving with a combination of restriction enzymes prior to electrophoresis, and an ordered map can be created. The presence of a special sequence within the fragment can be detected by hybridization of a labeled probe, or determined by primer extension in the presence of partial chemical degradation or chain terminating nucleotide analogs of the exact nucleotide sequence. can do.

制限断片長多形(RFLP):類似配列間の単一塩基の違いを検出するには、最高レベルの解像度の分析が必要になることが多い。問題のヌクレオチドの位置が既に分かっている場合には、直接配列を決定せずに単一の塩基の変化を検証するための方法が幾つか開発されている。例えば、関心対象の突然変異が制限認識配列内に生じた場合は、消化パタ−ンの変化を診断手段として用いることができる(例えば制限断片長多形[RFLP]分析)。   Restriction fragment length polymorphism (RFLP): The highest resolution analysis is often required to detect single base differences between similar sequences. Several methods have been developed to verify single base changes without directly sequencing when the position of the nucleotide in question is already known. For example, if the mutation of interest occurs in a restriction recognition sequence, a change in digestion pattern can be used as a diagnostic tool (eg, restriction fragment length polymorphism [RFLP] analysis).

単一点突然変異はまた、RFLPを作り出すこと、または破壊することによっても検出できる。突然変異は、ミスマッチ部分を開裂することによって生ずるRNA断片の存在およびサイズによって検出され、また位置が決められる。DNAヘテロ二重鎖中の単一のヌクレオチドミスマッチはまた幾つかの化学薬品によって認識および開裂され、一般的に「ミスマッチケミカル開裂(Mismatch Chemial Cleavage)(MCC)と呼ばれる単一塩基置換を検出するための別の方法を提供している。 しかしながら、この方法は臨床検査での使用にとって不向きな二種類の強い毒性を持つ化学薬品、四酸化オスミウムおよびピペリジンを必要とする。   Single point mutations can also be detected by creating or destroying RFLP. Mutations are detected and located by the presence and size of the RNA fragment that results from cleaving the mismatch. Single nucleotide mismatches in DNA heteroduplexes are also recognized and cleaved by several chemicals to detect single base substitutions commonly referred to as "Mismatch Chemical Cleavage (MCC)" However, this method requires two highly toxic chemicals, osmium tetroxide and piperidine, which are unsuitable for clinical laboratory use.

RFLP分析は感度が低く、また大量のサンプルを必要とする。点突然変異の検出にRFLP分析を用いる場合は、その性質から、これら単一塩基の変化が既知制限エンドヌクレア−ゼの制限配列内に存在する場合の検出に限られる。さらには、入手可能な酵素の大部分は、認識配列が4〜6塩基対であり、多くの大規模DNA操作にとっては開裂頻度が高すぎる。かくして、大部分の突然変異はこのような部位には存在しないことから、その応用は限られている。   RFLP analysis is insensitive and requires a large amount of sample. When RFLP analysis is used to detect point mutations, by nature, it is limited to detection when these single base changes are present within the restriction sequences of known restriction endonucleases. Furthermore, most of the available enzymes have a recognition sequence of 4-6 base pairs, and the frequency of cleavage is too high for many large DNA manipulations. Thus, since most mutations do not exist at such sites, their application is limited.

8塩基対の特異性を有する、切断頻度の低い制限酵素が幾つか単離されて、それらは遺伝子マッピングに広く用いられているが、これら酵素は少数であり、G+Cリッチ配列の認識に限られており、強いクラスタ形成傾向を示す部位を開裂する。最近、12塩基対を超える特異性を有するであろうグル−プIイントロンがコ−ドするエンドヌクレア−ゼが発見されたが、これもまだ数が少ない。   Several low-cleavage restriction enzymes with 8 base pair specificity have been isolated and are widely used for gene mapping, but these enzymes are few and can be used to recognize G + C rich sequences. It is limited and cleaves sites that show a strong tendency to form clusters. Recently, endonucleases have been discovered that code for group I introns that would have a specificity of more than 12 base pairs, but this is still few.

対立遺伝子特異的オリゴヌクレオチド(ASO):変化が認識配列内にない場合は、対立遺伝子特異的オリゴヌクレオチド(ASO)を、突然変異したヌクレオチドに近接してハイブリダイゼ−ションし、プライマ−伸長または連結をマッチまたはミスマッチの指標として使用できるように設計することができる。放射線標識した対立遺伝子特異的オリゴヌクレオチド(ASO)を用いたハイブリダイゼ−ションは、特異的点突然変異の検出にも応用されている。この方法は、単一ヌクレオチドが異なる、短いDNA断片の溶解温度の差に基づいている。厳密なハイブリダイゼ−ションおよび洗浄条件により、突然変異型と野生型の対立遺伝子を区別することができる。PCR産物へのASO法の応用も、様々な研究者によって、ras遺伝子およびgsp/gip発癌遺伝子の点突然変異の検出および特徴付けに盛んに利用されている。複数の位置に様々なヌクレオチドの変化が存在するため、ASO法では、考え得る全ての発癌遺伝子の突然変異を対象とするために多くのオリゴヌクレオチドを使用しなければならない。   Allele-specific oligonucleotide (ASO): If the change is not within the recognition sequence, the allele-specific oligonucleotide (ASO) is hybridized in close proximity to the mutated nucleotide to allow primer extension or ligation. It can be designed to be used as a match or mismatch indicator. Hybridization using radiolabeled allele-specific oligonucleotides (ASO) has also been applied to the detection of specific point mutations. This method is based on the difference in melting temperature of short DNA fragments that differ by a single nucleotide. Strict hybridization and wash conditions can distinguish between mutant and wild type alleles. The application of the ASO method to PCR products is also actively used by various researchers to detect and characterize point mutations in the ras gene and the gsp / gip oncogene. Due to the presence of various nucleotide changes at multiple positions, the ASO method must use many oligonucleotides to target all possible oncogene mutations.

上記の技術(即ちRFLPおよびASO)のいずれかを用いる場合は、、突然変異が疑われる場所を検査に先立って正確に知る必要がある。言い換えると、これらの方法は、関心対象の遺伝子または配列内の突然変異の存在を検出する必要がある場合には、用いることができない。   When using any of the above techniques (ie RFLP and ASO), it is necessary to know exactly where the mutation is suspected prior to testing. In other words, these methods cannot be used if it is necessary to detect the presence of a mutation in the gene or sequence of interest.

変性/温度勾配ゲル電気泳動(DGGE/TGGE):別の2つの方法は、微細な配列変化に反応した電気泳動移動度の変化を検出することに基づいている。「変性勾配ゲル電気泳動」(DGGE)と名づけられた、これらの方法の一つは、勾配ゲルで電気泳動分析を行った場合、わずかな配列の差が局所の溶解パタ−ンの違いとなって現れるという観察に基づいている。この方法では、単一のヌクレオチドが異なるホモ二重鎖とヘテロに重鎖の溶解特性の違いが、それに対応してそれらの電気泳動の移動度が変化することで標的配列中の突然変異の存在を検出できる場合には、変異体を区別することができる。分析対象の断片、通常PCR産物は、長いGC塩基対のストレッチ(30〜80)が一端に「クランピング」されており、完全に解離することなしに関心対象の配列を完全に変性することができる。DNA断片へGC「クランピング」を取付けることで、DGGEが認識できる突然変異の分画が広がる。一方のプライマ−にGCクランピングを取付けることが、増幅された配列が低い解離温度を持つことを保証する上で重要である。技術の改良が、温度勾配を用いて行われ、この方法はまたRNA:RNA二重鎖にも応用できる。   Denaturation / temperature gradient gel electrophoresis (DGGE / TGGE): Two other methods are based on detecting changes in electrophoretic mobility in response to minute sequence changes. One of these methods, named “denaturing gradient gel electrophoresis” (DGGE), is that when electrophoretic analysis is performed on a gradient gel, a slight sequence difference results in a difference in local lysis pattern. It is based on the observation that it appears. In this method, single nucleotides differ in homoduplex and heterozygous heavy chain solubility properties, and the corresponding mobility changes in their electrophoretic mobility, resulting in the presence of mutations in the target sequence. Mutants can be distinguished. Fragments of interest, usually PCR products, are “clamped” at one end with a long GC base pair stretch (30-80), which can completely denature the sequence of interest without complete dissociation. it can. Attaching GC “clamping” to DNA fragments broadens the fraction of mutations that DGGE can recognize. Attaching GC clamping to one primer is important to ensure that the amplified sequence has a low dissociation temperature. Improvements in technology are made using temperature gradients and this method can also be applied to RNA: RNA duplexes.

DGGE法の利用についての制限事項としては、変性条件を試験するDNAのそれぞれのタイプに合わせて最適化しなければならないことが挙げられる。さらには、この方法はゲルを調製し、電気泳動中、必要な高温を維持するための特殊な装置を必要とする。試験対象の各配列について一方のプライマ−にクランピングテ−ルを合成することに伴う出費も重要な要件である。これに加え、DGGEでは長い泳動時間が求められる。DGGEの長い泳動時間は、一定変性ゲル電気泳動(constant denaturant gel electrophoresis)(CDGE)と呼ばれるDGGEの改良法では短縮される。CDGEでは、突然変異検出の効率を高めるために異なる変性条件でゲルを実施する必要がある。   Restrictions on the use of the DGGE method include that denaturation conditions must be optimized for each type of DNA being tested. Furthermore, this method requires specialized equipment to prepare the gel and maintain the required high temperature during electrophoresis. The expense associated with synthesizing the clamping tail on one primer for each sequence to be tested is also an important requirement. In addition, DGGE requires a long run time. The long run time of DGGE is shortened by a modified DGGE method called constant denaturant gel electrophoresis (CDGE). CDGE requires that the gel be run under different denaturing conditions to increase the efficiency of mutation detection.

温度勾配ゲル電気泳動(TGGE)と名付けられたDGGEに似た技術は、変性剤の勾配ではなく温度の勾配を用いる。TGGEは、電場に対し直交方向に温度勾配を作ることができる特殊な装置を必要とする。TGGEは比較的小型のDNA断片中の突然変異を検出できることから、大型の遺伝子セグメントのスクリ−ニングでは、ゲル電気泳動を行う前に複数のPCR産物を用いる必要がある。   A technique similar to DGGE, termed temperature gradient gel electrophoresis (TGGE), uses a gradient of temperature rather than a gradient of denaturant. TGGE requires special equipment that can create a temperature gradient in a direction orthogonal to the electric field. Since TGGE can detect mutations in relatively small DNA fragments, screening of large gene segments requires the use of multiple PCR products prior to gel electrophoresis.

単鎖立体構造多形(Single−Strand Conformation Polymorphism)(SSCP):「単鎖立体構造多形」(SSCP)と呼ばれる別の一般的方法がHayashi、Sekyaおよび共同研究者らによって開発され、それは単鎖の核酸が非変性条件において特徴的な立体構造をとることができ、これらの立体構造が電気泳動移動度に影響するという観察に基づいている。相補的な鎖は、一つの鎖ともう一方の鎖とを区別できる、十分に異なった構造を持つと考えられる。断片内の配列の変化はこの立体構造も変化させ、その結果移動度が変わるが、これを配列変化のアッセイとして用いることができる。   Single-Strand Conformation Polymorphism (SSCP): Another general method called “Single-Strand Conformation Polymorphism” (SSCP) has been developed by Hayashi, Sekya and coworkers. It is based on the observation that strand nucleic acids can take characteristic three-dimensional structures under non-denaturing conditions and that these three-dimensional structures affect electrophoretic mobility. Complementary strands are thought to have sufficiently different structures that can distinguish one strand from the other. Sequence changes within the fragment also change this conformation, resulting in changes in mobility, which can be used as an assay for sequence changes.

SSCPプロセスは、両鎖が標識されているDNAセグメント(例えばPCR産物)を変性し、次にゆっくりと非変性ポリアクリルアミドを用いて電気泳動により分離することを含み、それにより泳動中に分子内の相互作用が形成でき、またそれは破壊されない。この技術は、ゲル組成および温度の変動に極めて敏感である。この方法の重大な限界は、明らかに同様の条件でも、異なる研究室で得られたデ−タを比較することが比較的難しいことである。   The SSCP process involves denaturing DNA segments (eg, PCR products) that are labeled on both strands, and then slowly separating them by electrophoresis using non-denaturing polyacrylamide, thereby allowing intramolecular intramolecular migration. Interactions can form and are not destroyed. This technique is extremely sensitive to variations in gel composition and temperature. A significant limitation of this method is that it is relatively difficult to compare data obtained in different laboratories, even under clearly similar conditions.

ジデオキシフィンガ−プリンティグ(ddF):ジデオキシフィンガ−プリンティグ(ddF)は、突然変異の存在について遺伝子をスキャニングするために開発された別の技術である。ddF技術は、Sangerのジデオキシ配列決定法とSSCPの要素を組み合わせている。ジデオキシ配列決定反応は、一種類のジデオキシタ−ミネ−タを用いて実施し、非変性ポリアクリルアミドゲルを用いて反応産物を電気泳動し、SSCP分析同様に終止セグメントの移動度の変化を検出するものである。ddFは感度の観点ではSSCPより優れているが、ddFでは高価なジデオキシヌクレオチドを使用しなければならず、またこの方法もSSCPに好適なサイズ(即ち突然変異の最適検出では200〜300bpの断片)の断片の分析に限定される。   Dideoxyfinger-printing (ddF): Dideoxyfinger-printing (ddF) is another technique developed to scan genes for the presence of mutations. The ddF technology combines Sanger dideoxy sequencing with SSCP elements. The dideoxy sequencing reaction is carried out using one kind of dideoxy terminator, the reaction product is electrophoresed using a non-denaturing polyacrylamide gel, and the change in the mobility of the termination segment is detected as in the SSCP analysis. It is. Although ddF is superior to SSCP in terms of sensitivity, ddF must use expensive dideoxynucleotides and this method is also suitable for SSCP (ie, a 200-300 bp fragment for optimal detection of mutations) Limited to analysis of fragments.

上記の限界に加えて、これら方法の全てについて、分析可能な核酸断片のサイズについて限界がある。直接配列を決定する方法では、600塩基対を超える配列はクロ−ニングが必要であり、結果として断片全体をカバ−するためには、欠失サブクロ−ニングまたはプライマ−ウォ−キングによる遅れと出費が伴う。SSCPとDGGEは、サイズの限界はより厳しい。配列の変化に対する感度が低いため、これらの方法は大型の断片には不向きと考えられる。SSCPは200塩基対断片内の単一塩基置換を90%検出できると報告されているが、400塩基対断片では検出率は50%未満に落ちる。同様に、DGGEの感度は、断片の長さが500塩基対に達すると下がる。ddF法は、直接配列決定およびSSCPと組み合わせた場合でも、スクリ−ニングできるDNAのサイズは比較的小さなものに限られる。   In addition to the above limitations, all of these methods have limitations on the size of nucleic acid fragments that can be analyzed. In direct sequencing methods, sequences exceeding 600 base pairs require cloning, and as a result, the delay and expense due to deletion subcloning or primer walking to cover the entire fragment. Is accompanied. SSCP and DGGE have stricter size limits. These methods are considered unsuitable for large fragments due to their low sensitivity to sequence changes. SSCP has been reported to detect 90% of single base substitutions within a 200 base pair fragment, but with 400 base pair fragments, the detection rate drops to less than 50%. Similarly, the sensitivity of DGGE decreases when the fragment length reaches 500 base pairs. The ddF method, even when combined with direct sequencing and SSCP, limits the size of DNA that can be screened to a relatively small size.

本発明の、現時点で好ましい態様によると、本明細書に記載の、腫瘍細胞、または癌患者由来の細胞の核酸配列を検索する段階は、核酸配列決定、ポリメラ−ゼチェインリアクション、リガ−ゼチェインリアクション、自立的配列増幅反応、Qβレプリカ−ゼ、サイクリングプロ−ブ反応、制限断片長体系分析、ミスマッチケミカル開裂、ヘテロ二重鎖分析、対立遺伝子特異的オリゴヌクレオチド、変性勾配ゲル電気泳動、一定変性ゲル電気泳動、温度勾配ゲル電気泳動およびジデオキシフィンガ−プリンティグを含む、いずれかの好適技術によって実施されるが、これらに限定されるものではない。   According to the presently preferred embodiments of the present invention, the step of searching for nucleic acid sequences of tumor cells or cells from cancer patients as described herein comprises nucleic acid sequencing, polymerase chain reaction, ligand chain. Reaction, autonomous sequence amplification reaction, Qβ replicase, cycling probe reaction, restriction fragment length system analysis, mismatch chemical cleavage, heteroduplex analysis, allele-specific oligonucleotide, denaturing gradient gel electrophoresis, constant denaturation It is performed by any suitable technique, including but not limited to gel electrophoresis, temperature gradient gel electrophoresis and dideoxyfinger-printing.

検出は、チップまたはその他同様の装置を用いて随意行うこともできる。分析対象の候補領域を含む核酸サンプルは、単離され、増幅され、レポ−タ−基で標識されることが好ましい。このレポ−タ−基は、フィコエリスリンのような蛍光基でよい。標識された核酸は、次にチップ上に固定されたプロ−ブとフルイディクスステ−ションを用いてインキュベ−ションされる。フルイディクス装置、および特にシリコンおよびガラス基体を用いたマイクロキャピラリ−装置の製造が記載されている。   Detection can optionally be performed using a chip or other similar device. The nucleic acid sample containing the candidate region to be analyzed is preferably isolated, amplified and labeled with a reporter group. The reporter group may be a fluorescent group such as phycoerythrin. The labeled nucleic acid is then incubated using a probe and fluidic station immobilized on the chip. The manufacture of fluidic devices and in particular microcapillary devices using silicon and glass substrates has been described.

反応終了後、チップはスキャナに挿入され、ハイブリダイゼ−ションのパタ−ンが検出される。ハイブリダイゼ−ションのデ−タは、今やチップに付着したプロ−ブに結合している、核酸内に既に取り込まれているレポ−タ−基が発するシグナルとして集められる。チップ上に固定した各プロ−ブの配列と位置は分かっていることから、あるプロ−ブにハイブリダイゼ−ションしている核酸を識別することができる。   After completion of the reaction, the chip is inserted into the scanner, and the hybridization pattern is detected. The hybridization data is collected as a signal emitted by a reporter group that is now incorporated into the nucleic acid, which is now bound to the probe attached to the chip. Since the sequence and position of each probe immobilized on the chip are known, the nucleic acid hybridized to a certain probe can be identified.

自動化装置と一緒に利用すれば、上記検出法を用いて疾患および/または病的状態について多数のサンプルを、迅速且つ容易にスクリ−ニングできる。   When used in conjunction with an automated device, multiple samples can be quickly and easily screened for disease and / or morbidity using the detection methods described above.

アミノ酸配列およびペプチド
用語「ポリペプチド」「ペプチド」および「タンパク質」は、本明細書では互換的に用いられ、アミノ酸残基の重合体を指す。この用語は、一または複数のアミノ酸残基が対応する天然アミノ酸の類似体もしくは模擬体であるアミノ酸重合体だけでなく、天然産アミノ酸重合体にも用いられる。ポリペプチドは、例えば炭水化物残基を付加することによって修飾し、糖タンパク質にすることができる。用語「ポリペプチド」「ペプチド」および「タンパク質」は、糖タンパク質だけでなく非糖タンパク質も包含する。
Amino Acid Sequences and Peptides The terms “polypeptide”, “peptide” and “protein” are used interchangeably herein and refer to a polymer of amino acid residues. This term is used not only for amino acid polymers in which one or more amino acid residues are analogs or mimetics of the corresponding natural amino acids, but also for naturally occurring amino acid polymers. Polypeptides can be modified into glycoproteins, for example, by adding carbohydrate residues. The terms “polypeptide”, “peptide” and “protein” encompass not only glycoproteins but also non-glycoproteins.

ポリペプチド産物は、標準的固相技術等を用いることによって生化学的に合成できる。このような方法としては、固相合成法、部分固相合成法、断片縮合、古典的液体合成法が挙げられるが、これらに限定されるわけではない。これらの方法は、ペプチドが比較的短い(即ち10kDa)場合、そして/またはそれが組換え体技術で作製できず、それ故に異なる化学を含む場合(即ち核酸配列にコ−ドされていない)にもっぱら用いられる。   Polypeptide products can be synthesized biochemically using standard solid phase techniques and the like. Such methods include, but are not limited to, solid phase synthesis, partial solid phase synthesis, fragment condensation, and classical liquid synthesis. These methods are used when the peptide is relatively short (ie 10 kDa) and / or when it cannot be produced by recombinant technology and therefore contains a different chemistry (ie not coded into the nucleic acid sequence). Used exclusively.

固相ポリペプチド合成法は当技術分野で周知であり、またJohn Morrow Stewart and Janis Dillaha Young、Solid Phase Peptide Syntheses (2nd Ed., Pierce Chemical Company, 1984)に詳しく記載されている。   Solid phase polypeptide synthesis methods are well known in the art and are described in detail in John Morrow Stewart and Janis Dillaha Young, Solid Phase Peptide Syntheses (2nd Ed., Pierce Chemical Company, 1984).

合成ポリペプチドは、高性能液体クロマトグラフィ−を用いて随意精製でき[Creighton T. (1983) Proteins, structures and molecular principles. WH Freeman and Co. N.Y.]、その後それらの組成はアミノ酸配列決定によって確認できる。   Synthetic polypeptides can be optionally purified using high performance liquid chromatography [Creighton T. (1983) Proteins, structures and molecular principles. WH Freeman and Co. N.Y.], after which their composition can be confirmed by amino acid sequencing.

大量のポリペプチドが望まれる場合は、Bitter et al., (1987) Methods in Enzymol. 153:516−544, Studier et al. (1990) Methods in Enzymol. 185;60−89, Brisson et al. (1984) Nature 310:511−514, Takamatsu et al. (1987) EMBO J. 6:307−311, Coruzzi et al. (1984) EMBO J. 3:1671−1680およびBrogli et al., (1984) Science 224:838−843, Gurley et al. (1986) Mol. Cell. Biol. 6:559−565およびWeissbach & Wessbach, 1988, Methods for Plant Molecular Biology, Academic Press, NY. Section VIII, pp 421−463に記載されているような組換え体技術を用いて作製することができる。   Bitter et al., (1987) Methods in Enzymol. 153: 516-544, Studier et al. (1990) Methods in Enzymol. 185; 60-89, Brisson et al. (1984) Nature 310: 511-514, Takamatsu et al. (1987) EMBO J. 6: 307-311, Coruzzi et al. (1984) EMBO J. 3: 1671-1680 and Brogli et al., (1984) Science 224: 838-843, Gurley et al. (1986) Mol.Cell.Biol. 6: 559-565 and Weissbach & Wessbach, 1988, Methods for Plant Molecular Biology, Academic Press, NY.Section VIII, pp 421-463. It can be produced using recombinant techniques as described.

本発明は、本発明のポリヌクレオチド配列がコ−ドするポリペプチドだけでなく本明細書に記載のアミノ酸配列に従ったポリペプチドも包含する。本発明はまた、これらポリペプチドの相同体も包含し、このような相同体は、以下記載のアミノ酸配列に対し、National Center of Biotechnology Information (NCBI)のソフトウエアBlastPを、要する場合および好ましくは以下を含めて初期設定パラメ−タで使用し決定した時に少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも95%、またより望ましくは100%相同である:フィルタリングはオン(このオプションはSeg(タンパク質)プログラムを用い、問い合わせから反復性または複雑度の低い配列を排除する)、スコアリングマトリックスはタンパク質についてBLOSUM62、ワ−ドサイズは3、E値は10、ギャップコストは11、1(初期化および伸長)ならびにアラインメント表示数は50である。最後に、本発明はまた上記ポリペプチド、ならびに自然発生したか、または無作為もしくは狙いを定めて人工的に誘導した一または複数のアミノ酸の欠失、挿入または置換のような突然変異を有するポリペプチドの断片も包含する。核酸配列の相同性/同一性は、National Center of Biotechnology Information (NCBI)のソフトウエアBlastNを用い、初期設定パラメ−タで決定するのが好ましく、このときDUSTフィルタ−プログラムを含むことが好ましく、さらにE値を10、複雑性の低い配列を排除、ワ−ドサイズを11にすることが好ましい。   The present invention encompasses not only the polypeptides encoded by the polynucleotide sequences of the present invention, but also polypeptides according to the amino acid sequences described herein. The present invention also encompasses homologues of these polypeptides, such homologues requiring and preferably following the National Center of Biotechnology Information (NCBI) software BlastP against the amino acid sequences described below. At least 50%, at least 55%, at least 60%, at least 65%, at least 70%, at least 75%, at least 80%, at least 85%, at least 95%, when used and determined by default parameters, including Also more preferably 100% homologous: filtering is on (this option uses the Seg (protein) program to eliminate repetitive or low complexity sequences from the query), the scoring matrix is BLOSUM62, Size is 3, E value is 10, gap cost is 11, 1 (initialization and extension), and alignment number is 50 A. Finally, the present invention also relates to polypeptides as described above, as well as those having mutations such as deletions, insertions or substitutions of one or more amino acids that are naturally occurring or are randomly or targeted artificially induced. Also includes peptide fragments. Nucleic acid sequence homology / identity is preferably determined using the default parameters using the BlastN software of the National Center of Biotechnology Information (NCBI), preferably including the DUST filter program, It is preferable that the E value is 10, the low complexity sequence is excluded, and the word size is 11.

本発明が同定したペプチドは、分解産物、合成ペプチドまたは組換え体ペプチドであるだけでなく、模擬ペプチド、一般的には合成ペプチドならびにペプチド類似物であるペプトイドおよびセミペプトイドでもよく、これらは、例えばペプチドに体内での安定性もしくは細胞内へより浸透できるようにする修飾がほどこされている。このような修飾としては、N末端修飾、C末端修飾、CH2−NH、CH2−S、CH2−S=O、O=C−NH、CH2−O、CH2−CH2、S=C−NH、CH=CHまたはCF=CHを包含するがこれらに限定されるものではないペプチド結合修飾、主鎖修飾ならびに残基修飾が挙げられるが、これらに限定されるものではないことが理解されるだろう。模擬ペプチド化合物の調製方法は当技術分野で周知であり、また具体化されている。この局面の詳細を以下に示す。   Peptides identified by the present invention are not only degradation products, synthetic peptides or recombinant peptides, but may also be mimetic peptides, generally synthetic peptides and peptide analogs peptoids and semipeptoids, for example, peptides It has been modified to make it more stable in the body or better penetrated into the cell. Such modifications include N-terminal modification, C-terminal modification, CH2-NH, CH2-S, CH2-S = O, O = C-NH, CH2-O, CH2-CH2, S = C-NH, CH It will be understood that peptide bond modifications, backbone modifications, and residue modifications include but are not limited to ═CH or CF═CH. Methods for preparing mock peptide compounds are well known and embodied in the art. Details of this aspect are shown below.

ペプチド内のペプチド結合(−CO−NH−)は、例えばN−メチル化結合(−N(CH3)−CO−)、エステル結合(−C(R)H−C−O−O−C(R)−N−)、ケトメチル結合(−CO−CH2−)、式中のRがいずれかのアルキル、例えばメチルであるα−アザ結合(−NH−N(R)−CO−)、カルバ結合(−CH2−NH−)、ヒドロキシエチレン結合(−CH(OH)−CH2−)、チオアミド結合(−CS−NH−)、オレフィン二重結合(−CH=CH−)、レトロアミド結合(−NH−CO−)、式中のRが「正常」側鎖であり、天然では炭素原子であるペプチド誘導体(−N(R)−CH2−CO−)で置換できる。   The peptide bond (—CO—NH—) in the peptide is, for example, an N-methylated bond (—N (CH 3) —CO—), an ester bond (—C (R) H—C—O—O—C (R ) —N—), ketomethyl bond (—CO—CH 2 —), α-aza bond (—NH—N (R) —CO—), carba bond (wherein R is any alkyl such as methyl) -CH2-NH-), hydroxyethylene bond (-CH (OH) -CH2-), thioamide bond (-CS-NH-), olefin double bond (-CH = CH-), retroamide bond (-NH- CO—), where R is a “normal” side chain and can be substituted with a peptide derivative (—N (R) —CH 2 —CO—) which is naturally a carbon atom.

これらの修飾は、ペプチド鎖上にあるいずれの結合でも起こり、同時に複数(2〜3)カ所で起こることもある。   These modifications occur at any bond on the peptide chain and may occur at multiple (2-3) locations simultaneously.

中性芳香族アミノ酸のTrp、TyrおよびPheは、フェニルグリシン、TIC、ナフチレラニン(Nol)、Pheの環式メチル化誘導体、Pheのハロゲン化誘導体またはo−メチル−Tyrのような合成非天然産の代わりになることができる。   The neutral aromatic amino acids Trp, Tyr and Phe are synthetic non-naturally occurring such as phenylglycine, TIC, naphthyrelanin (Nol), cyclic methylated derivatives of Phe, halogenated derivatives of Phe or o-methyl-Tyr. Can be an alternative.

上記に加え、本発明のペプチドは一または複数の修飾アミノ酸、あるいは一または複数の非アミノ酸モノマ−(例えば脂肪酸、複合炭水化物等)を含んでもよい。   In addition to the above, the peptides of the present invention may contain one or more modified amino acids, or one or more non-amino acid monomers (eg, fatty acids, complex carbohydrates, etc.).

本明細書および特許請求の範囲で用いる場合、用語「アミノ酸」は、20種類の天然アミノ酸;例えばヒドロキシプロリン、ホスホセリンおよびホスホスレオニンを含むインビボで翻訳後にしばしば修飾されるアミノ酸;ならびに2−アミノアジピン酸、ヒドロキシリジン、ノル−バリン、ノル−ロイシンおよびオルニチンを含むが、これらに限定されなりその他の稀なアミノ酸を包含すると理解される。   As used herein and in the claims, the term “amino acid” refers to the 20 natural amino acids; amino acids that are often post-translationally modified in vivo, including, for example, hydroxyproline, phosphoserine and phosphothreonine; and 2-aminoadipic acid , Hydroxylysine, nor-valine, nor-leucine and ornithine, but are not limited to, and are understood to include other rare amino acids.

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明のペプチドは、ペプチドを可溶化形状にする必要がある診断薬でもっぱら持ちいられることから、本発明のペプチドは、それらのヒドロキシル含有側鎖によってペプチドの溶解性を高めることができるセリンおよびスレオニンを含むが、これらに限定されるものではない一つまたは複数の非天然もしくは天然の極性アミノ酸を含むことが好ましい。   Since the peptides of the present invention are solely possessed by diagnostic agents that require the peptides to be in a solubilized form, the peptides of the present invention are capable of increasing the solubility of the peptides by their hydroxyl-containing side chains and Preferably, it includes one or more non-natural or natural polar amino acids, including but not limited to threonine.

本発明のペプチドは直線形状で用いることが好ましいが、環状化がペプチドの特性に重大な影響を及ぼさない場合には、環形状のペプチドも用いることができることが理解されるだろう。   While it is preferred that the peptides of the invention be used in a linear form, it will be understood that cyclic peptides can also be used if cyclization does not have a significant effect on the properties of the peptide.

本発明のペプチドは、標準的な固相技術等を用いることによって生化学的に合成できる。このような方法としては、当技術分野周知の限定固相合成法、部分固相合成法、断片縮合、古典的液体合成法が挙げられるが、これらに限定されるわけではない。これらの方法は、ペプチドが比較的短い(即ち10kDa)場合、そして/またはそれが組換え体技術で作製できず、それ故に異なる化学を含む場合(即ち核酸配列にコ−ドされていない)にもっぱら用いられる。   The peptides of the present invention can be synthesized biochemically using standard solid phase techniques and the like. Such methods include, but are not limited to, limited solid phase synthesis, partial solid phase synthesis, fragment condensation, and classical liquid synthesis methods well known in the art. These methods are used when the peptide is relatively short (ie 10 kDa) and / or when it cannot be produced by recombinant technology and therefore contains a different chemistry (ie not coded into the nucleic acid sequence). Used exclusively.

合成ペプチドは、高性能液体クロマトグラフィ−を用いて随意精製でき、またその組成はアミノ酸配列決定によって確認できる。   Synthetic peptides can be optionally purified using high performance liquid chromatography and their composition can be confirmed by amino acid sequencing.

大量のペプチドが望まれる場合、本発明のペプチドはBitter et al., (1987) Methods in Enzymol. 153:516−544, Studier et al. (1990) Methods in Enzymol. 185;60−89, Brisson et al. (1984) Nature 310:511−514, Takamatsu et al. (1987) EMBO J. 6:307−311, Coruzzi et al. (1984) EMBO J. 3:1671−1680およびBrogli et al., (1984) Science 224:838−843, Gurley et al. (1986) Mol. Cell. Biol. 6:559−565およびWeissbach & Wessbach, 1988, Methods for Plant Molecular Biology, Academic Press, NY. Section VIII, pp 421−463に記載されているような組換え体技術を用いて作製することができる。   When large amounts of peptides are desired, the peptides of the present invention can be obtained from Bitter et al., (1987) Methods in Enzymol. 153: 516-544, Studier et al. (1990) Methods in Enzymol. 185; 60-89, Brisson et al. (1984) Nature 310: 511-514, Takamatsu et al. (1987) EMBO J. 6: 307-311, Coruzzi et al. (1984) EMBO J. 3: 1671-1680 and Brogli et al., ( (1984) Science 224: 838-843, Gurley et al. (1986) Mol. Cell. Biol. 6: 559-565 and Weissbach & Wessbach, 1988, Methods for Plant Molecular Biology, Academic Press, NY.Section VIII, pp 421 Can be made using recombinant techniques as described in -463.

抗体
「抗体」とは、免疫グロブリン遺伝子がもっぱら実質的にコ−ドする、エピト−プ(例えば抗原)に特異的に結合し、認識するポリペプチドリガンド、またはその断片を指す。認められている免疫遺伝子としては、カッパおよびラムダ軽鎖定常域遺伝子、アルファ、ガンマ、デルタ、イプシロンおよびミュ−重鎖定常域遺伝子、ならびに無数の免疫グロブリンか変域遺伝子が挙げられる。抗体は、例えば未変性の免疫グロブリンまたは各種ペプチダ−ゼで消化されて生成された、良く特徴付けされた断片として存在する。これには、例えばFab'およびF(ab)'2断片が含まれる。用語「抗体」は、本明細書に用いる場合、抗体全体を修飾することによって生成するか、または組換え体DNA技術を用いてデノボ合成された抗体の断片も包含する。用語はまた、ポリクロ−ナル抗体、モノクロ−ナル抗体、キメラ抗体、ヒト化抗体または単鎖抗体も包含する。抗体の「Fc」部分は、一または複数の重鎖定常域ドメイン、CH1、CH2およびCH3を含むが、重鎖可変域は含まない、免疫グロブリン重鎖部分を指す。
Antibody “Antibody” refers to a polypeptide ligand, or a fragment thereof, that specifically binds and recognizes an epitope (eg, an antigen) to which an immunoglobulin gene exclusively codes. The recognized immune genes include the kappa and lambda light chain constant region genes, the alpha, gamma, delta, epsilon and mu heavy chain constant region genes, and the myriad immunoglobulin or variable region genes. Antibodies exist as well-characterized fragments produced, for example, by digestion with native immunoglobulins or various peptidases. This includes, for example, Fab ′ and F (ab) ′ 2 fragments. The term “antibody” as used herein also encompasses fragments of antibodies produced by modifying the whole antibody or synthesized de novo using recombinant DNA technology. The term also encompasses polyclonal, monoclonal, chimeric, humanized or single chain antibodies. The “Fc” portion of an antibody refers to an immunoglobulin heavy chain portion that contains one or more heavy chain constant region domains, CH1, CH2 and CH3, but does not include the heavy chain variable region.

マクロファ−ジに結合できるFab、F(ab)'2断片およびFv’のような抗体の機能的断片は、次のように説明されている:(1)抗体分子の単価の抗原結合断片を含有する断片であるFabは、完全抗体を酵素のパパインで消化して無償の軽鎖および一本の重鎖の一部を得ることで作製できる;(2) Fab'断片は、完全抗体をペプシンで処理した後、還元を行い無償の軽鎖および重鎖の一部を得ることで得られる抗体分子の断片である;抗体分子から二つのF(ab)'断片を得ることができる;(3) F(ab)'2断片は、完全抗体を酵素のパパインで処理し、その後還元をしないことで得られる抗体の断片である;F(ab)'2は二つのFab'
断片が二つのジスルフィド結合によって一つになったダイマ−である;(4)Fvは、二本の鎖として発現した軽鎖の可変領域および重鎖の可変領域を含有する遺伝子工学により作製された分子である;ならびに(5)単鎖抗体(「SCA」)は、好適なポリペプチドリンカ−を用いて遺伝的に融合した一本鎖分子に連結された、軽鎖の可変領域と重鎖の可変領域を含有する遺伝子工学的に作製された分子である。
Functional fragments of antibodies such as Fab, F (ab) ′ 2 fragments and Fv ′ capable of binding to macrophages are described as follows: (1) Contains a unitary antigen-binding fragment of the antibody molecule. Fab is a fragment that can be produced by digesting a complete antibody with the enzyme papain to obtain a free light chain and part of a single heavy chain; (2) A fragment of an antibody molecule obtained by treatment and reduction to obtain free light chain and part of heavy chain; two F (ab) ′ fragments can be obtained from the antibody molecule; (3) The F (ab) '2 fragment is a fragment of an antibody obtained by treating the complete antibody with the enzyme papain and then not reducing it; F (ab)' 2 is the two Fab '
A dimer in which the fragments are united by two disulfide bonds; (4) Fv was created by genetic engineering containing the light chain variable region and the heavy chain variable region expressed as two chains And (5) a single chain antibody (“SCA”) consists of a light chain variable region and a heavy chain linked to a single chain molecule genetically fused using a suitable polypeptide linker. A genetically engineered molecule containing a variable region.

ポリクロ−ナルおよびモノクロ−ナル抗体だけでなく、その断片を作製するための方法は、当技術分野で周知である(例えば、参照により本明細書に組み入れられるHarlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, New York, 1988を参照せよ)。   Methods for making polyclonal and monoclonal antibodies, as well as fragments thereof, are well known in the art (eg, Harlow and Lane, Antibodies: A Laboratory Manual, incorporated herein by reference). (See Cold Spring Harbor Laboratory, New York, 1988).

本発明の抗体断片は、抗体をタンパク質加水分化することによって、またはE.coliもしくは哺乳動物細胞(例えばチャイニ−ズハムスタ−培養卵細胞またはその他のタンパク質発現系)で前記断片をコ−ドしているDNAを発現させることによって調製できる。抗体断片は、完全抗体を通常の方法によってペプシンまたはパパイン消化することで得られる。例えば、抗体断片は、個体をペプシンで酵素開裂させ、F(Ab')2で表される5S断片として作製できる。この断片はチオ−ル還元剤を用いて、要する場合にはジスルフィド結合の開裂によって生ずるスルフィド基に対するブロック基を用いてさらに開裂し、3.5SのFab'単価断片を作製する。または、ペプシンを用いた酵素開裂により、二本の単価Fab'断片と一本のFc断片を直接作製する。これらの方法は、例えばGoldenbergによって、米国特許第4,036,945号および第4,331,647号、およびその中に含まれる参考資料に記載されており、これら特許は参照によって本明細書にそのまま組み入れられる。またPorter, R. R. [Biochem. J. 73: 119−126 (1959)]も参照せよ。重鎖を分離して単価の軽鎖−重鎖断片を形成する、断片をさらに開裂する、またはその他酵素、化学薬品、または遺伝的な技術等の抗体を開裂するその他の方法も、その断片が無傷の抗体が認識する抗原に結合するのであれば使用できる。   The antibody fragment of the present invention is a DNA encoding the fragment by protein hydrolysis of the antibody or in E. coli or mammalian cells (eg, Chinese hamster cultured egg cells or other protein expression systems). Can be prepared. An antibody fragment can be obtained by digesting a complete antibody with pepsin or papain by a conventional method. For example, an antibody fragment can be prepared as a 5S fragment represented by F (Ab ′) 2 by enzymatic cleavage of an individual with pepsin. This fragment is further cleaved with a thiol reducing agent and, if necessary, with a blocking group for the sulfide group generated by cleavage of the disulfide bond to produce a 3.5S Fab ′ unitary fragment. Alternatively, two unitary Fab ′ fragments and one Fc fragment are directly produced by enzymatic cleavage using pepsin. These methods are described, for example, by Goldenberg in US Pat. Nos. 4,036,945 and 4,331,647, and references contained therein, which are hereby incorporated by reference in their entirety. See also Porter, R.R. [Biochem. J. 73: 119-126 (1959)]. Other methods of separating heavy chains to form unitary light-heavy chain fragments, further cleaving the fragments, or cleaving antibodies such as enzymes, chemicals, or genetic techniques are Any antibody that binds to an antigen recognized by an intact antibody can be used.

Fv断片は、VHとHL鎖の会合を包含する。この会合は、Inbar et al.[Proc. Natl Acad.Sci. USA 69:2659−62 (19720]。または可変鎖を、分子間ジスルフィド結合によって結合するか、またはグルタ−ルアルデヒドのような化学薬品を用いて架橋結合することができる。好ましくは、Fv断片はペプチドリンカ−で連結されたVHとVL鎖を含む。これら単鎖抗原結合タンパク質(sFv)は、オリゴヌクレオチドを用いてつなげられたVHドメインとVLドメインとをコ−ドするDNA配列を含む構造遺伝子を構築することによって調製される。この構造遺伝子を発現ベクタ−に挿入し、続いてベクタ−をE.coliのような宿主細胞に導入する。組換え体宿主細胞は、二つのVドメインを架橋するリンカ−ペプチドの付いた単鎖のポリペプチド鎖を合成する。sFvsの産生方法は、例えば[Whitlow and Filpula, Methods 2: 97−105 (1991); Bird et al., Science 242:423−426 (1998); Pack et al., Bio/Technology 11:1271−77 (1993);および、参照によりそのまま本明細書に組み入れられる米国特許第4,946,778号]に記載されている。   The Fv fragment includes an association of VH and HL chains. This association can be found in Inbar et al. [Proc. Natl Acad. Sci. USA 69: 2659-62 (19720]) or chemical chains such as those in which the variable chains are joined by intermolecular disulfide bonds or glutaraldehyde. Preferably, the Fv fragment comprises a VH and VL chain linked by a peptide linker, and these single chain antigen binding proteins (sFv) are linked to VH linked using oligonucleotides. It is prepared by constructing a structural gene containing a DNA sequence that encodes a domain and a VL domain, which is inserted into an expression vector, which is then transferred into a host cell such as E. coli. Recombinant host cells synthesize a single polypeptide chain with a linker peptide that crosslinks two V domains, for example, [Whitlow and Filpula, Methods 2: 97- 105 (1991); Bird et al., Sc ience 242: 423-426 (1998); Pack et al., Bio / Technology 11: 1271-77 (1993); and US Pat. No. 4,946,778, incorporated herein by reference in its entirety.

抗体断片の別の形式は、単一の相補性決定領域(CDR)をコ−ドするペプチドである。CDRペプチド(「最小認識単位」)は、関心対象の抗体のCDRをコ−ドする遺伝子を構築することによって得られる。このような遺伝子は、例えば、ポリメラ−ゼチェインリアクションを用いて抗体産生細胞のRNAから可変域を合成することで調製される。例えば、Larrick and Fry[Methods, 2: 106−10 (1991)]を参照せよ。   Another form of antibody fragment is a peptide that codes for a single complementarity determining region (CDR). CDR peptides ("minimal recognition units") are obtained by constructing a gene that codes for the CDRs of the antibody of interest. Such a gene is prepared, for example, by synthesizing a variable region from RNA of an antibody-producing cell using a polymerase-chain reaction. See, for example, Larrick and Fry [Methods, 2: 106-10 (1991)].

ヒト以外(例えばマウス)の抗体のヒト化型は、ヒト以外の免疫グロブリンに由来する最小配列を含有する免疫グロブリン、免疫グロブリン鎖またはその断片(抗体のFv、Fab、Fab'、F(ab')または他の抗原結合サブ配列のような)のキメラ分子である。ヒト化抗体はレシピエントの相補性決定領域(CDR)由来の残基を、マウス、ラットまたはウサギのようなヒト以外の種(ドナ−抗体)の、所望の特異性、、親和性および能力を有する、CDRに由来する残基で置き換えられたヒト免疫グロブリン(レシピエント抗体)を包含する。いくつかの例では、ヒト免疫グロブリンのFvフレ−ムワ−ク残基が、対応するヒト以外の残基で置き換えられている。ヒト化抗体は、レシピエント抗体または移入されたCDRもしくはフレ−ムワ−ク配列にも存在しない残基も含むことがある。一般的には、実質的全てのヒト化抗体は、少なくとも一つ、典型的には二つの可変領域を含み、そのCDR領域の全てまたは実質全てがヒト以外の免疫グロブリンのそれに対応しており、またFR領域の全てまたは実質全てがヒト免疫グロブリンコンセンサス配列のFR領域である。ヒト化抗体はまた、随意、少なくとも一カ所免疫グロブリンの、典型的にはヒト免疫グロブリンの定常域(Fc)を含んでよい[Jones et al., Nature, 321:522−525 (1986); Riechmann et al., Nature, 332:323−329 (1988); およびPresta, Curr. Op. Struct. Biol., 2:593−596 (1992)]。   Humanized forms of non-human (eg, mouse) antibodies include immunoglobulins, immunoglobulin chains or fragments thereof that contain minimal sequences derived from non-human immunoglobulin (antibody Fv, Fab, Fab ′, F (ab ′ ) Or other antigen binding subsequences). Humanized antibodies can be derived from the recipient's complementarity-determining region (CDR) from the desired specificity, affinity and ability of a non-human species (donor antibody) such as mouse, rat or rabbit. Includes human immunoglobulins (recipient antibodies) replaced with residues derived from CDRs. In some examples, human immunoglobulin Fv framework residues are replaced with corresponding non-human residues. Humanized antibodies may also contain residues which are not present in the recipient antibody or in the imported CDR or framework sequences. In general, substantially all humanized antibodies comprise at least one, typically two variable regions, all or substantially all of the CDR regions corresponding to that of non-human immunoglobulin, All or substantially all of the FR region is the FR region of the human immunoglobulin consensus sequence. The humanized antibody may optionally also comprise at least one immunoglobulin region, typically a human immunoglobulin constant region (Fc) [Jones et al., Nature, 321: 522-525 (1986); Riechmann et al., Nature, 332: 323-329 (1988); and Presta, Curr. Op. Struct. Biol., 2: 593-596 (1992)].

ヒト以外の抗体をヒト化する方法は、当技術分野で周知である。一般的には、ヒト化抗体は、ヒト以外の供給源に由来し、その中に導入されたアミノ酸残基を一つまたは複数有している。これらのヒト以外のアミノ酸残基は、移入残基と呼ばれることが多く、それは一般的には移入可変ドメインから取られる。ヒト化は、本質的にWinterと共同研究者らの方法に従い [Jones et al., Nature, 321:522−525 (1986); Riechmann et al., Nature, 332:323−329 (1988); Verhoeyen et al., Science, 239:1534−1536(1988)],齧歯類のCDR配列で対応するヒト抗体の配列を置換して行われる。それゆえに、このようなヒト化抗体はキメラ抗体であり(米国特許第4,816,567号)、この場合実質的無傷なヒト可変ドメインは決して対応するヒト以外の種由来の配列で置換されることはない。実際、ヒト化抗体は一般的には、幾つかのCDR残基と、場合により幾つかのFR残基が齧歯類抗体中の同様の部位に由来する残基によって置き換えられているヒト抗体である。   Methods for humanizing non-human antibodies are well known in the art. Generally, humanized antibodies are derived from sources other than human and have one or more amino acid residues introduced therein. These non-human amino acid residues are often referred to as import residues, which are generally taken from the import variable domain. Humanization essentially follows the method of Winter and co-workers [Jones et al., Nature, 321: 522-525 (1986); Riechmann et al., Nature, 332: 323-329 (1988); Verhoeyen et al., Science, 239: 1534-1536 (1988)], by replacing the corresponding human antibody sequence with the rodent CDR sequence. Therefore, such humanized antibodies are chimeric antibodies (US Pat. No. 4,816,567), in which a substantially intact human variable domain is never replaced with a sequence from the corresponding non-human species. In fact, humanized antibodies are generally human antibodies in which some CDR residues and possibly some FR residues are replaced by residues from similar sites in rodent antibodies. is there.

ヒト抗体はまた、ファ−ジディスプレイライブラリ−[Hoogenboom and Winter, J. Mol. Biol., 227:381 (1991); Marks et al., J. Mol. Biol., 222:581 (1991)]を含む、当技術分野既知の様々な技術を用いても作製できる。ColeらおよびBoernerらの技術は、ヒトモノクロ−ナル抗体の調製にも利用できる(Cole et al., Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, P. 77 (1985)およびBoerner et al., J. Immunol., 147(1):86−95 (1991))。同様に、ヒト抗体はヒト免疫グロブリン遺伝子座を、内因性の免疫グロブリン遺伝子を部分的もしくは完全に不活性化したトランスジェニック動物、例えばマウスに導入site作ることもできる。導入によって、ヒト抗体の産生が観察され、それはは遺伝子配置、アッセンブリ、抗体レパ−トリ−を含め全ての観点においてヒトで見られるものによく似ている。この方法は、例えば米国特許第5,545,807号;第5,545,806号;5,569,825号;第5,625,126号;第5,633,425号;第5,661,016号、ならびに以下の科学出版物に記載されている:Marks et al., Bio/Technology 10:779−782 (1992); Lonberg et al., Nature 368: 856−859 (1994); Morrison, Nature 368 812−13 (1994); Fishwild et al., Nature Biotechnology 14, 845−51 (1996); Neuberger, Nature Biotechnology 14: 826 (1996);およびLonberg and Huszar, Intern Rev. Immunol. 13, 65−93 (1995)。
Human antibodies can also be obtained from fuzzy display libraries [Hoogenboom and Winter, J. Mol. Biol., 227: 381 (1991); Marks et al., J. Mol. Biol., 222: 581 (1991)]. It can also be made using various techniques known in the art, including. The techniques of Cole et al. And Boerner et al. Can also be used to prepare human monoclonal antibodies (Cole et al., Monoclonal Antibodies and Cancer Therapy, Alan R. Liss, P. 77 (1985) and Boerner et al., J Immunol., 147 (1): 86-95 (1991)). Similarly, human antibodies can create sites for the introduction of human immunoglobulin loci into transgenic animals, such as mice, in which endogenous immunoglobulin genes have been partially or completely inactivated. Upon introduction, human antibody production is observed, which is very similar to that seen in humans in all respects, including gene arrangement, assembly, and antibody repertoire. This method is described, for example, in US Pat. Nos. 5,545,807; 5,545,806; 5,569,825; 5,625,126; 5,633,425; 5,661,016, and the following scientific publications: Marks et al., Bio / Technology 10: 779-782 (1992); Lonberg et al., Nature 368: 856-859 (1994); Morrison, Nature 368 812-13 (1994); Fishwild et al., Nature Biotechnology 14, 845-51 (1996) Neuberger, Nature Biotechnology 14: 826 (1996); and Lonberg and Huszar, Intern Rev. Immunol. 13, 65-93 (1995).
.

好ましくは、本発明のこの局面の抗体は、本発明のポリペプチド変異体の少なくとも一つのエピト−プに特異的に結合する。本明細書で用いる場合、用語「エピト−プ」は、抗体のパラト−プが結合する、抗原上の抗原決定基を指す。   Preferably, the antibody of this aspect of the invention specifically binds to at least one epitope of the polypeptide variant of the invention. As used herein, the term “epitop” refers to an antigenic determinant on an antigen to which an antibody paratop binds.

エピト−プ決定因子は、通常はアミノ酸または炭水化物側鎖のような化学的に活性な表面基からなり、また通常は特異的な三次元構造特性、ならびに特異的な電荷特性を有している。   Epitopic determinants usually consist of chemically active surface groups such as amino acids or carbohydrate side chains and usually have specific three-dimensional structural characteristics as well as specific charge characteristics.

要する場合には、以下記載のように糖化および/またはリン酸化を含むが、これに限定されるものではない、一または複数の翻訳後修飾の変更により、変異体内に固有のエピト−プを創ってもよい。このような変更はまた、例えば特定部位の糖化を除去することによって、新たなエピト−プを創り出してもよい。   Where necessary, changes in one or more post-translational modifications create unique epitopes within the mutant, including but not limited to glycation and / or phosphorylation as described below. May be. Such changes may also create new epitopes, for example, by removing glycation at specific sites.

本発明のエピト−プはまた、本発明の変異体の固有配列部分の一部または全てを、直線状のポリペプチド自体においては固有配列部分と連続していない少なくとも一カ所の変異体のその他部分と組み合わせて含んでもよく、これにより組合せのエピト−プを形作ることができる。一または複数の固有配列部分は、一または複数の変異体のその他非連続部分(既知タンパク質の一部と高い相同性を有する部分を含む)と随意組合せ、エピト−プを形作ってもよい。   The epitopes of the present invention may also include some or all of the unique sequence portions of the variants of the present invention and other portions of the variant that are not contiguous with the unique sequence portions in the linear polypeptide itself. May be included in combination to form a combined epitope. One or more unique sequence portions may optionally combine with other non-contiguous portions of one or more variants (including portions having high homology with portions of known proteins) to form epitopes.

免疫アッセイ
本発明の別の態様では、免疫アッセイを用い、サンプル中のマ−カ−を定性的または定量的に検出および分析することができる。この方法は:マ−カ−に特異的に結合する抗体を準備すること;サンプルを抗体に接触させること;およびサンプル中のマ−カ−に結合した抗体の複合体の存在を検出すること、を含む。
Immunoassay In another aspect of the invention, an immunoassay can be used to detect and analyze markers in a sample qualitatively or quantitatively. The method includes: providing an antibody that specifically binds to a marker; contacting the sample with the antibody; and detecting the presence of a complex of antibody bound to the marker in the sample; including.

マ−カ−に特異的に結合する抗体を調製するために、精製タンパク質マ−カ−を用いることができる。タンパク質マ−カ−に特異的に結合する抗体は、当技術分野既知の好適な方法を用いて調製できる。   To prepare an antibody that specifically binds to the marker, a purified protein marker can be used. Antibodies that specifically bind to protein markers can be prepared using suitable methods known in the art.

抗体が準備できたら、数多くあるよく知られた免疫学的結合アッセイのいずれかを用いてマ−カ−を検出および/または定量化できる。有用なアッセイとしては、例えば酵素結合免疫吸着アッセイ(ELISA)のような酵素免疫アッセイ(EIA)、放射免疫アッセイ(RIA)、ウエスタンブロットアッセイ、またはスロットアッセイが挙げられ、例えば米国特許第4,366,241号;第4,376,110号;第4,517,288号;および第4,837,168号を参照せよ)。一般的には、被検者より得たサンプルは、マ−カ−に特異的に結合する抗体に接触させることができる。   Once the antibody is ready, the marker can be detected and / or quantified using any of a number of well-known immunological binding assays. Useful assays include, for example, enzyme immunoassays (EIA) such as enzyme-linked immunosorbent assay (ELISA), radioimmunoassay (RIA), Western blot assay, or slot assay, eg, US Pat. No. 4,366,241; Nos. 4,376,110; 4,517,288; and 4,837,168). In general, a sample obtained from a subject can be contacted with an antibody that specifically binds to the marker.

要する場合には、抗体は固体支持物に固定し、サンプルと抗体を接触する前の洗浄およびその後の複合体の単離を容易にすることができる。固体支持物の例としては、例えばマイクロタイタ−プレ−ト、スティック、ビ−ズまたはマイクロビ−ズの形をしたガラスまたはプラスチックが挙げられるが、これらに限定されるものではない。   If required, the antibody can be immobilized on a solid support to facilitate washing prior to contacting the sample with the antibody and subsequent isolation of the complex. Examples of solid supports include, but are not limited to, glass or plastic in the form of microtiter plates, sticks, beads or microbeads.

サンプルを抗体と共にインキュベ−ションした後、混合物を洗浄し、形成した抗体−マ−カ−複合体を検出することができる。これは、洗浄した混合物を検出試薬と共にインキュベ−ションすることによって成し遂げられる。または、サンプル中のマ−カ−は、例えば第二標識抗体を用いて結合したマ−カ−特異的抗体を検出する間接的アッセイを用いて、および/または、例えばマ−カ−の別のエピト−プに結合するモノクロ−ナル抗体を同時に混合物とインキュベ−ションする競合もしくは阻害アッセイにて検出できる。   After incubating the sample with the antibody, the mixture can be washed and the antibody-marker complex formed can be detected. This is accomplished by incubating the washed mixture with a detection reagent. Alternatively, the marker in the sample may be detected using an indirect assay that detects the marker-specific antibody bound using, for example, a second labeled antibody, and / or another marker, for example, Monoclonal antibodies that bind to the epitope can be detected in competition or inhibition assays that are incubated with the mixture simultaneously.

アッセイを通して、試薬と組み合わせる毎に、その後インキュベ−ションおよび/または洗浄段階が必要であろう。インキュベ−ション段階は、約5秒〜数時間、好ましくは約5分〜約24時間で変えることができる。しかしながら、インキュベ−ション時間は、アッセイの形式、マ−カ−、溶液の量、濃度等に依存するだろう。通常は、アッセイは周囲温度で行われるが、それらは10℃〜40℃といった温度範囲で実施できる。   Throughout the assay, each combination with reagents may require subsequent incubation and / or washing steps. Incubation steps can vary from about 5 seconds to several hours, preferably from about 5 minutes to about 24 hours. However, the incubation time will depend on the assay format, marker, volume of solution, concentration, etc. Usually, assays are performed at ambient temperature, but they can be performed in a temperature range of 10 ° C to 40 ° C.

免疫アッセイを用いて、被検者からのサンプルのマ−カ−試験量を決定することができる。第一にサンプル中のマ−カ−の試験量は上記の免疫アッセイ法を用いて検出できる。サンプルにマ−カ−が存在する場合には、それは上記の好適インキュベ−ション条件の下でマ−カ−に特異的に結合する抗体と共に、抗体−マ−カ−複合体を形成するだろう。抗体−マ−カ−複合体の量は、標準体と比較することによって光学的に測定できる。上記のように、測定単位をコントロ−ル量および/またはシグナルと比較できる場合は、使用したマ−カ−の試験量を絶対単位で測定する必要はない。   An immunoassay can be used to determine the marker test amount of a sample from a subject. First, the test amount of the marker in the sample can be detected using the immunoassay method described above. If a marker is present in the sample, it will form an antibody-marker complex with the antibody that specifically binds to the marker under the preferred incubation conditions described above. . The amount of antibody-marker complex can be measured optically by comparison with a standard. As described above, when the measurement unit can be compared with the control amount and / or the signal, it is not necessary to measure the test amount of the marker used in absolute units.

好ましく用いられる抗体は、例えば、本発明のポリペプチドと特異的に相互作用するが、野生型のタンパク質またはその他のそのイソ型とは相互作用しないものである。このような抗体は、例えば、以下詳しく記載する架橋部、頭部、尾部および挿入部を含むが、これらに限定されるものではない、本発明のポリペプチド変異体の固有配列部分に対するものである。本発明の抗体の好ましい態様は、「抗体」と題した節に詳しく記載されている。   The antibody preferably used is, for example, one that specifically interacts with the polypeptide of the present invention but does not interact with wild-type protein or other isoforms thereof. Such antibodies are directed against the unique sequence portion of the polypeptide variant of the present invention, including but not limited to, for example, but not limited to, the bridge, head, tail and insert described in detail below. . Preferred embodiments of the antibodies of the invention are described in detail in the section entitled “Antibodies”.

放射免疫アッセイ(RIA):一つの型では、この方法は所望する基質を沈降することを含み、以下詳述する方法では、特異的抗体およびアガロ−スビ−ズのような沈降可能な担体上に固定した放射標識された抗体結合タンパク質(例えばI125で標識したプロテインA)
が用いられる。沈降小球のカウント数は、基質の量に比例する。
Radioimmunoassay (RIA): In one type, the method involves precipitating the desired substrate, and in the method described in detail below, on a precipitable carrier such as a specific antibody and agarose beads. Immobilized radiolabeled antibody binding protein (eg protein A labeled with I 125 )
Is used. The number of sedimented globules is proportional to the amount of substrate.

RIAの別の型では、標識された基質および未標識の抗体結合タンパク質が用いられる。量が不明な基質を含むサンプルを、量を変えて加える。標識された基質からの沈殿カウント数の減少と、加えたサンプル中の基質量とが比例する。   Another type of RIA uses a labeled substrate and an unlabeled antibody binding protein. Samples containing an unknown amount of substrate are added in varying amounts. The decrease in the number of precipitation counts from the labeled substrate is proportional to the base mass in the added sample.

酵素結合免疫吸着アッセイ(ELISA):この方法は、タンパク質基質を含有するサンプル(例えば固定された細胞またはタンパク質溶液)を、マイクロタイタ−プレ−トのウエルのような表面に固定することを含む。酵素が連結された基質特異的抗体が加えられ、基質に結合させる。次に、抗体に連結した酵素を使った発色反応によって抗体の存在を検出し定量化する。この方法に一般的に用いられる酵素としては、西洋ワサビペルオキシダ−ゼやアルカリホスファタ−ゼが挙げられる。キャリブレ−ションが良好であり、また反応の直線域内にある場合は、サンプル中に存在する基質の量は、発色量に比例する。一般的には、定量性の精度を上げるために、基質標準物が用いられる。   Enzyme-linked immunosorbent assay (ELISA): This method involves immobilizing a sample (eg, an immobilized cell or protein solution) containing a protein substrate to a surface, such as a well of a microtiter plate. An enzyme-linked substrate specific antibody is added and allowed to bind to the substrate. Next, the presence of the antibody is detected and quantified by a color reaction using an enzyme linked to the antibody. Enzymes commonly used in this method include horseradish peroxidase and alkaline phosphatase. When calibration is good and within the linear range of the reaction, the amount of substrate present in the sample is proportional to the amount of color developed. In general, a substrate standard is used to increase the accuracy of quantification.

ウエスタンブロット:この方法は、アクリルアミドゲルによって基質を他のタンパク質から分離し、続いて基質をメンブレン(例えばナイロンまたはPVDF)に移すことを含む。基質の存在は、次に基質特異的な抗体によって検出され、それは次に抗体結合試薬によって検出される。抗体結合試薬は、例えばプロテインAもしくは他の抗体でよい。抗体結合試薬は、上記のように放射線で標識するか、または酵素を結合することができる。検出はオ−トラジオグラフィ−、発色反応、または化学発光により行える。この方法は、基質量の定量化、および電気泳動中にアクリルアミドゲル内の移動距離を示すメンブレン上の相対位置による同定の両方が可能である。   Western blot: This method involves separating the substrate from other proteins by acrylamide gel, followed by transfer of the substrate to a membrane (eg nylon or PVDF). The presence of the substrate is then detected by a substrate specific antibody, which is then detected by an antibody binding reagent. The antibody binding reagent may be, for example, protein A or other antibody. The antibody binding reagent can be labeled with radiation as described above, or can be conjugated with an enzyme. Detection can be performed by autoradiography, color reaction or chemiluminescence. This method allows both quantification of substrate mass and identification by relative position on the membrane indicating the distance traveled within the acrylamide gel during electrophoresis.

免疫組織化学分析:この方法は、固定細胞中の基質を、基質特異的抗体によってインサイチュ−で検出することを含む。基質特異的抗体は、酵素を結合させても、または蛍光団を結合させてもよい。顕微鏡および主観的評価により検出する。酵素結合抗体を用いる場合は、発色反応が必要となるだろう。   Immunohistochemical analysis: This method involves detecting the substrate in fixed cells in situ with substrate-specific antibodies. The substrate specific antibody may be conjugated with an enzyme or a fluorophore. Detect by microscope and subjective assessment. If enzyme-linked antibodies are used, a color reaction will be required.

蛍光活性化細胞ソ−ティング(FACS):この方法は、基質特異的抗体によって、細胞内の基質をインサイチュ−で検出することを含む。基質特異的抗体は蛍光団に結合している。検出は、光線を通過する時に各細胞から発せられる光線の波長を読取るセルソ−ティング装置を用いて行われる。この方法は、二種類以上の抗体を同時に用いることができる。   Fluorescence activated cell sorting (FACS): This method involves detecting intracellular substrates in situ with substrate specific antibodies. The substrate specific antibody is bound to the fluorophore. Detection is performed using a cell sorting device that reads the wavelength of the light emitted from each cell as it passes through the light. In this method, two or more kinds of antibodies can be used simultaneously.

放射線−イメ−ジング法
これらの方法としては、ポジトロンエミッション断層撮影法(PET)、シングルフォトンエミッションコンピュ−タ断層撮影法(SPECT)が挙げられるが、これらに限定されるものではない。これら技術は共に非侵襲性であり、また、例えば癌細胞の検出といった、広範な組織事象および/または機能を検出および/または測定するのに用いることができる。PETと異なり、SPECTは随意に二種類の標識物を同時に用いることができる。SPECTにはまた、例えば経費および使用可能な標識物のタイプに関するような、別の利点がいくつかある。例えば、米国特許第6,696,686号は乳癌検出へのSPECTの使用を記載しており、
これは参照によって本明細書の中に、本明細書に完全に記載されているものとして組み入れられる。
Radiation-imaging methods These methods include, but are not limited to, positron emission tomography (PET) and single photon emission computer tomography (SPECT). Both of these techniques are non-invasive and can be used to detect and / or measure a wide range of tissue events and / or functions, eg, detection of cancer cells. Unlike PET, SPECT can optionally use two types of labels simultaneously. SPECT also has several other advantages, such as cost and the type of label that can be used. For example, US Pat. No. 6,696,686 describes the use of SPECT for breast cancer detection,
This is incorporated herein by reference as if fully set forth herein.

ディスプレイライブラリ−
本発明のさらに別の局面によって、それぞれが本発明のポリペプチド配列に由来する少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、10〜15、12〜17、15〜20、15〜30または20〜50個の連続するアミノ酸を表示する複数のディスプレイビ−クル(ファ−ジ、ウイルスまたは細菌のような)を含むディスプレイライブラリ−が提供される。
Display library
According to yet another aspect of the invention, at least 6, at least 7, at least 8, at least 9, at least 10, 10-15, 12-17, 15-20, 15-30, each derived from a polypeptide sequence of the invention. Alternatively, a display library comprising a plurality of display vehicles (such as fuzzy, viral or bacterial) displaying 20-50 contiguous amino acids is provided.

このようなディスプレイライブラリ−を構築する方法は当技術分野で周知である。このような方法はあ、例えばYoung AC, et al., "The three−dimensional structures of a polysaccharide binding antibody to Cryptococcus neoformans and its complex with a peptide from a phage display library: implications for the identification of peptide monotopes" J Mol Biol 1997 Dec 12; 274 (4):632−34; Giebel LB et al. "Screening of cyclic peptide phage libraries identifies ligands that bind streptavidin with high affinities" Biochemistry 1995 Nov 28;34(47):15430−5; Davies EL et al., "Selection of specific phage−display antibodies using libraries derived from chicken immunoglobulin genes" J Immunol Methods 1995 Oct 12;186(1):125−35; Jones C RT al. "Current trends in molecular recognition and bioseparation" J Chromatogr A 1995 Jul 14; 707(1):3−22; Deng SJ et al. "Selection of antibody single−chain variable fragments with improved carbohydrate binding by phage display" J Biol Chem 1994 Apr 1;269(13):9533−8に記載されており、これらは参照により本明細書に組み入れられる。   Methods for constructing such display libraries are well known in the art. For example, Young AC, et al., "The three-dimensional structures of a polysaccharide binding antibody to Cryptococcus neoformans and its complex with a peptide from a phage display library: implications for the identification of peptide monotopes" J Mol Biol 1997 Dec 12; 274 (4): 632-34; Giebel LB et al. "Screening of cyclic peptide phage libraries identify ligands that bind streptavidin with high affinities" Biochemistry 1995 Nov 28; 34 (47): 15430-5; Davies EL et al., "Selection of specific phage-display antibodies using libraries derived from chicken immunoglobulin genes" J Immunol Methods 1995 Oct 12; 186 (1): 125-35; Jones C RT al. "Current trends in molecular recognition and bioseparation "J Chromatogr A 1995 Jul 14; 707 (1): 3-22; Deng SJ et al." Selection of antibody single-chain variable fragments with improved carbohydrate binding by phage display "J Biol Chem 1994 Apr 1; 269 (13 ): 9533-8, which are incorporated by reference. Incorporated into the specification.

以下の節は候補マ−カ−例(第一節)およびこれらマ−カ−例の実験デ−タ(第二節)に関係する。   The following sections relate to candidate marker examples (first section) and experimental data for these marker examples (second section).

候補マ−カ−例の節
本節は、その例示的選択方法を含む本発明の配列の例に関する。
Candidate Marker Example Section This section relates to examples of sequences of the present invention including their exemplary selection methods.

本発明の生物分子配列を明らかにするための方法論の説明
ヒトESTおよびcDNAはGenBankバ−ジョン136(2003年6月15日、ftp.ncbi.nih.gov/genbank/release.notes/gb136.release.notes);2003年4月のNCBIゲノムアッセンブリ;2003年6月からのRefSeq配列;GenBankバ−ジョン139(2003年12月);NCBIからのヒトゲノム(ビルド34)(2003年10月から):2003年12月からのSefSeq配列;およびIncyte Corp(Wilmington, DE, USA;ESTのみ)のLifeSeqライブラリ−より得た。GenBank配列に関しては、EST(GBEST)セクションからのヒトEST配列および霊長類(GBPRI)セクションからのヒトmRNA配列を用いた;またヒトヌクレオチドRefSeq mRNA配列も用いた(例えばwww.ncbi.nlm.nih.gov/Genbank/GenbankOverview.htmlを参照し、またESTセクションの参考資料としては、www.ncbi.nlm.nih.gov/dbEST/を参照し;dbESTの一般的参考資料である、GenBankのESTデ−タベ−スはBoguski et al, Nat Genet. 1993 Aug:4(4):332−3に見出すことができる:これらは全て参照によって、本明細書に完全に記載されたものとして本明細書に組み入れられる)。
Description of Methodology for Elucidating Biomolecular Sequences of the Present Invention Human ESTs and cDNA are available from GenBank version 136 (June 15, 2003, ftp.ncbi.nih.gov/genbank/release.notes/gb136.release NCBI genome assembly from April 2003; RefSeq sequence from June 2003; GenBank version 139 (December 2003); human genome from NCBI (Build 34) (from October 2003): SefSeq sequence from December 2003; and LifeSeq library from Incyte Corp (Wilmington, DE, USA; EST only). For the GenBank sequence, the human EST sequence from the EST (GBEST) section and the human mRNA sequence from the primate (GBPRI) section were used; the human nucleotide RefSeq mRNA sequence was also used (eg www.ncbi.nlm.nih. See gov / Genbank / GenbankOverview.html, and for reference material for the EST section, see www.ncbi.nlm.nih.gov/dbEST/; the general reference material for dbEST, GenBank EST data Tabes can be found in Boguski et al, Nat Genet. 1993 Aug: 4 (4): 332-3: all of which are hereby incorporated by reference as if fully set forth herein. ).

新規スプライシング変異体は、Sorek, A., Ast, G. & Graur, D. Alu−containing exons are alternatively spliced. Genome Res 12, 1060−7 (2002);米国特許第6,625,545号;および2004年5月27日に第US20040101876号として公開された米国特許出願第10/426,002号に記載されているLEADSクラスタリングおよびアッセンブリシステムを用いて予測した;これらは全て参照によって、本明細書に完全に記載されたものとして本明細書に組み入れられる。簡単に述べると、ソフトウエアは反復、ベクタ−、および免疫グロブリンに由来する発現配列を一掃する。次にソフトウエアは、発現した配列を、別のスプライシングを考慮に入れながら遺伝子とアラインメントをトリ、重複して発現した配列を、遺伝子または部分遺伝子を表す「クラスタ」にまとめる。   Novel splicing variants are described in Sorek, A., Ast, G. & Graur, D. Alu-containing exons are alternatively spliced. Genome Res 12, 1060-7 (2002); US Pat. No. 6,625,545; and May 2004 Predicted using the LEADS clustering and assembly system described in US patent application Ser. No. 10 / 426,002 published as US20040101876 on 27th; all of which are fully described herein by reference As incorporated herein by reference. Briefly, the software cleans up expression sequences derived from repeats, vectors, and immunoglobulins. The software then groups the expressed sequences into a “cluster” that represents the gene or partial gene, taking into account alternative splicing and matching the gene and alignment.

注釈付けは、GeneCarta(Compugen、Tel−Aviv、Israel)プラットホ−ムを用いて行った。GeneCartaプラットホ−ムは、注釈のリッチプ−ル、配列情報(特にスプライシングされた配列)、染色体情報、アランメント、およびSNP、遺伝子存在論用語、発現プロフィ−ル、機能分析、詳細なドメイン構造、既知および予測タンパク質、ならびに詳細な相同性報告を含む。   Annotation was performed using a GeneCarta (Compugen, Tel-Aviv, Israel) platform. GeneCarta platform is a rich pool of annotations, sequence information (especially spliced sequences), chromosomal information, arrangements, and SNPs, gene ontology terms, expression profiles, functional analysis, detailed domain structure, known And predicted proteins, as well as detailed homology reports.

候補の選択方法について、簡単に説明する。しかし、この説明は説明だけを目的とするものであり、いかなる形でも制限することを意図していないことに注意しなければならない。潜在的マ−カ−は、発現配列のデ−タベ−スを用いて、腫瘍組織で過剰発現している遺伝子および/またはそれらのスプライシング変異体を見つけ出すよう設計されたコンピュ−タ工程によって同定する。ヒトによる分類工程に従って決定された、ESTライブラリ−内の情報に関係した様々なパラメ−タを用いて、癌組織内で過剰発現している遺伝子および/またはそのスプライシング変異体の位置決定を補助した。選択方法の詳しい説明は、以下実施例1に示す。癌生物マ−カ−選択エンジンおよび以下の実験による有効性確認段階をまとめて図1に図示した。   A method for selecting candidates will be briefly described. However, it should be noted that this description is for illustrative purposes only and is not intended to be limiting in any way. Potential markers are identified by a computer process designed to use the database of expressed sequences to find genes and / or their splicing variants that are overexpressed in tumor tissue. . Various parameters related to information in the EST library, determined according to the classification process by humans, were used to help locate the overexpressed gene and / or its splicing variants in cancer tissue . A detailed description of the selection method is given in Example 1 below. The cancer biomarker selection engine and the effectiveness verification stage by the following experiment are summarized in FIG.

実施例1
特異発現遺伝子産物の同定−アルゴリズム
特異的に発現した遺伝子産物と構成的に発現している遺伝子(即ちハウスキ−ピング遺伝子)とを区別するために、頻度分析に基づいたアルゴリズムを組み立てた。癌で過剰発現している転写物を同定するための特殊アルゴリズムを以下に記載する。
Example 1
Identification of specific expressed gene products-algorithms An algorithm based on frequency analysis was constructed to distinguish between specifically expressed gene products and constitutively expressed genes (ie housekeeping genes). A special algorithm for identifying transcripts that are overexpressed in cancer is described below.

理論的な分析
ライブラリ−注釈付け−ESTライブラリ−を、ヒトの手により、以下に従って分類した:
(i) 起源の組織
(ii)供給元の生物−ESTライブラリ−作製の生物学的供給元に頻繁に用いられる例としては、癌細胞株:正常組織;癌組織;胎児組織;およびその他、正常細胞株や正常細胞株のプ−ル、癌細胞株およびその組合せ等が挙げられる。これら組織/細胞株に関して以下に用いられる略語の具体的説明は先に示した。
(iii)ライブラリ−構築のプロトコ−ル−ライブラリ−構築の方法については、正規化ライブラリ−構築;非正規化ライブラリ−構築;減算ライブラリ−;ORESTES等を含む様々な方法が当技術分野で知られている。ここではライブラリ−構築のプロトコ−ルを目的としていないことが理解されるだろう。
Theoretical analysis The library-annotated-EST library- was classified by human hands according to the following:
(i) Origin organization
(ii) Biological source-EST library-Examples of frequently used biological sources for production include cancer cell lines: normal tissues; cancer tissues; fetal tissues; and other normal cell lines and normal cell lines. And pools, cancer cell lines and combinations thereof. Specific explanations of the abbreviations used below for these tissues / cell lines are given above.
(iii) Library-construction protocol-Library-Construction methods are known in the art, including normalized library-construction; denormalized library-construction; subtraction library--ORESTES, etc. ing. It will be understood that this is not intended as a library construction protocol.

次の規則に従った:
同一の生物サンプルに由来するESTライブラリ−は、単一のライブラリ−とした。
The following rules were followed:
An EST library derived from the same biological sample was a single library.

例えばDNA汚染のような平均以上のレベルの汚染があるESTライブラリ−は排除した。このような汚染の存在は、次のようにして決定した。各ライブラリ−について、別のスプライシングされた配列内に完全には組み込まれていないスプライシングされていないESTの数を数えた。このような配列のパ−センテ−ジ(残り全ての配列に比べて)が、分析対象の全ライブラリ−の平均値よりも少なくとも4標準偏差高い場合には、このライブラリ−は汚染されているというタグを付け、以下の分析での更なる検討から外した(詳しくはSorek, R. & Safer, H.M. A novel algorithm for computational identification of contaminated EST libraries. Nucleic Acids Res 31, 1067−74 (2003) を参照)。   EST libraries with above average levels of contamination such as DNA contamination were excluded. The presence of such contamination was determined as follows. For each library, the number of unspliced ESTs that were not fully integrated within another spliced sequence was counted. A library is contaminated if the percentage of such a sequence (compared to all remaining sequences) is at least 4 standard deviations higher than the average of all the libraries analyzed. Tagged and removed from further consideration in the following analysis (see Sorek, R. & Safer, HM A novel algorithm for computational identification of contaminated EST libraries. Nucleic Acids Res 31, 1067-74 (2003) ).

関心対象の組織由来の配列を少なくとも二つ含む配列を少なくとも五つ有するクラスタ(遺伝子)を分析した。スプライシング変異体は、上記のLEADSソフトウエアパッケ−ジを用いて同定した。   Clusters (genes) having at least five sequences containing at least two sequences from the tissue of interest were analyzed. Splicing variants were identified using the LEADS software package described above.

実施例2
癌で過剰発現している遺伝子の同定
二種類のスコアリングアルゴリズムを開発した。
Example 2
Identification of over-expressed genes in cancer Two types of scoring algorithms have been developed.

ライブラリ−スコア−複数の癌ライブラリ−によって支持された候補配列は、特異的および効果的な診断マ−カ−になる可能性がより高い。   Candidate sequences supported by a library—score—multiple cancer libraries—are more likely to be specific and effective diagnostic markers.

基本アルゴリズム−各クラスタについて、そのクラスタに配列を加えている癌および正常ライブラリ−の数を数えた。フィシャ−の直接検定を用いて、癌ライブラリ−がクラスタ内において、癌および正常ライブラリ−の総数に比べ、有意に過剰に表現されているか確認した。   The basic algorithm—for each cluster, the number of cancer and normal libraries that added sequences to that cluster was counted. Fisher's direct test was used to determine if the cancer library was significantly overexpressed in the cluster compared to the total number of cancer and normal libraries.

ライブラリ−計測:小型のライブラリ−(例えば1000配列未満)は、それらがクラスタ内に存在しないかぎり、検討対象から外した。それ故に、ライブラリ−の総数は、実際には各クラスタについて調整されている。   Libraries-Instrumentation: Small libraries (eg, less than 1000 sequences) were excluded from consideration unless they were in a cluster. Therefore, the total number of libraries is actually adjusted for each cluster.

クロ−ン数スコア−一般に、ESTの数が、正常ライブラリ−に比べ癌ライブラリ−で遙かに多い場合は、実際に過剰発現していることを示す。   The clone number score—generally, the number of ESTs is much higher in the cancer library than in the normal library, indicating that it is actually overexpressed.

アルゴリズム−
クロ−ン計測:ESTクロ−ンの計測では、プロトコ−ルがどれだけ実際の発現レベルを反映しているかについての我々の判断に基づいて、各ライブラリ−のプロトコ−ル分類に重み付けを行った:
(i)非正規化:1
(ii)正規化:2
(iii)その他全ての分類:0.1
Algorithm
Clone measurement: In the EST clone measurement, the protocol classification of each library was weighted based on our judgment as to how much the protocol reflects the actual expression level. :
(i) Denormalization: 1
(ii) Normalization: 2
(iii) All other categories: 0.1

クロ−ン数スコア−癌ライブラリ−からのESTクロ−ンの重み付き後の総数を、正常ライブラリ−からのESTクロ−ンと比較した。一つのライブラリ−がスコアに大きく影響するのを回避するために、あるクラスタについて最も多くクロ−ンを付与するライブラリ−の関与を、2クロ−ンに制限した。   The total number of weighted EST clones from the clone score score-cancer library was compared to the EST clones from the normal library. In order to avoid having a single library significantly affect the score, the involvement of the library that gave the most clones for a cluster was limited to 2 clones.

スコアは下式に従って計算した

Figure 2007520217
式中:
c−クラスタ内の「癌」クロ−ンの重み付き数
C−全「癌」ライブラリ−中のクロ−ンの重み付き数
n−クラスタ内の「正常」クロ−ンの重み付き数
N−全「正常」ライブラリ−中のクロ−ンの重み付き数 The score was calculated according to the following formula
Figure 2007520217
In the formula:
c-weighted number of "cancer" clones in the cluster
C-Weighted number of clones in all "cancer" libraries
n-weighted number of "normal" clones in the cluster
N-Weighted number of clones in all "normal" libraries

クロ−ン数スコア有意性−フィッシャ−の直接検定を用い、癌および正常ライブラリ−からの全てのESTクロ−ンと比較した時に癌ライブラリ−からのESTクロ−ンがクラスタ内で有意に過剰に表現されているか調べた。   Significant excess of EST clones from the cancer library in the cluster when compared to all EST clones from cancer and normal libraries using a direct test of clone number score significance-Fischer I checked whether it was expressed.

二種類の検索方法を用いて、一般的な癌特異的候補体または腫瘍特異的候補体を見出した。
・腫瘍組織に由来するライブラリ−/配列を検索対象にし、さらに癌細胞株由来のライブラリ−についても対象とする(「正常」細胞株は無視した)
・腫瘍組織由来のライブラリ−/配列のみを検索対象とする
Two types of search methods were used to find general cancer-specific candidates or tumor-specific candidates.
・ Search for libraries derived from tumor tissues / sequences, and also libraries derived from cancer cell lines (ignoring “normal” cell lines)
・ Search only for tumor tissue-derived libraries / sequences

実施例3
組織特異的遺伝子の同定
組織特異的クラスタの検出では、組織ライブラリ−/配列をクラスタ内の全てのライブラリ−/配列と比較した。上記記載のものと同様の統計ツ−ルを用い、組織特異的遺伝子を同定した。組織の略語は、癌組織のものと同じであるが、「正常組織」というヘッダ−を用いて表示されている。
Example 3
Identification of Tissue Specific Genes For detection of tissue specific clusters, tissue libraries / sequences were compared to all libraries / sequences within the clusters. Tissue specific genes were identified using statistical tools similar to those described above. The abbreviation of the tissue is the same as that of the cancer tissue, but is displayed using the header “normal tissue”.

アルゴリズム−試験した各組織Tおよび試験した各クラスタについては、以下の点について調べた:
1.各クラスタは、組織Tからのライブラリ−を少なくとも2つ含む。少なくとも3クロ−ン(上記のように重み付けした)がクラスタ内の組織Tに由来する;そして
2.組織Tからのクロ−ンは、試験したクラスタに関与する全てのクロ−ンの少なくとも40%である
Algorithm-For each tissue T tested and each cluster tested, the following points were investigated:
1. Each cluster contains at least two libraries from organization T. At least 3 clones (weighted as above) are from tissue T in the cluster; and
2. The clone from tissue T is at least 40% of all the clones involved in the tested cluster

ライブラリ−および重み付きクロ−ンのカウントをフィッシャ−の直接検定を計算し、カウントが統計学的有意であるか調べた。   Library and weighted clone counts were calculated by Fisher's direct test to see if the counts were statistically significant.

実施例4
癌では過剰発現していないが、癌クラスタで過剰発現しているスプライシング変異体の同定
固有領域を含む癌特異的スプライシング変態を同定した
スプライシング変異体内の固有配列領域の同定
ある領域は、各スプライシング変異体に常にまとまって見られる、または見られない近接エクソンの群として定義されている。
Example 4
Identification of a splicing variant that has identified a cancer-specific splicing variant that includes a unique region of a splicing variant that is not overexpressed in cancer but overexpressed in a cancer cluster
A region is defined as a group of contiguous exons that are or are not always found together in each splicing variant.

「セグメント」(「seg」または「node」とも呼ばれることがある)は、内側に既知スプライシングのない、最も短い、連続して転写される領域として定義される。   A “segment” (sometimes referred to as “seg” or “node”) is defined as the shortest, continuously transcribed region with no known splicing inside.

信頼できるESTのみを分析対象の領域およびセグメントとした。以下に相当する場合、そのESTは信頼できないとした:
(i)スプライシングされていない;
(ii)RNAがカバ−していない;
(iii)スプライシングしたESTがカバ−していない;および
(iv)長いポリAストレッチの近くに終わるか、または長いポリTストレッチの近くから始まるゲノムとアラインメントが取れる場合。
Only trusted ESTs were analyzed areas and segments. An EST is considered unreliable if:
(i) not spliced;
(ii) RNA is not covered;
(iii) The spliced EST is not covered; and
(iv) A genome can be aligned with a long poly A stretch that ends or begins near a long poly T stretch.

信頼できる領域のみ選び、さらにスコア化した。以下に該当するとき、固有の配列領域は信頼できると考えた:
(i)ゲノムとアラインメントが取れる;および
(ii)2EST以上に支持された領域であるとき。
Only reliable areas were selected and scored. A unique sequence region was considered reliable when the following were true:
(i) be aligned with the genome; and
(ii) When the region is supported by 2EST or more.

アルゴリズム
各固有配列領域は、次の2転写物セット群に分けられる:
(i)この領域を含む転写物(群TA)
(ii)この領域を含まない転写物(群TB)
Algorithm Each unique sequence region is divided into two transcript sets:
(i) Transcript containing this region (group TA)
(ii) Transcript not containing this region (group TB)

クラスタのESTクロ−ンのセットは全て次の3群に分けられる:
(i)群TAの裏付けされた(それに由来する)転写物(S1)
(ii)群TBの裏付けされた転写物(S2)
(iii)両群からの、裏付けされた転写物(S3)
All sets of cluster EST clones are divided into three groups:
(i) Transcript backed by (derived from) group TA (S1)
(ii) Transcript backed by group TB (S2)
(iii) Backed transcripts from both groups (S3)

上記ライブラリ−およびクロ−ンの数値スコアはS1群に与えられた。   The library and clone numerical scores were given to the S1 group.

フィッシャ−の直接検定P−値を用いて、以下の点について調べた:
S1はS2に比べて、癌ESTクロ−ンが有意に多いか;および
S1はバックグランドクラスタ(S1+S2+S3)に比べ、癌ESTクロ−ンが有意に多いか。
The Fisher's direct test P-value was used to investigate the following points:
S1 has significantly more cancer EST clones than S2; and
Is S1 significantly more cancer EST clones than background clusters (S1 + S2 + S3)?

結果の固有配列領域の同定および転写物群の分割を図2に示した。これら固有配列領域はそれぞれ、本明細書では「ノ−ド(node)」と名付けられたセグメントに対応している。   The identification of the resulting unique sequence region and the division of the transcript group are shown in FIG. Each of these unique sequence regions correspond to a segment named herein “node”.

領域1:全ての転写物に共通であり、かくしてこの領域は変異体の間で異なる発現を決定するものとは考えられない;領域2;転写物1に特異的;領域3:転写物2+3に特異的;領域4:転写物3に特異的;領域5:転写物1および2に特異的;領域6;転写物1に特異的。   Region 1: Common to all transcripts and thus this region is not considered to determine differential expression among variants; Region 2: Specific to transcript 1; Region 3: Transcript 2+ Specific to 3; region 4: specific to transcript 3; region 5: specific to transcripts 1 and 2; region 6; specific to transcript 1.

実施例5
癌で過剰発現している遺伝子の癌特異的スプライシング変異体の同定
次の遺伝子の、ESTで裏付けされた(mRNAのない)領域の検索:
(i)既知遺伝子マ−カ−
(ii)公表されているマイクロアレイ実験で、癌で過剰発現することが示されている遺伝子。
Example 5
Identification of cancer-specific splicing variants of genes overexpressed in cancer Search for EST-supported (no mRNA) regions of the following genes:
(i) Known gene marker
(ii) Genes that have been shown to be overexpressed in cancer in published microarray experiments.

信頼できる、ESTで裏付けられた領域は、次の事項の最低一つによって裏付けられているものとして定義した:
(i)3つのスプライシングしたEST;または
(ii)2つのライブラリ−からの2つのスプライシングしたEST;
(iii)2つのライブラリ−からの10のスプライシングされていないEST、または
(iv)3つのライブラリ−
A trusted, EST-backed area was defined as being backed by at least one of the following:
(i) 3 spliced ESTs; or
(ii) two spliced ESTs from two libraries;
(iii) 10 unspliced ESTs from 2 libraries, or
(iv) Three libraries

実際のマ−カ−の例
次の実施例は、具体的な、実際のマ−カ−例に関する。
Actual Marker Example The following example relates to a specific, actual marker example.

実験例の節
本節は、これら配列が関係する実験を記載した実施例、およびその方法、アッセイおよび使用の、例示てきな非限定例に関する。全ての実験において、実施した作業の基本として用いた材料と実験手順についてまず説明する。
Experimental Section This section relates to examples that describe experiments involving these sequences, and non-limiting examples that have been exemplified in their methods, assays and uses. In all experiments, the materials and experimental procedures used as the basis of the work performed will be described first.

本発明のマ−カ−を、各種の癌および非癌組織サンプルでのそれらの発現について試験した。パネルに用いたサンプルの説明を下表1に示す。正常組織パネル内に用いられたサンプルの説明は、下表2に示す。次に試験は、以下の「材料と方法」の節に記載されているように実施した。   The markers of the present invention were tested for their expression in various cancer and non-cancerous tissue samples. Table 1 below describes the samples used for the panel. A description of the samples used in the normal tissue panel is shown in Table 2 below. The test was then performed as described in the “Materials and Methods” section below.

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

材料および実験手順
RNA調製−RNAはClontech(Franklin lakes、NJ USA 07417、www.clontech.com)、BioChain Inst. Inc.(Hayward、CA 94545 USA www.biochain.com)、ABS(Wilmington、DE 19801、USA、http:www.absbioreagents.com)またはAmbion(Austin、TX 78744 USA、http://www.ambion.com)より得た。またはRNAはTRI−Reagent(Molecular Research Center)を、製造元の指示書に従って使用し、組織サンプルより作製した。組織およびRNAサンプルは、患者からか検死体より得た。ト−タルRNAサンプルはDNaseI(Ambion)で処理してから、RNeasyカラム(Qiagen)を用いて精製した。
Materials and experimental procedures
RNA preparation-RNA is available from Clontech (Franklin lakes, NJ USA 07417, www.clontech.com), BioChain Inst. Inc. (Hayward, CA 94545 USA www.biochain.com), ABS (Wilmington, DE 19801, USA, http: www.absbioreagents.com) or Ambion (Austin, TX 78744 USA, http://www.ambion.com). Alternatively, RNA was prepared from tissue samples using TRI-Reagent (Molecular Research Center) according to the manufacturer's instructions. Tissue and RNA samples were obtained from patients or from autopsies. The total RNA sample was treated with DNase I (Ambion) and then purified using an RNeasy column (Qiagen).

RT−PCR−精製したRNA(1μg)を150ngのRandom Hexamerプライマ−(Invitrogen)および500μMのdNTPと、合計容積15.6μlになるように混合した。混合物を5分間、65℃でインキュベ−ションしてから、氷を用い急冷した。その後、5μlの5X SuperscriptII first strandバッファ−(Invitrogen)、2.4μlの0.1M DTTおよび40単位のRNasin(Promega)を加えて、混合物を10分間25℃でインキュベ−ションし、さらに続けて42℃で2分間インキュベ−ションした。次に1μl(200単位)のSuperscriptII(Invitrogen)を加え、反応液(最終容積25μl)を50分間、42℃でインキュベ−ションしてから70℃で15分間不活性化した。得られたcDNAはTEバッファ−(10mM Tris pH=8、1mM EDTA pH=8)を用いて1:20に希釈した。   RT-PCR-purified RNA (1 μg) was mixed with 150 ng Random Hexamer primer (Invitrogen) and 500 μM dNTPs for a total volume of 15.6 μl. The mixture was incubated for 5 minutes at 65 ° C. and then quenched with ice. Then 5 μl of 5X Superscript II first strand buffer (Invitrogen), 2.4 μl 0.1 M DTT and 40 units of RNasin (Promega) were added and the mixture was incubated for 10 minutes at 25 ° C., followed by 42 ° C. Incubated for 2 minutes. Then 1 μl (200 units) Superscript II (Invitrogen) was added and the reaction (final volume 25 μl) was incubated for 50 minutes at 42 ° C. and then inactivated at 70 ° C. for 15 minutes. The obtained cDNA was diluted 1:20 using TE buffer (10 mM Tris pH = 8, 1 mM EDTA pH = 8).

リアルタイムRT−PCR分析−上記のように調製したcDNA(5μl)を、特異プライマ−とUNG酵素(EurogentechまたはABIまたはRoche)を用いたSYBR Green Iアッセイ(PE Applied Biosysem)によるリアルタイムPCR反応の鋳型に用いた。増幅は次のように行った:50℃で2分間、95℃で10分間、次に95℃で15秒間に続けて60℃で1分間のサイクルを40回。検出はPE Applied Biosystem SDS7000を用いて行った。反応が蛍光の閾値(Ct)に達したサイクルを記録し、これを用いてRT反応中の転写物の相対量を計算した。この相対量は、式Q=効率Λ−Ctを用いて計算した。PCR反応の効率は、いくつかの逆転写(RT)反応物を連続希釈したものを用いて作製した標準曲線から計算した。RT反応の固有差を最小限にとどめるために、得られた相対量を、幾つかのハウスキ−ピング(HSKP)遺伝子の相対量の相乗平均について正規化した。定量的リアルタイムPCR分析の概略図を図3に示す。示したように、x軸はサイクル数を表す。CTは、実験に設定された蛍光閾値と増幅曲線が交叉するサイクルである、閾値サイクル点である。この点は、PCR産物のシグナルがバックグランドレベルより上にあり(受動色素ROX)、且つ相乗/対数期(示すように、蛍光のレベルが測定閾値と交叉すると、それは相乗増加期となり、その間測定値は最も正確になり、その後に直線期と定常期が続く;定量測定に関して後者二つの期は正確な測定値を提供しない)にある計算サイクル数である。y軸は、正規化されたレポ−タ−蛍光を表す。このタイプの分析は相対的定量値を提供することに注意しなければならない。 Real-time RT-PCR analysis-cDNA prepared as described above (5 μl) is used as a template for real-time PCR reaction by SYBR Green I assay (PE Applied Biosysem) using specific primer and UNG enzyme (Eurogentech or ABI or Roche) Using. Amplification was performed as follows: 50 ° C for 2 minutes, 95 ° C for 10 minutes, then 95 ° C for 15 seconds followed by 40 cycles of 60 ° C for 1 minute. Detection was performed using PE Applied Biosystem SDS7000. The cycle at which the reaction reached the fluorescence threshold (Ct) was recorded and used to calculate the relative amount of transcript during the RT reaction. This relative amount was calculated using the formula Q = efficiency Λ−Ct . The efficiency of the PCR reaction was calculated from a standard curve generated using serial dilutions of several reverse transcription (RT) reactions. In order to minimize the inherent differences in RT responses, the relative amounts obtained were normalized with respect to the geometric mean of the relative amounts of several housekeeping (HSKP) genes. A schematic of quantitative real-time PCR analysis is shown in FIG. As shown, the x-axis represents the number of cycles. CT is a threshold cycle point, which is a cycle in which the fluorescence threshold set in the experiment and the amplification curve intersect. This is because the PCR product signal is above the background level (passive dye ROX) and synergistic / logarithmic phase (as shown, when the level of fluorescence crosses the measurement threshold, it becomes a synergistic increasing period, during which The value is the most accurate, followed by a linear phase and a stationary phase; for quantitative measurements, the latter two phases do not provide accurate measurements). The y-axis represents normalized reporter fluorescence. It should be noted that this type of analysis provides a relative quantitative value.

乳癌パネルについての全実施例で測定したハウスキ−ピング遺伝子の配列は次の通りである:
G6PD (GenBank アクセッション番号NM_000402)
G6PD フォワ−ドプライマ−: gaggccgtcaccaagaacat
G6PD リバ−スプライマ−: ggacagccggtcagagctc
G6PD−アンプリコン:
gaggccgtcaccaagaacattcacgagtcctgcatgagccagataggctggaaccgcatcatcgtggagaagcccttcgggagggacct gcagagctctgaccggctgtcc

SDHA (GenBank アクセッション番号NM_004168)
SDHA フォワ−ドプライマ−: TGGGAACAAGAGGGCATCTG
SDHA リバ−スプライマ−: CCACCACTGCATCAAATTCATG
SDHA−アンプリコン:
TGGGAACAAGAGGGCATCTGCTAAAGTTTCAGATTCCATTTCTGCTCAGTATCCAGTAGTGGATCATGAATTTGATGCAGTGGTGG

PBGD (GenBank アクセッション番号BC019323),
PBGD フォワ−ドプライマ−: TGAGAGTGATTCGCGTGGG
PBGD リバ−スプライマ−: CCAGGGTACGAGGCTTTCAAT
PBGD−アンプリコン:
TGAGAGTGATTCGCGTGGGTACCCGCAAGAGCCAGCTTGCTCGCATACAGACGGACAGTGTGGTGGCAACATTGAAAGCCTCGTACCCTGG

HPRT1 (GenBank アクセッション番号NM_000194),
HPRT1フォワ−ドプライマ−:TGACACTGGCAAAACAATGCA
HPRT1リバ−スプライマ−: GGTCCTTTTCACCAGCAAGCT
HPRT1−アンプリコン: TGACACTGGCAAAACAATGCAGACTTTGCTTTCCTTGGTCAGGCAGTATAATCCAAAGATQGTCAAGGTCGCAAGCTTGCTGGTGAAAAGGACC
The sequence of the housekeeping gene measured in all examples for the breast cancer panel is as follows:
G6PD (GenBank accession number NM_000402)
G6PD forward primer: gaggccgtcaccaagaacat
G6PD River Primer: ggacagccggtcagagctc
G6PD-Amplicon:
gaggccgtcaccaagaacattcacgagtcctgcatgagccagataggctggaaccgcatcatcgtggagaagcccttcgggagggacct gcagagctctgaccggctgtcc

SDHA (GenBank accession number NM_004168)
SDHA forward primer: TGGGAACAAGAGGGCATCTG
SDHA River Primer: CCACCACTGCATCAAATTCATG
SDHA-Amplicon:
TGGGAACAAGAGGGCATCTGCTAAAGTTTCAGATTCCATTTCTGCTCAGTATCCAGTAGTGGATCATGAATTTGATGCAGTGGTGG

PBGD (GenBank accession number BC019323),
PBGD Forward Primer: TGAGAGTGATTCGCGTGGG
PBGD River Primer: CCAGGGTACGAGGCTTTCAAT
PBGD-Amplicon:
TGAGAGTGATTCGCGTGGGTACCCGCAAGAGCCAGCTTGCTCGCATACAGACGGACAGTGTGGTGGCAACATTGAAAGCCTCGTACCCTGG

HPRT1 (GenBank accession number NM_000194),
HPRT1 forward primer: TGACACTGGCAAAACAATGCA
HPRT1 River Primer: GGTCCTTTTCACCAGCAAGCT
HPRT1-Amplicon: TGACACTGGCAAAACAATGCAGACTTTGCTTTCCTTGGTCAGGCAGTATAATCCAAAGATQGTCAAGGTCGCAAGCTTGCTGGTGAAAAGGACC

正常組織サンプルパネルの全ての実施例について測定したハウスキ−ピング遺伝子の配列は次の通りである:
RPL19 (GenBank アクセッション番号NM_000981),
RPL19フォワ−ドプライマ−: TGGCAAGAAGAAGGTCTGGTTAG
RPL19リバ−スプライマ−: TGATCAGCCCATCTTTGATGAG
RPL19−アンプリコン: TGGCAAGAAGAAGGTCTGGTTAGACCCCAATGAGACCAATGAAATCGCCAATGCCAACTCCCGTCAGCAGATCCGGAAGCTCATCAAAGATGGGCTGATCA
TATA box (GenBank アクセッション番号 NM_003194),
TATA boxフォワ−ドプライマ−: CGGTTTGCTGCGGTAATCAT
TATA boxリバ−スプライマ−: TTTCTTGCTGCCAGTCTGGAC
TATA box−アンプリコン:
CGGTTTGCTGCGGTAATCATGAGGATAAGAGAGCCACGAACCACGGCACTGATTTTCAGTTCTGGGAAAATGGTGTGCACAGGAGCCAAGAGTGAAGAACAGTCCAGACTGGCAGCAAGAAA
UBC (GenBank アクセッション番号BC000449)
UBC フォワ−ドプライマ−: ATTTGGGTCGCGGTTCTTG
UBCリバ−スプライマ−: TGCCTTGACATTCTCGATGGT
UBC−アンプリコン:
ATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGACAATGCAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGGTTGAGCCCAGTGACACCATCGAGAATGTCAAGGCA
SDHA (GenBank アクセッション番号NM_004168)
SDHAフォワ−ドプライマ−: TGGGAACAAGAGGGCATCTG
SDHAリバ−スプライマ−: CCACCACTGCATCAAATTCATG
SDHA−アンプリコン:
TGGGAACAAGAGGGCATCTGCTAAAGTTTCAGATTCCATTTCTGCTCAGTATCCAGTAGTGGATCATGAATTTGATGCAGTGGTGG
The sequence of housekeeping genes measured for all examples of normal tissue sample panels is as follows:
RPL19 (GenBank accession number NM_000981),
RPL19 Forward Primer: TGGCAAGAAGAAGGTCTGGTTAG
RPL19 River Primer: TGATCAGCCCATCTTTGATGAG
RPL19-Amplicon: TGGCAAGAAGAAGGTCTGGTTAGACCCCAATGAGACCAATGAAATCGCCAATGCCAACTCCCGTCAGCAGATCCGGAAGCTCATCAAAGATGGGCTGATCA
TATA box (GenBank accession number NM_003194),
TATA box forward primer: CGGTTTGCTGCGGTAATCAT
TATA box River Primer: TTTCTTGCTGCCAGTCTGGAC
TATA box-amplicon:
CGGTTTGCTGCGGTAATCATGAGGATAAGAGAGCCACGAACCACGGCACTGATTTTCAGTTCTGGGAAAATGGTGTGCACAGGAGCCAAGAGTGAAGAACAGTCCAGACTGGCAGCAAGAAA
UBC (GenBank accession number BC000449)
UBC Forward Primer: ATTTGGGTCGCGGTTCTTG
UBC River Primer: TGCCTTGACATTCTCGATGGT
UBC-Amplicon:
ATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGACAATGCAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGGTTGAGCCCAGTGACACCATCGAGAATGTCAAGGCA
SDHA (GenBank accession number NM_004168)
SDHA forward primer: TGGGAACAAGAGGGCATCTG
SDHA River Primer: CCACCACTGCATCAAATTCATG
SDHA-Amplicon:
TGGGAACAAGAGGGCATCTGCTAAAGTTTCAGATTCCATTTCTGCTCAGTATCCAGTAGTGGATCATGAATTTGATGCAGTGGTGG

オリゴヌクレオチドをベ−スにしたマイクロアレイ実験のプロトコ−ル
マイクロアレイの作製
マイクロアレイ(チップ)は、BioRobotics Limited(Cambridge, UK)社製MicroGrid II MGII 600ロボットを用いたピンデポジションにより印刷した。50−merのオリゴヌクレオチド標的配列は、Compugen Ltd(Tel−Aviv, IL)により、Shosahn et al, "Optical technologies and informatics", Proceedings of SPIE. Vol 4266, pp.86−95 (2001)に記載のようにして設計した。設計したオリゴヌクレオチドはSigma−Genosys system(The Woodlands, TX, US)を用いて合成および脱塩して精製し、全てのオリゴヌクレオチドに、5'末端にC6アミノ修飾リンカ−を結合するか、またはCodeLinkスライド(カタログ番号25−6700−01、Amersham Bioscience, Piscataway, NJ, US)に直接取り付けた。標的配列を形成している50−merのオリゴヌクレオチドをまずUltra−pure DDW(カタログ番号01−866−1A Kibbutz Beit−Haemek, Israel)に50μMの濃度に懸濁した。スライドを印刷する前に、オリゴヌクレオチドを300mMのリン酸ナトリウム(pH8.5)に最終濃度150mMになるように懸濁し、35〜40%の相対湿度、21℃で印刷した。
Protocol microarray preparation for oligonucleotide-based microarray experiments Microarrays (chips) were printed by pin deposition using a MicroGrid II MGII 600 robot from BioRobotics Limited (Cambridge, UK). The 50-mer oligonucleotide target sequence is described by Compugen Ltd (Tel-Aviv, IL) in Shosahn et al, "Optical technologies and informatics", Proceedings of SPIE. Vol 4266, pp. 86-95 (2001). Designed. The designed oligonucleotides are synthesized and desalted using the Sigma-Genosys system (The Woodlands, TX, US) and purified, and all oligonucleotides have a C6 amino-modified linker attached to the 5 ′ end, or Attached directly to CodeLink slides (Catalog No. 25-6700-01, Amersham Bioscience, Piscataway, NJ, US). The 50-mer oligonucleotide forming the target sequence was first suspended in Ultra-pure DDW (catalog number 01-866-1A Kibbutz Beit-Haemek, Israel) at a concentration of 50 μM. Prior to printing the slides, the oligonucleotides were suspended in 300 mM sodium phosphate (pH 8.5) to a final concentration of 150 mM and printed at 35-40% relative humidity, 21 ° C.

各スライドは32のサブアレイの中に合計9792個のスポット(feature)を含んでいる。これらスポットの内4224個のスポットは本発明の関心対象配列および陰性コントロ−ルであり、いずれも二重に印刷されている。さらに288個のスポット(三重に印刷された96個の標的配列)はHuman Evaluation Library2、Compugen Ltd, Israelからのハウスキ−ピング遺伝子を含んでいる。別の384個のスポットはE.coliスパイク1〜6であり、これらはArray Control製品に商業的に利用できるE−Coli遺伝子に対するオリゴである(アレイコントロ−ルセンスオリゴスポット、Ambion Inc. Austin, TX.カタログ番号1781、ロット番号112K06)。   Each slide contains a total of 9792 features in 32 subarrays. Of these spots, 4224 spots are the sequences of interest and negative controls of the present invention, both of which are printed in duplicate. An additional 288 spots (96 target sequences printed in triplicate) contain the housekeeping genes from Human Evaluation Library 2, Compugen Ltd, Israel. Another 384 spots are E. coli spikes 1-6, which are oligos for the E-Coli gene commercially available for Array Control products (array control sense oligospots, Ambion Inc. Austin, TX. Catalog number 1781, lot number 112K06).

プリントしたスライドのカップリング後処理
ガラス(CodeLink)スライドにオリゴヌクレオチドをスポッティングした後、スライドを24時間、密封された飽和NaCl蒸気チャンバ−内(相対湿度70〜75%)でインキュベ−ションした。
Post-Coupling Treatment of Printed Slides After spotting oligonucleotides on glass (CodeLink) slides, the slides were incubated for 24 hours in a sealed saturated NaCl vapor chamber (70-75% relative humidity).

スライドをブロッキング溶液(0.1M Tris、50mMエタノ−ルアミン、0.1%SDSを含有するバッファ−、10ml/スライド)の中で、50℃、15分間インキュベ−ションし、スライドの残存反応基をブロッキング処理した。次にスライドを二回Ultra−pure DDW(二回蒸留水)で濯いだ。つぎにスライドを洗浄溶液(10ml/スライド、4XSSC、0.1%SDS)を用いて、50℃で30分間、振盪装置を用いて洗浄した。次にスライドをUltra−pure DDWで二回濯ぎ、続いて3分間、800rpmで遠心分離して乾燥させた。   The slide was incubated in blocking solution (buffer containing 0.1M Tris, 50 mM ethanolamine, 0.1% SDS, 10 ml / slide) at 50 ° C. for 15 minutes to block the remaining reactive groups on the slide. . The slides were then rinsed twice with Ultra-pure DDW (double distilled water). Next, the slide was washed with a shaking solution using a washing solution (10 ml / slide, 4XSSC, 0.1% SDS) at 50 ° C. for 30 minutes. The slides were then rinsed twice with Ultra-pure DDW, followed by drying for 3 minutes by centrifugation at 800 rpm.

次に、水和作業の自動運転を補助するために、スライドをVentana Discoveryハイブリダイゼ−ションステ−ションで処理し、バ−コ−ドを貼り付けた。プリントされたスライドをBio−Optica(Milan, Italy)血液学染色装置にかけ、10分間、50mlの3−アミノプロピルトリエトキシシラン(Sigma A3648ロット番号122K589)の中でインキュベ−ションした。余った液体を乾かし、次にスライドを遮光真空デシケ−タ(Pelco 2251, Ted Pella, Inc. Pedding CA)の中で、3時間、20mm/Hg中でインキュベ−ションした。   Next, to assist the automatic operation of the hydration operation, the slide was treated with a Ventana Discovery hybridization station, and a bar code was applied. Printed slides were run on a Bio-Optica (Milan, Italy) hematology stainer and incubated in 50 ml of 3-aminopropyltriethoxysilane (Sigma A3648 lot number 122K589) for 10 minutes. The excess liquid was allowed to dry and then the slides were incubated in a light-shielded vacuum desiccator (Pelco 2251, Ted Pella, Inc. Pedding CA) for 3 hours at 20 mm / Hg.

次にGenisphere 900−RP(ランダムプライマ−)、Bentana Discovery HybStation(商標)に装着したミニ溶出カラムを用いて以下のプロトコ−ル通りに作業し、マイクロアレイ実験を実施した。簡単に述べると、プロトコ−ルは、装置自体と一緒に提供された指示および情報に関しては、記載通りに実施した。プロトコ−ルはcDNA合成および標識化を包含した。cDNA濃度は、QliGreen ssDNA Quantitation試薬およびキットを利用し、TBS−380(Turner Biosystems. Sunnyvale, CA.)PicoFlourを用いて測定した。   Next, using a mini-elution column equipped with Genisphere 900-RP (random primer) and Bentana Discovery HybStation (trademark), the microprotocol experiment was carried out according to the following protocol. Briefly, the protocol was performed as described with respect to the instructions and information provided with the device itself. The protocol included cDNA synthesis and labeling. The cDNA concentration was measured using TBS-380 (Turner Biosystems. Sunnyvale, Calif.) PicoFlour using QliGreen ssDNA Quantitation reagent and kit.

ハイブリダイゼ−ションは、Ventana Hybridization装置を用い、提供されたプロトコ−ルに従って実施した(Discovery Hybridization StationTuscon AZ)。   Hybridization was performed using the Ventana Hybridization apparatus according to the provided protocol (Discovery Hybridization Station Tuscon AZ).

次にスライドをAxon Instruments Inc社製GenePix 4000Bデュアルレ−ザ−スキャナ−でスキャニングし、GenePix Pro 5.0ソフトウエアで解析した。   The slides were then scanned with a GenePix 4000B dual laser scanner from Axon Instruments Inc and analyzed with GenePix Pro 5.0 software.

オリゴヌクレオチドを基本としたマイクロアレイ作製および実験の流れの概略図を図4および5に示す。   4 and 5 show schematic diagrams of the flow of an oligonucleotide-based microarray fabrication and experiment.

簡単に述べると、図4に示すように25uMのDNAオリゴヌクレオチドをAmersham 「CodeLink」ガラススライドに配置し(プリントして)て、画定された「スポット」を作製した。これらのスライドは、C6−アミン修飾を介してDNAオリゴヌクレオチド5'−末端に共有結合する活性型の3−D表面を創る長鎖の親水性ポリマ−化学で覆われている。この結合により、完全長のDNAオリゴヌクレオチドがcDNAとのハイブリダイゼ−ションに利用できるようになり、また低いバックグランド、高い感度および再現性を可能にする。   Briefly, 25 uM DNA oligonucleotides were placed (printed) on Amersham “CodeLink” glass slides as shown in FIG. 4 to create defined “spots”. These slides are covered with a long hydrophilic polymer chemistry that creates an active 3-D surface that is covalently attached to the 5'-end of the DNA oligonucleotide via a C6-amine modification. This binding allows full-length DNA oligonucleotides to be used for hybridization with cDNA and allows low background, high sensitivity and reproducibility.

図5は、マイクロアレイ実験を実施するための方法の概略図である。左手または右手側の段階を、同時に行うことも含め、いずれかの順番に従って、段階4(ハイブリダイゼ−ション)まで随意に実施できることに注意すべきである。簡単に述べると、左手側では、標的オリゴヌクレオチドはガラス製(別の材料も随意に使用できるが)顕微鏡スライド上にスポットし、スポットスライドを作製する(段階1)。右手では、コントロ−ルサンプルのRNAと癌サンプルのRNAをそれぞれCy3およびCy5で標識して(段階2)標識化プロ−ブを作製する。コントロ−ルサンプルと癌サンプルは対応する組織(例えば正常前立腺組織と癌化前立腺組織)からのものであることに注意すべきである。さらにまた、例えばチップで前立腺癌組織および正常組織を上記のように試験した「前立腺」ように、RNAを得た組織を、「チップ」(マイクロアレイ)のオリゴヌクレオチドの過剰発現に関連する特定クラスタに関する具体的なデ−タ例の中に示す。段階3では、プロ−ブを混合する。段階4では、ハイブリダイゼ−ションを実施して、処理されたスライドを作製する。段階5では、スライドを洗浄し、スキャニングしてイメ−ジファイルを作製し、続いて段階6にてデ−タ分析を行う。   FIG. 5 is a schematic diagram of a method for performing a microarray experiment. It should be noted that the left-hand or right-hand side steps can optionally be performed up to step 4 (hybridization), in any order, including simultaneously. Briefly, on the left hand side, the target oligonucleotide is spotted onto a glass slide (although other materials can optionally be used) to create a spot slide (step 1). In the right hand, the control sample RNA and the cancer sample RNA are labeled with Cy3 and Cy5, respectively (step 2) to produce a labeled probe. It should be noted that the control sample and cancer sample are from corresponding tissues (eg, normal prostate tissue and cancerated prostate tissue). Furthermore, for example, the “prostate” in which prostate cancer tissue and normal tissue were tested with a chip as described above, the RNA-derived tissue is associated with a specific cluster associated with overexpression of “chip” (microarray) oligonucleotides. Specific examples of data are shown below. In step 3, the probe is mixed. In step 4, hybridization is performed to produce a processed slide. In step 5, the slides are washed and scanned to create an image file, followed by data analysis in step 6.

クラスタT10888の説明
クラスタT10888は、それらの名称をそれぞれ表1および2に示し、配列そのものは明細書の最後に示した関心態様の4つの転写物と8つのセグメントを特徴とする。選択されたタンパク質を表3に示す。
Description of Cluster T10888 Cluster T10888 has their names shown in Tables 1 and 2, respectively, and the sequence itself features 4 transcripts and 8 segments of the embodiment of interest shown at the end of the specification. Selected proteins are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は既知タンパク質の胎児性癌抗原関連細胞接着分子6前駆体(SwissProtアクセッション識別子CEA6_HUMAN:同義語の正常交叉反応抗原;非特異的交叉反応抗原;CD66c抗原とも呼ばれる)、配列番号:13は、本明細書では既知タンパク質と呼ぶ。   These sequences are known proteins of fetal cancer antigen-related cell adhesion molecule 6 precursor (SwissProt accession identifier CEA6_HUMAN: synonymous normal cross-reaction antigen; non-specific cross-reaction antigen; also called CD66c antigen), SEQ ID NO: 13 Are referred to herein as known proteins.

タンパク質胎児性癌抗原関連細胞接着分子6前駆体の配列は、本明細書の最後に「胎児性癌抗原関連細胞接着分子6前駆体アミノ酸配列」として示されている。この配列について知られている多形を表4に示す。   The sequence of the protein fetal cancer antigen-related cell adhesion molecule 6 precursor is shown at the end of the specification as the “fetal cancer antigen-related cell adhesion molecule 6 precursor amino acid sequence”. Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質胎児性癌抗原関連細胞接着分子6の前駆体の局在性は、GPIアンカ−によって膜に結びつけられていると考えられている。   The localization of the precursor of protein embryonal cancer antigen-related cell adhesion molecule 6 is thought to be linked to the membrane by a GPI anchor.

既知タンパク質は、次の適用および/または潜在的治療上の使用も有している:癌。ヒトでの臨床/治療使用、例えば抗体もしくは小分子の標的、および/または直接的治療薬としての研究が行われている;これらの研究に関し入手可能な情報は次の通りである。既知タンパク質の潜在的な、薬学に関係する、または治療に関係する活性は次の通りである:免疫刺激剤。このクラスタにより象徴されるタンパク質について、治療的役割が推測されている。このクラスタは、このタンパク質またはその一部は、潜在的治療適用:造影剤;抗ガン剤;免疫刺激剤;免疫複合体;モノクロ−ナル抗体、マウス;アンチセンス治療;抗体に使用されている、または使用できるという情報が薬物デ−タベ−スまたは公開デ−タベ−ス(例えば上記の)の中に存在することから、このフィ−ルドが割り当てられた。   Known proteins also have the following applications and / or potential therapeutic uses: cancer. Studies are being conducted in human clinical / therapeutic use, such as antibody or small molecule targets and / or direct therapeutics; the information available on these studies is as follows: The potential, pharmacological or therapeutic activities of known proteins are as follows: immunostimulants. A therapeutic role has been speculated for the proteins symbolized by this cluster. This cluster is part of this protein or part of it being used for potential therapeutic applications: contrast agents; anti-cancer agents; immunostimulants; immune complexes; monoclonal antibodies, mice; antisense therapy; Or this information was assigned because there is information in the drug database or public database (eg above) that it can be used.

既知タンパク質には次のGO注釈付け(Annotation)を適用する。次の注釈付けが見出された;シグナル伝達;生物学的プロセスに関連する注釈付けである、細胞−細胞シグナル伝達;および細胞成分に関連する注釈付けである原形質膜内タンパク質。   The following GO Annotation applies to known proteins. The following annotations were found; signaling; annotation related to biological processes, cell-cell signaling; and annotation related to cellular components, plasma membrane proteins.

QO割り当て(Assignment)は、<http://www/expasy.ch/sprot/>から利用可能な、一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLcuslinkからの情報に拠っている。   QO Assignment is one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http: //www.ncbi.nlm Based on information from Lcuslink available from .nih.gov / projects / LocusLink />.

クラスタT10888は、癌におけるこのクラスタ転写物の過剰発現による診断マ−カ−として用いることができる。正常組織でのこのような転写物の発現も、先述の方法に従って得られる。表右側縦列の用語「数」および図6のy軸の数は、「百万分の一」の形で表した、各分類のESTの重み付け発現を表している(百万分の一で表した、その分類の全ESTの発現に対する特定クラスタのEST発現比)。   Cluster T10888 can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues is also obtained according to the method described above. The term “number” in the right column of the table and the number of y-axes in FIG. 6 represent the weighted expression of ESTs in each category in the form of “parts per million” (in parts per million EST expression ratio of a specific cluster to the expression of all ESTs of that classification).

全体として、図6のヒストグラムおよび表5で示すような、次の結果が得られた。このクラスタは次の病的状態で過剰発現している(少なくとも最低レベルで):結腸直腸癌、各種組織からの悪性癌の混合、膵臓癌および胃癌。   Overall, the following results were obtained as shown in the histogram of FIG. 6 and Table 5. This cluster is overexpressed (at least at the lowest level) in the following pathological conditions: colorectal cancer, a mixture of malignant cancers from various tissues, pancreatic cancer and gastric cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のようにクラスタT10888は、上表1に記載されている4つの転写物を特徴とする。これら転写物は、タンパク質の胎児性癌抗原関連細胞接着分子6前駆体の変異体であるタンパク質をコ−ドしている。次に本発明の各変異体タンパク質ついて説明する。   As described above, cluster T10888 is characterized by the four transcripts listed in Table 1 above. These transcripts code for proteins that are variants of the fetal cancer antigen-related cell adhesion molecule 6 precursor of the protein. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質T10888_PEA_1_P2は、本明細書の最後に示すアミノ酸配列を有している;それは転写物T10888_PEA_1_T1にコ−ドされている。既知タンパク質(胎児性癌抗原関連細胞接着分子6前駆体)に対するアラインメントを本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列に対する一または複数のアラインメントを本明細書の最後に示す。次に本発明の変異体タンパク質と、このようにアラインメントを取った各タンパク質との関係について簡単に説明する:   The mutant protein T10888_PEA_1_P2 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T10888_PEA_1_T1. An alignment to a known protein (fetal cancer antigen-related cell adhesion molecule 6 precursor) is shown at the end of the specification. One or more alignments to one or more previously published protein sequences are shown at the end of the specification. Next, the relationship between the mutant protein of the present invention and each protein thus aligned is briefly described:

T10888_PEA_1_P2とCEA6_HUMANの比較レポ−ト
1.T10888_PEA_1_P2をコ−ドする単離されたキメラポリペプチドは、CEA6_HUMANのアミノ酸1〜319に相当し、またT10888_PEA_1_P2のアミノ酸1〜319にも相当するMGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYRPGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQAHNSATGLNRTTVTMITVSに少なくとも90%相同である第一アミノ酸配列、およびT10888_PEA_1_P2のアミノ酸320〜324に相当する配列DWTRPを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は、連続して順番につながっている。
Comparison report of T10888_PEA_1_P2 and CEA6_HUMAN
The 1.T10888_PEA_1_P2 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 319 of CEA6_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYRPGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQAHNSATGLNRTTVTMITVS which also corresponds to amino acids 1 to 319 of T10888_PEA_1_P2 And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% of the polypeptide having the sequence DWTRP corresponding to amino acids 320-324 of T10888_PEA_1_P2 A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are in sequential order. It has led to.

2.T10888_PEA_1_P2の尾部をコ−ドする単離されたポリペプチドは、T10888_PEA_1_P2内の配列DWTRPに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of T10888_PEA_1_P2 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence DWTRP within T10888_PEA_1_P2. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T10888_PEA_1_P2はまた、表7に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(掲載の変更アミノ酸と共に、アミノ酸配列上のそれらの位置に従って示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T10888_PEA_1_P2配列に既知SNPが存在することは、本発明のこの変異体タンパク質について導かれたこの配列を支持している)。   The variant protein T10888_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their position on the amino acid sequence, with the listed modified amino acids; last column) Indicates whether the SNP is known; the presence of a known SNP in the mutant protein T10888_PEA_1_P2 sequence supports this sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T10888_PEA_1_P2は、次の転写物にコ−ドされている:T10888_PEA_1_T1、これの配列は本明細書の最後に示している。転写物T10888_PEA_1_T1のコ−ディング領域は、太字で表している:このコ−ディング領域は、位置151から始まり、位置1122に終わる。転写物はまた、表8に掲載されている次のSNPも有している(それらのヌクレオチド酸配列上の位置に続いて、掲載の変更核酸が示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T10888_PEA_1_P2配列に既知SNPが存在することは、本発明のこの変異体タンパク質について導かれたこの配列を支持している)。   Mutant protein T10888_PEA_1_P2 is encoded in the following transcript: T10888_PEA_1_T1, the sequence of which is given at the end of the specification. The coding area of the transcript T10888_PEA_1_T1 is shown in bold: this coding area starts at position 151 and ends at position 1122. The transcript also has the following SNPs listed in Table 8 (following their nucleotide acid sequence position, the listed modified nucleic acids are shown; the last column reveals the SNPs The presence of a known SNP in the mutant protein T10888_PEA_1_P2 sequence supports this sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T10888_PEA_1_P4は、本明細書の最後に記載のアミノ酸配列を有する;それは転写物T10888_PEA_1_T4にコ−ドされている。既知タンパク質(胎児性癌抗原関連細胞接着分子6前駆体)とのアラインメントを、本明細書の最後に示す。一もしくは複数の、これまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係を以下簡単に説明する:   The mutant protein T10888_PEA_1_P4 of the present invention has the amino acid sequence described at the end of the specification; it is encoded in the transcript T10888_PEA_1_T4. An alignment with a known protein (fetal cancer antigen-related cell adhesion molecule 6 precursor) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

T10888_PEA_1_PEA_1_P4とCEA6_HUMANとの比較報告
1. T10888_PEA_1_P4をコ−ドする単離されたキメラポリペプチドは、CEA6_HUMANのアミノ酸1〜234に相当し、またT10888_PEA_1_P4のアミノ酸1〜234にも相当するMGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLに少なくとも90%相同である第一アミノ酸配列、およびT10888_PEA_1_P4のアミノ酸235〜356に相当する配列LLLSSQLWPPSASRLECWPGWLを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T10888_PEA_1_PEA_1_P4 and CEA6_HUMAN
1. T10888_PEA_1_P4 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 234 of CEA6_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL which also corresponds to amino acids 1 to 234 of T10888_PEA_1_P4 And a polypeptide having the sequence LLLSSQLWPPSASRLECWPGWL corresponding to amino acids 235 to 356 of T10888_PEA_1_P4, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

2. T10888_PEA_1_P4の尾部をコ−ドする単離されたポリペプチドは、T10888_PEA_1_P4内の配列LLLSSQLWPPSASRLECWPGWLに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of T10888_PEA_1_P4 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence LLLSSQLWPPSASRLECWPGWL in T10888_PEA_1_P4 And most preferably comprises a polypeptide that is at least about 95% homologous.

T10888_PEA_1_P4とQ13774(配列番号:829)との比較報告
1. T10888_PEA_1_P4をコ−ドする単離されたキメラポリペプチドは、Q13774のアミノ酸1〜234に相当し、またT10888_PEA_1_P4のアミノ酸1〜234にも相当するMGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLに少なくとも90%相同である第一アミノ酸配列、およびT10888_PEA_1_P4のアミノ酸235〜356に相当する配列LLLSSQLWPPSASRLECWPGWLを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T10888_PEA_1_P4 and Q13774 (SEQ ID NO: 829)
1. T10888_PEA_1_P4 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 234 of Q13774, also the first amino acid sequence that is at least 90% homologous to MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL which also corresponds to amino acids 1 to 234 of T10888_PEA_1_P4 And a polypeptide having the sequence LLLSSQLWPPSASRLECWPGWL corresponding to amino acids 235 to 356 of T10888_PEA_1_P4, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

2. T10888_PEA_1_P4の尾部をコ−ドする単離されたポリペプチドは、T10888_PEA_1_P4内の配列LLLSSQLWPPSASRLECWPGWLに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of T10888_PEA_1_P4 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence LLLSSQLWPPSASRLECWPGWL in T10888_PEA_1_P4 And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在していると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to be localized with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T10888_PEA_1_P4はまた、表9に掲載するように、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置の次に、掲載の変更アミノ酸が示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T10888_PEA_1_P4配列に既知SNPが存在することは、本発明のこの変異体タンパク質について導かれたこの配列を支持している)。   The mutant protein T10888_PEA_1_P4 also has the following non-silent SNPs (single nucleotide polymorphisms), as listed in Table 9 (following their position on the amino acid sequence, the listed modified amino acids are shown) The last column indicates whether the SNP is known; the presence of a known SNP in the mutant protein T10888_PEA_1_P4 sequence supports this sequence derived for this mutant protein of the present invention; ).

Figure 2007520217
Figure 2007520217

変異体タンパク質T10888_PEA_1_P4は、次の転写物にコ−ドされている:T10888_PEA_1_T4、この転写物の配列は本明細書の最後に示している。転写物T10888_PEA_1_T4のコ−ディング領域は、太字で表している:このコ−ディング領域は、位置151から始まり、位置918に終わる。転写物はまた、表8に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に続いて、掲載の変更核酸が示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T10888_PEA_1_P4配列に既知SNPが存在することは、本発明のこの変異体タンパク質について導かれたこの配列を支持している)。   The mutant protein T10888_PEA_1_P4 is encoded in the following transcript: T10888_PEA_1_T4, the sequence of this transcript is given at the end of the specification. The coding area of the transcript T10888_PEA_1_T4 is shown in bold: this coding area starts at position 151 and ends at position 918. The transcript also has the following SNPs listed in Table 8 (following their nucleotide sequence positions are the listed modified nucleic acids; the last column shows the SNPs The presence of a known SNP in the mutant protein T10888_PEA_1_P4 sequence supports this sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T10888_PEA_1_P5は、本明細書の最後に記載のアミノ酸配列を有する;それは転写物T10888_PEA_1_T5にコ−ドされている。既知タンパク質(胎児性癌抗原関連細胞接着分子6前駆体)とのアラインメントを本明細書の最後に示す。一もしくは複数のこれまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係を以下簡単に説明する:   The mutant protein T10888_PEA_1_P5 of the present invention has the amino acid sequence described at the end of the specification; it is encoded in the transcript T10888_PEA_1_T5. An alignment with a known protein (fetal cancer antigen-related cell adhesion molecule 6 precursor) is shown at the end of this specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

T10888_PEA_1_PEA_1_P5とCEA6_HUMANとの比較報告:
1. T10888_PEA_1_P5をコ−ドする単離されたキメラポリペプチドは、CEA6_HUMANのアミノ酸1〜320に相当し、またT10888_PEA_1_P5のアミノ酸1〜320にも相当するMGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYRPGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQAHNSATGLNRTTVTMITVSGに少なくとも90%相同である第一アミノ酸配列、およびT10888_PEA_1_P5のアミノ酸321〜390に相当する配列KWIHEALASHFQVESGSQRRARKKFSFPTCVQGAHANPKFSPEPSQFTSADSFPLVFLFFVVFCFLISHVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T10888_PEA_1_PEA_1_P5 and CEA6_HUMAN:
1. T10888_PEA_1_P5 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 320 of CEA6_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSISSNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTLTLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYRPGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQAHNSATGLNRTTVTMITVSG which also corresponds to amino acids 1 to 320 of T10888_PEA_1_P5 , And at least 70%, if necessary, at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95%, A second amino acid sequence that is homologous, Serial first and second amino acid sequence has led to the order in succession.

2. T10888_PEA_1_P5の尾部をコ−ドする単離されたポリペプチドは、T10888_PEA_1_P5内の配列KWIHEALASHFQVESGSQRRARKKFSFPTCVQGAHANPKFSPEPSQFTSADSFPLVFLFFVVFCFLISHVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of T10888_PEA_1_P5 has at least about 80%, preferably at least about 85%, preferably at least about 80%, preferably at least about 90%, preferably at least about 80%, preferably at least about 90%, And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在していると考えられる:膜。タンパク質の局在は、両シグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドであることで一致したこと、両膜貫通領域推測プログラムが、このタンパク質がこのシグナルペプチドの下流に膜貫通領域を有していると予測したことから、膜であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to be localized with respect to cells as follows: membranes. The localization of the protein was confirmed that both signal peptide prediction programs were matched by the fact that this protein was a signal peptide, and that both transmembrane region estimation programs had a transmembrane region downstream of this signal peptide. It is believed to be a membrane.

変異体タンパク質T10888_PEA_1_P5はまた、表11に掲載するように、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置の次に、掲載の変更アミノ酸が示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T10888_PEA_1_P5配列に既知SNPが存在することは、導かれた本発明のこの変異体タンパク質の配列を支持している)。   Mutant protein T10888_PEA_1_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) as listed in Table 11 (following their position on the amino acid sequence, the listed modified amino acids are shown) The last column indicates whether the SNP is known; the presence of a known SNP in the mutant protein T10888_PEA_1_P5 sequence supports the derived sequence of this mutant protein of the present invention) .

Figure 2007520217
Figure 2007520217

変異体タンパク質T10888_PEA_1_P5は、次の転写物にコ−ドされている:T10888_PEA_1_T5、この転写物の配列は本明細書の最後に示している。転写物T10888_PEA_1_T5のコ−ディング領域は、太字で表している:このコ−ディング領域は、位置151から始まり、位置1320に終わる。転写物はまた、表12に掲載されている次のSNPも有している(それらのヌクレオチド列上の位置に続いて、掲載の変更核酸が示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T10888_PEA_1_P5配列に既知SNPが存在することは、本発明のこの変異体タンパク質について導かれたこの配列を支持している)。   The mutant protein T10888_PEA_1_P5 is encoded in the following transcript: T10888_PEA_1_T5, the sequence of this transcript is given at the end of the specification. The coding region of the transcript T10888_PEA_1_T5 is shown in bold: this coding region starts at position 151 and ends at position 1320. The transcript also has the following SNPs listed in Table 12 (following their nucleotide sequence position, the listed modified nucleic acids are shown; the last column shows the SNP The presence of a known SNP in the mutant protein T10888_PEA_1_P5 sequence supports this sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T10888_PEA_1_P6は、本明細書の最後に記載のアミノ酸配列を有する;それは転写物T10888_PEA_1_T6にコ−ドされている。既知タンパク質(胎児性癌抗原関連細胞接着分子6前駆体)とのアラインメントを、本明細書の最後に示す。一もしくは複数のこれまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。   The mutant protein T10888_PEA_1_P6 of the present invention has the amino acid sequence described at the end of the specification; it is encoded in the transcript T10888_PEA_1_T6. An alignment with a known protein (fetal cancer antigen-related cell adhesion molecule 6 precursor) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification.

T10888_PEA_1_P6とCEA6_HUMANの比較報告:
1. T10888_PEA_1_P6をコ−ドする単離されたキメラポリペプチドは、CEA6_HUMANのアミノ酸1〜141に相当し、またT10888_PEA_1_P6のアミノ酸1〜141にも相当するMGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYに少なくとも90%相同である第一アミノ酸配列、およびT10888_PEA_1_P6のアミノ酸142〜183に相当する配列REYFHMTSGCWGSVLLPTYGIVRPGLCLWPSLHYILYQGLDIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T10888_PEA_1_P6 and CEA6_HUMAN:
1. T10888_PEA_1_P6 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 141 of CEA6_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRETIYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVY which also corresponds to amino acids 1 to 141 of T10888_PEA_1_P6 , And a polypeptide having the sequence REYFHMTSGCWGSVLLPTYGIVRPGLCLWPSLHYILYQGLDI corresponding to amino acids 142 to 183 of T10888_PEA_1_P6 A second amino acid sequence that is homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

2. T10888_PEA_1_P6の尾部をコ−ドする単離されたポリペプチドは、T10888_PEA_1_P6内の配列REYFHMTSGCWGSVLLPTYGIVRPGLCLWPSLHYILYQGLDIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、。   2. The isolated polypeptide that codes the tail of T10888_PEA_1_P6 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence REYFHMTSGCWGSVLLPTYGIVRPGLCLWPSLHYILYQGLDI in T10888_PEA_1_P6 And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在していると考えられる:分泌。タンパク質の局在は、両シグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドであることで一致したこと、膜貫通領域推測プログラムが、このタンパク質が膜貫通領域を有していると予測しなかったことから、分泌であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to be localized with respect to cells as follows: secretion. The localization of the protein was such that both signal peptide prediction programs matched that this protein was a signal peptide, and the transmembrane region estimation program did not predict that this protein had a transmembrane region. It is believed to be secreted.

変異体タンパク質T10888_PEA_1_P6はまた、表13に掲載するように、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置の次に、掲載の変更アミノ酸が示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T10888_PEA_1_P6配列に既知SNPが存在することは、導かれた本発明のこの変異体タンパク質の配列を支持している)。   Mutant protein T10888_PEA_1_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) as listed in Table 13 (following their position on the amino acid sequence, the listed modified amino acids are shown) The last column indicates whether the SNP is known; the presence of a known SNP in the mutant protein T10888_PEA_1_P6 sequence supports the derived sequence of this mutant protein of the present invention) .

Figure 2007520217
Figure 2007520217

変異体タンパク質T10888_PEA_1_P6は、次の転写物にコ−ドされている:T10888_PEA_1_T6、この転写物の配列は本明細書の最後に示している。転写物T10888_PEA_1_T6のコ−ディング領域は、太字で表している:このコ−ディング領域は、位置151から始まり、位置699に終わる。転写物はまた、表14に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に続いて、掲載の変更核酸が示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T10888_PEA_1_P6配列に既知SNPが存在することは、本発明のこの変異体タンパク質について導かれたこの配列を支持している)。   The mutant protein T10888_PEA_1_P6 is encoded in the following transcript: T10888_PEA_1_T6, the sequence of this transcript is given at the end of the specification. The coding area of the transcript T10888_PEA_1_T6 is shown in bold: this coding area starts at position 151 and ends at position 699. The transcript also has the following SNPs listed in Table 14 (following their nucleotide sequence positions are the listed modified nucleic acids; the last column shows the SNPs The presence of a known SNP in the mutant protein T10888_PEA_1_P6 sequence supports this sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のように、クラスタT10888は8つのセグメントを特徴とし、これらは上表2に掲載されており、またはその配列は本明細書の最後に示してある。これらセグメントは、特に関心の対象であることから、本明細書では別々に記載されている核酸配列の一部である。次に本発明の各セグメントを説明する。   As noted above, cluster T10888 features eight segments, which are listed in Table 2 above, or the sequence of which is given at the end of this specification. Because these segments are of particular interest, they are part of the nucleic acid sequences described separately herein. Next, each segment of the present invention will be described.

本発明のセグメントクラスタT10888_PEA_1_node_11は、57のライブラリ−に裏付けられている。ライブラリ−の数は、既述のようにして決定した。このセグメントは次の転写物に見出すことができる:T10888_PEA_1_T1およびT10888_PEA_1_T5。下表15に、各転写物の開始位置と終止位置を示す。   The segment cluster T10888_PEA_1_node_11 of the present invention is supported by 57 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T10888_PEA_1_T1 and T10888_PEA_1_T5. Table 15 below shows the start position and end position of each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT10888_PEA_1_node_12は9つのライブラリ−に裏付けられている。ライブラリ−の数は、既述のようにして決定した。このセグメントは次の転写物に見出すことができる:T10888_PEA_1_T5。表16に、各転写物の開始位置と終止位置を示す。   The segment cluster T10888_PEA_1_node_12 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T10888_PEA_1_T5. Table 16 shows the start position and end position of each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT10888_PEA_1_node_17は、160のライブラリ−に裏付けられている。ライブラリ−の数は、既述のようにして決定した。このセグメントは次の転写物に見出すことができる:T10888_PEA_1_T1およびT10888_PEA_1_T4。表17に、各転写物の開始位置と終止位置を示す。   The segment cluster T10888_PEA_1_node_17 of the present invention is supported by 160 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T10888_PEA_1_T1 and T10888_PEA_1_T4. Table 17 shows the start position and end position of each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT10888_PEA_1_node_4は、61のライブラリ−に裏付けられている。ライブラリ−の数は、既述のようにして決定した。このセグメントは次の転写物に見出すことができる:T10888_PEA_1_T1、T10888_PEA_1_T4、T10888_PEA_1_T5およびT10888_PEA_1_T6。表18に、各転写物の開始位置と終止位置を示す。   The segment cluster T10888_PEA_1_node_4 of the present invention is supported by 61 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T10888_PEA_1_T1, T10888_PEA_1_T4, T10888_PEA_1_T5 and T10888_PEA_1_T6. Table 18 shows the start position and end position of each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT10888_PEA_1_node_6は、81のライブラリ−に裏付けられている。ライブラリ−の数は、既述のようにして決定した。このセグメントは次の転写物に見出すことができる:T10888_PEA_1_T1、T10888_PEA_1_T4、T10888_PEA_1_T5およびT10888_PEA_1_T6。下表19に、各転写物の開始位置と終止位置を示す。   The segment cluster T10888_PEA_1_node_6 of the present invention is supported by 81 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T10888_PEA_1_T1, T10888_PEA_1_T4, T10888_PEA_1_T5 and T10888_PEA_1_T6. Table 19 below shows the start and end positions of each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT10888_PEA_1_node_7は、4つのライブラリ−に裏付けられている。ライブラリ−の数は、既述のようにして決定した。このセグメントは次の転写物に見出すことができる: T10888_PEA_1_T6。表20に、各転写物の開始位置と終止位置を示す。   The segment cluster T10888_PEA_1_node_7 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T10888_PEA_1_T6. Table 20 shows the start position and end position of each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT10888_PEA_1_node_9は、72のライブラリ−に裏付けられている。ライブラリ−の数は、既述のようにして決定した。このセグメントは次の転写物に見出すことができる:T10888_PEA_1_T1、T10888_PEA_1_T4、およびT10888_PEA_1_T5。表21に、各転写物の開始位置と終止位置を示す。   The segment cluster T10888_PEA_1_node_9 of the present invention is supported by 72 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T10888_PEA_1_T1, T10888_PEA_1_T4, and T10888_PEA_1_T5. Table 21 shows the start position and end position of each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によって、上記クラスタに関係する短いセグメントも提供される。これらセグメントの長さは120bpまでであることから、分けて説明する。   A selective segment of the invention also provides short segments related to the cluster. Since the length of these segments is up to 120 bp, they will be described separately.

本発明のセグメントクラスタT10888_PEA_1_node_15は、39のライブラリ−に裏付けられている。ライブラリ−の数は、既述のようにして決定した。このセグメントは次の転写物に見出すことができる: T10888_PEA_1_T4。表229に、各転写物の開始位置と終止位置を示す。   The segment cluster T10888_PEA_1_node_15 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T10888_PEA_1_T4. Table 229 shows the start position and end position of each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質アラインメント:
配列名:/tmp/tM4EgaoKvm/vuztUrlRc7:CEA6_HUMAN
配列文書:
アラインメント:T10888_PEA_1_P2 x CEA6_HUMAN
アラインメントセグメント 1/1:
クオリティ−:3163.00
Bscore:0
一致長:319 全長:319
一致パ−セント類似性:100.0 一致パ−セント同一性:100.00
全パ−セント類似性:100.0 全パ−セント同一性:100.00
ギャップ: 0
アラインメント
. . . . .
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
. . . . .
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
. . . . .
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
. . . . .
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYR 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYR 250
. . . . .
251 PGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQ 300
.
301 AHNSATGLNRTTVTMITVS 319
|||||||||||||||||||
301 AHNSATGLNRTTVTMITVS 319
Mutant protein alignment with known proteins:
Sequence name: / tmp / tM4EgaoKvm / vuztUrlRc7: CEA6_HUMAN
Sequence document:
Alignment: T10888_PEA_1_P2 x CEA6_HUMAN
Alignment segment 1/1:
Quality-: 3316.00
Bscore: 0
Match length: 319 Total length: 319
Match Percent Similarity: 100.0 Match Percent Identity: 100.00
Total percent similarity: 100.0 Total percent identity: 100.00
Gap: 0
alignment
...
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
...
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
...
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
...
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
...
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYR 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYR 250
...
251 PGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQ 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 PGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQ 300
.
301 AHNSATGLNRTTVTMITVS 319
|||||||||||||||||||||-
301 AHNSATGLNRTTVTMITVS 319

配列名:/tmp/Yjllgj7TCe/PgdufzLOlw:CEA6_HUMAN
配列文書:
アラインメント:T10888_PEA_1_P4 x CEA6_HUMAN
アラインメントセグメント 1/1:
クオリティ−:2310.00
Bscore:0
一致長:234 全長:234
一致パ−セント類似性:100.0 一致パ−セント同一性:100.00
全パ−セント類似性:100.0 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
. . . . .
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
. . . . .
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
. . .
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL 234
||||||||||||||||||||||||||||||||||
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL 234
Sequence name: / tmp / Yjllgj7TCe / PgdufzLOlw: CEA6_HUMAN
Sequence document:
Alignment: T10888_PEA_1_P4 x CEA6_HUMAN
Alignment segment 1/1:
Quality-: 2310.00
Bscore: 0
Match length: 234 Total length: 234
Match Percent Similarity: 100.0 Match Percent Identity: 100.00
Total percent similarity: 100.0 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
...
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
...
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
...
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
..
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL 234
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL 234

配列名:/tmp/Yjllgj7TCe/PgdufzLOlw:Q13774
配列文書:
アラインメント:T10888_PEA_1_P4 x Q13774
アラインメントセグメント 1/1:
クオリティ−:2310.00
Bscore:0
一致長:234 全長:234
一致パ−セント類似性:100.0 一致パ−セント同一性:100.00
全パ−セント類似性:100.0 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
. . . . .
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
. . . . .
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
. . .
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL 234
||||||||||||||||||||||||||||||||||
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL 234
Sequence name: / tmp / Yjllgj7TCe / PgdufzLOlw: Q13774
Sequence document:
Alignment: T10888_PEA_1_P4 x Q13774
Alignment segment 1/1:
Quality-: 2310.00
Bscore: 0
Match length: 234 Total length: 234
Match Percent Similarity: 100.0 Match Percent Identity: 100.00
Total percent similarity: 100.0 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
...
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
...
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
...
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
..
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL 234
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVL 234

配列名:/tmp/x5xDBacdpj/rTXRGepv3y:CEA6_HUMAN
配列文書:
アラインメント:T10888_PEA_1_P5 x CEA6_HUMAN
アラインメントセグメント 1/1:
クオリティ−:3172.00
Bscore:0
一致長:320 全長:320
一致パ−セント類似性:100.0 一致パ−セント同一性:100.00
全パ−セント類似性:100.0 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
. . . . .
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
. . . . .
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
. . . . .
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYR 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYR 250
. . . . .
251 PGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQ 300
. .
301 AHNSATGLNRTTVTMITVSG 320
||||||||||||||||||||
301 AHNSATGLNRTTVTMITVSG 320
Array name: / tmp / x5xDBacdpj / rTXRGepv3y: CEA6_HUMAN
Sequence document:
Alignment: T10888_PEA_1_P5 x CEA6_HUMAN
Alignment segment 1/1:
Quality-: 3172.00
Bscore: 0
Match length: 320 Total length: 320
Match Percent Similarity: 100.0 Match Percent Identity: 100.00
Total percent similarity: 100.0 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
...
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
...
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPELPKPSIS 150
...
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 SNNSNPVEDKDAVAFTCEPEVQNTTYLWWVNGQSLPVSPRLQLSNGNMTL 200
...
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYR 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 TLLSVKRNDAGSYECEIQNPASANRSDPVTLNVLYGPDVPTISPSKANYR 250
...
251 PGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQ 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 PGENLNLSCHAASNPPAQYSWFINGTFQQSTQELFIPNITVNNSGSYMCQ 300
..
301 AHNSATGLNRTTVTMITVSG 320
||||||||||||||||||||||-
301 AHNSATGLNRTTVTMITVSG 320

配列名:/tmp/VAhvYFeatq/QNEM573uCo:CEA6_HUMAN
配列文書:
アラインメント:T10888_PEA_1_P6 x CEA6_HUMAN
アラインメントセグメント 1/1:
クオリティ−:1393.00
Bscore:0
一致長:143 全長:143
一致パ−セント類似性:99.30 一致パ−セント同一性:99.30
全パ−セント類似性:99.30 全パ−セント同一性:99.30
ギャップ: 0
アラインメント:
. . . . .
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
. . . .
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYRE 143
||||||||||||||||||||||||||||||||||||||||| |
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPE 143
Sequence name: / tmp / VAhvYFeatq / QNEM573uCo: CEA6_HUMAN
Sequence document:
Alignment: T10888_PEA_1_P6 x CEA6_HUMAN
Alignment segment 1/1:
Quality-: 1393.00
Bscore: 0
Match length: 143 Total length: 143
Match Percent Similarity: 99.30 Match Percent Identity: 99.30
Total percent similarity: 99.30 Total percent identity: 99.30
Gap: 0
alignment:
...
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
...
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
...
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYRE 143
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-||||-|||||||-||||||-|||||-||||||-||||||-
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYPE 143

アラインメント:T10888_PEA_1_T6 x CEA6_HUMAN
アラインメントセグメント 1/1:
クオリティ−:101.00
Bscore:0
一致長:141 全長:183
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:77.05 全パ−セント同一性:77.05
ギャップ: 1
アラインメント
. . . . .
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
. . . . .
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYREYFHMTSG 150
|||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVY......... 141
. . .
151 CWGSVLLPTYGIVRPGLCLWPSLHYILYQGLDI 183

141 ................................. 141
Alignment: T10888_PEA_1_T6 x CEA6_HUMAN
Alignment segment 1/1:
Quality-: 101.00
Bscore: 0
Match length: 141 Total length: 183
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 77.05 Total percent identity: 77.05
Gap: 1
alignment
...
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPPSAPPCRLHVPWKEVLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
...
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VLLLAHNLPQNRIGYSWYKGERVDGNSLIVGYVIGTQQATPGPAYSGRET 100
...
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVYREYFHMTSG 150
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||-|||||||-|||||-||||-||||-|||||-||||||||||| be be no
101 IYPNASLLIQNVTQNDTGFYTLQVIKSDLVNEEATGQFHVY ......... 141
..
151 CWGSVLLPTYGIVRPGLCLWPSLHYILYQGLDI 183

141 ................................. 141

CEA6_HUMANの発現
正常および癌乳房組織における、配列名T10888junc11〜17に描かれたアンプリコンによって検出可能な胎児性癌抗原関連細胞接着分子6(T10888)転写物
junc11から17によって、T10888junc11〜17アンプリコンおよびT10888junc11〜17およびT10888junc11〜17Rプライマ−によって検出できるCEA6_HUMAN胎児性癌抗原関連細胞接着分子6転写物の発現を、リアルタイムPCRを用いて測定した。同時に4種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン);G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現を、ハウスキ−ピング遺伝子量の相乗平均について正規化した。次に正規化した各RTサンプルの値を正常剖検(PM)サンプル(上表1「試験パネル中の組織サンプル」のサンプル番号56〜60、63〜67)の値の中央値で除し、正常PMサンプル中央値に対する、各サンプルのアップレギュレ−ション倍率を得た。
Expression of CEA6_HUMAN In normal and breast cancer tissue, a fetal cancer antigen-related cell adhesion molecule 6 (T10888) transcript detectable by the amplicon depicted in SEQ ID T10888junc11-17
The expression of CEA6_HUMAN fetal cancer antigen-related cell adhesion molecule 6 transcript detectable by junc11 to 17 by T10888junc11-17 amplicon and T10888junc11-17 and T10888junc11-17R primers was measured using real-time PCR. Simultaneously four types of housekeeping genes—PBGD (GenBank accession number BC019323; amplicon—PBGD amplicon), HPRT1 (GenBank accession number NM — 000194; amplicon—HPRT1 amplicon), and SDHA (GenBank accession number NM — 004168; Amplicon-SDHA amplicon); G6PD (GenBank accession number NM — 000402; G6PD amplicon) were also measured in the same manner. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67 in Table 1, “Tissue samples in the test panel” above) The up-regulation magnification of each sample was obtained relative to the median PM sample.

図7は、正常サンプルに対する癌乳房サンプルでの上記CEA6_HUMAN胎児性癌抗原関連細胞接着分子6転写物が過剰発現していることを示すヒストグラムである。数値は二重実験の平均値を表している。誤差バ−は、得られた最小値と最大値を示している。試験した全サンプルのうち、少なくとも5倍過剰発現を示したサンプルの数およびパ−センテ−ジを最下部に示した。   FIG. 7 is a histogram showing that the CEA6_HUMAN fetal cancer antigen-related cell adhesion molecule 6 transcript is overexpressed in a cancer breast sample relative to a normal sample. Numbers represent the average of duplicate experiments. The error bar indicates the obtained minimum and maximum values. Of all the samples tested, the number and percentage of samples that showed at least a 5-fold overexpression are shown at the bottom.

図7から明らかなように、癌性サンプルについて、上記アンプリコンにより検出できるCEA6_HUMAN胎児性癌抗原関連細胞接着分子6転写物の発現は、非癌性サンプル(表1「試験パネル中の組織サンプル」のサンプル番号56〜60、63〜67)での発現に比べて有意に高かった。特に、28例の腺癌サンプル中19例で少なくとも5倍の過剰発現が見出された。   As is clear from FIG. 7, the expression of CEA6_HUMAN fetal cancer antigen-related cell adhesion molecule 6 transcript that can be detected by the amplicon for cancerous samples is shown in non-cancerous samples (Table 1 “Tissue samples in test panel”). The expression was significantly higher than that in sample numbers 56-60 and 63-67). In particular, at least 5-fold overexpression was found in 19 of 28 adenocarcinoma samples.

以下記載するように、統計分析を行い、これら結果の有意性を検証した。   Statistical analysis was performed to verify the significance of these results as described below.

上記アンプリコンを用いて検出できるCEA6_HUMAN胎児性癌抗原関連細胞接着分子6転写物の乳癌サンプルと正常組織サンプルとの発現レベル差のP値をT検定にかけたところ、2.00E−3であった。 The P value of the expression level difference between the breast cancer sample and the normal tissue sample of the CEA6_HUMAN fetal cancer antigen-related cell adhesion molecule 6 transcript that can be detected using the amplicon was 2.00E-3.

フィッシャ−の直接検定で調べたところ、閾値の5倍の過剰発現が、癌サンプルと正常サンプルとを8.44E−03のP値で区別することが見出された。上記の値は、結果が統計学的に有意であることを示している。   When examined by Fisher's direct test, it was found that an overexpression of 5 times the threshold discriminates between cancer and normal samples with a P value of 8.44E-03. The above values indicate that the results are statistically significant.

プライマ−もまた、本発明に選択的かつ好ましく包含される;例えば上記実験では、次のプライマ−ペア−が、好適プライマ−ペア−の非限定例として用いられた:T10888junc11〜17フォワ−ドプライマ−;およびT10888junc11〜17リバ−スプライマ−。   Primers are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pair was used as a non-limiting example of a suitable primer pair: T10888junc11-17 forward primer And T10888junc11-17 river primer.

本発明はまた、好適プライマ−を用いて得たアンプリコンも包含するのが好ましい;例えば、上記実験では次のアンプリコンが、好適アンプリコンの非限定的例として得られた:T10888junc11〜17。
T10888junc11〜17F(配列番号:830)
CCAGCAATCCACACAAGAGCT
T10888junc11〜17R(配列番号:831)
CAGGGTCTGGTCCAATCAGAG
T10888junc11〜17(配列番号:832)
CCAGCAATCCACACAAGAGCTCTTTATCCCCAACATCACTGTGAATAATAGCGGATCCTATATGTGCCAAGCCCATAACTCAGCCACTGGCCTCAATAGGACCACAGTCACGATGATCACAGTCTCTGATTGGACCAGACCCTG
The present invention also preferably encompasses amplicons obtained using suitable primers; for example, the following amplicon was obtained as a non-limiting example of a suitable amplicon in the above experiment: T10888junc11-17.
T10888junc11-17F (SEQ ID NO: 830)
CCAGCAATCCACACAAGAGCT
T10888junc11-17R (SEQ ID NO: 831)
CAGGGTCTGGTCCAATCAGAG
T10888junc11-17 (SEQ ID NO: 832)
CCAGCAATCCACACAAGAGCTCTTTATCCCCAACATCACTGTGAATAATAGCGGATCCTATATGTGCCAAGCCCATAACTCAGCCACTGGCCTCAATAGGACCACAGTCACGATGATCACAGTCTCTGATTGGACCAGACCCTG

CEA6_HUMANの発現
異なる正常組織での配列名T10888junc11−17に描かれたアンプリコンによって検出可能な胎児性癌抗原関連細胞接着分子6T10888転写物
T10888junc11〜17アンプリコンによって、またはT10888junc11〜17およびT10888junc11〜17Rプライマ−によって検出できるCEA6_HUMAN胎児性癌抗原関連細胞接着分子6転写物の発現を、リアルタイムPCRを用いて測定した。同時に4種類のハウスキ−ピング遺伝子−RPL19(GenBankアクセッション番号NM_000981;RPL19アンプリコン)、TATAボックス(GenBankアクセッション番号NM_003194;TATAアンプリコン)、UBC(GenBankアクセッション番号BC000449;アンプリコン−ユビキチンアンプリコン);SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現を、ハウスキ−ピング遺伝子量の相乗平均に対して正規化した。次に正規化した各RTサンプルの値を卵巣サンプル(上表2「正常パネルの組織サンプル」のサンプル番号18〜20)中央値で除し、卵巣サンプルの中央値に対する、各サンプルの相対発現値を得た。
Expression of CEA6_HUMAN A fetal cancer antigen-related cell adhesion molecule 6T10888 transcript detectable by an amplicon depicted in the sequence name T10888junc11-17 in different normal tissues
The expression of the CEA6_HUMAN fetal cancer antigen-related cell adhesion molecule 6 transcript that can be detected by the T10888junc11-17 amplicon or by the T10888junc11-17 and T10888junc11-17R primers was measured using real-time PCR. 4 types of housekeeping genes-RPL19 (GenBank accession number NM_000981; RPL19 amplicon), TATA box (GenBank accession number NM_003194; TATA amplicon), UBC (GenBank accession number BC000449; amplicon-ubiquitin amplicon) ); SDHA (GenBank accession number NM_004168; amplicon-SDHA amplicon) was measured in the same manner. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of the ovary sample (sample numbers 18 to 20 in the above table 2 “Tissue sample of normal panel”), and the relative expression value of each sample relative to the median value of the ovary sample Got.

CEA6_HUMAN胎児性癌抗原関連細胞接着分子6T10888転写物の発現を示す結果を図8に示したが、転写物は様々な正常組織において、配列名T10888junc11−17に描かれたアンプリコンで検出できる。   The results showing the expression of the CEA6_HUMAN fetal cancer antigen-related cell adhesion molecule 6T10888 transcript are shown in FIG. 8, and the transcript can be detected in various normal tissues with the amplicon depicted in the sequence name T10888junc11-17.

クラスタT39971の説明
クラスタT39971は、その名称をそれぞれ表1および2に示す、関心対象の4つの転写物および28のセグメントを特徴とし、配列自体は本明細書の最後に示す。選択されたタンパク質を表3に示す。
Cluster T39971 Description Cluster T39971 features four transcripts of interest and 28 segments, whose names are shown in Tables 1 and 2, respectively, the sequence itself is shown at the end of the specification. Selected proteins are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は既知タンパク質であるビトロネクチン前駆体(SwissProtアクセッション識別子VINC_HUMAN:同義語の血清拡散因子;S−タンパク質;V75ともしても知られる)、配列番号:50は、本明細書では既知タンパク質とよぶ。   These sequences are known proteins vitronectin precursor (SwissProt accession identifier VINC_HUMAN: synonymous serum diffusion factor; S-protein; also known as V75), SEQ ID NO: 50 is known protein Called.

タンパク質ビトロネクチン前駆体は、以下の機能を有することが知られているか、または信じられている:ビトロネクチンは血清および組織中に見出される細胞接着および拡散因子である。ビトロネクチンはグリコサミノグリカンおよびプロテオグリカンと相互作用する。インテグリンファミリ−の一部のメンバ−により認識され、細胞と基質との接着分子として機能する。末梢での細胞溶解性補体経路の膜損傷効果の阻害剤。タンパク質ビトロネクチン前駆体の配列は、本明細書の最後に「ビトロネクチン前駆体アミノ酸配列」(配列番号:50)として示している。この配列について知られている多形を表4に示す。   The protein vitronectin precursor is known or believed to have the following functions: vitronectin is a cell adhesion and diffusion factor found in serum and tissues. Vitronectin interacts with glycosaminoglycans and proteoglycans. It is recognized by some members of the integrin family and functions as an adhesion molecule between cells and substrates. Inhibitors of membrane damage effects of the cytolytic complement pathway in the periphery. The sequence of the protein vitronectin precursor is shown at the end of the specification as the “vitronectin precursor amino acid sequence” (SEQ ID NO: 50). Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質ビトロネクチン前駆体は細胞外に局在すると信じられている。   The protein vitronectin precursor is believed to be localized extracellularly.

既知タンパク質は、次の適用および/または潜在的治療上の使用も有している:癌、メラノ−マ。ヒトでの臨床/治療使用、例えば抗体もしくは小分子の標的、および/または直接的治療薬としての研究が行われている;これらの研究に関し入手可能な情報は次の通りである。既知タンパク質の潜在的な、薬学に関係する、または治療に関係する活性は次の通りである:アルファベ−タ3インテグリンアンタゴニスト;アポト−シスアゴニスト。このクラスタで象徴されるタンパク質について、治療的役割が推測されている。このクラスタは、このタンパク質またはその一部は、潜在的治療適用:抗ガン剤に使用されている、または使用できるという情報が薬物デ−タベ−スまたは公開デ−タベ−ス(例えば上記の)の中に存在することから、このフィ−ルドが割り当てられた。   Known proteins also have the following applications and / or potential therapeutic uses: cancer, melanoma. Studies are being conducted in human clinical / therapeutic use, such as antibody or small molecule targets and / or direct therapeutics; the information available on these studies is as follows: Potential, pharmacological or therapeutic activities of known proteins are as follows: alphabeta3 integrin antagonists; apoptotic agonists. A therapeutic role has been speculated for the proteins symbolized by this cluster. This cluster is a drug database or public database (eg, as described above) with information that this protein or part of it is or is being used for potential therapeutic applications: This field was assigned because it exists in

既知タンパク質には次のGO注釈付けを適用する。次の注釈付けが見出された;免疫反応;細胞接着、これらは生物学的プロセスに関連する注釈付けである;タンパク質結合、これは分子機能に関係する注釈付けである;および原形質膜内タンパク質、これは細胞成分に関連する注釈付けである。   The following GO annotations apply to known proteins. The following annotations were found; immune responses; cell adhesion, these are annotations related to biological processes; protein binding, this is an annotation related to molecular function; and within the plasma membrane Protein, an annotation related to cellular components.

QO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な、一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLcuslinkからの情報に拠っている。   QO assignments are available from <http: //www/expasy.ch/sprot/>, one or more SwissProt / TremB1 protein information bases, or <http: //www.ncbi.nlm.nih. Based on information from Lcuslink available from gov / projects / LocusLink />.

クラスタT39971は、癌におけるこのクラスタ転写物の過剰発現による診断マ−カ−として用いることができる。正常組織でのこのような転写物の発現も、先述の方法に従って得られる。表右側縦列の用語「数」および図9のy軸の数は、「百万分の一」の形で表した、各分類のESTの重み付け発現を表している(百万分の一で表した、その分類の全ESTの発現に対する特定クラスタのEST発現比)。   Cluster T39971 can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues is also obtained according to the method described above. The term “number” in the right column of the table and the number of y-axes in FIG. 9 represent the weighted expression of ESTs in each category in the form of “parts per million” EST expression ratio of a specific cluster to the expression of all ESTs of that classification).

全体として、図9のヒストグラムおよび表5で示す次の結果が得られた。このクラスタは次の病的状態で過剰発現している(少なくとも最低レベルで):肝癌、肺悪性腫瘍および膵臓癌。   Overall, the histogram of FIG. 9 and the following results shown in Table 5 were obtained. This cluster is overexpressed (at least at the lowest level) in the following pathological conditions: liver cancer, lung malignancy and pancreatic cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のようにクラスタT39971は、上表1に示す4つの転写物を特徴とする。これら単車物は、タンパク質ビトロネクチン前駆体の変異体であるタンパク質をコ−ドしている。次に本発明の各変異体タンパク質について説明する。   As described above, cluster T39971 is characterized by the four transcripts shown in Table 1 above. These unicycles code for proteins that are variants of the protein vitronectin precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質T39971_P6は、本明細書最後に示したアミノ酸配列を有する;これは転写物T39971_T5にコ−ドされている。。既知タンパク質(ビトロネクチン前駆体)とのアラインメントを、本明細書の最後に示す。一もしくは複数の、これまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係は以下簡単に説明する:   The mutant protein T39971_P6 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T39971_T5. . An alignment with a known protein (vitronectin precursor) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

T39971_P6とVTNC_HUMANの比較報告
1. T39971_P6をコ−ドする単離されたキメラポリペプチドは、VTNC_HUMANのアミノ酸1〜276に相当し、またT39971_ P6のアミノ酸1〜276にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGに少なくとも90%相同である第一アミノ酸配列、およびT39971_P6のアミノ酸277〜283に相当する配列TQGVVGDを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T39971_P6 and VTNC_HUMAN
1. T39971_P6 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 276 of VTNC_HUMAN, also the first amino acid at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKG which also corresponds to amino acids 1 to 276 of T39971_ P6 At least 70%, if necessary, at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95, for the polypeptide having the sequence and the sequence TQGVVGD corresponding to amino acids 277-283 of T39971_P6 A second amino acid sequence that is% homologous, wherein the first and second amino acid sequences are sequentially connected in sequence.

2. T39971_P6の尾部をコ−ドする単離されたポリペプチドは、T39971_P6内の配列TQGVVGDに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of T39971_P6 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence TQGVVGD within T39971_P6. And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T39971_P6はまた、表7に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(掲載の変更アミノ酸と共に、アミノ酸配列上のそれらの位置に従って示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T39971_P6配列に既知SNPが存在することは、本発明のこの変異体タンパク質について導かれたこの配列を支持している)。   The variant protein T39971_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their position on the amino acid sequence, with the listed modified amino acids; last column) Indicates whether the SNP is known; the presence of a known SNP in the mutant protein T39971_P6 sequence supports this sequence derived for this mutant protein of the invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T39971_P6は、次の転写物にコ−ドされている:T39971_T5、この転写物の配列は本明細書の最後に示している。転写物T39971_T5のコ−ディング領域は、太字で表している:このコ−ディング領域は、位置756から始まり、位置1604に終わる。転写物はまた、表8に掲載されている次のSNPも有している(それらヌクレオチド配列上の位置に続いて、掲載の変更核酸が示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T39971P6配列に既知SNPが存在することは、本発明のこの変異体タンパク質について導かれたこの配列を支持している)。   The mutant protein T39971_P6 is encoded in the following transcript: T39971_T5, the sequence of this transcript is given at the end of the description. The coding area of transcript T39971_T5 is shown in bold: this coding area starts at position 756 and ends at position 1604. The transcript also has the following SNPs listed in Table 8 (following their nucleotide sequence positions are the listed modified nucleic acids; the last column shows the SNP found The presence of a known SNP in the mutant protein T39971P6 sequence supports this sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T39971_P9は、本明細書の最後に示すアミノ酸配列を有している;それは転写物T39971_T10にコ−ドされている。本明細書の最後には、既知タンパク質(ビトロネクチン前駆体)とのアラインメントが示してある。本明細書の最後には、一または複数の、これまでに公表されているタンパク質配列とのアラインメントが示してある。そのようなアラインメントを持つタンパク質それぞれと、本発明の変異体タンパク質との関係について、以下簡単に説明する:   The mutant protein T39971_P9 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T39971_T10. At the end of the specification, an alignment with a known protein (vitronectin precursor) is shown. At the end of the specification, an alignment with one or more previously published protein sequences is shown. The relationship between each protein having such an alignment and the mutant protein of the present invention will be briefly described below:

T39971_P9とVTNC_HUMANとの比較報告
1. T39971_P9をコ−ドする単離されたキメラポリペプチドは、VTNC_HUMANのアミノ酸1〜325に相当し、またT39971_ P9のアミノ酸1〜325にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTに少なくとも90%相同である第一アミノ酸配列、およびVTNC_HUMANのアミノ酸357〜478に相当し、またT39971_P9のアミノ酸326〜447にも相当する配列SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRATWLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLを有するポリペプチドに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T39971_P9 and VTNC_HUMAN
1. T39971_P9 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 325 of VTNC_HUMAN, also the first amino acid at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRT which also corresponds to amino acids 1 to 325 of T39971_ P9 The sequence SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRATWLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLRTRRV The second amino acid sequence is sequentially It wants.

2. T39971_P9の端部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がTSを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号325−xから325のいずれかより開始し:アミノ酸番号326+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that codes for the end of T39971_P9 has a length “n”, where n is at least about 10 amino acids long, if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, including a polypeptide in which at least two amino acids comprise TS and having the following structure: A sequence starting from any of x to 325: ending at any of amino acid numbers 326 + ((n−2) −x), where x is in the range of 0 to n−2.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T39971_P9はまた、表7に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有している(掲載の変更アミノ酸と共に、アミノ酸配列上のそれらの位置に従って示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T39971_P9配列に既知SNPが存在することは、本発明のこの変異体タンパク質について導かれたこの配列を支持している)。   The variant protein T39971_P9 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their position on the amino acid sequence, with the listed modified amino acids; The last column indicates whether the SNP is known; the presence of a known SNP in the mutant protein T39971_P9 sequence supports this sequence derived for this mutant protein of the present invention) .

Figure 2007520217
Figure 2007520217

変異体タンパク質T3391_P9は、次の転写物:T39971_T10にコ−ドされており、その配列を本明細書の最後に示した。転写物T39971_T10のコ−ディング領域は、太字で表している:このコ−ディング領域は、位置756から始まり、位置2096に終わる。転写物はまた、表10に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に続いて、掲載の変更核酸が示されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T10888_PEA_1_P2配列に既知SNPが存在することは、本発明のこの変異体タンパク質について導かれたこの配列を支持している)。   Mutant protein T3391_P9 is encoded by the following transcript: T39971_T10, the sequence of which is given at the end of this specification. The coding region of the transcript T39971_T10 is shown in bold: this coding region starts at position 756 and ends at position 2096. The transcript also has the following SNPs listed in Table 10 (following their nucleotide sequence positions are the listed modified nucleic acids; the last column shows the SNPs The presence of a known SNP in the mutant protein T10888_PEA_1_P2 sequence supports this sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T39971_P11は、本明細書最後に示したアミノ酸配列を有する;これは転写物T39971_T12にコ−ドされている。既知タンパク質(ビトロネクチン前駆体)とのアラインメントを本明細書の最後に示す。一もしくは複数の、これまでに公表されているタンパク質配列との一もしくは複数のアラインメントを本明細書の最後に示す。そのようなアラインメントを持つ各タンパク質と本発明の変異体タンパク質との関係を以下簡単に説明する:   The mutant protein T39971_P11 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T39971_T12. An alignment with a known protein (vitronectin precursor) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between each protein having such an alignment and the mutant protein of the present invention will be briefly described below:

T39971_P11とVTNC_HUMANの比較報告:
1. T39971_P11をコ−ドする単離されたキメラポリペプチドは、VTNC_HUMANのアミノ酸1〜326に相当し、またT39971_ P11のアミノ酸1〜326にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSに少なくとも90%相同である第一アミノ酸配列、およびVTNC_HUMANのアミノ酸442〜478に相当し、またT39971_P11のアミノ酸327〜363にも相当する配列DKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLを有するポリペプチドに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T39971_P11 and VTNC_HUMAN:
1. T39971_P11 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 326 of VTNC_HUMAN, also the first amino acid at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTS which also corresponds to amino acids 1 to 326 of T39971_ P11 And a second amino acid sequence that is at least 90% homologous to a polypeptide having the sequence DKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHL corresponding to amino acids 442 to 478 of VTNC_HUMAN and also corresponding to amino acids 327 to 363 of T39971_P11, wherein The second amino acid sequence is connected sequentially.

2. T39971_P11の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がSDを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号326−xから326のいずれかより開始し:アミノ酸番号327+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that codes for the edge of T39971_P11 has a length “n”, where n is at least about 10 amino acids long, if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, including a polypeptide in which at least two amino acids comprise SD and having the following structure: Starting from any of x to 326: a sequence ending at any of amino acid numbers 327 + ((n−2) −x), where x ranges from 0 to n−2.

T39971_P11とQ9BSH7(配列番号:833)の比較報告:
1. T39971_P11をコ−ドする単離されたキメラポリペプチドは、Q9BSH7のアミノ酸1〜326に相当し、またT39971_ P11のアミノ酸1〜326にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSに少なくとも90%相同である第一アミノ酸配列、およびQ9BSH7のアミノ酸442〜478に相当し、またT39971_P11のアミノ酸327〜363にも相当する配列DKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLを有するポリペプチドに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparative report of T39971_P11 and Q9BSH7 (SEQ ID NO: 833):
1. T39971_P11 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 326 of Q9BSH7, also the first amino acid at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTS which also corresponds to amino acids 1 to 326 of T39971_ P11 And a second amino acid sequence that is at least 90% homologous to a polypeptide having the sequence DKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHL corresponding to amino acids 442 to 478 of Q9BSH7 and also corresponding to amino acids 327 to 363 of T39971_P11, wherein the first and The second amino acid sequence is connected sequentially.

2. T39971_P11の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がSDを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号326−xから326のいずれかより開始し:アミノ酸番号327+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that codes for the edge of T39971_P11 has a length “n”, where n is at least about 10 amino acids long, if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, including a polypeptide in which at least two amino acids comprise SD and having the following structure: Starting from any of x to 326: a sequence ending at any of amino acid numbers 327 + ((n−2) −x), where x ranges from 0 to n−2.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T39971_P11はまた、表11に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T39971_P11配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T39971_P11 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 11 (shown according to their position on the amino acid sequence, followed by the modified amino acids; last Column indicates whether or not a SNP is known; the presence of a known SNP within the mutant protein T39971_P11 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T39971_P11は、次の転写物にコ−ドされている:T39971_T12、この転写物の配列は本明細書の最後に示す。転写物T39971_T12のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置756から始まり、位置1844に終始している。転写物はまた、表12に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T39971_P11配列中での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T39971_P11 is encoded in the following transcript: T39971_T12, the sequence of this transcript is given at the end of the specification. The coding portion of the transcript T39971_T12 is shown in bold: this coding portion starts at position 756 and continues at position 1844. The transcript also has the following SNPs listed in Table 12 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP in the mutant protein T39971_P11 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T39971_P12は、本明細書の最後に示すアミノ酸配列を有している;それは転写物T39971_T16にコ−ドされている。本明細書の最後には、既知タンパク質(ビトロネクチン前駆体)とのアラインメントが示してある。本明細書の最後には、一または複数の、これまでに公表されているタンパク質配列とのアラインメントが示してある。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係について、以下簡単に説明する:   The mutant protein T39971_P12 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T39971_T16. At the end of the specification, an alignment with a known protein (vitronectin precursor) is shown. At the end of the specification, an alignment with one or more previously published protein sequences is shown. The relationship between the mutant protein of the present invention and each protein having such an alignment will be briefly described below:

T39971_P12とVTNC_HUMANとの比較報告:
1. T39971_P12をコ−ドする単離されたキメラポリペプチドは、VTNC_HUMANのアミノ酸1〜223に相当し、またT39971_ P12のアミノ酸1〜223にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCITYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKに少なくとも90%相同である第一アミノ酸配列、およびT39971_P12のアミノ酸224〜238に相当する配列VPGAVGQGRKHLGRVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T39971_P12 and VTNC_HUMAN:
1. T39971_P12 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 223 of VTNC_HUMAN, also the first amino acid at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCITYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFK which also corresponds to amino acids 1 to 223 of T39971_ P12 At least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% of the sequence and a polypeptide having the sequence VPGAVGQGRKHLGRV corresponding to amino acids 224 to 238 of T39971_P12 A second amino acid sequence that is% homologous, wherein the first and second amino acid sequences are sequentially connected in sequence.

2. T39971_P12の尾部をコ−ドする単離されたポリペプチドは、T39971_P12内の配列VPGAVGQGRKHLGRVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of T39971_P12 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence VPGAVGQGRKHLGRV within T39971_P12. And most preferably comprises a polypeptide that is at least about 95% homologous.

T39971_P12とQ9BSH7との比較報告:
1. T39971_P12をコ−ドする単離されたキメラポリペプチドは、Q9BSH7のアミノ酸1〜223に相当し、またT39971_ P12のアミノ酸1〜223にも相当するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKに少なくとも90%相同である第一アミノ酸配列、およびT39971_P12のアミノ酸224〜238に相当する配列VPGAVGQGRKHLGRVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T39971_P12 and Q9BSH7:
1. T39971_P12 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 223 of Q9BSH7, also the first amino acid at least 90% homologous to MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFK which also corresponds to amino acids 1 to 223 of T39971_ P12 At least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% of the sequence and a polypeptide having the sequence VPGAVGQGRKHLGRV corresponding to amino acids 224 to 238 of T39971_P12 A second amino acid sequence that is% homologous, wherein the first and second amino acid sequences are sequentially connected in sequence.

2. T39971_P12の尾部をコ−ドする単離されたポリペプチドは、T39971_P12内の配列VPGAVGQGRKHLGRVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、。   2. An isolated polypeptide that encodes the tail of T39971_P12 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence VPGAVGQGRKHLGRV within T39971_P12. And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T39971_P12はまた、表13に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T39971_P12配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T39971_P12 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 13 (shown according to their position on the amino acid sequence, followed by the modified amino acids; last Column indicates whether the SNP is known; the last column indicates whether the SNP is known; the presence of the known SNP in the mutant protein T39971_P12 sequence Supporting the sequence derived for the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T39971_P12は、次の転写物にコ−ドされている:T39971_T16、この転写物の配列は本明細書の最後に示してある。転写物T39971_T16のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置756から始まり、位置1469に終わる。転写物はまた、表14に掲載されている次のSNPも有している(ヌクレオチド配列上のそれらの位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T39971_P12配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T39971_P12 is encoded in the following transcript: T39971_T16, the sequence of this transcript is given at the end of the description. The coding portion of the transcript T39971_T16 is shown in bold: this coding portion starts at position 756 and ends at position 1469. The transcript also has the following SNPs listed in Table 14 (shown according to their position on the nucleotide sequence, then the modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP in the mutant protein T39971_P12 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のように、クラスタT39971は、上表2に記載し、またその配列を本明細書の最後に示した28個のセグメントを特徴とする。これらセグメントは、特に関心の対象であることから、ここに別々に記載した核酸配列部分である。次に本発明の各セグメントについて説明する。   As noted above, cluster T39971 is described in Table 2 above and is characterized by 28 segments whose sequence is shown at the end of this specification. Since these segments are of particular interest, they are the nucleic acid sequence portions described separately here. Next, each segment of the present invention will be described.

本発明のセグメントクラスタT39971_node_0は76個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表15に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_0 of the present invention is supported by 76 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_18は1個のライブラリ−に裏付けられている。ライブリ−の数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T16。下表16に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_18 of the present invention is supported by one library. The number of live trees was determined as described above. This segment can be found in the following transcript: T39971_T16. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_21は99個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。下表17に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_21 of the present invention is supported by 99 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, and T39971_T5. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_22は7個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T39971_T5。下表18に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_22 of the present invention is supported by seven libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T39971_T5. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_23は101個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12およびT39971_T5。下表19に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_23 of the present invention is supported by 101 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12 and T39971_T5. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_31は94個のライブラリ−に裏付けられている。このライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10およびT39971_T5。下表20に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_31 of the present invention is supported by 94 libraries. The library number was determined as described above. This segment can be found in the following transcripts: T39971_T10 and T39971_T5. Table 20 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_33は77個のライブラリ−に裏付けられている。このライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12およびT39971_T5。下表21に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_33 of the present invention is supported by 77 libraries. The library number was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12 and T39971_T5. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_7は87個のライブラリ−に裏付けられている。このライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表22に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_7 of the present invention is supported by 87 libraries. The library number was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 22 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは、長さが約120bpまでであることから分けて説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are described separately because they are up to about 120 bp in length.

本発明のセグメントクラスタT39971_node_1は次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表23に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_1 of the present invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_10は77個のライブラリ−に裏付けられている。このライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表24に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_10 of the present invention is supported by 77 libraries. The library number was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 24 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_11は79個のライブラリ−に裏付けられている。このライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表25に、各転写物における、このセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_11 of the present invention is supported by 79 libraries. The library number was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_12は次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表26に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_12 of the present invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_15は79個のライブラリ−に裏付けられている。このライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表27に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_15 of the present invention is supported by 79 libraries. The library number was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_16は次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表28に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_16 of the present invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_17は86個のライブラリ−に裏付けられている。このライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表29に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_17 of the present invention is supported by 86 libraries. The library number was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 29 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_26は85個のライブラリ−に裏付けられている。このライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T5。下表30に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_26 of the present invention is supported by 85 libraries. This library number was determined as described above. This segment can be found in the following transcript: T39971_T5. Table 30 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_27は90個のライブラリ−に裏付けられている。このライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T39971_T5。下表31に、各転写物における、このセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_27 of the present invention is supported by 90 libraries. This library number was determined as described above. This segment can be found in the following transcripts: T39971_T5. Table 31 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_28は次の転写物に見出すことができる:T39971_T10およびT39971_T5。下表32に、各転写物における、このセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_28 of the present invention can be found in the following transcripts: T39971_T10 and T39971_T5. Table 32 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_29は99個のライブラリ−に裏付けられている。このライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10およびT39971_T5。下表33に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_29 of the present invention is supported by 99 libraries. This library number was determined as described above. This segment can be found in the following transcripts: T39971_T10 and T39971_T5. Table 33 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_3は78個のライブラリ−に裏付けられている。このライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表34に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_3 of the present invention is supported by 78 libraries. The library number was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 34 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_30は次の転写物に見出すことができる:T39971_T10およびT39971_T5。下表35に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_30 of the present invention can be found in the following transcripts: T39971_T10 and T39971_T5. Table 35 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_34は次の転写物に見出すことができる:T39971_T10、T39971_T12およびT39971_T5。下表36に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_34 of the present invention can be found in the following transcripts: T39971_T10, T39971_T12 and T39971_T5. Table 36 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_35は次の転写物に見出すことができる:T39971_T10、T39971_T12およびT39971_T5。下表37に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_35 of the present invention can be found in the following transcripts: T39971_T10, T39971_T12 and T39971_T5. Table 37 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_36は51個のライブラリ−に裏付けされている。ライブラリ−の数は前記のように決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12およびT39971_T5。下表38に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_36 of the present invention is supported by 51 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12 and T39971_T5. Table 38 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_4は次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表39に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_4 of the present invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 39 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_5は80個のライブラリ−に裏付けされている。ライブラリ−の数は前記のようにして決定した。このセグメントは次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表40に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_5 of the present invention is supported by 80 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 40 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_8は次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表41に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_8 of the present invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 41 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT39971_node_9は次の転写物に見出すことができる:T39971_T10、T39971_T12、T39971_T16およびT39971_T5。下表42に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T39971_node_9 of the present invention can be found in the following transcripts: T39971_T10, T39971_T12, T39971_T16 and T39971_T5. Table 42 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント:
配列名:/tmp/xkraCL20cZ/43L7YcPH7x:VTNC_HUMAN
配列文書:
アラインメント:T39971_P6 x VTNC_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:2774.00
Escore:0
一致長:278 全長:278
一致パ−セント類似性:99.64 一致パ−セント同一性:99.64
全パ−セント類似性:99.64 全パ−セント同一性:99.64
ギャップ: 0
アラインメント:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. .
251 PDNVDAALALPAHSYSGRERVYFFKGTQ 278
|||||||||||||||||||||||||| |
251 PDNVDAALALPAHSYSGRERVYFFKGKQ 278
Mutant protein alignment with known proteins:
Sequence name: / tmp / xkraCL20cZ / 43L7YcPH7x: VTNC_HUMAN
Sequence document:
Alignment: T39971_P6 x VTNC_HUMAN ..
Alignment segment 1/1:
Quality-: 2774.00
Escore: 0
Match length: 278 Total length: 278
Match Percent Similarity: 99.64 Match Percent Identity: 99.64
Total percent similarity: 99.64 Total percent identity: 99.64
Gap: 0
alignment:
...
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
...
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
...
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
...
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
...
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
..
251 PDNVDAALALPAHSYSGRERVYFFKGTQ 278
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
251 PDNVDAALALPAHSYSGRERVYFFKGKQ 278

配列名:/tmp/X4DeeuSlB4/yMubSR5FPs:VTNC_HUMAN
配列文書:
アラインメント:T39971_P9 x VTNC_HUMAN
アラインメントセグメント 1/1:
クオリティ−:4430.00
Escore:0
一致長:447 全長:478
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:93.51 全パ−セント同一性:93.51
ギャップ: 1
アラインメント:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRT......................... 325
|||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 ......SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 369
||||||||||||||||||||||||||||||||||||||||||||
351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
. . . . .
370 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 419
||||||||||||||||||||||||||||||||||||||||||||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
420 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 447
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478
Sequence name: / tmp / X4DeeuSlB4 / yMubSR5FPs: VTNC_HUMAN
Sequence document:
Alignment: T39971_P9 x VTNC_HUMAN
Alignment segment 1/1:
Quality-: 4430.00
Escore: 0
Match length: 447 Total length: 478
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 93.51 Total percent identity: 93.51
Gap: 1
alignment:
...
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
...
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
...
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
...
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
...
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
...
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
...
301 VFEHFAMMQRDSWEDIFELLFWGRT ................... 325
||||||||||||||||||||||-
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
...
326 ...... SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 369
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||||-|||||-|||||-|||||-||||||-|||||||||||| be be not
351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
...
370 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 419
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
..
420 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 447
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478

配列名:/tmp/jvp1VtnxNy/wxNSeFVZZw:VTNC_HUMAN
配列文書:
アラインメント:T39971_P11 x VTNC_HUMAN
アラインメントセグメント 1/1:
クオリティ−:3576.00
Escore:0
一致長:363 全長:478
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:75.94 全パ−セント同一性:75.94
ギャップ: 1
アラインメント:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRTS........................ 326
||||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 .................................................. 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
. . . . .
327 .........................................DKYYRVNLR 335
|||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478
Array name: / tmp / jvp1VtnxNy / wxNSeFVZZw: VTNC_HUMAN
Sequence document:
Alignment: T39971_P11 x VTNC_HUMAN
Alignment segment 1/1:
Quality-: 3756.00
Escore: 0
Match length: 363 Total length: 478
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 75.94 Total percent identity: 75.94
Gap: 1
alignment:
...
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
...
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
...
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
...
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
...
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
...
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
...
301 VFEHFAMMQRDSWEDIFELLFWGRTS ......... 326
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
...
326 ...................................................... . 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
...
327 ................................................. DKYYRVNLR 335
||||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
..
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478

配列名:/tmp/jvp1VtnxNy/wxNseFVZZw:Q9BSH7
配列文書:
アラインメント:T39971_P11 x Q9BSH7
アラインメントセグメント 1/1:
クオリティ−:3576.00
Escore:0
一致長:363 全長:478
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:75.94 全パ−セント同一性:75.94
ギャップ: 1
アラインメント:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRTS........................ 326
||||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 .................................................. 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAM 400
. . . . .
327 .........................................DKYYRVNLR 335
|||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478
Sequence name: / tmp / jvp1VtnxNy / wxNseFVZZw: Q9BSH7
Sequence document:
Alignment: T39971_P11 x Q9BSH7
Alignment segment 1/1:
Quality-: 3756.00
Escore: 0
Match length: 363 Total length: 478
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 75.94 Total percent identity: 75.94
Gap: 1
alignment:
...
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
...
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
...
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
...
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
...
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
...
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
...
301 VFEHFAMMQRDSWEDIFELLFWGRTS ......... 326
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
...
326 ...................................................... . 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAM 400
...
327 ................................................. DKYYRVNLR 335
||||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
..
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478

配列名:/tmp/fgebv7ir4i/48bTBMziJ0:VTNC_HUMAN
配列文書:
アラインメント:T39971_P12 x VTNC_HUMAN
アラインメントセグメント 1/1:
クオリティ−:2237.00
Escore:0
一致長:223 全長:223
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. .
201 GIEGPIDAAFTRINCQGKTYLFK 223
|||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFK 223
Sequence name: / tmp / fgebv7ir4i / 48bTBMziJ0: VTNC_HUMAN
Sequence document:
Alignment: T39971_P12 x VTNC_HUMAN
Alignment segment 1/1:
Quality-: 2223.00
Escore: 0
Match length: 223 Total length: 223
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
...
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
...
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
...
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
..
201 GIEGPIDAAFTRINCQGKTYLFK 223
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
201 GIEGPIDAAFTRINCQGKTYLFK 223

配列名:/tmp/fgebv7ir4i/48bTBMziJ0:Q9BSH7
配列文書:
アラインメント:T39971_P12 x Q9BSH7
アラインメントセグメント 1/1:
クオリティ−:2237.00
Escore:0
一致長:223 全長:223
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. .
201 GIEGPIDAAFTRINCQGKTYLFK 223
|||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFK 223
Sequence name: / tmp / fgebv7ir4i / 48bTBMziJ0: Q9BSH7
Sequence document:
Alignment: T39971_P12 x Q9BSH7
Alignment segment 1/1:
Quality-: 2223.00
Escore: 0
Match length: 223 Total length: 223
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
...
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
...
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
...
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
..
201 GIEGPIDAAFTRINCQGKTYLFK 223
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
201 GIEGPIDAAFTRINCQGKTYLFK 223

正常および癌乳房組織での、配列名T39971 junc23〜33に描かれたアンプリコンによって検出できる、VTNC_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)T39971転写物の発現
junc23−33、T39971 junc23−33アンプリコンならびにT39971 junc23−33FおよびT3991 junc23−33Rプライマ−によって、または従って検出可能なVTNC_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)およびG6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルの発現差の倍率を得た。
Expression of VTNC_HUMAN vitronectin (serum diffusion factor, somatomedin B, complement S protein) T39971 transcripts detectable in normal and cancerous breast tissue by the amplicon depicted in SEQ ID T39971 junc23-33
Expression of the VTNC_HUMAN vitronectin (serum spreading factor, somatomedin B, complement S protein) transcript detectable by junc23-33, T39971 junc23-33 amplicon and T39971 junc23-33F and T3991 junc23-33R primers, and thus, Measurement was performed using real-time PCR. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of the expression difference of each sample with respect to the value was obtained.

図10は、正常サンプルに比べた、癌乳房組織における上記VTN_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)転写物の発現のダウンレギュレ−ションを示すヒストグラムである。   FIG. 10 is a histogram showing the down-regulation of the expression of the above VTN_HUMAN vitronectin (serum diffusion factor, somatomedin B, complement S protein) transcript in cancer breast tissue compared to normal samples.

図10から明らかなように、上記アンプリコンによって検出できるVTNC_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)転写物の癌サンプル中での発現は、非癌性サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)に比べて有意に低い。   As is clear from FIG. 10, the expression of the VTNC_HUMAN vitronectin (serum diffusion factor, somatomedin B, complement S protein) transcript that can be detected by the above amplicon in the cancer sample is non-cancerous sample (sample numbers 56-60) 63-67, significantly lower than the above Table 1 “Tissue Sample of Test Panel”).

プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:T39971junc23−33Fフォワ−ドプライマ−;およびT39971junc23−33Rリバ−スプライマ−。   Primer pairs are also selectively and preferably encompassed by the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: There are: T39971junc23-33F forward primer; and T39971junc23-33R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する。例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:T39971junc23−33。
T39971junc22−33F(配列番号:834):GGGGCAGAACCTCTGACAAG
T39971junc22−33R(配列番号:835):GGGCAGCCCAGCCAGTA
T39971junc22−33アンプリコン(配列番号:836):GGGGCAGAACCTCTGACAAGTACTACCGAGTCAATCTTCGCACACGGCGAGTGGACACTGTGGACCCTCCCTACCCACGCTCCATCGCTCAGTACTGGCTGGGCTGCCC
The present invention also includes preferred amplicons obtained using preferred primers. For example, for the above experiment, the following amplicon has been obtained in a form limited to a non-limiting example of a suitable amplicon: T39971junc23-33.
T39971junc22-33F (SEQ ID NO: 834): GGGGCAGAACCTCTGACAAG
T39971junc22-33R (SEQ ID NO: 835): GGGCAGCCCAGCCAGTA
T39971junc22-33 amplicon (SEQ ID NO: 836): GGGGCAGAACCTCTGACAAGTACTACCGAGTCAATCTTCGCACACGGCGAGTGGACACTGTGGACCCTCCCTACCCACGCTCCATCGCTCAGTACTGGCTGGGCTGCCC

配列名T39971junc23−33に描かれたアンプリコンにより検出可能な、VTNC_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)、SARM1(T23434)に対するアンチセンス、T39971転写物の各種正常組織での発現
VTNC_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)、T33971junc23−33アンプリコンならびにT39971junc23−33FおよびT39711junc23−33Rによって検出可能な転写物を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−RPL19(GenBankアクセッション番号NM_000981;RPL19アンプリコン)、TATAボックス(GenBankアクセッション番号NM_003194;TATAアンプリコン)、UBC(GenBankアクセッション番号BC000449;アンプリコン−ユビキチンアンプリコン)およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現をハウスキ−ピング遺伝子量の相乗平均に対して正規化した。次に正規化した各RTサンプルの値を乳房サンプル(上表2「正常パネルの組織サンプル」のサンプル番号33〜35)中央値で除し、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。プライマ−およびアンプリコンは上記の通りである。
VTNC_HUMAN vitronectin (serum diffusion factor, somatomedin B, complement S protein), antisense to SARM1 (T23434), expression of T39971 transcripts in various normal tissues, detectable by the amplicon depicted in SEQ ID T39971junc23-33
Transcripts detectable by VTNC_HUMAN vitronectin (serum diffusion factor, somatomedin B, complement S protein), T33971junc23-33 amplicon and T39971junc23-33F and T39711junc23-33R were measured using real-time PCR. 4 types of housekeeping genes in parallel-RPL19 (GenBank accession number NM_000981; RPL19 amplicon), TATA box (GenBank accession number NM_003194; TATA amplicon), UBC (GenBank accession number BC000449; amplicon-ubiquitin) Amplicon) and SDHA (GenBank accession number NM_004168; amplicon-SDHA amplicon) were measured in the same manner. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of the breast sample (sample numbers 33 to 35 in Table 2 “Tissue sample of normal panel” above), and the relative expression value of each sample relative to the median value of the breast sample is calculated. Obtained. Primers and amplicons are as described above.

結果を図11に示すが、配列名T39971junc23−33に描かれているアンプリコンによって検出可能なVTNC_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)、SARM1(T23434)に対するアンチセンスの、各種正常組織における発現が証明された。   The results are shown in FIG. 11. VTNC_HUMAN vitronectin (serum diffusion factor, somatomedin B, complement S protein) detectable by the amplicon depicted in the sequence name T39971junc23-33, various anti-senses against SARM1 (T23434) Expression in normal tissues was proven.

正常および癌乳房組織における、配列名T39971seg22に描かれているアンプリコンによって検出可能なVTNC_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)の発現
seg22、T39971 sge22アンプリコン、ならびにプライマ−T39971 seg22FおよびT39971 seg22Rによって検出可能なVTNC_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)およびG6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルの特異的発現の倍率を得た。
Expression of VTNC_HUMAN vitronectin (serum diffusion factor, somatomedin B, complement S protein) detectable in normal and cancerous breast tissue by the amplicon depicted in SEQ ID T39971seg22
Expression of seg22, T39971 sge22 amplicon, and VTNC_HUMAN vitronectin (serum diffusing factor, somatomedin B, complement S protein) detectable by primers T39971 seg22F and T39971 seg22R was measured using real-time PCR. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The fold of specific expression of each sample relative to the value was obtained.

実施した一つの実験では、癌サンプルに正常PMサンプルとの発現差は観察されなかった。しかしながら、これはこの実験に特有な問題によるものと思われる。   In one experiment conducted, no expression difference was observed between the cancer sample and the normal PM sample. However, this seems to be due to problems specific to this experiment.

プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:T39971seg22Fフォワ−ドプライマ−;およびT39971seg22Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: There are: T39971seg22F forward primer; and T39971seg22R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する。例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:T39971 seg22。
フォワ−ドプライマ−T39971 seg22F(配列番号:837):GCAGTCTTGGATTCCTTTCACATT
リバ−スプライマ−T39971 seg22R(配列番号:838):GAGGCTGTTGAAGTTAGGATCTCC
アンプリコンT39971 seg 22(配列番号:839):GCAGTCTTGGATTCCTTTCACATTTCACTGGGGACAGGCCTCAGCATGTGCCCACCCCTGACCCCCACCTCATGCTGGGAGATCCTAACTTCAACAGCCTC
The present invention also includes preferred amplicons obtained using preferred primers. For example, for the above experiment, the following amplicon has been obtained in a form limited to a non-limiting example of a suitable amplicon: T39971 seg22.
Forward primer T39971 seg22F (SEQ ID NO: 837): GCAGTCTTGGATTCCTTTCACATT
River primer-T39971 seg22R (SEQ ID NO: 838): GAGGCTGTTGAAGTTAGGATCTCC
Amplicon T39971 seg 22 (SEQ ID NO: 839): GCAGTCTTGGATTCCTTTCACATTTCACTGGGGACAGGCCTCAGCATGTGCCCACCCCTGACCCCCACCTCATGCTGGGAGATCCTAACTTCAACAGCCTC

クラスタZ21368の説明
クラスタZ21368は、表1および2にそれぞれその名称を示し、配列自体は本明細書の最後に示した、関心対象の7つの転写物および34個のセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Cluster Z21368 Description Cluster Z21368 is named in Tables 1 and 2, respectively, and the sequence itself is characterized by the seven transcripts of interest and 34 segments shown at the end of the specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は既知タンパク質である細胞外スルファタ−ゼSulf−1前駆体(SwissProtアクセッション識別子SUL1_HUMAN:同義語のEC3.1.6.−;Hsulf−1としても知られる)、配列番号:96であり、ここでは既知タンパク質と呼ぶ。   These sequences are the known protein extracellular sulfatase Sulf-1 precursor (SwissProt accession identifier SUL1_HUMAN: synonymous EC3.1.6.-; also known as Hsulf-1), SEQ ID NO: 96, Here, it is called a known protein.

細胞外スルファタ−ゼSulf−1前駆体は次の機能を有することが知られているか、または信じられている:アリ−ルスルファタ−ゼの活性および高い特性を持つエンドグルコサミン−6−スルファタ−ゼ活性を阻害する。これは無傷ヘパリンの特定小領域内にあるグルコサミンのC−6位置からイオウを除去できる。HSPG(ヘパリン硫酸プロテオグリカン)の硫酸化を低下し、ヘパリン依存的増殖因子によるシグナル伝達を阻害し、増殖を低下させ、そして外来刺激への反応のアポト−シスを促進する。タンパク質スルファタ−ゼSulf−1前駆体の配列は、本明細書の最後に「細胞外スルファタ−ゼSulf−1前駆体アミノ酸配列」(配列番号:96)として示されている。この配列について知られている多形を表4に示す。   The extracellular sulfatase Sulf-1 precursor is known or believed to have the following functions: activity of arylsulfatase and endoglucosamine-6-sulfatase activity with high properties Inhibits. This can remove sulfur from the C-6 position of glucosamine within a specific subregion of intact heparin. Reduces sulfation of HSPG (heparin sulfate proteoglycan), inhibits signal transduction by heparin-dependent growth factors, reduces proliferation, and promotes apoptosis in response to external stimuli. The sequence of the protein sulfatase Sulf-1 precursor is shown at the end of the specification as the “extracellular sulfatase Sulf-1 precursor amino acid sequence” (SEQ ID NO: 96). Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質細胞外スルファタ−ゼSulf−1前駆体は小胞体およびゴルジ体スタックに局在すると信じられている;また細胞表面にも局在する(類似性から)。   The protein extracellular sulfatase Sulf-1 precursor is believed to localize to the endoplasmic reticulum and Golgi stack; it also localizes to the cell surface (due to similarity).

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;アポト−シス;代謝;ヘパラン硫酸プロテオグリカン代謝、これらは生物学的プロセスに関係する注釈であり;アリ−ルスルファタ−ゼ;ヒドラ−ゼ、これらは分子機能に関係する注釈付けであり;そして細胞外空間、小胞体;ゴルジ器官、これらは細胞成分に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; apoptosis; metabolism; heparan sulfate proteoglycan metabolism, these are annotations related to biological processes; arylsulfatases; hydrases, these are Related annotations; and extracellular space, endoplasmic reticulum; Golgi organs, these are annotations related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタZ21368は、癌におけるこのクラスタ転写物の過剰発現による診断マ−カ−として用いることができる。このような転写物の正常組織での発現も、先述の方法によって得られる。表右側縦列の項「数」および図12のy軸の数は、「百万分の一」の形で表した各分類のESTの重み付け発現を表している(百万分の一で表した、その分類の全ESTの発現に対する特定クラスタのEST発現の比)。   Cluster Z21368 can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The term “number” in the column on the right side of the table and the number of y-axis in FIG. 12 represent the weighted expression of EST of each classification expressed in the form of “parts per million” (expressed in parts per million). , Ratio of EST expression of a particular cluster to expression of all ESTs of that classification).

全体として、図12のヒストグラムおよび表5で示すような、次の結果が得られた。このクラスタは次の病的状態で過剰発現している(少なくとも最低レベルで):上皮性悪性腫瘍、各種組織由来の混合型悪性腫瘍、および膵臓癌。   Overall, the following results were obtained as shown in the histogram of FIG. 12 and Table 5. This cluster is overexpressed (at least at the lowest level) in the following pathological conditions: epithelial malignancies, mixed malignancies from various tissues, and pancreatic cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタZ21368は、上表1に記載の7つの転写物を特徴とする。これら転写物は、タンパク質細胞外スルファタ−ゼSulf−1前駆体の変異体であるタンパク質をコ−ドしている。   As described above, cluster Z21368 is characterized by the seven transcripts listed in Table 1 above. These transcripts code for proteins that are variants of the protein extracellular sulfatase Sulf-1 precursor.

本発明の変異体タンパク質Z21368_PEA_1_P2は、本明細書の最後に示すアミノ酸配列を有する;それは転写物Z21368_PEA_1_T5にコ−ドされている。既知タンパク質(細胞外スルファタ−ゼSulf−1前駆体)とのアラインメントを本明細書の最後に示す。これまでに公開されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を以下簡単に説明する:   The mutant protein Z21368_PEA_1_P2 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript Z21368_PEA_1_T5. An alignment with a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between such an aligned protein and the mutant protein of the present invention will be briefly described below:

Z21368_PEA_1_P2とSUL1_HUMANの比較報告:
1. Z21368_PEA_1_P2をコ−ドする単離されたキメラポリペプチドは、SUL1_HUMANのアミノ酸1〜761に相当し、またZ21368_PEA_1_P2のアミノ酸1〜761にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNに少なくとも90%相同である第一アミノ酸配列、およびZ21368_PEA_1_P2のアミノ酸762〜790に相当する配列PHKYSAHGRTRHFESATRTTNGAQKLSRIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between Z21368_PEA_1_P2 and SUL1_HUMAN:
1. An isolated chimeric polypeptide that codes for Z21368_PEA_1_P2 corresponds to amino acids 1 to 761 of SUL1_HUMAN and also corresponds to amino acids 1 to 761 of Z21368_PEA_1_P2, a first amino acid sequence that is at least 90% homologous, And a polypeptide having the sequence PHKYSAHGRTRHFESATRTTNGAQKLSRI corresponding to amino acids 762-790 of Z21368_PEA_1_P2, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous Wherein the first and second amino acid sequences are sequentially connected in sequence.

2. Z21368_PEA_1_P2の尾部をコ−ドする単離されたポリペプチドは、Z21368_PEA_1_P2内の配列PHKYSAHGRTRHFESATRTTNGAQKLSRIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of Z21368_PEA_1_P2 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence PHKYSAHGRTRHFESATRTTNGAQKLSRI in Z21368_PEA_1_P2. And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質Z21368_PEA_1_P2は次の転写物にコ−ドされている:Z21368_PEA_1_T5、これの配列は本明細書の最後に示している。転写物Z21368_PEA_1_T5のコ−ディング部分は太字で示している;このコ−ディング部分は位置529から開始し、位置2898に終止している。   Mutant protein Z21368_PEA_1_P2 is encoded in the following transcript: Z21368_PEA_1_T5, the sequence of which is given at the end of the specification. The coding portion of transcript Z21368_PEA_1_T5 is shown in bold; this coding portion starts at position 529 and ends at position 2898.

本発明の変異体タンパク質Z21368_PEA_1_P5は、本明細書の最後に記したアミノ酸配列を有する;それは転写物Z21368_PEA_1_T9にコ−ドされている。既知タンパク質(細胞外スルファタ−ゼSulf−1前駆体)とのアラインメントを本明細書の最後に示す。これまでに公開されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を以下簡単に説明する:   The mutant protein Z21368_PEA_1_P5 of the present invention has the amino acid sequence noted at the end of the specification; it is encoded in the transcript Z21368_PEA_1_T9. An alignment with a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between such an aligned protein and the mutant protein of the present invention will be briefly described below:

Z21368_PEA_1_P5とQ7Z2W2(配列番号:840)の比較報告:
1. Z21368_PEA_1_P5をコ−ドする単離されたキメラポリペプチドは、Q7Z2W2のアミノ酸1〜57に相当し、またZ21368_PEA_1_P5のアミノ酸1〜57にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELに少なくとも90%相同である第一アミノ酸配列、Aを含む第二架橋アミノ酸配列、およびQ7Z2W2のアミノ酸139〜871に相当し、またZ21368_PEA_1_P5のアミノ酸139〜871にも相当するFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGに少なくとも90%相同である第三アミノ酸配列を含み、このとき前記第一、第二、および第三アミノ酸配列は連続して順番につながっている。
Comparative report of Z21368_PEA_1_P5 and Q7Z2W2 (SEQ ID NO: 840):
1. An isolated chimeric polypeptide that codes for Z21368_PEA_1_P5 corresponds to amino acids 1 to 57 of Q7Z2W2 and also corresponds to amino acids 1 to 57 of Z21368_PEA_1_P5, which is at least 90% homologous to the first amino acid sequence to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVEL , A second bridged amino acid sequence comprising A, and a third amino acid sequence corresponding to amino acids 139-871 of Q7Z2W2 and also corresponding to amino acids 139-871 of Z21368_PEA_1_P5, wherein The first, second and third amino acid sequences are connected sequentially in sequence.

2.Z21368_PEA_1_P5の縁部をコ−ドする単離されたポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも三つのアミノ酸がLAFを含むポリペプチドを含み、以下の構造(Z21368_PEA_1_P5に従った番号付け)を有する:アミノ酸番号57−xから57のいずれかより開始し:アミノ酸番号59+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2.An isolated polypeptide that encodes the edge of Z21368_PEA_1_P5 has a length of “n”, where n is at least about 10 amino acids long, if necessary, at least about 20 amino acids long, preferably at least About 30 amino acids long, more preferably at least about 40 amino acids long, and most preferably at least about 50 amino acids long, including a polypeptide wherein at least three amino acids comprise LAF, the following structure (numbering according to Z21368_PEA_1_P5) Having a sequence starting from any of amino acid numbers 57-x to 57 and ending at any of amino acid numbers 59 + ((n−2) −x), where x is 0 to n−2. Range.

Z21368_PEA_1_T5とAAH12997(配列番号:841)の比較報告:
1. Z21368_PEA_1_P5をコ−ドする単離されたキメラポリペプチドは、Z21368_PEA_1_P5のアミノ酸1〜751に対応する配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、およびAAH12997のアミノ酸1〜40に相当し、またZ21368_PEA_1_P5のアミノ酸752〜791にも相当するLRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparative report of Z21368_PEA_1_T5 and AAH12997 (SEQ ID NO: 841):
1. An isolated chimeric polypeptide that codes for Z21368_PEA_1_P5 is at least 70%, if necessary at least 80%, preferably at least 85%, for a polypeptide having a sequence corresponding to amino acids 1 to 751 of Z21368_PEA_1_P5 More preferably at least 90% and most preferably at least 95% homologous and at least 90% homologous to LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG corresponding to amino acids 1-40 of AAH12997 and also corresponding to amino acids 752-791 of Z21368_PEA_1_P5 Wherein the first and second amino acid sequences are sequentially connected in sequence.

2. Z21368_PEA_1_P5の頭部をコ−ドする単離されたポリペプチドは、Z21368_PEA_1_P5の配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同であるポリペプチドを含む。   2. the head of Z21368_PEA_1_P5 co - sul isolated polypeptide is at least 70% sequence MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLME of Z21368_PEA_1_P5, at least 80% when required, preferably at least 85%, more preferably at least 90% And most preferably comprises polypeptides that are at least 95% homologous.

Z21368_PEA_1_T5とSUL1_HUMANの比較報告:
1. Z21368_PEA_1_P5をコ−ドする単離されたキメラポリペプチドは、SUL1_HUMANのアミノ酸1〜57に相当し、またZ21368_PEA_1_P2のアミノ酸1〜57にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELに少なくとも90%相同である第一アミノ酸配列、およびSUL1_HUMANのアミノ酸138〜871に相当し、またZ21368_PEA_1_P5のアミノ酸58〜791にも相当するAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGに少なくとも90%相同である第二アミノ酸配列を含む。
Comparison report between Z21368_PEA_1_T5 and SUL1_HUMAN:
1. An isolated chimeric polypeptide that codes for Z21368_PEA_1_P5 corresponds to amino acids 1 to 57 of SUL1_HUMAN and also corresponds to amino acids 1 to 57 of Z21368_PEA_1_P2, which is at least 90% amino acid sequence homologous to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVEL And a second amino acid sequence corresponding to amino acids 138 to 871 of SUL1_HUMAN and corresponding to amino acids 58 to 791 of Z21368_PEA_1_P5, which is at least 90% homologous.

2. Z21368_PEA_1_P5の縁部をコ−ドする単離されたポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がLAを含むポリペプチドを含み、以下の構造(Z21368_PEA_1_P5に従った番号付け)を有する:アミノ酸番号57−xから57のいずれかより開始し:アミノ酸番号58+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated polypeptide that encodes the edge of Z21368_PEA_1_P5 has a length “n”, where n is at least about 10 amino acids long, if necessary, at least about 20 amino acids long, preferably at least About 30 amino acids long, more preferably at least about 40 amino acids long, and most preferably at least about 50 amino acids long, including a polypeptide wherein at least two amino acids contain LA, numbered according to Z21368_PEA_1_P5: A sequence starting from any of amino acid numbers 57-x to 57 and ending at any of amino acid numbers 58 + ((n-2) -x), where x is 0 to n-2 Range.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質Z21368_PEA_1_P5は次の転写物にコ−ドされている:Z21368_PEA_1_T9、これの配列は本明細書の最後に示している。転写物Z21368_PEA_1_T9のコ−ディング部分は太字で示している;このコ−ディング部分は位置556から開始し、位置2928に終止している。   Mutant protein Z21368_PEA_1_P5 is encoded in the following transcript: Z21368_PEA_1_T9, the sequence of which is given at the end of the specification. The coding portion of transcript Z21368_PEA_1_T9 is shown in bold; this coding portion starts at position 556 and ends at position 2928.

本発明の変異体タンパク質Z21368_PEA_1_P15は、本明細書の最後に記したアミノ酸配列を有する;それは転写物Z21368_PEA_1_T23にコ−ドされている。既知タンパク質(細胞外スルファタ−ゼSulf−1前駆体)とのアラインメントを本明細書の最後に示す。これまでに公開されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を以下簡単に説明する:   The mutant protein Z21368_PEA_1_P15 of the present invention has the amino acid sequence noted at the end of the specification; it is encoded in the transcript Z21368_PEA_1_T23. An alignment with a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between such an aligned protein and the mutant protein of the present invention will be briefly described below:

Z21368_PEA_1_P15とSUL1_HUMANの比較報告:
1. Z21368_PEA_1_P15をコ−ドする単離されたキメラポリペプチドは、SUL1_HUMANのアミノ酸1〜416に相当し、またZ21368_PEA_1_P15のアミノ酸1〜416にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGに少なくとも90%相同である第一アミノ酸配列を含む。
Comparison report between Z21368_PEA_1_P15 and SUL1_HUMAN:
1. Z21368_PEA_1_P15 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 416 of SUL1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERG which also corresponds to amino acids 1 to 416 of Z21368_PEA_1_P15 including.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質Z21368_PEA_1_P15は次の転写物にコ−ドされている:Z21368_PEA_1_T23、これの配列は本明細書の最後に示している。転写物Z21368_PEA_1_T23のコ−ディング部分は太字で示している;このコ−ディング部分は位置691から開始し、位置1938に終止している。   Mutant protein Z21368_PEA_1_P15 is encoded in the following transcript: Z21368_PEA_1_T23, the sequence of which is given at the end of the specification. The coding portion of transcript Z21368_PEA_1_T23 is shown in bold; this coding portion starts at position 691 and ends at position 1938.

本発明の変異体タンパク質Z21368_PEA_1_P16は、本明細書の最後に記したアミノ酸配列を有する;それは転写物Z21368_PEA_1_T24にコ−ドされている。既知タンパク質(細胞外スルファタ−ゼSulf−1前駆体)とのアラインメントを本明細書の最後に示す。これまでに公開されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を以下簡単に説明する:   The mutant protein Z21368_PEA_1_P16 of the present invention has the amino acid sequence noted at the end of the specification; it is encoded in the transcript Z21368_PEA_1_T24. An alignment with a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between such an aligned protein and the mutant protein of the present invention will be briefly described below:

Z21368_PEA_1_P16とSUL1_HUMANの比較報告:
1. Z21368_PEA_1_P16をコ−ドする単離されたキメラポリペプチドは、SUL1_HUMANのアミノ酸1〜397に相当し、またZ21368_PEA_1_P16のアミノ酸1〜397にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRに少なくとも90%相同である第一アミノ酸配列、およびZ21368_PEA_1_P16のアミノ酸398〜410に相当する配列CVIVPPLSQPQIHを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between Z21368_PEA_1_P16 and SUL1_HUMAN:
1. Z21368_PEA_1_P16 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 397 of SUL1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR which also corresponds to amino acids 1 to 397 of Z21368_PEA_1_P16 , And a polypeptide having the sequence CVIVPPLSQPQIH corresponding to amino acids 398-410 of Z21368_PEA_1_P16, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% Homologous second amino acid sequence Wherein, said this time the first and second amino acid sequences are linked in sequence continuously.

2. Z21368_PEA_1_P16の尾部をコ−ドする単離されたポリペプチドは、Z21368_PEA_1_P16内の配列CVIVPPLSQPQIHに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of Z21368_PEA_1_P16 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence CVIVPPLSQPQIH in Z21368_PEA_1_P16 And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質Z21368_PEA_1_P16は次の転写物にコ−ドされている:Z21368_PEA_1_T24、これの配列は本明細書の最後に示している。転写物Z21368_PEA_1_T24のコ−ディング部分は太字で示している;このコ−ディング部分は位置691から開始し、位置1920に終止している。   Mutant protein Z21368_PEA_1_P16 is encoded in the following transcript: Z21368_PEA_1_T24, the sequence of which is given at the end of the specification. The coding portion of transcript Z21368_PEA_1_T24 is shown in bold; this coding portion starts at position 691 and ends at position 1920.

本発明の変異体タンパク質Z21368_PEA_1_P22は、本明細書の最後に記したアミノ酸配列を有する;それは転写物Z21368_PEA_1_T10にコ−ドされている。既知タンパク質(細胞外スルファタ−ゼSulf−1前駆体)とのアラインメントを本明細書の最後に示す。これまでに公開されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を以下簡単に説明する:   The mutant protein Z21368_PEA_1_P22 of the present invention has the amino acid sequence noted at the end of the specification; it is encoded in the transcript Z21368_PEA_1_T10. An alignment with a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between such an aligned protein and the mutant protein of the present invention will be briefly described below:

Z21368_PEA_1_P22とSUL1_HUMANの比較報告:
1. Z21368_PEA_1_P22をコ−ドする単離されたキメラポリペプチドは、SUL1_HUMANのアミノ酸1〜188に相当し、またZ21368_PEA_1_P22のアミノ酸1〜188にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKに少なくとも90%相同である第一アミノ酸配列、およびZ21368_PEA_1_P22のアミノ酸189〜210に相当する配列ARYDGDQPRCAPRPRGLSPTVFを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between Z21368_PEA_1_P22 and SUL1_HUMAN:
1. Z21368_PEA_1_P22 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 188 of SUL1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK which also corresponds to amino acids 1 to 188 of Z21368_PEA_1_P22 , And a polypeptide having the sequence ARYDGDQPRCAPRPRGLSPTVF corresponding to amino acids 189-210 of Z21368_PEA_1_P22, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. Z21368_PEA_1_P22の尾部をコ−ドする単離されたポリペプチドは、Z21368_PEA_1_P22内の配列ARYDGDQPRCAPRPRGLSPTVFに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of Z21368_PEA_1_P22 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence ARYDGDQPRCAPRPRGLSPTVF in Z21368_PEA_1_P22 And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質Z21368_PEA_1_P22は次の転写物にコ−ドされている:A21368_PEA_1_T10、これの配列は本明細書の最後に示してある。転写物Z21368_PEA_1_T10のコ−ディング部分は、太字で示している;このコ−ディング部分は位置691から開始して、位置1320に終止している。   Mutant protein Z21368_PEA_1_P22 is encoded in the following transcript: A21368_PEA_1_T10, the sequence of which is given at the end of the specification. The coding portion of transcript Z21368_PEA_1_T10 is shown in bold; this coding portion starts at position 691 and ends at position 1320.

本発明の変異体タンパク質Z21368_PEA_1_P23は、本明細書の最後に記したアミノ酸配列を有する;それは転写物Z21368_PEA_1_T11にコ−ドされている。既知タンパク質(細胞外スルファタ−ゼSulf−1前駆体)とのアラインメントを本明細書の最後に示す。これまでに公開されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を以下簡単に説明する:   The mutant protein Z21368_PEA_1_P23 of the present invention has the amino acid sequence noted at the end of the specification; it is encoded in the transcript Z21368_PEA_1_T11. An alignment with a known protein (extracellular sulfatase Sulf-1 precursor) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between such an aligned protein and the mutant protein of the present invention will be briefly described below:

Z21368_PEA_1_P23とQ7Z2W2の比較報告:
1. Z21368_PEA_1_P23をコ−ドする単離されたキメラポリペプチドは、Q7Z2W2のアミノ酸1〜137に相当し、またZ21368_PEA_1_P23のアミノ酸1〜137にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTに少なくとも90%相同である第一アミノ酸配列、およびZ21368_PEA_1_P23のアミノ酸138〜145に相当する配列GLLHRLNHを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between Z21368_PEA_1_P23 and Q7Z2W2:
1. The isolated chimeric polypeptide that codes for Z21368_PEA_1_P23 corresponds to amino acids 1-137 of Q7Z2W2 and also to MKYSCCALVLAVLGTELLGSLCQNVYN And a polypeptide having the sequence GLLHRLNH corresponding to amino acids 138 to 145 of Z21368_PEA_1_P23, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. Z21368_PEA_1_P23の尾部をコ−ドする単離されたポリペプチドは、Z21368_PEA_1_P23内の配列GLLHRLNHに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. The isolated polypeptide that codes the tail of Z21368_PEA_1_P23 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence GLLHRLNH in Z21368_PEA_1_P23. And most preferably comprises a polypeptide that is at least about 95% homologous.

Z21368_PEA_1_P23とSUT1_HUMANの比較報告:
1. Z21368_PEA_1_P23をコ−ドする単離されたキメラポリペプチドは、SUL1_HUMANのアミノ酸1〜137に相当し、またZ21368_PEA_1_P23のアミノ酸1〜137にも相当するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTに少なくとも90%相同である第一アミノ酸配列、およびZ21368_PEA_1_P23のアミノ酸138〜145に相当する配列GLLHRLNHを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between Z21368_PEA_1_P23 and SUT1_HUMAN:
1. The isolated chimeric polypeptide that codes for Z21368_PEA_1_P23 corresponds to amino acids 1-137 of SUL1_HUMAN and also to MKYSCCALVLAVLGTELLGSLCN And a polypeptide having the sequence GLLHRLNH corresponding to amino acids 138 to 145 of Z21368_PEA_1_P23, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2.Z Z21368_PEA_1_P23の尾部をコ−ドする単離されたポリペプチドは、21368_PEA_1_P23内の配列GLLHRLNHに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.The isolated polypeptide that codes the tail of Z Z21368_PEA_1_P23 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence GLLHRLNH in 21368_PEA_1_P23. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質Z21368_PEA_1_P23は次の転写物にコ−ドされている:A21368_PEA_1_T11、これの配列は本明細書の最後に示してある。転写物Z21368_PEA_1_T11のコ−ディング部分は、太字で示している;このコ−ディング部分は位置691から開始して、位置1125に終止している。   Mutant protein Z21368_PEA_1_P23 is encoded in the following transcript: A21368_PEA_1_T11, the sequence of which is given at the end of the specification. The coding portion of transcript Z21368_PEA_1_T11 is shown in bold; this coding portion starts at position 691 and ends at position 1125.

上記のように、クラスタZ21368は、上表2に記載し、またその配列を本明細書の最後に示した34個のセグメントを特徴とする。これらセグメントは、特に関心の対象であることから、ここに別々に記載した核酸配列部分である。次に本発明の各セグメントについて説明する。   As noted above, cluster Z21368 is characterized by the 34 segments listed in Table 2 above and whose sequences are shown at the end of this specification. Since these segments are of particular interest, they are the nucleic acid sequence portions described separately here. Next, each segment of the present invention will be described.

本発明のセグメントクラスタZ21368_PEA_1_node_0は8個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T9。下表7に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_0 of the present invention is supported by eight libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T9. Table 7 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_15は26個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表8に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_15 of the present invention is supported by 26 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 8 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_19は24個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、およびZ21368_PEA_1_T6。下表9に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_19 of the present invention is supported by 24 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, and Z21368_PEA_1_T6. Table 9 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_2は15個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、およびZ21368_PEA_1_T6。下表10に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_2 of the present invention is supported by 15 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, and Z21368_PEA_1_T6. Table 10 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_21は37個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表11に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_21 of the present invention is supported by 37 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 11 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_33は45個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表12に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_33 of the present invention is supported by 45 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 12 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_36は44個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表13に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_36 of the present invention is supported by 44 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 13 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_37は3個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: Z21368_PEA_1_T24。下表14に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_37 of the present invention is supported by three libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T24. Table 14 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_39は5個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: Z21368_PEA_1_T23およびZ21368_PEA_1_T24。下表15に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_39 of the present invention is supported by five libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T23 and Z21368_PEA_1_T24. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_4は13個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、およびZ21368_PEA_1_T24。下表16に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_4 of the present invention is supported by 13 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, and Z21368_PEA_1_T24. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_41は49個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表17に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_41 of the present invention is supported by 49 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_43は52個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表18に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_43 of the present invention is supported by 52 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_45は64個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表19に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_45 of the present invention is supported by 64 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_53は60個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表20に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_53 of the present invention is supported by 60 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 20 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_56は50個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、およびZ21368_PEA_1_T9。下表21に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_56 of the present invention is supported by 50 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, and Z21368_PEA_1_T9. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_58は71個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表22に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_58 of the present invention is supported by 71 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 22 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_66は142個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表23に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_66 of the present invention is supported by 142 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_67は181個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表24に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_67 of the present invention is supported by 181 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 24 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_69は150個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。下表25に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_69 of the present invention is supported by 150 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6, and Z21368_PEA_1_T9. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは長さが約120bpまでであり、それゆえに説明を別に行う。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are up to about 120 bp in length and are therefore described separately.

本発明のセグメントクラスタZ21368_PEA_1_node_11は26個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表26に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_11 of the present invention is supported by 26 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_12は23個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表27に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_12 of the present invention is supported by 23 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_16は次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表28に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_16 of the present invention can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PE Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_17は19個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表29に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_17 of the present invention is supported by 19 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 29 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_23は36個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表30に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_23 of the present invention is supported by 36 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 30 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_24は36個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表31に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_24 of the present invention is supported by 36 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 31 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_30は39個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表32に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_30 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 32 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_31は40個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表33に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_31 of the present invention is supported by 40 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 33 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_38は45個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表34に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_38 of the present invention is supported by 45 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 34 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_47は61個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表35に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_47 of the present invention is supported by 61 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 35 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_49は57個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表36に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_49 of the present invention is supported by 57 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 36 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_51は46個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表37に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_51 of the present invention is supported by 46 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 37 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_61は61個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表38に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_61 of the present invention is supported by 61 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 38 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_68は87個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表39に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_68 of the present invention is supported by 87 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 39 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ21368_PEA_1_node_7は29個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6およびZ21368_PEA_1_T9。下表40に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z21368_PEA_1_node_7 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: Z21368_PEA_1_T10, Z21368_PEA_1_T11, Z21368_PEA_1_T23, Z21368_PEA_1_T24, Z21368_PEA_1_T5, Z21368_PEA_1_T6 and Z21368_PEA_1_T9. Table 40 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

このクラスタの少なくとも一部分の過剰発現は、オリゴヌクレオチド、および一または複数のチップによって決定された。結果は次の通りであった:オリゴヌクレオチドZ21368_0_0_61857はTAAチップ上にあり、乳癌において過剰発現されることが見出された。   Overexpression of at least a portion of this cluster was determined by oligonucleotides and one or more chips. The results were as follows: Oligonucleotide Z21368_0_0_61857 was found on the TAA chip and was overexpressed in breast cancer.

変異体タンパク質の既知タンパク質とのアラインメント:
配列名:/tmp/5ER3vIMKE2/9L0Y71D1TQ:SUL1_HUMAN
配列文書:
アラインメント:Z21368_PEA_1_P2 x SUL1_HUMAN
アラインメントセグメント 1/1:
クオリティ−:7664.00
Escore:0
一致長:761 全長:761
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
.
751 NNHWQTAPFWN 761
|||||||||||
751 NNHWQTAPFWN 761
Alignment of mutant proteins with known proteins:
Sequence name: / tmp / 5ER3vIMKE2 / 9L0Y71D1TQ: SUL1_HUMAN
Sequence document:
Alignment: Z21368_PEA_1_P2 x SUL1_HUMAN
Alignment segment 1/1:
Quality-: 7664.00
Escore: 0
Match length: 761 Total length: 761
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
...
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
...
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
...
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
...
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
...
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
...
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
...
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
...
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
...
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
...
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
...
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
...
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
...
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
...
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
.
751 NNHWQTAPFWN 761
||||||||||||
751 NNHWQTAPFWN 761

配列名:/tmp/tt3yfXIUKV/YxSTFWr66h:Q7Z2W2
配列文書:
アラインメント:Z21368_PEA_1_P5 x Q7Z2W2
アラインメントセグメント 1/1:
クオリティ−:7869.00
Escore:0
一致長:791 全長:871
一致パ−セント類似性:99.87 一致パ−セント同一性:99.87
全パ−セント類似性:90.70 全パ−セント同一性:90.70
ギャップ: 1
アラインメント
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELA.......................................... 58
|||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
59 ......................................FFGKYLNEYNGS 70
||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTVFFGKYLNEYNGS 150
. . . . .
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 120
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
121 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
221 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 270
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
421 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
471 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
571 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 620
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 670
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
. . . . .
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
||||||||||||||||||||||||||||||||||||||||||||||||||
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
. . . . .
721 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 770
||||||||||||||||||||||||||||||||||||||||||||||||||
801 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 850
. .
771 GNKDGGSYDLHRGQLWDGWEG 791
|||||||||||||||||||||
851 GNKDGGSYDLHRGQLWDGWEG 871
Sequence name: / tmp / tt3yfXIUKV / YxSTFWr66h: Q7Z2W2
Sequence document:
Alignment: Z21368_PEA_1_P5 x Q7Z2W2
Alignment segment 1/1:
Quality-: 7889.00
Escore: 0
Match length: 791 Total length: 871
Match Percent Similarity: 99.87 Match Percent Identity: 99.87
Total percent similarity: 90.70 Total percent identity: 90.70
Gap: 1
alignment
...
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
...
51 DDQDVELA ... 58
||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
...
59 ...................................... FFGKYLNEYNGS 70
||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTVFFGKYLNEYNGS 150
...
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 120
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
...
121 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
...
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
...
221 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 270
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
...
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
...
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
...
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
...
421 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
...
471 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
...
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
...
571 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 620
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
...
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 670
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
...
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
...
721 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 770
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 850
..
771 GNKDGGSYDLHRGQLWDGWEG 791
||||||||||||||||||||||-
851 GNKDGGSYDLHRGQLWDGWEG 871

配列名:/tmp/tt3yfXIUKV/VxSTFWr66h:AAH12997
配列文書:
アラインメント:Z21368_PEA_1_P5 x AAH12997
アラインメントセグメント 1/1:
クオリティ−:420.00
Escore:0
一致長:40 全長:40
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント
. . . .
752 LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG 791
||||||||||||||||||||||||||||||||||||||||
1 LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG 40
Sequence name: / tmp / tt3yfXIUKV / VxSTFWr66h: AAH12997
Sequence document:
Alignment: Z21368_PEA_1_P5 x AAH12997
Alignment segment 1/1:
Quality-: 420.00
Escore: 0
Match length: 40 Total length: 40
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment
...
752 LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG 791
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||||-||||||-|||||-||||||-|||||-|||||||-
1 LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG 40

配列名:/tmp/tt3yfXIUKV/YxSTFWr66h:SUL1_HUMAN
配列文書:
アラインメント:Z21368_PEA_1_P5 x SUL1_HUMAN
アラインメントセグメント 1/1:
クオリティ−:7878.00
Escore:0
一致長:791 全長:871
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:90.82 全パ−セント同一性:90.82
ギャップ: 1
アラインメント
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVEL........................................... 57
|||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
58 .....................................AFFGKYLNEYNGS 70
|||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 120
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
121 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
221 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 270
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
421 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
471 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
571 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 620
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 670
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
. . . . .
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
||||||||||||||||||||||||||||||||||||||||||||||||||
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
. . . . .
721 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 770
||||||||||||||||||||||||||||||||||||||||||||||||||
801 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 850
. .
771 GNKDGGSYDLHRGQLWDGWEG 791
|||||||||||||||||||||
851 GNKDGGSYDLHRGQLWDGWEG 871
Sequence name: / tmp / tt3yfXIUKV / YxSTFWr66h: SUL1_HUMAN
Sequence document:
Alignment: Z21368_PEA_1_P5 x SUL1_HUMAN
Alignment segment 1/1:
Quality-: 7787.00
Escore: 0
Match length: 791 Total length: 871
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 90.82 Total percent identity: 90.82
Gap: 1
alignment
...
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
...
51 DDQDVEL ....................................... 57
||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
...
58 ................................ AFFGKYLNEYNGS 70
||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
...
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 120
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
...
121 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
...
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
...
221 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 270
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
...
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
...
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
...
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
...
421 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
...
471 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
...
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
...
571 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 620
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
...
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 670
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
...
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
...
721 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 770
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 850
..
771 GNKDGGSYDLHRGQLWDGWEG 791
||||||||||||||||||||||-
851 GNKDGGSYDLHRGQLWDGWEG 871

配列名:/tmp/AVAZGWHuF0/RzHFOnHIsT:SUL1_HUMAN
配列文書:
アラインメント:Z21368_PEA_1_P15 x SUL1_HUMAN
アラインメントセグメント 1/1:
クオリティ−:4174.00
Escore:0
一致長:416 全長:416
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
.
401 NKKAKIWRDTFLVERG 416
||||||||||||||||
401 NKKAKIWRDTFLVERG 416
Sequence name: / tmp / AVAZGWHuF0 / RzHFOnHIsT: SUL1_HUMAN
Sequence document:
Alignment: Z21368_PEA_1_P15 x SUL1_HUMAN
Alignment segment 1/1:
Quality: 4174.00
Escore: 0
Match length: 416 Total length: 416
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
...
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
...
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
...
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
...
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
...
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
...
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
...
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
.
401 NKKAKIWRDTFLVERG 416
||||||||||||||||||| | ||||||
401 NKKAKIWRDTFLVERG 416

配列名:/tmp/JhwgRdKqmt/kqSmjxkWWk:SUL1_HUMAN
配列文書:
アラインメント:Z21368_PEA_1_P16 x SUL1_HUMAN
アラインメントセグメント 1/1:
クオリティ−:3985.00
Escore:0
一致長:397 全長:397
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR 397
|||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR 397
Array name: / tmp / JhwgRdKqmt / kqSmjxkWWk: SUL1_HUMAN
Sequence document:
Alignment: Z21368_PEA_1_P16 x SUL1_HUMAN
Alignment segment 1/1:
Quality-: 3985.00
Escore: 0
Match length: 397 Total length: 397
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
...
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
...
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
...
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
...
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
...
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
...
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
...
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR 397
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||-|||||||-||||-||||||-||||-|||||-|||||-|||||||||||-| be be
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR 397

配列名:/tmp/GPlnIw3BOg/zXFdxgG4ow:SUL1_HUMAN
配列文書:
アラインメント:Z21368_PEA_1_P22 x SUL1_HUMAN
アラインメントセグメント 1/1:
クオリティ−:1897.00
Escore:0
一致長:188 全長:188
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188
||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188
Sequence name: / tmp / GPlnIw3BOg / zXFdxgG4ow: SUL1_HUMAN
Sequence document:
Alignment: Z21368_PEA_1_P22 x SUL1_HUMAN
Alignment segment 1/1:
Quality: 1893.00
Escore: 0
Match length: 188 Total length: 188
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
...
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
...
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
..
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||||-
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188

配列名:/tmp/oji5Fs74fB/BxeB9KrGjp:Q7Z2W2
配列文書:
アラインメント:Z21368_PEA_1_P23 x Q7Z2W2
アラインメントセグメント 1/1:
クオリティ−:1368.00
Escore:0.000511
一致長:137 全長:137
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
|||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
Sequence name: / tmp / oji5Fs74fB / BxeB9KrGjp: Q7Z2W2
Sequence document:
Alignment: Z21368_PEA_1_P23 x Q7Z2W2
Alignment segment 1/1:
Quality-: 1368.00
Escore: 0.000511
Match length: 137 Total length: 137
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
...
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
..
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in a state
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137

配列名:/tmp/oji5Fs74fB/BxeB9KrGjp:SUL1_HUMAN
配列文書:
アラインメント:Z21368_PEA_1_P23 x SUL1_HUMAN
アラインメントセグメント 1/1:
クオリティ−:1368.00
Escore:0.000511
一致長:137 全長:137
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
|||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
Sequence name: / tmp / oji5Fs74fB / BxeB9KrGjp: SUL1_HUMAN
Sequence document:
Alignment: Z21368_PEA_1_P23 x SUL1_HUMAN
Alignment segment 1/1:
Quality-: 1368.00
Escore: 0.000511
Match length: 137 Total length: 137
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
...
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
..
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in a state
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137

配列名Z21368seg39に描かれたアンプリコンによって検出できるSULF1_HUMAN−細胞外スルファタ−ゼSulf−1Z21368転写物の、正常および癌乳房組織での発現
seg39、Z21368seg39アンプリコンならびにZ21368seg39FおよびZ21368seg39Rプライマ−によって、または従って検出可能なSUL1_HUMAN−細胞外スルファタ−ゼSulf−1転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)およびG6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルのアップレギュレ−ション倍率を得た。
Expression of SULF1_HUMAN-extracellular sulfatase Sulf-1Z21368 transcript in normal and cancer breast tissue detectable by the amplicon depicted in SEQ ID Z21368seg39
The expression of the SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript, which was detectable by the seg39, Z21368 seg39 amplicon and Z21368 seg39F and Z21368 seg39R primers, and thus, was measured using real-time PCR. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The up-regulation magnification of each sample relative to the value was obtained.

図13は、正常サンプルに比べ癌性乳房組織において、上記SUL1_HUMAN−細胞外スルファタ−ゼSulf−1転写物の発現が過剰発現していることを示すヒストグラムである。値は二重実験の平均を表している。誤差バ−は得られた最小値と最大値を示している。試験した全数サンプルの内、少なくとも5倍の過剰発現を示すサンプルの数およびパ−センテ−ジを下段に示す。   FIG. 13 is a histogram showing that the expression of the SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript is overexpressed in cancerous breast tissue as compared to normal samples. Values represent the average of duplicate experiments. The error bar indicates the obtained minimum and maximum values. Of the total number of samples tested, the number and percentage of samples showing at least 5-fold overexpression are shown in the bottom row.

図13から明らかなように、上記アンプリコンによって検出できるSUL1−HUMAN−細胞外スルファタ−ゼSulf−1転写物の癌サンプル中での発現は、非癌性サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)に比べ有意に高い。特に、28の腺癌サンプル中13サンプルに少なくとも5倍の過剰発現が見られた。   As is apparent from FIG. 13, the expression of the SUL1-HUMAN-extracellular sulfatase Sulf-1 transcript that can be detected by the amplicon in a cancer sample is shown in non-cancerous samples (sample numbers 56-60, 63- 67, significantly higher than Table 1 “Tissue sample of test panel”). In particular, at least 5-fold overexpression was seen in 13 of 28 adenocarcinoma samples.

以下記載のように、統計分析を用いてこれら結果の有意性を検証した。   The significance of these results was verified using statistical analysis as described below.

乳癌サンプルと正常組織サンプルを比較した時の、上記アンプリコンによって検出できるSUL1_HUMAN−細胞外スルファタ−ゼSulf−1転写物の発現レベルの差に関するP値は、T検定によって2.14E−03と決定された。   The P value for the difference in the expression level of SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript detectable by the amplicon when comparing a breast cancer sample and a normal tissue sample was determined to be 2.14E-03 by T test. It was.

直接フィシャ−検定で調べたところ、5倍の過剰発現の閾値は、6.91E−03のP値で癌サンプルと正常サンプルを区別することが判明した。上記の値は、結果の統計有意性を証明している。   When examined with a direct Fisher test, a 5-fold overexpression threshold was found to distinguish cancer samples from normal samples with a P value of 6.91E-03. The above values prove the statistical significance of the results.

プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験については、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:Z21368seg39Fフォワ−ドプライマ−;およびZ21368seg39Rリバ−スプライマ−。   Primer pairs are also selectively and preferably encompassed by the present invention; for example, for the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: Z21368 seg39F forward primer; and Z21368 seg39R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選し包含している。例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:Z21368seg39。
Z21368seg39F(配列番号:842):GTTGCATTTCTCAGTGCTGGTTT
Z21368seg39R(配列番号:843):AGGGTGCCGGGTGAGG
Z21368seg39アンプリコン(配列番号:844):GTTGCATTTCTCAGTGCTGGTTTCTAATCAGACCAGTGGATTGAGTTTCTCTACCATCCTCCCCACGTTCTTCTCTAAGCTGCCTCCAAGCCTCACCCGGCACCCT
The present invention also includes and favors amplicons obtained using preferred primers. For example, for the above experiment, the following amplicon has been obtained in a form limited to a non-limiting example of a suitable amplicon: Z21368seg39.
Z21368seg39F (SEQ ID NO: 842): GTTGCATTTCTCAGTGCTGGTTT
Z21368seg39R (SEQ ID NO: 843): AGGGTGCCGGGTGAGG
Z21368seg39 amplicon (SEQ ID NO: 844): GTTGCATTTCTCAGTGCTGGTTTCTAATCAGACCAGTGGATTGAGTTTCTCTACCATCCTCCCCACGTTCTTCTCTAAGCTGCCTCCAAGCCTCACCCGGCACCCT

配列名Z21368seg39に描かれたアンプリコンによって検出できるSUL1_HUMAN−細胞外スルファタ−ゼSulf−1Z21368転写物の各種正常組織での発現
Z21368seg39アンプリコンならびにZ21368seg39FおよびZ21368seg39Rプライマ−によって、または従って検出できるSUL1_HUMAN−細胞外スルファタ−ゼSulf−1転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−[RPL19(GenBankアクセッション番号NM_000981;RPL19アンプリコン)、TATAボックス(GenBankアクセッション番号NM_003194;TATAアンプリコン)、UBC(GenBankアクセッション番号BC000449;アンプリコン−ユビキチンアンプリコン)およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現をハウスキ−ピング遺伝子量の相乗平均に対して正規化した。次に正規化した各RTサンプルの値を乳房サンプル(上表2「正常パネルの組織サンプル」のサンプル番号33〜35)中央値で除し、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。プライマ−およびアンプリコンは上記の通りである。
Expression in various normal tissues of the SUL1_HUMAN-extracellular sulfatase Sulf-1Z21368 transcript detectable by the amplicon depicted in the sequence name Z21368seg39
The expression of the SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript, which can be detected by the Z21368seg39 amplicon and the Z21368seg39F and Z21368seg39R primers, or accordingly, was measured using real-time PCR. Four kinds of housekeeping genes in parallel-[RPL19 (GenBank accession number NM_000981; RPL19 amplicon), TATA box (GenBank accession number NM_003194; TATA amplicon), UBC (GenBank accession number BC000449; amplicon- Ubiquitin amplicon) and SDHA (GenBank accession number NM_004168; amplicon-SDHA amplicon) were also measured. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of the breast sample (sample numbers 33 to 35 in Table 2 “Tissue sample of normal panel” above), and the relative expression value of each sample relative to the median value of the breast sample is calculated. Obtained. Primers and amplicons are as described above.

結果を図14に示したが、各種正常組織での、配列名Z21368seg39に描かれているアンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファタ−ゼSulf−1Z21368転写物の発現を証明している。   The results are shown in FIG. 14 and demonstrate the expression of the SUL1_HUMAN-extracellular sulfatase Sulf-1Z21368 transcript detectable by the amplicon depicted in the sequence name Z21368seg39 in various normal tissues.

配列名Z21368junc17−21に描かれたアンプリコンによって検出できるSULF1_HUMAN−細胞外スルファタ−ゼSulf−1Z21368転写物の、正常および癌乳房組織での発現
Z21368junc17−21アンプリコンならびにZ21368junc17−21FおよびA21368junc17−21Rプライマ−によって、または従って検出できるSUL1_HUMAN−細胞外スルファタ−ゼSulf−1転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)およびG6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルのアップレギュレ−ションの倍率を得た。
Expression of SULF1_HUMAN-extracellular sulfatase Sulf-1Z21368 transcript detectable in the amplicon depicted in SEQ ID Z21368junc17-21 in normal and cancer breast tissue
The expression of the SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript, which can be detected by the Z21368junc17-21 amplicon and the Z21368junc17-21F and A21368junc17-21R primers, or accordingly, was measured using real-time PCR. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of each sample up-regulation relative to the value was obtained.

図15は、正常サンプルに比べて、癌乳房組織において上記SUL1_HUMAN−細胞外スルファタ−ゼSulf−1転写物が過剰発現していることを示すヒストグラムである。値は、二重実験の平均を表している。誤差バ−は得られた最小値と最大値を示している。試験した全数サンプルの内、少なくとも5倍の過剰発現を示すサンプルの数およびパ−センテ−ジを下段に示す。   FIG. 15 is a histogram showing that the SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript is overexpressed in breast cancer tissue compared to normal samples. Values represent the average of duplicate experiments. The error bar indicates the obtained minimum and maximum values. Of the total number of samples tested, the number and percentage of samples showing at least 5-fold overexpression are shown in the bottom row.

図15から明らかなように、上記アンプリコンによって検出できるSUL1−HUMAN−細胞外スルファタ−ゼSulf−1転写物の癌サンプル中での発現は、非癌性サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)に比べ有意に高い。特に28の腺癌サンプル中11サンプルに少なくとも5倍の過剰発現が見られた。   As is apparent from FIG. 15, the expression of the SUL1-HUMAN-extracellular sulfatase Sulf-1 transcript, which can be detected by the amplicon, in the cancer sample is shown in non-cancerous samples (sample numbers 56-60, 63- 67, significantly higher than Table 1 “Tissue sample of test panel”). In particular, 11 out of 28 adenocarcinoma samples showed at least a 5-fold overexpression.

以下記載のように、統計分析を用いてこれら結果の有意性を検証した。   The significance of these results was verified using statistical analysis as described below.

乳癌サンプルと正常組織サンプルを比較した時の、上記アンプリコンによって検出できるきるSUL1_HUMAN−細胞外スルファタ−ゼSulf−1転写物の発現レベルの差に関するP値は、T検定によって4.6E−03と決定された。   When comparing breast cancer samples and normal tissue samples, the P value for the difference in the expression level of the SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript that can be detected by the amplicon was determined to be 4.6E-03 by T-test. It was done.

直接フィシャ−検定で調べたところ、5倍の過剰発現の閾値は1.78E−02のP値で癌サンプルと正常サンプルを区別することが判明した。上記の値は、結果の統計学的有意性を証明している。本発明には、プライマ−ペア−もまた選択的、且つ好んで包含される;例えば、上記実験については、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:Z21368junc17−21Fフォワ−ドプライマ−; Z21368junc17−21Rリバ−スプライマ−。   When examined by a direct Fisher test, it was found that the 5-fold overexpression threshold discriminates between cancer samples and normal samples with a P value of 1.78E-02. The above values prove the statistical significance of the results. The present invention also includes primer pairs selectively and preferably; for example, for the above experiments, the following primer pairs are limited to non-limiting examples of preferred primer pairs: Used: Z21368junc17-21F forward primer; Z21368junc17-21R river primer.

本発明はまた、好適プライマ−の使用を通して得たアンプリコンも好選し包含している。例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:Z21368junc17−21。
Z21368junc17−21F(配列番号:845):GGACGGATACAGCAGGAACG
Z21368junc17−21R(配列番号:846):TATTTTCCAAAAAAGGCCAGCTC
Z21368junc17−21アンプリコン(配列番号:847):GGACGGATACAGCAGGAACGAAAAAACATCCGACCCAACATTATTCTTGTGCTTACCGATGATCAAGATGTGGAGCTGGCCTTTTTTGGAAAATA
The present invention also favors and encompasses amplicons obtained through the use of preferred primers. For example, for the above experiment, the following amplicon has been obtained in a form limited to a non-limiting example of a suitable amplicon: Z21368junc17-21.
Z21368junc17-21F (SEQ ID NO: 845): GGACGGATACAGCAGGAACG
Z21368junc17-21R (SEQ ID NO: 846): TATTTTCCAAAAAAGGCCAGCTC
Z21368junc17-21 amplicon (SEQ ID NO: 847): GGACGGATACAGCAGGAACGAAAAAACATCCGACCCAACATTATTCTTGTGCTTACCGATGATCAAGATGTGGAGCTGGCCTTTTTTGGAAAATA

配列名Z21368junc17−21に描かれたアンプリコンによって検出できるSUL1_HUMAN−細胞外スルファタ−ゼSulf−1Z21368転写物の各種正常組織での発現
Z21368junc17−21アンプリコンならびにZ21368junc17−21FおよびZ21368junc17−21Rプライマ−によって、または従って検出できるSUL1_HUMAN−細胞外スルファタ−ゼSulf−1転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−RPL19(GenBankアクセッション番号NM_000981;RPL19アンプリコン)、TATAボックス(GenBankアクセッション番号NM_003194;TATAアンプリコン)、UBC(GenBankアクセッション番号BC000449;アンプリコン−ユビキチンアンプリコン)およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現をハウスキ−ピング遺伝子量の相乗平均に対して正規化した。次に正規化した各RTサンプルの値を乳房サンプル(上表2「正常パネルの組織サンプル」のサンプル番号33〜35)中央値で除し、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。プライマ−およびアンプリコンは上記の通りである。
Expression in various normal tissues of the SUL1_HUMAN-extracellular sulfatase Sulf-1Z21368 transcript that can be detected by the amplicon depicted in the sequence name Z21368junc17-21
The expression of the SUL1_HUMAN-extracellular sulfatase Sulf-1 transcript, which can be detected by the Z21368junc17-21 amplicon and the Z21368junc17-21F and Z21368junc17-21R primers, or accordingly, was measured using real-time PCR. 4 types of housekeeping genes in parallel-RPL19 (GenBank accession number NM_000981; RPL19 amplicon), TATA box (GenBank accession number NM_003194; TATA amplicon), UBC (GenBank accession number BC000449; amplicon-ubiquitin) Amplicon) and SDHA (GenBank accession number NM_004168; amplicon-SDHA amplicon) were measured in the same manner. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of the breast sample (sample numbers 33 to 35 in Table 2 “Tissue sample of normal panel” above), and the relative expression value of each sample relative to the median value of the breast sample is calculated. Obtained. Primers and amplicons are as described above.

結果は図16に示しており、各種正常組織での、配列名Z21368junc17−21に描かれているアンプリコンによって検出可能な、SUL1_HUMAN−細胞外スルファタ−ゼSulf−1Z21368転写物の発現が証明されている。   The results are shown in FIG. 16 and demonstrate the expression of the SUL1_HUMAN-extracellular sulfatase Sulf-1Z21368 transcript detectable in various normal tissues by the amplicon depicted in the sequence name Z21368junc17-21. Yes.

クラスタT59832の説明
クラスタT59832は、それぞれ表1および2にその名称を示し、配列自体は本明細書の最後に示している関心対象の6つの転写物および33のセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Description of cluster T59832 Cluster T59832 has its name shown in Tables 1 and 2, respectively, and the sequence itself is characterized by the six transcripts of interest and 33 segments shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は既知タンパク質であるガンマインタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体(SwissProtアクセッション識別子GILT_HUMAN、同義語であるガンマインタ−フェロン誘導プロテインP IP−30としても知られる)、配列番号:142であり、ここでは既知タンパク質と呼ぶ。   These sequences are known proteins gamma inter-feron derived lysosomal thiol reductase precursor (SwissProt accession identifier GILT_HUMAN, also known as gamma inter-feron derived protein P IP-30), sequence Number: 142, referred to herein as a known protein.

タンパク質ガンマインタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体は、次の機能を有することが知られているか、または考えられている:還元によるタンパク質内のジスルフィド結合の開裂。リソゾ−ム分解を受けるタンパク質の完全な変性を促進する可能性。MHCクラスII拘束抗原処理に関係する可能性。タンパク質ガンマインタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体の配列は、「ガンマインタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体アミノ酸配列」として、本明細書の最後に示す。この配列について知られている多形を表4に示す。   Protein gamma interferon-derived lysosomal thiol reductase precursors are known or thought to have the following functions: cleavage of disulfide bonds in proteins by reduction. The possibility of promoting complete denaturation of proteins undergoing lysosomal degradation. Possible involvement in MHC class II restricted antigen processing. The sequence of the protein gamma interferon-derived lysosomal thiol reductase precursor is shown at the end of the specification as "gamma interferon-derived lysosomal thiol reductase precursor amino acid sequence". Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質ガンマインタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体の局在は、リソゾ−ムであると考えられている。   The localization of the protein gamma interferon-induced lysosomal thiol reductase precursor is believed to be a lysosome.

既知タンパク質には次のGO注釈付けを用いた。次の注釈付けが見出された:細胞外;リソゾ−ム、これらは細胞成分に関係する注釈である。   The following GO annotations were used for known proteins. The following annotations were found: extracellular; lysosomes, these are annotations related to cellular components.

QO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な、一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に拠っている。   QO assignments are available from <http: //www/expasy.ch/sprot/>, one or more SwissProt / TremB1 protein information bases, or <http: //www.ncbi.nlm.nih. Based on information from Locuslink available from gov / projects / LocusLink />.

クラスタT59832は、癌におけるこのクラスタ転写物の過剰発現による診断マ−カ−として用いることができる。正常組織でのこのような転写物の発現も、先述の方法に従って得られる。表右側縦列の項「数」および図17のy軸の数は、「百万分の一」の形で表されており、各分類のESTの重み付け発現を表している(百万分の一で表した、その分類の全ESTの発現に対する特定クラスタのEST発現の比)。   Cluster T59832 can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues is also obtained according to the method described above. The term “number” in the column on the right side of the table and the number of y-axis in FIG. The ratio of the EST expression of a specific cluster to the expression of all ESTs in that classification).

全体として、図17のヒストグラムおよび表5に示すような、次の結果が得られた。このクラスタは次の病的状態で過剰発現している(少なくとも最低レベルで):脳悪性腫瘍、乳房悪性腫瘍、卵巣癌、および膵臓癌。   Overall, the following results were obtained as shown in the histogram of FIG. 17 and Table 5. This cluster is overexpressed (at least at the lowest level) in the following pathological conditions: brain malignancy, breast malignancy, ovarian cancer, and pancreatic cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタT59832は6つの転写物を特徴とし、それらは上表1に記載されている。これら転写物は、タンパク質ガンマインタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As noted above, cluster T59832 features six transcripts, which are listed in Table 1 above. These transcripts code for proteins that are variants of the protein gamma interferon-induced lysosomal thiol reductase precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質T59832_P5は、本明細書の最後に示すアミノ酸配列を有する;それは転写物T59832_T6にコ−ドされている。既知タンパク質(ガンマインタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。   The mutant protein T59832_P5 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T59832_T6. An alignment with a known protein (gamma interferon-derived lysosomal thiol reductase precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification.

T59832_P5とGILT_HUMANの比較報告:
1. T59832_P5をコ−ドする単離されたキメラポリペプチドは、GILT_HUMANのアミノ酸12〜55に相当し、またT59832_P5のアミノ酸1〜44にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKに少なくとも90%相同である第一アミノ酸配列、およびT59832_P5のアミノ酸45〜189に相当する配列VGTATGRAGWREQAPCRGTRLLLSPQTSQGKTRAPRGRCPCRVPGKTLFSSRRCGHTPSVPFRFRIPHLRGAAASTRLVPPKGSMSAYCVLLGQELGSPFVAQGTSSAAGQGPPACILAATLDAFIPARAGLACLWDLLGRCPRGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P5 and GILT_HUMAN:
1. An isolated chimeric polypeptide that codes for T59832_P5 is a first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK corresponding to amino acids 12-55 of GILT_HUMAN and also corresponding to amino acids 1-44 of T59832_P5 And at least 90%, preferably at least 90%, and preferably at least 85%, and preferably at least 90%, and preferably at least 90% polypeptide A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. T59832_P5の尾部をコ−ドする単離されたポリペプチドは、T59832_P5内の配列VGTATGRAGWREQAPCRGTRLLLSPQTSQGKTRAPRGRCPCRVPGKTLFSSRRCGHTPSVPFRFRIPHLRGAAASTRLVPPKGSMSAYCVLLGQELGSPFVAQGTSSAAGQGPPACILAATLDAFIPARAGLACLWDLLGRCPRGに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. The isolated polypeptide that codes the tail of T59832_P5 is the sequence VGTATGRAGWREQAPCRGTRLLLSPQTSQGKTRAPRGRCPCRVPGKTLFSSRRCGHTPSVPFRFRIPHLRGAAASTRLVPPKGSMSAYCVLLGQELGSPFVAQ %% at least 80 to ARA And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方シグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization was that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region estimation program did not predict that this protein had a transmembrane region It is believed to be secreted.

変異体タンパク質T59832_P5は次の転写物にコ−ドされている:T59832_T6、この配列は本明細書の最後に記載されている。転写物T59382_T6のコ−ディング部分は太字で示してある;このコ−ディング部分は位置149から開始し、位置715に終止する。転写物は表7に記載する次のSNPも有している(ヌクレオチド配列上のその位置に従って示し、変更アミノ酸を記載している:最後の縦列にはSNPが既知であるかを示している:変異体タンパク質T59832_P5配列内での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)   Mutant protein T59832_P5 is encoded in the following transcript: T59832_T6, the sequence of which is described at the end of the specification. The coding portion of transcript T59382_T6 is shown in bold; this coding portion starts at position 149 and ends at position 715. The transcript also has the following SNPs listed in Table 7 (shown according to their position on the nucleotide sequence, listing the modified amino acids: the last column indicates whether the SNP is known: The presence of a known SNP within the mutant protein T59832_P5 sequence supports the sequence derived for this mutant protein of the present invention)

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T59832_P7は、本明細書の最後に示すアミノ酸配列を有する;それは転写物T59832_T8にコ−ドされている。既知タンパク質(ガンマインタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体)とのアラインメントを本明細書の最後に示す。これまでに公開されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を以下簡単に説明する:   The mutant protein T59832_P7 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T59832_T8. An alignment with a known protein (gamma interferon-derived lysosomal thiol reductase precursor) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between such an aligned protein and the mutant protein of the present invention will be briefly described below:

T59832_P7とGILT_HUMANの比較報告:
1. T59832_P7をコ−ドする単離されたキメラポリペプチドは、GILT_HUMANのアミノ酸12〜223に相当し、またT59832_P7のアミノ酸1〜212にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGに少なくとも90%相同である第一アミノ酸配列、およびT59832_P7のアミノ酸213〜238に相当する配列VRIFLALSLTLIVPWSQGWTRQRDQRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P7 and GILT_HUMAN:
1. T59832_P7 co - sul isolated chimeric polypeptide corresponds to amino acids 12-223 of GILT_HUMAN, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNG which also corresponds to amino acids 1 to 212 of T59832_P7 , And a polypeptide having the sequence VRIFLALSLTLIVPWSQGWTRQRDQR corresponding to amino acids 213-238 of T59832_P7, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. T59832_P7の尾部をコ−ドする単離されたポリペプチドは、T59832_P7内の配列VRIFLALSLTLIVPWSQGWTRQRDQRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes for the tail of T59832_P7 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence VRIFLALSLTLIVPWSQGWTRQRDQR within T59832_P7. And most preferably comprises a polypeptide that is at least about 95% homologous.

T59832_P7とBAC98466(配列番号:848)との比較報告
1. T59832_P7をコ−ドする単離されたキメラポリペプチドは、BAC98466のアミノ酸1〜212に相当し、またT59832_P7のアミノ酸1〜212にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGに少なくとも90%相同である第一アミノ酸配列、およびT59832_P7のアミノ酸213〜238に相当する配列VRIFLALSLTLIVPWSQGWTRQRDQRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P7 and BAC98466 (SEQ ID NO: 848)
1. T59832_P7 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 212 of BAC98466, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNG which also corresponds to amino acids 1 to 212 of T59832_P7 , And a polypeptide having the sequence VRIFLALSLTLIVPWSQGWTRQRDQR corresponding to amino acids 213-238 of T59832_P7, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2.T T59832_P7の尾部をコ−ドする単離されたポリペプチドは、59832_P7内の配列VRIFLALSLTLIVPWSQGWTRQRDQRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of T T59832_P7 has at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence VRIFLALSLTLIVPWSQGWTRQRDQR in 59832_P7. %, And most preferably at least about 95% homologous polypeptide.

T59832_P7とBAC85622(配列番号:849)との比較報告
1. T59832_P7をコ−ドする単離されたキメラポリペプチドは、T59832_P7のアミノ酸1〜90に相当する配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、およびBAC85622のアミノ酸1〜148に相当し、またT59832_P7のアミノ酸91〜238にも相当するMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGVRIFLALSLTLIVPWSQGWTRQRDQRに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P7 and BAC85622 (SEQ ID NO: 849)
1.An isolated chimeric polypeptide that codes for T59832_P7 is at least 70%, preferably at least 85% if it requires at least 80%, preferably at least 80% of a polypeptide having the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLV corresponding to amino acids 1-90 of T59832_P7 , More preferably at least 90%, and most preferably at least 95% homologous first amino acid sequence and MEILNVTLVPYGNAQRQQQRQQQRQQQRQQQRQQQRQQQRQQRQQQRQQGQQRQQGQRQQGQQRQQGQRQQRQQGQRQQGQRQQGQRQQGQRQQGHD A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. T59832_P7の頭部をコ−ドする単離されたポリペプチドは、T59832_P7の配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the head of T59832_P7 has at least about 80%, preferably at least about 85%, preferably at least about 85%, preferably at least about 80%, preferably at least about 85% of the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLV of T59832_P7 And most preferably comprises a polypeptide that is at least about 95% homologous.

T59832_P7とQ8WU77(配列番号:850)との比較報告
1. T59832_P7をコ−ドする単離されたキメラポリペプチドは、Q8WU77のアミノ酸1〜212に相当し、またT59832_P7のアミノ酸1〜212にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGに少なくとも90%相同である第一アミノ酸配列、およびT59832_P7のアミノ酸213〜238に相当する配列VRIFLALSLTLIVPWSQGWTRQRDQRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P7 and Q8WU77 (SEQ ID NO: 850)
1. T59832_P7 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 212 of Q8WU77, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNG which also corresponds to amino acids 1 to 212 of T59832_P7 , And a polypeptide having the sequence VRIFLALSLTLIVPWSQGWTRQRDQR corresponding to amino acids 213-238 of T59832_P7, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. T59832_P7の尾部をコ−ドする単離されたポリペプチドは、T59832_P7内の配列VRIFLALSLTLIVPWSQGWTRQRDQRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes for the tail of T59832_P7 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence VRIFLALSLTLIVPWSQGWTRQRDQR within T59832_P7. And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T59832_P7はまた、表8に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置に従って示され、その変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T59832_P7配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T59832_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 8 (shown according to their position on the amino acid sequence and their altered amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein T59832_P7 sequence confirms the sequence derived for this mutant protein of the invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T59832_P7は、次の転写物にコ−ドされている:T59832_T8、この転写物の配列は本明細書の最後に示してある。転写物T59832_T8のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置149から開始し、位置862に終止する。転写物はまた、表9に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T59832_P7配列中における既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T59832_P7 is encoded in the following transcript: T59832_T8, the sequence of this transcript is given at the end of the specification. The coding portion of the transcript T59832_T8 is shown in bold: this coding portion starts at position 149 and ends at position 862. The transcript also has the following SNPs listed in Table 9 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP in the mutant protein T59832_P7 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T59832_P9は、本明細書の最後に示すアミノ酸配列を有する;それは転写物T59832_T11にコ−ドされている。既知タンパク質(ガンマインタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体)とのアラインメントを本明細書の最後に示す。これまでに公開されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を以下簡単に説明する:   The mutant protein T59832_P9 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T59832_T11. An alignment with a known protein (gamma interferon-derived lysosomal thiol reductase precursor) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between such an aligned protein and the mutant protein of the present invention will be briefly described below:

T59832_P9とGILT_HUMANの比較報告:
1. T59832_P9をコ−ドする単離されたキメラポリペプチドは、GILT_HUMANのアミノ酸12〜214に相当し、またT59832_P9のアミノ酸1〜203にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEに少なくとも90%相同である第一アミノ酸配列、およびT59832_P9のアミノ酸204〜244に相当する配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P9 and GILT_HUMAN:
1. T59832_P9 co - sul isolated chimeric polypeptide corresponds to amino acids 12-214 of GILT_HUMAN, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHE which also corresponds to amino acids 1 to 203 of T59832_P9 , And a polypeptide having the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR corresponding to amino acids 204-244 of T59832_P9, at least 80%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. T59832_P9の尾部をコ−ドする単離されたポリペプチドは、T59832_P9内の配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of T59832_P9 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR within T59832_P9. And most preferably comprises a polypeptide that is at least about 95% homologous.

T59832_P9とBAC98466(配列番号:848)の比較報告:
1. T59832_P9をコ−ドする単離されたキメラポリペプチドは、BAC98466のアミノ酸1〜203に相当し、またT59832_P9のアミノ酸1〜203にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEに少なくとも90%相同である第一アミノ酸配列、およびT59832_P9のアミノ酸204〜244に相当する配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparative report of T59832_P9 and BAC98466 (SEQ ID NO: 848):
1. T59832_P9 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 203 of BAC98466, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHE which also corresponds to amino acids 1 to 203 of T59832_P9 , And a polypeptide having the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR corresponding to amino acids 204-244 of T59832_P9, at least 80%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. T59832_P9の尾部をコ−ドする単離されたポリペプチドは、T59832_P9内の配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of T59832_P9 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR within T59832_P9. And most preferably comprises a polypeptide that is at least about 95% homologous.

T59832_P9とBAC85622の比較報告:
1. T59832_P9をコ−ドする単離されたキメラポリペプチドは、T59832_P9のアミノ酸1〜90にも相当する配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、BAC85622のアミノ酸1〜113に相当し、またT59832_P9のアミノ酸91〜203にも相当するMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEに少なくとも90%相同である第二アミノ酸配列、およびT59832のアミノ酸204〜244に相当する配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、このとき前記第一、第二および第三アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P9 and BAC85622:
1. An isolated chimeric polypeptide that codes for T59832_P9 is at least 80%, preferably at least 85% if it requires at least 80%, preferably at least 80% of a polypeptide having the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLV corresponding to amino acids 1-90 of T59832_P9 %, More preferably at least 90%, and most preferably at least 95% homologous first amino acid sequence, corresponding to amino acids 1-113 of BAC85622 and also equivalent to amino acids 91-203 of T59832_P9, MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEG A polypeptide having the second amino acid sequence that is homologous and the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR corresponding to amino acids 204-244 of T59832, at least 80% if necessary, preferably at least 85%, Preferably comprises a third amino acid sequence that is at least 90%, and most preferably at least 95% homologous, the this time first, second and third amino acid sequences has led to the order in succession.

2. T59832_P9の頭部をコ−ドする単離されたポリペプチドは、T59832_P9の配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYEEALCGGCRAFLIRELFPTWLLVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes for the head of T59832_P9 is at least about 80%, preferably at least about 85%, preferably at least about 80%, preferably at least about 85%, in the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYEEALCGGCRAFLIRELFPTWLLV of T59832_P9 And most preferably comprises a polypeptide that is at least about 95% homologous.

3.T T59832_P9の尾部をコ−ドする単離されたポリペプチドは、59832_P9の配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   3.An isolated polypeptide that codes the tail of T T59832_P9 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR of 59832_P9 And most preferably comprises a polypeptide that is at least about 95% homologous.

T59832_P9とQ8WU77(配列番号:850)の比較報告
1. T59832_P9をコ−ドする単離されたキメラポリペプチドは、Q8WU77のアミノ酸1〜203に相当し、またT59832_P9のアミノ酸1〜203にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEに少なくとも90%相同である第一アミノ酸配列、およびT59832_P9のアミノ酸204〜244に相当する配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report of T59832_P9 and Q8WU77 (SEQ ID NO: 850)
1. T59832_P9 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 203 of Q8WU77, also the first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHE which also corresponds to amino acids 1 to 203 of T59832_P9 , And a polypeptide having the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR corresponding to amino acids 204-244 of T59832_P9, at least 80%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2.T59832_P9の尾部をコ−ドする単離されたポリペプチドは、T59832_P9内の配列NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGRに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of T59832_P9 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence NPWKIRPSSLPLSASCTRARSRMSALPQPAPSGVFASSDGR within T59832_P9. And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T59832_P9はまた、表10に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T59832_P9配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T59832_P9 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 10 (shown according to their position on the amino acid sequence, followed by the modified amino acids; last Column indicates whether or not a SNP is known; the presence of a known SNP within the mutant protein T59832_P9 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T59832_P9は、次の転写物にコ−ドされている:T59832_T11、この転写物の配列は本明細書の最後に示してある。転写物T59832_T11のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置149から開始し、位置880に終止する。転写物はまた、表11に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T59832_P9配列中における既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T59832_P9 is encoded in the following transcript: T59832_T11, the sequence of this transcript is shown at the end of the specification. The coding part of the transcript T59832_T11 is shown in bold: this coding part starts at position 149 and ends at position 880. The transcript also has the following SNPs listed in Table 11 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP in the mutant protein T59832_P9 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T59832_P12は、本明細書の最後に示すアミノ酸配列を有する;それは転写物T59832_T15にコ−ドされている。既知タンパク質(ガンマインタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体)とのアラインメントを本明細書の最後に示す。一または複数の、これまでに公開されているタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を以下簡単に説明する:   The mutant protein T59832_P12 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T59832_T15. An alignment with a known protein (gamma interferon-derived lysosomal thiol reductase precursor) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between such an aligned protein and the mutant protein of the present invention will be briefly described below:

T59832_P12とGILT_HUMANの比較報告:
1. T59832_P12をコ−ドする単離されたキメラポリペプチドは、GILT_HUMANのアミノ酸12〜141に相当し、またT59832_P12のアミノ酸1〜130にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEに少なくとも90%相同である第一アミノ酸配列、およびGILT_HUMANのアミノ酸173〜261に相当し、またT59832_P12のアミノ酸131〜219にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P12 and GILT_HUMAN:
1. The isolated chimeric polypeptide that codes for T59832_P12 is the MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGMEHILGEFQV sequence that corresponds to amino acids 12-141 of GILT_HUMAN and also amino acids 1-130 of T59832_P12. , And CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK which is at least 90% homologous to the first amino acid sequence when the second amino acid sequence and the second amino acid sequence And connected in order.

2. T59832_P12の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がECを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号130−xから130のいずれかより開始し:アミノ酸番号131+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that encodes the edge of T59832_P12 has a length “n”, where n is at least about 10 amino acids long, and if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, including a polypeptide in which at least two amino acids comprise EC and having the following structure: Starting from any of x to 130: a sequence ending at any of amino acid numbers 131 + ((n−2) −x), where x ranges from 0 to n−2.

T59832_P12とBAC85622の比較報告:
1. T59832_P12をコ−ドする単離されたキメラポリペプチドは、T59832_P12のアミノ酸1〜90に相当する配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、BAC85622のアミノ酸1〜40に相当し、またT59832_P9のアミノ酸91〜130にも相当するMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEに少なくとも90%相同である第二アミノ酸配列、BAC8562のアミノ酸72〜122に相当し、またT59832_P12のアミノ酸131〜181にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGに少なくとも90%相同である第三アミノ酸配列、およびT59832_P12のアミノ酸182〜219に相当する配列KPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第四アミノ酸配列を含み、このとき前記第一、第二、第三および第四アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P12 and BAC85622:
1. An isolated chimeric polypeptide that codes for T59832_P12 is at least 80%, preferably at least 80%, preferably at least 85% of a polypeptide having sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLV corresponding to amino acids 1-90 of T59832_P12 More preferably at least 90%, and most preferably at least 95% homologous to MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVE, corresponding to amino acids 1-40 of BAC85622 and also corresponding to amino acids 91-130 of T59832_P9 The second amino acid sequence, which corresponds to amino acids 72-122 of BAC8562, and which also corresponds to amino acids 131-181 of T59832_P12, a third amino acid sequence which is at least 90% homologous to CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNG, and corresponds to amino acids 182-219 of T59832_P12 Array KPLEDQTQLLTLVCQLYQGKKPDVCPSSTSS A polypeptide having LRSVCFK comprises a fourth amino acid sequence that is at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous The first, second, third and fourth amino acid sequences are sequentially connected in sequence.

2. T59832_P12の頭部をコ−ドする単離されたポリペプチドは、T59832_P12の配列MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、。   2. An isolated polypeptide that encodes the head of T59832_P12 has at least about 70%, preferably at least about 85%, preferably at least about 85%, preferably at least about 80%, preferably at least about 85% of the sequence MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLV of T59832_P12 And most preferably comprises a polypeptide that is at least about 95% homologous.

3. T59832_P12の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がECを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号130−xから130のいずれかより開始し:アミノ酸番号131+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   3. An isolated chimeric polypeptide that codes for the edge of T59832_P12 has a length “n”, where n is at least about 10 amino acids long, and if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, including a polypeptide in which at least two amino acids comprise EC and having the following structure: Starting from any of x to 130: a sequence ending at any of amino acid numbers 131 + ((n−2) −x), where x ranges from 0 to n−2.

4. T59832_P12の尾部をコ−ドする単離されたポリペプチドは、T59832_P12内の配列KPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   4. An isolated polypeptide that codes the tail of T59832_P12 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence KPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK in T59832_P12 And most preferably comprises a polypeptide that is at least about 95% homologous.

T59832_P9とQ8WU77の比較報告:
1. T59832_P12をコ−ドする単離されたキメラポリペプチドは、Q8WU77のアミノ酸1〜130に相当し、またT59832_P12のアミノ酸1〜130にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEに少なくとも90%相同である第一アミノ酸配列、およびW8WU77のアミノ酸162〜250に相当し、またT59832_P12のアミノ酸131〜219にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P9 and Q8WU77:
1. The isolated chimeric polypeptide that codes for T59832_P12 is MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYLRGPLKKSNAPLVGVTN And a second amino acid sequence that is at least 90% homologous to the CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK corresponding to amino acids 162 to 250 of W8WU77 And connected in order.

2. T59832_P12の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がECを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号130−xから130のいずれかより開始し:アミノ酸番号131+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that encodes the edge of T59832_P12 has a length “n”, where n is at least about 10 amino acids long, and if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, including a polypeptide in which at least two amino acids comprise EC and having the following structure: Starting from any of x to 130: a sequence ending at any of amino acid numbers 131 + ((n−2) −x), where x ranges from 0 to n−2.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T59832_P12はまた、表12に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T59832_P12配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T59832_P12 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 12 (shown according to their position on the amino acid sequence, followed by the modified amino acids; last Column indicates whether or not a SNP is known; the presence of a known SNP within the mutant protein T59832_P12 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T59832_P12は、次の転写物にコ−ドされている:T59832_T15、この転写物の配列は本明細書の最後に示してある。転写物T59832_T15のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置149から開始し、位置805に終止する。転写物はまた、表13に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T59832_P12配列中での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T59832_P12 is encoded in the following transcript: T59832_T15, the sequence of this transcript is given at the end of the specification. The coding part of the transcript T59832_T15 is shown in bold: this coding part starts at position 149 and ends at position 805. The transcript also has the following SNPs listed in Table 13 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP in the mutant protein T59832_P12 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T59832_P18は、本明細書最後に示したアミノ酸配列を有する;これは転写物T59832_T22にコ−ドされている。既知タンパク質(ガンマ−インタ−フェロン誘導リソゾ−ムチオ−ル還元酵素前駆体)とのアラインメントを、本明細書の最後に示す。一もしくは複数の、これまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係を以下簡単に説明する:   The mutant protein T59832_P18 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript T59832_T22. An alignment with a known protein (gamma-inter-feron-derived lysozomthiol reductase precursor) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

T59832_P18とGILT_HUMANの比較報告:
1. T59832_P18をコ−ドする単離されたキメラポリペプチドは、GILT_HUMANのアミノ酸12〜55に相当し、またT59832_P18のアミノ酸1〜44にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKに少なくとも90%相同である第一アミノ酸配列、およびGILT_HUMANのアミノ酸173〜261に相当し、またT59832_P18のアミノ酸45〜133にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P18 and GILT_HUMAN:
1. An isolated chimeric polypeptide that codes for T59832_P18 is a first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK corresponding to amino acids 12-55 of GILT_HUMAN and also corresponding to amino acids 1-44 of T59832_P18 , And CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK, which corresponds to amino acids 173 to 261 of GILT_HUMAN, and the second amino acid sequence when the second amino acid sequence is the second amino acid sequence and the second amino acid sequence includes And connected in order.

2. T59832_P18の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がKCを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号44−xから44のいずれかより開始し:アミノ酸番号45+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that codes for the edge of T59832_P18 has a length “n”, where n is at least about 10 amino acids long, and if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, at least two amino acids comprising a polypeptide comprising KC and having the following structure: Starting from any of x to 44: a sequence ending at any of amino acid numbers 45 + ((n−2) −x), where x ranges from 0 to n−2.

T59832_P18とQ8WU77の比較報告:
1. T59832_P18をコ−ドする単離されたキメラポリペプチドは、Q8WU77のアミノ酸1〜44に相当し、またT59832_P18のアミノ酸1〜44にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKに少なくとも90%相同である第一アミノ酸配列、およびW8WU77のアミノ酸162〜250に相当し、またT59832_P18のアミノ酸45〜133にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T59832_P18 and Q8WU77:
1. An isolated chimeric polypeptide that encodes T59832_P18 is a first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK, which corresponds to amino acids 1-44 of Q8WU77 and also amino acids 1-44 of T59832_P18 And a second amino acid sequence that is at least 90% homologous to the CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK corresponding to amino acids 162-250 of W8WU77 and also corresponding to amino acids 45-133 of T59832_P18 And connected in order.

2. T59832_P18の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がKCを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号44−xから44のいずれかより開始し:アミノ酸番号45+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that codes for the edge of T59832_P18 has a length “n”, where n is at least about 10 amino acids long, and if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, at least two amino acids comprising a polypeptide comprising KC and having the following structure: Starting from any of x to 44: a sequence ending at any of amino acid numbers 45 + ((n−2) −x), where x ranges from 0 to n−2.

T59832_P18とQ8NE14(配列番号:851)の比較報告:
1. T59832_P18をコ−ドする単離されたキメラポリペプチドは、Q8NE14のアミノ酸1〜44に相当し、またT59832_P18のアミノ酸1〜44にも相当するMTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKに少なくとも90%相同である第一アミノ酸配列、およびW8NE14のアミノ酸162〜250に相当し、またT59832_P18のアミノ酸45〜133にも相当するCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFKに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparative report of T59832_P18 and Q8NE14 (SEQ ID NO: 851):
1. An isolated chimeric polypeptide that codes for T59832_P18 is a first amino acid sequence that is at least 90% homologous to MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK corresponding to amino acids 1-44 of Q8NE14 and also corresponding to amino acids 1-44 of T59832_P18 And a second amino acid sequence that is at least 90% homologous to the CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQPPHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK corresponding to amino acids 162 to 250 of W8NE14 and also corresponding to amino acids 45 to 133 of T59832_P18 And connected in order.

2. T59832_P18の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がKCを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号44−xから44のいずれかより開始し:アミノ酸番号45+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that codes for the edge of T59832_P18 has a length “n”, where n is at least about 10 amino acids long, and if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, at least two amino acids comprising a polypeptide comprising KC and having the following structure: Starting from any of x to 44: a sequence ending at any of amino acid numbers 45 + ((n−2) −x), where x ranges from 0 to n−2.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T59832_P18はまた、表14に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T59832_P18配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T59832_P18 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 14 (shown according to their position on the amino acid sequence, followed by the modified amino acids; last Column indicates whether or not a SNP is known; the presence of a known SNP within the mutant protein T59832_P18 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T59832_P18は、次の転写物にコ−ドされている:T59832_T22、この転写物の配列は本明細書の最後に示してある。転写物T59832_T22のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置149から開始し、位置547に終止する。転写物はまた、表15に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T59832_P18配列中での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T59832_P18 is encoded in the following transcript: T59832_T22, the sequence of this transcript is given at the end of the specification. The coding portion of the transcript T59832_T22 is shown in bold: this coding portion starts at position 149 and ends at position 547. The transcript also has the following SNPs listed in Table 15 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column identifies the SNPs The presence of a known SNP in the mutant protein T59832_P18 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のように、クラスタT59832は、上表2に記載し、またその配列を本明細書の最後に示した33のセグメントを特徴とする。これらセグメントは、特に関心の対象であることからここに別々に記載した核酸配列部分である。次に本発明の各セグメントについて説明する。   As noted above, cluster T59832 is characterized by 33 segments listed in Table 2 above and whose sequence is shown at the end of this specification. These segments are the nucleic acid sequence portions described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタT59832_node_1は62個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T6およびT59832_T8。下表16に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_1 of the present invention is supported by 62 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T6 and T59832_T8. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_22は4個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T28。下表17に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_22 of the present invention is supported by four libraries. Library numbers were determined as described above. This segment can be found in the following transcript: T59832_T28. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_23は1個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T28。下表18に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_23 of the present invention is supported by one library. Library numbers were determined as described above. This segment can be found in the following transcript: T59832_T28. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_24は4個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T28。下表19に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_24 of the present invention is supported by four libraries. Library numbers were determined as described above. This segment can be found in the following transcript: T59832_T28. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_29は12個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T28およびT59832_T8。下表20に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_29 of the present invention is supported by 12 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T28 and T59832_T8. Table 20 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_39は195個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表21に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_39 of the present invention is supported by 195 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_7は8個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T6。下表22に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_7 of the present invention is supported by eight libraries. Library numbers were determined as described above. This segment can be found in the following transcript: T59832_T6. Table 22 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは長さが約120bpまでであることから分けて説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are described separately because they are up to about 120 bp in length.

本発明のセグメントクラスタT59832_node_10は332個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T6およびT59832_T8。下表23に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_10 of the present invention is supported by 332 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T6 and T59832_T8. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_11は306個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T6およびT59832_T8。下表24に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_11 of the present invention is supported by 306 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T6 and T59832_T8. Table 24 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_12は280個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T6およびT59832_T8。下表25に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_12 of the present invention is supported by 280 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T6 and T59832_T8. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_14は280個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T6およびT59832_T8。下表26に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_14 of the present invention is supported by 280 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T6 and T59832_T8. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_16は287個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T6およびT59832_T8。下表27に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_16 of the present invention is supported by 287 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T6 and T59832_T8. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_19は300個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T6およびT59832_T8。下表28に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_19 of the present invention is supported by 300 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T6 and T59832_T8. Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_2は258個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T6およびT59832_T8。下表29に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_2 of the present invention is supported by 258 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T6 and T59832_T8. Table 29 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_20は318個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T6およびT59832_T8。下表30に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_20 of the present invention is supported by 318 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T6 and T59832_T8. Table 30 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_25は次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表31に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_25 of the present invention can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 31 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_26は342個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表32に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_26 of the present invention is supported by 342 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 32 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_27は314個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表33に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_27 of the present invention is supported by 314 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 33 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_28は284個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表34に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_28 of the present invention is supported by 284 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 34 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_3は次の転写物に見出すことができる: T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表35に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_3 of the present invention can be found in the following transcripts: T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 35 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_30は次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表36に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_30 of the present invention can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 36 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_31は次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表37に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_31 of the present invention can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 37 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_32は287個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表38に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_32 of the present invention is supported by 287 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 38 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_34は次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表39に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_34 of the present invention can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 39 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_35は次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表40に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_35 of the present invention can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 40 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_36は次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表41に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_36 of the present invention can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 41 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_37は300個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表42に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_37 of the present invention is supported by 300 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 42 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_38は247個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T28、T59832_T6およびT59832_T8。下表43に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_38 of the present invention is supported by 247 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T28, T59832_T6 and T59832_T8. Table 43 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_4は296個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T6およびT59832_T8。下表44に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_4 of the present invention is supported by 296 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T6 and T59832_T8. Table 44 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_5は305個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T6およびT59832_T8。下表45に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_5 of the present invention is supported by 305 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T6 and T59832_T8. Table 45 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_6は次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T22、T59832_T6およびT59832_T8。下表46に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_6 of the present invention can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T22, T59832_T6 and T59832_T8. Table 46 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_8は次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T6およびT59832_T8。下表47に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_8 of the present invention can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T6 and T59832_T8. Table 47 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT59832_node_9は330個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T59832_T11、T59832_T15、T59832_T6およびT59832_T8。下表48に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T59832_node_9 of the present invention is supported by 330 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T59832_T11, T59832_T15, T59832_T6 and T59832_T8. Table 48 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質と変異体タンパク質アラインメント:
配列名:/tmp/YQPBtaxsLQ/JxSZR3ZR2p:GILT_HUMAN
配列文書:
アラインメント:T59832_P5 x GILT_HUMAN
アラインメントセグメント 1/1:
クオリティ−:429.00
Escore:0
一致長:46 全長:46
一致パ−セント類似性:97.83 一致パ−セント同一性:97.83
全パ−セント類似性:97.83 全パ−セント同一性:97.83
ギャップ: 0
アラインメント:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKVG 46
|||||||||||||||||||||||||||||||||||||||||||| |
12 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTG 57
Known protein and mutant protein alignment:
Sequence name: / tmp / YQPBtaxsLQ / JxSZR3ZR2p: GILT_HUMAN
Sequence document:
Alignment: T59832_P5 x GILT_HUMAN
Alignment segment 1/1:
Quality: 429.00
Escore: 0
Match length: 46 Total length: 46
Match Percent Similarity: 97.83 Match Percent Identity: 97.83
Total percent similarity: 97.83 Total percent identity: 97.83
Gap: 0
alignment:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKVG 46
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||-|||||||-||||-||||||-|||||||||-
12 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTG 57

配列名:/tmp/9HrQ57oZG0/ugNVzp017X:GILT_HUMAN
配列文書:
アラインメント:T59832_P7 x GILT_HUMAN
アラインメントセグメント 1/1:
クオリティ−:2110.00
Escore:0
一致長:212 全長:212
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
12 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 61
. . . . .
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
62 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 111
. . . . .
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
||||||||||||||||||||||||||||||||||||||||||||||||||
112 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 161
. . . . .
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
||||||||||||||||||||||||||||||||||||||||||||||||||
162 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 211
.
201 PHEYVPWVTVNG 212
||||||||||||
212 PHEYVPWVTVNG 223
Sequence name: / tmp / 9HrQ57oZG0 / ugNVzp017X: GILT_HUMAN
Sequence document:
Alignment: T59832_P7 x GILT_HUMAN
Alignment segment 1/1:
Quality-: 2110.00
Escore: 0
Match length: 212 Total length: 212
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
12 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 61
...
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
62 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 111
...
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
112 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 161
...
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
162 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 211
.
201 PHEYVPWVTVNG 212
||||||||||||||
212 PHEYVPWVTVNG 223

配列名:/tmp/9HrQ57oZG0/ugNVzp0l7X:BAC98466
配列文書:
アラインメント:T59832_P7 x BAC98466
アラインメントセグメント 1/1:
クオリティ−:2110.00
Escore:0
一致長:212 全長:212
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
. . . . .
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
. . . . .
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
. . . . .
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
.
201 PHEYVPWVTVNG 212
||||||||||||
201 PHEYVPWVTVNG 212
Sequence name: / tmp / 9HrQ57oZG0 / ugNVzp0l7X: BAC98466
Sequence document:
Alignment: T59832_P7 x BAC98466
Alignment segment 1/1:
Quality-: 2110.00
Escore: 0
Match length: 212 Total length: 212
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
...
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
...
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
...
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
.
201 PHEYVPWVTVNG 212
||||||||||||||
201 PHEYVPWVTVNG 212

配列名:/tmp/9HrQ57oZG0/ugNVzp0l7X:BAC85622
配列文書:
アラインメント:T59832_P7 x BAC85622 ..
アラインメントセグメント 1/1:
クオリティ−:1496.00
Escore:0
一致長:148 全長:148
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
91 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDME 140
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDME 50
. . . . .
141 LAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHA 190
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHA 100
. . . .
191 NAQRTDALQPPHEYVPWVTVNGVRIFLALSLTLIVPWSQGWTRQRDQR 238
||||||||||||||||||||||||||||||||||||||||||||||||
101 NAQRTDALQPPHEYVPWVTVNGVRIFLALSLTLIVPWSQGWTRQRDQR 148
Sequence name: / tmp / 9HrQ57oZG0 / ugNVzp0l7X: BAC85622
Sequence document:
Alignment: T59832_P7 x BAC85622 ..
Alignment segment 1/1:
Quality-: 1946.00
Escore: 0
Match length: 148 Total length: 148
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
91 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDME 140
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDME 50
...
141 LAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHA 190
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 LAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHA 100
...
191 NAQRTDALQPPHEYVPWVTVNGVRIFLALSLTLIVPWSQGWTRQRDQR 238
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||-||||||-||||||-||||||-||||||-||||||||-
101 NAQRTDALQPPHEYVPWVTVNGVRIFLALSLTLIVPWSQGWTRQRDQR 148

配列名:/tmp/9HrQ57oZG0/ugNVzp0l7X:Q8WU77
配列文書:
アラインメント:T59832_P7 x Q8WU77 ..
アラインメントセグメント 1/1:
クオリティ−:2110.00
Escore:0
一致長:212 全長:212
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
. . . . .
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
. . . . .
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
. . . . .
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
.
201 PHEYVPWVTVNG 212
||||||||||||
201 PHEYVPWVTVNG 212
Sequence name: / tmp / 9HrQ57oZG0 / ugNVzp0l7X: Q8WU77
Sequence document:
Alignment: T59832_P7 x Q8WU77 ..
Alignment segment 1/1:
Quality-: 2110.00
Escore: 0
Match length: 212 Total length: 212
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
...
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
...
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
...
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
.
201 PHEYVPWVTVNG 212
||||||||||||||
201 PHEYVPWVTVNG 212

配列名:/tmp/1ttCiW30od/feIXLDs4rU:GILT_HUMAN
配列文書:
アラインメント:T59832_P9 x GLIT_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:2016.00
Escore:0
一致長:203 全長:203
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
12 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 61
. . . . .
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
62 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 111
. . . . .
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
||||||||||||||||||||||||||||||||||||||||||||||||||
112 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 161
. . . . .
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
||||||||||||||||||||||||||||||||||||||||||||||||||
162 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 211

201 PHE 203
|||
212 PHE 214
Array name: / tmp / 1ttCiW30od / feIXLDs4rU: GILT_HUMAN
Sequence document:
Alignment: T59832_P9 x GLIT_HUMAN ..
Alignment segment 1/1:
Quality-2016.00
Escore: 0
Match length: 203 Total length: 203
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
12 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 61
...
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
62 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 111
...
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
112 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 161
...
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
162 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 211

201 PHE 203
|||
212 PHE 214

配列名:/tmp/1ttCiW30od/feIXLDs4rU:BAC98466
配列文書:
アラインメント:T59832_P9 x BAC98466 ..
アラインメントセグメント 1/1:
クオリティ−:2016.00
Escore:0
一致長:203 全長:203
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
. . . . .
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
. . . . .
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
. . . . .
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200

201 PHE 203
|||
201 PHE 203
Sequence name: / tmp / 1ttCiW30od / feIXLDs4rU: BAC98466
Sequence document:
Alignment: T59832_P9 x BAC98466 ..
Alignment segment 1/1:
Quality-2016.00
Escore: 0
Match length: 203 Total length: 203
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
...
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
...
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
...
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200

201 PHE 203
|||
201 PHE 203

配列名:/tmp/lttCiW30od/feIXLDs4rU:BAC85622
配列文書:
アラインメント:T59832_P9 x BAC85622 ..
アラインメントセグメント 1/1:
クオリティ−:1145.00
Escore:0
一致長:113 全長:113
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
91 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDME 140
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDME 50
. . . . .
141 LAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHA 190
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHA 100
.
191 NAQRTDALQPPHE 203
|||||||||||||
101 NAQRTDALQPPHE 113
Sequence name: / tmp / lttCiW30od / feIXLDs4rU: BAC85622
Sequence document:
Alignment: T59832_P9 x BAC85622 ..
Alignment segment 1/1:
Quality-: 1145.00
Escore: 0
Match length: 113 Total length: 113
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
91 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDME 140
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDME 50
...
141 LAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHA 190
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 LAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHA 100
.
191 NAQRTDALQPPHE 203
||||||||||||||||
101 NAQRTDALQPPHE 113

配列名:/tmp/lttCiW30od/feIXLDs4rU:Q8WU77
配列文書:
アラインメント:T59832_P9 x Q8WU77 ..
アラインメントセグメント 1/1:
クオリティ−:2016.00
Escore:0
一致長:203 全長:203
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
. . . . .
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
. . . . .
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
. . . . .
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200

201 PHE 203
|||
201 PHE 203
Sequence name: / tmp / lttCiW30od / feIXLDs4rU: Q8WU77
Sequence document:
Alignment: T59832_P9 x Q8WU77 ..
Alignment segment 1/1:
Quality-2016.00
Escore: 0
Match length: 203 Total length: 203
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
...
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
...
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
...
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200

201 PHE 203
|||
201 PHE 203

配列名:/tmp/sIHTwdduik/ToMKmEJiZc:GILT_HUMAN
配列文書:
アラインメント:T59832_P12 x GILT_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:2084.00
Escore:0
一致長:219 全長:250
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:87.60 全パ−セント同一性:87.60
ギャップ: 1
アラインメント:
. . . . .
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
12 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 61
. . . . .
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
62 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 111
. . . . .
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVE.................... 130
||||||||||||||||||||||||||||||
112 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 161
. . . . .
131 ...........CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 169
|||||||||||||||||||||||||||||||||||||||
162 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 211
. . . . .
170 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 219
||||||||||||||||||||||||||||||||||||||||||||||||||
212 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 261
Array name: / tmp / sIHTwdduik / ToMKmEJiZc: GILT_HUMAN
Sequence document:
Alignment: T59832_P12 x GILT_HUMAN ..
Alignment segment 1/1:
Quality-: 2084.00
Escore: 0
Match length: 219 Total length: 250
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 87.60 Total percent identity: 87.60
Gap: 1
alignment:
...
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
12 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 61
...
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
62 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 111
...
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVE ....................... 130
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
112 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 161
...
131 ........... CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 169
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||||-|||||-||||||-|||||-|||||-||||||-
162 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 211
...
170 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 219
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
212 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 261

配列名:/tmp/sIHTwdduik/ToMKmEJiZc:BAC85622
配列文書:
アラインメント:T59832_P12 x BAC85622 ..
アラインメントセグメント 1/1:
クオリティ−:835.00
Escore:0
一致長:91 全長:122
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:74.59 全パ−セント同一性:74.59
ギャップ: 1
アラインメント:
. . . . .
91 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVE.......... 130
||||||||||||||||||||||||||||||||||||||||
1 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDME 50
. . . . .
131 .....................CLQLYAPGLSPDTIMECAMGDRGMQLMHA 159
|||||||||||||||||||||||||||||
51 LAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHA 100
. .
160 NAQRTDALQPPHEYVPWVTVNG 181
||||||||||||||||||||||
101 NAQRTDALQPPHEYVPWVTVNG 122
Sequence name: / tmp / sIHTwdduik / ToMKmEJiZc: BAC85622
Sequence document:
Alignment: T59832_P12 x BAC85622 ..
Alignment segment 1/1:
Quality-: 835.00
Escore: 0
Match length: 91 Total length: 122
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 74.59 Total percent identity: 74.59
Gap: 1
alignment:
...
91 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVE .......... 130
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||||-||||||-|||||-||||||-|||||-|||||||-
1 MEILNVTLVPYGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDME 50
...
131 ...... CLQLYAPGLSPDTIMECAMGDRGMQLMHA 159
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
51 LAFLTIVCMEEFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHA 100
..
160 NAQRTDALQPPHEYVPWVTVNG 181
||||||||||||||||||||||-
101 NAQRTDALQPPHEYVPWVTVNG 122

配列名:/tmp/sIHTwdduik/ToMKmEJiZc:Q8WU77
配列文書:
アラインメント:T59832_P12 x Q8WU77 ..
アラインメントセグメント 1/1:
クオリティ−:2084.00
Escore:0
一致長:219 全長:250
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:87.60 全パ−セント同一性:87.60
ギャップ: 1
アラインメント:
. . . . .
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
. . . . .
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
. . . . .
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVE.................... 130
||||||||||||||||||||||||||||||
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
. . . . .
131 ...........CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 169
|||||||||||||||||||||||||||||||||||||||
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
. . . . .
170 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 219
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 250
Sequence name: / tmp / sIHTwdduik / ToMKmEJiZc: Q8WU77
Sequence document:
Alignment: T59832_P12 x Q8WU77 ..
Alignment segment 1/1:
Quality-: 2084.00
Escore: 0
Match length: 219 Total length: 250
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 87.60 Total percent identity: 87.60
Gap: 1
alignment:
...
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
...
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
...
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVE ....................... 130
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
...
131 ........... CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 169
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||||-|||||-||||||-|||||-|||||-||||||-
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
...
170 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 219
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 250

配列名:/tmp/LH4xf8J65f/a95JQoTfNB:GILT_HUMAN
配列文書:
アラインメント:T59832_P18 x GILT_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:1222.00
Escore:0
一致長:133 全長:250
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:53.20 全パ−セント同一性:53.20
ギャップ: 1
アラインメント:
. . . . .
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK...... 44
||||||||||||||||||||||||||||||||||||||||||||
12 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 61
. . . . .
44 .................................................. 44

62 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 111
. . . . .
44 .................................................. 44

112 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 161
. . . . .
45 ...........CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 83
|||||||||||||||||||||||||||||||||||||||
162 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 211
. . . . .
84 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 133
||||||||||||||||||||||||||||||||||||||||||||||||||
212 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 261
Array name: / tmp / LH4xf8J65f / a95JQoTfNB: GILT_HUMAN
Sequence document:
Alignment: T59832_P18 x GILT_HUMAN ..
Alignment segment 1/1:
Quality-: 1222.00
Escore: 0
Match length: 133 Total length: 250
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 53.20 Total percent identity: 53.20
Gap: 1
alignment:
...
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK ...... 44
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||||-|||||-|||||-|||||-||||||-|||||||||||| be be not
12 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 61
...
44 ................................................. . 44

62 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 111
...
44 ................................................. . 44

112 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 161
...
45 .......... CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 83
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||||-|||||-||||||-|||||-|||||-||||||-
162 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 211
...
84 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 133
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
212 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 261

配列名:/tmp/LH4xf8J65f/a95JQoTfNB:Q8WU77
配列文書:
アラインメント:T59832_P18 x Q8WU77 ..
アラインメントセグメント 1/1:
クオリティ−:1222.00
Escore:0
一致長:133 全長:250
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:53.20 全パ−セント同一性:53.20
ギャップ: 1
アラインメント:
. . . . .
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK...... 44
||||||||||||||||||||||||||||||||||||||||||||
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
. . . . .
44 .................................................. 44

51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
. . . . .
44 .................................................. 44

101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
. . . . .
45 ...........CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 83
|||||||||||||||||||||||||||||||||||||||
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
. . . . .
84 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 133
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 250
Sequence name: / tmp / LH4xf8J65f / a95JQoTfNB: Q8WU77
Sequence document:
Alignment: T59832_P18 x Q8WU77 ..
Alignment segment 1/1:
Quality-: 1222.00
Escore: 0
Match length: 133 Total length: 250
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 53.20 Total percent identity: 53.20
Gap: 1
alignment:
...
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK ...... 44
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||||-|||||-|||||-|||||-||||||-|||||||||||| be be not
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
...
44 ................................................. . 44

51 RGPLKKSNAPLVNVTLYYEALCGGCRAFLIRELFPTWLLVMEILNVTLVP 100
...
44 ................................................. . 44

101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
...
45 .......... CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 83
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||||-|||||-||||||-|||||-|||||-||||||-
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
...
84 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 133
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 250

配列名:/tmp/LH4xf8J65f/a95JQoTfNB:Q8NE14
配列文書:
アラインメント:T59832_P18 x Q8NE14 ..
アラインメントセグメント 1/1:
クオリティ−:1222.00
Escore:0
一致長:133 全長:250
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:53.20 全パ−セント同一性:53.20
ギャップ: 1
アラインメント:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK...... 44
||||||||||||||||||||||||||||||||||||||||||||
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
. . . . .
44 .................................................. 44

51 RGPLKKSNAPLVNVTLYYEALCGGCQAFLIRELFPTWLLVMEILNVTLVP 100
. . . . .
44 .................................................. 44

101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
. . . . .
45 ...........CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 83
|||||||||||||||||||||||||||||||||||||||
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
. . . . .
84 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 133
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 250
Sequence name: / tmp / LH4xf8J65f / a95JQoTfNB: Q8NE14
Sequence document:
Alignment: T59832_P18 x Q8NE14 ..
Alignment segment 1/1:
Quality-: 1222.00
Escore: 0
Match length: 133 Total length: 250
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 53.20 Total percent identity: 53.20
Gap: 1
alignment:
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYK ...... 44
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||||-|||||-|||||-|||||-||||||-|||||||||||| be be not
1 MTLSPLLLFLPPLLLLLDVPTAAVQASPLQALDFFGNGPPVNYKTGNLYL 50
...
44 ................................................. . 44

51 RGPLKKSNAPLVNVTLYYEALCGGCQAFLIRELFPTWLLVMEILNVTLVP 100
...
44 ................................................. . 44

101 YGNAQEQNVSGRWEFKCQHGEEECKFNKVEACVLDELDMELAFLTIVCME 150
...
45 .......... CLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 83
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||||-|||||-||||||-|||||-|||||-||||||-
151 EFEDMERSLPLCLQLYAPGLSPDTIMECAMGDRGMQLMHANAQRTDALQP 200
...
84 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 133
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 PHEYVPWVTVNGKPLEDQTQLLTLVCQLYQGKKPDVCPSSTSSLRSVCFK 250

正常および癌乳房組織での、配列名T59832junc6−25−26に描かれたアンプリコンによって検出できる、ガンマ−インタ−フェロン誘導リソゾ−ムチオ−ル還元酵素(GILT)T59832転写物の発現
junc6−25−26、T59832junc6−25−26アンプリコンならびにT59832junc6−25−26FおよびT59832junc6−25−26Rプライマ−によって、または従って検出可能なガンマ−インタ−フェロン誘導リソゾ−ムチオ−ル還元酵素(GILT)転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルのアップレギュレ−ションの倍率を得た。
Expression of gamma-interferon-induced lysosomal thiol reductase (GILT) T59832 transcripts detectable in normal and cancerous breast tissue by the amplicon depicted in SEQ ID T59832junc6-25-26
junc6-25-26, T59832junc6-25-26 amplicon and T59832junc6-25-26F and T59832junc6-25-26R primers, or thus detectable gamma-interferon-induced lysosomal thiol reductase (GILT) Transcript expression was measured using real-time PCR. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured in the same manner. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of each sample up-regulation relative to the value was obtained.

図18は、正常サンプルに比べた、癌乳房サンプルでの上記ガンマ−インタ−フェロン誘導リソゾ−ムチオ−ル還元酵素(GILT)転写物の過剰発現を示すヒストグラムである。   FIG. 18 is a histogram showing overexpression of the gamma-interferon-induced lysosomal thiol reductase (GILT) transcript in cancer breast samples compared to normal samples.

図18から明らかなように、上記アンプリコンによって検出できるガンマ−インタ−フェロン誘導リソゾ−ムチオ−ル還元酵素(GILT)転写物の癌での発現は、いくつかのサンプルにおいて、非癌性サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)に比べて有意に高かった。特に28の腺癌サンプルのうち3つに少なくとも7倍の過剰発現が見出された。   As is apparent from FIG. 18, the expression in cancer of the gamma-interferon-induced lysosomal thiol reductase (GILT) transcript that can be detected by the above amplicons in some samples is non-cancerous ( It was significantly higher than sample numbers 56-60, 63-67, Table 1 “Tissue Sample of Test Panel”). In particular, at least 7-fold overexpression was found in 3 of 28 adenocarcinoma samples.

プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:T59832junc6−25−26Fフォワ−ドプライマ−;およびT59832junc6−25−26Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: Are: T59832junc6-25-26F forward primer; and T59832junc6-25-26R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する。例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:T59832junc6−25−26。
フォワ−ドプライマ−T59832junc6−25−26F(配列番号:852):CCACCAGTTAACTACAAGTGCCTG
バ−スプライマ−T59832junc6−25−26Rリ(配列番号:853):GCGTGCATGAGCTGCATG
アンプリコンT59832junc6−25−26(配列番号:854):CCACCAGTTAACTACAAGTGCCTGCAGCTCTACGCCCCAGGGCTGTCGCCAGACACTATCATGGAGTGTGCAATGGGGGACCGCGGCATGCAGCTCATGCACGC
The present invention also includes preferred amplicons obtained using preferred primers. For example, for the above experiment, the following amplicon has been obtained in a form limited to a non-limiting example of a suitable amplicon: T59832junc6-25-26.
Forward primer-T59832junc6-25-26F (SEQ ID NO: 852): CCACCAGTTAACTACAAGTGCCTG
Base primer T59832junc6-25-26R (SEQ ID NO: 853): GCGTGCATGAGCTGCATG
Amplicon T59832junc6-25-26 (SEQ ID NO: 854): CCACCAGTTAACTACAAGTGCCTGCAGCTCTACGCCCCAGGGCTGTCGCCAGACACTATCATGGAGTGTGCAATGGGGGACCGCGGCATGCAGCTCATGCACGC

クラスタHUMGRP5Eの説明
クラスタHUMGRP5Eは、それぞれ表1および2にその名称を示し、配列自体は本明細書の最後に示した、関心の対象となる2つの転写物および5個のセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Cluster HUMGRP5E Description Cluster HUMGRP5E is named in Tables 1 and 2, respectively, and the sequence itself is characterized by the two transcripts of interest and the five segments shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は既知タンパク質であるガストリン放出ペプチド前駆体(SwissProtアクセッション識別子GRP_HUMAN:同義語のGRP;GRP−10としても知られる)、配列番号:155であり、ここでは既知タンパク質と呼ぶ。   These sequences are a known protein gastrin releasing peptide precursor (SwissProt accession identifier GRP_HUMAN: synonymous GRP; also known as GRP-10), SEQ ID NO: 155, referred to herein as a known protein.

ガストリン放出ペプチドは次の機能を有することが知られているか、または信じられている:ガストリン放出およびその他の胃腸管ホルモンの促進。タンパク質、ガストリン放出ペプチド前駆体の配列は、本明細書の最後に「ガストリン放出ペプチド前駆体アミノ酸配列」として示されている。この配列について知られている多形を表4に示す。   Gastrin-releasing peptides are known or believed to have the following functions: gastrin release and the promotion of other gastrointestinal hormones. The sequence of the protein, gastrin releasing peptide precursor, is shown at the end of the specification as "Gastrin releasing peptide precursor amino acid sequence". Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質ガストリン放出ペプチドの局在は、分泌型と考えられている。   The localization of protein gastrin releasing peptide is thought to be secreted.

既知タンパク質は次の適用および/または潜在的な治療的利用法も有している:II型糖尿病。既知タンパク質は、例えば抗体もしくは小分子の標的として、および/または直接の治療薬として、ヒトにおいて、臨床/治療的利用について研究が行われている;これら研究に関係する、入手可能な情報は次の通りである。既知タンパク質の潜在的に、薬学または治療に関係する活性は次の通りである:ボンベシンアンタゴニスト;インスリノトロピンアゴニスト。このクラスタを代表するタンパク質には、治療的な役割が予想されている。このタンパク質またはその一部分が潜在的な治療適用:食欲抑制剤/肥満治療薬;放出ホルモン;抗癌剤;呼吸;糖尿病治療薬に用いられているか、または用いることができるという情報が薬物デ−タベ−スまたは公開デ−タベ−ス(例えば本明細書中、上記の)にあることから、このクラスタにはこの分野が割り当てられている。   Known proteins also have the following applications and / or potential therapeutic uses: Type II diabetes. Known proteins have been studied for clinical / therapeutic use in humans, eg as antibodies or small molecule targets and / or as direct therapeutics; the available information relating to these studies is as follows It is as follows. Potentially pharmaceutical or therapeutic activities of known proteins are as follows: bombesin antagonists; insulinotropin agonists. The protein representing this cluster is expected to have a therapeutic role. Information on whether this protein or part of it is or can be used in potential therapeutic applications: appetite suppressant / obesity drug; release hormone; anticancer agent; breathing; Or, because it is in a public database (eg, as described herein above), this cluster is assigned to this field.

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;シグナル伝達;神経ペプチドシグナル伝達、これらは生物学的プロセスに関係する注釈であり;増殖因子、これは分子機能に関係する注釈付けであり;そして分泌、これらは細胞成分に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; signaling; neuropeptide signaling, these are annotations related to biological processes; growth factors, which are annotations related to molecular function; and secretion, These are annotations related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

上記のように、クラスタHUMGRP5Eは、上表1に掲載した2つの転写物を特徴とする。これら転写物は、タンパク質のガストリン放出ペプチド前駆体の変異体であるタンパク質をコ−ドする。次に本発明の各変異体タンパク質について説明する。   As described above, cluster HUMGRP5E is characterized by the two transcripts listed in Table 1 above. These transcripts code for proteins that are variants of the gastrin releasing peptide precursor of the protein. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質HUMGRP5E_P4は、本明細書最後に示すアミノ酸配列を有する;それは転写物HUMGRP5E_T4にコ−ドされている。本明細書最後に、既知タンパク質(ガストリン放出ペプチド前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HUMGRP5E_P4 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HUMGRP5E_T4. At the end of the specification, an alignment to a known protein (gastrin releasing peptide precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HUMGRP5E_P4とGRP_HUMANの比較報告:
1. HUMGRP5E_P4をコ−ドする単離されたキメラポリペプチドは、GRP_HUMANのアミノ酸1〜127に相当し、またHUMGRP5E_P4のアミノ酸1〜127にも相当するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKに少なくとも90%相同である第一アミノ酸配列、およびGRP_HUMANのアミノ酸135〜148に相当し、またHUMGRP5E_P4のアミノ酸128〜141にも相当するGSQREGRNPQLNQQに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between HUMGRP5E_P4 and GRP_HUMAN:
1. The isolated chimeric polypeptide that codes for HUMGRP5E_P4 is MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQP which corresponds to amino acids 1-127 of GRP_HUMAN and also amino acids 1-127 of HUMGRP5E_P4 And a second amino acid sequence that is at least 90% homologous to GSQREGRNPQLNQQ corresponding to amino acids 135 to 148 of GRP_HUMAN and also corresponding to amino acids 128 to 141 of HUMGRP5E_P4, wherein the first and second amino acid sequences are contiguous And connected in order.

2.HUMGRP5E_P4の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がKGを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号127−xから127のいずれかより開始し:アミノ酸番号128+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that codes for the edge of HUMGRP5E_P4 has a length “n”, where n is at least about 10 amino acids long, and if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, including a polypeptide in which at least two amino acids comprise KG, having the following structure: A sequence starting from any of x to 127: ending at any of amino acid numbers 128 + ((n−2) −x), where x is in the range of 0 to n−2.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HUMGRP5E_P4はまた、表5に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質HUMGRP5E_P4配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMGRP5E_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 5 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HUMGRP5E_P4 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMGRP5E_P4は、次の転写物にコ−ドされている:HUMGRP5E_T4、この転写物の配列は本明細書の最後に示してある。転写物HUMGRP5E_T4のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置622から始まり、位置1044に終止する。転写物はまた、表6に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質HUMGRP5E_P4配列中での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMGRP5E_P4 is encoded in the following transcript: HUMGRP5E_T4, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HUMGRP5E_T4 is shown in bold: this coding part starts at position 622 and ends at position 1044. The transcript also has the following SNPs listed in Table 6 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column reveals the SNPs The presence of a known SNP in the mutant protein HUMGRP5E_P4 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HUMGRP5E_P5は、本明細書の最後に示すアミノ酸配列を有する;それは転写物HUMGRP5E_T5にコ−ドされている。既知タンパク質(ガストリン放出ペプチド前駆体)とのアラインメントを本明細書の最後に示す。これまでに公開されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。以下、このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を簡単に説明する:   The mutant protein HUMGRP5E_P5 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HUMGRP5E_T5. An alignment with a known protein (gastrin releasing peptide precursor) is shown at the end of this specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the protein having such an alignment and the mutant protein of the present invention will be briefly described:

HUMGRP5E_P5とGRP_HUMANの比較報告:
1. HUMGRP5E_P5をコ−ドする単離されたキメラポリペプチドは、GRP_HUMANのアミノ酸1〜127に相当し、またHUMGRP5E_P5のアミノ酸1〜127にも相当するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKに少なくとも90%相同である第一アミノ酸配列、およびHUMGRP5E_P5のアミノ酸128〜142に相当する配列DSLLQVLNVKEGTPSを含むポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between HUMGRP5E_P5 and GRP_HUMAN:
1. The isolated chimeric polypeptide that codes for HUMGRP5E_P5 corresponds to amino acids 1-127 of GRP_HUMAN, and also corresponds to amino acids 1-127 of HUMGRP5E_P5. And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide comprising the sequence DSLLQVLNVKEGTPS corresponding to amino acids 128-142 of HUMGRP5E_P5 Wherein the first and second amino acid sequences are sequentially connected in sequence.

2. HUMGRP5E_P5の尾部をコ−ドする単離されたポリペプチドは、HUMGRP5E_P5内の配列DSLLQVLNVKEGTPSに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of HUMGRP5E_P5 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence DSLLQVLNVKEGTPS in HUMGRP5E_P5. And most preferably comprises a polypeptide that is at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HUMGRP5E_P5はまた、表7に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質HUMGRP5E_P5配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HUMGRP5E_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HUMGRP5E_P5 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMGRP5E_P5は、次の転写物にコ−ドされている:HUMGRP5E_T5、この転写物の配列は本明細書の最後に示してある。転写物HUMGRP5E_T5のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置622から始まり、位置1047に終止する。転写物はまた、表8に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質HUMGRP5E_P5配列中での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMGRP5E_P5 is encoded in the following transcript: HUMGRP5E_T5, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HUMGRP5E_T5 is shown in bold: this coding part starts at position 622 and ends at position 1047. The transcript also has the following SNPs listed in Table 8 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP in the mutant protein HUMGRP5E_P5 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のように、クラスタHUMGRP5Eは、上表2に掲載した5つのセグメントを特徴とする。これらセグメントは、それらが特に関心の対象であることから、ここに別に記載されている核酸配列の一部である。次に、本発明の各セグメントについて説明する。   As described above, the cluster HUMGRP5E is characterized by the five segments listed in Table 2 above. These segments are part of the nucleic acid sequences described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタHUMGRP5E_node_0は21個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。下表9に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMGRP5E_node_0 of the present invention is supported by 21 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HUMGRP5E_T4 and HUMGRP5E_T5. Table 9 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMGRP5E_node_2は27個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。下表10に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMGRP5E_node_2 of the present invention is supported by 27 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HUMGRP5E_T4 and HUMGRP5E_T5. Table 10 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMGRP5E_node_8は26個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。下表11に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMGRP5E_node_8 of the present invention is supported by 26 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HUMGRP5E_T4 and HUMGRP5E_T5. Table 11 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは、長さが約120bpまでであることから分けて説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are described separately because they are up to about 120 bp in length.

本発明のセグメントクラスタHUMGRP5E_node_3は次の転写物に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。下表12に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMGRP5E_node_3 of the present invention can be found in the following transcripts: HUMGRP5E_T4 and HUMGRP5E_T5. Table 12 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMGRP5E_node_7は次の転写物に見出すことができる: HUMGRP5E_T5。下表13に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMGRP5E_node_7 of the present invention can be found in the following transcript: HUMGRP5E_T5. Table 13 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント:
配列名:/tmp/412zs2mwyT/B0wjOUAXOd:GRP_HUMAN
配列文書:
アラインメント:HUMGRP5E_P4 x GRP_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:1291.00
Escore:0
一致長:141 全長:148
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:95.27 全パ−セント同一性:55.27
ギャップ: 1
アラインメント:
. . . . .
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
. . . . .
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
. . . .
101 PKALGNQQPSWDSEDSSNFKDVGSKGK.......GSQREGRNPQLNQQ 141
||||||||||||||||||||||||||| ||||||||||||||
101 PKALGNQQPSWDSEDSSNFKDVGSKGKVGRLSAPGSQREGRNPQLNQQ 148
Mutant protein alignment with known proteins:
Array name: / tmp / 412zs2mwyT / B0wjOUAXOd: GRP_HUMAN
Sequence document:
Alignment: HUMGRP5E_P4 x GRP_HUMAN ..
Alignment segment 1/1:
Quality-: 1291.00
Escore: 0
Match length: 141 Total length: 148
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 95.27 Total percent identity: 55.27
Gap: 1
alignment:
...
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
...
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
...
101 PKALGNQQPSWDSEDSSNFKDVGSKGK ....... GSQREGRNPQLNQQ 141
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| s ||||||||||||||||| nosings / a., ||||||||||||||||||| ing || sines} / thereofs / oflets you would_of you} would you]) hold)
101 PKALGNQQPSWDSEDSSNFKDVGSKGKVGRLSAPGSQREGRNPQLNQQ 148

配列名:/tmp/1me9ldnvfv/KbP5io8PtU:GRP_HUMAN
配列文書:
アラインメント:HUMGRP5E_P5 x GRP_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:1248.00
Escore:0
一致長:127 全長:127
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
. . . . .
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
. .
101 PKALGNQQPSWDSEDSSNFKDVGSKGK 127
|||||||||||||||||||||||||||
101 PKALGNQQPSWDSEDSSNFKDVGSKGK 127
Array name: / tmp / 1me9ldnvfv / KbP5io8PtU: GRP_HUMAN
Sequence document:
Alignment: HUMGRP5E_P5 x GRP_HUMAN ..
Alignment segment 1/1:
Quality-: 1248.00
Escore: 0
Match length: 127 Total length: 127
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
...
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
..
101 PKALGNQQPSWDSEDSSNFKDVGSKGK 127
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
101 PKALGNQQPSWDSEDSSNFKDVGSKGK 127

正常および癌乳房組織での、配列名HUMGRP5Ejunc3−7に描かれたアンプリコンによって検出できる、GRP_HUMA−ガストリン放出ペプチド(HUMGRP5E)転写物の発現
junc3−7、HUMGRP5Ejunc3−27アンプリコンならびにHUMGRP5Ejunc3−7FおよびHUMGRP5Ejunc3−7Rプライマ−によって、または従って検出可能なGRP_HUMAN−ガストリン放出ペプチド転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルのアップレギュレ−ションの倍率を得た。
Expression of GRP_HUMA-gastrin releasing peptide (HUMGRP5E) transcripts detectable in normal and cancerous breast tissue by the amplicon depicted in the sequence name HUMGRP5Ejunc3-7
Expression of the detectable GRP_HUMAN-gastrin releasing peptide transcript was measured by junc3-7, HUMGRP5Ejunc3-27 amplicon and HUMGRP5Ejunc3-7F and HUMGRP5Ejunc3-7R primers, and thus using real-time PCR. 4 types of housekeeping genes in parallel-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), and SDHA (GenBank accession number) The expression of NM_004168; amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) was also measured in the same manner. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue Sample of Test Panel”), and the center of normal PM samples The magnification of each sample up-regulation relative to the value was obtained.

図19は、正常サンプルに比べた、癌乳房サンプルでの上記GRP_HUMAN−ガストリン放出ペプチド転写物の過剰発現を示すヒストグラムである。値は二重実験の平均値である。誤差バ−は、得られた最小値と最大値を示す。   FIG. 19 is a histogram showing overexpression of the GRP_HUMAN-gastrin releasing peptide transcript in cancer breast samples compared to normal samples. Values are averages of duplicate experiments. The error bar indicates the obtained minimum and maximum values.

図19から明らかなように、上記アンプリコンによって検出できるGRP_HUMAN−ガストリン放出ペプチド転写物の発現は、非癌性サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)で有意に高かった。特に28の腺癌サンプルのうち12について、少なくとも5倍の過剰発現が見出された。   As is apparent from FIG. 19, the expression of the GRP_HUMAN-gastrin releasing peptide transcript that can be detected by the amplicon is shown in non-cancerous samples (sample numbers 56-60, 63-67, Table 1 “Tissue Sample of Test Panel” ) Was significantly higher. In particular, 12 out of 28 adenocarcinoma samples were found to be at least a 5-fold overexpression.

以下記載のように、統計分析を行い、これらの結果の有意性を検証した。   Statistical analysis was performed as described below to verify the significance of these results.

上記アンプリコンによって検出できるGRP_HUMAN−ガストリン放出ペプチド転写物の、乳癌サンプルと正常組織サンプルでの発現レベル差についてのP値は、T検定によって7.22E−04と決定された。   The P value for the difference in expression level of the GRP_HUMAN-gastrin releasing peptide transcript detectable by the amplicon between the breast cancer sample and the normal tissue sample was determined to be 7.22E-04 by T-test.

5倍の過剰発現の閾値は、フィシャ−の直接検定で調べたところ、癌と正常サンプルとを1.12E−02のP値で区別することが見出された。   A five-fold overexpression threshold, when examined by Fisher's direct test, was found to distinguish cancer from normal samples with a P value of 1.12E-02.

プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:HUMGRP5Ejunc3−7Fフォワ−ドプライマ−;およびHUMGRP5Ejunc3Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: Are: HUMGRP5Ejunc3-7F forward primer; and HUMGRP5Ejunc3R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する。例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:
HUMGRP5Ejunc3−7.
HUMGRP5Ejunc3−7F (配列番号:855)
ACCAGCCACCTCAACCCA
HUMGRP5Ejunc3−7R (配列番号:856)
CTGGAGCAGAGAGTCTTTGCCT
HUMGRP5Ejunc3−7 (配列番号:857)
ACCAGCCACCTCAACCCAAGGCCCTGGGCAATCAGCAGCCTTCGTGGGATTCAGAGGATAGCAGCAACTTCAAAGATGTAGGTTCAAAAGGCAAAGACTCTCTGCTCCAG
The present invention also includes preferred amplicons obtained using preferred primers. For example, for the above experiment, the following amplicons have been obtained in a form that is limited to non-limiting examples of preferred amplicons:
HUMGRP5Ejunc3-7.
HUMGRP5Ejunc3-7F (SEQ ID NO: 855)
ACCAGCCACCTCAACCCA
HUMGRP5Ejunc3-7R (SEQ ID NO: 856)
CTGGAGCAGAGAGTCTTTGCCT
HUMGRP5Ejunc3-7 (SEQ ID NO: 857)
ACCAGCCACCTCAACCCAAGGCCCTGGGCAATCAGCAGCCTTCGTGGGATTCAGAGGATAGCAGCAACTTCAAAGATGTAGGTTCAAAAGGCAAAGACTCTCTGCTCCAG

各種正常組織での、配列名HUMGRP5Ejunc3−7に描かれたアンプリコンによって検出できるGRP_HUMAN−ガストリン放出ペプチド(HUMGRP5E)の発現
HUMGRP5Ejunc3−7アンプリコンならびにHUMGRP5Ejunc3−7FおよびHUMGRP5Ejunc3−7Rプライマ−によって、または従って検出できるGRP_HUMAN−ガストリン放出ペプチド転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−RPL19(GenBankアクセッション番号NM_000981;RPL19アンプリコン)、TATAボックス(GenBankアクセッション番号NM_003194;TATAアンプリコン)、UBC(GenBankアクセッション番号BC000449;アンプリコン−ユビキチンアンプリコン)およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現をハウスキ−ピング遺伝子量の相乗平均に対して正規化した。次に正規化した各RTサンプルの値を乳房サンプル(上表2「正常パネルの組織サンプル」のサンプル番号33〜35)中央値で除し、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。プライマ−およびアンプリコンは上記の通りである。
Expression of GRP_HUMAN-gastrin-releasing peptide (HUMGRP5E) detectable in various normal tissues by the amplicon depicted in the sequence name HUMGRP5Ejunc3-7
The expression of the GRP_HUMAN-gastrin releasing peptide transcript that can be detected by the HUMGRP5Ejunc3-7 amplicon and the HUMGRP5Ejunc3-7F and HUMGRP5Ejunc3-7R primers, or thus, was measured using real-time PCR. 4 types of housekeeping genes in parallel-RPL19 (GenBank accession number NM_000981; RPL19 amplicon), TATA box (GenBank accession number NM_003194; TATA amplicon), UBC (GenBank accession number BC000449; amplicon-ubiquitin) Amplicon) and SDHA (GenBank accession number NM_004168; amplicon-SDHA amplicon) were measured in the same manner. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of the breast sample (sample numbers 33 to 35 in Table 2 “Tissue sample of normal panel” above), and the relative expression value of each sample relative to the median value of the breast sample is calculated. Obtained. Primers and amplicons are as described above.

結果を図20に示すが、各種正常組織での、配列名HUMGRP5Ejunc3−7に描かれているアンプリコンによって検出可能なGRP_HUMAN−ガストリン放出ペプチド転写物の発現が証明されている。   The results are shown in FIG. 20, which demonstrates the expression of a GRP_HUMAN-gastrin releasing peptide transcript detectable by the amplicon depicted in the sequence name HUMGRP5Ejunc3-7 in various normal tissues.

クラスタAA155578の説明
クラスタAA155578は、それぞれの名称を表1および2に示し、また配列そのものは本明細書の最後に示している、関心対象の4つの転写物および15のセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Description of Cluster AA155578 Cluster AA155578 is characterized by 4 transcripts of interest and 15 segments, the names of which are given in Tables 1 and 2 and the sequence itself is given at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は、既知のタンパク質であるカリクレイン10前駆体(SwissProtアクセッション識別子KLKA_HUMAN;同義語のEC 3.4.21.−;セリンプロテア−ゼ様プロテア−ゼ1;正常上皮細胞特異的1としても知られる)、配列番号:177の変異体であり、ここでは既知タンパク質を呼ぶ。   These sequences are also known as kallikrein 10 precursor (SwissProt accession identifier KLKA_HUMAN; synonymous EC 3.4.21.-; serine protease-like protease 1; normal epithelial cell-specific 1) A variant of SEQ ID NO: 177, referred to herein as a known protein.

タンパク質、カリクレイン10前駆体は、次の機能を有することが知られてるか、または有すると考えられている:乳癌および前立腺癌でのNES1に対し腫瘍抑制因子の役割を持つ。タンパク質、カリクレイン10前駆体の配列は、本明細書の最後に「カリクレイン10前駆体アミノ酸配列」として示してある。この配列について知られている多形を表4に示す。   The protein, kallikrein 10 precursor, is known or thought to have the following functions: has a tumor suppressor role for NES1 in breast and prostate cancer. The sequence of the protein, kallikrein 10 precursor, is shown at the end of the specification as the “kallikrein 10 precursor amino acid sequence”. Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質、カリクレイン10前駆体の局在は、分泌型と考えられている(推定)。   The localization of the protein, kallikrein 10 precursor, is thought to be secreted (presumed).

既知タンパク質には次のGO注釈付けが用いられている。以下の注釈付けが見出されている;タンパク質分解およびペプチド分解、これらは生物学的プロセスに関係する注釈である;キモトリプシン;トリプシン、セリン型ペプチダ−ゼ;ヒドラ−ゼ、これらは分子機能に関係する注釈付けである;そして細胞外、これらは細胞成分に関係する注釈付けである。   The following GO annotations are used for known proteins. The following annotations have been found; proteolysis and peptide degradation, these are annotations related to biological processes; chymotrypsin; trypsin, serine-type peptidase; hydrase, these are related to molecular function And extracellular, these are annotations related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタAA155578は、癌におけるこのクラスタの転写物の過剰発現による診断マ−カ−として用いることができる。このような転写物の正常組織での発現も、先述の方法によって得られる。表右側縦列の項「数」および図21のy軸の数は、「百万分の一」の形で表した各分類のESTの重み付け発現を表す(百万分の一で表した、その分類の全ESTの発現に対する特定クラスタのEST発現の比)。   Cluster AA155578 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The term “number” in the column on the right side of the table and the number of y-axis in FIG. Ratio of EST expression of a specific cluster to expression of all ESTs of the classification)

全体として、図21のヒストグラムおよび表5で示すような、次の結果が得られた。このクラスタは次の病的状態で過剰発現している(少なくとも最低レベルで):上皮性悪性腫瘍、各種組織由来の混合型悪性腫瘍、および膵臓癌。   Overall, the following results were obtained as shown in the histogram of FIG. 21 and Table 5. This cluster is overexpressed (at least at the lowest level) in the following pathological conditions: epithelial malignancies, mixed malignancies from various tissues, and pancreatic cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタAA155578は、上表5に掲載した4つの転写物を特徴とする。これら転写物は、タンパク質のカリクレイン10前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster AA155578 is characterized by the four transcripts listed in Table 5 above. These transcripts code for proteins that are variants of the kallikrein 10 precursor of the protein. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質AA155578_PEA_1_P4は、本明細書の最後に示したアミノ酸配列を有する;それは転写物AA155578_PEA_1_T10にコ−ドされている。既知タンパク質(カリクレイン10前駆体)とのアラインメントを本明細書の最後に示す。一もしくは複数の、これまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係を以下簡単に説明する:   The mutant protein AA155578_PEA_1_P4 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript AA155578_PEA_1_T10. An alignment with a known protein (kallikrein 10 precursor) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

AA155578_PEA_1_P4とKLKA_HUMANとの比較報告:
1. AA155578_PEA_1_P4をコ−ドする単離されたキメラポリペプチドは、KLKA_HUMANのアミノ酸1〜146に相当し、またAA155578_PEA_1_P4のアミノ酸1〜146にも相当するMRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGAPCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKPLWARVGDDHLLLLQGEQLRRTTRSVVHPKYHQGSGPILPRRTDEHDLMLLKLARPに少なくとも90%相同である第一アミノ酸配列、およびKIKA_HUMANのアミノ酸184〜276に相当し、またAA155578_PEA_1_P4のアミノ酸147〜239にも相当する配列YNKGLTCSSITILSPKECEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPCGSAQHPAVYTQICKYMSWINKVIRSNに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between AA155578_PEA_1_P4 and KLKA_HUMAN:
1. AA155578_PEA_1_P4 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 146 of KLKA_HUMAN, also the first amino acid sequence that is at least 90% homologous to MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGAPCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKPLWARVGDDHLLLLQGEQLRRTTRSVVHPKYHQGSGPILPRRTDEHDLMLLKLARP which also corresponds to amino acids 1 to 146 of AA155578_PEA_1_P4 And sequence corresponding to amino acids 184 to 276 of KIKA_HUMAN and also corresponding to amino acids 147 to 239 of AA155578_PEA_1_P4 It is connected sequentially in order.

2. AA155578_PEA_1_P4の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がPYを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号146−xから146のいずれかより開始し:アミノ酸番号147+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that codes for the edge of AA155578_PEA_1_P4 has a length “n”, where n is at least about 10 amino acids long, if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, including a polypeptide in which at least two amino acids comprise PY and having the following structure: Starting from any of x to 146: a sequence ending at any of amino acid numbers 147 + ((n−2) −x), where x ranges from 0 to n−2.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質AA155578_PEA_1_P4はまた、表7に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質AA155578_PEA_1_P4配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein AA155578_PEA_1_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not the SNP is known; the presence of a known SNP within the mutant protein AA155578_PEA_1_P4 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質AA155578_PEA_1_P4は、次の転写物にコ−ドされている:AA155578_PEA_1_T10、この転写物の配列は本明細書の最後に示してある。転写物AA155578_PEA_1_T10のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置148から始まり、位置864に終止する。転写物はまた、表8に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質AA155578_PEA_1_P4配列中での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein AA155578_PEA_1_P4 is encoded in the following transcript: AA155578_PEA_1_T10, the sequence of this transcript is given at the end of the specification. The coding part of the transcript AA155578_PEA_1_T10 is shown in bold: this coding part starts at position 148 and ends at position 864. The transcript also has the following SNPs listed in Table 8 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP in the mutant protein AA155578_PEA_1_P4 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質AA155578_PEA_1_P6は、本明細書の最後に示したアミノ酸配列を有する;それは転写物AA155578_PEA_1_T12にコ−ドされている。既知タンパク質(カリクレイン10前駆体)とのアラインメントを本明細書の最後に示す。一もしくは複数の、これまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係を以下簡単に説明する:   The mutant protein AA155578_PEA_1_P6 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript AA155578_PEA_1_T12. An alignment with a known protein (kallikrein 10 precursor) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

AA155578_PEA_1_P6とKLKA_HUMANとの比較報告:
1. AA155578_PEA_1_P6をコ−ドする単離されたキメラポリペプチドは、KLKA_HUMANのアミノ酸1〜29に相当し、またAA155578_PEA_1_P6のアミノ酸1〜29にも相当するMRAPHLHLSAASGARALAKLLPLLMAQLWに少なくとも90%相同である第一アミノ酸配列、およびKLKA_HUMANのアミノ酸182〜276に相当し、またAA155578_PEA_1_P6のアミノ酸30〜124にも相当するVKYNKGLTCSSITILSPKECEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPCGSAQHPAVYTQICKYMSWINKVIRSNに少なくとも90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between AA155578_PEA_1_P6 and KLKA_HUMAN:
1. An isolated chimeric polypeptide that codes for AA155578_PEA_1_P6 is the first amino acid sequence that is at least 90% homologous to MRAPHLHLSAASGARALAKLLPLLMAQLW corresponding to amino acids 1-29 of KLKA_HUMAN and also corresponding to amino acids 1-29 of AA155578_PEA_1_P6 , And VKYNKGLTCSSITILSPKECEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPCGSAQHPAVYTQICKYMSWINKVIRSN when the second amino acid sequence is the second amino acid sequence and the second amino acid sequence is the second amino acid sequence. And connected in order.

AA155578_PEA_1_P6の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がWVを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号29−xから29のいずれかより開始し:アミノ酸番号30+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   An isolated chimeric polypeptide that codes for the edge of AA155578_PEA_1_P6 has a length “n”, where n is at least about 10 amino acids long, if necessary, at least about 20 amino acids long, preferably at least about 30 amino acids long, more preferably at least about 40 amino acids long, and most preferably at least about 50 amino acids long, including a polypeptide wherein at least two amino acids comprise WV and having the following structure: from amino acid numbers 29-x A sequence starting from any of 29: ending at any of amino acid numbers 30 + ((n−2) −x), where x is in the range of 0 to n−2.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質AA155578_PEA_1_P6はまた、表9に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質AA155578_PEA_1_P6配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein AA155578_PEA_1_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 9 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not the SNP is known; the presence of a known SNP within the mutant protein AA155578_PEA_1_P6 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質AA155578_PEA_1_P6は、次の転写物にコ−ドされている:AA155578_PEA_1_T12、この転写物の配列は本明細書の最後に示してある。転写物AA155578_PEA_1_T12のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置148から始まり、位置519に終止する。転写物はまた、表10に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質AA155578_PEA_1_P6配列中での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein AA155578_PEA_1_P6 is encoded in the following transcript: AA155578_PEA_1_T12, the sequence of this transcript is given at the end of the specification. The coding part of the transcript AA155578_PEA_1_T12 is shown in bold: this coding part starts at position 148 and ends at position 519. The transcript also has the following SNPs listed in Table 10 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP in the mutant protein AA155578_PEA_1_P6 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質AA155578_PEA_1_P8は、本明細書の最後に示したアミノ酸配列を有する;それは転写物AA155578_PEA_1_T8にコ−ドされている。既知タンパク質(カリクレイン10前駆体)とのアラインメントを本明細書の最後に示す。一もしくは複数の、これまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係を以下簡単に説明する:   The mutant protein AA155578_PEA_1_P8 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript AA155578_PEA_1_T8. An alignment with a known protein (kallikrein 10 precursor) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

AA155578_PEA_1_P8とKLKA_HUMANとの比較報告:
1. AA155578_PEA_1_P8をコ−ドする単離されたキメラポリペプチドは、KIKA_HUMANのアミノ酸1〜29に相当し、またAA155578_PEA_1_P8のアミノ酸1〜29にも相当するMRAPHLHLSAASGARALAKLLPLLMAQLWに少なくとも90%相同である第一アミノ酸配列、およびAA155578_PEA_1_P8のアミノ酸30〜35に相当する配列GHCGLEを有するポリペプチドに少なくとも70%、要する場合は少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between AA155578_PEA_1_P8 and KLKA_HUMAN:
1. The isolated chimeric polypeptide that codes for AA155578_PEA_1_P8 corresponds to amino acids 1-29 of KIKA_HUMAN and also the first amino acid sequence that is at least 90% homologous to MRAPHLHLSAASGARALAKLLPLLMAQLW corresponding to amino acids 1-29 of AA155578_PEA_1_P8 And at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence GHCGLE corresponding to amino acids 30-35 of AA155578_PEA_1_P8 Wherein the first and second amino acid sequences are sequentially connected in sequence.

2. AA155578_PEA_1_P8の尾部をコ−ドする単離されたキメラポリペプチドは、AA155578_PEA_1_P8内の配列GHCGLEに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated chimeric polypeptide that encodes the tail of AA155578_PEA_1_P8 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90%, to the sequence GHCGLE within AA155578_PEA_1_P8. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質AA155578_PEA_1_P8はまた、表11に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質AA155578_PEA_1_P8配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein AA155578_PEA_1_P8 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 11 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether the SNP is known; the presence of a known SNP within the mutant protein AA155578_PEA_1_P8 sequence supports the sequence derived for this mutant protein of the invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質AA155578_PEA_1_P8は、次の転写物にコ−ドされている:AA155578_PEA_1_T8、この転写物の配列は本明細書の最後に示してある。転写物AA155578_PEA_1_T8のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置285から始まり、位置389に終止する。転写物はまた、表12に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質AA155578_PEA_1_P8配列中での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein AA155578_PEA_1_P8 is encoded in the following transcript: AA155578_PEA_1_T8, the sequence of this transcript is given at the end of the specification. The coding part of the transcript AA155578_PEA_1_T8 is shown in bold: this coding part starts at position 285 and ends at position 389. The transcript also has the following SNPs listed in Table 12 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP in the mutant protein AA155578_PEA_1_P8 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質AA155578_PEA_1_P9は、本明細書の最後に示したアミノ酸配列を有する;それは転写物AA155578_PEA_1_T13にコ−ドされている。既知タンパク質(カリクレイン10前駆体)とのアラインメントを本明細書の最後に示す。一もしくは複数の、これまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係を以下簡単に説明する:   The mutant protein AA155578_PEA_1_P9 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript AA155578_PEA_1_T13. An alignment with a known protein (kallikrein 10 precursor) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

AA155578_PEA_1_P9とKLKA_HUMANとの比較報告:
1. AA155578_PEA_1_P9をコ−ドする単離されたキメラポリペプチドは、KLKA_HUMANのアミノ酸1〜90に相当し、またAA155578_PEA_1_P9のアミノ酸1〜90にも相当するMRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGAPCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKに少なくとも90%相同である第一アミノ酸配列を含む。
Comparison report between AA155578_PEA_1_P9 and KLKA_HUMAN:
1. The isolated chimeric polypeptide that codes for AA155578_PEA_1_P9 corresponds to amino acids 1 to 90 of KLKA_HUMAN and also to the first amino acid MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDHCHCVLVQ% including.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質AA155578_PEA_1_P9はまた、表13に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質AA155578_PEA_1_P9配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein AA155578_PEA_1_P9 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 13 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether the SNP is known; the presence of a known SNP within the mutant protein AA155578_PEA_1_P9 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質AA155578_PEA_1_P9は、次の転写物にコ−ドされている:AA155578_PEA_1_T13、この転写物の配列は本明細書の最後に示してある。転写物AA155578_PEA_1_T13のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置148から始まり、位置419に終止する。転写物はまた、表14に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質AA155578_PEA_1_P9配列中での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein AA155578_PEA_1_P9 is encoded in the following transcript: AA155578_PEA_1_T13, the sequence of this transcript is given at the end of the specification. The coding part of the transcript AA155578_PEA_1_T13 is shown in bold: this coding part starts at position 148 and ends at position 419. The transcript also has the following SNPs listed in Table 14 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column reveals the SNPs The presence of a known SNP in the mutant protein AA155578_PEA_1_P9 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のように、クラスタT155578は、上表2に記載し、またその配列を本明細書の最後に示した15のセグメントを特徴とする。これらセグメントは、特に関心の対象であることからここに別々に記載した核酸配列部分である。次に本発明の各セグメントについて説明する。   As noted above, cluster T155578 is characterized by the 15 segments listed in Table 2 above and whose sequences are shown at the end of this specification. These segments are the nucleic acid sequence portions described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタT155578_PEA_1_node_11は34個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AA155578_PEA_1_T10、およびAA155578_PEA_1_T13。下表15に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_11 of the present invention is supported by 34 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: AA155578_PEA_1_T10, and AA155578_PEA_1_T13. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_12は3個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: AA155578_PEA_1_T13。下表16に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_12 of the present invention is supported by three libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: AA155578_PEA_1_T13. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_14は31個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AA155578_PEA_1_T10、およびAA155578_PEA_1_T8。下表17に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_14 of the present invention is supported by 31 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: AA155578_PEA_1_T10, and AA155578_PEA_1_T8. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_19は45個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AA155578_PEA_1_T10、AA155578_PEA_1_T12、およびAA155578_PEA_1_T8。下表18に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_19 of the present invention is supported by 45 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: AA155578_PEA_1_T10, AA155578_PEA_1_T12, and AA155578_PEA_1_T8. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_21は53個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AA155578_PEA_1_T10、AA155578_PEA_1_T12、およびAA155578_PEA_1_T8。下表19に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_21 of the present invention is supported by 53 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: AA155578_PEA_1_T10, AA155578_PEA_1_T12, and AA155578_PEA_1_T8. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_23は71個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AA155578_PEA_1_T10、AA155578_PEA_1_T12、およびAA155578_PEA_1_T8。下表20に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_23 of the present invention is supported by 71 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: AA155578_PEA_1_T10, AA155578_PEA_1_T12, and AA155578_PEA_1_T8. Table 20 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_24は52個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AA155578_PEA_1_T10、AA155578_PEA_1_T12、およびAA155578_PEA_1_T8。下表21に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_24 of the present invention is supported by 52 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: AA155578_PEA_1_T10, AA155578_PEA_1_T12, and AA155578_PEA_1_T8. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_25は53個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AA155578_PEA_1_T10、AA155578_PEA_1_T12、およびAA155578_PEA_1_T8。下表22に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_25 of the present invention is supported by 53 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: AA155578_PEA_1_T10, AA155578_PEA_1_T12, and AA155578_PEA_1_T8. Table 22 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_4は21個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AA155578_PEA_1_T10、AA155578_PEA_1_T12、およびAA155578_PEA_1_T8。下表23に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_4 of the present invention is supported by 21 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: AA155578_PEA_1_T10, AA155578_PEA_1_T12, and AA155578_PEA_1_T8. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_7は3個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: AA155578_PEA_1_T8。下表24に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_7 of the present invention is supported by three libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: AA155578_PEA_1_T8. Table 24 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは、長さが約120bpまでであことから分けて説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are described separately because they are up to about 120 bp in length.

本発明のセグメントクラスタAA155578_PEA_1_node_15は33個のライブラリ−に裏付けされている。ライブラリ−の数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AA155578_PEA_1_T8。下表25に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster AA155578_PEA_1_node_15 of the present invention is supported by 33 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AA155578_PEA_1_T8. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタAA155578_PEA_1_node_18は次の転写物に見出すことができる:AA155578_PEA_1_T12およびAA155578_PEA_1_T8。下表26に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster AA155578_PEA_1_node_18 of the present invention can be found in the following transcripts: AA155578_PEA_1_T12 and AA155578_PEA_1_T8. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_22は次の転写物に見出すことができる:AA155578_PEA_1_T10、AA155578_PEA_1_T12、およびAA155578_PEA_1_T8。下表27に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_22 of the present invention can be found in the following transcripts: AA155578_PEA_1_T10, AA155578_PEA_1_T12, and AA155578_PEA_1_T8. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタAA155578_PEA_1_node_6は2個のライブラリ−に裏付けされている。ライブラリ−の数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AA155578_PEA_1_T8。下表28に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster AA155578_PEA_1_node_6 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AA155578_PEA_1_T8. Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT155578_PEA_1_node_8は26個のライブラリ−に裏付けされている。ライブラリ−の数は、前述のようにして決定した。次の転写物に見出すことができる:AA155578_PEA_1_T10、AA155578_PEA_1_T12、AA155578_PEA_1_T13、およびAA155578_PEA_1_T8。下表29に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T155578_PEA_1_node_8 of the present invention is supported by 26 libraries. The number of libraries was determined as described above. The following transcripts can be found: AA155578_PEA_1_T10, AA155578_PEA_1_T12, AA155578_PEA_1_T13, and AA155578_PEA_1_T8. Table 29 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:/tmp/4gXdRV0C1z/cQ4LqHmh5A:KLKA_HUMAN
配列文書:
アラインメント:AA155578_PEA_1_P4 x KLKA_HUMAN
アラインメントセグメント 1/1:
クオリティ−:2283.00
Escore:0
一致長:239 全長:276
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:86.59 全パ−セント同一性:86.59
ギャップ: 1
アラインメント:
. . . . .
1 MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGA 50
. . . . .
51 PCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKPLWARVGDDH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKPLWARVGDDH 100
. . . . .
101 LLLLQGEQLRRTTRSVVHPKYHQGSGPILPRRTDEHDLMLLKLARP.... 146
||||||||||||||||||||||||||||||||||||||||||||||
101 LLLLQGEQLRRTTRSVVHPKYHQGSGPILPRRTDEHDLMLLKLARPVVPG 150
. . . . .
147 .................................YNKGLTCSSITILSPKE 163
|||||||||||||||||
151 PRVRALQLPYRCAQPGDQCQVAGWGTTAARRVKYNKGLTCSSITILSPKE 200
. . . . .
164 CEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPC 213
||||||||||||||||||||||||||||||||||||||||||||||||||
201 CEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPC 250
. .
214 GSAQHPAVYTQICKYMSWINKVIRSN 239
||||||||||||||||||||||||||
251 GSAQHPAVYTQICKYMSWINKVIRSN 276
Alignment of mutant protein with known protein Sequence name: / tmp / 4gXdRV0C1z / cQ4LqHmh5A: KLKA_HUMAN
Sequence document:
Alignment: AA155578_PEA_1_P4 x KLKA_HUMAN
Alignment segment 1/1:
Quality-: 2228.30
Escore: 0
Match length: 239 Total length: 276
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 86.59 Total percent identity: 86.59
Gap: 1
alignment:
...
1 MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGA 50
...
51 PCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKPLWARVGDDH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKPLWARVGDDH 100
...
101 LLLLQGEQLRRTTRSVVHPKYHQGSGPILPRRTDEHDLMLLKLARP .... 146
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||||-||||-||||||-||||||-||||||-||||||-|||||||| be be
101 LLLLQGEQLRRTTRSVVHPKYHQGSGPILPRRTDEHDLMLLKLARPVVPG 150
...
147 .................................... YNKGLTCSSITILSPKE 163
||||||||||||||||||| |
151 PRVRALQLPYRCAQPGDQCQVAGWGTTAARRVKYNKGLTCSSITILSPKE 200
...
164 CEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPC 213
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 CEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPC 250
..
214 GSAQHPAVYTQICKYMSWINKVIRSN 239
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
251 GSAQHPAVYTQICKYMSWINKVIRSN 276

配列名:/tmp/3VxcRS97HN/X9ncdxjYQx:KLKA_HUMAN
配列文書:
アラインメント: AA155578_PEA_1_P6 x KLKA_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−: 1140.00
Escore: 0
一致長:124 全長:276
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:44.93 全パ−セント同一性:44.93
ギャップ: 1
アラインメント:
. . . . .
1 MRAPHLHLSAASGARALAKLLPLLMAQLW..................... 29
|||||||||||||||||||||||||||||
1 MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGA 50
. . . . .
29 .................................................. 29

51 PCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKPLWARVGDDH 100
. . . . .
29 .................................................. 29

101 LLLLQGEQLRRTTRSVVHPKYHQGSGPILPRRTDEHDLMLLKLARPVVPG 150
. . . . .
30 ...............................VKYNKGLTCSSITILSPKE 48
|||||||||||||||||||
151 PRVRALQLPYRCAQPGDQCQVAGWGTTAARRVKYNKGLTCSSITILSPKE 200
. . . . .
49 CEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPC 98
||||||||||||||||||||||||||||||||||||||||||||||||||
201 CEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPC 250
. .
99 GSAQHPAVYTQICKYMSWINKVIRSN 124
||||||||||||||||||||||||||
251 GSAQHPAVYTQICKYMSWINKVIRSN 276
Array name: / tmp / 3VxcRS97HN / X9ncdxjYQx: KLKA_HUMAN
Sequence document:
Alignment: AA155578_PEA_1_P6 x KLKA_HUMAN ..
Alignment segment 1/1:
Quality: 1140.00
Escore: 0
Match length: 124 Total length: 276
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 44.93 Total percent identity: 44.93
Gap: 1
alignment:
...
1 MRAPHLHLSAASGARALAKLLPLLMAQLW ............ 29
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
1 MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGA 50
...
29 ................................................. . 29

51 PCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNKPLWARVGDDH 100
...
29 ................................................. . 29

101 LLLLQGEQLRRTTRSVVHPKYHQGSGPILPRRTDEHDLMLLKLARPVVPG 150
...
30 ...................... VKYNKGLTCSSITILSPKE 48
|||||||||||||||||||||-
151 PRVRALQLPYRCAQPGDQCQVAGWGTTAARRVKYNKGLTCSSITILSPKE 200
...
49 CEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPC 98
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 CEVFYPGVVTNNMICAGLDRGQDPCQSDSGGPLVCDETLQGILSWGVYPC 250
..
99 GSAQHPAVYTQICKYMSWINKVIRSN 124
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
251 GSAQHPAVYTQICKYMSWINKVIRSN 276

配列名:/tmp/LsSdTeu0qX/6luiCMKTi9:KLKA_HUMAN
配列文書:
アラインメント:AA155578_PEA_1_P8 x KLKA_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:279.00
Escore: 0
一致長:29 全長:29
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. .
1 MRAPHLHLSAASGARALAKLLPLLMAQLW 29
|||||||||||||||||||||||||||||
1 MRAPHLHLSAASGARALAKLLPLLMAQLW 29
Sequence name: / tmp / LsSdTeu0qX / 6luiCMKTi9: KLKA_HUMAN
Sequence document:
Alignment: AA155578_PEA_1_P8 x KLKA_HUMAN ..
Alignment segment 1/1:
Quality: 279.00
Escore: 0
Match length: 29 Total length: 29
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
..
1 MRAPHLHLSAASGARALAKLLPLLMAQLW 29
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
1 MRAPHLHLSAASGARALAKLLPLLMAQLW 29

配列名:/tmp/kcfKGMcF7s/YnKnMy8D1q:KLKA_HUMAN
配列文書:
アラインメント:AA155578_PEA_1_P9 x KLKA_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:887.00
Escore: 0
一致長:90 全長:90
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGA 50
. . . .
51 PCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNK 90
||||||||||||||||||||||||||||||||||||||||
51 PCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNK 90
Sequence name: / tmp / kcfKGMcF7s / YnKnMy8D1q: KLKA_HUMAN
Sequence document:
Alignment: AA155578_PEA_1_P9 x KLKA_HUMAN ..
Alignment segment 1/1:
Quality-: 887.00
Escore: 0
Match length: 90 Total length: 90
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRAPHLHLSAASGARALAKLLPLLMAQLWAAEAALLPQNDTRLDPEAYGA 50
...
51 PCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNK 90
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||||-||||||-|||||-||||||-|||||-|||||||-
51 PCARGSQPWQVSLFNGLSFHCAGVLVDQSWVLTAAHCGNK 90

クラスタHSENA78の説明
クラスタHSENA78は、表1および2にそれぞれその名称を示し、配列自体は本明細書の最後に示した、関心対象となる1つの転写物および7つのセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Description of Cluster HSENA78 Cluster HSENA78 is named in Tables 1 and 2, respectively, and the sequence itself is characterized by one transcript of interest and seven segments shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は既知タンパク質である小型誘導性サイトカインB5前駆体(SwissProtアクセッション識別子SZ05_HUMAN:同義語のCXCL5;上皮由来好中球活性化タンパク質78;好中球活性化ペプチドENA−78としても知られる)、配列番号:190であり、ここでは既知タンパク質と呼ぶ。   These sequences are known proteins, small inducible cytokine B5 precursor (SwissProt accession identifier SZ05_HUMAN: synonymous CXCL5; also known as epithelial neutrophil activating protein 78; neutrophil activating peptide ENA-78 ), SEQ ID NO: 190, referred to herein as a known protein.

タンパク質の小型誘導性サイトカインB5前駆体は次の機能を有することが知られているか、または信じられている:好中球の活性化への関与。タンパク質、小型誘導性サイトカインB5の配列は、本明細書の最後に「小型誘導性サイトカインB5前駆体アミノ酸配列」(配列番号:96)として示されている。タンパク質、小型誘導性サイトカインB5前駆体の局在は、分泌型と考えられている。   The small inducible cytokine B5 precursor of proteins is known or believed to have the following functions: involvement in neutrophil activation. The sequence of the protein, small inducible cytokine B5, is shown at the end of the specification as "small inducible cytokine B5 precursor amino acid sequence" (SEQ ID NO: 96). The localization of the protein, the small inducible cytokine B5 precursor, is thought to be secreted.

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;アポト−シス;走化性;シグナル変換;細胞−細胞シグナル伝達;細胞増殖のポジティブコントロ−ル、これらは生物学的プロセスに関係する注釈であり;そしてケモカイン、これらは細胞成分に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; apoptosis; chemotaxis; signal transduction; cell-cell signaling; positive control of cell proliferation, these are annotations related to biological processes; and Chemokines, these are annotations related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタHSENA78は、癌におけるこのクラスタ転写物の過剰発現による診断マ−カ−として用いることができる。このような転写物の正常組織での発現も、先述の方法によって得られる。表右側縦列の項「数」および図22のy軸の数は、「百万分の一」の形で表した各分類のESTの重み付け発現を表している(百万分の一で表した、その分類の全ESTの発現に対する特定クラスタのEST発現の比)。   Cluster HSENA78 can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The term “number” in the right column of the table and the number of y-axis in FIG. 22 represent the weighted expression of EST of each classification in the form of “parts per million” (expressed in parts per million). , Ratio of EST expression of a particular cluster to expression of all ESTs of that classification).

全体として、図22のヒストグラムおよび表4に関係して見られるように、次の結果が得られた。このクラスタは、次の病的状態で過剰発現している(少なくとも最小レベルで):上皮悪性腫瘍および肺悪性腫瘍。   Overall, the following results were obtained as seen in relation to the histogram of FIG. 22 and Table 4. This cluster is overexpressed (at least at a minimal level) in the following pathological conditions: epithelial and lung malignancies.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタHSENA78は、上表1に記載されている1つの転写物を特徴とする。これら転写物は、タンパク質の小型誘導性サイトカインB5前駆体の変異体であるタンパク質をコ−ドしている。次に本発明の各変異体タンパク質について説明する。   As mentioned above, cluster HSENA78 is characterized by one transcript listed in Table 1 above. These transcripts code for proteins that are variants of the protein small inducible cytokine B5 precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質HSENA78_P2は、本明細書の最後に示すアミノ酸配列を有している;それは転写物HSENA78_T5にコ−ドされている。既知タンパク質(小型誘導性サイトカインB5前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。次に、このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質との関係を簡単に説明する:   The mutant protein HSENA78_P2 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSENA78_T5. An alignment with a known protein (small inducible cytokine B5 precursor) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. Next, the relationship between the protein having such an alignment and the mutant protein of the present invention will be briefly described:

HSENA78とSZ05_HUMANの比較報告:
1.HSENA78_P2をコ−ドする単離されたキメラポリペプチドは、SZ05_HUMANのアミノ酸1〜81に相当し、またHSENA78_P2のアミノ酸1〜81にも相当するMSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCVCLQTTQGVHPKMISNLQVFAIGPQCSKVEVVに少なくとも90%相同である第一アミノ酸配列を含む。
Comparison report between HSENA78 and SZ05_HUMAN:
1.An isolated chimeric polypeptide that codes for HSENA78_P2 is at least the first amino acid at sequence 90 amino acid sequence of MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCVCLQTTQGVHPKMISNLQVFAIGSQCV including.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSENA78_P2はまた、表6に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質HSENA78_P2配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSENA78_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 6 (shown according to their position on the amino acid sequence, followed by the modified amino acids; last Column indicates whether the SNP is known; the presence of a known SNP in the mutant protein HSENA78_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSENA78_P2は、次の転写物にコ−ドされている:HSENA78_T5、この転写物の配列は本明細書の最後に示してある。転写物HSENA78_T5のコ−ディング部分は、太字で表している:このコ−ディング部分は、位置149から始まり、位置391に終わる。転写物はまた、表7に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質HSENA78_P2配列中での既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSENA78_P2 is encoded in the following transcript: HSENA78_T5, the sequence of this transcript is given at the end of the description. The coding part of the transcript HSENA78_T5 is shown in bold: this coding part starts at position 149 and ends at position 391. The transcript also has the following SNPs listed in Table 7 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP in the mutant protein HSENA78_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のようにクラスタHSENA78は、上表2に記載され、またその配列を本明細書の最後に示してある7つのセグメントを特徴とする。これらセグメントは、特に関心の対象であることから、ここで別々に記載される核酸配列部分である。次に、本発明の各セグメントについて説明する。   As noted above, cluster HSENA 78 is described in Table 2 above and is characterized by seven segments whose sequences are shown at the end of this specification. Since these segments are of particular interest, they are the nucleic acid sequence portions described separately here. Next, each segment of the present invention will be described.

本発明のセグメントクラスタHSENA78_node_0は24個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSENA78_T5。下表8に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSENA78_node_0 of the present invention is supported by 24 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSENA78_T5. Table 8 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSENA78_node_2は22個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSENA78_T5。下表9に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSENA78_node_2 of the present invention is supported by 22 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSENA78_T5. Table 9 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSENA78_node_6は68個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSENA78_T5。下表10に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSENA78_node_6 of the present invention is supported by 68 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSENA78_T5. Table 10 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSENA78_node_9は28個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSENA78_T5。下表11に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSENA78_node_9 of the present invention is supported by 28 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSENA78_T5. Table 11 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは、長さが約120bpまでであることから、別に説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they will be described separately.

本発明のセグメントクラスタHSENA78_node_3は1個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSENA78_T5。下表12に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSENA78_node_3 of the present invention is supported by one library. Library numbers were determined as described above. This segment can be found in the following transcript: HSENA78_T5. Table 12 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSENA78_node_4は17個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSENA78_T5。下表13に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSENA78_node_4 of the present invention is supported by 17 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSENA78_T5. Table 13 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSENA78_node_8は次の転写物に見出すことができる:HSENA78_T5。下表14に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSENA78_node_8 of the present invention can be found in the following transcript: HSENA78_T5. Table 14 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

この遺伝子については、つぎのようなマイクロアレイ(チップ)デ−タも入手できる。クラスタ自体について上記したように、様々なオリゴヌクレオチドについて、様々な疾患状態、特に癌で異なって発現されているか試験した。表15に示す次のオリゴヌクレオチドが、このセグメントをヒットすることが見いだされた。   The following microarray (chip) data is also available for this gene. As described above for the cluster itself, various oligonucleotides were tested for differential expression in various disease states, particularly cancer. The following oligonucleotides shown in Table 15 were found to hit this segment.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:/tmp/5kiQY6MxWx/pLnTrxsCqk:SZ05_HUMAN
配列文書:
アラインメント:HSENA78_P2 x SZ05_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:767.00
Escore: 0
一致長:81 全長:81
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCV 50
. . .
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81
|||||||||||||||||||||||||||||||
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81
Alignment of mutant protein with known protein Sequence name: / tmp / 5kiQY6MxWx / pLnTrxsCqk: SZ05_HUMAN
Sequence document:
Alignment: HSENA78_P2 x SZ05_HUMAN ..
Alignment segment 1/1:
Quality: 767.00
Escore: 0
Match length: 81 Total length: 81
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCV 50
..
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81

クラスタZT94936の説明
クラスタT94936は、表1および2にそれぞれにその名称を示し、配列自体は本明細書の最後に示した、関心対象の2つの転写物および12個のセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Description of Cluster ZT94936 Cluster T94936 features its name in Tables 1 and 2, respectively, and the sequence itself is characterized by the two transcripts of interest and 12 segments shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタT94936は、上表1に記載の2つの転写物を特徴とする。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster T94936 is characterized by the two transcripts listed in Table 1 above. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質T94936_PEA_1_P2は、本明細書の最後に示してあるアミノ酸配列を有する;それは転写物T94936_PEA_1_T1にコ−ドされている。これまでに公表されている一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。次に、このようなアラインメントを取った各タンパク質と本発明の変異体タンパク質との関係について簡単に説明する:   The mutant protein T94936_PEA_1_P2 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T94936_PEA_1_T1. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Next, the relationship between each protein having such an alignment and the mutant protein of the present invention will be briefly described:

T94936_PEA_1_P2とQ8TD06(配列番号858)との比較報告、
1.T94936_PEA_1_P2をコ−ドする単離されたキメラポリペプチドは、Q8TD06のアミノ酸1〜150に相当し、またT94936_PEA_1_P2のアミノ酸1〜150にも相当するMMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEEGLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNLMHETTDKNLSPDGQYVPRIMFVDPSLTVRADIAGRYSNRLYTYEPに少なくとも90%相同である第一アミノ酸配列を含む。
Comparison report between T94936_PEA_1_P2 and Q8TD06 (SEQ ID NO: 858),
1.An isolated chimeric polypeptide that codes for T94936_PEA_1_P2 corresponds to amino acids 1-150 of Q8TD06, and also corresponds to amino acids 1-150 of T94936_PEA_1_P2 and MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLS including.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T94936_PEA_1_P2はまた、表4に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置に従って示され、その変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T94936_PEA_1_P2配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T94936_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 4 (shown according to their position on the amino acid sequence and their altered amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein T94936_PEA_1_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T94936_PEA_1_P2は次の転写物にコ−ドされている:T94936_PEA_1_T1、これの配列は本明細書の最後に示している。転写物T94936_PEA_1_T1のコ−ディング部分は太字で示している;このコ−ディング部分は位置76から開始し、位置525で終止している。前記転写物は以下表5記載の非サイレントSNP(単一ヌクレオチド多形)を有する(ヌクレオチド配列上のそれらの位置に従って示され、その変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T94936_PEA_1_P2配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T94936_PEA_1_P2 is encoded in the following transcript: T94936_PEA_1_T1, the sequence of which is given at the end of the specification. The coding portion of transcript T94936_PEA_1_T1 is shown in bold; this coding portion starts at position 76 and ends at position 525. The transcripts have non-silent SNPs (single nucleotide polymorphisms) listed in Table 5 below (shown according to their position on the nucleotide sequence and their modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP within the mutant protein T94936_PEA_1_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T94936_PEA_1_P3は、本明細書の最後に記したアミノ酸配列を有する;それは転写物T94936_PEA_1_T2にコ−ドされている。これまでに公開されている一または複数のタンパク質配列との一または複数のアラインメントが本明細書の最後に示してある。このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質の関係を以下簡単に説明する:   The mutant protein T94936_PEA_1_P3 of the present invention has the amino acid sequence noted at the end of the specification; it is encoded in the transcript T94936_PEA_1_T2. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between such an aligned protein and the mutant protein of the present invention will be briefly described below:

T94936_PEA_1_P3とQ8TD06の比較報告:
1. T94936_PEA_1_P3をコ−ドする単離されたキメラポリペプチドは、Q8TD06のアミノ酸1〜122に相当し、またT94936_PEA_1_P3のアミノ酸1〜122にも相当するMMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEEGLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNLMHETTDKNLSPDGQYVPRIMFVに少なくとも90%相同である第一アミノ酸配列、およびT94936_PEA_1_P3のアミノ酸123〜145に相当する配列GMYVISFHQIYKISRNQHSCFYFを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T94936_PEA_1_P3 and Q8TD06:
1. The isolated chimeric polypeptide that codes for T94936_PEA_1_P3 corresponds to amino acids 1-122 of Q8TD06 and also corresponds to amino acids 1-122 of T94936_PEA_1_P3 MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEEGLFYAQKSKKPLMVIHQLED , And a polypeptide having the sequence GMYVISFHQIYKISRNQHSCFYF corresponding to amino acids 123-145 of T94936_PEA_1_P3, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2.T94936_PEA_1_P3の尾部をコ−ドする単離されたポリペプチドは、T94936_PEA_1_P3中の配列GMYVISFHQIYKISRNQHSCFYFに対して少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of T94936_PEA_1_P3 is at least 70% relative to the sequence GMYVISFHQIYKISRNQHSCFYF in T94936_PEA_1_P3, if necessary at least about 80%, preferably at least about 85%, more preferably at least Polypeptides that are about 90%, and most preferably at least about 95% homologous are included.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T94936_PEA_1_P3はまた、表6に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(アミノ酸配列上のそれらの位置に従って示され、その変更アミノ酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T94936_PEA_1_P3配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T94936_PEA_1_P3 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 6 (shown according to their position on the amino acid sequence and their altered amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein T94936_PEA_1_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T94936_PEA_1_P3は次の転写物にコ−ドされている:T94936_PEA_1_T2、これの配列は本明細書の最後に示している。転写物T94936_PEA_1_T2のコ−ディング部分は太字で示している;このコ−ディング部分は位置76から開始し、位置510で終止している。前記転写物は以下表7記載の非サイレントSNP(単一ヌクレオチド多形)を有する(ヌクレオチド配列上のそれらの位置に従って示され、その変更核酸が記載されている;最後の縦列はSNPが判明しているか否かを示している;変異体タンパク質T94936_PEA_1_P3配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T94936_PEA_1_P3 is encoded in the following transcript: T94936_PEA_1_T2, the sequence of which is given at the end of the specification. The coding portion of transcript T94936_PEA_1_T2 is shown in bold; this coding portion starts at position 76 and ends at position 510. The transcripts have non-silent SNPs (single nucleotide polymorphisms) listed below in Table 7 (shown according to their position on the nucleotide sequence and their modified nucleic acids are listed; the last column shows the SNP The presence of a known SNP within the mutant protein T94936_PEA_1_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のように、クラスタT94936は、上表2に記載され、その配列を本明細書の最後に示す12のセグメントを特徴とする。これらのセグメントは、特に関心の対象であることから、ここに別に記載する核酸配列の一部である。次に、本発明の各セグメントについて説明する。   As noted above, cluster T94936 is described in Table 2 above and is characterized by 12 segments whose arrangement is shown at the end of this specification. Since these segments are of particular interest, they are part of the nucleic acid sequences described separately here. Next, each segment of the present invention will be described.

本発明のセグメントクラスタT94936_PEA_1_node_14は1つのライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T49436_PEA_1_T2。下表8に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_14 of the present invention is supported by one library. Library numbers were determined as described above. This segment can be found in the following transcripts: T49436_PEA_1_T2. Table 8 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT94936_PEA_1_node_16は1つのライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T49436_PEA_1_T2。下表9に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_16 of the present invention is supported by one library. Library numbers were determined as described above. This segment can be found in the following transcripts: T49436_PEA_1_T2. Table 9 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT94936_PEA_1_node_2は65個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T94936_PEA_1_T1およびT49436_PEA_1_T2。下表10に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_2 of the present invention is supported by 65 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T94936_PEA_1_T1 and T49436_PEA_1_T2. Table 10 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT94936_PEA_1_node_20は146個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T49436_PEA_1_T2。下表11に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_20 of the present invention is supported by 146 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T49436_PEA_1_T2. Table 11 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT94936_PEA_1_node_23は2つのライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T49436_PEA_1_T1。下表12に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_23 of the present invention is supported by two libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T49436_PEA_1_T1. Table 12 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは長さが120bpでであることから、別に説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. Since these segments are 120 bp in length, they will be described separately.

本発明のセグメントクラスタT94936_PEA_1_node_0は32個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T94936_PEA_1_T1およびT49436_PEA_1_T2。下表13に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_0 of the present invention is supported by 32 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T94936_PEA_1_T1 and T49436_PEA_1_T2. Table 13 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT94936_PEA_1_node_11は61個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T94936_PEA_1_T1およびT49436_PEA_1_T2。下表14に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_11 of the present invention is supported by 61 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T94936_PEA_1_T1 and T49436_PEA_1_T2. Table 14 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT94936_PEA_1_node_13は50個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T94936_PEA_1_T1およびT49436_PEA_1_T2。下表15に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_13 of the present invention is supported by 50 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T94936_PEA_1_T1 and T49436_PEA_1_T2. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT94936_PEA_1_node_17は51個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T94936_PEA_1_T1およびT49436_PEA_1_T2。下表16に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_17 of the present invention is supported by 51 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T94936_PEA_1_T1 and T49436_PEA_1_T2. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT94936_PEA_1_node_6は74個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T94936_PEA_1_T1およびT49436_PEA_1_T2。下表17に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_6 of the present invention is supported by 74 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T94936_PEA_1_T1 and T49436_PEA_1_T2. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT94936_PEA_1_node_8は次の転写物に見出すことができる: T94936_PEA_1_T1およびT49436_PEA_1_T2。下表18に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_8 of the present invention can be found in the following transcripts: T94936_PEA_1_T1 and T49436_PEA_1_T2. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT94936_PEA_1_node_9は68個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T94936_PEA_1_T1およびT49436_PEA_1_T2。下表19に各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster T94936_PEA_1_node_9 of the present invention is supported by 68 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: T94936_PEA_1_T1 and T49436_PEA_1_T2. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名: /tmp/lR8BEXWutz/cdFRKHIcZR:Q8TD06
配列文書:
アラインメント:T94936_PEA_1_P2 x Q8TD06 ..
アラインメントセグメント 1/1:
クオリティ−:1486.00
Escore:0
一致長:150 全長:278
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEE 50
. . . . .
51 GLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNL 100
. . . . .
101 MHETTDKNLSPDGQYVPRIMFVDPSLTVRADIAGRYSNRLYTYEPRDLPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 MHETTDKNLSPDGQYVPRIMFVDPSLTVRADIAGRYSNRLYTYEPRDLPL 150
Alignment sequence of mutant protein with known protein: / tmp / lR8BEXWutz / cdFRKHIcZR: Q8TD06
Sequence document:
Alignment: T94936_PEA_1_P2 x Q8TD06 ..
Alignment segment 1/1:
Quality-: 1486.00
Escore: 0
Match length: 150 Total length: 278
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEE 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEE 50
...
51 GLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNL 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 GLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNL 100
...
101 MHETTDKNLSPDGQYVPRIMFVDPSLTVRADIAGRYSNRLYTYEPRDLPL 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 MHETTDKNLSPDGQYVPRIMFVDPSLTVRADIAGRYSNRLYTYEPRDLPL 150

配列名:/tmp/AG3unO0N3y/kjgGehygST:Q8TD06
配列文書:
アラインメント:T94936_PEA_1_P3 x Q8TD06 ..
アラインメントセグメント 1/1:
クオリティ−:1214.00
Escore:0
一致長:122 全長:122
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEE 50
. . . . .
51 GLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNL 100
. .
101 MHETTDKNLSPDGQYVPRIMFV 122
||||||||||||||||||||||
101 MHETTDKNLSPDGQYVPRIMFV 122
Sequence name: / tmp / AG3unO0N3y / kjgGehygST: Q8TD06
Sequence document:
Alignment: T94936_PEA_1_P3 x Q8TD06 ..
Alignment segment 1/1:
Quality: 1214.00
Escore: 0
Match length: 122 Total length: 122
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEE 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MMLHSALGLCLLLVTVSSNLAIAIKKEKRPPQTLSRGWGDDITWVQTYEE 50
...
51 GLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNL 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 GLFYAQKSKKPLMVIHHLEDCQYSQALKKVFAQNEEIQEMAQNKFIMLNL 100
..
101 MHETTDKNLSPDGQYVPRIMFV 122
||||||||||||||||||||||-
101 MHETTDKNLSPDGQYVPRIMFV 122

配列名T94936seg14に描かれたアンプリコンによって検出できる、正常および癌乳房組織でのヒト乳癌膜タンパク質11(BCMP11)T94936転写物の発現
seg14、T94936seg14アンプリコンならびにT94936seg14FおよびT94936seg14Rプライマ−によって、または従って検出可能なヒト乳癌膜タンパク質11(BCMP11)転写物の発現を、リアルタイムPCRを用いて測定した。この特異的な実施例では、リアルタイムPCRの反応効率は2であると考え、標準曲線反応(上記「リアルタイムRT−PCR分析」の項で詳述したような)を用いた計算は行わなかった。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルのアップレギュレ−ションの倍率を得た。
Expression of human breast cancer membrane protein 11 (BCMP11) T94936 transcript in normal and cancerous breast tissue, detectable by the amplicon depicted in SEQ ID T94936seg14
Expression of the human breast cancer membrane protein 11 (BCMP11) transcript detectable by seg14, T94936seg14 amplicon and T94936seg14F and T94936seg14R primers, or thus detectable, was measured using real-time PCR. In this specific example, the reaction efficiency of real-time PCR was considered to be 2, and calculations using standard curve reactions (as detailed in the section “Real-time RT-PCR analysis” above) were not performed. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured in the same manner. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of each sample up-regulation relative to the value was obtained.

図23は、正常サンプルに比べ癌乳房サンプルにおいて上記ヒト乳癌膜タンパク質11(BCMP11)転写物が過剰発現していることを示すヒストグラムである。   FIG. 23 is a histogram showing that the human breast cancer membrane protein 11 (BCMP11) transcript is overexpressed in cancer breast samples compared to normal samples.

図23から明らかなように、上記アンプリコンによって癌サンプル中に検出されるヒト乳癌膜タンパク質11(BCMP11)転写物の癌での発現は、非癌性サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)に比べて有意に高かった。特に28個の腺癌サンプルのうち17個に少なくとも5倍の過剰発現が見出された。   As is clear from FIG. 23, the expression of human breast cancer membrane protein 11 (BCMP11) transcript detected in cancer samples by the amplicon in cancer is shown in non-cancerous samples (sample numbers 56-60, 63-67). It was significantly higher than the above table 1 “Tissue sample of test panel”). In particular, at least 5-fold overexpression was found in 17 of 28 adenocarcinoma samples.

上記のように、統計学分析を行って、これらの結果の有意性を検証した。   Statistical analysis was performed as above to verify the significance of these results.

乳癌サンプルと正常組織サンプルとの比較において、上記アンプリコンによって検出できるヒト乳癌膜タンパク質11(BCMP11)転写物の発現レベル差のP値は、T検定により7.94E−02と決定された。   In a comparison between a breast cancer sample and a normal tissue sample, the P value of the expression level difference of the human breast cancer membrane protein 11 (BCMP11) transcript that can be detected by the amplicon was determined to be 7.94E-02 by T test.

5倍の過剰発現の閾値は、フィッシャ−の直接検定によって、癌と正常サンプルを6.74E−03のP値で識別することが見出された。上記の値は、結果の統計有意性を証明している。   A five-fold overexpression threshold was found to discriminate between cancer and normal samples with a P value of 6.74E-03 by Fisher's direct test. The above values prove the statistical significance of the results.

プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:T59832junc6−25−26Fフォワ−ドプライマ−;およびT59832junc6−25−26Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: Are: T59832junc6-25-26F forward primer; and T59832junc6-25-26R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する;例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:T94936seg14。
T94936seg14フォワ−ドプライマ−(配列番号:859):
TACAAAATTAGTAGAAATCAGCATTCTTGC
T94936seg14リバ−スプライマ−(配列番号:860):
TGTAGAACTAACAAGAGCTGATATTATTGGAT
T94936seg14アンプリコン(配列番号:861):
TACAAAATTAGTAGAAATCAGCATTCTTGCTTTTATTTTTAAATGCTAGTTCAAGTACTATTCTTTTTAAAGAGAAGTCATTTCTAATCCAATAATATCAGCTCTTGTTAGTTCTACA
The present invention also includes preferred amplicons obtained using preferred primers; for example, for the above experiments, the following amplicons are limited to non-limiting examples of preferred amplicons. Obtained at: T94936seg14.
T94936seg14 forward primer (SEQ ID NO: 859):
TACAAAATTAGTAGAAATCAGCATTCTTGC
T94936seg14 River Primer (SEQ ID NO: 860):
TGTAGAACTAACAAGAGCTGATATTATTGGAT
T94936seg14 amplicon (SEQ ID NO: 861):
TACAAAATTAGTAGAAATCAGCATTCTTGCTTTTATTTTTAAATGCTAGTTCAAGTACTATTCTTTTTAAAGAGAAGTCATTTCTAATCCAATAATATCAGCTCTTGTTAGTTCTACA

クラスタZ41644の説明
クラスタZ41644は、それぞれ表1および2にその名称を示し、配列自体は本明細書の最後に示した、関心の対象となる1つの転写物および21個のセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Description of cluster Z41644 Cluster Z41644 is named in Tables 1 and 2, respectively, and the sequence itself is characterized by one transcript of interest and 21 segments as shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は既知タンパク質である小型の誘導性サイトカインB14前駆体(SwissProtアクセッション識別子SZ14_HUMAN:同義語のCXCL14;ケモカインBRAKとしても知られる)、配列番号:230であり、ここでは既知タンパク質と呼ぶ。   These sequences are known inducible protein small inducible cytokine B14 precursor (SwissProt accession identifier SZ14_HUMAN: synonymous CXCL14; also known as chemokine BRAK), SEQ ID NO: 230, referred to herein as known protein.

小型誘導性サイトカインB14は次の機能を有することが知られているか、または有すると考えられている:T細胞、B細胞、単球、ナチュラルキラ−細胞または顆粒球に対しては非走化性。コロニ−形成アッセイにおいて骨髄性前駆細胞の増殖を阻害しない。タンパク質、小型誘導性サイトカインB14前駆体の配列は、本明細書の最後に「小型誘導性サイトカインB14前駆体アミノ酸配列」として示されている。タンパク質、小型誘導性サイトカインB14前駆体の局在は、分泌型と考えられている。   The small inducible cytokine B14 is known or believed to have the following functions: non-chemotactic for T cells, B cells, monocytes, natural killer cells or granulocytes . Does not inhibit proliferation of myeloid progenitor cells in colony formation assay. The sequence of the protein, the small inducible cytokine B14 precursor, is shown at the end of the specification as the “small inducible cytokine B14 precursor amino acid sequence”. The localization of the protein, the small inducible cytokine B14 precursor, is thought to be secreted.

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;走化性;シグナル伝達;細胞−細胞シグナル伝達、これらは生物学的プロセスに関係する注釈であり;ケモカイン、これは分子機能に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; chemotaxis; signaling; cell-cell signaling, these are annotations related to biological processes; chemokines, this are annotations related to molecular function .

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタZ414644は、癌での本クラスタ転写物の過剰発現による診断マ−カ−として用いることができる。このようような転写物の正常組織での発現も、前述の方法によって得られる。表、左手縦列の項目「数」および図24のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster Z414644 can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. In the table, the item “number” in the left hand column and the y-axis number in FIG. 24 are the weighted EST expression of each classification expressed in the form of “parts per million” (expressed in parts per million). , Ratio of EST expression of a specific cluster to expression of all ESTs of this classification).

全体として、図24のヒストグラムおよび表4に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);肺悪性腫瘍、乳房悪性腫瘍および膵臓癌。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 24 and Table 4. This cluster is overexpressed (at least at a minimal level) in the following pathological conditions: lung malignancies, breast malignancies and pancreatic cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

上記のように、クラスタZ41644は、上表1に記載の、1つの転写物を特徴とする。これら転写物は、タンパク質、小型誘導性サイトカインB14前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster Z41644 is characterized by one transcript, listed in Table 1 above. These transcripts code for proteins, proteins that are variants of the small inducible cytokine B14 precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質Z41644_PEA_1_P10は、本明細書最後に示すアミノ酸配列を有する;それは転写物Z41644_PEA_1_T5にコ−ドされている。本明細書最後に、既知タンパク質(小型誘導性サイトカインB14)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein Z41644_PEA_1_P10 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript Z41644_PEA_1_T5. At the end of this specification, an alignment to a known protein (small inducible cytokine B14) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

Z41644_PEA_1_P10とSZ14_HUMANの比較報告:
1. Z41644_PEA_1_P10をコ−ドする単離されたキメラポリペプチドは、SZ14_HUMANのアミノ酸1〜95に相当し、またZ41644_PEA_1_P10のアミノ酸1〜95にも相当するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRに少なくとも90%相同である第一アミノ酸配列、およびZ41644_PEA_1_P10のアミノ酸96〜123に相当するYAPPLLTFLPTRPSCGSQDGKGPPHQVIに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between Z41644_PEA_1_P10 and SZ14_HUMAN:
1. The isolated chimeric polypeptide that codes for Z41644_PEA_1_P10 corresponds to amino acids 1 to 95 of SZ14_HUMAN, and also corresponds to amino acids 1 to 95 of Z41644_PEA_1_P10, which is at least the first homologue of MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKLQ , And YAPPLLTFLPTRPSCGSQDGKGPPHQVI corresponding to amino acids 96-123 of Z41644_PEA_1_P10, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous It includes two amino acid sequences, wherein the first and second amino acid sequences are sequentially connected in sequence.

2. Z41644_PEA_1_P10の尾部をコ−ドする単離されたキメラポリペプチドは、Z41644_PEA_1_P10内の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated chimeric polypeptide that codes the tail of Z41644_PEA_1_P10 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI in Z41644_PEA_1_P10. %, And most preferably at least about 95% homologous polypeptide.

Z41644_PEA_1_P10とQ9NS21(配列番号:862)の比較報告:
1.Q Z41644_PEA_1_P10をコ−ドする単離されたキメラポリペプチドは、9NS21のアミノ酸13〜107に相当し、またZ41644_PEA_1_P10のアミノ酸1〜95にも相当するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRに少なくとも90%相同である第一アミノ酸配列、およびZ41644_PEA_1_P10のアミノ酸96〜123に相当する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between Z41644_PEA_1_P10 and Q9NS21 (SEQ ID NO: 862):
1.Q The isolated chimeric polypeptide that codes for Z41644_PEA_1_P10 is MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSNAQSQWH at least the first amino acid corresponding to amino acids 13 to 107 of 9NS21 and also to amino acids 1 to 95 of Z41644_PEA_1_P10 At least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95, and a polypeptide having the sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI corresponding to amino acids 96-123 of Z41644_PEA_1_P10 A second amino acid sequence that is% homologous, wherein the first and second amino acid sequences are sequentially connected in sequence.

2.Z41644_PEA_1_P10内の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む、Z41644_PEA_1_P10の尾部をコ−ドする単離されたキメラポリペプチド。   2.contains a polypeptide that is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably at least about 95% homologous to the sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI in Z41644_PEA_1_P10 An isolated chimeric polypeptide that codes the tail of Z41644_PEA_1_P10.

1. Z41644_PEA_1_P10をコ−ドする単離されたキメラポリペプチドは、AAQ89265のアミノ酸13〜107に相当し、またZ41644_PEA_1_P10のアミノ酸1〜95にも相当するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRに少なくとも90%相同である第一アミノ酸配列、およびZ41644_PEA_1_P10のアミノ酸96〜123に相当する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。   1. The isolated chimeric polypeptide that codes for Z41644_PEA_1_P10 corresponds to amino acids 13-107 of AAQ89265, and also corresponds to amino acids 1-95 of Z41644_PEA_1_P10, which is at least the first amino acid sequence of MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSNAQSQW , And a polypeptide having the sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI corresponding to amino acids 96-123 of Z41644_PEA_1_P10, at least 80%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. Z41644_PEA_1_P10の尾部をコ−ドする単離されたキメラポリペプチドは、Z41644_PEA_1_P10内の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIに少なくとも70%、要する場合は少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated chimeric polypeptide that codes the tail of Z41644_PEA_1_P10 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence YAPPLLTFLPTRPSCGSQDGKGPPHQVI in Z41644_PEA_1_P10. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質Z41644_PEA_1_P10はまた、表6に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質Z41644_PEA_1_P10配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein Z41644_PEA_1_P10 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 6 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein Z41644_PEA_1_P10 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質Z41644_PEA_1_P10は、次の転写物にコ−ドされている:Z41644_PEA_1_T5、この転写物の配列は本明細書の最後に示してある。転写物Z41644_PEA_1_T5のコ−ディング部分は太字で表している:このコ−ディング部分は、位置744から始まり、位置1112に終止する。転写物はまた、表7に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質Z41644_PEA_1_P10配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein Z41644_PEA_1_P10 is encoded in the following transcript: Z41644_PEA_1_T5, the sequence of this transcript is shown at the end of the specification. The coding part of transcript Z41644_PEA_1_T5 is shown in bold: this coding part starts at position 744 and ends at position 1112. The transcript also has the following SNPs listed in Table 7 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein Z41644_PEA_1_P10 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のように、クラスタZ41644は上表2に掲載され、その配列を本明細書の最後に示している21個のセグメントを特徴とする。これらセグメントは、それらが特に関心の対象であることから、ここに別に記載されている核酸配列の一部である。次に、本発明の各セグメントについて説明する。   As noted above, cluster Z41644 is listed in Table 2 above and is characterized by 21 segments whose arrangement is shown at the end of this specification. These segments are part of the nucleic acid sequences described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタZ41644_PEA_1_node_0は53個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表8に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_0 of the present invention is supported by 53 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 8 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_11は9個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表9に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_11 of the present invention is supported by nine libraries. Library numbers were determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 9 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_12は6個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表10に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_12 of the present invention is supported by six libraries. Library numbers were determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 10 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_15は23個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表11に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_15 of the present invention is supported by 23 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 11 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_20は260個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表12に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_20 of the present invention is supported by 260 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 12 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_24は185個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表13に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_24 of the present invention is supported by 185 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 13 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは、長さが約120bpまでであることから分けて説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are described separately because they are up to about 120 bp in length.

本発明のセグメントクラスタZ41644_PEA_1_node_1は53個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表14に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_1 of the present invention is supported by 53 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 14 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_10は138個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表15に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_10 of the present invention is supported by 138 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_13は次の転写物に見出すことができる:Z41644_PEA_1_T5。下表16に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_13 of the present invention can be found in the following transcript: Z41644_PEA_1_T5. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_16は152個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表17に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_16 of the present invention is supported by 152 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_17は次の転写物に見出すことができる:Z41644_PEA_1_T5。下表18に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_17 of the present invention can be found in the following transcript: Z41644_PEA_1_T5. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_19は112個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表19に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_19 of the present invention is supported by 112 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_2は58個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表20に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_2 of the present invention is supported by 58 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 20 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_21は次の転写物に見出すことができる:Z41644_PEA_1_T5。下表21に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_21 of the present invention can be found in the following transcript: Z41644_PEA_1_T5. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_22は164個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表22に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_22 of the present invention is supported by 164 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 22 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_23は169個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表23に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_23 of the present invention is supported by 169 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_25は138個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表24に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_25 of the present invention is supported by 138 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 24 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_3は75個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表25に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_3 of the present invention is supported by 75 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_4は61個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表26に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_4 of the present invention is supported by 61 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_6は101個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表27に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_6 of the present invention is supported by 101 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタZ41644_PEA_1_node_9は134個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:Z41644_PEA_1_T5。下表28に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster Z41644_PEA_1_node_9 of the present invention is supported by 134 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: Z41644_PEA_1_T5. Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント:
配列名:/tmp/p5SSvhT9Xp/HQeIMsUrfm:SZ14_HUMAN
配列文書:
アラインメント:Z41644_PEA_1_P10 x SZ14_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:953.00
Escore:0
一致長:95 全長:95
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||||||||
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
Mutant protein alignment with known proteins:
Sequence name: / tmp / p5SSvhT9Xp / HQeIMsUrfm: SZ14_HUMAN
Sequence document:
Alignment: Z41644_PEA_1_P10 x SZ14_HUMAN ..
Alignment segment 1/1:
Quality-: 953.00
Escore: 0
Match length: 95 Total length: 95
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
...
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||||-|||||||-||||-|||||||-||||||-||||||||-
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95

配列名:/tmp/p5SSvhT9Xp/HQeIMsUrfm:Q9NS21
配列文書:
アラインメント:Z41644_PEA_1_P10 x Q9NS21 ..
アラインメントセグメント 1/1:
クオリティ−:957.00
Escore:0
一致長:96 全長:96
一致パ−セント類似性:100.00 一致パ−セント同一性:98.96
全パ−セント類似性:100.00 全パ−セント同一性:98.96
ギャップ: 0
アラインメント:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 62
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRY 96
|||||||||||||||||||||||||||||||||||||||||||||:
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRF 108
Sequence name: / tmp / p5SSvhT9Xp / HQeIMsUrfm: Q9NS21
Sequence document:
Alignment: Z41644_PEA_1_P10 x Q9NS21 ..
Alignment segment 1/1:
Quality: 957.00
Escore: 0
Match length: 96 Total length: 96
Match Percent Similarity: 100.00 Match Percent Identity: 98.96
Total percent similarity: 100.00 Total percent identity: 98.96
Gap: 0
alignment:
...
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
13 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 62
...
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRY 96
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||||-|||||||-|||-||||||-||||-||||||-||||| be be
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRF 108

配列名:/tmp/p5SSvhT9Xp/HQeIMsUrfm:AAQ89265
配列文書:
アラインメント:Z41644_PEA_1_P10 x AAQ89265 ..
アラインメントセグメント 1/1:
クオリティ−:953.00
Escore:0
一致長:95 全長:95
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 62
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||||||||
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 107
Sequence name: / tmp / p5SSvhT9Xp / HQeIMsUrfm: AAQ89265
Sequence document:
Alignment: Z41644_PEA_1_P10 x AAQ89265 ..
Alignment segment 1/1:
Quality-: 953.00
Escore: 0
Match length: 95 Total length: 95
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
13 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 62
...
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||||-|||||||-||||-|||||||-||||||-||||||||-
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 107

クラスタM85491の説明
クラスタM85491は、それぞれの名称を表1および2に示し、また配列そのものは本明細書の最後に示している関心対象の2つの転写物および11個のセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Description of Cluster M85491 Cluster M85491 has its respective names shown in Tables 1 and 2, and the sequence itself is characterized by the two transcripts of interest and eleven segments shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は、既知タンパク質であるエフリンタイプBレセプタ−2[前駆体](SwissProtアクセッション識別子EPB2_HUMAN;同義語のEC 2.7.1.112;チロシン型キナ−ゼレセプタ−EPH−3;レセプタ−プロテイン−チロシンキナ−ゼHEK5;ERKとしても知られる)、配列番号:245の変異体であり、ここでは既知タンパク質と呼ぶ。   These sequences are the known protein ephrin type B receptor-2 [precursor] (SwissProt accession identifier EPB2_HUMAN; synonymous EC 2.7.1.112; tyrosine kinase receptor-EPH-3; receptor protein-tyrosine kinase; ZEK HEK5; also known as ERK), a variant of SEQ ID NO: 245, referred to herein as a known protein.

エフリンタイプBレセプタ−2[前駆体]は、次の機能を有することが知られている:エフリン−Bファミリ−のメンバ−のレセプタ−。タンパク質のエフリン乳癌および前立腺癌でのNES1に対し腫瘍抑制因子の役割を持つ。タンパク質、エフリンタイプBレセプタ−2[前駆体]の配列は、本明細書の最後に「エフリンタイプBレセプタ−2[前駆体]アミノ酸配列」として示してある。この配列について知られている多形を表4に示す。   Ephrin Type B Receptor-2 [Precursor] is known to have the following functions: Receptor of ephrin-B family members. The protein ephrin has a tumor suppressor role for NES1 in breast cancer and prostate cancer. The sequence of the protein, ephrin type B receptor-2 [precursor] is shown at the end of the specification as "Ephrin type B receptor-2 [precursor] amino acid sequence". Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質、エフリンタイプBレセプタ−2[前駆体]の局在は、I型膜タンパク質と考えられている。   The localization of the protein, ephrin type B receptor-2 [precursor] is considered a type I membrane protein.

既知タンパク質には次のGO注釈付けが用いられている。以下の注釈付けが見出されている;タンパク質アミノ酸リン酸化;膜貫通レセプタ−プロテインチロシンキナ−ゼシグナル伝達経路;神経発生、これらは生物学的プロセスに関係する注釈である;プロテインチロシンキナ−ゼ;レセプタ−;膜貫通エフリンレセプタ−;ATP結合;トランスフェラ−ゼ、これらは分子機能に関係する注釈付けである;そして膜内在性タンパク質、これらは細胞成分に関係する注釈付けである。   The following GO annotations are used for known proteins. The following annotations have been found; protein amino acid phosphorylation; transmembrane receptor-protein tyrosine kinase signaling pathways; neurogenesis, these are annotations related to biological processes; protein tyrosine kinases; Receptors; transmembrane ephrin receptors; ATP binding; transferases, these are annotations related to molecular function; and integral membrane proteins, these are annotations related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタM85491は、癌におけるこのクラスタの転写物の過剰発現による診断マ−カ−として用いることができる。このような転写物の正常組織での発現も、先述の方法によって得られる。表右側縦列の項「数」および図25のy軸の数は、「百万分の一」の形で表した各分類のESTの重み付け発現を表す(百万分の一で表した、その分類の全ESTの発現に対する特定クラスタのEST発現の比)。   Cluster M85491 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The term “number” in the column on the right side of the table and the number of y-axis in FIG. Ratio of EST expression of a specific cluster to expression of all ESTs in the classification).

全体として、図25のヒストグラムおよび表5で示すような、次の結果が得られた。このクラスタは次の病的状態で過剰発現している(少なくとも最低レベルで):上皮性悪性腫瘍および各種組織由来の混合型悪性腫瘍。   Overall, the following results were obtained as shown in the histogram of FIG. 25 and Table 5. This cluster is overexpressed (at least at the lowest level) in the following pathological conditions: epithelial malignancies and mixed malignancies from various tissues.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタM85491は、上表1に掲載した2つの転写物を特徴とする。これら転写物は、タンパク質のエフリンタイプBレセプタ−2[前駆体]の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As noted above, cluster M85491 is characterized by the two transcripts listed in Table 1 above. These transcripts code for proteins that are variants of the protein ephrin type B receptor-2 [precursor]. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質M85491_PEA_1_P13は、本明細書の最後に示したアミノ酸配列を有する;それは転写物M85491_PEA_1_T16にコ−ドされている。既知タンパク質(エフリンタイプBレセプタ−2[前駆体])とのアラインメントを本明細書の最後に示す。一もしくは複数の、これまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係を以下簡単に説明する:   The mutant protein M85491_PEA_1_P13 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript M85491_PEA_1_T16. An alignment with a known protein (Ephrin type B receptor-2 [precursor]) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

M85491_PEA_1_P13とEPB2_HUMANとの比較報告:
1. M85491_PEA_1_P13をコ−ドする単離されたキメラポリペプチドは、EPB2_HUMANのアミノ酸1〜476に相当し、またM85491_PEA_1_P13のアミノ酸1〜476にも相当するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGATNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDSGGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLAHTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVDSITLSWSQPDQPNGVILDYELQYYEKに少なくとも90%相同である第一アミノ酸配列、およびM85491_PEA_1_P13のアミノ酸477〜496に相当する配列VPIGWVLSPSPTSLRAPLPGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between M85491_PEA_1_P13 and EPB2_HUMAN:
1. M85491_PEA_1_P13 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 476 of EPB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGATNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDSGGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLAHTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVDSITLSWSQPDQPNGVILDYELQYYEK which also corresponds to amino acids 1 to 476 of M85491_PEA_1_P13 And a polypeptide having the sequence VPIGWVLSPSPTSLRAPLPG corresponding to amino acids 477-496 of M85491_PEA_1_P13, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, Most preferably, it comprises a second amino acid sequence that is at least 95% homologous, wherein said first and second amino acid sequences are connected sequentially in sequence.

2.M85491_PEA_1_P13の尾部をコ−ドする単離されたキメラポリペプチドは、M85491_PEA_1_P13内の配列VPIGWVLSPSPTSLRAPLPGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated chimeric polypeptide that encodes the tail of M85491_PEA_1_P13 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 85% to the sequence VPIGWVLSPSPTSLRAPLPG in M85491_PEA_1_P13. Polypeptides that are 90% and most preferably at least about 95% homologous are included.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると考えられている。変異体タンパク質M85491_PEA_1_P13は、次の転写物にコ−ドされている:M85491_PEA_1_T16、この転写物の配列は本明細書の最後に示してある。転写物M85491_PEA_1_T16のコ−ディング部分は太字で表している:このコ−ディング部分は、位置143から始まり、位置1630に終止する。転写物はまた、表7に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質M85491_PEA_1_P13配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is considered to be a secretory type. The mutant protein M85491_PEA_1_P13 is encoded in the following transcript: M85491_PEA_1_T16, the sequence of this transcript is given at the end of the specification. The coding portion of the transcript M85491_PEA_1_T16 is shown in bold: this coding portion starts at position 143 and ends at position 1630. The transcript also has the following SNPs listed in Table 7 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein M85491_PEA_1_P13 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質M85491_PEA_1_P14は、本明細書の最後に示したアミノ酸配列を有する;それは転写物M85491_PEA_1_T20にコ−ドされている。既知タンパク質(エフリンタイプBレセプタ−2[前駆体])とのアラインメントを本明細書の最後に示す。一もしくは複数の、これまでに公表されているタンパク質配列との、一もしくは複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、そのようなアラインメントを持つ各タンパク質との関係を以下簡単に説明する:   The mutant protein M85491_PEA_1_P14 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript M85491_PEA_1_T20. An alignment with a known protein (Ephrin type B receptor-2 [precursor]) is shown at the end of the specification. One or more alignments with one or more previously published protein sequences are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

M85491_PEA_1_P14とEPB2_HUMANとの比較報告:
1. M85491_PEA_1_P14をコ−ドする単離されたキメラポリペプチドは、EFB2_HUMANのアミノ酸1〜270に相当し、またM85491_PEA_1_P14のアミノ酸1〜270にも相当するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRに少なくとも90%相同である第一アミノ酸配列、およびM85491_PEA_1_P14のアミノ酸271〜301に相当する配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between M85491_PEA_1_P14 and EPB2_HUMAN:
1. M85491_PEA_1_P14 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 270 of EFB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCR which also corresponds to amino acids 1 to 270 of M85491_PEA_1_P14 And a polypeptide having the sequence ERQDLTMLSRLVLNSWPQMILPPQPPKVLEL corresponding to amino acids 271 to 301 of M85491_PEA_1_P14, at least 80%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are consecutively connected in sequence. The

2.M85491_PEA_1_P14の尾部をコ−ドする単離されたキメラポリペプチドは、M85491_PEA_1_P14内の配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated chimeric polypeptide that encodes the tail of M85491_PEA_1_P14 has at least 70%, if required at least about 80%, preferably at least about 85%, more preferably at least about 85% to the sequence ERQDLTMLSRLVLNSWPQMILPPQPPKVLEL in M85491_PEA_1_P14 Polypeptides that are 90% and most preferably at least about 95% homologous are included.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質M85491_PEA_1_P14は次の転写物にコ−ドされている:M85491_PEA_1_T20、この配列は本明細書の最後に示している。転写物M85491_PEA_1_T20のコ−ディング部分は太字で示している;このコ−ディング部分は位置143から始まり、位置1045に終止する。転写物は表8に記載する以下のSNP(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質M85491_PEA_1_P14配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein M85491_PEA_1_P14 is encoded in the following transcript: M85491_PEA_1_T20, the sequence of which is given at the end of the specification. The coding part of the transcript M85491_PEA_1_T20 is shown in bold; this coding part starts at position 143 and ends at position 1045. Transcripts are listed in the following SNPs listed in Table 8 (shown according to their nucleotide sequence position, then modified nucleic acids are listed; the last column indicates whether the SNP is known; The presence of a known SNP within the mutant protein M85491_PEA_1_P14 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のように、クラスタM85491は、上表2に記載し、またその配列を本明細書の最後に示した11個のセグメントを特徴とする。これらのセグメントは、それらが特に関心の対象であることからここに別々に記載する核酸配列の部分である。   As noted above, cluster M85491 is described in Table 2 above and is characterized by 11 segments whose sequences are shown at the end of this specification. These segments are part of the nucleic acid sequence described separately here because they are of particular interest.

本発明のセグメントクラスタM85491_PEA_1_node_0は5個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。下表9に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_0 of the present invention is supported by five libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: M85491_PEA_1_T16 and M85491_PEA_1_T20. Table 9 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM85491_PEA_1_node_13は6個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: M85491_PEA_1_T20。下表10に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_13 of the present invention is supported by six libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: M85491_PEA_1_T20. Table 10 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM85491_PEA_1_node_21は18個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: M85491_PEA_1_T16。下表12に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_21 of the present invention is supported by 18 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: M85491_PEA_1_T16. Table 12 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM85491_PEA_1_node_23は18個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: M85491_PEA_1_T16。下表13に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_23 of the present invention is supported by 18 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: M85491_PEA_1_T16. Table 13 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM85491_PEA_1_node_24は3個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: M85491_PEA_1_T16。下表14に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_24 of the present invention is supported by three libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: M85491_PEA_1_T16. Table 14 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM85491_PEA_1_node_8は25個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。下表15に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_8 of the present invention is supported by 25 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: M85491_PEA_1_T16 and M85491_PEA_1_T20. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM85491_PEA_1_node_9は20個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。下表17に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_9 of the present invention is supported by 20 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: M85491_PEA_1_T16 and M85491_PEA_1_T20. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは、長さが約120bpまでであることから分けて説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are described separately because they are up to about 120 bp in length.

本発明のセグメントクラスタM85491_PEA_1_node_10は17個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。下表18に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_10 of the present invention is supported by 17 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M85491_PEA_1_T16 and M85491_PEA_1_T20. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM85491_PEA_1_node_18は15個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:M85491_PEA_1_T16。下表19に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_18 of the present invention is supported by 15 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM85491_PEA_1_node_19は15個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:M85491_PEA_1_T16。下表20に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_19 of the present invention is supported by 15 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M85491_PEA_1_T16. Table 20 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM85491_PEA_1_node_6は11個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。下表21に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster M85491_PEA_1_node_6 of the present invention is supported by 11 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M85491_PEA_1_T16 and M85491_PEA_1_T20. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:/tmp/qfmsU9VtxS/DylcLC9j8v:EPB2_HUMAN
配列文書:
アラインメント:M85941_PEA_1_P13 x EPB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:4726.00
Escore:0
一致長:476 全長:476
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
. . . . .
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
. . . . .
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
. . . . .
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
. . . . .
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
. . . . .
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
. . . . .
301 TNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDS 350
. . . . .
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
. . . . .
401 HTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 HTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
. .
451 SITLSWSQPDQPNGVILDYELQYYEK 476
||||||||||||||||||||||||||
451 SITLSWSQPDQPNGVILDYELQYYEK 476
Alignment of mutant protein with known protein Sequence name: / tmp / qfmsU9VtxS / DylcLC9j8v: EPB2_HUMAN
Sequence document:
Alignment: M85941_PEA_1_P13 x EPB2_HUMAN ..
Alignment segment 1/1:
Quality-: 47260.00
Escore: 0
Match length: 476 Total length: 476
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
...
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
...
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
...
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
...
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
...
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
...
301 TNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDS 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 TNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDS 350
...
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
...
401 HTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 HTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
..
451 SITLSWSQPDQPNGVILDYELQYYEK 476
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
451 SITLSWSQPDQPNGVILDYELQYYEK 476

配列名:/tmp/rmnzuDbot6/GiHbjeU8iR:EPB2_HUMAN
配列文書:
アラインメント:M85491_PEA_1_P14 x EPB_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:2673.00
Escore:0
一致長:270 全長:270
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
. . . . .
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
. . . . .
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
. . . . .
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
. . . . .
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
. .
251 IGRCMCKAGFEAVENGTVCR 270
||||||||||||||||||||
251 IGRCMCKAGFEAVENGTVCR 270
Sequence name: / tmp / rmnzuDbot6 / GiHbjeU8iR: EPB2_HUMAN
Sequence document:
Alignment: M85491_PEA_1_P14 x EPB_HUMAN ..
Alignment segment 1/1:
Quality-: 2673.00
Escore: 0
Match length: 270 Length: 270
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
...
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
...
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
...
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
...
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
..
251 IGRCMCKAGFEAVENGTVCR 270
||||||||||||||||||||||-
251 IGRCMCKAGFEAVENGTVCR 270

配列名M85491seg24に描かれたアンプリコンによって検出できるエフリンタイプBレセプタ−2前駆体(EC2.7.1.112)(チロシンプロテインキナ−ゼレセプタ−EPH−3)M85491転写物の、正常および癌乳房組織での発現
seg24、M85491seg24アンプリコン、ならびにM85491seg24F M85491seg24Rプライマ−によって、または従って検出できるエフリンタイプBレセプタ−2前駆体(EC2.7.1.112)(チロシンプロテインキナ−ゼレセプタ−EPH−3)M85491転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルのアップレギュレ−ションの倍率を得た。
Ephrin Type B Receptor-2 Precursor (EC2.7.1.112) (Tyrosine Protein Kinase Receptor-EPH-3) M85491 Transcript Detectable by the Amplicon Depicted in SEQ ID NO: M85491seg24 in Normal and Cancer Breast Tissue Expression
seg24, M85491 seg24 amplicon, as well as the ephrin type B receptor-2 precursor (EC2.7.1.112) (tyrosine protein kinase receptor-EPH-3) M85491 transcript detectable by the M85491seg24F M85491seg24R primer, or thus Measurement was performed using real-time PCR. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured in the same manner. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of each sample up-regulation relative to the value was obtained.

図26は、正常サンプルと比較した時、癌乳房サンプルにおいて上記エフリンタイプBレセプタ−2前駆体(EC2.7.1.112)(チロシンプロテインキナ−ゼレセプタ−EPH−3)転写物が過剰発現していることを示すヒストグラムである。   FIG. 26 shows that the ephrin type B receptor-2 precursor (EC2.7.1.112) (tyrosine protein kinase receptor EPH-3) transcript is overexpressed in cancer breast samples when compared to normal samples. It is a histogram which shows that.

図26から明らかなように、上記アンプリコンによって癌サンプル中に検出できるエフリンタイプBレセプタ−2前駆体(EC2.7.1.112)(チロシンプロテインキナ−ゼレセプタ−EPH−3)転写物の癌での発現は、非癌性サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)に比べて有意に高かった。   As is clear from FIG. 26, the ephrin type B receptor-2 precursor (EC2.7.1.112) (tyrosine protein kinase receptor EPH-3) transcript that can be detected in cancer samples by the above amplicon in cancer. Expression was significantly higher compared to non-cancerous samples (sample numbers 56-60, 63-67, Table 1, “Tissue Sample of Test Panel” above).

プライマ−ペア−もまた、本発明に選択的および好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:M85491seg24Fフォワ−ドプライマ−;およびM85491seg24Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: M85491seg24F forward primer; and M85491seg24R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する;例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:M85491seg24。
M85491seg24フォワ−ドプライマ−(配列番号:864):GGCGTCTTTCTCCCTCTGAAC
M85491seg24リバ−スプライマ−(配列番号:865):GTCCCATTCTGGGTGCTGTG
M85491seg24アンプリコン(配列番号:866):GGCGTCTTTCTCCCTCTGAACCTCAGTTTCCACCTGTGTCGAGTGTGGGTGAGACCCCTCGCGGGGAGCTATGCAGGTTACGGAGAAAAGGCAGCACAGCACCCAGAATGGGAC
The present invention also includes preferred amplicons obtained using preferred primers; for example, for the above experiments, the following amplicons are limited to non-limiting examples of preferred amplicons. Obtained at: M85491seg24.
M85491seg24 forward primer (SEQ ID NO: 864): GGCGTCTTTCTCCCTCTGAAC
M85491seg24 River Primer (SEQ ID NO: 865): GTCCCATTCTGGGTGCTGTG
M85491seg24 amplicon (SEQ ID NO: 866): GGCGTCTTTCTCCCTCTGAACCTCAGTTTCCACCTGTGTCGAGTGTGGGTGAGACCCCTCGCGGGGAGCTATGCAGGTTACGGAGAAAAGGCAGCACAGCACCCAGAATGGGAC

配列名M85491seg24に描かれたアンプリコンによって検出できるエフリンタイプBレセプタ−2前駆体M85491転写物の、各種正常組織での発現
M85491seg24アンプリコン、ならびにM85491seg24FおよびM85491seg24Rプライマ−によって、または従って検出できるエフリンタイプBレセプタ−2前駆体転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−RPL19(GenBankアクセッション番号NM_000981;RPL19アンプリコン)、TATAボックス(GenBankアクセッション番号NM_003194;TATAアンプリコン)、UBC(GenBankアクセッション番号BC000449;アンプリコン−ユビキチンアンプリコン)およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現をハウスキ−ピング遺伝子量の相乗平均に対して正規化した。次に正規化した各RTサンプルの値を結腸サンプル(サンプル番号1〜3 上表2「正常パネルの組織サンプル」)中央値で除し、結腸サンプルの中央値に対する各サンプルの相対発現値を得た。プライマ−およびアンプリコンは上記の通りである。
Expression in various normal tissues of the ephrin type B receptor-2 precursor M85491 transcript detectable by the amplicon depicted in the sequence name M85491seg24
Expression of the ephrin type B receptor-2 precursor transcript, which can be detected by the M85491seg24 amplicon, and the M85491seg24F and M85491seg24R primers, or accordingly, was measured using real-time PCR. 4 types of housekeeping genes in parallel-RPL19 (GenBank accession number NM_000981; RPL19 amplicon), TATA box (GenBank accession number NM_003194; TATA amplicon), UBC (GenBank accession number BC000449; amplicon-ubiquitin) Amplicon) and SDHA (GenBank accession number NM_004168; amplicon-SDHA amplicon) were measured in the same manner. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of the colon sample (sample numbers 1-3 above, Table 2, “Tissue sample of normal panel”) to obtain the relative expression value of each sample relative to the median value of the colon sample. It was. Primers and amplicons are as described above.

配列名M85491seg24に描かれているアンプリコンによって検出できるエフリンタイプBレセプタ−2前駆体M85491転写物の、各種正常組織での発現を証明している結果を図27に示す。   FIG. 27 shows the results demonstrating the expression in various normal tissues of the ephrin type B receptor-2 precursor M85491 transcript that can be detected by the amplicon depicted in the sequence name M85491seg24.

クラスタHSSTROL3の説明
クラスタHSSTROL3は、それぞれ表1および2にその名称を示し、配列自体は本明細書の最後に示した、関心の対象となる6個の転写物および16個のセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Cluster HSSTROL3 description Cluster HSSTROL3 is named in Tables 1 and 2, respectively, and the sequence itself is characterized by the 6 transcripts and 16 segments of interest shown at the end of this specification. . Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は既知タンパク質であるストロメリシン3前駆体(SwissProtアクセッション識別子MM11_HUMAN:同義語のEC3.4.24.−;マトリックスメタロプロテイナ−ゼ−11、MMP−11;ST3;SL−3としても知られている)、配列番号:270であり、ここでは既知タンパク質と呼ぶ。   These sequences are also known as stromelysin 3 precursor (SwissProt accession identifier MM11_HUMAN: synonyms EC3.4.24.-; matrix metalloproteinase-11, MMP-11; ST3; SL-3 ), SEQ ID NO: 270, referred to herein as a known protein.

タンパク質、ストロメリシン3前駆体は次の機能を有することが知られているか、または有すると考えられている:おそらく上皮性悪性疾患の進行に重要な役割を果たしている。タンパク質、ストロメリシン3前駆体の配列は本明細書の最後に「ストロメリシン3前駆体アミノ酸配列」として示されている。   The protein, stromelysin 3 precursor, is known or believed to have the following functions: probably plays an important role in the progression of epithelial malignancies. The sequence of the protein, stromelysin 3 precursor, is shown at the end of the specification as the “stromelysin 3 precursor amino acid sequence”.

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;タンパク質分解およびペプチド分解;発生プロセス;形態形成、これらは生物学的プロセスに関係する注釈であり;ストロメリシン3;カルシウム結合;亜鉛結合;ヒドラ−ゼ、これは分子機能に関係する注釈付けであり;そして細胞外マトリックス、これは細胞成分に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; proteolysis and peptide degradation; developmental processes; morphogenesis, these are annotations related to biological processes; stromelysin 3; calcium binding; zinc binding; hydrase, this Is an annotation related to molecular function; and extracellular matrix, which is an annotation related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタHSSTROL3は、癌でのこのクラスタの転写物の過剰発現による診断マ−カ−として用いることができる。このようような転写物の正常組織での発現も、前述の方法によって得られる。表、左手縦列の項目「数」および図28のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster HSSTROL3 can be used as a diagnostic marker by overexpression of transcripts of this cluster in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. In the table, the item “number” in the left hand column and the y-axis number in FIG. 28 are the weighted EST expression for each classification expressed in the form of “parts per million” (expressed in parts per million). , Ratio of EST expression of a specific cluster to expression of all ESTs of this classification).

全体として、図28および表4のヒストグラムに関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);移行性上皮癌、上皮性悪性腫瘍、各種組織由来の混合型悪性腫瘍、および膵臓癌。   Overall, the following results were obtained as shown in relation to the histograms in FIG. 28 and Table 4. This cluster is overexpressed (at least at a minimal level) in the following pathological states: transitional cell carcinoma, epithelial malignancy, mixed malignancy from various tissues, and pancreatic cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタHSSTROL3は、上表1に記載の6個の転写物を特徴とする。これら転写物は、タンパク質ストロメリシン3前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster HSSTROL3 is characterized by the six transcripts listed in Table 1 above. These transcripts code for proteins that are variants of the protein stromelysin 3 precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質HSSTROL3_P4は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSSTROL3_T5にコ−ドされている。本明細書最後に、既知タンパク質(ストロメリシン−3前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HSSTROL3_P4 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSSTROL3_T5. At the end of this specification, an alignment to a known protein (Stromelysin-3 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HSSTROL3_P4とMM11_HUMANの比較報告:
1. HSSTROL3_P4をコ−ドする単離されたキメラポリペプチドは、MM11_HUMANのアミノ酸1〜163に相当し、またHSSTROL3_P4のアミノ酸1〜163にも相当するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWに少なくとも90%相同である第一アミノ酸配列、HSSTROL3_P4のアミノ酸164に相当する架橋アミノ酸H、MM11_HUMANのアミノ酸165〜445に相当し、またHSSTROL3_P4のアミノ酸165〜445にも相当するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKIYFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADGに少なくとも90%相同である第二アミノ酸配列、およびHSSTROL3_P4のアミノ酸446〜496に相当する配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、このとき前記アミノ酸配列、架橋アミノ酸、第二アミノ酸配列および第三アミノ酸配列は連続して順番につながっている。
Comparison report of HSSTROL3_P4 and MM11_HUMAN:
1. HSSTROL3_P4 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 163 of MM11_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYW which also corresponds to amino acids 1 to 163 of HSSTROL3_P4 , cross-linked amino acids H corresponding to amino acid 164 of HSSTROL3_P4, corresponds to amino acids 165-445 of MM11_HUMAN, also a second amino acid sequence that is at least 90% homologous to GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKIYFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG which also corresponds to amino acids 165-445 of HSSTROL3_P4, and HSSTROL3_P4 amino acids Array ALGVR equivalent to 446-496 A polypeptide having QLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAG comprising a third amino acid sequence that is at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous The amino acid sequence, the bridged amino acid, the second amino acid sequence, and the third amino acid sequence are sequentially connected in sequence.

2.HSSTROL3_P4の尾部をコ−ドする単離されたポリペプチドは、HSSTROL3_P4内の配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSSTROL3_P4 has at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAG in HSSTROL3_P4. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSSTROL3_P4はまた、表6に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSSTROL3_P4配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSSTROL3_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 6 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSSTROL3_P4 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSSTROL3_P4は、次の転写物にコ−ドされている:HSSTROL3_T5、この転写物の配列は本明細書の最後に示してある。転写物HSSTROL3_T5のコ−ディング部分は太字で表している:このコ−ディング部分は、位置24から始まり、位置1511に終止する。転写物はまた、表7に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSSTROL3_P4配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSSTROL3_P4 is encoded in the following transcript: HSSTROL3_T5, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSSTROL3_T5 is shown in bold: this coding part starts at position 24 and ends at position 1511. The transcript also has the following SNPs listed in Table 7 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSSTROL3_P4 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSSTROL3_P5は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSSTROL3_T8およびHSSTROL3_T9にコ−ドされている。本明細書最後に、既知タンパク質(ストロメリシン−3前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HSSTROL3_P5 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcripts HSSTROL3_T8 and HSSTROL3_T9. At the end of this specification, an alignment to a known protein (Stromelysin-3 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HSSTROL3_P5とMM11_HUMANの比較報告:
1. HSSTROL3_P5をコ−ドする単離されたキメラポリペプチドは、MM11_HUMANのアミノ酸1〜163に相当し、またHSSTROL3_P5のアミノ酸1〜163にも相当するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWに少なくとも90%相同である第一アミノ酸配列、HSSTROL3_P5のアミノ酸164に相当する架橋アミノ酸H、MM11_HUMANのアミノ酸165〜358に相当し、またHSSTROL3_P5のアミノ酸165〜358にも相当するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQに少なくとも90%相同である第二アミノ酸配列、およびHSSTROL3_P5のアミノ酸359〜382に相当する配列ELGFPSSTGRDESLEHCRCQGLHKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、このとき前記第一アミノ酸配列、架橋アミノ酸、第二アミノ酸配列および第三アミノ酸配列は、連続して順番につながっている。
Comparison report of HSSTROL3_P5 and MM11_HUMAN:
1. HSSTROL3_P5 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 163 of MM11_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYW which also corresponds to amino acids 1 to 163 of HSSTROL3_P5 , cross-linked amino acids H corresponding to amino acid 164 of HSSTROL3_P5, corresponds to amino acids 165-358 of MM11_HUMAN, also a second amino acid sequence that is at least 90% homologous to GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQ which also corresponds to amino acids 165-358 of HSSTROL3_P5, and HSSTROL3_P5 amino acids If a polypeptide with the sequence ELGFPSSTGRDESLEHCRCQGLHK corresponding to 359-382 requires at least 70% Comprises a third amino acid sequence that is at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous, wherein said first amino acid sequence, bridged amino acid, second amino acid sequence And the third amino acid sequence is connected sequentially in sequence.

2.HSSTROL3_P5の尾部をコ−ドする単離されたポリペプチドは、HSSTROL3_P5内の配列ELGFPSSTGRDESLEHCRCQGLHKに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HSSTROL3_P5 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, to the sequence ELGFPSSTGRDESLEHCRCQGLHK in HSSTROL3_P5. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSSTROL3_P5はまた、表8に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSSTROL3_P5配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSSTROL3_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 8 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSSTROL3_P5 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSSTROL3_P5は、次の転写物にコ−ドされている:HSSTROL3_T8およびHSSTROL3_T9、これらの転写物の配列は本明細書の最後に示してある。   The mutant protein HSSTROL3_P5 is coded in the following transcripts: HSSTROL3_T8 and HSSTROL3_T9, the sequences of these transcripts are given at the end of the specification.

転写物HSSTROL3_T8のコ−ディング部分は太字で表している:このコ−ディング部分は、位置24から始まり、位置1169に終止する。転写物はまた、表9に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSSTROL3_P5配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The coding part of the transcript HSSTROL3_T8 is shown in bold: this coding part starts at position 24 and ends at position 1169. The transcript also has the following SNPs listed in Table 9 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSSTROL3_P5 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

転写物HSSTROL3_T9のコ−ディング部分は太字で表している:このコ−ディング部分は、位置24から始まり、位置1169に終止する。転写物はまた、表10に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSSTROL3_P5配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The coding part of the transcript HSSTROL3_T9 is shown in bold: this coding part starts at position 24 and ends at position 1169. The transcript also has the following SNPs listed in Table 10 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSSTROL3_P5 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSSTROL3_P7は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSSTROL3_T10にコ−ドされている。本明細書最後に、既知タンパク質(ストロメリシン−3前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HSSTROL3_P7 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSSTROL3_T10. At the end of this specification, an alignment to a known protein (Stromelysin-3 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HSSTROL3_P7とMM11_HUMANの比較報告:
1. HSSTROL3_P7をコ−ドする単離されたキメラポリペプチドは、MM11_HUMANのアミノ酸1〜163に相当し、またHSSTROL3_P7のアミノ酸1〜163にも相当するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWに少なくとも90%相同である第一アミノ酸配列、HSSTROL3_P7のアミノ酸164に相当する架橋アミノ酸H、MM11_HUMANのアミノ酸165〜359に相当し、またHSSTROL3_P7のアミノ酸165〜359にも相当するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGに少なくとも90%相同である第二アミノ酸配列、およびHSSTROL3_P7のアミノ酸360〜370に相当する配列TTGVSTPAPGVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、このとき前記第一アミノ酸配列、架橋アミノ酸、第二アミノ酸配列および第三アミノ酸配列は、連続して順番につながっている。
Comparison report of HSSTROL3_P7 and MM11_HUMAN:
1. HSSTROL3_P7 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 163 of MM11_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYW which also corresponds to amino acids 1 to 163 of HSSTROL3_P7 , cross-linked amino acids H corresponding to amino acid 164 of HSSTROL3_P7, corresponds to amino acids 165-359 of MM11_HUMAN, also a second amino acid sequence that is at least 90% homologous to GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQG which also corresponds to amino acids 165-359 of HSSTROL3_P7, and HSSTROL3_P7 amino acids At least 70% of polypeptide with sequence TTGVSTPAPGV corresponding to 360-370, less if necessary Including a third amino acid sequence that is 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous, wherein said first amino acid sequence, bridging amino acid, second amino acid sequence and The third amino acid sequence is connected sequentially in sequence.

2.HSSTROL3_P7の尾部をコ−ドする単離されたポリペプチドは、HSSTROL3_P7内の配列TTGVSTPAPGVに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HSSTROL3_P7 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence TTGVSTPAPGV in HSSTROL3_P7. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSSTROL3_P7はまた、表11に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示す;変異体タンパク質HSSTROL3_P7配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSSTROL3_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 11 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSSTROL3_P7 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSSTROL3_P7は、次の転写物にコ−ドされている:HSSTROL3_T10、これらの転写物の配列は本明細書の最後に示してある。転写物HSSTROL3_T10のコ−ディング部分は太字で表している:このコ−ディング部分は、位置24から始まり、位置1133に終止する。転写物はまた、表12に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSSTROL3_P7配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSSTROL3_P7 is coded in the following transcript: HSSTROL3_T10, the sequence of these transcripts is given at the end of the specification. The coding part of the transcript HSSTROL3_T10 is shown in bold: this coding part starts at position 24 and ends at position 1133. The transcript also has the following SNPs listed in Table 12 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is known SNP) The presence of a known SNP in the mutant protein HSSTROL3_P7 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSSTROL3_P8は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSSTROL3_T11にコ−ドされている。本明細書最後に、既知タンパク質(ストロメリシン−3前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HSSTROL3_P8 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSSTROL3_T11. At the end of this specification, an alignment to a known protein (Stromelysin-3 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HSSTROL3_P8とMM11_HUMANの比較報告:
1. HSSTROL3_P8をコ−ドする単離されたキメラポリペプチドは、MM11_HUMANのアミノ酸1〜163に相当し、またHSSTROL3_P8のアミノ酸1〜163にも相当するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWに少なくとも90%相同である第一アミノ酸配列、HSSTROL3_P8のアミノ酸164に相当する架橋アミノ酸H、MM11_HUMANのアミノ酸165〜286に相当し、またHSSTROL3_P8のアミノ酸165〜286にも相当するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEに少なくとも90%相同である第二アミノ酸配列、およびHSSTROL3_P8のアミノ酸287〜301に相当する配列VRPCLPVPLLLCWPLを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、このとき前記第一アミノ酸配列、架橋アミノ酸、第二アミノ酸配列および第三アミノ酸配列は、連続して順番につながっている。
Comparison report of HSSTROL3_P8 and MM11_HUMAN:
1. HSSTROL3_P8 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 163 of MM11_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYW which also corresponds to amino acids 1 to 163 of HSSTROL3_P8 HSTROL3_P8 amino acid 164 cross-linked amino acid H, MM11_HUMAN amino acid 165-286 corresponding to HSSTROL3_P8 amino acid 165-286 GDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFY At least 70%, if necessary at least 80%, preferably at least 85%, more preferably a polypeptide having the sequence VRPCLPVPLLLCWPL corresponding to 287-301 Comprising a third amino acid sequence that is at least 90%, and most preferably at least 95% homologous, wherein said first amino acid sequence, bridging amino acid sequence, second amino acid sequence and third amino acid sequence are sequentially linked in sequence Yes.

2.HSSTROL3_P8の尾部をコ−ドする単離されたポリペプチドは、HSSTROL3_P8内の配列VRPCLPVPLLLCWPLに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HSSTROL3_P8 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence VRPCLPVPLLLCWPL in HSSTROL3_P8. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSSTROL3_P8はまた、表13に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示す;変異体タンパク質HSSTROL3_P8配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSSTROL3_P8 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 13 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSSTROL3_P8 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSSTROL3_P8は、次の転写物にコ−ドされている:HSSTROL3_T11、これらの転写物の配列は本明細書の最後に示してある。転写物HSSTROL3_T11のコ−ディング部分は太字で表している:このコ−ディング部分は、位置24から始まり、位置926に終止する。転写物はまた、表14に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSSTROL3_P8配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSSTROL3_P8 is encoded in the following transcripts: HSSTROL3_T11, the sequences of these transcripts are given at the end of the specification. The coding part of the transcript HSSTROL3_T11 is shown in bold: this coding part starts at position 24 and ends at position 926. The transcript also has the following SNPs listed in Table 14 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSSTROL3_P8 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSSTROL3_P9は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSSTROL3_T12にコ−ドされている。本明細書最後に、既知タンパク質(ストロメリシン−3前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HSSTROL3_P9 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSSTROL3_T12. At the end of this specification, an alignment to a known protein (Stromelysin-3 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HSSTROL3_P9とMM11_HUMANの比較報告:
1. HSSTROL3_P9をコ−ドする単離されたキメラポリペプチドは、MM11_HUMANのアミノ酸1〜96に相当し、またHSSTROL3_P9のアミノ酸1〜96にも相当するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKに少なくとも90%相同である第一アミノ酸配列、MM11_HUMANのアミノ酸113〜163に相当し、またHSSTROL3_P9のアミノ酸97〜147にも相当するRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWに少なくとも90%相同である第二アミノ酸配列、HSSTROL3_P9のアミノ酸148に相当する架橋アミノ酸H、MM11_HUMANのアミノ酸165〜359に相当し、またHSSTROL3_P9のアミノ酸149〜343にも相当するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGに少なくとも90%相同である第三アミノ酸配列、およびHSSTROL3_P9のアミノ酸344〜354に相当する配列TTGVSTPAPGVを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第四アミノ酸配列を含み、このとき前記第一アミノ酸配列、第二アミノ酸配列、架橋アミノ酸、第三アミノ酸配列および第四アミノ酸配列は連続して順番につながっている。
Comparison report of HSSTROL3_P9 and MM11_HUMAN:
1. The isolated chimeric polypeptide that codes for HSSTROL3_P9 is MAPAAWLRSAAARALLPPMLLLLLPPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPKSDGLN at the first amino acid sequence homologous to amino acids 1 to 96 of MM11_HUMAN and also amino acids 1 to 96 of HSSTROL3_P9 A second amino acid sequence that is at least 90% homologous to RILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYW corresponding to amino acids 113 to 163 of MM11_HUMAN and also amino acids 97 to 147 of HSSTROL3_P9, cross-linked amino acid H corresponding to amino acid 148 of HSSTROL3_P9, MM11165 GDLPFDGPGGILAH which is equivalent to ~ 359 and also corresponds to amino acids 149 to 343 of HSSTROL3_P9. And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence TTGVSTPAPGV corresponding to amino acids 344 to 354 of HSSTROL3_P9 Wherein the first amino acid sequence, the second amino acid sequence, the bridging amino acid, the third amino acid sequence and the fourth amino acid sequence are sequentially connected in sequence.

2. HSSTROL3_P9の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がKRを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号96−xから96のいずれかより開始し:アミノ酸番号97+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that codes for the edge of HSSTROL3_P9 has a length “n”, where n is at least about 10 amino acids long, and if necessary, at least about 20 amino acids long, preferably At least about 30 amino acids in length, more preferably at least about 40 amino acids in length, and most preferably at least about 50 amino acids in length, including a polypeptide in which at least two amino acids comprise KR and having the following structure: Starting from any of x to 96: a sequence ending at any of amino acid numbers 97 + ((n−2) −x), where x ranges from 0 to n−2.

3.HSSTROL3_P9の尾部をコ−ドする単離されたポリペプチドは、HSSTROL3_P9内の配列TTGVSTPAPGVに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   3.An isolated polypeptide that codes the tail of HSSTROL3_P9 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence TTGVSTPAPGV in HSSTROL3_P9. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSSTROL3_P9はまた、表15に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示す;変異体タンパク質HSSTROL3_P9配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSSTROL3_P9 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 15 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSSTROL3_P9 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSSTROL3_P9は、次の転写物にコ−ドされている:HSSTROL3_T12、これらの転写物の配列は本明細書の最後に示してある。転写物HSSTROL3_T12のコ−ディング部分は太字で表している:このコ−ディング部分は、位置24から始まり、位置1085に終止する。転写物はまた、表16に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSSTROL3_P9配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSSTROL3_P9 is encoded in the following transcripts: HSSTROL3_T12, the sequences of these transcripts are given at the end of the specification. The coding part of the transcript HSSTROL3_T12 is shown in bold: this coding part starts at position 24 and ends at position 1085. The transcript also has the following SNPs listed in Table 16 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known) The presence of a known SNP in the mutant protein HSSTROL3_P9 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

上記のように、クラスタHSSTROL3は、上表2に記載され、その配列を本明細書の最後に示している16個のセグメントを特徴とする。これらのセグメントは、特に関心の対象であることからここに別々に記している核酸配列の部分である。次に、本発明の各セグメントを説明する。   As noted above, cluster HSSTROL3 is characterized by the 16 segments listed in Table 2 above, the sequence of which is shown at the end of this specification. These segments are parts of the nucleic acid sequence which are separately noted here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタHSSTROL3_node_6は14個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。下表17に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_6 of the present invention is supported by 14 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_10は21個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。下表18に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_10 of the present invention is supported by 21 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_13は36個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。下表19に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_13 of the present invention is supported by 36 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_15は47個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。下表20に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_15 of the present invention is supported by 47 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 20 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_19は63個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。下表21に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_19 of the present invention is supported by 63 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_21は61個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。下表22に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_21 of the present invention is supported by 61 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 22 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_24は7個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSSTROL3_T8およびHSSTROL3_T9。下表23に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_24 of the present invention is supported by seven libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T8 and HSSTROL3_T9. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_25は13個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSSTROL3_T8。下表24に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_25 of the present invention is supported by 13 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T8. Table 24 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_26は55個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、およびHSSTROL3_T11。下表25に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_26 of the present invention is supported by 55 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, and HSSTROL3_T11. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_28は10個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSSTROL3_T5、HSSTROL3_T9、およびHSSTROL3_T10。下表26に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_28 of the present invention is supported by 10 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T9, and HSSTROL3_T10. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_29は109個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。下表27に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_29 of the present invention is supported by 109 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは、長さが約120bpまでであることから分けて説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are described separately because they are up to about 120 bp in length.

本発明のセグメントクラスタHSSTROL3_node_11は25個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、およびHSSTROL3_T11。下表28に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_11 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, and HSSTROL3_T11. Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_17は45個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。下表29に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_17 of the present invention is supported by 45 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 29 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_18は次の転写物に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。下表30に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_18 of the present invention can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 30 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_20は1つのライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは、次の転写物に見出すことができる: HSSTROL3_T11。下表31に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_20 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T11. Table 31 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSSTROL3_node_27は50個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。下表32に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSSTROL3_node_27 of the present invention is supported by 50 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSSTROL3_T5, HSSTROL3_T8, HSSTROL3_T9, HSSTROL3_T10, HSSTROL3_T11, and HSSTROL3_T12. Table 32 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント:
配列名:MM11_HUMAN
配列文書:
アラインメント:HSSTROL3_P4 x MM11_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:4444.00
Escore:0
一致長:445 全長:445
一致パ−セント類似性:99.78 一致パ−セント同一性:99.78
全パ−セント類似性:99.78 全パ−セント同一性:99.78
ギャップ: 0
アラインメント:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
. . . . .
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
. . . .
401 YFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG 445
|||||||||||||||||||||||||||||||||||||||||||||
401 YFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG 445
Mutant protein alignment with known proteins:
Array name: MM11_HUMAN
Sequence document:
Alignment: HSSTROL3_P4 x MM11_HUMAN ..
Alignment segment 1/1:
Quality-: 444.00
Escore: 0
Match length: 445 Total length: 445
Match Percent Similarity: 99.78 Match Percent Identity: 99.78
Total percent similarity: 99.78 Total percent identity: 99.78
Gap: 0
alignment:
...
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
...
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
...
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
...
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-||||||||||-||-||||-||||||||-||||-||||-||||-||||||||||| be be ignored
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
...
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
...
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
...
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
...
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
...
401 YFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG 445
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||||-|||||||-||||-|||||||-||||||-||||||||-
401 YFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG 445

配列名:MM11_HUMAN
配列文書:
アラインメント:HSSTROL3_P5 x MM11_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:3566.00
Escore:0
一致長:358 全長:358
一致パ−セント類似性:99.72 一致パ−セント同一性:99.72
全パ−セント類似性:99.72 全パ−セント同一性:99.72
ギャップ: 0
アラインメント:
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQ 358
||||||||
351 QGHIWFFQ 358
Array name: MM11_HUMAN
Sequence document:
Alignment: HSSTROL3_P5 x MM11_HUMAN ..
Alignment segment 1/1:
Quality-: 35.66.00
Escore: 0
Match length: 358 Total length: 358
Match Percent Similarity: 99.72 Match Percent Identity: 99.72
Total percent similarity: 99.72 Total percent identity: 99.72
Gap: 0
alignment:
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
...
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
...
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
...
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-||||||||||-||-||||-||||||||-||||-||||-||||-||||||||||| be be ignored
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
...
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
...
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
...
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQ 358
|||||||||
351 QGHIWFFQ 358

配列名:MM11_HUMAN
配列文書:
アラインメント:HSSTROL3_P7 x MM11_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:3575.00
Escore:0
一致長:359 全長:359
一致パ−セント類似性:99.72 一致パ−セント同一性:99.72
全パ−セント類似性:99.72 全パ−セント同一性:99.72
ギャップ: 0
アラインメント:
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQG 359
|||||||||
351 QGHIWFFQG 359
Array name: MM11_HUMAN
Sequence document:
Alignment: HSSTROL3_P7 x MM11_HUMAN ..
Alignment segment 1/1:
Quality: 3575.00
Escore: 0
Match length: 359 Total length: 359
Match Percent Similarity: 99.72 Match Percent Identity: 99.72
Total percent similarity: 99.72 Total percent identity: 99.72
Gap: 0
alignment:
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
...
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
...
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
...
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-||||||||||-||-||||-||||||||-||||-||||-||||-||||||||||| be be ignored
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
...
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
...
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
...
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQG 359
||||||||||
351 QGHIWFFQG 359

配列名:MM11_HUMAN
配列文書:
アラインメント:HSSTROL3_P8 x MM11_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:2838.00
Escore:0
一致長:286 全長:286
一致パ−セント類似性:99.65 一致パ−セント同一性:99.65
全パ−セント類似性:99.65 全パ−セント同一性:99.65
ギャップ: 0
アラインメント:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286
||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286
Array name: MM11_HUMAN
Sequence document:
Alignment: HSSTROL3_P8 x MM11_HUMAN ..
Alignment segment 1/1:
Quality-: 288.080
Escore: 0
Match length: 286 Total length: 286
Match Percent Similarity: 99.65 Match Percent Identity: 99.65
Total percent similarity: 99.65 Total percent identity: 99.65
Gap: 0
alignment:
...
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
...
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
...
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
...
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-||||||||||-||-||||-||||||||-||||-||||-||||-||||||||||| be be ignored
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
...
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
..
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||||||-
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286

配列名:MM11_HUMAN
配列文書:
アラインメント:HSSTROL3_P9 x MM11_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:3316.00
Escore:0
一致長:343 全長:359
一致パ−セント類似性:99.71 一致パ−セント同一性:99.71
全パ−セント類似性:95.26 全パ−セント同一性:95.26
ギャップ: 1
アラインメント:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQK.... 96
||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
97 ............RILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 134
||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
135 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 184
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
185 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 234
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
235 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 284
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
285 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 334
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

335 QGHIWFFQG 343
|||||||||
351 QGHIWFFQG 359
Array name: MM11_HUMAN
Sequence document:
Alignment: HSSTROL3_P9 x MM11_HUMAN ..
Alignment segment 1/1:
Quality-: 331.600
Escore: 0
Match length: 343 Total length: 359
Match Percent Similarity: 99.71 Match Percent Identity: 99.71
Total percent similarity: 95.26 Total percent identity: 95.26
Gap: 1
alignment:
...
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
...
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQK .... 96
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||||-||||-||||||-||||||-||||||-||||||-|||||||| be be
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
...
97 ............ RILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 134
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||||-
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
...
135 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 184
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-||||||||||-||-||||-||||||||-||||-||||-||||-||||||||||| be be ignored
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
...
185 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 234
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
...
235 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 284
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
...
285 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 334
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

335 QGHIWFFQG 343
||||||||||
351 QGHIWFFQG 359

配列名HSSTROL3seg24に描かれたアンプリコンによって検出できる、ストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)SL−3 HSSTROL3転写物の、正常および癌乳房組織での発現
seg24 HSSTROL3 seg24アンプリコンならびにHSSTROL3seg24FおよびHSSTROL3seg24Rプライマ−によって、または従って検出可能なストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)SL−3 HSSTROL3転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルのアップレギュレ−ションの倍率を得た。
Streamlicin-3 precursor (EC 3.4.24.-) (Matrix metalloproteinase-11) (MMP-11) (ST3) SL-3 HSSTROL3 transcript, detectable by the amplicon depicted in the sequence name HSSTROL3seg24 Of normal and cancerous breast tissue
seg24 HSSTROL3 seg24 amplicon and HSSTROL3 seg24F and HSSTROL3 seg24R primers or therefore detectable streamline-3 precursor (EC 3.4.24.-) (matrix metalloproteinase-11) (MMP-11) (ST3) SL −3 HSSTROL3 transcript expression was measured using real-time PCR. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured in the same manner. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of each sample up-regulation relative to the value was obtained.

図29Aは、正常サンプルに比べたとき、癌乳房サンプルにおいて上記ストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)(SL−3)転写物が過剰発現していることを示すヒストグラムである。値は二重に行った実験の平均値を表している。誤差バ−は、得られた最低値と最高値を示している。   FIG. 29A shows that in the cancer breast sample when compared to the normal sample, the above-mentioned stromelysin-3 precursor (EC 3.4.24.−) (matrix metalloproteinase-11) (MMP-11) (ST3) (SL− 3) A histogram showing that the transcript is overexpressed. Values represent the average of duplicate experiments. The error bar indicates the lowest value and the highest value obtained.

図29Aから明らかなように、上記アンプリコンによって癌サンプル中に検出されるストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)(SL−3)転写物の癌での発現は、非癌性サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)に比べて有意に高かった。特に28個の腺癌サンプルのうち20個において、少なくとも5倍の過剰発現が見出された。   As is clear from FIG. 29A, the stromelysin-3 precursor (EC 3.4.24.-) (matrix metalloproteinase-11) (MMP-11) (ST3) detected in cancer samples by the amplicon Expression of the (SL-3) transcript in cancer was significantly higher than in non-cancerous samples (sample numbers 56-60, 63-67, Table 1, “Tissue Sample of Test Panel” above). In particular, at least 5-fold overexpression was found in 20 of 28 adenocarcinoma samples.

以下記載のように、統計学的分析を行いこれらの結果の有意性を検証した。   Statistical analysis was performed to verify the significance of these results as described below.

上記アンプリコンによって検出できるストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)(SL−3)転写物の、乳癌サンプルと正常組織サンプルの発現レベルの差に関するP値は、T検定により6.46E−03に決定された。   Stromelysin-3 precursor (EC 3.4.24.-) (Matrix metalloproteinase-11) (MMP-11) (ST3) (SL-3) transcripts detectable with the above amplicons, normal and breast cancer samples The P value for the difference in expression level of the tissue samples was determined to 6.46E-03 by T test.

5倍の過剰発現の閾値は、フィッシャ−の直接検定によって、癌と正常サンプルを1.12E−03のP値で識別することが見出された。上記の値は、結果の統計有意性を証明している。プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:HSSTROL3seg24Fフォワ−ドプライマ−;およびHSSTROL3seg24Rリバ−スプライマ−。本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する;例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:HSSTROL3seg24。
HSSTROL3seg24フォワ−ドプライマ−(配列番号:867):ATTTCCATCCTCAACTGGCAGA
HSSTROL3seg24リバ−スプライマ−(配列番号:868):TGCCCTGGAACCCACG
HSSTROL3seg24アンプリコン(配列番号:869):ATTTCCATCCTCAACTGGCAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAAGGCACAGCATGGGAAACCTGCGTGGGTTCCAGGGCA
A 5-fold overexpression threshold was found to discriminate between cancer and normal samples with a P value of 1.12E-03 by Fisher's direct test. The above values prove the statistical significance of the results. Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: Has: HSSTROL3seg24F forward primer; and HSSTROL3seg24R river primer. The present invention also includes preferred amplicons obtained using preferred primers; for example, for the above experiments, the following amplicons are limited to non-limiting examples of preferred amplicons. Obtained in: HSSTROL3seg24.
HSSTROL3seg24 forward primer (SEQ ID NO: 867): ATTTCCATCCTCAACTGGCAGA
HSSTROL3seg24 River Primer (SEQ ID NO: 868): TGCCCTGGAACCCACG
HSSTROL3seg24 amplicon (SEQ ID NO: 869): ATTTCCATCCTCAACTGGCAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAAGGCACAGCATGGGAAACCTGCGTGGGTTCCAGGGCA

配列名HSSTROL3seg24に描かれたアンプリコンによって検出できる、ストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)(SL−3)HSSTROL3転写物の、各種正常組織での発現
HSSTROL3seg24アンプリコン、ならびにHSSTROL3seg24FおよびHSSTROL3seg24Rプライマ−によって、または従って検出できるストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)(SL−3)HSSTROL3転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−RPL19(GenBankアクセッション番号NM_000981;RPL19アンプリコン)、TATAボックス(GenBankアクセッション番号NM_003194;TATAアンプリコン)、UBC(GenBankアクセッション番号BC000449;アンプリコン−ユビキチンアンプリコン)およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現をハウスキ−ピング遺伝子量の相乗平均に対して正規化した。次に正規化した各RTサンプルの値を肺サンプル(サンプル番号15〜17 上表2「正常パネルの組織サンプル」)中央値で除し、肺サンプルの中央値に対する各サンプルの相対発現値を得た。プライマ−およびアンプリコンは上記の通りである。
Streamlicin-3 precursor (EC 3.4.24.-) (Matrix metalloproteinase-11) (MMP-11) (ST3) (SL-3) HSSTROL3, which can be detected by the amplicon depicted in the sequence name HSSTROL3seg24 Expression of transcripts in various normal tissues
HSSTROL3 seg24 amplicon, and streamline-3 precursor (EC 3.4.24.-) (matrix metalloproteinase-11) (MMP-11) (ST3) (SL-), which can be detected by or according to HSSTROL3seg24F and HSSTROL3seg24R primers 3) The expression of HSSTROL3 transcript was measured using real-time PCR. 4 types of housekeeping genes in parallel-RPL19 (GenBank accession number NM_000981; RPL19 amplicon), TATA box (GenBank accession number NM_003194; TATA amplicon), UBC (GenBank accession number BC000449; amplicon-ubiquitin) Amplicon) and SDHA (GenBank accession number NM_004168; amplicon-SDHA amplicon) were measured in the same manner. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of the lung sample (sample numbers 15 to 17 above, Table 2 “Tissue sample of normal panel”) to obtain the relative expression value of each sample relative to the median value of the lung sample. It was. Primers and amplicons are as described above.

配列名HSSTROL3seg24に描かれているアンプリコンによって検出できるストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)(SL−3)HSSTROL3転写物の、各種正常組織での発現を証明している結果を図29Bに示す。   Stromelysin-3 precursor (EC 3.4.24.-) (Matrix metalloproteinase-11) (MMP-11) (ST3) (SL-3) HSSTROL3 detectable by the amplicon depicted in the sequence name HSSTROL3seg24 The results demonstrating the expression of the transcript in various normal tissues are shown in FIG. 29B.

配列名HSSTROL3junc20−21に描かれたアンプリコンによって検出できる、ストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)SL−3 HSSTROL3転写物の、正常および癌乳房組織での発現
junc20−21、HSSTROL3junc20−21アンプリコン、ならびにプライマ−HSSTROL3junc20−21FおよびHSSTROL3junc20−21Rによって、または従って検出できるストロメリシン−3前駆体転写物の発現をリアルタムPCRによって測定した。この実験に関しては、RNAはClontech(Franklin Lakes, NJ USA 97417、www.clontech.com)、BioChain Inst. Inc(Hayward、CA 94545 USA www.biochain.com)、ABS(Wilmington, DE 19801, USA, www.absbioreagents.com)、卵巣サンプルに関するGOG−Pediatic Cooperative Human Tissue Network, Gynecologic Oncology Group Tissue Bank, Children Hospital of Columbus(Columbus OH 43205 USA)またはAmbion(Austin, TX 78744 USA, www.ambion.com)より得たことを言及しなければならない。あるいは、RNAは、TRI−Reagent(Molecular Research Center)を用いて、製造元の指示書に従い組織サンプルより生成した。組織およびRNAサンプルは、患者または検死体から得た。ト−タルRNAサンプルをDNaseI(Ambion)で処理した。
Streamlicin-3 precursor (EC 3.4.24.-) (Matrix metalloproteinase-11) (MMP-11) (ST3) SL-3 HSSTROL3, which can be detected by the amplicon depicted in the sequence name HSSTROL3junc20-21 Expression of transcripts in normal and cancerous breast tissue
Expression of the stromelysin-3 precursor transcript, which could be detected by junc20-21, HSSTROL3junc20-21 amplicon, and primers-HSSTROL3junc20-21F and HSSTROL3junc20-21R, or thus detectable, was measured by real-time PCR. For this experiment, RNA was Clontech (Franklin Lakes, NJ USA 97417, www.clontech.com), BioChain Inst. Inc (Hayward, CA 94545 USA www.biochain.com), ABS (Wilmington, DE 19801, USA, www absbioreagents.com), GOG-Pediatic Cooperative Human Tissue Network, Gynecologic Oncology Group Tissue Bank, Children Hospital of Columbus (Columbus OH 43205 USA) or Ambion (Austin, TX 78744 USA, www.ambion.com) I must mention that. Alternatively, RNA was generated from tissue samples using TRI-Reagent (Molecular Research Center) according to the manufacturer's instructions. Tissue and RNA samples were obtained from patients or autopsies. Total RNA samples were treated with DNaseI (Ambion).

平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルのアップレギュレ−ションの倍率を得た。   Four types of housekeeping genes in parallel—PBGD (GenBank accession number BC019323; amplicon—PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon—HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured in the same manner. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of each sample up-regulation relative to the value was obtained.

図30Aは、上記ストロメリシン−3前駆体転写物が正常サンプルに比べ癌乳房組織で過剰発現していることを示すヒストグラムである。   FIG. 30A is a histogram showing that the stromelysin-3 precursor transcript is overexpressed in cancer breast tissue compared to normal samples.

図30Aから明らかなように、上記アンプリコンによって検出されるストロメリシン−3前駆体転写物の発現は、非癌性サンプル(サンプル番号56〜60、63〜67、上記、表1:試験パネル中の組織サンプル)に比べ癌サンプルで有意に高かった。特に、28例の腺腫サンプル中13例に、少なくとも5倍の過剰発現が見出された。   As is apparent from FIG. 30A, the expression of stromelysin-3 precursor transcript detected by the amplicon is shown in non-cancerous samples (sample numbers 56-60, 63-67, above, Table 1: in the test panel). The cancer sample was significantly higher than the tissue sample. In particular, at least a 5-fold overexpression was found in 13 of 28 adenoma samples.

上記のように、統計学分析を行って、これらの結果の有意性を検証した。   Statistical analysis was performed as above to verify the significance of these results.

T検定によって、乳癌サンプルと正常組織サンプルとの比較において、上記アンプリコンによって検出できるストメリシン−3前駆体転写物の発現レベル差のP値は1.28E−02と決定された。   By comparing the breast cancer sample and the normal tissue sample by T test, the P value of the expression level difference of the stromelysin-3 precursor transcript that can be detected by the amplicon was determined to be 1.28E-02.

5倍の過剰発現の閾値は、フィッシャ−の直接検定によって、癌と正常サンプルを4.26E−02のP値で識別することが見出された。上記の値は、結果の統計有意性を証明している。   A five-fold overexpression threshold was found to discriminate between cancer and normal samples with a P-value of 4.26E-02 by Fisher's direct test. The above values prove the statistical significance of the results.

プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:HSSTROLjunc20−21Fフォワ−ドプライマ−;およびHSSTROLjunc20−21Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: Has: HSSTROLjunc20-21F forward primer; and HSSTROLjunc20-21R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する;例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:HSSTROLjunc20−21。
フォワ−ドプライマ−HSSTROLjunc20−21F(配列番号:870):TCTGCTGGCCACTGTGACTG
リバ−スプライマ−HSSTROLjunc20−21R(配列番号:871):GAAGAAAAAGAGCTCGCTCG
アンプリコンHSSTROLjunc20−21(配列番号:872):TCTGCTGGCCACTGTGACTGCAGCATATGCCCTCAGCATGTGTCCCTCTCTCCCACCCCAGCCAGACGCCCCGCCAGATGCCTGTGAGGCCTCCTTTGACGCGGTCTCCACCATCCGAGGCGAGCTCTTTTTCTTC
The present invention also includes preferred amplicons obtained using preferred primers; for example, for the above experiments, the following amplicons are limited to non-limiting examples of preferred amplicons. Obtained at: HSSTROLjunc 20-21.
Forward primer-HSSTROLjunc20-21F (SEQ ID NO: 870): TCTGCTGGCCACTGTGACTG
River primer HSSTROLjunc20-21R (SEQ ID NO: 871): GAAGAAAAAGAGCTCGCTCG
Amplicon HSSTROLjunc20-21 (SEQ ID NO: 872): TCTGCTGGCCACTGTGACTGCAGCATATGCCCTCAGCATGTGTCCCTCTCTCCCACCCCAGCCAGACGCCCCGCCAGATGCCTGTGAGGCCTCCTTTGACGCGGTCTCCACCATCCGAGGCGAGCTCTTTTTCTTC

配列名HSSTROL3junc21−27に描かれたアンプリコンによって検出できる、ストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)(SL−3) HSSTROL3転写物の、正常および癌乳房組織での発現
junc21−27、HSSTROL3junc21−27アンプリコン、ならびにプライマ−HSSTROL3junc21−27FおよびHSSTROL3junc21−27Rによって、または従って検出できるストロメリシン−3前駆体転写物の発現をリアルタムPCRによって測定した(RNAは上記実験と同様である)。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルのアップレギュレ−ションの倍率を得た。
Streamelin-3 precursor (EC 3.4.24.-) (Matrix metalloproteinase-11) (MMP-11) (ST3) (SL-3), which can be detected by the amplicon depicted in the sequence name HSSTROL3junc21-27 ) HSSTROL3 transcript expression in normal and cancerous breast tissue
The expression of stromelysin-3 precursor transcripts detected by junc21-27, HSSTROL3junc21-27 amplicon, and primers-HSSTROL3junc21-27F and HSSTROL3junc21-27R, or thus detectable, was measured by realtam PCR (RNA is similar to the above experiment) ). In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured in the same manner. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of each sample up-regulation relative to the value was obtained.

図30Bは、上記ストロメリシン−3前駆体転写物が正常サンプルに比べ癌乳房組織で過剰発現していることを示すヒストグラムである。   FIG. 30B is a histogram showing that the stromelysin-3 precursor transcript is overexpressed in cancer breast tissue compared to normal samples.

図30Bから明らかなように、上記アンプリコンによって検出されるストロメリシン−3前駆体転写物の発現は、非癌性サンプル(サンプル番号56〜60、63〜67、上記、表1:試験パネル中の組織サンプル)に比べ癌サンプルで有意に高かった。特に、28例の腺腫サンプル中20例について、少なくとも20倍の過剰発現が見出された。   As is apparent from FIG. 30B, the expression of stromelysin-3 precursor transcript detected by the amplicon is shown in non-cancerous samples (sample numbers 56-60, 63-67, above, Table 1: in the test panel). The cancer sample was significantly higher than the tissue sample. In particular, at least 20-fold overexpression was found in 20 of 28 adenoma samples.

上記のように統計学分析を行って、これらの結果の有意性を検証した。   Statistical analysis was performed as described above to verify the significance of these results.

T検定によって、乳癌サンプルと正常組織サンプルとの比較において、上記アンプリコンによって検出できるストメリシン−3前駆体転写物の発現レベル差のP値は5.98E−03と決定された。   By comparing the breast cancer sample with the normal tissue sample by T test, the P value of the expression level difference of the stromelysin-3 precursor transcript that can be detected by the amplicon was determined to be 5.98E-03.

20倍の過剰発現の閾値は、フィッシャ−の直接検定にかけたところ、癌と正常サンプルを3.66E−03のP値で識別することが見出された。上記の値は、結果の統計有意性を証明している。   A 20-fold overexpression threshold was found to discriminate between cancer and normal samples with a P-value of 3.66E-03 when subjected to Fisher's direct test. The above values prove the statistical significance of the results.

プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:HSSTROLjunc21−27Fフォワ−ドプライマ−;およびHSSTROLjunc21−27Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: Has: HSSTROLjunc21-27F forward primer; and HSSTROLjunc21-27R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する;例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:HSSTROLjunc21−27。
フォワ−ドプライマ−HSSTROLjunc21−27F(配列番号:873):ACATTTGGTTCTTCCAAGGGACTAC
リバ−スプライマ−HSSTROLjunc21−27R(配列番号:874):TCGATCTCAGAGGGCACCC
アンプリコンHSSTROLjunc21−27(配列番号:875):ACATTTGGTTCTTCCAAGGGACTACTGGCGTTTCCACCCCAGCACCCGGCGTGTAGACAGTCCCGTGCCCCGCAGGGCCACTGACTGGAGAGGGGTGCCCTCTGAGATCGA
The present invention also includes preferred amplicons obtained using preferred primers; for example, for the above experiments, the following amplicons are limited to non-limiting examples of preferred amplicons. Obtained at: HSSTROLjunc 21-27.
Forward primer-HSSTROLjunc21-27F (SEQ ID NO: 873): ACATTTGGTTCTTCCAAGGGACTAC
River primer HSSTROLjunc21-27R (SEQ ID NO: 874): TCGATCTCAGAGGGCACCC
Amplicon HSSTROLjunc21-27 (SEQ ID NO: 875): ACATTTGGTTCTTCCAAGGGACTACTGGCGTTTCCACCCCAGCACCCGGCGTGTAGACAGTCCCGTGCCCCGCAGGGCCACTGACTGGAGAGGGGTGCCCTCTGAGATCGA

配列名HSSTROL3seg25に描かれたアンプリコンによって検出できる、ストメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテイナ−ゼ−11)(MMP−11)(ST3)(SL−3) HSSTROL3転写物の、正常および癌乳房組織での発現
seg25、HSSTROL3junc21−27アンプリコン、ならびにプライマ−HSSTROL3junc21−27FおよびHSSTROL3junc21−27Rによって、または従って検出できるストロメリシン−3前駆体転写物の発現をリアルタムPCRによって測定した(RNAは上記実験と同様である)。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルのアップレギュレ−ションの倍率を得た。
Streamlicin-3 precursor (EC 3.4.24.-) (Matrix metalloproteinase-11) (MMP-11) (ST3) (SL-3) HSSTROL3, which can be detected by the amplicon depicted in the sequence name HSSTROL3seg25 Expression of transcripts in normal and cancerous breast tissue
Expression of stromelysin-3 precursor transcripts detectable by seg25, HSSTROL3junc21-27 amplicon, and primers-HSSTROL3junc21-27F and HSSTROL3junc21-27R, or thus detectable, was measured by Realtam PCR (RNA is similar to the above experiment). In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured in the same manner. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of each sample up-regulation relative to the value was obtained.

図30Cは、上記ストロメリシン−3前駆体転写物が正常サンプルに比べ癌乳房組織で過剰発現していることを示すヒストグラムである。   FIG. 30C is a histogram showing that the stromelysin-3 precursor transcript is overexpressed in cancer breast tissue compared to normal samples.

図30Cから明らかなように、上記アンプリコンによって検出されるストロメリシン−3前駆体転写物の発現は、非癌性サンプル(サンプル番号56〜60、63〜67、上記、表1:試験パネル中の組織サンプル)に比べ癌サンプルで有意に高かった。特に、28例の腺腫サンプル中20例について、少なくとも5倍の過剰発現が見出された。   As is apparent from FIG. 30C, the expression of stromelysin-3 precursor transcript detected by the amplicon is shown in non-cancerous samples (sample numbers 56-60, 63-67, above, Table 1: in the test panel). The cancer sample was significantly higher than the tissue sample. In particular, at least 5-fold overexpression was found in 20 of 28 adenoma samples.

上記のように統計学分析を行って、これらの結果の有意性を検証した。   Statistical analysis was performed as described above to verify the significance of these results.

T検定によって、乳癌サンプルと正常組織サンプルとの比較において、上記アンプリコンによって検出できるストメリシン−3前駆体転写物の発現レベル差のP値は5.79E−02と決定された。   By comparison with breast cancer samples and normal tissue samples by T-test, the P value of the expression level difference of the stromelysin-3 precursor transcript that can be detected by the amplicon was determined to be 5.79E-02.

5倍の過剰発現の閾値は、フィッシャ−の直接検定にかけたところ、癌と正常サンプルを6.75E−03のP値で識別することが見出された。上記の値は、結果の統計有意性を証明している。   A five-fold overexpression threshold was found to discriminate between cancer and normal samples with a P value of 6.75E-03 when subjected to Fisher's direct test. The above values prove the statistical significance of the results.

プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:HSSTROLseg25Fフォワ−ドプライマ−;およびHSSTROLseg25Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: Has: HSSTROLseg25F forward primer; and HSSTROLseg25R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する;例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:HSSTROLseg25。
フォワ−ドプライマ−HSSTROLseg25F(配列番号:876):CACTGCCCCAGCTTATCCC
リバ−スプライマ−HSSTROLseg25R(配列番号:877):CTCTCCCAGCCTCAGTTTCCT
アンプリコンHSSTROLseg25(配列番号:878):CACTGCCCCAGCTTATCCCAGGCCTCCCGCTTCCCTCTGCGGGTGGGGTGCTGAGCAGGCATTATTGGCCTGCATGTTTTACTGATGAGGAAACTGAGGCTGGGAGAG
The present invention also includes preferred amplicons obtained using preferred primers; for example, for the above experiments, the following amplicons are limited to non-limiting examples of preferred amplicons. Obtained at: HSSTROLseg25.
Forward primer-HSSTROLseg25F (SEQ ID NO: 876): CACTGCCCCAGCTTATCCC
River primer-HSSTROLseg25R (SEQ ID NO: 877): CTCTCCCAGCCTCAGTTTCCT
Amplicon HSSTROLseg25 (SEQ ID NO: 878): CACTGCCCCAGCTTATCCCAGGCCTCCCGCTTCCCTCTGCGGGTGGGGTGCTGAGCAGGCATTATTGGCCTGCATGTTTTACTGATGAGGAAACTGAGGCTGGGAGAG

クラスタAY180924の説明
クラスタAY180924は、それぞれ表1および2にその名称を示し、配列自体は本明細書の最後に示した、関心の対象となる1つの転写物および3個のセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Description of Cluster AY180924 Cluster AY180924 is named in Tables 1 and 2, respectively, and the sequence itself is characterized by one transcript of interest and three segments as shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は既知タンパク質であるラセリン(Latherin)前駆体(SwissProtアクセッション識別子LATH_HUMAN:同義語の乳癌および唾液腺発現タンパク質としても知られる)、配列番号:280であり、ここでは既知タンパク質と呼ぶ。   These sequences are the known protein Latherin precursor (SwissProt accession identifier LATH_HUMAN, also known as synonymous breast cancer and salivary gland expressed protein), SEQ ID NO: 280, referred to herein as the known protein.

タンパク質、ラセリン前駆体は次の機能を有することが知られているか、または有すると考えられている:界面活性特性。タンパク質、ラセリン前駆体の配列は本明細書の最後に「ラセリン前駆体アミノ酸配列」として示されている。タンパク質、ラセリン前駆体の局在は分泌型と考えられている。   Proteins, lacerine precursors are known or believed to have the following functions: surfactant properties. The sequence of the protein, racerin precursor, is shown at the end of the specification as the “racerin precursor amino acid sequence”. The localization of the protein and racerin precursor is considered to be secreted.

上記のように、クラスタAY180924は、上表1に記載の1つの転写物を特徴とする。これら転写物は、タンパク質、ラセリン前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster AY180924 is characterized by one transcript listed in Table 1 above. These transcripts code for proteins, proteins that are mutants of the racerin precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質AY180924_PEA_1_P3は、本明細書最後に示すアミノ酸配列を有する;それは転写物AY180924_PEA_1_T1にコ−ドされている。本明細書最後に、既知タンパク質(ラセリン前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein AY180924_PEA_1_P3 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript AY180924_PEA_1_T1. At the end of this specification, an alignment to a known protein (racerin precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

AY180924_PEA_1_P3とLATH_HUMANの比較報告:
1.AY180924_PEA_1_P3をコ−ドする単離されたキメラポリペプチドは、LATH_HUMANのアミノ酸1〜33に相当し、またAY180924_PEA_1_P3のアミノ酸1〜33にも相当するMLNVSGLFVLLCGLLVSSSAQEVLAGVSSQLLNに少なくとも90%相同である第一アミノ酸配列、およびAY180924_PEA_1_P3のアミノ酸34〜64に相当する配列GETVLLWVMQNPEPMPVKFSLAKYLGHNEHYを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して、順番につながっている。
Comparison report between AY180924_PEA_1_P3 and LATH_HUMAN:
1. The isolated chimeric polypeptide that codes for AY180924_PEA_1_P3 is the first amino acid sequence that is at least 90% homologous to MLNVSGLFVLLCGLLVSSSAQEVLAGVSSQLLN corresponding to amino acids 1-33 of LATH_HUMAN and also corresponding to amino acids 1-33 of AY180924_PEA_1_P3 , And a polypeptide having the sequence GETVLLWVMQNPEPMPVKFSLAKYLGHNEHY corresponding to amino acids 34-64 of AY180924_PEA_1_P3, at least 80%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are contiguous and sequentially connected.

2.AY180924_PEA_1_P3の尾部をコ−ドする単離されたポリペプチドは、AY180924_PEA_1_P3内の配列GETVLLWVMQNPEPMPVKFSLAKYLGHNEHYに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of AY180924_PEA_1_P3 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% in the sequence GETVLLWVMQNPEPMPVKFSLAKYLGHNEHY within AY180924_PEA_1_P3. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質AY180924_PEA_1_P3は次の転写物にコ−ドされている:AY180924_PEA_1_T1、その配列は本明細書の最後に示した。転写物AY180924_PEA_1_T1のコ−ディング部位は太字で示している;このコ−ディング部位は位置73に始まり、位置264に終止する。転写物はまた表4に掲載する、以下のSNPを有している(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質AY180924_PEA_1_P3配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein AY180924_PEA_1_P3 is encoded in the following transcript: AY180924_PEA_1_T1, the sequence of which is given at the end of this specification. The coding site of transcript AY180924_PEA_1_T1 is shown in bold; this coding site starts at position 73 and ends at position 264. The transcript also has the following SNPs listed in Table 4 (shown according to their amino acid sequence position, then the modified amino acids are listed; last column is SNP known? The presence of a known SNP within the mutant protein AY180924_PEA_1_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のように、クラスタAY180924は上表2に掲載され、その配列を本明細書の最後に示している3個のセグメントを特徴とする。これらセグメントは、それらが特に関心の対象であることから、ここに別に記載されている核酸配列の一部である。次に、本発明の各セグメントについて説明する。   As noted above, cluster AY180924 is listed in Table 2 above and is characterized by three segments whose arrangement is shown at the end of this specification. These segments are part of the nucleic acid sequences described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタAY180924_PEA_1_node_3は2個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AY180924_PEA_1_T1。下表5に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster AY180924_PEA_1_node_3 of the present invention is supported by two libraries. Library numbers were determined as described above. This segment can be found in the following transcript: AY180924_PEA_1_T1. Table 5 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは、長さが約120bpまでであることから分けて説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are described separately because they are up to about 120 bp in length.

本発明のセグメントクラスタAY180924_PEA_1_node_1は2個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AY180924_PEA_1_T1。下表6に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster AY180924_PEA_1_node_1 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AY180924_PEA_1_T1. Table 6 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタAY180924_PEA_1_node_2は2個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:AY180924_PEA_1_T1。下表7に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster AY180924_PEA_1_node_2 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: AY180924_PEA_1_T1. Table 7 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:/tmp/FepOCusBjG/YVh7Ev127H:LATH_HUMAN
配列文書:
アラインメント:AY189024_PEA_1_P3 x LATH_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:300.00
Escore:0
一致長:33 全長:33
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:10.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . .
1 MLNVSGLFVLLCGLLVSSSAQEVLAGVSSQLLN 33
|||||||||||||||||||||||||||||||||
1 MLNVSGLFVLLCGLLVSSSAQEVLAGVSSQLLN 33
Alignment sequence of mutant protein with known protein: / tmp / FepOCusBjG / YVh7Ev127H: LATH_HUMAN
Sequence document:
Alignment: AY189024_PEA_1_P3 x LATH_HUMAN ..
Alignment segment 1/1:
Quality-: 300.00
Escore: 0
Match length: 33 Total length: 33
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 10.00 Total percent identity: 100.00
Gap: 0
alignment:
..
1 MLNVSGLFVLLCGLLVSSSAQEVLAGVSSQLLN 33
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
1 MLNVSGLFVLLCGLLVSSSAQEVLAGVSSQLLN 33

クラスタR75793の説明
クラスタR75793は、それぞれ表1および2にその名称を示し、配列自体は本明細書の最後に示した、関心の対象となる3つの転写物および9個のセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Cluster R75793 Description Cluster R75793 is named in Tables 1 and 2, respectively, and the sequence itself is characterized by the three transcripts of interest and nine segments shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

クラスタR75793は、癌での本クラスタ転写物の過剰発現によった診断マ−カ−として用いることができる。このような転写物の正常組織での発現もまた前述の方法によって得られる。表左手縦列の項目「数」および図31のy軸の数字は、「百万分の一」で表した各分類のESTの重み付き発現(百万分の一で表したその分類の全ESTの発現に対する特定クラスタのEST発現の比)を表す。   Cluster R75793 can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The item “number” in the left column of the table and the y-axis number in FIG. 31 are the weighted expression of each category's EST expressed in “parts per million” (all ESTs in that category expressed in parts per million) The ratio of the EST expression of a specific cluster to the expression of.

全体として、図31のヒストグラムおよび表4に関係して示すような、以下の結果を得た。このクラスタは次の病的状態で過剰発現している(少なくとも最小レベルで):上皮悪性腫瘍および各種組織由来の混合型悪性腫瘍。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 31 and Table 4. This cluster is overexpressed (at least at the lowest level) in the following pathological conditions: epithelial malignancies and mixed malignancies from various tissues.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のようにクラスタR75793は、表1に記載した3つの転写物を特徴とする。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster R75793 is characterized by the three transcripts listed in Table 1. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質R75793_PEA_1_P2は、本明細書の最後に示すアミノ酸配列を有している;それは転写物R75793_PEA_1_T1にコ−ドされている。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。次に、このようなアラインメントを取ったタンパク質と、本発明の変異体タンパク質との関係について簡単に説明する:   The mutant protein R75793_PEA_1_P2 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript R75793_PEA_1_T1. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. Next, the relationship between the protein having such an alignment and the mutant protein of the present invention will be briefly described:

R75793_PEA_1_P2とQ96DR8(配列番号:294)との比較報告
1.R75793_PEA_1_P2をコ−ドする単離されたキメラポリペプチドは、Q96DR8のアミノ酸1〜74に相当し、またR75793_PEA_1_P2のアミノ酸1〜74にも相当するMKFLAVLVLLGVSIFLVSAQNPTTAAPADTYPATGPADDEAPDAETTAAATTATTAAPTTATTAASTTARKDIPに少なくとも90%相同である第一アミノ酸配列、およびR75793_PEA_1_P2のアミノ酸75〜76に相当する配列APを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between R75793_PEA_1_P2 and Q96DR8 (SEQ ID NO: 294)
1.An isolated chimeric polypeptide that codes for R75793_PEA_1_P2 corresponds to amino acids 1 to 74 of Q96DR8 and also corresponds to amino acids 1 to 74 of R75793_PEA_1_P2 and is at least 90% of the first amino acid sequence at homologous sequence MKFLAVLVLLGVSIFLVSAQNPTTAAPADTYPATGPADDEAPDAETTAAATTATTAAPTTATTAASTTARKDIP And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% of the polypeptide having the sequence AP corresponding to amino acids 75-76 of R75793_PEA_1_P2 A second amino acid sequence that is homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質R75793_PEA_1_P2は次の転写物にコ−ドされている:R75793_PEA_T1、その配列は本明細書の最後に示してある。転写物R75793_PEA_1_T1のコ−ディング部分は太字で表している;このコ−ディング部分は位置69から始まり、位置296で終止する。転写物はまた表6に掲載する、次のSNPを有する(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R75793_PEA_1_P2配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein R75793_PEA_1_P2 is encoded in the following transcript: R75793_PEA_T1, the sequence of which is given at the end of the specification. The coding portion of transcript R75793_PEA_1_T1 is shown in bold; this coding portion starts at position 69 and ends at position 296. The transcript also has the following SNPs listed in Table 6 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column indicates whether the SNP is known or not The presence of a known SNP within the mutant protein R75793_PEA_1_P2 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質R75793_PEA_1_P5は、本明細書の最後に示したアミノ酸配列を有する;それは転写物R75793_PEA_1_T5にコ−ドされている。変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   The mutant protein R75793_PEA_1_P5 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript R75793_PEA_1_T5. Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質R75793_PEA_1_P5はまた、表7に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R75793_PEA_1_P5配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Variant protein R75793_PEA_1_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein R75793_PEA_1_P5 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質R75793_PEA_1_P5は、次の転写物にコ−ドされている:R75793_PEA_1_T5、この転写物の配列は本明細書の最後に示してある。転写物R75793_PEA_1_T5のコ−ディング部分は太字で表している:このコ−ディング部分は位置69から始まり、位置383に終止する。転写物はまた、表8に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R75793_PEA_1_P10配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein R75793_PEA_1_P5 is encoded in the following transcript: R75793_PEA_1_T5, the sequence of this transcript is given at the end of the specification. The coding part of the transcript R75793_PEA_1_T5 is shown in bold: this coding part starts at position 69 and ends at position 383. The transcript also has the following SNPs listed in Table 8 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein R75793_PEA_1_P10 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質R75793_PEA_1_P6は、本明細書の最後に示したアミノ酸配列を有する;それは転写物R75793_PEA_1_T3にコ−ドされている。変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   The mutant protein R75793_PEA_1_P6 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript R75793_PEA_1_T3. Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質R75793_PEA_1_P6はまた、表9に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R75793_PEA_1_P6配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein R75793_PEA_1_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 9 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein R75793_PEA_1_P6 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質R75793_PEA_1_P6は、次の転写物にコ−ドされている:R75793_PEA_1_T3、この転写物の配列は本明細書の最後に示してある。転写物R75793_PEA_1_T3のコ−ディング部分は太字で表している:このコ−ディング部分は位置329から始まり、位置502に終止する。転写物はまた、表10に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R75793_PEA_1_P6配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein R75793_PEA_1_P6 is encoded in the following transcript: R75793_PEA_1_T3, the sequence of this transcript is given at the end of the specification. The coding part of the transcript R75793_PEA_1_T3 is shown in bold: this coding part starts at position 329 and ends at position 502. The transcript also has the following SNPs listed in Table 10 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein R75793_PEA_1_P6 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のようにクラスタR75793は上表2に記載し、その配列を本明細書の最後に示している9個のセグメントを特徴とする。これらセグメントは、特に関心の対象であることからここで別々に記載されている核酸配列の部分である。次に、本発明の各セグメントについて説明する。   As noted above, cluster R75793 is described in Table 2 above and is characterized by nine segments whose sequence is shown at the end of this specification. These segments are part of the nucleic acid sequence described separately here because of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタR75793_PEA_1_node_0は2つのライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R75793_PEA_1_T3。下表11に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R75793_PEA_1_node_0 of the present invention is supported by two libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R75793_PEA_1_T3. Table 11 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR75793_PEA_1_node_9は1個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R75793_PEA_1_T5。下表12に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R75793_PEA_1_node_9 of the present invention is supported by one library. Library numbers were determined as described above. This segment can be found in the following transcript: R75793_PEA_1_T5. Table 12 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR75793_PEA_1_node_11は59個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R75793_PEA_1_T1およびR75793_PEA_1_T3。下表13に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R75793_PEA_1_node_11 of the present invention is supported by 59 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: R75793_PEA_1_T1 and R75793_PEA_1_T3. Table 13 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR75793_PEA_1_node_14は41個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R75793_PEA_1_T1およびR75793_PEA_1_T3。下表14に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R75793_PEA_1_node_14 of the present invention is supported by 41 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: R75793_PEA_1_T1 and R75793_PEA_1_T3. Table 14 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは長さが約120bpまでであることから、別に記載する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they are described separately.

本発明のセグメントクラスタR75793_PEA_1_node_4は46個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R75793_PEA_1_T1およびR75793_PEA_1_T5。下表15に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R75793_PEA_1_node_4 of the present invention is supported by 46 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: R75793_PEA_1_T1 and R75793_PEA_1_T5. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR75793_PEA_1_node_5は52個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R75793_PEA_1_T1およびR75793_PEA_1_T5。下表16に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R75793_PEA_1_node_5 of the present invention is supported by 52 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: R75793_PEA_1_T1 and R75793_PEA_1_T5. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR75793_PEA_1_node_6は54個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R75793_PEA_1_T1およびR75793_PEA_1_T5。下表17に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R75793_PEA_1_node_6 of the present invention is supported by 54 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: R75793_PEA_1_T1 and R75793_PEA_1_T5. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR75793_PEA_1_node_8は57個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R75793_PEA_1_T1、R75793_PEA_1_T3およびR75793_PEA_1_T5。下表18に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R75793_PEA_1_node_8 of the present invention is supported by 57 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: R75793_PEA_1_T1, R75793_PEA_1_T3 and R75793_PEA_1_T5. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR75793_PEA_1_node_13は2つのライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R75793_PEA_1_T1。下表19に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R75793_PEA_1_node_13 of the present invention is supported by two libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R75793_PEA_1_T1. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント:
配列名:Q96DR8
配列文書:
アラインメント:R75793_PEA_1_P2 x Q96DR8 ..
アラインメントセグメント 1/1:
クオリティ−:681.00
Escore:0
一致長:74 全長:74
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
1 MKFLAVLVLLGVSIFLVSAQNPTTAAPADTYPATGPADDEAPDAETTAAA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKFLAVLVLLGVSIFLVSAQNPTTAAPADTYPATGPADDEAPDAETTAAA 50
. .
51 TTATTAAPTTATTAASTTARKDIP 74
||||||||||||||||||||||||
51 TTATTAAPTTATTAASTTARKDIP 74
Mutant protein alignment with known proteins:
Sequence name: Q96DR8
Sequence document:
Alignment: R75793_PEA_1_P2 x Q96DR8 ..
Alignment segment 1/1:
Quality-: 681.00
Escore: 0
Match length: 74 Total length: 74
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
1 MKFLAVLVLLGVSIFLVSAQNPTTAAPADTYPATGPADDEAPDAETTAAA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKFLAVLVLLGVSIFLVSAQNPTTAAPADTYPATGPADDEAPDAETTAAA 50
..
51 TTATTAAPTTATTAASTTARKDIP 74
||||||||||||||||||||||-
51 TTATTAAPTTATTAASTTARKDIP 74

配列名R75793junc11−13に描かれたアンプリコンによって検出できるヒト小乳房上皮ムチン(LOC118430)R75793転写物の、正常および癌乳房組織での発現
junc11−13、R75793junc11−13アンプリコン、ならびにプライマ−R75793junc11−13FおよびR75793junc11−13Rによって、または従って検出されるヒト小乳房上皮ムチン(LOC118430)転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルの発現差倍率を得た。
Expression of human small breast epithelial mucin (LOC118430) R75793 transcript in normal and cancer breast tissue detectable by the amplicon depicted in SEQ ID R75793junc11-13
The expression of the human small breast epithelial mucin (LOC118430) transcript detected by junc11-13, R75793junc11-13 amplicon, and primers-R75793junc11-13F and R75793junc11-13R, or thus detected, was measured using real-time PCR. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured in the same manner. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The expression difference magnification of each sample with respect to the value was obtained.

実施した実験の一つでは、正常PMサンプルと比較して癌サンプルに発現差は観察されなかった。しかしながら、これはこの実験が失敗したことによるものと思われる。   In one of the experiments performed, no expression difference was observed in cancer samples compared to normal PM samples. However, this is likely due to the failure of this experiment.

プライマ−ペア−もまた、本発明に選択的および好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:R75793junc11−13Fフォワ−ドプライマ−;およびR75793junc11−13Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: R75793junc11-13F forward primer; and R75793junc11-13R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する;例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:T75793junc11−13。
フォワ−ドプライマ−R75793junc11−13F(配列番号:879):TGATGATGAAGCCCCTGATG
リバ−スプライマ−R75793 junc11−13R (配列番号:880): TATTGTCAAGGGGCTGGAATGT
アンプリコンR75793 junc11−13 (配列番号:881): TGATGATGAAGCCCCTGATGCTGAAACCACTGCTGCTGCAACCACTGCGACCACTGCTGCTCCTACCACTGCAACCACCGCTGCTTCTACCACTGCTCGTAAAGACATTCCAGCCCCTTGACAATA
The present invention also includes preferred amplicons obtained using preferred primers; for example, for the above experiments, the following amplicons are limited to non-limiting examples of preferred amplicons. Obtained at: T75793junc11-13.
Forward primer R75793junc11-13F (SEQ ID NO: 879): TGATGATGAAGCCCCTGATG
River primer R75793 junc11-13R (SEQ ID NO: 880): TATTGTCAAGGGGCTGGAATGT
Amplicon R75793 junc11-13 (SEQ ID NO: 881): TGATGATGAAGCCCCTGATGCTGAAACCACTGCTGCTGCAACCACTGCGACCACTGCTGCTCCTACCACTGCAACCACCGCTGCTTCTACCACTGCTCGTAAAGACATTCCAGCCCCTTGACAATA

配列名R75793seg9に描かれたアンプリコンによって検出できる、正常および癌乳房組織でのヒト小乳房上皮ムチン(LOC118430)R75793転写物の発現
seg9、R75793seg9アンプリコンならびにR75793seg9FおよびR75793seg9Rプライマ−によって、または従って検出できるヒト小乳房上皮ムチン(LOC118430)転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルについて、上記アンプリコンの発現を前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルの発現差の倍率を得た。
Expression of human small breast epithelial mucin (LOC118430) R75793 transcript in normal and cancerous breast tissue, detectable by the amplicon depicted in SEQ ID R75793seg9
The expression of human small breast epithelial mucin (LOC118430) transcripts detectable by, or thus, the seg9, R75793seg9 amplicon and R75793seg9F and R75793seg9R primers was measured using real-time PCR. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured in the same manner. For each RT sample, the expression of the amplicon was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of the expression difference of each sample with respect to the value was obtained.

実施した実験の一つでは、正常PMサンプルと比較して癌サンプルに発現差は観察されなかった。しかしながら、これはこの実験が失敗したことによるものと思われる。   In one of the experiments performed, no expression difference was observed in cancer samples compared to normal PM samples. However, this is likely due to the failure of this experiment.

プライマ−ペア−もまた、本発明に選択的および好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:R75793seg9Fフォワ−ドプライマ−;およびR75793seg9Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: R75793seg9F forward primer; and R75793seg9R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する;例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:T75793seg9。
フィワ−ドプライマ−R75793seg9F (配列番号:882): TCCAGCAATAACCATTTTTCACTTC
リバ−スプライマ−R75793seg9R (配列番号:883): GCTTTCACAGACTTTTGCTTAGGATT
アンプリコンR75793seg9 (配列番号:884): TCCAGCAATAACCATTTTTCACTTCCAGCCTCATGTCAAACAGCCAGTTTCCATGTGGATAGTCTTTGTTATAAGGAATCCTAAGCAAAAGTCTGTGAAAGC
The present invention also includes preferred amplicons obtained using preferred primers; for example, for the above experiments, the following amplicons are limited to non-limiting examples of preferred amplicons. Obtained at: T75793seg9.
FIRED PRIMER-R75793seg9F (SEQ ID NO: 882): TCCAGCAATAACCATTTTTCACTTC
River primer R75793seg9R (SEQ ID NO: 883): GCTTTCACAGACTTTTGCTTAGGATT
Amplicon R75793seg9 (SEQ ID NO: 884): TCCAGCAATAACCATTTTTCACTTCCAGCCTCATGTCAAACAGCCAGTTTCCATGTGGATAGTCTTTGTTATAAGGAATCCTAAGCAAAAGTCTGTGAAAGC

クラスタHUMCA1XIAの説明
クラスタHUMCA1XIAは、それぞれ表1および2にその名称を示し、配列自体は本明細書の最後に示した、関心の対象となる4つの転写物および46個のセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Description of Cluster HUMCA1XIA Cluster HUMCA1XIA is named in Tables 1 and 2, respectively, and the sequence itself is characterized by the four transcripts of interest and 46 segments shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は、既知タンパク質のコラ−ゲンアルファ1(SwissProtアクセッション識別子CA1B_HUMAN;同義語のXIとしても知られる)、配列番号:348の変異体であり、ここでは既知タンパク質と呼ばれる。   These sequences are variants of the known protein collagen alpha 1 (SwissProt accession identifier CA1B_HUMAN; also known as the synonym XI), SEQ ID NO: 348, referred to herein as the known protein.

タンパク質、コラ−ゲンアルファ1は、次の機能を持つことが知られているか、または考えられている:コラ−ゲンII原繊維の側方への成長を制御することによる原繊維発生において重要な役割を果たしているだろう。タンパク質、コラ−ゲンアルファ1の配列は、本明細書の最後に「コラ−ゲンアルファ1アミノ酸配列」として示してある。この配列について知られている多形を表4に示す。   The protein, collagen alpha 1, is known or thought to have the following functions: important in fibril development by controlling the lateral growth of collagen II fibrils Will play a role. The sequence of the protein, collagen alpha 1, is shown at the end of the specification as the “collagen alpha 1 amino acid sequence”. Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;軟骨凝縮;視覚;聴覚;細胞−細胞接着;細胞外マトリックス構成および生物発生、これらは生物学的プロセスに関係する注釈であり;細胞外マトリックス構造タンパク質;細胞外マトリックスタンパク質、接着、これは分子機能に関係する注釈付けであり;そして細胞外マトリックス;コラ−ゲン;XI型コラ−ゲン、これらは細胞成分に関する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; cartilage condensation; vision; hearing; cell-cell adhesion; extracellular matrix organization and biogenesis, these are annotations related to biological processes; extracellular matrix structural proteins; Extracellular matrix proteins, adhesion, which are annotations related to molecular function; and extracellular matrix; collagen; type XI collagen, these are annotations on cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタHUMCAXIAは、癌での本クラスタ転写物の過剰発現による診断マ−カ−として用いることができる。このようような転写物の正常組織での発現も、前述の方法によって得られる。表、左手縦列の項目「数」および図32のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster HUMCAXIA can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. In the table, the item “number” in the left hand column and the y-axis number in FIG. 32 are the weighted EST expression for each classification expressed in the form of “parts per million” (expressed in parts per million). , Ratio of EST expression of a specific cluster to expression of all ESTs of this classification).

全体として、図32のヒストグラムおよび表5に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);骨悪性腫瘍、上皮悪性腫瘍、各種組織由来の混合型悪性腫瘍および肺悪性腫瘍。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 32 and Table 5. This cluster is overexpressed (at least at the lowest level) in the following pathological conditions: bone malignancies, epithelial malignancies, mixed malignancies and lung malignancies from various tissues.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタHUMCA1XIAは、上表1に記載の4個の転写物を特徴とする。これら転写物はタンパク質のコラ−ゲンアルファ1の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster HUMCA1XIA is characterized by the four transcripts listed in Table 1 above. These transcripts code for proteins that are variants of collagen alpha 1 of the protein. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質HUMCA1XIA_P14は、本明細書最後に示すアミノ酸配列を有する;それは転写物HUMCA1XIA_T16にコ−ドされている。本明細書最後に、既知タンパク質(コラ−ゲンアルファ1)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HUMCA1XIA_P14 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HUMCA1XIA_T16. At the end of this specification, an alignment to a known protein (collagen alpha 1) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HUMCA1XIA_P14とCA1B_HUMAN_5(配列番号:349)の比較報告:
1.HUMCA1XIA_P14をコ−ドする単離されたキメラポリペプチドは、CA1B_HUMAN_V5のアミノ酸1〜1056に相当し、またHUMCA1XIA_P14のアミノ酸1〜1056にも相当するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPPGPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGEVGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQGPKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKPGPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQRGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPGAAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQGPPGPVに少なくとも90%相同である第一アミノ酸配列、およびHUMCA1XIA_P14のアミノ酸1057〜1081に相当する配列VSMMIINSQTIMVVNYSSSFITLMLを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report of HUMCA1XIA_P14 and CA1B_HUMAN_5 (SEQ ID NO: 349):
1. An isolated chimeric polypeptide that encodes HUMCA1XIA_P14 corresponds to amino acids 1-1056 of CA1B_HUMAN_V5 and also corresponds to amino acids 1-1056 of HUMCA1XIA_P14, a first amino acid sequence that is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence VSMMIINSQTIMVVNYSSSFITLML corresponding to amino acids 1057 to 1081 of HUMCA1XIA_P14 Wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

2.HUMCA1XIA_P14の尾部をコ−ドする単離されたポリペプチドは、HUMCA1XIA_P14内の配列VSMMIINSQTIMVVNYSSSFITLMLに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HUMCA1XIA_P14 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, to the sequence VSMMIINSQTIMVVNYSSSFITLML in HUMCA1XIA_P14. %, And most preferably at least about 95% homologous polypeptides.

既知タンパク質配列(CA1B_HUMAN;配列番号:348)は、本明細書の最後に示し、またCA1B_HUMAN_V5のアミノ酸配列として掲げられている配列とは異なる変化を一または複数有していることに注意しなければならない。これらの変化は、その発生について既に知られており、下表に記載されている。   It should be noted that the known protein sequence (CA1B_HUMAN; SEQ ID NO: 348) has one or more changes that differ from the sequence shown at the end of this specification and listed as the amino acid sequence of CA1B_HUMAN_V5. Don't be. These changes are already known for their occurrence and are listed in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HUMCA1XIA_P14はまた、表8に掲載する以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMCA1XIA_P14配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HUMCA1XIA_P14 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 8 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HUMCA1XIA_P14 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMCA1XIA_P14は、次の転写物にコ−ドされている:HUMCA1XIA_T16、この転写物の配列は本明細書の最後に示してある。転写物HUMCA1XIA_T16のコ−ディング部分は太字で表している:このコ−ディング部分は、位置319から始まり、位置3561に終止する。転写物はまた、表9に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMCA1XIA_P14配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMCA1XIA_P14 is encoded in the following transcript: HUMCA1XIA_T16, the sequence of this transcript is given at the end of the description. The coding part of the transcript HUMCA1XIA_T16 is shown in bold: this coding part starts at position 319 and ends at position 3561. The transcript also has the following SNPs listed in Table 9 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HUMCA1XIA_P14 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HUMCA1XIA_P15は、本明細書最後に示すアミノ酸配列を有する;それは転写物HUMCA1XIA_T17にコ−ドされている。本明細書最後に、既知タンパク質(コラ−ゲンアルファ1)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HUMCA1XIA_P15 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HUMCA1XIA_T17. At the end of this specification, an alignment to a known protein (collagen alpha 1) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HUMCA1XIA_P15とCA1B_HUMANの比較報告:
1.HUMCA1XIA_P15をコ−ドする単離されたキメラポリペプチドは、CA1B_HUMANのアミノ酸1〜714に相当し、またHUMCA1XIA_P15のアミノ酸1〜714にも相当すMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKに少なくとも90%相同である第一アミノ酸配列、およびHUMCA1XIA_P15のアミノ酸715〜729に相当する配列MCCNLSFGILIPLQKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between HUMCA1XIA_P15 and CA1B_HUMAN:
1. An isolated chimeric polypeptide that encodes HUMCA1XIA_P15 corresponds to amino acids 1 to 714 of CA1B_HUMAN and also corresponds to amino acids 1 to 714 of HUMCA1XIA_P15, a first amino acid sequence that is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence MCCNLSFGILIPLQK corresponding to amino acids 715-729 of HUMCA1XIA_P15 Wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

2.HUMCA1XIA_P15の尾部をコ−ドする単離されたポリペプチドは、HUMCA1XIA_P14内の配列MCCNLSFGILIPLQKに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HUMCA1XIA_P15 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence MCCNLSFGILIPLQK in HUMCA1XIA_P14. %, And most preferably at least about 95% homologous polypeptides.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HUMCA1XIA_P15はまた、表10に掲載する以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMCA1XIA_P15配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMCA1XIA_P15 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 10 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HUMCA1XIA_P15 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMCA1XIA_P15のグリコシレ−ション部位を、既知タンパク質、コラ−ゲンアルファ1と比較する形で表11に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているか示している)。   The glycosylation sites of the mutant protein HUMCA1XIA_P15 are shown in Table 11 in comparison with the known protein, collagen alpha 1 (the first column is arranged according to their position in the amino acid sequence; the second column is glycosylation) Indicates whether the site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMCA1XIA_P15は、次の転写物にコ−ドされている:HUMCA1XIA_T17、この転写物の配列は本明細書の最後に示してある。転写物HUMCA1XIA_T17のコ−ディング部分は太字で表している:このコ−ディング部分は、位置319から始まり、位置2505に終止する。転写物はまた、表12に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMCA1XIA_P15配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMCA1XIA_P15 is encoded in the following transcript: HUMCA1XIA_T17, the sequence of this transcript is given at the end of the description. The coding part of the transcript HUMCA1XIA_T17 is shown in bold: this coding part starts at position 319 and ends at position 2505. The transcript also has the following SNPs listed in Table 12 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is known SNP) The presence of a known SNP in the mutant protein HUMCA1XIA_P15 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HUMCA1XIA_P16は、本明細書最後に示すアミノ酸配列を有する;それは転写物HUMCA1XIA_T19にコ−ドされている。本明細書最後に、既知タンパク質(コラ−ゲンアルファ1)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HUMCA1XIA_P16 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HUMCA1XIA_T19. At the end of this specification, an alignment to a known protein (collagen alpha 1) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HUMCA1XIA_P16とCA1B_HUMANの比較報告:
1.HUMCA1XIA_P16をコ−ドする単離されたキメラポリペプチドは、CA1B_HUMANのアミノ酸1〜648に相当し、またHUMCA1XIA_P16のアミノ酸1〜648にも相当するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAに少なくとも90%相同である第一アミノ酸配列、CA1B_HUMANのアミノ酸667〜714に相当し、またHUMCA1XIA_P16のアミノ酸649〜696にも相当するGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKに少なくとも90%相同である第二アミノ酸配列、およびHUMCA1XIA_P16のアミノ酸697〜738に相当する配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、このとき前記第一アミノ酸配列、第二アミノ酸配列および第三アミノ酸配列は連続して順番につながっている。
Comparison report between HUMCA1XIA_P16 and CA1B_HUMAN:
1. An isolated chimeric polypeptide that encodes HUMCA1XIA_P16 corresponds to amino acids 1 to 648 of CA1B_HUMAN and also corresponds to amino acids 1 to 648 of HUMCA1XIA_P16, a first amino acid sequence that is at least 90% homologous, A second amino acid sequence that is at least 90% homologous to GMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEK, which corresponds to amino acids 667 to 714 of CA1B_HUMAN, and also corresponds to an amino acid DER VSLY LIFS VD LISK corresponding to amino acids 697 to 738 of HUMCA1XIA_P16 A third amino acid sequence that is at least 70% homologous, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous. The second amino acid sequence and the third amino acid sequence are sequentially connected in sequence. .

2. HUMCA1XIA_P16の縁部をコ−ドする単離されたキメラポリペプチドは、長さ「n」を有し、このときnは少なくとも約10アミノ酸長、要する場合は少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、そして最も好ましくは少なくとも約50アミノ酸長であり、少なくとも二つのアミノ酸がAGを含むポリペプチドを含み、以下の構造を有する:アミノ酸番号648−xから648のいずれかより開始し:アミノ酸番号649+((n−2)−x)のいずれかで終止する配列であって、このときxは0〜n−2の範囲である。   2. An isolated chimeric polypeptide that codes for the edge of HUMCA1XIA_P16 has a length of “n”, where n is at least about 10 amino acids long, if necessary, at least about 20 amino acids long, preferably A polypeptide that is at least about 30 amino acids long, more preferably at least about 40 amino acids long, and most preferably at least about 50 amino acids long, with at least two amino acids comprising AG, having the following structure: Starting from any of x to 648: a sequence ending at any of amino acid numbers 649 + ((n−2) −x), where x ranges from 0 to n−2.

3.HUMCA1XIA_P16の尾部をコ−ドする単離されたポリペプチドは、HUMCA1XIA_P16内の配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   3.An isolated polypeptide that codes the tail of HUMCA1XIA_P16 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYE in HUMCA1XIA_P16. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HUMCA1XIA_P16はまた、表13に掲載する以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMCA1XIA_P16配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HUMCA1XIA_P16 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 13 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HUMCA1XIA_P16 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMCA1XIA_P16のグリコシレ−ション部位を、既知タンパク質、コラ−ゲンアルファ1と比較する形で表14に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているか示している)。   The glycosylation sites of the mutant protein HUMCA1XIA_P16 are shown in Table 14 in comparison with the known protein collagen alpha 1 (the first column is arranged according to their position in the amino acid sequence; the second column is glycosylation) Indicates whether the site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMCA1XIA_P16は、次の転写物にコ−ドされている:HUMCA1XIA_T19、この転写物の配列は本明細書の最後に示してある。転写物HUMCA1XIA_T19のコ−ディング部分は太字で表している:このコ−ディング部分は、位置319から始まり、位置2532に終止する。転写物はまた、表15に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMCA1XIA_P16配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMCA1XIA_P16 is encoded in the following transcript: HUMCA1XIA_T19, the sequence of this transcript is given at the end of the description. The coding part of the transcript HUMCA1XIA_T19 is shown in bold: this coding part starts at position 319 and ends at position 2532. The transcript also has the following SNPs listed in Table 15 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HUMCA1XIA_P16 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HUMCA1XIA_P17は、本明細書最後に示すアミノ酸配列を有する;それは転写物HUMCA1XIA_T20にコ−ドされている。本明細書最後に、既知タンパク質(コラ−ゲンアルファ1)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HUMCA1XIA_P17 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HUMCA1XIA_T20. At the end of this specification, an alignment to a known protein (collagen alpha 1) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HUMCA1XIA_P17とCA1B_HUMANの比較報告:
1.HUMCA1XIA_P17をコ−ドする単離されたキメラポリペプチドは、CA1B_HUMANのアミノ酸1〜260に相当し、またHUMCA1XIA_P17のアミノ酸1〜260にも相当するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEに少なくとも90%相同である第一アミノ酸配列、およびHUMCA1XIA_P17のアミノ酸261〜273に相当する配列VRSTRPEKVFVFQを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between HUMCA1XIA_P17 and CA1B_HUMAN:
The 1.HUMCA1XIA_P17 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 260 of CA1B_HUMAN, also the first amino acid sequence that is at least 90% homologous to MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDE which also corresponds to amino acids 1 to 260 of HUMCA1XIA_P17 , And a polypeptide having the sequence VRSTRPEKVFVFQ corresponding to amino acids 261-273 of HUMCA1XIA_P17, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

2.HUMCA1XIA_P17の尾部をコ−ドする単離されたポリペプチドは、HUMCA1XIA_P17内の配列VRSTRPEKVFVFQに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HUMCA1XIA_P17 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence VRSTRPEKVFVFQ in HUMCA1XIA_P17. %, And most preferably at least about 95% homologous polypeptides.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HUMCA1XIA_P17はまた、表16に掲載する以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMCA1XIA_P17配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMCA1XIA_P17 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 16 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HUMCA1XIA_P17 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMCA1XIA_P17のグリコシレ−ション部位を、既知タンパク質、コラ−ゲンアルファ1と比較する形で表17に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているか示している)。   The glycosylation sites of the mutant protein HUMCA1XIA_P17 are shown in Table 17 in comparison with the known protein, collagen alpha 1 (the first column is arranged according to their position in the amino acid sequence; the second column is glycosylation) Indicates whether the site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMCA1XIA_P17は、次の転写物にコ−ドされている:HUMCA1XIA_T20、この転写物の配列は本明細書の最後に示してある。転写物HUMCA1XIA_T20のコ−ディング部分は太字で表している:このコ−ディング部分は、位置319から始まり、位置1137に終止する。転写物はまた、表18に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMCA1XIA_P17配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMCA1XIA_P17 is encoded in the following transcript: HUMCA1XIA_T20, the sequence of this transcript is given at the end of the description. The coding part of the transcript HUMCA1XIA_T20 is shown in bold: this coding part starts at position 319 and ends at position 1137. The transcript also has the following SNPs listed in Table 18 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known) The presence of a known SNP in the mutant protein HUMCA1XIA_P17 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記したように、クラスタHUMCA1XIAは、上表2に示し、また配列を本明細書の最後に示す46個のセグメントを特徴とする。これらセグメントは、それらが特に関心の対象であることからここに別々に記載されている核酸配列部分である。次に、本発明の各セグメントを説明する。   As described above, cluster HUMCA1XIA is characterized by 46 segments as shown in Table 2 above and the sequence at the end of this specification. These segments are the nucleic acid sequence portions described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタHUMCA1XIA_node_0は13個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19およびHUMCA1XIA_T20。下表19に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_0 of the present invention is supported by 13 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, HUMCA1XIA_T19 and HUMCA1XIA_T20. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_2は9個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19およびHUMCA1XIA_T20。下表20に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_2 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, HUMCA1XIA_T19 and HUMCA1XIA_T20. Table 20 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_4は5個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19およびHUMCA1XIA_T20。下表21に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_4 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, HUMCA1XIA_T19 and HUMCA1XIA_T20. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

このセグメントについては、次のマイクロアレイ(チップ)デ−タもある。クラスタそのものに関して上記したように、各種オリゴヌクレオチドについて、様々な疾患状態、特に癌において異なって発現しているか試験した。表22に示すように、次のオリゴヌクレオチドがこのセグメント(乳癌に関係する)をヒットすることが見出された。   There is also the following microarray (chip) data for this segment. As described above for the cluster itself, various oligonucleotides were tested for differential expression in various disease states, particularly cancer. As shown in Table 22, the following oligonucleotides were found to hit this segment (related to breast cancer).

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_6は5個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19およびHUMCA1XIA_T20。下表23に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_6 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, HUMCA1XIA_T19 and HUMCA1XIA_T20. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

このセグメントについては、次のマイクロアレイ(チップ)デ−タもある。クラスタそのものに関して上記したように、各種オリゴヌクレオチドについて、様々な疾患状態、特に癌において異なって発現しているか試験した。表24に示すように、次のオリゴヌクレオチドがこのセグメント(乳癌に関係する)をヒットすることが見出された。   There is also the following microarray (chip) data for this segment. As described above for the cluster itself, various oligonucleotides were tested for differential expression in various disease states, particularly cancer. As shown in Table 24, the following oligonucleotides were found to hit this segment (related to breast cancer).

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_8は5個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19およびHUMCA1XIA_T20。下表25に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_8 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17, HUMCA1XIA_T19 and HUMCA1XIA_T20. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_9は2つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T20。下表26に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_9 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T20. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_18は6個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表27に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_18 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_54は2つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T19。下表28に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_54 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T19. Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_55は4個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T17およびHUMCA1XIA_T19。下表29に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_55 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 29 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

このセグメントについては、次のマイクロアレイ(チップ)デ−タもある。クラスタそのものに関して上記したように、各種オリゴヌクレオチドについて、様々な疾患状態、特に癌において異なって発現しているか試験した。表30に示すように、次のオリゴヌクレオチドがこのセグメント(乳癌に関係する)をヒットすることが見出された。   There is also the following microarray (chip) data for this segment. As described above for the cluster itself, various oligonucleotides were tested for differential expression in various disease states, particularly cancer. As shown in Table 30, the following oligonucleotides were found to hit this segment (related to breast cancer).

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_92は2つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表31に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_92 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 31 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは、長さが約120bpまでであることから分けて説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are described separately because they are up to about 120 bp in length.

本発明のセグメントクラスタHUMCA1XIA_node_11は3個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表32に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_11 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 32 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_15は5個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表33に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_15 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 33 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_19は3つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表34に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_19 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 34 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_21は2つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表35に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_21 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 35 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_23は3つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表36に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_23 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 36 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_25は3つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表35に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_25 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 35 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_27は2つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表38に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_27 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 38 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_29は3つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表39に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_29 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 39 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_31は3つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表40に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_31 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 40 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_33は3つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表41に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_33 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 41 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_35は4個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表42に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_35 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 42 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_37は4個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表43に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_37 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 43 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_39は5個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表44に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_39 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 44 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_41は4個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表45に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_41 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 45 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_43は5個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表46に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_43 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 46 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_45は4個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16およびHUMCA1XIA_T17。下表47に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_45 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16 and HUMCA1XIA_T17. Table 47 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_47は5個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表48に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_47 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 48 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_49は5個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表49に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_49 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 49 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_51は7個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16、HUMCA1XIA_T17およびHUMCA1XIA_T19。下表50に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_51 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16, HUMCA1XIA_T17 and HUMCA1XIA_T19. Table 50 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_57は4個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表51に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_57 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 51 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_59は3つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表52に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_59 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 52 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_62は3つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表53に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_62 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 53 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_64は4個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表54に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_64 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 54 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_66は4個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表55に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_66 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 55 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_68は7個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表56に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_68 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 56 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_70は6個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表57に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_70 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 57 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_72は6個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表58に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_72 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 58 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_74は5個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表59に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_74 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 59 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_76は6個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表60に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_76 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 60 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_78は6個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表61に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_78 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 61 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_81は8個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表62に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_81 of the present invention is supported by eight libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 62 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_83は7個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表63に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_83 of the present invention is supported by seven libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 63 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_85は6個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表64に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_85 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 64 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_87は10個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表65に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_87 of the present invention is supported by 10 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 65 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_89は9個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表66に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_89 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 66 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMCA1XIA_node_91は11個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HUMCA1XIA_T16。下表67に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HUMCA1XIA_node_91 of the present invention is supported by 11 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMCA1XIA_T16. Table 67 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

転写物核酸配列:
既知タンパク質との変異体タンパク質のアラインメント:
配列名:CA1B_HUMAN_V5
配列文書:
アラインメント:HUMCA1XIA_P14 x CA1B_HUMAN_V5 ..
アラインメントセグメント 1/1:
クオリティ−:10456.00
Escore:0
一致長:1058 全長:1058
一致パ−セント類似性:99.91 一致パ−セント同一性:99.91
全パ−セント類似性:99.91 全パ−セント同一性:99.91
ギャップ: 0
アラインメント:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
. . . . .
701 LPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 LPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
. . . . .
751 GPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 GPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
. . . . .
801 VGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQG 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 VGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQG 850
. . . . .
851 PKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKP 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 PKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKP 900
. . . . .
901 GPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQ 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 GPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQ 950
. . . . .
951 RGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPG 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 RGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPG 1000
. . . . .
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050

1051 GPPGPVVS 1058
|||||| |
1051 GPPGPVGS 1058
Transcript nucleic acid sequence:
Mutant protein alignment with known proteins:
Array name: CA1B_HUMAN_V5
Sequence document:
Alignment: HUMCA1XIA_P14 x CA1B_HUMAN_V5 ..
Alignment segment 1/1:
Quality-: 10456.00
Escore: 0
Match length: 1058 Total length: 1058
Match Percent Similarity: 99.91 Match Percent Identity: 99.91
Total percent similarity: 99.91 Total percent identity: 99.91
Gap: 0
alignment:
...
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
...
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
...
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
...
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
...
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
...
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
...
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
...
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
...
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
...
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
...
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
...
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
...
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
...
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
...
701 LPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 LPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
...
751 GPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 GPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
...
801 VGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQG 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 VGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQG 850
...
851 PKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKP 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 PKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKP 900
...
901 GPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQ 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 GPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQ 950
...
951 RGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPG 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 RGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPG 1000
...
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050

1051 GPPGPVVS 1058
||||||| |
1051 GPPGPVGS 1058

配列名:CA1B_HUMAN
配列文書:
アラインメント:HUMCA1XIA_P15 x CA1B_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:7073.00
Escore:0
一致長:714 全長:714
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
701 LPGPQGPIGPPGEK 714
||||||||||||||
701 LPGPQGPIGPPGEK 714
Array name: CA1B_HUMAN
Sequence document:
Alignment: HUMCA1XIA_P15 x CA1B_HUMAN ..
Alignment segment 1/1:
Quality-: 7073.30
Escore: 0
Match length: 714 Total length: 714
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
...
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
...
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
...
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
...
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
...
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
...
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
...
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
...
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
...
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
...
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
...
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
...
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
...
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
701 LPGPQGPIGPPGEK 714
||||||||||||||||
701 LPGPQGPIGPPGEK 714

配列名:CA1B_HUMAN
配列文書:
アラインメント:HUMCA1XIA_P16 x CA1B_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:6795.00
Escore:0
一致長:696 全長:714
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:97.48 全パ−セント同一性:97.48
ギャップ: 1
アラインメント:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEA.. 648
||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
649 ................GMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 682
||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
683 LPGPQGPIGPPGEK 696
||||||||||||||
701 LPGPQGPIGPPGEK 714
Array name: CA1B_HUMAN
Sequence document:
Alignment: HUMCA1XIA_P16 x CA1B_HUMAN ..
Alignment segment 1/1:
Quality-: 6795.00
Escore: 0
Match length: 696 Length: 714
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 97.48 Total percent identity: 97.48
Gap: 1
alignment:
...
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
...
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
...
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
...
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
...
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
...
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
...
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
...
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
...
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
...
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
...
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
...
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
...
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEA .. 648
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||-||||||-||||||-||||||-||||||-||||||||-
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
...
649 ................ GMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 682
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
683 LPGPQGPIGPPGEK 696
||||||||||||||||
701 LPGPQGPIGPPGEK 714

配列名:CA1B_HUMAN
配列文書:
アラインメント:HUMCA1XIA_P17 x CA1B_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:2561.00
Escore:0
一致長:260 全長:260
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
.
251 AQAQEPQIDE 260
||||||||||
251 AQAQEPQIDE 260
Array name: CA1B_HUMAN
Sequence document:
Alignment: HUMCA1XIA_P17 x CA1B_HUMAN ..
Alignment segment 1/1:
Quality-: 2561.00
Escore: 0
Match length: 260 Total length: 260
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
...
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
...
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
...
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
...
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
.
251 AQAQEPQIDE 260
|||||||||||
251 AQAQEPQIDE 260

クラスタR20779の説明
クラスタR20779は、それぞれ表1および2にその名称を示し、配列自体は本明細書の最後に示した、関心の対象となる1つの転写物および24個のセグメントを特徴とする。選択されたタンパク質変異体を表3に示す。
Description of Cluster R20779 Cluster R20779, whose names are shown in Tables 1 and 2, respectively, the sequence itself is characterized by one transcript of interest and 24 segments as shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は、既知タンパク質のスタニオカルシン2前駆体(SwissProtアクセッション識別子STC2_HUMAN;同義語のSTC−2;スタニオカルシン関連タンパク質;STCRP;STC−関連タンパク質としても知られる)、配列番号:379の変異体であり、ここでは既知タンパク質と呼ばれる。   These sequences are variants of the known protein stanniocalcin 2 precursor (SwissProt accession identifier STC2_HUMAN; synonymous STC-2; stanniocalcin related protein; STCRP; also known as STC-related protein), SEQ ID NO: 379 Yes, here called a known protein.

タンパク質、スタニオカルシン2前駆体は、次の機能を持つことが知られているか、または考えられている:カルシウムおよびリン恒常性に対するカルシウム低下作用を有する。タンパク質、スタニオカルシン2前駆体の配列は、本明細書の最後に「スタニオカルシン2前駆体アミノ酸配列」として示してある。タンパク質、スタニオカルシン2前駆体の局在は、分泌型(可能性)と考えられている。   The protein, stanniocalcin 2 precursor, is known or thought to have the following functions: has a calcium-lowering effect on calcium and phosphorus homeostasis. The sequence of the protein, stanniocalcin 2 precursor, is shown at the end of the specification as “stanniocalcin 2 precursor amino acid sequence”. The localization of the protein, stanniocalcin 2 precursor, is considered secretory (possible).

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;細胞表面レセプタ−連結シグナル伝達;細胞−細胞シグナル伝達;栄養反応経路、これらは生物学的プロセスに関係する注釈であり;ホルモン、これは分子機能に関係する注釈付けであり;そして細胞外、これは細胞成分に関係する注釈である。   The following GO annotations apply to known proteins. The following annotations have been found; cell surface receptor-linked signaling; cell-cell signaling; trophic reaction pathways, these are annotations related to biological processes; hormones, which are related to molecular function And extracellular, this is an annotation related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタR20779は、癌での本クラスタ転写物の過剰発現による診断マ−カ−として用いることができる。このようような転写物の正常組織での発現も、前述の方法によって得られる。表、左手縦列の項目「数」および図33のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster R20779 can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The number of items in the table, left hand column and the y-axis number in Figure 33 is the weighted EST expression for each category expressed in the form of "parts per million" (expressed in parts per million). , Ratio of EST expression of a specific cluster to expression of all ESTs of this classification).

全体として、図33のヒストグラムおよび表4に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);上皮悪性腫瘍、各種組織由来の混合型悪性腫瘍および肺悪性腫瘍。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 33 and Table 4. This cluster is overexpressed (at least at a minimal level) in the following pathological conditions: epithelial malignancies, mixed malignancies from various tissues and lung malignancies.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

このクラスタについては、少なくとも一つのオリゴヌクレオチドがクラスタの過剰発現を証明するが、以下掲載の少なくとも一つの転写物/セグメントの過剰発現は証明しないことが見出されている。このクラスタについては、以下のようなマイクロアレイ(チップ)デ−タもある。クラスタそのものに関して上記したように、各種オリゴヌクレオチドについて、様々な疾患状態、特に癌において異なって発現しているか試験した。表6に示すように、次のオリゴヌクレオチドがこのセグメント(乳癌に関係する)をヒットするが、他のセグメント/転写物はヒットしないことが見出された。   For this cluster, it has been found that at least one oligonucleotide demonstrates overexpression of the cluster but not at least one transcript / segment listed below. The following microarray (chip) data is also available for this cluster. As described above for the cluster itself, various oligonucleotides were tested for differential expression in various disease states, particularly cancer. As shown in Table 6, the next oligonucleotide was found to hit this segment (related to breast cancer) but not the other segments / transcripts.

Figure 2007520217
Figure 2007520217

上記のように、クラスタR20779は、上表1に記載の一つの転写物を特徴とする。これら転写物はタンパク質のスタニオカルシン2前駆体の変異体であるタンパク質をコ−ドしている。次に本発明の各変異体タンパク質について説明する。   As described above, cluster R20779 is characterized by one transcript listed in Table 1 above. These transcripts code for proteins that are variants of the protein stanniocalcin 2 precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質R20779_P2は、本明細書最後に示すアミノ酸配列を有する;それは転写物R20779_T7にコ−ドされている。本明細書最後に、既知タンパク質(スタニオカルシン2前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein R20779_P2 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript R20779_T7. At the end of this specification, an alignment to a known protein (stanniocalcin 2 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

R20779とSTC2_HUMANの比較レポ−ト:
1. R20779_P2をコ−ドしている単離されたキメラポリペプチドは、STC2_HUMANのアミノ酸1〜169に相当し、またR20779_P2のアミノ酸1〜169にも相当するMCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNTAEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGKSFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQENTRVIVEMIHFKDLLLHEに少なくとも90%相同である第一アミノ酸配列、およびR20779_P2のアミノ酸170〜187に相当する配列CYKIEITMPKRRKVKLRDを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
R20779 and STC2_HUMAN comparison report:
1. R20779_P2 co - de to isolated chimeric polypeptides are the first corresponds to amino acids 1 to 169 of STC2_HUMAN, also at least 90% homologous to MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNTAEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGKSFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQENTRVIVEMIHFKDLLLHE which also corresponds to amino acids 1 to 169 of R20779_P2 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least A second amino acid sequence that is 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

2.R20779_P2の尾部をコ−ドする単離されたポリペプチドは、R20779_P2内の配列CYKIEITMPKRRKVKLRDに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of R20779_P2 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence CYKIEITMPKRRKVKLRD within R20779_P2. %, And most preferably at least about 95% homologous polypeptides.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質R20779_P2はまた、表7に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R20779_P2配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein R20779_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their amino acid sequence position, then modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP in the mutant protein R20779_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質R20779_P2のグリコシレ−ション部位を、既知タンパク質、スタニオカルシン2前駆体と比較する形で表8に示す(第一縦列に、アミノ酸配列での位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of the mutant protein R20779_P2 are shown in Table 8 in comparison with the known protein, stanniocalcin 2 precursor (in the first column, arranged according to the position in the amino acid sequence; the second column shows the glycosylation site Indicates whether it is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質R20779_P2は、次の転写物にコ−ドされている:R20779_T7、この転写物の配列は本明細書の最後に示してある。転写物T20779_T2のコ−ディング部分は太字で表している:このコ−ディング部分は、位置1397から始まり、位置1957に終止する。転写物はまた、表9に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R20779_P2配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein R20779_P2 is encoded in the following transcript: R20779_T7, the sequence of this transcript is given at the end of the description. The coding part of the transcript T20779_T2 is shown in bold: this coding part starts at position 1397 and ends at position 1957. The transcript also has the following SNPs listed in Table 9 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein R20779_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のように、クラスタR20779は上表2に掲載され、その配列を本明細書の最後に示している24個のセグメントを特徴とする。これらセグメントは、それらが特に関心の対象であることから、ここに別に記載されている核酸配列の一部である。次に、本発明の各セグメントについて説明する。   As noted above, cluster R20779 is listed in Table 2 above and is characterized by 24 segments whose sequence is shown at the end of this specification. These segments are part of the nucleic acid sequences described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタR20779_node_0は31個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表10に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_0 of the present invention is supported by 31 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 10 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_2は55個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表111に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_2 of the present invention is supported by 55 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 111 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_7は63個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表12に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_7 of the present invention is supported by 63 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 12 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_9は66個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表13に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_9 of the present invention is supported by 66 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 13 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_18は61個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表14に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_18 of the present invention is supported by 61 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 14 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_21は106個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表15に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_21 of the present invention is supported by 106 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_24は100個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表16に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_24 of the present invention is supported by 100 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_27は26個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表17に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_27 of the present invention is supported by 26 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_28は31個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表18に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_28 of the present invention is supported by 31 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_30は34個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表19に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_30 of the present invention is supported by 34 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_31は46個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表20に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_31 of the present invention is supported by 46 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 20 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_32は88個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表21に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_32 of the present invention is supported by 88 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様では、上記クラスタに関係する短いセグメントも提供される。これらのセグメントは、約120bpまでの長さであることから、分けて記載する。   In an optional aspect of the present invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they are described separately.

本発明のセグメントクラスタR20779_node_1は27個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表22に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_1 of the present invention is supported by 27 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 22 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_3は52個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表23に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_3 of the present invention is supported by 52 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_10は次の転写物に見出すことができる:R20779_T7。下表24に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_10 of the present invention can be found in the following transcript: R20779_T7. Table 24 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_11は58個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表25に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_11 of the present invention is supported by 58 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_14は1つライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表26に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_14 of the present invention is supported by one library. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_17は54個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表27に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_17 of the present invention is supported by 54 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_19は次の転写物に見出すことができる:R20779_T7。下表28に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_19 of the present invention can be found in the following transcript: R20779_T7. Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_20は53個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表29に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_20 of the present invention is supported by 53 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 29 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_22は76個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表30に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_22 of the present invention is supported by 76 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 30 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_23は81個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:R20779_T7。下表31に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_23 of the present invention is supported by 81 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: R20779_T7. Table 31 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_25は次の転写物に見出すことができる:R20779_T7。下表32に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_25 of the present invention can be found in the following transcript: R20779_T7. Table 32 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR20779_node_29は次の転写物に見出すことができる:R20779_T7。下表33に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster R20779_node_29 of the present invention can be found in the following transcript: R20779_T7. Table 33 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント:
配列名:STC2_HUMAN
配列文書:
アラインメント:R20779_P2 x STC2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:1688.00
Escore:0
一致長:171 全長:171
一致パ−セント類似性:99.42 一致パ−セント同一性:99.42
全パ−セント類似性:99.42 全パ−セント同一性:99.42
ギャップ: 0
アラインメント:
. . . . .
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
. . . . .
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGK 100
. . . . .
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
. .
151 ENTRVIVEMIHFKDLLLHECY 171
||||||||||||||||||| |
151 ENTRVIVEMIHFKDLLLHEPY 171
Mutant protein alignment with known proteins:
Array name: STC2_HUMAN
Sequence document:
Alignment: R20779_P2 x STC2_HUMAN ..
Alignment segment 1/1:
Quality-: 1680.80
Escore: 0
Match length: 171 Total length: 171
Match Percent Similarity: 99.42 Match Percent Identity: 99.42
Total percent similarity: 99.42 Total percent identity: 99.42
Gap: 0
alignment:
...
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
...
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGK 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGK 100
...
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
..
151 ENTRVIVEMIHFKDLLLHECY 171
||||||||||||||||||||||-
151 ENTRVIVEMIHFKDLLLHEPY 171

クラスタHSS100PCBの説明
クラスタHSS100PCBは、それぞれの名称を表1および2に示し、また配列自体は本明細書の最後に示した関心対象の1つの転写物および3つのセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Description of Cluster HSS100PCB Cluster HSS100PCB has their respective names shown in Tables 1 and 2, and the sequence itself features one transcript and three segments of interest as shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は、既知タンパク質のS−100Pタンパク質(SwissProtアクセッション識別子S10P_HUMAN)、配列番号:385の変異体であり、ここでは既知タンパク質と呼ばれる。   These sequences are variants of the known protein S-100P protein (SwissProt accession identifier S10P_HUMAN), SEQ ID NO: 385, referred to herein as known proteins.

タンパク質、S−100Pタンパク質の配列は、本明細書の最後に「S−100Pタンパク質アミノ酸配列」として示してある。この配列について知られている多形を表4に示す。   The sequence of the protein, S-100P protein, is shown as “S-100P protein amino acid sequence” at the end of the specification. Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;カルシウム結合;タンパク質結合、これらは分子機能に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; calcium binding; protein binding, these are annotations related to molecular function.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタHSS100PCBは、癌での本クラスタ転写物の過剰発現による診断マ−カ−として用いることができる。このようような転写物の正常組織での発現も、前述の方法によって得られる。表、左手縦列の項目「数」および図34のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster HSS100PCB can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. In the table, the item “number” in the left hand column and the y-axis number in FIG. 34 are the weighted EST expression of each classification expressed in the form of “parts per million” (expressed in parts per million). , Ratio of EST expression of a specific cluster to expression of all ESTs in this classification)

全体として、図34のヒストグラムおよび表5に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);各種組織由来の混合型悪性腫瘍および肺悪性腫瘍。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 34 and Table 5. This cluster is overexpressed (at least at the lowest level) in the following pathological conditions: mixed and lung malignancies from various tissues.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のようにクラスタHSS100PCBは、表1に記載した1つの転写物を特徴とする。これら転写物は、タンパク質、S−100Pタンパク質の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, the cluster HSS100PCB is characterized by one transcript listed in Table 1. These transcripts code for proteins, proteins that are variants of S-100P protein. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質HSS100PCB_P3は、本明細書の最後に示すアミノ酸配列を有している;それは転写物HSS100PCB_T1にコ−ドされている。変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   The mutant protein HSS100PCB_P3 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSS100PCB_T1. Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSS100PCB_P3はまた、表7に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSS100PCB_P3配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSS100PCB_P3 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSS100PCB_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSS100PCB_P3は次の転写物にコ−ドされている:HSS100PCB_T1、この転写物の配列は本明細書の最後に示してある。転写物HSS100PCB_T1のコ−ディング部分は太字で表している:このコ−ディング部分は、位置1057から始まり、位置1533に終止している。転写物はまた、表8に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSS100PCB_P3配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSS100PCB_P3 is encoded in the following transcript: HSS100PCB_T1, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSS100PCB_T1 is shown in bold: this coding part starts at position 1057 and ends at position 1533. The transcript also has the following SNPs listed in Table 8 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSS100PCB_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記のようにクラスタHSS100PCBは、表2に記載し、またその配列を本明細書の最後に示した3つのセグメントを特徴とする。これら転写物は、特認関心の対象であることから、ここに別々に記載した核酸配列部分である。次に、本発明の核セグメントについて説明する。   As noted above, the cluster HSS100PCB is characterized by the three segments listed in Table 2 and whose sequences are shown at the end of this specification. Since these transcripts are of special interest, they are the nucleic acid sequence portions described separately here. Next, the nuclear segment of the present invention will be described.

本発明のセグメントクラスタHSS100PCB_node_3は16個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSS100PCB_T1。下表9に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSS100PCB_node_3 of the present invention is supported by 16 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSS100PCB_T1. Table 9 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSS100PCB_node_4は29個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSS100PCB_T1。下表10に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSS100PCB_node_4 of the present invention is supported by 29 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSS100PCB_T1. Table 10 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

このセグメントについては、次のマイクロアレイ(チップ)デ−タもある。クラスタそのものに関して上記したように、各種オリゴヌクレオチドについて、様々な疾患状態、特に癌において異なって発現しているか試験した。表11に示すように、次のオリゴヌクレオチドがこのセグメント(乳癌に関係する)をヒットすることが見出された。   There is also the following microarray (chip) data for this segment. As described above for the cluster itself, various oligonucleotides were tested for differential expression in various disease states, particularly cancer. As shown in Table 11, the following oligonucleotides were found to hit this segment (related to breast cancer).

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSS100PCB_node_5は141個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSS100PCB_T1。下表12に、各転写物におけるこのセグメントの開始位置と終止位置を示す。   The segment cluster HSS100PCB_node_5 of the present invention is supported by 141 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSS100PCB_T1. Table 12 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

クラスタHSCOC4の説明
クラスタHSCOC4は、それぞれの名称を表1および2に示し、また配列自体は本明細書の最後に示した関心対象の19個の転写物および79個つのセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Description of Cluster HSCOC4 Cluster HSCOC4 has its respective name shown in Tables 1 and 2, and the sequence itself features the 19 transcripts and 79 segments of interest shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これらの配列は、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン](SwissProtアクセッション識別子CO4_HUMAN)配列番号:485)の変異体であり、ここでは既知タンパク質と呼ぶ。   These sequences are variants of the known protein complement C4 precursor [containing: C4a anaphylatoxin] (SwissProt accession identifier CO4_HUMAN) SEQ ID NO: 485), referred to herein as known proteins.

タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]は次の機能を有することが知られているか、または有すると考えられている:C4は補体システムの古典経路の活性化において中心的な役割を果たしている。それはC4aアナフィラトキシンをアルファ鎖から取り除く活性化C1によって処理される。補体C4のタンパク質分解派生物であるC4aアナフィラトキシンは、局所性炎症プロセスのメディエイタである。それは平滑筋の収縮を引き起こし、血管透過性を上昇させ、そしてマスト細胞および好塩基球からヒスタミンを放出させる。タンパク質、補体C4前駆体[含有:C4aアナフィラトキシン]の配列は、本明細書の最後に「補体C4前駆体[含有:C4aアナフィラトキシン]のアミノ酸配列」として示している。この配列について知られている多形を表4に示す。   Protein complement C4 precursor [containing: C4a anaphylatoxin] is known or thought to have the following functions: C4 is central in the activation of the classical pathway of the complement system Playing a role. It is processed by activated C1, which removes C4a anaphylatoxin from the alpha chain. C4a anaphylatoxin, a proteolytic derivative of complement C4, is a mediator of the local inflammatory process. It causes smooth muscle contraction, increases vascular permeability, and releases histamine from mast cells and basophils. The sequence of the protein, complement C4 precursor [containing: C4a anaphylatoxin] is shown at the end of the present specification as “complement C4 precursor [containing: C4a anaphylatoxin] amino acid sequence”. Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;筋肉収縮;炎症反応;補体活性化;補体活性化、古典経路、これらは生物学的プロセスに関係する注釈であり;補体成分;プロテイナ−ゼ阻害剤、これは分子機能に関係する注釈付けであり;そして細胞外;細胞外空間、これらは細胞成分に関係する注釈である。   The following GO annotations apply to known proteins. The following annotations have been found; muscle contraction; inflammatory response; complement activation; complement activation, classical pathways, these are annotations related to biological processes; complement components; proteinases Inhibitors, which are annotations related to molecular function; and extracellular; extracellular space, these are annotations related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタHSCOC4は、癌での本クラスタ転写物の過剰発現による診断マ−カ−として用いることができる。このようような転写物の正常組織での発現も、前述の方法によって得られる。表、左手縦列の項目「数」および図35のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster HSCOC4 can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The number of items in the table, left hand column “number” and the y-axis number in FIG. 35 is the weighted EST expression of each classification expressed in the form of “parts per million” (expressed in parts per million). , Ratio of EST expression of a specific cluster to expression of all ESTs of this classification).

全体として、図35のヒストグラムおよび表5に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);脳悪性腫瘍、各種組織由来の混合型悪性腫瘍、乳房悪性腫瘍、膵臓癌および前立腺癌。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 35 and Table 5. This cluster is overexpressed (at least at a minimal level) in the following pathological conditions: brain malignancies, mixed malignancies from various tissues, breast malignancies, pancreatic cancer and prostate cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタHSCOC4は、上表1に記載の19個の転写物を特徴とする。これら転写物は、タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]の変異体であるタンパク質をコ−ドしている。次に本発明の各変異体タンパク質について説明する。   As described above, cluster HSCOC4 is characterized by the 19 transcripts listed in Table 1 above. These transcripts code for proteins that are variants of the protein complement C4 precursor [containing: C4a anaphylatoxin]. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質HSCOC4_PEA_1_P3は、本明細書の最後に示すアミノ酸配列を有している;それは転写物HSCOC4_PEA_1_T1にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P3 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T1. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P3とCO4_HUMANとの比較報告:
1.HSCOC4_PEA_1_P3をコ−ドする単離されたキメラポリペプチドは、CO4_HUMANのアミノ酸1〜865に相当し、またHSCOC4_PEA_1_P3のアミノ酸1〜865にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P3のアミノ酸866〜887に相当する配列RPHRSLSIQELGEPGPSEGWGGを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P3 and CO4_HUMAN:
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P3 corresponds to amino acids 1 to 865 of CO4_HUMAN and also corresponds to amino acids 1 to 865 of HSCOC4_PEA_1_P3, a first amino acid sequence that is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence RPHRSLSIQELGEPGPSEGWGG corresponding to amino acids 866-887 of HSCOC4_PEA_1_P3 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P3の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P3内の配列RPHRSLSIQELGEPGPSEGWGGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P3 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence RPHRSLSIQELGEPGPSEGWGG in HSCOC4_PEA_1_P3. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域予測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region prediction program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSCOC4_PEA_1_P3もまた、表7に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P3配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P3 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P3のグリコシレ−ション部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表8に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation sites of the mutant protein HSCOC4_PEA_1_P3 are shown in Table 8 in comparison with the complement C4 precursor of the known protein [containing: C4a anaphylatoxin] (aligned according to their position in the amino acid sequence in the first column; The second column indicates whether a glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P3のリン酸化部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表9に示す(最初の縦列にそれらのアミノ酸配列での位置を示し;第2列にはリン酸位置が変異体タンパク質に存在するかを示し;そして最後の縦列にはその位置が変異体タンパク質で異なっているかを示している)。   The phosphorylation sites of the mutant protein HSCOC4_PEA_1_P3 are shown in Table 9 in comparison with the complement of the known protein C4 precursor [included: C4a anaphylatoxin] (first column shows their amino acid position; The two columns indicate whether the phosphate position is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P3は次の転写物にコ−ドされている:HSCOC4_PEA_1_T1、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T1のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置3161に終止する。転写物はまた、表10に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P3配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P3 is encoded in the following transcript: HSCOC4_PEA_1_T1, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T1 is shown in bold: this coding part starts at position 501 and ends at position 3161. The transcript also has the following SNPs listed in Table 10 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P5は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T3にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P5 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T3. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P5とCO4_HUMANとの比較報告:
1.HSCOC4_PEA_1_P5をコ−ドする単離されたキメラポリペプチドは、CO4_HUMANのアミノ酸1〜818に相当し、またHSCOC4_PEA_1_P5のアミノ酸1〜818にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P5のアミノ酸819〜843に相当する配列DVTLSGPQVTLLPFPCTPAPCSLCSを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P5 and CO4_HUMAN:
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P5 corresponds to amino acids 1 to 818 of CO4_HUMAN and also corresponds to amino acids 1 to 818 of HSCOC4_PEA_1_P5, a first amino acid sequence that is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence DVTLSGPQVTLLPFPCTPAPCSLCS corresponding to amino acids 819-843 of HSCOC4_PEA_1_P5 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P5の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P5内の配列DVTLSGPQVTLLPFPCTPAPCSLCSに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P5 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence DVTLSGPQVTLLPFPCTPAPCSLCS within HSCOC4_PEA_1_P5. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域予測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region prediction program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSCOC4_PEA_1_P5もまた、表11に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P5配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 11 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P5 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P5のグリコシレ−ション部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表12に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation sites of the mutant protein HSCOC4_PEA_1_P5 are shown in Table 12 in comparison with the complement of the known protein C4 precursor [containing: C4a anaphylatoxin] (aligned according to their position in the amino acid sequence in the first column; The second column indicates whether a glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P5のリン酸化部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表13に示す(最初の縦列にそれらのアミノ酸配列での位置を示し;第2列にはリン酸位置が変異体タンパク質に存在するかを示し;そして最後の縦列にはその位置が変異体タンパク質で異なっているかを示している)。   The phosphorylation sites of the mutant protein HSCOC4_PEA_1_P5 are shown in Table 13 in comparison with the complement of the known protein C4 precursor [containing: C4a anaphylatoxin] (first column shows their amino acid position; first The two columns indicate whether the phosphate position is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P5は次の転写物にコ−ドされている:HSCOC4_PEA_1_T3、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T3のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置3029に終止する。転写物はまた、表14に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P5配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P5 is encoded in the following transcript: HSCOC4_PEA_1_T3, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T3 is shown in bold: this coding part starts at position 501 and ends at position 3029. The transcript also has the following SNPs listed in Table 14 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P5 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P6は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T4にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P6 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T4. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P6とCO4_HUMANとの比較報告:
1. HSCOC4_PEA_1_P6をコ−ドする単離されたキメラポリペプチドは、CO4_HUMANのアミノ酸1〜1052に相当し、またHSCOC4_PEA_1_P6のアミノ酸1〜1052にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P6のアミノ酸1053〜1084に相当する配列SGCKGKQEGGQERTVTGRWTAQEATEGKKGGPを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P6 and CO4_HUMAN:
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P6 corresponds to amino acids 1-1052 of CO4_HUMAN and also corresponds to amino acids 1-1052 of HSCOC4_PEA_1_P6, a first amino acid sequence that is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence SGCKGKQEGGQERTVTGRWTAQEATEGKKGGP corresponding to amino acids 1053-1084 of HSCOC4_PEA_1_P6 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P6の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P6内の配列SGCKGKQEGGQERTVTGRWTAQEATEGKKGGPに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HSCOC4_PEA_1_P6 has at least 70%, if required at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence SGCKGKQEGGQERTVTGRWTAQEATEGKKGGP in HSCOC4_PEA_1_P6. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域予測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region prediction program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSCOC4_PEA_1_P6もまた、表15に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P6配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 15 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P6 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P6のグリコシレ−ション部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表16に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation sites of the mutant protein HSCOC4_PEA_1_P6 are shown in Table 16 in comparison with the complement C4 precursor of the known protein [containing: C4a anaphylatoxin] (aligned according to their position in the amino acid sequence in the first column; The second column indicates whether a glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P6のリン酸化部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表17に示す(最初の縦列にそれらのアミノ酸配列での位置を示し;第2列にはリン酸位置が変異体タンパク質に存在するかを示し;そして最後の縦列にはその位置が変異体タンパク質で異なっているかを示している)。   The phosphorylation sites of the mutant protein HSCOC4_PEA_1_P6 are shown in Table 17 in comparison with the complement of the known protein C4 precursor [containing: C4a anaphylatoxin] (first column shows their amino acid position; The two columns indicate whether the phosphate position is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P6は次の転写物にコ−ドされている:HSCOC4_PEA_1_T4、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T4のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置3752に終止する。転写物はまた、表18に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P6配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P6 is encoded in the following transcript: HSCOC4_PEA_1_T4, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T4 is shown in bold: this coding part starts at position 501 and ends at position 3752. The transcript also has the following SNPs listed in Table 18 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known) The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P6 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P12は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T11にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P12 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T11. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P12とCO4_HUMAN_V1(配列番号:486)との比較報告:
1. HSCOC4_PEA_1_P12をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1380に相当し、またHSCOC4_PEA_1_P12のアミノ酸1〜1380にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P12のアミノ酸1381〜1397に相当する配列RAREGVGPGTGGGEGVEを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P12 and CO4_HUMAN_V1 (SEQ ID NO: 486):
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P12 corresponds to amino acids 1-1380 of CO4_HUMAN_V1 and also corresponds to amino acids 1-1380 of HSCOC4_PEA_1_P12, a first amino acid sequence that is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence RAREGVGPGTGGGEGVE corresponding to amino acids 1381-1397 of HSCOC4_PEA_1_P12 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P12の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P12内の配列RAREGVGPGTGGGEGVEに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HSCOC4_PEA_1_P12 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence RAREGVGPGTGGGEGVE in HSCOC4_PEA_1_P12. %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域予測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region prediction program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSCOC4_PEA_1_P12もまた、表20に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P12配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P12 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 20 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P12 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P12は次の転写物にコ−ドされている:HSCOC4_PEA_1_T11、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T11のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置4691に終止する。転写物はまた、表21に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P12配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P12 is encoded in the following transcript: HSCOC4_PEA_1_T11, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T11 is shown in bold: this coding part starts at position 501 and ends at position 4691. The transcript also has the following SNPs listed in Table 21 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P12 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P15は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T14にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P15 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T14. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P15とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P15をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1359に相当し、またHSCOC4_PEA_1_P15のアミノ酸1〜1359にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P15のアミノ酸1360〜1415に相当する配列VNHSLVNHSLAWVARTPGPRGQARSRPQPPTRGIPAALLPGVFGGRLTSWLRDLELを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P15 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that encodes HSCOC4_PEA_1_P15 corresponds to amino acids 1-1359 of CO4_HUMAN_V1, and also corresponds to amino acids 1-1359 of HSCOC4_PEA_1_P15, a first amino acid sequence that is at least 90% homologous; And a polypeptide having the sequence VNHSLVNHSLAWVARTPGPRGQARSRPQPPTRGIPAALLPGVFGGRLTSWLRDLEL corresponding to amino acids 1360-1415 of HSCOC4_PEA_1_P15 is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P15の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P15内の配列VNHSLVNHSLAWVARTPGPRGQARSRPQPPTRGIPAALLPGVFGGRLTSWLRDLELに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P15 has at least about 70%, preferably at least about 80%, more preferably at least about 85% in the sequence VNHSLVNHSLAWVARTPGPRGQARSRPQPPTRGIPAALLPGVFGGRLTSWLRDLEL in HSCOC4_PEA_1_P15 %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域予測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region prediction program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSCOC4_PEA_1_P15もまた、表23に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P15配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P15 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 23 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P15 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P15は次の転写物にコ−ドされている:HSCOC4_PEA_1_T14、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T14のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置4745に終止する。転写物はまた、表24に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P15配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P15 is encoded in the following transcript: HSCOC4_PEA_1_T14, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T14 is shown in bold: this coding part starts at position 501 and ends at position 4745. The transcript also has the following SNPs listed in Table 24 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P15 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P16は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T15にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P16 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T15. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P16とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P16をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1457に相当し、またHSCOC4_PEA_1_P16のアミノ酸1〜1457にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P16のアミノ酸1458〜1483に相当する配列AERQGGAVWHGHRGRHPPEWIPRPACを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P16 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that encodes HSCOC4_PEA_1_P16 corresponds to amino acids 1-1457 of CO4_HUMAN_V1 and also corresponds to amino acids 1-1457 of HSCOC4_PEA_1_P16, which is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence AERQGGAVWHGHRGRHPPEWIPRPAC corresponding to amino acids 1458-1483 of HSCOC4_PEA_1_P16 The first amino acid sequence and the second amino acid sequence are continuously connected in order.

2.HSCOC4_PEA_1_P16の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P16内の配列AERQGGAVWHGHRGRHPPEWIPRPACに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P16 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence AERQGGAVWHGHRGRHPPEWIPRPAC in HSCOC4_PEA_1_P16. %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、既知タンパク質局在および/または遺伝子構造のマニュアル検査により、分泌型と考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization is considered secreted by manual inspection of known protein localization and / or gene structure.

変異体タンパク質HSCOC4_PEA_1_P16もまた、表26に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P16配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P16 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 26 (shown according to their amino acid sequence position, then the modified amino acids are listed; The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P16 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P16は次の転写物にコ−ドされている:HSCOC4_PEA_1_T15、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T15のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置4949に終止する。転写物はまた、表27に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P16配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P16 is encoded in the following transcript: HSCOC4_PEA_1_T15, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T15 is shown in bold: this coding part starts at position 501 and ends at position 4949. The transcript also has the following SNPs listed in Table 27 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P16 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P20は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T20にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P20 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T20. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P20とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P20をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1303に相当し、またHSCOC4_PEA_1_P20のアミノ酸1〜1303にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P20のアミノ酸1304〜1349に相当する配列VGAVPGLWRGWVVLRPRACLSPGSTSLGHGDCPGCPVCLLDCLPHHを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P20 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P20 corresponds to amino acids 1-11303 of CO4_HUMAN_V1 and also corresponds to amino acids 1-11303 of HSCOC4_PEA_1_P20, a first amino acid sequence that is at least 90% homologous, And a polypeptide having the sequence VGAVPGLWRGWVVLRPRACLSPGSTSLGHGDCPGCPVCLLDCLPHH corresponding to amino acids 1304-1349 of HSCOC4_PEA_1_P20 at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P20の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P20内の配列VGAVPGLWRGWVVLRPRACLSPGSTSLGHGDCPGCPVCLLDCLPHHに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P20 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% in sequence VGAVPGLWRGWVVLRPRACLSPGSTSLGHGDCPGCPVCLLDCLPHH in HSCOC4_PEA_1_P20. %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域予測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region prediction program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSCOC4_PEA_1_P20もまた、表29に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P20配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P20 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 29 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P20 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P20は次の転写物にコ−ドされている:HSCOC4_PEA_1_T20、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T20のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置4547に終止する。転写物はまた、表30に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P20配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P20 is encoded in the following transcript: HSCOC4_PEA_1_T20, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T20 is shown in bold: this coding part starts at position 501 and ends at position 4547. The transcript also has the following SNPs listed in Table 30 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P20 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P9は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T21にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P9 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T21. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P9とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P9をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1529に相当し、またHSCOC4_PEA_1_P9のアミノ酸1〜1529にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P9のアミノ酸1530〜1533に相当する配列SGERを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P9 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P9 corresponds to amino acids 1-1529 of CO4_HUMAN_V1 and also a first amino acid sequence that is at least 90% homologous corresponding to amino acids 1-1529 of HSCOC4_PEA_1_P9; And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence SGER corresponding to amino acids 1530-1533 of HSCOC4_PEA_1_P9 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P9の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P9内の配列SGERに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P9 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence SGER in HSCOC4_PEA_1_P9. %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域予測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region prediction program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSCOC4_PEA_1_P9もまた、表32に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P9配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P9 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 32 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P9 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P9は次の転写物にコ−ドされている:HSCOC4_PEA_1_T21、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T21のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置5099に終止する。転写物はまた、表33に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P9配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P9 is encoded in the following transcript: HSCOC4_PEA_1_T21, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T21 is shown in bold: this coding part starts at position 501 and ends at position 5099. The transcript also has the following SNPs listed in Table 33 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known) The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P9 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P22は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T25にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P22 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T25. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P22とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P22をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1653に相当し、またHSCOC4_PEA_1_P22のアミノ酸1〜1653にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQPASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRRALERGLQDEDGYRMKFACYYPRVEYGFQVKVLREDSRAAFRLFETKITQVLHFに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P22のアミノ酸1654〜1670に相当する配列SMKQTGEAGRAGGRQGGを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P22 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P22 corresponds to amino acids 1-1653 of CO4_HUMAN_V1, and also corresponds to amino acids 1-1653 of HSCOC4_PEA_1_P22, a first amino acid sequence that is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence SMKQTGEAGRAGGRQGG corresponding to amino acids 1654 to 1670 of HSCOC4_PEA_1_P22 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P22の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P22内の配列SMKQTGEAGRAGGRQGGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HSCOC4_PEA_1_P22 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence SMKQTGEAGRAGGRQGG in HSCOC4_PEA_1_P22. %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域予測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region prediction program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HSCOC4_PEA_1_P22もまた、表35に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P22配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P22 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 35 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P22 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P22は次の転写物にコ−ドされている:HSCOC4_PEA_1_T25、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T25のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置5510に終止する。転写物はまた、表36に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P22配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P22 is encoded in the following transcript: HSCOC4_PEA_1_T25, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T25 is shown in bold: this coding part starts at position 501 and ends at position 5510. The transcript also has the following SNPs listed in Table 36 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P22 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P23は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T28にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P23 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T28. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P23とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P23をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1626に相当し、またHSCOC4_PEA_1_P23のアミノ酸1〜1626にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQPASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRRALERGLQDEDGYRMKFACYYPRVEYGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P23のアミノ酸1627〜1685に相当する配列QSSHRGPGLTLPRGPAVLVSLGVACSSYRSCTQPVCSDTNFLPSQPQSNSPFPLLLTPSを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P23 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that encodes HSCOC4_PEA_1_P23 corresponds to amino acids 1-1626 of CO4_HUMAN_V1, and also corresponds to amino acids 1-1626 of HSCOC4_PEA_1_P23, a first amino acid sequence that is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence QSSHRGPGLTLPRGPAVLVSLGVACSSYRSCTQPVCSDTNFLPSQPQSNSPFPLLLTPS corresponding to amino acids 1627-1685 of HSCOC4_PEA_1_P23 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P23の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P23内の配列QSSHRGPGLTLPRGPAVLVSLGVACSSYRSCTQPVCSDTNFLPSQPQSNSPFPLLLTPSに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HSCOC4_PEA_1_P23 has at least about 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% in the sequence QSSHRGPGLTLPRGPAVLVSLGVACSSYRSCTQPVCSDTNFLPSQPQSNSPFPLLLTPS within HSCOC4_PEA_1_P23. %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、既知タンパク質の局在のマニュアル検査および/または遺伝子構造から分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization is believed to be secreted from manual inspection of known protein localization and / or gene structure.

変異体タンパク質HSCOC4_PEA_1_P23もまた、表38に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P23配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P23 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 38 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P23 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P23は次の転写物にコ−ドされている:HSCOC4_PEA_1_T28、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T28のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置5555に終止する。転写物はまた、表39に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P23配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P23 is encoded in the following transcript: HSCOC4_PEA_1_T28, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T28 is shown in bold: this coding part starts at position 501 and ends at position 5555. The transcript also has the following SNPs listed in Table 39 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P23 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P24は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T30にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P24 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T30. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P24とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P24をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1528に相当し、またHSCOC4_PEA_1_P24のアミノ酸1〜1528にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P24のアミノ酸1529〜1579に相当する配列SADVLCFTGHQVRADSWPPCVLLKSASVLRGSALASVAPWSGVCRTRMATGを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P24 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P24 corresponds to amino acids 1-1528 of CO4_HUMAN_V1 and also a first amino acid sequence that is at least 90% homologous corresponding to amino acids 1-1528 of HSCOC4_PEA_1_P24; And a polypeptide having the sequence SADVLCFTGHQVRADSWPPCVLLKSASVLRGSALASVAPWSGVCRTRMATG corresponding to amino acids 1529 to 1579 of HSCOC4_PEA_1_P24 is at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P24の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P24内の配列SADVLCFTGHQVRADSWPPCVLLKSASVLRGSALASVAPWSGVCRTRMATGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HSCOC4_PEA_1_P24 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 85% in the sequence SADVLCFTGHQVRADSWPPCVLLKSASVLRGSALASVAPWSGVCRTRMATG in HSCOC4_PEA_1_P24. %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると推定したこと、ならびにいずれの膜貫通領域予測プログラムも、このタンパク質が膜貫通領域を持つとは予測しなかったことから分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein was because both signal peptide prediction programs presumed that this protein had a signal peptide, and no transmembrane region prediction program predicted that this protein had a transmembrane region. It is believed to be secreted.

変異体タンパク質HSCOC4_PEA_1_P24もまた、表41に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P24配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P24 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 41 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P24 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P24は次の転写物にコ−ドされている:HSCOC4_PEA_1_T30、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T30のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置5237に終止する。転写物はまた、表42に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P24配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P24 is encoded in the following transcript: HSCOC4_PEA_1_T30, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T30 is shown in bold: this coding part starts at position 501 and ends at position 5237. The transcript also has the following SNPs listed in Table 42 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P24 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P25は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T31にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P25 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T31. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P25とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P25をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1593に相当し、またHSCOC4_PEA_1_P25のアミノ酸1〜1593にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQPASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P25のアミノ酸1594〜1657に相当する配列ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRLPGを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P25 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that encodes HSCOC4_PEA_1_P25 corresponds to amino acids 1-1593 of CO4_HUMAN_V1 and also corresponds to amino acids 1-1593 of HSCOC4_PEA_1_P25, a first amino acid sequence that is at least 90% homologous; And a polypeptide having the sequence ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRLPG corresponding to amino acids 1594 to 1657 of HSCOC4_PEA_1_P25 at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous The first amino acid sequence and the second amino acid sequence are continuously connected in order.

2.HSCOC4_PEA_1_P25の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P25内の配列ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRLPGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HSCOC4_PEA_1_P25 is at least about 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least 70% in the sequence ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRLPG in HSCOC4_PEA_1_P25. %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると推定したこと、ならびにいずれの膜貫通領域予測プログラムも、このタンパク質が膜貫通領域を持つとは予測しなかったことから分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein was because both signal peptide prediction programs presumed that this protein had a signal peptide, and no transmembrane region prediction program predicted that this protein had a transmembrane region. It is believed to be secreted.

変異体タンパク質HSCOC4_PEA_1_P25もまた、表44に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P25配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P25 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 44 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P25 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P25は次の転写物にコ−ドされている:HSCOC4_PEA_1_T31、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T31のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置5471に終止する。転写物はまた、表45に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P25配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P25 is encoded in the following transcript: HSCOC4_PEA_1_T31, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T31 is shown in bold: this coding part starts at position 501 and ends at position 5471. The transcript also has the following SNPs listed in Table 45 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P25 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P26は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T32にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P26 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T32. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P26とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P26をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1593に相当し、またHSCOC4_PEA_1_P26のアミノ酸1〜1593にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQPASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P26のアミノ酸1594〜1691に相当する配列ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRSVFPPRPWPDPPSGTGCFGLSGCSLLLLQVMHAACLLを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P26 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that encodes HSCOC4_PEA_1_P26 corresponds to amino acids 1-1593 of CO4_HUMAN_V1 and also corresponds to amino acids 1-1593 of HSCOC4_PEA_1_P26, which is at least 90% homologous, And a sequence ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRSVFPPRPWPDPPSGTGCFGLSGCSLLLLQVMHAACLLLLQVMHAACLL corresponding to amino acids 1594 to 1691 of HSCOC4_PEA_1_P26, and preferably at least 90%, more preferably at least 85% The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P26の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P26内の配列ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRSVFPPRPWPDPPSGTGCFGLSGCSLLLLQVMHAACLLに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P26 has a sequence of ETEGLGRGSGGGMAGAPPTLSDGFPNFREVPSPASRPGAGSAGRGWLQDEVCLLLPPCGVRSVFPPRPWPDPPSGTGCFGLSGCSLLLLQVMHAACL in HSCOC4_PEA_1_P26, preferably at least about 80%, preferably at least about 90% %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると推定したこと、ならびにいずれの膜貫通領域予測プログラムが、このタンパク質が膜貫通領域を持つとは予測しなかったことから分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein was because both signal peptide prediction programs assumed that the protein had a signal peptide, and no transmembrane region prediction program predicted that the protein had a transmembrane region. It is believed to be secreted.

変異体タンパク質HSCOC4_PEA_1_P26もまた、表47に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P26配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P26 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 47 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P26 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P26は次の転写物にコ−ドされている:HSCOC4_PEA_1_T32、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T32のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置5573に終止する。転写物はまた、表48に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P26配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P26 is encoded in the following transcript: HSCOC4_PEA_1_T32, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T32 is shown in bold: this coding part starts at position 501 and ends at position 5573. The transcript also has the following SNPs listed in Table 48 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P26 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P30は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T40にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P30 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T40. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P30とCO4_HUMAN_V3(配列番号:487)との比較報告:
1. HSCOC4_PEA_1_P30をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V3のアミノ酸1〜1232に相当し、またHSCOC4_PEA_1_P30のアミノ酸1〜1232にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P30のアミノ酸1233〜1253に相当する配列RNPVRLLQPRAQMFCVLRGTKを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P30 and CO4_HUMAN_V3 (SEQ ID NO: 487):
1. An isolated chimeric polypeptide that encodes HSCOC4_PEA_1_P30 corresponds to amino acids 1-1123 of CO4_HUMAN_V3, and also corresponds to amino acids 1-1123 of HSCOC4_PEA_1_P30, a first amino acid sequence that is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence RNPVRLLQPRAQMFCVLRGTK corresponding to amino acids 1233 to 1253 of HSCOC4_PEA_1_P30 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P30の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P30内の配列RNPVRLLQPRAQMFCVLRGTKに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P30 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence RNPVRLLQPRAQMFCVLRGTK in HSCOC4_PEA_1_P30. %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V3と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   It should be noted that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is called CO4_HUMAN_V3. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると推定したこと、ならびにいずれの膜貫通領域予測プログラムも、このタンパク質が膜貫通領域を持つとは予測しなかったことから分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein was because both signal peptide prediction programs presumed that this protein had a signal peptide, and no transmembrane region prediction program predicted that this protein had a transmembrane region. It is believed to be secreted.

変異体タンパク質HSCOC4_PEA_1_P30もまた、表50に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P30配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P30 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 50 (shown according to their amino acid sequence position, followed by modified amino acids; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P30 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P30は次の転写物にコ−ドされている:HSCOC4_PEA_1_T40、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T40のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置4259に終止する。転写物はまた、表51に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P30配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P30 is encoded in the following transcript: HSCOC4_PEA_1_T40, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T40 is shown in bold: this coding part starts at position 501 and ends at position 4259. The transcript also has the following SNPs listed in Table 51 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P30 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P38は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T2にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P38 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T2. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P38とCO4_HUMANとの比較報告:
1. HSCOC4_PEA_1_P38をコ−ドする単離されたキメラポリペプチドは、CO4_HUMANのアミノ酸1〜818に相当し、またHSCOC4_PEA_1_P38のアミノ酸1〜818にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P38のアミノ酸819〜843に相当する配列DVTLSGPQVTLLPFPCTPAPCSLCSを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P38 and CO4_HUMAN:
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P38 corresponds to amino acids 1 to 818 of CO4_HUMAN and also corresponds to amino acids 1 to 818 of HSCOC4_PEA_1_P38, a first amino acid sequence that is at least 90% homologous, And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence DVTLSGPQVTLLPFPCTPAPCSLCS corresponding to amino acids 819-843 of HSCOC4_PEA_1_P38 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P38の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P38内の配列DVTLSGPQVTLLPFPCTPAPCSLCSに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P38 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence DVTLSGPQVTLLPFPCTPAPCSLCS within HSCOC4_PEA_1_P38. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると推定したこと、ならびにいずれの膜貫通領域予測プログラムも、このタンパク質が膜貫通領域を持つとは予測しなかったことから分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein was because both signal peptide prediction programs presumed that this protein had a signal peptide, and no transmembrane region prediction program predicted that this protein had a transmembrane region. It is believed to be secreted.

変異体タンパク質HSCOC4_PEA_1_P38もまた、表52に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P38配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P38 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 52 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P38 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P38のグリコシレ−ション部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表53に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation sites of the mutant protein HSCOC4_PEA_1_P38 are shown in Table 53 in comparison with the complement C4 precursor of the known protein [containing: C4a anaphylatoxin] (first column aligned according to their position in the amino acid sequence; The second column indicates whether a glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P38のリン酸化部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表54に示す(最初の縦列にそれらのアミノ酸配列での位置を示し;第2列にはリン酸位置が変異体タンパク質に存在するかを示し;そして最後の縦列にはその位置が変異体タンパク質で異なっているかを示している)。   The phosphorylation sites of the mutant protein HSCOC4_PEA_1_P38 are shown in Table 54 in comparison with the complement of the known protein C4 precursor [containing: C4a anaphylatoxin] (first column shows their amino acid position; The two columns indicate whether the phosphate position is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P38は次の転写物にコ−ドされている:HSCOC4_PEA_1_T2、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T2のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置3029に終止する。転写物はまた、表55に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P38配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P38 is encoded in the following transcript: HSCOC4_PEA_1_T2, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T2 is shown in bold: this coding part starts at position 501 and ends at position 3029. The transcript also has the following SNPs listed in Table 55 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is known SNPs) The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P38 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P39は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T5にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P39 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T5. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P39とCO4_HUMANとの比較報告:
1. HSCOC4_PEA_1_P39をコ−ドする単離されたキメラポリペプチドは、CO4_HUMANのアミノ酸1〜387に相当し、またHSCOC4_PEA_1_P39のアミノ酸1〜387にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P39のアミノ酸388〜894に相当する配列VSSRGEGを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P39 and CO4_HUMAN:
1. HSCOC4_PEA_1_P39 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 387 of CO4_HUMAN, also the first amino acid sequence that is at least 90% homologous to MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQ which also corresponds to amino acids 1 to 387 of HSCOC4_PEA_1_P39 And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence VSSRGEG corresponding to amino acids 388 to 894 of HSCOC4_PEA_1_P39 A second amino acid sequence which is The amino acid sequence and a second amino acid sequence, has led to the order in succession.

2.HSCOC4_PEA_1_P39の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P39内の配列VSSRGEGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HSCOC4_PEA_1_P39 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence VSSRGEG in HSCOC4_PEA_1_P39. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると推定したこと、ならびにいずれの膜貫通領域予測プログラムも、このタンパク質が膜貫通領域を持つとは予測しなかったことから分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein was because both signal peptide prediction programs presumed that this protein had a signal peptide, and no transmembrane region prediction program predicted that this protein had a transmembrane region. It is believed to be secreted.

変異体タンパク質HSCOC4_PEA_1_P39もまた、表56に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P39配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P39 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 56 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P39 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P39のグリコシレ−ション部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表57に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation sites of the mutant protein HSCOC4_PEA_1_P39 are shown in Table 57 in comparison with the complement of the known protein C4 precursor [containing: C4a anaphylatoxin] (first column aligned according to their position in the amino acid sequence; The second column indicates whether a glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P39のリン酸化部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表58に示す(最初の縦列にそれらのアミノ酸配列での位置を示し;第2列にはリン酸位置が変異体タンパク質に存在するかを示し;そして最後の縦列にはその位置が変異体タンパク質で異なっているかを示している)。   The phosphorylation sites of the mutant protein HSCOC4_PEA_1_P39 are shown in Table 58 in comparison with the complement of the known protein C4 precursor [containing: C4a anaphylatoxin] (first column shows their amino acid position; The two columns indicate whether the phosphate position is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P39は次の転写物にコ−ドされている:HSCOC4_PEA_1_T5、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T5のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置1682に終止する。転写物はまた、表59に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P39配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P39 is encoded in the following transcript: HSCOC4_PEA_1_T5, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T5 is shown in bold: this coding part starts at position 501 and ends at position 1682. The transcript also has the following SNPs listed in Table 59 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known) The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P39 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P40は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T7にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P40 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T7. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P40とCO4_HUMANとの比較報告:
1. HSCOC4_PEA_1_P40をコ−ドする単離されたキメラポリペプチドは、CO4_HUMANのアミノ酸1〜236に相当し、またHSCOC4_PEA_1_P40のアミノ酸1〜236にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P40のアミノ酸237〜263に相当する配列AGEWTEPHFPLKGRVPGRPGEAEYGHYを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P40 and CO4_HUMAN:
1. HSCOC4_PEA_1_P40 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 236 of CO4_HUMAN, also the first amino acid sequence that is at least 90% homologous to MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKY which also corresponds to amino acids 1 to 236 of HSCOC4_PEA_1_P40 And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence AGEWTEPHFPLKGRVPGRPGEAEYGHY corresponding to amino acids 237 to 263 of HSCOC4_PEA_1_P40 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P40の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P40内の配列AGEWTEPHFPLKGRVPGRPGEAEYGHYに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P40 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence AGEWTEPHFPLKGRVPGRPGEAEYGHY in HSCOC4_PEA_1_P40. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると推定したこと、ならびにいずれの膜貫通領域予測プログラムも、このタンパク質が膜貫通領域を持つとは予測しなかったことから分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein was because both signal peptide prediction programs presumed that this protein had a signal peptide, and no transmembrane region prediction program predicted that this protein had a transmembrane region. It is believed to be secreted.

変異体タンパク質HSCOC4_PEA_1_P40もまた、表60に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P40配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P40 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 60 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P40 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P40のグリコシレ−ション部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表61に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation sites of the mutant protein HSCOC4_PEA_1_P40 are shown in Table 61 in comparison with the complement of the known protein C4 precursor [containing: C4a anaphylatoxin] (aligned according to their position in the amino acid sequence in the first column; The second column indicates whether a glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P40のリン酸化部位を、既知タンパク質の補体C4前駆体[含有:C4aアナフィラトキシン]と比較する形で表62に示す(最初の縦列にそれらのアミノ酸配列での位置を示し;第2列にはリン酸位置が変異体タンパク質に存在するかを示し;そして最後の縦列にはその位置が変異体タンパク質で異なっているかを示している)。   The phosphorylation sites of the mutant protein HSCOC4_PEA_1_P40 are shown in Table 62 in comparison with the complement of the known protein C4 precursor [included: C4a anaphylatoxin] (first column shows the position in their amino acid sequence; The two columns indicate whether the phosphate position is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P40は次の転写物にコ−ドされている:HSCOC4_PEA_1_T7、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T7のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置1289に終止する。転写物はまた、表63に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P40配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P40 is encoded in the following transcript: HSCOC4_PEA_1_T7, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T7 is shown in bold: this coding part starts at position 501 and ends at position 1289. The transcript also has the following SNPs listed in Table 63 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P40 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P41は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T8にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P41 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T8. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P41とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P41をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1529に相当し、またHSCOC4_PEA_1_P41のアミノ酸1〜1529にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRADLEKLTSLSDRYVSHFETEGPHVLLYFDSVに少なくとも90%相同である第一アミノ酸配列、およびHSCOC4_PEA_1_P41のアミノ酸1530〜1533に相当する配列SGERを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列を含み、このとき前記第一アミノ酸配列と第二アミノ酸配列は、連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P41 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P41 corresponds to amino acids 1-1529 of CO4_HUMAN_V1 and also corresponds to amino acids 1-1529 of HSCOC4_PEA_1_P41, a first amino acid sequence that is at least 90% homologous, And at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence SGER corresponding to amino acids 1530-1533 of HSCOC4_PEA_1_P41 The first amino acid sequence and the second amino acid sequence are successively connected in order.

2.HSCOC4_PEA_1_P41の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P41内の配列SGERに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSCOC4_PEA_1_P41 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence SGER in HSCOC4_PEA_1_P41. %, And most preferably at least about 95% homologous polypeptide.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。このタンパク質の局在は、既知タンパク質局在および/または遺伝子構造のマニュアル検査により、分泌型と考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. This protein localization is considered secreted by manual examination of known protein localization and / or gene structure.

変異体タンパク質HSCOC4_PEA_1_P41もまた、表65に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P41配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P41 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 65 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether or not the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P41 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P41は次の転写物にコ−ドされている:HSCOC4_PEA_1_T8、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T8のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置5099に終止する。転写物はまた、表66に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P41配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P41 is encoded in the following transcript: HSCOC4_PEA_1_T8, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T8 is shown in bold: this coding part starts at position 501 and ends at position 5099. The transcript also has the following SNPs listed in Table 66 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P41 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSCOC4_PEA_1_P42は本明細書の最後に示すアミノ酸配列を有する;それは転写物HSCOC4_PEA_1_T12にコ−ドされている。既知タンパク質(補体C4前駆体[含有:C4aアナフィラトキシン])とのアラインメントを、本明細書の最後に示す。これまでに公表されている一または複数のタンパク質配列との一または複数のアラインメントを本明細書の最後に示す。本発明の変異体タンパク質と、このうようなアラインメントを取った各タンパク質との関係を以下簡単に説明する:   The mutant protein HSCOC4_PEA_1_P42 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSCOC4_PEA_1_T12. An alignment with a known protein (complement C4 precursor [containing: C4a anaphylatoxin]) is shown at the end of the specification. One or more alignments with one or more protein sequences published so far are shown at the end of the specification. The relationship between the mutant protein of the present invention and each protein having such an alignment is briefly described below:

HSCOC4_PEA_1_P42とCO4_HUMAN_V1との比較報告:
1. HSCOC4_PEA_1_P42をコ−ドする単離されたキメラポリペプチドは、CO4_HUMAN_V1のアミノ酸1〜1473に相当し、またHSCOC4_PEA_1_P41のアミノ酸1〜1473にも相当するMRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQVVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLHQLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIYNPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQDDFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKPYILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLESQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGGEMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASGIPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSAGSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGATFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHGDHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVALGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAAGLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAKRCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKGQAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLPDSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLELRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFSVVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNPLDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGVASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQKGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKLQETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALHHGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYALTLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNPSDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFRSTQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQIRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIEVTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNRRRREAPKVVEEQESRVHYTVCIWに少なくとも90%相同である第一アミノ酸配列、HSCOC4_PEA_1_P42のアミノ酸1474〜1511に相当する配列WAPGAALGQGREGRTQAGAGLLEPAQAEPGRQLTRLHRを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第二アミノ酸配列、CO4_HUMAN_V1のアミノ酸1474〜1503に相当し、HSCOC4_PEA_1_P42のアミノ酸1512〜1541にも相当するRNGKVGLSGMAIADVTLLSGFHALRADLEKに少なくとも90%相同である第三アミノ酸配列、およびHSCOC4_PEA_1_P42のアミノ酸1542〜1555に相当する配列VWSATQGNPLCPRYを有するポリペプチドに少なくとも70%, 要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは95%相同である第四アミノ酸配列を含み、このとき前記第一アミノ酸配列第二アミノ酸配列、第三アミノ酸配列および第四アミノ酸配列は連続して順番につながっている。
Comparison report between HSCOC4_PEA_1_P42 and CO4_HUMAN_V1:
1. An isolated chimeric polypeptide that codes for HSCOC4_PEA_1_P42 corresponds to amino acids 1-1473 of CO4_HUMAN_V1, and also corresponds to amino acids 1-11473 of HSCOC4_PEA_1_P41, a first amino acid sequence that is at least 90% homologous, At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably 95% homologous to a polypeptide having the sequence WAPGAALGQGREGRTQAGAGLLEPAQAEPGRQLTRLHR corresponding to amino acids 1474-1511 of HSCOC4_PEA_1_P42 A second amino acid sequence, a third amino acid sequence that is at least 90% homologous to RNGKVGLSGMAIADVTLLSGFHALRADLEK, which corresponds to amino acids 1474 to 1503 of CO4_HUMAN_V1, and also corresponds to amino acids 1512 to 1541 of HSCOC4_PEA_1_P42, and a sequence of amino acids 1542 to 1555 corresponding to amino acids 1542 to 1555 of HSCOC4_PEA_1_P42 At least 70%, preferably at least 80% Preferably comprising a fourth amino acid sequence that is at least 85%, more preferably at least 90% and most preferably 95% homologous, wherein said first amino acid sequence second amino acid sequence, third amino acid sequence and fourth amino acid The array is connected sequentially.

2.HSCOC4_PEA_1_P42の端部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P42内の配列WAPGAALGQGREGRTQAGAGLLEPAQAEPGRQLTRLHRに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes for the end of HSCOC4_PEA_1_P42 has at least 70%, if required at least about 80%, preferably at least about 85%, more preferably at least about 85% in the sequence WAPGAALGQGREGRTQAGAGLLEPAQAEPGRQLTRLHR within HSCOC4_PEA_1_P42 Polypeptides that are 90% and most preferably at least about 95% homologous are included.

3.HSCOC4_PEA_1_P42の尾部をコ−ドする単離されたポリペプチドは、HSCOC4_PEA_1_P42内のVWSATQGNPLCPRYに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   3.An isolated polypeptide that codes the tail of HSCOC4_PEA_1_P42 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% of VWSATQGNPLCPRY in HSCOC4_PEA_1_P42 And most preferably comprises a polypeptide that is at least about 95% homologous.

既知タンパク質配列(CO4_HUMAN)は本明細書の最後に示す配列からの変更を一つまたは複数有しており、そのアミノ酸配列はCO4_HUMAN_V1と称することに注意するものとする。これらの変化は、起こることが既に知られており、下表に示す。   Note that the known protein sequence (CO4_HUMAN) has one or more changes from the sequence shown at the end of this specification, and its amino acid sequence is referred to as CO4_HUMAN_V1. These changes are already known to occur and are shown in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると推定したこと、ならびにいずれの膜貫通領域予測プログラムも、このタンパク質が膜貫通領域を持つとは予測しなかったことから分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein was because both signal peptide prediction programs presumed that this protein had a signal peptide, and no transmembrane region prediction program predicted that this protein had a transmembrane region. It is believed to be secreted.

変異体タンパク質HSCOC4_PEA_1_P42もまた、表68に掲載した以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSCOC4_PEA_1_P42配列内に既知SNPが存在することは、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSCOC4_PEA_1_P42 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 68 (shown according to their amino acid sequence position, then the modified amino acids are listed; last The column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HSCOC4_PEA_1_P42 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSCOC4_PEA_1_P42は次の転写物にコ−ドされている:HSCOC4_PEA_1_T12、この転写物の配列は本明細書の最後に示してある。転写物HSCOC4_PEA_1_T12のコ−ディング部分は太字で表している:このコ−ディング部分は、位置501から始まり、位置5165に終止する。転写物はまた、表69に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSCOC4_PEA_1_P42配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSCOC4_PEA_1_P42 is encoded in the following transcript: HSCOC4_PEA_1_T12, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSCOC4_PEA_1_T12 is shown in bold: this coding part starts at position 501 and ends at position 5165. The transcript also has the following SNPs listed in Table 69 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSCOC4_PEA_1_P42 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

上記のように、クラスタHSCOC4は、上表2に記載されており、またその配列を本明細書の最後に示す79個のセグメントを特徴としている。これらセグメントは、特に関心の対象であることからここに別々に記載した核酸配列部分である。   As noted above, cluster HSCOC4 is described in Table 2 above and is characterized by 79 segments whose arrangement is shown at the end of this specification. These segments are the nucleic acid sequence portions described separately here because they are of particular interest.

本発明のセグメントクラスタHSCOC4_PEA_1_node_1は24個のライブラリ−に裏付けられている。ライブラリ−の数は前述のように決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、 HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表70に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_1 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 70 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_5は29個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表71に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_5 of the present invention is supported by 29 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 71 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_7は35個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表72に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_7 of the present invention is supported by 35 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 72 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_30は35個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、 HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、 HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表73に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_30 of the present invention is supported by 35 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 73 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_33は30個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、 HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、 HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表74に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_33 of the present invention is supported by 30 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 74 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_35は31個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、 HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表75に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_35 of the present invention is supported by 31 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 75 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_37は33個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、 HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、 HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表76に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_37 of the present invention is supported by 33 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 76 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_39は35個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、 HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表77に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_39 of the present invention is supported by 35 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 77 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_43は34個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、 HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表78に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_43 of the present invention is supported by 34 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 78 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_48は2つのライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSCOC4_PEA_1_T2およびHSCOC4_PEA_1_T3。下表79に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_48 of the present invention is supported by two libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T2 and HSCOC4_PEA_1_T3. Table 79 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_49は37個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、 HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表80に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_49 of the present invention is supported by 37 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 80 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_51は40個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表81に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_51 of the present invention is supported by 40 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 81 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_58は52個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表82に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_58 of the present invention is supported by 52 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 82 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_59は8個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T4。下表83に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_59 of the present invention is supported by eight libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T4. Table 83 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_62は61個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表84に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_62 of the present invention is supported by 61 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 84 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_66は65個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、 HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表85に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_66 of the present invention is supported by 65 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 85 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_72は65個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表86に各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_72 of the present invention is supported by 65 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 86 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_77は2つのライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T14、およびHSCOC4_PEA_1_T20。下表87に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_77 of the present invention is supported by two libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T14, and HSCOC4_PEA_1_T20. Table 87 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_79は6個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T11。下表88に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_79 of the present invention is supported by six libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T11. Table 88 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_93は25個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T12およびHSCOC4_PEA_1_T21。下表89に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_93 of the present invention is supported by 25 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T12 and HSCOC4_PEA_1_T21. Table 89 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_100は13個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSCOC4_PEA_1_T21。下表90に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_100 of the present invention is supported by 13 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T21. Table 90 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_105は9個のライブラリ−に裏付けられている。ライブラリ−数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSCOC4_PEA_1_T28およびHSCOC4_PEA_1_T32。下表91に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_105 of the present invention is supported by nine libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T28 and HSCOC4_PEA_1_T32. Table 91 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

このセグメントについては、次のマイクロアレイ(チップ)デ−タもある。クラスタそのものに関して上記したように、各種オリゴヌクレオチドについて、様々な疾患状態、特に癌で異なって発現しているか試験した。表92に示すように、次のオリゴヌクレオチドがこのセグメント(乳癌に関係する)をヒットすることが見出された。   There is also the following microarray (chip) data for this segment. As described above for the cluster itself, various oligonucleotides were tested for differential expression in various disease states, particularly cancer. As shown in Table 92, the following oligonucleotides were found to hit this segment (related to breast cancer).

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_107は27個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28およびHSCOC4_PEA_1_T32。下表93に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_107 of the present invention is supported by 27 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28 and HSCOC4_PEA_1_T32. Table 93 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_108は120個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表94に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_108 of the present invention is supported by 120 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 94 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_109は12個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T25およびHSCOC4_PEA_1_T28。下表95に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_109 of the present invention is supported by 12 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T25 and HSCOC4_PEA_1_T28. Table 95 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_110は97個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表96に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_110 of the present invention is supported by 97 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 96 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_112は71個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表97に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_112 of the present invention is supported by 71 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 97 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_113は19個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28およびHSCOC4_PEA_1_T32。下表98に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_113 of the present invention is supported by 19 libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28 and HSCOC4_PEA_1_T32. Table 98 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の選択的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは、長さが約120bpまでであることから分けて説明する。   According to an optional aspect of the present invention, a short segment related to the cluster is also provided. These segments are described separately because they are up to about 120 bp in length.

本発明のセグメントクラスタHSCOC4_PEA_1_node_2は25個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表99に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_2 of the present invention is supported by 25 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 99 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_8は35個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表100に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_8 of the present invention is supported by 35 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 100 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_10は33個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表101に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_10 of the present invention is supported by 33 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 101 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_12は33個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表102に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_12 of the present invention is supported by 33 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 102 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_14は30個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表103に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_14 of the present invention is supported by 30 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 103 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_17は28個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表104に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_17 of the present invention is supported by 28 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40. Table 104 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_19は27個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表105に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_19 of the present invention is supported by 27 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40. Table 105 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_21は26個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表106に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_21 of the present invention is supported by 26 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 106 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_22は26個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表107に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_22 of the present invention is supported by 26 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 107 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_28は34個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表108に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_28 of the present invention is supported by 34 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 108 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_29は5個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSCOC4_PEA_1_T5。下表109に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_29 of the present invention is supported by five libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T5. Table 109 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_41は32個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表110に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_41 of the present invention is supported by 32 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 110 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_45は31個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表111に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_45 of the present invention is supported by 31 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 111 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_47は32個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表112に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_47 of the present invention is supported by 32 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 112 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_50は5個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSCOC4_PEA_1_T1およびHSCOC4_PEA_1_T3。下表113に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_50 of the present invention is supported by five libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T1 and HSCOC4_PEA_1_T3. Table 113 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_53は38個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表114に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_53 of the present invention is supported by 38 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 114 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_55は40個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表115に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_55 of the present invention is supported by 40 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 115 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_57は42個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表115に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_57 of the present invention is supported by 42 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 115 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_60は50個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表117に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_60 of the present invention is supported by 50 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 117 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_64は65個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表118に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_64 of the present invention is supported by 65 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40 . Table 118 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_69は次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32およびHSCOC4_PEA_1_T40。下表119に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster HSCOC4_PEA_1_node_69 of the present invention can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31 , HSCOC4_PEA_1_T32 and HSCOC4_PEA_1_T40. Table 119 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_70は58個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表120に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_70 of the present invention is supported by 58 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 120 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_71は58個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表121に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_71 of the present invention is supported by 58 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 121 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_73は1つのライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSCOC4_PEA_1_T20。下表122に各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_73 of the present invention is supported by one library. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T20. Table 122 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_74は次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表121に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster HSCOC4_PEA_1_node_74 of the present invention can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31 , And HSCOC4_PEA_1_T32. Table 121 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_75は65個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表124に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_75 of the present invention is supported by 65 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 124 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_76は66個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表125に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_76 of the present invention is supported by 66 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 125 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_78は71個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表126に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_78 of the present invention is supported by 71 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 126 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_80は75個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表127に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_80 of the present invention is supported by 75 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 127 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_82は次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表128に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster HSCOC4_PEA_1_node_82 of the present invention can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31 , And HSCOC4_PEA_1_T32. Table 128 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_83は77個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表129に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_83 of the present invention is supported by 77 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 129 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_84は次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表130に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster HSCOC4_PEA_1_node_84 of the present invention can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31 , And HSCOC4_PEA_1_T32. Table 130 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_85は68個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表131に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_85 of the present invention is supported by 68 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 131 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_86は7個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: HSCOC4_PEA_1_T12。下表132に各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_86 of the present invention is supported by seven libraries. Library numbers were determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T12. Table 132 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_87は74個のライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表133に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_87 of the present invention is supported by 74 libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 133 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_88は2つのライブラリ−に裏付けられている。ライブラリ−数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T12。下表134に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_88 of the present invention is supported by two libraries. Library numbers were determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T12. Table 134 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_89は次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表135に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster HSCOC4_PEA_1_node_89 of the present invention can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31 , And HSCOC4_PEA_1_T32. Table 135 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_90は次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表136に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster HSCOC4_PEA_1_node_90 of the present invention can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31 , And HSCOC4_PEA_1_T32. Table 136 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_91は次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表137に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster HSCOC4_PEA_1_node_91 of the present invention can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31 , And HSCOC4_PEA_1_T32. Table 137 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_92は次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表138に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster HSCOC4_PEA_1_node_92 of the present invention can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31 , And HSCOC4_PEA_1_T32. Table 138 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_94は次の転写物に見出すことができる:HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T12、およびHSCOC4_PEA_1_T21。下表139に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_94 of the present invention can be found in the following transcripts: HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T12, and HSCOC4_PEA_1_T21. Table 139 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_96は次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表141に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster HSCOC4_PEA_1_node_96 of the present invention can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 141 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_97は次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表141に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster HSCOC4_PEA_1_node_97 of the present invention can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 141 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_98は93個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T31、およびHSCOC4_PEA_1_T32。下表142に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_98 of the present invention is supported by 93 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T31, and HSCOC4_PEA_1_T32. Table 142 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_99は93個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32、およびHSCOC4_PEA_1_T40。下表143に各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_99 of the present invention is supported by 93 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32, and HSCOC4_PEA_1_T40. Table 143 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_101は116個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32、およびHSCOC4_PEA_1_T40。下表144に各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_101 of the present invention is supported by 116 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32, and HSCOC4_PEA_1_T40. Table 144 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_102は3つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T31およびHSCOC4_PEA_1_T32。下表145に各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_102 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSCOC4_PEA_1_T31 and HSCOC4_PEA_1_T32. Table 145 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_103は106個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32、およびHSCOC4_PEA_1_T40。下表146に各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_103 of the present invention is supported by 106 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32, and HSCOC4_PEA_1_T40. Table 146 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_104は101個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32、およびHSCOC4_PEA_1_T40。下表147に各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_104 of the present invention is supported by 101 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32, and HSCOC4_PEA_1_T40. Table 147 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_106は110個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32、およびHSCOC4_PEA_1_T40。下表148に各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_106 of the present invention is supported by 110 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32, and HSCOC4_PEA_1_T40. Table 148 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSCOC4_PEA_1_node_111は77個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSCOC4_PEA_1_T1、HSCOC4_PEA_1_T2、HSCOC4_PEA_1_T3、HSCOC4_PEA_1_T4、HSCOC4_PEA_1_T5、HSCOC4_PEA_1_T7、HSCOC4_PEA_1_T8、HSCOC4_PEA_1_T11、HSCOC4_PEA_1_T12、HSCOC4_PEA_1_T14、HSCOC4_PEA_1_T15、HSCOC4_PEA_1_T20、HSCOC4_PEA_1_T21、HSCOC4_PEA_1_T25、HSCOC4_PEA_1_T28、HSCOC4_PEA_1_T30、HSCOC4_PEA_1_T31、HSCOC4_PEA_1_T32、およびHSCOC4_PEA_1_T40。下表149に各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster HSCOC4_PEA_1_node_111 of the present invention is supported by 77 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSCOC4_PEA_1_T1, HSCOC4_PEA_1_T2, HSCOC4_PEA_1_T3, HSCOC4_PEA_1_T4, HSCOC4_PEA_1_T5, HSCOC4_PEA_1_T7, HSCOC4_PEA_1_T8, HSCOC4_PEA_1_T11, HSCOC4_PEA_1_T12, HSCOC4_PEA_1_T14, HSCOC4_PEA_1_T15, HSCOC4_PEA_1_T20, HSCOC4_PEA_1_T21, HSCOC4_PEA_1_T25, HSCOC4_PEA_1_T28, HSCOC4_PEA_1_T30, HSCOC4_PEA_1_T31, HSCOC4_PEA_1_T32, and HSCOC4_PEA_1_T40. Table 149 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:CO4_HUMAN
配列文書:
アラインメント:HSCOC4_PEA_1_P3 x CO4_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:8438.00
Escore:0
一致長:870 全長:870
一致パ−セント類似性:99.66 一致パ−セント同一性:99.66
全パ−セント類似性:99.66 全パ−セント同一性:99.66
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. .
851 LRPVLYNYLDKNLTVRPHRS 870
||||||||||||||| | |
851 LRPVLYNYLDKNLTVSVHVS 870
Alignment of mutant protein with known protein Sequence name: CO4_HUMAN
Sequence document:
Alignment: HSCOC4_PEA_1_P3 x CO4_HUMAN ..
Alignment segment 1/1:
Quality-: 8438.00
Escore: 0
Match length: 870 Total length: 870
Match Percent Similarity: 99.66 Match Percent Identity: 99.66
Total percent similarity: 99.66 Total percent identity: 99.66
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
..
851 LRPVLYNYLDKNLTVRPHRS 870
||||||||||||||| ||
851 LRPVLYNYLDKNLTVSVHVS 870

配列名:CO4_HUMAN
配列文書:
アラインメント:HSCOC4_PEA_1_P5 x CO4_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:7969.00
Escore:0
一致長:818 全長:818
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
.
801 DSLTTWEIHGLSLSKTKG 818
||||||||||||||||||
801 DSLTTWEIHGLSLSKTKG 818
Array name: CO4_HUMAN
Sequence document:
Alignment: HSCOC4_PEA_1_P5 x CO4_HUMAN ..
Alignment segment 1/1:
Quality: 7969.00
Escore: 0
Match length: 818 Total length: 818
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
.
801 DSLTTWEIHGLSLSKTKG 818
||||||||||||||||||||-
801 DSLTTWEIHGLSLSKTKG 818

配列名:CO4_HUMAN
配列文書:
アラインメント:HSCOC4_PEA_1_P6 x CO4_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:10211.00
Escore:0
一致長:1052 全長:1052
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050

1051 KG 1052
||
1051 KG 1052
Array name: CO4_HUMAN
Sequence document:
Alignment: HSCOC4_PEA_1_P6 x CO4_HUMAN ..
Alignment segment 1/1:
Quality-: 10211.00
Escore: 0
Match length: 1052 Total length: 1052
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050

1051 KG 1052
||
1051 KG 1052

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P12 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:13367.00
Escore:0
一致長:1380 全長:1380
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
. . .
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKV 1380
||||||||||||||||||||||||||||||
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKV 1380
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P12 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 13367.00
Escore: 0
Match length: 1380 Total length: 1380
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
..
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKV 1380
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKV 1380

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P15 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:13174.00
Escore:0
一致長:1359 全長:1359
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350

1351 IRGLEEELQ 1359
|||||||||
1351 IRGLEEELQ 1359
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P15 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 13174.00
Escore: 0
Match length: 1359 Total length: 1359
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350

1351 IRGLEEELQ 1359
||||||||||
1351 IRGLEEELQ 1359

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P16 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:14137.00
Escore:0
一致長:1457 全長:1457
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
. . . . .
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
||||||||||||||||||||||||||||||||||||||||||||||||||
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
. . . . .
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
||||||||||||||||||||||||||||||||||||||||||||||||||
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450

1451 RRREAPK 1457
|||||||
1451 RRREAPK 1457
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P16 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 14137.00
Escore: 0
Match length: 1457 Total length: 1457
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
...
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
...
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450

1451 RRREAPK 1457
||||||||
1451 RRREAPK 1457

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P20 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:12641.00
Escore:0
一致長:1303 全長:1303
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300

1301 STQ 1303
|||
1301 STQ 1303
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P20 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 12641.00
Escore: 0
Match length: 1303 Total length: 1303
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300

1301 STQ 1303
|||
1301 STQ 1303

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P9 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:14831.00
Escore:0
一致長:1529 全長:1529
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
. . . . .
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
||||||||||||||||||||||||||||||||||||||||||||||||||
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
. . . . .
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
||||||||||||||||||||||||||||||||||||||||||||||||||
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
. . . . .
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
||||||||||||||||||||||||||||||||||||||||||||||||||
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
. .
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSV 1529
|||||||||||||||||||||||||||||
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSV 1529
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P9 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 14831.00
Escore: 0
Match length: 1529 Total length: 1529
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
...
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
...
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
...
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
..
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSV 1529
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSV 1529

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P22 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:16066.00
Escore:0
一致長:1654 全長:1654
一致パ−セント類似性:100.00 一致パ−セント同一性:99.94
全パ−セント類似性:100.00 全パ−セント同一性:99.94
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
. . . . .
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
||||||||||||||||||||||||||||||||||||||||||||||||||
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
. . . . .
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
||||||||||||||||||||||||||||||||||||||||||||||||||
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
. . . . .
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
||||||||||||||||||||||||||||||||||||||||||||||||||
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
. . . . .
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
||||||||||||||||||||||||||||||||||||||||||||||||||
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
. . . . .
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRR 1600
||||||||||||||||||||||||||||||||||||||||||||||||||
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRR 1600
. . . . .
1601 ALERGLQDEDGYRMKFACYYPRVEYGFQVKVLREDSRAAFRLFETKITQV 1650
||||||||||||||||||||||||||||||||||||||||||||||||||
1601 ALERGLQDEDGYRMKFACYYPRVEYGFQVKVLREDSRAAFRLFETKITQV 1650

1651 LHFS 1654
|||:
1651 LHFT 1654
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P22 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 16066.00
Escore: 0
Match length: 1654 Total length: 1654
Match Percent Similarity: 100.00 Match Percent Identity: 99.94
Total percent similarity: 100.00 Total percent identity: 99.94
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
...
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
...
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
...
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
...
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
...
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRR 1600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRR 1600
...
1601 ALERGLQDEDGYRMKFACYYPRVEYGFQVKVLREDSRAAFRLFETKITQV 1650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1601 ALERGLQDEDGYRMKFACYYPRVEYGFQVKVLREDSRAAFRLFETKITQV 1650

1651 LHFS 1654
|||:
1651 LHFT 1654

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P23 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:15806.00
Escore:0
一致長:1626 全長:1626
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
. . . . .
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
||||||||||||||||||||||||||||||||||||||||||||||||||
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
. . . . .
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
||||||||||||||||||||||||||||||||||||||||||||||||||
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
. . . . .
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
||||||||||||||||||||||||||||||||||||||||||||||||||
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
. . . . .
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
||||||||||||||||||||||||||||||||||||||||||||||||||
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
. . . . .
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRR 1600
||||||||||||||||||||||||||||||||||||||||||||||||||
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRR 1600
. .
1601 ALERGLQDEDGYRMKFACYYPRVEYG 1626
||||||||||||||||||||||||||
1601 ALERGLQDEDGYRMKFACYYPRVEYG 1626
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P23 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 15806.00
Escore: 0
Match length: 1626 Total length: 1626
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
...
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
...
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
...
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
...
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
...
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRR 1600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEGKCPRQRR 1600
..
1601 ALERGLQDEDGYRMKFACYYPRVEYG 1626
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
1601 ALERGLQDEDGYRMKFACYYPRVEYG 1626

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P24 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:14823.00
Escore:0
一致長:1528 全長:1528
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
. . . . .
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
||||||||||||||||||||||||||||||||||||||||||||||||||
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
. . . . .
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
||||||||||||||||||||||||||||||||||||||||||||||||||
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
. . . . .
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
||||||||||||||||||||||||||||||||||||||||||||||||||
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
. .
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDS 1528
||||||||||||||||||||||||||||
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDS 1528
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P24 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 14823.00
Escore: 0
Match length: 1528 Total length: 1528
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
...
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
...
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
...
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
..
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDS 1528
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDS 1528

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P25 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:15464.00
Escore:0
一致長:1593 全長:1593
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
. . . . .
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
||||||||||||||||||||||||||||||||||||||||||||||||||
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
. . . . .
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
||||||||||||||||||||||||||||||||||||||||||||||||||
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
. . . . .
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
||||||||||||||||||||||||||||||||||||||||||||||||||
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
. . . . .
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
||||||||||||||||||||||||||||||||||||||||||||||||||
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
. . . .
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEG 1593
|||||||||||||||||||||||||||||||||||||||||||
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEG 1593
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P25 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 15464.00
Escore: 0
Match length: 1593 Total length: 1593
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
...
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
...
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
...
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
...
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
...
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEG 1593
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-||||||-||||||-||||-||||||-||||||||||| be be not
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEG 1593

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P26 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:15464.00
Escore:0
一致長:1593 全長:1593
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
. . . . .
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
||||||||||||||||||||||||||||||||||||||||||||||||||
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
. . . . .
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
||||||||||||||||||||||||||||||||||||||||||||||||||
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
. . . . .
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
||||||||||||||||||||||||||||||||||||||||||||||||||
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
. . . . .
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
||||||||||||||||||||||||||||||||||||||||||||||||||
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
. . . .
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEG 1593
|||||||||||||||||||||||||||||||||||||||||||
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEG 1593
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P26 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 15464.00
Escore: 0
Match length: 1593 Total length: 1593
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
...
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
...
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
...
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
...
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSVPTSRECVGFEAVQEVPVGLVQ 1550
...
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEG 1593
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-||||||-||||||-||||-||||||-||||||||||| be be not
1551 PASATLYDYYNPERRCSVFYGAPSKSRLLATLCSAEVCQCAEG 1593

配列名:CO4_HUMAN_V3
配列文書:
アラインメント:HSCOC4_PEA_1_P30 x CO4_HUMAN_V3 ..
アラインメントセグメント 1/1:
クオリティ−:11940.00
Escore:0
一致長:1232 全長:1232
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGS 1232
||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGS 1232
Array name: CO4_HUMAN_V3
Sequence document:
Alignment: HSCOC4_PEA_1_P30 x CO4_HUMAN_V3 ..
Alignment segment 1/1:
Quality-: 11940.00
Escore: 0
Match length: 1232 Total length: 1232
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
..
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGS 1232
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGS 1232

配列名:CO4_HUMAN
配列文書:
アラインメント:HSCOC4_PEA_1_P38 x CO4_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:7969.00
Escore:0
一致長:818 全長:818
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
.
801 DSLTTWEIHGLSLSKTKG 818
||||||||||||||||||
801 DSLTTWEIHGLSLSKTKG 818
Array name: CO4_HUMAN
Sequence document:
Alignment: HSCOC4_PEA_1_P38 x CO4_HUMAN ..
Alignment segment 1/1:
Quality: 7969.00
Escore: 0
Match length: 818 Total length: 818
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
.
801 DSLTTWEIHGLSLSKTKG 818
||||||||||||||||||||-
801 DSLTTWEIHGLSLSKTKG 818

配列名:CO4_HUMAN
配列文書:
アラインメント:HSCOC4_PEA_1_P39 x CO4_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:3766.00
Escore:0
一致長:387 全長:387
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQ 387
|||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQ 387
Array name: CO4_HUMAN
Sequence document:
Alignment: HSCOC4_PEA_1_P39 x CO4_HUMAN ..
Alignment segment 1/1:
Quality-: 376.000
Escore: 0
Match length: 387 Total length: 387
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
..
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQ 387
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in a state
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQ 387

配列名:CO4_HUMAN
配列文書:
アラインメント:HSCOC4_PEA_1_P40 x CO4_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:2309.00
Escore:0
一致長:236 全長:236
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKY 236
||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKY 236
Array name: CO4_HUMAN
Sequence document:
Alignment: HSCOC4_PEA_1_P40 x CO4_HUMAN ..
Alignment segment 1/1:
Quality-: 2309.00
Escore: 0
Match length: 236 Total length: 236
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
..
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKY 236
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||||||-
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKY 236

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P41 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:14831.00
Escore:0
一致長:1529 全長:1529
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
. . . . .
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
||||||||||||||||||||||||||||||||||||||||||||||||||
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
. . . . .
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
||||||||||||||||||||||||||||||||||||||||||||||||||
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
. . . . .
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
||||||||||||||||||||||||||||||||||||||||||||||||||
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
. .
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSV 1529
|||||||||||||||||||||||||||||
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSV 1529
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P41 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 14831.00
Escore: 0
Match length: 1529 Total length: 1529
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
...
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
...
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
...
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1451 RRREAPKVVEEQESRVHYTVCIWRNGKVGLSGMAIADVTLLSGFHALRAD 1500
..
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSV 1529
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
1501 LEKLTSLSDRYVSHFETEGPHVLLYFDSV 1529

配列名:CO4_HUMAN_V1
配列文書:
アラインメント:HSCOC4_PEA_1_P42 x CO4_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:14480.00
Escore:0
一致長:1506 全長:1544
一致パ−セント類似性:99.93 一致パ−セント同一性:99.87
全パ−セント類似性:97.47 全パ−セント同一性:97.41
ギャップ: 1
アラインメント:
. . . . .
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
. . . . .
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
. . . . .
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
. . . . .
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
. . . . .
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
. . . . .
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
. . . . .
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
. . . . .
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
. . . . .
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
. . . . .
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
. . . . .
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
. . . . .
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
. . . . .
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
. . . . .
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
. . . . .
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
. . . . .
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
. . . . .
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
. . . . .
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
. . . . .
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
. . . . .
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
. . . . .
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
. . . . .
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
||||||||||||||||||||||||||||||||||||||||||||||||||
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
. . . . .
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
||||||||||||||||||||||||||||||||||||||||||||||||||
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
. . . . .
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
||||||||||||||||||||||||||||||||||||||||||||||||||
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
. . . . .
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
||||||||||||||||||||||||||||||||||||||||||||||||||
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
. . . . .
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
||||||||||||||||||||||||||||||||||||||||||||||||||
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
. . . . .
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
||||||||||||||||||||||||||||||||||||||||||||||||||
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
. . . . .
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
||||||||||||||||||||||||||||||||||||||||||||||||||
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
. . . . .
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
||||||||||||||||||||||||||||||||||||||||||||||||||
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
. . . . .
1451 RRREAPKVVEEQESRVHYTVCIWWAPGAALGQGREGRTQAGAGLLEPAQA 1500
|||||||||||||||||||||||
1451 RRREAPKVVEEQESRVHYTVCIW........................... 1473
. . . .
1501 EPGRQLTRLHRRNGKVGLSGMAIADVTLLSGFHALRADLEKVWS 1544
||||||||||||||||||||||||||||||: |
1474 ...........RNGKVGLSGMAIADVTLLSGFHALRADLEKLTS 1506
Array name: CO4_HUMAN_V1
Sequence document:
Alignment: HSCOC4_PEA_1_P42 x CO4_HUMAN_V1 ..
Alignment segment 1/1:
Quality-: 14480.00
Escore: 0
Match length: 1506 Total length: 1544
Match Percent Similarity: 99.93 Match Percent Identity: 99.87
Total percent similarity: 97.47 Total percent identity: 97.41
Gap: 1
alignment:
...
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRLLWGLIWASSFFTLSLQKPRLLLFSPSVVHLGVPLSVGVQLQDVPRGQ 50
...
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 VVKGSVFLRNPSRNNVPCSPKVDFTLSSERDFALLSLQVPLKDAKSCGLH 100
...
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 QLLRGPEVQLVAHSPWLKDSLSRTTNIQGINLLFSSRRGHLFLQTDQPIY 150
...
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 NPGQRVRYRVFALDQKMRPSTDTITVMVENSHGLRVRKKEVYMPSSIFQD 200
...
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 DFVIPDISEPGTWKISARFSDGLESNSSTQFEVKKYVLPNFEVKITPGKP 250
...
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 YILTVPGHLDEMQLDIQARYIYGKPVQGVAYVRFGLLDEDGKKTFFRGLE 300
...
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 SQTKLVNGQSHISLSKAEFQDALEKLNMGITDLQGLRLYVAAAIIESPGG 350
...
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EMEEAELTSWYFVSSPFSLDLSKTKRHLVPGAPFLLQALVREMSGSPASG 400
...
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 IPVKVSATVSSPGSVPEVQDIQQNTDGSGQVSIPIIIPQTISELQLSVSA 450
...
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 GSPHPAIARLTVAAPPSGGPGFLSIERPDSRPPRVGDTLNLNLRAVGSGA 500
...
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 TFSHYYYMILSRGQIVFMNREPKRTLTSVSVFVDHHLAPSFYFVAFYYHG 550
...
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 DHPVANSLRVDVQAGACEGKLELSVDGAKQYRNGESVKLHLETDSLALVA 600
...
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LGALDTALYAAGSKSHKPLNMGKVFEAMNSYDLGCGPGGGDSALQVFQAA 650
...
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
651 GLAFSDGDQWTLSRKRLSCPKEKTTRKKRNVNFQKAINEKLGQYASPTAK 700
...
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
701 RCCQDGVTRLPMMRSCEQRAARVQQPDCREPFLSCCQFAESLRKKSRDKG 750
...
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
751 QAGLQRALEILQEEDLIDEDDIPVRSFFPENWLWRVETVDRFQILTLWLP 800
...
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
801 DSLTTWEIHGLSLSKTKGLCVATPVQLRVFREFHLHLRLPMSVRRFEQLE 850
...
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
851 LRPVLYNYLDKNLTVSVHVSPVEGLCLAGGGGLAQQVLVPAGSARPVAFS 900
...
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
901 VVPTAAAAVSLKVVARGSFEFPVGDAVSKVLQIEKEGAIHREELVYELNP 950
...
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
951 LDHRGRTLEIPGNSDPNMIPDGDFNSYVRVTASDPLDTLGSEGALSPGGV 1000
...
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1001 ASLLRLPRGCGEQTMIYLAPTLAASRYLDKTEQWSTLPPETKDHAVDLIQ 1050
...
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1051 KGYMRIQQFRKADGSYAAWLSRDSSTWLTAFVLKVLSLAQEQVGGSPEKL 1100
...
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1101 QETSNWLLSQQQADGSFQDPCPVLDRSMQGGLVGNDETVALTAFVTIALH 1150
...
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1151 HGLAVFQDEGAEPLKQRVEASISKASSFLGEKASAGLLGAHAAAITAYAL 1200
...
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1201 TLTKAPADLRGVAHNNLMAMAQETGDNLYWGSVTGSQSNAVSPTPAPRNP 1250
...
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1251 SDPMPQAPALWIETTAYALLHLLLHEGKAEMADQAAAWLTRQGSFQGGFR 1300
...
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1301 STQDTVIALDALSAYWIASHTTEERGLNVTLSSTGRNGFKSHALQLNNRQ 1350
...
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1351 IRGLEEELQFSLGSKINVKVGGNSKGTLKVLRTYNVLDMKNTTCQDLQIE 1400
...
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1401 VTVKGHVEYTMEANEDYEDYEYDELPAKDDPDAPLQPVTPLQLFEGRRNR 1450
...
1451 RRREAPKVVEEQESRVHYTVCIWWAPGAALGQGREGRTQAGAGLLEPAQA 1500
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
1451 RRREAPKVVEEQESRVHYTVCIW ........................... 1473
...
1501 EPGRQLTRLHRRNGKVGLSGMAIADVTLLSGFHALRADLEKVWS 1544
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
1474 ........... RNGKVGLSGMAIADVTLLSGFHALRADLEKLTS 1506

クラスタHUMTREFACの説明
クラスタHUMTREFACは、その名称を表1および2にそれぞれ示し、配列それ自体は本明細書の最後に示す、関心対象の2つの転写物と7個のセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Description of Cluster HUMTREFAC Cluster HUMTREFAC is characterized by two transcripts of interest and seven segments, the names of which are shown in Tables 1 and 2, respectively, and the sequence itself is given at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は既知タンパク質であるトレフォイル因子3前駆体(SwissProtアクセッション識別子TFF3_HUMAN:同義語の腸トレフォイル因子;hP1.Bとしても知られる)、配列番号:516であり、ここでは既知タンパク質と呼ぶ。   These sequences are the known protein trefoil factor 3 precursor (SwissProt accession identifier TFF3_HUMAN: synonymous intestinal trefoil factor; also known as hP1.B), SEQ ID NO: 516, referred to herein as the known protein.

タンパク質のトレフォイル因子3前駆体は次の機能を有することが知られているか、または有すると考えられている:細胞移動を促進する役割を果たす可能性を有する(モトゲン)。タンパク質のトレフォイル因子3前駆体の配列は、本明細書の最後に「トレフォイル因子3前駆体アミノ酸配列」として示されている。この配列について知られている多形を表4に示す。   The protein trefoil factor 3 precursor is known or thought to have the following function: has the potential to play a role in promoting cell migration (motogen). The sequence of the protein trefoil factor 3 precursor is shown at the end of the specification as the “trefoil factor 3 precursor amino acid sequence”. Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質、トレフォイル因子3前駆体の局在は、分泌型と考えられている。   The localization of the protein, trefoil factor 3 precursor, is thought to be secreted.

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;防御反応;消化、これらは生物学的プロセスに関係する注釈であり;そして細胞外、これは細胞成分に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; defense reactions; digestion, these are annotations related to biological processes; and extracellular, this is an annotation related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタHUMTREFACは、癌においてこのクラスタ転写物が過剰発現することにより、診断マ−カ−として用いることができる。このようような転写物の正常組織での発現も、前述の方法によって得られる。表、左手縦列の項目「数」および図36のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けされたEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster HUMTREFAC can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The number of items in the table, left hand column “number” and the y-axis number in FIG. 36 is the weighted EST expression for each category expressed in the form of “parts per million” Expressed ratio of EST expression of a specific cluster to expression of all ESTs of this classification).

全体として、図36のヒストグラムおよび表5に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);各種組織由来の混合型悪性腫瘍、乳房悪性腫瘍、膵臓癌、および前立腺癌。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 36 and Table 5. This cluster is overexpressed (at least at a minimal level) in the following pathological conditions: mixed malignancies from various tissues, breast malignancies, pancreatic cancer, and prostate cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタHUMTREFACは、上表1に記載の、2つの転写物を特徴とする。これら転写物は、タンパク質、トレフォイル因子3前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, the cluster HUMTREFAC is characterized by the two transcripts listed in Table 1 above. These transcripts code for proteins that are variants of the protein, trefoil factor 3 precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質HUMTREFAC_PEA_2_P7は、本明細書最後に示すアミノ酸配列を有する;それは転写物HUMTREFAC_PEA_2_T5にコ−ドされている。変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   The mutant protein HUMTREFAC_PEA_2_P7 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HUMTREFAC_PEA_2_T5. Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HUMTREFAC_PEA_2_P7はまた、表7に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMTREFAC_PEA_2_P7配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HUMTREFAC_PEA_2_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HUMTREFAC_PEA_2_P7 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMTREFAC_PEA_2_P7は、次の転写物にコ−ドされている:HUMTREFAC_PEA_2_T5、この転写物の配列は本明細書の最後に示してある。転写物HUMTREFAC_PEA_2_T5のコ−ディング部分は太字で表している:このコ−ディング部分は、位置278から始まり、位置688に終止する。転写物はまた、表8に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMTREFAC_PEA_2_P7配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMTREFAC_PEA_2_P7 is encoded in the following transcript: HUMTREFAC_PEA_2_T5, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HUMTREFAC_PEA_2_T5 is shown in bold: this coding part starts at position 278 and ends at position 688. The transcript also has the following SNPs listed in Table 8 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HUMTREFAC_PEA_2_P7 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HUMTREFAC_PEA_2_P8は、本明細書最後に示すアミノ酸配列を有する;それは転写物HUMTREFAC_PEA_2_T4にコ−ドされている。本明細書最後に、既知タンパク質(トレフォイル因子3前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HUMTREFAC_PEA_2_P8 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript HUMTREFAC_PEA_2_T4. At the end of this specification, an alignment to a known protein (trefoil factor 3 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HUMTREFAC_PEA_2_P8とTFF3_HUMANの比較報告:
1. UMTREFAC_PEA_2_P8をコ−ドする単離されたキメラポリペプチドは、TFF3_HUMANのアミノ酸1〜27に相当し、またUMTREFAC_PEA_2_P8のアミノ酸1〜27にも相当するMAARALCMLGLVLALLSSSSAEEYVGLに少なくとも90%相同である第一アミノ酸配列、およびUMTREFAC_PEA_2_P8のアミノ酸28〜41に相当する配列WKVHLPKGEGFSSGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between HUMTREFAC_PEA_2_P8 and TFF3_HUMAN:
1. The isolated chimeric polypeptide that codes for UMTREFAC_PEA_2_P8 is the first amino acid sequence that is at least 90% homologous to MAARALCMLGLVLALLSSSSAEEYVGL corresponding to amino acids 1-27 of TFF3_HUMAN and also corresponding to amino acids 1-27 of UMTREFAC_PEA_2_P8 , And a polypeptide having the sequence WKVHLPKGEGFSSG corresponding to amino acids 28-41 of UMTREFAC_PEA_2_P8, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2.HUMTREFAC_PEA_2_P8の尾部をコ−ドする単離されたポリペプチドは、HUMTREFAC_PEA_2_P8内の配列WKVHLPKGEGFSSGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of HUMTREFAC_PEA_2_P8 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence WKVHLPKGEGFSSG in HUMTREFAC_PEA_2_P8. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HUMTREFAC_PEA_2_P8はまた、表9に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMTREFAC_PEA_2_P8配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMTREFAC_PEA_2_P8 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 9 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP in the mutant protein HUMTREFAC_PEA_2_P8 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMTREFAC_PEA_2_P8は、次の転写物にコ−ドされている:HUMTREFAC_PEA_2_T4、この転写物の配列は本明細書の最後に示してある。転写物HUMTREFAC_PEA_2_T4のコ−ディング部分は太字で表している:このコ−ディング部分は、位置278から始まり、位置400に終止する。転写物はまた、表10に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMTREFAC_PEA_2_P8配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMTREFAC_PEA_2_P8 is encoded in the following transcript: HUMTREFAC_PEA_2_T4, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HUMTREFAC_PEA_2_T4 is shown in bold: this coding part starts at position 278 and ends at position 400. The transcript also has the following SNPs listed in Table 10 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HUMTREFAC_PEA_2_P8 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記したように、クラスタHUMTREFACは上表2に記載され、その配列を本明細書の最後に示す7個のセグメントを特徴とする。これらセグメントは、特に関心の対象であることからここに別々に記載する核酸配列の部分である。次に本発明の各セグメントについて説明する。   As mentioned above, the cluster HUMTREFAC is described in Table 2 above and is characterized by seven segments whose arrangement is shown at the end of this specification. These segments are part of the nucleic acid sequence described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタHUMTREFAC_PEA_2_node_0は188個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。下表11に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMTREFAC_PEA_2_node_0 of the present invention is supported by 188 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 11 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMTREFAC_PEA_2_node_9は150個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。下表12に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMTREFAC_PEA_2_node_9 of the present invention is supported by 150 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 12 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の好選的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは約120bpまでの長さであることから、分けて説明する。   According to a preferred aspect of the invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they will be described separately.

本発明のセグメントクラスタHUMTREFAC_PEA_2_node_2は4個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMTREFAC_PEA_2_T4。下表13に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMTREFAC_PEA_2_node_2 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMTREFAC_PEA_2_T4. Table 13 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMTREFAC_PEA_2_node_3は10個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。下表14に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMTREFAC_PEA_2_node_3 of the present invention is supported by 10 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 14 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMTREFAC_PEA_2_node_3は197個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。下表15に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMTREFAC_PEA_2_node_3 of the present invention is supported by 197 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMTREFAC_PEA_2_node_5は187個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。下表16に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMTREFAC_PEA_2_node_5 of the present invention is supported by 187 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMTREFAC_PEA_2_node_8は次の転写物に見いだすことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。下表17に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMTREFAC_PEA_2_node_8 of the present invention can be found in the following transcripts: HUMTREFAC_PEA_2_T4 and HUMTREFAC_PEA_2_T5. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:TFF3_HUMAN
配列文書:
アラインメント:HUMTREFAC_PEA_2_P8 x TFF3_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:246.00
Escore:0
一致長:27 全長:27
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. .
1 MAARALCMLGLVLALLSSSSAEEYVGL 27
|||||||||||||||||||||||||||
1 MAARALCMLGLVLALLSSSSAEEYVGL 27
Alignment of mutant protein with known protein Sequence name: TFF3_HUMAN
Sequence document:
Alignment: HUMTREFAC_PEA_2_P8 x TFF3_HUMAN ..
Alignment segment 1/1:
Quality: 246.00
Escore: 0
Match length: 27 Total length: 27
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
..
1 MAARALCMLGLVLALLSSSSAEEYVGL 27
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
1 MAARALCMLGLVLALLSSSSAEEYVGL 27

クラスタHUMOSTROの説明
クラスタHUMOSTROは、その名称を表1および2にそれぞれ示し、配列それ自体を本明細書の最後に示す、関心対象の3つの転写物と30個のセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Description of Cluster HUMOSTRO Cluster HUMOSTRO is characterized by three transcripts of interest and 30 segments, whose names are shown in Tables 1 and 2, respectively, and the sequence itself is shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は既知タンパク質であるオステオポンチン前駆体(SwissProtアクセッション識別子OSTP_HUMAN:同義語の骨シアロタンパク質1;尿結石タンパク質;分泌型リンタンパク質1;SPP−1;ネフロポンチン;ウロポンチンとしても知られる)、配列番号:552であり、ここでは既知タンパク質と呼ぶ。   These sequences are known as osteopontin precursors (SwissProt accession identifier OSTP_HUMAN: synonymous bone sialoprotein 1; urinary calculus protein; secreted phosphoprotein 1; SPP-1; nephrontin; also known as uropontin), SEQ ID NO: : 552, referred to herein as a known protein.

タンパク質のオステオポンチン前駆体は次の機能を有することが知られているか、または有すると考えられている:ヒドロキシアパタイトに強固に結合する。ミネラル化したマトリックスの統合部分を形成すると思われる。おそらく、細胞マトリックス相互作用にとって重要である;インタ−フェロン−ガンマおよびインタ−ロイキン−12の産生増加およびインタ−ロイキン−10の産生減少に関与するサイトカインとして機能し、I型免疫をもたらす経路に必須である(類推より)。タンパク質のオステオポンチン前駆体の配列は、本明細書の最後に「オステオポンチン前駆体アミノ酸配列」として示されている。この配列について知られている多形を表4に示す。   Protein osteopontin precursors are known or believed to have the following functions: bind tightly to hydroxyapatite. It appears to form an integral part of the mineralized matrix. Probably important for cell matrix interactions; functions as a cytokine involved in increased production of inter-feron-gamma and inter-leukin-12 and decreased production of inter-leukin-10, essential for pathways that lead to type I immunity (By analogy) The sequence of the protein osteopontin precursor is shown at the end of the specification as the “osteopontin precursor amino acid sequence”. Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質、オステオポンチン前駆体の局在は、分泌型と考えられている。   The localization of the protein, osteopontin precursor, is thought to be secreted.

既知タンパク質は次の適用および/または潜在的治療使用も有している:再生、骨。これについては、ヒトでの臨床/治療使用について、例えば抗体もしくは小分子の標的として、および/または直接的治療薬としての研究が行われている。これら研究に関係する、入手可能な情報は次の通りである。既知タンパク質の潜在的な薬学的または治療薬に関係する活性は次の通りである:骨形成刺激物質。クラスタが表すタンパク質について、治療的役割が予測されている。薬物デ−タベ−スまたは公開デ−タベ−ス(本明細書内に上記したような)に、このタンパク質またはその一部が治療適用の可能性を目的に使用されているか、または使用できるという情報があることから、本クラスタはこの分野に割り当てられた:筋肉骨格系。   Known proteins also have the following applications and / or potential therapeutic uses: regeneration, bone. In this regard, research has been conducted on clinical / therapeutic use in humans, for example as antibodies or small molecule targets and / or as direct therapeutics. The information available on these studies is as follows: Activities related to potential pharmaceutical or therapeutic agents of known proteins are: osteogenic stimulators. A therapeutic role is predicted for the protein represented by the cluster. In a drug database or public database (as described hereinabove), the protein or part thereof is or is being used for potential therapeutic applications Given the information, this cluster has been assigned to this area: the musculoskeletal system.

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;骨化作用;抗アポト−シス;炎症反応;細胞マトリックス接着;細胞間シグナル伝達、これらは生物学的プロセスに関係する注釈であり;防御/免疫タンパク質;サイトカイン;インテグリンリガンド;タンパク質結合;増殖因子;アポト−シスインヒビタ−、これらは分子機能に関係する注釈付けであり;そして細胞外マトリックス、これは細胞成分に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; ossification; anti-apoptosis; inflammatory response; cell matrix adhesion; intercellular signaling; these are annotations related to biological processes; defense / immune proteins; Cytokines; integrin ligands; protein binding; growth factors; apoptotic inhibitors; these are annotations related to molecular function; and extracellular matrices, which are annotations related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタHUMOSTROは、癌においてこのクラスタ転写物が過剰発現することから、診断マ−カ−として用いることができる。このような転写物の正常組織での発現も、前述した方法によって得られる。表、左手縦列の項目「数」および図37のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けされたEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster HUMOSTRO can be used as a diagnostic marker because this cluster transcript is overexpressed in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The number of items in the table, left hand column “number” and the y-axis number in FIG. 37 is the weighted EST expression for each classification expressed in the form of “parts per million” Expressed ratio of EST expression of a specific cluster to expression of all ESTs of this classification).

全体として、図37のヒストグラムおよび表5に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);上皮性悪性腫瘍、各種組織由来の混合型悪性腫瘍、肺悪性腫瘍、乳房悪性腫瘍、卵巣癌、および皮膚癌。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 37 and Table 5. This cluster is overexpressed (at least at the lowest level) in the following pathological conditions: epithelial malignancy, mixed malignancy from various tissues, lung malignancy, breast malignancy, ovarian cancer, and skin cancer .

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタHUMOSTROは、上表1に記載の、3つの転写物を特徴とする。これら転写物は、タンパク質、オステオポンチン前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As mentioned above, the cluster HUMOSTRO is characterized by the three transcripts listed in Table 1 above. These transcripts code for proteins, which are variants of the protein, osteopontin precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P21は、本明細書最後に示すアミノ酸配列を有する;それは転写物HUMOSTRO_PEA_1_PEA_1_T14にコ−ドされている。本明細書の最後に、既知タンパク質(オステオポンチン前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HUMOSTRO_PEA_1_PEA_1_P21 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HUMOSTRO_PEA_1_PEA_1_T14. At the end of the specification, an alignment to a known protein (osteopontin precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HUMOSTRO_PEA_1_PEA_1_P21とOSTP_HUMANの比較報告:
1. HUMOSTRO_PEA_1_PEA_1_P21をコ−ドする単離されたキメラポリペプチドは、OSTP_HUMANのアミノ酸1〜58に相当し、またHUMOSTRO_PEA_1_PEA_1_P21のアミノ酸1〜58にも相当するMRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQKQNLLAPQに少なくとも90%相同である第一アミノ酸配列、およびHUMOSTRO_PEA_1_PEA_1_P21のアミノ酸59〜64に相当する配列VFLNFSを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between HUMOSTRO_PEA_1_PEA_1_P21 and OSTP_HUMAN:
1. The isolated chimeric polypeptide that codes for HUMOSTRO_PEA_1_PEA_1_P21 corresponds to amino acids 1 to 58 of OSTP_HUMAN and also to the first amino acid sequence of MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATN% of amino acids 1 to 58 corresponding to amino acids 1 to 58 of HUMOSTRO_PEA_1_PEA_1_P21 And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% of the polypeptide having the sequence VFLNFS corresponding to amino acids 59-64 of HUMOSTRO_PEA_1_PEA_1_P21 A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. HUMOSTRO_PEA_1_PEA_1_P21の尾部をコ−ドする単離されたポリペプチドは、HUMOSTRO_PEA_1_PEA_1_P21内の配列VFLNFSに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of HUMOSTRO_PEA_1_PEA_1_P21 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90%, to the sequence VFLNFS within HUMOSTRO_PEA_1_PEA_1_P21. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は既知タンパク質局在のマニュアル検査および/または遺伝子構造から、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization is believed to be secreted from manual examination of known protein localization and / or gene structure.

変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P21はまた、表7に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P21配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HUMOSTRO_PEA_1_PEA_1_P21 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 7 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether the SNP is known; the presence of a known SNP within the mutant protein HUMOSTRO_PEA_1_PEA_1_P21 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P21のグリコシレ−ション部位を、既知タンパク質のオステオポンチン前駆体と比較する形で表8に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation sites of the mutant protein HUMOSTRO_PEA_1_PEA_1_P21 are shown in Table 8 in comparison with the known protein osteopontin precursor (the first column is arranged according to their position in the amino acid sequence; the second column is the glycosylation site) Indicates whether it is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P21は、次の転写物にコ−ドされている:HUMOSTRO_PEA_1_PEA_1_T14、この転写物の配列は本明細書の最後に示してある。転写物HUMOSTRO_PEA_1_PEA_1_T14のコ−ディング部分は太字で表している:このコ−ディング部分は、位置199から始まり、位置390に終止する。転写物はまた、表9に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P21配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P21 is encoded in the following transcript: HUMOSTRO_PEA_1_PEA_1_T14, the sequence of this transcript is given at the end of the description. The coding part of the transcript HUMOSTRO_PEA_1_PEA_1_T14 is shown in bold: this coding part starts at position 199 and ends at position 390. The transcript also has the following SNPs listed in Table 9 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HUMOSTRO_PEA_1_PEA_1_P21 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P25は、本明細書最後に示すアミノ酸配列を有する;それは転写物HUMOSTRO_PEA_1_PEA_1_T16にコ−ドされている。本明細書の最後に、既知タンパク質(オステオポンチン前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HUMOSTRO_PEA_1_PEA_1_P25 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HUMOSTRO_PEA_1_PEA_1_T16. At the end of the specification, an alignment to a known protein (osteopontin precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HUMOSTRO_PEA_1_PEA_1_P25とOSTP_HUMANの比較報告:
1. HUMOSTRO_PEA_1_PEA_1_P25をコ−ドする単離されたキメラポリペプチドは、OSTP_HUMANのアミノ酸1〜31に相当し、またHUMOSTRO_PEA_1_PEA_1_P21のアミノ酸1〜31にも相当するMRIAVICFCLLGITCAIPVKQADSGSSEEKQに少なくとも90%相同である第一アミノ酸配列、およびHUMOSTRO_PEA_1_PEA_1_P25のアミノ酸32に相当する配列Hを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between HUMOSTRO_PEA_1_PEA_1_P25 and OSTP_HUMAN:
1. The isolated chimeric polypeptide that codes for HUMOSTRO_PEA_1_PEA_1_P25 is the first amino acid sequence that is at least 90% homologous to MRIAVICFCLLGITCAIPVKQADSGSSEEKQ corresponding to amino acids 1-31 of OSTP_HUMAN and also corresponding to amino acids 1-31 of HUMOSTRO_PEA_1_PEA_1_P21 And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence H corresponding to amino acid 32 of HUMOSTRO_PEA_1_PEA_1_P25 It includes a second amino acid sequence, wherein the first and second amino acid sequences are successively connected in sequence.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P25はまた、表10に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P25配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P25 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 10 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP in the mutant protein HUMOSTRO_PEA_1_PEA_1_P25 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P25のグリコシレ−ション部位を、既知タンパク質のオステオポンチン前駆体と比較する形で表11に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation sites of the mutant protein HUMOSTRO_PEA_1_PEA_1_P25 are shown in Table 11 in comparison with known protein osteopontin precursors (the first column is arranged according to their position in the amino acid sequence; the second column is the glycosylation site) Indicates whether it is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P25は、次の転写物にコ−ドされている:HUMOSTRO_PEA_1_PEA_1_T16、この転写物の配列は本明細書の最後に示してある。転写物HUMOSTRO_PEA_1_PEA_1_T16のコ−ディング部分は太字で表している:このコ−ディング部分は、位置199から始まり、位置294に終止する。転写物はまた、表12に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P25配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P25 is encoded in the following transcript: HUMOSTRO_PEA_1_PEA_1_T16, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HUMOSTRO_PEA_1_PEA_1_T16 is shown in bold: this coding part starts at position 199 and ends at position 294. The transcript also has the following SNPs listed in Table 12 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is known SNP) The presence of a known SNP in the mutant protein HUMOSTRO_PEA_1_PEA_1_P25 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P30は、本明細書最後に示すアミノ酸配列を有する;それは転写物HUMOSTRO_PEA_1_PEA_1_T30にコ−ドされている。本明細書の最後に、既知タンパク質(オステオポンチン前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HUMOSTRO_PEA_1_PEA_1_P30 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HUMOSTRO_PEA_1_PEA_1_T30. At the end of the specification, an alignment to a known protein (osteopontin precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HUMOSTRO_PEA_1_PEA_1_P30とOSTP_HUMANの比較報告:
1. HUMOSTRO_PEA_1_PEA_1_P30をコ−ドする単離されたキメラポリペプチドは、OSTP_HUMANのアミノ酸1〜31に相当し、またHUMOSTRO_PEA_1_PEA_1_P30のアミノ酸1〜31にも相当するMRIAVICFCLLGITCAIPVKQADSGSSEEKQに少なくとも90%相同である第一アミノ酸配列、およびHUMOSTRO_PEA_1_PEA_1_P30のアミノ酸32〜39に相当する配列VSIFYVFIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between HUMOSTRO_PEA_1_PEA_1_P30 and OSTP_HUMAN:
1. An isolated chimeric polypeptide that codes for HUMOSTRO_PEA_1_PEA_1_P30 is a first amino acid sequence that is at least 90% homologous to MRIAVICFCLLGITCAIPVKQADSGSSEEKQ corresponding to amino acids 1-31 of OSTP_HUMAN and also corresponding to amino acids 1-31 of HUMOSTRO_PEA_1_PEA_1_P30 And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% of the polypeptide having the sequence VSIFYVFI corresponding to amino acids 32-39 of HUMOSTRO_PEA_1_PEA_1_P30 A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. HUMOSTRO_PEA_1_PEA_1_P30の尾部をコ−ドする単離されたポリペプチドは、HUMOSTRO_PEA_1_PEA_1_P30内の配列VSIFYVFIに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of HUMOSTRO_PEA_1_PEA_1_P30 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence VSIFYVFI within HUMOSTRO_PEA_1_PEA_1_P30. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P30はまた、表13に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P30配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P30 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 13 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HUMOSTRO_PEA_1_PEA_1_P30 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P30のグリコシレ−ション部位を、既知タンパク質のオステオポンチン前駆体と比較する形で表14に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation sites of mutant protein HUMOSTRO_PEA_1_PEA_1_P30 are shown in Table 14 in comparison with known protein osteopontin precursors (first column aligned according to their position in the amino acid sequence; the second column contains glycosylation sites) Indicates whether it is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P30は、次の転写物にコ−ドされている:HUMOSTRO_PEA_1_PEA_1_T30、この転写物の配列は本明細書の最後に示してある。転写物HUMOSTRO_PEA_1_PEA_1_T30のコ−ディング部分は太字で表している:このコ−ディング部分は、位置199から始まり、位置315に終止する。転写物はまた、表15に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HUMOSTRO_PEA_1_PEA_1_P30配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HUMOSTRO_PEA_1_PEA_1_P30 is encoded in the following transcript: HUMOSTRO_PEA_1_PEA_1_T30, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HUMOSTRO_PEA_1_PEA_1_T30 is shown in bold: this coding part starts at position 199 and ends at position 315. The transcript also has the following SNPs listed in Table 15 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is known SNP) The presence of a known SNP in the mutant protein HUMOSTRO_PEA_1_PEA_1_P30 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記したように、クラスタHUMOSTROは上表2に記載され、その配列を本明細書の最後に示す30個のセグメントを特徴とする。これらセグメントは、特に関心の対象であることからここに別々に記載する核酸配列の部分である。次に本発明の各セグメントについて説明する。   As mentioned above, the cluster HUMOSTRO is listed in Table 2 above and is characterized by 30 segments whose sequence is shown at the end of this specification. These segments are part of the nucleic acid sequence described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_0は333個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16およびHUMOSTRO_PEA_1_PEA_1_T30。下表16に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_0 of the present invention is supported by 333 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14, HUMOSTRO_PEA_1_PEA_1_T16 and HUMOSTRO_PEA_1_PEA_1_T30. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_10は4つのライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる: HUMOSTRO_PEA_1_PEA_1_T16。下表17に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_10 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T16. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_16は6個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる: HUMOSTRO_PEA_1_PEA_1_T14。下表18に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_16 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_23は334個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表19に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_23 of the present invention is supported by 334 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_31は350個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表20に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_31 of the present invention is supported by 350 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 20 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_43は192個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表21に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_43 of the present invention is supported by 192 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の好選的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは約120bpまでの長さであることから、分けて説明する。   According to a preferred aspect of the invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they will be described separately.

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_3は353個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。下表22に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_3 of the present invention is supported by 353 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14, HUMOSTRO_PEA_1_PEA_1_T16, and HUMOSTRO_PEA_1_PEA_1_T30. Table 22 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_5は353個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。下表23に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_5 of the present invention is supported by 353 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14, HUMOSTRO_PEA_1_PEA_1_T16, and HUMOSTRO_PEA_1_PEA_1_T30. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_7は357個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。下表24に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_7 of the present invention is supported by 357 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14, HUMOSTRO_PEA_1_PEA_1_T16, and HUMOSTRO_PEA_1_PEA_1_T30. Table 24 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_8は1つのライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T30。下表25に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_8 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: HUMOSTRO_PEA_1_PEA_1_T30. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_15は366個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表26に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_15 of the present invention is supported by 366 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_17は261個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表27に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_17 of the present invention is supported by 261 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_20は次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表28に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_20 of the present invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_21は315個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表29に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_21 of the present invention is supported by 315 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 29 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_22は322個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表30に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_22 of the present invention is supported by 322 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 30 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_24は270個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表31に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_24 of the present invention is supported by 270 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 31 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_26は次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表32に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_26 of the present invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 32 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_27は260個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表33に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_27 of the present invention is supported by 260 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 33 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_28は273個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表34に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_28 of the present invention is supported by 273 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 34 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_29は272個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表35に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_29 of the present invention is supported by 272 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 35 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_30は次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表36に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_30 of the present invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 36 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_32は293個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメント次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表37に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_32 of the present invention is supported by 293 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 37 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_34は301個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメント次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表38に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_34 of the present invention is supported by 301 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 38 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_36は292個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメント次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表39に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_36 of the present invention is supported by 292 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 39 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_37は295個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメント次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表40に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_37 of the present invention is supported by 295 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 40 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_38は次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表41に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_38 of the present invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 41 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_39は268個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメント次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表42に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_39 of the present invention is supported by 268 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 42 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_40は次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表43に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_40 of the present invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 43 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_41は次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表44に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_41 of the present invention can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 44 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHUMOSTRO_PEA_1_PEA_1_node_42は224個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメント次の転写物に見いだすことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。下表45に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster HUMOSTRO_PEA_1_PEA_1_node_42 of the present invention is supported by 224 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HUMOSTRO_PEA_1_PEA_1_T14 and HUMOSTRO_PEA_1_PEA_1_T16. Table 45 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:OSTP_HUMAN
配列文書:
アラインメント:HUMOSTRO_PEA_1_PEA_1_P21 x OSTP_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:578.00
Escore:0
一致長:58 全長:58
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQ 50

51 KQNLLAPQ 58
||||||||
51 KQNLLAPQ 58
Alignment sequence name of mutant protein with known protein: OSTP_HUMAN
Sequence document:
Alignment: HUMOSTRO_PEA_1_PEA_1_P21 x OSTP_HUMAN ..
Alignment segment 1/1:
Quality-: 578.00
Escore: 0
Match length: 58 Total length: 58
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQ 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQ 50

51 KQNLLAPQ 58
|||||||||
51 KQNLLAPQ 58

配列名:OSTP_HUMAN
配列文書:
アラインメント:HUMOSTRO_PEA_1_PEA_1_P25 x OSTP_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:301.00
Escore:0
一致長:31 全長:31
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
|||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
Array name: OSTP_HUMAN
Sequence document:
Alignment: HUMOSTRO_PEA_1_PEA_1_P25 x OSTP_HUMAN ..
Alignment segment 1/1:
Quality-: 301.00
Escore: 0
Match length: 31 Total length: 31
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
..
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31

配列名:OSTP_HUMAN
配列文書:
アラインメント:HUMOSTRO_PEA_1_PEA_1_P30 x OSTP_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:301.00
Escore:0
一致長:31 全長:31
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
|||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
Array name: OSTP_HUMAN
Sequence document:
Alignment: HUMOSTRO_PEA_1_PEA_1_P30 x OSTP_HUMAN ..
Alignment segment 1/1:
Quality-: 301.00
Escore: 0
Match length: 31 Total length: 31
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
..
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31

クラスタR11723の説明
クラスタR11723は、その名称を表1および2にそれぞれ示し、配列それ自体は本明細書の最後に示す、関心対象の6個の転写物と26個のセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Description of cluster R11723 Cluster R11723 is characterized by 6 transcripts of interest and 26 segments, the names of which are shown in Tables 1 and 2, respectively, and the sequence itself is given at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

クラスタR11723は、癌においてこのクラスタ転写物が過剰発現することにより、診断マ−カ−として用いることができる。このようような転写物の正常組織での発現も、前述の方法によって得られる。表、左手縦列の項目「数」および図38のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けされたEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster R11723 can be used as a diagnostic marker by overexpression of this cluster transcript in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The number of items in the table, left hand column “number” and the y-axis number in FIG. 38 is the weighted EST expression for each category expressed in the form of “parts per million” Expressed ratio of EST expression of a specific cluster to expression of all ESTs of this classification).

全体として、図38のヒストグラムおよび表4に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);上皮性悪性腫瘍、各種組織由来の混合型悪性腫瘍、および腎臓悪性腫瘍。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 38 and Table 4. This cluster is overexpressed (at least at a minimal level) in the following pathological conditions: epithelial malignancies, mixed malignancies from various tissues, and kidney malignancies.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタR11723は、上表1に記載の6個の転写物を特徴とする。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster R11723 is characterized by the six transcripts listed in Table 1 above. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質R11723_PEA_1_P2は、本明細書最後に示すアミノ酸配列を有する;それは転写物R11723_PEA_1_T6にコ−ドされている。変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   The mutant protein R11723_PEA_1_P2 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript R11723_PEA_1_T6. Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質R11723_PEA_1_P2はまた、表6に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R11723_PEA_1_P2配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein R11723_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 6 (shown according to their amino acid sequence position, followed by the modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein R11723_PEA_1_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質R11723_PEA_1_P2は、次の転写物にコ−ドされている:R11723_PEA_1_T6、この転写物の配列は本明細書の最後に示してある。転写物R11723_PEA_1_T6のコ−ディング部分は太字で表している:このコ−ディング部分は、位置1716から始まり、位置2051に終止する。転写物はまた、表7に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R11723_PEA_1_P2配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein R11723_PEA_1_P2 is encoded in the following transcript: R11723_PEA_1_T6, the sequence of this transcript is given at the end of the specification. The coding portion of transcript R11723_PEA_1_T6 is shown in bold: this coding portion starts at position 1716 and ends at position 2051. The transcript also has the following SNPs listed in Table 7 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein R11723_PEA_1_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質R11723_PEA_1_P6は、本明細書最後に示すアミノ酸配列を有する;それは転写物R11723_PEA_1_T15にコ−ドされている。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein R11723_PEA_1_P6 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript R11723_PEA_1_T15. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

R11723_PEA_1_P6とQ8IXM0(配列番号:885)の比較報告:
1. R11723_PEA_1_P6をコ−ドする単離されたキメラポリペプチドは、R11723_PEA_1_P6のアミノ酸1〜110に相当する配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、およびQ81XM0のアミノ酸1〜112に相当し、またR11723_PEA_1_P6のアミノ酸111〜222にも相当するMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQに少なくとも90%相同である第二アミノ酸配列とを含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report of R11723_PEA_1_P6 and Q8IXM0 (SEQ ID NO: 885):
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P6 has at least the sequence MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIAQGS with a sequence corresponding to amino acids 1-110 of R11723_PEA_1_P6 A first amino acid sequence that is at least 90%, and most preferably at least 95% homologous, and MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPESRPRCHLVGHHRTRE A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are successively connected in sequence.

2.R11723_PEA_1_P6の頭部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P6の配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.The isolated polypeptide that encodes the head of R11723_PEA_1_P6 is at least about 90%, preferably at least about 80%, at least about 80% for the sequence MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQVRVR %, And most preferably at least about 95% homologous polypeptide.

R11723_PEA_1_P6とQ96AC2(配列番号:886)の比較報告:
1. R11723_PEA_1_P6をコ−ドする単離されたキメラポリペプチドは、Q96AC2のアミノ酸1〜83に相当し、またR11723_PEA_1_P6のアミノ酸1〜83に相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGに少なくとも90%相同である第一アミノ酸配列、およびR11723_PEA_1_P6のアミノ酸84〜222にも相当する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドに少なくとも90%相同である第二アミノ酸配列とを含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparative report of R11723_PEA_1_P6 and Q96AC2 (SEQ ID NO: 886):
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P6 corresponds to amino acids 1 to 83 of Q96AC2 and also corresponds to amino acids 1 to 83 of R11723_PEA_1_P6, and is at least the first amino acid sequence of the amino acid sequence HMWGIGIATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMASQKSC And the sequence SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRREQ is the second amino acid and the second sequence is homologous to the amino acid 84-222 of R11723_PEA_1_P6 Yes.

2.R11723_PEA_1_P6の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P6内の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of R11723_PEA_1_P6 is at least about RSEQ23, preferably at least about SRKGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPPPLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRGH %, And most preferably at least about 95% homologous polypeptide.

R11723_PEA_1_P6とQ8N2G4(配列番号:887)の比較報告:
1. R11723_PEA_1_P6をコ−ドする単離されたキメラポリペプチドは、Q8N2G4のアミノ酸1〜83に相当し、またR11723_PEA_1_P6のアミノ酸1〜83に相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGに少なくとも90%相同である第一アミノ酸配列、およびR11723_PEA_1_P6のアミノ酸84〜222にも相当する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドに少なくとも90%相同である第二アミノ酸配列とを含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparative report of R11723_PEA_1_P6 and Q8N2G4 (SEQ ID NO: 887):
1. The isolated chimeric polypeptide that codes for R11723_PEA_1_P6 corresponds to amino acids 1 to 83 of Q8N2G4 and also corresponds to amino acids 1 to 83 of R11723_PEA_1_P6 and is at least the first amino acid sequence homologous to the amino acid sequence MMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVSCASAGIASAS And the sequence SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRREQ is the second amino acid and the second sequence is homologous to the amino acid 84-222 of R11723_PEA_1_P6 Yes.

2.R11723_PEA_1_P6の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P6内の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of R11723_PEA_1_P6 is at least about RSEQ23, preferably at least about SRKGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPPPLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRGH %, And most preferably at least about 95% homologous polypeptide.

R11723_PEA_1_P6とBAC85518(配列番号:888)の比較報告:
1. R11723_PEA_1_P6をコ−ドする単離されたキメラポリペプチドは、BAC85518のアミノ酸24〜106に相当し、またR11723_PEA_1_P6のアミノ酸1〜83に相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGに少なくとも90%相同である第一アミノ酸配列、およびR11723_PEA_1_P6のアミノ酸84〜222にも相当する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドに少なくとも90%相同である第二アミノ酸配列とを含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparative report of R11723_PEA_1_P6 and BAC85518 (SEQ ID NO: 888):
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P6 corresponds to amino acids 24-106 of BAC85518, and also corresponds to amino acids 1-83 of R11723_PEA_1_P6, and is at least the first amino acid sequence of the amino acid sequence HMWGIGIATATGLGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMASQKSC And the sequence SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRREQ is the second amino acid and the second sequence is homologous to the amino acid 84-222 of R11723_PEA_1_P6 Yes.

2.R11723_PEA_1_P6の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P6内の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of R11723_PEA_1_P6 is at least about RSEQ23, preferably at least about SRKGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPPPLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRGH %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質R11723_PEA_1_P6はまた、表8に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R11723_PEA_1_P6配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein R11723_PEA_1_P6 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 8 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein R11723_PEA_1_P6 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質R11723_PEA_1_P6は、次の転写物にコ−ドされている:R11723_PEA_1_T15、この転写物の配列は本明細書の最後に示してある。転写物R11723_PEA_1_T15のコ−ディング部分は太字で表している:このコ−ディング部分は、位置434から始まり、位置1099に終止する。転写物はまた、表9に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R11723_PEA_1_P6配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein R11723_PEA_1_P6 is encoded in the following transcript: R11723_PEA_1_T15, the sequence of this transcript is given at the end of the specification. The coding portion of the transcript R11723_PEA_1_T15 is shown in bold: this coding portion starts at position 434 and ends at position 1099. The transcript also has the following SNPs listed in Table 9 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein R11723_PEA_1_P6 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質R11723_PEA_1_P7は、本明細書最後に示すアミノ酸配列を有する;それは転写物R11723_PEA_1_T17にコ−ドされている。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein R11723_PEA_1_P7 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript R11723_PEA_1_T17. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

R11723_PEA_1_P7とQ96AC2の比較報告:
1. R11723_PEA_1_P7をコ−ドする単離されたキメラポリペプチドは、Q96AC2のアミノ酸1〜64に相当し、またR11723_PEA_1_P7のアミノ酸1〜64にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGに少なくとも90%相同である第一アミノ酸配列、およびR11723_PEA_1_P7のアミノ酸65〜93に相当する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between R11723_PEA_1_P7 and Q96AC2:
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P7 corresponds to amino acids 1 to 64 of Q96AC2 and also corresponds to amino acids 1 to 64 of R11723_PEA_1_P7, which is at least 90% amino acid sequence first in amino acid sequence HMWLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAG , And a polypeptide having the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. R11723_PEA_1_P7の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P78内の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of R11723_PEA_1_P7 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P78. %, And most preferably at least about 95% homologous polypeptide.

R11723_PEA_1_P7とQ8N2G4の比較報告:
1. R11723_PEA_1_P7をコ−ドする単離されたキメラポリペプチドは、Q8N2G4のアミノ酸1〜64に相当し、またR11723_PEA_1_P7のアミノ酸1〜64にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGに少なくとも90%相同である第一アミノ酸配列、およびR11723_PEA_1_P7のアミノ酸65〜93に相当する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between R11723_PEA_1_P7 and Q8N2G4:
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P7 corresponds to amino acids 1 to 64 of Q8N2G4, and also corresponds to amino acids 1 to 64 of R11723_PEA_1_P7, and is at least the first amino acid at amino acid sequence HMWGIGIATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDM homologous sequence , And a polypeptide having the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. R11723_PEA_1_P7の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P7内の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of R11723_PEA_1_P7 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7. %, And most preferably at least about 95% homologous polypeptide.

R11723_PEA_1_P7とBAC85273の比較報告:
1. R11723_PEA_1_P7をコ−ドする単離されたキメラポリペプチドは、R11723_PEA_1_P7のアミノ酸1〜5にも相当する配列MWVLGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、BAC85273のアミノ酸22〜80に相当し、またR11723_PEA_1_P7のアミノ酸6〜64にも相当するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGに少なくとも90%相同である第二アミノ酸配列、およびR11723_PEA_1_P7のアミノ酸65〜93に相当する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、このとき前記第一、第二および第三アミノ酸配列は連続して順番につながっている。
Comparison report between R11723_PEA_1_P7 and BAC85273:
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P7 is at least 70%, if necessary at least 80%, preferably at least 85% of a polypeptide having the sequence MWVLG corresponding to amino acids 1-5 of R11723_PEA_1_P7. %, More preferably at least 90%, and most preferably at least 95% homologous to IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAG corresponding to amino acids 22-80 of BAC85273 and also corresponding to amino acids 6-64 of R11723_PEA_1_P7 A second amino acid sequence that is homologous and a polypeptide having the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90% And most preferably a third amino acid sequence that is at least 95% homologous. Seen, the this time first, second and third amino acid sequences has led to the order in succession.

2. R11723_PEA_1_P7の頭部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P7内の配列MWVLGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the head of R11723_PEA_1_P7 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 85% of the sequence MWVLG in R11723_PEA_1_P7. Polypeptides that are 90% and most preferably at least about 95% homologous are included.

3.R11723_PEA_P7の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P7内の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   3.An isolated polypeptide that encodes the tail of R11723_PEA_P7 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7. %, And most preferably at least about 95% homologous polypeptide.

R11723_PEA_1_P7とBAC85518の比較報告:
1. R11723_PEA_1_P7をコ−ドする単離されたキメラポリペプチドは、BAC85518のアミノ酸24〜87に相当し、またR11723_PEA_1_P7のアミノ酸1〜64にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGに少なくとも90%相同である第一アミノ酸配列、およびR11723_PEA_1_P7のアミノ酸65〜93に相当する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between R11723_PEA_1_P7 and BAC85518:
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P7 corresponds to amino acids 24-87 of BAC85518 and also corresponds to amino acids 1-64 of R11723_PEA_1_P7, which is at least 90% amino acid sequence first in amino acid sequence HMWGIGIATATGLGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAG , And a polypeptide having the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. R11723_PEA_1_P7の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P7内の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of R11723_PEA_1_P7 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT in R11723_PEA_1_P7. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質R11723_PEA_1_P7はまた、表10に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R11723_PEA_1_P7配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein R11723_PEA_1_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 10 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein R11723_PEA_1_P7 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質R11723_PEA_1_P7は、次の転写物にコ−ドされている:R11723_PEA_1_T17、この転写物の配列は本明細書の最後に示してある。転写物R11723_PEA_1_T17のコ−ディング部分は太字で表している:このコ−ディング部分は、位置434から始まり、位置712に終止する。転写物はまた、表11に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R11723_PEA_1_P7配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein R11723_PEA_1_P7 is encoded in the following transcript: R11723_PEA_1_T17, the sequence of this transcript is given at the end of the specification. The coding part of the transcript R11723_PEA_1_T17 is shown in bold: this coding part starts at position 434 and ends at position 712. The transcript also has the following SNPs listed in Table 11 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein R11723_PEA_1_P7 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質R11723_PEA_1_P13は、本明細書最後に示すアミノ酸配列を有する;それは転写物R11723_PEA_1_T19にコ−ドされている。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein R11723_PEA_1_P13 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript R11723_PEA_1_T19. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

R11723_PEA_1_P13とQ96AC2の比較報告:
1. R11723_PEA_1_P13をコ−ドする単離されたキメラポリペプチドは、Q96AC2のアミノ酸1〜63に相当し、またR11723_PEA_1_P7のアミノ酸1〜63にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAに少なくとも90%相同である第一アミノ酸配列、およびR11723_PEA_1_P13のアミノ酸64〜84に相当する配列DTKRTNTLLFEMRHFAKQLTTを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between R11723_PEA_1_P13 and Q96AC2:
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P13 corresponds to amino acids 1 to 63 of Q96AC2 and also corresponds to amino acids 1 to 63 of R11723_PEA_1_P7, at least the first amino acid sequence with the first amino acid sequence at 90% amino acid sequence homologous to MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA And a polypeptide having the sequence DTKRTNTLLFEMRHFAKQLTT corresponding to amino acids 64-84 of R11723_PEA_1_P13, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. R11723_PEA_1_P13の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P13内の配列DTKRTNTLLFEMRHFAKQLTTに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of R11723_PEA_1_P13 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence DTKRTNTLLFEMRHFAKQLTT in R11723_PEA_1_P13. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質R11723_PEA_1_P13は、次の転写物にコ−ドされている:R11723_PEA_1_T19およびR11723_PEA_1_T5、これら転写物の配列は本明細書の最後に示してある。転写物R11723_PEA_1_T19のコ−ディング部分は太字で表している:このコ−ディング部分は、位置434から始まり、位置685に終止する。転写物はまた、表12に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R11723_PEA_1_P13配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein R11723_PEA_1_P13 is encoded in the following transcripts: R11723_PEA_1_T19 and R11723_PEA_1_T5, the sequences of these transcripts are given at the end of the specification. The coding part of the transcript R11723_PEA_1_T19 is shown in bold: this coding part starts at position 434 and ends at position 685. The transcript also has the following SNPs listed in Table 12 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is known SNP) The presence of a known SNP in the mutant protein R11723_PEA_1_P13 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質R11723_PEA_1_P10は、本明細書最後に示すアミノ酸配列を有する;それは転写物R11723_PEA_1_T20にコ−ドされている。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein R11723_PEA_1_P10 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript R11723_PEA_1_T20. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

R11723_PEA_1_P10とQ96AC2の比較報告:
1. R11723_PEA_1_P10をコ−ドする単離されたキメラポリペプチドは、Q96AC2のアミノ酸1〜63に相当し、またR11723_PEA_1_P10のアミノ酸1〜63にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAに少なくとも90%相同である第一アミノ酸配列、およびR11723_PEA_1_P10のアミノ酸64〜90に相当する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between R11723_PEA_1_P10 and Q96AC2:
1. The isolated chimeric polypeptide that codes for R11723_PEA_1_P10 corresponds to amino acids 1 to 63 of Q96AC2 and also corresponds to amino acids 1 to 63 of R11723_PEA_1_P10, at least 90% of the first amino acid sequence at amino acid sequence HMWGILIATATGLGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA And a polypeptide having the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. R11723_PEA_1_P10の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P10内の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of R11723_PEA_1_P10 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10. %, And most preferably at least about 95% homologous polypeptide.

R11723_PEA_1_P10とQ8N2G4の比較報告:
1. R11723_PEA_1_P10をコ−ドする単離されたキメラポリペプチドは、Q8N2G4のアミノ酸1〜63に相当し、またR11723_PEA_1_P10のアミノ酸1〜63にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAに少なくとも90%相同である第一アミノ酸配列、およびR11723_PEA_1_P10のアミノ酸64〜90に相当する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between R11723_PEA_1_P10 and Q8N2G4:
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P10 corresponds to amino acids 1 to 63 of Q8N2G4, and also corresponds to amino acids 1 to 63 of R11723_PEA_1_P10, at least the first amino acid at amino acid sequence homologous to the first amino acid sequence of homologous sequence MMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA And a polypeptide having the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. R11723_PEA_1_P10の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P10内の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of R11723_PEA_1_P10 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10. %, And most preferably at least about 95% homologous polypeptide.

R11723_PEA_1_P10とBAC85273の比較報告:
1. R11723_PEA_1_P7をコ−ドする単離されたキメラポリペプチドは、R11723_PEA_1_P10のアミノ酸1〜5にも相当する配列MWVLGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、BAC85273のアミノ酸22〜79に相当し、またR11723_PEA_1_P10のアミノ酸6〜63にも相当するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAに少なくとも90%相同である第二アミノ酸配列、およびR11723_PEA_1_P10のアミノ酸64〜90に相当する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、このとき前記第一、第二および第三アミノ酸配列は連続して順番につながっている。
Comparison report between R11723_PEA_1_P10 and BAC85273:
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P7 is at least 70%, if necessary at least 80%, preferably at least 85% of a polypeptide having the sequence MWVLG corresponding to amino acids 1-5 of R11723_PEA_1_P10. %, More preferably at least 90%, and most preferably at least 95% homologous to IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA corresponding to amino acids 22-79 of BAC85273 and also corresponding to amino acids 6-63 of R11723_PEA_1_P10 A second amino acid sequence that is homologous, and a polypeptide having the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, And most preferably a third amino acid sequence that is at least 95% homologous. Seen, the this time first, second and third amino acid sequences has led to the order in succession.

2. R11723_PEA_1_P10の頭部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P10内の配列MWVLGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the head of R11723_PEA_1_P10 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 85% of the sequence MWVLG in R11723_PEA_1_P10. Polypeptides that are 90% and most preferably at least about 95% homologous are included.

3.R11723_PEA_P10の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P10内の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   3.An isolated polypeptide that encodes the tail of R11723_PEA_P10 is at least 70%, if necessary, at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10. %, And most preferably at least about 95% homologous polypeptide.

R11723_PEA_1_P10とBAC85518の比較報告:
1. R11723_PEA_1_P10をコ−ドする単離されたキメラポリペプチドは、BAC85518のアミノ酸24〜86に相当し、またR11723_PEA_1_P10のアミノ酸1〜63にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAに少なくとも90%相同である第一アミノ酸配列、およびR11723_PEA_1_P10のアミノ酸64〜90に相当する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between R11723_PEA_1_P10 and BAC85518:
1. An isolated chimeric polypeptide that codes for R11723_PEA_1_P10 is at least 90% amino acid sequence at the first amino acid sequence of amino acids 24-86 of BAC85518 and also corresponding to amino acids 1-63 of R11723_PEA_1_P10 at the first amino acid sequence of sequence 90% homologous to MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA And a polypeptide having the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.

2. R11723_PEA_1_P10の尾部をコ−ドする単離されたポリペプチドは、R11723_PEA_1_P10内の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of R11723_PEA_1_P10 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK in R11723_PEA_1_P10. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質R11723_PEA_1_P10はまた、表13に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R11723_PEA_1_P10配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein R11723_PEA_1_P10 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 13 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether the SNP is known; the presence of a known SNP within the mutant protein R11723_PEA_1_P10 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質R11723_PEA_1_P10は、次の転写物にコ−ドされている:R11723_PEA_1_T20、これら転写物の配列は本明細書の最後に示してある。転写物R11723_PEA_1_T20のコ−ディング部分は太字で表している:このコ−ディング部分は、位置434から始まり、位置703に終止する。転写物はまた、表14に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質R11723_PEA_1_P10配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein R11723_PEA_1_P10 is encoded in the following transcript: R11723_PEA_1_T20, the sequence of these transcripts is given at the end of the specification. The coding part of the transcript R11723_PEA_1_T20 is shown in bold: this coding part starts at position 434 and ends at position 703. The transcript also has the following SNPs listed in Table 14 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein R11723_PEA_1_P10 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記したように、クラスタR11723は上表2に記載され、その配列を本明細書の最後に示す26個のセグメントを特徴とする。これらセグメントは、特に関心の対象であることからここに別々に記載する核酸配列の部分である。次に本発明の各セグメントについて説明する。   As noted above, cluster R11723 is listed in Table 2 above and is characterized by 26 segments whose sequence is shown at the end of this specification. These segments are part of the nucleic acid sequence described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタR11723_PEA_1_node_13は5個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T19、R11723_PEA_1_T5およびR11723_PEA_1_T6。下表15に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_13 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T19, R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_16は3つのライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T17、R11723_PEA_1_T19およびR11723_PEA_1_T20。下表16に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_16 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T17, R11723_PEA_1_T19 and R11723_PEA_1_T20. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_19は45個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。下表17に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_19 of the present invention is supported by 45 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_2は29個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。下表18に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_2 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_22は65個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。下表19に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_22 of the present invention is supported by 65 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_31は70個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T5およびR11723_PEA_1_T6。下表20に、各転写物におけるこのセグメントの開始位置と終始位置を示す(これら転写物は別のポリアデニル化を示すことに注意せよ)。   The segment cluster R11723_PEA_1_node_31 of the present invention is supported by 70 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 20 below shows the start and end positions of this segment in each transcript (note that these transcripts show different polyadenylation).

Figure 2007520217
Figure 2007520217

本発明の好選的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは約120bpまでの長さであることから、分けて説明する。   According to a preferred aspect of the invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they will be described separately.

本発明のセグメントクラスタR11723_PEA_1_node_10は38個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。下表21に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_10 of the present invention is supported by 38 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_11は42個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。下表22に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_11 of the present invention is supported by 42 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 22 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_15は次の転写物に見いだすことができる: R11723_PEA_1_T20。下表23に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_15 of the present invention can be found in the following transcript: R11723_PEA_1_T20. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_18は40個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T5およびR11723_PEA_1_T6。下表24に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_18 of the present invention is supported by 40 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 24 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_20は次の転写物に見いだすことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。下表25に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_20 of the present invention can be found in the following transcripts: R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_21は36個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。下表26に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_21 of the present invention is supported by 36 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_23は39個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。下表27に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_23 of the present invention is supported by 39 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_24は51個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T5およびR11723_PEA_1_T6。下表28に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_24 of the present invention is supported by 51 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_25は54個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T5およびR11723_PEA_1_T6。下表29に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_25 of the present invention is supported by 54 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 29 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_26は62個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T5およびR11723_PEA_1_T6。下表30に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_26 of the present invention is supported by 62 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 30 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_27は67個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T5およびR11723_PEA_1_T6。下表31に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_27 of the present invention is supported by 67 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 31 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_28は次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T5およびR11723_PEA_1_T6。下表32に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_28 of the present invention can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 32 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_29は69個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T5およびR11723_PEA_1_T6。下表33に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_29 of the present invention is supported by 69 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 33 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_3は次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。下表34に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_3 of the present invention can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 34 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_30は次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T5およびR11723_PEA_1_T6。下表35に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_30 of the present invention can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T5 and R11723_PEA_1_T6. Table 35 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_4は25個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。下表36に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_4 of the present invention is supported by 25 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 36 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_5は26個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。下表37に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_5 of the present invention is supported by 26 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 37 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_6は27個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。下表38に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_6 of the present invention is supported by 27 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 38 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_7は29個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。下表39に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_7 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. Table 39 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタR11723_PEA_1_node_8は2つのライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見いだすことができる:R11723_PEA_1_T6。下表40に、各転写物におけるこのセグメントの開始位置と終始位置を示す。   The segment cluster R11723_PEA_1_node_8 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: R11723_PEA_1_T6. Table 40 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:/tmp/gp6eQTLWqk/mFtjUpUzhb:Q8IXM0
配列文書:
アラインメント:R11723_PEA_1_PEA_P6 x Q8IXM0 ..
アラインメントセグメント 1/1:
クオリティ−:1128.00
Escore:0
一致長:112 全長:112
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
111 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 160
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 50
. . . . .
161 GEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRE 210
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRE 100
.
211 RQRKEKHSMRTQ 222
||||||||||||
101 RQRKEKHSMRTQ 112
Alignment of mutant protein with known protein Sequence name: / tmp / gp6eQTLWqk / mFtjUpUzhb: Q8IXM0
Sequence document:
Alignment: R11723_PEA_1_PEA_P6 x Q8IXM0 ..
Alignment segment 1/1:
Quality-: 1128.00
Escore: 0
Match length: 112 Total length: 112
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
111 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 160
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 50
...
161 GEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRE 210
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 GEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRE 100
.
211 RQRKEKHSMRTQ 222
||||||||||||||
101 RQRKEKHSMRTQ 112

配列名: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q96AC2
配列文書:
アラインメント:R11723_PEA_1_PEA_P6 x Q96AC2 ..
アラインメントセグメント 1/1:
クオリティ−:835.00
Escore:0
一致長:83 全長:83
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
Sequence name: / tmp / gp6eQTLWqk / mFtjUpUzhb: Q96AC2
Sequence document:
Alignment: R11723_PEA_1_PEA_P6 x Q96AC2 ..
Alignment segment 1/1:
Quality-: 835.00
Escore: 0
Match length: 83 Total length: 83
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
..
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83

配列名: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q8N2G4
配列文書:
アラインメント:R11723_PEA_1_PEA_P6 x Q8N2G4 ..
アラインメントセグメント 1/1:
クオリティ−:835.00
Escore:0
一致長:83 全長:83
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
Sequence name: / tmp / gp6eQTLWqk / mFtjUpUzhb: Q8N2G4
Sequence document:
Alignment: R11723_PEA_1_PEA_P6 x Q8N2G4 ..
Alignment segment 1/1:
Quality-: 835.00
Escore: 0
Match length: 83 Total length: 83
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
..
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83

配列名: /tmp/gp6eQTLWqk/mFtjUpUzhb:BAC85518
配列文書:
アラインメント:R11723_PEA_1_PEA_P6 x BAC85518 ..
アラインメントセグメント 1/1:
クオリティ−:835.00
Escore:0
一致長:83 全長:83
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
74 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 106
Sequence name: / tmp / gp6eQTLWqk / mFtjUpUzhb: BAC85518
Sequence document:
Alignment: R11723_PEA_1_PEA_P6 x BAC85518 ..
Alignment segment 1/1:
Quality-: 835.00
Escore: 0
Match length: 83 Total length: 83
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
..
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
74 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 106

配列名: /tmp/VXjdFlzdBX/bexTxTh0Th:Q96AC2
配列文書:
アラインメント:R11723_PEA_1_PEA_P7 x Q96AC2 ..
アラインメントセグメント 1/1:
クオリティ−:654.00
Escore:0
一致長:64 全長:64
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
51 QDMCQKEVMEQSAG 64
Sequence name: / tmp / VXjdFlzdBX / bexTxTh0Th: Q96AC2
Sequence document:
Alignment: R11723_PEA_1_PEA_P7 x Q96AC2 ..
Alignment segment 1/1:
Quality: 654.00
Escore: 0
Match length: 64 Total length: 64
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
||||||||||||||||
51 QDMCQKEVMEQSAG 64

配列名: /tmp/VXjdFlzdBX/bexTxTh0Th:Q8N2G4
配列文書:
アラインメント:R11723_PEA_1_PEA_P7 x Q8N2G4 ..
アラインメントセグメント 1/1:
クオリティ−:654.00
Escore:0
一致長:64 全長:64
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
51 QDMCQKEVMEQSAG 64
Sequence name: / tmp / VXjdFlzdBX / bexTxTh0Th: Q8N2G4
Sequence document:
Alignment: R11723_PEA_1_PEA_P7 x Q8N2G4 ..
Alignment segment 1/1:
Quality: 654.00
Escore: 0
Match length: 64 Total length: 64
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
||||||||||||||||
51 QDMCQKEVMEQSAG 64

配列名: /tmp/VXjdFlzdBX/bexTxTh0Th:BAC85273
配列文書:
アラインメント:R11723_PEA_1_PEA_P7 x BAC85273 ..
アラインメントセグメント 1/1:
クオリティ−:600.00
Escore:0
一致長:59 全長:59
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
||||||||||||||||||||||||||||||||||||||||||||||||||
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSAG 64
|||||||||
72 KEVMEQSAG 80
Sequence name: / tmp / VXjdFlzdBX / bexTxTh0Th: BAC85273
Sequence document:
Alignment: R11723_PEA_1_PEA_P7 x BAC85273 ..
Alignment segment 1/1:
Quality-: 600.00
Escore: 0
Match length: 59 Total length: 59
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSAG 64
||||||||||
72 KEVMEQSAG 80

配列名: /tmp/VXjdFlzdBX/bexTxTh0Th:BAC85518
配列文書:
アラインメント:R11723_PEA_1_PEA_P7 x BAC85518 ..
アラインメントセグメント 1/1:
クオリティ−:654.00
Escore:0
一致長:64 全長:64
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
74 QDMCQKEVMEQSAG 87
Sequence name: / tmp / VXjdFlzdBX / bexTxTh0Th: BAC85518
Sequence document:
Alignment: R11723_PEA_1_PEA_P7 x BAC85518 ..
Alignment segment 1/1:
Quality: 654.00
Escore: 0
Match length: 64 Total length: 64
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSAG 64
||||||||||||||||
74 QDMCQKEVMEQSAG 87

配列名: /tmp/OLMSexEmIh/pc7Z7Xm1YR:Q96AC2
配列文書:
アラインメント:R11723_PEA_1_PEA_P10 x Q96AC2 ..
アラインメントセグメント 1/1:
クオリティ−:645.00
Escore:0
一致長:63 全長:634
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63
Sequence name: / tmp / OLMSexEmIh / pc7Z7Xm1YR: Q96AC2
Sequence document:
Alignment: R11723_PEA_1_PEA_P10 x Q96AC2 ..
Alignment segment 1/1:
Quality: 645.00
Escore: 0
Match length: 63 Total length: 634
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
||||||||||||||||
51 QDMCQKEVMEQSA 63

配列名: /tmp/OLMSexEmIh/pc7Z7Xm1YR:Q8N2G4
配列文書:
アラインメント:R11723_PEA_1_PEA_P10 x Q8N2G4 ..
アラインメントセグメント 1/1:
クオリティ−:645.00
Escore:0
一致長:63 全長:63
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63
Sequence name: / tmp / OLMSexEmIh / pc7Z7Xm1YR: Q8N2G4
Sequence document:
Alignment: R11723_PEA_1_PEA_P10 x Q8N2G4 ..
Alignment segment 1/1:
Quality: 645.00
Escore: 0
Match length: 63 Total length: 63
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
||||||||||||||||
51 QDMCQKEVMEQSA 63

配列名: /tmp/OLMSexEmIh/pc7Z7Xm1YR:BAC85273
配列文書:
アラインメント:R11723_PEA_1_PEA_P10 x BAC85273 ..
アラインメントセグメント 1/1:
クオリティ−:591.00
Escore:0
一致長:58 全長:58
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
||||||||||||||||||||||||||||||||||||||||||||||||||
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSA 63
||||||||
72 KEVMEQSA 79
Sequence name: / tmp / OLMSexEmIh / pc7Z7Xm1YR: BAC85273
Sequence document:
Alignment: R11723_PEA_1_PEA_P10 x BAC85273 ..
Alignment segment 1/1:
Quality-: 591.00
Escore: 0
Match length: 58 Total length: 58
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSA 63
|||||||||
72 KEVMEQSA 79

配列名: /tmp/OLMSexEmIh/pc7Z7Xm1YR:BAC85518
配列文書:
アラインメント:R11723_PEA_1_PEA_P10 x BAC85518 ..
アラインメントセグメント 1/1:
クオリティ−:645.00
Escore:0
一致長:63 全長:63
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSA 63
|||||||||||||
74 QDMCQKEVMEQSA 86
Sequence name: / tmp / OLMSexEmIh / pc7Z7Xm1YR: BAC85518
Sequence document:
Alignment: R11723_PEA_1_PEA_P10 x BAC85518 ..
Alignment segment 1/1:
Quality: 645.00
Escore: 0
Match length: 63 Total length: 63
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSA 63
||||||||||||||||
74 QDMCQKEVMEQSA 86

アラインメント:: R11723_PEA_1_P13 x Q96AC2 ..
アラインメントセグメント 1/1:
クオリティ−:645.00
Escore:0
一致長:63 全長:63
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63
Alignment :: R11723_PEA_1_P13 x Q96AC2 ..
Alignment segment 1/1:
Quality: 645.00
Escore: 0
Match length: 63 Total length: 63
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
||||||||||||||||
51 QDMCQKEVMEQSA 63

正常および癌乳房組織での、配列名R11723 seg13に描かれたアンプリコンによって検出できる、R117231転写物の発現
seg13、R11723 seg13アンプリコンならびにR11723 seg13FおよびR11723 seg13Rプライマ−によって、または従って検出可能な転写物の発現を、リアルタイムPCRを用いて測定した。このクラスタの変異体は、仮想タンパク質PSEC0181(ここでは「PSEC」と表す)の変異体であることに注意しなければならない。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)およびG6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルについて、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、上表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルの発現差の倍率を得た。
Expression of the R117231 transcript in normal and cancerous breast tissue, detectable by the amplicon depicted in the sequence name R11723 seg13
seg13, R11723 seg13 amplicons and R11723 seg13F and R11723 seg13R primers, or thus detectable transcript expression was measured using real-time PCR. It should be noted that a variant of this cluster is a variant of the hypothetical protein PSEC0181 (denoted here “PSEC”). In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured. For each RT sample, the amplicon expression was normalized by the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue sample of test panel” above), and the center of normal PM sample The magnification of the expression difference of each sample with respect to the value was obtained.

図39は、正常サンプルに比べた、癌乳房組織における上記転写物の過剰発現を示すヒストグラムである。   FIG. 39 is a histogram showing overexpression of the transcript in cancer breast tissue compared to normal samples.

図39から明らかなように、上記アンプリコンによって検出できる転写物の癌サンプル中での発現は、非癌性サンプル(サンプル番号56〜60、63〜67、表1「試験パネルの組織サンプル」)に比べて有意に低い。注目すべきことに、28の腺癌サンプルのうち5つにおいて、少なくとも5倍の過剰発現が見出された。   As is apparent from FIG. 39, the expression of the transcript that can be detected by the amplicon in the cancer sample is a non-cancerous sample (sample numbers 56-60, 63-67, Table 1, “Tissue Sample of Test Panel”). Significantly lower than Of note, at least 5-fold overexpression was found in 5 out of 28 adenocarcinoma samples.

プライマ−ペア−もまた本発明に選択的、且つ好しく包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:R11723 seg13Fフォワ−ドプライマ−;およびR11723 seg13Rリバ−スプライマ−。   Primer pairs are also selectively and preferably encompassed by the present invention; for example, in the above experiments, the following primer pairs are used in a form that is not limited to the non-limiting examples of preferred primer pairs: R11723 seg13F forward primer; and R11723 seg13R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する。例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:R11723 seg13。
R11723seg13F (配列番号:89)− ACACTAAAAGAACAAACACCTTGCTC
R11723seg13R (配列番号:890)− TCCTCAGAAGGCACATGAAAGA
R11723seg13アンプリコン (配列番号:891):ACACTAAAAGAACAAACACCTTGCTCTTCGAGATGAGACATTTTGCCAAGCAGTTGACCACTTAGTTCTCAAGAAGCAACTATCTCTTTCATGTGCCTTCTGAGGA
The present invention also includes preferred amplicons obtained using preferred primers. For example, for the above experiment, the following amplicon has been obtained in a form limited to a non-limiting example of a suitable amplicon: R11723 seg13.
R11723seg13F (SEQ ID NO: 89)-ACACTAAAAGAACAAACACCTTGCTC
R11723seg13R (SEQ ID NO: 890) − TCCTCAGAAGGCACATGAAAGA
R11723seg13 amplicon (SEQ ID NO: 891): ACACTAAAAGAACAAACACCTTGCTCTTCGAGATGAGACATTTTGCCAAGCAGTTGACCACTTAGTTCTCAAGAAGCAACTATCTCTTTCATGTGCCTTCTGAGGA

配列名R11723 seg13に描かれたアンプリコンにより検出可能なR11723転写物の各種正常組織での発現
R11723 seg13アンプリコンならびにR11723 seg13FおよびR11723 seg13Rによって検出可能なR11723転写物の発現を、リアルタイムPCRを用いて測定した。平行して四種類のハウスキ−ピング遺伝子RPL19(GenBankアクセッション番号NM_000981;RPL19アンプリコン)、TATAボックス(GenBankアクセッション番号NM_003194;TATAアンプリコン)、UBC(GenBankアクセッション番号BC000449;アンプリコン−ユビキチンアンプリコン)およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現をハウスキ−ピング遺伝子量の相乗平均に対して正規化した。次に正規化した各RTサンプルの値を卵巣サンプル(表2「正常パネルの組織サンプル」のサンプル番号18〜20)中央値で除し、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。プライマ−およびアンプリコンは上記の通りである。
Expression in various normal tissues of the R11723 transcript detectable by the amplicon depicted in the sequence name R11723 seg13
Expression of R11723 seg13 amplicon and R11723 transcript detectable by R11723 seg13F and R11723 seg13R was measured using real-time PCR. In parallel, four types of housekeeping genes RPL19 (GenBank accession number NM_000981; RPL19 amplicon), TATA box (GenBank accession number NM_003194; TATA amplicon), UBC (GenBank accession number BC000449; amplicon-ubiquitin amplifier) Recon) and SDHA (GenBank accession number NM_004168; amplicon-SDHA amplicon) were measured in the same manner. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of the ovary sample (sample numbers 18 to 20 in Table 2, “Tissue sample of normal panel”) to obtain the relative expression value of each sample relative to the median value of the ovary sample. It was. Primers and amplicons are as described above.

結果を図40に示すが、配列名R11723 seg13に描かれているアンプリコンによって検出可能なR11723転写物の、各種正常組織における発現が証明された。   The results are shown in FIG. 40, and the expression of the R11723 transcript detectable by the amplicon depicted in the sequence name R11723 seg13 was proved in various normal tissues.

正常および癌乳房組織における、配列名R11723 junc11−18に描かれているアンプリコンによって検出可能なR11723転写物の発現
junc11−18、R11723 junc11−18アンプリコン、ならびにプライマ−R11723 junc11−18FおよびR11723 junc11−18Rによって検出可能な転写物の発現を、リアルタイムPCRを用いて測定した(この接合部、即ちアンプリコンは、「野生型」またはWTタンパク質とも呼ばれり、その配列を本明細書に示している既知タンパク質に見出されるアンプリコンである;このタンパク質は「SPEC」とも呼ばれる)。乳癌検出への既知タンパク質(WTタンパク質)の、単独またはこのクラスタもしくはその他クラスタ、および/またはその他既知マ−カ−の一または複数の変異体と組み合わせての使用も、本発明の態様を含む。平行して四種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、SDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)およびG6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)の発現も同様に測定した。各RTサンプルに関しては、上記アンプリコンの発現を、前記ハウスキ−ピング遺伝子の相乗平均量で正規化した。次に各RTサンプルの正規化量を正常検死体(PM)サンプル(サンプル番号56〜60、63〜67、表1「試験パネルの組織サンプル」)の中央値で除し、正常PMサンプル中央値に対する各サンプルの特異的発現の倍率を得た。
Expression of R11723 transcript detectable in normal and cancerous breast tissue by the amplicon depicted in SEQ ID R11723 junc11-18
The expression of transcripts detectable by junc11-18, R11723 junc11-18 amplicon, and primers-R11723 junc11-18F and R11723 junc11-18R was measured using real-time PCR (this junction, ie amplicon, Also referred to as “wild type” or WT protein, an amplicon whose sequence is found in the known proteins shown herein; this protein is also referred to as “SPEC”). Use of a known protein (WT protein) for breast cancer detection alone or in combination with one or more variants of this or other clusters and / or other known markers also includes embodiments of the present invention. In parallel, four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), SDHA (GenBank accession number NM_004168) Amplicon-SDHA amplicon) and G6PD (GenBank accession number NM_000402; G6PD amplicon) were also measured. For each RT sample, the amplicon expression was normalized with the geometric mean amount of the housekeeping gene. Next, the normalized amount of each RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67, Table 1 “Tissue Sample of Test Panel”), and the median value of normal PM samples Fold specific expression of each sample was obtained.

図41Aは、正常サンプルに比べて、癌乳房組織において上記転写物が過剰発現することを示すヒストグラムである。   FIG. 41A is a histogram showing that the transcript is overexpressed in breast cancer tissue compared to normal samples.

図41Aから明らかなように、上記アンプリコンによって幾つかのサンプルで検出できる転写物の発現は、非癌性サンプル(サンプル番号56〜60、63〜67、表5「乳癌試験サンプルの組織サンプル」)に比べて有意に低い。注目すべきことに、28の腺癌サンプルのうち5つにおいて、少なくとも5倍の過剰発現が見出された。   As is apparent from FIG. 41A, the expression of transcripts that can be detected in some samples by the amplicon is shown in non-cancerous samples (sample numbers 56-60, 63-67, Table 5 “Tissue samples of breast cancer test samples”. ) Significantly lower. Of note, at least 5-fold overexpression was found in 5 out of 28 adenocarcinoma samples.

プライマ−ペア−もまた、本発明に選択的、且つ好んで包含される;例えば、上記実験では、次のプライマ−ペア−が好適プライマ−ペア−の非限定的な例示に限る形で用いられている:R11723 junc11−18Fフォワ−ドプライマ−;およびR11723 junc11−18Rリバ−スプライマ−。   Primer pairs are also selectively and preferably included in the present invention; for example, in the above experiments, the following primer pairs are used in a form that is limited to non-limiting examples of preferred primer pairs: R11723 junc11-18F forward primer; and R11723 junc11-18R river primer.

本発明はまた、好適プライマ−を使用して得たアンプリコンも好選して包含する。例えば、上記実験については、次のアンプリコンが、好適アンプリコンの非限定的な例示に限定する形で得られている:R11723 junc11−18。
R11723junc11−18F (配列番号:892)&#8211; AGTGATGGAGCAAAGTGCCG
R11723 junc11−18R (配列番号:893) &#8211; CAGCAGCTGATGCAAACTGAG
R11723 junc11−18 (配列番号:894)&#8211;AGTGATGGAGCAAAGTGCCGGGATCATGTACCGCAAGTCCTGTGCATCATCAGCGGCCTGTCTCATCGCCTCTGCCGGGTACCAGTCCTTCTGCTCCCCAGGGAAACTGAACTCAGTTTGCATCAGCTGCTG。
The present invention also includes preferred amplicons obtained using preferred primers. For example, for the above experiment, the following amplicon has been obtained in a form limited to a non-limiting example of a suitable amplicon: R11723 junc11-18.
R11723junc11-18F (SEQ ID NO: 892) &#8211; AGTGATGGAGCAAAGTGCCG
R11723 junc11-18R (SEQ ID NO: 893) &#8211; CAGCAGCTGATGCAAACTGAG
R11723 junc11-18 (SEQ ID NO: 894) &#8211; AGTGATGGAGCAAAGTGCCGGGATCATGTACCGCAAGTCCTGTGCATCATCAGCGGCCTGTCTCATCGCCTCTGCCGGGTACCAGTCCTTCTGCTCCCCAGGGAAACTGAACTCAGTTTGCATCAGCTGCTG.

配列名R11723 junc11−18に描かれたアンプリコンにより検出可能なR11723転写物の各種正常組織での発現
R11723seg13アンプリコン、ならびにプライマ−R11723 junc11−18FおよびR11723 junc11−18Rによって検出可能な転写物の発現を、リアルタイムPCRを用いて測定した(上記したように、この接合部、即ちアンプリコンは、「野生型」またはWTタンパク質とも呼ばれり、その配列を本明細書に示している既知タンパク質に見出されるアンプリコンである;このタンパク質は「SPEC」とも呼ばれる)。平行して四種類のハウスキ−ピング遺伝子RPL19(GenBankアクセッション番号NM_000981;RPL19アンプリコン)、TATAボックス(GenBankアクセッション番号NM_003194;TATAアンプリコン)、UBC(GenBankアクセッション番号BC000449;アンプリコン−ユビキチンアンプリコン)およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現をハウスキ−ピング遺伝子量の相乗平均に対して正規化した。次に正規化した各RTサンプルの値を卵巣サンプル(表2「正常パネルの組織サンプル」のサンプル番号18〜20)中央値で除し、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。図41Bは、この転写物の発現レベルを示す。プライマ−およびアンプリコンは上記の通りである。
Expression in various normal tissues of the R11723 transcript detectable by the amplicon depicted in the sequence name R11723 junc11-18
The expression of the transcripts detectable by the R11723seg13 amplicon and the primers R11723 junc11-18F and R11723 junc11-18R was measured using real-time PCR (as described above, this junction, ie the amplicon, was “wild Also referred to as “type” or WT protein, an amplicon whose sequence is found in the known proteins shown herein; this protein is also referred to as “SPEC”). In parallel, four types of housekeeping genes RPL19 (GenBank accession number NM_000981; RPL19 amplicon), TATA box (GenBank accession number NM_003194; TATA amplicon), UBC (GenBank accession number BC000449; amplicon-ubiquitin amplifier) Recon) and SDHA (GenBank accession number NM_004168; amplicon-SDHA amplicon) were measured in the same manner. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of the ovary sample (sample numbers 18 to 20 in Table 2, “Tissue sample of normal panel”) to obtain the relative expression value of each sample relative to the median value of the ovary sample. It was. FIG. 41B shows the expression level of this transcript. Primers and amplicons are as described above.

このクラスタの変異体転写物の発現は、野生型転写物の発現に類似している。しかしながら、幾つかの例(例えば卵巣癌)では、変異体の過剰発現がより高いと思われた(例えばR11723_PEA_1_T5に関して)。   The expression of the mutant transcript of this cluster is similar to the expression of the wild type transcript. However, in some cases (eg ovarian cancer) the mutant overexpression appeared to be higher (eg for R11723_PEA_1_T5).

クラスタT46984の説明
クラスタT46984は、その名称を表1および2にそれぞれ示し、配列それ自体は本明細書の最後に示す、関心対象の21個の転写物と49個のセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Description of Cluster T46984 Cluster T46984 is characterized by 21 transcripts of interest and 49 segments, the names of which are shown in Tables 1 and 2, respectively, and the sequence itself is given at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体(SwissProtアクセッション識別子BIB2_HUMAN:同義語EC 2.4.1.119;リボホリンII;RPN−II;RBIIRとしても知られる)、配列番号:663であり、ここでは既知タンパク質と呼ぶ。   These sequences are known as dorisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (SwissProt accession identifier BIB2_HUMAN: synonyms EC 2.4.1.119; ribophorin II; RPN-II; RBIIR Known), SEQ ID NO: 663, referred to herein as a known protein.

タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体は次の機能を有することが知られているか、または有すると考えられている:脂質結合オリゴサッカライド供与体から新生ポリペプチド鎖内Asn−X−Ser/Thrコンセンサスモチ−フ内アスパラギン残基への高マンノ−スオリゴサッカライドの転移を触媒するN−オリゴサッカリルトランスフェラ−ゼ酵素の必須サブユニット。タンパク質、ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体の配列は、本明細書の最後に「ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体アミノ酸配列」として示されている。この配列について知られている多形を表4に示す。   Protein dorisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor is known or believed to have the following functions: emerging from lipid-linked oligosaccharide donors An essential subunit of the N-oligosaccharyltransferase enzyme that catalyzes the transfer of high mannose oligosaccharides to asparagine residues within the polypeptide intrachain Asn-X-Ser / Thr consensus motif. The sequence of the protein, dorisyl-diphosphooligosaccharide-protein glyxyl transferase 63 kDa subunit precursor is given at the end of this document as "dosyl-diphosphooligosaccharide-protein glyxyl transferase 63 kDa subunit precursor. Body amino acid sequence ". Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質、ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体の局在は、I型膜タンパク質と考えられている。小胞体。   The localization of the protein, doricyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor is considered a type I membrane protein. ER.

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;タンパク質修飾、これは生物学的プロセスに関係する注釈であり;オリゴサッカリルトランスフェラ−ゼ;ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ;トランスフェラ−ゼ、これは分子機能に関係する注釈付けであり;そしてオリゴサッカリルトランスフェラ−ゼ複合体;膜内在性タンパク質、これらは細胞成分に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; protein modifications, which are annotations related to biological processes; oligosaccharyl transferases; dosyl-diphosphooligosaccharides-protein glyxyl transferases; Transfers, which are annotations related to molecular function; and oligosaccharyl transferase complexes; integral membrane proteins, these are annotations related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタT46984は、癌においてこのクラスタ転写物が過剰発現することから、診断マ−カ−として用いることができる。このようような転写物の正常組織での発現も、前述の方法によって得られる。表、左手縦列の項目「数」および図42のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けされたEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster T46984 can be used as a diagnostic marker because this cluster transcript is overexpressed in cancer. Expression of such transcripts in normal tissues can also be obtained by the method described above. The number of items in the table, left hand column “number” and the y-axis number in FIG. 42 is the weighted EST expression for each category expressed in the form of “parts per million” (in parts per million Expressed ratio of EST expression of a specific cluster to expression of all ESTs of this classification).

全体として、図41のヒストグラムおよび表5に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);上皮性悪性腫瘍、各種組織由来の混合型悪性腫瘍、乳房悪性腫瘍、卵巣癌、および膵臓癌。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 41 and Table 5. This cluster is overexpressed (at least at a minimal level) in the following pathological conditions: epithelial malignancies, mixed malignancies from various tissues, breast malignancies, ovarian cancer, and pancreatic cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタT46984は、上表1に記載の、21個の転写物を特徴とする。これら転写物は、タンパク質、ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster T46984 is characterized by the 21 transcripts listed in Table 1 above. These transcripts code for a protein, a variant of the protein, doricyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質T46984_PEA_1_PEA_1_P2は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_PEA_1_T2にコ−ドされている。本明細書の最後に、既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_PEA_1_P2 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T46984_PEA_1_PEA_1_T2. At the end of the specification, an alignment to a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P2とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P2をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜498に相当し、またT46984_PEA_1_P2のアミノ酸1〜498にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVに少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P2のアミノ酸499〜501に相当する配列VCAを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T46984_PEA_1_P2 and RIB2_HUMAN:
1. T46984_PEA_1_P2 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 498 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV which also corresponds to amino acids 1 to 498 of T46984_PEA_1_P2 And a polypeptide having the sequence VCA corresponding to amino acids 499-501 of T46984_PEA_1_P2, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, It comprises a second amino acid sequence, most preferably at least 95% homologous to the this time the first and second amino acid sequences are linked in sequence continuously.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T46984_PEA_1_P2のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表7に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of the mutant protein T46984_PEA_1_P2 is shown in Table 7 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P2は次の転写物にコ−ドされている:T46984_PEA_1_T2、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T2のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置1818に終止する。転写物はまた、表8に掲載されている次のSNPも有している(それらのヌクレオチド酸配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P2配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P2 is encoded in the following transcript: T46984_PEA_1_T2, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T46984_PEA_1_T2 is shown in bold: this coding portion starts at position 316 and ends at position 1818. The transcript also has the following SNPs listed in Table 8 (shown according to their position on the nucleotide acid sequence, followed by the modified nucleic acids; the last column is known by the SNPs) The presence of a known SNP in the mutant protein T46984_PEA_1_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P3は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T3にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを本明細書の最後に示す。これまでに公開されたタンパク質配列の一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P3 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T46984_PEA_1_T3. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P3とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P36をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜433に相当し、またT46984_PEA_1_P3のアミノ酸1〜433にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQに対し少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P3のアミノ酸434〜444に相当する配列ICHIWKLIFLPを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T46984_PEA_1_P3 and RIB2_HUMAN:
1. T46984_PEA_1_P36 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 433 of RIB2_HUMAN, also the first amino acid being at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQ which also corresponds to amino acids 1 to 433 of T46984_PEA_1_P3 At least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% of the sequence and a polypeptide having the sequence ICHIWKLIFLP corresponding to amino acids 434-444 of T46984_PEA_1_P3 %phase A second amino acid sequence which is the same, wherein the first and second amino acid sequences are successively connected in sequence.

2.T46984_PEA_1_P3の尾部をコ−ドする単離されたポリペプチドは、T46984_PEA_1_P3内の配列ICHIWKLIFLPに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of T46984_PEA_1_P3 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence ICHIWKLIFLP in T46984_PEA_1_P3. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T46984_PEA_1_P3はまた、表9に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P3配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T46984_PEA_1_P3 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 9 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P3のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表10に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of mutant protein T46984_PEA_1_P3 is shown in Table 10 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P3は次の転写物にコ−ドされている:T46984_PEA_1_T3、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T3のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置1647に終止する。転写物はまた、表11に掲載されている次のSNPも有している(それらのヌクレオチド酸配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P3配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P3 is encoded in the following transcript: T46984_PEA_1_T3, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T46984_PEA_1_T3 is shown in bold: this coding portion starts at position 316 and ends at position 1647. The transcript also has the following SNPs listed in Table 11 (shown according to their position on the nucleotide acid sequence, followed by the modified nucleic acids; the last column is known by the SNPs) The presence of a known SNP in the mutant protein T46984_PEA_1_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P10は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T13にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P10 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript T46984_PEA_1_T13. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P10とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P10をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜498に相当し、またT46984_PEA_1_P10のアミノ酸1〜498にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVに少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P10のアミノ酸499〜503に相当する配列LMDQKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T46984_PEA_1_P10 and RIB2_HUMAN:
1. T46984_PEA_1_P10 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 498 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV which also corresponds to amino acids 1 to 498 of T46984_PEA_1_P10 , And a polypeptide having the sequence LMDQK corresponding to amino acids 499-503 of T46984_PEA_1_P10, at least 80%, if necessary at least 80%, preferably at least 85%, more preferably at least 90 %, And most preferably at least 95% homologous second amino acid sequence, wherein the first and second amino acid sequences are sequentially connected in sequence.

2. T46984_PEA_1_P10の尾部をコ−ドする単離されたポリペプチドは、T46984_PEA_1_P10内の配列LMDQKに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of T46984_PEA_1_P10 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence LMDQK in T46984_PEA_1_P10. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T46984_PEA_1_P10はまた、表12に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P10配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T46984_PEA_1_P10 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 12 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P10 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P10のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表13に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of mutant protein T46984_PEA_1_P10 is shown in Table 13 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P10は次の転写物にコ−ドされている:T46984_PEA_1_T13、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T13のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置1824に終止する。転写物はまた、表14に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P10配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P10 is encoded in the following transcript: T46984_PEA_1_T13, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T46984_PEA_1_T13 is shown in bold: this coding portion starts at position 316 and ends at position 1824. The transcript also has the following SNPs listed in Table 14 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T46984_PEA_1_P10 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P11は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T14にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P11 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript T46984_PEA_1_T14. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P11とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P11をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜628に相当し、またT46984_PEA_1_P11のアミノ酸1〜628にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVADVVIKFPEEEAPSTVLSQNLFTPKQEIQHLFREPEKRPPTVVSNTFTALILSPLLLLFALWIRIGANVSNFTFAPSTIIFHLGHAAMLGLMYVYWTQLNMFQTLKYLAILGSVTFLAGNRMLAQQAVKRに少なくとも90%相同である第一アミノ酸配列を含む。
Comparison report between T46984_PEA_1_P11 and RIB2_HUMAN:
1. An isolated chimeric polypeptide encoding T46984_PEA_1_P11 has a first amino acid sequence corresponding to amino acids 1 to 628 of RIB2_HUMAN and corresponding to amino acids 1 to 628 of T46984_PEA_1_P11, and at least 90% homologous. Including.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:膜。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有することで一致したが、両方の膜貫通領域推測プログラムが、このタンパク質がこのシグナルペプチドの顆粒に膜貫通領域を有していると予測したことから、膜にあると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: membranes. The localization of the protein was consistent between both signal peptide prediction programs that the protein had a signal peptide, but both transmembrane region estimation programs had a transmembrane region in the signal peptide granule. It is believed to be in the membrane because it was predicted.

変異体タンパク質T46984_PEA_1_P11はまた、表15に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P11配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T46984_PEA_1_P11 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 15 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P11 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P11のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表16に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of the mutant protein T46984_PEA_1_P11 is shown in Table 16 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P11は次の転写物にコ−ドされている:T46984_PEA_1_T14、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T14のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置2199に終止する。転写物はまた、表17に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P11配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T46984_PEA_1_P11 is encoded in the following transcript: T46984_PEA_1_T14, the sequence of this transcript is shown at the end of the specification. The coding portion of transcript T46984_PEA_1_T14 is shown in bold: this coding portion starts at position 316 and ends at position 2199. The transcript also has the following SNPs listed in Table 17 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T46984_PEA_1_P11 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P12は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T15にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P12 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T46984_PEA_1_T15. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P12とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P12をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜338に相当し、またT46984_PEA_1_P12のアミノ酸1〜338にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNに少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P12のアミノ酸339〜343に相当する配列SQDLHを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T46984_PEA_1_P12 and RIB2_HUMAN:
1. T46984_PEA_1_P12 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 338 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMN which also corresponds to amino acids 1 to 338 of T46984_PEA_1_P12 And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% of the polypeptide having the sequence SQDLH corresponding to amino acids 339 to 343 of T46984_PEA_1_P12 A second amino acid sequence that is homologous, wherein said first and second amino acid sequences Are connected sequentially.

2. T46984_PEA_1_P12の尾部をコ−ドする単離されたポリペプチドは、T46984_PEA_1_P12内の配列SQDLHに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of T46984_PEA_1_P12 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence SQDLH within T46984_PEA_1_P12. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測したこと、および膜貫通領域推測プログラムが、このタンパク質は膜貫通領域を有していると予測しなかったことから、分泌型であると信じられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that the transmembrane region guessing program did not predict that this protein had a transmembrane region Therefore, it is believed to be a secretory type.

変異体タンパク質T46984_PEA_1_P12はまた、表18に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P12配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T46984_PEA_1_P12 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 18 (shown according to their amino acid sequence position, followed by the modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P12 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P12のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表19に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of the mutant protein T46984_PEA_1_P12 is shown in Table 19 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P12は次の転写物にコ−ドされている:T46984_PEA_1_T15、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T15のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置1344に終止する。転写物はまた、表20に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P12配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P12 is encoded in the following transcript: T46984_PEA_1_T15, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T46984_PEA_1_T15 is shown in bold: this coding portion starts at position 316 and ends at position 1344. The transcript also has the following SNPs listed in Table 20 (shown according to their nucleotide sequence position, then the modified nucleic acid is listed; the last column is known to the SNP) The presence of a known SNP in the mutant protein T46984_PEA_1_P12 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P21は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T27にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P21 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T46984_PEA_1_T27. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P21とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P21をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1に相当し、またT46984_PEA_1_P10のアミノ酸1にも相当する配列Mを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、およびRIB2_HUMANのアミノ酸70〜631に相当し、またT46984_PEA_1_P21のアミノ酸2〜563にも相当するKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVADVVIKFPEEEAPSTVLSQNLFTPKQEIQHLFREPEKRPPTVVSNTFTALILSPLLLLFALWIRIGANVSNFTFAPSTIIFHLGHAAMLGLMYVYWTQLNMFQTLKYLAILGSVTFLAGNRMLAQQAVKRTAHに少90%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T46984_PEA_1_P21 and RIB2_HUMAN:
1. An isolated chimeric polypeptide that codes for T46984_PEA_1_P21 corresponds to amino acid 1 of RIB2_HUMAN and also has a sequence M corresponding to amino acid 1 of T46984_PEA_1_P10, at least 70% if necessary, at least 70% 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to the first amino acid sequence and corresponds to amino acids 70-631 of RIB2_HUMAN and also to amino acids 2-563 of T46984_PEA_1_P21 Correspondingly comprises a second amino acid sequence that is 90% homologous, wherein the first and second amino acid sequences are successively connected in sequence.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:膜。タンパク質の局在は、両方の膜貫通領域推測プログラムがこのタンパク質について膜貫通領域を推測したことから、膜にあると考えられる。これに加えて、両方のシグナルペプチド予測プログラムは、このタンパク質が非分泌型タンパク質であると推測している。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: membranes. The localization of the protein is thought to be in the membrane, as both transmembrane domain inference programs have estimated the transmembrane domain for this protein. In addition, both signal peptide prediction programs speculate that this protein is a non-secreted protein.

変異体タンパク質T46984_PEA_1_P21はまた、表21に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P21配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P21 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 21 (shown according to their amino acid sequence position, followed by the modified amino acids; last Column indicates whether the SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P21 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P21のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表22に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of mutant protein T46984_PEA_1_P21 is shown in Table 22 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P21は次の転写物にコ−ドされている:T46984_PEA_1_T27、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T27のコ−ディング部分は太字で表している:このコ−ディング部分は、位置338から始まり、位置2026に終止する。転写物はまた、表23に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P21配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P21 is encoded in the following transcript: T46984_PEA_1_T27, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T46984_PEA_1_T27 is shown in bold: this coding portion starts at position 338 and ends at position 2026. The transcript also has the following SNPs listed in Table 23 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T46984_PEA_1_P21 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P27は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T34にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P27 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T46984_PEA_1_T34. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P27とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P27をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜415に相当し、またT46984_PEA_1_P27のアミノ酸1〜415にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFAに少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P27のアミノ酸416〜459に相当する配列FGSGLVPMSPTSLLLLARLYFTWDMLLCWDSCMSTGLSSTCSRPを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T46984_PEA_1_P27 and RIB2_HUMAN:
1. T46984_PEA_1_P27 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 415 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFA which also corresponds to amino acids 1 to 415 of T46984_PEA_1_P27 , And a polypeptide having the sequence FGSGLVPMSPTSLLLLARLYFTWDMLLCWDSCMSTGLSSTCSRP corresponding to amino acids 416-459 of T46984_PEA_1_P27, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least Also comprises a second amino acid sequence is 95% homologous, the this case the first and second amino acid sequences are linked in sequence continuously.

2. T46984_PEA_1_P27の尾部をコ−ドする単離されたポリペプチドは、T46984_PEA_1_P27内の配列FGSGLVPMSPTSLLLLARLYFTWDMLLCWDSCMSTGLSSTCSRPに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of T46984_PEA_1_P27 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence FGSGLVPMSPTSLLLLARLYFTWDMLLCWDSCMSTGLSSTCSRP in T46984_PEA_1_P27. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド推測プログラムが、このタンパク質がシグナルペプチドを有すると推測したこと、そして膜貫通領域推測プログラムがこのタンパク質が膜貫通領域を有すると推測しなかったことから、分泌されると考えられる。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is secreted because both signal peptide guessing programs speculated that this protein has a signal peptide and that the transmembrane domain guessing program did not speculate that this protein has a transmembrane domain. It is thought.

変異体タンパク質T46984_PEA_1_P27はまた、表24に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P27配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T46984_PEA_1_P27 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 24 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P27 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P27のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表25に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of mutant protein T46984_PEA_1_P27 is shown in Table 25 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P27は次の転写物にコ−ドされている:T46984_PEA_1_T34、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T34のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置1692に終止する。転写物はまた、表26に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P27配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P27 is encoded in the following transcript: T46984_PEA_1_T34, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T46984_PEA_1_T34 is shown in bold: this coding portion starts at position 316 and ends at position 1692. The transcript also has the following SNPs listed in Table 26 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T46984_PEA_1_P27 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P32は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T40にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P32 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T46984_PEA_1_T40. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P32とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P32をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜364に相当し、またT46984_PEA_1_P32のアミノ酸1〜364にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVEに少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P32のアミノ酸365〜397に相当する配列GQVRWLTPVIPALWEAKAGGSPEVRSSILAWPTを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
Comparison report between T46984_PEA_1_P32 and RIB2_HUMAN:
1. T46984_PEA_1_P32 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 364 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVE which also corresponds to amino acids 1 to 364 of T46984_PEA_1_P32 , And a polypeptide having the sequence GQVRWLTPVIPALWEAKAGGSPEVRSSILAWPT corresponding to amino acids 365-397 of T46984_PEA_1_P32, at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% Contains a second amino acid sequence that is homologous, In this case, the first and second amino acid sequences are sequentially connected in sequence.

2. T46984_PEA_1_P32の尾部をコ−ドする単離されたポリペプチドは、T46984_PEA_1_P32内の配列GQVRWLTPVIPALWEAKAGGSPEVRSSILAWPTに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of T46984_PEA_1_P32 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% of the sequence GQVRWLTPVIPALWEAKAGGSPEVRSSILAWPT within T46984_PEA_1_P32. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド推測プログラムが、このタンパク質がシグナルペプチドを有すると推測したこと、そして膜貫通領域推測プログラムがこのタンパク質が膜貫通領域を有すると推測しなかったことから、分泌されると考えられる。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is secreted because both signal peptide guessing programs speculated that this protein has a signal peptide and that the transmembrane domain guessing program did not speculate that this protein has a transmembrane domain. It is thought.

変異体タンパク質T46984_PEA_1_P32はまた、表27に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P32配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T46984_PEA_1_P32 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 27 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P32 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P32のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表28に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of mutant protein T46984_PEA_1_P32 is shown in Table 28 in comparison with a known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P32は次の転写物にコ−ドされている:T46984_PEA_1_T40、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T40のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置1506に終止する。転写物はまた、表29に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P32配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P32 is encoded in the following transcript: T46984_PEA_1_T40, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T46984_PEA_1_T40 is shown in bold: this coding portion starts at position 316 and ends at position 1506. The transcript also has the following SNPs listed in Table 29 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T46984_PEA_1_P32 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P34は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T42にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P34 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T46984_PEA_1_T42. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P34とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P34をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜329に相当し、またT46984_PEA_1_P34のアミノ酸1〜329にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVGに少なくとも90%相同である第一アミノ酸配列を含む。
Comparison report between T46984_PEA_1_P34 and RIB2_HUMAN:
1. T46984_PEA_1_P34 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 329 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATVLQKTSFTPVG which also corresponds to amino acids 1 to 329 of T46984_PEA_1_P34 including.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド推測プログラムが、このタンパク質がシグナルペプチドを有すると推測したこと、そして膜貫通領域推測プログラムがこのタンパク質が膜貫通領域を有すると推測しなかったことから、分泌されると考えられる。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is secreted because both signal peptide guessing programs speculated that this protein has a signal peptide and that the transmembrane domain guessing program did not speculate that this protein has a transmembrane domain. It is thought.

変異体タンパク質T46984_PEA_1_P34はまた、表30に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P34配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T46984_PEA_1_P34 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 30 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether the SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P34 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P34のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表31に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of the mutant protein T46984_PEA_1_P34 is shown in Table 31 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P34は次の転写物にコ−ドされている:T46984_PEA_1_T42、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T42のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置1302に終止する。転写物はまた、表32に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P34配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P34 is encoded in the following transcript: T46984_PEA_1_T42, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T46984_PEA_1_T42 is shown in bold: this coding portion starts at position 316 and ends at position 1302. The transcript also has the following SNPs listed in Table 32 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T46984_PEA_1_P34 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P35は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T43にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体とのアラインメント)を、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P35 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript T46984_PEA_1_T43. The known protein (alignment with doricyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P35とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P35をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜287に相当し、またT46984_PEA_1_P35のアミノ酸1〜287にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAIに少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P35のアミノ酸288〜334に相当する配列GCWPSRQSREQHISSRRKMEILKTECQEKESRTIHSMRRKMEKKNFIを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
を含む。
Comparison report between T46984_PEA_1_P35 and RIB2_HUMAN:
1. T46984_PEA_1_P35 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 287 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAI which also corresponds to amino acids 1 to 287 of T46984_PEA_1_P35 , And a polypeptide having the sequence GCWPSRQSREQHISSRRKMEILKTECQEKESRTIHSMRRKMEKKNFI corresponding to amino acids 288 to 334 of T46984_PEA_1_P35, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are contiguous And connected in order.
including.

2. T46984_PEA_1_P35の尾部をコ−ドする単離されたポリペプチドは、T46984_PEA_1_P35内の配列GCWPSRQSREQHISSRRKMEILKTECQEKESRTIHSMRRKMEKKNFIに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of T46984_PEA_1_P35 has at least 70%, in some cases at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence GCWPSRQSREQHISSRRKMEILKTECQEKESRTIHSMRRKMEKKNFI within T46984_PEA_1_P35. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド推測プログラムが、このタンパク質がシグナルペプチドを有すると推測したこと、そして膜貫通領域推測プログラムがこのタンパク質が膜貫通領域を有すると推測しなかったことから、分泌されると考えられる。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is secreted because both signal peptide guessing programs speculated that this protein has a signal peptide and that the transmembrane domain guessing program did not speculate that this protein has a transmembrane domain. It is thought.

変異体タンパク質T46984_PEA_1_P35はまた、表33に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P35配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T46984_PEA_1_P35 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 33 (shown according to their amino acid sequence position, followed by the modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P35 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P35のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表34に示す(第一縦列にアミノ酸配列でのそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of mutant protein T46984_PEA_1_P35 is shown in Table 34 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (in amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P35は次の転写物にコ−ドされている:T46984_PEA_1_T43、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T43のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置1317に終止する。転写物はまた、表35に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P35配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P35 is encoded in the following transcript: T46984_PEA_1_T43, the sequence of this transcript is given at the end of the specification. The coding part of the transcript T46984_PEA_1_T43 is shown in bold: this coding part starts at position 316 and ends at position 1317. The transcript also has the following SNPs listed in Table 35 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is known SNPs) The presence of a known SNP in the mutant protein T46984_PEA_1_P35 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P38は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T47にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P38 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T46984_PEA_1_T47. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P38とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P38をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜145に相当し、またT46984_PEA_1_P38のアミノ酸1〜145にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALに少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P38のアミノ酸146〜160に相当する配列MDPDWCQCLQLHFCSを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
を含む。
Comparison report between T46984_PEA_1_P38 and RIB2_HUMAN:
1. An isolated chimeric polypeptide that codes for T46984_PEA_1_P38 corresponds to amino acids 1-145 of RIB2_HUMAN, and also corresponds to amino acids 1-145 of T46984_PEA_1_P38. And a polypeptide having the sequence MDPDWCQCLQLHFCS corresponding to amino acids 146-160 of T46984_PEA_1_P38, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.
including.

2. T46984_PEA_1_P38の尾部をコ−ドする単離されたポリペプチドは、T46984_PEA_1_P38内の配列MDPDWCQCLQLHFCSに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of T46984_PEA_1_P38 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence MDPDWCQCLQLHFCS within T46984_PEA_1_P38. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド推測プログラムが、このタンパク質がシグナルペプチドを有すると推測したこと、そして膜貫通領域推測プログラムがこのタンパク質が膜貫通領域を有すると推測しなかったことから、分泌されると考えられる。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is secreted because both signal peptide guessing programs speculated that this protein has a signal peptide and that the transmembrane domain guessing program did not speculate that this protein has a transmembrane domain. It is thought.

変異体タンパク質T46984_PEA_1_P38はまた、表36に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P38配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P38 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 36 (shown according to their amino acid sequence position, followed by the modified amino acids; last Column indicates whether the SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P38 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P38のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表37に示す(第一縦列にアミノ酸配列中のそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of the mutant protein T46984_PEA_1_P38 is shown in Table 37 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (in the amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P38は次の転写物にコ−ドされている:T46984_PEA_1_T47、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T47のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置795に終止する。転写物はまた、表38に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P38配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P38 is encoded in the following transcript: T46984_PEA_1_T47, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T46984_PEA_1_T47 is shown in bold: this coding portion starts at position 316 and ends at position 795. The transcript also has the following SNPs listed in Table 38 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is known SNPs) The presence of a known SNP in the mutant protein T46984_PEA_1_P38 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P39は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T48にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P39 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T46984_PEA_1_T48. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P39とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P39をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜160に相当し、またT46984_PEA_1_P39のアミノ酸1〜160にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLAに少なくとも90%相同である第一アミノ酸配列を含む。
Comparison report between T46984_PEA_1_P39 and RIB2_HUMAN:
1. T46984_PEA_1_P39 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 160 of RIB2_HUMAN, also the first amino acid sequence that is at least 90% homologous to MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLA which also corresponds to amino acids 1 to 160 of T46984_PEA_1_P39 including.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド推測プログラムが、このタンパク質がシグナルペプチドを有すると推測したこと、そして膜貫通領域推測プログラムがこのタンパク質が膜貫通領域を有すると推測しなかったことから、分泌されると考えられる。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is secreted because both signal peptide guessing programs speculated that this protein has a signal peptide and that the transmembrane domain guessing program did not speculate that this protein has a transmembrane domain. It is thought.

変異体タンパク質T46984_PEA_1_P39はまた、表39に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P39配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T46984_PEA_1_P39 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 39 (shown according to their amino acid sequence position, followed by the modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P39 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P39のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表40に示す(第一縦列にアミノ酸配列中のそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of mutant protein T46984_PEA_1_P39 is shown in Table 40 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (in the amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P39は次の転写物にコ−ドされている:T46984_PEA_1_T48、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T48のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置795に終止する。転写物はまた、表41に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P39配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P39 is encoded in the following transcript: T46984_PEA_1_T48, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T46984_PEA_1_T48 is shown in bold: this coding portion starts at position 316 and ends at position 795. The transcript also has the following SNPs listed in Table 41 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T46984_PEA_1_P39 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P45は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T32にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P45 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript T46984_PEA_1_T32. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P45とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P45をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜101に相当し、またT46984_PEA_1_P45のアミノ酸1〜101にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGCEに少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P45のアミノ酸102〜116に相当する配列NSPGSADSIPPVPAGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
を含む。
Comparison report between T46984_PEA_1_P45 and RIB2_HUMAN:
1. The isolated chimeric polypeptide that codes for T46984_PEA_1_P45 corresponds to amino acids 1-101 of RIB2_HUMAN and also corresponds to amino acids 1-101 of T46984_PEA_1_P45, which is at least the first amino acid sequence HMAPVERSTASLLRP , And a polypeptide having the sequence NSPGSADSIPPVPAG corresponding to amino acids 102-116 of T46984_PEA_1_P45, if necessary at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.
including.

2. T46984_PEA_1_P45の尾部をコ−ドする単離されたポリペプチドは、T46984_PEA_1_P45内の配列NSPGSADSIPPVPAGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that encodes the tail of T46984_PEA_1_P45 has at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence NSPGSADSIPPVPAG in T46984_PEA_1_P45. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド推測プログラムが、このタンパク質がシグナルペプチドを有すると推測したこと、そして膜貫通領域推測プログラムがこのタンパク質が膜貫通領域を有すると推測しなかったことから、分泌されると考えられる。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is secreted because both signal peptide guessing programs speculated that this protein has a signal peptide and that the transmembrane domain guessing program did not speculate that this protein has a transmembrane domain. It is thought.

変異体タンパク質T46984_PEA_1_P45はまた、表42に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P45配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T46984_PEA_1_P45 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 42 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P45 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P45のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表43に示す(第一縦列にアミノ酸配列中のそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of the mutant protein T46984_PEA_1_P45 is shown in Table 43 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (in the amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P45は次の転写物にコ−ドされている:T46984_PEA_1_T32、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T32のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置663に終止する。転写物はまた、表44に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P45配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P45 is encoded in the following transcript: T46984_PEA_1_T32, the sequence of this transcript is given at the end of the specification. The coding part of the transcript T46984_PEA_1_T32 is shown in bold: this coding part starts at position 316 and ends at position 663. The transcript also has the following SNPs listed in Table 44 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T46984_PEA_1_P45 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T46984_PEA_1_P46は、本明細書最後に示すアミノ酸配列を有する;それは転写物T46984_PEA_1_T35にコ−ドされている。既知タンパク質(ドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体)とのアラインメントを、本明細書の最後に示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T46984_PEA_1_P46 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript T46984_PEA_1_T35. An alignment with a known protein (drisyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor) is shown at the end of the specification. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T46984_PEA_1_P46とRIB2_HUMANの比較報告:
1. T46984_PEA_1_P46をコ−ドする単離されたキメラポリペプチドは、RIB2_HUMANのアミノ酸1〜69に相当し、またT46984_PEA_1_P46のアミノ酸1〜69にも相当するMAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAKに少なくとも90%相同である第一アミノ酸配列、およびT46984_PEA_1_P46のアミノ酸70〜84に相当する配列NSPGSADSIPPVPAGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、このとき前記第一および第二アミノ酸配列は連続して順番につながっている。
を含む。
Comparison report between T46984_PEA_1_P46 and RIB2_HUMAN:
1. The isolated chimeric polypeptide that codes for T46984_PEA_1_P46 is at least the first amino acid sequence of 90 amino acids in sequence MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLESAFYSIVGLSSLGAQVPDAK corresponding to amino acids 1-69 of RIB2_HUMAN and corresponding to amino acids 1-69 of T46984_PEA_1_P46 , And a polypeptide having the sequence NSPGSADSIPPVPAG corresponding to amino acids 70-84 of T46984_PEA_1_P46, at least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% A second amino acid sequence that is homologous, wherein the first and second amino acid sequences are sequentially linked in sequence.
including.

2. T46984_PEA_1_P46の尾部をコ−ドする単離されたポリペプチドは、T46984_PEA_1_P46内の配列NSPGSADSIPPVPAGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2. An isolated polypeptide that codes the tail of T46984_PEA_1_P46 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence NSPGSADSIPPVPAG in T46984_PEA_1_P46. %, And most preferably at least about 95% homologous polypeptide.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両シグナルペプチド推測プログラムが、このタンパク質がシグナルペプチドを有すると推測したこと、そして膜貫通領域推測プログラムがこのタンパク質が膜貫通領域を有すると推測しなかったことから、分泌されると考えられる。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is secreted because both signal peptide guessing programs speculated that this protein has a signal peptide and that the transmembrane domain guessing program did not speculate that this protein has a transmembrane domain. It is thought.

変異体タンパク質T46984_PEA_1_P465はまた、表45に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T46984_PEA_1_P46配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T46984_PEA_1_P465 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 45 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T46984_PEA_1_P46 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P46のグリコシレ−ション部位を、既知タンパク質のドリシル−ジホスホオリゴサッカライド−タンパク質グリキシルトランスフェラ−ゼ63kDaサブユニット前駆体と比較する形で表46に示す(第一縦列にアミノ酸配列中のそれらの位置に従って並べ;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示し;そして最後の縦列は、その位置が変異体タンパク質で異なっているかを示す)。   The glycosylation site of mutant protein T46984_PEA_1_P46 is shown in Table 46 in comparison with the known protein dosyl-diphosphooligosaccharide-protein glyxyltransferase 63 kDa subunit precursor (in the amino acid sequence in the first column). The second column indicates whether the glycosylation site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質T46984_PEA_1_P46は次の転写物にコ−ドされている:T46984_PEA_1_T35、この転写物の配列は本明細書の最後に示してある。転写物T46984_PEA_1_T35のコ−ディング部分は太字で表している:このコ−ディング部分は、位置316から始まり、位置567に終止する。転写物はまた、表47に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT46984_PEA_1_P46配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T46984_PEA_1_P46 is encoded in the following transcript: T46984_PEA_1_T35, the sequence of this transcript is given at the end of the specification. The coding part of the transcript T46984_PEA_1_T35 is shown in bold: this coding part starts at position 316 and ends at position 567. The transcript also has the following SNPs listed in Table 47 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T46984_PEA_1_P46 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

上記したように、クラスタT46984は、上表2に掲載し、またその配列を本明細書の最後に示す49個のセグメントを特徴とする。これらセグメントは、特に関心の対象であることからここに別々に記載する核酸配列の部分である。次に本発明の各セグメントについて説明する。   As noted above, cluster T46984 is listed in Table 2 above and is characterized by 49 segments whose arrangement is shown at the end of this specification. These segments are part of the nucleic acid sequence described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタT46984_PEA_1_node_2は240個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T40、T46984_PEA_1_T42、T46984_PEA_1_T43、T46984_PEA_1_T47、およびT46984_PEA_1_T48。下表48に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_2 of the present invention is supported by 240 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T40, T46984_PEA_1_T42, T46984_PEA_1_T43, T46984_PEA_1_T47, and T46984_PEA_1_T48. Table 48 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_4は321個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T40、T46984_PEA_1_T42、T46984_PEA_1_T43、T46984_PEA_1_T47、およびT46984_PEA_1_T48。下表49に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_4 of the present invention is supported by 321 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T40, T46984_PEA_1_T42, T46984_PEA_1_T43, T46984_PEA_1_T47, and T46984_PEA_1_T48. Table 49 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_6は3つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T27。下表50に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_6 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T27. Table 50 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_12は262個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T34、T46984_PEA_1_T40、T46984_PEA_1_T42、T46984_PEA_1_T43、T46984_PEA_1_T47、およびT46984_PEA_1_T48。下表51に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_12 of the present invention is supported by 262 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T34, T46984_PEA_1_T40, T46984_PEA_1_T42, T46984_PEA_1_T43, T46984_PEA_1_T47, and T46984_PEA_1_T48. Table 51 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_14は2つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T48。下表52に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_14 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T48. Table 52 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_12は262個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T40、T46984_PEA_1_T42、およびT46984_PEA_1_T43。下表53に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_12 of the present invention is supported by 262 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T40, T46984_PEA_1_T42, and T46984_PEA_1_T43. Table 53 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_29は1つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T42。下表54に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_29 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T42. Table 54 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_34は4つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T40。下表55に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_34 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T40. Table 55 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_46は1つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T46。下表56に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_46 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T46. Table 56 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_47は5つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T3、T46984_PEA_1_T19、およびT46984_PEA_1_T46。下表57に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_47 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T3, T46984_PEA_1_T19, and T46984_PEA_1_T46. Table 57 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_52は29個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T19、およびT46984_PEA_1_T23。下表58に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_52 of the present invention is supported by 29 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T19, and T46984_PEA_1_T23. Table 58 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_65は2つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T51。下表59に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_65 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T51. Table 59 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_69は8個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T52、およびT46984_PEA_1_T54。下表60に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_69 of the present invention is supported by eight libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T52 and T46984_PEA_1_T54. Table 60 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_75は5つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる: T46984_PEA_1_T14。下表61に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_75 of the present invention is supported by five libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T14. Table 61 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_86は314個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T43、T46984_PEA_1_T46、T46984_PEA_1_T47、T46984_PEA_1_T51、T46984_PEA_1_T52、およびT46984_PEA_1_T54。下表62に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_86 of the present invention is supported by 314 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T43, T46984_PEA_1_T46, T46984_PEA_1_T47, T46984_PEA_1_T51, T46984_PEA_1_T52, and T46984_PEA_1_T54. Table 62 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の好選的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは約120bpまでの長さであることから、分けて説明する。   According to a preferred aspect of the invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they will be described separately.

本発明のセグメントクラスタT46984_PEA_1_node_9は304個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T40、T46984_PEA_1_T42、T46984_PEA_1_T43、T46984_PEA_1_T47、およびT46984_PEA_1_T48。下表63に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_9 of the present invention is supported by 304 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T40, T46984_PEA_1_T42, T46984_PEA_1_T43, T46984_PEA_1_T47, and T46984_PEA_1_T48. Table 63 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_13は232個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T34、T46984_PEA_1_T40、T46984_PEA_1_T42、T46984_PEA_1_T43、およびT46984_PEA_1_T48。下表64に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_13 of the present invention is supported by 232 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T34, T46984_PEA_1_T40, T46984_PEA_1_T42, T46984_PEA_1_T43, and T46984_PEA_1_T48. Table 64 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_19は237個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T40、T46984_PEA_1_T42、およびT46984_PEA_1_T43。下表65に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_19 of the present invention is supported by 237 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T40, T46984_PEA_1_T42, and T46984_PEA_1_T43. Table 65 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_21は242個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T40、T46984_PEA_1_T42、およびT46984_PEA_1_T43。下表66に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_21 of the present invention is supported by 242 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T40, T46984_PEA_1_T42, and T46984_PEA_1_T43. Table 66 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_22は205個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T40、T46984_PEA_1_T42、およびT46984_PEA_1_T43。下表67に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_22 of the present invention is supported by 205 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T40, T46984_PEA_1_T42, and T46984_PEA_1_T43. Table 67 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_26は次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T40、およびT46984_PEA_1_T42。下表68に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster T46984_PEA_1_node_26 of the present invention can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T40, and T46984_PEA_1_T42. Table 68 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_28は242個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T40、およびT46984_PEA_1_T42。下表69に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_28 of the present invention is supported by 242 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T40, and T46984_PEA_1_T42. Table 69 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_31は207個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、およびT46984_PEA_1_T40。下表70に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_31 of the present invention is supported by 207 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, and T46984_PEA_1_T40. Table 70 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_32は226個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、およびT46984_PEA_1_T40。下表71に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_32 of the present invention is supported by 226 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_T84, T46984_PEA_1_T469 Table 71 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_38は次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、およびT46984_PEA_1_T35。下表72に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster T46984_PEA_1_node_38 of the present invention can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, and T46984_PEA_1_T35. Table 72 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_39は次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、およびT46984_PEA_1_T35。下表73に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster T46984_PEA_1_node_39 of the present invention can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, and T46984_PEA_1_T35. Table 73 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_40は227個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、およびT46984_PEA_1_T35。下表74に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_40 of the present invention is supported by 227 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1, T46984_PE_1 Table 74 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_42は239個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、およびT46984_PEA_1_T35。下表75に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_42 of the present invention is supported by 239 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1, T46984_PE_1 Table 75 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_43は235個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、およびT46984_PEA_1_T35。下表76に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_43 of the present invention is supported by 235 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PE84, T46984_PE84 Table 76 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_48は282個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T35、およびT46984_PEA_1_T46。下表77に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_48 of the present invention is supported by 282 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_T84, T46984_PE84 Table 77 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_49は262個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T35、およびT46984_PEA_1_T46。下表78に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_49 of the present invention is supported by 262 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_T84, T46984_PE84 Table 78 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_50は277個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T35、およびT46984_PEA_1_T46。下表79に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_50 of the present invention is supported by 277 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_T84, T46984_PE84 Table 79 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_51は6個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T12、T46984_PEA_1_T19、およびT46984_PEA_1_T23。下表80に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_51 of the present invention is supported by six libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T12, T46984_PEA_1_T19, and T46984_PEA_1_T23. Table 80 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_53は16個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T13、T46984_PEA_1_T19、およびT46984_PEA_1_T23。下表81に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_53 of the present invention is supported by 16 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T13, T46984_PEA_1_T19, and T46984_PEA_1_T23. Table 81 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_54は18個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T19、およびT46984_PEA_1_T23。下表82に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_54 of the present invention is supported by 18 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T19, and T46984_PEA_1_T23. Table 82 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_55は335個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T35、およびT46984_PEA_1_T46。下表83に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_55 of the present invention is supported by 335 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_T84, T46984_PE84 Table 83 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_57は次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T35、およびT46984_PEA_1_T46。下表84に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster T46984_PEA_1_node_57 of the present invention can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T35, and T46984_PEA_1_T46. Table 84 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_60は326個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T35、およびT46984_PEA_1_T46。下表85に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_60 of the present invention is supported by 326 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_T84, T46984_T84, T46984_A84 Table 85 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_62は335個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T35、およびT46984_PEA_1_T46。下表86に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_62 of the present invention is supported by 335 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_T84, T46984_T84, T46984_A84 Table 86 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_66は336個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T46、T46984_PEA_1_T47、およびT46984_PEA_1_T51。下表87に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_66 of the present invention is supported by 336 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T46, T46984_PEA_1_T47, and T46984_PEA_1_T51. Table 87 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_67は323個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T46、T46984_PEA_1_T47、およびT46984_PEA_1_T51。下表88に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_67 of the present invention is supported by 323 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T46, T46984_PEA_1_T47, and T46984_PEA_1_T51. Table 88 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_70は337個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T46、T46984_PEA_1_T47、T46984_PEA_1_T51、T46984_PEA_1_T52、およびT46984_PEA_1_T54。下表89に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_70 of the present invention is supported by 337 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T46, T46984_PEA_1_T47, T46984_PEA_1_T51, T46984_PEA_1_T52, and T46984_PEA_1_T54. Table 89 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_71は次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T46、T46984_PEA_1_T47、T46984_PEA_1_T51、T46984_PEA_1_T52、およびT46984_PEA_1_T54。下表90に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster T46984_PEA_1_node_71 of the present invention can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T46, T46984_PEA_1_T47, T46984_PEA_1_T51, T46984_PEA_1_T52, and T46984_PEA_1_T54. Table 90 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_72は次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T43、T46984_PEA_1_T46、T46984_PEA_1_T47、T46984_PEA_1_T51、T46984_PEA_1_T52、およびT46984_PEA_1_T54。下表91に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster T46984_PEA_1_node_72 of the present invention can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T43, T46984_PEA_1_T46, T46984_PEA_1_T47, T46984_PEA_1_T51, T46984_PEA_1_T52 , And T46984_PEA_1_T54. Table 91 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_73は次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T43、T46984_PEA_1_T46、T46984_PEA_1_T47、T46984_PEA_1_T51、T46984_PEA_1_T52、およびT46984_PEA_1_T54。下表92に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster T46984_PEA_1_node_73 of the present invention can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T43, T46984_PEA_1_T46, T46984_PEA_1_T47, T46984_PEA_1_T51, T46984_PEA_1_T52 , And T46984_PEA_1_T54. Table 92 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_74は次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T14、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T43、T46984_PEA_1_T46、T46984_PEA_1_T47、T46984_PEA_1_T51、T46984_PEA_1_T52、およびT46984_PEA_1_T54。下表93に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster T46984_PEA_1_node_74 of the present invention can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T14, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T43, T46984_PEA_1_T46, T46984_PEA_1_T47, T46984_PEA_1_T51, T46984_PEA_1_T52 , And T46984_PEA_1_T54. Table 93 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_83は次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T43、T46984_PEA_1_T46、T46984_PEA_1_T47、T46984_PEA_1_T51、T46984_PEA_1_T52、およびT46984_PEA_1_T54。下表94に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster T46984_PEA_1_node_83 of the present invention can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T43, T46984_PEA_1_T46, T46984_PEA_1_T47, T46984_PEA_1_T51, T46984_PEA_1_T52, and T46984_PEA_1_T54. Table 94 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_84は次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T43、T46984_PEA_1_T46、T46984_PEA_1_T47、T46984_PEA_1_T51、T46984_PEA_1_T52、およびT46984_PEA_1_T54。下表95に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   Segment cluster T46984_PEA_1_node_84 of the present invention can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T43, T46984_PEA_1_T46, T46984_PEA_1_T47, T46984_PEA_1_T51, T46984_PEA_1_T52, and T46984_PEA_1_T54. Table 95 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT46984_PEA_1_node_85は295個のライブラリ−に裏付けられている。ライブラリ−の数は、先述のようにして決定した。このセグメントは、次の転写物に見出すことができる:T46984_PEA_1_T2、T46984_PEA_1_T3、T46984_PEA_1_T12、T46984_PEA_1_T13、T46984_PEA_1_T15、T46984_PEA_1_T19、T46984_PEA_1_T23、T46984_PEA_1_T27、T46984_PEA_1_T32、T46984_PEA_1_T34、T46984_PEA_1_T35、T46984_PEA_1_T43、T46984_PEA_1_T46、T46984_PEA_1_T47、T46984_PEA_1_T51、T46984_PEA_1_T52、およびT46984_PEA_1_T54。下表96に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T46984_PEA_1_node_85 of the present invention is supported by 295 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T46984_PEA_1_T2, T46984_PEA_1_T3, T46984_PEA_1_T12, T46984_PEA_1_T13, T46984_PEA_1_T15, T46984_PEA_1_T19, T46984_PEA_1_T23, T46984_PEA_1_T27, T46984_PEA_1_T32, T46984_PEA_1_T34, T46984_PEA_1_T35, T46984_PEA_1_T43, T46984_PEA_1_T46, T46984_PEA_1_T47, T46984_PEA_1_T51, T46984_PEA_1_T52, and T46984_PEA_1_T54. Table 96 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P2 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:4716.00
Escore:0
一致長:498 全長:498
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
. . . . .
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
. . . . .
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
. . . . .
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
. . . . .
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
. . . . .
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
. . . . .
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
. . . .
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV 498
||||||||||||||||||||||||||||||||||||||||||||||||
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV 498
Alignment of mutant protein with known protein Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P2 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 4716.00
Escore: 0
Match length: 498 Total length: 498
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
...
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
...
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
...
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
...
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
...
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
...
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
...
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV 498
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||-||||||-||||||-||||||-||||||-||||||||-
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV 498

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P3 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:4085.00
Escore:0
一致長:433 全長:433
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
. . . . .
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
. . . . .
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
. . . . .
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
. . . . .
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
. . . . .
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
. . .
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQ 433
|||||||||||||||||||||||||||||||||
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQ 433
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P3 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 4085.00
Escore: 0
Match length: 433 Total length: 433
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
...
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
...
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
...
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
...
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
...
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
..
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQ 433
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQ 433

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P10 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:4716.00
Escore:0
一致長:498 全長:498
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
. . . . .
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
. . . . .
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
. . . . .
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
. . . . .
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
. . . . .
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
. . . . .
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
. . . .
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV 498
||||||||||||||||||||||||||||||||||||||||||||||||
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV 498
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P10 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 4716.00
Escore: 0
Match length: 498 Total length: 498
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
...
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
...
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
...
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
...
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
...
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
...
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
...
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV 498
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||-||||||-||||||-||||||-||||||-||||||||-
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNV 498

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P11 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:5974.00
Escore:0
一致長:628 全長:628
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
. . . . .
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
. . . . .
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
. . . . .
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
. . . . .
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
. . . . .
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
. . . . .
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
. . . . .
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVAD 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVAD 500
. . . . .
501 VVIKFPEEEAPSTVLSQNLFTPKQEIQHLFREPEKRPPTVVSNTFTALIL 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 VVIKFPEEEAPSTVLSQNLFTPKQEIQHLFREPEKRPPTVVSNTFTALIL 550
. . . . .
551 SPLLLLFALWIRIGANVSNFTFAPSTIIFHLGHAAMLGLMYVYWTQLNMF 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 SPLLLLFALWIRIGANVSNFTFAPSTIIFHLGHAAMLGLMYVYWTQLNMF 600
. .
601 QTLKYLAILGSVTFLAGNRMLAQQAVKR 628
||||||||||||||||||||||||||||
601 QTLKYLAILGSVTFLAGNRMLAQQAVKR 628
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P11 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 5974.00
Escore: 0
Match length: 628 Total length: 628
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
...
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
...
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
...
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
...
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
...
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
...
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 KAKGTFIADSHQNFALFFQLVDVNTGAELTPHQTFVRLHNQKTGQEVVFV 450
...
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVAD 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 AEPDNKNVYKFELDTSERKIEFDSASGTYTLYLIIGDATLKNPILWNVAD 500
...
501 VVIKFPEEEAPSTVLSQNLFTPKQEIQHLFREPEKRPPTVVSNTFTALIL 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 VVIKFPEEEAPSTVLSQNLFTPKQEIQHLFREPEKRPPTVVSNTFTALIL 550
...
551 SPLLLLFALWIRIGANVSNFTFAPSTIIFHLGHAAMLGLMYVYWTQLNMF 600
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 SPLLLLFALWIRIGANVSNFTFAPSTIIFHLGHAAMLGLMYVYWTQLNMF 600
..
601 QTLKYLAILGSVTFLAGNRMLAQQAVKR 628
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
601 QTLKYLAILGSVTFLAGNRMLAQQAVKR 628

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P12 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:3179.00
Escore:0
一致長:338 全長:338
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
. . . . .
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
. . . . .
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
. . . . .
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
. . .
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMN 338
||||||||||||||||||||||||||||||||||||||
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMN 338
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P12 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 3117.00
Escore: 0
Match length: 338 Total length: 338
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
...
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
...
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
...
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
..
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMN 338
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||||-
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMN 338

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P21 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:5348.00
Escore:0
一致長:562 全長:562
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
2 KACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSED 51
||||||||||||||||||||||||||||||||||||||||||||||||||
70 KACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSED 119
. . . . .
52 SSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTAS 101
||||||||||||||||||||||||||||||||||||||||||||||||||
120 SSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTAS 169
. . . . .
102 HLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLM 151
||||||||||||||||||||||||||||||||||||||||||||||||||
170 HLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLM 219
. . . . .
152 DHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHV 201
||||||||||||||||||||||||||||||||||||||||||||||||||
220 DHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHV 269
. . . . .
202 PVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATV 251
||||||||||||||||||||||||||||||||||||||||||||||||||
270 PVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATV 319
. . . . .
252 LQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKI 301
||||||||||||||||||||||||||||||||||||||||||||||||||
320 LQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKI 369
. . . . .
302 STEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQ 351
||||||||||||||||||||||||||||||||||||||||||||||||||
370 STEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQ 419
. . . . .
352 LVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERK 401
||||||||||||||||||||||||||||||||||||||||||||||||||
420 LVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERK 469
. . . . .
402 IEFDSASGTYTLYLIIGDATLKNPILWNVADVVIKFPEEEAPSTVLSQNL 451
||||||||||||||||||||||||||||||||||||||||||||||||||
470 IEFDSASGTYTLYLIIGDATLKNPILWNVADVVIKFPEEEAPSTVLSQNL 519
. . . . .
452 FTPKQEIQHLFREPEKRPPTVVSNTFTALILSPLLLLFALWIRIGANVSN 501
||||||||||||||||||||||||||||||||||||||||||||||||||
520 FTPKQEIQHLFREPEKRPPTVVSNTFTALILSPLLLLFALWIRIGANVSN 569
. . . . .
502 FTFAPSTIIFHLGHAAMLGLMYVYWTQLNMFQTLKYLAILGSVTFLAGNR 551
||||||||||||||||||||||||||||||||||||||||||||||||||
570 FTFAPSTIIFHLGHAAMLGLMYVYWTQLNMFQTLKYLAILGSVTFLAGNR 619
.
552 MLAQQAVKRTAH 563
||||||||||||
620 MLAQQAVKRTAH 631
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P21 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 5348.00
Escore: 0
Match length: 562 Total length: 562
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
2 KACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSED 51
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
70 KACTYIRSNLDPSNVDSLFYAAQASQALSGCEISISNETKDLLLAAVSED 119
...
52 SSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTAS 101
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
120 SSVTQIYHAVAALSGFGLPLASQEALSALTARLSKEETVLATVQALQTAS 169
...
102 HLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLM 151
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
170 HLSQQADLRSIVEEIEDLVARLDELGGVYLQFEEGLETTALFVAATYKLM 219
...
152 DHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHV 201
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
220 DHVGTEPSIKEDQVIQLMNAIFSKKNFESLSEAFSVASAAAVLSHNRYHV 269
...
202 PVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATV 251
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
270 PVVVVPEGSASDTHEQAILRLQVTNVLSQPLTQATVKLEHAKSVASRATV 319
...
252 LQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKI 301
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
320 LQKTSFTPVGDVFELNFMNVKFSSGYYDFLVEVEGDNRYIANTVELRVKI 369
...
302 STEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQ 351
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
370 STEVGITNVDLSTVDKDQSIAPKTTRVTYPAKAKGTFIADSHQNFALFFQ 419
...
352 LVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERK 401
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
420 LVDVNTGAELTPHQTFVRLHNQKTGQEVVFVAEPDNKNVYKFELDTSERK 469
...
402 IEFDSASGTYTLYLIIGDATLKNPILWNVADVVIKFPEEEAPSTVLSQNL 451
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
470 IEFDSASGTYTLYLIIGDATLKNPILWNVADVVIKFPEEEAPSTVLSQNL 519
...
452 FTPKQEIQHLFREPEKRPPTVVSNTFTALILSPLLLLFALWIRIGANVSN 501
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
520 FTPKQEIQHLFREPEKRPPTVVSNTFTALILSPLLLLFALWIRIGANVSN 569
...
502 FTFAPSTIIFHLGHAAMLGLMYVYWTQLNMFQTLKYLAILGSVTFLAGNR 551
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
570 FTFAPSTIIFHLGHAAMLGLMYVYWTQLNMFQTLKYLAILGSVTFLAGNR 619
.
552 MLAQQAVKRTAH 563
||||||||||||||
620 MLAQQAVKRTAH 631

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P27 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:3910.00
Escore:0
一致長:415 全長:415
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
. . . . .
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
. . . . .
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
. . . . .
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
. . . . .
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
. . . . .
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
.
401 KAKGTFIADSHQNFA 415
|||||||||||||||
401 KAKGTFIADSHQNFA 415
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P27 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 3910.00
Escore: 0
Match length: 415 Length: 415
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
...
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
...
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
...
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
...
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
...
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 EVEGDNRYIANTVELRVKISTEVGITNVDLSTVDKDQSIAPKTTRVTYPA 400
.
401 KAKGTFIADSHQNFA 415
|||||||||||||||||| | |||||
401 KAKGTFIADSHQNFA 415

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P32 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:3434.00
Escore:0
一致長:373 全長:373
一致パ−セント類似性:98.93 一致パ−セント同一性:98. 39
全パ−セント類似性:98.93 全パ−セント同一性:98.39
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
. . . . .
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
. . . . .
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
. . . . .
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
. . . . .
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
. .
351 EVEGDNRYIANTVEGQVRWLTPV 373
|||||||||||||| :|: | |
351 EVEGDNRYIANTVELRVKISTEV 373
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P32 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 3434.00
Escore: 0
Match length: 373 Total length: 373
Match Percent Similarity: 98.93 Match Percent Identity: 98.39
Total percent similarity: 98.93 Total percent identity: 98.39
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
...
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
...
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
...
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
...
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 TQATVKLEHAKSVASRATVLQKTSFTPVGDVFELNFMNVKFSSGYYDFLV 350
..
351 EVEGDNRYIANTVEGQVRWLTPV 373
||||||||||||||:
351 EVEGDNRYIANTVELRVKISTEV 373

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P34 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:3087.00
Escore:0
一致長:329 全長:329
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
. . . . .
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
. . . . .
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
. . . . .
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
. .
301 TQATVKLEHAKSVASRATVLQKTSFTPVG 329
|||||||||||||||||||||||||||||
301 TQATVKLEHAKSVASRATVLQKTSFTPVG 329
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P34 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 307.00
Escore: 0
Match length: 329 Length: 329
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
...
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
...
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
...
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAILRLQVTNVLSQPL 300
..
301 TQATVKLEHAKSVASRATVLQKTSFTPVG 329
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
301 TQATVKLEHAKSVASRATVLQKTSFTPVG 329

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P35 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:2697.00
Escore:0
一致長:287 全長:287
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
. . . . .
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
. . . . .
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
. . .
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAI 287
|||||||||||||||||||||||||||||||||||||
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAI 287
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P35 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 26.97.00
Escore: 0
Match length: 287 Total length: 287
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
...
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 RLSKEETVLATVQALQTASHLSQQADLRSIVEEIEDLVARLDELGGVYLQ 200
...
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 FEEGLETTALFVAATYKLMDHVGTEPSIKEDQVIQLMNAIFSKKNFESLS 250
..
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAI 287
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in a state
251 EAFSVASAAAVLSHNRYHVPVVVVPEGSASDTHEQAI 287

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P38 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:1368.00
Escore:0
一致長:145 全長:145
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEAL 145
|||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEAL 145
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P38 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 1368.00
Escore: 0
Match length: 145 Total length: 145
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEAL 145
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||||-|||||||-||||-|||||||-||||||-||||||||-
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEAL 145

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P39 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:1500.00
Escore:0
一致長:160 全長:160
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
. . . . .
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
.
151 RLSKEETVLA 160
||||||||||
151 RLSKEETVLA 160
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P39 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 1500.00
Escore: 0
Match length: 160 Total length: 160
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
...
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 EISISNETKDLLLAAVSEDSSVTQIYHAVAALSGFGLPLASQEALSALTA 150
.
151 RLSKEETVLA 160
|||||||||||
151 RLSKEETVLA 160

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P45 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:970.00
Escore:0
一致長:103 全長:103
一致パ−セント類似性:99.03 一致パ−セント同一性:99.03
全パ−セント類似性:99.03 全パ−セント同一性:99.03
ギャップ: 0
アラインメント:
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
. . . . .
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100

101 ENS 103
| |
101 EIS 103
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P45 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 970.00
Escore: 0
Match length: 103 Total length: 103
Match Percent Similarity: 99.03 Match Percent Identity: 99.03
Total percent similarity: 99.03 Total percent identity: 99.03
Gap: 0
alignment:
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
...
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 AFYSIVGLSSLGAQVPDAKKACTYIRSNLDPSNVDSLFYAAQASQALSGC 100

101 ENS 103
| |
101 EIS 103

配列名:RIB2_HUMAN
配列文書:
アラインメント:T46984_PEA_1_P46 x RIB2_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:656.00
Escore:0
一致長:69 全長:69
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
.
51 AFYSIVGLSSLGAQVPDAK 69
|||||||||||||||||||
51 AFYSIVGLSSLGAQVPDAK 69
Sequence name: RIB2_HUMAN
Sequence document:
Alignment: T46984_PEA_1_P46 x RIB2_HUMAN ..
Alignment segment 1/1:
Quality-: 656.00
Escore: 0
Match length: 69 Total length: 69
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MAPPGSSTVFLLALTIIASTWALTPTHYLTKHDVERLKASLDRPFTNLES 50
.
51 AFYSIVGLSSLGAQVPDAK 69
|||||||||||||||||||||-
51 AFYSIVGLSSLGAQVPDAK 69

クラスタT11628の説明
クラスタT11628は、その名称を表1および2にそれぞれ示し、配列それ自体は本明細書の最後に示す、関心対象の6個の転写物と25個のセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Description of Cluster T11628 Cluster T11628 is characterized by 6 transcripts of interest and 25 segments, the names of which are shown in Tables 1 and 2, respectively, and the sequence itself is given at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は、既知タンパク質であるミオグロビン(SwissProtアクセッション識別子MYG_HUMAN)、配列番号:709であり、ここでは既知タンパク質と呼ぶ。   These sequences are myoglobin (SwissProt accession identifier MYG_HUMAN), which is a known protein, SEQ ID NO: 709, and are referred to herein as known proteins.

タンパク質のミオグロビンは次の機能を有することが知られているか、または有すると考えられている:筋肉内での酸素貯蔵供給および酸素の移動を促進する。タンパク質のミオグロビンの配列は、本明細書の最後に「ミオグロビンアミノ酸配列」として示されている。この配列について知られている多形を表4に示す。   The protein myoglobin is known or believed to have the following functions: promotes oxygen storage and movement of oxygen within the muscle. The sequence of the protein myoglobin is shown at the end of the specification as the “myoglobin amino acid sequence”. Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

上記のように、クラスタT116284は、上表1に記載の6個の転写物を特徴とする。これら転写物は、タンパク質、ミオグロビンの変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster T116284 is characterized by the six transcripts listed in Table 1 above. These transcripts code for proteins, proteins that are variants of myoglobin. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質T11628_PEA_1_P2は、本明細書最後に示すアミノ酸配列を有する;それは転写物T11628_PEA_1_T3にコ−ドされている。本明細書の最後に、既知タンパク質(ミオグロビン)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T11628_PEA_1_P2 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T11628_PEA_1_T3. At the end of the specification, an alignment to a known protein (myoglobin) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T11628_PEA_1_P2とQ8WVH6(配列番号:711)の比較報告:
1.T11628_PEA_1_P2をコ−ドする単離されたキメラポリペプチドは、T11628_PEA_1_P2のアミノ酸1〜55に相当する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、および最も好ましくは少なくとも95%相同である第一アミノ酸配列、およびQ8WVH6のアミノ酸1〜99に相当し、またT11628_PEA_1_P2のアミノ酸56〜154にも相当するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGに少なくとも90%相同である第二アミノ酸配列とを含み、このとき該第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report of T11628_PEA_1_P2 and Q8WVH6 (SEQ ID NO: 711):
1.An isolated chimeric polypeptide that encodes T11628_PEA_1_P2 is at least 70%, preferably at least 85%, preferably at least 80%, preferably at least 85% of a polypeptide having the sequence MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDE corresponding to amino acids 1 to 55 of T11628_PEA_1_P2 A first amino acid sequence that is more preferably at least 90% and most preferably at least 95% homologous, and MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQDMA corresponding to amino acids 1 to 99 of Q8WVH6 and also corresponding to amino acids 56 to 154 of T11628_PEA_1_P2 A second amino acid sequence that is homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

2.T11628_PEA_1_P2の頭部をコ−ドする単離されたポリペプチドは、配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、および最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the head of T11628_PEA_1_P2 has at least 70%, if required, at least about 80%, preferably at least about 85%, more preferably at least about 90% in the sequence MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDE And most preferably comprises polypeptides that are at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:細胞内。タンパク質の局在は、いずれの膜貫通領域推測プログラムが、このタンパク質について膜貫通領域を予測しなかったことから細胞内にあると考えられている。これに加え両方のシグナルペプチド予測プログラムは、このタンパク質が非分泌型タンパク質であると予測している。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to be localized with respect to cells as follows: intracellular. The localization of the protein is thought to be intracellular because none of the transmembrane domain prediction programs predicted a transmembrane domain for this protein. In addition, both signal peptide prediction programs predict that this protein is a non-secreted protein.

変異体タンパク質T11628_PEA_1_P2はまた、表5に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T11629_PEA_1_P3配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T11628_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 5 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T11629_PEA_1_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T11628_PEA_1_P2は次の転写物にコ−ドされている:T11628_PEA_1_T3、この転写物の配列は本明細書の最後に示してある。転写物T11628_PEA_1_T3のコ−ディング部分は太字で表している:このコ−ディング部分は、位置220から始まり、位置681に終止する。転写物はまた、表6に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT11628_PEA_1_P2配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T11628_PEA_1_P2 is encoded in the following transcript: T11628_PEA_1_T3, the sequence of this transcript is given at the end of the specification. The coding part of the transcript T11628_PEA_1_T3 is shown in bold: this coding part starts at position 220 and ends at position 681. The transcript also has the following SNPs listed in Table 6 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T11628_PEA_1_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T11628_PEA_1_P5は、本明細書最後に示すアミノ酸配列を有する;それは転写物T11628_PEA_1_T9にコ−ドされている。本明細書の最後に、既知タンパク質(ミオグロビン)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T11628_PEA_1_P5 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T11628_PEA_1_T9. At the end of the specification, an alignment to a known protein (myoglobin) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T11628_PEA_1_P5とMYG_HUMAN_V1(配列番号:710)の比較報告:
1.T11628_PEA_1_P5をコ−ドする単離されたキメラポリペプチドは、MYG_HUMANのアミノ酸56〜154に相当し、またT11628_PEA_1_P5のアミノ酸1〜99にも相当するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGに少なくとも90%相同第一アミノ酸配列を含む。
Comparison report of T11628_PEA_1_P5 and MYG_HUMAN_V1 (SEQ ID NO: 710):
1.An isolated chimeric polypeptide that encodes T11628_PEA_1_P5 corresponds to amino acids 56-154 of MYG_HUMAN, and also corresponds to amino acids 1-99 of T11628_PEA_1_P5, and contains at least the first amino acid sequence HK .

既知タンパク質配列(MYG_HUMAN)には、MYG_HUMAN_V1のアミノ酸配列として本明細書の最後に示し、そう命名されている配列とは異なる変更が一つまたは複数存在していることに注意しなければならない。これらの変更は起こることが既に知られており、下表に掲載する。   It should be noted that the known protein sequence (MYG_HUMAN) has one or more changes that differ from the sequence shown at the end of this specification as the amino acid sequence of MYG_HUMAN_V1. These changes are already known to occur and are listed in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:細胞内。タンパク質の局在は、いずれの膜貫通領域推測プログラムが、このタンパク質について膜貫通領域を予測しなかったことから細胞内にあると考えられている。これに加え両方のシグナルペプチド予測プログラムは、このタンパク質が非分泌型タンパク質であると予測している。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to be localized with respect to cells as follows: intracellular. The localization of the protein is thought to be intracellular because none of the transmembrane domain prediction programs predicted a transmembrane domain for this protein. In addition, both signal peptide prediction programs predict that this protein is a non-secreted protein.

変異体タンパク質T11628_PEA_1_P5はまた、表8に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T11629_PEA_1_P5配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T11628_PEA_1_P5 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 8 (shown according to their amino acid sequence position, followed by the modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T11629_PEA_1_P5 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T11628_PEA_1_P5は次の転写物にコ−ドされている:T11628_PEA_1_T9、この転写物の配列は本明細書の最後に示してある。転写物T11628_PEA_1_T9のコ−ディング部分は太字で表している:このコ−ディング部分は、位置211から始まり、位置507に終止する。転写物はまた、表9に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT11628_PEA_1_P5配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T11628_PEA_1_P5 is encoded in the following transcript: T11628_PEA_1_T9, the sequence of this transcript is given at the end of the specification. The coding portion of transcript T11628_PEA_1_T9 is shown in bold: this coding portion starts at position 211 and ends at position 507. The transcript also has the following SNPs listed in Table 9 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T11628_PEA_1_P5 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T11628_PEA_1_P7は、本明細書最後に示すアミノ酸配列を有する;それは転写物T11628_PEA_1_T11にコ−ドされている。本明細書の最後に、既知タンパク質(ミオグロビン)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T11628_PEA_1_P7 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T11628_PEA_1_T11. At the end of the specification, an alignment to a known protein (myoglobin) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T11628_PEA_1_P7とMYG_HUMAN_V1(配列番号:710)の比較報告:
1.T11628_PEA_1_P7をコ−ドする単離されたキメラポリペプチドは、MYG_HUMANのアミノ酸1〜134に相当し、またT11628_PEA_1_P7のアミノ酸1〜134にも相当するMGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKに少なくとも90%相同第一アミノ酸配列、およびT11628_PEA_1_P7のアミノ酸135〜135に相当しする配列Gを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、および最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき該第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report of T11628_PEA_1_P7 and MYG_HUMAN_V1 (SEQ ID NO: 710):
1.An isolated chimeric polypeptide that codes for T11628_PEA_1_P7 corresponds to amino acids 1-134 of MYG_HUMAN, and also corresponds to amino acids 1-134 of T11628_PEA_1_P7. At least 70%, where necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence G corresponding to amino acids 135-135 of T11628_PEA_1_P7 Wherein the first amino acid sequence and the second amino acid sequence are successively connected in order.

既知タンパク質配列(MYG_HUMAN)には、MYG_HUMAN_V1のアミノ酸配列として本明細書の最後に示し、そう命名されている配列とは異なる変更が一つまたは複数存在していることに注意しなければならない。これらの変更は起こることが既に知られており、下表に掲載する。   It should be noted that the known protein sequence (MYG_HUMAN) has one or more changes that differ from the sequence shown at the end of this specification as the amino acid sequence of MYG_HUMAN_V1. These changes are already known to occur and are listed in the table below.

Figure 2007520217
Figure 2007520217

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:細胞内。タンパク質の局在は、いずれの膜貫通領域推測プログラムが、このタンパク質について膜貫通領域を予測しなかったことから細胞内にあると考えられている。これに加え両方のシグナルペプチド予測プログラムは、このタンパク質が非分泌型タンパク質であると予測している。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to be localized with respect to cells as follows: intracellular. The localization of the protein is thought to be intracellular because none of the transmembrane domain prediction programs predicted a transmembrane domain for this protein. In addition, both signal peptide prediction programs predict that this protein is a non-secreted protein.

変異体タンパク質T11628_PEA_1_P7はまた、表11に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T11629_PEA_1_P7配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein T11628_PEA_1_P7 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 11 (shown according to their amino acid sequence position, followed by modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP in the mutant protein T11629_PEA_1_P7 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T11628_PEA_1_P7は次の転写物にコ−ドされている:T11628_PEA_1_T11、この転写物の配列は本明細書の最後に示してある。転写物T11628_PEA_1_T11のコ−ディング部分は太字で表している:このコ−ディング部分は、位置319から始まり、位置723に終止する。転写物はまた、表12に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT11628_PEA_1_P7配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T11628_PEA_1_P7 is encoded in the following transcript: T11628_PEA_1_T11, the sequence of this transcript is given at the end of the specification. The coding part of the transcript T11628_PEA_1_T11 is shown in bold: this coding part starts at position 319 and ends at position 723. The transcript also has the following SNPs listed in Table 12 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is known SNP) The presence of a known SNP in the mutant protein T11628_PEA_1_P7 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質T11628_PEA_1_P10は、本明細書最後に示すアミノ酸配列を有する;それは転写物T11628_PEA_1_T4にコ−ドされている。本明細書の最後に、既知タンパク質(ミオグロビン)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein T11628_PEA_1_P10 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript T11628_PEA_1_T4. At the end of the specification, an alignment to a known protein (myoglobin) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

T11628_PEA_1_P10とQ8WVH6(配列番号:711)の比較報告:
1.T11628_PEA_1_P10をコ−ドする単離されたキメラポリペプチドは、T11628_PEA_1_P10のアミノ酸1〜55に相当する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、および最も好ましくは少なくとも95%相同である第一アミノ酸配列、およびQ8WVH6のアミノ酸1〜99に相当し、またT11628_PEA_1_P10のアミノ酸56〜154にも相当するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGに少なくとも90%相同である第二アミノ酸配列とを含み、このとき該第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report of T11628_PEA_1_P10 and Q8WVH6 (SEQ ID NO: 711):
1.An isolated chimeric polypeptide that codes for T11628_PEA_1_P10 is at least 70%, preferably at least 85%, preferably at least 80%, preferably at least 85% for a polypeptide having the sequence MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDE corresponding to amino acids 1 to 55 of T11628_PEA_1_P10 A first amino acid sequence that is at least 90%, and most preferably at least 95% homologous, and MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQDMA corresponding to amino acids 1 to 99 of Q8WVH6 and also corresponding to amino acids 56 to 154 of T11628_PEA_1_P10 A second amino acid sequence that is homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

2.T11628_PEA_1_P10の頭部をコ−ドする単離されたポリペプチドは、配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、および最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the head of T11628_PEA_1_P10 has a sequence of MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDE at least 70%, if required at least about 80%, preferably at least about 85%, more preferably at least about 90%, And most preferably comprises polypeptides that are at least about 95% homologous.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:細胞内。タンパク質の局在は、いずれの膜貫通領域推測プログラムが、このタンパク質について膜貫通領域を予測しなかったことから細胞内にあると考えられている。これに加え両方のシグナルペプチド予測プログラムは、このタンパク質が非分泌型タンパク質であると予測している。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to be localized with respect to cells as follows: intracellular. The localization of the protein is thought to be intracellular because none of the transmembrane domain prediction programs predicted a transmembrane domain for this protein. In addition, both signal peptide prediction programs predict that this protein is a non-secreted protein.

変異体タンパク質T11628_PEA_1_P10はまた、表13に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質T11629_PEA_1_P107配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein T11628_PEA_1_P10 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 13 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein T11629_PEA_1_P107 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質T11628_PEA_1_P10は次の転写物にコ−ドされている:T11628_PEA_1_T4、この転写物の配列は本明細書の最後に示してある。転写物T11628_PEA_1_T4のコ−ディング部分は太字で表している:このコ−ディング部分は、位置205から始まり、位置666に終止する。転写物はまた、表14に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクT11628_PEA_1_P10配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein T11628_PEA_1_P10 is encoded in the following transcript: T11628_PEA_1_T4, the sequence of this transcript is given at the end of the specification. The coding part of the transcript T11628_PEA_1_T4 is shown in bold: this coding part starts at position 205 and ends at position 666. The transcript also has the following SNPs listed in Table 14 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein T11628_PEA_1_P10 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記したように、クラスタT11628は、上表2に掲載し、またその配列を本明細書の最後に示す25個のセグメントを特徴とする。これらセグメントは、特に関心の対象であることからここに別々に記載する核酸配列の部分である。次に本発明の各セグメントについて説明する。   As noted above, cluster T11628 features 25 segments listed in Table 2 above and whose sequence is shown at the end of this specification. These segments are part of the nucleic acid sequence described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタT11628_PEA_1_node_7は9個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3。下表15に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_7 of the present invention is supported by nine libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T3. Table 15 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_11は1つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T5。下表16に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_11 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T5. Table 16 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_16は38個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T11。下表17に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_16 of the present invention is supported by 38 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T11. Table 17 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_22は1つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T9。下表18に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_22 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T9. Table 18 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_25は129個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表19に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_25 of the present invention is supported by 129 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 19 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

このセグメントについては、次のようなマイクロアレイ(チップ)デ−タも在る。クラスタそのものについて上記したように、様々なオリゴヌクレオチドについて、各種疾患状態、特に癌で発現に差があるが試験した。次のオリゴヌクレオチドが、表20に示すようにこのセグメント(乳癌と関係する)をヒットすることが見出された。   The following microarray (chip) data is also present for this segment. As described above for the cluster itself, various oligonucleotides were tested with varying expression in various disease states, particularly cancer. The following oligonucleotide was found to hit this segment (associated with breast cancer) as shown in Table 20.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_31は137個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表21に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_31 of the present invention is supported by 137 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 21 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_37は99個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表22に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_37 of the present invention is supported by 99 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 22 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の好選的態様によれば、上記クラスタに関係する短いセグメントも提供される。これらセグメントは約120bpまでの長さであることから、分けて説明する。   According to a preferred aspect of the invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they will be described separately.

本発明のセグメントクラスタT11628_PEA_1_node_0は1つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T4。下表23に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_0 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T4. Table 23 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_4は2つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T4。下表24に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_4 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T4. Table 24 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_9は16個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T5およびT11628_PEA_1_T7。下表25に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_9 of the present invention is supported by 16 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T5 and T11628_PEA_1_T7. Table 25 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_13は次の転写物に見出すことができる:T11628_PEA_1_T7。下表26に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_13 of the present invention can be found in the following transcript: T11628_PEA_1_T7. Table 26 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_14は1つのライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメント次の転写物に見出すことができる:T11628_PEA_1_T7。下表27に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_14 of the present invention is supported by one library. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T7. Table 27 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_17は55個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメント次の転写物に見出すことができる:T11628_PEA_1_T11。下表28に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_17 of the present invention is supported by 55 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: T11628_PEA_1_T11. Table 28 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_18は98個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T11。下表29に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_18 of the present invention is supported by 98 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, and T11628_PEA_1_T11. Table 29 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_19は次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T11。下表30に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_19 of the present invention can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, and T11628_PEA_1_T11. Table 30 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_24は112個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表31に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_24 of the present invention is supported by 112 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 31 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_27は119個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表32に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_27 of the present invention is supported by 119 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 32 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

このセグメントについては、次のようなマイクロアレイ(チップ)デ−タも在る。クラスタそのものについて上記したように、様々なオリゴヌクレオチドについて、各種疾患状態、特に癌で発現に差があるが試験した。次のオリゴヌクレオチドが、表33に示すようにこのセグメント(乳癌と関係する)をヒットすることが見出された。   The following microarray (chip) data is also present for this segment. As described above for the cluster itself, various oligonucleotides were tested with varying expression in various disease states, particularly cancer. The following oligonucleotide was found to hit this segment (associated with breast cancer) as shown in Table 33.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_28は115個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T9。下表34に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_28 of the present invention is supported by 115 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, and T11628_PEA_1_T9. Table 34 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_29は113個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T9。下表35に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_29 of the present invention is supported by 113 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, and T11628_PEA_1_T9. Table 35 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_30は次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表36に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_30 of the present invention can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 36 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_32は次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表37に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_32 of the present invention can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 37 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_33は次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表38に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_33 of the present invention can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 38 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_34は122個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表39に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_34 of the present invention is supported by 122 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 39 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_35は126個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表40に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_35 of the present invention is supported by 126 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 40 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタT11628_PEA_1_node_36は122個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。下表41に、各転写物におけるこのセグメントの開始位置および終止位置を示す。   The segment cluster T11628_PEA_1_node_36 of the present invention is supported by 122 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: T11628_PEA_1_T3, T11628_PEA_1_T4, T11628_PEA_1_T5, T11628_PEA_1_T7, T11628_PEA_1_T9, and T11628_PEA_1_T11. Table 41 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:Q8WVH6
配列文書:
アラインメント:T46984_PEA_1_P2 x Q8WVH6 ..
アラインメントセグメント 1/1:
クオリティ−:962.00
Escore:0
一致長:99 全長:99
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50
. . . .
106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154
|||||||||||||||||||||||||||||||||||||||||||||||||
51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99
Alignment of mutant protein with known protein Sequence name: Q8WVH6
Sequence document:
Alignment: T46984_PEA_1_P2 x Q8WVH6 ..
Alignment segment 1/1:
Quality: 962.00
Escore: 0
Match length: 99 Total length: 99
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50
...
106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||-|||||-||||-|||||-|||||-||||||||||| be be not
51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99

配列名:MYG_HUMAN_V1
配列文書:
アラインメント:T46984_PEA_1_P5 x MYG_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:962.00
Escore:0
一致長:99 全長:99
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105
. . . .
51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99
|||||||||||||||||||||||||||||||||||||||||||||||||
106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154
Array name: MYG_HUMAN_V1
Sequence document:
Alignment: T46984_PEA_1_P5 x MYG_HUMAN_V1 ..
Alignment segment 1/1:
Quality: 962.00
Escore: 0
Match length: 99 Total length: 99
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105
...
51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||-|||||-||||-|||||-|||||-||||||||||| be be not
106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154

配列名:MYG_HUMAN_V1
配列文書:
アラインメント:T46984_PEA_1_P7 x MYG_HUMAN_V1 ..
アラインメントセグメント 1/1:
クオリティ−:1315.00
Escore:0
一致長:134 全長:134
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHL 50
. . . . .
51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100
. . .
101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134
||||||||||||||||||||||||||||||||||
101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134
Array name: MYG_HUMAN_V1
Sequence document:
Alignment: T46984_PEA_1_P7 x MYG_HUMAN_V1 ..
Alignment segment 1/1:
Quality: 1315.00
Escore: 0
Match length: 134 Total length: 134
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHL 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHL 50
...
51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100
..
101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-be in
101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134

配列名:Q8WVH6
配列文書:
アラインメント:T46984_PEA_1_P10 x Q8WVH6 ..
アラインメントセグメント 1/1:
クオリティ−:962.00
Escore:0
一致長:99 全長:99
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50
. . . .
106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154
|||||||||||||||||||||||||||||||||||||||||||||||||
51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99
Sequence name: Q8WVH6
Sequence document:
Alignment: T46984_PEA_1_P10 x Q8WVH6 ..
Alignment segment 1/1:
Quality: 962.00
Escore: 0
Match length: 99 Total length: 99
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50
...
106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||-|||||-||||-|||||-|||||-||||||||||| be be not
51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99

クラスタM78076の説明
クラスタM78076は、その名称を表1および2にそれぞれ示し、配列それ自体は本明細書の最後に示す、関心対象の9個の転写物と35個のセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Description of Cluster M78076 Cluster M78076 is characterized by 9 transcripts of interest and 35 segments, the names of which are shown in Tables 1 and 2, respectively, and the sequence itself is shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は、既知タンパク質であるアミロイド様タンパク質1前駆体(SwissProtアクセッション識別子APP1_HUMAN;同義語としてAPLP;APLP−1としても知られる)、配列番号:760であり、ここでは既知タンパク質と呼ぶ。   These sequences are the known protein amyloid-like protein 1 precursor (SwissProt accession identifier APP1_HUMAN; also known as APLP; also known as APLP-1), SEQ ID NO: 760, referred to herein as the known protein.

タンパク質のアミロイド様タンパク質1前駆体は次の機能を有することが知られているか、または有すると考えられている:シナプス後機能において役割を果たしているだろう。C−タ−ミナルガンマセクレタ−ゼ処理された断片のALiD1は、APBB1(Fe65)結合を通じて転写活性化を作動する。C−末端結合を通してJIPシグナル誘導に連結する。細胞Gタンパク質シグナル伝達経路と相互作用するだろう。ヘパリンおよびコラ−ゲンといった細胞外マトリックス成分との結合を通して、神経突起の成長を制御できる。ガンマCTFペプチド、C30は神経アポト−シスの強力なエンハンサ−である(類似性より)。タンパク質のアミロイド様タンパク質1前駆体の配列は、本明細書の最後に「アミロイド様タンパク質1前駆体アミノ酸配列」として示されている。この配列について知られている多形を表4に示す。   The protein amyloid-like protein 1 precursor is known or thought to have the following function: it may play a role in post-synaptic function. ALiD1 of the C-terminal gamma secretase-treated fragment activates transcriptional activation through APBB1 (Fe65) binding. Link to JIP signal induction through C-terminal linkage. Will interact with the cellular G protein signaling pathway. Neurite growth can be controlled through binding to extracellular matrix components such as heparin and collagen. The gamma CTF peptide, C30, is a potent enhancer of neural apoptosis (by analogy). The sequence of the protein amyloid-like protein 1 precursor is shown at the end of the specification as the “amyloid-like protein 1 precursor amino acid sequence”. Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質、アミロイド様タンパク質1前駆体の局在は、タイプI膜タンパク質であると考えられている。ゴルジ体の中でC末端が処理される。   The localization of the protein, amyloid-like protein 1 precursor, is thought to be a type I membrane protein. The C-terminus is processed in the Golgi apparatus.

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;エンドサイト−シス;アポト−シス;細胞接着;神経形成;細胞死、これらは生物学的プロセスに関係する注釈であり;タンパク質結合;ヘパリン結合、これらは分子機能に関係する注釈付けであり;そして基底膜;コ−テッドピット;内在性膜タンパク質、これは細胞成分に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; endocytosis; apoptosis; cell adhesion; neurogenesis; cell death, these are annotations related to biological processes; protein binding; heparin binding, these are Annotations related to molecular function; and basement membranes; coated pits; integral membrane proteins, which are annotations related to cellular components.

GO割り当ては、<http://www/expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http: //www/expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

上記のように、クラスタM78076は、上表1に記載の9個の転写物を特徴とする。これら転写物は、タンパク質、アミロイド様タンパク質1前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster M78076 is characterized by the nine transcripts listed in Table 1 above. These transcripts code for a protein, a protein that is a variant of the amyloid-like protein 1 precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質M78076_PEA_1_P3は、本明細書最後に示すアミノ酸配列を有する;それは転写物M78076_PEA_1_T2にコ−ドされている。本明細書の最後に、既知タンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein M78076_PEA_1_P3 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript M78076_PEA_1_T2. At the end of the description, an alignment to a known protein (amyloid-like protein 1 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

M78076_PEA_1_P3とAPP1_HUMANとの比較報告:
1.M78076_PEA_1_P3をコ−ドする単離されたキメラポリペプチドは、APP1_HUMANのアミノ酸1〜517に相当し、またM78076_PEA_1_P3のアミノ酸1〜517にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P3のアミノ酸518〜519に相当する配列GEを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、および最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between M78076_PEA_1_P3 and APP1_HUMAN:
The 1.M78076_PEA_1_P3 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 517 of APP1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKD which also corresponds to amino acids 1 to 517 of M78076_PEA_1_P3 And a polypeptide having the sequence GE corresponding to amino acids 518 to 519 of M78076_PEA_1_P3, at least 70%, if necessary at least 80%, preferably at least 85%, more preferably less Kutomo 90%, and most preferably comprises a second amino acid sequence at least 95% homologous, the this case the first amino acid sequence and a second amino acid sequence are connected in sequence continuously.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測していること、およびいずれの膜貫通領域推測プログラムも、このタンパク質について膜貫通領域を有すると予測しなかったことから分泌されていると考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicates that both signal peptide prediction programs predict that this protein has a signal peptide, and that neither transmembrane region estimation program has a transmembrane region for this protein It is thought that it is secreted from that.

変異体タンパク質M78076_PEA_1_P3はまた、表5に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質M78076_PEA_1_P3配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein M78076_PEA_1_P3 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 5 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein M78076_PEA_1_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P3のグリコシレ−ション部位を、既知タンパク質のアミロイド様タンパク質1前駆体と比較する形で表6に示す(第一縦列に、アミノ酸配列上でのそれらの位置を示す;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示している;そして最後の縦列はその位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of mutant protein M78076_PEA_1_P3 are shown in Table 6 in comparison with the known protein amyloid-like protein 1 precursor (first column shows their position on the amino acid sequence; second column shows It shows whether the glycosylation site is present in the mutant protein; and the last column shows whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P3は次の転写物にコ−ドされている:M78076_PEA_1_T2、この転写物の配列は本明細書の最後に示してある。転写物M78076_PEA_1_T2のコ−ディング部分は太字で表している:このコ−ディング部分は、位置142から始まり、位置1698に終止する。転写物はまた、表7に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P3配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein M78076_PEA_1_P3 is encoded in the following transcript: M78076_PEA_1_T2, the sequence of this transcript is given at the end of the specification. The coding part of the transcript M78076_PEA_1_T2 is shown in bold: this coding part starts at position 142 and ends at position 1698. The transcript also has the following SNPs listed in Table 7 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein M78076_PEA_1_P3 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質M78076_PEA_1_P4は、本明細書最後に示すアミノ酸配列を有する;それは転写物M78076_PEA_1_T3にコ−ドされている。本明細書の最後に、既知タンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein M78076_PEA_1_P4 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript M78076_PEA_1_T3. At the end of the description, an alignment to a known protein (amyloid-like protein 1 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

M78076_PEA_1_P4とAPP1_HUMANの比較報告:
1.M78076_PEA_1_P4をコ−ドする単離されたキメラポリペプチドは、APP1_HUMANのアミノ酸1〜526に相当し、またM78076_PEA_1_P4のアミノ酸1〜526にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGに少なくとも90%相同第一アミノ酸配列、およびM78076_PEA_1_P4のアミノ酸527〜541に相当する配列ECLTVNPSLQIPLNPを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、および最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between M78076_PEA_1_P4 and APP1_HUMAN:
1. An isolated chimeric polypeptide that codes for M78076_PEA_1_P4 corresponds to amino acids 1 to 526 of APP1_HUMAN and also corresponds to amino acids 1 to 526 of M78076_PEA_1_P4, and M78076_PEA_1_P4 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence ECLTVNPSLQIPLNP corresponding to amino acids 527 to 541 of A first amino acid sequence and a second amino acid sequence are sequentially connected in sequence.

2.M78076_PEA_1_P4の尾部をコ−ドする単離されたポリペプチドは、M78076_PEA_1_P4内の配列ECLTVNPSLQIPLNPに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、および最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of M78076_PEA_1_P4 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence ECLTVNPSLQIPLNP in M78076_PEA_1_P4. %, And most preferably at least about 95% homologous polypeptides.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測したこと、そしていずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから分泌されていると考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization is secreted because both signal peptide prediction programs predicted that the protein had a signal peptide, and no transmembrane region prediction program predicted that the protein had a transmembrane region It is believed that

変異体タンパク質M78076_PEA_1_P4はまた、表8に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらは、アミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P4配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein M78076_PEA_1_P4 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 8 (they are shown according to their position on the amino acid sequence, followed by the altered amino acids; The last column indicates whether the SNP is known; the presence of a known SNP in the mutant protein M78076_PEA_1_P4 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P4のグリコシレ−ション部位を、既知タンパク質のアミロイド様タンパク質1前駆体と比較する形で表9に示す(第一縦列に、アミノ酸配列上でのそれらの位置を示す;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示している;そして最後の縦列はその位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of the mutant protein M78076_PEA_1_P4 are shown in Table 9 in comparison with the amyloid-like protein 1 precursor of the known protein (first column shows their position on the amino acid sequence; second column shows It shows whether the glycosylation site is present in the mutant protein; and the last column shows whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P4は次の転写物にコ−ドされている:M78076_PEA_1_T3、この転写物の配列は本明細書の最後に示してある。転写物M78076_PEA_1_T3のコ−ディング部分は太字で表している:このコ−ディング部分は、位置142から始まり、位置1764に終止する。転写物はまた、表10に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P4配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein M78076_PEA_1_P4 is encoded in the following transcript: M78076_PEA_1_T3, the sequence of this transcript is given at the end of the specification. The coding part of the transcript M78076_PEA_1_T3 is shown in bold: this coding part starts at position 142 and ends at position 1764. The transcript also has the following SNPs listed in Table 10 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein M78076_PEA_1_P4 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質M78076_PEA_1_P12は、本明細書最後に示すアミノ酸配列を有する;それは転写物M78076_PEA_1_T13にコ−ドされている。本明細書の最後に、既知タンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein M78076_PEA_1_P12 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript M78076_PEA_1_T13. At the end of the description, an alignment to a known protein (amyloid-like protein 1 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

M78076_PEA_1_P12とAPP1_HUMANの比較報告:
1.M78076_PEA_1_P12をコ−ドする単離されたキメラポリペプチドは、APP1_HUMANのアミノ酸1〜526に相当し、またM78076_PEA_1_P4のアミノ酸1〜526にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGに少なくとも90%相同第一アミノ酸配列、およびM78076_PEA_1_P12のアミノ酸527〜544に相当する配列ECVCSKGFPFPLIGDSEGを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、および最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between M78076_PEA_1_P12 and APP1_HUMAN:
1. An isolated chimeric polypeptide that codes for M78076_PEA_1_P12 corresponds to amino acids 1 to 526 of APP1_HUMAN and also corresponds to amino acids 1 to 526 of M78076_PEA_1_P4, and M78076_PEA_1_P12 At least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence ECVCSKGFPFPLIGDSEG corresponding to amino acids 527 to 544 of A first amino acid sequence and a second amino acid sequence are sequentially connected in sequence.

2.M78076_PEA_1_P12の尾部をコ−ドする単離されたポリペプチドは、M78076_PEA_1_P12内の配列ECVCSKGFPFPLIGDSEGに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、および最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of M78076_PEA_1_P12 is at least 70%, if necessary at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence ECVCSKGFPFPLIGDSEG in M78076_PEA_1_P12. %, And most preferably at least about 95% homologous polypeptides.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測したこと、そしていずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから分泌されていると考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization is secreted because both signal peptide prediction programs predicted that the protein had a signal peptide, and no transmembrane region prediction program predicted that the protein had a transmembrane region It is believed that

変異体タンパク質M78076_PEA_1_P12はまた、表11に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらは、アミノ酸配列上の位置に従って、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P12配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   Mutant protein M78076_PEA_1_P12 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 11 (they are then listed modified amino acids according to their position on the amino acid sequence; The column indicates whether the SNP is known; the presence of a known SNP in the mutant protein M78076_PEA_1_P12 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P12のグリコシレ−ション部位を、既知タンパク質のアミロイド様タンパク質1前駆体と比較する形で表12に示す(第一縦列に、アミノ酸配列上でのそれらの位置を示す;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示している;そして最後の縦列はその位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of mutant protein M78076_PEA_1_P12 are shown in Table 12 in comparison to the known protein amyloid-like protein 1 precursor (first column shows their position on the amino acid sequence; second column shows It shows whether the glycosylation site is present in the mutant protein; and the last column shows whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P12は次の転写物にコ−ドされている:M78076_PEA_1_T13、この転写物の配列は本明細書の最後に示してある。転写物M78076_PEA_1_T13のコ−ディング部分は太字で表している:このコ−ディング部分は、位置142から始まり、位置1773に終止する。転写物はまた、表13に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P12配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein M78076_PEA_1_P12 is encoded in the following transcript: M78076_PEA_1_T13, the sequence of this transcript is given at the end of the specification. The coding part of the transcript M78076_PEA_1_T13 is shown in bold: this coding part starts at position 142 and ends at position 1773. The transcript also has the following SNPs listed in Table 13 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein M78076_PEA_1_P12 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質M78076_PEA_1_P14は、本明細書最後に示すアミノ酸配列を有する;それは転写物M78076_PEA_1_T15にコ−ドされている。本明細書の最後に、既知タンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein M78076_PEA_1_P14 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript M78076_PEA_1_T15. At the end of the description, an alignment to a known protein (amyloid-like protein 1 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

M78076_PEA_1_P14とAPP1_HUMANの比較報告:
1.M78076_PEA_1_P14をコ−ドする単離されたキメラポリペプチドは、APP1_HUMANのアミノ酸1〜570に相当し、またM78076_PEA_1_P14のアミノ酸1〜570にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELに少なくとも90%相同第一アミノ酸配列、およびM78076_PEA_1_P14のアミノ酸571〜619に相当する配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、および最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between M78076_PEA_1_P14 and APP1_HUMAN:
1. An isolated chimeric polypeptide that codes for M78076_PEA_1_P14 corresponds to amino acids 1 to 570 of APP1_HUMAN, and also corresponds to amino acids 1 to 570 of M78076_PEA_1_P14, and M78076_PEA_1_P14 Is at least 70%, preferably at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVP corresponding to amino acids 571-619 of A first amino acid sequence and a second amino acid sequence are sequentially connected in sequence.

2.M78076_PEA_1_P14の尾部をコ−ドする単離されたポリペプチドは、M78076_PEA_1_P14内の配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、および最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of M78076_PEA_1_P14 is at least 70%, if necessary requires at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVP in M78076_PEA_1_P14. %, And most preferably at least about 95% homologous polypeptides.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測したこと、そしていずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから分泌されていると考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization is secreted because both signal peptide prediction programs predicted that the protein had a signal peptide, and no transmembrane region prediction program predicted that the protein had a transmembrane region It is believed that

変異体タンパク質M78076_PEA_1_P14はまた、表14に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらは、アミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P14配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein M78076_PEA_1_P14 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 14 (they are shown according to their position on the amino acid sequence, followed by the altered amino acids; The last column indicates whether the SNP is known; the presence of a known SNP in the mutant protein M78076_PEA_1_P14 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P14のグリコシレ−ション部位を、既知タンパク質のアミロイド様タンパク質1前駆体と比較する形で表15に示す(第一縦列に、アミノ酸配列上でのそれらの位置を示す;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示している;そして最後の縦列はその位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of the mutant protein M78076_PEA_1_P14 are shown in Table 15 in comparison with the known protein amyloid-like protein 1 precursor (first column shows their position on the amino acid sequence; second column shows It shows whether the glycosylation site is present in the mutant protein; and the last column shows whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P14は次の転写物にコ−ドされている:M78076_PEA_1_T15、この転写物の配列は本明細書の最後に示してある。転写物M78076_PEA_1_T15のコ−ディング部分は太字で表している:このコ−ディング部分は、位置142から始まり、位置1998に終止する。転写物はまた、表16に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P14配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein M78076_PEA_1_P14 is encoded in the following transcript: M78076_PEA_1_T15, the sequence of this transcript is given at the end of the specification. The coding part of the transcript M78076_PEA_1_T15 is shown in bold: this coding part starts at position 142 and ends at position 1998. The transcript also has the following SNPs listed in Table 16 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known) The presence of a known SNP in the mutant protein M78076_PEA_1_P14 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質M78076_PEA_1_P21は、本明細書最後に示すアミノ酸配列を有する;それは転写物M78076_PEA_1_T23にコ−ドされている。本明細書の最後に、既知タンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein M78076_PEA_1_P21 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript M78076_PEA_1_T23. At the end of the description, an alignment to a known protein (amyloid-like protein 1 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

M78076_PEA_1_P21とAPP1_HUMANの比較報告:
1.M78076_PEA_1_P21をコ−ドする単離されたキメラポリペプチドは、APP1_HUMANのアミノ酸1〜352に相当し、またM78076_PEA_1_P21のアミノ酸1〜352にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEに少なくとも90%相同である第一アミノ酸配列、およびAPP1_HUMANのアミノ酸406〜597に相当する、そしてM78076_PEA_1_P21のアミノ酸353〜597にも相当する配列AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSMLLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERPに対し少なくとも90%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between M78076_PEA_1_P21 and APP1_HUMAN:
The 1.M78076_PEA_1_P21 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 352 of APP1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNE which also corresponds to amino acids 1 to 352 of M78076_PEA_1_P21 , and corresponding to APP1_HUMAN amino acids 406-597, and small with respect to the sequence corresponding to AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSMLLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP to amino acids 353-597 of M78076_PEA_1_P21 Comprises a second amino acid sequence is Kutomo 90% homology, said this time the first amino acid sequence and a second amino acid sequence are connected in sequence continuously.

2.M78076_PEA_1_P21の端部をコ−ドする単離されたポリペプチドは、長さ「n」のポリペプチドを含み、このときnは少なくとも約10アミノ酸長、要する場合には少なくとも約20アミノ酸長、このましくは少なくとも約30アミノ酸長、より好ましくは約40アミノ酸長、そして最も好ましくは約50アミノ酸長であり、少なくとも2つのアミノ酸がEAを含み、対の構造を有する:配列はアミノ酸番号352−x〜352のいずれかより開始する;そしてアミノ酸番号353+((n−2)−x)に終止し、このときxは0〜n−2で変化する。   2. An isolated polypeptide that codes for the end of M78076_PEA_1_P21 comprises a polypeptide of length `` n '', where n is at least about 10 amino acids long, if necessary, at least about 20 amino acids long, Preferably it is at least about 30 amino acids long, more preferably about 40 amino acids long, and most preferably about 50 amino acids long, with at least two amino acids comprising EA and having a paired structure: Start with any of x to 352; and end at amino acid number 353 + ((n−2) −x), where x varies from 0 to n−2.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:膜。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有することで一致したが、両方の膜貫通領域予測プログラムが、このタンパク質はこのシグナルぺプチドの下流に膜貫通領域を有していると予測したことから膜にあると考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: membranes. The localization of the protein was consistent between both signal peptide prediction programs that the protein has a signal peptide, but both transmembrane region prediction programs have a transmembrane region downstream of the signal peptide. It is thought that it is in the film because it is predicted that it is.

変異体タンパク質M78076_PEA_1_P21はまた、表17に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらは、アミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P21配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein M78076_PEA_1_P21 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 17 (they are shown according to their position on the amino acid sequence, followed by the altered amino acids; The last column indicates whether the SNP is known; the presence of a known SNP in the mutant protein M78076_PEA_1_P21 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P21のグリコシレ−ション部位を、既知タンパク質のアミロイド様タンパク質1前駆体と比較する形で表18に示す(第一縦列に、アミノ酸配列上でのそれらの位置を示す;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示している;そして最後の縦列はその位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of the mutant protein M78076_PEA_1_P21 are shown in Table 18 in comparison with the known protein amyloid-like protein 1 precursor (first column shows their position on the amino acid sequence; second column shows It shows whether the glycosylation site is present in the mutant protein; and the last column shows whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P21は次の転写物にコ−ドされている:M78076_PEA_1_T23、この転写物の配列は本明細書の最後に示してある。転写物M78076_PEA_1_T23のコ−ディング部分は太字で表している:このコ−ディング部分は、位置142から始まり、位置1932に終止する。転写物はまた、表19に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P21配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein M78076_PEA_1_P21 is encoded in the following transcript: M78076_PEA_1_T23, the sequence of this transcript is given at the end of the specification. The coding portion of the transcript M78076_PEA_1_T23 is shown in bold: this coding portion starts at position 142 and ends at position 1932. The transcript also has the following SNPs listed in Table 19 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein M78076_PEA_1_P21 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質M78076_PEA_1_P24は、本明細書最後に示すアミノ酸配列を有する;それは転写物M78076_PEA_1_T26にコ−ドされている。本明細書の最後に、既知タンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein M78076_PEA_1_P24 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript M78076_PEA_1_T26. At the end of the description, an alignment to a known protein (amyloid-like protein 1 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

M78076_PEA_1_P24とAPP1_HUMANの比較報告:
1.M78076_PEA_1_P24をコ−ドする単離されたキメラポリペプチドは、APP1_HUMANのアミノ酸1〜481に相当し、またM78076_PEA_1_P24のアミノ酸1〜481にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P24のアミノ酸482〜492に相当する配列RECLLPWLPLQISEGRSに対し少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between M78076_PEA_1_P24 and APP1_HUMAN:
The 1.M78076_PEA_1_P24 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 481 of APP1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQI which also corresponds to amino acids 1 to 481 of M78076_PEA_1_P24 And at least 70%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferred to the sequence RECLLPWLPLQISEGRS corresponding to amino acids 482 to 492 of M78076_PEA_1_P24 Comprises a second amino acid sequence at least 95% homologous, has led in turn this time the first amino acid sequence and a second amino acid sequence is continuous.

2.M78076_PEA_1_P24の尾部をコ−ドする単離されたポリペプチドは、M78076_PEA_1_P24内の配列RECLLPWLPLQISEGRSに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、および最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of M78076_PEA_1_P24 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% to the sequence RECLLPWLPLQISEGRS in M78076_PEA_1_P24. %, And most preferably at least about 95% homologous polypeptides.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測したこと、およびいずれの膜貫通領域予測プログラムもこのタンパク質がこのシグナルペプチドを有すると予測しなかったことから分泌されていると考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization is secreted because both signal peptide prediction programs predicted that this protein had a signal peptide, and no transmembrane region prediction program predicted that this protein had this signal peptide It is believed that

変異体タンパク質M78076_PEA_1_P24はまた、表20に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらは、アミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P24配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein M78076_PEA_1_P24 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 20 (they are shown according to their position on the amino acid sequence, followed by the altered amino acids; The last column indicates whether the SNP is known; the presence of a known SNP in the mutant protein M78076_PEA_1_P24 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P24のグリコシレ−ション部位を、既知タンパク質のアミロイド様タンパク質1前駆体と比較する形で表21に示す(第一縦列にアミノ酸配列上でのそれらの位置を示す;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示している;そして最後の縦列はその位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of mutant protein M78076_PEA_1_P24 are shown in Table 21 in comparison with the known protein amyloid-like protein 1 precursor (first column shows their position on the amino acid sequence; second column shows glycosylation) -Indicates whether the site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P24は次の転写物にコ−ドされている:M78076_PEA_1_T26、この転写物の配列は本明細書の最後に示してある。転写物M78076_PEA_1_T26のコ−ディング部分は太字で表している:このコ−ディング部分は、位置142から始まり、位置1635に終止する。転写物はまた、表22に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P24配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein M78076_PEA_1_P24 is encoded in the following transcript: M78076_PEA_1_T26, the sequence of this transcript is given at the end of the specification. The coding portion of transcript M78076_PEA_1_T26 is shown in bold: this coding portion starts at position 142 and ends at position 1635. The transcript also has the following SNPs listed in Table 22 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein M78076_PEA_1_P24 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質M78076_PEA_1_P2は、本明細書最後に示すアミノ酸配列を有する;それは転写物M78076_PEA_1_T27にコ−ドされている。本明細書の最後に、既知タンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein M78076_PEA_1_P2 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript M78076_PEA_1_T27. At the end of the description, an alignment to a known protein (amyloid-like protein 1 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

M78076_PEA_1_P2とAPP1_HUMANの比較報告:
1.M78076_PEA_1_P2をコ−ドする単離されたキメラポリペプチドは、APP1_HUMANのアミノ酸1〜449に相当し、またM78076_PEA_1_P24のアミノ酸1〜449にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P2のアミノ酸450〜588に相当する配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEに対し少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between M78076_PEA_1_P2 and APP1_HUMAN:
The 1.M78076_PEA_1_P2 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 449 of APP1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQV which also corresponds to amino acids 1 to 449 of M78076_PEA_1_P24 , And a sequence corresponding to amino acids 450-588 of M78076_PEA_1_P2 LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLE preferably requires at least 80%, A second amino acid sequence that is at least 85%, more preferably at least 90%, and most preferably at least 95% homologous, wherein the first amino acid sequence and the second amino acid sequence are sequentially linked in sequence Yes.

2.M78076_PEA_1_P2の尾部をコ−ドする単離されたポリペプチドは、M78076_PEA_1_P2内の配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、および最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of M78076_PEA_1_P2 is at least about the sequence LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSV in the M78076_PEA_1_P2 %, And most preferably at least about 95% homologous polypeptides.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:膜。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有することで一致したが、両方の膜貫通領域予測プログラムが、このタンパク質はこのシグナルぺプチドの下流に膜貫通領域を有していると予測したことから膜にあると考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: membranes. The localization of the protein was consistent between both signal peptide prediction programs that the protein has a signal peptide, but both transmembrane region prediction programs have a transmembrane region downstream of the signal peptide. It is thought that it is in the film because it is predicted that it is.

変異体タンパク質M78076_PEA_1_P2はまた、表23に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらは、アミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P2配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein M78076_PEA_1_P2 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 23 (they are shown according to their position on the amino acid sequence, followed by the altered amino acids; The last column indicates whether the SNP is known; the presence of a known SNP in the mutant protein M78076_PEA_1_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P2のグリコシレ−ション部位を、既知タンパク質のアミロイド様タンパク質1前駆体と比較する形で表24に示す(第一縦列にアミノ酸配列上でのそれらの位置を示す;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示している;そして最後の縦列はその位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of the mutant protein M78076_PEA_1_P2 are shown in Table 24 in comparison with the amyloid-like protein 1 precursor of the known protein (the first column shows their position on the amino acid sequence; the second column shows glycosylation) -Indicates whether the site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P2は次の転写物にコ−ドされている:M78076_PEA_1_T27、この転写物の配列は本明細書の最後に示してある。転写物M78076_PEA_1_T27のコ−ディング部分は太字で表している:このコ−ディング部分は、位置142から始まり、位置1905に終止する。転写物はまた、表25に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P2配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein M78076_PEA_1_P2 is encoded in the following transcript: M78076_PEA_1_T27, the sequence of this transcript is given at the end of the specification. The coding portion of the transcript M78076_PEA_1_T27 is shown in bold: this coding portion starts at position 142 and ends at position 1905. The transcript also has the following SNPs listed in Table 25 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein M78076_PEA_1_P2 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217
Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質M78076_PEA_1_P25は、本明細書最後に示すアミノ酸配列を有する;それは転写物M78076_PEA_1_T28にコ−ドされている。本明細書の最後に、既知タンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein M78076_PEA_1_P25 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript M78076_PEA_1_T28. At the end of the description, an alignment to a known protein (amyloid-like protein 1 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

M78076_PEA_1_P25とAPP1_HUMANの比較報告:
1.M78076_PEA_1_P25をコ−ドする単離されたキメラポリペプチドは、APP1_HUMANのアミノ酸1〜448に相当し、またM78076_PEA_1_P25のアミノ酸1〜448にも相当するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQに少なくとも90%相同である第一アミノ酸配列、およびM78076_PEA_1_P25のアミノ酸449〜505に相当する配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPに対し少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between M78076_PEA_1_P25 and APP1_HUMAN:
The 1.M78076_PEA_1_P25 co - sul isolated chimeric polypeptide corresponds to amino acids 1 to 448 of APP1_HUMAN, also the first amino acid sequence that is at least 90% homologous to MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ which also corresponds to amino acids 1 to 448 of M78076_PEA_1_P25 , And the sequence PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSP corresponding to amino acids 449 to 505 of M78076_PEA_1_P25, if necessary at least 80%, preferably at least 85%, more preferably at least 90% and most preferred Properly comprises a second amino acid sequence at least 95% homologous, the this case the first amino acid sequence and a second amino acid sequence are connected in sequence continuously.

2.M78076_PEA_1_P25の尾部をコ−ドする単離されたポリペプチドは、M78076_PEA_1_P25内の配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、および最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that codes the tail of M78076_PEA_1_P25 is at least 70%, preferably at least about 80%, preferably at least about 85%, more preferably at least about 90% in sequence PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSP within M78076_PEA_1_P25 %, And most preferably at least about 95% homologous polypeptides.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して、次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測したこと、およびいずれの膜貫通領域予測プログラムもこのタンパク質がこのシグナルペプチドを有すると予測しなかったことから分泌されていると考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization is secreted because both signal peptide prediction programs predicted that this protein had a signal peptide, and no transmembrane region prediction program predicted that this protein had this signal peptide It is believed that

変異体タンパク質M78076_PEA_1_P25はまた、表26に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらは、アミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P25配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein M78076_PEA_1_P25 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 26 (they are shown according to their position on the amino acid sequence, followed by the altered amino acids; The last column shows whether or not SNP is known; the presence of a known SNP in the mutant protein M78076_PEA_1_P25 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P25のグリコシレ−ション部位を、既知タンパク質のアミロイド様タンパク質1前駆体と比較する形で表27に示す(第一縦列にアミノ酸配列上でのそれらの位置を示す;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示している;そして最後の縦列はその位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of the mutant protein M78076_PEA_1_P25 are shown in Table 27 in comparison with the amyloid-like protein 1 precursor of the known protein (the first column shows their position on the amino acid sequence; the second column shows glycosylation) -Indicates whether the site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質M78076_PEA_1_P25は次の転写物にコ−ドされている:M78076_PEA_1_T28、この転写物の配列は本明細書の最後に示してある。転写物M78076_PEA_1_T28のコ−ディング部分は太字で表している:このコ−ディング部分は、位置142から始まり、位置1656に終止する。転写物はまた、表28に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクM78076_PEA_1_P25配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein M78076_PEA_1_P25 is encoded in the following transcript: M78076_PEA_1_T28, the sequence of this transcript is given at the end of the specification. The coding portion of the transcript M78076_PEA_1_T28 is shown in bold: this coding portion starts at position 142 and ends at position 1656. The transcript also has the following SNPs listed in Table 28 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein M78076_PEA_1_P25 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記したように、クラスタM78076は上表2に掲載し、またその配列を本明細書の最後に示した35個のセグメントを特徴とする。これらセグメントは、特に関心の対象であることからここに別々に記載する核酸配列の部分である。次に本発明の各セグメントについて説明する。   As noted above, cluster M78076 is listed in Table 2 above and is characterized by 35 segments whose arrangement is shown at the end of this specification. These segments are part of the nucleic acid sequence described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタM78076_PEA_1_node_0は、47個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表29に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_0 of the present invention is supported by 47 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 29 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_10は、70個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表30に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_10 of the present invention is supported by 70 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 30 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_15は、74個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表31に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_15 of the present invention is supported by 74 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 31 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_18は、95個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表32に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_18 of the present invention is supported by 95 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 32 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_20は、99個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表33に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_20 of the present invention is supported by 99 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 33 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_24は、105個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表34に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_24 of the present invention is supported by 105 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T26, M78076_PEA_1_T27, and M78076_PE_1. Table 34 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_26は、99個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表35に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_26 of the present invention is supported by 99 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 35 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_29は、2つのライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T27。下表36に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_29 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M78076_PEA_1_T27. Table 36 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_32は、2つのライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T26およびM78076_PEA_1_T27。下表37に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_32 of the present invention is supported by two libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T26 and M78076_PEA_1_T27. Table 37 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_35は、4つのライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2およびM78076_PEA_1_T5。下表38に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_35 of the present invention is supported by four libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2 and M78076_PEA_1_T5. Table 38 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_37は、11個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T3およびM78076_PEA_1_T5。下表39に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_37 of the present invention is supported by 11 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T3 and M78076_PEA_1_T5. Table 39 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_46は、3つのライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T15。下表40に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_46 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: M78076_PEA_1_T15. Table 40 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_47は、155個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。下表41に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_47 of the present invention is supported by 155 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, and M78076_PEA_1_T23. Table 41 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_54は、133個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、およびM78076_PEA_1_T28。下表42に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_54 of the present invention is supported by 133 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, and M78076_PEA_1_T28. Table 42 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明の好選態様によれば、上記クラスタに関係する短いセグメントも提供される。これらのセグメントは長さが約120bpまでであることから別に説明する。   According to the preferred embodiment of the present invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they will be described separately.

本発明のセグメントクラスタM78076_PEA_1_node_1は、47個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表43に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_1 of the present invention is supported by 47 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 43 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_2は次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表44に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_2 of the present invention can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PE_1, T78076_PE_1_1 Table 44 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_3は、52個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表45に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_3 of the present invention is supported by 52 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 45 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_6は、59個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表46に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_6 of the present invention is supported by 59 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 46 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_7は、64個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表47に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_7 of the present invention is supported by 64 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 47 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_12は、71個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表48に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_12 of the present invention is supported by 71 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 48 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_22は、92個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。下表49に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_22 of the present invention is supported by 92 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, M78076_PEM_1_780 Table 49 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_27は次の転写物に見出すことができる:M78076_PEA_1_T27。下表50に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_27 of the present invention can be found in the following transcript: M78076_PEA_1_T27. Table 50 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_30は、90個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、およびM78076_PEA_1_T27。下表51に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_30 of the present invention is supported by 90 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, and _M78076_PE_1. Table 51 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_31は、89個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、およびM78076_PEA_1_T27。下表52に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_31 of the present invention is supported by 89 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, M78076_PEA_1_T26, and _M78076_PE_1. Table 52 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_34は、103個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15およびM78076_PEA_1_T23。下表53に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_34 of the present invention is supported by 103 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15 and M78076_PEA_1_T23. Table 53 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_36は次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15およびM78076_PEA_1_T23。下表54に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_36 of the present invention can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15 and M78076_PEA_1_T23. Table 54 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_41は次の転写物に見出すことができる:M78076_PEA_1_T3およびM78076_PEA_1_T5。下表55に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_41 of the present invention can be found in the following transcripts: M78076_PEA_1_T3 and M78076_PEA_1_T5. Table 55 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_42は次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T15およびM78076_PEA_1_T23。下表56に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_42 of the present invention can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T15 and M78076_PEA_1_T23. Table 56 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_43は110個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T15およびM78076_PEA_1_T23。下表57に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_43 of the present invention is supported by 110 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T15 and M78076_PEA_1_T23. Table 57 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

このセグメントについては、次のようなマイクロアレイ(チップ)デ−タも在る。クラスタそのものに関して上記したように、様々なオリゴヌクレオチドについて、各種疾患状態、特に癌で発現に差があるか試験した。次のオリゴヌクレオチドが、表58に示すように、このセグメント(乳癌と関係する)をヒットすることが見出された。   The following microarray (chip) data is also present for this segment. As described above for the cluster itself, various oligonucleotides were tested for differences in expression in various disease states, particularly cancer. The following oligonucleotide was found to hit this segment (associated with breast cancer) as shown in Table 58.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_45は132個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15およびM78076_PEA_1_T23。下表59に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_45 of the present invention is supported by 132 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15 and M78076_PEA_1_T23. Table 59 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

このセグメントについては、次のようなマイクロアレイ(チップ)デ−タも在る。クラスタそのものに関して上記したように、様々なオリゴヌクレオチドについて、各種疾患状態、特に癌で発現に差があるか試験した。次のオリゴヌクレオチドが、表60に示すように、このセグメント(乳癌と関係する)をヒットすることが見出された。   The following microarray (chip) data is also present for this segment. As described above for the cluster itself, various oligonucleotides were tested for differences in expression in various disease states, particularly cancer. The following oligonucleotide was found to hit this segment (associated with breast cancer) as shown in Table 60.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_49は129個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15およびM78076_PEA_1_T23。下表61に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_49 of the present invention is supported by 129 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15 and M78076_PEA_1_T23. Table 61 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_50は125個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15およびM78076_PEA_1_T23。下表62に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_50 of the present invention is supported by 125 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15 and M78076_PEA_1_T23. Table 62 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_51は123個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15およびM78076_PEA_1_T23。下表63に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_51 of the present invention is supported by 123 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15 and M78076_PEA_1_T23. Table 63 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_52は次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15およびM78076_PEA_1_T23。下表64に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_52 of the present invention can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15 and M78076_PEA_1_T23. Table 64 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタM78076_PEA_1_node_53は次の転写物に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、およびM78076_PEA_1_T28。下表65に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster M78076_PEA_1_node_53 of the present invention can be found in the following transcripts: M78076_PEA_1_T2, M78076_PEA_1_T3, M78076_PEA_1_T5, M78076_PEA_1_T13, M78076_PEA_1_T15, M78076_PEA_1_T23, and A780_763. Table 65 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:APP1_HUMAN
配列文書:
アラインメント:M78076_PEA_1_P3 x APP1_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:5132.00
Escore:0
一致長:517 全長:517
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
.
501 GGSSEDKGGLQPPDSKD 517
|||||||||||||||||
501 GGSSEDKGGLQPPDSKD 517
Alignment sequence name of mutant protein with known protein: APP1_HUMAN
Sequence document:
Alignment: M78076_PEA_1_P3 x APP1_HUMAN ..
Alignment segment 1/1:
Quality: 5132.00
Escore: 0
Match length: 517 Total length: 517
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
...
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
...
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
...
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
...
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
...
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
...
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
...
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
...
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
...
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
.
501 GGSSEDKGGLQPPDSKD 517
||||||||||||||||||| |
501 GGSSEDKGGLQPPDSKD 517

配列名:APP1_HUMAN
配列文書:
アラインメント:M78076_PEA_1_P4 x APP1_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:5223.00
Escore:0
一致長:526 全長:526
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. .
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
Array name: APP1_HUMAN
Sequence document:
Alignment: M78076_PEA_1_P4 x APP1_HUMAN ..
Alignment segment 1/1:
Quality-: 5223.00
Escore: 0
Match length: 526 Length: 526
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
...
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
...
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
...
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
...
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
...
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
...
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
...
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
...
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
...
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
..
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526

配列名:APP1_HUMAN
配列文書:
アラインメント:M78076_PEA_1_P12 x APP1_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:5223.00
Escore:0
一致長:526 全長:526
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. .
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
Array name: APP1_HUMAN
Sequence document:
Alignment: M78076_PEA_1_P12 x APP1_HUMAN ..
Alignment segment 1/1:
Quality-: 5223.00
Escore: 0
Match length: 526 Length: 526
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
...
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
...
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
...
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
...
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
...
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
...
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
...
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
...
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
...
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
..
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526

配列名:APP1_HUMAN
配列文書:
アラインメント:M78076_PEA_1_P14 x APP1_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:5672.00
Escore:0
一致長:575 全長:575
一致パ−セント類似性:99.48 一致パ−セント同一性:99.48
全パ−セント類似性:99.48 全パ−セント同一性:99.48
ギャップ: 0
アラインメント:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. . . . .
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
. .
551 NASVPRGFPFHSSEIQRDELVRGGT 575
|||||||||||||||||||| ||
551 NASVPRGFPFHSSEIQRDELAPAGT 575
Array name: APP1_HUMAN
Sequence document:
Alignment: M78076_PEA_1_P14 x APP1_HUMAN ..
Alignment segment 1/1:
Quality-: 5672.00
Escore: 0
Match length: 575 Length: 575
Match Percent Similarity: 99.48 Match Percent Identity: 99.48
Total percent similarity: 99.48 Total percent identity: 99.48
Gap: 0
alignment:
...
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
...
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
...
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
...
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
...
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
...
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
...
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
...
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
...
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
...
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
...
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
..
551 NASVPRGFPFHSSEIQRDELVRGGT 575
|||||||||||||||||||||||-
551 NASVPRGFPFHSSEIQRDELAPAGT 575

配列名:APP1_HUMAN
配列文書:
アラインメント:M78076_PEA_1_P21 x APP1_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:5822.00
Escore:0
一致長:597 全長:650
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:91.85 全パ−セント同一性:91.85
ギャップ: 1
アラインメント:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NE................................................ 352
||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
353 .....AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 397
|||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
398 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 447
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. . . . .
448 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 497
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
. . . . .
498 NASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSM 547
||||||||||||||||||||||||||||||||||||||||||||||||||
551 NASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSM 600
. . . . .
548 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 597
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 650
Array name: APP1_HUMAN
Sequence document:
Alignment: M78076_PEA_1_P21 x APP1_HUMAN ..
Alignment segment 1/1:
Quality-: 5822.00
Escore: 0
Match length: 597 Length: 650
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 91.85 Total percent identity: 91.85
Gap: 1
alignment:
...
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
...
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
...
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
...
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
...
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
...
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
...
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
...
351 NE ................................................ 352
||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
...
353 ..... AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 397
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||||-|||||||-||||-|||||||-||||||-||||||||-
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
...
398 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 447
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
...
448 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 497
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
...
498 NASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSM 547
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
551 NASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSM 600
...
548 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 597
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
601 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 650

配列名:APP1_HUMAN
配列文書:
アラインメント:M78076_PEA_1_P24 x APP1_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:4791.00
Escore:0
一致長:485 全長:485
一致パ−セント類似性:99.79 一致パ−セント同一性:99.59
全パ−セント類似性:99.79 全パ−セント同一性:99.59
ギャップ: 0
アラインメント:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIRECL 485
|||||||||||||||||||||||||||||||:| |
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELL 485
Array name: APP1_HUMAN
Sequence document:
Alignment: M78076_PEA_1_P24 x APP1_HUMAN ..
Alignment segment 1/1:
Quality-: 4791.00
Escore: 0
Match length: 485 Total length: 485
Match Percent Similarity: 99.79 Match Percent Identity: 99.59
Total percent similarity: 99.79 Total percent identity: 99.59
Gap: 0
alignment:
...
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
...
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
...
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
...
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
...
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
...
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
...
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
...
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
...
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
..
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIRECL 485
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||||-
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELL 485

配列名:APP1_HUMAN
配列文書:
アラインメント:M78076_PEA_1_P2 x APP1_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:4474.00
Escore:0
一致長:454 全長:454
一致パ−セント類似性:99.56 一致パ−セント同一性:99.34
全パ−セント類似性:99.56 全パ−セント同一性:99.34
ギャップ: 0
アラインメント:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVL 450
|||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450

451 TSFQ 454
| :|
451 THLQ 454
Array name: APP1_HUMAN
Sequence document:
Alignment: M78076_PEA_1_P2 x APP1_HUMAN ..
Alignment segment 1/1:
Quality: 4447.00
Escore: 0
Match length: 454 Total length: 454
Match Percent Similarity: 99.56 Match Percent Identity: 99.34
Total percent similarity: 99.56 Total percent identity: 99.34
Gap: 0
alignment:
...
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
...
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
...
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
...
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
...
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
...
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
...
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
...
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
...
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVL 450
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-||||-|||||-||||-|||||-|||||-||||||||||| be be not
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450

451 TSFQ 454
|: |
451 THLQ 454

配列名:APP1_HUMAN
配列文書:
アラインメント:M78076_PEA_1_P25 x APP1_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:4455.00
Escore:0
一致長:448 全長:448
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:100.00 全パ−セント同一性:100.00
ギャップ: 0
アラインメント:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ 448
||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ 448
Array name: APP1_HUMAN
Sequence document:
Alignment: M78076_PEA_1_P25 x APP1_HUMAN ..
Alignment segment 1/1:
Quality-: 4455.00
Escore: 0
Match length: 448 Length: 448
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 100.00 Total percent identity: 100.00
Gap: 0
alignment:
...
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
...
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
...
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
...
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
...
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
...
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
...
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
...
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
...
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ 448
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||-||||||-||||||-||||||-||||||-||||||||-
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ 448

クラスタHSMUC1Aの説明
クラスタHSMUC1Aは、その名称を表1および2にそれぞれ示し、配列それ自体は本明細書の最後に示す、関心対象の14個の転写物と22個のセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Explanation of cluster HSMUC1A
Cluster HSMUC1A has its name shown in Tables 1 and 2, respectively, and the sequence itself is characterized by 14 transcripts of interest and 22 segments as shown at the end of the specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は、既知タンパク質であるムチン1前駆体(SwissProtアクセッション識別子MUC1_HUMAN;同義語のMUC−1;多形上皮ムチン;PEM;PEMT;エピシアリン(Episialin):腫瘍関連ムチン;癌腫関連ムチン;腫瘍関連上皮膜抗原;EMA;H23AG;ピ−ナッツ反応性子宮ムチン;PUM;乳癌関連抗原DF3;CD227好転としても知られる)、配列番号:805であり、ここでは既知タンパク質と呼ぶ。   These sequences are the known protein mucin 1 precursor (SwissProt accession identifier MUC1_HUMAN; synonymous MUC-1; polymorphic epithelial mucin; PEM; PEMT; Episialin: tumor associated mucin; carcinoma associated mucin; tumor associated Epithelial membrane antigen; EMA; H23AG; peanut-reactive uterine mucin; PUM; breast cancer associated antigen DF3; also known as CD227 turnover), SEQ ID NO: 805, referred to herein as a known protein.

タンパク質のムチン1前駆体は次の機能を有することが知られているか、または有すると考えられている:接着機能と細胞−細胞相互作用、転移ならびにシグナル伝達に役割を果たしている可能性がある。上皮表面に保護層を提供するだろう。アクチン細胞骨格との直接または間接的相互作用。イソ型7はレセプタ−として働き、分泌されたイソ型5を結合する。この結合はイソ型7のリン酸化を誘導し、細胞の形態を変えて細胞のシグナル伝達を始動する。GRB2アダプタ−タンパク質に結合できる。タンパク質のムチン1前駆体の配列は、本明細書の最後に「ムチン1前駆体アミノ酸配列」として示している。この配列について知られている多形は表4に示す通りである。   The protein mucin 1 precursor is known or believed to have the following functions: it may play a role in adhesion function and cell-cell interactions, metastasis and signal transduction. Will provide a protective layer on the epithelial surface. Direct or indirect interaction with the actin cytoskeleton. Isoform 7 acts as a receptor and binds secreted isoform 5. This binding induces phosphorylation of isoform 7, alters cell morphology and triggers cell signaling. GRB2 adapter—can bind to protein. The sequence of the protein mucin 1 precursor is shown at the end of the specification as the “mucin 1 precursor amino acid sequence”. Known polymorphs for this sequence are shown in Table 4.

Figure 2007520217
Figure 2007520217

タンパク質、ムチン1前駆体の局在は、タイプI膜タンパク質であると考えられている。二種類の分泌型(5および9)も生成される。   The localization of the protein, mucin 1 precursor, is thought to be a type I membrane protein. Two secreted forms (5 and 9) are also produced.

既知タンパク質には、次の適用および/または潜在的治療利用もある:癌、乳房;癌、肺、非小細胞;癌、卵巣;癌、前立腺。例えば抗体または低分子の標的として、および/または直接の治療としてのヒトでの臨床/治療利用が研究されている;これらの研究に関して入手可能な情報は次の通りである。既知タンパク質の潜在的な薬学に関係する、または治療に関係する活性は次の通りである:CD8アゴニスト;DNAアンタゴニスト;免疫刺激剤;インタ−フェロンガンマアゴニスト;MUC−1阻害剤。本クラスタが示すタンパク質については治療的役割が推測されている。本クラスタは、薬物デ−タベ−スまたは公開デ−タベ−ス(例えば本明細書上記のもの)の中に、このタンパク質もしくはその一部が、潜在的な治療応用に用いられている、または使用できるという情報があることから、この分野に割り当てられた:抗癌;モノクロ−ナル抗体、マウス;免疫毒素;免疫刺激剤;免疫複合体。   Known proteins also have the following applications and / or potential therapeutic uses: cancer, breast; cancer, lung, non-small cells; cancer, ovary; cancer, prostate. For example, human clinical / therapeutic uses have been studied as antibodies or small molecule targets and / or as direct therapies; the information available on these studies is as follows: Potential pharmacological or therapeutic activities of known proteins are as follows: CD8 agonist; DNA antagonist; immunostimulatory agent; inter-feron gamma agonist; MUC-1 inhibitor. A therapeutic role is presumed for the protein represented by this cluster. The cluster is a drug database or public database (eg, those described hereinabove) where the protein or part thereof is used for potential therapeutic applications, or Assigned to this field because there is information that it can be used: anti-cancer; monoclonal antibodies, mice; immunotoxins; immunostimulants; immune complexes.

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;アクチン結合、これは分子機能に関係する注釈付けである;および細胞骨格;内在性原形質膜タンパク質、これは細胞成分に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; actin binding, which is related to molecular function; and cytoskeleton; intrinsic plasma membrane protein, which is related to cellular components.

GO割り当ては、<http://www.expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http://www.expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタHSMUC1Aは、癌においてこのクラスタの転写物が過剰発現することから、診断マ−カ−として用いることができる。このような転写物の正常組織での発現もまた、前述した方法から得られる。表、左手縦列の項目「数」および図43のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けされたEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster HSMUC1A can be used as a diagnostic marker because transcripts of this cluster are overexpressed in cancer. Expression of such transcripts in normal tissues can also be obtained from the method described above. The number of items in the table, left hand column “number” and the y-axis number in FIG. 43 is the weighted EST expression for each category expressed in the form of “parts per million” Expressed ratio of EST expression of a specific cluster to expression of all ESTs of this classification)

全体として、図43のヒストグラムおよび表5に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);各種組織由来の混合型悪性腫瘍、乳房悪性腫瘍、膵臓癌、および前立腺癌。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 43 and Table 5. This cluster is overexpressed (at least at a minimal level) in the following pathological conditions: mixed malignancies from various tissues, breast malignancies, pancreatic cancer, and prostate cancer.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

このクラスタについては、以下に示す転写物/セグメントの少なくとも一つではないが、少なくとも一つのオリゴヌクレオチドがクラスタの過剰発現を証明することが分かっている。このセグメントについては、次のようなマイクロアレイ(チップ)デ−タも在る。クラスタそのものに関して上記したように、様々なオリゴヌクレオチドについて、各種疾患状態、特に癌で発現に差があるか試験した。次のオリゴヌクレオチドが、表7に示すように、このセグメントをヒットするが、他の下記セグメント/転写物(乳癌に関係する)はヒットしないことが見出された。   For this cluster, although not at least one of the transcripts / segments shown below, it has been found that at least one oligonucleotide demonstrates overexpression of the cluster. The following microarray (chip) data is also present for this segment. As described above for the cluster itself, various oligonucleotides were tested for differences in expression in various disease states, particularly cancer. The following oligonucleotide was found to hit this segment as shown in Table 7, but not the other following segments / transcripts (related to breast cancer).

Figure 2007520217
Figure 2007520217

上記のように、クラスタHSMUC1Aは、上表1に記載の14個の転写物を特徴とする。これら転写物は、タンパク質、ムチン1前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster HSMUC1A is characterized by the 14 transcripts listed in Table 1 above. These transcripts code for the protein, a protein that is a variant of mucin 1 precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質HSMUC1A_PEA_1_P25は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T26にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測していることから分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P25 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript HSMUC1A_PEA_1_T26. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is believed to be secreted because both signal peptide prediction programs predict that this protein has a signal peptide.

変異体タンパク質HSMUC1A_PEA_1_P25はまた、表8に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSMUC1A_PEA_1_P25配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSMUC1A_PEA_1_P25 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 8 (shown according to their amino acid sequence position and then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSMUC1A_PEA_1_P25 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSMUC1A_PEA_1_P25は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T26、この転写物の配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T26のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置1115に終止する。転写物はまた、表9に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P25配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P25 is encoded in the following transcript: HSMUC1A_PEA_1_T26, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T26 is shown in bold: this coding part starts at position 507 and ends at position 1115. The transcript also has the following SNPs listed in Table 9 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P25 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P29は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T33にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測していること、およびいずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を持つと予測しなかったことから分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P29 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript HSMUC1A_PEA_1_T33. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that neither transmembrane region prediction program predicted that this protein had a transmembrane region It is thought that it is secreted from.

変異体タンパク質HSMUC1A_PEA_1_P29は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T33、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T33のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置953に終止する。転写物はまた、表10に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P29配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P29 is encoded in the following transcript: HSMUC1A_PEA_1_T33, the sequence of which is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T33 is shown in bold: this coding part starts at position 507 and ends at position 953. The transcript also has the following SNPs listed in Table 10 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P29 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P30は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T34にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測していることから分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P30 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSMUC1A_PEA_1_T34. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is believed to be secreted because both signal peptide prediction programs predict that this protein has a signal peptide.

変異体タンパク質HSMUC1A_PEA_1_P30はまた、表11に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSMUC1A_PEA_1_P30配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P30 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 11 (shown according to their amino acid sequence position and then the altered amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSMUC1A_PEA_1_P30 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSMUC1A_PEA_1_P30は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T34、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T34のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置1004に終止する。転写物はまた、表12に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P30配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P30 is encoded in the following transcript: HSMUC1A_PEA_1_T34, the sequence of which is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T34 is shown in bold: this coding part starts at position 507 and ends at position 1004. The transcript also has the following SNPs listed in Table 12 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is known SNP) The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P30 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P32は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T36にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測していることから分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P32 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSMUC1A_PEA_1_T36. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. The localization of the protein is believed to be secreted because both signal peptide prediction programs predict that this protein has a signal peptide.

変異体タンパク質HSMUC1A_PEA_1_P32はまた、表13に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSMUC1A_PEA_1_P32配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSMUC1A_PEA_1_P32 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 13 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSMUC1A_PEA_1_P32 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSMUC1A_PEA_1_P32は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T36、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T36のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置977に終止する。転写物はまた、表14に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P32配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P32 is encoded in the following transcript: HSMUC1A_PEA_1_T36, the sequence of which is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T36 is shown in bold: this coding part starts at position 507 and ends at position 977. The transcript also has the following SNPs listed in Table 14 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P32 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P36は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T40にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測していること、またいずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから、分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P36 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSMUC1A_PEA_1_T40. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that neither transmembrane region prediction program predicted that this protein had a transmembrane region It is thought that it is secreted from.

変異体タンパク質HSMUC1A_PEA_1_P36はまた、表15に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSMUC1A_PEA_1_P36配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P36 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 15 (shown according to their amino acid sequence position and then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSMUC1A_PEA_1_P36 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSMUC1A_PEA_1_P36は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T40、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T40のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置983に終止する。転写物はまた、表16に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P36配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P36 is encoded in the following transcript: HSMUC1A_PEA_1_T40, the sequence of which is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T40 is shown in bold: this coding part starts at position 507 and ends at position 983. The transcript also has the following SNPs listed in Table 16 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known) The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P36 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P39は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T43にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測していること、またいずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから、分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P39 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSMUC1A_PEA_1_T43. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that neither transmembrane region prediction program predicted that this protein had a transmembrane region It is thought that it is secreted from.

変異体タンパク質HSMUC1A_PEA_1_P39はまた、表17に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSMUC1A_PEA_1_P39配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P39 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 17 (shown according to their amino acid sequence position, followed by the modified amino acids; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSMUC1A_PEA_1_P39 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSMUC1A_PEA_1_P39は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T43、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T43のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置914に終止する。転写物はまた、表18に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P39配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P39 is encoded in the following transcript: HSMUC1A_PEA_1_T43, the sequence of which is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T43 is shown in bold: this coding part starts at position 507 and ends at position 914. The transcript also has the following SNPs listed in Table 18 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known) The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P39 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P45は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T29にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測していること、またいずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから、分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P45 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSMUC1A_PEA_1_T29. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that neither transmembrane region prediction program predicted that this protein had a transmembrane region It is thought that it is secreted from.

変異体タンパク質HSMUC1A_PEA_1_P45は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T29、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T29のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置746に終止する。転写物はまた、表19に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P45配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P45 is encoded in the following transcript: HSMUC1A_PEA_1_T29, the sequence of which is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T29 is shown in bold: this coding part starts at position 507 and ends at position 746. The transcript also has the following SNPs listed in Table 19 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P45 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P49は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T12にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測していること、またいずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから、分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P49 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSMUC1A_PEA_1_T12. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that neither transmembrane region prediction program predicted that this protein had a transmembrane region It is thought that it is secreted from.

変異体タンパク質HSMUC1A_PEA_1_P49は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T12、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T12のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置884に終止する。転写物はまた、表20に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P49配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P49 is encoded in the following transcript: HSMUC1A_PEA_1_T12, the sequence is shown at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T12 is shown in bold: this coding part starts at position 507 and ends at position 884. The transcript also has the following SNPs listed in Table 20 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P49 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P52は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T30にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測していること、またいずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから、分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P52 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSMUC1A_PEA_1_T30. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that neither transmembrane region prediction program predicted that this protein had a transmembrane region It is thought that it is secreted from.

変異体タンパク質HSMUC1A_PEA_1_P52は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T30、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T30のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置719に終止する。転写物はまた、表21に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P52配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P52 is encoded in the following transcript: HSMUC1A_PEA_1_T30, the sequence of which is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T30 is shown in bold: this coding part starts at position 507 and ends at position 719. The transcript also has the following SNPs listed in Table 21 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P52 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P53は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T31にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測していること、またいずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから、分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P53 of the present invention has the amino acid sequence shown at the end of this specification; it is encoded in the transcript HSMUC1A_PEA_1_T31. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that neither transmembrane region prediction program predicted that this protein had a transmembrane region It is thought that it is secreted from.

変異体タンパク質HSMUC1A_PEA_1_P53は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T31、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T31のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置665に終止する。転写物はまた、表22に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P53配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P53 is encoded in the following transcript: HSMUC1A_PEA_1_T31, the sequence is shown at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T31 is shown in bold: this coding part starts at position 507 and ends at position 665. The transcript also has the following SNPs listed in Table 22 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P53 sequence confirms the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P56は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T42にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測していること、またいずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから、分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P56 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSMUC1A_PEA_1_T42. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that neither transmembrane region prediction program predicted that this protein had a transmembrane region It is thought that it is secreted from.

変異体タンパク質HSMUC1A_PEA_1_P56はまた、表23に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSMUC1A_PEA_1_P56配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSMUC1A_PEA_1_P56 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 23 (shown according to their amino acid sequence position and then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSMUC1A_PEA_1_P56 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSMUC1A_PEA_1_P56は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T42、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T42のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置890に終止する。転写物はまた、表24に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P56配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P56 is encoded in the following transcript: HSMUC1A_PEA_1_T42, the sequence of which is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T42 is shown in bold: this coding part starts at position 507 and ends at position 890. The transcript also has the following SNPs listed in Table 24 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P56 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P58は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T35にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測していること、またいずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから、分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P58 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSMUC1A_PEA_1_T35. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that neither transmembrane region prediction program predicted that this protein had a transmembrane region It is thought that it is secreted from.

変異体タンパク質HSMUC1A_PEA_1_P58はまた、表25に掲載する、以下の非サイレントSNP(単一ヌクレオチド多形)を有する(それらのアミノ酸配列上の位置に従って示され、次に変更アミノ酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパク質HSMUC1A_PEA_1_P58配列内の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The variant protein HSMUC1A_PEA_1_P58 also has the following non-silent SNPs (single nucleotide polymorphisms) listed in Table 25 (shown according to their amino acid sequence position, then the modified amino acids are listed; last Column indicates whether or not SNP is known; the presence of a known SNP within the mutant protein HSMUC1A_PEA_1_P58 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSMUC1A_PEA_1_P58は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T53、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T53のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置980に終止する。転写物はまた、表26に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P58配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P58 is encoded in the following transcript: HSMUC1A_PEA_1_T53, the sequence of which is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T53 is shown in bold: this coding part starts at position 507 and ends at position 980. The transcript also has the following SNPs listed in Table 26 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P58 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P59は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSMUC1A_PEA_1_T28にコ−ドされている。この変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムがこのタンパク質がシグナルペプチドを有すると予測していること、またいずれの膜貫通領域予測プログラムもこのタンパク質が膜貫通領域を有すると予測しなかったことから、分泌されていると考えられている。   The mutant protein HSMUC1A_PEA_1_P59 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSMUC1A_PEA_1_T28. The localization of this mutant protein was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicated that both signal peptide prediction programs predicted that this protein had a signal peptide, and that neither transmembrane region prediction program predicted that this protein had a transmembrane region It is thought that it is secreted from.

変異体タンパク質HSMUC1A_PEA_1_P59は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T28、この配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T28のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置794に終止する。転写物はまた、表27に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P59配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P59 is encoded in the following transcript: HSMUC1A_PEA_1_T28, the sequence of which is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T28 is shown in bold: this coding part starts at position 507 and ends at position 794. The transcript also has the following SNPs listed in Table 27 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P59 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

本発明の変異体タンパク質HSMUC1A_PEA_1_P63は、本明細書最後に示すアミノ酸配列を有する;それは転写物M78076_PEA_1_T47にコ−ドされている。本明細書の最後に、既知タンパク質(ムチン1前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HSMUC1A_PEA_1_P63 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript M78076_PEA_1_T47. At the end of the specification, an alignment to a known protein (mucin 1 precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HSMUC1A_PEA_1_P63とMUC1_HUMANとの比較報告:
1.HSMUC1A_PEA_1_P63をコ−ドする単離されたキメラポリペプチドは、MUC1_HUMANのアミノ酸1〜45に相当し、またHSMUC1A_PEA_1_P63のアミノ酸1〜45にも相当するMTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVに少なくとも90%相同である第一アミノ酸配列、およびHSMUC1A_PEA_1_P63のアミノ酸46〜85に相当する配列EEEVSADQVSVGASGVLGSFKEARNAPSFLSWSFSMGPSKを有するポリペプチドに少なくとも70%、要する場合には少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、および最も好ましくは少なくとも95%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between HSMUC1A_PEA_1_P63 and MUC1_HUMAN:
1. An isolated chimeric polypeptide that codes for HSMUC1A_PEA_1_P63 is a first amino acid sequence that is at least 90% homologous to MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSV, which corresponds to amino acids 1-45 of MUC1_HUMAN and also amino acids 1-45 of HSMUC1A_PEA_1_P63 , And a polypeptide having the sequence EEEVSADQVSVGASGVLGSFKEARNAPSFLSWSFSMGPSK corresponding to amino acids 46-85 of HSMUC1A_PEA_1_P63, at least 80%, if necessary at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% The first amino acid sequence and the second amino acid sequence are sequentially connected in sequence.

2.HSMUC1A_PEA_1_P63の尾部をコ−ドする単離されたポリペプチドは、HSMUC1A_PEA_1_P63内の配列EEEVSADQVSVGASGVLGSFKEARNAPSFLSWSFSMGPSKに少なくとも70%、要する場合には少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、および最も好ましくは少なくとも約95%相同であるポリペプチドを含む。   2.An isolated polypeptide that encodes the tail of HSMUC1A_PEA_1_P63 has at least 70%, if necessary requires at least about 80%, preferably at least about 85%, more preferably at least about 85%, to the sequence EEEVSADQVSVGASGVLGSFKEARNAPSFLSWSFSMGPSK in HSMUC1A_PEA_1_P63. %, And most preferably at least about 95% homologous polypeptides.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測していること、およびいずれの膜貫通領域推測プログラムも、このタンパク質について膜貫通領域を有すると予測しなかったことから分泌されていると考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicates that both signal peptide prediction programs predict that this protein has a signal peptide, and that neither transmembrane region estimation program has a transmembrane region for this protein It is thought that it is secreted from that.

変異体タンパク質HSMUC1A_PEA_1_P63のグリコシレ−ション部位を、既知タンパク質のムチン1前駆体と比較する形で表28に示す(第一縦列に、アミノ酸配列上でのそれらの位置を示す;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示している;そして最後の縦列はその位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of the mutant protein HSMUC1A_PEA_1_P63 are shown in Table 28 in comparison with the known protein mucin 1 precursor (first column shows their position on the amino acid sequence; second column shows glycosylation The last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSMUC1A_PEA_1_P63は次の転写物にコ−ドされている:HSMUC1A_PEA_1_T47、この転写物の配列は本明細書の最後に示してある。転写物HSMUC1A_PEA_1_T47のコ−ディング部分は太字で表している:このコ−ディング部分は、位置507から始まり、位置761に終止する。転写物はまた、表29に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSMUC1A_PEA_1_P63配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSMUC1A_PEA_1_P63 is encoded in the following transcript: HSMUC1A_PEA_1_T47, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSMUC1A_PEA_1_T47 is shown in bold: this coding part starts at position 507 and ends at position 761. The transcript also has the following SNPs listed in Table 29 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSMUC1A_PEA_1_P63 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記したようにクラスタHSMUC1Aは22のセグメントを特徴とするが、これらは上表2に掲載され、またその配列を本明細書の最後に示してある。これらセグメントは、特に関心の対象であることからここに別々に記載する核酸配列の部分である。次に本発明の各セグメントについて説明する。   As mentioned above, cluster HSMUC1A is characterized by 22 segments, which are listed in Table 2 above, and their sequences are given at the end of the specification. These segments are part of the nucleic acid sequence described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタHSMUC1A_PEA_1_node_0は31個のライブラリ−に裏付けされている。ライブラリ−の数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T36、HSMUC1A_PEA_1_T40、HSMUC1A_PEA_1_T42、HSMUC1A_PEA_1_T43、およびHSMUC1A_PEA_1_T47。下表30に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_0 of the present invention is supported by 31 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T35, HSMUC1A_PEA_1_T36, HSMUC1A_PEA_1_T40, HSMUC1A_PEA_1_T42, HSMUC1A_PEA_1_T43, and HSMUC1A_PEA_1_T47. Table 30 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_14は55個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12。下表31に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_14 of the present invention is supported by 55 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSMUC1A_PEA_1_T12. Table 31 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_24は135個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12。下表32に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_24 of the present invention is supported by 135 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSMUC1A_PEA_1_T12. Table 32 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_29は156個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T36、HSMUC1A_PEA_1_T40、HSMUC1A_PEA_1_T42、およびHSMUC1A_PEA_1_T43。下表33に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_29 of the present invention is supported by 156 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T35, HSMUC1A_PEA_1_T36, HSMUC1A_PEA_1_T40, HSMUC1A_PEA_1_T42, and HSMUC1A_PEA_1_T43. Table 33 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_35は51個のライブラリ−に裏付けされている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T47。下表34に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_35 of the present invention is supported by 51 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSMUC1A_PEA_1_T47. Table 34 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

このセグメントについては、次のようなマイクロアレイ(チップ)デ−タも在る。クラスタそのものに関して上記したように、様々なオリゴヌクレオチドについて、各種疾患状態、特に癌で発現に差があるか試験した。次のオリゴヌクレオチドが、表35に示すように、このセグメント(乳癌と関係する)をヒットすることが見出された。   The following microarray (chip) data is also present for this segment. As described above for the cluster itself, various oligonucleotides were tested for differences in expression in various disease states, particularly cancer. The following oligonucleotide was found to hit this segment (associated with breast cancer) as shown in Table 35.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_38は140個のライブラリ−に裏付けされている。ライブラリ−の数は、前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T36、HSMUC1A_PEA_1_T40、HSMUC1A_PEA_1_T42、HSMUC1A_PEA_1_T43、およびHSMUC1A_PEA_1_T47。下表36に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_38 of the present invention is supported by 140 libraries. The number of libraries was determined as described above. This segment can be found in the following transcript: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T35, HSMUC1A_PEA_1_T36, HSMUC1A_PEA_1_T40, HSMUC1A_PEA_1_T42, HSMUC1A_PEA_1_T43, and HSMUC1A_PEA_1_T47. Table 36 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明の好選態様によれば、上記クラスタに関係する短いセグメントも提供される。これらのセグメントは長さが約120bpまでであることから別に説明する。   According to the preferred embodiment of the present invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they will be described separately.

本発明のセグメントクラスタHSMUC1A_PEA_1_node_3は、17個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T40、およびHSMUC1A_PEA_1_T43。下表37に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_3 of the present invention is supported by 17 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T40, and HSMUC1A_PEA_1_T43. Table 37 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_4は次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T36、HSMUC1A_PEA_1_T40、HSMUC1A_PEA_1_T42、HSMUC1A_PEA_1_T43、およびHSMUC1A_PEA_1_T47。下表38に、各転写物でのこのセグメントの開始位置および終止位置を示す。   Segment cluster HSMUC1A_PEA_1_node_4 of the present invention can be found in the following transcript: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T35, HSMUC1A_PEA_1_T36, HSMUC1A_PEA_1_T40, HSMUC1A_PEA_1_T42, HSMUC1A_PEA_1_T43, and HSMUC1A_PEA_1_T47. Table 38 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_5は34個のライブラリ−に裏付けられている、ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T36、HSMUC1A_PEA_1_T40、HSMUC1A_PEA_1_T42、HSMUC1A_PEA_1_T43、およびHSMUC1A_PEA_1_T47。下表39に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_5 of the present invention is supported by 34 libraries, and the number of libraries was determined as described above. This segment can be found in the following transcript: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T35, HSMUC1A_PEA_1_T36, HSMUC1A_PEA_1_T40, HSMUC1A_PEA_1_T42, HSMUC1A_PEA_1_T43, and HSMUC1A_PEA_1_T47. Table 39 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_6は35個のライブラリ−に裏付けられている、ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T36、HSMUC1A_PEA_1_T40、HSMUC1A_PEA_1_T42、HSMUC1A_PEA_1_T43、およびHSMUC1A_PEA_1_T47。下表40に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_6 of the present invention is supported by 35 libraries, and the number of libraries was determined as described above. This segment can be found in the following transcript: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T35, HSMUC1A_PEA_1_T36, HSMUC1A_PEA_1_T40, HSMUC1A_PEA_1_T42, HSMUC1A_PEA_1_T43, and HSMUC1A_PEA_1_T47. Table 40 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_7は32個のライブラリ−に裏付けられている、ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T36、HSMUC1A_PEA_1_T40、HSMUC1A_PEA_1_T42、およびHSMUC1A_PEA_1_T43。下表42に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_7 of the present invention is supported by 32 libraries, and the number of libraries was determined as described above. This segment can be found in the following transcript: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T35, HSMUC1A_PEA_1_T36, HSMUC1A_PEA_1_T40, HSMUC1A_PEA_1_T42, and HSMUC1A_PEA_1_T43. Table 42 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_17は次の転写物に見出すことができる: HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T33およびHSMUC1A_PEA_1_T40。下表44に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_17 of the present invention can be found in the following transcripts: HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T33 and HSMUC1A_PEA_1_T40. Table 44 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_18は90個のライブラリ−に裏付けられている、ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T40、およびHSMUC1A_PEA_1_T42。下表45に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_18 of the present invention is supported by 90 libraries, and the number of libraries was determined as described above. This segment can be found in the following transcripts: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T33, HSMUC1A_T33, HSMUC1A_T33, HSMUC1A_T33, HSMUC1A_PE Table 45 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_20は次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T35、およびHSMUC1A_PEA_1_T42。下表46に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_20 of the present invention can be found in the following transcripts: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T35_A35 Table 46 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_21は97個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T35、およびHSMUC1A_PEA_1_T42。下表47に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_21 of the present invention is supported by 97 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T35, and HSMUC1A_PEA_1_T42. Table 47 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_23は次の転写物に見出すことができる:HSMUC1A_PEA_1_T12。下表48に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_23 of the present invention can be found in the following transcript: HSMUC1A_PEA_1_T12. Table 48 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_26は129個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、およびHSMUC1A_PEA_1_T31。下表49に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_26 of the present invention is supported by 129 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, and HSMUC1A_PEA_1_T31. Table 49 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_27は140個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、およびHSMUC1A_PEA_1_T36。下表50に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_27 of the present invention is supported by 140 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_T31, HSMUC1A_T31, HSMUC1A Table 50 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_31は次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T36、HSMUC1A_PEA_1_T40、HSMUC1A_PEA_1_T42、およびHSMUC1A_PEA_1_T43。下表51に、各転写物でのこのセグメントの開始位置および終止位置を示す。   Segment cluster HSMUC1A_PEA_1_node_31 of the present invention can be found in the following transcript: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T35, HSMUC1A_PEA_1_T36, HSMUC1A_PEA_1_T40, HSMUC1A_PEA_1_T42, and HSMUC1A_PEA_1_T43. Table 51 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_34は24個のライブラリ−に裏付けられている。ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T47。下表52に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_34 of the present invention is supported by 24 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSMUC1A_PEA_1_T47. Table 52 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_36は135個のライブラリ−に裏付けられている、ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T36、HSMUC1A_PEA_1_T40、HSMUC1A_PEA_1_T42、HSMUC1A_PEA_1_T43、およびHSMUC1A_PEA_1_T47。下表53に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_36 of the present invention is supported by 135 libraries, and the number of libraries was determined as described above. This segment can be found in the following transcript: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T35, HSMUC1A_PEA_1_T36, HSMUC1A_PEA_1_T40, HSMUC1A_PEA_1_T42, HSMUC1A_PEA_1_T43, and HSMUC1A_PEA_1_T47. Table 53 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSMUC1A_PEA_1_node_37は146個のライブラリ−に裏付けられている、ライブラリ−の数は前述のようにして決定した。このセグメントは次の転写物に見出すことができる:HSMUC1A_PEA_1_T12、HSMUC1A_PEA_1_T26、HSMUC1A_PEA_1_T28、HSMUC1A_PEA_1_T29、HSMUC1A_PEA_1_T30、HSMUC1A_PEA_1_T31、HSMUC1A_PEA_1_T33、HSMUC1A_PEA_1_T34、HSMUC1A_PEA_1_T35、HSMUC1A_PEA_1_T36、HSMUC1A_PEA_1_T40、HSMUC1A_PEA_1_T42、HSMUC1A_PEA_1_T43、およびHSMUC1A_PEA_1_T47。下表54に、各転写物でのこのセグメントの開始位置および終止位置を示す。   The segment cluster HSMUC1A_PEA_1_node_37 of the present invention is supported by 146 libraries, and the number of libraries was determined as described above. This segment can be found in the following transcript: HSMUC1A_PEA_1_T12, HSMUC1A_PEA_1_T26, HSMUC1A_PEA_1_T28, HSMUC1A_PEA_1_T29, HSMUC1A_PEA_1_T30, HSMUC1A_PEA_1_T31, HSMUC1A_PEA_1_T33, HSMUC1A_PEA_1_T34, HSMUC1A_PEA_1_T35, HSMUC1A_PEA_1_T36, HSMUC1A_PEA_1_T40, HSMUC1A_PEA_1_T42, HSMUC1A_PEA_1_T43, and HSMUC1A_PEA_1_T47. Table 54 below shows the start and end positions of this segment in each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:MUC1_HUMAN
配列文書:
アラインメント:HSMUC1A_PEA_1_P63 x MUC1_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:429.00
Escore:0
一致長:59 全長:59
一致パ−セント類似性:86.44 一致パ−セント同一性:81.36
全パ−セント類似性:86.44 全パ−セント同一性:81.36
ギャップ: 0
アラインメント:
. . . . .
1 MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVEEEVS 50
|||||||||||||||||||||||||||||||||||||||||||||
1 MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTE 50

51 ADQVSVGAS 59
: ||: :|
51 KNAVSMTSS 59
Alignment of mutant protein with known protein Sequence name: MUC1_HUMAN
Sequence document:
Alignment: HSMUC1A_PEA_1_P63 x MUC1_HUMAN ..
Alignment segment 1/1:
Quality: 429.00
Escore: 0
Match length: 59 Total length: 59
Match Percent Similarity: 86.44 Match Percent Identity: 81.36
Total percent similarity: 86.44 Total percent identity: 81.36
Gap: 0
alignment:
...
1 MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVEEEVS 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||-|||||||-|||||||-||||-|||||||-||||||-||||||||-
1 MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTE 50

51 ADQVSVGAS 59
: ||:: |
51 KNAVSMTSS 59

正常および癌乳房組織での8つの配列(T10888seg11−17、HUMGR5E junc3−7、HSSTROL3seg24、T94936 Seg 14、Z21368 seg39、Z21368 junc 17−21、T59832 junc6−25−26およびM85491 seg24)の組合せ発現
T10888seg11−17、HUMGR5E junc3−7、HSSTROL3seg24、T94936seg 14、Z21368 seg39、Z21368 junc 17−21、T59832 junc6−25−26およびM85491 seg24アンプリコン、ならびにT10888seg11−17F、T10888seg11−17R、HUMGR5E junc3−7F、HUMGR5E junc3−7R、HSSTROL3seg24F、HSSTROL3seg24R、T94936seg14F、T94936seg14R、Z21368 seg39F、Z21368 seg39R、Z21368junc17−21F、Z21368junc17−21R、T59832 junc6−25−26F、T59832 junc6−25−26R、M85491 seg24FおよびM85491 seg24Rプライマ−による、またはそれらに従った CEA6_HUMAN胎児性癌抗原関連細胞接着分子6前駆体、GRP_HUMAN−ガストリン放出ペプチド、ストロメリシン−3前駆体(EC 3.4.24.−)(マトリックスメタロプロテネ−ズ−11)(MMP−11)(ST−3)(SL−3)、ヒト乳癌膜タンパク質11(BCMP11)、SUL1_HUMAN、エフリンタイプBレセプタ−2前駆体(EC2.7.1.112)(チロシンプロテインキナ−ゼレセプタ−EPH−3およびガンマ−インタ−フェロン誘導リソゾ−ムチオ−ル還元酵素)(GILT)転写物の発現を、リアルタイムPCRによって測定した。同時に4種類のハウスキ−ピング遺伝子−PBGD(GenBankアクセッション番号BC019323;アンプリコン−PBGDアンプリコン)、HPRT1(GenBankアクセッション番号NM_000194;アンプリコン−HPRT1アンプリコン)、G6PD(GenBankアクセッション番号NM_000402;G6PDアンプリコン)およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン−SDHAアンプリコン)も同様に測定した。各RTサンプルについて、上記アンプリコンの発現を、ハウスキ−ピング遺伝子量の相乗平均について正規化した。次に正規化した各RTサンプルの値を正常剖検(PM)サンプル(上表1「試験パネルの組織サンプル」のサンプル番号56〜60、63〜67)の値の中央値で除し、正常PMサンプル中央値に対する、各サンプルのアップレギュレ−ション倍率を得た。
Combined expression of 8 sequences in normal and cancer breast tissue (T10888seg11-17, HUMGR5E junc3-7, HSSTROL3seg24, T94936 Seg 14, Z21368 seg39, Z21368 junc 17-21, T59832 junc6-25-26 and M85491 seg24)
T10888seg11-17, HUMGR5E junc3-7, HSSTROL3seg24, T94936seg 14, Z21368 seg39, Z21368 junc 17-21, T59832 junc6-25-26 and M85491 seg24 amplicons, as well as T10888seg11-17F, T10888seg11-17F, HUMGR7E junc3-7R, HSSTROL3seg24F, HSSTROL3seg24R, T94936seg14F, T94936seg14R, Z21368 seg39F, Z21368 seg39R, Z21368junc17-21F, Z21368junc17-21R, T59832 junc6-25R26F, T59832Meg24 According to them CEA6_HUMAN fetal cancer antigen-related cell adhesion molecule 6 precursor, GRP_HUMAN-gastrin releasing peptide, stromelysin-3 precursor (EC 3.4.24.-) (matrix metalloproteinases-11) (MMP-11 ) (ST-3) (SL-3), human breast cancer membrane protein 11 (BCMP11), SUL1_HUMAN, ephrin type B receptor-2 precursor (EC2.7.1.112) (tyrosine protein kinase receptor EPH-3 and Gamma - inter - interferon induction Risozo - Muchio - the expression of Le reductase) (GILT) transcripts was determined by real-time PCR. Simultaneously four types of housekeeping genes-PBGD (GenBank accession number BC019323; amplicon-PBGD amplicon), HPRT1 (GenBank accession number NM_000194; amplicon-HPRT1 amplicon), G6PD (GenBank accession number NM_000402; G6PD Amplicon) and SDHA (GenBank accession number NM_004168; amplicon-SDHA amplicon) were measured in the same manner. For each RT sample, the amplicon expression was normalized to the geometric mean of housekeeping gene dosage. Next, the value of each normalized RT sample is divided by the median value of normal autopsy (PM) samples (sample numbers 56-60, 63-67 in Table 1 “Tissue samples of the test panel” above) to obtain normal PM The up-regulation magnification of each sample relative to the median sample was obtained.

図44〜47は、様々な組合せでの、正常サンプルと比べた癌乳房サンプルにおける上記転写物の発現差を示すヒストグラムである。一番下に、少なくとも配列の一つについて、少なくとも5倍の差を示すサンプルの数および試験したサンプル総数に対するパ−センテ−ジを示した。   Figures 44-47 are histograms showing the differential expression of the transcript in cancer breast samples compared to normal samples in various combinations. At the bottom, for at least one of the sequences, the number of samples showing at least a 5-fold difference and the percentage of the total number of samples tested are shown.

図44〜47より明らかなように、全ての組合せにおいて、28癌腫中25に、少なくとも一つの配列について少なくとも5倍の発現差が見出された。   As is clear from FIGS. 44 to 47, in all combinations, an expression difference of at least 5-fold was found for at least one sequence in 25 of 28 carcinomas.

統計学的分析を用いて、以下記載するようにこれらの結果の優位性を検証した。少なくとも一つのアンプリコンについて5倍の発現差という閾値が、癌サンプルと正常サンプルを区別することが見出された。   Statistical analysis was used to verify the superiority of these results as described below. A threshold of 5 fold differential expression for at least one amplicon was found to distinguish between cancer and normal samples.

上記の値は、結果が統計学的に有意であることを証明した。   The above values proved that the results were statistically significant.

クラスタHSU33147の説明
クラスタHSU33147は、その名称を表1および2にそれぞれ示し、それらの配列を本明細書の最後に示す関心対象の2つの転写物と5つのセグメントを特徴とする。選択したタンパク質変異体を表3に示す。
Cluster HSU 33147 Description Cluster HSU 33147 is characterized by two transcripts of interest and five segments whose names are shown in Tables 1 and 2, respectively, and whose sequences are shown at the end of this specification. Selected protein variants are shown in Table 3.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

これら配列は、既知タンパク質であるマンマグロビン(Mammaglobin)A前駆体(SwissProtアクセッション識別子MGBA_HUMAN;同義語のマンマグロビン1;セクレトグロビン(Secretoglobin)ファミリ−2Aメンバ−2としても知られる)、配列番号:827であり、ここでは既知タンパク質と呼ぶ。   These sequences are the known protein Mammaglobin A precursor (SwissProt accession identifier MGBA_HUMAN; synonymous Mammaglobin 1; also known as Secretoglobin family-2A member-2), SEQ ID NO: 827, referred to herein as a known protein.

タンパク質のマンマグロビンA前駆体の配列は、本明細書の最後に「マンマグロビンA前駆体アミノ酸配列」として示してある。   The sequence of the protein mammaglobin A precursor is shown at the end of the specification as the “mammaglobin A precursor amino acid sequence”.

ヒトでの臨床/治療利用、例えば抗体もしくは低分子の標的、および/または直接的治療が研究されている;これらの研究に関して入手可能な情報は次の通りである。既知タンパク質の潜在的な薬学に関係する、または治療に関係する活性は次の通りである:免疫刺激剤。クラスタが表すタンパク質については、治療的な役割が予測されている。本クラスタは、薬物デ−タベ−スまたは公開デ−タベ−ス(例えば本明細書上記のもの)の中に、このタンパク質もしくはその一部が、潜在的な治療応用に用いられている、または使用できるという情報があることから、この分野に割り当てられた:抗癌。   Clinical / therapeutic uses in humans, such as antibodies or small molecule targets, and / or direct therapies are being studied; the information available on these studies is as follows: The potential pharmacological or therapeutic activity of known proteins is as follows: immunostimulants. A therapeutic role is predicted for the protein represented by the cluster. The cluster is a drug database or public database (eg, those described hereinabove) where the protein or part thereof is used for potential therapeutic applications, or Assigned to this field because there is information that it can be used: anti-cancer.

既知タンパク質には次のGO注釈付けが適用される。以下の注釈付けが見出されている;ステロイド結合、これは分子機能に関係する注釈付けである。   The following GO annotations apply to known proteins. The following annotations have been found; steroid binding, which is related to molecular function.

GO割り当ては、<http://www.expasy.ch/sprot/>から利用可能な一または複数のSwissProt/TremB1タンパク質情報ベ−ス、または<http://www.ncbi.nlm.nih.gov/projects/LocusLink/>から利用できるLocuslinkからの情報に基づいている。   GO assignment is based on one or more SwissProt / TremB1 protein information bases available from <http://www.expasy.ch/sprot/> or <http://www.ncbi.nlm.nih.gov Based on information from Locuslink available from / projects / LocusLink />.

クラスタHSU33147は、癌においてこのクラスタの転写物が過剰発現することから、診断マ−カ−として用いることができる。このような転写物の正常組織での発現もまた、前述した方法から得られる。表、左手縦列の項目「数」および図48のy軸の数値は、「百万分の一」の形で表された、各分類の重み付けされたEST発現である(百万分の一で表した、この分類の全ESTの発現に対する特定クラスタのEST発現の割合)。   Cluster HSU33147 can be used as a diagnostic marker because transcripts of this cluster are overexpressed in cancer. Expression of such transcripts in normal tissues can also be obtained from the method described above. The number of items in the table, left hand column “number” and the y-axis number in FIG. 48 is the weighted EST expression of each category expressed in the form of “parts per million” (in parts per million Expressed ratio of EST expression of a specific cluster to expression of all ESTs of this classification).

全体として、図48のヒストグラムおよび表4に関係して示すような、以下の結果を得た。このクラスタは、次の病的状態において過剰発現している(少なくとも最小レベルで);各種組織由来の混合型悪性腫瘍。   Overall, the following results were obtained as shown in relation to the histogram of FIG. 48 and Table 4. This cluster is overexpressed (at least at a minimal level) in the following pathological conditions: mixed malignant tumors from various tissues.

Figure 2007520217
Figure 2007520217

Figure 2007520217
Figure 2007520217

上記のように、クラスタHSU33147は、上表1に記載の2つの転写物を特徴とする。これら転写物は、タンパク質、マンマグロビンA前駆体の変異体であるタンパク質をコ−ドしている。次に、本発明の各変異体タンパク質について説明する。   As described above, cluster HSU 33147 is characterized by the two transcripts listed in Table 1 above. These transcripts code for proteins, proteins that are variants of the mammaglobin A precursor. Next, each mutant protein of the present invention will be described.

本発明の変異体タンパク質HSU33147_PEA_1_P5は、本明細書最後に示すアミノ酸配列を有する;それは転写物HSU33147_PEA_1_T1にコ−ドされている。本明細書の最後に、既知タンパク質(マンマグロビンA前駆体)に対するアラインメントを示す。これまでに公開された一または複数のタンパク質配列に対する一または複数のアラインメントを、本明細書の最後に示す。以下、本発明の変異体タンパク質と、このようなアラインメントを取ったタンパク質との関係について簡単に説明する:   The mutant protein HSU33147_PEA_1_P5 of the present invention has the amino acid sequence shown at the end of the specification; it is encoded in the transcript HSU33147_PEA_1_T1. At the end of the specification, an alignment to a known protein (mammaglobin A precursor) is shown. One or more alignments to one or more protein sequences published so far are shown at the end of the specification. Hereinafter, the relationship between the mutant protein of the present invention and such an aligned protein will be briefly described:

HSU33147_PEA_1_P5とMGBA_HUMANとの比較報告:
1.HSU33147_PEA_1_P5をコ−ドする単離されたキメラポリペプチドは、MGBA_HUMANのアミノ酸1〜78に相当し、またHSU33147_PEA_1_P5のアミノ酸1〜78にも相当するMKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFIDDNATTNAIDELKECFLNQTDETLSNVEに少なくとも90%相同である第一アミノ酸配列、およびMGBA_HUMANのアミノ酸82〜93に相当し、またHSU33147_PEA_1_P5のアミノ酸79〜90に相当するQLIYDSSLCDLFに対し少なくとも90%相同である第二アミノ酸配列とを含み、このとき前記第一アミノ酸配列および第二アミノ酸配列は連続して順番につながっている。
Comparison report between HSU33147_PEA_1_P5 and MGBA_HUMAN:
1.The isolated chimeric polypeptide that codes for HSU33147_PEA_1_P5 corresponds to amino acids 1 to 78 of MGBA_HUMAN and also corresponds to amino acids 1 to 78 of HSU33147_PEA_1_P5, which is at least the first amino acid sequence of the amino acid sequence HNA33ML_AALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFID DNA And a second amino acid sequence that is at least 90% homologous to QLIYDSSLCDLF corresponding to amino acids 82 to 93 of MGBA_HUMAN and corresponding to amino acids 79 to 90 of HSU33147_PEA_1_P5, wherein the first amino acid sequence and the second amino acid The array is connected sequentially.

2.HSU33147_PEA_1_P5の端部をコ−ドする単離されたポリペプチドは、長さ「n」のポリペプチドを含み、このときnは少なくとも約10アミノ酸長、要する場合には少なくとも約20アミノ酸長、このましくは少なくとも約30アミノ酸長、より好ましくは約40アミノ酸長、そして最も好ましくは約50アミノ酸長であり、少なくとも2つのアミノ酸がEQを含み、対の構造を有する:配列はアミノ酸番号78−x〜78のいずれかより開始する;そしてアミノ酸番号79+((n−2)−x)に終止し、このときxは0〜n−2で変化する。   2. An isolated polypeptide that codes for the end of HSU33147_PEA_1_P5 comprises a polypeptide of length `` n '', where n is at least about 10 amino acids long, if necessary, at least about 20 amino acids long, Preferably, it is at least about 30 amino acids long, more preferably about 40 amino acids long, and most preferably about 50 amino acids long, with at least two amino acids comprising EQ and having a paired structure: It starts from any of x to 78; and ends at amino acid number 79 + ((n−2) −x), where x varies from 0 to n−2.

変異体タンパク質の局在は、SignalPおよびその他専用プログラムでの分析を含む、複数の異なるソフトウエア−プログラムおよび分析からの結果に従って決定した。変異体タンパク質は、細胞に関して次のように局在すると考えられる:分泌。タンパク質の局在は、両方のシグナルペプチド予測プログラムが、このタンパク質がシグナルペプチドを有すると予測していること、およびいずれの膜貫通領域推測プログラムも、このタンパク質について膜貫通領域を有すると予測しなかったことから分泌されていると考えられている。   Mutant protein localization was determined according to results from several different software-programs and analyses, including analysis with SignalP and other specialized programs. Mutant proteins are thought to localize with respect to cells as follows: secretion. Protein localization indicates that both signal peptide prediction programs predict that this protein has a signal peptide, and that neither transmembrane region estimation program has a transmembrane region for this protein It is thought that it is secreted from that.

変異体タンパク質HSU33147_PEA_1_P5のグリコシレ−ション部位を、既知タンパク質のマンマルグロビンA前駆体と比較する形で表6に示す(第一縦列に、アミノ酸配列上でのそれらの位置を示す;第二縦列はグリコシレ−ション部位が変異体タンパク質に存在するかを示している;そして最後の縦列はその位置が変異体タンパク質で異なっているかを示している)。   The glycosylation sites of the mutant protein HSU33147_PEA_1_P5 are shown in Table 6 in comparison with the known protein mammaglobin A precursor (first column shows their position on the amino acid sequence; second column shows glycosylation) -Indicates whether the site is present in the mutant protein; and the last column indicates whether the position is different in the mutant protein).

Figure 2007520217
Figure 2007520217

変異体タンパク質HSU33147_PEA_1_P5は次の転写物にコ−ドされている:HSU33147_PEA_1_T1、この転写物の配列は本明細書の最後に示してある。転写物HSU33147_PEA_1_T1のコ−ディング部分は太字で表している:このコ−ディング部分は、位置72から始まり、位置341に終止する。転写物はまた、表7に掲載されている次のSNPも有している(それらのヌクレオチド配列上の位置に従って示され、次に変更核酸が記載されている;最後の縦列はSNPが知られているか否かを示している;変異体タンパクHSU33147_PEA_1_P5配列中の既知SNPの存在は、本発明のこの変異体タンパク質について導出された配列の裏付けとなる)。   The mutant protein HSU33147_PEA_1_P5 is encoded in the following transcript: HSU33147_PEA_1_T1, the sequence of this transcript is given at the end of the specification. The coding part of the transcript HSU33147_PEA_1_T1 is shown in bold: this coding part starts at position 72 and ends at position 341. The transcript also has the following SNPs listed in Table 7 (shown according to their nucleotide sequence position, then the modified nucleic acids are listed; the last column is the SNP known The presence of a known SNP in the mutant protein HSU33147_PEA_1_P5 sequence supports the sequence derived for this mutant protein of the present invention).

Figure 2007520217
Figure 2007520217

上記したように、クラスタHSU33147は上表2に掲載し、またその配列を本明細書の最後に示した5個のセグメントを特徴とする。これらセグメントは、特に関心の対象であることからここに別々に記載する核酸配列の部分である。次に本発明の各セグメントについて説明する。   As noted above, cluster HSU 33147 is listed in Table 2 above and is characterized by the five segments whose arrangement is shown at the end of this specification. These segments are part of the nucleic acid sequence described separately here because they are of particular interest. Next, each segment of the present invention will be described.

本発明のセグメントクラスタHSU33147_PEA_1_node_0は、38個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:HSU33147_PEA_1_T1およびHSU33147_PEA_1_T2。下表8に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster HSU33147_PEA_1_node_0 of the present invention is supported by 38 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSU33147_PEA_1_T1 and HSU33147_PEA_1_T2. Table 8 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSU33147_PEA_1_node_2は、44個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる:HSU33147_PEA_1_T1およびHSU33147_PEA_1_T2。下表9に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster HSU33147_PEA_1_node_2 of the present invention is supported by 44 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSU33147_PEA_1_T1 and HSU33147_PEA_1_T2. Table 9 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSU33147_PEA_1_node_4は、3つのライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる: HSU33147_PEA_1_T2。下表10に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster HSU33147_PEA_1_node_4 of the present invention is supported by three libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSU33147_PEA_1_T2. Table 10 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明のセグメントクラスタHSU33147_PEA_1_node_7は、35個のライブラリ−に裏付けられている。ライブラリ−の数は前述したようにして決定された。このセグメントは次の転写物に見出すことができる: HSU33147_PEA_1_T1。下表11に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster HSU33147_PEA_1_node_7 of the present invention is supported by 35 libraries. The number of libraries was determined as described above. This segment can be found in the following transcripts: HSU33147_PEA_1_T1. Table 11 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

本発明の好選態様によれば、上記クラスタに関係する短いセグメントも提供される。これらのセグメントは長さが約120bpまでであることから別に説明する。   According to the preferred embodiment of the present invention, a short segment related to the cluster is also provided. Since these segments are up to about 120 bp in length, they will be described separately.

本発明のセグメントクラスタHSU33147_PEA_1_node_3は次の転写物に見出すことができる: HSU33147_PEA_1_T2。下表12に各転写物上でのこのセグメントの開始位置と終止位置を示す。   The segment cluster HSU33147_PEA_1_node_3 of the present invention can be found in the following transcript: HSU33147_PEA_1_T2. Table 12 below shows the start and end positions of this segment on each transcript.

Figure 2007520217
Figure 2007520217

既知タンパク質との変異体タンパク質のアラインメント
配列名:MGBA_HUMAN
配列文書:
アラインメント:HSU33147_PEA_1_P5 x MGBA_HUMAN ..
アラインメントセグメント 1/1:
クオリティ−:776.00
Escore:0
一致長:90 全長:93
一致パ−セント類似性:100.00 一致パ−セント同一性:100.00
全パ−セント類似性:96.77 全パ−セント同一性:96.77
ギャップ: 1
アラインメント:
. . . . .
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
. . . .
51 DDNATTNAIDELKECFLNQTDETLSNVE...QLIYDSSLCDLF 90
|||||||||||||||||||||||||||| ||||||||||||
51 DDNATTNAIDELKECFLNQTDETLSNVEVFMQLIYDSSLCDLF 93
Alignment of mutant protein with known protein Sequence name: MGBA_HUMAN
Sequence document:
Alignment: HSU33147_PEA_1_P5 x MGBA_HUMAN ..
Alignment segment 1/1:
Quality-: 776.00
Escore: 0
Match length: 90 Total length: 93
Matched percent similarity: 100.00 Matched percent identity: 100.00
Total percent similarity: 96.77 Total percent identity: 96.77
Gap: 1
alignment:
...
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-||||||||-|||||-|||||||-|||||-||||||-||||||-|||||||-||||||-||||||-|||||||| be be
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
...
51 DDNATTNAIDELKECFLNQTDETLSNVE ... QLIYDSSLCDLF 90
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||-|||||||||||-||||||-||||||||-|||||||| be be not
51 DDNATTNAIDELKECFLNQTDETLSNVEVFMQLIYDSSLCDLF 93

本発明のスプライシング変異体の治療応用
本明細書に記載のスプライシング変異体(そのポリヌクレオチド、オリゴヌクレオチド、ポリペプチド、ペプチドもしくは断片を含む)またはそれに特異的に結合する抗体は治療応用、例えばその診断応用に関して本明細書に記載されている疾患を治療することに選択的に用いることもできる。「変異体により治療可能な」疾患とは、本発明の治療的タンパク質のいずれかのスプライシング変異体を用いることによって治療が可能である疾患を指す。「治療」は、疾患および/または病的状態の予防、改善、除去および制御も包含する。このような変異体が有用な治療薬となる疾患について、以下各変異体について詳しく記載する。変異体そのものは、これら変異体が既知タンパク質のスプライシング変異体であることから、「クラスタ」または遺伝子によって記載されている。かくして「クラスタ関連疾患」または「変異体関連疾患」とは、特定のタンパク質、以下記載の疾患の説明に関しては本発明の治療的タンパク質変異体、によって治療できるであろう疾患を指す。
Therapeutic applications of splicing variants of the invention Splicing variants described herein (including polynucleotides, oligonucleotides, polypeptides, peptides or fragments thereof) or antibodies that specifically bind thereto are therapeutic applications, such as diagnostics thereof. It can also be selectively used to treat the diseases described herein for application. A disease that can be treated by a variant refers to a disease that can be treated by using a splicing variant of any of the therapeutic proteins of the invention. “Treatment” also encompasses prevention, amelioration, elimination and control of the disease and / or pathological condition. Regarding the diseases for which such mutants are useful therapeutic agents, each mutant is described in detail below. Variants themselves are described by “clusters” or genes because these variants are splicing variants of known proteins. Thus, “cluster-related disease” or “mutant-related disease” refers to a disease that may be treated by a particular protein, the therapeutic protein variants of the present invention for the description of the disease described below.

用語「生物学的に活性」とは、本明細書で用いる場合は天然分子の構造、制御または生化学的機能を有するタンパク質を指す。同様に「免疫学的に活性」とは、適当な動物または細胞に特異的な免疫反応を誘導し、特異的抗体と結合できる天然、組換え体または合成のリガンドあるいはそのオリゴペプチドの能力を指す。   The term “biologically active” as used herein refers to a protein having the structure, control or biochemical function of a natural molecule. Similarly, “immunologically active” refers to the ability of a natural, recombinant or synthetic ligand or oligopeptide thereof to induce an immune response specific to an appropriate animal or cell and bind to a specific antibody. .

用語「変調」は、本明細書で用いる場合は少なくとも一つのレセプタ−介在活性の活性変化を指す。例えば、変調はタンパク質活性、結合特性、またはリガンドのその他生物学的、機能的もしくは免疫学的特性を増加または減少を引き起こせる。   The term “modulation” as used herein refers to a change in activity of at least one receptor-mediated activity. For example, modulation can cause an increase or decrease in protein activity, binding properties, or other biological, functional or immunological properties of the ligand.

治療方法
上記したように、本発明の新規治療タンパク質変異体およびそれに由来する組成物(即ちペプチド、オリゴヌクレオチド)は、クラスタ関連疾患の治療に用いることができる。
As described above, the novel therapeutic protein variants of the present invention and compositions derived therefrom (ie, peptides, oligonucleotides) can be used for the treatment of cluster-related diseases.

それゆえに、本発明の更なる局面によれば、被験者のクラスタ関連疾患を治療する方法が提供される。   Therefore, according to a further aspect of the present invention, a method for treating a cluster related disease in a subject is provided.

本発明の被験者は少なくとも一つのタイプの上記クラスタ関連疾患を持つ哺乳動物、このましくはヒトである。   The subject of the present invention is a mammal, preferably a human, having at least one type of the cluster-related disease.

上記したように、本発明の生物分子配列は、上記疾患を持つ被験者の治療に用いることができる。   As described above, the biomolecule sequence of the present invention can be used for the treatment of a subject having the above-mentioned diseases.

本発明の被験者は、上記疾患の少なくとも一つと診断されるか、または上記疾患の少なくとも一つに罹る素因がある哺乳動物、好ましくはヒトである。   The subject of the present invention is a mammal, preferably a human, diagnosed with at least one of the above diseases or predisposed to suffering from at least one of the above diseases.

本明細書で用いる場合、「治療(する)」とは、上記疾患の有害な影響を予防、治癒、逆行、減衰、緩和、最小化、抑制または抑止することを指す。   As used herein, “treating” refers to preventing, curing, retrograde, attenuating, mitigating, minimizing, suppressing, or suppressing the harmful effects of the disease.

本発明によれば、治療は被験者において、本発明のポリペプチドの少なくとも一つの発現を特異的にアップレギュレ−ションするか、またはダウンレギュレ−ションすることによって実行できる。   According to the present invention, treatment can be performed in a subject by specifically up-regulating or down-regulating the expression of at least one polypeptide of the present invention.

選択的には、アップレギュレ−ションは、本明細書に記載のように、少なくとも一つの本発明のポリペプチド(例えば組換え体または合成)またはその活性部分を被験者に投与することで実行することができる。しかしながら、大型のポリペプチドの生物利用度は分解率が高いこと、および透過率が低いことから比較的に小さくなる可能性があるため、ポリペプチドの投与は小型のペプチド断片(例えば約100アミノ酸)に制限することが好ましい。ポリペプチドまたはペプチドは、以下より詳細に述べる薬学的組成物として投与することもできる。   Optionally, up-regulation is performed by administering to a subject at least one polypeptide of the invention (eg, recombinant or synthetic) or an active portion thereof, as described herein. Can do. However, because the bioavailability of large polypeptides can be relatively small due to high degradation rates and low permeability, administration of polypeptides can result in small peptide fragments (eg, about 100 amino acids). It is preferable to limit to. The polypeptide or peptide can also be administered as a pharmaceutical composition as described in more detail below.

本発明の上記疾患の治療には、当技術分野公知の他の治療法を組み合わせてもよい(即ち併用治療)ことに気付くだろう。かくして本発明の作用物質を用いた悪性疾患の治療は、例えば放射線治療、抗体治療および/または化学療法と組み合わせることができる。   It will be noted that other treatments known in the art may be combined (ie, combination therapy) for the treatment of the above diseases of the present invention. Thus, treatment of malignant diseases using the agents of the present invention can be combined with, for example, radiation therapy, antibody therapy and / or chemotherapy.

これに替わって、もしくはこれに追加してアップレギュレ−ション法を、被験者中の少なくとも一つの本発明のポリペプチドまたはその活性部分の量(場合によっては発現)を特異的にアップレギュレ−ションすることで選択的に実行してもよい。   Alternatively or additionally, an up-regulation method can be used to specifically up-regulate the amount (optionally expressed) of at least one polypeptide of the invention or an active portion thereof in a subject. It may be selectively executed.

上記および以下の実施例の項に記載するように、本発明のこの局面の生物分子配列は、野生型の遺伝子産物の活性または発現の変化が疾患の発症もしくは進行に関係することが分かっている疾患の治療において、有益な治療手段として用いることができる。例えば、疾患が膜結合レセプタ−の過剰発現により起こる場合には、その可溶性の変異体を、リガンドを結合するレセプタ−と競合するアンタゴニストとして用い、それによってレセプタ−からのシグナル伝達を停止させることができる。   As described above and in the Examples section below, the biomolecular sequence of this aspect of the invention has been found that changes in the activity or expression of the wild-type gene product are associated with disease onset or progression. It can be used as a beneficial therapeutic tool in the treatment of diseases. For example, if the disease is caused by overexpression of a membrane-bound receptor, the soluble variant can be used as an antagonist that competes with the receptor that binds the ligand, thereby stopping signaling from the receptor. it can.

このような疾患の例を、以下実施例の項に列挙する。   Examples of such diseases are listed below in the Examples section.

本発明のポリペプチドはアゴニストの特性を持つこともできることを認識するだろう。これらには、リガンド(例えばIL−4)の安定性を高めること、タンパク質分解からの保護、およびリガンドの薬物動態特性を変更すること(即ちリガンドの半減期を延長しながら、そのクリアランスを短縮する)が挙げられる。このように、この局面の本発明の生物分子配列は、野生型遺伝子産物が好ましい役割を果たす、例えば糖尿病もしくは虚血例において血管の新生を高める状態もしくは疾患の治療に用いることができる。   It will be appreciated that the polypeptides of the invention can also have agonist properties. These include increasing the stability of the ligand (eg IL-4), protecting against proteolysis, and altering the pharmacokinetic properties of the ligand (ie shortening its clearance while extending the half-life of the ligand) ). Thus, the biomolecule sequence of the present invention of this aspect can be used for the treatment of a condition or disease in which the wild-type gene product plays a favorable role, for example, increases angiogenesis in diabetic or ischemic cases.

本発明の治療的タンパク質変異体の発現をアップレギュレ−ションすることは、上記のように真核生物細胞(例えば哺乳動物細胞)の中でコ−ディング配列が発現するよう設計された核酸発現構築物に連結された、少なくとも一つの本発明の外因性ポリヌクレオチド配列を投与することによって実行できる。外来性ポリヌクレオチドは、それに応じて、本発明の変異体またはその活性部分をコ−ドしているDNAまたはRNA配列となる。   Up-regulating the expression of therapeutic protein variants of the present invention is a nucleic acid expression construct designed to express coding sequences in eukaryotic cells (eg, mammalian cells) as described above. Can be carried out by administering at least one exogenous polynucleotide sequence of the invention linked to the. The exogenous polynucleotide accordingly becomes a DNA or RNA sequence encoding the variant of the invention or an active portion thereof.

核酸構築物は、以下記載する好適な投与形態(即ちin vivo遺伝子治療)を用いて個体に投与できることに気付くだろう。あるいは、核酸構築物は、必要に応じて適当な遺伝子送達ビ−クル/方法(トランスフェクション、トランスダクション、相同的組み換え等)を介して好適な細胞内および発現システムに導入し、次に修飾された細胞を培養して拡大してから個体に戻される(即ちex−vivo遺伝子治療)。核酸構築物は先に詳述した。   It will be appreciated that the nucleic acid construct can be administered to an individual using the preferred dosage form described below (ie, in vivo gene therapy). Alternatively, the nucleic acid construct is introduced into suitable intracellular and expression systems via appropriate gene delivery vehicles / methods (transfection, transduction, homologous recombination, etc.) as required and then modified. The cells are cultured and expanded before being returned to the individual (ie ex-vivo gene therapy). Nucleic acid constructs are detailed above.

本方法論はまた、被験者内での本発明の変異体の内因性発現を特異的にアップレギュレ−ションすることによっても実行できる。ある遺伝子の特定スプライシング変異体の内因性発現をアップレギュレ−ションする作用物質としては、関心対象のスプライシング部位に向かい、それによって遺伝子のスプライシングパタ−ンを変更するアンチセンスオリゴヌクレオチドが挙げられる。この方法は、2つのイソ型のBcl−x [Taylor (1999) Nat. Biotechnol. 17:1097−1100; and Mercatante (2001) J. Biol. Chem. 276:16411−16417]; IL−5R [Karras (2000) Mol. Pharmacol. 58:380−387];およびc−myc [Giles (1999) Antisense Acid Drug Dev. 9:213−220] の発現バランスをシフトするのに上手く用いられている。   The methodology can also be performed by specifically up-regulating endogenous expression of a variant of the invention in a subject. Agents that upregulate the endogenous expression of a particular splicing variant of a gene include antisense oligonucleotides that are directed to the splicing site of interest, thereby altering the splicing pattern of the gene. This method consists of two isoforms of Bcl-x [Taylor (1999) Nat. Biotechnol. 17: 1097-1100; and Mercatante (2001) J. Biol. Chem. 276: 16411-16417]; IL-5R [Karras (2000) Mol. Pharmacol. 58: 380-387]; and c-myc [Giles (1999) Antisense Acid Drug Dev. 9: 213-220] have been successfully used to shift the expression balance.

例えばインタ−ロイキン5とそのレセプタ−は造血の制御に重要な役割を果たしており、アレルギ−や喘息といった一部の炎症性疾患ではメディエイタの役割を果たしている。IL−5Rからは、エクソン9を含む(即ち長い型)または排除した(即ち短い型)の二種類の異なるスプライシングイソ型が作られている。長型は無傷の膜結合レセプタ−をコ−ドしているが、一方短型は分泌型の可溶性の非機能的レセプタ−をコ−ドしている。Karrasと共同研究者らは、エクソン9の領域に特異的な2'−O−MOE−オリゴヌクレオチドを用いて、野生型のレセプタ−の発現を有意に減少させ、また短い方のイソ型の発現を増加させることができた。本発明に従って使用できるオリゴヌクレオチドの設計および合成は以下、およびSazani and Kole (2003) Progress in Moleclular and Subcellular Biology 31:217−239に記載されている。   For example, interleukin 5 and its receptor play an important role in the control of hematopoiesis, and play a mediator role in some inflammatory diseases such as allergies and asthma. From IL-5R, two different splicing isoforms have been created that contain exon 9 (ie long form) or exclude (ie short form). The long form codes for an intact membrane-bound receptor, while the short form codes for a secreted, soluble, non-functional receptor. Karras and co-workers used 2′-O-MOE-oligonucleotide specific for the exon 9 region to significantly reduce the expression of the wild-type receptor and to express the shorter isoform. Could be increased. The design and synthesis of oligonucleotides that can be used in accordance with the present invention is described below and in Sazani and Kole (2003) Progress in Moleclular and Subcellular Biology 31: 217-239.

被験者における本発明のポリペプチドの発現のアップレギュレ−ションは、真核生物細胞(例えば哺乳動物細胞)でのコ−ディング配列の発現に合わせて設計された核酸発現構築物内に連結された、少なくとも一つの本発明の外因性ポリヌクレオチド配列(例えば、配列番号:3、7、11、15、19、23、27、31、35、39または43)を投与することにより実行できる。外来性ポリヌクレオチドは、それに応じて、本発明の変異体またはその活性部分をコ−ドしているDNAまたはRNA配列となる。   Upregulation of expression of a polypeptide of the invention in a subject is at least linked in a nucleic acid expression construct designed for expression of a coding sequence in a eukaryotic cell (eg, a mammalian cell). It can be carried out by administering one exogenous polynucleotide sequence of the invention (eg SEQ ID NO: 3, 7, 11, 15, 19, 23, 27, 31, 35, 39 or 43). The exogenous polynucleotide accordingly becomes a DNA or RNA sequence encoding the variant of the invention or an active portion thereof.

核酸構築物は、以下記載する好適な投与形態(即ちin vivo遺伝子治療)を用いて個体に投与できることに気付くだろう。あるいは、核酸構築物は、必要に応じて適当な遺伝子送達ビ−クル/方法(トランスフェクション、トランスダクション、相同的組み換え等)を介して好適な細胞内および発現システムに導入し、次に修飾された細胞を培養して拡大してから個体に戻される(即ちex−vivo遺伝子治療)。核酸構築物は先に詳述した。   It will be appreciated that the nucleic acid construct can be administered to an individual using the preferred dosage form described below (ie, in vivo gene therapy). Alternatively, the nucleic acid construct is introduced into suitable intracellular and expression systems via appropriate gene delivery vehicles / methods (transfection, transduction, homologous recombination, etc.) as required and then modified. The cells are cultured and expanded before being returned to the individual (ie ex-vivo gene therapy). Nucleic acid constructs are detailed above.

本発明の核酸構築物が利用するプロモ−タは、形質転換した具体的な細胞集団で活性であることが好ましい。細胞の型特異的、および/または組織特異的プロモ−タの例としては、肝臓特異的なもの[Pinkert et al., (1987) Genes Dev. 1:268−277]、リンパ細胞特異的プロモ−タ[Calame et al., (1988) Adv. Immunol. 43:235−275];特にはT細胞レセプタ− [Winoto et al., (1989) EMBO J. 8:729−733]および免疫グロブリン;[Banerji et al. (1983) Cell 33729−740]のプロモ−タ、神経繊維プロモ−タのようなニュ−ロン特異的プロモ−タ[Byrne et al. (1989) Proc. Natl. Acad. Sci. USA 86:5473−5477]、膵臓特異的プロモ−タ[Edlunch et al. (1985) Science 230:912−916]または乳精プロモ−タのような乳腺特異的プロモ−タ(米国特許第4,873,316号および欧州特許出願第EP264,166号)が挙げられる。   The promoter used by the nucleic acid construct of the present invention is preferably active in a specific transformed cell population. Examples of cell type-specific and / or tissue-specific promoters include liver-specific [Pinkert et al., (1987) Genes Dev. 1: 268-277], lymphocyte-specific promoters. [Calame et al., (1988) Adv. Immunol. 43: 235-275]; especially T cell receptors [Winoto et al., (1989) EMBO J. 8: 729-733] and immunoglobulins; [ Banerji et al. (1983) Cell 33729-740], neuron-specific promoters such as nerve fiber promoters [Byrne et al. (1989) Proc. Natl. Acad. Sci. USA 86: 5473-5477], pancreas-specific promoters [Edlunch et al. (1985) Science 230: 912-916] or mammary gland-specific promoters such as the milk-promoting promoter (US Pat. No. 4,873,316 and European patent application EP 264,166).

好適な構築物の例としては、これに限定されるものではないが、それぞれインビトロゲン社(Invitrogen Co.)(www.invitrogen.com)より市販されているpcDNA3、pcDNA3.1 (+/−)、pGL3, PzeoSV2 (+/−)、pDisplay、pEF/myc/cyto、pCMV/myc/cytoが挙げられる。レトロウイルスベクタ−およびパッケ−ジングシステムの例は、Retro−X vectors pLNCXおよびpLXSNを含むクロ−ンテック(Clontech)、San Diego、Califより販売されているものであり、これらは複数のクロ−ニング部位へのクロ−ニングを可能にし、トランス遺伝子はCMVプロモ−タから転写される。pBabeのようなMo−MuLV由来のベクタ−も挙げられるが、このベクタ−ではトランス遺伝子は5'LTRプロモ−タから転写される。   Examples of suitable constructs include, but are not limited to, pcDNA3, pcDNA3.1 (+/−), commercially available from Invitrogen Co. (www.invitrogen.com), respectively. Examples include pGL3, PzeoSV2 (+/−), pDisplay, pEF / myc / cyto, and pCMV / myc / cyto. Examples of retroviral vector and packaging systems are those sold by Clontech, San Diego, Calif, including Retro-X vectors pLNCX and pLXSN, which contain multiple cloning sites. The transgene is transcribed from the CMV promoter. A vector derived from Mo-MuLV, such as pBabe, can also be mentioned. In this vector, the transgene is transcribed from the 5 ′ LTR promoter.

現時点における好ましいin vivo核酸移入技術としては、アデノウイルス、レンチウイルス、単純ヘルペス1ウイルスもしくはアデノ関連ウイルス(AAV)および脂質ベ−スのシステムといったウイルスまたは非ウイルス構築物を用いたトランスフェクションが挙げられる。脂質を介した遺伝子の移入に有用な脂質は、例えばDOTMA、DOPEおよびDC−Chlo[Tonkinson et al., Cancer Investigation, 14(1): 54−65 (1996)]である。遺伝子治療での使用に最も好ましい構築物はウイルスであり、最も好ましくはアデノウイルス、AAV、レンチウイルスまたはレトロウイルスである。レトロウイルス構築物のようなウイルス性構築物は、少なくとも一つの転写プロモ−タ/エンハンサ−または遺伝子座画定要素、あるいは異なるスプライシング、核RNA移出、またはメッセンジャ−の翻訳後修飾のような別の手段によって遺伝子発現を制御する別の要素を含む。このようなベクタ−構築物は、それがウイルス構築物内に既に存在していない場合には、パッケ−ジングシグナル、ロングタ−ミナルリピ−ト(LTR)もしくはその一部分、ならびに用いるウイルスに合った正および負の鎖のプライマ−結合部位も含む。これに加えて、このような構築物は一般に、ペプチドを、それが納められている宿主細胞から分泌させるためのシグナル配列も含んでいる。好ましくは、この目的に関するシグナル配列は哺乳動物のシグナル配列または本発明のポリペプチド変異体のシグナル配列である。要する場合には、構築物はポリアデニル化を指示するシグナル、ならびに一または複数の制限部位および翻訳終止配列とを含んでよい。例示すると、このような構築物は、一般的には5'LTR、tRNA結合部位、パッケ−ジングシグナル、第二鎖DNA合成起点、および3'LTRまたはその一部分を含むだろう。カチオン性脂質、ポリリジンおよびデンドリマ−のような非ウイルス性のその他ベクタ−も用いることができる。   Presently preferred in vivo nucleic acid transfer techniques include transfection with viral or non-viral constructs such as adenovirus, lentivirus, herpes simplex 1 virus or adeno-associated virus (AAV) and lipid-based systems. Lipids useful for lipid-mediated gene transfer are, for example, DOTMA, DOPE, and DC-Chlo [Tonkinson et al., Cancer Investigation, 14 (1): 54-65 (1996)]. The most preferred construct for use in gene therapy is a virus, most preferably an adenovirus, AAV, lentivirus or retrovirus. Viral constructs, such as retroviral constructs, are genetically generated by at least one transcription promoter / enhancer or locus-defining element, or by alternative means such as differential splicing, nuclear RNA export, or messenger post-translational modification. Contains another element that controls expression. Such vector constructs are positive and negative for the packaging signal, long terminal repeat (LTR) or part thereof, and the virus used, if it is not already present in the viral construct. It also contains a chain primer-binding site. In addition, such constructs generally also contain a signal sequence for secretion of the peptide from the host cell in which it is housed. Preferably, the signal sequence for this purpose is a mammalian signal sequence or a signal sequence of a polypeptide variant of the invention. Where necessary, the construct may include a signal to direct polyadenylation, as well as one or more restriction sites and a translation termination sequence. To illustrate, such constructs will generally include a 5 ′ LTR, a tRNA binding site, a packaging signal, a second strand DNA synthesis origin, and a 3 ′ LTR or a portion thereof. Other non-viral vectors such as cationic lipids, polylysine and dendrimers can also be used.

本方法論は、被験者の本発明のスプライシング変異体の内因性発現を特異的にアップレギュレ−ションすることによっても実施できる。ある遺伝子の特定スプライシング変異体の内因性発現をアップレギュレ−ションするための作用物質としては、関心対象のスプライシング部位に向けられ、それによりその遺伝子のスプライシングパタ−ンを変えるアンチセンスオリゴヌクレオチドが挙げられる。この方法は、2つのイソ型のBcl−x [Taylor (1999) Nat. Biotechnol. 17:1097−1100; and Mercatante (2001) J. Biol. Chem. 276:16411−16417]; IL−5R [Karras (2000) Mol. Pharmacol. 58:380−387];およびc−myc [Giles (1999) Antisense Acid Drug Dev. 9:213−220] の発現バランスをシフトするのに上手く用いられている。   The methodology can also be performed by specifically upregulating the endogenous expression of the subject splicing variants of the subject. Agents for upregulating the endogenous expression of a particular splicing variant of a gene include antisense oligonucleotides that are directed to the splicing site of interest, thereby altering the splicing pattern of that gene. It is done. This method consists of two isoforms of Bcl-x [Taylor (1999) Nat. Biotechnol. 17: 1097-1100; and Mercatante (2001) J. Biol. Chem. 276: 16411-16417]; IL-5R [Karras (2000) Mol. Pharmacol. 58: 380-387]; and c-myc [Giles (1999) Antisense Acid Drug Dev. 9: 213-220] have been successfully used to shift the expression balance.

例えばインタ−ロイキン5とそのレセプタ−は造血の制御に重要な役割を果たしており、アレルギ−や喘息といった一部の炎症性疾患ではメディエイタの役割を果たしている。IL−5Rからは、エクソン9を含む(即ち長い型)または排除した(即ち短い型)の二種類の異なるスプライシングイソ型が作られている。長型は無傷の膜結合レセプタ−をコ−ドしているが、一方短型は分泌型の可溶性の非機能的レセプタ−をコ−ドしている。Karrasと共同研究者らは(上記)、エクソン9の領域に特異的な2'−O−MOE−オリゴヌクレオチドを用いて、野生型のレセプタ−の発現を有意に減少させ、また短い方のイソ型の発現を増加させることができた。本発明に従って使用できるオリゴヌクレオチドの設計および合成は以下、およびSazani and Kole (2003) Progress in Moleclular and Subcellular Biology 31:217−239に記載されている。   For example, interleukin 5 and its receptor play an important role in the control of hematopoiesis, and play a mediator role in some inflammatory diseases such as allergies and asthma. From IL-5R, two different splicing isoforms have been created that contain exon 9 (ie long form) or exclude (ie short form). The long form codes for an intact membrane-bound receptor, while the short form codes for a secreted, soluble, non-functional receptor. Karras and co-workers (above) use a 2′-O-MOE-oligonucleotide specific for the exon 9 region to significantly reduce the expression of the wild-type receptor and reduce the shorter isotype. The expression of the type could be increased. The design and synthesis of oligonucleotides that can be used in accordance with the present invention is described below and in Sazani and Kole (2003) Progress in Moleclular and Subcellular Biology 31: 217-239.

治療は、少なくとも一つの本発明のポリペプチド変異体の発現を特異的にダウンレギュレ−ションできる作用物質によって好ましく実行できる。   Treatment can preferably be performed with an agent capable of specifically down-regulating the expression of at least one polypeptide variant of the invention.

本発明の治療的タンパク質変異体の発現をダウンレギュレ−ションすることは、以下詳細に説明するようなオリゴヌクレオチド作用物質を用いて達成できる。   Down-regulating expression of therapeutic protein variants of the invention can be accomplished using oligonucleotide agents as described in detail below.

SiRNA分子−低分子干渉RNA(siRNA)分子を用いて、本発明の治療的タンパク質変異体の発現をダウンレギュレ−ションできる。RNA干渉は二段階のプロセスである。第一段階は初期段階と呼ばれ、投入dsRNAを21〜23ヌクレオチド(nt)の低分子干渉RNA(siRNA)に、好ましくはdsRNA特異的リボヌクレア−ゼのRNaseIIIファミリ−の一員であり、dsRNAをATP依存的な様式で加工(切断)するDicerの作用によって消化することが好ましい(直接、またはトランス遺伝子もしくはウイルスを介して導入する)。連続的な切断により、RNAは19〜21bpの、それぞれ2ヌクレオチドが3'でオ−バ−ハングしている二重鎖(siRNA)に分解される[Hutvagner and Zamore Curr. Opin. Genetics and Development 12:225−232 (2002); and Bernstein Nature 409:363−366 (2001)]。   SiRNA molecules—small interfering RNA (siRNA) molecules can be used to down-regulate the expression of therapeutic protein variants of the invention. RNA interference is a two-step process. The first stage, called the initial stage, is a member of the RNase III family of dsRNA-specific ribonucleases, the input dsRNA into 21-23 nucleotide (nt) small interfering RNA (siRNA) and preferably dsRNA into ATP Digestion is preferably carried out by the action of Dicer which processes (cuts) in a dependent manner (introduced directly or via a transgene or virus). By continuous cleavage, RNA is broken down into duplexes (siRNA) of 19-21 bp, each 2 nucleotides 3 'and overhang [Hutvagner and Zamore Curr. Opin. Genetics and Development 12 : 225−232 (2002); and Bernstein Nature 409: 363−366 (2001)].

エフェクタ−段階では、siRNA二重鎖はヌクレア−ゼ複合体に結合してRNA誘導サイレンシング複合体(RISC)を形成する。RISCの活性化には、siRNAに重鎖のATP依存型の巻戻しが必要である。次に活性化RISCは塩基対合相互作用により相同的な転写物を標的とし、mRNAをsiRNAの3'末端から12ヌクレオチドの断片に切断するHutvagner and Zamore Curr. Opin. Genetics and Development 12:225−232 (2002);Hammond et al. (2001) Nat. Rev. Gen. 2:110−119 (2001);およびSharp Genes. Dev. 15:485−90 (2001)]。切断のメカニズムはまだ推測の域であるが、研究からはそれぞれのRISCが単一のsiRNAおよびRNaseを含んでいることが示されている[Hutvagner and Zamore Curr. Opin. Genetics and Development 12:225−232 (2002)]。   At the effector stage, siRNA duplexes bind to the nuclease complex to form an RNA-induced silencing complex (RISC). Activation of RISC requires ATP-dependent unwinding of the heavy chain in the siRNA. Next, activated RISC targets homologous transcripts by base-pairing interactions and cleaves mRNA into 12 nucleotide fragments from the 3 ′ end of siRNA. Hutvagner and Zamore Curr. Opin. Genetics and Development 12: 225− 232 (2002); Hammond et al. (2001) Nat. Rev. Gen. 2: 110-119 (2001); and Sharp Genes. Dev. 15: 485-90 (2001)]. The mechanism of cleavage is still speculative, but studies have shown that each RISC contains a single siRNA and RNase [Hutvagner and Zamore Curr. Opin. Genetics and Development 12: 225− 232 (2002)].

RNAiの持つ注目すべき能力から、RNAi経路内の増幅段階が示唆されている。増幅は、投入dsRNAをコピ−することによって、または形成されたsiRNAを複製することによって起こすことができる。これに替わってか、またはこれに加えて増幅は、RISCを複数回繰り返すことによっても実行できる[Hammond et al. Nat. Rev. Gen. 2:110−119 (2001), Sharp Genes. Dev. 15:485−90 (2001);Hutvagner and Zamore Curr. Opin. Genetics and Development 12:225−232 (2002)]。RNAiに関する更なる情報については、次のレビュ−Tuschl ChemBiochem. 2:239−245 (2001); Cullen Nat. Immunol. 3:597−599 (2002); and Brantl Biochem. Biophys. Act. 1575:15−25 (2002)を見よ。   The remarkable ability of RNAi suggests an amplification step within the RNAi pathway. Amplification can take place by copying the input dsRNA or by replicating the siRNA formed. Alternatively, or in addition, amplification can be performed by repeating RISC multiple times [Hammond et al. Nat. Rev. Gen. 2: 110-119 (2001), Sharp Genes. Dev. 15 : 485-90 (2001); Hutvagner and Zamore Curr. Opin. Genetics and Development 12: 225-232 (2002)]. For further information on RNAi, see the following review-Tuschl ChemBiochem. 2: 239-245 (2001); Cullen Nat. Immunol. 3: 597-599 (2002); and Brantl Biochem. Biophys. Act. 1575: 15- See 25 (2002).

本発明での使用に適したRNAi分子の合成は、次のようにして実行できる。まずmRNA配列をAUG開始から下流方向にAAジヌクレオチド配列を捜しスキャニングする。見つかったAAおよび3'側に隣接する19ヌクレオチドをそれぞれsiRNA標的部位の候補として記録する。非翻訳領域(UTR)は制御タンパク質結合部位が多いことから、siRNA標的部位はオ−プンリ−ディングフレ−ムから選択することが好ましい。UTR−結合タンパク質および/または翻訳開始複合体は、siRNAエンドヌクレア−ゼ複合体の結合を妨害する[Tuschl ChemBiochem. 2:239−245]。5'UTRに対するsiRNAの仲介により細胞GAPDHのmRNAを約90%減少させ、タンパク質レベルを完全にゼロにしたことでGAPDHについて証明されているように、非翻訳領域を対象とするsiRNAもまた有効である(www.ambion.com/techlib/tn/91/912.html)ことが分かるだろう。   Synthesis of RNAi molecules suitable for use in the present invention can be performed as follows. First, the mRNA sequence is scanned for AA dinucleotide sequences in the downstream direction from the start of AUG. The AA found and the 19 ′ adjacent 19 nucleotides are each recorded as a candidate siRNA target site. Since the untranslated region (UTR) has many regulatory protein binding sites, the siRNA target site is preferably selected from open reading frames. UTR-binding proteins and / or translation initiation complexes interfere with the binding of siRNA endonuclease complexes [Tuschl ChemBiochem. 2: 239-245]. SiRNA targeting untranslated regions is also effective, as has been demonstrated for GAPDH by reducing cellular GAPDH mRNA by approximately 90% by mediating siRNA to the 5 'UTR and completely reducing protein levels to zero. You can see (www.ambion.com/techlib/tn/91/912.html).

第二に潜在的標的部位を、NCBIサ−バ−(www.ncbi.nlm.nih.gov/BLAST/)から入手できるBLASTソフトウエアのようなシ−ケンスアラインメントソフトウエアを用いて、適当なゲノムデ−タベ−スと比較する。他のコ−ディング配列と有意な相同性を示す推定標的部位を排除する。   Secondly, the potential target sites can be identified using appropriate sequence data such as BLAST software available from the NCBI server (www.ncbi.nlm.nih.gov/BLAST/). -Compare with the base. Eliminate putative target sites that show significant homology with other coding sequences.

適格性が確認された標的配列は、siRNA合成のための鋳型として選択される。好ましい配列はG/C含有量が低いものであるが、それはそのような配列がG/C含有量が55%を超える配列に比べて遺伝子サイレンシングにとってより効果的であることが証明されているからである。評価する場合は、標的遺伝子全体から複数の標的部位を選択するのが好ましい。標的部位は、本発明の各ポリヌクレオチドの固有ヌクレオチド配列から選出し、各ポリヌクレオチドが特異的にダウンレギュレ−ションされるようにする。選出したRNAをより正しく評価するために、陰性コントロ−ルを併用することが好ましい。陰性コントロ−ルのsiRNAは、siRNAと同一のヌクレオチド組成を含むが、ゲノムに対して有意な相同性を持たないものが好ましい。このようにして集められたsiRNAのヌクレオチド配列は、他の遺伝子に対し有意な相同性を示さない場合に好ましく用いられる。   The qualified target sequence is selected as a template for siRNA synthesis. Preferred sequences have low G / C content, but it has proven that such sequences are more effective for gene silencing than sequences with G / C content greater than 55% Because. When evaluating, it is preferable to select a plurality of target sites from the entire target gene. The target site is selected from the unique nucleotide sequence of each polynucleotide of the present invention so that each polynucleotide is specifically down-regulated. In order to evaluate selected RNA more correctly, it is preferable to use a negative control in combination. The negative control siRNA preferably contains the same nucleotide composition as the siRNA but does not have significant homology to the genome. The nucleotide sequence of siRNA collected in this way is preferably used when it does not show significant homology to other genes.

DNAzyme分子−本発明のポリペプチドの発現をダウンレギュレ−ションできる別の作用物質は、本発明のポリヌクレオチドのmRNA転写物またはDNA配列を特異的に切断できるDNAzyme分子である。DNAzymeは、単鎖または二本鎖の標的配列を切断できる単鎖のポリヌクレオチドである(Breaker, R.R. and Joyce, G. Chemistry and Biology 1995;2:655; Santoro, S.W. & Joyce, G.F. Proc. Natl, Acad. Sci. USA 1997;943:4262)。DNAzymeの一般的モデル("10−23"モデル)が提案されている。"10−23"DNAzymeは15デオキシリボヌクレオチドの触媒ドメインと、その横に連結した2つの、それぞれが7〜9デオキシリボヌクレオチドである基質認識ドメインを有する。このタイプのDNAzymeはその基質のRNAをプリン:ピリミジン結合で効果的に切断できる(Santoro, S.W. & Joyce, G.F. Proc. Natl, Acad. Sci. USA 199; for rev of DNAzymes see Khachigian, LM [Curr Opin Mol Ther 4:119−21 (2002)]。   DNAzyme molecule—Another agent capable of down-regulating the expression of a polypeptide of the invention is a DNAzyme molecule capable of specifically cleaving an mRNA transcript or DNA sequence of a polynucleotide of the invention. A DNAzyme is a single-stranded polynucleotide capable of cleaving a single-stranded or double-stranded target sequence (Breaker, RR and Joyce, G. Chemistry and Biology 1995; 2: 655; Santoro, SW & Joyce, GF Proc. Natl , Acad. Sci. USA 1997; 943: 4262). A general model of DNAzyme ("10-23" model) has been proposed. The “10-23” DNAzyme has a catalytic domain of 15 deoxyribonucleotides and two substrate-recognition domains that are linked side by side, each of which is 7-9 deoxyribonucleotides. This type of DNAzyme can effectively cleave its substrate RNA with purine: pyrimidine bonds (Santoro, SW & Joyce, GF Proc. Natl, Acad. Sci. USA 199; for rev of DNAzymes see Khachigian, LM [Curr Opin Mol Ther 4: 119-21 (2002)].

DNAzymeの標的部位は、各ポリヌクレオチドが特異的にダウンレギュレ−ションされるように本発明の各ポリヌクレオチドの固有ヌクレオチド配列から選択される。   The target site of the DNAzyme is selected from the unique nucleotide sequence of each polynucleotide of the present invention such that each polynucleotide is specifically downregulated.

単鎖および二本鎖の標的切断部位を認識する、合成的に作られたDNAzymeの構築および増幅の例はJoyceらに付与された米国特許第6,326,174号に開示されている。最近、ヒトウロキナ−ゼレセプタ−に対し同様に設計されたDNAzymeが、ウロキナ−ゼレセプタ−の発現を阻害すること、そしてin vivoにおいて結腸癌細胞の転移を上手く阻害することが観察されている(Itoh et al , 20002, Abstract 409, Ann Meeting Am Soc Gen Ther www.asgt.org)。別の応用では、bcr−abl癌遺伝子に対し相補的なDNAzymeは、白血病細胞での癌遺伝子の発現を上手く阻害し、またCMLやALLの骨髄自己移植での再発率を下げることに成功している。   An example of the construction and amplification of synthetically produced DNAzymes that recognize single and double stranded target cleavage sites is disclosed in US Pat. No. 6,326,174 to Joyce et al. Recently, a similarly designed DNAzyme for human urokinase receptor has been observed to inhibit urokinase receptor expression and successfully inhibit colon cancer cell metastasis in vivo (Itoh et al. 2000, Abstract 409, Ann Meeting Am Soc Gen Ther www.asgt.org). In another application, a DNAzyme complementary to the bcr-abl oncogene has successfully inhibited oncogene expression in leukemia cells and has successfully reduced the recurrence rate of bone marrow autologous CML and ALL. Yes.

アンチセンス分子−本発明のポリヌクレオチドのダウンレギュレ−ションは、本発明のポリペプチド変異体をコ−ドするmRNA転写物と特異的にハイブリダイゼ−ションできるアンチセンスポリヌクレオチドを用いることでも実行できる。   Antisense molecules—Down-regulation of the polynucleotides of the invention can also be accomplished by using antisense polynucleotides that can specifically hybridize with mRNA transcripts encoding the polypeptide variants of the invention.

用語「アンチセンス」は、本明細書で使用する場合、特異的DNAまたはRNA配列に相補的であるヌクレオチド配列を含有する組成物を指す。   The term “antisense” as used herein refers to a composition containing a nucleotide sequence that is complementary to a specific DNA or RNA sequence.

用語「アンチセンス鎖」は、「センス」鎖に相補的である核酸鎖を指すのに用いられる。アンチセンス分子はペプチド核酸も包含し、合成または転写を含む方法により生成できる。一度細胞内に導入されると、相補的ヌクレオチドは細胞が作った天然の配列と結合して二本鎖を形成し、転写または翻訳を阻止する。「負」は、アンチセンス鎖を表すときに用いられることがあり、そして「正」は、センス鎖を表すのに用いられることがある。アンチセンスオリゴヌクレオチドはまた、別スプライシングをin vivoで変更するために、そしてin vivoおよびin vitroでの診断のためにも用いられる(Khelifi C. et al., 2002, Current Pharmaceutical Design 8:451−1466; Sazani, P., and Kole. R. Progress in Molecular and Cellular Biology, 2003, 31:217−239)。   The term “antisense strand” is used to refer to a nucleic acid strand that is complementary to the “sense” strand. Antisense molecules also include peptide nucleic acids and can be generated by methods that involve synthesis or transcription. Once introduced into the cell, the complementary nucleotide combines with the natural sequence made by the cell to form a duplex, blocking transcription or translation. “Negative” may be used to represent the antisense strand, and “positive” may be used to represent the sense strand. Antisense oligonucleotides are also used to alter alternative splicing in vivo and for in vivo and in vitro diagnostics (Khelifi C. et al., 2002, Current Pharmaceutical Design 8: 451- 1466; Sazani, P., and Kole. R. Progress in Molecular and Cellular Biology, 2003, 31: 217-239).

本発明のポリペプチドの発現を功利的にダウンレギュレ−ションするのに用いることができるアンチセンス分子の設計は、アンチセンス法にとって重要な二つの局面を考慮しながら実行しなければならない。第一の局面は、適当な細胞の細胞質内へオリゴヌクレオチドを送達することであり、一方第二の局面は、オリゴヌクレオチドを、細胞内において指定されたmRNAに特異的に結合してその翻訳を阻害するように設計することである。   The design of antisense molecules that can be used to effectively down-regulate the expression of the polypeptides of the invention must be carried out in consideration of two aspects that are important for antisense methods. The first aspect is to deliver the oligonucleotide into the cytoplasm of the appropriate cell, while the second aspect specifically binds the oligonucleotide to the designated mRNA in the cell and translates it. It is designed to inhibit.

従来技術は、これを用いて多様なタイプの細胞内にオリゴヌクレオチドを効率的に送達できる様々な送達方法を教示している[例えばLuft J Mol Med 76: 75−6 (1998); Kronenwett et al. Blood 91: 852−62 (1998); Rajur et al. Bioconjug Chem 8: 935−40 (1997); Lavigne et al. Biochem Biophys Res Commun 237: 566−71 (1997) and Aoki et al. (1997) Biochem Biophys Res Commun 231: 540−5 (1997)を見よ]。   The prior art teaches various delivery methods that can be used to efficiently deliver oligonucleotides into various types of cells [eg, Luft J Mol Med 76: 75-6 (1998); Kronenwett et al Blood 91: 852-62 (1998); Rajur et al. Bioconjug Chem 8: 935-40 (1997); Lavigne et al. Biochem Biophys Res Commun 237: 566-71 (1997) and Aoki et al. (1997) See Biochem Biophys Res Commun 231: 540-5 (1997)].

これに加えて、標的mRNAに対し最も高い推定結合親和性を持った配列を、標的mRNAとオリゴヌクレオチド両方の構造変化のエネルギ−を表す熱力学サイクルに基づいて同定するためのアルゴリズムも利用できる[例えばWalton et al. Biotechnol Bioeng 65: 1−9 (1999)を見よ]。   In addition, an algorithm is also available to identify the sequence with the highest estimated binding affinity for the target mRNA based on a thermodynamic cycle that represents the energy of structural changes in both the target mRNA and the oligonucleotide [ See, for example, Walton et al. Biotechnol Bioeng 65: 1-9 (1999)].

このようなアルゴリズムは、細胞内でのアンチセンス法の実施に上手く用いられている。例えば、Waltonらが開発したアルゴリズムによって科学者らはウサギのベ−タグロビン(RBG)およびマウス腫瘍壊死因子アルファ(TNFアルファ)転写物に対するアンチセンスオリゴヌクレオチドの設計に成功している。最近同じ研究グル−プは、三種類のモデル標的mRNA(ヒト乳酸脱水素酵素AおよびB、ならびにラットgp130)について合理的に選択したオリゴヌクレオチドの細胞内でのアンチセンス活性を、動的PCR技術により評価して、ホスホジエステルおよびホスホロチオエ−トオリゴヌクレオチド化学を用いて二種類のタイプの細胞について三種類の標的を試験した場合を含む、殆ど全ての例で効果的であることを証明した。   Such an algorithm has been successfully used to perform antisense methods in cells. For example, the algorithm developed by Walton et al. Has allowed scientists to successfully design antisense oligonucleotides for rabbit beta-tagrobin (RBG) and mouse tumor necrosis factor alpha (TNF alpha) transcripts. Recently, the same group of studies demonstrated the intracellular antisense activity of rationally selected oligonucleotides for three model target mRNAs (human lactate dehydrogenase A and B, and rat gp130). And proved to be effective in almost all cases, including when phosphodiester and phosphorothioate oligonucleotide chemistry were used to test three types of targets on two types of cells.

これに加えて、in vitroシステムを用いた、特異的オリゴヌクレオチドを設計し、その効率を推測するための方法がいくつか発表されている(Matveeva et al., Nature Biotechnology 16: 1374 − 1375 (1998)]。   In addition, several methods have been published for designing specific oligonucleotides and estimating their efficiency using in vitro systems (Matveeva et al., Nature Biotechnology 16: 1374-1375 (1998). )].

いくつかの臨床試験が、アンチセンスオリゴヌクレオチドの安全性、実行可能性および活性を証明している。例えば、癌の治療に適したアンチセンスオリゴヌクレオチドは用いられ成功を収めており[Holmund et al., Curr Opin Mol Ther 1:372−85 (1999)]、またc−mby遺伝子、p53およびBcl−2を標的とするアンチセンスオリゴヌクレオチドを用いた造血性悪性疾患の治療は臨床試験に入っており、患者に受け入れられていることが示されている[Gerwitz Curr Opin Mol Ther 1:297−306 (1999)]。   Several clinical trials have demonstrated the safety, feasibility and activity of antisense oligonucleotides. For example, antisense oligonucleotides suitable for the treatment of cancer have been used successfully [Holmund et al., Curr Opin Mol Ther 1: 372-85 (1999)], and the c-mby gene, p53 and Bcl- Treatment of hematopoietic malignancies with antisense oligonucleotides targeting 2 has entered clinical trials and has been shown to be accepted by patients [Gerwitz Curr Opin Mol Ther 1: 297-306 ( 1999)].

ごく最近、アンチセンスを介したヒトヘパラナ−ゼ遺伝子の発現抑制により、マウスモデルにおいてヒト癌細胞の胸膜播種が阻害されたと報告されている[Uno et al., Cancer Res 61:7855−60 (2001)]。   Most recently, suppression of human heparanase gene expression via antisense has been reported to inhibit pleural dissemination of human cancer cells in a mouse model [Uno et al., Cancer Res 61: 7855-60 (2001). ].

かくして、アンチセンス技術分野の最近の進歩は、上記したように極めて正確なアンチセンス設計アルゴリズムと様々なオリゴヌクレオチド送達システムの創造をもたらし、これにより当業者は過度の試行錯誤的実験を行うこと無しに既知配列の発現をダウンレギュレ−ションするのに適したアンチセンス法を設計し、実行することができるようになったというのが、現在の共通認識である。   Thus, recent advances in the antisense technology field have resulted in the creation of highly accurate antisense design algorithms and various oligonucleotide delivery systems, as described above, so that those of ordinary skill in the art can avoid undue trial and error experiments. It is now common knowledge that antisense methods suitable for down-regulating the expression of known sequences can now be designed and implemented.

アンチセンス分子の標的部位は、本発明の各ポリヌクレオチドの固有なヌクレオチド配列から、各ポリヌクレオチドが特異的にダウンレギュレ−ションされるように選択される。   The target site of the antisense molecule is selected from the unique nucleotide sequence of each polynucleotide of the invention such that each polynucleotide is specifically down-regulated.

リボザイム−本発明のポリペプチドの発現をダウンレギュレ−ションできる別の作用物質は、本発明のポリペプチド変異体をコ−ドしているmRNA転写物を特異的に切断できるリボザイム分子である。リボザイムは関心対象のタンパク質をコ−ドしているmRBAの切断によって、遺伝子発現を配列特異的に阻害するためにますます用いられるようになっている[Welch et al., Curr Opin Biotechnol. 9:486−96 (1998)]。特定の標的RNAを切断するリボザイムを設計できれば、それらは基礎研究および治療応用の両方で価値ある手段となる。治療分野においては、リボザイムは、感染症でのウイルスRNA、癌における主要癌遺伝子、および遺伝性疾患での特異的な体細胞変異を標的として開発が進められている[Welch et al., Clin Diagn Virol. 10:163−71 (1998)]。特に注目すべきは、HIV患者を対象とした、複数のリボザイム遺伝子治療プロトコ−ルが既に第1相試験に入っている。ごく最近、リボザイムはトランスジェニック動物の研究、遺伝子標的の妥当性確認、および経路の予測に用いられている。複数のリボザイムが様々な段階の臨床試験にかけられている。ANGIOZYMEはヒトの臨床試験に合わせて最初に化学的に合成されたリボザイムである。ANGIOZYMEは、血管形成経路の重要構成要素であるVEGF−r(血管内皮成長因子レセプタ−)の形成を特異的に阻害する。Ribozyme Pharmaceuticals, Inc.ならびにその他の企業が、動物モデルにおける抗血管形成治療の重要性を証明している。HEPTAZYMEは、C型肝炎ウイルス(HCV)RNAを選択的に破壊するように設計されたリボザイムであり、細胞培養アッセイにおいてC型肝炎ウイルスのRNAを減少させることが見出されている(Ribozyme Pharmaceuticals, Incorporated − WEBホ−ムペ−ジ)。   Ribozymes—Another agent that can down-regulate the expression of a polypeptide of the invention is a ribozyme molecule that can specifically cleave an mRNA transcript encoding a polypeptide variant of the invention. Ribozymes are increasingly being used to sequence-specifically inhibit gene expression by cleaving the mRBA encoding the protein of interest [Welch et al., Curr Opin Biotechnol. 9: 486-96 (1998)]. If ribozymes that cleave specific target RNAs can be designed, they will be valuable tools in both basic research and therapeutic applications. In the therapeutic field, ribozymes are being developed to target viral RNAs in infectious diseases, major oncogenes in cancer, and specific somatic mutations in genetic disorders [Welch et al., Clin Diagn Virol. 10: 163-71 (1998)]. Of particular note, several ribozyme gene therapy protocols for HIV patients are already in Phase I trials. Most recently, ribozymes have been used to study transgenic animals, validate gene targets, and predict pathways. Several ribozymes are undergoing clinical trials at various stages. ANGIOZYME is the first chemically synthesized ribozyme for human clinical trials. ANGIOZYME specifically inhibits the formation of VEGF-r (vascular endothelial growth factor receptor), an important component of the angiogenic pathway. Ribozyme Pharmaceuticals, Inc. and other companies have demonstrated the importance of anti-angiogenic therapy in animal models. HEPTAZYME is a ribozyme designed to selectively destroy hepatitis C virus (HCV) RNA and has been found to reduce hepatitis C virus RNA in cell culture assays (Ribozyme Pharmaceuticals, Incorporated-WEB homepage).

または、本発明のポリペプチド変異体のダウンレギュレ−ションは、本発明のポリペプチドに特異的に結合し、その活性を阻害できる抗体(即ち中和抗体)のようなダウンレギュレ−ション作用物質を用いることで、ポリペプチドのレベルで達成できる。このような抗体はあ、例えば変異体上のヘテロダイマ−形成ドメイン、または推定リガンド結合ドメインに対するものでよい。抗体および抗体を作製する方法について、以下詳しく説明する。   Alternatively, down-regulation of a polypeptide variant of the invention may involve down-regulation agents such as antibodies that specifically bind to and inhibit the activity of the polypeptide of the invention (ie neutralizing antibodies). Use can be achieved at the polypeptide level. Such an antibody may be directed against, for example, a heterodimer-forming domain on a variant, or a putative ligand binding domain. The antibody and the method for producing the antibody will be described in detail below.

薬学的組成物およびその送達
本発明は、治療有効量の、本明細書に記載の治療的タンパク質変異体であることが好ましい本発明の治療薬を含む薬学的組成物を特徴とする。要する場合、およびこれに代わって治療薬は、治療的タンパク質変異体を特異的に認識して結合するが、対応する完全長の既知タンパク質には結合しない抗体またはオリゴヌクレオチドでもよい。
Pharmaceutical Compositions and their Delivery The invention features a pharmaceutical composition comprising a therapeutically effective amount of a therapeutic agent of the invention, preferably a therapeutic protein variant as described herein. If required, and alternatively, the therapeutic agent may be an antibody or oligonucleotide that specifically recognizes and binds to the therapeutic protein variant, but does not bind to the corresponding full-length known protein.

または、本発明の薬学的組成物は、少なくとも治療タンパク質変異体ポリペプチドの活性部分を治療有効量含む。   Alternatively, the pharmaceutical composition of the invention comprises a therapeutically effective amount of at least the active portion of a therapeutic protein variant polypeptide.

本発明の薬学的組成物は、クラスタ関連疾患の治療に好ましく用いられる。   The pharmaceutical composition of the present invention is preferably used for the treatment of cluster-related diseases.

「治療」は、治療的な治療および予防的もしくは防止的な処置の両方を指す。治療が必要なものとは、障害を既にもったものだけでなく、障害の予防が行われるものも包含する。従って、本明細書での治療対象の哺乳動物は、障害を持っているか、または障害になる素因がある、もしくは感受性であると診断されるだろう。治療の目的となる「哺乳動物」とは、ヒト、家畜および飼育動物、動物園、競技またはペットの動物、例えばイヌ、ウマ、ネコ、ウシ等のような動物を含む、哺乳動物に分類される動物を指す。好ましくは、哺乳動物はヒトである。   “Treatment” refers to both therapeutic treatment and prophylactic or preventative measures. What needs treatment includes not only those already having a disorder, but also those in which a disorder is prevented. Accordingly, the mammal to be treated herein will be diagnosed as having a disorder or being predisposed or susceptible to a disorder. “Mammals” for therapeutic purposes are animals classified as mammals, including humans, farm animals and domestic animals, zoos, competition or pet animals, such as dogs, horses, cats, cows, etc. Point to. Preferably the mammal is a human.

「障害」は、本発明の作用物質による治療から便益を受ける状態である。これには、問題の障害に哺乳動物を罹りやすくする病的状態を含む、慢性および急性の障害または疾患
が含まれる。本明細書において治療対象となる障害の非限定例は、本明細書に示す具体例に関係して記載される。
A “disorder” is a condition that benefits from treatment with an agent of the invention. This includes chronic and acute disorders or diseases, including pathological conditions that predispose mammals to the disorder in question. Non-limiting examples of disorders to be treated herein are described in connection with the specific examples shown herein.

用語「治療有効量」は、哺乳動物の疾患または障害を治療するのに有効である、発明の作用物質の量を指す。癌の場合には、治療有効量の作用物質は癌細胞数を減らすこと;腫瘍サイズを縮小すること;癌細胞の末梢臓器への浸潤を阻止すること(即ち、ある程度遅らせ、好ましくは停止させること);腫瘍の転移を阻止すること(即ち、ある程度遅らせ、好ましくは停止させること);腫瘍の増殖をある程度まで阻止すること;および/または癌に関係する一つもしくは複数の症状をある程度軽減することができる。作用物質が既存の癌細胞の増殖を防止および/または殺すことができる程度、それは細胞増殖抑制性および/または細胞障害性であってよい。癌治療では、効力は、例えば疾患の進行時間(TTP)を評価すること、および/または反応率(RR)を決定することによって測定できる。   The term “therapeutically effective amount” refers to an amount of an agent of the invention that is effective in treating a disease or disorder in a mammal. In the case of cancer, a therapeutically effective amount of the agent reduces the number of cancer cells; reduces tumor size; prevents cancer cells from invading peripheral organs (ie slows, preferably stops) ); Blocking tumor metastasis (ie, delaying, preferably stopping to some extent); blocking tumor growth to some extent; and / or reducing one or more symptoms associated with cancer to some extent. Can do. To the extent that the agent can prevent and / or kill the growth of existing cancer cells, it can be cytostatic and / or cytotoxic. In cancer therapy, efficacy can be measured, for example, by assessing disease progression time (TTP) and / or determining response rate (RR).

本発明の治療薬は、それ自体を被験者に提供するか、またはそれらが薬学的に許容されるキャリアと共に混合されている薬学的組成物の一部として提供することができる。   The therapeutic agents of the invention can be provided to the subject per se or as part of a pharmaceutical composition where they are mixed with a pharmaceutically acceptable carrier.

本明細書で用いる場合、「薬学的組成物」とは本明細書に記載の一または複数の活性成分と、生理学的に適したキャリアおよび賦形剤のようなその他化学成分とからなる調製物を指す。薬学的組成物の目的は、生物への化合物の投与を容易にすることである。   As used herein, a “pharmaceutical composition” is a preparation comprising one or more of the active ingredients described herein and other chemical ingredients such as physiologically suitable carriers and excipients. Point to. The purpose of a pharmaceutical composition is to facilitate administration of a compound to an organism.

本明細書では、用語「活性成分」は、生物学的作用を担う調合物をさす。   As used herein, the term “active ingredient” refers to a formulation responsible for biological action.

以後、句「生理学的に許容されるキャリア」および「薬学的に許容されるキャリア」は、互換的に使用され、生物に重大な刺激を与えず、また投与した化合物の生物学的活性および特性を排除しないキャリアまたは希釈剤を指す。アジュバントはこれらの句に含まれる。薬学的に許容されるキャリアに包含される成分の一つは、例えば、有機および水性媒体の両方に広い幅の溶解性を持つ生体適合性ポリマ−のポリエチレングリコ−ル(PEG)である(Mutter et al (1979))。   Hereinafter, the phrases “physiologically acceptable carrier” and “pharmaceutically acceptable carrier” are used interchangeably, do not cause significant irritation to the organism, and the biological activity and properties of the administered compound. Refers to a carrier or diluent that does not exclude Adjuvant is included in these phrases. One of the ingredients included in a pharmaceutically acceptable carrier is, for example, the biocompatible polymer polyethylene glycol (PEG), which has broad solubility in both organic and aqueous media (Mutter et al (1979)).

本明細書では、用語「賦形剤」は薬学的組成物に加えられて、活性成分の投与をさらに促進する不活性物質を指す。賦形剤の例としては、限定されるものではないが、炭酸カルシウム、リン酸カルシウム、各種の糖、およびある種のデンプン、セルロ−ス誘導体、ゼラチン、植物油、およびポリエチレングリコ−ルが挙げられる。   As used herein, the term “excipient” refers to an inert substance that is added to the pharmaceutical composition to further facilitate administration of the active ingredient. Examples of excipients include, but are not limited to, calcium carbonate, calcium phosphate, various sugars, and certain starches, cellulose derivatives, gelatin, vegetable oils, and polyethylene glycols.

薬物の調合および投与に関する技術は"Remington’s Pharmaceutical Sciences" Mack Publishing Co., Easton, PA, 最新版に見ることができ、これは参照によってここに組み入れられる。   Techniques for drug formulation and administration can be found in “Remington ’s Pharmaceutical Sciences” Mack Publishing Co., Easton, PA, latest edition, which is hereby incorporated by reference.

好適な投与経路としては、例えば経口、直腸、経皮、特に経鼻、腸内、または筋肉内、皮下および骨髄内注射だけでなくクモ膜下、脳室内に直接、静脈内、腹腔内、鼻内、あるいは眼球内注射を含む非腸管送達が挙げられる。または、前進的な形ではなく、例えば調合物を患者体部の特定部分に直接注射することにより局所に調合物を投与することもできる。   Suitable routes of administration include, for example, oral, rectal, transdermal, especially intranasal, enteral, or intramuscular, subcutaneous and intramedullary injection, as well as subarachnoid, directly into the ventricle, intravenous, intraperitoneal, nasal Non-intestinal delivery including internal or intraocular injection. Alternatively, the formulation can be administered locally rather than in a progressive form, for example, by directly injecting the formulation into a specific part of the patient's body.

本発明の薬学的組成物は、当技術分野周知の工程、例えば通常の混合、溶解、顆粒化、ドラジェ作製、湿式粉砕、乳化、カプセル化、封入または凍結乾燥工程によって製造できる。   The pharmaceutical compositions of the present invention can be prepared by processes well known in the art, such as conventional mixing, dissolving, granulating, dragee making, wet grinding, emulsifying, encapsulating, encapsulating or lyophilizing processes.

本発明に従った使用のための薬学的組成物は、薬学的に用いることができる活性成分を調製物に加工し易くする賦形剤および補助剤を含む一または複数の生理学的に許容されるキャリアを用いて、通常の様式で調合できる。妥当となる調合は、選択した投与経路に依存する。   A pharmaceutical composition for use according to the invention is one or more physiologically acceptable comprising excipients and auxiliaries which facilitate the processing of the pharmaceutically active ingredient into a preparation. It can be formulated in the usual manner using a carrier. The appropriate formulation will depend on the route of administration chosen.

注射の場合は、本発明の活性成分は水溶液に、好ましくはハンクス溶液、リンゲル溶液、または生理学的な塩緩衝液のような生理学的に適合した緩衝液に調合できる。経粘膜投与の場合は、調合物に透過対象となるバリアにとって適当である浸透剤を用いることができる。適当な浸透剤は当技術分野では公知である。   For injection, the active ingredients of the invention can be formulated in aqueous solutions, preferably in physiologically compatible buffers such as Hanks's solution, Ringer's solution, or physiological salt buffer. For transmucosal administration, penetrants appropriate to the barrier to be permeated can be used in the formulation. Suitable penetrants are known in the art.

経口投与の場合は、化合物は活性化合物を当技術分野周知の薬学的に許容されるキャリアと組み合わせることによって容易に調合できる。このようなキャリアは、発明の化合物を患者が経口摂取するための錠剤、ピル、ドラジェ、カプセル、液体、ゲル、シロップ、スラリ−、懸濁液等に調合できるようにする。経口使用のための薬学的調製物は、固形賦形剤を用いて、要する場合には粉砕して混合液を作製し、そして必要であれば好適な補助剤を加えた後に顆粒混合物を加工して錠剤もしくはドラジェコアを得ることができる。適した賦形剤は、特にはラクト−ス、ショ糖、マンニト−ルもしくはソルビト−ルを含む糖のような充填剤;トウモロコシ澱粉、小麦デンプン、コメデンプン、ジャガイモデンプン、ゼラチン、トラガカントゴム、メチルセルロ−ス、ヒドロキシプロピルメチルセルロ−ス、カルボメチルセルロ−スナトリウムのようなセルロ−ス調製物;および/またはポリビニルピロリドン(PVP)のような生理学的に許容されるポリマ−である。望ましい場合には、架橋型ポリビニルピロリドン、寒天もしくはアルギン酸、またはアルギン酸ナトリウムのようなその塩のような崩壊剤を加えてもよい。   For oral administration, the compounds can be readily formulated by combining the active compound with pharmaceutically acceptable carriers well known in the art. Such carriers enable the compounds of the invention to be formulated into tablets, pills, dragees, capsules, liquids, gels, syrups, slurries, suspensions, etc., for ingestion by the patient. Pharmaceutical preparations for oral use use solid excipients and, if necessary, mill to make a mixture and, if necessary, process the granule mixture after adding suitable adjuvants. To obtain tablets or dragee cores. Suitable excipients include fillers such as sugars, particularly including lactose, sucrose, mannitol or sorbitol; corn starch, wheat starch, rice starch, potato starch, gelatin, tragacanth gum, methylcellulose Cellulose preparations such as sodium, hydroxypropylmethylcellulose, carbomethylcellulose sodium; and / or physiologically acceptable polymers such as polyvinylpyrrolidone (PVP). If desired, disintegrating agents may be added, such as the cross-linked polyvinyl pyrrolidone, agar or alginic acid or a salt thereof such as sodium alginate.

ドラジェコアには適したコ−ティングが施される。この目的については、要する場合にはアラビアゴム、タルク、ポリビニルピロリドン、カルボポ−ルゲル、ポリエチレングリコ−ル、二酸化チタン、ラッカ−液および適合した有機溶媒もしくは溶媒混合液を含有してもよい濃縮糖溶液を用いることができる。錠剤またはドラジェコ−ティングには、活性化合物の容量の様々な組合せを識別または特徴付けするための色素または顔料を加えてもよい。   The dragee core is properly coated. For this purpose, concentrated sugar solutions which may contain gum arabic, talc, polyvinylpyrrolidone, carbopol gel, polyethylene glycol, titanium dioxide, lacquer liquid and suitable organic solvents or solvent mixtures, if necessary Can be used. Dyestuffs or pigments may be added to the tablets or dragee coatings to identify or characterize different combinations of active compound volumes.

経口使用できる薬学的組成物としては、ゼラチン製のプッシュフィットカプセル、ならびにゼラチンおよびグリセロ−ルもしくはソルビト−ルのような可塑剤から作られた軟式の密封カプセルが挙げられる。プッシュフィットカプセルは活性成分を、ラクト−スのような充填剤、澱粉のような結合剤、タルクまたはステアリン酸マグネシウムのような潤滑剤、そして要する場合には安定化剤との混合物として含有することができる。ソフトカプセルの場合は、活性成分は脂肪油、液体パラフィン、またはプロエチレングリコ−ル液のような適合した液体に溶解するか、または懸濁することができる。これに加えて、安定化剤を加えることもできる。経口投与向けの調合物は全て、選択した投与経路に合った投与形態にするものとする。   Pharmaceutical compositions that can be used orally include push-fit capsules made of gelatin, as well as soft, sealed capsules made of gelatin and a plasticizer, such as glycerol or sorbitol. Push-fit capsules contain the active ingredients as a mixture with a filler such as lactose, a binder such as starch, a lubricant such as talc or magnesium stearate, and if necessary a stabilizer. Can do. In the case of soft capsules, the active ingredient can be dissolved or suspended in a suitable liquid, such as fatty oil, liquid paraffin, or proethylene glycol liquid. In addition to this, stabilizers can also be added. All formulations for oral administration should be in dosage forms suitable for the chosen route of administration.

頬投与の場合は、組成物は通常の手段によって、錠剤またはロゼンジの形に調合されるだろう。   For buccal administration, the composition will be formulated into tablets or lozenges by conventional means.

鼻内吸入によって投与する場合は、本発明に従った使用のための活性成分は、加圧パックまたは適合した噴射剤、例えばジクロロジフルオロメタン、トリクロロフルオロメタン、ジクロロテトラフルオロメタンまたは二酸化炭素を用いた噴霧器からエアゾ−ルスプレ−の形で都合よく送られる。加圧式エアゾ−ルの場合は、投与単位は一定量を送り出すバルブを備えることによって決定できる。例えば分配器で使用するためのゼラチンのカプセルおよびカ−トリッジは、化合物とラクト−スもしくはデンプンのような好適な粉末基材の粉末混合物を含有するように調合できる。   When administered by nasal inhalation, the active ingredient for use according to the invention is a pressurized pack or a suitable propellant such as dichlorodifluoromethane, trichlorofluoromethane, dichlorotetrafluoromethane or carbon dioxide Conveniently sent from the nebulizer in the form of an aerosol spray. In the case of a pressurized aerosol, the dosage unit can be determined by providing a valve that delivers a certain amount. For example, gelatin capsules and cartridges for use in a dispenser can be formulated to contain a powder mixture of the compound and a suitable powder base such as lactose or starch.

本明細書に記載の調製物は、例えば大量一回注射または連続注入による非腸管投与に合わせて調合することもできる。注射用調合物は単位投与形態、例えばアンプルの中に、あるいは、要する場合には保存剤を加えた複数投与用の容器の中に入れることができる。組成物は油性または水性ビ−クルの懸濁液、溶液または乳液でよく、懸濁、安定化および/または分散剤のような調合剤を含有してもよい。   The preparations described herein can also be formulated for non-intestinal administration, eg, by a single bolus injection or continuous infusion. Injectable formulations can be placed in unit dosage forms, such as ampoules, or in multi-dose containers with preservatives, if desired. The composition may be a suspension, solution or emulsion in an oily or aqueous vehicle and may contain formulations such as suspending, stabilizing and / or dispersing agents.

非腸管投与のための薬学的組成物としては、水溶性形態の活性調製物の水溶液が挙げられる。これに加えて、活性成分の懸濁液は、適当な油または水をベ−スとした注射用懸濁液として調製できる。適合する親油性溶媒またはビ−クルとしては、ゴマ油のような脂肪油、またはエチルオレエ−ト、トリグリセリドもしくはリポソ−ムのような合成脂肪酸エステルが挙げられる。水性の注射用懸濁液は、カルボキシメチルセルロ−ス名とリム、ソルビト−ルもしくはデキストランのような懸濁液の粘度を挙げる物質を含むことができる。要する場合には、懸濁液は適した安定化剤または活性成分の水溶性を高めて高濃度溶液の調製を可能にする作用物質を含んでもよい。   Pharmaceutical compositions for parenteral administration include aqueous solutions of the active preparation in water-soluble form. In addition, suspensions of the active ingredients can be prepared as injectable suspensions based on suitable oils or water. Suitable lipophilic solvents or vehicles include fatty oils such as sesame oil, or synthetic fatty acid esters, such as ethyl oleate, triglycerides or liposomes. Aqueous injection suspensions may contain substances that increase the viscosity of the suspension, such as carboxymethyl cellulose name and rim, sorbitol, or dextran. If required, the suspension may contain suitable stabilizers or agents that enhance the aqueous solubility of the active ingredients to allow the preparation of highly concentrated solutions.

または、活性成分は、使用前に適合したビ−クル、例えば無菌の発熱物質を含まない水をベ−スとした溶液を用いて調製するための粉末形態であってもよい。   Alternatively, the active ingredient may be in powder form for preparation using a vehicle adapted prior to use, for example, a sterile pyrogen-free water-based solution.

本発明の調製物はまた、例えばココアバタ−もしくはその他グリセリドのような通常の座薬基材を用いて、座薬または留置式浣腸のような直腸用組成物に調合することができる。   The preparations of the present invention can also be formulated into rectal compositions such as suppositories or indwelling enemas, eg, using conventional suppository bases such as cocoa butter or other glycerides.

本発明の関係での使用に適した薬学的組成物としては、活性成分が意図する目的を達成するのに有効な量含有されている組成物が挙げられる。より具体的には、治療有効量は、治療対象の被験者の疾患の症状を予防、緩和または改善するか、その生存を延長するのに有効な活性成分の量を意味する。   Pharmaceutical compositions suitable for use in the context of the present invention include those compositions in which the active ingredient is contained in an amount effective to achieve the intended purpose. More specifically, a therapeutically effective amount refers to the amount of active ingredient effective to prevent, alleviate or ameliorate symptoms of disease or prolong the survival of the subject being treated.

治療有効量の決定は、当業者の能力の範囲内である。   Determination of a therapeutically effective amount is within the ability of those skilled in the art.

発明の方法で使用される調製物に関しては、治療有効量または投与量は、in vitroアッセイからまず推定できる。例えば、投与量は動物モデルを用いて定式化することができ、次にそのような情報を用いてヒトにおける有用投与量をより正確に決定することができる。   For preparations used in the methods of the invention, the therapeutically effective amount or dose can be estimated initially from in vitro assays. For example, dosages can be formulated using animal models, and such information can then be used to more accurately determine useful dosages in humans.

本明細書に記載の活性成分の毒性および治療効力は、in vitro、細胞培養、または実験動物を用いた標準的な薬学的手順によって決定することができる。これらin vivoおよび細胞培養アッセイ、ならびに動物研究から得たデ−タは、ヒトで使用するための投与範囲の設定に活かすことができる。投与量は用いる投与形態、および利用する投与経路によって変わるだろう。正確な処方、投与経路および投与量は、医師が患者の状態を見て選択することができる (たとえば Fingl, et al., 1975, in "The Pharmacological Basis of Therapeutics", Ch. 1 p.1を見よ)。   Toxicity and therapeutic efficacy of the active ingredients described herein can be determined by standard pharmaceutical procedures using in vitro, cell culture, or experimental animals. Data from these in vivo and cell culture assays, as well as animal studies, can be used to set the dosage range for use in humans. The dosage will vary depending on the dosage form used and the route of administration utilized. The exact formulation, route of administration and dosage can be chosen by the physician in view of the patient's condition (eg Fingl, et al., 1975, in "The Pharmacological Basis of Therapeutics", Ch. 1 p.1). Behold).

治療対象となる状態の重症度および反応性に応じて、投与は単回または複数回実施してよく、治療は数日から数週間、または治癒するか、もしくは疾患状態の軽減が得られるまで続けられる。   Depending on the severity and responsiveness of the condition being treated, administration may be single or multiple and continue for days to weeks or until cure or reduction of disease state is obtained. It is done.

投与する組成物の量は、当然治療対象の被験者、苦痛の大きさ、投与方法、担当医師の判断等に拠るだろう。   The amount of composition administered will of course depend on the subject being treated, the severity of the affliction, the method of administration, the judgment of the attending physician, and the like.

適合した薬学的キャリアを用いて調合された本発明の調製物を含む組成物を調製し、適当な容器に入れ、そして適用状態の治療を表示してもよい。   A composition containing the preparation of the invention formulated with a suitable pharmaceutical carrier may be prepared, placed in a suitable container, and the treatment indicated for the condition applied.

本発明の薬学的組成物は、望ましい場合には、FDA認可キットのようにパックまたは分配器に入れてもよく、それらは活性成分を含む単位投与形態を一または複数納めることができる。パックは、ブリスタ−パックのように、例えば金属もしくはプラスチック製ホイルを含んでよい。パックまたは分配器には、投与の指示書を添付してもよい。パックまたは分注器にはまた、医薬品の製造、使用または販売を監督する所轄官庁が指定した形の、組成物の形態、ヒトもしくは動物への投与についての官庁が認可したことを伝える通知を容器に添付してもよい。このような通知は、例えば処方薬または承認製品の添付文書について米国食品医薬品局が認めている表示でよい。   The pharmaceutical compositions of the invention may be placed in packs or dispensers, such as FDA approved kits, if desired, which may contain one or more unit dosage forms containing the active ingredient. The pack may include a metal or plastic foil, such as a blister pack. The pack or dispenser may be accompanied by instructions for administration. The pack or dispenser will also contain a notification that the agency has approved the form of the composition, administration to humans or animals, in the form specified by the competent authority that oversees the manufacture, use or sale of the medicinal product. May be attached. Such notification may be, for example, a label approved by the US Food and Drug Administration for package inserts of prescription drugs or approved products.

免疫原性組成物
本発明の治療薬は、要する場合には、被験者において、本発明のポリペプチドの少なくとも一つに対する特異的な免疫反応を促進する分子でよい。分子は本発明のポリペプチド変異体、それに由来する断片、またはそれをコ−ドする核酸配列でよい。分子は、それ自体を被験者に提供することができるが、作用物質は免疫原性組成物中の免疫刺激剤と共に投与することが好ましい。免疫刺激剤は、外来性抗原に対する免疫反応を増強または強化するいずれの物質でもよい。免疫刺激剤の例としては、アジュバント、その中に化合物を取り込んでいる生体分解型マイクロスフェア(例えばポリ乳酸ガラクシド)およびリポソ−ム(例えば米国特許第4,235,877号を参照)が挙げられる。ワクチン調製物は、例えばM. F. Powell and M. J. Newman, eds., "Vaccine Design (the subunit and adjuvant approach)," Plenum Press (NY, 1995)に一般的に書かれている。
Immunogenic composition The therapeutic agent of the present invention may be a molecule that, when required, promotes a specific immune response against at least one of the polypeptides of the present invention in a subject. The molecule may be a polypeptide variant of the invention, a fragment derived therefrom, or a nucleic acid sequence encoding it. While the molecule can provide itself to the subject, the agent is preferably administered with an immunostimulatory agent in the immunogenic composition. The immunostimulant may be any substance that enhances or enhances the immune response to the foreign antigen. Examples of immunostimulants include adjuvants, biodegradable microspheres (eg, polylactic acid galactosides) that incorporate compounds therein, and liposomes (see, eg, US Pat. No. 4,235,877). Vaccine preparations are generally described, for example, in MF Powell and MJ Newman, eds., “Vaccine Design (the subunit and adjuvant approach),” Plenum Press (NY, 1995).

例示的な免疫原性組成物は、上記ポリペプチドを、ポリペプチドがin situに生成されるように一または複数含有できる。DNAは、核酸発現システム(以下参照)、細菌またはウイルス発現システムを含む当業者に公知である様々な送達システムのなかに存在させることができる。Rolland, Crit. Rev. Therap. Drug Carrier Systems 15:143−198, 1998および本明細書内に引用した参考資料が記載するような、様々な遺伝子送達技術が当分野では周知である。これに相応しい核酸発現システムは、被験者での発現に必要なDNA配列(適合したプロモ−タおよび終止シグナルのような)を含む。細菌送達システムは、その細胞表面にポリペプチドの免疫原性部分を発言しているか、そのようなエピト−プを分泌する細菌(Bacillus−Calmette−Guerrinのような)を投与することを包含する。好ましい態様では、DNAはウイルス発現システム(例えばワクシニアもしくはその他ポックスウイルス、レトロウイルス、またはアデノウイルス)を用いて導入されるが、これは非病原性(欠失)の複製能力を有するウイルスの使用も包含する。これに適したシステムは、例えばin Fisher−Hoch et al., Proc. Natl. Acad. Sci. USA 86:317−321, 1989; Flexner et al., Ann. N.Y Acad. Sci. 569:86−103, 1989; Flexner et al., Vaccine 8:17−21, 1990; U.S. Pat. Nos. 4,603,112, 4,769,330, and 5,017,487; WO 89/01973;米国特許第4,777,127号; GB 2,200,651; EP 0,345,242; WO 91/02805; Berkner, Biotechniques 6:616−627, 1988; Rosenfeld et al., Science 252:431−434, 1991; Kolls et al., Proc. Natl. Acad. Sci. USA 91:215−219, 1994; Kass−Eisler et al., Proc. Natl. Acad. Sci. USA 90:11498−11502, 1993; Guzman et al., Circulation 88:2838−2848, 1993; and Guzman et al., Cir. Res. 73:1202−1207, 1993に開示されている。このような発現システムにDNAを組み入れるための技術は、当業者に周知である。DNAはまた、例えばUlmer et al., Science 259:1745−1749, 1993が記載し、またCohenScience 259:1691−1692, 1993によってレビュ−されているように「裸」でもよい。裸のDNAの取り込みは、細胞内に効率的に輸送される生体分解性ビ−ズの上にDNAをコ−ティングすることで高められる。   Exemplary immunogenic compositions can contain one or more of the above polypeptides such that the polypeptides are generated in situ. The DNA can be present in a variety of delivery systems known to those skilled in the art including nucleic acid expression systems (see below), bacterial or viral expression systems. Various gene delivery techniques are well known in the art, as described by Rolland, Crit. Rev. Therap. Drug Carrier Systems 15: 143-198, 1998 and references cited within this specification. A suitable nucleic acid expression system includes DNA sequences (such as compatible promoters and termination signals) necessary for expression in a subject. Bacterial delivery systems involve administering bacteria (such as Bacillus-Calmette-Guerrin) that speak the immunogenic portion of the polypeptide to their cell surface or secrete such epitopes. In preferred embodiments, the DNA is introduced using a viral expression system (eg, vaccinia or other poxviruses, retroviruses, or adenoviruses), although this may also involve the use of viruses that have non-pathogenic (deletion) replication capabilities. Includes. Suitable systems for this are e.g. in Fisher-Hoch et al., Proc. Natl. Acad. Sci. USA 86: 317-321, 1989; Flexner et al., Ann. NY Acad. Sci. 569: 86-103. Flexner et al., Vaccine 8: 17-21, 1990; US Pat.Nos. 4,603,112, 4,769,330, and 5,017,487; WO 89/01973; U.S. Pat.No. 4,777,127; GB 2,200,651; EP 0,345,242; WO 91/02805 Berkner, Biotechniques 6: 616-627, 1988; Rosenfeld et al., Science 252: 431-434, 1991; Kolls et al., Proc. Natl. Acad. Sci. USA 91: 215-219, 1994; Kass- Eisler et al., Proc. Natl. Acad. Sci. USA 90: 11498-11502, 1993; Guzman et al., Circulation 88: 2838-2848, 1993; and Guzman et al., Cir. Res. 73: 1202- 1207, 1993. Techniques for incorporating DNA into such expression systems are well known to those skilled in the art. The DNA may also be “naked” as described, for example, by Ulmer et al., Science 259: 1745-1749, 1993 and reviewed by CohenScience 259: 1691-1692, 1993. Naked DNA uptake is enhanced by coating the DNA onto a biodegradable bead that is efficiently transported into the cell.

免疫学的組成物は、ポリヌクレオチド成分とポリペプチド成分の両方を含むことができることが分かるだろう。このような免疫原性組成物は、免疫反応を高めるために与えることができる。   It will be appreciated that an immunological composition can include both a polynucleotide component and a polypeptide component. Such an immunogenic composition can be provided to enhance the immune response.

様々な免疫刺激剤を、本発明の免疫原性組成物に使用することができる。例えば、アジュバントを加えることができる。大部分のアジュバントは、水酸化アルミニウムもしくはミネラルオイルのような、急激な異化から抗原を保護するための物質、ならびに脂質A、Bortadella pertusisもしくはMycobacterium tuberculosis由来タンパク質のような免疫反応刺激剤を含有している。適合したアジュバントは、例えばフロインドの不完全アジュバントおよび完全アジュバント (Difco Laboratories, Detroit, Mich.); メルクアジュバント65 (Merck and Company, Inc., Rahway, N.J.); AS−2 (SmithKline Beecham, Philadelphia, Pa.)として;水酸化アルミニウムゲル(アルム)またはリン酸アルミニウムのようなアルミニウム塩として;カルシウム、鉄または亜鉛の塩として;アシル化チロシンの不溶性懸濁液;アシル化糖;カチオン性またはアニオン性誘導ポリサッカライド;ポリホスファゼン;生体分解型マイクロスフェア;モノホスホリル脂質AおよびquilAとして市販されている。GM−CSFまたはインタ−ロイキン−2、−7または−12のようなサイトカインもアジュバントして用いることができる。   A variety of immunostimulatory agents can be used in the immunogenic compositions of the invention. For example, an adjuvant can be added. Most adjuvants contain substances to protect antigens from rapid catabolism, such as aluminum hydroxide or mineral oil, and immune response stimulants such as lipid A, proteins from Bortadella pertusis or Mycobacterium tuberculosis. Yes. Suitable adjuvants include, for example, Freund's incomplete and complete adjuvants (Difco Laboratories, Detroit, Mich.); Merck Adjuvant 65 (Merck and Company, Inc., Rahway, NJ); AS-2 (SmithKline Beecham, Philadelphia, Pa .); As aluminum salts such as aluminum hydroxide gel (alum) or aluminum phosphate; as calcium, iron or zinc salts; insoluble suspensions of acylated tyrosine; acylated sugars; cationic or anionic induction Polysaccharides; polyphosphazenes; biodegradable microspheres; commercially available as monophosphoryl lipid A and quilA. Cytokines such as GM-CSF or interleukin-2, -7 or -12 can also be used as adjuvants.

アジュバント組成物は、Th1タイプの免疫反応を主に誘導するように設計できる。高レベルのTh1タイプサイトカイン(例えばIFN−.ガンマ.、TNF.アルファ.、IL−2およびIL−12)は投与された抗原に対する細胞性免疫反応の誘導を助長する傾向がある。これに対し高レベルのTh2タイプサイトカイン(例えば、IL−4、IL−5、IL−6およびIL−10)は、液性免疫反応の誘導を助長する傾向がある。本明細書に示す免疫原性組成物を適用されると、被験者はTh1−およびTh2タイプの反応を誘導する免疫反応を後押しするだろう。これらサイトカインのレベルは、標準的なアッセイを用いることで容易に評価できる。サイトカインファミリ−のレビュ−についてはMosmann and Coffinan, Ann. Rev. Immunol. 7:145−173, 1989を参照せよ。   Adjuvant compositions can be designed to primarily induce Th1-type immune responses. High levels of Th1-type cytokines (eg IFN-.gamma., TNF.alpha., IL-2 and IL-12) tend to help induce a cellular immune response to the administered antigen. In contrast, high levels of Th2-type cytokines (eg, IL-4, IL-5, IL-6 and IL-10) tend to help induce a humoral immune response. When applied with the immunogenic compositions provided herein, the subject will boost an immune response that induces Th1- and Th2-type responses. The levels of these cytokines can be easily assessed using standard assays. For reviews of the cytokine family, see Mosmann and Coffinan, Ann. Rev. Immunol. 7: 145-173, 1989.

Th1タイプの反応を主に誘発するのに好ましく使用されるアジュバントとしては、例えばモノホスホリル脂質A、好ましくは3−デ−O−アシル化モノホスホリル脂質A(3D−MPL)とアルミニウム塩との組合せが挙げられる。MPLアジュバントはCorixa Corporation (Seattle, Wash.; 米国特許第4,436,727号;第4,877,611号;第4,866,034号および第4,912,094号を参照)より入手できる。CpG含有オリゴヌクレオチド(この場合、CpGジヌクレオチドはメチル化されていない)もまたTh1反応を主に誘導する。このようなオリゴヌクレオチドは周知であり、例えばWO 96/02555、WO 99/33488ならびに米国特許第6,008,200号および第5,856,462号に記載されている。免疫刺激性DNA配列もまた、例えばSato et al., Science 273:352, 1996によって記載されている。別の好ましいアジュバントはサポニン、好ましくはQS21(Aquila Biopharmaceuticals Inc., Framingham, Mass.)であり、これは単独または他のアジュバントと組み合わせて用いることができる。例えば強化システムは、WO 94/00153に記載されているQS21と3D−MPLとの組合せのようなモノホスホリル脂質Aとサポニン誘導体との組合せ、またはWO 96/33739に記載されているような、QS21をコレステロ−ルで抑制した反応性の低い組成物を含む。別の好ましい調合物は、水中油形乳剤とトコフェロ−ルを含む。特に強力なアジュバント調合物はQS21、3D−MPLおよびトコフェロ−ルを含む水中油形乳剤で、WO 95/17210に記載されている。   Adjuvants preferably used primarily to elicit Th1-type reactions include, for example, monophosphoryl lipid A, preferably a combination of 3-de-O-acylated monophosphoryl lipid A (3D-MPL) and an aluminum salt Is mentioned. MPL adjuvants are available from Corixa Corporation (Seattle, Wash .; US Pat. Nos. 4,436,727; 4,877,611; 4,866,034 and 4,912,094). CpG-containing oligonucleotides (in which case CpG dinucleotides are not methylated) also induce predominantly Th1 responses. Such oligonucleotides are well known and are described, for example, in WO 96/02555, WO 99/33488 and US Pat. Nos. 6,008,200 and 5,856,462. Immunostimulatory DNA sequences are also described, for example, by Sato et al., Science 273: 352, 1996. Another preferred adjuvant is a saponin, preferably QS21 (Aquila Biopharmaceuticals Inc., Framingham, Mass.), Which can be used alone or in combination with other adjuvants. For example, the enhancement system can be a combination of monophosphoryl lipid A and a saponin derivative such as the combination of QS21 and 3D-MPL described in WO 94/00153, or QS21 as described in WO 96/33739. A low-reactivity composition in which is suppressed by cholesterol. Another preferred formulation comprises an oil-in-water emulsion and tocopherol. A particularly potent adjuvant formulation is an oil-in-water emulsion containing QS21, 3D-MPL and tocopherol and is described in WO 95/17210.

別の好ましいアジュバントとしては、Montanide ISA 720 (Seppic, France)、SAF (Chiron, Calif., United States)、ISCOMS (CSL), MF−59 (Chiron)、SBASシリ−ズのアジュバント(例えばSBAS−2もしくはSBAS−4、SmithKline Beecham, Rixensart, Belgiumより入手できる)、Detox (Corixa, Hamilton, Mont.)、RC−529 (Corixa, Hamilton, Mont.)および係属中米国特許出願第08/853,826号および第09/074,720号に記載されているような、その他アミノアルキルグルコサミニド4−リン酸(AGP)が挙げられる。   Other preferred adjuvants include Montanide ISA 720 (Seppic, France), SAF (Chiron, Calif., United States), ISCOMS (CSL), MF-59 (Chiron), SBAS series adjuvants (eg, SBAS-2). Or SBAS-4, available from SmithKline Beecham, Rixensart, Belgium), Detox (Corixa, Hamilton, Mont.), RC-529 (Corixa, Hamilton, Mont.) And pending U.S. Patent Application Nos. 08 / 853,826 and Other examples include aminoalkyl glucosaminide 4-phosphate (AGP), as described in 09 / 074,720.

本発明の免疫原性組成物の中に送達ビ−クルを用いて、腫瘍細胞を標的とする抗原特異的免疫反応の形成を促進できる。送達システムは、樹状細胞、マクロファ−ジ、B細胞、単球および遺伝子工学的によって効果的なAPCに作られたその他細胞を含む。このような細胞を遺伝的に変更し、抗原提示能力を高め、T細胞反応の活性化および/または維持を向上させ、抗腫瘍作用自体を持たせ、ならびに/あるいは受容者に免疫学的に適合さてもよい(即ちHLAハプロタイプを一致させる)。APCは各種生物学的液体、ならびに腫瘍および腫瘍周辺組織を含む器官から遺伝学的に単離することができ、また自己、同種、同系または異種細胞でもよい。   Delivery vehicles can be used in the immunogenic compositions of the present invention to promote the formation of antigen-specific immune responses that target tumor cells. The delivery system includes dendritic cells, macrophages, B cells, monocytes and other cells made into genetically effective APCs. Such cells are genetically altered to enhance the ability to present antigens, improve activation and / or maintenance of T cell responses, have anti-tumor effects themselves, and / or are immunologically compatible with the recipient It may also be done (ie match HLA haplotypes). APCs can be genetically isolated from various biological fluids and organs including tumors and surrounding tissues, and may be autologous, allogeneic, syngeneic or xenogeneic cells.

樹状細胞は極めて強力なAPCであり(Banchereau and Steinman, Nature 392:245−251, 1998)、予防的または治療的な抗腫瘍免疫のための生理学的アジュバントとして有効であることが示されている(Timmernan and Levy, Ann. Rev. Med. 50:507−529, 1999参照)。一般的には、樹状細胞はその典型的な形(in situでは星形をしており、in vitroでは顕著な細胞質突起(樹状突起)が確認できる)、高効率で抗原を取り込み、処理して提示するから特定できるその能力、および未感作T細胞反応を活性化するその能力から特定することができる。樹状細胞は、当然、in vivoまたはex vivoでは樹状細胞に一般的に見いだせない特定の細胞表面レセプタ−またはリガンドを発現するように遺伝子工学的に加工することもでき、そしてこの様に変更された樹状細胞は本発明に包含される。樹状細胞に替わって、分泌小胞抗原を負荷した樹状細胞(エクソゾ−ムと呼ぶ)を免疫原性組成物内に用いることもできる(Zitvogel et al., Nature Med. 4:594−600, 1998参照)。   Dendritic cells are extremely powerful APCs (Banchereau and Steinman, Nature 392: 245-251, 1998) and have been shown to be effective as physiological adjuvants for prophylactic or therapeutic anti-tumor immunity (See Timmernan and Levy, Ann. Rev. Med. 50: 507-529, 1999). In general, dendritic cells have a typical shape (star shape in situ and prominent cytoplasmic processes (dendrites) can be confirmed in vitro), and take up and process antigen with high efficiency. The ability to be identified from the presentation and the ability to activate an unsensitized T cell response. Dendritic cells can of course be engineered to express specific cell surface receptors or ligands that are not commonly found in dendritic cells in vivo or ex vivo, and are thus modified Dendritic cells made are encompassed by the present invention. As an alternative to dendritic cells, dendritic cells loaded with secreted vesicle antigens (called exosomes) can also be used in immunogenic compositions (Zitvogel et al., Nature Med. 4: 594-600). , 1998).

樹状細胞およびその前駆細胞は、末梢血、骨髄、腫瘍浸潤細胞、腫瘍周辺組織浸潤細胞、リンパ節、脾臓、皮膚、臍帯血またはその他好適な組織または液体から得られる。例えば、樹状細胞は、CM−CSF、IL−4、IL−13および/またはTNF.アルファのようなサイトカインを、末梢血から集めた単球の培養物に加えることによってex vivoに分化させることができる。またはGM−CSF、IL−3、TNF.アルファ、CD40リガンド、LPS、flt3リガンドおよび/もしくは樹状細胞の分化、成熟そして増殖を誘導するその他化合物の組合せを培地に加えることによって、末梢血、臍帯血もしくは骨髄から集めたCD34陽性細胞を樹状細胞に分化させることができる。   Dendritic cells and their progenitor cells are obtained from peripheral blood, bone marrow, tumor infiltrating cells, peritumoral tissue infiltrating cells, lymph nodes, spleen, skin, umbilical cord blood or other suitable tissue or fluid. For example, dendritic cells can be differentiated ex vivo by adding cytokines such as CM-CSF, IL-4, IL-13 and / or TNF.alpha to monocyte cultures collected from peripheral blood. Can do. Or peripheral blood, umbilical cord by adding to the medium a combination of GM-CSF, IL-3, TNF.alpha, CD40 ligand, LPS, flt3 ligand and / or other compounds that induce dendritic cell differentiation, maturation and proliferation CD34 positive cells collected from blood or bone marrow can be differentiated into dendritic cells.

樹状細胞は、よく特徴付けられた二つの表現形を容易に識別することができる「未熟」および「成熟」細胞に分類される。未熟な樹状細胞は、Fcyレセプタ−およびマンノ−スレセプタ−の高発現と相関する、高い抗原を取り込んで処理する能力を持つAPCとして特徴付けられる。成熟表現形は、一般的にはこれらマ−カ−の発現がより低いた、しかしクラスIおよびクラスIIMHC、接着分子(例えばCD54やCD11)ならびに補助刺激分子(例えばCD40、CD80、CD86および4−1BB)のようなT細胞活性化を担う細胞表面分子を強く発現することを特徴とする。   Dendritic cells are classified as “immature” and “mature” cells that can easily distinguish between two well-characterized phenotypes. Immature dendritic cells are characterized as APCs with the ability to take up and process high antigens that correlate with high expression of Fcy receptors and manno-receptors. The mature phenotype generally has lower expression of these markers, but class I and class II MHC, adhesion molecules (eg CD54 and CD11) and costimulatory molecules (eg CD40, CD80, CD86 and 4- It is characterized by strongly expressing cell surface molecules responsible for T cell activation such as 1BB).

APCは、一般的には本発明のポリペプチドをコ−ドする少なくとも一つのポリヌクレオチドでトランスフェクションされ、バリアントIIまたはその免疫原性部分を細胞表面に発現する。このようなトランスフェクションはex vivoで行うことができ、また次に、この様にトランスフェクションした細胞を含む組成物を本明細書に記載されているような治療目的に用いることができる。または樹状細胞またはその他の抗原提示細胞を標的とする遺伝子送達ビ−クルを被験者に投与し、トランスフェクションをin vivoで行うこともできる。樹状細胞のin vivoおよびex vivoトランスフェクションは、一般的には、例えばWO 97/24447に記載されているような当技術分野公知の方法、またはMahvi et al., Immunology and cell Biology 75:456−460, 1997が記載している遺伝子銃を用いて行うことができる。樹状細胞の抗原負荷は、樹状細胞または前駆細胞を本発明のポリペプチド、DNA(裸もしくはプラスミドベクタ−に入れた)またはRNA;あるいは抗原発現組換え体細菌もしくはウイルス(例えばワクシニア、鶏痘、アデノウイルスもしくはレンチウイルス)と一緒にインキュベ−ションすることによって達成できる。負荷前にポリペプチドを、上記のようなT細胞を補助する免疫学的パ−トナ−(例えばキャリア分子)に共有結合してもよい。または、樹状細胞を共有結合していない免疫学的パ−トナ−により、ポリペプチドとは別に、またはポリペプチド存在下にパルスしてもよい。   APC is generally transfected with at least one polynucleotide encoding the polypeptide of the present invention and expresses variant II or an immunogenic portion thereof on the cell surface. Such transfection can be performed ex vivo, and then a composition comprising such transfected cells can be used for therapeutic purposes as described herein. Alternatively, gene delivery vehicles targeting dendritic cells or other antigen presenting cells can be administered to the subject and transfection can be performed in vivo. In vivo and ex vivo transfection of dendritic cells is generally accomplished by methods known in the art, for example as described in WO 97/24447, or Mahvi et al., Immunology and cell Biology 75: 456 -460, 1997 can be used with the gene gun described. Dendritic cell antigen loading may include dendritic cells or progenitor cells of the polypeptide of the invention, DNA (naked or in a plasmid vector) or RNA; or antigen-expressing recombinant bacteria or viruses (eg, vaccinia, fowlpox). , Adenovirus or lentivirus). Prior to loading, the polypeptide may be covalently linked to an immunological partner (eg, a carrier molecule) that assists T cells as described above. Alternatively, the dendritic cells may be pulsed by an immunological partner that is not covalently bound separately from the polypeptide or in the presence of the polypeptide.

明快さを目的として別々の態様の中に記載されている発明の特定の特徴は、単一の態様の中に組み合わせて示すこともできることが認識される。逆に、簡潔さを目的として単一の態様の中に記載された発明の様々な特徴は、別々に、または適当な組合せとして示すこともできる。   It will be appreciated that certain features of the invention described in separate embodiments for purposes of clarity can also be shown in combination in a single embodiment. On the contrary, the various features of the invention described in a single embodiment for the sake of brevity may be shown separately or in any appropriate combination.

発明はその特定の態様と結びつけて記載されているが、当業者にとって多くの代替、変更および変形が明瞭に理解できることは明らかである。従って、添付のクレ−ムの精神および広い範囲の中に入るこのような代替、変更および変形は全て包含するものとする。本明細書に記載されている全ての刊行物、特許および特許出願は、参照によってそのまま、あたかもそれぞれの刊行物、特許または特許出願が明瞭、且つ個別に参照によって本明細書に組み入れられることを示したのと同程度に本明細書中に組み入れられている。これに加えて、本明細書において参考資料を引用または指定することは、このような参考資料が本発明に対する従来技術として利用可能であることを容認することを意味するものではない。   While the invention has been described in connection with specific embodiments thereof, it is evident that many alternatives, modifications and variations will be apparent to those skilled in the art. Accordingly, it is intended to embrace all such alternatives, modifications and variations that fall within the spirit and broad scope of the appended claims. All publications, patents, and patent applications mentioned in this specification are referenced by reference to the extent that each publication, patent, or patent application is clear and individually incorporated herein by reference. Are incorporated herein to the same extent as In addition, citation or designation of a reference material herein does not imply that such reference material is available as prior art to the present invention.

癌生物マ−カ−選択エンジンおよびウエットバリデ−ションの概略図。Schematic of cancer biomarker selection engine and wet validation. 固有の配列領域の有無に基づく、あるクラスタの転写物のグル−プ分けを描いた概略図。Schematic depicting the grouping of transcripts of a cluster based on the presence or absence of unique sequence regions. 定量的リアルタイムPCR分析の概略図。Schematic of quantitative real-time PCR analysis. オリゴヌクレオチドベ−スマイクロアレイ製造の概略図Schematic diagram of oligonucleotide-based microarray manufacturing オリゴヌクレオチドベ−スマイクロアレイ実験の流れを示す概略図Schematic showing the flow of oligonucleotide-based microarray experiments クラスタT10888の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、結腸長直腸癌、各種組織由来の混合型悪性腫瘍、膵臓癌および胃癌で過剰発現していることを示している。A histogram showing the expression of cluster T10888 in cancer and cell lines compared to that in normal tissues, and that it is overexpressed in colorectal cancer, mixed malignant tumors from various tissues, pancreatic cancer and gastric cancer Show. 配列名T10888 junc11−17に描かれたアンプリコンによって検出できる、CEA6_HUMAN胎児性癌抗原関連細胞接着分子6T10888転写物の、正常組織および癌乳房組織での発現を示すヒストグラム。Histogram showing the expression of CEA6_HUMAN fetal cancer antigen-related cell adhesion molecule 6T10888 transcript in normal tissue and cancer breast tissue that can be detected by the amplicon depicted in SEQ ID NO: T10888 junc11-17. 配列名T10888junc11−17に描かれたアンプリコンによって検出できる、CEA6_HUMAN胎児性癌抗原関連細胞接着分子6T10888転写物の各種正常組織での発現を示すヒストグラム。Histogram showing expression in various normal tissues of CEA6_HUMAN fetal cancer antigen-related cell adhesion molecule 6T10888 transcript, which can be detected by the amplicon depicted in SEQ ID T10888junc11-17. クラスタT39971の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、肝臓癌、肺悪性腫瘍および膵臓癌での過剰発現を証明している。A histogram showing the expression of cluster T39971 in cancer and cell lines compared to that in normal tissues demonstrates overexpression in liver cancer, lung malignancies and pancreatic cancer. 配列名T39971 junc23−33に描かれたアンプリコンによって検出できる、VTNC_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)T39971転写物の、正常組織および癌乳房組織での発現を示すヒストグラム。Histogram showing the expression of VTNC_HUMAN vitronectin (serum diffusion factor, somatomedin B, complement S protein) T39971 transcript in normal and cancerous breast tissues that can be detected by the amplicon depicted in SEQ ID T39971 junc23-33. 配列名T39971 junc23−33に描かれたアンプリコンによって検出できる、VTNC_HUMANビトロネクチン(血清拡散因子、ソマトメジンB、補体Sタンパク質)、SARM1(T23434)に対するアンチセンス、T39971転写物の、各種正常組織での発現を示すヒストグラム。VTNC_HUMAN vitronectin (serum diffusion factor, somatomedin B, complement S protein), antisense to SARM1 (T23434), T39971 transcript in various normal tissues, which can be detected by the amplicon depicted in sequence name T39971 junc23-33 Histogram showing expression. クラスタZ21368の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、上皮悪性腫瘍、各種組織由来の混合型悪性腫瘍および膵臓癌での過剰発現を証明している。A histogram showing the expression of cluster Z21368 in cancer and cell lines compared to that in normal tissues demonstrates overexpression in epithelial malignancies, mixed malignancies from various tissues and pancreatic cancer. 配列名Z21368seg39に描かれたアンプリコンによって検出できる、SUL1_HUMAN−細胞外サルファタ−ゼSulf−1Z21368転写物の、正常組織および癌乳房組織での発現を示すヒストグラム。Histogram showing the expression in normal and cancer breast tissue of the SUL1_HUMAN-extracellular sulfatase Sulf-1Z21368 transcript that can be detected by the amplicon depicted in SEQ ID Z21368seg39. 配列名Z21368seg39に描かれたアンプリコンによって検出できる、SUL1_HUMAN−細胞外サルファタ−ゼSulf−1Z21368転写物の、各種正常組織での発現を示すヒストグラム。The histogram which shows the expression in various normal tissues of the SUL1_HUMAN-extracellular sulfatase Sulf-1Z21368 transcript which can be detected by the amplicon drawn by sequence name Z21368seg39. 配列名Z21368junc 17−21に描かれたアンプリコンによって検出できる、SUL1_HUMAN−細胞外サルファタ−ゼSulf−1Z21368転写物の、正常組織および癌乳房組織での発現を示すヒストグラム。Histogram showing expression of SUL1_HUMAN-extracellular sulfatase Sulf-1Z21368 transcript in normal and cancerous breast tissues, detectable by the amplicon depicted in SEQ ID Z21368junc 17-21. 配列名Z21368junc 17−21に描かれたアンプリコンによって検出できる、SUL1_HUMAN−細胞外サルファタ−ゼSulf−1Z21368転写物の、各種正常組織での発現を示すヒストグラム。Histogram showing the expression in various normal tissues of the SUL1_HUMAN-extracellular sulfatase Sulf-1Z21368 transcript that can be detected by the amplicon depicted in the sequence name Z21368junc 17-21. クラスタT59832の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、脳悪性腫瘍、乳房悪性腫瘍、卵巣癌および膵臓癌での過剰発現を証明している。Histograms showing cluster T59832 expression in cancer and cell lines compared to expression in normal tissues demonstrate overexpression in brain, breast, ovarian and pancreatic cancers. 乳癌サンプルパネルを用いて実施した一つの実験でクラスタT59832、アンプリコン名:T59832 junc6−25−26について観察された低い過剰発現を示すヒストグラム。Histogram showing low overexpression observed for cluster T59832, amplicon name: T59832 junc6-25-26 in one experiment performed using a breast cancer sample panel. 配列名HUMGRP5Ejunc3−7に描かれたアンプリコンによって検出できる、GRP_HUMAN−ガストリン放出ペプチド(HUMGRP5E)転写物の、正常組織および癌乳房組織での発現を示すヒストグラム。Histogram showing expression in normal tissue and cancer breast tissue of a GRP_HUMAN-gastrin releasing peptide (HUMGRP5E) transcript that can be detected by the amplicon depicted in the sequence name HUMGRP5Ejunc3-7. 配列名HUMGRP5Ejunc3−7に描かれたアンプリコンによって検出できる、GRP_HUMAN−ガストリン放出ペプチド(HUMGRP5E)転写物の、各種正常組織での発現を示すヒストグラム。The histogram which shows the expression in various normal tissues of the GRP_HUMAN-gastrin releasing peptide (HUMGRP5E) transcript which can be detected by the amplicon drawn in sequence name HUMGRP5Ejunc3-7. クラスタAA155578の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、各種組織由来の混合型悪性腫瘍および膵臓癌での過剰発現を証明している。A histogram showing the expression of cluster AA155578 in cancer and cell lines compared to that in normal tissues demonstrates overexpression in mixed malignancies and pancreatic cancer from various tissues. クラスタHSENA78の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、上皮悪性腫瘍および肺悪性腫瘍での過剰発現を証明している。Histograms showing cluster HSENA78 expression in cancer and cell lines compared to expression in normal tissues demonstrate overexpression in epithelial and lung malignancies. 配列名T94936seg14に描かれたアンプリコンによって検出できる、ヒト乳癌膜タンパク質11(BCMP11)T94936転写物の、正常組織および癌乳房組織での発現を示すヒストグラム。Histogram showing expression of human breast cancer membrane protein 11 (BCMP11) T94936 transcript in normal and cancerous breast tissues, detectable by the amplicon depicted in SEQ ID T94936seg14. クラスタZ41644の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、肺悪性腫瘍、乳房悪性腫瘍および膵臓癌での過剰発現を証明している。A histogram showing the expression of cluster Z41644 in cancer and cell lines compared to that in normal tissues demonstrates overexpression in lung, breast and pancreatic cancers. クラスタM85491の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、上皮悪性腫瘍および各種組織由来の混合型悪性腫瘍での過剰発現を証明している。A histogram showing the expression of cluster M85491 in cancer and cell lines compared to that in normal tissues demonstrates overexpression in epithelial malignancies and mixed malignancies from various tissues. 配列名M85491seg24に描かれたアンプリコンによって検出できる、エフリンタイプBレセプタ−2前駆体(EC2.7.1.112)(チロシンタンパク質キナ−ゼレセプタ−EPH−3)M85491転写物の、正常組織および癌乳房組織での発現を示すヒストグラム。Normal tissue and cancer breast tissue of ephrin type B receptor-2 precursor (EC2.7.1.112) (tyrosine protein kinase receptor-EPH-3) M85491 transcript detectable by the amplicon depicted in SEQ ID M85491seg24 Histogram showing expression in 配列名M85491seg24に描かれたアンプリコンによって検出できる、エフリンタイプBレセプタ−2前駆体(EC2.7.1.112)(チロシンタンパク質キナ−ゼレセプタ−EPH−3)M85491転写物の、各種正常組織での発現を示すヒストグラム。Expression of the ephrin type B receptor-2 precursor (EC2.7.1.112) (tyrosine protein kinase receptor EPH-3) M85491 transcript, detected by the amplicon depicted in the sequence name M85491seg24, in various normal tissues Histogram showing. クラスタHSSTROL3の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、転移性細胞癌、上皮悪性腫瘍、各種組織に由来する混合型悪性腫瘍および膵臓癌での過剰発現を証明している。Histogram showing cluster HSSTROL3 expression in cancer and cell lines compared to normal tissue expression and overexpression in metastatic cell carcinoma, epithelial malignancies, mixed malignancies from various tissues and pancreatic cancer Prove that. 配列名HSSTROL3seg24に描かれたアンプリコンによって検出できる、ストロメリシン3前駆体(EC3.4.24.−)(マトリックスメタロプロテイネ−ス−11)(MMP−11)(ST3)HSSTROL3転写物の、正常組織および癌乳房組織での発現を示すヒストグラム。Stromelysin 3 precursor (EC3.4.24.-) (Matrix metalloproteinase-11) (MMP-11) (ST3) HSSTROL3 transcript, normal tissue and detectable by the amplicon depicted in the sequence name HSSTROL3seg24 Histogram showing expression in breast cancer tissue. 配列名HSSTROL3seg24に描かれたアンプリコンによって検出できる、ストロメリシン3前駆体(EC3.4.24.−)(マトリックスメタロプロテイネ−ス−11)(MMP−11)(ST3)HSSTROL3転写物の、各種正常組織での発現を示すヒストグラム。Stromelysin 3 precursor (EC3.4.24.-) (Matrix metalloproteinase-11) (MMP-11) (ST3) HSSTROL3 transcripts of various normal tissues that can be detected by the amplicon depicted in the sequence name HSSTROL3seg24 Histogram showing expression in 正常サンプルと比較した、癌乳房サンプルでの各種ストロメリシン3前駆体転写物の過剰発現を示すヒストグラム。Histogram showing overexpression of various stromelysin 3 precursor transcripts in cancer breast samples compared to normal samples. 正常サンプルと比較した、癌乳房サンプルでの各種ストロメリシン3前駆体転写物の過剰発現を示すヒストグラム。Histogram showing overexpression of various stromelysin 3 precursor transcripts in cancer breast samples compared to normal samples. 正常サンプルと比較した、癌乳房サンプルでの各種ストロメリシン3前駆体転写物の過剰発現を示すヒストグラム。Histogram showing overexpression of various stromelysin 3 precursor transcripts in cancer breast samples compared to normal samples. クラスタR75793の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、上皮悪性腫瘍および各種組織に由来する混合型悪性腫瘍での過剰発現を証明している。A histogram showing the expression of cluster R75793 in cancer and cell lines compared to expression in normal tissues demonstrates overexpression in epithelial malignancies and mixed malignancies derived from various tissues. クラスタHUMCA1XIAの癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、骨悪性腫瘍、上皮悪性腫瘍、各種組織に由来する混合型悪性腫瘍および肺悪性腫瘍での過剰発現を証明している。Histogram showing cluster HUMCA1XIA expression in cancer and cell lines compared to normal tissue expression, overexpression in bone malignancies, epithelial malignancies, mixed malignancies and lung malignancies derived from various tissues Prove that. クラスタR20779の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、各種組織に由来する混合型悪性腫瘍および肺悪性腫瘍での過剰発現を証明している。A histogram showing the expression of cluster R20779 in cancer and cell lines compared to that in normal tissues demonstrates overexpression in mixed and lung malignancies derived from various tissues. クラスタHSS100PCBの癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、各種組織に由来する混合型悪性腫瘍での過剰発現を証明している。A histogram showing the expression of cluster HSS100PCB in cancer and cell lines compared to that in normal tissues demonstrates overexpression in mixed malignant tumors derived from various tissues. クラスタHSCOC4の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、脳悪性腫瘍、各種組織に由来する混合型悪性腫瘍、乳房悪性腫瘍、膵臓癌、および前立腺癌での過剰発現を証明している。Histogram showing cluster HSCOC4 expression in cancer and cell lines compared to normal tissue expression in brain malignancies, mixed malignancies from various tissues, breast malignancies, pancreatic cancer, and prostate cancer Overexpression has been demonstrated. クラスタHUMTREFACの癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、各種組織に由来する混合型悪性腫瘍、乳房悪性腫瘍、膵臓癌および前立腺癌での過剰発現を証明している。A histogram showing the expression of cluster HUMTREFAC in cancer and cell lines compared to that in normal tissues, demonstrating overexpression in mixed, breast, pancreatic and prostate cancers from various tissues ing. クラスタHUMOSTROの癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、上皮悪性腫瘍、各種組織に由来する混合型悪性腫瘍、肺悪性腫瘍、乳房悪性腫瘍、卵巣癌および皮膚悪性疾患での過剰発現を証明している。A histogram showing the expression of cluster HUMOSTRO in cancer and cell lines compared to that in normal tissues, epithelial malignancies, mixed malignancies derived from various tissues, lung malignancies, breast malignancies, ovarian cancer and skin Proven overexpression in malignant disease. クラスタR11723の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、上皮悪性腫瘍、各種組織に由来する混合型悪性腫瘍、および腎臓悪性腫瘍での過剰発現を証明している。A histogram showing the expression of cluster R11723 in cancer and cell lines compared to that in normal tissues, demonstrating overexpression in epithelial malignancies, mixed malignancies from various tissues, and kidney malignancies Yes. 配列名R11723seg13に描かれたアンプリコンによって検出できる、R11723転写物の、正常組織および癌乳房組織での発現を示すヒストグラム。Histogram showing the expression of R11723 transcripts in normal and cancerous breast tissues that can be detected by the amplicon depicted in the sequence name R11723seg13. 配列名R11723seg13に描かれたアンプリコンによって検出できる、R11723転写物の、各種正常組織での発現を示すヒストグラム。The histogram which shows the expression in various normal tissues of the R11723 transcript which can be detected by the amplicon drawn by sequence name R11723seg13. 配列名R11723 junc11−19に描かれたアンプリコンによって検出できるR11723転写物の正常および癌乳房組織(図41A)または正常組織のパネル(図41B)での発現を示すヒストグラム。Histogram showing the expression of R11723 transcripts detectable by the amplicon depicted in SEQ ID R11723 junc11-19 in normal and cancer breast tissue (FIG. 41A) or normal tissue panel (FIG. 41B). 配列名R11723 junc11−19に描かれたアンプリコンによって検出できるR11723転写物の正常および癌乳房組織(図41A)または正常組織のパネル(図41B)での発現を示すヒストグラム。Histogram showing expression of normal and cancer breast tissue (FIG. 41A) or normal tissue panel (FIG. 41B) of the R11723 transcript detectable by the amplicon depicted in SEQ ID R11723 junc11-19. クラスタT46984の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、上皮悪性腫瘍、各種組織に由来する混合型悪性腫瘍、乳房悪性腫瘍、卵巣癌および膵臓癌での過剰発現を証明している。Histogram showing cluster T46984 expression in cancer and cell lines compared to expression in normal tissues, excess in epithelial malignancies, mixed malignancies from various tissues, breast malignancies, ovarian cancer and pancreatic cancer Proven expression. クラスタHSMUC1Aの癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、各種組織に由来する混合型悪性腫瘍、乳房悪性腫瘍、膵臓癌および前立腺癌での過剰発現を証明している。Histogram showing cluster HSMUC1A expression in cancer and cell lines compared to expression in normal tissue, demonstrating overexpression in mixed, breast, pancreatic and prostate cancers from various tissues ing. 正常組織および癌乳房組織での8種類の配列(T10888seg11−17、HUMGR5E junc3−7、HSSTROL3seg24、T94936 Seg 14、A21368 seg39、Z21368 junc17−21 T598322 junc6−25−26およびM85491seg24)の組合せ発現を示すヒストグラム。Histogram showing combined expression of eight sequences (T10888seg11-17, HUMGR5E junc3-7, HSSTROL3seg24, T94936 Seg14, A21368 seg39, Z21368 junc17-21 T598322 junc6-25-26 and M85491seg24) in normal tissue and cancer breast tissue . 正常組織および癌乳房組織での8種類の配列(T10888seg11−17、HUMGR5E junc3−7、HSSTROL3seg24、T94936 Seg 14、A21368 seg39、Z21368 junc17−21 T598322 junc6−25−26およびM85491seg24)の組合せ発現を示すヒストグラム。Histogram showing combined expression of eight sequences (T10888seg11-17, HUMGR5E junc3-7, HSSTROL3seg24, T94936 Seg14, A21368 seg39, Z21368 junc17-21 T598322 junc6-25-26 and M85491seg24) in normal tissue and cancer breast tissue . 正常組織および癌乳房組織での8種類の配列(T10888seg11−17、HUMGR5E junc3−7、HSSTROL3seg24、T94936 Seg 14、A21368 seg39、Z21368 junc17−21 T598322 junc6−25−26およびM85491seg24)の組合せ発現を示すヒストグラム。Histogram showing combined expression of eight sequences (T10888seg11-17, HUMGR5E junc3-7, HSSTROL3seg24, T94936 Seg14, A21368 seg39, Z21368 junc17-21 T598322 junc6-25-26 and M85491seg24) in normal tissue and cancer breast tissue . 正常組織および癌乳房組織での8種類の配列(T10888seg11−17、HUMGR5E junc3−7、HSSTROL3seg24、T94936 Seg 14、A21368 seg39、Z21368 junc17−21 T598322 junc6−25−26およびM85491seg24)の組合せ発現を示すヒストグラム。Histogram showing combined expression of eight sequences (T10888seg11-17, HUMGR5E junc3-7, HSSTROL3seg24, T94936 Seg14, A21368 seg39, Z21368 junc17-21 T598322 junc6-25-26 and M85491seg24) in normal tissue and cancer breast tissue . クラスタHSU33147の癌および細胞株での発現を正常組織での発現と比較して示すヒストグラムで、各種組織に由来する混合型悪性腫瘍での過剰発現を証明している。A histogram showing the expression of cluster HSU33147 in cancer and cell lines compared to that in normal tissues demonstrates overexpression in mixed malignant tumors derived from various tissues.

Claims (52)

単離されたポリヌクレオチドにおいて、R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、及びR11723_PEA_1_T6からなる群より選択される配列を有するポリヌクレオチドを含むことを特徴とする単離されたポリヌクレオチド。   An isolated polynucleotide comprising a polynucleotide having a sequence selected from the group consisting of R11723_PEA_1_T15, R11723_PEA_1_T17, R11723_PEA_1_T19, R11723_PEA_1_T20, R11723_PEA_1_T5, and R11723_PEA_1_T6. 単離されたポリヌクレオチドにおいて、R11723_PEA_1_node_13、R11723_PEA_1_node_16、R11723_PEA_1_node_19、R11723_PEA_1_node_2、R11723_PEA_1_node_22、R11723_PEA_1_node_31、R11723_PEA_1_node_10、R11723_PEA_1_node_11、R11723_PEA_1_node_15、R11723_PEA_1_node_18、R11723_PEA_1_node_20、R11723_PEA_1_node_21、 R11723_PEA_1_node_23、R11723_PEA_1_node_24、R11723_PEA_1_node_25、R11723_PEA_1_node_26、R11723_PEA_1_node_27、R11723_PEA_1_node_28、R11723_PEA_1_node_29、R11723_PEA_1_node_3、R11723_PEA_1_node_30、R11723_PEA_1_node_4、R11723_PEA_1_node_5、R11723_PEA_1_node_6、R11723_PEA_1_node_7、及びR11723_PEA_1_node_8からなる群より選択される配列を有するノ−ドを含むことを特徴とする単離されたポリヌクレオチド。   In the isolated polynucleotides, R11723_PEA_1_node_13, R11723_PEA_1_node_16, R11723_PEA_1_node_19, R11723_PEA_1_node_2, R11723_PEA_1_node_22, R11723_PEA_1_node_31, R11723_PEA_1_node_10, R11723_PEA_1_node_11, R11723_PEA_1_node_15, R11723_PEA_1_node_18, R11723_PEA_1_node_20, R11723_PEA_1_node_21, R11723_PEA_1_node_23, R11723_PEA_1_node_24, R11723_PEA_1_node_25, R11723_PEA_1_node_26, R11723_PEA_1_node_27, R11723_PEA_1_node_28, R11723_PEA_1_node_29, R11723_PEA_1_node_3, R11723_PEA_1_node_30, An isolated polynucleotide comprising a node having a sequence selected from the group consisting of R11723_PEA_1_node_4, R11723_PEA_1_node_5, R11723_PEA_1_node_6, R11723_PEA_1_node_7, and R11723_PEA_1_node_8. 単離されたポリヌクレオチドにおいて、R11723_PEA_1_P2、R11723_PEA_1_P6、R11723_PEA_1_P7、R11723_PEA_1_P13、及びR11723_PEA_1_P10からなる群より選択される配列を有するポリヌクレオチドを含むことを特徴とする単離されたポリヌクレオチド。   An isolated polynucleotide comprising a polynucleotide having a sequence selected from the group consisting of R11723_PEA_1_P2, R11723_PEA_1_P6, R11723_PEA_1_P7, R11723_PEA_1_P13, and R11723_PEA_1_P10. R11723_PEA_1_P6をコ−ドする単離されたキメラポリペプチドにおいて、R11723_PEA_1_P6のアミノ酸1〜110に相当する配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、及びQ81XM0のアミノ酸1〜112に相当し、またR11723_PEA_1_P6のアミノ酸111〜222にも相当するMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQに少なくとも90%相同である第二アミノ酸配列とを含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In an isolated chimeric polypeptide that codes for R11723_PEA_1_P6, the sequence corresponding to amino acids 1-110 of R11723_PEA_1_P6 is MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLVGSAG PCRHK Is at least 90% and most preferably at least 95% homologous, and corresponds to amino acids 1-112 of Q81XM0 and also amino acids 111-222 of R11723_PEA_1_P6 and MYAQALLVVGVLQRQAAAQHLHEQPP An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P6の頭部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P6の配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRを有するポリペプチドに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that encodes the head of R11723_PEA_1_P6, the sequence of R11723_PEA_1_P6 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAVGREE An isolated polypeptide characterized in that it comprises a polypeptide that is 90%, and most preferably at least about 95% homologous. R11723_PEA_1_P6をコ−ドする単離されたキメラポリペプチドにおいて、Q96AC2のアミノ酸1〜83に相当し、またR11723_PEA_1_P6のアミノ酸1〜83にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGに少なくとも90%相同である第一アミノ酸配列、及びR11723_PEA_1_P6のアミノ酸84〜222に相当する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする、単離されたキメラポリペプチド。   In the isolated chimeric polypeptide that codes for R11723_PEA_1_P6, the first amino acid sequence is at least the first amino acid sequence of MMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMASAG corresponding to amino acids 1 to 83 of Q96AC2 and also corresponding to amino acids 1 to 83 of R11723_PEA_1_P6 The sequence corresponding to amino acids 84-222 of R11723_PEA_1_P6 SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRREQ %% preferably at least An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P6の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P6の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that encodes the tail of R11723_PEA_1_P6, the sequence SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQER VDDRAEVEKRLREGEEDHVRPEVGPRPVVGFHRSHQPNRQ An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P6をコ−ドする単離されたキメラポリペプチドにおいて、Q8N2G4のアミノ酸1〜83に相当し、またR11723_PEA_1_P6のアミノ酸1〜83にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGに少なくとも90%相同である第一アミノ酸配列、及びR11723_PEA_1_P6のアミノ酸84〜222に相当する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In an isolated chimeric polypeptide that codes for R11723_PEA_1_P6, it corresponds to amino acids 1 to 83 of Q8N2G4, and also corresponds to amino acids 1 to 83 of R11723_PEA_1_P6, which is at least the first amino acid sequence homologous to MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQASMY and amino acids 1 to 83 The sequence corresponding to amino acids 84-222 of R11723_PEA_1_P6 SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRREQ %% preferably at least An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P6の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P6の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that encodes the tail of R11723_PEA_1_P6, the sequence SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQER VDDRAEVEKRLREGEEDHVRPEVGPRPVVGFHRSHQPNRQ An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P6をコ−ドする単離されたキメラポリペプチドにおいて、BAC85518のアミノ酸24〜106に相当し、またR11723_PEA_1_P6のアミノ酸1〜83にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGに少なくとも90%相同である第一アミノ酸配列、及びR11723_PEA_1_P6のアミノ酸84〜222に相当する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In the isolated chimeric polypeptide that codes for R11723_PEA_1_P6, the first amino acid sequence is at least the first amino acid sequence that is homologous to MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMASAG corresponding to amino acids 24-106 of BAC85518 and also corresponding to amino acids 1-83 of R11723_PEA_1_P6, The sequence corresponding to amino acids 84-222 of R11723_PEA_1_P6 SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRREQ %% preferably at least An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P6の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P6の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that encodes the tail of R11723_PEA_1_P6, the sequence SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQER VDDRAEVEKRLREGEEDHVRPEVGPRPVVGFHRSHQPNRQ An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P7をコ−ドする単離されたキメラポリペプチドにおいて、Q96AC2のアミノ酸1〜64に相当し、またR11723_PEA_1_P7のアミノ酸1〜64にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGに少なくとも90%相同である第一アミノ酸配列、及びR11723_PEA_1_P7のアミノ酸65〜93に相当する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In an isolated chimeric polypeptide that codes for R11723_PEA_1_P7, at least 90% of the amino acid sequence at least 90% homologous to the amino acid sequence 1 to 64 of Q96AC2 and also corresponding to amino acids 1 to 64 of R11723_PEA_1_P7, which is at least 90% homologous in sequence MMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAG At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7 An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P7の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P7の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that codes the tail of R11723_PEA_1_P7, at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT of R11723_PEA_1_P7 An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P7をコ−ドする単離されたキメラポリペプチドにおいて、Q8N2G4のアミノ酸1〜64に相当し、またR11723_PEA_1_P7のアミノ酸1〜64にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGに少なくとも90%相同である第一アミノ酸配列、及びR11723_PEA_1_P7のアミノ酸65〜93に相当する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In an isolated chimeric polypeptide that codes for R11723_PEA_1_P7, the first sequence is at least 90 amino acids in sequence MKVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMC corresponding to amino acids 1 to 64 of Q8N2G4 and also corresponding to amino acids 1 to 64 of R11723_PEA_1_P7 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7 An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P7の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P7の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that codes the tail of R11723_PEA_1_P7, at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT of R11723_PEA_1_P7 An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P7をコ−ドする単離されたキメラポリペプチドにおいて、R11723_PEA_1_P7のアミノ酸1〜5に相当する配列NWVLGを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、BAC85273のアミノ酸22〜80に相当し、またR11723_PEA_1_P7のアミノ酸6〜64にも相当するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAG に少なくとも90%相同である第二アミノ酸、及びR11723_PEA_1_P7のアミノ酸65〜93に相当する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、前記第一、第二及び第三アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In an isolated chimeric polypeptide that codes for R11723_PEA_1_P7, at least 70%, optionally at least 80%, preferably at least 85%, more preferably a polypeptide having the sequence NWVLG corresponding to amino acids 1-5 of R11723_PEA_1_P7 Is at least 90% homologous to IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAG which corresponds to amino acids 22-80 of BAC85273 and also amino acids 6-64 of R11723_PEA_1_P7 Two amino acids and at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% for a polypeptide having the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7 % Comprising a third amino acid sequence that is homologous, said first, An isolated chimeric polypeptide characterized in that the second and third amino acid sequences are in sequence order. R11723_PEA_1_P7の頭部をコ−ドする単離されたキメラポリペプチドにおいて、R11723_PEA_1_P7の配列NWVLGに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated chimeric polypeptide that encodes the head of R11723_PEA_1_P7, at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, to the sequence NWVLG of R11723_PEA_1_P7, And most preferably, an isolated polypeptide comprising a polypeptide that is at least about 95% homologous. R11723_PEA_1_P7の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P7の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that codes the tail of R11723_PEA_1_P7, at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT of R11723_PEA_1_P7 An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P7をコ−ドする単離されたキメラポリペプチドにおいて、BAC85518のアミノ酸24〜87に相当し、またR11723_PEA_1_P7のアミノ酸1〜64にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGに少なくとも90%相同である第一アミノ酸配列、及びR11723_PEA_1_P7のアミノ酸65〜93に相当する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In an isolated chimeric polypeptide that codes for R11723_PEA_1_P7, at least 90% of the amino acid sequence at least 90% homologous to the amino acids 24-87 of BAC85518 and also corresponding to amino acids 1-64 of R11723_PEA_1_P7 at the amino acid sequence at least 90% homologous to MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAG At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT corresponding to amino acids 65-93 of R11723_PEA_1_P7 An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P7の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P7の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that codes the tail of R11723_PEA_1_P7, at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably the sequence SHCVTRLECSGTISAHCNLCLPGSNDHPT of R11723_PEA_1_P7 An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P13をコ−ドする単離されたキメラポリペプチドにおいて、Q96AC2のアミノ酸1〜63に相当し、またR11723_PEA_1_P13のアミノ酸1〜63にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAに少なくとも90%相同である第一アミノ酸配列、及びR11723_PEA_1_P13のアミノ酸64〜84に相当する配列DTKRTNTLLFEMRHFAKQLTTを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In an isolated chimeric polypeptide that codes for R11723_PEA_1_P13, at least 90% of the amino acid sequence at least 90% homologous to the amino acid sequence 1 to 63 of Q96AC2 and also corresponding to amino acids 1 to 63 of R11723_PEA_1_P13, which is at least 90% homologous to the sequence of MMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence DTKRTNTLLFEMRHFAKQLTT corresponding to amino acids 64-84 of R11723_PEA_1_P13 An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P13の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P13の配列DTKRTNTLLFEMRHFAKQLTTに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that encodes the tail of R11723_PEA_1_P13, the sequence DTKRTNTLLFEMRHFAKQLTT of R11723_PEA_1_P13 is at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P10をコ−ドする単離されたキメラポリペプチドにおいて、Q96AC2のアミノ酸1〜63に相当し、またR11723_PEA_1_P10のアミノ酸1〜63にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAに少なくとも90%相同である第一アミノ酸配列、及びR11723_PEA_1_P10のアミノ酸64〜90に相当する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In the isolated chimeric polypeptide that codes for R11723_PEA_1_P10, at least 90% of the first amino acid sequence in amino acids 1 to 63 of Q96AC2 and also corresponding to amino acids 1 to 63 of R11723_PEA_1_P10, which is at least 90% homologous in sequence and amino acid sequence of MMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10 An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P10の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P10の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that encodes the tail of R11723_PEA_1_P10, at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK of R11723_PEA_1_P10 An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P10をコ−ドする単離されたキメラポリペプチドにおいて、Q8N2G4のアミノ酸1〜63に相当し、またR11723_PEA_1_P10のアミノ酸1〜63にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAに少なくとも90%相同である第一アミノ酸配列、及びR11723_PEA_1_P10のアミノ酸64〜90に相当する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In an isolated chimeric polypeptide that codes for R11723_PEA_1_P10, at least the first amino acid sequence at least 90 amino acids in sequence MKVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMC corresponding to amino acids 1 to 63 of Q8N2G4 and amino acids 1 to 63 of R11723_PEA_1_P10 At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10 An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P10の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P10の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that codes the tail of R11723_PEA_1_P10, at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably in the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK of R11723_PEA_1_P10 An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P10をコ−ドする単離されたキメラポリペプチドにおいて、R11723_PEA_1_P10のアミノ酸1〜5に相当する配列NWVLGを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第一アミノ酸配列、BAC85273のアミノ酸22〜79に相当し、またR11723_PEA_1_P10のアミノ酸6〜63にも相当するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA に少なくとも90%相同である第二アミノ酸、及びR11723_PEA_1_P10のアミノ酸64〜90に相当する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第三アミノ酸配列を含み、前記第一、第二及び第三アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In an isolated chimeric polypeptide that codes for R11723_PEA_1_P10, at least 70%, optionally at least 80%, preferably at least 85%, more preferably a polypeptide having the sequence NWVLG corresponding to amino acids 1-5 of R11723_PEA_1_P10 Is at least 90% homologous to IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA which corresponds to amino acids 22-79 of BAC85273 and also corresponding to amino acids 6-63 of R11723_PEA_1_P10 And at least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% for a polypeptide having the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10 Containing a third amino acid sequence that is% homologous, Isolated chimeric polypeptides second and third amino acid sequence is characterized in that in the arrangement order. R11723_PEA_1_P10の頭部をコ−ドする単離されたキメラポリペプチドにおいて、R11723_PEA_1_P10の配列NWVLGに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated chimeric polypeptide that encodes the head of R11723_PEA_1_P10, at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, to the sequence NWVLG of R11723_PEA_1_P10 And most preferably, an isolated polypeptide comprising a polypeptide that is at least about 95% homologous. R11723_PEA_1_P10の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P10の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that codes the tail of R11723_PEA_1_P10, at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably in the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK of R11723_PEA_1_P10 An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. R11723_PEA_1_P10をコ−ドする単離されたキメラポリペプチドにおいて、BAC85518のアミノ酸24〜86に相当し、またR11723_PEA_1_P10のアミノ酸1〜63にも相当するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAに少なくとも90%相同である第一アミノ酸配列、及びR11723_PEA_1_P10のアミノ酸64〜90に相当する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドに少なくとも70%、選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、そして最も好ましくは少なくとも95%相同である第二アミノ酸配列を含み、前記第一及び第二アミノ酸配列が配列順にあることを特徴とする単離されたキメラポリペプチド。   In an isolated chimeric polypeptide that codes for R11723_PEA_1_P10, at least 90% of the amino acid sequence at least 90% homologous to the amino acids 24-86 of BAC85518 and also corresponding to amino acids 1-63 of R11723_PEA_1_P10, which is at least 90% homologous to the amino acid sequence of MMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSA At least 70%, optionally at least 80%, preferably at least 85%, more preferably at least 90%, and most preferably at least 95% homologous to a polypeptide having the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK corresponding to amino acids 64-90 of R11723_PEA_1_P10 An isolated chimeric polypeptide comprising a second amino acid sequence, wherein the first and second amino acid sequences are in sequence order. R11723_PEA_1_P10の尾部をコ−ドする単離されたポリペプチドにおいて、R11723_PEA_1_P10の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKに少なくとも70%、選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、そして最も好ましくは少なくとも約95%相同であるポリペプチドを含むことを特徴とする単離されたポリペプチド。   In an isolated polypeptide that codes the tail of R11723_PEA_1_P10, at least 70%, optionally at least about 80%, preferably at least about 85%, more preferably at least about 90%, and most preferably in the sequence DRVSLCHEAGVQWNNFSTLQPLPPRLK of R11723_PEA_1_P10 An isolated polypeptide characterized in that it comprises a polypeptide that is preferably at least about 95% homologous. 単離されたオリゴヌクレオチドにおいて、配列番号:891又は894からなる群より選択されたアンプリコンを含むことを特徴とする単離されたオリゴヌクレオチド。   An isolated oligonucleotide comprising an amplicon selected from the group consisting of SEQ ID NO: 891 or 894. プライマ−ペアにおいて、請求項32に記載の前記アンプリコンを増幅できる単離されたオリゴヌクレオチドのペアを含むことを特徴とするプライマ−ペア。   37. A primer pair comprising a pair of isolated oligonucleotides capable of amplifying the amplicon of claim 32. 請求項33に記載のプライマ−ペアにおいて、配列番号889及び890、配列番号892及び893なる群から選択される単離されたオリゴヌクレオチドのペアを含むことを特徴とするプライマ−ペア。   34. The primer pair of claim 33, comprising a pair of isolated oligonucleotides selected from the group consisting of SEQ ID NOs: 889 and 890, SEQ ID NOs: 892 and 893. 抗体において、請求項3〜31のいずれかに記載のアミノ酸配列のエピト−プに特異的に結合できることを特徴とする抗体。   32. An antibody that can specifically bind to an epitope of the amino acid sequence according to any one of claims 3 to 31. 請求項35に記載の抗体が、前記アミノ酸配列が請求項4〜31記載の前記尾部を含むことを特徴とする抗体。   36. The antibody according to claim 35, wherein the amino acid sequence includes the tail according to claims 4-31. 請求項35又は36に記載の抗体が、前記抗体が前記エピト−プを有するスプライシング変異体と対応する既知タンパク質PSECとを識別できることを特徴とする抗体。   37. The antibody according to claim 35 or 36, wherein the antibody can distinguish a splicing variant having the epitope from a known protein PSEC corresponding thereto. 乳癌を検出するためのキットにおいて、上記いずれかの請求項に記載のスプライシング変異体の過剰発現を検出するキットを含むことを特徴とするキット。   A kit for detecting breast cancer, comprising a kit for detecting overexpression of a splicing variant according to any one of the above claims. 請求項38に記載のキットにおいて、前記キットがNATをベ−スとした技術を含むことを特徴とするキット。   40. The kit according to claim 38, wherein the kit includes NAT-based technology. 請求項39に記載のキットにおいて、前記キットが請求項1又は2に記載の核酸配列に選択的にハイブリダイゼ−ションできる少なくとも一組のプライマ−ペアをさらに含むことを特徴とするキット。   40. The kit according to claim 39, further comprising at least one primer pair capable of selectively hybridizing to the nucleic acid sequence according to claim 1 or 2. 請求項38に記載のキットにおいて、前記キットが請求項1又は2に記載の核酸配列に選択的にハイブリダイゼ−ションできる少なくとも一つのオリゴヌクレオチドをさらに含むことを特徴とするキット。   40. The kit according to claim 38, further comprising at least one oligonucleotide capable of selectively hybridizing to the nucleic acid sequence according to claim 1 or 2. 請求項38に記載のキットにおいて、前記キットが請求項35〜37のいずれかに記載の抗体を含むことを特徴とするキット。   The kit according to claim 38, wherein the kit comprises the antibody according to any one of claims 35 to 37. 請求項42に記載のキットにおいて、前記キットがELISA又はウエスタンブロットを実施するための少なくとも一つの試薬をさらに含むことを特徴とするキット。   43. The kit of claim 42, further comprising at least one reagent for performing an ELISA or Western blot. 乳癌を検出するための方法において、上記請求項のいずれかに記載のスプライシング変異体の過剰発現を検出することを含むことを特徴とする方法。   A method for detecting breast cancer, comprising detecting overexpression of a splicing variant according to any of the preceding claims. 請求項44に記載の方法において、前記過剰発現の検出をNATをベ−スとした技術を用いて実施することを特徴とする方法。   45. The method according to claim 44, wherein the overexpression is detected using a NAT-based technique. 請求項44に記載の方法において、前記過剰発現の検出をイムノアッセイを用いて実施することを特徴とする方法。   45. The method of claim 44, wherein the overexpression is detected using an immunoassay. 請求項46に記載の方法において、前記イムノアッセイが上記請求項のいずれかに記載の抗体を含むことを特徴とする方法。   48. The method of claim 46, wherein the immunoassay comprises the antibody of any of the preceding claims. 乳癌を検出することができるバイオマ−カ−において、上記いずれかの核酸配列又はその断片、あるいは上記いずれかのアミノ酸配列又はその断片を含むことを特徴とするバイオマ−カ−。   A biomarker capable of detecting breast cancer, comprising any one of the above nucleic acid sequences or fragments thereof, or any one of the above amino acid sequences or fragments thereof. 乳癌をスクリ−ニングするための方法において、上記請求項のいずれかに記載のバイオマ−カ−、又は抗体、又は方法、又はアッセイを用いて乳癌細胞を検出することを含むことを特徴とする方法。   A method for screening breast cancer comprising detecting breast cancer cells using the biomarker or antibody or method or assay of any of the preceding claims. . 乳癌を診断するための方法において、上記請求項のいずれかに記載のバイオマ−カ−、又は抗体、又は方法、又はアッセイを用いて乳癌細胞を検出することを含むことを特徴とする方法。   A method for diagnosing breast cancer, comprising detecting breast cancer cells using a biomarker or antibody or method or assay according to any of the preceding claims. 疾患の進行及び/又は治療の効果及び/又は乳癌の再発をモニタリングするための方法において、上記請求項のいずれかに記載のバイオマ−カ−、又は抗体、又は方法、又はアッセイを用いて乳癌細胞を検出することを含むことを特徴とする方法。   A method for monitoring disease progression and / or therapeutic effect and / or recurrence of breast cancer in a breast cancer cell using a biomarker or antibody or method or assay according to any of the preceding claims. Detecting the method. 乳癌治療法を選択する方法において、上記請求項のいずれかに記載のバイオマ−カ−、又は抗体、又は方法、又はアッセイを用いて乳癌細胞を検出すること、及び前記検出に従って治療法を選択することを含むことを特徴とする方法。   A method of selecting a breast cancer treatment, wherein the biomarker or antibody or method or assay of any of the above claims is used to detect breast cancer cells and the treatment is selected according to said detection. A method comprising:
JP2006550364A 2004-01-27 2005-01-27 Novel nucleotide and amino acid sequences, and assays and methods of use for breast cancer diagnosis using the same Pending JP2007520217A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US53912904P 2004-01-27 2004-01-27
US62091804P 2004-10-22 2004-10-22
US62091704P 2004-10-22 2004-10-22
US62810104P 2004-11-17 2004-11-17
PCT/IB2005/000433 WO2005072050A2 (en) 2004-01-27 2005-01-27 Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of breast cancer

Publications (2)

Publication Number Publication Date
JP2007520217A true JP2007520217A (en) 2007-07-26
JP2007520217A5 JP2007520217A5 (en) 2008-06-19

Family

ID=38344787

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006550364A Pending JP2007520217A (en) 2004-01-27 2005-01-27 Novel nucleotide and amino acid sequences, and assays and methods of use for breast cancer diagnosis using the same

Country Status (1)

Country Link
JP (1) JP2007520217A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998007749A1 (en) * 1996-08-23 1998-02-26 Human Genome Sciences, Inc. Novel human growth factors
WO2000077037A2 (en) * 1999-06-15 2000-12-21 Genentech, Inc. Secreted and transmembrane polypeptides and nucleic acids encoding the same
JP2003524017A (en) * 2000-02-25 2003-08-12 オックスフォード グリコサイエンセス(ユーケー) リミテッド protein

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998007749A1 (en) * 1996-08-23 1998-02-26 Human Genome Sciences, Inc. Novel human growth factors
WO2000077037A2 (en) * 1999-06-15 2000-12-21 Genentech, Inc. Secreted and transmembrane polypeptides and nucleic acids encoding the same
JP2003524017A (en) * 2000-02-25 2003-08-12 オックスフォード グリコサイエンセス(ユーケー) リミテッド protein

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6010047371, Br J Cancer. 2003 Feb 24;88(4):579−85. *
JPN6010047372, J Biol Chem. 2003 Feb 21;278(8):6482−9. Epub 2002 Dec 10. *

Similar Documents

Publication Publication Date Title
EP2740742B1 (en) Fusion gene of kif5b gene and ret gene, and method for determining effectiveness of cancer treatment targeting fusion gene
EP2456889B1 (en) Markers for endometrial cancer
EP2300041B1 (en) Method for determining risk of recurrence of prostate cancer
US20140221244A1 (en) Methods and Compositions for the Treatment and Diagnosis of Colorectal Cancer
KR20080080525A (en) Effects of inhibitors of fgfr3 on gene transcription
US20020076735A1 (en) Diagnostic and therapeutic methods using molecules differentially expressed in cancer cells
CA2840472A1 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
JP2011254830A (en) Polynucleotide related to colon cancer
US20060263786A1 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of colon cancer
JP2008507261A (en) Novel nucleotide and amino acid sequences for lung cancer diagnosis, and assays and methods of use thereof
EP1721257A2 (en) Differential expression of markers in ovarian cancer
JP7150018B2 (en) Novel CIP2A variants and uses thereof
US7528243B2 (en) Nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of breast cancer
WO2005072050A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of breast cancer
EP1749025A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of colon cancer
US6544742B1 (en) Detection of genes regulated by EGF in breast cancer
JP2007520217A (en) Novel nucleotide and amino acid sequences, and assays and methods of use for breast cancer diagnosis using the same
US8354243B2 (en) Method for determining presence of cancer in a sample by assaying for expression of ECSA/DPPA-2 nucleotide sequences
WO2005107364A9 (en) Polynucleotide, polypeptides, and diagnostic methods
EP1735468A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer
WO2006021874A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer
US7355025B2 (en) Marker molecules associated with lung tumors
EP1732943A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of breast cancer
AU2005276208A1 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071129

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080116

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100907

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110208