JPWO2008114709A1 - Biomarkers specific for blood cells or specific for osteoclast differentiation - Google Patents

Biomarkers specific for blood cells or specific for osteoclast differentiation Download PDF

Info

Publication number
JPWO2008114709A1
JPWO2008114709A1 JP2009505187A JP2009505187A JPWO2008114709A1 JP WO2008114709 A1 JPWO2008114709 A1 JP WO2008114709A1 JP 2009505187 A JP2009505187 A JP 2009505187A JP 2009505187 A JP2009505187 A JP 2009505187A JP WO2008114709 A1 JPWO2008114709 A1 JP WO2008114709A1
Authority
JP
Japan
Prior art keywords
seq
acid sequence
nucleic acid
amino acid
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009505187A
Other languages
Japanese (ja)
Other versions
JP5451376B2 (en
Inventor
若松 愛
愛 若松
山本 順一
順一 山本
磯貝 隆夫
隆夫 磯貝
Original Assignee
株式会社リバース・プロテオミクス研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社リバース・プロテオミクス研究所 filed Critical 株式会社リバース・プロテオミクス研究所
Priority to JP2009505187A priority Critical patent/JP5451376B2/en
Publication of JPWO2008114709A1 publication Critical patent/JPWO2008114709A1/en
Application granted granted Critical
Publication of JP5451376B2 publication Critical patent/JP5451376B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本発明は、血球系又は破骨細胞の障害に基づく疾患に対する診断用試薬、及び新たな作用機序を有する、このような疾患に対する医薬等の開発に有用な手段を提供する。より詳細には、本発明は、血球系に特異的あるいは破骨細胞分化に特異的なバイオマーカーとして使用し得る、新規ポリペプチド及びその特異的な部分ペプチド、並びに新規ポリヌクレオチド及びその特異的な部分ヌクレオチド;このようなポリヌクレオチド及びその特異的な部分ペプチドの発現ベクター;このような発現ベクターが導入された形質転換体;このようなバイオマーカーに対するアンチセンス分子、RNAi誘導性核酸(例、siRNA)、アプタマー、抗体、及びそれらを含む組成物;このようなバイオマーカーの発現又は機能が調節された、哺乳動物細胞又は非ヒト哺乳動物;このようなバイオマーカーの測定用手段(例、プライマーセット、核酸プローブ、抗体、アプタマー)、及びそれらを含む試薬などを提供する。The present invention provides a diagnostic reagent for a disease based on a disorder of blood cells or osteoclasts, and a useful means for development of a medicine for such a disease having a new mechanism of action. More specifically, the present invention relates to a novel polypeptide and its specific partial peptide, and a novel polynucleotide and its specific, which can be used as a biomarker specific to blood cells or specific to osteoclast differentiation. Partial nucleotides; expression vectors for such polynucleotides and their specific partial peptides; transformants into which such expression vectors have been introduced; antisense molecules to such biomarkers, RNAi-inducible nucleic acids (eg, siRNA) ), Aptamers, antibodies, and compositions containing them; mammalian cells or non-human mammals in which the expression or function of such biomarkers is regulated; means for measuring such biomarkers (eg, primer sets) , Nucleic acid probes, antibodies, aptamers), and reagents containing them.

Description

本発明は、血球系(blood cells)に特異的あるいは破骨細胞分化に特異的なバイオマーカーとして使用され得る、ポリペプチド及びその部分ペプチド、並びにポリヌクレオチド及びその部分ヌクレオチド;発現ベクター;形質転換体;アンチセンス分子、RNAi誘導性核酸(例、siRNA)、アプタマー、抗体、及びそれらを含む組成物;哺乳動物細胞又は非ヒト哺乳動物;血球系に特異的あるいは破骨細胞分化に特異的なバイオマーカーの測定用手段(例、プライマーセット、核酸プローブ、抗体、アプタマー)及び測定方法などを提供する。   The present invention relates to a polypeptide and a partial peptide thereof, and a polynucleotide and a partial nucleotide thereof, which can be used as a biomarker specific to blood cells or to osteoclast differentiation; an expression vector; a transformant Antisense molecules, RNAi-inducible nucleic acids (eg, siRNA), aptamers, antibodies, and compositions containing them; mammalian cells or non-human mammals; Means for measuring a marker (eg, primer set, nucleic acid probe, antibody, aptamer), a measuring method, and the like are provided.

ヒトゲノム研究の進展により、ヒトの染色体配列の解析は大幅に進んだが、それによりヒト遺伝子機能の全てが明らかになったわけではない。ヒトでは、遺伝子の多様性がその遺伝子の機能の変化に大きく関連している。実際、ヒトでは、染色体の特定領域から複数のmRNAが転写され、異なるバリアントを生じることが知られている。   Advances in human genome research have greatly advanced the analysis of human chromosomal sequences, but not all of the functions of human genes have been revealed. In humans, gene diversity is largely associated with changes in the function of the gene. In fact, in humans, it is known that multiple mRNAs are transcribed from specific regions of the chromosome, resulting in different variants.

血球系に特異的又は破骨細胞分化に特異的なバイオマーカーとして使用され得る、本発明者らにより今回見出された一連の遺伝子(必要に応じて「血球系・破骨細胞特異的遺伝子」と省略)については、既知バリアントが報告されている。例えば、このような既知バリアントとして、血球系・破骨細胞特異的遺伝子1(Genbankアクセッション番号:NM_012252.1;非特許文献1、2)、血球系・破骨細胞特異的遺伝子2(Genbankアクセッション番号:NM_001637.1;非特許文献3、4)、血球系・破骨細胞特異的遺伝子3(Genbankアクセッション番号:NM_002314.2;非特許文献5、6)、血球系・破骨細胞特異的遺伝子4(Genbankアクセッション番号:NM_002830.2;非特許文献7、8)、血球系・破骨細胞特異的遺伝子5(Genbankアクセッション番号:NM_006153.3;非特許文献9、10)、血球系・破骨細胞特異的遺伝子6(Genbankアクセッション番号:NM_000480.1;非特許文献11、12)、血球系・破骨細胞特異的遺伝子7(Genbankアクセッション番号:NM_024850.1;非特許文献13、14)、血球系・破骨細胞特異的遺伝子8(Genbankアクセッション番号:NM_015864.2;非特許文献15、16)、血球系・破骨細胞特異的遺伝子9(Genbankアクセッション番号:NM_139241.1;非特許文献17、18)、血球系・破骨細胞特異的遺伝子10(Genbankアクセッション番号:NM_178833.3;非特許文献19)、血球系・破骨細胞特異的遺伝子11(Genbankアクセッション番号:NM_005807.1;非特許文献20、21)、血球系・破骨細胞特異的遺伝子12(Genbankアクセッション番号:NM_031443.2;非特許文献22、23)の既知バリアントが報告されている。   A series of genes found by the present inventors that can be used as a biomarker specific for blood cell lineage or specific for osteoclast differentiation (if necessary, “blood cell line / osteoclast specific gene”) For abbreviated), known variants have been reported. For example, as such known variants, blood cell / osteoclast-specific gene 1 (Genbank accession number: NM_012252.1; Non-patent Documents 1 and 2), blood cell / osteoclast-specific gene 2 (Genbank access) Session number: NM_001637.1; Non-patent document 3, 4), Blood cell / osteoclast specific gene 3 (Genbank accession number: NM_002314.2; Non-patent document 5, 6), Blood cell / osteoclast specific Gene 4 (Genbank accession number: NM_002830.2; Non-patent documents 7, 8), blood cell line / osteoclast specific gene 5 (Genbank accession number: NM_006153.3; Non-patent documents 9, 10), blood cell System / osteoclast-specific gene 6 (Genbank accession number: NM_000480.1; Non-patent documents 11 and 12), blood cell system / osteoclast-specific gene 7 (Genbank accession number: NM_024850.1; non-patent document) 13, 14), blood cell line, osteoclast Specific gene 8 (Genbank accession number: NM_015864.2; Non-patent documents 15, 16), blood cell line / osteoclast specific gene 9 (Genbank accession number: NM_139241.1; Non-patent documents 17, 18), Blood cell / osteoclast specific gene 10 (Genbank accession number: NM_178833.3; Non-patent document 19), Blood cell / osteoclast specific gene 11 (Genbank accession number: NM_005807.1; Non-patent document 20) 21), a known variant of the blood cell line / osteoclast specific gene 12 (Genbank accession number: NM_031443.2; non-patent documents 22, 23) has been reported.

しかしながら、血球系・破骨細胞特異的遺伝子1〜12が血球系に特異的あるいは破骨細胞分化に特異的なバイオマーカーとして有用であり得ること、並びに血球系・破骨細胞特異的遺伝子1〜12について、本発明者らにより見出された特定のバリアントが存在することは知られていない。
Zhao, G.Q. et al., Mol. Cell. Biol. 13 (8), 4505-4512 (1993) Yasumoto, K. et al., Biochim. Biophys. Acta 1353 (1), 23-31 (1997) McDermott, C.M. et al., Infect. Immun. 59 (2), 478-485 (1991) Hagen, F.S. et al., Biochemistry 30 (34), 8415-8423 (1991) Mizuno, K. et al., Oncogene 9 (6), 1605-1612 (1994) Okano, I. et al., J. Biol. Chem. 270 (52), 31321-31330 (1995) Gu, M.X. et al., Proc. Natl. Acad. Sci. U.S.A. 88 (13), 5867-5871 (1991) Gu, M. et al., J. Biol. Chem. 271 (44), 27751-27759 (1996) Lehmann, J.M. et al., Nucleic Acids Res. 18 (4), 1048 (1990) Rivero-Lezcano, O.M. et al., J. Biol. Chem. 269 (26), 17363-17366 (1994) Mahnke-Zizelman, D.K. et al., J. Biol. Chem. 267 (29), 20866-20877 (1992) Yamada, Y. et al., Biochim. Biophys. Acta 1171 (1), 125-128 (1992) Clark, H.F. et al., Genome Res. 13 (10), 2265-2270 (2003) Zhang, Z. et al., Protein Sci. 13 (10), 2819-2824 (2004) Dakour, J. et al., Gene 185 (2), 153-157 (1997) Morrish, D.W. et al., J. Reprod. Immunol. 39 (1-2), 179-195 (1998) Obaishi, H. et al., J. Biol. Chem. 273 (30), 18697-18700 (1998) Ikeda, W. et al., Oncogene 20 (27), 3457-3463 (2001) Strausberg, R.L. et al., Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002) Marcelino, J. et al., Nat. Genet. 23 (3), 319-322 (1999) Ikegawa, S. et al., Cytogenet. Cell Genet. 90 (3-4), 291-297 (2000) Scherer, S.W. et al., Science 300 (5620), 767-772 (2003) Liquori, C.L. et al., Am. J. Hum. Genet. 73 (6), 1459-1464 (2003)
However, the blood cell / osteoclast-specific gene 1-12 may be useful as a biomarker specific for the blood cell system or specific for osteoclast differentiation, and the blood cell / osteoclast-specific gene 1-12. For 12, it is not known that there are specific variants found by the inventors.
Zhao, GQ et al., Mol. Cell. Biol. 13 (8), 4505-4512 (1993) Yasumoto, K. et al., Biochim. Biophys. Acta 1353 (1), 23-31 (1997) McDermott, CM et al., Infect. Immun. 59 (2), 478-485 (1991) Hagen, FS et al., Biochemistry 30 (34), 8415-8423 (1991) Mizuno, K. et al., Oncogene 9 (6), 1605-1612 (1994) Okano, I. et al., J. Biol. Chem. 270 (52), 31321-31330 (1995) Gu, MX et al., Proc. Natl. Acad. Sci. USA 88 (13), 5867-5871 (1991) Gu, M. et al., J. Biol. Chem. 271 (44), 27751-27759 (1996) Lehmann, JM et al., Nucleic Acids Res. 18 (4), 1048 (1990) Rivero-Lezcano, OM et al., J. Biol. Chem. 269 (26), 17363-17366 (1994) Mahnke-Zizelman, DK et al., J. Biol. Chem. 267 (29), 20866-20877 (1992) Yamada, Y. et al., Biochim. Biophys. Acta 1171 (1), 125-128 (1992) Clark, HF et al., Genome Res. 13 (10), 2265-2270 (2003) Zhang, Z. et al., Protein Sci. 13 (10), 2819-2824 (2004) Dakour, J. et al., Gene 185 (2), 153-157 (1997) Morrish, DW et al., J. Reprod.Immunol. 39 (1-2), 179-195 (1998) Obaishi, H. et al., J. Biol. Chem. 273 (30), 18697-18700 (1998) Ikeda, W. et al., Oncogene 20 (27), 3457-3463 (2001) Strausberg, RL et al., Proc. Natl. Acad. Sci. USA 99 (26), 16899-16903 (2002) Marcelino, J. et al., Nat. Genet. 23 (3), 319-322 (1999) Ikegawa, S. et al., Cytogenet. Cell Genet. 90 (3-4), 291-297 (2000) Scherer, SW et al., Science 300 (5620), 767-772 (2003) Liquori, CL et al., Am. J. Hum. Genet. 73 (6), 1459-1464 (2003)

血球系に特異的あるいは破骨細胞分化に特異的なバイオマーカーの解析は、例えば、血球系又は破骨細胞の同定又は破骨細胞の分化状態の判定用試薬、血球系又は破骨細胞の障害に基づく疾患に対する診断用試薬、及び新たな作用機序を有する、血球系又は破骨細胞の障害に基づく疾患に対する医薬等の開発につながる。本発明は、所定の遺伝子の発現プロファイル解析により得られた知見に基づき、このような試薬及び医薬等を提供すること、並びにこのような試薬及び医薬等の開発に有用な手段を提供することなどを目的とする。   Analysis of biomarkers specific for blood cell lineage or osteoclast differentiation can be performed by, for example, reagents for identifying blood cell line or osteoclasts or determining the differentiation state of osteoclasts, disorders of blood cell line or osteoclasts It leads to the development of diagnostic reagents for diseases based on the disease, and drugs for diseases based on disorders of blood cells or osteoclasts having a new mechanism of action. The present invention provides such reagents and medicines based on the knowledge obtained by analyzing the expression profile of a predetermined gene, and provides means useful for the development of such reagents and medicines, etc. With the goal.

本発明者らは、鋭意検討した結果、血球系に特異的あるいは破骨細胞分化に特異的なバイオマーカーとして、血球系・破骨細胞特異的遺伝子1〜12を見出した。本発明者らはまた、血球系に特異的あるいは破骨細胞分化に特異的なバイオマーカーとして使用され得る、血球系・破骨細胞特異的遺伝子1〜12の新規バリアントを見出した。従って、血球系・破骨細胞特異的遺伝子1〜12及び/又はその新規バリアントを利用することにより、血球系又は破骨細胞の同定、血球系又は破骨細胞の分化状態の判定、血球系又は破骨細胞の障害に基づく疾患に対する診断等が可能になると考えられる。特に、血球系・破骨細胞特異的遺伝子1〜12及び/又はその新規バリアントは血球系又は破骨細胞の特定の分化段階で特異的に発現していることから、このような特定の分化段階にある血球系又は破骨細胞の判定精度を高めることができる。また、血球系・破骨細胞特異的遺伝子1〜12及び/又はその新規バリアントを利用することにより、血球系又は破骨細胞の障害に基づく疾患等の所定の疾患に対する新規医薬等の開発も可能になると考えられる。
以上の知見に基づき、本発明者らは本発明を完成するに至った。
As a result of intensive studies, the present inventors have found blood cell / osteoclast-specific genes 1 to 12 as biomarkers specific to the blood cell lineage or specific to osteoclast differentiation. The present inventors have also found a novel variant of blood cell / osteoclast-specific genes 1 to 12 that can be used as a biomarker specific for blood cells or specific for osteoclast differentiation. Therefore, by using the blood cell line / osteoclast specific gene 1-12 and / or a novel variant thereof, identification of the blood cell line or osteoclast, determination of the differentiation state of the blood cell line or osteoclast, Diagnosis of diseases based on osteoclast damage is possible. In particular, since the blood cell / osteoclast-specific genes 1 to 12 and / or the novel variant thereof are specifically expressed in a specific differentiation stage of the blood cell or osteoclast, such a specific differentiation stage It is possible to improve the accuracy of determination of blood cells or osteoclasts. In addition, by using blood cell / osteoclast-specific genes 1 to 12 and / or novel variants thereof, it is possible to develop new medicines for predetermined diseases such as diseases based on disorders of blood cells or osteoclasts. It is thought to become.
Based on the above findings, the present inventors have completed the present invention.

即ち、本発明は、以下の発明などに関する:
〔1〕以下1)〜12)のいずれかのポリペプチド又はその特異的な部分ペプチド:
1)配列番号10で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
2)配列番号30若しくは配列番号37で表されるアミノ酸配列又は配列番号30で表されるアミノ酸配列において24〜543番目のアミノ酸残基からなるアミノ酸配列、あるいはそれらと実質的に同一のアミノ酸配列を有するポリペプチド;
3)配列番号57で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
4)配列番号73で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
5)配列番号88で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
6)配列番号104で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
7)配列番号120で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
8)配列番号143若しくは配列番号153で表されるアミノ酸配列、又はそれらと実質的に同一のアミノ酸配列を有するポリペプチド;
9)配列番号173若しくは配列番号180で表されるアミノ酸配列、又はそれらと実質的に同一のアミノ酸配列を有するポリペプチド;
10)配列番号201で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
11)配列番号226若しくは配列番号233で表されるアミノ酸配列又は配列番号226で表されるアミノ酸配列において25〜853番目のアミノ酸残基からなるアミノ酸配列若しくは配列番号233で表されるアミノ酸配列において25〜216番目のアミノ酸残基からなるアミノ酸配列、あるいはそれらと実質的に同一のアミノ酸配列を有するポリペプチド;あるいは
12)配列番号251、配列番号266若しくは配列番号272で表されるアミノ酸配列、又はそれらと実質的に同一のアミノ酸配列を有するポリペプチド。
〔2〕該ポリペプチドが以下1)〜12)のいずれかのポリペプチドである、上記〔1〕のポリペプチド又はその特異的な部分ペプチド:
1)配列番号10で表されるアミノ酸配列からなるポリペプチド;
2)配列番号30若しくは配列番号37で表されるアミノ酸配列又は配列番号30で表されるアミノ酸配列において24〜543番目のアミノ酸残基からなるアミノ酸配列からなるポリペプチド;
3)配列番号57で表されるアミノ酸配列からなるポリペプチド;
4)配列番号73で表されるアミノ酸配列からなるポリペプチド;
5)配列番号88で表されるアミノ酸配列からなるポリペプチド;
6)配列番号104で表されるアミノ酸配列からなるポリペプチド;
7)配列番号120で表されるアミノ酸配列からなるポリペプチド;
8)配列番号143若しくは配列番号153で表されるアミノ酸配列からなるポリペプチド;
9)配列番号173若しくは配列番号180で表されるアミノ酸配列からなるポリペプチド;
10)配列番号201で表されるアミノ酸配列からなるポリペプチド;
11)配列番号226若しくは配列番号233で表されるアミノ酸配列又は配列番号226で表されるアミノ酸配列において25〜853番目のアミノ酸残基からなるアミノ酸配列若しくは配列番号233で表されるアミノ酸配列において25〜216番目のアミノ酸残基からなるアミノ酸配列からなるポリペプチド;あるいは
12)配列番号251、配列番号266若しくは配列番号272で表されるアミノ酸配列からなるポリペプチド。
〔3〕異種アミノ酸配列からなるポリペプチドと融合している、上記〔1〕又は〔2〕のポリペプチド又はその特異的な部分ペプチド。
〔4〕以下1)〜12)のいずれかの部分ペプチドである、血球系・破骨細胞特異的遺伝子1〜12によりコードされるポリペプチドに特異的な部分ペプチド:
1)配列番号12若しくは配列番号14で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド、あるいは配列番号16で表されるアミノ酸配列を含む部分ペプチド;
2)配列番号32若しくは配列番号34で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド、あるいは配列番号39で表されるアミノ酸配列を含む部分ペプチド;
3)配列番号59で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
4)配列番号290で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
5)配列番号90で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
6)配列番号106で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
7)配列番号124、配列番号125若しくは配列番号127で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
8)配列番号145、配列番号147、配列番号149、配列番号155、配列番号157若しくは配列番号159で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
9)配列番号175、配列番号177、配列番号182若しくは配列番号184で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
10)配列番号204若しくは配列番号206で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
11)配列番号228、配列番号230、配列番号235若しくは配列番号237で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;あるいは
12)配列番号253、配列番号256、配列番号258、配列番号259、配列番号261、配列番号263、配列番号268、配列番号275、配列番号276若しくは配列番号278で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド。
〔5〕上記〔1〕〜〔3〕のいずれかのポリペプチド、又は上記〔1〕〜〔4〕のいずれかの特異的な部分ペプチドをコードするポリヌクレオチド。
〔6〕以下1)〜12)のいずれかのポリヌクレオチド又はその特異的な部分ヌクレオチド:
1)配列番号8で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
2)配列番号28若しくは配列番号35で表される核酸配列、又はそれらのORF対応核酸配列、又は配列番号28で表される核酸配列において357〜1919番目のヌクレオチド残基からなる核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
3)配列番号55で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
4)配列番号71で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
5)配列番号86で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
6)配列番号102で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
7)配列番号118で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
8)配列番号141若しくは配列番号151、又はそれらのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
9)配列番号171若しくは配列番号178で表される核酸配列、又はそれらのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
10)配列番号199で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
11)配列番号224若しくは配列番号231で表される核酸配列、又はそれらのORF対応核酸配列、又は配列番号224で表される核酸配列において118〜2604番目のヌクレオチド残基からなる核酸配列若しくは配列番号231で表される核酸配列において118〜693番目のヌクレオチド残基からなる核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;あるいは
12)配列番号249、配列番号264若しくは配列番号270で表される核酸配列、又はそれらのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド。
〔7〕該1)〜12)のいずれかのポリヌクレオチドが以下1)〜12)のいずれかのポリヌクレオチドである、上記〔6〕のポリヌクレオチド又はその特異的な部分ヌクレオチド:
1)配列番号8で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
2)配列番号28若しくは配列番号35で表される核酸配列、又はそれらのORF対応核酸配列、又は配列番号28で表される核酸配列において357〜1919番目のヌクレオチド残基からなる核酸配列からなるポリヌクレオチド;
3)配列番号55で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
4)配列番号71で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
5)配列番号86で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
6)配列番号102で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
7)配列番号118で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
8)配列番号141若しくは配列番号151、又はそれらのORF対応核酸配列からなるポリヌクレオチド;
9)配列番号171若しくは配列番号178で表される核酸配列、又はそれらのORF対応核酸配列からなるポリヌクレオチド;
10)配列番号199で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
11)配列番号224若しくは配列番号231で表される核酸配列、又はそれらのORF対応核酸配列、又は配列番号224で表される核酸配列において118〜2604番目のヌクレオチド残基からなる核酸配列若しくは配列番号231で表される核酸配列において118〜693番目のヌクレオチド残基からなる核酸配列からなるポリヌクレオチド;あるいは
12)配列番号249、配列番号264若しくは配列番号270で表される核酸配列、又はそれらのORF対応核酸配列からなるポリヌクレオチド。
〔8〕以下1)〜12)のいずれかの部分ヌクレオチドである、血球系・破骨細胞特異的遺伝子1〜12によりコードされるポリヌクレオチドに特異的な部分ヌクレオチド:
1)配列番号11、配列番号13、配列番号15、配列番号17、配列番号20、配列番号23若しくは配列番号27で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
2)配列番号31、配列番号33、配列番号38、配列番号40、配列番号43、配列番号46、配列番号49、配列番号53若しくは配列番号54で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
3)配列番号58、配列番号60、配列番号63、配列番号66若しくは配列番号70で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
4)配列番号74、配列番号75、配列番号78、配列番号81若しくは配列番号85で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
5)配列番号89、配列番号91、配列番号94、配列番号97若しくは配列番号101で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
6)配列番号105、配列番号107、配列番号110、配列番号113若しくは配列番号117で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
7)配列番号121、配列番号122、配列番号123、配列番号126、配列番号130、配列番号134若しくは配列番号140で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
8)配列番号144、配列番号146、配列番号148、配列番号150、配列番号154、配列番号156、配列番号158、配列番号160、配列番号163、配列番号166若しくは配列番号170で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
9)配列番号174、配列番号176、配列番号181、配列番号183、配列番号187、配列番号190、配列番号193、配列番号197若しくは配列番号198で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
10)配列番号202、配列番号203、配列番号205、配列番号209、配列番号212、配列番号215、配列番号218、配列番号222若しくは配列番号223で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
11)配列番号227、配列番号229、配列番号234、配列番号236、配列番号240、配列番号243、配列番号247若しくは配列番号248で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;あるいは
12)配列番号252、配列番号254、配列番号255、配列番号257、配列番号260、配列番号262、配列番号267、配列番号269、配列番号273、配列番号274、配列番号277、配列番号281、配列番号284、配列番号288若しくは配列番号289で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド。
〔9〕上記〔5〕〜〔7〕のいずれかのポリヌクレオチド、又は上記〔6〕〜〔8〕のいずれかの特異的な部分ヌクレオチド、及びそれに機能可能に連結されたプロモーターを含む、上記〔1〕〜〔3〕のいずれかのポリペプチド、又は上記〔1〕〜〔4〕のいずれかの特異的な部分ペプチドの発現ベクター。
〔10〕上記〔9〕の発現ベクターが導入された形質転換体。
〔11〕上記〔7〕又は〔8〕の特異的な部分ヌクレオチドの核酸配列に相補的な核酸配列を含み、かつ血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチドの発現を抑制し得る、アンチセンス分子。
〔12〕上記〔7〕又は〔8〕の特異的な部分ヌクレオチドの核酸配列からなるセンス鎖、及びそれに相補的な核酸配列からなるアンチセンス鎖から構成され、かつセンス鎖及びアンチセンス鎖の一方又は双方の5’末端及び/又は3’末端においてオーバーハングを有していてもよい、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチドの発現を抑制し得る、RNAi誘導性核酸。
〔13〕RNAi誘導性核酸がsiRNAである、上記〔12〕のRNAi誘導性核酸。
〔14〕上記〔2〕〜〔4〕のいずれかの特異的な部分ペプチドに対応する領域を介して、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチドに結合し得る、アプタマー。
〔15〕上記〔2〕〜〔4〕のいずれかの特異的な部分ペプチドに対応する領域を介して、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチドに結合し得る、抗体。
〔16〕抗体が以下i)〜iii)のいずれかである、上記〔15〕の抗体:
i)ポリクローナル抗体;
ii)モノクローナル抗体又はその一部;
iii)キメラ抗体、ヒト化抗体又はヒト抗体。
〔17〕上記〔15〕又は〔16〕の抗体を産生する、細胞。
〔18〕細胞がハイブリドーマである、上記〔17〕の細胞。
〔19〕上記〔1〕〜〔3〕のいずれかのポリペプチド、上記〔11〕のアンチセンス分子、上記〔12〕又は〔13〕のRNAi誘導性核酸、上記〔14〕のアプタマー、上記〔15〕又は〔16〕の抗体、あるいはそれらの発現ベクター、及び医薬として許容され得る担体を含む、組成物。
〔20〕上記〔1〕〜〔3〕のいずれかのポリペプチドの発現又は機能が調節された、哺乳動物細胞又は非ヒト哺乳動物。
〔21〕以下(a)又は(b)を含む、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリヌクレオチド又はその特異的な部分ヌクレオチドに特異的なプライマーセット:
(a)上記〔7〕のポリヌクレオチド、あるいは上記〔7〕又は〔8〕の特異的な部分ヌクレオチドの第1の核酸配列に対応するセンスプライマー;及び
(b)上記〔7〕のポリヌクレオチド、あるいは上記〔7〕又は〔8〕の特異的な部分ヌクレオチドの第2の核酸配列に相補的な核酸配列に対応するアンチセンスプライマー。
〔22〕以下(a)又は(b)のいずれかである、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリヌクレオチド又はその特異的な部分ヌクレオチドに特異的な核酸プローブ:
(a)上記〔7〕又は〔8〕の特異的な部分ヌクレオチドの核酸配列に相補的な核酸配列を含む一本鎖ポリヌクレオチド;又は
(b)上記〔7〕又は〔8〕の特異的な部分ヌクレオチドの核酸配列を含むセンス鎖、及びそれに相補的な核酸配列を含むアンチセンス鎖から構成される二本鎖ポリヌクレオチド。
〔23〕上記〔14〕のアプタマー、上記〔15〕又は〔16〕の抗体、上記〔21〕のプライマーセット及び上記〔22〕の核酸プローブから選ばれる1以上の物質又はセットを含む、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチド又はポリヌクレオチドの検出又は定量用試薬又はキット。
〔24〕血球系又は破骨細胞の同定、又はそれらの分化の判定用試薬又はキットである、上記〔23〕の試薬又はキット。
〔25〕哺乳動物から得られた生体試料、あるいは細胞又は組織培養物において、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチド又はポリヌクレオチドの発現を測定することを含み、かつ該生体試料又は該培養物が血球系又は破骨細胞あるいは造血組織、リンパ組織又は滑膜組織を含む、該ポリペプチド又はポリヌクレオチドの検出又は定量方法。
〔26〕哺乳動物から得られた生体試料、あるいは細胞又は組織培養物において、上記〔2〕又は〔3〕のポリペプチドあるいは上記〔7〕のポリヌクレオチドの発現を測定することを含む、該ポリペプチド又は該ポリヌクレオチドの検出又は定量方法。
〔27〕該生体試料又は該培養物が血球系又は破骨細胞あるいは造血組織、リンパ組織又は滑膜組織を含む、上記〔26〕の検出又は定量方法。
That is, the present invention relates to the following inventions and the like:
[1] The polypeptide of any one of 1) to 12) below or a specific partial peptide thereof:
1) a polypeptide having the amino acid sequence represented by SEQ ID NO: 10 or an amino acid sequence substantially identical thereto;
2) An amino acid sequence represented by SEQ ID NO: 30 or 37, an amino acid sequence consisting of amino acid residues 24 to 543 in the amino acid sequence represented by SEQ ID NO: 30, or an amino acid sequence substantially identical to them A polypeptide having;
3) a polypeptide having the amino acid sequence represented by SEQ ID NO: 57 or a substantially identical amino acid sequence thereto;
4) a polypeptide having the amino acid sequence represented by SEQ ID NO: 73 or an amino acid sequence substantially identical thereto;
5) A polypeptide having the amino acid sequence represented by SEQ ID NO: 88, or a substantially identical amino acid sequence thereof;
6) a polypeptide having the amino acid sequence represented by SEQ ID NO: 104 or a substantially identical amino acid sequence thereof;
7) A polypeptide having the amino acid sequence represented by SEQ ID NO: 120 or a substantially identical amino acid sequence thereof;
8) A polypeptide having the amino acid sequence represented by SEQ ID NO: 143 or SEQ ID NO: 153, or a substantially identical amino acid sequence thereto;
9) A polypeptide having the amino acid sequence represented by SEQ ID NO: 173 or SEQ ID NO: 180, or a substantially identical amino acid sequence thereof;
10) a polypeptide having the amino acid sequence represented by SEQ ID NO: 201, or a substantially identical amino acid sequence thereof;
11) 25 in the amino acid sequence represented by SEQ ID NO: 226 or SEQ ID NO: 233, the amino acid sequence consisting of the 25th to 853rd amino acid residues in the amino acid sequence represented by SEQ ID NO: 226, or the amino acid sequence represented by SEQ ID NO: 233 An amino acid sequence consisting of the 216th amino acid residue, or a polypeptide having an amino acid sequence substantially identical to them; or 12) an amino acid sequence represented by SEQ ID NO: 251, SEQ ID NO: 266 or SEQ ID NO: 272, or thereof A polypeptide having substantially the same amino acid sequence as
[2] The polypeptide of the above [1] or a specific partial peptide thereof, wherein the polypeptide is a polypeptide of any one of 1) to 12) below:
1) a polypeptide comprising the amino acid sequence represented by SEQ ID NO: 10;
2) A polypeptide comprising an amino acid sequence consisting of amino acid residues 24 to 543 in the amino acid sequence represented by SEQ ID NO: 30 or SEQ ID NO: 37 or the amino acid sequence represented by SEQ ID NO: 30;
3) a polypeptide comprising the amino acid sequence represented by SEQ ID NO: 57;
4) a polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 73;
5) a polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 88;
6) a polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 104;
7) a polypeptide comprising the amino acid sequence represented by SEQ ID NO: 120;
8) a polypeptide comprising the amino acid sequence represented by SEQ ID NO: 143 or SEQ ID NO: 153;
9) A polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 173 or SEQ ID NO: 180;
10) a polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 201;
11) 25 in the amino acid sequence represented by SEQ ID NO: 226 or SEQ ID NO: 233, the amino acid sequence consisting of the 25th to 853rd amino acid residues in the amino acid sequence represented by SEQ ID NO: 226, or the amino acid sequence represented by SEQ ID NO: 233 A polypeptide comprising an amino acid sequence comprising the 216th amino acid residue; or 12) a polypeptide comprising an amino acid sequence represented by SEQ ID NO: 251, SEQ ID NO: 266 or SEQ ID NO: 272.
[3] The polypeptide of [1] or [2] above or a specific partial peptide thereof fused to a polypeptide consisting of a heterologous amino acid sequence.
[4] A partial peptide specific to a polypeptide encoded by a blood cell / osteoclast specific gene 1-12, which is any partial peptide of 1) to 12) below:
1) the amino acid sequence represented by SEQ ID NO: 12 or SEQ ID NO: 14, or a partial peptide comprising these partial amino acid sequences, or a partial peptide comprising the amino acid sequence represented by SEQ ID NO: 16;
2) the amino acid sequence represented by SEQ ID NO: 32 or SEQ ID NO: 34, or a partial peptide comprising these partial amino acid sequences, or a partial peptide comprising the amino acid sequence represented by SEQ ID NO: 39;
3) A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 59 or a partial amino acid sequence thereof;
4) A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 290 or a partial amino acid sequence thereof;
5) A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 90 or a partial amino acid sequence thereof;
6) A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 106 or a partial amino acid sequence thereof;
7) A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 124, SEQ ID NO: 125 or SEQ ID NO: 127, or a partial amino acid sequence thereof;
8) SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 155, SEQ ID NO: 157 or SEQ ID NO: 159, or a partial peptide consisting of these partial amino acid sequences;
9) The amino acid sequence represented by SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 182 or SEQ ID NO: 184, or a partial peptide comprising these partial amino acid sequences;
10) A partial peptide comprising the amino acid sequence represented by SEQ ID NO: 204 or SEQ ID NO: 206, or a partial amino acid sequence thereof;
11) the amino acid sequence represented by SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 235 or SEQ ID NO: 237, or a partial peptide consisting of a partial amino acid sequence thereof; or 12) SEQ ID NO: 253, SEQ ID NO: 256, SEQ ID NO: 258, A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 268, SEQ ID NO: 275, SEQ ID NO: 276, or SEQ ID NO: 278, or a partial amino acid sequence thereof.
[5] A polynucleotide encoding the polypeptide of any one of [1] to [3] above or the specific partial peptide of any of [1] to [4] above.
[6] The polynucleotide according to any one of 1) to 12) below or a specific partial nucleotide thereof:
1) a nucleic acid sequence represented by SEQ ID NO: 8, a nucleic acid sequence corresponding to the ORF, or a polynucleotide having a nucleic acid sequence substantially identical to them;
2) Nucleic acid sequence represented by SEQ ID NO: 28 or SEQ ID NO: 35, or an ORF corresponding nucleic acid sequence thereof, or a nucleic acid sequence consisting of nucleotide residues 357 to 1919 in the nucleic acid sequence represented by SEQ ID NO: 28, or thereof A polynucleotide having a nucleic acid sequence substantially identical to said;
3) a polynucleotide having the nucleic acid sequence represented by SEQ ID NO: 55, the ORF-compatible nucleic acid sequence, or a nucleic acid sequence substantially the same as them;
4) a nucleic acid sequence represented by SEQ ID NO: 71, a nucleic acid sequence corresponding to the ORF, or a polynucleotide having a nucleic acid sequence substantially the same as them;
5) a polynucleotide having the nucleic acid sequence represented by SEQ ID NO: 86, the ORF-corresponding nucleic acid sequence, or a nucleic acid sequence substantially identical thereto;
6) a polynucleotide having the nucleic acid sequence represented by SEQ ID NO: 102, the ORF-corresponding nucleic acid sequence, or a nucleic acid sequence substantially identical thereto;
7) a nucleic acid sequence represented by SEQ ID NO: 118, a nucleic acid sequence corresponding to the ORF, or a polynucleotide having a nucleic acid sequence substantially the same as them;
8) a polynucleotide having SEQ ID NO: 141 or 151, or an ORF corresponding nucleic acid sequence thereof, or a nucleic acid sequence substantially identical thereto;
9) a nucleic acid sequence represented by SEQ ID NO: 171 or SEQ ID NO: 178, or an ORF corresponding nucleic acid sequence thereof, or a polynucleotide having a nucleic acid sequence substantially identical to them;
10) a polynucleotide having the nucleic acid sequence represented by SEQ ID NO: 199, or an ORF-corresponding nucleic acid sequence, or a nucleic acid sequence substantially identical thereto;
11) The nucleic acid sequence represented by SEQ ID NO: 224 or SEQ ID NO: 231 or the ORF-compatible nucleic acid sequence thereof, or the nucleic acid sequence consisting of 118 to 2604th nucleotide residues in the nucleic acid sequence represented by SEQ ID NO: 224 or SEQ ID NO: A nucleic acid sequence consisting of nucleotide residues 118 to 693 in the nucleic acid sequence represented by 231; or a polynucleotide having a nucleic acid sequence substantially the same as them; or 12) SEQ ID NO: 249, SEQ ID NO: 264, or SEQ ID NO: 270 A polynucleotide having the nucleic acid sequence represented by the above, or the ORF corresponding nucleic acid sequence thereof, or a nucleic acid sequence substantially identical to them.
[7] The polynucleotide of [6] above or a specific partial nucleotide thereof, wherein the polynucleotide of any one of 1) to 12) is the polynucleotide of any one of 1) to 12) below:
1) a nucleic acid sequence represented by SEQ ID NO: 8, or a polynucleotide comprising the nucleic acid sequence corresponding to the ORF;
2) a nucleic acid sequence represented by SEQ ID NO: 28 or SEQ ID NO: 35, or an ORF corresponding nucleic acid sequence thereof, or a nucleic acid sequence comprising a nucleic acid sequence consisting of nucleotide residues 357 to 1919 in the nucleic acid sequence represented by SEQ ID NO: 28 nucleotide;
3) a nucleic acid sequence represented by SEQ ID NO: 55 or a polynucleotide comprising the ORF-compatible nucleic acid sequence;
4) a polynucleotide comprising the nucleic acid sequence represented by SEQ ID NO: 71 or a nucleic acid sequence corresponding to the ORF;
5) a polynucleotide comprising the nucleic acid sequence represented by SEQ ID NO: 86 or a nucleic acid sequence corresponding to the ORF;
6) a polynucleotide consisting of the nucleic acid sequence represented by SEQ ID NO: 102, or a nucleic acid sequence corresponding to the ORF thereof;
7) a polynucleotide comprising the nucleic acid sequence represented by SEQ ID NO: 118 or a nucleic acid sequence corresponding to the ORF;
8) A polynucleotide comprising SEQ ID NO: 141 or SEQ ID NO: 151, or a nucleic acid sequence corresponding to the ORF thereof;
9) a polynucleotide comprising the nucleic acid sequence represented by SEQ ID NO: 171 or SEQ ID NO: 178, or an ORF-compatible nucleic acid sequence thereof;
10) a polynucleotide comprising the nucleic acid sequence represented by SEQ ID NO: 199 or a nucleic acid sequence corresponding to the ORF;
11) The nucleic acid sequence represented by SEQ ID NO: 224 or SEQ ID NO: 231 or the ORF-compatible nucleic acid sequence thereof, or the nucleic acid sequence consisting of 118 to 2604th nucleotide residues in the nucleic acid sequence represented by SEQ ID NO: 224 or SEQ ID NO: A polynucleotide comprising the nucleic acid sequence consisting of nucleotide residues 118 to 693 in the nucleic acid sequence represented by 231; or 12) the nucleic acid sequence represented by SEQ ID NO: 249, SEQ ID NO: 264 or SEQ ID NO: 270, or an ORF thereof A polynucleotide comprising a corresponding nucleic acid sequence.
[8] Partial nucleotides specific to the polynucleotide encoded by the blood cell / osteoclast specific gene 1-12, which is any partial nucleotide of 1) to 12) below:
1) a nucleic acid sequence represented by SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23 or SEQ ID NO: 27, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
2) Nucleic acid sequence represented by SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 43, SEQ ID NO: 46, SEQ ID NO: 49, SEQ ID NO: 53 or SEQ ID NO: 54, or a partial nucleic acid sequence thereof A partial nucleotide consisting of;
3) a nucleic acid sequence represented by SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 63, SEQ ID NO: 66 or SEQ ID NO: 70, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
4) a nucleic acid sequence represented by SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 78, SEQ ID NO: 81 or SEQ ID NO: 85, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
5) a nucleic acid sequence represented by SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 94, SEQ ID NO: 97 or SEQ ID NO: 101, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
6) a nucleic acid sequence represented by SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 110, SEQ ID NO: 113 or SEQ ID NO: 117, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
7) A nucleic acid sequence represented by SEQ ID NO: 121, SEQ ID NO: 122, SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 130, SEQ ID NO: 134 or SEQ ID NO: 140, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
8) Nucleic acid represented by SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 163, SEQ ID NO: 166 or SEQ ID NO: 170 A partial nucleotide consisting of a sequence or a partial nucleic acid sequence thereof;
9) Nucleic acid sequence represented by SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 187, SEQ ID NO: 190, SEQ ID NO: 193, SEQ ID NO: 197 or SEQ ID NO: 198, or a partial nucleic acid sequence thereof A partial nucleotide consisting of;
10) Nucleic acid sequence represented by SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 209, SEQ ID NO: 212, SEQ ID NO: 215, SEQ ID NO: 218, SEQ ID NO: 222 or SEQ ID NO: 223, or a partial nucleic acid sequence thereof A partial nucleotide consisting of;
11) A nucleic acid sequence represented by SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 240, SEQ ID NO: 243, SEQ ID NO: 247, or SEQ ID NO: 248, or a partial nucleotide consisting of a partial nucleic acid sequence thereof Or 12) SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 273, SEQ ID NO: 274, SEQ ID NO: 277, SEQ ID NO: 281, a nucleic acid sequence represented by SEQ ID NO: 284, SEQ ID NO: 288 or SEQ ID NO: 289, or a partial nucleotide consisting of a partial nucleic acid sequence thereof.
[9] The polynucleotide according to any one of [5] to [7] above, or the specific partial nucleotide according to any one of [6] to [8] above, and a promoter operably linked thereto, An expression vector for the polypeptide of any one of [1] to [3] or the specific partial peptide of any of [1] to [4] above.
[10] A transformant into which the expression vector of [9] has been introduced.
[11] Any one of the polymorphisms comprising a nucleic acid sequence complementary to the nucleic acid sequence of the specific partial nucleotide of [7] or [8] above and encoded by a blood cell / osteoclast specific gene 1-12 An antisense molecule capable of suppressing the expression of a peptide.
[12] A sense strand comprising the nucleic acid sequence of the specific partial nucleotide of [7] or [8] above and an antisense strand comprising the complementary nucleic acid sequence, and one of the sense strand and the antisense strand Alternatively, the expression of any polypeptide encoded by the hematopoietic / osteoclast specific gene 1-12, which may have an overhang at both the 5 ′ end and / or the 3 ′ end, may be suppressed. RNAi-inducible nucleic acids.
[13] The RNAi-inducible nucleic acid according to [12] above, wherein the RNAi-inducible nucleic acid is siRNA.
[14] To any polypeptide encoded by the blood cell line / osteoclast specific gene 1-12 through a region corresponding to the specific partial peptide of any one of [2] to [4] above Aptamers that can bind.
[15] To any of the polypeptides encoded by the blood cell / osteoclast-specific genes 1 to 12 via a region corresponding to the specific partial peptide of any of [2] to [4] above An antibody that can bind.
[16] The antibody according to [15] above, wherein the antibody is any one of i) to iii) below:
i) polyclonal antibodies;
ii) a monoclonal antibody or part thereof;
iii) chimeric, humanized or human antibodies.
[17] A cell that produces the antibody of [15] or [16] above.
[18] The cell according to [17] above, wherein the cell is a hybridoma.
[19] The polypeptide of any one of [1] to [3], the antisense molecule of [11], the RNAi-inducible nucleic acid of [12] or [13], the aptamer of [14], [ [15] A composition comprising the antibody of [16], or an expression vector thereof, and a pharmaceutically acceptable carrier.
[20] A mammalian cell or a non-human mammal in which the expression or function of the polypeptide of any one of [1] to [3] is regulated.
[21] A primer set specific for any polynucleotide encoded by the blood cell / osteoclast specific gene 1-12 or a specific partial nucleotide thereof, including the following (a) or (b):
(A) a sense primer corresponding to the first nucleic acid sequence of the polynucleotide of [7] above, or a specific partial nucleotide of [7] or [8] above; and (b) the polynucleotide of [7] above, Alternatively, an antisense primer corresponding to a nucleic acid sequence complementary to the second nucleic acid sequence of the specific partial nucleotide of [7] or [8] above.
[22] A nucleic acid specific for any polynucleotide encoded by the blood cell / osteoclast-specific gene 1-12, or a specific partial nucleotide thereof, which is either (a) or (b) below probe:
(A) a single-stranded polynucleotide comprising a nucleic acid sequence complementary to the nucleic acid sequence of the specific partial nucleotide of [7] or [8] above; or (b) the specific of [7] or [8] above A double-stranded polynucleotide comprising a sense strand containing a partial nucleotide nucleic acid sequence and an antisense strand containing a complementary nucleic acid sequence.
[23] A blood cell system comprising one or more substances or sets selected from the aptamer of [14], the antibody of [15] or [16], the primer set of [21] and the nucleic acid probe of [22] A reagent or kit for detection or quantification of any polypeptide or polynucleotide encoded by the osteoclast-specific gene 1-12.
[24] The reagent or kit according to [23] above, which is a reagent or kit for identifying blood cells or osteoclasts or determining their differentiation.
[25] Measuring the expression of any polypeptide or polynucleotide encoded by a blood cell / osteoclast specific gene 1-12 in a biological sample obtained from a mammal, or in a cell or tissue culture. And the method for detecting or quantifying the polypeptide or polynucleotide, wherein the biological sample or the culture contains blood cells, osteoclasts, hematopoietic tissue, lymphoid tissue or synovial tissue.
[26] The method comprising measuring the expression of the polypeptide of [2] or [3] or the polynucleotide of [7] in a biological sample obtained from a mammal, or a cell or tissue culture. A method for detecting or quantifying a peptide or the polynucleotide.
[27] The detection or quantification method according to [26] above, wherein the biological sample or the culture contains blood cells, osteoclasts, hematopoietic tissue, lymphoid tissue or synovial tissue.

本発明のポリペプチド及び本発明の部分ペプチドは、例えば、血球系に特異的あるいは破骨細胞分化に特異的なバイオマーカーとして、並びに本発明のポリペプチド又は既知ポリペプチドを特異的に認識し得る物質、あるいは本発明のポリペプチド及び既知ポリペプチドの双方を包括的に認識し得る物質、及び本発明のポリペプチド又は既知ポリペプチドの機能を特異的に調節し得る物質、あるいは本発明のポリペプチド及び既知ポリペプチドの双方の機能を包括的に調節し得る物質の開発に有用であり得る。
本発明のポリヌクレオチド及び本発明の部分ヌクレオチドは、例えば、血球系に特異的あるいは破骨細胞分化に特異的なバイオマーカーとして、並びに本発明のポリヌクレオチド又は既知ポリヌクレオチドを特異的に認識し得る物質、あるいは本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方を包括的に認識し得る物質、及び本発明のポリペプチド又は既知ポリペプチドの発現を特異的に調節し得る物質、あるいは本発明のポリペプチド及び既知ポリペプチドの双方の発現を包括的に調節し得る物質の開発に有用であり得る。
本発明の関連物質(例、アンチセンス分子、siRNA等のRNAi誘導性核酸、アプタマー及び抗体、並びにそれらの発現ベクター)は、例えば、医薬又は試薬として有用であり得る。
本発明の細胞は、例えば、本発明のポリペプチド及び本発明の部分ペプチド、並びに本発明の抗体の産生に有用であり得る。本発明の細胞はまた、医薬(例、血球系又は破骨細胞の障害に基づく疾患の予防又は治療薬)の開発、血球系に特異的あるいは破骨細胞分化に特異的なさらなるマーカー遺伝子の同定、及び血球系又は破骨細胞の分化に関連する機構の解析に有用であり得る。
本発明の動物は、例えば、医薬の開発、血球系に特異的あるいは破骨細胞分化に特異的なさらなるマーカー遺伝子の同定、及び破骨細胞の分化に関連する機構の解析に有用であり得る。
本発明の測定用手段(例、プライマーセット、核酸プローブ、抗体、アプタマー)及び測定方法は、例えば、本発明のポリヌクレオチド若しくは既知ポリヌクレオチド、又は本発明のポリペプチド若しくは既知ポリペプチドの特異的な検出及び定量、あるいは本発明のポリヌクレオチド及び既知ポリヌクレオチド、又は本発明のポリペプチド及び既知ポリペプチドの双方の包括的な検出及び定量に有用であり得る。このような手段及び方法はまた、血球系又は破骨細胞の同定、破骨細胞の分化状態の判定、並びに医薬、試薬又は食品のスクリーニングに利用できる。
The polypeptide of the present invention and the partial peptide of the present invention can specifically recognize the polypeptide of the present invention or a known polypeptide, for example, as a biomarker specific for blood cells or specific for osteoclast differentiation. A substance, a substance capable of comprehensively recognizing both the polypeptide of the present invention and a known polypeptide, and a substance capable of specifically regulating the function of the polypeptide of the present invention or a known polypeptide, or the polypeptide of the present invention And can be useful in the development of substances that can comprehensively regulate the function of both known polypeptides.
The polynucleotide of the present invention and the partial nucleotide of the present invention can specifically recognize the polynucleotide of the present invention or a known polynucleotide, for example, as a biomarker specific for blood cells or specific for osteoclast differentiation. A substance, a substance capable of comprehensively recognizing both the polynucleotide of the present invention and a known polynucleotide, and a substance capable of specifically regulating the expression of the polypeptide of the present invention or a known polypeptide, or the polypeptide of the present invention And can be useful in the development of substances that can comprehensively regulate the expression of both known polypeptides.
The related substances of the present invention (eg, antisense molecules, RNAi-inducible nucleic acids such as siRNA, aptamers and antibodies, and expression vectors thereof) can be useful as, for example, drugs or reagents.
The cells of the present invention can be useful, for example, for the production of the polypeptides of the present invention and partial peptides of the present invention, and antibodies of the present invention. The cells of the present invention can also be used to develop pharmaceuticals (eg, preventive or therapeutic agents for diseases based on disorders of blood cells or osteoclasts), to identify additional marker genes specific to blood cells or specific to osteoclast differentiation. , And in the analysis of mechanisms involved in the differentiation of blood cells or osteoclasts.
The animals of the present invention may be useful, for example, in drug development, identification of additional marker genes that are specific for the blood cell lineage or specific for osteoclast differentiation, and analysis of mechanisms associated with osteoclast differentiation.
The measurement means (eg, primer set, nucleic acid probe, antibody, aptamer) and measurement method of the present invention are, for example, specific for the polynucleotide of the present invention or the known polynucleotide, or the polypeptide of the present invention or the known polypeptide. It may be useful for detection and quantification, or for comprehensive detection and quantification of polynucleotides of the invention and known polynucleotides, or both polypeptides of the invention and known polypeptides. Such means and methods can also be used for identification of blood cells or osteoclasts, determination of osteoclast differentiation, and screening of drugs, reagents or foods.

1.血球系・破骨細胞特異的遺伝子
本発明の遺伝子は、任意の哺乳動物に由来する遺伝子であり得る。哺乳動物としては、例えば、霊長類及びげっ歯類、並びに実験用動物、家畜、使役動物、ペット等が挙げられる。詳細には、哺乳動物としては、例えば、ヒト、サル、ラット、マウス、ウサギ、ウマ、ウシ、ヤギ、ヒツジ、イヌ、ネコなどが挙げられる。好ましくは、哺乳動物はヒトである。
1. Blood cell line / osteoclast specific gene The gene of the present invention may be a gene derived from any mammal. Examples of mammals include primates and rodents, laboratory animals, farm animals, working animals, pets and the like. Specifically, examples of mammals include humans, monkeys, rats, mice, rabbits, horses, cows, goats, sheep, dogs, cats and the like. Preferably the mammal is a human.

本発明の遺伝子は、造血・リンパ組織又は滑膜組織で特異的に発現し得るか、又は特異的に発現し得ない。本発明の遺伝子はまた、既知ポリヌクレオチド及び/又は既知ポリペプチドに比し、造血・リンパ組織又は滑膜組織で高発現又は低発現し得る。このような造血・リンパ組織としては、例えば、骨髄、胸腺、脾臓などが挙げられる。   The gene of the present invention may be specifically expressed in hematopoietic / lymphoid tissue or synovial tissue, or may not be specifically expressed. The gene of the present invention can also be expressed at high or low levels in hematopoietic / lymphoid tissues or synovial tissues as compared to known polynucleotides and / or known polypeptides. Examples of such hematopoietic / lymphoid tissues include bone marrow, thymus, and spleen.

本発明の遺伝子は、血球系又は破骨細胞で特異的に発現し得るか、又は特異的に発現し得ない。本発明の遺伝子はまた、既知ポリヌクレオチド及び/又は既知ポリペプチドに比し、血球系又は破骨細胞で高発現又は低発現し得る。このような血球系としては、例えば、マクロファージ、リンパ球(例、T細胞、B細胞、NK細胞)、単球、顆粒球などが挙げられる。   The gene of the present invention may be specifically expressed in blood cells or osteoclasts or may not be specifically expressed. The gene of the present invention can also be expressed at high or low levels in blood cells or osteoclasts compared to known polynucleotides and / or known polypeptides. Examples of such blood cells include macrophages, lymphocytes (eg, T cells, B cells, NK cells), monocytes, granulocytes, and the like.

以下、本発明により提供される、ポリペプチド及びその部分ペプチド、並びにポリヌクレオチド及びその部分ヌクレオチドについて説明する。   Hereinafter, the polypeptide and its partial peptide, and the polynucleotide and its partial nucleotide provided by the present invention will be described.

1.1.ポリペプチド及びその部分ペプチド
本発明は、配列番号Xで表されるアミノ酸配列又はそれと実質的に同一のアミノ酸配列(必要に応じて「配列番号Xで表されるアミノ酸配列等」と省略)を有するポリペプチドを提供する。
1.1. Polypeptide and partial peptide thereof The present invention has an amino acid sequence represented by SEQ ID NO: X or an amino acid sequence substantially the same as the amino acid sequence (abbreviated as “amino acid sequence represented by SEQ ID NO: X” as necessary). A polypeptide is provided.

「配列番号X」は、本明細書中に開示される任意のアミノ酸配列の配列番号を示す。また、配列番号Xで表されるアミノ酸配列等を「有する(having)」ポリペプチドとは、配列番号Xで表されるアミノ酸配列等「からなる(consisting of)」ポリペプチド、及び当該アミノ酸配列等を「含む(comprising)」ポリペプチドを意味する。   “SEQ ID NO: X” indicates the SEQ ID NO of any amino acid sequence disclosed herein. In addition, the polypeptide having “having” the amino acid sequence represented by SEQ ID NO: X is a “consisting of” polypeptide such as the amino acid sequence represented by SEQ ID NO: X, and the amino acid sequence, etc. Means a “comprising” polypeptide.

一実施形態では、配列番号Xで表されるアミノ酸配列と実質的に同一のアミノ酸配列は、配列番号Xで表されるアミノ酸配列と所定のアミノ酸配列同一性を有するアミノ酸配列であり得る。アミノ酸配列同一性の程度は、約90%以上、好ましくは約92%以上、より好ましくは約95%以上、さらにより好ましくは約96%以上、最も好ましくは約97%以上、約98%以上又は約99%以上であり得る。アミノ酸配列同一性は自体公知の方法により決定できる。特に断らない場合、アミノ酸配列同一性(%)は、配列解析ソフトウェアであるDNASIS(日立ソフトウェアエンジニアリング)を用いて、例えば、マキシマムマッチング法のコマンドを実行することにより算出される。その際のパラメータは、デフォルトの設定(初期設定)とする。また、アミノ酸配列同一性(%)は、上記によらずに、当該分野で慣用のプログラム(例えば、BLAST、FASTA等)を初期設定で用いて決定することもできる。別の局面では、同一性(%)は、当該分野で公知の任意のアルゴリズム、例えば、Needlemanら(1970) (J. Mol. Biol. 48: 444-453)、Myers及びMiller (CABIOS, 1988, 4: 11-17)のアルゴリズム等を使用して決定することができる。Needlemanらのアルゴリズムは、GCGソフトウェアパッケージのGAPプログラムに組み込まれており、同一性(%)は、例えば、BLOSUM 62 matrix又はPAM250 matrix、並びにgap weight: 16、14、12、10、8、6若しくは4、及びlength weight: 1、2、3、4、5若しくは6のいずれかを使用することによって決定することができる。また、Myers及びMillerのアルゴリズムは、GCG配列アラインメントソフトウェアパッケージの一部であるALIGNプログラムに組み込まれている。アミノ酸配列を比較するためにALIGNプログラムを利用する場合、例えば、PAM120 weight residue table、gap length penalty 12、gap penalty 4を用いることができる。アミノ酸配列同一性の算出については、上記の方法のなかで最も低い値を示す方法を採用してもよい。   In one embodiment, the amino acid sequence substantially the same as the amino acid sequence represented by SEQ ID NO: X may be an amino acid sequence having a predetermined amino acid sequence identity with the amino acid sequence represented by SEQ ID NO: X. The degree of amino acid sequence identity is about 90% or higher, preferably about 92% or higher, more preferably about 95% or higher, even more preferably about 96% or higher, most preferably about 97% or higher, about 98% or higher, or It can be about 99% or more. Amino acid sequence identity can be determined by a method known per se. Unless otherwise specified, the amino acid sequence identity (%) is calculated by executing a command of the maximum matching method, for example, using DNASIS (Hitachi Software Engineering), which is sequence analysis software. The parameters at that time are default settings (initial settings). In addition, the amino acid sequence identity (%) can be determined using a program commonly used in the field (for example, BLAST, FASTA, etc.) in the initial setting without depending on the above. In another aspect, identity (%) is determined by any algorithm known in the art, such as Needleman et al. (1970) (J. Mol. Biol. 48: 444-453), Myers and Miller (CABIOS, 1988, 4: It can be determined using the algorithm of 11-17). Needleman et al.'S algorithm is incorporated into the GCG program in the GCG software package, and the percent identity is, for example, BLOSUM 62 matrix or PAM250 matrix, and gap weight: 16, 14, 12, 10, 8, 6 or 4 and length weight: can be determined by using any of 1, 2, 3, 4, 5 or 6. The Myers and Miller algorithms are also incorporated into the ALIGN program that is part of the GCG sequence alignment software package. When the ALIGN program is used to compare amino acid sequences, for example, PAM120 weight residue table, gap length penalty 12, and gap penalty 4 can be used. For the calculation of amino acid sequence identity, a method showing the lowest value among the above methods may be adopted.

別の実施形態では、配列番号Xで表されるアミノ酸配列と実質的に同一のアミノ酸配列は、配列番号Xで表されるアミノ酸配列において1以上のアミノ酸が置換、付加、欠失及び挿入から選ばれる1以上の修飾を施されたアミノ酸配列であり得る。修飾されるアミノ酸の数は、1以上であれば特に限定されないが、例えば1〜約50個、好ましくは1〜約30個、より好ましくは1〜約20個、さらにより好ましくは1〜約10個、最も好ましくは1〜約5個(例、1個又は2個)であり得る。   In another embodiment, the amino acid sequence substantially identical to the amino acid sequence represented by SEQ ID NO: X is selected from substitution, addition, deletion and insertion of one or more amino acids in the amino acid sequence represented by SEQ ID NO: X It may be an amino acid sequence having one or more modifications. The number of amino acids to be modified is not particularly limited as long as it is 1 or more. For example, 1 to about 50, preferably 1 to about 30, more preferably 1 to about 20, even more preferably 1 to about 10 is used. May be from 1 to about 5 (eg, 1 or 2).

配列番号Xで表されるアミノ酸配列と実質的に同一のアミノ酸配列は、その特徴的な部分(例、後述の特異的な部分ポリペプチドに対応する部分)を完全に保持し、かつそれ以外の部分(例、既知ポリペプチド中に存在する部分)が、配列番号Xで表されるアミノ酸配列の対応部分と実質的に同一であってもよい。あるいは、配列番号Xで表されるアミノ酸配列と実質的に同一のアミノ酸配列は、非特徴的な部分が配列番号Xで表されるアミノ酸配列の対応部分と同一であり、かつ特徴的な部分が、配列番号Xで表されるアミノ酸配列の対応部分と実質的に同一であってもよい。   The amino acid sequence substantially identical to the amino acid sequence represented by SEQ ID NO: X completely retains its characteristic part (eg, part corresponding to the specific partial polypeptide described below), and other than that A portion (eg, a portion present in a known polypeptide) may be substantially the same as the corresponding portion of the amino acid sequence represented by SEQ ID NO: X. Alternatively, in the amino acid sequence substantially the same as the amino acid sequence represented by SEQ ID NO: X, the non-characteristic part is the same as the corresponding part of the amino acid sequence represented by SEQ ID NO: X, and the characteristic part is , May be substantially the same as the corresponding portion of the amino acid sequence represented by SEQ ID NO: X.

本発明のポリペプチドは、既知ポリペプチド(例、既知バリアント)と同種又は異種の機能を有し得る。本発明のポリペプチドはまた、既知ポリペプチド(例、既知バリアント)に比し、増強又は低下した機能を有し得る。   The polypeptide of the present invention may have the same or different function as a known polypeptide (eg, known variant). The polypeptides of the present invention may also have an enhanced or reduced function compared to known polypeptides (eg, known variants).

詳細には、血球系・破骨細胞特異的遺伝子1〜12の新規ポリペプチドは、以下の通りである。   Specifically, novel polypeptides of blood cell / osteoclast specific genes 1 to 12 are as follows.

1)血球系・破骨細胞特異的遺伝子1
D-SYNOV4003692.1(配列番号10)
血球系・破骨細胞特異的遺伝子1の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒト転写因子EC(TFEC);ORF核酸配列中のヌクレオチドの総数:1044個;タンパク質中のアミノ酸の総数347個;GenBankアクセッション番号:NM_012252.1参照)が報告されている。血球系・破骨細胞特異的遺伝子1の既知バリアントは、所定の機能(例、転写調節能)を有することが報告されている(例、Zhao, G.Q. et al., Mol. Cell. Biol. 13 (8), 4505-4512 (1993); Chung, M.C. et al., Biochemistry 40 (30), 8887-8897 (2001) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子1の新規バリアントもまた、これらの機能を有し得る。
1) Blood cell line / osteoclast specific gene 1
D-SYNOV4003692.1 (SEQ ID NO: 10)
Examples of known variants of blood cell / osteoclast-specific gene 1 include, for example, variants disclosed in Examples (human transcription factor EC (TFEC); total number of nucleotides in ORF nucleic acid sequence: 1044; A total of 347 amino acids; GenBank accession number: NM_012252.1) has been reported. It has been reported that a known variant of blood cell / osteoclast specific gene 1 has a predetermined function (eg, transcriptional regulatory ability) (eg, Zhao, GQ et al., Mol. Cell. Biol. 13). (8), 4505-4512 (1993); Chung, MC et al., Biochemistry 40 (30), 8887-8897 (2001)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of blood cell / osteoclast specific gene 1 may also have these functions.

2)血球系・破骨細胞特異的遺伝子2
D-D3OST2001534.1(配列番号30)
D-NETRP1000046.1(配列番号37)
血球系・破骨細胞特異的遺伝子2の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒトアシルオキシアシルヒドロラーゼ(AOAH);ORF核酸配列中のヌクレオチドの総数:1728個;タンパク質中のアミノ酸の総数575個;GenBankアクセッション番号:NM_001637.1参照)が報告されている。血球系・破骨細胞特異的遺伝子2の既知バリアントは、所定の機能(例、アシルオキシアシルヒドロラーゼ活性)を有することが報告されている(例、Hagen, F.S. et al., Biochemistry 30 (34), 8415-8423 (1991) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子2の新規バリアントもまた、これらの機能を有し得る。
なお、配列番号30で表されるアミノ酸配列における1〜23番目のアミノ酸残基からなる領域は、シグナル配列予測ツールであるSignalP(http://www.cbs.dtu.dk/services/SignalP/)及びPSORT II(http://psort.nibb.ac.jp/)により、シグナル領域と予測される。また、血球系・破骨細胞特異的遺伝子2の既知バリアントであるNM_001637.1でも、同一領域がシグナル配列に対応することが公知の情報としてデータベースに記載されている他、シグナル配列予測ツールであるSignalP及びPSORT IIでも同一の領域にシグナル配列が予測される。従って、本発明はまた、このようなシグナル領域が除去されたポリペプチド(即ち、配列番号30で表されるアミノ酸配列において24〜543番目のアミノ酸残基からなるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド)を提供する。
2) Blood cell / osteoclast specific gene 2
D-D3OST2001534.1 (SEQ ID NO: 30)
D-NETRP1000046.1 (SEQ ID NO: 37)
Examples of known variants of blood cell / osteoclast-specific gene 2 include, for example, variants disclosed in Examples (human acyloxyacyl hydrolase (AOAH); total number of nucleotides in ORF nucleic acid sequence: 1728); A total of 575 amino acids; GenBank accession number: NM_001637.1) has been reported. It is reported that a known variant of blood cell / osteoclast specific gene 2 has a predetermined function (eg, acyloxyacyl hydrolase activity) (eg, Hagen, FS et al., Biochemistry 30 (34), 8415-8423 (1991)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of blood cell / osteoclast specific gene 2 may also have these functions.
The region consisting of the 1st to 23rd amino acid residues in the amino acid sequence represented by SEQ ID NO: 30 is SignalP (http://www.cbs.dtu.dk/services/SignalP/) which is a signal sequence prediction tool. And PSORT II (http://psort.nibb.ac.jp/), it is predicted as a signal region. In addition, NM_001637.1, a known variant of blood cell / osteoclast-specific gene 2, is a signal sequence prediction tool in addition to being described in the database as known information that the same region corresponds to the signal sequence. Signal sequences are also predicted in the same region in SignalP and PSORT II. Therefore, the present invention also provides a polypeptide from which such a signal region has been removed (that is, an amino acid sequence consisting of amino acid residues 24 to 543 in the amino acid sequence represented by SEQ ID NO: 30 or substantially the same as that). A polypeptide having the amino acid sequence of

3)血球系・破骨細胞特異的遺伝子3
D-PLACE7010497.1(配列番号57)
血球系・破骨細胞特異的遺伝子3の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒトLIMドメインキナーゼ1(LIMK1);ORF核酸配列中のヌクレオチドの総数:1944個;タンパク質中のアミノ酸の総数647個;GenBankアクセッション番号:NM_002314.2参照)が報告されている。血球系・破骨細胞特異的遺伝子3の既知バリアントは、所定の機能(例、キナーゼ活性)を有することが報告されている(例、Okano,I. et al., J. Biol. Chem. 270 (52), 31321-31330 (1995); Mizuno, K. et al., Oncogene 9 (6), 1605-1612 (1994) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子3の新規バリアントもまた、これらの機能を有し得る。
3) Blood cell / osteoclast specific gene 3
D-PLACE7010497.1 (SEQ ID NO: 57)
Examples of known variants of blood cell / osteoclast-specific gene 3 include, for example, variants disclosed in Examples (human LIM domain kinase 1 (LIMK1); total number of nucleotides in ORF nucleic acid sequence: 1944); The total number of amino acids of 647; GenBank accession number: NM_002314.2) has been reported. It is reported that a known variant of blood cell / osteoclast specific gene 3 has a predetermined function (eg, kinase activity) (eg, Okano, I. et al., J. Biol. Chem. 270). (52), 31321-31330 (1995); Mizuno, K. et al., Oncogene 9 (6), 1605-1612 (1994)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of blood cell / osteoclast specific gene 3 may also have these functions.

4)血球系・破骨細胞特異的遺伝子4
D-SPLEN2030304.1(配列番号73)
血球系・破骨細胞特異的遺伝子4の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒトタンパク質チロシンホスファターゼ,非レセプター型4(PTPN4);ORF核酸配列中のヌクレオチドの総数:2781個;タンパク質中のアミノ酸の総数926個;GenBankアクセッション番号:NM_002830.2参照)が報告されている。血球系・破骨細胞特異的遺伝子4の既知バリアントは、所定の機能(例、チロシンホスファターゼ活性)を有することが報告されている(例、Gu, M. et al., J. Biol. Chem. 271 (44), 27751-27759 (1996) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子4の新規バリアントもまた、これらの機能を有し得る。
4) Blood cell / osteoclast specific gene 4
D-SPLEN2030304.1 (SEQ ID NO: 73)
Examples of known variants of blood cell / osteoclast-specific gene 4 include, for example, variants disclosed in the Examples (human protein tyrosine phosphatase, non-receptor type 4 (PTPN4); total number of nucleotides in ORF nucleic acid sequence: 2781 A total of 926 amino acids in the protein; GenBank accession number: NM_002830.2) has been reported. It is reported that a known variant of blood cell / osteoclast specific gene 4 has a predetermined function (eg, tyrosine phosphatase activity) (eg, Gu, M. et al., J. Biol. Chem. 271 (44), 27751-27759 (1996)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of blood cell / osteoclast specific gene 4 may also have these functions.

5)血球系・破骨細胞特異的遺伝子5
D-SYNOV4000324.1(配列番号88)
血球系・破骨細胞特異的遺伝子5の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒトNCKアダプタータンパク質1(NCK1);ORF核酸配列中のヌクレオチドの総数:1134個;タンパク質中のアミノ酸の総数377個;GenBankアクセッション番号:NM_006153.3参照)が報告されている。血球系・破骨細胞特異的遺伝子5の既知バリアントは、所定の機能(例、Fasリガンド又はネフリンとの相互作用能)を有することが報告されている(例、Lettau,M. et al., Proc. Natl. Acad. Sci. U.S.A. 103 (15), 5911-5916 (2006); Jones,N. et al., Nature 440 (7085), 818-823 (2006) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子5の新規バリアントもまた、これらの機能を有し得る。
5) Blood cell / osteoclast specific gene 5
D-SYNOV4000324.1 (SEQ ID NO: 88)
Examples of known variants of blood cell / osteoclast specific gene 5 include, for example, the variants disclosed in the Examples (human NCK adapter protein 1 (NCK1); total number of nucleotides in ORF nucleic acid sequence: 1134; in protein 377 amino acids; GenBank accession number: NM_006153.3) has been reported. It has been reported that a known variant of blood cell / osteoclast specific gene 5 has a predetermined function (eg, ability to interact with Fas ligand or nephrin) (eg, Lettau, M. et al., Proc. Natl. Acad. Sci. USA 103 (15), 5911-5916 (2006); Jones, N. et al., Nature 440 (7085), 818-823 (2006)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of blood cell / osteoclast specific gene 5 may also have these functions.

6)血球系・破骨細胞特異的遺伝子6
D-SYNOV4007243.1(配列番号104)
血球系・破骨細胞特異的遺伝子6の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒトアデノシンモノホスフェートデアミナーゼ(isoform E)(AMPD3);ORF核酸配列中のヌクレオチドの総数:2331個;タンパク質中のアミノ酸の総数776個;GenBankアクセッション番号:NM_000480.1参照)が報告されている。血球系・破骨細胞特異的遺伝子6の既知バリアントは、所定の機能(例、アデノシンモノホスフェートデアミナーゼ活性)を有することが報告されている(例、Zydowo, M.M., Acta Biochim. Pol. 40 (4), 429-432 (1993); Yamada, Y. et al., Biochim. Biophys. Acta 1171 (1), 125-128 (1992) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子6の新規バリアントもまた、これらの機能を有し得る。
6) Blood cell / osteoclast specific gene 6
D-SYNOV4007243.1 (SEQ ID NO: 104)
Examples of known variants of the blood cell / osteoclast specific gene 6 include, for example, the variant disclosed in the Examples (human adenosine monophosphate deaminase (isoform E) (AMPD3); the total number of nucleotides in the ORF nucleic acid sequence: 2331 A total of 776 amino acids in the protein; GenBank accession number: NM_000480.1) has been reported. Known variants of the blood cell / osteoclast specific gene 6 have been reported to have a predetermined function (eg, adenosine monophosphate deaminase activity) (eg, Zydowo, MM, Acta Biochim. Pol. 40 (4 ), 429-432 (1993); Yamada, Y. et al., Biochim. Biophys. Acta 1171 (1), 125-128 (1992)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of blood cell / osteoclast specific gene 6 may also have these functions.

7)血球系・破骨細胞特異的遺伝子7
D-NETRP2004161.1(配列番号120)
血球系・破骨細胞特異的遺伝子7の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒトブチロフィリン様8(BTNL8),転写バリアント1;ORF核酸配列中のヌクレオチドの総数:1044個;タンパク質中のアミノ酸の総数347個;GenBankアクセッション番号:NM_024850.1参照)が報告されている。血球系・破骨細胞特異的遺伝子7の既知バリアントは、所定の機能(例、免疫系、原形質膜レセプター及び接着分子としての機能を含む、免疫グロブリン分子の機能)を有することが報告されている(例、Ogg, S. L. et al., Mammalian Genome 7: 900-905 (1996); Shibui, A. et al., J. Hum. Genet. 44: 249-252 (1999) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子7の新規バリアントもまた、これらの機能を有し得る。
7) Blood cell / osteoclast specific gene 7
D-NETRP2004161.1 (SEQ ID NO: 120)
Examples of known variants of the hematopoietic / osteoclast specific gene 7 include, for example, the variants disclosed in the examples (human butyrophilin-like 8 (BTNL8), transcription variant 1; total number of nucleotides in the ORF nucleic acid sequence: 1044; total number of amino acids 347 in protein; GenBank accession number: NM_024850.1) has been reported. Known variants of blood cell / osteoclast-specific gene 7 have been reported to have predetermined functions (eg, functions of immunoglobulin molecules including functions as immune system, plasma membrane receptor and adhesion molecule). (See, eg, Ogg, SL et al., Mammalian Genome 7: 900-905 (1996); Shibui, A. et al., J. Hum. Genet. 44: 249-252 (1999)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of blood cell / osteoclast specific gene 7 may also have these functions.

8)血球系・破骨細胞特異的遺伝子8
D-NT2RI3001993.1(配列番号143)
D-SMINT2013276.1(配列番号153)
血球系・破骨細胞特異的遺伝子8の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒト6番染色体オープンリーディングフレーム32(C6orf32);ORF核酸配列中のヌクレオチドの総数:1776個;タンパク質中のアミノ酸の総数591個;GenBankアクセッション番号:NM_015864.2参照)が報告されている。血球系・破骨細胞特異的遺伝子8の既知バリアントは、所定の機能(例、栄養芽細胞分化において、増殖性の細胞栄養芽層 (cytotrophoblast) から非有糸分裂多核シンシチウム(syncytium) の形成を刺激する機能)を有することが報告されている(例、Morrish, D.W. et al., Curr. Protein Pept. Sci. 2 (3), 245-259 (2001); Morrish, D.W. et al., J. Reprod. Immunol. 39 (1-2), 179-195 (1998); Dakour, J. et al., Gene 185 (2), 153-157 (1997) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子8の新規バリアントもまた、これらの機能を有し得る。
8) Blood cell / osteoclast specific gene 8
D-NT2RI3001993.1 (SEQ ID NO: 143)
D-SMINT2013276.1 (SEQ ID NO: 153)
Examples of known variants of the hematopoietic / osteoclast specific gene 8 include, for example, the variant disclosed in the Examples (human chromosome 6 open reading frame 32 (C6orf32); total number of nucleotides in ORF nucleic acid sequence: 1776) A total number of 591 amino acids in the protein; GenBank accession number: NM_015864.2) has been reported. A known variant of hematopoietic / osteoclast specific gene 8 is responsible for the formation of a non-mitotic polynuclear syncytium from a proliferative cytotrophoblast in a given function (eg, trophoblast differentiation). (Eg, Morrish, DW et al., Curr. Protein Pept. Sci. 2 (3), 245-259 (2001); Morrish, DW et al., J. Reprod. Immunol. 39 (1-2), 179-195 (1998); Dakour, J. et al., Gene 185 (2), 153-157 (1997)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of blood cell / osteoclast specific gene 8 may also have these functions.

9)血球系・破骨細胞特異的遺伝子9
D-THYMU3006588.1(配列番号173)
D-D3OST2003177.1(配列番号180)
血球系・破骨細胞特異的遺伝子9の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒトFYVE,RhoGEF及びPHドメイン含有4(FGD4);ORF核酸配列中のヌクレオチドの総数:2301個;タンパク質中のアミノ酸の総数766個;GenBankアクセッション番号:NM_139241.1参照)が報告されている。血球系・破骨細胞特異的遺伝子9の既知バリアントは、所定の機能(例、PH及びDHホモロジードメインを介する、Rho GTPase cdc42への特異的な結合能、及びイソプレニル化cdc42のGDP−GTP交換の刺激能)を有することが報告されている(例、Zheng, Y. et al., J. Biol. Chem. 271: 33169-33172 (1996) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子9の新規バリアントもまた、これらの機能を有し得る。
9) Blood cell / osteoclast specific gene 9
D-THYMU3006588.1 (SEQ ID NO: 173)
D-D3OST2003177.1 (SEQ ID NO: 180)
Examples of known variants of the blood cell / osteoclast specific gene 9 include, for example, the variants disclosed in the examples (human FYVE, RhoGEF and PH domain-containing 4 (FGD4); the total number of nucleotides in the ORF nucleic acid sequence: 2301. A total of 766 amino acids in the protein; GenBank accession number: NM_139241.1) has been reported. Known variants of the hematopoietic / osteoclast specific gene 9 have specific functions (eg, specific binding ability to Rho GTPase cdc42 via PH and DH homology domains, and GDP-GTP exchange of isoprenylated cdc42). (See, for example, Zheng, Y. et al., J. Biol. Chem. 271: 33169-33172 (1996)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of blood cell / osteoclast specific gene 9 may also have these functions.

10)血球系・破骨細胞特異的遺伝子10
D-D3OST2000831.1(配列番号201)
血球系・破骨細胞特異的遺伝子10の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒトハイポセティカルタンパク質BC009732(LOC133308);ORF核酸配列中のヌクレオチドの総数:1614個;タンパク質中のアミノ酸の総数537個;GenBankアクセッション番号:NM_178833.3参照)が報告されている。血球系・破骨細胞特異的遺伝子10の既知バリアントは、所定の機能(例、頂端 (apical) Na/H交換活性)を有することが報告されている(例、Klanke, C. A. et al., Genomics 25: 615-622 (1995) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子10の新規バリアントもまた、これらの機能を有し得る。
10) Blood cell / osteoclast specific gene 10
D-D3OST2000831.1 (SEQ ID NO: 201)
Examples of known variants of the blood cell / osteoclast specific gene 10 include, for example, the variant disclosed in the examples (human hypothetical protein BC009732 (LOC133308); the total number of nucleotides in the ORF nucleic acid sequence: 1614; protein 537 amino acids in total; GenBank accession number: see NM_178833.3) has been reported. Known variants of blood cell / osteoclast specific gene 10 have been reported to have a predetermined function (eg apical Na + / H + exchange activity) (eg Klanke, CA et al. , Genomics 25: 615-622 (1995)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of the blood cell / osteoclast specific gene 10 may also have these functions.

11)血球系・破骨細胞特異的遺伝子11
D-HCASM2001914.1(配列番号226)
D-SYNOV4003291.1(配列番号233)
血球系・破骨細胞特異的遺伝子11の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒトプロテオグリカン4(PRG4);ORF核酸配列中のヌクレオチドの総数:4215個;タンパク質中のアミノ酸の総数1404個;GenBankアクセッション番号:NM_005807.1参照)が報告されている。血球系・破骨細胞特異的遺伝子11の既知バリアントは、所定の機能(例、骨髄単核細胞の造血細胞及び/又は内皮細胞への分化促進能、あるいは軟骨代謝における増殖促進能、細胞保護能又は潤滑能)を有することが報告されている(例、Liu, Y.J. et al., Blood 103 (12), 4449-4456 (2004); Flannery, C.R. et al., Biochem. Biophys. Res. Commun. 254 (3), 535-541 (1999) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子11の新規バリアントもまた、これらの機能を有し得る。
なお、配列番号226及び配列番号233で表されるアミノ酸配列における1〜24番目のアミノ酸残基からなる領域は、シグナル配列予測ツールであるSignalP及びPSORT IIにより、シグナル領域と予測される。また、血球系・破骨細胞特異的遺伝子11の既知バリアントであるNM_005807.1でも、SignalP及びPSORT IIにより同一領域がシグナル配列と予測される。従って、本発明はまた、このようなシグナル領域が除去されたポリペプチド(即ち、配列番号226で表されるアミノ酸配列において25〜853番目のアミノ酸残基からなるアミノ酸配列、又は配列番号233で表されるアミノ酸配列において25〜216番目のアミノ酸残基からなるアミノ酸配列、あるいはそれらと実質的に同一のアミノ酸配列を有するポリペプチド)を提供する。
11) Blood cell / osteoclast specific gene 11
D-HCASM2001914.1 (SEQ ID NO: 226)
D-SYNOV4003291.1 (SEQ ID NO: 233)
Examples of known variants of the blood cell / osteoclast specific gene 11 include, for example, the variants disclosed in the Examples (human proteoglycan 4 (PRG4); total number of nucleotides in ORF nucleic acid sequence: 4215; amino acids in protein) 1404; GenBank accession number: see NM_005807.1) has been reported. Known variants of the blood cell / osteoclast-specific gene 11 have a predetermined function (for example, the ability to promote differentiation of bone marrow mononuclear cells into hematopoietic cells and / or endothelial cells, the ability to promote proliferation in cartilage metabolism, the ability to protect cells) (Eg, Liu, YJ et al., Blood 103 (12), 4449-4456 (2004); Flannery, CR et al., Biochem. Biophys. Res. Commun. 254 (3), 535-541 (1999)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of the blood cell / osteoclast specific gene 11 may also have these functions.
A region consisting of amino acid residues 1 to 24 in the amino acid sequences represented by SEQ ID NO: 226 and SEQ ID NO: 233 is predicted as a signal region by SignalP and PSORT II, which are signal sequence prediction tools. In NM_005807.1, which is a known variant of the blood cell / osteoclast specific gene 11, the same region is predicted as a signal sequence by SignalP and PSORT II. Therefore, the present invention also provides a polypeptide from which such a signal region has been removed (that is, an amino acid sequence consisting of amino acid residues 25 to 853 in the amino acid sequence represented by SEQ ID NO: 226, or SEQ ID NO: 233). A polypeptide having an amino acid sequence consisting of amino acid residues 25 to 216 in the amino acid sequence or a substantially identical amino acid sequence thereto.

12)血球系・破骨細胞特異的遺伝子12
D-NETRP2002051.1(配列番号251)
D-THYMU2031383.1(配列番号266)
D-THYMU3032318.1(配列番号272)
血球系・破骨細胞特異的遺伝子12の既知バリアントとしては、例えば、実施例中に開示されるバリアント(ヒト脳海綿状形成異常(cerebral cavernous malformation)2(CCM2);ORF核酸配列中のヌクレオチドの総数:1335個;タンパク質中のアミノ酸の総数444個;GenBankアクセッション番号:NM_031443.2参照)が報告されている。血球系・破骨細胞特異的遺伝子12の既知バリアントは、所定の機能(例、ホスホチロシン結合ドメインに起因するホスホチロシン結合能)を有し得る(例、Liquori, C.L. et al., Am. J. Hum. Genet. 73 (6), 1459-1464 (2003) 参照)。通常、単一のローカスから生じる複数のバリアント(スプライシングバリアント)はそれぞれ、その程度こそ異なり得るものの、同様の機能を有することが知られている。従って、血球系・破骨細胞特異的遺伝子12の新規バリアントもまた、これらの機能を有し得る。
12) Blood cell / osteoclast specific gene 12
D-NETRP2002051.1 (SEQ ID NO: 251)
D-THYMU2031383.1 (SEQ ID NO: 266)
D-THYMU3032318.1 (SEQ ID NO: 272)
Examples of known variants of the blood cell / osteoclast specific gene 12 include, for example, the variant disclosed in the Examples (human cerebral cavernous malformation 2 (CCM2); nucleotides in the ORF nucleic acid sequence) The total number: 1335; the total number of amino acids in the protein: 444; GenBank accession number: NM_031443.2) has been reported. A known variant of the hematopoietic / osteoclast specific gene 12 may have a predetermined function (eg, phosphotyrosine binding ability resulting from a phosphotyrosine binding domain) (eg, Liquori, CL et al., Am. J. Hum Genet. 73 (6), 1459-1464 (2003)). In general, it is known that a plurality of variants (splicing variants) generated from a single locus have similar functions, although the degree may vary. Therefore, a novel variant of blood cell / osteoclast specific gene 12 may also have these functions.

本発明のポリペプチドは、例えば、本発明のポリペプチドを特異的に認識し得る物質、本発明のポリペプチドを特異的に認識し得ない物質、又は本発明のポリペプチド及び既知ポリペプチドの双方を包括的に認識し得る物質の開発、並びに本発明のポリペプチドの機能を特異的に調節し得る物質、本発明のポリペプチドの機能を特異的に調節し得ない物質、又は本発明のポリペプチド及び既知ポリペプチドの双方の機能を包括的に認識し得る物質の開発に有用であり得る。   The polypeptide of the present invention is, for example, a substance that can specifically recognize the polypeptide of the present invention, a substance that cannot specifically recognize the polypeptide of the present invention, or both of the polypeptide of the present invention and a known polypeptide. Development of substances capable of comprehensively recognizing, and substances that can specifically regulate the function of the polypeptide of the present invention, substances that cannot specifically regulate the function of the polypeptide of the present invention, It may be useful for the development of substances that can comprehensively recognize the functions of both peptides and known polypeptides.

本発明はまた、部分ペプチドを提供する。   The present invention also provides partial peptides.

「部分ペプチド」は、所定の有用性(例、免疫原性又は抗原性ペプチド、特定のドメインを有する機能性ペプチドなどとしての用途)を有し得る、対象ポリペプチドから選ばれる少なくとも6個、好ましくは少なくとも8個、より好ましくは少なくとも10個、さらにより好ましくは少なくとも12個、最も好ましくは少なくとも15個の連続するアミノ酸残基からなる。   The “partial peptide” has at least 6 selected from the target polypeptide, preferably having a predetermined utility (eg, use as an immunogenic or antigenic peptide, a functional peptide having a specific domain, etc.), preferably Consists of at least 8, more preferably at least 10, even more preferably at least 12, most preferably at least 15 consecutive amino acid residues.

「本発明のポリペプチドの挿入アミノ酸配列」とは、本発明のポリペプチド(例、新規バリアント)中に挿入されているが既知ポリペプチド(例、既知バリアント)中で欠失しているアミノ酸配列をいう。一方、「既知ポリペプチドの挿入アミノ酸配列」とは、既知ポリペプチド(例、既知バリアント)中に挿入されているが本発明のポリペプチド(例、新規バリアント)中で欠失しているアミノ酸配列をいう。これらの挿入アミノ酸配列は、本明細書中の開示から明らかである。   “Inserted amino acid sequence of the polypeptide of the present invention” means an amino acid sequence that is inserted in the polypeptide of the present invention (eg, a new variant) but is deleted in a known polypeptide (eg, a known variant). Say. On the other hand, the “inserted amino acid sequence of a known polypeptide” means an amino acid sequence that is inserted in a known polypeptide (eg, known variant) but is deleted in the polypeptide of the present invention (eg, new variant). Say. These inserted amino acid sequences are apparent from the disclosure herein.

「本発明のポリペプチドの欠失アミノ酸配列」とは、本発明のポリペプチド(例、新規バリアント)中で欠失しているが既知ポリペプチド(例、既知バリアント)中に挿入されているアミノ酸配列をいう。一方、「既知ポリペプチドの欠失アミノ酸配列」とは、既知ポリペプチド(例、既知バリアント)中で欠失しているが本発明のポリペプチド(例、新規バリアント)中に挿入されているアミノ酸配列をいう。これらの欠失アミノ酸配列は、本明細書中の開示から明らかである。「本発明のポリペプチドの欠失アミノ酸配列」は、「既知ポリペプチドの挿入アミノ酸配列」と同義であり得、「既知ポリペプチドの欠失アミノ酸配列」は、「本発明のポリペプチドの挿入アミノ酸配列」と同義であり得る。   “Deleted amino acid sequence of the polypeptide of the present invention” means an amino acid that is deleted in a polypeptide of the present invention (eg, a new variant) but inserted in a known polypeptide (eg, a known variant). An array. On the other hand, the “deleted amino acid sequence of a known polypeptide” means an amino acid that is deleted in a known polypeptide (eg, known variant) but inserted in the polypeptide of the present invention (eg, new variant). An array. These deleted amino acid sequences are apparent from the disclosure herein. The “deleted amino acid sequence of the polypeptide of the present invention” may be synonymous with the “inserted amino acid sequence of the known polypeptide”, and the “deleted amino acid sequence of the known polypeptide” It can be synonymous with “sequence”.

本発明の部分ペプチドは、a)本発明のポリペプチドを既知ポリペプチドから識別可能である、本発明のポリペプチドの特異的な部分ペプチド(必要に応じて「特異的な部分ペプチドA」と省略)、b)既知ポリペプチドを本発明のポリペプチドから識別可能である、既知ポリペプチドの特異的な部分ペプチド(必要に応じて「特異的な部分ペプチドB」と省略)、又はc)本発明のポリペプチド及び既知ポリペプチドの双方に共通する部分ペプチド(必要に応じて「共通部分ペプチド」と省略)であり得る。これらの特定の部分ペプチドは、本発明者らの知見により、作製する、又はマーカーとして利用する動機付けが生まれるものの、このような知見なしには、これらを作製する、又はマーカーとして利用する動機付けはない。血球系・破骨細胞特異的遺伝子1〜12によりコードされるポリペプチドに特異的な部分ペプチドである、特異的な部分ペプチドA及びBを、必要に応じて「本発明の特異的な部分ペプチド」又は「特異的な部分ペプチド」と省略する。   The partial peptide of the present invention is a) a specific partial peptide of the polypeptide of the present invention (abbreviated as “specific partial peptide A” if necessary), which can distinguish the polypeptide of the present invention from known polypeptides. B) a specific partial peptide of the known polypeptide that can be distinguished from the polypeptide of the present invention (abbreviated as “specific partial peptide B” if necessary), or c) the present invention. A partial peptide common to both the polypeptide and the known polypeptide (abbreviated as “common partial peptide” if necessary). Although these specific partial peptides are motivated to be produced or used as markers by the knowledge of the present inventors, without such knowledge, the motivation to produce them or be used as markers There is no. Specific partial peptides A and B, which are partial peptides specific to the polypeptide encoded by the blood cell / osteoclast specific genes 1 to 12, may be referred to as “specific partial peptides of the present invention”. Or “specific partial peptide”.

本発明の特異的な部分ペプチドAは、配列番号Xで表されるアミノ酸配列等を有するポリペプチド中にのみ存在し、かつ既知ポリペプチド中に存在しない部分ペプチドである。このような特異的な部分ペプチドAとしては、例えば、i)本発明のポリペプチドの挿入アミノ酸配列又はその部分アミノ酸配列からなる部分ペプチド、ii)本発明のポリペプチドの挿入アミノ酸配列又はその末端部分アミノ酸配列及びその隣接アミノ酸配列からなる部分ペプチド、並びにiii)エクソンの欠失に起因して形成される、既知ポリペプチドの挿入アミノ酸配列に対してN末端側及びC末端側に存在する双方のアミノ酸配列が連結したアミノ酸配列からなる部分ペプチドが挙げられる。   The specific partial peptide A of the present invention is a partial peptide that exists only in a polypeptide having the amino acid sequence represented by SEQ ID NO: X and does not exist in a known polypeptide. Examples of such specific partial peptide A include i) a partial peptide consisting of the inserted amino acid sequence of the polypeptide of the present invention or a partial amino acid sequence thereof, and ii) an inserted amino acid sequence of the polypeptide of the present invention or a terminal portion thereof. A partial peptide consisting of an amino acid sequence and its adjacent amino acid sequence, and iii) both amino acids present on the N-terminal side and C-terminal side with respect to the inserted amino acid sequence of a known polypeptide resulting from the deletion of an exon Examples include partial peptides consisting of amino acid sequences linked in sequence.

上記i)の特異的な部分ペプチドAは、本発明のポリペプチドの挿入アミノ酸配列又はその部分アミノ酸配列からなる。このような部分アミノ酸配列は、本明細書中の開示から明らかである。   The specific partial peptide A of i) above consists of an inserted amino acid sequence of the polypeptide of the present invention or a partial amino acid sequence thereof. Such partial amino acid sequences are apparent from the disclosure herein.

上記ii)の特異的な部分ペプチドAは、本発明のポリペプチドの挿入アミノ酸配列又はその末端部分アミノ酸配列及びその隣接アミノ酸配列からなる。このような末端部分アミノ酸配列としては、本発明のポリペプチドの挿入アミノ酸配列中のN末端部分に対応するアミノ酸配列(必要に応じて「N末端部分アミノ酸配列A」と省略)、本発明のポリペプチドの挿入アミノ酸配列中のC末端部分に対応するアミノ酸配列(必要に応じて「C末端部分アミノ酸配列A」と省略)が挙げられる。このような隣接アミノ酸配列としては、本発明のポリペプチドの挿入アミノ酸配列に対してN末端側に存在するアミノ酸配列(必要に応じて「N末端隣接アミノ酸配列A」と省略)、本発明のポリペプチドの挿入アミノ酸配列に対してC末端側に存在するアミノ酸配列(必要に応じて「C末端隣接アミノ酸配列A」と省略)が挙げられる。従って、上記ii)の特異的な部分ペプチドAは、N末端隣接アミノ酸配列Aの所定の位置から本発明のポリペプチドの挿入アミノ酸配列の所定の位置にわたるアミノ酸配列からなる部分ペプチド、本発明のポリペプチドの挿入アミノ酸配列の所定の位置からC末端隣接アミノ酸配列Aの所定の位置にわたるアミノ酸配列からなる部分ペプチド、あるいはN末端隣接アミノ酸配列Aの所定の位置からC末端隣接アミノ酸配列Aの所定の位置にわたる、本発明のポリペプチドの挿入アミノ酸配列全体を含むアミノ酸配列からなる部分ペプチドであり得る。上記ii)の特異的な部分ペプチドAに含まれる、挿入アミノ酸配列(又はN末端若しくはC末端部分アミノ酸配列A)あるいは隣接アミノ酸配列(又はN末端若しくはC末端隣接アミノ酸配列A)中のアミノ酸残基数は、上記ii)の特異的な部分ペプチドAの特異性を確保できる数である限り特に限定されないが、例えば少なくとも3個、好ましくは少なくとも4個、より好ましくは少なくとも5個、さらにより好ましくは少なくとも6個、最も好ましくは少なくとも7個、8個、9個又は10個であり得る。このような末端部分アミノ酸配列及びこのような隣接アミノ酸配列は、本明細書中の開示から明らかである。   The specific partial peptide A of ii) above consists of the inserted amino acid sequence of the polypeptide of the present invention or the terminal partial amino acid sequence thereof and the adjacent amino acid sequence thereof. Examples of such a terminal partial amino acid sequence include an amino acid sequence corresponding to the N-terminal portion in the insertion amino acid sequence of the polypeptide of the present invention (abbreviated as “N-terminal partial amino acid sequence A” if necessary), An amino acid sequence corresponding to the C-terminal portion in the inserted amino acid sequence of the peptide (abbreviated as “C-terminal partial amino acid sequence A” if necessary) can be mentioned. Examples of such an adjacent amino acid sequence include an amino acid sequence existing on the N-terminal side with respect to the insertion amino acid sequence of the polypeptide of the present invention (abbreviated as “N-terminal adjacent amino acid sequence A” if necessary), An amino acid sequence existing on the C-terminal side with respect to the inserted amino acid sequence of the peptide (abbreviated as “C-terminal adjacent amino acid sequence A” if necessary). Therefore, the specific partial peptide A of the above ii) is a partial peptide consisting of an amino acid sequence extending from a predetermined position of the N-terminal adjacent amino acid sequence A to a predetermined position of the inserted amino acid sequence of the polypeptide of the present invention. A partial peptide consisting of an amino acid sequence extending from a predetermined position of the inserted amino acid sequence of the peptide to a predetermined position of the C-terminal adjacent amino acid sequence A, or a predetermined position of the C-terminal adjacent amino acid sequence A from a predetermined position of the N-terminal adjacent amino acid sequence A It can be a partial peptide consisting of an amino acid sequence including the entire insertion amino acid sequence of the polypeptide of the present invention. Amino acid residues in the inserted amino acid sequence (or N-terminal or C-terminal partial amino acid sequence A) or the adjacent amino acid sequence (or N-terminal or C-terminal adjacent amino acid sequence A) contained in the specific partial peptide A of ii) above The number is not particularly limited as long as it is a number that can ensure the specificity of the specific partial peptide A of ii) above, for example, at least 3, preferably at least 4, more preferably at least 5, even more preferably There may be at least 6, most preferably at least 7, 8, 9, or 10. Such terminal partial amino acid sequences and such adjacent amino acid sequences are apparent from the disclosure herein.

上記iii)の特異的な部分ペプチドAは、既知ポリペプチドの挿入アミノ酸配列に対してN末端側及びC末端側に存在する双方のアミノ酸配列が連結したアミノ酸配列(本発明のポリペプチドでは、エクソンの欠失に起因して、これらのアミノ酸配列は連結している)からなる、既知ポリペプチドに存在しない部分ペプチドである。上記iii)の特異的な部分ペプチドAに含まれる、既知ポリペプチドの挿入アミノ酸配列に対してN末端側及びC末端側に存在する各アミノ酸配列中のアミノ酸残基数はそれぞれ、上記iii)の特異的な部分ペプチドAの特異性を確保できる数である限り特に限定されないが、例えば、少なくとも3個、好ましくは少なくとも4個、より好ましくは少なくとも5個、さらにより好ましくは少なくとも6個、最も好ましくは少なくとも7個、8個、9個又は10個であり得る。   The specific partial peptide A in the above iii) is an amino acid sequence in which both amino acid sequences existing on the N-terminal side and the C-terminal side are linked to the insertion amino acid sequence of a known polypeptide (exon in the polypeptide of the present invention). These amino acid sequences are linked to each other due to the deletion of (1), and is a partial peptide that does not exist in a known polypeptide. The number of amino acid residues in each amino acid sequence present on the N-terminal side and C-terminal side with respect to the inserted amino acid sequence of the known polypeptide contained in the specific partial peptide A of iii) is the same as that of iii) above. Although it is not particularly limited as long as it is a number that can ensure the specificity of a specific partial peptide A, for example, at least 3, preferably at least 4, more preferably at least 5, even more preferably at least 6, most preferably May be at least 7, 8, 9, or 10.

本発明の特異的な部分ペプチドAは、例えば、本発明のポリペプチドを特異的に検出するための標的として、及び血球系に特異的あるいは破骨細胞分化に特異的なマーカーとして有用であり得る。本発明の特異的な部分ペプチドAはまた、本発明のポリペプチドを特異的に認識し得る物質、又は本発明のポリペプチドを特異的に認識し得ない物質の開発、あるいは本発明のポリペプチドの機能を特異的に調節し得る物質、又は本発明のポリペプチドの機能を特異的に調節し得ない物質の開発に有用であり得る。   The specific partial peptide A of the present invention can be useful, for example, as a target for specifically detecting the polypeptide of the present invention, and as a marker specific for blood cells or specific for osteoclast differentiation. . The specific partial peptide A of the present invention is also a substance that can specifically recognize the polypeptide of the present invention, or a substance that cannot specifically recognize the polypeptide of the present invention, or the polypeptide of the present invention. It may be useful for the development of a substance that can specifically regulate the function of or a substance that cannot specifically regulate the function of the polypeptide of the present invention.

本発明の特異的な部分ペプチドBは、既知ポリペプチド中にのみ存在し、かつ配列番号Xで表されるアミノ酸配列等を有するポリペプチド中に存在しない部分ペプチドである。このような特異的な部分ペプチドBとしては、例えば、i)既知ポリペプチドの挿入アミノ酸配列又はその部分アミノ酸配列からなる部分ペプチド、ii)既知ポリペプチドの挿入アミノ酸配列又はその末端部分アミノ酸配列及びその隣接アミノ酸配列からなる部分ペプチド、iii)エクソンの欠失に起因して形成される、本発明のポリペプチドの挿入アミノ酸配列に対してN末端側及びC末端側に存在する双方のアミノ酸配列が連結したアミノ酸配列からなる部分ペプチドが挙げられる。   The specific partial peptide B of the present invention is a partial peptide that exists only in a known polypeptide and does not exist in a polypeptide having the amino acid sequence represented by SEQ ID NO: X or the like. Examples of such a specific partial peptide B include i) a partial peptide consisting of an inserted amino acid sequence of a known polypeptide or a partial amino acid sequence thereof; ii) an inserted amino acid sequence of a known polypeptide or a terminal partial amino acid sequence thereof; A partial peptide consisting of an adjacent amino acid sequence, iii) both amino acid sequences present on the N-terminal side and C-terminal side of the inserted amino acid sequence of the polypeptide of the present invention formed due to the deletion of an exon are linked A partial peptide consisting of the amino acid sequence.

上記i)の特異的な部分ペプチドBは、既知ポリペプチドの挿入アミノ酸配列又はその部分アミノ酸配列からなる。このような部分アミノ酸配列は、本明細書中の開示から明らかである。   The specific partial peptide B of i) above consists of an inserted amino acid sequence of a known polypeptide or a partial amino acid sequence thereof. Such partial amino acid sequences are apparent from the disclosure herein.

上記ii)の特異的な部分ペプチドBは、既知ポリペプチドの挿入アミノ酸配列又はその末端部分アミノ酸配列及びその隣接アミノ酸配列からなる。このような末端部分アミノ酸配列としては、既知ポリペプチドの挿入アミノ酸配列中のN末端部分に対応するアミノ酸配列(必要に応じて「N末端部分アミノ酸配列B」と省略)、既知ポリペプチドの挿入アミノ酸配列中のC末端部分に対応するアミノ酸配列(必要に応じて「C末端部分アミノ酸配列B」と省略)が挙げられる。このような隣接アミノ酸配列としては、既知ポリペプチドの挿入アミノ酸配列に対してN末端側に存在するアミノ酸配列(必要に応じて「N末端隣接アミノ酸配列B」と省略)、既知ポリペプチドの挿入アミノ酸配列に対してC末端側に存在するアミノ酸配列(必要に応じて「C末端隣接アミノ酸配列B」と省略)が挙げられる。従って、上記ii)の特異的な部分ペプチドBは、N末端隣接アミノ酸配列Bの所定の位置から既知ポリペプチドの挿入アミノ酸配列の所定の位置にわたるアミノ酸配列からなる部分ペプチド、既知ポリペプチドの挿入アミノ酸配列の所定の位置からC末端隣接アミノ酸配列Bの所定の位置にわたるアミノ酸配列からなる部分ペプチド、あるいはN末端隣接アミノ酸配列Bの所定の位置からC末端隣接アミノ酸配列Bの所定の位置にわたる、既知ポリペプチドの挿入アミノ酸配列全体を含むアミノ酸配列からなる部分ペプチドであり得る。上記ii)の特異的な部分ペプチドBに含まれる、挿入アミノ酸配列(又はN末端若しくはC末端部分アミノ酸配列B)あるいは隣接アミノ酸配列(又はN末端若しくはC末端隣接アミノ酸配列B)中のアミノ酸残基数は、上記ii)の特異的な部分ペプチドBの特異性を確保できる数である限り特に限定されないが、例えば少なくとも3個、好ましくは少なくとも4個、より好ましくは少なくとも5個、さらにより好ましくは少なくとも6個、最も好ましくは少なくとも7個、8個、9個又は10個であり得る。このような末端部分アミノ酸配列及びこのような隣接アミノ酸配列は、本明細書中の開示から明らかである。   The specific partial peptide B of ii) above consists of an inserted amino acid sequence of a known polypeptide or its terminal partial amino acid sequence and its adjacent amino acid sequence. Examples of such terminal partial amino acid sequences include amino acid sequences corresponding to the N-terminal portion in the inserted amino acid sequence of known polypeptides (abbreviated as “N-terminal partial amino acid sequence B” if necessary), inserted amino acids of known polypeptides. An amino acid sequence corresponding to the C-terminal portion in the sequence (abbreviated as “C-terminal partial amino acid sequence B” if necessary) can be mentioned. As such an adjacent amino acid sequence, an amino acid sequence present on the N-terminal side with respect to an inserted amino acid sequence of a known polypeptide (abbreviated as “N-terminal adjacent amino acid sequence B” as necessary) An amino acid sequence existing on the C-terminal side with respect to the sequence (abbreviated as “C-terminal adjacent amino acid sequence B” if necessary) can be mentioned. Therefore, the specific partial peptide B of the above ii) is a partial peptide consisting of an amino acid sequence extending from a predetermined position of the N-terminal adjacent amino acid sequence B to a predetermined position of an inserted amino acid sequence of a known polypeptide, an inserted amino acid of a known polypeptide A partial peptide consisting of an amino acid sequence extending from a predetermined position of the sequence to a predetermined position of the C-terminal adjacent amino acid sequence B, or a known polypeptide extending from a predetermined position of the N-terminal adjacent amino acid sequence B to a predetermined position of the C-terminal adjacent amino acid sequence B; It may be a partial peptide consisting of an amino acid sequence including the entire inserted amino acid sequence of the peptide. Amino acid residues in the inserted amino acid sequence (or N-terminal or C-terminal partial amino acid sequence B) or the adjacent amino acid sequence (or N-terminal or C-terminal adjacent amino acid sequence B) contained in the specific partial peptide B of ii) above The number is not particularly limited as long as it is a number that can ensure the specificity of the specific partial peptide B of ii) above, for example, at least 3, preferably at least 4, more preferably at least 5, even more preferably There may be at least 6, most preferably at least 7, 8, 9, or 10. Such terminal partial amino acid sequences and such adjacent amino acid sequences are apparent from the disclosure herein.

上記iii)の特異的な部分ペプチドBは、本発明のポリペプチドの挿入アミノ酸配列に対してN末端側及びC末端側に存在する双方のアミノ酸配列が連結したアミノ酸配列(既知ポリペプチドでは、エクソンの欠失に起因して、これらのアミノ酸配列は連結している)からなる、本発明のポリペプチドに存在しない部分ペプチドである。上記iii)の特異的な部分ペプチドBに含まれる、本発明のポリペプチドの挿入アミノ酸配列に対してN末端側及びC末端側に存在する各アミノ酸配列中のアミノ酸残基数はそれぞれ、上記iii)の特異的な部分ペプチドBの特異性を確保できる数である限り特に限定されないが、例えば、少なくとも3個、好ましくは少なくとも4個、より好ましくは少なくとも5個、さらにより好ましくは少なくとも6個、最も好ましくは少なくとも7個、8個、9個又は10個であり得る。   The specific partial peptide B of the above iii) is an amino acid sequence in which both amino acid sequences existing on the N-terminal side and C-terminal side are linked to the insertion amino acid sequence of the polypeptide of the present invention (exon in the known polypeptide) These amino acid sequences are linked to each other due to the deletion of), and is a partial peptide that does not exist in the polypeptide of the present invention. The number of amino acid residues in each amino acid sequence present on the N-terminal side and the C-terminal side with respect to the inserted amino acid sequence of the polypeptide of the present invention contained in the specific partial peptide B of iii) above is respectively iii Is not particularly limited as long as the specificity of the specific partial peptide B can be ensured, for example, at least 3, preferably at least 4, more preferably at least 5, even more preferably at least 6, Most preferably it may be at least 7, 8, 9, or 10.

本発明の特異的な部分ペプチドBは、例えば、既知ポリペプチドを特異的に検出するための標的として、及び血球系に特異的あるいは破骨細胞分化に特異的なマーカーとして、あるいはこれらに非特異的なマーカーとして有用であり得る。本発明の特異的な部分ペプチドBはまた、既知ポリペプチドを特異的に認識し得る物質、又は既知ポリペプチドを特異的に認識し得ない物質の開発、あるいは既知ポリペプチドの機能を特異的に調節し得る物質、又は既知ポリペプチドの機能を特異的に調節し得ない物質の開発に有用であり得る。   The specific partial peptide B of the present invention is, for example, as a target for specifically detecting a known polypeptide, and as a marker specific to the blood cell system or osteoclast differentiation, or non-specific to these. As useful markers. The specific partial peptide B of the present invention also specifically develops a substance that can specifically recognize a known polypeptide, or a substance that cannot specifically recognize a known polypeptide, or specifically functions of a known polypeptide. It may be useful in the development of substances that can be modulated or substances that cannot specifically regulate the function of a known polypeptide.

本発明の共通部分ペプチドは、本発明のポリペプチド及び既知ポリペプチドの双方に存在する、非特異的な部分ペプチドであり得る。このような部分ペプチドは、本明細書中の開示から明らかである。本発明の共通部分ペプチドは、例えば、本発明のポリペプチド及び既知ポリペプチドの双方を包括的に検出するための標的として、及び血球系に特異的あるいは破骨細胞分化に特異的なマーカーとして、あるいはこれらに非特異的なマーカーとして有用であり得る。本発明の共通部分ペプチドはまた、本発明のポリペプチド及び既知ポリペプチドの双方を包括的に認識し得る物質、又は本発明のポリペプチド及び既知ポリペプチドの双方の機能を包括的に調節し得る物質の開発に有用であり得る。   The common partial peptide of the present invention may be a non-specific partial peptide that exists in both the polypeptide of the present invention and the known polypeptide. Such partial peptides are apparent from the disclosure herein. The common partial peptide of the present invention, for example, as a target for comprehensive detection of both the polypeptide of the present invention and known polypeptides, and as a marker specific for blood cell lineage or specific for osteoclast differentiation, Alternatively, it may be useful as a non-specific marker for these. The consensus peptide of the present invention can also comprehensively regulate the substance capable of comprehensively recognizing both the polypeptide of the present invention and the known polypeptide, or the functions of both the polypeptide of the present invention and the known polypeptide. Can be useful in material development.

本発明のポリペプチド又はその特異的な部分ペプチドは、異種アミノ酸配列からなるポリペプチドと融合していてもよい。このようなポリペプチドとしては、精製又は可溶化を容易にするポリペプチドが挙げられる。詳細には、このようなポリペプチドとしては、ヒスチジンタグ、マルトース結合タンパク(MBP)、グルタチオン−S−トランスフェラーゼ(GST)、カルモジュリン結合ペプチド(CBP)、FLAG、IgG分子のFc領域が挙げられる。   The polypeptide of the present invention or a specific partial peptide thereof may be fused with a polypeptide consisting of a heterologous amino acid sequence. Such polypeptides include polypeptides that facilitate purification or solubilization. Specifically, such polypeptides include histidine tag, maltose binding protein (MBP), glutathione-S-transferase (GST), calmodulin binding peptide (CBP), FLAG, Fc region of IgG molecule.

本発明のポリペプチド及びその部分ペプチドは塩の形態で提供されてもよい。塩としては、例えば、無機塩基(例、ナトリウム、カリウムなどのアルカリ金属;カルシウム、マグネシウムなどのアルカリ土類金属;アルミニウム、アンモニウム)、有機塩基(例、トリメチルアミン、トリエチルアミン、ピリジン、ピコリン、エタノールアミン、ジエタノールアミン、トリエタノールアミン、ジシクロヘキシルアミン、N,N−ジベンジルエチレンジアミン)、無機酸(例、塩酸、臭化水素酸、硝酸、硫酸、リン酸)、有機酸(例、ギ酸、酢酸、トリフルオロ酢酸、フマル酸、シュウ酸、酒石酸、マレイン酸、クエン酸、コハク酸、リンゴ酸、メタンスルホン酸、ベンゼンスルホン酸、p−トルエンスルホン酸)、塩基性アミノ酸(例、アルギニン、リジン、オルニチン)又は酸性アミノ酸(例、アスパラギン酸、グルタミン酸)との塩などが挙げられる。   The polypeptide of the present invention and its partial peptide may be provided in the form of a salt. Examples of the salt include inorganic bases (eg, alkali metals such as sodium and potassium; alkaline earth metals such as calcium and magnesium; aluminum and ammonium), organic bases (eg, trimethylamine, triethylamine, pyridine, picoline, ethanolamine, Diethanolamine, triethanolamine, dicyclohexylamine, N, N-dibenzylethylenediamine), inorganic acids (eg, hydrochloric acid, hydrobromic acid, nitric acid, sulfuric acid, phosphoric acid), organic acids (eg, formic acid, acetic acid, trifluoroacetic acid) , Fumaric acid, oxalic acid, tartaric acid, maleic acid, citric acid, succinic acid, malic acid, methanesulfonic acid, benzenesulfonic acid, p-toluenesulfonic acid), basic amino acids (eg, arginine, lysine, ornithine) or acidic Amino acids (eg, aspartic acid, And salts with amine acid).

本発明のポリペプチド及びその部分ペプチドは、自体公知の方法により作製できる。例えば、本発明のポリペプチド及びその部分ペプチドは、1)発現部位から回収してもよく、2)本発明のポリペプチド及びその部分ペプチドを発現する後述の形質転換体又はその培養上清から回収してもよく、3)ウサギ網状赤血球ライセート、コムギ胚芽ライセート、大腸菌ライセート等を用いる無細胞系により合成してもよく、あるいは4)有機化学的に合成(例、固相合成)してもよい。本発明のポリペプチド及びその部分ペプチドは、塩析や溶媒沈澱法などの溶解度を利用する方法;透析法、限外ろ過法、ゲルろ過法、及びSDS−ポリアクリルアミドゲル電気泳動法などの主として分子量の差を利用する方法;イオン交換クロマトグラフィーなどの荷電の差を利用する方法;アフィニティークロマトグラフィー、抗体の使用などの特異的親和性を利用する方法;逆相高速液体クロマトグラフィーなどの疎水性の差を利用する方法;等電点電気泳動法などの等電点の差を利用する方法;これらを組合せた方法などにより適宜精製される。   The polypeptide of the present invention and its partial peptide can be prepared by a method known per se. For example, the polypeptide of the present invention and its partial peptide may be recovered from 1) the expression site, or 2) recovered from the transformant described below that expresses the polypeptide of the present invention and its partial peptide or its culture supernatant. 3) may be synthesized by a cell-free system using rabbit reticulocyte lysate, wheat germ lysate, E. coli lysate, or the like, or 4) may be synthesized organically (eg, solid phase synthesis). . The polypeptide of the present invention and its partial peptide are mainly molecular weights such as a method using solubility such as salting out and solvent precipitation; dialysis, ultrafiltration, gel filtration, SDS-polyacrylamide gel electrophoresis, etc. A method utilizing a difference in charge; a method utilizing a difference in charge such as ion exchange chromatography; a method utilizing a specific affinity such as affinity chromatography or use of an antibody; a hydrophobic method such as reverse phase high performance liquid chromatography. It is appropriately purified by a method using a difference; a method using a difference in isoelectric point such as isoelectric focusing method; a method combining these, and the like.

1.2.ポリヌクレオチド及びその部分ヌクレオチド
本発明は、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2、あるいはそれらと実質的に同一の核酸配列(必要に応じて「配列番号Yで表される核酸配列等」と省略)を有するポリヌクレオチドを提供する。
1.2. Polynucleotide and its partial nucleotides The present invention relates to a nucleic acid sequence represented by SEQ ID NO: Y, a nucleic acid sequence Y1 or a nucleic acid sequence Y2, or a nucleic acid sequence substantially identical thereto (if necessary, represented by “SEQ ID NO: Y”). A polynucleotide having the abbreviation "Nucleic acid sequence etc."

「配列番号Y」は、本明細書中に開示される任意の核酸配列の配列番号を表す。また、配列番号Y等を「有する」ポリヌクレオチドとは、配列番号Y等「からなる」ポリヌクレオチド、あるいは当該核酸配列等を「含む」ポリヌクレオチドを意味する。   “SEQ ID NO: Y” represents the SEQ ID NO of any nucleic acid sequence disclosed herein. The polynucleotide having “SEQ ID NO: Y” means a polynucleotide “consisting of” SEQ ID NO: Y or the like, or a polynucleotide “including” the nucleic acid sequence or the like.

「核酸配列Y1」とは、配列番号Yで表される核酸配列において、コーディング部分(即ち、オープンリーディングフレーム(ORF)全体又はその一部)に対応する核酸配列を示す。換言すれば、「核酸配列Y1」とは、配列番号Yで表される核酸配列がコーディング部分のみに対応する核酸配列からなる場合、配列番号Yで表される核酸配列を示し、配列番号Yで表される核酸配列がコーディング部分及び非コーディング部分の双方に対応する核酸配列を含む場合、コーディング部分のみに対応する核酸配列を示す。   “Nucleic acid sequence Y1” indicates a nucleic acid sequence corresponding to the coding portion (that is, the entire open reading frame (ORF) or a part thereof) in the nucleic acid sequence represented by SEQ ID NO: Y. In other words, “nucleic acid sequence Y1” indicates the nucleic acid sequence represented by SEQ ID NO: Y when the nucleic acid sequence represented by SEQ ID NO: Y consists of a nucleic acid sequence corresponding only to the coding portion. Where the nucleic acid sequence represented includes nucleic acid sequences that correspond to both the coding and non-coding portions, the nucleic acid sequence that corresponds only to the coding portion is indicated.

「核酸配列Y2」とは、配列番号Yで表される核酸配列において、非コーディング部分(例、5’又は3’非翻訳領域)に対応する核酸配列を示す。換言すれば、「核酸配列Y2」とは、配列番号Yで表される核酸配列が非コーディング部分のみに対応する核酸配列からなる場合、配列番号Yで表される核酸配列を示し、配列番号Yで表される核酸配列が非コーディング部分及びコーディング部分の双方に対応する核酸配列を含む場合、非コーディング部分のみに対応する核酸配列を示す。   “Nucleic acid sequence Y2” refers to a nucleic acid sequence corresponding to a non-coding portion (eg, 5 ′ or 3 ′ untranslated region) in the nucleic acid sequence represented by SEQ ID NO: Y. In other words, “nucleic acid sequence Y2” indicates the nucleic acid sequence represented by SEQ ID NO: Y when the nucleic acid sequence represented by SEQ ID NO: Y consists of a nucleic acid sequence corresponding only to a non-coding portion, When the nucleic acid sequence represented by (1) includes a nucleic acid sequence corresponding to both the non-coding portion and the coding portion, the nucleic acid sequence corresponding to only the non-coding portion is indicated.

従って、「配列番号Y」で表される核酸配列は、i)核酸配列Y1(配列番号Yで表される核酸配列全体がコーディング部分に対応する核酸配列である場合)、ii)核酸配列Y2(配列番号Yで表される核酸配列全体が非コーディング部分に対応する核酸配列である場合)、あるいはiii)核酸配列Y1及び核酸配列Y2を含む核酸配列(配列番号Yで表される核酸配列がコーディング部分及び非コーディング部分に対応する核酸配列を含む場合)のいずれかにより表現できる。   Accordingly, the nucleic acid sequence represented by “SEQ ID NO: Y” is i) nucleic acid sequence Y1 (when the entire nucleic acid sequence represented by SEQ ID NO: Y is a nucleic acid sequence corresponding to the coding portion), ii) nucleic acid sequence Y2 ( The entire nucleic acid sequence represented by SEQ ID NO: Y is a nucleic acid sequence corresponding to a non-coding portion), or iii) a nucleic acid sequence comprising nucleic acid sequence Y1 and nucleic acid sequence Y2 (the nucleic acid sequence represented by SEQ ID NO: Y is coding) The nucleic acid sequence corresponding to the portion and the non-coding portion).

一実施形態では、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2と実質的に同一の核酸配列は、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2と所定の配列同一性を有する核酸配列であり得る。核酸配列同一性の程度は、約90%以上、好ましくは約92%以上、より好ましくは約95%以上、さらにより好ましくは約96%以上、最も好ましくは約97%以上、約98%以上又は約99%以上であり得る。核酸配列同一性は自体公知の方法により決定できる。例えば、核酸配列同一性(%)は、上述したアミノ酸配列同一性(%)と同様の方法により決定できる。   In one embodiment, the nucleic acid sequence represented by SEQ ID NO: Y, or the nucleic acid sequence substantially identical to the nucleic acid sequence Y1 or nucleic acid sequence Y2, is the nucleic acid sequence represented by SEQ ID NO: Y, or the nucleic acid sequence Y1 or nucleic acid sequence It may be a nucleic acid sequence having a predetermined sequence identity with Y2. The degree of nucleic acid sequence identity is about 90% or higher, preferably about 92% or higher, more preferably about 95% or higher, even more preferably about 96% or higher, most preferably about 97% or higher, about 98% or higher, or It can be about 99% or more. Nucleic acid sequence identity can be determined by methods known per se. For example, the nucleic acid sequence identity (%) can be determined by the same method as the amino acid sequence identity (%) described above.

別の実施形態では、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2と実質的に同一の核酸配列は、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2において1以上のヌクレオチドが置換、付加、欠失及び挿入から選ばれる1以上の修飾を施された核酸配列であり得る。修飾されるヌクレオチドの数は、1以上であれば特に限定されないが、例えば1〜約100個、好ましくは1〜約70個、より好ましくは1〜約50個、さらにより好ましくは1〜約30個、最も好ましくは1〜約20個、1〜約10個又は1〜約5個(例、1個又は2個)であり得る。   In another embodiment, the nucleic acid sequence represented by SEQ ID NO: Y, or the nucleic acid sequence substantially identical to the nucleic acid sequence Y1 or nucleic acid sequence Y2, is the nucleic acid sequence represented by SEQ ID NO: Y, or the nucleic acid sequence Y1 or nucleic acid In the sequence Y2, one or more nucleotides may be a nucleic acid sequence subjected to one or more modifications selected from substitution, addition, deletion and insertion. The number of nucleotides to be modified is not particularly limited as long as it is 1 or more. For example, 1 to about 100, preferably 1 to about 70, more preferably 1 to about 50, and even more preferably 1 to about 30. And most preferably 1 to about 20, 1 to about 10 or 1 to about 5 (eg, 1 or 2).

さらに別の実施形態では、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2と実質的に同一の核酸配列は、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2に相補的な核酸配列に対してハイストリンジェント条件下でハイブリダイズし得るポリヌクレオチドであり得る。ハイストリンジェント条件下でのハイブリダイゼーションの条件は、既報の条件を参考に設定することができる(例、Current Protocols in Molecular Biology, John Wiley & Sons, 6.3.1-6.3.6 (1999) 参照)。例えば、ハイストリンジェント条件下でのハイブリダイゼーションの条件としては、6×SSC(sodium chloride/sodium citrate)/45℃でのハイブリダイゼーション、次いで0.2×SSC/0.1%SDS/50〜65℃での1回又は2回以上の洗浄が挙げられる。   In yet another embodiment, the nucleic acid sequence represented by SEQ ID NO: Y, or the nucleic acid sequence substantially identical to the nucleic acid sequence Y1 or nucleic acid sequence Y2, is the nucleic acid sequence represented by SEQ ID NO: Y, or the nucleic acid sequence Y1 or It can be a polynucleotide that can hybridize under high stringency conditions to a nucleic acid sequence complementary to the nucleic acid sequence Y2. Hybridization conditions under high stringency conditions can be set with reference to previously reported conditions (eg, see Current Protocols in Molecular Biology, John Wiley & Sons, 6.3.1-6.3.6 (1999)). . For example, hybridization conditions under high stringent conditions include hybridization at 6 × SSC (sodium chloride / sodium citrate) / 45 ° C., then 0.2 × SSC / 0.1% SDS / 50 to 65 ° C. Or two or more washes.

配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2と実質的に同一の核酸配列は、その特徴的な部分(例、後述の特異的な部分ヌクレオチドに対応する部分)を完全に保持し、かつそれ以外の部分(例、既知ポリヌクレオチド中に存在する部分)が、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2の対応部分と実質的に同一であってもよい。あるいは、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2と実質的に同一の核酸配列は、非特徴的な部分が配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2の対応部分と同一であり、かつ特徴的な部分が、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2の対応部分と実質的に同一であってもよい。   The nucleic acid sequence represented by SEQ ID NO: Y, or a nucleic acid sequence substantially identical to the nucleic acid sequence Y1 or the nucleic acid sequence Y2, has its characteristic part (eg, part corresponding to a specific partial nucleotide described later) completely And the other portion (eg, the portion present in the known polynucleotide) is substantially the same as the nucleic acid sequence represented by SEQ ID NO: Y or the corresponding portion of the nucleic acid sequence Y1 or the nucleic acid sequence Y2. There may be. Alternatively, the nucleic acid sequence represented by SEQ ID NO: Y, the nucleic acid sequence substantially identical to the nucleic acid sequence Y1 or the nucleic acid sequence Y2, the nucleic acid sequence represented by SEQ ID NO: Y, or the nucleic acid sequence Y1 Alternatively, the corresponding portion of the nucleic acid sequence Y2 may be the same and the characteristic portion may be substantially the same as the nucleic acid sequence represented by SEQ ID NO: Y, or the corresponding portion of the nucleic acid sequence Y1 or the nucleic acid sequence Y2. .

本発明のポリヌクレオチドは、本発明のポリペプチドをコードし得る。従って、本発明のポリヌクレオチドは、それによりコードされるポリペプチドが本発明のポリペプチドと同様の機能を示し得るようなポリヌクレオチドであり得る。   The polynucleotide of the present invention may encode the polypeptide of the present invention. Therefore, the polynucleotide of the present invention can be a polynucleotide such that the polypeptide encoded thereby can exhibit the same function as the polypeptide of the present invention.

詳細には、血球系・破骨細胞特異的遺伝子1〜12についてのポリヌクレオチドの核酸配列Y、及びそのORF対応部分(核酸配列YにおけるYa〜Yb番目のヌクレオチド残基)の配列番号Y、及びYa〜Yb番目は、以下の通りである。   Specifically, the nucleic acid sequence Y of the polynucleotide for the hematopoietic / osteoclast specific gene 1-12, and the SEQ ID NO: Y of the ORF corresponding portion (the Yath to Ybth nucleotide residues in the nucleic acid sequence Y), and The Yath to Ybth are as follows.

1)本発明の特異的遺伝子1
D-SYNOV4003692.1(配列番号8又は配列番号9、及び176〜1126番目)
1) Specific gene 1 of the present invention
D-SYNOV4003692.1 (SEQ ID NO: 8 or SEQ ID NO: 9, and positions 176 to 1126)

2)本発明の特異的遺伝子2
D-D3OST2001534.1(配列番号28又は配列番号29、及び288〜1919番目)
D-NETRP1000046.1(配列番号35又は配列番号36、及び57〜950番目)
なお、配列番号28又は配列番号29で表される核酸配列における288〜356番目のヌクレオチド残基からなる領域は、シグナル配列予測ツールであるSignalP及びPSORT II(上記参照)により、シグナル領域をコードしていると予測される。また、血球系・破骨細胞特異的遺伝子2の既知バリアントであるNM_001637.1でも、同一領域がシグナル配列に対応することが公知の情報としてデータベースに記載されている他、シグナル配列予測ツールであるSignalP及びPSORT IIでも同一の領域にシグナル配列が予測される。従って、本発明はまた、ORF対応部分のうち、このような推定シグナル領域をコードするポリヌクレオチドが除去されたポリヌクレオチド(即ち、配列番号28で表される核酸配列において357〜1919番目のヌクレオチド残基からなる核酸配列、あるいはそれと実質的に同一の核酸配列を有するポリヌクレオチド)を提供する。
2) Specific gene 2 of the present invention
D-D3OST2001534.1 (SEQ ID NO: 28 or SEQ ID NO: 29, and 288 to 1919th)
D-NETRP1000046.1 (SEQ ID NO: 35 or SEQ ID NO: 36, and 57th to 950th positions)
The region consisting of nucleotide residues 288 to 356 in the nucleic acid sequence represented by SEQ ID NO: 28 or 29 encodes the signal region by SignalP and PSORT II (see above) which are signal sequence prediction tools. It is predicted that In addition, NM_001637.1, a known variant of blood cell / osteoclast-specific gene 2, is a signal sequence prediction tool in addition to being described in the database as known information that the same region corresponds to the signal sequence. Signal sequences are also predicted in the same region in SignalP and PSORT II. Therefore, the present invention also provides a polynucleotide in which the polynucleotide encoding such a putative signal region is removed from the ORF corresponding portion (that is, nucleotide residues 357 to 1919 in the nucleic acid sequence represented by SEQ ID NO: 28). Or a polynucleotide having a nucleic acid sequence substantially identical to the nucleic acid sequence.

3)本発明の特異的遺伝子3
D-PLACE7010497.1(配列番号55又は配列番号56、及び34〜1875番目)
3) Specific gene 3 of the present invention
D-PLACE7010497.1 (SEQ ID NO: 55 or SEQ ID NO: 56, and positions 34 to 1875)

4)本発明の特異的遺伝子4
D-SPLEN2030304.1(配列番号71又は配列番号72、及び89〜1768番目)
4) Specific gene 4 of the present invention
D-SPLEN2030304.1 (SEQ ID NO: 71 or 72, and 89th to 1768th)

5)本発明の特異的遺伝子5
D-SYNOV4000324.1(配列番号86又は配列番号87、及び45〜986番目)
5) Specific gene 5 of the present invention
D-SYNOV4000324.1 (SEQ ID NO: 86 or SEQ ID NO: 87, and positions 45 to 986)

6)本発明の特異的遺伝子6
D-SYNOV4007243.1(配列番号102又は配列番号103、及び202〜2526番目)
6) Specific gene 6 of the present invention
D-SYNOV4007243.1 (SEQ ID NO: 102 or SEQ ID NO: 103, and 202 to 2526th)

7)本発明の特異的遺伝子7
D-NETRP2004161.1(配列番号118又は配列番号119、及び290〜1240番目)
7) Specific gene 7 of the present invention
D-NETRP2004161.1 (SEQ ID NO: 118 or SEQ ID NO: 119, and positions 290 to 1240)

8)本発明の特異的遺伝子8
D-NT2RI3001993.1(配列番号141又は配列番号142、及び63〜3206番目)
D-SMINT2013276.1(配列番号151又は配列番号152、及び93〜2036番目)
8) Specific gene 8 of the present invention
D-NT2RI3001993.1 (SEQ ID NO: 141 or SEQ ID NO: 142, and positions 63 to 3206)
D-SMINT2013276.1 (SEQ ID NO: 151 or SEQ ID NO: 152, and 93 to 2036)

9)本発明の特異的遺伝子9
D-THYMU3006588.1(配列番号171又は配列番号172、及び87〜2723番目)
D-D3OST2003177.1(配列番号178又は配列番号179、及び163〜2718番目)
9) Specific gene 9 of the present invention
D-THYMU3006588.1 (SEQ ID NO: 171 or SEQ ID NO: 172 and positions 87 to 2723)
D-D3OST2003177.1 (SEQ ID NO: 178 or SEQ ID NO: 179, and positions 163 to 2718)

10)本発明の特異的遺伝子10
D-D3OST2000831.1(配列番号199又は配列番号200、及び178〜1620番目)
10) Specific gene 10 of the present invention
D-D3OST2000831.1 (SEQ ID NO: 199 or SEQ ID NO: 200, and positions 178 to 1620)

11)本発明の特異的遺伝子11
D-HCASM2001914.1(配列番号224又は配列番号225、及び46〜2604番目)
D-SYNOV4003291.1(配列番号231又は配列番号232、及び46〜693番目)
なお、配列番号224又は配列番号225あるいは配列番号231又は配列番号232で表される核酸配列における46〜117番目のヌクレオチド残基からなる領域は、シグナル配列予測ツールであるSignalP及びPSORT II(上記参照)により、シグナル領域をコードしていると予測される。また、血球系・破骨細胞特異的遺伝子11の既知バリアントであるNM_005807.1でも、SignalP及びPSORT IIにより同一領域がシグナル配列と予測される。従って、本発明はまた、ORF対応部分のうち、このような推定シグナル領域をコードするポリヌクレオチドが除去されたポリヌクレオチド(即ち、配列番号224で表される核酸配列において118〜2604番目のヌクレオチド残基からなる核酸配列、配列番号231で表される核酸配列において118〜693番目のヌクレオチド残基からなる核酸配列、あるいはそれと実質的に同一の核酸配列を有するポリヌクレオチド)を提供する。
11) Specific gene 11 of the present invention
D-HCASM2001914.1 (SEQ ID NO: 224 or SEQ ID NO: 225, and 46 to 2604th)
D-SYNOV4003291.1 (SEQ ID NO: 231 or SEQ ID NO: 232, and 46th to 693rd)
The region consisting of the 46th to 117th nucleotide residues in the nucleic acid sequence represented by SEQ ID NO: 224, SEQ ID NO: 225, SEQ ID NO: 231 or SEQ ID NO: 232 is a signal sequence prediction tool SignalP and PSORT II (see above) ) Is predicted to encode a signal region. In NM_005807.1, which is a known variant of the blood cell / osteoclast specific gene 11, the same region is predicted as a signal sequence by SignalP and PSORT II. Therefore, the present invention also provides a polynucleotide in which the polynucleotide encoding such a putative signal region is removed from the ORF-corresponding portion (that is, the nucleotide residues 118 to 2604 in the nucleic acid sequence represented by SEQ ID NO: 224). A nucleic acid sequence comprising a group, a nucleic acid sequence comprising nucleotide residues 118 to 693 in the nucleic acid sequence represented by SEQ ID NO: 231, or a polynucleotide having a nucleic acid sequence substantially identical thereto.

12)本発明の特異的遺伝子12
D-NETRP2002051.1(配列番号249又は配列番号250、及び34〜579番目)
D-THYMU2031383.1(配列番号264又は配列番号265、及び34〜816番目)
D-THYMU3032318.1(配列番号270又は配列番号271、及び36〜470番目)
12) Specific gene 12 of the present invention
D-NETRP2002051.1 (SEQ ID NO: 249 or SEQ ID NO: 250, and positions 34 to 579)
D-THYMU2031383.1 (SEQ ID NO: 264 or SEQ ID NO: 265, and positions 34 to 816)
D-THYMU3032318.1 (SEQ ID NO: 270 or SEQ ID NO: 271, and positions 36 to 470)

本発明のポリヌクレオチドは、例えば、本発明のポリヌクレオチドを特異的に認識し得る物質、本発明のポリヌクレオチドを特異的に認識し得ない物質、又は本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方を包括的に認識し得る物質の開発、並びに本発明のポリペプチドの発現を特異的に調節し得る物質、本発明のポリペプチドの発現を特異的に調節し得ない物質、又は本発明のポリペプチド及び既知ポリペプチドの双方の発現を包括的に調節し得る物質の開発に有用であり得る。   The polynucleotide of the present invention is, for example, a substance that can specifically recognize the polynucleotide of the present invention, a substance that cannot specifically recognize the polynucleotide of the present invention, or both the polynucleotide of the present invention and a known polynucleotide. Development of a substance capable of comprehensively recognizing a substance, a substance capable of specifically regulating the expression of a polypeptide of the present invention, a substance capable of not specifically regulating the expression of a polypeptide of the present invention, or a polypeptide of the present invention It may be useful for the development of substances that can comprehensively regulate the expression of both peptides and known polypeptides.

本発明はまた、部分ヌクレオチドを提供する。   The present invention also provides partial nucleotides.

「部分ヌクレオチド」とは、所定の有用性(例、プローブ、プライマー、免疫原性又は抗原性ペプチドをコードするポリヌクレオチド、特定のドメインを有する機能性ペプチドをコードするポリヌクレオチドなどとしての用途)を有し得る、対象ポリヌクレオチドから選ばれる少なくとも15個、好ましくは少なくとも16個、より好ましくは少なくとも18個、さらにより好ましくは少なくとも20個、最も好ましくは少なくとも22個、23個、24個又は25個の連続するヌクレオチド残基からなる。   “Partial nucleotide” means predetermined utility (eg, use as a probe, primer, polynucleotide encoding an immunogenic or antigenic peptide, polynucleotide encoding a functional peptide having a specific domain, etc.) At least 15, preferably at least 16, more preferably at least 18, even more preferably at least 20, most preferably at least 22, 23, 24 or 25 selected from the polynucleotide of interest Of consecutive nucleotide residues.

「本発明のポリヌクレオチドの挿入核酸配列」とは、本発明のポリヌクレオチド(例、新規バリアント)中に挿入されているが既知ポリヌクレオチド(例、既知バリアント)中で欠失している核酸配列をいう。一方、「既知ポリヌクレオチドの挿入核酸配列」とは、既知ポリヌクレオチド(例、既知バリアント)中に挿入されているが本発明のポリヌクレオチド(例、新規バリアント)中で欠失している核酸配列をいう。これらの挿入核酸配列は、本明細書中の開示から明らかである。   The “inserted nucleic acid sequence of the polynucleotide of the present invention” refers to a nucleic acid sequence that is inserted into a polynucleotide of the present invention (eg, a novel variant) but is deleted in a known polynucleotide (eg, a known variant). Say. On the other hand, the “inserted nucleic acid sequence of a known polynucleotide” refers to a nucleic acid sequence that is inserted in a known polynucleotide (eg, known variant) but is deleted in the polynucleotide (eg, novel variant) of the present invention. Say. These inserted nucleic acid sequences will be apparent from the disclosure herein.

「本発明のポリヌクレオチドの欠失核酸配列」とは、本発明のポリヌクレオチド(例、新規バリアント)中で欠失しているが既知ポリヌクレオチド(例、既知バリアント)中に挿入されている核酸配列をいう。一方、「既知ポリヌクレオチドの欠失核酸配列」とは、既知ポリヌクレオチド(例、既知バリアント)中で欠失しているが本発明のポリヌクレオチド(例、新規バリアント)中に挿入されている核酸配列をいう。これらの欠失核酸配列は、本明細書中の開示から明らかである。「本発明のポリヌクレオチドの欠失核酸配列」は、「既知ポリヌクレオチドの挿入核酸配列」と同義であり得、「既知ポリヌクレオチドの欠失核酸配列」は、「本発明のポリヌクレオチドの挿入核酸配列」と同義であり得る。   “Deleted nucleic acid sequence of the polynucleotide of the present invention” means a nucleic acid that is deleted in a polynucleotide of the present invention (eg, a novel variant) but inserted in a known polynucleotide (eg, a known variant). An array. On the other hand, a “deleted nucleic acid sequence of a known polynucleotide” refers to a nucleic acid that is deleted in a known polynucleotide (eg, known variant) but inserted in the polynucleotide (eg, novel variant) of the present invention. An array. These deleted nucleic acid sequences are apparent from the disclosure herein. The “deleted nucleic acid sequence of the polynucleotide of the present invention” may be synonymous with the “inserted nucleic acid sequence of the known polynucleotide”, and the “deleted nucleic acid sequence of the known polynucleotide” It can be synonymous with “sequence”.

本発明の部分ヌクレオチドは、a)本発明のポリヌクレオチドを既知ポリヌクレオチドから識別可能である、本発明のポリヌクレオチドの特異的な部分ヌクレオチド(必要に応じて「特異的な部分ヌクレオチドA」と省略)、b)既知ポリヌクレオチドを本発明のポリヌクレオチドから識別可能である、既知ポリヌクレオチドの特異的な部分ヌクレオチド(必要に応じて「特異的な部分ヌクレオチドB」と省略)、又はc)本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方に共通する部分ヌクレオチド(必要に応じて「共通部分ヌクレオチド」と省略)であり得る。これらの特定の部分ヌクレオチドは、本発明者らの知見により、作製する、又はマーカーとして利用する動機付けが生まれるものの、このような知見なしには、これらを作製する、又はマーカーとして利用する動機付けはない。血球系・破骨細胞特異的遺伝子1〜12によりコードされるポリヌクレオチドに特異的な部分ヌクレオチドである、特異的な部分ヌクレオチドA及びBを、必要に応じて「本発明の特異的な部分ヌクレオチド」又は「特異的な部分ヌクレオチド」と省略する。   The partial nucleotide of the present invention is a) a specific partial nucleotide of the polynucleotide of the present invention (abbreviated as “specific partial nucleotide A” if necessary) that can distinguish the polynucleotide of the present invention from known polynucleotides. B) a specific partial nucleotide of the known polynucleotide (abbreviated as “specific partial nucleotide B” if necessary), or c) the present invention, wherein the known polynucleotide can be distinguished from the polynucleotide of the present invention. Partial nucleotides common to both the polynucleotide and known polynucleotides (abbreviated as “common partial nucleotide” as necessary). Although these specific partial nucleotides are motivated to be produced or used as markers by the knowledge of the present inventors, without such knowledge, the motivation to produce or use them as markers is provided. There is no. Specific partial nucleotides A and B, which are specific partial nucleotides of the polynucleotide encoded by the hemocyte / osteoclast-specific genes 1 to 12, may be referred to as “specific partial nucleotides of the present invention”. "Or" specific partial nucleotide ".

本発明の特異的な部分ヌクレオチドAは、配列番号Yで表される核酸配列等を有するポリヌクレオチド中にのみ存在し、かつ既知ポリヌクレオチド中に存在しない部分ヌクレオチドである。このような特異的な部分ヌクレオチドAとしては、例えば、i)本発明のポリヌクレオチドの挿入核酸配列又はその部分核酸配列からなる部分ヌクレオチド、ii)本発明のポリヌクレオチドの挿入核酸配列又はその末端部分核酸配列及びその隣接核酸配列からなる部分ヌクレオチド、並びにiii)エクソンの欠失に起因して形成される、既知ポリヌクレオチドの挿入核酸配列に対して5’及び3’に存在する双方の核酸配列が連結した核酸配列からなる部分ヌクレオチドが挙げられる。   The specific partial nucleotide A of the present invention is a partial nucleotide that exists only in a polynucleotide having the nucleic acid sequence represented by SEQ ID NO: Y and does not exist in a known polynucleotide. Examples of such specific partial nucleotide A include: i) a partial nucleotide consisting of the inserted nucleic acid sequence of the polynucleotide of the present invention or a partial nucleic acid sequence thereof; ii) an inserted nucleic acid sequence of the polynucleotide of the present invention or a terminal portion thereof. A partial nucleotide consisting of a nucleic acid sequence and its adjacent nucleic acid sequence, and iii) both nucleic acid sequences present 5 ′ and 3 ′ to the inserted nucleic acid sequence of a known polynucleotide resulting from the deletion of an exon. Examples include partial nucleotides consisting of linked nucleic acid sequences.

上記i)の特異的な部分ヌクレオチドAは、本発明のポリヌクレオチドの挿入核酸配列又はその部分核酸配列からなる。このような部分核酸配列は、本明細書中の開示から明らかである。   The specific partial nucleotide A in i) above consists of the inserted nucleic acid sequence of the polynucleotide of the present invention or a partial nucleic acid sequence thereof. Such partial nucleic acid sequences are apparent from the disclosure herein.

上記ii)の特異的な部分ヌクレオチドAは、本発明のポリヌクレオチドの挿入核酸配列又はその末端部分核酸配列及びその隣接核酸配列からなる。このような末端部分核酸配列としては、本発明のポリヌクレオチドの挿入核酸配列中の5’末端部分に対応する核酸配列(必要に応じて「5’末端部分核酸配列A」と省略)、本発明のポリペプチドの挿入核酸配列中の3’末端部分に対応する核酸配列(必要に応じて「3’末端部分核酸配列A」と省略)が挙げられる。このような隣接核酸配列としては、本発明のポリヌクレオチドの挿入核酸配列に対して5’に存在する核酸配列(必要に応じて「5’隣接核酸配列A」と省略)、本発明のポリヌクレオチドの挿入核酸配列に対して3’に存在する核酸配列(必要に応じて「3’隣接核酸配列A」と省略)が挙げられる。従って、上記ii)の特異的な部分ヌクレオチドAは、5’隣接核酸配列Aの所定の位置から本発明のポリヌクレオチドの挿入核酸配列の所定の位置にわたる核酸配列からなる部分ヌクレオチド、本発明のポリヌクレオチドの挿入核酸配列の所定の位置から3’隣接核酸配列Aの所定の位置にわたる核酸配列からなる部分ヌクレオチド、あるいは5’隣接核酸配列Aの所定の位置から3’隣接核酸配列Aの所定の位置にわたる、本発明のポリヌクレオチドの挿入核酸配列全体を含む核酸配列からなる部分ヌクレオチドであり得る。上記ii)の特異的な部分ヌクレオチドAに含まれる、挿入核酸配列(又は5’末端若しくは3’末端部分核酸配列A)あるいは隣接核酸配列(又は5’末端若しくは3’末端隣接核酸配列A)中のヌクレオチド残基数は、上記ii)の特異的な部分ヌクレオチドAの特異性を確保できる数である限り特に限定されないが、例えば少なくとも3個、好ましくは少なくとも4個、より好ましくは少なくとも5個、さらにより好ましくは少なくとも6個、最も好ましくは少なくとも7個、8個、9個又は10個であり得る。このような末端部分核酸配列及びこのような隣接核酸配列は、本明細書中の開示から明らかである。   The specific partial nucleotide A of ii) above consists of the inserted nucleic acid sequence of the polynucleotide of the present invention or its terminal partial nucleic acid sequence and its adjacent nucleic acid sequence. As such a terminal partial nucleic acid sequence, a nucleic acid sequence corresponding to the 5 ′ terminal part in the inserted nucleic acid sequence of the polynucleotide of the present invention (abbreviated as “5 ′ terminal partial nucleic acid sequence A” if necessary), the present invention And a nucleic acid sequence corresponding to the 3 ′ end portion of the inserted nucleic acid sequence of the polypeptide (abbreviated as “3 ′ end portion nucleic acid sequence A” if necessary). As such an adjacent nucleic acid sequence, a nucleic acid sequence existing 5 ′ to the inserted nucleic acid sequence of the polynucleotide of the present invention (abbreviated as “5 ′ adjacent nucleic acid sequence A” if necessary), the polynucleotide of the present invention A nucleic acid sequence existing 3 ′ to the inserted nucleic acid sequence (abbreviated as “3 ′ adjacent nucleic acid sequence A” if necessary). Therefore, the specific partial nucleotide A of ii) above is a partial nucleotide consisting of a nucleic acid sequence extending from a predetermined position of the 5 ′ adjacent nucleic acid sequence A to a predetermined position of the inserted nucleic acid sequence of the polynucleotide of the present invention. Partial nucleotide consisting of a nucleic acid sequence extending from a predetermined position of a nucleotide insertion nucleic acid sequence to a predetermined position of 3 ′ adjacent nucleic acid sequence A, or a predetermined position of 3 ′ adjacent nucleic acid sequence A from a predetermined position of 5 ′ adjacent nucleic acid sequence A Can be a partial nucleotide consisting of a nucleic acid sequence comprising the entire inserted nucleic acid sequence of a polynucleotide of the invention. In the inserted partial nucleic acid sequence (or 5 ′ terminal or 3 ′ terminal partial nucleic acid sequence A) or adjacent nucleic acid sequence (or 5 ′ terminal or 3 ′ terminal adjacent nucleic acid sequence A) included in the specific partial nucleotide A of ii) above The number of nucleotide residues is not particularly limited as long as it is a number that can ensure the specificity of the specific partial nucleotide A in the above ii), for example, at least 3, preferably at least 4, more preferably at least 5, Even more preferably it may be at least 6, most preferably at least 7, 8, 9, or 10. Such terminal partial nucleic acid sequences and such flanking nucleic acid sequences will be apparent from the disclosure herein.

上記iii)の特異的な部分ヌクレオチドAは、既知ポリヌクレオチドの挿入核酸配列に対して5’及び3’に存在する双方の核酸配列が連結した核酸配列(本発明のポリヌクレオチドでは、エクソンの欠失に起因して、これらの核酸配列は連結している)からなる、既知ポリヌクレオチドに存在しない部分ヌクレオチドである。上記iii)の特異的な部分ヌクレオチドAに含まれる、既知ポリヌクレオチドの挿入核酸配列に対して5’及び3’に存在する各核酸配列中のヌクレオチド残基数はそれぞれ、上記iii)の特異的な部分ヌクレオチドAの特異性を確保できる数である限り特に限定されないが、例えば少なくとも3個、好ましくは少なくとも4個、より好ましくは少なくとも5個、さらにより好ましくは少なくとも6個、最も好ましくは少なくとも7個、8個、9個又は10個であり得る。   The specific partial nucleotide A in the above iii) is a nucleic acid sequence in which both 5 ′ and 3 ′ nucleic acid sequences are linked to an inserted nucleic acid sequence of a known polynucleotide (in the polynucleotide of the present invention, an exon is missing). These nucleic acid sequences are linked to each other due to loss, and are partial nucleotides not present in known polynucleotides. The number of nucleotide residues in each nucleic acid sequence present 5 ′ and 3 ′ with respect to the inserted nucleic acid sequence of the known polynucleotide contained in the specific partial nucleotide A of iii) is the specific number of the above iii) Is not particularly limited as long as the specificity of the partial nucleotide A can be ensured, but for example, at least 3, preferably at least 4, more preferably at least 5, even more preferably at least 6, most preferably at least 7 May be 8, 9, 9 or 10.

本発明の特異的な部分ヌクレオチドAは、例えば、本発明のポリヌクレオチドを特異的に検出するための標的として、及び血球系に特異的あるいは破骨細胞分化に特異的なマーカーとして有用であり得る。本発明の特異的な部分ヌクレオチドAはまた、本発明のポリヌクレオチドを特異的に認識し得る物質、又は本発明のポリヌクレオチドを特異的に認識し得ない物質の開発、あるいは本発明のポリペプチドの発現を特異的に調節し得る物質、又は本発明のポリペプチドの発現を特異的に調節し得ない物質の開発に有用であり得る。   The specific partial nucleotide A of the present invention can be useful, for example, as a target for specifically detecting the polynucleotide of the present invention, and as a marker specific for blood cells or specific for osteoclast differentiation. . The specific partial nucleotide A of the present invention can also be used to develop a substance that can specifically recognize the polynucleotide of the present invention, or a substance that cannot specifically recognize the polynucleotide of the present invention, or the polypeptide of the present invention. It may be useful for the development of a substance that can specifically regulate the expression of or a substance that cannot specifically regulate the expression of the polypeptide of the present invention.

本発明の特異的な部分ヌクレオチドBは、既知ポリヌクレオチド中にのみ存在し、かつ配列番号Yで表される核酸配列等を有するポリヌクレオチド中に存在しない部分ヌクレオチドである。このような特異的な部分ヌクレオチドBとしては、例えば、i)既知ポリヌクレオチドの挿入核酸配列又はその部分核酸配列からなる部分ヌクレオチド、ii)既知ポリヌクレオチドの挿入核酸配列又はその末端部分核酸配列及びその隣接核酸配列からなる部分ヌクレオチド、iii)エクソンの欠失に起因して形成される、本発明のポリヌクレオチドの挿入核酸配列に対して5’及び3’に存在する双方の核酸配列が連結した核酸配列からなる部分ヌクレオチドが挙げられる。   The specific partial nucleotide B of the present invention is a partial nucleotide that exists only in a known polynucleotide and does not exist in a polynucleotide having the nucleic acid sequence represented by SEQ ID NO: Y or the like. Examples of such a specific partial nucleotide B include i) a partial nucleotide consisting of an inserted nucleic acid sequence of a known polynucleotide or a partial nucleic acid sequence thereof; ii) an inserted nucleic acid sequence of a known polynucleotide or a terminal partial nucleic acid sequence thereof; A partial nucleotide consisting of an adjacent nucleic acid sequence, iii) a nucleic acid formed by ligation of both nucleic acid sequences 5 ′ and 3 ′ to the inserted nucleic acid sequence of the polynucleotide of the present invention formed by exon deletion Examples include partial nucleotides consisting of sequences.

上記i)の特異的な部分ヌクレオチドBは、既知ポリヌクレオチドの挿入核酸配列又はその部分核酸配列からなる。このような部分核酸配列は、本明細書中の開示から明らかである。   The specific partial nucleotide B in i) above consists of an inserted nucleic acid sequence of a known polynucleotide or a partial nucleic acid sequence thereof. Such partial nucleic acid sequences are apparent from the disclosure herein.

上記ii)の特異的な部分ヌクレオチドBは、既知ポリヌクレオチドの挿入核酸配列又はその末端部分核酸配列及びその隣接核酸配列からなる。このような末端部分核酸配列としては、既知ポリヌクレオチドの挿入核酸配列中の5’末端部分に対応する核酸配列(必要に応じて「5’末端部分核酸配列B」と省略)、既知ポリヌクレオチドの挿入核酸配列中の3’末端部分に対応する核酸配列(必要に応じて「3’末端部分核酸配列B」と省略)が挙げられる。このような隣接核酸配列としては、既知ポリヌクレオチドの挿入核酸配列に対して5’に存在する核酸配列(必要に応じて「5’隣接核酸配列B」と省略)、既知ポリヌクレオチドの挿入核酸配列に対して3’に存在する核酸配列(必要に応じて「3’隣接核酸配列B」と省略)が挙げられる。従って、上記ii)の特異的な部分ヌクレオチドBは、5’隣接核酸配列Bの所定の位置から既知ポリヌクレオチドの挿入核酸配列の所定の位置にわたる核酸配列からなる部分ヌクレオチド、既知ポリヌクレオチドの挿入核酸配列の所定の位置から3’隣接核酸配列Bの所定の位置にわたる核酸配列からなる部分ヌクレオチド、あるいは5’隣接核酸配列Bの所定の位置から3’隣接核酸配列Bの所定の位置にわたる、既知ポリヌクレオチドの挿入核酸配列全体を含む核酸配列からなる部分ヌクレオチドであり得る。上記ii)の特異的な部分ヌクレオチドBに含まれる、挿入核酸配列(又は5’末端若しくは3’末端部分核酸配列B)あるいは隣接核酸配列(又は5’末端若しくは3’末端隣接核酸配列B)中のヌクレオチド残基数は、上記ii)の特異的な部分ヌクレオチドBの特異性を確保できる数である限り特に限定されないが、例えば少なくとも3個、好ましくは少なくとも4個、より好ましくは少なくとも5個、さらにより好ましくは少なくとも6個、最も好ましくは少なくとも7個、8個、9個又は10個であり得る。このような末端部分核酸配列及びこのような隣接核酸配列は、本明細書中の開示から明らかである。   The specific partial nucleotide B of ii) above consists of an inserted nucleic acid sequence of a known polynucleotide or its terminal partial nucleic acid sequence and its adjacent nucleic acid sequence. As such a terminal partial nucleic acid sequence, a nucleic acid sequence corresponding to the 5 ′ terminal portion of the inserted nucleic acid sequence of a known polynucleotide (abbreviated as “5 ′ terminal partial nucleic acid sequence B” if necessary), Examples include a nucleic acid sequence corresponding to the 3 ′ end portion in the inserted nucleic acid sequence (abbreviated as “3 ′ end portion nucleic acid sequence B” if necessary). As such an adjacent nucleic acid sequence, a nucleic acid sequence existing 5 ′ to an inserted nucleic acid sequence of a known polynucleotide (abbreviated as “5 ′ adjacent nucleic acid sequence B” if necessary), an inserted nucleic acid sequence of a known polynucleotide In contrast, a nucleic acid sequence existing 3 ′ (abbreviated as “3 ′ adjacent nucleic acid sequence B” if necessary). Therefore, the specific partial nucleotide B of the above ii) is a partial nucleotide consisting of a nucleic acid sequence extending from a predetermined position of the 5 ′ adjacent nucleic acid sequence B to a predetermined position of the inserted nucleic acid sequence of the known polynucleotide, an inserted nucleic acid of the known polynucleotide A partial nucleotide consisting of a nucleic acid sequence extending from a predetermined position of the sequence to a predetermined position of the 3 ′ adjacent nucleic acid sequence B, or a known polymorphism extending from a predetermined position of the 5 ′ adjacent nucleic acid sequence B to a predetermined position of the 3 ′ adjacent nucleic acid sequence B; It may be a partial nucleotide consisting of a nucleic acid sequence comprising the entire inserted nucleic acid sequence of nucleotides. In the inserted nucleic acid sequence (or 5′-end or 3′-end partial nucleic acid sequence B) or adjacent nucleic acid sequence (or 5′-end or 3′-end adjacent nucleic acid sequence B) contained in the specific partial nucleotide B of ii) above The number of nucleotide residues is not particularly limited as long as it is a number that can ensure the specificity of the specific partial nucleotide B in the above ii), for example, at least 3, preferably at least 4, more preferably at least 5, Even more preferably it may be at least 6, most preferably at least 7, 8, 9, or 10. Such terminal partial nucleic acid sequences and such flanking nucleic acid sequences will be apparent from the disclosure herein.

上記iii)の特異的な部分ヌクレオチドBは、本発明のポリヌクレオチドの挿入核酸配列に対して5’及び3’に存在する双方の核酸配列が連結した核酸配列(既知ポリヌクレオチドでは、エクソンの欠失に起因して、これらの核酸配列は連結している)からなる、本発明のポリヌクレオチドに存在しない部分ヌクレオチドである。上記iii)の特異的な部分ヌクレオチドBに含まれる、本発明のポリヌクレオチドの挿入核酸配列に対して5’及び3’に存在する各核酸配列中のヌクレオチド残基数はそれぞれ、上記iii)の特異的な部分ヌクレオチドBの特異性を確保できる数である限り特に限定されないが、例えば少なくとも3個、好ましくは少なくとも4個、より好ましくは少なくとも5個、さらにより好ましくは少なくとも6個、最も好ましくは少なくとも7個、8個、9個又は10個であり得る。   The specific partial nucleotide B in the above iii) is a nucleic acid sequence in which both 5 ′ and 3 ′ nucleic acid sequences are linked to the inserted nucleic acid sequence of the polynucleotide of the present invention (in the known polynucleotide, the exon is missing). These nucleic acid sequences are linked to each other due to loss, and are partial nucleotides not present in the polynucleotide of the present invention. The number of nucleotide residues in each nucleic acid sequence present 5 ′ and 3 ′ with respect to the inserted nucleic acid sequence of the polynucleotide of the present invention contained in the specific partial nucleotide B of iii) is the same as that of iii) above. Although it is not particularly limited as long as it is a number that can ensure the specificity of a specific partial nucleotide B, for example, at least 3, preferably at least 4, more preferably at least 5, even more preferably at least 6, most preferably There may be at least 7, 8, 9, or 10.

本発明の特異的な部分ヌクレオチドBは、例えば、既知ポリヌクレオチドを特異的に検出するための標的として、及び血球系に特異的あるいは破骨細胞分化に特異的なマーカーとして、あるいはこれらに非特異的なマーカーとして有用であり得る。本発明の特異的な部分ヌクレオチドBはまた、既知ポリヌクレオチドを特異的に認識し得る物質、又は既知ポリヌクレオチドを特異的に認識し得ない物質の開発、あるいは既知ポリペプチドの発現を特異的に調節し得る物質、又は既知ポリペプチドの発現を特異的に調節し得ない物質の開発に有用であり得る。   The specific partial nucleotide B of the present invention is used, for example, as a target for specifically detecting a known polynucleotide, and as a marker specific for blood cells or as a marker specific for osteoclast differentiation, or non-specific to these. As useful markers. The specific partial nucleotide B of the present invention also specifically develops a substance that can specifically recognize a known polynucleotide, or a substance that cannot specifically recognize a known polynucleotide, or expresses a known polypeptide. It may be useful in the development of substances that can be modulated or substances that cannot specifically regulate the expression of known polypeptides.

本発明の共通部分ヌクレオチドは、本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方に存在する、非特異的な部分ヌクレオチドであり得る。このような部分ヌクレオチドは、本明細書中の開示から明らかである。本発明の共通部分ヌクレオチドは、例えば、本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方を包括的に検出するための標的として、及び血球系に特異的あるいは破骨細胞分化に特異的なマーカーとして、あるいはこれらに非特異的なマーカーとして有用であり得る。本発明の共通部分ヌクレオチドはまた、本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方を包括的に認識し得る物質、又は本発明のポリペプチド及び既知ポリペプチドの双方の発現を包括的に調節し得る物質の開発に有用であり得る。   The common partial nucleotide of the present invention may be a non-specific partial nucleotide present in both the polynucleotide of the present invention and the known polynucleotide. Such partial nucleotides are apparent from the disclosure herein. The consensus nucleotides of the present invention, for example, as a target for comprehensive detection of both the polynucleotides of the present invention and known polynucleotides, and as a marker specific for blood cell lineage or specific for osteoclast differentiation, Alternatively, it may be useful as a non-specific marker for these. The consensus nucleotides of the present invention can also comprehensively regulate the substance that can comprehensively recognize both the polynucleotides of the present invention and known polynucleotides, or the expression of both the polypeptides of the present invention and known polypeptides. Can be useful in material development.

本発明のポリヌクレオチド及びその部分ヌクレオチドは、本発明のポリペプチド又は本発明の部分ペプチドをコードし得る。本発明のポリヌクレオチド又は本発明の部分ヌクレオチドはまた、異種核酸配列からなるポリヌクレオチドと融合していてもよい。このような異種核酸配列としては、上述の異種アミノ酸配列をコードするものが挙げられる。   The polynucleotide of the present invention and the partial nucleotide thereof can encode the polypeptide of the present invention or the partial peptide of the present invention. The polynucleotide of the present invention or the partial nucleotide of the present invention may also be fused with a polynucleotide consisting of a heterologous nucleic acid sequence. Such heterologous nucleic acid sequences include those encoding the above heterologous amino acid sequences.

本発明のポリヌクレオチド及びその部分ヌクレオチドは、塩の形態で提供されてもよい。塩としては、上述のものが挙げられる。   The polynucleotide of the present invention and its partial nucleotide may be provided in the form of a salt. Examples of the salt include those described above.

本発明のポリヌクレオチド及びその部分ヌクレオチドは、自体公知の方法により作製できる。例えば、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2と同一の核酸配列は、所定の組織又は細胞を用いてクローニングできる。また、配列番号Yで表される核酸配列、又は核酸配列Y1若しくは核酸配列Y2と実質的に同一の核酸配列は、上記の通りクローニングしたポリヌクレオチドに変異を導入することにより作製できる。変異導入法としては、例えば、合成オリゴヌクレオチド指定突然変異導入法、gapped duplex法、ランダムに点突然変異を導入する方法(例えば、亜硝酸若しくは亜硫酸での処理)、カセット変異法、リンカースキャニング法、ミスマッチプライマー法が挙げられる。   The polynucleotide of the present invention and its partial nucleotide can be prepared by a method known per se. For example, the nucleic acid sequence represented by SEQ ID NO: Y or the same nucleic acid sequence as the nucleic acid sequence Y1 or the nucleic acid sequence Y2 can be cloned using a predetermined tissue or cell. In addition, the nucleic acid sequence represented by SEQ ID NO: Y, or a nucleic acid sequence substantially identical to the nucleic acid sequence Y1 or the nucleic acid sequence Y2 can be prepared by introducing mutations into the cloned polynucleotide as described above. Examples of the mutagenesis method include synthetic oligonucleotide-directed mutagenesis method, gapped duplex method, method of randomly introducing point mutations (for example, treatment with nitrous acid or sulfite), cassette mutagenesis method, linker scanning method, A mismatch primer method is exemplified.

2.関連物質
本発明は、本発明のポリペプチド及び本発明の部分ペプチド、並びに本発明のポリヌクレオチド及び本発明の部分ヌクレオチドに基づき開発が可能となる一連の関連物質を提供する。以下に記載される本発明の関連物質は、例えば、医薬として有用であり得る。本発明の関連物質が医薬である場合、対象疾患は、血球系又は破骨細胞の障害に基づく疾患であり得、例えば、免疫性疾患、炎症性疾患、アレルギー性疾患が挙げられる。詳細には、このような疾患としては、免疫不全症、白血病、リンパ腫、骨髄異形成症候群、骨髄腫、好中球機能異常症、自己免疫疾患、関節リューマチ、膠原病、アトピー性皮膚炎、脾機能亢進症、胸腺種、癌の骨転移、骨粗鬆症などが挙げられる。破骨細胞の障害に基づく疾患としては、関節リューマチ、癌の骨転移、骨粗鬆症などが挙げられる。
2. Related Substances The present invention provides a series of related substances that can be developed based on the polypeptide of the present invention and the partial peptide of the present invention, and the polynucleotide of the present invention and the partial nucleotide of the present invention. The related substances of the present invention described below can be useful, for example, as a medicine. When the related substance of the present invention is a medicine, the target disease can be a disease based on a disorder of blood cells or osteoclasts, and examples thereof include immune diseases, inflammatory diseases, and allergic diseases. Specifically, such diseases include immunodeficiency, leukemia, lymphoma, myelodysplastic syndrome, myeloma, neutrophil dysfunction, autoimmune disease, rheumatoid arthritis, collagen disease, atopic dermatitis, spleen Examples include hyperfunction, thymus species, bone metastasis of cancer, and osteoporosis. Diseases based on osteoclast damage include rheumatoid arthritis, bone metastasis of cancer, osteoporosis and the like.

2.1.アンチセンス分子
本発明は、アンチセンス分子を提供する。
2.1. Antisense molecules The present invention provides antisense molecules.

アンチセンス分子の種類はDNAであってもRNAであってもよいし、あるいはDNA/RNAキメラであってもよい。アンチセンス分子は、天然型のリン酸ジエステル結合を有するものであっても、分解酵素に安定なチオリン酸型(リン酸結合のP=OをP=Sに置換)や2’−O−メチル型等の修飾ヌクレオチドであってもよい。アンチセンス分子の設計に重要な他の要素として、水溶性及び細胞膜透過性を高めること等が挙げられるが、これらはリポソームやマイクロスフェアを使用するなどの剤形の工夫によっても克服できる。アンチセンス分子の長さは、転写産物と特異的にハイブリダイズし得る限り特に制限はなく、短いもので約15個のヌクレオチド程度、長いもので転写産物の全配列に相補的な配列を含むような配列であってもよい。合成の容易さや抗原性の問題等から、例えば約15個以上のヌクレオチド、好ましくは約15個〜約100個のヌクレオチド、より好ましくは約18個〜約50個のヌクレオチドからなるオリゴヌクレオチドが例示される。さらに、アンチセンス分子は、転写産物とハイブリダイズして翻訳を阻害するだけでなく、二本鎖DNAと結合して三重鎖(トリプレックス)を形成し、mRNAへの転写を阻害し得るものであってもよい。   The kind of antisense molecule may be DNA or RNA, or may be a DNA / RNA chimera. Even if the antisense molecule has a natural phosphodiester bond, the thiophosphate type (P = O in the phosphate bond is replaced by P = S) or 2′-O-methyl, which is stable to a degrading enzyme It may be a modified nucleotide such as a type. Other important factors for the design of antisense molecules include increasing water solubility and cell membrane permeability, but these can be overcome by devising dosage forms such as the use of liposomes and microspheres. The length of the antisense molecule is not particularly limited as long as it can specifically hybridize with the transcript. The length of the antisense molecule is about 15 nucleotides as short and includes a sequence that is long and complementary to the entire sequence of the transcript. It may be an array. From the viewpoint of ease of synthesis, antigenicity problems, etc., for example, oligonucleotides comprising about 15 nucleotides or more, preferably about 15 to about 100 nucleotides, more preferably about 18 to about 50 nucleotides are exemplified. The Furthermore, antisense molecules can not only hybridize with transcripts and inhibit translation, but also bind to double-stranded DNA to form triplex and inhibit transcription to mRNA. There may be.

本発明のアンチセンス分子は、本発明の部分ヌクレオチド(例、本発明の特異的な部分ヌクレオチドA及びB、本発明の共通部分ヌクレオチド)に対応する核酸配列に相補的な核酸配列を含み得る。従って、本発明のアンチセンス分子は、本発明のポリヌクレオチドに特異的なアンチセンス分子、既知ポリヌクレオチドに特異的なアンチセンス分子、又は本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方に共通するアンチセンス分子であり得る。本発明のアンチセンス分子は、本発明のポリペプチド又は既知ポリペプチドの発現の特異的な抑制、又は本発明のポリペプチド及び既知ポリペプチドの双方の発現の包括的な抑制に有用であり得る。   The antisense molecule of the present invention may comprise a nucleic acid sequence complementary to a nucleic acid sequence corresponding to a partial nucleotide of the present invention (eg, specific partial nucleotides A and B of the present invention, common partial nucleotide of the present invention). Accordingly, an antisense molecule of the present invention is an antisense molecule specific for a polynucleotide of the present invention, an antisense molecule specific for a known polynucleotide, or an antisense common to both a polynucleotide of the present invention and a known polynucleotide. It can be a sense molecule. The antisense molecules of the present invention may be useful for specific suppression of expression of a polypeptide of the present invention or a known polypeptide, or for comprehensive suppression of expression of both a polypeptide of the present invention and a known polypeptide.

2.2.RNAi誘導性核酸
本発明は、RNAi誘導性核酸を提供する。
2.2. RNAi Inducible Nucleic Acid The present invention provides an RNAi inducible nucleic acid.

RNAi誘導性核酸とは、細胞内に導入されることにより、RNA干渉(RNAi)効果を誘導し得るポリヌクレオチドをいい、好ましくはRNAである。RNAi効果とは、mRNAと同一の核酸配列又はその部分配列を含む2本鎖構造のRNAが、当該mRNAの発現を抑制する現象をいう。RNAi効果を得るには、例えば、少なくとも20以上の連続する標的mRNAと同一の核酸配列(又はその部分配列)を有する2本鎖構造のRNAを用いることが好ましい。2本鎖構造は、異なるストランドで構成されていてもよいし、一つのRNAのステムループ構造によって与えられる2本鎖であってもよい。RNAi誘導性核酸としては、例えばsiRNA、miRNAなどが挙げられるが、siRNAが好ましい。siRNAは、RNAiを誘導できる限り特に制限されないが、例えば21〜27塩基長、好ましくは21〜25塩基長であり得る。   RNAi-inducible nucleic acid refers to a polynucleotide that can induce an RNA interference (RNAi) effect when introduced into a cell, and is preferably RNA. The RNAi effect refers to a phenomenon in which a double-stranded RNA containing the same nucleic acid sequence as mRNA or a partial sequence thereof suppresses the expression of the mRNA. In order to obtain the RNAi effect, for example, it is preferable to use RNA having a double-stranded structure having the same nucleic acid sequence (or a partial sequence thereof) as at least 20 or more consecutive target mRNAs. The double-stranded structure may be composed of different strands, or may be a double-stranded structure provided by a single RNA stem-loop structure. Examples of RNAi-inducible nucleic acids include siRNA and miRNA, and siRNA is preferred. The siRNA is not particularly limited as long as it can induce RNAi, but may be, for example, 21 to 27 bases long, preferably 21 to 25 bases long.

本発明のRNAi誘導性核酸は、本発明の部分ヌクレオチド(例、本発明の特異的な部分ヌクレオチドA及びB、本発明の共通部分ヌクレオチド)に対応する核酸配列からなるセンス鎖、及びそれに相補的な核酸配列からなるアンチセンス鎖から構成される二重鎖ポリヌクレオチドであり得る。本発明のRNAi誘導性核酸はまた、センス鎖及びアンチセンス鎖の一方又は双方の5’末端及び/又は3’末端においてオーバーハングを有していてもよい。オーバーハングは、センス鎖及び/又はアンチセンス鎖の5’末端及び/又は3’末端における1〜数個(例、1、2又は3個)の塩基の付加により形成されたものであり得る。本発明のRNAi誘導性核酸は、本発明のポリヌクレオチドに特異的なRNAi誘導性核酸、既知ポリヌクレオチドに特異的なRNAi誘導性核酸、又は本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方に共通するRNAi誘導性核酸であり得る。本発明のRNAi誘導性核酸は、本発明のポリペプチド又は既知ポリペプチドの発現の特異的な抑制、又は本発明のポリペプチド及び既知ポリペプチドの双方の発現の包括的な抑制に有用であり得る。   The RNAi-inducible nucleic acid of the present invention comprises a sense strand consisting of a nucleic acid sequence corresponding to a partial nucleotide of the present invention (eg, specific partial nucleotides A and B of the present invention, a common partial nucleotide of the present invention), and complementary thereto. It can be a double-stranded polynucleotide composed of an antisense strand consisting of a simple nucleic acid sequence. The RNAi-inducible nucleic acid of the present invention may also have an overhang at the 5 'end and / or the 3' end of one or both of the sense strand and the antisense strand. The overhang may be formed by the addition of one to several (eg, 1, 2 or 3) bases at the 5 'end and / or the 3' end of the sense and / or antisense strand. The RNAi-inducible nucleic acid of the present invention is common to the RNAi-inducible nucleic acid specific to the polynucleotide of the present invention, the RNAi-inducible nucleic acid specific to the known polynucleotide, or both the polynucleotide of the present invention and the known polynucleotide. It can be an RNAi-inducible nucleic acid. The RNAi-inducible nucleic acid of the present invention may be useful for specific suppression of expression of the polypeptide of the present invention or a known polypeptide, or for comprehensive suppression of expression of both the polypeptide of the present invention and a known polypeptide. .

2.3.アプタマー
本発明は、アプタマーを提供する。
2.3. Aptamer The present invention provides an aptamer.

アプタマーとは、所定の標的分子に対する結合活性(又は阻害活性)を有するポリヌクレオチドをいう。本発明のアプタマーは、RNA、DNA、修飾ヌクレオチド又はそれらの混合物であり得る。本発明のアプタマーはまた、直鎖状又は環状の形態であり得る。アプタマーの長さは特に限定されず、通常、約16〜約200個のヌクレオチドであり得るが、例えば約100個のヌクレオチド以下であり、好ましくは約50個のヌクレオチド以下であり、より好ましくは約40個のヌクレオチド以下であり得る。また、本発明のアプタマーの長さは、例えば約18個、約20個、約25個又は約30個ヌクレオチド以上であってもよい。アプタマーは、結合性、安定性、薬物送達性等を高めるため、各ヌクレオチドの糖残基(例、リボース)が修飾されたものであってもよい。糖残基において修飾される部位としては、例えば、糖残基の2’位、3’位及び/又は4’位の酸素原子を他の原子に置き換えたものなどが挙げられる。修飾の種類としては、例えば、フルオロ化、O−アルキル化、O−アリル化、S−アルキル化、S−アリル化及びアミノ化が挙げられる(例、Sproat et al., (1991) Nucl. Acid. Res. 19, 733-738; Cotton et al., (1991) Nucl. Acid. Res. 19, 2629-2635参照)。アプタマーはまた、プリン、ピリミジンが改変されたものであってもよい。このような改変としては、例えば、5位ピリミジン改変、8位プリン改変、環外アミンでの改変、4−チオウリジンでの置換、5−ブロモ又は5−ヨード−ウラシルでの置換が挙げられる。また、ヌクレアーゼ及び加水分解に対して耐性であるように、本発明のアプタマーに含まれるリン酸基が改変されていてもよい。例えば、リン酸基が、チオエート、ジチオエート又はアミデートで置換されていてもよい。アプタマーは、既報(例えば、Ellington et al., (1990) Nature, 346, 818-822; Tuerk et al., (1990) Science, 249, 505-510)に従って作製できる。   An aptamer refers to a polynucleotide having binding activity (or inhibitory activity) for a predetermined target molecule. The aptamers of the present invention can be RNA, DNA, modified nucleotides or mixtures thereof. The aptamer of the present invention can also be in a linear or cyclic form. The length of the aptamer is not particularly limited, and can generally be about 16 to about 200 nucleotides, for example, about 100 nucleotides or less, preferably about 50 nucleotides or less, more preferably about It can be up to 40 nucleotides. The length of the aptamer of the present invention may be, for example, about 18, about 20, about 25, or about 30 nucleotides or more. The aptamer may be one in which the sugar residue (eg, ribose) of each nucleotide is modified in order to enhance binding properties, stability, drug delivery properties, and the like. Examples of the site modified in the sugar residue include those in which the oxygen atom at the 2′-position, 3′-position and / or 4′-position of the sugar residue is replaced with another atom. Types of modifications include, for example, fluorination, O-alkylation, O-allylation, S-alkylation, S-allylation and amination (eg, Sproat et al., (1991) Nucl. Acid Res. 19, 733-738; Cotton et al., (1991) Nucl. Acid. Res. 19, 2629-2635). Aptamers may also be modified purines and pyrimidines. Examples of such modifications include 5-position pyrimidine modification, 8-position purine modification, modification with exocyclic amine, substitution with 4-thiouridine, and substitution with 5-bromo or 5-iodo-uracil. Moreover, the phosphate group contained in the aptamer of the present invention may be modified so as to be resistant to nuclease and hydrolysis. For example, the phosphate group may be substituted with thioate, dithioate or amidate. Aptamers can be made according to previous reports (eg, Ellington et al., (1990) Nature, 346, 818-822; Tuerk et al., (1990) Science, 249, 505-510).

本発明のアプタマーは、本発明の部分ペプチドに対応する領域を介して、本発明のポリペプチド、既知ポリペプチド、又は本発明のポリペプチド及び既知ポリペプチドの双方に特異的に結合し得る。従って、本発明のアプタマーは、本発明のポリペプチドに特異的なアプタマー、既知ポリペプチドに特異的なアプタマー、又は本発明のポリペプチド及び既知ポリペプチドの双方に共通するアプタマーであり得る。このような特異的なアプタマーは、例えば、(a)本発明のポリペプチド又はその特異的な部分ペプチドに結合し、かつ既知ポリペプチドに結合しないポリヌクレオチド、(b)既知ポリペプチド又はその特異的な部分ペプチドに結合し、かつ本発明のポリペプチドに結合しないポリヌクレオチド、あるいは(c)本発明のポリペプチド及び既知ポリペプチドの双方又は本発明の共通部分ペプチドに結合するポリヌクレオチドを、SELEX法により選抜することで作製できる。   The aptamer of the present invention can specifically bind to the polypeptide of the present invention, the known polypeptide, or both the polypeptide of the present invention and the known polypeptide via a region corresponding to the partial peptide of the present invention. Therefore, the aptamer of the present invention can be an aptamer specific to the polypeptide of the present invention, an aptamer specific to a known polypeptide, or an aptamer common to both the polypeptide of the present invention and the known polypeptide. Such specific aptamers include, for example, (a) a polynucleotide that binds to the polypeptide of the present invention or a specific partial peptide thereof and does not bind to a known polypeptide, (b) a known polypeptide or a specific thereof. A polynucleotide that binds to a partial peptide and does not bind to the polypeptide of the present invention, or (c) a polynucleotide that binds to both the polypeptide of the present invention and a known polypeptide or the common partial peptide of the present invention. It can produce by selecting by.

2.4.抗体
本発明は、抗体を提供する。
2.4. Antibodies The present invention provides antibodies.

本発明の抗体は、ポリクローナル抗体(抗血清)、モノクローナル抗体のいずれであってもよく、周知の免疫学的手法により作製することができる。モノクローナル抗体は、IgG、IgM、IgA、IgDあるいはIgE等のいずれのアイソタイプであってもよいが、好ましくはIgG又はIgMである。   The antibody of the present invention may be either a polyclonal antibody (antiserum) or a monoclonal antibody, and can be prepared by a well-known immunological technique. The monoclonal antibody may be any isotype such as IgG, IgM, IgA, IgD or IgE, but is preferably IgG or IgM.

例えば、ポリクローナル抗体は、上記抗原(必要に応じて、ウシ血清アルブミン、KLH(Keyhole Limpet Hemocyanin)等のキャリア蛋白質に架橋した複合体とすることもできる)を、市販のアジュバント(例えば、完全又は不完全フロイントアジュバント)とともに、動物の皮下あるいは腹腔内に2〜3週間おきに2〜4回程度投与し(部分採血した血清の抗体価を公知の抗原抗体反応により測定し、その上昇を確認しておく)、最終免疫から約3〜10日後に全血を採取して抗血清を精製することにより取得できる。抗原を投与する動物としては、ラット、マウス、ウサギ、ヤギ、モルモット、ハムスターなどの哺乳動物が挙げられる。For example, polyclonal antibodies, the antigen (if necessary, bovine serum albumin, KLH (may be a K eyhole L impet H emocyanin) complexes crosslinked to a carrier protein, etc.), commercial adjuvants (e.g., (Complete or incomplete Freund's adjuvant) is administered 2 to 4 times subcutaneously or intraperitoneally in animals every 2 to 3 weeks (the antibody titer of partially collected serum is measured by a known antigen-antibody reaction) It can be obtained by collecting the whole blood about 3 to 10 days after the final immunization and purifying the antiserum. Examples of animals to which the antigen is administered include mammals such as rats, mice, rabbits, goats, guinea pigs, and hamsters.

また、モノクローナル抗体は、細胞融合法により作成することができる。例えば、マウスに上記抗原を市販のアジュバントと共に2〜4回皮下あるいは腹腔内に投与し、最終投与の3日後に脾臓あるいはリンパ節を採取し、白血球を採取する。この白血球と骨髄腫細胞(例えば、NS-1, P3X63Ag8など)を細胞融合して該因子に対するモノクローナル抗体を産生するハイブリドーマを得る。細胞融合はPEG法でも電圧パルス法であってもよい。所望のモノクローナル抗体を産生するハイブリドーマは、周知のEIA又はRIA法等を用いて抗原と特異的に結合する抗体を、培養上清中から検出することにより選択できる。モノクローナル抗体を産生するハイブリドーマの培養は、インビトロ、又はマウスもしくはラット、好ましくはマウス腹水中等のインビボで行うことができ、抗体はそれぞれハイブリドーマの培養上清及び動物の腹水から取得することができる。   A monoclonal antibody can be prepared by a cell fusion method. For example, the above antigen is administered to mice subcutaneously or intraperitoneally 2-4 times together with a commercially available adjuvant, and spleen or lymph nodes are collected 3 days after the final administration, and white blood cells are collected. This leukocyte and myeloma cells (for example, NS-1, P3X63Ag8, etc.) are fused to obtain a hybridoma that produces a monoclonal antibody against the factor. Cell fusion may be PEG or voltage pulse. A hybridoma producing a desired monoclonal antibody can be selected by detecting an antibody that specifically binds to an antigen from the culture supernatant using a well-known EIA or RIA method. The hybridoma producing the monoclonal antibody can be cultured in vitro or in vivo, such as mouse or rat, preferably mouse ascites, and the antibody can be obtained from the culture supernatant of the hybridoma and the ascites of the animal, respectively.

本発明の抗体はまた、キメラ抗体、ヒト化抗体又はヒト抗体であってもよい。   The antibodies of the present invention may also be chimeric antibodies, humanized antibodies or human antibodies.

キメラ抗体は、その可変領域及び定常領域が互いに異なる動物種のイムノグロブリンに由来するモノクローナル抗体を意味する。例えば、キメラ抗体は、その可変領域がマウスイムノグロブリン由来の可変領域であり、かつその定常領域がヒトイムノグロブリン由来の定常領域であるマウス/ヒトキメラモノクローナル抗体であり得る。ヒトイムノグロブリン由来の定常領域は、IgG、IgM、IgA、IgD及びIgE等のアイソタイプにより各々固有のアミノ酸配列を有するが、本発明における組換キメラモノクローナル抗体の定常領域はいずれのアイソタイプに属するヒトイムノグログリンの定常領域であってもよい。好ましくは、ヒトIgGの定常領域である。   A chimeric antibody means a monoclonal antibody derived from immunoglobulins of animal species whose variable regions and constant regions are different from each other. For example, the chimeric antibody can be a mouse / human chimeric monoclonal antibody whose variable region is a variable region derived from mouse immunoglobulin and whose constant region is a constant region derived from human immunoglobulin. The constant region derived from human immunoglobulin has a unique amino acid sequence depending on isotypes such as IgG, IgM, IgA, IgD, and IgE. However, the constant region of the recombinant chimeric monoclonal antibody of the present invention belongs to any isotype. It may be a constant region of groggrin. Preferably, it is a constant region of human IgG.

キメラ抗体は、自体公知の方法により作製できる。例えば、マウス/ヒトキメラモノクローナル抗体は、既報(例、実験医学(臨時増刊号), Vol. 6, No.10, 1988及び特公平3-73280号公報)に従って作製できる。詳細には、マウスモノクローナル抗体を産生するハイブリドーマから単離した該マウスモノクローナル抗体をコードするDNAから取得した活性なV遺伝子(H鎖可変領域をコードする再配列されたVDJ遺伝子)の下流に、ヒトイムノグロブリンをコードするDNAから取得したC遺伝子(H鎖定常領域をコードするC遺伝子)を、また該ハイブリドーマから単離したマウスモノクローナル抗体をコードするDNAから取得した活性なV遺伝子(L鎖可変領域をコードする再配列されたVJ遺伝子)の下流にヒトイムノグロブリンをコードするDNAから取得したC遺伝子(L鎖定常領域をコードするC遺伝子)を、各々発現可能なように配列して1つ又は別々の発現ベクターに挿入し、該発現ベクターで宿主細胞を形質転換し、該形質転換細胞を培養することにより作製することができる。A chimeric antibody can be prepared by a method known per se. For example, a mouse / human chimeric monoclonal antibody can be prepared according to a previous report (eg, experimental medicine (special issue), Vol. 6, No. 10, 1988 and Japanese Patent Publication No. 3-73280). Specifically, downstream of an active V H gene (rearranged VDJ gene encoding a heavy chain variable region) obtained from DNA encoding the mouse monoclonal antibody isolated from a hybridoma producing a mouse monoclonal antibody, C H gene (H-chain constant region C gene encoding), also active V L genes obtained from DNA encoding the mouse monoclonal antibody isolated from the hybridoma obtained from the DNA encoding human immunoglobulin (L the C gene) encoding the C L gene (L-chain constant region obtained from DNA encoding human immunoglobulin downstream of rearranged VJ gene) encoding the chain variable region, arranged so that each can express Are inserted into one or a separate expression vector, and host cells are transformed with the expression vector. It can be prepared by culturing the transformed cell.

ヒト化抗体は、遺伝子工学的に作製されるモノクローナル抗体であって、例えば、その超可変領域の相補性決定領域の一部又は全部がマウスモノクローナル抗体に由来し、その可変領域の枠組領域及びその定常領域がヒトイムノグロブリンに由来するヒト型モノクローナル抗体を意味する。超可変領域の相補性決定領域は、抗体の可変領域中の超可変領域に存在し、抗原と相補的に直接結合する部位である3つの領域(Complementarity-determining region;CDR1、CDR2、CDR3)であり、可変領域の枠組領域は、該3つの相補性決定領域の前後に介在する比較的保存された4つの領域(Framework;FR1、FR2、FR3、FR4)である。換言すれば、例えばマウスモノクローナル抗体の超可変領域の相補性決定領域の一部又は全部以外の全ての領域が、ヒトイムノグロブリンの対応領域と置き代わったモノクローナル抗体を意味する。   A humanized antibody is a monoclonal antibody produced by genetic engineering. For example, a part or all of the complementarity determining region of the hypervariable region is derived from a mouse monoclonal antibody, and the framework region of the variable region and It means a human monoclonal antibody whose constant region is derived from human immunoglobulin. The complementarity-determining regions of the hypervariable region are the three regions (Complementarity-determining regions; CDR1, CDR2, and CDR3) that are present in the hypervariable region of the antibody variable region and that directly bind complementarily to the antigen. Yes, the frame region of the variable region is four regions (Framework: FR1, FR2, FR3, FR4) that are relatively conserved before and after the three complementarity determining regions. In other words, for example, a monoclonal antibody in which all regions other than part or all of the complementarity determining region of the hypervariable region of a mouse monoclonal antibody are replaced with the corresponding region of human immunoglobulin.

ヒト化抗体は、自体公知の方法により作製できる。例えば、マウスモノクローナル抗体に由来する組換えヒト化抗体は、既報(例、特表平4-506458号公報及び特開昭62-296890号公報)に従って作製できる。詳細には、マウスモノクローナル抗体を産生するハイブリドーマから、少なくとも1つのマウスH鎖CDR遺伝子と該マウスH鎖CDR遺伝子に対応する少なくとも1つのマウスL鎖CDR遺伝子を単離し、またヒトイムノグロブリン遺伝子から前記マウスH鎖CDRに対応するヒトH鎖CDR以外の全領域をコードするヒトH鎖遺伝子と、マウスL鎖CDRに対応するヒトL鎖CDR以外の全領域をコードするヒトL鎖遺伝子を単離する。単離した該マウスH鎖CDR遺伝子と該ヒトH鎖遺伝子を発現可能なように適当な発現ベクターに導入し、同様に該マウスL鎖CDR遺伝子と該ヒトL鎖遺伝子を発現可能なように適当なもう1つの発現ベクターに導入する。又は、該マウスH鎖CDR遺伝子/ヒトH鎖遺伝子とマウスL鎖CDR遺伝子/ヒトL鎖遺伝子を同一の発現ベクターに発現可能なように導入することもできる。このようにして作製された発現ベクターで宿主細胞を形質転換することによりヒト化抗体産生細胞を得、該細胞を培養することにより培養上清中から目的のヒト化抗体を得ることができる。   A humanized antibody can be produced by a method known per se. For example, a recombinant humanized antibody derived from a mouse monoclonal antibody can be prepared in accordance with previous reports (eg, Japanese translations of PCT publication No. 4-506458 and JP-A-62-296890). Specifically, at least one mouse H chain CDR gene and at least one mouse L chain CDR gene corresponding to the mouse H chain CDR gene are isolated from a hybridoma producing a mouse monoclonal antibody, and the human immunoglobulin gene A human H chain gene encoding the entire region other than the human H chain CDR corresponding to the mouse H chain CDR and a human L chain gene encoding the entire region other than the human L chain CDR corresponding to the mouse L chain CDR are isolated. . The isolated mouse H chain CDR gene and the human H chain gene are introduced into an appropriate expression vector so that they can be expressed, and similarly, the mouse L chain CDR gene and the human L chain gene are also expressed appropriately. Into another expression vector. Alternatively, the mouse H chain CDR gene / human H chain gene and the mouse L chain CDR gene / human L chain gene can be introduced into the same expression vector so that they can be expressed. A humanized antibody-producing cell can be obtained by transforming a host cell with the expression vector thus prepared, and the desired humanized antibody can be obtained from the culture supernatant by culturing the cell.

ヒト抗体は、イムノグロブリンを構成するH鎖及びL鎖の可変領域及び定常領域を含む全ての領域がヒトイムノグロブリンをコードする遺伝子に由来する抗体を意味する。   A human antibody means an antibody in which all regions including the variable region and constant region of H and L chains constituting immunoglobulin are derived from a gene encoding human immunoglobulin.

ヒト抗体は、自体公知の方法により作製できる。例えば、ヒト抗体は、少なくともヒトイムノグロブリン遺伝子をマウス等のヒト以外の哺乳動物の遺伝子座中に組込むことにより作製されたトランスジェニック動物を、抗原で免疫感作することにより、前述したポリクローナル抗体あるいはモノクローナル抗体の作製法と同様にして製造することができる。例えば、ヒト抗体を産生するトランスジェニックマウスは、既報(Nature Genetics, Vol.15, p.146-156, 1997; Nature Genetics, Vol.7, p.13-21, 1994; 特表平4-504365号公報;国際出願公開WO94/25585号公報;Nature, Vol.368, p.856-859, 1994; 及び特表平6-500233号公報)に従って作製できる。   Human antibodies can be produced by methods known per se. For example, a human antibody can be prepared by immunizing a transgenic animal produced by incorporating at least a human immunoglobulin gene into a genetic locus of a mammal other than human, such as a mouse. It can be produced in the same manner as the production method of the monoclonal antibody. For example, transgenic mice producing human antibodies have been reported (Nature Genetics, Vol. 15, p. 146-156, 1997; Nature Genetics, Vol. 7, p. 13-21, 1994; International Publication No. WO94 / 25585; Nature, Vol.368, p.856-859, 1994; and Japanese National Publication No. Hei 6-500233).

本発明の抗体はまた、前述の本発明の抗体(例、モノクローナル抗体)の一部であり得る。このような抗体としては、例えば、F(ab’)、Fab’、Fab、Fv断片、単鎖抗体が挙げられる。The antibody of the present invention can also be a part of the above-described antibody (eg, monoclonal antibody) of the present invention. Examples of such antibodies include F (ab ′) 2 , Fab ′, Fab, Fv fragments, and single chain antibodies.

本発明の抗体は、本発明の部分ペプチドに対応する領域を介して、本発明のポリペプチド、既知ポリペプチド、又は本発明のポリペプチド及び既知ポリペプチドの双方に特異的に結合し得る。従って、本発明の抗体は、本発明のポリペプチドに特異的な抗体、既知ポリペプチドに特異的な抗体、又は本発明のポリペプチド及び既知ポリペプチドの双方に共通する抗体であり得る。このような特異的な抗体は、例えば、本発明のポリペプチドの特異的な部分ペプチド、既知ポリペプチドの特異的な部分ペプチド、又は本発明の共通部分ペプチドを、抗原として用いることにより作製できる。   The antibody of the present invention can specifically bind to the polypeptide of the present invention, the known polypeptide, or both the polypeptide of the present invention and the known polypeptide via a region corresponding to the partial peptide of the present invention. Accordingly, the antibody of the present invention may be an antibody specific for the polypeptide of the present invention, an antibody specific for a known polypeptide, or an antibody common to both the polypeptide of the present invention and the known polypeptide. Such a specific antibody can be produced, for example, by using a specific partial peptide of the polypeptide of the present invention, a specific partial peptide of a known polypeptide, or a common partial peptide of the present invention as an antigen.

2.5.発現ベクター
本発明は、上述の物質の発現ベクターを提供する。
2.5. Expression Vector The present invention provides an expression vector for the aforementioned substance.

本発明の発現ベクターは、発現されるべき目的ポリペプチドをコードするポリヌクレオチド又は発現されるべき目的ポリヌクレオチド、及び当該ポリヌクレオチドに機能可能に連結されたプロモーターを含み得る。「プロモーターがポリヌクレオチドに機能可能に連結されている」とは、プロモーターが、その制御下にあるポリヌクレオチド自体の発現又はポリヌクレオチドによりコードされるポリペプチドの発現を可能とするように、該遺伝子をコードするポリヌクレオチドに結合していることを意味する。   The expression vector of the present invention may comprise a polynucleotide encoding a target polypeptide to be expressed or a target polynucleotide to be expressed, and a promoter operably linked to the polynucleotide. “Promoter is operably linked to a polynucleotide” means that the promoter is capable of expressing the polynucleotide itself under its control or the expression of a polypeptide encoded by the polynucleotide. Is bound to a polynucleotide encoding.

本発明の発現ベクターのバックボーン(backbone)としては、所定の細胞で目的の物質を産生できるものであれば特に制限されないが、例えば、プラスミドベクター、ウイルスベクターが挙げられる。発現ベクターを医薬として用いる場合、哺乳動物への投与に好適なベクターとしては、アデノウイルス、レトロウイルス、アデノ随伴ウイルス、ヘルペスウイルス、ワクシニアウイルス、ポックスウイルス、ポリオウイルス、シンドビスウイルス、センダイウイルス等のウイルスベクターが挙げられる。   The backbone of the expression vector of the present invention is not particularly limited as long as it can produce a target substance in a predetermined cell, and examples thereof include a plasmid vector and a virus vector. When the expression vector is used as a medicine, suitable vectors for administration to mammals include adenovirus, retrovirus, adeno-associated virus, herpes virus, vaccinia virus, pox virus, poliovirus, Sindbis virus, Sendai virus, etc. A viral vector is mentioned.

宿主細胞として原核生物細胞を用いる場合、原核生物細胞を宿主細胞として利用可能な発現ベクターが用いられ得る。このような発現ベクターは、例えば、プロモーター−オペレーター領域、開始コドン、本発明のポリペプチド又はその部分ペプチドをコードするポリヌクレオチド、終止コドン、ターミネーター領域、複製起点等のエレメントを含み得る。細菌中で本発明のポリペプチドを発現させるためのプロモーター−オペレーター領域は、プロモーター、オペレーター及びShine-Dalgarno (SD) 配列を含むものである。これらのエレメントについては、自体公知のものを用いることができる。   When prokaryotic cells are used as host cells, expression vectors that can use prokaryotic cells as host cells can be used. Such an expression vector may contain elements such as a promoter-operator region, a start codon, a polynucleotide encoding the polypeptide of the present invention or a partial peptide thereof, a stop codon, a terminator region, and an origin of replication. The promoter-operator region for expressing the polypeptide of the present invention in bacteria contains a promoter, an operator and a Shine-Dalgarno (SD) sequence. As these elements, those known per se can be used.

また、宿主細胞として真核生物細胞を用いる場合、真核生物細胞を宿主細胞として利用可能な発現ベクターが用いられ得る。この場合、使用されるプロモーターは、哺乳動物等の真核生物で機能し得るものであれば特に制限されない。ポリペプチドの発現を目的とする場合、このようなプロモーターとしては、例えば、SV40由来初期プロモーター、サイトメガロウイルスLTR、ラウス肉腫ウイルスLTR、MoMuLV由来LTR、アデノウイルス由来初期プロモーター等のウイルスプロモーター、並びにβ−アクチン遺伝子プロモーター、PGK遺伝子プロモーター、トランスフェリン遺伝子プロモーター等の哺乳動物の構成蛋白質遺伝子プロモーターなどが挙げられる。ポリヌクレオチドの発現を目的とする場合、プロモーターは、polIIIプロモーター(例、tRNAプロモーター、U6プロモーター、H1プロモーター)であり得る。   When eukaryotic cells are used as host cells, expression vectors that can use eukaryotic cells as host cells can be used. In this case, the promoter used is not particularly limited as long as it can function in eukaryotes such as mammals. For the purpose of polypeptide expression, such promoters include, for example, SV40-derived early promoter, cytomegalovirus LTR, Rous sarcoma virus LTR, MoMuLV-derived LTR, adenovirus-derived early promoter and the like, and β -Mammal constituent protein gene promoters such as actin gene promoter, PGK gene promoter, transferrin gene promoter and the like. When the expression of the polynucleotide is intended, the promoter can be a polIII promoter (eg, tRNA promoter, U6 promoter, H1 promoter).

本発明の発現ベクターはさらに、転写開始及び転写終結のための部位、及び転写領域において翻訳に必要とされ得るリボソーム結合部位、複製起点並びに選択マーカー遺伝子(例、アンピシリン、テトラサイクリン、カナマイシン、スペクチノマイシン、エリスロマイシン、クロラムフェニコール)などを含み得る。本発明の発現ベクターは、自体公知の方法により作製できる(例、Molecular Cloning, 2nd edition, Sambrook et al., Cold Spring Harbor Lab. Press (1989)参照)。The expression vectors of the present invention further comprise sites for transcription initiation and termination, and ribosome binding sites, replication origins and selectable marker genes (eg, ampicillin, tetracycline, kanamycin, spectinomycin that may be required for translation in the transcription region). Erythromycin, chloramphenicol) and the like. Expression vectors of the present invention can be prepared by a method known per se (e.g., Molecular Cloning, 2 nd edition, Sambrook et al., See Cold Spring Harbor Lab. Press (1989 )).

3.組成物
本発明は、上述の物質を含む組成物を提供する。
3. Composition The present invention provides a composition comprising the aforementioned substances.

本発明の組成物は、上述の物質に加え、任意の担体、例えば医薬上許容され得る担体を含むことができる。医薬上許容され得る担体としては、例えば、ショ糖、デンプン、マンニット、ソルビット、乳糖、グルコース、セルロース、タルク、リン酸カルシウム、炭酸カルシウム等の賦形剤、セルロース、メチルセルロース、ヒドロキシプロピルセルロース、ポリプロピルピロリドン、ゼラチン、アラビアゴム、ポリエチレングリコール、ショ糖、デンプン等の結合剤、デンプン、カルボキシメチルセルロース、ヒドロキシプロピルスターチ、ナトリウム−グリコール−スターチ、炭酸水素ナトリウム、リン酸カルシウム、クエン酸カルシウム等の崩壊剤、ステアリン酸マグネシウム、エアロジル、タルク、ラウリル硫酸ナトリウム等の滑剤、クエン酸、メントール、グリシルリシン・アンモニウム塩、グリシン、オレンジ粉等の芳香剤、安息香酸ナトリウム、亜硫酸水素ナトリウム、メチルパラベン、プロピルパラベン等の保存剤、クエン酸、クエン酸ナトリウム、酢酸等の安定剤、メチルセルロース、ポリビニルピロリドン、ステアリン酸アルミニウム等の懸濁剤、界面活性剤等の分散剤、水、生理食塩水、オレンジジュース等の希釈剤、カカオ脂、ポリエチレングリコール、白灯油等のベースワックスなどが挙げられるが、それらに限定されるものではない。   The compositions of the present invention can include any carrier, such as a pharmaceutically acceptable carrier, in addition to the materials described above. Examples of pharmaceutically acceptable carriers include sucrose, starch, mannitol, sorbit, lactose, glucose, cellulose, talc, calcium phosphate, calcium carbonate, and other excipients, cellulose, methylcellulose, hydroxypropylcellulose, polypropylpyrrolidone. , Gelatin, gum arabic, polyethylene glycol, sucrose, starch and other binders, starch, carboxymethylcellulose, hydroxypropyl starch, sodium-glycol starch, sodium bicarbonate, calcium phosphate, calcium citrate and other disintegrants, magnesium stearate , Aerosil, Talc, Sodium lauryl sulfate lubricant, Citric acid, Menthol, Glycyllysine / Ammonium salt, Glycine, Orange powder, Fragrance, Sodium benzoate Preservatives such as lithium, sodium hydrogen sulfite, methyl paraben, propyl paraben, stabilizers such as citric acid, sodium citrate, acetic acid, suspension agents such as methyl cellulose, polyvinyl pyrrolidone, aluminum stearate, dispersants such as surfactants, Examples include, but are not limited to, water, physiological saline, diluents such as orange juice, base waxes such as cacao butter, polyethylene glycol, and white kerosene.

経口投与に好適な製剤は、水、生理食塩水、オレンジジュースのような希釈液に有効量の物質を溶解させた液剤、有効量の物質を固体や顆粒として含んでいるカプセル剤、サッシェ剤又は錠剤、適当な分散媒中に有効量の物質を懸濁させた懸濁液剤、有効量の物質を溶解させた溶液を適当な分散媒中に分散させ乳化させた乳剤等である。   Preparations suitable for oral administration include a solution in which an effective amount of a substance is dissolved in a diluent such as water, physiological saline, orange juice, a capsule containing an effective amount of the substance as a solid or granule, a sachet or Examples thereof include tablets, suspensions in which an effective amount of a substance is suspended in an appropriate dispersion medium, and emulsions in which a solution in which an effective amount of a substance is dissolved is dispersed in an appropriate dispersion medium and emulsified.

非経口的な投与(例えば、静脈内注射、皮下注射、筋肉注射、局所注入、腹腔内投与など)に好適な製剤としては、水性及び非水性の等張な無菌の注射液剤があり、これには抗酸化剤、緩衝液、制菌剤、等張化剤等が含まれていてもよい。また、水性及び非水性の無菌の懸濁液剤が挙げられ、これには懸濁剤、可溶化剤、増粘剤、安定化剤、防腐剤等が含まれていてもよい。当該製剤は、アンプルやバイアルのように単位投与量あるいは複数回投与量ずつ容器に封入することができる。また、有効成分及び医薬上許容され得る担体を凍結乾燥し、使用直前に適当な無菌のビヒクルに溶解又は懸濁すればよい状態で保存することもできる。   Formulations suitable for parenteral administration (eg, intravenous injection, subcutaneous injection, intramuscular injection, local injection, intraperitoneal administration, etc.) include aqueous and non-aqueous isotonic sterile injection solutions. May contain antioxidants, buffers, antibacterial agents, isotonic agents and the like. Also, aqueous and non-aqueous sterile suspensions can be mentioned, which may contain suspending agents, solubilizers, thickeners, stabilizers, preservatives and the like. The preparation can be enclosed in a container in unit doses or multiple doses like ampoules and vials. In addition, the active ingredient and a pharmaceutically acceptable carrier can be lyophilized and stored in a state that may be dissolved or suspended in a suitable sterile vehicle immediately before use.

本発明の組成物の投与量は、有効成分の活性や種類、病気の重篤度、投与対象となる動物種、投与対象の薬物受容性、体重、年齢等によって異なり一概に云えないが、通常、成人1日あたり有効成分量として約0.001〜約500mg/kgである。   The dose of the composition of the present invention varies depending on the activity and type of the active ingredient, the severity of the disease, the animal species to be administered, the drug acceptability of the administration target, body weight, age, etc. The amount of active ingredient per day for an adult is about 0.001 to about 500 mg / kg.

本発明の組成物は、本発明のポリペプチドの発現又は機能の調節(例、促進又は抑制)を可能とする。本発明の組成物は、例えば、医薬(例、上述したような疾患の予防又は治療薬)、試薬又は食品として有用であり得る。   The composition of the present invention enables the regulation (eg, promotion or suppression) of the expression or function of the polypeptide of the present invention. The composition of the present invention can be useful, for example, as a medicine (eg, a prophylactic or therapeutic drug for the diseases as described above), a reagent, or a food.

4.細胞
本発明は、本発明のポリペプチド又は本発明の部分ペプチドを産生する形質転換体、本発明の抗体の産生細胞、及び本発明のポリヌクレオチド又はポリペプチドの発現又は機能が調節された細胞を提供する。
4). Cell The present invention comprises a transformant producing the polypeptide of the present invention or the partial peptide of the present invention, a cell producing the antibody of the present invention, and a cell in which the expression or function of the polynucleotide or polypeptide of the present invention is regulated. provide.

4.1.形質転換体
本発明の形質転換体は、本発明のポリペプチド又は本発明の部分ペプチドを発現する、本発明の発現ベクターで形質転換された細胞であり得る。形質転換体の作製に用いられる宿主細胞としては、発現ベクターに適合し、目的のポリヌクレオチド又はポリペプチド等を発現し得るものであれば特に限定されず、例えば、初代培養細胞又は細胞株が挙げられる。詳細には、このような宿主細胞としては、例えば、大腸菌、バチルス属菌(例、枯草菌)、放線菌等の原核生物細胞、並びに酵母、昆虫細胞、鳥類細胞、哺乳動物細胞(例、上述の哺乳動物に由来する細胞:例、CHO細胞)等の真核生物細胞が挙げられる。本発明の形質転換体は、自体公知の方法により作製できる(例、Molecular Cloning, 2nd edition, Sambrook et al., Cold Spring Harbor Lab. Press (1989)参照)。
4.1. Transformant The transformant of the present invention may be a cell transformed with the expression vector of the present invention, which expresses the polypeptide of the present invention or the partial peptide of the present invention. The host cell used for the production of the transformant is not particularly limited as long as it is compatible with the expression vector and can express the target polynucleotide or polypeptide, and examples thereof include primary cultured cells or cell lines. It is done. Specifically, examples of such host cells include prokaryotic cells such as Escherichia coli, Bacillus (eg, Bacillus subtilis), actinomycetes, yeast, insect cells, avian cells, and mammalian cells (eg, the above-described examples). Eukaryotic cells such as cells derived from mammals: eg, CHO cells). The transformant of the present invention can be prepared by a method known per se (e.g., Molecular Cloning, 2 nd edition, Sambrook et al., See Cold Spring Harbor Lab. Press (1989 )).

形質転換体の培養は、自体公知の方法により液体培地等の栄養培地中で行われ得る。培地は、形質転換体の生育に必要な炭素源、窒素源、無機物などを含有することが好ましい。ここで、炭素源としては、例えば、グルコース、デキストリン、可溶性澱粉、ショ糖などが挙げられ、窒素源としては、例えば、アンモニウム塩類、硝酸塩類、コーンスチープ・リカー、ペプトン、カゼイン、肉エキス、大豆粕、バレイショ抽出液などの無機又は有機物質が挙げられ、無機物としては、例えば、塩化カルシウム、リン酸二水素ナトリウム、塩化マグネシウムなどがそれぞれ挙げられる。また、培地には、酵母エキス、ビタミン類などを添加してもよい。培養条件、例えば温度、培地のpH及び培養時間は、本発明のポリペプチドが大量に生産されるように適宜選択される。培養温度は、例えば30〜37℃である。   The transformant can be cultured in a nutrient medium such as a liquid medium by a method known per se. The medium preferably contains a carbon source, a nitrogen source, an inorganic substance and the like necessary for the growth of the transformant. Here, examples of the carbon source include glucose, dextrin, soluble starch, and sucrose, and examples of the nitrogen source include ammonium salts, nitrates, corn steep liquor, peptone, casein, meat extract, large extract, and the like. Examples include inorganic or organic substances such as bean paste and potato extract, and examples of inorganic substances include calcium chloride, sodium dihydrogen phosphate, and magnesium chloride. Moreover, you may add a yeast extract, vitamins, etc. to a culture medium. Culture conditions such as temperature, medium pH and culture time are appropriately selected so that the polypeptide of the present invention is produced in large quantities. The culture temperature is, for example, 30 to 37 ° C.

4.2.抗体産生細胞
本発明の抗体の産生細胞は、本発明の抗体を産生する任意の細胞であり得る。本発明の抗体産生細胞としては、上述のハイブリドーマ、及び上述の抗体の発現ベクターが導入された形質転換細胞が挙げられる。本発明の抗体産生細胞が形質転換細胞である場合、形質転換細胞の作製に用いられる発現ベクター及び宿主細胞、並びに細胞培養等の詳細は、上述と同様であり得る。
4.2. Antibody-Producing Cell The antibody-producing cell of the present invention can be any cell that produces the antibody of the present invention. Examples of the antibody-producing cell of the present invention include the above-described hybridoma and a transformed cell into which the above-described antibody expression vector has been introduced. When the antibody-producing cell of the present invention is a transformed cell, details of the expression vector and host cell used for the production of the transformed cell, cell culture, and the like can be the same as described above.

4.3.本発明のポリペプチドの発現又は機能が調節された細胞
本発明は、本発明のポリペプチドの発現又は機能が調節された細胞を提供する。
4.3. Polypeptide expression or function regulated cellular invention of the present invention, the expression or function of the polypeptides of the present invention is to provide a regulated cellular.

本発明の細胞は、単離及び/又は精製されたものであり得る。本発明の細胞は、上述の組織に由来する細胞、又は上述の種類の細胞であり得る。本発明の細胞は、上述の哺乳動物に由来し得る。本発明の細胞は、初代培養細胞又は細胞株、あるいは正常細胞、又は上述の疾患を有する哺乳動物に由来する細胞であり得る。本発明の細胞は、本発明のポリペプチドの発現又は機能が特異的に調節された細胞であり得る。本発明の細胞は、本発明のポリペプチドの発現又は機能の調節(例、促進、抑制)により、血球系又は破骨細胞に関連する作用、あるいは血球系又は破骨細胞に関連する表現型が変化し得る。本発明の細胞は、本発明のポリペプチドの発現が一過的に調節された細胞、又は当該発現が恒常的に調節された細胞(例、ホモ接合性又はヘテロ接合性欠損細胞)であり得る。本発明の細胞はまた、形質転換体又は非形質転換体であり得る。   The cells of the present invention can be isolated and / or purified. The cell of the present invention may be a cell derived from the above-mentioned tissue or the above-mentioned type of cell. The cells of the present invention can be derived from the mammals described above. The cell of the present invention may be a primary cultured cell or cell line, or a normal cell, or a cell derived from a mammal having the above-mentioned diseases. The cell of the present invention may be a cell in which the expression or function of the polypeptide of the present invention is specifically regulated. The cell of the present invention has an action related to blood cell line or osteoclast, or a phenotype related to blood cell line or osteoclast by regulating (eg, promoting or suppressing) the expression or function of the polypeptide of the present invention. Can change. The cell of the present invention can be a cell in which the expression of the polypeptide of the present invention is transiently regulated, or a cell in which the expression is constitutively regulated (eg, homozygous or heterozygous defective cells). . The cells of the invention can also be transformants or non-transformants.

本発明の細胞は、例えば、本発明のポリヌクレオチド又は本発明のポリペプチドの発現又は機能を調節し得る上述の物質(例、本発明のポリペプチド、アンチセンス分子、RNAi誘導性核酸、抗体、又はこれらの発現ベクター)で細胞を処理することにより作製できる。本発明の細胞はまた、後述の遺伝子導入動物又は遺伝子欠損(いわゆるノックアウト)動物から細胞を単離及び/又は精製することにより作製できる。   The cell of the present invention may contain, for example, the above-mentioned substances that can regulate the expression or function of the polynucleotide of the present invention or the polypeptide of the present invention (eg, the polypeptide of the present invention, antisense molecule, RNAi-inducible nucleic acid, antibody, Alternatively, it can be prepared by treating cells with these expression vectors. The cell of the present invention can also be produced by isolating and / or purifying a cell from a transgenic animal or a gene-deficient (so-called knockout) animal described below.

本発明のポリペプチドの発現又は機能が調節された細胞は、例えば、医薬(例、上述したような疾患の予防又は治療薬)、試薬又は食品の開発、血球系に特異的あるいは破骨細胞分化に特異的なさらなるマーカー遺伝子の同定、及び血球系又は破骨細胞の分化に関連する機構の解析に有用であり得る。これらは、例えば、マイクロアレイ、プロテインチップ(例、抗体チップ、又はサイファージェン社製チップ等の非抗体チップ)等を用いて本発明の細胞における発現プロファイルを測定し、対照細胞の発現プロファイルと比較することを含む、発現プロファイル解析により行われ得る。本発明の細胞はまた、上述したような疾患のモデル細胞として有用であり得る。   Cells in which the expression or function of the polypeptide of the present invention is regulated include, for example, development of drugs (eg, preventive or therapeutic agents for the diseases described above), reagents or foods, blood cell specific or osteoclast differentiation It may be useful for the identification of additional marker genes specific for, and for the analysis of mechanisms associated with blood cell lineage or osteoclast differentiation. For example, the expression profile in the cell of the present invention is measured using, for example, a microarray, a protein chip (eg, an antibody chip or a non-antibody chip such as a chip manufactured by Cyphergen), and compared with the expression profile of a control cell. Can be performed by expression profile analysis. The cells of the present invention may also be useful as model cells for the diseases described above.

5.動物
本発明は、本発明のポリペプチドの発現又は機能が調節された動物を提供する。
5). Animals The present invention provides animals in which the expression or function of the polypeptide of the present invention is regulated.

本発明の動物は、ゲノムの改変を伴う、又は伴わない動物であり得る。本発明の動物の種は、例えば、上述の非ヒト哺乳動物と同様であり得る。   The animals of the present invention can be animals with or without genomic alterations. The animal species of the present invention can be, for example, similar to the non-human mammal described above.

一実施形態では、本発明の動物は、ゲノムの改変を伴う遺伝子導入動物であり得る。本発明の遺伝子導入動物は、本発明のポリペプチドを発現し得る。本発明の遺伝子導入動物はまた、本発明のポリペプチドを上述の細胞又は組織特異的に発現し得る。   In one embodiment, the animal of the present invention may be a transgenic animal with genomic modification. The transgenic animal of the present invention can express the polypeptide of the present invention. The transgenic animal of the present invention can also express the polypeptide of the present invention in the aforementioned cell or tissue-specific manner.

本発明の遺伝子導入動物は、自体公知の方法により作製できる。より詳細には、本発明の遺伝子導入動物は、例えば、発生の初期段階において、動物の受精卵又はその他の細胞(例、未受精卵、精子又はそれらの前駆細胞)に、所定のプロモーター(例、上述の細胞又は組織に非特異的又は特異的なプロモーター)に機能可能に連結された本発明のポリヌクレオチド(例、本発明の発現ベクターの形態でもよい)を導入することにより作製できる。遺伝子の導入法としては、例えば、エレクトロポレーション法、リポフェクション法、凝集法、リン酸カルシウム共沈殿法、マイクロインジェクション法が挙げられる。本発明の遺伝子導入動物はまた、このように作製された動物と同種の他の動物(例、上述したような疾患のモデル動物)との交配により作製される動物であってもよい。   The transgenic animal of the present invention can be prepared by a method known per se. More specifically, the transgenic animal of the present invention can be applied to a predetermined promoter (eg, an unfertilized egg, sperm or a progenitor cell thereof), for example, at an early stage of development. The polynucleotide of the present invention (eg, may be in the form of the expression vector of the present invention) operably linked to the above-described cell or tissue can be prepared. Examples of gene introduction methods include electroporation, lipofection, aggregation, calcium phosphate coprecipitation, and microinjection. The transgenic animal of the present invention may also be an animal produced by crossing an animal produced in this way with another animal of the same species (eg, a model animal of the disease as described above).

別の実施形態では、本発明の動物は、ゲノムの改変を伴う遺伝子欠損動物であり得る。本発明の遺伝子欠損動物は、本発明のポリペプチドを発現し得ない。本発明の遺伝子欠損動物はまた、本発明のポリペプチドを上述の細胞又は組織特異的に発現し得ない。   In another embodiment, the animal of the present invention may be a gene-deficient animal with genomic modification. The gene-deficient animal of the present invention cannot express the polypeptide of the present invention. The gene-deficient animal of the present invention is also unable to express the polypeptide of the present invention in the aforementioned cell or tissue-specific manner.

本発明の遺伝子欠損動物は、自体公知の方法により作製できる。より詳細には、本発明の遺伝子欠損動物は、血球系・破骨細胞特異的遺伝子を特異的に欠損する胚性幹細胞(ES細胞)を用いて作製され得る。このようなES細胞は、例えば、所定のターゲティングベクターをES細胞に導入し、該ターゲティングベクターが導入されたES細胞から、相同組換えを生じたES細胞を選別することにより作製できる。   The gene-deficient animal of the present invention can be prepared by a method known per se. More specifically, the gene-deficient animal of the present invention can be prepared using embryonic stem cells (ES cells) that specifically lack a blood cell line / osteoclast-specific gene. Such an ES cell can be prepared, for example, by introducing a predetermined targeting vector into an ES cell and selecting an ES cell that has undergone homologous recombination from the ES cell into which the targeting vector has been introduced.

ターゲティングベクターとしては、本発明のポリヌクレオチド又はポリペプチドの特異的な発現不全を引き起こすような相同組換えを誘導し得るターゲティングベクターが用いられ得る。このようなターゲティングベクターは、血球系・破骨細胞特異的遺伝子に相同又は特異的に相同な第一のポリヌクレオチド及び第二のポリヌクレオチド(該ポリヌクレオチドのうち少なくとも一方は、血球系・破骨細胞特異的遺伝子のスプライシングドナーシグナルを含み、かつ該シグナルにおいて、少なくとも1つのアイソフォームを生じるスプライシングを不能とするような変異を含む)、並びに必要に応じて選択マーカーを含む。血球系・破骨細胞特異的遺伝子のスプライシングドナーシグナル、及び該シグナルにおける少なくとも1つのアイソフォームを生じるスプライシングを不能とするような変異は、当業者であれば、容易に決定することができる。第一及び第二のポリヌクレオチドは、血球系・破骨細胞特異的遺伝子に関連するゲノムDNAに対して、相同組換えを生じるのに十分な程度の配列同一性及び長さを有するポリヌクレオチドである。第一及び第二のポリヌクレオチドは、特定のアイソフォームの特異的な欠損がもたらされるように選択される。選択マーカーとしては、ポジティブ選択マーカー(例、ネオマイシン耐性遺伝子、ハイグロマイシンBホスホトランスフェラーゼ(BPH)遺伝子、ブラスティシジンSデアミナーゼ遺伝子、ピューロマイシン耐性遺伝子)、ネガティブ選択マーカー(例、単純ヘルペスウイルス(HSV)のチミジンキナーゼ(tk)遺伝子、ジフテリア毒素Aフラグメント(DTA)遺伝子)などが挙げられる。ターゲティングベクターは、ポジティブ選択マーカー、ネガティブ選択マーカーのいずれか一方、又は両方を含むことができる。ターゲティングベクターはまた、2以上のリコンビナーゼ標的配列(例、バクテリオファージP1由来のCre/loxPシステムで用いられるloxP配列、酵母由来のFLP/FRTシステムで用いられるFRT配列)を含んでいてもよい。本発明はまた、このようなターゲティングベクターを提供する。   As the targeting vector, a targeting vector capable of inducing homologous recombination that causes specific expression failure of the polynucleotide or polypeptide of the present invention can be used. Such a targeting vector includes a first polynucleotide and a second polynucleotide that are homologous or specifically homologous to a blood cell / osteoclast-specific gene (at least one of the polynucleotides is a blood cell / osteoclast). A splicing donor signal for a cell-specific gene, and including a mutation in the signal that disables splicing to produce at least one isoform), and optionally a selectable marker. A person skilled in the art can easily determine a splicing donor signal of a blood cell / osteoclast specific gene and a mutation that disables splicing to generate at least one isoform in the signal. The first and second polynucleotides are polynucleotides having sufficient sequence identity and length to cause homologous recombination with genomic DNA related to blood cell / osteoclast specific genes. is there. The first and second polynucleotides are selected so as to result in a specific deletion of a particular isoform. Selection markers include positive selection markers (eg, neomycin resistance gene, hygromycin B phosphotransferase (BPH) gene, blasticidin S deaminase gene, puromycin resistance gene), negative selection markers (eg, herpes simplex virus (HSV)). Thymidine kinase (tk) gene, diphtheria toxin A fragment (DTA) gene) and the like. The targeting vector can include either a positive selection marker, a negative selection marker, or both. The targeting vector may also include two or more recombinase target sequences (eg, loxP sequences used in Cre / loxP systems from bacteriophage P1, FRT sequences used in yeast-derived FLP / FRT systems). The present invention also provides such a targeting vector.

ターゲティングベクターをES細胞に導入する方法としては、自体公知の方法が用いられ得る。このような方法としては、例えば、リン酸カルシウム法、リポフェクション法/リポソーム法、エレクトロポレーション法などが挙げられる。ターゲティングベクターが細胞中に導入されると、当該細胞中で血球系・破骨細胞特異的遺伝子に関連するゲノムDNAの相同組換えが生じる。ES細胞は、任意の動物の胚盤胞から分離した内部細胞塊をフィーダー細胞上で培養することにより樹立してもよいが、既存のES細胞を利用してもよい。   As a method for introducing the targeting vector into ES cells, a method known per se can be used. Examples of such a method include a calcium phosphate method, a lipofection method / liposome method, and an electroporation method. When the targeting vector is introduced into a cell, homologous recombination of genomic DNA related to a blood cell / osteoclast specific gene occurs in the cell. ES cells may be established by culturing inner cell mass separated from blastocysts of any animal on feeder cells, but existing ES cells may be used.

相同組換えが生じたES細胞を選別するため、ターゲティングベクター導入後の細胞がスクリーニングされる。例えば、ポジティブ選別、ネガティブ選別等により選別を行った後に、遺伝子型に基づくスクリーニング(例えば、PCR法、サザンブロットハイブリダイゼーション法)を行う。また、得られたES細胞の核型分析をさらに行うことも好ましい。核型分析では、選別されたES細胞において染色体異常がないことが確認される。核型分析は、自体公知の方法により行うことができる。なお、ES細胞の核型は、ターゲティングベクターの導入前に予め確認しておくことが好ましい。   In order to select ES cells in which homologous recombination has occurred, cells after introduction of the targeting vector are screened. For example, after selection by positive selection, negative selection, etc., screening based on genotype (for example, PCR method, Southern blot hybridization method) is performed. It is also preferable to further perform karyotype analysis of the obtained ES cells. Karyotype analysis confirms that there are no chromosomal abnormalities in the sorted ES cells. Karyotype analysis can be performed by a method known per se. The karyotype of the ES cell is preferably confirmed in advance before introducing the targeting vector.

本発明の遺伝子欠損動物は、上記のように得られたES細胞を胚に導入することにより得られたキメラ胚を動物に移植し、次いで、得られたキメラ動物を交配させることにより作製できる。胚としては、例えば胚盤胞、8細胞期胚などが挙げられる。胚はホルモン剤(例えばFSH様作用を有するPMSG及びLH作用を有するhCGを使用)等により過排卵処理を施した雌動物を、雄動物と交配させること等により得ることができる。ES細胞を胚に導入する方法としては、マイクロマニピュレーション法、凝集法などが挙げられる。   The gene-deficient animal of the present invention can be prepared by transplanting a chimeric embryo obtained by introducing the ES cells obtained as described above into an embryo, and then mating the obtained chimeric animal. Examples of embryos include blastocysts and 8-cell stage embryos. Embryos can be obtained by mating female animals that have undergone superovulation treatment with hormone agents (for example, using PMSG having FSH-like action and hCG having LH action) and the like. Examples of methods for introducing ES cells into the embryo include micromanipulation methods and aggregation methods.

キメラ胚が移植される動物は好ましくは偽妊娠動物である。偽妊娠動物は、正常性周期の雌動物を、精管結紮等により去勢した雄動物と交配することにより得ることができる。キメラ胚が導入された動物は、妊娠し、キメラ動物を出産する。次いで、出生した動物がキメラ動物か否かが確認される。出生した動物がキメラ動物であるか否かは自体公知の方法により確認でき、例えば、体色や被毛色で判別できる。また、判別のために、体の一部からDNAを抽出し、サザンブロット解析やPCRアッセイを行ってもよい。交配は好ましくは、野生型動物とキメラ動物との間で、又はキメラ動物同士で行われ得る。血球系・破骨細胞特異的遺伝子の欠損が、キメラ動物の生殖系列細胞へ導入され、血球系・破骨細胞特異的遺伝子を欠損するヘテロ接合体子孫が得られたか否かは、自体公知の方法により種々の形質を指標として確認でき、例えば、子孫動物の体色や被毛色により判別できる。また、判別のために、体の一部からDNAを抽出し、サザンブロット解析やPCRアッセイを行ってもよい。さらに、このようにして得られたヘテロ接合体同士を交配させることにより、ホモ接合体を作製できる。本発明の遺伝子欠損動物はまた、このように作製された動物と同種の他の動物(例、血球系又は破骨細胞の障害に基づく疾患のモデル動物、遺伝子改変動物)との交配により作製される動物であってもよい。   The animal into which the chimeric embryo is transferred is preferably a pseudopregnant animal. A pseudopregnant animal can be obtained by mating a female animal having a normal cycle with a male animal castrated by vagina ligation or the like. The animal into which the chimeric embryo has been introduced becomes pregnant and gives birth to the chimeric animal. Next, it is confirmed whether the born animal is a chimeric animal. Whether or not the animal born is a chimeric animal can be confirmed by a method known per se, for example, by body color or coat color. For discrimination, DNA may be extracted from a part of the body, and Southern blot analysis or PCR assay may be performed. The mating can preferably take place between wild-type animals and chimeric animals or between chimeric animals. It is known per se whether or not a deficiency of a blood cell / osteoclast-specific gene was introduced into a germ line cell of a chimeric animal to obtain a heterozygous offspring that lacks the blood cell / osteoclast-specific gene. Depending on the method, various traits can be confirmed as indicators, and for example, it can be discriminated by the body color or coat color of the offspring animals. For discrimination, DNA may be extracted from a part of the body, and Southern blot analysis or PCR assay may be performed. Furthermore, a homozygote can be produced by crossing the heterozygotes thus obtained. The gene-deficient animal of the present invention is also produced by mating an animal produced in this way with another animal of the same species (eg, a model animal of a disease based on a disorder of blood cell line or osteoclast, a genetically modified animal). May be an animal.

さらに別の実施形態では、本発明の動物は、ゲノムの改変を伴わない動物であり得る。このような動物は、本発明のポリヌクレオチド又は本発明のポリペプチドの発現又は機能を調節し得る上述の物質(例、本発明のポリペプチド、アンチセンス分子、RNAi誘導性核酸、抗体、又はこれらの発現ベクター)で動物を処置することにより作製できる。このような動物はまた、局所的な処置により、本発明のポリペプチドを上述の組織特異的に発現し得る動物又は発現し得ない動物であり得る。動物の処置は、本発明の組成物で言及したような方法を用いて行われ得る。   In yet another embodiment, the animal of the present invention may be an animal without genomic modification. Such an animal is a substance as described above that can regulate the expression or function of the polynucleotide of the present invention or the polypeptide of the present invention (eg, the polypeptide of the present invention, antisense molecule, RNAi-inducible nucleic acid, antibody, or these). Of the expression vector). Such animals can also be animals that can or cannot express the above-described tissue-specific polypeptides of the invention by topical treatment. Animal treatment may be performed using methods such as those mentioned in the compositions of the present invention.

本発明の動物は、例えば、医薬(例、上述したような疾患の予防又は治療薬)、試薬又は食品の開発、血球系に特異的あるいは破骨細胞分化に特異的なさらなるマーカー遺伝子の同定、及び血球系又は破骨細胞の分化に関連する機構の解析に有用であり得る。これらは、例えば、マイクロアレイ、プロテインチップ(例、抗体チップ、又はサイファージェン社製チップ等の非抗体チップ)等を用いて本発明の動物における発現プロファイル(特に血球系又は破骨細胞あるいは造血・リンパ組織の発現プロファイル)を測定し、対照動物の発現プロファイルと比較することを含む、発現プロファイル解析により行われ得る。本発明の動物はまた、上述したような疾患のモデル動物として有用であり得る。   The animal of the present invention can be used, for example, for the development of drugs (eg, preventive or therapeutic agents for diseases as described above), reagents or foods, identification of additional marker genes specific for the blood cell system or osteoclast differentiation, And may be useful in the analysis of mechanisms involved in the differentiation of blood cells or osteoclasts. These include, for example, expression profiles (particularly blood cells or osteoclasts or hematopoietic / lymphoid cells) in animals of the present invention using microarrays, protein chips (eg, antibody chips or non-antibody chips such as Cyphergen's chips), etc. Tissue expression profile) can be measured and compared with the expression profile of a control animal. The animal of the present invention may also be useful as a model animal for the diseases as described above.

6.測定用手段及び測定方法
本発明は、標的ポリヌクレオチド及びポリペプチドの測定用手段(例、プライマーセット、核酸プローブ、抗体、アプタマー)及び測定方法を提供する。
6). Means for Measurement and Measuring Method The present invention provides means for measuring target polynucleotides and polypeptides (eg, primer sets, nucleic acid probes, antibodies, aptamers) and measuring methods.

6.1.プライマーセット及びその使用方法
本発明のプライマーセットは、本発明のポリヌクレオチド又は既知ポリヌクレオチドの特異的な検出及び定量、あるいは本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方の包括的な検出及び定量に使用できる。例えば、このような検出及び定量は、生体試料からの総RNAの調製後、PCR(例、RT−PCR、リアルタイムPCR、定量的PCR)、LAMP(Loop-mediated isothermal amplification)(例、WO00/28082参照)、ICAN(Isothermal and Chimeric primer-initiated Amplification of Nucleic acids)(例、WO00/56877参照)等の遺伝子増幅法を利用して行うことができる。遺伝子増
幅法の種類に応じて必要とされるプライマー数が異なるため、プライマー数は特に限定されないが、例えば、本発明のプライマーセットは、センス及びアンチセンスプライマーから構成される2以上のプライマーを含み得る。2以上のプライマーは、予め混合されていても、混合されていなくてもよい。センス及びアンチセンスプライマーはそれぞれ、標的領域を特異的に増幅し得るようなサイズである限り特に限定されないが、12個(例えば少なくとも約15個、好ましくは少なくとも約18個、より好ましくは少なくとも約20個など)の連続するヌクレオチド残基からなる。センス及びアンチセンスプライマーは、それらにより増幅されるポリヌクレオチドのサイズが視認的に検出される場合には、視認的に検出可能であるように設計され得る。視認的に検出可能なサイズは、特に限定されないが、例えば少なくとも約50個、好ましくは少なくとも70個、より好ましくは少なくとも約100個、さらにより好ましくは少なくとも約150個、最も好ましくは少なくとも約200個、約300個、約400個、約500個又はそれ以上のヌクレオチド残基長であり得る。センス及びアンチセンスプライマーはまた、それらにより増幅されるポリヌクレオチドが視認的に検出される必要はなく、リアルタイムPCRにおいて汎用されるように、蛍光シグナル等により検出されてもよい。
6.1. Primer set and method of use thereof The primer set of the present invention is used for specific detection and quantification of the polynucleotide of the present invention or known polynucleotide, or for comprehensive detection and quantification of both the polynucleotide of the present invention and known polynucleotide. Can be used. For example, such detection and quantification can be performed by preparing total RNA from a biological sample, followed by PCR (eg, RT-PCR, real-time PCR, quantitative PCR), LAMP (Loop-mediated isothermal amplification) (eg, WO00 / 28082). And a gene amplification method such as ICAN (Isothermal and Chimeric primer-initiated Amplification of Nucleic acids) (eg, see WO00 / 56877). Since the number of primers required differs depending on the type of gene amplification method, the number of primers is not particularly limited. For example, the primer set of the present invention includes two or more primers composed of sense and antisense primers. obtain. Two or more primers may be mixed in advance or may not be mixed. Each of the sense and antisense primers is not particularly limited as long as it has a size capable of specifically amplifying the target region, but 12 (eg, at least about 15, preferably at least about 18, more preferably at least about 20). Etc.) of consecutive nucleotide residues. Sense and antisense primers can be designed to be visually detectable if the size of the polynucleotide amplified by them is visually detected. The visually detectable size is not particularly limited, but for example, at least about 50, preferably at least 70, more preferably at least about 100, even more preferably at least about 150, and most preferably at least about 200. , About 300, about 400, about 500 or more nucleotide residues in length. The sense and antisense primers do not need to be visually detected by the polynucleotide amplified by them, and may be detected by a fluorescent signal or the like as commonly used in real-time PCR.

本発明のプライマーセットは、a)本発明のポリヌクレオチドを既知ポリヌクレオチドから識別可能である、本発明のポリヌクレオチドに特異的なプライマーセット(必要に応じて「特異的なプライマーセットA」と省略)、b)既知ポリヌクレオチドを本発明のポリヌクレオチドから識別可能である、既知ポリヌクレオチドに特異的なプライマーセット(必要に応じて「特異的なプライマーセットB」と省略)、c)本発明のポリヌクレオチド及び既知ポリヌクレオチドを互いに識別しない、本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方に共通するプライマーセット(必要に応じて「共通プライマーセット」と省略)であり得る。   The primer set of the present invention is a) a primer set specific to the polynucleotide of the present invention that can distinguish the polynucleotide of the present invention from known polynucleotides (abbreviated as “specific primer set A” if necessary). ), B) a primer set specific to the known polynucleotide that can distinguish the known polynucleotide from the polynucleotide of the present invention (abbreviated as “specific primer set B” if necessary), c) of the present invention It may be a primer set common to both the polynucleotide of the present invention and the known polynucleotide that does not distinguish the polynucleotide and the known polynucleotide from each other (abbreviated as “common primer set” if necessary).

本発明の特異的なプライマーセットAは、i)増幅される本発明のポリヌクレオチド又はその部分ヌクレオチドのサイズが、増幅される既知ポリヌクレオチド又はその部分ヌクレオチドのサイズと区別できるように設計されたセンス及びアンチセンスプライマー、あるいはii)本発明のポリヌクレオチド又はその部分ヌクレオチドのみが増幅され、かつ既知ポリヌクレオチドが増幅されないように設計されたセンス及びアンチセンスプライマーを含み得る。   Specific primer set A of the present invention is a sense designed so that i) the size of the amplified polynucleotide of the present invention or a partial nucleotide thereof can be distinguished from the size of the known polynucleotide or the partial nucleotide to be amplified. And ii) only sense and antisense primers designed such that only the polynucleotide of the invention or a partial nucleotide thereof is amplified and no known polynucleotide is amplified.

上記i)のセンス及びアンチセンスプライマーとしては、例えば、a)上記の特異的な部分ヌクレオチドAの核酸配列(特に本発明のポリヌクレオチドの挿入核酸配列)よりも5’に存在する核酸配列に対応するセンスプライマー、及び当該核酸配列よりも3’に存在する核酸配列に相補的な核酸配列に対応するアンチセンスプライマー、あるいはb)上記の特異的な部分ヌクレオチドBの核酸配列(特に既知ポリヌクレオチドの挿入核酸配列)よりも5’に存在する核酸配列に対応するセンスプライマー、及び当該核酸配列よりも3’に存在する核酸配列に相補的な核酸配列に対応するアンチセンスプライマーが好ましい。   Examples of the sense and antisense primers of i) above correspond to, for example, a) a nucleic acid sequence that is present 5 ′ above the specific partial nucleotide A nucleic acid sequence (particularly, the inserted nucleic acid sequence of the polynucleotide of the present invention). A sense primer, and an antisense primer corresponding to a nucleic acid sequence complementary to a nucleic acid sequence present 3 'from the nucleic acid sequence, or b) a nucleic acid sequence of the above-mentioned specific partial nucleotide B (especially of a known polynucleotide) A sense primer corresponding to a nucleic acid sequence present 5 ′ more than the inserted nucleic acid sequence) and an antisense primer corresponding to a nucleic acid sequence complementary to the nucleic acid sequence present 3 ′ to the nucleic acid sequence are preferred.

上記ii)のセンス及びアンチセンスプライマーとしては、例えば、a)上記の特異的な部分ヌクレオチドAの核酸配列(特に本発明のポリヌクレオチドの挿入核酸配列)に対応するセンスプライマー、及び所定のアンチセンスプライマー、b)所定のセンスプライマー、及び上記の特異的な部分ヌクレオチドAの核酸配列(特に本発明のポリヌクレオチドの挿入核酸配列)に対応するセンスプライマー、あるいはc)上記の特異的な部分ヌクレオチドAの核酸配列(特に本発明のポリヌクレオチドの挿入核酸配列)に対応するセンス及びアンチセンスプライマーが好ましい。   Examples of the sense and antisense primers of the above ii) include: a) a sense primer corresponding to the above-mentioned specific partial nucleotide A nucleic acid sequence (in particular, the inserted nucleic acid sequence of the polynucleotide of the present invention), and a predetermined antisense A primer, b) a predetermined sense primer, and a sense primer corresponding to the nucleic acid sequence of the specific partial nucleotide A (particularly, the inserted nucleic acid sequence of the polynucleotide of the present invention), or c) the specific partial nucleotide A of the above Sense and antisense primers corresponding to these nucleic acid sequences (especially the inserted nucleic acid sequence of the polynucleotide of the present invention) are preferred.

本発明の特異的なプライマーセットBは、i)増幅される既知ポリヌクレオチド又はその部分ヌクレオチドのサイズが、増幅される本発明のポリヌクレオチド又はその部分ヌクレオチドのサイズと区別できるように設計されたセンス及びアンチセンスプライマー、あるいはii)既知ポリヌクレオチド又はその部分ヌクレオチドのみが増幅され、かつ本発明のポリヌクレオチドが増幅されないように設計されたセンス及びアンチセンスプライマーを含み得る。   The specific primer set B of the present invention is a sense designed so that i) the size of the amplified known polynucleotide or a partial nucleotide thereof can be distinguished from the size of the amplified polynucleotide of the present invention or a partial nucleotide thereof. And ii) sense and antisense primers designed such that only known polynucleotides or partial nucleotides thereof are amplified and the polynucleotides of the invention are not amplified.

上記i)のセンス及びアンチセンスプライマーとしては、例えば、a)上記の特異的な部分ヌクレオチドBの核酸配列(特に既知ポリヌクレオチドの挿入核酸配列)よりも5’に存在する核酸配列に対応するセンスプライマー、及び当該核酸配列よりも3’に存在する核酸配列に相補的な核酸配列に対応するアンチセンスプライマー、あるいはb)上記の特異的な部分ヌクレオチドAの核酸配列(特に本発明のポリヌクレオチドの挿入核酸配列)よりも5’に存在する核酸配列に対応するセンスプライマー、及び当該核酸配列よりも3’に存在する核酸配列に相補的な核酸配列に対応するアンチセンスプライマーが好ましい。   Examples of the i) sense and antisense primers include: a) a sense corresponding to a nucleic acid sequence present 5 'from the specific partial nucleotide B nucleic acid sequence (particularly, an inserted nucleic acid sequence of a known polynucleotide). A primer and an antisense primer corresponding to a nucleic acid sequence complementary to a nucleic acid sequence present 3 'from the nucleic acid sequence, or b) a nucleic acid sequence of the above-mentioned specific partial nucleotide A (especially of the polynucleotide of the present invention) A sense primer corresponding to a nucleic acid sequence present 5 ′ more than the inserted nucleic acid sequence) and an antisense primer corresponding to a nucleic acid sequence complementary to the nucleic acid sequence present 3 ′ to the nucleic acid sequence are preferred.

上記ii)のセンス及びアンチセンスプライマーとしては、例えば、a)上記の特異的な部分ヌクレオチドBの核酸配列(特に既知ポリヌクレオチドの挿入核酸配列)に対応するセンスプライマー、及び所定のアンチセンスプライマー、b)所定のセンスプライマー、及び上記の特異的な部分ヌクレオチドBの核酸配列(特に既知ポリヌクレオチドの挿入核酸配列)に対応するセンスプライマー、あるいはc)上記の特異的な部分ヌクレオチドBの核酸配列(特に既知ポリヌクレオチドの挿入核酸配列)に対応するセンス及びアンチセンスプライマーが好ましい。   Examples of the sense and antisense primers of ii) include: a) a sense primer corresponding to the nucleic acid sequence of the specific partial nucleotide B (particularly, an inserted nucleic acid sequence of a known polynucleotide), and a predetermined antisense primer, b) a predetermined sense primer and a sense primer corresponding to the nucleic acid sequence of the specific partial nucleotide B (particularly, an inserted nucleic acid sequence of a known polynucleotide), or c) the nucleic acid sequence of the specific partial nucleotide B ( In particular, sense and antisense primers corresponding to known polynucleotide insert nucleic acid sequences) are preferred.

本発明の共通プライマーセットは、増幅される既知ポリヌクレオチド又はその部分ヌクレオチドのサイズが、増幅される本発明のポリヌクレオチド又はその部分ヌクレオチドのサイズと同一であるように設計されたセンス及びアンチセンスプライマーを含み得る。このようなセンス及びアンチセンスプライマーとしては、例えば、増幅される本発明のポリヌクレオチド又はその部分ヌクレオチド、及び増幅される既知ポリヌクレオチド又はその部分ヌクレオチドが、上記の特異的な部分ヌクレオチドA及びBの核酸配列を含まないように設計されたセンス及びアンチセンスプライマーが好ましい。   The common primer set of the present invention is a sense and antisense primer designed so that the size of the amplified known polynucleotide or a partial nucleotide thereof is the same as the size of the amplified polynucleotide of the present invention or a partial nucleotide thereof. Can be included. As such sense and antisense primers, for example, the polynucleotide of the present invention to be amplified or its partial nucleotide, and the known polynucleotide to be amplified or its partial nucleotide are those of the above-mentioned specific partial nucleotides A and B. Sense and antisense primers designed to contain no nucleic acid sequences are preferred.

6.2.核酸プローブ及びその使用方法
本発明の核酸プローブは、本発明のポリヌクレオチド又は既知ポリヌクレオチドの特異的な検出及び定量、あるいは本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方の包括的な検出及び定量に使用できる。例えば、このような検出及び定量は、生体試料からの総RNAの調製後、ノザンブロッティング、本発明の核酸プローブが固定化された核酸アレイなどを利用して行うことができる。核酸プローブはDNA、RNA、修飾核酸又はそれらのキメラ分子などであり得るが、安定性、簡便性等を考慮するとDNAが好ましい。核酸プローブはまた、1本鎖又は2本鎖ポリヌクレオチドのいずれでもよい。核酸プローブのサイズは、標的遺伝子の転写産物に特異的にハイブリダイズし得る限り特に限定されないが、例えば少なくとも約15個又は16個、好ましくは約15個〜約1000個、より好ましくは約20個〜約500個、さらにより好ましくは約25個〜約300個である。本発明の核酸プローブが1本鎖ポリヌクレオチドである場合、本発明の核酸プローブは本発明のアンチセンス分子と同様であり得る。本発明の核酸プローブが2本鎖ポリヌクレオチドである場合、本発明の核酸プローブは、本発明のアンチセンス分子及びそれに相補的なポリヌクレオチド分子から構成され得る。
6.2. Nucleic acid probes and methods of use thereof The nucleic acid probes of the present invention can be used for specific detection and quantification of the polynucleotides of the present invention or known polynucleotides, or for comprehensive detection and quantification of both the polynucleotides of the present invention and known polynucleotides. Can be used. For example, such detection and quantification can be performed using Northern blotting, a nucleic acid array on which the nucleic acid probe of the present invention is immobilized, etc. after the preparation of total RNA from a biological sample. The nucleic acid probe can be DNA, RNA, modified nucleic acid, or a chimeric molecule thereof, but DNA is preferable in consideration of stability, convenience and the like. The nucleic acid probe may also be either a single stranded or double stranded polynucleotide. The size of the nucleic acid probe is not particularly limited as long as it can specifically hybridize to the transcription product of the target gene. For example, at least about 15 or 16, preferably about 15 to about 1000, more preferably about 20 To about 500, and even more preferably from about 25 to about 300. When the nucleic acid probe of the present invention is a single-stranded polynucleotide, the nucleic acid probe of the present invention can be the same as the antisense molecule of the present invention. When the nucleic acid probe of the present invention is a double-stranded polynucleotide, the nucleic acid probe of the present invention can be composed of the antisense molecule of the present invention and a polynucleotide molecule complementary thereto.

本発明の核酸プローブは、a)本発明のポリヌクレオチドを既知ポリヌクレオチドから識別可能である、本発明のポリヌクレオチドに特異的な核酸プローブ(必要に応じて「特異的な核酸プローブA」と省略)、b)既知ポリヌクレオチドを本発明のポリヌクレオチドから識別可能である、既知ポリヌクレオチドに特異的な核酸プローブ(必要に応じて「特異的な核酸プローブB」と省略)、c)本発明のポリヌクレオチド及び既知ポリヌクレオチドを互いに識別しない、本発明のポリヌクレオチド及び既知ポリヌクレオチドの双方に共通する核酸プローブ(必要に応じて「共通核酸プローブ」と省略)であり得る。   The nucleic acid probe of the present invention is a) a nucleic acid probe specific to the polynucleotide of the present invention that can distinguish the polynucleotide of the present invention from known polynucleotides (abbreviated as “specific nucleic acid probe A” if necessary). B) Nucleic acid probe specific to a known polynucleotide that can distinguish a known polynucleotide from the polynucleotide of the present invention (abbreviated as “specific nucleic acid probe B” if necessary), c) of the present invention It may be a nucleic acid probe (abbreviated as “common nucleic acid probe” if necessary) common to both the polynucleotide of the present invention and the known polynucleotide, which does not distinguish the polynucleotide and the known polynucleotide from each other.

本発明の特異的な核酸プローブAは、上記の特異的な部分ヌクレオチドAの核酸配列(特に本発明のポリヌクレオチドの挿入核酸配列)に相補的な核酸配列を有するポリヌクレオチド(一本鎖ポリヌクレオチド)、又は上記の特異的な部分ヌクレオチドAの核酸配列(特に本発明のポリヌクレオチドの挿入核酸配列)及び当該核酸配列に相補的な核酸配列を有するポリヌクレオチド(二本鎖ポリヌクレオチド)であり得る。   The specific nucleic acid probe A of the present invention is a polynucleotide (single-stranded polynucleotide) having a nucleic acid sequence complementary to the nucleic acid sequence of the specific partial nucleotide A (particularly, the inserted nucleic acid sequence of the polynucleotide of the present invention). ), Or a polynucleotide having a nucleic acid sequence complementary to the nucleic acid sequence of the specific partial nucleotide A (particularly, the inserted nucleic acid sequence of the polynucleotide of the present invention) and the nucleic acid sequence (double-stranded polynucleotide). .

本発明の特異的な核酸プローブBは、上記の特異的な部分ヌクレオチドBの核酸配列(特に既知ポリヌクレオチドの挿入核酸配列)に相補的な核酸配列を有するポリヌクレオチド(一本鎖ポリヌクレオチド)、又は上記の特異的な部分ヌクレオチドBの核酸配列(特に既知ポリヌクレオチドの挿入核酸配列)及び当該核酸配列に相補的な核酸配列を有するポリヌクレオチド(二本鎖ポリヌクレオチド)であり得る。   The specific nucleic acid probe B of the present invention is a polynucleotide (single-stranded polynucleotide) having a nucleic acid sequence complementary to the nucleic acid sequence of the specific partial nucleotide B (particularly, an inserted nucleic acid sequence of a known polynucleotide), Alternatively, it may be a nucleic acid sequence (particularly an inserted nucleic acid sequence of a known polynucleotide) of the specific partial nucleotide B and a polynucleotide having a nucleic acid sequence complementary to the nucleic acid sequence (double-stranded polynucleotide).

本発明の共通核酸プローブは、上記の共通部分ヌクレオチドの核酸配列に相補的な核酸配列を有するポリヌクレオチド(一本鎖ポリヌクレオチド)、又は上記の共通部分ヌクレオチドの核酸配列及び当該核酸配列に相補的な核酸配列を有するポリヌクレオチド(二本鎖ポリヌクレオチド)であり得る。   The common nucleic acid probe of the present invention is a polynucleotide having a nucleic acid sequence complementary to the nucleic acid sequence of the common partial nucleotide (single-stranded polynucleotide), or the nucleic acid sequence of the common partial nucleotide and complementary to the nucleic acid sequence. A polynucleotide having a specific nucleic acid sequence (double-stranded polynucleotide).

本発明の核酸プローブは、支持体上に固定された形態で(即ち、アレイとして)提供されてもよい。このような核酸アレイの支持体としては、当該分野で通常用いられている支持体であれば特に限定されず、例えば、メンブレン(例えば、ナイロン膜)、ガラス、プラスチック、金属、プレートなどが挙げられる。本発明における核酸アレイの形態としては、自体公知の形態を用いることができ、例えば、支持体上で核酸が直接合成されるアレイ(いわゆるアフィメトリクス方式)、支持体上に核酸が固定化されるアレイ(いわゆるスタンフォード方式)、繊維型アレイ、電気化学的アレイ(ECA)が挙げられる。   The nucleic acid probe of the present invention may be provided in a form immobilized on a support (ie, as an array). The support for such a nucleic acid array is not particularly limited as long as it is a support commonly used in the art, and examples thereof include membranes (for example, nylon membrane), glass, plastic, metal, plates, and the like. . As a form of the nucleic acid array in the present invention, a form known per se can be used. For example, an array in which nucleic acids are directly synthesized on a support (so-called affiliometric method), an array in which nucleic acids are immobilized on a support (So-called Stanford method), fiber type array, and electrochemical array (ECA).

6.3.抗体及びアプタマー並びにその使用方法
本発明の抗体及びアプタマーは、本発明のポリペプチド、既知ポリペプチド、又は本発明のポリペプチド及び既知ポリペプチドの双方の特異的な検出及び定量に使用できる。例えば、このような検出及び定量は、生体試料からの抽出液の調製後、又は生体試料を用いて、免疫学的手法により又は親和性を利用した方法により行なうことができる。このような免疫学的手法としては、例えば、酵素免疫測定法(EIA)(例、直接競合ELISA、間接競合ELISA、サンドイッチELISA)、放射免疫測定法(RIA)、蛍光免疫測定法(FIA)、免疫クロマト法、ルミネッセンス免疫測定法、スピン免疫測定法、ウエスタンブロット法、免疫組織化学的染色法が挙げられる。親和性を利用した方法は、上述の免疫学的手法に準じて行うことができる。本発明のポリペプチド、既知ポリペプチド、又は本発明のポリペプチド及び既知ポリペプチドの双方の測定に用いられる抗体及びアプタマーは、上述の本発明の抗体及びアプタマーと同様であり得る。
6.3. Antibodies and aptamers and methods of use thereof The antibodies and aptamers of the invention can be used for specific detection and quantification of the polypeptides of the invention, known polypeptides, or both polypeptides of the invention and known polypeptides. For example, such detection and quantification can be performed after preparation of an extract from a biological sample, or using a biological sample by an immunological technique or a method utilizing affinity. Examples of such immunological techniques include enzyme immunoassay (EIA) (eg, direct competition ELISA, indirect competition ELISA, sandwich ELISA), radioimmunoassay (RIA), fluorescence immunoassay (FIA), Examples include immunochromatography, luminescence immunoassay, spin immunoassay, western blotting, and immunohistochemical staining. The method utilizing affinity can be performed according to the above-described immunological technique. The antibody and aptamer used for the measurement of the polypeptide of the present invention, the known polypeptide, or both the polypeptide of the present invention and the known polypeptide may be the same as the antibody and aptamer of the present invention described above.

本発明の抗体及びアプタマーは、a)本発明のポリペプチドを既知ポリペプチドから識別可能である、本発明のポリペプチドに特異的な抗体及びアプタマー(必要に応じて「特異的な抗体及びアプタマーA」と省略)、b)既知ポリペプチドを本発明のポリペプチドから識別可能である、既知ポリペプチドに特異的な抗体及びアプタマー(必要に応じて「特異的な抗体及びアプタマーB」と省略)、c)本発明のポリペプチド及び既知ポリペプチドを互いに識別しない、本発明のポリペプチド及び既知ポリペプチドの双方に共通する抗体及びアプタマー(必要に応じて「共通抗体及びアプタマー」と省略)であり得る。本発明の特異的な抗体及びアプタマーAは、上記の特異的な部分ペプチドA(特に本発明のポリペプチドの挿入アミノ酸配列からなる部分ペプチド)に結合し得る。本発明の特異的な抗体及びアプタマーBは、上記の特異的な部分ペプチドB(特に既知ポリペプチドの挿入アミノ酸配列からなる部分ペプチド)に結合し得る。本発明の共通抗体及びアプタマーは、上記の共通部分ペプチドに結合し得る。   The antibodies and aptamers of the present invention are: a) an antibody and an aptamer specific to the polypeptide of the present invention, which can distinguish the polypeptide of the present invention from a known polypeptide (if necessary, “specific antibody and aptamer A A) and b) antibodies and aptamers specific to known polypeptides (abbreviated as “specific antibodies and aptamers B” if necessary), which can distinguish known polypeptides from the polypeptides of the present invention, c) It may be an antibody and an aptamer that do not distinguish the polypeptide of the present invention and the known polypeptide from each other and are common to both the polypeptide of the present invention and the known polypeptide (abbreviated as “common antibody and aptamer” as necessary). . The specific antibody and aptamer A of the present invention can bind to the above-mentioned specific partial peptide A (particularly a partial peptide consisting of the inserted amino acid sequence of the polypeptide of the present invention). The specific antibody and aptamer B of the present invention can bind to the above-mentioned specific partial peptide B (particularly, a partial peptide consisting of an inserted amino acid sequence of a known polypeptide). The common antibody and aptamer of the present invention can bind to the above-mentioned common partial peptide.

本発明の抗体及びアプタマーは、支持体上に固定された形態で(即ち、アレイとして)提供されてもよい。このような核酸アレイの支持体としては、当該分野で通常用いられている支持体であれば特に限定されず、例えば、メンブレン(例、ニトロセルロース膜)、ガラス、プラスチック、金属、プレート(例、マルチウェルプレート)が挙げられる。   The antibodies and aptamers of the invention may be provided in a form immobilized on a support (ie, as an array). The support for such a nucleic acid array is not particularly limited as long as it is a support that is usually used in the art. Multiwell plate).

6.4.本発明の測定用手段についての補足事項
本発明の測定用手段は、必要に応じて、標識用物質で標識された形態で提供され得る。標識用物質としては、例えば、FITC、FAM等の蛍光物質、ルミノール、ルシフェリン、ルシゲニン等の発光物質、H、14C、32P、35S、123I等の放射性同位体、ビオチン、ストレプトアビジン等の親和性物質などが挙げられる。
6.4. Supplementary matter on the measuring means of the present invention The measuring means of the present invention can be provided in a form labeled with a labeling substance, if necessary. Examples of the labeling substance include fluorescent substances such as FITC and FAM, luminescent substances such as luminol, luciferin, and lucigenin, radioisotopes such as 3 H, 14 C, 32 P, 35 S, and 123 I, biotin, streptavidin, and the like. And the like, and the like.

本発明の測定用手段は、測定用手段に加え、さらなる構成要素を含むキットの形態で提供されてもよい。この場合、キットに含まれる各構成要素は、互いに隔離された形態、例えば、異なる容器に格納された形態で提供され得る。例えば、測定用手段が標識用物質で標識されていない場合、このようなキットは、標識用物質をさらに含み得る。本発明のキットは、2以上の標的遺伝子(例、血球系・破骨細胞特異的遺伝子と既知遺伝子との組合せ、2以上の血球系・破骨細胞特異的遺伝子の組合せ)に対する2以上の測定用手段を含み得る。また、本発明の測定用手段がアレイの形態で提供される場合、本発明のアレイは、2以上の標的遺伝子に対する2以上の測定用手段が固定されたものであり得る。本発明のキット及びアレイはまた、ハウスキーピング遺伝子(例、GAPDH、β-アクチン)について上述したような測定用手段を含み得る。   The measurement means of the present invention may be provided in the form of a kit including additional components in addition to the measurement means. In this case, each component included in the kit may be provided in an isolated form, for example, stored in a different container. For example, if the measuring means is not labeled with a labeling substance, such a kit may further comprise a labeling substance. The kit of the present invention comprises two or more measurements for two or more target genes (for example, a combination of a blood cell / osteoclast specific gene and a known gene, or a combination of two or more blood cell / osteoclast specific genes). Means may be included. When the measurement means of the present invention is provided in the form of an array, the array of the present invention may be one in which two or more measurement means for two or more target genes are fixed. The kits and arrays of the present invention can also include a means for measurement as described above for housekeeping genes (eg, GAPDH, β-actin).

6.5.本発明の測定方法
本発明はまた、本発明の測定用手段を用いた、標的ポリペプチド又はポリヌクレオチドの検出又は定量方法を提供する。
6.5. Measurement Method of the Present Invention The present invention also provides a method for detecting or quantifying a target polypeptide or polynucleotide using the measurement means of the present invention.

標的ポリヌクレオチド及びポリペプチドの測定は、上述の方法により、測定用手段の種類に応じて適切に行われ得る。   The measurement of the target polynucleotide and polypeptide can be appropriately performed according to the type of measuring means by the above-described method.

本発明の方法では、上述の哺乳動物(例、ヒト)から得られた生体試料、あるいは培養物(例、細胞又は組織培養物)における標的ポリヌクレオチド又はポリペプチドの発現量が測定され得る。生体試料としては、例えば、標的ポリヌクレオチド又はポリヌクレオチドの発現細胞又は組織を含む試料、あるいは標的ポリヌクレオチド又はポリペプチドが分泌又は漏出等される場合には、このような分泌又は漏出等されたポリヌクレオチド又はポリペプチドを含む動物由来試料(例、血液、血漿、血清、唾液、脳脊髄液、涙液、尿)である限り特に限定されない。生体試料はまた、上述の細胞又は組織(例、血球系又は破骨細胞あるいは造血・リンパ組織又は滑膜組織)を含むものであり得る。本発明で用いられる生体試料は、特に断らない限り、哺乳動物から予め採取された生体試料であり得るが、特定の局面では、本発明の方法は、哺乳動物から生体試料を採取することを含み得る。   In the method of the present invention, the expression level of a target polynucleotide or polypeptide in a biological sample obtained from the above-described mammal (eg, human) or in a culture (eg, cell or tissue culture) can be measured. The biological sample includes, for example, a sample containing a target polynucleotide or a polynucleotide-expressing cell or tissue, or, if the target polynucleotide or polypeptide is secreted or leaked, such a secreted or leaked polynucleotide. It is not particularly limited as long as it is an animal-derived sample (eg, blood, plasma, serum, saliva, cerebrospinal fluid, tears, urine) containing nucleotides or polypeptides. The biological sample may also contain the cells or tissues described above (eg, blood cells or osteoclasts or hematopoietic / lymphoid tissues or synovial tissues). The biological sample used in the present invention can be a biological sample collected in advance from a mammal unless otherwise specified, but in a specific aspect, the method of the present invention includes collecting a biological sample from a mammal. obtain.

一実施形態では、本発明の方法は、血球系又は破骨細胞の同定、血球系又は破骨細胞の分化状態の判定、血球系又は破骨細胞の障害に基づく疾患に対する診断(例、発症又は発症可能性の判定)に利用できる。このような方法は、動物から採取した生体試料において標的ポリヌクレオチド又はポリペプチドの発現量を測定し、測定された発現量又は相対的な発現比率に基づき対象疾患の発症又は発症可能性を評価することを含み得る。例えば、測定された発現量又は相対的な発現比率が、対象疾患に罹患していない哺乳動物(例、正常動物)における発現量と比較される。対象疾患に罹患していない哺乳動物における発現量又は発現比率は、自体公知の方法により決定できる。このような比較により、動物が対象疾患に罹患している可能性があるか否か、あるいは将来的に罹患する可能性が高いか低いかが判断される。特定の疾患を発症した哺乳動物では、当該疾患に関連する遺伝子の発現の変化がしばしば観察されることが知られている。また、特定の疾患の発症前に、特定の遺伝子の発現の変化がしばしば観察されることが知られている。従って、このような解析により、対象疾患の発症又は発症可能性を判断することが可能である。このような方法は、例えば、対象疾患の簡便な判定及び早期の発見に有用であり得る。当然のことながら、本発明の測定用手段及び本発明の試薬又はキットもまた、このような判定に利用され得る。   In one embodiment, the method of the invention comprises identification of a blood cell line or osteoclast, determination of the differentiation state of the blood cell line or osteoclast, diagnosis for a disease based on a disorder of the blood cell line or osteoclast (eg, onset or Can be used to determine the likelihood of onset). Such a method measures the expression level of a target polynucleotide or polypeptide in a biological sample collected from an animal, and evaluates the onset or possibility of onset of the target disease based on the measured expression level or relative expression ratio. Can include. For example, the measured expression level or the relative expression ratio is compared with the expression level in a mammal (eg, normal animal) not suffering from the target disease. The expression level or expression ratio in a mammal not affected by the target disease can be determined by a method known per se. Based on such comparison, it is determined whether or not the animal is likely to be affected by the target disease, or whether or not the animal is likely to be affected in the future. It is known that changes in the expression of genes associated with a particular disease are often observed in mammals that have developed a particular disease. It is also known that changes in the expression of specific genes are often observed before the onset of specific diseases. Therefore, it is possible to determine the onset or possibility of onset of the target disease by such analysis. Such a method may be useful, for example, for simple determination of the target disease and early detection. Of course, the measuring means of the present invention and the reagent or kit of the present invention can also be used for such determination.

詳細には、血球系又は破骨細胞あるいは造血・リンパ組織における血球系・破骨細胞特異的遺伝子1〜12の発現プロファイルの変化は、実施例に記載の通りである。従って、本発明のポリヌクレオチド及び本発明の部分ヌクレオチド(例、本発明の特異的な部分ヌクレオチドA、本発明の特異的な部分ヌクレオチドB、本発明の共通部分ヌクレオチド)、並びに本発明のポリペプチド及び本発明の部分ペプチド(例、本発明の特異的な部分ペプチドA、本発明の特異的な部分ペプチドB、本発明の共通部分ペプチド)の特異的な測定を可能にする本発明の測定用手段を用いて、血球系・破骨細胞特異的遺伝子1〜12の発現の程度及び/又はそれらの相対的な発現比率を評価することにより、血球系又は破骨細胞の同定、血球系又は破骨細胞の分化状態の判定、あるいは血球系又は破骨細胞の障害に基づく疾患に対する診断が可能である。   Specifically, changes in the expression profile of blood cell / osteoclast-specific genes 1 to 12 in blood cells or osteoclasts or hematopoietic / lymphoid tissues are as described in Examples. Accordingly, the polynucleotide of the present invention and the partial nucleotide of the present invention (eg, the specific partial nucleotide A of the present invention, the specific partial nucleotide B of the present invention, the common partial nucleotide of the present invention), and the polypeptide of the present invention And the measurement of the present invention that enables specific measurement of the partial peptide of the present invention (eg, specific partial peptide A of the present invention, specific partial peptide B of the present invention, common partial peptide of the present invention) By evaluating the degree of expression of blood cell line / osteoclast-specific genes 1 to 12 and / or their relative expression ratios using means, identification of blood cell line or osteoclast, blood cell line or osteoclast It is possible to determine the differentiation state of bone cells, or to diagnose a disease based on a disorder of blood cells or osteoclasts.

別の実施形態では、本発明の方法は、医薬、試薬又は食品等のスクリーニングに利用できる。例えば、一方法論では、スクリーニング方法は、被験物質が血球系又は破骨細胞数を調節(例、増加、減少)し得るか否かを評価することを含み得る。血球系又は破骨細胞数と血球系・破骨細胞特異的遺伝子の発現量は相関し得るので、血球系・破骨細胞特異的遺伝子の発現量を測定することにより、このようなスクリーニングを行うことができる。別の方法論では、スクリーニング方法は、被験物質が標的ポリヌクレオチド又はポリペプチドの発現又は機能を調節し得るか否かを評価することを含み得る。このようなスクリーニング方法は、例えば、標的の発現又は機能を調節し得る被験物質を選択することを含む、所定の疾患(例、血球系又は破骨細胞の障害に基づく疾患)に対して有効な医薬等のスクリーニング方法、並びに標的の発現又は機能を調節し得ない被験物質を選択することを含む、所定の作用(例、血球系又は破骨細胞の分化調節作用等の副作用)が低減した医薬等のスクリーニング方法として利用できる。スクリーニング方法に供される被験物は、公知又は新規の化合物又は組成物であり得、例えば、核酸、糖質、脂質、タンパク質、ペプチド、有機低分子化合物、コンビナトリアルケミストリー技術を用いて作製された化合物ライブラリー、固相合成やファージディスプレイ法により作製されたランダムペプチドライブラリー、あるいは微生物、動植物、海洋生物等由来の天然成分、既存の医薬、試薬又は食品等が挙げられる。スクリーニング方法では、上述したような哺乳動物、細胞及び組織(例、血球系又は破骨細胞あるいは造血・リンパ組織又は滑膜組織)、あるいは再構成系(非細胞系)が用いられ得る。スクリーニング方法により得られる医薬等もまた、本発明により提供される。   In another embodiment, the method of the present invention can be used for screening pharmaceuticals, reagents or foods. For example, in one methodology, the screening method can include evaluating whether the test substance can modulate (eg, increase, decrease) the blood cell line or osteoclast number. The number of blood cells or osteoclasts can be correlated with the expression level of blood cell / osteoclast-specific genes. be able to. In another methodology, the screening method can include assessing whether the test substance can modulate the expression or function of the target polynucleotide or polypeptide. Such a screening method is effective for a predetermined disease (eg, a disease based on a disorder of blood cell line or osteoclast) including, for example, selecting a test substance that can modulate the expression or function of a target. Drugs with reduced predetermined effects (eg, side effects such as blood cell or osteoclast differentiation-regulating effects) including screening methods for drugs and the like, and selecting test substances that cannot regulate target expression or function It can be used as a screening method. The subject to be subjected to the screening method can be a known or novel compound or composition, for example, a nucleic acid, carbohydrate, lipid, protein, peptide, organic low molecular weight compound, compound prepared using combinatorial chemistry technology Examples include libraries, random peptide libraries prepared by solid-phase synthesis and phage display methods, natural components derived from microorganisms, animals and plants, marine organisms, existing pharmaceuticals, reagents, foods, and the like. In the screening method, mammals, cells and tissues (for example, blood cells or osteoclasts, hematopoietic / lymphoid tissues or synovial tissues) as described above, or reconstitution systems (non-cell systems) can be used. A medicament obtained by the screening method is also provided by the present invention.

本明細書中で挙げられた特許及び特許出願明細書を含む全ての刊行物に記載された内容は、本明細書での引用により、その全てが明示されたと同程度に本明細書に組み込まれるものである。   The contents of all publications, including patents and patent application specifications cited in this specification, are hereby incorporated by reference herein to the same extent as if all were explicitly stated. Is.

以下に実施例を挙げ、本発明を更に詳しく説明するが、本発明は下記実施例等に何ら制約されるものではない。   The present invention will be described in more detail with reference to the following examples, but the present invention is not limited to the following examples.

実施例1:ヒトcDNAライブラリー作製と配列解析
(1)改良オリゴキャップ法によるcDNAライブラリーの作製と配列解析
1)mRNA抽出と購入
ヒト組織(下記に示す)より、文献(J. Sambrook, E. F. Fritsch & T. Maniatis, Molecular Cloning Second edition, Cold Spring harbor Laboratory Press, 1989)記載の方法により全RNAとしてmRNAを抽出した。また、ヒト培養細胞やヒト初代培養細胞(下記に示す)をカタログ記載の方法で培養後、文献(J. Sambrook, E. F. Fritsch & T. Maniatis, Molecular Cloning Second edition, Cold Spring harbor Laboratory Press, 1989)記載の方法により全RNAとしてmRNAを抽出した。
以下にライブラリー名とその由来の関係を、「ライブラリー名:由来」の順に示した。サブトラクションしたものについては、サブトラクトライブラリーの作り方も示した。
Example 1: Preparation and sequence analysis of human cDNA library (1) Preparation and sequence analysis of cDNA library by improved oligocap method 1) Extraction and purchase of mRNA From human tissues (shown below), literature (J. Sambrook, EF Fritsch & T. Maniatis, Molecular Cloning Second Edition, Cold Spring harbor Laboratory Press, 1989), mRNA was extracted as total RNA. In addition, after culturing human cultured cells and primary human cultured cells (shown below) by the method described in the catalog, literature (J. Sambrook, EF Fritsch & T. Maniatis, Molecular Cloning Second edition, Cold Spring harbor Laboratory Press, 1989) MRNA was extracted as total RNA by the method described.
The relationship between the library name and its origin is shown below in the order of “library name: origin”. For subtracted ones, we also showed how to create a subtract library.

<ヒト組織よりmRNA抽出>
NTONG:正常舌(Tongue);CTONG:舌癌(Tongue, Tumor);FCBBF:胎児脳(Brain, Fetal);OCBBF:胎児脳(Brain, Fetal);PLACE:胎盤(Placenta);SYNOV:滑膜組織(Synovial membrane tissue from rheumatioid arthritis);CORDB:臍帯血(Cord blood)。
<MRNA extraction from human tissue>
NTONG: normal tongue (Tongue); CTONG: tongue cancer (Tongue, Tumor); FCBBF: fetal brain (Brain, Fetal); OCBBF: fetal brain (Brain, Fetal); PLACE: placenta (Placenta); SYNOV: synovial tissue (Synovial membrane tissue from rheumatioid arthritis); CORDB: Cord blood.

<培養細胞よりmRNA抽出>
BNGH4:H4細胞(ATCC #HTB-148);IMR32:IMR32細胞(ATCC #CCL-127);SKNMC:SK-N-MC細胞(ATCC #HTB-10);3NB69:NB69細胞(RCB #RCB0480);BGGI1:GI1細胞(RCB #RCB0763);NB9N4:NB9細胞(RCB #RCB0477);SKNSH:SK-N-SH細胞(RCB #RCB0426);AHMSC:HMSC細胞(間葉細胞, Human mesenchymal cell);CHONS:軟骨細胞(Chondrocyte);ERLTF:TF-1細胞(赤白血病細胞, erythroleukemia);HELAC:HeLa細胞;JCMLC:白血病細胞(Leukemia, myelogenous);MESTC:間葉系幹細胞(Mesenchyme stem cell);N1ESE:間葉系幹細胞(Mesenchymal stem cell);NCRRM:胎生期癌細胞(Embryonal carcinoma);NCRRP:胎生期癌細胞(Embryonal carcinoma)をレチノイン酸(RA)処理誘導;T1ESE:間葉系幹細胞(Mesenchymal stem cell) をトリコスタチンと5アザシチジン処理誘導;NT2RM:NT2細胞(STARATAGENE #204101);NT2RP:NT2細胞をレチノイン酸(RA)処理誘導5週間;NT2RI:NT2細胞をRA処理誘導5週間後、生育阻害剤処理2週間;NT2NE:NT2細胞をRA処理と生育阻害剤処理により神経分化後、神経を濃縮回収(NT2 Neuron);NTISM:NT2細胞(STARATAGENE #204101)をRA処理誘導5週間後、生育阻害剤処理を2週間したmRNAから作製したcDNAライブラリーから、未分化NT2細胞のmRNAと重複するcDNAをSubtract Kit (Invitrogen #K4320-01)を用いてサブトラクトしたライブラリー(NT2RI−NT2RM)。RCBは、理化学研究所ジーンバンク・細胞開発銀行より分譲をうけたものであり、ATCCは、American Type Culture Collectionより分譲をうけたものである。
<MRNA extraction from cultured cells>
BNGH4: H4 cells (ATCC # HTB-148); IMR32: IMR32 cells (ATCC # CCL-127); SKNMC: SK-N-MC cells (ATCC # HTB-10); 3NB69: NB69 cells (RCB # RCB0480); BGGI1: GI1 cells (RCB # RCB0763); NB9N4: NB9 cells (RCB # RCB0477); SKNSH: SK-N-SH cells (RCB # RCB0426); AHMSC: HMSC cells (mesenchymal cells, human mesenchymal cells); CHONS: Chondrocytes; ERLTF: TF-1 cells (erythroleukemia cells, erythroleukemia); HERAC: HeLa cells; JCMLC: leukemia cells (Leukemia, myelogenous); MESTC: Mesenchyme stem cells; N1ESE: between Mesenchymal stem cells; NCRRM: Embryonal carcinoma cells; NCRRP: Embryonal carcinoma cells induced by retinoic acid (RA) treatment; T1ESE: Mesenchymal stem cells Induced with trichostatin and 5-azacytidine treatment; NT2RM: NT2 cells (STARATAGENE # 204101); NT2RP: NT2 cells were treated with retinoic acid (RA) for 5 weeks; NT2RI: NT2 cells were treated with RA after 5 weeks of induction of RA treatment 2 Week: NT2NE: NT2 cells are differentiated by RA treatment and growth inhibitor treatment, then nerves are concentrated and recovered (NT2 Neuron); NTISM: NT2 cells (STARATAGENE # 204101) are treated with growth inhibitor 5 weeks after induction of RA treatment A library (NT2RI-NT2RM) obtained by subtracting cDNA overlapping with mRNA of undifferentiated NT2 cells from a cDNA library prepared from 2 weeks of mRNA using Subtract Kit (Invitrogen # K4320-01). RCB was purchased from RIKEN Genebank and Cell Development Bank, and ATCC was purchased from the American Type Culture Collection.

<初代培養細胞よりmRNA抽出>
ASTRO:正常神経膠星状細胞(Normal Human Astrocyte) NHA5732, 宝酒造 #CC2565;DFNES:新生児正常皮膚繊維芽細胞(Normal Human Dermal Fibroblasts (Neonatal Skin); NHDF-Neo) NHDF2564, 宝酒造 #CC2509;MESAN:正常メサンギウム細胞(Normal human mesangial cells) NHMC56046-2, 宝酒造 #CC2559;NHNPC:正常神経前駆細胞(Normal human neural progenitor cells) NHNP5958, 宝酒造 #CC2599;PEBLM:正常末梢血単核細胞(Human peripheral blood mononuclear cells) HPBMC5939, 宝酒造 #CC2702;HSYRA:滑膜細胞HS-RA(Human synoviocytes from rheumatioid arthritis), 東洋紡 #T404K-05;PUAEN:正常肺動脈内皮細胞(Human pulmonary artery endothelial cells), 東洋紡 #T302K-05;UMVEN:正常臍帯静脈内皮細胞(Human umbilical vein endothelial cells) HUVEC, 東洋紡 #T200K-05;HCASM:正常冠動脈平滑筋細胞HCASMC(Human coronary artery smooth muscle cells), 東洋紡 #T305K-05;HCHON:正常軟骨細胞HC(Human Chondrocytes), 東洋紡 #T402K-05;HHDPC:正常頭髪毛乳頭細胞HDPC(Human dermal papilla cells), 東洋紡#THPCK-001;CD34C:CD34+細胞(AllCells, LLC #CB14435M);D3OST:CD34+細胞を破骨細胞分化因子(ODF)処理誘導3日間;D6OST:CD34+細胞をODF処理誘導6日間;D9OST:CD34+細胞をODF処理誘導9日間;ACTVT:活性化T細胞(Activated T-cell);LYMPB:リンパ芽球(Lymphoblast, EB virus transferred B cell);NETRP:好中球(Neutrophil)。
<MRNA extraction from primary cultured cells>
ASTRO: Normal Human Astrocyte NHA5732, Takara Shuzo # CC2565; DFNES: Normal Human Dermal Fibroblasts (Neonatal Skin); NHDF-Neo NHDF2564, Takara Shuzo # CC2509; MESAN: Normal Normal human mesangial cells NHMC56046-2, Takara Shuzo # CC2559; NHNPC: Normal human neural progenitor cells NHNP5958, Takara Shuzo # CC2599; PEBLM: Normal peripheral blood mononuclear cells HPBMC5939, Takara Shuzo # CC2702; HSYRA: Synovial cells HS-RA (Human synoviocytes from rheumatioid arthritis), Toyobo # T404K-05; PUAEN: Normal pulmonary artery endothelial cells, Toyobo # T302K-05; UMVEN: Normal umbilical vein endothelial cells HUVEC, Toyobo # T200K-05; HCASM: Normal coronary artery smooth muscle cells HCASMC, Toyobo # T305K-05; HCHON: Normal chondrocytes HC ( Human Chondrocytes), Toyobo # T402K-05; HHDPC: Normal hair papilla cells HDPC (Human dermal papilla cells), Toyobo # THPCK-001; CD34C: CD34 + cells (AllCells, LLC # CB14435M); D3OST: CD34 + cells osteoclast differentiation factor ( ODF) treatment induction for 3 days; D6OST: CD34 + cells induced for ODF treatment for 6 days; D9OST: CD34 + cells induced for ODF treatment for 9 days; ACTVT: Activated T-cells; LYMPB: lymphoblasts (Lymphoblast, EB virus transferred B cell); NETRP: Neutrophil.

次いで、以下に示すヒト組織より全RNAとして抽出されたmRNAを購入した。以下にライブラリー名とその由来の関係を、「ライブラリー名:由来」の順に示した。サブトラクションしたものについては、サブトラクトライブラリーの作り方も示した。   Subsequently, mRNA extracted as total RNA from human tissues shown below was purchased. The relationship between the library name and its origin is shown below in the order of “library name: origin”. For subtracted ones, we also showed how to create a subtract library.

<ヒト組織よりのmRNAを全RNAで購入>
ADRGL:副腎(Adrenal gland), CLONTECH #64016-1;BRACE:小脳(Brain, cerebellum), CLONTECH #64035-1;BRAWH:全脳(Brain, whole), CLONTECH #64020-1;FEBRA:胎児脳(Brain, Fetal), CLONTECH #64019-1;FELIV:胎児肝臓(Liver, Fetal), CLONTECH #64018-1;HEART:心臓(Heart), CLONTECH #64025-1;HLUNG:肺(Lung), CLONTECH #64023-1;KIDNE:腎臓(Kidney), CLONTECH #64030-1;LIVER:肝臓(Liver), CLONTECH #64022-1;MAMGL:乳腺(Mammary Gland), CLONTECH #64037-1;PANCR:膵臓(Pancreas), CLONTECH #64031-1;PROST:前立腺(Prostate), CLONTECH #64038-1;SALGL:唾液腺(Salivary Gland), CLONTECH #64026-1;SKMUS:骨格筋(Skeletal Muscle), CLONTECH #64033-1;SMINT:小腸(Small Intestine), CLONTECH #64039-1;SPLEN:脾臓(Spleen), CLONTECH #64034-1;STOMA:胃(Stomach), CLONTECH #64090-1;TBAES:乳癌(Breast, Tumor), CLONTECH #64015-1;TCERX:子宮頸管癌(Cervix, Tumor), CLONTECH #64010-1;TCOLN:結腸癌(Colon, Tumor), CLONTECH #64014-1;TESTI:精巣(Testis), CLONTECH #64027-1;THYMU:胸腺(Thymus), CLONTECH #64028-1;TLUNG:肺癌(Lung, Tumor), CLONTECH #64013-1;TOVAR:卵巣癌(Ovary, Tumor), CLONTECH #64011-1;TRACH:気管(Trachea), CLONTECH #64091-1;TUTER:子宮癌(Uterus, Tumor), CLONTECH #64008-1;UTERU:子宮(Uterus), CLONTECH #64029-1;ADIPS:脂肪組織(Adipose), Invitrogen #D6005-01;BLADE:膀胱(Bladder), Invitrogen #D6020-01;BRALZ:アルツハイマー患者大脳皮質(Brain, cortex, Alzheimer), Invitrogen #D6830-01;CERVX:子宮頸管(Cervix), Invitrogen #D6047-01;COLON:結腸(Colon), Invitrogen #D6050-0;NESOP:食道(Esophagus), Invitrogen #D6060-01;PERIC:心膜(Pericardium), Invitrogen #D6105-01;RECTM:直腸(Rectum), Invitrogen #D6110-01;TESOP:食道癌(Esophageal, Tumor), Invitrogen #D6860-01;TKIDN:腎臓癌(Kidney, Tumor), Invitrogen #D6870-01;TLIVE:肝臓癌(Liver, Tumor), Invitrogen #D6880-01;TSTOM:胃癌(Stomach, Tumor), Invitrogen #D6920-01;BEAST:成人乳房(Adult Breast), STARATAGENE #735044;FEHRT:胎児心臓(Heart, Fetal), STARATAGENE #738012;FEKID:胎児腎臓(Kidney, Fetal), STARATAGENE #738014;FELNG:胎児肺(Lung, Fetal), STARATAGENE #738020;NOVAR:成人卵巣(Adult Ovary), STARATAGENE #735260;BRASW:アルツハイマー患者大脳皮質組織[BRALZ:アルツハイマー患者大脳皮質(Brain, cortex, Alzheimer), Invitrogen #D6830-01]のmRNAから作製したcDNAライブラリーから、全脳組織[BRAWH:全脳(Brain, whole), CLONTECH #64020-1]のmRNAと重複するcDNAをSubtract Kit (Invitrogen #K4320-01)を用いてサブトラクトしたライブラリー(BRALZ−BRAWH)。
<Purchase of mRNA from human tissue with total RNA>
ADRGL: Adrenal gland, CLONTECH # 64016-1; BRACE: Cerebellum (Brain, cerebellum), CLONTECH # 64035-1; BRAWH: Whole brain (Brain, whole), CLONTECH # 64020-1; FEBRA: Fetal brain ( Brain, Fetal), CLONTECH # 64019-1; FELIV: Liver, Fetal, CLONTECH # 64018-1; HEART: Heart, CLONTECH # 64025-1; HLUNG: Lung, CLONTECH # 64023 -1; KIDNE: Kidney, CLONTECH # 64030-1; LIVER: Liver, CLONTECH # 64022-1; MAMGL: Mammary Gland, CLONTECH # 64037-1; PANCR: Pancreas, CLONTECH # 64031-1; PROST: Prostate, CLONTECH # 64038-1; SALGL: Salivary Gland, CLONTECH # 64026-1; SKMUS: Skeletal Muscle, CLONTECH # 64033-1; SMINT: Small Intestine, CLONTECH # 64039-1; SPLEN: Spleen, CLONTECH # 64034-1; STOMA: Stomach, CLONTECH # 64090-1; TBAES: Breast cancer (Breast, Tumor), CLONTECH # 64015 -1; TCERX: cervical cancer (Cervix, Tumor), CLONTECH # 64010-1; TCOLN: colon cancer (Colon, Tumor), CLONTECH # 64014-1; TESTI Testis, CLONTECH # 64027-1; THYMU: Thymus, CLONTECH # 64028-1; TRUNG: Lung cancer (Lung, Tumor), CLONTECH # 64013-1; TOVAR: Ovarian cancer (Ovary, Tumor), CLONTECH # 64011-1; TRACH: Trachea, CLONTECH # 64091-1; TUTER: Uterus cancer (Uterus, Tumor), CLONTECH # 64008-1; UTERU: Uterus, CLONTECH # 64029-1; ADIPS: Fat Tissue (Adipose), Invitrogen # D6005-01; BLADE: Bladder, Invitrogen # D6020-01; BRALZ: Brain cortex (Brain, cortex, Alzheimer), Invitrogen # D6830-01; CERVX: Cervix ), Invitrogen # D6047-01; COLON: Colon, Invitrogen # D6050-0; NESOP: Esophagus, Invitrogen # D6060-01; PERIC: Pericardium, Invitrogen # D6105-01; RECTM: Rectum (Rectum), Invitrogen # D6110-01; TESOP: Esophageal cancer (Esophageal, Tumor), Invitrogen # D6860-01; TKIDN: Kidney cancer (Kidney, Tumor), Invitrogen # D6870-01; TLIVE: Liver cancer (Liver, Tumor), Invitrogen # D6880-01; TSTOM: Stomach, Tumor, Invitrogen # D6920-01 : BEAST: Adult Breast, STARATAGENE # 735044; FEHRT: Fetal heart (Heart, Fetal), STARATAGENE # 738012; FEKID: Fetal kidney (Kidney, Fetal), STARATAGENE # 738014; FELNG: Fetal lung (Lung, Fetal) ), STARATAGENE # 738020; NOVAR: Adult Ovary, STARATAGENE # 735260; BRASW: Alzheimer patient cerebral cortex [BRALZ: Alzheimer patient cerebral cortex (Brain, cortex, Alzheimer), Invitrogen # D6830-01] mRNA A library obtained by subtracting cDNA overlapping with mRNA of whole brain tissue [BRAWH: Brain, whole, CLONTECH # 64020-1] from the prepared cDNA library using Subtract Kit (Invitrogen # K4320-01) (BRALZ-BRAWH).

さらに、次に示すヒト組織よりポリA(+) RNAとして抽出・精製されたmRNAを購入した。各組織由来のポリA(+) RNAに、ポリA(-)RNAを混ぜたRNAからcDNAライブラリーを作製した。ポリA(-)RNAは、全脳(Brain, whole), CLONTECH #64020-1の全RNAからポリA(+)RNAをオリゴdTセルロースで除くことにより調製した。以下にライブラリー名とその由来の関係を、「ライブラリー名:由来」の順に示した。   Furthermore, mRNA extracted and purified as poly A (+) RNA was purchased from the following human tissues. A cDNA library was prepared from RNA obtained by mixing poly A (+) RNA derived from each tissue with poly A (−) RNA. Poly A (−) RNA was prepared by removing poly A (+) RNA from whole RNA of brain, whole, CLONTECH # 64020-1 with oligo dT cellulose. The relationship between the library name and its origin is shown below in the order of “library name: origin”.

<ヒト組織よりのmRNAをポリA(+) RNAで購入>
BRAMY:扁桃(Brain, amygdala), CLONTECH #6574-1;BRCAN:尾状核(Brain, caudate nucleus), CLONTECH #6575-1;BRCOC:脳梁(Brain, corpus callosum), CLONTECH #6577-1;BRHIP:海馬(Brain, hippocampus), CLONTECH #6578-1;BRSSN:黒質(Brain, substantianigra), CLONTECH #6580-1;BRSTN:視床下核(Brain, subthalamic nucleus), CLONTECH #6581-1;BRTHA:視床(Brain, thalamus), CLONTECH #6582-1。
<Purchase of mRNA from human tissue with poly A (+) RNA>
BRAMY: Tonsils (Brain, amygdala), CLONTECH # 6574-1; BRCAN: Brain, caudate nucleus, CLONTECH # 6575-1; BRCOC: Brain, corpus callosum, CLONTECH # 6577-1; BRHIP: Hippocampus, CLONTECH # 6578-1; BRSSN: Black matter (Brain, substantianigra), CLONTECH # 6580-1; BRSTN: Brain, subthalamic nucleus, CLONTECH # 6581-1; BRTHA : Thalamus (Brain, thalamus), CLONTECH # 6582-1.

2)改良オリゴキャップ法によるcDNAライブラリーの作製
それぞれのRNAよりオリゴキャプ法[M. Maruyama and S. Sugano, Gene, 138: 171-174 (1994)]を改良した方法(WO 01/04286)によりcDNAライブラリーを作製した。Oligo-cap linker(配列番号:1)及びOligo dT primer(配列番号:2)を用いて、WO 01/04286に記載したようにBAP(Bacterial Alkaline Phosphatase)処理、TAP(Tobacco Acid Pyrophosphatase)処理、RNAライゲーション、第一鎖cDNAの合成とRNAの除去を行った。次いで、5'(配列番号:3)と3'(配列番号:4)のPCRプライマーを用いPCR (polymerase chain reaction)により2本鎖cDNAに変換し、SfiIで切断した。次いで、通常は2kb以上(場合によっては3kb以上)に分画したcDNA断片をDraIIIで切断したベクターpME18SFL3(GenBank AB009864, Expression vector)にcDNAの方向性を決めてクローニングし、cDNAライブラリーを作製した。
cDNAの5’-末端配列解析に用いたcDNAライブラリー名とその由来の関係を表1-1〜1-6に示す。また、ヒトゲノムにマップ後の各cDNAライブラリーのcDNAの5’-末端配列数も表1-1〜1-6に示す。
2) Preparation of cDNA library by improved oligo-capping method Oligocap method [M. Maruyama and S. Sugano, Gene, 138: 171-174 (1994)] was improved from each RNA (WO 01/04286). A cDNA library was prepared. Using Oligo-cap linker (SEQ ID NO: 1) and Oligo dT primer (SEQ ID NO: 2), BAP (Bacterial Alkaline Phosphatase) treatment, TAP (Tobacco Acid Pyrophosphatase) treatment, RNA as described in WO 01/04286 Ligation, first strand cDNA synthesis and RNA removal were performed. Next, it was converted into double-stranded cDNA by PCR (polymerase chain reaction) using PCR primers of 5 ′ (SEQ ID NO: 3) and 3 ′ (SEQ ID NO: 4), and cleaved with SfiI. Next, the cDNA fragment was usually cloned into a vector pME18SFL3 (GenBank AB009864, Expression vector) obtained by cleaving the cDNA fragment fractionated to 2 kb or more (in some cases 3 kb or more) with DraIII to prepare a cDNA library. .
Tables 1-1 to 1-6 show the names of the cDNA libraries used for the 5′-end sequence analysis of cDNA and their origins. Tables 1-1 to 1-6 also show the numbers of 5′-terminal sequences of cDNAs in each cDNA library after mapping to the human genome.

3)改良オリゴキャップ法で作製したcDNAライブラリーからのcDNAの5'-末端配列解析
各cDNAライブラリーより取得したcDNAの5'-末端の核酸配列をDNAシーケンシング試薬(BigDye Terminator Cycle Sequencing FS Ready Reaction Kit, PE Biosystems社製)を用い、マニュアルに従ってシーケンシング反応後、DNAシーケンサー(ABI PRISM 3700, PE Biosystems社製)で解析した。得られたデータについてはデータベース化を行った。改良オリゴキャップ法で作製した各cDNAライブラリーの5'-末端の全長率は、平均90%で高全長率であった(既知mRNAのタンパク質コード領域を指標にして算出した)。
3) Analysis of 5'-terminal sequence of cDNA from cDNA library prepared by improved oligo-cap method DNA sequencing reagent (BigDye Terminator Cycle Sequencing FS Ready) Using a Reaction Kit (manufactured by PE Biosystems), a sequencing reaction was performed according to the manual, followed by analysis with a DNA sequencer (ABI PRISM 3700, PE Biosystems). The obtained data was made into a database. The total length ratio of the 5′-end of each cDNA library prepared by the improved oligocap method was 90% on average and high in total length (calculated using the protein coding region of known mRNA as an index).

4)全長cDNA核酸配列解析
全長cDNA核酸配列解析に選抜されたcDNAについて各々全長cDNAの核酸配列を決定した。核酸配列は、主にカスタム合成DNAプライマーを用いたダイデオキシターミネーター法によるプライマーウォーキング法によって決定した。すなわち、カスタム合成DNAプライマーを用い、PE Biosystems社製のDNAシーケンシング試薬でマニュアルに従ってシーケンシング反応後、同社製のシーケンサーを用いてDNA核酸配列を解析した。全長核酸配列は上記方法により決定された部分核酸配列を完全にオーバーラップさせ最終的に確定した。次に、決定された全長cDNA核酸配列から、タンパク質への翻訳領域を推定しアミノ酸配列を求めた。
4) Full-length cDNA nucleic acid sequence analysis The full-length cDNA nucleic acid sequence was determined for each of the cDNAs selected for full-length cDNA nucleic acid sequence analysis. The nucleic acid sequence was determined mainly by the primer walking method by the dideoxy terminator method using custom synthetic DNA primers. That is, using a custom synthetic DNA primer, a sequencing reaction was performed according to the manual using a DNA sequencing reagent manufactured by PE Biosystems, and then a DNA nucleic acid sequence was analyzed using a sequencer manufactured by the same company. The full-length nucleic acid sequence was finally determined by completely overlapping the partial nucleic acid sequence determined by the above method. Next, from the determined full-length cDNA nucleic acid sequence, the translation region into the protein was estimated and the amino acid sequence was determined.

(2)オリゴキャップ法によるcDNAライブラリーの作製と配列解析
1)オリゴキャップ法によるcDNAライブラリーの作製
ヒト胎児精巣由来のテラトカルシノーマ細胞でレチノイン酸処理により神経細胞に分化可能なNT-2神経前駆細胞(Stratagene社より購入)を、添付のマニュアルにしたがって次のように処理したものを用いた。
・NT-2細胞をレチノイン酸で誘導しないで培養(NT2RM)
・NT-2細胞を培養後、レチノイン酸を添加して誘導後、2日間及び2週間培養(NT2RP)
また、ヒト培養細胞SK-N-MC(ATCC HTB-10)(SKNMC)、ヒト培養細胞Y79(ATCC HTB-18)(Y79AA)、ヒト培養細胞GI1(RCB RCB0763)(BGGI1)、ヒト培養細胞H4(ATCC HTB-148)(BNGH4)、ヒト培養細胞IMR32(ATCC CCL-127)(IMR32)、ヒト培養細胞NB9(RCB #RCB0477)(NB9N4)をカタログ記載の方法で培養した。RCBは、理化学研究所ジーンバンク・細胞開発銀行より分譲をうけたものであり、ATCCは、American Type Culture Collectionより分譲をうけたものである。
以上の培養細胞をそれぞれ集めて、文献(J. Sambrook, E. F. Fritsch & T. Maniatis, Molecular Cloning Second edition, Cold Spring harbor Laboratory Press 1989)記載の方法によりmRNAを抽出した。さらに、オリゴdTセルロースでpoly(A)+ RNAを精製した。
同様に、ヒト胎盤組織(PLACE)、ヒト卵巣癌組織(OVARC)、ヒト10週令胎児より頭部を多く含む組織(HEMBA)、ヒト10週令胎児より胴体部分を多く含む組織(HEMBB)、ヒト乳腺組織(MAMMA)、ヒト甲状腺組織(THYRO)、ヒト血管内皮組織の初代培養細胞(VESEN)より、文献(J. Sambrook, E. F. Fritsch & T. Maniatis, Molecular Cloning Second edition, Cold Spring harbor Laboratory Press, 1989)記載の方法によりmRNAを抽出した。さらに、オリゴdTセルロースでpoly(A)+ RNAを精製した。
以上の全てのpoly(A)+ RNAよりオリゴキャプ法 [M. Maruyama and S. Sugano, Gene, 138: 171-174 (1994)]により、それぞれcDNAライブラリーを作製した。Oligo-cap linker(配列番号:1)及びOligo dT primer(配列番号:2)を用いて文献 [鈴木・菅野, 蛋白質 核酸 酵素, 41: 197-201 (1996)、 Y. Suzuki et al., Gene, 200: 149-156 (1997)]に書いてあるようにBAP(Bacterial Alkaline Phosphatase)処理、TAP(Tobacco Acid Phosphatase)処理、RNAライゲーション、第一鎖cDNAの合成とRNAの除去を行った。次いで、5'(配列番号:3)と3'(配列番号:4)のPCRプライマーを用いPCR (polymerase chain reaction)により2本鎖cDNAに変換し、SfiI切断した。次いで、DraIIIで切断したベクターpUC19FL3(NT2RMとNT2RPの一部のみ)又はpME18SFL3(GenBank AB009864, Expression vector)にcDNAの方向性を決めてクローニングし、cDNAライブラリーを作製した。
cDNAの5’-末端配列解析に用いたcDNAライブラリー名とその由来の関係を表1-1〜1-6に示す。また、ヒトゲノムにマップ後の各cDNAライブラリーのcDNAの5’-末端配列数も表1-1〜1-6に示す。
(2) Preparation and sequence analysis of cDNA library by oligocap method 1) Preparation of cDNA library by oligocap method NT-2 neurons that can be differentiated into neurons by treatment with retinoic acid in teratocarcinoma cells derived from human fetal testis Progenitor cells (purchased from Stratagene) were treated as follows according to the attached manual.
・ Cultivate NT-2 cells without retinoic acid induction (NT2RM)
・ After culturing NT-2 cells, add retinoic acid and induce, then culture for 2 days and 2 weeks (NT2RP)
In addition, human cultured cells SK-N-MC (ATCC HTB-10) (SKNMC), human cultured cells Y79 (ATCC HTB-18) (Y79AA), human cultured cells GI1 (RCB RCB0763) (BGGI1), human cultured cells H4 (ATCC HTB-148) (BNGH4), human cultured cells IMR32 (ATCC CCL-127) (IMR32), and human cultured cells NB9 (RCB # RCB0477) (NB9N4) were cultured by the method described in the catalog. RCB was purchased from RIKEN Genebank and Cell Development Bank, and ATCC was purchased from the American Type Culture Collection.
The above cultured cells were collected, and mRNA was extracted by the method described in the literature (J. Sambrook, EF Fritsch & T. Maniatis, Molecular Cloning Second Edition, Cold Spring Harbor Laboratory Press 1989). Furthermore, poly (A) + RNA was purified with oligo dT cellulose.
Similarly, human placenta tissue (PLACE), human ovarian cancer tissue (OVARC), tissue containing more head than human 10-week-old fetus (HEMBA), tissue containing more body part than human 10-week-old fetus (HEMBB), Human mammary tissue (MAMMA), human thyroid tissue (THYRO), human vascular endothelial tissue primary cultured cells (VESEN), literature (J. Sambrook, EF Fritsch & T. Maniatis, Molecular Cloning Second edition, Cold Spring harbor Laboratory Press , 1989), and mRNA was extracted. Furthermore, poly (A) + RNA was purified with oligo dT cellulose.
A cDNA library was prepared from each of the above poly (A) + RNAs by the oligocap method [M. Maruyama and S. Sugano, Gene, 138: 171-174 (1994)]. Using the Oligo-cap linker (SEQ ID NO: 1) and Oligo dT primer (SEQ ID NO: 2), literature [Suzuki and Sugano, Protein Nucleic Acid Enzyme, 41: 197-201 (1996), Y. Suzuki et al., Gene , 200: 149-156 (1997)], BAP (Bacterial Alkaline Phosphatase) treatment, TAP (Tobacco Acid Phosphatase) treatment, RNA ligation, first-strand cDNA synthesis and RNA removal were performed. Subsequently, it was converted into double-stranded cDNA by PCR (polymerase chain reaction) using PCR primers of 5 ′ (SEQ ID NO: 3) and 3 ′ (SEQ ID NO: 4), and SfiI was cleaved. Next, the cDNA was cloned into the vector pUC19FL3 (part of NT2RM and NT2RP) or pME18SFL3 (GenBank AB009864, Expression vector) cleaved with DraIII to prepare a cDNA library.
Tables 1-1 to 1-6 show the names of the cDNA libraries used for the 5′-end sequence analysis of cDNA and their origins. Tables 1-1 to 1-6 also show the numbers of 5′-terminal sequences of cDNAs in each cDNA library after mapping to the human genome.

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

Figure 2008114709
2)オリゴキャップ法で作製したcDNAライブラリーからのcDNAの5'-末端配列解析
各cDNAライブラリーより取得したcDNAの5’-端又は3'-端の核酸配列をDNAシーケンシング試薬(Dye Terminator Cycle Sequencing FS Ready Reaction Kit, dRhodamine Terminator Cycle Sequencing FS Ready Reaction Kit又はBigDye Terminator Cycle Sequencing FS Ready Reaction Kit, PE Biosystems社製)を用い、マニュアルに従ってシーケンシング反応後、DNAシーケンサー(ABI PRISM 377, PE Biosystems社製)でDNA核酸配列を解析した。得られたデータをデータベース化した。オリゴキャップ法で作製した各cDNAライブラリーの5'-末端の全長率は、平均60%であった(既知mRNAのタンパク質コード領域を指標にして算出した)。
Figure 2008114709
2) Analysis of 5'-terminal sequence of cDNA from cDNA library prepared by oligocap method DNA sequencing reagent (Dye Terminator) Cycle Sequencing FS Ready Reaction Kit, dRhodamine Terminator Cycle Sequencing FS Ready Reaction Kit or BigDye Terminator Cycle Sequencing FS Ready Reaction Kit, manufactured by PE Biosystems) DNA nucleic acid sequence was analyzed. The obtained data was made into a database. The total length ratio of the 5′-end of each cDNA library prepared by the oligocap method was 60% on average (calculated using the protein coding region of a known mRNA as an index).

3)全長cDNA核酸配列解析
全長cDNA核酸配列解析に選抜されたcDNAについて各々全長cDNAの核酸配列を決定した。核酸配列は、主にカスタム合成DNAプライマーを用いたダイデオキシターミネーター法によるプライマーウォーキング法によって決定した。すなわち、カスタム合成DNAプライマーを用い、PE Biosystems社製のDNAシーケンシング試薬でマニュアルに従ってシーケンシング反応後、同社製のシーケンサーを用いてDNA核酸配列を解析した。一部のクローンについては、Licor社製DNAシーケンサーも利用した。また、一部のcDNAについてはカスタムプライマーを用いずcDNA が含まれるプラスミドをランダムに切断するショットガン法を用いて同様にDNAシーケンサーでDNA核酸配列を決定した。全長核酸配列は上記方法により決定された部分核酸配列を完全にオーバーラップさせ最終的に確定した。次に、決定された全長核酸配列から、タンパク質への翻訳領域を推定しアミノ酸配列を求めた。
3) Full-length cDNA nucleic acid sequence analysis The full-length cDNA nucleic acid sequence was determined for each of the cDNAs selected for full-length cDNA nucleic acid sequence analysis. The nucleic acid sequence was determined mainly by the primer walking method by the dideoxy terminator method using custom synthetic DNA primers. That is, using a custom synthetic DNA primer, a sequencing reaction was performed according to the manual using a DNA sequencing reagent manufactured by PE Biosystems, and then a DNA nucleic acid sequence was analyzed using a sequencer manufactured by the same company. For some clones, Licor DNA sequencer was also used. For some cDNAs, DNA nucleic acid sequences were similarly determined with a DNA sequencer using a shotgun method that randomly cuts a plasmid containing cDNA without using a custom primer. The full-length nucleic acid sequence was finally determined by completely overlapping the partial nucleic acid sequence determined by the above method. Next, from the determined full-length nucleic acid sequence, the translation region into the protein was estimated and the amino acid sequence was determined.

実施例2:ゲノムマッピングとクラスタリング
(1)配列データセット
以下の配列をデータセットとして使用した。
・ヒトゲノム配列:UCSC hg 17 (NCBI Build 35)(http://www.genome.ucsc.edu/)
・我々が新たに取得し全長cDNA配列解析を行ったヒト全長cDNA 19,265配列
・我々が取得し全長cDNA配列解析を行い既存の公共データベース(DDBJ / GenBank / EMBL)に登録済みのヒト全長cDNA配列(アクセッション番号: AB038269, AB045981, AB056476, AB056477, AK000001〜AK002212, AK021413〜AK027260, AK027263〜AK027902, AK054561〜AK058202, AK074029〜AK074481, AK074483〜AK075325, AK075326〜AK075566, AK090395〜AK098842, AK122580〜AK129030, AK129488〜AK131107, AK131190〜AK131575, AK160364〜AK160386, AK172724〜AK172740, AK172741〜AK172866)のうちゲノムマッピングに使用可能な30,754配列
・2005年2月3日までに財団法人かずさDNA研究所のデータベースHUGEに登録されていた2039配列(http://www.kazusa.or.jp/huge/)
・2005年1月30日までにMammalian Gene Collection (http://mgc.nci.nih.gov/) のWebページのFull Length Clone Listに記載され、かつGenBenk gbpri (ftp://ftp.ncbi.nih.gov/genbank/) に含まれていたヒト全長cDNA 20,878配列
・2005年1月30日までのGenBenk gbpriにDeutsches Krebsforschungszentrum (DKFZ)として登録のあったヒト全長cDNA 9,280配列
・2005年1月31日版のヒトRefSeq配列(http://www.ncbi.nlm.nih.gov/RefSeq/)の構成配列でmRNAとして登録され、かつGenBenk gbpri に含まれていたヒト全長cDNA 13,984配列
・2005年1月31日版のヒトRefSeq配列(http://www.ncbi.nlm.nih.gov/RefSeq/)28,931配列
・2005年2月10日のEnsembl(http://www.ensembl.org/)のヒトゲノムアセンブル配列(NCBI35.nov_26.35)のうち、UCSC(University of California, Santa Cruz, http://www.genome.ucsc.edu/)にてhg 17ヒトゲノムへマッピング済みであった NCBI35.nov_26.35の33,666配列
・我々のプロジェクトにおいて配列解析を行ったヒトcDNA 5'末端配列 1,456,213配列、及び 3'末端配列 109,283配列 (うち公開済み配列アクセッション番号:AU116788〜AU160826, AU279383〜AU280837, DA000001〜DA999999, DB000001〜DB384947)
Example 2: Genome mapping and clustering (1) Sequence data set The following sequences were used as a data set.
-Human genome sequence: UCSC hg 17 (NCBI Build 35) (http://www.genome.ucsc.edu/)
・ Human full-length cDNA sequence that we newly acquired and performed full-length cDNA sequence analysis 19,265 sequence ・ Human full-length cDNA sequence that we acquired and performed full-length cDNA sequence analysis and registered in existing public databases (DDBJ / GenBank / EMBL) ( Accession numbers: AB038269, AB045981, AB056476, AB056477, AK000001 to AK002212, AK021413 to AK027260, AK027263 to AK027902, AK054561 to AK058202, AK074029 to AK074481, AK074483 to AK075325, AK075326 to AK075 368 AK131107, AK131190 to AK131575, AK160364 to AK160386, AK172724 to AK172740, AK172741 to AK172866), which can be used for genome mapping 30,754 sequences. 2039 sequences (http://www.kazusa.or.jp/huge/)
・ It will be listed in the Full Length Clone List on the Mammalian Gene Collection (http://mgc.nci.nih.gov/) web page by January 30, 2005, and GenBenk gbpri (ftp: //ftp.ncbi. nih.gov/genbank/) Human full-length cDNA 20,878 sequence ・ Human full-length cDNA 9,280 sequence registered as Deutsches Krebsforschungszentrum (DKFZ) in GenBenk gbpri until January 30, 2005 ・ January 31, 2005 Human full-length cDNA 13,984 sequence that was registered as mRNA and included in GenBenk gbpri with the sequence of the Japanese version of human RefSeq sequence (http://www.ncbi.nlm.nih.gov/RefSeq/) The 31st version of the human RefSeq sequence (http://www.ncbi.nlm.nih.gov/RefSeq/) 28,931 sequence of the February 10, 2005 Ensembl (http://www.ensembl.org/) Of the human genome assembly sequence (NCBI35.nov_26.35), NCBI35.nov_26. Which had been mapped to the hg 17 human genome at UCSC (University of California, Santa Cruz, http://www.genome.ucsc.edu/). 35 33,666 sequences Sequence analysis in human cDNA 5 'terminal sequence 1,456,213 sequence and 3' terminal sequence 109,283 sequence (including published sequence accession numbers: AU116788 to AU160826, AU279383 to AU280837, DA000001 to DA999999, DB000001 to DB384947)

(2)ゲノムマッピング
上記データセットをBLASTN(ftp://ftp.ncbi.nih.gov/blast/)を用いて相同性(Identity) 95%以上、コンセンサス長50塩基対(bp)以上の条件下でゲノムマッピングを行った。マッピングに使用したデータセットの約99%の配列がゲノムマッピングできた。
(2) Genome mapping Using the above data set using BLASTN (ftp://ftp.ncbi.nih.gov/blast/), the homology (Identity) is 95% or more and the consensus length is 50 base pairs (bp) or more. Genome mapping was performed. Approximately 99% of the sequences used in the mapping were genome mapped.

(3)クラスタリング
ゲノムマッピング後、ゲノム領域に含まれる配列群を1つの固まりとしてクラスターを形成させた。つまり、各クラスターは、配列群の各ゲノム領域の両端の外側が各ゲノム領域にマップされた配列に重なりがなくなるように選択されたものである。その結果、全部で 87,173クラスター存在した。そこから我々のプロジェクトにおいて取得し配列解析を行ったヒトcDNA 3'末端配列のみによって構成される17,535クラスターを除外すると、69,638クラスターとなった。このうち、36,782クラスターは、我々のプロジェクトにおいて取得し配列解析を行ったヒトcDNA 5'末端配列のみによって構成されていたので除外した(全長cDNA、RefSeq、Ensembl配列が存在しないものは除外した)。この結果、全長cDNA、RefSeq、Ensembl配列を1つでも含むクラスターは、32,856クラスターであった。そのうち一定水準以上の信頼性のあるORF(open reading frame, 翻訳領域)が予測される全長cDNA、RefSeq、Ensembl配列を1本以上含むクラスターを選択することにより、21,703クラスターを取得した。この21,703クラスターについて発現特異性判別を行った。
(3) Clustering After genome mapping, clusters were formed with a group of sequences contained in the genomic region as one cluster. That is, each cluster is selected so that there is no overlap between the sequences mapped to each genomic region on the outer sides of each genomic region of the sequence group. As a result, a total of 87,173 clusters existed. Excluding the 17,535 clusters that consisted of only the 3 'terminal sequence of human cDNA obtained and sequence-analyzed in our project, there were 69,638 clusters. Of these, the 36,782 cluster was excluded because it consisted only of the 5 'terminal sequence of human cDNA obtained and sequenced in our project (excluded are those that do not have full-length cDNA, RefSeq, or Ensembl sequences). As a result, 32,856 clusters contained at least one full-length cDNA, RefSeq, and Ensembl sequence. Among them, 21,703 clusters were obtained by selecting clusters containing one or more full-length cDNAs, RefSeq, and Ensembl sequences that are predicted to have a certain level of reliable ORF (open reading frame, translation region). The expression specificity of these 21,703 clusters was determined.

実施例3:リアルタイムPCRの実験方法
(1)鋳型 (Template) cDNAの合成
1)ヒトmRNA(Human Total RNA)を鋳型に用いた場合
Human Total RNA 50μgに対して150μlの系にて反応を行った。
87μlのH2Oに溶解した50μg のTotal RNAに10μlのランダムプライマー (濃度65ng/μl)と7.5μlのdNTP Mix (濃度10mM each dNTP Mix)を加えた。65℃ 5分インキュベート、氷上で1分インキュベートした。30μlの5×反応緩衝液 (Invitrogen SuperScript III RTキットに添付)と7.5μlの0.1M DTTと3μlのRNase Inhibitor(STRATAGENE)と5μlのSuperScript III RT(Invitrogen)を加えた。25℃ 5分インキュベート、50℃ 60分インキュベート、70℃ 15分インキュベートした。反応後、フェノール・クロロホルム抽出を行い、酵素を失活させた。3μlのEDTA (0.5M)と22.5μlの0.1N NaOHを加えることでアルカリ処理を行い、RNAの分解を行った。30μlのTris (1M pH 7.8)を加えて、反応液を中和した後、エタノール沈殿を行い、100μlのTE緩衝液に溶解した。
mRNAソースからのヒトmRNA(Human Total RNA)については、実施例1に記載した方法により取得した。
実験に使用したヒトmRNAのリストを表2に示した。
Example 3: Experimental method for real-time PCR (1) Template Synthesis of cDNA 1) When human mRNA (Human Total RNA) is used as a template
The reaction was performed in a system of 150 μl against 50 μg of human total RNA.
10 μl random primer (concentration 65 ng / μl) and 7.5 μl dNTP Mix (concentration 10 mM each dNTP mix) were added to 50 μg total RNA dissolved in 87 μl H 2 O. Incubated at 65 ° C. for 5 minutes and incubated on ice for 1 minute. 30 μl of 5 × reaction buffer (attached to Invitrogen SuperScript III RT kit), 7.5 μl of 0.1 M DTT, 3 μl of RNase Inhibitor (STRATAGENE) and 5 μl of SuperScript III RT (Invitrogen) were added. Incubated at 25 ° C for 5 minutes, incubated at 50 ° C for 60 minutes, and incubated at 70 ° C for 15 minutes. After the reaction, phenol / chloroform extraction was performed to inactivate the enzyme. RNA was degraded by adding 3 μl of EDTA (0.5M) and 22.5 μl of 0.1N NaOH to perform alkali treatment. 30 μl of Tris (1M pH 7.8) was added to neutralize the reaction solution, followed by ethanol precipitation and dissolution in 100 μl of TE buffer.
Human mRNA (Human Total RNA) from an mRNA source was obtained by the method described in Example 1.
A list of human mRNAs used in the experiments is shown in Table 2.

Figure 2008114709
Figure 2008114709

(2)プライマー(Primer)とプローブ(Probe)の設計
Applied Biosystems社のリアルタイムPCR 7500 Fastに付属されているPrimer設計ソフト Primer Express software 3.0を用いて、ソフトが推奨する条件内で比較検討したいcDNAと同じ染色体領域から転写されるほかのスプライスパターンをもつcDNAを個別に検出できるように、変化領域の境界となる部分の配列を用いて、Primer, Probeの設計を行った。また、それらの設計したPrimerを用いて、リアルタイムPCRを行い、それらのバンドが単一であり、1種類のcDNAのみを特異的に検出できることについては、確認を行った。
(2) Primer and probe design
CDNA with other splice patterns transcribed from the same chromosomal region as the cDNA you want to compare using Primer Design software Primer Express software 3.0 included with Applied Biosystems real-time PCR 7500 Fast Primer and Probe were designed using the sequence of the part that becomes the boundary of the change region. Moreover, real-time PCR was performed using those designed primers, and it was confirmed that these bands were single and that only one kind of cDNA could be specifically detected.

(3)リアルタイムPCRを用いた発現解析
1)使用したmRNA
使用したmRNAは全てヒト由来である。
12の実験系のうちクラスターchr7+1084、chr7-1842、chr7+710、chr2+1780、chr3+1925、chr11+275、chr1+3150、chr7-669、chr6-1987、chr12+613、chr4-770、の11クラスターの実験ではリアルタイムPCRの反応系としてSYBR GREENを用い、テンプレートcDNAとして、骨髄 (Bone Marrow)、胸腺 (Thymus)、脾臓 (Spleen)、CD34+細胞(CD34+)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導3日間(CD34+ ODF 3days)、CD34+細胞を破骨細胞分化因子(ODF) 処理誘導6日間 (CD34+ ODF 6days)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導9日間 (CD34+ ODF 9days)、滑膜 (Synovial)、Jurkat細胞(Jurkat)、脊髄 (Spinal Cord)、脳 (Brain, whole)、内臓組織混合物 (Mix, viscus tissues) [心臓 (Heart)、腎臓 (Kidney)、肝臓 (Liver)、肺 (Lung)、結腸 (Colon)、胃(Stomach)]計12種のサンプルを用いた実験を行った。
12の実験系のうちクラスターchr5+2320の1クラスターの実験ではリアルタイムPCRの反応系としてApplied Biosystems社製の TaqManを用い、テンプレートcDNAとして、骨髄 (Bone Marrow)、胸腺 (Thymus)、脾臓 (Spleen)、CD34+細胞(CD34+)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導3日間 (CD34+ ODF 3days)、 CD34+細胞を破骨細胞分化因子(ODF) 処理誘導6日間 (CD34+ ODF 6days)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導9日間 (CD34+ ODF 9days)、滑膜 (Synovial)、Jurkat細胞(Jurkat)、脊髄 (Spinal Cord)、脳 (Brain, whole)、内臓組織混合物 (Mix, viscus tissues) [心臓 (Heart)、腎臓 (Kidney)、肝臓 (Liver)、肺 (Lung)、結腸 (Colon)、胃 (Stomach)]計12種のサンプルを用いた実験を行った。
(3) Expression analysis using real-time PCR 1) mRNA used
All the mRNAs used are of human origin.
Among 12 experimental systems, cluster chr7 + 1084, chr7-1842, chr7 + 710, chr2 + 1780, chr3 + 1925, chr11 + 275, chr1 + 3150, chr7-669, chr6-1987, chr12 + 613, chr4-770 In 11-cluster experiments, SYBR GREEN was used as the reaction system for real-time PCR, and bone marrow (Bone Marrow), thymus (Thymus), spleen (Spleen), CD34 + cells (CD34 +), and CD34 + cells were osteoclasts as template cDNAs. Differentiation factor (ODF) treatment induction 3 days (CD34 + ODF 3days), CD34 + cells induced osteoclast differentiation factor (ODF) treatment 6 days (CD34 + ODF 6days), CD34 + cells induced osteoclast differentiation factor (ODF) treatment 9 Days (CD34 + ODF 9days), synovial (Synovial), Jurkat cells (Jurkat), spinal cord, brain (Brain, whole), visceral tissue mixture (Mix, viscus tissues) [heart, kidney (Kidney ), Liver (Lung), lung (Colon), stomach (Stomach)], a total of 12 samples were used.
Of the 12 experimental systems, one cluster chr5 + 2320 experiment uses TaqMan (Applied Biosystems) as the reaction system for real-time PCR, and the bone marrow (Bone Marrow), thymus (Thymus), and spleen (Spleen) are used as template cDNAs. , CD34 + cells (CD34 +), CD34 + cells treated with osteoclast differentiation factor (ODF) 3 days (CD34 + ODF 3 days), CD34 + cells treated with osteoclast differentiation factor (ODF) 6 days (CD34 + ODF 6days), CD34 + Induction of osteoclast differentiation factor (ODF) treatment for 9 days (CD34 + ODF 9 days), synovial (Synovial), Jurkat cells (Jurkat), spinal cord (Binal, whole), visceral tissue mixture (Mix , viscus tissues) [Heart, Kidney, Liver, Lung, Colon, Stomach] A total of 12 samples were used.

2)SYBR GREENを用いた場合の反応系
SYBR GREEN I DyeアッセイケミストリーはSYBR GREENが2本鎖DNAに結合することで強い蛍光を発する特徴を利用した実験系である。PCR反応時、DNAが一本鎖に変性する際SYBR GREENはDNAから遊離し蛍光は急激に減少するが、その後のアニーリング・伸張反応に伴い2本鎖DNAに結合し再び蛍光を発する。SYBR GREEN I DyeアッセイケミストリーではPCRサイクル毎に増加する蛍光強度を検出するものである。
鋳型としてそれぞれの組織由来のcDNA 0.2μl (Total RNAに換算して 100ng相当)に、Forward Primer (最終濃度250nM)、Reverse Primer (最終濃度250nM)、SYBR Green PCR Master Mix (ABI 4309155) を加えて全量を20μlにした。内在性コントロールとして常に全てのテンプレートにGAPDH (Accession No; NM_002046.2) を反応コントロールとしておいた。
Applied Biosystems社のリアルタイムPCR 7500 Fastの標準プロトコールである以下の条件でPCRを行った。初期ステップ 50℃ 2分, 95℃ 10分後、変性95℃ 15秒、アニール伸長60℃ 1分を40サイクル繰り返した。
GAPDH-F (配列番号5) :内在性コントロールGAPDHのForward Primer
GAPDH-R (配列番号6) :内在性コントロールGAPDHのReverse Primer
2) Reaction system using SYBR GREEN
The SYBR GREEN I Dye assay chemistry is an experimental system that utilizes the feature of strong fluorescence when SYBR GREEN binds to double-stranded DNA. During the PCR reaction, when the DNA is denatured into single strands, SYBR GREEN is released from the DNA and the fluorescence decreases rapidly. The SYBR GREEN I Dye assay chemistry detects fluorescence intensity that increases with each PCR cycle.
As a template, add Forward Primer (final concentration 250 nM), Reverse Primer (final concentration 250 nM), and SYBR Green PCR Master Mix (ABI 4309155) to 0.2 μl of cDNA from each tissue (equivalent to 100 ng in terms of total RNA) as a template. The total volume was 20 μl. As an endogenous control, GAPDH (Accession No; NM_002046.2) was always used as a reaction control for all templates.
PCR was performed under the following conditions, which are standard protocols for real-time PCR 7500 Fast from Applied Biosystems. Initial step 50 ° C. for 2 minutes, 95 ° C. for 10 minutes, denaturation at 95 ° C. for 15 seconds, and annealing extension at 60 ° C. for 1 minute were repeated 40 cycles.
GAPDH-F (SEQ ID NO: 5): Forward Primer of endogenous control GAPDH
GAPDH-R (SEQ ID NO: 6): Reverse Primer of endogenous control GAPDH

3)TaqManを用いた場合の反応系
TaqManアッセイケミストリーは、3’末端をリン酸化したプローブの5’末端にFluorescenin系の蛍光色素(リポーター)、3’末端にRhodamine系の蛍光色素(クエンチャー)をラベルしたTaqManプローブを用いる実験系である。TaqManプローブは単体で存在する際にはリポーターの励起光を照射しても蛍光波長がクエンチャーと近似している為、リポーターの蛍光エネルギーがクエンチャーの励起エネルギーとして使用され、リポーターの蛍光が抑制される。しかし、PCR反応時プライマーよりの伸張反応中、TaqManプローブがDNAポリメラーゼの5’-3’エキソヌクレアーゼ活性により分解されると、リポーター蛍光色素がTaqManプローブの5’末端より遊離し、クエンチャー蛍光色素と距離が離れる事で蛍光を発する。TaqManアッセイケミストリーでは、PCRサイクル毎に増加するリポーターの発する蛍光強度を検出するものである。
鋳型としてそれぞれの組織由来のcDNA 0.2μl (Total RNAに換算して 100ng相当)に、Forward Primer (最終濃度900nM)、Reverse Primer (最終濃度900nM)、TaqMan Probe (最終濃度250nM)、TaqMan Fast Universal PCR Master Mix (ABI 466073) を加えて全量を20μlにした。内在性コントロールとして常に全てのテンプレートにGAPDHの反応コントロールをおいた。
Applied Biosystems社のリアルタイムPCR 7500 FastのFastプロトコールである以下の条件でPCRを行った。酵素Activation 95℃ 20秒後、変性95℃ 3秒、アニール伸長60℃ 30秒を40サイクル繰り返した。
GAPDH-Probe (配列番号7) :内在性コントロールGAPDHのTaqMan Probe
3) Reaction system using TaqMan
TaqMan assay chemistry is an experimental system that uses a TaqMan probe labeled with a fluorescent dye (reporter) at the 5 'end and a Rhodamine fluorescent dye (quencher) at the 3' end. is there. When TaqMan probe is present alone, the fluorescence wavelength of the TaqMan probe is close to that of the quencher even if it is irradiated with the excitation light of the reporter. Is done. However, if the TaqMan probe is degraded by the 5'-3 'exonuclease activity of the DNA polymerase during the extension reaction from the primer during the PCR reaction, the reporter fluorescent dye is released from the 5' end of the TaqMan probe, and the quencher fluorescent dye And emits fluorescence when the distance increases. TaqMan assay chemistry detects the intensity of the fluorescence emitted by a reporter that increases with each PCR cycle.
As a template, 0.2μl of cDNA derived from each tissue (equivalent to 100 ng in terms of total RNA), Forward Primer (final concentration 900 nM), Reverse Primer (final concentration 900 nM), TaqMan Probe (final concentration 250 nM), TaqMan Fast Universal PCR Master Mix (ABI 466073) was added to make a total volume of 20 μl. As an endogenous control, GAPDH reaction control was always applied to all templates.
PCR was performed under the following conditions, which is the Fast protocol of Applied Biosystems Real-time PCR 7500 Fast. After 20 seconds of enzyme activation at 95 ° C., 40 cycles of denaturation at 95 ° C. for 3 seconds and annealing extension at 60 ° C. for 30 seconds were repeated.
GAPDH-Probe (SEQ ID NO: 7): TaqMan Probe of endogenous control GAPDH

(4)データの統計解析方法
相対定量方法を用いて結果を解析した。
Applied Biosystems社のリアルタイムPCR 7500 FastのRQ studyソフトを用いて、増幅曲線の指数関数的増幅領域に閾値(Threshold)を設定。その時のサイクル数をCt (Threshold cycle) とした。初期RNA量を補正するために、得られたCtから内在性コントロールであるGAPDHのCtを引いた値を算出、それをdCtとした。[dCt = Target Ct - ENDOGENUS Ct (GAPDH)] 得られたdCtからさらに基準となるサンプル (コントロール)のdCtを引いた値を算出、それをddCtとした。[ddCt = Target dCt - Control dCt]その値をもとに、相対値を算出、それをRQとした。[RQ = 2 -ddCt]その結果をもとに、ログ系でグラフを作製、それぞれのPrimer, Probeでの増幅量つまり発現量を比較した。
各実施例において、RQ及びLog10RQの解析結果を示した。RQの数値は小数点1桁で表示した。リアルタイムPCRで検出出来なかったものについては、RQ数値及びLog10RQの数値のところに”Undet.”と記載した。Log10RQの数値は小数点2桁で表示した。ただし、コントロールの正常内臓組織を混合させたサンプル(Mix, viscus tissues)(RQ数値“1.0”)については、Log10RQ の数値のところに“0.0”と記載した(実施例9のみ全脳(Brain, whole)をコントロールとして使用)。
(4) Statistical analysis method of data The results were analyzed using a relative quantification method.
Threshold is set in the exponential amplification region of the amplification curve using Applied Biosystems real-time PCR 7500 Fast RQ study software. The number of cycles at that time was Ct (Threshold cycle). In order to correct the initial RNA amount, a value obtained by subtracting Ct of GAPDH, which is an endogenous control, from the obtained Ct was calculated, and this was defined as dCt. [dCt = Target Ct−ENDOGENUS Ct (GAPDH)] A value obtained by subtracting the dCt of the reference sample (control) from the obtained dCt was calculated, and this was taken as ddCt. [ddCt = Target dCt-Control dCt] Based on this value, a relative value was calculated and used as RQ. [RQ = 2 -ddCt ] Based on the results, graphs were created in the log system, and the amount of amplification, that is, the amount of expression in each Primer and Probe was compared.
In each example, analysis results of RQ and Log 10 RQ are shown. The numerical value of RQ is displayed with one decimal point. Those that could not be detected by real-time PCR were described as “Undet.” In the RQ value and Log 10 RQ values. Log 10 RQ values are displayed with two decimal places. However, the sample (Mix, viscus tissues) (RQ numerical value “1.0”) mixed with the normal visceral tissue of the control was described as “0.0” in the numerical value of Log 10 RQ (only brain of Example 9 ( Brain, whole) are used as controls).

実施例4:クラスターchr7-669(データセット:047)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr7-669 (Human genome UCSC hg18 (NCBI Build34) 染色体7番、115,150,000 bp〜115,400,000 bp) にゲノムマッピングされた8配列の全長cDNA [D-SYNOV4003692.1, AL110232.1, BC029891.1, BX538223.1, D43945.1, ENST00000265440, ENST00000320239, NM_012252.1] について解析を行った。それらは、発現パターンの違いにより4種類に分類されるが、転写開始点に注目すると主なものとして以下の2種類が存在した。
[1] D-SYNOV4003692.1
[2] D43945.1, ENST00000265440, NM_012252.1
[1]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[2]とORFが異なっていた。
[1]は、既知の[2]よりも上流にある染色体領域より発現するため、ORF領域が異なっていた。
[1]〜[2]の2種類のcDNAパターンがもつORF領域は、同じ染色体領域より、異なる転写開始点から発現を行うことにより、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 4: Cluster chr7-669 (Data set: 047)
(1) Cluster analysis 1) Cluster characteristics Cluster full-length cDNA of chr7-669 (Human genome UCSC hg18 (NCBI Build34) chromosome 7, 115,150,000 bp to 115,400,000 bp) [D-SYNOV4003692.1 , AL110232.1, BC029891.1, BX538223.1, D43945.1, ENST00000265440, ENST00000320239, NM_012252.1] were analyzed. They are classified into four types according to the difference in expression pattern, but the following two types existed mainly when focusing on the transcription start point.
[1] D-SYNOV4003692.1
[2] D43945.1, ENST00000265440, NM_012252.1
[1] is a cDNA we newly acquired and performed full-length cDNA sequence analysis, and the ORF was different from [2] registered in the existing public DB.
Since [1] is expressed from a chromosomal region upstream of the known [2], the ORF region was different.
The ORF regions of the two types of cDNA patterns [1] to [2] are expressed from the same chromosomal region from different transcription start sites, resulting in changes in amino acid sequences, resulting in diverse proteins and mRNAs. I found out that it was.

2)我々が新たに取得し全長cDNA配列解析を行ったD-SYNOV4003692.1([1])の特徴
047_[1]_1-N0 (配列番号8) : D-SYNOV4003692.1の核酸配列全領域
047_[1]_1-NA0 (配列番号9) : D-SYNOV4003692.1の核酸配列全領域とアミノ酸配列の併記
047_[1]_1-A0 (配列番号10) : D-SYNOV4003692.1のアミノ配列全領域
D-SYNOV4003692.1の1〜373塩基 (配列番号11) は、既存の公共DBに登録されているコントロールとなるNM_012252.1では存在しないエクソンが挿入するバリアントでNM_012252.1と相同性がない。この挿入するエクソン上に翻訳開始点と存在する為、NM_012252.1と比較するとN末端のアミノ酸が90残基 (配列番号12) 異なっていた。
また、D-SYNOV4003692.1の1,110〜1,245塩基 (配列番号15) は既存の公共DBに登録されているコントロールとなるNM_012252.1では存在しないエクソンが挿入するバリアントでNM_012252.1と相同性がない。この挿入するエクソン上に翻訳終止点と存在する為、NM_012252.1と比較するとC末端のアミノ酸が5残基 (配列番号16) 異なっていた。
047_[1]_1-N1 (配列番号11) : D-SYNOV4003692.1の373塩基の挿入核酸配列領域
047_[1]_1-A1 (配列番号12) : D-SYNOV4003692.1の90残基の挿入アミノ配列領域
047_[1]_1-N2 (配列番号13) : D-SYNOV4003692.1の373塩基の挿入領域中のORF核酸配列領域
047_[1]_1-A2 (配列番号14) : D-SYNOV4003692.1の373塩基の挿入領域に関わるORFアミノ酸領域
047_[1]_1-N3 (配列番号15) : D-SYNOV4003692.1の136塩基の挿入核酸配列領域
047_[1]_1-A3 (配列番号16) : D-SYNOV4003692.1の5残基の挿入アミノ配列領域
047_[1]_1-N4 (配列番号17) : D-SYNOV4003692.1の136塩基の挿入領域中のORF核酸配列領域
047_[1]_1-A4 (配列番号16と同一) : D-SYNOV4003692.1の136塩基の挿入領域に関わるORFアミノ酸領域
2) Features of D-SYNOV4003692.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
047_ [1] _1-N0 (SEQ ID NO: 8): D-SYNOV4003692.1 whole region of nucleic acid sequence
047_ [1] _1-NA0 (SEQ ID NO: 9): Combination of D-SYNOV4003692.1 entire region and amino acid sequence
047_ [1] _1-A0 (SEQ ID NO: 10): D-SYNOV4003692.1 full amino acid region
1-373 bases (SEQ ID NO: 11) of D-SYNOV4003692.1 are variants inserted by exons that do not exist in NM_012252.1, which is a control registered in the existing public DB, and have no homology with NM_012252.1. Due to the presence of the translation start point on this inserted exon, the N-terminal amino acid was 90 residues (SEQ ID NO: 12) different from NM_012252.1.
In addition, 1,110 to 1,245 bases (SEQ ID NO: 15) of D-SYNOV4003692.1 is a variant inserted by an exon that does not exist in NM_012252.1, which is a control registered in the existing public DB, and has no homology with NM_012252.1 . Due to the presence of a translation termination point on this inserted exon, the C-terminal amino acid was 5 residues (SEQ ID NO: 16) different from NM_012252.1.
047_ [1] _1-N1 (SEQ ID NO: 11): D-SYNOV4003692.1 373-base inserted nucleic acid sequence region
047_ [1] _1-A1 (SEQ ID NO: 12): 90-residue insertion amino acid sequence region of D-SYNOV4003692.1
047_ [1] _1-N2 (SEQ ID NO: 13): ORF nucleic acid sequence region in the 373 base insertion region of D-SYNOV4003692.1
047_ [1] _1-A2 (SEQ ID NO: 14): ORF amino acid region related to 373 base insertion region of D-SYNOV4003692.1
047_ [1] _1-N3 (SEQ ID NO: 15): 136-base inserted nucleic acid sequence region of D-SYNOV4003692.1
047_ [1] _1-A3 (SEQ ID NO: 16): 5-residue insertion amino acid sequence region of D-SYNOV4003692.1
047_ [1] _1-N4 (SEQ ID NO: 17): ORF nucleic acid sequence region in the 136-base insertion region of D-SYNOV4003692.1
047_ [1] _1-A4 (same as SEQ ID NO: 16): ORF amino acid region related to 136-base insertion region of D-SYNOV4003692.1

3)発現特異性解析とリアルタイムPCR用プライマーの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
047_01 - [1]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer047_01F (配列番号18) とPrimer047_01R (配列番号19) によって増幅される断片047_01 (配列番号20)
047_02 - 既存の公共DBに登録されている[2]の転写開始点領域、[1]を比較検討するためのコントロール
→Primer047_02F (配列番号21) とPrimer047_02R (配列番号22) によって増幅される断片047_02 (配列番号23)
047_05 - [1]、[2]が共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターン、さらには既存の公共DBに登録されている[2]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域
→Primer047_05F (配列番号24) とPrimer047_05R (配列番号25) によって増幅される断片047_05 (配列番号26)
上記に示された[1]、[2]のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1]のパターンでは5’末端配列が2配列存在し、その由来は滑膜組織 (Synovial membrane tissue from rheumatioid arthritis) が2配列 (解析母数 27,489)であった。
既存の公共DBに登録されているコントロールとなる [2]のパターンでは5’末端配列が8配列存在し、その由来はCD34+細胞を破骨細胞分化因子 (ODF) 処理誘導9日間(D9OST) が2配列 (解析母数 4,407)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導3日間(D3OST) が1配列 (解析母数 5,092)、正常末梢血単核細胞 (Human peripheral blood mononuclear cells) が1配列 (解析母数 7,900)、膀胱 (Bladder) が1配列 (解析母数 8,431)、胃 (Stomach) が1配列 (解析母数 8,685)、肺 (Lung) が1配列 (解析母数 16,146)、気管(Trachea) が1配列 (解析母数 52,352) であった。
この結果より、[1]の転写開始点は、滑膜組織 (Synovial membrane tissue from rheumatioid arthritis) での発現が多いことがわかった。また、[2]の転写開始点では、様々な組織での発現がみられた。これにより、滑膜組織(Synovial membrane tissue from rheumatioid arthritis) とそれ以外の組織では、この染色体領域において、転写の機構が異なり、用いられている転写開始点も異なる可能性が考えられた。
3) Expression specificity analysis and real-time PCR primer design In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions were used as detection regions. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
047_01-Specific region existing on the N-terminal side of the cDNA pattern of [1]: This is the transcription start region of the cDNA pattern of [1] that we newly analyzed and registered in the existing public DB Novel region that has not been processed → Fragment 047_01 (SEQ ID NO: 20) amplified by Primer047_01F (SEQ ID NO: 18) and Primer047_01R (SEQ ID NO: 19)
047_02-Control to compare the transcription start point region [2] registered in the existing public DB, [1] → Fragment 047_02 amplified by Primer047_02F (SEQ ID NO: 21) and Primer047_02R (SEQ ID NO: 22) (SEQ ID NO: 23)
047_05-Common region shared by [1] and [2]: [1] cDNA pattern we newly performed full-length cDNA sequence analysis, and [2] cDNA pattern registered in the existing public DB A region where all the patterns that serve as a control are in common to compare the expression level of the whole of the fragment → Fragment 047_05 (SEQ ID NO: 26) amplified by Primer047_05F (SEQ ID NO: 24) and Primer047_05R (SEQ ID NO: 25)
The exon regions specific to each of the cDNA patterns [1] and [2] shown above are mapped and compared to the human genome sequence of approximately 1.44 million 5 'end sequences obtained using the oligocap method. As a result, the following results were obtained.
In the newly analyzed cDNA pattern [1], there are two 5 'end sequences, and the origin is two synovial membrane tissue from rheumatioid arthritis (analysis parameter 27,489). .
In the pattern of [2], which is a control registered in the existing public DB, there are 8 5 'terminal sequences, and the origin is that CD34 + cells are induced by osteoclast differentiation factor (ODF) treatment for 9 days (D9OST). 2 sequences (analysis parameter 4,407), CD34 + cells treated with osteoclast differentiation factor (ODF) treatment for 3 days (D3OST) (analysis parameter 5,092), normal peripheral blood mononuclear cells 1 sequence (analysis parameter 7,900), bladder (Bladder) 1 sequence (analysis parameter 8,431), stomach (Stomach) 1 sequence (analysis parameter 8,685), and lung (Lung) 1 sequence (analysis parameter 16,146) ), Trachea (Trachea) was one sequence (analysis parameter 52,352).
From this result, it was found that the transcription start point of [1] is highly expressed in synovial membrane tissue from rheumatioid arthritis. In addition, at the transcription start point of [2], expression was observed in various tissues. As a result, it was considered that the mechanism of transcription differs between the synovial membrane tissue from rheumatioid arthritis and other tissues, and the transcription start point used may be different in this chromosomal region.

(2)リアルタイムPCRによる発現特異性の解析
血球系組織の中でもどのような組織、どのような状態のときに発現に使われる転写開始点が変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表3に示した。
(2) Analysis of expression specificity by real-time PCR In order to know what kind of tissue in the blood cell system tissue and in what state the transcription start point used for expression changes, details of the expression level are real-time Analyzed by PCR. The results are shown in Table 3.

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳 (Brain, whole) を用いて比較した。
047_01 (配列番号20) と047_02 (配列番号23) で比較される転写開始点の選択性によってmRNAが変わり、その結果としてORFが変化する比率は、以下の組織で大きく変化していた。
骨髄 (Bone Marrow)、CD34+細胞(CD34+)、CD34+細胞を破骨細胞分化因子(ODF) 処理誘導3日間 (CD34+ ODF 3days)、CD34+細胞をODF処理誘導6日間 (CD34+ ODF 6days)、CD34+細胞をODF処理誘導9日間 (CD34+ ODF 9days)及び脊髄(Spinal Cord)では047_02 (配列番号23) で表される下流の既知の転写開始点からの転写物(mRNA)が多いのだが、滑膜 (Synovial) 組織(リューマチ患者)では、047_01 (配列番号20) で表される新たに取得した上流の転写開始点からの転写物(mRNA)が多かった(表3)。
つまり滑膜 (Synovial) 組織(リューマチ患者)では、他の組織とは異なり転写因子もしくは、転写機構によって転写開始点に多様性があることで、ORF領域の異なるmRNAが発現していた。
これらの結果より、047_01 (配列番号20) という検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)047_[1]_1-N1 (配列番号11) の発現を比較することにより、リューマチ患者の滑膜 (Synovial) 組織に特異的な治療・診断マーカーとして利用することが可能であることが立証された。また、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についてもリューマチ患者の滑膜 (Synovial) 組織に特異的な治療・診断マーカーとして有用であると思われる。
[1]のcDNAパターンのD-SYNOV4003692.1においてPrimer047_01R (配列番号19) がプライミングする361〜380塩基目を含む上流配列047_[1]_1-N5 (配列番号27)。
[1]のcDNAパターンにおいてPrimer047_01F (配列番号18) とPrimer047_01R (配列番号19) によって増幅される領域047_01 (配列番号20)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As experimental controls, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
Depending on the selectivity of the transcription start site compared between 047_01 (SEQ ID NO: 20) and 047_02 (SEQ ID NO: 23), the mRNA was changed, and as a result, the rate at which the ORF changed greatly changed in the following tissues.
Bone Marrow, CD34 + cells (CD34 +), CD34 + cells treated with osteoclast differentiation factor (ODF) 3 days induction (CD34 + ODF 3days), CD34 + cells induced ODF treatment 6 days (CD34 + ODF 6days), CD34 + cells In the ODF treatment induction 9 days (CD34 + ODF 9days) and the spinal cord, there are many transcripts (mRNA) from the known downstream transcription start point represented by 047_02 (SEQ ID NO: 23), but the synovial (Synovial ) In tissues (rheumatic patients), there were many transcripts (mRNA) from the newly acquired upstream transcription start point represented by 047_01 (SEQ ID NO: 20) (Table 3).
In other words, in synovial tissues (rheumatoid patients), unlike other tissues, transcription factors or transcription mechanisms have a variety of transcription start points, and mRNAs with different ORF regions were expressed.
From these results, the 5′-terminal region of the newly obtained cDNA region indicated by the detection region 047_01 (SEQ ID NO: 20) (region near the transcription start point) 047_ [1] _1-N1 (SEQ ID NO: 11) By comparing the expression, it was proved that it can be used as a therapeutic / diagnostic marker specific to the synovial tissue of rheumatic patients. It is also possible to develop new drugs using compounds, antibodies, siRNA, etc. that target specific regions.
The following areas may also be useful as therapeutic / diagnostic markers specific to the synovial tissue of rheumatic patients.
The upstream sequence 047_ [1] _1-N5 (SEQ ID NO: 27) containing the 361th to 380th bases primed by Primer047_01R (SEQ ID NO: 19) in D-SYNOV4003692.1 of the cDNA pattern of [1].
Region 047_01 (SEQ ID NO: 20) amplified by Primer047_01F (SEQ ID NO: 18) and Primer047_01R (SEQ ID NO: 19) in the cDNA pattern of [1]

実施例5:クラスターchr7-1842(データセット:002)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr7-1842 (Human genome UCSC hg18 (NCBI Build34) 染色体7番、36,325,000 bp〜36,550,000 bp) にゲノムマッピングされた6配列の全長cDNA [D-D3OST2001534.1, D-NETRP1000046.1, BC025698.1, ENST00000258749, M62840.1, NM_001637.1] について解析を行った。それらは、発現パターンの違いにより以下のように3種類に分類できた。
[1] D-D3OST2001534.1
[2] D-NETRP1000046.1
[3] BC025698.1, ENST00000258749, M62840.1, NM_001637.1
[1]、[2]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DB(DDBJ / Genbank / EMBL) に登録されていた[3]とORFが異なっていた。
[1]は、既知の[3]と同じ転写開始点、翻訳開始点をもつが、[3]の第2エクソンに相当する領域が欠失しているため、ORF領域が異なっていた。
[2]は、[1]、[3]よりも下流にある染色体領域より発現し、相同性のないエクソン上に翻訳開始点をもつため、ORF領域が異なっていた。
[1]〜[3]の3種類のcDNAパターンがもつORF領域は、同じ染色体領域より、エクソンが欠失することや、異なる転写開始点から発現を行うことにより、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 5: Cluster chr7-1842 (Data set: 002)
(1) Cluster analysis
1) Cluster characteristics Six full-length cDNA genome-mapped on cluster chr7-1842 (Human genome UCSC hg18 (NCBI Build34) chromosome 7, 36,325,000 bp to 36,550,000 bp) [D-D3OST2001534.1, D-NETRP1000046.1 , BC025698.1, ENST00000258749, M62840.1, NM_001637.1]. They could be classified into three types according to the difference in expression pattern as follows.
[1] D-D3OST2001534.1
[2] D-NETRP1000046.1
[3] BC025698.1, ENST00000258749, M62840.1, NM_001637.1
[1] and [2] are cDNAs we newly acquired and subjected to full-length cDNA sequence analysis, and the ORF is different from [3] registered in the existing public DB (DDBJ / Genbank / EMBL). It was.
[1] has the same transcription start point and translation start point as known [3], but the ORF region was different because the region corresponding to the second exon of [3] was deleted.
[2] was expressed from a chromosomal region downstream of [1] and [3] and had a translation initiation point on a non-homologous exon, so the ORF region was different.
The ORF regions of the three types of cDNA patterns [1] to [3] vary in amino acid sequence due to deletion of exons from the same chromosomal region or expression from different transcription start sites, resulting in diverse It turned out that protein and mRNA with the nature were produced.

2)我々が新たに取得し全長cDNA配列解析を行ったD-D3OST2001534.1([1])の特徴
002_[1]_1-N0 (配列番号28) : D-D3OST2001534.1の核酸配列全領域
002_[1]_1-NA0 (配列番号29) : D-D3OST2001534.1の核酸配列全領域とアミノ酸配列の併記
002_[1]_1-A0 (配列番号30) : D-D3OST2001534.1のアミノ配列全領域
既存の公共DBに登録されているコントロールとなるNM_001637.1の402〜497塩基に存在する96塩基のエクソン (配列番号33) がD-D3OST2001534.1の414〜415塩基の領域には存在せず欠失している。その為、NM_001637.1と比較するとアミノ酸長が32残基短くなっていた。
002_[1]_1-N1 (配列番号31) : D-D3OST2001534.1の欠失核酸配列領域
002_[1]_1-A1 (配列番号32) : D-D3OST2001534.1の変化しているアミノ配列領域
002_[1]_1-N2 (配列番号31と同一) : D-D3OST2001534.1の欠失領域中のORF核酸配列領域
002_[1]_1-A2 (配列番号32と同一) : D-D3OST2001534.1の欠失領域に関わるORFアミノ酸領域
002_[1]_C-N1 (配列番号33) : D-D3OST2001534.1の414〜415塩基の領域に挿入されるNM_001637.1の402〜497塩基に存在する96塩基の挿入核酸配列
002_[1]_C-A1 (配列番号34) : D-D3OST2001534.1の414〜415塩基の領域に挿入されるNM_001637.1の402〜497塩基に存在する96塩基の挿入核酸配列に関わるアミノ酸領域。
2) Features of D-D3OST2001534.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
002_ [1] _1-N0 (SEQ ID NO: 28): D-D3OST2001534.1 whole region of nucleic acid sequence
002_ [1] _1-NA0 (SEQ ID NO: 29): Combination of D-D3OST2001534.1 full-length nucleic acid sequence and amino acid sequence
002_ [1] _1-A0 (SEQ ID NO: 30): All amino acid region of D-D3OST2001534.1 96 base exon existing in 402 to 497 bases of NM_001637.1 as a control registered in existing public DB (SEQ ID NO: 33) is not present in the region of 414 to 415 bases of D-D3OST2001534.1 and is deleted. Therefore, the amino acid length was 32 residues shorter than NM_001637.1.
002_ [1] _1-N1 (SEQ ID NO: 31): D-D3OST2001534.1 deleted nucleic acid sequence region
002_ [1] _1-A1 (SEQ ID NO: 32): D-D3OST2001534.1 changing amino sequence region
002_ [1] _1-N2 (same as SEQ ID NO: 31): ORF nucleic acid sequence region in the deleted region of D-D3OST2001534.1
002_ [1] _1-A2 (same as SEQ ID NO: 32): ORF amino acid region related to the deletion region of D-D3OST2001534.1
002_ [1] _C-N1 (SEQ ID NO: 33): 96-base inserted nucleic acid sequence present in 402-497 bases of NM_001637.1 inserted in the region of 414-415 bases of D-D3OST2001534.1
002_ [1] _C-A1 (SEQ ID NO: 34): Amino acid region related to the 96-base inserted nucleic acid sequence present in 402-497 bases of NM_001637.1 to be inserted into the 414-415 base region of D-D3OST2001534.1 .

3)我々が新たに取得し全長cDNA配列解析を行ったD-NETRP1000046.1([2])の特徴
002_[2]_1-N0 (配列番号35) : D-NETRP1000046.1の核酸配列全領域
002_[2]_1-NA0 (配列番号36) : D-NETRP1000046.1の核酸配列全領域とアミノ酸配列の併記
002_[2]_1-A0 (配列番号37) : D-NETRP1000046.1のアミノ配列全領域
D-NETRP1000046.1の1〜67塩基 (配列番号38) は、既存の公共DBに登録されているコントロールとなるNM_001637.1では存在しないエクソンでありNM_001637.1と相同性がない。このエクソン上に翻訳開始点が存在する為、N末端側のアミノ酸が4残基 (配列番号39) 変化していた。
002_[2]_1-N1 (配列番号38) : D-NETRP1000046.1の67塩基の挿入核酸配列領域
002_[2]_1-A1 (配列番号39) : D-NETRP1000046.1の4残基の挿入アミノ配列領域
002_[2]_1-N2 (配列番号40) : D-NETRP1000046.1の67塩基の挿入領域中のORF核酸配列領域
002_[2]_1-A2 (配列番号39と同一) : D-NETRP1000046.1の67塩基の挿入領域中のORFアミノ酸配列領域
この変化に伴いSignalP (http://www.cbs.dtu.dk/services/SignalP/) 及びPSORT (http://psort.nibb.ac.jp/) でNM_001637.1の1〜22アミノ酸目に存在すると予測されたN末端分泌シグナル配列は消失していた。
3) Features of D-NETRP1000046.1 ([2]) that we newly acquired and performed full-length cDNA sequence analysis
002_ [2] _1-N0 (SEQ ID NO: 35): D-NETRP1000046.1 whole region of nucleic acid sequence
002_ [2] _1-NA0 (SEQ ID NO: 36): Combination of the entire nucleic acid sequence and amino acid sequence of D-NETRP1000046.1
002_ [2] _1-A0 (SEQ ID NO: 37): D-NETRP1000046.1 full amino acid region
1-67 bases (SEQ ID NO: 38) of D-NETRP1000046.1 are exons that do not exist in NM_001637.1 as a control registered in the existing public DB, and have no homology with NM_001637.1. Since there was a translation start point on this exon, the amino acid on the N-terminal side was changed by 4 residues (SEQ ID NO: 39).
002_ [2] _1-N1 (SEQ ID NO: 38): 67-base inserted nucleic acid sequence region of D-NETRP1000046.1
002_ [2] _1-A1 (SEQ ID NO: 39): 4-residue insertion amino acid sequence region of D-NETRP1000046.1
002_ [2] _1-N2 (SEQ ID NO: 40): ORF nucleic acid sequence region in the 67-base insertion region of D-NETRP1000046.1
002_ [2] _1-A2 (same as SEQ ID NO: 39): ORF amino acid sequence region in the 67 base insertion region of D-NETRP1000046.1 SignalP (http://www.cbs.dtu.dk/ services / SignalP /) and PSORT (http://psort.nibb.ac.jp/), the N-terminal secretion signal sequence predicted to exist at amino acids 1 to 22 of NM_001637.1 was lost.

4)発現特異性解析とリアルタイムPCR用プライマーの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
002_01 - [1]のcDNAパターンのエクソンが欠失している領域の境界にある配列情報を利用して特異的に抽出した領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンにおいて、ORFを変化させているエクソンの欠失領域
→Primer002_01F (配列番号41) とPrimer002_01R (配列番号42) によって増幅される断片002_01 (配列番号43)
002_02 - 既存の公共DBに登録されている[3]のcDNAパターンの[1]の欠失領域と比較した場合に挿入領域に相当する特異的な領域であり、[1]を比較検討するためのコントロール
→Primer002_02F (配列番号44) とPrimer002_02R (配列番号45) によって増幅される断片002_02 (配列番号46)
002_03 - [2]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[2]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer002_03F (配列番号47) とPrimer002_03R (配列番号48) によって増幅される断片002_03 (配列番号49)
002_04 -[1]〜[3]全てが共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]、[2]のcDNAパターン、さらには既存の公共DBに登録されている[3]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域→Primer002_04F (配列番号50) とPrimer002_04R (配列番号51) によって増幅される断片002_04 (配列番号52)
上記に示された[1]〜[2] のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに取得し解析したcDNAの[1]のパターンでは5’末端配列が7配列存在し、その由来は脾臓 (Spleen) が5配列 (解析母数 33,950)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導3日間(D3OST) が2配列 (解析母数 5,092)であった。
我々が新たに解析したcDNAの[2]のパターンでは5’末端配列が1配列存在し、その由来は好中球 (Neutrophil)が1配列 (解析母数 9170)であった。
既存の公共DBに登録されているコントロールとなる[3]のパターンでは5’末端配列が49配列存在しその由来は、脾臓 (Spleen) が20配列 (解析母数 33,950)、胸腺 (Thymus) が5配列 (解析母数 70,578)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導9日間 (D9OST) が4配列 (解析母数 4,407)、滑膜組織(Synovial membrane tissue from rheumatioid arthritis) が3配列 (解析母数 27,489)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導3日間(D3OST) が2配列 (解析母数 5,092)、乳癌 (Breast, Tumor) が2配列 (解析母数 8,416)、肺 (Lung) が2配列 (解析母数 16,146)、子宮 (Uterus) が2配列 (解析母数 49,561) など様々な組織で発現していた。
この結果より、血球系の組織において発現が多く、相対的に比較して[1]のパターンでは、脾臓、CD34+細胞をODF処理誘導したもので発現が多いことがわかった。また、[2]のパターンでは、好中球での発現が多かった。これにより、何らかの発現機構により、血球系の組織の中でも特定の組織での発現、もしくは細胞の分化といった特異的な細胞状態での発現が多くなる可能性が考えられた。
4) Expression specificity analysis and design of primers for real-time PCR In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions were used as detection regions. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
002_01-[1] cDNA pattern specifically extracted using sequence information at the boundary of the region where exon is deleted: cDNA of [1] we newly analyzed full-length cDNA In the pattern, deletion region of exon changing ORF → Fragment 002_01 (SEQ ID NO: 43) amplified by Primer002_01F (SEQ ID NO: 41) and Primer002_01R (SEQ ID NO: 42)
002_02-This is a specific region corresponding to the insertion region when compared with the deleted region of [1] in the cDNA pattern of [3] registered in the existing public DB, and to compare [1] Control → Fragment 002_02 (SEQ ID NO: 46) amplified by Primer002_02F (SEQ ID NO: 44) and Primer002_02R (SEQ ID NO: 45)
002_03-Specific region existing on the N-terminal side of the cDNA pattern of [2]: This is the transcription start region of the cDNA pattern of [2] that we newly analyzed and registered in the existing public DB Novel region that has not been processed → Fragment 002_03 (SEQ ID NO: 49) amplified by Primer002_03F (SEQ ID NO: 47) and Primer002_03R (SEQ ID NO: 48)
002_04-[1]-[3] Common region shared by all: [1], [2] cDNA patterns we have newly analyzed, and registered in the existing public DB [ 3] The region where all the control patterns are common to compare the expression level of the cDNA pattern as a whole → Fragment 002_04 (sequence) amplified by Primer002_04F (SEQ ID NO: 50) and Primer002_04R (SEQ ID NO: 51) (Number 52)
The exon region specific to each of the cDNA patterns [1] to [2] shown above is a comparative analysis by mapping about 1.44 million 5 'end sequences obtained using the oligo cap method to the human genome sequence. As a result, the following results were obtained.
In the newly acquired and analyzed cDNA [1] pattern, there are 7 5 'terminal sequences, the origin of which is 5 sequences of spleen (analysis parameter 33,950), and CD34 + cells are differentiated into osteoclasts. Factor (ODF) treatment induction 3 days (D3OST) was 2 sequences (analysis parameter 5,092).
In the newly analyzed cDNA [2] pattern, there was one 5 'end sequence, and the origin was one neutrophil sequence (analysis parameter 9170).
In the pattern of control [3] registered in the existing public DB, there are 49 5 'terminal sequences, and the origin is 20 sequences of spleen (analysis parameter 33,950) and thymus (Thymus). 5 sequences (analysis parameter 70,578), CD34 + cells treated with osteoclast differentiation factor (ODF) treatment 9 days (D9OST) 4 sequences (analysis parameter 4,407), synovial membrane tissue from rheumatioid arthritis 3 Sequence (analysis parameter 27,489), CD34 + cells treated with osteoclast differentiation factor (ODF) treatment 3 days (D3OST) 2 sequences (analysis parameter 5,092), breast cancer (Breast, Tumor) 2 sequences (analysis parameter 8,416 ), Lung (Lung) 2 sequences (analysis parameter 16,146), and uterus (Uterus) 2 sequences (analysis parameter 49,561).
From this result, it was found that the expression was high in blood cell tissues, and in the pattern [1], the expression was high in the spleen and CD34 + cells induced by ODF treatment. In the pattern [2], there was much expression in neutrophils. As a result, it was considered that there is a possibility that expression in a specific cell state such as expression in a specific tissue or in a specific cell state such as cell differentiation increases in some blood cell tissues by some expression mechanism.

(2)リアルタイムPCRによる発現特異性の解析
血球系でどのような状態の時に発現に変化が現れるのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表4及び表5に示した。
(2) Analysis of expression specificity by real-time PCR In order to know what kind of state changes occur in the blood cell system, the details of the expression level were analyzed by real-time PCR. The results are shown in Tables 4 and 5.

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳 (Brain, whole) を用いて比較した。
002_01 (配列番号43) と002_02 (配列番号46) で比較されるmRNAにおける欠失によってORFが変化する比率は、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導以外の血球系組織では、ほぼ変わらなかった。つまり、どの血球系組織でも同じ割合で2種類のORFが発現していると思われる。しかし、CD34+細胞の破骨細胞への分化において、その比率は大きく変化した。CD34+細胞をODF 処理誘導3日間(CD34+ ODF 3days)、CD34+細胞をODF 処理誘導9日間(CD34+ ODF 9days)のステージにおいて002_01 (配列番号43) で示されるmRNAにおける欠失が起こる割合が高くなっていた(表4・表5)。
002_03 (配列番号29) で示される新しい転写開始点からの発現は、滑膜 (Synovial) 組織(リューマチ患者)、CD34+細胞をODF 処理誘導3日間 (CD34+ ODF 3days)、CD34+細胞をODF 処理誘導9日間 (CD34+ ODF 9days)、及び骨髄 (Bone Marrow)において増加していた(表4・表5)。
つまり滑膜 (Synovial) 組織(リューマチ患者)と骨髄(Bone Marrow)では、転写物(mRNA)に多様性があることで、ORFに多様性が生じていた。さらに、破骨細胞への分化のステージによって転写物 (mRNA) を変化させるような機構が働き、転写開始点やエクソンの選択性に多様性が生じていた。
これらの結果より、002_01 (配列番号43), 002_03 (配列番号46) という検出領域で示される新たに取得したcDNA領域002_[1]_1-N1 (配列番号31), 002_[2]_1-N1 (配列番号38) の発現を比較することにより、リューマチ患者の滑膜 (Synovial) 組織の血球系に特異的な治療・診断マーカーとして、破骨細胞の分化に特異的な治療・診断マーカーとして、また骨髄 (Bone Marrow)の血球系に特異的なマーカーとして利用することが可能であることが立証された。さらに、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についてもリューマチ患者の滑膜 (Synovial) 組織の血球系に特異的な治療・診断マーカーとして、破骨細胞の分化に特異的な治療・診断マーカーとして、また骨髄 (Bone Marrow)の血球系に特異的なマーカーとして有用であると思われる。
[1]のcDNAパターンのD-D3OST2001534.1においてPrimer002_01R (配列番号42) がプライミングする396〜420塩基目を含む上流配列002_[1]_1-N3 (配列番号53)。
[2]のcDNAパターンのD-NETRP1000046.1においてPrimer002_03R (配列番号48) がプライミングする53〜77塩基目を含む上流配列002_[2]_1-N3 (配列番号54)。
[1]のcDNAパターンにおいてPrimer002_01F (配列番号41) とPrimer002_01R (配列番号42) によって増幅される領域002_01 (配列番号43)
[2]のcDNAパターンにおいてPrimer002_03F (配列番号47) とPrimer002_03R (配列番号48) によって増幅される領域002_03 (配列番号49)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As experimental controls, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
The ratio of ORF changes due to the deletion in the mRNA compared with 002_01 (SEQ ID NO: 43) and 002_02 (SEQ ID NO: 46) is almost the same for CD34 + cells in blood cell tissues other than those induced by osteoclast differentiation factor (ODF) treatment. It didn't change. In other words, it seems that two ORFs are expressed at the same rate in any blood cell tissue. However, the ratio changed greatly in the differentiation of CD34 + cells into osteoclasts. In the stage of CD34 + cells induced by ODF treatment for 3 days (CD34 + ODF 3days) and CD34 + cells in ODF treatment induced for 9 days (CD34 + ODF 9days), the rate of deletion in the mRNA shown by 002_01 (SEQ ID NO: 43) is high. (Tables 4 and 5).
Expression from the new transcription start point shown in 002_03 (SEQ ID NO: 29) is as follows: Synovial tissue (rheumatic patients), CD34 + cells induced to ODF treatment for 3 days (CD34 + ODF 3days), CD34 + cells induced to ODF treatment9 Increased in days (CD34 + ODF 9days) and bone marrow (Table 4 and Table 5).
In other words, in synovial tissues (rheumatoid patients) and bone marrow (Bone Marrow), the diversity of transcripts (mRNA) caused diversity in ORF. Furthermore, a mechanism that changes the transcript (mRNA) depending on the stage of osteoclast differentiation worked, resulting in diversity in the transcription start point and exon selectivity.
From these results, newly obtained cDNA regions 002_ [1] _1-N1 (SEQ ID NO: 31), 002_ [2] _1-N1 indicated by the detection regions 002_01 (SEQ ID NO: 43) and 002_03 (SEQ ID NO: 46) By comparing the expression of (SEQ ID NO: 38), as a therapeutic / diagnostic marker specific for the blood cell system of synovial tissue of rheumatic patients, as a therapeutic / diagnostic marker specific for osteoclast differentiation, It was also demonstrated that it can be used as a marker specific to the bone marrow blood cell system. In addition, new drug development using compounds, antibodies, siRNA, etc. that target specific regions is also possible.
The following areas are also considered as therapeutic / diagnostic markers specific to the blood cell system of synovial tissues of rheumatic patients, as therapeutic / diagnostic markers specific to osteoclast differentiation, and to bone marrow (Bone Marrow). It seems to be useful as a marker specific to the blood cell system.
The upstream sequence 002_ [1] _1-N3 (SEQ ID NO: 53) containing the 396th to 420th bases primed by Primer002_01R (SEQ ID NO: 42) in D-D3OST2001534.1 of the cDNA pattern of [1].
The upstream sequence 002_ [2] _1-N3 (SEQ ID NO: 54) containing the 53rd to 77th bases primed by Primer002_03R (SEQ ID NO: 48) in D-NETRP1000046.1 of the cDNA pattern of [2].
Region 002_01 (SEQ ID NO: 43) amplified by Primer002_01F (SEQ ID NO: 41) and Primer002_01R (SEQ ID NO: 42) in the cDNA pattern of [1]
Region 002_03 (SEQ ID NO: 49) amplified by Primer002_03F (SEQ ID NO: 47) and Primer002_03R (SEQ ID NO: 48) in the cDNA pattern of [2]

実施例6:クラスターchr7+1084(データセット:012)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr7+1084 (Human genome UCSC hg18 (NCBI Build34) 染色体7番、72,940,000 bp〜72,985,000 bp) にゲノムマッピングされた9配列の全長cDNA [D-PLACE7010497.1, AF134379.1, C-FCBBF3003373, C-KAT04587,D26309.1, ENST00000336180, ENST00000355120, NM_002314.2, NM_016735.1] について解析を行った。それらは、発現パターンの違いにより5種類に分類されるが、主なものとして以下の3種類が存在した。
[1] D-PLACE7010497.1
[2] D26309.1, ENST00000336180, ENST00000355120, NM_002314.2
[3] AF134379.1, NM_016735.1
[1]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[2],[3]とORFが異なっていた。
[1]は、既知の[2],[3]よりも下流にある染色体領域より発現し、[2],[3]と相同性のない新しいエクソン上に翻訳開始点をもつため、ORF領域が異なっていた。
[2]、[3]は、同じ転写開始点、翻訳開始点をもちスプライシングのパターン変化によりORF領域が異なっていた。
[1]〜[3]の3種類のcDNAパターンがもつORF領域は、同じ染色体領域より、異なる転写開始点から発現を行うことや、スプライシングのパターンが変化することで、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 6: Cluster chr7 + 1084 (data set: 012)
(1) Cluster analysis
1) Features of the cluster Nine full-length cDNA genome-mapped on the cluster chr7 + 1084 (Human genome UCSC hg18 (NCBI Build34) chromosome 7, 72,940,000 bp to 72,985,000 bp) [D-PLACE7010497.1, AF134379.1, C -FCBBF3003373, C-KAT04587, D26309.1, ENST00000336180, ENST00000355120, NM_002314.2, NM_016735.1] were analyzed. They are classified into 5 types according to the difference in expression pattern.
[1] D-PLACE7010497.1
[2] D26309.1, ENST00000336180, ENST00000355120, NM_002314.2
[3] AF134379.1, NM_016735.1
[1] is a cDNA we newly acquired and performed full-length cDNA sequence analysis, and the ORF was different from [2], [3] registered in the existing public DB.
[1] is expressed from a chromosomal region downstream of the known [2], [3] and has a translation start point on a new exon that has no homology to [2], [3], so the ORF region Was different.
[2] and [3] had the same transcription start point and translation start point, and different ORF regions due to splicing pattern changes.
The ORF region of the three types of cDNA patterns [1] to [3] is expressed from different transcription start points from the same chromosomal region, and the splicing pattern changes, thereby changing the amino acid sequence, It was found that diverse proteins and mRNAs were produced.

2)我々が新たに取得し全長cDNA配列解析を行ったD-PLACE7010497.1([1])の特徴
012_[1]_1-N0 (配列番号55) : D-PLACE7010497.1の核酸配列全領域
012_[1]_1-NA0 (配列番号56) : D-PLACE7010497.1の核酸配列全領域とアミノ酸配列の併記
012_[1]_1-A0 (配列番号57) : D-PLACE7010497.1のアミノ配列全領域
D-PLACE7010497.1の1〜83塩基 (配列番号58) は、既存の公共DBに登録されているコントロールとなるNM_002314.2では存在しないエクソンが挿入するバリアントで、NM_002314.2と相同性がない。挿入するエクソン上に翻訳開始点が存在する為、NM_002314.2と比較するとN末端のアミノ酸が17残基 (配列番号59) 異なっていた。
012_[1]_1-N1 (配列番号58) : D-PLACE7010497.1の83塩基の挿入核酸配列領域
012_[1]_1-A1 (配列番号59) : D-PLACE7010497.1の17残基の挿入アミノ配列領域
012_[1]_1-N2 (配列番号60) : D-PLACE7010497.1の83塩基の挿入領域中のORF核酸配列領域
012_[1]_1-A2 (配列番号59と同一) : D-PLACE7010497.1の83塩基の挿入領域に関わるORFアミノ酸領域
2) Features of D-PLACE7010497.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
012_ [1] _1-N0 (SEQ ID NO: 55): The entire nucleic acid sequence of D-PLACE7010497.1
012_ [1] _1-NA0 (SEQ ID NO: 56): Combination of D-PLACE7010497.1 full-length nucleic acid sequence and amino acid sequence
012_ [1] _1-A0 (SEQ ID NO: 57): Full amino acid region of D-PLACE7010497.1
1-83 bases (SEQ ID NO: 58) of D-PLACE7010497.1 are variants inserted by exons that do not exist in NM_002314.2, which is a control registered in the existing public DB, and have no homology with NM_002314.2 . Since there was a translation start point on the exon to be inserted, the N-terminal amino acid was 17 residues (SEQ ID NO: 59) different from NM_002314.2.
012_ [1] _1-N1 (SEQ ID NO: 58): 83-nucleotide inserted nucleic acid sequence region of D-PLACE7010497.1
012_ [1] _1-A1 (SEQ ID NO: 59): 17-residue insertion amino acid sequence region of D-PLACE7010497.1
012_ [1] _1-N2 (SEQ ID NO: 60): ORF nucleic acid sequence region in the 83-base insertion region of D-PLACE7010497.1
012_ [1] _1-A2 (same as SEQ ID NO: 59): ORF amino acid region related to the 83 base insertion region of D-PLACE7010497.1

3)発現特異性解析とリアルタイムPCR用プライマーの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
012_01 - [1]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer012_01F (配列番号61) とPrimer012_01R (配列番号62) によって増幅される断片012_01 (配列番号63)
012_02 - 既存の公共DBに登録されている[2],[3]が共有する転写開始点領域、[1]を比較検討するためのコントロール
→Primer012_02F (配列番号64) とPrimer012_02R (配列番号65) によって増幅される断片012_02 (配列番号66)
002_03 - [1]〜[3]全てが共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターン、さらには既存の公共DBに登録されている[2],[3]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域
→Primer012_03F (配列番号67) とPrimer012_03R (配列番号68) によって増幅される断片012_03 (配列番号69)
上記に示された[1]、[2]のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1]のパターンでは5’末端配列が12配列存在し、その由来は滑膜組織 (Synovial membrane tissue from rheumatioid arthritis) が3配列 (解析母数 27,489)、胸腺(Thymus) が3配列 (解析母数 70,578)、脾臓 (Spleen) が2配列 (解析母数 33,950)、CD34+細胞 (CD34+) が1配列 (解析母数 1,420)、白血病細胞(Leukemia, myelogenous) が1配列 (解析母数 2,156)、黒質 (Brain, substantia nigra) が1配列 (解析母数 15,897)、胎盤 (Placenta) が1配列 (解析母数 46,090) であった。
既存の公共DBに登録されているコントロールとなる [2] 又は [3] のパターンでは5’末端配列が9配列存在し、その由来は胎児脳 (Brain, Fetal) が2配列(解析母数 47,574)、視床 (Brain, thalamus) が2配列 (解析母数 53,267)、扁桃(Brain, amygdala) が2配列 (解析母数 58,640)、SK-N-SH細胞(Neuroblastoma) が1配列 (解析母数 8,662)、海馬 (Brain, hippocampus) が1配列 (解析母数 57,918)、全脳(Brain, whole) が1配列(解析母数 59,069)であった。
この結果より、[1]の転写開始点は、滑膜組織 (Synovial membrane tissue from rheumatioid arthritis), 胸腺 (Thymus) などでの血球系組織での発現が多いことがわかった。また、[2]、[3]の共有する転写開始点では、脳での発現が多かった。これにより、血球系組織とそれ以外の組織(特に脳)では、この染色体領域において、転写の機構が異なり、用いられている転写開始点も異なるのではないかということがわかった。
3) Expression specificity analysis and design of primers for real-time PCR In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions were used as detection regions. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
012_01-Specific region existing on the N-terminal side of the cDNA pattern of [1]: This is the transcription start region of the cDNA pattern of [1] that we newly analyzed, and is registered in the existing public DB Novel region that has not been changed → Fragment 012_01 (SEQ ID NO: 63) amplified by Primer012_01F (SEQ ID NO: 61) and Primer012_01R (SEQ ID NO: 62)
012_02-Control to compare transcription start point region [1] shared by [2] and [3] registered in the existing public DB → Primer012_02F (SEQ ID NO: 64) and Primer012_02R (SEQ ID NO: 65) Fragment 012_02 amplified by (SEQ ID NO: 66)
002_03-[1]-[3] Common area shared by all: [1] cDNA pattern we newly performed full-length cDNA sequence analysis, and also registered in the existing public DB [2], [ 3] A region where all patterns serving as a control are in common to compare the expression levels of the cDNA pattern as a whole → Fragment 012_03 (sequence) amplified by Primer012_03F (SEQ ID NO: 67) and Primer012_03R (SEQ ID NO: 68) (Number 69)
The exon regions specific to each of the cDNA patterns [1] and [2] shown above are mapped and compared to the human genome sequence of approximately 1.44 million 5 'end sequences obtained using the oligocap method. As a result, the following results were obtained.
In the newly analyzed cDNA [1] pattern, there are 12 5'-terminal sequences, 3 of which are synovial membrane tissue from rheumatioid arthritis (analysis parameter 27,489), thymus ( (Thymus) has 3 sequences (analysis parameter 70,578), spleen (Spleen) has 2 sequences (analysis parameter 33,950), CD34 + cells (CD34 +) has 1 sequence (analysis parameter 1,420), leukemia cells (Leukemia, myelogenous) has 1 sequence The sequence (analysis parameter 2,156), the substantia nigra (Brain, substantia nigra) was 1 sequence (analysis parameter 15,897), and the placenta (Placenta) was 1 sequence (analysis parameter 46,090).
In the pattern [2] or [3], which is a control registered in the existing public DB, there are 9 5 'terminal sequences, and the origin is 2 sequences of the brain (Brain, Fetal) (analysis parameter 47,574). ), Thalamus (Brain, thalamus) 2 sequences (analysis parameter 53,267), tonsils (Brain, amygdala) 2 sequences (analysis parameter 58,640), SK-N-SH cells (Neuroblastoma) 1 sequence (analysis parameter) 8,662), hippocampus (Brain, hippocampus) had one sequence (analysis parameter 57,918), and whole brain (Brain, whole) had one sequence (analysis parameter 59,069).
From this result, it was found that the transcription start point of [1] is highly expressed in blood cell tissues such as Synovial membrane tissue from rheumatioid arthritis and Thymus. Moreover, at the transcription start point shared by [2] and [3], there was much expression in the brain. As a result, it was found that in the chromosomal region, the transcriptional mechanism is different and the transcription start point used is different between the blood cell system tissue and other tissues (particularly the brain).

(2)リアルタイムPCRによる発現特異性の解析
血球系組織の中でもどのような組織、どのような状態の時に発現に使われる転写開始点が変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表6及び表7に示した。
(2) Analysis of expression specificity by real-time PCR In order to know what kind of tissue in the blood cell system tissue and what state the transcription start point used for expression changes, details of the expression level are real-time PCR. Analyzed with The results are shown in Tables 6 and 7.

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳(Brain, whole)を用いて比較した。
012_01 (配列番号63) と012_02 (配列番号66) で比較される転写開始点の選択性によってmRNAが変わり、その結果としてORFが変化する比率は、以下の組織、細胞で大きく変化していた。
脾臓(Spleen)、滑膜 (Synovial) 組織(リューマチ患者)、CD34+細胞を破骨細胞分化因子(ODF)処理誘導3日間(CD34+ ODF 3days)、CD34+細胞をODF 処理誘導9日間 (CD34+ ODF 9days)では、012_01 (配列番号63) で表される下流の転写開始点からの転写物(mRNA)が多かった(表6・表7)。さらにODFで処理誘導したCD34+細胞について詳細に比較すると、分化の初期のステージであるCD34+細胞をODF 処理誘導3日間 (CD34+ ODF 3days)でもっとも大きく差が見られた(表6・表7)。
また、全脳(Brain, whole)、脊髄 (Spinal Cord)では、012_02 (配列番号66) で表される既存の公共DBに登録されている転写開始点からの転写物(mRNA)が多かった。
つまり脾臓(Spleen)、滑膜 (Synovial) 組織(リューマチ患者)、ODFで処理誘導したCD34+細胞では、脳とは異なる転写因子もしくは転写機構により、転写開始点に多様性が生じて、異なるORF領域をもつmRNAが発現している。さらに、破骨細胞への分化のステージにおいても変化が見られ、特に分化が起こる初期の段階で転写物(mRNA)を変化させるような機構が働き、転写開始点に多様性が生じていた。
これらの結果より、012_01 (配列番号63) という検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)012_[1]_1-N1 (配列番号58) の発現を比較することにより、リューマチ患者の滑膜 (Synovial) 組織の血球系に特異的な治療・診断マーカーとして、破骨細胞への分化、特に分化の初期段階を検出する治療・診断マーカーとして、また脾臓(Spleen)の血球系に特異的なマーカーとして、利用することが可能であることが立証された。さらに、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についてもリューマチ患者の滑膜 (Synovial)組織の血球系に特異的な治療・診断マーカーとして、破骨細胞への分化、特に分化の初期段階を検出する治療・診断マーカーとして、また脾臓 (Spleen)の血球系に特異的なマーカーとして有用であると思われる。
[1]のcDNAパターンのD-PLACE7010497.1においてPrimer002_01R (配列番号62) がプライミングする67〜87塩基目を含む上流配列012_[1]_1-N3 (配列番号70)。
[1]のcDNAパターンにおいてPrimer012_01F (配列番号61) とPrimer012_01R (配列番号62) によって増幅される領域012_01 (配列番号63)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As an experimental control, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
The mRNA changes depending on the selectivity of the transcription start site compared between 012_01 (SEQ ID NO: 63) and 012_02 (SEQ ID NO: 66). As a result, the rate of change in ORF greatly changed in the following tissues and cells.
Spleen (Spleen), synovial tissue (rheumatoid patients), CD34 + cells induced by osteoclast differentiation factor (ODF) treatment for 3 days (CD34 + ODF 3days), CD34 + cells induced by ODF treatment for 9 days (CD34 + ODF 9days) There were many transcripts (mRNA) from the downstream transcription start point represented by 012_01 (SEQ ID NO: 63) (Tables 6 and 7). Furthermore, when comparing CD34 + cells induced by treatment with ODF, CD34 + cells, the initial stage of differentiation, showed the largest difference in 3 days of ODF treatment induction (CD34 + ODF 3days) (Tables 6 and 7).
In the whole brain (Brain, whole) and spinal cord (Spinal Cord), there were many transcripts (mRNA) from the transcription start point registered in the existing public DB represented by 012_02 (SEQ ID NO: 66).
In other words, in the spleen (Spleen), synovial tissue (rheumatoid patients), and CD34 + cells induced by treatment with ODF, the transcription start point varies due to transcription factors or transcription mechanisms different from those in the brain, resulting in different ORF regions. MRNA is expressed. Furthermore, changes were observed in the stage of differentiation into osteoclasts, and a mechanism for changing the transcript (mRNA) worked particularly at the early stage of differentiation, resulting in diversity at the transcription start point.
From these results, the 5′-terminal region of the newly obtained cDNA region indicated by the detection region 012_01 (SEQ ID NO: 63) (region near the transcription start point) 012_ [1] _1-N1 (SEQ ID NO: 58) By comparing the expression, as a therapeutic / diagnostic marker specific to the blood system of the synovial tissue of rheumatic patients, as a therapeutic / diagnostic marker to detect differentiation into osteoclasts, especially the early stages of differentiation, It was also proved that it can be used as a marker specific to the spleen blood system. In addition, new drug development using compounds, antibodies, siRNA, etc. that target specific regions is also possible.
In addition, the following areas are also used as therapeutic / diagnostic markers specific to the blood cell system of the synovial tissue of rheumatic patients, as a therapeutic / diagnostic marker for detecting differentiation into osteoclasts, particularly the early stages of differentiation, and It seems to be useful as a marker specific to the blood system of the spleen (Spleen).
The upstream sequence 012_ [1] _1-N3 (SEQ ID NO: 70) containing the 67th to 87th bases primed by Primer002_01R (SEQ ID NO: 62) in D-PLACE7010497.1 of the cDNA pattern of [1].
Region 012_01 (SEQ ID NO: 63) amplified by Primer012_01F (SEQ ID NO: 61) and Primer012_01R (SEQ ID NO: 62) in the cDNA pattern of [1]

実施例7:クラスターchr2+1780 (データセット:009)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr2+1780 (Human genome UCSC hg18 (NCBI Build34) 染色体2番、120,200,000 bp〜120,500,000 bp) にゲノムマッピングされた6配列の全長cDNA [D-SPLEN2030304.1, BC010674.1, BX648614.1, ENST00000263708, M68941.1, NM_002830.2] がマッピングされている領域の解析を行った。それらは、発現パターンの違いにより3種類に分類されるが、主なものとして以下の2種類が存在した。
[1] D-SPLEN2030304.1
[2] BC010674.1, ENST00000263708, M68941.1, NM_002830.2
[1]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[2]とORFが異なっていた。
[1]は、既知の[2]よりも下流にある染色体領域より発現するため、ORF領域が異なっていた。
[1]〜[2]の2種類のcDNAパターンがもつORF領域は、同じ染色体領域の異なる転写開始点から発現を行うことにより、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 7: Cluster chr2 + 1780 (Data set: 009)
(1) Cluster analysis 1) Cluster characteristics Six full-length cDNA genome-mapped to cluster chr2 + 1780 (Human genome UCSC hg18 (NCBI Build34) chromosome 2, 120,200,000 bp to 120,500,000 bp) [D-SPLEN2030304.1 , BC010674.1, BX648614.1, ENST00000263708, M68941.1, NM_002830.2] was analyzed. They are classified into three types according to the difference in expression pattern, and the following two types exist as main ones.
[1] D-SPLEN2030304.1
[2] BC010674.1, ENST00000263708, M68941.1, NM_002830.2
[1] is a cDNA we newly acquired and performed full-length cDNA sequence analysis, and the ORF was different from [2] registered in the existing public DB.
Since [1] is expressed from a chromosomal region downstream from the known [2], the ORF region was different.
The ORF regions of the two types of cDNA patterns [1] to [2] are expressed from different transcription start sites in the same chromosomal region, so that the amino acid sequence changes, and diverse proteins and mRNAs are produced. It turns out that it is.

2)我々が新たに取得し全長cDNA配列解析を行ったD-SPLEN2030304.1([1])の特徴
009_[1]_1-N0 (配列番号71) : D-SPLEN2030304.1の核酸配列全領域
009_[1]_1-NA0 (配列番号72) : D-SPLEN2030304.1の核酸配列全領域とアミノ酸配列の併記
009_[1]_1-A0 (配列番号73) : D-SPLEN2030304.1のアミノ配列全領域
D-SPLEN2030304.1の1〜57塩基(配列番号74)のエクソン(第1エクソン)は既存の公共DBに登録されているコントロールとなるNM_002830.2には存在しないエクソンであり相同性がない。D-SPLEN2030304.1の第2エクソンはNM_002830.2の第14エクソンに相当し、これ以降のエクソンは両cDNA共に共通して存在している。NM_002830.2のORFの翻訳開始点は第2エクソン上に存在するのに対してD-SPLEN2030304.1の翻訳開始点は第2エクソン(NM_002830.2の第14エクソン)の領域に存在するため、NM_002830.2に比べN末端側のアミノ酸が367残基短くなっていた。(配列番号290)。
009_[1]_1-N1 (配列番号74) : D-SPLEN2030304.1の57塩基の挿入核酸配列領域
009_[1]_1-N2 (配列番号75) : D-SPLEN2030304.1の89塩基目を翻訳開始点とするORFの5’UTR領域88塩基
009_[1]_C-A1(配列番号290): NM_002830.2に存在するD-SPLEN2030304.1の367残基の欠失アミノ酸配列領域
この変化に伴い、NM_002830.2の31〜222アミノ酸目に存在するPfamモチーフ “FERM domain (Band 4.1 family)” が消失していた (http://pfam.janelia.org/)。
2) Features of D-SPLEN2030304.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
009_ [1] _1-N0 (SEQ ID NO: 71): D-SPLEN2030304.1 whole region of nucleic acid sequence
009_ [1] _1-NA0 (SEQ ID NO: 72): Combination of the entire nucleic acid sequence and amino acid sequence of D-SPLEN2030304.1
009_ [1] _1-A0 (SEQ ID NO: 73): D-SPLEN2030304.1 full amino acid region
The exon (first exon) of 1 to 57 bases (SEQ ID NO: 74) of D-SPLEN2030304.1 is an exon that does not exist in NM_002830.2, which is a control registered in the existing public DB, and has no homology. The second exon of D-SPLEN2030304.1 corresponds to the 14th exon of NM_002830.2, and the exons thereafter are common to both cDNAs. Since the translation start point of ORF of NM_002830.2 exists on the second exon, the translation start point of D-SPLEN2030304.1 exists in the region of the second exon (14th exon of NM_002830.2), Compared to NM_002830.2, the N-terminal amino acid was 367 residues shorter. (SEQ ID NO: 290).
009_ [1] _1-N1 (SEQ ID NO: 74): 57-base inserted nucleic acid sequence region of D-SPLEN2030304.1
009_ [1] _1-N2 (SEQ ID NO: 75): ORF 5'UTR region 88 bases starting from the 89th base of D-SPLEN2030304.1
009_ [1] _C-A1 (SEQ ID NO: 290): D-SPLEN2030304.1 367-residue deleted amino acid sequence region present in NM_002830.2 Along with this change, it exists in amino acids 31-222 of NM_002830.2 Pfam motif “FERM domain (Band 4.1 family)” disappeared (http://pfam.janelia.org/).

3)発現特異性解析とリアルタイムPCR用プライマーの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
009_01 - [1]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer009_01F (配列番号76) とPrimer009_01R (配列番号77) によって増幅される断片009_01 (配列番号78)
009_02 - 既存の公共DBに登録されている[2]の転写開始点領域、[1]を比較検討するためのコントロール
→Primer009_02F (配列番号79) とPrimer009_02R (配列番号80) によって増幅される断片009_02 (配列番号81)
009_03 - [1]、[2]が共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターン、さらには既存の公共DBに登録されている[2]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域
→Primer009_03F (配列番号82) とPrimer009_03R (配列番号83) によって増幅される断片009_03 (配列番号84)
上記に示された[1]、[2] のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1]のパターンでは5’末端配列が4配列存在し、その由来は脾臓 (Spleen) が3配列 (解析母数 33,950)、肺 (Lung) が1配列 (解析母数 16,146) であった。
既存の公共DBに登録されているコントロールとなる [2]のパターンでは5’末端配列が24配列存在し、その由来は視床 (Brain, thalamus) が6配列 (解析母数 53,267)、全脳(Brain, whole) が3配列 (解析母数 59,069)、正常神経膠星状細胞 (Normal Human Astrocyte) が2配列 (解析母数 17,162)、NT2細胞をレチノイン酸処理誘導 (NT2RP) が2配列 (解析母数 39,242)、胎児脳 (Brain, Fetal) が3配列(解析母数 79,560)、気管 (Trachea) が2配列 (解析母数 52,352)、胸腺 (Thymus) が2配列 (解析母数 70,578)、腎臓癌 (Kidney, Tumor) が1配列 (解析母数 15,970)、腎臓 (Kidney) が1配列 (解析母数 17,008)、NT2細胞をレチノイン酸処理誘導5週間後、生育阻害剤処理2週間(NT2RI) が1配列 (解析母数 32,662)、小脳 (Brain, cerebellum) が1配列 (解析母数 82,880) であった。
この結果より、[1]の転写開始点は、脾臓 (Spleen)での発現が多いことがわかった。また、[2]の転写開始点では、脳など様々な組織での発現がみられた。これにより、血球系の組織とそれ以外の組織では、この染色体領域において、転写の機構が異なり、用いられている転写開始点も異なる可能性が考えられた。
3) Expression specificity analysis and design of primers for real-time PCR In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions were used as detection regions. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
009_01-Specific region existing on the N-terminal side of the cDNA pattern of [1]: This is the transcription start region of the cDNA pattern of [1] that we newly analyzed and registered in the existing public DB Novel region that has not been processed → Fragment 009_01 (SEQ ID NO: 78) amplified by Primer009_01F (SEQ ID NO: 76) and Primer009_01R (SEQ ID NO: 77)
009_02-Control to compare and examine [2] transcription start site region [1] registered in the existing public DB → Fragment 009_02 amplified by Primer009_02F (SEQ ID NO: 79) and Primer009_02R (SEQ ID NO: 80) (SEQ ID NO: 81)
009_03-Common region shared by [1] and [2]: cDNA pattern of [1] that we newly analyzed full-length cDNA sequence, and also [2] cDNA pattern registered in the existing public DB A region where all patterns serving as a control are in common to compare the expression level of the entire expression of the fragment → Fragment 009_03 (SEQ ID NO: 84) amplified by Primer009_03F (SEQ ID NO: 82) and Primer009_03R (SEQ ID NO: 83)
The exon regions specific to each of the cDNA patterns [1] and [2] shown above map the approximately 1.44 million 5 'end sequences obtained using the oligo cap method to human genome sequences for comparative analysis. As a result, the following results were obtained.
In the newly analyzed cDNA [1] pattern, there are 4 5 'terminal sequences, 3 of which are derived from the spleen (analysis parameter 33,950) and 1 from the lung (analysis). The parameter was 16,146).
In the pattern of [2], which is the control registered in the existing public DB, there are 24 5 'terminal sequences, and the origin is 6 sequences of the thalamus (Brain, thalamus) (analysis parameter 53,267), whole brain ( 3 sequences (Brain, whole) (analysis parameter 59,069), 2 sequences of normal astrocytes (analysis parameter 17,162), 2 sequences of retinoic acid treatment induction (NT2RP) of NT2 cells (analysis) 39,242), 3 sequences of fetal brain (Brain, Fetal) (analysis parameter 79,560), 2 sequences of trachea (analysis parameter 52,352), 2 sequences of thymus (analysis parameter 70,578), 1 sequence of kidney cancer (Kidney, Tumor) (analysis parameter 15,970), 1 sequence of kidney (Kidney) (analysis parameter 17,008), NT2 cells 5 weeks after induction of retinoic acid treatment, 2 weeks of growth inhibitor treatment (NT2RI ) Was 1 sequence (analysis parameter 32,662) and cerebellum (Brain, cerebellum) was 1 sequence (analysis parameter 82,880).
From this result, it was found that the transcription start point of [1] is highly expressed in the spleen. Moreover, at the transcription start point of [2], expression was observed in various tissues such as the brain. As a result, it was considered that the transcriptional mechanism is different in the chromosomal region between the blood cell tissue and the other tissue, and the transcription start point used may be different.

(2)リアルタイムPCRによる発現特異性の解析
血球系組織の中でもどのような組織、どのような状態の時に発現に使われる転写開始点が変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表8及び表9に示した。
(2) Analysis of expression specificity by real-time PCR In order to know what kind of tissue in the blood cell system tissue and what state the transcription start point used for expression changes, details of the expression level are real-time PCR. Analyzed with The results are shown in Table 8 and Table 9.

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳(Brain, whole)を用いて比較した。
009_01 (配列番号78) と009_02 (配列番号81) で比較される転写開始点の選択性によってmRNAが変わり、その結果としてORFが変化する比率は、以下の組織、細胞で大きく変化していた。
脾臓 (Spleen), 骨髄 (Bone Marrow) では、009_01 (配列番号78) で表される下流の転写開始点からの転写物(mRNA)が多かった(表8・表9)。
また、破骨細胞分化因子(ODF)で処理誘導したCD34+細胞について詳細に比較すると、009_02 (配列番号81) で表される既存の公共DBに登録されている転写開始点からの転写物(mRNA)が全ての分化ステージでほぼ変わらない発現量であるのに対して、009_01 (配列番号78) で表される下流の転写開始点からの転写物(mRNA)は、未分化のCD34+細胞の状態で最も発現量が多く、CD34+細胞ODF処理誘導3日間(CD34+ ODF 3days)、CD34+細胞ODF処理誘導6日間(CD34+ ODF 6days)と分化のステージが進むにつれて発現量が減少し、CD34+細胞ODF処理誘導9日間 (CD34+ ODF 9days)では、発現が見られなかった(表8・表9)。
また、009_02 (配列番号81) では009_01 (配列番号78) 比べ全脳(Brain, whole)、脊髄(Spinal Cord)で発現が多く見られた。
つまり脾臓 (Spleen), 骨髄 (Bone Marrow)では、他の組織とは異なり転写因子もしくは、転写機構によって転写開始点に多様性が生じ、ORF領域の異なるmRNAが発現していた。さらに、破骨細胞へ分化することによって、転写物(mRNA)を変化させるような機構が機能しなくなり、転写開始点の多様性がなくなることが分かった。
これらの結果より、009_01 (配列番号78) という検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)009_[1]_1-N1 (配列番号74) の発現を比較することにより、破骨細胞の分化段階を検出する分化マーカー(骨粗鬆症・リューマチやそれに至る過程の診断・治療マーカー)として、また脾臓(Spleen)、骨髄 (Bone Marrow)の血球系に特異的なマーカーとして、利用することが可能であることが立証された。また、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についても破骨細胞の分化段階を検出する分化マーカー、また脾臓、骨髄の血球系に特異的なマーカーとしてとして有用であると思われる。
[1]のcDNAパターンのD-SPLEN2030304.1においてPrimer009_01R (配列番号77) がプライミングする89〜112塩基目を含む上流配列009_[1]_1-N 3 (配列番号85)。
[1]のcDNAパターンにおいてPrimer009_01F (配列番号76) とPrimer009_01R (配列番号77) によって増幅される領域009_01 (配列番号78)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As an experimental control, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
Depending on the selectivity of the transcription start site compared between 009_01 (SEQ ID NO: 78) and 009_02 (SEQ ID NO: 81), the mRNA was changed, and as a result, the ratio of change in ORF was greatly changed in the following tissues and cells.
In the spleen (Spleen) and bone marrow (Bone Marrow), there were many transcripts (mRNA) from the downstream transcription start point represented by 009_01 (SEQ ID NO: 78) (Tables 8 and 9).
In addition, when comparing CD34 + cells induced with osteoclast differentiation factor (ODF) in detail, transcripts (mRNA) from the transcription start point registered in the existing public DB represented by 009_02 (SEQ ID NO: 81) ) Is almost unchanged in all differentiation stages, whereas the transcript (mRNA) from the downstream transcription start point represented by 009_01 (SEQ ID NO: 78) is the state of undifferentiated CD34 + cells. The expression level of CD34 + cell ODF treatment was induced for 3 days (CD34 + ODF 3 days) and CD34 + cell ODF treatment was induced for 6 days (CD34 + ODF 6days). No expression was observed for 9 days (CD34 + ODF 9days) (Tables 8 and 9).
In addition, in 009_02 (SEQ ID NO: 81), more expression was observed in the whole brain (Brain, whole) and spinal cord (Spinal Cord) than 009_01 (SEQ ID NO: 78).
In other words, in the spleen and bone marrow, unlike other tissues, transcription factors or transcription mechanisms caused diversity in the transcription start point, and mRNAs with different ORF regions were expressed. Furthermore, it was found that by differentiating into osteoclasts, the mechanism that changes the transcript (mRNA) does not function, and the diversity of transcription start points is lost.
From these results, the 5′-terminal region of the newly obtained cDNA region indicated by the detection region of 009_01 (SEQ ID NO: 78) (region near the transcription start point) 009_ [1] _1-N1 (SEQ ID NO: 74) By comparing the expression, it is specific as a differentiation marker (diagnosis / treatment marker for osteoporosis, rheumatism and the process leading to it) as well as to the spleen and bone marrow (Bone Marrow) blood cells. It was proved that it can be used as a typical marker. It is also possible to develop new drugs using compounds, antibodies, siRNA, etc. that target specific regions.
The following regions are also useful as differentiation markers for detecting the differentiation stage of osteoclasts and as markers specific to the spleen and bone marrow blood cell systems.
The upstream sequence 009_ [1] _1-N 3 (SEQ ID NO: 85) containing the 89th to 112th bases primed by Primer009_01R (SEQ ID NO: 77) in D-SPLEN2030304.1 of the cDNA pattern of [1].
Region 009_01 (SEQ ID NO: 78) amplified by Primer009_01F (SEQ ID NO: 76) and Primer009_01R (SEQ ID NO: 77) in the cDNA pattern of [1]

実施例8:クラスターchr3+1925(データセット:045)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr3+1925 (Human genome UCSC hg18 (NCBI Build34) 染色体3番、138,060,000 bp〜138,160,000 bp) にゲノムマッピングされた4配列の全長cDNA [D-SYNOV4000324.1, BC006403.2, ENST00000288986, NM_006153.3] について解析を行った。それらは、発現パターンの違いにより以下のように2種類に分類できた。
[1] D-SYNOV4000324.1
[2] BC006403.2, ENST00000288986, NM_006153.3
[1]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[2]とORFが異なっていた。
[1]は、既知の[2]よりも下流にある染色体領域より発現し、[2]と相同性のない新しいエクソン上に翻訳開始点をもつため、ORF領域が異なっていた。
[1]〜[2]の2種類のcDNAパターンがもつORF領域は、同じ染色体領域より、異なる転写開始点から発現を行うことで、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 8: Cluster chr3 + 1925 (data set: 045)
(1) Cluster analysis 1) Cluster characteristics Four full-length cDNA genome-mapped to cluster chr3 + 1925 (Human genome UCSC hg18 (NCBI Build34) chromosome 3, 138,060,000 bp to 138,160,000 bp) [D-SYNOV4000324.1 , BC006403.2, ENST00000288986, NM_006153.3]. They could be classified into two types according to the difference in expression pattern as follows.
[1] D-SYNOV4000324.1
[2] BC006403.2, ENST00000288986, NM_006153.3
[1] is a cDNA we newly acquired and performed full-length cDNA sequence analysis, and the ORF was different from [2] registered in the existing public DB.
[1] was expressed from a chromosomal region downstream of the known [2], and the ORF region was different because it had a translation start on a new exon that had no homology to [2].
The ORF regions of the two types of cDNA patterns [1] to [2] are expressed from the same chromosomal region from different transcription initiation sites, resulting in altered amino acid sequences and the generation of diverse proteins and mRNAs. I found out.

2)我々が新たに取得し全長cDNA配列解析を行ったD-SYNOV4000324.1([1])の特徴
045_[1]_1-N0 (配列番号86) : D-SYNOV4000324.1の核酸配列全領域
045_[1]_1-NA0 (配列番号87) : D-SYNOV4000324.1の核酸配列全領域とアミノ酸配列の併記
045_[1]_1-A0 (配列番号88) : D-SYNOV4000324.1のアミノ配列全領域
D-SYNOV4000324.1の1〜78塩基 (配列番号89) は、既存の公共DBに登録されているコントロールとなるNM_006153.3では存在しないエクソンでありNM_006153.3と相同性がない。このエクソン上に翻訳開始点が存在する為、N末端側のアミノ酸が12残基 (配列番号90) 変化していた。
045_[1]_1-N1 (配列番号89) : D-SYNOV4000324.1の78塩基の挿入核酸配列領域
045_[1]_1-A1 (配列番号90) : D-SYNOV4000324.1の12残基の挿入アミノ配列領域
045_[1]_1-N2 (配列番号91) : D-SYNOV4000324.1の78塩基の挿入領域中のORF核酸配列領域
045_[1]_1-A2 (配列番号90と同一) : D-SYNOV4000324.1の78塩基の挿入領域中のORFアミノ酸配列領域
この変化に伴い、NM_006153.3の5〜59アミノ酸目に存在するPfamモチーフ“SH3 domain”が消失していた。
2) Features of D-SYNOV4000324.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
045_ [1] _1-N0 (SEQ ID NO: 86): Entire region of the nucleic acid sequence of D-SYNOV4000324.1
045_ [1] _1-NA0 (SEQ ID NO: 87): Combination of D-SYNOV4000324.1 nucleic acid sequence and amino acid sequence
045_ [1] _1-A0 (SEQ ID NO: 88): Full amino acid region of D-SYNOV4000324.1
1-78 bases (SEQ ID NO: 89) of D-SYNOV4000324.1 are exons that do not exist in NM_006153.3, which is a control registered in the existing public DB, and have no homology with NM_006153.3. Since there was a translation start point on this exon, the amino acid on the N-terminal side changed 12 residues (SEQ ID NO: 90).
045_ [1] _1-N1 (SEQ ID NO: 89): 78-base inserted nucleic acid sequence region of D-SYNOV4000324.1
045_ [1] _1-A1 (SEQ ID NO: 90): 12-residue insertion amino acid sequence region of D-SYNOV4000324.1
045_ [1] _1-N2 (SEQ ID NO: 91): ORF nucleic acid sequence region in the 78-base insertion region of D-SYNOV4000324.1
045_ [1] _1-A2 (same as SEQ ID NO: 90): ORF amino acid sequence region in the 78-base insertion region of D-SYNOV4000324.1 Along with this change, Pfam exists at amino acids 5 to 59 of NM_006153.3 The motif “SH3 domain” disappeared.

3)発現特異性解析とリアルタイムPCR用プライマーの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
045_01 - [1]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer045_01F (配列番号92) とPrimer045_01R (配列番号93) によって増幅される断片045_01 (配列番号94)
045_02 - 既存の公共DBに登録されている[2]が存在する転写開始点領域、[1]を比較検討するためのコントロール
→Primer045_02F (配列番号95) とPrimer045_02R (配列番号96) によって増幅される断片045_02 (配列番号97)
045_03 - [1]〜[2]全てが共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターン、さらには既存の公共DBに登録されている[2]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域
→Primer045_03F (配列番号98) とPrimer045_03R (配列番号99) によって増幅される断片045_03 (配列番号100)
上記に示された[1]、[2]のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1]のパターンでは5’末端配列が3配列存在し、その由来は滑膜組織 (Synovial membrane tissue from rheumatioid arthritis) が1配列 (解析母数 27,489)、結腸(Colon) が1配列 (解析母数 8,398)、NT2細胞をレチノイン酸処理誘導5週間後、生育阻害剤処理2週間(NT2RI) が1配列 (解析母数 32,662) であった。
既存の公共DBに登録されているコントロールとなる [2]のパターンでは5’末端配列が34配列存在し、その由来は胸腺 (Thymus) が9配列 (解析母数 70,578)、心膜 (Pericardium) が3配列 (解析母数 8,781)、尾状核 (Brain, caudate nucleus) が2配列 (解析母数 25,786)、気管(Trachea) が2配列 (解析母数 52,352)、海馬 (Brain, hippocampus) が2配列 (解析母数 57,918)、全脳 (Brain, whole) が2配列(解析母数 59,069) など様々な組織で発現していた。
この結果より、[1]の転写開始点は、滑膜組織 (Synovial membrane tissue from rheumatioid arthritis) などで発現していることがわかった。また、[2]の転写開始点からは、[1]の転写開始点に比べ様々な組織由来のcDNAが発現していた。つまり、この染色体領域において、[1]のパターンようなエクソンの選択性で、アミノ酸配列が変化し、異なるタンパク質を発現させるようなmRNAのパターン変化の選択機構が特定の組織で起こる可能性が考えられた。
3) Expression specificity analysis and design of primers for real-time PCR In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions were used as detection regions. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
045_01-Specific region existing on the N-terminal side of the cDNA pattern of [1]: This is the transcription start region of the cDNA pattern of [1] that we newly analyzed, and is registered in the existing public DB Novel region that has not been processed → Fragment 045_01 (SEQ ID NO: 94) amplified by Primer045_01F (SEQ ID NO: 92) and Primer045_01R (SEQ ID NO: 93)
045_02-Transcription start region where [2] registered in the existing public DB exists, control to compare [1] → amplified by Primer045_02F (SEQ ID NO: 95) and Primer045_02R (SEQ ID NO: 96) Fragment 045_02 (SEQ ID NO: 97)
045_03-[1]-[2] Common region shared by all: [1] cDNA pattern we newly performed full-length cDNA sequence analysis, and [2] cDNA registered in the existing public DB A region where all the control patterns are in common to compare the expression level of the entire pattern → Fragment 045_03 (SEQ ID NO: 100) amplified by Primer045_03F (SEQ ID NO: 98) and Primer045_03R (SEQ ID NO: 99)
The exon regions specific to each of the cDNA patterns [1] and [2] shown above are mapped and compared to the human genome sequence of approximately 1.44 million 5 'end sequences obtained using the oligocap method. As a result, the following results were obtained.
In the newly analyzed cDNA [1] pattern, there are 3 sequences of 5 'terminal sequence, and the origin is 1 sequence of synovial membrane tissue from rheumatioid arthritis (analysis parameter 27,489), colon ( Colon) had 1 sequence (analysis parameter 8,398), NT2 cells were 5 weeks after induction of retinoic acid treatment, and growth inhibitor treatment 2 weeks (NT2RI) had 1 sequence (analysis parameter 32,662).
In the pattern of [2], which is a control registered in the existing public DB, there are 34 5 'terminal sequences, the origin of which is 9 sequences of thymus (analysis parameter 70,578), pericardium (Pericardium) 3 sequences (analysis parameter 8,781), 2 sequences of caudate nucleus (Brain, caudate nucleus) (analysis parameter 25,786), 2 sequences of trachea (analysis parameter 52,352), hippocampus (Brain, hippocampus) Two sequences (analysis parameter 57,918) and whole brain (Brain, whole) were expressed in various tissues such as two sequences (analysis parameter 59,069).
From this result, it was found that the transcription start point of [1] was expressed in synovial membrane tissue from rheumatioid arthritis. Moreover, cDNA derived from various tissues was expressed from the transcription start point of [2] as compared to the transcription start point of [1]. In other words, in this chromosomal region, there is a possibility that the selection mechanism of mRNA pattern change that causes different proteins to be expressed in specific tissues changes in amino acid sequence due to exon selectivity like the pattern of [1]. It was.

(2)リアルタイムPCRによる発現特異性の解析
組織間において発現に使われる転写開始点がどのように変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表10及び表11に示した。
(2) Analysis of expression specificity by real-time PCR In order to know how the transcription start point used for expression changes between tissues, the details of the expression level were analyzed by real-time PCR. The results are shown in Table 10 and Table 11.

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳 (Brain, whole) を用いて比較した。
045_01 (配列番号94) と045_02 (配列番号97) で比較される転写開始点の選択性によってmRNAが変わり、その結果としてORFが変化する比率は、以下の組織、細胞で大きく変化していた。
滑膜 (Synovial) 組織(リューマチ患者)及びCD34+細胞ODF(破骨細胞分化因子)処理誘導3日間 (CD34+ ODF 3days)、 CD34+細胞ODF処理誘導6日間(CD34+ ODF 6days)、CD34+細胞ODF処理誘導9日間(CD34+ ODF 9days)のCD34+細胞をODFで処理誘導した全てのステージにおいて、045_01 (配列番号94) で表される下流の転写開始点からの転写物(mRNA)が多かった(表10・表11)。
全脳 (Brain, whole) では045_02 (配列番号97) で表される既存の公共DBに登録されている転写開始点からの転写が多かった。
つまり滑膜 (Synovial) 組織(リューマチ患者)やODFで処理誘導したCD34+細胞では、脳とは異なる転写因子もしくは転写機構によって、転写開始点に多様性があることで、ORF領域の異なるmRNAが発現することが分かった。
これらの結果より、045_01 (配列番号94) という検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)045_[1]_1-N1 (配列番号89) の発現を比較することにより、血球系特にリューマチ患者の滑膜 (Synovial) 組織に特異的な治療・診断マーカーとして、また破骨細胞への分化に特異的な治療・診断マーカー(骨粗鬆症・リューマチやそれに至る過程の診断・治療マーカー)として利用することが可能であることが立証された。また、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についても血球系特にリューマチ患者の滑膜組織に特異的な治療・診断マーカー、また破骨細胞への分化に特異的な治療・診断マーカーとして有用であると思われる。
[1]のcDNAパターンのD-SYNOV4000324.1においてPrimer045_01R (配列番号93) がプライミングする130〜153塩基目を含む上流配列045_[1]_1-N3 (配列番号101)。
[1]のcDNAパターンにおいてPrimer045_01F (配列番号92) とPrimer045_01R (配列番号93)によって増幅される領域045_01 (配列番号94)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As experimental controls, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
Depending on the selectivity of the transcription start site compared between 045_01 (SEQ ID NO: 94) and 045_02 (SEQ ID NO: 97), the mRNA was changed, and as a result, the rate at which the ORF was changed greatly in the following tissues and cells.
Synovial tissue (rheumatic patients) and CD34 + cell ODF (osteoclast differentiation factor) treatment induction 3 days (CD34 + ODF 3days), CD34 + cell ODF treatment induction 6 days (CD34 + ODF 6days), CD34 + cell ODF treatment induction 9 There were many transcripts (mRNA) from the downstream transcription start point represented by 045_01 (SEQ ID NO: 94) in all stages in which CD34 + cells were induced with ODF for a day (CD34 + ODF 9days) (Table 10 and Tables). 11).
In the whole brain (Brain, whole), there was much transcription from the transcription start point registered in the existing public DB represented by 045_02 (SEQ ID NO: 97).
In other words, in synovial tissues (rheumatoid patients) and CD34 + cells induced by treatment with ODF, mRNAs with different ORF regions are expressed due to the diversity of transcription start points due to transcription factors or transcription mechanisms different from those in the brain. I found out that
From these results, the 5'-terminal region (region near the transcription start point) 045_ [1] _1-N1 (SEQ ID NO: 89) of the newly obtained cDNA region indicated by the detection region 045_01 (SEQ ID NO: 94) By comparing the expression, therapeutic and diagnostic markers specific to the blood cell system, especially synovial tissues of rheumatic patients, and specific therapeutic and diagnostic markers for osteoclast differentiation (osteoporosis, rheumatism and It has been proved that it can be used as a diagnostic and therapeutic marker for all processes. It is also possible to develop new drugs using compounds, antibodies, siRNA, etc. that target specific regions.
The following areas are also useful as therapeutic / diagnostic markers specific for the blood cell system, particularly the synovial tissue of rheumatic patients, and for therapeutic / diagnostic markers specific for osteoclast differentiation.
The upstream sequence 045_ [1] _1-N3 (SEQ ID NO: 101) containing the 130th to 153rd bases primed by Primer045_01R (SEQ ID NO: 93) in D-SYNOV4000324.1 of the cDNA pattern of [1].
Region 045_01 (SEQ ID NO: 94) amplified by Primer045_01F (SEQ ID NO: 92) and Primer045_01R (SEQ ID NO: 93) in the cDNA pattern of [1]

実施例9:クラスターchr11+275(データセット:064)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr11+275 (Human genome UCSC hg18 (NCBI Build34) 染色体11番、10,275,000 bp〜10,500,000 bp) にゲノムマッピングされた13配列の全長cDNA [D-SYNOV4007243.1, Z-TRACH3025625-01, D-BRAMY3006431.1, D-BRAWH3035395.1, D-NT2RI3008791.1, D-PLACE7015823.1, D-TESTI4045452.1, Z-CD34C3000530-01, Z-NT2RI3008366-01, Z-TESTI4015893-01, NM_000480.1, ENST00000256183, ENST00000356959,] について解析を行った。それらは、発現パターンの違いにより6種類に分類されるが、転写開始点に注目すると主なものとして以下の2種類が存在した。
[1] D-SYNOV4007243.1
[2] NM_000480.1, ENST00000256183
[1]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[2]とORFが異なっていた。
[1]は、既知の[2]よりも下流にある染色体領域より発現するため、ORF領域が異なっていた。
[1]〜[2]の2種類のcDNAパターンがもつORF領域は、同じ染色体領域より、異なる転写開始点から発現を行うことにより、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 9: cluster chr11 + 275 (data set: 064)
(1) Cluster analysis 1) Cluster characteristics 13 full-length cDNA genome mapped to cluster chr11 + 275 (Human genome UCSC hg18 (NCBI Build34) chromosome 11, 10,275,000 bp to 10,500,000 bp) [D-SYNOV4007243.1 , Z-TRACH3025625-01, D-BRAMY3006431.1, D-BRAWH3035395.1, D-NT2RI3008791.1, D-PLACE7015823.1, D-TESTI4045452.1, Z-CD34C3000530-01, Z-NT2RI3008366-01, Z -TESTI4015893-01, NM_000480.1, ENST00000256183, ENST00000356959,] was analyzed. They are classified into six types according to the difference in expression pattern, but the following two types existed mainly when focusing on the transcription start point.
[1] D-SYNOV4007243.1
[2] NM_000480.1, ENST00000256183
[1] is a cDNA we newly acquired and performed full-length cDNA sequence analysis, and the ORF was different from [2] registered in the existing public DB.
Since [1] is expressed from a chromosomal region downstream from the known [2], the ORF region was different.
The ORF regions of the two types of cDNA patterns [1] to [2] are expressed from the same chromosomal region from different transcription start sites, resulting in changes in amino acid sequences, resulting in diverse proteins and mRNAs. I found out that it was.

2)我々が新たに取得し全長cDNA配列解析を行ったD-SYNOV4007243.1([1])の特徴
064_[1]_1-N0 (配列番号102) : D-SYNOV4007243.1の核酸配列全領域
064_[1]_1-NA0 (配列番号103) : D-SYNOV4007243.1の核酸配列全領域とアミノ酸配列の併記
064_[1]_1-A0 (配列番号104) : D-SYNOV4007243.1のアミノ配列全領域
D-SYNOV4007243.1の1〜217塩基 (配列番号105) は、既存の公共DBに登録されているコントロールとなるNM_000480.1では存在しないエクソンが挿入するバリアントでNM_000480.1と相同性がない。この挿入するエクソン上に翻訳開始点と存在する為、NM_000480.1と比較するとN末端のアミノ酸が6残基 (配列番号106) 異なっていた。
064_[1]_1-N1 (配列番号105) : D-SYNOV4007243.1の217塩基の挿入核酸配列領域
064_[1]_1-A1 (配列番号106) : D-SYNOV4007243.1の6残基の挿入アミノ配列領域
064_[1]_1-N2 (配列番号107) : D-SYNOV4007243.1の217塩基の挿入領域中のORF核酸配列領域
064_[1]_1-A2 (配列番号106と同一) : D-SYNOV4007243.1の217塩基の挿入領域に関わるORFアミノ酸領域
2) Features of D-SYNOV4007243.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
064_ [1] _1-N0 (SEQ ID NO: 102): Nucleic acid sequence entire region of D-SYNOV4007243.1
064_ [1] _1-NA0 (SEQ ID NO: 103): Combination of the entire nucleic acid sequence and amino acid sequence of D-SYNOV4007243.1
064_ [1] _1-A0 (SEQ ID NO: 104): D-SYNOV4007243.1 full amino acid region
1-217 bases (SEQ ID NO: 105) of D-SYNOV4007243.1 are variants inserted by exons that do not exist in NM_000480.1, which is a control registered in the existing public DB, and have no homology with NM_000480.1. Since it exists as a translation start point on this inserted exon, the amino acid at the N-terminal was 6 residues (SEQ ID NO: 106) different from NM_000480.1.
064_ [1] _1-N1 (SEQ ID NO: 105): 217-base inserted nucleic acid sequence region of D-SYNOV4007243.1
064_ [1] _1-A1 (SEQ ID NO: 106): D-SYNOV4007243.1 6-residue insertion amino acid sequence region
064_ [1] _1-N2 (SEQ ID NO: 107): ORF nucleic acid sequence region in the 217-base insertion region of D-SYNOV4007243.1
064_ [1] _1-A2 (same as SEQ ID NO: 106): ORF amino acid region related to 217 base insertion region of D-SYNOV4007243.1

3)発現特異性解析とリアルタイムPCR用プライマーの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
064_01 - [1]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer064_01F (配列番号108) とPrimer064_01R (配列番号109) によって増幅される断片064_01 (配列番号110)
064_02 - 既存の公共DBに登録されている[2]の転写開始点領域、[1]を比較検討するためのコントロール
→Primer064_02F (配列番号111) とPrimer064_02R (配列番号112) によって増幅される断片064_02 (配列番号113)
064_03 - [1]、[2]が共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターン、さらには既存の公共DBに登録されている[2]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域
→Primer064_03F (配列番号114) とPrimer064_03R (配列番号115) によって増幅される断片064_03 (配列番号116)
上記に示された[1]、[2] のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1]のパターンでは5’末端配列が13配列存在し、その由来は滑膜組織(Synovial membrane tissue from rheumatioid arthritis) が3配列 (解析母数 27,489)、気管(Trachea) が3配列 (解析母数 52,352)、全脳 (Brain, whole) が2配列 (解析母数 59,069)、精巣 (Testis) が2配列 (解析母数 90,188)、脾臓 (Spleen) が1配列 (解析母数 33,950)、子宮 (Uterus) が1配列 (解析母数 49,561)、胸腺 (Thymus) が1配列 (解析母数 70,578) であった。
既存の公共DBに登録されているコントロールとなる [2]のパターンでは5’末端配列が11配列存在し、その由来は海馬 (Brain, hippocampus) が4配列 (解析母数 57,918)、全脳(Brain, whole) が3配列 (解析母数 59,069)、視床 (Brain, thalamus) が2配列 (解析母数 53,267)、扁桃 (Brain, amygdala) が2配列 (解析母数 58,640) であった。
この結果より、[1]の転写開始点は、滑膜組織 (Synovial membrane tissue from rheumatioid arthritis) などの血球系組織での発現が多いことがわかった。また、[2]の転写開始点では、脳での発現が多かった。これにより、滑膜組織(Synovial membrane tissue from rheumatioid arthritis)などの血球系組織とそれ以外の組織(特に脳)では、この染色体領域において、転写の機構が異なり、用いられている転写開始点も異なる可能性が考えられた。
3) Expression specificity analysis and design of primers for real-time PCR In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions were used as detection regions. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
064_01-Specific region existing on the N-terminal side of the cDNA pattern of [1]: This is the transcription start region of the cDNA pattern of [1] that we newly analyzed and registered in the existing public DB Novel region that has not been changed → Fragment 064_01 (SEQ ID NO: 110) amplified by Primer064_01F (SEQ ID NO: 108) and Primer064_01R (SEQ ID NO: 109)
064_02-Control for comparing the transcription start point region [2] registered in the existing public DB, [1] → Fragment 064_02 amplified by Primer064_02F (SEQ ID NO: 111) and Primer064_02R (SEQ ID NO: 112) (SEQ ID NO: 113)
064_03-Common region shared by [1] and [2]: cDNA pattern of [1] that we newly analyzed full-length cDNA sequence, and also [2] cDNA pattern registered in the existing public DB A region where all patterns serving as controls are in common to compare the expression level of the entire expression of the fragment → Fragment 064_03 (SEQ ID NO: 116) amplified by Primer064_03F (SEQ ID NO: 114) and Primer064_03R (SEQ ID NO: 115)
The exon regions specific to each of the cDNA patterns [1] and [2] shown above map the approximately 1.44 million 5 'end sequences obtained using the oligo cap method to human genome sequences for comparative analysis. As a result, the following results were obtained.
In the newly analyzed cDNA [1] pattern, there are 13 5 'terminal sequences, and the origin is 3 synovial membrane tissue from rheumatioid arthritis (analysis parameter 27,489), trachea ( Trachea) (3 sequences (analysis parameter 52,352), whole brain (Brain, whole) 2 sequences (analysis parameter 59,069), testis (Testis) 2 sequences (analysis parameter 90,188), spleen (Spleen) 1 sequence (Analysis parameter 33,950), 1 sequence of Uterus (analysis parameter 49,561), and 1 sequence of thymus (Thymus) (analysis parameter 70,578).
In the pattern of control [2], which is registered in the existing public DB, there are 11 5 'terminal sequences, which are derived from 4 sequences of hippocampus (Brain, hippocampus) (analysis parameter 57,918), whole brain ( Brain, whole) had 3 sequences (analysis parameter 59,069), thalamus (Brain, thalamus) had 2 sequences (analysis parameter 53,267), and tonsils (Brain, amygdala) had 2 sequences (analysis parameter 58,640).
From this result, it was found that the transcription start point of [1] is highly expressed in blood cell tissues such as synovial membrane tissue from rheumatioid arthritis. Moreover, at the transcription start point of [2], there was much expression in the brain. As a result, in the chromosomal region, the transcriptional mechanism is different between the blood cell tissue such as synovial membrane tissue from rheumatioid arthritis and the other tissue (especially the brain), and the transcription start point used is also different. The possibility was considered.

(2)リアルタイムPCRによる発現特異性の解析
血球系組織の中でもどのような組織で、どのような状態の時に発現に使われる転写開始点が変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表12及び表13に示した。
(2) Analysis of expression specificity by real-time PCR In order to know what kind of tissue in the blood cell system and in what state the transcription start point used for expression changes, details of the expression level are real-time. Analyzed by PCR. The results are shown in Tables 12 and 13.

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル(Mix, viscus tissues)と全脳(Brain, whole)を用いて比較した。
064_01(配列番号110)と064_02(配列番号113)で比較される転写開始点の選択性によってmRNAが変わり、その結果としてORFが変化する比率は、以下の組織で大きく変化していた。
骨髄(Bone Marrow)、胸腺(Thymus)、脾臓(Spleen)、CD34+細胞(CD34+)、CD34+細胞を破骨細胞分化因子(ODF)処理誘導3日間(CD34+ ODF 3 days)、CD34+細胞をODF処理誘導6日間(CD34+ ODF 6 days)、CD34+細胞をODF処理誘導9日間(CD34+ ODF 9 days)、滑膜(Synovial)組織(リューマチ患者)、Jurkat細胞(Jurkat)、脊髄(Spinal Cord)において、064_01(配列番号110)で表される下流の転写開始点からの転写物(mRNA)が特に多かった(表12・表13)。
つまりこれらの組織では、他の組織とは異なり、転写因子もしくは、転写機構によって、転写開始点に多様性があることで、異なるORFをもつmRNAが発現していた。
これらの結果より、064_01(配列番号110)という検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)064_[1]_1-N1(配列番号105)の発現を比較することにより、骨髄(Bone Marrow)、胸腺(Thymus)、脾臓(Spleen)、Jurkat細胞(Jurkat)の血球系に特異的なマーカーとして、また滑膜(Synovial)組織(リューマチ患者)のマーカーや破骨細胞の分化に特異的な分化マーカーとして用いることが可能になることが立証された。また、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についても骨髄(Bone Marrow)、胸腺(Thymus)、脾臓(Spleen)、Jurkat細胞(Jurkat)の血球系に特異的なマーカーとして、また滑膜(Synovial)組織(リューマチ患者)のマーカーや破骨細胞の分化に特異的な分化マーカーとしてとして有用であると思われる。
[1]のcDNAパターンのD-SYNOV4007243.1においてPrimer064_01R(配列番号109)がプライミングする185〜205塩基目を含む上流配列064_[1]_1-N3(配列番号117)。
[1]のcDNAパターンにおいてPrimer064_01F(配列番号108)とPrimer064_01R(配列番号109)によって増幅される領域064_01(配列番号110)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As experimental controls, comparison was made using samples (Mix, viscus tissues) mixed with normal visceral tissues described in Example 3 and whole brain (Brain, whole).
Depending on the selectivity of the transcription start site compared between 064_01 (SEQ ID NO: 110) and 064_02 (SEQ ID NO: 113), the mRNA changes, and as a result, the rate at which the ORF changes greatly changes in the following tissues.
Bone marrow, Thymus, Spleen, CD34 + cells (CD34 +), CD34 + cells induced by osteoclast differentiation factor (ODF) 3 days (CD34 + ODF 3 days), CD34 + cells induced by ODF 6 days (CD34 + ODF 6 days), CD34 + cells were treated with ODF 9 days (CD34 + ODF 9 days), synovial tissue (rheumatic patients), Jurkat cells (Jurkat), spinal cord (064_01) The transcript (mRNA) from the downstream transcription start point represented by SEQ ID NO: 110) was particularly large (Tables 12 and 13).
In other words, unlike these other tissues, transcription factors or transcription mechanisms caused the diversity of transcription start points to express mRNA with different ORFs in these tissues.
From these results, the 5′-terminal region of the newly obtained cDNA region indicated by the detection region 064_01 (SEQ ID NO: 110) (region near the transcription start point) 064_ [1] _1-N1 (SEQ ID NO: 105) By comparing the expression, the bone marrow (Bone Marrow), thymus (Thymus), spleen (Spleen), Jurkat cell (Jurkat) blood cell lineage specific markers, and synovial tissue (rheumatic patients) It has been proved that it can be used as a marker or a differentiation marker specific for osteoclast differentiation. It is also possible to develop new drugs using compounds, antibodies, siRNA, etc. that target specific regions.
In the following areas, bone marrow (Bone Marrow), thymus (Thymus), spleen (Spleen), Jurkat cell (Jurkat) blood cell lineage specific markers, as well as synovial tissue (rheumatic patients) markers It seems to be useful as a differentiation marker specific for the differentiation of osteoclasts.
The upstream sequence 064_ [1] _1-N3 (SEQ ID NO: 117) containing the 185th to 205th bases primed by Primer064_01R (SEQ ID NO: 109) in the D-SYNOV4007243.1 of the cDNA pattern of [1].
Region 064_01 (SEQ ID NO: 110) amplified by Primer064_01F (SEQ ID NO: 108) and Primer064_01R (SEQ ID NO: 109) in the cDNA pattern of [1]

実施例10:クラスターchr5+2320(データセット:074)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr5+2320 (Human genome UCSC hg18 (NCBI Build34) 染色体5番、180,240,000 bp〜 180,380,000 bp) にゲノムマッピングされた11配列の全長cDNA [D-NETRP2004161.1, D-COLON2000670.1, Z-NETRP2006158-01, AY358385.1, C-COL04713, C-COL07391, ENST00000231229, ENST00000342868, NM_006707.2, NM_024850.1, NM_197975.1] について解析を行った。それらは、発現パターンの違いにより5種類に分類されるが、転写開始点に注目すると主なものとして以下の2種類が存在した。
[1] D-NETRP2004161.1
[2] C-COL04713 (AK025111.1), ENST00000231229, NM_024850.1
[1]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[2]とORFが異なっていた。
[1]は、既知の[2]よりも下流にある染色体領域より発現するため、ORF領域が異なっていた。
[1]〜[2]の2種類のcDNAパターンがもつORF領域は、同じ染色体領域より、異なる転写開始点から発現を行うことにより、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 10: Cluster chr5 + 2320 (data set: 074)
(1) Cluster analysis 1) Cluster characteristics 11 full-length cDNA genome-mapped to cluster chr5 + 2320 (Human genome UCSC hg18 (NCBI Build34) chromosome 5, 180,240,000 bp to 180,380,000 bp) [D-NETRP2004161.1 , D-COLON2000670.1, Z-NETRP2006158-01, AY358385.1, C-COL04713, C-COL07391, ENST00000231229, ENST00000342868, NM_006707.2, NM_024850.1, NM_197975.1]. They are classified into five types according to the difference in expression pattern, but the following two types existed mainly when focusing on the transcription start point.
[1] D-NETRP2004161.1
[2] C-COL04713 (AK025111.1), ENST00000231229, NM_024850.1
[1] is a cDNA we newly acquired and performed full-length cDNA sequence analysis, and the ORF was different from [2] registered in the existing public DB.
Since [1] is expressed from a chromosomal region downstream from the known [2], the ORF region was different.
The ORF regions of the two types of cDNA patterns [1] to [2] are expressed from the same chromosomal region from different transcription start sites, resulting in changes in amino acid sequences, resulting in diverse proteins and mRNAs. I found out that it was.

2)我々が新たに取得し全長cDNA配列解析を行ったD-NETRP2004161.1([1])の特徴
074_[1]_1-N0 (配列番号118) : D-NETRP2004161.1の核酸配列全領域
074_[1]_1-NA0 (配列番号119) : D-NETRP2004161.1の核酸配列全領域とアミノ酸配列の併記
074_[1]_1-A0 (配列番号120) : D-NETRP2004161.1のアミノ酸配列全領域
D-NETRP2004161.1の1〜134塩基(配列番号121)のエクソン(第1エクソン)は既存の公共DBに登録されているコントロールとなるNM_024850.1には存在しないエクソンであり相同性がない。NM_024850.1のORFの翻訳開始点はD-NETRP2004161.1には存在しないエクソンである第1エクソン上に存在するのに対してD-NETRP2004161.1の翻訳開始点は第2エクソン(NM_024850.1の第3エクソン)の領域に存在する。その為NM_024850.1に比べN末端側のアミノ酸が184残基短くなっていた。
この変化に伴いSignalP及びPSORTでNM_024850.1の1〜16アミノ酸目に存在すると予測されたN末端分泌シグナル配列がD-NETRP2004161.1では存在しない。
また既存の公共DBに登録されているコントロールとなるNM_024850.1の941〜1,070塩基に存在する130塩基のエクソン(配列番号126)がD-NETRP2004161.1の525〜526塩基の領域には存在せず欠失している。この変化に伴いORFの翻訳フレームが変化し、NM_024850.1と比較するとC末端のアミノ酸が238残基変化していた。
074_[1]_1-N 1(配列番号121): D-NETRP2004161.1の134塩基の挿入核酸配列領域
074_[1]_1-N 2(配列番号122): D-NETRP2004161.1の290塩基目を翻訳開始点とするORFの5’UTR領域289塩基
074_[1]_1-N3(配列番号123): D-NETRP2004161.1の欠失核酸配列領域
074_[1]_1-A1(配列番号124): D-NETRP2004161.1の欠失に伴い変化しているアミノ配列領域
074_[1]_1-N4 (配列番号123と同一) : D-NETRP2004161.1の欠失領域中のORF核酸配列領域074_[1]_1-A2 (配列番号125) : D-NETRP2004161.1の欠失領域に関わるORFアミノ酸領域
074_[1]_C-N1 (配列番号126) : D-NETRP2004161.1の525〜526塩基の領域に挿入されるNM_024850.1の941〜1,070塩基に存在する130塩基の挿入核酸配列
074_[1]_C-A1 (配列番号127) : D-NETRP2004161.1の525〜526塩基の領域に挿入されるNM_024850.1の941〜1,070塩基に存在する130塩基の挿入核酸配列に関わるアミノ酸領域
2) Features of D-NETRP2004161.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
074_ [1] _1-N0 (SEQ ID NO: 118): The entire nucleic acid sequence of D-NETRP2004161.1
074_ [1] _1-NA0 (SEQ ID NO: 119): Combination of the entire nucleic acid sequence and amino acid sequence of D-NETRP2004161.1
074_ [1] _1-A0 (SEQ ID NO: 120): The entire amino acid sequence of D-NETRP2004161.1
The exon (first exon) of 1 to 134 bases (SEQ ID NO: 121) of D-NETRP2004161.1 is an exon that does not exist in NM_024850.1 which is a control registered in the existing public DB and has no homology. The translation start point of ORF of NM_024850.1 exists on the first exon which is an exon that does not exist in D-NETRP2004161.1, whereas the translation start point of D-NETRP2004161.1 is the second exon (NM_024850.1 3rd exon). Therefore, the amino acid on the N-terminal side was 184 residues shorter than NM_024850.1.
With this change, D-NETRP2004161.1 does not have an N-terminal secretory signal sequence that is predicted to exist at amino acids 1 to 16 of NM_024850.1 by SignalP and PSORT.
In addition, the 130 base exon (SEQ ID NO: 126) present at 941 to 1,070 bases of NM_024850.1, which is the control registered in the existing public DB, should be present in the region of 525 to 526 bases of D-NETRP2004161.1. It is deleted. With this change, the translation frame of ORF changed, and the C-terminal amino acid changed by 238 residues compared to NM_024850.1.
074_ [1] _1-N 1 (SEQ ID NO: 121): 134-base inserted nucleic acid sequence region of D-NETRP2004161.1
074_ [1] _1-N 2 (SEQ ID NO: 122): ORF 5'UTR region 289 bases starting from the 290th base of D-NETRP2004161.1
074_ [1] _1-N3 (SEQ ID NO: 123): Deleted nucleic acid sequence region of D-NETRP2004161.1
074_ [1] _1-A1 (SEQ ID NO: 124): Amino sequence region changed with deletion of D-NETRP2004161.1
074_ [1] _1-N4 (same as SEQ ID NO: 123): ORF nucleic acid sequence region 074_ [1] _1-A2 (SEQ ID NO: 125) in the deleted region of D-NETRP2004161.1: lack of D-NETRP2004161.1 ORF amino acid region related to the loss region
074_ [1] _C-N1 (SEQ ID NO: 126): 130-base inserted nucleic acid sequence present in 941-1,070 bases of NM_024850.1 to be inserted into the 525-526 base region of D-NETRP2004161.1
074_ [1] _C-A1 (SEQ ID NO: 127): Amino acid region related to the 130-base inserted nucleic acid sequence present in 941-1,070 bases of NM_024850.1 to be inserted in the 525-526 base region of D-NETRP2004161.1

3)発現特異性解析とリアルタイムPCR用プライマーとTaqManプローブの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
074_01 - [1]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer074_01F (配列番号128) とPrimer074_01R (配列番号129) によって増幅される断片074_01 (配列番号130)
使用したTaqManプローブ074_01TP:(配列番号131)
074_03 - 既存の公共DBに登録されている[2]の転写開始点領域、[1]を比較検討するためのコントロール
→Primer074_03F (配列番号132) とPrimer074_03R (配列番号133) によって増幅される断片074_03 (配列番号134)
使用したTaqManプローブ074_03TP:(配列番号135)
074_04 - [1]、[2]が共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターン、さらには既存の公共DBに登録されている[2]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域
→Primer074_04F (配列番号136) とPrimer074_04R (配列番号137) によって増幅される断片074_04 (配列番号138)
使用したTaqManプローブ074_04TP:(配列番号139)
上記に示された[1]、[2] のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1] のパターンでは5’末端配列が6配列存在し、その由来は好中球 (Neutrophil) が5配列 (解析母数 9,170)、肺 (Lung) が1配列 (解析母数 16,146) であった。
既存の公共DBに登録されているコントロールとなる [2] のパターンでは5’末端配列が19配列存在し、その由来は結腸 (Colon) が12配列 (解析母数 8,398)、小腸 (Small Intestine) が6配列 (解析母数 16,767)、直腸 (Rectum) が1配列 (解析母数 2,723)であった。
この結果より、[1] の転写開始点は、好中球 (Neutrophil) での発現が多いことがわかった。また、[2] の転写開始点では、結腸 (Colon)、小腸 (Small Intestine) で発現が多くみられた。これにより、血球系組織とそれ以外の組織では、この染色体領域において、転写の機構が異なり、用いられている転写開始点も異なる可能性が考えられた。
3) Expression specificity analysis and real-time PCR primers and TaqMan probe design In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions are detected regions. It was. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
074_01-Specific region existing on the N-terminal side of the cDNA pattern of [1]: This is the transcription start region of the cDNA pattern of [1] that we newly analyzed, and is registered in the existing public DB Novel region that has not been processed → Fragment 074_01 (SEQ ID NO: 130) amplified by Primer074_01F (SEQ ID NO: 128) and Primer074_01R (SEQ ID NO: 129)
TaqMan probe used: 074_01TP: (SEQ ID NO: 131)
074_03-Control for comparing the transcription start point region [2] registered in the existing public DB, [1] → Fragment 074_03 amplified by Primer074_03F (SEQ ID NO: 132) and Primer074_03R (SEQ ID NO: 133) (SEQ ID NO: 134)
TaqMan probe used: 074_03TP: (SEQ ID NO: 135)
074_04-Common region shared by [1] and [2]: cDNA pattern of [1] that we newly analyzed full-length cDNA sequence, and also [2] cDNA pattern registered in the existing public DB A region where all the patterns that serve as a control are common to compare the expression level as a whole → Fragment 074_04 (SEQ ID NO: 138) amplified by Primer074_04F (SEQ ID NO: 136) and Primer074_04R (SEQ ID NO: 137)
TaqMan probe used: 074_04TP: (SEQ ID NO: 139)
The exon regions specific to each of the cDNA patterns [1] and [2] shown above map the approximately 1.44 million 5 'end sequences obtained using the oligo cap method to human genome sequences for comparative analysis. As a result, the following results were obtained.
In the newly analyzed cDNA [1] pattern, there are 6 5 'terminal sequences, which are derived from 5 sequences of neutrophil (analysis parameter 9,170) and 1 sequence of lung (Lung). The analysis parameter was 16,146.
In the pattern of control [2] registered in the existing public DB, there are 19 5 'terminal sequences, and the origin is 12 colons (analysis parameter 8,398), small intestine 6 sequences (analysis parameter 16,767) and rectum (Rectum) 1 sequence (analysis parameter 2,723).
From this result, it was found that the transcription start point of [1] is highly expressed in neutrophils. In addition, at the transcription start point in [2], expression was frequently observed in the colon and small intestine. As a result, it was considered that the transcriptional mechanism is different in the chromosomal region between the blood cell tissue and the other tissue, and the transcription start point used may be different.

(2)リアルタイムPCRによる発現特異性の解析
血球系組織の中でも、どのような組織、どのような状態の時に発現に使われる転写開始点が変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表14に示した。
(2) Analysis of expression specificity by real-time PCR In order to know what kind of tissue and in what state the transcription start point used for expression changes in blood cell tissue, details of the expression level are real-time. Analyzed by PCR. The results are shown in Table 14.

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳 (Brain, whole) を用いて比較した。
074_01 (配列番号130) と074_03 (配列番号134) で比較される転写開始点の選択性によってmRNAが変わり、その結果としてORFが変化する比率は、以下の組織で大きく変化していた。
骨髄 (Bone Marrow)、脾臓 (Spleen)、滑膜 (Synovial)組織(リューマチ患者)、CD34+細胞を破骨細胞分化因子(ODF)処理誘導3日間(CD34+ ODF 3days)では074_01 (配列番号130) で表される下流の転写開始点からの転写物(mRNA)が特に多かった(表14)。骨髄 (Bone Marrow)、脾臓 (Spleen)、滑膜 (Synovial)組織(リューマチ患者)、CD34+細胞をODF処理誘導3日間 (CD34+ ODF 3days)では、他の組織とは転写因子もしくは転写機構が異なり、転写開始点に多様性が生じることでORF領域の異なるmRNAが発現していた。
これらの結果より、074_01 (配列番号130) という検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)074_[1]_1-N1 (配列番号121) の発現を比較することにより、リューマチ患者の滑膜 (Synovial)組織の血球系に特異的な治療・診断マーカーとして、破骨細胞への分化、特に分化の初期段階を検出する治療・診断マーカー(骨粗鬆症・リューマチやそれに至る過程の診断・治療マーカー)として、また骨髄(Bone Marrow)、脾臓 (Spleen)の血球系に特異的なマーカーとして、利用することが可能であることが立証された。さらに、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についてもリューマチ患者の滑膜 (Synovial)組織の血球系に特異的な治療・診断マーカーとして、破骨細胞への分化、特に分化の初期段階を検出する治療・診断マーカーとして、また骨髄 (Bone Marrow)、脾臓 (Spleen)の血球系に特異的なマーカーとして有用であると思われる。
[1]のcDNAパターンのD-NETRP2004161.1においてPrimer074_01R (配列番号129) がプライミングする128〜146塩基目を含む上流配列074_[1]_1-N5 (配列番号140)
[1]のcDNAパターンにおいてPrimer074_01F (配列番号128) とPrimer074_01R (配列番号129) によって増幅される領域074_01 (配列番号130)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As experimental controls, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
The mRNA changes depending on the selectivity of the transcription start site compared between 074_01 (SEQ ID NO: 130) and 074_03 (SEQ ID NO: 134), and as a result, the rate at which the ORF changes greatly varies in the following tissues.
Bone marrow, spleen (spleen), synovial (synovial) tissue (rheumatic patients), CD34 + cells treated with osteoclast differentiation factor (ODF) treatment for 3 days (CD34 + ODF 3days) at 074_01 (SEQ ID NO: 130) The transcript (mRNA) from the downstream transcription start point represented was particularly large (Table 14). The bone marrow (Bone Marrow), spleen (Spleen), synovial (Synovial) tissue (rheumatoid patients), CD34 + cells induced ODF treatment for 3 days (CD34 + ODF 3days), the transcription factor or transcription mechanism is different from other tissues, Due to the diversity of transcription start sites, mRNAs with different ORF regions were expressed.
From these results, the 5′-terminal region of the newly obtained cDNA region indicated by the detection region 074_01 (SEQ ID NO: 130) (region near the transcription start point) 074_ [1] _1-N1 (SEQ ID NO: 121) As a therapeutic / diagnostic marker specific to the blood cell system of synovial tissue in rheumatic patients by comparing the expression, a therapeutic / diagnostic marker that detects differentiation into osteoclasts, particularly the early stages of differentiation (osteoporosis) -It has been proved that it can be used as a marker for diagnosis and treatment of rheumatism and the processes leading to it, and as a specific marker for the bone marrow (Bone Marrow) and spleen (Spleen) blood cells. In addition, new drug development using compounds, antibodies, siRNA, etc. that target specific regions is also possible.
In addition, the following areas are also used as therapeutic / diagnostic markers specific to the blood system of the synovial tissue of rheumatic patients, as a therapeutic / diagnostic marker for detecting differentiation into osteoclasts, particularly the early stages of differentiation, and It seems to be useful as a marker specific to the blood cell system of bone marrow and spleen.
Upstream sequence 074_ [1] _1-N5 (SEQ ID NO: 140) containing the 128th to 146th bases primed by Primer074_01R (SEQ ID NO: 129) in D-NETRP2004161.1 with the cDNA pattern of [1]
Region 074_01 (SEQ ID NO: 130) amplified by Primer074_01F (SEQ ID NO: 128) and Primer074_01R (SEQ ID NO: 129) in the cDNA pattern of [1]

実施例11:クラスターchr6-1987(データセット:026)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr6-1987 (Human genome UCSC hg18 (NCBI Build34) 染色体6番、24,900,000 bp〜25,200,000 bp) にゲノムマッピングされた8配列の全長cDNA [D-NT2RI3001993.1, D-SMINT2013276.1, AB002384.1, BC001232.1, C-KIDNE2007944, ENST00000229635, ENST00000259698, NM_015864.2] について解析を行った。それらは、転写開始点の発現パターンの違いにより5種類に分類されるが、主なものとして以下の4種類が存在した。
[1] D-NT2RI3001993.1
[2] D-SMINT2013276.1
[3] AB002384.1
[4] NM_015864.2, BC001232.1
[1]、[2]は、我々が新たに取得しに全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[3]、[4]とORFが異なっていた。
[1]、[2]は、既知の[3]、[4]よりも上流にある染色体領域より発現するため、ORF領域が異なっていた。
[1]〜[4]の4種類のcDNAパターンがもつORF領域は、同じ染色体領域より、異なる転写開始点から発現を行うことにより、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 11: Cluster chr6-1987 (Data set: 026)
(1) Cluster analysis 1) Cluster characteristics 8 full-length cDNA genome-mapped on cluster chr6-1987 (Human genome UCSC hg18 (NCBI Build34) chromosome 6, 24,900,000 bp to 25,200,000 bp) [D-NT2RI3001993.1 , D-SMINT2013276.1, AB002384.1, BC001232.1, C-KIDNE2007944, ENST00000229635, ENST00000259698, NM_015864.2]. They are classified into five types depending on the expression pattern of the transcription start point, and the following four types exist as main ones.
[1] D-NT2RI3001993.1
[2] D-SMINT2013276.1
[3] AB002384.1
[4] NM_015864.2, BC001232.1
[1] and [2] are cDNAs that we newly acquired and performed full-length cDNA sequence analysis, and their ORFs were different from [3] and [4] registered in the existing public DB.
Since [1] and [2] are expressed from the chromosomal region upstream of the known [3] and [4], the ORF regions are different.
The ORF regions of the four types of cDNA patterns [1] to [4] are expressed from the same chromosomal region from different transcription start sites, resulting in changes in amino acid sequences, resulting in diverse proteins and mRNAs. I found out.

2)我々が新たに取得し全長cDNA配列解析を行ったD-NT2RI3001993.1([1])の特徴
026_[1]_1-N0 (配列番号141) : D-NT2RI3001993.1の核酸配列全領域
026_[1]_1-NA0 (配列番号142) : D-NT2RI3001993.1の核酸配列全領域とアミノ酸配列の併記
026_[1]_1-A0 (配列番号143) : D-NT2RI3001993.1のアミノ配列全領域
D-NT2RI3001993.1の1〜123塩基 (配列番号144) は、既存の公共DBに登録されているコントロールとなるNM_015864.2では存在しないエクソンが挿入するバリアントでNM_015864.2と相同性がない。この挿入するエクソン上に翻訳開始点が存在する為、NM_015864.2と比較するとN末端のアミノ酸が29残基 (配列番号145) 異なっていた。
D-NT2RI3001993.1の1,920〜3,256塩基 (配列番号148) は、既存の公共DBに登録されているコントロールとなるNM_015864.2では存在しないエクソンが挿入するバリアントでNM_015864.2と相同性がない。この挿入するエクソン上に翻訳終止点が存在する為、NM_015864.2と比較するとC末端のアミノ酸が428残基 (配列番号149) 異なっていた。
026_[1]_1-N1 (配列番号144) : D-NT2RI3001993.1の123塩基の挿入核酸配列領域
026_[1]_1-A1 (配列番号145) : D-NT2RI3001993.1の29残基の挿入アミノ配列領域
026_[1]_1-N2 (配列番号146) : D-NT2RI3001993.1の123塩基の挿入領域中のORF核酸配列領域
026_[1]_1-A2 (配列番号147) : D-NT2RI3001993.1の123塩基の挿入領域に関わるORFアミノ酸領域
026_[1]_1-N3 (配列番号148) : D-NT2RI3001993.1の1,337塩基の挿入核酸配列領域
026_[1]_1-A3 (配列番号149) : D-NT2RI3001993.1の428残基の挿入アミノ配列領域
026_[1]_1-N4 (配列番号150) : D-NT2RI3001993.1の1,337塩基の挿入領域中のORF核酸配列領域
026_[1]_1-A4 (配列番号149と同一) : D-NT2RI3001993.1の1,337塩基の挿入領域に関わるORFアミノ酸領域
2) Features of D-NT2RI3001993.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
026_ [1] _1-N0 (SEQ ID NO: 141): D-NT2RI3001993.1 nucleic acid entire region
026_ [1] _1-NA0 (SEQ ID NO: 142): Combination of the entire nucleic acid sequence and amino acid sequence of D-NT2RI3001993.1
026_ [1] _1-A0 (SEQ ID NO: 143): D-NT2RI3001993.1 full amino acid region
1-123 bases (SEQ ID NO: 144) of D-NT2RI3001993.1 are variants inserted by exons that do not exist in NM_015864.2, which is a control registered in the existing public DB, and have no homology with NM_015864.2. Since there was a translation start point on this inserted exon, the N-terminal amino acid was 29 residues (SEQ ID NO: 145) different from NM_015864.2.
1,920-3,256 bases (SEQ ID NO: 148) of D-NT2RI3001993.1 are variants inserted by exons that do not exist in NM_015864.2, which is a control registered in the existing public DB, and have no homology with NM_015864.2. Due to the presence of a translation termination point on this inserted exon, the C-terminal amino acid was 428 residues (SEQ ID NO: 149) different from NM_015864.2.
026_ [1] _1-N1 (SEQ ID NO: 144): 123-base inserted nucleic acid sequence region of D-NT2RI3001993.1
026_ [1] _1-A1 (SEQ ID NO: 145): 29-residue insertion amino acid sequence region of D-NT2RI3001993.1
026_ [1] _1-N2 (SEQ ID NO: 146): ORF nucleic acid sequence region in the 123 base insertion region of D-NT2RI3001993.1
026_ [1] _1-A2 (SEQ ID NO: 147): ORF amino acid region related to the 123-base insertion region of D-NT2RI3001993.1
026_ [1] _1-N3 (SEQ ID NO: 148): 1,337-base inserted nucleic acid sequence region of D-NT2RI3001993.1
026_ [1] _1-A3 (SEQ ID NO: 149): D-NT2RI3001993.1 428-residue insertion amino acid sequence region
026_ [1] _1-N4 (SEQ ID NO: 150): ORF nucleic acid sequence region in the 1,337 base insertion region of D-NT2RI3001993.1
026_ [1] _1-A4 (same as SEQ ID NO: 149): ORF amino acid region related to 1,337 base insertion region of D-NT2RI3001993.1

3)我々が新たに取得し全長cDNA配列解析を行ったD-SMINT2013276.1([2])の特徴
026_[2]_1-N0 (配列番号151) : D-SMINT2013276.1の核酸配列全領域
026_[2]_1-NA0 (配列番号152) : D-SMINT2013276.1の核酸配列全領域とアミノ酸配列の併記
026_[2]_1-A0 (配列番号153) : D-SMINT2013276.1のアミノ配列全領域
D-SMINT2013276.1の1〜168塩基 (配列番号154) は、既存の公共DBに登録されているコントロールとなるNM_015864.2では存在しないエクソンが挿入するバリアントでNM_015864.2と相同性がない。この挿入するエクソン上に翻訳開始点が存在する為、NM_015864.2と比較するとN末端のアミノ酸が34残基 (配列番号155) 異なっていた。
D-SMINT2013276.1の1,965〜2,415塩基 (配列番号158) は、既存の公共DBに登録されているコントロールとなるNM_015864.2では存在しないエクソンが挿入するバリアントでNM_015864.2と相同性がない。この挿入するエクソン上に翻訳終止点が存在する為、NM_015864.2と比較するとC末端のアミノ酸が23残基 (配列番号159) 異なっていた。
026_[2]_1-N1 (配列番号154) : D-SMINT2013276.1の168塩基の挿入核酸配列領域
026_[2]_1-A1 (配列番号155) : D-SMINT2013276.1の34残基の挿入アミノ配列領域
026_[2]_1-N2 (配列番号156) : D-SMINT2013276.1の168塩基の挿入領域中のORF核酸配列領域
026_[2]_1-A2 (配列番号157) : D-SMINT2013276.1の168塩基の挿入領域に関わるORFアミノ酸領域
026_[2]_1-N3 (配列番号158) : D-SMINT2013276.1の451塩基の挿入核酸配列領域
026_[2]_1-A3 (配列番号159) : D-SMINT2013276.1の23残基の挿入アミノ配列領域
026_[2]_1-N4 (配列番号160) : D-SMINT2013276.1の451塩基の挿入領域中のORF核酸配列領域
026_[2]_1-A4 (配列番号159と同一) : D-SMINT2013276.1の451塩基の挿入領域に関わるORFアミノ酸領域
3) Features of D-SMINT2013276.1 ([2]) that we newly acquired and performed full-length cDNA sequence analysis
026_ [2] _1-N0 (SEQ ID NO: 151): D-SMINT2013276.1 whole region of nucleic acid sequence
026_ [2] _1-NA0 (SEQ ID NO: 152): Combination of the entire nucleic acid sequence and amino acid sequence of D-SMINT2013276.1
026_ [2] _1-A0 (SEQ ID NO: 153): D-SMINT2013276.1 full amino acid region
1-168 bases (SEQ ID NO: 154) of D-SMINT2013276.1 are variants inserted by exons that do not exist in NM_015864.2, which is a control registered in the existing public DB, and have no homology with NM_015864.2. Since there was a translation start point on this inserted exon, the N-terminal amino acid was 34 residues (SEQ ID NO: 155) different from NM_015864.2.
1,965-2,415 bases (SEQ ID NO: 158) of D-SMINT2013276.1 are variants inserted by exons that do not exist in NM_015864.2, which is a control registered in the existing public DB, and have no homology with NM_015864.2. Due to the presence of a translation termination point on this inserted exon, the C-terminal amino acid was 23 residues (SEQ ID NO: 159) different from NM_015864.2.
026_ [2] _1-N1 (SEQ ID NO: 154): D-SMINT2013276.1 168 bases inserted nucleic acid sequence region
026_ [2] _1-A1 (SEQ ID NO: 155): 34 amino acid insertion region of D-SMINT2013276.1
026_ [2] _1-N2 (SEQ ID NO: 156): ORF nucleic acid sequence region in the 168 base insertion region of D-SMINT2013276.1
026_ [2] _1-A2 (SEQ ID NO: 157): ORF amino acid region related to 168 base insertion region of D-SMINT2013276.1
026_ [2] _1-N3 (SEQ ID NO: 158): D-SMINT2013276.1 451 base insertion nucleic acid sequence region
026_ [2] _1-A3 (SEQ ID NO: 159): 23-residue insertion amino acid sequence region of D-SMINT2013276.1
026_ [2] _1-N4 (SEQ ID NO: 160): ORF nucleic acid sequence region in the 451 base insertion region of D-SMINT2013276.1
026_ [2] _1-A4 (same as SEQ ID NO: 159): ORF amino acid region related to 451 base insertion region of D-SMINT2013276.1

4)発現特異性解析とリアルタイムPCR用プライマーの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
026_02 - [1]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer026_02F (配列番号161) とPrimer026_02R (配列番号162) によって増幅される断片026_02 (配列番号163)
026_03 - 既存の公共DBに登録されている[3]の転写開始点領域、[1]を比較検討するためのコントロール
→Primer026_03F (配列番号164) とPrimer026_03R (配列番号165) によって増幅される断片026_03 (配列番号166)
026_05 - [1]、[3]が共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターン、さらには既存の公共DBに登録されている[3]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域
→Primer026_05F (配列番号167) とPrimer026_05R (配列番号168) によって増幅される断片026_05 (配列番号169)
上記に示された[1]、[3]のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1]のパターンでは5’末端配列が95配列存在し、その由来は好中球 (Neutrophil) が56配列(解析母数 9,170)、脾臓 (Spleen) が21配列 (解析母数 33,950)、正常末梢血単核細胞 (Human peripheral blood mononuclear cells) が8配列 (解析母数 7,900)、胸腺 (Thymus) が5配列 (解析母数 70,578)、NT2細胞をレチノイン酸処理誘導5週間後、生育阻害剤処理2週間(NT2RI) が2配列 (解析母数 32,662)、視床(Brain, thalamus) が2配列 (解析母数 53,267)、滑膜 (Synovial) が1配列 (解析母数 27,489) であった。
既存の公共DBに登録されているコントロールとなる[3]のパターンでは5’末端配列が26配列存在し、その由来は海馬 (Brain, hippocampus) が6配列 (解析母数 57,918)、扁桃(Brain, amygdala) が3配列 (解析母数 58,640)、子宮 (Uterus) が3配列 (解析母数 49,561)、胎児脳 (Brain, Fetal) が3配列(解析母数 47,574)、NT2細胞をレチノイン酸処理誘導5週間後、生育阻害剤処理2週間(NT2RI) が2配列 (解析母数 32,662) など様々な組織で発現していた。
この結果より、[1]の転写開始点は、好中球 (Neutrophil)、脾臓 (Spleen)などの血球系の組織での発現が多いことがわかった。また、[3]の転写開始点では脳組織など様々な組織での発現がみられた。これにより、血球系の組織とそれ以外の組織では、この染色体領域において、転写の機構が異なり、用いられている転写開始点も異なる可能性が考えられた。
4) Expression specificity analysis and design of primers for real-time PCR In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions were used as detection regions. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
026_02-Specific region existing on the N-terminal side of the cDNA pattern of [1]: This is the transcription start region of the cDNA pattern of [1] that we newly analyzed and registered in the existing public DB Novel region that has not been processed → Fragment 026_02 (SEQ ID NO: 163) amplified by Primer026_02F (SEQ ID NO: 161) and Primer026_02R (SEQ ID NO: 162)
026_03-Control for comparing [1] transcription start site region [1] registered in existing public DB → Fragment 026_03 amplified by Primer026_03F (SEQ ID NO: 164) and Primer026_03R (SEQ ID NO: 165) (SEQ ID NO: 166)
026_05-Common region shared by [1] and [3]: cDNA pattern of [1] that we newly analyzed full-length cDNA sequence, and [3] cDNA pattern registered in the existing public DB A region where all patterns serving as controls are in common to compare the expression level as a whole → Fragment 026_05 (SEQ ID NO: 169) amplified by Primer026_05F (SEQ ID NO: 167) and Primer026_05R (SEQ ID NO: 168)
The exon regions specific to each of the cDNA patterns [1] and [3] shown above are mapped and compared with the human genome sequence of approximately 1.44 million 5 'end sequences obtained using the oligocap method. As a result, the following results were obtained.
In the newly analyzed cDNA [1] pattern, there are 95 5 'end sequences, 56 from neutrophils (analysis parameter 9,170) and 21 from spleen (Spleen). (Analysis parameter 33,950), 8 sequences of human peripheral blood mononuclear cells (analysis parameter 7,900), 5 sequences of thymus (analysis parameter 70,578), NT2 cells treated with retinoic acid 5 weeks after induction, 2 sequences for growth inhibitor treatment (NT2RI) (analysis parameter 32,662), 2 sequences for thalamus (Brain, thalamus) (analysis parameter 53,267), 1 sequence for synovial (analysis) The parameter was 27,489).
In the pattern of control [3] registered in the existing public DB, there are 26 5 'terminal sequences, and the origin is 6 sequences of hippocampus (Brain, hippocampus) (analysis parameter 57,918), tonsils (Brain , amygdala) (analysis parameter 58,640), uterus (Uterus) 3 sequences (analysis parameter 49,561), fetal brain (Brain, Fetal) 3 sequences (analysis parameter 47,574), NT2 cells treated with retinoic acid Five weeks after induction, 2 weeks of growth inhibitor treatment (NT2RI) were expressed in various tissues such as 2 sequences (analysis parameter 32,662).
From this result, it was found that the transcription start point of [1] is highly expressed in blood cell tissues such as neutrophil and spleen. In addition, at the transcription start point of [3], expression was observed in various tissues such as brain tissue. As a result, it was considered that the transcriptional mechanism is different in the chromosomal region between the blood cell tissue and the other tissue, and the transcription start point used may be different.

(2)リアルタイムPCRによる発現特異性の解析
血球系組織の中でもどのような組織、どのような状態のときに発現に使われる転写開始点が変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表15に示した。
(2) Analysis of expression specificity by real-time PCR In order to know what kind of tissue in the blood cell system tissue and in what state the transcription start point used for expression changes, details of the expression level are real-time Analyzed by PCR. The results are shown in Table 15.

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳 (Brain, whole) を用いて比較した。
026_02 (配列番号163) と026_03 (配列番号166) で比較される転写開始点の選択性によってmRNAが変わり、その結果としてORFが変化する比率は、以下の組織、細胞で変化していた。
脾臓 (Spleen), 骨髄 (Bone Marrow)では、026_02 (配列番号163) で表される上流の転写開始点からの転写物(mRNA)が多かった(表15)。
つまり脾臓 (Spleen), 骨髄 (Bone Marrow)では、他の組織とは異なり転写因子もしくは、転写機構によって、転写開始点に多様性があることで、異なるORFをもつmRNAが発現している。
また、CD34+細胞を破骨細胞分化因子(ODF) 処理誘導3日間 (CD34+ ODF 3days)、CD34+細胞をODF処理誘導9日間 (CD34+ ODF 9days)、全脳 (Brain, whole) では026_03 (配列番号166) で表される既知の下流よりの転写開始点からの転写物(mRNA)が多かった。
これらの結果より、026_02 (配列番号163) という検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)026_[1]_1-N1 (配列番号144) の発現を比較することにより、脾臓(Spleen), 骨髄 (Bone Marrow)の血球系に特異的なマーカーとして利用することが可能であることが立証された。また、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についても脾臓 (Spleen)、骨髄(Bone Marrow)の血球系に特異的なマーカーとして有用であると思われる。
[1]のcDNAパターンのD-NT2RI3001993.1においてPrimer026_02R (配列番号162) がプライミングする99〜122塩基目を含む上流配列026_[1]_1-N5 (配列番号170)。
[1]のcDNAパターンにおいてPrimer026_02F (配列番号161) とPrimer026_02R (配列番号162) によって増幅される領域026_02 (配列番号163)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As experimental controls, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
Depending on the selectivity of the transcription start site compared between 026_02 (SEQ ID NO: 163) and 026_03 (SEQ ID NO: 166), the mRNA was changed, and as a result, the rate at which ORF was changed in the following tissues and cells.
In the spleen (Spleen) and bone marrow (Bone Marrow), there were many transcripts (mRNA) from the upstream transcription start point represented by 026_02 (SEQ ID NO: 163) (Table 15).
In other words, unlike the other tissues, spleen and bone marrow express mRNAs with different ORFs due to the diversity of transcription start sites depending on transcription factors or transcription mechanisms.
In addition, CD34 + cells were induced with osteoclast differentiation factor (ODF) treatment for 3 days (CD34 + ODF 3 days), CD34 + cells were induced with ODF treatment for 9 days (CD34 + ODF 9days), and whole brain (Brain, whole) was 026_03 (SEQ ID NO: 166). There were many transcripts (mRNA) from the transcription start point from the downstream known by ().
From these results, the 5′-terminal region of the newly obtained cDNA region indicated by the detection region 026_02 (SEQ ID NO: 163) (region near the transcription start point) 026_ [1] _1-N1 (SEQ ID NO: 144) By comparing the expression, it was proved that it can be used as a specific marker for the spleen and bone marrow blood cells. It is also possible to develop new drugs using compounds, antibodies, siRNA, etc. that target specific regions.
The following areas are also useful as markers specific to the spleen and bone marrow blood cells.
The upstream sequence 026_ [1] _1-N5 (SEQ ID NO: 170) containing the 99th to 122nd bases primed by Primer026_02R (SEQ ID NO: 162) in D-NT2RI3001993.1 of the cDNA pattern of [1].
Region 026_02 (SEQ ID NO: 163) amplified by Primer026_02F (SEQ ID NO: 161) and Primer026_02R (SEQ ID NO: 162) in the cDNA pattern of [1]

実施例12:クラスターchr12+613(データセット:040)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr12+613 (Human genome UCSC hg18 (NCBI Build34) 染色体12番、32,400,000 bp〜 32,700,000 bp) にゲノムマッピングされた9本の全長cDNA [D-THYMU3006588.1, D-D3OST2003177.1, AL713762.1, AL832064.1, C-BRAMY2019963, C-FEBRA2017154, C-TESTI2001141, ENST00000266482, NM_139241.1] について解析を行った。それらは、転写開始点の発現パターンの違いにより4種類に分類されるが、主なものとして以下の3種類が存在した。
[1] D-THYMU3006588.1
[2] D-D3OST2003177.1
[3] C-TESTI2001141 (AK057294.1), ENST00000266482, NM_139241.1
[1]、[2]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[3]とORFが異なっていた。
[1]は既知の[3]よりも下流の染色体領域、[2]は既知の[3]よりも上流にある染色体領域より発現するため、ORF領域が異なっていた。
[1]〜[3]の3種類のcDNAパターンがもつORF領域は、同じ染色体領域より、異なる転写開始点から発現を行うことにより、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 12: cluster chr12 + 613 (data set: 040)
(1) Cluster analysis 1) Cluster characteristics Nine full-length cDNAs mapped to the cluster chr12 + 613 (Human genome UCSC hg18 (NCBI Build34) chromosome 12, 32,400,000 bp to 32,700,000 bp) [D-THYMU3006588.1 , D-D3OST2003177.1, AL713762.1, AL832064.1, C-BRAMY2019963, C-FEBRA2017154, C-TESTI2001141, ENST00000266482, NM_139241.1]. They are classified into four types depending on the expression pattern of the transcription start point, and the following three types exist as main ones.
[1] D-THYMU3006588.1
[2] D-D3OST2003177.1
[3] C-TESTI2001141 (AK057294.1), ENST00000266482, NM_139241.1
[1] and [2] are cDNAs we newly acquired and subjected to full-length cDNA sequence analysis, and the ORF was different from [3] registered in the existing public DB.
Since [1] is expressed from a chromosomal region downstream from the known [3], and [2] is expressed from a chromosomal region upstream from the known [3], the ORF region was different.
The ORF regions of the three types of cDNA patterns [1] to [3] are expressed from different transcription start sites from the same chromosomal region, thereby changing the amino acid sequence and producing diverse proteins and mRNAs. I found out that it was.

2)我々が新たに取得し全長cDNA配列解析を行ったD-THYMU3006588.1([1])の特徴
040_[1]_1-N0 (配列番号171) : D-THYMU3006588.1の核酸配列全領域
040_[1]_1-NA0 (配列番号172) : D-THYMU3006588.1の核酸配列全領域とアミノ酸配列の併記
040_[1]_1-A0 (配列番号173) : D-THYMU3006588.1のアミノ配列全領域
D-THYMU3006588.1の1〜177塩基 (配列番号174) は、既存の公共DBに登録されているコントロールとなるNM_139241.1では存在しないエクソンが挿入するバリアントでNM_139241.1と相同性がない。この挿入するエクソン上に翻訳開始点が存在する為、NM_139241.1と比較するとN末端のアミノ酸が112残基 (配列番号175) 異なっていた。
040_[1]_1-N1 (配列番号174) : D-THYMU3006588.1の177塩基の挿入核酸配列領域
040_[1]_1-A1 (配列番号175) : D-THYMU3006588.1の112残基の挿入アミノ配列領域
040_[1]_1-N2 (配列番号176) : D-THYMU3006588.1の177塩基の挿入領域中のORF核酸配列領域
040_[1]_1-A2 (配列番号177) : D-THYMU3006588.1の177塩基の挿入領域に関わるORFアミノ酸領域
2) Features of D-THYMU3006588.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
040_ [1] _1-N0 (SEQ ID NO: 171): The entire nucleic acid sequence of D-THYMU3006588.1
040_ [1] _1-NA0 (SEQ ID NO: 172): Combination of the entire nucleic acid sequence and amino acid sequence of D-THYMU3006588.1
040_ [1] _1-A0 (SEQ ID NO: 173): D-THYMU3006588.1 full amino acid region
1-177 bases (SEQ ID NO: 174) of D-THYMU3006588.1 are variants inserted by exons that do not exist in NM_139241.1, which is a control registered in the existing public DB, and have no homology with NM_139241.1. Since there was a translation start point on this exon to be inserted, the amino acid at the N-terminal was 112 residues (SEQ ID NO: 175) different from NM_139241.1.
040_ [1] _1-N1 (SEQ ID NO: 174): 177 base insertion nucleic acid sequence region of D-THYMU3006588.1
040_ [1] _1-A1 (SEQ ID NO: 175): 112 amino acid insertion region of D-THYMU3006588.1
040_ [1] _1-N2 (SEQ ID NO: 176): ORF nucleic acid sequence region in the 177 base insertion region of D-THYMU3006588.1
040_ [1] _1-A2 (SEQ ID NO: 177): ORF amino acid region related to 177 base insertion region of D-THYMU3006588.1

3)我々が新たに取得し全長cDNA配列解析を行ったD-D3OST2003177.1([2])の特徴
040_[2]_1-N0 (配列番号178) : D-D3OST2003177.1の核酸配列全領域
040_[2]_1-NA0 (配列番号179) : D-D3OST2003177.1の核酸配列全領域とアミノ酸配列の併記
040_[2]_1-A0 (配列番号180) : D-D3OST2003177.1のアミノ酸配列全領域
D-D3OST2003177.1の1〜172塩基 (配列番号181) は、既存の公共DBに登録されているコントロールとなるNM_139241.1では存在しないエクソンが挿入するバリアントでNM_139241.1と相同性がない。この挿入するエクソン上に翻訳開始点が存在する為、NM_139241.1と比較するとN末端のアミノ酸が85残基 (配列番号182) 異なっていた。
040_[2]_1-N1 (配列番号181) : D-D3OST2003177.1の172塩基の挿入核酸配列領域
040_[2]_1-A1 (配列番号182) : D-D3OST2003177.1の85残基の挿入アミノ配列領域
040_[2]_1-N2 (配列番号183) : D-D3OST2003177.1の172塩基の挿入領域中のORF核酸配列領域
040_[2]_1-A2 (配列番号184) : D-D3OST2003177.1の172塩基の挿入領域に関わるORFアミノ酸領域
3) Features of D-D3OST2003177.1 ([2]) that we newly acquired and performed full-length cDNA sequence analysis
040_ [2] _1-N0 (SEQ ID NO: 178): The entire nucleic acid sequence of D-D3OST2003177.1
040_ [2] _1-NA0 (SEQ ID NO: 179): Combination of D-D3OST2003177.1 nucleic acid sequence and amino acid sequence
040_ [2] _1-A0 (SEQ ID NO: 180): D-D3OST2003177.1 full amino acid sequence
1-172 bases (SEQ ID NO: 181) of D-D3OST2003177.1 are variants inserted by exons that do not exist in NM_139241.1, which is a control registered in the existing public DB, and have no homology with NM_139241.1. Since there was a translation start point on the exon to be inserted, the N-terminal amino acid was 85 residues (SEQ ID NO: 182) different from NM_139241.1.
040_ [2] _1-N1 (SEQ ID NO: 181): 172 bases inserted nucleic acid sequence region of D-D3OST2003177.1
040_ [2] _1-A1 (SEQ ID NO: 182): 85 amino acid insertion region of D-D3OST2003177.1
040_ [2] _1-N2 (SEQ ID NO: 183): ORF nucleic acid sequence region in the 172 base insertion region of D-D3OST2003177.1
040_ [2] _1-A2 (SEQ ID NO: 184): ORF amino acid region related to 172 base insertion region of D-D3OST2003177.1

4)発現特異性解析とリアルタイムPCR用プライマーの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
040_01 - [1]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer040_01F (配列番号185) とPrimer040_01R (配列番号186) によって増幅される断片040_01(配列番号187)
040_02 - [2]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[2]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer040_02F (配列番号188) とPrimer040_02R (配列番号189) によって増幅される断片040_02 (配列番号190)
040_03 - 既存の公共DBに登録されている[3]の転写開始点領域、[1]、[2]を比較検討するためのコントロール
→Primer040_03F (配列番号191) とPrimer040_03R (配列番号192) によって増幅される断片040_03 (配列番号193)
040_04 - [1]〜[3]が共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]、[2]のcDNAパターン、さらには既存の公共DBに登録されている[3]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域
→Primer040_04F (配列番号194) とPrimer040_04R (配列番号195) によって増幅される断片040_04 (配列番号196)
上記に示された[1]〜[3] のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1]のパターンでは5’末端配列が4配列存在し、その由来は正常胸腺 (Thymus) が1配列 (解析母数 70,578)、軟骨細胞HC (Human Chondrocytes) が1配列 (解析母数 9,397)、正常メサンギウム細胞 (Normal human mesangial cells) が1配列 (解析母数 16,053)、NT2細胞をレチノイン酸処理と生育阻害剤処理により神経分化後、神経を濃縮回収 (NT2 Neuron) が1配列 (解析母数 16,337) であった。
我々が新たに解析したcDNAの[2]のパターンでは5’末端配列が3配列存在し、その由来は好中球 (Neutrophil) が2配列 (解析母数 9,170)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導3日間(D3OST) が1配列 (解析母数 5,092) であった。
既存の公共DBに登録されているコントロールとなる [3]のパターンでは5’末端配列が15配列存在し、その由来は精巣 (Testis) が12配列 (解析母数 90,188)、胎児脳 (Brain, Fetal) が2配列 (解析母数 55,564)、海馬 (Brain, hippocampus) が1配列 (解析母数 57,918) であった。
この結果より、[1]、[2]の転写開始点は、胸腺(Thymus)、好中球 (Neutrophil)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導などでの発現が多かった。また、[3]の転写開始点では、精巣 (Testis) での発現が多かった。これにより、血球系の組織とそれ以外の組織では、この染色体領域において、転写の機構が異なり用いられている転写開始点も異なる可能性が考えられた。
4) Expression specificity analysis and design of primers for real-time PCR In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions were used as detection regions. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
040_01-Specific region existing on the N-terminal side of the cDNA pattern of [1]: This is the transcription start region of the cDNA pattern of [1] that we newly analyzed and registered in the existing public DB Novel region that has not been changed → Fragment 040_01 (SEQ ID NO: 187) amplified by Primer040_01F (SEQ ID NO: 185) and Primer040_01R (SEQ ID NO: 186)
040_02-Specific region existing on the N-terminal side of the cDNA pattern of [2]: This is the transcription start region of the cDNA pattern of [2] that we newly analyzed, and is registered in the existing public DB Novel region that has not been processed → Fragment 040_02 (SEQ ID NO: 190) amplified by Primer040_02F (SEQ ID NO: 188) and Primer040_02R (SEQ ID NO: 189)
040_03-[3] transcription start region registered in the existing public DB, control to compare and examine [1], [2] → amplified by Primer040_03F (SEQ ID NO: 191) and Primer040_03R (SEQ ID NO: 192) Fragment 040_03 (SEQ ID NO: 193)
040_04-Common region shared by [1] to [3]: We newly performed full-length cDNA sequence analysis [1], [2] cDNA pattern, and also registered in the existing public DB [3] In order to compare the expression level of the entire cDNA pattern of [], a region in which all the control patterns are common → Fragment 040_04 (SEQ ID NO: 195) amplified by Primer040_04F (SEQ ID NO: 194) and Primer040_04R (SEQ ID NO: 195) 196)
The exon region specific to each of the cDNA patterns [1] to [3] shown above is a comparative analysis by mapping approximately 1.44 million 5 'end sequences obtained using the oligo cap method to the human genome sequence. As a result, the following results were obtained.
In the newly analyzed cDNA pattern [1], there are 4 5 'terminal sequences, and the origin is 1 sequence of normal thymus (Thymus) (analysis parameter 70,578), chondrocyte HC (Human Chondrocytes). 1 sequence (analysis parameter 9,397), 1 sequence of normal human mesangial cells (analysis parameter 16,053), NT2 cells were differentiated by retinoic acid treatment and growth inhibitor treatment, and nerves were concentrated and recovered (NT2 Neuron) was one sequence (analysis parameter 16,337).
In the newly analyzed cDNA [2] pattern, there are 3 5 'end sequences, 2 of which are neutrophils (analysis parameter 9,170), and CD34 + cells are differentiated into osteoclasts. Factor (ODF) treatment induction 3 days (D3OST) was 1 sequence (analysis parameter 5,092).
In the pattern of [3], which is a control registered in the existing public DB, there are 15 5 'terminal sequences, the origin of which is 12 sequences of testis (analysis parameter 90,188), fetal brain (Brain, Fetal) was 2 sequences (analysis parameter 55,564), and hippocampus (Brain, hippocampus) was 1 sequence (analysis parameter 57,918).
From these results, the transcription start sites of [1] and [2] were highly expressed in the thymus (Thymus), neutrophil (Neutrophil), and CD34 + cells induced by osteoclast differentiation factor (ODF) treatment. In addition, at the transcription start point of [3], the expression was high in the testis. As a result, it was considered that there is a possibility that the transcription start point used in the chromosomal region differs depending on the transcription mechanism used in the blood cell tissue and other tissues.

(2)リアルタイムPCRによる発現特異性の解析
血球系組織の中でもどのような組織、どのような状態のときに発現に使われる転写開始点が変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表16に示した。
(2) Analysis of expression specificity by real-time PCR In order to know what kind of tissue in the blood cell system tissue and in what state the transcription start point used for expression changes, details of the expression level are real-time Analyzed by PCR. The results are shown in Table 16.

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳(Brain, whole)を用いて比較した。
040_01 (配列番号187)、040_02 (配列番号190) と040_03 (配列番号193) で比較される転写開始点の選択性によってmRNAが変わり、その結果としてORFが変化する比率は、以下の組織、細胞で大きく変化していた。
骨髄 (Bone Marrow)、胸腺(Thymus)、脾臓(Spleen)、CD34+細胞(CD34+)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導3日間(CD34+ ODF 3days)、CD34+細胞をODF 処理誘導6日間 (CD34+ ODF 6days)、CD34+細胞をODF処理誘導9日間 (CD34+ ODF 9days)、滑膜 (Synovial) 組織(リューマチ患者)、脊髄(Spinal Cord)では040_01 (配列番号187)、040_02 (配列番号190) で表される新たに見つけた転写開始点からの転写物(mRNA)が040_03 (配列番号193) に比べ多かった(表16)。
特に040_01 (配列番号187) で表される転写開始点では、胸腺 (Thymus)、脾臓 (Spleen)、CD34+細胞をODF処理誘導6日間 (CD34+ ODF 6days)、CD34+細胞をODF処理誘導9日間 (CD34+ ODF 9days)、滑膜 (Synovial) 組織(リューマチ患者)、脊髄(Spinal Cord)において発現が多く、040_02 (配列番号190) で表される転写開始点では、骨髄(Bone Marrow)、CD34+細胞(CD34+)、CD34+細胞をODF処理誘導3日間 (CD34+ ODF 3days)での発現が多かった。
つまり血球系組織では、他の組織とは異なり転写因子もしくは、転写機構によって、転写開始点に多様性があることで、異なるORFをもつmRNAが発現していた。
これらの結果より、040_01 (配列番号187) という検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)040_[1]_1-N1 (配列番号174) の発現を比較することにより、リューマチ患者の滑膜 (Synovial)組織の血球系に特異的な治療・診断マーカーとして、破骨細胞の分化、特に分化の中・後期段階を検出する治療・診断マーカー(骨粗鬆症・リューマチやそれに至る過程の診断・治療マーカー)として、また胸腺(Thymus)、脾臓(Spleen)の血球系に特異的なマーカーとして、利用することが可能であることが立証された。
また、040_02 (配列番号190) という検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)040_[2]_1-N1 (配列番号181) の発現を比較することにより、破骨細胞への分化、特に分化の初期段階を検出する治療・診断マーカー(骨粗鬆症・リューマチやそれに至る過程の診断・治療マーカー)として、また骨髄 (Bone Marrow)の血球系に特異的なマーカーとして、利用することが可能であることが立証された。
さらに、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についてもリューマチ患者の滑膜 (Synovial) 組織の血球系に特異的な治療・診断マーカーとして、破骨細胞の分化、特に分化の中・後期段階を検出する治療・診断マーカーとして、また胸腺(Thymus)、脾臓(Spleen)の血球系に特異的なマーカーとして有用であると思われる。
[1]のcDNAパターンのD-THYMU3006588.1においてPrimer040_01R (配列番号186) がプライミングする182〜202塩基目を含む上流配列040_[1]_1-N3 (配列番号197)。
[2]のcDNAパターンのD-D3OST2003177.1においてPrimer040_02R (配列番号189) がプライミングする162〜179塩基目を含む上流配列040_[2]_1-N3 (配列番号198)。
[1]のcDNAパターンにおいてPrimer040_01F (配列番号185) とPrimer040_01R (配列番号186) によって増幅される領域040_01(配列番号187)
[2]のcDNAパターンにおいてPrimer040_02F (配列番号188) とPrimer040_02R (配列番号189) によって増幅される領域040_02 (配列番号190)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As an experimental control, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
040_01 (SEQ ID NO: 187), 040_02 (SEQ ID NO: 190) and 040_03 (SEQ ID NO: 193) mRNA changes depending on the selectivity of the transcription start point compared, and as a result, the rate of change of ORF is as follows: It has changed greatly.
Bone Marrow, Thymus, Spleen, CD34 + cells (CD34 +), CD34 + cells induced by osteoclast differentiation factor (ODF) treatment for 3 days (CD34 + ODF 3days), CD34 + cells induced by ODF treatment6 Days (CD34 + ODF 6days), CD34 + cells induced to ODF treatment 9 days (CD34 + ODF 9days), synovial tissue (rheumatic patients), spinal cord (040_01 (SEQ ID NO: 187), 040_02 (SEQ ID NO: 190) ) The transcript (mRNA) from the newly found transcription start point represented by) was higher than that of 040_03 (SEQ ID NO: 193) (Table 16).
In particular, at the transcription start point represented by 040_01 (SEQ ID NO: 187), thymus (Thymus), spleen (Spleen), CD34 + cells were induced with ODF treatment for 6 days (CD34 + ODF 6days), and CD34 + cells were induced with ODF treatment for 9 days (CD34 + ODF 9days), synovial tissues (rheumatoid patients), spinal cord (Spinal Cord), the expression is 040_02 (SEQ ID NO: 190) at the transcription start point, bone marrow (Bone Marrow), CD34 + cells (CD34 + ), CD34 + cells were highly expressed in ODF treatment-induced 3 days (CD34 + ODF 3days).
In other words, unlike blood cells, mRNAs with different ORFs were expressed in blood cell tissues because of the diversity of transcription start points depending on transcription factors or transcription mechanisms.
From these results, the 5′-terminal region of the newly obtained cDNA region indicated by the detection region 040_01 (SEQ ID NO: 187) (region near the transcription start point) 040_ [1] _1-N1 (SEQ ID NO: 174) By comparing the expression, a therapeutic / diagnostic marker that detects osteoclast differentiation, especially the middle and late stages of differentiation, as a specific therapeutic / diagnostic marker for the synovial tissues of rheumatic patients It has been proved that it can be used as a marker for diagnosis and treatment of osteoporosis and rheumatism and the process leading to it, and as a marker specific to the blood cell system of thymus and spleen.
Also, compare the expression of the 040_ [2] _1-N1 (SEQ ID NO: 181) 5'-terminal region (region near the transcription start site) of the newly obtained cDNA region indicated by the detection region 040_02 (SEQ ID NO: 190) Specific to osteoclast differentiation, especially as a therapeutic / diagnostic marker (diagnostic / therapeutic marker for osteoporosis / rheumatism and the process leading to it) and bone marrow (Bone Marrow) It was proved that it can be used as a typical marker.
In addition, new drug development using compounds, antibodies, siRNA, etc. that target specific regions is also possible.
In addition, as a therapeutic / diagnostic marker specific to the blood cell system of the synovial tissue of rheumatic patients in the following areas, osteoclast differentiation, especially as a therapeutic / diagnostic marker for detecting the middle and late stages of differentiation, In addition, it seems to be useful as a marker specific to the blood cell system of the thymus and spleen.
An upstream sequence 040_ [1] _1-N3 (SEQ ID NO: 197) containing nucleotides 182 to 202 primed by Primer040_01R (SEQ ID NO: 186) in D-THYMU3006588.1 of the cDNA pattern of [1].
An upstream sequence 040_ [2] _1-N3 (SEQ ID NO: 198) containing nucleotides 162 to 179 that Primer040_02R (SEQ ID NO: 189) primes in D-D3OST2003177.1 of the cDNA pattern of [2].
Region 040_01 (SEQ ID NO: 187) amplified by Primer040_01F (SEQ ID NO: 185) and Primer040_01R (SEQ ID NO: 186) in the cDNA pattern of [1]
Region 040_02 (SEQ ID NO: 190) amplified by Primer040_02F (SEQ ID NO: 188) and Primer040_02R (SEQ ID NO: 189) in the cDNA pattern of [2]

実施例13:クラスターchr4-770(データセット:069)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr4-770 (Human genome UCSC hg18 (NCBI Build34) 染色体4番、104,290,000 bp〜104,360,000 bp) にゲノムマッピングされた11配列の全長cDNA [D-D3OST2000831.1, D-MESAN2002178.1, D-OCBBF3022929.1, BC047447.1, BX640844.1, C-HEP22543, ENST00000339611, ENST00000355967, ENST00000358643, ENST00000360917, NM_178833.3] について解析を行った。それらは、発現パターンの違いにより7種類に分類されるが、転写開始点に注目すると主なものとして以下の2種類が存在した。
[1] D-D3OST2000831.1
[2] C-HEP22543 (AK172823.1), ENST00000360917, NM_178833.3
[1]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[2]とORFが異なっていた。
[1]は、既知の[2]よりも下流にある染色体領域より発現するが共通した翻訳開始点をもつため、転写開始点の変化によるORFの変化は存在しない。しかし、欠失領域が存在するためORF領域が異なっていた。
[1]〜[2]の2種類のcDNAパターンがもつORF領域は、同じ染色体領域より、異なる転写開始点から発現を行い欠失がおこることにより、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 13: Cluster chr4-770 (Data set: 069)
(1) Cluster analysis 1) Cluster characteristics 11 full-length cDNA genome mapped to cluster chr4-770 (Human genome UCSC hg18 (NCBI Build34) chromosome 4, 104,290,000 bp to 104,360,000 bp) [D-D3OST2000831.1 , D-MESAN2002178.1, D-OCBBF3022929.1, BC047447.1, BX640844.1, C-HEP22543, ENST00000339611, ENST00000355967, ENST00000358643, ENST00000360917, NM_178833.3] were analyzed. They are classified into seven types according to the difference in expression pattern, but the following two types existed mainly when focusing on the transcription start point.
[1] D-D3OST2000831.1
[2] C-HEP22543 (AK172823.1), ENST00000360917, NM_178833.3
[1] is a cDNA we newly acquired and performed full-length cDNA sequence analysis, and the ORF was different from [2] registered in the existing public DB.
[1] is expressed from a chromosomal region downstream of the known [2], but has a common translation start point, so there is no change in ORF due to a change in the transcription start point. However, the ORF region was different due to the presence of the deletion region.
The ORF regions of the two cDNA patterns [1] to [2] are expressed from the same chromosomal region and expressed from different transcription start sites, resulting in deletions that change the amino acid sequence, resulting in diverse proteins. And mRNA was found.

2)我々が新たに取得し全長cDNA配列解析を行ったD-D3OST2000831.1([1])の特徴
069_[1]_1-N0 (配列番号199) : D-D3OST2000831.1の核酸配列全領域
069_[1]_1-NA0 (配列番号200) : D-D3OST2000831.1の核酸配列全領域とアミノ酸配列の併記
069_[1]_1-A0 (配列番号201) : D-D3OST2000831.1のアミノ配列全領域
D-D3OST2000831.1の1〜135塩基 (配列番号202) は、既存の公共DBに登録されているコントロールとなるNM_178833.3では存在しないエクソンが挿入するバリアントで、NM_178833.3とは相同性がない。また、既存の公共DBに登録されているコントロールとなるNM_178833.3の904〜1,074塩基に存在する171塩基のエクソン (配列番号205) がD-D3OST2000831.1の448〜449塩基の領域には存在せず欠失している。D-D3OST2000831.1とNM_178833.3では翻訳開始点・翻訳終止点は共通しているが、171塩基の欠失が存在することでORFが異なり、D-D3OST2000831.1のアミノ酸長はNM_178833.3と比較すると57残基短くなっていた。
この変化に伴い、NM_178833.3の80〜102アミノ酸目、114〜136アミノ酸目に存在するとSOSUIによって予測した、2ヶ所の膜貫通ドメインがD-D3OST2000831.1では消失していた。069_[1]_1-N1 (配列番号202) : D-D3OST2000831.1の135塩基の挿入核酸配列領域
069_[1]_1-N2 (配列番号203) : D-D3OST2000831.1の欠失核酸配列領域
069_[1]_1-N3 (配列番号203と同一) : D-D3OST2000831.1の欠失領域中のORF核酸配列領域069_[1]_1-A1 (配列番号204) : D-D3OST2000831.1の欠失領域に関わるORFアミノ酸領域
069_[1]_C-N1 (配列番号205) : D-D3OST2000831.1の448〜449塩基の領域に挿入されるNM_178833.3の904〜1,074塩基に存在する171塩基の挿入核酸配列
069_[1]_C-A1 (配列番号206) : D-D3OST2000831.1の448〜449塩基の領域に挿入されるNM_178833.3の904〜1,074塩基に存在する171塩基の挿入核酸配列に関わるアミノ酸領域
2) Features of D-D3OST2000831.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
069_ [1] _1-N0 (SEQ ID NO: 199): The entire nucleic acid sequence of D-D3OST2000831.1
069_ [1] _1-NA0 (SEQ ID NO: 200): Combination of the entire nucleic acid sequence and amino acid sequence of D-D3OST2000831.1
069_ [1] _1-A0 (SEQ ID NO: 201): D-D3OST2000831.1 full amino acid region
D-D3OST2000831.1 base sequence 1-135 (SEQ ID NO: 202) is a variant inserted by an exon that does not exist in NM_178833.3, which is a control registered in the existing public DB, and has homology to NM_178833.3 Absent. In addition, a 171 base exon (SEQ ID NO: 205) present in 904 to 1,074 bases of NM_178833.3, which is a control registered in an existing public DB, is present in the region of 448 to 449 bases in D-D3OST2000831.1. It is deleted without. D-D3OST2000831.1 and NM_178833.3 share the same translation start point and translation end point, but the ORF differs due to the presence of a 171 base deletion, and the amino acid length of D-D3OST2000831.1 is NM_178833.3 57 residues were shorter than
With this change, two transmembrane domains predicted by SOSUI to exist at amino acids 80 to 102 and 114 to 136 of NM_178833.3 were lost in D-D3OST2000831.1. 069_ [1] _1-N1 (SEQ ID NO: 202): 135-base inserted nucleic acid sequence region of D-D3OST2000831.1
069_ [1] _1-N2 (SEQ ID NO: 203): D-D3OST2000831.1 deleted nucleic acid sequence region
069_ [1] _1-N3 (identical to SEQ ID NO: 203): ORF nucleic acid sequence region 069_ [1] _1-A1 (SEQ ID NO: 204) in the deleted region of D-D3OST2000831.1: lack of D-D3OST2000831.1 ORF amino acid region related to the loss region
069_ [1] _C-N1 (SEQ ID NO: 205): 171 base inserted nucleic acid sequence present in 904 to 1,074 bases of NM_178833.3 inserted in the region of 448 to 449 bases in D-D3OST2000831.1
069_ [1] _C-A1 (SEQ ID NO: 206): Amino acid region related to the 171-base inserted nucleic acid sequence present in 904-1,074 bases of NM_178833.3 inserted in the 448-449 base region of D-D3OST2000831.1

3)発現特異性解析とリアルタイムPCR用プライマーの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
069_01 - [1]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer069_01F (配列番号207) とPrimer069_01R (配列番号208) によって増幅される断片069_01 (配列番号209)
069_02 - 既存の公共DBに登録されている[2]の転写開始点領域、[1]を比較検討するためのコントロール
→Primer069_02F (配列番号210) とPrimer069_02R (配列番号211) によって増幅される断片069_02 (配列番号212)
069_03 -[1]のcDNAパターンのエクソンが欠失している領域の配列情報を利用して特異的に抽出した領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンにおいて、ORFを変化させているエクソンの欠失領域
→Primer069_03F (配列番号213) とPrimer069_03R (配列番号214) によって増幅される断片069_03 (配列番号215)
069_04 -既存の公共DBに登録されている[2]のcDNAパターンの[1]の欠失領域と比較した場合にどちらとも区別できるような特異的な領域であり、[1]を比較検討するためのコントロール
→Primer069_04F (配列番号216) とPrimer069_04R (配列番号217) によって増幅される断片069_04 (配列番号218)
069_05 -[1]、[2]全てが共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターン、さらには既存の公共DBに登録されている[2]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域
→Primer069_05F (配列番号219) とPrimer069_05R (配列番号220) によって増幅される断片069_05 (配列番号221)
上記に示された[1]、[2] のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1]のパターンでは5’末端配列が14配列存在し、その由来はCD34+細胞を破骨細胞分化因子 (ODF) 処理誘導9日間(D9OST) が5配列 (解析母数 4,407)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導3日間(D3OST) が2配列 (解析母数 5,092)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導6日間(D6OST) が2配列 (解析母数 888)、尾状核 (Brain, caudate nucleus) が2配列 (解析母数 25,786)、視床 (Brain, thalamus) が1配列 (解析母数 53,267)、NT2細胞をRA処理と生育阻害剤処理により神経分化後、神経を濃縮回収 (NT2 Neuron) が1配列 (解析母数 16,337)、軟骨細胞 (Chondrocyte) が1配列(解析母数 2,687) であった。
既存の公共DBに登録されているコントロールとなる [2]のパターンでは5’末端配列が79配列存在し、その由来は胎児脳 (Brain, Fetal) が19配列 (解析母数 71,152)、小脳(Brain, cerebellum) が9配列 (解析母数 82,880)、扁桃 (Brain, amygdala) が8配列 (解析母数 58,640)、全脳 (Brain, whole) が5配列(解析母数 59,069)、視床 (Brain, thalamus) が4配列 (解析母数 53,267)、腎臓癌 (Kidney, Tumor) が3配列 (解析母数 15,970)、NT2細胞をレチノイン酸処理誘導5週間後、生育阻害剤処理2週間(NT2RI) が3配列 (解析母数 32,662)、精巣(Testis) が3配列 (解析母数 90,188) など、様々な組織で見られた。
この結果より、[1]のパターンは、破骨細胞分化因子 (ODF) 処理誘導したCD34+細胞での発現が多いことがわかった。また、[2]のパターンでは、脳を中心に様々な組織で発現していた。これにより、破骨細胞とそれ以外の組織(特に脳)では、この染色体領域において、転写の機構が異なり、用いられている転写開始点も異なる可能性が考えられた。
3) Expression specificity analysis and design of primers for real-time PCR In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions were used as detection regions. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
069_01-Specific region existing on the N-terminal side of the cDNA pattern of [1]: This is the transcription start region of the cDNA pattern of [1] that we newly analyzed, and is registered in the existing public DB Novel region that has not been processed → Fragment 069_01 (SEQ ID NO: 209) amplified by Primer069_01F (SEQ ID NO: 207) and Primer069_01R (SEQ ID NO: 208)
069_02-Control for comparing and examining [2] transcription start point region registered in the existing public DB → Fragment 069_02 amplified by Primer069_02F (SEQ ID NO: 210) and Primer069_02R (SEQ ID NO: 211) (SEQ ID NO: 212)
069_03-The region extracted specifically using the sequence information of the exon deletion region of the cDNA pattern of [1]: In the cDNA pattern of [1] that we newly performed full-length cDNA sequence analysis, Exon deletion region changing ORF → Fragment 069_03 (SEQ ID NO: 215) amplified by Primer069_03F (SEQ ID NO: 213) and Primer069_03R (SEQ ID NO: 214)
069_04 -This is a specific region that can be distinguished from the deletion region of [1] in the cDNA pattern of [2] registered in the existing public DB. Compare [1]. Control for → Fragment 069_04 (SEQ ID NO: 218) amplified by Primer069_04F (SEQ ID NO: 216) and Primer069_04R (SEQ ID NO: 217)
069_05-[1], [2] Common region shared by all: [1] cDNA pattern we newly analyzed full-length cDNA sequence, and [2] cDNA registered in the existing public DB A region in which all the patterns to be used as a control are in common to compare the expression level of the entire pattern → fragment 069_05 (SEQ ID NO: 221) amplified by Primer069_05F (SEQ ID NO: 219) and Primer069_05R (SEQ ID NO: 220)
The exon regions specific to each of the cDNA patterns [1] and [2] shown above map the approximately 1.44 million 5 'end sequences obtained using the oligo cap method to human genome sequences for comparative analysis. As a result, the following results were obtained.
In the newly analyzed cDNA [1] pattern, there are 14 5 'terminal sequences, and the origin is CD34 + cells that are induced by 5 days of osteoclast differentiation factor (ODF) treatment induction (D9OST). (4,407), CD34 + cells treated with osteoclast differentiation factor (ODF) treatment 3 days (D3OST) 2 sequences (analysis parameter 5,092), CD34 + cells treated with osteoclast differentiation factor (ODF) treatment 6 days (D6OST) ) Is 2 sequences (analysis parameter 888), caudate nucleus (Brain, caudate nucleus) is 2 sequences (analysis parameter 25,786), thalamus (Brain, thalamus) is 1 sequence (analysis parameter 53,267), and NT2 cells are RA After nerve differentiation by treatment and growth inhibitor treatment, the nerve was concentrated and recovered (NT2 Neuron) in one sequence (analysis parameter 16,337), and chondrocyte was in one sequence (analysis parameter 2,687).
In the control [2] pattern registered in the existing public DB, there are 79 5 'terminal sequences, the origin of which is 19 sequences of fetal brain (Brain, Fetal) (analysis parameter 71,152), cerebellum ( 9 sequences (Brain, cerebellum) (analysis parameter 82,880), 8 sequences (Brain, amygdala) (analysis parameter 58,640), 5 sequences (Brain, whole) (analysis parameter 59,069), thalamus (Brain) , thalamus) 4 sequences (analysis parameter 53,267), kidney cancer (Kidney, Tumor) 3 sequences (analysis parameter 15,970), NT2 cells 5 weeks after induction of retinoic acid treatment, growth inhibitor treatment 2 weeks (NT2RI) 3 sequences (analysis parameter 32,662) and testis (Testis) 3 sequences (analysis parameter 90,188).
From this result, it was found that the pattern [1] is highly expressed in CD34 + cells induced by osteoclast differentiation factor (ODF) treatment. The pattern [2] was expressed in various tissues, mainly in the brain. As a result, it was considered that the mechanism of transcription differs between the osteoclasts and other tissues (particularly the brain), and the transcription start point used may be different.

(2)リアルタイムPCRによる発現特異性の解析
血球系組織の中でもどのような組織、どのような状態のときに発現に使われる転写開始点が変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表17-1、17-2及び表18-1、18-2に示した。
(2) Analysis of expression specificity by real-time PCR In order to know what kind of tissue in the blood cell system tissue and in what state the transcription start point used for expression changes, details of the expression level are real-time Analyzed by PCR. The results are shown in Tables 17-1 and 17-2 and Tables 18-1 and 18-2.

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳(Brain, whole)を用いて比較した。
069_01 (配列番号209) と069_02 (配列番号212) で比較される転写開始点の選択性と069_03 (配列番号215) と069_04 (配列番号218) で比較されるエクソンの選択性によってmRNAが変わり、その結果としてORFが変化する比率は、以下の組織で大きく変化していた。
骨髄 (Bone Marrow)、胸腺 (Thymus)、脾臓 (Spleen)、CD34+細胞(CD34+)、CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導3日間 (CD34+ ODF 3days)、 CD34+細胞をODF 処理誘導6日間 (CD34+ ODF 6days)、CD34+細胞をODF 処理誘導9日間 (CD34+ ODF 9days)、滑膜 (Synovial) 組織(リューマチ患者)、Jurkat細胞 (Jurkat)、脊髄 (Spinal Cord)では、069_01 (配列番号209) で表されるエクソンよりの転写物(mRNA)と、069_03 (配列番号215) で表されるエクソンが欠失するパターンでのmRNAの発現が多かった(表17-1、17-2・表18-1、18-2)。
つまりこれらの血球系組織では、他の組織とは異なり転写因子もしくは、転写機構によって、転写開始点に多様性があり、エクソンの選択性にも多様性があることで、ORF領域の異なるmRNAが発現していた。
これらの結果より、069_01 (配列番号209) という検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)069_[1]_1-N1 (配列番号202) の発現頻度と、069_03 (配列番号215) という検出領域で示されるエクソン欠失領域069_[1]_1-N2 (配列番号203) の発現頻度を比較することにより(それぞれ単独でも組み合わせての比較でも)、骨髄 (Bone Marrow)、胸腺 (Thymus)、脾臓 (Spleen)、CD34+細胞(CD34+)、Jurkat細胞 (Jurkat)、の血球系に特異的なマーカーとして、また滑膜 (Synovial) 組織(リューマチ患者)のマーカーや破骨細胞の分化マーカーとして利用することが可能であることが立証された。さらに、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についても骨髄(Bone Marrow)、胸腺(Thymus)、脾臓(Spleen)、CD34+細胞(CD34+)、Jurkat細胞(Jurkat)の血球系に特異的なマーカーとして、また滑膜(Synovial) 組織(リューマチ患者)のマーカーや破骨細胞の分化マーカーとして有用であると思われる。
[1]のcDNAパターンのD-D3OST2000831.1においてPrimer069_01R (配列番号208) がプライミングする88〜109塩基目を含む上流配列069_[1]_1-N4 (配列番号222)。
[1]のcDNAパターンのD-D3OST2000831.1においてPrimer069_03R (配列番号214) がプライミングする530〜551塩基目を含む上流配列069_[1]_1-N5 (配列番号223)。
[1]のcDNAパターンにおいてPrimer069_01F (配列番号207) とPrimer069_01R (配列番号208) によって増幅される領域069_01 (配列番号209)
[1]のcDNAパターンにおいてPrimer069_03F (配列番号213) とPrimer069_03R (配列番号214) によって増幅される領域069_03 (配列番号215)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As an experimental control, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
The mRNA changes depending on the selectivity of the transcription start site compared between 069_01 (SEQ ID NO: 209) and 069_02 (SEQ ID NO: 212) and the exon selectivity compared between 069_03 (SEQ ID NO: 215) and 069_04 (SEQ ID NO: 218), As a result, the rate at which ORF changes has changed significantly in the following organizations:
Bone Marrow, Thymus, Spleen, CD34 + cells (CD34 +), CD34 + cells induced by osteoclast differentiation factor (ODF) treatment for 3 days (CD34 + ODF 3days), CD34 + cells induced by ODF treatment6 069_01 (SEQ ID NO: 209) for days (CD34 + ODF 6days), CD34 + cells treated with ODF treatment for 9 days (CD34 + ODF 9days), synovial tissues (rheumatic patients), Jurkat cells (Jurkat), and spinal cord (Spinal Cord) ) In the pattern in which the exon represented by 069_03 (SEQ ID NO: 215) is deleted (Table 17-1 and 17-2). 18-1, 18-2).
In other words, in these blood cell tissues, unlike other tissues, there are diversity in the transcription start point depending on transcription factors or transcription mechanisms, and exon selectivity is also diverse, so that mRNAs with different ORF regions are different. It was expressed.
From these results, the 5′-terminal region of the newly obtained cDNA region indicated by the detection region 069_01 (SEQ ID NO: 209) (region near the transcription start point) 069_ [1] _1-N1 (SEQ ID NO: 202) By comparing the expression frequency with the expression frequency of the exon deletion region 069_ [1] _1-N2 (SEQ ID NO: 203) indicated by the detection region of 069_03 (SEQ ID NO: 215) (either individually or in combination) Bone Marrow, Thymus, Spleen, CD34 + cells (CD34 +), Jurkat cells (Jurkat), as a specific marker for blood cell lineage, and synovial tissues (Rheumatoid patients) It has been proved that it can be used as a marker for osteoclasts and as a differentiation marker for osteoclasts. In addition, new drug development using compounds, antibodies, siRNA, etc. that target specific regions is also possible.
In the following areas, bone marrow (Bone Marrow), thymus (Thymus), spleen (Spleen), CD34 + cells (CD34 +), Jurkat cells (Jurkat) blood cell lineage specific markers, and synovial tissue It seems to be useful as a marker for rheumatic patients and a marker for osteoclast differentiation.
The upstream sequence 069_ [1] _1-N4 (SEQ ID NO: 222) comprising the 88th to 109th bases primed by Primer069_01R (SEQ ID NO: 208) in D-D3OST2000831.1 having the cDNA pattern of [1].
The upstream sequence 069_ [1] _1-N5 (SEQ ID NO: 223) containing the 530th to 551th bases primed by Primer069_03R (SEQ ID NO: 214) in D-D3OST2000831.1 of the cDNA pattern of [1].
Region 069_01 (SEQ ID NO: 209) amplified by Primer069_01F (SEQ ID NO: 207) and Primer069_01R (SEQ ID NO: 208) in the cDNA pattern of [1]
Region 069_03 (SEQ ID NO: 215) amplified by Primer069_03F (SEQ ID NO: 213) and Primer069_03R (SEQ ID NO: 214) in the cDNA pattern of [1]

実施例14:クラスターchr1+3150(データセット:108)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr1+3150 (Human genome UCSC hg18 (NCBI Build34) 染色体1番、182,997,500 bp〜183,017,500 bp) にゲノムマッピングされた8本の全長cDNA [D-HCASM2001914.1, D-SYNOV4003291.1, D-SYNOV4005198.1, C-SYNOV2000178, C-SYNOV4003981, ENST00000251819, NM_005807.1, U70136.1] について解析を行った。それらは、発現パターンの違いにより6種類に分類されるが、主なものとして2種類が存在した。
[1] D-HCASM2001914.1、D-SYNOV4003291.1
[2] ENST00000251819, NM_005807.1, U70136.1
[1]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[2]とORFが異なっていた。
[1]は、既知の[2]と比較すると、ORF領域内の他のパターンと異なるエクソンが欠失しているため、ORF変化し、ORF領域が異なっていた。
[1]、[2]の2種類のcDNAパターンがもつORF領域は、同じ染色体領域より、異なるスプライシングのパターンをもつことにより、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 14: cluster chr1 + 3150 (data set: 108)
(1) Cluster analysis 1) Cluster characteristics Eight full-length cDNAs mapped to the cluster chr1 + 3150 (Human genome UCSC hg18 (NCBI Build34) chromosome 1, 182,997,500 bp to 183,017,500 bp) [D-HCASM2001914.1 , D-SYNOV4003291.1, D-SYNOV4005198.1, C-SYNOV2000178, C-SYNOV4003981, ENST00000251819, NM_005807.1, U70136.1] were analyzed. They are classified into six types depending on the expression pattern, but there are two main types.
[1] D-HCASM2001914.1, D-SYNOV4003291.1
[2] ENST00000251819, NM_005807.1, U70136.1
[1] is a cDNA we newly acquired and performed full-length cDNA sequence analysis, and the ORF was different from [2] registered in the existing public DB.
Compared with the known [2], [1] had an ORF change and a different ORF region because an exon different from other patterns in the ORF region was deleted.
The ORF regions of the two cDNA patterns [1] and [2] have different splicing patterns from the same chromosomal region, so that the amino acid sequence changes, and diverse proteins and mRNAs are produced. I found out.

2)我々が新たに取得し全長cDNA配列解析を行ったD-HCASM2001914.1([1])の特徴
108_[1]_1-N0 (配列番号224) : D-HCASM2001914.1の核酸配列全領域
108_[1]_1-NA0 (配列番号225) : D-HCASM2001914.1の核酸配列全領域とアミノ酸配列の併記
108_[1]_1-A0 (配列番号226) : D-HCASM2001914.1のアミノ配列全領域
既存の公共DBに登録されているコントロールとなるNM_005807.1の353〜631塩基に存在する279塩基のエクソン (配列番号229) がD-HCASM2001914.1の364〜365塩基の領域には存在せず欠失している。その為、NM_005807.1と比較するとアミノ酸が93残基欠失していた。
108_[1]_1-N1 (配列番号227) : D-HCASM2001914.1の欠失核酸配列領域
108_[1]_1-A1 (配列番号228) : D-HCASM2001914.1の変化しているアミノ配列領域
108_[1]_1-N2 (配列番号227と同一) : D-HCASM2001914.1の欠失領域中のORF核酸配列領域108_[1]_1-A2 (配列番号228と同一) : D-HCASM2001914.1の欠失領域に関わるORFアミノ酸領域
108_[1]_C-N1 (配列番号229) : D-HCASM2001914.1の364〜365塩基の領域に挿入されるNM_005807.1の353〜631塩基に存在する279塩基の挿入核酸配列
108_[1]_C-A1 (配列番号230) : D-HCASM2001914.1の364〜365塩基の領域に挿入されるNM_005807.1の353〜631塩基に存在する279塩基の挿入核酸配列に関わるアミノ酸領域。
2) Features of D-HCASM2001914.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
108_ [1] _1-N0 (SEQ ID NO: 224): The entire nucleic acid sequence of D-HCASM2001914.1
108_ [1] _1-NA0 (SEQ ID NO: 225): Combination of D-HCASM2001914.1 whole region and amino acid sequence
108_ [1] _1-A0 (SEQ ID NO: 226): Full amino acid region of D-HCASM2001914.1 279 base exons present in 353 to 631 bases of NM_005807.1 as a control registered in the existing public DB (SEQ ID NO: 229) does not exist in the region of 364 to 365 bases of D-HCASM2001914.1 and is deleted. Therefore, compared with NM_005807.1, 93 amino acids were deleted.
108_ [1] _1-N1 (SEQ ID NO: 227): D-HCASM2001914.1 deleted nucleic acid sequence region
108_ [1] _1-A1 (SEQ ID NO: 228): D-HCASM2001914.1 changing amino sequence region
108_ [1] _1-N2 (identical to SEQ ID NO: 227): ORF nucleic acid sequence region 108_ [1] _1-A2 (identical to SEQ ID NO: 228) in the deleted region of D-HCASM2001914.1: D-HCASM2001914.1 ORF amino acid region related to the deletion region of
108_ [1] _C-N1 (SEQ ID NO: 229): 279 base inserted nucleic acid sequence present in 353 to 631 bases of NM_005807.1 inserted in the region of 364 to 365 bases of D-HCASM2001914.1
108_ [1] _C-A1 (SEQ ID NO: 230): Amino acid region related to the inserted nucleic acid sequence of 279 bases present in 353 to 631 bases of NM_005807.1 inserted in the region of 364 to 365 bases of D-HCASM2001914.1 .

3)我々が新たに取得し全長cDNA配列解析を行ったD-SYNOV4003291.1([1])の特徴
108_[1]_2-N0 (配列番号231) : D-SYNOV4003291.1の核酸配列全領域
108_[1]_2-NA0 (配列番号232) : D-SYNOV4003291.1の核酸配列全領域とアミノ酸配列の併記
108_[1]_2-A0 (配列番号233) : D-SYNOV4003291.1のアミノ配列全領域
既存の公共DBに登録されているコントロールとなるNM_005807.1の109〜231塩基に存在する123塩基のエクソン (配列番号236) がD-SYNOV4003291.1の120〜121塩基の領域には存在せず欠失している。その為、NM_005807.1と比較するとアミノ酸が41残基欠失していた。
108_[1]_2-N1 (配列番号234) : D-SYNOV4003291.1の欠失核酸配列領域、その1
108_[1]_2-A1 (配列番号235) : D-SYNOV4003291.1の変化しているアミノ配列領域
108_[1]_2-N2 (配列番号234と同一) : D-SYNOV4003291.1の欠失領域中のORF核酸配列領域108_[1]_2-A2 (配列番号235と同一) : D-SYNOV4003291.1の欠失領域に関わるORFアミノ酸領域
108_[1]_C-N1 (配列番号236) : D-SYNOV4003291.1の120〜121塩基の領域に挿入されるNM_005807.1の109〜231塩基に存在する123塩基の挿入核酸配列
108_[1]_C-A1 (配列番号237) : D-SYNOV4003291.1の120〜121塩基の領域に挿入されるNM_005807.1の109〜231塩基に存在する123塩基の挿入核酸配列に関わるアミノ酸領域。
この変化に伴い、NM_005807.1の28〜69アミノ酸目に存在するPfamモチーフ “Somatomedin B domain” が消失していた。
また既存の公共DBに登録されているコントロールとなるNM_005807.1の353〜631塩基に存在する279塩基のエクソン (配列番号229) がD-SYNOV4003291.1の241〜242塩基の領域には存在せず欠失している。その為、NM_005807.1と比較するとアミノ酸が93残基欠失していた。
108_[1]_2-N3 (配列番号227と同一) : D-SYNOV4003291.1の欠失核酸配列領域、その2
108_[1]_2-A3 (配列番号228と同一) : D-SYNOV4003291.1の変化しているアミノ配列領域
108_[1]_2-N4 (配列番号227と同一) : D-SYNOV4003291.1の欠失領域中のORF核酸配列領域108_[1]_2-A4 (配列番号228と同一) : D-SYNOV4003291.1の欠失領域に関わるORFアミノ酸領域
108_[1]_C-N3 (配列番号229と同一) : D-SYNOV4003291.1の241〜242塩基の領域に挿入されるNM_005807.1の353〜631塩基に存在する279塩基の挿入核酸配列
108_[1]_C-A3 (配列番号230と同一) : D-SYNOV4003291.1の241〜242塩基の領域に挿入されるNM_005807.1の353〜631塩基に存在する279塩基の挿入核酸配列に関わるアミノ酸領域。
3) Features of D-SYNOV4003291.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
108_ [1] _2-N0 (SEQ ID NO: 231): D-SYNOV4003291.1 entire region of nucleic acid sequence
108_ [1] _2-NA0 (SEQ ID NO: 232): Combination of D-SYNOV4003291.1 nucleic acid sequence and amino acid sequence
108_ [1] _2-A0 (SEQ ID NO: 233): The entire amino acid sequence of D-SYNOV4003291.1 A 123-base exon in 109-231 bases of NM_005807.1, which is a control registered in an existing public DB (SEQ ID NO: 236) is not present in the region of 120 to 121 bases of D-SYNOV4003291.1 and is deleted. Therefore, 41 amino acid residues were deleted compared with NM_005807.1.
108_ [1] _2-N1 (SEQ ID NO: 234): D-SYNOV4003291.1 deleted nucleic acid sequence region, part 1
108_ [1] _2-A1 (SEQ ID NO: 235): D-SYNOV4003291.1 changing amino sequence region
108_ [1] _2-N2 (identical to SEQ ID NO: 234): ORF nucleic acid sequence region 108_ [1] _2-A2 (identical to SEQ ID NO: 235) in the deleted region of D-SYNOV4003291.1: D-SYNOV4003291.1 ORF amino acid region related to the deletion region of
108_ [1] _C-N1 (SEQ ID NO: 236): 123-base inserted nucleic acid sequence present in 109-231 bases of NM_005807.1 inserted in the 120-121 base region of D-SYNOV4003291.1
108_ [1] _C-A1 (SEQ ID NO: 237): Amino acid region related to the 123-base inserted nucleic acid sequence present in 109-231 bases of NM_005807.1 inserted in the 120-121 base region of D-SYNOV4003291.1 .
With this change, the Pfam motif “Somatomedin B domain” present at amino acids 28 to 69 of NM_005807.1 disappeared.
In addition, the 279-base exon (SEQ ID NO: 229) present in bases 353 to 631 of NM_005807.1, which is a control registered in the existing public DB, is present in the region of bases 241 to 242 in D-SYNOV4003291.1. Is missing. Therefore, compared with NM_005807.1, 93 amino acids were deleted.
108_ [1] _2-N3 (identical to SEQ ID NO: 227): D-SYNOV4003291.1 deleted nucleic acid sequence region, part 2
108_ [1] _2-A3 (same as SEQ ID NO: 228): D-SYNOV4003291.1 changing amino sequence region
108_ [1] _2-N4 (identical to SEQ ID NO: 227): ORF nucleic acid sequence region 108_ [1] _2-A4 (identical to SEQ ID NO: 228) in the deleted region of D-SYNOV4003291.1: D-SYNOV4003291.1 ORF amino acid region related to the deletion region of
108_ [1] _C-N3 (same as SEQ ID NO: 229): 279 base inserted nucleic acid sequence present in 353 to 631 bases of NM_005807.1 inserted in the region of 241 to 242 bases of D-SYNOV4003291.1
108_ [1] _C-A3 (same as SEQ ID NO: 230): involved in the inserted nucleic acid sequence of 279 bases present in 353 to 631 bases of NM_005807.1 inserted in the region of 241 to 242 bases of D-SYNOV4003291.1 Amino acid region.

4)発現特異性解析とリアルタイムPCR用プライマーの設計
上記で示されたような特徴的な領域を明確に区別して、それぞれの発現量を調べるために、以下のような領域を検出領域とした。その検出領域の発現量を比較することにより、個々の発現量を比較することが可能であると思われた。
108_01 - [1]のcDNAパターンで共通して欠失しているエクソン領域の境界にある配列情報を利用して特異的に抽出した領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターンにおいて、ORFを変化させているエクソンの欠失領域
→Primer108_01F (配列番号238) とPrimer108_01R (配列番号239) によって増幅される断片108_01 (配列番号240)
108_03 - 既存の公共DBに登録されている [2]のcDNAパターンと[1]の欠失領域と比較した場合に挿入領域に相当する特異的な領域
→Primer108_03F (配列番号241) とPrimer108_03R (配列番号242) によって増幅される断片108_03 (配列番号243)
108_04 - [1]、[2]全てが共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]のcDNAパターン、さらには既存の公共DBに登録されている [2]のcDNAパターンの全体としての発現量を比較するためにコントロールとなる全てのパターンが共通している領域
→Primer108_04F (配列番号244) とPrimer108_04R (配列番号245) によって増幅される断片108_04 (配列番号246)
上記に示された[1]、[2]のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1]のパターンでは5’末端配列が17配列存在し、その由来は滑膜組織 (Synovial membrane tissue from rheumatioid arthritis) が14配列 (解析母数 27,489)、胸腺(Thymus) が2配列 (解析母数 70,578)、正常冠動脈平滑筋細胞HCASMC (Human coronary artery smooth muscle cells) が1配列 (解析母数 8,949) であった。
既存の公共DBに登録されているコントロールとなる [2]のパターンでは5’末端配列が42配列存在し、滑膜組織(Synovial membrane tissue from rheumatioid arthritis) が42配列 (解析母数 27,489) 存在した。
この結果より、[1]、[2]両方のパターンで、滑膜組織(Synovial membrane tissue from rheumatioid arthritis) での発現が多いことがわかった。つまり、滑膜組織(Synovial membrane tissue from rheumatioid arthritis) では、この染色体領域において、[1]、[2]のパターンのように、エクソンのスプライシングのパターンに多様性があることでORFが変化し、異なるタンパクを発現させるような機構が働くことがわかった。
4) Expression specificity analysis and design of primers for real-time PCR In order to clearly distinguish the characteristic regions as shown above and examine their expression levels, the following regions were used as detection regions. By comparing the expression levels of the detection regions, it was considered possible to compare the individual expression levels.
108_01-A region specifically extracted using sequence information at the boundary of exon regions that are commonly deleted in the cDNA pattern of [1]: We newly performed full-length cDNA sequence analysis [1] In the cDNA pattern of: deletion region of exon changing ORF → Fragment 108_01 (SEQ ID NO: 240) amplified by Primer108_01F (SEQ ID NO: 238) and Primer108_01R (SEQ ID NO: 239)
108_03-Specific region corresponding to the insertion region when compared with the cDNA pattern of [2] registered in the existing public DB and the deleted region of [1] → Primer108_03F (SEQ ID NO: 241) and Primer108_03R (sequence) No. 242) amplified by fragment 108_03 (SEQ ID NO: 243)
108_04-[1], [2] Common area shared by all: [1] cDNA pattern we newly analyzed full-length cDNA sequence, and [2] cDNA registered in the existing public DB A region in which all patterns serving as controls are in common to compare the expression level of the entire pattern → Fragment 108_04 (SEQ ID NO: 246) amplified by Primer108_04F (SEQ ID NO: 244) and Primer108_04R (SEQ ID NO: 245)
The exon regions specific to each of the cDNA patterns [1] and [2] shown above are mapped and compared to the human genome sequence of approximately 1.44 million 5 'end sequences obtained using the oligocap method. As a result, the following results were obtained.
In the newly analyzed cDNA [1] pattern, there are 17 5'-terminal sequences, 14 of which are derived from Synovial membrane tissue from rheumatioid arthritis (analysis parameter 27,489), thymus ( Thymus) had 2 sequences (analysis parameter 70,578), and normal coronary artery smooth muscle cells HCASMC (Human coronary artery smooth muscle cells) had 1 sequence (analysis parameter 8,949).
In the pattern of [2], which is a control registered in the existing public DB, there were 42 5 'terminal sequences, and 42 synovial membrane tissue from rheumatioid arthritis (analysis parameter 27,489) .
From this result, it was found that the expression in synovial membrane tissue from rheumatioid arthritis is high in both patterns [1] and [2]. In other words, in Synovial membrane tissue from rheumatioid arthritis, ORF changes due to the diversity of exon splicing patterns, such as the patterns of [1] and [2], in this chromosomal region, It was found that a mechanism to express different proteins works.

(2)リアルタイムPCRによる発現特異性の解析
どのような組織でエクソンの選択性によるタンパク発現の多様性がどのように変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表19及び表20に示した。
(2) Analysis of expression specificity by real-time PCR In order to know how the diversity of protein expression due to exon selectivity changes in various tissues, the details of the expression level were analyzed by real-time PCR. The results are shown in Table 19 and Table 20.

Figure 2008114709
Figure 2008114709

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳(Brain, whole)を用いて比較した。
108_01 (配列番号240) で表される新たに取得したmRNA発現のパターンと、108_03 (配列番号243) で表される既知のmRNA発現のパターンでは、共に滑膜 (Synovial) 組織(リューマチ患者)での発現が多く、比較されるエクソンの挿入・欠失のmRNAにおけるスプライシングによる選択性は、滑膜 (Synovial) 組織(リューマチ患者)において多様性があることがわかった(表19・表20)。また、108_03 (配列番号243) で表される既知のmRNA発現のパターンでは、CD34+細胞ODF(破骨細胞分化因子) 処理誘導3日間 (CD34+ ODF 3days)、CD34+細胞 ODF 処理誘導9日間 (CD34+ ODF 9days)、脊髄 (Spinal Cord)で発現が高かった。
これらの結果より、108_01 (配列番号240) という検出領域で示される新たに取得したcDNAの選択的なエクソン領域108_[1]_1-N1(配列番号227) 及び108_[1]_2-N3 (配列番号227) の発現を検出することにより、血球系の中でも特にリューマチ患者の滑膜(Synovial)組織に特異的な診断・治療マーカーとして利用することが可能であることが立証された。また、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についても血球系の中でも特にリューマチ患者の滑膜(Synovial) 組織に特異的な診断・治療マーカーとして有用であると思われる。
[1]のcDNAパターンのD-HCASM2001914.1においてPrimer108_01R (配列番号239) がプライミングする438〜458塩基目を含む上流配列108_[1]_1-N3 (配列番号247)。
[1]のcDNAパターンのD-SYNOV4003291.1においてPrimer108_01R (配列番号239) がプライミングする315〜335塩基目を含む上流配列108_[1]_2-N5 (配列番号248)。
[1]のcDNAパターンにおいてPrimer108_01F (配列番号238) とPrimer108_01R (配列番号239) によって増幅される領域108_01 (配列番号240)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As an experimental control, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
The newly obtained mRNA expression pattern represented by 108_01 (SEQ ID NO: 240) and the known mRNA expression pattern represented by 108_03 (SEQ ID NO: 243) are both in synovial tissue (rheumatic patients). It was found that splicing selectivity in exon insertion / deletion mRNA was diverse in synovial tissues (rheumatic patients) (Tables 19 and 20). In addition, in the known mRNA expression pattern represented by 108_03 (SEQ ID NO: 243), CD34 + cell ODF (osteoclast differentiation factor) treatment induction 3 days (CD34 + ODF 3days), CD34 + cell ODF treatment induction 9 days (CD34 + ODF) 9 days), and expression was high in the spinal cord.
From these results, selective exon regions 108_ [1] _1-N1 (SEQ ID NO: 227) and 108_ [1] _2-N3 (SEQ ID NO: 227) of the newly obtained cDNA indicated by the detection region 108_01 (SEQ ID NO: 240) By detecting the expression of No. 227), it was proved that it can be used as a diagnostic and therapeutic marker specific to the synovial tissue of rheumatic patients in the blood cell system. It is also possible to develop new drugs using compounds, antibodies, siRNA, etc. that target specific regions.
The following areas are also useful as diagnostic and therapeutic markers specific to the synovial tissue of rheumatic patients, especially in the blood cell system.
The upstream sequence 108_ [1] _1-N3 (SEQ ID NO: 247) containing the 438th to 458th bases primed by Primer108_01R (SEQ ID NO: 239) in D-HCASM2001914.1 of the cDNA pattern of [1].
The upstream sequence 108_ [1] _2-N5 (SEQ ID NO: 248) containing the 315th to 335th bases primed by Primer108_01R (SEQ ID NO: 239) in D-SYNOV4003291.1 of the cDNA pattern of [1].
Region 108_01 (SEQ ID NO: 240) amplified by Primer108_01F (SEQ ID NO: 238) and Primer108_01R (SEQ ID NO: 239) in the cDNA pattern of [1]

実施例15:クラスターchr7+710(データセット:076)
(1)クラスターの解析
1)クラスターの特徴
クラスターchr7+710 (Human genome UCSC hg18 (NCBI Build34) 染色体7番、44,810,000 bp〜44,890,000 bp) にゲノムマッピングされた14配列の全長cDNA [D-NETRP2002051.1, D-THYMU2031383.1, D-THYMU3032318.1, AL832992.1, BC004903.2, BC008859.2, BC016832.2, BC063663.1, BX641167.1, C-HRC00201, C-SYNOV2007758, C-THYMU2024071, ENST00000258781, NM_031443.2] について解析を行った。それらは、発現パターンの違いにより9種類のORFに分類されるが、主なものとして我々が新たに全長cDNA配列解析を行った3種類、既存の公共DBに登録されているパターンとして1種類の計4種類が存在した。
[1] D-NETRP2002051.1
[2] D-THYMU2031383.1
[3] D-THYMU3032318.1
[4] BC004903.2, BC008859.2, BC016832.2, ENST00000258781, NM_031443.2
[1]、[2]、[3]は、我々が新たに取得し全長cDNA配列解析を行ったcDNAであり、既存の公共DBに登録されていた[4]とORFが異なっていた。
[1]、[2]、[3]は、既知の[4]よりも下流にある染色体領域より発現し、[4]と相同性のない新しいエクソン上に翻訳開始点が存在するため、ORF領域が異なっていた。また[1]、[2]、[3]は、それぞれスプライシングのパターンが異なるため、同じ転写開始点、翻訳開始点をもつが、ORFが異なっていた。
[1]〜[4]の4種類のcDNAパターンがもつORF領域は、同じ染色体領域より、異なる転写開始点、異なるスプライシングパターンをもつことで、アミノ酸配列が変化し、多様性をもつタンパクやmRNAが生みだされていることが判った。
Example 15: Cluster chr7 + 710 (data set: 076)
(1) Cluster analysis 1) Cluster characteristics 14 full-length cDNA genome mapped to cluster chr7 + 710 (Human genome UCSC hg18 (NCBI Build34) chromosome 7, 44,810,000 bp to 44,890,000 bp) [D-NETRP2002051.1 , D-THYMU2031383.1, D-THYMU3032318.1, AL832992.1, BC004903.2, BC008859.2, BC016832.2, BC063663.1, BX641167.1, C-HRC00201, C-SYNOV2007758, C-THYMU2024071, ENST00000258781 , NM_031443.2] was analyzed. They are classified into nine types of ORFs depending on the expression pattern, but the main ones are the three types we newly performed full-length cDNA sequence analysis, and one type as a pattern registered in the existing public DB. There were a total of 4 types.
[1] D-NETRP2002051.1
[2] D-THYMU2031383.1
[3] D-THYMU3032318.1
[4] BC004903.2, BC008859.2, BC016832.2, ENST00000258781, NM_031443.2
[1], [2], and [3] are cDNAs that we newly acquired and performed full-length cDNA sequence analysis. The ORF was different from [4] registered in the existing public DB.
[1], [2], [3] are expressed from a chromosomal region downstream of the known [4], and the ORF is located on a new exon that has no homology with [4]. The area was different. [1], [2], and [3] have the same transcription start point and translation start point because of different splicing patterns, but different ORFs.
The ORF regions of the four types of cDNA patterns [1] to [4] have different transcription start points and different splicing patterns from the same chromosomal region. Was found to have been created.

2)我々が新たに取得し全長cDNA配列解析を行ったD-NETRP2002051.1([1])の特徴
076_[1]_1-N0 (配列番号249) : D-NETRP2002051.1の核酸配列全領域
076_[1]_1-NA0 (配列番号250) : D-NETRP2002051.1の核酸配列全領域とアミノ酸配列の併記
076_[1]_1-A0 (配列番号251) : D-NETRP2002051.1のアミノ配列全領域
D-NETRP2002051.1の1〜126塩基 (配列番号252) は、既存の公共DBに登録されているコントロールとなるNM_0314443.2では存在しないエクソンが挿入するバリアントで、NM_0314443.2とは相同性がなく、挿入するエクソン上に翻訳開始点と存在する為、NM_0314443.2と比較するとN末端のアミノ酸が31残基 (配列番号253) 異なっていた。
076_[1]_1-N1 (配列番号252) : D-NETRP2002051.1の126塩基の挿入核酸配列領域
076_[1]_1-A1 (配列番号253) : D-NETRP2002051.1の31残基の挿入アミノ酸配列領域
076_[1]_1-N2 (配列番号254) : D-NETRP2002051.1の126塩基の挿入領域中のORF核酸配列領域
076_[1]_1-A2 (配列番号253と同一) : D-NETRP2002051.1の126塩基の挿入領域に関わるORFアミノ酸領域
また、既存の公共DBに登録されているコントロールとなるNM_0314443.2の286〜369塩基に存在する84塩基のエクソン (配列番号260) がD-NETRP2002051.1の300〜301塩基の領域には存在せず欠失している。その為、NM_0314443.2と比較するとアミノ酸が28残基 (配列番号261) 欠失していた。
076_[1]_1-N3 (配列番号255) : D-NETRP2002051.1の欠失核酸配列領域、その1
076_[1]_1-A3 (配列番号256) : D-NETRP2002051.1の変化しているアミノ酸配列領域
076_[1]_1-N4 (配列番号255と同一) : D-NETRP2002051.1の欠失領域中のORF核酸配列領域076_[1]_1-A4 (配列番号256と同一) : D-NETRP2002051.1の欠失領域に関わるORFアミノ酸領域
076_[1]_C-N1 (配列番号260) : D-NETRP2002051.1の300〜301塩基の領域に挿入されるNM_0314443.2の286〜369塩基に存在する84塩基の挿入核酸配列
076_[1]_C-A1 (配列番号261) : D-NETRP2002051.1の300〜301塩基の領域に挿入されるNM_0314443.2の286〜369塩基に存在する84塩基の挿入核酸配列に関わるアミノ酸領域。
また、既存の公共DBに登録されているコントロールとなるNM_0314443.2の554〜690塩基に存在する137塩基のエクソン (配列番号262) がD-NETRP2002051.1の484〜485塩基の領域には存在せず欠失している。この変化に伴い、ORFの翻訳フレームが変化するため、NM_0314443.2と比較するとC末端のアミノ酸が38残基 (配列番号258) 異なっていた。
076_[1]_1-N5 (配列番号257) : D-NETRP2002051.1の欠失核酸配列領域、その2
076_[1]_1-A5 (配列番号258) : D-NETRP2002051.1の変化しているアミノ酸配列領域
076_[1]_1-N6 (配列番号257と同一) : D-NETRP2002051.1の欠失領域中のORF核酸配列領域076_[1]_1-A6 (配列番号259) : D-NETRP2002051.1の欠失領域に関わるORFアミノ酸領域
076_[1]_C-N2 (配列番号262) : D-NETRP2002051.1の484〜485塩基の領域に挿入されるNM_0314443.2の554〜690塩基に存在する137塩基の挿入核酸配列
076_[1]_C-A2 (配列番号263) : D-NETRP2002051.1の484〜485塩基の領域に挿入されるNM_0314443.2の554〜690塩基に存在する137塩基の挿入核酸配列に関わるアミノ酸領域。
2) Features of D-NETRP2002051.1 ([1]) that we newly acquired and performed full-length cDNA sequence analysis
076_ [1] _1-N0 (SEQ ID NO: 249): The entire nucleic acid sequence of D-NETRP2002051.1
076_ [1] _1-NA0 (SEQ ID NO: 250): Combination of the entire nucleic acid sequence and amino acid sequence of D-NETRP2002051.1
076_ [1] _1-A0 (SEQ ID NO: 251): Full amino acid region of D-NETRP2002051.1
1-126 bases (SEQ ID NO: 252) of D-NETRP2002051.1 is a variant inserted by an exon that does not exist in NM_0314443.2, which is a control registered in the existing public DB, and has homology to NM_0314443.2 The N-terminal amino acid differs by 31 residues (SEQ ID NO: 253) compared to NM_0314443.2 because it exists as a translation start point on the inserted exon.
076_ [1] _1-N1 (SEQ ID NO: 252): 126-base inserted nucleic acid sequence region of D-NETRP2002051.1
076_ [1] _1-A1 (SEQ ID NO: 253): 31-amino acid insertion region of D-NETRP2002051.1
076_ [1] _1-N2 (SEQ ID NO: 254): ORF nucleic acid sequence region in the 126 base insertion region of D-NETRP2002051.1
076_ [1] _1-A2 (same as SEQ ID NO: 253): ORF amino acid region related to 126-base insertion region of D-NETRP2002051.1 Also, NM_0314443.2 286 as a control registered in the existing public DB An exon of 84 bases (SEQ ID NO: 260) present at ˜369 bases is not present in the region of 300-301 bases of D-NETRP2002051.1 and is deleted. Therefore, compared with NM_0314443.2, 28 amino acid residues (SEQ ID NO: 261) were deleted.
076_ [1] _1-N3 (SEQ ID NO: 255): D-NETRP2002051.1 deleted nucleic acid sequence region, part 1
076_ [1] _1-A3 (SEQ ID NO: 256): D-NETRP2002051.1 changing amino acid sequence region
076_ [1] _1-N4 (same as SEQ ID NO: 255): ORF nucleic acid sequence region 076_ [1] _1-A4 (same as SEQ ID NO: 256) in the deleted region of D-NETRP2002051.1: D-NETRP2002051.1 ORF amino acid region related to the deletion region of
076_ [1] _C-N1 (SEQ ID NO: 260): An inserted nucleic acid sequence of 84 bases present in 286 to 369 bases of NM_0314443.2 to be inserted into the region of 300 to 301 bases of D-NETRP2002051.1
076_ [1] _C-A1 (SEQ ID NO: 261): Amino acid region related to the 84-base inserted nucleic acid sequence present in 286-369 bases of NM_0314443.2 inserted in the 300-301 base region of D-NETRP2002051.1 .
In addition, a 137 base exon (SEQ ID NO: 262) present in 554 to 690 bases of NM_0314443.2, which is a control registered in the existing public DB, is present in the region of 484 to 485 bases in D-NETRP2002051.1. It is deleted without. With this change, the translation frame of ORF changes, so the amino acid at the C-terminal differs by 38 residues (SEQ ID NO: 258) compared to NM_0314443.2.
076_ [1] _1-N5 (SEQ ID NO: 257): D-NETRP2002051.1 deleted nucleic acid sequence region, part 2
076_ [1] _1-A5 (SEQ ID NO: 258): D-NETRP2002051.1 changing amino acid sequence region
076_ [1] _1-N6 (identical to SEQ ID NO: 257): ORF nucleic acid sequence region 076_ [1] _1-A6 (SEQ ID NO: 259) in the deleted region of D-NETRP2002051.1: lack of D-NETRP2002051.1 ORF amino acid region related to the loss region
076_ [1] _C-N2 (SEQ ID NO: 262): Nucleic acid sequence of 137 bases present in 554 to 690 bases of NM_0314443.2 inserted in the region of 484 to 485 bases of D-NETRP2002051.1
076_ [1] _C-A2 (SEQ ID NO: 263): Amino acid region related to the 137-base inserted nucleic acid sequence present in 554-690 bases of NM_0314443.2 inserted in the 484-485 base region of D-NETRP2002051.1 .

3)我々が新たに取得し全長cDNA配列解析を行ったD-THYMU2031383.1([2])の特徴
076_[2]_1-N0 (配列番号264) : D-THYMU2031383.1の核酸配列全領域
076_[2]_1-NA0 (配列番号265) : D-THYMU2031383.1の核酸配列全領域とアミノ酸配列の併記
076_[2]_1-A0 (配列番号266) : D-THYMU2031383.1のアミノ酸配列全領域
D-THYMU2031383.1の1〜126塩基 (配列番号252) は、既存の公共DBに登録されているコントロールとなるNM_0314443.2では存在しないエクソンが挿入するバリアントで、NM_0314443.2とは相同性がなく、挿入するエクソン上に翻訳開始点と存在する為、NM_0314443.2と比較するとN末端のアミノ酸が31残基 (配列番号253) 異なっていた。
076_[2]_1-N1 (配列番号252と同一) : D-THYMU2031383.1の126塩基の挿入核酸配列領域
076_[2]_1-A1 (配列番号253と同一) : D-THYMU2031383.1の31残基の挿入アミノ酸配列領域
076_[2]_1-N2 (配列番号254と同一) : D-THYMU2031383.1の126塩基の挿入領域中のORF核酸配列領域
076_[2]_1-A2 (配列番号253と同一) : D-THYMU2031383.1の126塩基の挿入領域に関わるORFアミノ酸領域
また、D-THYMU2031383.1の668〜1,459塩基 (配列番号267) は、既存の公共DBに登録されているコントロールとなるNM_0314443.2では存在しないエクソンが挿入するバリアントで、NM_0314443.2とは相同性がなく、挿入するエクソン上に翻訳終止点が存在する為、NM_0314443.2と比較するとC末端のアミノ酸が49残基 (配列番号268) 異なっていた。
076_[2]_1-N3 (配列番号267) : D-THYMU2031383.1の792塩基の挿入核酸配列領域
076_[2]_1-A3 (配列番号268) : D-THYMU2031383.1の49残基の挿入アミノ酸配列領域
076_[2]_1-N4 (配列番号269) : D-THYMU2031383.1の792塩基の挿入領域中のORF核酸配列領域
076_[2]_1-A4 (配列番号268と同一) : D-THYMU2031383.1の792塩基の挿入領域に関わるORFアミノ酸領域
3) Features of D-THYMU2031383.1 ([2]) that we newly acquired and performed full-length cDNA sequence analysis
076_ [2] _1-N0 (SEQ ID NO: 264): The entire nucleic acid sequence of D-THYMU2031383.1
076_ [2] _1-NA0 (SEQ ID NO: 265): Combination of the entire nucleic acid sequence and amino acid sequence of D-THYMU2031383.1
076_ [2] _1-A0 (SEQ ID NO: 266): D-THYMU2031383.1 entire amino acid sequence region
1-126 bases (SEQ ID NO: 252) of D-THYMU2031383.1 are variants inserted by exons that do not exist in NM_0314443.2, which is a control registered in the existing public DB, and have homology to NM_0314443.2 The N-terminal amino acid differs by 31 residues (SEQ ID NO: 253) compared to NM_0314443.2 because it exists as a translation start point on the inserted exon.
076_ [2] _1-N1 (same as SEQ ID NO: 252): 126-base inserted nucleic acid sequence region of D-THYMU2031383.1
076_ [2] _1-A1 (same as SEQ ID NO: 253): D-THYMU2031383.1 31-residue amino acid sequence region
076_ [2] _1-N2 (same as SEQ ID NO: 254): ORF nucleic acid sequence region in the 126 base insertion region of D-THYMU2031383.1
076_ [2] _1-A2 (same as SEQ ID NO: 253): ORF amino acid region related to 126 base insertion region of D-THYMU2031383.1 Also, 668 to 1,459 bases (SEQ ID NO: 267) of D-THYMU2031383.1 are NM_0331443.2 is a variant inserted by an exon that does not exist in NM_0314443.2, which is a control registered in the existing public DB.There is no homology with NM_0314443.2, and there is a translation termination point on the inserted exon. Compared to 2, the C-terminal amino acid was 49 residues (SEQ ID NO: 268) different.
076_ [2] _1-N3 (SEQ ID NO: 267): 792-base inserted nucleic acid sequence region of D-THYMU2031383.1
076_ [2] _1-A3 (SEQ ID NO: 268): 49-residue insertion amino acid sequence region of D-THYMU2031383.1
076_ [2] _1-N4 (SEQ ID NO: 269): ORF nucleic acid sequence region in the 792-base insertion region of D-THYMU2031383.1
076_ [2] _1-A4 (same as SEQ ID NO: 268): ORF amino acid region related to the insertion region of 792 bases in D-THYMU2031383.1

4)我々が新たに取得し全長cDNA配列解析を行ったD-THYMU3032318.1([3])の特徴
076_[3]_1-N0 (配列番号270) : D-THYMU3032318.1の核酸配列全領域
076_[3]_1-NA0 (配列番号271) : D-THYMU3032318.1の核酸配列全領域とアミノ酸配列の併記
076_[3]_1-A0 (配列番号272) : D-THYMU3032318.1のアミノ酸配列全領域
D-THYMU3032318.1の1〜128塩基 (配列番号273) は、既存の公共DBに登録されているコントロールとなるNM_0314443.2では存在しないエクソンが挿入するバリアントで、NM_0314443.2とは相同性がなく、挿入するエクソン上に翻訳開始点と存在する為、NM_0314443.2と比較するとN末端のアミノ酸が31残基 (配列番号253) 異なっていた。
076_[3]_1-N1 (配列番号273) : D-THYMU3032318.1の128塩基の挿入核酸配列領域
076_[3]_1-A1 (配列番号253と同一) : D-THYMU3032318.1の31残基の挿入アミノ酸配列領域
076_[3]_1-N2 (配列番号254と同一) : D-THYMU3032318.1の128塩基の挿入領域中のORF核酸配列領域
076_[3]_1-A2 (配列番号253と同一) : D-THYMU3032318.1の128塩基の挿入領域に関わるORFアミノ酸領域
また、既存の公共DBに登録されているコントロールとなるNM_0314443.2の286〜553塩基に存在する268塩基のエクソン (配列番号277) がD-THYMU3032318.1の302〜303塩基の領域には存在せず欠失している。この変化に伴い、ORFの翻訳フレームが変化するため、NM_0314443.2と比較するとC末端のアミノ酸が55残基 (配列番号275) 異なっていた。
076_[3]_1-N3 (配列番号274) : D-THYMU3032318.1の欠失核酸配列領域
076_[3]_1-A3 (配列番号275) : D-THYMU3032318.1の変化しているアミノ酸配列領域
076_[3]_1-N4 (配列番号274と同一) : D-THYMU3032318.1の欠失領域中のORF核酸配列領域076_[3]_1-A4 (配列番号276) : D-THYMU3032318.1の欠失領域に関わるORFアミノ酸領域
076_[3]_C-N1 (配列番号277) : D-THYMU3032318.1の302〜303塩基の領域に挿入されるNM_0314443.2の286〜553塩基に存在する268塩基の挿入核酸配列
076_[3]_C-A1 (配列番号278) : D-THYMU3032318.1の302〜303塩基の領域に挿入されるNM_0314443.2の286〜553塩基に存在する268塩基の挿入核酸配列に関わるアミノ酸領域。
4) Features of D-THYMU3032318.1 ([3]) that we newly acquired and performed full-length cDNA sequence analysis
076_ [3] _1-N0 (SEQ ID NO: 270): D-THYMU3032318.1 entire nucleic acid sequence region
076_ [3] _1-NA0 (SEQ ID NO: 271): Combination of the entire nucleic acid sequence and amino acid sequence of D-THYMU3032318.1
076_ [3] _1-A0 (SEQ ID NO: 272): D-THYMU3032318.1 whole amino acid sequence region
D-THYMU3032318.1, 1-128 bases (SEQ ID NO: 273) is a variant inserted by an exon that does not exist in NM_0314443.2, which is a control registered in the existing public DB, and has homology to NM_0314443.2 The N-terminal amino acid differs by 31 residues (SEQ ID NO: 253) compared to NM_0314443.2 because it exists as a translation start point on the inserted exon.
076_ [3] _1-N1 (SEQ ID NO: 273): 128-base inserted nucleic acid sequence region of D-THYMU3032318.1
076_ [3] _1-A1 (same as SEQ ID NO: 253): 31-amino acid sequence region of D-THYMU3032318.1
076_ [3] _1-N2 (same as SEQ ID NO: 254): ORF nucleic acid sequence region in the 128-base insertion region of D-THYMU3032318.1
076_ [3] _1-A2 (same as SEQ ID NO: 253): ORF amino acid region related to the 128-base insertion region of D-THYMU3032318.1 Also, 286 of NM_0314443.2, which is a control registered in the existing public DB A 268-base exon (SEQ ID NO: 277) existing at ~ 553 bases is not present in the 302-303 base region of D-THYMU3032318.1 and is deleted. With this change, the translation frame of ORF changes, so the amino acid at the C-terminal was 55 residues (SEQ ID NO: 275) different from NM_0314443.2.
076_ [3] _1-N3 (SEQ ID NO: 274): D-THYMU3032318.1 deleted nucleic acid sequence region
076_ [3] _1-A3 (SEQ ID NO: 275): D-THYMU3032318.1 changing amino acid sequence region
076_ [3] _1-N4 (identical to SEQ ID NO: 274): ORF nucleic acid sequence region 076_ [3] _1-A4 (SEQ ID NO: 276) in the deleted region of D-THYMU3032318.1: lack of D-THYMU3032318.1 ORF amino acid region related to the loss region
076_ [3] _C-N1 (SEQ ID NO: 277): 268-base inserted nucleic acid sequence present in 286-553 bases of NM_0314443.2 inserted in the 302-303 base region of D-THYMU3032318.1
076_ [3] _C-A1 (SEQ ID NO: 278): Amino acid region related to the 268-base inserted nucleic acid sequence present in 286-553 bases of NM_0314443.2 inserted in the 302-303 base region of D-THYMU3032318.1 .

5)発現特異性解析とリアルタイムPCR用プライマーの設計
[1]〜[4]の4種類のcDNAパターンがもつORF領域は、それぞれが転写開始点領域に注目して分類すると2種類に分けられ、その転写開始領域を比較することにより、どちらの転写開始点より発現するのかを比較することが可能であると思われた。
076_01 - [1]、[3]のcDNAパターンのN末側に存在する特異的な領域 : 我々が新たに全長cDNA配列解析を行った[1]、[3]のcDNAパターンの転写開始領域であり、既存の公共DBに登録されていない新規性のある領域
→Primer076_01F (配列番号279) とPrimer076_01R (配列番号280) によって増幅される断片076_01 (配列番号281)
076_02 - 既存の公共DBに登録されている[4]が存在する転写開始点領域、[1]、[2]、[3]を比較検討するためのコントロール
→Primer076_02F (配列番号282) とPrimer076_02R (配列番号283) によって増幅される断片076_02 (配列番号284)
076_04 - [1]、[2]、[4]に共有する共通領域 : 我々が新たに全長cDNA配列解析を行った[1]、[2]のcDNAパターン、さらには既存の公共DBに登録されている[4]のcDNAパターンの発現量を比較するためのコントロールとなる共通している領域
→Primer076_04F (配列番号285) とPrimer076_04R (配列番号286) によって増幅される断片076_04 (配列番号287)
上記に示された[1]〜[4] のcDNAパターンのそれぞれに特異的なエクソン領域は、オリゴキャップ法を用いて取得した約144万配列の5’末端配列をヒトゲノム配列にマップし比較解析することにより下記のような頻度で発現している結果を得た。
我々が新たに解析したcDNAの[1]のパターンでは5’末端配列が2配列存在し、その由来は好中球 (Neutrophil) が1配列 (解析母数 9,170)、脾臓 (Spleen) が1配列 (解析母数 33,950) であった。
我々が新たに解析したcDNAの[2]のパターンでは5’末端配列が7配列存在し、その由来は胸腺 (Thymus) が5配列 (解析母数 70,578)、脾臓 (Spleen) が1配列 (解析母数 33,950)、視床 (Brain, thalamus) が1配列 (解析母数 53,267) であった。
我々が新たに解析したcDNAの[3]のパターンでは5’末端配列が1配列存在し、その由来は胸腺 (Thymus) が1配列 (解析母数 70,578) であった。
既存の公共DBに登録されているコントロールとなる [4]のパターンでは5’末端配列が存在しなかった。
この結果より、[1]、[2]、[3]の転写開始点は、胸腺(Thymus)、脾臓 (Spleen) での発現が多いことがわかった。つまり、胸腺 (Thymus)、脾臓 (Spleen) では、この染色体領域において、[1]、[2]、[3]のパターンのように染色体上で下流に位置する転写開始点を選択的に用いるような転写の機構が働くことがわかった。
5) Expression specificity analysis and real-time PCR primer design
The ORF regions of the four types of cDNA patterns [1] to [4] can be classified into two types, focusing on the transcription start site region. It seemed possible to compare the expression from the starting point.
076_01-Specific region existing on the N-terminal side of the cDNA pattern of [1] and [3]: In the transcription start region of the cDNA pattern of [1] and [3] that we newly performed full-length cDNA sequence analysis There is a novel region that is not registered in the existing public DB → Fragment 076_01 (SEQ ID NO: 281) amplified by Primer076_01F (SEQ ID NO: 279) and Primer076_01R (SEQ ID NO: 280)
076_02-Control to compare transcription start point region [1], [2], [3] with [4] registered in existing public DB → Primer076_02F (SEQ ID NO: 282) and Primer076_02R ( SEQ ID NO: 283) Fragment 076_02 amplified by (SEQ ID NO: 284)
076_04-Common region shared by [1], [2], [4]: The cDNA pattern of [1], [2], which we newly performed full-length cDNA sequence analysis, and registered in the existing public DB A common region serving as a control for comparing the expression levels of the cDNA patterns of [4] → Fragment 076_04 (SEQ ID NO: 287) amplified by Primer076_04F (SEQ ID NO: 285) and Primer076_04R (SEQ ID NO: 286)
The exon regions specific to each of the cDNA patterns [1] to [4] shown above are mapped and compared with the human genome sequence of approximately 1.44 million 5 'end sequences obtained using the oligocap method. As a result, the following results were obtained.
In the newly analyzed cDNA [1] pattern, there are two 5 'end sequences, one from neutrophils (analysis parameter 9,170) and one from spleen (Spleen). (Analysis parameter 33,950).
In the newly analyzed cDNA [2] pattern, there are 7 5 'terminal sequences, and the origin is 5 sequences of thymus (analysis parameter 70,578) and 1 sequence of spleen (analysis). The parameter was 33,950), and the thalamus (Brain, thalamus) was one sequence (analysis parameter 53,267).
In the newly analyzed cDNA pattern [3], there was one 5 'terminal sequence, which was derived from one thymus (analytical parameter 70,578).
In the pattern [4], which is a control registered in the existing public DB, there was no 5 'terminal sequence.
From these results, it was found that the transcription start points of [1], [2], and [3] are highly expressed in the thymus (Symus) and spleen (Spleen). In other words, in the thymus (Thymus) and spleen (Spleen), in this chromosomal region, the transcription start site located downstream on the chromosome like the patterns [1], [2], [3] should be used selectively. It was found that the transcription mechanism works.

(2)リアルタイムPCRによる発現特異性の解析
血球系組織の中でもどのような組織、どのような状態のときに発現に使われる転写開始点が変化するのかを知るために、発現量の詳細をリアルタイムPCRにて解析した。結果を表21に示した。
(2) Analysis of expression specificity by real-time PCR In order to know what kind of tissue in the blood cell system tissue and in what state the transcription start point used for expression changes, details of the expression level are real-time Analyzed by PCR. The results are shown in Table 21.

Figure 2008114709
Figure 2008114709

実施例3記載の血球系の組織やCD34+細胞、CD34+細胞を破骨細胞分化因子 (ODF) で処理誘導した細胞など、12種類のサンプルを用いて発現量の比較を行った。実験的なコントロールとして、実施例3記載の正常内臓組織を混合したサンプル (Mix, viscus tissues) と全脳(Brain, whole)を用いて比較した。
076_01 (配列番号281) と076_02 (配列番号284) で比較される転写開始点の選択性によってmRNAが変わり、その結果としてORFが変化する比率は、以下の組織、細胞で大きく変化していた。
滑膜 (Synovial)組織(リューマチ患者)、胸腺(Thymus)、骨髄(Bone Marrow)、脾臓(Spleen)の血球系の組織では、076_01 (配列番号281) で表される下流の転写開始点からの転写物(mRNA)が多かった(表21)。 また、脳では076_02 (配列番号284) で表される既知の転写開始点からの転写物(mRNA)が多かった(表21)。
CD34+細胞を破骨細胞分化因子 (ODF) 処理誘導したものを用いて分化段階の比較をすると、分化の段階により転写開始点の選択性が大きく変化することがわかった。分化初期のCD34+細胞をODF 処理誘導3日間 (CD34+ ODF 3days)までは、076_01 (配列番号281) で表される下流の転写開始点からの転写物(mRNA)が多かったのだが、分化の後期のCD34+細胞をODF処理誘導6日間 (CD34+ ODF 6days)、CD34+細胞をODF処理誘導9日間 (CD34+ ODF 9days) では選択性が逆転し、076_02 (配列番号284) で表される既知の転写開始点からの転写物(mRNA)が多かった(表21)。
つまり血球系の組織と脳では異なる転写因子もしくは、転写機構によって、転写開始点に多様性があることで、異なるORFをもつmRNAが発現していた。さらに、破骨細胞では、分化が進むにつれて、選択する転写開始点が変化していくことがわかった。
これらの結果より、076_01 (配列番号281) というという検出領域で示される新たに取得したcDNA領域の5’-末端領域(転写開始点付近の領域)076_[1]_1-N1 (配列番号252)、076_[2]_1-N1 (配列番号252)、076_[3]_1-N1 (配列番号273) の発現を比較することで、リューマチ患者の滑膜 (Synovial)組織 の血球系に特異的な治療・診断マーカーとして、破骨細胞への分化、特に分化の初期段階を検出する治療・診断マーカー(骨粗鬆症・リューマチやそれに至る過程の診断・治療マーカー)として、また胸腺 (Thymus)、骨髄(Bone Marrow)、脾臓(Spleen)の血球系に特異的なマーカーとして、利用することが可能であることが立証された。さらに、特異性を示す領域を標的とした化合物、抗体、siRNA等による新薬開発も可能と思われる。
また以下の領域についてもリューマチ患者の滑膜 (Synovial) 組織 の血球系に特異的な治療・診断マーカーとして、破骨細胞への分化、特に分化の初期段階を検出する治療・診断マーカーとして、また胸腺(Thymus)、骨髄(Bone Marrow)、脾臓(Spleen)の血球系に特異的なマーカーとして有用であると思われる。
[1]のcDNAパターンのD-NETRP2002051.1においてPrimer076_01R (配列番号280) がプライミングする149〜174塩基目を含む上流配列076_[1]_1-N7 (配列番号288)。
[3]のcDNAパターンのD-THYMU3032318.1においてPrimer076_01R (配列番号280) がプライミングする151〜176塩基目を含む上流配列076_[3]_1-N5 (配列番号289)。
[1]、[3]のcDNAパターンにおいてPrimer076_01F (配列番号279) とPrimer076_01R (配列番号280) によって増幅される領域076_01 (配列番号281)
Expression levels were compared using 12 types of samples such as blood cell tissues described in Example 3, CD34 + cells, and cells in which CD34 + cells were induced to be treated with osteoclast differentiation factor (ODF). As an experimental control, a sample (Mix, viscus tissues) mixed with normal visceral tissue described in Example 3 and a whole brain (Brain, whole) were used for comparison.
Depending on the selectivity of the transcription start site compared between 076_01 (SEQ ID NO: 281) and 076_02 (SEQ ID NO: 284), the mRNA changes, and as a result, the ratio of ORF changes greatly in the following tissues and cells.
Synovial tissue (rheumatoid patients), thymus (Bone Marrow), spleen (Spleen) blood cell tissue, from the downstream transcription start point represented by 076_01 (SEQ ID NO: 281) There were many transcripts (mRNA) (Table 21). In the brain, there were many transcripts (mRNA) from the known transcription start point represented by 076_02 (SEQ ID NO: 284) (Table 21).
When CD34 + cells were induced by osteoclast differentiation factor (ODF) treatment, the differentiation stage was compared, and it was found that the selectivity of the transcription start point greatly changed depending on the stage of differentiation. There were many transcripts (mRNA) from the downstream transcription start point represented by 076_01 (SEQ ID NO: 281) until 3 days (CD34 + ODF 3days) of CD34 + cells in the early stage of differentiation. CD34 + cells in ODF treatment induction 6 days (CD34 + ODF 6days) and CD34 + cells in ODF treatment induction 9 days (CD34 + ODF 9days) reversed the selectivity, and the known transcription start point represented by 076_02 (SEQ ID NO: 284) There were many transcripts (mRNA) from (Table 21).
In other words, mRNAs with different ORFs were expressed by different transcription factors or transcription mechanisms in blood cell tissues and brains due to the diversity of transcription start points. Furthermore, in osteoclasts, it was found that the selected transcription start point changes as differentiation progresses.
From these results, the 5′-terminal region of the newly obtained cDNA region indicated by the detection region of 076_01 (SEQ ID NO: 281) (region near the transcription start point) 076_ [1] _1-N1 (SEQ ID NO: 252) , 076_ [2] _1-N1 (SEQ ID NO: 252), 076_ [3] _1-N1 (SEQ ID NO: 273) are compared with each other in the synovial tissue of the rheumatic patients. As a therapeutic / diagnostic marker, differentiation into osteoclasts, especially as a therapeutic / diagnostic marker (diagnostic / therapeutic marker for osteoporosis / rheumatism and the process leading to it) to detect the early stages of differentiation, as well as thymus, bone marrow It has been proved that it can be used as a marker specific to the spleen blood cell system. In addition, new drug development using compounds, antibodies, siRNA, etc. that target specific regions is also possible.
In addition, the following areas are also considered as therapeutic / diagnostic markers specific to the blood cell system of synovial tissue in rheumatic patients, as differentiation / intestinal differentiation, particularly as a therapeutic / diagnostic marker for detecting the early stages of differentiation, and It seems to be useful as a specific marker for the blood cell system of thymus, bone marrow, and spleen.
The upstream sequence 076_ [1] _1-N7 (SEQ ID NO: 288) containing the 149th to 174th bases primed by Primer076_01R (SEQ ID NO: 280) in D-NETRP2002051.1 having the cDNA pattern of [1].
The upstream sequence 076_ [3] _1-N5 (SEQ ID NO: 289) containing the 151st to 176th bases primed by Primer076_01R (SEQ ID NO: 280) in D-THYMU3032318.1 of the cDNA pattern of [3].
Region 076_01 (SEQ ID NO: 281) amplified by Primer076_01F (SEQ ID NO: 279) and Primer076_01R (SEQ ID NO: 280) in the cDNA pattern of [1] and [3]

実施例16:全長cDNA配列のORF情報と相同性解析結果及びモチーフ等の解析結果
我々が新たに取得し全長cDNA配列解析行った18配列の全長cDNAの機能を知るためにORF予測とアノテーション解析を行った。アノテーション解析結果は比較するデータベースや解析ソフトがバージョンアップされた時には更新することができる。それにより、アノテーションが記載されていないものにも同一条件で新たに付けることが可能となることがある。
Example 16: Results of ORF information and homology analysis of full-length cDNA sequences and analysis results of motifs, etc. In order to know the functions of 18 full-length cDNAs that we newly acquired and performed full-length cDNA sequence analysis, ORF prediction and annotation analysis were performed. went. The annotation analysis result can be updated when the database or analysis software to be compared is upgraded. As a result, it may be possible to add a new annotation under the same condition even if no annotation is described.

1)全長cDNA配列解析したcDNAのORF予測
ATGpr (A. Salamov et al. (1998) Bioinformatics 14: 384-390) 、TRins (K. Kimura et al. (2003) Genome Informatics 14: 456-457) などのORF予測・評価システムを用い全長cDNA配列からORFを予測した。全長cDNA配列から予測したORF領域情報を以下に示す。
ORF領域の記載方法は「DDBJ/EMBL/GenBank Feature Table Definition」(http://www.ncbi.nlm.nih.gov/collab/FT/index.html) の規則に則って記載した。ORF開始位置はメチオニンをコードする塩基である ”ATG” の一文字目であり、終止位置は終止コドンの3文字目を示している。これを「..」で区切り記載した。ただし、終止コドンが現れないORFについては記載規則に則って” > ” を用いて終止位置を記載した。
- - - - - - - - - - - - - -
cDNA配列名 ORF領域
- - - - - - - - - - - - - -
D-SYNOV4003692.1 176..1126
D-D3OST2001534.1 288..1919
D-NETRP1000046.1 57..950
D-PLACE7010497.1 34..1875
D-SPLEN2030304.1 89..1768
D-SYNOV4000324.1 45..986
D-SYNOV4007243.1 202..2526
D-NETRP2004161.1 290..1240
D-NT2RI3001993.1 63..3206
D-SMINT2013276.1 93..2036
D-THYMU3006588.1 87..2723
D-D3OST2003177.1 163..2718
D-D3OST2000831.1 178..1620
D-HCASM2001914.1 46..>2604
D-SYNOV4003291.1 46..>693
D-NETRP2002051.1 34..579
D-THYMU2031383.1 34..816
D-THYMU3032318.1 36..470
- - - - - - - - - - - - - -
1) Predicting the ORF of cDNA analyzed by full-length cDNA sequence
Full-length cDNA sequences using ORF prediction and evaluation systems such as ATGpr (A. Salamov et al. (1998) Bioinformatics 14: 384-390) and TRins (K. Kimura et al. (2003) Genome Informatics 14: 456-457) Predicted the ORF. The ORF region information predicted from the full-length cDNA sequence is shown below.
The description method of the ORF region is described in accordance with the rules of “DDBJ / EMBL / GenBank Feature Table Definition” (http://www.ncbi.nlm.nih.gov/collab/FT/index.html). The ORF start position is the first letter of “ATG”, which is the base encoding methionine, and the stop position is the third letter of the stop codon. This is delimited by “..”. However, for ORFs in which no stop codon appears, the stop position is described using “>” in accordance with the description rules.
--------------
cDNA sequence name ORF region
--------------
D-SYNOV4003692.1 176..1126
D-D3OST2001534.1 288..1919
D-NETRP1000046.1 57..950
D-PLACE7010497.1 34..1875
D-SPLEN2030304.1 89..1768
D-SYNOV4000324.1 45..986
D-SYNOV4007243.1 202..2526
D-NETRP2004161.1 290..1240
D-NT2RI3001993.1 63..3206
D-SMINT2013276.1 93..2036
D-THYMU3006588.1 87..2723
D-D3OST2003177.1 163..2718
D-D3OST2000831.1 178..1620
D-HCASM2001914.1 46 ..> 2604
D-SYNOV4003291.1 46 ..> 693
D-NETRP2002051.1 34..579
D-THYMU2031383.1 34..816
D-THYMU3032318.1 36..470
--------------

2)BLASTPによる相同性解析結果(SwissProt)
実施例16の1)に記載した18配列のORFについてBLASTP (blastall 2.2.6; ftp://ftp.ncbi.nih.gov/blast/) を用い、2006年8月22日のバージョンのSwissProt (ftp://us.expasy.org/databases/swiss-prot/) に対して相同性解析を行った。相同性解析を行った結果より最も高い相同性を示したものでE-valueの値が1E-10以下の相同性を示すものを以下に記載する。ただし、次の条件に当てはまる時は該当候補を選択せず次候補を記載した。
「ALU SUBFAMILY」で始まるdefinitionのもの
「Alu subfamily」で始まるdefinitionのもの
「!!!! ALU SUBFAMILY」で始まるdefinitionのもの
「B-CELL GROWTH FACTOR PRECURSOR」で始まるdefinitionのもの
「NRK2」を含むdefinitionのもの
「PROLINE-RICH」で始まるdefinitionのもの
「GLYCINE-RICH」で始まるdefinitionのもの
「EXTENSIN PRECURSOR」で始まるdefinitionのもの
「COLLAGEN」で始まるdefinitionのもの
「100KD」で始まるdefinitionのもの
「RETROVIRUS-RELATED POL POLYPROTEIN」で始まるdefinitionのもの
「CUTICLE COLLAGEN」で始まるdefinitionのもの
「HYPOTHETICAL」で始まるdefinitionのもの
「Hypothetical」で始まるdefinitionのもの
「SALIVARY PROLINE-RICH PROTEIN」 で始まるdefinitionのもの
「IMMEDIATE-EARLY PROTEIN」 で始まるdefinitionのもの
アクセッションNoが「P49646」であるもの
各データは、cDNA配列名、ORF領域、ヒットデータのアクセッション番号、ヒットデータのDefinition、ヒットデータのキーワード、E-value、コンセンサス長 (アミノ酸長)、Identityの順に ”//” で区切って記載した。
D-SYNOV4003692.1// 176..1126// O75030// Microphthalmia-associated transcription factor// Activator; Albinism; Alternative splicing; Deafness; Developmental protein; Disease mutation; DNA-binding; Nuclear protein; Phosphorylation; Transcription; Transcription regulation; Waardenburg syndrome.// 7E-60// 158// 46
D-D3OST2001534.1// 288..1919// P28039// Acyloxyacyl hydrolase precursor (EC 3.1.1.77)[Contains: Acyloxyacyl hydrolase small subunit;Acyloxyacyl hydrolase large subunit]// Direct protein sequencing; Glycoprotein; Hydrolase; Polymorphism; Signal; Zymogen.// 0// 543// 94
D-NETRP1000046.1// 57..950// P28039// Acyloxyacyl hydrolase precursor (EC 3.1.1.77)[Contains: Acyloxyacyl hydrolase small subunit;Acyloxyacyl hydrolase large subunit]// Direct protein sequencing; Glycoprotein; Hydrolase; Polymorphism; Signal; Zymogen.// 1E-176// 293// 100
D-PLACE7010497.1// 34..1875// P53667// LIM domain kinase 1 (EC 2.7.11.1) (LIMK-1)// Alternative splicing; ATP-binding; Kinase; LIM domain; Metal-binding; Nucleotide-binding; Phosphorylation; Repeat; Serine/threonine-protein kinase; Transferase; Williams-Beuren syndrome; Zinc.// 0// 596// 99
D-SPLEN2030304.1// 89..1768// P29074// Tyrosine-protein phosphatase non-receptor type4 (EC 3.1.3.48) (Protein-tyrosine phosphatase MEG1)(PTPase-MEG1) (MEG)// 3D-structure; Cytoskeleton; Hydrolase; Protein phosphatase; Structural protein.// 0// 558// 99
D-SYNOV4000324.1// 45..986// P16333// Cytoplasmic protein NCK1 (NCK adaptor protein1) (SH2/SH3 adaptor protein NCK-alpha)// 3D-structure; Direct protein sequencing; Phosphorylation; Repeat; SH2 domain; SH3 domain.// 1E-180// 303// 99
D-SYNOV4007243.1// 202..2526// Q01432// AMP deaminase 3 (EC 3.5.4.6) (AMP deaminaseisoform E) (Erythrocyte AMP deaminase)// Alternative splicing; Hydrolase; Nucleotide metabolism; Polymorphism.// 0// 767// 100
D-NETRP2004161.1// 290..1240// Q6UX41// Butyrophilin-like protein 8 precursor// Alternative splicing; Direct protein sequencing; Glycoprotein; Immunoglobulin domain; Membrane; Repeat; Signal; Transmembrane.// 0// 315// 99
D-NT2RI3001993.1// 63..3206// Q96MK2// Uncharacterized protein C20orf175// // 1E-99// 245// 38
D-SMINT2013276.1// 93..2036// Q96MK2// Uncharacterized protein C20orf175// // 7E-96// 232// 38
D-THYMU3006588.1// 87..2723// Q96M96// FYVE, RhoGEF and PH domain-containing protein4 (Actin filament- binding protein frabin) (FGD1-relatedF-actin-binding protein) (Zinc finger FYVEdomain-containing protein 6)// Actin-binding; Alternative splicing; Cytoskeleton; Guanine-nucleotide releasing factor; Metal-binding; Repeat; Zinc; Zinc-finger.// 0// 764// 99
D-D3OST2003177.1// 163..2718// Q96M96// FYVE, RhoGEF and PH domain-containing protein4 (Actin filament- binding protein frabin) (FGD1-relatedF-actin-binding protein) (Zinc finger FYVEdomain-containing protein 6)// Actin-binding; Alternative splicing; Cytoskeleton; Guanine-nucleotide releasing factor; Metal-binding; Repeat; Zinc; Zinc-finger.// 0// 765// 99
D-HCASM2001914.1// 46..>2604// Q92954// Proteoglycan-4 precursor (Lubricin)(Megakaryocyte-stimulating factor) (Superficial zoneproteoglycan) [Contains: Proteoglycan-4 C-terminal part]// Alternative splicing; Glycoprotein; Polymorphism; Proteoglycan; Repeat; Signal.// 0// 744// 99
D-SYNOV4003291.1// 46..>693// Q92954// Proteoglycan-4 precursor (Lubricin)(Megakaryocyte-stimulating factor) (Superficial zoneproteoglycan) [Contains: Proteoglycan-4 C-terminal part]// Alternative splicing; Glycoprotein; Polymorphism; Proteoglycan; Repeat; Signal.// 2E-82// 151// 99
D-NETRP2002051.1// 34..579// Q9BSQ5// Malcavernin (Cerebral cavernous malformations2 protein)// Disease mutation; Polymorphism.// 9E-59// 120// 78
D-THYMU2031383.1// 34..816// Q9BSQ5// Malcavernin (Cerebral cavernous malformations2 protein)// Disease mutation; Polymorphism.// 4E-99// 181// 98
D-THYMU3032318.1// 36..470// Q9BSQ5// Malcavernin (Cerebral cavernousmalformations 2 protein)// Disease mutation; Polymorphism.// 5E-27// 58// 98
2) Results of homology analysis using BLASTP (SwissProt)
Using the BLASTP (blastall 2.2.6; ftp://ftp.ncbi.nih.gov/blast/) for the 18-sequence ORF described in 1) of Example 16, the version of SwissProt of August 22, 2006 ( Homology analysis was performed on ftp://us.expasy.org/databases/swiss-prot/). Those having the highest homology than the results of the homology analysis and showing the homology with an E-value of 1E-10 or less are described below. However, when the following conditions are met, the next candidate is described without selecting the corresponding candidate.
Definitions beginning with "ALU SUBFAMILY" Definitions starting with "Alu subfamily" Definitions starting with "!!!! ALU SUBFAMILY" Definitions starting with "B-CELL GROWTH FACTOR PRECURSOR" Definitions including "NRK2" Definitions starting with "PROLINE-RICH" Definitions starting with "GLYCINE-RICH" Definitions starting with "EXTENSIN PRECURSOR" Definitions starting with "COLLAGEN" Definitions starting with "100KD""RETROVIRUS- Definitions that start with "RELATED POL POLYPROTEIN" Definitions that start with "CUTICLE COLLAGEN" Definitions that start with "HYPOTHETICAL" Definitions that start with "Hypothetical" Definitions that start with "SALIVARY PROLINE-RICH PROTEIN""IMMEDIATE-EARLY" Definition data beginning with "PROTEIN" Accession number "P49646" Each data is the cDNA sequence name, ORF region, hit data accession number Of hit data Definition, keyword of hit data, E-value, consensus length (amino acids in length), as described, separated by "//" in the order of Identity.
D-SYNOV4003692.1 // 176..1126 // O75030 // Microphthalmia-associated transcription factor // Activator; Albinism; Alternative splicing; Deafness; Developmental protein; Disease mutation; DNA-binding; Nuclear protein; Phosphorylation; Transcription; Transcription regulation; Waardenburg syndrome.// 7E-60 // 158 // 46
D-D3OST2001534.1 // 288..1919 // P28039 // Acyloxyacyl hydrolase precursor (EC 3.1.1.77) [Contains: Acyloxyacyl hydrolase small subunit; Acyloxyacyl hydrolase large subunit] // Direct protein sequencing; Glycoprotein; Hydrolase; Polymorphism; Signal; Zymogen.// 0 // 543 // 94
D-NETRP1000046.1 // 57..950 // P28039 // Acyloxyacyl hydrolase precursor (EC 3.1.1.77) [Contains: Acyloxyacyl hydrolase small subunit; Acyloxyacyl hydrolase large subunit] // Direct protein sequencing; Glycoprotein; Hydrolase; Polymorphism; Signal; Zymogen.// 1E-176 // 293 // 100
D-PLACE7010497.1 // 34..1875 // P53667 // LIM domain kinase 1 (EC 2.7.11.1) (LIMK-1) // Alternative splicing; ATP-binding; Kinase; LIM domain; Metal-binding; Nucleotide -binding; Phosphorylation; Repeat; Serine / threonine-protein kinase; Transferase; Williams-Beuren syndrome; Zinc.// 0 // 596 // 99
D-SPLEN2030304.1 // 89..1768 // P29074 // Tyrosine-protein phosphatase non-receptor type4 (EC 3.1.3.48) (Protein-tyrosine phosphatase MEG1) (PTPase-MEG1) (MEG) // 3D-structure ; Cytoskeleton; Hydrolase; Protein phosphatase; Structural protein.// 0 // 558 // 99
D-SYNOV4000324.1 // 45..986 // P16333 // Cytoplasmic protein NCK1 (NCK adaptor protein1) (SH2 / SH3 adaptor protein NCK-alpha) // 3D-structure; Direct protein sequencing; Phosphorylation; Repeat; SH2 domain ; SH3 domain.// 1E-180 // 303 // 99
D-SYNOV4007243.1 // 202..2526 // Q01432 // AMP deaminase 3 (EC 3.5.4.6) (AMP deaminaseisoform E) (Erythrocyte AMP deaminase) // Alternative splicing; Hydrolase; Nucleotide metabolism; Polymorphism.// 0 // 767 // 100
D-NETRP2004161.1 // 290..1240 // Q6UX41 // Butyrophilin-like protein 8 precursor // Alternative splicing; Direct protein sequencing; Glycoprotein; Immunoglobulin domain; Membrane; Repeat; Signal; Transmembrane.// 0 // 315 // 99
D-NT2RI3001993.1 // 63..3206 // Q96MK2 // Uncharacterized protein C20orf175 // // 1E-99 // 245 // 38
D-SMINT2013276.1 // 93..2036 // Q96MK2 // Uncharacterized protein C20orf175 // // 7E-96 // 232 // 38
D-THYMU3006588.1 // 87..2723 // Q96M96 // FYVE, RhoGEF and PH domain-containing protein4 (Actin filament-binding protein frabin) (FGD1-relatedF-actin-binding protein) (Zinc finger FYVEdomain-containing protein 6) // Actin-binding; Alternative splicing; Cytoskeleton; Guanine-nucleotide releasing factor; Metal-binding; Repeat; Zinc; Zinc-finger.// 0 // 764 // 99
D-D3OST2003177.1 // 163..2718 // Q96M96 // FYVE, RhoGEF and PH domain-containing protein4 (Actin filament-binding protein frabin) (FGD1-relatedF-actin-binding protein) (Zinc finger FYVEdomain-containing protein 6) // Actin-binding; Alternative splicing; Cytoskeleton; Guanine-nucleotide releasing factor; Metal-binding; Repeat; Zinc; Zinc-finger.// 0 // 765 // 99
D-HCASM2001914.1 // 46 ..> 2604 // Q92954 // Proteoglycan-4 precursor (Lubricin) (Megakaryocyte-stimulating factor) (Superficial zoneproteoglycan) (Contains: Proteoglycan-4 C-terminal part] // Alternative splicing; Glycoprotein; Polymorphism; Proteoglycan; Repeat; Signal.// 0 // 744 // 99
D-SYNOV4003291.1 // 46 ..> 693 // Q92954 // Proteoglycan-4 precursor (Lubricin) (Megakaryocyte-stimulating factor) (Superficial zoneproteoglycan) (Contains: Proteoglycan-4 C-terminal part] // Alternative splicing; Glycoprotein; Polymorphism; Proteoglycan; Repeat; Signal.// 2E-82 // 151 // 99
D-NETRP2002051.1 // 34..579 // Q9BSQ5 // Malcavernin (Cerebral cavernous malformations2 protein) // Disease mutation; Polymorphism.// 9E-59 // 120 // 78
D-THYMU2031383.1 // 34..816 // Q9BSQ5 // Malcavernin (Cerebral cavernous malformations2 protein) // Disease mutation; Polymorphism.// 4E-99 // 181 // 98
D-THYMU3032318.1 // 36..470 // Q9BSQ5 // Malcavernin (Cerebral cavernousmalformations 2 protein) // Disease mutation; Polymorphism.// 5E-27 // 58 // 98

3)BLASTPによる相同性解析結果 (RefSeq)
実施例16の1)に記載した18配列のORFについてBLASTP (blastall 2.2.6; ftp://ftp.ncbi.nih.gov/blast/) を用い、2006年7月15日のバージョンのRefSeq (human, mouse, rat; ftp://ftp.ncbi.nih.gov/refseq/) に対して相同性解析を行った。相同性解析を行った結果より最も高い相同性を示したものでE-valueの値が1E-10以下の相同性を示すものを以下に記載する。ただし、次の条件に当てはまる時は該当候補を選択せず次候補を記載した。
「hypothetical protein FLJ」で始まるdefinitionのもの
「KIAA」で始まるdefinitionのもの
「hypothetical protein DKFZ」で始まるdefinitionのもの
「DKFZ」で始まるdefinitionのもの
「RIKEN cDNA」で始まるdefinitionのもの
「hypothetical protein MGC」で始まるdefinitionのもの
「hypothetical protein」 であるdefinitionのもの
「hypothetical protein PP」で始まるdefinitionのもの
「neuronal thread protein」であるdefinitionのもの
「clone FLB」で始まるdefinitionのもの
「hypothetical protein PRO」で始まるdefinitionのもの
「PRO0483 protein」であるdefinitionのもの
「MNC」を含むdefinitionのもの
「MOST-1」を含むdefinitionのもの
「similar to」で始まるdefinitionのもの
「TPR gene on Y」を含むdefinitionのもの
「HSPC」で始まるdefinitionのもの
「CGI-」で始まるdefinitionのもの
各データは、cDNA配列名、ORF領域、ヒットデータのアクセッション番号、ヒットデータのDefinition、E-value、コンセンサス長 (アミノ酸長)、Identityの順に ”//” で区切って記載した。
D-SYNOV4003692.1// 176..1126// NP_036384.1// transcription factor EC isoform a [Homo sapiens]// 1E-125// 221// 100
D-D3OST2001534.1// 288..1919// NP_001628.1// acyloxyacyl hydrolase precursor [Homo sapiens]// 0// 543// 94
D-NETRP1000046.1// 57..950// NP_001628.1// acyloxyacyl hydrolase precursor [Homo sapiens]// 1E-177// 293// 100
D-PLACE7010497.1// 34..1875// NP_002305.1// LIM domain kinase 1 [Homo sapiens]//0// 596// 99
D-SPLEN2030304.1// 89..1768// NP_002821.1// protein tyrosine phosphatase, non-receptor type 4 [Homo sapiens]// 0// 558// 99
D-SYNOV4000324.1// 45..986// NP_006144.1// NCK adaptor protein 1 [Homo sapiens]// 0// 303// 99
D-SYNOV4007243.1// 202..2526// NP_001020561.1// erythrocyte adenosine monophosphate deaminase isoform 1C [Homo sapiens]// 0// 774// 100
D-NETRP2004161.1// 290..1240// NP_001035552.1// butyrophilin-like 8 long form [Homo sapiens]// 0// 315// 99
D-THYMU3006588.1// 87..2723// NP_640334.1// FYVE, RhoGEF and PH domain containing 4 [Homo sapiens]// 0// 764// 99
D-D3OST2003177.1// 163..2718// NP_640334.1// FYVE, RhoGEF and PH domain containing 4 [Homo sapiens]// 0// 765// 99
D-HCASM2001914.1// 46..>2604// NP_005798.2// proteoglycan 4 [Homo sapiens]// 0//744// 99
D-SYNOV4003291.1// 46..>693// NP_005798.2// proteoglycan 4 [Homo sapiens]// 1E-82// 151// 99
D-NETRP2002051.1// 34..579// NP_001025006.1// cerebral cavernous malformation 2 isoform 1 [Homo sapiens]// 2E-78// 151// 82
D-THYMU2031383.1// 34..816// NP_113631.1// cerebral cavernous malformation 2 isoform 2 [Homo sapiens]// 2E-99// 181// 98
D-THYMU3032318.1// 36..470// NP_001025006.1// cerebral cavernous malformation 2 isoform 1 [Homo sapiens]// 9E-47// 89// 100
3) Results of homology analysis using BLASTP (RefSeq)
Using the BLASTP (blastall 2.2.6; ftp://ftp.ncbi.nih.gov/blast/) for the 18-sequence ORF described in 1) of Example 16, the version of RefSeq of July 15, 2006 ( Human, mouse, rat; ftp://ftp.ncbi.nih.gov/refseq/). Those having the highest homology than the results of the homology analysis and showing the homology with an E-value of 1E-10 or less are described below. However, when the following conditions are met, the next candidate is described without selecting the corresponding candidate.
Definitions starting with "hypothetical protein FLJ" Definitions starting with "KIAA" Definitions starting with "hypothetical protein DKFZ" Definitions starting with "DKFZ" Definitions starting with "RIKEN cDNA""hypothetical protein MGC" Definitions starting with "hypothetical protein" Definitions starting with "hypothetical protein PP" Definitions starting with "hypothetical protein PP" Definitions starting with "neuronal thread protein" Definitions starting with "clone FLB" Starting with "hypothetical protein PRO" Definitions including "PRO0483 protein" Definitions including "MNC" Definitions including "MOST-1" Definitions starting with "similar to" Definitions including "TPR gene on Y" Definition data beginning with “HSPC” Definition data starting with “CGI-” Each data includes cDNA sequence name, ORF region, hit data accession number, hit number Data Definition, E-value, consensus length (amino acids in length), as described, separated by "//" in the order of Identity.
D-SYNOV4003692.1 // 176..1126 // NP_036384.1 // transcription factor EC isoform a [Homo sapiens] // 1E-125 // 221 // 100
D-D3OST2001534.1 // 288..1919 // NP_001628.1 // acyloxyacyl hydrolase precursor [Homo sapiens] // 0 // 543 // 94
D-NETRP1000046.1 // 57..950 // NP_001628.1 // acyloxyacyl hydrolase precursor [Homo sapiens] // 1E-177 // 293 // 100
D-PLACE7010497.1 // 34..1875 // NP_002305.1 // LIM domain kinase 1 [Homo sapiens] // 0 // 596 // 99
D-SPLEN2030304.1 // 89..1768 // NP_002821.1 // protein tyrosine phosphatase, non-receptor type 4 [Homo sapiens] // 0 // 558 // 99
D-SYNOV4000324.1 // 45..986 // NP_006144.1 // NCK adaptor protein 1 [Homo sapiens] // 0 // 303 // 99
D-SYNOV4007243.1 // 202..2526 // NP_001020561.1 // erythrocyte adenosine monophosphate deaminase isoform 1C [Homo sapiens] // 0 // 774 // 100
D-NETRP2004161.1 // 290..1240 // NP_001035552.1 // butyrophilin-like 8 long form [Homo sapiens] // 0 // 315 // 99
D-THYMU3006588.1 // 87..2723 // NP_640334.1 // FYVE, RhoGEF and PH domain containing 4 [Homo sapiens] // 0 // 764 // 99
D-D3OST2003177.1 // 163..2718 // NP_640334.1 // FYVE, RhoGEF and PH domain containing 4 [Homo sapiens] // 0 // 765 // 99
D-HCASM2001914.1 // 46 ..> 2604 // NP_005798.2 // proteoglycan 4 [Homo sapiens] // 0 // 744 // 99
D-SYNOV4003291.1 // 46 ..> 693 // NP_005798.2 // proteoglycan 4 [Homo sapiens] // 1E-82 // 151 // 99
D-NETRP2002051.1 // 34..579 // NP_001025006.1 // cerebral cavernous malformation 2 isoform 1 [Homo sapiens] // 2E-78 // 151 // 82
D-THYMU2031383.1 // 34..816 // NP_113631.1 // cerebral cavernous malformation 2 isoform 2 [Homo sapiens] // 2E-99 // 181 // 98
D-THYMU3032318.1 // 36..470 // NP_001025006.1 // cerebral cavernous malformation 2 isoform 1 [Homo sapiens] // 9E-47 // 89 // 100

4)Pfamによるモチーフ相同性解析結果
実施例16の1)に記載した18配列のORFについてPfam (ftp://ftp.sanger.ac.uk/pub/databases/Pfam/)を用い、モチーフ相同性解析を行った。解析プログラムにはhmmpfam v2.3.2を使用し、2005年11月バージョンのPfam19.0に対して解析を実施した。相同性解析を行った結果より最も高い相同性を示したものでE-valueの値が1E-10以下の相同性を示すものを以下に記載する。
各データは、cDNA配列名、ORF領域に続き、ヒットデータのアクセッション番号、ヒットデータの名前、ヒットデータのDescription、E-value、InterPro IDの順に”¥”で区切ったものをヒットデータの数だけの”//” 区切りで繰り返し記載した。
D-SYNOV4003692.1// 176..1126// PF00010.15\HLH\Helix-loop-helix DNA-binding domain\1.8e-15\IPR001092
D-D3OST2001534.1// 288..1919// PF00657.11\Lipase_GDSL\GDSL-like Lipase/Acylhydrolase\1e-39\IPR001087
D-NETRP1000046.1// 57..950// PF00657.11\Lipase_GDSL\GDSL-like Lipase/Acylhydrolase\8.5e-29\IPR001087
D-PLACE7010497.1// 34..1875// PF00069.14\Pkinase\Protein kinase domain\4.6e-49\IPR000719// PF07714.5\Pkinase_Tyr\Protein tyrosine kinase\1.8e-48\// PF00412.11\LIM\LIM domain\1e-21\IPR001781// PF00595.12\PDZ\PDZ domain (Also known as DHR or GLGF)\4.7e-19\IPR001478
D-SPLEN2030304.1// 89..1768// PF00102.16\Y_phosphatase\Protein-tyrosine phosphatase\2.9e-110\IPR000242// PF00595.12\PDZ\PDZ domain (Also known as DHR or GLGF)\4.5e-25\IPR001478
D-SYNOV4000324.1// 45..986// PF00017.12\SH2\SH2 domain\8.8e-34\IPR000980// PF00018.16\SH3_1\SH3 domain\5.3e-23\IPR001452// PF07653.5\SH3_2\Variant SH3 domain\1.3e-11\IPR011511
D-SYNOV4007243.1// 202..2526// PF00962.11\A_deaminase\Adenosine/AMP deaminase\4.1e-232\IPR001365
D-NETRP2004161.1// 290..1240// PF00622.17\SPRY\SPRY domain\6e-30\IPR003877
D-THYMU3006588.1// 87..2723// PF00621.10\RhoGEF\RhoGEF domain\5e-59\IPR000219// PF01363.12\FYVE\FYVE zinc finger\4.9e-24\IPR000306// PF00169.17\PH\PH domain\4.3e-18\IPR001849
D-D3OST2003177.1// 163..2718// PF00621.10\RhoGEF\RhoGEF domain\2.2e-61\IPR000219// PF01363.12\FYVE\FYVE zinc finger\4.9e-24\IPR000306// PF00169.17\PH\PH domain\4.3e-18\IPR001849
D-HCASM2001914.1// 46..>2604// PF01033.7\Somatomedin_B\Somatomedin B domain\1.1e-19\IPR001212
D-SYNOV4003291.1// 46..>693// PF01033.7\Somatomedin_B\Somatomedin B domain\1.3e-16\IPR001212
4) Results of motif homology analysis using Pfam Motif homology using Pfam (ftp://ftp.sanger.ac.uk/pub/databases/Pfam/) for the 18-sequence ORF described in Example 16 1) Analysis was performed. Hmmpfam v2.3.2 was used as the analysis program, and analysis was performed on the November 2005 version of Pfam19.0. Those having the highest homology than the results of the homology analysis and showing the homology with an E-value of 1E-10 or less are described below.
Each data consists of the cDNA sequence name, ORF region, hit data accession number, hit data name, hit data description, E-value, and InterPro ID in the order of “\”. It was repeated repeatedly with just “//” separators.
D-SYNOV4003692.1 // 176..1126 // PF00010.15 \ HLH \ Helix-loop-helix DNA-binding domain \ 1.8e-15 \ IPR001092
D-D3OST2001534.1 // 288..1919 // PF00657.11 \ Lipase_GDSL \ GDSL-like Lipase / Acylhydrolase \ 1e-39 \ IPR001087
D-NETRP1000046.1 // 57..950 // PF00657.11 \ Lipase_GDSL \ GDSL-like Lipase / Acylhydrolase \ 8.5e-29 \ IPR001087
D-PLACE7010497.1 // 34..1875 // PF00069.14 \ Pkinase \ Protein kinase domain \ 4.6e-49 \ IPR000719 // PF07714.5 \ Pkinase_Tyr \ Protein tyrosine kinase \ 1.8e-48 \ // PF00412. 11 \ LIM \ LIM domain \ 1e-21 \ IPR001781 // PF00595.12 \ PDZ \ PDZ domain (Also known as DHR or GLGF) \ 4.7e-19 \ IPR001478
D-SPLEN2030304.1 // 89..1768 // PF00102.16 \ Y_phosphatase \ Protein-tyrosine phosphatase \ 2.9e-110 \ IPR000242 // PF00595.12 \ PDZ \ PDZ domain (Also known as DHR or GLGF) \ 4.5 e-25 \ IPR001478
D-SYNOV4000324.1 // 45..986 // PF00017.12 \ SH2 \ SH2 domain \ 8.8e-34 \ IPR000980 // PF00018.16 \ SH3_1 \ SH3 domain \ 5.3e-23 \ IPR001452 // PF07653.5 \ SH3_2 \ Variant SH3 domain \ 1.3e-11 \ IPR011511
D-SYNOV4007243.1 // 202..2526 // PF00962.11 \ A_deaminase \ Adenosine / AMP deaminase \ 4.1e-232 \ IPR001365
D-NETRP2004161.1 // 290..1240 // PF00622.17 \ SPRY \ SPRY domain \ 6e-30 \ IPR003877
D-THYMU3006588.1 // 87..2723 // PF00621.10 \ RhoGEF \ RhoGEF domain \ 5e-59 \ IPR000219 // PF01363.12 \ FYVE \ FYVE zinc finger \ 4.9e-24 \ IPR000306 // PF00169.17 \ PH \ PH domain \ 4.3e-18 \ IPR001849
D-D3OST2003177.1 // 163..2718 // PF00621.10 \ RhoGEF \ RhoGEF domain \ 2.2e-61 \ IPR000219 // PF01363.12 \ FYVE \ FYVE zinc finger \ 4.9e-24 \ IPR000306 // PF00169. 17 \ PH \ PH domain \ 4.3e-18 \ IPR001849
D-HCASM2001914.1 // 46 ..> 2604 // PF01033.7 \ Somatomedin_B \ Somatomedin B domain \ 1.1e-19 \ IPR001212
D-SYNOV4003291.1 // 46 ..> 693 // PF01033.7 \ Somatomedin_B \ Somatomedin B domain \ 1.3e-16 \ IPR001212

5)SOSUIによる膜貫通ドメイン予測解析
実施例16の1)に記載した18配列のORFについてSOSUI (http://bp.nuap.nagoya-u.ac.jp/sosui/)を用い、膜貫通ドメイン予測解析を行った。解析にはSOSUIバージョン1.5を用いた。SOSUI解析において膜貫通ドメインが予測できたものについて以下に記載する。
各データは、cDNA配列名、ORF領域、膜貫通ドメイン回数を”//” 区切りで記載した。
D-NETRP2004161.1// 290..1240// 1
D-D3OST2000831.1// 178..1620// 10
D-HCASM2001914.1// 46..>2604// 1
D-SYNOV4003291.1// 46..>693// 1
5) Transmembrane domain prediction analysis by SOSUI Using SOSUI (http://bp.nuap.nagoya-u.ac.jp/sosui/) for the 18-sequence ORF described in 1) of Example 16, transmembrane domain Predictive analysis was performed. SOSUI version 1.5 was used for the analysis. What can be predicted for the transmembrane domain in the SOSUI analysis is described below.
In each data, the cDNA sequence name, ORF region, and transmembrane domain number are described in “//” delimiters.
D-NETRP2004161.1 // 290..1240 // 1
D-D3OST2000831.1 // 178..1620 // 10
D-HCASM2001914.1 // 46 ..> 2604 // 1
D-SYNOV4003291.1 // 46 ..> 693 // 1

6)PSORTによるN末端分泌シグナル配列予測解析
実施例16の1)に記載した18配列のORFについてPSORT (http://psort.nibb.ac.jp/) を用い、N末端分泌シグナル配列予測を行った。解析にはPSORT IIを用いた。PSORT解析においてN末端分泌シグナル配列が予測できたものについて以下に記載する。
各データは、cDNA配列名、ORF領域を”//” 区切りで記載した。
D-D3OST2001534.1// 288..1919
D-HCASM2001914.1// 46..>2604
D-SYNOV4003291.1// 46..>693
6) N-terminal secretion signal sequence prediction analysis by PSORT N-terminal secretion signal sequence prediction was performed using PSORT (http://psort.nibb.ac.jp/) for the 18-sequence ORF described in Example 16 1). went. PSORT II was used for the analysis. The following describes the N-terminal secretory signal sequence that could be predicted in the PSORT analysis.
Each data is described as a cDNA sequence name and an ORF region separated by “//”.
D-D3OST2001534.1 // 288..1919
D-HCASM2001914.1 // 46 ..> 2604
D-SYNOV4003291.1 // 46 ..> 693

7)SignalP ver.3.0によるN末端分泌シグナル配列予測解析
実施例16の1)に記載した18配列のORFについてSignalP (http://www.cbs.dtu.dk/services/SignalP/) を用い、N末端分泌シグナル配列予測を行った。解析にはSignalP バージョン3.0を用いた。SignalP解析においてN末端分泌シグナル配列が予測できたものについて以下に記載する。
各データは、cDNA配列名、ORF領域を”//” 区切りで記載した。
D-D3OST2001534.1// 288..1919
D-HCASM2001914.1// 46..>2604
D-SYNOV4003291.1// 46..>693
7) N-terminal secretion signal sequence prediction analysis by SignalP ver.3.0 Using SignalP (http://www.cbs.dtu.dk/services/SignalP/) for the 18-sequence ORF described in Example 16 1), N-terminal secretion signal sequence prediction was performed. SignalP version 3.0 was used for the analysis. What can predict the N-terminal secretory signal sequence in SignalP analysis is described below.
Each data is described as a cDNA sequence name and an ORF region separated by “//”.
D-D3OST2001534.1 // 288..1919
D-HCASM2001914.1 // 46 ..> 2604
D-SYNOV4003291.1 // 46 ..> 693

(実施例1〜16に対する総括)
ヒトゲノム研究の進展により、ヒトの染色体配列の解析は大幅に進んだが、それによりヒト遺伝子の機能の全てが明らかになったわけではない。我々は、ヒトの遺伝子をその多様性に重点をおいて解析することにより、多様性が遺伝子の機能の変化に大きく関連していることを解明した。
ヒトゲノムの配列情報とそこから転写された産物であるヒトcDNAのデータを比較することにより、染色体のある領域から複数のmRNAが転写されていることがわかった。それらは、タンパク質をコードすると予測されるORF領域に違いがあり異なるタンパク質ができると予測される場合と、非翻訳領域である5’UTR領域や3’UTR領域に違いがありタンパク質としては同じものとなる場合が存在した。我々は、その中でも特にすでに解析されている既知のcDNAと異なるタンパク質をコードすると予測されるcDNAに重点をおいて、そのようなcDNAの探索と配列解析を行った。すると、多様性が生み出される原因は、主に転写開始点の選択性とエクソンの選択性にあることがわかった。転写開始点の選択性では、ある染色体領域において使われる転写因子が変化することにより、転写の始まる位置が異なり、cDNAに多様性が生じていた。また、エクソンの選択性では、転写されスプライシングが起こる際に、同じ染色体領域から転写していても使われるエクソンが増えたり減ったりすることでcDNAに多様性が生じていた。
遺伝子の多様性が機能とどのような関連があるのかを我々のもつ約150万のヒトcDNAの5’末端配列(5’-onepass配列)によるmRNAの発現頻度情報をもとに解析した。すると、ある臓器のみ選択的に転写開始領域が異なっていたり、ある病態になった時のみエクソンが欠失するなどといった多様性が機能に大きく影響していると思われる例が多数見つかった。我々は、血球系由来の破骨細胞の分化段階、リューマチ患者の滑膜組織や血球系の臓器組織において、mRNAの多様性に変化が現れる遺伝子を見つけ出して詳細な解析を行った。
解析方法としては、リアルタイムPCR(polymerase chain reaction)を用いてその発現量を比較した。例えば、血球系細胞であるCD34陽性(CD34+)細胞が多核破骨細胞へ分化する場合にのみ選択的に挿入されると予測されるエクソンがある場合、そのエクソン領域を特異的に検出するPrimer (01)を設計、またそのエクソンが挿入されないパターンのみを特異的に検出するPrimer (02)を設計、さらにどちらのパターンも共有してもつ領域を検出するPrimer (03)を設計する。これらの3種類のPrimerを使って、破骨細胞の分化のステージ別での増幅量を比較する。共有領域の03の増幅量をコントロールとして、特異的な領域の検出結果である01、02の破骨細胞の分化のステージ別の増幅量を比較することにより、エクソンの選択性が破骨細胞の分化によってどのように変化したのかを知ることができるのである。つまり、エクソンの選択性と組織特異的な発現の相関をみることが出来るのである。
この方法によって、我々は、遺伝子の多様性が組織特異的な発現と関連している遺伝子を多く見つけ出した。発現している組織に特異性があるということは、多様性がその遺伝子の機能に大きく影響していることが示唆される。つまり、多様性が生じている特異的な領域を遺伝子マーカーとして使用することで、破骨細胞の分化段階を詳細に検出することが可能になったり、滑膜組織などの血球系組織の病態の状況を知ることが可能になるとおもわれる。さらには、例えば血球系組織から発現する特異的な領域をもつタンパク質を標的にして医薬品の開発を進めることにより、より副作用の少なく効果の高い医薬品の開発が可能になると思われる。
(Overview for Examples 1-16)
Advances in human genome research have greatly advanced the analysis of human chromosome sequences, but not all of the functions of human genes have been revealed. By analyzing human genes with emphasis on their diversity, we have clarified that diversity is greatly related to changes in gene function.
By comparing the sequence information of the human genome with the human cDNA data transcribed from it, it was found that multiple mRNAs were transcribed from a certain region of the chromosome. There is a difference in the ORF region that is predicted to encode a protein and it is predicted that a different protein will be produced, and the difference is in the 5'UTR region and 3'UTR region that are untranslated regions, and the same protein as the protein There was a case. We searched and sequenced such cDNAs, with particular emphasis on cDNAs that are predicted to encode proteins that are different from known cDNAs that have already been analyzed. Then, it was found that the causes of diversity were mainly transcription start point selectivity and exon selectivity. In terms of the selectivity of the transcription start point, the transcription factor used in a certain chromosomal region changed, and thus the transcription start position was different, resulting in diversity in cDNA. In addition, in terms of exon selectivity, when transcription and splicing occurred, diversity occurred in cDNA by increasing or decreasing the number of exons used even if they were transcribed from the same chromosomal region.
We analyzed how gene diversity is related to function based on mRNA expression frequency information based on the 5 'end sequence (5'-onepass sequence) of about 1.5 million human cDNAs. We found many examples where diversity seems to have a significant effect on function, such as selective transcriptional regions differing only in certain organs or exon deletion only in certain pathological conditions. We found and analyzed in detail the genes that show changes in mRNA diversity in the differentiation stage of blood cell-derived osteoclasts, synovial tissue of rheumatic patients, and blood cell organ tissues.
As an analysis method, the expression levels were compared using real-time PCR (polymerase chain reaction). For example, if there is an exon that is predicted to be selectively inserted only when CD34-positive (CD34 +) cells that are blood cells differentiate into multinucleated osteoclasts, Primer that specifically detects the exon region ( 01) is designed, and Primer (02) that specifically detects only the pattern in which the exon is not inserted is designed, and Primer (03) is also designed to detect a region shared by both patterns. Using these three types of Primer, we compare the amount of amplification at each stage of osteoclast differentiation. By comparing the amount of amplification of 03 in the shared region as a control and comparing the amount of amplification by stage of osteoclast differentiation of 01 and 02, which is the detection result of specific regions, the selectivity of exon You can see how it has changed due to differentiation. In other words, the correlation between exon selectivity and tissue-specific expression can be observed.
With this method, we have found many genes whose gene diversity is associated with tissue-specific expression. The specificity of the expressed tissue suggests that diversity greatly affects the function of the gene. In other words, it is possible to detect in detail the differentiation stage of osteoclasts by using a specific region where diversity occurs as a genetic marker, or to investigate the pathology of blood cell tissues such as synovial tissue. It seems that it will be possible to know the situation. Furthermore, for example, by proceeding with the development of a drug targeting a protein having a specific region expressed from a blood cell system tissue, it is considered possible to develop a drug having a higher effect with fewer side effects.

<in vitro破骨細胞形成法と破骨細胞についての説明>
1)破骨細胞
破骨細胞は単球、マクロファージ系の前駆細胞に由来する多核細胞であり、正常な骨リモデリングのみならず慢性関節リューマチ、癌の骨転移などの病的な骨吸収においても中心的な役割を果たしている(Miyamoto, T. and Suda, T., Keio J Med. (2003) 52: 1-7; Udagawa, N. et al., Arthritis Res. (2002) 4: 281-289)。破骨細胞の研究が進んでいなかった理由のひとつは、破骨細胞が分裂能のない細胞であり、株細胞が存在しなかったことであった。しかし、最近、単独細胞を破骨細胞に分化させることが可能になった。
<Explanation of in vitro osteoclast formation method and osteoclast>
1) Osteoclasts Osteoclasts are multinucleated cells derived from monocyte and macrophage progenitor cells, and not only in normal bone remodeling but also in pathological bone resorption such as rheumatoid arthritis and bone metastasis of cancer. It plays a central role (Miyamoto, T. and Suda, T., Keio J Med. (2003) 52: 1-7; Udagawa, N. et al., Arthritis Res. (2002) 4: 281-289 ). One reason for the lack of research on osteoclasts was that osteoclasts were non-dividing cells and there were no cell lines. Recently, however, it has become possible to differentiate single cells into osteoclasts.

2)マウス破骨細胞形成系
1988年に高橋らは、マウス骨髄細胞を活性型ビタミンD3や副甲状腺ホルモンなどの骨吸収因子の存在下で培養することで破骨細胞様の多核細胞が形成されることを発見した(Takahashi, N. et al., Endocrinology (1988) 123: 1504-1510)。この方法で形成された多核細胞は、酒石酸抵抗性酸ホスファターゼ(tartrate-resistant acid phosphoatase, TRAP)陽性で多数のカルシトニンレセプターをもち、象牙質切片上で吸収窩を形成するなど破骨細胞としての性質を全て満足するものであった。このとき形成される破骨細胞様細胞が、アルカリホスファターゼ陽性の骨芽細胞様のストローマ細胞に近接して形成されることから、彼らは骨芽細胞が血球系の細胞から破骨細胞への分化を支持しているのではないかと考えた。そこでマウス頭蓋骨から得られた骨芽細胞と純粋に血球系の細胞である脾細胞との共存培養を行ったところ、予想通り骨吸収因子の存在下で破骨細胞様細胞が形成された(Takahashi, N. et al., Endocrinology (1988) 123: 2600-2602)。興味深いことに骨芽細胞、脾細胞を単独で培養すると、骨吸収因子が存在しても破骨細胞は形成されず、骨芽細胞と破骨細胞前駆細胞との直接の接触が破骨細胞形成に必須であることが明らかになった。この時の骨芽細胞の役割については永らく不明であったが、最近骨芽細胞の産生するマクロファージコロニー刺激因子(macrophage colony-stimulating factor, M-CSF)(Yoshida, H. et al., Nature (1990) 345: 442-444)及びOsteoclast Differentiation Factor(ODF)(Yasuda, H. et al., Proc. Natl. Acad. Sci. USA (1998) 95: 3597-3602)が破骨細胞の分化において極めて重要な役割を果たすことが明らかになった。
2) Mouse osteoclast formation system
In 1988, Takahashi et al. Discovered that osteoclast-like multinucleated cells were formed by culturing mouse bone marrow cells in the presence of bone resorption factors such as active vitamin D3 and parathyroid hormone (Takahashi, N. et al., Endocrinology (1988) 123: 1504-1510). The multinucleated cells formed by this method are tartrate-resistant acid phosphatase (TRAP) -positive, have many calcitonin receptors, and have properties as osteoclasts such as forming resorption pits on dentin slices. We were all satisfied. The osteoclast-like cells formed at this time are formed close to alkaline phosphatase-positive osteoblast-like stromal cells, so they differentiate from osteocytic cells to osteoclasts. I thought that it might support. Therefore, when osteoblasts obtained from the mouse skull and splenocytes, which are purely blood cells, were cocultured, osteoclast-like cells were formed in the presence of bone resorption factor as expected (Takahashi , N. et al., Endocrinology (1988) 123: 2600-2602). Interestingly, when osteoblasts and spleen cells are cultured alone, osteoclasts are not formed even in the presence of bone resorption factor, and direct contact between osteoblasts and osteoclast precursor cells is osteoclast formation. It became clear that it was essential. The role of osteoblasts at this time has been unknown for some time, but recently the macrophage colony-stimulating factor (M-CSF) produced by osteoblasts (Yoshida, H. et al., Nature ( 1990) 345: 442-444) and Osteoclast Differentiation Factor (ODF) (Yasuda, H. et al., Proc. Natl. Acad. Sci. USA (1998) 95: 3597-3602) are extremely important in osteoclast differentiation. It became clear that it played an important role.

3)ヒト破骨細胞形成系
1998年に保田ら(Yasuda, H. et al., Proc. Natl. Acad. Sci. USA (1998) 95: 3597-3602)がODFをクローニングして以来、単独細胞による破骨細胞分化の研究が進められ、須田らのグループにより、ヒト齊帯血由来CD34陽性(CD34+)細胞をM-CSF及びODF処理すると、約10日目に多核破骨細胞が形成されることが見出された。この細胞はマクロファージとしても増殖するが、分化の条件を整えることにより効率的に(純度よく)破骨細胞に分化させることができるようになった。
3) Human osteoclast formation system
Since 1998 when Yasuda et al. (Yasuda, H. et al., Proc. Natl. Acad. Sci. USA (1998) 95: 3597-3602) have cloned ODF, research into osteoclast differentiation by single cells has been conducted. Advanced, it was found by the group of Suda et al. That multinucleated osteoclasts were formed about 10 days after treatment of human cord blood-derived CD34 positive (CD34 +) cells with M-CSF and ODF. Although these cells proliferate as macrophages, they can be efficiently differentiated into osteoclasts (with high purity) by adjusting the differentiation conditions.

4)分化誘導細胞からのcDNAライブラリー作製と遺伝子発現解析
ヒト齊帯血由来CD34+細胞をM-CSF及びODF処理すると、約10日目に多核破骨細胞が形成される。ヒト齊帯血由来CD34+細胞をAllCells, LLCのCB-CD34+を購入し、3週間培養して増やした後、ODFで分化誘導した。分化誘導後、各分化段階の状況を見てみると、6日で多核破骨細胞に分化した細胞が見られるようになり、9日ではほとんどが多核破骨細胞に分化していた。この未分化及び分化誘導後、3日、6日及び9日より改良オリゴキャップ法でcDNAライブラリーを作成し、5'-端の配列解析することにより遺伝子発現頻度解析をおこなった。その結果を他のcDNAライブラリーからの5'-端配列などと比較することにより、発現特異性のあるcDNAを取得し、更なる解析を行った。
4) Preparation of cDNA library from differentiation-inducing cells and gene expression analysis When CD34 + cells derived from human cord blood are treated with M-CSF and ODF, multinucleated osteoclasts are formed on the 10th day. Human cord blood-derived CD34 + cells were purchased from AllCells, LLC, CB-CD34 +, cultured for 3 weeks, and then differentiated with ODF. After differentiation induction, looking at the status of each differentiation stage, cells that differentiated into multinucleated osteoclasts were seen on the 6th day, and most were differentiated into multinucleated osteoclasts on the 9th day. After this undifferentiation and differentiation induction, a cDNA library was prepared by the improved oligocap method from the 3rd, 6th and 9th, and the gene expression frequency analysis was performed by analyzing the 5'-end sequence. By comparing the results with other 5'-end sequences from other cDNA libraries, cDNA with expression specificity was obtained and further analysis was performed.

5)骨粗鬆症に関連する遺伝子・mRNA
骨粗鬆症とは、骨の成分が全体として減少し、骨折しやすくなった病態であるが、その発症には骨を産生する骨芽細胞と、骨を吸収する破骨細胞の働きのバランス、すなわち骨代謝が関与する。したがって単球/マクロファージ系の前駆細胞から分化する破骨細胞の増加に関連する遺伝子・mRNAは、骨代謝に関連した骨粗鬆症に関する遺伝子・mRNAであると言える。
5) Genes and mRNAs related to osteoporosis
Osteoporosis is a condition in which the composition of bone has decreased as a whole and fractures have become easier, but the onset of the disease is the balance between the action of osteoblasts that produce bone and osteoclasts that absorb bone, that is, bone. Metabolism is involved. Therefore, it can be said that the gene / mRNA related to the increase of osteoclasts differentiated from monocyte / macrophage progenitor cells is a gene / mRNA related to osteoporosis related to bone metabolism.

<CD34陽性(CD34+)細胞>
CD34+細胞は、ヒトの血液幹細胞を豊富に含む細胞分画である。CD34は、分子量約110kDaの膜蛋白質であり、ヒト骨髄細胞の約1%に発現していて、接着分子として機能していると考えられている。CD34+細胞の約3分の1がin vitroでコロニーを形成する。ヒトCD34+細胞は、T細胞にも分化でき、ヒトの造血幹細胞はCD34を発現していることが明らかになっている。現在では、CD34+細胞を移植する造血幹細胞移植も実用化されている。造血幹細胞はヒトの末梢血中や臍帯血中にも存在し、CD34+細胞はそれぞれ0.01%, 0.3%程度であると言われている。
<CD34 positive (CD34 +) cells>
CD34 + cells are a cell fraction rich in human blood stem cells. CD34 is a membrane protein having a molecular weight of about 110 kDa, and is expressed in about 1% of human bone marrow cells, and is considered to function as an adhesion molecule. About one-third of CD34 + cells form colonies in vitro. Human CD34 + cells can also differentiate into T cells, and human hematopoietic stem cells have been shown to express CD34. At present, hematopoietic stem cell transplantation for transplanting CD34 + cells is also in practical use. Hematopoietic stem cells are also present in human peripheral blood and umbilical cord blood, and CD34 + cells are said to be about 0.01% and 0.3%, respectively.

<滑膜(synovial)組織と関節リューマチの説明>
関節とは骨と骨をつなぐ部分であり、固い骨と骨が直接ぶつからないように、わずかな隙間(関節腔)は粘りのある関節液(滑液)で満たされ、骨の先を弾力のある軟骨が覆ってクッションの役割を果たしている。軟骨は水を80%も含む弾力のあるやわらかい骨で、コラーゲンという繊維成分を含み強さを保っている。軟骨は加齢や加重によりすり減るなど変化する。関節全体は関節胞に包まれ、その内側にある滑膜が関節液を分泌して、関節の動きをスムーズにして栄養を補給する。この滑膜に炎症が起こると関節に腫れや痛みが起こる。
慢性関節リューマチに特徴的な症状は関節の腫れと痛みである。この腫れと痛みの原因は関節に起こる炎症である。「炎症反応」は組織が傷ついたときに修復を行おうとする防御反応のひとつである。滑膜の炎症は、免疫細胞が自己を攻撃しはじめることで引き起こされる。1)T細胞や好中球などの免疫細胞が滑膜の中に入り込む。2)滑膜の中にリューマチ因子があらわれ関節液へこぼれだす。3)リューマチ因子は、IgGという抗体と結びつき「免疫複合体」になり、さらに補体というタンパク質と結びつき好中球やマクロファージ及びよせる。4)好中球はライソゾームやプロスタグランジンという物質を出して「免疫複合体」を攻撃する。これらの物質や酵素は滑膜に炎症を起こしたり、骨や軟骨を破壊する。多量の関節液が分泌されて関節が腫れあがって痛む。T細胞やB細胞が攻撃に加わるとさらに炎症が進み慢性化する。滑膜の炎症が慢性化すると、徐々に関節の変形が起こってくる。骨の破壊や変形は元へは戻せないので、早期発見で治療を行い、炎症をくい止めることが大切である。
関節リューマチのステージは次のようである。ステージ1(初期):関節腔に関節液が増えると骨のカルシウム分が失われていき、まだ骨の破壊は起きていないが骨にスが入ったような骨萎縮がみられる場合がある。ステージ2(中等度):滑膜の細胞が増殖し肉芽(パンヌス)を形成、肉芽が軟骨と軟骨下の骨を侵食しはじめ、骨びらんがみられる。関節周辺の筋肉に萎縮がみられる。ステージ3(高度):軟骨の侵食が進み骨も破壊され関節がうまく噛み合わなくなり関節の変形や亜脱臼・脱臼が起こる。筋肉に強い萎縮がみられ筋肉や腱の伸縮が悪くなり関節の変形が起きる。ステージ4(末期):肉芽が繊維化して硬くなり、二つの骨の端がくっついて骨癒合の状態となり関節がまったく動かせない状態になる。
<Description of synovial tissue and rheumatoid arthritis>
The joint is the part that connects the bones, and the slight gap (joint cavity) is filled with sticky joint fluid (synovial fluid) so that the hard bones do not collide directly, and the tip of the bone is elastic A cartilage covers and acts as a cushion. Cartilage is a soft and soft bone containing 80% water, and contains a fiber component called collagen to maintain its strength. Cartilage changes with age and weight. The entire joint is wrapped in an articular follicle, and the synovium inside it secretes joint fluid, smoothing the movement of the joint and replenishing nutrition. When inflammation occurs in the synovium, swelling and pain occur in the joint.
Symptoms characteristic of rheumatoid arthritis are joint swelling and pain. The cause of this swelling and pain is inflammation in the joints. “Inflammatory response” is one of the protective responses to repair when a tissue is damaged. Synovial inflammation is caused by immune cells beginning to attack themselves. 1) Immune cells such as T cells and neutrophils enter the synovium. 2) Rheumatoid factor appears in the synovium and spills into the joint fluid. 3) Rheumatoid factor binds to an antibody called IgG to form an “immune complex”, and further binds to a protein called complement to cause neutrophils and macrophages. 4) Neutrophils attack the “immune complex” by producing substances such as lysosomes and prostaglandins. These substances and enzymes cause inflammation in the synovium and destroy bone and cartilage. A large amount of joint fluid is secreted and the joint swells and hurts. When T cells and B cells participate in the attack, the inflammation further progresses and becomes chronic. When the inflammation of the synovium becomes chronic, joint deformation gradually occurs. Since bone destruction and deformation cannot be reversed, it is important to treat with early detection and stop inflammation.
The stage of rheumatoid arthritis is as follows. Stage 1 (Initial): When the joint fluid increases in the joint cavity, the calcium content of the bones is lost, and bone destruction has not yet occurred, but there may be bone atrophy such that the bones are filled. Stage 2 (moderate): Synovial cells proliferate to form granulation (pannus), granulation begins to erode cartilage and subchondral bone, and bone erosion is observed. Atrophy is seen in the muscles around the joint. Stage 3 (advanced): The cartilage erodes and the bones are destroyed, causing the joints to not mesh properly, resulting in joint deformation and subluxation / dislocation. Strong atrophy is seen in the muscles, and the muscles and tendons stretch and become deformed. Stage 4 (end stage): The granulation becomes fibrotic and hard, the ends of the two bones stick together and become a bone fusion state, and the joint cannot move at all.

<骨髄(bone marrow)>
骨髄は、骨の中に存在する柔組織である。骨髄は血液に富み、あらゆる血球系細胞(赤血球、白血球、リンパ球、血小板のもとになる巨核球など)に分化できる造血幹細胞が存在する。マウスにおいては一個の造血幹細胞を移植することによって、すべての造血系細胞を再構成させることができることが証明されており、ヒトにおいても骨髄移植は白血病など造血系の疾患の根治的治療として有効である場合がある。
<Bone marrow>
Bone marrow is a soft tissue that exists in bone. The bone marrow is rich in blood, and there are hematopoietic stem cells that can differentiate into all blood cells (red blood cells, white blood cells, lymphocytes, megakaryocytes that form platelets, etc.). In mice, it has been proven that all hematopoietic cells can be reconstituted by transplanting a single hematopoietic stem cell. In humans, bone marrow transplantation is effective as a radical treatment for hematopoietic diseases such as leukemia. There may be.

<胸腺(thymus)>
胸腺は胸腔に存在する免疫系に関与する臓器である。思春期までは活発に機能するが、その後はだんだん小さくなり、やがて脂肪になる。胸腺において、Tリンパ球を分化する役割を持つ。しかし、年齢による萎縮によりTリンパ球の分化が徐々に行えなくなるため、加齢と共に自己抗体が作られ正常な細胞を破壊していくため、老化の要因の一因として考えられている。
<Thymus>
The thymus is an organ involved in the immune system that resides in the thoracic cavity. It works actively until puberty, but then becomes smaller and eventually fat. It has a role to differentiate T lymphocytes in the thymus. However, since T lymphocytes cannot gradually differentiate due to age-related atrophy, autoantibodies are made with age and destroy normal cells, which is considered to be a cause of aging.

<脾臓(spleen)>
脾臓は脾動脈及び脾静脈に介在する臓器である。脾臓の機能は次のようである。免疫機能:白脾髄でリンパ球を作る。造血機能:骨髄で造血が始まるまでの胎生期には、脾臓で赤血球が作られている。生後はその機能は失われるが、大量出血や骨髄の機能が抑制された状態では再び脾臓での造血が行われることがある。血球の破壊:古くなった赤血球の破壊を行う。赤血球中のヘモグロビンも破壊され鉄を回収する働きもある。血液の貯蔵機能:血液を蓄える機能がある。人間ではそれほど多くの血液の貯留はされない。筋肉が大量の酸素を必要とするような運動時には、脾臓から貯蔵されていた血液を駆出することで充分な酸素を筋肉へ送り届けることが出来る。
<Spleen>
The spleen is an organ that intervenes in the splenic artery and splenic vein. The function of the spleen is as follows. Immune function: Making lymphocytes in the white pulp. Hematopoietic function: Red blood cells are made in the spleen during the embryonic period until hematopoiesis begins in the bone marrow. Its function is lost after birth, but hematopoiesis may occur again in the spleen if massive bleeding or bone marrow function is suppressed. Blood cell destruction: Destruction of old red blood cells. Hemoglobin in erythrocytes is also destroyed and has the function of recovering iron. Blood storage function: Has the function of storing blood. Humans do not store much blood. When exercising your muscles needing a lot of oxygen, you can deliver enough oxygen to your muscles by expelling the blood stored in your spleen.

<Jurkat細胞>
ヒトT細胞株である(T-cell leukemia)。
<Jurkat cells>
It is a human T cell line (T-cell leukemia).

本出願は、日本国で出願された特願2007−066434(出願日:2007年3月15日)を基礎としており、その内容は本明細書に全て包含されるものである。   This application is based on Japanese Patent Application No. 2007-066434 (filing date: March 15, 2007) filed in Japan, the contents of which are incorporated in full herein.

Claims (27)

以下1)〜12)のいずれかのポリペプチド又はその特異的な部分ペプチド:
1)配列番号10で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
2)配列番号30若しくは配列番号37で表されるアミノ酸配列又は配列番号30で表されるアミノ酸配列において24〜543番目のアミノ酸残基からなるアミノ酸配列、あるいはそれらと実質的に同一のアミノ酸配列を有するポリペプチド;
3)配列番号57で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
4)配列番号73で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
5)配列番号88で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
6)配列番号104で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
7)配列番号120で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
8)配列番号143若しくは配列番号153で表されるアミノ酸配列、又はそれらと実質的に同一のアミノ酸配列を有するポリペプチド;
9)配列番号173若しくは配列番号180で表されるアミノ酸配列、又はそれらと実質的に同一のアミノ酸配列を有するポリペプチド;
10)配列番号201で表されるアミノ酸配列、又はそれと実質的に同一のアミノ酸配列を有するポリペプチド;
11)配列番号226若しくは配列番号233で表されるアミノ酸配列又は配列番号226で表されるアミノ酸配列において25〜853番目のアミノ酸残基からなるアミノ酸配列若しくは配列番号233で表されるアミノ酸配列において25〜216番目のアミノ酸残基からなるアミノ酸配列、あるいはそれらと実質的に同一のアミノ酸配列を有するポリペプチド;あるいは
12)配列番号251、配列番号266若しくは配列番号272で表されるアミノ酸配列、又はそれらと実質的に同一のアミノ酸配列を有するポリペプチド。
The polypeptide of any one of 1) to 12) below or a specific partial peptide thereof:
1) a polypeptide having the amino acid sequence represented by SEQ ID NO: 10 or an amino acid sequence substantially identical thereto;
2) An amino acid sequence represented by SEQ ID NO: 30 or 37, an amino acid sequence consisting of amino acid residues 24 to 543 in the amino acid sequence represented by SEQ ID NO: 30, or an amino acid sequence substantially identical to them A polypeptide having;
3) a polypeptide having the amino acid sequence represented by SEQ ID NO: 57 or a substantially identical amino acid sequence thereto;
4) a polypeptide having the amino acid sequence represented by SEQ ID NO: 73 or an amino acid sequence substantially identical thereto;
5) A polypeptide having the amino acid sequence represented by SEQ ID NO: 88, or a substantially identical amino acid sequence thereof;
6) a polypeptide having the amino acid sequence represented by SEQ ID NO: 104 or a substantially identical amino acid sequence thereof;
7) A polypeptide having the amino acid sequence represented by SEQ ID NO: 120 or a substantially identical amino acid sequence thereof;
8) A polypeptide having the amino acid sequence represented by SEQ ID NO: 143 or SEQ ID NO: 153, or a substantially identical amino acid sequence thereto;
9) A polypeptide having the amino acid sequence represented by SEQ ID NO: 173 or SEQ ID NO: 180, or a substantially identical amino acid sequence thereof;
10) a polypeptide having the amino acid sequence represented by SEQ ID NO: 201, or a substantially identical amino acid sequence thereof;
11) 25 in the amino acid sequence represented by SEQ ID NO: 226 or SEQ ID NO: 233, the amino acid sequence consisting of the 25th to 853rd amino acid residues in the amino acid sequence represented by SEQ ID NO: 226, or the amino acid sequence represented by SEQ ID NO: 233 An amino acid sequence consisting of the 216th amino acid residue, or a polypeptide having an amino acid sequence substantially identical to them; or 12) an amino acid sequence represented by SEQ ID NO: 251, SEQ ID NO: 266 or SEQ ID NO: 272, or thereof A polypeptide having substantially the same amino acid sequence as
該ポリペプチドが以下1)〜12)のいずれかのポリペプチドである、請求項1記載のポリペプチド又はその特異的な部分ペプチド:
1)配列番号10で表されるアミノ酸配列からなるポリペプチド;
2)配列番号30若しくは配列番号37で表されるアミノ酸配列又は配列番号30で表されるアミノ酸配列において24〜543番目のアミノ酸残基からなるアミノ酸配列からなるポリペプチド;
3)配列番号57で表されるアミノ酸配列からなるポリペプチド;
4)配列番号73で表されるアミノ酸配列からなるポリペプチド;
5)配列番号88で表されるアミノ酸配列からなるポリペプチド;
6)配列番号104で表されるアミノ酸配列からなるポリペプチド;
7)配列番号120で表されるアミノ酸配列からなるポリペプチド;
8)配列番号143若しくは配列番号153で表されるアミノ酸配列からなるポリペプチド;
9)配列番号173若しくは配列番号180で表されるアミノ酸配列からなるポリペプチド;
10)配列番号201で表されるアミノ酸配列からなるポリペプチド;
11)配列番号226若しくは配列番号233で表されるアミノ酸配列又は配列番号226で表されるアミノ酸配列において25〜853番目のアミノ酸残基からなるアミノ酸配列若しくは配列番号233で表されるアミノ酸配列において25〜216番目のアミノ酸残基からなるアミノ酸配列からなるポリペプチド;あるいは
12)配列番号251、配列番号266若しくは配列番号272で表されるアミノ酸配列からなるポリペプチド。
The polypeptide according to claim 1 or a specific partial peptide thereof, wherein the polypeptide is a polypeptide of any one of 1) to 12) below:
1) a polypeptide comprising the amino acid sequence represented by SEQ ID NO: 10;
2) A polypeptide comprising an amino acid sequence consisting of amino acid residues 24 to 543 in the amino acid sequence represented by SEQ ID NO: 30 or SEQ ID NO: 37 or the amino acid sequence represented by SEQ ID NO: 30;
3) a polypeptide comprising the amino acid sequence represented by SEQ ID NO: 57;
4) a polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 73;
5) a polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 88;
6) a polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 104;
7) a polypeptide comprising the amino acid sequence represented by SEQ ID NO: 120;
8) a polypeptide comprising the amino acid sequence represented by SEQ ID NO: 143 or SEQ ID NO: 153;
9) A polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 173 or SEQ ID NO: 180;
10) a polypeptide consisting of the amino acid sequence represented by SEQ ID NO: 201;
11) 25 in the amino acid sequence represented by SEQ ID NO: 226 or SEQ ID NO: 233, the amino acid sequence consisting of the 25th to 853rd amino acid residues in the amino acid sequence represented by SEQ ID NO: 226, or the amino acid sequence represented by SEQ ID NO: 233 A polypeptide comprising an amino acid sequence comprising the 216th amino acid residue; or 12) a polypeptide comprising an amino acid sequence represented by SEQ ID NO: 251, SEQ ID NO: 266 or SEQ ID NO: 272.
異種アミノ酸配列からなるポリペプチドと融合している、請求項1又は2記載のポリペプチド又はその特異的な部分ペプチド。   The polypeptide according to claim 1 or 2, or a specific partial peptide thereof, which is fused with a polypeptide comprising a heterologous amino acid sequence. 以下1)〜12)のいずれかの部分ペプチドである、血球系・破骨細胞特異的遺伝子1〜12によりコードされるポリペプチドに特異的な部分ペプチド:
1)配列番号12若しくは配列番号14で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド、あるいは配列番号16で表されるアミノ酸配列を含む部分ペプチド;
2)配列番号32若しくは配列番号34で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド、あるいは配列番号39で表されるアミノ酸配列を含む部分ペプチド;
3)配列番号59で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
4)配列番号290で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
5)配列番号90で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
6)配列番号106で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
7)配列番号124、配列番号125若しくは配列番号127で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
8)配列番号145、配列番号147、配列番号149、配列番号155、配列番号157若しくは配列番号159で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
9)配列番号175、配列番号177、配列番号182若しくは配列番号184で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
10)配列番号204若しくは配列番号206で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;
11)配列番号228、配列番号230、配列番号235若しくは配列番号237で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド;あるいは
12)配列番号253、配列番号256、配列番号258、配列番号259、配列番号261、配列番号263、配列番号268、配列番号275、配列番号276若しくは配列番号278で表されるアミノ酸配列、又はそれらの部分アミノ酸配列からなる部分ペプチド。
The partial peptide specific to the polypeptide encoded by the blood cell / osteoclast specific gene 1-12, which is a partial peptide of any one of 1) to 12) below:
1) the amino acid sequence represented by SEQ ID NO: 12 or SEQ ID NO: 14, or a partial peptide comprising these partial amino acid sequences, or a partial peptide comprising the amino acid sequence represented by SEQ ID NO: 16;
2) the amino acid sequence represented by SEQ ID NO: 32 or SEQ ID NO: 34, or a partial peptide comprising these partial amino acid sequences, or a partial peptide comprising the amino acid sequence represented by SEQ ID NO: 39;
3) A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 59 or a partial amino acid sequence thereof;
4) A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 290 or a partial amino acid sequence thereof;
5) A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 90 or a partial amino acid sequence thereof;
6) A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 106 or a partial amino acid sequence thereof;
7) A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 124, SEQ ID NO: 125 or SEQ ID NO: 127, or a partial amino acid sequence thereof;
8) SEQ ID NO: 145, SEQ ID NO: 147, SEQ ID NO: 149, SEQ ID NO: 155, SEQ ID NO: 157 or SEQ ID NO: 159, or a partial peptide consisting of these partial amino acid sequences;
9) The amino acid sequence represented by SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 182 or SEQ ID NO: 184, or a partial peptide comprising these partial amino acid sequences;
10) A partial peptide comprising the amino acid sequence represented by SEQ ID NO: 204 or SEQ ID NO: 206, or a partial amino acid sequence thereof;
11) the amino acid sequence represented by SEQ ID NO: 228, SEQ ID NO: 230, SEQ ID NO: 235 or SEQ ID NO: 237, or a partial peptide consisting of a partial amino acid sequence thereof; or 12) SEQ ID NO: 253, SEQ ID NO: 256, SEQ ID NO: 258, A partial peptide consisting of the amino acid sequence represented by SEQ ID NO: 259, SEQ ID NO: 261, SEQ ID NO: 263, SEQ ID NO: 268, SEQ ID NO: 275, SEQ ID NO: 276, or SEQ ID NO: 278, or a partial amino acid sequence thereof.
請求項1〜3のいずれか1項記載のポリペプチド、又は請求項1〜4のいずれか1項記載の特異的な部分ペプチドをコードするポリヌクレオチド。   A polynucleotide encoding the polypeptide according to any one of claims 1 to 3, or the specific partial peptide according to any one of claims 1 to 4. 以下1)〜12)のいずれかのポリヌクレオチド又はその特異的な部分ヌクレオチド:
1)配列番号8で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
2)配列番号28若しくは配列番号35で表される核酸配列、又はそれらのORF対応核酸配列、又は配列番号28で表される核酸配列において357〜1919番目のヌクレオチド残基からなる核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
3)配列番号55で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
4)配列番号71で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
5)配列番号86で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
6)配列番号102で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
7)配列番号118で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
8)配列番号141若しくは配列番号151、又はそれらのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
9)配列番号171若しくは配列番号178で表される核酸配列、又はそれらのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
10)配列番号199で表される核酸配列、又はそのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;
11)配列番号224若しくは配列番号231で表される核酸配列、又はそれらのORF対応核酸配列、又は配列番号224で表される核酸配列において118〜2604番目のヌクレオチド残基からなる核酸配列若しくは配列番号231で表される核酸配列において118〜693番目のヌクレオチド残基からなる核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド;あるいは
12)配列番号249、配列番号264若しくは配列番号270で表される核酸配列、又はそれらのORF対応核酸配列、あるいはそれらと実質的に同一の核酸配列を有するポリヌクレオチド。
The polynucleotide of any one of 1) to 12) below or a specific partial nucleotide thereof:
1) a nucleic acid sequence represented by SEQ ID NO: 8, a nucleic acid sequence corresponding to the ORF, or a polynucleotide having a nucleic acid sequence substantially identical to them;
2) Nucleic acid sequence represented by SEQ ID NO: 28 or SEQ ID NO: 35, or an ORF corresponding nucleic acid sequence thereof, or a nucleic acid sequence consisting of nucleotide residues 357 to 1919 in the nucleic acid sequence represented by SEQ ID NO: 28, or thereof A polynucleotide having a nucleic acid sequence substantially identical to said;
3) a polynucleotide having the nucleic acid sequence represented by SEQ ID NO: 55, the ORF-compatible nucleic acid sequence, or a nucleic acid sequence substantially the same as them;
4) a nucleic acid sequence represented by SEQ ID NO: 71, a nucleic acid sequence corresponding to the ORF, or a polynucleotide having a nucleic acid sequence substantially the same as them;
5) a polynucleotide having the nucleic acid sequence represented by SEQ ID NO: 86, the ORF-corresponding nucleic acid sequence, or a nucleic acid sequence substantially identical thereto;
6) a polynucleotide having the nucleic acid sequence represented by SEQ ID NO: 102, the ORF-corresponding nucleic acid sequence, or a nucleic acid sequence substantially identical thereto;
7) a nucleic acid sequence represented by SEQ ID NO: 118, a nucleic acid sequence corresponding to the ORF, or a polynucleotide having a nucleic acid sequence substantially the same as them;
8) a polynucleotide having SEQ ID NO: 141 or 151, or an ORF corresponding nucleic acid sequence thereof, or a nucleic acid sequence substantially identical thereto;
9) a nucleic acid sequence represented by SEQ ID NO: 171 or SEQ ID NO: 178, or an ORF corresponding nucleic acid sequence thereof, or a polynucleotide having a nucleic acid sequence substantially identical to them;
10) a polynucleotide having the nucleic acid sequence represented by SEQ ID NO: 199, or an ORF-corresponding nucleic acid sequence, or a nucleic acid sequence substantially identical thereto;
11) The nucleic acid sequence represented by SEQ ID NO: 224 or SEQ ID NO: 231 or the ORF-compatible nucleic acid sequence thereof, or the nucleic acid sequence consisting of 118 to 2604th nucleotide residues in the nucleic acid sequence represented by SEQ ID NO: 224 or SEQ ID NO: A nucleic acid sequence consisting of nucleotide residues 118 to 693 in the nucleic acid sequence represented by 231; or a polynucleotide having a nucleic acid sequence substantially the same as them; or 12) SEQ ID NO: 249, SEQ ID NO: 264, or SEQ ID NO: 270 A polynucleotide having the nucleic acid sequence represented by the above, or the ORF corresponding nucleic acid sequence thereof, or a nucleic acid sequence substantially identical to them.
該1)〜12)のいずれかのポリヌクレオチドが以下1)〜12)のいずれかのポリヌクレオチドである、請求項6記載のポリヌクレオチド又はその特異的な部分ヌクレオチド:
1)配列番号8で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
2)配列番号28若しくは配列番号35で表される核酸配列、又はそれらのORF対応核酸配列、又は配列番号28で表される核酸配列において357〜1919番目のヌクレオチド残基からなる核酸配列からなるポリヌクレオチド;
3)配列番号55で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
4)配列番号71で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
5)配列番号86で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
6)配列番号102で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
7)配列番号118で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
8)配列番号141若しくは配列番号151、又はそれらのORF対応核酸配列からなるポリヌクレオチド;
9)配列番号171若しくは配列番号178で表される核酸配列、又はそれらのORF対応核酸配列からなるポリヌクレオチド;
10)配列番号199で表される核酸配列、又はそのORF対応核酸配列からなるポリヌクレオチド;
11)配列番号224若しくは配列番号231で表される核酸配列、又はそれらのORF対応核酸配列、又は配列番号224で表される核酸配列において118〜2604番目のヌクレオチド残基からなる核酸配列若しくは配列番号231で表される核酸配列において118〜693番目のヌクレオチド残基からなる核酸配列からなるポリヌクレオチド;あるいは
12)配列番号249、配列番号264若しくは配列番号270で表される核酸配列、又はそれらのORF対応核酸配列からなるポリヌクレオチド。
The polynucleotide according to claim 6 or a specific partial nucleotide thereof, wherein the polynucleotide of any one of 1) to 12) is the polynucleotide of any one of 1) to 12) below:
1) a nucleic acid sequence represented by SEQ ID NO: 8, or a polynucleotide comprising the nucleic acid sequence corresponding to the ORF;
2) a nucleic acid sequence represented by SEQ ID NO: 28 or SEQ ID NO: 35, or an ORF corresponding nucleic acid sequence thereof, or a nucleic acid sequence comprising a nucleic acid sequence consisting of nucleotide residues 357 to 1919 in the nucleic acid sequence represented by SEQ ID NO: 28 nucleotide;
3) a nucleic acid sequence represented by SEQ ID NO: 55 or a polynucleotide comprising the ORF-compatible nucleic acid sequence;
4) a polynucleotide comprising the nucleic acid sequence represented by SEQ ID NO: 71 or a nucleic acid sequence corresponding to the ORF;
5) a polynucleotide comprising the nucleic acid sequence represented by SEQ ID NO: 86 or a nucleic acid sequence corresponding to the ORF;
6) a polynucleotide consisting of the nucleic acid sequence represented by SEQ ID NO: 102, or a nucleic acid sequence corresponding to the ORF thereof;
7) a polynucleotide comprising the nucleic acid sequence represented by SEQ ID NO: 118 or a nucleic acid sequence corresponding to the ORF;
8) A polynucleotide comprising SEQ ID NO: 141 or SEQ ID NO: 151, or a nucleic acid sequence corresponding to the ORF thereof;
9) a polynucleotide comprising the nucleic acid sequence represented by SEQ ID NO: 171 or SEQ ID NO: 178, or an ORF-compatible nucleic acid sequence thereof;
10) a polynucleotide comprising the nucleic acid sequence represented by SEQ ID NO: 199 or a nucleic acid sequence corresponding to the ORF;
11) The nucleic acid sequence represented by SEQ ID NO: 224 or SEQ ID NO: 231 or the ORF-compatible nucleic acid sequence thereof, or the nucleic acid sequence consisting of 118 to 2604th nucleotide residues in the nucleic acid sequence represented by SEQ ID NO: 224 or SEQ ID NO: A polynucleotide comprising the nucleic acid sequence consisting of nucleotide residues 118 to 693 in the nucleic acid sequence represented by 231; or 12) the nucleic acid sequence represented by SEQ ID NO: 249, SEQ ID NO: 264 or SEQ ID NO: 270, or an ORF thereof A polynucleotide comprising a corresponding nucleic acid sequence.
以下1)〜12)のいずれかの部分ヌクレオチドである、血球系・破骨細胞特異的遺伝子1〜12によりコードされるポリヌクレオチドに特異的な部分ヌクレオチド:
1)配列番号11、配列番号13、配列番号15、配列番号17、配列番号20、配列番号23若しくは配列番号27で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
2)配列番号31、配列番号33、配列番号38、配列番号40、配列番号43、配列番号46、配列番号49、配列番号53若しくは配列番号54で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
3)配列番号58、配列番号60、配列番号63、配列番号66若しくは配列番号70で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
4)配列番号74、配列番号75、配列番号78、配列番号81若しくは配列番号85で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
5)配列番号89、配列番号91、配列番号94、配列番号97若しくは配列番号101で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
6)配列番号105、配列番号107、配列番号110、配列番号113若しくは配列番号117で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
7)配列番号121、配列番号122、配列番号123、配列番号126、配列番号130、配列番号134若しくは配列番号140で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
8)配列番号144、配列番号146、配列番号148、配列番号150、配列番号154、配列番号156、配列番号158、配列番号160、配列番号163、配列番号166若しくは配列番号170で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
9)配列番号174、配列番号176、配列番号181、配列番号183、配列番号187、配列番号190、配列番号193、配列番号197若しくは配列番号198で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
10)配列番号202、配列番号203、配列番号205、配列番号209、配列番号212、配列番号215、配列番号218、配列番号222若しくは配列番号223で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;
11)配列番号227、配列番号229、配列番号234、配列番号236、配列番号240、配列番号243、配列番号247若しくは配列番号248で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド;あるいは
12)配列番号252、配列番号254、配列番号255、配列番号257、配列番号260、配列番号262、配列番号267、配列番号269、配列番号273、配列番号274、配列番号277、配列番号281、配列番号284、配列番号288若しくは配列番号289で表される核酸配列、又はそれらの部分核酸配列からなる部分ヌクレオチド。
The following partial nucleotides specific to the polynucleotide encoded by the blood cell / osteoclast specific gene 1-12, which is any partial nucleotide of 1) to 12):
1) a nucleic acid sequence represented by SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 20, SEQ ID NO: 23 or SEQ ID NO: 27, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
2) Nucleic acid sequence represented by SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 43, SEQ ID NO: 46, SEQ ID NO: 49, SEQ ID NO: 53 or SEQ ID NO: 54, or a partial nucleic acid sequence thereof A partial nucleotide consisting of;
3) a nucleic acid sequence represented by SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 63, SEQ ID NO: 66 or SEQ ID NO: 70, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
4) a nucleic acid sequence represented by SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 78, SEQ ID NO: 81 or SEQ ID NO: 85, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
5) a nucleic acid sequence represented by SEQ ID NO: 89, SEQ ID NO: 91, SEQ ID NO: 94, SEQ ID NO: 97 or SEQ ID NO: 101, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
6) a nucleic acid sequence represented by SEQ ID NO: 105, SEQ ID NO: 107, SEQ ID NO: 110, SEQ ID NO: 113 or SEQ ID NO: 117, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
7) A nucleic acid sequence represented by SEQ ID NO: 121, SEQ ID NO: 122, SEQ ID NO: 123, SEQ ID NO: 126, SEQ ID NO: 130, SEQ ID NO: 134 or SEQ ID NO: 140, or a partial nucleotide consisting of a partial nucleic acid sequence thereof;
8) Nucleic acid represented by SEQ ID NO: 144, SEQ ID NO: 146, SEQ ID NO: 148, SEQ ID NO: 150, SEQ ID NO: 154, SEQ ID NO: 156, SEQ ID NO: 158, SEQ ID NO: 160, SEQ ID NO: 163, SEQ ID NO: 166 or SEQ ID NO: 170 A partial nucleotide consisting of a sequence or a partial nucleic acid sequence thereof;
9) Nucleic acid sequence represented by SEQ ID NO: 174, SEQ ID NO: 176, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 187, SEQ ID NO: 190, SEQ ID NO: 193, SEQ ID NO: 197 or SEQ ID NO: 198, or a partial nucleic acid sequence thereof A partial nucleotide consisting of;
10) Nucleic acid sequence represented by SEQ ID NO: 202, SEQ ID NO: 203, SEQ ID NO: 205, SEQ ID NO: 209, SEQ ID NO: 212, SEQ ID NO: 215, SEQ ID NO: 218, SEQ ID NO: 222 or SEQ ID NO: 223, or a partial nucleic acid sequence thereof A partial nucleotide consisting of;
11) A nucleic acid sequence represented by SEQ ID NO: 227, SEQ ID NO: 229, SEQ ID NO: 234, SEQ ID NO: 236, SEQ ID NO: 240, SEQ ID NO: 243, SEQ ID NO: 247, or SEQ ID NO: 248, or a partial nucleotide consisting of a partial nucleic acid sequence thereof Or 12) SEQ ID NO: 252, SEQ ID NO: 254, SEQ ID NO: 255, SEQ ID NO: 257, SEQ ID NO: 260, SEQ ID NO: 262, SEQ ID NO: 267, SEQ ID NO: 269, SEQ ID NO: 273, SEQ ID NO: 274, SEQ ID NO: 277, SEQ ID NO: 281, a nucleic acid sequence represented by SEQ ID NO: 284, SEQ ID NO: 288 or SEQ ID NO: 289, or a partial nucleotide consisting of a partial nucleic acid sequence thereof.
請求項5〜7のいずれか1項記載のポリヌクレオチド、又は請求項6〜8のいずれか1項記載の特異的な部分ヌクレオチド、及びそれに機能可能に連結されたプロモーターを含む、請求項1〜3のいずれか1項記載のポリペプチド、又は請求項1〜4のいずれか1項記載の特異的な部分ペプチドの発現ベクター。   The polynucleotide according to any one of claims 5 to 7, or the specific partial nucleotide according to any one of claims 6 to 8, and a promoter operably linked thereto. 5. An expression vector for the polypeptide according to any one of 3 or the specific partial peptide according to any one of claims 1 to 4. 請求項9記載の発現ベクターが導入された形質転換体。   A transformant into which the expression vector according to claim 9 has been introduced. 請求項7又は8記載の特異的な部分ヌクレオチドの核酸配列に相補的な核酸配列を含み、かつ血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチドの発現を抑制し得る、アンチセンス分子。   9. A nucleic acid sequence complementary to the nucleic acid sequence of the specific partial nucleotide according to claim 7 or 8, and suppressing the expression of any polypeptide encoded by a blood cell / osteoclast specific gene 1-12. Antisense molecules that can. 請求項7又は8記載の特異的な部分ヌクレオチドの核酸配列からなるセンス鎖、及びそれに相補的な核酸配列からなるアンチセンス鎖から構成され、かつセンス鎖及びアンチセンス鎖の一方又は双方の5’末端及び/又は3’末端においてオーバーハングを有していてもよい、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチドの発現を抑制し得る、RNAi誘導性核酸。   A sense strand comprising a nucleic acid sequence of the specific partial nucleotide according to claim 7 or 8, and an antisense strand comprising a nucleic acid sequence complementary thereto, and 5 'of one or both of the sense strand and the antisense strand RNAi-inducible nucleic acid capable of suppressing the expression of any polypeptide encoded by blood cell / osteoclast-specific genes 1-12, which may have an overhang at the terminal and / or 3 'terminal . RNAi誘導性核酸がsiRNAである、請求項12記載のRNAi誘導性核酸。   The RNAi-inducible nucleic acid according to claim 12, wherein the RNAi-inducible nucleic acid is siRNA. 請求項2〜4のいずれか1項記載の特異的な部分ペプチドに対応する領域を介して、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチドに結合し得る、アプタマー。   It can bind to any polypeptide encoded by the blood cell line / osteoclast-specific gene 1-12 via a region corresponding to the specific partial peptide according to any one of claims 2 to 4. Aptamer. 請求項2〜4のいずれか1項記載の特異的な部分ペプチドに対応する領域を介して、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチドに結合し得る、抗体。   It can bind to any polypeptide encoded by the blood cell line / osteoclast-specific gene 1-12 via a region corresponding to the specific partial peptide according to any one of claims 2 to 4. ,antibody. 抗体が以下i)〜iii)のいずれかである、請求項15記載の抗体:
i)ポリクローナル抗体;
ii)モノクローナル抗体又はその一部;
iii)キメラ抗体、ヒト化抗体又はヒト抗体。
The antibody according to claim 15, wherein the antibody is any one of i) to iii) below:
i) polyclonal antibodies;
ii) a monoclonal antibody or part thereof;
iii) chimeric, humanized or human antibodies.
請求項15又は16記載の抗体を産生する、細胞。   A cell that produces the antibody according to claim 15 or 16. 細胞がハイブリドーマである、請求項17記載の細胞。   The cell according to claim 17, wherein the cell is a hybridoma. 請求項1〜3のいずれか1項記載のポリペプチド、請求項11記載のアンチセンス分子、請求項12又は13記載のRNAi誘導性核酸、請求項14記載のアプタマー、請求項15又は16記載の抗体、あるいはそれらの発現ベクター、及び医薬として許容され得る担体を含む、組成物。   The polypeptide according to any one of claims 1 to 3, the antisense molecule according to claim 11, the RNAi-inducible nucleic acid according to claim 12 or 13, the aptamer according to claim 14, and the claims 15 or 16. A composition comprising an antibody, or an expression vector thereof, and a pharmaceutically acceptable carrier. 請求項1〜3のいずれか1項記載のポリペプチドの発現又は機能が調節された、哺乳動物細胞又は非ヒト哺乳動物。   A mammalian cell or a non-human mammal, wherein expression or function of the polypeptide according to any one of claims 1 to 3 is regulated. 以下(a)又は(b)を含む、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリヌクレオチド又はその特異的な部分ヌクレオチドに特異的なプライマーセット:
(a)請求項7記載のポリヌクレオチド、あるいは請求項7又は8記載の特異的な部分ヌクレオチドの第1の核酸配列に対応するセンスプライマー;及び
(b)請求項7記載のポリヌクレオチド、あるいは請求項7又は8記載の特異的な部分ヌクレオチドの第2の核酸配列に相補的な核酸配列に対応するアンチセンスプライマー。
Primer set specific to any polynucleotide encoded by the blood cell / osteoclast specific gene 1-12 or its specific partial nucleotide, including the following (a) or (b):
(A) a sense primer corresponding to the first nucleic acid sequence of the polynucleotide according to claim 7 or the specific partial nucleotide according to claim 7 or 8; and (b) the polynucleotide according to claim 7 or claim. Item 9. An antisense primer corresponding to a nucleic acid sequence complementary to the second nucleic acid sequence of the specific partial nucleotide according to Item 7 or 8.
以下(a)又は(b)のいずれかである、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリヌクレオチド又はその特異的な部分ヌクレオチドに特異的な核酸プローブ:
(a)請求項7又は8記載の特異的な部分ヌクレオチドの核酸配列に相補的な核酸配列を含む一本鎖ポリヌクレオチド;又は
(b)請求項7又は8記載の特異的な部分ヌクレオチドの核酸配列を含むセンス鎖、及びそれに相補的な核酸配列を含むアンチセンス鎖から構成される二本鎖ポリヌクレオチド。
A nucleic acid probe specific for any of the polynucleotides encoded by the blood cell line / osteoclast specific genes 1 to 12 or a specific partial nucleotide thereof, which is either of the following (a) or (b):
(A) a single-stranded polynucleotide comprising a nucleic acid sequence complementary to the nucleic acid sequence of the specific partial nucleotide according to claim 7 or 8, or (b) the nucleic acid of the specific partial nucleotide according to claim 7 or 8. A double-stranded polynucleotide comprising a sense strand comprising a sequence and an antisense strand comprising a nucleic acid sequence complementary thereto.
請求項14記載のアプタマー、請求項15又は16記載の抗体、請求項21記載のプライマーセット及び請求項22記載の核酸プローブから選ばれる1以上の物質又はセットを含む、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチド又はポリヌクレオチドの検出又は定量用試薬又はキット。   Blood cell line / osteoclast specific, comprising one or more substances or sets selected from the aptamer according to claim 14, the antibody according to claim 15 or 16, the primer set according to claim 21, and the nucleic acid probe according to claim 22. A reagent or kit for detection or quantification of any polypeptide or polynucleotide encoded by genetic genes 1-12. 血球系又は破骨細胞の同定、又はそれらの分化の判定用試薬又はキットである、請求項23記載の試薬又はキット。   24. The reagent or kit according to claim 23, which is a reagent or kit for identifying a blood cell line or osteoclast, or for determining differentiation thereof. 哺乳動物から得られた生体試料、あるいは細胞又は組織培養物において、血球系・破骨細胞特異的遺伝子1〜12によりコードされるいずれかのポリペプチド又はポリヌクレオチドの発現を測定することを含み、かつ該生体試料又は該培養物が血球系又は破骨細胞あるいは造血組織、リンパ組織又は滑膜組織を含む、該ポリペプチド又はポリヌクレオチドの検出又は定量方法。   Measuring the expression of any polypeptide or polynucleotide encoded by a blood cell / osteoclast specific gene 1-12 in a biological sample obtained from a mammal, or in a cell or tissue culture, And a method of detecting or quantifying the polypeptide or polynucleotide, wherein the biological sample or the culture contains blood cells, osteoclasts, hematopoietic tissue, lymphoid tissue or synovial tissue. 哺乳動物から得られた生体試料、あるいは細胞又は組織培養物において、請求項2又は3記載のポリペプチドあるいは請求項7記載のポリヌクレオチドの発現を測定することを含む、該ポリペプチド又は該ポリヌクレオチドの検出又は定量方法。   The polypeptide or the polynucleotide comprising measuring the expression of the polypeptide according to claim 2 or 3 or the polynucleotide according to claim 7 in a biological sample obtained from a mammal, or a cell or tissue culture. Detection or quantification method. 該生体試料又は該培養物が血球系又は破骨細胞あるいは造血組織、リンパ組織又は滑膜組織を含む、請求項26記載の検出又は定量方法。   27. The detection or quantification method according to claim 26, wherein the biological sample or the culture contains blood cells, osteoclasts, hematopoietic tissue, lymphoid tissue or synovial tissue.
JP2009505187A 2007-03-15 2008-03-14 Biomarkers specific for blood cell lineage or specific for osteoclast differentiation Active JP5451376B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009505187A JP5451376B2 (en) 2007-03-15 2008-03-14 Biomarkers specific for blood cell lineage or specific for osteoclast differentiation

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007066434 2007-03-15
JP2007066434 2007-03-15
PCT/JP2008/054706 WO2008114709A1 (en) 2007-03-15 2008-03-14 Biomarker specific to blood cell or specific to osteoclast differentiation
JP2009505187A JP5451376B2 (en) 2007-03-15 2008-03-14 Biomarkers specific for blood cell lineage or specific for osteoclast differentiation

Publications (2)

Publication Number Publication Date
JPWO2008114709A1 true JPWO2008114709A1 (en) 2010-07-01
JP5451376B2 JP5451376B2 (en) 2014-03-26

Family

ID=39765817

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009505187A Active JP5451376B2 (en) 2007-03-15 2008-03-14 Biomarkers specific for blood cell lineage or specific for osteoclast differentiation

Country Status (2)

Country Link
JP (1) JP5451376B2 (en)
WO (1) WO2008114709A1 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1294927B1 (en) * 2000-06-09 2005-11-16 Boehringer Ingelheim International GmbH Screening-method for modulators of methyltransferase-dependent chromosome stability
CA2421155A1 (en) * 2000-09-05 2002-03-14 The Rockefeller University Osteoclast-associated receptor
JP2004298093A (en) * 2003-03-31 2004-10-28 Amusaito:Kk Transgenic cyprinodont
EP1678326A2 (en) * 2003-10-22 2006-07-12 Novartis AG Genes involved in neurodegenerative disorders
EP1831370A4 (en) * 2004-12-13 2009-08-12 Alethia Biotherapeutics Inc Polynucleotides and polypeptide sequences involved in the process of bone remodeling
JP5422203B2 (en) * 2005-04-19 2014-02-19 キングス カレッジ ロンドン use

Also Published As

Publication number Publication date
JP5451376B2 (en) 2014-03-26
WO2008114709A1 (en) 2008-09-25

Similar Documents

Publication Publication Date Title
US20160282354A1 (en) Compositions and methods for selecting a treatment for b-cell neoplasias
EP1352961B1 (en) Synovial cell protein
KR20160018525A (en) Methods and compositions for reducing immunosupression by tumor cells
CN104470531A (en) Prophylactic or therapeutic agent for hepatic diseases
JP2006246823A (en) Use of fgf21 as hematopoietic factor
US8741868B2 (en) Pharmaceutical composition including an HIF-2 alpha inhibitor as an active ingredient for preventing or treating arthritis
CA2487427A1 (en) Methods and compositions for treating neoplasia relating to hnrnp a1 and a2 nucleic acid molecules
JP5378202B2 (en) Biomarkers specific to the brain and nerves or specific to neural differentiation
JPWO2007018316A1 (en) Cancer preventive / therapeutic agent
JPWO2006129881A1 (en) Bone and joint disease prophylactic / therapeutic agent and screening method thereof
JP5451376B2 (en) Biomarkers specific for blood cell lineage or specific for osteoclast differentiation
US8309687B2 (en) Biomarker specific for cancer
WO2011093647A2 (en) Genes implicated in osteoarthritis and use thereof
KR20080056185A (en) Conserved membrane activator of calcineurin (cmac), a novel therapeutic protein and target
JP6653120B2 (en) Anti-inflammatory drugs based on IKAROS inhibition
US8642549B2 (en) OCL-2A3 compositions and uses thereof
EP2214013A1 (en) Methods of treating bone disorders
US20070099252A1 (en) Diagnostic application of mail
JP4382861B2 (en) Novel gene involved in neuralization induction, protein thereof, and method of use thereof
KR20220088882A (en) HLA Class I Molecules and Additional Medical Implications in In Vitro Fertilization
JP2006166703A (en) Cartilage differentiation regulating gene
CA2494575A1 (en) Compositions and methods for the treatment of osteoporosis
JP2006298848A (en) Regulant for differentiation or proliferation of lymphocyte and method for screening the same
JP2010208954A (en) T cell receptor function regulator and method for screening the same
JP2006166704A (en) Cartilage differentiation inhibitory gene

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130402

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130625

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131001

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131226

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S801 Written request for registration of abandonment of right

Free format text: JAPANESE INTERMEDIATE CODE: R311801

ABAN Cancellation due to abandonment
R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350