KR20160002819A

KR20160002819A - 단백질의 제조 방법

Info

Publication number: KR20160002819A
Application number: KR1020157030530A
Authority: KR
Inventors: 도모노리 우에노; 유키 다가; 기요코 고토; 유코 가쿠
Original assignee: 가부시키가이샤 닛피
Priority date: 2013-03-26
Filing date: 2014-03-26
Publication date: 2016-01-08
Also published as: AU2014245132B2; US10442843B2; US9884897B2; US20180118796A1; US20160075747A1; AU2014245132A1; IL241779A0; SG11201507948UA; EP2990476B1; EP2990476A1; IL241779A; AU2014245132A2; WO2014157429A1; JP5848853B2; KR101791770B1; CA2908156A1; EP3981877A1; EP2990476A4; CN105358682A; CN105358682B

Abstract

고효율의 단백질 합성에는 mRNA 에 다수의 리보솜이 부착된 폴리솜 형성의 촉진이 매우 효과적이라고 생각되고 있었지만, p180 단백질의 폴리솜 형성의 촉진 기능의 기구는 분명하지 않았다.
본 출원의 발명자들은, p180 단백질의 폴리솜 형성 촉진 기능의 책임 영역인 coiled-coil 도메인과 특이적으로 상호작용하는 단백질, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질로서의 SF3b4 단백질을 새롭게 찾아내고, 그리고 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질 (예를 들어, SF3b4 단백질) 과 p180 단백질의 양방을 고발현하는 세포에 있어서, mRNA 의 소포체 상에의 국재화가 현저하게 상승해, 배양 세포의 분비 기능을 상승시키는 것이 가능해지는 것을 밝혀냈다. 또, 발현 플라스미드 중에도 특정 뉴클레오티드 배열을 삽입함으로써, 단백질 발현 증강 효과가 있는 SF3b4 단백질을 소포체막 상에 국재화, 및 폴리솜 중 mRNA 를 중량화 시프트시키는 것이 가능해지고, 이것을 통하여 세포의 분비능을 증강 가능한 것이 나타났다.

Description

단백질의 제조 방법{METHOD FOR PRODUCING PROTEIN}

본 출원은, 재조합 세포에 있어서의 외래성 유전자로부터의 단백질의 발현을 항진하기 위한, 재조합 세포, 그리고 그와 같은 세포를 이용한 발명에 관한 것이다. 보다 구체적으로는, p180 단백질의 발현, 및/또는 SF3b4 단백질의 발현이 모두 항진된 세포, 또는 그와 같은 특징을 갖는 세포를 이용한, 목적물로서의 단백질의 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조하는 방법을 제공하는 것에 관한 것이다. 상기 특징을 갖는 세포를 이용한, 목적물로서의 단백질의 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조하는 방법에 있어서는, 목적물인 단백질 발현을 위한 벡터 중에서 cis-엘리먼트를 이용하는 것도 또, 특징으로 한다.

유전자 재조합 기술을 응용한 바이오 테크놀러지 의약품은, 최근, 특히 항체 의약품 시장이 급속히 확대되는 가운데, 그 의료비에 대한 부하도 위구되도록 되어 있어, 종래보다 효율적으로 단백질 생산을 실시할 수 있고, 그리고 비용이 보다 낮은 바이오 테크놀러지 의약품의 제조 기술의 개발이 항상 요구되고 있다.

유전자 재조합 기술을 이용한 단백질 생산을 위한 숙주로는, 지금까지, 동물 세포, 효모, 대장균 등이 이용되고 있다. 대장균 등은, 목적물로서의 단백질을 저비용으로 생산할 수 있지만, 당사슬 수식 등의 번역 후 수식을 실시할 수 없어, 당단백질의 생산에는 적합하지 않다. 또, 대장균에서는 생산한 단백질을 포함하는 봉입체를 만들기 쉬운 성질이 있어, 목적물로서의 단백질의 취득에는, 합성 후에 추가로 가용화 프로세스가 필요해져, 작업 부하가 높다는 결점이 존재한다.

특히, 항체 등의 당단백질의 경우, 부가된 당사슬이, 목적물로서의 단백질의 수용성, 프로테아제에 대한 저항성, 조직 표적성, 나아가서는 그 생물 활성에도 영향을 주기 때문에, 고등 진핵생물인 동물 세포를 사용한 생산 기술이 필요로 되고, 최근 그 기술은 크게 진보하였다. 그러한 상황 아래, 현재의 항체 의약품의 상당수는 Chinese Hamster Ovary (CHO) 세포로 생산되고 있지만, 그 제조 프로세스의 최적화는 여전히 중요한 과제이다.

포유 동물 세포를 포함하는 진핵생물 세포로부터 세포 밖으로 분비되는 단백질은, 내막으로 구획된 세포 내 소기관인 소포체에 있어서 합성된다. 소포체는, RNA-단백질의 거대 복합체로 이루어지는 단백질 합성 장치인 리보솜을 표면에 갖는 조면 소포체와, 리보솜이 없는 활면 소포체의 2 종으로 크게 구별되지만, 조면 소포체의 자세한 형성 기구는 분명하지 않다.

생체 내에는, 특정 단백질의 분비에 전문적으로 종사하는 분비 전문 세포 (professional secretory cells) 가 존재하고, 그들 세포에 있어서는 조면 소포체가 현저하게 발달하여 있어, 고효율의 단백질 생산을 가능하게 하고 있다고 생각된다. 예로는 콜라겐을 분비하는 선유아세포, 소화 효소군을 분비하는 췌장선방외분비세포 등이, 그러한 분비 전문 세포에 해당한다. 이들 분비 전문 세포와 비교해, 현재 유전자 공학적 단백질 생산에 많이 이용되고 있는 CHO 세포, HEK293 세포 등의 조면 소포체는 매우 소량이고, 분비 활성이 낮다는 문제가 있다.

유전자 재조합 기술을 이용하여 바이오 테크놀러지 의약품을 생산할 때에는, 목적물인 단백질의 유전자는 발현 벡터 중에서 높은 전사 활성을 나타내는 프로모터의 제어화에 있고, 그 mRNA 는 고레벨로 발현하고 있다고 예상된다. 그러나, 그러한 상황하에 있어서도, mRNA 레벨과 단백질 발현량 그 자체가 상관하지 않는 경우도 자주 있고, 그 일요인으로서 소포체막 상에서의 번역 효율이 낮은 것을 들 수 있다.

즉, 현재 이들 유전자 공학적 단백질 생산에 많이 이용되고 있는 세포에 있어서도, mRNA 를 소포체막 상에서의 번역 장치에 대해 이용하기 쉬운 형태로 제공할 수 있으면, 선유아세포의 경우와 마찬가지로, 단백질 합성능을 한층 증강시킬 수 있는 여지가 남아 있다고 생각되는 것을 의미하고 있다.

콜라겐을 항상적으로 분비하고 있는 선유아세포에서는, 콜라겐 단백질을 코드하는 mRNA 는 항상 고레벨로 발현하고 있고, 그 대부분이 분비 단백질의 생합성의 장인 소포체막 상에서 검출되는 것이 알려져 있다 (비특허문헌 1). 그러나, 콜라겐 합성을 활성화시키기 위해서는 그 mRNA 가 소포체 상에 존재하는 것만으로는 불충분하여, 번역 효율이 높은 폴리솜을 형성시키는 것이 필요하게 된다.

발명자들의 지금까지의 해석에 의해, 콜라겐 유전자 등의 일부 단백질의 mRNA 에는, 단백질 합성 장치인 리보솜이 복수 부착된 폴리솜이 형성되기 쉬운 성질을 구비하는 것이 밝혀져 있다 (특허문헌 1, 비특허문헌 2). 이들로부터, 유전자 재조합 기술을 이용하여 바이오 테크놀러지 의약품을 생산할 때에, 목적 단백질을 코드하는 유전자 전사 산물이 고레벨로 발현하고 있는 것에 관계없이, 그 단백질 합성/분비량이 낮은 문제가 생기는 것은, 이용되고 있는 세포에 있어서 mRNA 가 소포체막 상에서의 번역 장치에 이용하기 쉬운 형태로 제공되고 있지 않을 가능성이 추측되었다.

일본 특허출원 2011-227462

Ueno, T., et al., (2010). J Biol Chem 285(39), 29941-50. Ueno, T., et al., (2012). Regulation of polysome assembly on the endoplasmic reticulum by a coiled-coil protein, p180. Nucleic Acids Res.

소포체에 있어서의 단백질 합성에 있어서 소포체에의 mRNA 의 국재화 (폴리솜 형성) 가 필수이다. 또한 고효율의 단백질 합성에는 mRNA 에 다수의 리보솜이 부착된 폴리솜 형성의 촉진이 매우 효과적이라고 생각되고 있었지만, p180 단백질의 폴리솜 형성의 촉진 기능의 기구는 분명하지 않았다.

본 출원의 발명자들은, 상세한 해석을 진행한 결과, p180 단백질의 폴리솜 형성 촉진 기능의 책임 영역인 coiled-coil 도메인 (비특허문헌 2) 과 특이적으로 상호작용해, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질을 새롭게 찾아냈다. 그리고, SF3b4 단백질과 p180 단백질의 양방을 고발현하는 세포를 작출한 바, 그와 같은 특징을 갖는 세포에 있어서, mRNA 의 소포체 상에의 국재화가 현저하게 상승해, 배양 세포의 분비 기능을 상승시키는 것이 가능해지는 것을 밝혔다. 그 결과, 본원 발명을 완성하기에 이르렀다.

본 발명의 발명자들은, 세포에 있어서, p180 단백질의 전체 길이 또는 그 부분의 발현, 그리고 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현이 항진된, 세포 내에서의 목적물로서의 단백질의 합성능 또는 분비능이 항진된 재조합 세포를 제공할 수 있는 것을 나타냈다.

본 발명의 발명자들은 또, 본 발명의 제 2 양태에 있어서, p180 단백질의 전체 길이 또는 그 부분의 발현을 항진시키고, 그리고 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현을 항진시킨 재조합 세포에 있어서, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시킴으로써, 목적물로서의 단백질의 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조하는 방법을 제공할 수 있는 것을 나타냈다.

본 발명에 있어서는, 이와 같은 특징적인 재조합 세포를 제공하거나, 혹은 그러한 특징적인 재조합 세포를 이용하여, 목적물로서의 단백질의 합성능 또는 분비능을 항진시킴으로써, 상기 서술한 과제를 해결할 수 있는 것을 나타냈다.

[1] 세포에 있어서, p180 단백질의 전체 길이 또는 그 부분의 발현, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현, 또는 이들 양방의 발현이 모두 항진된, 세포 내에서의 목적물로서의 단백질의 합성능 또는 분비능이 항진된 재조합 세포.

[2] p180 단백질이,

(a) 인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 과 적어도 70 ％ 의 배열 동일성을 갖는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,

(b) 인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 에 있어서, 1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가된 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,

(c) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 적어도 70 ％ 의 배열 동일성을 갖는 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,

(d) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질, 및

(e) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 상보적인 뉴클레오티드 배열과, 스트린젠트한 조건하에서 하이브리다이즈 가능한 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질

로 이루어지는 군에서 선택되는, [1] 에 기재된 재조합 세포.

[3] p180 단백질이 포유 동물 유래의 것인, [1] 또는 [2] 에 기재된 재조합 세포.

[4] 포유 동물의 p180 단백질의 전체 길이 또는 그 부분이, 인간 p180 단백질 (SEQ ID NO : 2), 마우스 p180 단백질 (GenBank Accession No. NP_077243), 래트 p180 단백질 (GenBank Accession No. XP_230637), 차이니즈 햄스터 p180 단백질 (GenBank Accession No. XM_003496471), 개 p180 단백질 (GenBank Accession No. NP_001003179), 말 p180 단백질 (GenBank Accession No. XP_001915027), 원숭이 p180 단백질 (GenBank Accession No. XP_002798281), 침팬지 p180 단백질 (GenBank Accession No. XP_514527), 돼지 p180 단백질 (GenBank Accession No. XP_001926148), 또는 그들의 부분인, [3] 에 기재된 재조합 세포.

[5] p180 단백질의 부분이, SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 623 ∼ 737 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 738 ∼ 944 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 945 ∼ 1540 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분에서 선택되는, [1] ∼ [4] 중 어느 한 항에 기재된 재조합 세포.

[6] mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질이, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분 (SEQ ID NO : 4 의 전체 길이 아미노산 배열 424 AA ; RRM1 인 SEQ ID NO : 4 의 13 ∼ 91 AA ; .RRM2 인 SEQ ID NO : 4 의 100 으로 이루어지는 군에서 선택되는, [1] ∼ [5] 중 어느 한 항에 기재된 재조합 세포.

[7] SF3b4 단백질이,

(i) 인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 과 적어도 70 ％ 의 배열 동일성을 갖는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,

(ii) 인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 에 있어서, 1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가된 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,

(iii) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 적어도 70 ％ 의 배열 동일성을 갖는 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,

(iv) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,

(v) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 상보적인 뉴클레오티드 배열과, 스트린젠트한 조건하에서 하이브리다이즈 가능한 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질

로 이루어지는 군에서 선택되는, [6] 에 기재된 재조합 세포.

[8] SF3b4 단백질이 포유 동물 유래의 것인, [6] 또는 [7] 에 기재된 재조합 세포.

[9] 포유 동물의 SF3b4 단백질의 전체 길이 또는 그 부분이, 인간 SF3b4 단백질 (SEQ ID NO : 4), 마우스 SF3b4 단백질 (GenBank Accession No. NP_694693.1), 래트 SF3b4 단백질 (GenBank Accession No. NP_001011951.1), 차이니즈 햄스터 SF3b4 단백질 (GenBank Accession No. XP_003498680.1), 개 SF3b4 단백질 (GenBank Accession No. XP_540295.3), 말 SF3b4 단백질 (GenBank Accession No. XP_001488649.2), 원숭이 SF3b4 단백질 (GenBank Accession No. NP_001097793.1), 침팬지 SF3b4 단백질 (GenBank Accession No. XP_513768.2), 돼지 SF3b4 단백질 (GenBank Accession No. XP_001926524.1), 또는 그들의 부분인, [8] 에 기재된 재조합 세포.

[10] 목적물로서의 단백질의 합성능 또는 분비능이, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시킴으로써 항진된, [1] ∼ [9] 중 어느 한 항에 기재된 재조합 세포.

[11] 수탁 번호 NITE BP-01753 (CHO 3D5), 수탁 번호 NITE BP-1535 (CHO YA7), 또는 수령 번호 NITE ABP-01811 (CHO 1B2) 에 의해 나타내는, 세포주.

[12] p180 단백질의 전체 길이 또는 그 부분의 발현을 항진시키고, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현을 항진시키고, 또는 이들 단백질 양방의 발현을 항진시킨 재조합 세포에 있어서, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시키는 것에 의한, 목적물로서의 단백질을 제조하는 방법.

[13] p180 단백질이 포유 동물 유래의 것인, [12] 에 기재된 방법.

[14] 포유 동물의 p180 단백질의 전체 길이 또는 그 부분이, 인간 p180 단백질 (SEQ ID NO : 2), 마우스 p180 단백질 (GenBank Accession No. NP_077243), 래트 p180 단백질 (GenBank Accession No. XP_230637), 차이니즈 햄스터 p180 단백질 (GenBank Accession No. XM_003496471), 개 p180 단백질 (GenBank Accession No. NP_001003179), 말 p180 단백질 (GenBank Accession No. XP_001915027), 원숭이 p180 단백질 (GenBank Accession No. XP_002798281), 침팬지 p180 단백질 (GenBank Accession No. XP_514527), 돼지 p180 단백질 (GenBank Accession No. XP_001926148), 또는 그들의 부분인, [13] 에 기재된 방법.

[15] 포유 동물의 p180 단백질의 부분이, SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역을 포함하는 부분, 623 ∼ 737 번 아미노산으로 이루어지는 영역을 포함하는 부분, 738 ∼ 944 번 아미노산으로 이루어지는 영역을 포함하는 부분, 945 ∼ 1540 번 아미노산으로 이루어지는 영역을 포함하는 부분에서 선택되는, [13] 또는 [14] 에 기재된 방법.

[16] mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질이, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분 (SEQ ID NO : 4 의 전체 길이 아미노산 배열 424 AA ; RRM1 인 SEQ ID NO : 4 의 13 ∼ 91 AA ; .RRM2 인 SEQ ID NO : 4 의 100 으로 이루어지는 군에서 선택되는, [12] ∼ [15] 중 어느 한 항에 기재된 방법.

[17] SF3b4 단백질이 포유 동물 유래의 것인, [16] 에 기재된 방법.

[18] 포유 동물의 SF3b4 단백질의 전체 길이 또는 그 부분이, 인간 SF3b4 단백질 (SEQ ID NO : 4), 마우스 SF3b4 단백질 (GenBank Accession No. NP_694693.1), 래트 SF3b4 단백질 (GenBank Accession No. NP_001011951.1), 차이니즈 햄스터 SF3b4 단백질 (GenBank Accession No. XP_003498680.1), 개 SF3b4 단백질 (GenBank Accession No. XP_540295.3), 말 SF3b4 단백질 (GenBank Accession No. XP_001488649.2), 원숭이 SF3b4 단백질 (GenBank Accession No. NP_001097793.1), 침팬지 SF3b4 단백질 (GenBank Accession No. XP_513768.2), 돼지 SF3b4 단백질 (GenBank Accession No. XP_001926524.1), 또는 그들의 부분인, [17] 에 기재된 방법.

[19] 재조합 세포가, 수탁 번호 NITE BP-01753 (CHO 3D5), 수탁 번호 NITE BP-1535 (CHO YA7), 또는 수령 번호 NITE ABP-01811 (CHO 1B2) 에 의해 나타내는 세포주인, [12] ∼ [18] 중 어느 한 항에 기재된 방법.

[20] 목적물로서의 단백질이, 당단백질인, [12] ∼ [19] 중 어느 한 항에 기재된 방법.

[21] 목적물로서의 단백질이, 콜라겐, 피브로넥틴 또는 항체인, [20] 에 기재된 방법.

[22] 목적물로서의 단백질을 발현하기 위한 발현 유닛 중, 프로모터의 하류이고 또한 목적물로서의 단백질을 코드하는 DNA 의 뉴클레오티드 배열의 개시 코돈의 상류에, RNA 결합 단백질이 인식/결합 (혹은 상호작용) 하는 cis-엘리먼트를 삽입함으로써, 발현계 세포 내에 있어서의 목적물로서의 단백질의 발현량을 증대시키는 방법.

[23] cis-엘리먼트가, RNA 인식 모티프 (RRM) 형 RNA 결합 단백질이 인식/결합 (혹은 상호작용) 하는 것인, [22] 에 기재된 방법.

[24] cis-엘리먼트가, SF3b4 단백질의 RNA 인식 모티프 (RRM) 가 인식/결합 (혹은 상호작용) 하는 것인, [23] 에 기재된 방법.

[25] cis-엘리먼트의 뉴클레오티드 배열이, 1 또는 몇 개의 9 mer ∼ 12 mer 의 배열 모티프 GAN₁-(X)_n-ACN₂ (n = 3 ∼ 6) (N₁ 및 N₂ 는 독립적으로 A, T, C, G 중 어느 뉴클레오티드여도 된다) 를 포함하는 것인, [22] ∼ [24] 중 어느 하나에 기재된 방법.

[26] cis-엘리먼트의 뉴클레오티드 배열이, 1 또는 몇 개의 9 mer ∼ 12 mer 의 배열 모티프 (GAG-(X)_n-ACV (n = 3 ∼ 6) (V 는 A 또는 G 또는 C 를 나타낸다), SEQ ID NO : 17 ∼ 20) 를 포함하는 것인, [25] 에 기재된 방법.

[27] cis-엘리먼트의 뉴클레오티드 배열이, 타입 I 콜라겐 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 피브로넥틴 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 매트릭스 메탈로프로테아제 14 (MMP14) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A2 (P4HA2) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A1 (P4HA1) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열로 이루어지는 군에서 선택되는 배열인, [22] ∼ [26] 중 어느 한 항에 기재된 방법.

[28] cis-엘리먼트의 뉴클레오티드 배열이, SEQ ID NO : 5 의 전체 길이 또는 SEQ ID NO : 7 의 전체 길이 외, SEQ ID NO : 5 중 1 ∼ 102 번 뉴클레오티드, 1 ∼ 78 번 뉴클레오티드, 1 ∼ 60 번 뉴클레오티드, 61 ∼ 126 번 뉴클레오티드, 16 ∼ 57 번 뉴클레오티드, 79 ∼ 126 번 뉴클레오티드, 103 ∼ 126 번 뉴클레오티드, 58 ∼ 78 번 뉴클레오티드, 51 ∼ 78 번 뉴클레오티드, 1 ∼ 27 번 뉴클레오티드, 70 ∼ 78 번 뉴클레오티드로 이루어지는 군에서 선택되는 어느 배열인 [22] ∼ [27] 중 어느 한 항에 기재된 방법.

[29] 발현계 세포가, 손상되지 않은 숙주 세포, p180 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, SF3b4 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, 또는 이들 양방의 발현이 모두 항진된 세포인, [22] ∼ [28] 중 어느 한 항에 기재된 방법.

[30] SF3b4 를 기능 저해 또는 발현 억제함으로써, 콜라겐 합성을 억제해, 이상 콜라겐에 의한 폐포 상피, 섬유증의 중증화를 방지하기 위한 의약 조성물.

p180 단백질의 전체 길이 또는 그 부분의 발현, 및/또는 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질 (예를 들어, SF3b4 단백질의 전체 길이 또는 그 부분) 의 발현이 항진된 본 발명의 재조합 세포를 이용하여, 목적물로서의 단백질을 코드하는 DNA 를 형질 전환하면, 목적물로서의 단백질의 합성능 또는 분비능이, 비약적으로 증가하고, 목적물로서의 단백질을 효율적으로 제조하는 것이 밝혀졌다. 또한, cis-엘리먼트를 발현 유닛 내에 부가하면, 단백질 발현 증강 효과가 있는 SF3b4 단백질을 소포체막 상에 국재화, 및 폴리솜 중 mRNA 를 중량화 시프트시키는 것이 가능해지고, 이것을 통하여 세포의 분비능을 증강 가능한 것이 나타났다.

도 1 은, 실시예 1 에 있어서 조제한 각 세포 (CHO 세포, CHO 3D5 세포, CHO 5g 세포, 그리고 CHO YA7 세포) 에 관해서, 세포 내에 있어서의 p180 단백질의 발현과 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질인 SF3b4 단백질의 발현을 웨스턴 블롯에 의해 조사한 결과를 나타내는 도면이다.
도 2 는, 실시예 1 에 있어서 조제한 각 세포에 대해, 분비 마커인 인간 태반 유래 분비형 알칼리 포스파타아제 (SEAP) 의 발현 플라스미드를 외래성으로 도입한 경우의, SEAP 단백질의 발현 결과를 비교해 나타낸 도면이다.
도 3 은, 실시예 1 에 있어서 조제한 각 세포에 대해, 분비 마커인 인간 태반 유래 분비형 알칼리 포스파타아제 (SEAP) 의 발현 플라스미드를 외래성으로 도입한 경우의, SEAP mRNA 의 막 획분에의 국재화의 정도를 비교해 나타낸 도면이다.
도 4 는, cis-엘리먼트를 포함하는 발현 벡터의 인서트 부분의 개략도 (A) 그리고 cis-엘리먼트의 분비 활성화능을 평가한 결과 (B 및 C) 를 나타내는 도면이다.
도 5 는, 콜라겐을 발현시킨 경우의 단백질의 분비 활성의 변화를 나타내는 도면이다.
도 6 은, cis-엘리먼트를 삽입함으로써, 항체의 분비 활성화가 생기는 것을 나타내는 도면이다.
도 7 은, kozak 배열과 cis-엘리먼트 #1 의 분비 활성화에 대한 효과를 CHO 세포 및 CHO YA7 세포를 이용하여 비교한 도면이다.
도 8 은, cis-엘리먼트 #1, cis-엘리먼트 #2, cis-엘리먼트 #3, 및 cis-엘리먼트 #4 를 사용하여, cis-엘리먼트의 구조와 단백질 발현 증강 작용의 관련성을 나타낸 도면이다.
도 9 는, cis-엘리먼트 내의 모티프의 일례가, GAG-(X)_n-ACN₂ (n = 3 ∼ 6) 인 것 (A), 및 각 엘리먼트의 SEAP 분비 활성을 평가하는 도면인 것 (B) 을 나타내는 도면이다.
도 10 은, 모티프 GAN₁-(X)_n-ACN₂ 의 뉴클레오티드에 있어서의, 치환, 결실, 삽입에 의한, 그 모티프의 활성에의 영향을 조사한 도면이다.
도 11 은, SF3b4 의 발현 억제에 수반해 콜라겐의 산생이 현저하게 억제되는 것을 나타내는 도면이다.
도 12 는, cis-엘리먼트를 포함하지 않는 경우와 비교해, cis-엘리먼트를 포함하는 경우에, 폴리솜 획분 중의 COL1A1 cDNA 의 중량이 고밀도측으로 시프트하는 것을 나타내는 도면이다.

본 발명의 발명자들은, 본 발명의 제 1 양태에 있어서, 세포에 있어서, p180 단백질의 전체 길이 또는 그 부분의 발현 및/또는 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분의 발현이 모두 항진된, 세포 내에서의 목적물로서의 단백질의 합성능 또는 분비능이 항진된 재조합 세포를 제공할 수 있는 것을 나타냈다.

본 발명의 이 양태에 있어서, p180 단백질의 전체 길이 또는 부분 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분을 양방 모두 세포 중에서 발현시킴으로써, 그 세포 내의 소포체막 상에서의 목적물로서의 단백질을 코드하는 핵산 분자의 발현 산물인 mRNA 가 관여하는 폴리솜 형성을 촉진할 수 있다. 여기서, 폴리솜은, 세포 내의 소포체막 상에 존재하는 복수의 리보솜에 대해, 1 분자의 mRNA 가 결합한 것을 말한다. 이와 같은 폴리솜 형성 촉진의 결과로서, 목적물로서의 단백질의 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조할 수 있다.

본 발명의 상기 서술한 재조합 세포는, 세포에 있어서, p180 단백질, 특히 포유 동물의 p180 단백질의 전체 길이 또는 그 부분의 발현이 항진되어 있는 것을 제 1 특징으로 하고 있다. p180 단백질이란, 필수의 소포체막 단백질이고, 그리고 분비 조직 중에서 많이 발현되고 있고, 폴리솜 형성을 촉진할 수 있는 단백질이다.

여기서, p180 단백질의 아미노산 배열을, 인간의 p180 단백질 (GenBank Accession No. AB287347) 과 비교한 경우, 마우스의 p180 단백질은 87 ％ 의 유사성, 래트의 p180 단백질은 87 ％ 의 유사성, 차이니즈 햄스터의 p180 단백질은 88 ％ 의 유사성, 개의 p180 단백질은 91 ％ 의 유사성, 말의 p180 단백질은 89 ％ 의 유사성, 원숭이의 p180 단백질은 91 ∼ 92 ％ 의 유사성, 침팬지의 p180 단백질은 98 ％ 의 유사성, 돼지의 p180 단백질은 86 ％ 의 유사성을, 각각 갖는 것이 알려져 있고, 포유 동물의 p180 단백질은 모두, 아미노산 유사성으로 84 ％ 이상의 범위 내에, 그 이외의 생물의 p180 단백질로까지 범위를 넓혀도 아미노산 유사성으로 76 ％ 이상의 범위 내에, 포함되는 것이 보고되어 있다.

[표 1-1]

[표 1-2]

따라서, 본 발명에 있어서 「p180 단백질」이라고 하는 경우,

(d) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,

을 말한다.

이 양태의 (a) 에 있어서, 아미노산 배열 동일성에 관해서, 「인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 과 적어도 70 ％ 의 배열 동일성을 갖는다」라고 하는 경우, 배열 동일성의 ％ 값은, 70 ％ ∼ 100 ％ 사이의 어느 값을 선택해도 되고, 예를 들어 70 ％, 71 ％, 72 ％, 73 ％, 74 ％, 75 ％, 76 ％, 77 ％, 78 ％, 79 ％, 80 ％, 81 ％, 82 ％, 83 ％, 84 ％, 85 ％, 86 ％, 87 ％, 88 ％, 89 ％, 90 ％, 91 ％, 92 ％, 93 ％, 94 ％, 95 ％, 96 ％, 97 ％, 98 ％, 99 ％, 100 ％ 등의 배열 동일성의 ％ 값을 선택할 수 있다.

이 양태의 (b) 에 있어서, 「1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가」라고 하는 경우, 결실, 치환, 또는 부가되는 아미노산수는 1 ∼ 10 개 정도까지인 것을 의미하고, 1 개, 2 개, 3 개, 4 개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개의 아미노산의 수를 선택할 수 있다.

이 양태의 (c) 에 있어서, 「인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 적어도 70 ％ 의 배열 동일성을 갖는다」라고 하는 경우, 배열 동일성의 ％ 값은, 70 ％ ∼ 100 ％ 사이의 어느 값을 선택해도 되고, 예를 들어 70 ％, 71 ％, 72 ％, 73 ％, 74 ％, 75 ％, 76 ％, 77 ％, 78 ％, 79 ％, 80 ％, 81 ％, 82 ％, 83 ％, 84 ％, 85 ％, 86 ％, 87 ％, 88 ％, 89 ％, 90 ％, 91 ％, 92 ％, 93 ％, 94 ％, 95 ％, 96 ％, 97 ％, 98 ％, 99 ％, 100 ％ 등의 배열 동일성의 ％ 값을 선택할 수 있다.

이 양태의 (d) 에 있어서, 「1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가」라고 하는 경우, 결실, 치환, 또는 부가되는 뉴클레오티드수는 1 ∼ 10 개 정도까지인 것을 의미하고, 1 개, 2 개, 3 개, 4 개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개의 아미노산의 수를 선택할 수 있다. 또한, 이와 같은 「1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가」됨으로써, 종지 코돈이 도입되지 않고, 목적으로 하는 기능을 갖는 단백질을 규정할 수 있는 것은 전제이다.

이 양태의 (e) 에 있어서, 「스트린젠트한 조건하」라고 하는 경우, 예를 들어 유전자의 뉴클레오티드 배열의 길이에 근거해, 일반적인 기술을 가진 당업자에 의해, 용이하게 결정할 수 있다. 기본적인 조건은, 예를 들어 Current Protocols in Molecular Biology Vol.1 (John Wiley and Sons, Inc.) 이나 Molecular Cloning 2nd edition (Sambrook et al. (1989)) 에 기재되어 있는 바와 같이, 5×SSC, 5×Denhardt's solution, 1 ％ SDS, 25 ℃ 내지 68 ℃ 에서, 수시간 내지 하룻밤 등의 하이브리다이제이션 조건을 들 수 있다. 이 경우, 하이브리다이제이션의 온도로는, 보다 바람직하게는 45 ℃ 내지 68 ℃ (포름아미드 없음) 또는 30 ℃ 내지 42 ℃ (50 ％ 포름아미드) 를 들 수 있다. 세정의 조건으로는, 예를 들어 0.2×SSC 에서 45 ℃ 내지 68 ℃ 를 들 수 있다. 포름아미드 농도, 염 농도 및 온도 등의 하이브리다이제이션 조건을 적절히 설정함으로써, 어느 일정 동일성 이상의 동일성을 갖는 뉴클레오티드 배열을 포함하는 핵산 분자를 클로닝할 수 있는 것은 당업자에게 주지이고, 이와 같이 하여 클로닝된 핵산 분자는 모두 본 발명의 범위 중에 포함된다.

인간 p180 단백질의 전체 길이는, SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질이고 (GenBank Accession No. AB287347), 이 단백질은, SEQ ID NO : 1 에 나타내는 뉴클레오티드 배열에 의해 코드된다 (GenBank Accession No. AB287347). 이 외, 상기 서술한 마우스의 p180 단백질은, GenBank Accession No. NP_077243 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 래트의 p180 단백질은, GenBank Accession No. XP_230637 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 차이니즈 햄스터의 p180 단백질은, GenBank Accession No. XM_003496471 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 개의 p180 단백질은, GenBank Accession No. NP_001003179 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 말의 p180 단백질은, GenBank Accession No. XP_001915027 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 원숭이의 p180 단백질은, GenBank Accession No. XP_002798281 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 침팬지의 p180 단백질은, GenBank Accession No. XP_514527 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 돼지의 p180 단백질은, GenBank Accession No. XP_001926148 에 의해 나타내는 뉴클레오티드 배열에 의해 코드된다.

예를 들어, p180 단백질로서 인간의 p180 단백질을 사용하는 경우, SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역, 623 ∼ 737 번 아미노산으로 이루어지는 영역, 738 ∼ 944 번 아미노산으로 이루어지는 영역, 945 ∼ 1540 번 아미노산으로 이루어지는 영역 중 어느 것을 포함하는 부분을 발현시킴으로써, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진할 수 있다 (특허문헌 1).

따라서, 본 발명에 있어서, 「p180 단백질의 부분」이라고 하는 경우, SEQ ID NO : 2 로 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 623 ∼ 737 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 738 ∼ 944 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 945 ∼ 1540 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분 등의 부분인 것을 의미한다. 이와 같은 부분을 포함하는 것은, 폴리솜 형성을 촉진하는 능력을 나타낼 수 있다. 인간에 관해서, 이와 같이 하여 규정되는 p180 단백질의 부분으로는, 상기 서술한 SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역, 623 ∼ 737 번 아미노산으로 이루어지는 영역, 738 ∼ 944 번 아미노산으로 이루어지는 영역, 945 ∼ 1540 번 아미노산으로 이루어지는 영역을 포함하는 부분, 등을 포함하는 부분 그 자체 외, 인간 p180 단백질의 N 말단막 관통 도메인의 C 말단측에 인접하는 MTB-2 도메인, 또는 리보솜-결합 리피트 도메인을 포함하는 고도로 염기성의 N-말단 영역, 고도로 염기성의 탠덤 리피트 도메인, 또는 미소관 결합 및 다발 형성 도메인 (MTB-1 도메인) 등이 일례로서 포함된다 (특허문헌 1).

전술한 바와 같이, 다른 포유 동물의 p180 단백질의 부분을 사용하는 경우도, 인간의 p180 단백질의 아미노산 배열과 그 밖의 포유 동물의 p180 단백질의 아미노산 배열이, 전체적으로 고도로 보존되고 있는 점에서, 전술한 (a) ∼ (e) 로 나타내는 단백질의 아미노산 배열 중, 대응하는 부분 또는 영역을 포함하는 단편의 아미노산 배열도 또, 「p180 단백질의 부분」으로서 사용할 수 있다.

본 발명의 상기 서술한 재조합 세포는, 세포에 있어서, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현이 항진되고 있는 것을 제 2 특징으로 하고 있다. 이와 같은 mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질로는, SF3b4 단백질, 특히 포유 동물의 SF3b4 단백질의 전체 길이 또는 그 부분 (예를 들어, SEQ ID NO : 4 의 전체 길이 아미노산 배열 424 AA ; RRM1 인 SEQ ID NO : 4 의 13 ∼ 91 AA ; .RRM2 인 SEQ ID NO : 4 의 100 ∼ 179 AA ; .C-말단역인 180 ∼ 424 AA.) 등이 포함된다.

이 중, SF3b4 단백질은, 통상은 핵 내에 있어서만 검출되는 단백질이지만, 콜라겐을 활발하게 분비하고 있는 선유아세포에서는, 그 대부분은 핵 내에서 검출되지만, 추가로 상세하게 검토한 바, 세포질 내의 소포체를 포함하는 막 분획에 SF3b4 단백질이 일부 존재하는 것이 밝혀졌다. SF3b4 단백질 (SAP49/SF3b49 라고도 한다) 은, 그 아미노 말단측에 RNA 인식 모티프 (RRM) 를 2 개 포함하는 것으로부터 RNA 인식 모티프 (RRM) 형의 RNA 결합 단백질 (RBP) 패밀리로 분류되고, 카르복시 말단측에는 기능 미지의 프롤린 리치 도메인을 갖는 물질이다. 정상적인 스플라이싱 반응 과정에는, 이들 2 개의 RNA 인식 모티프 (RRM) (RRM1, RRM2) 의 양자가 모두 필요하고, 이들은 효모에 있어서도 고도로 보존되고, 중요한 기능 도메인이라고 추측되고 있다. 또, SF3b4 단백질은, SF3b 복합체의 다른 구성 단백질인 SAP145 단백질과도 결합하고, 이 결합에도 SF3b4 단백질의 2 개의 RNA 인식 모티프 (RRM) (RRM1, RRM2) 가 양자 모두 필요하다는 것이 나타나 있다 (Champion-Arnaud & Reed, 1994). 즉, SF3b4 단백질의 RRM 도메인은, RNA 인식에 필요할 뿐만 아니라, 단백질-단백질간의 상호작용에도 기능하고 있다고 생각된다.

여기서, SF3b4 단백질의 아미노산 배열을 비교하면, 인간 SF3b4 단백질과 비교한 경우, 포유 동물의 조사된 모든 포유 동물종에 있어서 100 ％ 의 유사성을 나타내고, 그 밖의 종에 있어서도, 효모의 SF3b4 단백질은 40 ∼ 54 ％ 의 유사성, 곤충의 SF3b4 단백질은 63 ∼ 81 ％ 의 유사성을 각각 갖는 것이 알려져 있어, 모든 생물에 있어서 매우 보존적인 단백질인 것이 보고되어 있다.

[표 2-1]

[표 2-2]

이상과 같이, SF3b4 단백질의 1 차 아미노산 배열이 생물종간을 넘어 널리 고도로 보존되고 있는 사실로부터, 인간 SF3b4 단백질을 이용하여 확인된 기능은 다른 생물종 유래의 SF3b4 단백질을 사용한 경우에도 재현되는 것이 용이하게 추측된다.

따라서, 본 발명에 있어서 「SF3b4 단백질」이라고 하는 경우,

을 말한다.

이 양태의 (i) 에 있어서, 아미노산 배열 동일성에 관해서, 「인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 과 적어도 70 ％ 의 배열 동일성을 갖는다」라고 하는 경우, 배열 동일성의 ％ 값은, 70 ％ ∼ 100 ％ 사이의 어느 값을 선택해도 되고, 예를 들어 70 ％, 71 ％, 72 ％, 73 ％, 74 ％, 75 ％, 76 ％, 77 ％, 78 ％, 79 ％, 80 ％, 81 ％, 82 ％, 83 ％, 84 ％, 85 ％, 86 ％, 87 ％, 88 ％, 89 ％, 90 ％, 91 ％, 92 ％, 93 ％, 94 ％, 95 ％, 96 ％, 97 ％, 98 ％, 99 ％, 100 ％ 등의 배열 동일성의 ％ 값을 선택할 수 있다.

이 양태의 (ii) 에 있어서, 「1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가」라고 하는 경우, 결실, 치환, 또는 부가되는 아미노산수는 1 ∼ 10 개 정도까지인 것을 의미하고, 1 개, 2 개, 3 개, 4 개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개의 아미노산의 수를 선택할 수 있다.

이 양태의 (iii) 에 있어서, 「인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 적어도 70 ％ 의 배열 동일성을 갖는다」라고 하는 경우, 배열 동일성의 ％ 값은, 70 ％ ∼ 100 ％ 사이의 어느 값을 선택해도 되고, 예를 들어 70 ％, 71 ％, 72 ％, 73 ％, 74 ％, 75 ％, 76 ％, 77 ％, 78 ％, 79 ％, 80 ％, 81 ％, 82 ％, 83 ％, 84 ％, 85 ％, 86 ％, 87 ％, 88 ％, 89 ％, 90 ％, 91 ％, 92 ％, 93 ％, 94 ％, 95 ％, 96 ％, 97 ％, 98 ％, 99 ％, 100 ％ 등의 배열 동일성의 ％ 값을 선택할 수 있다.

이 양태의 (iv) 에 있어서, 「1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가」라고 하는 경우, 결실, 치환, 또는 부가되는 뉴클레오티드수는 1 ∼ 10 개 정도까지인 것을 의미하고, 1 개, 2 개, 3 개, 4 개, 5 개, 6 개, 7 개, 8 개, 9 개, 10 개의 아미노산의 수를 선택할 수 있다. 또한, 이와 같은 「1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가」됨으로써, 종지 코돈이 도입되지 않고, 목적으로 하는 기능을 갖는 단백질을 규정할 수 있는 것은 전제이다.

이 양태의 (v) 에 있어서, 「스트린젠트 조건하」라고 하는 경우, 그 취할 수 있는 조건에 대해서는, p180 단백질에 관해서 전술한 바와 같다.

인간 SF3b4 단백질의 전체 길이는, SEQ ID NO : 4 에 나타내는 아미노산 배열을 갖는 단백질이고 (GenBank Accession No. NP_005841.1), 이 단백질은, SEQ ID NO : 3 에 나타내는 뉴클레오티드 배열에 의해 코드된다 (GenBank Accession No. NP_005841.1). 이 외, 상기 서술한 마우스의 SF3b4 단백질은, GenBank Accession No. NP_694693.1 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 래트의 SF3b4 단백질은, GenBank Accession No. NP_001011951.1 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 차이니즈 햄스터의 SF3b4 단백질은, GenBank Accession No. XP_003498680.1 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 개의 SF3b4 단백질은, GenBank Accession No. XP_540295.3 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 말의 SF3b4 단백질은, GenBank Accession No. XP_001488649.2 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 원숭이의 SF3b4 단백질은, GenBank Accession No. NP_001097793.1 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 침팬지의 SF3b4 단백질은, GenBank Accession No. XP_513768.2 에 의해 나타내는 뉴클레오티드 배열에 의해 코드되고, 돼지의 SF3b4 단백질은, GenBank Accession No. XP_001926524.1 에 의해 나타내는 뉴클레오티드 배열에 의해 코드된다.

본 발명에 있어서 발현이 요구되는, 목적물로서의 단백질을 코드하는 DNA 를, 단백질 발현계에 있어서 사용되는 세포에 대해 형질 전환하면, 그 DNA 로부터 전사된 mRNA (전구체) 는, 스플라이싱에 의해 아미노산의 유전 정보를 갖지 않는 인트론 부분이 제거되어, 성숙형 mRNA 로 변환된다. 그 과정은 스플라이세오솜이라고 하는 핵 내 저분자 RNA (snRNA)-단백질로 이루어지는 거대 복합체가 담당한다. 스플라이세오솜에는, 5 종의 저분자 리보핵단백질 복합체 (snRNP) 가 존재하고, SF3b4 단백질은 이 중 U2-snRNP 의 구성 성분이고, RNA 결합 도메인을 갖는다.

지금까지, SF3b4 단백질을 포함한 스플라이싱 인자가 단백질의 번역 레벨에서 어떠한 기능을 갖는다는 보고는 없었지만, 발명자들의 해석에 의해, SF3b4 단백질이 세포질 내의 소포체를 포함하는 막 획분에 유의하게 증가하고, 그것과 함께 mRNA 와 결합한 SF3b4 단백질이, p180 단백질의 coiled-coil 도메인과 상호작용함으로써, mRNA 의 소포체에의 국재화를 촉진시키고, 그 결과로서 배양 세포의 분비 기능을 상승시킬 수 있는 것을 밝혀냈다.

즉, 이와 같은 2 개의 단백질 중 어느 것 또는 그들 양방의 발현이 항진된 재조합 세포에 있어서, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하면, 목적물로서의 단백질을 코드하는 DNA 로부터 전사된 mRNA 가 세포 내에 있어서 발현된 SF3b4 단백질과 작용한 결과, 또는 p180 단백질과 상호작용한 결과, 혹은 목적물로서의 단백질을 코드하는 DNA 로부터 전사된 mRNA 가 SF3b4 단백질과 상호작용하고, 이어서 p180 단백질의 coiled-coil 도메인과 SF3b4 단백질이 상호작용한 결과, mRNA 의 소포체에의 국재화를 촉진시키고, 이 세포 내에 있어서 목적물로서의 단백질의 합성능 또는 분비능이 항진되는 것이 밝혀졌다.

여러 가지 조직이 장기간에 걸쳐 상해되어 섬유화되어 버리는 상태인 섬유증은, 모두 원인 및 상세한 발증 기서, 유효한 치료법이 불명이고, 예후 불량의 질환이다. 예를 들어 특발성 폐섬유증은 여러 가지 자극에 의해 생긴 폐포 상피의 상해에 대해, 그 수복을 위한 콜라겐 등이 증가해 이상 수복 반응이 일어나기 때문에 섬유화가 진행된다고 생각되고 있지만, 유효한 치료법은 확립되어 있지 않다. 이와 같은 병태에 있어서, 콜라겐의 이상 증가를 저지하기 위한 단서도 얻어져 있지 않았지만, 본 발명에 있어서 새롭게, 지금까지 스플라이싱 인자로서 기능한다고 생각되고 있던 SF3b4 단백질이, 콜라겐의 합성/분비에 불가결한 역할을 하는 것이 판명되고, SF3b4 를 기능 저해 또는 발현 억제함으로써 콜라겐 합성을 억제 가능한 것이 나타났다. SF3b4 의 발현 억제는 그 특이적 shRNA 등의 투여에 의해, 그 기능 저해는 스플라이싱 과정을 저해하는 각종 약제에 의해 가능하다고 생각되기 때문에, SF3b4 의 기능 저해 또는 발현 억제에 의해 섬유증에 있어서의 이상 콜라겐의 축적을 억제해 섬유증의 중증화를 방지할 수 있는 가능성이 나타났다.

본 발명에 있어서 재조합 세포를 제조하기 위해서 사용할 수 있는 세포는, 단백질 발현에 적절한 세포이면 어떠한 것이어도 되고, 예를 들어 기원이 되는 세포로는, CHO 세포, HEK293 세포, HeLa 세포 등의 포유 동물 유래의 세포를 사용할 수 있다. 이들 세포에 대해, 전술한 p180 단백질의 전체 길이 또는 그 부분 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분을, 당해 기술 분야에 있어서 일반적으로 사용되고 있는 방법을 사용해 트랜스펙트하여, 이들 세포 내에 있어서 p180 단백질의 전체 길이 또는 그 부분 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분을 양방 모두 발현시킬 수 있다.

전술한 p180 단백질의 전체 길이 또는 그 부분 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분을, 이들 세포 내에 있어서 발현시키기 위해서는, 당해 기술 분야에 있어서 일반적으로 사용되고 있는 형질 전환 방법을 사용할 수 있다. 그 형질 전환을 실시하기 위해서는, p180 단백질의 전체 길이 또는 그 부분을 코드하는 DNA 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분을 코드하는 DNA 를 각각, 예를 들어 pcDNA, pEGFP, pCAGGS 등의 발현 벡터 중에 편입시키고, 각각의 발현 벡터를 세포에 대해 형질 전환해 사용할 수 있다.

본 발명에 있어서는, p180 을 안정적으로 발현하는 재조합 세포로서, CHO 세포에서 유래하는 세포주 CHO 5g 세포, SF3b4 단백질을 안정적으로 발현하는 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 재조합 세포로서, CHO 세포에서 유래하는 세포주 CHO 3D5 세포, 그리고 이들 2 개의 단백질의 발현이 동시에 항진된 재조합 세포로서, CHO 세포에서 유래하는 세포, CHO YA7 세포를 제조하고 (후술하는 실시예 1 을 참조), 이들 세포주를 독립행정법인 제품 평가 기술 기반 기구의 특허 미생물 기탁 센터에 기탁하였다 (CHO 3D5 세포에 대해 수탁 번호 NITE BP-01753), CHO YA7 세포에 대해 수탁 번호 NITE BP-1535, 또는 CHO 1B2 세포에 대해서 수령 번호 NITE ABP-01811).

본 발명의 발명자들은 또, p180 단백질의 전체 길이 또는 그 부분의 발현 및/또는 SF3b4 단백질의 전체 길이 또는 그 부분의 발현을 모두 항진시킨 재조합 세포에 있어서, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시킴으로써, 목적물로서의 단백질의 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조하는 방법을 제공할 수 있는 것을 나타냈다.

이 방법에 있어서, 합성능 또는 분비능을 항진하고, 그 결과로서 단백질을 제조하는 목적물로서의 단백질은, 바이오 테크놀러지적 수법에 의해 산생하는 것을 목적으로 한 어느 단백질이어도 된다. 예를 들어, 목적물로서의 단백질로서, 당단백질을 들 수 있고, 그 예로서 항체, 콜라겐, 피브로넥틴, 라미닌 등을 선택할 수 있지만, 이들에는 한정되지 않는다.

본 발명의 발명자들은, 본 발명의 제 2 양태에 있어서, 목적물로서의 단백질을 발현하기 위한 발현 유닛 중, 프로모터의 하류이고 또한 목적물로서의 단백질을 코드하는 DNA 의 뉴클레오티드 배열의 개시 코돈의 상류에, cis-엘리먼트를 삽입함으로써, 발현계 세포 내에 있어서의 목적물로서의 단백질의 발현량을 증대시키는 방법을 제공한다. 상기 서술한 발현 유닛에 cis-엘리먼트의 배열을 삽입한다고 하는 경우, 예를 들어 목적물의 단백질의 발현 플라스미드 내에 있어서 프로모터의 하류이고 또한 목적물로서의 단백질을 코드하는 DNA 의 뉴클레오티드 배열의 개시 코돈의 상류에 cis-엘리먼트 배열을 삽입하는 경우 외에, 이미 세포 내에 프로모터 및 목적물이 유전자 도입되어 있는 경우에 프로모터의 하류이고 또한 목적 유전자의 ORF 개시 코돈의 상류에 cis-엘리먼트 배열을 부위 특이적으로 삽입하는 경우 등도 포함된다.

배경 기술의 항에 있어서도 기재한 바와 같이, 콜라겐 유전자 등의 일부 단백질의 mRNA 에는, 단백질 합성 장치인 리보솜이 복수 부착된 폴리솜이 형성되기 쉬운 성질을 구비하는 것이 분명해져 있다 (특허문헌 1, 비특허문헌 2). 그러나, 목적물로서의 단백질을 코드하는 DNA 로 트랜스펙트한 세포 내에 있어서, 목적물로서의 단백질을 코드하는 유전자 전사 산물이 고레벨로 발현하고 있는 것에 관계없이, 그 단백질의 합성/분비량이 낮은 문제가 생기는 경우가 종종 보이고, 이용되고 있는 세포에 있어서 mRNA 가 소포체막 상에서의 번역 장치에 이용하기 쉬운 형태로 제공되고 있지 않은 가능성이 추측되었다.

이와 같은 검토에 기초하여 해석을 진행시킨 결과, 콜라겐 유전자의 5' 비번역 영역에 존재하는 cis-엘리먼트가, 단백질의 발현량을 증대시키는 작용을 갖는 것을 알아냈다. 보다 구체적으로는, 성숙 mRNA 의 5' 비번역 영역에 있는 cis-엘리먼트 배열을 인식하는 RRM 단백질이 거기에 결합함으로써, 분비 단백질의 합성의 장인 소포체의 막 상에의 mRNA 의 수송/국재화를 증강시켜, 추가로 번역 효율을 상승시키는 기능이 있다고 생각되었다.

본 발명에 있어서 확인된 cis-엘리먼트는, 1 형 콜라겐 유전자의 해석의 결과로부터 밝혀진 것이고, 이 cis-엘리먼트의 뉴클레오티드 배열은, 1 형 콜라겐 유전자의 5' 비번역 영역에 존재하는 것이 분명해졌다. 따라서, 본 발명에 있어서는, 그와 같은 cis-엘리먼트의 뉴클레오티드 배열로서, 타입 I 콜라겐 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열을 들 수 있지만, 원하는 효과를 갖는 한에 있어서, 피브로넥틴 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 매트릭스 메탈로프로테아제 14 (MMP14) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A2 (P4HA2) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A1 (P4HA1) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열 등의 다른 유전자에서 유래하는 cis-엘리먼트를 사용할 수도 있다.

본 발명에 있어서 사용할 수 있는 cis-엘리먼트의 구조적인 특징으로는, 목적물의 단백질을 발현하기 위한 발현 플라스미드에 포함되는 유전자의 5' 비번역 영역 중에, 9 개 ∼ 12 개의 뉴클레오티드로 구성되는 모티프 「GAN₁-(X)_n-ACN₂」(n = 3 ∼ 6) (N₁ 및 N₂ 는 독립적으로 A, T, C, G 중 어느 뉴클레오티드여도 된다) 를 1 또는 몇 개 포함하는 것에 의해 특징지어진다. 구체적인 모티프의 예로는, 천연의 cis-엘리먼트로서 존재하는 모티프를 들 수 있고, 이들은 N₁ 이 G 인 것, 그리고 N₂ 가 A 또는 G 또는 C 인 것을 특징으로 하고 있다. 더 상세하게는, 「GAG xxx ACV」(SEQ ID NO : 17), 「GAG xxxx ACV」(SEQ ID NO : 18), 「GAG xxxxx ACV」(SEQ ID NO : 19), 및 「GAG xxxxxx ACV」(SEQ ID NO : 20) (이들 배열에 있어서, V 는 A 또는 G 또는 C 를 나타낸다) 로 나타낼 수 있다. 예를 들어, 1 형 콜라겐 유전자의 경우에는, 그 5' 비번역 영역 중에 4 개의 모티프를 내포하고 있는 것을 알 수 있다.

I 형 콜라겐 유전자에서 유래하는 cis-엘리먼트를 이용하는 경우, cis-엘리먼트의 뉴클레오티드 배열을, SEQ ID NO : 5 의 전체 길이 또는 SEQ ID NO : 7 의 전체 길이 외, SEQ ID NO : 5 중 1 ∼ 102 번 뉴클레오티드, 1 ∼ 78 번 뉴클레오티드, 1 ∼ 60 번 뉴클레오티드, 61 ∼ 126 번 뉴클레오티드, 16 ∼ 57 번 뉴클레오티드, 79 ∼ 126 번 뉴클레오티드, 103 ∼ 126 번 뉴클레오티드, 58 ∼ 78 번 뉴클레오티드, 51 ∼ 78 번 뉴클레오티드, 1 ∼ 27 번 뉴클레오티드, 70 ∼ 78 번 뉴클레오티드 등으로 이루어지는 군에서 선택되는 어느 배열을 사용할 수 있다.

또, 피브로넥틴 유전자에서 유래하는 cis-엘리먼트를 이용하는 경우, cis-엘리먼트의 뉴클레오티드 배열을, SEQ ID NO : 6 의 전체 길이 및 SEQ ID NO : 8 의 전체 길이 외로 이루어지는 군에서 선택되는 어느 배열을 사용할 수 있다.

[표 3]

이와 같은 cis-엘리먼트를 포함하는 발현 플라스미드를, 손상되지 않은 숙주 세포뿐만 아니라, 본원 발명에 있어서 조제한, p180 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, 또는 이들 양방의 발현이 모두 항진된 세포에 있어서 사용할 수 있다.

본 명세서에 있어서는, 여기까지에 설명한 본 발명을 더 구체적으로 설명하는 것을 목적으로 해, 이하의 실시예를 기재하지만, 그러나 이하의 실시예의 기재는, 본 발명을 한정하는 것을 목적으로 한 것은 아니다.

실시예

실시예 1 : SF3b4 단백질, 또는 p180 단백질과 SF3b4 단백질을 공발현하는 세포주의 수립

플라스미드의 조제

SF3b4 단백질, 또는 p180 단백질과 SF3b4 단백질을 공발현하는 세포주의 수립은, p180 단백질을 코드하는 핵산을 포함하는 발현 플라스미드와 SF3b4 단백질을 코드하는 핵산을 포함하는 발현 플라스미드를 별개로 조제하고, CHO 세포에 대해 차례로 트랜스펙트함으로써, 실시하였다.

인간 p180 단백질 (GenBank Accession No. AB287347) 전체 길이를 코드하는 발현 플라스미드 pcDNA-p180/54R 은, 특허문헌 1 (일본 공개특허공보 2005-312409) 에 기재된 방법에 준해 조제하였다.

인간 SF3b4 단백질 전체 길이를 코드하는 발현 플라스미드 pEF-SF3b4 는, 이하의 방법에 따라 조제하였다. 즉, 인간 SF3b4 단백질 (GenBank Accession No. NP_005841.1) 전체 길이를 코드하는 cDNA 배열을 PCR 로 증폭 후, pEF1/Myc-His 벡터 (Life Technologies 사 제조) 의 KpnI-EcoRV 사이트에 삽입 연결해, 플라스미드 pEF-SF3b4 를 얻었다.

차이니즈 햄스터 SF3b4 단백질 전체 길이를 코드하는 발현 플라스미드 pEF-CHO-SF3b4 는, 이하의 방법에 따라 조제하였다. 즉, CHO 세포로부터 total RNA 를 추출하고, 차이니즈 햄스터 SF3b4 단백질 (GenBank Accession No. XP_003498680.1) 전체 길이를 코드하는 cDNA 배열을 PCR 로 증폭하였다. 그 후 pEF1/Myc-His 벡터의 KpnI-EcoRV 사이트에 삽입 연결해, 플라스미드 pEF-CHO-SF3b4 를 얻었다.

인간 cis 엘리먼트의 배열 (예를 들어, cis-엘리먼트 #1 ∼ #11) 을 코드하는 발현 플라스미드 pEF-Cis 는, 이하의 방법에 따라 조제하였다. 즉, 인간 cis-엘리먼트 (예를 들어, cis-엘리먼트 #1 의 경우에는, SEQ ID NO : 5) 를 코드하는 핵산 배열을 PCR 로 증폭 후, pEGFP 벡터 (clontech 사 제조) 의 bglII-HindIII 사이트에 삽입 연결해, 플라스미드 prCMV-cis#-SEAP 를 얻었다. 각 cis-엘리먼트를 포함하는 발현 벡터의 자세한 것은 실시예 9 에 기재하였다.

p180 단백질을 안정적으로 발현하는 세포의 조제

인간 p180 단백질을 안정적으로 발현하는 CHO 세포의 수립은, 특허문헌 1 에 기재된 방법에 준해 실시하였다. 즉, CHO 세포에 인간 p180 단백질 발현 플라스미드 pcDNA-p180/54R 을 리포펙션법에 의해 트랜스펙션한 후, Zeocin 400 ㎍/㎖ 존재하에서 배양하고, 약제 선택을 실시하였다. 10 일간 배양 후, Zeocin 에 내성을 갖는 세포주의 콜로니를 분리하여, p180 단백질을 안정적으로 발현하는 세포주 CHO 5g 세포를 수립하였다.

SF3b4 단백질을 안정적으로 발현하는 세포의 조제

인간 SF3b4 단백질을 안정적으로 발현하는 CHO 세포를 조제하기 위해, CHO 세포에 인간 SF3b4 단백질 발현 플라스미드 pEF-SF3b4 를 리포펙션법에 의해 트랜스펙션한 후, G418 400 ㎍/㎖ 존재하에서 배양하고, 약제 선택을 실시하였다. 10 일간 배양 후, G418 에 내성을 갖는 세포주의 콜로니를 분리하여, SF3b4 단백질을 안정적으로 발현하는 세포주 CHO 3D5 세포를 수립하였다 (독립행정법인 제품 평가 기술 기반 기구 특허 미생물 기탁 센터 (NPMD), 치바현 키사라즈시 카즈사카마타리 2-5-8 (일본), 수탁 번호 NITE BP-01753, 수탁일 2013년 11월 21일).

p180 단백질과 SF3b4 단백질을 안정적으로 공발현하는 세포의 조제

다음으로, 인간 p180 단백질과 인간 SF3b4 단백질을 안정적으로 공발현하는 CHO 세포를 수립하기 위해, 세포주 CHO 5g 세포에 대해, SF3b4 단백질 발현 플라스미드 pEF-SF3b4 를 리포펙션법에 의해 트랜스펙션하였다. 그 후, G418 400 ㎍/㎖, Zeocin 100 ㎍/㎖ 존재하에서 배양하고, 약제 선택을 실시하였다. 14 일간 배양 후, G418 과 Zeocin 에 내성을 갖는 세포주의 콜로니를 분리하여, 인간 p180 단백질과 인간 SF3b4 단백질을 안정적으로 공발현하는 세포주 CHO YA7 세포를 수립하였다 (독립행정법인 제품 평가 기술 기반 기구 특허 미생물 기탁 센터 (NPMD), 치바현 키사라즈시 카즈사카마타리 2-5-8 (일본), 수탁 번호 NITE BP-1535, 수탁일 2013년 2월 13일).

다음으로 인간 p180 단백질과 차이니즈 햄스터 SF3b4 단백질을 안정적으로 공발현하는 CHO 세포를 수립하기 위해, CHO 세포에 인간 p180 및 차이니즈 햄스터 SF3b4 를 발현하는 플라스미드를 리포펙션법에 의해 트랜스펙션하였다. 그 후, Hygromycin 300 ㎍/㎖ 존재하에서 배양하고, 약제 선택을 실시하였다. 14 일간 배양 후, Hygromycin 에 내성을 갖는 세포주의 콜로니를 분리하여, 인간 p180 단백질과 차이니즈 햄스터 SF3b4 단백질을 안정적으로 공발현하는 세포주 CHO 1B2 세포를 수립하였다 (독립행정법인 제품 평가 기술 기반 기구 특허 미생물 기탁 센터 (NPMD), 치바현 키사라즈시 카즈사카마타리 2-5-8 (일본), 수령 번호 NITE ABP-01811, 수령일 2014년 3월 4일).

세포의 성상 확인

CHO 5g 세포가 p180 단백질을 안정적으로 발현하고 있는 것, CHO 3D5 세포가 SF3b4 단백질을 안정적으로 발현하고 있는 것, 그리고 CHO YA7 세포 및 CHO 1B2 세포가 p180 단백질과 SF3b4 단백질을 공발현하고 있는 것을 각각 확인하기 위해, CHO 5g 세포, CHO 3D5 세포, CHO YA7 세포, CHO 1B2 세포의 각각을, 5 ％ 소 태아 혈청을 포함하는 둘베코 개변 이글 배지 (DMEM) 중에서, 5 ％ CO₂ 존재하, 37 ℃ 에서 배양하였다. 컨트롤 세포로서, CHO 세포도 아울러 배양하였다.

40 시간 후, 트립신 처리에 의해 현탁한 각 세포 1 × 10⁵ 개를 원심에 의해 회수하고, 해석용 샘플로 하였다. 그 후, 세포 내에서 발현하는 p180 단백질에 대해서는 항p180 항체 (Ogawa-Goto, K. et.al., J. Virol., 76(2002) 2350-2362 참조) 를 사용하고, 그리고 SF3b4 단백질에 대해서는 항SF3b4 항체 (Santacruz 사 제조) 를 사용하여, 웨스턴 블롯법에 의해 각각 해석하였다.

도 1 에 나타내는 바와 같이, CHO 세포의 p180 발현량은 검출 한계 이하이고, 내재성의 SF3b4 단백질의 발현이 낮은 레벨로 확인되었다 (레인 1). CHO 3D5 세포는, p180 단백질의 발현량은 CHO 세포와 마찬가지로, 검출 한계 이하였지만, SF3B4 단백질을 고발현하고 있었다 (레인 2). CHO 5g 세포는, p180 단백질을 고발현하고, SF3b4 단백질은 내재성의 발현이 낮은 레벨로 확인되었다 (레인 3). CHO YA7 세포 및 CHO 1B2 세포는, p180 단백질과 SF3b4 단백질을 모두 고발현하고 있었다 (레인 4, 레인 6). 이들의 점에서, p180 단백질을 고발현하는 CHO 5g 세포, SF3b4 단백질을 고발현하는 CHO 3D5 세포, 그리고 p180 단백질과 SF3b4 단백질을 공발현하는 CHO 세포 유래의 세포주, CHO YA7 세포 및 CHO 1B2 세포를 수립할 수 있었던 것을 확인하였다.

실시예 2 : p180 단백질의 발현 및/또는 SF3b4 단백질의 발현에 의한 분비 활성화

실시예 1 에 있어서 제조한 p180 단백질을 발현하는 세포주 CHO 5g 세포, SF3b4 단백질을 발현하는 세포주 CHO 3D5 세포, 및 p180 단백질과 SF3b4 단백질을 공발현하는 세포주 CHO YA7 세포를 사용하여, p180 단백질의 발현 및/또는 SF3b4 단백질의 발현과, 단백질 분비의 활성화에 대해 조사하였다.

분비 마커인 인간 태반 유래 분비형 알칼리 포스파타아제 (SEAP) 의 발현 플라스미드를 이하의 방법에 따라 구축하였다. 즉, SEAP 단백질 (GenBank Accession No. NP_001623.3) 전체 길이를 코드하는 cDNA 프래그먼트를 포유 동물 세포용 발현 벡터 (pEGFP-C3, Clontech 사 제조) 의 NheI-XhoI 사이트에 삽입 연결하여, SEAP 단백질 발현 플라스미드 prCMV-SEAP 를 얻었다.

각각의 세포의 SEAP 단백질 분비능을 평가하기 위해, CHO 3D5 세포, CHO 5g 세포, CHO YA7 세포, 그리고 CHO 세포 각각에 대해, SEAP 발현 플라스미드와 내부 표준화용의 β-갈락토시다아제를 발현하는 플라스미드 pEF1-LacZ (Life technologies 사 제조) 를 Lipofectamine LTX 시약 (Life technologies 사 제조) 을 이용하여 코트랜스펙션하였다. 0.1 ％ 소 태아 혈청을 포함하는 DMEM 중에서 20 시간 배양한 후, 배양 상청과 p-Nitrophenyl phosphate (pNPP, Sigma 사 제조) 를 포함하는 기질 용액을 혼합하였다. 실온에서 30 분 반응 후, 파장 405 ㎚ 에 대한 흡광도를 흡광도계로 측정하였다. 세포 획분의 β-갈락토시다아제 활성은 β-Galactosidase Enzyme Assay System (promega 사 제조) 의 정법에 따라 측정하였다.

β-갈락토시다아제 측정값으로 표준화한 SEAP 활성을 도 2 에 나타낸다. p180 단백질을 단독 발현시킨 CHO 5g 세포 및 SF3b4 단백질을 단독 발현시킨 CHO 3D5 세포에 있어서는, 배양 상청 중의 SEAP 분비 활성은 CHO 와 비교해 1.7 ∼ 2.0 배로 유의하게 증가하였다 (도 2). CHO YA7 세포에 있어서의 p180 단백질과 SF3b4 단백질을 공발현시킨 경우에는, CHO 세포와 비교해 3.1 배로까지 SEAP 활성이 더 증가하였다. 이들 점에서, p180 단백질을 단독 발현시키는 경우 및 SF3b4 단백질을 단독 발현시키는 경우의 어느 것에 있어서도, CHO 세포의 경우와 비교해, SEAP 분비 활성이 유의하게 상승시킬 수 있었지만, p180 단백질과 SF3b4 단백질을 공발현시킴으로써, CHO 세포의 경우와 비교해, 세포의 분비능을 현저하게 상승시키는 것이 나타났다.

또 CHO 세포의 SEAP 활성을 1 로 했을 때의 CHO 1B2 세포의 SEAP 활성비는 3.1 배로, SEAP 활성이 현저하게 증가하였다. 이 점에서, 인간 SF3b4 와 높은 유사성을 갖는 차이니즈 햄스터 SF3b4 는, 인간 SF3b4 와 동등한 분비 증강 활성을 갖는 것이 나타났다.

실시예 3 : p180 단백질과 SF3b4 단백질의 공발현에 의한, mRNA 의 막 획분에의 국재화 촉진

실시예 1 에 있어서 제조한 p180 단백질을 발현하는 세포주 CHO 5g 세포, SF3b4 단백질을 발현하는 세포주 CHO 3D5 세포, 및 p180 단백질과 SF3b4 단백질을 공발현하는 세포주 CHO YA7 세포를 사용하여, p180 단백질의 발현 및/또는 SF3b4 단백질의 발현과, mRNA 의 막 획분에의 국재화 촉진의 관계에 대해 조사하였다.

CHO YA7 세포 및 컨트롤 세포에 상기 서술한 SEAP 발현 플라스미드를 lipofectamine LTX 를 이용하여 트랜스펙션하고, 40 시간 후, 세포질 획분과 막 획분으로 분획하였다. 분획 방법은 비특허문헌 1 (Ueno, et al., (2010) J Biol Chem 285, 29941-29950) 에 기재된 방법에 준해 실시했다. 각각의 획분으로부터 Trisol-LS 시약 (Life technologies 사 제조) 의 정법에 따라 RNA 를 추출하였다. 그 후, SEAP 특이적인 프라이머를 이용하여 정량적 PCR 법을 실시해, SEAP mRNA 량을 정량하였다 (도 3).

그 결과, CHO 3D5 세포, CHO 5g 세포, CHO YA7 세포, CHO 세포에서는, 세포질과 막 획분의 총합이 되는 전체 mRNA 량은 거의 동일 정도였다. 그러나, CHO 세포, CHO 3D5 세포, CHO 5g 세포에서는 전체의 약 3 할의 mRNA 가 막 획분에 존재하고 있던 것에 대해, CHO YA7 세포에서는 약 7 할이 막 획분에 국재화되어 있고, 세포질로부터 막 획분으로 mRNA 의 국재가 현저하게 시프트되어 있었다.

이들 점에서, p180 단백질과 SF3b4 단백질을 공발현하는 CHO YA7 세포는, 분비 단백질의 생합성 시에 mRNA 를 막 획분으로 적극적으로 국재화시키는 특성을 갖는 것이 나타났다.

실시예 4 : 분비형 알칼리 포스파타아제 발현 유닛 내에 각종 cis-엘리먼트를 삽입한 발현 벡터의 구축

본 실시예에 있어서는, 실시예 1 에 있어서 제작한 SF3b4 단백질을 발현하는 세포주 CHO 3D5 세포, 및 p180 단백질과 SF3b4 단백질을 공발현하는 세포주 CHO YA7 세포를 사용하여, 단백질의 발현 효율을 더 올리는 것을 목적으로 해, 발현 플라스미드의 구조를 검토하였다.

실시예 2 에서 나타낸 SEAP 발현 플라스미드 prCMV-SEAP 에 cis-엘리먼트를 삽입한 발현 벡터를 이하의 방법에 따라 구축하였다. 인간 선유아세포 유래의 RNA 를 비특허문헌 1 (Ueno, et al., (2010) J Biol Chem 285, 29941-29950) 에 기재된 방법에 준해 조제하고, 주형으로서 RT-PCR 을 실시하였다. 증폭 시에 5', 3' 측에 BglII 와 HindIII 인식 배열을 각각 부가한 프라이머 (SEQ ID NO : 15, SEQ ID NO : 16) 를 사용하여, 인간 유래의 I 형 콜라겐 α1 유래 cis-엘리먼트 #1 (SEQ ID NO : 5) 을 증폭하였다. prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 부위에, 증폭 단편을 BglII-HindIII 으로 처리한 후 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #1 을 삽입한 발현 플라스미드 prCMV-cis#1-SEAP 를 얻었다 (도 4A).

실시예 5 : cis-엘리먼트에 의한 단백질의 분비 활성화

실시예 4 에 있어서 제작한 cis-엘리먼트를 포함하는 발현 플라스미드에 의해, 발현 단백질의 분비에의 영향을 검토하였다. 실시예 4 에서 제조한 2 종의 발현 플라스미드, prCMV-cis#1-SEAP 및 prCMV-SEAP 를, LipofectamineLTX 시약 (Life technologies 사 제조) 을 이용하여 트랜스펙션하였다. 세포는 실시예 1 에서 제조한 4 종의 세포주를 사용하였다. 0.1 ％ FBS 를 포함하는 DMEM 중에서 20 시간 배양한 후, 배양 상청과 형광 기질 4-Methylumbelliferyl phosphate (4-MUP, Sigma 사 제조) 를 포함하는 기질 용액을 혼합하였다. 실온에서 30 분 반응 후, 형광 강도 (여기광 360 ㎚, 형광 440 ㎚) 를 형광 광도계로 측정하였다. 또 트랜스펙션 효율을 SEAP cDNA 총량으로 보정하기 위해, 세포 획분으로부터 Trizol 시약 (Lifetechnologies 사 제조) 을 이용하여 전체 mRNA 를 추출하고, SEAP 특이적인 프라이머를 이용하여 정량적 PCR 을 실시해, SEAP cDNA 량을 정량하였다. SEAP cDNA 량으로 보정한 prCMV-cis#1-SEAP 의 prCMV-SEAP 에 대한 SEAP 활성비를 도 4B, 도 4C 에 나타낸다.

그 결과, CHO 세포에 있어서 cis-엘리먼트 #1 의 삽입에 의해, SEAP 활성은 2.7 배로 증가하였다. CHO 3D5 세포, CHO 5g 세포, 그리고 CHO YA7 세포의 각 세포에 있어서도 cis-엘리먼트 #1 의 삽입에 의해, SEAP 활성은 모두 3.0 ∼ 3.2 배로 증가하였다. 이들 결과로부터, cis-엘리먼트 #1 을 발현 유닛 내에 삽입함으로써, 각종 CHO 세포에 있어서 전사 산물당 단백질 합성 및 분비량을 증가시킬 수 있는 것이 나타났다.

이상의 각 세포의 cis-엘리먼트 #1 의 삽입 후의 SEAP 활성비를, CHO 세포의 cis-엘리먼트 #1 의 미삽입 SEAP 활성과 비교하기 위해, CHO 세포에서의 prCMV-SEAP 도입 시의 SEAP 활성을 1 로 하고 각 세포에서의 prCMV-cis#1-SEAP 도입 시 활성을 구하였다 (도 4C). cis-엘리먼트 #1 을 사용한 경우의 CHO 3D5 세포, CHO 5g 세포의 SEAP 활성비는 각각, 컨트롤인 CHO 세포의 4.7, 6.3 배로 증가하였다. 또한 CHO YA7 세포에서는, 컨트롤인 CHO 세포의 9.4 배로, SEAP 의 분비 활성이 현저하게 증가해 있었다.

이상으로부터, cis-엘리먼트 #1 과 SF3b4 단백질이 공존함으로써, 혹은 cis-엘리먼트 #1 과 p180 단백질이 공존함으로써, 발현 플라스미드로부터 발현되는 단백질의 분비 활성이 상승하고, 또한 cis-엘리먼트 #1, SF3b4 단백질 및 p180 단백질의 3 인자가 공존함으로써, 세포의 단백질 분비 활성을 현저하게 증강시킬 수 있는 것이 나타났다.

실시예 6 : cis-엘리먼트 #1 에 의한 콜라겐의 분비 활성화

본 실시예에 있어서는, cis-엘리먼트를 포함하는 발현 플라스미드에 의해, 콜라겐 발현에의 영향을 검토하였다.

인간 I 형 콜라겐 α1 (COL1A1) 의 발현 플라스미드를 이하의 방법에 따라 구축하였다. 즉, COL1A1 (GenBank Accession No. NM_000088.3) 전체 길이를 코드하는 cDNA 프래그먼트를 포유 동물 세포용 발현 벡터 (pEGFP-C3, Clontech 사 제조) 의 NheI-XhoI 사이트에 삽입 연결하고, CMV 프로모터의 제어하에서 cis-엘리먼트 #1 을 포함한 COL1A1 (1 ∼ 5297) 을 발현하는 플라스미드 prCMV-COL1A1 을 얻었다. 또, COL1A1 유전자 전체 길이 대신에, COL1A1 ORF 전체 길이만을 코드하는 127 ∼ 4251, 및 127 ∼ 5297 까지의 유전자 단편을 동일하게 증폭하여, prCMV-COL1A1-ORF, 및 prCMV-COL1A1-ORF-UTR 을 구축하였다. 또 인간 II 형 콜라겐 α1 (COL2A1), 인간 III 형 콜라겐 α1 (COL3A1) 의 발현 플라스미드를 이하의 방법에 따라 구축하였다. 즉, COL2A1 (GenBank Accession No. NP_001835.3) 또는 COL3A1 (GenBank Accession No. NP_000081.1) 전체 길이를 코드하는 cDNA 프래그먼트를, 포유 동물 세포용 발현 벡터 (pcDNA, Invitrogen 사 제조) 에 cis-엘리먼트 #1 을 삽입한 pcDNA-cis#1 의 EcoRV-NotI 사이트에 삽입 연결하고, CMV 프로모터의 제어하에서 COL2A1 (1 ∼ 4464) 을 발현하는 플라스미드 pcDNA-cis#1-COL2A1, COL3A1 (1 ∼ 4401) 을 발현하는 플라스미드 pcDNA-cis#1-COL3A1 을 얻었다.

cis-엘리먼트 #1 의 프로콜라겐에 대한 분비 활성화능을 조사하기 위해, 실시예 1 에서 제작한 3 종의 세포주에, prCMV-COL1A1 을 리포펙션법으로 트랜스펙션하였다. 0.1 ％ 소 태아 혈청, 200 μM 아스코르브산을 포함하는 DMEM 중에서 40 시간 배양한 후, 배양 상청 중의 COL1A1 procollagen 량을 웨스턴 블롯법에 의해 해석하였다 (도 5A).

그 결과, 컨트롤인 CHO 세포의 프로콜라겐량을 1 로 하면 CHO YA7 세포에서는 약 20 배로 증가하였다. 또, cis-엘리먼트 #1 의 평가를 위해, 컨트롤 CHO 세포에, cis-엘리먼트 #1 을 포함하지 않는 prCMV-COL1A1-ORF, prCMV-COL1A1-ORF-UTR 도 동일하게 유전자 도입하였다. 이 경우에는, 배양 상청 중의 프로콜라겐량은 웨스턴 블롯법에 의한 검출 한계 이하였다.

또한, 호모트라이머를 형성한 콜라겐의 분비량을 조사하기 위해, 실시예 1 에서 제작한 3 종의 세포주에, pcDNA-cis#1-COL2A1, pcDNA-cis#1-COL3A1 또는 실시예 6 에서 제작한 prCMV-COL1A1 및 prCMV-COL1A1-ORF 를 리포펙션법으로 트랜스펙션하였다. 2 ％ 소 태아 혈청, 200 μM 아스코르브산을 포함하는 DMEM 중에서 72 시간 배양한 후, 배양 상청을 회수하고 0.1 N 이 되도록 HCl 을 첨가해 산성으로 하고, 0.5 ㎎/㎖ 가 되도록 펩신 (SIGMA 사 제조) 을 첨가하고 4 ℃ 에서 16 시간 소화 반응을 실시하였다. 이것에 1 M 이 되도록 NaCl 을 첨가해 빙상에서 3 시간 정치한 후, 원심분리를 실시하고, 얻어진 침전을 1 M NaCl 과 95 ％ 에탄올로 세정하였다. 이 콜라겐 정제 시료를 SDS-PAGE 로 영동하여 각 콜라겐의 밴드 강도를 비교하였다. 그 결과, 컨트롤 CHO 세포의 분비량을 1 로 했을 때, CHO YA7 세포에 있어서의 COL1A1, COL2A1, COL3A1 의 각 호모트라이머의 분비량은 각각 1.8, 1.9, 3.7 배로 유의하게 증가해 있었다 (도 5B ∼ 도 5D). cis-엘리먼트 #1 비존재하에 있어서도, CHO 3D5 세포, CHO YA7 세포에서는 컨트롤의 1.5 배, 2.1 배로 호모트라이머 분비량이 증가하였다.

이상으로부터, cis-엘리먼트 #1 은 각종 CHO 세포에 있어서 콜라겐 분자의 발현을 증강시켜, SF3b4 단백질 및/또는 p180 단백질의 존재하에서 cis-엘리먼트 #1 을 이용하면 3 중 나선 구조를 유지한 콜라겐 분비량이 더 증가하는 것이 나타났다.

실시예 7 : cis-엘리먼트에 의한 항체 분자의 발현 증강 효과

cis-엘리먼트에 의한 항체 발현에의 영향을 이하와 같이 검토하였다.

항체 중사슬 및 경사슬 전체 길이의 발현 플라스미드를 이하의 방법에 따라 구축하였다. 즉, 항IL-8 항체 발현 플라스미드 (p6G425V11N35A.choSD, ATCC 209552) 에 코드되는 항체 중사슬 (Heavy chain, HC) 및 경사슬 (Light chain, LC) 전체 길이 배열을 인공 유전자 합성 서비스 (MBL 사) 에 의해 합성하였다. 그 후, 중사슬 ORF 전체 길이는 pEF1/Myc-His 벡터의 NheI-SpeI 사이트에, 경사슬 ORF 전체 길이는 pEF1/Myc-His 벡터의 KpnI-EcoRV 사이트에 각각 삽입 연결하였다. 그 후, 경사슬 발현 카세트를 ClaI 로 잘라내고, 중사슬 발현 벡터의 ClaI 사이트에 삽입 연결하여, 항IL-8 항체 (중사슬, 경사슬) 공발현 플라스미드 pEF-HC-LC 를 구축하였다. 또한 이 플라스미드의 중사슬 및 경사슬 ORF 상류에 cis#1 을 삽입한 발현 플라스미드 pEF-cis#1-HC-LC 도 아울러 구축하였다.

실시예 1 에서 제작한 3 종의 세포주에, pEF-HC-LC, pEF-cis#1-HC-LC 를 리포펙션법으로 트랜스펙션하였다. 0.1 ％ 소 태아 혈청을 포함하는 DMEM 중에서 96 시간 배양한 후, 배양 상청 중의 항체 산생량을 Human IgG ELISA Quantitation Set (Bethyl 사) 를 사용하여 ELISA 법에 의해 정량하였다. 그 결과, CHO 세포에 있어서 cis-엘리먼트 #1 의 삽입에 의해, 항체 분비량은 2.7 배로 증가하였다. CHO 3D5 세포, CHO YA7 세포의 각 세포에 있어서도 cis-엘리먼트 #1 의 삽입에 의해, 항체 분비량은 각각 2.5, 1.8 배로 증가하였다 (도 6A). 이들 결과로부터, cis-엘리먼트 #1 을 발현 유닛 내에 삽입함으로써, 각종 CHO 세포에 있어서 항체 분비량을 증가시킬 수 있는 것이 나타났다.

도 6B 에 나타내는 바와 같이, CHO 세포에서의 pEF-HC-LC 도입 시의 항체 분비량을 1 로 한 경우 SF3b4 를 도입한 CHO 3D5 세포, SF3b4 및 p180 을 도입한 CHO YA7 세포의 항체 분비량은 2.5 배, 12.6 배로 증가하여, p180 단백질, 및/또는 SF3b4 의 도입에 의해 항체 분비량의 증가가 확인되었다. 이들 경향은, cis-엘리먼트 #1 을 사용하면 더 현저한 효과가 얻어지고, CHO 3D5 세포의 항체 분비량은, 컨트롤인 CHO 세포의 5.6 배로 증가하고, CHO YA7 세포에서는 21.3 배로 현저하게 증가해 있었다.

이상으로부터, cis-엘리먼트 #1 이 항체 생산에 유효하게 작용하는 것, 그 활성은 SF3b4 단백질 또는 p180 단백질의, 또는 그 양자의 존재하에 있어서 더 현저하게 작용하는 것이 나타났다.

실시예 8 : kozak 배열과 cis-엘리먼트 #1 의 분비 활성화 효과의 비교

본 실시예에 있어서는, 진핵 세포의 mRNA 중에 있어서 번역의 개시에 관여하는 공통 배열로서 알려진 kozak 배열이 나타내는 분비 활성화 효과와, cis-엘리먼트가 나타내는 분비 활성화 효과를 비교하는 것을 목적으로 해 실시했다. .

실시예 4 에 있어서 제조한 prCMV-SEAP 및 prCMV-cis#1-SEAP 의 개시 메티오닌 코돈 ATG 의 직전의 6 bp 의 배열 TCCTGC 를 GCCACC 로 치환한 발현 플라스미드 prCMV-SEAP-kozak, prCMV-cis#1-SEAP-kozak 을 이하의 방법에 의해 구축하였다. 즉, SEAP 특이적 프라이머를 이용하여 PCR 을 실시하고, ATG 의 직전에 GCCACC 를 부가한 SEAP 단편 (1 ∼ 132) 을 증폭하였다. 계속해서 prCMV-SEAP 및 prCMV-cis#1-SEAP 로부터 SEAP (1 ∼ 132) 영역을 HindIII-PstI 로 제거하고, HindIII-PstI 로 처리한 증폭 단편으로 치환함으로써, SEAP ORF 상류에 kozak 배열을 삽입한 SEAP 발현 플라스미드 prCMV-SEAP-kozak 과 prCMV-cis#1-SEAP-kozak 을 얻었다.

CHO 세포, CHO 3D5 세포 및 CHO YA7 세포에 prCMV-SEAP, prCMV-SEAP-kozak, prCMV-cis#1-SEAP, prCMV-cis#1-SEAP-kozak 을 트랜스펙션하고, 20 시간 후의 배양 상청 중의 SEAP 활성을 실시예 5 에 기재된 방법으로 측정하였다. 그 결과, prCMV-SEAP 에 비해, prCMV-cis#1-SEAP, prCMV-cis#1-SEAP-kozak 의 경우에는 CHO 세포의 SEAP 활성은 2 배 이상으로 증강하고 (도 7), 그 효과는 단백질 발현에 유효로서 알려진 코작 배열과 동등 이상을 나타내는 것이 확인되었다.

이 증가 경향은 CHO 3D5 세포나 CHO YA7 세포에 있어서도 강하게 관찰되고, cis-엘리먼트 #1 을 부가하면, SEAP 활성비가 3.3 ∼ 3.4 배로, kozak 배열과 cis-엘리먼트 #1 의 양자를 부가했을 때에는 3.3 ∼ 4.9 배로 증가하였다 (도 7).

이들로부터, CHO 세포, CHO 3D5 세포 및 CHO YA7 세포에 있어서 cis-엘리먼트 #1 에 의한 분비 활성화의 효과는 kozak 배열의 효과보다 높고, cis-엘리먼트 #1, SF3b4 단백질, 및 p180 단백질의 3 인자와 kozak 배열을 병용함으로써, 분비 활성능을 더 증강시킬 수 있는 것이 나타났다.

실시예 9 : cis-엘리먼트 부가에 의한 단백질 발현 증강 효과

실시예 1 에 있어서 제작한 세포에 대해, 각종 cis-엘리먼트를 포함하는 발현 플라스미드를 사용하여, 단백질 발현 증강 작용이 있는 cis-엘리먼트 배열의 상세를 검토하였다.

prCMV-SEAP 에 인간 유래의 피브로넥틴 유전자의 cis-엘리먼트 배열, cis-엘리먼트 #2 (SEQ ID NO : 6) 를 삽입한 발현 벡터 prCMV-cis#2-SEAP 는, 이하의 방법에 따라 구축하였다. 즉, 인간 선유아세포 유래의 RNA 를 비특허문헌 1 (Ueno, et al., (2010) J Biol Chem 285, 29941-29950) 에 기재된 방법에 준해 조제한 RNA 를 주형으로 해서 RT-PCR 을 실시하였다. 증폭 시에 5', 3' 측에 BglII 와 HindIII 인식 배열을 각각 부가한 프라이머 (SEQ ID NO : 13, SEQ ID NO : 14) 를 사용하여, cis-엘리먼트 #2 를 포함하는 단편을 증폭하였다. 증폭 단편을 BglII-HindIII 으로 처리한 후, prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #2 를 삽입한 발현 플라스미드를 얻었다.

prCMV-SEAP 에 대해, 인간 유래의 I 형 콜라겐 α1 유전자의 cis-엘리먼트 배열, cis-엘리먼트 #3, 및 인간 유래의 피브로넥틴 유전자의 cis-엘리먼트 배열, cis-엘리먼트 #4 를 삽입한 발현 벡터 prCMV-cis#3-SEAP 등은, 이하의 방법에 따라 구축하였다. 즉, cis-엘리먼트 #3 의 cis-엘리먼트를 포함하는 프라이머 (SEQ ID NO : 9, SEQ ID NO : 10) 혹은 cis-엘리먼트 #4 의 cis-엘리먼트를 포함하는 프라이머 (SEQ ID NO : 11, SEQ ID NO : 12) 를 95 ℃ 에서 10 분 열처리 후에 단계적으로 25 ℃ 까지 낮추고 2 개의 프라이머를 어닐링시킴으로써 각종 링커를 조제하였다. 각종 링커를 prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #3 (SEQ ID NO : 7), cis-엘리먼트 #4 (SEQ ID NO : 8) 를 삽입한 발현 플라스미드를 얻었다.

prCMV-SEAP 에 cis-엘리먼트 #5, #6 을 삽입한 발현 벡터 prCMV-cis#5-SEAP, prCMV-cis#6-SEAP 는, 이하의 방법에 따라 구축하였다. cis-엘리먼트 #1 의 부분 배열을 BglII 와 HindIII 인식 배열을 각각 부가한 프라이머 (SEQ ID NO : 28 및 29, SEQ ID NO : 30 및 31) 를 사용하여, cis-엘리먼트 #5 (1-60), cis-엘리먼트 #6 (61-126) 을 포함하는 단편을 증폭하였다. 증폭 단편을 BglII-HindIII 으로 처리한 후, prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #5, cis-엘리먼트 #6 을 삽입한 발현 플라스미드를 각각 얻었다.

prCMV-SEAP 에 cis-엘리먼트 #7 을 삽입한 발현 벡터 prCMV-cis#7-SEAP 는 이하의 방법에 따라 구축하였다. COL2A1 유전자 유래 배열을 합성 후, 말단에 부가한 BglII, HindIII 인식 배열을 이용하여 prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #7 을 삽입한 발현 플라스미드를 얻었다.

prCMV-SEAP 에 cis-엘리먼트 #2 유래 배열인 cis-엘리먼트 #8, #9, #10 을 삽입한 발현 벡터 prCMV-cis#8-SEAP, prCMV-cis#9-SEAP, prCMV-cis#10-SEAP 는, 이하의 방법에 따라 구축하였다. 즉, cis-엘리먼트 #8 의 cis-엘리먼트를 포함하는 프라이머 (SEQ ID NO : 32, SEQ ID NO : 33), cis-엘리먼트 #9 의 cis-엘리먼트를 포함하는 프라이머 (SEQ ID NO : 34, SEQ ID NO : 35), cis-엘리먼트 #10 의 cis-엘리먼트를 포함하는 프라이머 (SEQ ID NO : 36, SEQ ID NO : 37) 를 95 ℃ 에서 10 분 열처리 후에 단계적으로 25 ℃ 까지 낮추고 2 개의 프라이머를 어닐링시킴으로써 각종 링커를 조제하였다. 각종 링커를 prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #8 (SEQ ID NO : 24), cis-엘리먼트 #9 (SEQ ID NO : 25), cis-엘리먼트 #10 (SEQ ID NO : 26) 을 삽입한 발현 플라스미드를 얻었다.

prCMV-SEAP 에 cis-엘리먼트 #11 을 삽입한 발현 벡터 prCMV-cis#11-SEAP 는, 이하의 방법에 따라 구축하였다. cis-엘리먼트 #1 의 부분 배열을 BglII 와 HindIII 인식 배열을 각각 부가한 프라이머 (SEQ ID NO : 38, SEQ ID NO : 39) 를 사용하여, cis-엘리먼트 #11 (1-113) 을 포함하는 단편을 증폭하였다. 증폭 단편을 BglII-HindIII 으로 처리한 후, prCMV-SEAP 의 CMV 프로모터와 SEAP ORF 사이에 있는 BglII-HindIII 사이트에 삽입 연결하였다. 이로써, CMV 프로모터와 SEAP 의 개시 메티오닌 사이에 cis-엘리먼트 #11 (SEQ ID NO : 27) 을 삽입한 발현 플라스미드를 각각 얻었다.

[표 4]

CHO YA7 세포에, prCMV-cis#1-SEAP, prCMV-cis#2-SEAP, prCMV-cis#3-SEAP, prCMV-cis#4-SEAP, prCMV-cis#5-SEAP, prCMV-cis#6-SEAP, prCMV-cis#7-SEAP, prCMV-cis#8-SEAP, prCMV-cis#9-SEAP, prCMV-cis#10-SEAP, prCMV-cis#11-SEAP, prCMV-SEAP 를 트랜스펙션하였다. 20 시간 후의 배양 상청 중의 SEAP 활성을 실시예 5 에 기재된 방법으로 측정하였다. prCMV-SEAP 의 경우의 SEAP 활성을 1 로 하면, 사용한 모든 cis-엘리먼트는 약 2.0 ∼ 3.4 배로 SEAP 의 분비 활성비가 상승하였다 (도 8A). 이때 막 획분의 SF3b4 단백질량을 웨스턴 블롯법으로 해석하고, 덴시토메트리 처리에 의해 정량하면 cis-엘리먼트 #1, cis-엘리먼트 #2, cis-엘리먼트 #3, cis-엘리먼트 #4, cis-엘리먼트 #5, cis-엘리먼트 #6 각각의 막 획분 중의 SF3b4 단백질량은 컨트롤의 2.0 ∼ 3.6 배로 유의하게 증가해 있었다 (도 8B).

이상의 결과로부터, cis-엘리먼트 #1 ∼ #11 을 발현 유닛 내에 부가하면 단백질 발현 증강 효과가 있는 SF3b4 단백질을 소포체막 상에 국재화시키는 것이 가능해지고, 이것을 개재하여 세포의 분비능을 증강 가능한 것이 나타났다.

실시예 10 : 모티프 내 배열 사슬 길이의 효과

cis-엘리먼트 #1 에 동정된 모티프 배열 GAN₁-(X)_n-ACN₂ 에 대해, 유효한 사슬 길이수 n 의 검토를 이하와 같이 실시하였다. GAG-(X)_n-ACV (V 는 A 또는 G 또는 C 를 나타낸다) 에 대해, n 을 1-9 mer 까지 변화시킨 cis-엘리먼트 #3 유래의 변이체를 실시예 8 과 동일한 방법으로 구축하였다 (도 9A). 또 모티프를 결실시킨 변이체 (motif delete) 도 아울러 구축하였다. 각 엘리먼트의 SEAP 분비 활성을 평가하기 위해, 실시예 5 에 기재된 방법에 따라, 각각의 분비 활성을 평가하였다. 그 결과, n = 3 ∼ 6 인 경우에, cis-엘리먼트 #3 과 동등한 활성이 얻어졌다 (도 9B). 이상의 결과로부터, 본 계에 있어서 분비 활성화에 중요해지는 cis-엘리먼트 내의 모티프는 GAN₁-(X)_n-ACN₂ 의 X 사슬 길이 n 이 3 ∼ 6 잔기인 것이 판명되었다.

실시예 11 : 모티프 배열의 염기 치환, 삽입에 의한 영향

모티프 내의 염기 치환 및 삽입에 의한 발현 증강 활성에의 영향을 검토하였다. Cis-엘리먼트 #3 내의 모티프 GAN₁-(X)_n-ACN₂ 에 대해, N₁ 및 N₂ 를 각각 A, G, C, T 로 한 cis-엘리먼트 #3 유래의 변이체를 실시예 8 과 동일한 방법으로 구축하였다 (도 10A). 또 polyA 배열, polyC 배열에 모티프를 삽입한 변이체와 컨트롤도 아울러 구축하였다 (도 10A). 실시예 5 에 기재된 방법에 따라, 각 엘리먼트의 분비 활성을 평가하였다. 그 결과, cis-엘리먼트 #3 의 N₂ 를 G 로부터 A, C, T 로 치환했을 때의 SEAP 활성은, 모두 cis-엘리먼트 #3 과 동등한 활성이 얻어졌다 (도 10B). cis-엘리먼트 #3 의 N₁ 을 G 로부터 A, C, T 로 치환했을 때의 SEAP 활성은, 모두 cis-엘리먼트 #3 과 동등한 활성을 나타냈다 (도 10B). 또 모티프를 삽입한 엘리먼트도 cis-엘리먼트 #3 과 동등한 활성을 가지고 있었다. 이상의 결과로부터, 높은 활성을 갖는 모티프로서 GAN₁-(X)_n-ACN₂ (N₁ 및 N₂ 는 A, G, C, T 의 어느 염기라도 되고, n = 3 ∼ 6 의 정수) 라고 확인되었다.

실시예 12 : SF3b4 발현 억제에 수반하는 콜라겐 분비량의 저하

SF3b4 의 발현 억제에 수반한 콜라겐 분비량에의 영향을 검토하였다. 인간 태아 폐 유래 섬유아세포 (HEL) 에, Oligofectamine (Life technologies) 의 정법에 따라 SF3b4 에 대한 siRNA (Life technologies, human SF3b4 siRNA HSS115684) 를 트랜스펙션하였다. 0.1 ％ FBS-DMEM, 아스코르브산인산에스테르 200 μM 의 조건하에서 4 일간 배양하였다. 그 후, 배지를 회수하고, 배양 상청 중의 COL1A1 프로콜라겐량 그리고 세포 획분의 SF3b4 단백질량을 실시예 6 의 방법에 준해 해석하였다. 그 결과, 세포 내의 SF3b4 발현량이 컨트롤의 20 ％ 로 저하되었을 때, 분비된 COL1A1 프로콜라겐량은 10 ％ 로 저하하였다 (도 11). 이상의 결과로부터, SF3b4 의 발현 억제에 수반해 콜라겐의 산생이 현저하게 억제되는 것이 나타났다.

실시예 13 : p180/SF3b4 공발현 부유 세포주에 있어서의 콜라겐 분비에의 영향

인간 p180 단백질과 인간 SF3b4 를 안정 공발현하는 CHO-S 세포주를 이하의 방법에 의해 수립하였다. CHO-S 세포 (Life technologies 사) 에, pCDNA-p180/54R 을 리포펙션법에 의해 트랜스펙션하고, Zeocin 300 ㎍/㎖ 존재하에서 14 일간 배양해, 약제 선택을 실시하였다. Zeocin 내성 세포주의 콜로니를 분리하고 pEF-SF3b4 를 리포펙션법에 의해 트랜스펙션하고, Hygromycin 600 ㎍/㎖ 의 조건으로 약제 선택을 실시하였다. 14 일간 배양 후, Zeocin 및 Hygromycin 의 양자에 내성을 갖는 세포주의 콜로니를 분리해, 인간 p180 단백질과 인간 SF3b4 를 안정적으로 공발현하는 CHO-S 유래 세포주 54#160 을 수립하였다.

컨트롤로서 CHO-S 세포 및 제조한 54#160 세포에, prCMV-COL1A1, prCMV-COL1A1-ORF 를 각각 리포펙션법으로 트랜스펙션하였다. 무혈청, 8 mM L-글루타민을 포함하는 CD FortiCHO 배양액 (Life technologies 사) 중에서 96 시간 배양한 후, 배양 상청 중의 COL1A1 프로콜라겐량을 웨스턴 블롯법에 의해 해석하였다. cis-엘리먼트 #1 을 포함하는 prCMV-COL1A1 을 유전자 도입한 경우, 컨트롤인 CHO-S 세포의 프로콜라겐량을 1 로 하면 54#160 세포에서는 약 3.5 배로 증가하였다. 또, cis-엘리먼트 #1 을 포함하지 않는 prCMV-COL1A1-ORF 를 유전자 도입한 경우, 배양 상청 중의 프로콜라겐량은 웨스턴 블롯법에 의한 검출 한계 이하였다.

이상으로부터, 부유화 CHO-S 세포에 있어서 무혈청 조건하에서, cis-엘리먼트 #1 은, 거대 분자인 콜라겐의 합성/분비를 증강시킬 수 있고, 또한 cis-엘리먼트 #1, SF3b4 단백질 및 p180 단백질의 3 인자에 의해 부유화 CHO 세포의 분비 활성을 현저하게 증강 가능한 것이 나타났다.

실시예 14 : cis-엘리먼트 #1 에 의한 폴리솜 중 mRNA 의 중량화 시프트

CHO YA7 세포에 prCMV-COL1A1, prCMV-COL1A1-ORF 를 각각 리포펙션법으로 트랜스펙션하였다. 40 시간 후, 실시예 3 에 기재된 방법에 따라, 막 획분을 조제하였다. 얻어진 막 획분을 15 ∼ 50 ％ 의 자당 밀도 구배 원심분리에 제공하여, 폴리솜 획분을 분획하였다. 각 획분으로부터 실시예 5 에 기재된 방법에 준해 mRNA 를 추출하고, 정량적 PCR 에 의해 COL1A1 cDNA 량을 정량하였다. 또, 이때의 분비 프로콜라겐량을 실시예 6 에 기재된 방법으로 해석하였다. 그 결과, 폴리솜 획분 중의 COL1A1 cDNA 는, cis 엘리먼트를 포함하지 않는 prCMV-COL1A1-ORF 의 경우, 프랙션 24 를 피크로 하는 분포인 것에 대해, cis#1 을 포함하는 경우에는 프랙션 26 을 피크로 한 분포가 되어, 보다 고밀도의 획분으로 분포가 시프트해 있었다 (도 12). 또한 피크의 시프트에 수반해, 프로콜라겐의 분비량은 cis-엘리먼트 #1 존재하에서는 컨트롤의 4.9 배로 증가해 있었다. p180 및 SF3b4 존재하에 있어서 cis-엘리먼트 #1 은 mRNA 의 중량화 시프트를 일으키는 능력을 갖고, 이 중량화 시프트는 발현 증가와 상관하는 것이 확인되었다.

산업상 이용가능성

p180 단백질의 전체 길이 또는 그 부분의 발현, 그리고 SF3b4 단백질의 전체 길이 또는 그 부분의 발현이 항진된 본 발명의 재조합 세포는, 목적물로서의 단백질을 코드하는 DNA 를 형질 전환하면, 목적물로서의 단백질의 합성능 또는 분비능이, 비약적으로 증가하는 것이 밝혀졌다.

배열표 프리텍스트

SEQ ID NO : 1 : 인간 p180 을 코드하는 뉴클레오티드 배열

SEQ ID NO : 2 : 인간 p180 단백질의 아미노산 배열

SEQ ID NO : 3 : 인간 SF3b4 를 코드하는 뉴클레오티드 배열

SEQ ID NO : 4 : 인간 SF3b4 단백질의 아미노산 배열

SEQ ID NO : 5 : cis-엘리먼트 #1

SEQ ID NO : 6 : cis-엘리먼트 #2

SEQ ID NO : 7 : cis-엘리먼트 #3

SEQ ID NO : 8 : cis-엘리먼트 #4

SEQ ID NO : 9 : cis-엘리먼트 #3 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 10 : cis-엘리먼트 #3 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 11 : cis-엘리먼트 #4 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 12 : cis-엘리먼트 #4 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 13 : 5' 측에 BglII 인식 배열을 부가한, cis-엘리먼트 #2 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 14 : 3' 측에 HindIII 인식 배열을 부가한, cis-엘리먼트 #2 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 15 : 5' 측에 BglII 인식 배열을 부가한, cis-엘리먼트 #1 을 증폭하기 위한 프라이머

SEQ ID NO : 16 : 3' 측에 HindIII 인식 배열을 부가한, cis-엘리먼트 #1 을 증폭하기 위한 프라이머

SEQ ID NO : 17 : cis-엘리먼트의 모티프 (9 mer)

SEQ ID NO : 18 : cis-엘리먼트의 모티프 (10 mer)

SEQ ID NO : 19 : cis-엘리먼트의 모티프 (11 mer)

SEQ ID NO : 20 : cis-엘리먼트의 모티프 (12 mer)

SEQ ID NO : 21 : cis-엘리먼트 #5

SEQ ID NO : 22 : cis-엘리먼트 #6

SEQ ID NO : 23 : cis-엘리먼트 #7

SEQ ID NO : 24 : cis-엘리먼트 #8

SEQ ID NO : 25 : cis-엘리먼트 #9

SEQ ID NO : 26 : cis-엘리먼트 #10

SEQ ID NO : 27 : cis-엘리먼트 #11

SEQ ID NO : 28 : 5' 측에 BglII 인식 배열을 부가한, cis-엘리먼트 #5 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 29 : 3' 측에 HindIII 인식 배열을 부가한, cis-엘리먼트 #5 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 30 : 5' 측에 BglII 인식 배열을 부가한, cis-엘리먼트 #6 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 31 : 3'측에 HindIII 인식 배열을 부가한, cis-엘리먼트 #6 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 32 : cis-엘리먼트 #8 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 33 : cis-엘리먼트 #8 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 34 : cis-엘리먼트 #9 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 35 : cis-엘리먼트 #9 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 36 : cis-엘리먼트 #10 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 37 : cis-엘리먼트 #10 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 38 : 5' 측에 BglII 인식 배열을 부가한, cis-엘리먼트 #11 의 cis-엘리먼트를 포함하는 프라이머

SEQ ID NO : 39 : 3' 측에 HindIII 인식 배열을 부가한, cis-엘리먼트 #11 의 cis-엘리먼트를 포함하는 프라이머

독립행정법인 제품 평가 기술 기반 기구 특허 미생물 기탁 센터

NITEBP-01753

20131121

NITEBP-1535

20130213

NITEABP-01811

20140304

SEQUENCE LISTING <110> NIPPI, INCORPORATED <120> A method for producing a protein. <130> FA1238-14040PCT <150> JP2013-064357 <151> 2013-03-26 <150> JP2013-261178 <151> 2013-12-18 <160> 39 <170> PatentIn version 3.5 <210> 1 <211> 4623 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)..(4623) <400> 1 atg gat att tac gac act caa acc ttg ggg gtt gtg gtc ttt gga gga 48 Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Val Val Phe Gly Gly 1 5 10 15 ttc atg gtt gtt tct gcc att ggc atc ttc ctg gtg tcg act ttc tcc 96 Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser 20 25 30 atg aag gaa acg tca tat gaa gaa gcc cta gcc aac cag cgc aag gag 144 Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu 35 40 45 atg gcg aaa act cac cac cag aaa gtc gag aag aaa aag aag gag aaa 192 Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys 50 55 60 aca gtg gag aag aaa gga aag acc aag aaa aag gaa gag aaa cct aat 240 Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn 65 70 75 80 ggg aag ata cct gat cat gat cca gcc ccc aat gtg act gtc ctc ctt 288 Gly Lys Ile Pro Asp His Asp Pro Ala Pro Asn Val Thr Val Leu Leu 85 90 95 cga gaa cca gtg cgg gct cct gct gtg gct gtg gct cca acc cca gtg 336 Arg Glu Pro Val Arg Ala Pro Ala Val Ala Val Ala Pro Thr Pro Val 100 105 110 cag ccc ccc att atc gtt gct cct gtc gcc aca gtt cca gcc atg ccc 384 Gln Pro Pro Ile Ile Val Ala Pro Val Ala Thr Val Pro Ala Met Pro 115 120 125 cag gag aag ctg gcc tcc tcc ccc aag gac aaa aag aag aag gag aaa 432 Gln Glu Lys Leu Ala Ser Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys 130 135 140 aaa gtg gca aaa gtg gaa cca gct gtc agc tct gta gtg aat tcc atc 480 Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Ile 145 150 155 160 cag gtt ctc act tcg aag gct gcc atc ttg gaa act gct ccc aag gag 528 Gln Val Leu Thr Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu 165 170 175 gtg ccg atg gtg gtg gtg ccc cca gtg ggt gcc aag ggc aac aca cca 576 Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Gly Asn Thr Pro 180 185 190 gcc act ggc act act cag ggc aaa aag gcg gag ggg act cag aat caa 624 Ala Thr Gly Thr Thr Gln Gly Lys Lys Ala Glu Gly Thr Gln Asn Gln 195 200 205 agc aaa aag gct gaa gga gcc cca aac cag ggc aga aag gca gag gga 672 Ser Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Arg Lys Ala Glu Gly 210 215 220 acc cca aac cag ggc aaa aag aca gag gga acc cca aac caa ggg aaa 720 Thr Pro Asn Gln Gly Lys Lys Thr Glu Gly Thr Pro Asn Gln Gly Lys 225 230 235 240 aag gca gag gga acc cca aac caa ggc aaa aag gca gaa gga acc cca 768 Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro 245 250 255 aac caa ggc aaa aag gcg gag ggg gcc cag aac cag ggt aaa aag gta 816 Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val 260 265 270 gat aca acc cca aac cag ggg aaa aag gtg gag ggg gcc cca acc cag 864 Asp Thr Thr Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Pro Thr Gln 275 280 285 ggc aga aag gcc gag ggg gct cag aac cag gcc aaa aag gta gaa ggg 912 Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Ala Lys Lys Val Glu Gly 290 295 300 gcc cag aac cag ggc aaa aag gca gag ggg gcc cag aat cag ggc aaa 960 Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys 305 310 315 320 aag gga gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag 1008 Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln 325 330 335 aat cag ggc aag aag gcc gag ggg gcc cag aat cag ggc aag aag gcc 1056 Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala 340 345 350 gag ggg gcc cag aat cag ggc aag aag gcc gag ggg gcc cag aat cag 1104 Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln 355 360 365 ggc aag aag gct gag ggg gct cag aac cag ggc aaa aag gcc gag ggg 1152 Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly 370 375 380 gct cag aac cag ggc aaa aaa gta gaa ggg gcc cag aac cag ggc aag 1200 Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys 385 390 395 400 aag gct gag ggt gcc cag aac cag ggc aaa aag gcc gag ggg gcc cag 1248 Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln 405 410 415 aat cag ggc aaa aag gcc gag ggg gcc cag aac cag ggc aag aag gca 1296 Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala 420 425 430 gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag 1344 Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln 435 440 445 gac aag aag gcc gag ggg gcc cag aac cag ggc agg aag gcc gag ggg 1392 Asp Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly 450 455 460 gcc cag aac cag ggc agg aag gcc gag ggg gcc cag aac cag ggc aag 1440 Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys 465 470 475 480 aag gcc gag ggg gcc cag aac cag ggc aag aag gcc gag ggg acc ccg 1488 Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro 485 490 495 aac cag ggc aag aag gcc gag ggg acc ccg aac cag ggc aag aag gcc 1536 Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala 500 505 510 gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag 1584 Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln 515 520 525 ggc aag aag gcc gag ggg acc ccg aac cag ggc aag aag gcc gag ggg 1632 Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly 530 535 540 gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag ggc aag 1680 Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys 545 550 555 560 aag gcc gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag 1728 Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln 565 570 575 aac cag ggc aag aag gcc gag ggg gcc cag aac cag ggc aag aag gcc 1776 Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala 580 585 590 gag ggt gct cag aac cag ggc aaa aaa gta gaa ggg gcc cag aac cag 1824 Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln 595 600 605 ggc aag aag gct gag ggg gcc cag aac cag ggc aag aag gcc gag ggg 1872 Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly 610 615 620 gct cag aac cag ggc aaa aag gcc gag gga gcc cag aac cag ggc caa 1920 Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Gln 625 630 635 640 aaa gga gag gga gcc cag aat cag ggt aaa aag aca gaa ggg gct cag 1968 Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Thr Glu Gly Ala Gln 645 650 655 ggc aaa aag gca gaa agg agt ccc aac caa ggc aaa aaa gga gag gga 2016 Gly Lys Lys Ala Glu Arg Ser Pro Asn Gln Gly Lys Lys Gly Glu Gly 660 665 670 gct ccc atc cag ggc aaa aag gca gat tcg gtt gct aat cag ggc aca 2064 Ala Pro Ile Gln Gly Lys Lys Ala Asp Ser Val Ala Asn Gln Gly Thr 675 680 685 aag gta gag ggt att aca aac cag ggg aaa aaa gca gaa ggg tcc ccc 2112 Lys Val Glu Gly Ile Thr Asn Gln Gly Lys Lys Ala Glu Gly Ser Pro 690 695 700 agt gaa ggc aaa aag gca gaa ggg tcc ccc aac caa ggc aaa aag gca 2160 Ser Glu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln Gly Lys Lys Ala 705 710 715 720 gac gca gct gcc aat cag ggt aaa aag aca gag tca gct tct gtc cag 2208 Asp Ala Ala Ala Asn Gln Gly Lys Lys Thr Glu Ser Ala Ser Val Gln 725 730 735 ggc aga aat aca gat gtg gcc cag agc cca gag gca cca aag caa gag 2256 Gly Arg Asn Thr Asp Val Ala Gln Ser Pro Glu Ala Pro Lys Gln Glu 740 745 750 gct cct gcc aag aag aag tct ggt tca aag aaa aaa ggt gag cct ggg 2304 Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly Glu Pro Gly 755 760 765 ccc cca gat gcc gac ggc cct ctc tac ctc ccc tac aag acg ctg gtc 2352 Pro Pro Asp Ala Asp Gly Pro Leu Tyr Leu Pro Tyr Lys Thr Leu Val 770 775 780 tcc acg gtt ggg agc atg gtg ttc aac gag ggc gag gcc cag cgg ctc 2400 Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala Gln Arg Leu 785 790 795 800 atc gag atc ctg tcc gag aag gct ggc atc att cag gac acc tgg cac 2448 Ile Glu Ile Leu Ser Glu Lys Ala Gly Ile Ile Gln Asp Thr Trp His 805 810 815 aag gcc act cag aag ggt gac cct gtg gcg att ctg aaa cgc cag ctg 2496 Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys Arg Gln Leu 820 825 830 gaa gag aag gaa aaa ctg ctg gcc aca gaa cag gaa gat gcg gct gtc 2544 Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp Ala Ala Val 835 840 845 gcc aag agc aaa ctg agg gag ctc aac aag gag atg gca gca gaa aag 2592 Ala Lys Ser Lys Leu Arg Glu Leu Asn Lys Glu Met Ala Ala Glu Lys 850 855 860 gcc aaa gca gca gcc ggg gag gcc aaa gtg aaa aag cag ctg gtg gcc 2640 Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln Leu Val Ala 865 870 875 880 cgg gag cag gag atc acg gct gtg cag gca cgc atg cag gcc agc tac 2688 Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Met Gln Ala Ser Tyr 885 890 895 cgg gag cac gtg aag gag gtg cag cag ctg cag ggc aag atc cgg act 2736 Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys Ile Arg Thr 900 905 910 ctt cag gag cag ctg gag aat ggc ccc aac acg cag ctg gcc cgc ctg 2784 Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu Ala Arg Leu 915 920 925 cag cag gag aac tcc atc ctg cgg gat gcc ttg aac cag gcc acg agc 2832 Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln Ala Thr Ser 930 935 940 cag gtg gag agc aag cag aac gca gag ctg gcc aag ctt cgg cag gag 2880 Gln Val Glu Ser Lys Gln Asn Ala Glu Leu Ala Lys Leu Arg Gln Glu 945 950 955 960 ctc agc aag gtc agc aaa gag ctg gtg gag aag tca gag gct gtg cgg 2928 Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu Ala Val Arg 965 970 975 caa gat gag cag cag cgg aaa gct ctg gaa gcc aag gca gct gcc ttc 2976 Gln Asp Glu Gln Gln Arg Lys Ala Leu Glu Ala Lys Ala Ala Ala Phe 980 985 990 gag aag cag gtc ctg cag ctg cag gcg tcc cac agg gag agt gag gag 3024 Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Arg Glu Ser Glu Glu 995 1000 1005 gcc ctg cag aag cgc ctg gac gag gtc agc cgg gag ctg tgc cac 3069 Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu Cys His 1010 1015 1020 acg cag agc agc cac gcc agc ctc cgg gcg gat gcc gag aag gcc 3114 Thr Gln Ser Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys Ala 1025 1030 1035 cag gag caa cag cag cag atg gcc gag ctg cac agc aag tta cag 3159 Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln 1040 1045 1050 tcc tcc gag gca gag gtg cgc agc aaa tgc gag gag ctg agt ggc 3204 Ser Ser Glu Ala Glu Val Arg Ser Lys Cys Glu Glu Leu Ser Gly 1055 1060 1065 ctc cac ggg cag ctc cag gag gcc agg gcg gag aac tcc cag ctc 3249 Leu His Gly Gln Leu Gln Glu Ala Arg Ala Glu Asn Ser Gln Leu 1070 1075 1080 aca gag aga atc cgt tcc att gag gcc ctg ctg gag gcg ggc cag 3294 Thr Glu Arg Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln 1085 1090 1095 gcg cgg gat gcc cag gac gtc cag gcc agc cag gcg gag gct gac 3339 Ala Arg Asp Ala Gln Asp Val Gln Ala Ser Gln Ala Glu Ala Asp 1100 1105 1110 cag cag cag act cgc ctc aag gag ctg gag tcc cag gtg tcg ggt 3384 Gln Gln Gln Thr Arg Leu Lys Glu Leu Glu Ser Gln Val Ser Gly 1115 1120 1125 ctg gag aag gag gcc atc gag ctc agg gag gcc gtc gag cag cag 3429 Leu Glu Lys Glu Ala Ile Glu Leu Arg Glu Ala Val Glu Gln Gln 1130 1135 1140 aaa gtg aag aac aat gac ctc cgg gag aag aac tgg aag gcc atg 3474 Lys Val Lys Asn Asn Asp Leu Arg Glu Lys Asn Trp Lys Ala Met 1145 1150 1155 gag gca ctg gcc acg gcc gag cag gcc tgc aag gag aag ctg cac 3519 Glu Ala Leu Ala Thr Ala Glu Gln Ala Cys Lys Glu Lys Leu His 1160 1165 1170 tcc ctg acc cag gcc aag gag gaa tcg gag aag cag ctc tgt ctg 3564 Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys Gln Leu Cys Leu 1175 1180 1185 att gag gcg cag acc atg gag gcc ctg ctg gct ctg ctc cca gaa 3609 Ile Glu Ala Gln Thr Met Glu Ala Leu Leu Ala Leu Leu Pro Glu 1190 1195 1200 ctc tct gtc ttg gca caa cag aat tac acc gag tgg ctg cag gat 3654 Leu Ser Val Leu Ala Gln Gln Asn Tyr Thr Glu Trp Leu Gln Asp 1205 1210 1215 ctc aaa gag aaa ggc ccc acg ctg ctg aag cac ccg cca gct ccc 3699 Leu Lys Glu Lys Gly Pro Thr Leu Leu Lys His Pro Pro Ala Pro 1220 1225 1230 gcg gag cct tcc tcg gac ctg gcc tcc aag ttg agg gag gcc gag 3744 Ala Glu Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu 1235 1240 1245 gag acg cag agc aca ctg cag gcc gag tgt gac cag tac cgc agc 3789 Glu Thr Gln Ser Thr Leu Gln Ala Glu Cys Asp Gln Tyr Arg Ser 1250 1255 1260 atc ctg gcg gag acg gag ggc atg ctc aga gac ctg cag aag agc 3834 Ile Leu Ala Glu Thr Glu Gly Met Leu Arg Asp Leu Gln Lys Ser 1265 1270 1275 gtg gag gag gag gag cag gtg tgg agg gcc aag gtg ggc gcc gca 3879 Val Glu Glu Glu Glu Gln Val Trp Arg Ala Lys Val Gly Ala Ala 1280 1285 1290 gag gag gag ctc cag aag tcc cgg gtc aca gtg aag cat ctc gaa 3924 Glu Glu Glu Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu 1295 1300 1305 gag att gta gag aag cta aaa gga gaa ctt gaa agt tcg gac cag 3969 Glu Ile Val Glu Lys Leu Lys Gly Glu Leu Glu Ser Ser Asp Gln 1310 1315 1320 gtg agg gag cac acg tcg cat ttg gag gca gag ctg gaa aag cac 4014 Val Arg Glu His Thr Ser His Leu Glu Ala Glu Leu Glu Lys His 1325 1330 1335 atg gcg gcc gcc agc gcc gag tgc cag aac tac gcc aag gag gtg 4059 Met Ala Ala Ala Ser Ala Glu Cys Gln Asn Tyr Ala Lys Glu Val 1340 1345 1350 gca ggg ctg agg caa ctt ctc cta gaa tct caa tct cag ctc gat 4104 Ala Gly Leu Arg Gln Leu Leu Leu Glu Ser Gln Ser Gln Leu Asp 1355 1360 1365 gcc gcc aag agc gaa gcc cag aaa cag agc gat gag ctt gcc ctg 4149 Ala Ala Lys Ser Glu Ala Gln Lys Gln Ser Asp Glu Leu Ala Leu 1370 1375 1380 gtc agg cag cag ttg agt gaa atg aag agc cac gta gag gat ggt 4194 Val Arg Gln Gln Leu Ser Glu Met Lys Ser His Val Glu Asp Gly 1385 1390 1395 gac att gct ggg gcc cca gct tcc tcc cca gag gcg ccc cca gcc 4239 Asp Ile Ala Gly Ala Pro Ala Ser Ser Pro Glu Ala Pro Pro Ala 1400 1405 1410 gag cag gac ccc gtt cag ctg aag acg cag ctg gag tgg aca gaa 4284 Glu Gln Asp Pro Val Gln Leu Lys Thr Gln Leu Glu Trp Thr Glu 1415 1420 1425 gcc atc ctg gag gat gag cag aca cag cgg cag aag ctc acg gcc 4329 Ala Ile Leu Glu Asp Glu Gln Thr Gln Arg Gln Lys Leu Thr Ala 1430 1435 1440 gag ttt gag gag gct cag acc tcg gca tgt cgg tta caa gaa gaa 4374 Glu Phe Glu Glu Ala Gln Thr Ser Ala Cys Arg Leu Gln Glu Glu 1445 1450 1455 ttg gag aag ctc cgc aca gcc ggc ccc cta gag tct tca gaa aca 4419 Leu Glu Lys Leu Arg Thr Ala Gly Pro Leu Glu Ser Ser Glu Thr 1460 1465 1470 gag gag gcc tca cag ctg aag gag aga cta gaa aaa gag aag aag 4464 Glu Glu Ala Ser Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys 1475 1480 1485 tta aca agt gac ctg ggg cgc gcc gcc acg aga ctg cag gag ctt 4509 Leu Thr Ser Asp Leu Gly Arg Ala Ala Thr Arg Leu Gln Glu Leu 1490 1495 1500 ctg aag acg acc cag gag cag ctg gca agg gag aag gac acg gtg 4554 Leu Lys Thr Thr Gln Glu Gln Leu Ala Arg Glu Lys Asp Thr Val 1505 1510 1515 aag aag ctg cag gaa cag ctg gaa aag gca gag gac ggc agc agc 4599 Lys Lys Leu Gln Glu Gln Leu Glu Lys Ala Glu Asp Gly Ser Ser 1520 1525 1530 tca aag gag ggc acc tct gtc tga 4623 Ser Lys Glu Gly Thr Ser Val 1535 1540 <210> 2 <211> 1540 <212> PRT <213> Homo sapiens <400> 2 Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Val Val Phe Gly Gly 1 5 10 15 Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser 20 25 30 Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu 35 40 45 Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys 50 55 60 Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn 65 70 75 80 Gly Lys Ile Pro Asp His Asp Pro Ala Pro Asn Val Thr Val Leu Leu 85 90 95 Arg Glu Pro Val Arg Ala Pro Ala Val Ala Val Ala Pro Thr Pro Val 100 105 110 Gln Pro Pro Ile Ile Val Ala Pro Val Ala Thr Val Pro Ala Met Pro 115 120 125 Gln Glu Lys Leu Ala Ser Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys 130 135 140 Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Ile 145 150 155 160 Gln Val Leu Thr Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu 165 170 175 Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Gly Asn Thr Pro 180 185 190 Ala Thr Gly Thr Thr Gln Gly Lys Lys Ala Glu Gly Thr Gln Asn Gln 195 200 205 Ser Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Arg Lys Ala Glu Gly 210 215 220 Thr Pro Asn Gln Gly Lys Lys Thr Glu Gly Thr Pro Asn Gln Gly Lys 225 230 235 240 Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro 245 250 255 Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val 260 265 270 Asp Thr Thr Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Pro Thr Gln 275 280 285 Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Ala Lys Lys Val Glu Gly 290 295 300 Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys 305 310 315 320 Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln 325 330 335 Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala 340 345 350 Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln 355 360 365 Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly 370 375 380 Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys 385 390 395 400 Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln 405 410 415 Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala 420 425 430 Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln 435 440 445 Asp Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly 450 455 460 Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys 465 470 475 480 Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro 485 490 495 Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala 500 505 510 Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln 515 520 525 Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly 530 535 540 Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys 545 550 555 560 Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln 565 570 575 Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala 580 585 590 Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln 595 600 605 Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly 610 615 620 Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Gln 625 630 635 640 Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Thr Glu Gly Ala Gln 645 650 655 Gly Lys Lys Ala Glu Arg Ser Pro Asn Gln Gly Lys Lys Gly Glu Gly 660 665 670 Ala Pro Ile Gln Gly Lys Lys Ala Asp Ser Val Ala Asn Gln Gly Thr 675 680 685 Lys Val Glu Gly Ile Thr Asn Gln Gly Lys Lys Ala Glu Gly Ser Pro 690 695 700 Ser Glu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln Gly Lys Lys Ala 705 710 715 720 Asp Ala Ala Ala Asn Gln Gly Lys Lys Thr Glu Ser Ala Ser Val Gln 725 730 735 Gly Arg Asn Thr Asp Val Ala Gln Ser Pro Glu Ala Pro Lys Gln Glu 740 745 750 Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly Glu Pro Gly 755 760 765 Pro Pro Asp Ala Asp Gly Pro Leu Tyr Leu Pro Tyr Lys Thr Leu Val 770 775 780 Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala Gln Arg Leu 785 790 795 800 Ile Glu Ile Leu Ser Glu Lys Ala Gly Ile Ile Gln Asp Thr Trp His 805 810 815 Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys Arg Gln Leu 820 825 830 Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp Ala Ala Val 835 840 845 Ala Lys Ser Lys Leu Arg Glu Leu Asn Lys Glu Met Ala Ala Glu Lys 850 855 860 Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln Leu Val Ala 865 870 875 880 Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Met Gln Ala Ser Tyr 885 890 895 Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys Ile Arg Thr 900 905 910 Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu Ala Arg Leu 915 920 925 Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln Ala Thr Ser 930 935 940 Gln Val Glu Ser Lys Gln Asn Ala Glu Leu Ala Lys Leu Arg Gln Glu 945 950 955 960 Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu Ala Val Arg 965 970 975 Gln Asp Glu Gln Gln Arg Lys Ala Leu Glu Ala Lys Ala Ala Ala Phe 980 985 990 Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Arg Glu Ser Glu Glu 995 1000 1005 Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu Cys His 1010 1015 1020 Thr Gln Ser Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys Ala 1025 1030 1035 Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln 1040 1045 1050 Ser Ser Glu Ala Glu Val Arg Ser Lys Cys Glu Glu Leu Ser Gly 1055 1060 1065 Leu His Gly Gln Leu Gln Glu Ala Arg Ala Glu Asn Ser Gln Leu 1070 1075 1080 Thr Glu Arg Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln 1085 1090 1095 Ala Arg Asp Ala Gln Asp Val Gln Ala Ser Gln Ala Glu Ala Asp 1100 1105 1110 Gln Gln Gln Thr Arg Leu Lys Glu Leu Glu Ser Gln Val Ser Gly 1115 1120 1125 Leu Glu Lys Glu Ala Ile Glu Leu Arg Glu Ala Val Glu Gln Gln 1130 1135 1140 Lys Val Lys Asn Asn Asp Leu Arg Glu Lys Asn Trp Lys Ala Met 1145 1150 1155 Glu Ala Leu Ala Thr Ala Glu Gln Ala Cys Lys Glu Lys Leu His 1160 1165 1170 Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys Gln Leu Cys Leu 1175 1180 1185 Ile Glu Ala Gln Thr Met Glu Ala Leu Leu Ala Leu Leu Pro Glu 1190 1195 1200 Leu Ser Val Leu Ala Gln Gln Asn Tyr Thr Glu Trp Leu Gln Asp 1205 1210 1215 Leu Lys Glu Lys Gly Pro Thr Leu Leu Lys His Pro Pro Ala Pro 1220 1225 1230 Ala Glu Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu 1235 1240 1245 Glu Thr Gln Ser Thr Leu Gln Ala Glu Cys Asp Gln Tyr Arg Ser 1250 1255 1260 Ile Leu Ala Glu Thr Glu Gly Met Leu Arg Asp Leu Gln Lys Ser 1265 1270 1275 Val Glu Glu Glu Glu Gln Val Trp Arg Ala Lys Val Gly Ala Ala 1280 1285 1290 Glu Glu Glu Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu 1295 1300 1305 Glu Ile Val Glu Lys Leu Lys Gly Glu Leu Glu Ser Ser Asp Gln 1310 1315 1320 Val Arg Glu His Thr Ser His Leu Glu Ala Glu Leu Glu Lys His 1325 1330 1335 Met Ala Ala Ala Ser Ala Glu Cys Gln Asn Tyr Ala Lys Glu Val 1340 1345 1350 Ala Gly Leu Arg Gln Leu Leu Leu Glu Ser Gln Ser Gln Leu Asp 1355 1360 1365 Ala Ala Lys Ser Glu Ala Gln Lys Gln Ser Asp Glu Leu Ala Leu 1370 1375 1380 Val Arg Gln Gln Leu Ser Glu Met Lys Ser His Val Glu Asp Gly 1385 1390 1395 Asp Ile Ala Gly Ala Pro Ala Ser Ser Pro Glu Ala Pro Pro Ala 1400 1405 1410 Glu Gln Asp Pro Val Gln Leu Lys Thr Gln Leu Glu Trp Thr Glu 1415 1420 1425 Ala Ile Leu Glu Asp Glu Gln Thr Gln Arg Gln Lys Leu Thr Ala 1430 1435 1440 Glu Phe Glu Glu Ala Gln Thr Ser Ala Cys Arg Leu Gln Glu Glu 1445 1450 1455 Leu Glu Lys Leu Arg Thr Ala Gly Pro Leu Glu Ser Ser Glu Thr 1460 1465 1470 Glu Glu Ala Ser Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys 1475 1480 1485 Leu Thr Ser Asp Leu Gly Arg Ala Ala Thr Arg Leu Gln Glu Leu 1490 1495 1500 Leu Lys Thr Thr Gln Glu Gln Leu Ala Arg Glu Lys Asp Thr Val 1505 1510 1515 Lys Lys Leu Gln Glu Gln Leu Glu Lys Ala Glu Asp Gly Ser Ser 1520 1525 1530 Ser Lys Glu Gly Thr Ser Val 1535 1540 <210> 3 <211> 1275 <212> DNA <213> Homo sapiens <220> <221> CDS <222> (1)..(1275) <400> 3 atg gct gcc ggg ccg atc tcc gag cgg aat cag gat gcc act gtg tac 48 Met Ala Ala Gly Pro Ile Ser Glu Arg Asn Gln Asp Ala Thr Val Tyr 1 5 10 15 gtg ggg ggc ctg gat gag aag gtt agt gaa ccg ctg ctg tgg gaa ctg 96 Val Gly Gly Leu Asp Glu Lys Val Ser Glu Pro Leu Leu Trp Glu Leu 20 25 30 ttt ctc cag gct gga cca gta gtc aac acc cac atg cca aag gat aga 144 Phe Leu Gln Ala Gly Pro Val Val Asn Thr His Met Pro Lys Asp Arg 35 40 45 gtc act ggc cag cac caa ggc tat ggc ttt gtg gaa ttc ttg agt gag 192 Val Thr Gly Gln His Gln Gly Tyr Gly Phe Val Glu Phe Leu Ser Glu 50 55 60 gaa gat gct gac tat gcc att aag atc atg aac atg atc aaa ctc tat 240 Glu Asp Ala Asp Tyr Ala Ile Lys Ile Met Asn Met Ile Lys Leu Tyr 65 70 75 80 ggg aag cca ata cgg gtg aac aaa gca tca gct cac aac aaa aac ctg 288 Gly Lys Pro Ile Arg Val Asn Lys Ala Ser Ala His Asn Lys Asn Leu 85 90 95 gat gta ggg gcc aac att ttc att ggg aac ctg gac cct gag att gat 336 Asp Val Gly Ala Asn Ile Phe Ile Gly Asn Leu Asp Pro Glu Ile Asp 100 105 110 gag aag ttg ctt tat gat act ttc agc gcc ttt ggg gtc atc tta caa 384 Glu Lys Leu Leu Tyr Asp Thr Phe Ser Ala Phe Gly Val Ile Leu Gln 115 120 125 acc ccc aaa att atg cgg gac cct gac aca ggc aac tcc aaa ggt tat 432 Thr Pro Lys Ile Met Arg Asp Pro Asp Thr Gly Asn Ser Lys Gly Tyr 130 135 140 gcc ttt att aat ttt gct tca ttt gat gct tcg gat gca gca att gaa 480 Ala Phe Ile Asn Phe Ala Ser Phe Asp Ala Ser Asp Ala Ala Ile Glu 145 150 155 160 gcc atg aat ggg cag tac ctc tgt aac cgt cct atc acc gta tct tat 528 Ala Met Asn Gly Gln Tyr Leu Cys Asn Arg Pro Ile Thr Val Ser Tyr 165 170 175 gcc ttc aag aag gac tcc aag ggt gag cgc cat ggc tca gca gcc gaa 576 Ala Phe Lys Lys Asp Ser Lys Gly Glu Arg His Gly Ser Ala Ala Glu 180 185 190 cga ctt ctg gca gct cag aac ccg ctc tcc cag gct gat cgc cct cat 624 Arg Leu Leu Ala Ala Gln Asn Pro Leu Ser Gln Ala Asp Arg Pro His 195 200 205 cag ctg ttt gca gat gca cct cct cca ccc tct gct ccc aat cct gtg 672 Gln Leu Phe Ala Asp Ala Pro Pro Pro Pro Ser Ala Pro Asn Pro Val 210 215 220 gta tca tca ttg ggg tct ggg ctt cct cca cca ggc atg cct cct cct 720 Val Ser Ser Leu Gly Ser Gly Leu Pro Pro Pro Gly Met Pro Pro Pro 225 230 235 240 ggc tcc ttc cca ccc cca gtg cca cct cct gga gcc ctc cca cct ggg 768 Gly Ser Phe Pro Pro Pro Val Pro Pro Pro Gly Ala Leu Pro Pro Gly 245 250 255 ata ccc cca gcc atg ccc cca cca cct atg cct cct ggg gct gca gga 816 Ile Pro Pro Ala Met Pro Pro Pro Pro Met Pro Pro Gly Ala Ala Gly 260 265 270 cat ggc ccc cca tcg gca gga acc cca ggg gca gga cat cct ggt cat 864 His Gly Pro Pro Ser Ala Gly Thr Pro Gly Ala Gly His Pro Gly His 275 280 285 gga cac tca cat cct cac cca ttc cca ccg ggt ggg atg ccc cat cca 912 Gly His Ser His Pro His Pro Phe Pro Pro Gly Gly Met Pro His Pro 290 295 300 ggg atg tct cag atg cag ctt gca cac cat ggc cct cat ggc tta gga 960 Gly Met Ser Gln Met Gln Leu Ala His His Gly Pro His Gly Leu Gly 305 310 315 320 cat ccc cac gct gga ccc cca ggc tct ggg ggc cag cca ccg ccc cga 1008 His Pro His Ala Gly Pro Pro Gly Ser Gly Gly Gln Pro Pro Pro Arg 325 330 335 cca cca cct gga atg cct cat cct gga cct cct cca atg ggc atg ccc 1056 Pro Pro Pro Gly Met Pro His Pro Gly Pro Pro Pro Met Gly Met Pro 340 345 350 ccc cga ggg cct cca ttc gga tct ccc atg ggt cac cca ggt cct atg 1104 Pro Arg Gly Pro Pro Phe Gly Ser Pro Met Gly His Pro Gly Pro Met 355 360 365 cct ccg cat ggt atg cgt gga cct cct cca ctg atg ccc ccc cat gga 1152 Pro Pro His Gly Met Arg Gly Pro Pro Pro Leu Met Pro Pro His Gly 370 375 380 tac act ggc cct cca cga ccc cca ccc tat ggc tac cag cgg ggg cct 1200 Tyr Thr Gly Pro Pro Arg Pro Pro Pro Tyr Gly Tyr Gln Arg Gly Pro 385 390 395 400 ctc cct cca ccc aga ccc act ccc cgg cca cca gtt ccc cct cga ggc 1248 Leu Pro Pro Pro Arg Pro Thr Pro Arg Pro Pro Val Pro Pro Arg Gly 405 410 415 cca ctt cga ggc cct ctc cct cag taa 1275 Pro Leu Arg Gly Pro Leu Pro Gln 420 <210> 4 <211> 424 <212> PRT <213> Homo sapiens <400> 4 Met Ala Ala Gly Pro Ile Ser Glu Arg Asn Gln Asp Ala Thr Val Tyr 1 5 10 15 Val Gly Gly Leu Asp Glu Lys Val Ser Glu Pro Leu Leu Trp Glu Leu 20 25 30 Phe Leu Gln Ala Gly Pro Val Val Asn Thr His Met Pro Lys Asp Arg 35 40 45 Val Thr Gly Gln His Gln Gly Tyr Gly Phe Val Glu Phe Leu Ser Glu 50 55 60 Glu Asp Ala Asp Tyr Ala Ile Lys Ile Met Asn Met Ile Lys Leu Tyr 65 70 75 80 Gly Lys Pro Ile Arg Val Asn Lys Ala Ser Ala His Asn Lys Asn Leu 85 90 95 Asp Val Gly Ala Asn Ile Phe Ile Gly Asn Leu Asp Pro Glu Ile Asp 100 105 110 Glu Lys Leu Leu Tyr Asp Thr Phe Ser Ala Phe Gly Val Ile Leu Gln 115 120 125 Thr Pro Lys Ile Met Arg Asp Pro Asp Thr Gly Asn Ser Lys Gly Tyr 130 135 140 Ala Phe Ile Asn Phe Ala Ser Phe Asp Ala Ser Asp Ala Ala Ile Glu 145 150 155 160 Ala Met Asn Gly Gln Tyr Leu Cys Asn Arg Pro Ile Thr Val Ser Tyr 165 170 175 Ala Phe Lys Lys Asp Ser Lys Gly Glu Arg His Gly Ser Ala Ala Glu 180 185 190 Arg Leu Leu Ala Ala Gln Asn Pro Leu Ser Gln Ala Asp Arg Pro His 195 200 205 Gln Leu Phe Ala Asp Ala Pro Pro Pro Pro Ser Ala Pro Asn Pro Val 210 215 220 Val Ser Ser Leu Gly Ser Gly Leu Pro Pro Pro Gly Met Pro Pro Pro 225 230 235 240 Gly Ser Phe Pro Pro Pro Val Pro Pro Pro Gly Ala Leu Pro Pro Gly 245 250 255 Ile Pro Pro Ala Met Pro Pro Pro Pro Met Pro Pro Gly Ala Ala Gly 260 265 270 His Gly Pro Pro Ser Ala Gly Thr Pro Gly Ala Gly His Pro Gly His 275 280 285 Gly His Ser His Pro His Pro Phe Pro Pro Gly Gly Met Pro His Pro 290 295 300 Gly Met Ser Gln Met Gln Leu Ala His His Gly Pro His Gly Leu Gly 305 310 315 320 His Pro His Ala Gly Pro Pro Gly Ser Gly Gly Gln Pro Pro Pro Arg 325 330 335 Pro Pro Pro Gly Met Pro His Pro Gly Pro Pro Pro Met Gly Met Pro 340 345 350 Pro Arg Gly Pro Pro Phe Gly Ser Pro Met Gly His Pro Gly Pro Met 355 360 365 Pro Pro His Gly Met Arg Gly Pro Pro Pro Leu Met Pro Pro His Gly 370 375 380 Tyr Thr Gly Pro Pro Arg Pro Pro Pro Tyr Gly Tyr Gln Arg Gly Pro 385 390 395 400 Leu Pro Pro Pro Arg Pro Thr Pro Arg Pro Pro Val Pro Pro Arg Gly 405 410 415 Pro Leu Arg Gly Pro Leu Pro Gln 420 <210> 5 <211> 126 <212> DNA <213> Homo sapiens <400> 5 tcgtcggagc agacgggagt ttctcctcgg ggtcggagca ggaggcacgc ggagtgtgag 60 gccacgcatg agcggacgct aaccccctcc ccagccacaa agagtctaca tgtctagggt 120 ctagac 126 <210> 6 <211> 266 <212> DNA <213> Homo sapiens <400> 6 gcccgcgccg gctgtgctgc acagggggag gagagggaac cccaggcgcg agcgggaaga 60 ggggacctgc agccacaact tctctggtcc tctgcatccc ttctgtccct ccacccgtcc 120 ccttccccac cctctggccc ccaccttctt ggaggcgaca acccccggga ggcattagaa 180 ggatttttc ccgcaggttg cgaagggaag caaacttggt ggcaacttgc ctcccggtgc 240 gggcgtctct cccccaccgt ctcaac 266 <210> 7 <211> 27 <212> DNA <213> Homo sapiens <400> 7 tcgtcggagc agacgggagt ttctcct 27 <210> 8 <211> 32 <212> DNA <213> Homo sapiens <400> 8 ccaccttctt ggaggcgaca acccccggga gg 32 <210> 9 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #3. <400> 9 gatcttcgtc ggagcagacg ggagtttctc cta 33 <210> 10 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #3. <400> 10 agcttaggag aaactcccgt ctgctccgac gaa 33 <210> 11 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #4. <400> 11 gatcttctgc atcccttctg tccctccaca 30 <210> 12 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #4. <400> 12 agcttgtgga gggacagaag ggatgcagaa 30 <210> 13 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #2. <400> 13 aaaaaaagat ctgcccgcgc cggctgt 27 <210> 14 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #2. <400> 14 aaaaaaaagc ttgttgagac ggtggggga 29 <210> 15 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #1. <400> 15 aaaaaaagat cttcgtcgga gcagacg 27 <210> 16 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #1. <400> 16 aaaaaaaagc ttgtctagac cctagac 27 <210> 17 <211> 9 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (4)..(6) <223> "n" is a, c, g, or t <220> <221> misc_feature <222> (9)..(9) <223> "v" is a or g or c. <400> 17 gagnnnacv 9 <210> 18 <211> 10 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (4)..(7) <223> "n" is a, c, g, or t <220> <221> misc_feature <222> (10)..(10) <223> "v" is a or g or c. <400> 18 gagnnnnacv 10 <210> 19 <211> 11 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (4)..(8) <223> "n" is a, c, g, or t <220> <221> misc_feature <222> (11)..(11) <223> "v" is a or g or c. <400> 19 gagnnnnnac v 11 <210> 20 <211> 12 <212> DNA <213> Homo sapiens <220> <221> misc_feature <222> (4)..(9) <223> "n" is a, c, g, or t <220> <221> misc_feature <222> (12)..(12) <223> "r" is a or g <220> <221> misc_feature <222> (12)..(12) <223> "v" is a or g or c. <400> 20 gagnnnnnna cv 12 <210> 21 <211> 60 <212> DNA <213> Homo sapiens <400> 21 tcgtcggagc agacgggagt ttctcctcgg ggtcggagca ggaggcacgc ggagtgtgag 60 <210> 22 <211> 66 <212> DNA <213> Homo sapiens <400> 22 gccacgcatg agcggacgct aaccccctcc ccagccacaa agagtctaca tgtctagggt 60 ctagac 66 <210> 23 <211> 181 <212> DNA <213> Homo sapiens <400> 23 aacgggcgcc gcggcgggga gaagacgcag agcgctgctg ggctgccggg tctcccgctt 60 ccccctcctg ctccaagggc ctcctgcatg agggcgcggt agagacccgg acccgcgccg 120 tgctcctgcc gtttcgctgc gctccgcccg ggcccggctc agccaggccc cgcggtgagc 180 c 181 <210> 24 <211> 30 <212> DNA <213> Homo sapiens <400> 24 cagggggagg agagggaacc ccaggcgcga 30 <210> 25 <211> 32 <212> DNA <213> Homo sapiens <400> 25 gagcgggaag aggggacctg cagccacaac tt 32 <210> 26 <211> 60 <212> DNA <213> Homo sapiens <400> 26 cagggggagg agagggaacc ccaggcgcga gcgggaagag gggacctgca gccacaactt 60 <210> 27 <211> 113 <212> DNA <213> Homo sapiens <400> 27 tcgtcggagc agacgggagt ttctcctcgg ggtcggagca ggaggcacgc ggagtgtgag 60 gccacgcatg agcggacgct aaccccctcc ccagccacaa agagtctaca tgt 113 <210> 28 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #5. <400> 28 aaaaaaagat cttcgtcgga gcagacggga gt 32 <210> 29 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #5. <400> 29 aaaaaaaagc ttctcacact ccgcgtgcct cc 32 <210> 30 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #6. <400> 30 aaaaaaagat ctgccacgca tgagcggacg ct 32 <210> 31 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #6. <400> 31 aaaaaaaagc ttgtctagac cctagacatg ta 32 <210> 32 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #8. <400> 32 gatctcaggg ggaggagagg gaaccccagg cgcgaa 36 <210> 33 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #8. <400> 33 agctttcgcg cctggggttc cctctcctcc ccctga 36 <210> 34 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #9. <400> 34 gatctgagcg ggaagagggg acctgcagcc acaactta 38 <210> 35 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #9. <400> 35 agcttaagtt gtggctgcag gtcccctctt cccgctca 38 <210> 36 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #10. <400> 36 gatctcaggg ggaggagagg gaaccccagg cgcgagcggg aagaggggac ctgcagccac 60 aactta 66 <210> 37 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #10. <400> 37 agcttaagtt gtggctgcag gtcccctctt cccgctcgcg cctggggttc cctctcctcc 60 ccctga 66 <210> 38 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #11. <400> 38 aaaaaaagat cttcgtcgga gcagacggga gt 32 <210> 39 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> A primer for amprifying the portion of cis-element of cis-element #11. <400> 39 aaaaaaaagc ttacatgtag actctttgtg gc 32

Claims

세포에 있어서, p180 단백질의 전체 길이 또는 그 부분의 발현, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현, 또는 이들 양방의 발현이 모두 항진된, 세포 내에서의 목적물로서의 단백질의 합성능 또는 분비능이 항진된 재조합 세포.
제 1 항에 있어서,
p180 단백질이,
(a) 인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 과 적어도 70 ％ 의 배열 동일성을 갖는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(b) 인간 유래의 p180 단백질의 아미노산 배열 (SEQ ID NO : 2) 에 있어서, 1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가된 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(c) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 적어도 70 ％ 의 배열 동일성을 갖는 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질,
(d) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질, 및
(e) 인간 유래의 p180 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 1) 과 상보적인 뉴클레오티드 배열과, 스트린젠트한 조건하에서 하이브리다이즈 가능한 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, 세포 내의 소포체막 상에서의 폴리솜 형성을 촉진하는 기능을 갖는 단백질
로 이루어지는 군에서 선택되는, 재조합 세포.
제 1 항 또는 제 2 항에 있어서,
p180 단백질이 포유 동물 유래의 것인, 재조합 세포.
제 3 항에 있어서,
포유 동물의 p180 단백질의 전체 길이 또는 그 부분이, 인간 p180 단백질 (SEQ ID NO : 2), 마우스 p180 단백질 (GenBank Accession No. NP_077243), 래트 p180 단백질 (GenBank Accession No. XP_230637), 차이니즈 햄스터 p180 단백질 (GenBank Accession No. XM_003496471), 개 p180 단백질 (GenBank Accession No. NP_001003179), 말 p180 단백질 (GenBank Accession No. XP_001915027), 원숭이 p180 단백질 (GenBank Accession No. XP_002798281), 침팬지 p180 단백질 (GenBank Accession No. XP_514527), 돼지 p180 단백질 (GenBank Accession No. XP_001926148), 또는 그들의 부분인, 재조합 세포.
제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
p180 단백질의 부분이, SEQ ID NO : 2 로 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 623 ∼ 737 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분, 738 ∼ 944 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열, 945 ∼ 1540 번 아미노산으로 이루어지는 영역에 대응하는 아미노산 배열을 포함하는 부분에서 선택되는, 재조합 세포.
제 1 항 내지 제 5 항 중 어느 한 항에 있어서,
mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질이, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분 (SEQ ID NO : 4 의 전체 길이 아미노산 배열 424 AA ; RRM1 인 SEQ ID NO : 4 의 13 ∼ 91 AA ; .RRM2 인 SEQ ID NO : 4 의 100 으로 이루어지는 군에서 선택되는, 재조합 세포.
제 6 항에 있어서,
SF3b4 단백질이,
(i) 인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 과 적어도 70 ％ 의 배열 동일성을 갖는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(ii) 인간 유래의 SF3b4 단백질의 아미노산 배열 (SEQ ID NO : 4) 에 있어서, 1 또는 몇 개의 아미노산이 결실, 치환, 또는 부가된 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(iii) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 적어도 70 ％ 의 배열 동일성을 갖는 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(iv) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 에 있어서, 1 또는 몇 개의 뉴클레오티드가 결실, 치환, 또는 부가된 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질,
(v) 인간 유래의 SF3b4 단백질을 코드하는 유전자의 뉴클레오티드 배열 (SEQ ID NO : 3) 과 상보적인 뉴클레오티드 배열과, 스트린젠트한 조건하에서 하이브리다이즈 가능한 뉴클레오티드 배열에 의해 규정되는 아미노산 배열로 이루어지고, mRNA 의 소포체에의 국재화를 촉진시키는 기능을 갖는 단백질
로 이루어지는 군에서 선택되는, 재조합 세포.
제 6 항 또는 제 7 항에 있어서,
SF3b4 단백질이 포유 동물 유래의 것인, 재조합 세포.
제 8 항에 있어서,
포유 동물의 SF3b4 단백질의 전체 길이 또는 그 부분이, 인간 SF3b4 단백질 (SEQ ID NO : 4), 마우스 SF3b4 단백질 (GenBank Accession No. NP_694693.1), 래트 SF3b4 단백질 (GenBank Accession No. NP_001011951.1), 차이니즈 햄스터 SF3b4 단백질 (GenBank Accession No. XP_003498680.1), 개 SF3b4 단백질 (GenBank Accession No. XP_540295.3), 말 SF3b4 단백질 (GenBank Accession No. XP_001488649.2), 원숭이 SF3b4 단백질 (GenBank Accession No. NP_001097793.1), 침팬지 SF3b4 단백질 (GenBank Accession No. XP_513768.2), 돼지 SF3b4 단백질 (GenBank Accession No. XP_001926524.1), 또는 그들의 부분인, 재조합 세포.
제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
목적물로서의 단백질의 합성능 또는 분비능이, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시킴으로써 항진된, 재조합 세포.
수탁 번호 NITE BP-01753 (CHO 3D5), 수탁 번호 NITE BP-1535 (CHO YA7), 또는 수령 번호 NITE ABP-01811 (CHO 1B2) 에 의해 나타내는, 세포주.
p180 단백질의 전체 길이 또는 그 부분의 발현을 항진시키고, mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질의 발현을 항진시키고, 또는 이들 단백질 양방의 발현을 항진시킨 재조합 세포에 있어서, 목적물로서의 단백질을 코드하는 핵산 분자를 형질 전환하거나 또는 목적물로서의 단백질의 산생량을 증가시키는 것에 의한, 목적물로서의 단백질을 제조하는 방법.
제 12 항에 있어서,
p180 단백질이 포유 동물 유래의 것인, 방법.
제 13 항에 있어서,
포유 동물의 p180 단백질의 전체 길이 또는 그 부분이, 인간 p180 단백질 (SEQ ID NO : 2), 마우스 p180 단백질 (GenBank Accession No. NP_077243), 래트 p180 단백질 (GenBank Accession No. XP_230637), 차이니즈 햄스터 p180 단백질 (GenBank Accession No. XM_003496471), 개 p180 단백질 (GenBank Accession No. NP_001003179), 말 p180 단백질 (GenBank Accession No. XP_001915027), 원숭이 p180 단백질 (GenBank Accession No. XP_002798281), 침팬지 p180 단백질 (GenBank Accession No. XP_514527), 돼지 p180 단백질 (GenBank Accession No. XP_001926148), 또는 그들의 부분인, 방법.
제 13 항 또는 제 14 항에 있어서,
포유 동물의 p180 단백질의 부분이, SEQ ID NO : 2 에 나타내는 아미노산 배열을 갖는 단백질 (인간 p180 단백질) 의 27 ∼ 157 번 아미노산으로 이루어지는 영역을 포함하는 부분, 623 ∼ 737 번 아미노산으로 이루어지는 영역을 포함하는 부분, 738 ∼ 944 번 아미노산으로 이루어지는 영역을 포함하는 부분, 945 ∼ 1540 번 아미노산으로 이루어지는 영역을 포함하는 부분에서 선택되는, 방법.
제 12 항 내지 제 15 항 중 어느 한 항에 있어서,
mRNA 의 소포체 (ER) 국재화를 촉진하는 단백질이, 스플라이싱 인자 3B 서브유닛 4 (SF3b4) 단백질의 전체 길이 또는 그 부분 (SEQ ID NO : 4 의 전체 길이 아미노산 배열 424 AA ; RRM1 인 SEQ ID NO : 4 의 13 ∼ 91 AA ; .RRM2 인 SEQ ID NO : 4 의 100 으로 이루어지는 군에서 선택되는, 방법.
제 16 항에 있어서,
SF3b4 단백질이 포유 동물 유래의 것인, 방법.
제 17 항에 있어서,
포유 동물의 SF3b4 단백질의 전체 길이 또는 그 부분이, 인간 SF3b4 단백질 (SEQ ID NO : 4), 마우스 SF3b4 단백질 (GenBank Accession No. NP_694693.1), 래트 SF3b4 단백질 (GenBank Accession No. NP_001011951.1), 차이니즈 햄스터 SF3b4 단백질 (GenBank Accession No. XP_003498680.1), 개 SF3b4 단백질 (GenBank Accession No. XP_540295.3), 말 SF3b4 단백질 (GenBank Accession No. XP_001488649.2), 원숭이 SF3b4 단백질 (GenBank Accession No. NP_001097793.1), 침팬지 SF3b4 단백질 (GenBank Accession No. XP_513768.2), 돼지 SF3b4 단백질 (GenBank Accession No. XP_001926524.1), 또는 그들의 부분인, 방법.
제 12 항 내지 제 18 항 중 어느 한 항에 있어서,
재조합 세포가, 수탁 번호 NITE BP-01753 (CHO 3D5), 수탁 번호 NITE BP-1535 (CHO YA7), 또는 수령 번호 NITE ABP-01811 (CHO 1B2) 에 의해 나타내는 세포주인, 방법.
제 12 항 내지 제 19 항 중 어느 한 항에 있어서,
목적물로서의 단백질이, 당단백질인, 방법.
제 20 항에 있어서,
목적물로서의 단백질이, 콜라겐, 피브로넥틴 또는 항체인, 방법.
목적물로서의 단백질을 발현하기 위한 발현 유닛 중, 프로모터의 하류이고 또한 목적물로서의 단백질을 코드하는 DNA 의 뉴클레오티드 배열의 개시 코돈의 상류에, RNA 결합 단백질이 인식/결합 (혹은 상호작용) 하는 cis-엘리먼트를 삽입함으로써, 발현계 세포 내에 있어서의 목적물로서의 단백질의 발현량을 증대시키는 방법.
제 22 항에 있어서,
cis-엘리먼트가, RNA 인식 모티프 (RRM) 형 RNA 결합 단백질이 인식/결합 (혹은 상호작용) 하는 것인, 방법.
제 23 항에 있어서,
cis-엘리먼트가, SF3b4 단백질의 RNA 인식 모티프 (RRM) 가 인식/결합 (혹은 상호작용) 하는 것인, 방법.
제 22 항 내지 제 24 항 중 어느 한 항에 있어서,
cis-엘리먼트의 뉴클레오티드 배열이, 1 또는 몇 개의 9 mer ∼ 12 mer 의 배열 모티프 GAN₁-(X)_n-ACN₂ (n = 3 ∼ 6) (N₁ 및 N₂ 는 독립적으로 A, T, C, G 의 어느 뉴클레오티드여도 된다) 를 포함하는 것인, 방법.
제 25 항에 있어서,
cis-엘리먼트의 뉴클레오티드 배열이, 1 또는 몇 개의 9 mer ∼ 12 mer 의 배열 모티프 GAG-(X)_n-ACV (n = 3 ∼ 6) (V 는 A 또는 G 또는 C 를 나타낸다), SEQ ID NO : 17 ∼ 20) 를 포함하는 것인, 방법.
제 22 항 내지 제 26 항 중 어느 한 항에 있어서,
cis-엘리먼트의 뉴클레오티드 배열이, 타입 I 콜라겐 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 피브로넥틴 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 매트릭스 메탈로프로테아제 14 (MMP14) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A2 (P4HA2) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열, 프롤릴 4-하이드록시라아제 A1 (P4HA1) 유전자의 5' 비번역 영역의 뉴클레오티드 배열에서 유래하는 배열로 이루어지는 군에서 선택되는 배열인, 방법.
제 22 항 내지 제 27 항 중 어느 한 항에 있어서,
cis-엘리먼트의 뉴클레오티드 배열이, SEQ ID NO : 5 의 전체 길이 또는 SEQ ID NO : 7 의 전체 길이 외, SEQ ID NO : 5 중 1 ∼ 102 번 뉴클레오티드, 1 ∼ 78 번 뉴클레오티드, 1 ∼ 60 번 뉴클레오티드, 61 ∼ 126 번 뉴클레오티드, 16 ∼ 57 번 뉴클레오티드, 79 ∼ 126 번 뉴클레오티드, 103 ∼ 126 번 뉴클레오티드, 58 ∼ 78 번 뉴클레오티드, 51 ∼ 78 번 뉴클레오티드, 1 ∼ 27 번 뉴클레오티드, 70 ∼ 78 번 뉴클레오티드로 이루어지는 군에서 선택되는 어느 배열인, 방법.
제 22 항 내지 제 28 항 중 어느 한 항에 있어서,
발현계 세포가, 손상되지 않은 숙주 세포, p180 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, SF3b4 단백질의 전체 길이 또는 그 부분의 발현이 항진된 세포, 또는 이들 양방의 발현이 모두 항진된 세포인, 방법.
SF3b4 를 기능 저해 또는 발현 억제함으로써, 콜라겐 합성을 억제하고, 이상 콜라겐에 의한 폐포 상피, 섬유증의 중증화를 방지하기 위한 의약 조성물.