본 발명은 인 시스(in cis)에서 유전자의 전사에 영향을 주는 능력을 포함하는 DNA 서열('DNA 분자'라고도 함)에 관한 것이다. 전형적으로, 반드시 그렇지는 않지만, 연구된 서열은 기능적인 단백질로 스스로 코딩되지는 않는다. 인 시스에서 유전자 전사에 영향을 미치는 능력을 갖는 다양한 서열 요소가 동정되고 있다. 이들 요소는 프로모터, 인핸서(enhancer), 사일렌서(silencer)에서 경계 요소 및 매트릭스 첨부 영역까지의 범위이다.
조절 서열의 매우 많고 다른 형태가 발견되고 있다는 사실은 효과적인 발현 카세트를 고안하는 것이 매우 쉽다는 인상은 준다. 하지만, 그렇지 않은 것이 사실이다. 발현 카세트가 아직도 시행착오에 의해 종종 유도된다. 표적 세포 또는 그것의 자손에서 외부 유전자의 어떠한 종류의 발현을 얻는 것은 종종 가능하다. 하지만, 발현 카세트가 표적세포에 나타날 수 있는 발현의 지속성 또는 발현의 수준을 어느 정도의 정확성을 갖고 예상하는 것이 흔히 어렵다는 것이다.
본 발명은 다른 수단 및 방법 중에서 새로운 전사 조절 요소를 단리하고 탐지하기 위한 수단 및 방법을 제공한다. 유전자 전사-조절 성질을 가진 DNA 서열을 탐지하고, 그리고 임의로 선별하는 방법이 제공되고, 이것은 다양한 단편을 포함하는 벡터를 갖는 전사계를 제공하는 것으로, 상기 벡터는 ⅰ) 유전자 전사 억제 성질을 갖는 요소, 및 ⅱ) 리포터(reporter) 유전자의 전사를 이끄는 프로모터를 포 함하고, 상기 방법은 또한 상기 유전자 전사 조정 성질을 갖는 상기 DNA 서열을 동정하기 위해서 상기 전사계에 선별 단계를 수행하는 것을 포함한다. 바람직한 구현예에서, 상기 단편은 ⅰ) 유전자 전사 억제 성질을 갖는 상기 요소 및 ⅱ) 상기 리포터 유전자의 전사를 이끄는 상기 프로모터 사이에 위치한다. RNA 폴리머라제는 프로모터라 칭하는, RNA 합성이 시작하는 위치를 신호하는 특정 서열에 결합한 후 전사 공정을 개시한다. 조정 성질은 주어진 세포형 및 또는 주어진 프로모터에서 인 시스에서의 상기 프로모터로부터 전사를 증대시킬 수 있다. 이러한 DNA 서열은 세포의 한 유형에서 또는 프로모터의 한 유형을 갖는 증대 성질을 포함할 수 있지만, 그것은 세포의 또 다른 유형에서 또는 프로모터의 또 다른 유형을 갖는, 또 다른 유전자 전사 조정 성질을 포함할 수 있거나 또는 전혀 포함하지 않을 수 있다. 전사는 특정 프로모터의 전사 상에 조절 요소(또는 그것에 결합하는 단백질)의 직접적인 영향을 받을 수 있다. 하지만, 전사는 또한 예를 들어, 조절 요소가 하나 이상의 다른 조절 요소의 기능에 영향을 줄 수 있기 때문에, 간접적으로 영향받을 수 있다. 유전자 전사 조정 성질은 또한 안정한 유전자 전사 성질을 포함할 수 있다. 안정하다는 것은 관찰된 전사 수준이 30번의 세포 분화에서도 현저하게 변화하지는 않는다는 것을 의미한다. 안정한 성질은 발현 특성이 여러번의 세포 분화에 걸쳐 예측가능하여야만 한다는 상황에서 유용할 것이다.
전형적인 예는 외부 유전자로 트랜스펙션된 세포주이다. 다른 예로는 트랜스제닉 동물 및 식물 그리고 유전자 치료요법이 있다. 매우 흔하게, 도입된 발현 카세트는 세포 분화수 또는 식물 또는 동물 세대수 증가 후 다르게 기능한다. 바람직 한 구현예에서, 안정한 성질은 트랜스제닉 식물 또는 동물의 뒤이은 생성에서 유전자 전사를 유지하는 성질을 포함한다. 물론, 발현이 유도적인 경우에는 상기 성질은 트랜스제닉 식물 또는 동물의 뒤이은 생성에서 발현의 유도성을 유지하는 성질을 포함한다. 빈번하게, 발현 수준은 세포 분화의 횟수가 증가하면서 급격하게 떨어진다. 본 발명의 방법으로 세포 분화의 횟수가 증가하면서도 전사 수준에서의 급격한 하락을, 적어도 부분적으로 억제하는 능력이 있는 DNA 서열을 탐지하고 임의로 선별하는 것이 가능하다. 그러므로, 바람직한 구현예에서, 상기 유전자 전사 조정 성질은 안정한 유전자 전사 성질을 포함한다. 인상적으로, 상기 안정한 유전자 전사 성질을 갖는 DNA 서열을 포함하는 단편은 본 발명의 방법이 전사의 장기간 안정성을 필수적으로 측정하지는 않는다는 사실에도 불구하고, 본 발명의 방법으로 탐지되고 임의로 선별될 수 있다. 본 발명의 바람직한 구현예에서, 상기 유전자 전사 조정 성질은 안정한 유전자 전사를 증대시키는 성질을 포함한다. 관심의 유전자를 갖는 발현 벡터에서 유전자 전사 조정 성질을 갖는 DNA 서열의 혼입이 세포의 게놈에서 발현 벡터의 통합에서, 상기 관심의 유전자의 전사의 더 높은 수준을 가져다 준다는 것, 더구나 상기 더 높은 발현 수준이 또한 유전자 전사 조정 성질을 갖는 상기 DNA 서열의 비존재에서 더욱 안정하다는 것이 관찰되고 있다. 세포의 게놈으로 관심의 유전자를 유도하고 상기 관심의 유전자의 발현을 얻기 위하여 고안된 실험에서, 하기와 같이 알아 냈다. 상기 관심의 유전자와 함께 유전자 전사 조정 성질을 갖는 DNA 서열이 도입된다면, 더 많은 클론이, 상기 DNA 서열이 상기 관심의 유전자와 함께 도입되지 않는 경우보다도, 상기 관심의 유전자 생성물의 어떠 한 양보다 더욱 많이 발현하는 것이 탐지될 수 있다. 그러므로, 본 발명은 또한, 세포의 게놈으로 상기 관심의 유전자를 제공하면서, 관심의 유전자의 유전자 생성물의 어떤 수준 이상으로 발현하는 세포의 수를 증가시키는 방법으로 제공한다. 상기 방법은 상기 관심의 유전자와 함께 유전자 전사 조정 성질을 포함하는 DNA 서열을 갖는 상기 세포를 제공하는 것을 포함한다.
유전자 전사 조정 성질을 갖는 단편을 탐지하는 가능성은 단편이 유도되는 근원에 따라 다양하다. 전형적으로, 상기 성질을 갖는 단편의 존재 또는 비존재에 관한 이전의 정보는 없다. 그런 상황에서, 많은 단편은 유전자 전사 조정 성질을 갖는 DNA 서열을 포함하지 않을 것이다. 이러한 상황에서, 상기 성질을 갖는 DNA 서열을 위한 형식적인 선별이 도입되었다. 이것은 상기 리포터 유전자의 생성물의 특징에 기초한 상기 서열을 포함하는, 선호적으로 또는 적대적으로 선별될 수 있는 선별 벡터에 의해 이루어진다. 예를 들어, 상기 유전자 생성물은 형광 또는 색상 피복(예를 들어, 형광 단백질 및 유도체, 루시페라제 또는 알칼리성 포스파타제)을 유도하거나 또는 항생물질의 저항을 비교하거나 세포자멸사 또는 세포 죽음을 유도한다.
본 발명의 방법은 특히 유전자 전사를 증대하는 성질을 갖는 DNA 서열을 탐지하고 임의로 선별하는 것에 적합하다. 관심의 유전자를 포함하는 발현 벡터로 혼힙되는 경우에, 적어도 어느 정도의 선별된 DNA는 벡터가 유전자 전사 억제 성질을 갖는 요소를 포함하지 않는 때에 조차도 숙주세포에서 상기 관심의 유전자의 유전자 전사를 급격히 증가시킬 수 있다. 이 유전자 전사를 증대하는 성질은 외부 유전 자로 트랜스펙션된 세포주에서 또는 트렌스제닉 동물 및 식물에서 매우 유용하다.
상기 전사계는 세포가 없는 인 비트로 전사계일 수 있다. 자동화에서 현재의 전문적인 지식으로, 이러한 세포가 없는 시스템은 정확할 수 있고, 빠를 수 있다. 하지만, 본 발명의 경우에, 상기 전사계는 바람직하게는 숙주세포를 포함한다. 숙주세포의 사용은 단편이 세포에서 활동적으로 탐지되고 임의로 선별되는 것은 보장한다.
유전자 전사 억제 성질을 갖는 요소는, 본 발명의 방법에서, 사용된 전사계에서의 프로모터로부터 전사를 억제할 것이다. 상기 억제는 탐지할 수 없는 발현 수준을 이끌지는 않는다. 억제의 존재 또는 비존재에서 발현 수준에서의 차이를 탐지할 수 있고, 임의로 선별할 수 있다는 것이 중요하다. 바람직한 구현예에서, 상기 벡터에서의 유전자 전사 억제는 유전자 전사 억제 염색질로 귀착된다. 이 바람직한 구현예에서, DNA 서열은 탐지될 수 있고, 임의로 선별될 수 있고, 유전자 전사 억제 염색질의 형성을 적어도 부분적으로 대항하는 능력이 있다. 하나의 관점에서, 유전자 전사 억제 염색질의 형성에 적어도 부분적으로 대항할 수 있는 DNA 서열은 안정한 유전자 전사 성질을 포함한다. 바람직한 구현예에서 유전사 전사 억제에 관계된 DNA 서열은 단백질 복합체에 의하여 인식되는 DNA 서열이고, 상기 전사계는 상기 복합체를 포함한다. 바람직하게는, 상기 복합체는 HP1을 포함하는 이종염색질-결합 단백질, Polycomb-그룹(Pc-G) 단백질, 히스톤 디아세틸라제 활성 또는 MeCP2(메틸-CpG-결합 단백질)을 포함한다. 많은 유기체는 하나 이상의 이들 단백질을 포함한다. 이들 단백질은 빈번하게 다른 종에서도 또한 활성을 나타낸다. 그러 므로, 상기 복합체는 또한 둘 이상의 종류로부터 단백질을 포함한다. 알려진 염색질-연관된 단백질 복합체의 언급된 세트는 많은 염기쌍에 걸쳐서 장기적인 억제를 전달할 수 있다. 상기 복합체는 또한 유전자의 억제된 상태를 세포 분화에서의 딸세포로 안정하게 이동하는 것에 관련된다. 이 방법에서 선별된 서열은 많은 염기쌍에 걸친 장기적인 항-억제를 전달할 수 있다(van der Vlag et al., 2000).
사용된 벡터는 클로닝 DNA에 적합한 벡터 및 전사계에서 사용될 수 있는 벡터이다. 숙주세포가 사용되는 경우, 상기 벡터는 에피솜성으로 복제하는 벡터이다. 이러한 방법으로, 벡터 통합 부위가 다름으로 인한 영향은 피하여진다. 통합 부위에서의 DNA 요소를 플랭킹(flanking)하는 상기 벡터는 프로모터의 전사의 수준에서 효과를 가질 수 있고, 그것으로 인하여 유전자 전사 조정 성질을 갖는 DNA 서열을 포함하는 단편의 의태효과를 가질 수 있다. 바람직한 구현예에서, 상기 벡터는 Epstein-Barr 바이러스(EBV), OriP 및 핵 항원(EBNA-1)으로부터의 복제 기원을 포함한다. 이러한 벡터는 많은 종류의 진핵 세포에서 복제가 가능하고, 적절한 조건하에서 염색질로 회합할 수 있다.
또 다른 관점에서, 본 발명은 ⅰ) 식물, 척추동물에서 단리된 DNA 서열 또는 그것의 유도체, 또는 ⅱ) 합성 DNA 서열 또는 유전공학에 의하여 구성된 것을 포함하고, 여기서 DNA 서열은 억제를 금지하는 서열이고, 본 발명의 방법에 따라서 탐지되고 선별되고 임의로 클로닝되는 것을 포함하는 DNA 서열을 제공한다. 또 다른 관점에서, 본 발명은 ⅰ) 식물 또는 척추동물로부터 단리된 DNA 서열 또는 그것의 유도체, 또는 ⅱ) 합성 DNA 서열 또는 유전공학에 의하여 구성된 것, 여기서 DNA 서열은 본 발명의 방법으로써 탐지되고 선별되고 그리고 임의로 클로닝되는 것을 포함하는 DNA 서열을 제공한다. 바람직하게는, 상기 DNA 서열은 표 4A에서 나타낸 바와 같은 서열 또는 그것의 기능성 상동물을 포함한다. 표 4에서 나타낸 바와 같은 서열의 기능성 상동물은 표 4(표 4A 또는 표 4B에 있는)에 주어진 정보로 유도된 서열이다. 예를 들면, 서열에 또는 서열로부터 결실하고, 조정하고, 및/또는 염기를 삽입하는 것으로 표 4에서의 서열로부터 유도될 수 있는 서열은 표 4에서 나타내었고, 여기서 상기 유도된 서열은, 필연적으로 양에서는 아니지만, 표 4에서 나타낸 바와 같은 종류의 서열에 동일한 활성을 포함한다. 기능성 상동물은 추가적으로 표 4에서 나타낸 둘 이상의 서열로부터의 일부분을 포함하는 서열이다. 합성 DNA 서열은 유기체에서 존재하는 서열로부터 직접적으로 또는 간접적으로 유도되지 않는 서열이다. 예를 들면, 드로소필라 scs 또는 scs 서열을 포함하는 서열은, scs 또는 scs 서열이 인공적으로 생성되는 경우에서도, 합성 서열이 아니다.
하나의 관점에서, 본 발명은 더욱 고차의 유전자 조절에 대하여 증가되는 지식에 관계되고, 이 지식을 사용하는 수단 및 방법에 관계된다. 고전적인 프로모터 및 인핸서와 같은 요소가 단일 유전자의 전사를 이끌고 조절하는 것으로 특성화되는 반면에, 염색체 영역 전체의 유전자 전사 능력을 지배하는 더욱 고차의 조절 요소는 아직까지 거의 관심을 받지 못하고 있다. 이러한 더욱 고차원의 요소에 관한 우리 지식의 대부분은 배태발육에 관한 연구에서 비롯된다. 배태발육에서, 세포는 다른 발달의 대사 경로에 의존하게 된다. 의존하는 즉시, 세포는, 많은 세포 분화후에서조차, 거의 그들의 운명이 변하지 않는다.
세포 유형 특이적인 유전자 전사 패턴의 안정한 전송은 프로모터의 환경에 의존하지 않지만, 대신에 DNA 및, 염색질이라 칭하는, 연관된 단백질의 구조에서의 변화에 의해 중재된다. 염색체 수준에서의 유전자 조절은 DNA(예를 들어, 메틸화), 히스톤(예를 들어, 아세틸화 및/또는 메틸화)의 변경을 포함하고, 원거리의 염색체 요소 사이의 장기적인 상호작용을 포함한다.
염색질 주형은 DNA, 히스톤 및 비히스톤 단백질의 고도로 축합된 복합체이고, 핵으로 게놈 전체를 일괄할 수 있고, 동시에 특정 유전자의 적절한 전사를 가능하게 한다. 진핵세포 염색체는 유전자 전사의 활성화에 대한 균일한 주형이 아니다. 염색질 및 염색질 영역의 다른 유형은 구분될 수 있고, 차별적으로 유전자 전사에 영향을 준다. 소위 이종염색질 영역은 '밀폐된' 염색질 구조를 동정하는 반면에, 진정염색질은 더욱 분산되고 '개방된' 염색질 구조와 연관된다. 진정염색질 영역은 조건적인 이종염색질 및 진정염색질로서 인용된, 다소간의 축합된 구조로 나타나는, 구조 변화에 직면할 수 있다. 조건적인 진정염색질 또는 이종염색질의 형성은, 세포 유형 특정한 방법에서, 활성의 또는 억제의 상태에서 유전자를 간직하는, 염색질-중재된 유전자 조절의 내재하는 메카니즘을 나타내는 것으로 믿어진다.
모든 진핵세포에서, 여러 염색질-관련된 단백질 복합체는 세포 유형 특이성의 보전에 관련된 것으로 동정되고 있고, 그 중 하나는 Polycomb 그룹(PcG) 복합체이다. PcG 복합체는 유전자의 안정한 억제에 관련이 있고, 염색질 구조에서의 변화는 상당한 역할을 수행하는 것으로 믿어진다. 유사하게는, 트리토락스 그룹(TrG)으로 명명된, 단백질의 이차 분류는 PcG 단백질의 작동에 반작용하는 것으로 동정되 고 있다. TrG 단백질은 유전자 전사의 보전에 관련된다. 그들의 작동에 대한 각각의 방식에 기초하여, PcG 및 TrG 단백질은 유전자 전사 패턴의 상속가능한 전송에 대하여 상당한, 세포의 기억 시스템을 나타낸다.
PcG 및 TrG 복합체가 그들의 표적 유전자와 어떻게 연관되는지는 아직까지 불분명하다. 유전학 연구는 유전자의 비활성 상태를 전사적으로 보전하는 cis-작용 조절 서열을 특성화하고 있다. 이들 cis-작용 조절 서열에 의해 중재되는 침묵(silencing)은 기능성 PcG 단백질의 존재에 의존하므로, 이들 서열은 PcG 감응 요소(PREs)라고 명명되고 있다. 상기 서열은 염색질의 PcG 중재된 억제에 관련이 있다고 동정되고 있다. 아직까지는, (척추동물 또는 식물 모두에서) 염색질의 억제를 중재하기에 필요한 모든 서열 정보를 포함하는 주형 PREs는 발견되지않고 있다.
게다가, 지금까지는, 시종 일관된 방법에서 장기적인 억제 가능성을 갖는 서열을 연구할 가능하지 않았다. 이것은 많은 부분에서, 이러한 장기적으로 작용하는 서열에 대한 체계적으로 스크리닝할 능력이 없음에 기인한다. 하나의 관점에서, 본 발명은 DNA에서 이러한 서열을 체계적으로 탐지하기 위한 수단 및 방법을 제공한다. 하나의 구현예에서, 본 발명은 하기의 단계,
- 시험 핵산의 집단을 제공하는 단계,
- 프로모터의 전사 조절하에서 시험 핵산 및 제 1 리포터 유전자를 포함하는 발현 벡터의 집단을 생성하는 단계,
- 발현 벡터의 상기 집단을 갖는 세포를 제공하는 단계,
- 세포 또는 이의 벡터-포함 자손을 선별하고, 여기서, 상기 제 1 리포터 유 전자의 전사는 억제되는 단계, 및
- 상기 세포에서 상기 시험 핵산을 동정하는 단계를 포함하는 유전자 전사 억제 성질을 갖는 DNA 서열을 동정하는 방법을 제공한다. 상기 동정된 시험 핵산은 상기 프로모터 기능을 억제하는 능력을 포함하므로, 유전자 전사 억제 성질을 포함한다. 바람직하게는, 상기 동정된 시험 핵산은 또한 회수되고 클로닝된다. 상기 성질은, 상기 성질을 갖는 DNA 서열의 부재하에서의 수준에 비교하여, 상기 프로모터에 물리적으로 연결되는 경우에 상기 프로모터로부터 전사의 수준을 감소하는 능력을 적어도 부분적으로는 포함한다. 바람직한 구현예에서, 상기 유전자 전사 억제 성질은 유전자 전사 억제 염색질 성질을 포함한다. 즉, 상기 전사 수준의 감소는 염색질이 유전자 전사를 억제하는 배치를 갖는 결과이다. 이 배치는 바람직하게는 상기 프로모터를 둘러싼다. 하지만, 상기 배치가 상기 프로모터에서 상기 인핸서의 전사를 증대하는 효과를 적어도 부분적으로 비활성화하는 것에 의하여 인핸서 또는 유사한 것을 둘러싼다. 특히 바람직한 구현예에서, 유전자 전사 억제 염색질 성질을 갖는 상기 DNA 서열은 Polycomb그룹형 감응성 요소를 포함한다.
상기 방법을 사용하여, 프로모터로부터 전사 수준을 감소하는 능력을 포함하는 여러 핵산 서열을 회수하는 것이 가능하다. 유사한 기능을 갖는 서열은 서열 유사성으로 서로 비교될 수 있고, Polycomb그룹형 감응성 요소와 같이 유전자 전사 억제 성질을 갖는 요소에 대한 하나 이상의 컨센서스 서열이 추정될 수 있다. 더구나, 유기체의 게놈의 전체 서열이 알려지고 얼마 안 있어 더 많은 것이 알려지게 된다는 점을 고려하여, 이들 게놈 또는 그것의 일부분을 스크리닝하고, 게놈에서 이들 서열의 발생을 예상하는 것이 가능하다. 게놈에서 유전자 전사 조절 성질 및/또는 유전자 전사 억제 성질을 포함하는 DNA 서열의 출현 및 위치결정에 관한 지식은 게놈에서 유전자 전사의 더 고차원적 조절에 대한 우리의 지식을 매우 증가시킬 것이다.
Polycomb그룹 감응 요소는 상기 요소를 갖는 하나 이상의 Polycomb그룹 단백질의 직접적인 및/또는 간접적인 상호작용에 감응하여 프로모터로부터 전사를 억제할 수 있는 요소이다. Polycomb그룹형 감응 요소는 Polycomb그룹 반응요소이거나 또는 대체가능하게는 상기 요소를 갖는 하나 이상의 단백질의 직접적인 및/또는 간접적인 상호작용에서의 프로모터의 전사를 억제할 수 있는 요소이고, 여기서, 상기 하나 이상의 단백질은 Polycomb그룹에 속하지는 않지만, 상기 상호작용의 결과로서, 유전자 전사 억제 염색질이 형성된다. 이러한 단백질의 예로는 이종염색질 단백질1(HP1)과 같은 염색질 관련 단백질이 있다(Eisenberg et al., 1990). 유전자 활성을 억제하는 다른 염색질관련 단백질은 메틸-CpG-결합 단백질, MeCP2이 있다(Nan et al., 1997). 바람직한 구현예에서, 본 발명의 Polycomb그룹형 감응성 요소는 원거리에 있는, 바람직하게는 2000 염기쌍 이상에 있는 프로모터의 전사 억제 능력을 포함한다(van der Vlag et al., 2000).
시험 핵산의 집단은 많은 방법으로 생성될 수 있다. 시험 핵산으로서 인공적인 서열을 사용하여 유전자 전사 억제 성질에 대한 컨센서스 서열을 얻을 수 있다. 다른 성질은 다른 컨센서스 서열을 포함할 수 있다. 바람직하게는 상기 집단은 염색체 DNA로부터 생성된다. 이 방법에서, 염색체에서 자연적으로 발생하는 서열을 포함하는 유전자 전사 억제 성질이 발견된다. 이것은 염색체에서 이들 성질의 위치가 결정될 수 있는 이점을 갖고, 그 결과로, 상기 위치에서 더욱 고차원의 유전자 전사에 그들의 영향이 해결될 수 있다.
리포터 유전자는 세포에서 직접적으로 또는 간접적으로 탐지될 수 있는 발현 생성물을 코드화하는 유전자이다. 유전자 전사 억제 성질을 탐지하기 위한 방법에서, 세포로의 발현 벡터의 전이는 상기 리포터 유전자의 발현을 이끌 것이다. 하지만, 시험 핵산이 Polycomb그룹형 감응 요소와 같은 유전자 전사 억제 성질을 포함하는 경우에, 발현은 상기 리포터 유전자의 적어도 부분적으로 감소된 발현을 이끄는 것에 의하여 상기 세포에서 억제될 것이다. 그러므로, 상기 프로모터의 전사를 억제할 수 있는 핵산의 존재 또는 부재는 상기 세포에서 상기 발현 생성물을 탐지하는 것으로 탐지될 수 있고, 그것으로 인하여 감소된 결실 또는 무결실은 유전자 전사 억제 성질의 존재를 나타낸다. 리포터 유전자는 형광 리포터 단백질을 코드화할 수 있다. 그런 다음, 감소된 발현은 예를 들어, 유속 세포계산기와 같은 형광계의 수단에 의하여 탐지될 수 있다. 낮거나 또는 전무한 형광을 나타내는 세포는 형광 활성화된 세포 구분기(sorter) 및 발현 벡터 및/또는 단리된 시험 핵산, 예를 들어 증폭 반응을 사용하여 구분될 수 있다. 바람직하게는, 상기 제 1 리포터 유전자는 선별가능한 리포터 유전자, 발현을 포함하고, 상기 발현은 상기 세포를 상기 제 1 리포터 유전자의 낮은 수준으로 발현하거나 또는 발현하지 않는 세포에서 적어도 성장 단점을 직접적으로 또는 간접적으로 제공한다. 유전자 전사 억제 성질을 갖는 DNA 서열이 스크리닝하는 경우에, 상기 제 1 리포터 유전자의 발현은 바람직 하게는, 상기 세포에 직접적으로 또는 간접적으로 독성을 갖는다. 이러한 독성의 발현 생성물의 비제한적인 예는 리신 또는 그것의 독성 이형체이다. 또 다른 예에서, 상기 제 1 리포터 유전자는 세포자멸사를 유도하는 유전자 생성물을 코드화한다. 바람직하게는 상기 세포자멸사를 유도하는 유전자 생성물은 아데노바이러스 13S E1A 또는 그것의 기능성 등가물을 포함한다(Breckenridge and Shore, 2000). 또 다른 구현예에서, 상기 세포자멸사를 유도하는 유전자 생성물은 아포프틴 또는 그것의 기능성 등가물을 포함한다(Pietersen and Noteborn, 2000).
또 다른 예는 헤르페스 단순포진 바이러스 티미딘 키나제(HSV-tk)와 같은 소위 자살 생성물을 코드화하는 유전자이다. HSV-tk를 발현하는 세포의 배양액에 간시클로비르을 첨가하는 것은 이들 세포에서 독성물질의 형성을 초래할 것이다. 특히 바람직한 구현예에서, 상기 자살 유전자는 시토신 디아미나제를 포함한다. 시토신 디아미나제는 시토신을 우라실로 변환한다. 이 효소 활성은 원핵세포 및 저급 진핵세포에서 발견되지만, 고급 진핵세포에서는 존재하지 않는다. 상기 유전자는 프로드럭 5-플루오로시토신(5-FC)과의 조합에서 생체대사의 자살 유전자로서 사용된다. 시토신 디아미나제는 비독성 5-FC를 5-플루오로우라실로 변환할 수 있고, 이것은 DNA 합성을 붕괴시키는 것으로 세포를 죽일 수 있으므로, 세포자멸사를 유발한다(Mullen et al., 1992; Wei and Huber, 1996).
상기 제 1 리포터 유전자의 전사 조절 프로모터는 활성이거나 또는 상기 세포에서 활성화될 수 있는 어떤 프로모터일 수 있다. 특정 프로모터를 선별하는 것으로 상기 특정 프로모터의 전사를 억제할 수 있는 Polycomb그룹형 감응성 요소와 같은 유전자 전사 억제 성질을 선별하는 것은 가능하다. 이러한 방법에서 상기 특정 프로모터가 속하는 종류의 프로모터를 명확하게 억제하는 성질을 선별하는 것은 가능하다. 바람직한 구현예에서, 상기 프로모터는 그것의 활성이 상기 프로모터를 시그널와 함께 포함하는 세포를 제공하는 것을 유도할 수 있는 프로모터를 포함한다. 이러한 유도가능한 프로모터는 바람직하게는 테트라시클린 감응성 프로모터를 포함한다. 여기서 시그널은 테트라시클린, 독시시클린 및 균등물이다. 이러한 프로모터는 또한 진핵 세포에서 테트라시클린 감응성에 적응할 수 있다(Yin et al., 1996). 프로모터 및 실행하는 분자는 테트라시클린 또는 그것의 상당물의 첨가로 유전자의 발현을 유도하거나 억제하는 것이 가능하다.
본 발명의 발현 벡터로 트랜스펙션된 세포는, 전형적으로 낮은 빈도로 그리고 유전자 전사 억제 성질을 갖는 DNA 서열의 존재와 연관되지 않는 이유로, 상기 제 1 리포터 유전자의 발현 생성물의 탐지가능한 양을 발현할 수 없다. 이것은 예를 들어, 상기 제 1 리포터 유전자의 코딩 서열을 붕괴하는 재조합 사건에 기인할 것이다. 본 발명의 바람직한 구현예에서, 발현 벡터의 상기 집단은 추가로 제 2 리포터 유전자를 포함한다. 상기 제 2 리포터 유전자의 발현은 바람직하게는 이차 프로모터의 조절하에 있다. 상기 제 2 리포터 유전자의 발현 생성물의 발현을 탐지하기 위한 방법은 상기 시험 핵산의 발현을 억제하는 활성을 확인하는 데에 사용될 수 있고, 그것으로 인하여, 상기 제 1 리포터 유전자를 그릇되게 발현하지 않는 세포의 수를 적어도 부분적으로 감소한다. 바람직한 구현예에서, 상기 제 2 리포터 유전자는 발현 카세트를 포함하는 세포용으로 선별된다. 이러한 방법으로, 상기 발 현 카세트를 포함하지 않는 세포는 쉽게 무시될 수 있다. 결론적으로, 상기 제 2 리포터 유전자의 상기 발현 생성물은 바람직하게는 양성의 지배적인 선별가능한 리포터 유전자를 포함한다. 바람직하게는, 상기 양성의 지배적인 선별가능한 리포터 유전자는 다른 독성화합물에 내성을 줄 수 있는 발현 생성물을 코드화한다. 비제한적인 예로는 G418 내성 및 히그로마이신 내성이 있다.
유전자 전사 억제 성질이 전사를 억압하는 것을 고려하여, 이 구현예에서 발현 벡터는 추가로 유전자 전사 억제 성질을 갖는 DNA 서열의 전사 억제 효과에 반작용할 수 있는, 유전자 전사 조정 성질을 갖는 적어도 한 개의 DNA 서열을 포함한다. 발현 벡터에서 상기 전사를 대항하는 요소의 대체는 바람직하게는 상기 제 2 리포터 유전자의 전사 수준에서 가질 수 있는 상기 유전자 전사 억제 성질의 효과를 감소하는 것에 의하여 효과적으로 방해하는 것이 된다. 바람직한 구현예에서, 유전자 전사 조정 성질을 갖는 상기 DNA 서열은 기능적으로 상기 일차 및 상기 제 2 리포터 유전자를 포함하는 발현 카세트를 분리한다. 바람직하게는, 상기 제 2 리포터 유전자(및 상기 제 2 리포터 유전자의 전사 조절 프로모터)는 유전자 전사 조정 성질을 갖는 DNA 서열에 의해 플랭킹된다. 유전자 전사 조정 성질을 갖는 DNA 서열의 예로는 표 1 및 2에 기재된 소위 STAR 요소이다.
본 발명의 방법은 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질을 포함하는 많은 요소의 클로닝 및 동정화를 초래한다. 이러한 요소는 예를 들어, 유전자 전사 억제 염색질의 형성에 관련되지 않은 상기 성질을 수행하는 데에서의 수단이 아닌 관계없는 핵산을 함유할 수 있다. 이러한 요소에서 기능적인 서열은 종래에 알려진 여러 방법으로 나타낼 수 있다. 하나의 구현예에서 결실 및/또는 치환은 유전자 전사를 조정하거나 또는 유전자 전사 억제 성질을 갖는 DNA 서열에서 이루어진다. 이러한 방법으로 조정되는 DNA는 본 발명의 방법에서 활성에 대하여 시험된다. 이것은 단일 변형된 핵산을 사용하거나 또는 상기 변형된 핵산을 포함하는 시험 핵산의 집단을 생성하는 것으로 이루어질 수 있다. 본 발명의 DNA 서열안에서 기능적인 서열의 해명은 유전자 전사를 조정하고 그리고/또는 유전자 전사 억제 성질을 갖는 요소에 대한 컨센서스 서열의 해명을 가능하게 한다. 여러 Polycomb형 복합체가 있고 각각 다른 기능성 및 발현 패턴을 포함한다는 것을 고려하면, 하나 이상의 컨센서스 서열의 유형은 본 발명의 방법으로 발견된다는 것이 예상된다. 유사하게는 하나 이상의 컨센서스 서열이 유전자 전사 조정 성질을 포함하는 원소에 대하여 발견되는 것이 예상된다. 그러므로, 본 발명은 Polycomb그룹형 감응성 요소와 같이 유전자 전사를 조정하고 그리고/또는 유전자 전사 억제 성질을 포함하는 단리된 및/또는 재조합 핵산의 라이브러리를 추가로 제공한다. 하나의 구현예에서, 상기 라이브러리는 동일한 컨센서스 서열을 포함하는 단리된 및/또는 재조합 핵산을 포함한다. 바람직한 구현예에서, 상기 라이브러리는 하나 이상의 컨센서스 서열의 유형을 포함한다. 상기 라이브러리는 예를 들어 주어진 DNA 분자가 DNA를 조정하는 성질을 포함하는지를 결정하는 데에 사용될 수 있다. 바람직한 구현예에서, 상기 라이브러리는 실질적으로 염색체의, 유전자 전사를 증대하는 기능을 갖는 모든 요소, 안정한 유전자 전사 성질을 포함하는 요소 및/또는 Polycomb그룹형 감응 요소와 같은 유전자 전사 억제 성질을 갖는 요소를 포함한다. 염색체에서 이들 요소의 위치에 관한 지식이외에, 이것은 당업자에게 상기 염색체 상에 자연적으로 존재하는 유전자의 유전자 발현의 고차원의 조절에 대한 그리고 재조합 수단에 의하여 상기 염색체로 도입된 유전자(외부 핵산)에 대한 예상을 가능하게 한다. 이러한 예상은 예를 들어, 외부 DNA의 삽입을 위한 상기 염색체상에서 적절한 후보 위치를 선별하는 데에 사용될 수 있다. 적절한 위치는 어떤 세포, 세포형 및/또는 조직에서 명확하게 발현될 것이라고 예상되는 위치일 수 있다. 바람직하게는, 상기 염색체는 염색체 21 또는 염색체 22를 포함한다. 특히 바람직한 구현예에서, 세포에서의 유전자 전사를 조정하거나 또는 유전자 전사 억제 성질을 포함하는 모든 DNA 서열은 라이브러리 내에 있다. 이 구현예에서 게놈 전체는 적절한 후보 위치를 예상하는 데에 사용될 수 있다. 하나의 구현예에서 상기 라이브러리는 식물에서 인간까지의 범위의 종의 다른 세포주에서 생성될 수 있다. 다른 세포주 및/또는 종에서, 유전자 전사 억제 성질을 갖는 DNA 서열과 상호작용할 수 있는 다른 단백질(또는 단백질 복합체)은 유전자 전사 억제 성질을 갖는 다른 DNA 요소를 야기하도록 발현될 것이다. 유사하게는, 유전자 전사 조정 성질을 포함하는 DNA 서열과 직접적으로 또는 간접적으로 상호작용하는 다른 단백질이 발현될 것이다. 그러므로, 라이브러리의 구성은 세포형에 위존하고, 그리고 관련된 단백질의 존재에 의존한다. 이것은 또한 Polycomb그룹형 감응 요소의 경우이다. HP1이 세포형 1에서 발현된다면, HP1에 의존하는 요소는 본 발명의 방법에 의해 탐지될 것이다. HP1가 세포형 2에서 발견되지 않는다면, 본 발명의 방법은 세포형 하나로부터 회수되는 요소를 탐지하지 않을 것이다.
본 발명의 한 관점에서, 상기 라이브러리는 유전자 전사 억제 염색질의 형성에 적어도 부분적으로 대항할 수 있는 하나 이상의 요소를 포함한다. 염색체 또는 게놈에서 유전자 전사 억제 성질을 갖는 DNA 서열의 위치에 대한 지식 이외에, 이러한 대항하는 요소의 위치에 대한 지식은 상기 염색체 또는 게놈에서(삽입된) 유전자의 유전자 전사의 고차원 조절의 더욱 정확한 예상을 가능하게 한다. 바람직하게는 상기 라이브러리는 추가로 인핸서 및 사일렌서와 같은 다른 전사 조절 요소를 포함한다. 이러한 서열이 고차원의 유전자 조절에 제한된 영향을 줄지라도, 이러한 다른 서열의 위치에 관한 정보는 추가로 그 안에 삽입된 외부 서열의 발현을 위한 게놈에서의 적절한 위치에 대한 예측의 정확도를 증가시킨다. 바람직하게는, 상기 라이브러리는 실질적으로 유전자 전사 조절 성질 및/또는 염색체의 모든 다른 조절 서열을 포함하는 모든 DNA 서열을 포함한다.
이미 염색체가 전형적으로 수천만개의 염기에 의해 구축된다는 것을 고려하면, 라이브러리는 고차원의 유전자 조절에 주어진다는 정보가 자동화된 시스템에 적어도 부분적으로 혼입되는 것이 바람직하다.
본 발명의 라이브러리의 또 다른 용도는 "고차원(higher order)" 조절 서열이 돌연변이되는 식으로 염색체 서열의 표적화된 변형시 유전자의 전사를 예상하는 것이다. 예를 들면, 본 발명의 하나 이상의 Polycomb그룹형 감응성 요소, 및/또는 상기 염색체에서의 다른 조절 요소는 돌연변이된다. 이것은 Polycomb그룹형 감응성 요소 및/또는 다른 발현 조정 요소의 근처에 있는 유전자의 전사 수준을 변화시키는 것으로 기대된다.
본 발명의 라이브러리 또는 시스템의 또 다른 용도는 게놈에서 돌연변이로부터 야기되는 유전자 발현의 예상이다. 돌연변이가 변경된 유전자 전사를 야기하는 경우에, 이러한 변경된 유전자 전사의 탐지는 상기 자연적으로 발생하는 돌연변이의 존재를 나타낼 수 있다. 이 접근은 예를 들면, 진단 평가에서 시험되어질 서열 또는 단백질의 수를 제한하는 데에 유용하다. 이것은 특히 이들 접근에서 시험되어질 발현 서열의 수가 배열이 최대로 보유할 수 있는 서열의 수에 의해 제한되기 때문에, 마이크로어레이에서 중요하다. 본 발명의 수단 및 방법으로, 마이크로어레이 접근에서 시험되어질 서열의 수를 제한하는 것이 가능하다.
본 발명의 시스템 또는 라이브러리의 또 다른 용도는 약물 표적의 발견이다. 그들이 "고차원" 요소이거나 그렇지 않은, 조절 요소는 그것들에 결합할 수 있는 단백질(복합체)이기 때문에 기능화된다. 본 발명의 시스템은 특정 단백질(복합체)의 결합 또는 기능으로 방해하기 위한 약제의 표적화가 특정 유전자의 발현의 변경을 위한 가능성이 있는지를 결정하는 데에 사용될 수 있다.
본 발명은 본 발명의 방법에 의하여 얻어질 수 있는 유전자 전사 억제 성질을 포함하는 DNA 서열을 추가로 제공한다. 바람직한 구현예에서, 유전자 전사 억제 성질을 갖는 상기 DNA 서열은 척추동물에서 식물까지로부터 유도된다. 더욱 바람직하게는, 유전자 전사 억제 성질을 갖는 상기 DNA 서열은 표 4B에 따른 서열 또는 그것의 기능적인 유사체를 포함한다. 본 발명의 DNA 서열로 DNA 구성을 제공하는 것, 또는 이러한 DNA 서열을 조정하는 것이 또한 가능하다. 바람직한 구현예에서, DNA 컨스트럭트(construct: 이하에서 '구성물'이라고도 함)은 관심의 핵산으로 작동가능하게 연결된 프로모터를 포함하는 것으로 제공된다. 바람직하게는, 유전자 전사 조절 및/또는 억제 성질을 갖는 상기 DNA 서열의 성질의 활성량은 상기 프로모터와 비교하여, 상기 구성물에서 상기 DNA 서열의 배향(orientation)에 의존한다. 바람직하게는, 상기 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질은 시그널의 존재에 의존한다. 바람직하게는, 상기 시그널은 DNA 결합 단백질을 포함한다. 바람직하게는, 상기 시그널은 인간 면역-결핍 바이러스 TAT 단백질을 포함한다.
유전자 전사 조정 성질 또는 유전자 전사 억제 성질을 포함하는 DNA 서열의 용도 중 하나는 물론 관심의 유전자 전사의 조절이다. 관심의 유전자의 전사는 상기 성질을 갖는 DNA 서열이 제공되거나 또는 제거되는 것과 같이, 상기 유전자의 근처에서 서열을 변경하는 것으로 변경되어질 수 있다. 특정한 발현의 특징은 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질을 갖는 DNA 서열(의 일부분)을 결합하는 것으로 고안될 수 있다. 예를 들면, 발현 벡터에서 안정한 유전자 전사 성질을 갖는 서열의 복제는 상기 표적세포에서 상기 벡터의 도입에서 자손 또는 표적세포에서의 발현이 향상되는 것을 이끌 것이다. DNA 서열이 유전자 전사 조정 성질과 결합함으로서, 변경된 유전자 전사 조정 성질은 종류 또는 양에서 또는 모두에서 생성될 수 있다.
DNA 서열을 원하는 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질로 고안하는 것 또한 가능하다. DNA 결합 단백질은 다른 단백질 또는 DNA 서열과 함께 DNA 서열의 성질을 결정한다. 하나 이상의 다른 단백질 결합 DNA 서열을, 성질을 갖는 DNA 서열로 삽입하는 것은 가능하다. 결합 단백질이 결합하게 함으로서, 성질을 방해하는 것, 또는 이끄는 것이 가능하므로, 고안된 성질을 갖는 DNA 서열을 생성할 수 있다. 특정 유전자 전사 조절 성질 및/또는 유전자 전사 억제 성질을 갖는 DNA 서열로부터 단백질 결합 부위를 제거하는 것도 물론 가능하므로, 그것으로 인하여 생성된 DNA 서열의 성질이 변경된다. 첨가 및 제거의 조합 또한 가능하다. 특정 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질은 본 발명에서 개시된 탐지 방법을 조화하는 것으로 선별될 수 있다. 예를 들면, 유도가능한 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질을 갖는 DNA 서열을 합성하는 것이 가능하다. 예를 들어, 유전자 전사 억제 성질을 포함하는 DNA 서열에서 TAT-결합 요소를 포함하는 것으로써, TAT를 포함하는 세포에서 유전자 전사 억제 성질을 적어도 부분적으로 비활성화시키는 것이 가능하다. 유사하게 시그널의 존재 또는 부재에서 그들의 표적 서열에만 결합할 수 있는 DNA 결합 단백질이 있다. 이러한 단백질의 비제한적인 예는 TET-억제제 및 그것의 다양한 돌연변이체, lac-억제제, 스테로이드 호르몬 수용체, 레티노산 수용체 및 유도체가 있다. 예를 들어, DNA 서열을 세포형 특정 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질으로 고안하는 것이 가능하다. 예를 들면, 상기 TAT 예의 경우. 언급된 DNA 서열은 TAT를 발현하는 HIV 감염세포에 대하여 특정하게 될 수 있다. 대체가능하게는 DNA 서열은 세포형 특이적 방식으로 발현되는 단백질 복합체에 특이적으로 만들 수 있다.
유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질을 포함하는 DNA 서열을 포함하는 발현 구성물은 상기 발현 구성물의 하나 이상의 카피(copy)를 포함하는 세포에서 상기 구성물로부터 발현하기에 적절하다. 또한, 발현 구성물이 상기 세포의 게놈에서 존재하는 경우이고, 또한 발현 카세트가 상기 세포에서 하나 이상의 카피에서 존재하는 경우이다. 더구나, 그것들은 하나 이상의 카피에서 동일한 위치로 통합되는 경우에도 작용한다.
본 발명의 바람직한 구현예에서, 유전자 전사 조정 성질을 갖는 상기 DNA 서열은 소위 STAR(안정화하는 항-억제) 서열을 포함한다. 여기서 사용된 바와 같은 STAR 요소는 상기 유전자 전사 조정 성질을 하나 이상 포함하는 DNA 서열로 간주된다.
종래의 여러 방법으로 어떤 일반적인 특징을 분담하는 DNA 서열군에서 서열 동정체(identifier)를 추출할 수 있다. 이러한 서열 동정체는 그 후에 하나 이상의 동정체를 분담하는 서열을 동정하는 데에 사용될 수 있다. 그러한 하나 이상의 동정체를 분담하는 서열은 동일한 서열군의 하나일 수 있다, 즉 상기 군의 일반적인 특징을 분담할 수 있다. 본 발명에서 STAR 활성(소위 STAR 서열)을 포함하는 많은 서열은 STAR 활성을 포함하는 서열의 특징을 나타내는 서열 동정체(패턴)을 얻는 데에 사용될 수 있었다. 이들 패턴은 시험 서열이 STAR 활성을 함유하는 가를 결정하는 데에 사용될 수 있다. 본 발명의 하나의 관점에서, 본 발명은 약 50-5000개의 염기쌍의 핵산 서열안에서 STAR 서열의 존재를 탐지하는 방법을 제공하고, 이것은 하나 이상의 서열 패턴의 상기 서열에서 발생의 횟수를 결정하고 그리고 상기 발생의 횟수가 STAR 서열을 포함하는 하나 이상의 서열에서 상기 하나 이상의 서열 패턴의 발생 횟수를 대표하는가를 결정하는 것을 포함한다. 원칙적으로 어느 방법은 서열 패턴이 STAR 서열을 대표하는가를 결정하는 데에 적합하다.
많은 다른 방법은 당기술분야에서 사용가능하다. 본 발명의 바람직한 구현예에서, 상기 발생이 STAR 서열을 포함하는 하나 이상의 서열에서 상기 하나 이상의 서열패턴의 발생 횟수를 대표하는 가를 결정하는 단계는 상기 하나 이상의 서열패턴의 발생 횟수가 상기 하나 이상의 STAR 서열 및 하나 이상의 대조 서열사이에서 현저하게 다르다는 것을 결정하는 것을 포함한다. 원칙적으로 어느 현저한 차이는 STAR 서열의 존재에 식별된다. 하지만, 특히 바람직한 구현예에서, 상기 하나 이상의 서열패턴의 발생 횟수는 하나 이상의 대조 서열에 비교하여, STAR 서열을 포함하는 상기 하나 이상의 서열에서 현저하게 더 높다.
STAR 서열을 포함하는 주목할 만한 많은 서열은 본 발명에서 동정되고 있다. 패턴이 대조 서열 및 STAR 서열을 포함하는 서열을 구별하는 데에 얼마나 효율적인가를 시험하기 위해 이들 서열을 사용하는 것이 가능하다. 소위 구별 분석을 사용하여, 하나의 종 안에서 STAR 서열의 어느 세트를 기초로 하여 그것의 가장 최상의 구별되는 서열 패턴 또는 조합을 구별하는 것이 가능하다. 그러므로, 바람직하게는, 상기 패턴의 하나 이상은 STAR 서열을 포함하는 하나 이상의 상기 서열 및 대조 서열 간에 원하는, 바람직하게는 최상의 구별을 기초로 하여 선별된다. 원하는 구별은 생물정보학을 통하여 패턴과 관련된 어떤 상당한 인자일 수 있다.
바람직한 구현예에서, 시험 핵산에서 서열 패턴의 발생 횟수는 STAR 서열을 함유하는 것으로 알려진 서열에서 발생 횟수와 비교된다. 이 경우에서 패턴은 발생 횟수가 유사하다면 STAR 서열을 포함하는 서열에 대하여 대표한다고 간주된다. 바람직한 구현예에서 또다른 규범이 사용된다. STAR 서열을 포함하는 서열에서의 패 턴의 발생 횟수는 대조 서열에서의 상기 패턴의 발생 횟수에 비교된다. 두 개의 횟수를 비교하는 것에 의하여 STAR 서열을 포함하는 서열에서의 횟수가 대조 서열에서의 횟수와 현저하게 다른가를 분석하는 것은 각각의 패턴을 결정하는 것이 가능하게 한다. 이 구현예에서, STAR 서열을 포함하는 하나 이상의 서열에서 패턴의 발생 횟수가 대조 서열에서의 동일한 패턴의 발생 횟수와 다르다면, 서열 패턴은 STAR 서열을 포함하는 서열을 대표하는 것으로 간주된다. STAR 서열을 포함하는 많은 수의 서열을 사용하는 것으로, 통계학적인 차이가 입증될 수 있는 패턴의 수는 증가하므로, 발생 횟수는 STAR 서열을 포함하는 서열에 대하여 대표하는 패턴의 수를 증가시킨다. 바람직하게는 상기 발생 횟수는 STAR 서열을 포함하는 2개 이상의 서열에서, 더욱 바람직하게는 STAR 서열을 포함하는 5개 이상의 서열에서 상기 하나 이상의 서열 패턴의 발생 횟수에 대하여 대표한다. 더욱 바람직하게는 STAR 서열을 포함하는 10개 이상의 서열에서이다. 더욱 바람직하게는, 상기 발생 횟수는 STAR 서열을 포함하는 20개 이상의 서열에서 하나 이상의 상기 서열의 발생 횟수의 전헝이다. 특히 바람직한 구현예에서 상기 발생 횟수는 STAR 서열을 포함하는 50개 이상의 서열에서 하나 이상의 상기 서열의 발생 횟수를 대표한다.
STAR 서열을 포함하는 서열을 나타내는 패턴은 또한 사용된 대조군 핵산의 유형에 의존한다. 사용된 대조 서열의 유형은 바람직하게는 STAR 서열의 존재가 탐지되는 서열을 기초로 하여 선별된다. 바람직한 구현예에서 상기 대조 서열은 STAR 요소를 포함하는 하나 이상의 상기 서열로서 유사한 AT/CG 함량을 포함하는 무작위 서열을 포함한다. 또 다른 바람직한 구현예에서, 대조 서열은 상기 STAR 요소를 포 함하는 하나 이상의 상기 서열로서 동일한 종에서부터 유도된다. 예를 들면, 시험 서열이 STAR 서열의 존재에 대하여 정밀하게 조사되어 식물 세포에서 활성이라면, 바람직하게는 대조 서열은 또한 식물 세포로부터 유도된다. 유사하게는, 인간 세포에서 STAR 활성에 대하여 시험하는 경우에, 대조군 핵산은 또한 바람직하게는 인간 게놈으로부터 유도된다. 바람직한 구현예에서, 대조 서열은 STAR 서열을 포함하는 하나 이상의 상기 서열의 염기의 50%와 150%사이를 포함한다. 특히 바람직한 구현예에서, 상기 대조 서열은 STAR 서열을 포함하는 하나 이상의 상기 서열의 염기의 90%와 110%사이를 포함한다. 더욱 바람직하게는, 95%와 105% 사이이다.
패턴은 두 개 이상의 염기의 수를 포함할 수 있다. 바람직하게는, 하나 이상의 서열 패턴은 5개 이상을 포함하고, 더욱 바람직하게는 6개 이상의 염기이다. 또 다른 구현예에서 하나 이상의 서열 패턴은 8개 이상의 염기를 포함한다. 바람직한 구현예에서, 하나 이상의 상기 서열 패턴은 표 9 및/또는 표 10에서 기재된 패턴을 포함한다. 패턴은 염기의 연속적인 목록으로 구성될 것이다. 하지만, 상기 패턴은 또한 구별되지 않거나 또는 부분적으로만 구별되는 많은 염기에 의해 한번이상 방해되는 염기를 포함할 수 있다. 부분적으로 구별되는 염기는 예를 들어 퓨린을 나타낸다.
바람직하게는, STAR 활성의 존재는 기능적인 펑가법을 사용하여 증명된다.
여러 방법은 여기서, 서열이 STAR 활성을 포함하는지를 결정하기 위해 나타낸다. STAR 활성은 서열이 하기 기능: (ⅰ) 본 발명의 유전자 전사 억제 요소를 포함하는 서열의 효과를 적어도 부분적으로 억제하는 기능, (ⅱ) 염색질에 연관된 억 제를 적어도 부분적으로 차단하는 기능, (ⅲ) 인핸서의 활성을 적어도 부분적으로 차단하는 기능, (ⅳ) 핵산 단독으로 비교하여 전사 단위를 코드화하는, 작동가능하게 연결된 핵산을 수여하는 기능 중 하나이상을 수행할 수 있는지를 확인된다. (iv-a) 전사의 더 높은 예측성, (iv-b) 더 높은 전사 및/또는 (iv-c) 전사의 더 높은 안정성.
본 발명에서 동정된 STAR 활성을 포함하는 많은 수의 서열은 양에서까지는 아니지만 동일한 활성을 포함하는 서열을 동정하고 생성하는 매우 다양한 가능성을 열어둔다. 예를 들면, 본 발명에서 동정된 서열을 변경하고 STAR 활성에 대한 변경된 서열을 시험하는 것을 당업자에게 잘 알려져 있다. 그러므로, 이러한 변경된 서열은 또한 본 발명의 일부분이다. 변경은 서열에서의 하나 이상의 염기의 결실, 삽입 및 돌연변이를 포함할 수 있다.
STAR 활성을 포함하는 서열은 400개의 염기의 범위에서 동정된다.
하지만, 이들 400개의 염기 모두가 STAR 활성을 유지하는 데에 필요하지는 않다고 기대된다. 400개와 5000개 염기사이의 단편에 대하여 어떤 성질을 주는 서열의 범위를 정하는 방법은 잘 알려져 있다. STAR 활성을 포함하는 단편의 최소의 서열 길이는 약 50개의 염기로 추정된다.
표 9 및 표 10은 STAR 활성을 포함하는 핵산 분자를 과잉-표현하는 것으로 발견되고 있는 6개의 염기의 패턴이 기재된다. 이 전체 표현은 STAR 서열을 대표하는 것으로 간주된다. 상기 표는 65개의 STAR 서열의 군으로 생성되었다. 유사한 표는 STAR 서열의 다른 세트로부터 또는 STAR 서열의 더 작거나 또는 더 큰 세포로부 터 개시하는 것으로 생성될 수 있다. 패턴은 그것이 STAR 요소를 포함하지 않는 서열에 비하여 상기 STAR 서열를 과잉-표현하지 않는다면 STAR 서열을 대표한다. 이것은 무작위 서열일 수 있다. 하지만, 관계없는 경향을 배제하기 위하여, STAR 서열을 포함하는 서열은 바람직하게는 게놈 또는 그것의 상당한 부분, 바람직하게는 척추동물 또는 식물의 게놈은 더욱 바람직하게는 인간 게놈에 비교된다. 게놈의 상당한 부분은 예를 들면 염색체이다. 바람직하게는 STAR 서열 및 상기 대조 서열을 포함하는 서열은 동일한 종의 핵산으로부터 유도된다.
STAR 서열이 서열 패턴의 발생 횟수를 결정하는 데에 사용될수록 STAR에 더욱 대표적인 패턴은 과잉- 또는 소량-표현되어진다. 핵산에 의해 발현될 수 있는 많은 기능적인 특징이 그것에 결합하는 단백질성 분자에 의해 중재되는 것을 고려하여, 대표적인 패턴은 STAR 서열에 과잉-표현되는 것이 바람직하다. 이러한 과잉-표현된 패턴은 단백질성 분자에 대한 결합 부위, 그 일부분일 수 있다.
바람직하게는, 상기 발생 횟수는 STAR 서열을 포함하는 2개 이상의 서열에서, 더욱 바람직하게는 STAR 서열을 포함하는 5개 이상의 서열에서, 더욱 바람직하게는 STAR 서열을 포함하는 10개 이상의 서열에서 하나 이상의 상기 서열 패턴의 발생 횟수를 대표한다. 더욱 바람직하게는, 상기 발생 횟수는 STAR 서열을 포함하는 20개 이상의 서열에서 하나 이상의 서열 패턴의 발생 횟수를 대표한다. 특히 바람직한 구현예에서 상기 발생 횟수는 STAR을 포함하는 50개 이상의 서열에서 하나 이상의 상기 서열 패턴의 발생 횟수를 대표한다. 바람직하게는, STAR 서열을 포함하는 상기 서열은 도 26에서의 서열을 하나 이상 포함한다.
STAR 활성은 도 26에서의 서열에 의하여 분담되는 특징이 있다. 하지만, 이것은 그것들이 동일한 동정체 서열을 분담해야 한다는 것을 의미하는 것은 아니다. 다른 동정체일 가능성이 매우 높다. 동정체는 그것을 함유하는 단편에서 이러한 일반적인 특징을 수여할 수 있고, 이것은 반드시 서열 패턴 또는 패턴들의 발생 횟수를 결정하기 위한 STAR 활성을 포함하는 더 많은 서열을 사용하는 것에 의한 것은 아니지만, 그러한 STAR 서열에서 존재 또는 부재하는 다른 것들보다 더욱 흔한 패턴들을 선별하는 것은 가능하다. 이러한 방법에서, STAR 서열에서 매우 빈번하게 과잉- 또는 소량-표현되는 패턴을 찾는 것이 가능하다. 빈번하게 과잉- 또는 소량-표현된 패턴은 시험 세트에서 후보 STAR 서열을 동정하기 더욱 알맞다. 과잉- 또는 소량-표현되는 패턴의 세트롤 사용하는 다른 방법은 서열에서 STAR를 동정하기에 최고로 적합한 패턴 또는 패턴들의 조합을 결정하는 것이다. 소위 구별적인 통계를 사용하여 본 발명자들은 STAR 요소를 포함하는 서열을 동정하는 데에서 최고로 수행하는 패턴의 한 세트를 동정하였다. 바람직한 구현예에서 STAR 서열을 탐지하기 위한 하나 이상의 상기 서열 패턴은 서열 패턴 GGACCC, CCCTGC, AAGCCC, CCCCCA 및/또는 AGCACC를 포함한다.
또 다른 구현예에서, STAR 요소를 탐지하기 위한 하나 이상의 상기 서열 패턴은 서열 패턴 CCCN{16}AGC, GGCN{9}GAC, CACN{13}AGG, CTGN{4}GCC를 포함한다.
STAR 서열의 목록은 그것 안에서 하나 이상의 컨센서스 서열을 결정하는 데에 사용될 수 있다. 그러므로 본 발명은 또한 STAR 요소에 대한 컨센서스 서열을 제공한다. 이 컨센서스 요소는 물론 시험 서열에서 후보 STAR 요소를 동정하는데에 사용될 수 있다.
더욱이, STAR 요소를 포함하는 서열이 척추동물에서 동정되고 있다면 척추동물에 속하는 다른 종에서 STAR 요소를 포함하는 서열을 동정하기 위한 서열 상동성의 수단으로 사용될 수 있다.
바람직하게는 포유동물 STAR 서열은 다른 포유동물 종에서 STAR 서열에 대하여 스크리닝하는 데에 사용될 수 있다. 유사하게는, STAR 서열이 식물 종에서 동정되고 있다면 다른 식물 종에서 유사한 기능을 갖는 상동 서열에 대하여 스크리닝하는 데에 사용될 수 있다. 하나의 관점에서 본 발명은 본 발명에 따른 방법에 의하여 제공될 수 있는 STAR 서열을 제공한다.
추가로 STAR 서열의 집단을 제공한다. 바람직하게는 상기 STAR 서열은 척추동물 또는 식물 STAR 서열가 있다. 더욱 바람직하게는, 상기 STAR 요소는 포유동물 STAR 서열 또는 속씨 식물(쌀과 같은 외떡잎, 또는 아라비돕시스와 같은 쌍떡잎)이다. 더욱 바람직하게는, 상기 STAR 서열은 영장류 및/또는 인간 STAR 서열이다.
STAR 활성을 포함하는 서열의 목록은 시험서열이 STAR 요소를 포함하는지를 결정하는 데에 사용될 수 있다. 상기와 같이, 이 목적으로 이러한 목록을 사용하는 많은 다른 방법이 있다. 바람직한 구현예에서 본 발명은 약 50-5000개의 염기쌍의 핵산 서열이 STAR 서열을 포함하는지를 결정하기 위한 방법을 제공하고, 상기 방법은 본 발명의 STAR 서열의 집단에서 상기 패턴의 발생 횟수를 포함하는 서열 패턴을 일차 표를 생성하는 단계, 하나 이상의 참조 서열에서 상기 패턴의 발생 횟수를 포함하는 상기 패턴의 이차 표를 생성하는 단계, 상기 발생 횟수가 두 표사이에서 다른 하나 이상의 패턴을 선별하는 단계, 약 50-5000 염기쌍의 상기 핵산 서열안에서, 하나 이상의 상기 선별된 패턴의 발생 횟수를 결정하는 단계 및 상기 시험 핵산이 STAR 서열의 상기 집단에서 상기 선별된 패턴의 발생를 대표하는가를 결정하는 단계를 포함한다.
대체가능하게는, 상기 결정은 상기 시험 핵산에서 발생 횟수가 상기 STAR 서열의 집단에서 상기 선별된 패턴의 발생 횟수를 대표하는가를 결졍하는 단계를 포함한다.
바람직하게는, 상기 방법은 상기 후보 STAR가 본 발명의 방법을 사용하는 유전자 전사 조정 성질을 포함하는지를 결정하는 단계를 포함한다. 바람직하게는, 상기 STAR의 집단은 도 26과 같은 서열을 포함한다.
또 다른 관점에서 본 발명은 본 발명의 방법에 의해 얻어질 수 있는 STAR 서열을 포함하는 단리된 및/또는 재조합 핵산 서열을 제공한다.
상기와 같이, STAR 서열은 방향 방법에서 그것의 활성을 발휘할 수 있다, 즉 다른 쪽보다 그것을 함유하는 단편의 쪽에서 더욱 발휘할 수 있다. 더욱이, STAR 활성은 STAR 요소의 수를 증가시키는 것으로 양에서 증폭될 수 있다. 후자는 STAR 요소가 STAR 활성을 포함하는 하나 이상의 요소를 포함할 수 있다. 그것을 함유하는 단편에서 STAR 활성을 줄 수 있는 서열을 동정하는 또 다른 방법은 척추동물 또는 식물 서열로부터 선별하는 단계를 포함하고, 서열은 STAR 요소를 포함하고 선별된 서열을 플랭킹하는 서열이 또 다른 종에서 보존되는가를 동정한다. 이러한 보존된 플랭킹하는 서열은 기능적인 서열일 수 있다. 그러므로 하나의 관점에서, 본 발 명은 STAR 요소를 포함하는 척추동물 또는 식물 종으로부터 약 50 내지 5000개의 염기쌍의 서열을 선별하는 단계 및 상기 종에서 상기 선별된 서열을 플랭킹하는 서열이 하나 이상의 다른 종에서 보존되는가를 동정하는 단계를 포함하는 STAR 요소를 포함하는 서열을 동정하는 방법을 제공한다. 그러므로, 본 발명은 약 50-5000개의 염기쌍의 핵산 서열 안에서 STAR 서열의 존재를 탐지하기 위한 방법을 추가로 제공하고, 종의 세포의 염색체 일부분에서 STAR 서열을 포함하는 서열을 동정하는 단계 및 상기 서열과 다른 종의 염색체에서의 서열사이의 상당한 상동성을 탐지하는 단계를 포함한다. 바람직하게는, 상기 종은 식물 또는 척추동물 종, 바람직하게는 포유동물 종을 포함한다. 본 발명은 또한 척추동물 또는 식물 종의 약 50-5000개의 염기쌍의 핵산 서열안에서 STAR 요소의 존재를 탐지하는 방법을 제공하고, 상기 핵산 서열의 플랭킹 서열이 하나 이상의 다른 종에서 보존되는가를 동정하는 것을 포함한다.
생물정보학적인 정보를 사용하여 STAR 서열을 포함하는 서열의 존재를 탐지하기 위한 본 발명의 방법이 실재적으로 반복하는 것을 유의하는 것은 중요하다. STAR 서열을 포함하는 서열이 본 발명의 방법으로 동정될수록 패턴은 더욱 STAR 서열을 포함하는 서열과 대조 서열 사이를 구별되는 것으로 발견된다. 이들 새로이 발견된 구별 패턴을 사용하여 STAR 서열을 포함하는 더 많은 서열이 동정될 수 있고, 교대로 구별 등을 할 수 있는 패턴의 세트를 확장시킨다. 이 반복의 관점은 본 발명에서 제공하는 방법의 중요한 관점이다.
서열에 관련하여 성질(quality)이란 용어는 상기 서열의 활성으로 간주된다. STAR, STAR 서열 또는 STAR 요소라는 용어는 여기서, 상기 유전자 전사 조정 성질을 하나 이상 포함하는 DNA 서열로 간주한다. SINC 또는 SINC 요소라는 용어는 상기 유전자 전사 억제 성질을 하나 이상 포함하는 DNA 서열로 간주한다. 여기서 사용한 바와 같이 "DNA 서열"이라는 용어는 특정하지 않지만, 염기의 특정 순서의 목록으로 간주하기 보다는 DNA의 물리적인 부분이다. DNA 서열에 관한 전사 성질은 상기 DNA 서열이 관심의 유전자의 전사를 갖는 영향으로 간주한다. 여기서 "성질"이라는 용어는 전사계에서 핵산 또는 단백질의 탐지가능한 고유성 또는 속성으로 간주한다.
본 발명은 도 26의 SEQ ID: 44의 서열을 포함하는 항-억제자 활성을 갖는 단리 또는 재조합 DNA 서열로서, 상기 서열의 항-억제자 활성은, 인간 U-2 OS 골육종 세포가 Tet-Off 전사 조절 시스템의 조정하에 LexA DNA 결합 도메인과 HP1 또는 HPC2의 코딩 영역을 함유하는 LexA-억제자 융합 단백질을 포함할 때, 상기 단리 또는 재조합 DNA 서열이 플라스미드 중의 다중연결자 서열에 클론될 때, 인간 U-2 OS 골육종 세포에 제오신 250㎍/ml와 독시시클린 0.1ng/ml의 존재하에 4~5주의 배양 후 성장할 수 있는 능력을 제공하고, 상기 다중연결자는, 상기 플라스미드가 상기 세포에 존재할 때, 4개의 LexA 작동자 부위와 제오신 내성 유전자를 조절하는 SV40 프로모터 사이에 위치하는 것인 DNA 서열, 상기 DNA 서열이 제공된 재조합 DNA 구조물, 및 이를 포함하는 세포를 제공하는 효과를 가진다.
실시예
실시예 1. STAR 및 SINC 요소를 단리하기 위한 방법
재료 및 방법
플라스미드 및 균주. STAR 요소, pSelect-SV40-zeo("pSelect", 도 1)을 위한 선별 벡터는 하기와 같이 구성된다: pREP4 벡터(Inbitrogen V004-50)는 플라스미드 골격으로 사용된다. 이것은 영장류 세포주에서 고급-카피 에피솜 복제를 위한 EBNA-1 핵 항원 및 복제의 Epstein Barr oriP 기원; 포유동물 세포에서의 선별을 위한 티미딘 키나제 프로모터 및 폴리아데닐화 부위를 갖는 하이그로마이신 내성 유전자; 및 앰피실린 내성 유전자 및 Escherichia coli에서 보전을 위한 복제의 colE1 기원을 제공한다. 상기 벡터는 XbaI와 NheI 제한 부위 사이에서 네 개의 연속되는 LexA 작용체(operator) 부위를 함유한다(Bunker and Kingston, 1994). 하기 HindⅢ-AscⅠ-BamHI-AscⅠ-HindⅢ의 제한 부위에 의해 구축된 다중연결자(polylinker)는 LexA 작용체들과 NheI 부위 사이에 끼워진다. pSV40/Zeo(Invitrogen V502-20)로부터 유도된, SV40 프로모터 및 폴리아데닐화 부위를 갖는 제오신 내성 유전자는 NheI 부위와 SalI의 사이이다; 이것은 STAR 스크린용 선별가능한 마커이다.
PSDH 벡터(도 2)는 하기와 같이 구성된다: pGL3-Control(Promega E1741)로부터의 루시페라제 리포터 유전자는 PCR로 증폭되고, SacⅡ/BamHI-소화된 pUHD10-3로 삽입된다(Gossen and Bujard, 1992). 이것은 Tet-Off 프로모터의 조절하에서 루시페라제를 SV40 폴리아데닐화 시그널의 상류에 위치하게 한다. 다중 클로닝 부위는 PCR, Tet-Off 프로모터의 상류(MCSI, XhoⅠ-NotⅠ-EcoRⅠ-SalⅠ) 및 폴리아데닐화 시그널의 하류(MCSⅡ, NheⅠ-BglⅡ-EcoRⅤ-HindⅢ)로 도입된다. 유전자 라이브러리는 인간 게놈 DNA의 Sau3AI 소화, 태반(Clontech 6550-1)에서 정제된 또는 박테리아/P1(BAC/PAC) 인공 염색체에서 수행되는 것 중 하나에 의해 구성된다. BAC/PAC 클론은 1q12 세포유전학 영역(클론 RP1154H19 및 RP1170019) 또는 항상성의(homeotic) 유전자(클론 RP1167F23, RP1170019 및 RP11387A1)의 HOX 집단으로부터의 게놈 DNA를 함유한다. DNAs는 크기-분류되고, 0.5-2.0kb 크기 분류는 표준적인 기술(Sambrook et al., 1989)에 의해서, BamHⅠ-소화된 pSelect 벡터로 결찰된다.
숙주 균주의 구성은 개시되어 왔다(van der Vlag et al., 2000). 간략하게는, 그것들은 U-2 OS 인간 골육종 세포주(American Type Culture Collection HTB-96)를 기초로 한다. U-2 OS는 pTet-Off 플라스미드(Clontech K120-A)로 안정하게 트랜스펙션되고, Tet-억제제 DNA에 결합하는 도메인 및 VP16 트랜스활성화(transactivation) 도메인으로 구성하는 단백질 키메라를 코드화한다. 세포주는 연속적으로 LexA DNA에 결합하는 도메인 및 HP1 또는 HP2(DNA을 속박하는 경우에 유전자 발현을 억제하는 두개의 Drosophila Polycomb군 단백질) 중 하나의 코팅하는 영역을 함유하는 융합 단백질 유전자로 트랜스펙션된다. LexA-억제제 유전자는 Tet-Off 전사 조절 시스템의 조정하에 있다(Gossen and Bujard, 1992).
라이브러리 스크리닝 및 STAR 요소 특성화. pSelect에서의 유전자 라이브러리는 트랜스펙션 시약의 공급자(Life Technologies)로부터 제조된 바와 같이, 칼슘 포스페이트 침전(Graham and van der Eb, 1973; Wigler et al., 1978)에 의해서 U-2 OS/Tet-Off/LexA-억제제 세포주로 트랜스펙션된다. 트랜스펙션된 세포는 1주일(50% 집합)동안 하이그로마이신 선별법(25㎍/㎖) 및 테트라시클린 억제(독시시클린, 10ng/㎖) 하에서 배양된다. 그런 다음, 독시시클린 농도는 0.1ng/㎖로 감소되고, LexA-억제제 유전자를 유도하고, 2일 후 제오신 250㎍/㎖을 첨가한다. 상기 세포는 대조군 배양(빈 pSelect로 트랜스펙션된)이 제오신에 의해 죽을 때까지 추가로 4-5주동안 배양된다.
라이브러리 트랜스펙션으로부터 제오신-내성 콜로니를 증식시키고, 플라스미드 DNA는 단리되고, 표준적인 기술(Sambrook et al., 1989)에 의해 E. coli로 해방된다. 해방된 DNA에서 후보 STAR 요소는 제한 엔도뉴클라제 맵핑(mapping)(Sambrook et al., 1989), DNA 서열 분석(Sanger et al., 1977)에 의해 분석되고, U-2 OS/Tet-Off/LexA-억제제에 재-트랜스펙션 및 독시시클린 농도를 낮춘 후 STAR 활성(제오신 내성)을 위하여 분석된다.
인간 게놈에서 알려진 서열에 상응하는 DNA 서열을 갖는 후보 STAR 요소는 인간 게놈 데이타베이스(http://www.ncbi.nlm.nhi.gov/genome/seq/HsBlast.html 20 June 2001)의 BLAST 조사(Altschul et al., 1990)에 의해 동정된다. 상기 요소의 염색체 위치는 반복적인 DNA의 비율 및 인근 유전자의 동일성에 따라 기록된다.
재-트랜스펙션에서 STAR 활성를 보여주는 그것들의 후보물질은 STAR 단편을 pSDH 플라스미드로 서브클로닝하고 U-2 OS 염색체 DNA에서 안정하게 통합하는 것으로 추가 특성화된다. pSDH 플라스미드는 pBABE-puro으로 U-2 OS 세포에 코-트랜스 펙션되고(Morgenstern and Land, 1990), 퓨로마이신 내성을 위해 선별된다. STAR 단편마다, 대략 30개의 개별 클론의 개체군이 단리되고 배양된다. 상기 클론은 제조업자의 지침에 따라서 루시페라제 활성에 대하여 정기적으로 평가된다(Roche 1669893).
결과
STAR 요소의 기능적인 특성화. 인간 게놈 DNA의 스크린 및 HOX 및 1q12 유전자좌의 스크린은 17개의 선의의 STAR 요소를 산출한다. 기준은 (1) 상기 요소가 숙주 U-2 OS 인간 골육종 세포주로 pSelect-기초 클론의 재-트랜스펙션에서 STAR 활성을 개시함(초기 스크린에서 발현된 항-억제제 활성이 플라스미드-특이적이지만 숙주세포에서 인공적인 변화에 기인한 것이 아닌 것을 나타내는); (2) 상기 요소가 인간 게놈 서열 데이타베이스에서의 서열을 대등하는 DNA 서열을 함유함(클론은 예를 들어 박테리아 또는 벡터으로부터 오염된 DNA 서열을 함유하지 않는 것을 가리키는)이다.
STAR 요소는 pSDH 플라스미드로 서브클론되고 숙주세포 게놈으로 통합된다. 리포터 유전자의 발현은 안정한 트랜스펙턴트의 개체군에서 평가되어 STAR 요소의 능력이 게놈에서 무작위적으로 통합 후 침묵으로부터 리포터 유전자를 보호하는 것을 예증한다. 이것은 (1) 높은 발현을 나타내는 클론의 개체군에 대한 그리고 (2) STAR 요소에 의해 알려지는 과잉-발현의 정도에 대한 정보를 제공한다.
클론에 의한 루시페라제 리포터 유전자의 발현은 그것이 STAR 요소를 포함하지 않는 플라스미드(참조 수준)에 대한 평균 수준이상의 2배이라면 중요하게 고려 된다: 모든 플라스미드의 경우, 발현 수준에서의 분포는 무발현에서 참고 수준이상으로 현저하게 발현하기까지, 몇몇개의 과잉-발현제에서 많은 과잉-발현제까지의 클론 사이에서 관측된다. 뛰어난 STAR 활성은 약간의 높은 과잉발현하는 클론을 포함하는 많은 과잉발현하는 클론을 가져다 주는 플라스미드에 의해 명확하게 된다. 전형적인 실험의 결과는 표 1 및 도 3-5에서 나타낸다:
상기 결과는 시험되어진 인간 STAR 요소가 보호되지 않은 리포터 유전자 또는 Drosophila SCS 요소로 보호되는 것보다 더 높은 과잉발현하는 클론의 개체군을 산출하는 것을 나타낸다(Kellum and Schedl, 1992). 또한, 이들 플라스미드의 과잉발현의 정도는 보호되지 않는 또는 SCS-보호된 리포터보다 STAR-보호된 리포터에서 훨씬 더 크다.
STAR 요소 서열 및 게놈 위치 데이타. 표 2는 인접한 유전자의 동일성 및 상기 요소의 반복적인 DNA 함량뿐만 아니라 17개의 STAR 요소 각각의 염색체 위치를 기재한다. STAR 요소는 많은 염색체 전체로 분포된다. 그것들은 그것들의 실제 DNA 서열 및 반복적인 DNA 상황에서 다양하고, 이웃한 유전자와 관련된 다양한 정도를 나타낸다.
SINC 요소 스크린
재료 및 방법
SINC 스크린, pSINC-Select를 위한 플라스미드("pSS", 도 6)는 하기와 같이 구성된다: pREP4 벡터(Invitrogen V004-50)은 플라스미드 골격으로 사용된다. 복제의 Epstein Barr oriP 근원 및 영장류 세포주에서 고-카피 에피솜 복제의 EBNA-1 핵산 항원을 제공한다; 포유동물 세포에서의 선별을 위한, 티미딘 키나제 프로모터 및 폴리아데닐화 부위를 갖는 하이그로마이신 내성 유전자; 및 앰피실린 내성 유전자 및 Escherichia coli에서 보전을 위한 복제의 colE1 근원. 상기 벡터는 Tet-Off 전사 조절 시스템에 의해 조정하기 위하여, 플라스미드 pUDH10-3으로부터의 탠덤(tardem) Tet 감응성 요소(TREs)으로 이루어진(Gossen and Bujard, 1992) Tet-Off 프로모터를 함유한다. TREs는 codA::upp 유전자의 발현을 조절한다(사이오신 데아미나제/우라실 포르포리보실트랜스퍼라제; Invivogen porfcodaupp). 이것은 소위 "자살 유전자"이다; codA::upp 효소의 활성은 프로드럭 5-플루오로시토신(5-FC)을 독성 약물, 플루오로우라실(5-FU)로 변환하고, 이것은 세포자멸사 및 세포 죽음을 일으킨다(Mullen et al., 1992; Tiraby et al., 1998; Wei and Huber, 1996). Tet-Off 프로모터로부터의 상류는 스크린용 Sau3AI-소화된 게놈 DNA을 클로닝하기 위한 BglⅡ 제한 부위이다. pREP4 DNA는 클론된 SINC 요소에 의한 pREP4 요소에서 필수적인 플라스미드 요소의 침묵을 방해하기 위하여 STAR 요소에 의한 게놈 DNA 및 자살 유전자로부터 분리된다. 인간 염색체 22번을 포함하는 BAC 클론의 라이브러리로부터 게놈 DNA(Invitrogen/Research Genitics 96010-22)는 Sau3AI에 의해 부분적으로 소화되고, BglⅡ-소화된 pSS로 결찰된다(Sambrook et al., 1989). 재조합 플라스미드의 라이브러리는 트랜스펙션 시약의 공급으로 제시된 바(Life Technologies)와 같이 칼슘 포스페이트 침전물에 의하여 U-2 OS/Tet-Off 세포주로 트랜스펙션된다(Graham and van der Eb, 1973; Wigler et al., 1978). 트랜스펙션된 세포는 3주동안 하이그로마이신 선별법(25㎍/㎖) 및 테트라시클린 억제법(독시 시클린, 10ng/㎖) 하에서 배양된다. 그런 다음, 5-FC는 1㎍/㎖의 농도로 첨가되고, 세포는 SINC 요소를 선별하기 위해 추가로 3주동안 배양된다.
후보 SINC-함유 클로니는 채집되고, 프라이머 PCR1 및 PCR2로 폴리머라제 연쇄 반응에서 사용된다(도 6); PCR 생성물은 HindⅢ 및 XhoI 제한 엔도뉴클레아제로 소화되고, 통상적인 기술(Sambrook et al., 1989)에 의하여 pBluescriptⅡ SK(+)(Stratagene 212207)로 클로닝된다. 후보 SINC 요소의 DNA 서열은 결정되고(Sanger et al., 1977), 그리고 인간 게놈에서 상응하는 서열은 인간 게놈 데이타베이스(http://www.ncbi.nlm.nih.gov/genome/seq/HsBlast.html 2001년 6월 20일)의 BLAST 조사(Altschul et al., 1990)에 의하여 동정된다. 상기 요소의 염색체 위치는 반복적인 DNA 및 인접한 유전자의 동정화에 비율에 따라서 기록된다.
결과
선별 기간의 말단부에서, 어떠한 콜로니도 대조군 배양(빈 pSS)에서는 명확하지 않고, 많은 콜로니는 게놈 DNA를 갖는 pSS를 함유하는 배양에서는 명확하다. 이들 생존한 클론은 후보 SINC 요소를 함유한다. 상기 요소는 PCR에 의하여 기록되고, 표준 클로닝 벡터, pBluescript로 서브클로닝된다. 상기 요소의 DNA 서열은 결정되고, 인간 게놈 서열과 비교된다(표 3). 모든 경우에서, 서열화된 요소는 예상한 바와 같이 염색체 22에서 발견된다.
실시예 2. STAR, SINC 또는 화합된 STAR/SINC에 기인하는 트랜스유전자의 발현 특성화.
배경: 부위-특이적인 재조합은 그것들의 염색체 위치에서 이형의 DNAs를 정 확하게 제거하기 위해 사용된다. 이것은 두 개의 시스템 중 하나로 일반적으로 실행된다: 박테리오파지 P1의 cre 레콤비나제 및 loxP 표적화(Feng et al., 1999), 또는 효모의 FLP 레콤비나제 및 FRT(FLP 레콤비나제 표적화)(Wigley et al., 1994). 이들 시스템에서, DNA 영역(일반적으로 리포터 유전자 및/또는 선별가능한 마커를 포함하는)은 loxP 또는 FRT 표적화에 의하여 염색체에서 플랭킹한다. 그런 다음, 레콤비나제의 활성은 염색체로부터 DNA 영역의 정확한 적출을 촉진한다. 상기 레콤비나제는 단일 부위에서 두개의 재인식 서열을 분해하고, 그것들 사이의 서열을 결실한다. 그러므로, DNA의 전장은 표적 부위에 의해 플랭킹될 것이고, 결과적으로 레콤비나제의 도입 또는 활성에서 인 비보로 결실된다(Schwenk et al., 1995; Dymecki, 1996). Cre 및 Flp 레콤비나제는 두 개의 13-염기쌍 전화한 반복 사이에서 재조합을 촉진하고, 최소한의 6(loxP) 또는 8(FRT) 염기쌍을 갖는 스페이서에 의해 분리된다(Senecoff et al., 1985). loxP 서열은 ATAACTTCGTATA이고 FRT 서열은 GAAGTTCCTATAC이다.
프로토콜: 통상적인 DNA 클로닝(Sambrook et al., 1989)를 사용하여, 리포터 유전자(예를 들어, 녹색 형광 단백질(GFP)과 같은 리포터 단백질을 코드화하는)(Bierhuizen et al., 1997) 또는 루시페라제(Himes and Shannon, 2000)은 한 쌍의 STAR 요소에 의해, 한 쌍의 SINC 요소에 의해, 또는 한 쌍의 STAR/SINC 조합 요소에 의해 플라스미드에서 플랭킹되는 것으로 구성된다. 각각의 경우에, 상기 요소는 그들 스스로 레콤비나제 표적 부위에 플랭킹된다. 한 요소는 한 쌍의 loxP 부위에 의해 플랭킹되고, 다른 것들은 한 쌍의 FRT 부위에 의해 플랭킹된다(도 1). 플 라스미드의 트랜스펙션은 세포의 적은 퍼센트로 숙주 염색체로 통합되고, 필수 요소는 항생물질 내성으로 선별된다. 유사한 구성물은 세개의 시험 요소(STAR, SINC, STAR/SINC) 각각에 대하여 제조된다.
통상적인 기술("SuperFect Transfection Reagent Handbook", Qiagen, November, 1997)을 사용하여, 이들 플라스미드는 U-2 OS 인간 골육종 세포주로 트랜스펙션되고, 하이그로마이신 내성에 대하여 선별된다. 하이그로마이신-내성 단리물은 세포주의 게놈으로 안정하게 통합되는 플라스미드를 갖는다. 개별적인 단리물은 세포 배양 배지에서 증식되고, 트랜스제닉 리포터 유전자의 발현은 예를 들어, 유속 세포계측기에 의하여 평가된다(Stull et al., 2000).
그 다음, 통상적인 기술(트랜스펙션, 또는 호르몬 자극)을 사용하여, 상기에서부터 안정한 단리물은 레콤비나제 활성을 도입하거나 또는 활성화하기 위해 처리된다. 이것은 연속적으로 예를 들어, cre 레콤비나제 활성이 STAR1의 적출을 촉진하고, 연속적으로 FLP 레콤비나제 활성이 STAR2의 적출을 촉진하는 것으로 이루어진다. 이들 세포에서 리포터 유전자의 발현 수준은 평가되고, 상기 값은 어버이의, STAR-함유 단리물의 참고값과 비교된다.
실시예 3. STAR의 서열분석; 요소 기능에 대한 최소의 기본적인 서열의 결정; 요소 사이의 서열 보존; 및 탠덤 및 다중 요소의 성질
배경: STAR 또는 SINC 요소를 함유하는 DNA 단편은 개별적으로 pSelect(도 1) 또는 pSS(도 6) 플라스미드를 사용하여 유전학적인 선별법으로 단리된다. 이 선별법은 STAR 또는 SINC 활성을 갖는 그것들의 단편에서의 DNA 서열을 특성화시키는 접근을 개시한다.
프로토콜:
DNA 서열: 올리고뉴클레오티드는 DNA 단편을 서열화하기 위한 pSelect 및 pSS 선별 플라스미드의 서열을 기초로 하여 고안되었다. 상기 단편은 디데옥시 사슬 종결 기술을 사용하여 서열화된다(Sanger et al., 1977). 그 다음, DNA 서열은공공의 인간 게놈 서열 데이타베이스(http://www.ncbi.nlm.nih.gov:80/cgi-bin/Entrez/hum_srch?chr=hum_chr.inf&query)를 사용하여 염색체 위치를 결정하게 된다. 단편 서열의 부근에서 유전자 및 유전자 밀도를 게놈 서열 주석으로부터 기록된다. 이들 유전자의 전사 활성은 DNA 마이크로어레이(http://arrays.rockefeller.edu/xenpus/links.html) 및 SAGE(Serial Analysis of Gene Expression;http://bioinfo.amc.uva.nl/HTM-bin/index.cgi) 데이타로부터 결정된다.
STAR 및 SINC 서열에서 위치의 정보가 편집되는 즉시, 상기 데이타는 내재하는 컨센서스 서열의 관점에서 분석된다. 컨센서스 서열 또는 동향(이것이 예를 들어, C 및 G 염기가 풍부한 것과 같은 특정 뉴클레오티드 조합이 풍부한 국지적인 구역이라는 것으로 이해되는)은 clustalw(Higgins et al., 1996) 및 블로섬 유사성 평점화(Altschul and gish, 1996)와 같은 유사성조사 알고리즘을 사용하여 탐지될 수 있다. 그 다음, 어느 내재하는 컨센서스 또는 발견된 동향은 BLAST 조사를 수행하는 것으로 게놈 규모에서 다른 잠재적인 STAR를 동정하기에 사용될 수 있다. 이전의 조사는 알려진 절연체 및 경계 요소에 결합하는 전사 조절 단백질을 동정하고 있다(Gaszner et al., 1999; Gerasimova and Corces, 1998). 개시된 실시예에서, 단백질 결합 부위는 절연체 또는 경계 기능에 핵심적인 DNaseⅠ 과민성 부위와 같은 공간을 차지한다. STAR 요소가 또한 알려진 조절 단백질에 의해 결속된다는 가설은 STAR 요소에서 발생하는 서열 모티브에 대한 전사 인자의 TRANSFAC 데이타베이스(http://transfac.gbf.de/TRANSFAC)를 조사하는 것으로 검사된다. 서열 모티브는 STAR 또는 SINC 집단원 사이에서 일반적인 서열 모티브는 상응하는 전사 인자가 그 요소에 결합한다는 것을 나타내는 표시기이다.
최소의 기본적인 서열: 이 서열 지식을 사용하여 STAR(또는 SINC) 요소는 잘리고, 기능성에 대하여 시험된다. 이것은 표준적인 기술(Sambrook et al., 1989)에 의해 pSelect 또는 pSS로 단편을 함유하는 STAR- 또는 SINC-의 서브-단편을 클로닝하는 폴리머라제 연쇄 반응(PCR)을 사용하여 이루어진다. 서브-단편을 포함하는 플라스미드는 U-2 OS 세포로 트랜스펙션되고, 항생물질 내성(STAR 요소) 또는 프로드럭 내성(SINC 요소)에 대하여 평가하는 것으로 기능성에 대하여 시험된다.
방향성: STAR 및 SINC 요소는 개별적으로 pSelect 및 pSS 플라스미드를 사용하여 그들의 방향성에 대하여 시험된다. 예를 들어, pSelect 스크린에 의하여 단리된 STAR 요소의 방향은 5' 3' 배향으로 간주된다.
상기 요소의 배향은 통상적인 재조합 DNA기술(Sambrook et al., 1989)에 의하여 역행된다. 생성된 플라스미드는 U-2 OS 세포주로 트랜스펙션되고, 리포터 유전자의 발현은 평가된다(Bierhuizen et al., 1997; Himes and Shannon, 2000). 역배향 요소를 갖는 플라스미드로부터의 발현의 수준은 5' 3' 배향의 것과 비교된다. 역배향 플라스미드가 유사한 발현 수준을 갖는다면, STAR 요소는 방향성을 나타내지 않는다.
요소의 조합 및 다중화: STAR 요소가 혼합된 쌍에서 기능하는지를 결정하기 위해서, 다른 요소는 결합되고 시험된다. 분석은 재조합 DNA 기술에 의하여 MCSI에서 하나의 STAR 요소 및 MCSⅡ에서 다른 STAR를 삽입하는 것으로 pSDH 플라스미드에서 수행된다(Sambrook et al., 1989). 생성된 플라스미드는 트랜스펙션되고 리포터 유전자의 발현은 평가된다(Bierhuizen et al., 1997; Himes and Shannon, 200); 결과는 MCSI 및 MCSⅡ에서 동일한 요소를 함유하는 플라스미드로부터의 발현으로 비교된다; 발현이 플라스미드의 두 유형에 대하여 유사하다면, 다른 STAR 요소는 서로 간섭하지 않는다고 결론내어진다.
단일 STAR 또는 SINC 요소의 세기는 요소의 탠덤 반복으로 비교된다. 이것은 DNA 리가제와 관심의 STAR 또는 SINC 요소의 사슬형연결 및 재조합 DNA 기술(Sambrook et al., 1989)에 의해 pSDH 또는 pSS 플라스미드로 결찰 생성물을 도입하는 것에 의하여 이루어진다. 생성된 플라스미드는 U-2 OS 세포로 트랜스펙션되고, 리포터 유전자의 발현은 평가된다(Bierhuizen et al., 1997; Himes and Shannon, 2000); 결과는 단일 STAR 또는 SINC 요소를 포함하는 플라스미드로부터의 발현으로 비교된다.
실시예 4. STAR, SINC 또는 그것들의 조합이 기능하는 거리의 결정.
배경: STAR 요소는 단일 및 다중 트랜스유전자의 발현을 최적화하기 위하여 사용된다. 단일 쌍의 STAR 요소가 침묵으로부터 많은 또는 다중의 트랜스유전자를 보호할 수 있는가를 결정하기 위해서, STAR 요소가 활동하는 범위를 결정하는 것이 필요하다. 유사한 정보는 SINC 요소 및 STAR/SINC 조합에 대하여 결정한다.
프로토콜: STAR 및 SINC 요소는 하기와 같이, 각각 pSelect 또는 pSS에 기초한 유도체 플라스미드를 사용하여 거리 전체로 그것들의 기능성에 대하여 시험된다. 500bp 내지 10kb의 무작위 DNA 단편의 라이브러리는 표준 DNA 클로닝 기술(Sambrook et al., 1989)에 의하여 회합된다. 단편은 STAR 또는 SINC 활성을 갖지 않는 이 라이브러리로부터 상기한 바와 같이 pSelect 및 pSS 플라스미드에서의 시험에 의하여 선별된다. STAR 요소 및 STAR/SINC 조합의 경우, 이들 단편은 적절한 pSelect 플라스미드(도 1)에서의 클로닝 부위 및 리포터 유전자의 프로모터 사이에 삽입된다. 이 플라스미드 세트는 U-2 OS 세포주로 트랜스펙션되고, 발현은 상기와 같이 측정된다. 리포터 유전자 발현의 세기는 프로모터로부터 STAR 요소를 분리하는 무작위 DNA 단편의 길이와 상호관련된다. SINC 요소는 유사한 성향에서 사정된다: 무작위 DNA 단편은 적절한 pSS 플라스미드의 SINC 요소 및 프로모터 사이에 삽입되고, 리포터 유전자의 억제의 정도는 무작위 DNA 단편의 길이와 상호관련된다.
실시예 5 (a). STAR 요소에 대한 유전학 선별법에서 자연적으로 발생하는 SINC 요소의 사용.
배경: STAR 요소에 대한 현재의 스크린은 선별 플라스미드에서 선별가능한 마커의 억제를 제공하기 위하여 키메라 lexA-PcG 단백질을 사용한다. 자연적으로 발생하는 SINC 요소를 사용하여 선별을 반복하는 것으로, STAR 요소는 이들 자연적 으로 발생하는 SINC 요소에 기인한 억제 활성에 특이적인 것으로 동정된다.
SINC 요소 스크린은 "tet-off" 프로모터를 침묵시킬 수 있고 codA::upp 자살 유전자의 발현을 차단할 수 있는 게놈 DNA의 무작위적으로 생성된 단편을 동정하는 유전학적인 선별능력에 기초한다. 이 선별에서 회수된 SINC 요소는 게놈 침묵 요소의 무작위 샘플화를 나타내고, 요소의 다른 분류는 회수된다. 이 프로토콜의 경우, 이들 다양한 SINC 요소는 상기 lexA-PcG 기초 선별에서 회수되는 것들보다 STAR 요소의 다른 분류를 회수하도록 사용된다.
프로토콜: 현재의 선별법으로부터의 SINC 요소는 특성화되고, 기능적인 및 DNA 서열 특징을 기초로 하여 구분된다(기능적인 특징은 억제의 세기를 포함한다; 서열 특징은 동정가능한 보존 모티브를 포함한다; 실시예 3을 참조). 각 분류의 대표적인 요소는 표준 DNA 클로닝 기술(Sambrook et al., 1989)를 통하여 pSelect 플라스미드에서 lexA 결합 부위를 대체하도록 사용된다. 유전자 뱅크(bank)는 이들 새로운 플라스미드 각각으로 만들지고, 기재한 바와 같은 새로운, SINC-특이적인 STAR 요소를 동정하도록 사용된다(van der Vlag et al., 2000). 이것은 전체 게놈 DNA, 사용되어지는 SINC 요소도 포함하는 BAC 클론으로부터의 DNA로 이루어진다.
실시예 5(b). STAR 및 SINC 요소의 최대 길이의 결정.
배경: STAR 요소는 2kb미만의 게놈 DNA 단편으로 이루어진, pSelect 플라스미드를 사용하여 회수된 DNA의 단편로서 클로닝되었다. 하지만, 이것들은 더욱 확장된 STAR 요소의 일부분일 것이다. 확장된 STAR 활성은 하기의 실험으로 검사된다.
프로토콜: pSelect에서 클로닝된 STAR 요소는 인간 게놈 서열에 대하여 맵핑된다. 그것들이 더욱 확장된 STAR 요소의 일부분인지를 결정하기 위해서, 클론을 포함하는 4kb의 영역은 PCR에 의해 증폭되고, 표준 DNA 클로닝 기술(Sambrook et al., 1989)에 의하여 pSelect 및/또는 pSDH 플라스미드로 클론이 도입된다. 생성된 플라스미드는 U-2 OS 세포로 트랜스펙션되고, 상기와 같이 리포터 유전자 발현에 대하여 평가된다; 기존 2kb STAR 요소를 함유하는 플리스미드는 대조군으로 포함된다. 세 개의 가능한 결과가 기대될 수 있다: (1) STAR 요소가 확실히 기존 2kb 단편임을 예증하는, 대조군 및 확장된 STAR 단리물에 의한 유사 발현; (2) STAR 요소가 2kb 단편내에서 포함되고 원거리에서 효율적으로 작용하지 않는다는 것 또는 상기 확장된 단편이 SINC 요소를 함유하는 것을 제안하는, 확장된 STAR 단리물에 의한 더 낮은 발현; (3) 확장된 영역이 더욱 완전한 STAR 요소를 함유하는 것을 제안하는, 상기 확장된 STAR 단리물에 의한 더 높은 발현. 결과 (3)의 경우에, 실험은 6kb의 더 큰 PCR 단편으로 반복되었다.
STAR 요소는 또한 다양한 단백질이 결합하는 부위의 합성물일 수 있다. 그러므로 STAR 활성을 갖는 큰 DNA 단편은 STAR 활성을 갖는 더 작은 단편으로 분화될 수 있다(실시예 3 참조). 2kb보다 더 큰 요소는 그것들이 2kb미만으로 잘라진(내부 결실에 의한 것도 포함) 후에도 STAR 활성을 나타낸다면 STAR 요소로 인식될 것이다.
실시예 6. STAR 요소, SINC 요소, 또는 그것의 조합 및 인접한 트랜스유전자의 메틸화 및 히스톤 아세틸화 상태.
배경: STAR 및 SINC 요소의 조절 성질은 국부적인 염색질 구조와 관련되고, DNA 그 자체에 의해 그리고 DNA-관련 단백질에 의해 결정된다. 유전자 발현에서의 변화와 관련된 염색질 구조에서의 변화는 고분자(macromolecule)의 이차 변형, 특히, DNA의 메틸화 또는 히스톤 단백질의 아세틸화에 의해 종종 생성된다. STAR 및 SINC 요소에서 그리고 인접한 트랜스유전자에서 발생하는 이차 변형을 동정하는 것은 이들 요소에 대한 특질(hallmark)를 제공한다.
프로토콜: DNA 메틸화: STAR 또는 SINC 요소 또는 그것의 조합은 표준 기술(Sambrook et al., 1989)에 의해 pSelect 플라스미드로 클로닝된다. U-2 OS 세포는 리포터 유전자에서 기초 DNA 메틸화를 결정하기 위한 대조군으로서 STAR 또는 SINC 요소가 결핍된 pSelect와 함께, 이들 플라스미드로 안정하게 트랜스펙션된다. 세포는 채집되고 염색질은 표준 방법(Thomas, 1998)에 의해 정제된다. DNA는 분리된 반응에서 HpaⅡ 및 MspI 제한 엔도뉴클레아제로 소화된다(Sambrook et al., 1989). 이들 제한 효소 모두는 비-메틸화 서열 CCGG를 자를 수 있다. 외부 C가 메틸화된 경우, MspI 및 HpaⅡ 모두는 쪼개지지 않는다. 하지만, HpaⅡ와 같지 않은, MspI는 내부 C가 메틸화되는 경우에 서열을 쪼개질 수 있다. DNA는 서던 블로팅하게 되고, 상기 블롯은 간접적인 말단-표지화로 분석된다(Pazin and Kadonaga, 1998). 대조군으로서, 벗겨진, 비메틸화 DNA로서 상응하는 pSelect 플라스미드는 또한 기재된 효소로 잘리어지고 서던 블로팅하게 된다. 다른 크기의 DNA 단편의 대조는 DNA가 인 비보에서 메틸화되거나 되지 않는지를 밝혀낸다.
히스톤 아세틸화: DNA 메틸화 분석용으로 사용되는 동일한 트랜스펙션된 세 포주는 이들 실험을 위해 사용된다. 하기 방법은 STAR 및 SINC 요소 및 리포터 유전자에서 히스톤 아세틸화 패턴의 고해상 맵을 산출한다(Litt et al., 2001). 핵의 구상세균 뉴클레아제 다이제스트(digest)는 수크로스 기울기에 분별 증류되고, 정제된 뉴클레오솜 단량체 및 이량체는 항-아세틸히스톤 항체와의 면역침전으로 인하여 아세틸화 히스톤에 대하여 풍부해진다. 뉴클레오솜 분획 및 면역침전물은 예를 들어, 리포터 유전자 또는 STAR 또는 SINC 요소에 어니링(anealing)하는 프라이머 및 Taqman 프로브를 사용하여 0.1kb의 이동 창(moving window)을 갖는, 0.2kb 생성물을 산출하는 실시간 PCR(Jung et al., 2000)에 의하여 분석된다. 그 다음, PCR동안 Taqman 프로브 형광 시그널의 증가 속도(샘플에서 다량의 주형 DNA에 비례하는)가 측정된다. 뉴클레오솜 분획에서 다량의 주형 DNA의 비율은 리포터 유전자 및 STAR 또는 SINC 요소(또는 요소의 부재하에서의 리포터 유전자)에서 각 0.1kb에 대하여 히스톤 아세틸화의 패턴의 미세한 맵을 제공한다.
실시예 7. 인 비보 뉴클레오솜 위치화 및 DNAseⅠ 과민 부위
배경: 염색질은 DNA, 히스톤, 비-히스톤 단백질을 구성한다. 히스톤은 뉴클레오솜을 만들기 위한 ~150bp의 DNA로 감싼 핵심 입자를 형성한다. 뉴클레오솜은 50-75bp의 연결자 DNA에 의해 분리된다. 염색체 DNA에서 안정하게 위치화된 뉴클레오솜은 유전자 발현을 억제하고, 뉴클레오솜을 차단하는 인자 또는 그렇지 않으면 재모형 염색질은 이 억제를 극복할 수 있다. 염색체 영역에서 뉴클레오솜의 위치화는 구상세균 뉴클레아제(MNase) 평가법으로 분석된다; MNase는 연결자 DNA에서 차별적으로 염색질을 자른다. 유사하게는, DNA의 어떤 구역은 조성적으로 비-히스톤 단백질에 노출되고, 이들은 흔히 조절 영역, 즉 cis-활동 조절 인자가 결합하는 부위이다. 실험적으로, 이들 부위는 효소 DNaseⅠ에 의한 소화에 민감하다.
프로토콜: 리포터 유전자에서 및 STAR 또는 SINC 요소 중 하나에서 뉴클레오솜의 위치를 결정하기 위하여, MNase가 사용된다(Saluz and Jost, 1993). 핵세포는 배양된 U-2 OS 세포로부터 정제되고, 상기(히스톤 아세틸화)와 같이 MNase로 소화된다. STAR 또는 SINC 요소에서 또는 리포터 유전자에서 DNaseI 민감 부위에 대한 조사를 위하여, 정제된 핵세포는 상기(Wallrath et al., 1998)와 같이, 적절한 농도(예를 들면, 게놈 DNA 100㎍/㎖ 및 DNaseⅠ 20-100U/㎖)에서 DNaseI으로 처리된다. 벗겨진 DNA는 대조군으로서 DNaseI으로 소화된다. 양쪽 기술의 경우, 리포터 유전자 및 STAR 또는 SINC 요소는 상기(Tanaka et al., 1996; van der Vlag et al., 2000)와 같이, 프라이머 확장 또는 간접적인 말단-표지화 및 서던 블로팅을 사용하여 파인-맵핑(fine-mapping)된다. MNase 평가법은 STAR 또는 SINC 요소 또는 리포터 유전자에서 뉴클레오솜의 위치에 상응하는 자동 방사선 사진에서 불연속적인 밴드의 래더(ladder)를 드러낸다. DNaseⅠ 민감 부위는 벗겨진 DNA 대조군에서 부재한 또는 덜 주요한 생성된 자동 방사선 사진에서 불연속적인 밴드로서 분명하게 된다.
실시예 8. STAR 및 SINC 요소의 세포형, 조직 의존성 및 프로모터 의존성
배경: 어떤 절연체 또는 경계 요소는 조직 특이성을 나타낼 수 있다고 보고되고 있다(Takada et al., 2000). STAR 요소는 절연체 및 경계 요소와 공통적으로 많은 특징을 갖는다. 무차별적이고 조직-특이적인 STAR 및 SINC 요소 모두는 트랜 스제닉 응용에서 생물공학적인 가치를 갖는다. 하기 평가법은 세포형 의존성을 사정하기 위해 수행된다. 상기 요소들의 세포 및 조식 특이성은 추가로 DNA의 마이크로어레이의 공공의 데이타베이스 (http://arrays.rockeller.edu/xenopus/links.html) 및 SAGE (Serial Analysis of Gene Expression; http://bioinfo.amc.uva.nl/HTM-bin/index.cgi) 데이타를 사용하여, 인간 게놈에서 상기 요소들의 근처에서 유전자의 발현을 검사하는 것으로 검사된다.
프로토콜: STAR 요소는 pSDH 플라스미드에서 시험되고, SINC 요소는 pSS 플라스미드에서 시험된다. 세 개의 세포주는 표준 프로토콜을 사용하여 트랜스펙션된다: 인간 U-2 OS 골육종 세포주(Heldin et al., 1986), 아프리카 녹색원숭이 신장에서의 Vero 세포주(Simizu et al., 1967), 및 중국 햄스터 난소에서의 CHO 세포주(Kao and Puck, 1968). 세 개의 세포주 모두에서 기능할 수 있는 요소들은 무차별적인 것으로 분류된다. 하나 또는 두 개의 세포주에서만 활성을 나타내는 것들은 그것들 세포형 기능성에서 제한되는 것으로 분류된다.
프로모터 특이성: STAR 및 SINC 요소는 일반적으로 두 개의 프로모터, 사이토메갈로바이러스(CMV) 프로모터 또는 Tetracycline Response Element 및 최소의 CMV 프로모터(tTA 전사 활성화제와 조합하여)와 기능에 관련하여 선별되고 시험된다. 프로모터 특이성을 사정하기 위하여, STAR 및 SINC 기능은 다른 일반적으로 사용되는 바이러스 프로모터, 즉 유인원 바이러스 유형 40(SV40) 초기 및 후기 프로모터, 아데노바이러스 E1A 및 주요 후기 프로모터, 및 Rous 육종 바이러스(RSV) 긴 터미널 반복 으로 시험된다(Doll et al., 1996; Smith et al., 2000; Weaver and Kadan, 2000; Xu et al., 1995). 이들 프로모터 각각은 개별적으로, STAR 또는 SINC와 함께 표준 기술(Sambrook et al., 1989)에 의해서 pSelect 및 pSS 플라스미드로 분리하여 클론된다. 생성된 플라스미드는 상기와 같이, U-2 OS 세포주로 트랜스펙션되고, 리포터 유전자 발현에 대하여 평가된다. 이들 프로모터를 침묵시키는 SINC 요소 또는 침묵에 대항하여 보호하는 STAR 요소의 능력은 STAR 또는 SINC 요소가 결핍된 플라스미드와 비교하는 것으로 결정된다.
실시예 9. STAR 및 SINC 요소의 개량 방법
배경: 개량된 STAR 및 SINC 요소는 개발되어 있다. 개량은 항-억제적인 또는 억제적인 활성의 증가된 세기, 및 유도가능하고 조직-특이적인 활성을 갖는 요소를 산출한다. 이들 활성은 기술의 조합으로 이루어진다.
프로토콜
강제적인 진화: 오류-유발성(Error prone) PCR(Cherry et al., 1999; Henke and Bornscheuer, 1999)는 평균적으로 요소당 하나 내지 두 개의 점 돌연변이(point mutation)로 도입되도록 사용된다. 돌연변이된 요소는 예를 들어, 형광활성된 세포 구분 및 항생물질 내성에 의한 리포터-선별가능한 마커 융합 단백질을 함유하는 pSelect(또는 pSS) 플라스미드를 사용하여 스크린된다(Bennett et al., 1998). 오류-유발성 PCR 및 선별법의 뒤이은 과정은 활성에서 추가 개량을 갖는 요소를 유도하기 위해 실행된다.
탠덤 및 이형 조합: 상기한 바와 같이, 요소들의 탠덤 및 이형의 조합은 단 일 요소에 비교하여 활성에 대하여 시험된다(실시예 3).
STAR 및 SINC 요소의 관련된 우성(dominance)는 원칙대로 하나하나씩 시험된다. 그것은 요소의 세기를 시험하는 데에 사용되고 있다; 예를 들어, 새로운 STAR요소가 알려진, 강한 SINC 요소에 지배적이라면, STAR는 매우 강한 것으로 분류된다. STAR 및 SINC사이의 우성 연관성이 세포형-, 조직- 또는 프로모터-특이적이라는 가능성은 또한 고려된다(실시예 8). 상기 우성 시험은 표준 재조합 DNA 기술(Sambrook et al., 1989)에 의해 개별적인 STAR 요소의 상류를 대체하는 개별적인 SINC 요소를 갖는, pSelect 플라스미드를 활용한다. 상기 플라스미드는 U-2 OS 세포에 트랜스펙션되고, 리포터 유전자 발현은 평가된다. SINC 우성은 STAR 우성이 SINC 요소만을 갖는 플라스미드보다 더 높게 발현되는 것이 명백한 반면에, STAR 요소만을 갖는 플라스미드보다 더 낮게 발현되는 것이 명백하다.
신규한 성질을 첨가하기 위한 STAR 및 SINC 요소에 대한 다른 DNA-결합 단백질의 결합 부위의 도입(예를 들어, 유도가능성, 조직 특이성)
배경: 조절가능한 STAR 및 SINC 요소는 시그널-의존 DNA 결합 단백질에 대한 결합 부위를 갖는 그것들을 화합하는 것으로 만들어진다. 하나의 실시예에서, 이것은 STAR 또는 SINC 또는 STAR/SINC 조합 및 당성피질성 감응 요소(GRE)의 병치를 포함할 것이다. 당성피질성 감응 요소의 부재하에서, STAR 또는 SINC 요소는 기재된 바와 같은 기능을 할 것이다. 자극시에는, 자연적으로 발생하는 당성피질성 수용체는 GRE에 결합하고 STAR 또는 SINC 기능을 방해할 것이다.
프로토콜: 통상적인 DNA 클로닝(Sambrook et al., 1989)을 사용하여, GRE는 개별적으로 STAR 또는 SINC 요소에 인접한 pSelect 또는 pSS 벡터에로 도입된다. 상기 플라스미드는 상기와 같이, U-2 OS 세포로 트랜스펙션된다. 세포는 두 배양액으로 분리된다; 하나는 당성피질성(10μM)으로 처리된다. 리포터 유전자의 발현은 측정되고 두 개의 배양액 사이에서 비교된다. 발현에서의 차이는 시그널-의존 DNA-결합 단백질의 활동에 의한 STAR 및 SINC 기능을 조절하는 능력을 예증한다.
무차별 STAR 및 SINC 요소: 이들 성질을 시험하거나 또는 증대하는 것은 다른 세포주에서의 배양, 및 항생물질 선별법이 없는 장기간 배양을 포함한다.
실시예 10. 트랜스유전자의 보전에 대한 지속적인 선별법의 요구를 예방하는 STAR 및 SINC 요소.
배경: 트랜스제네시스에서, 선별 마커에 대한 의존성은 두 개의 골격을 갖는다: 선별 제제는 일반적으로 비싸고, 세포에 대한 대사 비용을 수행한다. 그리고, 트랜스제닉 응용에서 선별가능한 마커를 포함하는 것에 대한, 특히 트랜스유전자 자체가 생성물내에 있다면(예를 들어, 농산물, 유전자 치료 벡터), 단속 및 윤리적인 반대가 있다. STAR 및 SINC 요소는 트랜스제닉 단리물을 설립한 후, 선별을 보전하는 요구를 감소 또는 제한한다. 결과적으로, 내성 유전자는 트랜스유전자 발현의 감소된 손실을 갖는 부위-특이적인 재조합에 의해 트랜스제닉 게놈으로부터 제거될 수 있다.
프로토콜: 리포터 유전자를 플랭킹하고 염색체적으로 통합된 STAR 요소를 함유하는 안정하게 트랜스펙션된 U-2 OS 세포주는 상기한 바와 같이 트랜스-활동 항생물질 내성 플라스미드를 갖는 pSDH 플라스미드의 코-트랜스펙션에 의하여 생성된 다. 실험은 선별의 부재하에서 연장된(3-6개월) 배양동안 이들 세포주에서 리포터 유전자 발현 수준의 안정성을 시험하는 것을 포함한다. 이것은 pSDH 플라스미드에서 루시페라제 또는 GFP 리포터 유전자를 플랭킹하는 STAR 요소로 시험된다. 항생물질 내성 유전자는 항생물질 선별 마커가 레콤비나제 표적 부위에 의하여 플랭킹하는 발현 플라스미드(pSDH에 기초한)를 구성하는 것에 의해 제거된다. 상기 선별가능한 마커는 상기한 바와 같이, 이어서 레콤비나제 활성에 의해 잘린다.
실시예 11. 발현 시스템에서 STAR 요소의 적용으로 개선되는 예측가능성 및 수율
전사 억제의 영향을 차단하는 기능을 하는 STAR 요소는 트랜스유전자 발현 단위에서 영향을 준다. 이들 억제 영향은 이종염색질("위치 효과", (Boivin & Dura, 1998)) 또는 트랜스유전자의 인접한 카피("반복-유도된 유전자 침묵", (Garrick et al., 1998))에 기인할 수 있다. 이형의 단백질 생산에 대한 STAR 요소의 이익 중 두 가지는 고-발현 초기 재조합 숙주세포를 찾는 것에 대한 증가된 예측가능성, 및 생산 순환동안의 증가된 수율이다. 이들 이익은 이 실시예에서 예증된다.
재료 및 방법
pSDH 벡터 및 STAR 함유 유도체의 구성: pSDH-Tet 벡터는 프라이머 C67 및 C68(모든 PCR 프라이머 및 변이유발소의 올리고뉴클레오티드는 표 5에 등재된다)을 사용하여 플라스미드 pREP4-HSF-Luc(van der Vlag et al., 2000)로부터 루시페라제 개방 리딩프레임의 폴리머라제 연쇄 반응 증폭(PCR), 및 SacⅡ/BamHI-소화된 pUHD10-3으로 SacⅡ/BamHI 단편의 삽입(Gossen & Bujard, 1992)에 의해 구성되었 다. 루시페라제 발현 단위는 프라이머 C65 및 C66으로 재증폭되고, 두 개의 다중 클로닝 부위(MCSI 및 MCSⅡ)로 그것을 플랭킹하기 위해 pUHD10-3으로 재삽입되었다. 그 다음, AscI 부위는 EcoRI으로의 소화 및 연결자(어닐링된 올리고뉴클레오티드 D93 및 D94에 의해 구축된)의 삽입에 의하여 MCSI로 도입된다. CMV 프로모터는 프라이머 D90 및 D91로 플라스미드 pCMV-Bsd(Invitrogen K51001)에서 증폭되고, SalI/SacⅡ 소화 및 벡터 pSDH-CMV를 만들기 위한 결찰에 의하여 pSDH-Tet에서 Tet-Off 프로모터를 대체하는 데에 사용된다. 이 벡터에서의 루시페라제 개방 리딩프레임은 SEAP(분비 알칼리성 포스파타제)에 의하여 하기와 같이 대체되었다: 벡터 pSDH-CMV는 SacⅡ 및 BamHI으로 소화되고 블런트(blunt)되었다; SEAP 개방 리딩프레임은 EcoRI/SalI 소화에 의하여 pSEAP-베이직(basic)(Clontech 6037-1)로부터 단리되고, 블런트되고 pSDH-CMV로 결찰되어 벡터 pSDH-CS로 만들어졌다. SV40 프로모터 조절하에서 퓨로마이신 내성 유전자는 프라이머 C81 및 C82를 사용하여, PCR에 의하여 플라스미드 pBabe-Puro(Morgenstern & Land, 1990)으로부터 단리되었다. 이것은 NcoI/XbaI로 소화된 벡터 pGL3-대조군(BamHI 부위 제거된)로 결찰되어 pGL3-puro를 만들었다. pGL3-puro는 BglⅡ/SalI으로 소화되어 SV40-puro 내성 유전자를 단리하고, 이것은 블런트되고, 그리고 NheI 소화된, 블런트-말단 pSDH-CS로 결찰된다. 생성된 벡터, pSDH-CSP는 도7에서 나타낸다. 모든 클로닝 단계는 종래의 기술분야에서 알려진 방법에 따라서, 시약의 제조업체에서 제공된 지침서에 따라 실행되었다(Sambrook et al. 1989).
STAR 요소는 두 단계로, 적당한 제한 효소로 STAR 요소 및 pSDH-CSP 벡터의 소화 및 뒤이은 결찰에 의하여, MCSI 및 MCSⅡ로 삽입되었다. 재조합 pSDH 벡터는 STAR 요소의 배향은 제한 맵핑으로 결정되었다. 삽입물의 동일성 및 배향은 DNA 서열 분석으로 입증되었다. 서열화는 제조업체의 지침처에 따라서, Beckman CEQ2000 자동화 DNA 서열기를 사용하는 디데옥시 방법(Sanger et al., 1977)으로 수행되었다. 간략하게, DNA는 QIAprep Spin Miniprep 및 Plasmid Midi Kits(QIAGEN 27106 및 12145, 개별적으로)를 사용하여 E. coli로부터 정제되었다. 순환 서열화는 염료 종결자(CEQ Dye Terminator Cycle Sequencing Kit, Beckman 608000)의 존재하에서, 주문한(custom) 올리고뉴클레오티드 c85, E25 및 C42(표 5)를 사용하여 실행되었다.
pSDH 플라스미드를 이용한 CHO 세포의 트랜스펙션 및 배양: 중국 햄스터 난소 세포주 CHO-K1 (ATCC CCL-61)은 37℃/5% CO2에서 글루타민 2mM, 페니실린 100U/㎖ 및 스트렙토마이신 100㎍/㎖를 함유하는 HAMS-F12 배지 + 10% 소태아 혈청에서 배양하였다. 세포는 제조업체에 의해 개시한 바와 같이 SuperFect(QIAGEN)을 사용하여, MSCI 및 MCSⅡ에서 STAR6 또는 STAR49를 함유하는 그것의 유도체, 및 pSDH-CSP 벡터를 이용하여 트랜스펙션되었다. 간략하게, 세포는 배양 용기에 살포되고 70-90% 군집이 되도록 하룻밤동안 성장되었다. SuperFect 시약은 마이크로그램당 6마이크로리터의 비율(예를 들어, 10㎝ 페트리 접시, 20㎍ DNA 및 120㎕ SuferFect)에서 플라스미드 DNA(Pvul로 소화되는 것으로 이 실시예에서 선형화된)와 화합되고, 세포에 첨가되었다. 하룻밤동안 인큐베이션한 후, 트랜스펙션 혼합물은 신선한 배지로 대체되고, 트랜스펙션된 세포는 추가로 인큐베이션되었다. 하룻밤동안 배양한 후, 퓨로마이신 5㎍/㎖을 첨가하였다. 퓨로마이신 선별은 개별적인 퓨로마이신 내성 CHO/pSDH-CSP 클론이 무작위로 단리되고 추가로 배양된 후인, 2주에서 완성되었다.
분비 알칼리성 포스파타제(SEAP) 평가: CHO/pSDH-CSP 클론의 배양 배지에서 SEAP 활성(Berger et al., 1988, Henthorn et al., 1988, Kain, 1997, Yang et al., 1997)은 제조업체에서 기재한 바와 같이 결정되었다(Clontech Great EscAPe kit #K2041). 간략하게, 배지의 부분표본은 65℃에서 비활성화된 다음, 평가 완충용액 및 CSPD 화학냉광의(chemiluminescent) 기질과 화합되고, 10분 동안 실온에서 인큐베이션되었다. 그 다음, 기질 변환의 비율은 냉광계측기(luminometer)(Turner 20/20TD)에서 결정되었다. 세포 농도는 Coulter ACT10 세포 계측기에서 트립신화된 세포를 계산하는 것으로 결정되었다.
pSDH 플라스미드를 이용한 U-2 OS 세포의 트랜스펙션 및 배양: 인간 골육종 U-2 OS 세포주(ATCC #HTB-96)은 37℃/5% CO2에서 글루타민, 페니실린 및 스트렙토마이신(상기)를 함유하는 Dulbecco's Modified Eagle 배지 + 10% 소태아 혈청에서 배양하였다. 세포는 SuperFect(상기)를 사용하여, MSCI 및 MCSⅡ(플라스미드 pBabe-Puro와 함께)에서 STAR6 또는 STAR8를 함유하는 그것의 유도체, 및 pSDH-CMV 벡터를 이용하여 코-트랜스펙션되었다. 퓨로마이신 선별은 개별적인 퓨로마이신 내성 U-2 OS/pSDH-CMV 클론이 무작위로 단리되고 추가로 배양된 후인, 2주에서 완성되었 다.
루시페라제 평가: 루시페라제 평가(Himes & Shannon, 2000)은 냉광계측기(Turner 20/20TD)를 사용하여, 평가 키트 제조업체의 지침서(Roche 1669893)에 따라서 재현탁된(resuspended) 세포에서 평가되었다. 총 세포의 단백질 농도는 제조업체의 지침서(Sigma B-9643)에 따른 비신크닌산 방법에 의하여 결정되었고, 루시페라제 데이타를 표준적으로 하는데 사용되었다.
결과
pSDH-CSP 벡터 또는 STAR6 또는 STAR49를 함유하는 pSDH-CSP 플라스미드를 함유하는 재조합 CHO 세포 클론(표 6)은 3주동안 배양되었다. 그 다음, 배양 상징액에서의 SEAP 활성은 결정되고, 세포수를 기초로 하여 발현되었다(표 8). 보여지는 바와 같이, 발현 단위에서 STAR 요소를 갖는 클론은 단리되고, STAR 요소를 포함하지 않는 발현 단위의 클론보다 2-3배 더 높은 SEAP 활성을 발현하였다. 더구나, STAR가 없는 클론의 최대 활성에 또는 이상에서의 SEAP 활성을 발현하는 STAR-함유 클론의 수는 매우 높다: STAR 클론 개체군의 25% 내지 40%는 pSDH-CSP 클론의 가장 높은 SEAP 발현을 초과한다.
pSDH-CMV 벡터 또는 STAR6 또는 STAR8를 함유하는 pSDH-CMV 플라스미드를 함유하는 재조합 U-2 OS 세포 클론(표 6)은 3주동안 배양되었다. 그 다음, 숙주세포에서의 루시페라제 활성은 결정되고, 관련되 루시페라제 단위(도 9)로서 발현되고, 총 세포 단백질을 표준적으로 하였다. 발현 단위를 플랭킹하는 STAR 요소를 갖는 재조합 U-2 OS 클론은 STAR 요소를 포함하지 않는 클론보다 더 높은 수율을 가졌 다: 더구나, STAR8로부터 관측된 가장 높은 발현은 STAR가 없는 클론에서의 발현보다 2-3배 더 높았다. STAR6 클론은 STAR가 없는 클론보다 5배 더 높은 최대의 발현수준을 가졌다. 상기 STAR 요소는 또한 더 높은 예측가능성을 수여하였다: STAR 요소 모두의 경우, 클론의 15 내지 20%는 가장 높은 수준을 갖는 STAR가 없는 클론 비교가능한 또는 더 높은 수준에서 루시페라제 발현을 나타내었다.
이들 결과는 강한 CMV 프로모터와 함께 사용되는 경우에, STAR 요소는 이형 단백질(루시페라제 및 SEAP)의 수율을 증가시키는 것을 예증한다. 이 실시예에서 도입된 세 개의 STAR 요소 모두는 상승된 수율을 제공한다. STAR 요소에 의해 수여된 증가된 예측가능성은 STAR가 없는 클론에 의해 나타낸 가장 높은 수율과 동등하거나 또는 더 높은 수율을 갖는 클론의 많은 개체군에 의해 명백해진다.
실시예 12. 트랜스유전자 발현의 안정성을 개량한 STAR 요소.
재조합 숙주세포의 배양동안, 항생물질 선별을 보존하는 것은 일반적인 실행이다. 이것은 트랜스유전자의 전사적인 침묵 또는 재조합과 같은 공정에 의하여 게놈으로부터 트랜스유전자의 손실을 억제하려는 의도이다. 하지만, 많은 이유때문에, 이형 단백질의 생산은 바람직하지 않다. 첫번째로, 사용되는 항생물질은 매우 비싸고, 생성물의 단위 비용에 현저하게 기여한다. 둘째로, 생물약제학적인 용도에서, 단백질은 생성물에서 항생물질의 흔적이 없는 것을 증명할 수 있도록 순수해야한다. 이종 단백질 생산을 위한 STAR 요소의 하나의 이점은 그것들이 항생물질 선별의 부재에서조차, 연장된 배양 동안 트랜스유전자 상에서 안정한 발현을 수여한다는 것이다.
재료 및 방법
U-2 OS 세포주는 플라스미드 pSDH-Tet-STAR6로 트랜스펙션되고, 실시예 11에서 기재한 바와 같이 배양되었다. 개별적인 퓨로마이신-내성 클론은 단리되고 독시시클린의 부재에서 추가로 배양되었다. 1주 단위의 간격에서 세포는 1:20의 희석에서 신선한 배양 용기로 이전되었다. 루시페라제 활성은 실시예 11에서 기재한 바와 같이 정기적인 간격에서 측정되었다. 15주 후, 배양은 두 개의 복제물로 나누어졌다; 하나의 복제물은, 다른 복제물이 시험의 잔류물에 대하여 어떠한 항생물질도 받지 않는 반면에, 퓨로마이신을 지속적으로 받았다(총 25주).
결과
표 7은 항생물질을 갖거나 또는 갖지 않은 연장된 성장 중에 STAR6로 플랭킹된 발현 단위에 의한 루시페라제 발현에서의 데이타를 나타낸다. 보여지는 바와 같이, 리포터 트랜스유전자, 루시페라제의 발현은 실험의 기간에 대한 U-2 OS 숙주세포에서 안정하게 남는다. 상기 배양이 두 가지의 처리(항생물질을 첨가 및 항생물질없이)로 나누어진 후, 루시페라제의 발현은 항생물질 선별의 부재에서 실질적으로 안정하다. 이것은 STAR 요소의 능력이 침묵 또는 연장된 배양 중의 손실로부터 트랜스유전자를 보호하는 것을 예증한다. 이것은 또한 이 성질이 항생물질 선별에 독립적이라는 것을 예증한다. 그러므로, 이형 단백질의 생산은 항생물질의 비용 또는 까다로운 하류 공정을 초래하는 것 없이 가능하다.
실시예 13. STAR 요소의 최소한의 필수 서열
STAR 요소는 실시예 1에서 기재된 유전학적인 스크린으로 단리된다. 상기 스 크린은 대략 0.5-2 킬로염기(상기)로 크기-분류되는 인간 게놈 DNA에 의해 구축된 라이브러리를 사용한다. STAR 요소는 500 내지 2361 염기쌍의 범위이다(표 6). 단리되어진 STAR 요소의 많은 경우에, STAR 활성은 처음에 단리된 클론보다 더 작은 DNA 단편에 의해 수여되는 가능성이 있다. 이것은, 두 가지 이유에서, STAR 활성에 실질적인 이들 최소의 단편 크기를 결정하는 데에 유용하다. 첫번째로, 더 작은 기능적인 STAR 요소는 더 작은 벡터가 더 높은 효율로 숙주세포에 트랜스펙션되므로, 조밀 발현 벡터의 고안에서 유익할 것이다. 두번째로, 최소의 실질적인 STAR 요소를 결정하는 것은 상승된 기능성에 대한 그들의 서열을 변형하는 것을 용인한다. 두 개의 STAR 요소는 그것들의 최소의 실질적인 서열을 결정하도록 파인-맵핑되고 있다.
재료 및 방법:
STAR10(1167 염기쌍) 및 STAR27(1520 염기쌍)은 파인-맵핑되고 있다. 그것들은 PCR에 의해 증폭되어 대략 동등한 길이의 하위단편(sub-fragment)를 산출한다(도 10 범례). 초기 시험을 위하여, 이들은 BamHI 부위에서 pSelect 벡터로 클로닝되고 있고, 실시예 1에서 기재한 바와 같이, U-2 OS/Tet-Off/Lexa-HP1 세포로 트랜스펙션되고 있다. 하이그로마이신 내성을 위한 선별 후, 트랜스펙션된 세포는 제오신으로 인큐베이션되어 LexA-HP1 결합에 기인한 억제로부터 SV40-Zeo 발현 단위를 보호하기 위한 STAR 요소의 능력을 시험하였다.
결과
이 실험에서 STAR10 및 STAR27은 예상한 바와 같이(도 10), 유전자 침묵에 반작용하는 좋은 보호를 수여한다. 이것은 제오신의 존재하에서의 강건한 성장으로 명백하였다.
STAR10 하위단편 중에서, 10A(~400 염기쌍)은 트랜스펙션된 세포에 제오신의 존재하에서 활기있는 성장을 수여하고, 총 길이 STAR 요소의 것을 초과한다. 다른 2개의 하위단편을 포함하는 pSelect 구성물로 트랜스펙션하였다. 이들 결과는 STAR10의 항-억제 활성을 초래하는 DNA 서열을 포함하는 것으로 ~400 염기쌍 10A 단편을 동정한다.
STAR27은 이 실험에서 트랜스펙션된 세포에 대하여 제오신에서 온건한 성장을 수여한다(도 10). 이 STAR의 하위단편 중 하나인, 27B(~500 염기쌍)은 제오신-함유 배지에서 숙주세포의 약한 성장을 용인한다. 이것은 이 STAR의 항-억제 활성이 부분적으로 하위단편 27B에 위치결정되지만, 모든 화성은 또한 27A 및/또는 27C(각 ~500 염기쌍)으로부터의 서열을 요구한다.
실시예 14. 배양된 포유동물 세포의 다양한 균주에서 기능하는 STAR 요소
이형 단백질 발현을 위한 숙주세포주 선별은 단백질의 질, 수율 및 단위 비용에 대한 결정적인 매개변수이다. 전사-후 변형, 분비 경로 수용능력 및 세포주 불멸성과 같은 고찰은 특정 생물약제학적인 생산 시스템을 위한 절적한 세포주를 지시한다. 이러한 이유로, 수율, 예측가능성 및 안정성의 관점에서 STAR 요소에 의해 제공된 이점은 다양한 세포주에서 얻어질 수 있을 것이다. 이것은 본래에 클로닝된 인간 U-2 OS 세포주 또는 생물공학에서 폭넓게 응용된 CHO 세포주에서 STAR6의 기능을 비교하는 것으로 시험될 수 있다.
재료 및 방법:
실시예 11의 실험이 인용된다.
결과
CHO 세포에서 SEAP 리포터 유전자의 발현은 도 8에서 나타낸다; U-2 OS 세포에서 루시페라제 리포터 유전자의 발현은 도 9에서 나타낸다. 이들 두 실험의 결과를 비교하는 것으로, STAR6 요소가 양쪽 세포주에서 기능적이라는 것이 분명하다: 리포터 유전자가 STAR6에 의해 위치 효과로부터 보호되는 경우, 리포터 유전자 발현은 양쪽 모두에서 더욱 예측가능하고, 각 세포주의 클론은 더 높은 수율로 나타냈다. 이들 두 세포주는 다른 종(인간 및 햄스터) 및 다른 조직 유형(뼈 및 난소)로부터 유도되고, 이 STAR 요소가 이형 단백질 발현을 개량하는 데에 활용될 수 있는 숙주세포의 광범위한 범위를 반영한다.
실시예 15. 다양한 전사 프로모터의 상황에서 기능하는 STAR 요소
트랜스유전자 전사는 외부 프로모터의 조절하에서 트랜스유전자 개방 리딩프레임를 대체하는 것으로 이루어진다. 프로모터의 선별은 이형 단백질의 본성 및 생산 시스템에 의하여 영향받는다. 대부분의 경우에, 강한 구조성의 프로모터는 그것들이 제공할 수 있는 높은 수율때문에 바람직하다. 어떤 바이러스성 프로모터는 이들 성질을 갖는다; 사이토메갈로바이러스 직관적인(immediate) 초기 유전자의 프로모터/인핸서("CMV 프로모터")는 일반적으로 보통의 생물공학적인 용도에서 가장 강력한 프로모터로서 간주된다(Boshart et al., 1985, Doll et al., 196, Foecking & Hofstetter, 1986). 유인원 바이러스 SV40 프로모터는 또한 알맞게 강하고(Boshart et al., 1985, Foecking & Hofstetter, 1986), 종종 포유동물 세포 벡터에서 전위(ectopic) 발현을 위해 사용된다. Tet-Off 프로모터는 유도가능하다: 프로모터는 테트라시클린 또는 tTA 플라스미드(Clontech K1620-A)를 발현하는 세포주에서 관련된 항생물질(독시시클린이 일반적으로 사용된다)의 존재하에서 억제되고, 항생물질의 제거는 전사적인 유도를 나타낸다(Deuschle et al., 1995, Gossen & Bujard, 1992, Izumi & Gilbert, 1999, Umana et al., 1999).
재료 및 방법:
pSDH-Tet 및 pSDH-CMV 벡터의 구성은 실시예 11에서 기재된다. pSDH-SV40은 플라스미드 pSelcet-SV40-Zeo(실시예 1)으로부터 SV40 프로모터의 PCR 증폭(프라이머 D41 및 D42), 뒤이은 SacⅡ 및 SalI로의 PCR 생성물 소화에 의하여 구성되었다. pSDH-CMV 벡터는 SacⅡ 및 SalI로 소화되어 CMV 프로모터를 제거하고, 벡터 및 SV40 단편은 함께 결찰되어 pSDH-SV40을 만들었다. STAR6은 실시예 11에서 기재된 바와 같이, MCSI 및 MCSⅡ로 클로닝되었다. 플라스미드 pSDH-Tet, pSDH-Tet-STAR6, pSDH-Tet-STAR7, pSDH-SV40 및 pSDH-SV40-STAR6은 제조업체에 의해 기재된 바와 같이 SuperFect를 사용하여 U-2 OS로 pBabe-Puro로 코-트랜스펙션되었다. 세포 배양, 퓨로마이신 선별 및 루시페라제 평가는 실시예 11에서 기대된 바와 같이 수행되었다.
결과
도 9, 11 및 12는 3개의 다른 프로모터로부터 루시페라제 리포터 유전자의 발현을 비교한다: 두 개의 강하고 구조성의 바이러스성 프로모터(CMV 및 SV40), 유 도가능한 Tet-Off 프로모터. 세 개의 프로모터 모두는 U-2 OS 세포에서 STAR6의 상황에서 시험되었다. 결과는 세 개의 프로모터 모두로부터 수율 및 예측가능성이 STAR6에 의해 증가되었다. 실시예 11 및 실시예 14에서 기재된 바와 같이, STAR6는 CMV 프로모터의 상황에서 유익하다(도 9). 유사한 개량은 SV40 프로모터의 상황에서 보여진다(도 11): 가장 높게 발현하는 STAR6 클론으로부터의 수율은 최고의 pSDH-SV40 클론보다 2-3배 더 크고, 6개의 STAR 클론(개체군의 20%)은 최고의 STAR가 없는 클론보다 더 높은 수율을 갖는다. 유도되는(낮은 독시시클린) 농도 이하의 Tet-Off 프로모터의 상황에서, STAR6는 또한 트랜스유전자 발현의 수율 및 예측가능성을 개량한다(도 12): 가장 높게 발현하는 STAR6 클론은 최고의 pSDH-Tet 클론보다 20배 더 높은 수율을 갖고, 9개의 STAR6 클론(개체군의 35%)은 최고의 STAR이 없는 클론보다 더 높은 수율을 갖는다. 이 STAR 요소는, 그것이 다양한 생물공학적으로 유용한 전사의 프로모터의 상황에서 기능하므로, 그것의 트랜스유전자-보호 성질에서 다재다능하다고 결론되어진다.
실시예 16. 방향성일 수 있는 STAR 요소의 기능
짧은 핵산 서열이 대칭적(예를 들어 회문적인(palindromic))일 수 있는 반면에, 더 긴 자연적으로 발생하는 서열은 전형적으로 비대칭적이다. 결과로서, 핵산 서열의 정보 함량,및 서열 자체는 그것들의 5' 및 3' 말단에 관해서 기재될 수 있다. 핵산 서열 정보의 방향성은 재조합 DNA 분자가 해당 기술분야에서의 표준 클로닝 기술(Sambrook et al., 1989)을 사용하여 회합된다. STAR 요소는 길고, 비대칭적인 DNA 서열이고, 그리고 그것들이 본래에 pSelect 벡터에서 클로닝되는 배향에 서 기초한 방향성을 갖는다. 상기 실시예에서, pSDH 벡터에서 2개의 STAR 요소를 사용하여, 이 방향성은 보존된다. 이 배향은 제오신 내성 유전자에 관련된, 천연 또는 5'-3' 배향으로 기재된다(도 13 참조). 이 실시예에서, STAR 기능에 대한 방향성의 중요성은 pSDH-Tet 벡터에서 시험된다. pSDH 벡터에서 리포터 유전자는 관심의 STAR 요소의 카피에 의하여 양쪽 측면에 플랭킹되므로, 각 STAR 카피의 배향은 고려되어야 한다. 이 실시예은 반대 배향과 천연 배향을 비교한다(도 13).
재료 및 방법:
STAR66 요소는 실시예 11에서 기재된 바와 같이 pSDH-Tet로 클로닝되었다. U-2 OS 세포는 플라스미드 pSDH-Tet-STAR66-천연 및 pSDH-Tet-STAR66-반대로 코-트랜스펙션되고, 실시예 11에서 기재된 바와 같이 배양된다. 개별적인 클론은 단리되고 배양된다; 루시페라제 발현의 수준은 기재된 바(상기)와 같이 결정된다.
결과
천연 배향 및 반대 배향에서 STAR66 활성의 비교 결과는 도 14에서 보여준다. STAR66가 반대 배향인 경우, 단지 하나의 클론의 수율은 합당하게 높다(60 루시페라제 단위). 대조적으로, 가장 높게 발현하는 클론의 수율은 STAR66이 천연 배향인 경우 상당히 더 높고(100 루시페라제 단위), 예측가능성은 또한 훨씬 더 높다: 천연-배향 개체군의 7개의 클론(30%)는 반대-배향 개체군으로부터 가장 높게 발현하는 클론의 수준 이상으로 루시페라제를 발현하고, 천연 배향 개체군(60%)에서의 15개의 클론은 10개의 관련된 루시페라제 단위 이상으로 루시페라제를 발현한다. 그러므로, 이것은 STAR66 기능은 방향성이라는 것을 예증한다.
실시예 17. 카피수-의존적인 STAR 요소의 상황에서의 트랜스유전자 발현
이형 단백질 발현을 위한 트랜스유전자 발현 단위는 일반적으로 숙주세포의 게놈으로 통합되어 세포 분화 중에 안정하게 유지하는 것을 보증한다. 통합은 게놈으로 삽입되는 발현 단위의 하나 또는 다중의 카피를 이끌어낼 수 있다. 다중 카피는 탠덤 배열로서 나타낼 수 있거나 또는 나타낼 수 없다. STAR 요소(상기)에 의하여 보호되는 트랜스유전자에 대한 예증하는 증가된 수율은 STAR 요소가 게놈에서 통합 부위와 연관된 전사에서의 영향에 독립적으로 기능하는 트랜스유전자 발현 단위를 용인할 수 있다는 것을 제안한다(위치 효과와는 독립적임(Boivin & Dura, 1998)). 이것은 또한 STAR 요소가 탠덤 배열로서 통합되는 경우에 그것들이 발현 단위의 이웃한 카피에 독립적으로 기능하는 각각의 발현 단위를 용인한다는 것을 제안한다(반복-유도 유전자 침묵으로부터 독립적임(Garrick et al., 1998)). 카피수-의존성은 하기와 같이, 트랜스유전자 발현 수준 및 카피수 사이의 관계로부터 결정된다.
재료 및 방법:
U-2 OS 세로는 pSDH-Tet-STAR10으로 코-트랜스펙션되었고, 상기와 같이 퓨로마이신 선별 하에서 배양되었다. 8개의 개별적인 클론은 단리되었고, 추가로 배양되었다. 그 다음, 세포는 채집되었고, 한 부분은 상기와 같이 루시페라제 활성에 대하여 평가되었다. 남은 세포는 용해되고 게놈 DNA는 제조업체에 의해 기재된 바와 같이 DNeasy Tissue Kit(QIAGEN 69504)를 사용하여 정제되었다. DNA 샘플은 UV 분광 측정계에 의하여 분량되었다. 3마이크로그램의 각 게놈 DNA 샘플은 제조업 체(New England Biolabs)에 의해 기재된 바와 같이 PvuⅡ 및 XhoI로 소화되었고, 아가로스 젤 전기연동으로 분석되었다. DNA 단편은 기재된 바(Sambrook et al., 1989)와 같이, 나일론 막으로 이동되었고,루시페라제 유전자(BamHI/SacⅡ-소화된 pSDH-Tet으로부터 단리된)에 대하여 방사성 표지된 프로브로 혼성되었다. 블롯은 기재된 바(Sambrook et al., 1989)와 같이 세척되었고, 포스포리메이저 스크린(Personal F/X, BioRad)에 노출되었다. 생성된 자동 방사선 사진(도 15)은 사진농도계에 의해 분석되어 트랜스유전자 카피수를 나타내는, 루시페라제 DNA 밴드의 관련된 세기를 결정하였다.
결과
pSDH-Tet-STAR10 클론 개체군으로부터의 클론에서 루시페라제의 효소 활성 및 카피수(DNA 밴드 강도)는 도 16에서 나타낸다. 트랜스유전자 카피수는 이들 pSDH-Tet-STAR10 클론에서의 루시페라제 발현의 수준(r=0.86)과 매우 연관된다. 이것은 STAR10은 트랜스유전자 발현 단위에서 카피수-의존성을 수여하고, 탠덤 배열에서 다른 트랜스유전자 카피에 의존하고 통합 부위에서 유전자-침묵 효과와는 독립적인 트랜스유전자 발현을 만든다.
실시예 18. 단지 인핸서가 아닌 인핸서 차단제로서의 STAR 요소의 기능
유전자 프로모터는 전사를 개시하는 그것들의 능력에 양성 및 음성 모두의 영향에 직면하게 된다. 양성적인 효과를 발휘하는 요소의 상당한 분류는 인핸서가다. 인핸서는 그것들이 프로모터로부터 멀리(수 킬로염기쌍) 떨어진 경우에조차 성질적으로 프로모터에 영향을 줄 수 있다. 이종염색질 형성(예를 들어, Polycomb 그 룹 단백질)에 의해 작용하는 음성적인 영향은 상기하였고, 이들은 STAR 활성의 표적이다. 그러므로, STAR 요소가 음성적인 영향뿐만 아니라 양성적인 영향을 차단할 수 있는가, 다시 말하면, 통합 부위의 근처에서 게놈 인핸서로부터 트랜스유전자를 차단할 수 있는가를 결정하는 것은 중요하다. 인핸서 활성으로부터 트랜스유전자를 차단하는 능력은 생물공학적인 응용에서 트랜스유전자의 안정하고 예측가능한 수행능력을 보장한다. 이 실시예는 인핸서-차단 평가에서 STAR 요소의 수행능력을 검사한다.
그것들의 기능에 상당한 STAR 활성의 또 다른 특징은 그것들이 트랜스유전자에 수여하는 증가된 수율이다(실시예 11). STAR는 이종염색질-형성 단백질이 후보 STAR 요소의 근처에 결합되는 경우에 제오신 발현의 높은 수준을 유지하는 그것들의 능력에 기초하여 단리된다. 높은 발현은 STAR가 제오신 발현 단위로의 이종염색질의 확산을 차단하는 것으로 예상되기 때문에 발생하는 것으로 예측된다. 하지만, 두번째 시나리오는 제오신-내성 클론에서 DNA 단편이 인핸서를 함유한다는 것이다. 인핸서는 STAR 스크린의 방법에서 사용되는 것과 같은 Polycomb-그룹 단백질의 억제 효과를 극복하는 능력을 갖는 것으로 예증되고 있다(Zink & Paro, 1995). 이 현상에 의하여 단리된 인핸서는 인핸서가 STAR에 대하여 여기서 주장한 성질을 갖지 않으므로, 잘못된 양성으로 고려될 것이다. STAR 요소가 인핸서가 아니라는 것을 예증하기 위해서, 그것들은 인핸서 평가법에서 시험된다.
인핸서-차단 평가 및 인핸서 평가는 방법론적으로 그리고 개념적으로 유사하다. 상기 평가법은 개략적으로 도 17에서 나타낸다. 인핸서를 차단하는 STAR 요소 의 능력은 E47/E-box 인핸서 시스템을 사용하여 수행된다. E47 단백질은 그것이 그것들의 프로모터의 근처에 위치하는 E-Box DNA 서열에 결합하는 경우에 프로모터에 의하여 전사를 활성화할 수 있다(Quong et al., 2002). E47은 보통 B 및 T 림프구 식별의 조절을 포함하지만(Quong et al., 2002), 이것은 전위적으로 발현하는 경우에 다양한 세포 유형에서 기능을 할 수 있다(Petersson et al., 2002). E-box는 회문성 DNA 서열, CANNTG이다(Knofler et al., 2002). 인핸서-차단 평가에서, E-box는 발현 벡터에서 루시페라제 리포터 유전자(최소의 프로모터를 포함하는)의 상류에 위치된다. STAR 요소에 대한 클로닝 부위는 E-box 및 프로모터 사이에 위치된다. E47 단백질은 이차 플라스미드에 코드화된다. 평가는 세포로 E47 플라스미드 및 루시페라제 발현 모두를 트랜스펙션하는 것으로 수행된다; E47 단백질은 발현되고, E-box에 결합되고, E47/E-box 복합체는 인핸서로서 작용할 수 있다. 루시페라제 발현 벡터가 STAR 요소를 포함하지 않는 경우에, E47/E-box 복합체는 루시페라제 발현을 증대시킨다(도 17A, 국면 1). STAR 요소는 E-box 및 프로모터 사이에 삽입되고, 인핸서를 차단하는 그것들의 능력은 루시페라제 활성의 감소된 발현에 의해 예증된다(도 17A 국면 2); STAR가 인핸서를 차단할 수 없다면, 루시페라제 발현은 활성화된다(도 17A 국면3).
인핸서로서 작용하는 STAR 요소의 능력은 동일한 루시페라제 발현 벡터를 활용한다. E47의 부재에서, E-box 그 자체는 전사에 영향을 주지 않는다. 그 대신, STAR 요소에 의한 인핸서 행동은 루시페라제 전자의 활성화를 나타낼 것이다. 상기 평가는 E47 플라스미드가 없는 루시페라제 발현 벡터를 트랜스펙션하는 것으로 수 행된다. 발현 벡터가 STAR 요소를 함유하지 않는 경우에, 루시페라제 발현은 낮다(도 17B, 국면 1). STAR 요소가 인핸서 성질을 갖지 않는다면, 루시페라제 발현은 STAR 요소가 벡터에 존재하는 경우에 낮다(도 17B, 국면 2). STAR 요소가 인핸서 성질을 갖는다면, 루시페라제 발현은 STAR-함유 벡터에서 활성화될 것이다(도 17B, 국면 3).
재료 및 방법:
루시페라제 발현 벡터는 플라스미드 pGL3-베이직(Promega E1751)에 루시페라제 유전자의 플라스미드 mu-E5+E2x6-cat(x)(Ruezinsky et al., 1991) 상류로부터 E-box 및 인간 알칼리성 포스파타제 최소의 프로모터를 삽입하는 것으로 구성되어 pGL3-E-box-루시페라제(W. Romanow으로부터 받음)를 만든다. E47 발현 플라스미드는 pHBAPr-1-neo 플라스미드에서 베타-액틴 프로모터의 조절하에서 E47 개방 리딩프레임을 함유한다; E47은 이 플라스미드로부터 구성적으로 발현된다(W. Romanow로부터 받음).
STAR 요소 1, 2, 3, 6, 10, 11, 18 및 27은 루시페라제 발현 벡터로 클로닝된다. Drosophila scs 요소 및 닭 베타-글로빈 HS4-6x 핵심(core) ("HS4") 요소를 함유하는 클론은 양성 대조군으로 포함되고(그것들은 인핸서를 차단하는 것으로 알려져 있고, 어떠한 본능적인 인핸서 성질도 갖지 않는다(Chung et al., 1993, Kellum & Schedl, 1992)), 빈 루시페라제 발현 벡터는 음성 대조군으로서 포함된다. 모든 평가는 U-2 OS 세포주를 사용하여 수행되었다. 인핸서-차단 평가에서, E47 플라스미드는 루시페라제 발현 벡터(빈 벡터, 또는 STAR 또는 양성-대조군 요 소를 함유하는)으로 코-트랜스펙션되었다. 인핸서 평가에서, E47 플라스미드는 인핸서 활성에 대한 양성 대조군으로 STAR가 없는 루시페라제 발현 벡터로 코-트랜스펙션되었다; 다른 모든 샘플은 코-트랜스펙션중에 모조 플라스미드를 받았다. 일시적으로 트랜스펙션된 세포는 플라스미드 트랜스펙션(상기)후 48시간에 루시페라제 활성에 대하여 평가된다. 어떠한 E-box 또는 STAR/대조군 요소를 함유하지 않는 플라스미드로부터 발현된 루시페라제 활성은 제거되고, 루시페라제 활성은 기재된 바와 같이 단백질 함량에 표준적으로 된다.
결과
도 18은 인핸서-차단 평가의 결과를 나타낸다. STAR 요소(또는 알려진 인핸서-차단 요소 scs 및 HS4)의 부재하에서, E47/E-box 인핸서 복합체는 루시페라제("벡터")의 발현을 활성화한다; 이 발현의 증대된 수준은 100에 평균적으로 된다. 인핸서 활성은 시험된 모든 STAR 요소에 의해 차단된다. 인핸서 할성은 또한 예상된 바와 같이, HS4 및 scs 요소에 의해서 차단된다(Bell et al., 2001, Gerasimova & Corces, 2001). 이들 결과는 전사적 침묵의 확산(음성 영향)을 차단하는 그것들의 능력에 더하여, STAR 요소가 인핸서의 작용(양성 영향)을 차단할 수 있다.
도 19는 인핸서 평가의 결과를 나타낸다. E47/E-box 복합체에 의한 증대에 기인한 루시페라제 발현의 수준은 100("E47")에 고정되었다. 비교에 의하여, STAR 요소의 어느 것도 루시페라제 발현의 상당한 활성화가 생기게 하지 않는다. 예상한 바와 같이, scs 및 HS4 요소는 또한 리포터 유전자의 활성화를 생기게 하지 않는다. 그러므로 적어도 시험된 STAR 요소는 인핸서 성질을 소유하지 않는 것으로 결 론되어진다.
실시예 19. 침묵을 유도하는 염색질(SINC) 요소의 특성화
재료 및 방법
SINC 스크린의 일반적인 특징은 실시예 1에서 기재되고 있고, 그것의 약간의 측면은 여기서 개괄한다. 게놈 DNA에서 SINC 요소를 스크리닝하도록 사용되는 pSS 벡터의 하나의 별형은 pSS-codA::upp이다(도 20). 그것은 2개의 STAR6 요소에 의해 플랭킹되는, 자살 유전자 발현 단위에 의해 구축된다.Tet-Off 프로모터의 조절하에서 codA::upp 자살 유전자로 구성되는 발현 단위는 BglⅡ 제한 부위의 하류이다. pSS 벡터, pSS-hrGFP(도 21)의 두 번째 별형은 STAR8를 갖는 하나의 STAR6 요소의 대체 및 HrGFP 유전자를 갖는 자살 유전자의 대체에 의해 만들어지고, 녹색 형광 단백질(Stratagene 240059)을 코드화하였다. 염색체 22(Research Genetics 96010-22)으로부터의 인간 게놈 DNA는 Sau3AI에 의해 부분적으로 소화되고, 크기 분류되었다. 0.5-10 킬로염기쌍 분획은 pSS-codA::upp의 BglⅡ로 결찰되었다. 이 라이브러리는 1.2 킬로염기쌍의 평균 삽입 크기를 갖는 ~20,000개의 독립적인 클론을 나타냈다. 라이브러리는 Escherichia coli에서 증폭되었다. 증폭된 라이브러리로부터 정제된 DNA는 표준 기술(칼슘 포스페이트; Life Technologies 18306-019)에 위하여 U-2 OS/Tet-Off 세포(van der Vlag et al., 2000)로 트랜스펙션되었다. 대조군 트랜스펙션은 빈 pSS-codA::upp 벡터 DNA를 사용하여 수행되고, 2400개의 하이그로마이신 내성 콜로니를 산출하였다. 트랜스펙션된 세포는 높은 독시시클린(10ng/㎖)에서 3주 기간에 걸쳐 하이그로마이신 내성(25㎎/㎖)에 대하여 선별되고, 1800개의 하이그로마이신-내성 콜로니는 라이브러리 트랜스펙션으로부터 회수되었다. 그 다음, 이들 콜로니는 독시시클린 농도 10ng/㎖에서, 4일동안 5㎎/㎖의 상승을 갖는, 1㎎/㎖에서의 프로드럭 5-플루오로시토신(5-FC)으로 인큐베이션하였다. 3주 후, 단지 3주간 성장한 대조군 콜로니(빈 pSS-codA::upp로 트랜스펙션된)는 모두 죽었다; 라이브러리-트랜스펙셔된 콜로니 58개는 생존하였다. 이들 콜로니는 프로드럭 처리로부터 회수될 수 있고, 추가로 배양되었다. 5-FC-내성 단리물은 채집되었고, 세포는 용해되었고, DNA의 일부는 프라이머 D30 및 D51을 사용하는 PCR 증폭하여 SINC 요소를 회수하였다. 6개의 5-FC-내성 콜로니로부터의 PCR 생성물은 통상의 방법(Sambrook et al., 1989)에 의하여 pBluescriptⅡ SK(+) 플라스미드(Stratagene 212207)의 HindⅢ 및 XhoI 부위사이에 클로닝되었다. 후보 SINC 요소의 DNA 서열은 pBluescript 벡터(Stratagene 300301 및 300302)을 위한 시판중인 프라이머를 사용하여 기재된 바와 같이 결정되었다. 이들 SINC 요소의 서열은 표 4B에서 나타낸다.
6개의 후보 SINC 요소는 그것들의 천연 배향에서 플라스미드 pSS-hrGFP로 클로닝되고, 생성된 플라스미드는 U-2 OS/Tet-Off 세포로 트랜스펙션되었다. 하이그로마이신 내성에 대한 선별 후, pSS-hrGFP-SINC 트랜스펙턴트는 높은 독시시클린 농도(10ng/㎖)에서 추가로 배양되었다. 총 세포 RNA는 제조업체에서 기재한 바와 같이 RNeasy Mini Kit(QIAGEN 74014)을 사용하여 추출하였다. 이들 개체군에서 GFP mRNA 풍부성의 노던 블롯 분석은 표준 기술(Sambrook et al., 1989)을 사용하여 사정하였다. GFP 프로브는 phrGFP-1에서 690 내지 1419 염기쌍을 포함하는 BamHI-EcoRI 단편이다. 블롯은 또한 PSS-hrGFP-유도된 플라스미드 카피수에 대한 대조군 으로서 하이그로마이신 mRNA 및 유전체학적으로 코드화된 mRNA 양에 대한 대조군으로서 베타-액신에 대하여 프로브하였다. 하이그로마이신 프로브는 pREP4에서 8219-10144로부터 확장된 SfuI-SalI 단편이고, 그리고 베타-액신 프로브는 Clontech, #9800-1으로부터의 것이다. 잡종화 및 세척 후, 블롯은 포스포리메이저 스크린에 노출되고, 방사성 시그널은 BioRad Personal F/X 포스포리메이저를 사용하여 시각화되고 정량되었다.
결과
GFP 리포터 유전자에 인접한 클로닝된 SINC 요소는 리포터 유전자 전사의 침묵을 유도할 것이지만, 다른 유전자의 전사에 영향을 주지 않는다. SINC 활성의 정밀한 측정은 단순하게 완전한 GFP 발현을 측정하는 것보다 두 개의 참조 유전자의 발현에 관련된 GFP의 발현을 결정하는 것으로 이 사실을 이용한다. 하나의 참조 유전자는 pSS-hrGFP 플라스미드(STAR 요소에 의해 정의된 외부 도메인;도 21)에서 하이그로마이신 내성 유전자이고, 다른 하나는 게놈 베타-액틴 유전자이다. SINC 활성은 RNA 블롯 분석에 의하여 하이그로마이신 및 베타-액틴 시그널에 대한 GFP 시그널의 비율에서의 감소로 정량화된다. 특성화되고 있는 후보 SINC 요소 중에서, 약간의 것들은 GFP 전사에서 현저한 관련 감소를 나타내고, 이들 DNAs가 침묵 염색질의 형성을 유도할 수 있는 것을 나타낸다. SINC35 요소(표 4B에서 표지화된 PSINK35)은 이들 후보물질의 가장 강력한 활성을 갖는다. 이것은 GF/하이그로마이신 비율에서 69% 감소, 및 GFP/베타-액틴 시그널에서 75% 감소를 생기게 한다. 본래의 응용에서, 및 단리되고 이 응용에 의해서 특성화된 많은 후보 SINC 요소에서 기재된 다른 5개의 후보물질에서의 SINC 활성의 세기는 더 적다. 그러므로 SINC35는 다양한 생물공학적 응용에서 침묵 염색질의 유도에 대한 유력한 유전자 요소으로 월등한 수행능력을 갖는다.
실시예 20. 마우스 및 인간 사이에서 보존된 STAR 요소
인간 게놈 데이타베이스에 대한 STAR DNA 서열의 BLAT 분석(http://genome.ucsc.edu/cgi-bin/hgGateway)은 이들 서열의 일부가 인간 게놈의 다른 영역과 높은 서열 보존을 갖는다는 것을 드러낸다. 이들 증복된 영역은 후보 STAR 요소이다; 그것들이 STAR 활성을 보인다면, 그것들은 클로닝된 STAR의 파라로그(paralog)로 고려될 것이다(2개의 유전자 또는 유전자 요소는 그것들이 증복 사건으로부터 유도된다면 파라로그한 것이라고 말하여진다(Li, 1997)).
마우스 게놈에 대한 인간 STAR의 BLAST 분석(http://www. ensembl.org/Mus_musculus/blastview)은 또한 마우스 또는 인간 사이에서 높은 서열 보존의 영역을 드러낸다. 이 서열 보존은 65개의 인간 STAR 요소로부터의 15개의 단편을 나타내고 있다. 보존은 64% 내지 89%의 범위이고, 141 염기쌍 내지 909 염기쌍의 길이이다(표 8). 이들 서열 보존의 정도는 주목할 만하고, 이들 DNA 서열 또한 마우스 게놈안에서 STAR 활성을 수여할 수 있다는 것을 제안한다. 표 8에서 마우스 및 인간 게놈으로부터의 서열의 일부는 엄밀하게 오소로그(ortholog)이라고 정의될 수 있다(2개의 유전자 또는 유전자 요소는 그것들이 종 형성 사건으로부터 유도된다면 오소로그한 것이라고 말하여진다(Li, 1997)). 예를 들면, STAR6는 인간 및 마우스 유전자 모두에서 SLC8A1 및 HAAO 유전자 사이에 있다. 다른 경우에, 클 로닝된 인간 STAR는 인간 게놈에서 파라로그를 갖고, 그것의 오소로그는 마우스 게놈에서 동정된다. 예를 들어, STAR3a는 인간 게놈 15의 15q11.2영역의 단편이다. 이 영역은 인간 게놈 5에서의 5q33.3에서 DNA 단편과 96.9% 동일(파라로그한)하고, IL12B 인터루킨 유전자에 인접한다. 이들 인간 DNAs는 마우스 염색체 11에서의 마우스 11B2 영역의 단편과 대략 80%의 동일성을 공유한다. 상기 11B2 단편은 또한 (마우스) IL12B 인터루킨 유전자에 인접한다. 그러므로 STAR3 및 마우스 11B2 단편은 엄격하게는 파라로그로 정의된다. STAR 활성이 마우스 및 인간 게놈에서 높은 서열 보존의 영역들 사이에서 공유한다는 가설을 시험하기 위하여, 마우스에서 보존된 서열을 갖는 인간 STAR 중 하나, STAR18는 매우 자세하게 분석되고 있다. 본래의 STAR18 크론으로 탐지되는 마우스 게놈에서의 서열 보존은 약 500 염기쌍에 대하여 인간 염색체 2에서 왼쪽 방향으로 확장된다(도 22; 왼쪽 및 오른쪽은 염색체 2의 암스(arms)의 표준 기술에 관련한다). 이 실시예에서 본 발명자들은 서열 보존의 영역이 본래의 클론보다 길이가 확장되는, 인간에서의 "자연적으로 발생하는" STAR 요소를 정의하는 가를 검사한다. 본 발명자들은 또한 이 STAR 요소의 STAR 기능이 마누스 및 인간 사이에서 보존되는 가를 검사한다.
재료 및 방법
STAR18 주위의 마우스/인간 서열 보존의 영역은 세 개의 단편으로, PCR 증폭에 의하여 인간 BAC 클론 RP11-387A1로부터 회수되었다: 전체 영역(프라이머 E93 및 E94), 왼쪽방향 반쪽(프라이머 E93 및 E92), 및 오른쪽방향 반쪽(프라이머 E57 및 E94). 상동의 마우스 영역으로부터 상응하는 단편은 동일한 양식(개별적으로, 프라이머 E95 및 E98, E95 및 E96, E97 및 E98)에서 BAC 클론 RP23-400H17로부터 회수되었다. 모든 단편은 pSelect 벡터로 클로닝되고, U-2 OS/Tet-Off/LexA-HP1 세포주(상기)로 트랜스펙션되었다. 트랜스펙션에 이어서, 하이그로마이신 선별은 트랜스펙션된 세포에 대하여 선별하도록 수행되었다. LexA-HP1 단백질은 독시시클린 농도를 낮추는 것으로 유도하고, 항생물질 제오신을 견디는 트랜스펙션된 세포의 능력(STAR 활성의 측정)은 세포 성장을 관찰하는 것으로 사정되었다.
결과
본래 STAR18 클론은 Sau3AI 소화된 인간 DNA로부터 단리되고, 제오신 내성 유전자의 침묵을 방해하는 능력을 기초로 pSelect 벡터로 결찰되었다. 마우스 유전자를 갖는 인간 STAR18 클론(497 염기쌍)의 선형은 오소로그한 인간 및 마우스 STAR18 영역 사이에서 높은 서열 유사성(72%)을 드러냈다. 이것은 또한 클로닝된 영역의 왼쪽 말단을 정의하는 Sau3AI 부위의 왼쪽방향에 직접한 488 염기쌍에 대하여 확장하는 영역에서 높은 유사성(73%)으로 나타냈다(도 22). 이들 영역 외부로 인간 및 마우스 DNA 사이의 서열 유사성은 60% 이하로 떨어진다.
도 22에서의 나타내는 바와 같이, 인간 및 마우스 STAR18 요소 모두는 lexA-HP1 억제자 단백질을 발현하는 숙주세포가 제오신에서도 생존하게 한다. 본래 497 염기쌍 STAR18 클론 및 그것의 마우스 오소로그 모두는 성장할 수 있게 된다(도 22, a 및 d). 양쪽 게놈으로부터의 높은 유사성의 인접한 488 염기쌍 영역은 또한 성장할 수 있게 되고, 사실상 그것들의 성장 표현형은 본래 STAR18 클론의 것보다 더욱 활발하다. 서열 유사성의 전체 영역이 시험되는 경우에, 마우스 및 인간 모두 로부터의 이들 DNAs는 성장하게 하고, 성장 표현형은 두 하위-단편보다 더욱 활기차다(도 22, c 및 f). 이들 결과는 사람 STAR18의 STAR 활성이 마우스로부터 그것의 오소로그에서 보존된다는 것을 예증한다. 이들 오소로그한 영역 사이에서 높은 서열 보존은 그것들이 단백질-코드하는 서열이 아니기 때문에 특히 주목할만하고, 그것들이 돌연변이를 통하여 그것들의 진화론적인 다양성을 방해하는 어떤 조절 기능을 갖는다는 결론을 이끈다.
이 분석은 본래의 스크린 프로그램에 의해 동정되는 클로닝된 STAR 요소는 어떤 경우에 부분적인 STAR 요소를 나타낼 수 있고, 그것들이 심어져 있는 게놈 DNA의 분석은 더 강한 STAR 활성을 갖는 서열을 동정할 수 있다.
실시예 21. 특징적인 DNA 서열 모티브를 함유하는 STAR 요소
STAR 요소는 트랜스유전자 발현에 관하여 그것들의 항-억제 표현형을 기초로 하여 단리된다. 이 항-억제 표현형은 STAR 요소와 연관된 염색질 형성을 조절하는 잠재적인 생화학적인 공정을 반영한다. 이들 공정은 전형적으로 서열-특이적이고 단백질 결합 또는 DNA 구조로부터 초래된다. 이것은 STAR 요소가 DNA 서열 유사성을 공유할 것이라고 제안한다. STAR 요소 사이의 서열 유사성의 동정화는 서열 모티프를 제공할 것이고, 기능적인 스크린 및 시험에 의해 이미 동정되고 있는 요소의 특징이다. 서열 모티브는 또한 이 명세서의 청구항에 일치하는 신규한 STAR 요소의 기능을 알리고 주장하는 데에 유용할 것이다. 상기 기능은 진핵생물 숙주세포에서 발현된 트랜스유전자의 안정성 및 개량된 수율을 포함한다.
STAR 요소의 특징을 나타내는 서열 모티브를 동정하는 다른 이점은 하기를 포함한다: (1) 게놈 데이타베이스에서 신규한 STAR 요소의 예측 및 동정화를 위한 조사 모티프의 제공, (2) 상기 요소의 변형에 대한 논리적 근거의 제공, 및 (3) STAR 활성의 기능적인 분석을 위한 정보의 제공. 생물정보학의 사용으로, STAR 요소 사이의 서열 유사성은 동정되고 있다; 결과는 이 실시예에서 나타낸다.
생물정보학 및 통계학적인 배경. 조절 DNA 요소는 전형적으로 서열-특이적인 DNA-결합 단백질과의 상호작용을 통하여 기능한다. 동정된 조절 성질을 갖지만 상호작용하는 단백질은 알려지지 않은 STAR 요소와 같은 DNA 요소의 생물정보학적인 분석은 서열 모티프의 동정화를 위한 통계학적인 접근을 필요로 한다. 이것은 참고 서열(예를 들어, 완전한 인간 게놈)에 비교된 조절 DNA 요소(예를 들어, STAR 요소)의 세트에서 과잉 표현되는, 짧은 DNA 서열 패턴을 탐지하는 방법에 의하여 성취될 수 있다. 상기 방법은 각각의 조절 요소에서 패턴의 관찰된 그리고 예상된 발생수는 참고 서열에서 각 패턴의 관찰된 발생수로부터 계산된다.
DNA 서열 패턴은 주어진 길이, 예를 들어 6개의 염기쌍의 올리고뉴클레오티드일 수 있다. 가장 간단한 분석에서, 네 개의 뉴클레오티드(A, C, G 및 T)에 의해 구축된 6개의 염기쌍 올리고뉴클레오티드(헥사머)의 경우, 4^6=4096개의 별개의 올리고뉴클레오티드(AAAAAA에서부터 TTTTTT로부터의 모든 조합)가 있다. 조절 및 참고 서열이 완전히 무작위적이고 A, C, G 및 T 뉴클레오티드의 동등한 비율을 갖는다면, 각 헥사머의 예상되는 빈도는 1/4096(~0.00024)일 것이다. 하지만, 참고 서열에서 각 헥사머의 실제 빈도는 G:C 염기쌍 등의 함량에서 경향에 따라서 전형적으로 다르다. 그러므로, 참고 서열의 각 올리고뉴클레오티드의 빈도는 계산에 의하 여 실험적으로 결정되고 패턴에 대한 "빈도표"를 만든다.
참고 서열의 패턴 빈도표는 조절 요소 세트에서 각 페턴의 예상되는 발생빈도를 계산하는 데에 사용된다. 예상되는 빈도는 상기 패턴의 관찰되는 발생빈도와 비교된다. 상기 세트에서 "과잉-표현된" 패턴은 동정된다; 예를 들어, 헥사머 ACGTGA는 서열의 20 킬로염기쌍에서 5번 발생하는 것으로 예상되지만 15번 관찰된다면, 3배 과잉-표현된 것이다. 상기 헥사머의 서열 패턴의 15번의 발생 중 10번은 상기 요소가 전체 게놈에서와 같이, 동일한 헥사머 조성물을 가졌다면, 조절 요소라고 예상될 수 없을 것이다. 과잉-표현된 패턴이 동정되면, 통계학적인 시험은 그것들의 과잉-표현이 중요한 것인지 아니면 우연한 것인지를 결정하는 데에 응용된다. 이 시험을 위해, 중요 목록, "sig"이 각 패턴에 대하여 계산된다면, 중요 목록은 각 패턴의 발생 개연성으로부터 유도되고, 이항식 분포에 의해 추정된다. 개연성은 가능한 패턴의 수(헥사머에 대한 4096)를 계산하게 한다. 가장 높은 sig값은 가장 과잉표현된 올리고뉴클레오티드에 상응한다(van Helden et al., 1998). 실질 용어에서, sig >= 0를 갖는 올리오뉴클레오티드는 과잉-표현된 것으로 간주된다. sig >= 0를 갖는 패턴은 조절 요소 서열의 세트에서 한번의 기회(=10^0)에 기인한 과잉-표현된 것일 가능성이 있다. 하지만, sig >= 1에서 패턴은 10개(=10^1)의 서열 세트 중 한 번 과잉-표현된 것으로 예상되고, sig >= 2는 100개(=10^2) 서열 세트 중 한 번으로 예상된다. 조절 요소 세트에서 현저하게 과잉-표현되는 패턴은 조절 요소 서열의 분류화 및 예측을 위한 모형을 개발하는 데에 사용된다. 이것은 구별식 분석, 소위 종래의 기술분야에서 알려진 기술 중 하나인 통계적인 분류화의 " 감독된" 방법을 이용한다(Huberty, 1994). 구별식 분석에서, 알려진 또는 분류화된 항목(예를 들어, STAR 요소)은 특정 변수(예를 들어, 헥사머와 같은 서열 패턴)를 기초로 하여 이들 항목을 인식하는 모형을 처리하는 데에 사용된다. 처리된 모형은 다른 항목이 알려진 항목(예를 들어, DNA 서열이 STAR 요소이다)의 세트에 속하는 것으로 분류될 것인지를 예상하는 데에 사용된다. 이 실시예에서, 처리 세트에서 알려진 항목은 STAR 요소(양성 처리 세트)이다. 그것들은 STAR 요소로 동일한 길이를 갖는 게놈(음성 처리 세트)로부터 무작위적으로 선별된 서열과 대조된다. 구별법 분석은 양성을 구별하는 변수의 세트에 기초된 음성으로부터 양성을 구별하기 위한 척도를 설립한다; 이 실시예에서, 상기 변수는 현저하게 과잉-표현된 패턴(예를 들어, 헥사머)이다.
과잉-표현된 패턴의 수가 처리 세트의 크기에 높게 비교되는 경우, 모형은 과잉-처리에 기인하여 치우치게 될 수 있었다. 과잉-처리는 변수의 단계별 선별을 적용하는 것으로 피하여진다(Huberty, 1994). 단계별 구별법 분석의 목표는 양성 및 음성 사이의 최대 구별을 제공하는 변수의 최소의 수를 선별하는 것이다. 모형은 양성 및 음성 처리 세트에서 항목을 적절하게 분류화하는 그것들의 능력에 대한 하나씩 변수를 평가하는 것으로 처리된다. 이것은 모형에 신규한 변수의 첨가가 모형의 예측력을 현저하게 증가시키지 않을 때까지(즉, 분류화 과오 비율이 최소화될 때까지) 이루어진다. 이 최적화된 모형은 "신규한" 항목이 양성 또는 음성인지를 예측하기 위하여, 시험하는 데에 사용된다(Huberty, 1994).
DNA 서열과 같은 복합체 항목의 경우, 양성 처리 세트의 어떤 요소는 음성으 로 분류화될 것이고(가성 음성) 그리고 음성 처리 세트의 어떤 요소는 양성으로 분류화될 것이다(가성 양성)라는 분류화 통계에서 타고난 것이다. 처리된 모형은 신규한 항목을 시험하는 데에 적용되는 경우, 잘못된 분류화의 동일한 유형은 발생하는 것으로 예상된다. 여기서 기재된 생물정보학적인 방법에서, 첫 번째 단계, 패턴 빈도 분석은 현저하게 과잉-표현된 패턴의 더 작은 세트(예를 들어, 100개의 헥사머)에 대한 서열 패턴의 큰 세트(예를 들어, 4096개의 헥사머)를 감소시킨다; 두 번째 단계에서, 단계별 구별법 분석은 최대의 구별력을 갖는 그것들의 서브세트에 대한 과잉-표현된 패턴의 세트를 감소시킨다(예를 들어, 5-10 헥사머)그러므로, 이 접근은 STAR 요소과 같이 조절 DNA 요소를 동정하기 위한 간단하고 강건한 척도를 제공한다.
DNA-결합 단백질은 그것들이 차지하는 결합 부위의 유형을 기초로 하여 식별될 수 있다. 어떤 것은 이웃한 서열을 인식한다; 이 단백질의 유형인 경우, 길이 6개의 염기쌍(헥사머)의 올리고뉴클레오티드인 패턴은 생물정보학적인 분석에 대하여 효과적이다(van Helden et al., 1998). 다른 단백질은 서열 이분염색체과 결합한다: 접촉은 고정된 폭의 비-보존된 영역에 의해 분리된, 고도로 보존된 트리뉴클레오티드의 이분염색체 사이에 만들어진다(van Helden et al., 2000). 이분염색체-결합 단백질에 의하여 결합될 수 있는 STAR 요소에서의 서열을 동정하기 위하여, 빈도 분석은 또한 이 패턴의 유형에 대하여 실시되고, 두 개의 트리뉴클레오티드 사이의 공간은 0 내지 20으로 다양하였다(즉, XXXN{0-20}XXX, X는 트리뉴클레오티드를 구성하는 특정 뉴클레오티드이고, N은 길이상 0 내지 20 염기쌍의 무작위 뉴 클레오티드이다). 이분염색체 빈도 분석의 결과는 또한 상기한 바와 같이 선형 구별법 분석에 사용된다.
재료 및 방법
원본 특허 출원에 기재된 유전자 스크린을 사용하여, 66개의 STAR 요소는 초기에 인간 게놈 DNA로부터 단리되고, 상세하게 특성화된다(표 6). 스크린은 인간 게놈 DNA의 Sau3AI 소화에 의해 구성되고, 태반(Clontech 6550-1)으로부터 정제되거나 또는 박테리아/P1 (BAC/PAC) 인공 염색체를 수행하게 된다. BAC/PAC 클론 염색체 1(클론 RP1154H19 및 RP3328E19)으로부터의, 유사 유전자(클론 RP1167F23, 1170019 및 RP11387A1)의 HOX 클러스터로부터의 또는 인간 염색체 22(Research Genetics 96010-22)으로부터의 게놈 DNA를 함유한다. DNAs 크기-분류되고, 0.5-2kb 크기 분획은 표준 기술(Sambrook et al., 1989)을 사용하여, BamHI-소화된 pSelect 벡터로 결찰되었다. 낮은 독시시클린 농도에서 제오신에 내성을 수여하는 인간 게놈 DNA를 함유하는 pSelect 플라스미드는 Escherichia coli에서 단리되고, 증식된다. 표 6의 STAR 요소를 산출하는 스크린은 인간 게놈의 대략 1-2%를 평가한다.
이들 66개의 플라스미드에서의 인간 게놈 DNA 삽입물은 제조업체의 지침서를 사용하여, Beckman CEQ2000 자동화 DNA 서열화기를 이용하는 디데옥시 방법(Sanger et al., 1977)에 의하여 서열화되었다. 간략하게는, DNA는 QIAprep Spin Miniprep 및 Plasmi Midi Kits(개별적으로, QIAGEN 27106 및 12145)을 사용하여 E. coli로부터 정제되었다. 사이클 서열화는 염료 종결자(CEQ Dye Terminator Cycle Sequencing Kit, Beckman 608000)의 존재하에서, pSelect 벡터(프라이머 D89 및 D95, 표 5)에 상응하는 주문한 올리고뉴클레오티드를 사용하여 수행하였다. 회합된 STAR DNA 서열은 BLAT(Basic Local Alignment Tool(Kent, 2002); http://genome.ucsc.edu/cgi-bin/hgGateway; 표 6)를 사용하여 인간 게놈(2001년 8월 및 12월에 형성한 데이타베이스)에 위치되었다. 총량에서 화합한 STAR 요소는 1.3 킬로염기쌍의 평균 길이를 갖는, 85.6 킬로염기쌍을 포함한다.
인간 게놈 DNA에서 STAR 요소를 식별하는 서열 모티프는 하기(도식적인 도표을 위한 도 23 참조)와 같이, 두 단계 공정을 사용하는 생물정보학적인 분석으로 동정되었다. 분석은 두 개의 입력 데이타세트를 갖는다:(1) STAR 요소의 DNA 서열(STAR1-STAR65은 사용되었다; 표 6); 및 (2) 인간 게놈의 DNA 서열(그것의 큰 크기에 기인하여 포함할 가능성이 없는, 염색체 1을 제외한; 이분염색체 분석을 위해 인간 게놈 DNA 서열(~27Mb)의 무작위 서브세트가 사용되었다).
패턴 빈도 분석. 분석에서의 첫 번째 단계는 RSA-Tools 소프트웨어(Regulatory Sequence Analysis Tools; http://www.ucmb.ulb.ac.be/bioinformatics/rsa-tools/; 참고문헌(van Helden et al., 1998, van Helden et al., 2000, van Helden et al., 2000))를 사용하여 하기 정보를 결정하였다: (1) 인간 게놈에서의 모든 이분염색체 및 헥사머 올리고뉴클레오티드의 빈도; (2) 65개의 STAR 요소에서 올리고뉴클레오티드 및 이분염색체의 빈도; 및 (3) 게놈에 비교된 STAR 요소에서 과잉-표현된 그것들의 올리고뉴클레오티드 및 이분염색체의 중요 목록. 대조군 분석은 표 6의 STAR 요소의 길이에 부합하는 인간 게놈(즉, 2689 x 10^3 킬로염기쌍)으로부터 무작위로 선별된 65개의 서열 로 이루어졌다.
구별식 분석. 과잉-표현된 올리고뉴클레오티드 및 이분염색체는 선형 구별법 분석에 의한 STAR 요소의 예측을 위한 모형을 처리하도록 사용되었다(Huberty, 1994). 변수의 전-선별은 빈도 분석의 과잉-표현된 올리고 또는 이분염색체으로부터 가장 높은 개별적인 구별력을 갖는 50개의 패턴을 선별하는 것으로 수행되었다. 이들 전-선별된 변수는 단계별 선형 구별식 분석에서 처리되는 모형으로 사용되어 변수의 가장 좋은 구별식 조합을 선별하였다(Huberty, 1994). 변수 선별은 분류화 오류 비율을 최소화하는 데에 기초를 두고 있다(잘못된 음성 분류화의 퍼센트). 더구나, 예상되는 오류 비율은 무작위 서열의 대조군 세트에 동일한 구별식 접근을 응용하는 것으로 추정되었다(잘못된 양성 분류화를 최소화하는).
구별식 분석의 처리 상으로부터의 예측성 모형은 두 가지 방법으로 시험되었다. 첫 번째, 모형(처리 세트)를 생성하는 데에 사용되는 STAR 요소 및 무작위 서열은 분류화되었다. 두 번째, 19개의 후보 STAR 요소(상기와 같이 제오신 선별에 의하여 최근에 클로닝된)의 집단에서 서열은 분류화되었다. 이들 후보 STAR 요소 표 11에서 기재된다(SEQ ID:67-84).
결과
패턴 빈도 분석은 참고 서열과 같이 인간 게놈을 사용하여, 65개의 STAR 요소에서 RSA-Tools로 수행되었다. 166개의 헥사머 올리고뉴클레오티드는 전체 게놈에 비교된 STAR 요소(sig >= 0)의 세트에서 과잉-표현되는 것으로 알려졌다(표 9). 가장 현저하게 과잉-표현된 올리고뉴클레오티드, CCCCAC는 65개의 STAR 요소 중에 서 107번 발생하지만, 49번만 발생하는 것으로 예상되었다. 8.76의 유효계수를 갖는다; 다시 말하면, 그것들의 과잉-표현은 무작위 기회에 기인한 것이라는 예측가능성은 1/10^8.76, 즉, 5억분의 1이하이다.
95개의 올리고뉴클레오티드는 1보다 큰 유효계수를 가지므로 STAR 요소에서 매우 과잉-표현된다. 과잉-표현된 올리고뉴클레오티드 중에서, 그것들의 관측된 및 예상된 발생은 각각 6 및 1(올리고 163의 경우, CGCGAA, sig=0.02) 내지 133 및 95(올리고 120의 경우, CCCAGG, sig=0.49)까지의 범위이다. 예상된 발생에서의 차이는 인간 게놈의 G:C 함량과 같은 인자를 반영한다. 그러므로, 그것들의 발생수에서의 올리고뉴클레오티드 중에서 차이는 그것들의 과잉-표현보다 덜 중요하다; 예를 들면, 올리고 2(CAGCGG)는 36/9 = 4배 과잉-표현되고, 5천만분의 1의 무작위 기회에 기인하는 예측가능성을 갖는다(sig=7.75).
표 9는 또한 각각의 과잉-표현된 올리고뉴클레오티드가 발견되는 STAR 요소의 수를 나타낸다. 예를 들어, 가장 상당한 올리고뉴클레오티드, 올리고 1(CCCCAC)는 107번 발생하지만, 51개의 STAR에만 발견된다, 즉 평균적으로 STAR당 2개의 카피로 발생한다. 최소량의 올리고뉴클레오티드, 번호 166(AATCGG)는 평균적으로 STAR당 단일 카피로 발생한다(11개의 STAR에서 13번 발생); 단일-카피 올리고뉴클레오티드는 특히 더 적은 올리고의 경우 빈번하게 발생한다. 다른 극단에서, 올리고 4(CAGCCC)는 발견되는(37개의 STAR) 그것들의 STAR에서 평균적으로 3번 발생한다. 가장 넓리 퍼진 올리고뉴클레오티드는 번호 120(CCCAGG)이고, 58개의 STAR에서 발생하고(평균적으로 STAR당 2번), 최소로 넓게 퍼진 올리고뉴크레오티드는 번호 114(CGTCGC)이고, 6개의 STAR에서만 발생한다(그리고 평균적으로 STAR당 1번).
이분염색체 빈도 분성의 결과는 표 10에 주어진다. 730개의 이분염색체는 참고서열에 비교된 STAR 요소의 세트(sig >= 0)에서 과잉-표현되는 것으로 발견되었다. 가장 현저하게 과잉-표현된 이분염색체, CCCN{2}CGG는 65개의 STAR 요소 사이에서 36번 발생하지만, 단지 7번만 발생할 것으로 예상된다. 그것은 유효계수 9.31을 갖는다; 다시 말하면, 우연에 의한 그것의 과잉-표현의 개연성은 1/10^9.31이다, 즉 20억분의 1이다.
397개의 이분염색체는 1보다 큰 유효계수를 가지므로, STAR 요소에서 높게 과잉-표현된다. 과잉-표현된 이분염색체 중에서, 그것들의 관찰된 및 예상된 발생은, 개별적으로 9 및 1(번호 380, 435, 493, 640 및 665)에서 118 및 63(번호 30의 경우 (AGGN{2}GGG), sig = 4.44)까지이다.
패턴 빈도 분석에 의해 STAR 요소에서 과잉-표현되는 것으로 발견되는 올리고뉴클레오티드 및 이분염색체는 선형 구별식 분석으로 그것들의 구별력이 시험되었다. 구별식 모형은 50개의 대부분의 구별식 올리고뉴클레오티드(표 9) 또는 이분염색체(표 10) 패턴 중에서 최고의 조합의 단계별 선별에 의해 처리되었다. 상기 모형은 4(이분염색체) 또는 5개의 변수의 혼입 후 최적의 과오율을 얻었다. 올리고 분석으로부터의 구별 변수는 번호 11, 30, 94, 122 및 160이고(표 9); 이분염색체 분석으로부터의 구별 변수는 번호 73, 194, 419 및 297이다(표 10).
그 다음, 이 구별식 모형이 연습 세트 및 그것들의 연관된 무작위 서열에서 65개의 STAR 요소를 분류하기 위하여 사용되었다. 올리고뉴클레오티드 변수를 사용 하는 모형은 STAR 요소(실제 양성)로서 65개의 STAR 요소 중 46개를 분류한다; 이분염색체 모형은 실지 양성으로서 STAR 요소의 49개를 분류한다. 합하여, 상기 모형은 STAR 요소로서 65개의 STAR 요소 중에서 59개를 분류한다(91%; 도 24). 잘못된 양성 비율(STAR로 분류된 무작위 서열)은 이분염색체 모형의 경우에 7, 올리고뉴클레오티드 모형인 경우에 8, 그리고 두 모형의 혼합된 예측의 경우 13이다(20%). LDA에 의해 STAR로서 분류되지 않았던 표 6의 STAR 요소는 STAR 7, 22, 35, 44, 46 및 65이다. 이들 요소는 기능성 평가에서 항-억제자 활성을 안정화시키는 것으로 나타나고 따라서 그것들이 LDA에 의하여 STAR로서 분류되지 않는다는 사실은 그것들이 STAR 요소의 다른 분류(또는 분류들)을 나타낸다는 것을 제안한다.
그 다음, 상기 모형은 표 11에 기재된 시험 세트에서 19개의 후보 STAR 요소를 분류화하는 데에 사용되었다. 상기 이분염색체 모형은 STAR 요소로서 이들 후보 STAR의 12개를 분류화하고, 상기 올리고뉴클레오티드 모형은 STAR로서 14개를 분류화한다. STAR 요소로 분류화된 후보물질의 조합된 수는 15(79%)이다. 이것은 65개의 STAR의 처리 세트로 얻어지는 것보다 분류의 더 낮은 비율이다; 이것은 두 개의 이유로 예상된다. 첫번째, 구별식 모형은 표 6의 65개의 STAR로 처리되었고, 이 처리 세트에 기초한 구별하는 변수는 시험 세트에서 더 잘 나타내지는 않을 것이다. 두번째, 시험 세트에서 후보 STAR 요소는 인 비보 기능의 관점에서 완전히 특성화되지는 않고, 단지 약한 향-억제 성질을 갖는 요소를 포함할 수 있다. 이 분석은 STAR 요소의 생물정보학적인 분류에 대한 통계학적인 접근의 힘을 예증한다. 상기 STAR 요소는 전체적으로 인간 게놈에 비교하여 현저하게 과잉-표현된 많은 이분염 색체 및 헥사머성 올리고뉴클레오티드 패턴을 함유한다. 이들 패턴은 STAR 활성을 수여하는 단백질에 대한 결합 부위를 나타낼 수 있다; 어떤 경우에 그것들은 STAR 요소 서열을 인식하는 데에 사용될 수 있는 서열 모티프의 세트를 형성한다.
구별식 분석에 의하여 STAR 요소를 인식하도록 이들 패턴을 사용하여, 본 발명의 유전자 스크린에 의하여 얻어진 요소의 높은 비율은 사실상 STAR로서 분류화된다. 이것은 내재하는 서열 및 이들 요소 중에서 기능적인 유사성을 반영한다. 여기서 기재된 방법(패턴 빈도 분석에 이은 구별식 분석)의 상당한 관점은 반복되어질 수 있다는 것이다; 예를 들어, 하나의 처리 세트로 표 6의 66개의 STAR 요소를 갖는 표 11의 19개의 후보 STAR 요소를 포함하는 것으로, 개량된 구별식 모형은 처리될 수 있다. 이 개량된 모형은 STAR로서 다른 후보 조절 요소를 분류화하도록 사용될 수 있다. 생물정보학적인 분석의 반복으로 화합된, 본 발명의 방법을 사용하는 게놈 서열의 대용량 인 비보 스크린은 게놈이 그것의 전체에서 스크리닝되면서 점근선적으로 요소의 100% 인식 및 예측에 접근하는 STAR 요소를 구별하는 수단을 제공할 것이다. STAR 기능의 이들 엄격한 그리고 포괄적인 예측은 모든 인간 STAR 요소가 인식되고, 개량된 트랜스유전자 발현에서의 사용을 가능하게 하는 것을 보증할 것이다.
실시예 22. Arabidopsis thaliana로부터 STAR 요소의 클로닝 및 특성화
트랜스유전자 침묵은 전사의 및 전사후의 수준 모두에서 트랜스제닉 식물에 발생한다(Meyer, 2000, Vance & Vaucheret, 2001). 둘 중 하나의 경우에, 트랜스유전자 발현의 원하는 결과는 침묵에 의하여 손상될 수 있다; 트랜스유전자의 낮은 발현 및 불안정성은 원하는 특색의 약한 발현(예를 들어, 페스트 내성) 또는 제조합 단백질의 낮은 수율을 나타낸다. 그것은 또한 약한 예측가능성을 나타낸다: 생물공학적으로 유용한 수준에서 트랜스유전자를 발현하는 트랜스제닉 식물의 비율은 낮고, 유익한 발현 성질을 갖는 그것들에 대한 형질전환된 개체의 노동적이고 많은 비용이 드는 스크린이 필수적이다. 이 실시예는 트랜스제닉 식물에서 전사 트랜스유전자 침묵을 방해하는 데에서의 사용을 위한 쌍떡잎 식물 Arabidopsis thaliana의 게놈으로부터 STAR 요소의 단리를 기재한다. Arabidopsis는 잘 연구된 모형 유기체이기 때문에 이 실시예를 위해 선별되었다: 그것은 조밀한 게놈을 갖고, 유전자의 및 제조합 DNA 조작으로 다루기 쉽고, 그것의 게놈은 서열화되어 있다(Bevan et al., 2001, initiative, 2000, Meinke et al., 1998).
재료 및 방법:
게놈 DNA는 기재된 바와 같이 Arabidopsis thaliana ecotype Columbia로부터 단리되고(Stam et al., 1998) 그리고 MboI로 부분적으로 소화된다. 소화된 DNA는 아가로스 젤 전기연동 및 젤로부터 정제(QIAquick Gel Extraction Kit, QIAGEN 28706)에 의하여 0.5-2 킬로염기쌍으로 크기-분류되고, pSelect 벡터(상기)로 결찰된다. U-2 OS/Tet-Off/LexA-HP1 세포주로의 트랜스펙션 및 낮은 독시시클린 농도에서의 제오신 내성에 대한 선별은 기재된 바와 같이 수행되었다. 플라스미드는 제오신 내성의 클로니로부터 단리되고 U-2 OS/Tet-Off/LexA-HP1 세포주로 재-트랜스펙션되었다.
재-트랜스펙션에서 제오신 내성을 수여한 Arabidopsis 게놈 DNA 단편의 서열 화는 기재된 바와 같이 수행되었다. DNA 서열은 BLAST 분석((Altschul et al., 1990); URL http://www.ncbi.nlm.nih.gov/blast/Blast)에 의하여 Arabidopsis 게놈의 서열에 비교하였다.
STAR 활성은 역전사 PCR(RT-PCR)에 의해 재조합 숙주세포에서 하이그로마이신- 및 제오신-내성 유전자에 대한 mRNA 수준을 측정하는 것으로 추가로 시험되었다. U-2 OS/Tett-Off/LexA-HP1 세포주의 세포는 Arabidopsis STAR 요소, Drosohila scs 요소를 함유하는, 또는 삽입물을 포함하지 않는 pSelect 플라스미드로 트랜스펙션되었다. 이들은 높은 독시시클린 농도에서 2주동안 하이그로마이신에서 배양된 다음, 독시시클린 농도는 0.1ng/㎖로 낮아지게 하여 lexA-HP1 억제자 단백질을 유도하였다. 10일 후, 총 RNA는 제조업체에 의해 기재된 바와 같이 RNeasy mini kit(QIAGEN 74104)로 단리되었다. 첫번째 스트랜드 cDNA 합성은 제조업체에 의하여 기재된 바와 같이 올리고(dT)18 프라이머를 사용하는 RevertAid Fist Strand cDNA Synthesis kit(MBI Fermentas 1622)를 사용하여 수행되었다. cDNA의 부분표본은 프라이머 D58 및 D80(제오신 마커인 경우), 및 D70 및 D71(하이그로마이신 마커인 경우), 및 Taq DNA 폴리머라제(Promega M2661)을 사용하는 PCR 반응에서 주형으로서 사용되었다. 반응 조건은 94℃에서 1분, 54℃에서 1분, 및 72℃에서 90초의 15-20사이클이다. 이들 조건은 투입 RNA 및 PCR 생성물 DNA 사이의 선형 관계를 나타낸다. PCR 생성물은 아가로스 젤 전기연동으로 결정되고, 제오신 및 하이그로마이신 띠는 주형으로 정제된 pSelect 플라스미드를 갖는 상기와 같이 생성된 PCR 생성물을 사용하여, 기재된 바(Sambrook et al., 1989)와 같이 서던 블로팅으로 탐지되었 다. 제오신 및 하이그로마이신 시그널의 비율은 제오신 유전자의 정상화된 발현 수준에 상응한다.
결과
pSelect 벡터에서의 Arabidopsis 게놈 DNA의 라이브러리는 삽입이 수행된 80%의 E. coli에서 69,000개의 최초 클론을 포함한다. 평균 삽입 크기는 대략 1000 염기쌍이었다; 그러므로 라이브러리는 Arabidopsis 게놈의 대략 40%를 나타낸다.
이 라이브러리의 부분(Arabidopsis 게놈의 약 16%를 표현하는)은 U-2 OS/Tet-Off/LexA-HP1 세포주로 트랜스펙션되었다. 하이그로마이신 선별은 트랜스펙턴트를 단리시키고, 27,000개의 생존하는 클로니를 나타내었다. 이들은 낮은 독시시클린 농도에서 제오신 선별하게 되었다. 56개의 제오신-내성 클로니로부터의 추정 STAR-함유 플라스미드는 E. coli로부터 해방되고, U-2 OS/Tet-Off/LexA-HP1 세포로 재-트랜스펙션되었다. 이들 플라스미드 중 44개(시험된 플라스미드의 70%)는 낮은 독시시클린 농도에서 숙주세포에서 제오신 내성을 수여하고, 플라스미드가 STAR 요소를 가지고 있는 것을 예증한다. 이것은 인간 U-2 OS 세포에서 pSelect 스크린이 식물 게놈 DNA로부터 STAR 요소의 탐지에서 매우 효능적이라는 것을 나타낸다.
이들 44개의 후보 STAR 요소는 DNA 서열은 결정되었다. 그들 중 35개는 Arabidopsis 핵 게놈 서열의 데이타베이스에서 단일 유전자좌로서 동정되었다(표 12; SEQ ID:85 - SEQ ID:119). 다른 4개는 엽록체 게놈으로부터 유래되는 것으로 동정되었고, 4개는 두개의 유전자좌로부터 DNA 단편의 키메라이었고, 하나는 Arabidopsis 게놈 데이타베이스에서 발견되지 않았다.
클로닝된 Arabidopsis STAR 요소의 세기는 RT-PCR 평가를 사용하여, 제오신-내성 유전자의 전사적인 억제를 방해하는 그것들의 능력을 사정하는 것으로 시험되었다. 샘플 중에서 RNA 도입을 위한 대조군으로서, 각각의 STAR 트랜스펙션에 대한 하이그로마이신-내성 유전자의 복사 수준은 또한 사정되었다. 이 분석은 Arabidopsis STAR 요소 중 12개에 대하여 수행되었다. 결과(도 25)는 Arabidopsis STAR 요소가 전사 억제로부터 제오신-내성 유전자를 보호하는 그것들의 능력에서 Drosophila scs 요소(양성 대조군) 및 빈 벡터("SV40"; 음성 대조군)에 대하여 뛰어나다는 것을 예증한다. 특히, STAR-A28 및 STAR-A30은 lexA-HP1 억제자가 발현되는 경우에, scs 요소(하이그로마이신-내성 유전자 mRNA의 내부 대조군에 정상화되는)보다 제오신-내성 유전자 발현의 2-배 높은 수준을 가능하게 한다. 이들 결과는 본 발명의 방법이 인간보다 다른 종의 게놈으로부터 STAR 요소의 회복에 성공적으로 응용될 수 있다는 것을 예증한다. 식물로부터의 STAR 요소에 대한 그것의 성공적인 응용은 그것이, 본 발명의 방법이 응용될 수 있는 넓은 분류학적인 범위를 예증하기 때문에 그리고 식물이 생물공학적인 개발의 상당한 표적이기 때문에 특히 중요하다.
표 1. 트랜스유전자 발현을 개량한 STAR 요소
플라스미드 |
과잉-발현된 클론, % |
폴드 과잉-발현(범위) |
클론수 |
빈 |
12 |
3-11 |
25 |
SCS(양성 대조군) |
24 |
3-160 |
21 |
STAR-6 |
62 |
2-200 |
26 |
STAR-3 |
39 |
5-820 |
23 |
STAR-8 |
63 |
7-315 |
19 |
STAR-4 |
31 |
25-1500 |
13 |
STAR-1 |
57 |
5-80 |
23 |
루시페라제 리포터 유전자의 발현은 STAR 요소(Drosophila로부터의 SCS, 양성 대조군 요소를 포함하는)을 함유하는 또는 함유하지 않은("빈", 음성 대조군), 통합된 pSDH 플라스미드를 함유하는 세포주에서 측정된다. 음성 대조군의 평균 발현 수준은 참고 수준으로 정의되고, 클론은 그것들의 발현 수준이 참고 수준보다 >2배인 경우에 과잉-발현으로 간주한다. 각각의 플라스미드에서 과잉-발현된 클론의 퍼센트 및 폴드 과잉-표현은 각 플라스미드에 대하여 분석된 클론수에 따라서, 보고되었다.
표 2. 클로닝된 STAR 요소
클론 |
염색체 위치1 |
인접 유전자2 |
반복 서열 |
STAR-1 |
N.d. |
|
|
STAR-2 |
N.d. |
|
|
STAR-3 |
For 5q33.3 Rev 10q22.2 |
히스톤에서 Chr 10 부분 아세틸트랜스퍼라제 유전자 |
|
STAR-4 |
For 1p31.1 Rev 14q24.1 |
G-단백질 시그널링의 조절자의 10kb 인트론 안에서의 유전자 부재 |
83% 반복적인 LINE2 & LTR ERV_Class1 |
STAR-5 |
For 3q13.1 Rev 10q22.1* |
|
|
STAR-6 |
2p21 |
L5 kb 알려지지 않은 추정 키나제 R 20 kb 미세관 관련 단백질 |
19% SINE (MIR) 29% LINE |
STAR-7 |
1q32.2 |
|
12% Alu 4% MIR(SINE) LINE 1 2.5% L31CR1 11.5% MER1 7% 낮은 복합체 2% |
STAR-8 |
9q32 |
아연 핑거(finger) 단백질을 함유하는 ZFP KRAB 박스 |
35% ERV_ClassI (LTR) 2% 단순 반복 |
STAR-9 |
STAR4 참조 |
|
|
STAR-10 |
N.d. |
|
|
STAR-11 |
2p25.1 |
단백질 억제자를 결합하는 R 15 kb 알려지지 않은 DNA(Myc 유형) |
12% Alu (SINE) 26% MalRs (LINE) |
STAR-12 |
5q35.3 |
R 15 kb 알려지지 않은 TS2 집단 메탈로 프로테이나제 |
3% 낮은 복합도 |
STAR-13 |
STAR4 및 9 참조 |
|
|
STAR-14 |
F N.d. R 20q13.33 |
|
|
STAR-15 |
1p36.36 |
L 6 kb Voltage-gated K 채널 서브유니트 R 4 kb 알려지지 않은 |
14% LTR (MaLRs) |
STAR-16 |
F 8p23.1 R 8p22 etc. |
|
서열화된 부분에서 비-반복 |
STAR-17 |
2q31.1 |
L 6 kb BTEB1 전사 인자 R 40 kb HNRNP |
10% 단순 및 낮은 복합도 |
1염색체 위치는 인간 게놈 데이타베이스에 대하여 STAR 클론으로부터 DNA 서열 데이타의 BLAST 조사에 의하여 결정된다. 상기 위치는 각 염색체의 세포유전학적인 표의 문자로 인용되는 표준 명명법에 따라서 주어졌다; 예를 들어, 1p2.3은 염색체 1의 짧은 암(arm)의 두번째 세포유전학적인 밴드의 세번째 세포유전학적인 서브밴드이다(http://WWW.ncbi.nlm.nih.gov/Class/MLACourse/Genetics/chrombanding. html). F, 순행 서열화 반응 결과; R, 역행 서열화 반응 결과. N.d., 결정되지 않음.
2인간 게놈 맵 View Build 22 (http://www.ncbi.nlm.nih.gov/cgi-bin/Entrez/hum_srch?chr=hum_chr.inf&query April 2001)에 기초하였다. L, 왼쪽; R, 오른쪽.
*위치 모호, 여러번의 적중(hit)
표 3. pSS 벡터에서 선별에 의한 인간 염색체 22으로부터 회복된 SINC 요소
SINC |
길이(nt) |
염색체 위치1 |
비고 |
psinks 9 |
700 |
22q11.21 |
LTR을 함유한다; 가장 인접한 유전자 ZNF 74, RNA 결합 단백질. LTR 매우 복제적인 |
psinks 12 |
750 |
22q12.3 |
종양 형성에 관련된 아세틸글루코사미닐트랜스퍼라제형 단백질(664kb)의 인트론에 위치한다 |
psinks 19 |
600 |
22q13.1 |
뇌에서 거의 독점적으로 발현된, 칼슘 채널의 인트론에 위치한다. |
psinks 28 |
950 |
22q13.31 |
알려지지 않은 기능의 신장 단백질의 인트론에 위치한다. SINE 요소를 포함한다. |
psinks 30 |
700 |
22q13.33 |
SINE의 일부를 포함한다. |
psinks 35 |
650 |
22q11.21 |
용질 담체를 위한 엑손을 덮는다(미토콘트리온을 위한 핵 유전자). |
염색체 위는 인간 게놈 데이타베이스에 대하여 STAR 클론으로부터 DNA 서열 데이타의 BLAST 조사에 의해 결정된다. 상기 위치는 각 염색체의 세포유전학적인 표의 문자로 인용되는 표준 명명법에 따라서 주어졌다; 예를 들어, 1p2.3은 염색체 1의 짧은 암(arm)의 두번째 세포유전학적인 밴드의 세번째 세포유전학적인 서브밴드이다(http://WWW.ncbi.nlm.nih.gov/Class/MLACourse/Genetics/chrombanding. html).
표 4A: 하나의 스트랜드(순행) 또는 반대쪽 스트랜드(역행)에서의 다양한 STAR 요소의 서열.
표 4B: 다양한 sinc 요소의 서열
표 5. 폴리머라제 연쇄 반응(PCR 프라이머) 또는 DNA 돌연변이화에서 사용된 올리고뉴클레오티드
표 6. 게놈의 위치 및 길이를 포함하는, 본 발명의 STAR 요소
1염색체 위치는 인간 게놈 데이타베이스에 대하여 STAR 클론으로부터 DNA 서열 데이타의 BLAST 조사에 의하여 결정된다. 상기 위치는 각 염색체의 세포유전학 적인 표의 문자로 인용되는 표준 명명법에 따라서 주어졌다; 예를 들어, 1p2.3은 염색체 1의 짧은 암(arm)의 두번째 세포유전학적인 밴드의 세번째 세포유전학적인 서브밴드이다(http://WWW.ncbi.nlm.nih.gov/Class/MLACourse/Genetics/chrombanding. html). 순행 및 역행 서열화 반응이 다른 게놈의 유전자좌로부터 DNAs를 동정하는 경우에, 양쪽 유전자좌 모두 보여진다.
2정확한 길이는 DNA 서열 분석에 의하여 결정되어진다; 대략의 길이는 제한 맵핑으로 결정된다.
3STAR3의 서열 및 위치는 표 2 및 표 4의 회합으로 순화되어진다.
4표 2 및 표 4에서의 이들 번호를 갖는 STAR는 제외되고(이후로 "oldSTAR5"로 간주됨) 그리고 그들의 번호는 DNA 서열 부록에 보여진 STAR 요소에 부여된다. oldSTAR5, oldSTAR14 및 oldSTAR16인 경우에, 클로닝된 DNAs는 두 개의 염색체 위치이상으로부터 키메라이었다; oldSTAR9 및 oldSTAR 13의 경우에, 클로닝된 DNAs는 STAR4에 동일하였다.
5표 4"STAR18"에 동일함.
표 7. 트랜스유전자 발현에서 기간을 통해서 안정성을 전달하는 STAR 요소1
|
세포 분화2 |
루시페라제 발현3 |
STAR6 플러스 퓨로마이신 |
42 |
18,000 |
60 |
23,000 |
84 |
20,000 |
108 |
16,000 |
퓨로마이신이 없는 STAR64 |
84 |
12,000 |
108 |
15,000 |
144 |
12,000 |
1플라스미드 pSDH-Tet-STAR6는 U-2 OS 세포로 트랜스펙션되었고, 클론은 단리되고 실시예 1에서 기재된 바와 같이 독시시크린이 없는 배지에서 배양되었다. 세포는 1:20의 희석으로 매주 신선한 배양 용기에 이동되었다.
2세포 분화의 수는 1주에서 배양이 세포 집합에 도달하는 예측을 기초로 하고, ~6 세포 분화를 나타낸다.
3루시페라제는 실시예 1에서 기재된 바와 같이 평가되었다.
460번의 세포 분화 후, 세포는 두개의 배양 용기에 이동되었다; 하나는 처음 60번의 세포 분화와 마찬가지로, 퓨로마이신을 함유하는 배양 배지가 공급되었고, 두번째 것은 항생물질이 결여된 배양 배지가 공급되었다.
표 8. 인간 STAR 요소 및 그것들의 추정 마우스 오소로그 및 파라로그
1인간 게놈에서의 STAR 요소의 세포유전학적인 위치
2마우스 게놈에서 STAR 요소 오소로그의 세포유전학적인 위치
3높은 서열 유사성을 나타내는 영역의 길이 및 퍼센트 유사성. 어떤 경우에는 높은 유사성의 한 블록(block)이상이 발생한다; 그러한 경우에, 각 블록은 분리되어 기재된다. 유사성<60%은 중요하게 간주되지 않는다.
표 9. STAR 요소에서 과잉-표현된 올리고뉴클레오티드 패턴(6개의 염기쌍).
패턴은 유효계수에 따라서 등급되어진다. 이것들은 참고로서 인간 게놈의 서열을 갖는 RSA-Tools를 사용하여 결정된다. 선형 구별식 분석에서 가장 구별식 변수를 포함하는 패턴은 별표로 표시되었다.
표 10. STAR 요소에서 과잉-표현된 이분염색체 패턴
패턴은 유효계수에 따라서 등급되어진다. 이것들은 참고로서 인간 게놈에서 무작위 서열을 갖는 RSA-Tools를 사용하여 결정된다. 선형 구별식 분석에서 가장 구별식 변수를 포함하는 패턴은 별표로 표시되었다.
표 11. 선형 구별식 분석에 의해 시험된 후보 STAR 요소.
1염색체 위치는 인간 게놈 데이타베이스에 대하여 STAR 요소로부터 DNA 서열 데이타의 BLAT 조사에 의하여 결정된다. 상기 위치는 각 염색체의 세포유전학적인 표의 문자로 인용되는 표준 명명법에 따라서 주어졌다; 예를 들어, 1p2.3은 염색체 1의 짧은 암(arm)의 두번째 세포유전학적인 밴드의 세번째 세포유전학적인 서브밴드이다(http://WWW.ncbi.nlm.nih.gov/Class/MLACourse/Genetics/chrombanding. html). F, 순행 서열화 반응 결과; R, 역행 서열화 반응 결과. 순행 및 역행 서열화 결과가 다른 게놈 위치에 맵핑되는 경우에, 각각의 서열은 인간 게놈 데이타베이스로부터 서열 정보에 기초한 원래 클론의 전체 길이(제한 맵핑에 의하여 결정된 바와 같은)로 확장되었다.
2ND: 결정되지 않음.
표 12. 염색체 위치 및 길이를 포함하는, 본 발명의 Arabidopsis STAR 요소
참고문헌