KR100942116B1

KR100942116B1 - 유전자 전사 조절 성질을 포함하는 디엔에이 서열 및 이러한 디엔에이 서열을 탐지하고 이용하는 방법

Info

Publication number: KR100942116B1
Application number: KR1020097003928A
Authority: KR
Inventors: 아리 피테르 오테; 아르수르 레오 크루케베르그
Original assignee: 크로마제닉스 비.브이.
Priority date: 2001-07-04
Filing date: 2002-06-14
Publication date: 2010-02-12
Also published as: US20070037256A1; AU2002314629B2; AU2007234619A1; EP1600510B1; US7192741B2; EP1829972B1; PT1600510E; EP1829971A3; US20070031934A1; EP1806407B1; EP1829971A1; ATE474053T1; KR20090037485A; DK1808488T3; JP4500044B2; NO338477B1; CY1107678T1; ES2285630T3; DK1842919T3; EP1842919B1

Abstract

본 발명은 조절 서열의 체계적인 설명 및 동정화에 관한 것이다. 본 발명은 조절 서열이 동정될 수 있는가를 다른 스크리닝 및 탐지 방법 중에서 제공한다. 본 발명은 추가로 조절 서열 및, 여기에 제한되지는 않지만, 단백질 생산, 진단법, 트랜스제닉 식물 및 동물과 같은 다양한 분야 및 치료학적인 분야에서의 그것의 용도에 관한 것이다.

항-억제자 활성, 조절 서열, STAR 서열

Description

유전자 전사 조절 성질을 포함하는 디엔에이 서열 및 이러한 디엔에이 서열을 탐지하고 이용하는 방법{DNA sequences comprising gene transcription regulatory qualities and methods for detecting and using such DNA sequences}

본 발명은 약제 및 세포생물학의 분야에 관한 것이다. 본 발명은 특히 유전자 전사 조절을 위한 수단 및 방법에 관한 것이다. 본 발명은 또한, DNA 서열이 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질을 포함하는가를 결정하는 수단 및 방법에 관한 것이다.

여러 가지 게놈 프로젝트가 진행되면서, 유기체 게놈 전체의 서열이 이용가능하게 되었다. 방대한 데이타는 많은 연구자들에게 흥미를 일으키고 있다. 더욱 두드러지는 발견 중 하나는 인간 게놈이 과실파리와 같은 단순한 유기체의 게놈보다 더 유전자를 현저하게 코팅하지 않는다는 관찰이었다. 이제, 많은 연구자의 초점은 유전자의 동정화에서 유전자 발현 및 유전자 기능의 결정으로 이동하고 있다. 이러한 과학기술의 예로는 DNA 마이크로어레이(microarray), 기능유전체학 응용 및 단백질체학이 있다. 이들 과학기술은 공통적으로 그들이 코팅하는 서열의 기능 및 발현에 집중하고 있다는 것이다. 하지만, 유전자에 대한 지식이 급격하게 증가하는 반면에, 이러한 빠르게 증가하는 지식을 적용하는 능력은 유전자의 발현이 어떻게 조절되는가에 대한 이해에 의하여 한정되고 있다. 이것은 예를 들면, 트랜스제닉 식물 및 동물의 생성에서 및 인간 유전자 치료요법에서의 경우이다. 이들 응용에서, 외부 핵산은 전형적으로 세포에 도입되어 코팅하는 서열의 발현을 얻는다. 세포의 게놈으로의 외부 핵산의 통합은 종종 도입된 서열의 연장된 기능을 위해 요구된다. 하지만, 게놈으로의 서열의 통합은 주변 DNA가 통합되는 서열의 전사에 영향을 주기 때문에, 발현의 예측불가성을 유도한다. 이 예측불가성은 유도된 서열이 주변 DNA에 영향을 주는 전사로부터 통합된 서열을 기능적으로 단리하기 위하여 유전체학적인 정보를 충분히 제공받을 수 없다는 사실에 부분적으로 기인한다. 또 다른 부분에서, 이것은 주변 DNA의 효과에 영향을 주는 전사가 충분히 알려지지 않았다는 사실에 기인한다.

본 발명은 인 시스(in cis)에서 유전자의 전사에 영향을 주는 능력을 포함하는 DNA 서열('DNA 분자'라고도 함)에 관한 것이다. 전형적으로, 반드시 그렇지는 않지만, 연구된 서열은 기능적인 단백질로 스스로 코딩되지는 않는다. 인 시스에서 유전자 전사에 영향을 미치는 능력을 갖는 다양한 서열 요소가 동정되고 있다. 이들 요소는 프로모터, 인핸서(enhancer), 사일렌서(silencer)에서 경계 요소 및 매트릭스 첨부 영역까지의 범위이다.

조절 서열의 매우 많고 다른 형태가 발견되고 있다는 사실은 효과적인 발현 카세트를 고안하는 것이 매우 쉽다는 인상은 준다. 하지만, 그렇지 않은 것이 사실이다. 발현 카세트가 아직도 시행착오에 의해 종종 유도된다. 표적 세포 또는 그것의 자손에서 외부 유전자의 어떠한 종류의 발현을 얻는 것은 종종 가능하다. 하지만, 발현 카세트가 표적세포에 나타날 수 있는 발현의 지속성 또는 발현의 수준을 어느 정도의 정확성을 갖고 예상하는 것이 흔히 어렵다는 것이다.

본 발명은 다른 수단 및 방법 중에서 새로운 전사 조절 요소를 단리하고 탐지하기 위한 수단 및 방법을 제공한다. 유전자 전사-조절 성질을 가진 DNA 서열을 탐지하고, 그리고 임의로 선별하는 방법이 제공되고, 이것은 다양한 단편을 포함하는 벡터를 갖는 전사계를 제공하는 것으로, 상기 벡터는 ⅰ) 유전자 전사 억제 성질을 갖는 요소, 및 ⅱ) 리포터(reporter) 유전자의 전사를 이끄는 프로모터를 포 함하고, 상기 방법은 또한 상기 유전자 전사 조정 성질을 갖는 상기 DNA 서열을 동정하기 위해서 상기 전사계에 선별 단계를 수행하는 것을 포함한다. 바람직한 구현예에서, 상기 단편은 ⅰ) 유전자 전사 억제 성질을 갖는 상기 요소 및 ⅱ) 상기 리포터 유전자의 전사를 이끄는 상기 프로모터 사이에 위치한다. RNA 폴리머라제는 프로모터라 칭하는, RNA 합성이 시작하는 위치를 신호하는 특정 서열에 결합한 후 전사 공정을 개시한다. 조정 성질은 주어진 세포형 및 또는 주어진 프로모터에서 인 시스에서의 상기 프로모터로부터 전사를 증대시킬 수 있다. 이러한 DNA 서열은 세포의 한 유형에서 또는 프로모터의 한 유형을 갖는 증대 성질을 포함할 수 있지만, 그것은 세포의 또 다른 유형에서 또는 프로모터의 또 다른 유형을 갖는, 또 다른 유전자 전사 조정 성질을 포함할 수 있거나 또는 전혀 포함하지 않을 수 있다. 전사는 특정 프로모터의 전사 상에 조절 요소(또는 그것에 결합하는 단백질)의 직접적인 영향을 받을 수 있다. 하지만, 전사는 또한 예를 들어, 조절 요소가 하나 이상의 다른 조절 요소의 기능에 영향을 줄 수 있기 때문에, 간접적으로 영향받을 수 있다. 유전자 전사 조정 성질은 또한 안정한 유전자 전사 성질을 포함할 수 있다. 안정하다는 것은 관찰된 전사 수준이 30번의 세포 분화에서도 현저하게 변화하지는 않는다는 것을 의미한다. 안정한 성질은 발현 특성이 여러번의 세포 분화에 걸쳐 예측가능하여야만 한다는 상황에서 유용할 것이다.

전형적인 예는 외부 유전자로 트랜스펙션된 세포주이다. 다른 예로는 트랜스제닉 동물 및 식물 그리고 유전자 치료요법이 있다. 매우 흔하게, 도입된 발현 카세트는 세포 분화수 또는 식물 또는 동물 세대수 증가 후 다르게 기능한다. 바람직 한 구현예에서, 안정한 성질은 트랜스제닉 식물 또는 동물의 뒤이은 생성에서 유전자 전사를 유지하는 성질을 포함한다. 물론, 발현이 유도적인 경우에는 상기 성질은 트랜스제닉 식물 또는 동물의 뒤이은 생성에서 발현의 유도성을 유지하는 성질을 포함한다. 빈번하게, 발현 수준은 세포 분화의 횟수가 증가하면서 급격하게 떨어진다. 본 발명의 방법으로 세포 분화의 횟수가 증가하면서도 전사 수준에서의 급격한 하락을, 적어도 부분적으로 억제하는 능력이 있는 DNA 서열을 탐지하고 임의로 선별하는 것이 가능하다. 그러므로, 바람직한 구현예에서, 상기 유전자 전사 조정 성질은 안정한 유전자 전사 성질을 포함한다. 인상적으로, 상기 안정한 유전자 전사 성질을 갖는 DNA 서열을 포함하는 단편은 본 발명의 방법이 전사의 장기간 안정성을 필수적으로 측정하지는 않는다는 사실에도 불구하고, 본 발명의 방법으로 탐지되고 임의로 선별될 수 있다. 본 발명의 바람직한 구현예에서, 상기 유전자 전사 조정 성질은 안정한 유전자 전사를 증대시키는 성질을 포함한다. 관심의 유전자를 갖는 발현 벡터에서 유전자 전사 조정 성질을 갖는 DNA 서열의 혼입이 세포의 게놈에서 발현 벡터의 통합에서, 상기 관심의 유전자의 전사의 더 높은 수준을 가져다 준다는 것, 더구나 상기 더 높은 발현 수준이 또한 유전자 전사 조정 성질을 갖는 상기 DNA 서열의 비존재에서 더욱 안정하다는 것이 관찰되고 있다. 세포의 게놈으로 관심의 유전자를 유도하고 상기 관심의 유전자의 발현을 얻기 위하여 고안된 실험에서, 하기와 같이 알아 냈다. 상기 관심의 유전자와 함께 유전자 전사 조정 성질을 갖는 DNA 서열이 도입된다면, 더 많은 클론이, 상기 DNA 서열이 상기 관심의 유전자와 함께 도입되지 않는 경우보다도, 상기 관심의 유전자 생성물의 어떠 한 양보다 더욱 많이 발현하는 것이 탐지될 수 있다. 그러므로, 본 발명은 또한, 세포의 게놈으로 상기 관심의 유전자를 제공하면서, 관심의 유전자의 유전자 생성물의 어떤 수준 이상으로 발현하는 세포의 수를 증가시키는 방법으로 제공한다. 상기 방법은 상기 관심의 유전자와 함께 유전자 전사 조정 성질을 포함하는 DNA 서열을 갖는 상기 세포를 제공하는 것을 포함한다.

유전자 전사 조정 성질을 갖는 단편을 탐지하는 가능성은 단편이 유도되는 근원에 따라 다양하다. 전형적으로, 상기 성질을 갖는 단편의 존재 또는 비존재에 관한 이전의 정보는 없다. 그런 상황에서, 많은 단편은 유전자 전사 조정 성질을 갖는 DNA 서열을 포함하지 않을 것이다. 이러한 상황에서, 상기 성질을 갖는 DNA 서열을 위한 형식적인 선별이 도입되었다. 이것은 상기 리포터 유전자의 생성물의 특징에 기초한 상기 서열을 포함하는, 선호적으로 또는 적대적으로 선별될 수 있는 선별 벡터에 의해 이루어진다. 예를 들어, 상기 유전자 생성물은 형광 또는 색상 피복(예를 들어, 형광 단백질 및 유도체, 루시페라제 또는 알칼리성 포스파타제)을 유도하거나 또는 항생물질의 저항을 비교하거나 세포자멸사 또는 세포 죽음을 유도한다.

본 발명의 방법은 특히 유전자 전사를 증대하는 성질을 갖는 DNA 서열을 탐지하고 임의로 선별하는 것에 적합하다. 관심의 유전자를 포함하는 발현 벡터로 혼힙되는 경우에, 적어도 어느 정도의 선별된 DNA는 벡터가 유전자 전사 억제 성질을 갖는 요소를 포함하지 않는 때에 조차도 숙주세포에서 상기 관심의 유전자의 유전자 전사를 급격히 증가시킬 수 있다. 이 유전자 전사를 증대하는 성질은 외부 유전 자로 트랜스펙션된 세포주에서 또는 트렌스제닉 동물 및 식물에서 매우 유용하다.

상기 전사계는 세포가 없는 인 비트로 전사계일 수 있다. 자동화에서 현재의 전문적인 지식으로, 이러한 세포가 없는 시스템은 정확할 수 있고, 빠를 수 있다. 하지만, 본 발명의 경우에, 상기 전사계는 바람직하게는 숙주세포를 포함한다. 숙주세포의 사용은 단편이 세포에서 활동적으로 탐지되고 임의로 선별되는 것은 보장한다.

유전자 전사 억제 성질을 갖는 요소는, 본 발명의 방법에서, 사용된 전사계에서의 프로모터로부터 전사를 억제할 것이다. 상기 억제는 탐지할 수 없는 발현 수준을 이끌지는 않는다. 억제의 존재 또는 비존재에서 발현 수준에서의 차이를 탐지할 수 있고, 임의로 선별할 수 있다는 것이 중요하다. 바람직한 구현예에서, 상기 벡터에서의 유전자 전사 억제는 유전자 전사 억제 염색질로 귀착된다. 이 바람직한 구현예에서, DNA 서열은 탐지될 수 있고, 임의로 선별될 수 있고, 유전자 전사 억제 염색질의 형성을 적어도 부분적으로 대항하는 능력이 있다. 하나의 관점에서, 유전자 전사 억제 염색질의 형성에 적어도 부분적으로 대항할 수 있는 DNA 서열은 안정한 유전자 전사 성질을 포함한다. 바람직한 구현예에서 유전사 전사 억제에 관계된 DNA 서열은 단백질 복합체에 의하여 인식되는 DNA 서열이고, 상기 전사계는 상기 복합체를 포함한다. 바람직하게는, 상기 복합체는 HP1을 포함하는 이종염색질-결합 단백질, Polycomb-그룹(Pc-G) 단백질, 히스톤 디아세틸라제 활성 또는 MeCP2(메틸-CpG-결합 단백질)을 포함한다. 많은 유기체는 하나 이상의 이들 단백질을 포함한다. 이들 단백질은 빈번하게 다른 종에서도 또한 활성을 나타낸다. 그러 므로, 상기 복합체는 또한 둘 이상의 종류로부터 단백질을 포함한다. 알려진 염색질-연관된 단백질 복합체의 언급된 세트는 많은 염기쌍에 걸쳐서 장기적인 억제를 전달할 수 있다. 상기 복합체는 또한 유전자의 억제된 상태를 세포 분화에서의 딸세포로 안정하게 이동하는 것에 관련된다. 이 방법에서 선별된 서열은 많은 염기쌍에 걸친 장기적인 항-억제를 전달할 수 있다(van der Vlag et al., 2000).

사용된 벡터는 클로닝 DNA에 적합한 벡터 및 전사계에서 사용될 수 있는 벡터이다. 숙주세포가 사용되는 경우, 상기 벡터는 에피솜성으로 복제하는 벡터이다. 이러한 방법으로, 벡터 통합 부위가 다름으로 인한 영향은 피하여진다. 통합 부위에서의 DNA 요소를 플랭킹(flanking)하는 상기 벡터는 프로모터의 전사의 수준에서 효과를 가질 수 있고, 그것으로 인하여 유전자 전사 조정 성질을 갖는 DNA 서열을 포함하는 단편의 의태효과를 가질 수 있다. 바람직한 구현예에서, 상기 벡터는 Epstein-Barr 바이러스(EBV), OriP 및 핵 항원(EBNA-1)으로부터의 복제 기원을 포함한다. 이러한 벡터는 많은 종류의 진핵 세포에서 복제가 가능하고, 적절한 조건하에서 염색질로 회합할 수 있다.

또 다른 관점에서, 본 발명은 ⅰ) 식물, 척추동물에서 단리된 DNA 서열 또는 그것의 유도체, 또는 ⅱ) 합성 DNA 서열 또는 유전공학에 의하여 구성된 것을 포함하고, 여기서 DNA 서열은 억제를 금지하는 서열이고, 본 발명의 방법에 따라서 탐지되고 선별되고 임의로 클로닝되는 것을 포함하는 DNA 서열을 제공한다. 또 다른 관점에서, 본 발명은 ⅰ) 식물 또는 척추동물로부터 단리된 DNA 서열 또는 그것의 유도체, 또는 ⅱ) 합성 DNA 서열 또는 유전공학에 의하여 구성된 것, 여기서 DNA 서열은 본 발명의 방법으로써 탐지되고 선별되고 그리고 임의로 클로닝되는 것을 포함하는 DNA 서열을 제공한다. 바람직하게는, 상기 DNA 서열은 표 4A에서 나타낸 바와 같은 서열 또는 그것의 기능성 상동물을 포함한다. 표 4에서 나타낸 바와 같은 서열의 기능성 상동물은 표 4(표 4A 또는 표 4B에 있는)에 주어진 정보로 유도된 서열이다. 예를 들면, 서열에 또는 서열로부터 결실하고, 조정하고, 및/또는 염기를 삽입하는 것으로 표 4에서의 서열로부터 유도될 수 있는 서열은 표 4에서 나타내었고, 여기서 상기 유도된 서열은, 필연적으로 양에서는 아니지만, 표 4에서 나타낸 바와 같은 종류의 서열에 동일한 활성을 포함한다. 기능성 상동물은 추가적으로 표 4에서 나타낸 둘 이상의 서열로부터의 일부분을 포함하는 서열이다. 합성 DNA 서열은 유기체에서 존재하는 서열로부터 직접적으로 또는 간접적으로 유도되지 않는 서열이다. 예를 들면, 드로소필라 scs 또는 scs 서열을 포함하는 서열은, scs 또는 scs 서열이 인공적으로 생성되는 경우에서도, 합성 서열이 아니다.

하나의 관점에서, 본 발명은 더욱 고차의 유전자 조절에 대하여 증가되는 지식에 관계되고, 이 지식을 사용하는 수단 및 방법에 관계된다. 고전적인 프로모터 및 인핸서와 같은 요소가 단일 유전자의 전사를 이끌고 조절하는 것으로 특성화되는 반면에, 염색체 영역 전체의 유전자 전사 능력을 지배하는 더욱 고차의 조절 요소는 아직까지 거의 관심을 받지 못하고 있다. 이러한 더욱 고차원의 요소에 관한 우리 지식의 대부분은 배태발육에 관한 연구에서 비롯된다. 배태발육에서, 세포는 다른 발달의 대사 경로에 의존하게 된다. 의존하는 즉시, 세포는, 많은 세포 분화후에서조차, 거의 그들의 운명이 변하지 않는다.

세포 유형 특이적인 유전자 전사 패턴의 안정한 전송은 프로모터의 환경에 의존하지 않지만, 대신에 DNA 및, 염색질이라 칭하는, 연관된 단백질의 구조에서의 변화에 의해 중재된다. 염색체 수준에서의 유전자 조절은 DNA(예를 들어, 메틸화), 히스톤(예를 들어, 아세틸화 및/또는 메틸화)의 변경을 포함하고, 원거리의 염색체 요소 사이의 장기적인 상호작용을 포함한다.

염색질 주형은 DNA, 히스톤 및 비히스톤 단백질의 고도로 축합된 복합체이고, 핵으로 게놈 전체를 일괄할 수 있고, 동시에 특정 유전자의 적절한 전사를 가능하게 한다. 진핵세포 염색체는 유전자 전사의 활성화에 대한 균일한 주형이 아니다. 염색질 및 염색질 영역의 다른 유형은 구분될 수 있고, 차별적으로 유전자 전사에 영향을 준다. 소위 이종염색질 영역은 '밀폐된' 염색질 구조를 동정하는 반면에, 진정염색질은 더욱 분산되고 '개방된' 염색질 구조와 연관된다. 진정염색질 영역은 조건적인 이종염색질 및 진정염색질로서 인용된, 다소간의 축합된 구조로 나타나는, 구조 변화에 직면할 수 있다. 조건적인 진정염색질 또는 이종염색질의 형성은, 세포 유형 특정한 방법에서, 활성의 또는 억제의 상태에서 유전자를 간직하는, 염색질-중재된 유전자 조절의 내재하는 메카니즘을 나타내는 것으로 믿어진다.

모든 진핵세포에서, 여러 염색질-관련된 단백질 복합체는 세포 유형 특이성의 보전에 관련된 것으로 동정되고 있고, 그 중 하나는 Polycomb 그룹(PcG) 복합체이다. PcG 복합체는 유전자의 안정한 억제에 관련이 있고, 염색질 구조에서의 변화는 상당한 역할을 수행하는 것으로 믿어진다. 유사하게는, 트리토락스 그룹(TrG)으로 명명된, 단백질의 이차 분류는 PcG 단백질의 작동에 반작용하는 것으로 동정되 고 있다. TrG 단백질은 유전자 전사의 보전에 관련된다. 그들의 작동에 대한 각각의 방식에 기초하여, PcG 및 TrG 단백질은 유전자 전사 패턴의 상속가능한 전송에 대하여 상당한, 세포의 기억 시스템을 나타낸다.

PcG 및 TrG 복합체가 그들의 표적 유전자와 어떻게 연관되는지는 아직까지 불분명하다. 유전학 연구는 유전자의 비활성 상태를 전사적으로 보전하는 cis-작용 조절 서열을 특성화하고 있다. 이들 cis-작용 조절 서열에 의해 중재되는 침묵(silencing)은 기능성 PcG 단백질의 존재에 의존하므로, 이들 서열은 PcG 감응 요소(PREs)라고 명명되고 있다. 상기 서열은 염색질의 PcG 중재된 억제에 관련이 있다고 동정되고 있다. 아직까지는, (척추동물 또는 식물 모두에서) 염색질의 억제를 중재하기에 필요한 모든 서열 정보를 포함하는 주형 PREs는 발견되지않고 있다.

게다가, 지금까지는, 시종 일관된 방법에서 장기적인 억제 가능성을 갖는 서열을 연구할 가능하지 않았다. 이것은 많은 부분에서, 이러한 장기적으로 작용하는 서열에 대한 체계적으로 스크리닝할 능력이 없음에 기인한다. 하나의 관점에서, 본 발명은 DNA에서 이러한 서열을 체계적으로 탐지하기 위한 수단 및 방법을 제공한다. 하나의 구현예에서, 본 발명은 하기의 단계,

- 시험 핵산의 집단을 제공하는 단계,

- 프로모터의 전사 조절하에서 시험 핵산 및 제 1 리포터 유전자를 포함하는 발현 벡터의 집단을 생성하는 단계,

- 발현 벡터의 상기 집단을 갖는 세포를 제공하는 단계,

- 세포 또는 이의 벡터-포함 자손을 선별하고, 여기서, 상기 제 1 리포터 유 전자의 전사는 억제되는 단계, 및

- 상기 세포에서 상기 시험 핵산을 동정하는 단계를 포함하는 유전자 전사 억제 성질을 갖는 DNA 서열을 동정하는 방법을 제공한다. 상기 동정된 시험 핵산은 상기 프로모터 기능을 억제하는 능력을 포함하므로, 유전자 전사 억제 성질을 포함한다. 바람직하게는, 상기 동정된 시험 핵산은 또한 회수되고 클로닝된다. 상기 성질은, 상기 성질을 갖는 DNA 서열의 부재하에서의 수준에 비교하여, 상기 프로모터에 물리적으로 연결되는 경우에 상기 프로모터로부터 전사의 수준을 감소하는 능력을 적어도 부분적으로는 포함한다. 바람직한 구현예에서, 상기 유전자 전사 억제 성질은 유전자 전사 억제 염색질 성질을 포함한다. 즉, 상기 전사 수준의 감소는 염색질이 유전자 전사를 억제하는 배치를 갖는 결과이다. 이 배치는 바람직하게는 상기 프로모터를 둘러싼다. 하지만, 상기 배치가 상기 프로모터에서 상기 인핸서의 전사를 증대하는 효과를 적어도 부분적으로 비활성화하는 것에 의하여 인핸서 또는 유사한 것을 둘러싼다. 특히 바람직한 구현예에서, 유전자 전사 억제 염색질 성질을 갖는 상기 DNA 서열은 Polycomb그룹형 감응성 요소를 포함한다.

상기 방법을 사용하여, 프로모터로부터 전사 수준을 감소하는 능력을 포함하는 여러 핵산 서열을 회수하는 것이 가능하다. 유사한 기능을 갖는 서열은 서열 유사성으로 서로 비교될 수 있고, Polycomb그룹형 감응성 요소와 같이 유전자 전사 억제 성질을 갖는 요소에 대한 하나 이상의 컨센서스 서열이 추정될 수 있다. 더구나, 유기체의 게놈의 전체 서열이 알려지고 얼마 안 있어 더 많은 것이 알려지게 된다는 점을 고려하여, 이들 게놈 또는 그것의 일부분을 스크리닝하고, 게놈에서 이들 서열의 발생을 예상하는 것이 가능하다. 게놈에서 유전자 전사 조절 성질 및/또는 유전자 전사 억제 성질을 포함하는 DNA 서열의 출현 및 위치결정에 관한 지식은 게놈에서 유전자 전사의 더 고차원적 조절에 대한 우리의 지식을 매우 증가시킬 것이다.

Polycomb그룹 감응 요소는 상기 요소를 갖는 하나 이상의 Polycomb그룹 단백질의 직접적인 및/또는 간접적인 상호작용에 감응하여 프로모터로부터 전사를 억제할 수 있는 요소이다. Polycomb그룹형 감응 요소는 Polycomb그룹 반응요소이거나 또는 대체가능하게는 상기 요소를 갖는 하나 이상의 단백질의 직접적인 및/또는 간접적인 상호작용에서의 프로모터의 전사를 억제할 수 있는 요소이고, 여기서, 상기 하나 이상의 단백질은 Polycomb그룹에 속하지는 않지만, 상기 상호작용의 결과로서, 유전자 전사 억제 염색질이 형성된다. 이러한 단백질의 예로는 이종염색질 단백질1(HP1)과 같은 염색질 관련 단백질이 있다(Eisenberg et al., 1990). 유전자 활성을 억제하는 다른 염색질관련 단백질은 메틸-CpG-결합 단백질, MeCP2이 있다(Nan et al., 1997). 바람직한 구현예에서, 본 발명의 Polycomb그룹형 감응성 요소는 원거리에 있는, 바람직하게는 2000 염기쌍 이상에 있는 프로모터의 전사 억제 능력을 포함한다(van der Vlag et al., 2000).

시험 핵산의 집단은 많은 방법으로 생성될 수 있다. 시험 핵산으로서 인공적인 서열을 사용하여 유전자 전사 억제 성질에 대한 컨센서스 서열을 얻을 수 있다. 다른 성질은 다른 컨센서스 서열을 포함할 수 있다. 바람직하게는 상기 집단은 염색체 DNA로부터 생성된다. 이 방법에서, 염색체에서 자연적으로 발생하는 서열을 포함하는 유전자 전사 억제 성질이 발견된다. 이것은 염색체에서 이들 성질의 위치가 결정될 수 있는 이점을 갖고, 그 결과로, 상기 위치에서 더욱 고차원의 유전자 전사에 그들의 영향이 해결될 수 있다.

리포터 유전자는 세포에서 직접적으로 또는 간접적으로 탐지될 수 있는 발현 생성물을 코드화하는 유전자이다. 유전자 전사 억제 성질을 탐지하기 위한 방법에서, 세포로의 발현 벡터의 전이는 상기 리포터 유전자의 발현을 이끌 것이다. 하지만, 시험 핵산이 Polycomb그룹형 감응 요소와 같은 유전자 전사 억제 성질을 포함하는 경우에, 발현은 상기 리포터 유전자의 적어도 부분적으로 감소된 발현을 이끄는 것에 의하여 상기 세포에서 억제될 것이다. 그러므로, 상기 프로모터의 전사를 억제할 수 있는 핵산의 존재 또는 부재는 상기 세포에서 상기 발현 생성물을 탐지하는 것으로 탐지될 수 있고, 그것으로 인하여 감소된 결실 또는 무결실은 유전자 전사 억제 성질의 존재를 나타낸다. 리포터 유전자는 형광 리포터 단백질을 코드화할 수 있다. 그런 다음, 감소된 발현은 예를 들어, 유속 세포계산기와 같은 형광계의 수단에 의하여 탐지될 수 있다. 낮거나 또는 전무한 형광을 나타내는 세포는 형광 활성화된 세포 구분기(sorter) 및 발현 벡터 및/또는 단리된 시험 핵산, 예를 들어 증폭 반응을 사용하여 구분될 수 있다. 바람직하게는, 상기 제 1 리포터 유전자는 선별가능한 리포터 유전자, 발현을 포함하고, 상기 발현은 상기 세포를 상기 제 1 리포터 유전자의 낮은 수준으로 발현하거나 또는 발현하지 않는 세포에서 적어도 성장 단점을 직접적으로 또는 간접적으로 제공한다. 유전자 전사 억제 성질을 갖는 DNA 서열이 스크리닝하는 경우에, 상기 제 1 리포터 유전자의 발현은 바람직 하게는, 상기 세포에 직접적으로 또는 간접적으로 독성을 갖는다. 이러한 독성의 발현 생성물의 비제한적인 예는 리신 또는 그것의 독성 이형체이다. 또 다른 예에서, 상기 제 1 리포터 유전자는 세포자멸사를 유도하는 유전자 생성물을 코드화한다. 바람직하게는 상기 세포자멸사를 유도하는 유전자 생성물은 아데노바이러스 13S E1A 또는 그것의 기능성 등가물을 포함한다(Breckenridge and Shore, 2000). 또 다른 구현예에서, 상기 세포자멸사를 유도하는 유전자 생성물은 아포프틴 또는 그것의 기능성 등가물을 포함한다(Pietersen and Noteborn, 2000).

또 다른 예는 헤르페스 단순포진 바이러스 티미딘 키나제(HSV-tk)와 같은 소위 자살 생성물을 코드화하는 유전자이다. HSV-tk를 발현하는 세포의 배양액에 간시클로비르을 첨가하는 것은 이들 세포에서 독성물질의 형성을 초래할 것이다. 특히 바람직한 구현예에서, 상기 자살 유전자는 시토신 디아미나제를 포함한다. 시토신 디아미나제는 시토신을 우라실로 변환한다. 이 효소 활성은 원핵세포 및 저급 진핵세포에서 발견되지만, 고급 진핵세포에서는 존재하지 않는다. 상기 유전자는 프로드럭 5-플루오로시토신(5-FC)과의 조합에서 생체대사의 자살 유전자로서 사용된다. 시토신 디아미나제는 비독성 5-FC를 5-플루오로우라실로 변환할 수 있고, 이것은 DNA 합성을 붕괴시키는 것으로 세포를 죽일 수 있으므로, 세포자멸사를 유발한다(Mullen et al., 1992; Wei and Huber, 1996).

상기 제 1 리포터 유전자의 전사 조절 프로모터는 활성이거나 또는 상기 세포에서 활성화될 수 있는 어떤 프로모터일 수 있다. 특정 프로모터를 선별하는 것으로 상기 특정 프로모터의 전사를 억제할 수 있는 Polycomb그룹형 감응성 요소와 같은 유전자 전사 억제 성질을 선별하는 것은 가능하다. 이러한 방법에서 상기 특정 프로모터가 속하는 종류의 프로모터를 명확하게 억제하는 성질을 선별하는 것은 가능하다. 바람직한 구현예에서, 상기 프로모터는 그것의 활성이 상기 프로모터를 시그널와 함께 포함하는 세포를 제공하는 것을 유도할 수 있는 프로모터를 포함한다. 이러한 유도가능한 프로모터는 바람직하게는 테트라시클린 감응성 프로모터를 포함한다. 여기서 시그널은 테트라시클린, 독시시클린 및 균등물이다. 이러한 프로모터는 또한 진핵 세포에서 테트라시클린 감응성에 적응할 수 있다(Yin et al., 1996). 프로모터 및 실행하는 분자는 테트라시클린 또는 그것의 상당물의 첨가로 유전자의 발현을 유도하거나 억제하는 것이 가능하다.

본 발명의 발현 벡터로 트랜스펙션된 세포는, 전형적으로 낮은 빈도로 그리고 유전자 전사 억제 성질을 갖는 DNA 서열의 존재와 연관되지 않는 이유로, 상기 제 1 리포터 유전자의 발현 생성물의 탐지가능한 양을 발현할 수 없다. 이것은 예를 들어, 상기 제 1 리포터 유전자의 코딩 서열을 붕괴하는 재조합 사건에 기인할 것이다. 본 발명의 바람직한 구현예에서, 발현 벡터의 상기 집단은 추가로 제 2 리포터 유전자를 포함한다. 상기 제 2 리포터 유전자의 발현은 바람직하게는 이차 프로모터의 조절하에 있다. 상기 제 2 리포터 유전자의 발현 생성물의 발현을 탐지하기 위한 방법은 상기 시험 핵산의 발현을 억제하는 활성을 확인하는 데에 사용될 수 있고, 그것으로 인하여, 상기 제 1 리포터 유전자를 그릇되게 발현하지 않는 세포의 수를 적어도 부분적으로 감소한다. 바람직한 구현예에서, 상기 제 2 리포터 유전자는 발현 카세트를 포함하는 세포용으로 선별된다. 이러한 방법으로, 상기 발 현 카세트를 포함하지 않는 세포는 쉽게 무시될 수 있다. 결론적으로, 상기 제 2 리포터 유전자의 상기 발현 생성물은 바람직하게는 양성의 지배적인 선별가능한 리포터 유전자를 포함한다. 바람직하게는, 상기 양성의 지배적인 선별가능한 리포터 유전자는 다른 독성화합물에 내성을 줄 수 있는 발현 생성물을 코드화한다. 비제한적인 예로는 G418 내성 및 히그로마이신 내성이 있다.

유전자 전사 억제 성질이 전사를 억압하는 것을 고려하여, 이 구현예에서 발현 벡터는 추가로 유전자 전사 억제 성질을 갖는 DNA 서열의 전사 억제 효과에 반작용할 수 있는, 유전자 전사 조정 성질을 갖는 적어도 한 개의 DNA 서열을 포함한다. 발현 벡터에서 상기 전사를 대항하는 요소의 대체는 바람직하게는 상기 제 2 리포터 유전자의 전사 수준에서 가질 수 있는 상기 유전자 전사 억제 성질의 효과를 감소하는 것에 의하여 효과적으로 방해하는 것이 된다. 바람직한 구현예에서, 유전자 전사 조정 성질을 갖는 상기 DNA 서열은 기능적으로 상기 일차 및 상기 제 2 리포터 유전자를 포함하는 발현 카세트를 분리한다. 바람직하게는, 상기 제 2 리포터 유전자(및 상기 제 2 리포터 유전자의 전사 조절 프로모터)는 유전자 전사 조정 성질을 갖는 DNA 서열에 의해 플랭킹된다. 유전자 전사 조정 성질을 갖는 DNA 서열의 예로는 표 1 및 2에 기재된 소위 STAR 요소이다.

본 발명의 방법은 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질을 포함하는 많은 요소의 클로닝 및 동정화를 초래한다. 이러한 요소는 예를 들어, 유전자 전사 억제 염색질의 형성에 관련되지 않은 상기 성질을 수행하는 데에서의 수단이 아닌 관계없는 핵산을 함유할 수 있다. 이러한 요소에서 기능적인 서열은 종래에 알려진 여러 방법으로 나타낼 수 있다. 하나의 구현예에서 결실 및/또는 치환은 유전자 전사를 조정하거나 또는 유전자 전사 억제 성질을 갖는 DNA 서열에서 이루어진다. 이러한 방법으로 조정되는 DNA는 본 발명의 방법에서 활성에 대하여 시험된다. 이것은 단일 변형된 핵산을 사용하거나 또는 상기 변형된 핵산을 포함하는 시험 핵산의 집단을 생성하는 것으로 이루어질 수 있다. 본 발명의 DNA 서열안에서 기능적인 서열의 해명은 유전자 전사를 조정하고 그리고/또는 유전자 전사 억제 성질을 갖는 요소에 대한 컨센서스 서열의 해명을 가능하게 한다. 여러 Polycomb형 복합체가 있고 각각 다른 기능성 및 발현 패턴을 포함한다는 것을 고려하면, 하나 이상의 컨센서스 서열의 유형은 본 발명의 방법으로 발견된다는 것이 예상된다. 유사하게는 하나 이상의 컨센서스 서열이 유전자 전사 조정 성질을 포함하는 원소에 대하여 발견되는 것이 예상된다. 그러므로, 본 발명은 Polycomb그룹형 감응성 요소와 같이 유전자 전사를 조정하고 그리고/또는 유전자 전사 억제 성질을 포함하는 단리된 및/또는 재조합 핵산의 라이브러리를 추가로 제공한다. 하나의 구현예에서, 상기 라이브러리는 동일한 컨센서스 서열을 포함하는 단리된 및/또는 재조합 핵산을 포함한다. 바람직한 구현예에서, 상기 라이브러리는 하나 이상의 컨센서스 서열의 유형을 포함한다. 상기 라이브러리는 예를 들어 주어진 DNA 분자가 DNA를 조정하는 성질을 포함하는지를 결정하는 데에 사용될 수 있다. 바람직한 구현예에서, 상기 라이브러리는 실질적으로 염색체의, 유전자 전사를 증대하는 기능을 갖는 모든 요소, 안정한 유전자 전사 성질을 포함하는 요소 및/또는 Polycomb그룹형 감응 요소와 같은 유전자 전사 억제 성질을 갖는 요소를 포함한다. 염색체에서 이들 요소의 위치에 관한 지식이외에, 이것은 당업자에게 상기 염색체 상에 자연적으로 존재하는 유전자의 유전자 발현의 고차원의 조절에 대한 그리고 재조합 수단에 의하여 상기 염색체로 도입된 유전자(외부 핵산)에 대한 예상을 가능하게 한다. 이러한 예상은 예를 들어, 외부 DNA의 삽입을 위한 상기 염색체상에서 적절한 후보 위치를 선별하는 데에 사용될 수 있다. 적절한 위치는 어떤 세포, 세포형 및/또는 조직에서 명확하게 발현될 것이라고 예상되는 위치일 수 있다. 바람직하게는, 상기 염색체는 염색체 21 또는 염색체 22를 포함한다. 특히 바람직한 구현예에서, 세포에서의 유전자 전사를 조정하거나 또는 유전자 전사 억제 성질을 포함하는 모든 DNA 서열은 라이브러리 내에 있다. 이 구현예에서 게놈 전체는 적절한 후보 위치를 예상하는 데에 사용될 수 있다. 하나의 구현예에서 상기 라이브러리는 식물에서 인간까지의 범위의 종의 다른 세포주에서 생성될 수 있다. 다른 세포주 및/또는 종에서, 유전자 전사 억제 성질을 갖는 DNA 서열과 상호작용할 수 있는 다른 단백질(또는 단백질 복합체)은 유전자 전사 억제 성질을 갖는 다른 DNA 요소를 야기하도록 발현될 것이다. 유사하게는, 유전자 전사 조정 성질을 포함하는 DNA 서열과 직접적으로 또는 간접적으로 상호작용하는 다른 단백질이 발현될 것이다. 그러므로, 라이브러리의 구성은 세포형에 위존하고, 그리고 관련된 단백질의 존재에 의존한다. 이것은 또한 Polycomb그룹형 감응 요소의 경우이다. HP1이 세포형 1에서 발현된다면, HP1에 의존하는 요소는 본 발명의 방법에 의해 탐지될 것이다. HP1가 세포형 2에서 발견되지 않는다면, 본 발명의 방법은 세포형 하나로부터 회수되는 요소를 탐지하지 않을 것이다.

본 발명의 한 관점에서, 상기 라이브러리는 유전자 전사 억제 염색질의 형성에 적어도 부분적으로 대항할 수 있는 하나 이상의 요소를 포함한다. 염색체 또는 게놈에서 유전자 전사 억제 성질을 갖는 DNA 서열의 위치에 대한 지식 이외에, 이러한 대항하는 요소의 위치에 대한 지식은 상기 염색체 또는 게놈에서(삽입된) 유전자의 유전자 전사의 고차원 조절의 더욱 정확한 예상을 가능하게 한다. 바람직하게는 상기 라이브러리는 추가로 인핸서 및 사일렌서와 같은 다른 전사 조절 요소를 포함한다. 이러한 서열이 고차원의 유전자 조절에 제한된 영향을 줄지라도, 이러한 다른 서열의 위치에 관한 정보는 추가로 그 안에 삽입된 외부 서열의 발현을 위한 게놈에서의 적절한 위치에 대한 예측의 정확도를 증가시킨다. 바람직하게는, 상기 라이브러리는 실질적으로 유전자 전사 조절 성질 및/또는 염색체의 모든 다른 조절 서열을 포함하는 모든 DNA 서열을 포함한다.

이미 염색체가 전형적으로 수천만개의 염기에 의해 구축된다는 것을 고려하면, 라이브러리는 고차원의 유전자 조절에 주어진다는 정보가 자동화된 시스템에 적어도 부분적으로 혼입되는 것이 바람직하다.

본 발명의 라이브러리의 또 다른 용도는 "고차원(higher order)" 조절 서열이 돌연변이되는 식으로 염색체 서열의 표적화된 변형시 유전자의 전사를 예상하는 것이다. 예를 들면, 본 발명의 하나 이상의 Polycomb그룹형 감응성 요소, 및/또는 상기 염색체에서의 다른 조절 요소는 돌연변이된다. 이것은 Polycomb그룹형 감응성 요소 및/또는 다른 발현 조정 요소의 근처에 있는 유전자의 전사 수준을 변화시키는 것으로 기대된다.

본 발명의 라이브러리 또는 시스템의 또 다른 용도는 게놈에서 돌연변이로부터 야기되는 유전자 발현의 예상이다. 돌연변이가 변경된 유전자 전사를 야기하는 경우에, 이러한 변경된 유전자 전사의 탐지는 상기 자연적으로 발생하는 돌연변이의 존재를 나타낼 수 있다. 이 접근은 예를 들면, 진단 평가에서 시험되어질 서열 또는 단백질의 수를 제한하는 데에 유용하다. 이것은 특히 이들 접근에서 시험되어질 발현 서열의 수가 배열이 최대로 보유할 수 있는 서열의 수에 의해 제한되기 때문에, 마이크로어레이에서 중요하다. 본 발명의 수단 및 방법으로, 마이크로어레이 접근에서 시험되어질 서열의 수를 제한하는 것이 가능하다.

본 발명의 시스템 또는 라이브러리의 또 다른 용도는 약물 표적의 발견이다. 그들이 "고차원" 요소이거나 그렇지 않은, 조절 요소는 그것들에 결합할 수 있는 단백질(복합체)이기 때문에 기능화된다. 본 발명의 시스템은 특정 단백질(복합체)의 결합 또는 기능으로 방해하기 위한 약제의 표적화가 특정 유전자의 발현의 변경을 위한 가능성이 있는지를 결정하는 데에 사용될 수 있다.

본 발명은 본 발명의 방법에 의하여 얻어질 수 있는 유전자 전사 억제 성질을 포함하는 DNA 서열을 추가로 제공한다. 바람직한 구현예에서, 유전자 전사 억제 성질을 갖는 상기 DNA 서열은 척추동물에서 식물까지로부터 유도된다. 더욱 바람직하게는, 유전자 전사 억제 성질을 갖는 상기 DNA 서열은 표 4B에 따른 서열 또는 그것의 기능적인 유사체를 포함한다. 본 발명의 DNA 서열로 DNA 구성을 제공하는 것, 또는 이러한 DNA 서열을 조정하는 것이 또한 가능하다. 바람직한 구현예에서, DNA 컨스트럭트(construct: 이하에서 '구성물'이라고도 함)은 관심의 핵산으로 작동가능하게 연결된 프로모터를 포함하는 것으로 제공된다. 바람직하게는, 유전자 전사 조절 및/또는 억제 성질을 갖는 상기 DNA 서열의 성질의 활성량은 상기 프로모터와 비교하여, 상기 구성물에서 상기 DNA 서열의 배향(orientation)에 의존한다. 바람직하게는, 상기 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질은 시그널의 존재에 의존한다. 바람직하게는, 상기 시그널은 DNA 결합 단백질을 포함한다. 바람직하게는, 상기 시그널은 인간 면역-결핍 바이러스 TAT 단백질을 포함한다.

유전자 전사 조정 성질 또는 유전자 전사 억제 성질을 포함하는 DNA 서열의 용도 중 하나는 물론 관심의 유전자 전사의 조절이다. 관심의 유전자의 전사는 상기 성질을 갖는 DNA 서열이 제공되거나 또는 제거되는 것과 같이, 상기 유전자의 근처에서 서열을 변경하는 것으로 변경되어질 수 있다. 특정한 발현의 특징은 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질을 갖는 DNA 서열(의 일부분)을 결합하는 것으로 고안될 수 있다. 예를 들면, 발현 벡터에서 안정한 유전자 전사 성질을 갖는 서열의 복제는 상기 표적세포에서 상기 벡터의 도입에서 자손 또는 표적세포에서의 발현이 향상되는 것을 이끌 것이다. DNA 서열이 유전자 전사 조정 성질과 결합함으로서, 변경된 유전자 전사 조정 성질은 종류 또는 양에서 또는 모두에서 생성될 수 있다.

DNA 서열을 원하는 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질로 고안하는 것 또한 가능하다. DNA 결합 단백질은 다른 단백질 또는 DNA 서열과 함께 DNA 서열의 성질을 결정한다. 하나 이상의 다른 단백질 결합 DNA 서열을, 성질을 갖는 DNA 서열로 삽입하는 것은 가능하다. 결합 단백질이 결합하게 함으로서, 성질을 방해하는 것, 또는 이끄는 것이 가능하므로, 고안된 성질을 갖는 DNA 서열을 생성할 수 있다. 특정 유전자 전사 조절 성질 및/또는 유전자 전사 억제 성질을 갖는 DNA 서열로부터 단백질 결합 부위를 제거하는 것도 물론 가능하므로, 그것으로 인하여 생성된 DNA 서열의 성질이 변경된다. 첨가 및 제거의 조합 또한 가능하다. 특정 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질은 본 발명에서 개시된 탐지 방법을 조화하는 것으로 선별될 수 있다. 예를 들면, 유도가능한 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질을 갖는 DNA 서열을 합성하는 것이 가능하다. 예를 들어, 유전자 전사 억제 성질을 포함하는 DNA 서열에서 TAT-결합 요소를 포함하는 것으로써, TAT를 포함하는 세포에서 유전자 전사 억제 성질을 적어도 부분적으로 비활성화시키는 것이 가능하다. 유사하게 시그널의 존재 또는 부재에서 그들의 표적 서열에만 결합할 수 있는 DNA 결합 단백질이 있다. 이러한 단백질의 비제한적인 예는 TET-억제제 및 그것의 다양한 돌연변이체, lac-억제제, 스테로이드 호르몬 수용체, 레티노산 수용체 및 유도체가 있다. 예를 들어, DNA 서열을 세포형 특정 유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질으로 고안하는 것이 가능하다. 예를 들면, 상기 TAT 예의 경우. 언급된 DNA 서열은 TAT를 발현하는 HIV 감염세포에 대하여 특정하게 될 수 있다. 대체가능하게는 DNA 서열은 세포형 특이적 방식으로 발현되는 단백질 복합체에 특이적으로 만들 수 있다.

유전자 전사 조정 성질 및/또는 유전자 전사 억제 성질을 포함하는 DNA 서열을 포함하는 발현 구성물은 상기 발현 구성물의 하나 이상의 카피(copy)를 포함하는 세포에서 상기 구성물로부터 발현하기에 적절하다. 또한, 발현 구성물이 상기 세포의 게놈에서 존재하는 경우이고, 또한 발현 카세트가 상기 세포에서 하나 이상의 카피에서 존재하는 경우이다. 더구나, 그것들은 하나 이상의 카피에서 동일한 위치로 통합되는 경우에도 작용한다.

본 발명의 바람직한 구현예에서, 유전자 전사 조정 성질을 갖는 상기 DNA 서열은 소위 STAR(안정화하는 항-억제) 서열을 포함한다. 여기서 사용된 바와 같은 STAR 요소는 상기 유전자 전사 조정 성질을 하나 이상 포함하는 DNA 서열로 간주된다.

종래의 여러 방법으로 어떤 일반적인 특징을 분담하는 DNA 서열군에서 서열 동정체(identifier)를 추출할 수 있다. 이러한 서열 동정체는 그 후에 하나 이상의 동정체를 분담하는 서열을 동정하는 데에 사용될 수 있다. 그러한 하나 이상의 동정체를 분담하는 서열은 동일한 서열군의 하나일 수 있다, 즉 상기 군의 일반적인 특징을 분담할 수 있다. 본 발명에서 STAR 활성(소위 STAR 서열)을 포함하는 많은 서열은 STAR 활성을 포함하는 서열의 특징을 나타내는 서열 동정체(패턴)을 얻는 데에 사용될 수 있었다. 이들 패턴은 시험 서열이 STAR 활성을 함유하는 가를 결정하는 데에 사용될 수 있다. 본 발명의 하나의 관점에서, 본 발명은 약 50-5000개의 염기쌍의 핵산 서열안에서 STAR 서열의 존재를 탐지하는 방법을 제공하고, 이것은 하나 이상의 서열 패턴의 상기 서열에서 발생의 횟수를 결정하고 그리고 상기 발생의 횟수가 STAR 서열을 포함하는 하나 이상의 서열에서 상기 하나 이상의 서열 패턴의 발생 횟수를 대표하는가를 결정하는 것을 포함한다. 원칙적으로 어느 방법은 서열 패턴이 STAR 서열을 대표하는가를 결정하는 데에 적합하다.

많은 다른 방법은 당기술분야에서 사용가능하다. 본 발명의 바람직한 구현예에서, 상기 발생이 STAR 서열을 포함하는 하나 이상의 서열에서 상기 하나 이상의 서열패턴의 발생 횟수를 대표하는 가를 결정하는 단계는 상기 하나 이상의 서열패턴의 발생 횟수가 상기 하나 이상의 STAR 서열 및 하나 이상의 대조 서열사이에서 현저하게 다르다는 것을 결정하는 것을 포함한다. 원칙적으로 어느 현저한 차이는 STAR 서열의 존재에 식별된다. 하지만, 특히 바람직한 구현예에서, 상기 하나 이상의 서열패턴의 발생 횟수는 하나 이상의 대조 서열에 비교하여, STAR 서열을 포함하는 상기 하나 이상의 서열에서 현저하게 더 높다.

STAR 서열을 포함하는 주목할 만한 많은 서열은 본 발명에서 동정되고 있다. 패턴이 대조 서열 및 STAR 서열을 포함하는 서열을 구별하는 데에 얼마나 효율적인가를 시험하기 위해 이들 서열을 사용하는 것이 가능하다. 소위 구별 분석을 사용하여, 하나의 종 안에서 STAR 서열의 어느 세트를 기초로 하여 그것의 가장 최상의 구별되는 서열 패턴 또는 조합을 구별하는 것이 가능하다. 그러므로, 바람직하게는, 상기 패턴의 하나 이상은 STAR 서열을 포함하는 하나 이상의 상기 서열 및 대조 서열 간에 원하는, 바람직하게는 최상의 구별을 기초로 하여 선별된다. 원하는 구별은 생물정보학을 통하여 패턴과 관련된 어떤 상당한 인자일 수 있다.

바람직한 구현예에서, 시험 핵산에서 서열 패턴의 발생 횟수는 STAR 서열을 함유하는 것으로 알려진 서열에서 발생 횟수와 비교된다. 이 경우에서 패턴은 발생 횟수가 유사하다면 STAR 서열을 포함하는 서열에 대하여 대표한다고 간주된다. 바람직한 구현예에서 또다른 규범이 사용된다. STAR 서열을 포함하는 서열에서의 패 턴의 발생 횟수는 대조 서열에서의 상기 패턴의 발생 횟수에 비교된다. 두 개의 횟수를 비교하는 것에 의하여 STAR 서열을 포함하는 서열에서의 횟수가 대조 서열에서의 횟수와 현저하게 다른가를 분석하는 것은 각각의 패턴을 결정하는 것이 가능하게 한다. 이 구현예에서, STAR 서열을 포함하는 하나 이상의 서열에서 패턴의 발생 횟수가 대조 서열에서의 동일한 패턴의 발생 횟수와 다르다면, 서열 패턴은 STAR 서열을 포함하는 서열을 대표하는 것으로 간주된다. STAR 서열을 포함하는 많은 수의 서열을 사용하는 것으로, 통계학적인 차이가 입증될 수 있는 패턴의 수는 증가하므로, 발생 횟수는 STAR 서열을 포함하는 서열에 대하여 대표하는 패턴의 수를 증가시킨다. 바람직하게는 상기 발생 횟수는 STAR 서열을 포함하는 2개 이상의 서열에서, 더욱 바람직하게는 STAR 서열을 포함하는 5개 이상의 서열에서 상기 하나 이상의 서열 패턴의 발생 횟수에 대하여 대표한다. 더욱 바람직하게는 STAR 서열을 포함하는 10개 이상의 서열에서이다. 더욱 바람직하게는, 상기 발생 횟수는 STAR 서열을 포함하는 20개 이상의 서열에서 하나 이상의 상기 서열의 발생 횟수의 전헝이다. 특히 바람직한 구현예에서 상기 발생 횟수는 STAR 서열을 포함하는 50개 이상의 서열에서 하나 이상의 상기 서열의 발생 횟수를 대표한다.

STAR 서열을 포함하는 서열을 나타내는 패턴은 또한 사용된 대조군 핵산의 유형에 의존한다. 사용된 대조 서열의 유형은 바람직하게는 STAR 서열의 존재가 탐지되는 서열을 기초로 하여 선별된다. 바람직한 구현예에서 상기 대조 서열은 STAR 요소를 포함하는 하나 이상의 상기 서열로서 유사한 AT/CG 함량을 포함하는 무작위 서열을 포함한다. 또 다른 바람직한 구현예에서, 대조 서열은 상기 STAR 요소를 포 함하는 하나 이상의 상기 서열로서 동일한 종에서부터 유도된다. 예를 들면, 시험 서열이 STAR 서열의 존재에 대하여 정밀하게 조사되어 식물 세포에서 활성이라면, 바람직하게는 대조 서열은 또한 식물 세포로부터 유도된다. 유사하게는, 인간 세포에서 STAR 활성에 대하여 시험하는 경우에, 대조군 핵산은 또한 바람직하게는 인간 게놈으로부터 유도된다. 바람직한 구현예에서, 대조 서열은 STAR 서열을 포함하는 하나 이상의 상기 서열의 염기의 50%와 150%사이를 포함한다. 특히 바람직한 구현예에서, 상기 대조 서열은 STAR 서열을 포함하는 하나 이상의 상기 서열의 염기의 90%와 110%사이를 포함한다. 더욱 바람직하게는, 95%와 105% 사이이다.

패턴은 두 개 이상의 염기의 수를 포함할 수 있다. 바람직하게는, 하나 이상의 서열 패턴은 5개 이상을 포함하고, 더욱 바람직하게는 6개 이상의 염기이다. 또 다른 구현예에서 하나 이상의 서열 패턴은 8개 이상의 염기를 포함한다. 바람직한 구현예에서, 하나 이상의 상기 서열 패턴은 표 9 및/또는 표 10에서 기재된 패턴을 포함한다. 패턴은 염기의 연속적인 목록으로 구성될 것이다. 하지만, 상기 패턴은 또한 구별되지 않거나 또는 부분적으로만 구별되는 많은 염기에 의해 한번이상 방해되는 염기를 포함할 수 있다. 부분적으로 구별되는 염기는 예를 들어 퓨린을 나타낸다.

바람직하게는, STAR 활성의 존재는 기능적인 펑가법을 사용하여 증명된다.

여러 방법은 여기서, 서열이 STAR 활성을 포함하는지를 결정하기 위해 나타낸다. STAR 활성은 서열이 하기 기능: (ⅰ) 본 발명의 유전자 전사 억제 요소를 포함하는 서열의 효과를 적어도 부분적으로 억제하는 기능, (ⅱ) 염색질에 연관된 억 제를 적어도 부분적으로 차단하는 기능, (ⅲ) 인핸서의 활성을 적어도 부분적으로 차단하는 기능, (ⅳ) 핵산 단독으로 비교하여 전사 단위를 코드화하는, 작동가능하게 연결된 핵산을 수여하는 기능 중 하나이상을 수행할 수 있는지를 확인된다. (iv-a) 전사의 더 높은 예측성, (iv-b) 더 높은 전사 및/또는 (iv-c) 전사의 더 높은 안정성.

본 발명에서 동정된 STAR 활성을 포함하는 많은 수의 서열은 양에서까지는 아니지만 동일한 활성을 포함하는 서열을 동정하고 생성하는 매우 다양한 가능성을 열어둔다. 예를 들면, 본 발명에서 동정된 서열을 변경하고 STAR 활성에 대한 변경된 서열을 시험하는 것을 당업자에게 잘 알려져 있다. 그러므로, 이러한 변경된 서열은 또한 본 발명의 일부분이다. 변경은 서열에서의 하나 이상의 염기의 결실, 삽입 및 돌연변이를 포함할 수 있다.

STAR 활성을 포함하는 서열은 400개의 염기의 범위에서 동정된다.

하지만, 이들 400개의 염기 모두가 STAR 활성을 유지하는 데에 필요하지는 않다고 기대된다. 400개와 5000개 염기사이의 단편에 대하여 어떤 성질을 주는 서열의 범위를 정하는 방법은 잘 알려져 있다. STAR 활성을 포함하는 단편의 최소의 서열 길이는 약 50개의 염기로 추정된다.

표 9 및 표 10은 STAR 활성을 포함하는 핵산 분자를 과잉-표현하는 것으로 발견되고 있는 6개의 염기의 패턴이 기재된다. 이 전체 표현은 STAR 서열을 대표하는 것으로 간주된다. 상기 표는 65개의 STAR 서열의 군으로 생성되었다. 유사한 표는 STAR 서열의 다른 세트로부터 또는 STAR 서열의 더 작거나 또는 더 큰 세포로부 터 개시하는 것으로 생성될 수 있다. 패턴은 그것이 STAR 요소를 포함하지 않는 서열에 비하여 상기 STAR 서열를 과잉-표현하지 않는다면 STAR 서열을 대표한다. 이것은 무작위 서열일 수 있다. 하지만, 관계없는 경향을 배제하기 위하여, STAR 서열을 포함하는 서열은 바람직하게는 게놈 또는 그것의 상당한 부분, 바람직하게는 척추동물 또는 식물의 게놈은 더욱 바람직하게는 인간 게놈에 비교된다. 게놈의 상당한 부분은 예를 들면 염색체이다. 바람직하게는 STAR 서열 및 상기 대조 서열을 포함하는 서열은 동일한 종의 핵산으로부터 유도된다.

STAR 서열이 서열 패턴의 발생 횟수를 결정하는 데에 사용될수록 STAR에 더욱 대표적인 패턴은 과잉- 또는 소량-표현되어진다. 핵산에 의해 발현될 수 있는 많은 기능적인 특징이 그것에 결합하는 단백질성 분자에 의해 중재되는 것을 고려하여, 대표적인 패턴은 STAR 서열에 과잉-표현되는 것이 바람직하다. 이러한 과잉-표현된 패턴은 단백질성 분자에 대한 결합 부위, 그 일부분일 수 있다.

바람직하게는, 상기 발생 횟수는 STAR 서열을 포함하는 2개 이상의 서열에서, 더욱 바람직하게는 STAR 서열을 포함하는 5개 이상의 서열에서, 더욱 바람직하게는 STAR 서열을 포함하는 10개 이상의 서열에서 하나 이상의 상기 서열 패턴의 발생 횟수를 대표한다. 더욱 바람직하게는, 상기 발생 횟수는 STAR 서열을 포함하는 20개 이상의 서열에서 하나 이상의 서열 패턴의 발생 횟수를 대표한다. 특히 바람직한 구현예에서 상기 발생 횟수는 STAR을 포함하는 50개 이상의 서열에서 하나 이상의 상기 서열 패턴의 발생 횟수를 대표한다. 바람직하게는, STAR 서열을 포함하는 상기 서열은 도 26에서의 서열을 하나 이상 포함한다.

STAR 활성은 도 26에서의 서열에 의하여 분담되는 특징이 있다. 하지만, 이것은 그것들이 동일한 동정체 서열을 분담해야 한다는 것을 의미하는 것은 아니다. 다른 동정체일 가능성이 매우 높다. 동정체는 그것을 함유하는 단편에서 이러한 일반적인 특징을 수여할 수 있고, 이것은 반드시 서열 패턴 또는 패턴들의 발생 횟수를 결정하기 위한 STAR 활성을 포함하는 더 많은 서열을 사용하는 것에 의한 것은 아니지만, 그러한 STAR 서열에서 존재 또는 부재하는 다른 것들보다 더욱 흔한 패턴들을 선별하는 것은 가능하다. 이러한 방법에서, STAR 서열에서 매우 빈번하게 과잉- 또는 소량-표현되는 패턴을 찾는 것이 가능하다. 빈번하게 과잉- 또는 소량-표현된 패턴은 시험 세트에서 후보 STAR 서열을 동정하기 더욱 알맞다. 과잉- 또는 소량-표현되는 패턴의 세트롤 사용하는 다른 방법은 서열에서 STAR를 동정하기에 최고로 적합한 패턴 또는 패턴들의 조합을 결정하는 것이다. 소위 구별적인 통계를 사용하여 본 발명자들은 STAR 요소를 포함하는 서열을 동정하는 데에서 최고로 수행하는 패턴의 한 세트를 동정하였다. 바람직한 구현예에서 STAR 서열을 탐지하기 위한 하나 이상의 상기 서열 패턴은 서열 패턴 GGACCC, CCCTGC, AAGCCC, CCCCCA 및/또는 AGCACC를 포함한다.

또 다른 구현예에서, STAR 요소를 탐지하기 위한 하나 이상의 상기 서열 패턴은 서열 패턴 CCCN{16}AGC, GGCN{9}GAC, CACN{13}AGG, CTGN{4}GCC를 포함한다.

STAR 서열의 목록은 그것 안에서 하나 이상의 컨센서스 서열을 결정하는 데에 사용될 수 있다. 그러므로 본 발명은 또한 STAR 요소에 대한 컨센서스 서열을 제공한다. 이 컨센서스 요소는 물론 시험 서열에서 후보 STAR 요소를 동정하는데에 사용될 수 있다.

더욱이, STAR 요소를 포함하는 서열이 척추동물에서 동정되고 있다면 척추동물에 속하는 다른 종에서 STAR 요소를 포함하는 서열을 동정하기 위한 서열 상동성의 수단으로 사용될 수 있다.

바람직하게는 포유동물 STAR 서열은 다른 포유동물 종에서 STAR 서열에 대하여 스크리닝하는 데에 사용될 수 있다. 유사하게는, STAR 서열이 식물 종에서 동정되고 있다면 다른 식물 종에서 유사한 기능을 갖는 상동 서열에 대하여 스크리닝하는 데에 사용될 수 있다. 하나의 관점에서 본 발명은 본 발명에 따른 방법에 의하여 제공될 수 있는 STAR 서열을 제공한다.

추가로 STAR 서열의 집단을 제공한다. 바람직하게는 상기 STAR 서열은 척추동물 또는 식물 STAR 서열가 있다. 더욱 바람직하게는, 상기 STAR 요소는 포유동물 STAR 서열 또는 속씨 식물(쌀과 같은 외떡잎, 또는 아라비돕시스와 같은 쌍떡잎)이다. 더욱 바람직하게는, 상기 STAR 서열은 영장류 및/또는 인간 STAR 서열이다.

STAR 활성을 포함하는 서열의 목록은 시험서열이 STAR 요소를 포함하는지를 결정하는 데에 사용될 수 있다. 상기와 같이, 이 목적으로 이러한 목록을 사용하는 많은 다른 방법이 있다. 바람직한 구현예에서 본 발명은 약 50-5000개의 염기쌍의 핵산 서열이 STAR 서열을 포함하는지를 결정하기 위한 방법을 제공하고, 상기 방법은 본 발명의 STAR 서열의 집단에서 상기 패턴의 발생 횟수를 포함하는 서열 패턴을 일차 표를 생성하는 단계, 하나 이상의 참조 서열에서 상기 패턴의 발생 횟수를 포함하는 상기 패턴의 이차 표를 생성하는 단계, 상기 발생 횟수가 두 표사이에서 다른 하나 이상의 패턴을 선별하는 단계, 약 50-5000 염기쌍의 상기 핵산 서열안에서, 하나 이상의 상기 선별된 패턴의 발생 횟수를 결정하는 단계 및 상기 시험 핵산이 STAR 서열의 상기 집단에서 상기 선별된 패턴의 발생를 대표하는가를 결정하는 단계를 포함한다.

대체가능하게는, 상기 결정은 상기 시험 핵산에서 발생 횟수가 상기 STAR 서열의 집단에서 상기 선별된 패턴의 발생 횟수를 대표하는가를 결졍하는 단계를 포함한다.

바람직하게는, 상기 방법은 상기 후보 STAR가 본 발명의 방법을 사용하는 유전자 전사 조정 성질을 포함하는지를 결정하는 단계를 포함한다. 바람직하게는, 상기 STAR의 집단은 도 26과 같은 서열을 포함한다.

또 다른 관점에서 본 발명은 본 발명의 방법에 의해 얻어질 수 있는 STAR 서열을 포함하는 단리된 및/또는 재조합 핵산 서열을 제공한다.

상기와 같이, STAR 서열은 방향 방법에서 그것의 활성을 발휘할 수 있다, 즉 다른 쪽보다 그것을 함유하는 단편의 쪽에서 더욱 발휘할 수 있다. 더욱이, STAR 활성은 STAR 요소의 수를 증가시키는 것으로 양에서 증폭될 수 있다. 후자는 STAR 요소가 STAR 활성을 포함하는 하나 이상의 요소를 포함할 수 있다. 그것을 함유하는 단편에서 STAR 활성을 줄 수 있는 서열을 동정하는 또 다른 방법은 척추동물 또는 식물 서열로부터 선별하는 단계를 포함하고, 서열은 STAR 요소를 포함하고 선별된 서열을 플랭킹하는 서열이 또 다른 종에서 보존되는가를 동정한다. 이러한 보존된 플랭킹하는 서열은 기능적인 서열일 수 있다. 그러므로 하나의 관점에서, 본 발 명은 STAR 요소를 포함하는 척추동물 또는 식물 종으로부터 약 50 내지 5000개의 염기쌍의 서열을 선별하는 단계 및 상기 종에서 상기 선별된 서열을 플랭킹하는 서열이 하나 이상의 다른 종에서 보존되는가를 동정하는 단계를 포함하는 STAR 요소를 포함하는 서열을 동정하는 방법을 제공한다. 그러므로, 본 발명은 약 50-5000개의 염기쌍의 핵산 서열 안에서 STAR 서열의 존재를 탐지하기 위한 방법을 추가로 제공하고, 종의 세포의 염색체 일부분에서 STAR 서열을 포함하는 서열을 동정하는 단계 및 상기 서열과 다른 종의 염색체에서의 서열사이의 상당한 상동성을 탐지하는 단계를 포함한다. 바람직하게는, 상기 종은 식물 또는 척추동물 종, 바람직하게는 포유동물 종을 포함한다. 본 발명은 또한 척추동물 또는 식물 종의 약 50-5000개의 염기쌍의 핵산 서열안에서 STAR 요소의 존재를 탐지하는 방법을 제공하고, 상기 핵산 서열의 플랭킹 서열이 하나 이상의 다른 종에서 보존되는가를 동정하는 것을 포함한다.

생물정보학적인 정보를 사용하여 STAR 서열을 포함하는 서열의 존재를 탐지하기 위한 본 발명의 방법이 실재적으로 반복하는 것을 유의하는 것은 중요하다. STAR 서열을 포함하는 서열이 본 발명의 방법으로 동정될수록 패턴은 더욱 STAR 서열을 포함하는 서열과 대조 서열 사이를 구별되는 것으로 발견된다. 이들 새로이 발견된 구별 패턴을 사용하여 STAR 서열을 포함하는 더 많은 서열이 동정될 수 있고, 교대로 구별 등을 할 수 있는 패턴의 세트를 확장시킨다. 이 반복의 관점은 본 발명에서 제공하는 방법의 중요한 관점이다.

서열에 관련하여 성질(quality)이란 용어는 상기 서열의 활성으로 간주된다. STAR, STAR 서열 또는 STAR 요소라는 용어는 여기서, 상기 유전자 전사 조정 성질을 하나 이상 포함하는 DNA 서열로 간주한다. SINC 또는 SINC 요소라는 용어는 상기 유전자 전사 억제 성질을 하나 이상 포함하는 DNA 서열로 간주한다. 여기서 사용한 바와 같이 "DNA 서열"이라는 용어는 특정하지 않지만, 염기의 특정 순서의 목록으로 간주하기 보다는 DNA의 물리적인 부분이다. DNA 서열에 관한 전사 성질은 상기 DNA 서열이 관심의 유전자의 전사를 갖는 영향으로 간주한다. 여기서 "성질"이라는 용어는 전사계에서 핵산 또는 단백질의 탐지가능한 고유성 또는 속성으로 간주한다.

본 발명은 도 26의 SEQ ID: 44의 서열을 포함하는 항-억제자 활성을 갖는 단리 또는 재조합 DNA 서열로서, 상기 서열의 항-억제자 활성은, 인간 U-2 OS 골육종 세포가 Tet-Off 전사 조절 시스템의 조정하에 LexA DNA 결합 도메인과 HP1 또는 HPC2의 코딩 영역을 함유하는 LexA-억제자 융합 단백질을 포함할 때, 상기 단리 또는 재조합 DNA 서열이 플라스미드 중의 다중연결자 서열에 클론될 때, 인간 U-2 OS 골육종 세포에 제오신 250㎍/ml와 독시시클린 0.1ng/ml의 존재하에 4~5주의 배양 후 성장할 수 있는 능력을 제공하고, 상기 다중연결자는, 상기 플라스미드가 상기 세포에 존재할 때, 4개의 LexA 작동자 부위와 제오신 내성 유전자를 조절하는 SV40 프로모터 사이에 위치하는 것인 DNA 서열, 상기 DNA 서열이 제공된 재조합 DNA 구조물, 및 이를 포함하는 세포를 제공하는 효과를 가진다.

실시예

실시예 1. STAR 및 SINC 요소를 단리하기 위한 방법

재료 및 방법

플라스미드 및 균주. STAR 요소, pSelect-SV40-zeo("pSelect", 도 1)을 위한 선별 벡터는 하기와 같이 구성된다: pREP4 벡터(Inbitrogen V004-50)는 플라스미드 골격으로 사용된다. 이것은 영장류 세포주에서 고급-카피 에피솜 복제를 위한 EBNA-1 핵 항원 및 복제의 Epstein Barr oriP 기원; 포유동물 세포에서의 선별을 위한 티미딘 키나제 프로모터 및 폴리아데닐화 부위를 갖는 하이그로마이신 내성 유전자; 및 앰피실린 내성 유전자 및 Escherichia coli에서 보전을 위한 복제의 colE1 기원을 제공한다. 상기 벡터는 XbaI와 NheI 제한 부위 사이에서 네 개의 연속되는 LexA 작용체(operator) 부위를 함유한다(Bunker and Kingston, 1994). 하기 HindⅢ-AscⅠ-BamHI-AscⅠ-HindⅢ의 제한 부위에 의해 구축된 다중연결자(polylinker)는 LexA 작용체들과 NheI 부위 사이에 끼워진다. pSV40/Zeo(Invitrogen V502-20)로부터 유도된, SV40 프로모터 및 폴리아데닐화 부위를 갖는 제오신 내성 유전자는 NheI 부위와 SalI의 사이이다; 이것은 STAR 스크린용 선별가능한 마커이다.

PSDH 벡터(도 2)는 하기와 같이 구성된다: pGL3-Control(Promega E1741)로부터의 루시페라제 리포터 유전자는 PCR로 증폭되고, SacⅡ/BamHI-소화된 pUHD10-3로 삽입된다(Gossen and Bujard, 1992). 이것은 Tet-Off 프로모터의 조절하에서 루시페라제를 SV40 폴리아데닐화 시그널의 상류에 위치하게 한다. 다중 클로닝 부위는 PCR, Tet-Off 프로모터의 상류(MCSI, XhoⅠ-NotⅠ-EcoRⅠ-SalⅠ) 및 폴리아데닐화 시그널의 하류(MCSⅡ, NheⅠ-BglⅡ-EcoRⅤ-HindⅢ)로 도입된다. 유전자 라이브러리는 인간 게놈 DNA의 Sau3AI 소화, 태반(Clontech 6550-1)에서 정제된 또는 박테리아/P1(BAC/PAC) 인공 염색체에서 수행되는 것 중 하나에 의해 구성된다. BAC/PAC 클론은 1q12 세포유전학 영역(클론 RP1154H19 및 RP1170019) 또는 항상성의(homeotic) 유전자(클론 RP1167F23, RP1170019 및 RP11387A1)의 HOX 집단으로부터의 게놈 DNA를 함유한다. DNAs는 크기-분류되고, 0.5-2.0kb 크기 분류는 표준적인 기술(Sambrook et al., 1989)에 의해서, BamHⅠ-소화된 pSelect 벡터로 결찰된다.

숙주 균주의 구성은 개시되어 왔다(van der Vlag et al., 2000). 간략하게는, 그것들은 U-2 OS 인간 골육종 세포주(American Type Culture Collection HTB-96)를 기초로 한다. U-2 OS는 pTet-Off 플라스미드(Clontech K120-A)로 안정하게 트랜스펙션되고, Tet-억제제 DNA에 결합하는 도메인 및 VP16 트랜스활성화(transactivation) 도메인으로 구성하는 단백질 키메라를 코드화한다. 세포주는 연속적으로 LexA DNA에 결합하는 도메인 및 HP1 또는 HP2(DNA을 속박하는 경우에 유전자 발현을 억제하는 두개의 Drosophila Polycomb군 단백질) 중 하나의 코팅하는 영역을 함유하는 융합 단백질 유전자로 트랜스펙션된다. LexA-억제제 유전자는 Tet-Off 전사 조절 시스템의 조정하에 있다(Gossen and Bujard, 1992).

라이브러리 스크리닝 및 STAR 요소 특성화. pSelect에서의 유전자 라이브러리는 트랜스펙션 시약의 공급자(Life Technologies)로부터 제조된 바와 같이, 칼슘 포스페이트 침전(Graham and van der Eb, 1973; Wigler et al., 1978)에 의해서 U-2 OS/Tet-Off/LexA-억제제 세포주로 트랜스펙션된다. 트랜스펙션된 세포는 1주일(50% 집합)동안 하이그로마이신 선별법(25㎍/㎖) 및 테트라시클린 억제(독시시클린, 10ng/㎖) 하에서 배양된다. 그런 다음, 독시시클린 농도는 0.1ng/㎖로 감소되고, LexA-억제제 유전자를 유도하고, 2일 후 제오신 250㎍/㎖을 첨가한다. 상기 세포는 대조군 배양(빈 pSelect로 트랜스펙션된)이 제오신에 의해 죽을 때까지 추가로 4-5주동안 배양된다.

라이브러리 트랜스펙션으로부터 제오신-내성 콜로니를 증식시키고, 플라스미드 DNA는 단리되고, 표준적인 기술(Sambrook et al., 1989)에 의해 E. coli로 해방된다. 해방된 DNA에서 후보 STAR 요소는 제한 엔도뉴클라제 맵핑(mapping)(Sambrook et al., 1989), DNA 서열 분석(Sanger et al., 1977)에 의해 분석되고, U-2 OS/Tet-Off/LexA-억제제에 재-트랜스펙션 및 독시시클린 농도를 낮춘 후 STAR 활성(제오신 내성)을 위하여 분석된다.

인간 게놈에서 알려진 서열에 상응하는 DNA 서열을 갖는 후보 STAR 요소는 인간 게놈 데이타베이스(http://www.ncbi.nlm.nhi.gov/genome/seq/HsBlast.html 20 June 2001)의 BLAST 조사(Altschul et al., 1990)에 의해 동정된다. 상기 요소의 염색체 위치는 반복적인 DNA의 비율 및 인근 유전자의 동일성에 따라 기록된다.

재-트랜스펙션에서 STAR 활성를 보여주는 그것들의 후보물질은 STAR 단편을 pSDH 플라스미드로 서브클로닝하고 U-2 OS 염색체 DNA에서 안정하게 통합하는 것으로 추가 특성화된다. pSDH 플라스미드는 pBABE-puro으로 U-2 OS 세포에 코-트랜스 펙션되고(Morgenstern and Land, 1990), 퓨로마이신 내성을 위해 선별된다. STAR 단편마다, 대략 30개의 개별 클론의 개체군이 단리되고 배양된다. 상기 클론은 제조업자의 지침에 따라서 루시페라제 활성에 대하여 정기적으로 평가된다(Roche 1669893).

결과

STAR 요소의 기능적인 특성화. 인간 게놈 DNA의 스크린 및 HOX 및 1q12 유전자좌의 스크린은 17개의 선의의 STAR 요소를 산출한다. 기준은 (1) 상기 요소가 숙주 U-2 OS 인간 골육종 세포주로 pSelect-기초 클론의 재-트랜스펙션에서 STAR 활성을 개시함(초기 스크린에서 발현된 항-억제제 활성이 플라스미드-특이적이지만 숙주세포에서 인공적인 변화에 기인한 것이 아닌 것을 나타내는); (2) 상기 요소가 인간 게놈 서열 데이타베이스에서의 서열을 대등하는 DNA 서열을 함유함(클론은 예를 들어 박테리아 또는 벡터으로부터 오염된 DNA 서열을 함유하지 않는 것을 가리키는)이다.

STAR 요소는 pSDH 플라스미드로 서브클론되고 숙주세포 게놈으로 통합된다. 리포터 유전자의 발현은 안정한 트랜스펙턴트의 개체군에서 평가되어 STAR 요소의 능력이 게놈에서 무작위적으로 통합 후 침묵으로부터 리포터 유전자를 보호하는 것을 예증한다. 이것은 (1) 높은 발현을 나타내는 클론의 개체군에 대한 그리고 (2) STAR 요소에 의해 알려지는 과잉-발현의 정도에 대한 정보를 제공한다.

클론에 의한 루시페라제 리포터 유전자의 발현은 그것이 STAR 요소를 포함하지 않는 플라스미드(참조 수준)에 대한 평균 수준이상의 2배이라면 중요하게 고려 된다: 모든 플라스미드의 경우, 발현 수준에서의 분포는 무발현에서 참고 수준이상으로 현저하게 발현하기까지, 몇몇개의 과잉-발현제에서 많은 과잉-발현제까지의 클론 사이에서 관측된다. 뛰어난 STAR 활성은 약간의 높은 과잉발현하는 클론을 포함하는 많은 과잉발현하는 클론을 가져다 주는 플라스미드에 의해 명확하게 된다. 전형적인 실험의 결과는 표 1 및 도 3-5에서 나타낸다:

상기 결과는 시험되어진 인간 STAR 요소가 보호되지 않은 리포터 유전자 또는 Drosophila SCS 요소로 보호되는 것보다 더 높은 과잉발현하는 클론의 개체군을 산출하는 것을 나타낸다(Kellum and Schedl, 1992). 또한, 이들 플라스미드의 과잉발현의 정도는 보호되지 않는 또는 SCS-보호된 리포터보다 STAR-보호된 리포터에서 훨씬 더 크다.

STAR 요소 서열 및 게놈 위치 데이타. 표 2는 인접한 유전자의 동일성 및 상기 요소의 반복적인 DNA 함량뿐만 아니라 17개의 STAR 요소 각각의 염색체 위치를 기재한다. STAR 요소는 많은 염색체 전체로 분포된다. 그것들은 그것들의 실제 DNA 서열 및 반복적인 DNA 상황에서 다양하고, 이웃한 유전자와 관련된 다양한 정도를 나타낸다.

SINC 요소 스크린

재료 및 방법

SINC 스크린, pSINC-Select를 위한 플라스미드("pSS", 도 6)는 하기와 같이 구성된다: pREP4 벡터(Invitrogen V004-50)은 플라스미드 골격으로 사용된다. 복제의 Epstein Barr oriP 근원 및 영장류 세포주에서 고-카피 에피솜 복제의 EBNA-1 핵산 항원을 제공한다; 포유동물 세포에서의 선별을 위한, 티미딘 키나제 프로모터 및 폴리아데닐화 부위를 갖는 하이그로마이신 내성 유전자; 및 앰피실린 내성 유전자 및 Escherichia coli에서 보전을 위한 복제의 colE1 근원. 상기 벡터는 Tet-Off 전사 조절 시스템에 의해 조정하기 위하여, 플라스미드 pUDH10-3으로부터의 탠덤(tardem) Tet 감응성 요소(TREs)으로 이루어진(Gossen and Bujard, 1992) Tet-Off 프로모터를 함유한다. TREs는 codA::upp 유전자의 발현을 조절한다(사이오신 데아미나제/우라실 포르포리보실트랜스퍼라제; Invivogen porfcodaupp). 이것은 소위 "자살 유전자"이다; codA::upp 효소의 활성은 프로드럭 5-플루오로시토신(5-FC)을 독성 약물, 플루오로우라실(5-FU)로 변환하고, 이것은 세포자멸사 및 세포 죽음을 일으킨다(Mullen et al., 1992; Tiraby et al., 1998; Wei and Huber, 1996). Tet-Off 프로모터로부터의 상류는 스크린용 Sau3AI-소화된 게놈 DNA을 클로닝하기 위한 BglⅡ 제한 부위이다. pREP4 DNA는 클론된 SINC 요소에 의한 pREP4 요소에서 필수적인 플라스미드 요소의 침묵을 방해하기 위하여 STAR 요소에 의한 게놈 DNA 및 자살 유전자로부터 분리된다. 인간 염색체 22번을 포함하는 BAC 클론의 라이브러리로부터 게놈 DNA(Invitrogen/Research Genitics 96010-22)는 Sau3AI에 의해 부분적으로 소화되고, BglⅡ-소화된 pSS로 결찰된다(Sambrook et al., 1989). 재조합 플라스미드의 라이브러리는 트랜스펙션 시약의 공급으로 제시된 바(Life Technologies)와 같이 칼슘 포스페이트 침전물에 의하여 U-2 OS/Tet-Off 세포주로 트랜스펙션된다(Graham and van der Eb, 1973; Wigler et al., 1978). 트랜스펙션된 세포는 3주동안 하이그로마이신 선별법(25㎍/㎖) 및 테트라시클린 억제법(독시 시클린, 10ng/㎖) 하에서 배양된다. 그런 다음, 5-FC는 1㎍/㎖의 농도로 첨가되고, 세포는 SINC 요소를 선별하기 위해 추가로 3주동안 배양된다.

후보 SINC-함유 클로니는 채집되고, 프라이머 PCR1 및 PCR2로 폴리머라제 연쇄 반응에서 사용된다(도 6); PCR 생성물은 HindⅢ 및 XhoI 제한 엔도뉴클레아제로 소화되고, 통상적인 기술(Sambrook et al., 1989)에 의하여 pBluescriptⅡ SK(+)(Stratagene 212207)로 클로닝된다. 후보 SINC 요소의 DNA 서열은 결정되고(Sanger et al., 1977), 그리고 인간 게놈에서 상응하는 서열은 인간 게놈 데이타베이스(http://www.ncbi.nlm.nih.gov/genome/seq/HsBlast.html 2001년 6월 20일)의 BLAST 조사(Altschul et al., 1990)에 의하여 동정된다. 상기 요소의 염색체 위치는 반복적인 DNA 및 인접한 유전자의 동정화에 비율에 따라서 기록된다.

결과

선별 기간의 말단부에서, 어떠한 콜로니도 대조군 배양(빈 pSS)에서는 명확하지 않고, 많은 콜로니는 게놈 DNA를 갖는 pSS를 함유하는 배양에서는 명확하다. 이들 생존한 클론은 후보 SINC 요소를 함유한다. 상기 요소는 PCR에 의하여 기록되고, 표준 클로닝 벡터, pBluescript로 서브클로닝된다. 상기 요소의 DNA 서열은 결정되고, 인간 게놈 서열과 비교된다(표 3). 모든 경우에서, 서열화된 요소는 예상한 바와 같이 염색체 22에서 발견된다.

실시예 2. STAR, SINC 또는 화합된 STAR/SINC에 기인하는 트랜스유전자의 발현 특성화.

배경: 부위-특이적인 재조합은 그것들의 염색체 위치에서 이형의 DNAs를 정 확하게 제거하기 위해 사용된다. 이것은 두 개의 시스템 중 하나로 일반적으로 실행된다: 박테리오파지 P1의 cre 레콤비나제 및 loxP 표적화(Feng et al., 1999), 또는 효모의 FLP 레콤비나제 및 FRT(FLP 레콤비나제 표적화)(Wigley et al., 1994). 이들 시스템에서, DNA 영역(일반적으로 리포터 유전자 및/또는 선별가능한 마커를 포함하는)은 loxP 또는 FRT 표적화에 의하여 염색체에서 플랭킹한다. 그런 다음, 레콤비나제의 활성은 염색체로부터 DNA 영역의 정확한 적출을 촉진한다. 상기 레콤비나제는 단일 부위에서 두개의 재인식 서열을 분해하고, 그것들 사이의 서열을 결실한다. 그러므로, DNA의 전장은 표적 부위에 의해 플랭킹될 것이고, 결과적으로 레콤비나제의 도입 또는 활성에서 인 비보로 결실된다(Schwenk et al., 1995; Dymecki, 1996). Cre 및 Flp 레콤비나제는 두 개의 13-염기쌍 전화한 반복 사이에서 재조합을 촉진하고, 최소한의 6(loxP) 또는 8(FRT) 염기쌍을 갖는 스페이서에 의해 분리된다(Senecoff et al., 1985). loxP 서열은 ATAACTTCGTATA이고 FRT 서열은 GAAGTTCCTATAC이다.

프로토콜: 통상적인 DNA 클로닝(Sambrook et al., 1989)를 사용하여, 리포터 유전자(예를 들어, 녹색 형광 단백질(GFP)과 같은 리포터 단백질을 코드화하는)(Bierhuizen et al., 1997) 또는 루시페라제(Himes and Shannon, 2000)은 한 쌍의 STAR 요소에 의해, 한 쌍의 SINC 요소에 의해, 또는 한 쌍의 STAR/SINC 조합 요소에 의해 플라스미드에서 플랭킹되는 것으로 구성된다. 각각의 경우에, 상기 요소는 그들 스스로 레콤비나제 표적 부위에 플랭킹된다. 한 요소는 한 쌍의 loxP 부위에 의해 플랭킹되고, 다른 것들은 한 쌍의 FRT 부위에 의해 플랭킹된다(도 1). 플 라스미드의 트랜스펙션은 세포의 적은 퍼센트로 숙주 염색체로 통합되고, 필수 요소는 항생물질 내성으로 선별된다. 유사한 구성물은 세개의 시험 요소(STAR, SINC, STAR/SINC) 각각에 대하여 제조된다.

통상적인 기술("SuperFect Transfection Reagent Handbook", Qiagen, November, 1997)을 사용하여, 이들 플라스미드는 U-2 OS 인간 골육종 세포주로 트랜스펙션되고, 하이그로마이신 내성에 대하여 선별된다. 하이그로마이신-내성 단리물은 세포주의 게놈으로 안정하게 통합되는 플라스미드를 갖는다. 개별적인 단리물은 세포 배양 배지에서 증식되고, 트랜스제닉 리포터 유전자의 발현은 예를 들어, 유속 세포계측기에 의하여 평가된다(Stull et al., 2000).

그 다음, 통상적인 기술(트랜스펙션, 또는 호르몬 자극)을 사용하여, 상기에서부터 안정한 단리물은 레콤비나제 활성을 도입하거나 또는 활성화하기 위해 처리된다. 이것은 연속적으로 예를 들어, cre 레콤비나제 활성이 STAR1의 적출을 촉진하고, 연속적으로 FLP 레콤비나제 활성이 STAR2의 적출을 촉진하는 것으로 이루어진다. 이들 세포에서 리포터 유전자의 발현 수준은 평가되고, 상기 값은 어버이의, STAR-함유 단리물의 참고값과 비교된다.

실시예 3. STAR의 서열분석; 요소 기능에 대한 최소의 기본적인 서열의 결정; 요소 사이의 서열 보존; 및 탠덤 및 다중 요소의 성질

배경: STAR 또는 SINC 요소를 함유하는 DNA 단편은 개별적으로 pSelect(도 1) 또는 pSS(도 6) 플라스미드를 사용하여 유전학적인 선별법으로 단리된다. 이 선별법은 STAR 또는 SINC 활성을 갖는 그것들의 단편에서의 DNA 서열을 특성화시키는 접근을 개시한다.

프로토콜:

DNA 서열: 올리고뉴클레오티드는 DNA 단편을 서열화하기 위한 pSelect 및 pSS 선별 플라스미드의 서열을 기초로 하여 고안되었다. 상기 단편은 디데옥시 사슬 종결 기술을 사용하여 서열화된다(Sanger et al., 1977). 그 다음, DNA 서열은공공의 인간 게놈 서열 데이타베이스(http://www.ncbi.nlm.nih.gov:80/cgi-bin/Entrez/hum_srch?chr=hum_chr.inf&query)를 사용하여 염색체 위치를 결정하게 된다. 단편 서열의 부근에서 유전자 및 유전자 밀도를 게놈 서열 주석으로부터 기록된다. 이들 유전자의 전사 활성은 DNA 마이크로어레이(http://arrays.rockefeller.edu/xenpus/links.html) 및 SAGE(Serial Analysis of Gene Expression;http://bioinfo.amc.uva.nl/HTM-bin/index.cgi) 데이타로부터 결정된다.

STAR 및 SINC 서열에서 위치의 정보가 편집되는 즉시, 상기 데이타는 내재하는 컨센서스 서열의 관점에서 분석된다. 컨센서스 서열 또는 동향(이것이 예를 들어, C 및 G 염기가 풍부한 것과 같은 특정 뉴클레오티드 조합이 풍부한 국지적인 구역이라는 것으로 이해되는)은 clustalw(Higgins et al., 1996) 및 블로섬 유사성 평점화(Altschul and gish, 1996)와 같은 유사성조사 알고리즘을 사용하여 탐지될 수 있다. 그 다음, 어느 내재하는 컨센서스 또는 발견된 동향은 BLAST 조사를 수행하는 것으로 게놈 규모에서 다른 잠재적인 STAR를 동정하기에 사용될 수 있다. 이전의 조사는 알려진 절연체 및 경계 요소에 결합하는 전사 조절 단백질을 동정하고 있다(Gaszner et al., 1999; Gerasimova and Corces, 1998). 개시된 실시예에서, 단백질 결합 부위는 절연체 또는 경계 기능에 핵심적인 DNaseⅠ 과민성 부위와 같은 공간을 차지한다. STAR 요소가 또한 알려진 조절 단백질에 의해 결속된다는 가설은 STAR 요소에서 발생하는 서열 모티브에 대한 전사 인자의 TRANSFAC 데이타베이스(http://transfac.gbf.de/TRANSFAC)를 조사하는 것으로 검사된다. 서열 모티브는 STAR 또는 SINC 집단원 사이에서 일반적인 서열 모티브는 상응하는 전사 인자가 그 요소에 결합한다는 것을 나타내는 표시기이다.

최소의 기본적인 서열: 이 서열 지식을 사용하여 STAR(또는 SINC) 요소는 잘리고, 기능성에 대하여 시험된다. 이것은 표준적인 기술(Sambrook et al., 1989)에 의해 pSelect 또는 pSS로 단편을 함유하는 STAR- 또는 SINC-의 서브-단편을 클로닝하는 폴리머라제 연쇄 반응(PCR)을 사용하여 이루어진다. 서브-단편을 포함하는 플라스미드는 U-2 OS 세포로 트랜스펙션되고, 항생물질 내성(STAR 요소) 또는 프로드럭 내성(SINC 요소)에 대하여 평가하는 것으로 기능성에 대하여 시험된다.

방향성: STAR 및 SINC 요소는 개별적으로 pSelect 및 pSS 플라스미드를 사용하여 그들의 방향성에 대하여 시험된다. 예를 들어, pSelect 스크린에 의하여 단리된 STAR 요소의 방향은 5' 3' 배향으로 간주된다.

상기 요소의 배향은 통상적인 재조합 DNA기술(Sambrook et al., 1989)에 의하여 역행된다. 생성된 플라스미드는 U-2 OS 세포주로 트랜스펙션되고, 리포터 유전자의 발현은 평가된다(Bierhuizen et al., 1997; Himes and Shannon, 2000). 역배향 요소를 갖는 플라스미드로부터의 발현의 수준은 5' 3' 배향의 것과 비교된다. 역배향 플라스미드가 유사한 발현 수준을 갖는다면, STAR 요소는 방향성을 나타내지 않는다.

요소의 조합 및 다중화: STAR 요소가 혼합된 쌍에서 기능하는지를 결정하기 위해서, 다른 요소는 결합되고 시험된다. 분석은 재조합 DNA 기술에 의하여 MCSI에서 하나의 STAR 요소 및 MCSⅡ에서 다른 STAR를 삽입하는 것으로 pSDH 플라스미드에서 수행된다(Sambrook et al., 1989). 생성된 플라스미드는 트랜스펙션되고 리포터 유전자의 발현은 평가된다(Bierhuizen et al., 1997; Himes and Shannon, 200); 결과는 MCSI 및 MCSⅡ에서 동일한 요소를 함유하는 플라스미드로부터의 발현으로 비교된다; 발현이 플라스미드의 두 유형에 대하여 유사하다면, 다른 STAR 요소는 서로 간섭하지 않는다고 결론내어진다.

단일 STAR 또는 SINC 요소의 세기는 요소의 탠덤 반복으로 비교된다. 이것은 DNA 리가제와 관심의 STAR 또는 SINC 요소의 사슬형연결 및 재조합 DNA 기술(Sambrook et al., 1989)에 의해 pSDH 또는 pSS 플라스미드로 결찰 생성물을 도입하는 것에 의하여 이루어진다. 생성된 플라스미드는 U-2 OS 세포로 트랜스펙션되고, 리포터 유전자의 발현은 평가된다(Bierhuizen et al., 1997; Himes and Shannon, 2000); 결과는 단일 STAR 또는 SINC 요소를 포함하는 플라스미드로부터의 발현으로 비교된다.

실시예 4. STAR, SINC 또는 그것들의 조합이 기능하는 거리의 결정.

배경: STAR 요소는 단일 및 다중 트랜스유전자의 발현을 최적화하기 위하여 사용된다. 단일 쌍의 STAR 요소가 침묵으로부터 많은 또는 다중의 트랜스유전자를 보호할 수 있는가를 결정하기 위해서, STAR 요소가 활동하는 범위를 결정하는 것이 필요하다. 유사한 정보는 SINC 요소 및 STAR/SINC 조합에 대하여 결정한다.

프로토콜: STAR 및 SINC 요소는 하기와 같이, 각각 pSelect 또는 pSS에 기초한 유도체 플라스미드를 사용하여 거리 전체로 그것들의 기능성에 대하여 시험된다. 500bp 내지 10kb의 무작위 DNA 단편의 라이브러리는 표준 DNA 클로닝 기술(Sambrook et al., 1989)에 의하여 회합된다. 단편은 STAR 또는 SINC 활성을 갖지 않는 이 라이브러리로부터 상기한 바와 같이 pSelect 및 pSS 플라스미드에서의 시험에 의하여 선별된다. STAR 요소 및 STAR/SINC 조합의 경우, 이들 단편은 적절한 pSelect 플라스미드(도 1)에서의 클로닝 부위 및 리포터 유전자의 프로모터 사이에 삽입된다. 이 플라스미드 세트는 U-2 OS 세포주로 트랜스펙션되고, 발현은 상기와 같이 측정된다. 리포터 유전자 발현의 세기는 프로모터로부터 STAR 요소를 분리하는 무작위 DNA 단편의 길이와 상호관련된다. SINC 요소는 유사한 성향에서 사정된다: 무작위 DNA 단편은 적절한 pSS 플라스미드의 SINC 요소 및 프로모터 사이에 삽입되고, 리포터 유전자의 억제의 정도는 무작위 DNA 단편의 길이와 상호관련된다.

실시예 5 (a). STAR 요소에 대한 유전학 선별법에서 자연적으로 발생하는 SINC 요소의 사용.

배경: STAR 요소에 대한 현재의 스크린은 선별 플라스미드에서 선별가능한 마커의 억제를 제공하기 위하여 키메라 lexA-PcG 단백질을 사용한다. 자연적으로 발생하는 SINC 요소를 사용하여 선별을 반복하는 것으로, STAR 요소는 이들 자연적 으로 발생하는 SINC 요소에 기인한 억제 활성에 특이적인 것으로 동정된다.

SINC 요소 스크린은 "tet-off" 프로모터를 침묵시킬 수 있고 codA::upp 자살 유전자의 발현을 차단할 수 있는 게놈 DNA의 무작위적으로 생성된 단편을 동정하는 유전학적인 선별능력에 기초한다. 이 선별에서 회수된 SINC 요소는 게놈 침묵 요소의 무작위 샘플화를 나타내고, 요소의 다른 분류는 회수된다. 이 프로토콜의 경우, 이들 다양한 SINC 요소는 상기 lexA-PcG 기초 선별에서 회수되는 것들보다 STAR 요소의 다른 분류를 회수하도록 사용된다.

프로토콜: 현재의 선별법으로부터의 SINC 요소는 특성화되고, 기능적인 및 DNA 서열 특징을 기초로 하여 구분된다(기능적인 특징은 억제의 세기를 포함한다; 서열 특징은 동정가능한 보존 모티브를 포함한다; 실시예 3을 참조). 각 분류의 대표적인 요소는 표준 DNA 클로닝 기술(Sambrook et al., 1989)를 통하여 pSelect 플라스미드에서 lexA 결합 부위를 대체하도록 사용된다. 유전자 뱅크(bank)는 이들 새로운 플라스미드 각각으로 만들지고, 기재한 바와 같은 새로운, SINC-특이적인 STAR 요소를 동정하도록 사용된다(van der Vlag et al., 2000). 이것은 전체 게놈 DNA, 사용되어지는 SINC 요소도 포함하는 BAC 클론으로부터의 DNA로 이루어진다.

실시예 5(b). STAR 및 SINC 요소의 최대 길이의 결정.

배경: STAR 요소는 2kb미만의 게놈 DNA 단편으로 이루어진, pSelect 플라스미드를 사용하여 회수된 DNA의 단편로서 클로닝되었다. 하지만, 이것들은 더욱 확장된 STAR 요소의 일부분일 것이다. 확장된 STAR 활성은 하기의 실험으로 검사된다.

프로토콜: pSelect에서 클로닝된 STAR 요소는 인간 게놈 서열에 대하여 맵핑된다. 그것들이 더욱 확장된 STAR 요소의 일부분인지를 결정하기 위해서, 클론을 포함하는 4kb의 영역은 PCR에 의해 증폭되고, 표준 DNA 클로닝 기술(Sambrook et al., 1989)에 의하여 pSelect 및/또는 pSDH 플라스미드로 클론이 도입된다. 생성된 플라스미드는 U-2 OS 세포로 트랜스펙션되고, 상기와 같이 리포터 유전자 발현에 대하여 평가된다; 기존 2kb STAR 요소를 함유하는 플리스미드는 대조군으로 포함된다. 세 개의 가능한 결과가 기대될 수 있다: (1) STAR 요소가 확실히 기존 2kb 단편임을 예증하는, 대조군 및 확장된 STAR 단리물에 의한 유사 발현; (2) STAR 요소가 2kb 단편내에서 포함되고 원거리에서 효율적으로 작용하지 않는다는 것 또는 상기 확장된 단편이 SINC 요소를 함유하는 것을 제안하는, 확장된 STAR 단리물에 의한 더 낮은 발현; (3) 확장된 영역이 더욱 완전한 STAR 요소를 함유하는 것을 제안하는, 상기 확장된 STAR 단리물에 의한 더 높은 발현. 결과 (3)의 경우에, 실험은 6kb의 더 큰 PCR 단편으로 반복되었다.

STAR 요소는 또한 다양한 단백질이 결합하는 부위의 합성물일 수 있다. 그러므로 STAR 활성을 갖는 큰 DNA 단편은 STAR 활성을 갖는 더 작은 단편으로 분화될 수 있다(실시예 3 참조). 2kb보다 더 큰 요소는 그것들이 2kb미만으로 잘라진(내부 결실에 의한 것도 포함) 후에도 STAR 활성을 나타낸다면 STAR 요소로 인식될 것이다.

실시예 6. STAR 요소, SINC 요소, 또는 그것의 조합 및 인접한 트랜스유전자의 메틸화 및 히스톤 아세틸화 상태.

배경: STAR 및 SINC 요소의 조절 성질은 국부적인 염색질 구조와 관련되고, DNA 그 자체에 의해 그리고 DNA-관련 단백질에 의해 결정된다. 유전자 발현에서의 변화와 관련된 염색질 구조에서의 변화는 고분자(macromolecule)의 이차 변형, 특히, DNA의 메틸화 또는 히스톤 단백질의 아세틸화에 의해 종종 생성된다. STAR 및 SINC 요소에서 그리고 인접한 트랜스유전자에서 발생하는 이차 변형을 동정하는 것은 이들 요소에 대한 특질(hallmark)를 제공한다.

프로토콜: DNA 메틸화: STAR 또는 SINC 요소 또는 그것의 조합은 표준 기술(Sambrook et al., 1989)에 의해 pSelect 플라스미드로 클로닝된다. U-2 OS 세포는 리포터 유전자에서 기초 DNA 메틸화를 결정하기 위한 대조군으로서 STAR 또는 SINC 요소가 결핍된 pSelect와 함께, 이들 플라스미드로 안정하게 트랜스펙션된다. 세포는 채집되고 염색질은 표준 방법(Thomas, 1998)에 의해 정제된다. DNA는 분리된 반응에서 HpaⅡ 및 MspI 제한 엔도뉴클레아제로 소화된다(Sambrook et al., 1989). 이들 제한 효소 모두는 비-메틸화 서열 CCGG를 자를 수 있다. 외부 C가 메틸화된 경우, MspI 및 HpaⅡ 모두는 쪼개지지 않는다. 하지만, HpaⅡ와 같지 않은, MspI는 내부 C가 메틸화되는 경우에 서열을 쪼개질 수 있다. DNA는 서던 블로팅하게 되고, 상기 블롯은 간접적인 말단-표지화로 분석된다(Pazin and Kadonaga, 1998). 대조군으로서, 벗겨진, 비메틸화 DNA로서 상응하는 pSelect 플라스미드는 또한 기재된 효소로 잘리어지고 서던 블로팅하게 된다. 다른 크기의 DNA 단편의 대조는 DNA가 인 비보에서 메틸화되거나 되지 않는지를 밝혀낸다.

히스톤 아세틸화: DNA 메틸화 분석용으로 사용되는 동일한 트랜스펙션된 세 포주는 이들 실험을 위해 사용된다. 하기 방법은 STAR 및 SINC 요소 및 리포터 유전자에서 히스톤 아세틸화 패턴의 고해상 맵을 산출한다(Litt et al., 2001). 핵의 구상세균 뉴클레아제 다이제스트(digest)는 수크로스 기울기에 분별 증류되고, 정제된 뉴클레오솜 단량체 및 이량체는 항-아세틸히스톤 항체와의 면역침전으로 인하여 아세틸화 히스톤에 대하여 풍부해진다. 뉴클레오솜 분획 및 면역침전물은 예를 들어, 리포터 유전자 또는 STAR 또는 SINC 요소에 어니링(anealing)하는 프라이머 및 Taqman 프로브를 사용하여 0.1kb의 이동 창(moving window)을 갖는, 0.2kb 생성물을 산출하는 실시간 PCR(Jung et al., 2000)에 의하여 분석된다. 그 다음, PCR동안 Taqman 프로브 형광 시그널의 증가 속도(샘플에서 다량의 주형 DNA에 비례하는)가 측정된다. 뉴클레오솜 분획에서 다량의 주형 DNA의 비율은 리포터 유전자 및 STAR 또는 SINC 요소(또는 요소의 부재하에서의 리포터 유전자)에서 각 0.1kb에 대하여 히스톤 아세틸화의 패턴의 미세한 맵을 제공한다.

실시예 7. 인 비보 뉴클레오솜 위치화 및 DNAseⅠ 과민 부위

배경: 염색질은 DNA, 히스톤, 비-히스톤 단백질을 구성한다. 히스톤은 뉴클레오솜을 만들기 위한 ~150bp의 DNA로 감싼 핵심 입자를 형성한다. 뉴클레오솜은 50-75bp의 연결자 DNA에 의해 분리된다. 염색체 DNA에서 안정하게 위치화된 뉴클레오솜은 유전자 발현을 억제하고, 뉴클레오솜을 차단하는 인자 또는 그렇지 않으면 재모형 염색질은 이 억제를 극복할 수 있다. 염색체 영역에서 뉴클레오솜의 위치화는 구상세균 뉴클레아제(MNase) 평가법으로 분석된다; MNase는 연결자 DNA에서 차별적으로 염색질을 자른다. 유사하게는, DNA의 어떤 구역은 조성적으로 비-히스톤 단백질에 노출되고, 이들은 흔히 조절 영역, 즉 cis-활동 조절 인자가 결합하는 부위이다. 실험적으로, 이들 부위는 효소 DNaseⅠ에 의한 소화에 민감하다.

프로토콜: 리포터 유전자에서 및 STAR 또는 SINC 요소 중 하나에서 뉴클레오솜의 위치를 결정하기 위하여, MNase가 사용된다(Saluz and Jost, 1993). 핵세포는 배양된 U-2 OS 세포로부터 정제되고, 상기(히스톤 아세틸화)와 같이 MNase로 소화된다. STAR 또는 SINC 요소에서 또는 리포터 유전자에서 DNaseI 민감 부위에 대한 조사를 위하여, 정제된 핵세포는 상기(Wallrath et al., 1998)와 같이, 적절한 농도(예를 들면, 게놈 DNA 100㎍/㎖ 및 DNaseⅠ 20-100U/㎖)에서 DNaseI으로 처리된다. 벗겨진 DNA는 대조군으로서 DNaseI으로 소화된다. 양쪽 기술의 경우, 리포터 유전자 및 STAR 또는 SINC 요소는 상기(Tanaka et al., 1996; van der Vlag et al., 2000)와 같이, 프라이머 확장 또는 간접적인 말단-표지화 및 서던 블로팅을 사용하여 파인-맵핑(fine-mapping)된다. MNase 평가법은 STAR 또는 SINC 요소 또는 리포터 유전자에서 뉴클레오솜의 위치에 상응하는 자동 방사선 사진에서 불연속적인 밴드의 래더(ladder)를 드러낸다. DNaseⅠ 민감 부위는 벗겨진 DNA 대조군에서 부재한 또는 덜 주요한 생성된 자동 방사선 사진에서 불연속적인 밴드로서 분명하게 된다.

실시예 8. STAR 및 SINC 요소의 세포형, 조직 의존성 및 프로모터 의존성

배경: 어떤 절연체 또는 경계 요소는 조직 특이성을 나타낼 수 있다고 보고되고 있다(Takada et al., 2000). STAR 요소는 절연체 및 경계 요소와 공통적으로 많은 특징을 갖는다. 무차별적이고 조직-특이적인 STAR 및 SINC 요소 모두는 트랜 스제닉 응용에서 생물공학적인 가치를 갖는다. 하기 평가법은 세포형 의존성을 사정하기 위해 수행된다. 상기 요소들의 세포 및 조식 특이성은 추가로 DNA의 마이크로어레이의 공공의 데이타베이스 (http://arrays.rockeller.edu/xenopus/links.html) 및 SAGE (Serial Analysis of Gene Expression; http://bioinfo.amc.uva.nl/HTM-bin/index.cgi) 데이타를 사용하여, 인간 게놈에서 상기 요소들의 근처에서 유전자의 발현을 검사하는 것으로 검사된다.

프로토콜: STAR 요소는 pSDH 플라스미드에서 시험되고, SINC 요소는 pSS 플라스미드에서 시험된다. 세 개의 세포주는 표준 프로토콜을 사용하여 트랜스펙션된다: 인간 U-2 OS 골육종 세포주(Heldin et al., 1986), 아프리카 녹색원숭이 신장에서의 Vero 세포주(Simizu et al., 1967), 및 중국 햄스터 난소에서의 CHO 세포주(Kao and Puck, 1968). 세 개의 세포주 모두에서 기능할 수 있는 요소들은 무차별적인 것으로 분류된다. 하나 또는 두 개의 세포주에서만 활성을 나타내는 것들은 그것들 세포형 기능성에서 제한되는 것으로 분류된다.

프로모터 특이성: STAR 및 SINC 요소는 일반적으로 두 개의 프로모터, 사이토메갈로바이러스(CMV) 프로모터 또는 Tetracycline Response Element 및 최소의 CMV 프로모터(tTA 전사 활성화제와 조합하여)와 기능에 관련하여 선별되고 시험된다. 프로모터 특이성을 사정하기 위하여, STAR 및 SINC 기능은 다른 일반적으로 사용되는 바이러스 프로모터, 즉 유인원 바이러스 유형 40(SV40) 초기 및 후기 프로모터, 아데노바이러스 E1A 및 주요 후기 프로모터, 및 Rous 육종 바이러스(RSV) 긴 터미널 반복 으로 시험된다(Doll et al., 1996; Smith et al., 2000; Weaver and Kadan, 2000; Xu et al., 1995). 이들 프로모터 각각은 개별적으로, STAR 또는 SINC와 함께 표준 기술(Sambrook et al., 1989)에 의해서 pSelect 및 pSS 플라스미드로 분리하여 클론된다. 생성된 플라스미드는 상기와 같이, U-2 OS 세포주로 트랜스펙션되고, 리포터 유전자 발현에 대하여 평가된다. 이들 프로모터를 침묵시키는 SINC 요소 또는 침묵에 대항하여 보호하는 STAR 요소의 능력은 STAR 또는 SINC 요소가 결핍된 플라스미드와 비교하는 것으로 결정된다.

실시예 9. STAR 및 SINC 요소의 개량 방법

배경: 개량된 STAR 및 SINC 요소는 개발되어 있다. 개량은 항-억제적인 또는 억제적인 활성의 증가된 세기, 및 유도가능하고 조직-특이적인 활성을 갖는 요소를 산출한다. 이들 활성은 기술의 조합으로 이루어진다.

프로토콜

강제적인 진화: 오류-유발성(Error prone) PCR(Cherry et al., 1999; Henke and Bornscheuer, 1999)는 평균적으로 요소당 하나 내지 두 개의 점 돌연변이(point mutation)로 도입되도록 사용된다. 돌연변이된 요소는 예를 들어, 형광활성된 세포 구분 및 항생물질 내성에 의한 리포터-선별가능한 마커 융합 단백질을 함유하는 pSelect(또는 pSS) 플라스미드를 사용하여 스크린된다(Bennett et al., 1998). 오류-유발성 PCR 및 선별법의 뒤이은 과정은 활성에서 추가 개량을 갖는 요소를 유도하기 위해 실행된다.

탠덤 및 이형 조합: 상기한 바와 같이, 요소들의 탠덤 및 이형의 조합은 단 일 요소에 비교하여 활성에 대하여 시험된다(실시예 3).

STAR 및 SINC 요소의 관련된 우성(dominance)는 원칙대로 하나하나씩 시험된다. 그것은 요소의 세기를 시험하는 데에 사용되고 있다; 예를 들어, 새로운 STAR요소가 알려진, 강한 SINC 요소에 지배적이라면, STAR는 매우 강한 것으로 분류된다. STAR 및 SINC사이의 우성 연관성이 세포형-, 조직- 또는 프로모터-특이적이라는 가능성은 또한 고려된다(실시예 8). 상기 우성 시험은 표준 재조합 DNA 기술(Sambrook et al., 1989)에 의해 개별적인 STAR 요소의 상류를 대체하는 개별적인 SINC 요소를 갖는, pSelect 플라스미드를 활용한다. 상기 플라스미드는 U-2 OS 세포에 트랜스펙션되고, 리포터 유전자 발현은 평가된다. SINC 우성은 STAR 우성이 SINC 요소만을 갖는 플라스미드보다 더 높게 발현되는 것이 명백한 반면에, STAR 요소만을 갖는 플라스미드보다 더 낮게 발현되는 것이 명백하다.

신규한 성질을 첨가하기 위한 STAR 및 SINC 요소에 대한 다른 DNA-결합 단백질의 결합 부위의 도입(예를 들어, 유도가능성, 조직 특이성)

배경: 조절가능한 STAR 및 SINC 요소는 시그널-의존 DNA 결합 단백질에 대한 결합 부위를 갖는 그것들을 화합하는 것으로 만들어진다. 하나의 실시예에서, 이것은 STAR 또는 SINC 또는 STAR/SINC 조합 및 당성피질성 감응 요소(GRE)의 병치를 포함할 것이다. 당성피질성 감응 요소의 부재하에서, STAR 또는 SINC 요소는 기재된 바와 같은 기능을 할 것이다. 자극시에는, 자연적으로 발생하는 당성피질성 수용체는 GRE에 결합하고 STAR 또는 SINC 기능을 방해할 것이다.

프로토콜: 통상적인 DNA 클로닝(Sambrook et al., 1989)을 사용하여, GRE는 개별적으로 STAR 또는 SINC 요소에 인접한 pSelect 또는 pSS 벡터에로 도입된다. 상기 플라스미드는 상기와 같이, U-2 OS 세포로 트랜스펙션된다. 세포는 두 배양액으로 분리된다; 하나는 당성피질성(10μM)으로 처리된다. 리포터 유전자의 발현은 측정되고 두 개의 배양액 사이에서 비교된다. 발현에서의 차이는 시그널-의존 DNA-결합 단백질의 활동에 의한 STAR 및 SINC 기능을 조절하는 능력을 예증한다.

무차별 STAR 및 SINC 요소: 이들 성질을 시험하거나 또는 증대하는 것은 다른 세포주에서의 배양, 및 항생물질 선별법이 없는 장기간 배양을 포함한다.

실시예 10. 트랜스유전자의 보전에 대한 지속적인 선별법의 요구를 예방하는 STAR 및 SINC 요소.

배경: 트랜스제네시스에서, 선별 마커에 대한 의존성은 두 개의 골격을 갖는다: 선별 제제는 일반적으로 비싸고, 세포에 대한 대사 비용을 수행한다. 그리고, 트랜스제닉 응용에서 선별가능한 마커를 포함하는 것에 대한, 특히 트랜스유전자 자체가 생성물내에 있다면(예를 들어, 농산물, 유전자 치료 벡터), 단속 및 윤리적인 반대가 있다. STAR 및 SINC 요소는 트랜스제닉 단리물을 설립한 후, 선별을 보전하는 요구를 감소 또는 제한한다. 결과적으로, 내성 유전자는 트랜스유전자 발현의 감소된 손실을 갖는 부위-특이적인 재조합에 의해 트랜스제닉 게놈으로부터 제거될 수 있다.

프로토콜: 리포터 유전자를 플랭킹하고 염색체적으로 통합된 STAR 요소를 함유하는 안정하게 트랜스펙션된 U-2 OS 세포주는 상기한 바와 같이 트랜스-활동 항생물질 내성 플라스미드를 갖는 pSDH 플라스미드의 코-트랜스펙션에 의하여 생성된 다. 실험은 선별의 부재하에서 연장된(3-6개월) 배양동안 이들 세포주에서 리포터 유전자 발현 수준의 안정성을 시험하는 것을 포함한다. 이것은 pSDH 플라스미드에서 루시페라제 또는 GFP 리포터 유전자를 플랭킹하는 STAR 요소로 시험된다. 항생물질 내성 유전자는 항생물질 선별 마커가 레콤비나제 표적 부위에 의하여 플랭킹하는 발현 플라스미드(pSDH에 기초한)를 구성하는 것에 의해 제거된다. 상기 선별가능한 마커는 상기한 바와 같이, 이어서 레콤비나제 활성에 의해 잘린다.

실시예 11. 발현 시스템에서 STAR 요소의 적용으로 개선되는 예측가능성 및 수율

전사 억제의 영향을 차단하는 기능을 하는 STAR 요소는 트랜스유전자 발현 단위에서 영향을 준다. 이들 억제 영향은 이종염색질("위치 효과", (Boivin & Dura, 1998)) 또는 트랜스유전자의 인접한 카피("반복-유도된 유전자 침묵", (Garrick et al., 1998))에 기인할 수 있다. 이형의 단백질 생산에 대한 STAR 요소의 이익 중 두 가지는 고-발현 초기 재조합 숙주세포를 찾는 것에 대한 증가된 예측가능성, 및 생산 순환동안의 증가된 수율이다. 이들 이익은 이 실시예에서 예증된다.

재료 및 방법

pSDH 벡터 및 STAR 함유 유도체의 구성: pSDH-Tet 벡터는 프라이머 C67 및 C68(모든 PCR 프라이머 및 변이유발소의 올리고뉴클레오티드는 표 5에 등재된다)을 사용하여 플라스미드 pREP4-HSF-Luc(van der Vlag et al., 2000)로부터 루시페라제 개방 리딩프레임의 폴리머라제 연쇄 반응 증폭(PCR), 및 SacⅡ/BamHI-소화된 pUHD10-3으로 SacⅡ/BamHI 단편의 삽입(Gossen & Bujard, 1992)에 의해 구성되었 다. 루시페라제 발현 단위는 프라이머 C65 및 C66으로 재증폭되고, 두 개의 다중 클로닝 부위(MCSI 및 MCSⅡ)로 그것을 플랭킹하기 위해 pUHD10-3으로 재삽입되었다. 그 다음, AscI 부위는 EcoRI으로의 소화 및 연결자(어닐링된 올리고뉴클레오티드 D93 및 D94에 의해 구축된)의 삽입에 의하여 MCSI로 도입된다. CMV 프로모터는 프라이머 D90 및 D91로 플라스미드 pCMV-Bsd(Invitrogen K51001)에서 증폭되고, SalI/SacⅡ 소화 및 벡터 pSDH-CMV를 만들기 위한 결찰에 의하여 pSDH-Tet에서 Tet-Off 프로모터를 대체하는 데에 사용된다. 이 벡터에서의 루시페라제 개방 리딩프레임은 SEAP(분비 알칼리성 포스파타제)에 의하여 하기와 같이 대체되었다: 벡터 pSDH-CMV는 SacⅡ 및 BamHI으로 소화되고 블런트(blunt)되었다; SEAP 개방 리딩프레임은 EcoRI/SalI 소화에 의하여 pSEAP-베이직(basic)(Clontech 6037-1)로부터 단리되고, 블런트되고 pSDH-CMV로 결찰되어 벡터 pSDH-CS로 만들어졌다. SV40 프로모터 조절하에서 퓨로마이신 내성 유전자는 프라이머 C81 및 C82를 사용하여, PCR에 의하여 플라스미드 pBabe-Puro(Morgenstern & Land, 1990)으로부터 단리되었다. 이것은 NcoI/XbaI로 소화된 벡터 pGL3-대조군(BamHI 부위 제거된)로 결찰되어 pGL3-puro를 만들었다. pGL3-puro는 BglⅡ/SalI으로 소화되어 SV40-puro 내성 유전자를 단리하고, 이것은 블런트되고, 그리고 NheI 소화된, 블런트-말단 pSDH-CS로 결찰된다. 생성된 벡터, pSDH-CSP는 도7에서 나타낸다. 모든 클로닝 단계는 종래의 기술분야에서 알려진 방법에 따라서, 시약의 제조업체에서 제공된 지침서에 따라 실행되었다(Sambrook et al. 1989).

STAR 요소는 두 단계로, 적당한 제한 효소로 STAR 요소 및 pSDH-CSP 벡터의 소화 및 뒤이은 결찰에 의하여, MCSI 및 MCSⅡ로 삽입되었다. 재조합 pSDH 벡터는 STAR 요소의 배향은 제한 맵핑으로 결정되었다. 삽입물의 동일성 및 배향은 DNA 서열 분석으로 입증되었다. 서열화는 제조업체의 지침처에 따라서, Beckman CEQ2000 자동화 DNA 서열기를 사용하는 디데옥시 방법(Sanger et al., 1977)으로 수행되었다. 간략하게, DNA는 QIAprep Spin Miniprep 및 Plasmid Midi Kits(QIAGEN 27106 및 12145, 개별적으로)를 사용하여 E. coli로부터 정제되었다. 순환 서열화는 염료 종결자(CEQ Dye Terminator Cycle Sequencing Kit, Beckman 608000)의 존재하에서, 주문한(custom) 올리고뉴클레오티드 c85, E25 및 C42(표 5)를 사용하여 실행되었다.

pSDH 플라스미드를 이용한 CHO 세포의 트랜스펙션 및 배양: 중국 햄스터 난소 세포주 CHO-K1 (ATCC CCL-61)은 37℃/5% CO₂에서 글루타민 2mM, 페니실린 100U/㎖ 및 스트렙토마이신 100㎍/㎖를 함유하는 HAMS-F12 배지 + 10% 소태아 혈청에서 배양하였다. 세포는 제조업체에 의해 개시한 바와 같이 SuperFect(QIAGEN)을 사용하여, MSCI 및 MCSⅡ에서 STAR6 또는 STAR49를 함유하는 그것의 유도체, 및 pSDH-CSP 벡터를 이용하여 트랜스펙션되었다. 간략하게, 세포는 배양 용기에 살포되고 70-90% 군집이 되도록 하룻밤동안 성장되었다. SuperFect 시약은 마이크로그램당 6마이크로리터의 비율(예를 들어, 10㎝ 페트리 접시, 20㎍ DNA 및 120㎕ SuferFect)에서 플라스미드 DNA(Pvul로 소화되는 것으로 이 실시예에서 선형화된)와 화합되고, 세포에 첨가되었다. 하룻밤동안 인큐베이션한 후, 트랜스펙션 혼합물은 신선한 배지로 대체되고, 트랜스펙션된 세포는 추가로 인큐베이션되었다. 하룻밤동안 배양한 후, 퓨로마이신 5㎍/㎖을 첨가하였다. 퓨로마이신 선별은 개별적인 퓨로마이신 내성 CHO/pSDH-CSP 클론이 무작위로 단리되고 추가로 배양된 후인, 2주에서 완성되었다.

분비 알칼리성 포스파타제(SEAP) 평가: CHO/pSDH-CSP 클론의 배양 배지에서 SEAP 활성(Berger et al., 1988, Henthorn et al., 1988, Kain, 1997, Yang et al., 1997)은 제조업체에서 기재한 바와 같이 결정되었다(Clontech Great EscAPe kit #K2041). 간략하게, 배지의 부분표본은 65℃에서 비활성화된 다음, 평가 완충용액 및 CSPD 화학냉광의(chemiluminescent) 기질과 화합되고, 10분 동안 실온에서 인큐베이션되었다. 그 다음, 기질 변환의 비율은 냉광계측기(luminometer)(Turner 20/20TD)에서 결정되었다. 세포 농도는 Coulter ACT10 세포 계측기에서 트립신화된 세포를 계산하는 것으로 결정되었다.

pSDH 플라스미드를 이용한 U-2 OS 세포의 트랜스펙션 및 배양: 인간 골육종 U-2 OS 세포주(ATCC #HTB-96)은 37℃/5% CO₂에서 글루타민, 페니실린 및 스트렙토마이신(상기)를 함유하는 Dulbecco's Modified Eagle 배지 + 10% 소태아 혈청에서 배양하였다. 세포는 SuperFect(상기)를 사용하여, MSCI 및 MCSⅡ(플라스미드 pBabe-Puro와 함께)에서 STAR6 또는 STAR8를 함유하는 그것의 유도체, 및 pSDH-CMV 벡터를 이용하여 코-트랜스펙션되었다. 퓨로마이신 선별은 개별적인 퓨로마이신 내성 U-2 OS/pSDH-CMV 클론이 무작위로 단리되고 추가로 배양된 후인, 2주에서 완성되었 다.

루시페라제 평가: 루시페라제 평가(Himes & Shannon, 2000)은 냉광계측기(Turner 20/20TD)를 사용하여, 평가 키트 제조업체의 지침서(Roche 1669893)에 따라서 재현탁된(resuspended) 세포에서 평가되었다. 총 세포의 단백질 농도는 제조업체의 지침서(Sigma B-9643)에 따른 비신크닌산 방법에 의하여 결정되었고, 루시페라제 데이타를 표준적으로 하는데 사용되었다.

결과

pSDH-CSP 벡터 또는 STAR6 또는 STAR49를 함유하는 pSDH-CSP 플라스미드를 함유하는 재조합 CHO 세포 클론(표 6)은 3주동안 배양되었다. 그 다음, 배양 상징액에서의 SEAP 활성은 결정되고, 세포수를 기초로 하여 발현되었다(표 8). 보여지는 바와 같이, 발현 단위에서 STAR 요소를 갖는 클론은 단리되고, STAR 요소를 포함하지 않는 발현 단위의 클론보다 2-3배 더 높은 SEAP 활성을 발현하였다. 더구나, STAR가 없는 클론의 최대 활성에 또는 이상에서의 SEAP 활성을 발현하는 STAR-함유 클론의 수는 매우 높다: STAR 클론 개체군의 25% 내지 40%는 pSDH-CSP 클론의 가장 높은 SEAP 발현을 초과한다.

pSDH-CMV 벡터 또는 STAR6 또는 STAR8를 함유하는 pSDH-CMV 플라스미드를 함유하는 재조합 U-2 OS 세포 클론(표 6)은 3주동안 배양되었다. 그 다음, 숙주세포에서의 루시페라제 활성은 결정되고, 관련되 루시페라제 단위(도 9)로서 발현되고, 총 세포 단백질을 표준적으로 하였다. 발현 단위를 플랭킹하는 STAR 요소를 갖는 재조합 U-2 OS 클론은 STAR 요소를 포함하지 않는 클론보다 더 높은 수율을 가졌 다: 더구나, STAR8로부터 관측된 가장 높은 발현은 STAR가 없는 클론에서의 발현보다 2-3배 더 높았다. STAR6 클론은 STAR가 없는 클론보다 5배 더 높은 최대의 발현수준을 가졌다. 상기 STAR 요소는 또한 더 높은 예측가능성을 수여하였다: STAR 요소 모두의 경우, 클론의 15 내지 20%는 가장 높은 수준을 갖는 STAR가 없는 클론 비교가능한 또는 더 높은 수준에서 루시페라제 발현을 나타내었다.

이들 결과는 강한 CMV 프로모터와 함께 사용되는 경우에, STAR 요소는 이형 단백질(루시페라제 및 SEAP)의 수율을 증가시키는 것을 예증한다. 이 실시예에서 도입된 세 개의 STAR 요소 모두는 상승된 수율을 제공한다. STAR 요소에 의해 수여된 증가된 예측가능성은 STAR가 없는 클론에 의해 나타낸 가장 높은 수율과 동등하거나 또는 더 높은 수율을 갖는 클론의 많은 개체군에 의해 명백해진다.

실시예 12. 트랜스유전자 발현의 안정성을 개량한 STAR 요소.

재조합 숙주세포의 배양동안, 항생물질 선별을 보존하는 것은 일반적인 실행이다. 이것은 트랜스유전자의 전사적인 침묵 또는 재조합과 같은 공정에 의하여 게놈으로부터 트랜스유전자의 손실을 억제하려는 의도이다. 하지만, 많은 이유때문에, 이형 단백질의 생산은 바람직하지 않다. 첫번째로, 사용되는 항생물질은 매우 비싸고, 생성물의 단위 비용에 현저하게 기여한다. 둘째로, 생물약제학적인 용도에서, 단백질은 생성물에서 항생물질의 흔적이 없는 것을 증명할 수 있도록 순수해야한다. 이종 단백질 생산을 위한 STAR 요소의 하나의 이점은 그것들이 항생물질 선별의 부재에서조차, 연장된 배양 동안 트랜스유전자 상에서 안정한 발현을 수여한다는 것이다.

재료 및 방법

U-2 OS 세포주는 플라스미드 pSDH-Tet-STAR6로 트랜스펙션되고, 실시예 11에서 기재한 바와 같이 배양되었다. 개별적인 퓨로마이신-내성 클론은 단리되고 독시시클린의 부재에서 추가로 배양되었다. 1주 단위의 간격에서 세포는 1:20의 희석에서 신선한 배양 용기로 이전되었다. 루시페라제 활성은 실시예 11에서 기재한 바와 같이 정기적인 간격에서 측정되었다. 15주 후, 배양은 두 개의 복제물로 나누어졌다; 하나의 복제물은, 다른 복제물이 시험의 잔류물에 대하여 어떠한 항생물질도 받지 않는 반면에, 퓨로마이신을 지속적으로 받았다(총 25주).

결과

표 7은 항생물질을 갖거나 또는 갖지 않은 연장된 성장 중에 STAR6로 플랭킹된 발현 단위에 의한 루시페라제 발현에서의 데이타를 나타낸다. 보여지는 바와 같이, 리포터 트랜스유전자, 루시페라제의 발현은 실험의 기간에 대한 U-2 OS 숙주세포에서 안정하게 남는다. 상기 배양이 두 가지의 처리(항생물질을 첨가 및 항생물질없이)로 나누어진 후, 루시페라제의 발현은 항생물질 선별의 부재에서 실질적으로 안정하다. 이것은 STAR 요소의 능력이 침묵 또는 연장된 배양 중의 손실로부터 트랜스유전자를 보호하는 것을 예증한다. 이것은 또한 이 성질이 항생물질 선별에 독립적이라는 것을 예증한다. 그러므로, 이형 단백질의 생산은 항생물질의 비용 또는 까다로운 하류 공정을 초래하는 것 없이 가능하다.

실시예 13. STAR 요소의 최소한의 필수 서열

STAR 요소는 실시예 1에서 기재된 유전학적인 스크린으로 단리된다. 상기 스 크린은 대략 0.5-2 킬로염기(상기)로 크기-분류되는 인간 게놈 DNA에 의해 구축된 라이브러리를 사용한다. STAR 요소는 500 내지 2361 염기쌍의 범위이다(표 6). 단리되어진 STAR 요소의 많은 경우에, STAR 활성은 처음에 단리된 클론보다 더 작은 DNA 단편에 의해 수여되는 가능성이 있다. 이것은, 두 가지 이유에서, STAR 활성에 실질적인 이들 최소의 단편 크기를 결정하는 데에 유용하다. 첫번째로, 더 작은 기능적인 STAR 요소는 더 작은 벡터가 더 높은 효율로 숙주세포에 트랜스펙션되므로, 조밀 발현 벡터의 고안에서 유익할 것이다. 두번째로, 최소의 실질적인 STAR 요소를 결정하는 것은 상승된 기능성에 대한 그들의 서열을 변형하는 것을 용인한다. 두 개의 STAR 요소는 그것들의 최소의 실질적인 서열을 결정하도록 파인-맵핑되고 있다.

재료 및 방법:

STAR10(1167 염기쌍) 및 STAR27(1520 염기쌍)은 파인-맵핑되고 있다. 그것들은 PCR에 의해 증폭되어 대략 동등한 길이의 하위단편(sub-fragment)를 산출한다(도 10 범례). 초기 시험을 위하여, 이들은 BamHI 부위에서 pSelect 벡터로 클로닝되고 있고, 실시예 1에서 기재한 바와 같이, U-2 OS/Tet-Off/Lexa-HP1 세포로 트랜스펙션되고 있다. 하이그로마이신 내성을 위한 선별 후, 트랜스펙션된 세포는 제오신으로 인큐베이션되어 LexA-HP1 결합에 기인한 억제로부터 SV40-Zeo 발현 단위를 보호하기 위한 STAR 요소의 능력을 시험하였다.

결과

이 실험에서 STAR10 및 STAR27은 예상한 바와 같이(도 10), 유전자 침묵에 반작용하는 좋은 보호를 수여한다. 이것은 제오신의 존재하에서의 강건한 성장으로 명백하였다.

STAR10 하위단편 중에서, 10A(~400 염기쌍)은 트랜스펙션된 세포에 제오신의 존재하에서 활기있는 성장을 수여하고, 총 길이 STAR 요소의 것을 초과한다. 다른 2개의 하위단편을 포함하는 pSelect 구성물로 트랜스펙션하였다. 이들 결과는 STAR10의 항-억제 활성을 초래하는 DNA 서열을 포함하는 것으로 ~400 염기쌍 10A 단편을 동정한다.

STAR27은 이 실험에서 트랜스펙션된 세포에 대하여 제오신에서 온건한 성장을 수여한다(도 10). 이 STAR의 하위단편 중 하나인, 27B(~500 염기쌍)은 제오신-함유 배지에서 숙주세포의 약한 성장을 용인한다. 이것은 이 STAR의 항-억제 활성이 부분적으로 하위단편 27B에 위치결정되지만, 모든 화성은 또한 27A 및/또는 27C(각 ~500 염기쌍)으로부터의 서열을 요구한다.

실시예 14. 배양된 포유동물 세포의 다양한 균주에서 기능하는 STAR 요소

이형 단백질 발현을 위한 숙주세포주 선별은 단백질의 질, 수율 및 단위 비용에 대한 결정적인 매개변수이다. 전사-후 변형, 분비 경로 수용능력 및 세포주 불멸성과 같은 고찰은 특정 생물약제학적인 생산 시스템을 위한 절적한 세포주를 지시한다. 이러한 이유로, 수율, 예측가능성 및 안정성의 관점에서 STAR 요소에 의해 제공된 이점은 다양한 세포주에서 얻어질 수 있을 것이다. 이것은 본래에 클로닝된 인간 U-2 OS 세포주 또는 생물공학에서 폭넓게 응용된 CHO 세포주에서 STAR6의 기능을 비교하는 것으로 시험될 수 있다.

재료 및 방법:

실시예 11의 실험이 인용된다.

결과

CHO 세포에서 SEAP 리포터 유전자의 발현은 도 8에서 나타낸다; U-2 OS 세포에서 루시페라제 리포터 유전자의 발현은 도 9에서 나타낸다. 이들 두 실험의 결과를 비교하는 것으로, STAR6 요소가 양쪽 세포주에서 기능적이라는 것이 분명하다: 리포터 유전자가 STAR6에 의해 위치 효과로부터 보호되는 경우, 리포터 유전자 발현은 양쪽 모두에서 더욱 예측가능하고, 각 세포주의 클론은 더 높은 수율로 나타냈다. 이들 두 세포주는 다른 종(인간 및 햄스터) 및 다른 조직 유형(뼈 및 난소)로부터 유도되고, 이 STAR 요소가 이형 단백질 발현을 개량하는 데에 활용될 수 있는 숙주세포의 광범위한 범위를 반영한다.

실시예 15. 다양한 전사 프로모터의 상황에서 기능하는 STAR 요소

트랜스유전자 전사는 외부 프로모터의 조절하에서 트랜스유전자 개방 리딩프레임를 대체하는 것으로 이루어진다. 프로모터의 선별은 이형 단백질의 본성 및 생산 시스템에 의하여 영향받는다. 대부분의 경우에, 강한 구조성의 프로모터는 그것들이 제공할 수 있는 높은 수율때문에 바람직하다. 어떤 바이러스성 프로모터는 이들 성질을 갖는다; 사이토메갈로바이러스 직관적인(immediate) 초기 유전자의 프로모터/인핸서("CMV 프로모터")는 일반적으로 보통의 생물공학적인 용도에서 가장 강력한 프로모터로서 간주된다(Boshart et al., 1985, Doll et al., 196, Foecking & Hofstetter, 1986). 유인원 바이러스 SV40 프로모터는 또한 알맞게 강하고(Boshart et al., 1985, Foecking & Hofstetter, 1986), 종종 포유동물 세포 벡터에서 전위(ectopic) 발현을 위해 사용된다. Tet-Off 프로모터는 유도가능하다: 프로모터는 테트라시클린 또는 tTA 플라스미드(Clontech K1620-A)를 발현하는 세포주에서 관련된 항생물질(독시시클린이 일반적으로 사용된다)의 존재하에서 억제되고, 항생물질의 제거는 전사적인 유도를 나타낸다(Deuschle et al., 1995, Gossen & Bujard, 1992, Izumi & Gilbert, 1999, Umana et al., 1999).

재료 및 방법:

pSDH-Tet 및 pSDH-CMV 벡터의 구성은 실시예 11에서 기재된다. pSDH-SV40은 플라스미드 pSelcet-SV40-Zeo(실시예 1)으로부터 SV40 프로모터의 PCR 증폭(프라이머 D41 및 D42), 뒤이은 SacⅡ 및 SalI로의 PCR 생성물 소화에 의하여 구성되었다. pSDH-CMV 벡터는 SacⅡ 및 SalI로 소화되어 CMV 프로모터를 제거하고, 벡터 및 SV40 단편은 함께 결찰되어 pSDH-SV40을 만들었다. STAR6은 실시예 11에서 기재된 바와 같이, MCSI 및 MCSⅡ로 클로닝되었다. 플라스미드 pSDH-Tet, pSDH-Tet-STAR6, pSDH-Tet-STAR7, pSDH-SV40 및 pSDH-SV40-STAR6은 제조업체에 의해 기재된 바와 같이 SuperFect를 사용하여 U-2 OS로 pBabe-Puro로 코-트랜스펙션되었다. 세포 배양, 퓨로마이신 선별 및 루시페라제 평가는 실시예 11에서 기대된 바와 같이 수행되었다.

결과

도 9, 11 및 12는 3개의 다른 프로모터로부터 루시페라제 리포터 유전자의 발현을 비교한다: 두 개의 강하고 구조성의 바이러스성 프로모터(CMV 및 SV40), 유 도가능한 Tet-Off 프로모터. 세 개의 프로모터 모두는 U-2 OS 세포에서 STAR6의 상황에서 시험되었다. 결과는 세 개의 프로모터 모두로부터 수율 및 예측가능성이 STAR6에 의해 증가되었다. 실시예 11 및 실시예 14에서 기재된 바와 같이, STAR6는 CMV 프로모터의 상황에서 유익하다(도 9). 유사한 개량은 SV40 프로모터의 상황에서 보여진다(도 11): 가장 높게 발현하는 STAR6 클론으로부터의 수율은 최고의 pSDH-SV40 클론보다 2-3배 더 크고, 6개의 STAR 클론(개체군의 20%)은 최고의 STAR가 없는 클론보다 더 높은 수율을 갖는다. 유도되는(낮은 독시시클린) 농도 이하의 Tet-Off 프로모터의 상황에서, STAR6는 또한 트랜스유전자 발현의 수율 및 예측가능성을 개량한다(도 12): 가장 높게 발현하는 STAR6 클론은 최고의 pSDH-Tet 클론보다 20배 더 높은 수율을 갖고, 9개의 STAR6 클론(개체군의 35%)은 최고의 STAR이 없는 클론보다 더 높은 수율을 갖는다. 이 STAR 요소는, 그것이 다양한 생물공학적으로 유용한 전사의 프로모터의 상황에서 기능하므로, 그것의 트랜스유전자-보호 성질에서 다재다능하다고 결론되어진다.

실시예 16. 방향성일 수 있는 STAR 요소의 기능

짧은 핵산 서열이 대칭적(예를 들어 회문적인(palindromic))일 수 있는 반면에, 더 긴 자연적으로 발생하는 서열은 전형적으로 비대칭적이다. 결과로서, 핵산 서열의 정보 함량,및 서열 자체는 그것들의 5' 및 3' 말단에 관해서 기재될 수 있다. 핵산 서열 정보의 방향성은 재조합 DNA 분자가 해당 기술분야에서의 표준 클로닝 기술(Sambrook et al., 1989)을 사용하여 회합된다. STAR 요소는 길고, 비대칭적인 DNA 서열이고, 그리고 그것들이 본래에 pSelect 벡터에서 클로닝되는 배향에 서 기초한 방향성을 갖는다. 상기 실시예에서, pSDH 벡터에서 2개의 STAR 요소를 사용하여, 이 방향성은 보존된다. 이 배향은 제오신 내성 유전자에 관련된, 천연 또는 5'-3' 배향으로 기재된다(도 13 참조). 이 실시예에서, STAR 기능에 대한 방향성의 중요성은 pSDH-Tet 벡터에서 시험된다. pSDH 벡터에서 리포터 유전자는 관심의 STAR 요소의 카피에 의하여 양쪽 측면에 플랭킹되므로, 각 STAR 카피의 배향은 고려되어야 한다. 이 실시예은 반대 배향과 천연 배향을 비교한다(도 13).

재료 및 방법:

STAR66 요소는 실시예 11에서 기재된 바와 같이 pSDH-Tet로 클로닝되었다. U-2 OS 세포는 플라스미드 pSDH-Tet-STAR66-천연 및 pSDH-Tet-STAR66-반대로 코-트랜스펙션되고, 실시예 11에서 기재된 바와 같이 배양된다. 개별적인 클론은 단리되고 배양된다; 루시페라제 발현의 수준은 기재된 바(상기)와 같이 결정된다.

결과

천연 배향 및 반대 배향에서 STAR66 활성의 비교 결과는 도 14에서 보여준다. STAR66가 반대 배향인 경우, 단지 하나의 클론의 수율은 합당하게 높다(60 루시페라제 단위). 대조적으로, 가장 높게 발현하는 클론의 수율은 STAR66이 천연 배향인 경우 상당히 더 높고(100 루시페라제 단위), 예측가능성은 또한 훨씬 더 높다: 천연-배향 개체군의 7개의 클론(30%)는 반대-배향 개체군으로부터 가장 높게 발현하는 클론의 수준 이상으로 루시페라제를 발현하고, 천연 배향 개체군(60%)에서의 15개의 클론은 10개의 관련된 루시페라제 단위 이상으로 루시페라제를 발현한다. 그러므로, 이것은 STAR66 기능은 방향성이라는 것을 예증한다.

실시예 17. 카피수-의존적인 STAR 요소의 상황에서의 트랜스유전자 발현

이형 단백질 발현을 위한 트랜스유전자 발현 단위는 일반적으로 숙주세포의 게놈으로 통합되어 세포 분화 중에 안정하게 유지하는 것을 보증한다. 통합은 게놈으로 삽입되는 발현 단위의 하나 또는 다중의 카피를 이끌어낼 수 있다. 다중 카피는 탠덤 배열로서 나타낼 수 있거나 또는 나타낼 수 없다. STAR 요소(상기)에 의하여 보호되는 트랜스유전자에 대한 예증하는 증가된 수율은 STAR 요소가 게놈에서 통합 부위와 연관된 전사에서의 영향에 독립적으로 기능하는 트랜스유전자 발현 단위를 용인할 수 있다는 것을 제안한다(위치 효과와는 독립적임(Boivin & Dura, 1998)). 이것은 또한 STAR 요소가 탠덤 배열로서 통합되는 경우에 그것들이 발현 단위의 이웃한 카피에 독립적으로 기능하는 각각의 발현 단위를 용인한다는 것을 제안한다(반복-유도 유전자 침묵으로부터 독립적임(Garrick et al., 1998)). 카피수-의존성은 하기와 같이, 트랜스유전자 발현 수준 및 카피수 사이의 관계로부터 결정된다.

재료 및 방법:

U-2 OS 세로는 pSDH-Tet-STAR10으로 코-트랜스펙션되었고, 상기와 같이 퓨로마이신 선별 하에서 배양되었다. 8개의 개별적인 클론은 단리되었고, 추가로 배양되었다. 그 다음, 세포는 채집되었고, 한 부분은 상기와 같이 루시페라제 활성에 대하여 평가되었다. 남은 세포는 용해되고 게놈 DNA는 제조업체에 의해 기재된 바와 같이 DNeasy Tissue Kit(QIAGEN 69504)를 사용하여 정제되었다. DNA 샘플은 UV 분광 측정계에 의하여 분량되었다. 3마이크로그램의 각 게놈 DNA 샘플은 제조업 체(New England Biolabs)에 의해 기재된 바와 같이 PvuⅡ 및 XhoI로 소화되었고, 아가로스 젤 전기연동으로 분석되었다. DNA 단편은 기재된 바(Sambrook et al., 1989)와 같이, 나일론 막으로 이동되었고,루시페라제 유전자(BamHI/SacⅡ-소화된 pSDH-Tet으로부터 단리된)에 대하여 방사성 표지된 프로브로 혼성되었다. 블롯은 기재된 바(Sambrook et al., 1989)와 같이 세척되었고, 포스포리메이저 스크린(Personal F/X, BioRad)에 노출되었다. 생성된 자동 방사선 사진(도 15)은 사진농도계에 의해 분석되어 트랜스유전자 카피수를 나타내는, 루시페라제 DNA 밴드의 관련된 세기를 결정하였다.

결과

pSDH-Tet-STAR10 클론 개체군으로부터의 클론에서 루시페라제의 효소 활성 및 카피수(DNA 밴드 강도)는 도 16에서 나타낸다. 트랜스유전자 카피수는 이들 pSDH-Tet-STAR10 클론에서의 루시페라제 발현의 수준(r=0.86)과 매우 연관된다. 이것은 STAR10은 트랜스유전자 발현 단위에서 카피수-의존성을 수여하고, 탠덤 배열에서 다른 트랜스유전자 카피에 의존하고 통합 부위에서 유전자-침묵 효과와는 독립적인 트랜스유전자 발현을 만든다.

실시예 18. 단지 인핸서가 아닌 인핸서 차단제로서의 STAR 요소의 기능

유전자 프로모터는 전사를 개시하는 그것들의 능력에 양성 및 음성 모두의 영향에 직면하게 된다. 양성적인 효과를 발휘하는 요소의 상당한 분류는 인핸서가다. 인핸서는 그것들이 프로모터로부터 멀리(수 킬로염기쌍) 떨어진 경우에조차 성질적으로 프로모터에 영향을 줄 수 있다. 이종염색질 형성(예를 들어, Polycomb 그 룹 단백질)에 의해 작용하는 음성적인 영향은 상기하였고, 이들은 STAR 활성의 표적이다. 그러므로, STAR 요소가 음성적인 영향뿐만 아니라 양성적인 영향을 차단할 수 있는가, 다시 말하면, 통합 부위의 근처에서 게놈 인핸서로부터 트랜스유전자를 차단할 수 있는가를 결정하는 것은 중요하다. 인핸서 활성으로부터 트랜스유전자를 차단하는 능력은 생물공학적인 응용에서 트랜스유전자의 안정하고 예측가능한 수행능력을 보장한다. 이 실시예는 인핸서-차단 평가에서 STAR 요소의 수행능력을 검사한다.

그것들의 기능에 상당한 STAR 활성의 또 다른 특징은 그것들이 트랜스유전자에 수여하는 증가된 수율이다(실시예 11). STAR는 이종염색질-형성 단백질이 후보 STAR 요소의 근처에 결합되는 경우에 제오신 발현의 높은 수준을 유지하는 그것들의 능력에 기초하여 단리된다. 높은 발현은 STAR가 제오신 발현 단위로의 이종염색질의 확산을 차단하는 것으로 예상되기 때문에 발생하는 것으로 예측된다. 하지만, 두번째 시나리오는 제오신-내성 클론에서 DNA 단편이 인핸서를 함유한다는 것이다. 인핸서는 STAR 스크린의 방법에서 사용되는 것과 같은 Polycomb-그룹 단백질의 억제 효과를 극복하는 능력을 갖는 것으로 예증되고 있다(Zink & Paro, 1995). 이 현상에 의하여 단리된 인핸서는 인핸서가 STAR에 대하여 여기서 주장한 성질을 갖지 않으므로, 잘못된 양성으로 고려될 것이다. STAR 요소가 인핸서가 아니라는 것을 예증하기 위해서, 그것들은 인핸서 평가법에서 시험된다.

인핸서-차단 평가 및 인핸서 평가는 방법론적으로 그리고 개념적으로 유사하다. 상기 평가법은 개략적으로 도 17에서 나타낸다. 인핸서를 차단하는 STAR 요소 의 능력은 E47/E-box 인핸서 시스템을 사용하여 수행된다. E47 단백질은 그것이 그것들의 프로모터의 근처에 위치하는 E-Box DNA 서열에 결합하는 경우에 프로모터에 의하여 전사를 활성화할 수 있다(Quong et al., 2002). E47은 보통 B 및 T 림프구 식별의 조절을 포함하지만(Quong et al., 2002), 이것은 전위적으로 발현하는 경우에 다양한 세포 유형에서 기능을 할 수 있다(Petersson et al., 2002). E-box는 회문성 DNA 서열, CANNTG이다(Knofler et al., 2002). 인핸서-차단 평가에서, E-box는 발현 벡터에서 루시페라제 리포터 유전자(최소의 프로모터를 포함하는)의 상류에 위치된다. STAR 요소에 대한 클로닝 부위는 E-box 및 프로모터 사이에 위치된다. E47 단백질은 이차 플라스미드에 코드화된다. 평가는 세포로 E47 플라스미드 및 루시페라제 발현 모두를 트랜스펙션하는 것으로 수행된다; E47 단백질은 발현되고, E-box에 결합되고, E47/E-box 복합체는 인핸서로서 작용할 수 있다. 루시페라제 발현 벡터가 STAR 요소를 포함하지 않는 경우에, E47/E-box 복합체는 루시페라제 발현을 증대시킨다(도 17A, 국면 1). STAR 요소는 E-box 및 프로모터 사이에 삽입되고, 인핸서를 차단하는 그것들의 능력은 루시페라제 활성의 감소된 발현에 의해 예증된다(도 17A 국면 2); STAR가 인핸서를 차단할 수 없다면, 루시페라제 발현은 활성화된다(도 17A 국면3).

인핸서로서 작용하는 STAR 요소의 능력은 동일한 루시페라제 발현 벡터를 활용한다. E47의 부재에서, E-box 그 자체는 전사에 영향을 주지 않는다. 그 대신, STAR 요소에 의한 인핸서 행동은 루시페라제 전자의 활성화를 나타낼 것이다. 상기 평가는 E47 플라스미드가 없는 루시페라제 발현 벡터를 트랜스펙션하는 것으로 수 행된다. 발현 벡터가 STAR 요소를 함유하지 않는 경우에, 루시페라제 발현은 낮다(도 17B, 국면 1). STAR 요소가 인핸서 성질을 갖지 않는다면, 루시페라제 발현은 STAR 요소가 벡터에 존재하는 경우에 낮다(도 17B, 국면 2). STAR 요소가 인핸서 성질을 갖는다면, 루시페라제 발현은 STAR-함유 벡터에서 활성화될 것이다(도 17B, 국면 3).

재료 및 방법:

루시페라제 발현 벡터는 플라스미드 pGL3-베이직(Promega E1751)에 루시페라제 유전자의 플라스미드 mu-E5+E2x6-cat(x)(Ruezinsky et al., 1991) 상류로부터 E-box 및 인간 알칼리성 포스파타제 최소의 프로모터를 삽입하는 것으로 구성되어 pGL3-E-box-루시페라제(W. Romanow으로부터 받음)를 만든다. E47 발현 플라스미드는 pHBAPr-1-neo 플라스미드에서 베타-액틴 프로모터의 조절하에서 E47 개방 리딩프레임을 함유한다; E47은 이 플라스미드로부터 구성적으로 발현된다(W. Romanow로부터 받음).

STAR 요소 1, 2, 3, 6, 10, 11, 18 및 27은 루시페라제 발현 벡터로 클로닝된다. Drosophila scs 요소 및 닭 베타-글로빈 HS4-6x 핵심(core) ("HS4") 요소를 함유하는 클론은 양성 대조군으로 포함되고(그것들은 인핸서를 차단하는 것으로 알려져 있고, 어떠한 본능적인 인핸서 성질도 갖지 않는다(Chung et al., 1993, Kellum & Schedl, 1992)), 빈 루시페라제 발현 벡터는 음성 대조군으로서 포함된다. 모든 평가는 U-2 OS 세포주를 사용하여 수행되었다. 인핸서-차단 평가에서, E47 플라스미드는 루시페라제 발현 벡터(빈 벡터, 또는 STAR 또는 양성-대조군 요 소를 함유하는)으로 코-트랜스펙션되었다. 인핸서 평가에서, E47 플라스미드는 인핸서 활성에 대한 양성 대조군으로 STAR가 없는 루시페라제 발현 벡터로 코-트랜스펙션되었다; 다른 모든 샘플은 코-트랜스펙션중에 모조 플라스미드를 받았다. 일시적으로 트랜스펙션된 세포는 플라스미드 트랜스펙션(상기)후 48시간에 루시페라제 활성에 대하여 평가된다. 어떠한 E-box 또는 STAR/대조군 요소를 함유하지 않는 플라스미드로부터 발현된 루시페라제 활성은 제거되고, 루시페라제 활성은 기재된 바와 같이 단백질 함량에 표준적으로 된다.

결과

도 18은 인핸서-차단 평가의 결과를 나타낸다. STAR 요소(또는 알려진 인핸서-차단 요소 scs 및 HS4)의 부재하에서, E47/E-box 인핸서 복합체는 루시페라제("벡터")의 발현을 활성화한다; 이 발현의 증대된 수준은 100에 평균적으로 된다. 인핸서 활성은 시험된 모든 STAR 요소에 의해 차단된다. 인핸서 할성은 또한 예상된 바와 같이, HS4 및 scs 요소에 의해서 차단된다(Bell et al., 2001, Gerasimova & Corces, 2001). 이들 결과는 전사적 침묵의 확산(음성 영향)을 차단하는 그것들의 능력에 더하여, STAR 요소가 인핸서의 작용(양성 영향)을 차단할 수 있다.

도 19는 인핸서 평가의 결과를 나타낸다. E47/E-box 복합체에 의한 증대에 기인한 루시페라제 발현의 수준은 100("E47")에 고정되었다. 비교에 의하여, STAR 요소의 어느 것도 루시페라제 발현의 상당한 활성화가 생기게 하지 않는다. 예상한 바와 같이, scs 및 HS4 요소는 또한 리포터 유전자의 활성화를 생기게 하지 않는다. 그러므로 적어도 시험된 STAR 요소는 인핸서 성질을 소유하지 않는 것으로 결 론되어진다.

실시예 19. 침묵을 유도하는 염색질(SINC) 요소의 특성화

재료 및 방법

SINC 스크린의 일반적인 특징은 실시예 1에서 기재되고 있고, 그것의 약간의 측면은 여기서 개괄한다. 게놈 DNA에서 SINC 요소를 스크리닝하도록 사용되는 pSS 벡터의 하나의 별형은 pSS-codA::upp이다(도 20). 그것은 2개의 STAR6 요소에 의해 플랭킹되는, 자살 유전자 발현 단위에 의해 구축된다.Tet-Off 프로모터의 조절하에서 codA::upp 자살 유전자로 구성되는 발현 단위는 BglⅡ 제한 부위의 하류이다. pSS 벡터, pSS-hrGFP(도 21)의 두 번째 별형은 STAR8를 갖는 하나의 STAR6 요소의 대체 및 HrGFP 유전자를 갖는 자살 유전자의 대체에 의해 만들어지고, 녹색 형광 단백질(Stratagene 240059)을 코드화하였다. 염색체 22(Research Genetics 96010-22)으로부터의 인간 게놈 DNA는 Sau3AI에 의해 부분적으로 소화되고, 크기 분류되었다. 0.5-10 킬로염기쌍 분획은 pSS-codA::upp의 BglⅡ로 결찰되었다. 이 라이브러리는 1.2 킬로염기쌍의 평균 삽입 크기를 갖는 ~20,000개의 독립적인 클론을 나타냈다. 라이브러리는 Escherichia coli에서 증폭되었다. 증폭된 라이브러리로부터 정제된 DNA는 표준 기술(칼슘 포스페이트; Life Technologies 18306-019)에 위하여 U-2 OS/Tet-Off 세포(van der Vlag et al., 2000)로 트랜스펙션되었다. 대조군 트랜스펙션은 빈 pSS-codA::upp 벡터 DNA를 사용하여 수행되고, 2400개의 하이그로마이신 내성 콜로니를 산출하였다. 트랜스펙션된 세포는 높은 독시시클린(10ng/㎖)에서 3주 기간에 걸쳐 하이그로마이신 내성(25㎎/㎖)에 대하여 선별되고, 1800개의 하이그로마이신-내성 콜로니는 라이브러리 트랜스펙션으로부터 회수되었다. 그 다음, 이들 콜로니는 독시시클린 농도 10ng/㎖에서, 4일동안 5㎎/㎖의 상승을 갖는, 1㎎/㎖에서의 프로드럭 5-플루오로시토신(5-FC)으로 인큐베이션하였다. 3주 후, 단지 3주간 성장한 대조군 콜로니(빈 pSS-codA::upp로 트랜스펙션된)는 모두 죽었다; 라이브러리-트랜스펙셔된 콜로니 58개는 생존하였다. 이들 콜로니는 프로드럭 처리로부터 회수될 수 있고, 추가로 배양되었다. 5-FC-내성 단리물은 채집되었고, 세포는 용해되었고, DNA의 일부는 프라이머 D30 및 D51을 사용하는 PCR 증폭하여 SINC 요소를 회수하였다. 6개의 5-FC-내성 콜로니로부터의 PCR 생성물은 통상의 방법(Sambrook et al., 1989)에 의하여 pBluescriptⅡ SK(+) 플라스미드(Stratagene 212207)의 HindⅢ 및 XhoI 부위사이에 클로닝되었다. 후보 SINC 요소의 DNA 서열은 pBluescript 벡터(Stratagene 300301 및 300302)을 위한 시판중인 프라이머를 사용하여 기재된 바와 같이 결정되었다. 이들 SINC 요소의 서열은 표 4B에서 나타낸다.

6개의 후보 SINC 요소는 그것들의 천연 배향에서 플라스미드 pSS-hrGFP로 클로닝되고, 생성된 플라스미드는 U-2 OS/Tet-Off 세포로 트랜스펙션되었다. 하이그로마이신 내성에 대한 선별 후, pSS-hrGFP-SINC 트랜스펙턴트는 높은 독시시클린 농도(10ng/㎖)에서 추가로 배양되었다. 총 세포 RNA는 제조업체에서 기재한 바와 같이 RNeasy Mini Kit(QIAGEN 74014)을 사용하여 추출하였다. 이들 개체군에서 GFP mRNA 풍부성의 노던 블롯 분석은 표준 기술(Sambrook et al., 1989)을 사용하여 사정하였다. GFP 프로브는 phrGFP-1에서 690 내지 1419 염기쌍을 포함하는 BamHI-EcoRI 단편이다. 블롯은 또한 PSS-hrGFP-유도된 플라스미드 카피수에 대한 대조군 으로서 하이그로마이신 mRNA 및 유전체학적으로 코드화된 mRNA 양에 대한 대조군으로서 베타-액신에 대하여 프로브하였다. 하이그로마이신 프로브는 pREP4에서 8219-10144로부터 확장된 SfuI-SalI 단편이고, 그리고 베타-액신 프로브는 Clontech, #9800-1으로부터의 것이다. 잡종화 및 세척 후, 블롯은 포스포리메이저 스크린에 노출되고, 방사성 시그널은 BioRad Personal F/X 포스포리메이저를 사용하여 시각화되고 정량되었다.

결과

GFP 리포터 유전자에 인접한 클로닝된 SINC 요소는 리포터 유전자 전사의 침묵을 유도할 것이지만, 다른 유전자의 전사에 영향을 주지 않는다. SINC 활성의 정밀한 측정은 단순하게 완전한 GFP 발현을 측정하는 것보다 두 개의 참조 유전자의 발현에 관련된 GFP의 발현을 결정하는 것으로 이 사실을 이용한다. 하나의 참조 유전자는 pSS-hrGFP 플라스미드(STAR 요소에 의해 정의된 외부 도메인;도 21)에서 하이그로마이신 내성 유전자이고, 다른 하나는 게놈 베타-액틴 유전자이다. SINC 활성은 RNA 블롯 분석에 의하여 하이그로마이신 및 베타-액틴 시그널에 대한 GFP 시그널의 비율에서의 감소로 정량화된다. 특성화되고 있는 후보 SINC 요소 중에서, 약간의 것들은 GFP 전사에서 현저한 관련 감소를 나타내고, 이들 DNAs가 침묵 염색질의 형성을 유도할 수 있는 것을 나타낸다. SINC35 요소(표 4B에서 표지화된 PSINK35)은 이들 후보물질의 가장 강력한 활성을 갖는다. 이것은 GF/하이그로마이신 비율에서 69% 감소, 및 GFP/베타-액틴 시그널에서 75% 감소를 생기게 한다. 본래의 응용에서, 및 단리되고 이 응용에 의해서 특성화된 많은 후보 SINC 요소에서 기재된 다른 5개의 후보물질에서의 SINC 활성의 세기는 더 적다. 그러므로 SINC35는 다양한 생물공학적 응용에서 침묵 염색질의 유도에 대한 유력한 유전자 요소으로 월등한 수행능력을 갖는다.

실시예 20. 마우스 및 인간 사이에서 보존된 STAR 요소

인간 게놈 데이타베이스에 대한 STAR DNA 서열의 BLAT 분석(http://genome.ucsc.edu/cgi-bin/hgGateway)은 이들 서열의 일부가 인간 게놈의 다른 영역과 높은 서열 보존을 갖는다는 것을 드러낸다. 이들 증복된 영역은 후보 STAR 요소이다; 그것들이 STAR 활성을 보인다면, 그것들은 클로닝된 STAR의 파라로그(paralog)로 고려될 것이다(2개의 유전자 또는 유전자 요소는 그것들이 증복 사건으로부터 유도된다면 파라로그한 것이라고 말하여진다(Li, 1997)).

마우스 게놈에 대한 인간 STAR의 BLAST 분석(http://www. ensembl.org/Mus_musculus/blastview)은 또한 마우스 또는 인간 사이에서 높은 서열 보존의 영역을 드러낸다. 이 서열 보존은 65개의 인간 STAR 요소로부터의 15개의 단편을 나타내고 있다. 보존은 64% 내지 89%의 범위이고, 141 염기쌍 내지 909 염기쌍의 길이이다(표 8). 이들 서열 보존의 정도는 주목할 만하고, 이들 DNA 서열 또한 마우스 게놈안에서 STAR 활성을 수여할 수 있다는 것을 제안한다. 표 8에서 마우스 및 인간 게놈으로부터의 서열의 일부는 엄밀하게 오소로그(ortholog)이라고 정의될 수 있다(2개의 유전자 또는 유전자 요소는 그것들이 종 형성 사건으로부터 유도된다면 오소로그한 것이라고 말하여진다(Li, 1997)). 예를 들면, STAR6는 인간 및 마우스 유전자 모두에서 SLC8A1 및 HAAO 유전자 사이에 있다. 다른 경우에, 클 로닝된 인간 STAR는 인간 게놈에서 파라로그를 갖고, 그것의 오소로그는 마우스 게놈에서 동정된다. 예를 들어, STAR3a는 인간 게놈 15의 15q11.2영역의 단편이다. 이 영역은 인간 게놈 5에서의 5q33.3에서 DNA 단편과 96.9% 동일(파라로그한)하고, IL12B 인터루킨 유전자에 인접한다. 이들 인간 DNAs는 마우스 염색체 11에서의 마우스 11B2 영역의 단편과 대략 80%의 동일성을 공유한다. 상기 11B2 단편은 또한 (마우스) IL12B 인터루킨 유전자에 인접한다. 그러므로 STAR3 및 마우스 11B2 단편은 엄격하게는 파라로그로 정의된다. STAR 활성이 마우스 및 인간 게놈에서 높은 서열 보존의 영역들 사이에서 공유한다는 가설을 시험하기 위하여, 마우스에서 보존된 서열을 갖는 인간 STAR 중 하나, STAR18는 매우 자세하게 분석되고 있다. 본래의 STAR18 크론으로 탐지되는 마우스 게놈에서의 서열 보존은 약 500 염기쌍에 대하여 인간 염색체 2에서 왼쪽 방향으로 확장된다(도 22; 왼쪽 및 오른쪽은 염색체 2의 암스(arms)의 표준 기술에 관련한다). 이 실시예에서 본 발명자들은 서열 보존의 영역이 본래의 클론보다 길이가 확장되는, 인간에서의 "자연적으로 발생하는" STAR 요소를 정의하는 가를 검사한다. 본 발명자들은 또한 이 STAR 요소의 STAR 기능이 마누스 및 인간 사이에서 보존되는 가를 검사한다.

재료 및 방법

STAR18 주위의 마우스/인간 서열 보존의 영역은 세 개의 단편으로, PCR 증폭에 의하여 인간 BAC 클론 RP11-387A1로부터 회수되었다: 전체 영역(프라이머 E93 및 E94), 왼쪽방향 반쪽(프라이머 E93 및 E92), 및 오른쪽방향 반쪽(프라이머 E57 및 E94). 상동의 마우스 영역으로부터 상응하는 단편은 동일한 양식(개별적으로, 프라이머 E95 및 E98, E95 및 E96, E97 및 E98)에서 BAC 클론 RP23-400H17로부터 회수되었다. 모든 단편은 pSelect 벡터로 클로닝되고, U-2 OS/Tet-Off/LexA-HP1 세포주(상기)로 트랜스펙션되었다. 트랜스펙션에 이어서, 하이그로마이신 선별은 트랜스펙션된 세포에 대하여 선별하도록 수행되었다. LexA-HP1 단백질은 독시시클린 농도를 낮추는 것으로 유도하고, 항생물질 제오신을 견디는 트랜스펙션된 세포의 능력(STAR 활성의 측정)은 세포 성장을 관찰하는 것으로 사정되었다.

결과

본래 STAR18 클론은 Sau3AI 소화된 인간 DNA로부터 단리되고, 제오신 내성 유전자의 침묵을 방해하는 능력을 기초로 pSelect 벡터로 결찰되었다. 마우스 유전자를 갖는 인간 STAR18 클론(497 염기쌍)의 선형은 오소로그한 인간 및 마우스 STAR18 영역 사이에서 높은 서열 유사성(72%)을 드러냈다. 이것은 또한 클로닝된 영역의 왼쪽 말단을 정의하는 Sau3AI 부위의 왼쪽방향에 직접한 488 염기쌍에 대하여 확장하는 영역에서 높은 유사성(73%)으로 나타냈다(도 22). 이들 영역 외부로 인간 및 마우스 DNA 사이의 서열 유사성은 60% 이하로 떨어진다.

도 22에서의 나타내는 바와 같이, 인간 및 마우스 STAR18 요소 모두는 lexA-HP1 억제자 단백질을 발현하는 숙주세포가 제오신에서도 생존하게 한다. 본래 497 염기쌍 STAR18 클론 및 그것의 마우스 오소로그 모두는 성장할 수 있게 된다(도 22, a 및 d). 양쪽 게놈으로부터의 높은 유사성의 인접한 488 염기쌍 영역은 또한 성장할 수 있게 되고, 사실상 그것들의 성장 표현형은 본래 STAR18 클론의 것보다 더욱 활발하다. 서열 유사성의 전체 영역이 시험되는 경우에, 마우스 및 인간 모두 로부터의 이들 DNAs는 성장하게 하고, 성장 표현형은 두 하위-단편보다 더욱 활기차다(도 22, c 및 f). 이들 결과는 사람 STAR18의 STAR 활성이 마우스로부터 그것의 오소로그에서 보존된다는 것을 예증한다. 이들 오소로그한 영역 사이에서 높은 서열 보존은 그것들이 단백질-코드하는 서열이 아니기 때문에 특히 주목할만하고, 그것들이 돌연변이를 통하여 그것들의 진화론적인 다양성을 방해하는 어떤 조절 기능을 갖는다는 결론을 이끈다.

이 분석은 본래의 스크린 프로그램에 의해 동정되는 클로닝된 STAR 요소는 어떤 경우에 부분적인 STAR 요소를 나타낼 수 있고, 그것들이 심어져 있는 게놈 DNA의 분석은 더 강한 STAR 활성을 갖는 서열을 동정할 수 있다.

실시예 21. 특징적인 DNA 서열 모티브를 함유하는 STAR 요소

STAR 요소는 트랜스유전자 발현에 관하여 그것들의 항-억제 표현형을 기초로 하여 단리된다. 이 항-억제 표현형은 STAR 요소와 연관된 염색질 형성을 조절하는 잠재적인 생화학적인 공정을 반영한다. 이들 공정은 전형적으로 서열-특이적이고 단백질 결합 또는 DNA 구조로부터 초래된다. 이것은 STAR 요소가 DNA 서열 유사성을 공유할 것이라고 제안한다. STAR 요소 사이의 서열 유사성의 동정화는 서열 모티프를 제공할 것이고, 기능적인 스크린 및 시험에 의해 이미 동정되고 있는 요소의 특징이다. 서열 모티브는 또한 이 명세서의 청구항에 일치하는 신규한 STAR 요소의 기능을 알리고 주장하는 데에 유용할 것이다. 상기 기능은 진핵생물 숙주세포에서 발현된 트랜스유전자의 안정성 및 개량된 수율을 포함한다.

STAR 요소의 특징을 나타내는 서열 모티브를 동정하는 다른 이점은 하기를 포함한다: (1) 게놈 데이타베이스에서 신규한 STAR 요소의 예측 및 동정화를 위한 조사 모티프의 제공, (2) 상기 요소의 변형에 대한 논리적 근거의 제공, 및 (3) STAR 활성의 기능적인 분석을 위한 정보의 제공. 생물정보학의 사용으로, STAR 요소 사이의 서열 유사성은 동정되고 있다; 결과는 이 실시예에서 나타낸다.

생물정보학 및 통계학적인 배경. 조절 DNA 요소는 전형적으로 서열-특이적인 DNA-결합 단백질과의 상호작용을 통하여 기능한다. 동정된 조절 성질을 갖지만 상호작용하는 단백질은 알려지지 않은 STAR 요소와 같은 DNA 요소의 생물정보학적인 분석은 서열 모티프의 동정화를 위한 통계학적인 접근을 필요로 한다. 이것은 참고 서열(예를 들어, 완전한 인간 게놈)에 비교된 조절 DNA 요소(예를 들어, STAR 요소)의 세트에서 과잉 표현되는, 짧은 DNA 서열 패턴을 탐지하는 방법에 의하여 성취될 수 있다. 상기 방법은 각각의 조절 요소에서 패턴의 관찰된 그리고 예상된 발생수는 참고 서열에서 각 패턴의 관찰된 발생수로부터 계산된다.

DNA 서열 패턴은 주어진 길이, 예를 들어 6개의 염기쌍의 올리고뉴클레오티드일 수 있다. 가장 간단한 분석에서, 네 개의 뉴클레오티드(A, C, G 및 T)에 의해 구축된 6개의 염기쌍 올리고뉴클레오티드(헥사머)의 경우, 4^6=4096개의 별개의 올리고뉴클레오티드(AAAAAA에서부터 TTTTTT로부터의 모든 조합)가 있다. 조절 및 참고 서열이 완전히 무작위적이고 A, C, G 및 T 뉴클레오티드의 동등한 비율을 갖는다면, 각 헥사머의 예상되는 빈도는 1/4096(~0.00024)일 것이다. 하지만, 참고 서열에서 각 헥사머의 실제 빈도는 G:C 염기쌍 등의 함량에서 경향에 따라서 전형적으로 다르다. 그러므로, 참고 서열의 각 올리고뉴클레오티드의 빈도는 계산에 의하 여 실험적으로 결정되고 패턴에 대한 "빈도표"를 만든다.

참고 서열의 패턴 빈도표는 조절 요소 세트에서 각 페턴의 예상되는 발생빈도를 계산하는 데에 사용된다. 예상되는 빈도는 상기 패턴의 관찰되는 발생빈도와 비교된다. 상기 세트에서 "과잉-표현된" 패턴은 동정된다; 예를 들어, 헥사머 ACGTGA는 서열의 20 킬로염기쌍에서 5번 발생하는 것으로 예상되지만 15번 관찰된다면, 3배 과잉-표현된 것이다. 상기 헥사머의 서열 패턴의 15번의 발생 중 10번은 상기 요소가 전체 게놈에서와 같이, 동일한 헥사머 조성물을 가졌다면, 조절 요소라고 예상될 수 없을 것이다. 과잉-표현된 패턴이 동정되면, 통계학적인 시험은 그것들의 과잉-표현이 중요한 것인지 아니면 우연한 것인지를 결정하는 데에 응용된다. 이 시험을 위해, 중요 목록, "sig"이 각 패턴에 대하여 계산된다면, 중요 목록은 각 패턴의 발생 개연성으로부터 유도되고, 이항식 분포에 의해 추정된다. 개연성은 가능한 패턴의 수(헥사머에 대한 4096)를 계산하게 한다. 가장 높은 sig값은 가장 과잉표현된 올리고뉴클레오티드에 상응한다(van Helden et al., 1998). 실질 용어에서, sig >= 0를 갖는 올리오뉴클레오티드는 과잉-표현된 것으로 간주된다. sig >= 0를 갖는 패턴은 조절 요소 서열의 세트에서 한번의 기회(=10^0)에 기인한 과잉-표현된 것일 가능성이 있다. 하지만, sig >= 1에서 패턴은 10개(=10^1)의 서열 세트 중 한 번 과잉-표현된 것으로 예상되고, sig >= 2는 100개(=10^2) 서열 세트 중 한 번으로 예상된다. 조절 요소 세트에서 현저하게 과잉-표현되는 패턴은 조절 요소 서열의 분류화 및 예측을 위한 모형을 개발하는 데에 사용된다. 이것은 구별식 분석, 소위 종래의 기술분야에서 알려진 기술 중 하나인 통계적인 분류화의 " 감독된" 방법을 이용한다(Huberty, 1994). 구별식 분석에서, 알려진 또는 분류화된 항목(예를 들어, STAR 요소)은 특정 변수(예를 들어, 헥사머와 같은 서열 패턴)를 기초로 하여 이들 항목을 인식하는 모형을 처리하는 데에 사용된다. 처리된 모형은 다른 항목이 알려진 항목(예를 들어, DNA 서열이 STAR 요소이다)의 세트에 속하는 것으로 분류될 것인지를 예상하는 데에 사용된다. 이 실시예에서, 처리 세트에서 알려진 항목은 STAR 요소(양성 처리 세트)이다. 그것들은 STAR 요소로 동일한 길이를 갖는 게놈(음성 처리 세트)로부터 무작위적으로 선별된 서열과 대조된다. 구별법 분석은 양성을 구별하는 변수의 세트에 기초된 음성으로부터 양성을 구별하기 위한 척도를 설립한다; 이 실시예에서, 상기 변수는 현저하게 과잉-표현된 패턴(예를 들어, 헥사머)이다.

과잉-표현된 패턴의 수가 처리 세트의 크기에 높게 비교되는 경우, 모형은 과잉-처리에 기인하여 치우치게 될 수 있었다. 과잉-처리는 변수의 단계별 선별을 적용하는 것으로 피하여진다(Huberty, 1994). 단계별 구별법 분석의 목표는 양성 및 음성 사이의 최대 구별을 제공하는 변수의 최소의 수를 선별하는 것이다. 모형은 양성 및 음성 처리 세트에서 항목을 적절하게 분류화하는 그것들의 능력에 대한 하나씩 변수를 평가하는 것으로 처리된다. 이것은 모형에 신규한 변수의 첨가가 모형의 예측력을 현저하게 증가시키지 않을 때까지(즉, 분류화 과오 비율이 최소화될 때까지) 이루어진다. 이 최적화된 모형은 "신규한" 항목이 양성 또는 음성인지를 예측하기 위하여, 시험하는 데에 사용된다(Huberty, 1994).

DNA 서열과 같은 복합체 항목의 경우, 양성 처리 세트의 어떤 요소는 음성으 로 분류화될 것이고(가성 음성) 그리고 음성 처리 세트의 어떤 요소는 양성으로 분류화될 것이다(가성 양성)라는 분류화 통계에서 타고난 것이다. 처리된 모형은 신규한 항목을 시험하는 데에 적용되는 경우, 잘못된 분류화의 동일한 유형은 발생하는 것으로 예상된다. 여기서 기재된 생물정보학적인 방법에서, 첫 번째 단계, 패턴 빈도 분석은 현저하게 과잉-표현된 패턴의 더 작은 세트(예를 들어, 100개의 헥사머)에 대한 서열 패턴의 큰 세트(예를 들어, 4096개의 헥사머)를 감소시킨다; 두 번째 단계에서, 단계별 구별법 분석은 최대의 구별력을 갖는 그것들의 서브세트에 대한 과잉-표현된 패턴의 세트를 감소시킨다(예를 들어, 5-10 헥사머)그러므로, 이 접근은 STAR 요소과 같이 조절 DNA 요소를 동정하기 위한 간단하고 강건한 척도를 제공한다.

DNA-결합 단백질은 그것들이 차지하는 결합 부위의 유형을 기초로 하여 식별될 수 있다. 어떤 것은 이웃한 서열을 인식한다; 이 단백질의 유형인 경우, 길이 6개의 염기쌍(헥사머)의 올리고뉴클레오티드인 패턴은 생물정보학적인 분석에 대하여 효과적이다(van Helden et al., 1998). 다른 단백질은 서열 이분염색체과 결합한다: 접촉은 고정된 폭의 비-보존된 영역에 의해 분리된, 고도로 보존된 트리뉴클레오티드의 이분염색체 사이에 만들어진다(van Helden et al., 2000). 이분염색체-결합 단백질에 의하여 결합될 수 있는 STAR 요소에서의 서열을 동정하기 위하여, 빈도 분석은 또한 이 패턴의 유형에 대하여 실시되고, 두 개의 트리뉴클레오티드 사이의 공간은 0 내지 20으로 다양하였다(즉, XXXN{0-20}XXX, X는 트리뉴클레오티드를 구성하는 특정 뉴클레오티드이고, N은 길이상 0 내지 20 염기쌍의 무작위 뉴 클레오티드이다). 이분염색체 빈도 분석의 결과는 또한 상기한 바와 같이 선형 구별법 분석에 사용된다.

재료 및 방법

원본 특허 출원에 기재된 유전자 스크린을 사용하여, 66개의 STAR 요소는 초기에 인간 게놈 DNA로부터 단리되고, 상세하게 특성화된다(표 6). 스크린은 인간 게놈 DNA의 Sau3AI 소화에 의해 구성되고, 태반(Clontech 6550-1)으로부터 정제되거나 또는 박테리아/P1 (BAC/PAC) 인공 염색체를 수행하게 된다. BAC/PAC 클론 염색체 1(클론 RP1154H19 및 RP3328E19)으로부터의, 유사 유전자(클론 RP1167F23, 1170019 및 RP11387A1)의 HOX 클러스터로부터의 또는 인간 염색체 22(Research Genetics 96010-22)으로부터의 게놈 DNA를 함유한다. DNAs 크기-분류되고, 0.5-2kb 크기 분획은 표준 기술(Sambrook et al., 1989)을 사용하여, BamHI-소화된 pSelect 벡터로 결찰되었다. 낮은 독시시클린 농도에서 제오신에 내성을 수여하는 인간 게놈 DNA를 함유하는 pSelect 플라스미드는 Escherichia coli에서 단리되고, 증식된다. 표 6의 STAR 요소를 산출하는 스크린은 인간 게놈의 대략 1-2%를 평가한다.

이들 66개의 플라스미드에서의 인간 게놈 DNA 삽입물은 제조업체의 지침서를 사용하여, Beckman CEQ2000 자동화 DNA 서열화기를 이용하는 디데옥시 방법(Sanger et al., 1977)에 의하여 서열화되었다. 간략하게는, DNA는 QIAprep Spin Miniprep 및 Plasmi Midi Kits(개별적으로, QIAGEN 27106 및 12145)을 사용하여 E. coli로부터 정제되었다. 사이클 서열화는 염료 종결자(CEQ Dye Terminator Cycle Sequencing Kit, Beckman 608000)의 존재하에서, pSelect 벡터(프라이머 D89 및 D95, 표 5)에 상응하는 주문한 올리고뉴클레오티드를 사용하여 수행하였다. 회합된 STAR DNA 서열은 BLAT(Basic Local Alignment Tool(Kent, 2002); http://genome.ucsc.edu/cgi-bin/hgGateway; 표 6)를 사용하여 인간 게놈(2001년 8월 및 12월에 형성한 데이타베이스)에 위치되었다. 총량에서 화합한 STAR 요소는 1.3 킬로염기쌍의 평균 길이를 갖는, 85.6 킬로염기쌍을 포함한다.

인간 게놈 DNA에서 STAR 요소를 식별하는 서열 모티프는 하기(도식적인 도표을 위한 도 23 참조)와 같이, 두 단계 공정을 사용하는 생물정보학적인 분석으로 동정되었다. 분석은 두 개의 입력 데이타세트를 갖는다:(1) STAR 요소의 DNA 서열(STAR1-STAR65은 사용되었다; 표 6); 및 (2) 인간 게놈의 DNA 서열(그것의 큰 크기에 기인하여 포함할 가능성이 없는, 염색체 1을 제외한; 이분염색체 분석을 위해 인간 게놈 DNA 서열(~27Mb)의 무작위 서브세트가 사용되었다).

패턴 빈도 분석. 분석에서의 첫 번째 단계는 RSA-Tools 소프트웨어(Regulatory Sequence Analysis Tools; http://www.ucmb.ulb.ac.be/bioinformatics/rsa-tools/; 참고문헌(van Helden et al., 1998, van Helden et al., 2000, van Helden et al., 2000))를 사용하여 하기 정보를 결정하였다: (1) 인간 게놈에서의 모든 이분염색체 및 헥사머 올리고뉴클레오티드의 빈도; (2) 65개의 STAR 요소에서 올리고뉴클레오티드 및 이분염색체의 빈도; 및 (3) 게놈에 비교된 STAR 요소에서 과잉-표현된 그것들의 올리고뉴클레오티드 및 이분염색체의 중요 목록. 대조군 분석은 표 6의 STAR 요소의 길이에 부합하는 인간 게놈(즉, 2689 x 10^3 킬로염기쌍)으로부터 무작위로 선별된 65개의 서열 로 이루어졌다.

구별식 분석. 과잉-표현된 올리고뉴클레오티드 및 이분염색체는 선형 구별법 분석에 의한 STAR 요소의 예측을 위한 모형을 처리하도록 사용되었다(Huberty, 1994). 변수의 전-선별은 빈도 분석의 과잉-표현된 올리고 또는 이분염색체으로부터 가장 높은 개별적인 구별력을 갖는 50개의 패턴을 선별하는 것으로 수행되었다. 이들 전-선별된 변수는 단계별 선형 구별식 분석에서 처리되는 모형으로 사용되어 변수의 가장 좋은 구별식 조합을 선별하였다(Huberty, 1994). 변수 선별은 분류화 오류 비율을 최소화하는 데에 기초를 두고 있다(잘못된 음성 분류화의 퍼센트). 더구나, 예상되는 오류 비율은 무작위 서열의 대조군 세트에 동일한 구별식 접근을 응용하는 것으로 추정되었다(잘못된 양성 분류화를 최소화하는).

구별식 분석의 처리 상으로부터의 예측성 모형은 두 가지 방법으로 시험되었다. 첫 번째, 모형(처리 세트)를 생성하는 데에 사용되는 STAR 요소 및 무작위 서열은 분류화되었다. 두 번째, 19개의 후보 STAR 요소(상기와 같이 제오신 선별에 의하여 최근에 클로닝된)의 집단에서 서열은 분류화되었다. 이들 후보 STAR 요소 표 11에서 기재된다(SEQ ID:67-84).

결과

패턴 빈도 분석은 참고 서열과 같이 인간 게놈을 사용하여, 65개의 STAR 요소에서 RSA-Tools로 수행되었다. 166개의 헥사머 올리고뉴클레오티드는 전체 게놈에 비교된 STAR 요소(sig >= 0)의 세트에서 과잉-표현되는 것으로 알려졌다(표 9). 가장 현저하게 과잉-표현된 올리고뉴클레오티드, CCCCAC는 65개의 STAR 요소 중에 서 107번 발생하지만, 49번만 발생하는 것으로 예상되었다. 8.76의 유효계수를 갖는다; 다시 말하면, 그것들의 과잉-표현은 무작위 기회에 기인한 것이라는 예측가능성은 1/10^8.76, 즉, 5억분의 1이하이다.

95개의 올리고뉴클레오티드는 1보다 큰 유효계수를 가지므로 STAR 요소에서 매우 과잉-표현된다. 과잉-표현된 올리고뉴클레오티드 중에서, 그것들의 관측된 및 예상된 발생은 각각 6 및 1(올리고 163의 경우, CGCGAA, sig=0.02) 내지 133 및 95(올리고 120의 경우, CCCAGG, sig=0.49)까지의 범위이다. 예상된 발생에서의 차이는 인간 게놈의 G:C 함량과 같은 인자를 반영한다. 그러므로, 그것들의 발생수에서의 올리고뉴클레오티드 중에서 차이는 그것들의 과잉-표현보다 덜 중요하다; 예를 들면, 올리고 2(CAGCGG)는 36/9 = 4배 과잉-표현되고, 5천만분의 1의 무작위 기회에 기인하는 예측가능성을 갖는다(sig=7.75).

표 9는 또한 각각의 과잉-표현된 올리고뉴클레오티드가 발견되는 STAR 요소의 수를 나타낸다. 예를 들어, 가장 상당한 올리고뉴클레오티드, 올리고 1(CCCCAC)는 107번 발생하지만, 51개의 STAR에만 발견된다, 즉 평균적으로 STAR당 2개의 카피로 발생한다. 최소량의 올리고뉴클레오티드, 번호 166(AATCGG)는 평균적으로 STAR당 단일 카피로 발생한다(11개의 STAR에서 13번 발생); 단일-카피 올리고뉴클레오티드는 특히 더 적은 올리고의 경우 빈번하게 발생한다. 다른 극단에서, 올리고 4(CAGCCC)는 발견되는(37개의 STAR) 그것들의 STAR에서 평균적으로 3번 발생한다. 가장 넓리 퍼진 올리고뉴클레오티드는 번호 120(CCCAGG)이고, 58개의 STAR에서 발생하고(평균적으로 STAR당 2번), 최소로 넓게 퍼진 올리고뉴크레오티드는 번호 114(CGTCGC)이고, 6개의 STAR에서만 발생한다(그리고 평균적으로 STAR당 1번).

이분염색체 빈도 분성의 결과는 표 10에 주어진다. 730개의 이분염색체는 참고서열에 비교된 STAR 요소의 세트(sig >= 0)에서 과잉-표현되는 것으로 발견되었다. 가장 현저하게 과잉-표현된 이분염색체, CCCN{2}CGG는 65개의 STAR 요소 사이에서 36번 발생하지만, 단지 7번만 발생할 것으로 예상된다. 그것은 유효계수 9.31을 갖는다; 다시 말하면, 우연에 의한 그것의 과잉-표현의 개연성은 1/10^9.31이다, 즉 20억분의 1이다.

397개의 이분염색체는 1보다 큰 유효계수를 가지므로, STAR 요소에서 높게 과잉-표현된다. 과잉-표현된 이분염색체 중에서, 그것들의 관찰된 및 예상된 발생은, 개별적으로 9 및 1(번호 380, 435, 493, 640 및 665)에서 118 및 63(번호 30의 경우 (AGGN{2}GGG), sig = 4.44)까지이다.

패턴 빈도 분석에 의해 STAR 요소에서 과잉-표현되는 것으로 발견되는 올리고뉴클레오티드 및 이분염색체는 선형 구별식 분석으로 그것들의 구별력이 시험되었다. 구별식 모형은 50개의 대부분의 구별식 올리고뉴클레오티드(표 9) 또는 이분염색체(표 10) 패턴 중에서 최고의 조합의 단계별 선별에 의해 처리되었다. 상기 모형은 4(이분염색체) 또는 5개의 변수의 혼입 후 최적의 과오율을 얻었다. 올리고 분석으로부터의 구별 변수는 번호 11, 30, 94, 122 및 160이고(표 9); 이분염색체 분석으로부터의 구별 변수는 번호 73, 194, 419 및 297이다(표 10).

그 다음, 이 구별식 모형이 연습 세트 및 그것들의 연관된 무작위 서열에서 65개의 STAR 요소를 분류하기 위하여 사용되었다. 올리고뉴클레오티드 변수를 사용 하는 모형은 STAR 요소(실제 양성)로서 65개의 STAR 요소 중 46개를 분류한다; 이분염색체 모형은 실지 양성으로서 STAR 요소의 49개를 분류한다. 합하여, 상기 모형은 STAR 요소로서 65개의 STAR 요소 중에서 59개를 분류한다(91%; 도 24). 잘못된 양성 비율(STAR로 분류된 무작위 서열)은 이분염색체 모형의 경우에 7, 올리고뉴클레오티드 모형인 경우에 8, 그리고 두 모형의 혼합된 예측의 경우 13이다(20%). LDA에 의해 STAR로서 분류되지 않았던 표 6의 STAR 요소는 STAR 7, 22, 35, 44, 46 및 65이다. 이들 요소는 기능성 평가에서 항-억제자 활성을 안정화시키는 것으로 나타나고 따라서 그것들이 LDA에 의하여 STAR로서 분류되지 않는다는 사실은 그것들이 STAR 요소의 다른 분류(또는 분류들)을 나타낸다는 것을 제안한다.

그 다음, 상기 모형은 표 11에 기재된 시험 세트에서 19개의 후보 STAR 요소를 분류화하는 데에 사용되었다. 상기 이분염색체 모형은 STAR 요소로서 이들 후보 STAR의 12개를 분류화하고, 상기 올리고뉴클레오티드 모형은 STAR로서 14개를 분류화한다. STAR 요소로 분류화된 후보물질의 조합된 수는 15(79%)이다. 이것은 65개의 STAR의 처리 세트로 얻어지는 것보다 분류의 더 낮은 비율이다; 이것은 두 개의 이유로 예상된다. 첫번째, 구별식 모형은 표 6의 65개의 STAR로 처리되었고, 이 처리 세트에 기초한 구별하는 변수는 시험 세트에서 더 잘 나타내지는 않을 것이다. 두번째, 시험 세트에서 후보 STAR 요소는 인 비보 기능의 관점에서 완전히 특성화되지는 않고, 단지 약한 향-억제 성질을 갖는 요소를 포함할 수 있다. 이 분석은 STAR 요소의 생물정보학적인 분류에 대한 통계학적인 접근의 힘을 예증한다. 상기 STAR 요소는 전체적으로 인간 게놈에 비교하여 현저하게 과잉-표현된 많은 이분염 색체 및 헥사머성 올리고뉴클레오티드 패턴을 함유한다. 이들 패턴은 STAR 활성을 수여하는 단백질에 대한 결합 부위를 나타낼 수 있다; 어떤 경우에 그것들은 STAR 요소 서열을 인식하는 데에 사용될 수 있는 서열 모티프의 세트를 형성한다.

구별식 분석에 의하여 STAR 요소를 인식하도록 이들 패턴을 사용하여, 본 발명의 유전자 스크린에 의하여 얻어진 요소의 높은 비율은 사실상 STAR로서 분류화된다. 이것은 내재하는 서열 및 이들 요소 중에서 기능적인 유사성을 반영한다. 여기서 기재된 방법(패턴 빈도 분석에 이은 구별식 분석)의 상당한 관점은 반복되어질 수 있다는 것이다; 예를 들어, 하나의 처리 세트로 표 6의 66개의 STAR 요소를 갖는 표 11의 19개의 후보 STAR 요소를 포함하는 것으로, 개량된 구별식 모형은 처리될 수 있다. 이 개량된 모형은 STAR로서 다른 후보 조절 요소를 분류화하도록 사용될 수 있다. 생물정보학적인 분석의 반복으로 화합된, 본 발명의 방법을 사용하는 게놈 서열의 대용량 인 비보 스크린은 게놈이 그것의 전체에서 스크리닝되면서 점근선적으로 요소의 100% 인식 및 예측에 접근하는 STAR 요소를 구별하는 수단을 제공할 것이다. STAR 기능의 이들 엄격한 그리고 포괄적인 예측은 모든 인간 STAR 요소가 인식되고, 개량된 트랜스유전자 발현에서의 사용을 가능하게 하는 것을 보증할 것이다.

실시예 22. Arabidopsis thaliana로부터 STAR 요소의 클로닝 및 특성화

트랜스유전자 침묵은 전사의 및 전사후의 수준 모두에서 트랜스제닉 식물에 발생한다(Meyer, 2000, Vance & Vaucheret, 2001). 둘 중 하나의 경우에, 트랜스유전자 발현의 원하는 결과는 침묵에 의하여 손상될 수 있다; 트랜스유전자의 낮은 발현 및 불안정성은 원하는 특색의 약한 발현(예를 들어, 페스트 내성) 또는 제조합 단백질의 낮은 수율을 나타낸다. 그것은 또한 약한 예측가능성을 나타낸다: 생물공학적으로 유용한 수준에서 트랜스유전자를 발현하는 트랜스제닉 식물의 비율은 낮고, 유익한 발현 성질을 갖는 그것들에 대한 형질전환된 개체의 노동적이고 많은 비용이 드는 스크린이 필수적이다. 이 실시예는 트랜스제닉 식물에서 전사 트랜스유전자 침묵을 방해하는 데에서의 사용을 위한 쌍떡잎 식물 Arabidopsis thaliana의 게놈으로부터 STAR 요소의 단리를 기재한다. Arabidopsis는 잘 연구된 모형 유기체이기 때문에 이 실시예를 위해 선별되었다: 그것은 조밀한 게놈을 갖고, 유전자의 및 제조합 DNA 조작으로 다루기 쉽고, 그것의 게놈은 서열화되어 있다(Bevan et al., 2001, initiative, 2000, Meinke et al., 1998).

재료 및 방법:

게놈 DNA는 기재된 바와 같이 Arabidopsis thaliana ecotype Columbia로부터 단리되고(Stam et al., 1998) 그리고 MboI로 부분적으로 소화된다. 소화된 DNA는 아가로스 젤 전기연동 및 젤로부터 정제(QIAquick Gel Extraction Kit, QIAGEN 28706)에 의하여 0.5-2 킬로염기쌍으로 크기-분류되고, pSelect 벡터(상기)로 결찰된다. U-2 OS/Tet-Off/LexA-HP1 세포주로의 트랜스펙션 및 낮은 독시시클린 농도에서의 제오신 내성에 대한 선별은 기재된 바와 같이 수행되었다. 플라스미드는 제오신 내성의 클로니로부터 단리되고 U-2 OS/Tet-Off/LexA-HP1 세포주로 재-트랜스펙션되었다.

재-트랜스펙션에서 제오신 내성을 수여한 Arabidopsis 게놈 DNA 단편의 서열 화는 기재된 바와 같이 수행되었다. DNA 서열은 BLAST 분석((Altschul et al., 1990); URL http://www.ncbi.nlm.nih.gov/blast/Blast)에 의하여 Arabidopsis 게놈의 서열에 비교하였다.

STAR 활성은 역전사 PCR(RT-PCR)에 의해 재조합 숙주세포에서 하이그로마이신- 및 제오신-내성 유전자에 대한 mRNA 수준을 측정하는 것으로 추가로 시험되었다. U-2 OS/Tett-Off/LexA-HP1 세포주의 세포는 Arabidopsis STAR 요소, Drosohila scs 요소를 함유하는, 또는 삽입물을 포함하지 않는 pSelect 플라스미드로 트랜스펙션되었다. 이들은 높은 독시시클린 농도에서 2주동안 하이그로마이신에서 배양된 다음, 독시시클린 농도는 0.1ng/㎖로 낮아지게 하여 lexA-HP1 억제자 단백질을 유도하였다. 10일 후, 총 RNA는 제조업체에 의해 기재된 바와 같이 RNeasy mini kit(QIAGEN 74104)로 단리되었다. 첫번째 스트랜드 cDNA 합성은 제조업체에 의하여 기재된 바와 같이 올리고(dT)18 프라이머를 사용하는 RevertAid Fist Strand cDNA Synthesis kit(MBI Fermentas 1622)를 사용하여 수행되었다. cDNA의 부분표본은 프라이머 D58 및 D80(제오신 마커인 경우), 및 D70 및 D71(하이그로마이신 마커인 경우), 및 Taq DNA 폴리머라제(Promega M2661)을 사용하는 PCR 반응에서 주형으로서 사용되었다. 반응 조건은 94℃에서 1분, 54℃에서 1분, 및 72℃에서 90초의 15-20사이클이다. 이들 조건은 투입 RNA 및 PCR 생성물 DNA 사이의 선형 관계를 나타낸다. PCR 생성물은 아가로스 젤 전기연동으로 결정되고, 제오신 및 하이그로마이신 띠는 주형으로 정제된 pSelect 플라스미드를 갖는 상기와 같이 생성된 PCR 생성물을 사용하여, 기재된 바(Sambrook et al., 1989)와 같이 서던 블로팅으로 탐지되었 다. 제오신 및 하이그로마이신 시그널의 비율은 제오신 유전자의 정상화된 발현 수준에 상응한다.

결과

pSelect 벡터에서의 Arabidopsis 게놈 DNA의 라이브러리는 삽입이 수행된 80%의 E. coli에서 69,000개의 최초 클론을 포함한다. 평균 삽입 크기는 대략 1000 염기쌍이었다; 그러므로 라이브러리는 Arabidopsis 게놈의 대략 40%를 나타낸다.

이 라이브러리의 부분(Arabidopsis 게놈의 약 16%를 표현하는)은 U-2 OS/Tet-Off/LexA-HP1 세포주로 트랜스펙션되었다. 하이그로마이신 선별은 트랜스펙턴트를 단리시키고, 27,000개의 생존하는 클로니를 나타내었다. 이들은 낮은 독시시클린 농도에서 제오신 선별하게 되었다. 56개의 제오신-내성 클로니로부터의 추정 STAR-함유 플라스미드는 E. coli로부터 해방되고, U-2 OS/Tet-Off/LexA-HP1 세포로 재-트랜스펙션되었다. 이들 플라스미드 중 44개(시험된 플라스미드의 70%)는 낮은 독시시클린 농도에서 숙주세포에서 제오신 내성을 수여하고, 플라스미드가 STAR 요소를 가지고 있는 것을 예증한다. 이것은 인간 U-2 OS 세포에서 pSelect 스크린이 식물 게놈 DNA로부터 STAR 요소의 탐지에서 매우 효능적이라는 것을 나타낸다.

이들 44개의 후보 STAR 요소는 DNA 서열은 결정되었다. 그들 중 35개는 Arabidopsis 핵 게놈 서열의 데이타베이스에서 단일 유전자좌로서 동정되었다(표 12; SEQ ID:85 - SEQ ID:119). 다른 4개는 엽록체 게놈으로부터 유래되는 것으로 동정되었고, 4개는 두개의 유전자좌로부터 DNA 단편의 키메라이었고, 하나는 Arabidopsis 게놈 데이타베이스에서 발견되지 않았다.

클로닝된 Arabidopsis STAR 요소의 세기는 RT-PCR 평가를 사용하여, 제오신-내성 유전자의 전사적인 억제를 방해하는 그것들의 능력을 사정하는 것으로 시험되었다. 샘플 중에서 RNA 도입을 위한 대조군으로서, 각각의 STAR 트랜스펙션에 대한 하이그로마이신-내성 유전자의 복사 수준은 또한 사정되었다. 이 분석은 Arabidopsis STAR 요소 중 12개에 대하여 수행되었다. 결과(도 25)는 Arabidopsis STAR 요소가 전사 억제로부터 제오신-내성 유전자를 보호하는 그것들의 능력에서 Drosophila scs 요소(양성 대조군) 및 빈 벡터("SV40"; 음성 대조군)에 대하여 뛰어나다는 것을 예증한다. 특히, STAR-A28 및 STAR-A30은 lexA-HP1 억제자가 발현되는 경우에, scs 요소(하이그로마이신-내성 유전자 mRNA의 내부 대조군에 정상화되는)보다 제오신-내성 유전자 발현의 2-배 높은 수준을 가능하게 한다. 이들 결과는 본 발명의 방법이 인간보다 다른 종의 게놈으로부터 STAR 요소의 회복에 성공적으로 응용될 수 있다는 것을 예증한다. 식물로부터의 STAR 요소에 대한 그것의 성공적인 응용은 그것이, 본 발명의 방법이 응용될 수 있는 넓은 분류학적인 범위를 예증하기 때문에 그리고 식물이 생물공학적인 개발의 상당한 표적이기 때문에 특히 중요하다.

표 1. 트랜스유전자 발현을 개량한 STAR 요소

플라스미드	과잉-발현된 클론, %	폴드 과잉-발현(범위)	클론수
빈	12	3-11	25
SCS(양성 대조군)	24	3-160	21
STAR-6	62	2-200	26
STAR-3	39	5-820	23
STAR-8	63	7-315	19
STAR-4	31	25-1500	13
STAR-1	57	5-80	23

루시페라제 리포터 유전자의 발현은 STAR 요소(Drosophila로부터의 SCS, 양성 대조군 요소를 포함하는)을 함유하는 또는 함유하지 않은("빈", 음성 대조군), 통합된 pSDH 플라스미드를 함유하는 세포주에서 측정된다. 음성 대조군의 평균 발현 수준은 참고 수준으로 정의되고, 클론은 그것들의 발현 수준이 참고 수준보다 >2배인 경우에 과잉-발현으로 간주한다. 각각의 플라스미드에서 과잉-발현된 클론의 퍼센트 및 폴드 과잉-표현은 각 플라스미드에 대하여 분석된 클론수에 따라서, 보고되었다.

표 2. 클로닝된 STAR 요소

클론	염색체 위치¹	인접 유전자²	반복 서열
STAR-1	N.d.
STAR-2	N.d.
STAR-3	For 5q33.3 Rev 10q22.2	히스톤에서 Chr 10 부분 아세틸트랜스퍼라제 유전자
STAR-4	For 1p31.1 Rev 14q24.1	G-단백질 시그널링의 조절자의 10kb 인트론 안에서의 유전자 부재	83% 반복적인 LINE2 & LTR ERV_Class1
STAR-5	For 3q13.1 Rev 10q22.1^*
STAR-6	2p21	L5 kb 알려지지 않은 추정 키나제 R 20 kb 미세관 관련 단백질	19% SINE (MIR) 29% LINE
STAR-7	1q32.2		12% Alu 4% MIR(SINE) LINE 1 2.5% L31CR1 11.5% MER1 7% 낮은 복합체 2%
STAR-8	9q32	아연 핑거(finger) 단백질을 함유하는 ZFP KRAB 박스	35% ERV_ClassI (LTR) 2% 단순 반복
STAR-9	STAR4 참조
STAR-10	N.d.
STAR-11	2p25.1	단백질 억제자를 결합하는 R 15 kb 알려지지 않은 DNA(Myc 유형)	12% Alu (SINE) 26% MalRs (LINE)
STAR-12	5q35.3	R 15 kb 알려지지 않은 TS2 집단 메탈로 프로테이나제	3% 낮은 복합도
STAR-13	STAR4 및 9 참조
STAR-14	F N.d. R 20q13.33
STAR-15	1p36.36	L 6 kb Voltage-gated K 채널 서브유니트 R 4 kb 알려지지 않은	14% LTR (MaLRs)
STAR-16	F 8p23.1 R 8p22 etc.		서열화된 부분에서 비-반복
STAR-17	2q31.1	L 6 kb BTEB1 전사 인자 R 40 kb HNRNP	10% 단순 및 낮은 복합도

¹염색체 위치는 인간 게놈 데이타베이스에 대하여 STAR 클론으로부터 DNA 서열 데이타의 BLAST 조사에 의하여 결정된다. 상기 위치는 각 염색체의 세포유전학적인 표의 문자로 인용되는 표준 명명법에 따라서 주어졌다; 예를 들어, 1p2.3은 염색체 1의 짧은 암(arm)의 두번째 세포유전학적인 밴드의 세번째 세포유전학적인 서브밴드이다(http://WWW.ncbi.nlm.nih.gov/Class/MLACourse/Genetics/chrombanding. html). F, 순행 서열화 반응 결과; R, 역행 서열화 반응 결과. N.d., 결정되지 않음.

²인간 게놈 맵 View Build 22 (http://www.ncbi.nlm.nih.gov/cgi-bin/Entrez/hum_srch?chr=hum_chr.inf&query April 2001)에 기초하였다. L, 왼쪽; R, 오른쪽.

^*위치 모호, 여러번의 적중(hit)

표 3. pSS 벡터에서 선별에 의한 인간 염색체 22으로부터 회복된 SINC 요소

SINC	길이(nt)	염색체 위치¹	비고
psinks 9	700	22q11.21	LTR을 함유한다; 가장 인접한 유전자 ZNF 74, RNA 결합 단백질. LTR 매우 복제적인
psinks 12	750	22q12.3	종양 형성에 관련된 아세틸글루코사미닐트랜스퍼라제형 단백질(664kb)의 인트론에 위치한다
psinks 19	600	22q13.1	뇌에서 거의 독점적으로 발현된, 칼슘 채널의 인트론에 위치한다.
psinks 28	950	22q13.31	알려지지 않은 기능의 신장 단백질의 인트론에 위치한다. SINE 요소를 포함한다.
psinks 30	700	22q13.33	SINE의 일부를 포함한다.
psinks 35	650	22q11.21	용질 담체를 위한 엑손을 덮는다(미토콘트리온을 위한 핵 유전자).

염색체 위는 인간 게놈 데이타베이스에 대하여 STAR 클론으로부터 DNA 서열 데이타의 BLAST 조사에 의해 결정된다. 상기 위치는 각 염색체의 세포유전학적인 표의 문자로 인용되는 표준 명명법에 따라서 주어졌다; 예를 들어, 1p2.3은 염색체 1의 짧은 암(arm)의 두번째 세포유전학적인 밴드의 세번째 세포유전학적인 서브밴드이다(http://WWW.ncbi.nlm.nih.gov/Class/MLACourse/Genetics/chrombanding. html).

표 4A: 하나의 스트랜드(순행) 또는 반대쪽 스트랜드(역행)에서의 다양한 STAR 요소의 서열.

표 4B: 다양한 sinc 요소의 서열

표 5. 폴리머라제 연쇄 반응(PCR 프라이머) 또는 DNA 돌연변이화에서 사용된 올리고뉴클레오티드

표 6. 게놈의 위치 및 길이를 포함하는, 본 발명의 STAR 요소

¹염색체 위치는 인간 게놈 데이타베이스에 대하여 STAR 클론으로부터 DNA 서열 데이타의 BLAST 조사에 의하여 결정된다. 상기 위치는 각 염색체의 세포유전학 적인 표의 문자로 인용되는 표준 명명법에 따라서 주어졌다; 예를 들어, 1p2.3은 염색체 1의 짧은 암(arm)의 두번째 세포유전학적인 밴드의 세번째 세포유전학적인 서브밴드이다(http://WWW.ncbi.nlm.nih.gov/Class/MLACourse/Genetics/chrombanding. html). 순행 및 역행 서열화 반응이 다른 게놈의 유전자좌로부터 DNAs를 동정하는 경우에, 양쪽 유전자좌 모두 보여진다.

²정확한 길이는 DNA 서열 분석에 의하여 결정되어진다; 대략의 길이는 제한 맵핑으로 결정된다.

³STAR3의 서열 및 위치는 표 2 및 표 4의 회합으로 순화되어진다.

⁴표 2 및 표 4에서의 이들 번호를 갖는 STAR는 제외되고(이후로 "oldSTAR5"로 간주됨) 그리고 그들의 번호는 DNA 서열 부록에 보여진 STAR 요소에 부여된다. oldSTAR5, oldSTAR14 및 oldSTAR16인 경우에, 클로닝된 DNAs는 두 개의 염색체 위치이상으로부터 키메라이었다; oldSTAR9 및 oldSTAR 13의 경우에, 클로닝된 DNAs는 STAR4에 동일하였다.

⁵표 4"STAR18"에 동일함.

표 7. 트랜스유전자 발현에서 기간을 통해서 안정성을 전달하는 STAR 요소¹

	세포 분화²	루시페라제 발현³
STAR6 플러스 퓨로마이신	42	18,000
	60	23,000
	84	20,000
	108	16,000
퓨로마이신이 없는 STAR6⁴	84	12,000
	108	15,000
	144	12,000

¹플라스미드 pSDH-Tet-STAR6는 U-2 OS 세포로 트랜스펙션되었고, 클론은 단리되고 실시예 1에서 기재된 바와 같이 독시시크린이 없는 배지에서 배양되었다. 세포는 1:20의 희석으로 매주 신선한 배양 용기에 이동되었다.

²세포 분화의 수는 1주에서 배양이 세포 집합에 도달하는 예측을 기초로 하고, ~6 세포 분화를 나타낸다.

³루시페라제는 실시예 1에서 기재된 바와 같이 평가되었다.

⁴60번의 세포 분화 후, 세포는 두개의 배양 용기에 이동되었다; 하나는 처음 60번의 세포 분화와 마찬가지로, 퓨로마이신을 함유하는 배양 배지가 공급되었고, 두번째 것은 항생물질이 결여된 배양 배지가 공급되었다.

표 8. 인간 STAR 요소 및 그것들의 추정 마우스 오소로그 및 파라로그

¹인간 게놈에서의 STAR 요소의 세포유전학적인 위치

²마우스 게놈에서 STAR 요소 오소로그의 세포유전학적인 위치

³높은 서열 유사성을 나타내는 영역의 길이 및 퍼센트 유사성. 어떤 경우에는 높은 유사성의 한 블록(block)이상이 발생한다; 그러한 경우에, 각 블록은 분리되어 기재된다. 유사성<60%은 중요하게 간주되지 않는다.

표 9. STAR 요소에서 과잉-표현된 올리고뉴클레오티드 패턴(6개의 염기쌍).

패턴은 유효계수에 따라서 등급되어진다. 이것들은 참고로서 인간 게놈의 서열을 갖는 RSA-Tools를 사용하여 결정된다. 선형 구별식 분석에서 가장 구별식 변수를 포함하는 패턴은 별표로 표시되었다.

표 10. STAR 요소에서 과잉-표현된 이분염색체 패턴

패턴은 유효계수에 따라서 등급되어진다. 이것들은 참고로서 인간 게놈에서 무작위 서열을 갖는 RSA-Tools를 사용하여 결정된다. 선형 구별식 분석에서 가장 구별식 변수를 포함하는 패턴은 별표로 표시되었다.

표 11. 선형 구별식 분석에 의해 시험된 후보 STAR 요소.

¹염색체 위치는 인간 게놈 데이타베이스에 대하여 STAR 요소로부터 DNA 서열 데이타의 BLAT 조사에 의하여 결정된다. 상기 위치는 각 염색체의 세포유전학적인 표의 문자로 인용되는 표준 명명법에 따라서 주어졌다; 예를 들어, 1p2.3은 염색체 1의 짧은 암(arm)의 두번째 세포유전학적인 밴드의 세번째 세포유전학적인 서브밴드이다(http://WWW.ncbi.nlm.nih.gov/Class/MLACourse/Genetics/chrombanding. html). F, 순행 서열화 반응 결과; R, 역행 서열화 반응 결과. 순행 및 역행 서열화 결과가 다른 게놈 위치에 맵핑되는 경우에, 각각의 서열은 인간 게놈 데이타베이스로부터 서열 정보에 기초한 원래 클론의 전체 길이(제한 맵핑에 의하여 결정된 바와 같은)로 확장되었다.

²ND: 결정되지 않음.

표 12. 염색체 위치 및 길이를 포함하는, 본 발명의 Arabidopsis STAR 요소

참고문헌

도 1은 STAR 요소를 선별하고 특성화하기 위한 플라스미드의 pSelect 집단을 나타내는 도이다. 무차별적인 SV40 프로모터의 조절 하에서 내성 마커(제오신 또는 퓨로마이신) 또는 리포터 유전자(GFP 또는 루시페라제)는 AscI 및 HindⅢ 부위에 의해 플랭킹된 BamHI 클로닝 부위에 인접한다. 클로닝 부위의 상류는 lexA 단백질이 결합할 수 있는 lexA 작용체이다. 키메라성 lexA-Polycomb 그룹 단백질의 작용체에 대한 결합은 마커 또는 리포터 유전자의 억제를 야기한다. 억제를 차단하는 클로닝 부위에 삽입된 DNA 단편은 마커 또는 리포터 유전자의 지속적인 발현에 의해 동정된다. 플라스미드는 oriP 서열에 기인한 배양된 포유동물 세포에서 에피솜성으로 복제된다.

도 2는 STAR 요소를 시험하기 위한 플라스미드의 pSDH 집단을 나타내는 도이다. 두 개의 다중 클로닝 부위(MCSI 및 MCSⅡ)는 상류 프로모터(CMV, Tet-Off 또는 SV40)에 의하여 유도되는 발현의 리포터 유전자(GFP 또는 루시페라제)를 플랭킹한다. 시험되어지는 STAR 요소는 MCSI 및 MCSⅡ에서 삽입된다. 이들은 독특한 제한 부위(MCSI: XhoI, NotI, EcoRI 및 SalI; MCSⅡ, HindⅢ, EcoRⅤ, BglⅡ 및 NheI)를 함유한다. 플라스미드는 포유동물 세포의 게놈에서 무작위적으로 통합한 후 복제한다.

도 3은 루시페라제를 과잉-표현하는 콜론의 비율을 나타내는 도이다. U-2 OS 인간 골육종 세포는 pSDH 플라스미드(tet-off 프로모터의 조절 하에서 루시페라제 리포터 유전자를 함유하는)로 안정하게 트랜스펙션되고, 개별적인 트랜스펙션된 클 론은 단리되고 배양된다. 루시페라제 발현은 효소학적으로 측정된다. STAR가 없는 pSDH("참고 수준")를 함유하는 클론에 의한 평균 루시페라제 발현은 결정되었다. 모든 플라스미드에 대한 세트로부터의 클론은 그것들의 루시페라제 활성이 참고 수준보다 2배 이상 더 높다면 "과잉-발현하는" 것으로 평가하였다. 각각의 플라스미드에서 과잉-발현된 클론의 퍼센트는 도면에 나타내었다.

도 4는 과잉-발현되는 클론에 의한 폴드 과잉-발현을 나타내는 도이다. 게놈 DNA로 통합된 STAR-함유 pSDH 플라스미드에서 과잉-발현의 범위는 참고 수준에 의한 각각의 클론의 루시페라제 활성을 나누는 것으로 결정된다. 상당한 발현(참고 수준에 2-배이상인)을 나타내는 것들의 경우, 실제 폴드 증가는 주목되었다; 이들 데이타의 최소 및 중간값은 각각의 플라스미드에 대하여 나타낸다.

도 5는 과잉-발현되는 클론에 의한 폴드 과잉-발현을 나타내는 도이다. 게놈 DNA으로 통합된 STAR-함유 pSDH 플라스미드에서의 과잉-발현의 범위는 참고 수준에 의해 각 클론의 루시페라제 활성을 나누는 것으로 결정되었다. 상당한 발현(참고 수준에 2-배이상인)을 나타내는 것들의 경우, 실제 폴드 증가는 주목되었다; 이들 데이타의 최대값은 각각의 플라스미드에 대하여 나타낸다.

도6. SINC 요소를 선별하고 특성화하기 위한 pSS(SINC-Select) 플라스미드를 나타내는 도이다. codA::upp 자살 유전자는 프로드럭 5-플루오로시토신을 독성 약물 5-폴루오로우라실로 변환하는 단백질을 코드화한다. 더 낮아진 테트라시클린 농도에 의한 유도에서, 숙주세포는 프로드럭에 민감하게 된다. 침묵 활성을 갖는 클로닝 부위(BglⅡ-XhoI)에서 삽입된 게놈 DNA 단편은 자살 유전자의 발현을 방해할 것이고, 프로드럭 내성 콜로니의 형성을 가능하게 한다. STAR 요소는 선별 구성인자를 플랭킹하여 플라스미드의 기능적인 구성인자에 침묵된 염색질의 확산을 억제한다. 플라스미드는 oriP 서열에 기인한 배양된 포유동물 세포에서 에피솜성으로 복제한다.

도 7은 STAR 활성을 시험하는데 사용된 pSDH-CSP 플라스미드를 나타내는 도이다. 분비된 알칼리성 포스파타제(SEAP) 리포터 유전자는 CMV 프로모터의 조절 하에 있고, 퓨로마이신 내성 선별가능한 마커(puro)는 SV40 프로모터의 조절 하에 있다. 이들 두 유전자를 플랭킹하는 STAR 요소가 클로닝될 수 있는 다중 클로닝 부위이다. 플라스미드는 또한 Escherichia coli에서 증식을 위한 복제의 기원(ori) 및 앰피실린 내성 유전자(ampR)을 갖는다.

도 8은 예측가능성 및 트랜스 유전자의 수율을 개량한 STAR6 및 STAR49을 나타내는 도이다. pSDH-CSP, pSDH-CSP-STAR6 또는 pSDH-CSP-STAR49로 트랜스펙션된 CHO 세포에 의한 CMV 프로모터로부터의 SEAP의 발현은 결정되었다. STAR-함유 구성물은 더 큰 예측가능성 및 pSDH-CSP 구성물 단독에 관련된 상승된 수율을 수여한다.

도 9은 예측가능성 및 트랜스 유전자의 수율을 개량한 STAR6 및 STAR8을 나타내는 도이다. pSDH-CMV, pSDH-CMV-STAR6 또는 pSDH-CMV-STAR8로 트랜스펙션된 U-2 OS 세포에 의한 CMV 프로모터로부터의 SEAP의 발현은 결정되었다. STAR-함유 구성물은 더 큰 예측가능성 및 pSDH-CMV 구성물 단독에 관련된 상승된 수율을 수여한다.

도 10은 STAR10 및 STAR27의 최소의 실질적인 서열을 나타내는 도이다. STAR 요소의 부분은 PCR에 의한 증대되었다: STAR10는 프라이머 E23 및 E12로 증대되어 단편 10A를 산출하고, 프라이머 E13 및 E14로 증대되어 단편 10B를 산출하고, 프라이머 E15 및 E16로 증대되어 단편 10C를 산출하였다. STAR27은 프라이머 E17 및 E18로 증폭되어 단편 27A를 산출하고, 프라이머 E19 및 E20으로 증폭되어 단편 27B를 산출하고, 프라이머 E21 및 E22로 증폭되어 단편 27C를 산출하였다. 이들 하위단편은 pSelect 벡터로 클로닝되었다. U-2 OS/Tet-Off/LexA-HP1 세포로 트랜스펙션된 후, 제오신의 존재하에서 배양의 성장이 관측되었다. 성장 속도는 어떤 배양이 시험된 DNA 단편에서 STAR 활성의 부재에 기인한 제오신 처리(-)에서 생존하는 것을 실패하였지만, 활기찬(+++)에서 약한(+/-)까지 다양하였다.

도 11은 SV40 프로모터의 상황에서 STAR 요소 기능을 나타낸 도이다. pSDH-SV40 및 pSDV-SV40-STAR6은 인간 골육종 U-2 OS 세포주로 트랜스펙션되었고, 루시페라제의 발현은 퓨로마이신-내성 클론에서 STAR6에 의한 유전자 침묵으로부터 보호되거나 또는 보호되지 않은 상태에서 평가되었다.

도 12는 Tet-Off 프로모터의 상황에서 STAR 요소 기능을 나타낸 도이다. pSDH-Tet 및 pSDH-Tet-STAR6는 인간 골육종 U-2 OS 세포주로 트랜스펙션되었고, 루시페라제의 발현은 퓨로마이신-내성 클론에서 STAR6에 의한 유전자 침묵으로부터 보호되거나 또는 보호되지 않은 상태에서 평가되었다.

도 13은 STAR 요소의 배향의 도식적인 도표를 나타내는 도이고, 이 도에서는 그것들이 pSelect 벡터에서 클로닝되는 것(패널 A)을, 그것들이 그것들의 본연 배 향을 보존하기 위한 pSDH 벡터로 클로닝되는 것(패널 B)을, 그것들이 반대 배향에서 pSDH 벡터로 클로닝되는 것(패널 C)을 나타낸다.

도 14는 STAR66 기능의 방향성을 나타낸 도이다. STAR66 요소는 본연(STAR66본연) 또는 반대 배향(STAR66 반대) 중 하나에서 pSDH-Tet로 클로닝되었고, U-2 OS 세포로 트랜스펙션되었다. 루시페라제 활성은 퓨로마이신 내성 클론에서 평가되었다.

도 15는 STAR 기능의 카피수-의존도를 나타내는 도이다. pSDH-Tet-STAR10에서 루시페라제 발현 단위의 서던 블룻은 U-2 OS 게놈 DNA로 통합되었다. 방사성 루시페라제 DNA 프로브(probe)는 각 클론의 게놈에서 트랜스유전자 DNA의 양을 탐지하는 데에 사용된 다음, 포스포리메이저(phsphorimager)로 정량화되었다.

도 16은 STAR 기능의 카피수-의존도를 나타내는 도이다. 각 클론에서 pSDH-Tet-STAR10 발현 단위의 카피수는 포스포리메이저리(phosphorimagery)로 결정되고, 각 클론에서 발현된 루시페라제 리포터 효소의 활성과 비교되었다.

도 17은 인핸서-차단 및 인핸서 평가를 나타내는 도이다. 인핸서-차단 및 인핸서 활성을 대하여 STAR를 시험하기 위한 루시페라제 발현 벡터는 도식적으로 나타낸다. E47 인핸서 단백질에 대한 E-box 결합 부위는 STAR 요소에 대한 클로닝 부위의 상류이다. STAR 클로닝 부위의 하류는 인간 알칼리성 포스파타제 최소의 프로모터(mp)의 조절 하에서의 루시페라제 유전자이다. 도수 분포도는 세 가지의 가능한 실험적인 상태에 대한 예상되는 결과를 나타낸다(본문 참조). 패널 A: 인핸서-차단 평가. 패널 B: 인핸서 평가.

도 18은 인핸서-차단 평가를 나타내는 도이다. 최소의 프로모터로부터의 루시페라제 발현은 빈 벡터(벡터)에 E47/E-box에 의해 활성화된다. 인핸서-차단제(scs, HS4) 또는 STAR 요소(STAR 요소 1, 2, 3, 6, 10, 11, 18 및 27)의 삽입은 E47/E-box 인핸서에 의하여 루시페라제 활성을 차단한다.

도 19는 인핸서 평가를 나타내는 도이다. 최소의 프로모터로부터의 루시페라제 발현은 빈 벡터(E47)에 E47/E-box에 의해 활성화된다. scs 및 HS4 요소 또는 다양한 STAR 요소(STAR 1, 2, 3, 6, 10, 11, 18 및 27)의 삽입은 리포터 유전자의 전사를 활성화하지 않는다.

도 20은 SINC 요소의 단리를 위해 사용된 pSS-codA::upp 벡터를 나타내는 도이다. codA::upp 자살 유전자은 프로드럭 5-플루오로시토신을 독성 약물 5-플루오로우라실로 변환하는 단백질을 코드화한다. 낮아진 독시시클린 농도에 의한 유도에서, 숙주세포는 프로드럭에 민감하게 된다. 침묵 활성을 갖는 BglⅡ 클로닝 부위에 삽입된 게놈 DNA 단편은 자살 유전자의 발현을 방해할 것이고, 프로드럭 내성 콜로니의 형성을 가능하게 한다. STAR 요소는 선별 구성인자를 플랭킹하여 플라스미드의 기능적인 구성인자에 침묵된 염색질의 확산을 방해한다. 플라스미드는 포유동물 세포를 하이그로마이신-내성 유전자로 트랜스펙션한 후, 그리고 앰피실린-내성 유전자로 E.coli에로 형질전환한 후 선별된다. oriP 서열에 기인한 배양된 포유동물 세포에서 에피솜성으로 복제한다. 그것은 oriP 및 EBNA-1 서열에 기인한 배양된 포유동물 세포에서, 그리고 ori 서열에 기인한 E. coli에서 에피솜성으로 복제된다.

도 21은 pSS-hrGFP 플라스미드를 나타내는 도이다. 상기 pSS-hrGFP 플라스미 드는 hrGFP를 갖는 자살 유전자(녹색 형광 단백질) 및 GFP 리포터 유전자의 STAR8 하류를 갖는 STAR6의 대체를 제외하고는, pSS-codA::upp 플라스미드와 동일하다.

도 22는 마우스 및 인간 사이에 STAR18 서열 보존을 나타내는 도이다. 497개의 염기쌍 STAR18을 함유하는 인간 게놈의 영역은 보여진다(검은 박스); 요소는 인간 염색체 2에서 HOXD8 및 HOXD4 홈박스(homebox) 유전자사이에서 발생한다. 그것은 72% 서열 동일성을 공유하는 마우스 염색체 2에서의 영역으로 정렬된다. STAR18의 왼쪽에 접한 인간 염색체 2의 영역은 또한 마우스 염색체 2로 높게 보존된다(73% 동일성; 회색 박스); 이들 영역 넘어서는, 동일성은 60% 아래로 떨어진다. 분리되어 또는 조합되어, 제오신에서 성장을 수여하는, 인간 및 마우스로부터의 이들 영역의 능력은 하기로 나타낸다: -, 비성장; +, 보통의 성장; ++, 활발한 성장; +++, 빠른 성장.

도 23은 생물정보학적인 분석 작업흐름의 도식적인 도표이다. 자세한 내용은 본문 참조.

도 24는 65개의 STAR 요소의 훈련 세트의 분류에 대한 구별식 분석의 결과를 나타내는 도이다. 단계별 선형 구별식 분석(LDA)에 의하여 STAR로 정확하게 분류화되는 STAR 요소가 벤 다이어그램으로 도시된다. LDA의 변수는 헥사머성 올리고뉴클레오티드("올리고") 및 이분염색체에 대한 빈도 분석 결과로부터 선별되어진다. 상기 다이어그램은 STAR를 정확하게 분류함에 있어서 두 세트 변수의 조화를 나타낸다.

도 25는 Arabidopsis STAR 세기의 RT-PCR 평가를 나타낸 도이다. U-2 OS/Tet-Off/lexA-HP1 세포는 후보 Arabidopsis STAR 요소로 트랜스펙션되고 낮은 독시시클린 농도에서 배양된다. 총 RNA는 단리되었고 RT-PCR되었다; 제오신 및 하이그로마이신 내성 mRNAs에 상응하는 밴드는 서던 블로팅으로 탐지되었고, 포스포리메이저로 정량되었다. 하이그로마이신 시그널에 대한 제오신의 비율은 12개의 다른 Arabidopsis STAR 요소, Drosophila scs 요소에 의하여 플랭킹된, 또는 플랭킹된 요소가 없는 제오신 발현 단위를 함유하는 트랜스펙턴트에 대하여 보여준다.

도 26은 STAR1 - STAR65를 포함하는 서열(SEQ ID:1-65), STAR66 및 시험되는 세트를 포함하는 서열(SEQ ID:66-84), Arabidopsis STAR A1-A35을 포함하는 서열(SEQ ID:85-119)을 나타내는 도이다.

SEQUENCE LISTING <110> Chromagenics B.V. Otte, Arie P. Arthur, Kruckeberg L. <120> DNA sequences comprising gene transcription regulatory qualities and methods for detecting and using DNA sequences <130> P56047PC00 <140> PCT/NL02/00390 <141> 2002-06-14 <150> US 10/190,312 <151> 2002-07-05 <150> US 60/303,199 <151> 2001-07-05 <160> 1079 <170> PatentIn version 3.1 <210> 1 <211> 749 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR1 <400> 1 atgcggtggg ggcgcgccag agactcgtgg gatccttggc ttggatgttt ggatctttct 60 gagttgcctg tgccgcgaaa gacaggtaca tttctgatta ggcctgtgaa gcctcctgga 120 ggaccatctc attaagacga tggtattgga gggagagtca cagaaagaac tgtggcccct 180 ccctcactgc aaaacggaag tgattttatt ttaatgggag ttggaatatg tgagggctgc 240 aggaaccagt ctccctcctt cttggttgga aaagctgggg ctggcctcag agacaggttt 300 tttggccccg ctgggctggg cagtctagtc gaccctttgt agactgtgca cacccctaga 360 agagcaacta cccctataca ccaggctggc tcaagtgaaa ggggctctgg gctccagtct 420 ggaaaatctg gtgtcctggg gacctctggt cttgcttctc tcctcccctg cactggctct 480 gggtgcttat ctctgcagaa gcttctcgct agcaaaccca cattcagcgc cctgtagctg 540 aacacagcac aaaaagccct agagatcaaa agcattagta tgggcagttg agcgggaggt 600 gaatatttaa cgcttttgtt catcaataac tcgttggctt tgacctgtct gaacaagtcg 660 agcaataagg tgaaatgcag gtcacagcgt ctaacaaata tgaaaatgtg tatattcacc 720 ccggtctcca gccggcgcgc caggctccc 749 <210> 2 <211> 883 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR2 <400> 2 gggtgcttcc tgaattcttc cctgagaagg atggtggccg gtaaggtccg tgtaggtggg 60 gtgcggctcc ccaggccccg gcccgtggtg gtggccgctg cccagcggcc cggcaccccc 120 atagtccatg gcgcccgagg cagcgtgggg gaggtgagtt agaccaaaga gggctggccc 180 ggagttgctc atgggctcca catagctgcc ccccacgaag acggggcttc cctgtatgtg 240 tggggtccca tagctgccgt tgccctgcag gccatgagcg tgcgggtcat agtcgggggt 300 gccccctgcg cccgcccctg ccgccgtgta gcgcttctgt gggggtggcg ggggtgcgca 360 gctgggcagg gacgcagggt aggaggcggg gggcagcccg taggtaccct gggggggctt 420 ggagaagggc gggggcgact ggggctcata cgggacgctg ttgaccagcg aatgcataga 480 gttcagatag ccaccggctc cggggggcac ggggctgcga cttggagact ggccccccga 540 tgacgttagc atgcccttgc ccttctgatc ctttttgtac ttcatgcggc gattctggaa 600 ccagatcttg atctggcgct cagtgaggtt cagcagattg gccatctcca cccggcgcgg 660 ccggcacagg tagcggttga agtggaactc tttctccagc tccaccagct gcgcgctcgt 720 gtaggccgtg cgcgcgcgct tggacgaagc ctgccccggc gggctcttgt cgccagcgca 780 gctttcgcct gcgaggacag agagaggaag agcggcgtca ggggctgccg cggccccgcc 840 cagcccctga cccagcccgg cccctccttc caccaggccc caa 883 <210> 3 <211> 2126 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR3 <400> 3 atctcgagta ctgaaatagg agtaaatctg aagagcaaat aagatgagcc agaaaaccat 60 gaaaagaaca gggactacca gttgattcca caaggacatt cccaaggtga gaaggccata 120 tacctccact acctgaacca attctctgta tgcagattta gcaaggttat aaggtagcaa 180 aagattagac ccaagaaaat agagaacttc caatccagta aaaatcatag caaatttatt 240 gatgataaca attgtctcca aaggaacaag gcagagtcgt gctagcagag gaagcacgtg 300 agctgaaaac agccaaatct gctttgtttt catgacacag gagcataaag tacacaccac 360 caactgacct attaaggctg tggtaaaccg attcatagag agaggttcta aatacattgg 420 tccctcacag gcaaactgca gttcgctccg aacgtagtcc ctggaaattt gatgtccagt 480 atagaaaagc agagcagtca aaaaatatag ataaagctga accagatgtt gcctgggcaa 540 tgttagcagc accacactta agatataacc tcaggctgtg gactccctcc ctggggagcg 600 gtgctgccgg cggcgggcgg gctccgcaac tccccggctc tctcgcccgc cctcccgttc 660 tcctcgggcg gcggcggggg ccgggactgc gccgctcaca gcggcggctc ttctgcgccc 720 ggcctcggag gcagtggcgg tggcggccat ggcctcctgc gttcgccgat gtcagcattt 780 cgaactgagg gtcatctcct tgggactggt tagacagtgg gtgcagccca cggagggcga 840 gttgaagcag ggtggggtgt cacctccccc aggaagtcca gtgggtcagg gaactccctc 900 ccctagccaa gggaggccgt gagggactgt gcccggtgag agactgtgcc ctgaggaaag 960 gtgcactctg gcccagatac tacacttttc ccacggtctt caaaacccgc agaccaggag 1020 attccctcgg gttcctacac caccaggacc ctgggtttca accacaaaac cgggccattt 1080 gggcagacac ccagctagct gcaagagttg tttttttttt tatactcctg tggcacctgg 1140 aacgccagcg agagagcacc tttcactccc ctggaaaggg ggctgaaggc agggaccttt 1200 agctgcgggc tagggggttt ggggttgagt gggggagggg agagggaaaa ggcctcgtca 1260 ttggcgtcgt ctgcagccaa taaggctacg ctcctctgct gcgagtagac ccaatccttt 1320 cctagaggtg gagggggcgg gtaggtggaa gtagaggtgg cgcggtatct aggagagaga 1380 aaaagggctg gaccaatagg tgcccggaag aggcggaccc agcggtctgt tgattggtat 1440 tggcagtgga ccctcccccg gggtggtgcc ggaggggggg atgatgggtc gaggggtgtg 1500 tttatgtgga agcgagatga ccggcaggaa cctgccccaa tgggctgcag agtggttagt 1560 gagtgggtga cagacagacc cgtaggccaa cgggtggcct taagtgtctt tggtctcctc 1620 caatggagca gcggcggggc gggaccgcga ctcgggttta atgagactcc attgggctgt 1680 aatcagtgtc atgtcggatt catgtcaacg acaacaacag ggggacacaa aatggcggcg 1740 gcttagtcct acccctggcg gcggcggcag cggtggcgga ggcgacggca ctcctccagg 1800 cggcagccgc agtttctcag gcagcggcag cgcccccggc aggcgcggtg gcggtggcgc 1860 gcagccaggt ctgtcaccca ccccgcgcgt tcccaggggg aggagactgg gcgggagggg 1920 ggaacagacg gggggggatt caggggcttg cgacgcccct cccacaggcc tctgcgcgag 1980 ggtcaccgcg gggccgctcg gggtcaggct gcccctgagc gtgacggtag ggggcggggg 2040 aaaggggagg agggacaggc cccgcccctc ggcagggcct ctagggcaag ggggcggggc 2100 tcgaggagcg gaggggggcg gggcgg 2126 <210> 4 <211> 1625 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR4 <400> 4 gatctgagtc atgttttaag gggaggattc ttttggctgc tgagttgaga ttaggttgag 60 ggtagtgaag gtaaaggcag tgagaccacg taggggtcat tgcagtaatc caggctggag 120 atgatggtgg ttcagttgga atagcagtgc atgtgctgta acaacctcag ctgggaagca 180 gtatatgtgg cgttatgacc tcagctggaa cagcaatgca tgtggtggtg taatgacccc 240 agctgggtag ggtgcatgtg gtgtaacgac ctcagctggg tagcagtgtg tgtgatgtaa 300 caacctcagc tgggtagcag tgtacttgat aaaatgttgg catactctag atttgttatg 360 agggtagtgc cattaaattt ctccacaaat tggttgtcac gtatgagtga aaagaggaag 420 tgatggaaga cttcagtgct tttggcctga ataaatagaa gacgtcattt ccagttaatg 480 gagacaggga agactaaagg tagggtggga ttcagtagag caggtgttca gttttgaata 540 tgatgaactc tgagagagga aaaacttttt ctacctctta gtttttgtga ctggacttaa 600 gaattaaagt gacataagac agagtaacaa gacaaaaata tgcgaggtta tttaatattt 660 ttacttgcag aggggaatct tcaaaagaaa aatgaagacc caaagaagcc attagggtca 720 aaagctcata tgccttttta agtagaaaat gataaatttt aacaatgtga gaagacaaag 780 gtgtttgagc tgagggcaat aaattgtggg acagtgatta agaaatatat gggggaaatg 840 aaatgataag ttattttagt agatttattc ttcatatcta ttttggcttc aacttccagt 900 ctctagtgat aagaatgttc ttctcttcct ggtacagaga gagcaccttt ctcatgggaa 960 attttatgac cttgctgtaa gtagaaaggg gaagatcgat ctcctgtttc ccagcatcag 1020 gatgcaaaca tttccctcca ttccagttct caaccccatg gctgggcctc atggcattcc 1080 agcatcgcta tgagtgcacc tttcctgcag gctgcctcgg gtagctggtg cactgctagg 1140 tcagtctatg tgaccaggag ctgggcctct gggcaatgcc agttggcagc ccccatccct 1200 ccactgctgg gggcctccta tccagaaggg cttggtgtgc agaacgatgg tgcaccatca 1260 tcattcccca cttgccatct ttcaggggac agccagctgc tttgggcgcg gcaaaaaaca 1320 cccaactcac tcctcttcag gggcctctgg tctgatgcca ccacaggaca tccttgagtg 1380 ctgggcagtc tgaggacagg gaaggagtga tgaccacaaa acaggaatgg cagcagcagt 1440 gacaggagga agtcaaaggc ttgtgtgtcc tggccctgct gagggctggc gagggccctg 1500 ggatggcgct cagtgcctgg tcggctgcaa gaggccagcc ctctgcccat gaggggagct 1560 ggcagtgacc aagctgcact gccctggtgg tgcatttcct gccccactct ttccttctaa 1620 gatcc 1625 <210> 5 <211> 1571 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR5 <400> 5 agcagagatc ttatttcccg tattcccttg tggcacagca cctcccacgc caaagcaaac 60 caaagcaaag gagcccttga tgaggagggg ccttccccca acctggtctc ccacaggtcc 120 tacatacgta cccaccccag acacacagag ctgcttcctg ctctcacacc agactgagct 180 gtgcccagac atttccccta gcactaacca actctttcaa aaatacattt ttctctaaaa 240 agaacaagtt taaacaaagt tgactcattt taagaactgt ttagaagata accttgtgtt 300 tattaattat gtatttgcag aaattggagg cagaaggtta ccaacattgc ctggtgtcca 360 gccaggaggt agagcgtggt ggcatccaga accttcctcc aactcctgcc tggcgtggtt 420 tttattcatc tttgtattcc caagaaactt ctcagtgtct caggagtgtt aggcactcag 480 tacgtgtttg gtagttacat gaatgaatgc ataatgacta agtgagttaa tggatgaagc 540 taattgtctc tcccttttgc ttttccagag ctttccaagg tgaaagtgtt ggacactctt 600 tcttcatctc agatttaatc aactaagaat gctgcaaatt gaacaccagt ccacaaaact 660 caggaataca tgaaaagcat tgtgccttat ttttaactaa ctcaaattct atgtcagtct 720 cccttttatg ctggatgttg gcgctaaatc tcagtgggtt cctcattctg ccagacctgt 780 gtccagtttg ggggcttcac atagagccac cccatcacag gagagggaag ggtcttgctc 840 ttggttgcca tcactccacc ctcttgtctt ccgagctttg atgttcactt tccttttcac 900 cactcggaag cttcctgcca tgatacattg agacctcaat gttaatgcca attggggttt 960 ggggttctca taaactcaga agtccaggaa aatcgcctgc tgcctcccac aacactctga 1020 gggcattctg gaatcctacc acttacctgg agcctgctgg cctcaactgt tttgaagtct 1080 gtgtctgggc catgcaggta aatgggagga tgttctgtgg ccataaaaat acccgaagtc 1140 ccacctaaag ttgatgcagg gtcttctgca tttcattgca aaattgttct atcatttcta 1200 tagttttcag cctacagtca ggggccagga ctttgcaccc ttggtaaacc tcaatctctt 1260 ctccttcctg gcttctactc ctttctccct caatcccaaa tcaaggccct tgattgtctg 1320 gaggtaggaa agcctggttc tggctcatga tatagtctac atcatagcct ttgtcatctc 1380 atggattcac tcaacaaccg tgtgtggatg gggccaccca atatgtgcca ggagttgagg 1440 acacgcaggg ttatgatgat gaaatagata aggggcccac actcacggac cctgcaggac 1500 agtggagctg tggacccagc atgcgagtaa agacccagtg agctcaccag acagatcatt 1560 taaatcaggt g 1571 <210> 6 <211> 1173 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR6 <400> 6 tgacccacca cagacatccc ctctggcctc ctgagtggtt tcttcagcac agcttccaga 60 gccaaattaa acgttcactc tatgtctata gacaaaaagg gttttgacta aactctgtgt 120 tttagagagg gagttaaatg ctgttaactt tttaggggtg ggcgagaggg atgacaaata 180 acaacttgtc tgaatgtttt acatttctcc ccactgcctc aagaaggttc acaacgaggt 240 catccatgat aaggagtaag acctcccagc cggactgtcc ctcggccccc agaggacact 300 ccacagagat atgctaactg gacttggaga ctggctcaca ctccagagaa aagcatggag 360 cacgagcgca cagagcaggg ccaaggtccc agggacagaa tgtctaggag ggagattggg 420 gtgagggtaa tctgatgcaa ttactgtggc agctcaacat tcaagggagg gggaagaaag 480 aaacagtccc tgtcaagtaa gttgtgcagc agagatggta agctccaaaa tttgaaactt 540 tggctgctgg aaagttttag ggggcagaga taagaagaca taagagactt tgagggttta 600 ctacacacta gacgctctat gcatttattt atttattatc tcttatttat tactttgtat 660 aactcttata ataatcttat gaaaacggaa accctcatat acccatttta cagatgagaa 720 aagtgacaat tttgagagca tagctaagaa tagctagtaa gtaaaggagc tgggacctaa 780 accaaaccct atctcaccag agtacacact cttttttttt ttccagtgta atttttttta 840 atttttattt tactttaagt tctgggatac atgtgcagaa ggtatggttt gttacatagg 900 tatatgtgtg ccatagtgga ttgctgcacc tatcaacccg tcatctaggt ttaagcccca 960 catgcattag ctatttgtcc tgatgctctc cctcccctcc ccacaccaga caggccttgg 1020 tgtgtgatgt tcccctccct gtgtccatgt gttctcactg ttcagctccc acttatgagt 1080 gagaacgtgt ggtatttggt tttctgttcc tgtgttagtt tgctgaggat gatggcttcc 1140 agcttcatcc atgtccctgc aaaggacacg atc 1173 <210> 7 <211> 2101 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR7 <400> 7 atcatgccag cttaggcgac agagtgagac tggacataat aacaataata ataaaaataa 60 ataaataaaa caattatctg agaggaaaaa tttgattcat aataaagaga ataaaggttt 120 ttggcgtgtt tgttttgttt tcacctaaga acagctgttc ccctcattgg gttagtttta 180 tttgcaagca gaaatcatct ccgcatgatt tccagggtga tggaaaactg aatatgaatc 240 caccttctgc catctattca cttgtcacat ttaataagac actcatgcct attttagcat 300 gttttcttcc ctaccaaatg agttagtaac atcaagagat taaaataaca caaataagaa 360 cattgaaggt attcaaatgt tacatacaaa tattaaacac aatattatta taattattcc 420 tggaaatgac attgcctcta ctctcaaggt aaaggtcatt tttcttgatt taaacttttt 480 tctcaagttt gaaatctcta agtttcaacc cgtaatctat ttgcaagttt gtgcaaattt 540 tagggattga atccatagta attagtgatt tattgtggtg tagggagaca agtcaaaaga 600 atcaggactg ctaggtagat gactaaggaa aggatggttc acgaggtgac ataaagcact 660 cagaagaaaa aggtcaggaa acggaggaca gaaaaaaacc taagttctgc tgggtgatgc 720 tgaatttgtc atcacaaaat ctgcattgtg gaagctttag ctattgagga gattgctcaa 780 gtgtagaact gagaacaata ggcagtgaac ccgagagaac atcaagagac tgagagaaaa 840 tgaaccagac ttccaggtgc tccatgttcc aaccaacatt ttgtattgtc agaaggaatt 900 gagaggcaaa aggaaaccca ataaaaaata aaacaggaaa gggcatacat gattaccacc 960 ccttttctca ccagctgctc atggaccagc tttctcctag tgctattttc ttggtcactg 1020 catcactctg ctaacatagt ttccccacta gctctgaggc tgtcccagag gggaagccag 1080 ctgtcatctc cttcttccac actctgttgg aggaacctgt cattagcagc tccctactaa 1140 acgcatttat gacaaacagg caggagataa ttaactagaa agtgaacaaa ctcaaacttc 1200 agagcctctc atttgtatga atgcccttgt aaggtcttgg gcctatttta atatttataa 1260 atgtgttatt ttcttctaaa gaaaaccacc aaattgtata agctacagaa tctgcaaaac 1320 tgaggtccat ccatgcactc aggatacatt catagcatct ctgagctgga aaatatctta 1380 aaggtcatat atgtcctcca acactgcaag aatctctctg gcagcattct tttaaaatca 1440 tcatctaaaa gagggaaatc cccagctgtg tttggatttt gctctgtcac ttgtccagtt 1500 tccccatcca taaaagggca acaatatgaa tttcctgata aggtagttgt taatataaat 1560 acaaagtgcg tagccacttc cctaagaaaa atatggggtt tctgcttcac agtctaggga 1620 gaggaaaaaa aaggggggtc agaagtgatt attattatca ttctatattg gaatgttttc 1680 agacataaaa agctcaccac gtcttaggcc agacagatgc attatgaaag ttaagctaag 1740 tcttcctcat catgagctgc acctatatcc ccattacttc ttctagaact gcataattta 1800 tttattcttt cttcaaaagt ttgagagagc cattcttgtc ctctaagatt tttttttttt 1860 tttttggaga cagagtctcc gtctgttgcc caggctggag tgcaatggca ctatctcagc 1920 tcactgcaac ctctgcctcc cagattcaag tgattctcct gcctcagcct cccgagtagc 1980 tgggattaca agcacgcacc accacaacca gctaattttt cgtatttttt agtagagacg 2040 aggttttacc atgttggcca ggctggtctt gaactcctga cctcgggtga tccacccacc 2100 t 2101 <210> 8 <211> 1821 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR8 <400> 8 gagatcacct cgaagagagt ctaacgtccg taggaacgct ctcgggttca caaggattga 60 ccgaacccca ggatacgtcg ctctccatct gaggcttgct ccaaatggcc ctccactatt 120 ccaggcacgt gggtgtctcc cctaactctc cctgctctcc tgagcccatg ctgcctatca 180 cccatcggtg caggtccttt ctgaagagct cgggtggatt ctctccatcc cacttccttt 240 cccaagaaag aagccaccgt tccaagacac ccaatgggac attccccttc cacctccttc 300 tccaaagttg cccaggtgtt catcacaggt tagggagaga agcccccagg tttcagttac 360 aaggcatagg acgctggcat gaacacacac acacacacac acacacacac acacacacac 420 acacgactcg aagaggtagc cacaagggtc attaaacact tgacgactgt tttccaaaaa 480 cgtggatgca gttcatccac gccaaagcca agggtgcaaa gcaaacacgg aatggtggag 540 agattccaga ggctcaccaa accctctcag gaatattttc ctgaccctgg gggcagaggt 600 tggaaacatt gaggacattt cttgggacac acggagaagc tgaccgacca ggcattttcc 660 tttccactgc aaatgaccta tggcgggggc atttcacttt cccctgcaaa tcacctatgg 720 cgaggtacct ccccaagccc ccacccccac ttccgcgaat cggcatggct cggcctctat 780 ccgggtgtca ctccaggtag gcttctcaac gctctcggct caaagaagga caatcacagg 840 tccaagccca aagcccacac ctcttccttt tgttataccc acagaagtta gagaaaacgc 900 cacactttga gacaaattaa gagtccttta tttaagccgg cggccaaaga gatggctaac 960 gctcaaaatt ctctgggccc cgaggaaggg gcttgactaa cttctatacc ttggtttagg 1020 aaggggaggg gaactcaaat gcggtaattc tacagaagta aaaacatgca ggaatcaaaa 1080 gaagcaaatg gttatagaga gataaacagt tttaaaaggc aaatggttac aaaaggcaac 1140 ggtaccaggt gcggggctct aaatccttca tgacacttag atataggtgc tatgctggac 1200 acgaactcaa ggctttatgt tgttatctct tcgagaaaaa tcctgggaac ttcatgcact 1260 gtttgtgcca gtatcttatc agttgattgg gctcccttga aatgctgagt atctgcttac 1320 acaggtcaac tccttgcgga agggggttgg gtaaggagcc cttcgtgtct cgtaaattaa 1380 ggggtcgatt ggagtttgtc cagcattccc agctacagag agccttattt acatgagaag 1440 caaggctagg tgattaaaga gaccaacagg gaagattcaa agtagcgact tagagtaaaa 1500 acaaggttag gcatttcact ttcccagaga acgcgcaaac attcaatggg agagaggtcc 1560 cgagtcgtca aagtcccaga tgtggcgagc ccccgggagg aaaaaccgtg tcttccttag 1620 gatgcccgga acaagagcta ggcttccgga gctaggcagc catctatgtc cgtgagccgg 1680 cgggagggag accgccggga ggcgaagtgg ggcggggcca tccttctttc tgctctgctg 1740 ctgccgggga gctcctggct ggcgtccaag cggcaggagg ccgccgtcct gcagggcgcc 1800 gtagagtttg cggtgcagag t 1821 <210> 9 <211> 1929 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR9 <400> 9 atgagccccc aaaaatgatc ctctggctta tgacaacctg atgcagccca ggaaatgcct 60 gcaacatgcc cactagcagc tgggaacccc tctgtgagga agagaacgtt ttacattaag 120 aaaccctttg ttttgcagca gagactattc aggtcacaca tgtgtggcct ctcagttctt 180 tgagccattt gaagttctct atccttgctg ggaggctgag ctctccatgg aaacctggtc 240 cgatagtgag aggagcagac cctctggaaa caccttttta cacctgacca aagcagccag 300 tcatgggcca gtgatgcaac aaggtcaacc ggtgcattct ggcccctcag aaaagcagcc 360 cccgggaagg tcaggaggag gctgctgact ccctcttccc ctgcagccgc cccaagcaca 420 cccaggagcc ctgcaggttt gggttcacca ggtgccagca ggtcccacga tgctgcattt 480 cttacgagct cctggaggat gcagatggtc ctggtcagag gctgcattct gagtatcagg 540 agccatgggg caacgtttct gcgattgagg aaggggcatt tctggggtgg gcagaacaaa 600 ggtctttggc tgagctggag catccgcctc catcagtgtt ttccggcaac tgtactatcc 660 atcgtcttcc cttcccacag ctgaccatgg ctttggaaaa tgctctgaaa ctttcttttc 720 agaagagttg actcccaact ccacacttag gggaagtcaa gcctacttct cagaattcag 780 agaaggcata aaaaagaatt catttctaaa ggccctttag aagtaacttc aggtctgaca 840 gcggccagct aatttctggt cgccttccag gaatcttctg actgcaaaaa aaaagcattt 900 accacctgaa cacaaaccca gttacagata gaaaaacata gtcatttaaa tagaatataa 960 gcatctggcc tctgcccatc ataatggagt aacacaaaaa tctattttca aaaggaaact 1020 aaatattatt gaccaaaaca tgaatgggga gacctcaggg tgatacagct cttgcctgga 1080 tggaatttgt aatcaagagg atgagacagg attgtaactt gtgccaatgt gaaagggttt 1140 gctcaggtat cattcatttt gcttaaatgc atgggtaatt tccaaagttc tttggagctg 1200 aatttcacaa tttagtgcag gtcctggtga gcccaccttg acttatctca cagtacaatg 1260 cagtggcgtg gctacaatgc tgggcaagag aagccaatgt caacagccca ggagtggctg 1320 ggtccttacc aggctcccag gcatgcttca tggtgggccc tgggctggga ggaacagcac 1380 ctttgcctgg tccatgagta tctgggtcaa actctcctgt ggacacagaa ggccatggcg 1440 acaggcattc ccaggaaaag aaaagggcag cagctgaaat cgtcaggtgg agaaggcagt 1500 catccttgct cagtcaactc taatccggct gcctcctcct cagcttcagg gtgaacctct 1560 cctaagctgt gtctttggta tctgatgggc attaggtgct ggtgaaaaag ctggagggtc 1620 ctttgggata ttacagaagc ccaatctagc cttgtattca atatctaggc actctcaccc 1680 ctgaagttct acgtttccag atttctgaaa acatgggaaa gcatgtgtgt gatgtctgag 1740 gtccccctca gcctctggtg tagggttagg agggctctaa agggtggcag ctccagtgtc 1800 ccagtggggc ctgaagttgg tcccttccct tcccagctcc catccatggt ttagcccaat 1860 cccttccgta cctaagagta ctgcacatgg atgctccacg cagagcctct gctccactcc 1920 caggaagtg 1929 <210> 10 <211> 1167 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR10 <220> <221> misc_feature <222> (452)..(1143) <223> "N" stands for any nucleic acid on various positions <400> 10 aggtcaggag ttcaagacca gcctggccaa catggtgaaa ccctgtccct acaaaaaata 60 caaaaattag ccgggcgtgg tggggggcgc ctataatccc agctactcag gatgctgaga 120 caggagaatt gtttgaaccc gggaggtgga ggttgcagtg aactgagatc gcgccactgc 180 actccagcct ggtgacagag agagactccg tctcaacaac agacaaacaa acaaacaaac 240 aacaacaaaa atgtttactg acagctttat tgagataaaa ttcacatgcc ataaaggtca 300 ccttctacag tatacaattc agtggattta gtatgttcac aaagttgtac gttgttcacc 360 atctactcca gaacatttac atcaccccta aaagaagctc tttagcagtc acttctcatt 420 ctccccagcc cctgccaacc acgaatctac tntctgtctc tattctgaat atttcatata 480 aaggagtcct atcatatggg ccttttacgt ctaccttctt tcacttagca tcatgttttt 540 aagattcatc cacagtgtag cacgtgtcag ttaattcatt tcatcttatg gctggataat 600 gctctattgt atgcatatcc ctcactttgc ttatccattc atcaactgat tgacatttgg 660 gttatttcta ctttttgact attatgagta atgctgctat gaacattcct gtaccaatcg 720 ttacgtggac atatgctttc aattctcctg agtatgtaac tagggttgga gttgctgggt 780 catatgttaa ctcagtgttt catttttttg aagaactacc aaatggtttt ccaaagtgga 840 tgcaacactt tacattccca ccagcaagat atgaaggttc caatgtctct acatttttgc 900 caacacttgt gattttcttt tatttattta tttatttatt tatttttgag atggagtctc 960 actctgtcac ccaggctgga gtgcagtggc acaatttcag ctcactgcaa tctccacctc 1020 tcgggctcaa gcgatactcc tgcctcaacc tcccgagtaa ctgggattac aggcgcccac 1080 caccacacca agctaatttt ttgtattttt agtagagacg gggtttcatc atgtcggcca 1140 ggntgtactc gaactctgac ctcaagt 1167 <210> 11 <211> 1377 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR11 <400> 11 gattctgggt gggtttgatg atctgagagt cccttgaata aaaagaattc tagaaaagct 60 gtgaaacttc acctttcccc tattcttaac cttacttgcc tttgggaggc tgaggcagga 120 ggatgactta aggccaggag tttgagaatg tagtgagcta tgaccacacc ggttacactc 180 aagcctgggc gagaccacaa caaaaacctt acctgccaac tgctccatgc tggaaattta 240 tttcgtttct tggattgtgg aaagaactgg cttactgaaa accacacttc tctaaaaccc 300 ttcttccagt taggtgttaa gattttaaca gcctttccta tctgaataaa aactgcacac 360 aaagtaaact taagagatgt caacaactca tctgtttgtt acaagatgag tctccatgct 420 tcatcgcctg tggggaatcc tcatcagcgt ctagtggcaa agactcctgt gtgctcaccg 480 aaacgctccc cttcctccag ggcacacagt cacatggatt tcccatgcac cctggcagct 540 cagcaggagt ccatgactta agaaggccaa tggactgtgg gtgaagtctg tggacgggga 600 agccacatgc gtcacttcca ggcctgggcg tgtgcatcct ccactctctt cccctgtggg 660 tgcagaaggc ggggcagagg gccctgaaac cttggaggtc ggtggagccc aaaatgaagg 720 agcgtgggcc tctgggtctt catgtaaatt taggtaacac tgaactgtca ggtgaacaag 780 aaataaacgt caaatgtatt cagtcgatta gatttggtga tggttgttac agcggttacc 840 ctccctcaac ataataaatt ttcaaacaac tcataatggc tcactcatgt ataaaatatt 900 ccatatgaaa tcccgggata acatgcttat tctagctcaa gcttaatcag agtagtccat 960 ctgagggagg agatagtaga gggcagcaag gggttgtcac tgaagataac tagccttgct 1020 aaaagaatgg ttgaagaagt gagctacaga tagggtaaat ccacatctca gacattctgt 1080 gatggtcctg atattatcct aaagtaaaat gtagagttga accattttaa ttagattcta 1140 gaattctatt aatttataag atgggcattt ccacaaagga ctaaacaaag tacaagagga 1200 ttaaataatc atccacatgg gaggcaccgc cttgcacttt aaaatgatgg agcttatcaa 1260 gactggctgt ggatatctgt ccctgggagg gttttttccc ccattttttt cctttttgag 1320 acatgttctc gctatgttgc ccaggctggt cttgaactcc tgggctcaag tgatcct 1377 <210> 12 <211> 1051 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR12 <400> 12 atcctgcttc tgggaagaga gtggcctccc ttgtgcaggt gactttggca ggaccagcag 60 aaacccaggt ttcctgtcag gaggaagtgc tcagcttatc tctgtgaagg gtcgtgataa 120 ggcacgagga ggcaggggct tgccaggatg ttgcctttct gtgccatatg ggacatctca 180 gcttacgttg ttaagaaata tttggcaaga agatgcacac agaatttctg taacgaatag 240 gatggagttt taagggttac tacgaaaaaa agaaaactac tggagaagag ggaagccaaa 300 caccaccaag tttgaaatcg attttattgg acgaatgtct cactttaaat ttaaatggag 360 tccaacttcc ttttctcacc cagacgtcga gaaggtggca ttcaaaatgt ttacacttgt 420 ttcatctgcc tttttgctaa gtcctggtcc cctacctcct ttccctcact tcacatttgt 480 cgtttcatcg cacacatatg ctcatcttta tatttacata tatataattt ttatatatgg 540 cttgtgaaat atgccagacg agggatgaaa tagtcctgaa aacagctgga aaattatgca 600 acagtgggga gattgggcac atgtacattc tgtactgcaa agttgcacaa cagaccaagt 660 ttgttataag tgaggctggg tggtttttat tttttctcta ggacaacagc ttgcctggtg 720 gagtaggcct cctgcagaag gcattttctt aggagcctca acttccccaa gaagaggaga 780 gggcgagact ggagttgtgc tggcagcaca gagacaaggg ggcacggcag gactgcagcc 840 tgcagagggg ctggagaagc ggaggctggc acccagtggc cagcgaggcc caggtccaag 900 tccagcgagg tcgaggtcta gagtacagca aggccaaggt ccaaggtcag tgagtctaag 960 gtccatggtc agtgaggctg agacccaggg tccaatgagg ccaaggtcca gagtccagta 1020 aggccgagat ccagggtcca gggaggtcaa g 1051 <210> 13 <211> 1291 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR13 <400> 13 ctgccctgat cccttaatgc ttttggccca gagcaccccg ctaagtccaa ccccagaggg 60 gcctcatccg caaagcctcg ggaagaggac agtgacggag gcggctgccc tgtgagctgc 120 acggggcaga atgtcctttt ggcgtcatgt tggatgtcca cacatccata tggggtcagt 180 tctattagga ttccttcggg aagaggtaga gggtaggagg ggttaagcca cgagacgagg 240 catgcagagg ggtggcctgg atgggtctgc actgctgtcc atgcacacgg ggagcgttgc 300 aaattgtgct tcccagccca tagtgccccc acagaggagc ccgggagtcc ctggtgggcg 360 tctgtgttcc tgcaaggagc cagtggagat ggccccgtga actctcatcc cccttgcctt 420 ggtggggtct ctggcaggtt tatggagccg tacatctttg ggagccgcct ggaccacgac 480 atcatcgacc tggaacagac agccacgcac ctccagctgg ccttgaactt caccgcccac 540 atggcctacc gcaagggcat catcttgttt ataagccgca accggcagtt ctcgtacctg 600 attgagaaca tggcccgtga ctgtggcgag tacgcccaca ctcgctactt caggggcggc 660 atgctgacca acgcgcgcct cctctttggc cccacggtcc gcctgccgga cctcatcatc 720 ttcctgcaca cgctcaacaa catctttgag ccacacgtgg ccgtgagaga cgcagccaag 780 atgaacatcc ccacagtggg catcgtggac accaactgca acccctgcct catcacctac 840 cctgtacccg gcaatgacga ctctccgctg gctgtgcacc tctactgcag gctcttccag 900 acggccatca cccgggccaa ggagaagcgg cagcaggttg aggctctcta tcgcctgcag 960 ggccagaagg agcccgggga ccaggggcca gcccaccctc ctggggctga catgagccat 1020 tccctgtgat gttcactctc ctcccaaagc aaaccacagc caagcctgtc tgagctggga 1080 gtccccttcc ccagccctgg gtcagcggca tcctcagtcg ttgttactta ctcagctgat 1140 gtcacagtgc agacatccac cgttccacca cagaaccagt ggctgagcgg accaacgttg 1200 ccatgtgcgt ttgctctgtg gggaacagag cacagagggt gagcgacatg tgcagaacgg 1260 ccccttggct gcagttagga cctcagtggc t 1291 <210> 14 <211> 711 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR14 <400> 14 agcaaggacc agggctctgc ctccccagtc agcatgagca gagcagactc ctttgagcag 60 agcatcaggg cagaaataga acagtttctg aatgagaaaa gacagcatga gacccaaaaa 120 tgtgatgggt cagtggagaa gaaaccagac acacatgaaa attcggcgaa gtcactctcg 180 aaatcccacc aagagccggc tacaaaggtg gtgcaccggc agggcctgat gggcgtccag 240 aaggagttcg ccttctgcag acctcccccg gttagcaaag acaaacgtgc agcccagaag 300 cctcaggtcc aaggtcacga ccacgaccac gcaggagaag gagggcagca caaagccagc 360 aacccccacc gcccttcaga agcagtacag aataaaagtg ggattaaaag gaacgccagc 420 accgcaagga ggggaaagcg agtcacgagc gccgtacagg cgcccgaggc gtccgactcc 480 agcagcgacg acggcattga ggaggccatc cagctgtacc aggtgcagaa aacacacaag 540 gaggccgacg gggacccgcc ccagagggtc cagctccaag aggaaagagc acctgcccct 600 cccgcacaca gcacaagcag cgccacaaaa agtgccttgc cagagaccca caggaaaaca 660 cccagcaaga agaagccagt gcccaccaag accacggacc ctggtccagg g 711 <210> 15 <211> 1876 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR16 <400> 15 cagtacatgc agaactgagt ccaaacgaga cggacagcaa acccggcagt gggctcccag 60 acattcctgg gggaaaggga tcctaaccac aggcagttaa agtcatctcc tccaaccctc 120 tatgacacag gctgtgcgct gtcatttaaa agctgagtga aatttaaccc ttttcccatt 180 tagaaaaaca aagcgcagct ggctgccagc actcatttaa ttttacataa acgtgctctt 240 tgaggctgaa gcaaatctga ctgattttca atgtgaaaat aaaatgtaaa aactgttctt 300 ggaattattt ctaaacagaa catcagaatc gtctgaatca tcagaatcgg ctattttgga 360 aaaatcggat tcatcaaacg aatcttcggc caacaactgt tagagaacga tgttaacacc 420 acgcatagga atgttacatt ttctagaatt tgacattttc attgacggaa aattactgta 480 tcttgtatat ggaaatacca ctactaaaaa cataatgcta taaatagaat gatgtctttt 540 gtttccaaag tcaatatact cgagcaatgc aaaaataata ataaaagtga gatacttcat 600 ggcaaagctg ccgcaggata aacattgcag ccacaagtgc ccccagtatt ctcggggcaa 660 actggaaaag ggctaacagg caacattttc atgttattct actgagtgca gtaattattt 720 ttaaaaatat acatgaataa tgaaaaaact gtggtatggt tttaaagaaa tttccataac 780 ctggtgaaac tcttcacaca gggtaatagg ttcataaagc cttggtcctc tgcaaaacaa 840 gcatcaactt gacaatgact aaaagaagca acagcaaaac tgtcacgcat ttggagccat 900 ggcctgggtt gggccggtgt aaagctctcc gccctctgga gcaagtctgg gccccagcgg 960 ctggcatgtg ggcactgcag ggcctgggtt gggcaggtgt gcagctctcc gtcatctgag 1020 cctagtctga ggcctggtgg ctggcacgtg ggccctgcag ggcctctact tctcacccca 1080 gctccacttc cctccctgcc ctcactgggt ctcacagagc caatgaacac tggggtcaga 1140 ttcagggccc agcatccact gcagtgggca ctgcccttcc acaaggcctg gctccaggaa 1200 gcaaccccca cctcagccac acagtagggc aacaggaaat cccattcccc catgccagtg 1260 actacaccag ggaaggggct cacgtgaggc tggccccagg cctgctgtga gaccgcgttg 1320 tctatgagct tggatttaag gaacttggga gcaagaagct ttctttcatt acgggccacc 1380 agcagggaaa aaagttagcc caacgcagtt gacagtcaca cccccaccag gaccccaggg 1440 cacagaagga gggaagagga caacagagga tgaggtgggg ccagcagagg gacagagaag 1500 agctgcctgc cctggaacag gcagaaagca tcccacgtgc aagaaaaagt aggccagcta 1560 gacttaaaat cagaactacc gctcatcaaa agatagtgta acatttgggg tgctataatt 1620 ttaacatgtc ccccaaaagg catgtgttgg aaatttaatc cccaacaaac cagggctggg 1680 aggtggagcc tcatgagagg tggtgaggcc atgagggtgg agtgaatgga tgaatgccat 1740 tgtctcggga atgggcctct tctacaagga cgagttcagc ccccctttct cttgctcacc 1800 ctctctttgc cctttcgcta gggagtgacg taacaagaag gccctcacaa gatgctggca 1860 ccttgatctt ggactc 1876 <210> 16 <211> 1282 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR17 <400> 16 cgcccacctc ggctttccaa agtgctggga ttacaggcat gagtcactgc gcccatcctg 60 attccaagtc tttagataat aacttaactt tttcgaccaa ttgccaatca ggcaatcttt 120 gaatctgcct atgacctagg acatccctct ccctacaagt tgccccgcgt ttccagacca 180 aaccaatgta catcttacat gtattgattg aagttttaca tctccctaaa acatataaaa 240 ccaagctata gtctgaccac ctcaggcacg tgttctcagg acctccctgg ggctatggca 300 tgggtcctgg tcctcagatt tggctcagaa taaatctctt caaatatttt ccagaatttt 360 actcttttca tcaccattac ctatcaccca taagtcagag ttttccacaa ccccttcctc 420 agattcagta atttgctaga atggccacca aactcaggaa agtattttac ttacaattac 480 caatttatta tgaagaactc aaatcaggaa tagccaaatg gaagaggcat agggaaaggt 540 atggaggaag gggcacaaag cttccatgcc ctgtgtgcac accaccctct cagcatcttc 600 atgtgttcac caactcagaa gctcttcaaa ctttgtcatt taggggtttt tatggcagtt 660 ccactatgta ggcatggttg ataaatcact ggtcatcggt gatagaactc tgtctccagc 720 tcctctctct ctcctcccca gaagtcctga ggtggggctg aaagtttcac aaggttagtt 780 gctctgacaa ccagccccta tcctgaagct attgaggggt cccccaaaag ttaccttagt 840 atggttggaa gaggcttatt atgaataaca aaagatgctc ctatttttac cactagggag 900 catatccaag tcttgcggga acaaagcatg ttactggtag caaattcata caggtagata 960 gcaatctcaa ttcttgcctt ctcagaagaa agaatttgac caagggggca taaggcagag 1020 tgagggacca agataagttt tagagcagga gtgaaagttt attaaaaagt tttaggcagg 1080 aatgaaagaa agtaaagtac atttggaaga gggccaagtg ggcgacatga gagagtcaaa 1140 caccatgccc tgtttgatgt ttggcttggg gtcttatatg atgacatgct tctgagggtt 1200 gcatccttct cccctgattc ttcccttggg gtgggctgtc cgcatgcaca atggcctgcc 1260 agcagtaggg aggggccgca tg 1282 <210> 17 <211> 793 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR17 <400> 17 atccgagggg aggaggagaa gaggaaggcg agcagggcgc cggagcccga ggtgtctgcg 60 agaactgttt taaatggttg gcttgaaaat gtcactagtg ctaagtggct tttcggattg 120 tcttatttat tactttgtca ggtttcctta aggagagggt gtgttggggg tgggggagga 180 ggtggactgg ggaaacctct gcgtttctcc tcctcggctg cacagggtga gtaggaaacg 240 cctcgctgcc acttaacaat ccctctatta gtaaatctac gcggagactc tatgggaagc 300 cgagaaccag tgtcttcttc cagggcagaa gtcacctgtt gggaacggcc cccgggtccc 360 cctgctgggc tttccggctc ttctaggcgg cctgatttct cctcagccct ccacccagcg 420 tccctcaggg acttttcaca cctccccacc cccatttcca ctacagtctc ccagggcaca 480 gcacttcatt gacagccaca cgagccttct cgttctcttc tcctctgttc cttctctttc 540 tcttctcctc tgttccttct ctttctctgt cataatttcc ttggtgcttt cgccacctta 600 aacaaaaaag agaaaaaaat aaaataaaaa aaacccattc tgagccaaag tattttaaga 660 tgaatccaag aaagcgaccc acatagccct ccccacccac ggagtgcgcc aagacgcacc 720 caggctccat cacagggccg agagcagcgc cactctggtc gtacttttgg gtcaagagat 780 cttgcaaaag agg 793 <210> 18 <211> 492 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR18 <400> 18 atctttttgc tctctaaatg tattgatggg ttgtgttttt tttcccacct gctaataaat 60 attacattgc aacattcttc cctcaacttc aaaactgctg aactgaaaca atatgcataa 120 aagaaaatcc tttgcagaag aaaaaaagct attttctccc actgattttg aatggcactt 180 gcggatgcag ttcgcaaatc ctattgccta ttccctcatg aacattgtga aatgaaacct 240 ttggacagtc tgccgcattg cgcatgagac tgcctgcgca aggcaagggt atggttccca 300 aagcacccag tggtaaatcc taacttatta ttcccttaaa attccaatgt aacaacgtgg 360 gccataaaag agtttctgaa caaaacatgt catctttgtg gaaaggtgtt tttcgtaatt 420 aatgatggaa tcatgctcat ttcaaaatgg aggtccacga tttgtggcca gctgatgcct 480 gcaaattatc ct 492 <210> 19 <211> 1840 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR19 <400> 19 tcacttcctg atattttaca ttcaaggcta gctttatgca tatgcaacct gtgcagttgc 60 acagggcttt gtgttcagaa agactagctc ttggtttaat actctgttgt tgccatcttg 120 agattcatta taatataatt tttgaatttg tgttttgaac gtgatgtcca atgggacaat 180 ggaacattca cataacagag gagacaggtc aggtggcagc ctcaattcct tgccaccctt 240 ttcacataca gcattggcaa tgccccatga gcacaaaatt tgggggaacc atgatgctaa 300 gactcaaagc acatataaac atgttacctc tgtgactaaa agaagtggag gtgctgacag 360 cccccagagg ccacagttta tgttcaaacc aaaacttgct tagggtgcag aaagaaggca 420 atggcagggt ctaagaaaca gcccatcata tccttgttta ttcatgttac gtccctgcat 480 gaactaatca cttacactga aaatattgac agaggaggaa atggaaagat agggcaaccc 540 atagttcttt ttccttttag tctttcctta tcagtaaacc aaagatagta ttggtaaaat 600 gtgtgtgagt taattaatga gttagtttta ggcagtgttt ccactgttgg ggtaagaaca 660 aaatatatag gcttgtattg agctattaaa tgtaaattgt ggaatgtcag tgattccaag 720 tatgaattaa atatccttgt atttgcattt aaaattggca ctgaacaaca aagattaaca 780 gtaaaattaa taatgtaaaa gtttaatttt tacttagaat gacattaaat agcaaataaa 840 agcaccatga taaatcaaga gagagactgt ggaaagaagg aaaacgtttt tattttagta 900 tatttaatgg gactttcttc ctgatgtttt gttttgtttt gagagagagg gatgtggggg 960 cagggaggtc tcattttgtt gcccaggctg gacttgaact cctgggctcc agctatcctg 1020 ccttagcttc ttgagtagct gggactacag gcacacacca cagtgtctga cattttctgg 1080 attttttttt tttttttatt ttttttgtga gacaggttct ggctctgtta ctcaggttgc 1140 agtgcagtgg catgatagcg gctcactgca gcctcaacct cctcagctta agctactctc 1200 ccacttcagc ctcctgagta gccaggacta cagttgtgtg ccaccacacc tgtggctaat 1260 ttttgtagag atggggtctc tccacgttgc cgaggctggt ctccaactcc tggtctcaag 1320 cgaacctcct gacttggcct cccgaagtgc tgggattaca ggcttgagcc actgcatcca 1380 gcctgtcctc tgtgttaaac ctactccaat ttgtctttca tctctacata aacggctctt 1440 ttcaaagttc ccatagacct cactgttgct aatctaataa taaattatct gccttttctt 1500 acatggttca tcagtagcag cattagattg ggctgctcaa ttcttcttgg tatattttct 1560 tcatttggct tctggggcat cacactctct ttgagttact cattcctcat tgatagcttc 1620 ttcctagtct tctttactgg ttcttcctct tctccctgac tccttaatat tgtttttctc 1680 cccaggcttt agttcttagt cctcttctgt tatctattta cacccaattc tttcagagtc 1740 tcatccagag tcatgaactt aaacctgttt ctgtgcagat aattcacatt attatatctc 1800 cagcccagac tctcccgcaa actgcagact gatcctactg 1840 <210> 20 <211> 780 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR20 <400> 20 gatctcaagt ttcaatatca tgttttggca aaacattcga tgctcccaca tccttaccta 60 aagctaccag aaaggctttg ggaactgtca acagagctac agaaaagtca gtaaagacca 120 atggacccct caaacaaaaa cagccaagct tttctgccaa aaagatgact gagaagactg 180 ttaaagcaaa aaactctgtt cctgcctcag atgatggcta tccagaaata gaaaaattat 240 ttcccttcaa tcctctaggc ttcgagagtt ttgacctgcc tgaagagcac cagattgcac 300 atctcccctt gagtgaagtg cctctcatga tacttgatga ggagagagag cttgaaaagc 360 tgtttcagct gggcccccct tcacctttga agatgccctc tccaccatgg aaatccaatc 420 tgttgcagtc tcctttaagc attctgttga ccctggatgt tgaattgcca cctgtttgct 480 ctgacataga tatttaaatt tcttagtgct ttagagtttg tgtatatttc tattaataaa 540 gcattatttg tttaacagaa aaaaagatat atacttaaat cctaaaataa aataaccatt 600 aaaaggaaaa acaggagtta taactaataa gggaacaaag gacataaaat gggataataa 660 tgcttaatcc aaaataaagc agaaaatgaa gaaaaatgaa atgaagaaca gataaataga 720 aaacaaatag caatatgaaa gacaaacttg accgggtgtg gtggctgatg cctgtaatcc 780 <210> 21 <211> 607 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR21 <400> 21 gatcaataat ttgtaatagt cagtgaatac aaaggggtat atactaaatg ctacagaaat 60 tccattcctg ggtataaatc ctagacatat ttatgcatat gtacaccaag atatatctgc 120 aagaatgttc acagcaaatc tctttgtagt agcaaaaggc caaaaggtct atcaacaaga 180 aaattaatac attgtggcac ataatggcat ccttatgcca ataaaaatgg atgaaattat 240 agttaggttc aaaaggcaag cctccagata atttatatca tataattcca tgtacaacat 300 tcaacaacaa gcaaaactaa acatatacaa atgtcaggga aaatgatgaa caaggttaga 360 aaatgattaa tataaaaata ctgcacagtg ataacattta atgagaaaaa aagaaggaag 420 ggcttaggga gggacctaca gggaactcca aagttcatgg taagtactaa atacataatc 480 aaagcactca aaatagaaaa tattttagta atgttttagc tagttaatat cttacttaaa 540 acaaggtcta ggccaggcac ggtggctcac acctgtaatc ccagcacttt gggaggctga 600 ggcgggt 607 <210> 22 <211> 1380 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR22 <400> 22 cccttgtgat ccacccgcct tggcctccca aagtgctggg attacaggcg tgagtcacta 60 cgcccggcca ccctccctgt atattatttc taagtatact attatgttaa aaaaagttta 120 aaaatattga tttaatgaat tcccagaaac taggatttta catgtcacgt tttcttatta 180 taaaaataaa aatcaacaat aaatatatgg taaaagtaaa aagaaaaaca aaaacaaaaa 240 gtgaaaaaaa taaacaacac tcctgtcaaa aaacaacagt tgtgataaaa cttaagtgcc 300 tgaaaattta gaaacatcct tctaaagaag ttctgaataa aataaggaat aaaataatca 360 catagttttg gtcattggtt ctgtttatgt gatggattat gtttattgat ttgtgtatgt 420 tgaacttatc tcaatagatg cagacaaggc cttgataaaa gtttttaaca ccttttcatg 480 ttgaaaactc tcaatagact aggtattgat gaaacatatc tcaaaataat agaagctatt 540 tatgataaac ccatagccaa tatcatactg agtgggcaaa agctggaagc attccctttg 600 aaaactggca caagacaagg atgccctctc tcaccactcc tattaaatgt agtattggaa 660 gttctggcca gagcaatcag gcaggagaaa gaaaaggtat taaaatagga agagaggaag 720 tcaaattgtc tctgtttgca gtaaacatga ttgtatattt agaaaacccc attgtctcat 780 cctaaaaact ccttaagctg ataaacaact tcagcaaagt ctcaggatac aaaatcaatg 840 tgcaaaaatc acaagcattc ctatacaccg ataatagaca gcagagagcc aaatcatgag 900 tgaagtccca ttcacaattg cttcaaagaa aataaaatac ttaggaatac aactttcacg 960 ggacatgaag gacattttca aggacaacta aaaaccactg ctcaaggaaa tgagagagga 1020 cacaaagaaa tggaaaaaca ttccatgctc atggaagaat caatatcatg aaaatggcca 1080 tactgcccaa agtaatttat agattcaatg ctaaccccat caagccacca ttgactttct 1140 tcacagaact agaaaaaaac tattttaaaa ctcatatgta gtcaaaaaga gtcggtatag 1200 ccaagacaat cctaagcata aagaacaaag ctggatgcat cacgctgact tcaaaccata 1260 ctacaaggct acagtaacca aaacagcatg gtactggtac caaaacagat agatagaccg 1320 atagaacaga acagaggcct cggaaataac accacacatc tacaaccctt tgatcttcaa 1380 <210> 23 <211> 1246 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR23 <400> 23 atcccctcat ccttcagggc agctgagcag ggcctcgagc agctggggga gcctcactta 60 atgctcctgg gagggcagcc agggagcatg gggtctgcag gcatggtcca gggtcctgca 120 ggcggcacgc accatgtgca gccgccccca cctgttgctc tgcctccgcc acctggccat 180 gggcttcagc agccagccac aaagtctgca gctgctgtac atggacaaga agcccacaag 240 cagctagagg accttgtgtt ccacgtgccc agggagcatg gcccacagcc caaagaccag 300 tcaggagcag gcaggggctt ctggcaggcc cagctctacc tctgtcttca cacagatggg 360 agatttctgt tgtgattttg agtgatgtgc ccctttggtg acatccaaga tagttgctga 420 agcaccgctc taacaatgtg tgtgtattct gaaaacgaga acttctttat tctgaaataa 480 ttgatgcaaa ataaattagt ttggatttga aattctattc atgtaggcat gcacacaaaa 540 gtccaacatt gcatatgaca caaagaaaag aaaaagcttg cattccttaa atacaaatat 600 ctgttaacta tatttgcaaa tatatttgaa tacacttcta ttatgttaca tataatatta 660 tatgtatatg tatatataat atacatatat atgttacata taatatactt ctattatgtt 720 acatataata tttatctata agtaaataca taaatataaa gatttgagta gctgtagaac 780 attgtcttat gtgttatcag ctactactac aaaaatatct cttccactta tgccagtttg 840 ccatataaat atgatcttct cattgatggc ccagggcaag agtgcagtgg gtacttattc 900 tctgtgagga gggaggagaa aagggaacaa ggagaaagtc acaaagggaa aactctggtg 960 ttgccaaaat gtcaagtttc acatattccg agacggaaaa tgacatgtcc cacagaagga 1020 ccctgcccag ctaatgtgtc acagatatct caggaagctt aaatgatttt tttaaaagaa 1080 aagagatggc attgtcactt gtttcttgta gctgaggctg tgggatgatg cagatttctg 1140 gaaggcaaag agctcctgct ttttccacac cgagggactt tcaggaatga ggccagggtg 1200 ctgagcacta caccaggaaa tccctggaga gtgtttttct tactta 1246 <210> 24 <211> 939 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR24 <400> 24 acgaggtcac gagttcgaga ccagcctggc caagatggtg aagccctgtc tctactaaaa 60 atacaacaag tagccgggcg cggtgacggg cgcctgtaat cccagctact caggaggctg 120 aagcaggaga atctctagaa cccaggaggc ggaggtgcag tgagctgaga ctgccccgct 180 gcactctagc ctgggcaaca cagcaagact ctgtctcaaa taaataaata aataaataaa 240 taaataaata aataaataaa tagaaaggga gagttggaag tagatgaaag agaagaaaag 300 aaatcctaga tttcctatct gaaggcacca tgaagatgaa ggccacctct tctgggccag 360 gtcctcccgt tgcaggtgaa ccgagttctg gcctccattg gagaccaaag gagatgactt 420 tggcctggct cctagtgagg aagccatgcc tagtcctgtt ctgtttgggc ttgatcctgt 480 atcacttgat tgtctctcct ggactttcca tggattccag ggatgcaact gagaagttta 540 tttttaatgc acttacttga agtaagagtt attttaaaac attttagcaa aggaaatgaa 600 ttctgacagg ttttgcactg aagacattca catgtgagga aaacaggaaa accactatgc 660 tagaaaaagc aaatgctgtt gagattgtct cacaaacaca aattgcgtgc cagcaggtag 720 gtttgagcct caggttgggc acattttacc ttaagcgcac tgttggtgga acttaaggtg 780 actgtaggac ttatatatac atacatacat ataatatata tacatattta tgtgtatata 840 cacacacaca cacacacaca cacacagggt cttgctatct tgcccagggt ggtctccaac 900 tctgggtctc aagcgatcct ctgcctcccc ttcccaaag 939 <210> 25 <211> 1067 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR25 <400> 25 ataaaaaaat aaaaaaccct gctctaattt gcaaaggctc tatctttcct cccaaccacc 60 tgaaatttta gtgaaaacgg ggcttcctgt aggaaggagt agctagctat cccggtccgc 120 tacaggttat cagtgcgtga ataccctgac tcctaaggct caggatttga ctgggtcgcc 180 tcgtccgact gccccgcccc caacgcggac ccacgtcacc gcgcgccagc ctgcggccgt 240 cctgacctcg cgggatttga gcttcggtgc caacaaacac tcccaccgcg gctgcgtcca 300 ctttacctgc cggcggcgac cagcttctga agaaaagtgt ccaccatggt gtcgaggagc 360 ttcaccctcg aaatggtagt gccgggtggc acagattccg aagacgaccc ctcatgcctt 420 ttttcctcac agccgctgcc tagattggcg ctacttgctt cggccatgtt gaagttgaac 480 ctccaaatct aactggcccg gcctccccgc ctgccggagc tcccgattgg ccgctcccgc 540 gaagggtgcc tccgattgga agcagtagaa cgtctgtcac cgagcagggc gggggcgggg 600 aagtcatcgg aggctgaggg cagcggggag gcgaggctct gcgcggtggg atgtccgcga 660 ccggaaaaat acgcgcaagc caaagctcgg gggctcaata aaaactttta attacatttc 720 agagacttcg tacagtgcaa cagtgaatat tcactgttaa ttttcacaag agtccatttc 780 atcaaacgtt cagagagtct gccttttcat tcccttgttc ctcagtgctc caatcaggtt 840 tccagtctcc cagaggtttc ttttagtttt gattaccgac caaaactcca gtttagggag 900 aatggaagtc caccgtccca tccccaccaa aacatatttc agtcaaaccc aatcccagtc 960 cctaaagaat taggaaagta tgggccaagg gtccttttaa ttatacacac atcaccctta 1020 aaactgcgtg tgtgtacgag aaataaagaa aaacacaaga ggggctg 1067 <210> 26 <211> 540 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR26 <400> 26 ccccctgaca agccccagtg tgtgatgttc cccactctgt gtccatgcat tctcattgtt 60 caactcccat ctgtgagtga gaacatgcag tgtttggttt tctgtccttg agatagtttg 120 ctgagaatga tggtttccag cttcatccat gtccttgcaa aggaagtgaa cttatccttt 180 tttatggctt catagtattc catggcacat atgtgccaca tttttttaat ccagtctatc 240 attgatggac atttgggttg gttccaagtc tttgctattg tgaatagcac cacaattaac 300 atatgtgtgc atgtatacat ctttatagta gcatgattta taatccttcg ggtatatacc 360 ctgtaatggg atcgctgggt caaatggtat ttctagttct agatccttga ggaatcacca 420 cactgctttc cacaatggtt gaactaattt acgctcccac cagcagtgta aaagcattcc 480 tatttctcca cgtcctctcc agtatctgtt gtttcctgac tttttaatga tcatcattct 540 <210> 27 <211> 1520 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR27 <400> 27 cttggccctc acaaagcctg tggccaggga acaattagcg agctgcttat tttgctttgt 60 atccccaatg ctgggcataa tgcctgccat tatgagtaat gccggtagaa gtatgtgttc 120 aaggaccaaa gttgataaat accaaagaat ccagagaagg gagagaacat tgagtagagg 180 atagtgacag aagagatggg aacttctgac aagagttgtg aagatgtact aggcaggggg 240 aacagcttaa ggagagtcac acaggaccga gctcttgtca agccggctgc catggaggct 300 gggtggggcc atggtagctt tcccttcctt ctcaggttca gagtgtcagc cttgaacttc 360 taattcccag aggcatttat tcaatgtttt cttctagggg catacctgcc ctgctgtgga 420 agactttctt ccctgtgggt cgccccagtc cccagatgag acggtttggg tcagggccag 480 gtgcaccgtt gggtgtgtgc ttatgtctga tgacagttag ttactcagtc attagtcatt 540 gagggaggtg tggtaaagat ggagatgctg ggtcacatcc ctagagaggt gttccagtat 600 gggcacatgg gagggctgga aggataggtt actgctagac gtagagaagc cacatccttt 660 aacaccctgg cttttcccac tgccaagatc cagaaagtcc ttgtggtttc gctgctttct 720 cctttttttt tttttttttt tttctgagat ggagtctggc tctgtcgccc aggctggagt 780 gcagtggcac gatttcggct cactgcaagt tccgcctcct aggttcatac cattctccca 840 cctcagcctc ccgagtagct gggactacag gcgccaccac acccagctaa ttttttgtat 900 ttttagtaga gacggcgttt caccatgtta gccaggatgg tcttgatccg cctgcctcag 960 cctcccaaag tgctgggatt acaggcgtga gccaccgcgc ccggcctgct ttcttctttc 1020 atgaagcatt cagctggtga aaaagctcag ccaggctggt ctggaactct tgacctcaag 1080 tgatctgcct gcctcagcct cccaaagtgc tgagattaca ggcatgagcc agtccgaatg 1140 tggctttttt tgttttgttt tgaaacaagg tctcactgtt gcccaggctg cagtgcagtg 1200 gcatacctca gctccactgc agcctcgacc tcctgggctc aagcaatcct cccaactgag 1260 cctccccagt agctggggct acaagcgcat gccaccacgc ctggctattt tttttttttt 1320 tttttttttt gagaaggagt ttcattcttg ttgcccaggc tggagtgcaa tggcacagtc 1380 tcagctcact gcagcctccg cctcctgggt tcaagcgatt ctcctgcctc agcctcccga 1440 gtagctggga ttataggcac ctgccaccat gcctggctaa tttttttgta tttttagtag 1500 ggatggggtt tcaccatgtt 1520 <210> 28 <211> 961 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR28 <400> 28 aggaggttat tcctgagcaa atggccagcc tagtgaactg gataaatgcc catgtaagat 60 ctgtttaccc tgagaagggc atttcctaac tctccctata aaatgccaag tggagcaccc 120 cagatgaaat agctgatatg ctttctatac aagccatcta ggactggctt tatcatgacc 180 aggatattca cccactgaat atggctatta cccaagttat ggtaaatgct gtagttaagg 240 gggtcccttc cacatggaca ccccaggtta taaccagaaa gggttcccaa tctagactcc 300 aagagagggt tcttagacct catgcaagaa agaacttggg gcaagtacat aaagtgaaag 360 caagtttatt aagaaagtaa agaaacaaaa aaatggctac tccataagca aagttatttc 420 tcacttatat gattaataag agatggatta ttcatgagtt ttctgggaaa ggggtgggca 480 attcctggaa ctgagggttc ctcccacttt tagaccatat agggtatctt cctgatattg 540 ccatggcatt tgtaaactgt catggcactg atgggagtgt cttttagcat tctaatgcat 600 tataattagc atataatgag cagtgaggat gaccagaggt cacttctgtt gccatattgg 660 tttcagtggg gtttggttgg cttttttttt tttttaacca caacctgttt tttatttatt 720 tatttattta tttatttatt tatatttttt attttttttt agatggagtc ttgctctgtc 780 acccaggtta gagtgcagtg gcaccatctc ggctcactgc aagctctgcc tccttggttc 840 acgccattct gctgcctcag cctcccgagt agctgggact acaggtgcct gccaccatac 900 ccggctaatt ttttctattt ttcagtagag acggggtttc accgtgttag ccaggatggt 960 c 961 <210> 29 <211> 2233 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR29 <400> 29 agcttggaca cttgctgatg ccactttgga tgttgaaggg ccgccctctc ccacaccgct 60 ggccactttt aaatatgtcc cctctgccca gaagggcccc agaggagggg ctggtgaggg 120 tgacaggagt tgactgctct cacagcaggg ggttccggag ggaccttttc tccccattgg 180 gcagcataga aggacctaga agggccccct ccaagcccag ctgggcgtgc agggccagcg 240 attcgatgcc ttcccctgac tcaggtggcg ctgtcctaaa ggtgtgtgtg ttttctgttc 300 gccagggggt ggcggataca gtggagcatc gtgcccgaag tgtctgagcc cgtggtaagt 360 ccctggaggg tgcacggtct cctccgactg tctccatcac gtcaggcctc acagcctgta 420 ggcaccgctc ggggaagcct ctggatgagg ccatgtggtc atccccctgg agtcctggcc 480 tggcctgaag aggaggggag gaggaggcca gcccctccct agccccaagg cctgcgaggc 540 tgcaagcccg gccccacatt ctagtccagg cttggctgtg caagaagcag attgcctggc 600 cctggccagg cttcccagct aggatgtggt atggcagggg tgggggacat tgaggggctg 660 ctgtagcccc cacaacctcc ccaggtaggg tggtgaacag taggctggac aagtggacct 720 gttcccatct gagattcaag agcccacctc tcggaggttg cagtgagccg agatccctcc 780 actgcactcc agcctgggca acagagcaag actctgtctc aaaaaaacag aacaacgaca 840 acaaaaaacc cacctctggc ccactgccta actttgtaaa taaagtttta ttggcacata 900 gacacaccca ttcatttaca tactgctgcg gctgcttttg cattaccctt gagtagacga 960 cagaccacgt ggccatggaa gccaaaaata tttactgtct ggccctttac agaagtctgc 1020 tctagaggga gaccccggcc catggggcag gaccactggg cgtgggcaga agggaggcct 1080 cggtgcctcc acgggcctag ttgggtatct cagtgcctgt ttcttgcatg gagcaccagg 1140 ggtcagggca agtacctgga ggaggcaggc tgttgcccgc ccagcactgg gacccaggag 1200 accttgagag gctcttaacg aatgggagac aagcaggacc agggctccca ttggctgggc 1260 ctcagtttcc ctgcctgtaa gtgagggagg gcagctgtga aggtgaactg tgaggcagag 1320 cctctgctca gccattgcag gggcggctct gccccactcc tgttgtgcac ccagagtgag 1380 gggcacgggg tgagatgtca ccatcagccc ataggggtgt cctcctggtg ccaggtcccc 1440 aagggatgtc ccatcccccc tggctgtgtg gggacagcag agtccctggg gctgggaggg 1500 ctccacactg ttttgtcagt ggtttttctg aactgttaaa tttcagtgga aaattctctt 1560 tcccctttta ctgaaggaac ctccaaagga agacctgact gtgtctgaga agttccagct 1620 ggtgctggac gtcgcccaga aagcccaggt actgccacgg gcgccggcca ggggtgtgtc 1680 tgcgccagcc atgggcacca gccaggggtg tgtctacgcc ggccaggggt aggtctccgc 1740 cggcctccgc tgctgcctgg ggagggccgt gcctgacact gcaggcccgg tttgtccgcg 1800 gtcagctgac ttgtagtcac cctgcccttg gatggtcgtt acagcaactc tggtggttgg 1860 ggaaggggcc tcctgattca gcctctgcgg acggtgcgcg agggtggagc tcccctccct 1920 ccccaccgcc cctggccagg gttgaacgcc cctgggaagg actcaggccc gggtctgctg 1980 ttgctgtgag cgtggccacc tctgccctag accagagctg ggccttcccc ggcctaggag 2040 cagccgggca ggaccacagg gctccgagtg acctcagggc tgcccgacct ggaggccctc 2100 ctggcgtcgc ggtgtgactg acagcccagg agcgggggct gttgtaattg ctgtttctcc 2160 ttcacacaga accttttcgg gaagatggct gacatcctgg agaagatcaa gaagtaagtc 2220 ccgcccccca ccc 2233 <210> 30 <211> 1851 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR30 <400> 30 cctcccctgg agccttcaga aggagcatgg cataggagtc ttgatttcag acgtctggtc 60 cccagaatga tgggagaatg aatttctgtt atttaagcca cccaacctgt ggtgctttgt 120 tatagcagcc tcaggaaact aacacactgc acgtgcccac tattcccttt tccagtatct 180 ttcaggactt gctggcttcc tttgttctgg cgtacaccca tgcatggccc cattccccac 240 ttcctaaaac aacaaccctg acttagtctg tttgggctgc tagaacaaaa tactatagac 300 tgggtgactt ataaacaaca gaaattcatt tctcacattc tggaggctgg gaagtccaat 360 atcgaggcac catcacattt ggtctctgct gaggccccct tcctagctcc tcactgtgtc 420 cttacatggc agaaggggca aggcagctct ctggggtccc ttttcaaggc cacaaatccc 480 attcattagg gctgatgact tcatgactta atcacctcct aatggcccca cctcctaatc 540 gcattgggcg ttaggattca acataaattt tggggggaca cacatattca gaccatagca 600 aaccccaaca ataaaaaacc ttcactttaa ggttccaaat ggactggcag ttaaatcatg 660 ttcatattta cataaaagaa ggagtaagtc aacaaattga taaacgcgtg gagatttgtt 720 cggatggatg ttcaccaaaa tgctggcctt aaagagtgag atgggaaatg ggaactatta 780 cattcttctt catacttttt ggtactgcct gcattgttaa aaaaaaaaaa aaagagcaca 840 gagcattttt acaatcagga aaaaaacaat gaggttatct tcattctgga aaaaaatgga 900 aaatgaaaca gtggagtcac atcatggaaa atgcttatgg tacaatttca tgtgacataa 960 aacaatagaa tagaggacct gttttatgac taaagcactg taaaaatgac aggcctggaa 1020 ggagagatga aaaccactca tttgttaagg tagtcaggtg gcaggtgatt tctcttcttt 1080 tgaaaatttc cattttcatt atatcgcagt ttgtgcattt actaaaactt tcggttggta 1140 cacatgcata aatagataga taaataagta gatagatgat agataaatag acggtaggta 1200 gatagataga tagatatgag aaataagtcc cctgtacttg gccttgcagc cataactagt 1260 cattcccctt cctctgtcca ttgctatgcc tgatggacaa ggcagtctgt gccctctggc 1320 cccaattcca atgtgccctc tgctcctggc tgttagtccc tttccacccc aatacaattg 1380 ctccgaggtc acttctaagt gtgaagcccc cagatcagat ggcttcttct gtgtccttac 1440 cttacccaat ttctaattat aactaaaaca caatgaggct ctagtaaaat accatgagac 1500 ttcaggccct ctgtataact tcactcattt aaacctaaca aggaaaacct accatgaatc 1560 cgaggcacag agcagctaag gaactcacca aggtcacgca gctattggtg atggaaccat 1620 gagtcaagct tcacagcctg ttggctctag aatagggttt cccaacctca gcactgtgga 1680 cattttcagg ctggataatt ctctgttgtg gggggctgtt ctgtgccttg taggatatta 1740 ggagcatctc tggcctctac ccactagacg cagcagcact cccatgccca gttgtgacaa 1800 caagcaatgt ctcccaccat tgccaagtgt cccctgggtg gaaatgcacc c 1851 <210> 31 <211> 1701 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR31 <220> <221> misc_feature <222> (159)..(1696) <223> "N" stands for any nucleic acid on various positions <400> 31 cacccgcctt ggccccccag agtgctggga ttacaagtgt aaaccaccat tcctggctag 60 atttaatttt ttaaaaaata aagagaagta ggaatagttc attttaggga gagcccctta 120 actgggacag gggcaggaca ggggtgaggc ttcccttant tcaagctcac ctcaaaccca 180 cccaggactg tgtgtcacat tctccaataa aggaaaggtt gctgcccccg cctgtgagtg 240 ctgcagtgga gggtagaggg ccgtgggcag agtgcttcat ggactgctca tcaagaaagg 300 cttcatgaca atcggcccag ctgctgtcat cccacattct acttccagct aggagaaggc 360 ggcttgccca cagtcaccca gccggcaagt gtcacccctg ggttggaccc agagctatga 420 tcctgcccag gggtccagct gagaatcagg cccacgttct aggcagaggg gctcacctac 480 tgggactcca gtagctgtag tgcatggagg catcatggct gcagcagcct ggacctggtc 540 tcacactggc tgtccctgtg ggcaggccat cctcaatgcc aggtcaggcc caagcatgta 600 tcccagacaa tgacaatggg gtggaatcct ctcttgtccc agaagccact cctcactgtt 660 ctacctgagg aaggcagggg catggtggaa tcctgaagcc tgctgtgagg gtctccagcg 720 aacttgcaca tggtcagccc tgccttctcc tccctgaact agattgagcg agagcaagaa 780 ggacattgaa ccagcaccca aagaattttg gggaacggcc tctcatccag gtcaggctca 840 cctccttttt aaaatttaat taattaatta attaattttt ttttagagac agagtcttac 900 tgtgtggccc aggctgtagt gcagtggcac aatcatagtt cactgcagcc tcaaactccc 960 cacctcagcc tctggattag ctgagactac aggtgcacca ccaccacacc cagctaatat 1020 ttttattttt gtagagagag ggtttcacca tcttgcccag gctggtctca aactcctggg 1080 ctcaagtgat cccgcccagg tctgaaagcc cccaggctgg cctcagactg tggggttttc 1140 catgcagcca cccgagggcg cccccaagcc agttcatctc ggagtccagg cctggccctg 1200 ggagacagag tgaaaccagt ggtttttatg aacttaactt agagtttaaa agatttctac 1260 tcgatcactt gtcaagatgc gccctctctg gggagaaggg aacgtgactg gattccctca 1320 ctgttgtatc ttgaataaac gctgctgctt catcctgtgg gggccgtggc cctgtccctg 1380 tgtgggtggg gcctcttcca tttccctgac ttagaaacca cagtccacct agaacagggt 1440 ttgagaggct tagtcagcac tgggtagcgt tttgactcca ttctcggctt tcttcttttt 1500 ctttccagga tttttgtgca gaaatggttc ttttgttgcc gtgttagtcc tccttggaag 1560 gcagctcaga aggcccgtga aatgtcgggg gacaggaccc ccagggaggg aaccccaggc 1620 tacgcacttt agggttcgtt ctccagggag ggcgacctga cccccgnatc cgtcggngcg 1680 cgnngnnacn aannnnttcc c 1701 <210> 32 <211> 771 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR32 <400> 32 gatcacacag cttgtatgtg ggagctagga ttggaacccc agaagtctgg ccccaggttc 60 atgctctcac ccactgcata caatggcctc tcataaatca atccagtata aaacattaga 120 atctgcttta aaaccataga attagtagcg taagtaataa atgcagagac catgcagtga 180 atggcattcc tggaaaaagc ccccagaagg aattttaaat cagctttcgt ctaatcttga 240 gcagctagtt agcaaatatg agaatacagt tgttcccaga taatgcttta tgtctgacca 300 tcttaaactg gcgctgtttt tcaaaaactt aaaaacaaaa tccatgactc ttttaattat 360 aaaagtgata catgtctact tgggaggctg aggtggtggg aggatggctt gagtttgagg 420 ctgcagtatg ctactatcat gcctataaat agccgctgca ttccagcttg ggcaacatac 480 ccaggcccta tctcaaaaaa ataaaaagta atacatctac attgaagaaa attaatttta 540 ttgggttttt ttgcattttt attatacaca gcacacacag cacatatgaa aaaatgggta 600 tgaactcagg cattcaactg gaagaacagt actaaatcaa tgtccatgta gtcagcgtga 660 ctgaggttgg tttgtttttt cttttttctt ctcttctctt ctcttttctt tttttttgag 720 acggagcttt gctctttttg cccaggcttg attgcaatgg cgtgatctca g 771 <210> 33 <211> 1368 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR33 <400> 33 gcttttatcc tccattcaca gctagcctgg cccccagagt acccaattct ccctaaaaaa 60 cggtcatgct gtatagatgt gtgtggcttg gtagtgctaa agtggccaca tacagagctc 120 tgacaccaaa cctcaggacc atgttcatgc cttctcactg agttctggct tgttcgtgac 180 acattatgac attatgatta tgatgacttg tgagagcctc agtcttctat agcactttta 240 gaatgcttta taaaaaccat ggggatgtca ttatattcta acctgttagc acttctgttc 300 gtattaccca tcacatccca acatcaattc tcatatatgc aggtacctct tgtcacgcgc 360 gtccatgtaa ggagaccaca aaacaggctt tgtttgagca acaaggtttt tatttcacct 420 gggtgcaggt gggctgagtc tgaaaagaga gtcagtgaag ggagacaggg gtgggtccac 480 tttataagat ttgggtaggt agtggaaaat tacaatcaaa gggggttgtt ctctggctgg 540 ccagggtggg ggtcacaagg tgctcagtgg gagagccttt gagccaggat gagccagaag 600 gaatttcaca aggtaatgtc atcagttaag gcagggactg gccattttca cttcttttgt 660 ggtggaatgt catcagttaa ggcaggaacc ggccattttc acttcttttg tgattcttca 720 cttgcttcag gccatctgga cgtataggtg caggtcacag tcacagggga taagatggca 780 atggcatagc ttgggctcag aggcctgaca cctctgagaa actaaagatt ataaaaatga 840 tggtcgcttc tattgcaaat ctgtgtttat tgtcaagagg cacttatttg tcaattaaga 900 acccagtggt agaatcgaat gtccgaatgt aaaacaaaat acaaaacctc tgtgtgtgtg 960 tgtgtgtgag tgtgtgtgta tgtgtgtgtg tgtgtattag agaggaaaag cctgtatttg 1020 gaggtgtgat tcttagattc taggttcttt cctgcccacc ccatatgcac ccaccccaca 1080 aaagaacaaa caacaaatcc caggacatct tagcgcaaca tttcagtttg catattttac 1140 atatttactt ttcttacata ttaaaaaact gaaaatttta tgaacacgct aagttagatt 1200 ttaaattaag tttgttttta cactgaaaat aatttaatat ttgtgaagaa tactaataca 1260 ttggtatatt tcattttctt aaaattctga acccctcttc ccttatttcc ttttgacccg 1320 attggtgtat tggtcatgtg actcatggat ttgccttaag gcaggagg 1368 <210> 34 <211> 755 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR34 <400> 34 actgggcacc ctcctaggca ggggaatgtg agaactgccg ctgctctggg gctgggcgcc 60 atgtcacagc aggagggagg acggtgttac accacgtggg aaggactcag ggtggtcagc 120 cacaaagctg ctggtgatga ccaggggctt gtgtcttcac tctgcagccc taacacccag 180 gctgggttcg ctaggctcca tcctgggggt gcagaccctg agagtgatgc cagtgggagc 240 ctcccgcccc tccccttcct cgaaggccca ggggtcaaac agtgtagact cagaggcctg 300 agggcacatg tttatttagc agacaaggtg gggctccatc agcggggtgg cctggggagc 360 agctgcatgg gtggcactgt ggggagggtc tcccagctcc ctcaatggtg ttcgggctgg 420 tgcggcagct ggcggcaccc tggacagagg tggatatgag ggtgatgggt ggggaaatgg 480 gaggcacccg agatggggac agcagaataa agacagcagc agtgctgggg ggcaggggga 540 tgagcaaagg caggcccaag acccccagcc cactgcaccc tggcctccca caagccccct 600 cgcagccgcc cagccacact cactgtgcac tcagccgtcg atacactggt ctgttaggga 660 gaaagtccgt cagaacaggc agctgtgtgt gtgtgtgcgt gtatgagtgt gtgtgtgtga 720 tccctgactg ccaggtcctc tgcactgccc ctggg 755 <210> 35 <211> 1193 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR35 <220> <221> misc_feature <222> (355)..(1191) <223> "N" stands for any nucleic acid on various positions <220> <221> misc_feature <222> (312)..(1191) <223> "N" stands for any nucleic acid on various positions <400> 35 cgacttggtg atgcgggctc ttttttggtt ccatatgaac tttaaagtag tcttttccaa 60 ttctgtgaag aaagtcattg gtaggttgat ggggatggca ttgaatctgt aaattacctt 120 gggcagtatg gccattttca caatgttgat tcttcctatc catgatgatg gaatgttctt 180 ccattagttt gtatcctctt ttatttcctt gagcagtggt ttgtagttct ccttgaagag 240 gtccttcaca tcccttgtaa gttggattcc taggtatttt attctctttg aagcaaattg 300 tgaatgggag tncactcacg atttggctct ctgtttgtct gctgggtgta taaanaatgt 360 ngtgatnttn gtacattgat ttngtatccn tgagacttng ctgaatttgc ttnatcngct 420 tnngggaacc ttttgggctg aaacnatggg attttctaaa tatacaatca tgtcgtctgc 480 aaacagggaa caatttgact tcctcttttc ctaattgaat acactttatc tccttctcct 540 gcctaattgc cctgggcaaa acttccaaca ctatgntngn aataggagnt ggtgagagag 600 ggcatccctg ttcttgttgc cagnttttca aagggaatgc ttccagtttt ggcccattca 660 gtatgatatg ggctgtgggt ngtgtcataa atagctctta tnattttgaa atgtgtccca 720 tcaataccta atttattgaa agtttttagc atgaangcat ngttgaattt ggtcaaaggc 780 tttttctgca tctatggaaa taatcatgtg gtttttgtct ttggctcntg tttatatgct 840 ggatnacatt tattgatttg tgtatatnga acccagcctn ncatcccagg gatgaagccc 900 acttgatcca agcttggcgc gcngnctagc tcgaggcagg caaaagtatg caaagcatgc 960 atctcaatta gtcagcaccc atagtccgcc cctacctccg cccatccgcc cctaactcng 1020 nccgttcgcc cattctcgcc catggctgac taatnttttt annatccaag cggngccgcc 1080 ctgcttganc attcagagtn nagagnnttg gaggccnagc cttgcaaaac tccggacngn 1140 ttctnnggat tgaccccnnt taaatatttg gttttttgtn ttttcanngg nga 1193 <210> 36 <211> 1712 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR36 <400> 36 gatcccatcc ttagcctcat cgatacctcc tgctcacctg tcagtgcctc tggagtgtgt 60 gtctagccca ggcccatccc ctggaactca ggggactcag gactagtggg catgtacact 120 tggcctcagg ggactcagga ttagtgagcc ccacatgtac acttggcctc agtggactca 180 ggactagtga gccccacatg tacacttggc ctcaggggac tcaggattag tgagccccca 240 catgtacact tggcctcagg ggactcagga ttagtgagcc ccacatgtac acttggcctc 300 aggggactca ggactagtga gccccacatg tacacttggc ctcaggggac tcagaactag 360 tgagccccac atgtacactt ggcttcaggg gactcaggat tagtgagccc cacatgtaca 420 cttggacacg tgaaccacat cgatgtgctg cagagctcag ccctctgcag atgaaatgtg 480 gtcatggcat tccttcacag tggcacccct cgttccctcc ccacctcatc tcccattctt 540 gtctgtcttc agcacctgcc atgtccagcc ggcagattcc accgcagcat cttctgcagc 600 acccccgacc acacacctcc ccagcgcctg cttggccctc cagcccagct cccgcctttc 660 ttccttgggg aagctccctg gacagacacc ccctcctccc agccatggct ttttcctgct 720 ctgccccacg cgggaccctg ccctggatgt gctacaatag acacatcaga tacagtcctt 780 cctcagcagc cggcagaccc agggtggact gctcggggcc tgcctgtgag gtcacacagg 840 tgtcgttaac ttgccatctc agcaactagt gaatatgggc agatgctacc ttccttccgg 900 ttccctggtg agaggtactg gtggatgtcc tgtgttgccg gccacctttt gtccctggat 960 gccatttatt tttttccaca aatatttccc aggtctcttc tgtgtgcaag gtattagggc 1020 tgcagcgggg gccaggccac agatctctgt cctgagaaga cttggattct agtgcaggag 1080 actgaagtgt atcacaccaa tcagtgtaaa ttgttaactg ccacaaggag aaaggccagg 1140 aaggagtggg gcatggtggt gttctagtgt tacaagaaga agccagggag ggcttcctgg 1200 atgaagtggc atctgacctg ggatctggag gaggagaaaa atgtcccaaa agagcagaga 1260 gcccacccta ggctctgcac caggaggcaa cttgctgggc ttatggaatt cagagggcaa 1320 gtgataagca gaaagtcctt gggggccaca attaggattt ctgtcttcta aagggcctct 1380 gccctctgct gtgtgacctt gggcaagtta cttcacctct agtgctttgg ttgcctcatc 1440 tgtaaagtgg tgaggataat gctatcacac tggttgagaa ttgaagtaat tattgctgca 1500 aagggcttat aagggtgtct aatactagta ctagtaggta cttcatgtgt cttgacaatt 1560 ttaatcatta ttattttgtc atcaccgtca ctcttccagg ggactaatgt ccctgctgtt 1620 ctgtccaaat taaacattgt ttatccctgt gggcatctgg cgaggtggct aggaaagcct 1680 ggagctgttt cctgttgacg tgccagacta gt 1712 <210> 37 <211> 1321 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR37 <400> 37 atctctctct gccaaagcaa cagcggtccc tgccccaacc agactacccc actcagtggg 60 gttacggatg ctgctccagc atcctaacac tgcccagctg gtgcctgcct gtgctcaccc 120 acaaccccca ggccggcctt ccctgcagcc tgggcttggc caccttggcc tgattgagca 180 ctgaggcctc ctgggcaccc agccccatca ctgcacctgc tgcttccagc cccaccccac 240 cggctcaggg gttcttccca gcggcgctga tcatgaagtc aacatgcacg caagtcgtct 300 caggaaactt tttaatgaaa gtgtcggcca cggtggtgtg taggtggctg agctcagatt 360 gcagctgcta agacaccagc cacttaccaa gagaaagcca ggctgcttca aacccagggc 420 cggaggcaaa aaagcatcac ttccagccgg ggagtctgga agccacgcct tgtgggaggt 480 cacactggca tctaggcctt cgcctgcact gcagaaggag agccgggtcc ccctcctgga 540 gaacgctgcg ttccccagcc ccacaccggc tttgccacca cacaggctgt tgaggcagga 600 ggcgggtaag acgtagctgt agacccaaag caaccaccag ccctgggacc ctgcgggaga 660 ggagcacttt tagaacatgg aaaaatgtgg tcatcccatc attagacagc acacatccta 720 cataaataaa aagtcgtatg gggaaggagg ttggggaggg aataaaaaat tggcacagac 780 attgatagac tggtttccag tttcaaggta acagatgcac atcatgagac cagaggaggc 840 agagacaagg gctgaatttg gcttttctaa gcaacatgtg ttcctgcgca gggctgaatg 900 gtcgctgaga cagagatgga agccaggaca agggagccca ccgggcccag ataggtacag 960 agagcagagg ctcctgttct gtcctcgcca cccatgaggg tgacactgct tgtaaatggt 1020 ggctgtgctc tcccagcaag aaaaaagcac aactaaatcc acactgcaca cagacgcaga 1080 cagaaagcct tcaagtggct ctgttttctg ctccctgcct tgccaggtcc acaagcagag 1140 aggagtgtca ggcacatggc cccgctgtca ggctccccag tgagctgtag gctcagcagg 1200 agctgcccac tgacacacag gggacaccca ctcctgccac cttgggagcg gttgccagac 1260 agagccgcac tgggtgctgg tgtcatccag ggaccccaca cacttcctta aatgtgatcc 1320 t 1321 <210> 38 <211> 1445 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR38 <220> <221> misc_feature <222> (348)..(949) <223> "N" stands for any nucleic acid on various positions <400> 38 gatctatggg agtagcttcc ttagtgagct ttcccttcaa atactttgca accaggtaga 60 gaattttgga gtgaaggttt tgttcttcgt ttcttcacaa tatggatatg catcttcttt 120 tgaaaatgtt aaagtaaatt acctctcttt tcagatactg tcttcatgcg aacttggtat 180 cctgtttcca tcccagcctt ctataaccca gtaacatctt ttttgaaacc agtgggtgag 240 aaagacacct ggtcaggaac gcggaccaca ggacaactca ggctcaccca cggcatcaga 300 ctaaaggcaa acaaggactc tgtataaagt accggtggca tgtgtatnag tggagatgca 360 gcctgtgctc tgcagacagg gagtcacaca gacacttttc tataatttct taagtgcttt 420 gaatgttcaa gtagaaagtc taacattaaa tttgattgaa caattgtata ttcatggaat 480 attttggaac ggaataccaa aaaatggcaa tagtggttct ttctggatgg aagacaaact 540 tttcttgttt aaaataaatt ttattttata tatttgaggt tgaccacatg accttaagga 600 tacatataga cagtaaactg gttactacag tgaagcaaat taacatatct accatcgtac 660 atagttacat ttttttgtgt gacaggaaca gctaaaatct acgtatttaa caaaaatcct 720 aaagacaata catttttatt aactatagcc ctcatgatgt acattagatc gtgtggttgt 780 ttcttccgtc cccgccacgc cttcctcctg ggatggggat tcattcccta gcaggtgtcg 840 gagaactggc gcccttgcag ggtaggtgcc ccggagcctg aggcgggnac tttaanatca 900 gacgcttggg ggccggctgg gaaaaactgg cggaaaatat tataactgna ctctcaatgc 960 cagctgttgt agaagctcct gggacaagcc gtggaagtcc cctcaggagg cttccgcgat 1020 gtcctaggtg gctgctccgc ccgccacggt catttccatt gactcacacg cgccgcctgg 1080 aggaggaggc tgcgctggac acgccggtgg cgcctttgcc tgggggagcg cagcctggag 1140 ctctggcggc agcgctggga gcggggcctc ggaggctggg cctggggacc caaggttggg 1200 cggggcgcag gaggtgggct cagggttctc cagagaatcc ccatgagctg acccgcaggg 1260 cggccgggcc agtaggcacc gggcccccgc ggtgacctgc ggacccgaag ctggagcagc 1320 cactgcaaat gctgcgctga ccccaaatgc tgtgtccttt aaatgtttta attaagaata 1380 attaataggt ccgggtgtgg aggctcaagc cttaatcccc agcacctggc gaggccgagg 1440 aggga 1445 <210> 39 <211> 2331 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR39 <400> 39 tcactgcaac ctccacctcc caggttcaag tgattctcct gcctcggcct cccgagtagc 60 tgggactaca ggtgcatgac accgcacctg gctagttttt gtatttttag tagagacagg 120 gtttcactat gttggccagg ttggtctcga actcctgacc ttgtgatccg cccacctcgg 180 cctcccaaag tgctgggatt acagagtgag ccactgcgcc tggcctgcac cccttactat 240 tatatgcttt gcattttctt ttagatttga agaacctcat tataaactct agcactaatc 300 ttatgtcagt taaatgcata gcaaatatct cctgacgtgg gagaatatat atttgcaagt 360 cttcttgtga acatatgttt tcagttctag ggagccagac gcctatgagt gaaaagccta 420 gtcatcgtgg agaagtgcat tcaactttgt aagaaactgc caaaccttta ttcataatgg 480 ttgtataaat tttacattac caccaataat gtatgagagt tccagttgct tcacatcctc 540 accagcattt tgttttgtct gtcttttttc ctttggttat tctagtgggc ataagatata 600 atagtatccc ttgtggttta atgtaaattc cactgaagac taataacatt tgcatatttc 660 taattaataa gcctttttaa gtgacttttc aagtctttgc tcatttttat tagatatttg 720 ccttcttatt attgatttga aagaattata tttatatgct tatattctgg ttataagccc 780 tttgtcatta ttttccaaaa caatatttgg ttgtttctgt actactttcc ttgctccttt 840 gaattgactt ggtgccttgg ccaaaaatca attgaccaca tacatgtggg tgcatctcca 900 gactaccaca ttccgtttat ctatttgtct ctccttgtgt caataacact ctgtcttgat 960 aatggtaagt tttgagatca ggttgtgtaa gtcctcctaa tttttcctgg gttttcaata 1020 ttgctttgct ttttaaaaat tttgtatttt catttacatt ttaaaataaa cttgttagtg 1080 ggattttgat tggcattgca ctgaactcgt ggatcaattt ggggagattg gacattctta 1140 tatatggatc ccgtggtcat caactttaag aactctttct catccattag taactcaatc 1200 taggttcaga tgctactcgt tttctgctca gtctgtgtct gagcccctta tgctcttcat 1260 tttgtcatcc aattaacctc agctttgcat caatactatt tcttgctttg gtgcctgtta 1320 cctctcctct aatcaccaat ccacaactta cctccaaatt cagggcttgt ctcattcttc 1380 ccaggaggag tgctgctcag tctatctact tagtattata atttctctgg cttggtatca 1440 aggcactccc atttccggct tccatgagat gtctcagagg gcatgctgcc cggtgtagct 1500 gcatggtcaa gcttcttcat atctcttgcc tcatcactta aactcactat tttgtactcc 1560 tgcttcagct atagggagct actgttagtt tcttgaagac atatgctctc tctctctctc 1620 acatctggac ctgagcacat cctgttactg ctgcttgaaa caatgtgatc cccaggcaca 1680 caccattagc ttagaagcct cccctgattc ttcaaggctg gttgagtccc ttctctgtgc 1740 tctcatgaca acagttggca attcctcgtt gcagcaccta gcccatgatg ctctttggag 1800 gcagagactg agtctttctc actattgaat ttccagcatt catcacagag cctggcatat 1860 ataaagccct ccatcatatg tattaagtga atggataaat gaaaaaaagt tatatatatg 1920 tacatatatg tgtatatatg tatatgtata tatgtgtata tatgtgtgta tatgtgtgtg 1980 tatatatgta catatatatg tatctatgta catatatgta tatatgtata tatatgtgtg 2040 tgtatatgtg tgtgtgtatg tatatatatt acaatgaaat actattcagc cttaaaaagg 2100 cagggaatcc tgtcatttaa cacaatatgg ataaacctag aggactctaa aggcaaatac 2160 cacatgttct cactcacaaa atctaaacaa gttgaactcc tacaagtaga gagtaggatg 2220 atggttacca agggctgggg gacgggagag gatggggaaa gcatagctgt ccatcaaagg 2280 gtagaaagtt tcatttagac aagaggaatc agctttagtg atctatttca c 2331 <210> 40 <211> 1071 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR40 <400> 40 gctgtgattc aaactgtcag cgagataagg cagcagatca agaaagcact ccgggctcca 60 gaaggagcct tccaggccag ctttgagcat aagctgctga tgagcagtga gtgtcttgag 120 tagtgttcag ggcagcatgt taccattcat gcttgacttc tagccagtgt gacgagaggc 180 tggagtcagg tctctagaga gttgagcagc tccagcctta gatctcccag tcttatgcgg 240 tgtgcccatt cgctttgtgt ctgcagtccc ctggccacac ccagtaacag ttctgggatc 300 tatgggagta gcttccttag tgagctttcc cttcaaatac tttgcaacca ggtagagaat 360 tttggagtga aggttttgtt cttcgtttct tcacaatatg gatatgcatc ttcttttgaa 420 aatgttaaag taaattacct ctcttttcag atactgtctt catgcgaact tggtatcctg 480 tttccatccc agccttctat aacccagtaa catctttttt gaaaccagtg ggtgagaaag 540 acacctggtc aggaacgcgg accacaggac aactcaggct cacccacggc atcagactaa 600 aggcaaacaa ggactctgta taaagtaccg gtggcatgtg tattagtgga gatgcagcct 660 gtgctctgca gacagggagt cacacagaca cttttctata atttcttaag tgctttgaat 720 gttcaagtag aaagtctaac attaaatttg attgaacaat tgtatattca tggaatattt 780 tggaacggaa taccaaaaaa tggcaatagt ggttctttct ggatggaaga caaacttttc 840 ttgtttaaaa taaattttat tttatatatt tgaggttgac cacatgacct taaggataca 900 tatagacagt aaactggtta ctacagtgaa gcaaattaac atatctacca tcgtacatag 960 ttacattttt ttgtgtgaca ggaacagcta aaatctacgt atttaacaaa aatcctaaag 1020 acaatacatt tttattaact atagccctca tgatgtacat tagatctcta a 1071 <210> 41 <211> 1135 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR41 <400> 41 tgctcttgtt gcccaggctg cagtgcaatg gcgctgtctc ggctcatcgc aacctccgcc 60 tcccagattc aagtgattct cctgcctcac cctcccaagt agctgggatt accagtatgc 120 agcaacacgc ccggctaatt ttgtatttgt aatagagacg gggtttcttc atgttggtca 180 ggctggtctc aaattcctgc cctcaggtga tctgcccacc ttggcctccc aaagtgctgg 240 gattacaggc atgagccact gtgcccggcc tgggctgggg cttttaaggg gactggaggg 300 tgaggggctg gaaaattggg agagttgatt ggtggggcaa gggggatgta atcatcaggg 360 tgtacaaact gcactcttgg tttagtcagc tcctcgtggg gtccttcgga gcagctcagt 420 cagtagctcc atcagtatac aggacccaaa ggaatatctc aaagggaaaa cagcatttcc 480 taaggttcaa gttgtgatct acggagcagt taggggaact acaatcttgt gacagggtct 540 acatgcttct gaggcaatga gacaccaagc agctacgagg aagcagtcag agagcacgcc 600 gacctagtga ctgatgctga tgtgctgcga gctgggttca ttttcatttc tcccctcccc 660 ctgccctcat taattttgta aagtttatag ggaacatttc acccactctg ctgtggatcc 720 ctgtcactta cggagtctgt catcttggct gtatgggctg tggcctctgc ggtgcccatt 780 ctcaggaggt gtgagaccca tgaggaccgg aggtggacaa ggctagagac cacacccccc 840 cgctccatcc aatcatgttt tcctgggtgc ttggtttcta tgcaggctgc atgtccttag 900 tccctgcatg ggaacagctc ctgtggtgag caggcccctg aggaaggcct tgagcgggaa 960 tggagcctag gcttaggctg cctggtaaga gctggaggga accagccgag gcttgtgcta 1020 cttttttttc cagaatgaaa tacgtgactg atgttggtgt cctgcagcgc cacgtttccc 1080 gccacaacca ccggaacgag gatgaggaga acacactctc cgtggactgc acacg 1135 <210> 42 <211> 735 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR42 <400> 42 aagggtgaga tcactaggga gggaggaagg agctataaaa gaaagaggtc actcatcaca 60 tcttacacac tttttaaaac cttggttttt taatgtccgt gttcctcatt agcagtaagc 120 cctgtggaag caggagtctt tctcattgac caccatgaca agaccctatt tatgaaacat 180 aatagacaca caaatgttta tcggatattt attgaaatat aggaattttt cccctcacac 240 ctcatgacca cattctggta cattgtatga atgaatatac cataatttta cctatggctg 300 tatatttagg tcttttcgtg caggctataa aaatatgtat gggccggtca cagtgactta 360 cgcccgtagt cccagaactt tgggaggccg aggcgggtgg atcacctgag gtcgggagtt 420 caaaaccagc ctgaccaaca tggagaaacc ccgtctctgc taaaaataca aaaattaact 480 ggacacggtg gcgtatgcct gtaatcccag ctactcggga agctgaggca ggagaactgc 540 ttgaacccag gaggcggagg ttgtggtgag tcgagattgc gccattgcac tccagcctgg 600 gcaacaagag cgaaattcca tctcaaaaaa aagaaaaaag tatgactgta tttagagtag 660 tatgtggatt tgaaaaatta ataagtgttg ccaacttacc ttagggttta taccatttat 720 gagggtgtcg gtttc 735 <210> 43 <211> 1227 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR43 <400> 43 caaatagatc tacacaaaac aagataatgt ctgcccattt ttccaaagat aatgtggtga 60 agtgggtaga gagaaatgca tccattctcc ccacccaacc tctgctaaat tgtccatgtc 120 acagtactga gaccaggggg cttattccca gcgggcagaa tgtgcaccaa gcacctcttg 180 tctcaatttg cagtctaggc cctgctattt gatggtgtga aggcttgcac ctggcatgga 240 aggtccgttt tgtacttctt gctttagcag ttcaaagagc agggagagct gcgagggcct 300 ctgcagcttc agatggatgt ggtcagcttg ttggaggcgc cttctgtggt ccattatctc 360 cagcccccct gcggtgttgc tgtttgcttg gcttgtctgg ctctccatgc cttgttggct 420 ccaaaatgtc atcatgctgc accccaggaa gaatgtgcag gcccatctct tttatgtgct 480 ttgggctatt ttgattcccc gttgggtata ttccctaggt aagacccaga agacacagga 540 ggtagttgct ttgggagagt ttggacctat gggtatgagg taatagacac agtatcttct 600 ctttcatttg gtgagactgt tagctctggc cgcggactga attccacaca gctcacttgg 660 gaaaacttta ttccaaaaca tagtcacatt gaacattgtg gagaatgagg gacagagaag 720 aggccctaga tttgtacatc tgggtgttat gtctataaat agaatgcttt ggtggtcaac 780 tagacttgtt catgttgaca tttagtcttg ccttttcggt ggtgatttaa aaattatgta 840 tatcttgttt ggaatatagt ggagctatgg tgtggcattt tcatctggct ttttgtttag 900 ctcagcccgt cctgttatgg gcagccttga agctcagtag ctaatgaaga ggtatcctca 960 ctccctccag agagcggtcc cctcacggct cattgagagt ttgtcagcac cttgaaatga 1020 gtttaaactt gtttattttt aaaacattct tggttatgaa tgtgcctata ttgaattact 1080 gaacaacctt atggttgtga agaattgatt tggtgctaag gtgtataaat ttcaggacca 1140 gtgtctctga agagttcatt tagcatgaag tcagcctgtg gcaggttggg tggagccagg 1200 gaacaatgga gaagctttca tgggtgg 1227 <210> 44 <211> 1586 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR44 <400> 44 tgagttgggg tcctaagcca gaagttaact atgctttcat atattcttgc aagtagaagt 60 acagtgttgg tgtaaattcc ccttagatgg atagctaagc ccagaggaaa taatggtaat 120 tggaaccata tgaccgtatg caattcatgt gcatatttat atcaagaaaa gaacattata 180 ggtcgggtga gaccctattt tgttctgaca atgtcatctg tatttacatg tctgtttcgg 240 gagtttggat gtcaagggat tctgtgctgg attgtaaagc atgtgcttct gcttgatgta 300 gctactcaat tttgtattct tgactaataa agtcataaac ataattcaac ctctgtgtgc 360 gtgctctcct tccattaatt tatactttag caaaaagtat tgaatgtgtg tgttatgtaa 420 caatttccta taaattatat taaatgattt attagcttta ttcaataaag ttttaagtgt 480 tttcttctat gactacatta tttgttaaca agaaatttct ttaactgaaa acttcaagga 540 agactatctg ggtaactctt tcaaaaagaa ttgtccctgt attttgggat tgaatatatt 600 aatttcttgt actgttttaa cagcacataa ttttacaaga caagccactt tttcaaagcc 660 tgcttctcct cccattttcc ctatctctgt gattgacacc tccaacccct gtagcctgcc 720 tctgctctct cttaaccagt cctactgata ctacttccta agtatttttc agccctgtcc 780 ttcctctcca tcatgatgga ttcacttcca gttgaaatcc ttatggtacc ctccctggat 840 tatggcagta atcagagagc tggtctcctt aactcaggat tcacttcttc tcatctgttg 900 ttcacagtga catcagaaag atattttaaa atgatgaact agaattaatt atataaaaca 960 cacatacaca cataaataat acttaaattt ttcaatgatg ttccaattat gtaaaatata 1020 atataggagg cactttatgt tctggcctca atctttcaat tcaaacttat ctcctgccac 1080 tatctccttt gaacattgta ttccagctac tttagaataa taataataca taatattcat 1140 agagcccttc ctgggttcct atcaccgtac aaaatacttc acatataaca tttaatcttt 1200 gacaacttta ttaggcatgc acaattatta tctatctata tatctatatc tatatatata 1260 aaatctatat tttatagata agaaaataga gggtaaaaac ttgccaaaat tacaaagctt 1320 agaagtgtag cagttgggat ttgaatctag gcatcctgcc tctatagtct acagtggctt 1380 tcttgtgcca aaagccttgc agttccctag acttaacatt tctcaaaatc tgtgtctttc 1440 acatgctctt ccaattgtct ggaaaatctt tcccaacctc agtctaactg tggtactcat 1500 gttcacccca caagaattga ctccatctgt cccctctcca tgaaaatttc tttgaatctc 1560 agcactttgg gaggctgagg caggtg 1586 <210> 45 <211> 1981 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR45 <400> 45 cacgccccag cgtgccctgg actactgctc cgcaggactc ctgttctgct gcaccctgga 60 ctacggcacc agaggaccca gctcccgccg gcctgagcta tggcaccaga ggacccagct 120 cccggcagcc tggactatgg caccagagga cccagccccc cgcttcctgg gctaaggcac 180 agtaggaccc tgcctcatcg tgtactcctg ctcaggagga ccctcgcagg gcggcgcact 240 ggactaagct actgaaggag ccccacccct gcctaaccct ggactaaggc actggagaac 300 tcttgctccg cagagccacg gactcttgca caagagaacc tcagcccagc cgtgccctgg 360 actgtggcac agtagggccc acaccacgcc atggactcct gtattggagg aagagtagtg 420 ataaatgtcc aggtttacaa cttgaaaagt agcaatcaat gtgccacaat agatggatgt 480 gatgtaaaat tataaatgat gaaaacatta tgtgtaattg cctagccaga acagttacac 540 aagacaaaga cgtaaaagaa atccacatag ggaaggaaga ggtaagattg tttctgtttt 600 ttgaaaatat aatcttaaga tagagaaaat cttaaagatt ccaccaaaat aaatggttat 660 agctgatgaa gaaattcaat aaagttaata gttacaaaat caacatacaa atatcattat 720 tgtttctatt aactaatgac aaactattac ctgaaaaata aaggcaattc aatttataat 780 agaatcaaaa cagatatata aatatataaa agacaggagt aaatttaatc aaaaccataa 840 aagatttaca tactgaaaac tatagcacat tgatgaaaaa aattaaaatg gcataaataa 900 atggagaaac atccttcatt gatggattca aaaattagta ttgtaaaagt gtcaatgcta 960 cccaaagcaa tctacagatt aaatgcaacc actatcaaat tccaatgtca ttcttcacag 1020 aaatagaaaa attactgcta aaatttgtat ggaaccacaa aagacctgga ccaaccaaag 1080 caatcttgaa caaaaagaac aaagctggag gcatcagact acctgactcc aaactctatt 1140 acaaagctat aggaattaaa acagcatagc aatggcataa aaacagacat gtaaaacagt 1200 acaaagggat atagaacctg taaataaatc cgtgtgtctg tggtcaattg attttttgat 1260 aaaataacta aaaatacaca gtgaagaaag aaaattattt tcaataaatg gtgtagacaa 1320 aactgactat ccacatacag aagaataaaa tttgactttt attttgctct ttatacaagc 1380 atcaaatcaa aattaaagtt taaatgtaaa actactacaa ggaaatatag aaggagactg 1440 tatgacattg gcctgagcta tgattttctg tagattattc caaaaggcaa caaaagcaaa 1500 acacacaaat gagactgcat aaaacttaaa acttttccac aggaaaagaa gcaatgatag 1560 aattaagaga acccacaaat gggataatat ttttaaacca tacatcaggt aaggggctca 1620 tataataata tataagcaac tcaacctact caaaaataag aaaaaaacta tgcttattaa 1680 aaaataagca aagaatcaga atagacattt cctacatcat acaaaaggcc aaccaggtac 1740 atgaaaaaat cataaacatt cctaattatc agagaagtgc aaatcaatgc cacaatgaga 1800 tatcacctca cacattttac tagggctatt ataaaaaaag atggaagata agtgttggtg 1860 aggatgtgga gaaaaagaaa ccctgtacac tgttggtagg aatggaaatt agtacagcca 1920 tcttggaaaa cagtacgaag ctttctcaag aaattataaa tttatttacc ctatgatcca 1980 t 1981 <210> 46 <211> 1859 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR46 <400> 46 attgtttttc tcgcccttct gcattttctg caaattctgt tgaatcattg cagttactta 60 ggtttgcttc gtctccccca ttacaaacta cttactgggt ttttcaaccc tagttccctc 120 atttttatga tttatgctca tttctttgta cacttcgtct tgctccatct cccaactcat 180 ggcccctggc tttggattat tgttttggtc ttttattttt tgtcttcttc tacctcaaca 240 cttatcttcc tctcccagtc tccggtaccc tatcaccaag gttgtcatta acctttcata 300 ttattcctca ttatccatgt attcatttgc aaataagcgt atattaacaa aatcacaggt 360 ttatggagat ataattcaca taccttaaaa ttcaggcttt taaagtgtac ctttcatgtg 420 gtttttggta tattcacaaa gttatgcatt gatcaccacc atctgattcc ataacatgtt 480 caatacctca aaaagaagtc tgtactcatt agtagtcatt tcacattcac cactccctct 540 ggctctgggc agtcactgat ctttgtgtct ctatggattt gcctagtcta ggtattttta 600 tgtaaatggc atcatacaac atgtgacctt ttgtttggct tttttcattt agcaaaatgt 660 tatcaaggtc tgtccctgtt gtagcatgta ttagcacttc atttcttata tgctgaatga 720 tatactttat ttgtccatca gttgttcatg ctttatttgt ccatcagttg atgaacattt 780 gcgtttttgc cactttgggc tattaagaat aatgctactg tgaacaagtg tgtacaagtt 840 cctctacaaa tttttgtgtg gacatatcct ttcagttctc tcaggtgtat atctgggaat 900 tgaattgctg ggtcgtgtag tagctatgtt aaacactttg agaaactgct ataatgttct 960 ccagagctgt accattttaa attctgtgta tgaggattcc acgttctcca cttcctcacc 1020 agtgtatgga tttgggggta tactttttaa aaagtgggat taggctgggc acagtggctc 1080 acacctgtaa tcccaacact tcaggaagct gaggtgggag gatcacttga gcctagtagt 1140 ttgagaccag cctgggcaac atagggagac cctgtctcta caaaaaataa tttaaaataa 1200 attagctggg cgttgtggca cacacctgta gtcccagcta catgggaggc tgaggtggaa 1260 ggattccctg agcccagaag tttgaggttg cagtgagcca tgatggcagc actatactgt 1320 agcctgggtg tcagagcaag actccgtttc agggaagaaa aaaaaaagtg ggatgatatt 1380 tttgacactt ttcttcttgt tttcttaatt tcatacttct ggaaattcca ttaaattagc 1440 tggtaccact ctaactcatt gtgtttcatg gctgcatagt aatattgcat aatataaata 1500 taccattcat tcatcaaagt tagcagatat tgactgttag gtgccaggca ctgctctaag 1560 cgttaaagaa aaacacacaa aaacttttgc attcttagag tttattttcc aatggagggg 1620 gtggagggag gtaagaattt aggaaataaa ttaattacat atatagcata gggtttcacc 1680 agtgagtgca gcttgaatcg ttggcagctt tcttagtagt ataaatacag tactaaagat 1740 gaaattactc taaatggtgt tacttaaatt actggaatag gtattactat tagtcacttt 1800 gcaggtgaaa gtggaaacac catcgtaaaa tgtaaaatag gaaacagctg gttaatgtt 1859 <210> 47 <211> 1082 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR47 <400> 47 atcattagtc attagggaaa tgcaaatgaa aaacacaagc agccaccaat atacacctac 60 taggatgatt taaaggaaaa taagtgtgaa gaaggacgta aagaaattgt aaccctgata 120 cattgatggt agaaatggat aaagttgcag ccactgtgaa aaacagtctg cagtggctca 180 gaaggttaaa tatagaaccc ctgttggacc caggaactct actcttaggc accccaaaga 240 atagagaaca gaaatcaaac agatgtttgt atactaatgt ttgtagcatc acttttcaca 300 ggagccaaaa ggtggaaata atccaaccat cagtgaacaa atgaatgtaa taaaagcaag 360 gtggtctgca tgcaatgcta catcatccat ctgtaaaaaa cgaacatcat tttgatagat 420 gatacaacat gggtggacat tgagaacatt atgcttagtg aaataagcca gacacaaaag 480 gaatatattg tataattgta attacatgaa gtgcctagaa tagtcaaatt catacaagag 540 aaagtgggat aggaatcacc atgggctgga aataggggga aggtgctata ctgcttattg 600 tggacaaggt ttcgtaagaa atcatcaaaa ttgtgggtgt agatagtggt gttggttatg 660 caaccctgtg aatatattga atgccatgga gtgcacactt tggttaaaag gttcaaatga 720 taaatattgt gttatatata tttccccacg atagaaaaca cgcacagcca agcccacatg 780 ccagtcttgt tagctgcctt cctttacctt caagagtggg ctgaagcttg tccaatcttt 840 caaggttgct gaagactgta tgatggaagt catctgcatt gggaaagaaa ttaatggaga 900 gaggagaaaa cttgagaatc cacactactc accctgcagg gccaagaact ctgtctccca 960 tgctttgctg tcctgtctca gtatttcctg tgaccacctc ctttttcaac tgaagacttt 1020 gtacctgaag gggttcccag gtttttcacc tcggcccttg tcaggactga tcctctcaac 1080 ta 1082 <210> 48 <211> 1242 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR48 <400> 48 atcatgtatt tgttttctga attaattctt agatacatta atgttttatg ttaccatgaa 60 tgtgatatta taatataata tttttaattg gttgctactg tttataagaa tttcattttc 120 tgtttacttt gccttcatat ctgaaaacct tgctgatttg attagtgcat ccacaaattt 180 tcttggattt tctatgggta attacaaatc tccacacaat gaggttgcag tgagccaaga 240 tcacaccact gtactccagc ctgggcgaca gagtgagaca ccatctcaca aaaacacata 300 aacaaacaaa cagaaactcc acacaatgac aacgtatgtg ctttcttttt ttcttcctct 360 ttctataata tttctttgtc ctatcttaac tgaactggcc agaaacccca ggacaatgat 420 aaatacgagc agtgtcaaca gacatctcat tccctttcct agcttttata aaaataacga 480 ttatgcttca acattacata tggtggtgtc gatggttttg ttatagataa gcttatcagg 540 ttaagaaatt tgtctgcgtt tcctagtttg gtataaagat tttaatataa atgaatgttg 600 tattttatca tcttattttt ttcctacatc tgctaaggta atcctgtgtt ttcccctttt 660 caatctccta atgtggtgaa tgacattaaa ataccttcta ttgttaaaat attcttgcaa 720 cgctgtatag aaccaatgcc tttattctgt attgctgatg gatttttgaa aaatatgtag 780 gtggacttag ttttctaagg ggaatagaat ttctaatata tttaaaatat tttgcatgta 840 tgttctgaag gacattggtg tgtcatttct ataccatctg gctactagag gagccgactg 900 aaagtcacac tgccggagga ggggagaggt gctcttccgt ttctggtgtc tgtagccatc 960 tccagtggta gctgcagtga taataatgct gcagtgccga cagttctgga aggagcaaca 1020 acagtgattt cagcagcagc agtattgcgg gatccccacg atggagcaag ggaaataatt 1080 ctggaagcaa tgacaatatc agctgtggct atagcagctg agatgtgagt tctcacggtg 1140 gcagcttcaa ggacagtagt gatggtccaa tggcgcccag acctagaaat gcacatttcc 1200 tcagcaccgg ctccagatgc tgagcttgga cagctgacgc ct 1242 <210> 49 <211> 1015 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR49 <400> 49 aaaccagaaa cccaaaacaa tgggagtgac atgctaaaac cagaaaccca aaacaatggg 60 agggtcctgc taaaccagaa acccaaaaca atgggagtga agtgctaaaa ccagaaaccc 120 aaaacaatgg gagtgtcctg ctacaccaga aacccaaaac gatgggagtg acgtgataaa 180 accagacacc caaaacaatg ggagtgacgt gctaaaccag aaacccaaaa caatgggagt 240 gacgtgctaa aacctggaaa cctaaaacaa tgcgagtgag gtgctaacac cagaatccat 300 aacaatgtga gtgacgtgct aaaccagaac ccaaaacaat gggagtgacg tgctaaaaca 360 ggaacccaaa acaatgagag tgacgtgcta aaccagaaac ccaaaacaat gggaatgacg 420 tgctaaaacc ggaacccaaa acaatgggag tgatgtgcta aaccagaaac ccaaaacaat 480 gggaatgaca tgctaaaact ggaacccaaa acaatggtaa ctaagagtga tgctaaggcc 540 ctacattttg gtcacactct caactaagtg agaacttgac tgaaaaggag gatttttttt 600 tctaagacag agttttggtc tgtcccccag agtggagtgc agtggcatga tctcggctca 660 ctgcaagctc tgcctcccgg gttcaggcca ttctcctgcc tcagcctcct gagtagctgg 720 gaatacaggc acccgccacc acacttggct aattttttgt atttttagta gagatggggt 780 ttcaccatat tagcaaggat ggtctcaatc tcctgacctc gtgatctgcc cacctcaggc 840 tcccaaagtg ctgggattac aggtgtgagc caccacaccc agcaaaaagg aggaattttt 900 aaagcaaaat tatgggaggc cattgttttg aactaagctc atgcaatagg tcccaacaga 960 ccaaaccaaa ccaaaccaaa atggagtcac tcatgctaaa tgtagcataa tcaaa 1015 <210> 50 <211> 2355 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR50 <400> 50 caaccatcgt tccgcaagag cggcttgttt attaaacatg aaatgaggga aaagcctagt 60 agctccattg gattgggaag aatggcaaag agagacaggc gtcattttct agaaagcaat 120 cttcacacct gttggtcctc acccattgaa tgtcctcacc caatctccaa cacagaaatg 180 agtgactgtg tgtgcacatg cgtgtgcatg tgtgaaagta tgagtgtgaa tgtgtctata 240 tgggaacata tatgtgattg tatgtgtgta actatgtgtg actggcagcg tggggagtgc 300 tggttggagt gtggtgtgat gtgagtatgc atgagtggct gtgtgtatga ctgtggcggg 360 aggcggaagg ggagaagcag caggctcagg tgtcgccaga gaggctggga ggaaactata 420 aacctgggca atttcctcct catcagcgag cctttcttgg gcaatagggg cagagctcaa 480 agttcacaga gatagtgcct gggaggcatg aggcaaggcg gaagtactgc gaggaggggc 540 agagggtctg acacttgagg ggttctaatg ggaaaggaaa gacccacact gaattccact 600 tagccccaga ccctgggccc agcggtgccg gcttccaacc ataccaacca tttccaagtg 660 ttgccggcag aagttaacct ctcttagcct cagtttcccc acctgtaaaa tggcagaagt 720 aaccaagctt accttcccgg cagtgtgtga ggatgaaaag agctatgtac gtgatgcact 780 tagaagaagg tctagggtgt gagtggtact cgtctggtgg gtgtggagaa gacattctag 840 gcaatgagga ctggggagag cctggcccat ggcttccact cagcaaggtc agtctcttgt 900 cctctgcact cccagccttc cagagaggac cttcccaacc agcactcccc acgctgccag 960 tcacacatag ttacacacat acaatcacat atatgttccc atatagacac attcacactc 1020 ataccttcac acatgcacac gcatgtgcac acacagtcac tcatttctgt gttggagatt 1080 gggtgaggac attcaatggg tgaggaccaa caggtgtgaa gattgctttc tagaaaatga 1140 ctcctgtctc tctttgccat tcttcccaat ccgatggagc tactaggctt ttccctcatt 1200 tcatgtttaa taaaccttcc caatggcgaa atgggctttc tcaagaagtg gtgagtgtcc 1260 catccctgcg gtggggacag gggtggcagc ggacaagcct gcctggaggg aactgtcagg 1320 ctgattccca gtccaactcc agcttccaac acctcatcct ccaggcagtc ttcattcttg 1380 gctctaattt cgctcttgtt ttctttttta tttttatcga gaactgggtg gagagctttt 1440 ggtgtcattg gggattgctt tgaaaccctt ctctgcctca cactgggagc tggcttgagt 1500 caactggtct ccatggaatt tcttttttta gtgtgtaaac agctaagttt taggcagctg 1560 ttgtgccgtc cagggtggaa agcagcctgt tgatgtggaa ctgcttggct cagatttctt 1620 gggcaaacag atgccgtgtc tctcaactca ccaattaaga agcccagaaa atgtggcttg 1680 gagaccacat gtctggttat gtctagtaat tcagatggct tcacctggga agccctttct 1740 gaatgtcaaa gccatgagat aaaggacata tatatagtag ctagggtggt ccacttctta 1800 ggggccatct ccggaggtgg tgagcactaa gtgccaggaa gagaggaaac tctgttttgg 1860 agccaaagca taaaaaaacc ttagccacaa accactgaac atttgttttg tgcaggttct 1920 gagtccaggg agggcttctg aggagagggg cagctggagc tggtaggagt tatgtgagat 1980 ggagcaaggg ccctttaaga ggtgggagca gcatgagcaa aggcagagag gtggtaatgt 2040 ataaggtatg tcatgggaaa gagtttggct ggaacagagt ttacagaata gaaaaattca 2100 acactattaa ttgagcctct actacgtgct cgacattgtt ctagtcactg agataggttt 2160 ggtatacaaa acaaaatcca tcctctatgg acattttagt gactaacaac aatataaata 2220 ataaaagtga acaaaagctc aaaacatgcc aggcactatt atttatttat ttatttattt 2280 atttatttat tttttgaaac agagtctcgc tctgttgccc aggctggagt gtagtggtgc 2340 gatctcggct cactg 2355 <210> 51 <211> 2289 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR51 <400> 51 tcacaggtga caccaatccc ctgaccacgc tttgagaagc actgtactag attgactttc 60 taatgtcagt cttcattttc tagctctgtt acagccatgg tctccatatt atctagtaca 120 acacacatac aaatatgtgt gatacagtat gaatataata taaaaatatg tgttataata 180 taaatataat attaaaatat gtctttatac tagataataa tacttaataa cgttgagtgt 240 ttaactgctc taagcacttt acctgcagga aacagttttt tttttatttt ggtgaaatac 300 aactaacata aatttattta caattttaag catttttaag tgtatagttt agtggagtta 360 atatattcaa aatgttgtgc agccgtcacc atcatcagtc ttcataactc ttttcatatt 420 gtaaaattaa aagtttatgc tcatttaaaa atgactccca atttcccccc tcctcaacct 480 ctggaaacta ccattctatt ttctgcctcc gtagttttgc ccactctaag tacctcacat 540 aagtggaatt tgtcttattt gcctgtttgt gaccggctga tttcatttag tataatgtcc 600 tcaagtttta ttcacgttat atagcatatg tcataatttt cttcactttt aagcttgagt 660 aatatttcat cgtatgtatc tcacattttg cttatccatt catctctcag tggacacttg 720 agttgcttct acattttagc tgttgtgaat actgctgcta tgaacatggg tgtataaata 780 tctcaagacc tttttatcag ttttttaaaa tatatactca gtagtagttt agctggatta 840 tatggtaatt ttatttttaa tttttgagga actgtcctac ccttttattc aatagtagct 900 ataccaattg acaattggca ttcctaccaa cagggcataa gggttctcaa ttctccacat 960 attccctgat acttgttatt ttcaggtgtt tttttttttt tttttttttt atgggagcca 1020 tgttaatggg tgtaaggtga tatttcatta tagttttgat ttgcatttcc ctaatgatta 1080 gtgatgttaa gcatctcttc atgtgcctat tggccatttg tatatcttct ttaaaaatat 1140 atatatactc attcctttgc ccatttttga attatgttta ttttttgtta ttgagtttca 1200 atacttttct atataaccta ggtattaatc ctttatcaga cttaagattt gcaaatattc 1260 tctttcattc cacaggttgc taattctctc tgttggtaat atcttttgat gctgttgtgt 1320 ccagaattga ttcattcctg tgggttcttg gtctcactga cttcaagaat aaagctgcgg 1380 accctagtgg tgagtgttac acttcttata gatggtgttt ccggagtttg ttccttcaga 1440 tgtgtccaga gtttcttcct tccaatgggt tcatggtctt gctgacttca ggaatgaagc 1500 cgcagacctt cgcagtgagg tttacagctc ttaaaggtgg cgtgtccaga gttgtttgtt 1560 ccccctggtg ggttcgtggt cttgctgact tcaggaatga agccgcagac cctcgcagtg 1620 agtgttacag ctcataaagg tagtgcggac acagagtgag ctgcagcaag atttactgtg 1680 aagagcaaaa gaacaaagct tccacagcat agaaggacac cccagcgggt tcctgctgct 1740 ggctcaggtg gccagttatt attcccttat ttgccctgcc cacatcctgc tgattggtcc 1800 attttacaga gtactgattg gtccatttta cagagtgctg attggtgcat ttacaatcct 1860 ttagctagac acagagtgct gattgctgca ttcttacaga gtgctgattg gtgcatttac 1920 agtcctttag ctagatacag aacgctgatt gctgcgtttt ttacagagtg ctgattggtg 1980 catttacaat cctttagcta gacacagtgc tgattggtgg gtttttacag agtgctgatt 2040 ggtgcgtctt tacagagtgc tgattggtgc atttacaatc ctttagctag acacagagtg 2100 ctgattggtg cgtttataat cctctagcta gacagaaaag ttttccaagt ccccacctga 2160 ccgagaagcc ccactggctt cacctctcac tgttatactt tggacatttg tccccccaaa 2220 atctcatgtt gaaatgtaac ccctaatgtt ggaactgagg ccagactgga tgtggctggg 2280 ccatgggga 2289 <210> 52 <211> 1184 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR52 <400> 52 cttatgccat ctggcggtgc catgtggaac ttcgctgaag aagctaaatt tactgaccat 60 ctgtgcctag agcgggtttc tccaaggaaa ggctctgtaa atctcgtcct tttgaaatct 120 aggggaaaac agcctccttc actgaggatt aatttaaaga aagggggaaa taggaaaatt 180 ccatgcgttg gaagtccatt tagatttcta catgaaccat catatatgtg cactacataa 240 ttcttatttt tttattttta aaaaagggat aatttatatt ccagtgacaa gtttgggaaa 300 ggccaaggca agcaattgag ttgaacatta tgtagcgttt atatagacct tgcagacgtc 360 tgtgcaatat ccaccactga acacgtgagg tcgtactcaa gtctctctgg cccctggtaa 420 tgtgactccc ttcctttatt tgcatgaatc gcctggattg ggtgtcaggt ttttaaaacg 480 tcaaggttta cgcctattgt tgtcaaccaa tcagcatcct actttgacgt gattggcttc 540 tactgtaggt gtcaatcatc caaaatttgc atactactcc tcaggccgcc gggagcctgt 600 cagtcggctg tggcagctgg aagagaagga atcggacgga gaagaatgaa aaatcacttt 660 gctttcgcaa agcgaaagaa aagtattctt ttcctcatta tttttaaata aatttgattg 720 tatatttacc taataaaata aacattcaat taaacaaaaa taagcaacta tcaaagattt 780 gtttactaat tttcgtaatg tttactgttt caataagtag ccaaaggaat attaaaacac 840 aaaaatatga atgctgataa ttttatgtca taaagaccat tttaaaacta aaagtgaaca 900 tggggtttct aaataaaatt accgtggtag cgtaaaaaca ctgctttcaa tacttgggca 960 tgctgaaagt gctgcatcct aagataaaaa atacaccaag ggggggattt caaagaacat 1020 tattttgctt ttaataatcc tgtatttctg tcactttgcc ctttttattt atttaccgtg 1080 aactcacaga cagaatatta cttggagttt ctgaaatact tgtgtttgta catttctcat 1140 cttacacgta cccacacacc ccaaaataaa aaaacaaaga agag 1184 <210> 53 <211> 1431 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR53 <400> 53 ccctgaggaa gatgacgagt aactccgtaa gagaaccttc cactcatccc ccacatccct 60 gcagacgtgc tattctgtta tgatactggt atcccatctg tcacttgctc cccaaatcat 120 tcccttctta caattttcta ctgtacagca ttgaggctga acgatgagag atttcccatg 180 ctctttctac tccctgccct gtatatatcc ggggatcctc cctacccagg atgctgtggg 240 gtcccaaacc ccaagtaagc cctgatatgc gggccacacc tttctctagc ctaggaattg 300 ataacccagg cgaggaagtc actgtggcat gaacagatgg ttcacttcga ggaaccgtgg 360 aaggcgtgtg caggtcctga gatagggcag aatcggagtg tgcagggtct gcaggtcagg 420 aggagttgag attgcgttgc cacgtggtgg gaactcactg ccacttattt ccttctctct 480 tcttgcctca gcctcaggga tacgacacat gcccatgatg agaagcagaa cgtggtgacc 540 tttcacgaac atgggcatgg ctgcggaccc ctcgtcatca ggtgcatagc aagtgaaagc 600 aagtgttcac aacagtgaaa agttgagcgt catttttctt agtgtgccaa gagttcgatg 660 ttagcgttta cgttgtattt tcttacactg tgtcattctg ttagatacta acattttcat 720 tgatgagcaa gacatactta atgcatattt tggtttgtgt atccatgcac ctaccttaga 780 aaacaagtat tgtcggttac ctctgcatgg aacagcatta ccctcctctc tccccagatg 840 tgactactga gggcagttct gagtgtttaa tttcagattt tttcctctgc atttacacac 900 acacgcacac aaaccacacc acacacacac acacacacac acacacacac acacacacac 960 acacaccaag taccagtata agcatctgcc atctgctttt cccattgcca tgcgtcctgg 1020 tcaagctccc ctcactctgt ttcctggtca gcatgtactc ccctcatccg attcccctgt 1080 agcagtcact gacagttaat aaacctttgc aaacgttccc cagttgtttg ctcgtgccat 1140 tattgtgcac acagctctgt gcacgtgtgt gcatatttct ttaggaaaga ttcttagaag 1200 tggaattgct gtgtcaaagg agtcatttat tcaacaaaac actaatgagt gcgtcctcgt 1260 gctgagcgct gttctaggtg ctggagcgac gtcagggaac aaggcagaca ggagttcctg 1320 acccccgttc tagaggagga tgtttccagt tgttgggttt tgtttgtttg tttcttctag 1380 agatggtggt cttgctctgt ccaggctaga gtgcagtggc atgatcatag c 1431 <210> 54 <211> 975 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR54 <400> 54 ccataaaagt gtttctaaac tgcagaaaaa tccccctaca gtcttacagt tcaagaattt 60 tcagcatgaa atgcctggta gattacctga ctttttttgc caaaaataag gcacagcagc 120 tctctcctga ctctgacttt ctatagtcct tactgaatta tagtccttac tgaattcatt 180 cttcagtgtt gcagtctgaa ggacacccac attttctctt tgtctttgtc aattctttgt 240 gttgtaaggg caggatgttt aaaagttgaa gtcattgact tgcaaaatga gaaatttcag 300 agggcatttt gttctctaga ccatgtagct tagagcagtg ttcacactga ggttgctgct 360 aatgtttctg cagttcttac caatagtatc atttacccag caacaggata tgatagagga 420 cttcgaaaac cccagaaaat gttttgccat atatccaaag ccctttggga aatggaaagg 480 aattgcgggc tcccattttt atatatggat agatagagac caagaaagac caaggcaact 540 ccatgtgctt tacattaata aagtacaaaa tgttaacatg taggaagtct aggcgaagtt 600 tatgtgagaa ttctttacac taattttgca acattttaat gcaagtctga aattatgtca 660 aaataagtaa aaatttttac aagttaagca gagaataaca atgattagtc agagaaataa 720 gtagcaaaat cttcttctca gtattgactt ggttgctttt caatctctga ggacacagca 780 gtcttcgctt ccaaatccac aagtcacatc agtgaggaga ctcagctgag actttggcta 840 atgttggggg gtccctcctg tgtctcccca ggcgcagtga gcctgcaggc cgacctcact 900 cgtggcacac aactaaatct ggggagaagc aacccgatgc cagcatgatg cagatatctc 960 agggtatgat cggcc 975 <210> 55 <211> 501 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR55 <400> 55 cctgaactca tgatccgccc acctcagcct cctgaagtgc tgggattaca ggtgtgagcc 60 accacaccca gccgcaacac actcttgagc aaccaatgtg tcataaaaga aataaaatgg 120 aaatcagaaa gtatcttgag acagacaaaa atggaaacac aacataccaa aatttatggg 180 acacagcaaa agcagtttta ggagggaagt ttatagtgat gaatacctac ctcaaaatca 240 ttagcctgat tggatgacac tacagtgtat aaatgaattg aaaaccacat tgtgccccat 300 acatatatac aatttttatt tgttaattaa aaataaaata aaactttaaa aaagaagaaa 360 gagctcaaat aaacaaccta actttatacc tcaaggaaat agaagagcca gctaagccca 420 aagttgacag aaggaaaaaa atattggcag aaagaaatga aacagagact agaaagacaa 480 ttgaagagat cagcaaaact a 501 <210> 56 <211> 741 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR56 <400> 56 acacaggaaa agatcgcaat tgttcagcag agctttgaac cggggatgac ggtctccctc 60 gttgcccggc aacatggtgt agcagccagc cagttatttc tctggcgtaa gcaataccag 120 gaaggaagtc ttactgctgt cgccgccgga gaacaggttg ttcctgcctc tgaacttgct 180 gccgccatga agcagattaa agaactccag cgcctgctcg gcaagaaaac gatggaaaat 240 gaactcctca aagaagccgt tgaatatgga cgggcaaaaa agtggatagc gcacgcgccc 300 ttattgcccg gggatgggga gtaagcttag tcagccgttg tctccgggtg tcgcgtgcgc 360 agttgcacgt cattctcaga cgaaccgatg actggatgga tggccgccgc agtcgtcaca 420 ctgatgatac ggatgtgctt ctccgtatac accatgttat cggagagctg ccaacgtatg 480 gttatcgtcg ggtatgggcg ctgcttcgca gacaggcaga acttgatggt atgcctgcga 540 tcaatgccaa acgtgtttac cggatcatgc gccagaatgc gctgttgctt gagcgaaaac 600 ctgctgtacc gccatcgaaa cgggcacata caggcagagt ggccgtgaaa gaaagcaatc 660 agcgatggtg ctctgacggg ttcgagttct gctgtgataa cggagagaga ctgcgtgtca 720 cgttcgcgct ggactgctgt g 741 <210> 57 <211> 1365 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR57 <400> 57 tccttctgta aataggcaaa atgtatttta gtttccacca cacatgttct tttctgtagg 60 gcttgtatgt tggaaatttt atccaattat tcaattaaca ctataccaac aatctgctaa 120 ttctggagat gtggcagtga ataaaaaagt tatagtttct gattttgtgg agcttggact 180 ttaatgatgg acaaaacaac acattcttaa atatatattt catcaaaatt atagtgggtg 240 aattatttat atgtgcattt acatgtgtat gtatacataa atgggcggtt actggctgca 300 ctgagaatgt acacgtggcg cgaacgaggc tgggcggtca gagaaggcct cccaaggagg 360 tggctttgaa gctgagtggt gcttccacgt gaaaaggctg gaaagggcat tccaagaaaa 420 ggctgaggcc agcgggaaag aggttccagt gcgctctggg aacggaaagc gcacctgcct 480 gaaacgaaaa tgagtgtgct gaaataggac gctagaaagg gaggcagagg ctggcaaaag 540 cgaccgagga ggagctcaaa ggagcgagcg gggaaggccg ctgtggagcc tggaggaagc 600 acttcggaag cgcttctgag cgggtaaggc cgctgggagc atgaactgct gagcaggtgt 660 gtccagaatt cgtgggttct tggtctcact gacttcaaga atgaagaggg accgcggacc 720 ctcgcggtga gtgttacagc tcttaaggtg gcgcgtctgg agtttgttcc ttctgatgtt 780 cggatgtgtt cagagtttct tccttctggt gggttcgtgg tctcgctggc tcaggagtga 840 agctgcagac cttcgcggtg agtgttacag ctcataaaag cagggtggac tcaaagagtg 900 agcagcagca agatttattg caaagaatga aagaacaaag cttccacact gtggaagggg 960 accccagcgg gttgccactg ctggctccgc agcctgcttt tattctctta tctggcccca 1020 cccacatcct gctgattggt agagccgaat ggtctgtttt gacggcgctg attggtgcgt 1080 ttacaatccc tgcgctagat acaaaggttc tccacgtccc caccagatta gctagataga 1140 gtctccacac aaaggttctc caaggcccca ccagagtagc tagatacaga gtgttgattg 1200 gtgcattcac aaaccctgag ctagacacag ggtgatgact ggtgtgttta caaaccttgc 1260 ggtagataca gagtatcaat tggcgtattt acaatcactg agctaggcat aaaggttctc 1320 caggtcccca ccagactcag gagcccagct ggcttcaccc agtgg 1365 <210> 58 <211> 1401 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR58 <400> 58 aagtttacct tagccctaaa ttatttcatt gtgattggca ttttaggaaa tatgtattaa 60 ggaatgtctc ttaggagata aggataacat atgtctaaga aaattatatt gaaatattat 120 tacatgaact aaaatgttag aactgaaaaa aaattattgt aactccttcc agcgtaggca 180 ggagtatcta gataccaact ttaacaactc aactttaaca acttcgaacc aaccagatgg 240 ctaggagatt cacctattta gcatgatatc ttttattgat aaaaaaatat aaaacttcca 300 ttaaattttt aagctactac aatcctatta aattttaact taccagtgtt ctcaatgcta 360 cataatttaa aatcattgaa atcttctgat tttaactcct cagtcttgaa atctacttat 420 ttttagttac atatatatcc aatctactgc cgctagtaga agaagcttgg aatttgagaa 480 aaaaatcaga cgttttgtat attctcatat tcactaattt attttttaaa tgagtttctg 540 caatgcatca agcagtggca aaacaggaga aaaattaaaa ttggttgaaa agatatgtgt 600 gccaaacaat cccttgaaat ttgatgaagt gactaatcct gagttattgt ttcaaatgtg 660 tacctgttta tacaagggta tcacctttga aatctcaaca ttaaatgaaa ttttataagc 720 aatttgttgt aacatgatta ttataaaatt ctgatataac attttttatt acctgtttag 780 agtttaaaga gagaaaagga gttaagaata attacatttt cattagcatt gtccgggtgc 840 aaaaacttct aacactatct tcaaatcttt ttctccattg ccttctgaac atacccactt 900 gggtatctca ttagcactgc aaattcaaca ttttcgattg ctaatttttc tccctaaata 960 tttatttgtt ttctcagctt tagccaatgt ttcactattg accatttgct caagtatagt 1020 gacgcttcaa tgaccttcag agagctgttt cagtccttcc tggactactt gcatgcttcc 1080 aacaaaatga agcactcttg atgtcagtca ctcaaataaa tggaaatggg cccatttact 1140 aggaatgtta acagaataaa aagatagacg tgacaccagt tgcttcagtc catctccatt 1200 tacttgctta aggcctggcc atatttctca cagttgatat ggcgcagggc acatgtttaa 1260 atggctgttc ttgtaggatg gtttgactgt tggattcctc atcttccctc tccttaggaa 1320 ggaaggttac agtagtactg ttggctcctg gaatatagat tcataaagaa ctaatggagt 1380 atcatctccc actgctcttg t 1401 <210> 59 <211> 866 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR59 <400> 59 gagatcacgc cactgcactc cagcctgggg gacagagcaa gactccatct cagaaacaaa 60 caaacacaca aagccagtca aggtgtttaa ttcgacggtg tcaggctcag gtctcttgac 120 aggatacatc cagcacccgg gggaaacgtc gatgggtggg gtggaatcta ttttgtggcc 180 tcaagggagg gtttgagagg tagtcccgca agcggtgatg gcctaaggaa gcccctccgc 240 ccaagaagcg atattcattt ctagcctgta gccacccaag agggagaatc gggctcgcca 300 cagaccccac aacccccaac ccaccccacc cccacccctc ccacctcgtg aaatgggctc 360 tcgctccgtc aggctctagt cacaccgtgt ggttttggaa cctccagcgt gtgtgcgtgg 420 gttgcgtggt ggggtggggc cggctgtgga cagaggaggg gataaagcgg cggtgtcccg 480 cgggtgcccg ggacgtgggg cgtggggcgt gggtggggtg gccagagcct tgggaactcg 540 tcgcctgtcg ggacgtctcc cctcctggtc ccctctctga cctacgctcc acatcttcgc 600 cgttcagtgg ggaccttgtg ggtggaagtc accatccctt tggactttag ccgacgaagg 660 ccgggctccc aagagtctcc ccggaggcgg ggccttgggc aggctcacaa ggatgctgac 720 ggtgacggtt ggtgacggtg atgtacttcg gaggcctcgg gccaatgcag aggtatccat 780 ttgacctcgg tgggacaggt cagctttgcg gagtcccgtg cgtccttcca gagactcatc 840 cagcgctagc aagcatggtc ccgagg 866 <210> 60 <211> 2067 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR60 <220> <221> misc_feature <222> (92)..(1777) <223> All "N" on various positions stand for any nucleic acid <400> 60 agcagtgcag aactggggaa gaagaagagt ccctacacca cttaatactc aaaagtactc 60 gcaaaaaata acacccctca ccaggtggca tnattactct ccttcattga gaaaattagg 120 aaactggact tcgtagaagc taattgcttt atccagagcc acctgcatac aaacctgcag 180 cgccacctgc atacaaacct gtcagccgac cccaaagccc tcagtcgcac caagcctctg 240 ctgcacaccc tcgtgccttc acactggccg ttccccaagc ctggggcata ctncccagct 300 ctgagaaatg tattcatcct tcaaagccct gctcatgtgt cctnntcaac aggaaaatct 360 cccatgagat gctctgctat ccccatctct cctgccccat agcttaggca nacttctgtg 420 gtggtgagtc ctgggctgtg ctgtgatgtg ttcgcctgcn atgtntgttc ttccccacaa 480 tgatgggccc ctgaattctc tatctctagc acctgtgctc agtaaaggct tgggaaacca 540 ggctcaaagc ctggcccaga tgccaccttt tccagggtgc ttccgggggc caccaaccag 600 agtgcagcct tctcctccac caggaactct tgcagcccca cccctgagca cctgcacccc 660 attacccatc tttgtttctc cgtgtgatcg tattattaca gaattatata ctgtattctt 720 aatacagtat ataattgtat aattattctt aatacagtat ataattatac aaatacaaaa 780 tatgtgttaa tggaccgttt atgttactgg taaagcttta agtcaacagt gggacattag 840 ttaggttttt ggcgaagtca aaagttatat gtgcattttc aacttcttga ggggtcggta 900 cntctnaccc ccatgttgtt caanggtcaa ctgtctacac atatcatagc taattcacta 960 cagaaatgtt agcttgtgtc actagtatct ccccttctca taagcttaat acacatacct 1020 tgagagagct cttggccatc tctactaatg actgaagttt ttatttatta tagatgtcat 1080 aataggcata aaactacatt acatcattcg agtgccaatt ttgccacctt gaccctcttt 1140 tgcaaaacac caacgtcagt acacatatga agaggaaact gcccgagaac tgaagttcct 1200 gagaccagga gctgcaggcg ttagatagaa tatggtgacg agagttacga ggatgacgag 1260 agtaaatact tcatactcag tacgtgccaa gcactgctat aagcgctctg tatgtgtgaa 1320 gtcatttaat cctcacagca tcccacggtg taattatttt cattatcccc atgagggaac 1380 agaaactcag aacggttcaa cacatatgcg agaagtcgca gccggtcagt gagagagcag 1440 gttcccgtcc aagcagtcag accccgagtg cacactctcg acccctgtcc agcagactca 1500 ctcgtcataa ggcggggagt gntctgtttc agccagatgc tttatgcatc tcagagtacc 1560 caaaccatga aagaatgagg cagtattcan gagcagatgg ngctgggcag taaggctggg 1620 cttcagaata gctggaaagc tcaagtnatg ggacctgcaa gaaaaatcca ttgtttngat 1680 aaatagccaa agtccctagg ctgtaagggg aaggtgtgcc aggtgcaagt ggagctctaa 1740 tgtaaaatcg cacctgagtc tcctggtctt atgagtnctg ggtgtacccc agtgaaaggt 1800 cctgctgcca ccaagtgggc catggttcag ctgtgtaagt gctgagcggc agccggaccg 1860 cttcctctaa cttcacctcc aaaggcacag tgcacctggt tcctccagca ctcagctgcg 1920 aggcccctag ccagggtccc ggcccccggc ccccggcagc tgctccagct tccttcccca 1980 cagcattcag gatggtctgc gttcatgtag acctttgttt tcagtctgtg ctccgaggtc 2040 actggcagca ctagccccgg ctcctgt 2067 <210> 61 <211> 1470 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR61 <220> <221> misc_feature <222> (130)..(976) <223> "N" stands for any nucleic acid on various positions <400> 61 cagcccccac atgcccagcc ctgtgctcag ctctgcagcg gggcatggtg ggcagagaca 60 cagaggccaa ggccctgctt cggggacggt gggcctggga tgagcatggc cttggccttc 120 gccgagagtn ctcttgtgaa ggaggggtca ggaggggctg ctgcagctgg ggaggagggc 180 gatggcactg tggcangaag tgaantagtg tgggtgcctn gcaccccagg cacggccagc 240 ctggggtatg gacccggggc cntctgttct agagcaggaa ggtatggtga ggacctcaaa 300 aggacagcca ctggagagct ccaggcagag gnacttgaga ggccctgggg ccatcctgtc 360 tcttttctgg gtctgtgtgc tctgggcctg ggcccttcct ctgctccccc gggcttggag 420 agggctggcc ttgcctcgtg caaaggacca ctctagactg gtaccaagtc tggcccatgg 480 cctcctgtgg gtgcaggcct gtgcgggtga cctgagagcc agggctggca ggtcagagtc 540 aggagaggga tggcagtgga tgccctgtgc aggatctgcc taatcatggt gaggctggag 600 gaatccaaag tgggcatgca ctctgcactc atttctttat tcatgtgtgc ccatcccaac 660 aagcagggag cctggccagg agggcccctg ggagaaggca ctgatgggct gtgttccatt 720 taggaaggat ggacggttgt gagacgggta agtcagaacg ggctgcccac ctcggccgag 780 agggccccgt ggtgggttgg caccatctgg gcctggagag ctgctcagga ggctctctag 840 ggctgggtga ccaggnctgg ggtacagtag ccatgggagc aggtgcttac ctggggctgt 900 ccctgagcag gggctgcatt gggtgctctg tgagcacaca cttctctatt cacctgagtc 960 ccnctgagtg atgagnacac ccttgttttg cagatgaatc tgagcatgga gatgttaagt 1020 ggcttgcctg agccacacag cagatggatg gtgtagctgg gacctgaggg caggcagtcc 1080 cagcccgagg acttcccaag gttgtggcaa actctgacag catgacccca gggaacaccc 1140 atctcagctc tggtcagaca ctgcggagtt gtgttgtaac ccacacagct ggagacagcc 1200 accctagccc cacccttatc ctctcccaaa ggaacctgcc ctttcccttc attttcctct 1260 tactgcattg agggaccaca cagtgtggca gaaggaacat gggttcagga cccagatgga 1320 cttgcttcac agtgcagccc tcctgtcctc ttgcagagtg cgtcttccac tgtgaagttg 1380 ggacagtcac accaactcaa tactgctggg cccgtcacac ggtgggcagg caacggatgg 1440 cagtcactgg ctgtgggtct gcagaggtgg 1470 <210> 62 <211> 1011 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR62 <400> 62 agtgtcaaat agatctacac aaaacaagat aatgtctgcc catttttcca aagataatgt 60 ggtgaagtgg gtagagagaa atgcatccat tctccccacc caacctctgc taaattgtcc 120 atgtcacagt actgagacca gggggcttat tcccagcggg cagaatgtgc accaagcacc 180 tcttgtctca atttgcagtc taggccctgc tatttgatgg tgtgaaggct tgcacctggc 240 atggaaggtc cgttttgtac ttcttgcttt agcagttcaa agagcaggga gagctgcgag 300 ggcctctgca gcttcagatg gatgtggtca gcttgttgga ggcgccttct gtggtccatt 360 atctccagcc cccctgcggt gttgctgttt gcttggcttg tctggctctc catgccttgt 420 tggctccaaa atgtcatcat gctgcacccc aggaagaatg tgcaggccca tctcttttat 480 gtgctttggg ctattttgat tccccgttgg gtatattccc taggtaagac ccagaagaca 540 caggaggtag ttgctttggg agagtttgga cctatgggta tgaggtaata gacacagtat 600 cttctctttc atttggtgag actgttagct ctggccgcgg actgaattcc acacagctca 660 cttgggaaaa ctttattcca aaacatagtc acattgaaca ttgtggagaa tgagggacag 720 agaagaggcc ctagatttgt acatctgggt gttatgtcta taaatagaat gctttggtgg 780 tcaactagac ttgttcatgt tgacatttag tcttgccttt tcggtggtga tttaaaaatt 840 atgtatatct tgtttggaat atagtggagc tatggtgtgg cattttcatc tggctttttg 900 tttagctcag cccgtcctgt tatgggcagc cttgaagctc agtagctaat gaagaggtat 960 cctcactccc tccagagagc ggtcccctca cggctcattg agagtttgtc a 1011 <210> 63 <211> 1410 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR63 <400> 63 gcgtctgagc cgctgggaac ccatgagccc cgtccatgga gttgaggaag ggggttcgcc 60 ccacggggtg ggcgccctct acacagcgcg cttcctcttc tctcgttagc gccgcgggac 120 cagcctctgg ttctgcacct cgcgctctgg gagcagcgcc cggctttggc gagcgcttcc 180 ccggggctgc ccagcctctg ctccgctcgc cccgccaggc ccggctccgc gaagccccca 240 gggtccagtc caaggccccg attccccaag gccagggccc cggggcagca ttggaacagg 300 gcgcggacgc cagtcctccg agcatggagt aactgcagct tttgagaaaa gaaagcggac 360 cccaccccat cgagaacgcg gcgccttgtt tagggacgtt cctgggccgt cacggagtgt 420 cgccggctcc tcggcccctc cctcctccaa gcccccaccc ccgacagcgg cctccctggg 480 gacctcccct cgggctgcgc tttcagccca aacacaggga ggtcttccag gagcctgccc 540 agtccccaca gcagcccaga gacccccact cccacctgta cctgccaagc cttcagagag 600 ggcggcctgg acatgccccg cacgggagga gccccgcctc agcacccctg caagtggcag 660 caacccagaa cacccgtgag aggcctctga gcagcccagg aagtggctgg aagacgcata 720 ggcagctcac tcctctgtaa gagcaaggac cggagaacac atgctgaccc ctgcttttgc 780 agaggggcga tgcttcagga caggcgcgct cagcaggtgt ccatcttatt tcacaccttt 840 gtgtttatat catcttattt tgcattttat gtctaattaa caatatgcag ctggccaggc 900 gcagtggctc aagcctctaa tcccagcact ttgggaggcc gaggcaggtg tatcacttga 960 gggcaggagt tcgggaccgg cctgggcaac atagcaaaac cccattgcta ataaaaatac 1020 aaaaattagc cagccatggt ggcgggcacc tgcagtccca gctactccgg aagctgaagc 1080 aggagaatca cttgaaccca ggaggcggag gtggcagtga gctatcaagc cattacactc 1140 cagcctgggc aacagagaaa gactgtctca aaaaaaaatt aatacgcagc agaatattat 1200 gtggtcagcc caagcagtcc cccccactca gccctctgtc cctacagctc caggcactcc 1260 cccagcccct cccctggaca agaggtaatg cccagagggt gaaaatccac caaggttaag 1320 ccagaaacaa aaagctcaaa gcttcggcat ctccctccgc tcagaccctt agagcagatt 1380 cctctcatcg acagcacgat caggctgtgg 1410 <210> 64 <211> 1414 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR64 <400> 64 agagatcttt taagggctca aaagaccctg cggctcccct gccaatagct ctgccatcgt 60 ccccagagct ttcgaggacc ctccaccatc ggcgccaacc ccagctgagc tgggtgctcg 120 tctgcaggcc tctgctccat ctcagcctga gcatgaggct ctgctgtgct gcttccagca 180 gcagggacag ggctgatgag cctggccctt gcaagcatct tcctgtgccg aatacaattc 240 cacagacaga ggatttaaaa tccaagtgga ggtgacagga aagaaaggaa aacctccagg 300 tatcagaaga aaggaggggg tgtgaagaca gtatgggagg aaggtcaggc tggggctcag 360 ctctgggaag tgccagcctg aacaggagtc acgcccgggt ccacatgcaa gggaatgagg 420 accgaggccc tgcatgtggc agggccttcc gcaggctgcc ccgtctgtga acaggacacc 480 agaagaagtc tgccttccag cctggcaaag tggcaaggaa cctctgggtg ggaaaacaaa 540 tcaacaaaca aattgtcagt aaaaaacaga aacctcacac tttcctttct cttgacctct 600 tgaaaaaagc aaatccactg cagctcacca aaggcaaaga gaaaacctta agaataccca 660 gagagaaaag acacgttact tgcaaaagaa catctaatgc agggagataa tgaaaataca 720 gactcttcaa agggctgaag gaaaaaaacc gtccacctag aattctatcc ccaaactgtc 780 atctgagagc aagggcaaaa caaacgcttt ctcagacagg ctggacgagg tcgctcacgc 840 ctgtaatcct agcactttgg gaggccaagg tgggaggacc gctttaagcc agaagtttga 900 gaccagtgtg ggtaacataa tgagacccca tctctaagaa aaagaaatta aataagacaa 960 gactttttca gacaacaagt gctctgagag ctggcctatc ttggctgtct tgtaaagaat 1020 tgctgcgaga cacctcatta ggaaagagac tgaatctaga aggaaagagc agagcatgag 1080 gtacaatgag gagcaaataa acaggtcacc atataagcaa acccaaatac acattcacta 1140 tacgaaacaa taaaaatgac tcatttgggg ggttaaaaca ctgttgaact aaaatcctgg 1200 ataacagcag catgaaaggt ggggtggtgg tcccaggaaa gcattcaaag gtccatgtct 1260 catttgggag gagggtaggg agactcatga acttgaggct cccttcaggc aagcacagtg 1320 caaaaaaatt ataataatgg gaaacagata cagtagactg tgatgtacaa ctctcagagc 1380 agtagaaggg agggtataaa acaaatctga tcca 1414 <210> 65 <211> 1310 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR65 <400> 65 tcgagaccag cctggccaac atggtgaaac attgtctcta ttacaaatac aaaaattagc 60 caggtgtagt ggtgcatgcc tgcagtccca gccatttggg aggctgaagt tggagaatcg 120 cttaaacctg ggaggtggag gttgcattga gccgagaagc actccagcct ggatgacgga 180 gcaagactgt ctcaaaaaga aaaaaaaaag aagcagcagc aaatatccct gtcctgatgg 240 aggctatata acaaccaaac aagtgaatgc ataagacaat ttcaaggtta tggtagatac 300 cataagtggg agatgaacaa tgagaacaca tggacacagg gaggagaaca tcacacactg 360 gggcctctcg gggggtgggg aaataggggg tgatagcatt aggagaaata cctaatgtcg 420 ataacaggtt agtgggtgca gcaaaccacc atggcacgtg tatatctatg taacacacct 480 gcacgttctg cacatgtatc ccagaactta aagtataata aaaaaagaca ttaaaaaatt 540 atgatataaa atcccaattc aagttgtttt aaaaagagaa aacaattatc tttatataat 600 agcggaaaat atagatggcg gaattaaagc ctcgtcatat tttctaacag aactttctga 660 taaacttgat taaataaaaa ttttaaatat cactaaacac atagaagaaa taaatttaaa 720 ccttcacaaa aaataaagta caatgaatga agacaaggtg tacttgaaaa aagaactgaa 780 taaatattct acatataaaa aaaatctgat gatattgtgg tgattcttta ctttgctact 840 agtttctctt tttttcttct gaaaaatttc ttgggatgta tttggtttca ttagtaaaat 900 tctaagtttc tttgcaatct gaacattgga gcttcatcca tagccagtat gccctaacat 960 tatctttgga caactgtaaa attagaacac tgccagacat atttaatgta tgatgtatat 1020 caacactggg acacatttta tactatcttt attccaaaat caaatgattc actgtggttt 1080 ataaatgtac atggatatat ctctacctaa gcagatagtt aggagagtta gtaaaaatga 1140 ggtggaaaat aggagtcact gtcccttcac agggagagaa ttctgctttt ctcctaatat 1200 accctttgct tgaacagact ccaacccctc atcttttgtc ctttaaatga ccacatttat 1260 tttaactttg ataaacaaca cagaaagata tttgatccat caacattcac 1310 <210> 66 <211> 2500 <212> DNA <213> Artificial Sequence <220> <223> sequence of T2F (STAR66F) <400> 66 gcaggttgga tggtgctgac ccctcctcgg gttggcttcc tgtctccagg tggacgtcct 60 gtactccagg gtctgcaagc ctaaaaggag ggacccagga cccaccacag acccgctgga 120 ccccaagggc cagggagcga ttctggccct ggcgggtgac ctggcctacc agaccctccc 180 gctcagggcc ctggatgtgg acagcggccc cctggaaaac gtgtatgaga gcatccggga 240 gctgggggac cctgctggca ggagcagcac gtgcggggct gggacgcccc ctgcttccag 300 ctgccccagc ctagggaggg gctggagacc cctccctgcc tccctgccct gaacactcaa 360 ggacctgtgc tccttcctcc agagtgaggc ccgtcccccg ccccgccccg cctcacagct 420 gacagcgcca gtcccaggtc cccgggctgc cagcccgtga ggtccgtgag gtcctggccg 480 ctctgacagc cgcggcctcc ccgggctcca gagaaggccc gcgtctaaat aaagcgccag 540 cgcaggatga aagcggccag cctcgcagcc tgctcttctt gaaagctggg cgggttgggg 600 cggggggctt ctctggaagg cttggagctg tcccctctgg ccttggggga ctggctgccc 660 ccggggcgcc cgggcctagc cgaggcggtg ctcctgccgg ccagactctc ggtcagtgcg 720 ggcacggggt cccagccact cctagggggc agcgcagccg gcagggtggc cgcccccggg 780 tgggacttgg accctggact ccacgggagg gctccgccac ccagcctggt gttacataag 840 gggtggtgga ggtgggcagt cgagcgttaa agagtaacct gctgccggga agcccgccaa 900 gcaatcgcgg ccccttcccc ggctctggca gctctgcgag cgcgcccgtg gggaacgggc 960 cctccccggc ggggcgcgcg ggcgcgcgag gtgggcggag gcctcggagc tgtgccgggc 1020 cgggcctccc tccctaggcc agcgcgggag cgacccggag ggggcgggcc cggggcgggg 1080 cctcgaagcg ctggccggcg ggagcgcggc cggccgggcc cgcccgcctg cggtgtggac 1140 gccgcgcggc caatgcgcgc gccgggacgg gacgggacgg ggcggggcgg ggcgggacga 1200 gacggggcgg ggcggggcgg gccgggcagc ctccgggcgg cgcggcgcgg gcggcggccg 1260 gatccagggc gggggtcggc ggcccggcca gcccggcccg gcccggggcc gcgtcctgag 1320 agtcagccct cgccgctgca gcctcggcgc ccggccggcc ggccatggag cgccccccgc 1380 cccgcgccgc cggccgggac cccagtgcgc tgcgggccga ggcgccgtgg ctgcgcgcgg 1440 agggtccggg gccgcgcgcc gcgcccgtga cggtgcccac gccgccgcag gtaccgggcg 1500 ccggtgggcg ggggcgccga ccaagtttct ctcgctgcaa agatggcgtc agtgctgccc 1560 aaacttcggg cccccggggg cggggcagcg gggagggcgg ccgcgtcggt ccgcgcgtgt 1620 ccgtgggtcc cgccggggct gcgccgggcg gccggggagc ccttcccgcc gcgccgggct 1680 gggggcgggg ccgggggcgg ggccgcgccg tccacaccgg ccgcagccgg ttttcgaggc 1740 gggcgccgag cggatccgcg gcggaggttg agggaccccc ctcccccggc caccgcctcc 1800 gctgagtctg ccccctcccc atccgcaggg ctcttccgtg ggcggcggct tcgcgggctt 1860 ggagttcgcg cggccgcagg agtcggagcc gcgggcctcg gacctggggg ccccccggac 1920 gtggacgggg gcggcggcgg ggccccggac tccgtcggcg cacatccccg tcccagcgca 1980 gaggtgagcg ggaggcccgg tgcctcggga ctcggtgtgc gcaggggcgg tgggtggggt 2040 gcggagacac cggccccgac ggaggccagg tcagggcccc aggtttgtaa ttaccagcca 2100 cccccaagct cttcagccct ggaggagctg agcagaaatg atcgatgact gggagtccct 2160 acacctccct ccaccgcagt tcctcggggc tagagctcag aacccggagc gggtggctgt 2220 gcgtctctgt gcagaagagg ctgcgcggtc ggcatggggc gactgtccag gaatccctgg 2280 ggctcctgac cgccacctcc caacccctgc caggccggac acctcggtct ggctgccagg 2340 gcaggggcgg gccctggcct ggctcgctgg ggcctgggga gctgcccgtg cttccagccc 2400 agtctccccc tggctgctgc cggctgctgg ccactcccac ctcccaggcc tggcgtgagg 2460 cccacagctg ctgttgcaca accctggtta atgtgtgatg 2500 <210> 67 <211> 2500 <212> DNA <213> Artificial Sequence <220> <223> sequence of T2R (STAR66R) <400> 67 gtttggggta gagagaacat actgattatg ggactttgct ttgcagctta gtgctgtcct 60 gtcagtggga agcaacaggg ggcagaactc agcttgtgcc catagaggga atgtttatac 120 taggcctgtc cagaggcaaa tcatccatcc tagcaattgg aacctgactt ttggcaagtc 180 ctgccaccat gggctaaagt gttctggggt tctaaataaa catgaaaggc aacctagacc 240 acaaggactg caattcctgc acaagtcctg gtgctgtgtt gggcttggag ccagggaact 300 tggagtgcat ggaacctagt gagataccag ctgagacaac caaggaagtg cttgtgtcac 360 ccctccacca accccaggca gtacagattg tacctccaag accccttcca tctgcttgag 420 gaaggtggag gggaagagga ctttgttttg caacttggat tccagcccat ccacagtaga 480 ataaggcaac gggcagactc ctaaggcccc catcccagac cctagctcct ggatgacatt 540 tctaaacaca ccatgggcca gaagggaacc cattgccttg aagggaaggg cccagtcctg 600 gcagaattta tcatgtgctg aataaacagc ccttgggccc tgaataatta gtattggtag 660 ccaggcagta tttaccacag gccttgggtg agacccagag ccatgttggc ttcaggtgtg 720 acccagcaca ttcccagctg tggtaacttt ggggagagac cacttctgct tgagaaaagg 780 agacagaaga gtaaaggggt ctttatcttg cagcctggta ccagcttggc cgcagtgggg 840 tagagcacca agagagcacc tgggataaac aaaatcaaaa aacctttagc tagactaaga 900 gtaaagagag aagacccaag taaatataat caaagacaaa aaaggagaga cattacaacc 960 aatacctcag aaattcaaag tatcattagc agctactttg aacaactata tgccagtaaa 1020 ttggaaaacc tagaagaatt atataaattc ctaacatata caacctacca agattgaacc 1080 atgaagaaat ttaaagcctg aataggccaa taacaagcaa tgagattgga gccctaatac 1140 aaagtttaca atgagaaaca ttgctcaaac aaatcataga tgacacaaac aaatggaaaa 1200 catccaatgc tcatggacag gaaaaaatat ttaaatttct atactgccca aagcagttta 1260 tacattcaat gctattcctg tcaaaatacc aatcttattc ttcacaaaaa aaaaattaaa 1320 aattacacag aaccaaaaaa gagcccaaat acccaaggca attttaagca aaaagaacaa 1380 agctggaggc atcacgttac ctgtgatcca cactataggg ctacagtaaa tgaaacagca 1440 aggtgctggt atacaaacag acacataaac caatggaata gaataaagag cttagaaata 1500 atgctccaca cctccagcca tccgatgttt gagaaagtag acataaacaa gcaatgagga 1560 gaggactccc tattcattaa atcaactcaa gacggaccaa aaacctaaat gtaaaacaaa 1620 caaacaaaaa aaataactgc taaaaccctg ggagatgacc taggaaatac cattctggac 1680 agtacctggt gaaaatttca tgctgaagac accaaaaaca attgcagcaa aagaaaaaat 1740 tgacatatgg gatcaaatta aactttagag cttttgcaca gcaaaataaa ctatcaacag 1800 agtaaatagg caccctacag gaagggagaa aatattttca atctgtgctc tgacaaagtc 1860 ctaatatcca gagcctataa ggaacttaaa caaatttaca aacaaaaaac aaacaacact 1920 attacgagtt ggaaaaggac atgaatcgac acttttcaaa agaagacata catgtggcta 1980 acaagcatat gaaaaaaatg ctcaacatta ctaatcatta gagaaatgca aatcaaaacc 2040 acaatgagat accatctcaa ccagtctgaa tggctgttat taaaaaaatc agaaaaaaac 2100 agatgctggc aaggttgtgg agaaaaggaa acacttatac attgttgggg ggagtgtaaa 2160 ttaattcagc cattgtggaa agtattgtgg tgattttcta aagaactaaa aaggaattac 2220 tattttacct ggaaatttca ttattgggta tatacccaaa gaaatatgaa ttattttact 2280 ataaagacag atgcatgcat gtgttcattg tagcactatt cacagtagca aagacatgtt 2340 atcaacctaa atgcccatta acagtaaact ggataaggaa aatatggtac atatacactg 2400 tggaatacta tgcagtcata aaaagaatga gataatgttc attgcagcaa catggatgga 2460 actggagacc attatccttg ggaaactaac aaagcaacag 2500 <210> 68 <211> 2501 <212> DNA <213> Artificial Sequence <220> <223> sequence of T3F <400> 68 agatttgccc tcaagattac aactgctggg gctaaagtgg tacagagcct gagttcagta 60 ggcttccata gtctcactca agaatgcaag tttacctctc aatctttcaa tcatcacaat 120 tataacaact ttaaaaagag ccaacatgat atttgcttat cacttttcta ctcacattcc 180 agtattaact caaaagtgtc aacacaacct tcgtgataaa tactattaac gtcatcattc 240 ctactgtaca gatgatgata gtgacacata ggttaagttg cccaaggtct tattattaag 300 ggtcatagcc aggatttgat ctcttcagta aagttctagt caatgctctt aaccattaag 360 ccatgcaaca cacccagagc caactgggtt gtgttgatga ttataatatt tgttttaaca 420 aacaataatt tttcctaaat ataatataga ttttccataa ataccataaa ttcttgatta 480 tttatttcac tttattccaa aaggaagttg aattctgaga tttaaatgaa tagcaaacaa 540 cagttgctta atttcactac ttttgtcact tgtagccagt acttaaaaag agatacataa 600 tttatttttg ttgatttgca tttcacatat aattgtaaga tcctggagaa taaagactat 660 atgtgttata ccattttact ctctcacaca gtgtgtaggc ctaggctttg tgcatagcaa 720 gtgttaaaaa gtaatgtgac tcgtgatagt tattagattt attgaaattc agaaatttag 780 ggaaatgcac aataaaatgt acattttgtg attccggtca aattacttaa aaattatatt 840 tttcctatga ataattttta tttcacttaa attatgtata acaaaataac atgcataatt 900 aaacatttac cacaaagaaa atatttgtac tattgttatc acaataaaga acttgctaca 960 taaattcaat tacacttttg tggaaagtat cttcattata taaaaacaat ctacatttag 1020 aataggaaaa ttgtacaaaa catgaaaata taaacaaatt aagcgagaat tatctaaaaa 1080 gcaactcttc agaatttaga agaattgtct agaataaaaa gaatttagaa gaattatcta 1140 agaaacaacc ataaatattc tgatgtattt aagactcata ttctagaatc ctgactatta 1200 ttttttatac ttctatggct aatctcaagt ttagctttat ttttctaaag caatgaggcc 1260 tgtagaatat tttttcagaa ttctctgagg ttttttcttt tttgtctttc ctgtcatagt 1320 atgccaatta ttcatgggtt tatagaatat gtatgcactg ctaagagcag caaaacaaaa 1380 gatatatgtg ctatttatta attcatgttg ctttatttaa attacttgaa aatgataaag 1440 aaaaaactat tgtatttaca acagcaacca aatatagact acctgtaact acatctaaca 1500 gaataaataa aatataacat acaatatgta gtaaatatat ttataatata tatgttcact 1560 aaatagttaa cctgtaactt acttacagta aatatatata atatctactg agatagtacc 1620 acattttatt aaggattaaa cttttaataa ttcagaagaa taaatataat aaatttcatt 1680 tgttctcaaa ctaatttgtt tttatttgtt tgttttttgt attttaattt gacagtagtt 1740 ccaagatatt ttggggtata taatgaggtg ataattgcaa agaaaattct gaaaaggaaa 1800 agactaagcg tgaattgaaa gtaaaattcg ttaaaaggta taataaactg tgatactgta 1860 acaataattg aaaatagata aagaaaaagg taacatcaat aaatagtcta ttatatatgt 1920 gaattatgtt aataaaagtg acattttatt ttcaatccac aatttctgaa atatatatgg 1980 caatattttt ctgttttatt ttttcaacct ctgattactt tattacattt ttttcttttt 2040 ctagaattta cttgtatttt ctctgtgtct aatatatgat tatttctgaa ctagcatcat 2100 tggtcctgga accagactat attattccca aggtagagca tcaaaatata acaattaaat 2160 aaatactttt agttacttta acaacctttt gtctttcatt ataattttgg aattatagtt 2220 tagtacaata cagatagttt taatatctgt tagagtgaag atatatatat atgtgtgtgt 2280 gtttttgaga tggagtctca ctctgttgcc caggctggag tacagtggtg ccatctcggc 2340 tcacggcaac ctctgcgtcc caggttcaag caattctcct gcctcagcct cccgggtagc 2400 tgggactaca ggcgagtgtc accacgcctg gctaattttt tgtattttta gtagagacag 2460 ggtttcacca tattagccag gatggtctcg gtctcctgac t 2501 <210> 69 <211> 2511 <212> DNA <213> Artificial Sequence <220> <223> sequence of T3R <400> 69 cttttggtgc cctgtccctt ataatttcct cgtgtgtcct ttcccatttg cttatccgat 60 gacttgcttc tctcacccat tggattgtga gcctcttgtg gtcaggggca gtgctctgta 120 agctgctgtg tccccagaat ctggcccagt gtaggcactc agcagctata gactgatgtt 180 aagagaaaat gcacatttca tctcagcctc agagcagttc tgggaaacag ataggaaacc 240 aaagctctgc aagaacgtgg gactctctca gggccatcac aacactgttg ttggtctcat 300 gtttggtgac tgggtctcct attcctggtc tctttcctag gcataatgct tttatataaa 360 gtcccttcca ttgttttttt gtttgttttc ttttttcagc ctaaataact tagtttctct 420 aaacttttct cccagggact cttttttaac cctttgaatt attgctgatt attatcttaa 480 taacttttat tttttttcca ttttgcatgt catattttag caaagcatta aaaggaacac 540 ggcacaaagc acacccatat ttttggatgc tgtggatttc atcatgctgc ttattccatt 600 atatctagtc agtacctcca aggcattaat gctgccttac ctccttcatt cgaagacttc 660 cctgtgcaag gtggaatata cgtaaggagg caaacagact gggttatatg cctgctctgc 720 tttacagagg cctcttccag gagtgtaata cgggggttgc tcatactctg aagaagatag 780 tggcaggcta ttactgtcat gagagccaga acgtggctgg cttcttacag acatggcttc 840 ataggggcat gccacgtgat tcctgagtaa gccttctggt gtgaattccc tgctcactgg 900 ggtgattctt cacttcccac agttcaacct gctgtattat cctcttacct atgcttttct 960 gtgatccata gaggtaattt aattttcagt ccatgtacct accctgccta cttagtttct 1020 tctcagtgcc acacttaatt ccttcacatt tactgattaa ttaaatgaga agactatgcc 1080 aggtgaaggt tcagcatctt cagaactcta catgatgcat tccctgaggc tgcctttcaa 1140 taactgaggt gatattcttt gagcagtgtg acctgttaga ggtgcccagt caggtccgat 1200 gaaaagccct ctgatttgtt gaaatagtgc attagtaaag tattatagtt tattttcaca 1260 aagctagatt agttgttaca tgttggtttt tgttttgcct agccctaaca agtatggagg 1320 tgaccttgat gtgtctatag aatatcagga atatctggct gggtgggtgg ctcacacctg 1380 taatcccaac aatttgggag gccgaggtgg gcggatcacc tgaggtcagg agtttgagag 1440 aggcctggcc aacatggtga acccccgtct ctactaaaaa tacaaaaatt agccaggtgt 1500 ggtggcaggt gcctgcaatc tcagctactc cggaggctga tgcaggggaa tcacttgaac 1560 ccgggaggta gaggttgcag tgagccaaga ttgtgccact gcactccagc ctgggcaaca 1620 gagcgagatt ctgcctcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaga atatcaggaa 1680 tatccatttt atgtctcaac tcacatacct cacagttttc tggtccaatt tttaggcact 1740 ttatcaggcc ctcatatgtt ttcaaaaata attgctaatg actttgatga agctaggcaa 1800 gatatttttt ggttttaggg cagtttgggc tatagtttgc agccttccta ctttaataga 1860 agaattttta aactagattc tcccccttct cagggtggct ttctgccttt ccattctagt 1920 gcttcacaca gaaatgacaa gctcacaggg gacttatcta gaaaaggccg agataaaaat 1980 aagtacaatg ttaaaaaaat ctatcttata gtatcattta tttagagctt cctctccttt 2040 tctaatgaaa ggctgctgta gtttcctttt gtgctttttt tgctgaaggc ttttcagtaa 2100 tattcccgtg tgtcccctgt gatgctaaaa gcatgagctt gggggcaggt tgactggcat 2160 tcaggtcttt gctcagcctc cagccgcaag acaaggcgaa taatattgat ctcatggagc 2220 tgaaatgaaa attaactttt ctaatctgtg aaaatgcttt gttataatcc ttaaatacat 2280 gaatacatag gttgaaatag caagtaccaa gtgctgacat tatgtccaca attgccacat 2340 gccatgtcct tatgattttt gccagatgtt taataagatt ataaatgaat aggttattaa 2400 atgggcatct cctactctct aggtgtttct gtttctgctt ctctgttttc tgtttgtatc 2460 tccatttatt ttaatgccta ccattatgtg aagtctgcca ccttcctata c 2511 <210> 70 <211> 1500 <212> DNA <213> Artificial Sequence <220> <223> sequence of T5F <400> 70 gaactcaata ggggtcttgt acggagcagg ggcttggtcc ctcgtacctc tggccatacc 60 tatggagccc aggggatgct tggcagcacc tgggaggtgc caaccccggg tggcaaggga 120 gggccggtcc cacgctcaca ttgtcttctg ttctctctct ctctttatct gtgtcgatgt 180 ctctctctct tcccccgtgc ccgtgccatc ctctccaccc ctggattcct gtctctgctt 240 ggctttcacc cacttctcct ccccacccac ggctgctcct cctcctgtcc ccacctcctc 300 cccgggtgca ggacgggcct cttcacacct gacctcgctt ttgaagccac agtgaaaaag 360 caggtgcaga agctcaaaga gcccagtatc aagtgtgtgg atatggtagt cagtgagctc 420 acagccacca tcagaaagtg tagcgaaaag gtatgacggc cgcctgggcg gggctgggcc 480 tggccgtcca ttccttgtgg ccacagcctc ccgtgggcag aaggatctgc tgagccggcc 540 tcacggctac ccgcagggac ccagccctag tgtttcctgc cagtttctaa ccctgggtac 600 ttgcactcat gacccctcca ggcccccatc ccagaagact tgactccaac ccaagcctcc 660 ttggtggcac ctatgctagt gatgaagatg atgttaagga gatggcagct gtttactgag 720 cacctactat gtgccaagca cacgctaagt gcttgccctt actatctgac tcagtcctct 780 caaccaccct aagacgtggg tagtgttgtt attcccattt tgcagatggc aaaacagagt 840 ctcagaaaag agaagcagag tgtgattcag ttttaggaag gacagaggaa ggggtctgag 900 gtcagggcct cctgggcagg gggagctgtc ctagttcctc aaaaccaatt tgcctgaaag 960 catattggat tactcacttt acagtaatcc gtgcgtgaga gacaggggcg gtctcttttg 1020 agttgtctgt gactttttag atgccttttt cctatttgtc tgcttttggg cattttgagg 1080 atttttagcc aggttgtcta aagcagttct tcccagggga gtgcgagaga atcagttgcc 1140 tgcaggagct tctccagcag gctaaatcag aggtgccagg ggtgagccca gcctcaccta 1200 tatctgaagg acttccctat gctggtgggt ggaggcacat ccaccttagc attgagtttc 1260 aaataagcat caatcatctc cattcctttt tttttttttt tttttttttg agatggaatc 1320 ttgctctgtc gcccaggctg gagtgcagtg gcaccatctt ggctcactgc aacctctgcc 1380 tcctgggttc aagtattctc ctgcctcagc ctcccgggtg gctgggatta ctagcatgta 1440 ccaccacacc tggctaattt ttgtattttt agtagagatg gggttttgcc acgttggcca 1500 <210> 71 <211> 1500 <212> DNA <213> Artificial Sequence <220> <223> sequence of T5R <400> 71 gattacaggc gtgagccacc acacctggcc cagtggggtc cttctaaaat gcaaagctga 60 tcatgtctct tcttccaggc ttaaagccct cccatggctt cctgcagccc tggtgcacgc 120 cttacgccaa gcctgaaaac actctgcaca cccacccctt ccctgcacaa acgggcctct 180 gcacactacc tgccccggcc atgcccccgc aaccagccct ctctgcttat ctaccttggc 240 cttctctctg gtcaagcccc aggcccgtcc ctgcccctag gccttcactt agagcctcag 300 aagcacttct tgcaggaagc cctccagact ccagaatggg tccagaacct acttcctttt 360 cgtggcattt ctgtattctt tttttttttc ttccatagag ccagggtctc actgtgtttc 420 ctaggctagt ctcgaactcc tgggctcaac tgatcctcct gccttggcct tccatagtgc 480 tgggattaca ggcatgagtc attgcacccg gcctccacag tcttaattaa ttggttggag 540 cattatttgc attaatatct ctcaccaccc tccccattcc tgtccaagac ctcagggagg 600 gccaggccag atgtatcatc tgcaccaggg agtcccctgc aggggcttcc agatgtctgc 660 taaatgaaca cacagctctc tctggccagt ccaaggcacc ccaggaggcc accagaagcc 720 tgcagcctcc ctccctccct cctgctaagc ccaaggaatg agcactgagc agggaatggt 780 aatctggaca catccatact ctgcccttca gaaactacct agctgtcacc ctgcacgaaa 840 caggcaccag cctgagagtc aggaggcctg ggctctgggt ccacctagac agctgtgggg 900 cgcaggacca accgcacccc aatctctaag cctgggtttt tccatacgta aaaaaatgag 960 ggcagggcgg gttagacact agaccagatc tgtgatgaca ggcccgttgg aaggctggag 1020 gcggggcccc tcgctgaagg aaaatgcctt acctccagaa gtggcccgcc ctggagtggc 1080 cagcaaaggg ggcattgccc ctgcgctgga atacacccag aagcagggtg tgagcaggag 1140 ctgcggagac cttcagggac aggacagtct agggaggggg tgagcccttt gcagatctcc 1200 tgcttatgcc aggagaaagg taaacacctc tcaaacacac aaggagccag ggggctgtgg 1260 gctggaacct atagccggca acagcgtata gcttaggatt ttatagcatt gttctaccct 1320 agttatgttt cctatacttt tgtttgtttg tttgtttgtt tgtttgtttg tttgaaatgg 1380 agtctcactc tgtcgcccag gctggagtgc aatggcacga tcttggctca ctgcagcctc 1440 tgtcttccag gttcaagtga ttctcctact tcagccttcc tgagtagctg gaattacagg 1500 <210> 72 <211> 1199 <212> DNA <213> Artificial Sequence <220> <223> sequence of T7 <400> 72 ccatcttata aatatatcat aatttactga aaaatatttc agtaatgttg aaaggcctct 60 gtgccatttc cagcttgagg ctattcctaa aaatccttgc acatgtcttt cagtgcacac 120 atgtatacat ttcggttggg tatgcctagg agtggaatga ctggttatag ggtacactta 180 cgttgagctt tggtagatac taccaactgc cagttttcca aagttgtacc aatttacatt 240 cctaccacca gtacatgagg gttccagatg ctgaacgtcc tcactaatgc ttggtaatgt 300 ctgccttttt cattttagtc attctggagg tagtgtgata atatctcatc gtggttattt 360 gctttagcct gatgattaac gatcctgacc attttttgga acatttggag atcatctttt 420 gtgaagtaac tactcaaata ttttgcccat tttgctactg ggttgttcaa aagattcatt 480 aaaagaactt cttttatata tgggtttgta gttgttattt agatattcta gagactagcc 540 agatccctat actacaaata ctttctccta ctttgtagtt tgccttttta ctttctttta 600 tatacatata atttttcccc ctccaaaaga cagggtcttg ctctgttgcc caggctggag 660 tgtagtggtg caatcatagc tcactgcagc cttgaactcc taagctcaag caatcctcct 720 tcctcagact ctggagtagt tggaacaata ggcacatggc attatgcgca gtcaacttta 780 aaaaaaaaaa aaattgtaga gatgaggtct tactatgttg ttgcccaggc tgatctttaa 840 ctcctggtct aaagcaatcc tcctgcctca gcctccctcc caagtagcta agaatacagg 900 tgtgcaccac cacatctagc tttactttct taatggcgtc ttttaatgaa cagataattc 960 ctaagtttga tgtagtcaaa tcatcatttt ttcctttata gtcagcattt atatccagtt 1020 caagtaaaga atatcatgaa aacattcttc tttgttttct tttagaaact ttcataaagt 1080 agcatttaaa atgtgaattt tcctataatc ctagcacttc aggaggctgt gccaccgcac 1140 tctagcctgg gcaacagagc gagaccttgt ctcaaaataa aaaattaaaa aaaaaaaat 1199 <210> 73 <211> 1602 <212> DNA <213> Artificial Sequence <220> <223> sequence of T9F <400> 73 tgagcatctc tgaactattg cgccatgtat ttccaatttt catattgtgt atttgtatat 60 tttatatgta atagtatagg tgtaatatgt aaatatattt tatatgtatt taaaatcttt 120 atattttgaa gggttttgtt tcaactatta cttgttaatt tcacagtccc tttctttgat 180 gttagcaaat agtaccttca tgaacctcag aggacttgga tctgaatgtg caatgccctc 240 tagtatttca aataatagtt cagttggtat agtatttttt taatctgcaa aaaacaatac 300 ttgctaatat agctatgtta gagtaaacaa taaatcgaga ataaatttat agcctttgaa 360 acaaaacaaa ccaaaaattt tactcctttt tggctttcat ccctgcactg gtatcttaac 420 ttctgtttgt ataaaagaat accatttttt cacagaagac aaagaacaat cagccaatct 480 aataattatt ttatggccat gctctgaaat acaattaaaa ttatgattgt ggacaatatg 540 ccttttcggg acctggctga tggtatttct ggtgtgaccc caactttcca gtcagttcag 600 ggcaataaac attggataca ggacagcttt ggggatgaaa tagaattaaa tttagtgtag 660 tttttgccac ttttagctgg atgcctggcg aggggttttg tgccctctga gagcctccgt 720 cttctcaact gaggggtggt tgtgagtttt gggtcaaatg cttggtgttt agtagatgct 780 tggagcttcc atgaaacatg caaccacggc gttgctgcta tttgttcaga tgcgagagga 840 acatgacttt tggctgcctg agtgttctca tagcatctgg gccttccttg tgagatcgtc 900 agaaagtgtt tcctgcacaa agcctgtact gcggccctgg cgtggggctg attgtcccgc 960 tactctgctg tgatggctga attcaaagag tggccgatag gagcacgtat ggtgggtgcc 1020 ttgttaacag ctcatagcag aaacgtgaca agcgggagag ggctttgggt tgtcctgaac 1080 ttcaaacacc tgtaactgct gcgggaagag cggcacgtgg atgaaacgga cacagagggg 1140 gaataggcag gaaaggacgc gggctctttt cgaagcagca ggtctcaagg cggccagcca 1200 ctggcgcagc tgcagctgaa gccacggcag agtctccatc cttcccacta tctgctgaat 1260 cagagaaagt ggcaggcaac atttttagtg ccttaaattt agaacgcttg ctcaaaatca 1320 gaccctactt aaaataagga gcgataccct catttcttaa atagtaaaaa tgccctcagc 1380 agaattaacg ggagtatctt ccaacttcat atcctgaatg gaaaagtctg tccaccatcc 1440 cgaggacgtg tttgaagcgc agtgtgaaaa tccagcacgt cgtggaccgg ccagacccct 1500 gtgccgtgag aggcggggcg gcggggccgt ggggcgctcg cactcccgag ctcatcgtgg 1560 catgcgctga gccgaaaacc acgaggtaga gggaatgaga tc 1602 <210> 74 <211> 1602 <212> DNA <213> Artificial Sequence <220> <223> sequence of T9R <400> 74 gagcttgatt gtctggccgc gaaaacaggg caggcccgtg tccaacatga tagtgaccag 60 ggagacgacc acatccatgt agggcctggg gagagacagg agggagcggt gggctgaggc 120 cagcctaggt ggtggccctg cctgtagtcc tgtggactgg ctgatgccaa cagcctcagg 180 tgtgggctcc tgccacccac ctcgcctgcc acatcttgca catccccgag gcaactttcg 240 atctgctgca ctcggtcacc cgtactgccc aggcaagggc tgcccatacg cactctggac 300 aggctgagtg tcctgccctg tcccccacat aaggctgccg gccatggctt ctgcacctgg 360 gtgggatgca gacacgctga cctgcctttc tctgcggggc agtggggatg aacccaggtt 420 ggactgtggc cttggccaag tgacctgtat atgaaactgg gacaaagccc atctttggca 480 cgtagcctgt ggggtggcag gtgctcaggc tttggtgaca aggtggatgg gatgcccaga 540 aagggagagc ccatggctga aggcgtgggc aggattgtgg ggaaggtggt tggaattaga 600 tgcccagagc aagaatttat tggcacaggt gggcagacag aggtgaccaa aggacaggtg 660 taggtcagca ggtggctgct agcacctacc tcactctctg gaacccgatt cccttcatcc 720 taaaggggat ctcagaacgt tccacacacc ccctccgcct ccaccctggc cctcacccag 780 gctcaccgca cagccaggta gcctggacac acatctccat gaaccacttg aagggtgtgg 840 cctccatctt gccccccatg atcatcacca tctcatccgt cagcttgatg tcgggttccc 900 agccgagatt gccgcccggc gagctttcaa acatgaagcc aaagtctgca aaaccccaaa 960 gagctgcctg tgactgggta ggagccaggg cgggcaagga cgagtggtct gttttgagga 1020 gtggaaaagg actcttcaac aggagcaccc cctccacccc caaaaggcag gttgtgtttt 1080 cttggagaca gtgatggggt gggtggtggg gcagcaggca gagaaagaga agggaggaag 1140 tggaggaagg agccaagctg gggcactgaa cctggaccag ccccactccg cccagctcca 1200 gcttctgact cagagcaatg gcggctctcg ccccagctcc ctggggccgg ggccaggcac 1260 cctctacagc agaacagctt ggtggccgac agttcggacc tcagagctgg accctgacac 1320 tcctggcagg gtggtcctgg gcattctcct ctctgtgggg tggggatccc tatccacccc 1380 tgggtgccgg ggtgaaggga gaggagggtg gcgctgtggc tggctgaccg atgtggatga 1440 tatggccctt cttgtccagc ataatgttgc cgttgtgtct gtccttgatc tgcagcagga 1500 acagcaggag gctgtaggcg gccatgcttc ggatgaagtt gtagcgggcc tgtgcagaga 1560 gcgccctggg ctcaaaaagg ccctggggcc tgtgggcatt ct 1602 <210> 75 <211> 1301 <212> DNA <213> Artificial Sequence <220> <223> sequence of T10F <400> 75 aatcaaactg gacccttatc ttccaccata tacaaaaatt aatgcaaggt ggattaaaga 60 tttaattgta aggcctcaaa ctataaaatc ttaaaaggaa acctaggaaa taccatctgg 120 acatcagcct tgggacataa tttataacta agtcctcaaa agcaattgca acaaaaaaca 180 aaaactgaca agtgagacct aattaaacta aagaactttt gcacagcaaa agaaactatc 240 aacagaataa acagacaacc tacagaatgg gagaaaatac ttgcaaacta tgcatccaac 300 aaaggtttaa tatccagaat ccataaggca cttaaacaac tcaacaaaca aaaaacaaat 360 aacttcattt aaaaaaagac atgaacagac acttctcaaa agaagacata caagtagaca 420 aaaaacatag gaaaaaaata cttaccatca ctaatcatca gaaaaatgca aatctaaacc 480 ataatgagat atcatctcac accagtccaa atggccatta ataaaaagac aaaaaacaac 540 agaagctggc aaggctgtgg agaaaaagga acacttatac acttttggtg ggaaagtaaa 600 ttagttcagc cactgtggaa agcagtttgg agatttctca aagaactaaa aatagaacta 660 ccatatgacc caacaattcc attactggtt agatacccag aggaaaataa attgttctac 720 aaaaaagaca tgtgcacttg tatgttcatt gcagcactat tcacaatagc aaagacatga 780 aatcaaccta ggtgcctgtc agcagtgaat tggataaaga aaatgtggta catatacacc 840 atggaatact acacagccat aatagaagaa tgaaatcatg ttctttgcag caacatggat 900 ccagctggag gccatcatcc taagcgaatt aacagaggaa caaaaaacca aataccacat 960 gtcctcactt gcaaatgaga ggtatatata gacataaaca tgggaacaat ggacactggg 1020 gactcctgga ggagggaaag aagtggcagg caaagggttg aaaaactact tattgggtac 1080 tatactcact acctgggtaa tccgctagta gggatcattt gttccccaaa cctcagtatc 1140 acataatata cccatgtaac aaacctgcac atgtaccccc gaatctaaaa taaaagttgc 1200 aattattaaa ataaaataaa aataaagcta gcaatgagcc ctatacatga aaatcaataa 1260 aacataatca tggctgtata gaggggcttg tcatttatag c 1301 <210> 76 <211> 1300 <212> DNA <213> Artificial Sequence <220> <223> sequence of T10R <400> 76 aattttacac acacacacac acacacacac acacacacac acaatatcgc tcagccttaa 60 aaacatgcta ctaatcggct ttaagaaaag aagaaaattc tgtcatttct gacaccatgg 120 aagaacttca acattacgtt aggtgaacta attcaggtac agaagaatac tacagtatct 180 cacttatata tggaatgtaa aaatgttgaa ctcaaaagta gagaatggaa tggtggttac 240 caggccttga gagagagggg taaaggttgg tcaaaagatg caaaatttca gttaagagga 300 aggagtacaa gagatttatt gtacatcatg gtgactataa ttgataacaa tgtgcttttt 360 tcttgacaat tgctaagagt agaatttgtt tatgggcacc aagcttgatt ccaagtcttt 420 gctattgtga atagtgctgc catgaacatg caaatgcgtg tgtctttttg gtagaatgat 480 ttgttttctt ttggatatat acccactaat gggattgctg ggtcaaatgg tagttctaag 540 ttctttgaga aatctacaaa ctgctttctg tggtggccaa actaatttac actcccatta 600 actgtgtcta agtgttccct tttctccatg tcctcaccag catctgttgt ttttttgact 660 ttttaataat agccattctg actggtgtaa ggaggtatgc cattgtggtt tgatttgcat 720 ttctctgatt agtaaaatga agcatttttt gtatgtttgt cagccatgta tatgtcttct 780 tttgagaaat atctgttcat ttattttgcc cacttttaaa tgaggttatt tggttttgct 840 tgttcaattg tttaaattct ttatcgatgc tgtatattag acctttgttg aatgtgtagt 900 tttgagaata ttttctctcc ttctgtaggt tgtctgttta ctcttttgat agtttatttt 960 gctgtgcaga aactctttag tttaattggg cctcatttgt caatttttgc tttcgttgta 1020 cttgcttttg gtgacattgt cacaaattct ttcctaaggt caatgttcaa aatggtgttt 1080 cctaggtctt cttctaaaag tcttatagtt tgagggttta catttaaatc tttaatctat 1140 cttaagttaa tatttgtata tggtgagaga aaggggtcca gtttaattct tttgcatatg 1200 actagccagc tatcccagca ctatttatta aatagggagt actttcctca ttgcttattt 1260 ttgtcgactt tgttcaagat cagatggctg taggtgtgtg 1300 <210> 77 <211> 2001 <212> DNA <213> Artificial Sequence <220> <223> sequence of T11F <400> 77 tctttggggt atgattatat gtctaggtaa aactctttta agaagatgaa gcagagagga 60 ttgaattgac aaagacagct ctttaaaaat taaggttatt tcaagactaa gaacataact 120 gcttaattgc aggtaataac agaaaaaact tggaaataaa catcccatta tttgacctcc 180 aaggcagaag actggcacca aggaaatggc agcttcgtcc ctttcctgtc ttgggcattg 240 gtaaaaggag ttgtctagac atgtttgatt tctgtttcag cccttattag tagttatgcc 300 atggcaaatt attcaatttc tctgactcag tttccttatt cagaaaatgg aagcataatt 360 cttgcctcat agggccatga agattaaatg aggggtgtct tgaagtgtct gggacataaa 420 tcttcaataa aagctaattc ctttttttta cagttatctc aaacctttta gtgaattggt 480 gcttatcagt gagcttttta ggtgatgcaa agaccctgct ttgctcattt taaggaacag 540 ttatttttct ttctccattt tgaagtttct tgtttgctgc ctggttgata tggtttggct 600 gtgtccccac ccatatctca tcttgaattg tagttcccat aatccccaca tgtcatggga 660 gggacctggt gggaggtaat tgaaccatgg gggtggttac cctcatgctg ttcttgtgat 720 agtgagtgag ttctcacaag agctgatggt tttataaggg gcttccccct tcgcttggca 780 ctcattctct ctcctgttac cctgtgaaga ggtgtctcct gccgtgattg taagtttccc 840 gaggcctccc ggccatgtga aactgtgagt caattaaacc tcttttcttt ataaattacc 900 aagtcttggg tattccttca aagcagcatg agaacagact aatacattgg tttaaattag 960 aatgccaaaa tttaaataat ttttatcttg aatagtagat ggaattaact ttctcttgaa 1020 agatatattt taaaaaattg aacttacaca gacagttttg aaatggtctt attttagttt 1080 tatttattta tttattttga gacagagtct cacagtgtcg cccaggctgg agtgcaatgg 1140 cacaatctcg gctcactgca acctccacct ccagggtcaa gcgattctct tgcctcagct 1200 tcctgagtag ctgggattat aggcgcccac caccatgccc agctaatttt tgtgttttta 1260 gtagagacgg ggtttcacca tgttggccag gctggtctcg aactcctgac atcgtgattc 1320 tcccacctcg gcctcccaaa gtctcaggat tacaggcatg aaccaccgcg cctggctgaa 1380 attgttttta ttatagatgt tgcttgtgca gttttgttag aagttcgtga cttttaacag 1440 tgatgaaaat acttcgtcat tcaacaggtt atttttctgc tggttgtagg ttatttgtaa 1500 ggaactgtta gtctcctatc tgggtggaca tgtaatagta tcagttactg aaccagaact 1560 ttaaacacct ttctgatact cacactggga ggtcaccaag tatctcagaa taaaatgtcc 1620 caaactgaac ctaccatgtt cccagaaacc cagcccttct caaattccca gacttggtga 1680 atgggagcct gtccttgcag tcttgtagcc caaaacctag ggcttaagaa caccttcttc 1740 cttactccca tatgcaaccc atcaagttcc atgcatttca tctcctaatc tcaaatccct 1800 tcacccatct ccacagccac cccgctagtc cgggctgcca ttgtctctca cttaaaatgt 1860 tgttattgtc taactgacct tcctgaaccc tttcttgcct ctttccagtt tattttccac 1920 actacagcca gaaaaagctt ttcaaaatac gcatctggtc acctgcatac ctgtctccag 1980 accacataca ataagccttc a 2001 <210> 78 <211> 2001 <212> DNA <213> Artificial Sequence <220> <223> sequence of T11R <400> 78 tctgccagcg gctcccgcgc caggtcctcg aagcgcacca ggcggtagcg gccgcgcagg 60 aagggtggcg gcttgagtgt ggcggcctcg gcgatgcgca cgtggctgcg gcacacctcg 120 cgaatcaggc gcaggtgagg gtcggcctcc acccacttgc cgttggtgcc cagcacgatg 180 ccgttgtcgc gtgccagtat cgggcccgcc gcctcccggg agcgcagcac ggcccgcggg 240 tcgcgcacca ggtgcacgat gcgcaggttg agcgcggggt cgctgagcag cgggtagagc 300 acctgcaggt tgaagaagcg cacctccttg agcaccacgt ggctgtagga gcggcaggcc 360 tcccgggcca ggctgaatgg ctgccgcgtg cacagtgtct tgcatacgtc ctgcttgctg 420 atggtgcctc ggggaaaggc gctgcaggcg ggcggcgagc acagcgcgcg gctcgttgcc 480 cagttgaaaa aggcggacag gtttcggctc tgtggcatgt aggcatcaaa cacgtccatg 540 tcgcacaaaa agatagagcg catcaggtcg cgcacggcca tgtgcagcgt tgccgcgctg 600 ccctgcgaca gggtggtcca cacatgccac gcgggctcca tcaggtagaa gacgtcgggg 660 tgctggctga agagctggcc caagaaggat gagcccgagc gccacgagga cagcaccagc 720 acgtgcacac gatcctcgcc gccggctggg gatgagggcc ctggccggga gatgatgaag 780 agcaggaggc aggtggtctg tgccaggagg agcactgtca ctgtcttgct ggagaaccgt 840 ggcagccaca tgcgggcggc tgggggcctt cgggtggagt gggcaacttt agggacccgg 900 gccctcatgc ccatcccatg ccccaattac tgcccagtgc cctcagggat cagccctcag 960 attcggctac cctacccatt ggacttccca agactcccaa ggtctcagtc gagcactttc 1020 ccaggaatac ggagtcaaga cataggccag aatatagtct gtgctcacag cagaagtcca 1080 gttgcagaat aatgtgggat atcatcaaac tgtctaccta cccacccacc cacctactta 1140 catacctaca ggctatctat ctgtagagag aaatactatg tttcaaagag aactcctgtc 1200 ttttgcttca ggatacctct tagagagacc cttttaggtt gtggagctaa aagggcttga 1260 tgggggcttc ggtggatgtc agagcaccac caggctcgcc gaggttgaat cctggctctg 1320 ccacttccta gcctatgatc ttgcttatga agatcactta aatctctctg tgacggatca 1380 ctttacccgt gtgtgaaaga gggataattc cggtacctgg ctcacaggat ctggggggat 1440 tggggggtta ttataatgaa gatgggggaa gggaacacgc agtcatgccc ataactgagg 1500 attgcacctt ttacaaggtg tgcttctgta ttatataatt tttttaacag gcaggtataa 1560 aacttttgtc agccaggcgc ggtggctcac gcctgtaatc ccagcattat gggaggccga 1620 ggcgggcgga tcacgaggtc aggagatcga gaccatcctg gctaacacag tgagacccca 1680 tctctactaa aaatacaaaa aattagccag gcgtgatggt gggcgcctgt agtcccagct 1740 actcgggagg ctgaggcagg agaatggcgt gaacctggga ggcagaggtg gcagtgagct 1800 gagattgcgc cactgcactg cagcctgagt gaagagtgag actccgtttc aaaaaaaaaa 1860 aaaaaaacaa caaaaaaaaa acttttgtca ttaaagataa acaagtaaat aaagtggaca 1920 aagaacagca actgttgtca tcactggtgg ggagtgaagt gctgtaggca gcatgggctc 1980 cagaaggagg gtgtcctgga g 2001 <210> 79 <211> 2100 <212> DNA <213> Artificial Sequence <220> <223> sequence of T12 <400> 79 tggcatccag catggagccc acagcttccc tttgtagaat tgcccagttg ttgcagagtg 60 ctttggtctc aatgggtcta aagctcttga tgatataaga gcttcaactt ccttttccct 120 ctcctccccg caggctgcac aatgtcctgg tgaatcacct gggacttcag agctctgcca 180 ccctgggtgt gaagctcagg tctgctcttg gtagcttggt cagtgtgaag tacaccgtga 240 ttttgggcaa gctgcttaac ctccctggcc ctccgtttcc tcatctgtag aatggggata 300 ttcacagaac ctacttgtag ggccatggtg aggattaaat gatgaacagt gctggcaaac 360 aggaaatgct atataagtgt ccctagcaat atacacaccg cacatcctca gtcaccacgt 420 gtgttcactg aggtatgggc catgtgtggg tggaattgtg ttccctaaaa agatatgttg 480 atgtgctaac ttgaggtccc tgtgaatgca ggaaaccaaa atatttcttc tcaaaatagt 540 gaggattgtt aagttaaaga cactgaaaat gcaggggaac actgccttgg cctctacttg 600 cctgatgaca ggcacgaatc cttccttact taagacacat cacttgctta tcagcccaga 660 gaaagcacct gcaggcacca ggaaaatcta ggaacagatt ttactctctt cccacatttt 720 cccacttttt caaacactga aactgctctc tcctttgtct tgtcactaga taggatttat 780 ggctctttgt taaaatattg tttaagcaag gcttctacgc cactagcttg agagagaaat 840 acttttgaac tgaggcctct tccgcatgat aggcagagca tgcattaata catttctgct 900 tgtttctctt ttgttaatct gacttttgtt ttccagagtg tctcaaataa gaacataaaa 960 gggaggggag aaattatagt ttctccccta catgaactta ttcggatata gggtctttgc 1020 agatgtaatc aagttaagat gaagtcatat ttgattagga taggccctaa ttaaatatgg 1080 ttgctgtctt tataaaatga gaagaagaga ccaggtgtgg tggctcacac ctataatccc 1140 agaactttgg gatgccaagg caggaggatt gcttgaggcc aggagtttga gactagcctg 1200 ggcaacacag caagactcca tctccaaaaa aattaaaaat tagctgggca tggtggcatg 1260 cacctgtagc cccagctact tggtgggctg aggcaggagg atcaattgat cccaagagtt 1320 caaagctgca gtgagctatg atggcaccac ggcaacctgg gtgacagagc gagaccctgt 1380 ctcttaaaga agaaaaaaag aggagaaaaa aacagagaca cagaaaaaag tccttgggat 1440 gataaatgca gaaattggag ccatatatcc acaagacaag gaaccaccag gattcttggg 1500 aactccagaa gctaagaaga gggcatggaa caggttctac cctagggcct tcagagggag 1560 cgcagccctg cagacaccct gagttcagac ttctggcctc cagaactgcg aaagaataac 1620 tttctgttgt tacagcagcc ctaaggcact agtacaggtg acatgtattg ctcttctgaa 1680 gagcagggtg tctacagcgg cagaggtctg ggtcctggca cgtgcccttt aggattccaa 1740 tatccttagg ggcctgctgg tgctgacagt tccagaacca taagacagaa ttcctgcggg 1800 ccagtttgga agcagagaca ggaaactgga agagccctta gcctgtgctt gggcttaaag 1860 ccctttagct tgtggcttta actctgaaac ttctagaggg catcttgcag gtcagtgtga 1920 ggtacagaag ttgtcacaag cttcctggct caaagaaagt gagacttcac gaacttttct 1980 ggacatcaca ccagcactta tgaagttatc ttgttaagca cagatgaaat cagaaataca 2040 ggcattcacc atcacttaaa caaagctcag attgtagagt gcgaggaaga atcggtggga 2100 <210> 80 <211> 1700 <212> DNA <213> Artificial Sequence <220> <223> sequence of T13F <400> 80 cagatctcta aagtattggg tgtggactag agctctggac ggcctaaagg aaaggaatgt 60 gccggttcac agggacccgc ggctaagctc aagggtaaaa tacagcttta caaagcatct 120 ttaggctgtt ccttcccaaa cgtgcttaga agggaacagg gaaaggcggg tgtgttttct 180 cactgaggtt cttctagtgg ctggaatctg atagagtacc aagttgtagg gatatggata 240 tattttccct ttggcactcc ataaagctaa atgttgggct gaaaaaagga tgcagcctat 300 aaacaagtat ttttcctgaa accaactgca tgaggaaacg ctgcgctccc cctcagggag 360 cagtttctga agccagctga gcacagctgg cactggccag agggagccct ccaccctccc 420 accacgtatg cccacctgca aacctgggtt ctgagtcccc atgcagggga cagacctgaa 480 aattccagtt tgtgtccttt caggtcatcg acaggaatga cagcctggca agctgcagtg 540 actgcacaca gctaccctgt gagctccact tgtgtgggtg caggtgggcg acaggagtgt 600 gtgacacaga caggcactcc accaggagga aacccacagc agacgtcaac catcgcttta 660 ttaaggctgc gagtcggggg gctgagtcat gcactccaca gacaccccca ctgctcccaa 720 ggtccacttt tggatgaccc tgaaggcaga gactcctgag atctgggcca caatctaggg 780 tgagccaccc acagtgccct gctggacagg ggggtatgcg gactgcacgg gggggccctc 840 agcaggggtc ttcctgccta gggtggggct ggctccagtg ggtcctgggc tcaggcaggg 900 ggggtggcag ggaggcaggg acatcccccc gccctctggc ctatggcttt gttgccctat 960 tgccaccagc gcagaagcaa tgtgctatac cgtgaggtga tgaagaagag ccccgggagg 1020 gagcaggcag ctctgtgcct ggggcctggc cagacctcag gggtgctgtg gccctgctcc 1080 tgttccccct cagctcctcc cagcaatggg tctcctccag tggaggtcag tcactcagaa 1140 gtggacccgc agcacgtctt ggctagcaac cggccgctgg caggctgtgc acgtcatggg 1200 cagggagcgt tgcttctcac ccaggcaggg tcggcacagg aggtggccgc agggcagctg 1260 gtacaccggc tcctttttga agtagggaga aaatactctt ttgcaggagg cacattcggg 1320 gcccaggatg ctcccaggct gctctggtaa atcaggaagg aaaacaggcc agggttagga 1380 aagctgctcc atggtccagg ctgctctgag gggcagagcc ttcccaccgt gctgctgcag 1440 catctggctt catccctccc gagtccatcc cagtctgatc aggtagggga gtggaagcgg 1500 gagagggagc ctgggaaccc gggaggcctc ttctctatca tctttgacca aatctcagtg 1560 cctctacgaa tgcttgagaa gagctggctt ctgagggcag caggcaggac tgggcccttc 1620 ctcctggtct cccagcaagg tttactttcc cctgcgatag gtggccaagg ctggagcaag 1680 gcacagctca ctctgacaag 1700 <210> 81 <211> 1701 <212> DNA <213> Artificial Sequence <220> <223> sequence of T13R <400> 81 gaatctgacc actcagtccc acatcccagg attcagagaa aaagaattcc agtgagggct 60 ctggacccca cacagctaag gcttccaggg tttaggcaag ccctgaggga cacccatcat 120 aattacccag acgggggccc agcatcccgc cccagcattc tgccttgcaa ggagctccct 180 caccagggct cagggaaggg acagcctgca gttccagcaa gggaggcctg cagagtcagc 240 cacaggtggc cactatcggt tgcttggtgc caacttagtg tgagggggca gggcccagac 300 tcgagggtgc cattaccgtc ccccatcgtg tacttctttt cctcgtagct tgagtctgtg 360 tattccagga gcaggcggat ggaatgggcc agctgggaga gatggcccac agctcgggtc 420 agagatggag ggtccctgac tttgtgacga ctctgcacaa ggggagcccc atctcctcct 480 ctcgttcctg cctcacccgc ccccaccccg cacgcccagc cacacgcaca gacagcggca 540 agcacagacc ccgctgtcag ggacagccct gaagaggaac cgtccctaga gcccgtcctg 600 cagctgctcc acacttcccc gcccccacgc acccccgtcc caccgcccag cggaccctgg 660 ctcaccccgc ggatgttcca gtaccccagt gtcatgggca tggtgctggt tgctgtggat 720 tctgcagaca ggcctcagcg gggcggggct cagcgtttgt gagaggccca gagagggtag 780 aggggaagcc ttgctgcgac cccgccccac ggcccgccct gcccccgaaa cgggccaatc 840 tggaggcctg gagcgcgctc atggggctag gagtaggatc tcctcccacc tcccagcccc 900 gtgggtttca ggagagagat caggacgccc agaagcccag ggcgggggag aactggttga 960 gtccaggggt tcaagactga actgagctat gatcgcgccg ctgcactcta ggttaggcaa 1020 gaaagaaagg ctctctctaa aacagagaga ttctgaataa agtaataata gcctaataaa 1080 gaaaaataac acaaaagaac atttggtgct cagggattca ctggataagt tttcaaaact 1140 tttcaatgta tgatagagat tgttataaac tgcggacata cgtggcatga cagacctaac 1200 gtgggaagga caacacaggc aaggatgatt ataactcact gtcacttatc agcctaaatc 1260 caaacgtcag gaataccgcc tcagagaaaa gaaaatgatg tttttgtcat aagtggtgct 1320 gtgctcctag ggagcttgct gggtgggaag agagacagaa aggtggggag caggggctgg 1380 tggacttggg gagggaggag aaagcccatg tggaaacgtt agaatctggg gtaatcagag 1440 gtctttgtat tcattcgttt tgtaaatttc tcaaactctc atgttaaatc aaaataaaaa 1500 gttaaaaaaa aaaaactacc aggacagaca tacacaaata ttattaactg aaataaatgt 1560 tccatcaaaa aggacttacc ttaactacat gagttatatt atgatttcta ttattattat 1620 tattattatt ttaatattag tatccatcca gcacaccact ggtcttcaag tggaggtaac 1680 tttgcccctc aggggacatg t 1701 <210> 82 <211> 1482 <212> DNA <213> Artificial Sequence <220> <223> sequence of T14 <220> <221> misc_feature <222> (132)..(978) <223> "N" stands for any nucleic acid on various positions <400> 82 atcagccccc acatgcccag ccctgtgctc agctctgcag cggggcatgg tgggcagaga 60 cacagaggcc aaggccctgc ttcggggacg gtgggcctgg gatgagcatg gccttggcct 120 tcgccgagag tnctcttgtg aaggaggggt caggaggggc tgctgcagct ggggaggagg 180 gcgatggcac tgtggcanga agtgaantag tgtgggtgcc tngcacccca ggcacggcca 240 gcctggggta tggacccggg gccntctgtt ctagagcagg aaggtatggt gaggacctca 300 aaaggacagc cactggagag ctccaggcag aggnacttga gaggccctgg ggccatcctg 360 tctcttttct gggtctgtgt gctctgggcc tgggcccttc ctctgctccc ccgggcttgg 420 agagggctgg ccttgcctcg tgcaaaggac cactctagac tggtaccaag tctggcccat 480 ggcctcctgt gggtgcaggc ctgtgcgggt gacctgagag ccagggctgg caggtcagag 540 tcaggagagg gatggcagtg gatgccctgt gcaggatctg cctaatcatg gtgaggctgg 600 aggaatccaa agtgggcatg cactctgcac tcatttcttt attcatgtgt gcccatccca 660 acaagcaggg agcctggcca ggagggcccc tgggagaagg cactgatggg ctgtgttcca 720 tttaggaagg atggacggtt gtgagacggg taagtcagaa cgggctgccc acctcggccg 780 agagggcccc gtggtgggtt ggcaccatct gggcctggag agctgctcag gaggctctct 840 agggctgggt gaccaggnct ggggtacagt agccatggga gcaggtgctt acctggggct 900 gtccctgagc aggggctgca ttgggtgctc tgtgagcaca cacttctcta ttcacctgag 960 tcccnctgag tgatgagnac acccttgttt tgcagatgaa tctgagcatg gagatgttaa 1020 gtggcttgcc tgagccacac agcagatgga tggtgtagct gggacctgag ggcaggcagt 1080 cccagcccga ggacttccca aggttgtggc aaactctgac agcatgaccc cagggaacac 1140 ccatctcagc tctggtcaga cactgcggag ttgtgttgta acccacacag ctggagacag 1200 ccaccctagc cccaccctta tcctctccca aaggaacctg ccctttccct tcattttcct 1260 cttactgcat tgagggacca cacagtgtgg cagaaggaac atgggttcag gacccagatg 1320 gacttgcttc acagtgcagc cctcctgtcc tcttgcagag tgcgtcttcc actgtgaagt 1380 tgggacagtc acaccaactc aatactgctg ggcccgtcac acggtgggca ggcaacggat 1440 ggcagtcact ggctgtgggt ctgcagaggt gggatccaag ct 1482 <210> 83 <211> 1680 <212> DNA <213> Artificial Sequence <220> <223> sequence of T17 <400> 83 ggcgccacta cgggattaag cctgaaaccc gagcggcccc ggcccccgcc acggccgcct 60 ccaccacctc ctcctcctcc acttccttat cctcctcctc caaacggact gagtgctccg 120 tggcccggga gtcccagggg agcagcggcc ccgagttctc gtgcaactcg ttcctgcagg 180 agaaggcggc agcggcgacg gggggaaccg ggcctggggc agggatcggg gccgcgactg 240 ggacgggcgg ctcgtcggag ccctcagctt gcagcgacca cccgatccca ggctgttcgc 300 tgaaggagga ggagaagcag cattcgcagc cgcagcagca gcaacttgac ccaagtaagt 360 gcaaaagaaa ttgccccctg atttattgct gaaacctgta aggctcgaat gtgcaaaact 420 gatagtttta ctaacctata aaaacgtcta gacgcctacc caagcctagg cgaacaacat 480 gcatccataa aaagagcttc ccataaccac ctaccctggg cgctcagtta gtacggtaaa 540 cagagcgcga gcattaaggc tttttatgat aattccccac aagttgtgaa aagcgaccat 600 ccttggtgaa attaatttaa cgacctctct tccccaccct gtggtctctc cctgcctccc 660 ctcctctcct ctctccccgt ctccaaacct ccctctttgt agacaacccc gccgcgaact 720 ggatccacgc tcgctccacc cggaaaaagc gctgtcccta caccaaatac cagacgcttg 780 agctggagaa agaattcctc ttcaacatgt acctcacccg ggaccggcgc tacgaggtgg 840 ccaggattct caacctaaca gagagacagg tcaaaatctg gtttcagaac cgtaggatga 900 aaatgaaaaa gatgagcaag gagaaatgcc ccaaaggaga ctgacccggc gcggtgctgg 960 cgggagcgct caagggcagc ggatttgttg ttgttgctgt tttcctttgt gggtgtttgg 1020 tgcttgattt ccagaaactc tccagcgact tggacttctt cttctttttt tttttctttt 1080 tagatagaag tgactgtgtg gttggtctct gaggtatttg ggggactctg tatttgctcg 1140 tttacgtgtt ggaaaaacca agtggctttg gggtttcgcc ctatcccact ccctctcttt 1200 cctgctccat tggttcctta agaaatgcta tattttgtga gtgcaagctg gcttggggag 1260 ccctctcttg tgtaaatgtc ccccatgttt ctgaaaagtg ctgtagttta gtcccctcac 1320 ccccagcact gcccaaacag gggccaagtg cgccccaatt ccaagaatga aggcagagcg 1380 acaacagtgc ggacaccccg gctgctagcc cacggtgaag cccggcgggg ttgcccacca 1440 gttgcgaaag ccccctttcc tcagggagca cgcgggacct cggtggagat ctccagtgag 1500 gcttagagga gcccagggcc tcgggcgggt tggggtttgt cctcagtgca ttggacgcgc 1560 tgctctctcc cctgaaggct gggctcgcgt gggcggccgc gggtggtggc cctcccggtt 1620 cctgcccgag gaccagttgt aaatgttact gcttcctact aataaatgct gacctgatca 1680 <210> 84 <211> 919 <212> DNA <213> Artificial Sequence <220> <223> sequence of T18 <400> 84 gatcatctac taggttgaaa ggagagaata tgacttccag aacagcactg atgcttaaaa 60 aggatgcctc tggaagaaaa ggaggaagag gagcaagtga tgggagaata cagtgggact 120 ttgggcacca tagggtcatc ctgagttttt caccaaaatc aggaacagcg gcaaaactgg 180 tttcactgaa gaagacacac gtttggagac atgtgtagtc tccaaggatt ctcacttaac 240 aaagcctatt tctgttgtta aaaacccctg cataatgcac ccacacacaa acacaaggct 300 tggtctgtgt tcctggccac ctaaagaaac tgattcccag taagtttaaa cctgaatgaa 360 atgtttctgc aaattcagcc tcaaaattcc tcctctacct ggcatccctg gcttgtaaac 420 tatgtgtctc attagttcat aaacaaagca gccctgactt tgccttgtac tcaaccacag 480 ccctaggagc cagtagaatt tgtccagagg tgctgggctt tggagcccaa gtggacaaag 540 tcagaccccc tttcctcagg gcaaagccct cccacagggc tgggacccca aaggctatgc 600 tggaagcagg ttcagcagca ggatatcaag gggcaaagct cctaattcaa aatcttcctg 660 gcttctgaac aaccattagg atggacagag aaaacttttg ccctgctctg agagggtccc 720 acagggcttt tggaagcaga gccaccattg agaaatccct ttcaacctga gtagtaattc 780 agatttttct cccactcctg cacaacttaa tttgctgaat ggaaaattca gccagaagtg 840 atgggctgct tgaaatcaac aaaacttgac acattcttcc cattttcatt ttactttatt 900 gttaaacaca taattgatc 919 <210> 85 <211> 1174 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A1 <400> 85 gatcaataga agaatggagt ttgtgtttgc tagccatagt tttgacgtgt gggagagttg 60 gagtctagaa ggttctctgg acgaatgtcg gcttgttaac tgcaggaatt cctctgtaag 120 tctctgtcct tacagaaaat ggcccgaaat tgaaaaaccc tacttcttgg aaaacagaaa 180 taatttgtgt aatgaatgtt gcaggcggtg ttggacgttc gtgtggagat attggcaatg 240 gtaggagacg atggtatcac acgttggatc gattaaaaag aaaaacagag tctctccatt 300 tgtgagtttc tctcttttaa ttacttttgt tactttaaca tccttaggat tcacagacga 360 aaaacagaga cacccaattt ttgtgtttcg agactgtgtc gtgtgttgtg tagttggtat 420 caaccaactt atatctgtaa tcattgtttc tttttattta ttctcggttt gcagaaacat 480 ccgatgagct tgtcttagag ggacgtttgt tgttgttttc tgggtctggt cgtgatgaac 540 tcgaaagcat tgtgtgtttg gttagtagtt tgaaataggt gtgtgtattg tatttgtata 600 tgctgcgttt gtgttttaga gatcatcgta cataaaacac atcatcgtac ataactaaaa 660 tttgagctaa actacaaaag aaagtaacct tcatttttag tcgaaccagg ccccagctag 720 gcagctatct cgtaaataag attgctggct tacgatcgta ttccacgtgg caatttatgt 780 gccgtggatt taaatttgta cgtggcatga gtgttaggag aatgtccaca tggcttgtag 840 ttgttagtcc cacgctctga accagagcaa ccggctcctt acacgtgttc ggcttaaatc 900 catttttcga atgagattac acttctaacc ttgtctccct ctcccgctta taccaccacc 960 actctcacac aagtctctca agtcacaaac tctgtttcaa accaaaaggg aactttgtgt 1020 gtgttgtcga gttttatggt gactgtaaac cctagccaag ctcattgttt gcctatgaaa 1080 atgagtctac cgggtttcaa tactcttccc cacacggcaa caacgatacc ggtttccata 1140 cggagcaata ggacgatgtc gttttttgag gatc 1174 <210> 86 <211> 910 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A2 <400> 86 gatcaaaatt ttggtttctt cgctttgatt ttcttcttct tcttcttctt cttccctcaa 60 gttccttaga atatctttct catccatttt ttttggttct tgttttgtta agtgaacatt 120 ttagttgatt ttaaagtgct aaacttaaat gcagcatttt actaatataa aattacgctc 180 cattattgac cttatataca tagaacaaaa taatgttata atcttcgact tttttctaac 240 aaatattaac caatcatgtc actaagaaat taaaaaatac tagtatatag gaatctagtc 300 cattgtatat atcgtaaaca tggacacttc accaacgaac atgcatgggg tctttttata 360 aggttcttta taccgaaacc attgttttgg tttttatgat aattgagtta gttttgtggc 420 ttttccgttc aactaaaagt ctcattatgt caactgctat taaaccggcg cacatggcat 480 gttttatgaa attaaggtca attggactcc aacttttcaa ttattaaaaa aaaagaaaaa 540 tgattgttgt atgccttggc gaagaagaaa agccgctagc tttattcatt atcaaacgaa 600 acaaaaacaa caacacatca ctaagaatct taaactctta accttacatc aaagtaactt 660 ttattacatt gcatacaaga aaagaacaaa ccagcattat taggtttgag attaaacctg 720 ttcccacaca tatacataga gatatgaact ctacaatttc aaaccagagc cttgaagttt 780 ctcctcaaca atcatgtcga ttttgttttc catttcagga gtcatataac tcttccaatc 840 accaacttcc cctttacgga aaaaactctt gaaacttact ccttccgaca agcttcctgt 900 tttgttgatc 910 <210> 87 <211> 906 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A3 <400> 87 gatcattaat cgcagatttt tacaagacag cagcttggag agcaacttac aagtgtgtta 60 taaactctga actcaacttg gaagatgttg acgttccaaa tgaaattgga agacaaacta 120 tcttcccacc aaggacaaga aggccgtctg ggaggccaaa aaggctacgt atcaaatcca 180 ttggcgaata tccggttcgt atttgtagga gtcccatttt ttcgacttta tctttattcc 240 gtatttaatt ttcaatttta tgtggtttaa cagaaatcaa agagcgtgaa ggtgaagatt 300 aacaggtgtg gcagatgcaa aaagactgga cacaacagga caagctgtag taatccaatc 360 tgaagatgtt ttaaaatcgg ctatattgat agaacgatga ccattttatt attgtttttg 420 tgtttggaaa tggttatttt tggataaaat atgttgcatt ctattttata attttagttt 480 cgacttatta catataaatc tagtaaggta atatattagc aaattacaga taatgatgaa 540 aaacatggac aggtataggt ggataagata taaataaggt aggactgaat tgttacccgt 600 taataatgaa agaatatacg aaatactaaa cattaaataa ggaagttact aattattgga 660 caacaaaaag tttaattcct ttaaaaagaa attggaatac agacagtttc attgacctaa 720 ttaagtactt ctttgaaaaa aatcaaacta ggagaataga agttgtaaat aattgaaggg 780 aaacgtcgat tcggtgaaaa ggttttttaa ttagtattta aagggaaata tcttctctta 840 tacagaatat cttgccccag aacaaatcgc ctcaaatact aaaagtgtgt acatcttctc 900 ttgatc 906 <210> 88 <211> 782 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A4 <400> 88 gatcaaattc atatgcttat ttgtgattat actttgcttt gattcaggaa atcaaagaag 60 atagctccac cttacagggt gatactacac aatgacaact tcaacaagag ggaatatgtg 120 gttcaggtgt tgatgaaggt aatacccggc atgactgtag acaacgcggt taacattatg 180 caagaagctc atatcaacgg tttggcagtt gtgattgttt gtgctcaggc tgatgcagag 240 caacactgta tgcagctgcg cggtaacggc cttctcagtt ctgttgaacc tgatggtgga 300 ggctgctgaa actaattaaa ctcagtatag attttcccac cttccaggac tctctattta 360 gtcaaaaaca tttgttgttt taatgtatat aatatcagaa atttggtaca agactgttac 420 tatatgcaat gaaccttgcc cctacataga tctgttgtga gttttaagtg ttttcatttg 480 gaacttcaga atgcaaataa acaaaacttt attgaagtca aatggtgtta cagatgaatc 540 tttctgattc tgtaatcact aatgtaaatg tatctaagca attgtaaggg agtgacgtgt 600 ttcggtttca tctcgcccaa aaaagcattc aaacccaaga aacctgcagt ttcaagacat 660 tgatgggata ccatatagat gtatcaagca tcaaccggag taagaagcga ctgaatgccg 720 aagataatga aaagcattcc accggaaaga gccacctgca acaacataag agctatttga 780 tc 782 <210> 89 <211> 1356 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A5 <400> 89 gatcctgtaa aacataaagt tagagataat tgtccgattt gtttgccctt ttaatttgga 60 gagatatgaa ccaaaaacat atttcggaat gggtcccttt ttcatcgtgt gtaacagttt 120 taccaaacag taatactttg tgaaagtttt gattaattaa tgcaaaaaga ttagaaaaaa 180 gcgaaactaa tttttggatt acactagaaa aaggttaaaa tcaataacca aaaaaagaaa 240 aaggttaaag ttacaaaaca caccggttta tagagtgaaa tgattattgt tctgttgaat 300 tgacgtgcca gcttagcatc accttactat tatcagtcac ctatatatca caattcacag 360 gcttcttgct ttctctcatt ggctcgtctt cttccctttc ttctccaatc accttagctt 420 gctgatcagg taaactagat tggtgtttcg tgttgttttc ttctcaactt aggtgtttga 480 tttgagaagt ttttctatgt atgttggcat gttgcgttcg tagcattgca tatcaacgga 540 taggtttgaa taggtagaat taatttgatt gatatatgaa agaatgtttg tatatatact 600 ctaggtctag gttattgaat attgagaaat ttattttgtt aggtttagat gaattattct 660 tcgatgagtg gttcaaagtt caattggcaa gtcttttcaa tgattgtagt attttggtga 720 tgataagtaa gttgttaatg actctcaagt ctgaattcat gttttggttt tgtttccttg 780 taaaaatgtg aacgtttttc ttacagaagc tttcacaaac aaagtatggt taattgagtg 840 actaatccac taattctctt ttgttgtttt atatcgttta ttaggtaatg tttttttttt 900 ttgggtgtgt aaaatatgat actgactcaa gattttatca tatttctgaa tccataagct 960 aaagtacatt tgagagaagc aagagagata gaatggggcg tggagttagt gcaggtggag 1020 gacaaagttc tttgggatat ctttttggga gcggagaggc tccaaagcta gcagccgtta 1080 acaaaactcc agctgaaact gagtcttctg ctcatgctcc acctactcaa gctgctgctg 1140 caaacgctgt tgatagcatc aaacaagttc ctgctggtct caatagcaac tctgcaaaca 1200 attacatgcg tgcagaagga caaaacacag gcaatttcat cacggtatgt ctttaattct 1260 ttcgctgaat cgagtcctgt gtgctggtta tcggatagca aaaacatctg tatctttact 1320 tttcttagat tagttgtctg aaaatgaaag aagatc 1356 <210> 90 <211> 1452 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A6 <400> 90 gatcgactgg tacaatgcta gaagccctag aggttgtagg tgatagccac gatacatcct 60 taggtgatgt aagtcaactg aatataaatg gccatttacg tagacttcat gtcctagatg 120 atccctccta ttataacgtg aatctcggtt tcttggtgtg gaaaacgaaa tgattgatat 180 gtttttgtca gggatttgag gtggtgaaca gtcgttatat gactagttat gatgatgaag 240 atacaccgcc aggaagtgga ttcaggacaa aactaagaga gttccataag aggtaaatga 300 cgcattaact catgcctctc aacattttgt cggcattcaa acagatgcat tcaagtctct 360 tttaataaac acaagaatcc catttgttta ttgttttgtt tgtatgcagt gcggcatcat 420 tcacagaact agataggaat tacctaacac cgttcttcac aagtaacaac ggagattatg 480 atgatgaggg taacatggag caacaccatg gtaacaacat aattctctga tctcttgttt 540 cactattatt tttgttgtta ttccgcaccc aaaaccatga aatttacaat tggggttatt 600 gcagaagaac gaatcccatt tactagaaga ggaaatctaa ataaccgcgg ctaagtttcc 660 gagatgagaa atctaatagt gttttttcag cggcatatat atgtacataa aacaaactgg 720 atgtatggga ggaggtagtg acaaaggatt tgttctaagc taggtttctc tataatatgg 780 tactgtgttg ttggtgtaaa cctgaatgga tattgttagg ttgaaactaa ttacattcac 840 acaaagaaag aaaaaaactt gaagaaggcc atggctggtt tatactgaac cacgaatttt 900 gttagtttta aactcttagg gaaaatgcta taatgccttt tttgtcttgt agtcgtgttt 960 ggtttgaatt aaaaaaaaaa tagagaacgt cacggcacgc caaaagtgtg gaccttgttt 1020 attcgccgga agtaagtaac caaaaacgct tctaatcttt cgtttacaac aaatatctct 1080 ctctctctcg ctctctctcg ctctctcttt cttcttcttc atcttctttc atggctgtta 1140 ctggctgggc aatcacaatc tgaattcttt cttcctcctt gtctctctga ttttcgccga 1200 gttttggggg ctcttgttgt tacacgatga gtctggtggt tggtcagtct ctgggtttaa 1260 ctctagtcgg tgatggtctt tcgttacgca attccaaaat aaatgtcgga aaatcaaagt 1320 ttttctcggt aaatcggagg agattggcgc gtgcggccct ggtacaagct aggcctaagg 1380 aagacggagc ggcggcaagt ccttccccat cgtcgagacc ggcgtcagtt gtgcagtacc 1440 gacgagctga tc 1452 <210> 91 <211> 1085 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A7 <400> 91 gatctatctt atattgttag ttcatgtttg tttttaaaga ctgtttttat gtttcaatgg 60 tatattactg actggggcag taatattgtt gaagtctgta gattatggtc gcatggctga 120 aatactggtg cagagggctg cttctcctga tgaattcact cgattaacag ccatcacgtg 180 ggtaagcaga ataaaccatg cttctgcttg gcgtcttcca gttatataga ttggtactat 240 tttgacttct cgggagattc atatactaag aatatctgct ttttattaaa tgttgtagat 300 aaacgagttc gtaaaacttg ggggagacca gctcgtgcgt tattatgctg acattcttgg 360 ggctatcttg ccttgcatat ctgacaaaga agagaaaatc agggtggtaa gtttgcttct 420 cctcctcagt gatggaaact gtaggttttg tatgcatctt tttactttct ttgttttttg 480 atttttattt gcataaggtt gctcgtgaaa ccaatgaaga acttcgttca atccatgttg 540 aaccctcaga tggttttgat gttggcgcaa ttctctctgt tgcaaggagg ttagtttttc 600 tctattgttg tttttatatc cgtttgaata ttattaaatc gcgcctgttt atttgtgagt 660 ttttgcattg agcaggcagc tatcaagtga gtttgaggct actcggattg aagcattgaa 720 ttggatatca acacttttaa acaagcatcg tactgaggtg aagaaactgg tttttgcttg 780 ggcatcattc ttttctagtt agcctttttg tttatcgcgt tatagctaaa ttggtaatgc 840 tgcaacaggt cttgtgcttc ctgaatgaca tatttgacac ccttctaaaa gcactatctg 900 attcttctga tgacgtaagt tctatctccc tgactgttcg tttgattggt tggtgaactt 960 tataatataa aggtttggtt ttgtctagta ataaacttat ttgatatttg aactatctgg 1020 acttggaaat atactttagg tggtgctctt ggttctggag gttcatgctg gtgtagcaaa 1080 agatc 1085 <210> 92 <211> 696 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A8 <400> 92 gatcatcttt ttctaggtag ggaattgctt atctcggtaa gctaagaatg ttagaaacaa 60 agaactagga cagaacggga aatggagaag gaggttagaa tcaaagaaca gtaaatggag 120 aaggaggtta atgtgtattt cattctatct acattttaac taattgagtg tatccagtct 180 tatccattaa tgtaattaca agaagaatag taccaagcat gtaggttata gttttcactt 240 tactgggtga aggtttctgt agttcaagtg ggtcaaaagt ggtttgcgga aacatatctc 300 taataatttg attgagaggc tcctcgcact cacatggact taaacttttg tgtattatac 360 aaacatgatt cacatacaca tctcgtgtat attgcaatac atttggtaaa ttatctgaaa 420 ataataatga aggtttcttc aaaagaggtc caggagctat ttccattaac actgttatac 480 tgaacagtat acaaaagaag actgcagtgc gagaatttat ggaggatgat aatgcatttg 540 agatattctt ctgaacactt tcatatcttt tatgtaaaac atttttgatg agaaaatcac 600 cagtagtatc caaacacttt aatccagatg atgggaaaat gctttgttta aacctactac 660 gaagtatgct taatacttca ttattaccag ttgatc 696 <210> 93 <211> 925 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A9 <400> 93 gatctggttt cggtaattgt tgtttccggg aattgagtat agaaacacaa atacatattt 60 aaccctgatg aaagagggtg taaacttgtg cagatagatg cgaaaacaac gcacgacaaa 120 cttgtgaagt tggtgctcga tgataaagtt agacgaaatg ttgtatctct tattgttttg 180 cgacaaattt acatgtcacg gctgagttat atgcttaagg gaagatgaaa agttcagtca 240 atttacatgt caccactgag ttatacgttc caggaaagac gaaaggttcg atagaattac 300 attacggttg agttatatgc ttaagggaga acgaaacgtt cagtcaattt acatgtcacg 360 gctgagttat atgttccagg gaagacgaaa ggttcggtaa aattacatta cggatgagtt 420 atatgtttaa gggaagacat ctataaattt acatgtcacg gctgagttat atgttcaagg 480 gcaaacgaaa gatgagtgta aattatatgt tacggctgag ttatatgctt caaggaagac 540 gaaaggttcg gtaaattaca tgtcacggct gagttatcat tcagggaaga cgaaaggttg 600 tgtaaattat atgttacggc tgaggtacat cacgttaagg ctgagttata atacagatcg 660 gaaaacaaca tttttctggg gaagacaata tgaaatttat tggccaaaga acaacaatca 720 aattaagaaa cgtaagaata tgtttgaggg atacatagga ggaagacgaa actatatgaa 780 tcaaaacatt gatagaagta gaaatatctc taaatagatc gattgagagg aaaactaaac 840 gagagacata taaaatcaaa gtaaaagagt agttattctt gattcaactc aaacctgtaa 900 caaatcatat aaaattctat agatc 925 <210> 94 <211> 1753 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A10 <400> 94 gatctgaatg agatgtgttg gcgaacgcat atagtttttg tttcttgctg ttcataactt 60 tgcttatgga attttattta tgtctttctc tatacctctt tggaccagtg ttccatttgc 120 aatagagagt cactcgtgaa aaaaacaaat aatgtgtgtg tatcaattat tccctctcgg 180 ccttatattt tgtcttcttt ttgctaatta tatactattg atttagatat ttacttatat 240 tcatgacgtc ttcttcttat attcttattt aatttgaagt tagaaaatta acgttacaac 300 ttacaactat taaattattg ttaattggtt ttataataag tatcgctctt gtctccattc 360 acttgtcttt tattgtcccc agtaccaaac taccaaatac aattcatatt cactaattaa 420 ttagtttgat gcaaaggatg atgcaatgtt aagaaaattg aaactctacc acattctaaa 480 atgaagcaac tctaccatat ttaatttctt tagacttgga atagtcacaa tatgaatgct 540 taggtagtta cggttagtta ggagtatcac acagaattga aaataccaaa ccacaatttt 600 aatcaggtga ttcggtacta atttttatta atgaataaaa acataaccga accaactcaa 660 agcagatatt aacctgaaaa tgaactcacc aaaacaataa tagaaagact caaatcgagc 720 cggaaaccag attgagcaac gaactcatgg gaatatcata tctatttatg tccagactat 780 taatatacat acctatgaca aaatactatg catgcaatgc aagactgaag taaccatatt 840 tttttgggta aaccattgat aagctaaact tgaatatcca tagtacttca tcgtactatg 900 tatcaatagt atagtaagtt tgacacaatt acattcagtt tgatttttat catataaacc 960 tcccaacaat atttaaaacc gtatctatat ataaatttat ttgattaaat cagcctagaa 1020 gtttatagtt cagtgcagat aaattcaaat tttgatatat atcttaattg aattaaccgt 1080 cttttggtta aattattgtt acaagcttac aaaatccact atacaccaag ttggacttag 1140 atatcatata tgagattaac agccgattac acttgtacat tgacctgacc tatacaaacg 1200 actacaactt tatgtatata tatttctcta tttttggaaa ctcgtttgat ttgttttcac 1260 atgtcgtgaa atttacagct ttgtttccta ctctcaaaaa tagagcatag agctggctga 1320 tcacacttca aattaaaacc aacaacgtat ataaactata acccatgtga acacaaaaat 1380 ttagaccttt tttcaaaacc attccaattt ctaacaaaaa caaaattaga aatcctaaaa 1440 tctgcaaggt gtatggaagg caaaaaaggc taacaggatt aaaaacagtt tacattagtt 1500 attctcttta aaatagaaag aagattttcg ataaaaacgt cgtcgtatct tcgtcgacgt 1560 ctccgtcttt aatgggggag caaagggcaa gcggtgcttc ctcctccacc gactcatatt 1620 caactccttc gccgtctgcg tcaccgtctc catctccggc tccacgtcaa catgtcacgt 1680 tactcgaacc atctcatcaa cacaagaaga aaagcaaaaa agtcttccga gtttttcgtt 1740 cggttttccg atc 1753 <210> 95 <211> 1908 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A11 <400> 95 gatctcactc aagctcatgc tcacgttcaa ggactttcca accgcaaggt tatcttcaac 60 ttgtactcat taaggcctct caatattcat gtgttatgtt catgtagatg tccggtccag 120 ttcaacaact gtttcattgc tttagttgtc acgagaaata tttgtatata ttattatggt 180 gtgcaaaaca tagtaaaatg ttgttcaatt ggcagatgat gatgatgaaa atggaaagtg 240 aatgggttgg agcaaatgga gaagcagaga aggcaaagac gaagggttta ggactacatg 300 aagagttaag gactgttcct tcgggacctg acccgttgca ccatcatgtg aacccaccaa 360 gacagccaag aaacaacttt cagctccctt gacctaatct cttgttgctt taaattattt 420 catattgtaa attactttct gctttatcgg ttttaccatt tcgggagtct tttttgtgtg 480 caatctgttt cgtttggtaa gcttgtagtt tcatgaaagt gaatgtaaga tatgcattac 540 gtttgttgct gaagtgaatg taagatacgc actattatat ctcatgattt tctaagaaaa 600 ccctcttaaa acgaagatgt ctatagcatt acgtttctat ttccatataa tacgttaaaa 660 tttatggttt ttacgtataa aatgcaaaat aaagacacaa gtatatctcc aaagcaatgt 720 accgttggga aaatttatta gtacgttttc aattgtcaat gcaaataatt aatggatgtg 780 atagtcacaa ttaaacatac aataataaaa atgatgatga tgattcgatg atgtggtggg 840 aaggataaat taaaccgact ttggggcagt gacaggcagt gtcagtgtca aagacaacca 900 tttgtagtca ctatttctat cgaaggttgc aaattgaatg gtggaggagt atcaaaacga 960 cacacatact tgaaaagata ttttaataat ataaaaaaat tggtgatggc gtaataacaa 1020 acctagagct aattattatc cttaatgata ccaaatctat atgatacgat atttgtttta 1080 aaaagagtaa agactgacac ttgagatgtg acactggcga tttcgctcac gtcaccactt 1140 ttcccacctc aaataacgct tacggcttta tccattaatt ctaagtataa ttttaagtgt 1200 attttttctt gccaaattca aatatatctt actaaatgga tgaacattat aaaattgtta 1260 tcaaaaccat taaatgttct tataatttct ttcgttcctc caatgtcatc ccaagacttt 1320 ttgacctaat atatgatata tctaacttgc tttggaatcg tatgacatat atcttcaaat 1380 acatatttcg tatttttttt tcacgaaaac taatttagaa agtagaaaac cagctatttt 1440 aaagaaaata aagtgtgttt atatatattc taaaacaatg ctataagaac ataagaccaa 1500 gatatataca atgttatttt atatttatta ttaagcatta acattgaaat taaaaatatt 1560 aaacatgtat accaaagtaa tcaacattgt agttattact actctctctg ttcatttttg 1620 tttgattgtt tagaaaaaac acacatatta agaaaacata ttaaatattg attataaatg 1680 tattattttt aatgttttac agttttctat aactttaaac caatgataat taactatttt 1740 tttaaaaaat taccattcac ctatactaac caataaagat tacatagaaa actaaaaaaa 1800 ttaatctttt aaaaacaaat tttttttcta aacaatcaaa caaaaaggaa cagaggggga 1860 atattatttt aatttaattt agattaccat tgtagttagt aattgatc 1908 <210> 96 <211> 1403 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A12 <400> 96 gatctattgc tgtttatggc aggctgtcat ttcagaaaag aatggtggtt tgggatgtaa 60 tgttggtgaa gatggtggtc ttgctccaga tatctcgagg tacatatatt tttcctctct 120 gatgctaatc tgcttgcatc tgtagattgt cgaaactgag aaaaccatgt tatggtttga 180 tggcttagtg cctaatatgt gtaattgcaa ctgtatgcag cctcaaggaa ggtttggagc 240 ttgtaaaaga agctatcaac cgaacagggt acaatgataa gataaagata gccattgata 300 ttgccgccac taatttttgt ttaggtaatt ttctgcttcc tggctaactg attttttgcg 360 gcttcttgta gtcatggata gtcttggttt ggttctcggc attgtcattc acaattggct 420 agtgagacga ataagatgtt aaatcatcaa atgtgtagcc tatcaatatc ttgctcttgc 480 aagtttcaac tatgttatac gtttttgtgt attatttctt accttgtgga actgttcttt 540 cctgaacagg taccaagtat gatttagata tcaagtctcc aaataaatct gggcaaaatt 600 tcaagtcagc ggaagatatg atagatatgt acaaagaaat ttgtaatggt atgtctggct 660 cgtctgaaca atattttttg tgtctatctt agtactcttg cagtattgta acgaccagat 720 tctctgtttg gtctccttgt gggtttagat tatccaattg tgtctataga agaccctttt 780 gacaaggagg actgggaaca caccaagtat ttttcgagtc ttggaatatg tcaggtccaa 840 ctcggttccc ctactattaa cggttcacat agattttgtg ttctttcaga tcacactgtc 900 ttctgattct tttctcagag tcaaatatct aaagagagag acccttaaat cttcttgtac 960 aatcattttc cttgtctaaa ttctcagtgt taaactcttg taggtggtag gtgacgattt 1020 gttgatgtca aattcaaaac gagttgagcg tgccatacag gagtcttctt gtaatgctct 1080 tcttctcaag gtatttcgtc cgtcctattt tgtttattac tatgtattac ctgtgcacat 1140 attgtatgtt tactgcctaa gaacgacaaa gacataatgt gcatacggtg atacaggtga 1200 atcagattgg tacagtaaca gaagccattg aagtagtgaa aatggcaagg gatgcccagt 1260 ggggtgtggt gacatctcat agatgtggag aaacagagga ctctttcatc tctgacttat 1320 ctgtgggtct cgcaacaggt gtgattaaag ctggtgctcc ttgcagagga gaacgtacta 1380 tgaagtataa ccaggtctgg atc 1403 <210> 97 <211> 1140 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A13 <400> 97 gatccatttc atatacatat taccaatttt ggcttttata ggtttgtatc cagaaggcct 60 tttcgtggct acgattaagg aaaatacgaa aacaaaagtg aattttacta cttttgtagc 120 atggtttatt ctactttata tacctaagaa atatgagcaa caattacttc tgtaatgact 180 ttttactact tcgtagttgg tacaaactac aaaagattgt gttgttttta catgatactt 240 tataatatct atattaatat atttagtcgt gtttaatcaa aaaagcacca gtggtctagt 300 ggtagaatag taccctgcca cggtacagac ccgggttcga ttcccggctg gtgcattgag 360 ctatgatgat ataggcttca gcattggttg ggtccattgc attcttctga actatcagtt 420 gatgtatgcc acacctctga gctcttcttt ttttttcctc gtcaattaat tttttaaagt 480 tttgtctgcc taaaaacttt cttctttttg attaatcata ttaagcatct cggctataaa 540 aaccacggtc tactaactta acatgcattg gactagtttt agtggagagt gttcgagtta 600 aaatgagaag ctcacgattg cataacggaa catttgattc gctaggcatc tccatttgta 660 aaagtagcca ctccaataca aaatggtcga tgatggtgag tgggtgagac aaacccacca 720 ccacctcaag aagatatatt tctctggtta agaatttgaa tggttgacaa agaaacggtc 780 actctatata cttagaaaat atagtcatac atagacacca tcggtctagt tataataata 840 accactggat taatgcccag tgaaaataat tgagtagcca aaacatgaat ataacaatat 900 cccaatttac atacaacaac acaaaggagg ttttacacga ttctatagta caaactcata 960 acaacaaaaa atcacacttt tgtttaacag ttgcctttat ggctttacta cagtatcttg 1020 tccagggttt tcacacataa caatcacagt aaatcgtttc cttttctttg catcttccat 1080 tccttttgta cacgtaacat ctccggcttc ccgaccatca gctaagaacc agatgcgatc 1140 <210> 98 <211> 2125 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A14 <400> 98 gatccagcaa ctaagtctta tgctcaagtg tttgctcccc accatggatg ggctatacgg 60 aaagctgttt ctcttgggat gtatgctctt cccacaaggg ctcacctact taatatgctc 120 aaagaggatg gtgagttcat caactagtta atatgctcaa agtggatggt gtgtttgata 180 aactagtagt ttaagtagtc agattagttt caaggtcttc acaggattag gtagatatca 240 cggcaatatt tggcctgtat aagtcctggt atcataagag agaactcttt gagattcaca 300 ttggttttaa gttcatttgg cagtaggata ttagattttg aattttccaa tactatctct 360 gtttgagatt tcataaatcg agtttcttct tcattatgtt cgctgacgat attgtttttt 420 tcatttattt atgaatgttg ttacagaggc ggcggctaag atacatatgc aaagctatgt 480 caattcatcg gcaccattaa tcacgtatct tgataatcta ttcctctcca agcaactcgg 540 tattgattgg tgaagagcct gaaaaaaagg cataactatt gttactcttt agacaaaata 600 acctatgttc tcacatcaag ctatgtaatg tcataacaac agcgacgaaa tacattggaa 660 taaattgagt atgtccttaa tctgtcgttt tatctcttct tttaataaac acagtttatc 720 tcatagtaag cagaagaagc tttacacggg ttgtaggaac gtattaaacg gtttgtttca 780 atttcactct ctttggtttt gaaattctag tataaaccaa agtagttggt gcttcaagtt 840 gtgttactta ttcaacaaaa aaatatatta tttttaattt ttaattttcg taggtaagat 900 tacatagtaa caaaatgtta aatttaacaa tgtaagatta ctatgtaaat gcatgggcac 960 cagtaatcac gtatcttgat gatatatatc cctaatccaa gcgagtcggc atttattggt 1020 gaagaatctc aagactcata gtcatcgcta gttaacaatc tttttcggac aaaagcgtct 1080 tcgttaaaat tcggcattat taaccttttt gcccttttaa aatcagaaaa tttctgtttt 1140 actggtattt ttctttgacg attcaatttt ttagttgtat tatatatatg aaagaagctt 1200 aactctctct cacagcttga tatgtcagta tctaaaacaa gcaatacata atttaattaa 1260 tttatcataa aatatttatg attaaaaagt aaagaagata aatattaaaa agctaaatgt 1320 ctcttataat ttaaaaataa aaattaaaaa ggattgaaaa gtaaagaaga taaatataaa 1380 gaaactatta gtatcttata aataaataaa taaactaaaa attgaaatat aattatttta 1440 gttttgaatt aagaaaatat taaatataaa aaaaattaaa cataaagaaa ctatatatat 1500 cttgtaatta aaaaattaaa aaaaaatgaa aaatgagaaa aaaaatataa actcttcatc 1560 atataattaa tgaaatttaa aaacttattg cttttaattt tttgtacaat aattaaggaa 1620 atttagaaat taattattaa ttttagaaga aaaatgttaa aatagtttaa tagttttgat 1680 tcactaaata catgtgtaca tatatgatgg tatgaggatc aagaaagtgc cgtaaaatgt 1740 aaaacttcca atgttcctta gtgaaaaatg ttaacttttc tgttgacaag acgtgtatat 1800 aaacatcacc tataccggag aagaagaaga cacaaaacaa agttaaaaag aagaaatttt 1860 tggtgcagtg aattcgaaga gcaatatgaa gaatattggt tacattatta tagccacctt 1920 gcttgttggt ctcctcctca tcatggctct agtggcgagt ttctattggg ccaaacgaca 1980 tgtcaaatgt tgtggcggag agggactgtc gtcaaaggat gtgttcaatt tacttataca 2040 attggttgct tttattctgc tttgtggttt atttgcttat ttggtatttt tggtttagat 2100 tagtaaccta aagccatagc agatc 2125 <210> 99 <211> 1196 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A15 <400> 99 gatcagcaat tacagttgga tggaaaaaga gagacgagaa tgtatctgct gctggtgact 60 ttaaggtagg ctgagtacca aattgcattc tgactgttct tacctcgacc acctttctta 120 ctttccctag ctctaatctt gctattacta gattgaatct ggtggactcg gagcatcagc 180 tcgttatact cgtaaacttt catccaaatc tcatggtcgc attgtgggta gaatcggaag 240 gtatgtttta ttgacaatcc cgagcaacct aatgtatgat gtgcgagagg atagaaatca 300 ttttttaagt tgtctttaca tgtgtggcgc aatcattgtt ctcattttac tttggaattt 360 tttttttaac ttattcagca atgctcttga gattgagctc ggtggtggaa ggcaaatttc 420 tgagttcagt acagtaagaa tgatgtatac agtaggactc aaggtaaact actctttaaa 480 actttcggag ccatcttagc cattatgcaa tctgcttatt tccggtactc ttatactttg 540 tttgtagggt attttctgga aagtagagct acaccgtggt agccaaaagc tgattgttcc 600 cgtgagtgtt actttcttcc tttcttttct tgtggtgtca tgtctgctgt cttcggataa 660 gaaccgaaca gattgtgtct taatctgtgg agtagaatat attaaaaaag cataaaccaa 720 tagaaccaaa gaccaatcct aaaagcctag ggatggattc tagagcatta tccttgactc 780 tctgaaacct ttacccaact caattatgga caaagacaaa catccgtatt actctgggga 840 agtctttcac ttttgacacc ttcatgatga ttatctttga aacgtgcaga ttctactctc 900 cgcacattta gctccagtat ttgcaactgg agcattcatt gttccaacat ctctttactt 960 tttgttaaag gtgagtgatt ggaccctcta aatataatct acttttggtc tattgttata 1020 agctgtttac cttattaaac attttcactg ttccacgcag aaatttgtgg tgaagccata 1080 tttgcttaaa agagaaaaac aaaaggcctt ggagaatatg gagaaaactt ggggccaggt 1140 gattgttact tccgagtttg gtagccaagc gagattcctt gtaattgtag atgatc 1196 <210> 100 <211> 692 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A16 <400> 100 gatcgctttc agtctatcat gttttgagcc ttattttggg agcgatgtat taatattttg 60 cctgttcttt attttttgtg ttgcagacat acaatgaagt gcagcggtgt tttctgactg 120 ttggcttggt ttaccctgag gatttgttta catttcttct taacgtaagg acatcttttg 180 ttttatgatt atggctctag ttattctttg tatatgtaac gcaaaacggt ggcaatacct 240 agcactcata ttagactcaa gaactattcc ttgccacaca tctgtgtgat atttatatgg 300 gctttttatc ttacatattt gaaatccctg tcttccttgt atactttcac cagaaatgca 360 agttgaaaga agaccctttg acgtttggtg ctctttgcat cttgaaacat ctgcttccga 420 ggtgtattct tttatccttc atcagtataa cttatcattc agagttaatt taccatccta 480 acttaatgat gttgcattgt gttcgaaggt tgtttgaagc atggcactca aaacggcctc 540 ttttggtgga tactgcaagt tctttgttag atgagcaaag tttagctgtt cgaaaagccc 600 tttcagaggt actgagctgg cgtagatttt cttatttact actaaaatat gcatgcttta 660 gcatagtgct tctactttaa tgacagttga tc 692 <210> 101 <211> 1826 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A17 <400> 101 gatcacgata attttcctta attatctaat tctaagatag tctaaccatg aatattctta 60 taatatctta actgtatagg agattctatt ttcatcccta aattatattc gtaattttat 120 tcggatatac ttgcttttat tttcgtcaac agatatatat atatatatat atatatatta 180 tttattttta attttcatta aaattagtga tttaattctc tattatttgt gtactatata 240 aaacaaacaa atgaatctta taatgtttgc tttttcgtcc ataaatattt ccgggaaaaa 300 tcgttagata taaatcgaac ctagtggtga gtgactcaca cacatgtgac aattcccaaa 360 ataagtcccc cacgtacgct atgtctgttt tagtgtgcat gtagtaacta ttatttactg 420 atttagaata taactagcat ttggccccta tttagggata acattgtttt agattatatc 480 tgttacaact tttaactaaa aattttaaaa taaagcagac agtattaata tacaacaaat 540 ttattatcat tgatcgaaga atatacaaag attaagaaaa agatataaag aaggtacaac 600 ttttctaccc aatgaatcaa ttgcgatagg caataactaa caaatcaaga gtttagaaat 660 ataagagagt ataagtacga aaattatgct gggtatatac atgtccgctt atttcatcat 720 tagctccaac caattgtaat gtgttcttct tctcatcatc agtaattcag tttacaaaca 780 ttcgttgaca cccaaagctt ggaagtctaa aaaaaaatgt aaaatgtgca caaataagta 840 actacatgac gcagacgctg cctttgaaac aatatcaaag atattgcaga tataaagaag 900 taaaataaga gatgacttta aaattgaagt atttgtatta atacaaaaat cttgcgtgaa 960 aatacaattg cagtttaata caaaaaagaa attgcagata taaagaagta aaataagaga 1020 tgaaagaaga atagtaaaaa gtatgagaat taatttacca tcaaaaaaac acttgagctt 1080 cgattaagat attaaactca cccttgtttt aaggcaactg ttcagatgag aagccaaaat 1140 ttgtcgttgt tccttgagtg tttgtgagac gggagaatca taggcattga ttgtattaaa 1200 gaataatcct atggaaaaat ggagatgtat gagagaaatc gaattcagtc aaataaagca 1260 gaaacaaagc aaaaaaaaaa aaaaaccata gaaatctaga agaaggatat atgattttcg 1320 gatctatgga aaatttctat atatataaaa caaaattaca aacagaaata gaagatggta 1380 aattggttca ttgagatgaa caaagtacct gatttctgag taatcgatta atgatgttga 1440 gaaacccatt tttgagattt tacacagtag tcatggagtt tttggaagag agaaagtgga 1500 gatgtggaga tcgtggggat gaaagagaaa atcatttgag aaagaaacaa agttaaataa 1560 aaacgacaca tactatgcgt aaaaatgaaa aaataaaaaa tagtactaag ctgatgtgtc 1620 aatcactgaa tgcattagtt attggaaaag tgactgctga tttagtatat ttagattaga 1680 gaaaataaat acttgtaatc atttttctta ttagcaatgt tgaagtgaaa aaaaaaagaa 1740 gaaaaaagtg tatatttatc atactcatag tgggaaattg ataattcaaa attgctgata 1800 aacgttatga aagaaggtgg aggatc 1826 <210> 102 <211> 1590 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A18 <400> 102 gatctgttga ttggttaaat cgacgatctc aacggcggag gaagtgacga tgaaggcgcg 60 gcagagagga caattagagt gagatttcaa ccaagtatca atacaaggaa cgtgaaacgc 120 gtggttgcat ttaggtaaca atctcaagct ctcgttctct tgaaactcgc ttaaacaaac 180 agagcaatct gaagattcaa caaatccatc catctttctg tatttgtaaa cagttatcga 240 tttaatcaga gattcatcga gtccatcgcc accaccacca ccaatcgttt gattcggatt 300 cgtagctccg ttgttgttgt tgttgttggt tccttgccag gtgtaatctg atgagattct 360 gtttatagct gcggcggagg tagaggagga gttgtggcga cggcggtggc agtatttgga 420 gatgagagtg tagtagctga cgaggatgaa ggcgctagcg aggattccga tgagagcgat 480 gaggagagga gagaaatcag aggaggaaga gtcgtcttcg tcgtcgagat agaaggaagg 540 aggaggaggg aagatgacgt aacaccattg agggcaatag acactgcata ctccttgaga 600 acagtctctg tatgaatcgt atgttgtacc ccatggatta gggtttcctg ttgaacccat 660 tatttgattg ttggagaaag atagagagag agagcaagga agaagatgga ggtgtcaagt 720 gtctctctcc tttttctttg ggctctgctt ttgtctggta agtgtctatt tttttatttc 780 gagttaattg gtattattag aggagataat gaataaatat atatgttcat gaaagctttt 840 gcatgatggt gttaatacta attgaatgat gtttatagtg aatgttctac tttatcaaat 900 ttttatttct agtatgaata aaggtgtaga atttgcttta ttcattttta ttctttagct 960 ttctctttat gcttccattt tttttaaaga taaattaata cattagtaaa ataaatggag 1020 ttcatttttt ttttttttga ttttattttg agaaatgaga acgtaacata agaagtgttt 1080 tagtgttgac gaaataaaaa gagagagagg gtttagtcta tttcaaggca taaaaaaatg 1140 gttggtgaag tgttgacgaa ggtggaatac tataacatgg gccacgtgga tgacaaattt 1200 actcctcgac gtatctatta aagttgtggt cagaaataca gtacaattta ccgactacct 1260 acatggaaga agaatatttt catttcattt caactacagt agtataacat tcacgttata 1320 cgatttttca tttttgtttt gtaatcaaag taatgatttt ccaaaaaaat cattgctatg 1380 attcgaatac atacagtttt atattagttt acatatttat gacaactata atacaaaatt 1440 ttaatagttg ttcaagggac gattgatgtg aactcgccaa ccatatgccc tacgtacaaa 1500 ataacatatt tacatgtaga agttgaaaat aataataata aagtgtgatt aaaaacaatt 1560 atacaaatgc taacaatagg ctacgagatc 1590 <210> 103 <211> 706 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A19 <400> 103 gatcttgatg tgtgttttgt gtttttgtta ttgcaggatg tatgtttcat agtgagacag 60 ggcttaagag ctttgaccat ccgactaata tgatgaaggc aatgccgagg attgatagtg 120 aaggtgttct ttgtggagct agtttcaaag ttgatgcttg ttctaagatc aatagtatcc 180 ctagaagagg aagtgaagct aactgggcgc tggctaattc tcgttgattt tgcttctagt 240 ttcgttaact cttgcttctt tgttgcgttt tctttttatg tactcttgtt tatgtaaata 300 tagccttatg aagacgataa agaaataaaa ttgatttgct tcttcgtgac atagcagtct 360 ttacttagac aactgtgtga taaattcgca atctcactct ttgatagata agagggaggg 420 aagaaagcag tggtaaagac aaaactgtgt tgattttgtg aatttagaag tttacaatag 480 caaaaaagaa actttggtcg acttttatca ttcatcgttc cacatgtctg taaattcatc 540 aggctccaat gggtttgaga gttcatgcat ctttcttctt gtttttgcct ttattttctt 600 agcaaatttc ccagctttat ttcttttctc caaagctcga atctaaaagg caggaaattg 660 gaatatatga gaactctgac agataatcat atatagcaat gtgatc 706 <210> 104 <211> 2064 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A20 <400> 104 atcgtttcaa agcatggtct aatgatgatc ctgatctccg actgatccaa taacggttaa 60 gcaacgctgt ttttgatcct ccattgttgt ttgccatcga tcaacactca gaaataaggt 120 aattaacgca tctcgagact cattgtttta acaatctttg ttttgtttct tccaaattat 180 tctcgtgaat atccgtaatc tctccgtctt ttaatgaaca acacatatca tatgcttttg 240 tttgttttgt tttgtttttt caacatttca ataattttgt ctttttttct tcgatttaat 300 ttgtttattt cctgctataa taaacgaaaa ctataattcc atgtaatgtt cgttgttgtt 360 catagtgatt tatcataacg agcaacaaca taaaaatcaa gagaataaga aattagagtt 420 atgctgctta tttgaattag acaaaaccta cttttacttg ttaaggaaat gaaaagatgt 480 taataaagat gagcacatcg tacgtggcgc acgtggaagc acttctgtac gacggaccca 540 gtccaactcg aaccccacac acatagcaaa ggttgttaag ttggctcgta ggtgaattta 600 atacctgtta tttcctttat agctggctaa ttacctaaat tcgatccata ataacacatt 660 cctactatgc caacatttaa ccctagtcaa actaattaaa acgtttctta ctttttggcc 720 tattaaaacg tttcattatg ttccgcaaat agtatgaaat atataaagat tttctaacaa 780 aaaattacta agaacagtta gactgattga gattgttttt atttcctttt atttaatttt 840 cttttattat actctgttta tttgtgttta ataattagga ttctatttgt cttgtcttgt 900 ttgctatagt tggagttttg ttcataaaga atggcgttta atacggctat ggcgtctaca 960 tctccagcgg cggcaaatga cgttttaaga gaacatattg gcctccgtag atcgttgtcc 1020 ggtcaagatc tcgtcttaaa aggcggtggt atacggagat cgagttccga caatcacttg 1080 tgttgtcgct ccggtaataa taataatcgc attcttgctg tgtctgttcg tccggggatg 1140 aaaacgagtc gatctgtggg agtgttctcg tttcagatat cgagttctat aatcccaagt 1200 ccgataaaaa cgttgctatt tgaaacggac acgtctcaag acgagcaaga gagcgatgag 1260 attgagattg agacagagcc aaatctagat ggagccaaga aggcaaattg ggtcgagagg 1320 ctgcttgaga taaggagaca gtggaagaga gagcaaaaaa cagagagtgg aaacagtgac 1380 gttgcagagg aaagtgttga cgttacgtgt ggttgtgaag aagaagaagg ttgcattgcg 1440 aattacggat ctgtaaatgg tgattgggga cgagaatcgt tctctagatt gcttgtgaag 1500 gtttcttggt ctgaggctaa aaagctttct cagttagctt atttgtgtaa cttggcttac 1560 acgatacctg agatcaaggg tgaggatttg agaagaaact atgggttaaa gtttgtgaca 1620 tcttcattgg aaaagaaagc taaagcagcg atacttagag agaaactaga gcaagatcca 1680 acacatgtcc ctgttattac atccccggat ttagaatccg agaagcagtc tcaacgatca 1740 gcttcatctt ctgcttctgc ttacaagatt gctgcttcag ctgcgtctta cattcactct 1800 tgcaaagagt atgatctttc agaaccaatt tataaatcag ctgctgctgc tcaggctgca 1860 gcgtctacca tgaccgcggt ggttgctgcg ggtgaggagg agaagctaga agcggcaagg 1920 gagttacagt cgctacaatc atctccttgt gagtggtttg tttgtgatga tccaaacaca 1980 tacactaggt gctttgtgat tcaggtaata tgtgttcaaa gttactactt tcaagcaaat 2040 cctctgtttc ctcacatcat gatc 2064 <210> 105 <211> 1834 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A21 <400> 105 gatcttcttc tatatatacc ggtataagtc aactggcggc tgaacaaagg tcgtgaggta 60 acaaaatatg agacaaatct acaggtcaga ttgggttctg aattctgata aggtcttaaa 120 aaggagctca ccaacccaca aaaccatgga ttgaacaagt acaggtcatt gccttcattt 180 tattctttac ttttctaagg ctcaagcttc ctttattgcc tttaataaca atatactaat 240 gagtattttg cactcagtaa caaaattcag gagagtaatt ttttgcccta acatgttact 300 tttatgtgtt aagagtttag aattttggat ctatgatttt agtttttgtt agggaatcat 360 attcatataa ataaaatatt gccattgact taattgttgt tattcaccta atttctctcc 420 aaatttggtc atttacctca gttgattcta tattatactt gctaagtgtt ctttgtctaa 480 ttctctatca ttgtttgatt taataataac caaaccttaa gacttggaag caaagaagag 540 agaaaatccc aattaatttt taataattca aagagagata ttgagtgact tccactaata 600 caaagaaagc ttggtttgtg caatattttg cggttaagct attaattgct gaggcaacac 660 cttttcacac tttgctttcc ttcttccaag ttttcaactt ttctttctta ctctttctat 720 taatcaaact gcaacacaaa aatcatttgg ataatacatg tttagaagat gattaagctt 780 tagttttatt tcaagattat cataattgtt atctgttgtt acctacattc atataatctt 840 atcaaaaacg ataaagacaa aaaggggata caatataggt ttttattata aagaaacagg 900 aaagaaagaa aagggttttc accaaacgaa attagttcaa tcatttaaat tatctttatc 960 cttatgatta gtgtctttat atctgtcata tgctgcttct ccttccaact tcctttggat 1020 tatattctct tctctttatt ttaatttcca tttgtggtag ctgttttatt ttttgtattt 1080 tcacgccgtg tccctttaaa ataatattaa ctacaccact aatgttggaa catgaaaaac 1140 atgaatgagg taattatgat gatgaaccaa atgttaagga caagctcggt gtaactaaga 1200 agataattag tgaaacagaa caagtcaata acttgtaagc atttcagaat tgaaaataaa 1260 gataagggag gatgaatatg aatttagtaa atgggtaatg aaagtgaaag aagaagaggg 1320 aagggttggt tactgtctca agggtttgaa atggagacgg ttgcttgaga atgaggaaaa 1380 agagttagta agtttttaac tctctctttc tctctccctc tctctttttc aacgtcaatt 1440 cctttaagga atggcctctc tctctctctg aaagtgtgtg tgtatatatt aaacgactcc 1500 atttctcctc tgcttagacc aaaactcatc ttctatactg caacaaagaa ggaggagccg 1560 ttgagactac aaaatgactg cagcagaaaa cccttttgta tctgacacct cttctctgca 1620 aagccagctt aaaggttctt atttttcttt ctgtttattg ttcatcaacc cttatgagta 1680 atttgcttga tgttgaggtt gttctgcttt cttttaattc cactctgcag aaaaagagaa 1740 agagcttttg gctgctaaag ctgaagttga ggctttgaga acaaatgaag agctcaaaga 1800 cagagtcttt aaggaggtaa catgcatgat gatc 1834 <210> 106 <211> 751 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A22 <400> 106 gatccattaa gaagcagccg caaaatcgga ttgagaacag gaaaagaggc ggttaaggct 60 tatgatgaag tcgttgatgg gatggttgaa aaccattgtg cccttagcta ttgttcaact 120 aaggagcact cggagactcg tggtttgcgt gggagtgaag aaacttggtt cgatttaaga 180 aagagacgaa ggagtaatga agattctatg tgtcaagaag ttgaaatgca gaagacggtt 240 actggagaag agacagtatg tgatgtgttt ggtttgtttg agtttgagga tttgggaagt 300 gattatttgg agacgttatt atcttctttt tgacagaaat acattgaaaa ctaccgttgc 360 taatttgata ggtatacata tatagacatg tatatattgt ataattatat gtcaagatta 420 tttatttatt ttacattttt cacaaaaaaa aacgttaatc tatttttctg tcacaagtgt 480 gtttttattc atactacata ctacaacgcc aatttaacat gccaaatata aaacatacat 540 gggcaaaggc ccaacagcca gtttaaagaa ctttgtctga agagaaagtt gttgtatata 600 tcacaaggga tatgtggtaa ttgggaaaca tgttgggttg acacgtggga aattgaagga 660 gatggagttt ccgtcactgg tagaatcttc taacactaga gagcttcaat tcaggttgaa 720 atcgtcagaa aactaatgca gacggtagat c 751 <210> 107 <211> 653 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A23 <400> 107 gatcaaaact tagtcaaatc gttccttcca ttttctttca gtttgattcc actttaatgg 60 cgtcataatc atctcttaaa tcaaacaatg actccactat ctcgtttccg atctcttgtt 120 acataaagtt ttctgtagca ttgagattgt ccttttcgga attgctttta tttgcgcagc 180 ttgatggaaa caacaaacag tgtagtagtt tagtagaaag actgagagat aaaacgaaga 240 gtcaagttcc taagtccatt acttgcatta accgcttaga gatatcgcgt atagcaccat 300 tacacgcaac gatgaatagc ccgaaaggat ttggacctcc tcctaagaaa accaagaagt 360 cgaaaaagcc aaaacccgga aaccaaagtg atgaagacga cgacgatgaa gacgaagatg 420 atgatgatga agaagatgaa cgtgagagag gtgtaattcc agagatagtg accaacagaa 480 tgataagcag aatgggattt acagtggggt taccactctt cattggtctt ttgttcttcc 540 cattctttta ctatctcaaa gtgggattga aagttgatgt gcctacatgg gttccgttta 600 ttgtttcgtt cgtcttcttt ggtacggctt tagctggtgt gagctatggg atc 653 <210> 108 <211> 548 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A24 <400> 108 gatcagactg aactcgtgta ctctgagcct tgcttcttgt agctctttta gctttcacat 60 tttcatcagt attcacatca ttcctgataa ttgtgccaga agtcccacga ctatcttgtt 120 gctcactaat ggttgctgct gcagatgatt ccatgttgtc ctcttgtgaa accccaatgc 180 ttcgtctagc aactgtattt cttgcacttc ctgctttgcg gtttttacat ttggatgatg 240 caactttaac tttaggtagc ttcttttgag taagatcaat ctcatctcta cctaggacct 300 gcaaatcgat gaaatttgag ttcatttcaa cacacttgat gacactatca tagaaaacaa 360 aaagaccttg ctgtaccaga gtgaagaaca gcctttacct tggccttcac aggactaggt 420 agaatctccg gagaacaagg cctctgagtc cattcaaaca tttcgctatc aaacatgtca 480 cctggattgg gcttttgttg ctcgtcttcc tgaaacattc atcggaaaaa aagtaagatc 540 aaaggatc 548 <210> 109 <211> 1000 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A25 <400> 109 gatccaaact ctgcaatgta tattacgaag tcgtttgata taacacctct cttgataaaa 60 gatgattaga acctaaagta attttaaaat atggtgaaaa attagactct tggagtatat 120 aaatggctca atctgtattg cccgcaccgc ccaaactccc atggcaaatc cattgacgaa 180 accaaggtaa aaatcacatg ctttgagcgt ttttttaaaa cagaagtgta agcttaaatt 240 ttttagttta atagtagtaa caaattcaac cttgtgaaga gatttattaa taatattaaa 300 atcattcccc taattatttg ccttgagttt cgagccttct actgtaccac tcacacatta 360 aaaatcatca gactattcaa actttcttac atggttgatt agttcatctc atatatgctc 420 agtatcatac tcttgcagat taatttttca ttttaattat caacgaattt tttatttaat 480 tattcatgac caaaatacat ttattttttt taaataaaac aaataataaa tttggaagtc 540 aaaaatacaa tcaatagaaa aaaaagtatg acagtgatag ataatatttg cagaatatta 600 tgtgaaagct attttctctg taacaataaa tgagaaaatc tttattattt tacatgaaag 660 aaaaagaaaa caaaacagag atatttttcc agctgaaaag aacaaacatc tctcattgat 720 gttcagtgaa cttgcaccaa acttcacttc ttctatactt cttcatagcc acaaactcag 780 ttctttgcaa gaaacacaaa cttaagtatt caaaatatcg tcatcatgtt ctcaagattc 840 catgctctgt ttcttctcct tgttctttca gtaagaacat ataaatgtgt atcttcatct 900 tcttcttctt cttcttcttt ctcattctct tcattttctt cttcgtcttc ttctcaaact 960 cttgtcttgc ctctaaagac ccgaataacc ccaacggatc 1000 <210> 110 <211> 1926 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A26 <400> 110 gatcctcgat tcttatctgg atacagaaga aaacaccttt ttgtctttta agtactcgga 60 gaaatctgag ggtatctttt tcttgagcag atggaggtga agtcctgagt tggggaggag 120 ggggctctgg aagacttggc cacggtcacc agtccagtct ttttggcatc ttaagaagta 180 acaggtttgt tttacttaat ttcaatatcg ttttgtctct ttctcatgca ttttttgctc 240 acaagaattt tcccatttcc tcctttactt tatcatgatt ccttcataat tttcttgtat 300 tgcactgtaa agtatccccc tgattgcagt gagtttactc caaggcttat caaggaactt 360 gaggggatca aggtaatcta gtggtgaaga atatccacct tggatgaaga gtttctagtt 420 acctagtggt ggttttaatc tttagacttt catgcttatg tttttccatt ctttctgtcg 480 agcactaggt cacaaatgtt gctgctggtc tgctgcattc agcatgcact gatggtattg 540 atttactttc ttaaaagtat gaatgttgtg ccatttaccg aactttatga ggtttgtttg 600 caaatgcaga gaatggctct gctttcatgt tcggagagaa atctataaac aagatggtaa 660 gaaaatgtct ttttctttga tttctgtggt catatatgtg aagctatctg atgggaaaat 720 acagggcttt ggaggagtaa gaaatgccac aacaccatcg attatcagtg aagtaccata 780 tgcagaagaa gttgcatgtg gtggctacca cacatgtgta gttacaagta atactctctt 840 attatatcgt tctttctttg atattgagtt tgcttgtata ctgcaaatgc ctgtcctgct 900 caaatttctt tttgttattc tttatagagg cccaaaactg ctctttagtt tctgctaaat 960 ttatgaacat attgtgtttg taagatggtc gataacaact catcgtttga tgtttccttc 1020 gtttttggaa ggaggtgggg agctttacac ctggggctca aacgaaaatg ggtgccttgg 1080 aacagagtaa gttacatacc ccgaaaaaat agaatgtttc cccataagat gaaaacaagg 1140 ttcttgaact gtacctatac tcttatttca aaaaattcag ttcaacgtat gtctcacact 1200 cccctgtgag agttgaaggt cctttcttgg agtctactgt atctcaggta tcttgtgggt 1260 ggaagcacac tgcagctatt tcaggtagca tctcttttga gtaaaacata tttgtttcct 1320 ctctcattgt ataagttaat tcaactcaat ttctgaaact tgtttgcaga taacaatgtc 1380 ttcacctggg gctggggagg atctcacggc acattctctg ttgatggaca ttcctctggt 1440 ggacaattgg tttgtttcat catcttatct tattgatcaa atctctgaaa caacattttc 1500 aagtgtcgaa gagaataaat atggtatgct taatatgtag ggccatggta gtgatgtaga 1560 ctatgcaaga ccagcaatgg tggacttggg aaagaatgta agagcagtgc atatatcttg 1620 tggcttcaat catacagcag cagttcttga acatttttga agactcggtc tcaagttaat 1680 atcatataca gatgtttagt ttattcttgc ttaaacatct atagactaaa aaaataataa 1740 gaaatttaca ctattgaata gcgatcaatt acaccattgg ttctaacttg aacaatttag 1800 taaataggtg gaatattctt gtcgtgtaaa ttattgattt tatttattta tttttgaaaa 1860 ctacaacaaa cgatagaaga gttgaggaaa tctctttgta atcataatta tgagaaaatt 1920 aagatc 1926 <210> 111 <211> 1109 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A27 <400> 111 gatcggaatc attttgggag tttgaaggaa ctaaacataa tatgcatgtc gaagtcaact 60 tattgcaaat aattttgaaa tgattctgaa ttggaaattc atgaagctta attattttat 120 ctaaataagt ttaatatagg tttgagtgag atatcgagat taaatgataa gagtctttct 180 tcgaggagac attagaattc tacacaaaaa tcgaaattaa tctagtcctt gacaatcagt 240 tttcaattaa tcaaaaacct ataaaattca actcaaaacc aatcgtatga aacttcatta 300 taccatataa tctggttact tagcttaaat ctctacccgg cgatgtttca tgcttgagag 360 actaggtaca taggacacta ggagtactgc atatatggtt acctcatgag ttctcatcgt 420 aaaatcatcc aataaaaaat ggtttcctgc ttaggtatac ggtataccat cttgtatcgt 480 taaaatttat agctcagttc gttgctaaca gtcaaatacg tctttccagg gtaaaaaatg 540 tggaaatttg ttccactgta aaaacctaat aatttttgac attaataatt aaaagggatt 600 ataatgtaat atatacaaag ataggggaga cagagacgaa ggcccacaca tctttaacaa 660 aagaacaaca agcccgtgac cccaaaataa aactagcttt cagatttatt atttttcatc 720 tgacataatt gcaaccgtta gatttcattt ctcaggtccc attctgactc agatccaacc 780 gtccatattc ctctagtgtc ttcaatagtt gggccccttt tctttttcct ctcgccgtac 840 actctccttc cagcgccaac gccaccgccc gagccacttc ttccgccggc gccaccgcga 900 tttcctcgcc ggaatcccct ccttcgccgc ctttcccgta gaccacggaa aggatgctta 960 tggcgtattc tctccctcta ccagccaatc tcgccatcac cgctaccatc gccggcaccg 1020 tcatcgcgtg agcgcgaacc tccgccgctc cttctgccgt tgtacacatt agctcaagag 1080 cagctaaggc tcgctccacc gctgagatc 1109 <210> 112 <211> 1659 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A28 <400> 112 gatcgaactt tggtaacatg cttgcttact gctttctatt gtctgcaaaa cctctgttct 60 gggtgacctt ctggcccctc tctctcgaag cttcagaact atggaggaga gattggataa 120 aggagacaaa aggtgtggtg tggcgaaatg ttagggtacc ggcaattgtg tatgtatgag 180 ttgattttgt tcttttctca taaagaggat ttaacaaagg atgagaaaac aaatccaact 240 tgagtactac gaggagataa aagcttttat tgggtattga gtattgacac gttgttgaaa 300 gtctgataca ttttagactt ttactgcata tgtccaaata tttagatttt tttttcgttt 360 ctcaaaaaag taacttgttt aacaaaaaaa aatcgttatt gggcttttcg tttcttttat 420 attgggcctt gagccttttt agcttttgta tttttagtcc ttttcgggtt tatttattta 480 ttaataagat accaaaaaca taacaaaaat gtagttttgt atttttaacc tagtctttta 540 aatatttaaa cttaattaga aaaattctat ttaaaatatt ataaaaaaaa catgattttg 600 tgattttccc atattttgtg taactatttt tgacaagctt ttgaaacaac aaagacaaaa 660 tccatgtgat aaggtcggtc aaaaatcttg cgtagtagag gagttaaaga tttttggatg 720 gttacaatgg tatactctta tttgatatcc catcaatggt atatagcttt gaatggtagg 780 acaagtgaga gtaaaatttt ctcatcattg ctaagtttta ttttaggttc tacattgttt 840 cacccttctt aagtatccta ctctcaacta gaaaaaaaaa ttgtgagggc ggttttatcg 900 gctggaatgc agctcatgta gctcccacga cggagttttc tggctaagaa actcggacac 960 aacgttggcc tccaatatct tcaaggcttc ttcattcgtc accgacctcg gtgtcttata 1020 ctgactcaca gaagagcctc tagacagaaa gaagttcatg agcttgtcga aagcgccagg 1080 cttaacaacc ttaatctcaa gtggtccaat gttcttatca ttctttcgtc cttttctgta 1140 aaccgcgtcc agagactcct caatggtgaa gcagcattcc tccaaaacat tctggtcaag 1200 ctcaagcttg gcgtccttga cttttctccc gagttcccag tagagcacgt agtgacctgg 1260 atacgaggag gaatccacac ggctagtgaa atccatgagc attaggtcat gtggctcaag 1320 caggagactc gcgttagtca ctgccttgag gaggtcttcg tcgtaggtct tgtccatgtc 1380 gatgctcaga acaactttct gtcttcccac gaaatgaaac tgtggcgcat tgttgtagaa 1440 accagtcact cttaaaacgt cccctaaacg gtacctatac aaacctgtat aaagaatttt 1500 gatacacatt aagaaaatta ttaacatgtc atttagtttt gaaattgaga gagtaaacaa 1560 gaaaaaacac ttaccagcaa acgttgtgac aacaggttca taatcatgac cgattttaac 1620 atcgacaaga tcgactacaa caggattctc tgcgggatc 1659 <210> 113 <211> 874 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A29 <400> 113 gatcagagtc acaaccatag gagtcggaga cggccatgca tgtgtcttga tagaagaatt 60 aaccggttct aaatctgaaa acgaatccgg tcgtctcgaa ccgaaatcaa taaccggtcc 120 ggtcaaagaa acggttgcac gagtgaagga aacggttacg aaaacggagc cgttaatatg 180 cgatgacgga gtgacaaagg ggaagctgac gatgtgctac gaggtagacg ttgacgttga 240 cggtgggagg tgtgttaacg gagatttaac ggcagttagc tacggaggag gtttgggtaa 300 ttgtggcggg gattggtggg agaaatggga tggagtggtg aggatgagaa atggtgatga 360 cagttggtac cgttacgtgg atttaacggt gattaatgga aatgtggtaa ggttatggga 420 tgacaacaaa acactagtaa cggcggcatg tgtctaaatt agagaagttt catatttcgg 480 aaagttttta aatcttgaga agctttcttg gtttgaagtg tttttttttt gttggttgat 540 taagttgtaa tttgtaaata attttcacac aagagaccaa gaaggaacgc ttaaatcaat 600 atcaattggt gttgattccc agctttttct agtcgaactt aggtaacacg tccattgcga 660 tgatgaattc gtgacaaggg gtcaactatt tgaacacaac aaacaagtgc gttttcttgt 720 taaggcccat ctaaaattga ctacacacat ttacttttag gcccatttta aacttgactg 780 tagcctgtag gcatgtattt gttcgtgtta ctcccagcct caaacccgca aaatccacga 840 attcttctta cttagtctag actctggtct gatc 874 <210> 114 <211> 2138 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A30 <400> 114 gatctggcta atccgtttag cacacaacca gatgtaacat tggttgcaaa gattattgaa 60 gagtctcgat ctaatgtaac acacctctgc gcattcagga gtgcttacgt caacacattc 120 cgggaacgaa aaactgttag cgtatgtgta ttttaaagta ttaccatatt tctttatatc 180 ttctagcacc tcctcacaaa tgtcacgtgc gtcctccgat tccaaagcat aatggttgct 240 tccgaagagc cgaaggtaga caccacccat gtgagcatta ccagcacata tgtaaagaat 300 tgcgcatgca agggttgcag cggcgttcct tggggcgatt cgctctaagt gtaggatagc 360 tccctggatg tcagactcat gtgtaacgag acgcagtcct tcatggtaaa tagccgtggg 420 gttaccagct tgtaagcacc gtttgaagaa gggtctatag cgaccttcgg agttgatgtc 480 atttggatcg tggcctgccg cgtagaagtc atcgggatcg tcgcacatgc tgaaaatgtt 540 tgcatttttg aggacatccg gacagtagac aatgtctctt ccacgaggac cggatttcaa 600 cataggtccg aggtaccacc aacatttgtc agccattttc ttggctatct tcgcaagcaa 660 atcgtcagga atatttgggt ttgtcatatt taggagtaag gtgtttcgag aaaatgaaat 720 ttgaacactt aaataagcat cattgaagat atggttgggt aagttatggt tgtatttatt 780 gcaaaggtat taagtgatga tgtgtattca tattgtcaaa tcaaagtaat agtattccat 840 atataatttg ttatcgttgt tatgagcaac ctctttttat taacagctta aaactagacg 900 tgtacgtttt actgacggtc ttagtgtacg tccacattta catttctaca tttactcaac 960 aaacagtgta cgttgtagtg tatgttttag tgaacgtcca catttacatt tctacatttg 1020 cccaacaaac agtgtacgtt gtagtgtacg tccacattta catttctaca tttgcccaac 1080 aaacagtgta cgttgtagtg tacgtttaag tgtacgtcca catttacatt tctacatttg 1140 cccaacaaac agtgtacgtt gtagtgtacg ttttagtgta cgtccatatt tacatttcta 1200 catttactca acagacagtg tacgctgtag tgtactatta gtgtacgtcc attcataaat 1260 atcaccattt atgagacaaa ccaaagacct catacgtttg catgtgttat tttttagtgt 1320 acgttagagt tgatatctca tgctagtgaa cgtccatatc tagttttccg agacaaagaa 1380 aaaacctcta agtattattt ggtagatgca cgtgtacgga gttgtggacg cttagatttt 1440 aatatccaaa tttacattta ctgcagtgtc taaatatcat atgtgaattt ggctgaaaaa 1500 tattcaactt gagaaacata acacaccttg caaatttctt aagcaataat ataatttcaa 1560 cataaacata aacaacatag tagaaggctt atcataattt gaaacatgac atagcggata 1620 acataaacaa acatataaag tagaatggaa taactatagc atttgactaa cacgcctggc 1680 acacgaccag aggtaacagc ggttgcaaac gttttggaaa gctcctgata ccatgtaaca 1740 atataaggcg caaggaggca tactaattcc atggctggta ggataagaga acgtaggacc 1800 atatgtattg ctgtatggag ggtcaaactt ctttatttcc tcgatgaact catcacccaa 1860 aactcgagtg gcaaccgagt ccaatggata atggttgcgg gtgaagagct gtagaaacaa 1920 gccgcccata taatcatacc cagcacatat gaatacaatg gcgcatgcaa gtgttgcatt 1980 tgctcgtact ggagcatgac gctgtaagag cctgatggct ccattgatgt ttcgttcatg 2040 cgttagaaca cgaatacctt cgtaatacac ggccgtggga ttattagctg caaaacacct 2100 taagaaaaat gttcgatgtc ggccttcatc agcggatc 2138 <210> 115 <211> 2092 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A31 <400> 115 gatcaaaaga atcgtacttg aaatatttag tggaacgcat atgtcagagt tacagatatg 60 gtttaactct ttttatctcc tttttttaat ggtgtttctc tttttatctc ctataatctt 120 ttgggaattt tttattatta aatattaatt aaaaagataa attcttagag aaaatcccaa 180 ctgacttgtt aactagtgag acatatctta tttattctct gcttatctaa aaagaaaatg 240 aaaaagaaaa aaaaagtata tattagaaga ttaatataag tttaggggga aaatgattat 300 tattactatt tataaaatta gtatatttca aaattgtaca attaattact aagccttaaa 360 ataaaaatgt aaaagaagat tatcatcaag aatagtatac catctttgtt tcaaaagaaa 420 agtttactaa aagaaaaaac ttttgtttaa tttctactaa agctgaaagg aaaatgattg 480 tcaatttgtt attattatta tttatatgat agatttctta agaaacgtat agagttagtt 540 acaaattcta aattaaaaat tgtatgataa gattatctta agaaagttat acaatatatt 600 cctaattcta aaagaaaatg gttatttttt tggaatagat atacacaaca aaacaaattt 660 agtataagaa gatatgttag attaactaaa taaacatctc aggcatgaaa ctggattagg 720 ttaaccagag gtccagagac ctatatatct ctaggcatta gggtttaact acggagcaaa 780 gcctcataat caagtttata tcttgcgcat ctttagcaac caatcaatta tctaagaagc 840 catgactaat actaatgttg ctgctacaaa gcctctttct actatggtcg atgaatctcc 900 tagccttctc cgtgattggt ggtgagactc tagatcaatg atttttctta cttttttccc 960 attactatgt tatgttacgt aacataagat ggattaaact gaatctgatc ctcttaaatt 1020 atattggttg cagtatgaac aagaacctac aatacaactt tgcgatgaac ttcgtcatga 1080 taatcatcaa cattgaagca atcttgtcta tcagaaacca cgaaaatcac gtaaggaaag 1140 attattcaac gattttgata atttccggta tgttcttgcc tttcgcctat taagttgcgt 1200 ttgttgggtt ggcgcaatca gggatgtgac attatgtgaa ctcgcctaca tcttcggacg 1260 catcagtcac aacataggct ttattttctt cctagaactc ctctattgta tttctcccta 1320 cttggctcta ctcgttggtc tacatgtagg ccaatggtat ctaacttcca tgattggact 1380 gtctctatgg gaaggaatgc aagcattacg aactgatatt taacctcgtt taatagtaaa 1440 atctaaactt atttagctgc atattttggt ttaaggcaat cgagaatgtc ttagcatcta 1500 aagcttactt cgtgggacgc atctgtcaca cgttcggctt ttgtattttc gtccacctcc 1560 tctattcggt ttctcctcac ttggctctat acttcggtct cccttgtttg ctaggtttcg 1620 tagccgtcat gattgcacca agttgtccgt atcaatggaa aggcctatgc aacaaagtgc 1680 aagagttacg agactggtgg aagcatgtga atcgaccaca atcctcggtt gttattgttc 1740 aaggatctcc atttctaaga tgtgaatttt aggactcttt tatccctttt gccttttaaa 1800 ttggaatacc aacgtttatt atgtgggtta gttatgtgtg tatatgatat acaaatcaaa 1860 caacatatat aaggagaaga gatattgaat gttgattctt aatttacagg aacatgaagc 1920 tcgggtcttt ccggcaatgc catcaatatc cgaggcggtg cagtttcttc gtcagacgag 1980 aaaccagaga gtctagtatc ctaattttga acaaatagag cataaaggaa caagttatat 2040 agcttcacat aacccgaaac atgttttaag tttcaatatc aaagacaaga tc 2092 <210> 116 <211> 1290 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A32 <400> 116 gatctagaca tatgtgtgag acgtttcatt gtaggtatct gaatgtaaag ctcaaagctt 60 taacctttga accgataaac ctctaaagct ctctcttttc cttggatgag tctcacaagt 120 taagaacttc agtgaaataa tctgacttta ttgaacccaa acttgggtat cactgtttat 180 cttagcatta cagagttttg tttttgttat gtacattgga tttgaagtct acaatgtttt 240 tccaggttta taaaccggaa gaatatagcc gggttctagc tatctgtggt cctgggaaca 300 atggtggtga tggtttggtg gcggcgaggc atttgcacca ctttggatat aaaccgttta 360 tttgttatcc caaacgtaca gccaagccac tttatactgg actggtcact caggtttgtg 420 taaccagtgc ttaatttatg ggggatcttt gttagctttc tccgtttctt tactgcctgc 480 tgaatttgcc tgtttttgta gttggattca ctctcagtcc cttttgtttc cgttgaggat 540 ctgccggatg acttgtcaaa ggactttgat gttattgtag atgcaatgtt tgggttttca 600 ttccatggta actatttttg tgcatgaatc gttagaattc ttcaaagcat gaaacaatta 660 taagaagtaa attcatcaaa cttttgaaca gcaagttttg gaatcaaagt ctcagagatg 720 caccttattc atttgcatca tgtttcagtt ggcctttgaa aatccatttt ttgcacatgt 780 aggagctccc aggcctcctt ttgatgacct catccggcga ttagtatcgt tacagaacta 840 tgagcagact cttcaaaaac acccagtcat tgtctctgtg gatattccct ctggttggca 900 cgttgaagaa ggagaccatg aagatggagg aattaagcct gatatgttgg taagtcttag 960 ccgaaatgct tgtgtttctc tttttctctt gtactcattt gttactatct gatataatga 1020 aaactacttt ataaattgaa catatttact ctttttaggt atctttgact gccccaaaat 1080 tatgtgcaaa gagattccgt ggccctcatc actttttagg tgggagattt gtaccacctt 1140 ctgttgcaga aaagtataag ctggagctcc ctagttaccc agggacatct atgtgtgtta 1200 gaattggtaa acctcccaaa gttgacatat ctgctatgag agtgaactat gtctctccag 1260 aattgcttga ggagcaggtt gaaactgatc 1290 <210> 117 <211> 869 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A33 <400> 117 gatcccgttc atgtattttt gccagttcga gttggggttg gttctgttta ctttttctag 60 tccatgtatt ttgcagacct attaaaacca ttctgttttt tttttggacc aacaaaaccc 120 atccgttttt agatacgaaa ataaaatttt attaaaacca ttatttttct tggaccatca 180 aaacccatcc gtttaaagat acgaaatgaa attcgattga taaatacaaa ataaagttca 240 ccaaacttaa ataaaaaggc atagatggga ccaatgagaa agaaatttct tttctcctca 300 atttccccaa aaatatataa accttaagtt tacttttttg ttgcaaggaa aaacattaat 360 ctttttcaac tttctaaaaa caatcatttc aaacgttaaa ggaacctcct cctttcttta 420 cgcgtttgca atataaccca agaagaccgc ttgtttgtac aactttccaa aaaccaaaca 480 gtagtgtaat aaacctctga cttctttttt cttctctatt tttgtgggtg ataatcaatt 540 cactcggttt gaaatttcgt ccacttttca aagatgagtg aatgaaaaag ccacgaaact 600 ttccatttct tcctctgtgt ataactctca ctgagtacga cttgccattt tctcatccaa 660 aaaaaatgtt tatccaaata catatttgtg aactttgctt ttaaaccact caagattctt 720 ccccatggct tcttcgtctt cttcttctcg gtctcgcacc tggagatacc gcgtcttcac 780 gaacttccat ggacctgacg tccgtaaaac attcctcagc catttacgta aacagtttag 840 ctacaacggg atttcgatgt ttaatgatc 869 <210> 118 <211> 921 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A34 <400> 118 gatccatgct tttgagttta agtgatttat ttaagatcct ctaaactttt ttttcttcac 60 ttagtggtgg ttccagtcaa tttagcaagt aagatgttgt atgtgtcaat gctataactg 120 tgaattttca gctattgtag tttgattttt gtctttgtta gcttcaggtg tcttgaatct 180 gaatctgtgg ctatatttgg tgctcggtgg tgagcaggaa gggaggggga tattgtcagg 240 gttttaatgt acgtcagatg aatagagcaa ctaatgttac tggcagtaga aggagggggt 300 ttattctcag cgtccgcgtc tgggtatagt aagggattga cccttctttt ctctggtgat 360 aaagacgtag ataggcccat gagagttgtc ccgtggaatc actaccaggt ggttgaccaa 420 gagcctgagg ctgaccctgt tcttcagctg gattctatta agaaccgagt ttcccgcggt 480 tgcgctgctt ccttcagttg ttttggtggc gcttccgcgg gacttgagac cccttctcct 540 cttaaagttg aacctgtgca gcagcagcat cgtgaaatat catcaccaga gtctgttgtt 600 gttgtttctg aaaagggtaa agaccaaata agtgaagctg ataatggcag cagcaaagaa 660 gctttcaaac tctcgttgag gagtagcttg aagaggccct ctgttgcgga atcacgctct 720 ctagaagata taaaagaata cgagacgttg agtgtggatg gtagcgatct cactggtgac 780 atggcaaggc ggaaagttca gtggcctgat gcttgtggta gtgaactcac tcaagttaga 840 gaatttgagc cgaggtacgt gtgatatgtt ttcctcttat tgagttgctt aaatcccaat 900 acgagttaat ttaagtagat c 921 <210> 119 <211> 1140 <212> DNA <213> Artificial Sequence <220> <223> sequence of STAR A35 <400> 119 gatccatttc atatacatat taccaatttt ggcttttata ggtttgtatc cagaaggcct 60 tttcgtggct acgattaagg aaaatacgaa aacaaaagtg aattttacta cttttgtagc 120 atggtttatt ctactttata tacctaagaa atatgagcaa caattacttc tgtaatgact 180 ttttactact tcgtagttgg tacaaactac aaaagattgt gttgttttta catgatactt 240 tataatatct atattaatat atttagtcgt gtttaatcaa aaaagcacca gtggtctagt 300 ggtagaatag taccctgcca cggtacagac ccgggttcga ttcccggctg gtgcattgag 360 ctatgatgat ataggcttca gcattggttg ggtccattgc attcttctga actatcagtt 420 gatgtatgcc acacctctga gctcttcttt ttttttcctc gtcaattaat tttttaaagt 480 tttgtctgcc taaaaacttt cttctttttg attaatcata ttaagcatct cggctataaa 540 aaccacggtc tactaactta acatgcattg gactagtttt agtggagagt gttcgagtta 600 aaatgagaag ctcacgattg cataacggaa catttgattc gctaggcatc tccatttgta 660 aaagtagcca ctccaataca aaatggtcga tgatggtgag tgggtgagac aaacccacca 720 ccacctcaag aagatatatt tctctggtta agaatttgaa tggttgacaa agaaacggtc 780 actctatata cttagaaaat atagtcatac atagacacca tcggtctagt tataataata 840 accactggat taatgcccag tgaaaataat tgagtagcca aaacatgaat ataacaatat 900 cccaatttac atacaacaac acaaaggagg ttttacacga ttctatagta caaactcata 960 acaacaaaaa atcacacttt tgtttaacag ttgcctttat ggctttacta cagtatcttg 1020 tccagggttt tcacacataa caatcacagt aaatcgtttc cttttctttg catcttccat 1080 tccttttgta cacgtaacat ctccggcttc ccgaccatca gctaagaacc agatgcgatc 1140 <210> 120 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> loxP sequence <400> 120 ataacttcgt ata 13 <210> 121 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> FRT sequence <400> 121 gaagttccta tac 13 <210> 122 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 122 aaaaaa 6 <210> 123 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide <400> 123 tttttt 6 <210> 124 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> hexamer <400> 124 acgtga 6 <210> 125 <211> 631 <212> DNA <213> Artificial Sequence <220> <223> STAR elements in STAR3 forward <220> <221> misc_feature <222> (5)..(630) <223> "N" stands for any nucleic acid on various positions <400> 125 acgtnctaag naaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag 60 gccctttcgt cttcactcga gcggccagct tggatctcga gtactgaaat aggagtaaat 120 ctgaagagca aataagatga gccagaaaac catgaaaaga acagggacta ccagttgatt 180 ccacaaggac attcccaagg tgagaaggcc atatacctcc actacctgaa ccaattctct 240 gtatgcagat ttagcaaggt tataaggtag caaaagatta gacccaagaa aatagagaac 300 ttccaatcca gtaaaaatca tagcaaattt attgatgata acaattgtct ccaaaggaac 360 caggcagagt cgtgctagca gaggaagcac gtgagctgaa aacagccaaa tctgctttgt 420 tttcatgaca caggagcata aagtacacac caccaactga cctattaagg ctgtggtaaa 480 ccgattcata gagagaggtt ctaaatacat tggtccctca taggcaaacc gcagttcact 540 ccgaacgtag tccctggaaa tttgatgtcc agnatagaaa agcanagcag ncnnnnnnta 600 tanatnnngn tganccanat gntnnctgnn c 631 <210> 126 <211> 774 <212> DNA <213> Artificial Sequence <220> <223> STAR elements in STAR3 reverse <220> <221> misc_feature <222> (637)..(762) <223> "N" stands for any nucleic acid on various positions <400> 126 gagctagcgg cgcgccaagc ttggatcccg ccccgccccc tccgccctcg agccccgccc 60 cttgccctag aggccctgcc gaggggcggg gcctgtccct cctccccttt cccccgcccc 120 ctaccgtcac gctcaggggc agcctgaccc cgagcggccc cgcggtgacc ctcgcgcaga 180 ggcctgtggg aggggcgtcg caagcccctg aatccccccc cgtctgttcc cccctcccgc 240 ccagtctcct ccccctggga acgcgcgggg tgggtgacag acctggctgc gcgccaccgc 300 caccgcgcct gccgggggcg ctgccgctgc ctgagaaact gcggctgccg cctggaggag 360 gtgccgtcgc ctccgccacc gctgccgccg ccgccagggg taggagctaa gccgccgcca 420 ttttgtgtcc ccctgttgtt gtcgttgaca tgaatccgac atgacactga ttacagccca 480 atggagtctc attaaacccg agtcgcggtc ccgccccgcc gctgctccat tggaggagac 540 caaagacact taaggccacc cgttggccta cgggtctgtc tgtcacccac tcactaacca 600 ctctgcagcc cattggggca ggttcctgcc ggtcatntcg cttccaataa acacacccct 660 tcgaccccat nattcccccc cttcgggaac cacccccggg ggaggggtcc actggncaat 720 accaattnaa nagaaccgct ngggtccgcc tntttncggg cnccctattg ggtt 774 <210> 127 <211> 717 <212> DNA <213> Artificial Sequence <220> <223> STAR elements in STAR4 forward <220> <221> misc_feature <222> (444)..(704) <223> "N" stands for any nucleic acid on various positions <400> 127 ggggaggatt cttttggctg ctgagttgag attaggttga gggtagtgaa ggtaaaggca 60 gtgagaccac gtaggggtca ttgcagtaat ccaggctgga gatgatggtg gttcagttgg 120 aatagcagtg catgtgctgt aacaacctca gctgggaagc agtatatgtg gcgttatgac 180 ctcagctgga acagcaatgc atgtggtggt gtaatgaccc cagctgggta gggtgcatgt 240 gatggaacaa cctcagctgg gtagcagtgt acttgataaa atgttggcat actctacatt 300 tgttatgagg gtagtgccat taaatttctc cacaaattgg ttgtcacgta tgagtgaaaa 360 gaggaagtga tggaagactt cagtgctttt ggcctgaata aatagaagac gtcattttca 420 gtaatggaga cagggaagac taangnaggg tggattcagt agagcaggtg ttcagttttg 480 aatatgatga actctgagag aggaaaaact ttttctacct cttagttttt gngnctggac 540 ttaanattaa aggacatang acngaganca gaccaaatnt gcgangtttt tatattttac 600 ttgcngaggg aatttncaag aaaaagaaga cccaanancc attggtcaaa actatntgcc 660 ttttaanaaa aaganaatta caatgganan anaagtgttg nctnggcaaa aattggg 717 <210> 128 <211> 541 <212> DNA <213> Artificial Sequence <220> <223> STAR elements in STAR4 reverse <220> <221> misc_feature <222> (6)..(533) <223> "N" stands for any nucleic acid on various positions <400> 128 ggattngagc tagcggcgcg ccaagcttgg atcttagaag gacagagtgg ggcatggaaa 60 tgcaccacca gggcagtgca gcttggtcac tgccagctcc nctcatgggc agagggctgg 120 cctcttgcag ccgaccaggc actgagcgcc atcccagggc cctcgccagc cctcagcagg 180 gccaggacac acaagccttt gacttcctcc tgtcactgct gctgccattc ctgttttgtg 240 gtcatcactc cttccctgtc ctcagactgc ccagcactca aggatgtcct gtggtggcat 300 cagaccatat gcccctgaan aggagtgagt tggtgttttt tgccgcgccc anagagctgc 360 tgtcccctga aagatgcaag tgggaatgat gatgntcacc atcntctgac accaagccct 420 ttggatagag gccccaacag tgaggatggg gctgcactgc attgccaagg caactctgtn 480 ntgactgcta cangacantc ccaggacctg ngaagnncta tanatntgat gcnaggcacc 540 t 541 <210> 129 <211> 794 <212> DNA <213> Artificial Sequence <220> <223> STAR elements in STAR6 forward <220> <221> misc_feature <222> (374)..(792) <223> "N" stands for any nucleic acid on various positions <400> 129 ccaccacaga catcccctct ggcctcctga gtggtttctt cagcacagct tccagagcca 60 aattaaacgt tcactctatg tctatagaca aaaagggttt tgactaaact ctgtgtttta 120 gagagggagt taaatgctgt taacttttta ggggtgggcg agaggaatga caaataacaa 180 cttgtctgaa tgttttacat ttctccccac tgcctcaaga aggttcacaa cgaggtcatc 240 catgataagg agtaagacct cccagccgga ctgtccctcg gcccccagag gacactccac 300 agagatatgc taactggact tggagactgg ctcacactcc agagaaaagc atggagcacg 360 agcgcacaga gcangggcca aggtcccagg gacngaatgt ctaggaggga gattggggtg 420 agggtantct gatgcaatta ctgngcagct caacattcaa gggaggggaa gaaagaaacn 480 gtccctgtaa gtaagttgtn cancagagat ggtaagctcc aaatttnaac tttggctgct 540 ggaaagtttn ngggccnana naanaaacan aaanatttga ggtttanacc cactaacccn 600 tatnantant tattaatacc cctaattana ccttggatan ccttaaaata tcntntnaaa 660 cggaaccctc nttcccnttt nnaaatnnna aaggccattn ngnncnagta aaaatctnnn 720 ttaagnnntg ggcccnaaca aacntnttcc nagacacntt ttttntccng gnatttntaa 780 tttatttcta ancc 794 <210> 130 <211> 379 <212> DNA <213> Artificial Sequence <220> <223> STAR elements in STAR6 reverse <220> <221> misc_feature <222> (287)..(379) <223> "N" stands for any nucleic acid on various positions <400> 130 atcgtgtcct ttccagggac atggatgaag ctggaagcca tcatcctcag caaactaaca 60 caggaacaga aaaccaaata ccacatgttc tcactcataa gtgggagctg aacagtgaga 120 acacatggac acagggaggg gaacatcaca caccaaggcc tgtctggtgt ggggagggga 180 gggagagcat caggacaaat agctaatgca tgtggggctt aaacctagat gacgggttga 240 taggtgcagc aatccactat ggacacatat acctatgtaa caacccnacc ttnttgacat 300 gtatcccaga acttaaagga aaataaaaat taaaaaaaat tnccctggaa taaaaaagag 360 tgtggacttt ggtgagatn 379 <210> 131 <211> 398 <212> DNA <213> Artificial Sequence <220> <223> STAR elements in STAR8 forward <220> <221> misc_feature <222> (98)..(395) <223> "N" stands for any nucleic acid on various positions <400> 131 ggatcacctc gaagagagtc taacgtccgt aggaacgctc tcgggttcac aaggattgac 60 cgaaccccag gatacgtcgc tctccatctg aggcttgntc caaatggccc tccactattc 120 caggcacgtg ggtgtctccc ctaactctcc ctgctctcct gagcccatgc tgcctatcac 180 ccatcggtgc aggtcctttc tgaanagctc gggtggattc tctccatccc acttcctttc 240 ccaagaaaga agccaccgtt ccaagacacc caatgggaca ttcccnttcc acctccttnt 300 cnaaagttng cccaggtgtt cntaacaggt tagggagaga ancccccagg tttnagttnc 360 aaggcatagg acgctggctt gaacacacac acacnctc 398 <210> 132 <211> 309 <212> DNA <213> Artificial Sequence <220> <223> STAR elements in STAR8 reverse <220> <221> misc_feature <222> (72)..(72) <223> "N" stands for any nucleic acid <400> 132 ggatcccgac tctgcaccgc aaactctacg gcgccctgca ggacggcggc ctcctgccgc 60 ttggacgcca gncaggagct ccccggcagc agcagagcag aaagaaggat ggccccgccc 120 cacttcgcct cccggcggtc tccctcccgc cggctcacgg acatagatgg ctgcctagct 180 ccggaagcct agctcttgtt ccgggcatcc taaggaagac acggtttttc ctcccggggc 240 ctcaccacat ctgggacttt gacgactcgg acctctctcc attgaatggt tgcgcgttct 300 ctgggaaag 309 <210> 133 <211> 606 <212> DNA <213> Artificial Sequence <220> <223> STAR elements in STAR18 forward <220> <221> misc_feature <222> (524)..(524) <223> "N" stands for any nucleic acid <400> 133 tggatcctgc cgctcgcgtc ttagtgtttc tccctcaaga ctttccttct gttttgttgt 60 cttgtgcagt attttacagc ccctcttgtg tttttcttta tttctcgtac acacacgcag 120 ttttaagggt gatgtgtgta taattaaaag gacccttggc ccatactttc ctaattcttt 180 agggactggg attgggtttg actgaaatat gttttggtgg ggatgggacg gtggacttcc 240 attctcccta aactggagtt ttggtcggta atcaaaacta aaagaaacct ctgggagact 300 ggaaacctga ttggagcact gaggaacaag ggaatgaaaa ggcagactct ctgaacgttt 360 gatgaaatgg actcttgtga aaattaacag tgaatattca ctgttgcact gtacgaagtc 420 tctgaaatgt aattaaaagt ttttattgag cccccgagct ttggcttgcg cgtatttttc 480 cggtcgcgga catcccaccg cgcagagcct cgcctccccg ctgncctcag ctccgatgac 540 ttccccgccc ccgccctgct cggtgacaga cgttctactg cttccaatcg gaggcaccct 600 tcgcgg 606 <210> 134 <211> 465 <212> DNA <213> Artificial Sequence <220> <223> STAR elements in STAR18 reverse <400> 134 tggatcctgc cgctcgcgtc ttagtgtttc tccctcaaga ctttccttct gttttgttgt 60 cttgtgcagt attttacagc ccctcttgtg tttttcttta tttctcgtac acacacgcag 120 ttttaagggt gatgtgtgta taattaaaag gacccttggc ccatactttc ctaattcttt 180 agggactggg attgggtttg actgaaatat gttttggtgg ggatgggacg gtggacttcc 240 attctcccta aactggagtt ttggtcggta atcaaaacta aaagaaacct ctgggagact 300 ggaaacctga ttggagcact gaggaacaag ggaatgaaaa ggcagactct ctgaacgttt 360 gatgaaatgg actcttgtga aaattaacag tgaatattca ctgttgcact gtacgaagtc 420 tctgaaatgt aattaaaagt ttttattgag cccccgagct ttggc 465 <210> 135 <211> 565 <212> DNA <213> Artificial Sequence <220> <223> sinc elements PSINKS 9 <400> 135 gatcaggata ataagtacgc tgggaagaca acaaaatgat ttaaatctta gacaagtcat 60 tctaggtgtc tccactgttt cagttcttgc attcattctt gtggtatctt ttccctttta 120 ccaataaaaa agctccctga catcacattg tggcagtccc catggtttgc cgcagttact 180 gcgggactga acgaaggagg acgaatgaag aaatgaaaac caaggaaaaa aggagctgtt 240 taaagaaggg tccagggaag aagaagaggg ctcccagctt ctagtgagca agggcagcag 300 ccctgagctt ctacagccct tcatatttat tgagtagaaa gagcagggag caggaggtaa 360 tgattggtca gcttctcaat tgatcacagg ttcacattat tgctaacaga tttcacatgt 420 gcctaatctc aagaaacgcc gcgcctgggg catgactgcc ctcagcattc cctctgggtg 480 gcagacgcag tttgccaaca ttctgcattc atgagaacag tttactgttt actcatataa 540 cctccagtgg tacaccgagt tgatc 565 <210> 136 <211> 571 <212> DNA <213> Artificial Sequence <220> <223> sinc elements PSINKS 12 <220> <221> misc_feature <222> (522)..(522) <223> "N" stands for any nucleic acid <400> 136 gatctaattt ctctgtattt aattcccatg tctattttgt ctattttcaa gattgattta 60 cattgcaggt tccgatgcaa ccactgactt acattgcagg ttctaatgta accactgtcc 120 ttaacgagta catagatttg tttccttctc tccaggagca tgagatttgt tgcctccagg 180 aaaggcaaca aatctactat tccttaagga cagtggttct caaaggattg tcctgggaac 240 agcagcatca cctacacagt agttagaaat gcacattctg aggcctccca agacctgcta 300 actcagacac ttggggagaa gaaggggttc caacaagcct tctaggtcat tctgatgcat 360 gctggagttt gagaatcgat gctctaggaa aaacaccagt actatctacc atcaacttga 420 ccactcaagt gtcaccattc actgaagttt aactacaatg tccagagaat taattgtgta 480 ccaggcacta tgcggaaggc tgaatgctgc ctcacaatcc anagtggtat gtgtgtaaat 540 gactaaataa aatgcaaaat gggatgacat g 571 <210> 137 <211> 553 <212> DNA <213> Artificial Sequence <220> <223> sinc elements PSINKS 19 <400> 137 gatcctccat ctgctccacc cacttccatg taagtgatcc tgggctgatc acttcctctc 60 tctagacttc gtttcttttt tttctttttt agaccgagtc tcactctgtc acccaggctg 120 gagtgcagtg gtgagatctt ggctcactgc aacctccacc tcctgggttc aagcaattct 180 cctgtctcag cctcctgagt agataggact ataggtgcac accaccatac ctagctaatt 240 tttgtttttt tagtagagat ggggtttcac catattggtc agcctgttct caaactcctg 300 acctcaggtg atccacccac ctcagcctcc caaagtgctg ggattacagg tgtgagccac 360 cgagccgggc tgcccttctc tggactttga tttcctcatc tataaaacag acaacaatcc 420 ctactatgac catccagaag ggttaatcta tgcttcattg caatcctaat caaaaatccc 480 aacattttgg ccgtggagcc tgcccagatg gttctaggat ttatttggat gggaaaatag 540 tcaagacaag ctt 553 <210> 138 <211> 881 <212> DNA <213> Artificial Sequence <220> <223> sinc elements PSINKS 28 <400> 138 gatcatggag ggagagaaca accaaccaca cactgactgg tcacccctga agttcacagc 60 cactaccctg tagaggcccc gaggttgccg gcaagcccag tatacttcca tctaaactcc 120 ccttgcacct gctcctcctg ttccagacaa tgagctgtaa cacgcacatc cacaccacac 180 atcacccaca gcaggggcag gaggcagcta agcatgggct tcagagtcct cccaccagca 240 gcgcctacca gctacaagcc tgacgtctct gtgtgtgtgt gtaaatttca ctaaatattt 300 cttcctttgt tttttaaaaa tttacatgaa atgcacattt ttgctgtgac agaagcatgt 360 aactgtgatc ctaacacacc tactcctccg ccttttactg ccgtctgctt ccctctcttc 420 tccacgccca ctcgactgca gtatcgatgc caacaacatg atgtgtgtcc ttccatgttt 480 ccctgctcat gcattcgcat gtaagccacc gcacatgtca ctgtatgtac acacagggga 540 ttctgaggcc aatgttttac aaggattacg ttatacaccc ttttctgcag tgagtttttc 600 ccaggcaacc tcccaggccc catggtgtag ctctgggtca atcctttttt ttttttttgg 660 agacagagtc tcactctgtc gcccaggctg gagtgcagtg gtgcaatttg ggctcactgc 720 aacctccgcc tcccgggttc aagcgattct cctgcctcag cctcctgagt agctgacatt 780 acaagcgcgc actaccacac ccggctaatt tttgtatttt tagtagagat acagtttcac 840 catgttggtc aggctggtct tgaactcctg agctcgtgat c 881 <210> 139 <211> 632 <212> DNA <213> Artificial Sequence <220> <223> sinc elements PSINKS 30 <400> 139 gatccacccg cctcggactc ccaaagtgct gggattacag gtgtgagcca ctgtgcttgg 60 cccgaatcag gaataattct gatggctaag gaagacagct tccgagagag taggagaaag 120 ggcacaggat tccaggcaga aggcccatct agggcaaagg cgaaggtgtg gctcagcctg 180 cctcctttgg ggaatggcga gtgtgttctg ggctcagggt tcttggtaag ggacagagaa 240 gactcgggaa agatcagttg agctggaatg tgcaggctct tgagtaccct gctcaggagc 300 tggaggtggg ctaccctgca aactccaggc catgaagccc aggaagatgt caggctggtc 360 ttcccatgcc cttgtgtatc tgagaccaac tgtcactaaa tgtttccttt acgccctgga 420 cacacagcta gactctactt ctcagattct cttgaaatac aagtctttag ccagagggtg 480 tggagggaaa tgctgtgtat cactttgagg ttgaggccat caaagcctcc cacaggtggc 540 cccctctttc tctccccacg tacttatgat gttgatgccc aaggcagctt gagtactacc 600 tgctgaaggc agggcctctg tcaccataga tc 632 <210> 140 <211> 573 <212> DNA <213> Artificial Sequence <220> <223> sinc elements PSINKS 35 <400> 140 gatccacctg cctcggcctc ccaaagtgct gggattacag gcatgagcca ccatgcctgg 60 ccaaaaactt ctacctgctt ggaaagttga ctggtcacac agcctagcaa atgaggttgg 120 gatgtgggat gtgcctggtt ccaatcccag ccctttactg ttcccatagg aggtggggac 180 aggcctcacc caggcgtcca gcatcctgca gctgaatctt gagcatttcc atgggacagg 240 tcaccacgac ctggcacatc ccagccccac acccggcaag catctccatc ttcaggttcc 300 gctgcatcct atgggaacag gcgtcaggct ccttcagccg caggccacag gcctgccctg 360 gtgcagctgc cctcttgtga gagggggact ttccctggat ggcacccgtg gctgccactc 420 acccagctgg tcaagtcatc agctagccct taggtgtggt ctctgtacgg acaggggact 480 aagtttaaaa caaagcctgc tagggaggta gcaccgcatg gaagctgaaa cagtgacaga 540 gaaaactacc cagaccaggc gttgtccttg atc 573 <210> 141 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide C65 <400> 141 aacaagcttg atatcagatc tgctagcttg gtcgagctga tacttccc 48 <210> 142 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide C66 <400> 142 aaactcgagc ggccgcgaat tcgtcgactt taccactccc tatcagtgat agag 54 <210> 143 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide C67 <400> 143 aaaccgcggc atggaagacg ccaaaaacat aaagaaagg 39 <210> 144 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide C68 <400> 144 tatggatcct agaattacac ggcgatcttt cc 32 <210> 145 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide C81 <400> 145 aaaccatggc cgagtacaag cccacggtgc gcc 33 <210> 146 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide C82 <400> 146 aaatctagat caggcaccgg gcttgcgggt catgc 35 <210> 147 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide C85 <400> 147 catttccccg aaaagtgcca cc 22 <210> 148 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D30 <400> 148 tcactgctag cgagtggtaa actc 24 <210> 149 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D41 <400> 149 gaagtcgacg aggcaggcag aagtatgc 28 <210> 150 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D42 <400> 150 gagccgcggt ttagttcctc accttgtcg 29 <210> 151 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D51 <400> 151 tctggaagct ttgctgaaga aac 23 <210> 152 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D89 <400> 152 gggcaagatg tcgtagtcag g 21 <210> 153 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D90 <400> 153 aggcccatgg tcacctccat cgctactgtg 30 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D91 <400> 154 ctaatcactc actgtgtaat 20 <210> 155 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D93 <400> 155 aattacaggc gcgcc 15 <210> 156 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D94 <400> 156 aattggcgcg cctgt 15 <210> 157 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D95 <400> 157 tgctttgcat acttctgcct gcctc 25 <210> 158 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E12 <400> 158 taggggggat ccaaatgttc 20 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E13 <400> 159 cctaaaagaa gatctttagc 20 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E14 <400> 160 aagtgttgga tccactttgg 20 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E15 <400> 161 tttgaagatc taccaaatgg 20 <210> 162 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E16 <400> 162 gttcgggatc cacctggccg 20 <210> 163 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E17 <400> 163 taggcaagat cttggccctc 20 <210> 164 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E18 <400> 164 cctctctagg gatccgaccc 20 <210> 165 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E19 <400> 165 ctagagagat cttccagtat 20 <210> 166 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E20 <400> 166 agagttccgg atccgcctgg 20 <210> 167 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E21 <400> 167 ccaggcagac tcggaactct 20 <210> 168 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E22 <400> 168 tggtgaaacc ggatccctac 20 <210> 169 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E23 <400> 169 aggtcaggag atctagacca 20 <210> 170 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E25 <400> 170 ccattttcgc ttccttagct cc 22 <210> 171 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E42 <400> 171 cgatgtaacc cactcgtgca cc 22 <210> 172 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E57 <400> 172 agagatctag gataatttcg 20 <210> 173 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E92 <400> 173 aggcgctagc acgcgttcta ctcttttcct actctg 36 <210> 174 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E93 <400> 174 gatcaagctt acgcgtctaa aggcatttta tatag 35 <210> 175 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E94 <400> 175 aggcgctagc acgcgttcag agttagtgat ccagg 35 <210> 176 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E95 <400> 176 gatcaagctt acgcgtcagt aaaggtttcg tatgg 35 <210> 177 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E96 <400> 177 aggcgctagc acgcgttcta ctctttcatt actctg 36 <210> 178 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E97 <400> 178 cgaggaagct ggagaaggag aagctg 26 <210> 179 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide E98 <400> 179 caagggccgc agcttacaca tgttc 25 <210> 180 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D58 <400> 180 ccaagttgac cagtgcc 17 <210> 181 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D80 <400> 181 gttcgtggac acgacctccg 20 <210> 182 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D70 <400> 182 tacaagccaa ccacggcct 19 <210> 183 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide D71 <400> 183 cggaagtgct tgacattggg 20 <210> 184 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 184 ccccac 6 <210> 185 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 185 cagcgg 6 <210> 186 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 186 ggcccc 6 <210> 187 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 187 cagccc 6 <210> 188 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 188 gccccc 6 <210> 189 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 189 cggggc 6 <210> 190 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 190 ccccgc 6 <210> 191 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 191 cggcag 6 <210> 192 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 192 agcccc 6 <210> 193 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 193 ccaggg 6 <210> 194 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 194 ggaccc 6 <210> 195 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 195 gcggac 6 <210> 196 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 196 ccagcg 6 <210> 197 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 197 gcagcc 6 <210> 198 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 198 ccggca 6 <210> 199 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 199 agcggc 6 <210> 200 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 200 cagggg 6 <210> 201 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 201 ccgccc 6 <210> 202 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 202 cccccg 6 <210> 203 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 203 gccgcc 6 <210> 204 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 204 gccggc 6 <210> 205 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 205 cggacc 6 <210> 206 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 206 cgcccc 6 <210> 207 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 207 cgccag 6 <210> 208 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 208 cgcagc 6 <210> 209 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 209 cagccg 6 <210> 210 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 210 cccacg 6 <210> 211 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 211 gctgcc 6 <210> 212 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 212 ccctcc 6 <210> 213 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 213 ccctgc 6 <210> 214 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 214 cacccc 6 <210> 215 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 215 gcgcca 6 <210> 216 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 216 aggggc 6 <210> 217 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 217 gagggc 6 <210> 218 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 218 gcgaac 6 <210> 219 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 219 ccggcg 6 <210> 220 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 220 agccgg 6 <210> 221 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 221 ggagcc 6 <210> 222 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 222 ccccag 6 <210> 223 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 223 ccgctc 6 <210> 224 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 224 cccctc 6 <210> 225 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 225 caccgc 6 <210> 226 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 226 ctgccc 6 <210> 227 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 227 gggcca 6 <210> 228 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 228 cgctgc 6 <210> 229 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 229 cagcgc 6 <210> 230 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 230 cggccc 6 <210> 231 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 231 ccgccg 6 <210> 232 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 232 ccccgg 6 <210> 233 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 233 agccgc 6 <210> 234 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 234 gcaccc 6 <210> 235 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 235 aggacc 6 <210> 236 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 236 agggcg 6 <210> 237 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 237 cagggc 6 <210> 238 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 238 cccgcc 6 <210> 239 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 239 gccagc 6 <210> 240 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 240 agcgcc 6 <210> 241 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 241 aggccc 6 <210> 242 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 242 cccacc 6 <210> 243 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 243 cgctca 6 <210> 244 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 244 aacgcg 6 <210> 245 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 245 gcggca 6 <210> 246 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 246 aggtcc 6 <210> 247 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 247 ccgtca 6 <210> 248 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 248 cagagg 6 <210> 249 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 249 cccgag 6 <210> 250 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 250 ccgagg 6 <210> 251 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 251 cgcgga 6 <210> 252 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 252 ccaccc 6 <210> 253 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 253 cctcgc 6 <210> 254 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 254 caagcc 6 <210> 255 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 255 tccgca 6 <210> 256 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 256 cgccgc 6 <210> 257 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 257 gggaac 6 <210> 258 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 258 ccagag 6 <210> 259 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 259 cgttcc 6 <210> 260 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 260 cgagga 6 <210> 261 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 261 gggacc 6 <210> 262 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 262 ccgcga 6 <210> 263 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 263 cctgcg 6 <210> 264 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 264 ctgcgc 6 <210> 265 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 265 gacccc 6 <210> 266 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 266 gctcca 6 <210> 267 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 267 cgccac 6 <210> 268 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 268 gcggga 6 <210> 269 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 269 ctgcga 6 <210> 270 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 270 ctgctc 6 <210> 271 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 271 cagacg 6 <210> 272 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 272 cgagag 6 <210> 273 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 273 cggtgc 6 <210> 274 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 274 ctcccc 6 <210> 275 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 275 gcggcc 6 <210> 276 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 276 cggcgc 6 <210> 277 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 277 aagccc 6 <210> 278 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 278 ccgcag 6 <210> 279 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 279 gcccac 6 <210> 280 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 280 caccca 6 <210> 281 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 281 gcgccc 6 <210> 282 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 282 accggc 6 <210> 283 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 283 ctcgca 6 <210> 284 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 284 acgctc 6 <210> 285 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 285 ctggac 6 <210> 286 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 286 gcccca 6 <210> 287 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 287 accgtc 6 <210> 288 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 288 ccctcg 6 <210> 289 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 289 agcccg 6 <210> 290 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 290 acccga 6 <210> 291 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 291 agcagc 6 <210> 292 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 292 accgcg 6 <210> 293 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 293 cgaggc 6 <210> 294 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 294 agctgc 6 <210> 295 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 295 ggggac 6 <210> 296 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 296 ccgcaa 6 <210> 297 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 297 cgtcgc 6 <210> 298 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 298 cgtgac 6 <210> 299 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 299 cgccca 6 <210> 300 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 300 ctctgc 6 <210> 301 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 301 agcggg 6 <210> 302 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 302 accgct 6 <210> 303 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 303 cccagg 6 <210> 304 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 304 ccctca 6 <210> 305 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 305 ccccca 6 <210> 306 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 306 ggcgaa 6 <210> 307 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 307 cggctc 6 <210> 308 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 308 ctcgcc 6 <210> 309 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 309 cggaga 6 <210> 310 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 310 tcccca 6 <210> 311 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 311 gacacc 6 <210> 312 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 312 ctccga 6 <210> 313 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 313 ctcgtc 6 <210> 314 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 314 cgacca 6 <210> 315 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 315 atgacg 6 <210> 316 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 316 ccatcg 6 <210> 317 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 317 agggga 6 <210> 318 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 318 gctgca 6 <210> 319 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 319 acccca 6 <210> 320 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 320 cggagc 6 <210> 321 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 321 cctccg 6 <210> 322 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 322 cgggac 6 <210> 323 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 323 cctgga 6 <210> 324 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 324 aggcga 6 <210> 325 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 325 acccct 6 <210> 326 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 326 gctccc 6 <210> 327 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 327 cgtcac 6 <210> 328 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 328 agcgca 6 <210> 329 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 329 gaagcc 6 <210> 330 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 330 gaggcc 6 <210> 331 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 331 accctc 6 <210> 332 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 332 cccggc 6 <210> 333 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 333 cgagaa 6 <210> 334 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 334 ccaccg 6 <210> 335 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 335 acttcg 6 <210> 336 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 336 gatgac 6 <210> 337 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 337 acgagg 6 <210> 338 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 338 ccggag 6 <210> 339 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 339 acccac 6 <210> 340 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 340 ctgggc 6 <210> 341 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 341 ccacgg 6 <210> 342 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 342 cggtcc 6 <210> 343 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 343 agcacc 6 <210> 344 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 344 acaccc 6 <210> 345 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 345 agggcc 6 <210> 346 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 346 cgcgaa 6 <210> 347 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 347 gagccc 6 <210> 348 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 348 ctgagc 6 <210> 349 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> oligonucleotide patterns over-represented in STAR elements <400> 349 aatcgg 6 <210> 350 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 350 cccnncgg 8 <210> 351 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 351 ccgnnnnnnc cc 12 <210> 352 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 352 cagcgg 6 <210> 353 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 353 cgcnnnnnnn nnnnnnnncc c 21 <210> 354 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 354 cggnnnnnnn nngcc 15 <210> 355 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 355 cccnnnnnnn nncgc 15 <210> 356 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 356 cccngcg 7 <210> 357 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 357 ccccac 6 <210> 358 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 358 agcnnnnnnn nnnnnnnnnc cg 22 <210> 359 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 359 cccnnnncgc 10 <210> 360 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 360 cgcnnnnnnn nnnnnngga 19 <210> 361 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 361 gcgnnnnnnn nnnnnnnnnc cc 22 <210> 362 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 362 cgcnnnnngc a 11 <210> 363 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 363 cccnnnnnnn nnnnnnnccc 20 <210> 364 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 364 ctgnnnncgc 10 <210> 365 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 365 ccannnnnnn nnnnngcg 18 <210> 366 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 366 cggnnnnnnn nnnncag 17 <210> 367 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 367 cccnnnnngc c 11 <210> 368 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 368 gccccc 6 <210> 369 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 369 cgcnnnngac 10 <210> 370 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 370 cggcag 6 <210> 371 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 371 cccnnncgc 9 <210> 372 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 372 cgcngac 7 <210> 373 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 373 gcgnngcc 8 <210> 374 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 374 cccnnnngcc 10 <210> 375 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 375 cccnccc 7 <210> 376 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 376 ccgnnnnnnn nnnnnncag 19 <210> 377 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 377 gccnnnngga 10 <210> 378 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 378 ccgnnngga 9 <210> 379 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 379 aggnnggg 8 <210> 380 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 380 cacnnnnngc g 11 <210> 381 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 381 cgcnnnnnnn nnnnnnnnnn cca 23 <210> 382 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 382 cccnnnnnnn nnggc 15 <210> 383 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 383 cctnnnnngc g 11 <210> 384 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 384 gcggac 6 <210> 385 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 385 gccggc 6 <210> 386 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 386 gcgnnccc 8 <210> 387 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 387 ccgnnnnnnn nnnnccc 17 <210> 388 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 388 cccnnnnnnn ntcg 14 <210> 389 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 389 ccgnnnnnnn nnnnnnnnnn gcc 23 <210> 390 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 390 gggnnnnngg a 11 <210> 391 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 391 ggcnnnnnng ga 12 <210> 392 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 392 ccannnnccc 10 <210> 393 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 393 cctnnnnnnn nnnnnnnccg 20 <210> 394 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 394 gacnnnnnnn nnnnnggc 18 <210> 395 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 395 cgcnnnnnnn nnnnnnccc 19 <210> 396 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 396 cagnnnnnnn nnnnnnnnnc cc 22 <210> 397 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 397 agcnnnnnnn nnnggg 16 <210> 398 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 398 cggnnnnnnn nnnnnnggc 19 <210> 399 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 399 cggngcc 7 <210> 400 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 400 agcggc 6 <210> 401 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 401 cccnnnnnnn nnnnnnnnng gc 22 <210> 402 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 402 gctnnnnnnn nnnnnnnnnn nnccc 25 <210> 403 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 403 cccnnnnnnn nnnnnnnnng gg 22 <210> 404 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 404 cccnnnnnnn nncgg 15 <210> 405 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 405 cccnnnnnnn nnncgg 16 <210> 406 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 406 ccagcg 6 <210> 407 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 407 gccnnnnnnn nnnnnnnnnn cgc 23 <210> 408 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 408 cctnnnnnnc gc 12 <210> 409 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 409 gganccc 7 <210> 410 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 410 cgcnnnnnnn nnnnnnnnnn ncac 24 <210> 411 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 411 cgcnnnnnnn nnnnnnnnnn nnnccg 26 <210> 412 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 412 ccggca 6 <210> 413 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 413 cgcnnnnnnn nnnnnnnnnn nnnccc 26 <210> 414 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 414 agcnnnnnnn nnnnnnnncc c 21 <210> 415 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 415 cctnnnnnnn ggc 13 <210> 416 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 416 gccnnnnncg c 11 <210> 417 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 417 gccnnnnnnn nnnnnnncgc 20 <210> 418 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 418 cagnnnnnnn nnnnccc 17 <210> 419 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 419 gggnnnnnnn nnnnnnnnng ac 22 <210> 420 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 420 cccnnnnnnn nnnnnnnngc g 21 <210> 421 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 421 ccccgc 6 <210> 422 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 422 cccnnnnnnn nnnnnnnnna gc 22 <210> 423 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 423 aggnnnnnnn nnggg 15 <210> 424 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 424 cgcnnnnnnn nnnnnctc 18 <210> 425 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 425 cacnnnnnnn ncgc 14 <210> 426 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 426 ccannnnnnn ccg 13 <210> 427 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 427 cggngca 7 <210> 428 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 428 cgcnnnnnnn nnnnnnnccc 20 <210> 429 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 429 agcccc 6 <210> 430 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 430 cgcnnnnnnn nnnnnngtc 19 <210> 431 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 431 gcgnnngca 9 <210> 432 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 432 cggggc 6 <210> 433 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 433 gccnnnnnnn nnnnnnnccc 20 <210> 434 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 434 accnnnnnnn cgc 13 <210> 435 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 435 aggnnnnnnn cgg 13 <210> 436 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 436 cccnnnnnnn nnnnnnnnnc ga 22 <210> 437 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 437 cgcnnnnnnc ag 12 <210> 438 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 438 cagnnnnnnn nnnngcg 17 <210> 439 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 439 ccgnnnnnnn nnnnnccg 18 <210> 440 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 440 cgcnnnnnnn nnnnnnnnnn ncag 24 <210> 441 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 441 cagnggg 7 <210> 442 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 442 cgcccc 6 <210> 443 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 443 gcgnnnnnnn nnnnnnnnnn ngcc 24 <210> 444 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 444 cggnnnnnnn nnnnnnnngg c 21 <210> 445 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 445 cccnnnnnnn nnnnnnnnag g 21 <210> 446 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 446 aggnnnnnnn nnnnnnnnnn nnngcg 26 <210> 447 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 447 cggnnnnnct c 11 <210> 448 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 448 tccnnnnnnn nnnnnnnnnn cga 23 <210> 449 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 449 gcgnnnnccc 10 <210> 450 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 450 cccnncgc 8 <210> 451 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 451 cgtnnncag 9 <210> 452 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 452 ccgnnnnnnn nnnnnngag 19 <210> 453 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 453 ctcnnnnnnc gc 12 <210> 454 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 454 cgcnnnngag 10 <210> 455 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 455 gcgnnnnngg a 11 <210> 456 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 456 ccgncag 7 <210> 457 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 457 cgcnnnnnnn nnnnccg 17 <210> 458 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 458 gcgnnnnnnn nnnnnnnnnn nnccc 25 <210> 459 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 459 cgcnnnnnnn nnnnnnnnnn ngaa 24 <210> 460 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 460 gggnnnnnnn nnnnnnnnnn nngga 25 <210> 461 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 461 ccancgg 7 <210> 462 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 462 cccnnnnnnn gcg 13 <210> 463 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 463 aggnnnnnnn nnnccc 16 <210> 464 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 464 ccaggg 6 <210> 465 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 465 cagnnnnnnn nnnccc 16 <210> 466 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 466 ccgnnnnnnn nnnnnnnnnn nccg 24 <210> 467 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 467 ccgnnnnnnn nnnnnnnnnn nggc 24 <210> 468 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 468 cccnngcg 8 <210> 469 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 469 cgcnggc 7 <210> 470 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 470 ccgnnnnnga c 11 <210> 471 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 471 ggaccc 6 <210> 472 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 472 cccnccg 7 <210> 473 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 473 cccnnnnnnn nnnnnnnnac g 21 <210> 474 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 474 agcnnnnnnn nccc 14 <210> 475 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 475 cccnnnggc 9 <210> 476 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 476 aggnnnnnnn nncgg 15 <210> 477 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 477 cccnnnnnnn nnnnnnncgc 20 <210> 478 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 478 ccgccg 6 <210> 479 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 479 cgcnnnnnnn nagc 14 <210> 480 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 480 cgcnnnnnnn nnnnnnnnnn nnacc 25 <210> 481 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 481 gcgnnnnnnn nnnnnnnnnn gac 23 <210> 482 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 482 agcngcg 7 <210> 483 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 483 ccgnnnnnnn nnnnggc 17 <210> 484 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 484 cggnnnnaga 10 <210> 485 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 485 cgcnnnnnnn nnnnnnnccg 20 <210> 486 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 486 cctnnnnnnn nnnnnnnnnn nnngcg 26 <210> 487 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 487 ccannnnnnn nnncgc 16 <210> 488 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 488 cccnnnnnnn nnnnnnnnnn nnncac 26 <210> 489 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 489 ccgnnnnnnn nnnngcc 17 <210> 490 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 490 cgcnnnnnnn nnnnnnnnnn nccc 24 <210> 491 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 491 cggnnnnnnn nnnnnnnncg c 21 <210> 492 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 492 cgcnnnnnnn nnnnnnnnng cc 22 <210> 493 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 493 cgcnnnnnnn nnnnnnnnnn nnnggc 26 <210> 494 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 494 cgcnnnnnnn nnnnnnnnnn nnccg 25 <210> 495 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 495 cggnnnnnnn nnncca 16 <210> 496 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 496 cgcnnnnnnn nnnnnnnnnn ccc 23 <210> 497 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 497 cgcnnnnnnn nnnnaca 17 <210> 498 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 498 cggacc 6 <210> 499 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 499 gcgnnnnnnn nnngcc 16 <210> 500 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 500 gcgnnnnnnn ngac 14 <210> 501 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 501 cccnnnnnnn nnnnnnnngg g 21 <210> 502 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (1)..(19) <223> "N" stands for any nucleic acid <400> 502 cggnnnnnnn nnnnnnnnng gc 22 <210> 503 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 503 cgcnnnnnnn nnnnnnnnnc ca 22 <210> 504 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 504 gccnnnccc 9 <210> 505 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 505 cagnnnnggg 10 <210> 506 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 506 cccnnnnnng cg 12 <210> 507 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 507 ccgnnnnnnn nnnnnnnnnc gc 22 <210> 508 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 508 cccnnnnnnn nnnnnnnnnn gca 23 <210> 509 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 509 cgcnnnnnnn nnnnnntcc 19 <210> 510 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 510 gccncgc 7 <210> 511 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 511 ccgnnnnnnn nnnnnnnnnn nngag 25 <210> 512 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 512 gggnnnnnnn nnngga 16 <210> 513 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 513 cagnnnnncc g 11 <210> 514 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 514 cgcnnnaga 9 <210> 515 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 515 gccgcc 6 <210> 516 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 516 cccnnnnnnn nggc 14 <210> 517 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 517 cctnnnnnng cg 12 <210> 518 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 518 gacnnnnnnc cc 12 <210> 519 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 519 cggnccc 7 <210> 520 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 520 cccnnnnnnn nnnnnnnncc g 21 <210> 521 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 521 cagnnnnnnn nnccc 15 <210> 522 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 522 cggnnnnnnn nnnggc 16 <210> 523 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 523 cgannnnnnn nnnacg 16 <210> 524 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 524 gcgnnntcc 9 <210> 525 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 525 cccnnngcc 9 <210> 526 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 526 gcgnacc 7 <210> 527 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 527 ccgnnnnnnn nnagg 15 <210> 528 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 528 cgcnnnnnnn nnnnnnnnnc ag 22 <210> 529 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 529 ggcccc 6 <210> 530 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 530 aggnnnnnnn nnnnnccg 18 <210> 531 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 531 ccggcg 6 <210> 532 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 532 ccgnngcc 8 <210> 533 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 533 ccgnnnnnnn nnnngtc 17 <210> 534 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 534 cagccc 6 <210> 535 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 535 cccnnnnncc g 11 <210> 536 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 536 gccnnnnnnn nnnnnnnnnn nnnccc 26 <210> 537 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 537 gacnncgc 8 <210> 538 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 538 cgcnnnnnnc ac 12 <210> 539 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 539 aggnnnnnnn nnnnnnngcg 20 <210> 540 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 540 gacnnnnncg c 11 <210> 541 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 541 cctnnnnnnn nnnnnnnnnn nnccg 25 <210> 542 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 542 ccgnnnnnnn nnnnngga 18 <210> 543 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 543 ggcnnnnnnn nngac 15 <210> 544 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 544 aggnnnnnnn nnnggg 16 <210> 545 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 545 ccgnnnnnnn nnngag 16 <210> 546 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 546 cgcnnnnnng ga 12 <210> 547 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 547 cgcnnnnnnn agc 13 <210> 548 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 548 ccannnnnnn nnnnnncgg 19 <210> 549 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 549 cggnnnnnng ga 12 <210> 550 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 550 cgcnnnnnnn nnnnnnnnnn nngcc 25 <210> 551 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 551 ccannnnnnn nnnnncgc 18 <210> 552 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 552 cggnggc 7 <210> 553 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 553 gcgnnncca 9 <210> 554 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 554 aggncgc 7 <210> 555 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 555 ctcnnnnncg c 11 <210> 556 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 556 cccacg 6 <210> 557 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 557 cagnnnnnnn nnnnnnnnnn ccg 23 <210> 558 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 558 ggcnnnnccc 10 <210> 559 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 559 aggnnnnnnn ngcg 14 <210> 560 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 560 ctgnccc 7 <210> 561 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 561 cccnnnnnnn nnnnnnnnnc ag 22 <210> 562 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 562 cgcnnnnnnn nngac 15 <210> 563 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 563 cagnnnnnnc cg 12 <210> 564 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 564 cgtnnnnnnn nnnnncgc 18 <210> 565 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 565 ctcnnnnnnn gcc 13 <210> 566 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 566 cgcnnnnnnn nnnnnnnnnn nntcc 25 <210> 567 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 567 cccnnnnnnn gcc 13 <210> 568 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 568 cagnnnnnnn nnnnnncgg 19 <210> 569 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 569 cgcngcc 7 <210> 570 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 570 cgcnnnnnnn nnnnnnnnnn ccg 23 <210> 571 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 571 aggnnnnccc 10 <210> 572 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 572 agcnnnnnnn nnncgc 16 <210> 573 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 573 cccnnnnnnn nnnncgg 17 <210> 574 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 574 cccnnnnnnn ngcc 14 <210> 575 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 575 ccgncgg 7 <210> 576 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 576 cccnacc 7 <210> 577 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 577 cgccag 6 <210> 578 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 578 ccgnnnnnnn nnnnnnnnnn nntgc 25 <210> 579 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 579 gcgnnnncga 10 <210> 580 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 580 ccgnnnnnnn nnnnnnnnnn nngcc 25 <210> 581 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 581 ccannnnnnn nnnccc 16 <210> 582 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 582 cagnnnnnnn nnnnnnggg 19 <210> 583 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 583 agcnnnnnnn nnnnnnnnnn ncgg 24 <210> 584 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 584 cgannnnnnn ncgc 14 <210> 585 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 585 agcnnnnccc 10 <210> 586 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 586 ggannnnnnc cc 12 <210> 587 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 587 cggnnnnnnn nnnnnnaag 19 <210> 588 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 588 accnnnnnnn nnnncgc 17 <210> 589 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 589 ccgnnnnnnn nnnnncag 18 <210> 590 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 590 cccnnnnnnn nnnnnggg 18 <210> 591 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 591 cacnnnnnnn nnnnnnnnnn acg 23 <210> 592 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 592 cagnnnnnnn nnnnnnnnnn nccc 24 <210> 593 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 593 cgtnnnnnnn nnngtc 16 <210> 594 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 594 cccnnnnnnn nnnnnngcg 19 <210> 595 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 595 gcancgc 7 <210> 596 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 596 agannnnccg 10 <210> 597 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 597 gcgnnnnnnn nnnagc 16 <210> 598 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 598 cgcgga 6 <210> 599 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 599 cggnnnngac 10 <210> 600 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 600 cccnnnnnnn nnnnncgc 18 <210> 601 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 601 gccnnnnnnn nnnnnnnncc c 21 <210> 602 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 602 gcgnnnnnnt cc 12 <210> 603 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 603 cggnnncag 9 <210> 604 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 604 cccnnncca 9 <210> 605 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 605 agcnnnccc 9 <210> 606 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 606 gggnnnnnnn nnnnnnnnng ca 22 <210> 607 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 607 aggnnnnnnn nccg 14 <210> 608 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 608 cccccg 6 <210> 609 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 609 gcgnnnnnga c 11 <210> 610 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 610 cccnnnnnnn nnacc 15 <210> 611 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 611 ctgnnnnncg c 11 <210> 612 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 612 cgcnnnnnnn nnnnnnnctc 20 <210> 613 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 613 cggnnnnnnn nnnnnnngca 20 <210> 614 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 614 ccgnnnnnnn ngcc 14 <210> 615 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 615 ccgnnnnnnn cac 13 <210> 616 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 616 agcnnnnnnn ngcg 14 <210> 617 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 617 cggnnnnnnn nnnnnnnnng ga 22 <210> 618 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 618 ccannnnnnn nnnnnccg 18 <210> 619 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 619 cggnnccc 8 <210> 620 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 620 ccannnnnnn nnnnnnggg 19 <210> 621 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 621 cggnnnnnnn nnnnnnnngc a 21 <210> 622 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 622 cgcnnnnnnn nngca 15 <210> 623 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 623 cggnnnnnnn nnnnnnnnnn nncca 25 <210> 624 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 624 gggnnnnnnn nnnnnnnncg a 21 <210> 625 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 625 cccnnnnnnn nnncgc 16 <210> 626 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 626 ctcnnnnnnn nnnnnnncgc 20 <210> 627 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 627 cacnnnnnnn nnnngcg 17 <210> 628 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 628 ccgnnggc 8 <210> 629 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 629 ctgnnnnnnn nnnnnnnnnn nccc 24 <210> 630 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 630 gggnnnnnnn nnnnnncac 19 <210> 631 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 631 cctnnnnnnn nnnnnnnngg c 21 <210> 632 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 632 cccnnnnnnn nnnnnnnnnn nnncga 26 <210> 633 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 633 cccnnnnnnn ncga 14 <210> 634 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 634 gagnnnnnnn ccc 13 <210> 635 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 635 cgcnnccg 8 <210> 636 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 636 ccctcc 6 <210> 637 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 637 agcgcc 6 <210> 638 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 638 cccnntcc 8 <210> 639 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 639 ccgnnnnncc c 11 <210> 640 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 640 cgcnnnnnnn nnnnnncgc 19 <210> 641 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 641 cccncgc 7 <210> 642 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 642 gccnnnnnnn nnnnnnnnng ca 22 <210> 643 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 643 cccnnnnnnn nnnnnnnnnc ca 22 <210> 644 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 644 ccgnnnnnnn nnnnnncgc 19 <210> 645 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 645 ccgnnnnnnn nnnnnnnnnn cag 23 <210> 646 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 646 cggnnnnnnn nnnnnnnnnn nggc 24 <210> 647 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 647 ccgnnnnnnn nnnnnnnagg 20 <210> 648 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 648 cccnnnnncg g 11 <210> 649 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 649 cccnnnnnng ga 12 <210> 650 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 650 acgnnccc 8 <210> 651 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 651 ccannnnnnn nnccg 15 <210> 652 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 652 cccnnnnnnn nnnnnnnnnn nncca 25 <210> 653 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 653 cagggg 6 <210> 654 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 654 agcnccc 7 <210> 655 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 655 gcgnnnnnnn tcc 13 <210> 656 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 656 acgnnnnnnn nnnnnnnnnn ncca 24 <210> 657 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 657 gctnnnnnnn nnnnnnnccc 20 <210> 658 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 658 gcgnnnnnnn nnnnnnnccc 20 <210> 659 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 659 gcgnnnnnnn nnnnnnnnnn nnagc 25 <210> 660 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 660 ccgnnnnnnn ncag 14 <210> 661 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 661 gcgnnnnnng cc 12 <210> 662 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 662 gcgnnnnnnn nnngca 16 <210> 663 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 663 cctnnnnnnn gcc 13 <210> 664 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 664 gccnnnnnnn nnnnnngcc 19 <210> 665 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 665 cccnnnnnnn nnnnnnngcc 20 <210> 666 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 666 cccnnnnnnn nnnnnnnncg g 21 <210> 667 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 667 ccannnnnnn nnnnnncgc 19 <210> 668 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 668 agcnnnnnnn nnnnggg 17 <210> 669 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 669 ggagcc 6 <210> 670 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 670 gccnnntcc 9 <210> 671 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 671 cctnnnnngc c 11 <210> 672 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 672 cggnnnnnnn nnnnnnnnnn nccc 24 <210> 673 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 673 cctnnnggc 9 <210> 674 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 674 ccgctc 6 <210> 675 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (1)..(20) <223> "N" stands for any nucleic acid <400> 675 agcnnnnnnn nnnnnnnnnn gcg 23 <210> 676 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 676 acgnnnnnnn nnnnnnnggg 20 <210> 677 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 677 cgannnnnnn nnnnnggc 18 <210> 678 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 678 cccnnnnnnn nnnnnnnnnn nnncgc 26 <210> 679 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 679 acgnnnnnnn nnnnnctg 18 <210> 680 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 680 ccgccc 6 <210> 681 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 681 ccgnnnnnnn nnngga 16 <210> 682 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 682 cccnnngcg 9 <210> 683 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 683 gcgnnnnnnn nnnnnnncgc 20 <210> 684 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 684 ccgnnnnnnn ncgc 14 <210> 685 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 685 cgcnnnnnnn nnnaca 16 <210> 686 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 686 cccnnnnnnn nnnnnnnnnn nnccg 25 <210> 687 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 687 cacnnnnnnn nnnnnnncgc 20 <210> 688 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 688 gacnnnggc 9 <210> 689 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 689 gaannnnnnn cgc 13 <210> 690 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 690 cgcnnnnnnn nnnnnnnnng gc 22 <210> 691 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 691 ggcnnnnnnn nnccc 15 <210> 692 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 692 cccnnnnnnn nngcc 15 <210> 693 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 693 cgctgc 6 <210> 694 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 694 cctnnnnnnn nggc 14 <210> 695 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 695 ccannnnnnn nccc 14 <210> 696 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 696 gacnnccc 8 <210> 697 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 697 ggcnccc 7 <210> 698 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 698 cgcagc 6 <210> 699 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 699 aggnnnngcg 10 <210> 700 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 700 cggnnnnnnt cc 12 <210> 701 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 701 acgnnnnnnn nnnnnnnnnn nnggc 25 <210> 702 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 702 cccnnnnnnn nacg 14 <210> 703 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 703 cccnnnnnnn nnnnnnnnnn ngcc 24 <210> 704 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 704 gccnncga 8 <210> 705 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 705 cccnnnnnnn ngcg 14 <210> 706 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 706 cccctc 6 <210> 707 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 707 gccnnnnnnn nnnncgc 17 <210> 708 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 708 agcnnnnnnn nnccc 15 <210> 709 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 709 gctgcc 6 <210> 710 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 710 cgcnnnccc 9 <210> 711 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 711 cccnnccc 8 <210> 712 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 712 gccnnnnnnn nncgc 15 <210> 713 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 713 gcannnnnnn nnnnnnnnnn nncgc 25 <210> 714 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 714 cagnnnncgg 10 <210> 715 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 715 cagnnggg 8 <210> 716 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 716 gccnnnnnnn nnnnnnnnnc cc 22 <210> 717 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 717 gagnnnnncc c 11 <210> 718 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 718 cctnnnnnnn nnnnnnnnnt cg 22 <210> 719 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 719 cccnnnggc 9 <210> 720 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 720 gcgnnnnnnn nnnnnngga 19 <210> 721 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 721 gccnnnnnnn nnnnnnnnnn ggc 23 <210> 722 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 722 cccnnnnnnn nnnnnnnggc 20 <210> 723 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 723 aggnnnccg 9 <210> 724 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 724 caccgc 6 <210> 725 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 725 cggnnnnnnn nnnnnnnnnn ncag 24 <210> 726 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 726 agcngcc 7 <210> 727 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 727 cgcnnnnnnn nnnnnnnnnn nggc 24 <210> 728 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 728 cccnnnnnag g 11 <210> 729 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 729 aacgcg 6 <210> 730 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 730 cccnnnnnnn nnncca 16 <210> 731 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 731 cgcnnnnnnn nnnnnngag 19 <210> 732 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 732 cgcnnnnnnn gcc 13 <210> 733 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 733 cccnnnnnnn nnccg 15 <210> 734 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 734 cgcnnnnnnn nnnnnnnnnc cc 22 <210> 735 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 735 gaannnnnnn nnnnnncgc 19 <210> 736 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 736 ggcnnnccc 9 <210> 737 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 737 tccnnnnnnn nnnncca 17 <210> 738 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 738 cacccc 6 <210> 739 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 739 cgcnnnnnnn nnnnnnnnnc cg 22 <210> 740 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 740 cggnnnnnnn nnnnnnnnag c 21 <210> 741 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 741 cccnnnnnnn nnnnngcg 18 <210> 742 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 742 cccnnnnnnn nngag 15 <210> 743 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 743 ccgnnnnnnn nnnnnnnnnn nnntcc 26 <210> 744 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 744 cgccgc 6 <210> 745 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 745 atgnnnnnnn cgg 13 <210> 746 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 746 gggnnnnnnn nnnnnnnnnn nnngca 26 <210> 747 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 747 cggnnnnggc 10 <210> 748 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 748 cggnnnnnnn nnnnnnnnna gc 22 <210> 749 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 749 cggnnnnngg c 11 <210> 750 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 750 gcggga 6 <210> 751 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 751 ggcnnnnnnn nnnnnnnnnn nnncac 26 <210> 752 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 752 cccnnnnnnn nnccc 15 <210> 753 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 753 accnnnnnnn nnnnnnnnnn ggc 23 <210> 754 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 754 cccnnnnnnc ga 12 <210> 755 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 755 aagnnnnnnn nnncgg 16 <210> 756 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 756 cgcnnnnnnn nnnnnnnnnn cac 23 <210> 757 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 757 cccnnnnnnn nnnnnnnnnc gg 22 <210> 758 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 758 gacnnnnnnn nnnnnnnnnn nggc 24 <210> 759 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 759 gggnnnnnnn nnnnnnnnga c 21 <210> 760 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 760 gccnnnntcc 10 <210> 761 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 761 ggcnnnnnnn nnnnnnnncc c 21 <210> 762 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 762 cagnnnnnnn nnnnncgc 18 <210> 763 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 763 ccannngcg 9 <210> 764 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 764 ccgnnnnnnn nnnnnnnnng ag 22 <210> 765 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 765 agcnncgc 8 <210> 766 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 766 gagnnnnccc 10 <210> 767 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 767 aggnnncgc 9 <210> 768 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 768 cacnnnnnnn nnnnnnagg 19 <210> 769 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 769 cccnnnncag 10 <210> 770 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 770 cccnngaa 8 <210> 771 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 771 cgcnnnnnnn nnnnnnnnnn nngag 25 <210> 772 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 772 acgnnnnnnn nnnnnnnnnn nggg 24 <210> 773 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 773 cccnnnnggc 10 <210> 774 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 774 cggnnnnnnn nngag 15 <210> 775 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 775 cccnnnggg 9 <210> 776 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 776 gagnnnnggc 10 <210> 777 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 777 cgcnnnnnga g 11 <210> 778 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 778 ccgnnnnnnn nnnnnnnnnn nnnagg 26 <210> 779 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 779 cccnnnnnnn nnnnnnnncc c 21 <210> 780 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 780 aggnnnnnnn nnnnnnnnnn ccg 23 <210> 781 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 781 aggnnnnnng gg 12 <210> 782 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 782 ggcnnnnnnn nnnnnnnnnn nnnccc 26 <210> 783 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 783 gcannnnnnn nnnnnnnnnn cgc 23 <210> 784 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 784 cgannnnnnn nnnnacg 17 <210> 785 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 785 cgcnngga 8 <210> 786 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 786 ctgnnnnncc c 11 <210> 787 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 787 tccnnnnnnn nnnnnnnnnn nnncca 26 <210> 788 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 788 ccannggg 8 <210> 789 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 789 ccgnnnnnnn nnnnnnnngc g 21 <210> 790 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 790 ccannnnngg g 11 <210> 791 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 791 cggntgc 7 <210> 792 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 792 cccnnnnnnn nnnnnnngcg 20 <210> 793 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 793 cagccg 6 <210> 794 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 794 gccnnnnnnn nntcc 15 <210> 795 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 795 aggnnnnnnn nnnnnnnnnn nnncgc 26 <210> 796 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 796 cccnnnnnng ac 12 <210> 797 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 797 cggnnnnnnn nnnncca 17 <210> 798 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 798 gggnnnnnnn nnnnnnncac 20 <210> 799 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 799 gcannnnnnn nnnnnnnncg c 21 <210> 800 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 800 cgcnnaca 8 <210> 801 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 801 accnnnnnnn nnccc 15 <210> 802 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 802 gcgnnnnnnn nncgc 15 <210> 803 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 803 cagnnnnnnn nnnnnnnngc g 21 <210> 804 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 804 cccnnnnnnn nnnnnnnnnn ngtc 24 <210> 805 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 805 gcgnnnccc 9 <210> 806 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 806 cggnnnnnnn nnnngcc 17 <210> 807 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 807 cccncgg 7 <210> 808 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 808 gccnnnncca 10 <210> 809 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 809 cccnnnnccg 10 <210> 810 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 810 cgtnngca 8 <210> 811 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 811 agcnnnnnnn tcg 13 <210> 812 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 812 ccgnnnnnnn nnnnnnnnga a 21 <210> 813 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 813 accnnnnncc c 11 <210> 814 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 814 cgcnnnnnnn nnnnnnngag 20 <210> 815 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 815 cccnnnnnnn cgc 13 <210> 816 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 816 gagnnnnnnn nnnnncgc 18 <210> 817 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 817 ggcnnnnnnn nnnnnnnnnn ccc 23 <210> 818 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 818 acgnnnnnnn nnnnctc 17 <210> 819 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 819 acannnnnnn nncgg 15 <210> 820 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 820 ctgnnnnnnn ccc 13 <210> 821 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 821 cccnngcc 8 <210> 822 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 822 cggnngca 8 <210> 823 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 823 ccctgc 6 <210> 824 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 824 cgcnnnnnnn acc 13 <210> 825 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 825 gcanngcc 8 <210> 826 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 826 gcgnnnnnnn ncca 14 <210> 827 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 827 agccgc 6 <210> 828 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 828 gcgnngca 8 <210> 829 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 829 ccgnngtc 8 <210> 830 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 830 ccgnnnaca 9 <210> 831 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 831 acgnnnnnnn nnnnnntgg 19 <210> 832 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 832 ccannnnnnn ncgc 14 <210> 833 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 833 ccgnnnnnnn nnggc 15 <210> 834 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 834 ccannnnncc g 11 <210> 835 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 835 aggnnnggg 9 <210> 836 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 836 cagnnggc 8 <210> 837 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 837 cccnnnnnnn ncag 14 <210> 838 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 838 agcnnnnnca g 11 <210> 839 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 839 cggnnnnnnn nnnnnnnnng cc 22 <210> 840 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 840 gcgnnnnnnn nnnnnnnncc c 21 <210> 841 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 841 cccnnnnnnn nnnngcc 17 <210> 842 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 842 cgannacg 8 <210> 843 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 843 cggnnnngcc 10 <210> 844 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 844 cacnnnnnnc gc 12 <210> 845 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 845 cggnnnnnac g 11 <210> 846 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 846 ctgnnnngcc 10 <210> 847 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 847 gggnnnnnnn nnnnnnnnnn ncga 24 <210> 848 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 848 cctnnnnnnn ncgc 14 <210> 849 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 849 gccnnnnccc 10 <210> 850 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 850 cggnnnnnnn nnngcc 16 <210> 851 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 851 gccnnnnngg a 11 <210> 852 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 852 accnnnnnnn gcg 13 <210> 853 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 853 cccnnnnnnn ncgc 14 <210> 854 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 854 cagnnnnncc c 11 <210> 855 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 855 cacnnnnnnn nnnnnnngga 20 <210> 856 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 856 cccngcc 7 <210> 857 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 857 cccnnnnnag c 11 <210> 858 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 858 ggcnnnnngg a 11 <210> 859 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 859 cgannnnnnn nnnnnnnnnn gag 23 <210> 860 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 860 cgcnnnnnnn aca 13 <210> 861 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 861 ccannnnnnn nnnnnnccc 19 <210> 862 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 862 cggnnnnnnn nnnnnnnnnn nnnggc 26 <210> 863 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 863 cccnnnnnnn nnnnnnnnnn gcc 23 <210> 864 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 864 cctnnnnnnn nnnccg 16 <210> 865 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 865 cccnnnnnnn nccg 14 <210> 866 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 866 cgcnnngag 9 <210> 867 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 867 cgcnnnnnnn aag 13 <210> 868 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 868 cggnnnnnnn nnnngga 17 <210> 869 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 869 ccgnnnnnnn nnnnnnnncc g 21 <210> 870 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 870 cccnnngca 9 <210> 871 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 871 cggnncag 8 <210> 872 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 872 aggnnccg 8 <210> 873 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 873 cccnnnncac 10 <210> 874 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 874 ggannnnnnn nnnnnnnnnn nnccc 25 <210> 875 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 875 cccnnnnnnn ncac 14 <210> 876 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 876 accnnnnnnc cg 12 <210> 877 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 877 cccnnnnnng gc 12 <210> 878 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 878 cccnnnnnnc cg 12 <210> 879 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 879 cgcnnnnnnn nnnnnnngcc 20 <210> 880 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 880 ccgnnnnntc c 11 <210> 881 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 881 gccnnnnnng cc 12 <210> 882 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 882 cggnnnnnnn gga 13 <210> 883 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 883 gggnnnnnng ga 12 <210> 884 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 884 gccnnnnnnn nnnnntcc 18 <210> 885 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 885 agtnnnnnnn nnnnnnnnnc cg 22 <210> 886 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 886 ggcnnnnnnn nnnnnnnnnn nngcc 25 <210> 887 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 887 ccgnnnccg 9 <210> 888 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 888 cccnnnnnnn nacc 14 <210> 889 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 889 cagnnnnnnn nnnnnnnngc c 21 <210> 890 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 890 cccnnnnnnn nnnnnnnnnn cgg 23 <210> 891 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 891 gcgncca 7 <210> 892 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 892 cccnnnnnnn nnnnnnncag 20 <210> 893 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 893 cccnnnnnnn nccc 14 <210> 894 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 894 acannnnnnn nnnnngcg 18 <210> 895 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 895 aggnnnnccg 10 <210> 896 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 896 cgcnnnnnnn nnnnnngcc 19 <210> 897 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 897 gagnncgc 8 <210> 898 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 898 cccnnnnnnn nngcg 15 <210> 899 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 899 cgcnnnnnnn nnnnnnnnnn aca 23 <210> 900 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 900 gcgnnnnnnn nnnnnnnnnn cca 23 <210> 901 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 901 aagnnnnnnn nnnnnnnnnn nccg 24 <210> 902 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 902 cgcngga 7 <210> 903 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 903 ccanccc 7 <210> 904 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 904 cgtnnnnnnn nnnnnnnnnn ntgc 24 <210> 905 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 905 tccnnnnnnn nnnnnnncga 20 <210> 906 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 906 cacnnnnngg g 11 <210> 907 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 907 ccgnnnnnnn nnnnngca 18 <210> 908 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 908 ctgnnnnnnc cc 12 <210> 909 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 909 cggnnnnnnn nggc 14 <210> 910 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 910 ccannnnnnn nnnnggg 17 <210> 911 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 911 acgnnnnnnn nnnnnnnnnn nncaa 25 <210> 912 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 912 gggnnnnnnn nnnnnnnnnn nnnccc 26 <210> 913 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 913 cgcnnnncag 10 <210> 914 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 914 agcnnnnnnn nnnnnnnnnn ggg 23 <210> 915 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 915 cacnnnnnnn nnnnnnnnnn nnnccg 26 <210> 916 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 916 acgnnnnnnn nnnnnnnnnn cag 23 <210> 917 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 917 aggnccc 7 <210> 918 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 918 cgtnnnnnnn nnnnncac 18 <210> 919 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 919 cggnnnnnnn nnggc 15 <210> 920 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 920 cgcnnnnnnn nnngcg 16 <210> 921 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 921 cccnnnnnnc tc 12 <210> 922 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 922 ccgnnnnnnn nnnagg 16 <210> 923 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 923 cccnnnnnnn nnnnnnnnnn ncag 24 <210> 924 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 924 agcnnnnnnn nnnnnnnnnn ccg 23 <210> 925 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 925 agcnnnnnnn nngcg 15 <210> 926 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 926 ccannnggc 9 <210> 927 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 927 cccnnnnnnn nnnnggc 17 <210> 928 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 928 acgnnnnngc a 11 <210> 929 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 929 cccnnnnnnn nnnnnnncgg 20 <210> 930 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 930 cccnnnnncc a 11 <210> 931 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 931 ccgnagg 7 <210> 932 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 932 gggnnnnnnn nnngac 16 <210> 933 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 933 cgcnnnnnnn nnnnnnnncc a 21 <210> 934 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 934 cctnnnnnnn nnnnnnnnnn nncgc 25 <210> 935 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 935 cgtnnncgc 9 <210> 936 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 936 agcnnnnnnn nnnnnnnccg 20 <210> 937 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 937 ggcnncga 8 <210> 938 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 938 cagnnnnnnn nccc 14 <210> 939 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 939 ccgnngac 8 <210> 940 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 940 agcnnnnnnn nnnnnnnnnn nnagg 25 <210> 941 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 941 cctnnnnggc 10 <210> 942 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 942 ccgnnnnnnn nnnnagc 17 <210> 943 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 943 cacnnnncgc 10 <210> 944 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 944 ccgnccc 7 <210> 945 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 945 ctgnnnnnnn nnnnnnggc 19 <210> 946 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 946 cgcnnnnnnn nnnnnnnnna cc 22 <210> 947 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 947 cacnnnnnnn nnnnnnnnnn ncag 24 <210> 948 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 948 ggcnnnnnnn ngcc 14 <210> 949 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 949 gggnnnnnnn nnnnnnnngg a 21 <210> 950 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 950 ccgnnnnnnn nnnnnnnnng cc 22 <210> 951 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 951 ccgnnnnnnn nnnnnnnnnn nnnacc 26 <210> 952 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 952 cgannnnnnn ccc 13 <210> 953 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 953 ccgnnnnnnc tc 12 <210> 954 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 954 cggnnnnnnn nnnctc 16 <210> 955 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 955 cagnnnnnnn nnnnnnnnnc gc 22 <210> 956 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 956 ccannnagg 9 <210> 957 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 957 gccnnnnnnn nnnnnnnnnn ngcc 24 <210> 958 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 958 cgcnnnnnnn nnnnnnnnnn ngga 24 <210> 959 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 959 ccgnnnnnnn nnnnnnnnnn nnnggc 26 <210> 960 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 960 acannnnnnn nnngcg 16 <210> 961 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 961 cggnnnnncc c 11 <210> 962 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 962 cccnnnnnnn tcc 13 <210> 963 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 963 acgnnnnnnn nnncgc 16 <210> 964 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 964 cccnnntcc 9 <210> 965 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 965 ccgnnnnnnn ncgg 14 <210> 966 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 966 ccannnnnnn nnnnnnnncg g 21 <210> 967 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 967 ccgnnnnnnc cg 12 <210> 968 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 968 cagnnngcg 9 <210> 969 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 969 gagnccc 7 <210> 970 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 970 ccgnnnnnnn nnnnnnnnnn ntgc 24 <210> 971 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 971 cccnnnnnnn cca 13 <210> 972 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 972 cggnnncca 9 <210> 973 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 973 acgnccc 7 <210> 974 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 974 cggnnnnnnn nnnnnntga 19 <210> 975 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 975 ctcnnnnnng gc 12 <210> 976 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 976 gcgnngac 8 <210> 977 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 977 gggnnnnnnn nnnnacc 17 <210> 978 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 978 cgcnnnngga 10 <210> 979 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 979 cccnnnnnnn nnnnccg 17 <210> 980 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 980 ccgnnnnnnn nnnnnnnnnn nngca 25 <210> 981 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 981 gcggca 6 <210> 982 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 982 agannnnnnn ccc 13 <210> 983 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 983 cggnncca 8 <210> 984 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 984 cccnnnnnnc cc 12 <210> 985 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 985 accnnnngcg 10 <210> 986 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 986 cctnnnnnnn nnnnnnnncg c 21 <210> 987 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 987 agcnnnnnnn nngtc 15 <210> 988 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 988 cccnnnnnnn nnnnnnnnnn nctc 24 <210> 989 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 989 cgcnnnnnnn nnnnnnnnnn ncga 24 <210> 990 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 990 cccnnnnnnn nnnnnnnngc c 21 <210> 991 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 991 accnnnnnnn nnnnggc 17 <210> 992 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 992 aggnnnnnnn nnnnnnnncg c 21 <210> 993 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 993 gcgcca 6 <210> 994 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 994 gcgnnnnnnn nnagc 15 <210> 995 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 995 gggnnnnnnn nnnnnnnnnn ngca 24 <210> 996 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 996 cccnnnnnnn nnnnnnnnnn cag 23 <210> 997 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 997 ccannnnnnn ncgg 14 <210> 998 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 998 ccgnnnnnnn nnnggc 16 <210> 999 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 999 gcagcc 6 <210> 1000 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(5) <223> "N" stands for any nucleic acid <400> 1000 cagnncgc 8 <210> 1001 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 1001 cgcnnnnnnn nggc 14 <210> 1002 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 1002 ctgnnnnnnn nnnnnnnnnn ggc 23 <210> 1003 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 1003 gggnnnnnnn nnnnnnnacc 20 <210> 1004 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 1004 ccgntgc 7 <210> 1005 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 1005 cagnnnnnnn ncgc 14 <210> 1006 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 1006 aagnnnnnnn nnnncgc 17 <210> 1007 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 1007 ccgnnnnnnt cc 12 <210> 1008 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 1008 ccannnnnnn nnnnnnnnnn nccc 24 <210> 1009 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 1009 ccaccc 6 <210> 1010 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 1010 gagnnnnnnc cc 12 <210> 1011 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 1011 agcnnnnnnn nnnnnnnnnn nnnggc 26 <210> 1012 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 1012 cagcgc 6 <210> 1013 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 1013 ccgnnnnnnn nnnnnctc 18 <210> 1014 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 1014 cgcnnnnnnn nnnnnnnnac g 21 <210> 1015 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 1015 ggcnnnnnnn nnnnnnnnnn cga 23 <210> 1016 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 1016 ccgnnnnnnn nnnnnnnnna ag 22 <210> 1017 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 1017 cgcnnnnnnn nnnnnnntcc 20 <210> 1018 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 1018 aggnnnnnnn cgc 13 <210> 1019 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 1019 cggnnnnnnn ccc 13 <210> 1020 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 1020 cgcnnnngcc 10 <210> 1021 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 1021 cgannnnnnc cc 12 <210> 1022 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 1022 cccnnnnnnn nnnnnnnnnn nngga 25 <210> 1023 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 1023 cccnnnnnnn nnnnnnnnng cg 22 <210> 1024 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 1024 ccannnnnnn cgc 13 <210> 1025 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 1025 cccnnnnnng cc 12 <210> 1026 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 1026 gccnnnnnnn nnnnnnntcc 20 <210> 1027 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 1027 aggnnnnnnn nnnnnnngcc 20 <210> 1028 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 1028 cgcnnnnnnn nnnngcc 17 <210> 1029 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 1029 tccgca 6 <210> 1030 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 1030 gcgnnnnnnn nccc 14 <210> 1031 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 1031 ccannnnnnn nnnngcg 17 <210> 1032 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 1032 cacnnnnggg 10 <210> 1033 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 1033 cggnnnnnnn tcc 13 <210> 1034 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 1034 gcgnnnnngc c 11 <210> 1035 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(15) <223> "N" stands for any nucleic acid <400> 1035 acgnnnnnnn nnnnncag 18 <210> 1036 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 1036 ccgnnnnnnn nnnnnnnnnn nncgc 25 <210> 1037 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(11) <223> "N" stands for any nucleic acid <400> 1037 cggnnnnnnn ntgc 14 <210> 1038 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 1038 cccngag 7 <210> 1039 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 1039 gcgnnnnnnn nnnnnnnnnn nntga 25 <210> 1040 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(18) <223> "N" stands for any nucleic acid <400> 1040 ggcnnnnnnn nnnnnnnngc c 21 <210> 1041 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 1041 ccgnnnnnnn ccc 13 <210> 1042 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 1042 acannnnnnn nnnnnnnnnn nnccc 25 <210> 1043 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 1043 accnnnnnnn nnnnnnnnng gg 22 <210> 1044 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 1044 aganggc 7 <210> 1045 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 1045 gggnnnnnnn nnnnnnnnnn tga 23 <210> 1046 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 1046 cagnnnnngg g 11 <210> 1047 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 1047 gccnnnnnnn nnnnnncgc 19 <210> 1048 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 1048 gcgnnnnnnn gga 13 <210> 1049 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 1049 cagnnnnnnn nnnnnnncca 20 <210> 1050 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 1050 ccgnnnngtc 10 <210> 1051 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 1051 cccnnnnnnn nnnnnncgc 19 <210> 1052 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(17) <223> "N" stands for any nucleic acid <400> 1052 gcgnnnnnnn nnnnnnnacc 20 <210> 1053 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(23) <223> "N" stands for any nucleic acid <400> 1053 cagnnnnnnn nnnnnnnnnn nnnggg 26 <210> 1054 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 1054 ccgnnnnccc 10 <210> 1055 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 1055 cgcnnnnngg c 11 <210> 1056 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 1056 cctnnnnnng gc 12 <210> 1057 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 1057 aggnnnggc 9 <210> 1058 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(14) <223> "N" stands for any nucleic acid <400> 1058 cggnnnnnnn nnnncgc 17 <210> 1059 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(21) <223> "N" stands for any nucleic acid <400> 1059 ctgnnnnnnn nnnnnnnnnn ngga 24 <210> 1060 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(20) <223> "N" stands for any nucleic acid <400> 1060 cacnnnnnnn nnnnnnnnnn cca 23 <210> 1061 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(6) <223> "N" stands for any nucleic acid <400> 1061 cggnnngag 9 <210> 1062 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 1062 cccnnnnnnn nncca 15 <210> 1063 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 1063 cccnacg 7 <210> 1064 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(4) <223> "N" stands for any nucleic acid <400> 1064 cagngcc 7 <210> 1065 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 1065 aggnnnnnnc cg 12 <210> 1066 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(12) <223> "N" stands for any nucleic acid <400> 1066 agcnnnnnnn nnggg 15 <210> 1067 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 1067 cccnnnnnnn ggc 13 <210> 1068 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 1068 cctnnnnnnn nnnnnnccc 19 <210> 1069 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(22) <223> "N" stands for any nucleic acid <400> 1069 ccgnnnnnnn nnnnnnnnnn nnttc 25 <210> 1070 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(10) <223> "N" stands for any nucleic acid <400> 1070 cccnnnnnnn ccg 13 <210> 1071 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 1071 cgannnnnng gc 12 <210> 1072 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(7) <223> "N" stands for any nucleic acid <400> 1072 cggnnnnctc 10 <210> 1073 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 1073 cggcgc 6 <210> 1074 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(16) <223> "N" stands for any nucleic acid <400> 1074 cctnnnnnnn nnnnnnacg 19 <210> 1075 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(9) <223> "N" stands for any nucleic acid <400> 1075 gggnnnnnnc ac 12 <210> 1076 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(19) <223> "N" stands for any nucleic acid <400> 1076 cccnnnnnnn nnnnnnnnnc gc 22 <210> 1077 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(13) <223> "N" stands for any nucleic acid <400> 1077 cccnnnnnnn nnnctc 16 <210> 1078 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <400> 1078 ccccag 6 <210> 1079 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Dyad patterns over-represented in STAR elements <220> <221> misc_feature <222> (4)..(8) <223> "N" stands for any nucleic acid <400> 1079 gccnnnnncc c 11

Claims

항-억제자 활성을 갖는 단리 또는 재조합 DNA 분자로, 상기 DNA 분자는 도 26의 SEQ ID: 44의 서열을 포함하고;

상기 분자의 항-억제자 활성은, 인간 U-2 OS 골육종 세포가 Tet-Off 전사 조절 시스템의 조정하에 LexA DNA 결합 도메인과 HP1 또는 HPC2의 코딩 영역을 함유하는 LexA-억제자 융합 단백질을 포함할 때, 상기 단리 또는 재조합 DNA 분자가 플라스미드 중의 다중연결자 서열에 클론될 때, 인간 U-2 OS 골육종 세포에 제오신 250㎍/ml와 독시시클린 0.1ng/ml의 존재하에 4~5주의 배양 후 성장할 수 있는 능력을 제공하고, 상기 다중연결자는, 상기 플라스미드가 상기 세포에 존재할 때, 4개의 LexA 작동자 부위와 제오신 내성 유전자를 조절하는 SV40 프로모터 사이에 위치하는 것인 DNA 분자.
제1항에 따른 DNA 분자를 포함하는 재조합 DNA 컨스트럭트.
제2항에 있어서, 추가로 관심의 핵산 서열에 작동가능하게 연결된 프로모터를 포함하는 DNA 컨스트럭트.
제3항에 있어서, 상기 관심의 핵산 서열은 트란스유전자 개방 리딩 프레임인 DNA 컨스트럭트.
제4항에 있어서, 상기 프로모터는 외인성 프로모터인 DNA 컨스트럭트.
제3항 내지 제5항 중 어느 한 항에 있어서, 상기 프로모터는 강한 구성적 프로모터 또는 유발성 프로모터인 DNA 컨스트럭트.
제3항 내지 제5항 중 어느 한 항에 있어서, 상기 프로모터는 CMV 프로모터, SV40 프로모터 또는 Tet-Off 프로모터인 DNA 컨스트럭트.
제3항 내지 제5항 중 어느 한 항에 있어서, 아래 순서로

(ⅰ) 제1항에 따른 DNA 분자,

(ⅱ) 관심의 핵산 서열에 작동가능하게 연결된 프로모터, 및

(ⅲ) 상기한 (ⅰ)과 반대 방향의 제1항에 따른 DNA 분자:

를 포함하는 것인 DNA 컨스트럭트.
숙주세포를 제2항 내지 제5항 중 어느 한 항에 따른 DNA 컨스트럭트로 트란스펙트하는 단계를 포함하여 숙주세포를 얻는 방법.
제3항 내지 제5항 중 어느 한 항에 따른 DNA 컨스트럭트를 포함하는 세포.
제10항에 있어서, 상기 DNA 컨스트럭트의 다수의 카피(copy)들을 포함하는 세포.
제10항에 있어서, CHO 세포인 세포.
세포에서 유전자 산물을 생산하는 방법으로, 상기 방법은

(ⅰ) 상기 유전자 산물을 암호화하는 트란스유전자, 및

(ⅱ) 제1항에 따른 DNA 분자:

를 포함하는 발현카세트를 제공하는 단계; 및

세포에서 상기 발현 카세트의 전사를 허용하는 단계를 포함하는 방법.
제13항에 있어서, 상기 세포는 CHO 세포인 방법.
제13항에 있어서, 상기 발현 카세트는 다음의 순서로

(ⅰ) 제1항에 따른 DNA 분자;

(ⅱ) 상기 유전자 산물을 암호화하는 개방 리딩 프레임에 작동가능하게 연결된 프로모터를 포함하는 트란스유전자; 및

(ⅲ) 상기 (ⅰ)과 반대 방향인 제1항에 따른 DNA 분자:

을 포함하는 것인 방법.
제13항 또는 제14항에 있어서, 다수의 상기 발현 카세트가 제공되고 그것의 전사가 상기 세포에서 허용되고, 그리고 상기 트란스유전자의 발현은 카피수-의존인 것인 방법.
제1항에 따른 DNA 분자를 사용하여 관심의 핵산의 전사를 조절하는 방법.