KR20180127339A - 복제 트랜스포존 시스템 - Google Patents

복제 트랜스포존 시스템 Download PDF

Info

Publication number
KR20180127339A
KR20180127339A KR1020187026171A KR20187026171A KR20180127339A KR 20180127339 A KR20180127339 A KR 20180127339A KR 1020187026171 A KR1020187026171 A KR 1020187026171A KR 20187026171 A KR20187026171 A KR 20187026171A KR 20180127339 A KR20180127339 A KR 20180127339A
Authority
KR
South Korea
Prior art keywords
sequence
dna
gene
cells
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
KR1020187026171A
Other languages
English (en)
Inventor
틸만 벅스튜머
블라디미르 뱌체슬라보비치 카피토노프
이바나 그라번지야
졸탄 이빅스
Original Assignee
호리존 디스커버리 리미티드
제네틱 인포메이션 리서치 인스티튜트
맥스-델브뤼크-센트럼 퓌어 몰레쿨라레 메디친
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 호리존 디스커버리 리미티드, 제네틱 인포메이션 리서치 인스티튜트, 맥스-델브뤼크-센트럼 퓌어 몰레쿨라레 메디친 filed Critical 호리존 디스커버리 리미티드
Publication of KR20180127339A publication Critical patent/KR20180127339A/ko
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • A61K35/48Reproductive organs
    • A61K35/54Ovaries; Ova; Ovules; Embryos; Foetal cells; Germ cells
    • A61K35/545Embryonic stem cells; Pluripotent stem cells; Induced pluripotent stem cells; Uncharacterised stem cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/90Vectors containing a transposable element

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Reproductive Health (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Gynecology & Obstetrics (AREA)
  • Analytical Chemistry (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 DNA를 세포에 도입하기 위한 시스템 및 방법에 관한 것이다. 특히, 본 발명은 하기를 제공하는 단계를 포함하는 단일 또는 복수 카피의 관심 DNA 서열 또는 유전자를 세포에 도입하기 위한 방법에 관한 것이다: a) "복사 및 붙여넣기" 전이효소; 및 b) LTS 또는 RTS와 같이 "복사 및 붙여넣기" 트랜스포존 종결 서열에 의해 플랭크된 DNA 서열 또는 관심 유전자를 포함하는 컨스트럭트. 신규한 "복사 및 붙여넣기" 헬리트론 계열의 트랜스포존은 예를 들어, 단백질 생산, 세포 및 유전자 치료에서 또는 참고 기준으로서 사용하기 위한 세포주를 생성하기 위해 DNA를 세포에 도입하기 위한 방법에서 상응하는 전이효소를 이용하는 시스템과 함께 기술된다.

Description

복제 트랜스포존 시스템
본 발명은 세포에 DNA를 도입하기 위한 시스템 및 방법에 관한 것이다. 본 발명은 단일 또는 복수 카피(copy)의 DNA 서열을 세포에서 생성하기 위한 시스템에 관한 것이다. 이 시스템은 헬리트론 전이효소 (Helitron transposase) 및 상기 전이 효소에 의해 인식되는 RTS 및 LTS 서열을 갖는 DNA 서열의 용도를 포함한다.
유전자 및 세포 조작(engineering)을 위한 트랜스포존(transposon) 시스템의 용도가 기술되어 있다(예를 들어 Ivics and Izsvak, Mobile DNA 2010, 1:25 doi:10.1186/1759-8753-1-25에서 리뷰). 이 시스템은 유전자 복제 및 발현을 위해 잘라내기/붙여넣기 메커니즘을 이용하는 슬리핑 뷰티(sleeping beauty, SB, 예를 들어 US6,489,459 참조) 및 피기백(PiggyBac)과 같은 트랜스포존을 이용한다. 이러한 시스템의 단점은 일단 숙주 게놈으로 삽입되면 그들이 전달한 운반체(cargo)의 카피수(copy number)를 증폭시킬 수 없다는 것이다.
따라서, 새로운 트랜스포존-기반의 시스템이 필요하다.
진핵 생물계 전반에 널리 퍼져있으면서 헬리트론(Helitron)이라 불리우는 DNA 트랜스포존(transposon)의 신규한 그룹은 인 실리코(in silico) 게놈 서열 분석에 의해서 발견되었다(Kapitonov VV, Jurka J. Helitrons on a roll: eukaryotic rolling-circle transposons. Trends Genet 23, 521-529 (2007) 및 Thomas J, Pritham EJ. Helitrons, the Eukaryotic Rolling-circle Transposable Elements. Microbiology spectrum 3, (2015)에서 리뷰).
헬리트론 전이(Helitron transposition)는 표적 부위 중복(target site duplications, TSDs)이 없으나(Kapitonov et al. (2007) 및 Thomas et al. (2015) 또한, putative Helitron transposases do not contain an RNase-H like catalytic domain (Dyda F, Hickman AB, Jenkins TM, Engelman A, Craigie R, Davies DR. Crystal structure of the catalytic domain of HIV-1 integrase: similarity to other polynucleotidyl transferases. Science 266, 1981-1986 (1994)에서 리뷰), 복제 개시제(replication initiator, Rep) 및 DNA 헬리카제(Helicase, Hel) 도메인으로 구성된 "RepHel" 모티브를 암호화하는 것(Kapitonov et al. (2007); Thomas et al. (2015) 및 Kapitonov VV, Jurka J. Rolling-circle transposons in eukaryotes. Proceedings of the National Academy of Sciences of the United States of America 98, 8714-8719 (2001). Rep is a nuclease domain belonging to the HUH superfamily of nucleases that are involved in catalytic reactions for endonucleolytic cleavage, DNA transfer and ligation (Ilyina TV, Koonin EV. Conserved sequence motifs in the initiator proteins for rolling circle DNA replication encoded by diverse replicons from eubacteria, eucaryotes and archaebacteria. Nucleic Acids Res 20, 3279-3285 (1992) 및 Koonin EV, Ilyina TV. Computer-assisted dissection of rolling circle DNA replication. Biosystems 30, 241-268 (1993))과 같은 DNA 트랜스포존에 대한 많은 특이한 많은 특징을 보여준다. HUH 뉴클레아제(nuclease)는 오직 ssDNA만을 절단하고, IS91 패밀리 박테리아 트랜스포존의 "롤링 서클(rolling circle, RC)" 전이(del Pilar Garcillan-Barcia M, Bernales I, Mendiola MV, de la Cruz F. Single-stranded DNA intermediates in IS91 rolling-circle transposition. Molecular microbiology 39, 494-501 (2001); Garcillan-Barcia MP, de la Cruz F. Distribution of IS91 family insertion sequences in bacterial genomes: evolutionary implications. FEMS microbiology ecology 42, 303-313 (2002) and Mendiola MV, Bernales I, de la Cruz F. Differential roles of the transposon termini in IS91 transposition. Proceedings of the National Academy of Sciences of the United States of America 91, 1922-1926 (1994)) 뿐만 아니라 ΦX174(van Mansfeld AD, van Teeffelen HA, Baas PD, Jansz HS. Two juxtaposed tyrosyl-OH groups participate in phi X174 gene A protein catalysed cleavage and ligation of DNA. Nucleic Acids Res 14, 4229-4238 (1986)), ssDNA, 및 박테리아 플라스미드(Chandler M, de la Cruz F, Dyda F, Hickman AB, Moncalian G, Ton-Hoang B. Breaking and joining single-stranded DNA: the HUH endonuclease superfamily. Nature reviews Microbiology 11, 525-538 (2013)에서 리뷰)와 같은 특정 박테리아파지의 "롤링 서클 증폭(rolling circle replication, RCR)"의 개시에 있어서 주요한 역할을 한다.
제안된 RC 전이 메커니즘의 핵심 요소(Mendiola MV, de la Cruz F. IS91 transposase is related to the rolling-circle-type replication proteins of the pUB110 family of plasmids. Nucleic Acids Res 20, 3521 (1992))는 IS91's HUH 전이효소(transposase)의 활성 부위 내에 2개의 티로신(Tyr) 잔기를 포함한다(del Pilar Garcillan-Barcia et al. (2001)). 간략하게, 상기 모델은 5'-포스포티로신 중간체(5'-phosphotyrosine intermediate)를 형성하는 전이효소와 함께, 트랜스포존 5'-말단에 부위-특이적(site-specific) 틈(nick)을 제시한다. 틈(nick)에 있는 3'-OH는 하나의 트랜스포존 DNA 가닥이 벗겨지는 동안 DNA 합성을 개시하는 역할을 한다. 제2 활성 부위 Tyr에 의해 표적 DNA에서 생성된 틈(nick)은 5'-포스포티로신의 분해(resolution)를 유도한다. 일단 전체 트랜스포존이 복제되면, 전이효소는 트랜스포존의 3'-말단을 열고(nicking) 그것을 표적 부위의 5'-말단에 결합시킴으로써, 제2 가닥 전이 이벤트(transfer event)를 촉매한다(Kapitonov et al. (2007); Chandler et al. (2013) 및 (Mendiola et al. (1994)).
헬리트론(Helitron)은 최초의 진핵 생물 RC 트랜스포존이며(Kapitonov et al. (2001)), 헬리트론 트랜스포존은 진핵 생물에서 유전자 단편을 포획하고 동원할 수 있지만, 임의의 종으로부터 분리된 활성 요소가 없기 때문에 전이 메커니즘과 관련된 확실한 정보는 아직 파악하기 힘들다. 즉, 이전에는 세포에서 활발히 복제할 수 있는 헬리트론 트랜스포존을 분리할 수 없었다. 대신, 헬리트론 전이에 대한 우리의 모든 지식은 기능 장애의 헬리트론 트랜스포존 또는 트랜스포존 단편의 게놈 서열 나머지에 대한 생물정보학(bioinformatic) 분석에서 기인한다.
시퀀싱된 포유류 게놈에서 발견된 유일한 헬리트론 트랜스포존은 애기박쥐과(vespertilionid bats)로부터 유래한 것이다(Pritham EJ, Feschotte C. Massive amplification of rolling-circle transposons in the lineage of the bat Myotis lucifugus. Proceedings of the National Academy of Sciences of the United States of America 104, 1895-1900 (2007); Thomas J, Phillips CD, Baker RJ, Pritham EJ. Rolling-circle transposons catalyze genomic innovation in a Mammalian lineage. Genome biology and evolution 6, 2595-2610 (2014) and Thomas J, Sorourian M, Ray D, Baker RJ, Pritham EJ. The limited distribution of Helitrons to vesper bats supports horizontal transfer. Gene 474, 52-58 (2011)). 박쥐 헬리트론에 의해 암호화된 예상되는 전이효소는 전형적인 "RepHel" 모티프를 포함하며, 상기 요소는 역반복(inverted repeats)을 포함하지 않지만 3'-말단의 상류에 위치한 짧은 회문(palindromic) 모티프를 갖는 5'-TC 및 CTRR-3' 말단을 특징으로 하며, 삽입은 숙주 AT 타겟 부위에 5'-A 및 T-3' 뉴클레오티드 사이에서 정확하게 나타났다(Pritham et al. (2007)). 헬리트론 계열의 대다수가 3'-말단에서 짧은 회문 서열을 보유하고 있지만(Kapitonov et al. (2001); Coates BS, Hellmich RL, Grant DM, Abel CA. Mobilizing the genome of Lepidoptera through novel sequence gains and end creation by non-autonomous Lep1 Helitrons. DNA research : an international journal for rapid publication of reports on genes and genomes 19, 11-21 (2012); Du C, Fefelova N, Caronna J, He L, Dooner HK. The polychromatic Helitron landscape of the maize genome. Proceedings of the National Academy of Sciences of the United States of America 106, 19916-19921 (2009); Lal SK, Giroux MJ, Brendel V, Vallejos CE, Hannah LC. The maize genome contains a helitron insertion. The Plant cell 15, 381-391 (2003); Xiong W, He L, Lai J, Dooner HK, Du C. HelitronScanner uncovers a large overlooked cache of Helitron transposons in many plant genomes. Proceedings of the National Academy of Sciences of the United States of America 111, 10263-10268 (2014)), 헬리트론 전이에서 이들 서열의 역할은 불분명하다.
게놈 데이터는 헬리트론 전이가 종종 숙주 게놈 단편의 포획 및 동원과 연관되어 있으며, 이는 게놈 조절 요소의 전파(dissemination) (Pritham et al. (2007) and Thomas et al. (2014)), 유전자 단편 복제(duplication) (Morgante M, Brunner S, Pea G, Fengler K, Zuccolo A, Rafalski A. Gene duplication and exon shuffling by helitron-like transposons generate intraspecies diversity in maize. Nature genetics 37, 997-1002 (2005)), 키메라 전사체(chimeric transcripts)의 생성(Thomas et al. (2014) and Morgante et al. (2005)) and the creation of putative regulatory RNAs (Thomas et al. (2014) and Morgante et al. (2005))을 가져온다. 헬리트론 유전자 포획을 설명하기 위해 몇 가지 메커니즘이 제안되었으나(Kapitonov et al. (2007); Thomas et al. (2015); Coates et al. (2012); Dong Y, et al. Structural characterization of helitrons and their stepwise capturing of gene fragments in the maize genome. BMC genomics 12, 609 (2011); Toleman MA, Bennett PM, Walsh TR. ISCR elements: novel gene-capturing systems of the 21st century? Microbiol Mol Biol Rev 70, 296-316 (2006); Yassine H, et al. Experimental evidence for IS1294b-mediated transposition of the blaCMY-2 cephalosporinase gene in Enterobacteriaceae. The Journal of antimicrobial chemotherapy 70, 697-700 (2015); Brunner S, Pea G, Rafalski A. Origins, genetic organization and transcription of a family of non-autonomous helitron elements in maize. The Plant journal : for cell and molecular biology 43, 799-810 (2005); Feschotte C, Wessler SR. Treasures in the attic: rolling circle transposons discovered in eukaryotic genomes. Proceedings of the National Academy of Sciences of the United States of America 98, 8923-8924 (2001) and Tempel S, Nicolas J, El Amrani A, Couee I. Model-based identification of Helitrons results in a new classification of their families in Arabidopsis thaliana. Gene 403, 18-28 (2007)), 세포에서 복제할 수 있는 활동적인 헬리트론 트랜스포존이 없기 때문에, 헬리트론 전이의 과정 및 조절은 수수께끼를 남겼다. 개재(intervening) 게놈 내용의 복제를 가능하게 하는 기능적 말단 서열과 함께 활성 전이효소에 의해 정의된 활성 헬리트론 트랜스포존은 이전에 분리되지 않았었기 때문에, 헬리트론 생물학에 관해 현재까지 알려진 모든 것은 인 실리코(in silico) 또는 유전 분석으로부터 파생된다.
본 발명의 요약
본원에 기술된 바와 같이, 본 발명은 본원에서 "헬레이저(Helraiser)"로 명명된 자율적인(autonomous) Helibat1 트랜스포존의 활성 카피의 부활(resurrection) 및 시험관 내 및 생체 외 인간 세포에서 그것의 전이(transition)의 특성화에 관한 것이다.
박쥐 게놈에서 나온 고대 요소인 헬레이저는 헬리트론 전이의 메커니즘을 풀기 위한 실험 도구로 사용되어 왔다. 트랜스포존의 3'-말단에 가까운 헤어핀은 전이 종결자(terminator)로서 기능한다. 그러나, 3'-말단은 전이효소에 의해 우회되어, 새로운 게놈 위치에 플랭킹 서열을 형질도입할 수 있다. 헬레이저 전이는 증식성 전이 메커니즘을 암시하는 공유결합으로 폐쇄된 원형 중간체를 생성하며, 이는 게놈을 통해 포획된 전사 조절 신호를 전파하는 강력한 수단을 제공한다. 실험적으로나 박쥐에서의 전사체(transcriptome) 분석에 의해, 헬리트론 프로모터 포획에 의한 신규한 전사체(transcript)의 생성이 기술되어 있다. 이러한 결과는 세포 배양 그리고 생체 내 박쥐에서의 전이, 표적 부위 선별 특성 및 유전자 포획의 분자적 요구 사항에 대한 실험적 통찰력을 제공할 뿐만 아니라 헬리트론 전이 그리고 이것이 게놈 셔플링에 의해 유전자 기능의 다양성에 미치는 영향에 대한 메커니즘적 통찰력을 제공한다.
중요하게, 헬레이저 전이효소는 적절한 서열에 의해 플랭크된 공여자(donor)와 함께 사용될 때 DNA 전이를 트랜스로(in trans) 촉매할 수 있다.
이 시스템은 단일 또는 복수 카피(copy)의 공여자 DNA를 세포의 게놈에 도입하는 데에 사용될 수 있다. 헬레이저가 다른 트랜스포존 시스템(예: 슬리핑 뷰티(Sleeping Beauty), 피기백(PiggyBac))과 차별화되는 점은 다른 시스템의 잘라내기/붙여넣기 메커니즘보다는 복제를 위해 복사/붙여넣기 메커니즘을 사용한다는 것이며, 이는 시작하기 위해 존재하는 이동 가능한 요소의 단일 카피를 이용하여 복제(duplication)/복제(replication)의 곱셈적 효과를 달성할 수 있음을 의미한다. 이것은 선호 지역의 복수 카피를 운반하는 세포주를 조작하는 용도를 가지고 있다. 그것은 또한 전이의 추가의 순회(rounds)에 의해 수혜자 세포에서 DNA 운반체의 단계적 증폭을 가능하게 한다.
따라서, 일 측면에서, 복사/붙여넣기 전이효소 및 전이효소에 의해 인식되는 공여자 DNA를 포함하는 단리된 또는 배양된 세포에서 단일 또는 복수 카피의 DNA 서열을 생성하는 시스템이 제공된다. 적합하게는, "DNA 서열"은 "관심 유전자" (즉, 관심 단백질을 암호화함)일 수 있는 관심 DNA 서열이며, 상기 용어는 또한 게놈 영역 (예를 들어, 인핸서(enhancer), 리프레서(repressor), CpG 아일랜드(CpG island) 등을 포함하는 게놈의 영역)을 포함한다. 본원에서 사용되는 "공여자 DNA"라는 용어는 컨스트럭트, 예를 들어 전이효소-매개된 전이 이벤트를 발생시킬 수 있는 선택적으로 적합한 상류 및/또는 하류 말단 서열과 배열된 발현 벡터 내에서 제공되는 관심 유전자, 또는 게놈 영역을 지칭한다.
다른 측면에서, 하기를 제공하는 단계를 포함하는 단일 또는 복수 카피(copy)의 DNA 서열 또는 관심 유전자를 세포에 도입하는 방법이 제공된다: a) 헬리트론 전이효소(Helitron transposase); 및 b) 헬리트론 전이효소 LTS 서열을 포함하는 컨스트럭트(construct). 일 실시양태에서, b)에서의 상기 컨스트럭트는 헬레이저(Helraise) LTS 서열에 의해 플랭크된 DNA 서열 또는 관심 유전자를 더 포함한다. 적합하게는, 상기 세포는 원핵 세포 또는 진핵 세포일 수 있다.
또 다른 측면에서, 하기를 제공하는 단계를 포함하는 단일 또는 복수 카피(copy)의 DNA 서열 또는 관심 유전자를 진핵 세포에 도입하는 방법이 제공된다: a) "복사 및 붙여넣기" 전이효소; 및 b) "복사 및 붙여넣기" 트랜스포존 LTS 또는 RTS와 같은 트랜스포존 말단 서열에 의해 플랭크된 DNA 서열 또는 관심 유전자를 포함하는 컨스트럭트. 적합한 "복사 및 붙여넣기(copy and paste)" 전이효소는 본원에 기술된 헬레이저 전이효소를 포함하는 헬리트론 계열의 전이효소를 포함한다. 적합한 헬리트론 계열의 전이효소는 예를 들어 Kapitonov and Jurka (2007) 및 Thomas et al. (2015)에 기재되어 있다. 적합한 LTS 및 RTS는 헬리트론과 같은 특정 복사 및 붙여넣기 트랜스포존을 보완하는 것으로 확인된 것이다. 본 발명의 임의의 측면의 일 실시양태에서, 상기 "복사 및 붙여넣기" 전이효소는 헬리트론 전이효소이고 상기 LTS는 헬리트론 트랜스포존으로부터 유래된 것이다. 적합하게는, 상기 DNA 서열 또는 관심 유전자는 세포의 게놈으로 도입된다.
유리하게는, 상기 "복사/붙여넣기" 전이효소는 전이가 가능한 활성 요소이다. 일 실시양태에서, 상기 "복사/붙여넣기" 전이효소는 박테리아와 같은 원핵 생물의 "복사/붙여넣기" 트랜스포존이 아니다. 적합하게는 상기 "복사/붙여넣기" 전이효소는 진핵 생물의 게놈으로부터 부활되었다.
본 발명의 임의의 측면의 하나의 실시양태에서, 상기 트랜스포존 말단 서열은 서열번호 3으로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는 헬레이저 LTS 서열이다.
유리하게는, LTS 서열을 단독으로 삽입하는 것은 전이효소 첨가에 의해 개시될 때, 하류 게놈 내용이 전이될 수 있는 트랜스포존 공여자 서열의 단순한 생성을 가능하게 한다. 이것은 LTS 및 RTS의 순차적인 도입이 번거로울 경우, 예를 들어 진핵 세포에서 게놈 내용물을 증폭시키고 LTS 및/또는 RTS를 CRISPR/Cas, TALENs, 징크 핑거 뉴클레아제(Zinc finger nucleases) 또는 메가뉴클레아제(Meganucleases)과 같은 일반적인 게놈 조작 기술로 도입해야할 때, 특히 유리하다.
다른 실시양태에서, 상기 관심 유전자는 또한 서열번호 4로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는 RTS 서열에 의해 플랭크된다. 본원에 기재된 바와 같이, (예를 들어, 도 3a를 참조) 단일 LTS 서열은 헬레이저 전이효소에 의해 하류 DNA 운반체의 전이를 일으키기에 충분할 수 있지만, 원하는 유전자 또는 게놈 영역이 LTS 및 RTS 서열 모두와 플랭크된 경우, 전이율(transposition rate)은 더 높다. 유리하게는, 상기 RTS의 첨가는 전이효소 활성이 종결되어야 하는 위치를 정의하는 데 도움이 되어, 보다 조절된 전이를 제공한다. 일 실시양태에서, 관심 유전자가 복제되고 삽입될 수 있으나 전이효소에 의해 동원되지 않도록 바람직하게는 돌연변이된 RTS가 사용될 수 있다.
적절하게는 공여자 DNA는 예를 들어 관심 유전자를 암호화하는 표적 유전자에 대한 DNA 서열과 같이, 오른쪽과 왼쪽 종결 서열(RTS과 LTS 서열) 사이에 위치한 DNA 서열을 포함한다. 일 실시양태에서, 상기 LTS는 5' 말단에 있는 TC를 포함하는 핵산 서열을 갖는 반면, 상기 RTS는 3' 말단에 있는 CTAG를 포함하는 핵산 서열을 갖는다. 적절하게는 상기 RTS는 서열번호 4로 기재되는 핵산 서열, 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 갖는 반면에, 상기 LTS는 서열번호 3으로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하거나 갖는다.
일 측면에서, 예를 들어, 포유류 기원 및 전이효소에 의해 인식되는 공여자 DNA의 복사/붙여넣기 전이효소를 포함하는 단리된 또는 배양된 포유류 세포에서 단일 또는 복수 카피의 DNA 서열을 생성하는 시험관 내(in vitro) 시스템이 제공된다.
적합하게는 "복사/붙여넣기" 전이효소는 헬리트론 전이효소이다. 헬리트론 (또는 롤링 서클(rolling circle)) 트랜스포존 및 전이효소는 예를 들어 Kapitonov et al. (2007)에 기재되어 있다. 본 발명의 임의의 측면의 일 실시양태에서, 상기 전이효소는 서열번호 1로 기재되는 아미노산 서열과 적어도 80%의 서열 상동성을 갖는 아미노산 서열을 갖는 헬리트론 전이효소이다 (표 6 참조: 서열번호의 표; 서열번호 1은 헬레이저 전이효소의 아미노산 서열이다). 다른 실시 양태에서, 상기 헬리트론 전이효소는 서열번호 1로 기재되는 아미노산 서열과 80, 85, 90, 95 또는 95%의 서열 상동성을 갖는 것이다. 상기 헬리트론 전이효소는 DNA, RNA 또는 단백질 형태로 도입될 수 있다. 일 실시양태에서, 상기 전이효소는 헬레이저 전이효소이다. 적절하게는, 상기 전이효소는 서열번호 1로 기재되는 아미노산 서열로부터 유도되거나 서열을 갖는다. 일 실시양태에서, 상기 헬레이저 전이효소는 서열번호 2로 기재되는 핵산 서열(표 6을 참조: 서열번호의 표; 서열번호 2는 헬레이저 전이효소를 암호화하는 핵산 서열, 도 8 참조) 또는 예를 들어, 서열번호 6으로 기재되는 핵산 서열과 같이 이의 코돈-최적화된 버전에 의해 암호화된다.
일 실시양태에서, 상기 전이효소 및 상기 관심 유전자를 포함하는 컨스트럭트는 2개의 별개의 독립체로 제공된다. 적절하게는 독립체는 발현 벡터 또는 플라스미드와 같은 DNA 컨스트럭트이지만, 전이효소는 DNA, mRNA로서 또는 단백질로서 제공될 수 있다고 예상된다. 일 실시양태에서, 헬레이저 말단 서열(들)에 의해 플랭크된 관심 유전자 또는 게놈 영역을 포함하는 컨스트럭트는 전이효소를 암호화하는 컨스트럭트로 나중에 형질감염되는 세포주 내에서 생성되거나 존재할 수 있다. 다른 실시양태에서, 헬레이저 말단 서열(들)에 의해 플랭크된 관심 유전자를 포함하는 컨스트럭트는 전이효소를 암호화하는 컨스트럭트로 동시-형질감염을 위한 분리된 플라스미드의 일부일 수 있다. 다른 실시양태에서, 관심 유전자 및 LTS인 전이효소는 단일 컨스트럭트 내에 트랜스포존으로서 제공된다.
본 발명의 임의의 측면의 일 실시양태에서, 상기 전이효소는 헬리트론 트랜스포존에 의해 암호화될 수 있다. 예를 들어, 상기 전이효소는 서열번호 5로 기재되는 헬레이저 트랜스포존 핵산 서열과 같은 트랜스포존 핵산 서열에 의해 암호화될 수 있다(표 6을 참조: 서열번호의 표; 도 8도 참조). 본 발명의 일 측면에 따르면, 헬리트론 트랜스포존이 제공된다. 따라서, 본 발명은 서열번호 5로 기재되는 단리된 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 제공한다. 적절하게는, 서열번호 5와 적어도 80, 85, 90, 95 또는 95%의 상동성을 갖는 핵산 서열, 또는 이의 코돈-최적화된 버전이 제공된다. 일 실시양태에서, 서열번호 5로 기재되는 서열을 갖는 단리된 핵산이 제공된다.
일 실시양태에서, 상기 관심 유전자/DNA 서열은 내인성 유전자일 수 있다. 다른 실시양태에서, 상기 표적 DNA 서열은 인핸서, 리프레서, CpG 아일랜드 또는 임의의 관심 비-암호화 요소와 같은 관심 게놈 영역일 수 있다. 이들 실시양태 모두에서, 본 발명의 방법은 참조 세포주로서 사용될 수있는 세포주를 생성하기 위해 내인성 유전자의 복수 카피를 생성하는데 사용될 수있다. 다른 실시양태에서, 관심 유전자는 cDNA 서열로서 제공될 수 있다.
LTS와 RTS 사이에 위치하는 DNA 서열은 세포 시스템에서 발현을 위해 관심 단백질을 암호화하는 DNA 서열과 같이 바람직하게는 관심 DNA 서열을 제공하는 것이다.
유리하게는, 본원에 기술된 바와 같이 헬레이저와 같은 헬리트론 전이효소 시스템을 이용하여 공여자 DNA의 복제 및 게놈 내 복수의 부위로의 도입을 용이하게 한다. 이와 같이, 본 발명에 따른 방법 또는 시스템은 단일 또는 복수 카피의 관심 표적 유전자를 도입하는데 사용될 수 있다.
일 실시양태에서, 본 발명의 방법에서 사용하기 위한 세포 또는 분리된 또는 배양된 세포는 박테리아와 같은 원핵 세포이다. 다른 실시양태에서, 상기 세포는 곤충, 효모, 식물 또는 포유류 세포와 같은 진핵 세포일 수 있다. 적합한 배양된 세포는 당업자에게 익숙하다. 일 실시양태에서, 상기 세포는 마우스, 랫트와 같은 포유류 세포 또는 CHO 세포, 293T 세포, HEK293 세포, 인간유도만능줄기세포(human induced pluripotent stem cell), 인간 또는 쥐 배아줄기세포(embryonic stem cell), 조혈모세포(hematopoietic stem cell), T 세포 또는 B 세포와 같은 인간 세포이다. 상기 세포가 포유류 또는 인간 세포인 경우, 그것은 치료에 사용하기 위한 세포일 수 있다. 다른 실시양태에서, 상기 세포는 종양 세포주, HAPI 또는 eHAP 세포, HCT116 세포, DLD-1 세포, HEK293 세포 등과 같은 참조 세포주를 생성하는데 사용될 수 있는 세포 유형일 수 있다. 다른 실시양태에서, 상기 세포는 단백질 생산에 적합할 수 있다. 예를 들어, 상기 세포는 HeLa, 293T 세포, CHO 세포 또는 다른 적합한 포유류 세포 시스템일 수 있다. 포유류 단백질 생산을 위한 적합한 세포주는 당업자에게 공지되어 있으며, 예를 들어 CHO 세포, HEK29E 및 293T 세포를 포함한다.
일 실시양태에서, 본 발명의 방법은 세포주를 생성하는데 사용될 수 있다. 그러한 세포주는 일시적이거나 안정적일 수 있다.
헬레이저 전이를 위한 적합한 시스템은 본 명세서의 실시예 및 도 1b를 참조하여 기술된다.
다른 실시양태에서, 상기 전이효소를 암호화하는 핵산은 상기 세포의 게놈에 삽입된다. 다른 실시양태에서, 상기 공여자 DNA는 플라스미드 또는 재조합 바이러스 벡터의 일부이다. 추가의 실시양태에서, 상기 공여자 DNA는 적어도 오픈 리딩 프레임(open reading frame)의 일부를 포함한다. 추가의 실시양태에서, 상기 공여자 DNA는 프로모터, 인핸서, 사일렌서(silencer), 유전자좌위 조절 영역(locus-control region), 및 경계 요소(border element)으로 구성된 군으로부터 선택될 수 있는 전사 조절 영역과 같은 적어도 유전자의 조절 영역을 포함한다. 적합하게는, 상기 공여자 DNA는 적어도 오픈 리딩 프레임의 일부에 작동 가능하게 연결된 프로모터를 포함한다.
상기 공여자 DNA 및/또는 상기 전이효소 서열을 포함하는 컨스트럭트는 하기로 이루어진 군으로부터 선택된 방법을 이용하여 상기 세포에 도입될 수 있다: 유전자총(particle bombardment); 전기천공(electroporation); 미세주입(microinjection); 핵산 단편을 소포 또는 DNA 축합 시약을 포함하는 지질과 결합; 및 핵산 단편을 바이러스 벡터로 혼입하고 상기 바이러스 벡터를 상기 세포와 접촉. 본 발명의 임의의 측면의 일 실시양태에서, 상기 전이효소는 mRNA 분자로서 도입될 수 있다.
다른 측면에서, 헬리트론 전이효소 및 공여자 DNA가 세포 내로 도입된 게놈에 복수 카피의 DNA 서열을 도입하는 방법이 제공된다. 일 실시양태에서, 상기 전이효소 및 공여자 DNA는 별개로 공급된다. 다른 실시양태에서, 상기 전이효소 및 공여자 DNA는 동일한 DNA 컨스트럭트 상에 공급된다. 유리하게는, 상기 전이효소가 별개의 컨스트럭트로 공급되는 경우, 그것은 상기 세포 내 존재하는 한 단지 발현되고 효과적일 수 있다. 바람직한 경우, 이것은 전이 이벤트가 제한될 수 있게 할 수 있다. 다른 실시양태에서, 상기 전이효소는 RNA 또는 단백질 형태로 도입된다.
다른 측면에서, 공여자 DNA가 먼저 세포의 게놈에 도입되고 그 다음 헬리트론 전이효소가 도입된 게놈에 복수 카피의 DNA 서열을 도입하는 방법이 제공된다.
다른 측면에서, 상기 RTS 및 LTS 서열이 내인성 유전자를 플랭크한 게놈에 복수 카피의 DNA 서열을 도입하는 방법이 제공된다. 본 발명은 또한 헬레이저 LTS 서열에 의해 플랭크된 DNA 서열을 포함하는 컨스트럭트를 제공함으로써 단일 또는 복수 카피의 관심 DNA 서열 또는 유전자를 세포에 도입하는 방법을 제공한다. 일 실시양태에서, 상기 LTS는 5' 말단에 있는 TC를 포함하는 핵산 서열을 갖는 반면, 상기 RTS는 3' 말단에 있는 CTAG를 포함하는 핵산 서열을 갖는다. 적절하게는 상기 RTS는 서열번호 4로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 갖는 반면에, 상기 LTS는 서열번호 3으로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 갖는다. 적절하게는, 상기 방법은 내인성 세포 유전자가 전이효소에 의해 증식(multiplication)에 표적화되도록 관심 내인성 세포 유전자의 양측에 놓이는 방식으로 상기 RTS 및 LTS를 도입하기 위해 세포 게놈을 변형시키는 단계를 포함한다. 일 실시양태에서, 상기 RTS 및/또는 LTS는 게놈 표적 또는 조작 방법을 이용하여 도입된다. 일 실시양태에서, CRISPR, 징크 핑거 뉴클레아제(ZFNs), 메가뉴클레아제(Meganucleases), 전사 활성화 인자-유사 이펙터 뉴클레아제(transcription activator-like effector nucleases (TALENs)) (예를 들어, Gaj et al. in Trends in Biotechnology, Volume 31, Issue 7, p397-405, July 2013에 리뷰), 다른 프로그램 가능한 뉴클레아제 기술, 또는 rAAV 기술과 같은 게놈 편집(genome editing) 방법은 상기 RTS 및/또는 LTS를 도입하는데 이용될 수 있다.
본 발명의 임의의 측면의 일 실시양태에서, 상기 방법은 하기의 단계를 포함한다:
a) 적어도 하나의 헬레이저 말단 서열에 의해 플랭크된 관심 유전자를 암호화하는 핵산 서열을 포함하는 제1 컨스트럭트를 제공하는 단계;
b) 상기 제1 컨스트럭트를 세포에 도입하는 단계;
c) 헬레이저 전이효소를 암호화하는 핵산 서열을 포함하는 제2 컨스트럭트를 제공하는 단계;
d) 상기 제2 컨스트럭트를 단계 b)에서 수득된 상기 세포에 도입하는 단계;
e) 단계 d)에서 수득된 상기 세포를 전이효소 활성을 위한 조건 하에서 배양하는 단계; 및
f) 상기 관심 유전자의 다중 복제물을 검출하는 단계.
다른 측면에서, DNA 서열이 RTS 및 LTS에 의해 플랭크된 게놈에 무작위로 삽입되고 이어서 헬리트론 전이효소가 도입되는 게놈에 복수 카피의 DNA 서열을 도입하는 방법이 제공된다. 본 발명의 임의의 측면의 일 실시양태에서, 상기 헬리트론 전이효소는 본원에 기술된 바와 같이 헬레이저 전이효소이다. 본 발명의 임의의 측면의 일 실시양태에서, 상기 표적 유전자의 카피수는 전이효소 형질도입의 복수 순회(rounds)에 의해 조절될 수 있다.
본 발명의 임의의 측면의 일 실시양태에서, 상기 게놈은 포유류 게놈, 적절하게는 CHO 게놈으로 구성된다. 임의의 측면의 다른 실시양태에서, 상기 게놈은 반수체(haploid) 인간 게놈이다. 적합한 반수체 게놈은 KBM-7 세포(예를 들어, Kotecki et al. 1999 Nov 1;252(2):273-80에 기술된 바와 같이) 또는 HAPI 세포(예를 들어, Carette JE et al. Nature. 2011 August 24; 477(7364): 340-343에 기술된 바와 같이)에서 관찰되는 것이다.
다른 측면에서, 본원에 기술된 바와 같이 임의의 측면 또는 실시양태에서 시스템에 의해 도입된 복수 카피의 DNA 서열을 포함하는 세포가 제공된다.
다른 측면에서, 본 발명에 따른 방법에 의해 생산되는 세포주가 제공된다. 유리하게는, 본 발명에 따른 헬리트론 전이 이벤트 (또는 이벤트)를 이용하여 생산되는 세포주는 그의 게놈 내에서 헬레이저 LTS 및/또는 RTS DNA 서열의 존재에 대해 세포주를 분석함으로써 용이하게 검출될 수 있다. 검출하기 위한 적합한 방법은 PCR을 포함한다. 일 실시양태에서, 상기 세포주는 CHO 세포주이다.
일 실시양태에서, 그러한 세포주는 참조 표준으로서 사용하기 위한 것이다. 적합하게는, 본 발명에 따른 포유류 세포는 DNA 분자 참조 표준으로서 작용하는 DNA를 추출하는데 사용될 수 있다. 적절하게는, 본 발명에 따른 상기 포유류 세포는 또한 ERBB2/Her2 및 CD274/ PD-L1와 같은 표적 유전자/단백질의 다양한 발현 수준을 갖는 참조 물질을 제공하기 위한 면역조직화학(immunohistochemistry)에 이용될 수 있다. 참조 표준의 용도의 설명은 예를 들어, 호라이즌 디스커버리 제품 카탈로그(Horizon Discovery Product Catalogue (www.horizondiscovery.com))에서 찾을 수 있다. 여기서, 이러한 응용에 유용할 수 있는 유전자 서열의 예가 또한 기술된다.
본 발명에 따른 세포주는 또한 관심 단백질의 생산에 사용될 수 있다. 따라서, 다른 실시양태에서, 포유류 세포는 DNA 서열에 의해 암호화되는 단백질, 즉 관심 유전자에 의해 암호화되는 관심 단백질의 생산에 사용될 수 있다. 따라서, 일 실시양태에서, 재조합 단백질, 예를 들어 바이오치료 분자와 같은 모노클로날 항체 후보 물질을 생산하는 안정적인 숙주 세포인 본 발명에 따른 포유류 세포가 제공된다. 적합하게는, 관심 유전자를 포함하는 복수 컨스트럭트가 동일한 세포에 도입되어 항체 또는 항체 또는 이의 단편을 포함하는 조성물과 같은 바이오치료제를 생성시킬 수 있다. 이러한 바이오치료 분자를 생성하기 위한 적합한 방법이 본원에 기술되어 있다.
다른 실시양태에서, 본 발명은 치료에 사용하기 위한 본 발명의 방법에 따라 제조된 세포주를 제공한다. 적합하게는 상기 세포주는 유전자 치료(gene therapy), 세포 치료(cell therapy), 조직 치료(tissue therapy) 또는 면역 치료(immunotherapy)에 사용할 수 있다.
다른 측면에서, 본 발명에 따른 세포로부터 단리된 핵산이 제공된다.
또한, RTS와 LTS 사이에 위치된 핵산 서열을 포함하는 핵산이 제공되며, 상기 RTS 및 LTS는 헬레이저 전이효소 단백질에 결합할 수 있고, 상기 헬레이저 전이효소 단백질은 서열번호 1과 적어도 80%의 상동성을 갖는 아미노산 서열을 포함하며, 상기 RTS 및 LTS에 결합하고, 단리된 세포에서 DNA로 핵산의 삽입을 촉매한다. 적합하게는, 본 발명의 임의의 측면에 따른 핵산은 플라스미드의 일부이다.
또한, 본 발명은 헬레이저 단백질을 암호화하는 핵산을 제공하며, 상기 헬레이저 단백질은 서열번호 1과 적어도 80%의 상동성을 갖는 아미노산 서열을 포함한다. 일 실시양태에서, 상기 헬레이저 전이효소 단백질은 서열번호 1로 기재되는 아미노산 서열을 갖는다. 적합하게는, 상기 헬레이저 전이효소 단백질은 RTS 및 또는 LTS에 결합하고, 단리된 세포에서 DNA로 핵산의 삽입을 촉매한다. 적절하게는, 상기 RTS는 서열번호 4로 기재되는 핵산 서열을 갖고 상기 LTS는 서열번호 3으로 기재되는 핵산 서열을 갖는다. 본 발명은 핵산을 포함하는 벡터 및 핵산 또는 벡터를 포함하는 세포를 추가로 제공한다.
따라서, 일 측면에서, 본 발명은 서열번호 1로 기재되는 아미노산 서열과 80%의 상동성을 갖는 아미노산 서열을 포함하는 단리된 아미노산 서열을 포함하며, 상기 단리된 아미노산 서열은 "헬레이저" 전이효소로서 본원에서 기술된 헬리트론 전이효소를 암호화한다. 일 실시양태에서, 상기 헬레이저 전이효소는 서열번호 1로 기재되는 아미노산 서열과 적어도 80, 85, 90, 95 또는 95%의 상동성을 갖는 것이다. 다른 실시양태에서, 상기 아미노산 서열은 N-말단 핵 위주 서열(Nuclear localization sequence), 징크-핑거-유사 모티프(zinc-finger-like motif) 및 RepHel 효소적 코어(enzymatic core)를 포함하며, 이는 본원에 기술된 바와 같이, HUH 모티프 및 나선효소(helicase) 도메인을 갖는 Rep 뉴클레아제 도메인을 포함한다. 다른 실시양태에서, 상기 아미노산 서열은 서열번호 1로 기재되는 아미노산 서열을 포함한다.
적합하게는, 상기 전이효소는 서열번호 1로 기재되는 아미노산 서열로부터 유래되거나 아미노산 서열을 갖는다.
다른 측면에서, 본 발명에 따른 아미노산 서열을 암호화하는 핵산을 포함하는 단리된 핵산 서열이 제공된다. 적합하게는, 상기 단리된 핵산 서열은 본 발명에 따른 헬레이저 전이효소를 암호화한다. 일 실시양태에서, 상기 핵산 서열은 서열번호 2로 기재되는 서열과 상동성 수준을 나타낸다. 예를 들어, 서열번호 2로 기재되는 서열은 서열번호 1로 기재되는 것과 동일한 아미노산 서열을 암호화하기 위해 코돈-최적화될 수 있다. 일 실시양태에서, 상기 헬레이저 전이효소는 서열번호 2로 기재되는 핵산 서열에 의해 암호화된다 (표 6을 참조: 서열번호의 표; 서열번호 2는 헬레이저 전이효소를 암호화하는 핵산 서열, 도 8도 참조). 다른 실시양태에서, 상기 헬레이저 전이효소는 코돈-최적화된 서열의 예인 서열번호 6으로 기재되는 핵산 서열에 의해 암호화된다
중요하게는, 상기 헬레이저 전이효소는 적절한 서열에 의해 플랭크된 공여자 DNA와 함께 사용될 때 DNA 전이를 트랜스로(in trans) 촉매할 수 있다. 이 기능적 활성을 결정하기 위한 적합한 방법은 예를 들어, 본원에 실시예 1에 기술되어 있다.
다른 측면에서, 본 발명은 헬레이저 트랜스포존으로 DNA 전이를 촉매하는 적절한 서열을 포함하는 단리된 핵산 분자를 제공한다. 따라서, 본 발명은 헬레이저 좌측 말단 서열(left terminal sequence, LTS)을 포함하는 단리된 핵산 서열을 제공한다. 일 실시양태에서, 상기 LTS는 5' 말단에 있는 뉴클레오티드 TC를 갖는 핵산 서열을 포함한다. 적합하게는 서열번호 3으로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는 핵산이 제공된다. 다른 실시양태에서, 본 발명은 헬레이저 우측 말단 서열(right terminal sequence, RTS)을 포함하는 단리된 핵산 서열을 제공한다. 일 실시양태에서, 상기 RTS는 3' 말단에 있는 CTAG를 포함하는 핵산 서열을 갖는다. 적절하게는, 서열번호 4로 기재되는 핵산 서열, 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는 핵산이 제공된다. 일 실시양태에서, 상기 본 발명에 따른 LTS 또는 RTS 서열은 서열번호 3 또는 서열번호 4로 기재되는 아미노산 서열과 적어도 80, 85, 90, 95 또는 95%의 상동성을 갖는 것이고, 목적 유전자의 DNA 전이가 촉매되도록 관심 유전자를 플랭킹할 때, 이는 본 발명에 따른 헬레이저 트랜스포존과 반응할 수 있는 기능적 활성을 보유한다.
본 발명의 다른 측면에서, 서열번호 3으로 기재되는 서열 또는 그의 서열과 80%의 상동성을 갖는 서열을 포함하는 LTS 헬레이저 말단 서열에 의해 적어도 플랭크된 관심 유전자의 핵산 서열을 포함하는 단리된 핵산이 제공된다. 일 실시양태에서, 상기 단리된 핵산은 서열번호 4 또는 그의 서열과 80%의 상동성을 갖는 서열을 포함하는 RTS 헬레이저 종결 서열을 추가로 포함한다. 이러한 핵산은 또한 공여자 DNA로 지칭될 수 있다.
다른 측면에서, 본 발명에 따른 핵산 서열을 포함하는 발현 벡터가 제공된다. 따라서, 일 실시양태에서, 본 발명은 본 발명에 따른 전이효소를 암호화하는 서열을 포함하는 발현 벡터 뿐만 아니라 LTS 또는/및 RTS 서열(서열번호 3 또는 4로 기재됨)을 각각 포함하는 발현 벡터를 제공한다.
일 실시양태에서, 발현벡터는 적어도 하기 중 하나를 더 포함할 수 있다:
a) 일반적인(generic) gRNA 인식 부위, 바람직하게는 LTS 및 RTS를 플랭킹(flanking)하는 Tia1L;
b) 상기 관심 유전자가 상기 프로모터의 제어 하에 있도록 배열된 프로모터 서열;
c) 상기 관심 유전자에 후속하는 폴리아데닐화 카세트(polyadenylation cassette).
다른 측면에서, 본 발명은 본 발명에 따른 핵산 서열 또는 발현 벡터를 포함하는 재조합 숙주 세포를 제공한다. 적절한 숙주 세포는 본원에 기술되어 있고 예를 들어, CHO 세포를 포함한다.
다른 측면에서, 본 발명은 본 발명의 방법에 따라 제조된 세포 또는 본 발명에 따른 재조합 숙주 세포를 적합한 배지에서 배양하는 단계 및 상기 세포 또는 적합한 배지로부터 관심 단백질을 수확하는 단계를 포함하는 관심 단백질을 수확하는 방법을 제공한다.
다른 측면에서, 하기의 단계를 포함하는 치료를 필요로 하는 대상(subject)에 목적 유전자를 제공함으로써 질환을 치료하는 방법이 제공된다:
a) 상기 대상에 사용하기에 적합한 세포주를 분리하는 단계;
b) 본 발명에 따른 단리된 핵산 또는 발현 벡터를 상기 세포주에 도입하는 단계로서, 상기 핵산 또는 발현 벡터가 상기 관심 단백질에 상응하는 관심 유전자를 포함함;
c) 헬레이저 전이 이벤트(Helraiser transposition event)가 발생하여 상기 관심 유전자를 포함하는 조작된 세포주를 생성하도록 본 발명에 따른 아미노산 서열, 핵산 서열 또는 발현 벡터를 도입하는 단계;
d) 상기 조작된 세포주를 세포 배양물에서 조작된 세포의 집단을 제공하기 위해 증식시키는 단계; 및
e) 상기 조작된 세포를 상기 대상에 도입하는 단계.
적절하게는, 대상(subject)에 질환을 치료하는 생체 외(ex vivo) 방법이 제공된다. 이 실시양태에서, 상기 관심 유전자는 대상 또는 환자에게 단백질을 제공하기 위해 조작된 세포에서 발현되는 관심 단백질을 암호화할 수 있다. 상기 세포주는 예를 들어, T 세포, 대식세포(macrophage cell), B 세포, 수지상세포(dendritic cell), NK 세포, 조혈줄기세포(haematopoietic stem cell), 골수계-적혈구계 전구(myeloid-erythroid progenitor, CMEP)세포 또는 공통 림프계 전구(common lymphoid progenitor, CLP)세포일 수 있다.
다른 측면에서, 본 발명은 하기의 단계를 포함하는 치료를 필요로 하는 대상에 질환을 치료하는 방법을 제공한다:
a) 본 발명에 따른 관심 유전자를 제공하는 단리된 핵산을 포함하는 제1 발현 벡터를 제공하는 단계;
b) 본 발명에 따른 전이효소를 암호화하는 핵산 서열을 포함하는 제2 발현 벡터를 제공하는 단계;
c) 상기 제1 및 제2 발현 벡터를 상기 대상에 도입하는 단계.
적절하게는, 대상에 질환을 치료하는 생체 내(in vivo) 방법이 제공된다.
추가의 측면에서, 본 발명은 본 발명에 따른 관심 유전자 및 전이효소를 제공하는 단리된 핵산을 포함하는 제1 발현 벡터를 포함하는 약학적 조성물을 제공한다. 일 실시양태에서, 상기 전이효소는 본 발명에 따른 전이효소를 암호화하는 핵산 서열을 포함하는 제2 발현 벡터 내에 제공될 수 있다. 다른 실시양태에서, 상기 전이효소는 mRNA 또는 단백질로 제공될 수 있다.
본 발명은 치료에 사용하기 위한 본 발명의 임의의 측면에 따른 세포주를 제공한다. 추가 측면은 질환의 치료에 사용하기 위한 의약의 제조에서 본 발명에 따른 세포주의 사용을 포함한다.
다른 측면에서, 본 발명은 무작위 돌연변이 유발(mutagenesis)에서 트랜스포존 또는 전이효소의 용도 또는 본 발명의 임의의 측면 또는 실시양태에 따른 방법을 제공한다. 적합한 방법이 본원에 기술되어 있다. 예를 들어, 실시예 8을 참조하라. 특히, 반수체(haploid) 세포 배경에 삽입 돌연변이 유발을 위한 방법에서 본 발명에 따른 트랜스포존, 전이효소 또는 방법 용도가 제공된다. 이러한 기술들에 의해 얻어진 라이브러리의 용도가 예를 들어, Carette et al. Nature Biotechnology, pages 542-546; Vol. 29 (6), 2011 and Moriarity et al. Nature Genetics 2015, doi:10.1038/ng.3293에 기술되어 있다.
따라서, 본 발명은 리포터(reporter)의 다양한 게놈 삽입(integration) 이벤트를 포함하는 세포주 라이브러리를 생성하기 위해, LTS 및/또는 RTS에 의해 플랭크된 리포터 유전자를 암호화하는 공여자와 헬리트론 전이효소의 용도 또한 제공한다.
다른 측면에서, 본 발명에 따라 LTS 및/또는 RTS 서열의 존재에 대해 상기 세포주를 분석하는 단계를 포함하는, 헬리트론 전이 방법으로부터 유래된 세포주를 검출하는 방법이 제공된다.
다른 측면에서, 본 발명은 하기의 단계를 포함하는 세포주를 생성하는 방법을 제공한다:
a) 헬리트론 LTS 서열을 포함하는 컨스트럭트를 제공하는 단계; 및
b) 상기 컨스트럭트를 세포주에 도입하는 단계.
적절하게는, 단계 a)의 상기 컨스트럭트는 헬리트론 RTS 서열을 더 포함한다. 일 실시양태에서, 상기 LTS 및/또는 RTS는 관심 DNA 서열을 표적으로 한다. 본 발명은 또한 이 측면에 따른 방법에 의해 생산된 세포주를 제공한다.
다른 측면에서, 하기의 단계를 포함하는 복수 카피의 관심 DNA 서열을 포함하는 세포주를 생산하는 방법이 제공된다.
a) 본 발명에 따른 헬리트론 LTS 서열을 포함하는 세포주를 수득하는 단계;
b) 헬리트론 전이효소를 전이효소 활성을 위한 조건 하에서 도입하는 단계;
c) 상기 복수 카피의 DNA 서열을 갖는 클론성 세포주(clonal cell line)를 분리하는 단계.
본 발명은 이 측면에 따른 방법에 의해 제조된 단리된 클론성 세포주를 더 제공한다. 이러한 세포주는 CHO 세포주, HAP1 또는 eHAP 세포주일 수 있다.
본 발명의 다른 측면에서, 단일 또는 복수 카피의 DNA 서열을 갖는 세포를 생성하기 위한 진핵 세포에서의 복사 및 붙여넣기 트랜스포존의 용도가 제공된다. 본 발명의 다른 측면에서, 단일 또는 복수 카피의 DNA 서열을 갖는 세포를 생성하기 위한 원핵 또는 진핵 세포에서의 헬리트론 트랜스포존의 용도가 제공된다.
도 1. 인간 HeLa 세포에서 헬레이저 전이의 특징. a) 헬레이저 트랜스포존의 도식적 표현. LTS 및 RTS 말단 서열은 대문자이고, 플랭킹 A 및 T 숙주 표적 부위 서열은 소문자이다. 헬레이저 전이효소 내 보존된 아미노산 모티프는 아래에 나와 있다. b) 헬레이저 콜로니 형성(colony-forming) 효율. 표시된 퓨로(puro)-저항성 HeLa 세포 콜로니를 포함하는 조직 배양 접시를 나타낸다. 헬레이저 공여자(pHelR) 및 헬퍼(pFHelR) 플라스미드. pHelR: 흰색 사각형 내부 RTS: 헤어핀을 나타낸다; pFHelR: 검정색 화살표: 전이효소 발현을 유도하는 프로모터를 나타낸다, 검정색 원: polyA 신호를 나타낸다; 이러한 주석은 모든 도면에서 일관되게 사용된다. 데이터는 평균 ± 표준오차로 나타낸다. c) 헬레이저 전이는 표준이 되는(canonical) 삽입을 생성한다. 게놈에 대한 헬레이저 LTS- 또는 RTS(Helraiser LTS- or RTS-to-genome) 접합부(junction)는 10개의 독립적인 트랜스포존 삽입을 위해 표시된다. 헬레이저 서열은 검정색 배경에 보존 된 5'- 및 3'-말단 서열을 갖는 대문자로 나타내고, 플랭킹 숙주 게놈 서열은 소문자이다. 플랭킹 pHelR 플라스미드 서열(상단 라인)은 이탤릭체로 표시된다. d) HeLa 세포에서 콜로니 형성에 의해 측정된 헬레이저 및 슬리핑 뷰티(SB100X)의 상대적인 전이 효율. 데이터는 평균 ± 표준오차로 나타낸다. e) Helibat1 및 비-자율적인(non-autonomous) 서브패밀리 HelibatN1, HelibatN2 및 HelibatN3의 상대적인 전이 효율. 데이터는 평균 ± 표준오차로 나타낸다.
도 2. HUH 뉴클레아제 및 SF1B 나선효소 도메인의 기능적 분석. a) 100%로 설정된 HelR (WT)와 비교하여, HeLa 세포에서의 헬레이저 전이효소 돌연변이의 전이 활성. 데이터는 평균 ± 표준오차로 나타낸다. b) 시험관 내에서 헬레이저 전이효소에 의한 단일-가닥 DNA 올리고뉴클레오티드의 절단. c) 헬레이저 전이효소 및 그것의 점 돌연변이 및 절단된 유도체로 DNA 결합 어세이(DNA binding assay). d) 야생형 (WT) 및 K1068Q 돌연변이체 전이효소 단백질로 비색계(Colorimetric) ATPase 분석. 데이터는 평균 ± 표준오차로 나타낸다. 각 처리에 대해(ATP+dsDNA, ATP+ssDNA 또는 ATP 단독), 가장 왼쪽 막대는 0.02 uM WT에 대한 데이터를 나타내고, 중앙 막대는 0.08 uM WT에 대한 데이터를 나타내며, 가장 오른쪽 막대는 0.3 uM K1068Q에 대한 데이터를 나타낸다.
도 3. 헬레이저 전이에서 3'-말단 서열 및 헤어핀 구조의 역할. a) pHelR, pHelRΔLTS, pHelRΔRTS 및 pHelRΔHP 공여자 플라스미드의 콜로니 형성 효율. 데이터는 평균 ± 표준편차로 나타낸다. 각 공여자 플라스미드에 대해, 데이터는 '공유자+헬퍼 (왼쪽 막대), 및 '공여자+대조군 (오른쪽 막대)'로 나타내어진다. b) 평균 콜로니 수(inset)에 의해 정규화된 HelR, HelRΔRTS 및 HelRΔHP 트랜스포존의 클론 당 평균 트랜스포존 카피수 및 전이 효율. HelRΔRTS와 HelRΔHP 전이 효율의 차이는 통계적으로 유의하지 않았으며, *p> 0.05, 언페어드 t-검정(unpaired t-test). 데이터는 평균 ± 표준오차로 나타낸다. c) HelR, HelRATH, HelRStemX 및 HelRLoopX 헤어핀의 M-배(M-fold) 예측된 구조 (Zuker, 2003). d) 헤어핀 돌연변이체의 상대적 콜로니-형성 활성. 막대(왼쪽에서 오른쪽)는 각각 HelR, DHP, ATH, StemX 및 LoopX를 나타낸다. 데이터는 평균 ± 표준오차로 나타낸다.
도 4. 헬리트론 서클( Helitron circle). a) 헬리트론 서클 공여자 플라스키드 (pHelRCD) 및 헬레이저 전이효소-생성된 헬리트론 서클 (pHelRC). 흰색 화살표는 Amp/SV40 프로모터를 나타낸다; 흰색 원은 polyA 신호를 나타낸다. b) 형성된 콜로의 수로 측정된, pHelRCD (그래프의 왼쪽) 또는 pHelRC (그래프의 오른쪽)로부터 생성된 헬리트론 서클의 전이. 각 공여자 플라스미드에 대해, 데이터는 공여자+헬퍼 (왼쪽 막대) 및 공여자+대조군 (오른쪽 막대)로 제시된다. c) HelR, HelRMut 및 HelRΔHP 트랜스포존으로 생성된 헬리트론 서클의 PCR 검출. HelRMut, 팔린드롬(palindrome)의 마지막 9 nt가 결실된 트랜스포존 결실 버전; H2O, 주형(template) 없는 대조군. d) pHelRCpuro (그래프의 왼쪽) 및 pHelRCΔHPpuro (그래프의 오른쪽)의 상대적인 전이 효율. 각 공여자 플라스미드에 대해, 데이터는 공여자+헬퍼(왼쪽 막대) 및 공여자+대조군(오른쪽 막대)로 제시된다. 데이터는 평균 ± 표준오차으로 나타낸다. pHelRCpuro 및 pHelRCΔHPpuro 플라스미드의 도식은 그래프 아래에 제시된다.
도 5. 인간 게놈에서의 신규한( do novo ) 헬레이저 삽입(insertion)에 대한 전장 게놈(genome-wide)의 분석. a) 서열 로고는 WebLogo (http://weblogo.berkeley.edu)에서 생성되었다. 트랜스포존 삽입(integration)은 위치 -1과 1 사이이다. 하위 패널은 삽입 부위에서의 디뉴클레오티드의 분포를 보여준다. b) 무작위 게놈 부위 (각 쌍의 앞쪽 막대) 및 헬레이저 삽입 부위의 염기 조성 특징을 모방하는 대조군 부위 (각 쌍의 뒷쪽 막대)와 비교하여 상대적인 삽입 빈도의 배수 풍부도(fold enrichment). 상위 유전자는 높은 발현 수준을 갖는 500개의 유전자이다. 침묵 유전자의 프로모터 영역 및 H3K9me3 영역으로의 삽입 빈도는 대조군과 유의적으로 다르지 않았다; 다른 모든 차이는 통계적으로 유의하였다 (피셔의 정확 검정(Fisher's exact test) p-값 <= 0.05). c) 임의의 게놈 부위 (각 쌍의 앞쪽 막대) 및 헬레이저 삽입 부위의 염기 조성 특징을 모방하는 대조군 부위 (각 쌍의 뒷쪽 막대)와 비교하여 염색체 당 상대적인 삽입 빈도의 배수 풍부도. d) 133개의 헬레이저 재-전이 이벤트의 염색체 분포 (염색체 위의 화살표). 염색체 8, 20 및 21 아래의 화살표는 본래 염색체 공여자 부위의 위치를 나타낸다.
도 6. 헬레이저 유전자 포획의 메커니즘. a) pHelRΔRTS 및 pHelRΔHP 전이에 의해 생성된 신규한 3'-말단 서열의 확인. pHelR, pHelRΔHP 및 pHelRΔRTS 전이에서 생성된 표준이 되고(canonical) 신규한(de novo) 3'-말단의 상대적인 위치는 다음과 같이 표시된다: pHelR RTS (표준이 되는 RTS) 말단의 화살표, pHelRΔHP 및 pHelRΔRTS(절단) 상의 퓨로(puro)와 폴리A 신호(polyA signal) 사이의 화살표 및 pHelRΔHP 및 pHelRΔRTS (리드 스루 (read-throughs)) 상의 LTS 상류의 화살표. 새로운 트랜스포존 게놈에 대한 3'-말단(3'-terminus-to-genome) 접합부를 나타내는 서열이 오른쪽에 도시되어 있다. b) 네오마이신(neomycin) 저항성 카세트의 형질도입에 의해 측정된 HelR 및 HelRΔHP 트랜스포존의 유전자 포획 효율. 각 플라스미드에 대해, 왼쪽 막대는 퓨로마이신(puromycin)만을 이용하여 생산된 데이터를 나타내고, 오른쪽 막대는 퓨로마이신 및 네오마이신을 이용하여 생산된 데이터를 나타낸다. 데이터는 평균 ± 표준오차로 나타내어진다. c) HelibatN3 전이에 의한 새로운 전사체의 신규한(de novo) 형성. [i] HelibatN3 트랜스포존은 프로모터 및 트랜스포존의 좌측 및 우측 말단 서열 (LTS 및 RTS) 사이에 스플라이싱 공여자(splice donor, SD)가 뒤따르는 암호화 영역의 작은 부분을 포함하는 NUBPL 유전자의 단편을 포함한다. [ii] 퓨로마이신 저항성 선택 마커가 태그된 HelibatN3 트랜스포존. T2A 자가-절단 펩타이드 서열은 보다 신뢰성있는 퓨로 발현을 가능하게 하는 1차 융합 단백질의 가공을 가능하게 한다. 두 가지 실시예가 비-암호화 RNA의 엑손화(exonization) 및 도입된 스플라이싱에 의한 mRNA의 절단을 보여준다. MED27, 매개자 복합체 서브유닛 27 유전자(mediator complex subunit 27 gene); GREB1L, 유방암-유사 유전자에서의 에스트로겐에 의한 성장 조절.
도 7. 헬레이저 전이의 제안된 모델. a) 헬레이저 전이효소 (타원형)는 LTS에 결합하고 HUH 뉴클레아제 활성 부위에 있는 티로신 잔기와 트랜스포존 말단 사이에서 5'-포스포티로신 중간체를 생성하는 ssDNA 공여자 부위에 틈을 만든다. b) 나선효소 도메인이 dsDNA 헬릭스(helix)를 5'에서 3' 방향으로 푸는 반면, 공여자 부위의 자유 3'-OH 그룹은 예정되지 않은 DNA 합성의 일부 유형을 준비한다. c) [도면의 왼쪽 절반] RTS에서의 헤어핀 구조는 HUH 도메인의 두 번째 티로신에 의한 RTS에서의 CTAG-3' 4개(tetrad)의 인식 및 닉킹(nicking)에 필요한 나선효소의 중지를 유도한다. 이것은 유리(free) ssDNA 서클을 생성하는 첫 번째 5'-포스포티로신 연결을 공격하는 트랜스포존 RTS에서의 자유 3'-OH 그룹을 생성한다. ssDNA 서클은 추가의 전이 순회(rounds)를 위해 dsDNA 서클로 전환될 가능성이 있다. [도면의 오른쪽 절반] 대신에, 전이효소는 RTS를 통해 읽고 숙주 플랭킹 서열을 동원하여, 대안적인, 신규한(de novo) 3'-말단을 생성한다. 표준이 되는(canonical) 트랜스포존 및 포획된 숙주 서열을 포함하는 트랜스포존에서의 추가 단계는 동일하다. d) 뉴클레아제 활성 부위의 2개의 티로신 잔기는 ss 표적 DNA 및 헬리트론 서클의 절단을 촉매하여 가닥 이동 반응을 매개한다. e) [도면의 왼쪽 절반] 세포 주기 중 DNA 합성 동안, 표적에 공유결합된 ss 트랜스포존 DNA는 수동적으로 복제되고 ds 형태로 전환되어, 숙주 게놈에서 트랜스포존 수의 증폭 및 숙주 게놈 서열의 형질도입을 유도한다. [도면의 오른쪽 절반] 신규한(de novo) 3' 말단이 생성된 경우 전이의 대안적인 결과 (도 7d, 오른쪽 절반 참조)
도 8. DNA 염기 서열. 공통(consensus) Helibat1 (헬레이저) 트랜스포존, 및 자율적인 및 비-자율적인 트랜스포존의 공통(consensus) 왼쪽 말단 및 오른쪽 말단 서열의 완전한 DNA 서열이 트랜스포존 공여자 컨스트럭트에 사용되었다. 5'-TC 및 CTAG-3' 말단 서열은 굵게 타이핑된다.
도 9. 단백질 서열 정렬과 도메인 매핑. a) C. elegans, T. castaneum, P. infestans, L. corymbifera, A. thalianaO. sativa의 헬리트론 전이효소 서열과 M. lucifugus의 헬레이저의 전체 단백질 서열 정렬. 트립신 분해물(trypsin digest)에 의해 결정된 도메인은 서열 아래에 컬러 막대로 표시된다. 예측된 핵 위치 신호 및 징크 핑거 모티프는 각각 서열 아래에 주황색 및 보라색 막대로 표시된다. b) 트립신 양을 증가시킴에 따른, 정제된 헬레이저 분해물(digest)의 SDS-PAGE. N-말단 시퀀싱은 아미노산 811-1496을 포함하는 나선효소 단편, 아미노산 491-745를 포함하는 HUH 뉴클레아제 단편 및 아미노산 251 내지 481에 걸친 N-말단 서열을 확인하였다.
도 10. 헬레이저 전이효소 도메인의 구조 및 기능적 특성. 헬레이저 나선효소 도메인은 SF1B 서브패밀리 그룹 구성원과 정렬되고 이전에 언급된 헬리트론의 특징인(Pritham et al. (2007)).Nature 502, 393-396 (2013)) (Pritham et al. (2007)) 상동성 재조합 및 정지된 복제 포크의 분해에 관여하는 나선효소의 계열인 Pif1 나선효소와 밀접하게 관련되어있다 (Sabouri N, McDonald KR, Webb CJ, Cristea IM, Zakian VA. DNA replication through hard-to-replicate sites, including both highly transcribed RNA Pol II and Pol III genes, requires the S. pombe Pfh1 helicase. Genes & development 26, 581-593 (2012); Steinacher R, Osman F, Dalgaard JZ, Lorenz A, Whitby MC. The DNA helicase Pfh1 promotes fork merging at replication termination sites to ensure genome stability. Genes & development 26, 594-602 (2012); Wilson MA, et al. Pif1 helicase and Poldelta promote recombination-coupled DNA synthesis via bubble migration. Nature 502, 393-396 (2013)). a) 나선효소 서열 정렬. 2차 구조적 특징은 베타 가닥을 화살표로 표시하고 나선을 나선으로 표시한다. 상단: E. coli의 RecD 나선효소, G. stearothermophilus의 헬리트론 전이효소 및 PcrA 나선효소의 모델이 각각 왼쪽, 가운데 및 오른쪽에 표시된다. 각 나선효소의 4개의 도메인이 라벨링된다. 하부: M. lucifugus (헬레이저), A. thalianaO. sativa 의 헬리트론 나선효소와 왼쪽에 있는 SF1B 나선효소 [(Pif1 (S. cerevisiae), Dna2 (S. cerevisiae), Dda (E. phage T4), TraI (E. coli) 및 RecD (E. coli)] 및 오른쪽에 있는 SF1A 나선효소 [Rep (E. coli), UvrD (B. subtilis ssp. subtilis str. 168) and PcrA (G. stearothermophilus)] 와의 전체 단백질 서열 정렬. 보존된 SF1 나선효소 모티프는 하이라이트되어 있다. b) 5'- 또는 3'- 말단 상부 및 하부 가닥의 시험관 내(in vitro) 절단 ssDNA. 헬레이저 전이효소에 의한 5' FAM-표지된 올리고뉴클레오티드 절단의 15% TBE-UREA 겔. 오른쪽의 DNA 도식은 4개의 ssDNA 기질을 보여주며, 5'-와 3'-말단 서열은 굵게 표시되어 있고, 규칙적인 스크립트(script)에 있는 플랭킹 서열 및 3'-헤어핀은 밑줄로 표시되어 있다. 화살표는 절단 부위를 나타내며, 번호는 서열화된 ssDNA 단편을 나타낸다.
도 11. 윗수염박쥐속 ( Myotis ) 게놈에서 헬리트론의 3'-말단의 다양화 실시예 . a) 신규한 헬리트론 말단의 획득. 절단된 5'-말단을 갖는 헬리트론에 인접한 헬리트론 카피의 삽입은 신규한 3'-말단의 획득을 유도할 수 있다. b) 서로 옆에 헬리트론을 삽입. 숙주의 5'-A와 헬리트론의 T-3' 사이에서의 헬리트론의 삽입은 하나의 헬리트론의 3'-말단이 다른 헬리트론의 5'-말단과 인접한 곳에서 삽입이 발생할 수 있다. c) 아마도 3'-말단의 절단에 의한 신규한(de novo) 말단의 생성. d ) 헬리트론 삽입(A-C에서 기술) 및 종간(orthologous) 빈 (삽입이 없는) 부위와 숙주 서열의 비교. 첫 번째 줄은 헬리트론 삽입을 플랭킹한 숙주 서열이다. 두 번째 줄은 종간 빈 부위이다. 왼쪽 및 오른쪽 말단의 서열은 숙주 서열을 나타내나, 수직선 선 간의 서열은 헬리트론 서열을 나타낸다. 접근번호(accession number) 및 좌표가 표시된다. e) 말단-우회(end-bypass)에 의한 신규한(de novo) 말단의 생성 [i] 상위의 만화는 HelibatN542 공통(consensus)의 구조를 보여준다. 공통의 말단 서열은 만화 옆에 표시된다. 말단 내의 팔린드롬(palindrome)은 회색으로 표시되며 팔린드롬의 줄기를 구성하는 서열에는 밑줄이 그어져있다. [ii] 팔린드롬 서열이 결여된 HelibatN542 카피의 구조를 만화로 표현한 결과, 다른 3'-말단을 생성. 신규한 3'-말단의 서열은 만화 옆에 표시된다. [iii] 게놈에서 두 개의 HelibatN542 카피의 위치. 하나의 카피의 전이 (점선으로 도시됨)는 CTAG-3'의 말단-우회를 초래하고, 짧은 팔린드롬이 뒤 따르는 무작위 서열에서 종결된다. 그런 다음 카피를 게놈에서의 다른 위치 ()에 삽입했다. 팔린드폼을 포함하는 신규한 말단 서열은 카툰 옆에 표시된다. [iv] 첫 번째 줄은 헬리트론 삽입 및 신규한 말단이 있는 숙주 서열이다. 두 번째 줄은 헬리트론 및 신규한 말단이 있는 종내(paralogous) 카피이다. 왼쪽과 오른쪽 말단에 있는 서열은 플랭킹 숙주 서열을 나타내나, 수직선 선 간의 서열은 헬리트론 및 포획된 숙주 서열을 나타낸다. 접근번호(accession number) 및 좌표가 표시된다.
도 12. RINT1 , ARMC9 RNF10 유전자좌위 ( M. brandtii ). a) RINT1 유전자좌위. b) ARMC9 유전자좌위. c) RNF10 유전자좌위. 각 패널 상단에는 전사체(transcriptome) 어셈블리에 의해 결정된 전체 유전자 모델의 IGV 게놈 브라우저 스냅샷이 표시된다 (FPKM> 0.5 인 전사체 어셈블리만 표시). 확장된 버전은 NUBPL-유도 전사체를 vhga하는 유전자 모델의 영역을 나타낸다. 확장된 버전에서, 상위 트랙은 유전자 모델에 대한 RNA-seq 판독물(reads)의 총 범위를 나타내며, 아래 트랙은 영역에 대해 정렬된 판독물(reads)의 서브세트를 나타낸다. 세 번째 트랙은 NUBPL 단편 (밝은 회색 막대)의 위치뿐 아니라, 반복 및 이동 가능한 요소 (진한 회색 막대)의 위치를 나타낸다. 아래 트랙은 관심 전사체를 포함하는 전사체 어셈블을 포함한다 (RINT1의 경우 asmbl_702530, ARMC9의 경우 asmbl_111852 및 RNF10의 경우 asmbl_680940).
도 13. HEK293 세포의 AAVS1 유전자좌위로 헬레이저 전이에 의해 터보(Turbo) GFP 공여자의 삽입: (a) AAVS1 유전자좌위에서 터보GFP 공여자 및 CRISPR-매개 삽입의 도식 묘사. 헬레이저 LTS 및 RTS 서열은 EF1A 프로모터 및 폴리아데닐화 신호 또한 포함하는 TurboGFP 카세트를 플랭킹한다. AAVS1 유전자좌위에서의 CRISPR/Cas9-매개 삽입을 가능하게 하기 위해, 공여자 서열은 또한 tia1L-특이적 gRNA의 동시 발현 시, 삽입을 유발하는 tia1L 인식 부위와 함께 플랭크되어 있었다. (b) 예측된 gRNA 절단 사이트에 AAVS1 유전자좌위로 TurboGFP 공여자의 정확한 삽입을 증명하는 대표적인 표적화된 클론에서 삽입 부위의 DNA 시퀀싱.
도 14. 헬레이저 전이효소는 삽입된 TurboGFP 공여자의 카피수를 증가시킨다. (a) 도 13에 설명된 터보GFP(TurboGFP) 태깅 카세트의 단일 카피를 포함하는 HEK293 세포는 헬레이저 전이 되었다. 개별 클론을 희석을 제한하여 분리하고 디지털 액적(droplet) PCR (digital droplet PCR, ddPCR) 분석에 의해 분석하여 TurboGFP 카피수를 전이효소 플라스미드로 형질감염 전 (-) 과 후 (+)로 정량하였다. (b) 헬레이저 전이효소 발현 플라스미드로 형질감염 전 (채워진 히스토그램)과 후 (개방된 히스토그램), 헬레이저 터보GFP(TurboGFP) 공여자를 보유하는 HEK293 클론에서의 터보GFP(TurboGFP) 발현의 유세포 분석(Flow cytometric analysis).
도 15: 관심 유전자의 안정적으로 삽입된 복수 카피를 보유하는 세포주를 생산하는 헬레이저 전이효소의 용도. HEK293 세포를 헬레이저 전이효소 및 퓨로마이신 저항성(PuroR) 유전자를 포함하는 트랜스포존 말단 서열 (LTS 및 RTS)을 포함하는 공여자 플라스미드로 형질감염시켰다. HEK293에 대한 PuroR 유전자의 형질감염 및 삽입 후, 1주 동안 1μg/ml 퓨로마이신을 적용하여 세포를 선택하였다. 희석을 제한하여 단일 클론을 수득하고 증식시켰다. 선택된 클론의 게놈 DNA를 디지털 액적 PCR (ddPCR)로 분석하여 PuroR 유전자의 카피수를 정량화하였다. 양성 대조군 ((+) 대조군)으로서, PuroR 유전자의 2개의 카피를 갖는 참조 세포주가 포함되었다. 음성 대조군 ((-) 대조군)으로서, 부모 HEK293(parental HEK293) 세포가 포함되었다.

표 1. M. brandtii 의 TSS 주위 +/- 1 kb 영역에서 헬리트론 풍부 분석을 위한 우연성 카운트 표(contingency count table).
* TSS 주위 +/- 1 kb 영역과 중복되는 헬린트론의 횟수
** 헬리트론과 중복되지 않는 TSS 주위 +/- 1 kb 영역의 수
*** TSS 주위 +/- 1 kb 영역과 중복되지 않는 헬리트론의 수
+ 헬리트론 또는 TSS 주위 +/- 1 kb 영역과 중복되지 않는 (추정되는) 영역의 수 (추정치)
° 왼쪽 p-값은 TSS 주위 +/- 1 kb 영역에서 헬리트론이 고갈될 확률을 나타낸다. 오른쪽 p-값은 풍부 확률(probability of enrichment) 및 우연히 예상되는 것과 다른 양측(Two-Tailed)의 헬리트론 확률을 나타낸다.
표 2. 윗수염박쥐속(Myotis) 게놈에서 최근 활성화된 헬리트론의 3'-말단 분석.
표 3. 후보 NUBPL-유래 전사체. 이 표는 각 후보 NUBPL-유래 전사체에 대한 그것의 ID, 그것이 속한 유전자의 이름, 전사체의 스캐폴드 및 좌표, 및 그것의 조직-특이적인 발현 (있는 경우)을 포함하는 정보를 나열한다. 특정 NUBPL 프로모터 삽입에 대한 정보는 표의 오른쪽에 나열되어 있으며, 공여자 헬리트론 요소, TSS의 요소 거리(우리의 전사체(transcriptome) 어셈블리에 기초하여 주석 달림; 양수는 그것이 TSS와 중복됨을 나타냄), 및 방법에 기술된 것처럼 결정된 그것의 대략적인 연령을 포함한다. 초록색으로 표지된 전사체는 삽입을 포함하는 NUBPL-프로모터에 의해 기증된 TSS의 것이다. 숫자 1과 2는 전사체의 방향을 나타낸다. 1로 표시된 전사체는 NUBPL 프로모터에 의해 표준이 되는 방향으로 유도되는 반면, 2로 표시된 전사체는 반대 방향으로 유도된다. 이 삽입들 중 많은 수는 다른 세 개의 시퀀싱된 애기박쥐과(vespertilionid) 박쥐의 게놈에 존재하나 (M. lucifugus, M. davidii, Eptesicus fuscus), 애기박쥐과(vesper bats)의 다양화를 통한 Helibat 활성과 일치하는, M. brandtii에 특이적인 FOXJ2 및 STX10 유전자를 포함하는 계통-특이적 삽입이 있다 (Thomas et al. (2014)) 9개의 삽입은 표준이 되는 방향으로 그들의 전사를 유도하는 것처럼 보이는 반면, 8개의 삽입은 반대 방향으로 전사체를 유도하여, 포획된 NUBPL 프로모터가 양방향임을 제시한다. 포획된 프로모터 서열의 양 가닥 상에 많은 특징적인 프로모터 서열 특징(예상되는 TF 결합 부위/과하게 나타나는 부위(overrepresented sites) 뿐만 아니라 TATA, CAAT 및 GC 박스)의 존재에 의해 이는 더 지지된다 (데이터 미도시). 작은 세트에도 불구하고, 이러한 유전자들은 GOGO 조건들에 대해 풍요롭게 된다: 단백질 유비퀴틴화 (GO : 0016567, p = 1.295e-02), 유사 분열의(mitotic) G2 DNA 손상 체크포인트에 관여된 신호 형질도입의 조절 (GO : 1902504, p = 1.481e-02), 작은 단백질 접합에 의한 단백질 변형 (GO: 0032446; p=1.66e-02), 작은 단백질 접합 또는 제거에 의한 단백질 변형 (GO: 0070647; p=3.104e-02), 세포소기관 조직 (GO: 0006996; p=3.312e-02), 세포 주기 (GO: 0007049; p=4.082e-02), 및 액틴 중합-의존성 세포 운동성(GO: 0070358; p=4.439e-02).
표 4. 프라이머 목록. 역방향 프라이머가 순방향 프라이머 서열의 역상(reverse complement)인 프라이머 쌍의 경우, 정방향 프라이머 서열만 나타낸다.
표 5는 실시예 2에 기술된 Tia1L-LTS-EF1A-TurboGFP-RTS-Tia1L를 포함하는 태깅 카세트의 서열을 나타낸다.
표 6은 서열 및 그의 상응하는 서열번호의 리스트를 나타낸다.
본원에 기술된 바와 같이, 본 발명은 단일 또는 복수 카피의 DNA 서열을 세포에 도입하기 위한 방법, 시스템 및 분자를 제공한다. 상기 DNA 서열은 관시 유전자를 포함할 수 있거나, 또는 원하는 게놈 서열 또는 더 짧은 핵산 서열일 수 있다. 상기 관심 유전자는 관심 단백질을 암호화할 수 있다.
세포의 DNA 내로 핵산을 도입하기 위한 트랜스포존-기반 시스템은 예를 들어 US 6,489,458에 기재되어 있다.
본원에서 언급된 바와 같이 용어 "컨스트럭트"는 플라스미드 또는 바이러스 벡터(레트로바이러스, 예를 들어, rAAV와 같은 아데노바이러스)로 패키징하기 위한 서열일 수 있는 발현 벡터와 같은 발현 컨스트럭트를 포함한다. 본 발명의 방법에 사용하기에 적합한 컨스트럭트는 당업자에게 익숙할 것이며 본원에 예시된 것을 포함한다. 당업자는 또한 프로모터 서열과 같은 부가적인 성분이 혼입될 수 있다는 것을 인식할 것이다. 적합한 프로모터는 항시 발현(constitutive expression)을 가능하게 하거나 유도성 발현(inducible expression)을 가능하게 할 수 있다.
본 발명에 따른 DNA 분자, 컨스트럭트, 발현 벡터, 플라스미드 등은 임의의 수의 수단, 예를 들어, 전기천공(electroporation), 미세주입(microinjection), 양이온성 지질 소포, DNA 축합 시약, DNA 나노입자 또는 침전 기술과 결합, 및 바이러스 벡터로 혼입을 포함하는 수단에 의해 세포에 도입될 수 있다.
적절하게는, 트랜스포존-발현 헬퍼 플라스미드로서의 전이효소 및 태그된 트랜스포존(LTS 및 RTS에 의해 플랭크된 관심 유전자를 포함함)을 포함하는 상응하는 컨스트럭트는 태그된 트랜스포존 및 전이효소-발현 헬프 플라스미드를 포함하는 2-구성요소(bi-component) 전이 시스템에서 제공된다. 대안적으로, 1-구성요소 시스템, 예를 들어, LTS/RTS 플랭크된 트랜스포존에 존재하는 전이효소가 제공될 수 있다. 하나의 구성요소 시스템이 전달하기 더 쉬울 수 있지만, 전이효소 및 전이효소 기질이 공간적으로 분리되어 있기 때문에, 안전성 측면에서 2-구성요소 시스템이 바람직할 수 있다. 결과적으로, 2-구성요소 시스템으로, 전이효소 플라스미드가 사라지면 전이 반응은 끝나고 트랜스포존은 세포에 더이상 존재하지 않는다. 이것은 통제되지 않은 방식으로 발생할 수 있는 계속되는 전이를 예방할 수 있다.
헬레이저 트랜스포존의 용도
일 실시양태에서, 헬리트론 전이효소를 암호화하는 플라스미드는 전이효소 단백질의 발현을 유도하는 포유류 세포에 도입될 수 있다. DNA의 영역을 암호화하는 DNA 서열을 포함하는 공여자 DNA가 또한 첨가되거나 이미 존재하며, 그 중 단일 또는 복수 카피의 DNA는 RTS 및 LTS 서열에 의해 플랭크된 게놈 내에 위치한다. 전이효소의 도입 이후, 상기 공여자 DNA는 복제되고 상기 게놈 내 복수의 부위로 도입된다. 따라서, 일 측면에서, 본 발명은 단일 또는 복수 카피가 요구되는 DNA의 영역을 포함하는 공여자 DNA를 제공하며, 상기 공여자 DNA는 LTS 및 RTS 서열에 의해 플랭크된다.
참조 표준(Reference standards)
공여자 DNA는 참조 표준을 생성하는데 사용될 수 있는 세포주를 생성하는데 사용될 수 있다. 따라서, 본 발명은 관심 유전자의 단일 카피를 갖는 세포주가 먼저 생성되는 관심 유전자의 복수 카피를 포함하는 세포주를 생성하는 방법을 제공하며, 상기 관심 대상 유전자는 적어도 LTS 헬라이저 말단 서열 (및, 선택적으로, 또한 RTS)에 의해 플랭크된다. 일 실시양태에서, 상기 관심 유전자는 유전자 편집 기술에 의해 플랭킹 LTS 및 RTS가 플랭크된 내인성 유전자일 수 있다. 다른 실시양태에서, 상기 관심 유전자는 도입되거나 비-내인성 유전자일 수 있다. 적합하게는 상기 "관심 유전자"는 복제하는 것으로 알려진 유전자 또는 그 일부일 수 있다. 따라서, 다른 실시양태에서, 상기 공여자는 암과 같은 특정 질병에서 복제하는 것으로 알려진 DNA의 영역을 나타내고, 그 존재는 질환에 대한 진단을 제공하는 것을 돕는데 이용될 수 있다. 참고 표준으로서 유용할 수 있는 유전자의 예로는 ERBB2/Her2, MET, CDK4 또는 CD274/PD-L1 이 있다.
참고 표준을 생성하기 위해, 본 발명에 따른 방법은 바람직하게 알려진 카피수를 갖는 클론을 선별하는 단계 및/또는 정의된 커피수를 얻는 것과 같은 방식으로 세포를 생성하는 단계를 포함할 수 있다. 참고 표준을 생성하는데 사용될 수 있는 세포주는 예를 들어, CHO 세포, HAP1 또는 eHAP 세포주 를 포함한다.
단백질 생산
생물의약품 약물 발굴은 포유류 세포-기반 제조 플랫폼에서 재조합 단백질의 발현에 의존한다. 이러한 안정적으로 발현하는 숙주 세포의 생성은 복잡하고 힘든 스크리닝 방법론이 필요하다. 이전의 기술은 표적 포유류 세포의 게놈에 재조합 트랜스진(transgene) 카세트를 무작위로 삽입하는 것에 의존한다. 컨스트럭트된 세포는 광범위한 발현, 성장 및 안정성 특성을 갖는다. 상업적으로 실행 가능한 생산 숙주 세포를 수득하기 위해, 수백 개의 클론들을 스크리닝한다. 또한, 관련된 저항성 유전자, 예를 들어 글루타민 합성효소(glutamine synthase), 디하이드로엽산 환원효소(dihydrofolate reductase)의 선택 압력을 증가시킴으로써 트랜스진의 증폭 과정을 사용할 수 있다. 이 과정은 트랜스진 발현의 불안정성을 야기하는 트랜스진 카세트를 증폭하는 동안 부정확한 경향이 있다. 다수의 다른 적합한 세포주가 당업자에게 익숙하고 NS0 쥐 골수종(murine myeloma), PER.C6®, 유햄스터 신장(Baby Hamster kidney), 인간 배아 신장(Human embryonic kidney (HEK293)), 닭 배아 섬유아세포(Chicken embryo fibroblast), 마딘 다비 소 신장(Madin Darby bovine kidney), 마딘 다비 개 신장(Madin Darby canine kidney) 및 베로 세포(VERO cells)를 포함하더라도, 중국 햄스터 난소 세포(Chinese hamster ovary cells, CHO cells)는 치료용 생물 제제의 제조를 위한 기본 발현 숙주로 남아 있다.
헬레이저 전이효소 단백질은 스크리닝을위해 감소된 세포 패널을 효율적으로 생성하기 위해 이전 시스템에 비해 이점을 제공한다. 단일 단계에서, RTS 및/또는 LTS에 의해 플랭크된 복수 카피의 트랜스진을 높은 빈도로 표적 세포의 게놈에 혼입시킬 수 있다. 상기 혼입은 표적 세포의 게놈 내의 공지된 핫 스팟을 표적으로 할 수 있다. 헬레이저 전이효소 단백질의 복사 및 붙여넣기 활성은 이전에 게놈에 혼입된 서열을 더 증폭시키는데 이용될 수 있다. 이는 예를 들어, 메티오닌 설폭시이민(methionine sulfoximine) 또는 메토트렉세이트(methotrexate)와 같은 화학적 처리를 필요로하지 않고, 단일 삽입 부위 또는 복수 부위로부터 나올 수 있다. 힘든 스크리닝 단계를 없앰으로써 원하는 성장 및 안정성 특성을 갖는 고생산 세포를보다 신속하게 동정할 수 있다. 일 실시예에서, 이 시스템은 확립된 생체 생산 라인에서 존재하는 트랜스진을 증폭시키는데 사용될 수 있다.
따라서, 또 다른 실시양태에서, 전이효소에 의해 삽입된 단백질의 다중 카피를 운반하는 세포에 의해 생산되는 항체와 같이, 상기 공여자 DNA는 치료용 단백질을 암호화할 수 있다. RTS 및 LTS 서열을 갖는 항체를 포함하는 발현 카세트를 플랭킹하고, 이를 전이효소를 갖는 적합한 세포형(예, CHO)에 도입함으로써, 많은 카피의 카세트를 게놈에 삽입하여 단일 삽입 이벤트와 비교하여 더 높은 발현 수준을 유도한다.
세포 및 유전자 치료
일 실시양태에서, 본 발명은 관심 핵산 또는 관심 유전자를 그 핵산이 필요로 하는 대상(subject)에 도입하는 시스템을 제공한다. 적합하게는 대상은 식물, 포유류, 인간 세포 등과 같은 임의의 진핵 세포일 수 있다.
인간 환자와 같은 대상자가 기능 돌연변이의 상실과 관련된 병리(pathology)를 가지고 있는 경우, 유전자 치료는 건강을 회복시킬 잠재력을 가지고 있다. 유전자 치료법은 발현 컨스트럭트를 환자의 세포 내로 도입하는 것을 포함한다. 이것은 생체 외(ex vivo) 또는 생체 내(in vivo)에서 수행할 수 있으며, 생체 외 적용은 보다 안전하고 간단하다.
적절한 전이효소의 존재 하에서, 헬레이저 트랜스포존의 LTS 및 RTS 서열에 의해 플랭크된 서열은 염색체 DNA에 효율적으로 삽입된다 (도 1 참조). 헬레이저 트랜스포존의 복사 및 붙여넣기 특성은 도입된 유전자 서열의 복수 카피를 갖는 형질도입된 세포의 높은 비율을 초래한다 (도 3 및 도 15 참조).
따라서, 본 발명은 일단 환자에게 재도입된 조작된 세포를 생성하는데 사용될 수 있는 시스템 및 방법을 설명하며, 이는 현존 기술에서 요구되는 것보다 낮은 비율의 편집된 세포로 치료되는 병리학에 대한 손실된 기능의 회복을 달성할 수 있다. 따라서, 본 발명은 이것이 효소, 호르몬, 성장 인자, 사이토카인 또는 응고 인자인지 여부에 관계없이, 손실된 분비된 단백질에 의해 유발된 병리를 치료할 수 있는 조작된 세포를 생성시키는데 사용될 수 있다.
또한, 치료용 항체의 도입은 세포 신호 전달이 방해받는 상황에서 유익할 수 있다. 조작된 세포는 환자의 적절한 부위에서 치료용 항체를 분비하기 위해 사용될 수 있으며 복수 카피 삽입을 위한 헬리트론 시스템의 경향은 이전에 보고된 시스템보다 더 높은 발현 수준을 제공한다.
본 발명에 따른 방법에 사용하기에 적합한 세포는 치료하고자 하는 질환에 따라 달라질 수 있는 표적화에 유리한 세포의 유형 (즉, 표적 세포)에 의존한다. 적절한 인간 표적 세포는 간세포, 췌장 세포, 골격근 세포, 섬유아세포, 망막 세포, 윤활 관절(synovial joint) 세포, 청력 과정에 관여하는 세포, 폐 세포, T 세포, B 세포, 대식세포, NK 세포, 뉴런, 신경교세포, 줄기 세포, 내피 세포 및 암 세포를 포함한다. 따라서, 대상에 사용하기에 적합한 세포주를 분리하는 것에 대한 언급은 외부 공급원으로부터 이용 가능한 적합한 세포주를 선택하거나 치료를 필요로 하는 대상자로부터 세포주를 생성하는 것을 의미할 수 있다.
일 실시양태에서, 본 발명의 방법은 CAR T 세포와 같은 치료용 세포를 생성하는데 적용 가능할 수 있다.
적절한 줄기 세포는 조혈, 신경, 배아, 유도만능 줄기 세포(iPS), 간엽, 중배엽, 간, 췌장, 근육, 망막 등의 줄기 세포를 포함하는 인간 줄기 세포와 같은 포유 동물을 포함한다. 또한, 마우스 배아 줄기 세포를 포함하는 마우스 줄기 세포와 같은 적절한 포유류 줄기 세포가 포함된다.
본 발명은 또한 인간 환자와 같은 대상에게 관심 유전자의 도입을 가능하게하는 시스템을 제공하고, 따라서 질환을 치료하는 방법 및 약학적 조성물을 제공한다. 유리하게는, 헬리트론 시스템은 바이러스를 대체할 수 있으며, 제조 비용이 저렴하고 면역 원성이 적으며 후성적 침묵(epigenetic silencing) 가능성이 적다.
기타 용도
본원에 기술된 복사 및 붙여넣기 트랜스포존을 포함하는 트랜스포존 시스템 또는 방법은 또한 돌연변이 유발 기술을 위한 도구로서 사용될 수 있다.
본 발명의 측면 및 실시양태는 하기 청구항에 표시된다:
1. 복사/붙여넣기 전이효소 및 상기 전이효소에 의해 인식되는 공여자 DNA를 포함하는 단리된 또는 배양된 세포에서 복수 카피의 DNA 서열을 생성하기 위한 시스템.
2. 제1항에 있어서, 상기 전이효소는 헬리트론 트랜스포존에 의해 암호화되는, 시스템.
3. 제1항 또는 제2항에 있어서, 상기 전이효소는 서열번호 1과 적어도 80%의 상동성을 갖는 헬리트론 전이효소인, 시스템.
4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 공여자 DNA는 서열번호 3으로 기재되는 LTS 핵산 서열 및 서열번호 4로 기재되는 RTS 핵산 서열에 의해 플랭크되는, 시스템.
5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 전이효소는 서열번호 1로 기재되는 아미노산 서열을 갖는 헬레이저 전이효소인, 시스템.
6. 헬리트론 전이효소 및 공여자 DNA가 세포 내로 도입된 게놈에 복수 카피의 DNA 서열을 도입하는 방법.
7. 제6항에 있어서, 상기 전이효소 및 공여자 DNA는 별개로 공급되는, 방법.
8. 제6항에 있어서, 상기 전이효소 및 공여자 DNA는 동일한 DNA 컨스트럭트상에 공급되는, 방법.
9. 제6항에 있어서, 상기 전이효소는 RNA 또는 단백질 형태로 도입되는, 방법.
10. 공여자 DNA가 먼저 세포의 게놈에 도입되고 그 다음 헬리트론 전이효소가 도입된 게놈에 복수 카피의 DNA 서열을 도입하는 방법.
11. RTS 및 LTS 서열이 내인성 유전자를 플랭크한 게놈에 복수 카피의 DNA 서열을 도입하는 방법.
12. 제11항에있어서, 상기 RTS 서열은 게놈 표적화 방법을 이용하여 도입되는, 방법.
13. 제11항에 있어서, 상기 방법은 RTS를 도입하기 위해 CRISPR, ZFN, TALEN 또는 rAAV 기술을 사용하는, 방법.
14. 제11항에 있어서, 상기 LTS 서열은 게놈 표적화 방법을 이용하여 도입되는, 방법.
15. 제14항에 있어서, 상기 방법은 LTS를 도입하는 데에 CRISPR, ZFN, TALEN 또는 rAAV 기술을 사용하는, 방법.
16. 바람직한 DNA는 RTS 및 LTS에 의해 플랭크된 게놈에 무작위로 삽입되고 이어서 헬리트론 전이효소가 도입된 게놈에 복수 카피의 바람직한 DNA를 도입하는 방법.
17. 제6항 내지 제16항 중 어느 한 항에 있어서, 상기 게놈은 포유류 게놈으로 구성되는, 방법.
18. 제17항에 있어서, 상기 게놈은 CHO 게놈인, 방법.
19. 제6항 내지 제16항 중 어느 한 항에 있어서, 상기 게놈은 반수체(haploid) 게놈인, 방법.
20. 제1항 내지 제5항 중 어느 한 항의 시스템 또는 제6항 내지 제19항 중 어느 한 항의 방법에 의해 도입된 복수 카피의 바람직한 DNA를 포함하는 포유류 세포.
21. DNA 또는 RNA 분자 참고 표준(reference standard)으로서 사용되는 포유류 세포.
22. IHC 참고 표준으로 사용되는 제20항의 포유류 동물.
23. 바람직한 DNA에 의해 암호화된 단백질의 생산을 위해 사용되는 제20항의 포유류 세포.
24. 제20항의 세포로부터 단리된 핵산.
본 발명의 다양한 추가적인 측면 및 실시양태는 본 개시의 관점에서 당업자에게 자명할 것이다.
이 명세서에 언급된 모든 문서는 그 전체가 참조로 본원에 통합된다.
"및/또는"은 여기에 사용된 경우, 두 개의 특정된 특징 또는 다른 하나를 갖거나 갖지 않은 구성요소 각각의 구체적인 개시로 간주되어야 한다. 예를 들어, "A 및/또는 B"는 각각 (i) A, (ii) B 및 (iii) A 및 B의 각각의 구체적인 개시로 간주된다.
문맥에 달리 명시되지 않는 한, 전술한 특징의 설명 및 정의는 본 발명의 임의의 특정 측면 또는 실시양태에 한정되지 않으며, 기술된 모든 측면 및 실시양태에 동등하게 적용한다.
본 발명의 특정 측면 및 실시양태는 실시예로 그리고 전술한 도면 및 하기에 기술된 표를 참조하여 이제 설명될 것이다.
실시예
실시예 1 - 헬레이저 정의( Helraiser characterisation)
방법
컨스트럭트 및 PCR
PCR을 위한 프라이머 서열 뿐만 아니라 트랜스포존 및 전이효소 발현 벡터의 상세한 클로닝 절차가 다음과 같이 제공된다:
전이효소 벡터. 헬레이저 전이효소의 암호화 영역은 인간 코돈 최적화 후 GenScript에 의해 합성되었고, SpeI/XhoI에 의해 발현벡터 FV4a로 클로닝되어(Liu ZJ, Moav B, Faras AJ, Guise KS, Kapuscinski AR, Hackett PB. Development of expression vectors for transgenic fish. Bio/technology 8, 1268-1272 (1990)) 전이효소 헬퍼 플라스미드 pFHelR을 수득하였다. MYPYDVPDYAYPYDVPDYA를 암호화하는 합성 이중-가닥 올리고뉴클레오타이드로서 N-말단 2XHA-태그를 pFHelR의 SpeI 부위에 삽입하여 pF-HA-HelR을 수득하였다. CMV 프로모터-구동하는 전이효소 발현 플라스미드 pCHelR은 pFHelR의 SpeI/XhoI 단편을 pcDNA3.1(-)(Invitrogen)의 NheI/XhoI 부위에 삽입함으로써 생성되었다. pCHelRGFP 플라스미드를 생성하기 위해, (B. Schroeder, MDC로부터) pMSCV20Ires-GFP의 XhoI/NotI 단편을 pCHelR의 XhoI/NotI 부위에 삽입하였다. 전이효소 촉매 돌연변이 발현 플라스미드는 pCHelR을 주형으로 이용하여 돌연변이 유발 PCR에 의해 생성되었다. GENEART(Invitrogen)에 의해 합성된 헬레이저 전이효소 암호화 서열을 NcoI 및 XhoI 제한 효소 부위를 이용하여 pFastBac HT-A(Invitrogen)에 서브 클로닝함으로써, 곤충 세포에서 헬레이저 단백질 발현에 사용되는 트랜스포존 벡터를 생성하였다.
트랜스포존 벡터
GeneScript에 의해 합성된 Helibat1(pHelR), HelibatN1, HelibatN2 및 HelibatN3의 공통(consensus) LTS 및 RTS 서열 사이에 SV40-퓨로(puro) 또는 SV40-네오(neo) 선별 카세트를 클로닝하였다 (도 8). 트랜스포존 공여자 벡터 pHelRΔHP, pHelRMut, pHelRATH, pHelRStemX 및 pHelRLoopX는 트랜스포존 3'-말단의 팔린드롬 서열의 결실 또는 치환에 의해 생성되었다. pHelRMut 및 pHelRΔHP 벡터는 프라이머 쌍을 이용하여 결실(deletion) PCR에 의해 생성되었다: Hel-Mut fwd/Hel-Mut rev, 및 HelRDelH fwd 및 HelRDelH rev 각각. HelRATH 및 pHelRLoopX 공여자 플라스미드를 생성하기 위해 4개의 올리고뉴클레오티드 ATH1, ATH2, ATH3, ATH4 및 LX1, LX2, LX3, LX4 각각을 등몰 비율로 어닐링하였다 (0.8 μM 각 올리고, 0.2 mM dNTP mix 및 1 ㎕ PfuUltra II Fusion HotStart DNA Polymerase(Agilent technologies)/50 ㎕ 반응액). 올리고 어닐링 반응을 위한 온도 프로파일은 95℃에서 20초, 72℃에서 10초가 10 사이클이었다. 어닐링 반응액 1 ㎕를 ATH5/ATH6 및 LX5/LX6 프라이머 쌍을 이용하여 각각 ATH 또는 LX 단편의 PCR 증폭을 위해 사용하였다. 최종 단계에서, ATH 및 LX PCR 단편을 SpeI 및 BamHI로 절단(digest)시키고 pHelR의 SpeI/BamHI 부위에 클로닝시켰다. pHelRStemX 트랜스포존 공여자 플라스미드를 생성하기 위해, 프라이머 SX fwd 및 SX rev와 함께 돌연변이 유발 PCR에서 pHelRATH를 주형으로 사용하였다. PCR 반응 후, 선형 단편의 말단을 함께 라이게이션(ligation)하여 pHELRStemX를 생성시켰다. pHelRΔRTS를 생성하기 위해, pHelR을 SpeI/BamHI 제한 효소로 절단하였다. 제한 부위는 Klenow(Fermentas)로 평활하게 하고(blunt) 다시 라이게이션하였다. pHelRΔLTS 공여자 플라스미드는 Hel1C 백본의 NdeI 및 EcoRI 절단한 다음, 제한 부위의 Klenow 처리 및 벡터 백본 재-라이게이션을 통해 생성되었다. pHelRPN 및 pHelRΔHPN 공여자 플라스미드는 pUC19SBneo벡터로부터의 SpeI 단편(Grabundzija I, et al. Comparative analysis of transposable element vector systems in human cells. Mol Ther 18, 1200-1209 (2010))을 각각 pHelR 및 pHelRΔHP 벡터의 SpeI 부위에 삽입함으로써 생성되었다. 헬리트론 서클 공여자 플라스미드 pHelRCD를 생성하기 위해, pWAS-EGFP의 NotI/BamHI 단편을 pGFP-N1 플라스미드(Clontech)의 NotI/BamHI 부위에 클로닝함으로써 첫 번째 pIRES-EGFP-N1 벡터를 제작하였다. 이어서, pIRES-EGFP-N1 플라스미드의 EcoRI/BamHI 단편을 pHelR 플라스미드의 EcoRI/BamHI 부위에 클로닝하여 pHelRCD를 생성시켰다. pHelRCneo 벡터는 pHC 플라스미드로부터의 BamHI/EcoRI 단편(HeLa 세포에서 pHelRCD 공여자 플라스미드로부터의 헬레이저 전이를 통해 생성됨)을 pcDNA3.1(-)의 BamHI/MfeI 부위에 삽입함으로써 생성되었다. 다음 단계에서, pHelRCneo의 네오(neo) 암호화 서열을 AvrII/BamHI 제한 부위를 사용하여 pHel1C 플라스미드로의 퓨로(puro) 암호화 서열과 교환하여 pHelRCpuro 벡터를 생성하였다. 트랜스포존 3'-말단, pHelRCΔHPpuro에서 팔린드롬 서열의 결실을 갖는 헬리트론 서클 벡터는 pHelRCpuro를 주형으로 하고 Hel-Mut fwd/Hel-Mut rev 프라이머 쌍을 이용하는 부위 특이적 돌연변이 유발 PCR을 통해 생성되었다. PCR에 의해 생성 되는 모든 암호화 영역 및 트랜스포존 컨스트럭트의 온전함은 DNA 시퀀싱에 의해 확인되었다.
세포 및 형질감염(transfection)
2×105 HeLa 세포를 형질감염 하루 전에 6-웰 플레이트 상에 접종하였다. 2 μl의 jetPRIME 형질감염 시약(Polyplus Transfection)과 200 ㎕의 jetPRIME 완충액을 사용하여 1 ㎍의 DNA를 형질감염시켰다 (각 형질감염 반응에는 500 ng 트랜스포존 공여자와 500 ng 전이효소 헬퍼 또는 pBluescript 벡터(Stratagene)를 포함하고 있다). 형질감염 후 48시간 째에, 형질감염된 세포 (10 또는 20 %)의 일부를 100 mm 접시에 다시 놓고 트랜스포존 삽입(2 ㎍/㎖ 퓨로 또는 2 ㎍/㎖ 퓨로 및 1.4 mg/㎖ G418)을 위해 선별하였다. 2-3주 간의 선별 후, 콜로니를 인산염-완충 식염수 (PBS, phosphate-buffered saline)에서 4% 파라포름알데히드 (PFA, paraformaldehyde)에 채취하거나 고정시키고 콜로니 계수 및 분석을 위해 PBS에서 메틸렌 블루로 염색시켰다.
스플린커렛(splinkerette) PCR에 의한 삽입 부위 및 카피수 분석
트랜스포존 카피 수는 하기와 같이 스플린커렛 PCR에 의해 결정되었다:
HeLa 세포 클론을 6-웰 플레이트에 가득찰 때(confluency)까지 성장시키고, PBS로 세척하고 용해 완충액(100 mM Tris pH 8.0, 5 mM EDTA, 0.2 % SDS, 200 mM NaCl 및 100 ㎍/㎕ 프로테이나아제(proteinase) K)에서 흔들어주면서 55℃에서 밤새 배양하였다. HeLa 게놈 DNA (gDNA)은 표준 페놀/클로로포름 추출로 용해된 세포로부터 분리되었다. 5 ㎍의 gDNA를 4시간 동안 FspBI로 절단한(digest) 후 에탄올 침전시켰다. 다음 단계에서, 20 ㎕ 반응액에서 BfaI 스플린커렛 어댑터 (100 pmol)에 샘플을 라이게이션 (300 ng)했다. 라이게이션 반응액 3 ㎕를 프라이머인 링커 프라이머 및 Hel1와 함께 첫 번째 PCR에 사용하였다. 첫 번째 PCR 라운드의 온도 프로파일은 다음과 같다: 94℃에서 3분 동안 1 사이클에 이어서, 94℃에서 30초, 70℃에서 30초, 72℃에서 30초를 15 사이클; 94℃에서 30초, 63℃에서 30초, 사이클 당 2초씩 증가하는 72℃에서 2초를 5 사이클; 94℃에서 30초, 62℃에서 30초, 사이클 당 2초씩 증가하는 72℃에서 12초를 5 사이클; 94℃에서 30초, 61℃에서 30초, 사이클 당 2초씩 증가하는 72℃에서 22초를 5 사이클; 및 94℃에서 30초, 60℃에서 30초, 72℃에서 30초를 5 사이클. 네스티드 PCR(Nested PCR)은 프라이머 Nested 및 Hel2, 및 50 ㎕ 반응액 당 첫 번째 PCR의 1:100 희석액 1 ㎕으로 수행되었다. 네스티드 PCR에 대한 온도 프로파일은 94℃에서 3분 간의 1 사이클로 시작하여, 이어서 94℃에서 30초, 65℃에서 30초, 72℃에서 30초를 10 사이클 및 94℃에서 30초, 55℃에서 30초, 72℃에서 2분을 20 사이클이었다. 최종 신장은 72℃에서 5분 동안 수행되었다.
pHelR, pHelRΔHP 및 pHelRΔRTS 트랜스포존으로 생성된 헬레이저 삽입물의 3' 말단에서 트랜스포존-게놈 접합 부위를 분석하기 위해, HeLa 클론으로부터 단리된 gDNA를 사용하여 첫 번째 왼쪽-말단 스플린커렛 PCR을 수행하여 트랜스포존 삽입의 게놈 위치를 결정하였다. 다음 단계에서, 각 트랜스포존 삽입물의 50과 100 bp 하류 사이에 위치하는 게놈 서열에 상보적인 특정 프라이머를 디자인하고 (WT6a, WT6b, WT6c, WT6d, DelH2, DelH14, DelH19, DelRTS2, DelRTS15a), 헬레이저 트랜스포존의 5'-말단에 서열과 상보적인 HelCD1 프라이머와 함께 게놈 PCR에 사용하였다. PCR의 온도 프로파일은 95℃에서 2분, 이어서 95℃에서 20초, 57℃에서 20초, 72℃에서 90초를 40 사이클이었다. 최종 연장 단계는 72℃에서 5분 동안 수행되었다. 게놈 PCR에서 수득된 PCR 산물을 시퀀싱하고 분석하였다.
서클 검출 어세이(Circle detection assay)
저분자량 DNA를 형질감염된 HeLa 세포로부터 분리하고 변형된 인버스 PCR(inverse PCR) 방법에서 사용하여 헬리트론 서클을 검출하였다. HeLa 세포에서의 헬레이저 서클 형성은 서클 검출(circle detection) PCR에 의해 확인되었다. 먼저, 2×105 HeLa 세포를 형질감염 하루 전에 6-웰 플레이트 상에 접종하였다. 형질감염 48시간 후, 세포 용해 단계에서 P2 완충액 대신에 50 ㎍의 프로테이나아제 K가 보충된 300 ㎕ 1.2% SDS를 사용하여 변형된 Qiagen QIAprep Spin Miniprep 프로토콜을 이용하여 세포로부터 플라스미드를 분리하였다. 플라스미드 분리 과정의 나머지는 제조자의 프로토콜에 따라 수행하였다. 150 ng의 분리된 플라스미드를 프라이머 Hel1 및 Hel5를 이용하는 PCR에 사용하였다. PCR를 위한 온도 프로파일은 98℃에서 2분, 이어서 98℃에서 10초, 59℃에서 15초, 72℃에서 10초를 34 사이클이었다. 최종 연장 단계는 72℃에서 5분 동안 수행되었다.
HeLa 세포에서의 헬레이저 재-전이
헬레이저 전이 효소를 발현하는 세포는 4개의 매핑된 헬레이저 삽입물을 포함하는 HeLa-유래된 트랜스포존 공여자 H1 세포주를 pCHelRGFP 헬퍼 플라스미드로 반복적으로 형질감염시키고 GFP+ 세포를 분류함으로써 농축되었다. 그런 다음 우리는 농축된 세포 집단의 풀링된 DNA를 트랜스포존 삽입 부위의 고-처리량(high-throughput) 시퀀싱에 적용하였다.
재-전이 어세이를 위해, H1 세포를 100 mm 플레이트 (2 ㎍/㎖ 퓨로마이신) 에 가득찰 때(confluency)까지 성장시켰다. 형질감염 하루 전에, 2×106 개의 세포를 새로운 100-mm 플레이트에 접종하였다. 20 ㎕의 jetPRIME 형질감염 시약 및 500 ㎕의 jetPRIME 완충액을 사용하여 3.5 ㎍의 pCHelRGFP 플라스미드를 세포에 형질감염시켰다. 형질감염 48시간 후, 세포를 GFP 발현을 위해 FACS-분류하고, 5×105 GFP-양성 세포를 150-mm 플레이트(2 ㎍/㎖ 퓨로마이신) 상에 놓고 1주일 동안 성장시켰다. 전 주에 FACS-분류된 형질감염을 위한 세포를 이용할 때마다, 사이클 사이에 이 과정을 7일 동안 2번 더 반복하였다. 세포를 형질감염시키고 세 번째로 FACS로 분류한 후, 150-mm 플레이트(2 ㎍/㎖ 퓨로마이신)에 가득찰 때(confluency)까지 성장시키고 게놈 DNA 분리 및 삽입 부위 분석을 위해 모았다.
전장 게놈(genome-wide) 삽입 부위 분석
HeLa 세포를 이전에 pCHelR 및 pHelR로 기술한 바와 같이 형질감염시켰다. 형질감염 3주 후, 퓨로-저항성 콜로니를 모으고 gDNA를 분리하였다. 트랜스포존 말단을 플랭킹하는 DNA 서열을 인간 게놈(hg19)에 대해 Bowtie와 매핑되어 하나의 미스매치까지 허용하였다 (Langmead B, Trapnell C, Pop M, Salzberg SL. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome biology 10, R25 (2009)). 게놈에 매칭되는 매핑된 리드(read)들만 오류없이 보관되었다. 동일한 게놈 위치에 매핑되는 불필요한 리드가 함께 병합되었다. 우리는 트랜스포존 말단의 마지막 4개의 염기와 매칭되는 게놈 위치로의 모든 삽입을 버렸다. 왜냐하면 이 부위들은 미스프레이밍(misprimeing) artifacts) 인공물(artifacts)이 될 수도 있기 때문이다. 더 자세한 내용은 아래에 제공된다.
삽입 부위 및 융합-전사체 라이브러리 구축(Integration site and fusion-transcript library construction)
삽입 부위 및 융합-전사체 라이브러리의 생성은 계산-지원되는 헤미-특이적(hemi-specific) PCR 방법에 기초하였다. PCR 어세이는 3'-말단에 4개의 특이적 뉴클레오티드(4-mer)만을 운반하는 헤미-특이적 프라이머(Ewing AD, Kazazian HH, Jr. High-throughput sequencing reveals extensive variation in human-specific L1 content in individual human genomes. Genome research 20, 1262-1270 (2010) Genome research 20, 1262-1270 (2010))의 사용에 이어서 무작위 서열 및 특이적 오버행(overhang)에 달려있다. 네스티드 PCR 증폭을 위해 이들 유전자좌위를 태그하기 위해, 이들 프라이머는 주형 게놈 DNA, 또는 cDNA 각각의 트랜스포존-게놈 또는 트랜스포존-게놈 전사체 접합부의 주위에 어닐링되어야 한다. 헤미-특이적 프라이머의 4-mer는 계산적으로 설계되었다. 트랜스포존 서열 또는 프라이머 오버행에서 원하지 않는 앰플리콘(amplicon)을 유발할 수 있는 것들을 제외하고, 가능한 4-mer를 인간 게놈 또는 전사체(transcriptome)에서의 표시에 의해 평가하였다. 유사하게, 6개의 4-mer의 조합을 예측하기 위해 알고리즘을 수행하였으며, 이는 인간 게놈 또는 전사체(transcriptome), 및 사용된 트랜스포존 벡터에 대해 가장 포괄적인 라이브러리를 생성한다. 다음으로, 인덱싱된 일루미나-유세포(Illumina-flow cell) 호환이 되는 융합 전사체 또는 인터그롬(integrome) 라이브러리를 얻기 위해, 다단계 PCR 기법을 수행했다.
삽입물-라이브러리의 준비 및 인간 게놈에서의 헬리트론 트랜스포존의 삽입 부위의 고-처리량 시퀀싱
퓨로마이신 저항성 HeLa 콜로니의 풀에서 분리한 300 ng의 DNA를 6개의 다른 헤미-특이적 프라이머를 포함하는 초기 6개의 평형(parallel) PCR 반응을 위한 주형으로 사용하였고, 하기의 조건으로 수행하였다: 5' 헬리트론 트랜스포존 말단을 위해: 동일한 프로그램이나 62℃ 어닐링 온도로, 5'-헬리트론 서열에 특이적인 5 pmol의 Hel_Lft_1 또는 3'-트랜스포존 말단에 특이적인 5 pmol의 Hel_3P_1로 95℃에서 1분, (94℃에서 30초, 65℃에서 30초, 72℃에서 30초) 40 사이클, (94℃에서 30초, 25℃에서 1분, 0.2℃/초로 72℃로 오르고, 72℃에서 1분) 2 사이클. 첫 번째 PCR 반응액을 5'-에 대한 15 pmol의 Hel_Lft_2 및 3'-트랜스포존 말단에 대한 Hel_3P_2 각각을 포함하는 25 ㎕의 PCR 마스터 믹스로 보충하였다. 5'-말단을 위한 PCR 프로그램은 다음과 같다: [(94℃에서 30초, 65℃에서 30초, 72℃에서 30초) 3 사이클, (94℃에서 30초, 60℃에서 30초, 72℃에서 40초) 1 사이클] 15 슈퍼-사이클. 3'-말단을 위한 어닐링 온도는 3 사이클 동안 사용되었다. PCR 생성물을 컬럼-정제하고, 30 ㎕의 용출액(elute)의 2 ㎕를 5'-에 대한 프라이머 PE_first 및 3'-트랜스포존 말단에 대한 Hel_L_bc 각각으로 하기의 사이클링 조건을 이용하여 제1 지수(exponential) PCR에 사용하였다: 95℃에서 30초, 94℃에서 30초, 65℃에서 30초, 72℃에서 1분을 20 사이클. 3'-트랜스포존 말단을 위한 어닐링 온도는 58℃였다. 1 ㎕ 10배 희석한 제1 지수 PCR 생성물을 다음과 같은 사이클링 조건으로 Pfx 중합효소(Life Technologies)를 이용하여 일루미나 어댑터에 추가하는데 사용하였다: 95℃에서 30초, 94℃에서 15초, 68℃에서 1분을 20 사이클. 최종 PCR 생성물을 아가로스 겔상에 작동시키고 200 내지 500 bp 사이의 증폭물을 절제하고 컬럼-정제 하였다 (Zymoclean Gel DNA Recovery Kit, Zymo Research). 결과로 나온 라이브러리의 시퀀싱은 Beckman Coulter Genomics Danvers Massachusetts USA 시퀀싱 시설에서 Illumina HiSeq 2500 기기를 사용하여 수행되었다.
미가공(raw) 리드들은 다음과 같이 매핑을 위해 처리되었다. 5개의 염기 중 2개가 프레드 점수 20보다 낮은 품질 암호화를 갖는 즉시, 얻어진 리드들은 'N' 염기를 포함하는 리드를 생략하고 리드를 다듬음으로써 품질 필터링하였다. 24개의 염기들보다 짧은 모든 다듬어진 리드들을 제외하였다. 나머지 서열을 Bowtie (Langmead et al. (2009))로 h19 인간 게놈 어셈블리에 대해 매핑하였다.
단백질 발현 및 정제
QuikChange 부위-특이적 돌연변이 유발 방법(Agilent)을 사용하여 점 돌연변이를 만들었다. 바큘로 바이러스 생산 및 단백질 발현은 국립 암 연구소(National Cancer Institute)의 단백질 발현 연구소(Protein Expression Laboratory)에 의해 하기와 같이 수행되었다:
세포 펠렛을 니켈 친화성 컬럼 결합 완충액 (20 mM NaH2PO4 pH 7.4, 500 mM NaCl, 50 mM 이미다졸, 1 mM TCEP)에 재현탁시켰다. 모든 후속 단계는 4℃에서 수행되었다. 용해는 세포를 얼음에서 30분간 인큐베이션한 다음 Misonix Sonicator 3000으로 초음파 처리(82 W에서 3분간 정지와 함께 5×20-초 펄스)하여 수행되었다. 용해성 분획을 20,000×g에서 원심분리하여 분리하고, 니켈 친화성 컬럼 결합 완충액으로 평형화된 HiTrap CHeLating 칼럼 (GE Healthcare)에 로딩하고, 용출 완충액 (20 mM NaH2PO4 pH 7.4, 500 mM NaCl, 250 mM 이미다졸, 1 mM TCEP)으로 선형 구배(linear gradient)를 이용하여 용출시켰다. 용출된 단백질을 20 mM NaH2PO4 pH 7.0, 250 mM NaCl, 1 mM DTT 및 프로테아제 대 단백질의 부피비를 1:100으로 첨가한 1 mg/㎖ TEV 프로테아제(protease)에서 밤새 투석하였다. 상기 생성물을 헤파린 (Heparin) 컬럼 결합 완충액(20 mM NaH2PO4 pH 7.0, 250 mM NaCl, 1 mM TCEP)으로 미리 평형화된 HiTrap 헤파린 HP 칼럼(GE Healthcare)에 로딩시키고, 용출 완충액(20 mM NaH2PO4 pH 7.0, 2 M NaCl, 1 mM TCEP)으로 선형 구배를 이용하여 용출시켰다. 헬레이저 전이효소를 50 mM HEPES pH 7.5, 150 mM NaCl, 0.5 mM EDTA, 1 mM TCEP로 평형화된 HiLoad 16/60 Superdex 200 사이징 컬럼(GE Healthcare)에 로딩하고, 정제된 단백질을 포함하는 분획물을 10 mg/㎖로 농축시켰다. 모든 점 돌연변이 체는 동일한 방식으로 정제되었고, 야생형 전이효소와 비교하여 발현 또는 정제 행동(>90% 균질성)에서 변화를 나타내지 않았다. 전이효소의 절단된 버전을 정제하는 데에도 동일한 과정이 이용되었다.
절단 어세이 및 절단 생성물의 시퀀싱(Cleavage assay and sequencing of cleavage products)
DNA 절단은 6-FAM 라벨링된 올리고뉴클레오티드(BioTeZ Berlin-Buch GMBH)를 사용하여 측정되었다. 반응액은 일반적으로 5 mM MnCl2를 포함하거나 포함하지 않은 완충액(50 mM Tris pH 7.5, 100 mM NaCl, 0.5 mM ETDA, 1 mM TCEP)에 500 nM DNA 기질 및 500 nM 단백질로 구성된다. 자세한 내용은 다음과 같다:
절단을 37℃에서 1시간 동안 수행하고, 2 ㎕ 프로테이나아제 K(New England BioLabs) 및 2 ㎕의 0.5 M EDTA를 첨가하여 퀀칭(quenching)시켰다. 5 mM MgCl2와의 반응을 위해 37℃에서 밤새 반응시켰다. 프로테이나아제 K 절단(digestion)은 45℃에서 30분간 수행한 후, 동일한 양의 로딩 염료 (80% 포름아미드, 1 mg/㎖ 자일렌 시아놀(xylene cyanol), 1 mg/㎖ 브로모페놀 블루(bromophenol blue), 10 mM EDTA)를 첨가하고 반응액을 22℃에서 15분 동안 인큐베이션한 다음, 15% 트리스(Tris)/보레이트(Borate)/EDTA/우레아(Urea) 겔(Invitrogen) 상에 겔 로딩하기 이전에 95℃에서 5분간 인큐베이션하였다. 결과는 Typhoon Trio(GE Healthcare)를 이용하여 시각화하였다.
겔을 SYBR Safe DNA 겔 염색(Invitrogen)으로 염색하고, 푸른 빛으로 시각화하고, 각 밴드를 잘라내었다. ssDNA 추출은 겔을 분쇄하고 추출 완충액(0.5 N NH4Ac, 10 mM MgAc, 1 mM EDTA, 0.1% SDS)에서 37℃에서 밤새 흔들면서 이루어졌다. 남아있는 오염 물질을 제거하기 위해, 용액을 14,000×g로 4℃에서 2분간 원심 분리하고, 상층액을 Illustra MicroSpin G-25 컬럼(GE Healthcare)을 사용하여 염을 추가로 제거했다. ssDNA를 ssDNA 리가아제(ligase) 키트(New England Biolabs)를 사용하여 하기의 올리고뉴클레오티드에 라이게이션하였다: 5'/5rApp/CAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTAAGCTTCCAGCG/3SpC3/-3'. 이어서, PCR 및 상기 올리고뉴클레오티드에 대한 5' 말단 및 역방향 프라이머 서열의 공지된 부분을 위해 설계된 프라이머를 사용하여, 단편을 증폭시켰다. 생성된 dsDNA를 EcoRI 및 HindIII 제한 부위를 사용하여 pUC19 내로 클로닝하고, FDA-FBR 시설에서 시퀀싱하였다.
프로테아제 절단 및 N-말단 시퀀싱(Protease digest and N-terminal sequencing)
헬레이저 전이효소를 20 ㎖의 절단(digestion) 완충액(50 mM Hepes pH 7.5, 150 mM NaCl, 5 mM MgCl2, 1 mM TCEP)에서 1 mg/㎖로 희석하고, 일련의 트립신 희석액을 0.1-1 mg/㎖의 범위의 최종 농도로 첨가하였다. 샘플을 37℃에서 1시간 동안 배양하고, NuPAGE 로딩 염료(Novex)로 반응을 퀀칭(quenching)하고, 95℃에서 5분간 끓였다. 이어서 샘플을 즉시 4-12% NuPAGE 비스 트리스(bis Tris) 겔(Novex) 상에 로딩하였다. 밴드를 Invitrogen의 iBlot 키트를 사용하여 블롯 페이퍼로 옮기고 각 N-말단 서열의 서열을 FDA-FBR 시설에 의해 결정하였다.
EMSA
다양한 DNA 올리고뉴클레오티드에 대한 헬레이저 전이효소의 결합을 6% TBE 겔(Invitrogen)을 사용하여 EMSA로 측정하였다. 15 nM 내지 150nM의 정제된 단백질을 50 nM 6-FAM 라벨링된 올리고뉴클레오티드를 갖는 결합 완충액 (50 mM Tris pH 7.5, 100 mM NaCl, 10 mM MgCl2, 0.5 mM ETDA, 1 mM TCEP)에서 30분 동안 실온에서 배양하였다. DNA 겔 로딩 용액(Quality Biological, INC)을 첨가한 후, 샘플을 6% TBE 겔에 러닝(run)시키고 시각화하였다.
결과
부활한 헬레이저 트랜스포존의 구조적 특징(Structural hallmarks of the resurrected Helraiser transposon)
자율적인 Helibat 요소의 모델을 만들기 위해, M. lucifugus 게놈은 생물정보학(bioinfomatics) 분석을 받았다 (아래 참조). 그 결과 5296 bp의 헬레이저 공통(consensus) 서열(도 8)은 서열 분석에 의해 확인된 바와 같이 자율적인 헬리트론의 알려진 모든 특징을 포함한다 (Kapitonov et al. (2007) 및 Thomas et al. (2015)에서 리뷰). 헬레이저 전이효소의 1496개의 아미노산(aa) 길이의 암호화 서열은 각각 LTS 및 RTS로 명명된 트랜스포존의 좌측 및 우측 말단 서열에 의해 플랭킹되며 (도 1a 및 도 8), Helibat1 계열의 특징인 보존된 5'-TC/CTAG-3' 모티프로 종결된다 (Pritham et al. (2007)). 단일 가닥일 때 헤어핀 구조를 형성할 가능성이 있는 19 bp 길이의 팔린드롬 서열은 RTS 말단의 11개 뉴클레오티드 상류에 위치한다(도 1a 및 도 8).
헬레이저 전이효소는 잠재적인 N-말단 핵 위치 신호(NLS, nuclear localization signal) 및 징크 핑거-유사 모티프를 포함하고, RepHel 효소적 중심이 뒤따른다 (Kapitonov et al. (2001) 및 Pritham et al. (2007)). RepHel는 보존된 HUH 모티프 및 2개의 활성 부위 Tyr 잔기로 특징화된 300-aa 길이의 Rep 뉴클레아제 도메인 및 DNA 나선효소의 SF1 슈퍼패밀리의 8개의 보존된 모티프 특징을 포함하는 ~600-aa 길이의 나선효소 도메인으로 이루어진다 (도 1a, 도 9a 및 도 10 aa).
헬레이저 트랜스포존의 분자 재구축(Molecular reconstruction of the Helraiser transposon)
식물 및 후생동물(metazoan)에서 다양한 알려진 헬리트론에 의해 암호화된 RepHel 단백질에 존재하는 보존된 롤링-서클 복제 개시자 도메인(Rep)에 상응하는 300-aa 단백질 서열 세트를 사용하여, 우리는 GenBank 작은갈색박쥐(Myotis lucifugus) 어셈블리에 대한 Censor (Jurka J, Klonowski P, Dagman V, Pelton P. CENSOR--a program for identification and elimination of repetitive elements from DNA sequences. Computers & chemistry 20, 119-121 (1996)) 검색에서 쿼리로 그들을 이용함으로써 이 도메인을 암호화하는 모든 박쥐 서열을 확인하였다. 확인된 DNA 서열이 다른 계열(family)로 구성되어 있는지 확인하기 위해, BLASTCLUST (standalone Blast, NCBI)를 사용하여 클러스터링을 수행했다. 클러스터링 결과를 바탕으로, 우리는 박쥐 게놈이 자율적-유사 헬리트론의 유일한 주요 계열을 포함하고 있다고 결론내렸다. 이러한 모든 서열들은, 조기 정지 코돈과 짧은 indels에 의해 오염된 것들조차도, 촉매 도메인을 암호화하는 ~900-bp Rep 공통 서열을 유도하는데 사용되어 왔다. 다음 단계에서, Rep 공통의 200-bp 5'- 및 3'- 말단 부분과 90% 이상 동일한 게놈 서열이 각각 말단의 2 kb 상류 및 하류로 확대되었다. 확장된 서열의 다중 정렬(alignment)의 2 세트에 대해, 2개의 공통 서열이 유도되었다. 이 두 가지 말단 공통과 Rep 공통은 하나의 긴 확장 공통으로 어셈블되었다. 이 과정은 박쥐 자율적-유사 헬리트론의 양 말단이 확인될 때까지 반복되었고, 자율적 박쥐 공통 서열(Helitron-1_ML)의 첫 번째 버전이 만들어졌다.
다음으로 Censor를 사용하여 우리는 Helitron-1_ML과 90% 이상의 상동성을 갖는 M. lucifugus 게놈에서의 모든 카피를 수집했다. 양 방향으로 1 kb 확장된 수집된 서열의 쌍(pairwise) 정렬에 기초하여, 우리는 그들의 전이에 의한 헬리트론의 증식(multiplication)에 직접적으로 관련이 없는 긴 부분적 복제(segmental duplications, 서로 90% 이상 동일)로 생성된 모든 카피를 제거하였다. 결과적으로 Helitron-1_ML 500 카피로 구성된 최종 세트를 수집했다. 이러한 모든 서열과 Helitron-1_ML의 다중 정렬 후, 우리는 1458-aa RepHel 단백질을 암호화하고 수집된 500 카피와 ~95% 동일한, 공통(consensus) 두 번째 버전인 5301-bp Helitron-1a_ML를 도출하였다.
Helitron-1a_ML 카피를 연속적으로 분석한 결과, 대다수의 카피가 실제로 두 개의 비자율적인 Helitron-1N1_ML 및 Helitron-2N2_ML 트랜스포존의 카피일 때, 게놈은 소수의 자율적-유사 카피만 포함하는 것으로 드러났다. 2437-bp Helitron-1N1_ML 및 2144-bp Helitron-1N2_ML 공통 서열은 각각 Helitron-1a_ML RepHel 단백질의 610-aa N-말단과 390-aa C-말단 부분을 암호화했다. 아마도 이러한 자율적인 트랜스포존은 자율적인 헬리트론에 의해 발현된 RepHel 전이효소에 의해 전이되었다. 그러므로 우리는 RepHel의 나머지를 암호화하는 비자율적인 트랜스포존의 영역이 비자율적인 요소의 카피로부터 재구성된 단백질의 적절한 기능을 파괴하거나 손상시킬 수 있는 돌연변이를 포함할 수 있다고 결론을 내렸다. 이 문제를 피하기 위해, 비자율적인 트랜스포존의 카피를 "500-조각" 세트에서 제외했다. 결과적으로 실제 자율적인 헬리트론의 단편인 46개의 서열만 수정된 세트에 남아있게 된다. Heltron-1a_ML 공통 서열을 이들 46개의 서열로 재배열한 결과, 1494-aa RepHel 단백질을 암호화하는 새로운 5295-bp Helenron-1b_ML 공통 서열이 유도되었다 (공통 및 46개의 서열 사이의 ~95%의 상동성).
이 시점에서 Helitron-1b_ML과 Helitron-1a_ML 공통 서열은 98.81% 동일했고, 이러한 공통 서열에 의해 암호화된 RepHel 단백질은 13aa 치환과 Helitron-1b_ML 암호화 서열에 추가된 36-aa C-꼬리에 의해 서로 달랐다.
본래의 "500-단편" 세트의 서열은 다른 전이가능한(transposable) 요소의 삽입과 내부 결실에 의해 생성된 긴 자율적인 헬리트론의 짧은 단편을 포함하지 않았기 때문에, Heltron-1b_ML이 유래된 46개의 암호화 서열 각각에 대해, 모든 말단 및 추가적인 내부 단편은 수동으로 첨가되어 177개 단편 세트를 생성하였다. Helitron-1b_ML 공통 서열을 이 단편들과의 재배열에 기초하여, 헬레이저라는 이름의 5296-bp 자율적인 공통 서열의 최종 버전이 도출되었다(도 8).
인간 세포에서의 헬레이저 전이
우리는 트랜스포존의 기능적 구성 요소(즉, LTS 및 RTS 서열 뿐만 아니라 전이효소)를 합성하고, 퓨로마이신 유전자(puro)-태그된 트랜스포존(pHelR로 명명) 및 전이효소-발현하는 헬퍼 플라스미드(pFHelR로 명명, 도 1b)로 이루어진 2-구성요소 전이 시스템을 생성하였다. 도 1b에서 볼 수 있듯이, 헬레이저 시스템을 인간 HeLa 세포에 형질감염 시키면 평균적으로 전이효소의 부재 하에서 플레이트당 ~100개의 콜로니에 비해 플레이트당 ~3400개 퓨로-저항성 콜로니를 생성하였다. 따라서, 헬레이저 트랜스포존 시스템은 인간 세포에서의 전이 활성에 필요한 모든 결정 인자를 포함하는 것으로 보인다.
스플린커렛-PCR ("스플린커렛(splinkerette) PCR에 의한 삽입 부위 및 카피수 분석" 참조)에 의해 회수된 10개의 독립적인 헬레이저 삽입물의 서열 분석은 모든 경우에, A 뉴클레오티드에 대한 트랜스포존 LTS 5'-TC 모티프 및 T 뉴클레오티드에 대한 RTS CTAG-3' 모티프의 직접적인 표준이 되는(canonical) 접합이 있었다(도 1c). 따라서, AT 디뉴클레오티드 표적 부위로의 헬리트론 전이는 헬레이저에 의해 충실하게 반복되었다.
헬레이저의 상대적인 전이 효율을 평가하기 위해, 우리는 가장 활동적인 척추동물 잘라내기-및-붙여넣기 트랜스포존 중 하나인 슬리핑 뷰티 (SB100X)의 과활성화된 변이체와 직접 비교했다 (Mates L, et al. Molecular evolution of a novel hyperactive Sleeping Beauty transposase enables robust stable gene transfer in vertebrates. Nature genetics 41, 753-761 (2009)). 헬레이저는 인간 HeLa 세포에서 SB100X 보다 오직 2배 낮은 콜로니 형성 활성을 입증했으며 (도 1d), 이는 최적화없이도 비교적 높은 전이 활성을 보여준다.
헬레이저 전이효소가 비자율적인 트랜스포존 HelibatN1, HelibatN2 및 HelibatN3을 교차-이동시키는 능력을 시험하기 위해, 그들의 공통 LTS 및 RTS 서열을 합성하고 네오마이신(neo) 또는 퓨로 항생제 저항성 유전자로 태그하고 그들의 전이 활성 상기 기술된 바와 같이 분석하였다. Helibat N2는 이러한 실험 ㅈ조족조건에서 명백하게 비활성인 반면에 (도 1e), HelibatN1은 가장 활동적이었고 (야생형 헬레이저 전이의 ~28%의 활성); HelibatN3는 검출가능한 활성을 나타냈다 (~2%). 이 데이터는 헬레이저가 M. lucifugus 게놈에서 가장 풍부한 비자율적인 헬리트론 서브 패밀리의 적어도 일부를 동원하고 전파시키는데 아마도 기여한 고대 Helibat1 전이효소를 나타냄을 보여준다.
HUH 뉴클레아제 및 SF1B 나선효소 도메인의 기능적 분석
헬레이저 전이효소의 일부 보존된 아미노산의 기능적 중요성을 결정하기 위해, Walker의 K1068 모티프 및 나선효소 도메인의 모티프 VI에 위치한 아르기닌 핑거 R1457 잔기 뿐만 아니라, HUH 뉴클레아제 도메인에서 H593 및 H595 그리고 추정되는 촉매성 Y727 및 Y731 잔기 (개별적으로 그리고 함께 모두)를 돌연변이시켰다 (도 2a). 이러한 각각의 돌연변이는 HeLa 세포의 전이 활성을 상실시켰으며 (도 2a), 이는 뉴클레아제 및 나선효소 활성이 모두 전이에 필요하다는 것을 암시한다.
정제된 헬레이저 전이효소를 사용한 시험관 내 어세이는 dsDNA가 아닌 (데이터 미도시), ssDNA의 절단을 증명하였다 (헬레이저 LTS와 RTS의 40개 염기와 플랭킹 DNA의 10개의 염기를 나타냄) (도 2b). 가장 현저한 절단 생성물 (1-4로 라벨링, 도 10b)의 시퀀싱은 플랭킹 DNA와 LTS 가닥 상위에 있는 헬레이저 5'-TC 디뉴클레오티드 사이(레인 2), LTS 하부 가닥에 있는 내부 AT 디뉴클레오티드(레인 4)와 정확히 RTS의 양쪽 가닥에 있는 트랜스포존 말단(레인 6 및 8) 사이의 절단을 나타냈다. 이러한 결과는 트랜스포존 말단의 정확한 절단을 위한 트랜스포존 서열 결정 인자가 각 말단의 40 bps 내에 위치한다는 것을 나타낸다.
HUH 뉴클레아제로부터 기대되는 바와 같이, 절단 활성은 2가 금속 이온을 필요로하며(도 2b의 레인 2와 3 비교), Mg2 +보다 Mn2 +가 더 효율적이다 [레인 3(37℃에서 1시간) 및 11(37℃에서 하룻밤)]. 우리는 HUH 모티프의 히스티딘(His)-> 알라닌(Ala) 돌연변이체(레인 4) 또는 두 티로신(Tyr) 잔기가 동시에 돌연변이된 경우(레인 5)를 LTS 상단 가닥에서 ssDNA 절단을 검출하지 않았다. 우리는 두 개의 티로신(Tyr) 잔기가 개별적으로 돌연변이된 경우, 현저한 차이를 관찰했다: 첫 번째 Tyr(Y727F)의 돌연변이는 절단에 영향을 주지 않았고(레인 6), 두 번째 Tyr(Y731F)의 돌연변이는 절단 활성의 감소를 가져왔다(레인 7). 나선효소 도메인의 K1068Q 돌연변이는 ssDNA 절단에 영향을 미치지 않았다(레인 8). 종합적으로, 이들 결과는 HUH 도메인의 보존된 잔기가 ssDNA의 절단에 중요하고, 활성 부위의 2개의 Tyr 잔기가 헬리트론 전이에서 별개의 역할을 갖는다는 것을 보여준다.
정제된 헬레이저 전이효소에서의 제한된 단백질 분해(proteolysis)로 인해 N-말단, 뉴클레아제- 및 나선효소 도메인에 상응하는 3개의 안정적인 단편이 생성되었다(도 9b). 우리는 이 실험적으로 결정된 도메인 경계를 사용하여 N-말단 도메인이 없고 뉴클레아제 (HelR490-745) 또는 뉴클레아제-나선효소 (HelR490-1486) 도메인을 포함하는 절단된 전이효소를 설계하였다. 정제된 절단된 전이효소 단편도 DNA를 절단할 수 없었으며 (도 2b, 레인 9 및 10), N-말단 도메인이 DNA-결합에 관여할 수 있음을 시사한다. 사실, 도 2c에 도시된 바와 같이, 야생형 헬레이저 전이효소 (레인 1-12) 및 전체 길이의 히스티딘(His)->알라닌(Ala) 돌연변이체 (레인 13-14)가 절단 어세이에 사용된 올리고 뉴클레오타이드에 결합할 수 있지만, N-말단 489 아미노산이 결핍된 절단된 버전은 DNA에 결합하지 않았다 (레인 15-20). 이러한 데이터는 예상되는 징크 핑거-유사 모티프(Pritham 등 (2007))를 함유하는 헬레이저 전이효소의 N-말단이 ssDNA를 결합 및 절단하는 능력에 결정적인 DNA 결합 도메인을 암호화함을 나타낸다.
나선효소 활성과 일치하여, 정제된 전이효소는 46 +/- 3.3 μM의 Km 및 6.8 +/-0.11 s- 1 kcat (도 2d의 삽입물)로 ATP를 가수분해한다. 중요하게, ATP 가수분해 속도는 dsDNA 또는 ssDNA의 첨가에 의해 극적으로 자극되며 (도 2d), 이는 다른 SF1 나선효소에서 볼 수 있는 효과이다 (Bird LE, Subramanya HS, Wigley DB. Helicases: a unifying structural theme? Curr Opin Struct Biol 8, 14-18 (1998)). Walker A 모티프 K1068의 돌연변이는 ATP 가수분해를 제거했다 (도 2d).
비색계 ATPase 어세이(Colorimetric ATPase assay)
ATP 가수 분해는 Baykov et al로부터 적응된 과정을 사용하여 시간의 함수로서 유리 인산염(Pi)의 형성을 측정함으로써 분석되었다 (Baykov AA, Evtushenko OA, Avaeva SM. A malachite green procedure for orthophosphate determination and its use in alkaline phosphatase-based enzyme immunoassay. Anal Biochem 171, 266-270 (1988)). 헬레이저 전이효소 또는 돌연변이 단백질을 50 mM HEPES pH 7.5, 100 mM NaCl, 1 mM DTT 및 2 mM MgCl2를 포함하는 완충액에서 0.3-1 μM 사이의 최종 농도로 희석시킨 다음 10분 동안 37℃로 가열했다. 반응은 ATP(Jena biosciences)를 1 mM의 최종 농도 또는 총 부피 180 ㎕에서 0.0078 내지 1 mM의 농도 범위로 첨가함으로써 개시되었다. 샘플(20 ㎕)을 다양한 시점에서 제거하고 0.5 μM의 EDTA 5 ㎕를 각각 포함하는 96-웰 플레이트의 웰에서 즉시 퀀칭시켰다. 1 mM 말라카이트 그린(malachite green) 스톡 용액의 분취량(150 ㎕)을 각 웰에 첨가하고, 650 nm에서의 흡광도를 Molecular Devices Spectramax M5 마이크로 플레이트 판독기를 사용하여 측정하였다. 방출된 인산염의 양은 KH2PO4를 사용하여 생성된 표준 곡선과 비교하여 계산되었다. ATP 가수분해의 DNA 자극은 동일한 완충액 및 단백질 농도 범위(0.3, 0.08, 0.02 ?M) 및 ATP (1 mM)를 사용하여 측정되었지만, ATP 첨가 전에 50-염기-길이의 ssDNA 또는 50-bp-길이의 dsDNA의 1 μM를 첨가하였다. Km 및 kcat의 계산은 엑셀(마이크로소프트) 및 KaleidaGraph 4.0에서 수행되었다.
헬레이저 전이에서 말단 서열과 3'-헤어핀 구조의 역할
전이에서 헬레이저의 말단 서열의 중요성을 시험하기 위해, 우리는 LTS 또는 RTS 서열을 삭제함으로써 트랜스포존 벡터, pHelRΔLTS 및 pHelRΔRTS의 돌연변이를 만들었다. 이들의 결실은 헬레이저 전이를 없애기 때문에, LTS의 존재는 필수적이었다 (HeLa 세포에서 전이효소의 존재 및 부재시 구별할 수 없는 콜로니 수로 판단). 놀랍게도, 그 제거로 인해 손상되지 않은 트랜스포존의 ~24 %까지 콜로니 형성 활성이 감소했음에도 불구하고, RTS의 존재가 필수적인 것은 아니었다 (도 3a).
RTS의 역할을 더 연구하기 위해, 우리는 트랜스포존 벡터 pHelRΔHP를 만들었는데, 여기에서 헤어핀("HP") 구조를 형성할 것으로 예측된 19-bp 팔린드롬 서열은 삭제되었다. 도 3a에 나타낸 바와 같이, pHelRΔHP는 손상되지 않은 트랜스포존의 트랜스포존 콜로니-형성 활성의 ~35 %를 산출하였다. 특히, 이것은 전체 RTS가 삭제된 pHELRΔRTS로 생성된 콜로니의 수와 유사하다. 야생형 헬레이저 트랜스포존으로 얻은 51개의 HeLa 클론으로부터 트랜스포존 삽입 부위의 스플린커렛(Spinkerette) PCR 분석은 클론 당 1 내지 10개의 트랜스포존 삽입을 갖는 4개의 평균 카피수를 나타냈다 (도 3b, 삽입물). pHelRΔHP로 생성된 16개 클론과 pHelRΔRTS로 생성된 15개 클론의 동일한 분석은 두 돌연변이 트랜스포존 모두 평균적으로 클론 당 단일 삽입물을 생성함을 밝혔다 (도 3b). 따라서, HelRΔHP 및 HelRΔRTS 트랜스포존 돌연변이의 정정된 전이 효율은 각각 야생형 트랜스포존으로 수득 된 전이 효율의 8.8% 및 6%이다 (도 3b, 삽입물).
헬레이저의 RTS 헤어핀의 역할을 좀 더 깊이 조사하기 위해, 헤어핀 서열이 다른 방식으로 돌연변이된 변형된 트랜스포존 공여자 벡터 3개 (pHelRATH, pHelRStemX, pHelRLoopX)를 생성했다 (도 3c). pHelRATH에서, 헬레이저 헤어핀 서열은 애기장대(Arabidopsis thaliana)에서 헬리트론1 트랜스포존 패밀리의 서열로 대체되었다 (Kapitonov et al., 2001). pHelRStemX는 헬레이저 헤어핀 루프를 유지하는 반면, 줄기 서열은 애기장대(A. thaliana) 헤어핀의 서열과 교환되었다. pHelRLoopX에서, 헬레이저 헤어핀의 줄기 서열은 유지되었지만, 루프 내 ATT 뉴클레오티드는 CGG로 대체되었고 루프의 염기에 헬레이저 A-T bp는 A-A로 변경되었다.
pHelRATH 및 pHelRLoopX는 모두 pHelRΔHP와 유사한 전이 활성을 나타내었으며, 여기서 완전한 팔린드롬은 제거되었다 (도 3d). 대조적으로, pHelRStemX는 야생형 전이 활성의 90%를 나타냈다. 이러한 결과는 RTS 팔린드롬이 헬레이저 전이에 절대적으로 필요한 것은 아니지만, 팔린드롬 서열은 전이 조절에 중요하다는 것을 시사했다.
헬레이저 전이는 트랜스포존 서클을 생성한다(Helitron transposition generates transposon circles)
인버스 PCR을 이용하는 헬레이저 삽입 부위 분석을 하는 동안, 우리는 중요한 ~150 bp의 PCR 생성물을 종종 관찰했다 (데이터 미도시). 이 PCR 증폭물의 DNA 시퀀싱은 헬레이저 트랜스포존 말단의 정확한 머리부터 꼬리까지의(head-to-tail) 접합부를 나타냈다 (LTS의 5'-TC 디뉴클레오티드는 RTS의 CTAG-3 '테트라뉴클레오티드에 직접적으로 정확하게 결합된다) (도 4a). 이 데이터는 헬레이저 전이에서 서클 중간체의 형성을 제안했다.
전이하는 동안 트랜스포존 서클이 생성되었음을 확인하기 위해, 우리는 플라스미드-구조(rescue) 헬레이저 공여자 벡터, 플라스미드 복제 기점 및 카나마이신/네오마이신(kan/neo) 선별 카세트가 플랭크된 트랜스포존 LTS 및 RTS 서열이 있는, pHelRCD("CD": 원형 공여자(circle donot))를 제작했다 (도 4a). pHelRCD 및 전이효소 헬퍼 플라스미드로 HeLa 세포를 형질감염시킨 후, 저분자량 DNA를 분리하고 kan 선별된 대장균(E. coli)세포로 전기천공(electrophoration)하였다. 50개의 대장균 콜로니 중 하나는 완전한 트랜스포존 서열 및 완벽한 헬레이저 LTS 및 RTS의 머리부터 꼬리까지의 접합부로 구성된 헬레이저-유래된 헬리트론 서클("pHelRC"로 명명)을 포함하였다 (도 4a). 헬리트론 서클은 전이적으로(transpositionally) 활동적이다; pHelRC의 전이는 평균적으로 플레이트당 ~360개의 콜로니를 생성했다. 이는 플라스미드-기반 pHelRCD 헬리트론 서클 공여자 벡터의 콜로니 형성 효율의 ~51%를 차지한다 (도 4b).
팔린드롬이 완전히 또는 부분적으로 결실된 pHelRΔHP 및 pHelRMutH 벡터는 헬레이저 전이효소의 존재 하에서 서클을 생성하는데 능숙하기 때문에, 헬레이저 RTS 내 팔린드롬은 헬리트론 서클 형성하는 데 필요하지 않다 (도 4c). 흥미롭게도, 전이효소의 존재 하에서 pHelRCpuro 및 pHelRCDΔHPpuro로 얻은 유사한 카피수에 의해 입증된 바와 같이, 팔린드롬의 삭제는 플라스미드 공여자와 같이 헬리트론 서클의 전이에 동일한 해로운 영향을 미치지 않았다 (도 4d). 이 결과는 결합된 말단을 갖는 트랜스포존 서클의 맥락에서, 공여자 DNA 내 단지 하나의 닉이 만들어 져야하고, 따라서 트랜스포존의 3'-말단을 신호할 필요가 없음을 시사한다. 요약하면, 이 결과는 헬레이저 전이의 중간체로서 트랜스포존 서클이 생성되었음을 나타낸다.
헬레이저 삽입물의 전장 게놈(genome-wide) 분석
헬레이저 삽입물의 패턴이 많은 진핵 생물 종의 게놈에서 광범위하게 분석되었지만 (Pritham et al. (2007); Thomas et al. (2014); Coates et al. (2012); Du et al. (2009); Morgante et al. (2005); Dong Y, et al. Structural characterization of helitrons and their stepwise capturing of gene fragments in the maize genome. BMC genomics 12, 609 (2011); Han MJ, Shen YH, Xu MS, Liang HY, Zhang HH, Zhang Z. Identification and evolution of the silkworm helitrons and their contribution to transcripts. DNA research : an international journal for rapid publication of reports on genes and genomes 20, 471-484 (2013); Yang L, Bennetzen JL. Structure-based discovery and description of plant and animal Helitrons. Proceedings of the National Academy of Sciences of the United States of America 106, 12832-12837 (2009) and Yang L, Bennetzen JL. Distribution, diversity, evolution, and survival of Helitrons in the maize genome. Proceedings of the National Academy of Sciences of the United States of America 106, 19922-19927 (2009)) 이러한 패턴은 숙주 종의 수준에서 자연 선택(natural selection) 및 유전적 부동(genetic drift)에 의해 적어도 부분적으로 형성된다. 대조적으로, 배양된 세포에서 회수된 신규한(de novo) 전이 이벤트는 임의의 선택이나 부동이 거의 없으며, 따라서 트랜스포존의 삽입 선호도를 더 직접적으로 반영한다. 인간 게놈에서 신규한(de novo) 헬레이저 전이 이벤트를 특성화하기 위해, 우리는 HeLa 세포에서 회수된 1751 헬레이저 삽입물을 생성, 매핑 및 생물정보학적으로 주석처리했다. 표적 부위의 서열 로고(logo) 분석은 박쥐 및 기타 진핵 생물 게놈에서 내재적인 헬리트론 트랜스포존에 대해 이전에 관찰된 바와 같이, 삽입을 위한 매우 바람직한 부위로서 AT 표적 디뉴클레오티드를 확인했다 (Kapitonov et al. (2007); Thomas et al. (2015); Kapitonov et al. (2001) and Pritham et al. (2007)). 그러나, 삽입물에 대한 AT 디뉴클레오티드의 표적화는 절대적이지 않았다: 가장 두드러진 대안적인 디뉴클레오티드인 TT, AC 및 AA로 다른 서열에 46개의 삽입물이 발생하였다 (도 5a). 중앙 AT 디뉴클레오티드 이외에, 우리는 실제 삽입 부위 주위 ~20 bps 내에서 AT가 풍부한 DNA 서열에 대한 강한 선호를 관찰한다; 이 선호는 삽입된 트랜스포존의 3'-말단을 플랭킹하는 서열에 대해 가장 두드러진다 (도 5a).
우리는 다음으로 트랜스포존 삽입에서 관찰된 염기 조성을 고려하여 무작위로 고른 또는 모델링된 게놈 사이트의 컴퓨터-생성된 제어 데이터 세트에 대해 다른 게놈 특징에 헬레이저 삽입물의 상대적 빈도를 분석했다 (아래 참조). 도 5b는 GENCODE 카탈로그에 의해 정의된 바와 같이, 프로모터 영역(즉, 전사 개시 부위(transcriptional start site)의 5 kb 상류와 2 kb 하류 사이) 및 유전자 바디 (프로모터 영역이 없는 전사 단위) 내로의 조절 부위와 비교하여, 각각 헬레이저 삽입물의 2.5배 및 1.8배 유의적인 농축을 나타낸다 (Harrow J, et al. GENCODE: the reference human genome annotation for The ENCODE Project. Genome research 22, 1760-1774 (2012)). HeLa 세포에서 고도로 발현된 유전자는 헬레이저 삽입에 의해 더 자주 표적화되기 때문에, 500개의 가장 고도로 발현된 유전자 중에서 프로모터 내에서 7.3배 농축 및 바디 내에서 2.1배 농축에 의해 입증된 바와 같이, 둘 모두에서 전사 활성은 삽입 이벤트와 양의 상관 관계가 있는 것으로 보인다 (도 5b). 또한, 헬레이저는 CpG 아일랜드(염기 조성-보정된 조절 부위를 이용)로의 삽입에 대해 강한 6.9배 농축, CpG 해안(shores) (CpG 아일랜드를 플랭킹하는 5-kb 창(window)에서 대조군에 비해 2.6배 농축), 인핸서 영역(CAGE 픽으로부터 유래됨 (Andersson R, et al. An atlas of active enhancers across human cell types and tissues. Nature 507, 455-461 (2014)) 7.1배 농축), 히스톤 변형 H3K27ac에 대해 농축된 염색체 영역 (인핸서, 5.6배), H3K4me1 (인핸서, 3.8배), H3K4me3 (활성 프로모터, 3.4배), H3K36me3 (전사된 유전자 바디, 2.1 배) 및 DNaseI 풋프린팅(footprinting), FAIRE 및 ChIP-Seq 실험에 의해 정의된 오픈 염색질 영역(UCSC Open Chrom Synth 트랙에서 추출된 영역, 14.2배)을 보여준다. 반면에, 우리는 H3K9me3 또는 H3K27me3 이형염색질(heterochromatin) 마크로 특징지어지는 염색체 영역으로의 전이에 대한 명확한 결여 및 라미나(lamina)-관련 도메인으로의 삽입의 유의미한 2.2배 과소 표현을 검출했다 (Guelen L, et al. Domain organization of human chromosomes revealed by mapping of nuclear lamina interactions. Nature 453, 948-951 (2008)) (도 5b). 최종적으로, 트랜스포존 삽입 부위 농축과 유전자 밀도 간에는 상관 관계가 없었다 (도 5c).
게놈 공여자 부위로부터 전이가 시작될 때 헬레이저가 cis-결합 유전자좌위에 동원을 선호하는지 여부를 시험하기 위해 (종종 많은 '잘라내기-및-붙여넣기' 트랜스포존으로 보이고 '국부적인 호핑(local hopping)'이라고 함) (Carlson CM, Dupuy AJ, Fritz S, Roberg-Perez KJ, Fletcher CF, Largaespada DA. Transposon mutagenesis of the mouse germline. Genetics 165, 243-256 (2003); Fischer SE, Wienholds E, Plasterk RH. Regulated transposition of a fish transposon in the mouse germ line. Proceedings of the National Academy of Sciences of the United States of America 98, 6759-6764 (2001); Luo G, Ivics Z, Izsvak Z, Bradley A. Chromosomal transposition of a Tc1/mariner-like element in mouse embryonic stem cells. Proceedings of the National Academy of Sciences of the United States of America 95, 10769-10773 (1998) and Tower J, Karpen GH, Craig N, Spradling AC. Preferential transposition of Drosophila P elements to nearby chromosomal sites. Genetics 133, 347-359 (1993)), 우리는 4개의 확인된 염색체 헬레이저 공여자 부위를 포함하는 트랜스포존 공여자 세포주, 및 새로운 염색체 부위로 2차 전이 이벤트를 유도하는 전이효소 헬퍼 플라스미드로 재-형질감염된 이 세포를 사용하였다. 재-전이 삽입 부위의 분석은 본래 공여자 부위 주위에 새로운 트랜스포존 삽입의 클러스터링을 밝히지 않았다 (도 5d).
헬레이저 삽입 부위 분석
우리는 1751개의 독립적인 삽입 이벤트를 확인했다. 통계 분석을 위해, 우리는 2개의 다른 배경 모델에 따라 무작위로 선택된 게놈 사이트 세트를 만들었다. 모델('무작위')은 HeLa 세포의 비정상 핵형(karyotype)에 대해 표준화되었다. 두 번째 모델('대조군')은 시퀀싱 리드(read)의 매핑 가능성을 설명하고 삽입 부위에 염기 조성을 모방한다. HeLa 세포의 핵형을 결정하기 위해, 우리는 Broad/MGH ENCODE 그룹에 의해 생성된 ChIP-Seq 입력 데이터 세트를 사용했다. 이러한 데이터 세트는 특이적으로 결합하는 항체의 적용없이 생성되었기 때문에, 리드(read) 밀도는 근본적인 기본 게놈 영역의 상대적인 카피수에 대한 추정치로서 사용될 수 있다. 정상적인 핵형을 가진 12개의 다른 세포 유형 뿐만 아니라 HeLa 세포에 대한 2개의 생물학적 복제의 매핑된 시퀀싱 리드(read)를 UCSC 게놈 생물정보학(Genome Bioinformatics) 웹 사이트에서 다운받았다 (http://genome.ucsc.edu/cgi-bin/hgFileUi?db=hg19&g=wgEncodeBroadHistone). 우리는 HeLa 세포 및 정상 세포의 각 데이터 세트 쌍에 대해 정상 세포 데이터 세트로부터 1000 연속 리드를 각각 h함하는 슬라이딩 창(sliding windows)에서 리드 수의 배수 변화를 계산하였다. 결과로 얻은 배수 변화는 HeLa 세포의 가정된 평균 배수(ploidy)를 곱하였고(즉, 3), 정상 세포의 배수로 나눈 다음 (즉, 비-성염색체(non-sex chromosomes)에 대해 2, 대조군 세포 데이터 세트의 성별에 따른 chrX 및 chrY), 창 사이즈(window size) 30000인 중간값 필터로 실행(running)을 반듯하게 하고 마지막으로 가장 가까운 정수 값으로 반올림되었다. HeLa 세포와 정상 세포 데이터 세트의 모든 쌍의 결과는 계산 중간값에 의해 합쳐졌다. 정상 세포에서 유래한 데이터를 테스트한 결과, 이 방법은 정상 핵형을 정확하게 예측했다 (데이터는 미도시). '무작위' 배경 모델의 경우 우리는 게놈 위치를 선택하는 확률이 염색체 단편의 배수(ploidy)에 비례하는 방식으로, 게놈 내 500000개 무작위 위치를 샘플링했다. '대조군' 배경 모델은 다음과 같이 생성되었다. 먼저 우리는 게놈 위치를 선택하는 확률이 염색체 단편의 배수와 비례하는 방식으로, 1억개의 무작위 게놈 위치를 샘플링했다. 이 위치에서 우리는 트랜스포존 삽입 부위에서 매핑된 실제 시퀀싱 리드와 동일한 길이 분포를 갖는 거짓된(mock)시퀀싱 리드를 샘플링했다. 거짓된(mock) 리드들은 이전에 기술된 시퀀싱 리드로 처리되었다. 생성된 거짓된 부위는 삽입 부위에 있는 염기 조성으로부터 유래된 위치 특이적 무게 매트릭스(PWM, position specific weight matrix)를 이용하여 점수화했다 (도 5a). 거짓된 부위로부터 우리는 그들의 PWM 점수 분포가 실제 삽입 부위의 PWM 점수 분포와 비슷하게 보이는 방식으로, 100,000 대조군 부위를 샘플링했다. 유전자 발현 수준, 히스톤 변형 및 염색질 접근 가능성, 및 CpG 아일랜드과 라미나 연관된 도메인의 게놈 위치에 대한 정보를 USCS로부터 다운로드받았다 (http://genome.ucsc.edu). 오픈 크로마틴 영역은 UCSC Open Chrom Synth 트랙, 출시(release) 2 (2012년 2월)로부터 가져온 입증된 영역인 DNaseI HS 데이터, FAIRE 데이터 및 ChIP 데이터로부터 유래되었다.
헬레이저에 의한 유전자 포획
도 3a에 제시된 결과는 전체 RTS가 누락된 경우에도 일부 전이가 발생할 수 있음을 보여주었다. 이것은 서열 결정인자가 동원된 DNA 단편의 3'-말단을 정의하는 것에 대한 질문을 제기한다.
pHelR, pHelRΔHP 및 pHelRΔRTS에 의해 생성된 삽입 부위의 DNA 시퀀싱은 세 가지 트랜스포존 모두에 대해 게놈 표적 부위에서 A 뉴클레오티드에 대한 LTS 5'-TC 서열의 표준이 되는 접합을 나타내었으며, 이는 삽입물(integrants)이 실제로 헬레이저 전이효소-매개 생성물이었음을 나타낸다. RTS-게놈 접합의 서열 분석은 pHelR에 대한 T 뉴클레오티드에 의해 플랭크된 표준이 되는 CTAG-3' 서열을 나타내었다 (도 6a; 삽입 "H1-2"). 대조적으로, pHelRΔHP 및 pHelRΔRTS 벡터에 의해 생성된 일부의 삽입물은 3개의 상이한 게놈 표적 부위에 있는 T 뉴클레오티드에 인접하여 삽입된 CTTG-3' 테트라뉴클레오티드 (또한 옥수수(maize) 헬리트론으로 보여짐 (Dong et al. (2011)) 로 종결되었다 (도 6a; 빨간색으로 표시). 현저한 트랜스포존 말단이 내부적으로, SV40 폴리-A 서열의 시작으로부터 6 bp 하류에 위치하고 있기 때문에, 이러한 트랜스포존 삽입은 본래의 트랜스포존 서열의 절단을 나타내었다. 또한, HelRΔHP 및 HelRΔRTS에 의해 생성된 두 개의 삽입은 각각 CTAC-3' 및 AATG-3'로 종결되었다 (도 6a; 녹색으로 표시). 이러한 이벤트는 3'-형질도입(transduction) 이벤트로 간주될 수 있는데, 대안적인 트랜스포존 RTS를 나타내는 독특한 외부 서열이 전이에 이용되었다. 두 경우 모두, 트랜스포존 RTS의 마지막 2개의 뉴클레오티드가 게놈 HeLa 표적 부위에 있는 첫 번째 2개의 뉴클레오티드와 중복되어 (eHGS IS91 요소의 한쪽-말단의 전이로 보여짐 (Mendiola et al. ((1994)), 실제 RTS의 정확한 식별을 할 수 없게 만들었다. 새로운 RTS를 나타내는 다섯 개의 서열 중 어느 것도 이전 관찰과 일치하여(Han et al. (2013)) 마지막 30 bps 내에서 식별 가능한 팔린드롬을 포함하지 않았다 (데이터 미도시).
헬레이저 전이 동안 생성된 3'-형질도입 이벤트의 빈도와 정도를 더 조사하기 위해, 우리는 트랜스포존 RTS의 바로 하류에 있는 SV40-네오(neo)-폴리A(polyA) 선별 카세트를 pHelR 및 pHelRΔHP 벡터로 도입하였다 (퓨로(puro) 및 네오(neo) 각각에 대해 "pHelRpn" 및 "pHelRΔHPpn"으로 바꿨다; 도 6b). 이러한 방식으로, 전체 네오(neo) 카세트를 포획하는 리드-스루(read-through) 이벤트를 정량화할 수 있다. 도 6b에 도시된 바와 같이, 손상되지 않은 헬레이저 트랜스포존은 전이 이벤트의 ~11.7%로 플랭킹한 DNA 서열을 포획할 가능성이 있다. 대조적으로, 전반적인 전이 빈도는 낮지만, pHelRΔHPpn으로 생성된 전이 이벤트의 36% 이상이 트랜스포존의 하류 전체 1.6kb 네오(neo) 카세트의 전달을 초래했다. 이 실험 설정은 아마도 1.6kb 네오 카세트 전체를 포획해야 하므로, 3'-형질도입 빈도를 과소 평가했을 것이다.
윗수염박쥐속(Myotis) 게놈 내 헬리트론 3'-말단의 다양화
상기 실험은 및 팔린드롬 또는 RTS 검출을 통해 생성된 조기 절단(premature truncation) 및 리드-쓰루(read-through) 이벤트가 새로운 3'-말단의 생성을 유도한다는 것을 입증하였다. 이러한 이벤트가 또한 생체 내에서 발생했는지를 조사하기 위해, 최근 활성 HelibatN541, HelibatN542 및 HelibatN580 서브패밀리 (각각 26, 339 및 30 카피)의 395개의 카피를 분석하고, 신규한(de novo) 3'-말단을 갖는 39개의 표본(exemplar)을 발견했다 (공통의 마지막 30 bps에 걸쳐 >20% 갈라짐) (표 1). 이러한 표본은 1) 기존의 5'-절단된 헬리트론에 인접한 삽입 (도 11a), 2) 하나의 헬리트론의 5'-말단이 다른 헬리트론의 3'-말단에 인접한 다른 헬리트론의 바로 옆에 삽입 (도 11b), 및 3) 3'-말단의 마지막 30 bps 내에서의 결실 또는 돌연변이 (도 11c) 에 의해 생성될 수 있다. 빈 부위 증거는 이것이 참으로 진실한 (bona fide) 삽입 이벤트임을 시사한다 (도 11d). 가장 흥미롭게도, pHelRΔHP 트랜스포존의 삽입 #2와 유사하게 (도 6a), 우리는 하나의 표본을 확인하였으며 (도 11e), 여기서 신규한(de novo) 3'-말단은 팔린드롬이 부족한 RTS 내 CTAG-3' 서열의 우회를 통해 생성되었다. 따라서 3'-말단을 우회하여 결과적으로 초래한 헬레이저 전이에서 신규한(de novo) 트랜스포존 말단 (도 6a, b)이 자연적인 과정을 충실하게 반복한다.
윗수염박쥐속(Myotis) 게놈 내 최근 활성화 헬리트론 3'-말단의 분석
시퀀싱된 게놈에서 헬리트론에 의한 신규한 말단의 획득 패턴을 이해하기 위해, 우리는 윗수염박쥐속(Myotis) 혈통에서 Helibat 표본 3개(HelibatN541, HelibatN542 및 HelibatN580)의 카피를 분석했다. 카피는 최근 활성화되어 (공통과 98-99% 동일), 이는 서열 특징이 어떻게 해석되는지에 대한 선택의 영향을 최소화한다. HelibatN541 카피는 M. lucifugus 혈통에 고유하고 (Thomas et al. (2014)), HelibatN580 카피는 M. brandtii 혈통에 고유하고, HelibatN542 카피는 두 혈통에서 발견된다. 공통(consensus)과 98-99%의 상동성을 갖는 Helibat 표본의 카피 (HelibatN541 및 HelibatN580)를 그들 각각의 게놈으로부터 추출했다. HelibatN542 카피는 공통(consensus)과 95% 이상 상동성을 갖고, M. lucifugus 게놈에서 손상되지 않은 5'-말단을 추출했다. HelibatN542 카피는 비교적 오래되었으므로, 다른 컷오프(cut off)를 사용했다. 각 카피의 마지막 30 bp는 MUSCLE를 이용하여 각각의 공통에 맞춰 정렬되었다 (Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res 32, 1792-1797 (2004)).Nucleic Acids Res 32, 1792-1797 (2004)). 3'-말단의 기원 및 진화에 대한 통찰력을 얻기 위해, 공통(consensus)으로부터 20% 이상 갈라지거나 정렬되지 않은 말단을 가진 카피(de novo)를 상동성-기반 도구 (BLAST tools (Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. Basic local alignment search tool. J Mol Biol 215, 403-410 (1990)) 를 이용하여 주의깊게 분석하였다. 우리는 또한 다른 박쥐 전체 게놈 서열을 사용하여 허위 양성(false positive)을 제외시키기 위한 비교 지노믹스(genomics) 접근법을 사용했다. 예를 들어, 하나의 박쥐 게놈의 카피가 신규한(de novo) 3'-말단을 가지고 종간(orthologous) 카피가 공통과 말단 상동성(homologous)을 갖는다면, 이러한 변화들은 삽입 후 일어난 것으로 추정되었다. 또한, 빈 부위(삽입이 없는 부위)는 요소의 경계를 확인하는 데 사용되었다.
HelibatN3 전이에 의한 신규한 키메라 전사체의 신규한 생성(De novo generation of novel, chimeric transcripts by HelibatN3 transposition)
M. lucifugus 게놈에서, 15개의 상이한 유전자로부터의 프로모터 서열을 포획하고, 헬리트론에 의해 4690개 카피로 증폭시켰다 (Thomas et al. (2014)). 예를 들어, HelibatN3 서브 패밀리는 유전자 포획 이벤트로부터 진화하였으며, 여기서 전이 요소(trnasposing element)는 프로모터를 포함하는 NUBPL(nucleotide binding protein-like) 유전자의 단편, NUBPL N-말단 및 스플라이스 공여자(SD, splice donor)의 6개 아미노산에 대한 암호화 서열을 골랐다 [도 6c (i)] (Pritham et al. (2007)). 따라서, HelibatN3 요소가 올바른 방향으로 유전자의 인트론으로 점프한다면, 그것은 트랜스포존의 SD 서열과 가장 가까운 하류 스플라이스 수락자(splice acceptor, SA) 사이의 스플라이싱(splicing)에 의해 그 유전자의 N-말단이 절단된 유도체를 비정상적으로(ectopically) 발현하는 능력을 가질 것이다 (도 6c).
전사 엑손 트래핑 이벤트를 입증하기 위해, 우리는 NUBPL 프로모터와 SD 사이에 선택 가능한 퓨로 항생제 내성 유전자를 삽입했고 [도 6c(ii)], 이 트랜스포존을 헬레이저 전이효소에 의해 HeLa 세포 게놈으로 동원했다. 퓨로-저항성 세포로부터 제조된 cDNA의 서열 분석은 인간 전사체에 존재하는 트랜스포존-함유된 SD 와 SA 부위 사이의 스플라이싱을 나타내었다. 이 데이터는 트랜스포존 삽입의 하류에 엑손 서열의 포획을 나타내었다 (도 6c). 더욱이, 우리는 또한 SD가 명백하게 비-암호화 RNA 내 암호(cryptic) 스플라이스 부위에 접합된 키메라 전사체를 회수하여, 비-암호화 게놈 정보의 엑손화(exonization)를 초래한다 (도 6c).
M. brandtii 에서 NUBPL-유도된 전사체 및 그 유전자
상기 데이터는 HeLa 세포에서 실험적으로 동원될 때, HelibatN3 요소가 강력한 엑손 트랩(trap)으로 작용함을 시사한다. 생체 내에서 새로운 전사체를 생성하기 위한 내인성(endogenous) 헬리트론 전이의 능력을 문서화하기 위해, 우리는 박쥐 Myotis brandtii에 헬린트론-포획된 NUBPL 프로모터-유도된 전사체를 주석처리하였다. 우리는 헬리트론-포획된 NUBPL 프로모터 삽입이 23개의 주석 달린 유전자에 대해 적어도 1개의 주석달린 전사 개시 부위(TSS, transcription start site)의 1 kb 상류 내에 존재함을 발견하였다; 이러한 삽입은 총 46개의 전사체를 유도하고 [FPKM (fragments per kilobase of exon per million fragments mapped) > 0.5], 이들 중 3개는 삽입에 의해 공급된 TSS를 가질 것으로 예측된다 (표 2). 46개의 전사체 중 4개는 암호화될 것으로 예측되며, 그들의 부모 유전자(parent gene)와 달리, 46개의 전사체 중 35개는 검사된 조직 내에서 조직 특이성을 나타낸다 (그 조직에서만 FPKM > 0.5) (표 2).
헬린트론 삽입과 겹치는 예측된 TSS가 있는 후보 NUBPL-유도된 전사체는 진짜(bona fide) NUBPL-유도된 전사체로 간주되었다. 3개의 전사체는 기준을 충족시켰고, 유전자 RINT1 (도 12a), ARMC9 (도 12b) 및 RNF10 (도 12c)를 원인임을 보여주었다. 이들 중, RINT1 (신장)과 RNF10 (검사된 조직에서 항시적으로(constitutively) 발현됨) 전사체는 암호화 (손상되지 않은 오픈 리딩 프레임이 존재함) 그리고 ARMC9 (뇌)는 비암호화되는 것으로 예측된다 (표 2). 요약하면 헬리트론은 전사 수준에서 유전적 신규성에 영향을 미치고 헬레이저는 이러한 생물학적 현상을 충실히 반복할 수 있다.
NUBPL 프로모터-유래된 융합 전사체의 검출(Detection of NUBPL promoter-driven fusion transcripts)
퓨로 저항성 HeLa 콜로니에서 정제된 총 RNA 500 ng을 Maxima 역전사효소(Reverse Transcriptase)(Thermo Scientific)와 올리고(oligo) dT 프라이머를 사용하여 50℃에서 30분 동안 역전사시켰다. 열-불활성화 후 역전사 반응을 반복하였다. RNA를 65℃에서 15분 동안 1 N NaOH와 0.5 M EDTA의 1/5 부피로 가수분해시켰다. cDNA를 DNA Clean & Concentrator Kit(Zymo Research)로 정제하고 2 ㎕의 용출액(elute)을 하기 조건으로 6개의 독립적인 PCR 증폭에 사용하였다: 헬리트론 벡터 서열에 특이적인 프라이머 퓨로1(Puro1) 및 전체 인간 전사체(transcriptome) 상에 높은 표현을 위해 계산적으로 예측된 4-mer 헤미-특이적 프라이머로 95℃에서 1분, (94℃에서 30초, 65℃에서 30초, 72℃에서 30초) 40 사이클, (94℃에서 30초, 25℃에서 1분, 0.2℃/초로 72℃로 오르고, 72℃에서 1분) 2사이클. 첫 번째 PCR 반응은 벡터 특이적 올리고 퓨로2(Puro2)를 포함하는 25 ㎕의 PCR 마스터 믹스로 보충되어, 하기 조건을 갖는 후속 비대칭 PCR 반응을 수행하였다: [(94℃에서 30초, 65℃에서 30초, 72℃에서 40초) 3 사이클 (94℃에서 30초, 60℃에서 30초, 72℃에서 40초) 1 사이클)]의 10 슈퍼-사이클. PCR 생성물을 컬럼-정제하고, 30 ㎕의 용출액 중 2 ㎕를 트랜스포존-특이적 올리고 T2a_SD_bc 및 헤미-특이적 프라이머의 오버행에 특이적인 PE_first로 제1 지수(exponential) PCR에 사용하였다. PCR 생성물을 정제하고, pGEM-T 벡터 시스템(Promega)을 사용하여 TA-클로닝하고 시퀀싱하였다. 융합 전사체는 UCSC 게놈 브라우저의 BLAT 도구로 헬리트론 트랜스포존 내 스플라이스 공여자 부위 다음의 서열을 정렬시킴으로써 결정하였다.
M. brandtii 게놈의 헬리트론 주석(좌표, 대략적인 나이 및 상대적인 방향)
이전에 기술된 윗수염박쥐속(Myotis)-특이적 헬리트론 반복 라이브러리(repeat library)를 이용하여 M. brandtii 게놈 어셈블리(NCBI(National Center for Biotechnology Information)의 GenBank 내 171343 스캐폴드, KE161034-KE332376) (Seim I, et al.) Genome analysis reveals insights into physiology and longevity of the Brandt's bat Myotis brandtii. Nature communications 4, 2212 (2013))) 내 헬리트론 삽입이 확인되었다 (RepeatMasker v.4.0.5 http://www.repeatmasker.org). 헬리트론 삽입의 보존은 헬리트론 DNA 서열과 200 bp의 플랭킹 서열을 취하여 NCBI wgs 데이터베이스의 blastn 쿼리(query)를 수행하여 다른 시퀀싱된 애기박쥐과(Vespertilionidae) 박쥐 (E. fuscus, M. lucifugus, 및 M. davidii)에 삽입이 존재하는지를 결정함으로써 결정되었다. 특정 종에서 쿼리 서열의 전체 길이에 대한 히트가 있었던 경우, 해당 종에서 존재하는 (보존된) 것으로 간주되었다. 헬리트론에 대해 하나의 히트가 있거나 히트가 없다면, 존재하지 않은 것으로 간주되었다. 이 정보를 박쥐의 알려진 분기(divergence) 시간과 결합하여, 각 삽입에 대한 대략적인 나이를 얻었다. 유전자 모델에 삽입하는 헬리트론의 방향에 편차가 있는지를 결정하기 위해, 우리는 이전에 기술된 파이프 라인 (Kapusta A, et al. Transposable elements are major contributors to the origin, diversification, and regulation of vertebrate long noncoding RNAs. PLoS genetics 9, e1003470 (2013)) 을 사용하여 인트론, 엑손, 또는 주석이 달린 유전자 모델의 상류 또는 하류 1 kb 영역에서 중첩되는 헬리트론을 확인했다. 표적 유전자와 동일한 방향 및 반대 방향으로 삽입된 헬리트론들을 정량화하고 양측(two-tailed), 두 표본(two-sample) T 검정(T-test)을 이용하여 비교하였다 (α=0.05).
M. brandtii 전사체 어셈블리(transcriptome assembly), 대안적인 스플라이싱 분석(alternative splicing analysis), 풍부도 측정(abundance estimation) 및 유전자 배치(gene assignment)
M. brandtii는 이러한 분석에 사용되었으며, 높은 적용 범위를 갖는 수많은 고품질 방향성(directional) RNA-seq이 공개적으로 이용 가능하고 게놈은 ~ 2000개의 헬리트론-포획된 NUBPL 삽입이 포함하고 있기 때문이다. M. brandtii (SRA061140) (Seim et al. (2013))의 신장, 간 및 뇌 조직에서 추출한 Ilumina RNA-seq 리드(read) (200 bp, 쌍(paired))을 모으고, Trimmomatic을 이용하여 품질-정돈하고 (Lohse M, et al. RobiNA: a user-friendly, integrated software solution for RNA-Seq-based transcriptomics. Nucleic Acids Res 40, W622-627 (2012)), Trinity를 이용하여 어셈블(신규하고 게놈-안내)하고 (r20140413 (Grabherr MG, et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome. Nature biotechnology 29, 644-652 (2011))), Trinity를 이용하여 어셈블(신규하고 게놈-안내)하였다 (r20140413 (Grabherr MG, et al. and Haas BJ, et al. De novo transcript sequence reconstruction from RNA-seq using the Trinity platform for reference generation and analysis. Nature protocols 8, 1494-1512 (2013)). 두 가지 분석으로 부터 나온 어셈블리 결과를 결합하고 PASA(Program to Assemble Spliced Alignments, 스플라이싱된 정렬들을 어셈블하는 프로그램)(PASA_r20140417)을 사용하여 대안적인 스플라이싱 분석을 수행했다 (Haas BJ, et al. Improving the Arabidopsis genome annotation using maximal transcript alignment assemblies. Nucleic Acids Res 31, 5654-5666 (2003) and Campbell MA, Haas BJ, Hamilton JP, Mount SM, Buell CR. Comprehensive analysis of alternative splicing in rice and comparative analyses with Arabidopsis. BMC genomics 7, 327 (2006)). 각 전사체(FPKM)의 상대적인 풍부도는 기대값-최대화에 의한 RNA-Seq (RNA-Seq by Expectation-Maximization) (RSEM; v.1.2.12)를 이용하여 결정하였다 (Li B, Dewey CN. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC bioinformatics 12, 323 (2011)). 스플라이싱 정보 (따라서 방향 정보(directionality information))가 결여되고, FPKM <0.5의 풍부도 및 총 길이 <200 bp인 전사체(transcripts)를 어셈블리에서 제거하여, 최종 M. brandtii 전사체(transcriptome) 어셈블리를 생성하였다. 전사체는 게놈 좌표와 현재 게놈 주석을 교차시키고 (Bedtools; v.2.22.1 (Quinlan AR, Hall IM. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics (Oxford, England) 26, 841-842 (2010)) and by verifying homology to known transcripts of that gene using BLAST. ) BLAST를 사용하여 그 유전자의 알려진 전 사체와 상동성을 확인함으로써 유전자에 배치되었다. 각 전사 체에 대한 암호화 가능성은 예측된 ORF> 100 아미노산을 갖는 것으로 결정되었다 (Haas et al. (2013)). 각각의 전사체에 대한 조직 특이성 또한 결정되었고, FPKM 값이 3개의 검사된 조직 중 단 하나 또는 두 개에서 > 0.5인 경우, 전사체는 조직 특이적인 것으로 간주되었다.
M. brandtii 에서 헬리트론-포획된 NUBPL 프로모터(NUBPL-HCP) 유도된 전사체 확인
포획된 NUBPL 프로모터를 포함하는 헬리트론의 게놈 좌표를 어셈블된 전사체의 좌표와 교차시켰다. 우리는 전사체가 검출 가능하고 (FPKM> 0.5), 가닥-특이성을 가지며, NUBPL 프로모터 자체가 TSS의 1 kb 상류에 있음을 확실히 하기 위해 엄격한 기준을 사용했다 (Andersson et al. (2014)). NUBPL 프로모터-포함하는 헬리트론이 위치한 전사체는 후보 NUBPL-HCP 유도된 전사체로 분류되었다. NUBPL 프로모터-포함하는 헬리트론에 의해 제공되는 TSS의 전사체는 인증된 NUBPL-HCP 유도된 전사체인 것으로 간주되었다. GO Term 분석 농축 분석(Enrichment Analysis)에는 헬리트론에 의해 추정하여 유도되는 적어도 하나의 전사체를 가지는 유전자들을 포함하고 p-값이 0.05 미만인 경우 용어가 중요하게 고려되었다 (Mi H, Muruganujan A, Thomas PD. PANTHER in 2013: modeling the evolution of gene function, and other gene attributes, in the context of phylogenetic trees. Nucleic Acids Res 41, D377-386 (2013) and Ashburner M, et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nature genetics 25, 25-29 (2000)). FPKM > 0.5 인 전사체 TSS의 1 kb 내의 각 NUBPL 프로모터는 TATA, CAAT 및 GC 박스와 같은 프로모터 모티프에 대해 분석하였고, GPMiner를 사용하여 전사 인자(TF, transcription factor) 결합 부위를 예측하였다 (Lee TY, Chang WC, Hsu JB, Chang TH, Shien DM. GPMiner: an integrated system for mining combinatorial cis-regulatory elements in mammalian gene group. BMC genomics 13 Suppl 1, S3 (2012)).
전사 개시 부위(TSS, transcription start sites)에 대해 +/- 1 kb 영역에서 M. brandtii 내 헬리트론의 농축/고갈(enrichment/depletion) 결정
M. brandtii 유전자의 TSS를 중심으로 2 kb 간격에 해당하는 좌표를 얻기 위해, 우리는 M. brandtii 유전자 어셈블리에서 TSS에 상대적으로 -1 kb 및 +1 kb의 좌표를 추출했다. 그런 다음 우리는 베드툴(Bedtools)을 사용하여 M. brandtii 내 알려진 헬리트론 삽입물 (RepeatMasker, 상기 참조)과 이 좌표들을 교차시켰고, 피셔의 정확 검정(Fisher's exact test)을 통해 농축 또는 고갈을 결정했다 (α=0.05) (Quinlan et al. (2010)). 양측 p-값이 0.05 미만인 경우, 결과가 유의미한 것으로 간주되었으며 유의성 (농축된 또는 고갈된) 방향은 적절한 단측(one-tailed) 검정의 p-값을 통해 결정되었다 (2010)). 양측 p-값이 0.05 미만인 경우, 결과가 유의미한 것으로 간주되었으며 유의성 (농축된 또는 고갈된) 방향은 적절한 단측(one-tailed) 검정의 p-값을 통해 결정되었다.
고찰
박쥐 M. lucifugus의 게놈에서 활성 헬리트론 전이는 부활되었으며, 이 새로운 트랜스포존인 헬레이저는 헬리트론 전이의 메커니즘 및 게놈에 대한 영향을 조사하는 데 사용되었다.
다른 HUH 뉴클레아제 도메인의 알려진 특성과 일치하여(Chandler et al. (2013)), 뉴클레아제 활성은 헬레이저의 LTS 및 RTS에서 유래된 ssDNA 단편에서만 시험관 내에서 검출되었다. 이것은 헬레이저가 ssDNA를 절단에 사용할 수 있도록 일부 세포 과정에 의존한다는 것을 암시한다. 예를 들어, HUH 뉴클레아제를 암호화하는 잘-특성화된 원핵 생물의 전이효소인 IS608의 전이는 ssDNA를 생성하기 위해 지체 가닥(lagging strand) DNA 복제에 의존한다 (Ton-Hoang B, Guynet C, Ronning DR, Cointin-Marty B, Dyda F, Chandler M. Transposition of ISHp608, member of an unusual family of bacterial insertion sequences. EMBO J 24, 3325-3338 (2005) and Ton-Hoang B, et al. Single-stranded DNA transposition is coupled to host replication. Cell 142, 398-408 (2010)). 대안적으로, 헬레이저 전이의 초기 단계에 필요한 ssDNA는 AT-풍부한 영역에서 dsDNA의 국부적인 융해(melting)를 유도하는 음성 슈퍼코일(supercoiling)을 통해 이용 가능하게 될 수있다 (Dayn A, Malkhosyan S, Mirkin SM. Transcriptionally driven cruciform formation in vivo. Nucleic Acids Res 20, 5991-5997 (1992); Krasilnikov AS, Podtelezhnikov A, Vologodskii A, Mirkin SM. Large-scale effects of transcriptional DNA supercoiling in vivo. J Mol Biol 292, 1149-1160 (1999) and Strick TR, Allemand JF, Bensimon D, Croquette V. Behavior of supercoiled DNA. Biophysical journal 74, 2016-2028 (1998)). 진핵 세포에서, DNA의 음성 슈퍼코일(supercoiling)은 전사 복합체의 상류에서 일어나고 (Liu LF, Wang JC. Supercoiling of the DNA template during transcription. Proceedings of the National Academy of Sciences of the United States of America 84, 7024-7027 (1987) and Rahmouni AR, Wells RD. Direct evidence for the effect of transcription on local DNA supercoiling in vivo. J Mol Biol 223, 131-144 (1992)), 헬레이저 전이에 필요한 단일-가닥 패치를 생성할 수 있다 (Parsa JY, et al. Negative supercoiling creates single-stranded patches of DNA that are substrates for AID-mediated mutagenesis. PLoS genetics 8, e1002518 (2012)). 게다가, AT-풍부한 영역은 국부적인 DNA가 융해(melting)를 가능하게 할 수 있기 때문에, 아마도 공통(consensus) LTS가 절단 부위에 가까운 AT-풍부한 영역을 포함하고 있는 것은 우연이 아니다 (도 8). 헬레이저 나선효소 도메인과 Pif1 사이의 상동성(도 10a) 및 전이를 위한 나선효소 기능의 중요한 요구 사항(도 2) 둘 다 나선효소 도메인의 역할은 일단 ssDNA가 트랜스포존 말단에서 생성되면, ssDNA-dsDNA 접합부에서 DNA를 푸는 것이라는 것을 뒷받침한다.
헬레이저 전이가 원형 중간체를 통해 진행된다는 것을 암시하는 데이터는 다른 알려진 진핵 생물 DNA 트랜스포존과 비교할 때 결정적인 차이를 정의한다. 헬리트론 전이가 일부 ssDNA-기반 원핵 생물 전이 시스템 (del Pilar Garcillan-Barcia et al. (2001)) 또는 특정 ssDNA 바이러스 복제 과정 (Faurez F, Dory D, Grasland B, Jestin A. Replication of porcine circoviruses. Virology journal 6, 60 (2009))과 기계적으로 관련되어 있을 수 있다. 전이가 게놈 공여자 유전자좌위(genomic donor loci)에서 시작되었을 때 (도 5), 트랜스포존 삽입의 국부적인 호핑(hopping)과 무작위 분포의 결여는 에피솜 전이 중간체의 아이디어를 강하게 지지한다.
하기의 관찰은 헬리트론 전이의 수정된 롤링 서클 모델(rolling circle model)과 일치한다: 1) 헬레이저 전이는 LTS가 필요하지만, RTS는 반드시 필요한 것은 아니다 (도 3), 2) 헤어핀은 결실 또는 전체 RTS의 가장 중요한 구성 요소인 것처럼 보이며 전이에 유사한 효과를 나타낸다 (도 3), 및 3) 트랜스포존 절단 및 RTS에 인접한 서열의 형질도입은 둘 다 생체 내에서 일어나고, 헤어핀이 결실되면 이러한 비-표준 전이 이벤트의 빈도가 유의하게 증가된다 (도 6). 종합적으로, 데이터는 RTS의 헤어핀 구조가 전이 종료 신호로 작용하여 헬레이저 전이에서 중요한 조절 역할을 한다는 것을 나타낸다. 우리의 관찰은 트랜스포존을 플랭킹하는 DNA 서열을 포획하는 "리드-스루(read-through)" 모델을 뒷받침한다: RTS에서 헤어핀이 없거나 전이 기계(machinery)에 의해 인식되지 않을 때, 전이효소는 트랜스포존의 3'-말단을 우회하고 대체 가능한 전이 종결인자(terminator) 서열을 더 하류로 발견하여, 플랭킹 숙주 서열의 형질도입을 초래한다 (Feschotte et al (2001) (도 7)).
RTS의 상대적으로 느슨한 기능적 정의는 헬리트론이 효율적으로 하류 숙주 게놈 서열을 형질도입시킬 수 있는 핵심적인 이유일 가능성이 높다. 유전자 포획은 신규한 헬리트론 계열의 출현과 다양성, 그리고 새로운 세포 전사체의 생성에 기여할 수 있다. 예를 들어, 포획된 NUBPL 유전자 단편은 헬레이저 전이효소에 의해 인간 세포의 게놈에 동원될 때, 부과된 전사 및 스플라이싱(splicing)에 의해 새로운 암호화 및 비-암호화 전사체를 일으킨다 (도 6c). 세포 유전자의 전사를 유도하는 몇몇 Helibat 삽입이 확인되었으며 (표 2) NUBPL 삽입 내에서 시작하는 전사체가 확인되었다. 이러한 진짜(bona fide) NUBPL-유도된 전사체는 N-말단 절단되고 비-암호화 서열을 엑손화시켰으며, 생체 외에서 일부 헬레이저-촉매된 삽입에서 볼 수 있듯이 (도 6c), 대부분 신규한 5'-UTR을 생성한다 (도 12 및 표 2).
TE는 수백만년 동안 게놈 구조와 기능을 형성해왔으며, 숙주의 진화론적 궤도에 강한 영향을 미쳤다 (Feschotte C. Transposable elements and the evolution of regulatory networks. Nature reviews Genetics 9, 397-405 (2008)에 리뷰). 대안적인 프로모터, 인핸서 요소, 폴리아데닐화 시그널 및 스플라이스 부위를 제공하기 위해 문서화된 가장 중요한 제제는 레트로트랜스포존(retrotransposon)이다. 또한, ~1000개의 세포 유전자 단편이 벼 게놈에 있는 잘라내기-및-붙여넣기 Pack-MULE DNA 트랜스포존에 의해 포획된 것으로 나타났으며, 이 트랜스포존들은 식물에서 유전자의 진화에 중요한 역학을 했을 가능성이 있음을 시사한다 (Jiang N, Bao Z, Zhang X, Eddy SR, Wessler SR. Pack-MULE transposable elements mediate gene evolution in plants. Nature 431, 569-573 (2004)).Nature 431, 569-573 (2004)). 헬리트론은 게놈 변이를 생성할 수 있는 잠재력이 매우 큰 것으로 보인다. 실제로, 옥수수(maize) 헬리트론의 약 60%는 포획된 유전자 단편을 운반하는 것으로 밝혀졌으며, 헬리트론 전이에 의해 옥수수 게놈에 걸쳐 전파되는 수십만 개의 유전자 단편이 되었다 (Yang et al. Proceedings of the National Academy of Sciences of the United States of America 106, 19922-19927 (2009)). 대부분의 포획된 유전자 단편이 옥수수에서 명백하게 무작위 부동(drift)을 겪고 있지만, 이들 중 ~4%가 정제 선별에 속하는 것으로 추정되어 숙주에게 유익한 효과가 있음을 시사한다. 따라서, 3'-형질도입 및 이후, 포획된 유전자 단편 또는 복사-및-붙여넣기 전이에 의한 전체 유전자의 전장 유전체(genome-wide) 전파의 분자적 메커니즘은 헬리트론을 광범위한 생물학적 결과를 가져오는 강력한 게놈 셔플링 제제로 자리 매김시킨다.
실시예 2: 게놈 콘텐츠 증폭을 위한 헬레이저 전이효소의 용도
헬레이저는 복제를 위해 복사 및 붙여넣기 메커니즘을 사용하고 진핵 세포에서 작동하는 최초의 트랜스포존이다. 분자 생물학 도구로서 이 트랜스포존의 한 가지 매력적인 응용은 유전자 또는 관심 게놈 영역의 복수 카피를 포함하는 세포주가 생성되도록 하는 게놈 컨텐츠의 증폭이다. 이것을 예시하기 위해, 헬레이저 말단 서열 (LTS 및 RTS)에 의해 플랭크된, "모델 유전자"(TurboGFP)의 정의된 단일-카피 삽입을 가진 세포주를 출발점으로 사용하였다. 그런 다음, 이 세포에 헬레이저 전이효소를 형질도입하고 TurboGFP가 복사 및 붙여넣기 메커니즘으로 복제되었는지 여부를 평가했다.
LTS-EF1A-TurboGFP-RTS의 정의된 카피수를 포함하는 세포주를 생성하기 위해, 공여자가 Tia1L (여기서는 LTS-TurboGFP-RTS)로 불리는 일반적인(generic) gRNA 인식 부위에 의해 플랭킹되는 제자리(in situ) 라이게이션 접근법이 이용되었다 (gRNA 서열: GGTATGTCGGGAACCTCTCC; gRNA 인식 부위: GGTATGTCGGGAACCTCTCCAGG with PAM sequence underlined). 이 방법에 대한 자세한 설명은 최근에 출판되었다 (Lackner, D.H. et al. A generic strategy for CRISPR-Cas9-mediated gene tagging. Nat. Commun. 6:10237 doi: 10.1038/ncomms10237 (2015)). 태깅 카세트는 헬레이저 트랜스포존 (LTS 및 RTS)으로부터의 말단 서열을 포함하는 Tia1L 부위를 포함한다. TurboGFP는 EF1A 프로모터로부터 발현되고 있어서 폴리아데닐화 카세트가 뒤따른다 (도 13a).
HEK293 세포를 상기 기술된 AAVS1 세이프 하버(safe harbor) 유전자좌위 및 태깅 카세트를 표적으로 하는 gRNA (gRNA 서열: GTCACCAATCCTGTCCCTAG)인 Cas9으로 전기천공시켰다. 이 카세트는 또한 U6 프로모터의 Tia1L gRNA를 발현한다. AAVS1 유전자좌위의 절단은 태깅 플라스미드의 Tia1L 절단에 의해 유리된 태깅 카세트의 삽입을 일으킬 것이다. 다음으로, TurboGFP를 발현하는 단일 세포 클론을 FACS 분류법으로 수득하였다. 클론은 게놈과 카세트의 5' 또는 3' 접합을 증폭시키는 이중 전략에 의해 유전형을 결정했다:
5' 접합 PCR AAVS1-EF1A에 대한 프라이머 쌍
정방향(Fwd): TATATTCCCAGGGCCGGTTA, 역방향(Rev): TCTCCACCTCAGTGATGACG
3' 접합 PCR TurboGFP-AAVS1에 대한 프라이머 쌍
정방향(Fwd): AGGAGGATCACAGCAACACC, 역방향(Rev): ACAGGAGGTGGGGGTTAGAC
상기 기술된 두 유전자형(genotyping) PCR이 양성인 많은 클론 세포주를 수득하였다. AAVS1 유전자좌위에서의 태깅 카세트의 삽입을 확실하게 확인하기 위해 생거 시퀀싱(Sanger sequencing)에 의해 이들의 선별을 분석하였다 (도 13b).
다음으로, 태깅 카세트를 가지는 단일 세포 클론을 디지털 액적 PCR (digital droplet PCR, ddPCR)에 의해 분석하였다. ddPCR은 세포에서 주어진 유전자좌위의 카피수를 결정하는 강력한 방법이다. 이를 위해, 각 클론의 50 ng의 게놈 DNA를 관심 유전자좌위에 특이적인 TaqMan 프라이머(900 nM 최종 농도) 및 프로브(250 nM 최종 농도)와 함께 Bio-Rad 2XddPCR 마스터 믹스 (20 ㎕ 총 반응 부피)에 첨가하였다:
터보GFP 프라이머/프로브 서열
정방향(Fwd) 프라이머 5'-CTGCACGTGAGCTTCAGCTA-3'
역방향(Rev) 프라이머 5'-AAGCCGGTGCCCATCA-3'
프로브 FAM-CCGCGTGATCGGCGACTT-MGB
증폭산물(amplicon) 길이 74 bp
터보GFP 카피수를 기준 유전자좌위와 연관시키기 위해, 인간 RnaseP 유전자에 대한 프로브 세트가 포함되었다 (ThermoFisher의 카탈로그 번호 4403326). 이 어세이는 염색체 14에서 리보뉴클레아제(Ribonuclease) P RNA 구성 요소 H1(H1RNA)를 검출한다:
어세이 위치: chr.14:20811565
빌드(Build): NCBI build37
유전자 기호: RPPH1
프로브 변형: VIC 염료 (5'), TAMRA 퀀처(Quencher) (3')
증폭산물 길이: 87 bp
DG8 카트리지와 70 ㎕의 오일을 사용하여 액적(droplet)을 생성하고 96웰 PCR 플레이트로 옮겼다. 다음으로, 하기 조건을 이용하여 액적들에 대해 PCR을 수행하였다:
Figure pct00001
PCR 반응 후, PCR 플레이트를 액적을 자동으로 측정하는 QX100 액적 판독기로 옮기고 4개의 다른 집단으로 분류했다. 이 데이터를 Quantasoft 소프트웨어를 이용하여 분석했다.
추후 실험을 위해, FACS에 의해 보여진 바와 같이 검출 가능한 수준으로 터보GFP를 발현(도 14b)하는 터보GFP 카세트의 단일 카피를 갖는 두 개의 클론(도 14a)을 선택하였다. 터보GFP 카세트를 동원하고 증폭시키기 위해, HEK293 세포를 (pcDNA3.1(-)(Invitrogen)의) CMV 프로모터로부터 발현된 헬레이저 전이효소 유전자(서열번호 6)로 형질감염시켰다. 형질감염 후, 단일 세포 클론을 분리하고 전술한 ddPCR 어세이를 이용하여 터보GFP의 카피수를 정량화하였다. 어세이는 여기에 보여지는 두 클론 모두에서 카피수의 증가가 명백하게 나타났다(도 14a의 클론 1 및 2). 클론 2에서, 카피수는 1n에서 4n으로 증가하였는데, 이는 현저하고 헬레이저 전이효소의 활성이 매우 높음을 시사한다. 다른 클론에서, 증가가 관찰되지 않았다 (데이터 미도시).
다음으로, 카피수의 증가가 터보GFP 발현의 증가로 해석되는지 여부를 평가하였다. 이를 위해, FACS 분석에 의해 전이효소 형질도입 전과 후의 클론을 분석하였다. 주목할 것은, 터보GFP 발현의 유의한 증가는 전이효소 형질도입 후 관찰되었다 (도 14b). 이것은 헬레이저 전이효소 활성이 터보GFP 카세트를 복사하여 다른 게놈 유전자좌위에 붙여넣기에 충분함을 암시한다. 이전의 문헌에서(Grabundzija et al. Nat Commun. 2016 Mar 2;7:10716. doi: 10.1038/ncomms10716.), 삽입이 (표적 부위에서의 AG 디뉴클레오티드에 대한 선호도를 가지는) 게놈 전체에 걸쳐 무작위로 일어날 수 있다고 가정한다.
요약하면, 이 실험은 헬레이저 말단 서열에 의해 플랭크된 유전자 또는 게놈 영역은 헬레이저 전이효소의 첨가 후에 증폭될 수 있음을 보여준다. 이것은 여기에 모델 유전자와 함께 예시되었지만 (단일 카피에 AAVS1 유전자좌위에 삽입된 터보GFP), 내인성 유전자가 LTS 및 RTS로 태그된 경우, 유사한 증폭이 관찰될 수 있다고 예상하기 쉽다. 따라서, 이 접근법은 게놈 증폭을 갖는 세포주를 생성하도록 조정된다. 이러한 세포주는 특정 치료법이 표적 유전자(예를 들어, 유방암에서 Her2)의 증폭 정도에 따라 계층화되고 적절한 참고 표준이 없는 종양학에서 특히 중요할 수 있다.
실시예 3: 두 개의 내인성 인간 유전자좌위의 게놈 증폭: CDK4 및 CD81
세포에서의 유전자 증폭에 사용될 때 헬레이저 트랜스포존의 효율을 측정하기 위해, Hap1 세포는 관심 내인성 유전자를 플랭킹하는 전이효소 인식 부위 (LTS 및 RTS)를 포함하도록 설계된다. 일단 이러한 세포주가 조작되면, 전이효소가 이러한 세포에서 발현되고, 유전자좌위가 전이효소의 복사-붙여넣기 활성으로 인해 카피수가 증가하면 관찰된다. 이 개념 실험의 증명을 위해 두 개의 유전자가 선택된다: 사이클린-의존성 인산화효소 4(Cyclin-dependent kinase 4, CDK4) 및 분화 클러스터 81(Cluster of Differentiation 81, CD81).
게놈으로의 전이에 필요한 좌측 말단 서열(Left Terminal Sequence, LTS) 및 우측 말단 서열 (Right Terminal Sequence, RTS)을 삽입하기 위해, 확립된 비-상동 말단 연결(Non-Homologous End joining) 태깅 방법이 사용된다. 제브라피쉬 tia1L gRNA 인식 부위에 의해 플랭크된 LTS 또는 RTS 및 이 제브라피쉬 tia1L gRNA의 발현을 유도하는 U6 프로모터를 포함하는 플라스미드가 구축된다. LTS 및 RTS 카세트는 tia1L gRNA 부위에서의 Cas9 절단 시 플라스미드로부터 유리될 것이다. 관심 게놈 유전자좌위를 구체화하는 gRNA가 또한 제공된다면, LTS 또는 RTS 카세트는 Cas9/gRNA의 절단 후 이 부위에 삽입될 것이다. LTS는 서열번호 3에 명시되고 RTS는 서열번호 4에 명시된다.
이상적으로, LTS는 상류 A에 의해 플랭킹되고 RTS는 하류 T에 의해 플랭킹되어, 자연적인 헬레이저 전이 이벤트가 AT 디뉴클레오티드에서 일어난다는 사실을 나타내며, 여기서 LTS-공여자-RTS 서열은 A와 T 사이에 삽입된다.
세포주를 조작하기 위해 (하나는 CDK4, 하나는 CD81에 대해), gRNA는 CDK4 및 CD81 게놈 유전자좌위의 상류 및 하류에 설계된다. LTS 카세트는 유전자의 상류(5') 및 RTS 카세트 하류(3')에 삽입되어야 한다. 각 세포주는 두 개의 다른 유전자좌위 (LTS 상류 및 RTS 하류)에 삽입된 카세트를 가질 필요가 있기 때문에 두 개의 연속적인 조작(engineering) 단계가 수행된다. 설계된 gRNA는 아래 표에 나와 있다:
Figure pct00002
Hap1 세포는 Cas9을 발현하는 플라스미드, 태깅 플라스미드 (LTS 또는 RTS), 상응하는 유전자-특이적 gRNA 플라스미드 및 블라스티시딘(blasticidin) 저항성을 부여하는 플라스미드를 가진 리포펙틴(lipofection)에 의해 형질감염된다. 형질감염 후 블라스티시딘으로 세포를 간단히 선택하여 형질감염된 세포를 풍부하게 한다. 3일간의 회복 후, 세포는 단일 세포로 희석되어 클론주를 분리한다. 클론을 PCR 및 생거 시퀀싱에 의해 분석하여 삽입된 LTS 또는 RTS 카세트를 갖는 클론을 식별한다. PCR 및 생거 시퀀싱에 사용된 프라이머는 하기 표에 나와 있다:
Figure pct00003
정확한 유전좌좌위에서의 LTS 또는 RTS를 포함하는 클론 세포주를 확인한 후, 이 세포를 다른 서열 (LTS 또는 RTS)을 삽입하도록 재-표적화하였다. 첫 번째 표적화 실험에 대해 기술된 것과 동일한 절차가 반복되지만, 세포주를 포함하는 LTS가 RTS를 포함하도록 설계되고 그 반대의 경우도 확인한다. 원하는 위치에서 LTS 및 RTS 서열 모두로 두 번째 표적화 실험으로부터 정확하게 편집된 클론성 세포주는 전이효소의 활성을 시험하는데 사용된다.
CDK4 LTS/RTS 및 CD81 LTS/RTS 세포주는 헬레이저 전이효소를 발현하는 플라스미드로 전기천공하였다. 이 발현 플라스미드는 CMV 프로모터 하에서 전이효소 암호화 서열을 포함하며, 이는 전이효소의 높은 발현 수준을 보장한다. 전이효소의 암호화 서열은 서열번호 6에 기재되어 있다. 조작된 CDK4 LTS/RTS 및 CD81 LTS/RTS Hap1 세포를 SE 완충액과 프로그램 DS120을 갖는 론자 뉴클레오펙션(Lonza Nucleofection) 시스템을 이용하여 전이효소 플라스미드로 전기천공하였다. 많은 전이 이벤트가 일어날 수 있게 하기 위해, 세포는 각 라운드 사이에서 4일 간의 회복으로 5회 전기천공을 수행한다. 전기천공의 5번째와 마지막 라운드 후에, 세포주는 단일 세포로 희석하여 클론성 세포주를 분리한다. 클론은 상업적으로 이용가능한 어세이를 이용하여 CDK4 및 CD81 유전자의 카피수를 평가하기 위해 액적 디지털 PCR(droplet digital PCR, ddPCR)에 의해 분석된다. 카피수의 증가가 검출되는 이 클론성 세포주의 경우, 세포주를 qPCR 및 웨스턴 블롯(Western Blot)으로 분석하여 증가된 mRNA 및 단백질 발현 수준의 존재를 확인한다.
실시예 4: DNA 운반체(cargo)를 전달하고 복수 카피의 표적 유전자를 갖는 세포주를 확립하는 헬레이저의 용도
트랜스포존의 한 가지 잠재적인 응용은 전이효소가 무작위 고-카피수 삽입을 매개하는 표적 세포로 DNA 운반체(cargo)를 전달하는 것이다. 이것은 치료적 문맥에서 DNA 운반체를 전달하기 위해 트랜스포존이 적용될 수 있는 경우에 특히 중요하다. 또한, 이것은 CHO 세포가 항체 및 다른 생물학적 물질을 생산하는 생물반응기(bioreactor)로 사용되는 CHO 세포 조작(engineering)과 관련된다.
우리의 실험은 헬레이저가 관심 트랜스진(transgene)을 안정적으로 포함하는 세포주를 확립하는 데 매우 효율적임을 제안한다 (도 1d에 보여진 바와 같이). 실제로, 상기에 기술된 바와 같이, 헬레이저는 자연적으로 발생하는 시스템 보다 100배 더 활동적인 슬리핑뷰티의 조작된 버전(즉, SB100이라고 함) 만큼의 활성이다. 그러나, 이러한 실험에서, 세포 당 예상할 수 있는 트랜스진의 카피수는 명확하지 않았는데 이는 디지털 액적 PCR이 아닌 오직 스플린커렛 PCR에 의해 정량화되었다 (도 3).
이 문제를 해결하기 위해, 플라스미드로부터 HEK293 세포의 게놈으로 전이를 가능하게 하는 퓨로마이신 저항성 유전자가 SV40 프로모터로부터 발현되고 헬레이저 말단 서열에 의해 플랭크된 헬레이저 공여자로 HEK293 세포를 형질감염시켰다. 전이는 CMV 프로모터로부터 발현된 헬레이저 전이효소를 암호화하는 플라스미드를 공동-형질감염시킴으로써 촉매되었다. 형질감염 후, 표적 유전자(PuroR)의 안정적인 삽입을 지닌 세포를 풍부하게 하기 위해 1 ㎍/㎖ 퓨로마이신(Puromycin)을 적용하여 세포를 선택하였다. 다음으로, 희석을 제한함으로써 단일 세포 클론을 분리하고 게놈 DNA를 추출하기 위해 이 클론들을 증식하였다.
선택된 단일 세포 클론을 ddPCR 어세이에 의해 분석하였으며, PuRR 유전자의 카피수를 하기 어세이에 의해 결정하였다:
PuroR 프라이머/프로브 서열
정방향 프라이머 5'-CACCAGGGCAAGGGTCTG-3'
역방향 프라이머 5'-GCTCGTAGAAGGGGAGGTTG-3'
프로브 VIC-GCCTTCCTGGAGACCT-MGB
증폭산물 길이 118 bp
PuroR 카피수를 기준 유전자좌위와 연관시키기 위해, 인간 EGFR 유전자 (ThermoFisher의 카탈로그 번호 4400291)에 대한 프로브 세트를 포함하였다. 이 어세이는 7번 염색체 상의 EGF 수용체를 검출한다.
ddPCR은 본질적으로 실시예 2에서 기술된 바와 같이 수행되었다. 도 15는 ddPCR은 안정한 PuroR 삽입을 보유한 클론의 선택에 기인함을 보여준다. 주목할 것은, 몇몇 클론은 트랜스진(예를 들어, 카피수가 12인 클론 5E11; 카피수가 15인 클론 5F10; 카피수가 14인 클론 10B1)의 고-카피수를 포함하였다. 이 실험은 항생제 선택 이후 및 희석 제한 이후에 실시되었으므로, 그들은 (플라스미드 캐리오버(carry-over) 보다) 실제 게놈 삽입 이벤트를 나타내는 경향이 있다.
요약하면, 이 실험은 헬레이저가 수령자 세포에 운반체를 전달하고 트랜스진의 고-카피수를 보유한 세포주를 확립하는 강력한 도구임을 시사한다. 여기서 얻은 관심있는 카피수는 슬리핑 뷰티의 조작된 버전에 대해 보고된 카피수를 초과한다 (compare Fig 6 of PMID 22402491; Kacherovsky N et al., Combination of Sleeping Beauty transposition and chemically induced dimerization selection for robust production of engineered cells. Nucleic Acids Research, 2012, Vol. 40, No. 11 e85 doi:10.1093/nar/gks213). 이것은 유전자 전달 비히클(vehicle)로서의 헬레이저의 유용성을 강조하고 상기 요약된 목적을 위한 적용 가능성을 강력하게 제시한다.
실시예 5 - 생물공정(Bioprocee) 응용을 위한 헬레이저의 응용
본원에 기술된 헬리트론 전이효소의 생물공정 적용에 대한 적합성을 평가하기 위해, 하기의 실험적 검증이 수행된다.
적절한 선별 카세트를 갖는 공여자 벡터는 산업적으로 관련된 재조합 단백질, 예를 들어 항-HER2 항체를 암호화하는 카세트를 포함하여 구축된다. 기술 검증에 적합한 벡터는 다음과 같은 암호화를 포함한다:
RTS 및 LTS에 의해 플랭킹되는 퓨로마이신R 선별 카세트를 가진 대조군 GFP 벡터 - eGFP (벡터 (1)).
RTS 및 LTS에 의해 플랭킹되는 글루타민 합성효소 선별 카세트를 가진 IgG1 HC 공여자 - 항-HER2 IgG1 중쇄 (벡터 (2)).
RTS 및 LTS에 의해 플랭킹되는 글루타민 합성효소 선별 카세트를 가진 IgG1 LC 공여자 - 항-HERS IgG2 경쇄 (벡터 (3)).
RTS 및 LTS에 의해 플랭킹되는 글루타민 합성효소 선별 카세트를 사진 항-HER2 IgG1 중쇄, 항-HER2 IgG1 경쇄 (벡터 (4)).
헬레이저를 사용하여 GFP와 같은 재조합 단백질의 혼입(incorporation)
헬레이저 전이효소 단백질과 공여자 대조군 GFP 벡터 (상기 Vector (1))는 론자 뉴클레오펙터 표준화된 CHO 절차를 이용하여 전기천공을 통해 세포에 전달된다. 72시간 후, 형질감염의 효율을 결정하기 위해, 세포를 양성 GFP 세포의 수에 대한 유세포 분석법에 의해 분석한다. 세포를 2개의 E125 삼각 플라스크 (0.5×106 세포/㎖)에 접종한다. 첫 번째 플라스크 (a)의 세포를 퓨로마이신 선별 하에 2주 동안 놓고, 반면에 두 번째 플라스크 (b)의 세포를 흔들어주면서 2주 동안 통과시켰다 (최대 세포 밀도 4.0×106 세포/㎖). 2주 후, 플라스크 (a)에서 선별 압력을 제거하고 두 플라스크의 세포를 유세포 분석법으로 분석하여 GFP의 안정적인 삽입을 갖는 세포의 비율을 결정한다. 플라스크 (a)에서 GFP를 발현하는 세포의 100%는 선별 하에 있는 세포 100%에 GFP 유전자의 삽입을 나타낸다. 플라스크 (b)는 선별없이 카세트를 삽입하기 위한 헬레이저 전이효소의 효율의 측정을 제공한다. 플라스크 (a)에서 퓨로마이신으로 선택된 세포를 Cergentis에 의한 TLA(Targeted Locus Amplification, 표적화된 유전자좌위 증폭) 평가를 위해 수확하여 삽입 수와 이의 위치를 결정한다.
GFP-양성 세포는 FACS를 사용하여 1세포/웰로 384 웰 플레이트에 접종된다. 집단의 분포는 단일 삽입에서 복수 삽입을 포함하는 세포에 이르는 다양한 삽입 빈도를 가진 세포를 포획하도록 선택된다. 세포는 2주 동안 성장하고, GFP 형광의 강도가 결정된다. 저-, 중-, 고-형광 세포를 선택하여 추가 분석을 위해 배양한다. 이러한 클론은 ddPCR을 사용하여 삽입 횟수를 평가한다. 단일 삽입을 가진 클론은 증폭 프로토콜을 평가하는 데 사용된다. 삽입 위치는 가장 높은 신호를 나타내는 클론에서 TLA에 의해 결정된다. 클론은 NGS에 의해 시퀀싱되어 헬레이저 전이효소의 사용에 의해 생긴 게놈에 원하지 않은 임의의 변형을 결정한다. 특정 게놈 헬레이저 삽입 이벤트는 그들이 세포 성장, 증식 또는 안정성에 영향을 미치는 것과 같이 피할 수 있으므로 이 정보는 조절 승인에 중요하다.
단일 GFP 삽입을 가진 클론은 헬레이저 전이효소 단백질에 노출되어 증폭 효율을 결정한다. 세포는 유세포 분석법에 의카피해 분석되어 형광 신호의 변화를 결정한다. 세포는 복제되고 삽입 수는 ddPCR에 의해 결정된다. 클론은 저(<5 카피), 중간 (10-20 copies) 및 고(20-100 카피) 형광으로 분류된다. TLA를 사용하여 전이가능한 요소의 무결성을 평가한다. 프로토콜은 GFP 카세트의 10-20 카피를 갖는 클론의 생성을 증가시키는데 최적화되어 있다.
헬레이저를 이용하는 대형 멀티유전자(multigene) 카세트(단일 클론 항체 중쇄 및 경쇄)의 혼입
단일 유전자 공여자 대 이중 유전자 공여자에 의한 멀티유전자 운반체를 전달하는 효율을 비교하기 위해 두 개의 형질감염이 설정된다. 헬레이저 전이효소 및 공여자는 론자 뉴클레오펙터(Lonza Nucleofector) 표준화된 CHO 절차를 사용하여 전기천공을 통해 세포에 전달된다. 세 개의 풀이 생성된다: 풀 (a)는 상기와 같이 단일 유전자 공여자 벡터 (2) 및 (3)으로 형질 감염시키고, 풀 (b)는 상기와 같이 이중 유전자 공여자 벡터 (4)로 형질 감염시키고 풀 (c)는 공여자가 없는 거짓된(mock) 대조군이다. 72시간 후, 호라이즌 표준(Horizon’s standard) 절차에 따라 T 플라스크에서 L-글루타민이 없는(minus L-Glutamine) 조건하에서 세포를 선택한다. 10일 선별 후, 풀 (a) 및 (b)로부터 얻은 세포는 10일 유가 배양(fed-batch) 배양물에서 생산성에 대해 평가된다. 이것은 그램 양의 생성물을 생성하는 데 사용될 수 있는 고도로 발현하는 풀을 생성할 때 전이효소의 효율을 결정한다. 동시에, 풀 (a) 및 (b)로부터의 세포를 384-웰 플레이트에 접종하여 1000개의 클론을 생성시킨다. 1000 클론을 96-웰 플레이트에 접종하고, IgG1 생산성을 결정하기 위해 5일 배양 후 상층액을 수거한다. 클론은 IgG1의 성장 및 생산(저, 중 및 고)에 기초하여 선택된다. 풀(pool)과 클론은 60세대 동안 세포를 배양함으로써 안정성에 대해 평가된다. 이 기간이 끝나면, 세포를 10일 동안의 유가 배양 배양물로 생산성에 대해 평가한다. 이 정보는 규제 승인에 중요하다.
생물공정 응용에 사용하기 위한 전이효소의 평가를 위해, 하기와 같은 매트릭스(metrics)가 고려되어야 한다:
1) 선택된 풀은 2 g/L보다 큰 재조합 단백질을 생산한다
2) 제품 적정농도(titre)는 안정적인 세포주의 세대 1과 세대 60 사이에서 +/- 30%로 차이가 없다.
실시예 6: 치료 목적을 위해 생체 외에서 DNA 전달체를 인간 세포로 전달하는 헬레이저의 사용
헬레이저 트랜스포존을 이용하는 생체 외 유전자 치료
표적화된 병리(pathology)에 적합한 세포의 유형 및 수는 이식편 대 숙주 질환(graft vs host disease)을 제한하고 숙주에 의한 거부를 예방/감소시키기 위해 적절히 조작된 iPSC 세포로부터 유래된 환자, 공여자 또는 집단으로부터 분리된다. LTS 서열, 관심 세포에서 작동하는 적절한 프로모터 및/또는 인핸서, 선택적으로 인접한 유전자를 활성화시키는 프로모터/인핸서의 능력을 억제하는 절연(insulation) 서열, 관심 단백질 (또는 RNA)을 암호화하는 cDNA, 적절한 전사 종결 서열 및 RTS 서열을 포함하는 DNA 벡터가 어셈블된다. 원하는 세포 수가 얻어질 때까지 적절한 세포 배양 배지에서 세포를 배양한다 (그리고 필요할 경우 증식한다). 상기 기술된 벡터(관심-RTS의 LTS-cDNA)는 전기천공 또는 형질감염에 의해 수령자 세포로 도입된다. 대안적으로, 활성 바이러스가 생성되는 위험을 제거하도록 벡터는 패키징 시스템으로부터 유래된 바이러스 입자를 통해 도입될 수 있다. 추가의 대안으로, 벡터는 숙주 세포로 융합하기에 적합한 특성을 갖는 비-바이러스 입자, 예를 들어 리포좀에 도입된다.
모든 경우에, 숙주 세포는 벡터가 세포 내로 도입될 때 또는 그 때쯤에 (적어도 일시적으로) 헬리트론 전이효소를 또한 발현시킬 필요가 있다. 헬리트론 전이효소는 DNA로 (형질감염/전기천공을 통한 또는 비-바이러스 입자 상에 바이러스와의 형질도입을 통한 유리 플라스미드)로, 전이효소를 암호화하는 mRNA, 또는 전이효소 단백질로 도입될 수 있다.
형질도입된 세포 집단은 전이효소의 공급원이 시스템에서 제거될 때까지 배양된다. 전이효소의 존재/부재는 트랜스포존의 뉴클레오티드 서열에 대한 프라이머를 이용한 PCR에 의해 결정된다. 조작된 세포의 샘플을 조사하여 그들이 얼마나 효율적으로 형질도입되었는지, 삽입된 원하는 유전자 서열의 수 및 세포 간에 얼마나 많은 카피 수가 있는지를 확인한다. 조작(engineering) 이벤트가 세포 완전성(integrity)를 보존하는 방식으로 유세포 분석법에 의해 관찰될 수 있는 표현형을 생성하는 경우, 바람직한 행동을 가진 집단을 FACS 분류에 의해 농축할 수 있다. 세포는 치료를 위한 적절한 수에 도달할 때까지 세로 배양물에서 증식된다. 동결보존(cryopreservation)은 후속조치(follow-on) 치료를 위한 집단을 저장하거나 기성품(off-the-shelf) 치료 제품을 만드는 데 사용될 수 있다.
형질감염된 세포는 적절한 신체 조직 또는 말초 혈액 순환 내로의 주입에 의해 환자에게 도입된다. 일부 경우, 숙주 조직 (예컨대, 골수)이 제거되어 인체 내에 존재하는 야생형 세포에 대한 조작된 도입된 세포의 비율을 증가시키면, 증가 된 치료 효과를 달성할 것이다. 환자의 병리학적 표현형은 조작된 세포의 도입으로 인한 치료 효과를 측정하기 위해 평가된다. 어떤 경우에는 1회 치료가 최적일 수 있고, 다른 경우에는 조작된 세포의 추가 도입이 도움이 될 수 있다.
실시예 7: 치료 목적을 위해 생체 내에서 DNA 전달체를 인간 세포로 전달하는 헬레이저의 사용
생체 내 유전자 치료법은 병리학적 상황을 정상 기능으로 회복시키는 또 다른 방법이다. 당업자는 헬리트론 트랜스포존이 하기 단계를 거쳐 생체 내 유전자 치료법에 사용될 수 있음을 명백히 알 수있다.
첫째, LTS 서열, 관심 세포주에서 작동하는 적절한 프로모터 및/또는 인핸서, 잠재적으로 인접한 유전자를 활성화시키는 프로모터/인핸서의 능력을 억제하는 절연(insulation) 서열, 단백질 (또는 RNA)을 암호화하는 cDNA, 적절한 전사 종결 서열 및 RTS 서열을 포함하는 DNA 벡터가 어셈블된다.
둘째, 관심-RTS 벡터의 LTS-cDNA의 치료 용량은 헬리트론 트랜스포존을 생체 내에서 세포 내로 도입할 수 있는 시스템과 함께 제조된다. DNA 벡터는 그들이 독소가 없도록 충분한 주의를 기울인 플라스미드로 제조될 수 있거나, 감염을 유지할 수 있는 살아있는 바이러스의 생성을 방지하는 패키징 시스템에서 생성된 적절한 바이러스 입자에서 포장될 수 있거나, 적절한 지질 또는 중합체 입자 주위에 비-바이러스 전달 시스템에서 포장될 수 있다. 일부 경우에, 헬리트론 전이효소는 암호화 mRNA, 또는 대안적으로, 적절한 순도의 재조합 단백질 의 형태로 전달될 수 있다.
셋째, 상기 관심-RTS의 LTS-cDNA 벡터 및 전이효소의 형질도입 시스템은 원하는 조직이나 장기에 주사를 통해 환자의 신체에 도입된다. 적용된 용량 및 방법은 마우스, 랫트 및/또는 비-인간 영장류을 포함하나 이에 제한되지 않는 전임상 모델에 사용될 때, 허용 가능한 안전성을 가지는 치료 효과를 생산해내는 것들로부터 선택될 것이다.
실시예 8: 돌연변이체의 라이브러리를 생성하는 헬리트론의 사용
유전자 트랩 (Gene Traps)은 다양한 종에 걸쳐 자주 관심 유전자의 발현을 방해하는 합성 유전적 요소이다 (cite PMID 18370072; Floss T and Schnutgen F; Chapter 9 in Chromosomal Mutagenesis, Humana Press, Eds. Davis GD and Kayser KJ (2008)). GFP, RFP, mCherry, PuroR 또는 BlaR과 같은 리포터 유전자에 융합된 강한 스플라이스 수용체를 포함하고 강한 전사 종결 신호가 뒤따른다 (cite PMID 19965467; Carette JE et al. (2009) Science Vol. 326, Issue 5957, pp. 1231-1235 DOI: 10.1126/science.1178955). 그러한 유전자 트랩 카세트가 유전자의 발현 부분 내에 삽입되면, 그것은 스플라이스 수락자(splice acceptor)의 수단에 의해 전사체를 포획할 것이고 이 유전자의 전사를 명확하게 폐지할 융합 전사체를 만들 것이다. 이것은 다양한 유기체에서 기능상실(loss-of-function, LOF) 모델을 만드는데 이용되었다 (e.g. mice, zebrafish; cite PMID 15167922; International Gene Trap Consortium, Skarnes WC et al. (2004). Nature Genetics, 36(6), 543?544. http://doi.org/10.1038/ng0604-543).
유전자 스크랩의 대규모 평행(parallel) 전달은 유전 스크리닝을 받을 수 있는 돌연변이체의 라이브러리를 만드는 접근법으로 사용될 수 있다. 이것은 염색체/유전자의 단일 세트를 포함하는 효모 및 반수체(haploid) 인간 세포에서 잘 예시되어 왔으며 (Carette et al. (2009)), 따라서 "동형(homozygous)" LOF 돌연변이를 얻는 것은 간단하다. 비록 낮은 빈도와 가능하게는 (이형(heterozygous) LOF 돌연변이체가 가장 두드러질 수 있는) 낮은 "전환율(conversion rates)"에도 불구하고, 다른 세포 및 유기체에서 가능하다 (cite PMID 25961939; Moriarity BS et al. (2015). Nature Genetics, 47(6), 615?624. http://doi.org/10.1038/ng.3293).
이러한 스크린은 고효율의 세포 형질도입 및 거대한 평행 접근법으로 수천 개의 유전자의 동시적인 불활성화를 요구한다. 역사적으로, 이것은 레트로바이러스, 렌티바이러스 또는 트랜스포존(대개 피기백(PiggyBac), Tol2 및 슬리핑 뷰티(Sleeping Beauty))을 이용하여 달성된다. 이들 접근법 모두가 가능하지만, 레트로바이러스는 그 삽입 패턴이 유전자 및 전사 개시 부위에 편향되어 있고 레트로바이러스 삽입 사이트가 후성적(epigenetic) 메커니즘에 의해 침묵되어 있으므로 특별한 단점이 있다. 렌티바이러스는 덜 편항되어 있지만, 여전히 침묵의 대상이 된다. 트랜스포존은 매력적인 대안을 나타내고 생산하기에 훨씬 쉽지만, 적어도 그들 중 일부는 전체 게놈에 대한 비편향적인 분포와 달리 "국부적인 호핑(local hopping)"을 선호하는 것으로 보인다 (cite PMID 19391106; Liang Q et al. (2009) Genesis. 2009 Jun;47(6):404-8. doi: 10.1002/dvg.20508).
헬레이저 트랜스포존 시스템은 수만개(최대 100만개)의 독립적인 헬레이저 삽입 이벤트를 포함하는 세포 라이브러리를 만드는 매력적인 수단이다. 세포는 퓨로마이신-저항성 유전자의 발현을 유도하는 스플라이스 수락자(splice acceptor)로 구성된 유전자 트랩 카세트는 헬레이저 종결 서열 LTS 및 RTS에 의해 플랭킹되는 공여자로 형질도입된다. 전이효소 발현 플라스미드의 동시-적용(예를 들어, 형질감염에 의함)은 플라스미드로부터 유전자 트랩을 동원하여 많은 상이한 삽입 돌연변이체를 포함하는 세포주 라이브러리를 생성한다. 이러한 라이브러리의 크기는 사용된 세포수 및 전이 활성에 비례하므로 모든 단일 인간 유전자가 트랜스포존 삽입에 의해 불활성화되는 라이브러리가 생성된다. 형질도입 후, 헬레이저 삽입 이벤트를 포함하는 세포는 선택적으로, 퓨로마이신 선별에 의해 농축된다.
다음으로, 이들 라이브러리는 당업자에게 공지된 방법을 사용하여 유전적 스크리닝 된다. 세포 집단에서 살아남은 트랜스포존 돌연변이체를 결정하기 위해, 트랜스포존 삽입 부위는 하기에 요약된 것과 같이 스플린커렛 PCR에 의해 매핑된다:
헬레이저 트랜스포존 삽입을 포함하는 세포의 게놈 DNA 5 ㎍을 FspBI로 4시간 동안 절단한 후 에탄올 침전시킨다. 다음 단계에서, 20 ㎕의 반응액에서 BfaI 스플린커렛 어댑터 (100 pmol)에 샘플을 라이게이션(300 ng)한다. 라이게이션 반응액의 3 마이크로리터를 프라이머인 링커 프라이머 및 Hel1 (표 4 참조)와 함께 첫 번째 PCR에 사용한다. 첫 번째 PCR 라운드의 온도 프로파일은 다음과 같다: 94℃에서 3분 동안 1 사이클에 이어서, 94℃에서 30초, 70℃에서 30초, 72℃에서 30초를 15 사이클; 94℃에서 30초, 63℃에서 30초, 사이클 당 2초씩 증가하는 72℃에서 2초를 5 사이클; 94℃에서 30초, 62℃에서 30초, 사이클 당 2초씩 증가하는 72℃에서 12초를 5 사이클; 94℃에서 30초, 61℃에서 30초, 사이클 당 2초씩 증가하는 72℃에서 22초를 5 사이클; 및 94℃에서 30초, 60℃에서 30초, 72℃에서 30초를 5 사이클. 네스티드 PCR(Nested PCR)은 프라이머 Nested 및 Hel2, 및 50 ㎕ 반응액 당 첫 번째 PCR의 1:100 희석액 1 ㎕으로 수행된다. 네스티드 PCR에 대한 온도 프로파일은 94℃에서 3분 간의 1 사이클로 시작하여, 이어서 94℃에서 30초, 65℃에서 30초, 72℃에서 30초를 10 사이클 및 94℃에서 30초, 55℃에서 30초, 72℃에서 2분을 20 사이클이었다. 최종 신장은 72℃에서 5분 동안 수행된다.
pHelR, pHelRΔHP 및 pHelRΔRTS 트랜스포존으로 생성된 헬레이저 삽입물의 3' 말단에서 트랜스포존-게놈 접합 부위를 분석하기 위해, 세포로부터 단리된 게놈 DNA로 첫 번째 왼쪽-말단 스플린커렛 PCR을 수행하여 트랜스포존 삽입의 게놈 위치를 결정한다. 다음 단계에서, 각 트랜스포존 삽입물의 50과 100 bp 하류 사이에 위치하는 게놈 서열에 상보적인 특정 프라이머(WT6a, WT6b, WT6c, WT6d, DelH2, DelH14, DelH19, DelRTS2, DelRTS15a; 표 4 참조)를 헬레이저 트랜스포존의 5'-말단에 서열과 상보적인 HelCD1 프라이머와 함께 게놈 PCR에 사용한다. PCR의 온도 프로파일은 95℃에서 2분, 이어서 95℃에서 20초, 57℃에서 20초, 72℃에서 90초를 40 사이클이다. 최종 연장 단계는 72℃에서 5분 동안 수행되었다. 게놈 PCR에서 수득된 PCR 산물을 시퀀싱하고 분석한다.
표 1
Figure pct00004
표 2
Figure pct00005
표 3
Figure pct00006
표 4 (1/3)
Figure pct00007
Figure pct00008
Figure pct00009
표 5
Figure pct00010
Figure pct00011
표 6: 서열번호의 표
Figure pct00012
Figure pct00013
Figure pct00014
<110> HORIZON DISCOVERY LIMITED MAX-DELBRUCK-CENTRUM FUR MOLEKULARE MEDIZIN GENETIC INFORMATION RESEARCH INSTITUTE <120> REPLICATIVE TRANSPOSON SYSTEM <130> 2018FPI-07-003GB <150> GB 1602473.9 <151> 2016-02-11 <150> PCT/GB 2017/050355 <151> 2017-02-10 <160> 207 <170> PatentIn version 3.5 <210> 1 <211> 1496 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 1 Met Ser Lys Glu Gln Leu Leu Ile Gln Arg Ser Ser Ala Ala Glu Arg 1 5 10 15 Cys Arg Arg Tyr Arg Gln Lys Met Ser Ala Glu Gln Arg Ala Ser Asp 20 25 30 Leu Glu Arg Arg Arg Arg Leu Gln Gln Asn Val Ser Glu Glu Gln Leu 35 40 45 Leu Glu Lys Arg Arg Ser Glu Ala Glu Lys Gln Arg Arg His Arg Gln 50 55 60 Lys Met Ser Lys Asp Gln Arg Ala Phe Glu Val Glu Arg Arg Arg Trp 65 70 75 80 Arg Arg Gln Asn Met Ser Arg Glu Gln Ser Ser Thr Ser Thr Thr Asn 85 90 95 Thr Gly Arg Asn Cys Leu Leu Ser Lys Asn Gly Val His Glu Asp Ala 100 105 110 Ile Leu Glu His Ser Cys Gly Gly Met Thr Val Arg Cys Glu Phe Cys 115 120 125 Leu Ser Leu Asn Phe Ser Asp Glu Lys Pro Ser Asp Gly Lys Phe Thr 130 135 140 Arg Cys Cys Ser Lys Gly Lys Val Cys Pro Asn Asp Ile His Phe Pro 145 150 155 160 Asp Tyr Pro Ala Tyr Leu Lys Arg Leu Met Thr Asn Glu Asp Ser Asp 165 170 175 Ser Lys Asn Phe Met Glu Asn Ile Arg Ser Ile Asn Ser Ser Phe Ala 180 185 190 Phe Ala Ser Met Gly Ala Asn Ile Ala Ser Pro Ser Gly Tyr Gly Pro 195 200 205 Tyr Cys Phe Arg Ile His Gly Gln Val Tyr His Arg Thr Gly Thr Leu 210 215 220 His Pro Ser Asp Gly Val Ser Arg Lys Phe Ala Gln Leu Tyr Ile Leu 225 230 235 240 Asp Thr Ala Glu Ala Thr Ser Lys Arg Leu Ala Met Pro Glu Asn Gln 245 250 255 Gly Cys Ser Glu Arg Leu Met Ile Asn Ile Asn Asn Leu Met His Glu 260 265 270 Ile Asn Glu Leu Thr Lys Ser Tyr Lys Met Leu His Glu Val Glu Lys 275 280 285 Glu Ala Gln Ser Glu Ala Ala Ala Lys Gly Ile Ala Pro Thr Glu Val 290 295 300 Thr Met Ala Ile Lys Tyr Asp Arg Asn Ser Asp Pro Gly Arg Tyr Asn 305 310 315 320 Ser Pro Arg Val Thr Glu Val Ala Val Ile Phe Arg Asn Glu Asp Gly 325 330 335 Glu Pro Pro Phe Glu Arg Asp Leu Leu Ile His Cys Lys Pro Asp Pro 340 345 350 Asn Asn Pro Asn Ala Thr Lys Met Lys Gln Ile Ser Ile Leu Phe Pro 355 360 365 Thr Leu Asp Ala Met Thr Tyr Pro Ile Leu Phe Pro His Gly Glu Lys 370 375 380 Gly Trp Gly Thr Asp Ile Ala Leu Arg Leu Arg Asp Asn Ser Val Ile 385 390 395 400 Asp Asn Asn Thr Arg Gln Asn Val Arg Thr Arg Val Thr Gln Met Gln 405 410 415 Tyr Tyr Gly Phe His Leu Ser Val Arg Asp Thr Phe Asn Pro Ile Leu 420 425 430 Asn Ala Gly Lys Leu Thr Gln Gln Phe Ile Val Asp Ser Tyr Ser Lys 435 440 445 Met Glu Ala Asn Arg Ile Asn Phe Ile Lys Ala Asn Gln Ser Lys Leu 450 455 460 Arg Val Glu Lys Tyr Ser Gly Leu Met Asp Tyr Leu Lys Ser Arg Ser 465 470 475 480 Glu Asn Asp Asn Val Pro Ile Gly Lys Met Ile Ile Leu Pro Ser Ser 485 490 495 Phe Glu Gly Ser Pro Arg Asn Met Gln Gln Arg Tyr Gln Asp Ala Met 500 505 510 Ala Ile Val Thr Lys Tyr Gly Lys Pro Asp Leu Phe Ile Thr Met Thr 515 520 525 Cys Asn Pro Lys Trp Ala Asp Ile Thr Asn Asn Leu Gln Arg Trp Gln 530 535 540 Lys Val Glu Asn Arg Pro Asp Leu Val Ala Arg Val Phe Asn Ile Lys 545 550 555 560 Leu Asn Ala Leu Leu Asn Asp Ile Cys Lys Phe His Leu Phe Gly Lys 565 570 575 Val Ile Ala Lys Ile His Val Ile Glu Phe Gln Lys Arg Gly Leu Pro 580 585 590 His Ala His Ile Leu Leu Ile Leu Asp Ser Glu Ser Lys Leu Arg Ser 595 600 605 Glu Asp Asp Ile Asp Arg Ile Val Lys Ala Glu Ile Pro Asp Glu Asp 610 615 620 Gln Cys Pro Arg Leu Phe Gln Ile Val Lys Ser Asn Met Val His Gly 625 630 635 640 Pro Cys Gly Ile Gln Asn Pro Asn Ser Pro Cys Met Glu Asn Gly Lys 645 650 655 Cys Ser Lys Gly Tyr Pro Lys Glu Phe Gln Asn Ala Thr Ile Gly Asn 660 665 670 Ile Asp Gly Tyr Pro Lys Tyr Lys Arg Arg Ser Gly Ser Thr Met Ser 675 680 685 Ile Gly Asn Lys Val Val Asp Asn Thr Trp Ile Val Pro Tyr Asn Pro 690 695 700 Tyr Leu Cys Leu Lys Tyr Asn Cys His Ile Asn Val Glu Val Cys Ala 705 710 715 720 Ser Ile Lys Ser Val Lys Tyr Leu Phe Lys Tyr Ile Tyr Lys Gly His 725 730 735 Asp Cys Ala Asn Ile Gln Ile Ser Glu Lys Asn Ile Ile Asn His Asp 740 745 750 Glu Val Gln Asp Phe Ile Asp Ser Arg Tyr Val Ser Ala Pro Glu Ala 755 760 765 Val Trp Arg Leu Phe Ala Met Arg Met His Asp Gln Ser His Ala Ile 770 775 780 Thr Arg Leu Ala Ile His Leu Pro Asn Asp Gln Asn Leu Tyr Phe His 785 790 795 800 Thr Asp Asp Phe Ala Glu Val Leu Asp Arg Ala Lys Arg His Asn Ser 805 810 815 Thr Leu Met Ala Trp Phe Leu Leu Asn Arg Glu Asp Ser Asp Ala Arg 820 825 830 Asn Tyr Tyr Tyr Trp Glu Ile Pro Gln His Tyr Val Phe Asn Asn Ser 835 840 845 Leu Trp Thr Lys Arg Arg Lys Gly Gly Asn Lys Val Leu Gly Arg Leu 850 855 860 Phe Thr Val Ser Phe Arg Glu Pro Glu Arg Tyr Tyr Leu Arg Leu Leu 865 870 875 880 Leu Leu His Val Lys Gly Ala Ile Ser Phe Glu Asp Leu Arg Thr Val 885 890 895 Gly Gly Val Thr Tyr Asp Thr Phe His Glu Ala Ala Lys His Arg Gly 900 905 910 Leu Leu Leu Asp Asp Thr Ile Trp Lys Asp Thr Ile Asp Asp Ala Ile 915 920 925 Ile Leu Asn Met Pro Lys Gln Leu Arg Gln Leu Phe Ala Tyr Ile Cys 930 935 940 Val Phe Gly Cys Pro Ser Ala Ala Asp Lys Leu Trp Asp Glu Asn Lys 945 950 955 960 Ser His Phe Ile Glu Asp Phe Cys Trp Lys Leu His Arg Arg Glu Gly 965 970 975 Ala Cys Val Asn Cys Glu Met His Ala Leu Asn Glu Ile Gln Glu Val 980 985 990 Phe Thr Leu His Gly Met Lys Cys Ser His Phe Lys Leu Pro Asp Tyr 995 1000 1005 Pro Leu Leu Met Asn Ala Asn Thr Cys Asp Gln Leu Tyr Glu Gln Gln 1010 1015 1020 Gln Ala Glu Val Leu Ile Asn Ser Leu Asn Asp Glu Gln Leu Ala Ala 1025 1030 1035 1040 Phe Gln Thr Ile Thr Ser Ala Ile Glu Asp Gln Thr Val His Pro Lys 1045 1050 1055 Cys Phe Phe Leu Asp Gly Pro Gly Gly Ser Gly Lys Thr Tyr Leu Tyr 1060 1065 1070 Lys Val Leu Thr His Tyr Ile Arg Gly Arg Gly Gly Thr Val Leu Pro 1075 1080 1085 Thr Ala Ser Thr Gly Ile Ala Ala Asn Leu Leu Leu Gly Gly Arg Thr 1090 1095 1100 Phe His Ser Gln Tyr Lys Leu Pro Ile Pro Leu Asn Glu Thr Ser Ile 1105 1110 1115 1120 Ser Arg Leu Asp Ile Lys Ser Glu Val Ala Lys Thr Ile Lys Lys Ala 1125 1130 1135 Gln Leu Leu Ile Ile Asp Glu Cys Thr Met Ala Ser Ser His Ala Ile 1140 1145 1150 Asn Ala Ile Asp Arg Leu Leu Arg Glu Ile Met Asn Leu Asn Val Ala 1155 1160 1165 Phe Gly Gly Lys Val Leu Leu Leu Gly Gly Asp Phe Arg Gln Cys Leu 1170 1175 1180 Ser Ile Val Pro His Ala Met Arg Ser Ala Ile Val Gln Thr Ser Leu 1185 1190 1195 1200 Lys Tyr Cys Asn Val Trp Gly Cys Phe Arg Lys Leu Ser Leu Lys Thr 1205 1210 1215 Asn Met Arg Ser Glu Asp Ser Ala Tyr Ser Glu Trp Leu Val Lys Leu 1220 1225 1230 Gly Asp Gly Lys Leu Asp Ser Ser Phe His Leu Gly Met Asp Ile Ile 1235 1240 1245 Glu Ile Pro His Glu Met Ile Cys Asn Gly Ser Ile Ile Glu Ala Thr 1250 1255 1260 Phe Gly Asn Ser Ile Ser Ile Asp Asn Ile Lys Asn Ile Ser Lys Arg 1265 1270 1275 1280 Ala Ile Leu Cys Pro Lys Asn Glu His Val Gln Lys Leu Asn Glu Glu 1285 1290 1295 Ile Leu Asp Ile Leu Asp Gly Asp Phe His Thr Tyr Leu Ser Asp Asp 1300 1305 1310 Ser Ile Asp Ser Thr Asp Asp Ala Glu Lys Glu Asn Phe Pro Ile Glu 1315 1320 1325 Phe Leu Asn Ser Ile Thr Pro Ser Gly Met Pro Cys His Lys Leu Lys 1330 1335 1340 Leu Lys Val Gly Ala Ile Ile Met Leu Leu Arg Asn Leu Asn Ser Lys 1345 1350 1355 1360 Trp Gly Leu Cys Asn Gly Thr Arg Phe Ile Ile Lys Arg Leu Arg Pro 1365 1370 1375 Asn Ile Ile Glu Ala Glu Val Leu Thr Gly Ser Ala Glu Gly Glu Val 1380 1385 1390 Val Leu Ile Pro Arg Ile Asp Leu Ser Pro Ser Asp Thr Gly Leu Pro 1395 1400 1405 Phe Lys Leu Ile Arg Arg Gln Phe Pro Val Met Pro Ala Phe Ala Met 1410 1415 1420 Thr Ile Asn Lys Ser Gln Gly Gln Thr Leu Asp Arg Val Gly Ile Phe 1425 1430 1435 1440 Leu Pro Glu Pro Val Phe Ala His Gly Gln Leu Tyr Val Ala Phe Ser 1445 1450 1455 Arg Val Arg Arg Ala Cys Asp Val Lys Val Lys Val Val Asn Thr Ser 1460 1465 1470 Ser Gln Gly Lys Leu Val Lys His Ser Glu Ser Val Phe Thr Leu Asn 1475 1480 1485 Val Val Tyr Arg Glu Ile Leu Glu 1490 1495 <210> 2 <211> 4491 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 2 atgtctaaag aacaactgtt gatacaacgt agctctgcag ccgaaagatg ccggcgttat 60 cgacagaaaa tgtctgcaga gcaacgtgcg tctgatcttg aaagaaggcg gcgcctgcaa 120 cagaatgtat ctgaagagca gctactggaa aaacgtcgct ctgaagccga aaaacagcgg 180 cgtcatcgac agaaaatgtc taaagaccaa cgtgcctttg aagttgaaag aaggcggtgg 240 cgacgacaga atatgtctag agaacagtca tcaacaagta ctaccaatac cggtaggaac 300 tgccttctca gcaaaaatgg agtacatgag gatgcaattc tcgaacatag ttgtggtgga 360 atgactgttc gatgtgaatt ttgcctatca ctaaatttct ctgatgaaaa accatccgat 420 gggaaattta ctcgatgttg tagcaaaggg aaagtctgtc caaatgatat acattttcca 480 gattacccgg catatttaaa aagattaatg acaaacgaag attctgacag taaaaatttc 540 atggaaaata ttcgttccat aaatagttct tttgcttttg cttccatggg tgcaaatatt 600 gcatcgccat caggatatgg gccatactgt tttagaatac acggacaagt ttatcaccgt 660 actggaactt tacatccttc ggatggtgtt tctcggaagt ttgctcaact ctatattttg 720 gatacagccg aagctacaag taaaagatta gcaatgccag aaaaccaggg ctgctcagaa 780 agactcatga tcaacatcaa caacctcatg catgaaataa atgaattaac aaaatcgtac 840 aagatgctac atgaggtaga aaaggaagcc caatctgaag cagcagcaaa aggtattgct 900 cccacagaag taacaatggc gattaaatac gatcgtaaca gtgacccagg tagatataat 960 tctccccgtg taaccgaggt tgctgtcata ttcagaaacg aagatggaga acctcctttt 1020 gaaagggact tgctcattca ttgtaaacca gatcccaata atccaaatgc cactaaaatg 1080 aaacaaatca gtatcctgtt tcctacatta gatgcaatga catatcctat tctttttcca 1140 catggtgaaa aaggctgggg aacagatatt gcattaagac tcagagacaa cagtgtaatc 1200 gacaataata ctagacaaaa tgtaaggaca cgagtcacac aaatgcagta ttatggattt 1260 catctctctg tgcgggacac gttcaatcct attttaaatg caggaaaatt aactcaacag 1320 tttattgtgg attcatattc aaaaatggag gccaatcgga taaatttcat caaagcaaac 1380 caatctaagt tgagagttga aaaatatagt ggtttgatgg attatctcaa atctagatct 1440 gaaaatgaca atgtgccgat tggtaaaatg ataatacttc catcatcttt tgagggtagt 1500 cccagaaata tgcagcagcg atatcaggat gctatggcaa ttgtaacgaa gtatggcaag 1560 cccgatttat tcataaccat gacatgcaac cccaaatggg cagatattac aaacaattta 1620 caacgctggc aaaaagttga aaacagacct gacttggtag ccagagtttt taatattaag 1680 ctgaatgctc ttttaaatga tatatgtaaa ttccatttat ttggcaaagt aatagctaaa 1740 attcatgtca ttgaatttca gaaacgcgga ctgcctcacg ctcacatatt attgatatta 1800 gatagtgagt ccaaattacg ttcagaagat gacattgacc gtatagttaa ggcagaaatt 1860 ccagatgaag accagtgtcc tcgacttttt caaattgtaa aatcaaatat ggtacatgga 1920 ccatgtggaa tacaaaatcc aaatagtcca tgtatggaaa atggaaaatg ttcaaaggga 1980 tatccaaaag aatttcaaaa tgcgaccatt ggaaatattg atggatatcc caaatacaaa 2040 cgaagatctg gtagcaccat gtctattgga aataaagttg tcgataacac ttggattgtc 2100 ccttataacc cgtatttgtg ccttaaatat aactgtcata taaatgttga agtctgtgca 2160 tcaattaaaa gtgtcaaata tttatttaaa tacatctata aagggcacga ttgtgcaaat 2220 attcaaattt ctgaaaaaaa tattatcaat catgacgaag tacaggactt cattgactcc 2280 aggtatgtga gcgctcctga ggctgtttgg agactttttg caatgcgaat gcatgaccaa 2340 tctcatgcaa tcacaagatt agctattcat ttgccaaatg atcagaattt gtattttcat 2400 accgatgatt ttgctgaagt tttagatagg gctaaaaggc ataactcgac tttgatggct 2460 tggttcttat tgaatagaga agattctgat gcacgtaatt attattattg ggagattcca 2520 cagcattatg tgtttaataa ttctttgtgg acaaaacgcc gaaagggtgg gaataaagta 2580 ttaggtagac tgttcactgt gagctttaga gaaccagaac gatattacct tagacttttg 2640 cttctgcatg taaaaggtgc gataagtttt gaggatctgc gaactgtagg aggtgtaact 2700 tatgatacat ttcatgaagc tgctaaacac cgaggattat tacttgatga cactatctgg 2760 aaagatacga ttgacgatgc aatcatcctt aatatgccca aacaactacg gcaacttttt 2820 gcatatatat gtgtgtttgg atgtccttct gctgcagaca aattatggga tgagaataaa 2880 tctcatttta ttgaagattt ctgttggaaa ttacaccgaa gagaaggtgc ctgtgtgaac 2940 tgtgaaatgc atgcccttaa cgaaattcag gaggtattca cattgcatgg aatgaaatgt 3000 tcacatttca aacttccgga ctatccttta ttaatgaatg caaatacatg tgatcaattg 3060 tacgagcaac aacaggcaga ggttttgata aattctctga atgatgaaca gttggcagcc 3120 tttcagacta taacttcagc catcgaagat caaactgtac accccaaatg ctttttcttg 3180 gatggtccag gtggtagtgg aaaaacatat ctgtataaag ttttaacaca ttatattaga 3240 ggtcgtggtg gtactgtttt acccacagca tctacaggaa ttgctgcaaa tttacttctt 3300 ggtggaagaa cctttcattc ccaatataaa ttaccaattc cattaaatga aacttcaatt 3360 tctagactcg atataaagag tgaagttgct aaaaccatta aaaaggccca acttctcatt 3420 attgatgaat gcaccatggc atccagtcat gctataaacg ccatagatag attactaaga 3480 gaaattatga atttgaatgt tgcatttggt gggaaagttc tccttctcgg aggggatttt 3540 cgacaatgtc tcagtattgt accacatgct atgcgatcgg ccatagtaca aacgagttta 3600 aagtactgta atgtttgggg atgtttcaga aagttgtctc ttaaaacaaa tatgagatca 3660 gaggattctg cttatagtga atggttagta aaacttggag atggcaaact tgatagcagt 3720 tttcatttag gaatggatat tattgaaatc ccccatgaaa tgatttgtaa cggatctatt 3780 attgaagcta cctttggaaa tagtatatct atagataata ttaaaaatat atctaaacgt 3840 gcaattcttt gtccaaaaaa tgagcatgtt caaaaattaa atgaagaaat tttggatata 3900 cttgatggag attttcacac atatttgagt gatgattcca ttgattcaac agatgatgct 3960 gaaaaggaaa attttcccat cgaatttctt aatagtatta ctccttcggg aatgccgtgt 4020 cataaattaa aattgaaagt gggtgcaatc atcatgctat tgagaaatct taatagtaaa 4080 tggggtcttt gtaatggtac tagatttatt atcaaaagat tacgacctaa cattatcgaa 4140 gctgaagtat taacaggatc tgcagaggga gaggttgttc tgattccaag aattgatttg 4200 tccccatctg acactggcct cccatttaaa ttaattcgaa gacagtttcc cgtgatgcca 4260 gcatttgcga tgactattaa taaatcacaa ggacaaactc tagacagagt aggaatattc 4320 ctacctgaac ccgttttcgc acatggtcag ttatatgttg ctttctctcg agttcgaaga 4380 gcatgtgacg ttaaagttaa agttgtaaat acttcatcac aagggaaatt agtcaagcac 4440 tctgaaagtg tttttactct taatgtggta tacagggaga tattagaata a 4491 <210> 3 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 3 tcctatataa taaaagagaa acatgcaaat tgaccatccc tccgctacgc tcaagccacg 60 cccaccagcc aatcagaagt gactatgcaa attaacccaa caaagatggc agttaaattt 120 gcatacgcag gtgtcaagcg ccccaggagg 150 <210> 4 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 4 aaatttatgt attattttca tatacatttt actcatttcc tttcatctct cacacttcta 60 ttatagagaa agggcaaata gcaatattaa aatatttcct ctaattaatt ccctttcaat 120 gtgcacgaat ttcgtgcacc gggccactag 150 <210> 5 <211> 5296 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 5 tcctatataa taaaagagaa acatgcaaat tgaccatccc tccgctacgc tcaagccacg 60 cccaccagcc aatcagaagt gactatgcaa attaacccaa caaagatggc agttaaattt 120 gcatacgcag gtgtcaagcg ccccaggagg caacggcggc cgcgggctcc caggaccttc 180 gctggccccg ggaggcgagg ccggccgcgc ctagccacac ccgcgggctc ccgggacctt 240 cgccagcaga gagcagagcg ggagagcggg cggagagcgg gaggtttgga ggacttggca 300 gagcaggagg ccgctggaca tagagcagag cgagagagag ggtggcttgg agggcgtggc 360 tccctctgtc accccagctt cctcatcaca gctgtggaaa ctgacagcag ggaggaggaa 420 gtcccacccc cacagaatca gccagaatca gccgttggtc agacagctct cagcggcctg 480 acagccagga ctctcattca cctgcatctc agaccgtgac agtagagagg tgggactatg 540 tctaaagaac aactgttgat acaacgtagc tctgcagccg aaagatgccg gcgttatcga 600 cagaaaatgt ctgcagagca acgtgcgtct gatcttgaaa gaaggcggcg cctgcaacag 660 aatgtatctg aagagcagct actggaaaaa cgtcgctctg aagccgaaaa acagcggcgt 720 catcgacaga aaatgtctaa agaccaacgt gcctttgaag ttgaaagaag gcggtggcga 780 cgacagaata tgtctagaga acagtcatca acaagtacta ccaataccgg taggaactgc 840 cttctcagca aaaatggagt acatgaggat gcaattctcg aacatagttg tggtggaatg 900 actgttcgat gtgaattttg cctatcacta aatttctctg atgaaaaacc atccgatggg 960 aaatttactc gatgttgtag caaagggaaa gtctgtccaa atgatataca ttttccagat 1020 tacccggcat atttaaaaag attaatgaca aacgaagatt ctgacagtaa aaatttcatg 1080 gaaaatattc gttccataaa tagttctttt gcttttgctt ccatgggtgc aaatattgca 1140 tcgccatcag gatatgggcc atactgtttt agaatacacg gacaagttta tcaccgtact 1200 ggaactttac atccttcgga tggtgtttct cggaagtttg ctcaactcta tattttggat 1260 acagccgaag ctacaagtaa aagattagca atgccagaaa accagggctg ctcagaaaga 1320 ctcatgatca acatcaacaa cctcatgcat gaaataaatg aattaacaaa atcgtacaag 1380 atgctacatg aggtagaaaa ggaagcccaa tctgaagcag cagcaaaagg tattgctccc 1440 acagaagtaa caatggcgat taaatacgat cgtaacagtg acccaggtag atataattct 1500 ccccgtgtaa ccgaggttgc tgtcatattc agaaacgaag atggagaacc tccttttgaa 1560 agggacttgc tcattcattg taaaccagat cccaataatc caaatgccac taaaatgaaa 1620 caaatcagta tcctgtttcc tacattagat gcaatgacat atcctattct ttttccacat 1680 ggtgaaaaag gctggggaac agatattgca ttaagactca gagacaacag tgtaatcgac 1740 aataatacta gacaaaatgt aaggacacga gtcacacaaa tgcagtatta tggatttcat 1800 ctctctgtgc gggacacgtt caatcctatt ttaaatgcag gaaaattaac tcaacagttt 1860 attgtggatt catattcaaa aatggaggcc aatcggataa atttcatcaa agcaaaccaa 1920 tctaagttga gagttgaaaa atatagtggt ttgatggatt atctcaaatc tagatctgaa 1980 aatgacaatg tgccgattgg taaaatgata atacttccat catcttttga gggtagtccc 2040 agaaatatgc agcagcgata tcaggatgct atggcaattg taacgaagta tggcaagccc 2100 gatttattca taaccatgac atgcaacccc aaatgggcag atattacaaa caatttacaa 2160 cgctggcaaa aagttgaaaa cagacctgac ttggtagcca gagtttttaa tattaagctg 2220 aatgctcttt taaatgatat atgtaaattc catttatttg gcaaagtaat agctaaaatt 2280 catgtcattg aatttcagaa acgcggactg cctcacgctc acatattatt gatattagat 2340 agtgagtcca aattacgttc agaagatgac attgaccgta tagttaaggc agaaattcca 2400 gatgaagacc agtgtcctcg actttttcaa attgtaaaat caaatatggt acatggacca 2460 tgtggaatac aaaatccaaa tagtccatgt atggaaaatg gaaaatgttc aaagggatat 2520 ccaaaagaat ttcaaaatgc gaccattgga aatattgatg gatatcccaa atacaaacga 2580 agatctggta gcaccatgtc tattggaaat aaagttgtcg ataacacttg gattgtccct 2640 tataacccgt atttgtgcct taaatataac tgtcatataa atgttgaagt ctgtgcatca 2700 attaaaagtg tcaaatattt atttaaatac atctataaag ggcacgattg tgcaaatatt 2760 caaatttctg aaaaaaatat tatcaatcat gacgaagtac aggacttcat tgactccagg 2820 tatgtgagcg ctcctgaggc tgtttggaga ctttttgcaa tgcgaatgca tgaccaatct 2880 catgcaatca caagattagc tattcatttg ccaaatgatc agaatttgta ttttcatacc 2940 gatgattttg ctgaagtttt agatagggct aaaaggcata actcgacttt gatggcttgg 3000 ttcttattga atagagaaga ttctgatgca cgtaattatt attattggga gattccacag 3060 cattatgtgt ttaataattc tttgtggaca aaacgccgaa agggtgggaa taaagtatta 3120 ggtagactgt tcactgtgag ctttagagaa ccagaacgat attaccttag acttttgctt 3180 ctgcatgtaa aaggtgcgat aagttttgag gatctgcgaa ctgtaggagg tgtaacttat 3240 gatacatttc atgaagctgc taaacaccga ggattattac ttgatgacac tatctggaaa 3300 gatacgattg acgatgcaat catccttaat atgcccaaac aactacggca actttttgca 3360 tatatatgtg tgtttggatg tccttctgct gcagacaaat tatgggatga gaataaatct 3420 cattttattg aagatttctg ttggaaatta caccgaagag aaggtgcctg tgtgaactgt 3480 gaaatgcatg cccttaacga aattcaggag gtattcacat tgcatggaat gaaatgttca 3540 catttcaaac ttccggacta tcctttatta atgaatgcaa atacatgtga tcaattgtac 3600 gagcaacaac aggcagaggt tttgataaat tctctgaatg atgaacagtt ggcagccttt 3660 cagactataa cttcagccat cgaagatcaa actgtacacc ccaaatgctt tttcttggat 3720 ggtccaggtg gtagtggaaa aacatatctg tataaagttt taacacatta tattagaggt 3780 cgtggtggta ctgttttacc cacagcatct acaggaattg ctgcaaattt acttcttggt 3840 ggaagaacct ttcattccca atataaatta ccaattccat taaatgaaac ttcaatttct 3900 agactcgata taaagagtga agttgctaaa accattaaaa aggcccaact tctcattatt 3960 gatgaatgca ccatggcatc cagtcatgct ataaacgcca tagatagatt actaagagaa 4020 attatgaatt tgaatgttgc atttggtggg aaagttctcc ttctcggagg ggattttcga 4080 caatgtctca gtattgtacc acatgctatg cgatcggcca tagtacaaac gagtttaaag 4140 tactgtaatg tttggggatg tttcagaaag ttgtctctta aaacaaatat gagatcagag 4200 gattctgctt atagtgaatg gttagtaaaa cttggagatg gcaaacttga tagcagtttt 4260 catttaggaa tggatattat tgaaatcccc catgaaatga tttgtaacgg atctattatt 4320 gaagctacct ttggaaatag tatatctata gataatatta aaaatatatc taaacgtgca 4380 attctttgtc caaaaaatga gcatgttcaa aaattaaatg aagaaatttt ggatatactt 4440 gatggagatt ttcacacata tttgagtgat gattccattg attcaacaga tgatgctgaa 4500 aaggaaaatt ttcccatcga atttcttaat agtattactc cttcgggaat gccgtgtcat 4560 aaattaaaat tgaaagtggg tgcaatcatc atgctattga gaaatcttaa tagtaaatgg 4620 ggtctttgta atggtactag atttattatc aaaagattac gacctaacat tatcgaagct 4680 gaagtattaa caggatctgc agagggagag gttgttctga ttccaagaat tgatttgtcc 4740 ccatctgaca ctggcctccc atttaaatta attcgaagac agtttcccgt gatgccagca 4800 tttgcgatga ctattaataa atcacaagga caaactctag acagagtagg aatattccta 4860 cctgaacccg ttttcgcaca tggtcagtta tatgttgctt tctctcgagt tcgaagagca 4920 tgtgacgtta aagttaaagt tgtaaatact tcatcacaag ggaaattagt caagcactct 4980 gaaagtgttt ttactcttaa tgtggtatac agggagatat tagaataagt ttaatcactt 5040 tatcagtcat tgtttgcatc aatgttgttt ttatatcatg tttttgttgt ttttatatca 5100 tgtctttgtt gttgttatat catgttgtta ttgtttattt attaataaat ttatgtatta 5160 ttttcatata cattttactc atttcctttc atctctcaca cttctattat agagaaaggg 5220 caaatagcaa tattaaaata tttcctctaa ttaattccct ttcaatgtgc acgaatttcg 5280 tgcaccgggc cactag 5296 <210> 6 <211> 4491 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 6 atgtccaagg aacagctgct gattcagcgg agctccgccg ccgagagatg ccgccgctat 60 cgccagaaaa tgtctgccga gcagagggcc tccgatctgg agcgccggcg gagactgcag 120 cagaacgtga gcgaagagca gctgctggag aagcggcggt ctgaagccga gaagcagaga 180 agacaccggc agaaaatgtc caaagatcag agggccttcg aggtggagcg gcggaggtgg 240 agaagacaga atatgagcag agaacagtct tctaccagca caaccaatac cgggagaaac 300 tgtctgctgt ccaagaacgg cgtgcacgaa gatgccatcc tggagcacag ctgtggcggc 360 atgaccgtga gatgcgagtt ttgtctgagc ctgaattttt ccgacgagaa gccatctgat 420 ggcaagttta ccagatgttg ttccaaaggg aaagtgtgcc caaatgatat ccacttcccc 480 gactacccag cctatctgaa gaggctgatg accaacgagg atagcgattc caagaacttc 540 atggaaaata tcaggagcat caactcctct ttcgcctttg cctctatggg cgccaacatt 600 gcctccccct ctgggtacgg cccttactgt ttccggattc acggacaggt gtaccaccgc 660 accggcaccc tgcacccctc tgacggcgtg tctcggaagt tcgcccagct gtatatcctg 720 gacaccgccg aggccacctc caagaggctg gccatgcctg agaatcaggg ctgcagcgaa 780 aggctgatga tcaacattaa caacctgatg cacgagatca acgagctgac caagagctac 840 aagatgctgc acgaggtgga gaaagaagcc cagtctgagg ccgccgccaa ggggatcgcc 900 cccaccgagg tgaccatggc catcaaatat gatcggaatt ccgatcctgg ccggtacaat 960 agcccaagag tgacagaggt ggccgtgatt ttcaggaacg aggacggaga gccccccttc 1020 gagagggatc tgctgattca ctgtaagcct gaccctaata accctaatgc caccaagatg 1080 aagcagattt ctatcctgtt cccaaccctg gacgccatga cctatcctat tctgttcccc 1140 cacggcgaaa agggatgggg gacagatatc gccctgcggc tgagggacaa ttccgtgatt 1200 gacaataata ccagacagaa cgtgcggaca agggtgacac agatgcagta ttacggcttc 1260 cacctgtctg tgagagacac ctttaatcca atcctgaatg ccggaaagct gacccagcag 1320 tttatcgtgg actcctactc caagatggaa gccaacagaa ttaatttcat caaggccaat 1380 cagtctaagc tgcgggtgga gaaatactct gggctgatgg attacctgaa gtctaggtct 1440 gagaatgaca acgtgcctat tggaaagatg atcattctgc ccagctcttt tgaagggagc 1500 ccacggaata tgcagcagcg gtaccaggat gccatggcca ttgtgacaaa gtatgggaag 1560 cctgatctgt tcatcacaat gacatgtaac cccaagtggg ccgatattac caacaacctg 1620 cagaggtggc agaaggtgga gaacagaccc gacctggtgg ccagggtgtt caacatcaag 1680 ctgaacgccc tgctgaacga catttgcaag tttcacctgt ttgggaaggt gattgccaaa 1740 attcacgtga ttgagtttca gaaacggggc ctgccacacg cccacatcct gctgatcctg 1800 gactccgaaa gcaagctgag atctgaggac gatatcgaca ggattgtgaa ggccgagatc 1860 cccgacgagg atcagtgtcc acgcctgttc cagattgtga aatccaacat ggtgcacggc 1920 ccttgtggga tccagaatcc caactcccca tgcatggaaa acgggaagtg cagcaagggc 1980 tatcccaagg agttccagaa cgccaccatc ggcaacatcg acggctatcc aaaatataag 2040 aggaggtccg gctctaccat gagcattggc aataaggtgg tggataacac ctggatcgtg 2100 ccttataacc cctatctgtg cctgaagtac aactgtcaca tcaatgtgga ggtgtgcgcc 2160 tccatcaaat ccgtgaagta cctgttcaaa tacatctaca aaggccacga ctgcgccaat 2220 atccagatct ctgagaagaa cattattaac cacgatgagg tgcaggactt tattgattct 2280 agatacgtga gcgcccccga ggccgtgtgg agactgttcg ccatgaggat gcacgaccag 2340 agccacgcca tcacccggct ggccatccac ctgcccaatg atcagaatct gtactttcac 2400 accgatgatt tcgccgaggt gctggatagg gccaagagac acaacagcac cctgatggcc 2460 tggttcctgc tgaacaggga ggattccgac gccaggaact attattattg ggaaatccca 2520 cagcactacg tgtttaacaa cagcctgtgg accaagagaa gaaaaggggg caacaaggtg 2580 ctgggccgcc tgttcaccgt gtcttttaga gagcctgaaa ggtactacct gaggctgctg 2640 ctgctgcacg tgaagggggc catctctttc gaagacctgc gcaccgtggg gggagtgacc 2700 tacgatacct tccacgaagc cgccaaacac aggggcctgc tgctggacga cacaatctgg 2760 aaagacacca tcgatgatgc cattattctg aacatgccaa agcagctgag acagctgttc 2820 gcctacatct gcgtgtttgg atgcccctcc gccgccgaca agctgtggga tgagaataag 2880 tcccacttta ttgaggattt ctgttggaag ctgcacagaa gggagggggc ctgtgtgaac 2940 tgcgaaatgc acgccctgaa tgagatccag gaagtgttta cactgcacgg catgaagtgt 3000 tctcacttca aactgcctga ctatcctctg ctgatgaatg ccaacacctg tgatcagctg 3060 tacgagcagc agcaggccga ggtgctgatc aattccctga atgacgagca gctggccgcc 3120 ttccagacca ttacatctgc cattgaggac cagaccgtgc accccaagtg cttcttcctg 3180 gacggacccg gagggtctgg caagacctac ctgtataaag tgctgacaca ctatatcaga 3240 ggaagggggg ggaccgtgct gcctaccgcc agcacaggca ttgccgccaa cctgctgctg 3300 gggggcagga ccttccactc tcagtacaag ctgcccatcc ctctgaacga gacatctatc 3360 tctagactgg acatcaaatc cgaggtggcc aagaccatta aaaaggccca gctgctgatt 3420 atcgacgagt gtaccatggc cagctcccac gccatcaacg ccatcgacag actgctgagg 3480 gaaatcatga acctgaacgt ggccttcgga ggcaaggtgc tgctgctggg cggcgatttt 3540 aggcagtgcc tgagcattgt gccccacgcc atgcggtccg ccatcgtgca gacctccctg 3600 aagtattgta atgtgtgggg ctgcttccgg aagctgagcc tgaaaaccaa tatgaggagc 3660 gaggacagcg cctacagcga gtggctggtg aagctgggcg atggaaaact ggattcctcc 3720 ttccacctgg ggatggacat tatcgagatc ccccacgaga tgatttgtaa cgggagcatt 3780 atcgaggcca ccttcgggaa ctccatcagc atcgataaca tcaagaatat ttctaagaga 3840 gccattctgt gcccaaagaa cgaacacgtg cagaagctga atgaggagat cctggatatt 3900 ctggacggag atttccacac ctacctgtct gacgatagca tcgattccac cgacgacgcc 3960 gagaaggaaa acttcccaat tgaattcctg aatagcatca cccccagcgg catgccctgt 4020 cacaagctga agctgaaggt gggcgccatc atcatgctgc tgcggaacct gaactctaag 4080 tggggcctgt gtaacggcac ccgctttatc attaaaaggc tgaggccaaa catcattgaa 4140 gccgaggtgc tgaccggcag cgccgaaggc gaagtggtgc tgatcccacg cattgacctg 4200 tctccaagcg acaccggcct gcccttcaaa ctgatccgcc gccagtttcc tgtgatgccc 4260 gccttcgcca tgacaattaa caagtcccag ggccagacac tggaccgcgt gggcattttt 4320 ctgcccgaac cagtgttcgc ccacgggcag ctgtatgtgg cctttagcag agtgcgccgg 4380 gcctgcgatg tgaaggtgaa agtggtgaac acctcttccc agggcaagct ggtgaagcac 4440 agcgaatctg tgttcacact gaacgtggtg tatagagaga tcctggaata a 4491 <210> 7 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 7 Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Tyr Pro Tyr Asp Val Pro 1 5 10 15 Asp Tyr Ala <210> 8 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 8 caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 60 cttcagcatc ttttacttaa gcttccagcg 90 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 9 ggtatgtcgg gaacctctcc 20 <210> 10 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 10 ggtatgtcgg gaacctctcc agg 23 <210> 11 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 11 gtcaccaatc ctgtccctag 20 <210> 12 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 12 tatattccca gggccggtta 20 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 13 tctccacctc agtgatgacg 20 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 14 aggaggatca cagcaacacc 20 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 15 acaggaggtg ggggttagac 20 <210> 16 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 16 ctgcacgtga gcttcagcta 20 <210> 17 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 17 aagccggtgc ccatca 16 <210> 18 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic probe" <400> 18 ccgcgtgatc ggcgactt 18 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 19 gtggctctaa gggtaaatca 20 <210> 20 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 20 taatcataga accttcctac 20 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 21 ggcctgacat ctgattgcgg 20 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 22 caggggaatc tgacatcggt 20 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 23 ggttgttttc tccttggccc 20 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 24 atcctagagc caaccccagt 20 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 25 aagtgctaag aaagcggcac 20 <210> 26 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 26 tccaacaggc tcagtgacaa g 21 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 27 cacttctggg tgcgtactgt 20 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 28 gcttgctaga gggtcacagg 20 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 29 taacacgtcg ccttcaactg 20 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 30 ttacaatctg gcggcttcat 20 <210> 31 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 31 caccagggca agggtctg 18 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 32 gctcgtagaa ggggaggttg 20 <210> 33 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic probe" <400> 33 gccttcctgg agacct 16 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 34 ggcgcttgac acctgcgtat 20 <210> 35 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 35 gtggcttgag cgtagcggag 20 <210> 36 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 36 acactctttc cctacacgac gctcttccga tct 33 <210> 37 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 37 tttgcatgtt tctcttttat tatatag 27 <210> 38 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 38 attaattccc tttcaatgtg cacgaa 26 <210> 39 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 39 ttccctttca atgtgcacga attt 24 <210> 40 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 40 acactctttc cctacacgac gctcttccga tct 33 <210> 41 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 41 aatttcgtgc accgggccac t 21 <210> 42 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 42 ccttctatga acggctgggc tt 22 <210> 43 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 43 gggctttact gtgaccgcag at 22 <210> 44 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 44 acactctttc cctacacgac gctcttccga tct 33 <210> 45 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 45 gaaaaccctg gaccaatggt ttgt 24 <210> 46 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 46 gtgactggag ttcagacgtg 20 <210> 47 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 47 caagcagaag acggcatacg agat 24 <210> 48 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 48 gtgactggag ttcagacgtg tgctcttccg atct 34 <210> 49 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 49 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58 <210> 50 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 50 gtgactggag ttcagacgtg tgctcttccg atctdddnnn aacg 44 <210> 51 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 51 gtgactggag ttcagacgtg tgctcttccg atcthhhnnn ctac 44 <210> 52 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 52 gtgactggag ttcagacgtg tgctcttccg atcthhhnnn ggac 44 <210> 53 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (35) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (37)..(38) <223> a, c, t, g, unknown or other <400> 53 gtgactggag ttcagacgtg tgctcttccg atctnbnnbh cgtt 44 <210> 54 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (36) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (38) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (40) <223> a, c, t, g, unknown or other <400> 54 gtgactggag ttcagacgtg tgctcttccg atctvnvnvn gcaa 44 <210> 55 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (36) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 55 gtgactggag ttcagacgtg tgctcttccg atcthnhnnn gtcc 44 <210> 56 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (40) <223> a, c, t, g, unknown or other <400> 56 gtgactggag ttcagacgtg tgctcttccg atcthhhnhn attc 44 <210> 57 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 57 gtgactggag ttcagacgtg tgctcttccg atctbbbnnn gaat 44 <210> 58 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 58 gtgactggag ttcagacgtg tgctcttccg atcthhhnnn gaac 44 <210> 59 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (36) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 59 gtgactggag ttcagacgtg tgctcttccg atctvnvnnn gtaa 44 <210> 60 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (36) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 60 gtgactggag ttcagacgtg tgctcttccg atcthnhnnn gtcc 44 <210> 61 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 61 gtgactggag ttcagacgtg tgctcttccg atcthhhnnn ttac 44 <210> 62 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (35) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 62 gtgactggag ttcagacgtg tgctcttccg atctnddnnn agtg 44 <210> 63 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 63 gtgactggag ttcagacgtg tgctcttccg atctbbbnnn cact 44 <210> 64 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (36) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 64 gtgactggag ttcagacgtg tgctcttccg atctvnvnnn tcaa 44 <210> 65 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 65 gtgactggag ttcagacgtg tgctcttccg atctdvvnnn ttga 44 <210> 66 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38) <223> a, c, t, g, unknown or other <220> <221> misc_feature <222> (40) <223> a, c, t, g, unknown or other <400> 66 gtgactggag ttcagacgtg tgctcttccg atcthvvnvn taca 44 <210> 67 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <220> <221> misc_feature <222> (38)..(40) <223> a, c, t, g, unknown or other <400> 67 gtgactggag ttcagacgtg tgctcttccg atctsvvnnn tgta 44 <210> 68 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 68 gcctccatca aatccgtgaa gttcctgttc aaatacatct acaaaggc 48 <210> 69 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 69 gtgaagtacc tgttcaaatt tatctacaaa ggccacgact gc 42 <210> 70 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 70 cagaaacggg gcctgccagc agccgcaatc ctgctgatcc tgg 43 <210> 71 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 71 cagaaacggg gcctgccaca agcccaaatc ctgctgatcc tgg 43 <210> 72 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 72 gcctccatca aatccgtgaa gttcctgttc aaatttatct acaaaggc 48 <210> 73 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 73 ggacccggag ggtctggcca aacctacctg tataaagtg 39 <210> 74 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 74 ctgtatgtgg cctttagcca agtgcgccgg gcctgcgat 39 <210> 75 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 75 gataatgtgc cgattggcac catggttatt ctgccgagca gttttg 46 <210> 76 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 76 cagattagcg aaaaaaactg aatcaaccac gatgaggtg 39 <210> 77 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 77 gccagcatta aaagcgtgaa attcctgttc aaatatatct ataaaggc 48 <210> 78 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 78 gtgaaatacc tgttcaaatt tatctataaa ggccacgatt gc 42 <210> 79 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 79 cagaaacggg gcctgccagc agccgcaatc ctgctgatcc tgg 43 <210> 80 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 80 cagaaacgtg gtctgccgca agcccaaatt ctgctgattc tgg 43 <210> 81 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 81 gccagcatta aaagcgtgaa attcctgttc aaatttatct ataaaggc 48 <210> 82 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 82 ggtccgggtg gcagcggtaa cacctatctg tataaagtg 39 <210> 83 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 83 ctgtacgttg cctttagcaa cgttcgtcgt gcatgtgat 39 <210> 84 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 84 caccatatga tcctatataa taaaagagaa acatgcaaat tgaccatccc 50 <210> 85 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 85 ccctttcaat gtgcacgaat ttcgtgcacc gggccactag tatatatata 50 <210> 86 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 86 ccctttcaat gtgcacgaac gggccactag tatatatata aagc 44 <210> 87 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 87 ctaattaatt ccctttcaat cgggccacta gtatatatat aaagc 45 <210> 88 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 88 ttatatatat actagtggcc cgacctgcgg tacaccgcag gtattg 46 <210> 89 <211> 74 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 89 gctatttgcc ctttctctat aatagaagtg tgagagatga aaggaaatga gtaaaatgta 60 tatgaaaata atac 74 <210> 90 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 90 gagaaagggc aaatagcaat attaaaatat ttcctctaat taattccctt tcaatacctg 60 cggtgtaccg c 71 <210> 91 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 91 tatcatgtct ggatccaaat ttatgtatta ttttcatata c 41 <210> 92 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 92 ttatatatat actagtgg 18 <210> 93 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 93 tatcatgtct ggatcc 16 <210> 94 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 94 ttatatatat actagtggcc cggtgcacga cggacgtgca cattg 45 <210> 95 <211> 74 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 95 gctatttgcc ctttctctat aatagaagtg tgagagatga aaggaaatga gtaaaatgta 60 tatgaaaata atac 74 <210> 96 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 96 gagaaagggc aaatagcaat attaaaatat ttcctctaat taattccctt tcaatgtgca 60 cgacggacgt gcaccgggcc 80 <210> 97 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 97 tatcatgtct ggatccaaat ttatgtatta ttttcatata c 41 <210> 98 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 98 ttatatatat actagtgg 18 <210> 99 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 99 tatcatgtct ggatcc 16 <210> 100 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 100 aatttccgca ggtcgggcca c 21 <210> 101 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 101 ccgcaggtat tgaaaggg 18 <210> 102 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 102 cctcctgggg cgcttgacac ctgcg 25 <210> 103 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 103 tggctggtgg gcgtggcttg 20 <210> 104 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 104 tcatctctca cacttctatt atagag 26 <210> 105 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 105 gtaatacgac tcactatagg gc 22 <210> 106 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 106 agggctccgc ttaagggac 19 <210> 107 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 107 ggcagttaaa tttgcatacg cag 23 <210> 108 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 108 cagttaccta gaaggaaaca gag 23 <210> 109 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 109 gtcacagccc atgatatgcc c 21 <210> 110 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 110 cttgctgttt gaatatgaaa ttatgttatt c 31 <210> 111 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 111 cattatgcca atttcacaga tgagg 25 <210> 112 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 112 gaaggtaatt tagaagtgaa agaacac 27 <210> 113 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 113 gtatctatca cctcacctag ttaac 25 <210> 114 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 114 gctggaacgt taattatgat gcg 23 <210> 115 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 115 gttgatatgg aagatgagaa tgaaac 26 <210> 116 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 116 ctgacaggat tttggagaat acg 23 <210> 117 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 117 gactctacta gtgccaccat gtacccttac gacgtaccgg attacgccta cccttacgac 60 gtaccggatt acgccactag tgactct 87 <210> 118 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 118 agagtcacta gtggcgtaat ccggtacgtc gtaagggtag gcgtaatccg gtacgtcgta 60 agggtacatg gtggcactag tagagtc 87 <210> 119 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 119 cgctggaagc ttaag 15 <210> 120 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 120 gcgcgggaat tccaccatat g 21 <210> 121 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 121 gcgcgggaat tcgggatggt caatttgc 28 <210> 122 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 122 gcgcgggaat tcccctttca atgtgcacg 29 <210> 123 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 123 gcgcgggaat tctatatata ta 22 <210> 124 <211> 2928 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 124 cctggagagg ttcccgacat acctcctata taataaaaga gaaacatgca aattgaccat 60 ccctccgcta cgctcaagcc acgcccacca gccaatcaga agtgactatg caaattaacc 120 caacaaagat ggcagttaaa tttgcatacg caggtgtcaa gcgccccagg aggatcgatg 180 agtaattcat acaaaaggac tcgcccctgc cttggggaat cccagggacc gtcgttaaac 240 tcccactaac gtagaaccca gagatcgctg cgttcccgcc ccctcacccg cccgctctcg 300 tcatcactga ggtggagaag agcatgcgtg aggctccggt gcccgtcagt gggcagagcg 360 cacatcgccc acagtccccg agaagttggg gggaggggtc ggcaattgaa ccggtgccta 420 gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc gcctttttcc 480 cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc tttttcgcaa 540 cgggtttgcc gccagaacac aggtaagtgc cgtgtgtggt tcccgcgggc ctggcctctt 600 tacgggttat ggcccttgcg tgccttgaat tacttccacg cccctggctg cagtacgtga 660 ttcttgatcc cgagcttcgg gttggaagtg ggtgggagag ttcgaggcct tgcgcttaag 720 gagccccttc gcctcgtgct tgagttgagg cctggcttgg gcgctggggc cgccgcgtgc 780 gaatctggtg gcaccttcgc gcctgtctcg ctgctttcga taagtctcta gccatttaaa 840 atttttgatg acctgctgcg acgctttttt tctggcaaga tagtcttgta aatgcgggcc 900 aagatctgca cactggtatt tcggtttttg gggccgcggg cggcgacggg gcccgtgcgt 960 cccagcgcac atgttcggcg aggcggggcc tgcgagcgcg gccaccgaga atcggacggg 1020 ggtagtctca agctggccgg cctgctctgg tgcctggcct cgcgccgccg tgtatcgccc 1080 cgccctgggc ggcaaggctg gcccggtcgg caccagttgc gtgagcggaa agatggccgc 1140 ttcccggccc tgctgcaggg agctcaaaat ggaggacgcg gcgctcggga gagcgggcgg 1200 gtgagtcacc cacacaaagg aaaagggcct ttccgtcctc agccgtcgct tcatgtgact 1260 ccacggagta ccgggcgccg tccaggcacc tcgattagtt ctcgagcttt tggagtacgt 1320 cgtctttagg ttggggggag gggttttatg cgatggagtt tccccacact gagtgggtgg 1380 agactgaagt taggccagct tggcacttga tgtaattctc cttggaattt gccctttttg 1440 agtttggatc ttggttcatt ctcaagcctc agacagtggt tcaaagtttt tttcttccat 1500 ttcaggtgtc gtgagccacc atgggatccg agagcgacga gagcggcctg cccgccatgg 1560 agatcgagtg ccgcatcacc ggcaccctga acggcgtgga gttcgagctg gtgggcggcg 1620 gagagggcac ccccgagcag ggccgcatga ccaacaagat gaagagcacc aaaggcgccc 1680 tgaccttcag cccctacctg ctgagccacg tgatgggcta cggcttctac cacttcggca 1740 cctaccccag cggctacgag aaccccttcc tgcacgccat caacaacggc ggctacacca 1800 acacccgcat cgagaagtac gaggacggcg gcgtgctgca cgtgagcttc agctaccgct 1860 acgaggccgg ccgcgtgatc ggcgacttca aggtgatggg caccggcttc cccgaggaca 1920 gcgtgatctt caccgacaag atcatccgca gcaacgccac cgtggagcac ctgcacccca 1980 tgggcgataa cgatctggat ggcagcttca cccgcacctt cagcctgcgc gacggcggct 2040 actacagctc cgtggtggac agccacatgc acttcaagag cgccatccac cccagcatcc 2100 tgcagaacgg gggccccatg ttcgccttcc gccgcgtgga ggaggatcac agcaacaccg 2160 agctgggcat cgtggagtac cagcacgcct tcaagacccc ggatgcagat gccggtgaag 2220 aaggatccta gacgcgtgga tccaataaaa gatccttatt ttcattggat ctgtgtgttg 2280 gttttttgtg tggctagcaa atttatgtat tattttcata tacattttac tcatttcctt 2340 tcatctctca cacttctatt atagagaaag ggcaaatagc aatattaaaa tatttcctct 2400 aattaattcc ctttcaatgt gcacgaattt cgtgcaccgg gccactagta tatatataaa 2460 gcttggtatg tcgggaacct ctccaggcag cggccgccca aggtcgggca ggaagagggc 2520 ctatttccca tgattccttc atatttgcat atacgataca aggctgttag agagataatt 2580 agaattaatt tgactgtaaa cacaaagata ttagtacaaa atacgtgacg tagaaagtaa 2640 taatttcttg ggtagtttgc agttttaaaa ttatgtttta aaatggacta tcatatgctt 2700 accgtaactt gaaagtattt cgatttcttg gctttatata tcttgtggaa aggacgaaac 2760 accggtatgt cgggaacctc tccgttttag agctagaaat agcaagttaa aataaggcta 2820 gtccgttatc aacttgaaaa agtggcaccg agtcggtgct ttttttatcg gatcccgggc 2880 ccgtcgactg cagaggcctg catgcaagct tggcgtaatc atggtcat 2928 <210> 125 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 125 cctggagagg ttcccgacat acc 23 <210> 126 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 126 ggtatgtcgg gaacctctcc agg 23 <210> 127 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 127 tcctatataa taaaagagaa acatgcaaat tgaccatccc tccgctacgc tcaagccacg 60 cccaccagcc aatcagaagt gactatgcaa attaacccaa caaagatggc agttaaattt 120 gcatacgcag gtgtcaagcg ccccaggagg 150 <210> 128 <211> 1335 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 128 gagtaattca tacaaaagga ctcgcccctg ccttggggaa tcccagggac cgtcgttaaa 60 ctcccactaa cgtagaaccc agagatcgct gcgttcccgc cccctcaccc gcccgctctc 120 gtcatcactg aggtggagaa gagcatgcgt gaggctccgg tgcccgtcag tgggcagagc 180 gcacatcgcc cacagtcccc gagaagttgg ggggaggggt cggcaattga accggtgcct 240 agagaaggtg gcgcggggta aactgggaaa gtgatgtcgt gtactggctc cgcctttttc 300 ccgagggtgg gggagaaccg tatataagtg cagtagtcgc cgtgaacgtt ctttttcgca 360 acgggtttgc cgccagaaca caggtaagtg ccgtgtgtgg ttcccgcggg cctggcctct 420 ttacgggtta tggcccttgc gtgccttgaa ttacttccac gcccctggct gcagtacgtg 480 attcttgatc ccgagcttcg ggttggaagt gggtgggaga gttcgaggcc ttgcgcttaa 540 ggagcccctt cgcctcgtgc ttgagttgag gcctggcttg ggcgctgggg ccgccgcgtg 600 cgaatctggt ggcaccttcg cgcctgtctc gctgctttcg ataagtctct agccatttaa 660 aatttttgat gacctgctgc gacgcttttt ttctggcaag atagtcttgt aaatgcgggc 720 caagatctgc acactggtat ttcggttttt ggggccgcgg gcggcgacgg ggcccgtgcg 780 tcccagcgca catgttcggc gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg 840 gggtagtctc aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc 900 ccgccctggg cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga aagatggccg 960 cttcccggcc ctgctgcagg gagctcaaaa tggaggacgc ggcgctcggg agagcgggcg 1020 ggtgagtcac ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac 1080 tccacggagt accgggcgcc gtccaggcac ctcgattagt tctcgagctt ttggagtacg 1140 tcgtctttag gttgggggga ggggttttat gcgatggagt ttccccacac tgagtgggtg 1200 gagactgaag ttaggccagc ttggcacttg atgtaattct ccttggaatt tgcccttttt 1260 gagtttggat cttggttcat tctcaagcct cagacagtgg ttcaaagttt ttttcttcca 1320 tttcaggtgt cgtga 1335 <210> 129 <211> 711 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 129 atgggatccg agagcgacga gagcggcctg cccgccatgg agatcgagtg ccgcatcacc 60 ggcaccctga acggcgtgga gttcgagctg gtgggcggcg gagagggcac ccccgagcag 120 ggccgcatga ccaacaagat gaagagcacc aaaggcgccc tgaccttcag cccctacctg 180 ctgagccacg tgatgggcta cggcttctac cacttcggca cctaccccag cggctacgag 240 aaccccttcc tgcacgccat caacaacggc ggctacacca acacccgcat cgagaagtac 300 gaggacggcg gcgtgctgca cgtgagcttc agctaccgct acgaggccgg ccgcgtgatc 360 ggcgacttca aggtgatggg caccggcttc cccgaggaca gcgtgatctt caccgacaag 420 atcatccgca gcaacgccac cgtggagcac ctgcacccca tgggcgataa cgatctggat 480 ggcagcttca cccgcacctt cagcctgcgc gacggcggct actacagctc cgtggtggac 540 agccacatgc acttcaagag cgccatccac cccagcatcc tgcagaacgg gggccccatg 600 ttcgccttcc gccgcgtgga ggaggatcac agcaacaccg agctgggcat cgtggagtac 660 cagcacgcct tcaagacccc ggatgcagat gccggtgaag aaggatccta g 711 <210> 130 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 130 aataaaagat ccttattttc attggatctg tgtgttggtt ttttgtgtg 49 <210> 131 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 131 aaatttatgt attattttca tatacatttt actcatttcc tttcatctct cacacttcta 60 ttatagagaa agggcaaata gcaatattaa aatatttcct ctaattaatt ccctttcaat 120 gtgcacgaat ttcgtgcacc gggccactag 150 <210> 132 <211> 266 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 132 ccaaggtcgg gcaggaagag ggcctatttc ccatgattcc ttcatatttg catatacgat 60 acaaggctgt tagagagata attagaatta atttgactgt aaacacaaag atattagtac 120 aaaatacgtg acgtagaaag taataatttc ttgggtagtt tgcagtttta aaattatgtt 180 ttaaaatgga ctatcatatg cttaccgtaa cttgaaagta tttcgatttc ttggctttat 240 atatcttgtg gaaaggacga aacacc 266 <210> 133 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 133 ggtatgtcgg gaacctctcc 20 <210> 134 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 134 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60 ggcaccgagt cggtgctttt tttatcggat cccgggcccg tcgactgcag aggcctgcat 120 gcaagcttgg cgtaatcatg gtcat 145 <210> 135 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 135 Val Ile Glu Phe Gln Lys Arg Gly Leu Pro His Ala His Ile Leu 1 5 10 15 <210> 136 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 136 Val Lys Tyr Leu Phe Lys Tyr Ile Tyr Lys Gly His Asp Cys 1 5 10 <210> 137 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 137 Leu Asp Gly Pro Gly Gly Ser Gly Lys Thr Tyr Leu 1 5 10 <210> 138 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 138 Val Leu Pro Thr Ala Ser Thr Gly Ile Ala Ala Asn Leu Leu 1 5 10 <210> 139 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 139 Leu Leu Ile Ile Asp Glu Cys Thr Met Ala Ser Ser His Ala Ile 1 5 10 15 <210> 140 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 140 Gly Lys Val Leu Leu Leu Gly Gly Asp Phe Arg Gln Cys Leu Ser Ile 1 5 10 15 <210> 141 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 141 Leu Lys Thr Asn Met Arg 1 5 <210> 142 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 142 Gly Ala Ile Ile Met Leu Leu Arg Asn Leu Asn Ser Lys Trp Gly Leu 1 5 10 15 Cys Asn Gly <210> 143 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 143 Phe Ala Met Thr Ile Asn Lys Ser Gln Gly Gln Thr Leu Asp Arg Val 1 5 10 15 Gly Ile <210> 144 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic peptide" <400> 144 Tyr Val Ala Phe Ser Arg Val Arg Arg Ala Cys Asp Val Lys Val 1 5 10 15 <210> 145 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 145 caccatatga tcctatataa 20 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 146 gggccactag tatatatata 20 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 147 cctgtgcata tcctatataa 20 <210> 148 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 148 gggccactag taatatataa 20 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 149 tgttctggca tcctatataa 20 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 150 gggccactag tgaatataat 20 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 151 tactctatca tcctatataa 20 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 152 gggccactag tcaaatatat 20 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 153 taagcaataa tcctatataa 20 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 154 gggccactag taattaataa 20 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 155 cctatgtcta tcctatataa 20 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 156 gggccactag taaaaaataa 20 <210> 157 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 157 caccatatga tcctatataa taaaagagaa acatgcaaat tgaccatccc 50 <210> 158 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 158 gtgcacgaat ttcgtgcac 19 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 159 acctgtggta caccgcaggt 20 <210> 160 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 160 acctgcggaa tttccgcagg t 21 <210> 161 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 161 gtgcacgccg gacgtgcac 19 <210> 162 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 162 ccctttcaat gtgcacgaat ttcgtgcacc gggccactag 40 <210> 163 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 163 ccctttcaat cgggccacta g 21 <210> 164 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 164 ccctttcaat acctgtggtg taccgcaggt cgggccacta g 41 <210> 165 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 165 ccctttcaat acctgcggaa tttccgcagg tcgggccact ag 42 <210> 166 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 166 ccctttcaat gtgcacgccg ggcgtgcacc gggccactag 40 <210> 167 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 167 atcctatata a 11 <210> 168 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 168 gggccactag t 11 <210> 169 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 169 gggccactag tcctatataa 20 <210> 170 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 170 ttcgtgcacc gggccactag 20 <210> 171 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 171 tcaaatatat tagaaggtgg taagtgctat ggaaaa 36 <210> 172 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 172 attgaccatc cctccgctac 20 <210> 173 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 173 tagactcatt ctacaaacaa tgaaaccaag agtgttagac attaaggtca t 51 <210> 174 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 174 tcttcgccca ccccaacttg 20 <210> 175 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> misc_feature <222> (9) <223> a, c, t, g, unknown or other <400> 175 tgtaaaatna aaataaataa catattgtaa acttgaaat 39 <210> 176 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 176 tcttcgccca ccccaacttg 20 <210> 177 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 177 ttaaatatat tattcaatgt agccttgatt gttggaaa 38 <210> 178 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 178 tcttcgccca ccccaacttg 20 <210> 179 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 179 tatgactata ataagagaaa ggcagcctgg gaagag 36 <210> 180 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 180 ataagggcga cacggaaatg 20 <210> 181 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 181 ctaagaatat cattgtataa tctctttgtt tatatgt 37 <210> 182 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 182 caccatatga tcctatataa taaaagagaa acatgcaaat tgaccatccc 50 <210> 183 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 183 gggatggtca atttggtact ttgtgtttta ttatatagga tcatatggtg 50 <210> 184 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 184 ccctttcaat gtgcacgaat ttcgtgcacc gggccactag tatatatata 50 <210> 185 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 185 tatatatata ctagtggccc ggtgcacgaa attcgtgcac attgaaaggg 50 <210> 186 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 186 taatattgta taccaactat ctacactaaa ggcctctagt acttaaataa aaaaaataa 59 <210> 187 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 187 ataatattgt ataccaacta tacttaaata aaaaaaataa 40 <210> 188 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 188 tctacactaa aggcctctag 20 <210> 189 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 189 catattctca tacatacaca tctacactaa aggcctctag tctatatata aaagccaagc 60 60 <210> 190 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 190 catattctta tacacacaca tctatatata aaagccaagc 40 <210> 191 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 191 tctacactaa aggcctctag 20 <210> 192 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 192 tccagcatat atatatatat ctacactaac ccatctatat atttggtaat aaaggtta 58 <210> 193 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 193 tccagcatat actatatata tatttggtaa tgaacggtta 40 <210> 194 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 194 tctacactaa cccatctata 20 <210> 195 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 195 cccccgagtg cacaaatttt tgtgcaccgg gcctctag 38 <210> 196 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 196 agggcacagg ccgggctgag ggacccccga ccctctag 38 <210> 197 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 197 tcaaattgag tttcaactag cagaataatt atttaaga 38 <210> 198 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 198 gcactagtct aatgctaaca tcctcctatc taattattta agaaaaaata aacaatgacg 60 agg 63 <210> 199 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 199 gtagggaaac ttaatactta tcctatctaa ttatttaaga tgctcaatgc aggagctgcc 60 60 <210> 200 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 200 tcctcctatc taattattta aga 23 <210> 201 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 201 tcctatctaa ttatttaaga 20 <210> 202 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 202 ccctttcaat gtgcacgaat ttcgtgcacc gggccactag tatatatata aagcttggta 60 tgtcgggaac ctcgggacag gattggtgac a 91 <210> 203 <211> 91 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 203 ccctttcaat gtgcacgaat ttcgtgcacc gggccactag tatatatata aagcttggta 60 tgtcgggaac ctcgggacag gattggtgac a 91 <210> 204 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 204 tcctatataa taaaagagaa acatgcaaat tgaccatccc tccgctacgc tcaagccacg 60 cccaccagcc aatcagaagt gactatgcaa attaacccaa caaagatggc agttaaattt 120 gcatacgcag gtgtcaagcg ccccaggagg aaatttatgt attattttca tatacatttt 180 actcatttcc tttcatctct cacacttcta ttatagagaa agggcaaata gcaatattaa 240 aatatttcct ctaattaatt ccctttcaat gtgcacgaat ttcgtgcacc gggccactag 300 300 <210> 205 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 205 tcctatataa taaaagagaa acatgcaaat tagccgtccc tctgctacgc tcaagccacg 60 cccacaagcc acgcccacca gccaatcaga gtgactatgc aaattaacct gacaaagatg 120 gcggttaatt tgcatacgca ggtgtcaagc aaagtaatag ctaaaattca tgtcattgaa 180 tttcagaaac gcggactgcc tcacgctcac atattattga tattagatag tgagtccaaa 240 ttacgttcct ctaattaatt ccctttcaat gtgcacgaat ttcgtgcacc aggctactag 300 300 <210> 206 <211> 300 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 206 tctacttata taaaaaccct gggtgtaaca tcacgtccag aagcgcgacc aaccggaagg 60 aagtcagtcc tgcaggggtc gtcttggaaa cggctgcgcc ctcccccagc tgtttccccg 120 gagggcgagg tttcaggcag gaacccgccc aaatttatat attattttca tatacatttt 180 actaatttcc tttcatctct cacacttcta ttatagagaa agggcaaata gcaatattaa 240 aatatctccg ctaattaatt cccttttaat gtgcacgaat ttcgtgcacc gggctactag 300 300 <210> 207 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 207 tctatatata taaaaggcta agtgtccatc caaccggtag ctatgatgca cactgaccac 60 cagggggcag atgctcaatg caggagctgc catgatgtgc actggccatt taaaaataaa 120 cgtgggctgg aaaaagttta gctaaatcag aaagcaggtc taattaagca agtttattct 180 atatctataa aaggctaagt tgactcgtgc atgcgcgata catataaagc tctcgctggc 240 gccaatcgca cacgtgtgtt tcgatctgtc attgtcgatc atgaatttgg ttgacacttc 300 tattatagag aaagggcaaa tagcgatatt aaaatatttc ttctaattaa ttcctttcaa 360 tgtgcacgaa tctgtgcacc gggccactag 390

Claims (59)

  1. 하기를 제공하는 단계를 포함하는 단일 또는 복수 카피(copy)의 관심 유전자를 세포에 도입하는 방법:
    a) 헬리트론 전이효소(Helitron transposase); 및
    b) 헬리트론 전이효소 LTS 서열을 포함하는 컨스트럭트(construct).
  2. 제1항에 있어서, b)에서의 상기 컨스트럭트는 헬리트론 전이효소 LTS 서열에 의해 플랭크된(flanked) 관심 유전자를 더 포함하는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 세포는 원핵 또는 진핵 세포인, 방법.
  4. 하기를 제공하는 단계를 포함하는 단일 또는 복수 카피의 관심 유전자를 진핵 세포에 도입하는 방법:
    a) "복사 및 붙여넣기" 전이효소; 및
    b) "복사 및 붙여넣기" 트랜스포존 LTS 서열에 의해 플랭크된 관심 유전자를 포함하는 컨스트럭트.
  5. 제4항에 있어서, 상기 진핵 세포는 식물 세포, 효모 세포 또는 포유류 세포인, 방법.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 세포는 인간, 랫트 또는 마우스 세포인, 방법.
  7. 제4항 내지 제6항 중 어느 한 항에 있어서, 상기 "복사 및 붙여넣기" 전이효소는 헬리트론 전이효소이고 상기 LTS는 헬리트론 트랜스포존으로부터 유래된 것인, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 LTS 서열은 서열번호 3으로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는, 방법.
  9. 제2항 내지 제8항 중 어느 한 항에 있어서, 상기 관심 유전자는 또한 RTS 서열에 의해 플랭크된 것인, 방법.
  10. 제9항에 있어서, 상기 RTS 서열은 서열번호 4로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 상기 전이효소는 서열번호 1로 기재되는 아미노산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는 헬레이저(Helraiser) 전이효소인, 방법.
  12. 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 전이효소 및 상기 관심 유전자를 포함하는 컨스트럭트는 2개의 별개의 독립체로 제공되는, 방법.
  13. 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 전이효소, 관심 유전자 및 LTS는 단일 컨스트럭트로 제공되는, 방법.
  14. 제2항 내지 제13항 중 어느 한 항에 있어서, 상기 관심 유전자는 내인성 유전자이고 그 내인성 유전자 또는 cDNA 서열의 복수 카피가 도입된, 방법.
  15. 제2항 내지 제13항 중 어느 한 항에 있어서, 상기 관심 유전자는 비-내인성 유전자 또는 cDNA 서열인, 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 방법은 세포주를 생성하는 데에 사용되는, 방법.
  17. 제16항에 있어서, 상기 세포주는 복수 카피의 관심 유전자를 포함하는, 방법.
  18. 제17항에 있어서, 하기 단계를 포함하는 방법:
    a) 적어도 하나의 헬레이저 말단 서열에 의해 플랭크된 관심 유전자를 암호화하는 핵산 서열을 포함하는 제1 컨스트럭트를 제공하는 단계;
    b) 상기 제1 컨스트럭트를 세포에 도입하는 단계;
    c) 헬레이저 전이효소를 암호화하는 핵산 서열을 포함하는 제2 컨스트럭트를 제공하는 단계;
    d) 상기 제2 컨스트럭트를 단계 b)에서 수득된 상기 세포에 도입하는 단계;
    e) 단계 d)에서 수득된 상기 세포를 전이효소 활성을 위한 조건 하에서 배양하는 단계; 및
    f) 상기 관심 유전자의 다중 복제물을 검출하는 단계.
  19. 제18항에 있어서, 상기 제1 컨스트럭트는 헬레이저 LTS 및 RTS 서열을 포함하는, 방법.
  20. 제18항 또는 제19항에 있어서, 상기 제1 컨스트럭트는 바람직하게는 CRISPR/Cas9, TALENs, 징크 핑거 뉴클레아제(Zinc finger nucleases) 또는 메가뉴클레아제(Meganucleases)와 같은 프로그램 가능한 뉴클레아제 기술을 이용하는 게놈 조작(genome engineering)을 통해 생성되는, 방법.
  21. 제18항 내지 제20항 중 어느 한 항에 있어서, 알려진 카피수(copy number)를 갖는 클론을 선별하는 단계를 더 포함하는, 방법.
  22. 제2항 내지 제21항 중 어느 한 항에 있어서, 상기 관심 유전자가 치료용 단백질을 암호화하는, 방법.
  23. 제1항 내지 제22항 중 어느 한 항의 방법에 의해 제조된 세포주.
  24. 제23항에 있어서, 참고 표준(reference standard)으로서 사용하기 위한 세포주.
  25. 제23항에 있어서, 관심 단백질의 생산에 사용하기 위한 세포주.
  26. 제23항에 있어서, 치료에 사용하기 위한 세포주.
  27. 제23항 내지 제26항 중 어느 한 항에 있어서, 상기 세포주는 CHO 세포주인, 세포주.
  28. 서열번호 1로 기재되는 서열과 적어도 80%의 상동성을 갖는 아미노산 서열을 포함하고 상기 서열은 헬레이저 전이효소를 암호화하는, 단리된 아미노산 서열.
  29. 제28항에 있어서, 서열번호 1로 기재되는 아미노산 서열을 갖는, 단리된 아미노산 서열.
  30. 제28항 또는 제29항의 아미노산 서열을 암호화하는 핵산 서열을 포함하는 단리된 핵산 서열.
  31. 제30항에 있어서, 상기 서열은 서열번호 2 또는 서열번호 6을 포함하는, 단리된 핵산 서열.
  32. 제31항에 있어서, 상기 서열은 서열번호 2 또는 서열번호 6으로 기재되는 핵산 서열인, 단리된 핵산 서열.
  33. 서열번호 3으로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는, 단리된 핵산 서열.
  34. 서열번호 4로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는, 단리된 핵산 서열.
  35. 서열번호 3으로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열 및 서열번호 4로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는, 단리된 핵산 서열.
  36. 서열번호 5로 기재되는 핵산 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는, 단리된 핵산 서열.
  37. 서열번호 3으로 기재되는 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는 LTS 헬레이저 말단 서열에 의해 적어도 플랭크된 관심 유전자의 핵산 서열을 포함하는, 단리된 핵산 서열.
  38. 제37항에 있어서, 서열번호 4로 기재되는 서열 또는 그의 서열과 적어도 80%의 상동성을 갖는 서열을 포함하는 RTS 헬레이저 말단 서열을 더 포함하는, 단리된 핵산 서열.
  39. 제30항 내지 제38항 중 어느 한 항의 핵산 서열을 포함하는 발현 벡터.
  40. 제37항 또는 제38항에 있어서, 적어도 하기를 더 포함하는 핵산 서열을 포함하는 발현 벡터:
    a) 일반적인(generic) gRNA 인식 부위, 바람직하게는 LTS 및 RTS를 플랭킹(flanking)하는 Tia1L;
    b) 상기 관심 유전자가 상기 프로모터의 제어 하에 있도록 배열된 프로모터 서열;
    c) 상기 관심 유전자에 후속하는 폴리아데닐화 카세트(polyadenylation cassette).
  41. 제30항 내지 제38항 중 어느 한 항의 핵산 서열 또는 제39항 또는 제40항의 발현 벡터를 포함하는 재조합 숙주 세포.
  42. 제41항에 있어서, 상기 숙주 세포는 CHO 세포인, 재조합 숙주 세포.
  43. 제25항, 제41항 또는 제42항의 세포를 적합한 배지에서 배양하는 단계 및 상기 세포 또는 적합한 배지로부터 관심 단백질을 수확하는 단계를 포함하는 관심 단백질의 생산 방법.
  44. 하기의 단계를 포함하는 치료를 필요로 하는 대상(subject)에 목적 유전자를 제공함으로써 질환을 치료하는 방법:
    a) 상기 대상에 사용하기에 적합한 세포주를 분리하는 단계;
    b) 제33항, 제37항 또는 제38항의 단리된 핵산, 또는 제39항 또는 제40항의 발현 벡터를 상기 세포주에 도입하는 단계로서, 상기 핵산 또는 발현 벡터가 상기 관심 단백질에 상응하는 관심 유전자를 포함함;
    c) 헬레이저 전이 이벤트(Helraiser transposition event)가 발생하여 상기 관심 유전자를 포함하는 조작된 세포주를 생성하도록, 제28항 또는 제29항의 아미노산 서열, 제30항, 제31항 또는 제33항의 핵산 서열 또는 제39항 또는 제40항의 발현 벡터를 도입하는 단계;
    d) 상기 조작된 세포주를 세포 배양물에서 조작된 세포의 집단을 제공하기 위해 증식시키는 단계; 및
    e) 상기 조작된 세포를 상기 대상에 도입하는 단계.
  45. 제44항에 있어서, 상기 세포주는 T 세포, 대식세포(macrophage cell), B 세포, 수지상세포(dendritic cell), NK 세포, 조혈줄기세포(haematopoietic stem cell), 골수계-적혈구계 전구(myeloid-erythroid progenitor, CMEP)세포 또는 공통 림프계 전구(common lymphoid progenitor, CLP)세포인, 방법.
  46. 하기의 단계를 포함하는 치료를 필요로 하는 대상의 질환을 치료하는 방법:
    a) 제33항, 제37항 또는 제38항의 단리된 핵산을 포함하는 제1 발현 벡터를 제공하는 단계;
    b) 제30항, 제31항 또는 제33항의 핵산 서열을 포함하는 제2 발현 벡터를 제공하는 단계;
    c) 상기 제1 및 제2 발현 벡터를 상기 대상에 도입하는 단계.
  47. 제33항, 제37항 또는 제38항의 단리된 핵산 서열을 포함하는 제1 발현 벡터 및 제30항, 제31항 또는 제33항의 핵산 서열을 포함하는 제2 발현 벡터를 포함하는 약학적 조성물.
  48. 리포터(reporter)의 다양한 게놈으로의 삽입(integration)을 포함하는 세포주 라이브러리를 생성하기 위한, LTS 및/또는 RTS에 의해 플랭크된 리포터 유전자를 암호화하는 공여자(donor)와 헬리트론 전이효소의 용도.
  49. 제33항 또는 제34항의 LTS 및/또는 RTS 서열의 존재에 대해 상기 세포주를 분석하는 단계를 포함하는, 헬리트론 전이 방법으로부터 유래된 세포주를 선별하는 방법
  50. 하기의 단계를 포함하는 세포주를 생성하는 방법:
    a) 헬리트론 LTS 서열을 포함하는 컨스트럭트를 제공하는 단계; 및
    b) 상기 컨스트럭트를 세포주에 도입하는 단계.
  51. 제50항에 있어서, 단계 a)의 상기 컨스트럭트는 헬리트론 RTS 서열을 더 포함하는, 방법.
  52. 제50항 또는 제51항에 있어서, 상기 LTS 및/또는 RTS는 관심 DNA 서열로 표적화되는 것인, 방법.
  53. 제50항 내지 제52항 중 어느 한 항의 방법에 의해 제조된 세포주.
  54. 하기의 단계를 포함하는 복수 카피의 관심 DNA 서열을 포함하는 세포주를 생산하는 방법:
    a) 제53항의 세포주를 수득하는 단계;
    b) 헬리트론 전이효소를 전이효소 활성을 위한 조건 하에서 도입하는 단계;
    c) 상기 복수 카피의 관심 DNA 서열을 갖는 클론성 세포주(clonal cell line)를 분리하는 단계.
  55. 제54항의 방법에 의해 제조된 단리된 클론성 세포주.
  56. 참고 표준으로서 사용하기 위한 제55항의 단리된 클론성 세포주.
  57. 제53항, 제55항 또는 제56항 중 어느 한 항에 있어서, 상기 세포주는 CHO 세포주 또는 HAP1 또는 eHAP 세포주인, 단리된 클론성 세포주.
  58. 단일 또는 복수 카피의 DNA 서열을 갖는 세포를 생성하기 위한 진핵 세포에서의 복사 및 붙여넣기 트랜스포존의 용도.
  59. 단일 또는 복수 카피의 DNA 서열을 갖는 세포를 생성하기 위한 원핵 또는 진핵 세포에서의 헬리트론 트랜스포존의 용도.
KR1020187026171A 2016-02-11 2017-02-10 복제 트랜스포존 시스템 Withdrawn KR20180127339A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB1602473.9A GB201602473D0 (en) 2016-02-11 2016-02-11 Replicative transposon system
GB1602473.9 2016-02-11
PCT/GB2017/050355 WO2017137768A1 (en) 2016-02-11 2017-02-10 Replicative transposon system

Publications (1)

Publication Number Publication Date
KR20180127339A true KR20180127339A (ko) 2018-11-28

Family

ID=55697562

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187026171A Withdrawn KR20180127339A (ko) 2016-02-11 2017-02-10 복제 트랜스포존 시스템

Country Status (11)

Country Link
US (1) US11396664B2 (ko)
EP (1) EP3414333B1 (ko)
JP (1) JP2019504646A (ko)
KR (1) KR20180127339A (ko)
CN (1) CN109072258A (ko)
AU (1) AU2017218651A1 (ko)
BR (1) BR112018016443A2 (ko)
CA (1) CA3011886A1 (ko)
GB (2) GB201602473D0 (ko)
SG (1) SG11201806400XA (ko)
WO (1) WO2017137768A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108728477B (zh) * 2017-04-24 2022-02-22 华东理工大学 一种高效的转座突变系统及构建方法
US11168322B2 (en) 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof
US12054754B2 (en) * 2017-11-02 2024-08-06 Arbor Biotechnologies, Inc. CRISPR-associated transposon systems and components
AU2019327449A1 (en) 2018-08-28 2021-03-11 Flagship Pioneering Innovations Vi, Llc Methods and compositions for modulating a genome
CN112823392B (zh) * 2018-10-12 2024-09-03 生命科技股份有限公司 用于评估微卫星不稳定性状态的方法和系统
EP3935179A4 (en) * 2019-03-07 2022-11-23 The Trustees of Columbia University in the City of New York Rna-guided dna integration using tn7-like transposons
WO2020207560A1 (en) * 2019-04-09 2020-10-15 European Molecular Biology Laboratory Improved transposon insertion sites and uses thereof
CN110257425B (zh) * 2019-05-05 2022-07-15 扬州大学 一种ps转座子系统及其介导的基因转移方法
CN111909986B (zh) * 2019-05-10 2024-03-26 潘雨堃 一种基因治疗安全评估与毒副作用预防的方法
US12254959B2 (en) 2019-07-03 2025-03-18 Integrated Dna Technologies, Inc. Identification, characterization, and quantitation of CRISPR-introduced double-stranded DNA break repairs
US20220372521A1 (en) * 2019-08-14 2022-11-24 The Trustees Of Columbia University In The City Of New York Rna-guided dna integration and modification
KR20220097875A (ko) 2019-09-03 2022-07-08 마이얼로이드 테라퓨틱스, 인크. 게놈 통합을 위한 방법 및 조성물
EP4225928A4 (en) * 2020-10-09 2025-04-30 The Broad Institute, Inc. HELITRON-MEDIATED GENETIC MODIFICATION
JP2024518100A (ja) 2021-05-11 2024-04-24 マイエロイド・セラピューティクス,インコーポレーテッド ゲノム組込みのための方法および組成物
EP4508202A1 (en) * 2023-03-27 2025-02-19 Beijing Astragenomics Technology Co., Ltd. Isolated transposase and use thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0973928B1 (en) 1997-03-11 2010-05-05 Regents Of The University Of Minnesota Dna-based transposon system for the introduction of nucleic acid into dna of a cell
CN103923932A (zh) * 2014-05-07 2014-07-16 重庆大学 具有增强子作用的家蚕BmHel-10转座子
CN104789594A (zh) * 2015-04-27 2015-07-22 江南大学 稳定高效表达人血清白蛋白和白介素ⅱ融合蛋白的cho细胞株的构建方法

Also Published As

Publication number Publication date
CN109072258A (zh) 2018-12-21
US20190323037A1 (en) 2019-10-24
JP2019504646A (ja) 2019-02-21
BR112018016443A2 (pt) 2019-10-01
CA3011886A1 (en) 2017-08-17
EP3414333B1 (en) 2021-12-08
GB2564296A (en) 2019-01-09
EP3414333A1 (en) 2018-12-19
US11396664B2 (en) 2022-07-26
SG11201806400XA (en) 2018-08-30
AU2017218651A1 (en) 2018-08-09
GB201602473D0 (en) 2016-03-30
GB201814775D0 (en) 2018-10-24
WO2017137768A1 (en) 2017-08-17

Similar Documents

Publication Publication Date Title
EP3414333B1 (en) Replicative transposon system
JP7083364B2 (ja) 配列操作のための最適化されたCRISPR-Cas二重ニッカーゼ系、方法および組成物
US11560555B2 (en) Engineered proteins
US20250066751A1 (en) Cas9-Cas9 Fusion Proteins
CN111373041B (zh) 用于基因组编辑和调节转录的crispr/cas系统和方法
JP6625971B2 (ja) 配列操作のためのタンデムガイド系、方法および組成物の送達、エンジニアリングおよび最適化
JP6700788B2 (ja) Rna誘導性ヒトゲノム改変
CA3026110A1 (en) Novel crispr enzymes and systems
CA3064601A1 (en) Crispr/cas-adenine deaminase based compositions, systems, and methods for targeted nucleic acid editing
CA2989834A1 (en) Crispr enzymes and systems
WO2005014791A2 (en) Methods and compositions for targeted cleavage and recombination
EP1913149A2 (en) Targeted integration and expression of exogenous nucleic acid sequences
WO2018172798A1 (en) Argonaute system
WO2017122096A1 (en) Gene modification assays
AU2012245168B2 (en) Targeted Integration and Expression of Exogenous Nucleic Acid Sequences
CN116940673A (zh) 可编程转座酶及其用途
EA048319B1 (ru) СКОНСТРУИРОВАННЫЕ СИСТЕМЫ CasX
Checketts Nuclease-Mediated Targeted Gene Insertion at the Adenosine Deaminase Locus in Primary Cells

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20180910

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application
PC1203 Withdrawal of no request for examination