KR20150126026A - 효소 정지 방법 - Google Patents

효소 정지 방법 Download PDF

Info

Publication number
KR20150126026A
KR20150126026A KR1020157027690A KR20157027690A KR20150126026A KR 20150126026 A KR20150126026 A KR 20150126026A KR 1020157027690 A KR1020157027690 A KR 1020157027690A KR 20157027690 A KR20157027690 A KR 20157027690A KR 20150126026 A KR20150126026 A KR 20150126026A
Authority
KR
South Korea
Prior art keywords
polynucleotide
helicase
spacer
helicases
seq
Prior art date
Application number
KR1020157027690A
Other languages
English (en)
Other versions
KR102168813B1 (ko
Inventor
앤드류 존 헤론
데이비드 안토니 알베스
제임스 클라크
마리온 루이스 크로포드
다니엘 라이언 제럴드
그라함 할
다니엘 존 터너
제임스 화이트
Original Assignee
옥스포드 나노포어 테크놀로지즈 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1314695.6A external-priority patent/GB201314695D0/en
Priority claimed from GB201318464A external-priority patent/GB201318464D0/en
Priority claimed from GBGB1318465.0A external-priority patent/GB201318465D0/en
Application filed by 옥스포드 나노포어 테크놀로지즈 리미티드 filed Critical 옥스포드 나노포어 테크놀로지즈 리미티드
Publication of KR20150126026A publication Critical patent/KR20150126026A/ko
Application granted granted Critical
Publication of KR102168813B1 publication Critical patent/KR102168813B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N13/00Treatment of microorganisms or enzymes with electrical or wave energy, e.g. magnetism, sonic waves
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • G01N27/44704Details; Accessories
    • G01N27/44717Arrangements for investigating the separated zones, e.g. localising zones
    • G01N27/4473Arrangements for investigating the separated zones, e.g. localising zones by electric means
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/416Systems
    • G01N27/447Systems using electrophoresis
    • G01N27/44756Apparatus specially adapted therefor
    • G01N27/44791Microapparatus
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/513Winding/unwinding enzyme, e.g. helicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/164Methylation detection other then bisulfite or methylation sensitive restriction endonucleases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/631Detection means characterised by use of a special device being a biochannel or pore
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y306/00Hydrolases acting on acid anhydrides (3.6)
    • C12Y306/04Hydrolases acting on acid anhydrides (3.6) acting on acid anhydrides; involved in cellular and subcellular movement (3.6.4)
    • C12Y306/04012DNA helicase (3.6.4.12)

Abstract

본 발명은 폴리뉴클레오티드 상에서 헬리카제가 스페이서를 지나도록 이동시키고, 헬리카제의 폴리뉴클레오티드 상에의 로딩을 제어하는 신규한 방법에 관한 것이다. 본 발명은 또한 헬리카제를 사용하여 표적 폴리뉴클레오티드의 특징을 규명하는 신규한 방법에 관한 것이다.

Description

효소 정지 방법 {ENZYME STALLING METHOD}
본 방법은 폴리뉴클레오티드 상에서 헬리카제가 스페이서를 지나도록 이동시키고, 헬리카제의 폴리뉴클레오티드 상에의 로딩을 제어하는 신규한 방법에 관한 것이다. 본 발명은 또한 헬리카제를 사용하여 표적 폴리뉴클레오티드의 특징을 규명하는 신규한 방법에 관한 것이다.
현재 다양한 적용에 걸쳐 신속하고, 저렴한 폴리뉴클레오티드 (예컨대, DNA 또는 RNA) 서열분석 및 확인 기술이 요구되고 있다. 현재 기술은 주로 다량의 폴리뉴클레오티드를 제조하고, 신호 검출을 위해 전문가용 형광성 화학 물질을 다량으로 필요로 하기 때문에, 속도가 느리고, 고가이다.
막횡단 포어 (나노포어)는 중합체 및 다양한 소형 분자에 대한 직접적인 전기 바이오센서로서의 큰 잠재능을 가지고 있다. 특히, 최근에는 나노포어가 잠재적인 DNA 서열분석 기술로서 주목을 받아오고 있다.
전위가 나노포어를 통해 인가되면, 분석물, 예컨대, 뉴클레오티드가 일정 기간 동안 장벽에 일시적으로 존재할 때 전류는 변화하게 된다. 뉴클레오티드의 나노포어 검출이 공지된 시그니처 및 지속 기간의 전류 변화를 일으킨다. "가닥 서열분석" 방법에서, 단일 폴리뉴클레오티드 가닥은 포어를 통해 통과되고, 뉴클레오티드의 동일성가 유도된다. 가닥 서열분석은 포어를 통과하는 폴리뉴클레오티드의 이동을 제어하기 위해 뉴클레오티드 취급 단백질, 예컨대, 헬리카제를 사용하는 것을 포함할 수 있다.
폴리뉴클레오티드 중 스페이서는 전형적으로 헬리카제를 정지시킬 수 있고, 즉, 헬리카제가 스페이서를 지나 폴리뉴클레오티드를 따라 추가로 이동하지 못하도록 막을 수 있다. 본 발명자들은 놀랍게도 헬리카제 및 폴리뉴클레오티드를 막횡단 포어와 접촉시키고, 전위를 인가함으로써 폴리뉴클레오티드에서 하나 이상의 정지된 헬리카제가 스페이서를 지나도록 이동시킬 수 있다는 것을 입증하였다. 헬리카제는 전형적으로는 포어를 통과하기에는 너무 크기 때문에, 전위를 따라 포어를 통과하여 이동하는 폴리뉴클레오티드의 힘은 헬리카제가 스페이서를 지나도록 이동시킨다. 이는 폴리뉴클레오티드의 이동을 제어하고, 폴리뉴클레오티드의 특징을 규명하는 데, 예컨대, 서열분석하는 데 중요하게 적용된다. 본 발명자들은 또한 놀랍게도 하나 이상의 스페이서를 사용하여 하나 이상의 헬리카제의 폴리뉴클레오티드 상에의 로딩을 제어할 수 있는 것 또한 입증하였다.
그러므로, 본 발명은 (a) 하나 이상의 정지된 헬리카제 및 표적 폴리뉴클레오티드를 막횡단 포어와 접촉시키는 단계, 및 (b) 전위를 포어를 통해 인가하여 표적 폴리뉴클레오티드 상에서 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 단계를 포함하는, 표적 폴리뉴클레오티드에서 하나 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 방법을 제공한다.
본 발명은 또한
- (a) 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계; (b) 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 하나 이상의 스페이서에서 정지하도록 하는 단계; (c) 표적 폴리뉴클레오티드 및 하나 이상의 정지된 헬리카제를 포어와 접촉시키는 단계; 및 (d) 포어를 통해 전위를 인가하여 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나 이동하도록 하고, 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하도록 하는 단계를 포함하는, 막횡단 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 방법;
- (a) 본 발명의 막횡단 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 방법을 수행하는 단계; 및 (b) 폴리뉴클레오티드가 포어와 관련하여 이동함에 따라 하나 이상의 측정치를 측정하여 표적 폴리뉴클레오티드의 특징을 규명하고, 여기서 측정치는 폴리뉴클레오티드의 하나 이상의 특징을 나타내는 것인 단계를 포함하는, 표적 폴리뉴클레오티드의 특징을 규명하는 방법;
- (a) 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계; 및 (b) (a)에서 제공받은 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 폴리뉴클레오티드에 결합하고, 각 스페이서에서 정지하도록 하는 단계를 포함하는, 하나 이상의 헬리카제의 표적 폴리뉴클레오티드 상에의 로딩을 제어하는 방법;
- 표적 폴리뉴클레오티드의 이동을 제어하기 위한 어댑터로서, 여기서, 어댑터는 5'→3' 방향으로 (a) (L-S-D)n 또는 (D-S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, D는 이중 가닥 폴리뉴클레오티드이고, 여기서, n은 정수임), 및 (b) 각 어댑터 상에서 정지된 하나 이상의 헬리카제를 포함하는 것인, 어댑터; 및
- 표적 폴리뉴클레오티드의 이동을 제어하기 위한 키트로서, 여기서, 키트는 (a) 하나 이상의 스페이서, (b) 하나 이상의 헬리카제 및 (c) 막횡단 포어를 포함하는 것인 키트를 제공한다.
도 1은 실시예 1에서 사용된 람다 DNA 구축물의 다이어그램을 보여주는 것이다. 서열 9 (A로 표지)는 그의 3' 말단에서 4개의 iSpC3 스페이서 (B로 표지)에 부착되어 있다. 4개의 iSpC3 스페이서는 서열 10 (C로 표지)의 5' 말단에 부착되어 있다. 서열 10은, 서열 11 (E로 표지) 그의 5' 말단에 부착되어 있는 4개의 iSpC3 스페이서 (D로 표지)에 부착되어 있다. 서열 10은 서열 12 (F로 표지, 3' 콜레스테롤 테더를 가진다)에 혼성화된다.
도 2는 헬리카제 (T4 Dda - E94C/A360C (돌연변이 E94C/A360C, 및 이어서, (ΔM1)G1G2를 포함하는 서열 8))가 나노포어 (MS(B1- G75S/G77S/L88N/Q126R)8 MspA (MspA - B2C) (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 (기술된 바와 같이 0.2 nM이고, 도 1에 도시된 것과 같은) 람다 DNA 구축물의 전위를 제어할 때의, 예시적인 전류 트레이스 (y축 표지 = 전류 ((pA), 20 내지 120), x축 표지 = 시간 ((s), 3,500 내지 8,000))를 보여주는 것이다.
도 3은 도 2의 전류 트레이스에 제시된 헬리카제 제어형 DNA 이동에 대한 확대된 영역을 보여주는 것이다 (상단 및 하단 트레이스, 둘 모두에 대하여 y축 표지 = 전류 ((pA), 상단 트레이스 20 내지 80, 하단 트레이스 20 내지 60), x축 표지 = 시간 ((s), 상단 트레이스 2,995 내지 3,020, 하단 트레이스 8,140 내지 8,170)). a)는 헬리카제 제어형 DNA 이동 시작점을 보여주는 것이고, b)는 헬리카제 제어형 DNA 이동 종점을 보여주는 것이다. 화살표로 표지된 1은 (나노포어에 의해 포획되기 이전에 효소의 이동을 정지시키는 데 사용되는) 첫번째 4개의 iSpC3 스페이서가 나노포어를 통해 이동할 때의 것에 상응한다. 화살표로 표지된 2는 나노포어를 통해 이동하는 두번째 4개의 iSpC3 스페이서 기의 것에 상응한다.
도 4(a)는 실시예 2에서 사용되는 헤어핀 및 Y형 MuA 기질 디자인을 보여주는 것이다. 서열 19의 dUMP는 삼각형으로 강조 표시되어 있고, iSpC3 스페이서는 x로 제시되어 있다. 도 4(b)는 실시예 2에서 설명되는 샘플 제조 방법 동안 제조된 람다 DNA 구축물을 보여주는 것이다. 람다 DNA의 5-10 kB 단편은 X로 표지되어 있고, 폴리머라제에 의해 충전되고, 리가제에 의해서 구축물 나머지 부분에 연결되는 DNA 단편은 y로 표지되어 있고 (점선으로 제시되어 있고), iSpC3 스페이서는 x로 제시되어 있다. 테더 서열 (서열 16)은 제시된 DNA 구축물에 혼성화된다. 2개의 티민 잔기 및 3' 콜레스테롤 TEG (회색 동그라미로 제시)에 부착된 6개의 iSp18 스페이서는 서열 16의 3' 말단에 부착되어 있다.
도 5는 헬리카제 (Trwc Cba (서열 9))가 나노포어 (MS(B1-G75S/G77S/L88N/Q126R)8 MspA (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 (도 4b에 제시된) 람다 DNA 구축물의 전위를 제어할 때의, 예시적인 전류 트레이스 (상단 및 하단 트레이스, 둘 모두에 대하여 y축 표지 = 전류 (pA), x축 표지 = 시간 (s))를 보여주는 것이다. 상단 트레이스는 나노포어를 통한 전체 람다 DNA 구축물의 헬리카제 제어형 DNA 이동을 보여주는 것이고, X1로 표지된 첫번째 iSpC3 스페이서는 1로 표지된 전류 스파이크를 생성하고, X2로 표지된 두번째 iSpC3 스페이서는 2로 표지된 전류 스파이크를 생성한다. 하단 트레이스는 나노포어를 통한 헬리카제 제어형 DNA 이동 종점에 대한 확대된 영역을 보여주는 것이고, X3으로 표지된 세번째 iSpC3 스페이서는 3으로 표지된 전류 스파이크를 생성한다.
도 6(a)는 실시예 3에서 사용되는 헤어핀 및 Y형 MuA 기질 디자인을 보여주는 것이다. 5' 포스페이트는 동그라미로 표지화되어 있고, 서열 18 중의 이노신은 직사각형으로 강조 표시되어 있고, iSpC3 스페이서는 x로 제시되어 있다. 도 6(b)는 실시예 3에서 설명되는 샘플 제조 방법 동안 제조된 람다 DNA 구축물을 보여주는 것이다. 람다 DNA의 5-10 kB 단편은 X로 표지화되어 있고, x에 부착되지 않은 이노신은 직사각형으로 표지화되어 있고, iSpC3 스페이서는 x로 제시되어 있다. 테더 서열 (서열 16)은 제시된 DNA 구축물에 혼성화된다. 2개의 티민 잔기 및 3' 콜레스테롤 TEG (회색 동그라미로 제시)에 부착된 6개의 iSp18 스페이서는 서열 16의 3' 말단에 부착되어 있다.
도 7은 헬리카제 (Trwc Cba (서열 17))가 나노포어 (MS(B1-G75S/G77S/L88N/Q126R)8 MspA (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 (도 6b에 제시된) 람다 DNA 구축물의 전위를 제어할 때의, 예시적인 전류 트레이스 (상단 및 하단 트레이스, 둘 모두에 대하여 y축 표지 = 전류 (pA), x축 표지 = 시간 (s))를 보여주는 것이다. 상단 트레이스는 나노포어를 통한 전체 람다 DNA 구축물의 헬리카제 제어형 DNA 이동을 보여주는 것이고, X1로 표지된 첫번째 iSpC3 스페이서는 1로 표지된 전류 스파이크를 생성하고, X2로 표지된 두번째 iSpC3 스페이서는 2로 표지된 전류 스파이크를 생성하고, X3으로 표지된 세번째 iSpC3 스페이서는 3으로 표지된 전류 스파이크를 생성한다. 하단 트레이스는 나노포어를 통한 헬리카제 제어형 DNA 이동의 후반부에 대한 확대된 영역을 보여주는 것이고, X2로 표지된 두번째 iSpC3 스페이서는 2로 표지된 전류 스파이크를 생성하고, X3으로 표지된 세번째 iSpC3 스페이서는 3으로 표지된 전류 스파이크를 생성한다.
도 8은 효소 활성을 시험하기 위한 형광 검정법이다. 시판용 형광성 기질을 사용하여 혼성화된 dsDNA를 치환할 수 있는 헬리카제 (a로 표지)의 능력에 대해 검정하였다. 1) 형광성 기질 가닥 (최종 48.75 nM, 서열 25 및 26)은 3' ssDNA 오버행 (20개의 염기), 및 혼성화된 dsDNA의 40개의 염기 섹션을 가진다. 상단 가닥 (b)는 서열 25의 5' 말단에 카르복시플루오레세인 염기 (c)를 가지고, 혼성화된 상보체 (d)는 서열 26의 3' 말단에 블랙-홀 소광제 (BHQ-1) 염기 (e)를 가진다. 혼성화되면, 플루오레세인으로부터의 형광은 국소 BHQ-1에 의해 소광되고, 기질은 본질적으로 비형광성이 된다. 형광성 기질의 하단 가닥과 부분적으로 상보적인, 0.975 μM의 포획 가닥 (f, 서열 27)이 본 검정에 포함된다. 2) ATP (0.975 mM) 및 MgCl2 (10 mM)의 존재하에서, 헬리카제 Hel308 Mbu (12 nM, 서열 28)는 제시된 바와 같이 형광성 기질의 3' 오버행에 결합하여 상단 가닥을 따라 이동하여 상보성 가닥 (d)을 치환시킨다. 3) 일단 BHQ-1을 포함하는 상보성 가닥이 완전하게 치환되고 나면, 주요 가닥 상의 플루오레세인은 형광을 발한다 (별표 표시). 4) 치환된 하단 가닥 (d)은 과량의 포획 가닥 (f)에 어닐링하여 초기 기질의 재어닐링 및 형광 손실을 막는다.
도 9는 효소 활성을 시험하기 위한 형광 검정법이다. 2가지 가능한 형광성 기질을 사용하여 혼성화된 dsDNA를 치환할 수 있는 헬리카제 (a로 표지)의 능력에 대해 검정하였으며, 이는 도 9에 제시되어 있는데, (a) (1C-3C로 표지)는 서열 27의 3' 말단을 서열 29의 3' 말단에 연결하는 4개의 Sp9 스페이서 (검은색 삼각형으로 제시)를 가지고, (b) (1B-3B로 표지)는 서열 27의 3' 말단을 서열 29의 3' 말단에 연결하는 1개의 Sp9 스페이서 (검은색 삼각형으로 제시)를 가진다. 형광성 기질 가닥 (최종 48.75 nM, 앞서 기술된 a) 또는 b))은 3' ssDNA 오버행 (20개의 염기), 및 혼성화된 dsDNA의 40개의 염기 섹션을 가진다. 상단 가닥 (b)는 서열 27의 5' 말단에 카르복시플루오레세인 염기 (c)를 가지고, 혼성화된 상보체 (d)는 서열 26의 3' 말단에 블랙-홀 소광제 (BHQ-1) 염기 (e)를 가진다. 혼성화되면, 플루오레세인으로부터의 형광은 국소 BHQ-1에 의해 소광되고, 기질은 본질적으로 비형광성이 된다. 형광성 기질의 하단 가닥과 부분적으로 상보적인, 1 μM의 포획 가닥 (f, 서열 27)이 본 검정에 포함된다. 2 a 및 b). ATP (0.975 mM) 및 MgCl2 (10 mM)의 존재하에서, 헬리카제 Hel308 Mbu (서열 28)는 형광성 기질의 3' 오버행에 결합하여 상단 가닥을 따라 최대 Sp9 기(들)까지 이동한다. sp9 기 (B에서 1개, 및 C에서 4개)는 헬리카제가 그를 지나 이동하지 못하게 막고, 헬리카제는 상보성 가닥 (서열 26)을 치환하지 못한다. 그러므로, 플루오레세인 및 블랙 홀 소광제는 서로 매우 인접한 상태 그대로 유지되며, 형광은 관찰되지 않는다.
도 10은 400 mM의 KCl에서 Hel308 Mbu 헬리카제 (A로 표지, 서열 28)에 대한, 완충제 용액 (100 mM HEPES (pH 8), 0.975 mM ATP, 10 mM MgCl2, 1 mg/mL BSA, 48.75 nM 형광성 기질 DNA (A = 서열 25 및 26, B = 1개의 Sp9 스페이서에 의해 그의 3' 말단에서 서열 29의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27, C = 4개의 Sp9 스페이서에 의해 그의 3' 말단에서 서열 29의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27), 0.975 μM 포획 DNA (서열 27)) 중에서의 상대적인 dsDNA 교체율의 그래프 (y축 = 상대적인 dsDNA 교체율, x축 = 형광성 기질)를 보여주는 것이다.
도 11은 400 mM의 KCl에서 Hel308 Mbu 헬리카제 (A로 표지, 서열 28)에 대한, 완충제 용액 (100 mM HEPES (pH 8), 0.975 mM ATP, 10 mM MgCl2, 1 mg/mL BSA, 48.75 nM 형광성 기질 DNA (D = 서열 32 및 26, E = 1개의 idSp 기에 의해 그의 3' 말단에서 서열 30의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27, F = 4개의 idSp 기에 의해 그의 3' 말단에서 서열 31의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27, 및 G = 서열 26에 혼성화된 서열 33), 0.975 μM 포획 DNA (서열 27)) 중에서의 상대적인 dsDNA 교체율의 그래프 (y축 = 상대적인 dsDNA 교체율, x축 = 형광성 기질)를 보여주는 것이다.
도 12는 헬리카제 (1로 표지)를 정지시키는 iSpC3 또는 iSp18 스페이서를 함유하지 않는 대조군 가닥에 대한 실험 단계를 보여주는 것이다. 대조군 가닥 (서열 34)은 스페이서 또는 차단 기를 함유하지 않고, DNA의 더 짧은 상보성 가닥 (서열 35, 그의 5' 말단에 회색 동그라미로 제시된 카르복시플루오레세인이 부착되어 있다)에 혼성화된다. 이는 50개의 뉴클레오티드로 된 오버행을 갖는 부분적으로 이중 가닥 구축물을 제조한다. 구축물 (서열 35에 혼성화된 서열 34)을 T4 Dda - E94C/A360C와 함께 미리 인큐베이션시켜 상기 효소가 오버행에 결합할 수 있도록 한다. 제시된 바와 같이, 오버행의 길이로 인해, 1 초과의 효소가 그에 결합할 수 있다. 이어서, 헬리카제 이동을 촉진시키기 위해 효소에 필요한 성분을 제공한다 (ATP 및 MgCl2). ATP 및 MgCl2와 함께 추가의 포획 가닥 (서열 37) 또한 첨가한다. 이어서, 헬리카제는 대조군 가닥을 따라 전위되어 더 짧은 상보성 가닥을 치환하고, 대조군 가닥은 헬리카제를 함유하지 않게 되거나, 또는 상보성 가닥에 결합된 상태로 남게 된다 (A로 표지). 이어서, 상보성 가닥은 헤어핀을 형성함으로써, 이는 대조군 가닥에 재어닐링할 수 없다 (B로 표지). 이어서, 용액 중에 유리 상태이거나, 또는 대조군 DNA를 따라 이동하고, 말단에서 떨어진 헬리카제는 제시된 바와 같은 과량의 포획 가닥 (서열 37, C로 표지된 복합체)에 의해 결합된다. 헬리카제에 결합하지 않은 임의의 DNA는 무손상 상태 그대로 유지된다 (F 종 그대로 유지). 이어서, 샘플 혼합물을 겔 상에 전개시키고, 그를 통해 겔 상에 생성된 밴드에 의해 별개의 종을 확인한다.
도 13은 헬리카제 (1로 표지)를 정지시키기 위한 iSpC3 또는 iSp18 스페이서 (도에서 X로 표시)를 함유하는 가닥에 대한 실험 단계를 보여주는 것이다. 도 12에 제시된 것과 같은 방법을 수행하였고, 효소를 DNA 구축물과 미리 인큐베이션시켰다 (더 짧은 상보성 가닥에는 그의 5' 말단에 카르복시플루오레세인이 부착되어 있다). 스페이서 기는 이중 가닥 영역의 앞쪽에 위치하고, 헬리카제는 제시된 바와 같이 DNA에 결합할 수 있다. ATP, MgCl2 및 포획 DNA (2로 표지) 첨가시, 이때 헬리카제는 헬리카제 이동을 촉진시키는 필요 성분을 제공받게 된다. 스페이서가 헬리카제를 정지시킬 수 있다면, 이때는 짧은 상보성 가닥을 여전히 함유하는 DNA 구축물에 결합한 상태 그대로 유지될 것이다 (D로 표지). 스페이서가 헬리카제를 정지시킬 수 없다면, 이때는 스페이서를 지나 이동하여 상보성 가닥을 치환하게 되고 (B로 표지), 어떤 헬리카제도 결합되어 있지 않은 A 종이 남게 된다. 이어서, 유리 효소는 과량의 포획 가닥 (C로 표지)에 결합하고, 치환된 상보성 가닥은 헤어핀을 형성하게 될 것이다 (B로 표지). 스페이서가 2개의 헬리카제가 아닌, 1개의 헬리카제를 정지시킬 수 있다면, 이때 제1 헬리카제는 뒤쪽에 있는 헬리카제에 의해서 스페이서를 지나도록 인출될 것이며, 상보성 가닥을 치환하게 될 것이다. 그러나, 제2 헬리카제는 스페이서를 지나 이동할 수 없고, E로 표지된 복합체로 형성된다. 헬리카제에 결합하지 않은 임의의 DNA는 어떤 헬리카제도 결합되어 있지 않은 무손상 상태 그대로 유지된다 (F 종). 이어서, 샘플 혼합물을 겔 상에 전개시키고, 그를 통해 겔 상에 생성된 밴드에 의해 별개의 종을 확인한다.
도 14는 대조군 가닥 (하기 표 11에서 1)에 대하여 실행된 겔 검정법을 보여주는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1,000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 레인 1은 오직 어닐링된 DNA (서열 35에 혼성화된 서열 34)만을 함유한다. 레인 2는 대조군 가닥에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다 (연료 비첨가). 레인 3은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 대조군 가닥을 보여주는 것이다. 레인 4는 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 대조군 가닥을 보여주는 것이다. 밴드 X는 오직 서열 34에만 상응하고, 밴드 Y는 서열 35에 혼성화된 서열 34에 상응한다. 1Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 1개의 헬리카제에 상응한다. 2Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 2개의 헬리카제에 상응한다. 3Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 3개의 헬리카제에 상응한다. 4Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 4개의 헬리카제에 상응한다. 5Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 5개의 헬리카제에 상응한다.
도 15는 ssDNA와 dsDNA 사이의 연접부에 3개 (하기 표 11에서 7, 레인 = 1-4에 상응), 4개 (하기 표 11에서 8, 레인 = 5-8에 상응) 및 5개 iSp18 스페이서 (하기 표 11에서 9, 레인 = 9-12에 상응)를 함유하는 DNA 구축물에 대하여 실행된 겔 검정법을 보여주는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 레인 1은 오직 어닐링된 DNA (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)만을 함유한다. 레인 2는 연료가 첨가되지 않은 상태에서, DNA 구축물 (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다. 레인 3은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 4는 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 5는 오직 어닐링된 DNA (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)만을 함유한다. 레인 6은 연료가 첨가되지 않은 상태에서, DNA 구축물 (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다. 레인 7은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 8은 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 9는 오직 어닐링된 DNA (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)만을 함유한다. 레인 10은 연료가 첨가되지 않은 상태에서, DNA 구축물 (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다. 레인 11은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 12는 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 밴드 X는 오직 ssDNA 구축물 (예컨대, 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 36의 5' 말단에 부착되어 있다)에만 상응하고, 밴드 Y는 dsDNA 구축물 (그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에만 상응한다. 1X로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 36에 부착되어 있다)에 결합된 1개의 헬리카제에 상응한다. 1Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 1개의 헬리카제에 상응한다. 2Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 2개의 헬리카제에 상응한다. 3Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 3개의 헬리카제에 상응한다. 4Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 4개의 헬리카제에 상응한다. 5Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 5개의 헬리카제에 상응한다.
도 16은 실시예 9에서 사용된 표준 DNA 구축물을 보여주는 것이다. x는 헬리카제가 결합할 수 없는 스페이서 기를 나타낸다. 1로 표지된 영역의 길이는 상기 영역에 결합할 수 있는 헬리카제의 개수를 제어하기 위해 변경될 수 있다. 실시예와 같이, 본 도면은 영역 1에 1 또는 2개의 헬리카제가 결합되어 있는 것을 보여준다.
도 17은 표 12에 3으로 표지된 DNA 구축물 (서열 9의 5' 말단에 부착되어 있는 5개의 iSpC3 스페이서, 서열 9는 그의 3' 말단에서 4개의 iSpC3 스페이서에 부착되어 있고, iSpC3 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)의 예시적인 겔 검정법을 보여주는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1,000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 레인 1-6은 상이한 농도의 T4 Dda - E94C/A360C에 상응하는 것이다 (1 = 5,000 nM, 2 = 2,500 nM, 3 = 1,250 nM, 4 = 625 nM, 5 = 312.5 nM 및 6 = 0 nM). X 수준에서 관찰된 밴드는 비결합 dsDNA 구축물에 상응하는 것이다. 겔 좌측에 기재된 수치는 DNA에 결합된 효소의 개수에 관한 것이다. 상기 DNA 구축물의 경우, 첨가된 최고 농도의 효소에서 최대 6개까지의 헬리카제에 결합할 수 있다. 겔의 상단에 제시된 수치는 첨가된 T4 Dda - E94C/A360C의 농도에 상응하는 것이다.
도 18은 실시예 9에서 사용된 DNA 구축물을 보여주는 것이다. A 및 B로 표지된 영역은 디자인된 짧은 DNA 가닥 (서열 37)이며, 이로써, 1개의 헬리카제가 각 영역 (우측에 제시)에 결합할 수 있다. 영역 1은 25개의 SpC3 스페이서에 상응하고, 영역 2는 2개의 iSp18 스페이서에 상응하고, 영역 3은 2개의 iSp18 스페이서에 상응하고, 영역 4는 포크형 DNA로 구성될 수 있거나, 또는 구성될 수 없는 또 다른 DNA 가닥 (예컨대, 서열 42 = 비포크형 (7로 표지된 단편 결실) 및 (7로 표지된 단편으로 제시된) 6개의 iSp18 스페이서에 부착된 서열 12 = 포크형)에 혼성화하는 DNA 섹션 (서열 10)에 상응하고, 영역 5는 4개의 5-니트로인돌에 상응하고, 영역 6은 그의 상보체 (서열 43)에 혼성화된 또 다른 DNA 영역 (서열 41)에 상응한다.
도 19는 도 18에 기술되고 제시된 DNA 구축물의 겔 검정법을 보여주는 것이다. X 수준에서 관찰된 밴드는 비결합 dsDNA 구축물에 상응하는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 겔 좌측에 기재된 수치는 DNA에 결합된 효소의 개수에 관한 것이다. 상기 DNA 구축물의 경우, 475 nM 이상인 농도의 효소로부터 2개의 헬리카제 (도 18에 제시된 바와 같이, 하나는 영역 A에, 및 또 다른 하나는 영역 B에)의 결합을 관찰할 수 있었다. 겔의 상단에 제시된 수치는 첨가된 T4 Dda - E94C/A360C의 농도에 상응하는 것이다.
도 20은 실시예 10에서 사용된 DNA 구축물 (DNA 구축물 X1로 지칭)을 보여주는 것이다. 서열 38의 5' 말단에 부착된 25개의 SpC3 스페이서 (x로 표시)가 존재하고, 서열 38은 그의 3' 말단에서 4개의 iSp18 스페이서 (검은색 사각형으로 표시)에 부착되어 있다. 4개의 iSp18 스페이서는 서열 10의 5' 말단에 부착되어 있고, 서열 10은 그의 3' 말단에서 4개의 5-니트로인돌 (회식 삼각형으로 표시)에 부착되어 있다. 이어서, 4개의 니트로인돌은 서열 41의 5' 말단에 부착되어 있다. 서열 41에 혼성화되는 상보성 DNA 가닥은 서열 43이다. 서열 10에 혼성화되는 상보성 DNA 가닥은 서열 12 (서열 12의 3' 말단에는 2개의 티민 잔기 및 3' 콜레스테롤 TEG (회색 동그라미로 제시)에 부착된 6개의 iSp18 스페이서가 부착되어 있다)이다. A로 표지된 영역은 T4 Dda - E94C/A360C가 결합할 수 있는 구축물의 영역에 상응한다.
도 21은 헬리카제 (T4 Dda - E94C/A360C)가 나노포어 (MspA - B2C)를 통과하는 DNA 구축물 (0.1 nM, 도 20 설명 참조의 전위를 제어할 때의, 예시적인 전류 트레이스 (y축 표지 = 전류 ((pA), 50 내지 250), x축 표지 = 시간 ((s), 238 내지 252))를 보여주는 것이다. 1로 표지된 영역은 나노포어를 통과하는 폴리T 영역 (서열 38, 그 위에 효소가 결합되어 있는 것)의 헬리카제 제어형 전위를 보여주는 것이다. 2로 표지된 영역은 나노포어를 통과하는 나노포어를 통과하는 iSp18 스페이서의 헬리카제 제어형 전위를 보여주는 것이다.
도 22는 실시예 4에서 사용된 DNA 구축물의 다이어그램을 보여주는 것이다. 2개의 티민이 28개의 iSpC3 스페이서 (A로 표지)의 3' 말단에 부착되어 있다. 28개의 iSpC3 스페이서는 나머지 다른 한쪽 말단에서 서열 23의 5' 말단에 부착되어 있다 (서열은 영역 B = 폴리T 섹션, 및 영역 C = 테더 서열 (서열 12에 상보적인 서열에 상응한다). 서열 23의 3' 말단은 4개의 iSpC3 스페이서 (D로 표지)에 부착되어 있다. 4개의 iSpC3 스페이서의 나머지 다른 한쪽 말단은 서열 24의 5' 말단에 부착되어 있다. 테더 서열 (서열 12)은 그의 3' 말단에서, 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착되어 있는 6개의 iSp18 스페이서에 부착되어 있다.
서열 목록 설명
서열 1은 MS-B1 돌연변이체 MspA 단량체를 코딩하는 코돈 최적화된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 돌연변이체에는 신호 서열이 결실되어 있으며, 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다.
서열 2는 MspA 단량체의 MS-B1 돌연변이체의 성숙한 형태의 아미노산 서열을 보여주는 것이다. 상기 돌연변이체에는 신호 서열이 결실되어 있으며, 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다.
서열 3은 α-헤몰리신-E111N/K147N (α-HL-NN; 문헌 [Stoddart et al., PNAS, 2009; 106(19): 7702-7707])의 한 단량체를 코딩하는 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 4는 α-HL-NN의 한 단량체의 아미노산 서열을 보여주는 것이다.
서열 5 내지 7은 MspB, C 및 D의 아미노산 서열을 보여주는 것이다.
서열 8은 엔테로박테리아파지 T4로부터의 헬리카제 Dda 1993의 아미노산 서열을 보여주는 것이다.
서열 9는 실시예 1, 2, 3, 7 및 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 10은 실시예 1 및 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 11은 실시예 1에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 11은 그의 5' 말단에 의해, 서열 10의 3' 말단에 부착된 3개의 iSpC3 스페이서에 부착된다.
서열 12는 실시예 1 및 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 실시예 1에서, 서열 12는 그의 3' 말단에서, 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착된 6개의 iSp18 스페이서에 부착된다. 실시예 9에서, 서열 12는 그의 3' 말단에서 오직 6개의 iSp18 스페이서에만 부착된다.
서열 13은 엔테로박테리아파지 λ의 폴리뉴클레오티드 서열을 보여주는 것이다. 서열은 센스 가닥의 5' 말단에 부착된 추가의 12개의 염기 오버행을 함유한다. 본원에 제시된 서열은 오직 센스 가닥의 것이다.
서열 14는 실시예 2 및 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 14는 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛에 의해 서열 15의 5' 말단에 부착된다.
서열 15는 실시예 2 및 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 15는 그의 5' 말단에서 4개의 iSpC3 스페이서 유닛에 의해 서열 14의 3' 말단에 부착된다.
서열 16은 실시예 2 및 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것으로서, 상기 서열은 그의 3' 말단에서, 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착된 6개의 iSp18 스페이서를 가진다.
서열 17은 Trwc Cba 헬리카제의 아미노산 서열을 보여주는 것이다.
서열 18은 실시예 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 18은 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛에 의해 서열 9의 5' 말단에 부착된다. 상기 서열은 그의 5' 말단에 부착된 포스페이트, 및 1 내지 5번 위치에 5 데옥시이노신을 가진다.
서열 19는 실시예 2에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 20은 실시예 2에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 21 및 22는 하기 서열의 번호매김을 유지시키기 위한 플레이스 홀더이다.
서열 23은, 실시예 4에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 마지막의 것이 스페이서 기의 5' 말단에 부착된 추가의 2개의 T를 갖는 것인 28개의 iSpC3 스페이서 유닛은 상기 서열의 5' 말단에 부착되어 있다. 서열 24의 5' 말단에 부착된 4개의 iSpC3 스페이서 유닛은 상기 서열의 3' 말단에 부착되어 있다.
서열 24는 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 마지막의 것이 서열 23에 부착되어 있는 것인 4개의 iSpC3 스페이서 유닛은 상기 서열의 5' 말단에 부착되어 있다. 마지막의 것이 스페이서 기의 5' 말단에 부착된 추가의 2개의 T를 갖는 것인 28개의 iSpC3 스페이서 유닛은 서열 23의 5' 말단에 부착되어 있다.
서열 25는 실시예 5에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 26은 실시예 5 및 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 3' 말단에 블랙-홀 소광제 (BHQ-1) 염기를 가진다.
서열 27은 실시예 5 및 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 28은 Hel308 Mbu의 아미노산 서열을 보여주는 것이다.
서열 29는 실시예 5에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 서열은 그의 5' 말단에서 1 또는 4개의 iSp9 스페이서 기에 의해 서열 27에 연결된다.
서열 30은 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 서열은 그의 5' 말단에서 1개의 idSp 기에 의해 서열 27에 연결된다.
서열 31은 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 서열은 그의 5' 말단에서 4개의 idSp 기에 의해 서열 27에 연결된다.
서열 32는 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 33은 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 34는 실시예 7에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 35는 실시예 7 및 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 36은 실시예 7 및 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 37은 실시예 7, 8 및 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 38은 실시예 8 및 10에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 39는 실시예 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 40은 실시예 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 41은 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 42는 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 43은 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
개시된 생성물 및 방법의 상이한 적용은 관련 기술분야에서의 구체적인 요구에 맞게 적합화될 수 있다는 것을 이해하여야 한다. 또한, 본원에서 사용된 용어는 단지 본 발명의 특정 실시양태를 기술하기 위한 목적의 것이며, 제한하고자 하는 것은 아님을 이해하여야 한다.
추가로, 본 명세서 및 첨부된 청구범위에서 사용되는 바, 단수 형태인 "하나"("a", "an") 및 "그"라는 것은 내용상 달리 명백하게 명시되지 않는 한, 복수 개의 지시 대상을 포함한다. 따라서, 예를 들어, "하나의 폴리뉴클레오티드"라고 지칭하는 것은 2개 이상의 폴리뉴클레오티드를 포함하는 것이고, "하나의 스페이서"라고 지칭하는 것은 2개 이상의 스페이서를 포함하는 것이며, "1개의 헬리카제"라고 지칭하는 것은 2개 이상의 헬리카제를 포함하는 것이고, "하나의 막횡단 포어"라고 지칭하는 것은 2개 이상의 포어를 포함하는 것이며, 다른 것도 그러하다.
상기에서든 또는 하기에서든 상관없이, 본원에서 인용된 모든 공개 문헌, 특허, 및 특허 출원은 그 전문이 본원에서 참조로 포함된다.
헬리카제가 스페이서를 지나도록 이동시키는 방법
본 발명은 표적 폴리뉴클레오티드에서 하나 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 방법을 제공한다. 헬리카제는 그가 폴리뉴클레오티드를 따라 이동하는 것을 중단하였다면, 정지된 것이다. 각 스페이서는 전형적으로 하나 이상의 헬리카제를 정지시킨다. 하나 이상의 헬리카제가 정지되었는지 여부를 측정하는 방법은 하기에서 논의된다. 하나 이상의 헬리카제는 스페이서 앞에서 정지될 수 있다. 하나 이상의 헬리카제는 스페이서에 의해 정지될 수 있다. 하나 이상의 헬리카제는 스페이서 상에서 정지될 수 있다. 본 발명은 하나 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록, 즉, 그를 넘도록 이동시키는 것에 관한 것이다.
하나 이상의 정지된 헬리카제 및 표적 폴리뉴클레오티드를 막횡단 포어와 접촉시키고, 전위를 인가하다. 하기에서 더욱 상세하게 기술되는 바와 같이, 표적 폴리뉴클레오티드는 인가된 전위로부터 생성된 장을 이용하여 포어를 통해 이동한다. 하나 이상의 헬리카제는 전형적으로는 너무 크기 때문에 포어를 통해 이동하지 못한다. 표적 폴리뉴클레오티드의 일부가 포어에 진입하고, 인가된 전위로부터 생성된 장을 따라 포어를 통해 이동할 때, 표적 폴리뉴클레오티드가 포어를 통해 이동함에 따라 하나 이상의 헬리카제는 포어에 의해 스페이서를 지나 이동하게 된다. 이는 (하나 이상의 스페이서를 포함하는) 표적 폴리뉴클레오티드가 포어를 통해 이동하고, 하나 이상의 헬리카제가 포어의 상단에 그대로 남아있기 때문이다.
이를 통해 표적 폴리뉴클레오티드 상의 하나 이상의 헬리카제의 위치는 제어될 수 있다. 하나 이상의 정지된 헬리카제 및 표적 폴리뉴클레오티드가 막횡단 포어와 접촉하고, 전위가 인가되기 전에는, 하나 이상의 헬리카제는 그가 정지된 위치에 그대로 남아있다. 심지어 헬리카제 이동을 촉진시키는 데 필요한 성분 (예컨대, ATP 및 Mg2 +)이 존재하는 경우에도, 하나 이상의 헬리카제는 표적 폴리뉴클레오티드 상의 스페이서를 지나 이동하지 못할 것이며, 그가 막횡단 포어 및 인가된 전위의 존재하에 놓일 때까지는 스페이서의 다른 쪽 상의 표적 폴리뉴클레오티드 일부를 따라 이동하지 못할 것이다.
하나 이상의 헬리카제 또한 막횡단 포어의 존재하에, 그러나, 인가된 전위의 부재하에서 정지된 위치에 그대로 남아있게 될 것이다. 이러한 경우, 전위 인가를 통해 하나 이상의 헬리카제는 스페이서를 지나 이동하게 된다. 그러므로, 하나 이상의 헬리카제가 스페이서를 지나 스페이서의 다른 쪽 상의 표적 폴리뉴클레오티드 일부를 따라 이동하도록 조장하는 데에는 전위 인가가 사용될 수 있다. 예를 들어, 하나 이상의 헬리카제가 스페이서를 지나 이동하도록 하는 데에는 전압 증가가 사용될 수 있다.
본 발명은 또한 막횡단 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 방법을 제공한다. 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공한다. 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시키고, 하나 이상의 헬리카제는 하나 이상의 스페이서에서 정지한다. 이를 통해 확실하게 하나 이상의 헬리카제가 폴리뉴클레오티드 상의 하나 이상의 특정 위치에 그대로 남게 된다. 이는 하기에서 더욱 상세하게 논의된다. 표적 폴리뉴클레오티드 및 하나 이상의 정지된 헬리카제를 막횡단 포어와 접촉시킨다. 일단 전위를 인가하고 나면, 하나 이상의 헬리카제는 하나 이상의 스페이서를 지나 스페이서(들)의 다른 쪽 상의 표적 폴리뉴클레오티드 일부를 따라 이동하게 된다. 이로써, 하나 이상의 헬리카제는 포어를 통과하는 폴리뉴클레오티드의 이동을 제어할 수 있다. 또한 전위는 폴리뉴클레오티드를 포어로 트레딩(thread)하는 데에도 사용된다.
헬리카제는 적어도 2가지 활성 작동 모드로 (이동을 촉진시키는 데 필요한 모든 성분, 예컨대, ATP 및 Mg2 +를 헬리카제에 제공하였을 때) 및 1가지 불활성 작동 모드로 (이동을 촉진시키는 데 필요한 성분을 헬리카제에 제공하지 않았을 때) 폴리뉴클레오티드의 이동을 제어할 수 있다. 이동을 촉진시키는 데 필요한 모든 성분을 제공받은 경우, 헬리카제는 (헬리카제에 따라) 5'→3' 또는 3'→5' 방향으로 폴리뉴클레오티드를 따라 이동하지만, (폴리뉴클레오티드의 어느 말단이 포어에 의해 포획되었는지에 의존하는) 포어 중 폴리뉴클레오티드의 배향은 폴리뉴클레오티드를 인가된 장에 반하여 포어 밖으로 이동시키거나, 또는 폴리뉴클레오티드를 인가된 장에 따라 포어 안으로 이동시키는 데 헬리카제가 사용될 수 있다는 것을 의미한다. 헬리카제가 이동하는 방향 쪽의 폴리뉴클레오티드의 말단이 포어에 포획되었을 때, 헬리카제는 인가된 전위로부터 생성된 장의 방향에 반대로 작용하여 트레딩된 폴리뉴클레오티드를 포어 밖으로 및 시스 챔버 안으로 인입한다. 그러나, 헬리카제가 이동하는 방향 쪽으로부터 떨어져 있는 말단이 포어에 포획되었을 때, 헬리카제는 인가된 전위로부터 생성된 장의 방향에 따라 작용하여 트레딩된 폴리뉴클레오티드를 포어 안으로 및 트랜스 챔버 안으로 인출한다.
이동을 촉진시키는 데 필요한 성분을 제공받지 못한 경우, 헬리카제는 폴리뉴클레오티드에 결합하고, 폴리뉴클레오티드가 인가된 전위로부터 생성된 전에 의해 포어 안으로 인입될 때, 폴리뉴클레오티드의 이동을 저속화시키는 브레이크로서 작용할 수 있다. 불활성 모드에서, 폴리뉴클레오티드의 어느 말단이 포획되었는지는 중요하지 않고, 브레이크로서 작용하는 헬리카제와 트랜스 쪽인 방향인 포어 내로 폴리뉴클레오티드를 인입하는 인가된 전위가 중요하다. 불활성 모드일 때, 헬리카제에 의한 폴리뉴클레오티드의 이동을 제어하는 것은 라체팅, 슬라이딩 및 브레이킹을 비롯한 다수의 방식으로 기술될 수 있다.
본 발명의 방법에서, 하나 이상의 헬리카제는 바람직하게는 표적 폴리뉴클레오티드는 인가된 전위로부터 생성된 장을 이용하여 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어한다. 한 바람직한 실시양태에서, 하나 이상의 헬리카제는 활성 모드로 사용되고, 하나 이상의 헬리카제가 이동하는 방향 쪽으로부터 떨어져 있는 말단이 포어에 포획되고, 이로써, 하나 이상의 헬리카제는 인가된 전위로부터 생성된 장의 방향에 따라 작용하여 폴리뉴클레오티드가 포어를 통과하도록 인출한다. 하나 이상의 헬리카제가 5'→3' 방향으로 이동할 때, 표적 폴리뉴클레오티드의 5' 말단은 바람직하게 포어에 의해 포획된다. 상기 실시양태에서, 하나 이상의 헬리카제는 5'→3' 방향으로 하나 이상의 스페이서를 지나 이동하게 된다. 하나 이상의 헬리카제가 3'→5' 방향으로 이동할 때, 표적 폴리뉴클레오티드의 3' 말단은 바람직하게 포어에 의해 포획된다. 상기 실시양태에서, 하나 이상의 헬리카제는 3'→5' 방향으로 하나 이상의 스페이서를 지나 이동하게 된다.
또 다른 바람직한 실시양태에서, 하나 이상의 헬리카제는 불활성 모드로 사용되고, 이로써, 인가된 장은 표적 폴리뉴클레오티드가 포어를 통과하도록 인입하고, 하나 이상의 헬리카제는 브레이크로서 작용하게 된다. 본 발명의 방법에서, 하나 이상의 헬리카제는 바람직하게 인가된 전위로부터 생성된 장을 이용하여 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 저속화시키거나, 또는 제동을 건다. 어느 경우에서든, 하나 이상의 헬리카제는 전형적으로는 포어를 통해 이동하기에는 너무 크고, 폴리뉴클레오티드가 인가된 전위로부터 생성된 장을 이용하여 포어를 통해 이동함에 따라, 포어는 폴리뉴클레오티드 상에서 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 인출한다.
막횡단 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 방법은 포어를 사용하여 폴리뉴클레오티드의 특징을 규명하는 동안, 예를 들어, 가닥 서열분석을 수행하는 동안 도움이 될 수 있다. 본 발명은 또한 표적 폴리뉴클레오티드의 특징을 규명하는 방법을 제공한다. 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공한다. 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시키고, 하나 이상의 헬리카제는 하나 이상의 스페이서에서 정지한다. 이를 통해 확실하게 하나 이상의 헬리카제가 폴리뉴클레오티드 상의 하나 이상의 특정 위치에 그대로 남게 된다. 이는 하기에서 더욱 상세하게 논의된다. 표적 폴리뉴클레오티드 및 하나 이상의 정지된 헬리카제를 막횡단 포어와 접촉시킨다. 일단 전위를 인가하고 나면, 하나 이상의 헬리카제는 하나 이상의 스페이서를 지나 스페이서(들)의 다른 쪽 상의 폴리뉴클레오티드 일부를 따라 이동하게 된다. 이로써, 하나 이상의 헬리카제는 포어를 통과하는 폴리뉴클레오티드의 이동을 제어할 수 있다. 본 방법은 또한 폴리뉴클레오티드가 포어와 관련하여 이동함에 따라 하나 이상의 측정치를 측정하는 단계를 포함한다. 측정치는 폴리뉴클레오티드의 하나 이상의 특징을 나타낸다.
막횡단 포어 및 인가된 전위를 사용하여 표적 폴리뉴클레오티드 상의 하나 이상의 헬리카제를 정지시키고, 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시킬 수 있는 능력은 이를 통해 표적 폴리뉴클레오티드의 특징을 효과적으로 규명할 수 있기 때문에, 서열분석할 수 있기 때문에 이롭다. 예를 들어, 하나 이상의 헬리카제는 (하기 기술되는 바와 같이) 포어에 의해 포획되도록 디자인되고, 특징 규명될 필요가 없는 리더 서열 중의 표적 폴리뉴클레오티드의 한쪽 말단 쪽의 방향으로 정지될 수 있다. 리더 서열 중 하나 이상의 헬리카제의 정지란 하나 이상의 헬리카제는 그(들)가 포어와 접촉하고, 전위가 인가될 때까지는 리더 서열로부터 출발하여 폴리뉴클레오티드의 일부를 따라 이동하지 못한다는 것을 의미한다. 일단 1개 이상의 헬리카제 및 폴리뉴클레오티드가 포어와 접촉하게 되고, 전위가 인가되고 나면, 리더 서열은 전형적으로 포어에 의해 포획되고, 포어를 통해 이동하게 된다. (상기 기술된 바와 같이) 이러한 이동은 하나 이상의 헬리카제가 스페이서(들)를 지나 특징 규명하고자 하는 폴리뉴클레오티드 일부를 따라 움직이게 한다. 이어서, 하나 이상의 헬리카제는 특징 규명하고자 하는 폴리뉴클레오티드 일부의 이동을 제어할 수 있다.
리더 서열에서 하나 이상의 헬리카제가 정지되지 않으면, 그(들)는 리더 서열로부터 출발하여 폴리뉴클레오티드를 따라, 및 특징 규명하고자 하는 폴리뉴클레오티드 일부를 따라 이동하게 될 것이다. 상기 환경하에서 하나 이상의 헬리카제 및 폴리뉴클레오티드가 포어와 접촉하게 되고, 전위가 인가되면, 리더 서열, 및 특징 규명하고자 하는 폴리뉴클레오티드는 그 모두가 아니더라도, 그 중 일부는 인가된 전위로부터 생성된 장을 따라 제어되지 않는 방식으로 포어를 통해 이동하게 될 것이다. 오직 일단 1개 이상의 헬리카제가 포어와 접촉하게 된 경우에만, 상기 논의된 바와 같이, 그(들)는 특징 규명하고자 하는 폴리뉴클레오티드의 일부의 이동을 제어하기 시작할 것이다. 제어되지 않는 방식으로 포어를 통해 이동하는 폴리뉴클레오티드의 임의의 일부분은 하기 기술되는 바와 같이 특징 규명될 수 없다. 하나 이상의 헬리카제가 리더 서열로부터 출발하여 남은 표적 폴리뉴클레오티드 대부분을 따라 이동하게 되다면, 있다해도 극소수의 폴리뉴클레오티드만이 특징 규명될 것이다.
하기에서 더욱 상세하게 논의되는 바와 같이, 본 발명에 따른 하나 이상의 스페이서를 사용함으로써 표적 폴리뉴클레오티 상의 하나 이상의 헬리카제의 개수 및 위치는 제어될 수 있다. 예를 들어, 특정 개수의 헬리카제는, 특징 규명 이전에 표적 폴리뉴클레오티드에 결찰될 수 있는 어댑터 상의 특정 위치에서 정지될 수 있다. 상기 어댑터는 본 발명에 의해 제공되며, 이는 특징 규명을 이한 키트에 제공될 수 있다. 하나 이상의 스페이서를 사용함에 따라 확실하게 헬리카제는, 특징 규명 이전에 어댑터 및/또는 표적 폴리뉴클레오티드가 헬리카제 이동을 촉진시키는 데 필요한 성분 (예컨대, ATP 및 Mg2 +)의 존재하에 있는 경우에도, 특징 규명이 시작될 때까지 존재하게 되는 위치에 그대로 남게 된다.
폴리뉴클레오티드
폴리뉴클레오티드, 예컨대, 핵산은 2개 이상의 뉴클레오티드를 포함하는 거대분자이다. 폴리뉴클레오티드 또는 핵산은 임의의 뉴클레오티드의 임의의 조합을 포함할 수 있다. 뉴클레오티드는 자연적으로 발생된 것이거나, 또는 인공의 것일 수 있다. 폴리뉴클레오티드 중 하나 이상의 뉴클레오티드는 산화되거나, 메틸화될 수 있다. 폴리뉴클레오티드 중 하나 이상의 뉴클레오티드는 손상될 수 있다. 예를 들어, 폴리뉴클레오티드는 피리미딘 이량체를 포함할 수 있다. 상기 이량체는 전형적으로 자외선에 의한 손상과 관련이 있으며, 이는 피부 흑색종의 주요 원인이다. 폴리뉴클레오티드 중 하나 이상의 뉴클레오티드는 예를 들어, 표지 또는 태그로 변형될 수 있다. 적합한 표지는 하기 기술한다.
뉴클레오티드는 전형적으로 뉴클레오염기, 당 및 1개 이상의 포스페이트 기를 함유한다. 뉴클레오염기 및 당은 뉴클레오시드를 형성한다.
뉴클레오염기는 전형적으로 헤테로시클릭이다. 뉴클레오염기로는 퓨린 및 피리미딘, 및 더욱 구체적으로, 아데닌 (A), 구아닌 (G), 티민 (T), 우라실 (U) 및 시토신 (C)을 포함하나, 이에 제한되지는 않는다.
당은 전형적으로 펜토스 당이다. 뉴클레오티드 당은 리보스 및 데옥시리보스를 포함하나, 이에 제한되지는 않는다. 당은 바람직하게 데옥시리보스이다.
폴리뉴클레오티드 중 뉴클레오티드는 전형적으로 리보뉴클레오티드 또는 데옥시리보뉴클레오티드이다. 폴리뉴클레오티드는 하기 뉴클레오시드: 아데노신, 우리딘, 구아노신 및 시티딘을 포함할 수 있다. 뉴클레오티드는 바람직하게 데옥시리보뉴클레오티드이다. 폴리뉴클레오티드는 바람직하게 하기 뉴클레오시드: 데옥시아데노신 (dA), 데옥시우리딘 (dU) 및/또는 티미딘 (dT), 데옥시구아노신 (dG) 및 데옥시시티딘 (dC)을 포함한다.
뉴클레오티드 전형적으로 모노포스페이트, 디포스페이트 또는 트리포스페이트를 포함한다. 포스페이트는 뉴클레오티드의 5' 또는 3' 측 상에 부착될 수 있다.
적합한 뉴클레오티드는 아데노신 모노포스페이트 (AMP), 구아노신 모노포스페이트 (GMP), 티미딘 모노포스페이트 (TMP), 우리딘 모노포스페이트 (UMP), 시티딘 모노포스페이트 (CMP), 시클릭 아데노신 모노포스페이트 (cAMP), 시클릭 구아노신 모노포스페이트 (cGMP), 데옥시아데노신 모노포스페이트 (dAMP), 데옥시구아노신 모노포스페이트 (dGMP), 데옥시티미딘 모노포스페이트 (dTMP), 데옥시우리딘 모노포스페이트 (dUMP) 및 데옥시시티딘 모노포스페이트 (dCMP)를 포함하나, 이에 제한되지는 않는다. 뉴클레오티드는 바람직하게 AMP, TMP, GMP, CMP, UMP, dAMP, dTMP, dGMP, dCMP 및 dUMP로부터 선택된다. 뉴클레오티드는 가장 바람직하게 dAMP, dTMP, dGMP, dCMP 및 dUMP로부터 선택된다. 폴리뉴클레오티드는 바람직하게 하기 뉴클레오티드: dAMP, dUMP 및/또는 dTMP, dGMP 및 dCMP를 포함한다.
폴리뉴클레오티드 중 뉴클레오티드는 임의 방식으로 서로에게 부착될 수 있다. 뉴클레오티드는 전형적으로 핵산에서와 같이 그의 당 및 포스페이트 기에 의해 부착된다. 뉴클레오티드는 피리미딘 이량체에서와 같이 그의 뉴클레오염기를 통해 연결될 수 있다.
폴리뉴클레오티드는 핵산일 수 있다. 폴리뉴클레오티드는 관련 기술분야에 공지된 임의의 합성 핵산, 예컨대, 펩티드 핵산 (PNA), 글리세롤 핵산 (GNA), 트레오스 핵산 (TNA), 잠금 핵산 (LNA) 또는 뉴클레오티드 측쇄를 포함하는 다른 합성 중합체일 수 있다. PNA 백본은 펩티드 결합에 의해 연결된, 반복 N-(2-아미노에틸)-글리신으로 구성된다. GNA 백본은 포스포디에스테르 결합에 의해 연결된, 반복 글리콜 단위로 구성된다. TNA 백본은 포스포디에스테르 결합에 의해 함께 연결된 반복 트레오스 당으로 구성된다. LNA는 리보스 모이어티 중 2' 산소 및 4' 탄소를 연결하는 추가의 브릿지를 가지는, 상기 논의된 리보뉴클레오티드로부터 형성된다.
폴리뉴클레오티드는 가장 바람직하게 리보핵산 (RNA) 또는 데옥시리보핵산 (DNA)이다.
폴리뉴클레오티드는 바람직하게 하나 이상의 스페이서를 제외하면, 어떤 무염기 뉴클레오티드 (즉, 뉴클레오염기가 결실된 뉴클레오티드)도 포함하지 않는다. 폴리뉴클레오티드는 바람직하게 하나 이상의 스페이서를 제외하면, 어떤 C3 스페이서 (즉, 뉴클레오염기 및 당이 결실된 뉴클레오티드)도 포함하지 않는다.
폴리뉴클레오티드의 길이는 임의 길이일 수 있다. 예를 들어, 폴리뉴클레오티드 길이는 10개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 400개 이상, 또는 500개 이상의 뉴클레오티드 길이일 수 있다. 폴리뉴클레오티드 길이는 1,000개 이상의 뉴클레오티드, 5,000개 이상의 뉴클레오티드 길이, 또는 100,000개 이상의 뉴클레오티드 길이일 수 있다.
헬리카제는 본 발명의 방법에서 전체 표적 폴리뉴클레오티드를 따라 또는 그의 오직 일부분만을 따라 이동할 수 있다. 본 발명의 방법을 이용하여 전체 표적 폴리뉴클레오티드 또는 그의 오직 일부분만을 특징 규명할 수 있다.
표적 폴리뉴클레오티드는 단일 가닥일 수 있다. 표적 폴리뉴클레오티드의 적어도 일부는 바람직하게 이중 가닥이다. 헬리카제는 전형적으로 단일 가닥 폴리뉴클레오티드에 결합한다. 표적 폴리뉴클레오티드의 적어도 일부는 이중 가닥일 경우, 표적 폴리뉴클레오티드는 바람직하게 단일 가닥 영역 또는 비혼성화된 영역을 포함한다. 하나 이상의 헬리카제는 단일 가닥 영역에, 또는 비혼성화된 영역의 한 가닥에 결합할 수 있다. 표적 폴리뉴클레오티드는 바람직하게 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역을 포함한다.
하나 이상의 스페이서는 바람직하게 표적 폴리뉴클레오티드의 단일 가닥 영역 또는 비혼성화된 영역에 포함된다. 표적 폴리뉴클레오티드는 1 초과의 단일 가닥 영역 또는 1 초과의 비혼성화된 영역을 포함할 수 있다. 표적 폴리뉴클레오티드는 그의 서열 내에 및/또는 한쪽 말단 또는 양측 말단에 단일 가닥 영역 또는 비혼성화된 영역을 포함할 수 있다. 하나 이상의 스페이서는 표적 폴리뉴클레오티드의 이중 가닥 영역에 포함될 수 있다.
본 방법에서 사용되는 하나 이상의 헬리카제가 5'→3' 방향으로 이동할 경우, 표적 폴리뉴클레오티드는 바람직하게 그의 5' 말단에 단일 가닥 영역 또는 비혼성화된 영역을 포함한다. 본 방법에서 사용되는 하나 이상의 헬리카제가 3'→5'방향으로 이동할 경우, 표적 폴리뉴클레오티드는 바람직하게 그의 3' 말단에 단일 가닥 영역 또는 비혼성화된 영역을 포함한다. 하나 이상의 헬리카제가 불활성 모드로 (즉, 브레이크로서) 사용될 경우, 단일 가닥 영역 또는 비혼성화된 영역이 어디 위치하는지는 중요하지 않다.
단일 가닥 영역은 바람직하게 우선적으로 포어로 트레딩하는 리더 서열을 포함한다. 리더 서열은 본 발명의 방법을 촉진시킨다. 리더 서열은 우선적으로 막횡단 포어로 트레딩하여 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 촉진시키도록 디자인된다. 리더 서열은 전형적으로 중합체를 포함한다. 중합체는 바람직하게 음으로 하전된 것이다. 중합체는 바람직하게 폴리뉴클레오티드, 예컨대, DNA 또는 RNA, 변형된 폴리뉴클레오티드 (예컨대, 무염기 DNA), PNA, LNA, 폴리에틸렌 글리콜 (PEG) 또는 폴리펩티드이다. 리더는 바람직하게 폴리뉴클레오티드를 포함하고, 더욱 바람직하게 단일 가닥 폴리뉴클레오티드를 포함한다. 리더 서열은 상기 논의된 폴리뉴클레오티드 중 임의의 것을 포함할 수 있다. 단일 가닥 리더 서열은 가장 바람직하게 DNA의 단일 가닥, 예컨대, 폴리 dT 섹션을 포함한다. 리더 서열은 바람직하게 하나 이상의 스페이서를 포함한다.
리더 서열의 길이는 임의 길이일 수 있지만, 전형적으로는 10 내지 150개의 뉴클레오티드 길이, 예컨대, 20 내지 150개의 뉴클레오티드 길이이다. 리더의 길이는 전형적으로 본 방법에서 사용되는 막횡단 포어에 의존한다.
표적 폴리뉴클레오티드의 적어도 일부가 이중 가닥일 경우, 이중 가닥부의 두 가닥은 바람직하게 예컨대, 헤어핀과 같은 가교 모이어티를 사용하여 연결되어 있다. 이는 본 발명의 특징 규명 방법을 촉진시킨다. 가교 모이어티에 의한 표적 폴리뉴클레오티드의 두 가닥의 연결은 폴리뉴클레오티드의 두 가닥 모두 막횡단 포어에 의해 특징 규명할 수 있게, 예컨대, 서열분석할 수 있게 한다. 폴리뉴클레오티드가 단일 가닥 폴리뉴클레오티드와 같이 포어를 통해 이동함에 따라 두 가닥은 탈혼성화된다. 본 방법은 단일의 이중 가닥 표적 폴리뉴클레오티드로부터 수득되는 정보의 양을 배가시키기 때문에 이롭다. 또한, 상보적인 '안티 센스' 가닥 중 서열은 '센스' 가닥의 서열에 대하여 반드시 오르소고날성이기 때문에, 두 가닥으로부터의 정보는 정보화 방식으로 조합될 수 있다. 따라서, 이러한 메커니즘은 신뢰성이 더 높은 관찰 결과를 제공하는 오르소고날성 프루프 리딩 능력을 제공한다.
국제 출원 번호 PCT/GB2012/051786 (공보 WO 2013/014451)에 개시된 실시양태 중 임의의 것이 사용될 수 있다. 가교 모이어티는 전형적으로 폴리뉴클레오티드의 두 가닥을 공유적으로 연결시킨다. 가교 모이어티는 표적 폴리뉴클레오티드의 두 가닥을 연결시킬 수 있는 임의의 것일 수 있지만, 단, 가교 모이어티는 막횡단 포어를 통과하는 폴리뉴클레오티드의 이동을 방해하지는 않는다. 적합한 가교 모이어티로는 중합성 링커, 화학 링커, 폴리뉴클레오티드 또는 폴리펩티드를 포함하나, 이에 제한되지는 않는다. 바람직하게, 가교 모이어티는 DNA, RNA, 변형된 DNA (예컨대, 무염기 DNA), RNA, PNA, LNA 또는 폴리에틸렌 글리콜 (PEG)을 포함한다. 가교 모이어티는 더욱 바람직하게 DNA 또는 RNA이다. 가교 모이어티는 하나 이상의 스페이서를 포함할 수 있다.
가교 모이어티는 가장 바람직하게 헤어핀 루프이다. 헤어핀 루프는 상기 논의된 폴리뉴클레오티드 중 임의의 것으로부터 형성될 수 있다. 헤어핀 루프 또는 헤어핀 루프의 루프의 길이는 전형적으로 약 4 내지 약 100개의 뉴클레오티드 길이, 바람직하게, 약 4 내지 약 8개의 뉴클레오티드 길이이다.
가교 모이어티는 관련 기술분야에 공지된 임의의 적합한 수단에 의해 표적 폴리뉴클레오티드의 두 가닥에 연결된다. 가교 모이어티는 별개로 합성되고, 표적 폴리뉴클레오티드에 화학적으로 부착되거나, 또는 효소적으로 결찰될 수 있다. 대안적으로, 가교 모이어티는 표적 폴리뉴클레오티드의 프로세싱에서 생성될 수 있다.
가교 모이어티는 표적 폴리뉴클레오티드의 한쪽 말단에 또는 그 부근에서 표적 폴리뉴클레오티드에 연결된다. 가교 모이어티는 바람직하게 폴리뉴클레오티드의 말단으로부터 10개 이내의 뉴클레오티드 범위 내에서 표적 폴리뉴클레오티드에 연결된다.
하나 이상의 스페이서는 바람직하게 그(들)가 하나 이상의 헬리카제를 정지시키고, 헬리카제가 제어하고자 하거나, 또는 특징 규명하고자 하는 표적 폴리뉴클레오티드를 따라 이동하지 못하게 위치한다. 예를 들어, 하나 이상의 스페이서는 바람직하게 리더 서열과 제어하고자 하거나, 또는 특징 규명하고자 하는 표적 폴리뉴클레오티드 사이에, 예를 들어, 폴리뉴클레오티드의 한쪽 말단의 리더 서열 범위 내에 위치한다. 리더 서열은 전형적으로 인가된 전위로부터 생성된 장을 이용하여 포어에 진입하고, 폴리뉴클레오티드가 포어를 통해 이동함에 따라 하나 이상의 헬리카제는 하나 이상의 스페이서를 지나 이동하게 된다. 이어서, 하나 이상의 헬리카제는 포어를 통과하는 표적 폴리뉴클레오티드의 나머지 부분의 이동을 제어할 수 있고, 그의 특징 규명을 촉진시킬 수 있다.
가장 바람직한 실시양태에서, 표적 폴리뉴클레오티드는 한쪽 말단에서 가교 모이어티, 예컨대, 헤어핀 루프에 의해 연결된 이중 가닥부, 및 리더 서열을 포함하며, 가교 모이어티로부터 나머지 다른 한쪽 말단에 위치하는 단일 가닥부를 포함한다. 하나 이상의 스페이서는 리더 서열 및/또는 가교 모이어티에 존재할 수 있다.
표적 폴리뉴클레오티드는 임의의 적합한 샘플 중에 존재한다. 본 발명은 전형적으로 표적 폴리뉴클레오티드를 함유하는 것으로 공지되어 있거나, 또는 그러할 것으로 의심되는 샘플에 대해 수행된다. 본 발명은 샘플 중 그의 존재가 공지되어 있거나, 또는 예상되는 하나 이상의 표적 폴리뉴클레오티드의 동일성를 확인하기 위한 샘플에 대해 수행될 수 있다.
샘플은 생물학적 샘플일 수 있다. 본 발명은 임의의 유기체 또는 미생물로부터 수득된, 또는 그로부터 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 유기체 또는 미생물은 전형적으로 고세균성, 원핵성 또는 진핵성이고, 전형적으로는 5가지의 계; 식물계, 동물계, 진균계, 모네라계 및 원생 생물계 중 하나에 속한다. 본 발명은 임의의 바이러스로부터 수득된, 또는 그로부터 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 샘플은 바람직하게 유체 샘플이다. 샘플은 전형적으로 환자의 체액을 포함한다. 샘플은 뇨, 림프, 타액, 점액, 또는 양수일 수 있지만, 바람직하게는 혈액, 혈장 또는 혈청이다. 전형적으로, 샘플은 인간 기원의 것이지만, 대안적으로, 또 다른 포유동물로부터의 것, 예컨대, 상업상 사육 동물, 예컨대, 말, 소, 양 또는 돼지로부터의 것일 수 있거나, 또는 대안적으로, 애완동물, 예컨대, 고양이 또는 개로부터의 것일 수 있다. 대안적으로, 식물 기원의 샘플은 전형적으로 상업상 작물, 예컨대, 시리얼, 콩과 식물, 과일 또는 야채, 예를 들어, 밀, 퀴노아, 보리, 귀리, 카놀라, 옥수수, 대두, 쌀, 바나나, 사과, 토마토, 감자, 포도, 담배, 콩, 렌틸, 사탕수수, 코코아, 목화로부터 수득되는 것이다.
샘플은 비생물학적 샘플일 수 있다. 비생물학적 샘플은 바람직하게 유체 샘플이다. 비생물학적 샘플의 예로는 수술 유체, 물, 예컨대, 식수, 해수, 또는 강물 및 실험실 시험용 시약을 포함한다.
샘플은 전형적으로 검정되기 이전에, 예를 들어, 원심분리에 의해 또는 원치 않는 분자 또는 세포, 예컨대, 적혈구를 여과하는 막을 통해 통과시킴으로써 프로세싱된다. 샘플은 채취 즉시 측정될 수 있다. 샘플은 또한 전형적으로는 검정 이전에 바람직하게는 -70℃에서 보관될 수 있다.
스페이서 (들)
하나 이상의 스페이서는 표적 폴리뉴클레오티드에 포함된다. 하나 이상의 스페이서는 바람직하게 표적 폴리뉴클레오티드의 일부이고, 예를 들어, 그(들)는 폴리뉴클레오티드 서열을 방해한다. 하나 이상의 스페이서는 바람직하게 표적 폴리뉴클레오티드에 혼성화된, 하나 이상의 차단 분자, 예컨대, 과속 방지턱의 일부가 아니다.
표적 폴리뉴클레오티드 중 임의 개수의 스페이서, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 스페이서가 존재할 수 있다. 바람직하게, 표적 폴리뉴클레오티드 중 2, 4, 또는 6개의 스페이서가 존재한다. 스페이서는 표적 폴리뉴클레오티드의 상이한 영역에 존재할 수 있고, 예컨대, 스페이서는 리더 서열에 및 스페이서는 헤어핀 루프에 존재할 수 있다.
하나 이상의 스페이서는 각각 하나 이상의 헬리카제기 심지어는 활성 모드에서도 극복하지 못하는 에너지 장벽을 제공한다. 하나 이상의 스페이서는 헬리카제의 견인을 감소시킴으로써 (예를 들어, 표적 폴리뉴클레오티드 중 뉴클레오티드로부터 염기를 제거함으로써), 또는 (예를 들어, 벌키한 화학적 기를 사용하여) 하나 이상의 헬리카제의 이동을 물리적으로 차단함으로써 하나 이상의 헬리카제를 정지시킬 수 있다.
하나 이상의 스페이서는 하나 이상의 헬리카제를 정지시키는 임의의 분자 또는 분자 조합을 포함할 수 있다. 하나 이상의 스페이서는 하나 이상의 헬리카제가 표적 폴리뉴클레오티드를 따라 이동하지 못하도록 막는 임의의 분자 또는 분자 조합을 포함할 수 있다. 하나 이상의 헬리카제가 막횡단 포어 및 인가된 전위의 부재하에서 하나 이상의 스페이서에서 정지되는지 여부를 측정하는 것은 간단하다. 예를 들어, 실시예에 제시된 바와 같이 검정될 수 있다. 예를 들어, 스페이서를 지나 이동하고, DNA의 상보성 가닥을 치환할 수 있는 헬리카제의 능력은 PAGE에 의해 측정될 수 있다.
하나 이상의 스페이서는 전형적으로 선형 분자, 예컨대, 중합체를 포함한다. 하나 이상의 스페이서는 전형적으로 표적 폴리뉴클레오티드와 상이한 구조를 가진다. 예를 들어, 표적 폴리뉴클레오티드가 DNA일 경우, 하나 이상의 스페이서는 전형적으로 DNA가 아니다. 특히, 표적 폴리뉴클레오티드가 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA)일 경우, 하나 이상의 스페이서는 바람직하게 펩티드 핵산 (PNA), 글리세롤 핵산 (GNA), 트레오스 핵산 (TNA), 잠금 핵산 (LNA) 또는 뉴클레오티드 측쇄를 포함하는 합성 중합체를 포함한다.
하나 이상의 스페이서는 바람직하게 하나 이상의 니트로인돌, 예컨대, 하나 이상의 5-니트로인돌, 하나 이상의 이노신, 하나 이상의 아크리딘, 하나 이상의 2-아미노퓨린, 하나 이상의 2-6-디아미노퓨린, 하나 이상의 5-브로모-데옥시우리딘, 하나 이상의 역 티미딘 (역 dT), 하나 이상의 역 디데옥시-티미딘 (ddT), 하나 이상의 디데옥시-시티딘 (ddC), 하나 이상의 5-메틸시티딘, 하나 이상의 5-히드록시메틸시티딘, 하나 이상의 2'-O-메틸 RNA 염기, 하나 이상의 이소-데옥시시티딘 (이소-dC), 하나 이상의 이소-데옥시구아노신 (이소-dG), 하나 이상의 iSpC3 기 (즉, 당 및 염기가 결실된 뉴클레오티드), 하나 이상의 광절단가능한 (PC) 기, 하나 이상의 헥산디올 기, 하나 이상의 스페이서 9 (iSp9) 기, 하나 이상의 스페이서 18 (iSp18) 기, 중합체 또는 하나 이상의 티올 연결부를 포함한다. 하나 이상의 스페이서는 상기 기들의 임의의 조합을 포함할 수 있다. 상기 기 중 다수는 IDT® (인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies)®)로부터 상업적으로 이용가능하다.
하나 이상의 스페이서는 임의 개수의 상기 기를 함유할 수 있다. 예를 들어, 2-아미노퓨린, 2-6-디아미노퓨린, 5-브로모-데옥시우리딘, 역 dT, ddT, ddC, 5-메틸시티딘, 5-히드록시메틸시티딘, 2'-O-메틸 RNA 염기, 이소-dC, 이소-dG, iSpC3 기, PC 기, 헥산디올 기 및 티올 연결부인 경우, 하나 이상의 스페이서는 바람직하게 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과를 포함한다. 하나 이상의 스페이서는 바람직하게 2, 3, 4, 5, 6, 7, 8개 또는 그 초과의 iSp9 기를 포함한다. 하나 이상의 스페이서는 바람직하게 2, 3, 4, 5 또는 6개 또는 그 초과의 iSp18 기를 포함한다. 가장 바람직한 스페이서는 4개의 iSp18 기이다.
중합체는 바람직하게 폴리펩티드 또는 폴리에틸렌 글리콜 (PEG)이다. 폴리펩티드는 바람직하게 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과의 아미노산을 포함한다. PEG는 바람직하게 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과의 단량체 단위를 포함한다.
하나 이상의 스페이서는 바람직하게 하나 이상의 무염기 뉴클레오티드 (즉, 뉴클레오염기가 결실된 뉴클레오티드), 예컨대, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과의 무염기 뉴클레오티드를 포함한다. 뉴클레오염기는 무염기 뉴클레오티드 중 -H(idSp) 또는 -OH에 의해 치환될 수 있다. 무염기 스페이서는 하나 이상의 인접한 뉴클레오티드로부터 뉴클레오염기를 제거함으로써 표적 폴리뉴클레오티드 내로 삽입될 수 있다. 예를 들어, 폴리뉴클레오티드는 3-메틸아데닌, 7-메틸구아닌, 1,N6-에테노아데닌 이노신 또는 히포크산틴을 포함하도록 변형될 수 있고, 뉴클레오염기는 인간 알킬아데닌 DNA 글리코실라제 (hAAG)를 사용하여 상기 뉴클레오티드로부터 제거될 수 있다. 대안적으로, 폴리뉴클레오티드는 우라실을 포함하도록 변형될 수 있고, 뉴클레오염기는 우라실-DNA 글리코실라제 (UDG)를 사용하여 제거될 수 있다. 한 실시양태에서, 하나 이상의 스페이서는 임의의 무염기 뉴클레오티드를 포함하지 않는다.
하나 이상의 헬리카제는 각각의 선형 분자 스페이서에 의해 (즉, 그 앞에서), 또는 그 상에서 정지될 수 있다. 선형 분자 스페이서가 사용될 때, 표적 폴리뉴클레오티드에는 바람직하게, 하나 이상의 헬리카제가 지나서 이동하게 되는 각 스페이서의 말단에 인접한 폴리뉴클레오티드의 이중 가닥 영역이 제공된다. 이중 가닥 영역은 전형적으로 인접한 스페이서 상에서의 하나 이상의 헬리카제의 정지를 돕는다. 이중 가닥 영역(들)의 존재는 특히 본 방법이 염 농도가 약 100 mM 이하일 때 수행되는 경우에 바람직하다. 각 이중 가닥 영역의 길이는 전형적으로 10개 이상, 예컨대, 12개 이상의 뉴클레오티드 길이이다. 본 발명에서 사용되는 표적 폴리뉴클레오티드가 단일 가닥일 경우, 이중 가닥 영역은 더 짧은 폴리뉴클레오티드를 스페이서에 인접한 영역에 혼성화시킴으로써 형성될 수 있다. 더 짧은 폴리뉴클레오티드는 전형적으로 표적 폴리뉴클레오티드와 동일한 뉴클레오티드로부터 형성되지만, 상이한 뉴클레오티드로부터 형성될 수 있다. 예를 들어, 더 짧은 폴리뉴클레오티드는 LNA로부터 형성될 수 있다.
선형 분자 스페이서가 사용되는 경우, 표적 폴리뉴클레오티드에는 바람직하게, 하나 이상의 헬리카제가 지나서 이동하게 되는 말단 반대편의 각 스페이서의 말단에 차단 분자가 제공된다. 이는 확실하게 하나 이상의 헬리카제가 각 스페이서 상에 정지된 상태 그대로 유지될 수 있도록 하는 데 도움을 줄 수 있다. 이는 또한 그(들)가 용액 중에서 확산되는 경우, 표적 폴리뉴클레오티드 상에 하나 이상의 헬리카제를 유지시키는 데 도움을 줄 수 있다. 차단 분자는 하나 이상의 헬리카제를 물리적으로 정지시키는, 하기 논의되는 화학적 기 중 임의의 것일 수 있다. 차단 분자는 폴리뉴클레오티드의 이중 가닥 영역일 수 있다.
하나 이상의 스페이서는 바람직하게 하나 이상의 헬리카제를 물리적으로 정지시키는 하나 이상의 화학적 기를 포함한다. 하나 이상의 화학적 기는 바람직하게 하나 이상의 펜던트 화학적 기. 하나 이상의 화학적 기는 표적 폴리뉴클레오티드 중 하나 이상의 뉴클레오염기에 부착될 수 있다. 하나 이상의 화학적 기는 표적 폴리뉴클레오티드 백본에 부착될 수 있다. 상기 화학적 기는 임의 개수로, 예컨대, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과로 존재할 수 있다. 적합한 기로는 형광단, 스트렙트아비딘 및/또는 비오틴, 콜레스테롤, 메틸렌 블루, 디니트로페놀 (DNP), 디곡시게닌 및/또는 항-디곡시게닌 및 디벤질시클로옥틴 기를 포함하나, 이에 제한되지는 않는다.
표적 폴리뉴클레오티드 중 상이한 스페이서는 상이한 정지 분자를 포함할 수 있다. 예를 들어, 한 스페이서는 상기 논의된 선형 분자 중 하나를 포함할 수 있고, 또 다른 스페이서는 하나 이상의 헬리카제를 물리적으로 정지시키는 하나 이상의 화학적 기를 포함할 수 있다. 스페이서는 상기 논의된 선형 분자 중 하나, 및 하나 이상의 헬리카제를 물리적으로 정지시키는 하나 이상의 화학적 기, 예컨대, 하나 이상의 무염기 및 형광단을 포함할 수 있다.
적합한 스페이서는 표적 폴리뉴클레오티드의 유형, 및 본 발명의 방법이 수행되는 조건에 따라 디자인될 수 있다. 대부분의 헬리카제는 DNA에 결합하여 그를 따라 이동하며, 이로써, DNA가 아닌 임의의 것을 사용하여 정지될 수 있다. 적합한 분자는 상기에 논의된 것이다.
본 발명의 방법은 바람직하게 유리 뉴클레오티드의 존재, 및/또는 헬리카제 보조인자의 존재 하에 수행된다. 이는 하기에서 더욱 상세하게 논의된다. 막횡단 포어 및 인가된 전위의 부재하에서, 하나 이상의 스페이서는 바람직하게 유리 뉴클레오티드의 존재, 및/또는 헬리카제 보조인자의 존재 하에 하나 이상의 헬리카제를 정지시킬 수 있다.
하기 논의되는 바와 같이 본 발명의 방법이 (하나 이상의 헬리카제가 활성 모드이도록) 유리 뉴클레오티드 및 헬리카제 보조인자의 존재 하에 수행되는 경우, 확실하게 하나 이상의 헬리카제가 막횡단 포어와 접촉하기 전 및 전위가 인가되기 전에 표적 폴리뉴클레오티드 상에서 정지되게 하는 데에는 전형적으로 하나 이상의 더 긴 장쇄의 스페이서가 사용된다. 하나 이상의 더 짧은 단쇄의 스페이서는 (하나 이상의 헬리카제가 불활성 모드이도록) 유리 뉴클레오티드 및 헬리카제 보조인자의 부재하에서 사용될 수 있다.
염 농도 또한 하나 이상의 헬리카제를 정지시킬 수 있는 하나 이상의 스페이서의 능력에 영향을 미친다. 막횡단 포어 및 인가된 전위의 부재하에서, 하나 이상의 스페이서는 바람직하게 염 농도 약 100 mM 이하에서 하나 이상의 헬리카제를 정지시킬 수 있다. 본 발명의 방법에서 사용되는 염 농도가 높을수록, 전형적으로 사용되는 하나 이상의 스페이서의 길이는 더 짧아지고, 그 반대의 경우도 그러하다.
특징의 바람직한 조합은 하기 표 1에 제시되어 있다.
[표 1]
Figure pct00001
하기에서 더욱 상세하게 논의되는 바와 같이, 본 방법은 2개 이상의 헬리카제가 스페이서를 지나도록 이동시키는 것에 관한 것이다. 상기 경우에서, 스페이서의 길이는 전형적으로는, 포어 및 인가된 전위의 부재하에서 트레일링 헬리카제가 리딩 헬리카제가 스페이서를 지나도록 인출하지 못하도록 막기 위해서는 증가된다. 본 방법이 2개 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 것에 관한 것인 경우, 상기 논의된 스페이서의 길이는 1.5배 이상, 에서, 2배, 2.5배 또는 3배로 증가될 수 있다. 예를 들어, 본 방법이 2개 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 것에 관한 것인 경우, 상기 표 1의 세번째 칸의 스페이서 길이는 1.5배, 2배, 2,5배 또는 3배로 증가될 수 있다.
2개 이상의 헬리카제는 또한 각각이 그 자체의 하나 이상의 스페이서를 가지도록 이격될 수 있다. 이는 하기에서 더욱 상세하게 논의된다.
헬리카제 (들)
임의의 헬리카제가 본 발명에서 사용될 수 있다. 헬리카제는 Hel308 헬리카제, RecD 헬리카제, 예컨대, TraI 헬리카제 또는 TrwC 헬리카제, XPD 헬리카제 또는 Dda 헬리카제이거나, 또는 그로부터 유래된 것일 수 있다. 헬리카제는 국제 출원 번호 PCT/GB2012/052579 (공보 WO 2013/057495); PCT/GB2012/053274 (공보 WO 2013/098562); PCT/GB2012/053273 (공보 WO2013098561); PCT/GB2013/051925; PCT/GB2013/051924 및 PCT/GB2013/051928; 및 UK 출원 번호 1318464.3 (2013년 10월 18일 출원)에서 개시된, 헬리카제, 변형된 헬리카제 또는 헬리카제 구축물 중 임의의 것일 수 있다.
헬리카제는 바람직하게 서열 17에 제시된 서열 (Trwc Cba) 또는 그의 변이체, 서열 28에 제시된 서열 (Hel308 Mbu) 또는 그의 변이체, 또는 서열 8에 제시된 서열 (Dda) 또는 그의 변이체를 포함한다. 변이체는 막횡단 포어에 대해 하기에 논의되는 방식 중 임의의 것으로 자연 서열과 상이할 수 있다. 서열 8의 바람직한 변이체는 E94C/A360C 및 이어서, (ΔM1)G1G2 (즉, M1 결실, 및 이어서, G1 및 G2 부가)를 포함한다.
본 발명에 따라 임의 개수의 헬리카제가 하나 이상의 스페이서를 지나 이동할 수 있다. 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 헬리카제가 하나 이상의 스페이서를 지나 이동할 수 있다. 일부 실시양태에서, 상이한 개수의 헬리카제가 각 스페이서를 지나 이동할 수 있다. 예를 들어, 2개의 별개의 스페이서를 사용하여 2개의 헬리카제를 정지시키는 경우, 1개의 헬리카제 (제1 헬리카제)는 제1 스페이서를 지나 이동할 수 있지만, 2개의 헬리카제 (제1 및 제2 헬리카제)는 제2 스페이서를 지나 이동할 수 있다.
본 발명의 방법은 바람직하게 2개 이상, 예컨대, 3개 이상 또는 4개 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 것을 포함한다. 2개 이상의 헬리카제는 전형적으로 동일한 헬리카제이다. 2개 이상의 헬리카제는 상이한 헬리카제이다.
2개 이상의 헬리카제는 상기 언급된 헬리카제의 임의의 조합일 수 있다. 2개 이상의 헬리카제는 2개 이상의 Dda 헬리카제일 수 있다. 2개 이상의 헬리카제는 하나 이상의 Dda 헬리카제 및 하나 이상의 TrwC 헬리카제일 수 있다. 2개 이상의 헬리카제는 동일한 헬리카제의 상이한 변이체일 수 있다.
2개 이상의 헬리카제는 바람직하게 서로 부착되어 있다. 2개 이상의 헬리카제는 더욱 바람직하게 서로 공유 부착되어 있다. 헬리카제는 임의의 순서로 및 임의의 방법을 이용하여 부착되어 있을 수 있다. 본 발명에서 사용하는 데 바람직한 헬리카제 구축물은 국제 출원 번호 PCT/GB2013/051925; PCT/GB2013/051924 및 PCT/GB2013/051928; 및 UK 출원 번호 1318464.3 (2013년 10월 18일 출원)에 기술되어 있다.
조건 및 막횡단 포어
본 방법은 포어를 통해 전위를 인가하는 것을 포함한다. 인가된 전위는 전압 전위일 수 있다. 본 방법은 포어를 통해 전압 전위를 인가하는 것을 포함할 수 있다. 본 방법은 포어를 통해 인가되는 전압을 증가시키는 것을 포함할 수 있다. 본 실시양태에서, 초기 전압 전위는 전형적으로는 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 데에는 충분하지 않고, 증가된 전압 전위는 전형적으로 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 데 충분하다. 대안적으로, 인가된 전위는 화학 전위일 수 있다. 그의 예는 양친매성 층을 통한 염 구배를 사용하는 것이다. 염 구배는 문헌 [Holden et al., J Am Chem Soc. 2007 Jul 11;129(27):8650-5]에 개시되어 있다. 일부 경우에서, 포어와 관련하여 표적 폴리뉴클레오티드가 이동함에 따라 포어를 통과하는 전류는 표적 폴리뉴클레오티드의 서열을 결정하는 데 사용된다. 이것이 가닥 서열분석이다.
막횡단 포어는 어느 정도 막을 횡단하는 구조이다. 이는 인가된 전위에 의해 유도된, 수화된 이온이 막을 통해 또는 막 내에서 유동할 수 있도록 허용한다. 막횡단 포어는 전형적으로 전체 막을 횡단하며, 이로써 수화된 이온은 막의 한쪽에서부터 막의 다른 쪽으로 유동할 수 있다. 그러나, 막횡단 포어이 막을 횡단할 필요는 없다. 이는 한쪽 다부에 가깝게 존재할 수 있다. 예를 들어, 포어는 그를 따라 또는 그 내부로 수화된 이온이 유동하는 막 내의 웰일 수 있다.
임의의 막횡단 포어가 본 발명에서 사용될 수 있다. 포어는 생물학적인 것 또는 인공인 것일 수 있다. 적합한 포어로는 단백질 포어, 폴리뉴클레오티드 포어 및 고체 상태 포어를 포함하나, 이에 제한되지는 않는다.
임의의 막이 본 발명에 따라 사용될 수 있다. 적합한 막은 관련 기술분야에 주지되어 있다. 막은 바람직하게 양친매성 층이다. 양친매성 층은 1개 이상의 친수성 부분 및 1개 이상의 친유성 또는 소수성 부분, 둘 모두를 포함하는, 양친매성 분자, 예컨대, 인지질로부터 형성되는 층이다. 양친매성 분자는 합성 분자이거나, 또는 자연적으로 발생된 것일 수 있다. 비-자연적으로 발생된 양친매성 물질 및 단일층을 형성하는 양친매성 물질은 관련 기술분야에 공지되어 있고, 이는 예를 들어, 블록 공중합체를 포함한다 (Gonzalez-Perez et al., Langmuir, 2009. 25, 10447-10450). 블록 공중합체는 2개 이상의 단량체 서브유닛이 함께 중합화되어 단일 중합체 쇄를 생성하는 중합성 물질이다. 블록 공중합체는 전형적으로 각 단량체 서브유닛이 기여하는 특성을 가진다. 그러나, 블록 공중합체는 개별 서브유닛으로부터 형성된 중합체는 가지지 않는 독특한 특성을 가질 수 있다. 블록 공중합체는, 수성 매질 중에 있는 동안 단량체 서브유닛 중 하나는 소수성 (즉, 친유성)이고, 나머지 서브유닛(들)은 친수성이도록 조작될 수 있다. 이러한 경우, 블록 공중합체는 양친매성 특성을 가질 수 있고, 생물학적 막을 모방하는 구조를 형성할 수 있다. 블록 공중합체는 (2개의 단량체 서브유닛으로 이루어진) 디블록일 수 있지만, 이는 또한 2개 초과의 단량체 서브유닛으로부터 구축될 수 있고, 이로써 양친매성 물질로서의 작용하는 더욱 복잡한 배열을 형성할 수 있다. 공중합체는 트리블록, 테트라블록 또는 펜타블록 공중합체일 수 있다.
양친매성 층은 단일층 또는 이중층일 수 있다. 양친매성 층은 전형적으로 평면 지질 이중층 또는 지지형 이중층일 수 있다.
양친매성 층은 전형적으로 지질 이중층이다. 지질 이중층은 세포막 모델이고, 광범위한 실험 연구를 위한 탁월한 플랫폼으로서의 역할을 한다. 예를 들어, 지질 이중층은 단일 채널 기록에 의한 막 단백질에 관한 시험관내 연구에 사용될 수 있다. 대안적으로, 지질 이중층은 다양한 물질의 존재를 검출하기 위한 바이오센서로서 사용될 수 있다. 지질 이중층은 임의의 지질 이중층일 수 있다. 적합한 지질 이중층으로는 평면 지질 이중층, 지지형 이중층 또는 리포솜을 포함하나, 이에 제한되지는 않는다. 지질 이중층은 바람직하게 평면 지질 이중층이다. 적합한 지질 이중층은 국제 출원 번호 PCT/GB08/000563 (공보 WO 2008/102121), 국제 출원 번호 PCT/GB08/004127 (공보 WO 2009/077734) 및 국제 출원 번호 PCT/GB2006/001057 (공보 WO 2006/100484)에 개시되어 있다.
지질 이중층을 형성하는 방법은 관련 기술분야에 공지되어 있다. 적합한 방법은 실시예에 개시되어 있다. 지질 이중층은 보편적으로는, 지질 단일층이 수용액/대기 계면에 수직인 개구의 양측을 지나 상기 계면에서 계속 이어지는, 몬탈(Montal) 및 뮐러(Mueller) (Proc. Natl. Acad. Sci. USA., 1972; 69: 3561-3566)의 방법에 의해 형성된다.
몬탈 및 뮐러의 방법은 단백질 포어를 삽입시키는 데 적합한 우수한 품질의 지질 이중층을 형성할 수 있는 방법으로서 비용면에서 효율적이고, 상대적으로 간단하기 때문에 인기가 많다. 다른 일반적인 이중층 형성 방법으로는 팁-디핑, 이중층 페인팅 및 리포솜 이중층 패치-클램핑을 포함한다.
바람직한 실시양태에서, 지질 이중층은 국제 출원 번호 PCT/GB08/004127 (공보 WO 2009/077734)에 기술된 바와 같이 형성된다.
또 다른 바람직한 실시양태에서, 막은 고체 상태 층이다. 고체 상태 층은 생물학적 기원의 것이 아니다. 다시 말해, 고체 상태 층은 생물학적 환경, 예컨대, 유기체 또는 세포, 또는 합성적으로 제조된 생물학적으로 이용가능한 구조체 버전으로부터 유래된 것이 아니거나, 또는 그로부터 단리된 것이 아니다. 고체 상태 층은 마이크로전자 물질, 절연 물질, 예컨대, 예컨대, Si3N4, Al2O3, 및 SiO를 비롯한, 유기 물질 및 무기 물질, 둘 모두, 유기 및 무기 중합, 예컨대, 폴리아미드, 플라스틱, 예컨대, 테플론(Teflon)® 또는 엘라스토머, 예컨대, 2 성분 부가 경화형 실리콘 곱, 및 유리로부터 형성될 수 있다. 고체 상태 층은 단원자 층, 예컨대, 그래핀, 또는 단지 몇 안되는 원자 두께인 층으로부터 형성될 수 있다. 적합한 그래핀 층은 국제 출원 번호 PCT/US2008/010637 (공보 WO 2009/035647)에 개시되어 있다.
본 방법은 전형적으로 (i) 포어를 포함하는 인공 양친매성 층, (ii) 포어를 포함하는 단리된, 자연적으로 발생된 지질 이중층, 또는 (iii) 그 안에 포어가 삽입되어 있는 세포를 사용하여 수행된다. 본 방법은 전형적으로 인공 양친매성 층, 예컨대, 인공 지질 이중층을 사용하여 수행된다. 층은 포어 이외에도, 다른 막횡단 및/또는 막내 단백질 뿐만 아니라, 다른 분자를 포함할 수 있다. 적합한 장치 및 조건은 하기에서 논의된다. 본 발명의 방법은 전형적으로 시험관내에서 수행된다.
표적 폴리뉴클레오티드는 바람직하게 막에 커플링된다. 이는 임의의 공지된 방법을 이용하여 수행될 수 있다. 막이 양친매성 층, 예컨대, (상기에서 상세하게 논의된 바와 같은) 지질 이중층일 경우, 표적 폴리뉴클레오티드는 바람직하게 막에 존재하는 폴리펩티드를 통해, 또는 막에 존재하는 소수성 앵커를 통해 막에 커플링된다. 소수성 앵커는 바람직하게 지질, 지방산, 스테롤, 탄소 나노튜브 또는 아미노산이다.
표적 폴리뉴클레오티드는 막에 직접 커플링될 수 있다. 이는 국제 출원 번호 PCT/GB2012/051191 (공보 WO 2012/164270)에 개시된 방법들 중 임의의 것을 사용하여 막에 커플링될 수 있다. 표적 폴리뉴클레오티드는 바람직하게 링커를 통해 막에 커플링된다. 바람직한 링커로는 중합체, 예컨대, 폴리뉴클레오티드, 폴리에틸렌 글리콜 (PEG) 및 폴리펩티드를 포함하나, 이에 제한되지는 않는다. 표적 폴리뉴클레오티드가 막에 직접 커플링될 경우, 이때, 막과 포어 및/또는 헬리카제 사이의 거리에 기인하여 특징 규명 실행이 폴리뉴클레오티드 말단으로까지 계속 진행되지 못하기 때문에 일부 데이터는 손실될 것이다. 링커가 사용되는 경우, 이때 표적 폴리뉴클레오티드는 완전하게 프로세싱될 수 있다. 링커가 사용되는 경우, 링커는 표적 폴리뉴클레오티드의 임의의 위치에 부착될 수 있다. 링커는 전형적으로 표적 폴리뉴클레오티드 꼬리 중합체에 부착된다.
커플링은 안정적이거나, 또는 일시적인 것일 수 있다. 특정 적용의 경우, 커플링의 일시적인 성질이 바람직하다. 안정한 커플링 분자가 폴리뉴클레오티드의 5' 또는 3' 말단 중 어느 하나에 직접 부착된다면, 이때, 막과 포어 및/또는 헬리카제 사이의 거리에 기인하여 특징 규명 실행이 폴리뉴클레오티드 말단으로까지 계속 진행되지 못하기 때문에 일부 데이터는 손실될 것이다. 커플링이 일시적인 경우, 이때 커플링된 말단이 무작위적으로 막에 존재하지 않게 되었을 때, 이때 표적 폴리뉴클레오티드는 완전하게 프로세싱될 수 있다. 막과 안정적인 또는 일시적인 결합을 형성하는 화학적 기는 하기에서 더욱 상세하게 논의된다. 폴리뉴클레오티드는 콜레스테롤 또는 지방 아실 쇄를 이용하여 양친매성 층, 예컨대, 지질 이중층에 일시적으로 커플링될 수 있다. 길이가 6 내지 30개의 탄소 원자로 이루어진 임의의 지방 아실 쇄, 예컨대, 헥사데카노산이 사용될 수 있다.
바람직한 실시양태에서, 폴리뉴클레오티드는 양친매성 층에 커플링된다. 폴리뉴클레오티드를 합성 지질 이중층에 커플링시키는 것은 다양한 상이한 테더링 전략법을 이용하여 앞서 수행된 바 있다. 이는 하기 표 2에 요약되어 있다.
[표 2]
Figure pct00002
폴리뉴클레오티드는 합성 반응에서 반응성 기, 예컨대, 티올, 콜레스테롤, 지질 및 비오틴 기의 부가를 위해 쉽게 화합성을 띠는 변형된 포스포르아미다이트를 사용하여 관능화될 수 있다. 상기의 상이한 부착 화학법은 폴리뉴클레오티드에 대한 한 벌의 부착 옵션을 제공한다. 각각의 변형 기는 약간 상이한 방식으로 폴리뉴클레오티드를 테더링하고, 커플링은 항상 영구적인 것은 아니기 때문에, 폴리뉴클레오티드가 막에 존재하는 지속 시간은 상이하다. 일시적인 커플링이 갖는 장점은 상기에서 논의하였다.
폴리뉴클레오티드의 커플링은 또한, 반응성 기가 폴리뉴클레오티드에 부가될 수 있다면 다수의 다른 수단에 의해서도 달성될 수 있다. 반응성 기를 DNA의 말단에 부착시키는 것은 앞서 보고된 바 있다. 폴리뉴클레오티드 키나제 및 ATPγS를 사용하여 티올 기를 ssDNA의 5'에 부가할 수 있다 (Grant, G. P. and P. Z, Qin (2007). "A facile method for attaching nitroxide spin labels at the 5' terminus of nucleic acids." Nucleic Acids Res 35(10): e77). 변형된 올리고클레오티드를 ssDNA의 3'에 도입하는 데 말단 트랜스퍼라제를 사용하여 더욱 다양하게 선택될 수 있는 화학적 기, 예컨대, 비오틴, 티올 및 형광단을 부가할 수 있다 (Kumar, A., P. Tchen, et al. (1988). "Nonradioactive labeling of synthetic oligonucleotide probes with terminal deoxynucleotidyl transferase." Anal Biochem 169(2): 376-82).
대안적으로, 반응성 기는 이미 막에 커플링된 것에 대하여 폴리뉴클레오티드 중 짧은 단쇄 영역인 것으로 간주될 수 있고, 이로써, 부착은 혼성화를 통해 달성될 수 있다. 영역은 폴리뉴클레오티드의 일부이거나, 또는 그에 결찰될 수 있다. T4 RNA 리가제 I를 사용하여 이루어지는 짧은 ssDNA 조각의 결찰은 보고된 바 있다 (Troutt, A. B., M. G. McHeyzer-Williams, et al. (1992). "Ligation-anchored PCR: a simple amplification technique with single-sided specificity." Proc Natl Acad Sci U S A 89(20): 9823-5).
가장 바람직하게, 폴리뉴클레오티드는 폴리뉴클레오티드에 혼성화하는 콜레스테롤 태깅된 폴리뉴클레오티드를 사용하여 막에 커플링된다.
막횡단 포어는 바람직하게 막횡단 단백질 포어이다. 막횡단 단백질 포어는 수화된 이온, 예컨대, 분석물이 막의 한쪽으로부터 막의 나머지 다른 한쪽으로 유동할 수 있도록 허용하는 폴리펩티드 또는 폴리펩티드 집합이다. 본 발명에서, 막횡단 단백질 포어는 인가된 전위에 의해 유도된 수화된 이온이 막의 한쪽으로부터 나머지 다른 한쪽으로 유동할 수 있도록 허용하는 포어를 형성할 수 있다. 막횡단 단백질 포어는 바람직하게 분석물, 예컨대, 뉴클레오티드가 막, 예컨대, 지질 이중층의 한쪽으로부터 나머지 다른 한쪽으로 유동할 수 있도록 허용한다. 막횡단 단백질 포어를 통해 폴리뉴클레오티드 또는 핵산, 예컨대, DNA 또는 RNA는 포어를 통과하여 이동할 수 있다.
막횡단 단백질 포어는 단량체 또는 올리고머일 수 있다. 포어는 바람직하게 수개의 반복 서브유닛, 예컨대, 6, 7, 8 또는 9개의 서브유닛으로 구성된다. 포어는 바람직하게 육량체, 칠량체, 팔량체 또는 구량체 포어이다.
막횡단 단백질 포어는 전형적으로 이동이 그를 통해 유동할 수 있는 것인 장벽 또는 채널을 포함한다. 포어의 서브유닛은 전형적으로 중축을 둘러싸고, 가닥을 막횡단 β 장벽 또는 채널 또는 막횡단 α 나선 번들 또는 채널을 제공한다.
막횡단 단백질 포어의 장벽 또는 채널은 전형적으로 분석물, 예컨대, 뉴클레오티드, 폴리뉴클레오티드 또는 핵산과의 상호작용을 촉진시키는 아미노산을 포함한다. 이러한 아미노산은 바람직하게 장벽 또는 채널의 압축 수렴부 근처에 위치한다. 막횡단 단백질 포어는 전형적으로 하나 이상의 양으로 하전된 아미노산, 예컨대, 아르기닌, 리신 또는 히스티딘, 또는 방향족 아미노산, 예컨대, 티로신 또는 트립토판을 포함한다. 이러한 아미노산은 전형적으로 포어와 뉴클레오티드, 폴리뉴클레오티드 또는 핵산 사이의 상호작용을 촉진시킨다.
본 발명에 따라 사용하기 위한 막횡단 단백질 포어는 β 장벽 포어 또는 α 나선 번들 포어로부터 유도될 수 있다. β 장벽 포어는 β 가닥으로부터 형성되는 장벽 또는 채널을 포함한다. 적합한 β 장벽 포어로는 β 독소, 예컨대, α 헤몰리신, 탄저균 독소 및 류코시딘, 및 박테리아의 외막 단백질/포린, 예컨대, 미코박테리움 스메그마티스(Mycobacterium smegmatis) 포린 (Msp), 예를 들어, MspA, MspB, MspC 또는 MspD, 리세닌, 외막 포린 F (OmpF), 외막 포린 G (OmpG), 외막 포스포리파제 A 및 나이세리아(Neisseria) 자가수송체 지단백질 (NalP)을 포함하나, 이에 제한되지는 않는다. α 나선 번들 포어는 α 나선으로부터 형성되는 장벽 또는 채널을 포함한다. 적합한 α 나선 번들 포어로는 내막 단백질 및 외막 단백질, 예컨대, WZA 및 ClyA 독소를 포함하나, 이에 제한되지는 않는다. 막횡단 포어는 리세닌으로부터 유래될 수 있다. 리세닌으로부터 유래된 적합한 포어는 국제 출원 번호 PCT/GB2013/050667 (공보 WO 2013/153359)에 개시되어 있다. 막횡단 포어는 Msp로부터 또는 α 헤몰리신 (α-HL)으로부터 유래될 수 있다.
막횡단 단백질 포어는 바람직하게 Msp로부터, 바람직하게, MspA로부터 유래된다. 상기 포어는 올리고머가 될 것이며, 전형적으로는 Msp로부터 유래된 7, 8, 9 또는 10개의 단량체를 포함한다. 포어는 동일한 단량체를 포함하는, Msp로부터 유래된 동종올리고머 포어일 수 있다. 대안적으로, 포어는 나머지 다른 것과 상이한 1개 이상의 단량체를 포함하는, Msp로부터 유래된 이종올리고머 포어일 수 있다. 바람직하게, 포어는 MspA, 또는 그의 호모로그 또는 파라로그로부터 유래된 것이다.
Msp로부터 유래된 단량체는 전형적으로 서열 2에 제시된 서열 또는 그의 변이체를 포함한다. 서열 2는 MspA 단량체의 MS-(B1)8 돌연변이체이다. 이는 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다. 서열 2의 변이체는 서열 2와 다르고, 포어를 형성할 수 있는 그의 능력은 유지하는 아미노산 서열을 갖는 폴리펩티드이다. 포어를 형성할 수 있는 변이체의 능력은 관련 기술분야에 공지된 임의의 방법을 이용하여 검정될 수 있다. 예를 들어, 변이체는 다른 적절한 서브유닛을 따라 양친매성 층 내로 삽입될 수 있고, 중합화하여 포어를 형성할 수 있는 그의 능력은 측정될 수 있다. 서브유닛을 막, 예컨대, 양친매성 층 내로 삽입하는 방법은 관련 기술분야에 공지되어 있다. 예를 들어, 서브유닛은 지질 이중층을 함유하는 용액 중 정제된 형태로 현탁될 수 있고, 이로써, 서브유닛이 지질 이중층으로 확산되고, 지질 이중층에의 결합 및 기능성 상태로의 조립에 의해 삽입된다. 대안적으로, 서브유닛은 문헌 [M.A. Holden, H. Bayley. J. Am. Chem. Soc. 2005, 127, 6502-6503] 및 국제 출원 번호 PCT/GB2006/001057 (공보 WO 2006/100484)에 기술된, "픽 앤 플레이스(pick and place)" 방법을 이용하여 막으로 직접 삽입될 수 있다.
서열 2의 아미노산 서열의 전장에 걸쳐, 변이체는 바람직하게 아미노산 동일성에 기초하여 상기 서열과 50% 이상 상동성일 것이다. 더욱 바람직하게, 변이체는 아미노산 동일성에 기초하여 전체 서열에 걸쳐 서열 2의 아미노산 서열과 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 더욱 바람직하게, 95%, 97% 또는 99% 이상 상동성일 수 있다. 100개 이상, 예를 들어, 125, 150, 175 또는 200개 또는 그 초과의 인접한 아미노산으로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85%, 90% 또는 95% 이상의 아미노산 동일성을 가질 수 있다 ("엄격한(hard) 상동성").
상동성을 측정하는 데 관련 기술분야의 표준 방법이 사용될 수 있다. 예를 들어, UWGCG 패키지는, 상동성을 계산하는 데, 예를 들어, 그의 디폴트 설정 환경에서 사용될 수 있는 BESTFIT 프로그램을 제공한다 (Devereux et al., (1984) Nucleic Acids Research 12, p387-395). PILEUP 및 BLAST 알고리즘은 예를 들어, 문헌 [Altschul S. F. (1993) J Mol Evol 36:290-300]; [Altschul, S.F et al., (1990) J Mol Biol 215:403-10]에 기술된 바와 같이, 상동성을 계산하는 데 또는 서열을 정렬하는 데 (예컨대, (전형적으로 그의 디폴드 설정 환경에서) 등가인 잔기 또는 상응하는 서열을 확인하는 데) 사용될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물 공학 정보 센터(National Center for Biotechnology Information)를 통해 공개적으로 이용가능하다 (http://www.ncbi.nlm.nih.gov/).
서열 2는 MspA 단량체의 MS-(B1)8 돌연변이체이다. 변이체는 MspA와 비교하여 MspB, C 또는 D 단량체에 돌연변이 중 임의의 것을 포함할 수 있다. 성숙한 형태의 MspB, C 및 D는 서열 5 내지 7에 제시되어 있다. 특히, 변이체는 MspB 중에 존재하는 하기 치환을 포함할 수 있다: A138P. 변이체는 MspC 중에 존재하는 하기 치환 중 하나 이상의 것을 포함할 수 있다: A96G, N102E 및 A138P. 변이체는 MspD 중에 존재하는 하기 치환 중 하나 이상의 것을 포함할 수 있다: G1 결실, L2V, E5Q, L8V, D13G, W21A, D22E, K47T, I49H, I68V, D91G, A96Q, N102D, S103T, V104I, S136K 및 G141A. 변이체는 Msp B, C 및 D로부터의 돌연변이 및 치환 중 하나 이상의 것의 조합을 포함할 수 있다. 변이체는 바람직하게 돌연변이 L88N을 포함한다. 서열 2의 변이체는 MS-(B1)8의 모든 돌연변이 이외에도 돌연변이 L88N을 가지며, 이는 MS-(B2)8로 명명된다. 본 발명에서 사용되는 포어는 바람직하게 MS-(B2)8이다. 추가로 바람직한 변이체는 돌연변이 G75S/G77S/L88N/Q126R을 포함한다. 서열 2의 변이체는 MS-(B1)8의 모든 돌연변이 이외에도 돌연변이 G75S/G77S/L88N/Q126R을 가지며, 이는 MS-(B2C)8로 명명된다. 본 발명에서 사용되는 포어는 바람직하게 MS-(B2)8 또는 MS-(B2C)8이다.
상기 논의된 것 이외에도, 서열 2의 아미노산 서열에 대하여 아미노산 치환, 예를 들어, 최대 1, 2, 3, 4, 5, 10, 20 또는 30개의 치환이 이루어질 수 있다. 보존적 치환은 아미노산을, 화학 구조가 유사한, 화학적 특성이 유사한, 또는 측쇄 부피가 유사한 다른 아미노산으로 대체한다. 도입되는 아미노산은 그가 대체하는 아미노산과 유사한 극성, 친수성, 소수성, 염기도, 산도, 중성도 또는 전하를 가질 수 있다. 대안적으로, 보존적 치환은 기존 방향족 또는 지방족 아미노산 대신 방향족 또는 지방족인 또 다른 아미노산을 도입할 수 있다. 보존적 아미노산 변이는 관련 기술분야에 주지되어 있고, 이는 하기 표 3에 정의된 바와 같은 20종의 주요 아미노산의 특성에 따라 선택될 수 있다. 아미노산이 유사한 극성을 가질 경우, 이는 또한 하기 표 4의 아미노산 측쇄에 대한 소수친수성(hydropathy) 등급을 참조로 하여 결정될 수 있다.
[표 3]
아미노산의 화학적 특성
Figure pct00003
[표 4]
소수친수성 등급
Figure pct00004
서열 2의 서열의 하나 이상의 아미노산 잔기는 추가로 상기 기술된 폴리펩티드로부터 결실될 수 있다. 최대 1, 2, 3, 4, 5, 10, 20 또는 30개 또는 그 초과의 잔기가 결실될 수 있다.
변이체는 서열 2의 단편을 포함할 수 있다. 상기 단편은 포어 형성 활성을 유지한다. 단편의 길이는 50, 100, 150 또는 200개 이상의 아미노산 길이일 수 있다. 상기 단편은 포어를 제조하는 데 사용될 수 있다. 단편은 바람직하게 서열 2의 포어 형성 도메인을 포함한다. 단편은 서열 2의 잔기 88, 90, 91, 105, 118 및 134 중 하나를 포함하여야 한다. 전형적으로, 단편은 서열 2의 잔기 88, 90, 91, 105, 118 및 134 모두를 포함한다.
하나 이상의 아미노산은 대안적으로 또는 추가로 상기 기술된 폴리펩티드에 부가될 수 있다. 신장부는 서열 2 또는 그의 폴리펩티드 변이체 또는 단편의 아미노산 서열의 아미노 말단 또는 카르복시 말단에 제공될 수 있다. 신장부는 매우 짧은 단쇄일 수 있고, 예를 들어, 길이는 1 내지 10개의 아미노산 길이일 수 있다. 대안적으로, 신장부는 더 긴 장쇄일 수 있고, 예를 들어, 최대 50 또는 100개의 아미노산일 수 있다. 캐리어 단백질은 본 발명에 따라 아미노산 서열에 융합될 수 있다. 다른 융합 단백질은 하기에서 더욱 상세하게 논의된다.
상기에서 논의된 바와 같이, 변이체는 서열 2의 것과는 다른 아미노산 서열을 가지고, 그의 포어를 형성할 수 있는 능력을 갖는 폴리펩티드이다. 변이체는 전형적으로 포어 형성을 담당하는 서열 2의 영역을 함유한다. β 장벽을 함유하는 Msp의 포어 형성 능력은 각 서브유닛 중의 β 시트에 의해 제공된다. 서열 2의 변이체는 전형적으로 β 시트를 형성하는, 서열 2 중의 영역을 포함한다. 생성된 변이체가 포어를 형성할 수 있는 그의 능력을 유지하는 한, β 시트를 형성하는, 서열 2 중의 영역에 대하여 하나 이상의 변형이 이루어질 수 있다. 서열 2의 변이체는 바람직하게 그의 α 나선 및/또는 루프 영역 내에 하나 이상의 변형, 예컨대, 치환, 부가 또는 결실을 포함한다.
Msp로부터 유래된 단량체는 그의 확인 또는 정제를 돕기 위해, 예를 들어, 히스티딘 잔기 (his 태그), 아스파르트산 잔기 (asp 태그), 스트렙트아비딘 태그 또는 플래그 태그의 부가에 의해, 또는 폴리펩티드가 자연적으로 하기 신호 서열을 함유하지 않는 세포로부터 그의 분비를 촉진시키는 신호 서열의 부가에 의해 변형될 수 있다. 유전자 태그를 도입하는 대안은 포어 상의 자연 또는 조작된 위치 상에서 태그를 화학적으로 반응시키는 것이다. 그의 일례는 포어 바깥쪽에서 조작된 시스테인에 대하여 겔 이동 시약을 반응시키는 것이 될 것이다. 이는 헤몰리신 이종올리고머를 분리시키는 방법으로서 입증되었다 (Chem Biol. 1997 Jul; 4(7):497-505).
Msp로부터 유래된 단량체는 시현 표지로 표지화될 수 있다. 시현 표지는 포어가 검출될 수 있도록 하는 임의의 적합한 표지일 수 있다. 적합한 표지는 하기 기술된다.
Msp로부터 유래된 단량체는 또한 D-아미노산을 사용하여 제조될 수 있다. 예를 들어, Msp로부터 유래된 단량체는 L-아미노산 및 D-아미노산의 혼합물을 포함할 수 있다. 이는 관련 기술분야에서 상기 단백질 또는 펩티드를 제조하는 데 통상적인 것이다.
Msp로부터 유래된 단량체는 뉴클레오티드 구별을 촉진시키기 위해 하나 이상의 특이적인 변형을 함유한다. Msp로부터 유래된 단량체는 또한 포어 형성을 하지 않는 한, 다른 비특이적인 변형을 함유할 수 있다. 다수의 비특이적인 측쇄 변형은 관련 기술분야에 공지되어 있고, Msp로부터 유래된 단량체의 측쇄에 대해 상기와 같은 변형이 이루어질 수 있다. 그러한 변형으로는 예를 들어, 알데히드와 반응시킨 후, NaBH4로 환원시키는 아미노산의 환원적 알킬화, 메틸아세트이미데이트에 의한 아미딘화 또는 아세트산 무수물에 의해 아실화를 포함한다.
Msp로부터 유래된 단량체는 관련 기술분야에 공지된 표준 방법을 이용하여 제조될 수 있다. Msp로부터 유래된 단량체는 합성적으로 또는 재조합 수단에 의해 제조될 수 있다. 예를 들어, 포어는 시험관내 번역 및 전사 (IVTT)에 의해 합성될 수 있다. 포어를 제조하는 데 적합한 방법은 국제 출원 번호 PCT/GB09/001690 (공보 WO 2010/004273), PCT/GB09/001679 (공보 WO 2010/004265) 또는 PCT/GB10/000133 (공보 WO 2010/086603)에서 논의된 바와 있다. 포어를 막 내로 삽입하는 방법이 논의된다.
막횡단 단백질 포어는 또한 바람직하게 α-헤몰리신 (α-HL)으로부터 유래된다. 야생형 α-HL 포어는 7개의 동일한 단량체 또는 서브유닛으로 형성된다 (즉, 이는 칠량체성을 띤다). α-헤몰리신-NN의 한 단량체 또는 서브유닛의 서열은 서열 4에 제시되어 있다. 막횡단 단백질 포어는 바람직하게 , 각각이 서열 4 또는 그의 변이체에 제시된 서열을 포함하는 것인, 7개의 단량체를 포함한다. 서열 4의 아미노산 1, 7 내지 21, 31 내지 34, 45 내지 51, 63 내지 66, 72, 92 내지 97, 104 내지 111, 124 내지 136, 149 내지 153, 160 내지 164, 173 내지 206, 210 내지 213, 217, 218, 223 내지 228, 236 내지 242, 262 내지 265, 272 내지 274, 287 내지 290 및 294가 루프 영역을 형성한다. 서열 4의 잔기 113 내지 147이 α-HL의 장벽 또는 채널의 압축 수렴부의 일부를 형성한다.
상기 실시양태에서, 각각이 서열 4에 제시된 서열 또는 그의 변이체를 포함하는, 7개의 단백질 또는 단량체를 포함하는 포어가 바람직하게 본 발명의 방법에서 사용된다. 7개의 단백질은 동일하거나 (동종칠량체) 또는 상이할 수 있다 (이종칠량체).
서열 4의 변이체는 서열 4의 것과는 다른 아미노산 서열을 가지고, 그의 포어를 형성할 수 있는 능력을 유지하는 단백질이다. 포어를 형성할 수 있는 변이체의 능력은 관련 기술분야에 공지된 임의의 방법을 이용하여 검정될 수 있다. 예를 들어, 변이체는 임의의 적절한 서브유닛과 함께 양친매성 층, 예컨대, 지질 이중층 내로 삽입될 수 있고, 올리고머화하여 포어를 형성할 수 있는 그의 능력이 측정될 수 있다. 양친매성 층, 예컨대, 지질 이중층 내로 서브유닛을 삽입하는 방법은 관련 기술분야에 공지되어 있다. 적합한 방법은 상기에서 논의된 바와 같다.
변이체는 헬리카제에의 공유 부착 또는 그와의 상호작용을 촉진시키는 변형을 포함할 수 있다. 변이체는 바람직하게 헬리카제에의 부착을 촉진시키는 하나 이상의 반응성 시스테인 잔기를 포함한다. 예를 들어, 변이체는 서열 4의 8, 9, 17, 18, 19, 44, 45, 50, 51, 237, 239 ? 287번 위치 중 하나 이상에서 및/또는 아미노 또는 카르복시 말단 상에 시스테인을 포함할 수 있다. 바람직한 변이체는 서열 4의 8, 9, 17, 237, 239 및 287번 위치의 잔기를 시스테인으로 치환하는 것 (A8C, T9C, N17C, K237C, S239C 또는 E287C)을 포함한다. 변이체는 바람직하게 국제 출원 번호 PCT/GB09/001690 (공보 WO 2010/004273), PCT/GB09/001679 (공보 WO 2010/004265) 또는 PCT/GB 10/000133 (공보 WO 2010/086603)에 기술된 변이체 중 어느 하나이다.
변이체는 또한 뉴클레오티드와의 임의의 상호작용을 촉진시키는 변형을 포함할 수 있다.
변이체는 유기체에 의해, 예를 들어, 스타필로코쿠스(Staphylococcus) 박테리아에 의해 자연적으로 발현되는, 자연적으로 발생된 변이체일 수 있다. 대안적으로, 변이체는 박테리아에 의해, 예컨대, 에스케리키아 콜라이(Escherichia coli)에 의해 시험관내에서 또는 재조합적으로 발현될 수 있다. 변이체는 또한 재조합 기술에 의해 제조된 비자연적으로 발생된 변이체를 포함한다. 서열 4의 아미노산 서열의 전장에 걸쳐, 변이체는 바람직하게 아미노산 동일성에 기초하여 상기 서열과 50% 이상 상동성일 것이다. 더욱 바람직하게, 변이체 폴리펩티드는 전체 서열에 걸쳐 서열 4의 아미노산 서열과 아미노산 동일성에 기초하여 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 및 더욱 바람직하게, 95%, 97% 또는 99% 이상 상동성일 수 있다. 200개 이상, 예를 들어, 230, 250, 270 또는 280개 또는 그 초과의 것으로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85%, 90% 또는 95% 이상의 아미노산 동일성을 가질 수 있다 ("엄격한 상동성"). 상동성은 상기 논의된 바와 같이 측정될 수 있다.
상기 논의된 것 이외에도 서열 4의 아미노산 서열에 대하여 아미노산 치환, 예를 들어, 최대 1, 2, 3, 4, 5, 10, 20 또는 30개 또는 그 초과의 치환이 이루어질 수 있다. 보존적 치환은 상기 논의된 바와 같이 이루어질 수 있다.
서열 4의 아미노산 서열의 하나 이상의 아미노산 잔기는 추가로 상기 기술된 폴리펩티드로부터 결실될 수 있다. 최대 1, 2, 3, 4, 5, 10, 20 또는 30개 또는 그 초과의 잔기가 결실될 수 있다.
변이체는 서열 4의 단편일 수 있다. 상기 단편은 포어 형성 활성을 유지한다. 단편의 길이는 50, 100, 200 또는 250개 이상의 아미노산 길이일 수 있다. 단편은 바람직하게 서열 4의 포어 형성 도메인을 포함한다. 단편은 전형적으로 서열 4의 잔기 119, 121, 135, 113 및 139를 포함한다.
하나 이상의 아미노산은 대안적으로 또는 추가로 상기 기술된 폴리펩티드에 부가될 수 있다. 신장부는 서열 4 또는 그의 변이체 또는 단편의 아미노산 서열의 아미노 말단 또는 카르복시 말단에 제공될 수 있다. 신장부는 매우 짧은 단쇄일 수 있고, 예를 들어, 길이는 1 내지 10개의 아미노산 길이일 수 있다. 대안적으로, 신장부는 더 긴 장쇄일 수 있고, 예를 들어, 최대 50 또는 100개의 아미노산일 수 있다. 캐리어 단백질은 포어 또는 변이체에 융합될 수 있다.
상기에서 논의된 바와 같이, 서열 4의 변이체는 서열 4의 것과는 다른 아미노산 서열을 가지고, 그의 포어를 형성할 수 있는 능력을 갖는 서브유닛이다. 변이체는 전형적으로 포어 형성을 담당하는 서열 4의 영역을 함유한다. β 장벽을 함유하는 α-HL의 포어 형성 능력은 각 서브유닛 중의 β 가닥에 의해 제공된다. 서열 4의 변이체는 전형적으로 β 가닥을 형성하는, 서열 4 중의 영역을 포함한다. β 가닥을 형성하는 서열 4의 아미노산은 상기에서 논의된 바와 같다. 생성된 변이체가 포어를 형성할 수 있는 그의 능력을 유지하는 한, β 가닥을 형성하는, 서열 4 중의 영역에 대하여 하나 이상의 변형이 이루어질 수 있다. 서열 4의 β 가닥 영역에 대하여 이루어질 수 있는 구체적인 변형은 상기에서 논의된 바와 같다.
서열 4의 변이체는 바람직하게 그의 α 나선 및/또는 루프 영역 내에 하나 이상의 변형, 예컨대, 치환, 부가 또는 결실을 포함한다. α-나선 및 루프를 형성하는 아미노산은 상기 논의되어 있다.
변이체는 상기 논의된 바와 같이 그의 확인 또는 정제를 돕기 위해 변형될 수 있다.
α-HL로부터 유래된 포어는 Msp로부터 유래된 포어를 참조로 하여 상기 논의된 바와 같이 제조될 수 있다.
일부 실시양태에서, 막횡단 단백질 포어는 화학적으로 변형된다. 포어는 임의의 방식으로 및 임의의 부위에서 화학적으로 변형될 수 있다. 막횡단 단백질 포어는 바람직하게 분자의 하나 이상의 시스테인 (시스테인 연결부)에의 부착에 의해, 분자의 하나 이상의 리신에의 부착에 의해, 분자의 하나 이상의 비자연 아미노산에의 부착에 의해, 에피토프의 효소적 변형에 의해, 또는 말단 변형에 의해 화학적으로 변형된다. 상기 변형을 수행하는 데 적합한 방법은 관련 기술분야에 주지되어 있다. 막횡단 단백질 포어는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 포어는 염료 또는 형광단의 부착에 의해 화학적으로 변형될 수 있다.
포어 중 임의 개수의 단량체가 화학적으로 변형될 수 있다. 하나 이상의, 예컨대, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 단량체는 바람직하게 상기 논의된 바와 같이 화학적으로 변형된다.
시스테인 잔기의 반응성은 인접한 잔기의 변형에 의해 증진될 수 있다. 예를 들어, 측면에 위치하는 아르기닌, 히스티딘 또는 리신 잔기의 염기성 기는 시스테인 티올 기의 pKa를 반응성이 더 큰 S- 기의 것으로 변화시킬 것이다. 시스테인 잔기의 반응성은 티올 보호기, 예컨대, dTNB에 의해 보호될 수 있다. 이는 링커 부착 이전에 포어의 하나 이상의 시스테인 잔기와 반응할 수 있다.
국제 출원 번호 PCT/GB09/001690 (공보 WO 2010/004273), PCT/GB09/001679 (공보 WO 2010/004265) 또는 PCT/GB10/000133 (공보 WO 2010/086603)에 개시된 바와 같이, (포어가 화학적으로 변형된 것인) 분자는 포어에 직접 부착될 수 있거나, 링커를 통해 부착될 수 있다.
헬리카제는 포어에 공유 부착될 수 있다. 헬리카제는 바람직하게 포어에 공유 부착되지 않는다.
본원에 기술된 단백질 중 임의의 것은 그의 확인 또는 정제를 돕기 위해, 예를 들어, 히스티딘 잔기 (his 태그), 아스파르트산 잔기 (asp 태그), 스트렙트아비딘 태그 또는 플래그 태그, SUMO 태그, GST 태그 또는 MBP 태그의 부가에 의해, 또는 폴리펩티드가 자연적으로 하기 신호 서열을 함유하지 않는 세포로부터 그의 분비를 촉진시키는 신호 서열의 부가에 의해 변형될 수 있다. 유전자 태그를 도입하는 대안은 헬리카제 또는 포어 상의 자연 또는 조작된 위치 상에서 태그를 화학적으로 반응시키는 것이다. 그의 일례는 포어 바깥쪽에서 조작된 시스테인에 대하여 겔 이동 시약을 반응시키는 것이 될 것이다. 이는 헤몰리신 이종올리고머를 분리시키는 방법으로서 입증되었다 (Chem Biol. 1997 Jul; 4(7):497-505).
표적 폴리뉴클레오티드, 헬리카제 또는 포어는 시현 표지로 표지화될 수 있다. 시현 표지는 검출될 수 있는 임의의 적합한 표지일 수 있다. 적합한 표지로는 형광성 분자, 방사성 동위 원소, 예컨대, 125I,35S, 효소, 항체, 항원, 폴리뉴클레오티드 및 리간드, 예컨대, 비오틴을 포함하나, 이에 제한되지는 않는다.
단백질은 합성적으로 또는 재조합 수단에 의해 제조될 수 있다. 예를 들어, 단백질은 시험관내 번역 및 전사 (IVTT)에 의해 합성될 수 있다. 단백질의 아미노산 서열은 비자연적으로 발생된 아미노산을 포함하도록, 또는 단백질의 안정성을 증가시키도록 변형될 수 있다. 단백질이 합성 수단에 의해 제조될 때, 상기 아미노산은 제조되는 동안 도입될 수 있다. 단백질은 또한 합성 또는 재조합 제조 이후에 변경될 수 있다.
단백질은 또한 D-아미노산을 사용하여 제조될 수 있다. 예를 들어, 포어 또는 헬리카제는 L-아미노산 및 D-아미노산의 혼합물을 포함할 수 있다. 이는 관련 기술분야에서 단백질 또는 펩티드를 제조하는 데 있어 통상적인 것이다.
본 발명에서 사용되는 단백질은 또한 단백질의 기능을 방해하지 않는 한, 다른 비특이 변형을 포함할 수 있다. 다수의 비특이 측쇄 변형이 관련 기술분야에 공지되어 있고, 단백질(들)의 측쇄에 대해 변형이 이루어질 수 있다. 그러한 변형으로는 예를 들어, 알데히드와 반응시킨 후, NaBH4로 환원시키는 환원적 알킬화, 메틸아세트이미데이트에 의한 아미딘화 또는 아세트산 무수물에 의해 아실화를 포함한다.
단백질을 코딩하는 폴리뉴클레오티드 서열은 관련 기술분야의 표준 방법을 이용하여 유래될 수 있고, 복제될 수 있다. 단백질을 코딩하는 폴리뉴클레오티드 서열은 관련 기술분야의 표준 기법을 사용하여 박테리아 숙주 세포에서 발현시킬 수 있다. 단백질은 재조합 발현 벡터로부터의 폴리펩티드의 계내 발현에 의해 세포에서 제조될 수 있다. 발현 벡터는 임의적으로 폴리펩티드의 발현을 제어하는 유도성 프로모터를 보유한다. 이러한 방법은 문헌 [Sambrook, J. and Russell, D. (2001). Molecular Cloning: A Laboratory Manual, 3rd Edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY]에 기술되어 있다.
관심 서열을 코딩하는 유전자는 특이 프라이머를 포함하는 PCR을 사용하여 증폭시킬 수 있다. 이어서, 증폭된 서열을 재조합 복제가능한 벡터, 예컨대, 클로닝 벡터 내로 도입할 수 있다. 벡터는 화합성인 숙주 세포에서 폴리뉴클레오티드를 복제시키는 데 사용될 수 있다. 따라서, 폴리뉴클레오티드 서열은 관심 서열을 코딩하는 폴리뉴클레오티드를 복제가능한 벡터 내로 도입하고, 벡터를 화합성인 숙주 세포 내로 도입하고, 벡터를 복제시키는 조건하에서 숙주 세포를 성장시킴으로써 제조될 수 있다. 벡터를 숙주 세포로부터 회수할 수 있다. 폴리뉴클레오티드를 클로닝하는 데 적합한 숙주 세포는 관련 기술분야에 공지되어 있고, 이는 하기에서 더욱 상세하게 기술된다.
폴리뉴클레오티드 서열을 적합한 발현 벡터로 클로닝할 수 있다. 발현 벡터에서, 폴리뉴클레오티드 서열은 전형적으로 숙주 세포에 의해 코딩 서열을 발현시킬 수 있는 제어 서열에 작동가능하게 연결된다. 상기 발현 벡터를 사용하여 구축물을 발현시킬 수 있다.
"작동가능하게 연결된"이라는 용어는 기술된 성분이 그가 의도하는 방식으로 작용할 수 있도록 허용하는 관계에 있는 것인 병렬 배치를 의미한다. 코딩 서열에 "작동가능하게 연결된" 제어 서열은 코딩 서열의 발현이 제어 서열과 화합성인 조건하에서 달성될 수 있도록 하는 방식으로 결찰된다. 다중 카피수의 동일하거나 상이한 폴리뉴클레오티드가 벡터 내로 도입될 수 있다.
이어서, 발현 벡터는 적합한 숙주 세포 내로 도입될 수 있다. 따라서, 구축물은 구축물을 코딩하는 폴리뉴클레오티드 서열을 발현 벡터 내로 삽입하고, 벡터를 화합성인 박테리아 숙주 세포 내로 도입하고, 폴리뉴클레오티드 서열을 발현시키는 조건하에서 숙주 세포를 성장시킴으로써 제조될 수 있다.
벡터는 예를 들어, 복제 기점, 임의적으로 상기 폴리뉴클레오티드 서열 의 발현을 위한 프로모터, 및 임의적으로 프로모터의 조절 인자가 장착된 플라스미드, 바이러스 또는 파지 벡터일 수 있다. 벡터는 하나 이상의 선별가능한 마커 유전자, 예를 들어, 암피실린 저항성 유전자를 하?할 수 있다. 프로모터 및 다른 발현 조절 신호는 발현 벡터의 디자인 대상이 되는 숙주 세포와 화합성인 것으로 선택될 수 있다. T7, trc, lac, ara 또는 λL 프로모터가 전형적으로 사용된다.
숙주 세포는 전형적으로 구축물을 고수준으로 발현한다. 폴리뉴클레오티드 서열로 형질전환된 숙주 세포는 세포를 형질전환시키는 데 사용된 발현 벡터와 화합성인 것으로 선택될 것이다. 숙주 세포는 전형적으로 박테리아 세포 및 바람직하게 E. 콜라이(E. coli) 세포이다. λ DE3 리소겐을 포함하는 임의의 세포, 예를 들어, Rosetta2(DE3)pLys, C41 (DE3), BL21 (DE3), JM109 (DE3), B834 (DE3), TUNER, Origami 및 Origami B가 T7 프로모터를 포함하는 벡터를 발현시킬 수 있다.
단백질은 단백질 생산 유기체로부터 임의의 단백질 액체 크로마토그래피 시스템에 의한 정제 후, 또는 재조합 발현 후에 대규모로 제조될 수 있다. 전형적인 단백질 액체 크로마토그래피 시스템으로는 FPLC, AKTA 시스템, 바이오-캐드(Bio-Cad) 시스템, 바이오-래드 바이오로직(Bio-Rad BioLogic) 시스템 및 길슨(Gilson) HPLC 시스템을 포함한다.
본 발명의 방법은 표적 폴리뉴클레오티드의 하나 이상의 특징을 측정하는 단계를 포함한다. 본 방법은 표적 폴리뉴클레오티드의 2, 3, 4, 또는 5개 또는 그 초과의 특징을 측정하는 단계를 포함할 수 있다. 하나 이상의 특징은 바람직하게 (i) 표적 폴리뉴클레오티드의 길이, (ii) 표적 폴리뉴클레오티드의 동일성, (iii) 표적 폴리뉴클레오티드의 서열, (iv) 표적 폴리뉴클레오티드의 2차 구조, 및 (v) 표적 폴리뉴클레오티드의 변형 여부로부터 선택된다. (i) 내지 (v)의 임의 조합이 본 발명에 따라 측정될 수 있다.
(i)의 경우, 표적 폴리뉴클레오티드의 길이는 예를 들어, 표적 폴리뉴클레오티드 및 포어 사이의 상호작용 회수, 또는 표적 폴리뉴클레오티드 및 포어 사이의 상호작용 지속 기간을 측정함으로써 측정될 수 있다.
(ii)의 경우, 폴리뉴클레오티드의 동일성는 다수의 방식으로 측정될 수 있다. 폴리뉴클레오티드의 동일성는 표적 폴리뉴클레오티드의 서열을 측정하면서 함께, 또는 표적 폴리뉴클레오티드의 서열을 측정하지 않으면서 측정될 수 있다. 전자의 경우가 간단하다; 폴리뉴클레오티드를 서열분석함으로써 확인한다. 후자는 여러 방식으로 수행될 수 있다. 예를 들어, 폴리뉴클레오티드 중 특정 모티프의 존재를 (폴리뉴클레오티드의 남은 서열은 측정하지 않고) 측정될 수 있다. 대안적으로, 본 방법에서 특정의 전기 및/또는 광학 신호를 측정함으로써 특정 공급원으로서 기원하는 바, 표적 폴리뉴클레오티드를 확인할 수 있다.
(iii)의 경우, 폴리뉴클레오티드의 서열은 앞서 기술된 바와 같이 측정될 수 있다. 적합한 서열분석 방법, 특히, 전기적 측정을 사용하는 것은 문헌 [Stoddart D et al., Proc Natl Acad Sci, 12;106(19):7702-7], [Lieberman KR et al., J Am Chem Soc. 2010; 132(50):17961-72], 및 국제 출원 WO 2000/28312에 기술되어 있다.
(iv)의 경우, 2차 구조는 다양한 방식으로 측정될 수 있다. 예를 들어, 본 방법인 전기적 측정을 포함할 경우, 2차 구조는 지속 시간 변화 또는 포어를 통해 흐르는 전류의 변화를 사용하여 측정될 수 있다. 이를 통해 단일 가닥 및 이중 가닥 폴리뉴클레오티드 영역이 구별될 수 있다.
(v)의 경우, 임의의 변형의 존재 또는 부재가 측정될 수 있다. 본 방법은 바람직하게 하나 이상의 단백질을 이용하여, 또는 하나 이상의 표지, 태그, 또는 스페이서를 이용하여 표적 폴리뉴클레오티드가 메틸화에 의해, 산화에 의해, 산화에 의해 변형되었는지 여부를 측정하는 단계를 포함한다. 특이적인 변형을 통해 포어와의 특이적인 상호작용이 이루어질 것이며, 이는 하기 기술되는 방법을 이용하여 특정될 수 있다. 예를 들어, 메틸시토신은 각 뉴클레오티드와 포어의 상호작용 동안 포어를 통해 흐르는 전류에 기반하여 시토신과 구별될 수 있다.
다양한 상이한 유형의 측정 방식으로 측정될 수 있다. 이는 제한 없이 전기적 측정 및 광학적 측정을 포함한다. 가능한 전기적 측정으로는 전류 측정, 임피던스 측정, 터널링 측정 (Ivanov AP et al., Nano Lett. 2011 Jan 12; 11(1):279-85), 및 FET 측정 (국제 출원 WO 2005/124888)을 포함한다. 광학적 측정은 전기적 측정과 조합될 수 있다 (Soni GV et al., Rev Sci Instrum. 2010 Jan;81 (1):014301). 측정은 막횡단 전류 측정, 예컨대, 포어를 통해 흐르는 이온 전류 측정일 수 있다.
전기적 측정은 [Stoddart D et al., Proc Natl Acad Sci, 12; 106(19):7702-7], [Lieberman KR et al., J Am Chem Soc. 2010;132(50):17961-72], 및 국제 출원 WO-2000/28312에 기술된 바와 같이, 표준 단일 채널 기록 장치를 이용하여 수행될 수 있다. 대안적으로, 전기적 측정은 예를 들어, 국제 출원 WO2009/077734 및 국제 출원 WO-2011/067559에 기술된 바와 같이, 다채널 시스템을 사용하여 수행될 수 있다.
본 방법은 포어가 막에 존재하는 것인 막/포어 시스템을 조사하는 데 적합한 임의의 장치를 사용하여 수행될 수 있다. 본 방법은 막횡단 포어 감지에 적합한 임의의 장치를 사용하여 수행될 수 있다. 예를 들어, 장치는 수용액을 포함하는 챔버, 및 챔버를 2개의 섹션으로 분리하는 장벽을 포함한다. 장벽은 전형적으로 포어를 함유하는 막이 형성되는 개구부를 가진다. 대안적으로, 장벽은 포어가 존재하는 막을 형성한다.
본 방법은 국제 출원 번호 PCT/GB08/000562 (WO 2008/102120)에 기술된 장치를 사용하여 수행될 수 있다.
본 방법은 폴리뉴클레오티드가 포어와 관련하여 이동함에 따라 포어를 통과하는 전류를 측정하는 단계를 포함할 수 있다. 그러므로, 장치는 또한 전위를 인가할 수 있고, 막 및 포어를 통과하는 전기 신호를 측정할 수 있는 전기 회로를 포함할 수 있다. 본 방법은 패치 클램프 또는 전압 클램프를 사용하여 수행될 수 있다. 본 방법은 바람직하게 전압 클램프를 사용하는 것을 포함한다.
본 발명의 방법은 폴리뉴클레오티드가 포어와 관련하여 이동함에 따라 포어를 통과하는 전류를 측정하는 단계를 포함할 수 있다. 막횡단 단백질 포어를 통과하는 이온 전류를 측정하는 데 적합한 조건은 관련 기술분야에 공지되어 있고, 실시예에 개시되어 있다. 본 방법은 전형적으로 막 및 포어를 통해 인가되는 전압을 이용하여 수행된다. 사용되는 전압은 전형적으로 +2 V 내지 -2 V, 전형적으로 -400 mV 내지 +400 mV이다. 사용되는 전압은 바람직하게 -400 mV, -300 mV, -200 mV, -150 mV, -100 mV, -50 mV, -20 mV 및 0 mV로부터 선택되는 하한 및 +10 mV, + 20 mV, +50 mV, +100 mV, +150 mV, +200 mV, +300 mV 및 +400 mV로부터 독립적으로 선택되는 상한을 갖는 범위이다. 사용되는 전압은 더욱 바람직하게 100 mV 내지 240 mV 범위이고, 가장 바람직하게는 120 mV 내지 220 mV 범위이다. 인가되는 전위 증가를 사용함으로써 포어에 의한 상이한 뉴클레오티드 사이의 차이를 증가시킬 수 있다.
본 방법은 전형적으로 임의의 전하 캐리어, 예컨대, 금속 염, 예를 들어, 알칼리 금속 염, 할라이드 염, 예를 들어, 클로라이드 염, 예컨대, 알칼리 금속 할라이드 염의 존재 하에 수행된다. 전하 캐리어로는 이온성 액체 또는 유기 염, 예를 들어, 테트라메틸 암모늄 클로라이드, 트리메틸페닐 암모늄 클로라이드, 페닐트리메틸 암모늄 클로라이드, 또는 1-에틸-3-메틸 이미다졸리움 클로라이드를 포함할 수 있다. 상기 논의된 예시적인 장치에서, 염은 챔버내 수용액 중에 존재한다. 염화칼륨 (KCl), 염화나트륨 (NaCl), 염화세슘 (CsCl) 또는 페로시안화 칼륨 및 페리시안화 칼륨의 혼합물이 전형적으로 사용된다. KCl, NaCl 및 페로시안화 칼륨 및 페리시안화 칼륨의 혼합물이 바람직한다. 염 농도는 포화 상태일 수 있다. 염 농도는 3 M 이하일 수 있고, 전형적으로 0.1 내지 2.5 M, 0.3 내지 1.9M, 0.5 내지 1.8 M, 0.7 내지 1.7 M, 0.9 내지 1.6 M, 또는 1 M 내지 1.4 M이다. 염 농도는 바람직하게 150 mM 내지 1 M이다. Hel308, XPD, RecD, TraI 및 Dda 헬리카제가 놀랍게도 높은 염 농도에서도 작용한다. 본 방법은 바람직하게 0.3 M 이상, 예컨대, 0.4 M 이상, 0.5 M 이상, 0.6 M 이상, 0.8 M 이상, 1.0 M 이상, 1.5 M 이상, 2.0 M 이상, 2.5 M 이상, 또는 3.0 M 이상의 염 농도에서 수행된다. 높은 염 농도는 높은 신호 대 잡음비를 제공하고, 이를 통해 뉴클레오티드의 존재를 나타내는 전류는 정상적인 전류 변동의 배경에 대해 확인될 수 있다.
본 방법은 전형적으로 완충제의 존재 하에 수행된다. 상기 논의된 예시적인 장치에서, 상기 논의된 예시적인 장치에서, 완충제는 챔버내 수용액 중에 존재한다. 임의의 완충제가 본 발명의 방법에 사용될 수 있다. 전형적으로, 완충제는 포스페이트 완충제이다. 다른 적합한 완충제는 HEPES 및 트리스(Tris)-HCl 완충제. 본 방법은 전형적으로 pH 4.0 내지 12.0, 4.5 내지 10.0, 5.0 내지 9.0, 5.5 내지 8.8, 6.0 내지 8.7 또는 7.0 내지 8.8 또는 7.5 내지 8.5에서 수행된다. 사용되는 pH는 바람직하게 약 7.5이다.
본 방법은 0℃ 내지 100℃, 15℃ 내지 95℃, 16℃ 내지 90℃, 17℃ 내지 85℃, 18℃ 내지 80℃, 19℃ 내지 70℃, 또는 20℃ 내지 60℃에서 수행될 수 있다. 본 방법은 전형적으로 실온에서 수행된다. 본 방법은 임의적으로 헬리카제 기능을 지지하는 온도, 예컨대, 약 37℃에서 수행된다.
본 방법은 유리 뉴클레오티드 또는 유리 뉴클레오티드 유사체 및/또는 헬리카제 작용을 촉진시키는 헬리카제 보조인자의 존재 하에 수행될 수 있다. 본 방법은 또한 유리 뉴클레오티드 또는 유리 뉴클레오티드 유사체의 부재하에서 및 헬리카제 보조인자의 부재하에서 수행될 수 있다. 유리 뉴클레오티드는 하나 이상의, 상기 논의된 개별 뉴클레오티드 중 임의의 것일 수 있다. 유리 뉴클레오티드로는 아데노신 모노포스페이트 (AMP), 아데노신 디포스페이트 (ADP), 아데노신 트리포스페이트 (ATP), 구아노신 모노포스페이트 (GMP), 구아노신 디포스페이트 (GDP), 구아노신 트리포스페이트 (GTP), 티미딘 모노포스페이트 (TMP), 티미딘 디포스페이트 (TDP), 티미딘 트리포스페이트 (TTP), 우리딘 모노포스페이트 (UMP), 우리딘 디포스페이트 (UDP), 우리딘 트리포스페이트 (UTP), 시티딘 모노포스페이트 (CMP), 시티딘 디포스페이트 (CDP), 시티딘 트리포스페이트 (CTP), 시클릭 아데노신 모노포스페이트 (cAMP), 시클릭 구아노신 모노포스페이트 (cGMP), 데옥시아데노신 모노포스페이트 (dAMP), 데옥시아데노신 디포스페이트 (dADP), 데옥시아데노신 트리포스페이트 (dATP), 데옥시구아노신 모노포스페이트 (dGMP), 데옥시구아노신 디포스페이트 (dGDP), 데옥시구아노신 트리포스페이트 (dGTP), 데옥시티미딘 모노포스페이트 (dTMP), 데옥시티미딘 디포스페이트 (dTDP), 데옥시티미딘 트리포스페이트 (dTTP), 데옥시우리딘 모노포스페이트 (dUMP), 데옥시우리딘 디포스페이트 (dUDP), 데옥시우리딘 트리포스페이트 (dUTP), 데옥시시티딘 모노포스페이트 (dCMP), 데옥시시티딘 디포스페이트 (dCDP) 및 데옥시시티딘 트리포스페이트 (dCTP)를 포함하나, 이에 제한되지는 않는다. 유리 뉴클레오티드는 바람직하게 AMP, TMP, GMP, CMP, UMP, dAMP, dTMP, dGMP 또는 dCMP로부터 선택된다. 유리 뉴클레오티드는 바람직하게 아데노신 트리포스페이트 (ATP)이다. 헬리카제 보조인자는 헬리카제 또는 구축물이 작용할 수 있도록 하는 인자이다. 헬리카제 보조인자는 바람직하게 2가 금속 양이온이다. 2가 금속 양이온은 바람직하게 Mg2 +, Mn2 +, Ca2 + 또는 Co2 +이다. 헬리카제 보조인자는 가장 바람직하게 Mg2 +이다.
하나 이상의 헬리카제의 표적 폴리뉴클레오티드 상에의 로딩을 제어하는 방법
본 발명은 또한 하나 이상의 헬리카제의 표적 폴리뉴클레오티드 상에의 로딩을 제어하는 방법 또한 제공한다. 본 방법은 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계를 포함한다. 본 방법은 바람직하게 하나 이상의 스페이서를 포함하도록 표적 폴리뉴클레오티드를 변형시키는 것을 포함한다. 상기에서 논의된 스페이서 실시양태 모두 본 방법에 동등하게 적용된다.
본 방법은 또한 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 표적 폴리뉴클레오티드에 결합하고, 하나 이상의 헬리카제가 각 스페이서에서 정지하도록 하는 단계를 포함한다. 스페이서에서 헬리카제가 정지하는 것은 상기 논의된 바와 같이 검정될 수 있다.
표적 폴리뉴클레오티드는 상기 논의된 바와 같이 임의 개수의 스페이서를 포함할 수 있다. 표적 폴리뉴클레오티드는 바람직하게 2개 이상의 스페이서, 예컨대, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 스페이서를 포함한다. 상기 논의된 바와 같이 임의 개수의 헬리카제가 각 스페이서에서 정지될 수 있다. 이러한 방식으로, 얼마나 많은 헬리카제가 표적 폴리뉴클레오티드 상의 어느 위치에 로딩되는지 제어할 수 있고, 이로써, 표적 폴리뉴클레오티드의 특징 규명을 촉진할 수 있다. 상기 논의된 본 방법 중 임의의 것을 사용하여 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시킬 수 있다.
표적 폴리뉴클레오티드는 바람직하게 하나 이상의 스페이서 S 및 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L (L은 로딩 부위에 대한 것임)을 제공받는다. 각 영역 L의 길이는 각 L에 결합하여야 하고, 각 스페이서 S에서 정지되어야 하는 헬리카제의 개수에 의존한다. 하나 이상의 스페이서 S 및 하나 이상의 영역 L은 서로 인접해 있을 수 있거나 (즉, 바로 옆에 있을 수 있거나), 또는 표적 폴리뉴클레오티드의 일부만큼 이격되어 있을 수 있다. 각 스페이서는 전형적으로 헬리카제 이동 방향으로 각 영역 L의 말단에 또는 그 근처에 위치한다. 예를 들어, 헬리카제가 5'→3' 헬리카제일 경우, 각 스페이서는 전형적으로 각 영역의 3' 말단에 또는 그 근처에 위치하고, 즉, 5'-L-S-3'이다. 헬리카제가 3'→5' 헬리카제일 경우, 각 스페이서는 전형적으로 각 영역의 5' 말단에 또는 그 근처에 위치하고, 즉, 5'-S-L-3'이다.
표적 폴리뉴클레오티드는 바람직하게 5'→3' 방향으로 (L-S)n 또는 (S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다. 5'→3' 방향은 표적 폴리뉴클레오티드를 지칭한다.
표적 폴리뉴클레오티드는 바람직하게, 각각이 양 말단에 또는 그 근처에 스페이서 S를 갖는 것인, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L을 제공받으며, 즉, (S-L-S)n을 제공받는다.
바람직한 실시양태에서, 스페이서는 상기 논의된 바와 같이 이중 가닥 영역 D에 인접해 있으며, 즉, 5'→3' 헬리카제 또는 불활성 모드로 사용되는 헬리카제인 경우, 5'-L-S-D-3'이거나, 또는 3'→5' 헬리카제 또는 불활성 모드로 사용되는 헬리카제인 경우, 5'-D-S-L-3'이다. 표적 폴리뉴클레오티드는 바람직하게 5'→3' 방향으로 (L-S-D)n 또는 (D-S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, D는 이중 가닥 폴리뉴클레오티드이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다. L은 D와 동일한 유형의 폴리뉴클레오티드일 수 있거나, D와 상이한 유형의 폴리뉴클레오티드일 수 있다. L 및/또는 D는 표적 폴리뉴클레오티드와 동일한 유형의 폴리뉴클레오티드일 수 있거나, 표적 폴리뉴클레오티드와 상이한 유형의 폴리뉴클레오티드일 수 있다.
바람직한 실시양태에서, 차단 분자 B는 하나 이상의 헬리카제가 지나 이동하는 말단 반대쪽의 각 스페이서의 말단에 제공되고, 즉, 5'→3' 헬리카제 또는 불활성화 모드로 사용되는 헬리카제인 경우, 5'-B-L-S-3'이거나, 3'→5' 헬리카제인 경우, 5'-S-L-B-3'이다. 표적 폴리뉴클레오티드는 바람직하게 5'→3' 방향으로 (B-L-S)n 또는 (S-L-B)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, B는 차단 분자이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다.
가장 바람직한 실시양태에서, 표적 폴리뉴클레오티드는 D 및 B, 둘 모두를 제공하고, 즉, 5'→3' 헬리카제 또는 불활성화 모드로 사용되는 헬리카제인 경우, 5'-B-L-S-D-3'이거나, 또는 3'→5' 헬리카제인 경우, 5'-D-S-L-B-3'이다. 표적 폴리뉴클레오티드는 가장 바람직하게 5'→3' 방향으로 (B-L-S-D)n 또는 (D-S-L-B)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, B는 차단 분자이고, D는 이중 가닥 폴리뉴클레오티드이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다.
표적 폴리뉴클레오티드는 임의 개수의 상기 스페이서 함유 유닛을 제공받을 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 (5'-L-S-3')n, (5'-S-L-3')n, (S-L-S)n, (5'-L-S-D-3')n, (5'-D-S-L-3')n, (5'-B-L-S-3')n, (5'-S-L-B-3')n, (5'-B-L-S-D-3')n 또는 (5'-D-S-L-B-3')n (여기서, n은 2 또는 그 초과이고, 예컨대, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과임)을 제공받을 수 있다. 상기 실시양태를 통해 다중의 헬리카제는 표적 폴리뉴클레오티드 상에서 정지될 수 있다.
표적 폴리뉴클레오티드는 본 발명의 어댑터를 표적 폴리뉴클레오티드에 결찰시킴으로써 L, S, D 및 B를 참조하여 상기 논의된 실시양태 모두를 제공받을 수 있다.
바람직한 실시양태에서, 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 1개의 헬리카제 (즉, 단 1개의 헬리카제)가 각 스페이서에서 정지하도록 한다. 이는 표적 폴리뉴클레오티드에 하나 이상의 스페이서 S, 및 각각이 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L1을 제공함으로써 달성될 수 있다. 표적 폴리뉴클레오티드는 바람직하게 5'→3' 방향으로 (L1-S)n 또는 (S-L1)n (여기서, L1은 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다.
영역 L1의 길이는 헬리카제의 풋프린트에 의존하고, 간단한 방법으로 계산될 수 있다. 영역 L1은 표적 폴리뉴클레오티드의 일부일 수 있거나, 또는 예를 들어, 본 발명의 어댑터의 일부로서 표적 폴리뉴클레오티드에 부가될 수 있다. 영역 L1의 길이는 전형적으로 8, 9, 10, 12, 13, 14 또는 15개의 뉴클레오티드 길이이다. 하나 이상의 스페이서 S 및 하나 이상의 L1 영역은 서로 인접해 있을 수 있거나 (즉, 바로 옆에 있을 수 있거나), 또는 표적 폴리뉴클레오티드의 일부만큼 이격되어 있을 수 있다. 각 스페이서 S는 전형적으로 헬리카제 이동 방향으로 각 영역 L1의 말단에 또는 그 근처에 위치한다. 예를 들어, 헬리카제가 5'→3' 헬리카제일 경우, 각 스페이서 S는 전형적으로 각 영역 L1의 3' 말단에 또는 그 근처에 위치하고, 즉, 5'-L1-S-3'이다. 헬리카제가 3'→5' 헬리카제일 경우, 각 스페이서 S는 전형적으로 각 영역 L1의 5' 말단에 또는 그 근처에 위치하고, 즉, 5'-S-L1-3'이다. 표적 폴리뉴클레오티드는 바람직하게 각각이 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이이고, 각각이 양 말단에 또는 그 근처에 스페이서 S를 갖는 것인, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L1을 제공받으며, 즉, (S-L1-S)n을 제공받는다.
표적 폴리뉴클레오티드는 (5'-L1-S-3')n, (5'-S-L1-3')n, (S-L1-S)n, (5'-L1-S-D-3')n, (5'-D-S-L1-3')n, (5'-B-L1-S-3')n, (5'-S-L1-B-3')n, (5'-B-L1-S-D-3')n 또는 (5'-D-S-L1-B-3')n (여기서, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받을 수 있다. 상기 실시양태를 통해 n개의 헬리카제는 표적 폴리뉴클레오티드 상에서 정지될 수 있다. 1개의 헬리카제가 각 스페이서에 의해 정지된다.
또 다른 바람직한 실시양태에서, 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 2개의 헬리카제 (즉, 단 2개의 헬리카제)가 각 스페이서에서 정지하도록 한다. 이는 표적 폴리뉴클레오티드에 하나 이상의 스페이서 S, 및 각각이 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L2를 제공함으로써 달성될 수 있다. 표적 폴리뉴클레오티드는 바람직하게 5'→3' 방향으로 (L2-S)n 또는 (S-L2)n (여기서, L은 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다.
영역 L2의 길이는 헬리카제의 풋프린트에 의존하고, 간단한 방법으로 계산될 수 있다. 영역 L2는 표적 폴리뉴클레오티드의 일부일 수 있거나, 또는 예를 들어, 본 발명의 어댑터의 일부로서 표적 폴리뉴클레오티드에 부가될 수 있다. 영역 L2의 길이는 전형적으로 16, 17, 18, 19, 20, 21 또는 22개의 뉴클레오티드 길이이다. 하나 이상의 스페이서 S 및 하나 이상의 영역 L2는 서로 인접해 있을 수 있거나 (즉, 바로 옆에 있을 수 있거나), 또는 폴리뉴클레오티드의 일부만큼 이격되어 있을 수 있다. 각 스페이서는 전형적으로 헬리카제 이동 방향으로 각 영역의 말단에 또는 그 근처에 위치한다. 예를 들어, 헬리카제가 5'→3' 헬리카제일 경우, 각 스페이서는 전형적으로 각 영역의 3' 말단에 또는 그 근처에 위치한다. 폴리뉴클레오티드는 바람직하게 각각이 단 2개의의 헬리카제가 결합하기에 충분할 정도의 길이이고, 각각이 양 말단에 또는 그 근처에 스페이서 S를 갖는 것인, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L2를 제공받으며, 즉, (S-L2-S)n을 제공받는다.
표적 폴리뉴클레오티드는 (5'-L2-S-3')n, (5'-S-L2-3')n, (S-L2-S)n, (5'-L2-S-D-3')n, (5'-D-S-L2-3')n, (5'-B-L2-S-3')n, (5'-S-L2-B-3')n, (5'-B-L2-S-D-3')n 또는 (5'-D-S-L2-B-3')n (n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받을 수 있다. 상기 실시양태를 통해 2n개의 헬리카제는 표적 폴리뉴클레오티드 상에서 정지될 수 있다. 2개의 헬리카제가 각 스페이서에 의해 정지된다.
각 스페이서에서 정지된 2개의 헬리카제는 바람직하게는 서로 상이한 것이다. 이는 여러 방식으로 제어될 수 있다. 예를 들어, 2개의 상이한 헬리카제는 서로 부착될 수 있고, 예컨대, 서로 공유 부착될 수 있고, 이어서, 각 스페이서에서 정지될 수 있다. 적합한 구축물은 상기에서 논의된 바와 같다. 대안적으로, 차단 폴리뉴클레오티드를 사용하여 확실하게 상이한 헬리카제가 각 스페이서에서 정지되도록 할 수 있다. 본 방법이 폴리뉴클레오티드에 하나 이상의 스페이서 S, 및 각각이 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L2를 제공하는 단계를 포함할 경우, 본 방법은 바람직하게 차단 폴리뉴클레오티드를 각 영역 L2의 부분에 혼성화시켜 각 영역의 남은 (즉, 비차단) 부분이 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이가 되도록 하는 단계를 포함한다. 차단 폴리뉴클레오티드의 길이는 전형적으로 2, 3, 4, 5, 6, 7 또는 8개의 뉴클레오티드 길이이다. 차단 폴리뉴클레오티드는 2개의 헬리카제가 동시에 같은 영역에 결합하지 못하도록 막는다. 차단 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드를 바람직하게 하나 이상의 헬리카제와 접촉시켜 1개의 헬리카제가 각 영역 L2의 남은 (즉, 비차단) 부분에 결합하게 한다. 이어서, 각 헬리카제를 사용하여 차단 폴리뉴클레오티드를 제거할 수 있다. 하나 이상의 결합된 헬리카제에 바람직하게 유리 뉴클레오티드 및 헬리카제 보조인자를 제공하여 헬리카제가 각 차단 폴리뉴클레오티드를 제거하고, 각 스페이서 S에서 정지할 수 있도록 한다. 이어서, 상기 방법으로 제조된 폴리뉴클레오티드를 바람직하게는, 본 방법에서 먼저 사용된 헬리카제와는 상이한 하나 이상의 헬리카제와 접촉시켜 1개의 상이한 헬리카제가 각 영역에 결합하고, 스페이서 및 나머지 다른 정지된 헬리카제에 의해 정지되도록 한다.
본 방법은 바람직하게 (a) 표적 폴리뉴클레오티드에 5'→3' 방향으로 (L2-S)n 또는 (S-L2)n (여기서, L은 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수임)을 제공하는 단계; (b) 차단 폴리뉴클레오티드를 각 영역 L2의 부분에 혼성화시켜 각 영역 L2의 남은 부분이 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이가 되도록 하는 단계; (c) (b)에서 제조된 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 1개의 헬리카제가 각 영역 L2의 남은 부분에 결합하도록 하는 단계; (d) (c)의 하나 이상의 결합된 헬리카제에 유리 뉴클레오티드 및 헬리카제 보조인자를 제공하여 헬리카제가 각 차단 폴리뉴클레오티드를 제거하고, 각 스페이서 S에서 정지할 수 있도록 하는 단계; 및 (e) (d)에서 제조된 표적 폴리뉴클레오티드를 (c)에서 사용된 것과 상이한 것인 하나 이상의 헬리카제와 접촉시켜 1개의 상이한 헬리카제가 각 영역 L2에 결합하고, 각 스페이서 및 (d)에서 정지된 각 헬리카제에 의해 정지되도록 하는 것인 단계를 포함한다. n은 바람직하게 1, 2, 3 또는 4이다. S 및 L2의 다른 배열, 예컨대, 상기 논의된 바와 같은, (S-L2-S)n, (5'-L2-S-D-3')n, (5'-D-S-L2-3')n, (5'-B-L2-S-3')n, (5'-S-L2-B-3')n, (5'-B-L2-S-D-3')n 및 (5'-D-S-L2-B-3')n 또한 본 실시양태에서 사용될 수 있다.
상기 논의된 바와 같이, 스페이서의 길이를 사용하여 정지되는 헬리카제의 개수, 및/또는 스페이서를 지나 이동할 수 있는 헬리카제의 개수를 제어할 수 있다. 보다 긴 장쇄의 스페이서를 사용하여 더 많은 헬리카제를 정지시킬 수 있다. 트레일링 헬리카제가 리딩 헬리카제가 스페이서를 지나도록 인출할 수 있기 때문에, 일련의 2개 이상의 헬리카제, 예컨대, 3, 4 또는 5개의 헬리카제 또한 보다 긴 장쇄의 스페이서를 지나 이동할 수 있다. 상기 L1 및 L2를 참조하여 본 실시양태는 3, 4 또는 5개의 헬리카제가 각 스페이서에서 정지되도록 변형될 수 있다. 예를 들어, 폴리뉴클레오티드는 하나 이상의 스페이서 S, 및 각각이 단 3개 (L3), 4개 (L4) 또는 5개 (L5)의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역을 제공받을 수 있다.
어댑터
본 발명은 또한 표적 폴리뉴클레오티드의 이동을 제어하기 위한 어댑터를 제공한다. 어댑터는 바람직하게 표적 폴리뉴클레오티드의 특징 규명을 위한 것이다. 어댑터는 (a) 5'→3' 방향으로 (L-S-D)n 또는 (D-S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, D는 이중 가닥 폴리뉴클레오티드이고, 여기서, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수임), 및 (b) 각 어댑터 상에서 정지되는 하나 이상의 헬리카제를 포함한다. n은 바람직하게 1, 2, 3 또는 4이다. 5'→3' 방향은 어댑터에서 L 및 D 폴리뉴클레오티드의 방향을 나타낸다.
하나 이상의 헬리카제는 스페이서 S 앞에서, 스페이서 S 옆에서, 또는 스페이서 S 상에서 정지될 수 있다.
어댑터는 표적 폴리뉴클레오티드가 상기 논의된 방법 중 임의의 것에 사용될 수 있도록 표적 폴리뉴클레오티드에 결찰될 수 있다.
L은 상기 논의된 바와 같이 L1 또는 L2일 수 있다. 어댑터는 L1 및 L2의 조합을 포함할 수 있다.
상기에서 논의된 스페이서 실시양태 모두 본 방법에 동등하게 적용된다.
L, S 및 D를 참조하여 상기에서 논의된 본 실시양태 중 임의의 것은 본 발명의 어댑터에 동등하게 적용된다. 어댑터는 5'→3' 방향으로 (5'-L1-S-D-3')n, (5'-D-S-L1-3')n, (5'-B-L1-S-D-3')n 또는 (5'-D-S-L1-B-3')n, (5'-L2-S-D-3')n, (5'-D-S-L2-3')n, (5'-B-L2-S-D-3')n 또는 (5'-D-S-L2-B-3')n (여기서, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 포함할 수 있다. L1 또는 L2는 L3, L4 또는 L5로 대체될 수 있다.
가장 바람직하게, n은 1이고, 1 또는 2개의 헬리카제가 어댑터 상에서 정지된다.
키트
본 발명은 또한 표적 폴리뉴클레오티드의 이동을 제어하기 위한 키트를 제공한다. 키트는 바람직하게 표적 폴리뉴클레오티드의 특징 규명을 위한 것이다. 키트는 (a) 하나 이상의 스페이서, (b) 하나 이상의 헬리카제 및 (c) 막횡단 포어를 포함한다. 본 방법을 참조하여 상기 논의된 스페이서 실시양태 모두 본 발명의 키트에 동등하게 적용된다. 예를 들어, 하나 이상의 스페이서는, 표적 폴리뉴클레오티드에 결찰될 수 있고, 우선적으로 포어로 트레딩하는 리더 서열을 포함하는 것인 폴리뉴클레오티드 어댑터, 바람직하게, 단일 가닥 폴리뉴클레오티드 어댑터의 일부일 수 있다. 키트는 상기 논의된 헬리카제 및 포어 중 임의의 것을 포함할 수 있다.
하나 이상의 스페이서 및 하나 이상의 헬리카제는 본 발명의 어댑터의 일부일 수 있다.
키트는 막 성분, 예컨대, 양친매성 층, 예컨대, 지질 이중층을 형성하는 데 필요한 인지질을 추가로 포함할 수 있다.
본 발명의 키트는 상기 언급된 실시양태 중 임의의 것을 수행할 수 있게 하는 하나 이상의 다른 시약 또는 장치를 추가로 포함할 수 있다. 상기 시약 또는 장치로는 하기: 적합한 완충제(들) (수용액), 대상체로부터 샘플을 수득하기 위한 수단 (예컨대, 니들을 포함하는 베쓸 또는 장치), 폴리뉴클레오티드를 증폭 및/또는 발현시키기 위한 수단, 상기 정의된 바와 같은 막 또는 전압 또는 패치 클램프 장치 중 하나 이상의 것을 포함한다. 시약은 유체 샘플이 시약을 재현탁시킬 수 있도록 건식 상태로 키트 중에 존재할 수 있다. 키트는 또한 임의적으로 키트가 본 발명의 방법에서 사용될 수 있도록 하는 설명서, 또는 본 발명이 어떤 환자를 위해 사용될 수 있는지에 관한 세부 사항을 포함할 수 있다. 키트는 임의적으로 헬리카제 이동을 촉진시키는 데 필요한 성분 (예컨대, ATP 및 Mg2 +)을 포함할 수 있다. 하기 실시예는 본 발명을 예시한다.
실시예
실시예 1
본 실시예는 T4 Dda - E94C/A360C (돌연변이 E94C/A360C, 및 이어서, (ΔM1)G1G2를 포함하는 서열 8) 헬리카제가 단일 MspA 나노포어 (MS(B1- G75S/G77S/L88N/Q126R)8 MspA (MspA - B2C) (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 무손상 DNA 가닥의 이동을 어떻게 제어할 수 있는지를 기술하는 것이다. 람다 DNA 구축물 중 iSpC3 스페이서 (그의 3' 말단에서 4개의 iSpC3 스페이서에 부착되어 있는 서열 9 (상기 4개의 iSpC3 스페이서는 서열 10의 5' 말단에 부착되어 있고, 상기 서열 10은 3개의 iSpC3 스페이서에 부착되어 있고, 상기 3개의 iSpC3 스페이서는 서열 11에 3' 말단에 부착되어 있고, 상기 구축물의 서열 10 영역은 서열 12에 혼성화된다(서열 12는 그의 3' 말단에 부착되고, 6개의 iSp18 스페이서는 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착되어 있다)))를 사용하여, 구축물이 나노포어에 의해 포획될 때까지 효소를 정지시킨다. 포획시, 인가된 전위력이 효소 T4 Dda - E94C/A360C가 정지 스페이서를 지나도록 이동시키고, 나노포어를 통과하는 람다 구축물의 효소 제어형 DNA 이동을 가능하게 한다.
물질 및 방법
실험을 세팅하기 전, 람다 DNA 구축물 (그의 3' 말단에서 4개의 iSpC3 스페이서에 부착되어 있는 서열 9 (상기 4개의 iSpC3 스페이서는 서열 10의 5' 말단에 부착되어 있고, 상기 서열 10은 서열 11에 3' 말단에 부착되어 있고, 상기 구축물의 서열 10 영역은 서열 12에 혼성화된다(서열 12는 3' 콜레스테롤 테더를 가진다))) 및 T4 Dda - E94C/A360C를 함께 완충제 (20 mM CAPS, pH 10.0, 500 mM NaCl, 5% 글리세롤, 2 mM DTT) 중에서 23℃에서 15분 동안 미리 인큐베이션시켰다.
전기적 측정은 (냉각기 플레이트 상에 실험 시스템을 배치함으로써) 20℃에서 완충제 (600 mM KCl, 25 mM 인산칼륨, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8) 중 블록 공중합체에 삽입된 단일 MspA 나노포어 (MspA - B2C)로부터 획득하였다. 블록 공중합체에 삽입된 단일 포어를 수득한 후, 이어서, 완충제 (1 mL, 600 mM KCl, 25 mM 인산칼륨, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)를 시스템을 통해 유동시켜 임의의 과량의 MspA 나노포어 (MspA - B2C)를 제거하고, 최종적으로 실험 완충제 (2 mL 960 mM KCl, 25 mM 인산칼륨, 3 mM 페로시안화 칼륨 (II), 1 mM 페리시안화 칼륨 (III), pH 8)를 시스템 내로 유동시켰다. MgCl2 (10 mM 최종 농도) 및 ATP (1 mM 최종 농도)를 완충제 (960 mM KCl, 25 mM 인산칼륨, 3 mM 페로시안화 칼륨 (II), 1 mM 페리시안화 칼륨 (III), pH 8)와 함께 혼합한 후, 람다 DNA 구축물 (0.2 nM 최종 농도), T4 Dda - E94C/A360C (10 nM 최종 농도) 완충제 (20 mM CAPS, pH 10.0, 500 mM NaCl, 5% 글리세롤, 2 mM DTT) 프리 믹스에 첨가하였다. 이어서, 프리 믹스를 단일 나노포어 실험 시스템에 첨가하였다. 전위 플립 프로세스 (2 s 동안 +100 mV, 이어서, 2 s 동안 0 V, 및 이어서, 14,500 s 동안 -120 mV로 시스 측에서 인가) 후 4시간 동안 실험을 수행하고, 헬리카제 제어형 DNA 이동을 모니터링하였다.
결과 및 논의
DNA 구축물은 도 1에 제시되어 있다. T4 Dda - E94C/A360C는 DNA 구축물과 미리 인큐베이션되었을 때 구축물 영역 (A로 표지) (서열 9)에 결합할 수 있다. 그러나, 상기 효소는 유리 용액 중에 존재할 경우에는 정지 기를 지나 이동하지 못한다 (도 1에서 B 및 D로 표지). 그러므로, DNA 구축물이 나노포어에 의해 포획될 때까지 효소는 iSpC3 스페이서 (도 1에서 B로 표지)에서 정지되어 있다. 일단 나노포어에 의해 포획되고 나면, 인가된 전위력은 효소 T4 Dda - E94C/A360C가 정지 스페이서를 지나도록 이동시키고, 나노포어를 통과하는 람다 구축물의 효소 제어형 DNA 이동을 가능하게 한다. 헬리카제 제어형 DNA 이동의 일례가 도 2에 제시되어 있다. 헬리카제 제어형 DNA 이동 기간은 5,170초였고, 이는 나노포어를 통과하는 대략 30 kB의 람다 구축물의 전위에 상응한다. 도 3은 헬리카제 제어형 DNA 이동의 시작점 (a) 및 종점 (b)에 대한 확대된 영역을 보여주는 것이다. 1 및 2는 iSpC3 스페이서가 헬리카제의 제어하에서 나노포어를 통해 전위할 때를 보여주는 것이다.
실시예 2
MuA를 사용하여 람다 DNA를 ~5-10 kB 단편으로 단편화함으로써 본 실시예에서 사용되는 DNA 구축물을 제조하였다. 이어서, 샘플 제조에 의해 제조된 단편을 나노포어를 통해 통과시켰고, 그의 이동은 헬리카제 효소에 의해 제어되었다. 헬리카제는 나노포어를 통해 인가된 전위력에 의해 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나 이동하였다. 나노포어를 통과하는 마커의 헬리카제 제어형 이동에 의해 형성되는 특징적인 차단 관찰 결과는 샘플 제조 방법이 성공적이었으며, 효소는 도 4(b)에 제시된 바와 같이 정지되었다는 것을 나타내었다. 이는 효소는 정의된 출발점을 가졌고, 나노포어에 의해 포획될 때까지는 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나 이동하지는 못하였다는 것을 의미하였다.
물질 및 방법
2.1 Y형 및 헤어핀 MuA 기질 형성을 위한 DNA 가닥의 어닐링
하기 표 5에 제시된 바와 같이 Y형 및 헤어핀 MuA 기질을 제조하였다. 이어서, Y형 및 헤어핀 MuA 기질을 형성하기 위해 DNA를 함유하는 샘플 혼합물을 2분 동안 95℃로 가열한 후, 분당 2℃의 비율로 16℃까지로 냉각시켰다. 이를 통해 서열 14 및 15 (여기서, 서열 14는 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛만큼 서열 15의 5' 말단에 부착되어 있다)가 서열 19 및 9 (여기서, 서열 19는 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛만큼 서열 9의 5' 말단에 부착되어 있다)에 어닐링하여 Y형 MuA 기질을 형성하였고, 서열 19 및 20 (여기서, 서열 19는 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛만큼 서열 15의 5' 말단에 부착되어 있다)의 경우에는 헤어핀 루프 MuA 기질을 형성하였다. 형성된 2개의 MuA 기질의 DNA 기질 디자인은 도 4(a)에 제시되어 있다.
[표 5]
Figure pct00005
2.2 MuA 트랜스포사제를 이용한 DNA 주형 단편화
MuA 트랜스포사제를 이용하여 이중 가닥 람다 DNA (서열 13은 센스 가닥의 서열에 상응한다)를 길이가 대략 5-10 kB인 가닥으로 단편화시켰다. MuA 트랜스포사제는 섹션 3.1에서 어닐링된 MuA 기질 (Y형 및 헤어핀 MuA 기질)을 삽입하였고, 샘플은 하기 표 6에 제시된 바와 같이 제조하였다. 이어서, 샘플을 30℃에서 1시간 동안 인큐베이션시키고, 75℃에서 10분 동안 가열하여 불활성화시켰다. 이어서, 퀴아퀵(QIAquick)™ PCR 정제용 키트 (퀴아젠(Qiagen))를 사용하여 샘플을 추가로 정제하고, 26 ㎕ 중에서 용리시켰다.
[표 6]
Figure pct00006
2.3 삽입된 MuA 기질을 이용한 단편화된 람다 DNA의 USER 분해
서열 19로부터 dUMP를 제거하기 위해 단계 3.2로부터의 정제된 샘플 부피 1을 USER™ 분해물로 처리하였다. 적절한 부피 및 농도에 대해서는 하기 표 7을 참조할 수 있다. 이어서, 샘플을 37℃에서 30분 동안 인큐베이션시킨 후, 얼음 덩어리에서 냉각시켰다.
[표 7]
Figure pct00007
2.4 이중 가닥 람다 DNA 구축물 단편 중 단일 가닥 갭의 수복
이어서, 단일 가닥 갭을 폐쇄하기 위해 USER™ 처리 후에 제조된 샘플 부피 2를 DNA 폴리머라제 및 리가제로 처리하였다. 샘플 부피 3 (적절한 부피 및 농도에 대해서는하기 표 8 참조)을 16℃에서 30분 동안 인큐베이션시킨 후, EDTA (0.5M, 10 ㎕)를 샘플 부피 3에 첨가하였다. 이어서, 퀴아퀵™ PCR 정제용 키트를 사용하여 각 샘플을 정제하고, 50 ㎕ 물 중에서 용리시켰다. 분취량의 정제된 샘플 (1 ㎕)을 애질런트(Agilent) 12000 칩 상에서 전개시켜 샘플을 정량화하고, 트리스-HCl 및 NaCl (pH 7.5)을 각각 그 농도가 10 mM 및 50 mM이 될 때까지 나머지 샘플에 첨가하였다. 최종적으로, 서열 16 (서열의 3' 말단은 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착된 6개의 iSp18 스페이서를 가진다, 0.5 μM)을 정제된 샘플에 어닐링시켰다.
[표 8]
Figure pct00008
2.5 정제되고, 단편화된 람다 DNA 구축물의 헬리카제 제어형 DNA 이동을 보여주는 전기생리학적 실험
실험을 세팅하기 전, 람다 DNA 구축물 (0.2 nM, MuA 트랜스포사제에 의해 Y형 MuA 기질 및 헤어핀 MuA 기질이 단편의 양단에 부착되어 있는, 5-10 kB의 람다 DNA 단편 (예시적인 구축물에 대해서는 도 4 (b) 참조)) 및 Trwc Cba (서열 9, 1 μM)를 완충제 (50 mM CAPS, pH 10.0 (NaOH를 첨가함으로써 pH를 pH 10.0으로 변경), 100 mM NaCl) 중에서 1시간 동안 함께 미리 인큐베이션시켰다.
전기적 측정은 완충제 (600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8) 중 블록 공중합체에 삽입된 단일 MspA 나노포어 (MspA - B2C)로부터 획득하였다. 이중층 중에서 단일 포어를 수득한 후, 이어서, 완충제 (1 mL, 600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)를 시스템을 통해 유동시켜 임의의 과량의 MspA 나노포어 (MspA - B2C)를 제거하고, 8℃로 설정된 냉각기 플레이트 상에 실험 시스템을 배치시킴으로써 시스템 온도가 ~15℃가 되도록 만들었다. MgCl2 (10 mM) 및 dTTP (5 mM)를 함께 완충제 (600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)와 혼합한 후, 이어서, 람다 DNA 구축물 (0.2 nM), Trwc Cba (서열 9, 1 μM) 완충제 (50 mM CAPS, pH 10.0 (NaOH를 첨가함으로써 pH를 pH 10.0으로 변경), 100 mM NaCl) 프리 믹스에 첨가하였다. 이어서, 프리 믹스를 단일 나노포어 실험 시스템에 첨가하였다. 전위 플립 프로세스 (30 min 동안 +120 mV, 이어서, 2초 동안 -100 mV, 및 이어서, 2초 동안 0 mV) 후 2시간 동안 실험을 수행하고, 헬리카제 제어형 DNA 이동을 모니터링하였다.
2.6 결과 및 논의
람다 DNA 구축물에 대한 헬리카제 제어형 DNA 이동을 관찰하였고, 헬리카제 제어형 DNA 이동의 예는 도 5에 제시되어 있다. 람다 DNA 구축물에 존재하는 iSpC3 스페이서는 도 5에서 번호 1, 2, 및 3으로 강조 표시된 특징적인 차단 수준을 나타내었다. Y형 MuA 기질은 양 가닥에 4개의 iSpC3 스페이서를 가지고, 헤어핀 MuA 기질 또한 4개의 iSpC3 스페이서를 가지는데, 각 iSpC3 스페이서는, 람다 DNA 구축물의 상기 영역이 나노포어를 통해 전위됨에 따라 더 많은 전류가 흐르게 할 수 있다. 샘플이 성공적으로 제조되었다면, 이때 iSpC3 스페이서 이벤트는 람다 DNA 구축물의 시작점, 중간 (센스 및 안티센스 서열 사이의 전이를 표시) 및 종점에서 관찰될 것이다. 도 5는 iSpC3 스페이서 영역에 상응하는 전류 흐름 증가에 대한 3가지 예시를 명확하게 보여준다. 그러므로, 샘플 제조 방법은 도 4 (b)에 제시된 람다 DNA 구축물을 제조하기 위해 람다 DNA 내로 MuA 기질을 효과적으로 도입하였다. 나노포어에 의해 DNA가 포획되었을 때, 효소 (A로 표지)는 나노포어를 통해 인가된 전위력에 의해 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나 이동한다.
실시예 3
본 실시예에서 사용된 DNA 구축물은 MuA를 이용하여 람다 DNA를 ~5-10 kB 단편으로 단편화시켜 제조하였다. 본 실시예는 실시예 2에 기술된 것과 유사하지만, 본 실시예에서는 트랜스포사제 서열이 이노신을 함유하는 바, 샘플 제조 방법은 상이하다 (상기 기술된 단계 2.3 및 2.4가 필요하지 않다). 효소는 나노포어를 통해 인가된 전위력에 의해 dsDNA 영역 및 스페이서를 지나 이동하였다.
물질 및 방법
3.1 Y형 및 헤어핀 MuA 기질 형성을 위한 DNA 가닥의 어닐링
상기 실시예 2.1에 기술된 바와 같이 Y형 2 및 헤어핀 2 MuA 기질을 제조하였다. 본 실시예에서 사용된 부피, 농도 및 서열은 하기 표 9에 상세히 기술되어 있다. 형성된 2개의 구축물의 DNA 기질 디자인은 도 6 (a)에 제시되어 있다.
[표 9]
Figure pct00009
3.2 MuA 트랜스포사제를 이용한 DNA 주형 단편화
MuA 트랜스포사제를 이용하여 이중 가닥 람다 DNA (서열 13은 센스 가닥의 서열만을 나타낸다)를 길이가 대략 5-10 kB인 가닥으로 단편화시켰다. MuA 트랜스포사제는 섹션 3.1에서 어닐링된 MuA 기질 (Y형 2 및 헤어핀 2 MuA 기질)을 삽입하였다. 섹션 2.2 및 상기 표 6에 기술된 것과 유사한 방법으로 샘플을 제조하였는데, 단, 예외적으로, 사용된 MuA 기질은 Y형 2 및 헤어핀 2 MuA 기질였다. 본 경우에서, 정제된 샘플 X를 20 ㎕ 부피에서 용리시켰다.
3.3 이중 가닥 람다 DNA 구축물 단편에서의 닉 수복
일단 Y형 2 및 헤어핀 2 MuA 기질이 단편화된 람다 DNA 내로 삽입되고 나면, 가닥 중의 닉을 수복시키고, 이노신을 람다 DNA 단편에 결합시켜 완전한 이중 가닥 람다 DNA 단편을 제조하는 것이 필요하다. 한 반응물을 하기 표 10에 기술된 바와 같이 얼음 상에서 조립시켰다. EDTA (10 ㎕, 0.5 M)를 샘플에 첨가하기 전, 샘플을 16℃에서 60 min 동안 인큐베이션시켰다. 생성된 샘플 혼합물을 퀴아퀵™ 정제를 사용하여 정제하고, 50 ㎕ 물 중에서 용리시켰다. 분취량의 정제된 샘플 (1 ㎕)을 애질런트 12000 칩 상에서 전개시켜 샘플을 정량화하고, 트리스-HCl 및 NaCl (pH 7.5)을 각각 그 농도가 10 mM 및 50 mM이 될 때까지 나머지 샘플에 첨가하였다. 최종적으로, 서열 16 (서열의 3' 말단은 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착된 6개의 iSp18 스페이서를 가진다, 0.5 μM)을 정제된 람다 DNA 구축물에 어닐링시켰다.
[표 10]
Figure pct00010
3.4 정제되고, 단편화된 람다 DNA 구축물의 헬리카제 제어형 DNA 이동을 보여주는 전기생리학적 실험
실험을 세팅하기 전, 람다 DNA 구축물 (0.2 nM, MuA 트랜스포사제에 의해 Y형 2 및 헤어핀 2 MuA 기질이 단편의 양단에 부착되어 있는, 5-10 kB의 람다 DNA 단편 (예시적인 구축물에 대해서는 도 6 (b) 참조)) 및 Trwc Cba (서열 17, 1 μM)를 완충제 (50 mM CAPS, pH 10.0 (NaOH를 첨가함으로써 pH를 pH 10.0으로 변경), 100 mM NaCl) 중에서 1시간 동안 함께 미리 인큐베이션시켰다.
전기적 측정은 완충제 (600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8) 중 블록 공중합체에 삽입된 단일 MspA 나노포어 (MspA - B2C)로부터 획득하였다. 이중층 중에서 단일 포어를 수득한 후, 이어서, 완충제 (3 mL, 600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)를 시스템을 통해 유동시켜 임의의 과량의 MspA 나노포어 (MspA - B2C)를 제거하고, 8℃로 설정된 냉각기 플레이트 상에 실험 시스템을 배치시킴으로써 시스템 온도가 ~15℃가 되도록 만들었다. MgCl2 (10 mM) 및 dTTP (5 mM)를 함께 완충제 (600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)와 혼합한 후, 이어서, 람다 DNA 구축물 (0.2 nM), Trwc Cba (서열 17, 1 μM) 완충제 (50 mM CAPS, pH 10.0 (NaOH를 첨가함으로써 pH를 pH 10.0으로 변경), 100 mM NaCl) 프리 믹스에 첨가하였다. 이어서, 프리 믹스를 단일 나노포어 실험 시스템에 첨가하였다. 전위 플립 프로세스 (30 min 동안 +120 mV, 이어서, 2초 동안 -100 mV, 및 이어서, 2초 동안 0 mV) 후 2시간 동안 실험을 수행하고, 헬리카제 제어형 DNA 이동을 모니터링하였다.
3.5 결과 및 논의
람다 DNA 구축물에 대한 헬리카제 제어형 DNA 이동을 관찰하였고, 헬리카제 제어형 DNA 이동의 예는 도 7에 제시되어 있다. 람다 DNA 구축물에 존재하는 iSpC3 스페이서는 도 7에서 번호 1-3으로 강조 표시된 특징적인 차단 수준을 나타내었다. Y형 2 MuA 기질은 양 가닥에 4개의 iSpC3 스페이서를 가지고, 헤어핀 2 MuA 기질 또한 4개의 iSpC3 스페이서를 가지는데, 각 iSpC3 스페이서는, 람다 DNA 구축물의 상기 영역이 나노포어를 통해 전위됨에 따라 더 많은 전류가 흐르게 할 수 있다. 샘플이 성공적으로 제조되었다면, 이때 iSpC3 스페이서 이벤트는 람다 DNA 구축물의 시작점, 중간 (센스 및 안티센스 서열 사이의 전이를 표시) 및 종점에서 관찰될 것이다. 도 7은 iSpC3 스페이서 영역에 상응하는 전류 흐름 증가에 대한 3가지 예시를 명확하게 보여준다. 그러므로, 샘플 제조 방법은 도 6 (b)에 제시된 람다 DNA 구축물을 제조하기 위해 람다 DNA 내로 MuA 기질을 효과적으로 도입하였다. 나노포어에 의해 DNA가 포획되었을 때, 효소 (A로 표지)는 나노포어를 통해 인가된 전위력에 의해 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나 이동한다. Y형 2 및 헤어핀 2 MuA 기질에서 이노신이 사용되기 때문에, 일단 MuA 기질이 삽입되고 나면, 그 모두는 이중 가닥 DNA 구축물 중 닉을 폐쇄시키는 데 필요하였는 바, 샘플 제조 방법의 단계는 축소되었다.
실시예 4
본 실시예는 나노포어를 통한 무손상 DNA 가닥 (마지막의 것이 스페이서 기의 5' 말단에 부착된 추가의 2개의 T를 갖는 것인 28개의 iSpC3 스페이서 유닛은 서열 23의 5' 말단에 부착되어 있고, 서열 24의 5' 말단에 부착된 추가의 4개의 iSpC3 스페이서는 서열 23의 3' 말단에 부착되어 있고, 여기서, 서열 12는 서열 23의 영역에 혼성화된다)의 이동을 제어할 수 있는 TrwC Cba 단량체 (서열 17)의 능력을 TrwC Cba Q276C-3.4 kDa 이량체 (각 단량체 유닛은 돌연변이 Q276C를 포함하는 서열 17을 포함하며, 여기서, 한 단량체 유닛은 3.4 kDa PEG 링커를 사용하여 각 단량체 유닛의 276번 위치를 통해 나머지 다른 한 유닛에 연결되어 있다)의 능력과 비교한다. 본 실시예에서 사용된 DNA 구축물은 도 22에 제시되어 있다 (헬리카제는 B로 표지된 영역에 결합할 수 있다). DNA 구축물이 나노포어에 의해 포획되고 나면, 나노포어를 통한 인가된 전위는 효소가 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나도록 이동시키고, 헬리카제 제어형 DNA 이동이 관찰된다.
단량체의 헬리카제 제어형 이동을 이량체의 것과 비교하였을 때, 단량체보다 이량체의 경우에 더 큰 비율로 장시간의 지속 헬리카제 제어형 DNA 이동 (장시간의 지속 이동은 주요 집단의 헬리카제 제어형 DNA 이동의 평균치로부터의 표준 편차는 3을 초과하는 것인 헬리카제 제어형 DNA 이동임)이 이루어진 것으로 관찰되었다.
물질 및 방법
실험을 세팅하기 전, DNA (1 nM, 마지막의 것이 스페이서 기의 5' 말단에 부착된 추가의 2개의 T를 갖는 것인 28개의 iSpC3 스페이서 유닛은 서열 23의 5' 말단에 부착되어 있고, 서열 24의 5' 말단에 부착된 추가의 4개의 iSpC3 스페이서는 서열 23의 3' 말단에 부착되어 있고, 여기서, 서열 12는 서열 23에 혼성화된다) 및 효소 (TrwC Cba 단량체 (1 nM, 서열 17) 또는 TrwC Cba Q276C-3.4 kDa 이량체 (0.3 nM, 각 단량체 유닛은 돌연변이 Q276C를 포함하는 서열 17을 포함하고, 여기서, 한 단량체 유닛은 3.4 kDa PEG 링커를 사용하여 각 단량체 유닛의 276번 위치를 통해 나머지 다른 한 유닛에 연결되어 있다))를 >16시간 동안 함께 미리 인큐베이션시켰다.
전기적 측정은 완충제 (625 mM KCl, 100 mM Hepes, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8) 중 블록 공중합체에 삽입된 단일 MspA 나노포어 MS(G75S/G77S/L88N/Q126R)8 MspA (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2)로부터 획득하였다. MgCl2 (10 mM) 및 dTTP (5 mM)를 완충제 (625 mM KCl, 100 mM Hepes, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)와 함께 혼합한 후, DNA (앞서 기술된 구축물), 효소 프리 믹스 (TrwC Cba 단량체 (1 nM, 서열 17) 또는 TrwC Cba Q276C-3.4 kDa 이량체 (1 nM, 각 단량체 유닛은 돌연변이 Q276C를 포함하는 서열 17을 포함하고, 여기서, 한 단량체 유닛은 3.4 kDa PEG 링커를 사용하여 각 단량체 유닛의 276번 위치를 통해 나머지 다른 한 유닛에 연결되어 있다))에 첨가하였다. 이중층 중에서 단일 포어를 수득한 후, 프리 믹스를 단일 나노포어 실험 시스템에 첨가하였다. +120 mV의 정전위에서 실험을 수행하고, 헬리카제 제어형 DNA 이동을 모니터링하였다.
결과 및 논의
헬리카제 TrwC Cba 단량체 (서열 17) 및 TrwC Cba Q276C-3.4 kDa 이량체 (각 단량체 유닛은 돌연변이 Q276C를 포함하는 서열 17을 포함하고, 여기서, 한 단량체 유닛은 3.4 kDa PEG 링커를 사용하여 각 단량체 유닛의 276번 위치를 통해 나머지 다른 한 유닛에 연결되어 있다)에 대한 헬리카제 제어형 DNA 이동을 관찰하였다. 나노포어에 의한 DNA 구축물 포획시, 헬리카제는 나노포어를 통해 인가된 전위력에 의해 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나 이동하였고, 헬리카제 제어형 이동이 관찰되었다.
관찰된 헬리카제 제어형 DNA 이동 중 주요 집단은 검출된 이동의 약 95%를 차지하였지만, 적은 비율의 이동은 지속 시간이 유의적으로 더 길었다 (주요 집단의 헬리카제 제어형 DNA 이동의 평균치로부터의 표준 편차는 3을 초과한다). 이와 같이 이동 시간이 길어짐에 따라 데이터 분석은 개선될 수 있다. TrwC Cba Q276C-3.4 kDa 이량체 (1 nM)를 사용하여 DNA 이동을 제어하였을 때, 훨씬 더 높은 비율 (TrwC Cba 단량체의 경우, 5%인 것과 비교하여, TrwC Cba Q276C-3.4 kDa 이량체의 경우, 20%)의 상기와 같이 더욱 긴 지속 시간의 이동 (주요 집단의 헬리카제 제어형 DNA 이동의 평균치로부터의 표준 편차는 3을 초과한다)이 관찰되었다. 이량체 헬리카제를 통해 나노포어 서열분석 시스템에서 개선된 데이터 분석을 수행할 수 있는 바, 이량체 헬리카제를 사용하는 것이 단량체보다 우수한 이점을 제공한다.
실시예 5
본 실시예는 효소 활성을 시험하기 위한 형광 기반 검정법에서 (ATP 및 MgCl2, 둘 모두를 제공받았을 때) Hel308 Mbu (서열 28)의 이동을 정지시키는 데 Sp9 스페이서 유닛이 사용될 수 있다는 것을 예시한다.
물질 및 방법
3개의 상이한 시판용 형광성 기질 (A = (스페이서를 함유하지 않는 대조군 가닥) 서열 25 및 26, B = (단일 Sp9 스페이서를 함유하는 가닥) 그의 3' 말단에서 1개의 Sp9 스페이서에 의해 서열 29의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27, C = (4개의 Sp9를 함유하는 가닥) 그의 3' 말단에서 4개의 Sp9 스페이서에 의해 서열 29의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27)을 사용하여 혼성화된 dsDNA를 치환할 수 있는 Hel308 Mbu (서열 28)의 능력을 검정하였다. FAM 표지된 DNA (형광성 기질을 위해, A = 서열 25, B = 서열 29의 3' 말단에 부착된 1개의 sp9 스페이서에 그의 3' 말단에 의해 부착된 서열 27, C = 서열 29의 3' 말단에 부착된 4개의 sp9 스페이서에 그의 3' 말단에 의해 부착된 서열 27)를, 그의 3' 말단에 블랙-홀 소광제가 부착되어 있는 부분적으로 상보성인 가닥 (서열 26)에 1:1 비율로 (각 가닥 1 uM씩) 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA 중에서 어닐링시켰다. 가닥을 실온에서 30분 동안 어닐링시켰다. 어닐링된 DNA (A = 서열 25 및 26, B = 그의 3' 말단에서 1개의 Sp9 스페이서에 의해 서열 29의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27, C = 그의 3' 말단에서 4개의 Sp9 스페이서에 의해 서열 29의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27)를 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA, 1 mM ATP (1 uM 포획 DNA (서열 27 또한 존재)) 중에서 50 nM으로 희석시켰다. Hel308 Mbu (서열 28)의 샘플을 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA 중에서 475 nM로 희석시켰다. 이어서, Hel308 Mbu (12 nM)를 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA, 0.975 mM ATP (0.975 uM 포획 DNA 또한 존재) 중에서 48.75 nM의 어닐링된 DNA에 대하여 (하기 기술되고, 도 8 및 9에 제시된 바와 같이) 검정하였다.
대조군 가닥 A는 도 8에 제시되어 있으며, 여기서, 1A)에서 형광성 기질 가닥 (48.75 nM 최종)은 3' ssDNA 오버행, 및 40개의 염기로 된 혼성화된 dsDNA 섹션을 가진다. 3' ssDNA 오버행을 함유하는 상단 가닥은 서열 25의 5' 말단에 부착된 카르복시플루오레세인 염기를 가지고, 혼성화된 상보체는 서열 26의 3' 말단에 부착된 블랙-홀 소광제 (BHQ-1) 염기를 가진다. 혼성화되면, 플루오레세인으로부터의 형광은 국소 BHQ-1에 의해 소광되고, 기질은 본질적으로 비형광성이 된다. 형광성 기질의 하단 가닥과 부분적으로 상보적인, 1 μM의 포획 가닥 (서열 27)이 본 검정에 포함된다. 2A)에 제시된 바와 같이, ATP (0.975 mM) 및 MgCl2 (10 mM)의 존재하에서, 기질에 첨가된 헬리카제 (12 nM)는 형광성 기질의 3' 꼬리에 결합하여 상단 가닥을 따라 이동하여 상보성 가닥을 치환시킨다. 3A)에 제시된 바와 같이, 일단 BHQ-1을 포함하는 상보성 가닥이 완전하게 치환되고 나면, 주요 가닥 상의 플루오레세인은 형광을 발한다. 4A)에 제시된 바와 같이, 치환된 가닥은 과량의 포획 가닥에 우선적으로 어닐링하여 초기 기질의 재어닐링 및 형광 손실을 막는다. 도 9는 가닥 B (1B-3B) 및 C (1C-3C)에 대한 검정 단계를 보여주는 것으로서, 이들 가닥의 경우, Sp9 스페이서는 헬리카제를 정지시키고, 헬리카제가, 플루오레세인이 부착된 가닥을 블랙-홀 소광제가 부착되어 있는 가닥으로부터 분리시키지 못하도록 막는다.
결과 및 논의
도 10의 그래프는 400 mM의 KCl에서 Hel308 Mbu (도 8 및 9에서 A로 표지; 서열 28)에 대한 완충제 용액 (100 mM Hepes pH 8.0, 0.975 mM ATP, 10 mM MgCl2, 1 mg/ml BSA, 48.75 nM 형광성 기질 DNA (상기 논의된 기질 A, B 및 C), 0.975 μM 포획 DNA (서열 27)) 중에서의 활성의 초기 속도를 보여주는 것이다. 조사된 염 농도에서, Hel308 Mbu (서열 28)는 대조군 가닥 A의 dsDNA 교체를 보였다. 그러나, 도 10은 서열 (B (1개의 Sp9 스페이서) 및 C (4개의 Sp9 스페이서))에 Sp9 스페이서를 갖는 2개의 구축물 모두, dsDNA 교체는 폐기되었다는 것을 명확하게 나타낸다. 이는 ATP 및 MgCl2의 존재 하에 Sp9 스페이서가 유리 용액 중에서 Hel308 Mbu 효소를 정지시킨다는 것을 나타낸다.
실시예 6
본 실시예는 효소 활성을 시험하기 위한 형광 기반 검정법에서 (ATP 및 MgCl2, 둘 모두를 제공받았을 때) Hel308 Mbu (서열 28)의 이동을 정지시키는 데 idSp 기가 사용될 수 있다는 것을 예시한다.
물질 및 방법
4개의 상이한 시판용 형광성 기질 (D = (스페이서를 함유하지 않는 대조군 가닥) 서열 32 및 26, E = (단일 idSp 스페이서를 함유하는 가닥) 그의 3' 말단에서 1개의 idSp 기에 의해 서열 30의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27, F = (4개의 idSp를 함유하는 가닥) 그의 3' 말단에서 4개의 idSp 기에 의해 서열 31의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27 및 G = (스페이서를 함유하지 않는 제2 대조군 가닥) 서열 33 및 26)을 사용하여 혼성화된 dsDNA를 치환할 수 있는 Hel308 Mbu (서열 28)의 능력을 검정하였다. FAM 표지된 DNA (형광성 기질을 위해, D - 서열 32, E = 서열 30의 3' 말단에 부착된 1개의 idSp 기에 그의 3' 말단에 의해 부착된 서열 27, F = 서열 31의 3' 말단에 부착된 4개의 idSp 기에 그의 3' 말단에 의해 부착된 서열 27 및 G = 서열 33)를, 그의 3' 말단에 블랙-홀 소광제가 부착되어 있는 부분적으로 상보성인 가닥 (서열 26)에 1:1.2 비율로 (1:1.2 μM) 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA 중에서 어닐링시켰다. 가닥을 실온에서 15분 동안 어닐링시켰다. 어닐링된 DNA (D = 서열 32 및 26, E = 그의 3' 말단에서 1개의 idSp 기에 의해 서열 30의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27, F = 그의 3' 말단에서 4개의 idSp 기에 의해 서열 31의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27 및 G = 서열 33 및 26)를 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA, 1 mM ATP (1 uM 포획 DNA (서열 27 또한 존재)) 중에서 50 nM으로 희석시켰다. 이어서, Hel308 Mbu (12 nM)를 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA, 0.975 mM ATP (0.975 uM 포획 DNA 또한 존재) 중에서 48.75 nM의 어닐링된 DNA에 대하여 (실시예 5에 기술된 바와 같이 (단, 예외적으로, DNA 구축물은 상이하고, Sp9 스페이서 대신 idSp 기를 함유한다), 및 도 8 및 9에 제시된 바와 같이 (또한, 본 도면에서 Sp9 기는 idSp 기로 대체된다)) 검정하였다.
결과 및 논의
도 11의 그래프는 400 mM의 KCl에서 Hel308 Mbu (도 8 및 9에서 A로 표지)에 대한 완충제 용액 (100 mM Hepes pH 8.0, 0.975 mM ATP, 10 mM MgCl2, 1 mg/ml BSA, 48.75 nM 형광성 기질 DNA (상기 논의된 기질 D, E, F 및 G), 0.975 μM 포획 DNA (서열 27)) 중에서의 활성의 초기 속도를 보여주는 것이다. 조사된 염 농도에서, Hel308 Mbu (서열 28)는 대조군 가닥 D 및 G의 dsDNA 교체를 보였다. 그러나, 도 11은 서열 (F)에 4개의 idSp 스페이서를 갖는 구축물의 경우, dsDNA 교체는 폐기되었다는 것을 명확하게 나타낸다. 이는 ATP 및 MgCl2의 존재 하에 4개의 idSp 기가 유리 용액 중에서 Hel308 Mbu 효소를 정지시킨다는 것을 나타낸다.
실시예 7
본 실시예는 T4 Dda - E94C/A360C의 이동을 정지시킬 수 있는 iSpC3 스페이서 및 iSp18 스페이서의 능력을 측정하는 데 사용된 겔 기반 검정법을 예시하는 것이다.
물질 및 방법
어닐링된 DNA 복합체 (시험된 서열은 하기 표 11에 제시되어 있다)를 25 mM 포스페이트 (pH 8.0), 200 mM KCl 중 T4 Dda - E94C/A360C와 (1:1, v/v)의 비로 혼합하여 최종 농도의 T4 Dda - E94C/A360C (2,000 nM) 및 DNA (100 nM)를 수득하였다. 헬리카제를 주변 온도에서 2시간 동안 DNA에 결합하게 하였다. 포획 가닥 (서열 37, 20 μM)을 각 샘플에 첨가하여 임의의 비결합 효소에 결합시키고, 샘플을 주변 온도에서 30 min 동안 인큐베이션시켰다. 완충제를 샘플에 첨가하고 (하기 표 11로부터의 DNA 구축물 = 50 nM, 포획 DNA (서열 37) = 10 μM 및 T4 Dda - E94C/A360C = 1,000 nM), 주변 온도에서 1시간 동안 인큐베이션시켰다 (완충제 1 = 25 mM 포스페이트 (pH 8.0), 200 mM KCl, 20 mM MgCl2, 10 mM ATP 또는 완충제 2 = 25 mM 포스페이트 (pH 8.0), 1 M KCl, 25 mM 페리시안화 칼륨 (III), 75 mM 페로시안화 칼륨, 20 mM MgCl2, 10 mM ATP). 로딩 완충제 (25 mM 포스페이트 (pH 8.0), 151.5 mM KCl, 25% 글리세롤, 125 mM EDTA)를 각 샘플에 첨가하여 헬리카제 활성을 켄칭시켰다. 샘플을 4-20% TBE 겔 상에 로딩하고, 겔을 1.5시간 동안 160 V에서 전개시켰다. 이어서, DNA 밴드를 관찰하기 위해 겔을 SYBR 골드로 염색시켰다.
[표 11]
Figure pct00011
결과 및 논의
도 12는, DNA 구축물이 헬리카제 (T4 Dda - E94C/A360C)를 정지시키는 스페이서를 함유하지 않는 양성 대조군 실험의 겔을 보여주는 것이다. 도 14의 레인 2는 최대 5개의 헬리카제 효소가 서열 34의 단일 가닥 섹션 상에 결합할 수 있다는 것을 보여주는 것이다. ATP 및 MgCl2 첨가시, 다중 효소에 결합한 dsDNA 구축물에 상응하는 더 높은 고역 밴드는 소실되었고, ssDNA 구축물에 상응하는 밴드 (X로 표시 및 단 서열 34에 상응)는 강도가 증가하였다. 이는 헬리카제가 연료를 받았을 때에는 DNA를 따라 이동하여 혼성화된 상보성 가닥 (서열 35)을 치환한다는 것을 나타낸다.
도 15는 표 11의 DNA 구축물 7-9 (예컨대, 예컨대, ssDNA/dsDNA 연접부 바로 앞에 3, 4, 또는 5개의 iSp18 스페이서를 갖는 DNA)에 대한 효소 활성 실험을 보여주는 겔 실시예를 보여주는 것이다. 레인 1-4는 3개의 iSp18 스페이서에 상응하고, 레인 5-7은 4개의 iSp18 스페이서에 상응하고, 레인 9-12는 5개의 iSp18 스페이서에 상응한다. 레인 2, 6 및 10은 대조군과 유사하게, 최대 5개의 헬리카제 효소가 표 11의 DNA 구축물 7-9의 단일 가닥 섹션에 결합할 수 있다는 것을 보여준다. ATP 및 MgCl2 첨가시, 헬리카제는 DNA 가닥을 따라 이동하기 위해 필요한 성분을 제공받을 것이다. 레인 3-4, 7-8 및 11-12는 ATP 및 MgCl2 첨가 첨가 후 상이한 2가지 완충제 조건 (완충제 1 및 2) 하에서의 다양한 DNA 구축물을 보여주는 것이다. 1Y 및 1X로 표지된 영역에서 2개의 밴드가 뚜렷이 보인다. 1Y는 1개의 헬리카제가 정지되어 있고, 결합되어 있는 dsDNA 구축물에 상응한다. 이는 3, 4, 및 5개의 iSP18 스페이서가 시험된 조건하에서 헬리카제를 정지시킬 수 있다는 것을 보여주는 것이다. 1X는 1개의 헬리카제가 정지되어 있고, 결합되어 있는 ssDNA 구축물에 상응한다. 상기 밴드는 DNA 구축물에 결합하는 다중 헬리카제, 및 앞쪽 헬리카제가 정지 기를 지나도록 인출하여 짧은 단쇄 상보성 가닥 (서열 35)을 치환하도록 하는 헬리카제로부터 생성된 결과이다. 그러나, 단일 헬리카제는 iSp18 스페이서를 지나 이동할 수 없는 바, 상기 밴드는 여전히 1개의 헬리카제가 결합되어 있는 것이다 (예컨대, 도 13 결과에서 종 E). 헬리카제를 정지시키는 데 4 및 5개의 iSp18 스페이서가 사용된 경우, 2Y 수준에 희미한 밴드가 존재한다. 이는 시험된 조건하에서 4/5개의 iSp18 스페이서가 사용되었을 때, 최대 2개의 헬리카제의 이동을 정지시킬 수 있다는 것을 보여주는 것이다.
1개 이상의 시험된 완충제 조건에서 조사된 다른 스페이서 조합 (표 11의 엔트리 2-6) 중 iSpC3 및 iSp18 스페이서, 둘 모두 1개의 헬리카제를 정지시킬 수 있었다. 시험된 2가지 완충제 조건 중에서 일반적으로는 완충제 1보다는 완충제 2의 경우에 더욱 효율적으로 정지된 것이 관찰되었다. 포함된 스페이서 개수가 많을수록, 시험된 조건하에서 헬리카제는 더욱 효율적으로 정지되었다.
실시예 8
본 실시예는 특정 영역에서 단 1개 또는 2개의 T4 Dda - E94C/A360C 헬리카제의 결합을 제어하는 데 필요한 염기의 개수를 조사한다.
물질 및 방법
하기 표 12에 상세하게 기술된 DNA 구축물 (1 μM 또는 100 nM 최종 농도)을 적절한 완충제 중에서 일련으로 희석된 T4 Dda - E94C/A360C와 함께 인큐베이션시켰다. 이어서, 샘플을 4-20% TBE 겔 상에 로딩하고, 90분 동안 160 V에서 전개시켰다. 이어서, 엔트리 1-6을 함유하는 겔을 SYBR로 염색시켰다. 도 16은 본 실험에서 사용된 DNA 구축물의 유형을 보여주는 것이다. 1로 표지된 영역의 길이는 DNA에 결합할 수 있는 T4 Dda - E94C/A360C 헬리카제의 개수를 제어할 수 있도록 조건을 최적화하기 위해 2 내지 50으로 가변된다.
[표 12]
Figure pct00012
Figure pct00013
결과 및 논의
2개의 염기 내지 50개의 염기로 가변된 영역 1 (도 16에 제시)에 몇개의 효소가 결합할 수 있는지 측정하기 위해 표 12에 열거되어 있는 각 DNA 구축물을 조사하였다. 시험된 각 DNA 구축물의 경우, 헬리카제가 첨가되지 않았을 때에는 오직 DNA에 비결합인 것에 대한 단일 밴드만이 관찰되었다. 조사된 조건하에서, (2개의 티민 염기로 이루어진 결합 영역을 가지는) 구축물 4 및 (4개의 티민 염기로 이루어진 결합 영역을 가지는) 구축물 5는 어느 농도에서도 임의의 헬리카제의 결합을 허용하지 않는 것으로 관찰되었다 (하기 표 14 참조). 구축물 6 (8개의 티민 염기로 이루어진 결합 영역을 갖는 것, 하기 표 14 참조) 및 (10개의 티민 염기로 이루어진 결합 영역을 가지는) 구축물 1은 오직 1개의 헬리카제만 결합하는 것으로 관찰되었다 (하기 표 13 참조). 20개의 티민 염기로 이루어진 결합 영역을 갖는 구축물 2는 시험된 더 높은 농도에서도 2개의 효소가 결합할 수 있게 하였고, 50개의 티민 염기로 이루어진 결합 영역을 갖는 구축물 3은 시험된 최고 농도에서 최대 6개까지의 효소가 결합할 수 있게 하였다 (본 실험을 보여주는 겔에 대해서는 도 17을 참조, 하기 표 13 참조). 구축물 1-6은 ssDNA/dsDNA 영역의 연접부에 헬리카제가 결합하지 못하도록 막는 데 iSpC3 스페이서를 사용하였다. 구축물 7 및 8은 ssDNA/dsDNA 영역의 연접부에 헬리카제가 결합하지 못하도록 막는 데 iSp18 스페이서를 사용하였다. (16개의 티민으로 이루어진 결합 영역을 가지는) 구축물 7 및 (18개의 티민으로 이루어진 결합 영역을 가지는) 구축물 8, 둘 모두 시험된 조건하에서 최대 2개까지의 헬리카제가 결합할 수 있게 하였다 (하기 표 15 참조). 그러므로, 길이가 8개 초과의 티민 염기 길이인 결합 영역을 통해서는 1개 이상의 효소가 DNA 구축물에 결합할 수 있다.
[표 13]
Figure pct00014
[표 14]
Figure pct00015
[표 15]
Figure pct00016
실시예 9
본 실시예는 (도 18에서 기술되고, 그에 제시된) DNA 구축물 X에 부가되었을 때, 2개의 헬리카제가 결합하도록 하는 T4 Dda - E94C/A360C 헬리카제의 농도를 조사한다.
물질 및 방법
포크형이 아닌 DNA의 상보성을 갖는 것 하나 (도 18에 제시된 바와 같이 서열 42는 DNA 구축물에 혼성화된다)와, 포크형인 것 하나 (도 18에 제시된 바와 같이 (6개의 iSp18 스페이서가 3' 말단에 부착되어 있는) 서열 12는 DNA 구축물에 혼성화된다)인, 2개의 DNA 구축물을 시험하였다. 하기 표 16에 제시된 DNA는 가닥을 25 mM 포스페이트 (pH 8.0), 1,515.5 mM KCl 중에서 1 μM로 어닐링하였다 (10% 과량의 상보성 가닥 서열 43 (하기에서 엔트리 9 및 10) 및 서열 12 (하기에서 엔트리 10) 또는 서열 42 (하기에서 엔트리 9)를 사용하였다).
[표 16]
Figure pct00017
T4 Dda - E94C/A360C를 25 mM 포스페이트 (pH 8.0), 151.5 mM KCl로 완충제 교환하고, 일련으로 희석시켰다. 이어서, 헬리카제 및 DNA (1:1, v/v)를 상기 기술된 DNA 구축물 샘플 9 및 10과 함께 혼합하였다 (DNA 최종 농도A = 100 nM, 조사된 헬리카제 농도 = 3,800 nM, 1,900 nM, 950 nM, 475 nM, 238 nM, 0 nM). 이어서, DNA 및 효소 부피를 주변 온도에서 1.5시간 동안 인큐베이션시켰다. 염료 무함유 로딩 완충제 (5x, 7.5 ㎕)를 각 샘플 (30 ㎕)에 첨가하였다. 이어서, 샘플 (37.5 ㎕)을 4-20% TBE 겔 상에 로딩하고, 90분 동안 160 V에서 전개시켰다. 이어서, 겔을 SYBR로 염색시켰다.
결과 및 논의
표 16에 열거된 2개의 DNA 구축물을 조사하여 2개의 헬리카제의 결합을 촉진시키기 위해서는 어느 농도의 T4 Dda - E94C/A360C 헬리카제가 필요한지를 측정하였다. 시험된 각 DNA 구축물의 경우, 헬리카제가 첨가되지 않았을 때에는 오직 DNA에 비결합인 것에 대한 단일 밴드만이 관찰되었다. 조사된 조건하에서, 구축물 9 (비포크형 구축물) 및 10 (포크형), 둘 모두 238 nM 헬리카제로부터 한 헬리카제에, 및 475 nM 이상으로부터 2개의 효소의 결합이 관찰되었다. 효소 농도가 증가함에 따라, 2개의 효소 결합에 상응하는 밴드의 강도는 증가하였다. 도 18에 제시된 DNA 구축물의 디자인을 통해 3,800 nM만큼 높은 농도에서 단 2개의 효소가 결합할 수 있다. 그러므로, 구축물이 미리 인큐베이션된 때에는 조사된 스페이서에 의해서는 헬리카제가 그에 결합할 수 없다.
실시예 10
본 실시예는 구축물 (DNA 구축물 X1)이 나노포어에 의해 포획되었을 때, T4 Dda - E94C/A360C가 유리 용액 중 4개의 iSp18 스페이서에 의해 어떻게 정지되는지를 보여준다. 포획시, 인가된 전위력이 효소 T4 Dda - E94C/A360C가 정지 스페이서를 지나도록 이동시키고, 나노포어를 통과하는 람다 구축물의 효소 제어형 DNA 이동을 가능하게 한다.
물질 및 방법
실험을 세팅하기 전, DNA 구축물 X1 (0.13 ㎕, 100 nM) 및 T4 Dda - E94C/A360C (15.6 ㎕, 250 nM)를 함께 완충제 (50 mM 인산칼륨, 253 mM KCl, pH 8.0) 중에서 실온에서 1시간 동안 미리 인큐베이션시켰다.
전기적 측정은 (냉각기 플레이트 상에 실험 시스템을 배치함으로써) 30℃에서 완충제 (600 mM KCl, 25 mM 인산칼륨, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8) 중 블록 공중합체에 삽입된 단일 MspA 나노포어 (MspA - B2C)로부터 획득하였다. 블록 공중합체에 삽입된 단일 포어를 수득한 후, 이어서, 완충제 (1 mL, 600 mM KCl, 25 mM 인산칼륨, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)를 시스템을 통해 유동시켜 임의의 과량의 MspA 나노포어 (MspA - B2C)를 제거하였다. 페리시안화 칼륨 (III) (200 μM 최종 농도)을 DNA (0.1 nM 최종 농도) 효소 (3 nM 최종 농도) 프리 믹스에 첨가하고, 1분 동안 방치하여 인큐베이션시킨 후, MgCl2 (10 mM 최종 농도) 및 ATP (1 mM 최종 농도)를 함께 완충제 (1,260 ㎕, 600 mM KCl, 25 mM 인산칼륨, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)와 혼합하였다. 이어서, 상기 실험 믹스를 단일 나노포어 실험 시스템에 첨가하였다. 전위 플립 프로세스 (2 s 동안 +180 mV, 이어서, 2 s 동안 0 V, 및 이어서, 3,600 s 동안 -120 mV로 시스 측에서 인가(x6회 반복)) 후 6시간 동안 실험을 수행하고, 헬리카제 제어형 DNA 이동을 모니터링하였다.
결과 및 논의
DNA 구축물은 도 20에 제시되어 있다. T4 Dda - E94C/A360C는 DNA 구축물과 미리 인큐베이션되었을 때 구축물 영역 (A로 표지) (서열 9)에 결합할 수 있다. 그러나, 상기 효소는 유리 용액 중에 존재할 경우에는 정지 기 (4개의 iSp18 스페이서)를 지나 이동하지 못한다 (검은색 박스로 표지). 그러므로, DNA 구축물이 나노포어에 의해 포획될 때까지 효소는 iSp18 스페이서 (도 1에서 B로 표지)에서 정지되어 있다. 일단 나노포어에 의해 포획되고 나면, 인가된 전위력은 효소 T4 Dda - E94C/A360C가 정지 스페이서 (4개의 iSp18 스페이서)를 지나도록 이동시키고, 나노포어를 통과하는 DNA 구축물 X1 구축물의 효소 제어형 DNA 이동을 가능하게 한다. 헬리카제 제어형 DNA 이동의 일례가 도 21에 제시되어 있다. 1로 표지된 섹션은 서열 38의 pT 영역이 헬리카제의 제어하에 나노포어를 통해 전위되었을 때를 나타낸 것이다. 2로 표지된 섹션은 iSp18 스페이서가 헬리카제의 제어하에 나노포어를 통해 전위되었을 때를 나타낸 것이다. 관찰된 헬리카제 이벤트는 헬리카제 제어형 DNA 이동 시작점에서 pT 영역 및 iSp18 신호를 보였는 바, 헬리카제는 (iSp18 스페이서에 의한 헬리카제의 정지로부터 생성되는) 정의된 출발점을 갖는 것으로 관찰되었다.
SEQUENCE LISTING <110> OXFORD NANOPORE TECHNOLOGIES LIMITED <120> ENZYME STALLING METHOD <130> N402011WO <150> 61/774,694 <151> 2013-03-08 <150> 1314695.6 <151> 2013-08-16 <150> 1318464.3 <151> 2013-10-18 <160> 43 <170> PatentIn version 3.5 <210> 1 <211> 558 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding the MS-B1 mutant MspA monomer <400> 1 atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60 caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120 tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180 ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240 ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300 ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360 ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420 ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480 ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540 ccgtggaata tgaactaa 558 <210> 2 <211> 184 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of the mature form of the MS-B1 mutant of the MspA monomer <400> 2 Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu 1 5 10 15 Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp 20 25 30 Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr 35 40 45 Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu 50 55 60 Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe 65 70 75 80 Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala 85 90 95 Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly 100 105 110 Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val 115 120 125 Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val 130 135 140 Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu 145 150 155 160 Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr 165 170 175 Tyr Gly Glu Pro Trp Asn Met Asn 180 <210> 3 <211> 885 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence encoding one monomer of alpha-hemolysin-E111N/K147N <400> 3 atggcagatt ctgatattaa tattaaaacc ggtactacag atattggaag caatactaca 60 gtaaaaacag gtgatttagt cacttatgat aaagaaaatg gcatgcacaa aaaagtattt 120 tatagtttta tcgatgataa aaatcacaat aaaaaactgc tagttattag aacaaaaggt 180 accattgctg gtcaatatag agtttatagc gaagaaggtg ctaacaaaag tggtttagcc 240 tggccttcag cctttaaggt acagttgcaa ctacctgata atgaagtagc tcaaatatct 300 gattactatc caagaaattc gattgataca aaaaactata tgagtacttt aacttatgga 360 ttcaacggta atgttactgg tgatgataca ggaaaaattg gcggccttat tggtgcaaat 420 gtttcgattg gtcatacact gaactatgtt caacctgatt tcaaaacaat tttagagagc 480 ccaactgata aaaaagtagg ctggaaagtg atatttaaca atatggtgaa tcaaaattgg 540 ggaccatacg atcgagattc ttggaacccg gtatatggca atcaactttt catgaaaact 600 agaaatggtt ctatgaaagc agcagataac ttccttgatc ctaacaaagc aagttctcta 660 ttatcttcag ggttttcacc agacttcgct acagttatta ctatggatag aaaagcatcc 720 aaacaacaaa caaatataga tgtaatatac gaacgagttc gtgatgatta ccaattgcat 780 tggacttcaa caaattggaa aggtaccaat actaaagata aatggacaga tcgttcttca 840 gaaagatata aaatcgattg ggaaaaagaa gaaatgacaa attaa 885 <210> 4 <211> 293 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of one monomer of alpha-HL-NN <400> 4 Ala Asp Ser Asp Ile Asn Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser 1 5 10 15 Asn Thr Thr Val Lys Thr Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn 20 25 30 Gly Met His Lys Lys Val Phe Tyr Ser Phe Ile Asp Asp Lys Asn His 35 40 45 Asn Lys Lys Leu Leu Val Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln 50 55 60 Tyr Arg Val Tyr Ser Glu Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp 65 70 75 80 Pro Ser Ala Phe Lys Val Gln Leu Gln Leu Pro Asp Asn Glu Val Ala 85 90 95 Gln Ile Ser Asp Tyr Tyr Pro Arg Asn Ser Ile Asp Thr Lys Asn Tyr 100 105 110 Met Ser Thr Leu Thr Tyr Gly Phe Asn Gly Asn Val Thr Gly Asp Asp 115 120 125 Thr Gly Lys Ile Gly Gly Leu Ile Gly Ala Asn Val Ser Ile Gly His 130 135 140 Thr Leu Asn Tyr Val Gln Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro 145 150 155 160 Thr Asp Lys Lys Val Gly Trp Lys Val Ile Phe Asn Asn Met Val Asn 165 170 175 Gln Asn Trp Gly Pro Tyr Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly 180 185 190 Asn Gln Leu Phe Met Lys Thr Arg Asn Gly Ser Met Lys Ala Ala Asp 195 200 205 Asn Phe Leu Asp Pro Asn Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe 210 215 220 Ser Pro Asp Phe Ala Thr Val Ile Thr Met Asp Arg Lys Ala Ser Lys 225 230 235 240 Gln Gln Thr Asn Ile Asp Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr 245 250 255 Gln Leu His Trp Thr Ser Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp 260 265 270 Lys Trp Thr Asp Arg Ser Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys 275 280 285 Glu Glu Met Thr Asn 290 <210> 5 <211> 184 <212> PRT <213> Mycobacterium smegmatis <400> 5 Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu 1 5 10 15 Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp 20 25 30 Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr 35 40 45 Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu 50 55 60 Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe 65 70 75 80 Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala 85 90 95 Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly 100 105 110 Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val 115 120 125 Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val 130 135 140 Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu 145 150 155 160 Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr 165 170 175 Tyr Gly Glu Pro Trp Asn Met Asn 180 <210> 6 <211> 184 <212> PRT <213> Mycobacterium smegmatis <400> 6 Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu 1 5 10 15 Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp 20 25 30 Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr 35 40 45 Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu 50 55 60 Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe 65 70 75 80 Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly 85 90 95 Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly 100 105 110 Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val 115 120 125 Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val 130 135 140 Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu 145 150 155 160 Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr 165 170 175 Tyr Gly Glu Pro Trp Asn Met Asn 180 <210> 7 <211> 183 <212> PRT <213> Mycobacterium smegmatis <400> 7 Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr 1 5 10 15 Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg 20 25 30 Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His 35 40 45 Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly 50 55 60 Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser 65 70 75 80 Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro 85 90 95 Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val 100 105 110 Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala 115 120 125 Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser 130 135 140 Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg 145 150 155 160 Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr 165 170 175 Gly Glu Pro Trp Asn Met Asn 180 <210> 8 <211> 439 <212> PRT <213> Enterobacteria phage T4 <400> 8 Met Thr Phe Asp Asp Leu Thr Glu Gly Gln Lys Asn Ala Phe Asn Ile 1 5 10 15 Val Met Lys Ala Ile Lys Glu Lys Lys His His Val Thr Ile Asn Gly 20 25 30 Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Glu Ala 35 40 45 Leu Ile Ser Thr Gly Glu Thr Gly Ile Ile Leu Ala Ala Pro Thr His 50 55 60 Ala Ala Lys Lys Ile Leu Ser Lys Leu Ser Gly Lys Glu Ala Ser Thr 65 70 75 80 Ile His Ser Ile Leu Lys Ile Asn Pro Val Thr Tyr Glu Glu Asn Val 85 90 95 Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Lys Cys Arg Val Leu 100 105 110 Ile Cys Asp Glu Val Ser Met Tyr Asp Arg Lys Leu Phe Lys Ile Leu 115 120 125 Leu Ser Thr Ile Pro Pro Trp Cys Thr Ile Ile Gly Ile Gly Asp Asn 130 135 140 Lys Gln Ile Arg Pro Val Asp Pro Gly Glu Asn Thr Ala Tyr Ile Ser 145 150 155 160 Pro Phe Phe Thr His Lys Asp Phe Tyr Gln Cys Glu Leu Thr Glu Val 165 170 175 Lys Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Val Arg Asn 180 185 190 Gly Lys Trp Ile Tyr Asp Lys Val Val Asp Gly His Gly Val Arg Gly 195 200 205 Phe Thr Gly Asp Thr Ala Leu Arg Asp Phe Met Val Asn Tyr Phe Ser 210 215 220 Ile Val Lys Ser Leu Asp Asp Leu Phe Glu Asn Arg Val Met Ala Phe 225 230 235 240 Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Lys Lys Ile 245 250 255 Phe Glu Thr Asp Lys Asp Phe Ile Val Gly Glu Ile Ile Val Met Gln 260 265 270 Glu Pro Leu Phe Lys Thr Tyr Lys Ile Asp Gly Lys Pro Val Ser Glu 275 280 285 Ile Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Ile Glu Ala Glu Tyr 290 295 300 Thr Ser Thr Phe Val Lys Ala Arg Gly Val Pro Gly Glu Tyr Leu Ile 305 310 315 320 Arg His Trp Asp Leu Thr Val Glu Thr Tyr Gly Asp Asp Glu Tyr Tyr 325 330 335 Arg Glu Lys Ile Lys Ile Ile Ser Ser Asp Glu Glu Leu Tyr Lys Phe 340 345 350 Asn Leu Phe Leu Gly Lys Thr Ala Glu Thr Tyr Lys Asn Trp Asn Lys 355 360 365 Gly Gly Lys Ala Pro Trp Ser Asp Phe Trp Asp Ala Lys Ser Gln Phe 370 375 380 Ser Lys Val Lys Ala Leu Pro Ala Ser Thr Phe His Lys Ala Gln Gly 385 390 395 400 Met Ser Val Asp Arg Ala Phe Ile Tyr Thr Pro Cys Ile His Tyr Ala 405 410 415 Asp Val Glu Leu Ala Gln Gln Leu Leu Tyr Val Gly Val Thr Arg Gly 420 425 430 Arg Tyr Asp Val Phe Tyr Val 435 <210> 9 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 1, 2, 3, 7 and 8 <400> 9 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 50 <210> 10 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 1 and 9 <400> 10 ggttgtttct gttggtgctg atattgc 27 <210> 11 <211> 97138 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 1 <400> 11 gctccactaa agggccgatt gacgggcggc gacctcgcgg gttttcgcta tttatgaaaa 60 ttttccggtt taaggcgttt ccgttcttct tcgtcataac ttaatgtttt tatttaaaat 120 accctctgaa aagaaaggaa acgacaggtg ctgaaagcga ggctttttgg cctctgtcgt 180 ttcctttctc tgtttttgtc cgtggaatga acaatggaag tcaacaaaaa gcagctggct 240 gacattttcg gtgcgagtat ccgtaccatt cagaactggc aggaacaggg aatgcccgtt 300 ctgcgaggcg gtggcaaggg taatgaggtg ctttatgact ctgccgccgt cataaaatgg 360 tatgccgaaa gggatgctga aattgagaac gaaaagctgc gccgggaggt tgaagaactg 420 cggcaggcca gcgaggcaga tctccagcca ggaactattg agtacgaacg ccatcgactt 480 acgcgtgcgc aggccgacgc acaggaactg aagaatgcca gagactccgc tgaagtggtg 540 gaaaccgcat tctgtacttt cgtgctgtcg cggatcgcag gtgaaattgc cagtattctc 600 gacgggctcc ccctgtcggt gcagcggcgt tttccggaac tggaaaaccg acatgttgat 660 ttcctgaaac gggatatcat caaagccatg aacaaagcag ccgcgctgga tgaactgata 720 ccggggttgc tgagtgaata tatcgaacag tcaggttaac aggctgcggc attttgtccg 780 cgccgggctt cgctcactgt tcaggccgga gccacagacc gccgttgaat gggcggatgc 840 taattactat ctcccgaaag aatccgcata ccaggaaggg cgctgggaaa cactgccctt 900 tcagcgggcc atcatgaatg cgatgggcag cgactacatc cgtgaggtga atgtggtgaa 960 gtctgcccgt gtcggttatt ccaaaatgct gctgggtgtt tatgcctact ttatagagca 1020 taagcagcgc aacaccctta tctggttgcc gacggatggt gatgccgaga actttatgaa 1080 aacccacgtt gagccgacta ttcgtgatat tccgtcgctg ctggcgctgg ccccgtggta 1140 tggcaaaaag caccgggata acacgctcac catgaagcgt ttcactaatg ggcgtggctt 1200 ctggtgcctg ggcggtaaag cggcaaaaaa ctaccgtgaa aagtcggtgg atgtggcggg 1260 ttatgatgaa cttgctgctt ttgatgatga tattgaacag gaaggctctc cgacgttcct 1320 gggtgacaag cgtattgaag gctcggtctg gccaaagtcc atccgtggct ccacgccaaa 1380 agtgagaggc acctgtcaga ttgagcgtgc agccagtgaa tccccgcatt ttatgcgttt 1440 tcatgttgcc tgcccgcatt gcggggagga gcagtatctt aaatttggcg acaaagagac 1500 gccgtttggc ctcaaatgga cgccggatga cccctccagc gtgttttatc tctgcgagca 1560 taatgcctgc gtcatccgcc agcaggagct ggactttact gatgcccgtt atatctgcga 1620 aaagaccggg atctggaccc gtgatggcat tctctggttt tcgtcatccg gtgaagagat 1680 tgagccacct gacagtgtga cctttcacat ctggacagcg tacagcccgt tcaccacctg 1740 ggtgcagatt gtcaaagact ggatgaaaac gaaaggggat acgggaaaac gtaaaacctt 1800 cgtaaacacc acgctcggtg agacgtggga ggcgaaaatt ggcgaacgtc cggatgctga 1860 agtgatggca gagcggaaag agcattattc agcgcccgtt cctgaccgtg tggcttacct 1920 gaccgccggt atcgactccc agctggaccg ctacgaaatg cgcgtatggg gatgggggcc 1980 gggtgaggaa agctggctga ttgaccggca gattattatg ggccgccacg acgatgaaca 2040 gacgctgctg cgtgtggatg aggccatcaa taaaacctat acccgccgga atggtgcaga 2100 aatgtcgata tcccgtatct gctgggatac tggcgggatt gacccgacca ttgtgtatga 2160 acgctcgaaa aaacatgggc tgttccgggt gatccccatt aaaggggcat ccgtctacgg 2220 aaagccggtg gccagcatgc cacgtaagcg aaacaaaaac ggggtttacc ttaccgaaat 2280 cggtacggat accgcgaaag agcagattta taaccgcttc acactgacgc cggaagggga 2340 tgaaccgctt cccggtgccg ttcacttccc gaataacccg gatatttttg atctgaccga 2400 agcgcagcag ctgactgctg aagagcaggt cgaaaaatgg gtggatggca ggaaaaaaat 2460 actgtgggac agcaaaaagc gacgcaatga ggcactcgac tgcttcgttt atgcgctggc 2520 ggcgctgcgc atcagtattt cccgctggca gctggatctc agtgcgctgc tggcgagcct 2580 gcaggaagag gatggtgcag caaccaacaa gaaaacactg gcagattacg cccgtgcctt 2640 atccggagag gatgaatgac gcgacaggaa gaacttgccg ctgcccgtgc ggcactgcat 2700 gacctgatga caggtaaacg ggtggcaaca gtacagaaag acggacgaag ggtggagttt 2760 acggccactt ccgtgtctga cctgaaaaaa tatattgcag agctggaagt gcagaccggc 2820 atgacacagc gacgcagggg acctgcagga ttttatgtat gaaaacgccc accattccca 2880 cccttctggg gccggacggc atgacatcgc tgcgcgaata tgccggttat cacggcggtg 2940 gcagcggatt tggagggcag ttgcggtcgt ggaacccacc gagtgaaagt gtggatgcag 3000 ccctgttgcc caactttacc cgtggcaatg cccgcgcaga cgatctggta cgcaataacg 3060 gctatgccgc caacgccatc cagctgcatc aggatcatat cgtcgggtct tttttccggc 3120 tcagtcatcg cccaagctgg cgctatctgg gcatcgggga ggaagaagcc cgtgcctttt 3180 cccgcgaggt tgaagcggca tggaaagagt ttgccgagga tgactgctgc tgcattgacg 3240 ttgagcgaaa acgcacgttt accatgatga ttcgggaagg tgtggccatg cacgccttta 3300 acggtgaact gttcgttcag gccacctggg ataccagttc gtcgcggctt ttccggacac 3360 agttccggat ggtcagcccg aagcgcatca gcaacccgaa caataccggc gacagccgga 3420 actgccgtgc cggtgtgcag attaatgaca gcggtgcggc gctgggatat tacgtcagcg 3480 aggacgggta tcctggctgg atgccgcaga aatggacatg gataccccgt gagttacccg 3540 gcgggcgcgc ctcgttcatt cacgtttttg aacccgtgga ggacgggcag actcgcggtg 3600 caaatgtgtt ttacagcgtg atggagcaga tgaagatgct cgacacgctg cagaacacgc 3660 agctgcagag cgccattgtg aaggcgatgt atgccgccac cattgagagt gagctggata 3720 cgcagtcagc gatggatttt attctgggcg cgaacagtca ggagcagcgg gaaaggctga 3780 ccggctggat tggtgaaatt gccgcgtatt acgccgcagc gccggtccgg ctgggaggcg 3840 caaaagtacc gcacctgatg ccgggtgact cactgaacct gcagacggct caggatacgg 3900 ataacggcta ctccgtgttt gagcagtcac tgctgcggta tatcgctgcc gggctgggtg 3960 tctcgtatga gcagctttcc cggaattacg cccagatgag ctactccacg gcacgggcca 4020 gtgcgaacga gtcgtgggcg tactttatgg ggcggcgaaa attcgtcgca tcccgtcagg 4080 cgagccagat gtttctgtgc tggctggaag aggccatcgt tcgccgcgtg gtgacgttac 4140 cttcaaaagc gcgcttcagt tttcaggaag cccgcagtgc ctgggggaac tgcgactgga 4200 taggctccgg tcgtatggcc atcgatggtc tgaaagaagt tcaggaagcg gtgatgctga 4260 tagaagccgg actgagtacc tacgagaaag agtgcgcaaa acgcggtgac gactatcagg 4320 aaatttttgc ccagcaggtc cgtgaaacga tggagcgccg tgcagccggt cttaaaccgc 4380 ccgcctgggc ggctgcagca tttgaatccg ggctgcgaca atcaacagag gaggagaaga 4440 gtgacagcag agctgcgtaa tctcccgcat attgccagca tggcctttaa tgagccgctg 4500 atgcttgaac ccgcctatgc gcgggttttc ttttgtgcgc ttgcaggcca gcttgggatc 4560 agcagcctga cggatgcggt gtccggcgac agcctgactg cccaggaggc actcgcgacg 4620 ctggcattat ccggtgatga tgacggacca cgacaggccc gcagttatca ggtcatgaac 4680 ggcatcgccg tgctgccggt gtccggcacg ctggtcagcc ggacgcgggc gctgcagccg 4740 tactcgggga tgaccggtta caacggcatt atcgcccgtc tgcaacaggc tgccagcgat 4800 ccgatggtgg acggcattct gctcgatatg gacacgcccg gcgggatggt ggcgggggca 4860 tttgactgcg ctgacatcat cgcccgtgtg cgtgacataa aaccggtatg ggcgcttgcc 4920 aacgacatga actgcagtgc aggtcagttg cttgccagtg ccgcctcccg gcgtctggtc 4980 acgcagaccg cccggacagg ctccatcggc gtcatgatgg ctcacagtaa ttacggtgct 5040 gcgctggaga aacagggtgt ggaaatcacg ctgatttaca gcggcagcca taaggtggat 5100 ggcaacccct acagccatct tccggatgac gtccgggaga cactgcagtc ccggatggac 5160 gcaacccgcc agatgtttgc gcagaaggtg tcggcatata ccggcctgtc cgtgcaggtt 5220 gtgctggata ccgaggctgc agtgtacagc ggtcaggagg ccattgatgc cggactggct 5280 gatgaacttg ttaacagcac cgatgcgatc accgtcatgc gtgatgcact ggatgcacgt 5340 aaatcccgtc tctcaggagg gcgaatgacc aaagagactc aatcaacaac tgtttcagcc 5400 actgcttcgc aggctgacgt tactgacgtg gtgccagcga cggagggcga gaacgccagc 5460 gcggcgcagc cggacgtgaa cgcgcagatc accgcagcgg ttgcggcaga aaacagccgc 5520 attatgggga tcctcaactg tgaggaggct cacggacgcg aagaacaggc acgcgtgctg 5580 gcagaaaccc ccggtatgac cgtgaaaacg gcccgccgca ttctggccgc agcaccacag 5640 agtgcacagg cgcgcagtga cactgcgctg gatcgtctga tgcagggggc accggcaccg 5700 ctggctgcag gtaacccggc atctgatgcc gttaacgatt tgctgaacac accagtgtaa 5760 gggatgttta tgacgagcaa agaaaccttt acccattacc agccgcaggg caacagtgac 5820 ccggctcata ccgcaaccgc gcccggcgga ttgagtgcga aagcgcctgc aatgaccccg 5880 ctgatgctgg acacctccag ccgtaagctg gttgcgtggg atggcaccac cgacggtgct 5940 gccgttggca ttcttgcggt tgctgctgac cagaccagca ccacgctgac gttctacaag 6000 tccggcacgt tccgttatga ggatgtgctc tggccggagg ctgccagcga cgagacgaaa 6060 aaacggaccg cgtttgccgg aacggcaatc agcatcgttt aactttaccc ttcatcacta 6120 aaggccgcct gtgcggcttt ttttacggga tttttttatg tcgatgtaca caaccgccca 6180 actgctggcg gcaaatgagc agaaatttaa gtttgatccg ctgtttctgc gtctcttttt 6240 ccgtgagagc tatcccttca ccacggagaa agtctatctc tcacaaattc cgggactggt 6300 aaacatggcg ctgtacgttt cgccgattgt ttccggtgag gttatccgtt cccgtggcgg 6360 ctccacctct gaatttacgc cgggatatgt caagccgaag catgaagtga atccgcagat 6420 gaccctgcgt cgcctgccgg atgaagatcc gcagaatctg gcggacccgg cttaccgccg 6480 ccgtcgcatc atcatgcaga acatgcgtga cgaagagctg gccattgctc aggtcgaaga 6540 gatgcaggca gtttctgccg tgcttaaggg caaatacacc atgaccggtg aagccttcga 6600 tccggttgag gtggatatgg gccgcagtga ggagaataac atcacgcagt ccggcggcac 6660 ggagtggagc aagcgtgaca agtccacgta tgacccgacc gacgatatcg aagcctacgc 6720 gctgaacgcc agcggtgtgg tgaatatcat cgtgttcgat ccgaaaggct gggcgctgtt 6780 ccgttccttc aaagccgtca aggagaagct ggatacccgt cgtggctcta attccgagct 6840 ggagacagcg gtgaaagacc tgggcaaagc ggtgtcctat aaggggatgt atggcgatgt 6900 ggccatcgtc gtgtattccg gacagtacgt ggaaaacggc gtcaaaaaga acttcctgcc 6960 ggacaacacg atggtgctgg ggaacactca ggcacgcggt ctgcgcacct atggctgcat 7020 tcaggatgcg gacgcacagc gcgaaggcat taacgcctct gcccgttacc cgaaaaactg 7080 ggtgaccacc ggcgatccgg cgcgtgagtt caccatgatt cagtcagcac cgctgatgct 7140 gctggctgac cctgatgagt tcgtgtccgt acaactggcg taatcatggc ccttcggggc 7200 cattgtttct ctgtggagga gtccatgacg aaagatgaac tgattgcccg tctccgctcg 7260 ctgggtgaac aactgaaccg tgatgtcagc ctgacgggga cgaaagaaga actggcgctc 7320 cgtgtggcag agctgaaaga ggagcttgat gacacggatg aaactgccgg tcaggacacc 7380 cctctcagcc gggaaaatgt gctgaccgga catgaaaatg aggtgggatc agcgcagccg 7440 gataccgtga ttctggatac gtctgaactg gtcacggtcg tggcactggt gaagctgcat 7500 actgatgcac ttcacgccac gcgggatgaa cctgtggcat ttgtgctgcc gggaacggcg 7560 tttcgtgtct ctgccggtgt ggcagccgaa atgacagagc gcggcctggc cagaatgcaa 7620 taacgggagg cgctgtggct gatttcgata acctgttcga tgctgccatt gcccgcgccg 7680 atgaaacgat acgcgggtac atgggaacgt cagccaccat tacatccggt gagcagtcag 7740 gtgcggtgat acgtggtgtt tttgatgacc ctgaaaatat cagctatgcc ggacagggcg 7800 tgcgcgttga aggctccagc ccgtccctgt ttgtccggac tgatgaggtg cggcagctgc 7860 ggcgtggaga cacgctgacc atcggtgagg aaaatttctg ggtagatcgg gtttcgccgg 7920 atgatggcgg aagttgtcat ctctggcttg gacggggcgt accgcctgcc gttaaccgtc 7980 gccgctgaaa gggggatgta tggccataaa aggtcttgag caggccgttg aaaacctcag 8040 ccgtatcagc aaaacggcgg tgcctggtgc cgccgcaatg gccattaacc gcgttgcttc 8100 atccgcgata tcgcagtcgg cgtcacaggt tgcccgtgag acaaaggtac gccggaaact 8160 ggtaaaggaa agggccaggc tgaaaagggc cacggtcaaa aatccgcagg ccagaatcaa 8220 agttaaccgg ggggatttgc ccgtaatcaa gctgggtaat gcgcgggttg tcctttcgcg 8280 ccgcaggcgt cgtaaaaagg ggcagcgttc atccctgaaa ggtggcggca gcgtgcttgt 8340 ggtgggtaac cgtcgtattc ccggcgcgtt tattcagcaa ctgaaaaatg gccggtggca 8400 tgtcatgcag cgtgtggctg ggaaaaaccg ttaccccatt gatgtggtga aaatcccgat 8460 ggcggtgccg ctgaccacgg cgtttaaaca aaatattgag cggatacggc gtgaacgtct 8520 tccgaaagag ctgggctatg cgctgcagca tcaactgagg atggtaataa agcgatgaaa 8580 catactgaac tccgtgcagc cgtactggat gcactggaga agcatgacac cggggcgacg 8640 ttttttgatg gtcgccccgc tgtttttgat gaggcggatt ttccggcagt tgccgtttat 8700 ctcaccggcg ctgaatacac gggcgaagag ctggacagcg atacctggca ggcggagctg 8760 catatcgaag ttttcctgcc tgctcaggtg ccggattcag agctggatgc gtggatggag 8820 tcccggattt atccggtgat gagcgatatc ccggcactgt cagatttgat caccagtatg 8880 gtggccagcg gctatgacta ccggcgcgac gatgatgcgg gcttgtggag ttcagccgat 8940 ctgacttatg tcattaccta tgaaatgtga ggacgctatg cctgtaccaa atcctacaat 9000 gccggtgaaa ggtgccggga ccaccctgtg ggtttataag gggagcggtg acccttacgc 9060 gaatccgctt tcagacgttg actggtcgcg tctggcaaaa gttaaagacc tgacgcccgg 9120 cgaactgacc gctgagtcct atgacgacag ctatctcgat gatgaagatg cagactggac 9180 tgcgaccggg caggggcaga aatctgccgg agataccagc ttcacgctgg cgtggatgcc 9240 cggagagcag gggcagcagg cgctgctggc gtggtttaat gaaggcgata cccgtgccta 9300 taaaatccgc ttcccgaacg gcacggtcga tgtgttccgt ggctgggtca gcagtatcgg 9360 taaggcggtg acggcgaagg aagtgatcac ccgcacggtg aaagtcacca atgtgggacg 9420 tccgtcgatg gcagaagatc gcagcacggt aacagcggca accggcatga ccgtgacgcc 9480 tgccagcacc tcggtggtga aagggcagag caccacgctg accgtggcct tccagccgga 9540 gggcgtaacc gacaagagct ttcgtgcggt gtctgcggat aaaacaaaag ccaccgtgtc 9600 ggtcagtggt atgaccatca ccgtgaacgg cgttgctgca ggcaaggtca acattccggt 9660 tgtatccggt aatggtgagt ttgctgcggt tgcagaaatt accgtcaccg ccagttaatc 9720 cggagagtca gcgatgttcc tgaaaaccga atcatttgaa cataacggtg tgaccgtcac 9780 gctttctgaa ctgtcagccc tgcagcgcat tgagcatctc gccctgatga aacggcaggc 9840 agaacaggcg gagtcagaca gcaaccggaa gtttactgtg gaagacgcca tcagaaccgg 9900 cgcgtttctg gtggcgatgt ccctgtggca taaccatccg cagaagacgc agatgccgtc 9960 catgaatgaa gccgttaaac agattgagca ggaagtgctt accacctggc ccacggaggc 10020 aatttctcat gctgaaaacg tggtgtaccg gctgtctggt atgtatgagt ttgtggtgaa 10080 taatgcccct gaacagacag aggacgccgg gcccgcagag cctgtttctg cgggaaagtg 10140 ttcgacggtg agctgagttt tgccctgaaa ctggcgcgtg agatggggcg acccgactgg 10200 cgtgccatgc ttgccgggat gtcatccacg gagtatgccg actggcaccg cttttacagt 10260 acccattatt ttcatgatgt tctgctggat atgcactttt ccgggctgac gtacaccgtg 10320 ctcagcctgt ttttcagcga tccggatatg catccgctgg atttcagtct gctgaaccgg 10380 cgcgaggctg acgaagagcc tgaagatgat gtgctgatgc agaaagcggc agggcttgcc 10440 ggaggtgtcc gctttggccc ggacgggaat gaagttatcc ccgcttcccc ggatgtggcg 10500 gacatgacgg aggatgacgt aatgctgatg acagtatcag aagggatcgc aggaggagtc 10560 cggtatggct gaaccggtag gcgatctggt cgttgatttg agtctggatg cggccagatt 10620 tgacgagcag atggccagag tcaggcgtca tttttctggt acggaaagtg atgcgaaaaa 10680 aacagcggca gtcgttgaac agtcgctgag ccgacaggcg ctggctgcac agaaagcggg 10740 gatttccgtc gggcagtata aagccgccat gcgtatgctg cctgcacagt tcaccgacgt 10800 ggccacgcag cttgcaggcg ggcaaagtcc gtggctgatc ctgctgcaac agggggggca 10860 ggtgaaggac tccttcggcg ggatgatccc catgttcagg gggcttgccg gtgcgatcac 10920 cctgccgatg gtgggggcca cctcgctggc ggtggcgacc ggtgcgctgg cgtatgcctg 10980 gtatcagggc aactcaaccc tgtccgattt caacaaaacg ctggtccttt ccggcaatca 11040 ggcgggactg acggcagatc gtatgctggt cctgtccaga gccgggcagg cggcagggct 11100 gacgtttaac cagaccagcg agtcactcag cgcactggtt aaggcggggg taagcggtga 11160 ggctcagatt gcgtccatca gccagagtgt ggcgcgtttc tcctctgcat ccggcgtgga 11220 ggtggacaag gtcgctgaag ccttcgggaa gctgaccaca gacccgacgt cggggctgac 11280 ggcgatggct cgccagttcc ataacgtgtc ggcggagcag attgcgtatg ttgctcagtt 11340 gcagcgttcc ggcgatgaag ccggggcatt gcaggcggcg aacgaggccg caacgaaagg 11400 gtttgatgac cagacccgcc gcctgaaaga gaacatgggc acgctggaga cctgggcaga 11460 caggactgcg cgggcattca aatccatgtg ggatgcggtg ctggatattg gtcgtcctga 11520 taccgcgcag gagatgctga ttaaggcaga ggctgcgtat aagaaagcag acgacatctg 11580 gaatctgcgc aaggatgatt attttgttaa cgatgaagcg cgggcgcgtt actgggatga 11640 tcgtgaaaag gcccgtcttg cgcttgaagc cgcccgaaag aaggctgagc agcagactca 11700 acaggacaaa aatgcgcagc agcagagcga taccgaagcg tcacggctga aatataccga 11760 agaggcgcag aaggcttacg aacggctgca gacgccgctg gagaaatata ccgcccgtca 11820 ggaagaactg aacaaggcac tgaaagacgg gaaaatcctg caggcggatt acaacacgct 11880 gatggcggcg gcgaaaaagg attatgaagc gacgctgaaa aagccgaaac agtccagcgt 11940 gaaggtgtct gcgggcgatc gtcaggaaga cagtgctcat gctgccctgc tgacgcttca 12000 ggcagaactc cggacgctgg agaagcatgc cggagcaaat gagaaaatca gccagcagcg 12060 ccgggatttg tggaaggcgg agagtcagtt cgcggtactg gaggaggcgg cgcaacgtcg 12120 ccagctgtct gcacaggaga aatccctgct ggcgcataaa gatgagacgc tggagtacaa 12180 acgccagctg gctgcacttg gcgacaaggt tacgtatcag gagcgcctga acgcgctggc 12240 gcagcaggcg gataaattcg cacagcagca acgggcaaaa cgggccgcca ttgatgcgaa 12300 aagccggggg ctgactgacc ggcaggcaga acgggaagcc acggaacagc gcctgaagga 12360 acagtatggc gataatccgc tggcgctgaa taacgtcatg tcagagcaga aaaagacctg 12420 ggcggctgaa gaccagcttc gcgggaactg gatggcaggc ctgaagtccg gctggagtga 12480 gtgggaagag agcgccacgg acagtatgtc gcaggtaaaa agtgcagcca cgcagacctt 12540 tgatggtatt gcacagaata tggcggcgat gctgaccggc agtgagcaga actggcgcag 12600 cttcacccgt tccgtgctgt ccatgatgac agaaattctg cttaagcagg caatggtggg 12660 gattgtcggg agtatcggca gcgccattgg cggggctgtt ggtggcggcg catccgcgtc 12720 aggcggtaca gccattcagg ccgctgcggc gaaattccat tttgcaaccg gaggatttac 12780 gggaaccggc ggcaaatatg agccagcggg gattgttcac cgtggtgagt ttgtcttcac 12840 gaaggaggca accagccgga ttggcgtggg gaatctttac cggctgatgc gcggctatgc 12900 caccggcggt tatgtcggta caccgggcag catggcagac agccggtcgc aggcgtccgg 12960 gacgtttgag cagaataacc atgtggtgat taacaacgac ggcacgaacg ggcagatagg 13020 tccggctgct ctgaaggcgg tgtatgacat ggcccgcaag ggtgcccgtg atgaaattca 13080 gacacagatg cgtgatggtg gcctgttctc cggaggtgga cgatgaagac cttccgctgg 13140 aaagtgaaac ccggtatgga tgtggcttcg gtcccttctg taagaaaggt gcgctttggt 13200 gatggctatt ctcagcgagc gcctgccggg ctgaatgcca acctgaaaac gtacagcgtg 13260 acgctttctg tcccccgtga ggaggccacg gtactggagt cgtttctgga agagcacggg 13320 ggctggaaat cctttctgtg gacgccgcct tatgagtggc ggcagataaa ggtgacctgc 13380 gcaaaatggt cgtcgcgggt cagtatgctg cgtgttgagt tcagcgcaga gtttgaacag 13440 gtggtgaact gatgcaggat atccggcagg aaacactgaa tgaatgcacc cgtgcggagc 13500 agtcggccag cgtggtgctc tgggaaatcg acctgacaga ggtcggtgga gaacgttatt 13560 ttttctgtaa tgagcagaac gaaaaaggtg agccggtcac ctggcagggg cgacagtatc 13620 agccgtatcc cattcagggg agcggttttg aactgaatgg caaaggcacc agtacgcgcc 13680 ccacgctgac ggtttctaac ctgtacggta tggtcaccgg gatggcggaa gatatgcaga 13740 gtctggtcgg cggaacggtg gtccggcgta aggtttacgc ccgttttctg gatgcggtga 13800 acttcgtcaa cggaaacagt tacgccgatc cggagcagga ggtgatcagc cgctggcgca 13860 ttgagcagtg cagcgaactg agcgcggtga gtgcctcctt tgtactgtcc acgccgacgg 13920 aaacggatgg cgctgttttt ccgggacgta tcatgctggc caacacctgc acctggacct 13980 atcgcggtga cgagtgcggt tatagcggtc cggctgtcgc ggatgaatat gaccagccaa 14040 cgtccgatat cacgaaggat aaatgcagca aatgcctgag cggttgtaag ttccgcaata 14100 acgtcggcaa ctttggcggc ttcctttcca ttaacaaact ttcgcagtaa atcccatgac 14160 acagacagaa tcagcgattc tggcgcacgc ccggcgatgt gcgccagcgg agtcgtgcgg 14220 cttcgtggta agcacgccgg agggggaaag atatttcccc tgcgtgaata tctccggtga 14280 gccggaggct atttccgtat gtcgccggaa gactggctgc aggcagaaat gcagggtgag 14340 attgtggcgc tggtccacag ccaccccggt ggtctgccct ggctgagtga ggccgaccgg 14400 cggctgcagg tgcagagtga tttgccgtgg tggctggtct gccgggggac gattcataag 14460 ttccgctgtg tgccgcatct caccgggcgg cgctttgagc acggtgtgac ggactgttac 14520 acactgttcc gggatgctta tcatctggcg gggattgaga tgccggactt tcatcgtgag 14580 gatgactggt ggcgtaacgg ccagaatctc tatctggata atctggaggc gacggggctg 14640 tatcaggtgc cgttgtcagc ggcacagccg ggcgatgtgc tgctgtgctg ttttggttca 14700 tcagtgccga atcacgccgc aatttactgc ggcgacggcg agctgctgca ccatattcct 14760 gaacaactga gcaaacgaga gaggtacacc gacaaatggc agcgacgcac acactccctc 14820 tggcgtcacc gggcatggcg cgcatctgcc tttacgggga tttacaacga tttggtcgcc 14880 gcatcgacct tcgtgtgaaa acgggggctg aagccatccg ggcactggcc acacagctcc 14940 cggcgtttcg tcagaaactg agcgacggct ggtatcaggt acggattgcc gggcgggacg 15000 tcagcacgtc cgggttaacg gcgcagttac atgagactct gcctgatggc gctgtaattc 15060 atattgttcc cagagtcgcc ggggccaagt caggtggcgt attccagatt gtcctggggg 15120 ctgccgccat tgccggatca ttctttaccg ccggagccac ccttgcagca tggggggcag 15180 ccattggggc cggtggtatg accggcatcc tgttttctct cggtgccagt atggtgctcg 15240 gtggtgtggc gcagatgctg gcaccgaaag ccagaactcc ccgtatacag acaacggata 15300 acggtaagca gaacacctat ttctcctcac tggataacat ggttgcccag ggcaatgttc 15360 tgcctgttct gtacggggaa atgcgcgtgg ggtcacgcgt ggtttctcag gagatcagca 15420 cggcagacga aggggacggt ggtcaggttg tggtgattgg tcgctgatgc aaaatgtttt 15480 atgtgaaacc gcctgcgggc ggttttgtca tttatggagc gtgaggaatg ggtaaaggaa 15540 gcagtaaggg gcataccccg cgcgaagcga aggacaacct gaagtccacg cagttgctga 15600 gtgtgatcga tgccatcagc gaagggccga ttgaaggtcc ggtggatggc ttaaaaagcg 15660 tgctgctgaa cagtacgccg gtgctggaca ctgaggggaa taccaacata tccggtgtca 15720 cggtggtgtt ccgggctggt gagcaggagc agactccgcc ggagggattt gaatcctccg 15780 gctccgagac ggtgctgggt acggaagtga aatatgacac gccgatcacc cgcaccatta 15840 cgtctgcaaa catcgaccgt ctgcgcttta ccttcggtgt acaggcactg gtggaaacca 15900 cctcaaaggg tgacaggaat ccgtcggaag tccgcctgct ggttcagata caacgtaacg 15960 gtggctgggt gacggaaaaa gacatcacca ttaagggcaa aaccacctcg cagtatctgg 16020 cctcggtggt gatgggtaac ctgccgccgc gcccgtttaa tatccggatg cgcaggatga 16080 cgccggacag caccacagac cagctgcaga acaaaacgct ctggtcgtca tacactgaaa 16140 tcatcgatgt gaaacagtgc tacccgaaca cggcactggt cggcgtgcag gtggactcgg 16200 agcagttcgg cagccagcag gtgagccgta attatcatct gcgcgggcgt attctgcagg 16260 tgccgtcgaa ctataacccg cagacgcggc aatacagcgg tatctgggac ggaacgttta 16320 aaccggcata cagcaacaac atggcctggt gtctgtggga tatgctgacc catccgcgct 16380 acggcatggg gaaacgtctt ggtgcggcgg atgtggataa atgggcgctg tatgtcatcg 16440 gccagtactg cgaccagtca gtgccggacg gctttggcgg cacggagccg cgcatcacct 16500 gtaatgcgta cctgaccaca cagcgtaagg cgtgggatgt gctcagcgat ttctgctcgg 16560 cgatgcgctg tatgccggta tggaacgggc agacgctgac gttcgtgcag gaccgaccgt 16620 cggataagac gtggacctat aaccgcagta atgtggtgat gccggatgat ggcgcgccgt 16680 tccgctacag cttcagcgcc ctgaaggacc gccataatgc cgttgaggtg aactggattg 16740 acccgaacaa cggctgggag acggcgacag agcttgttga agatacgcag gccattgccc 16800 gttacggtcg taatgttacg aagatggatg cctttggctg taccagccgg gggcaggcac 16860 accgcgccgg gctgtggctg attaaaacag aactgctgga aacgcagacc gtggatttca 16920 gcgtcggcgc agaagggctt cgccatgtac cgggcgatgt tattgaaatc tgcgatgatg 16980 actatgccgg tatcagcacc ggtggtcgtg tgctggcggt gaacagccag acccggacgc 17040 tgacgctcga ccgtgaaatc acgctgccat cctccggtac cgcgctgata agcctggttg 17100 acggaagtgg caatccggtc agcgtggagg ttcagtccgt caccgacggc gtgaaggtaa 17160 aagtgagccg tgttcctgac ggtgttgctg aatacagcgt atgggagctg aagctgccga 17220 cgctgcgcca gcgactgttc cgctgcgtga gtatccgtga gaacgacgac ggcacgtatg 17280 ccatcaccgc cgtgcagcat gtgccggaaa aagaggccat cgtggataac ggggcgcact 17340 ttgacggcga acagagtggc acggtgaatg gtgtcacgcc gccagcggtg cagcacctga 17400 ccgcagaagt cactgcagac agcggggaat atcaggtgct ggcgcgatgg gacacaccga 17460 aggtggtgaa gggcgtgagt ttcctgctcc gtctgaccgt aacagcggac gacggcagtg 17520 agcggctggt cagcacggcc cggacgacgg aaaccacata ccgcttcacg caactggcgc 17580 tggggaacta caggctgaca gtccgggcgg taaatgcgtg ggggcagcag ggcgatccgg 17640 cgtcggtatc gttccggatt gccgcaccgg cagcaccgtc gaggattgag ctgacgccgg 17700 gctattttca gataaccgcc acgccgcatc ttgccgttta tgacccgacg gtacagtttg 17760 agttctggtt ctcggaaaag cagattgcgg atatcagaca ggttgaaacc agcacgcgtt 17820 atcttggtac ggcgctgtac tggatagccg ccagtatcaa tatcaaaccg ggccatgatt 17880 attactttta tatccgcagt gtgaacaccg ttggcaaatc ggcattcgtg gaggccgtcg 17940 gtcgggcgag cgatgatgcg gaaggttacc tggatttttt caaaggcaag ataaccgaat 18000 cccatctcgg caaggagctg ctggaaaaag tcgagctgac ggaggataac gccagcagac 18060 tggaggagtt ttcgaaagag tggaaggatg ccagtgataa gtggaatgcc atgtgggctg 18120 tcaaaattga gcagaccaaa gacggcaaac attatgtcgc gggtattggc ctcagcatgg 18180 aggacacgga ggaaggcaaa ctgagccagt ttctggttgc cgccaatcgt atcgcattta 18240 ttgacccggc aaacgggaat gaaacgccga tgtttgtggc gcagggcaac cagatattca 18300 tgaacgacgt gttcctgaag cgcctgacgg cccccaccat taccagcggc ggcaatcctc 18360 cggccttttc cctgacaccg gacggaaagc tgaccgctaa aaatgcggat atcagtggca 18420 gtgtgaatgc gaactccggg acgctcagta atgtgacgat agctgaaaac tgtacgataa 18480 acggtacgct gagggcggaa aaaatcgtcg gggacattgt aaaggcggcg agcgcggctt 18540 ttccgcgcca gcgtgaaagc agtgtggact ggccgtcagg tacccgtact gtcaccgtga 18600 ccgatgacca tccttttgat cgccagatag tggtgcttcc gctgacgttt cgcggaagta 18660 agcgtactgt cagcggcagg acaacgtatt cgatgtgtta tctgaaagta ctgatgaacg 18720 gtgcggtgat ttatgatggc gcggcgaacg aggcggtaca ggtgttctcc cgtattgttg 18780 acatgccagc gggtcgggga aacgtgatcc tgacgttcac gcttacgtcc acacggcatt 18840 cggcagatat tccgccgtat acgtttgcca gcgatgtgca ggttatggtg attaagaaac 18900 aggcgctggg catcagcgtg gtctgagtgt gttacagagg ttcgtccggg aacgggcgtt 18960 ttattataaa acagtgagag gtgaacgatg cgtaatgtgt gtattgccgt tgctgtcttt 19020 gccgcacttg cggtgacagt cactccggcc cgtgcggaag gtggacatgg tacgtttacg 19080 gtgggctatt ttcaagtgaa accgggtaca ttgccgtcgt tgtcgggcgg ggataccggt 19140 gtgagtcatc tgaaagggat taacgtgaag taccgttatg agctgacgga cagtgtgggg 19200 gtgatggctt ccctggggtt cgccgcgtcg aaaaagagca gcacagtgat gaccggggag 19260 gatacgtttc actatgagag cctgcgtgga cgttatgtga gcgtgatggc cggaccggtt 19320 ttacaaatca gtaagcaggt cagtgcgtac gccatggccg gagtggctca cagtcggtgg 19380 tccggcagta caatggatta ccgtaagacg gaaatcactc ccgggtatat gaaagagacg 19440 accactgcca gggacgaaag tgcaatgcgg catacctcag tggcgtggag tgcaggtata 19500 cagattaatc cggcagcgtc cgtcgttgtt gatattgctt atgaaggctc cggcagtggc 19560 gactggcgta ctgacggatt catcgttggg gtcggttata aattctgatt agccaggtaa 19620 cacagtgtta tgacagcccg ccggaaccgg tgggcttttt tgtggggtga atatggcagt 19680 aaagatttca ggagtcctga aagacggcac aggaaaaccg gtacagaact gcaccattca 19740 gctgaaagcc agacgtaaca gcaccacggt ggtggtgaac acggtgggct cagagaatcc 19800 ggatgaagcc gggcgttaca gcatggatgt ggagtacggt cagtacagtg tcatcctgca 19860 ggttgacggt tttccaccat cgcacgccgg gaccatcacc gtgtatgaag attcacaacc 19920 ggggacgctg aatgattttc tctgtgccat gacggaggat gatgcccggc cggaggtgct 19980 gcgtcgtctt gaactgatgg tggaagaggt ggcgcgtaac gcgtccgtgg tggcacagag 20040 tacggcagac gcgaagaaat cagccggcga tgccagtgca tcagctgctc aggtcgcggc 20100 ccttgtgact gatgcaactg actcagcacg cgccgccagc acgtccgccg gacaggctgc 20160 atcgtcagct caggaagcgt cctccggcgc agaagcggca tcagcaaagg ccactgaagc 20220 ggaaaaaagt gccgcagccg cagagtcctc aaaaaacgcg gcggccacca gtgccggtgc 20280 ggcgaaaacg tcagaaacga atgctgcagc gtcacaacaa tcagccgcca cgtctgcctc 20340 caccgcggcc acgaaagcgt cagaggccgc cacttcagca cgagatgcgg tggcctcaaa 20400 agaggcagca aaatcatcag aaacgaacgc atcatcaagt gccggtcgtg cagcttcctc 20460 ggcaacggcg gcagaaaatt ctgccagggc ggcaaaaacg tccgagacga atgccaggtc 20520 atctgaaaca gcagcggaac ggagcgcctc tgccgcggca gacgcaaaaa cagcggcggc 20580 ggggagtgcg tcaacggcat ccacgaaggc gacagaggct gcgggaagtg cggtatcagc 20640 atcgcagagc aaaagtgcgg cagaagcggc ggcaatacgt gcaaaaaatt cggcaaaacg 20700 tgcagaagat atagcttcag ctgtcgcgct tgaggatgcg gacacaacga gaaaggggat 20760 agtgcagctc agcagtgcaa ccaacagcac gtctgaaacg cttgctgcaa cgccaaaggc 20820 ggttaaggtg gtaatggatg aaacgaacag aaaagcccac tggacagtcc ggcactgacc 20880 ggaacgccaa cagcaccaac cgcgctcagg ggaacaaaca atacccagat tgcgaacacc 20940 gcttttgtac tggccgcgat tgcagatgtt atcgacgcgt cacctgacgc actgaatacg 21000 ctgaatgaac tggccgcagc gctcgggaat gatccagatt ttgctaccac catgactaac 21060 gcgcttgcgg gtaaacaacc gaagaatgcg acactgacgg cgctggcagg gctttccacg 21120 gcgaaaaata aattaccgta ttttgcggaa aatgatgccg ccagcctgac tgaactgact 21180 caggttggca gggatattct ggcaaaaaat tccgttgcag atgttcttga ataccttggg 21240 gccggtgaga attcggcctt tccggcaggt gcgccgatcc cgtggccatc agatatcgtt 21300 ccgtctggct acgtcctgat gcaggggcag gcgtttgaca aatcagccta cccaaaactt 21360 gctgtcgcgt atccatcggg tgtgcttcct gatatgcgag gctggacaat caaggggaaa 21420 cccgccagcg gtcgtgctgt attgtctcag gaacaggatg gaattaagtc gcacacccac 21480 agtgccagtg catccggtac ggatttgggg acgaaaacca catcgtcgtt tgattacggg 21540 acgaaaacaa caggcagttt cgattacggc accaaatcga cgaataacac gggggctcat 21600 gctcacagtc tgagcggttc aacaggggcc gcgggtgctc atgcccacac aagtggttta 21660 aggatgaaca gttctggctg gagtcagtat ggaacagcaa ccattacagg aagtttatcc 21720 acagttaaag gaaccagcac acagggtatt gcttatttat cgaaaacgga cagtcagggc 21780 agccacagtc actcattgtc cggtacagcc gtgagtgccg gtgcacatgc gcatacagtt 21840 ggtattggtg cgcaccagca tccggttgtt atcggtgctc atgcccattc tttcagtatt 21900 ggttcacacg gacacaccat caccgttaac gctgcgggta acgcggaaaa caccgtcaaa 21960 aacattgcat ttaactatat tgtgaggctt gcataatggc attcagaatg agtgaacaac 22020 cacggaccat aaaaatttat aatctgctgg ccggaactaa tgaatttatt ggtgaaggtg 22080 acgcatatat tccgcctcat accggtctgc ctgcaaacag taccgatatt gcaccgccag 22140 atattccggc tggctttgtg gctgttttca acagtgatga ggcatcgtgg catctcgttg 22200 aagaccatcg gggtaaaacc gtctatgacg tggcttccgg cgacgcgtta tttatttctg 22260 aactcggtcc gttaccggaa aattttacct ggttatcgcc gggaggggaa tatcagaagt 22320 ggaacggcac agcctgggtg aaggatacgg aagcagaaaa actgttccgg atccgggagg 22380 cggaagaaac aaaaaaaagc ctgatgcagg tagccagtga gcatattgcg ccgcttcagg 22440 atgctgcaga tctggaaatt gcaacgaagg aagaaacctc gttgctggaa gcctggaaga 22500 agtatcgggt gttgctgaac cgtgttgata catcaactgc acctgatatt gagtggcctg 22560 ctgtccctgt tatggagtaa tcgttttgtg atatgccgca gaaacgttgt atgaaataac 22620 gttctgcggt tagttagtat attgtaaagc tgagtattgg tttatttggc gattattatc 22680 ttcaggagaa taatggaagt tctatgactc aattgttcat agtgtttaca tcaccgccaa 22740 ttgcttttaa gactgaacgc atgaaatatg gtttttcgtc atgttttgag tctgctgttg 22800 atatttctaa agtcggtttt ttttcttcgt tttctctaac tattttccat gaaatacatt 22860 tttgattatt atttgaatca attccaatta cctgaagtct ttcatctata attggcattg 22920 tatgtattgg tttattggag tagatgcttg cttttctgag ccatagctct gatatccaaa 22980 tgaagccata ggcatttgtt attttggctc tgtcagctgc ataacgccaa aaaatatatt 23040 tatctgcttg atcttcaaat gttgtattga ttaaatcaat tggatggaat tgtttatcat 23100 aaaaaattaa tgtttgaatg tgataaccgt cctttaaaaa agtcgtttct gcaagcttgg 23160 ctgtatagtc aactaactct tctgtcgaag tgatattttt aggcttatct accagtttta 23220 gacgctcttt aatatcttca ggaattattt tattgtcata ttgtatcatg ctaaatgaca 23280 atttgcttat ggagtaatct tttaatttta aataagttat tctcctggct tcatcaaata 23340 aagagtcgaa tgatgttggc gaaatcacat cgtcacccat tggattgttt atttgtatgc 23400 caagagagtt acagcagtta tacattctgc catagattat agctaaggca tgtaataatt 23460 cgtaatcttt tagcgtatta gcgacccatc gtctttctga tttaataata gatgattcag 23520 ttaaatatga aggtaatttc ttttgtgcaa gtctgactaa cttttttata ccaatgttta 23580 acatactttc atttgtaata aactcaatgt cattttcttc aatgtaagat gaaataagag 23640 tagcctttgc ctcgctatac atttctaaat cgccttgttt ttctatcgta ttgcgagaat 23700 ttttagccca agccattaat ggatcatttt tccatttttc aataacatta ttgttatacc 23760 aaatgtcata tcctataatc tggtttttgt ttttttgaat aataaatgtt actgttcttg 23820 cggtttggag gaattgattc aaattcaagc gaaataattc agggtcaaaa tatgtatcaa 23880 tgcagcattt gagcaagtgc gataaatctt taagtcttct ttcccatggt tttttagtca 23940 taaaactctc cattttgata ggttgcatgc tagatgctga tatattttag aggtgataaa 24000 attaactgct taactgtcaa tgtaatacaa gttgtttgat ctttgcaatg attcttatca 24060 gaaaccatat agtaaattag ttacacagga aatttttaat attattatta tcattcatta 24120 tgtattaaaa ttagagttgt ggcttggctc tgctaacacg ttgctcatag gagatatggt 24180 agagccgcag acacgtcgta tgcaggaacg tgctgcggct ggctggtgaa cttccgatag 24240 tgcgggtgtt gaatgatttc cagttgctac cgattttaca tattttttgc atgagagaat 24300 ttgtaccacc tcccaccgac catctatgac tgtacgccac tgtccctagg actgctatgt 24360 gccggagcgg acattacaaa cgtccttctc ggtgcatgcc actgttgcca atgacctgcc 24420 taggaattgg ttagcaagtt actaccggat tttgtaaaaa cagccctcct catataaaaa 24480 gtattcgttc acttccgata agcgtcgtaa ttttctatct ttcatcatat tctagatccc 24540 tctgaaaaaa tcttccgagt ttgctaggca ctgatacata actcttttcc aataattggg 24600 gaagtcattc aaatctataa taggtttcag atttgcttca ataaattctg actgtagctg 24660 ctgaaacgtt gcggttgaac tatatttcct tataactttt acgaaagagt ttctttgagt 24720 aatcacttca ctcaagtgct tccctgcctc caaacgatac ctgttagcaa tatttaatag 24780 cttgaaatga tgaagagctc tgtgtttgtc ttcctgcctc cagttcgccg ggcattcaac 24840 ataaaaactg atagcacccg gagttccgga aacgaaattt gcatataccc attgctcacg 24900 aaaaaaaatg tccttgtcga tatagggatg aatcgcttgg tgtacctcat ctactgcgaa 24960 aacttgacct ttctctccca tattgcagtc gcggcacgat ggaactaaat taataggcat 25020 caccgaaaat tcaggataat gtgcaatagg aagaaaatga tctatatttt ttgtctgtcc 25080 tatatcacca caaaatggac atttttcacc tgatgaaaca agcatgtcat cgtaatatgt 25140 tctagcgggt ttgtttttat ctcggagatt attttcataa agcttttcta atttaacctt 25200 tgtcaggtta ccaactacta aggttgtagg ctcaagaggg tgtgtcctgt cgtaggtaaa 25260 taactgacct gtcgagctta atattctata ttgttgttct ttctgcaaaa aagtggggaa 25320 gtgagtaatg aaattatttc taacatttat ctgcatcata ccttccgagc atttattaag 25380 catttcgcta taagttctcg ctggaagagg tagttttttc attgtacttt accttcatct 25440 ctgttcatta tcatcgcttt taaaacggtt cgaccttcta atcctatctg accattataa 25500 ttttttagaa tggtttcata agaaagctct gaatcaacgg actgcgataa taagtggtgg 25560 tatccagaat ttgtcacttc aagtaaaaac acctcacgag ttaaaacacc taagttctca 25620 ccgaatgtct caatatccgg acggataata tttattgctt ctcttgaccg taggactttc 25680 cacatgcagg attttggaac ctcttgcagt actactgggg aatgagttgc aattattgct 25740 acaccattgc gtgcatcgag taagtcgctt aatgttcgta aaaaagcaga gagcaaaggt 25800 ggatgcagat gaacctctgg ttcatcgaat aaaactaatg acttttcgcc aacgacatct 25860 actaatcttg tgatagtaaa taaaacaatt gcatgtccag agctcattcg aagcagatat 25920 ttctggatat tgtcataaaa caatttagtg aatttatcat cgtccacttg aatctgtggt 25980 tcattacgtc ttaactcttc atatttagaa atgaggctga tgagttccat atttgaaaag 26040 ttttcatcac tacttagttt tttgatagct tcaagccaga gttgtctttt tctatctact 26100 ctcatacaac caataaatgc tgaaatgaat tctaagcgga gatcgcctag tgattttaaa 26160 ctattgctgg cagcattctt gagtccaata taaaagtatt gtgtaccttt tgctgggtca 26220 ggttgttctt taggaggagt aaaaggatca aatgcactaa acgaaactga aacaagcgat 26280 cgaaaatatc cctttgggat tcttgactcg ataagtctat tattttcaga gaaaaaatat 26340 tcattgtttt ctgggttggt gattgcacca atcattccat tcaaaattgt tgttttacca 26400 cacccattcc gcccgataaa agcatgaatg ttcgtgctgg gcatagaatt aaccgtcacc 26460 tcaaaaggta tagttaaatc actgaatccg ggagcacttt ttctattaaa tgaaaagtgg 26520 aaatctgaca attctggcaa accatttaac acacgtgcga actgtccatg aatttctgaa 26580 agagttaccc ctctaagtaa tgaggtgtta aggacgcttt cattttcaat gtcggctaat 26640 cgatttggcc atactactaa atcctgaata gctttaagaa ggttatgttt aaaaccatcg 26700 cttaatttgc tgagattaac atagtagtca atgctttcac ctaaggaaaa aaacatttca 26760 gggagttgac tgaatttttt atctattaat gaataagtgc ttacttcttc tttttgacct 26820 acaaaaccaa ttttaacatt tccgatatcg catttttcac catgctcatc aaagacagta 26880 agataaaaca ttgtaacaaa ggaatagtca ttccaaccat ctgctcgtag gaatgcctta 26940 tttttttcta ctgcaggaat atacccgcct ctttcaataa cactaaactc caacatatag 27000 taacccttaa ttttattaaa ataaccgcaa tttatttggc ggcaacacag gatctctctt 27060 ttaagttact ctctattaca tacgttttcc atctaaaaat tagtagtatt gaacttaacg 27120 gggcatcgta ttgtagtttt ccatatttag ctttctgctt ccttttggat aacccactgt 27180 tattcatgtt gcatggtgca ctgtttatac caacgatata gtctattaat gcatatatag 27240 tatcgccgaa cgattagctc ttcaggcttc tgaagaagcg tttcaagtac taataagccg 27300 atagatagcc acggacttcg tagccatttt tcataagtgt taacttccgc tcctcgctca 27360 taacagacat tcactacagt tatggcggaa aggtatgcat gctgggtgtg gggaagtcgt 27420 gaaagaaaag aagtcagctg cgtcgtttga catcactgct atcttcttac tggttatgca 27480 ggtcgtagtg ggtggcacac aaagctttgc actggattgc gaggctttgt gcttctctgg 27540 agtgcgacag gtttgatgac aaaaaattag cgcaagaaga caaaaatcac cttgcgctaa 27600 tgctctgtta caggtcacta ataccatcta agtagttgat tcatagtgac tgcatatgtt 27660 gtgttttaca gtattatgta gtctgttttt tatgcaaaat ctaatttaat atattgatat 27720 ttatatcatt ttacgtttct cgttcagctt ttttatacta agttggcatt ataaaaaagc 27780 attgcttatc aatttgttgc aacgaacagg tcactatcag tcaaaataaa atcattattt 27840 gatttcaatt ttgtcccact ccctgcctct gtcatcacga tactgtgatg ccatggtgtc 27900 cgacttatgc ccgagaagat gttgagcaaa cttatcgctt atctgcttct catagagtct 27960 tgcagacaaa ctgcgcaact cgtgaaaggt aggcggatcc ccttcgaagg aaagacctga 28020 tgcttttcgt gcgcgcataa aataccttga tactgtgccg gatgaaagcg gttcgcgacg 28080 agtagatgca attatggttt ctccgccaag aatctctttg catttatcaa gtgtttcctt 28140 cattgatatt ccgagagcat caatatgcaa tgctgttggg atggcaattt ttacgcctgt 28200 tttgctttgc tcgacataaa gatatccatc tacgatatca gaccacttca tttcgcataa 28260 atcaccaact cgttgcccgg taacaacagc cagttccatt gcaagtctga gccaacatgg 28320 tgatgattct gctgcttgat aaattttcag gtattcgtca gccgtaagtc ttgatctcct 28380 tacctctgat tttgctgcgc gagtggcagc gacatggttt gttgttatat ggccttcagc 28440 tattgcctct cggaatgcat cgctcagtgt tgatctgatt aacttggctg acgccgcctt 28500 gccctcgtct atgtatccat tgagcattgc cgcaatttct tttgtggtga tgtcttcaag 28560 tggagcatca ggcagacccc tccttattgc tttaattttg ctcatgtaat ttatgagtgt 28620 cttctgcttg attcctctgc tggccaggat tttttcgtag cgatcaagcc atgaatgtaa 28680 cgtaacggaa ttatcactgt tgattctcgc tgtcagaggc ttgtgtttgt gtcctgaaaa 28740 taactcaatg ttggcctgta tagcttcagt gattgcgatt cgcctgtctc tgcctaatcc 28800 aaactcttta cccgtccttg ggtccctgta gcagtaatat ccattgtttc ttatataaag 28860 gttagggggt aaatcccggc gctcatgact tcgccttctt cccatttctg atcctcttca 28920 aaaggccacc tgttactggt cgatttaagt caacctttac cgctgattcg tggaacagat 28980 actctcttcc atccttaacc ggaggtggga atatcctgca ttcccgaacc catcgacgaa 29040 ctgtttcaag gcttcttgga cgtcgctggc gtgcgttcca ctcctgaagt gtcaagtaca 29100 tcgcaaagtc tccgcaatta cacgcaagaa aaaaccgcca tcaggcggct tggtgttctt 29160 tcagttcttc aattcgaata ttggttacgt ctgcatgtgc tatctgcgcc catatcatcc 29220 agtggtcgta gcagtcgttg atgttctccg cttcgataac tctgttgaat ggctctccat 29280 tccattctcc tgtgactcgg aagtgcattt atcatctcca taaaacaaaa cccgccgtag 29340 cgagttcaga taaaataaat ccccgcgagt gcgaggattg ttatgtaata ttgggtttaa 29400 tcatctatat gttttgtaca gagagggcaa gtatcgtttc caccgtactc gtgataataa 29460 ttttgcacgg tatcagtcat ttctcgcaca ttgcagaatg gggatttgtc ttcattagac 29520 ttataaacct tcatggaata tttgtatgcc gactctatat ctataccttc atctacataa 29580 acaccttcgt gatgtctgca tggagacaag acaccggatc tgcacaacat tgataacgcc 29640 caatcttttt gctcagactc taactcattg atactcattt ataaactcct tgcaatgtat 29700 gtcgtttcag ctaaacggta tcagcaatgt ttatgtaaag aaacagtaag ataatactca 29760 acccgatgtt tgagtacggt catcatctga cactacagac tctggcatcg ctgtgaagac 29820 gacgcgaaat tcagcatttt cacaagcgtt atcttttaca aaaccgatct cactctcctt 29880 tgatgcgaat gccagcgtca gacatcatat gcagatactc acctgcatcc tgaacccatt 29940 gacctccaac cccgtaatag cgatgcgtaa tgatgtcgat agttactaac gggtcttgtt 30000 cgattaactg ccgcagaaac tcttccaggt caccagtgca gtgcttgata acaggagtct 30060 tcccaggatg gcgaacaaca agaaactggt ttccgtcttc acggacttcg ttgctttcca 30120 gtttagcaat acgcttactc ccatccgaga taacaccttc gtaatactca cgctgctcgt 30180 tgagttttga ttttgctgtt tcaagctcaa cacgcagttt ccctactgtt agcgcaatat 30240 cctcgttctc ctggtcgcgg cgtttgatgt attgctggtt tctttcccgt tcatccagca 30300 gttccagcac aatcgatggt gttaccaatt catggaaaag gtctgcgtca aatccccagt 30360 cgtcatgcat tgcctgctct gccgcttcac gcagtgcctg agagttaatt tcgctcactt 30420 cgaacctctc tgtttactga taagttccag atcctcctgg caacttgcac aagtccgaca 30480 accctgaacg accaggcgtc ttcgttcatc tatcggatcg ccacactcac aacaatgagt 30540 ggcagatata gcctggtggt tcaggcggcg catttttatt gctgtgttgc gctgtaattc 30600 ttctatttct gatgctgaat caatgatgtc tgccatcttt cattaatccc tgaactgttg 30660 gttaatacgc ttgagggtga atgcgaataa taaaaaagga gcctgtagct ccctgatgat 30720 tttgcttttc atgttcatcg ttccttaaag acgccgttta acatgccgat tgccaggctt 30780 aaatgagtcg gtgtgaatcc catcagcgtt accgtttcgc ggtgcttctt cagtacgcta 30840 cggcaaatgt catcgacgtt tttatccgga aactgctgtc tggctttttt tgatttcaga 30900 attagcctga cgggcaatgc tgcgaagggc gttttcctgc tgaggtgtca ttgaacaagt 30960 cccatgtcgg caagcataag cacacagaat atgaagcccg ctgccagaaa aatgcattcc 31020 gtggttgtca tacctggttt ctctcatctg cttctgcttt cgccaccatc atttccagct 31080 tttgtgaaag ggatgcggct aacgtatgaa attcttcgtc tgtttctact ggtattggca 31140 caaacctgat tccaatttga gcaaggctat gtgccatctc gatactcgtt cttaactcaa 31200 cagaagatgc tttgtgcata cagcccctcg tttattattt atctcctcag ccagccgctg 31260 tgctttcagt ggatttcgga taacagaaag gccgggaaat acccagcctc gctttgtaac 31320 ggagtagacg aaagtgattg cgcctacccg gatattatcg tgaggatgcg tcatcgccat 31380 tgctccccaa atacaaaacc aatttcagcc agtgcctcgt ccattttttc gatgaactcc 31440 ggcacgatct cgtcaaaact cgccatgtac ttttcatccc gctcaatcac gacataatgc 31500 aggccttcac gcttcatacg cgggtcatag ttggcaaagt accaggcatt ttttcgcgtc 31560 acccacatgc tgtactgcac ctgggccatg taagctgact ttatggcctc gaaaccaccg 31620 agccggaact tcatgaaatc ccgggaggta aacgggcatt tcagttcaag gccgttgccg 31680 tcactgcata aaccatcggg agagcaggcg gtacgcatac tttcgtcgcg atagatgatc 31740 ggggattcag taacattcac gccggaagtg aattcaaaca gggttctggc gtcgttctcg 31800 tactgttttc cccaggccag tgctttagcg ttaacttccg gagccacacc ggtgcaaacc 31860 tcagcaagca gggtgtggaa gtaggacatt ttcatgtcag gccacttctt tccggagcgg 31920 ggttttgcta tcacgttgtg aacttctgaa gcggtgatga cgccgagccg taatttgtgc 31980 cacgcatcat ccccctgttc gacagctctc acatcgatcc cggtacgctg caggataatg 32040 tccggtgtca tgctgccacc ttctgctctg cggctttctg tttcaggaat ccaagagctt 32100 ttactgcttc ggcctgtgtc agttctgacg atgcacgaat gtcgcggcga aatatctggg 32160 aacagagcgg caataagtcg tcatcccatg ttttatccag ggcgatcagc agagtgttaa 32220 tctcctgcat ggtttcatcg ttaaccggag tgatgtcgcg ttccggctga cgttctgcag 32280 tgtatgcagt attttcgaca atgcgctcgg cttcatcctt gtcatagata ccagcaaatc 32340 cgaaggccag acgggcacac tgaatcatgg ctttatgacg taacatccgt ttgggatgcg 32400 actgccacgg ccccgtgatt tctctgcctt cgcgagtttt gaatggttcg cggcggcatt 32460 catccatcca ttcggtaacg cagatcggat gattacggtc cttgcggtaa atccggcatg 32520 tacaggattc attgtcctgc tcaaagtcca tgccatcaaa ctgctggttt tcattgatga 32580 tgcgggacca gccatcaacg cccaccaccg gaacgatgcc attctgctta tcaggaaagg 32640 cgtaaatttc tttcgtccac ggattaaggc cgtactggtt ggcaacgatc agtaatgcga 32700 tgaactgcgc atcgctggca tcacctttaa atgccgtctg gcgaagagtg gtgatcagtt 32760 cctgtgggtc gacagaatcc atgccgacac gttcagccag cttcccagcc agcgttgcga 32820 gtgcagtact cattcgtttt atacctctga atcaatatca acctggtggt gagcaatggt 32880 ttcaaccatg taccggatgt gttctgccat gcgctcctga aactcaacat cgtcatcaaa 32940 cgcacgggta atggattttt tgctggcccc gtggcgttgc aaatgatcga tgcatagcga 33000 ttcaaacagg tgctggggca ggcctttttc catgtcgtct gccagttctg cctctttctc 33060 ttcacgggcg agctgctggt agtgacgcgc ccagctctga gcctcaagac gatcctgaat 33120 gtaataagcg ttcatggctg aactcctgaa atagctgtga aaatatcgcc cgcgaaatgc 33180 cgggctgatt aggaaaacag gaaagggggt tagtgaatgc ttttgcttga tctcagtttc 33240 agtattaata tccatttttt ataagcgtcg acggcttcac gaaacatctt ttcatcgcca 33300 ataaaagtgg cgatagtgaa tttagtctgg atagccataa gtgtttgatc cattctttgg 33360 gactcctggc tgattaagta tgtcgataag gcgtttccat ccgtcacgta atttacgggt 33420 gattcgttca agtaaagatt cggaagggca gccagcaaca ggccaccctg caatggcata 33480 ttgcatggtg tgctccttat ttatacataa cgaaaaacgc ctcgagtgaa gcgttattgg 33540 tatgcggtaa aaccgcactc aggcggcctt gatagtcata tcatctgaat caaatattcc 33600 tgatgtatcg atatcggtaa ttcttattcc ttcgctacca tccattggag gccatccttc 33660 ctgaccattt ccatcattcc agtcgaactc acacacaaca ccatatgcat ttaagtcgct 33720 tgaaattgct ataagcagag catgttgcgc cagcatgatt aatacagcat ttaatacaga 33780 gccgtgttta ttgagtcggt attcagagtc tgaccagaaa ttattaatct ggtgaagttt 33840 ttcctctgtc attacgtcat ggtcgatttc aatttctatt gatgctttcc agtcgtaatc 33900 aatgatgtat tttttgatgt ttgacatctg ttcatatcct cacagataaa aaatcgccct 33960 cacactggag ggcaaagaag atttccaata atcagaacaa gtcggctcct gtttagttac 34020 gagcgacatt gctccgtgta ttcactcgtt ggaatgaata cacagtgcag tgtttattct 34080 gttatttatg ccaaaaataa aggccactat caggcagctt tgttgttctg tttaccaagt 34140 tctctggcaa tcattgccgt cgttcgtatt gcccatttat cgacatattt cccatcttcc 34200 attacaggaa acatttcttc aggcttaacc atgcattccg attgcagctt gcatccattg 34260 catcgcttga attgtccaca ccattgattt ttatcaatag tcgtagtcat acggatagtc 34320 ctggtattgt tccatcacat cctgaggatg ctcttcgaac tcttcaaatt cttcttccat 34380 atatcacctt aaatagtgga ttgcggtagt aaagattgtg cctgtctttt aaccacatca 34440 ggctcggtgg ttctcgtgta cccctacagc gagaaatcgg ataaactatt acaaccccta 34500 cagtttgatg agtatagaaa tggatccact cgttattctc ggacgagtgt tcagtaatga 34560 acctctggag agaaccatgt atatgatcgt tatctgggtt ggacttctgc ttttaagccc 34620 agataactgg cctgaatatg ttaatgagag aatcggtatt cctcatgtgt ggcatgtttt 34680 cgtctttgct cttgcatttt cgctagcaat taatgtgcat cgattatcag ctattgccag 34740 cgccagatat aagcgattta agctaagaaa acgcattaag atgcaaaacg ataaagtgcg 34800 atcagtaatt caaaacctta cagaagagca atctatggtt ttgtgcgcag cccttaatga 34860 aggcaggaag tatgtggtta catcaaaaca attcccatac attagtgagt tgattgagct 34920 tggtgtgttg aacaaaactt tttcccgatg gaatggaaag catatattat tccctattga 34980 ggatatttac tggactgaat tagttgccag ctatgatcca tataatattg agataaagcc 35040 aaggccaata tctaagtaac tagataagag gaatcgattt tcccttaatt ttctggcgtc 35100 cactgcatgt tatgccgcgt tcgccaggct tgctgtacca tgtgcgctga ttcttgcgct 35160 caatacgttg caggttgctt tcaatctgtt tgtggtattc agccagcact gtaaggtcta 35220 tcggatttag tgcgctttct actcgtgatt tcggtttgcg attcagcgag agaatagggc 35280 ggttaactgg ttttgcgctt accccaacca acaggggatt tgctgctttc cattgagcct 35340 gtttctctgc gcgacgttcg cggcggcgtg tttgtgcatc catctggatt ctcctgtcag 35400 ttagctttgg tggtgtgtgg cagttgtagt cctgaacgaa aaccccccgc gattggcaca 35460 ttggcagcta atccggaatc gcacttacgg ccaatgcttc gtttcgtatc acacacccca 35520 aagccttctg ctttgaatgc tgcccttctt cagggcttaa tttttaagag cgtcaccttc 35580 atggtggtca gtgcgtcctg ctgatgtgct cagtatcacc gccagtggta tttatgtcaa 35640 caccgccaga gataatttat caccgcagat ggttatctgt atgtttttta tatgaattta 35700 ttttttgcag gggggcattg tttggtaggt gagagatctg aattgctatg tttagtgagt 35760 tgtatctatt tatttttcaa taaatacaat tggttatgtg ttttgggggc gatcgtgagg 35820 caaagaaaac ccggcgctga ggccgggtta ttcttgttct ctggtcaaat tatatagttg 35880 gaaaacaagg atgcatatat gaatgaacga tgcagaggca atgccgatgg cgatagtggg 35940 tatcatgtag ccgcttatgc tggaaagaag caataacccg cagaaaaaca aagctccaag 36000 ctcaacaaaa ctaagggcat agacaataac taccgatgtc atatacccat actctctaat 36060 cttggccagt cggcgcgttc tgcttccgat tagaaacgtc aaggcagcaa tcaggattgc 36120 aatcatggtt cctgcatatg atgacaatgt cgccccaaga ccatctctat gagctgaaaa 36180 agaaacacca ggaatgtagt ggcggaaaag gagatagcaa atgcttacga taacgtaagg 36240 aattattact atgtaaacac caggcatgat tctgttccgc ataattactc ctgataatta 36300 atccttaact ttgcccacct gccttttaaa acattccagt atatcacttt tcattcttgc 36360 gtagcaatat gccatctctt cagctatctc agcattggtg accttgttca gaggcgctga 36420 gagatggcct ttttctgata gataatgttc tgttaaaata tctccggcct catcttttgc 36480 ccgcaggcta atgtctgaaa attgaggtga cgggttaaaa ataatatcct tggcaacctt 36540 ttttatatcc cttttaaatt ttggcttaat gactatatcc aatgagtcaa aaagctcccc 36600 ttcaatatct gttgccccta agacctttaa tatatcgcca aatacaggta gcttggcttc 36660 taccttcacc gttgttcggc cgatgaaatg catatgcata acatcgtctt tggtggttcc 36720 cctcatcagt ggctctatct gaacgcgctc tccactgctt aatgacattc ctttcccgat 36780 taaaaaatct gtcagatcgg atgtggtcgg cccgaaaaca gttctggcaa aaccaatggt 36840 gtcgccttca acaaacaaaa aagatgggaa tcccaatgat tcgtcatctg cgaggctgtt 36900 cttaatatct tcaactgaag ctttagagcg atttatcttc tgaaccagac tcttgtcatt 36960 tgttttggta aagagaaaag tttttccatc gattttatga atatacaaat aattggagcc 37020 aacctgcagg tgatgattat cagccagcag agaattaagg aaaacagaca ggtttattga 37080 gcgcttatct ttccctttat ttttgctgcg gtaagtcgca taaaaaccat tcttcataat 37140 tcaatccatt tactatgtta tgttctgagg ggagtgaaaa ttcccctaat tcgatgaaga 37200 ttcttgctca attgttatca gctatgcgcc gaccagaaca ccttgccgat cagccaaacg 37260 tctcttcagg ccactgacta gcgataactt tccccacaac ggaacaactc tcattgcatg 37320 ggatcattgg gtactgtggg tttagtggtt gtaaaaacac ctgaccgcta tccctgatca 37380 gtttcttgaa ggtaaactca tcacccccaa gtctggctat gcagaaatca cctggctcaa 37440 cagcctgctc agggtcaacg agaattaaca ttccgtcagg aaagcttggc ttggagcctg 37500 ttggtgcggt catggaatta ccttcaacct caagccagaa tgcagaatca ctggcttttt 37560 tggttgtgct tacccatctc tccgcatcac ctttggtaaa ggttctaagc ttaggtgaga 37620 acatccctgc ctgaacatga gaaaaaacag ggtactcata ctcacttcta agtgacggct 37680 gcatactaac cgcttcatac atctcgtaga tttctctggc gattgaaggg ctaaattctt 37740 caacgctaac tttgagaatt tttgtaagca atgcggcgtt ataagcattt aatgcattga 37800 tgccattaaa taaagcacca acgcctgact gccccatccc catcttgtct gcgacagatt 37860 cctgggataa gccaagttca tttttctttt tttcataaat tgctttaagg cgacgtgcgt 37920 cctcaagctg ctcttgtgtt aatggtttct tttttgtgct catacgttaa atctatcacc 37980 gcaagggata aatatctaac accgtgcgtg ttgactattt tacctctggc ggtgataatg 38040 gttgcatgta ctaaggaggt tgtatggaac aacgcataac cctgaaagat tatgcaatgc 38100 gctttgggca aaccaagaca gctaaagatc tcggcgtata tcaaagcgcg atcaacaagg 38160 ccattcatgc aggccgaaag atttttttaa ctataaacgc tgatggaagc gtttatgcgg 38220 aagaggtaaa gcccttcccg agtaacaaaa aaacaacagc ataaataacc ccgctcttac 38280 acattccagc cctgaaaaag ggcatcaaat taaaccacac ctatggtgta tgcatttatt 38340 tgcatacatt caatcaattg ttatctaagg aaatacttac atatggttcg tgcaaacaaa 38400 cgcaacgagg ctctacgaat cgagagtgcg ttgcttaaca aaatcgcaat gcttggaact 38460 gagaagacag cggaagctgt gggcgttgat aagtcgcaga tcagcaggtg gaagagggac 38520 tggattccaa agttctcaat gctgcttgct gttcttgaat ggggggtcgt tgacgacgac 38580 atggctcgat tggcgcgaca agttgctgcg attctcacca ataaaaaacg cccggcggca 38640 accgagcgtt ctgaacaaat ccagatggag ttctgaggtc attactggat ctatcaacag 38700 gagtcattat gacaaataca gcaaaaatac tcaacttcgg cagaggtaac tttgccggac 38760 aggagcgtaa tgtggcagat ctcgatgatg gttacgccag actatcaaat atgctgcttg 38820 aggcttattc gggcgcagat ctgaccaagc gacagtttaa agtgctgctt gccattctgc 38880 gtaaaaccta tgggtggaat aaaccaatgg acagaatcac cgattctcaa cttagcgaga 38940 ttacaaagtt acctgtcaaa cggtgcaatg aagccaagtt agaactcgtc agaatgaata 39000 ttatcaagca gcaaggcggc atgtttggac caaataaaaa catctcagaa tggtgcatcc 39060 ctcaaaacga gggaaaatcc cctaaaacga gggataaaac atccctcaaa ttgggggatt 39120 gctatccctc aaaacagggg gacacaaaag acactattac aaaagaaaaa agaaaagatt 39180 attcgtcaga gaattctggc gaatcctctg accagccaga aaacgacctt tctgtggtga 39240 aaccggatgc tgcaattcag agcggcagca agtgggggac agcagaagac ctgaccgccg 39300 cagagtggat gtttgacatg gtgaagacta tcgcaccatc agccagaaaa ccgaattttg 39360 ctgggtgggc taacgatatc cgcctgatgc gtgaacgtga cggacgtaac caccgcgaca 39420 tgtgtgtgct gttccgctgg gcatgccagg acaacttctg gtccggtaac gtgctgagcc 39480 cggccaaact ccgcgataag tggacccaac tcgaaatcaa ccgtaacaag caacaggcag 39540 gcgtgacagc cagcaaacca aaactcgacc tgacaaacac agactggatt tacggggtgg 39600 atctatgaaa aacatcgccg cacagatggt taactttgac cgtgagcaga tgcgtcggat 39660 cgccaacaac atgccggaac agtacgacga aaagccgcag gtacagcagg tagcgcagat 39720 catcaacggt gtgttcagcc agttactggc aactttcccg gcgagcctgg ctaaccgtga 39780 ccagaacgaa gtgaacgaaa tccgtcgcca gtgggttctg gcttttcggg aaaacgggat 39840 caccacgatg gaacaggtta acgcaggaat gcgcgtagcc cgtcggcaga atcgaccatt 39900 tctgccatca cccgggcagt ttgttgcatg gtgccgggaa gaagcatccg ttaccgccgg 39960 actgccaaac gtcagcgagc tggttgatat ggtttacgag tattgccgga agcgaggcct 40020 gtatccggat gcggagtctt atccgtggaa atcaaacgcg cactactggc tggttaccaa 40080 cctgtatcag aacatgcggg ccaatgcgct tactgatgcg gaattacgcc gtaaggccgc 40140 agatgagctt gtccatatga ctgcgagaat taaccgtggt gaggcgatcc ctgaaccagt 40200 aaaacaactt cctgtcatgg gcggtagacc tctaaatcgt gcacaggctc tggcgaagat 40260 cgcagaaatc aaagctaagt tcggactgaa aggagcaagt gtatgacggg caaagaggca 40320 attattcatt acctggggac gcataatagc ttctgtgcgc cggacgttgc cgcgctaaca 40380 ggcgcaacag taaccagcat aaatcaggcc gcggctaaaa tggcacgggc aggtcttctg 40440 gttatcgaag gtaaggtctg gcgaacggtg tattaccggt ttgctaccag ggaagaacgg 40500 gaaggaaaga tgagcacgaa cctggttttt aaggagtgtc gccagagtgc cgcgatgaaa 40560 cgggtattgg cggtatatgg agttaaaaga tgaccatcta cattactgag ctaataacag 40620 gcctgctggt aatcgcaggc ctttttattt gggggagagg gaagtcatga aaaaactaac 40680 ctttgaaatt cgatctccag cacatcagca aaacgctatt cacgcagtac agcaaatcct 40740 tccagaccca accaaaccaa tcgtagtaac cattcaggaa cgcaaccgca gcttagacca 40800 aaacaggaag ctatgggcct gcttaggtga cgtctctcgt caggttgaat ggcatggtcg 40860 ctggctggat gcagaaagct ggaagtgtgt gtttaccgca gcattaaagc agcaggatgt 40920 tgttcctaac cttgccggga atggctttgt ggtaataggc cagtcaacca gcaggatgcg 40980 tgtaggcgaa tttgcggagc tattagagct tatacaggca ttcggtacag agcgtggcgt 41040 taagtggtca gacgaagcga gactggctct ggagtggaaa gcgagatggg gagacagggc 41100 tgcatgataa atgtcgttag tttctccggt ggcaggacgt cagcatattt gctctggcta 41160 atggagcaaa agcgacgggc aggtaaagac gtgcattacg ttttcatgga tacaggttgt 41220 gaacatccaa tgacatatcg gtttgtcagg gaagttgtga agttctggga tataccgctc 41280 accgtattgc aggttgatat caacccggag cttggacagc caaatggtta tacggtatgg 41340 gaaccaaagg atattcagac gcgaatgcct gttctgaagc catttatcga tatggtaaag 41400 aaatatggca ctccatacgt cggcggcgcg ttctgcactg acagattaaa actcgttccc 41460 ttcaccaaat actgtgatga ccatttcggg cgagggaatt acaccacgtg gattggcatc 41520 agagctgatg aaccgaagcg gctaaagcca aagcctggaa tcagatatct tgctgaactg 41580 tcagactttg agaaggaaga tatcctcgca tggtggaagc aacaaccatt cgatttgcaa 41640 ataccggaac atctcggtaa ctgcatattc tgcattaaaa aatcaacgca aaaaatcgga 41700 cttgcctgca aagatgagga gggattgcag cgtgttttta atgaggtcat cacgggatcc 41760 catgtgcgtg acggacatcg ggaaacgcca aaggagatta tgtaccgagg aagaatgtcg 41820 ctggacggta tcgcgaaaat gtattcagaa aatgattatc aagccctgta tcaggacatg 41880 gtacgagcta aaagattcga taccggctct tgttctgagt catgcgaaat atttggaggg 41940 cagcttgatt tcgacttcgg gagggaagct gcatgatgcg atgttatcgg tgcggtgaat 42000 gcaaagaaga taaccgcttc cgaccaaatc aaccttactg gaatcgatgg tgtctccggt 42060 gtgaaagaac accaacaggg gtgttaccac taccgcagga aaaggaggac gtgtggcgag 42120 acagcgacga agtatcaccg acataatctg cgaaaactgc aaataccttc caacgaaacg 42180 caccagaaat aaacccaagc caatcccaaa agaatctgac gtaaaaacct tcaactacac 42240 ggctcacctg tgggatatcc ggtggctaag acgtcgtgcg aggaaaacaa ggtgattgac 42300 caaaatcgaa gttacgaaca agaaagcgtc gagcgagctt taacgtgcgc taactgcggt 42360 cagaagctgc atgtgctgga agttcacgtg tgtgagcact gctgcgcaga actgatgagc 42420 gatccgaata gctcgatgca cgaggaagaa gatgatggct aaaccagcgc gaagacgatg 42480 taaaaacgat gaatgccggg aatggtttca ccctgcattc gctaatcagt ggtggtgctc 42540 tccagagtgt ggaaccaaga tagcactcga acgacgaagt aaagaacgcg aaaaagcgga 42600 aaaagcagca gagaagaaac gacgacgaga ggagcagaaa cagaaagata aacttaagat 42660 tcgaaaactc gccttaaagc cccgcagtta ctggattaaa caagcccaac aagccgtaaa 42720 cgccttcatc agagaaagag accgcgactt accatgtatc tcgtgcggaa cgctcacgtc 42780 tgctcagtgg gatgccggac attaccggac aactgctgcg gcacctcaac tccgatttaa 42840 tgaacgcaat attcacaagc aatgcgtggt gtgcaaccag cacaaaagcg gaaatctcgt 42900 tccgtatcgc gtcgaactga ttagccgcat cgggcaggaa gcagtagacg aaatcgaatc 42960 aaaccataac cgccatcgct ggactatcga agagtgcaag gcgatcaagg cagagtacca 43020 acagaaactc aaagacctgc gaaatagcag aagtgaggcc gcatgacgtt ctcagtaaaa 43080 accattccag acatgctcgt tgaaacatac ggaaatcaga cagaagtagc acgcagactg 43140 aaatgtagtc gcggtacggt cagaaaatac gttgatgata aagacgggaa aatgcacgcc 43200 atcgtcaacg acgttctcat ggttcatcgc ggatggagtg aaagagatgc gctattacga 43260 aaaaattgat ggcagcaaat accgaaatat ttgggtagtt ggcgatctgc acggatgcta 43320 cacgaacctg atgaacaaac tggatacgat tggattcgac aacaaaaaag acctgcttat 43380 ctcggtgggc gatttggttg atcgtggtgc agagaacgtt gaatgcctgg aattaatcac 43440 attcccctgg ttcagagctg tacgtggaaa ccatgagcaa atgatgattg atggcttatc 43500 agagcgtgga aacgttaatc actggctgct taatggcggt ggctggttct ttaatctcga 43560 ttacgacaaa gaaattctgg ctaaagctct tgcccataaa gcagatgaac ttccgttaat 43620 catcgaactg gtgagcaaag ataaaaaata tgttatctgc cacgccgatt atccctttga 43680 cgaatacgag tttggaaagc cagttgatca tcagcaggta atctggaacc gcgaacgaat 43740 cagcaactca caaaacggga tcgtgaaaga aatcaaaggc gcggacacgt tcatctttgg 43800 tcatacgcca gcagtgaaac cactcaagtt tgccaaccaa atgtatatcg ataccggcgc 43860 agtgttctgc ggaaacctaa cattgattca ggtacaggga gaaggcgcat gagactcgaa 43920 agcgtagcta aatttcattc gccaaaaagc ccgatgatga gcgactcacc acgggccacg 43980 gcttctgact ctctttccgg tactgatgtg atggctgcta tggggatggc gcaatcacaa 44040 gccggattcg gtatggctgc attctgcggt aagcacgaac tcagccagaa cgacaaacaa 44100 aaggctatca actatctgat gcaatttgca cacaaggtat cggggaaata ccgtggtgtg 44160 gcaaagcttg aaggaaatac taaggcaaag gtactgcaag tgctcgcaac attcgcttat 44220 gcggattatt gccgtagtgc cgcgacgccg ggggcaagat gcagagattg ccatggtaca 44280 ggccgtgcgg ttgatattgc caaaacagag ctgtggggga gagttgtcga gaaagagtgc 44340 ggaagatgca aaggcgtcgg ctattcaagg atgccagcaa gcgcagcata tcgcgctgtg 44400 acgatgctaa tcccaaacct tacccaaccc acctggtcac gcactgttaa gccgctgtat 44460 gacgctctgg tggtgcaatg ccacaaagaa gagtcaatcg cagacaacat tttgaatgcg 44520 gtcacacgtt agcagcatga ttgccacgga tggcaacata ttaacggcat gatattgact 44580 tattgaataa aattgggtaa atttgactca acgatgggtt aattcgctcg ttgtggtagt 44640 gagatgaaaa gaggcggcgc ttactaccga ttccgcctag ttggtcactt cgacgtatcg 44700 tctggaactc caaccatcgc aggcagagag gtctgcaaaa tgcaatcccg aaacagttcg 44760 caggtaatag ttagagcctg cataacggtt tcgggatttt ttatatctgc acaacaggta 44820 agagcattga gtcgataatc gtgaagagtc ggcgagcctg gttagccagt gctctttccg 44880 ttgtgctgaa ttaagcgaat accggaagca gaaccggatc accaaatgcg tacaggcgtc 44940 atcgccgccc agcaacagca caacccaaac tgagccgtag ccactgtctg tcctgaattc 45000 attagtaata gttacgctgc ggccttttac acatgacctt cgtgaaagcg ggtggcagga 45060 ggtcgcgcta acaacctcct gccgttttgc ccgtgcatat cggtcacgaa caaatctgat 45120 tactaaacac agtagcctgg atttgttcta tcagtaatcg accttattcc taattaaata 45180 gagcaaatcc ccttattggg ggtaagacat gaagatgcca gaaaaacatg acctgttggc 45240 cgccattctc gcggcaaagg aacaaggcat cggggcaatc cttgcgtttg caatggcgta 45300 ccttcgcggc agatataatg gcggtgcgtt tacaaaaaca gtaatcgacg caacgatgtg 45360 cgccattatc gcctagttca ttcgtgacct tctcgacttc gccggactaa gtagcaatct 45420 cgcttatata acgagcgtgt ttatcggcta catcggtact gactcgattg gttcgcttat 45480 caaacgcttc gctgctaaaa aagccggagt agaagatggt agaaatcaat aatcaacgta 45540 aggcgttcct cgatatgctg gcgtggtcgg agggaactga taacggacgt cagaaaacca 45600 gaaatcatgg ttatgacgtc attgtaggcg gagagctatt tactgattac tccgatcacc 45660 ctcgcaaact tgtcacgcta aacccaaaac tcaaatcaac aggcgccgga cgctaccagc 45720 ttctttcccg ttggtgggat gcctaccgca agcagcttgg cctgaaagac ttctctccga 45780 aaagtcagga cgctgtggca ttgcagcaga ttaaggagcg tggcgcttta cctatgattg 45840 atcgtggtga tatccgtcag gcaatcgacc gttgcagcaa tatctgggct tcactgccgg 45900 gcgctggtta tggtcagttc gagcataagg ctgacagcct gattgcaaaa ttcaaagaag 45960 cgggcggaac ggtcagagag attgatgtat gagcagagtc accgcgatta tctccgctct 46020 ggttatctgc atcatcgtct gcctgtcatg ggctgttaat cattaccgtg ataacgccat 46080 tacctacaaa gcccagcgcg acaaaaatgc cagagaactg aagctggcga acgcggcaat 46140 tactgacatg cagatgcgtc agcgtgatgt tgctgcgctc gatgcaaaat acacgaagga 46200 gttagctgat gctaaagctg aaaatgatgc tctgcgtgat gatgttgccg ctggtcgtcg 46260 tcggttgcac atcaaagcag tctgtcagtc agtgcgtgaa gccaccaccg cctccggcgt 46320 ggataatgca gcctcccccc gactggcaga caccgctgaa cgggattatt tcaccctcag 46380 agagaggctg atcactatgc aaaaacaact ggaaggaacc cagaagtata ttaatgagca 46440 gtgcagatag agttgcccat atcgatgggc aactcatgca attattgtga gcaatacaca 46500 cgcgcttcca gcggagtata aatgcctaaa gtaataaaac cgagcaatcc atttacgaat 46560 gtttgctggg tttctgtttt aacaacattt tctgcgccgc cacaaatttt ggctgcatcg 46620 acagttttct tctgcccaat tccagaaacg aagaaatgat gggtgatggt ttcctttggt 46680 gctactgctg ccggtttgtt ttgaacagta aacgtctgtt gagcacatcc tgtaataagc 46740 agggccagcg cagtagcgag tagcattttt ttcatggtgt tattcccgat gctttttgaa 46800 gttcgcagaa tcgtatgtgt agaaaattaa acaaacccta aacaatgagt tgaaatttca 46860 tattgttaat atttattaat gtatgtcagg tgcgatgaat cgtcattgta ttcccggatt 46920 aactatgtcc acagccctga cggggaactt ctctgcggga gtgtccggga ataattaaaa 46980 cgatgcacac agggtttagc gcgtacacgt attgcattat gccaacgccc cggtgctgac 47040 acggaagaaa ccggacgtta tgatttagcg tggaaagatt tgtgtagtgt tctgaatgct 47100 ctcagtaaat agtaatgaat tatcaaaggt atagtaatat cttttatgtt catggatatt 47160 tgtaacccat cggaaaactc ctgctttagc aagattttcc ctgtattgct gaaatgtgat 47220 ttctcttgat ttcaacctat cataggacgt ttctataaga tgcgtgtttc ttgagaattt 47280 aacatttaca acctttttaa gtccttttat taacacggtg ttatcgtttt ctaacacgat 47340 gtgaatatta tctgtggcta gatagtaaat ataatgtgag acgttgtgac gttttagttc 47400 agaataaaac aattcacagt ctaaatcttt tcgcacttga tcgaatattt ctttaaaaat 47460 ggcaacctga gccattggta aaaccttcca tgtgatacga gggcgcgtag tttgcattat 47520 cgtttttatc gtttcaatct ggtctgacct ccttgtgttt tgttgatgat ttatgtcaaa 47580 tattaggaat gttttcactt aatagtattg gttgcgtaac aaagtgcggt cctgctggca 47640 ttctggaggg aaatacaacc gacagatgta tgtaaggcca acgtgctcaa atcttcatac 47700 agaaagattt gaagtaatat tttaaccgct agatgaagag caagcgcatg gagcgacaaa 47760 atgaataaag aacaatctgc tgatgatccc tccgtggatc tgattcgtgt aaaaaatatg 47820 cttaatagca ccatttctat gagttaccct gatgttgtaa ttgcatgtat agaacataag 47880 gtgtctctgg aagcattcag agcaattgag gcagcgttgg tgaagcacga taataatatg 47940 aaggattatt ccctggtggt tgactgatca ccataactgc taatcattca aactatttag 48000 tctgtgacag agccaacacg cagtctgtca ctgtcaggaa agtggtaaaa ctgcaactca 48060 attactgcaa tgccctcgta attaagtgaa tttacaatat cgtcctgttc ggagggaaga 48120 acgcgggatg ttcattcttc atcactttta attgatgtat atgctctctt ttctgacgtt 48180 agtctccgac ggcaggcttc aatgacccag gctgagaaat tcccggaccc tttttgctca 48240 agagcgatgt taatttgttc aatcatttgg ttaggaaagc ggatgttgcg ggttgttgtt 48300 ctgcgggttc tgttcttcgt tgacatgagg ttgccccgta ttcagtgtcg ctgatttgta 48360 ttgtctgaag ttgtttttac gttaagttga tgcagatcaa ttaatacgat acctgcgtca 48420 taattgatta tttgacgtgg tttgatggcc tccacgcacg ttgtgatatg tagatgataa 48480 tcattatcac tttacgggtc ctttccggtg atccgacagg ttacggggcg gcgacctcgt 48540 tctgtttatg tttcttgttt gttagccttt tggctaacaa acaagaaaca taaacagaac 48600 gcgtaacctg tcggatcacc ggaaaggacc cgtaaagtga taatgattat catctacata 48660 tcacaacgtg cgtggaggcc atcaaaccac gtcaaataat caattatgac gcaggtatcg 48720 tattaattga tctgcatcaa cttaacgtaa aaacaacttc agacaataca aatcagcgac 48780 actgaatacg gggcaacctc atgtcaacga agaacagaac ccgcagaaca acaacccgca 48840 acatccgctt tcctaaccaa atgattgaac aaattaacat cgctcttgag caaaaagggt 48900 ccgggaattt ctcagcctgg gtcattgaag cctgccgtcg gagactaacg tcagaaaaga 48960 gagcatatac atcaattaaa agtgatgaag aatgaacatc ccgcgttctt ccctccgaac 49020 aggacgatat tgtaaattca cttaattacg agggcattgc agtaattgag ttgcagtttt 49080 accactttcc tgacagtgac agactgcgtg ttggctctgt cacagactaa atagtttgaa 49140 tgattagcag ttatggtgat cagtcaacca ccagggaata atccttcata ttattatcgt 49200 gcttcaccaa cgctgcctca attgctctga atgcttccag agacacctta tgttctatac 49260 atgcaattac aacatcaggg taactcatag aaatggtgct attaagcata ttttttacac 49320 gaatcagatc cacggaggga tcatcagcag attgttcttt attcattttg tcgctccatg 49380 cgcttgctct tcatctagcg gttaaaatat tacttcaaat ctttctgtat gaagatttga 49440 gcacgttggc cttacataca tctgtcggtt gtatttccct ccagaatgcc agcaggaccg 49500 cactttgtta cgcaaccaat actattaagt gaaaacattc ctaatatttg acataaatca 49560 tcaacaaaac acaaggaggt cagaccagat tgaaacgata aaaacgataa tgcaaactac 49620 gcgccctcgt atcacatgga aggttttacc aatggctcag gttgccattt ttaaagaaat 49680 attcgatcaa gtgcgaaaag atttagactg tgaattgttt tattctgaac taaaacgtca 49740 caacgtctca cattatattt actatctagc cacagataat attcacatcg tgttagaaaa 49800 cgataacacc gtgttaataa aaggacttaa aaaggttgta aatgttaaat tctcaagaaa 49860 cacgcatctt atagaaacgt cctatgatag gttgaaatca agagaaatca catttcagca 49920 atacagggaa aatcttgcta aagcaggagt tttccgatgg gttacaaata tccatgaaca 49980 taaaagatat tactatacct ttgataattc attactattt actgagagca ttcagaacac 50040 tacacaaatc tttccacgct aaatcataac gtccggtttc ttccgtgtca gcaccggggc 50100 gttggcataa tgcaatacgt gtacgcgcta aaccctgtgt gcatcgtttt aattattccc 50160 ggacactccc gcagagaagt tccccgtcag ggctgtggac atagttaatc cgggaataca 50220 atgacgattc atcgcacctg acatacatta ataaatatta acaatatgaa atttcaactc 50280 attgtttagg gtttgtttaa ttttctacac atacgattct gcgaacttca aaaagcatcg 50340 ggaataacac catgaaaaaa atgctactcg ctactgcgct ggccctgctt attacaggat 50400 gtgctcaaca gacgtttact gttcaaaaca aaccggcagc agtagcacca aaggaaacca 50460 tcacccatca tttcttcgtt tctggaattg ggcagaagaa aactgtcgat gcagccaaaa 50520 tttgtggcgg cgcagaaaat gttgttaaaa cagaaaccca gcaaacattc gtaaatggat 50580 tgctcggttt tattacttta ggcatttata ctccgctgga agcgcgtgtg tattgctcac 50640 aataattgca tgagttgccc atcgatatgg gcaactctat ctgcactgct cattaatata 50700 cttctgggtt ccttccagtt gtttttgcat agtgatcagc ctctctctga gggtgaaata 50760 atcccgttca gcggtgtctg ccagtcgggg ggaggctgca ttatccacgc cggaggcggt 50820 ggtggcttca cgcactgact gacagactgc tttgatgtgc aaccgacgac gaccagcggc 50880 aacatcatca cgcagagcat cattttcagc tttagcatca gctaactcct tcgtgtattt 50940 tgcatcgagc gcagcaacat cacgctgacg catctgcatg tcagtaattg ccgcgttcgc 51000 cagcttcagt tctctggcat ttttgtcgcg ctgggctttg taggtaatgg cgttatcacg 51060 gtaatgatta acagcccatg acaggcagac gatgatgcag ataaccagag cggagataat 51120 cgcggtgact ctgctcatac atcaatctct ctgaccgttc cgcccgcttc tttgaatttt 51180 gcaatcaggc tgtcagcctt atgctcgaac tgaccataac cagcgcccgg cagtgaagcc 51240 cagatattgc tgcaacggtc gattgcctga cggatatcac cacgatcaat cataggtaaa 51300 gcgccacgct ccttaatctg ctgcaatgcc acagcgtcct gacttttcgg agagaagtct 51360 ttcaggccaa gctgcttgcg gtaggcatcc caccaacggg aaagaagctg gtagcgtccg 51420 gcgcctgttg atttgagttt tgggtttagc gtgacaagtt tgcgagggtg atcggagtaa 51480 tcagtaaata gctctccgcc tacaatgacg tcataaccat gatttctggt tttctgacgt 51540 ccgttatcag ttccctccga ccacgccagc atatcgagga acgccttacg ttgattattg 51600 atttctacca tcttctactc cggctttttt agcagcgaag cgtttgataa gcgaaccaat 51660 cgagtcagta ccgatgtagc cgataaacac gctcgttata taagcgagat tgctacttag 51720 tccggcgaag tcgagaaggt cacgaatgaa ctaggcgata atggcgcaca tcgttgcgtc 51780 gattactgtt tttgtaaacg caccgccatt atatctgccg cgaaggtacg ccattgcaaa 51840 cgcaaggatt gccccgatgc cttgttcctt tgccgcgaga atggcggcca acaggtcatg 51900 tttttctggc atcttcatgt cttaccccca ataaggggat ttgctctatt taattaggaa 51960 taaggtcgat tactgataga acaaatccag gctactgtgt ttagtaatca gatttgttcg 52020 tgaccgatat gcacgggcaa aacggcagga ggttgttagc gcgacctcct gccacccgct 52080 ttcacgaagg tcatgtgtaa aaggccgcag cgtaactatt actaatgaat tcaggacaga 52140 cagtggctac ggctcagttt gggttgtgct gttgctgggc ggcgatgacg cctgtacgca 52200 tttggtgatc cggttctgct tccggtattc gcttaattca gcacaacgga aagagcactg 52260 gctaaccagg ctcgccgact cttcacgatt atcgactcaa tgctcttacc tgttgtgcag 52320 atataaaaaa tcccgaaacc gttatgcagg ctctaactat tacctgcgaa ctgtttcggg 52380 attgcatttt gcagacctct ctgcctgcga tggttggagt tccagacgat acgtcgaagt 52440 gaccaactag gcggaatcgg tagtaagcgc cgcctctttt catctcacta ccacaacgag 52500 cgaattaacc catcgttgag tcaaatttac ccaattttat tcaataagtc aatatcatgc 52560 cgttaatatg ttgccatccg tggcaatcat gctgctaacg tgtgaccgca ttcaaaatgt 52620 tgtctgcgat tgactcttct ttgtggcatt gcaccaccag agcgtcatac agcggcttaa 52680 cagtgcgtga ccaggtgggt tgggtaaggt ttgggattag catcgtcaca gcgcgatatg 52740 ctgcgcttgc tggcatcctt gaatagccga cgcctttgca tcttccgcac tctttctcga 52800 caactctccc ccacagctct gttttggcaa tatcaaccgc acggcctgta ccatggcaat 52860 ctctgcatct tgcccccggc gtcgcggcac tacggcaata atccgcataa gcgaatgttg 52920 cgagcacttg cagtaccttt gccttagtat ttccttcaag ctttgccaca ccacggtatt 52980 tccccgatac cttgtgtgca aattgcatca gatagttgat agccttttgt ttgtcgttct 53040 ggctgagttc gtgcttaccg cagaatgcag ccataccgaa tccggcttgt gattgcgcca 53100 tccccatagc agccatcaca tcagtaccgg aaagagagtc agaagccgtg gcccgtggtg 53160 agtcgctcat catcgggctt tttggcgaat gaaatttagc tacgctttcg agtctcatgc 53220 gccttctccc tgtacctgaa tcaatgttag gtttccgcag aacactgcgc cggtatcgat 53280 atacatttgg ttggcaaact tgagtggttt cactgctggc gtatgaccaa agatgaacgt 53340 gtccgcgcct ttgatttctt tcacgatccc gttttgtgag ttgctgattc gttcgcggtt 53400 ccagattacc tgctgatgat caactggctt tccaaactcg tattcgtcaa agggataatc 53460 ggcgtggcag ataacatatt ttttatcttt gctcaccagt tcgatgatta acggaagttc 53520 atctgcttta tgggcaagag ctttagccag aatttctttg tcgtaatcga gattaaagaa 53580 ccagccaccg ccattaagca gccagtgatt aacgtttcca cgctctgata agccatcaat 53640 catcatttgc tcatggtttc cacgtacagc tctgaaccag gggaatgtga ttaattccag 53700 gcattcaacg ttctctgcac cacgatcaac caaatcgccc accgagataa gcaggtcttt 53760 tttgttgtcg aatccaatcg tatccagttt gttcatcagg ttcgtgtagc atccgtgcag 53820 atcgccaact acccaaatat ttcggtattt gctgccatca attttttcgt aatagcgcat 53880 ctctttcact ccatccgcga tgaaccatga gaacgtcgtt gacgatggcg tgcattttcc 53940 cgtctttatc atcaacgtat tttctgaccg taccgcgact acatttcagt ctgcgtgcta 54000 cttctgtctg atttccgtat gtttcaacga gcatgtctgg aatggttttt actgagaacg 54060 tcatgcggcc tcacttctgc tatttcgcag gtctttgagt ttctgttggt actctgcctt 54120 gatcgccttg cactcttcga tagtccagcg atggcggtta tggtttgatt cgatttcgtc 54180 tactgcttcc tgcccgatgc ggctaatcag ttcgacgcga tacggaacga gatttccgct 54240 tttgtgctgg ttgcacacca cgcattgctt gtgaatattg cgttcattaa atcggagttg 54300 aggtgccgca gcagttgtcc ggtaatgtcc ggcatcccac tgagcagacg tgagcgttcc 54360 gcacgagata catggtaagt cgcggtctct ttctctgatg aaggcgttta cggcttgttg 54420 ggcttgttta atccagtaac tgcggggctt taaggcgagt tttcgaatct taagtttatc 54480 tttctgtttc tgctcctctc gtcgtcgttt cttctctgct gctttttccg ctttttcgcg 54540 ttctttactt cgtcgttcga gtgctatctt ggttccacac tctggagagc accaccactg 54600 attagcgaat gcagggtgaa accattcccg gcattcatcg tttttacatc gtcttcgcgc 54660 tggtttagcc atcatcttct tcctcgtgca tcgagctatt cggatcgctc atcagttctg 54720 cgcagcagtg ctcacacacg tgaacttcca gcacatgcag cttctgaccg cagttagcgc 54780 acgttaaagc tcgctcgacg ctttcttgtt cgtaacttcg attttggtca atcaccttgt 54840 tttcctcgca cgacgtctta gccaccggat atcccacagg tgagccgtgt agttgaaggt 54900 ttttacgtca gattcttttg ggattggctt gggtttattt ctggtgcgtt tcgttggaag 54960 gtatttgcag ttttcgcaga ttatgtcggt gatacttcgt cgctgtctcg ccacacgtcc 55020 tccttttcct gcggtagtgg taacacccct gttggtgttc tttcacaccg gagacaccat 55080 cgattccagt aaggttgatt tggtcggaag cggttatctt ctttgcattc accgcaccga 55140 taacatcgca tcatgcagct tccctcccga agtcgaaatc aagctgccct ccaaatattt 55200 cgcatgactc agaacaagag ccggtatcga atcttttagc tcgtaccatg tcctgataca 55260 gggcttgata atcattttct gaatacattt tcgcgatacc gtccagcgac attcttcctc 55320 ggtacataat ctcctttggc gtttcccgat gtccgtcacg cacatgggat cccgtgatga 55380 cctcattaaa aacacgctgc aatccctcct catctttgca ggcaagtccg attttttgcg 55440 ttgatttttt aatgcagaat atgcagttac cgagatgttc cggtatttgc aaatcgaatg 55500 gttgttgctt ccaccatgcg aggatatctt ccttctcaaa gtctgacagt tcagcaagat 55560 atctgattcc aggctttggc tttagccgct tcggttcatc agctctgatg ccaatccacg 55620 tggtgtaatt ccctcgcccg aaatggtcat cacagtattt ggtgaaggga acgagtttta 55680 atctgtcagt gcagaacgcg ccgccgacgt atggagtgcc atatttcttt accatatcga 55740 taaatggctt cagaacaggc attcgcgtct gaatatcctt tggttcccat accgtataac 55800 catttggctg tccaagctcc gggttgatat caacctgcaa tacggtgagc ggtatatccc 55860 agaacttcac aacttccctg acaaaccgat atgtcattgg atgttcacaa cctgtatcca 55920 tgaaaacgta atgcacgtct ttacctgccc gtcgcttttg ctccattagc cagagcaaat 55980 atgctgacgt cctgccaccg gagaaactaa cgacatttat catgcagccc tgtctcccca 56040 tctcgctttc cactccagag ccagtctcgc ttcgtctgac cacttaacgc cacgctctgt 56100 accgaatgcc tgtataagct ctaatagctc cgcaaattcg cctacacgca tcctgctggt 56160 tgactggcct attaccacaa agccattccc ggcaaggtta ggaacaacat cctgctgctt 56220 taatgctgcg gtaaacacac acttccagct ttctgcatcc agccagcgac catgccattc 56280 aacctgacga gagacgtcac ctaagcaggc ccatagcttc ctgttttggt ctaagctgcg 56340 gttgcgttcc tgaatggtta ctacgattgg tttggttggg tctggaagga tttgctgtac 56400 tgcgtgaata gcgttttgct gatgtgctgg agatcgaatt tcaaaggtta gttttttcat 56460 gacttccctc tcccccaaat aaaaaggcct gcgattacca gcaggcctgt tattagctca 56520 gtaatgtaga tggtcatctt ttaactccat ataccgccaa tacccgtttc atcgcggcac 56580 tctggcgaca ctccttaaaa accaggttcg tgctcatctt tccttcccgt tcttccctgg 56640 tagcaaaccg gtaatacacc gttcgccaga ccttaccttc gataaccaga agacctgccc 56700 gtgccatttt agccgcggcc tgatttatgc tggttactgt tgcgcctgtt agcgcggcaa 56760 cgtccggcgc acagaagcta ttatgcgtcc ccaggtaatg aataattgcc tctttgcccg 56820 tcatacactt gctcctttca gtccgaactt agctttgatt tctgcgatct tcgccagagc 56880 ctgtgcacga tttagaggtc taccgcccat gacaggaagt tgttttactg gttcagggat 56940 cgcctcacca cggttaattc tcgcagtcat atggacaagc tcatctgcgg ccttacggcg 57000 taattccgca tcagtaagcg cattggcccg catgttctga tacaggttgg taaccagcca 57060 gtagtgcgcg tttgatttcc acggataaga ctccgcatcc ggatacaggc ctcgcttccg 57120 gcaatactcg taaaccatat caaccagctc gctgacgttt ggcagtccgg cggtaacgga 57180 tgcttcttcc cggcaccatg caacaaactg cccgggtgat ggcagaaatg gtcgattctg 57240 ccgacgggct acgcgcattc ctgcgttaac ctgttccatc gtggtgatcc cgttttcccg 57300 aaaagccaga acccactggc gacggatttc gttcacttcg ttctggtcac ggttagccag 57360 gctcgccggg aaagttgcca gtaactggct gaacacaccg ttgatgatct gcgctacctg 57420 ctgtacctgc ggcttttcgt cgtactgttc cggcatgttg ttggcgatcc gacgcatctg 57480 ctcacggtca aagttaacca tctgtgcggc gatgtttttc atagatccac cccgtaaatc 57540 cagtctgtgt ttgtcaggtc gagttttggt ttgctggctg tcacgcctgc ctgttgcttg 57600 ttacggttga tttcgagttg ggtccactta tcgcggagtt tggccgggct cagcacgtta 57660 ccggaccaga agttgtcctg gcatgcccag cggaacagca cacacatgtc gcggtggtta 57720 cgtccgtcac gttcacgcat caggcggata tcgttagccc acccagcaaa attcggtttt 57780 ctggctgatg gtgcgatagt cttcaccatg tcaaacatcc actctgcggc ggtcaggtct 57840 tctgctgtcc cccacttgct gccgctctga attgcagcat ccggtttcac cacagaaagg 57900 tcgttttctg gctggtcaga ggattcgcca gaattctctg acgaataatc ttttcttttt 57960 tcttttgtaa tagtgtcttt tgtgtccccc tgttttgagg gatagcaatc ccccaatttg 58020 agggatgttt tatccctcgt tttaggggat tttccctcgt tttgagggat gcaccattct 58080 gagatgtttt tatttggtcc aaacatgccg ccttgctgct tgataatatt cattctgacg 58140 agttctaact tggcttcatt gcaccgtttg acaggtaact ttgtaatctc gctaagttga 58200 gaatcggtga ttctgtccat tggtttattc cacccatagg ttttacgcag aatggcaagc 58260 agcactttaa actgtcgctt ggtcagatct gcgcccgaat aagcctcaag cagcatattt 58320 gatagtctgg cgtaaccatc atcgagatct gccacattac gctcctgtcc ggcaaagtta 58380 cctctgccga agttgagtat ttttgctgta tttgtcataa tgactcctgt tgatagatcc 58440 agtaatgacc tcagaactcc atctggattt gttcagaacg ctcggttgcc gccgggcgtt 58500 ttttattggt gagaatcgca gcaacttgtc gcgccaatcg agccatgtcg tcgtcaacga 58560 ccccccattc aagaacagca agcagcattg agaactttgg aatccagtcc ctcttccacc 58620 tgctgatctg cgacttatca acgcccacag cttccgctgt cttctcagtt ccaagcattg 58680 cgattttgtt aagcaacgca ctctcgattc gtagagcctc gttgcgtttg tttgcacgaa 58740 ccatatgtaa gtatttcctt agataacaat tgattgaatg tatgcaaata aatgcataca 58800 ccataggtgt ggtttaattt gatgcccttt ttcagggctg gaatgtgtaa gagcggggtt 58860 atttatgctg ttgttttttt gttactcggg aagggcttta cctcttccgc ataaacgctt 58920 ccatcagcgt ttatagttaa aaaaatcttt cggcctgcat gaatggcctt gttgatcgcg 58980 ctttgatata cgccgagatc tttagctgtc ttggtttgcc caaagcgcat tgcataatct 59040 ttcagggtta tgcgttgttc catacaacct ccttagtaca tgcaaccatt atcaccgcca 59100 gaggtaaaat agtcaacacg cacggtgtta gatatttatc ccttgcggtg atagatttaa 59160 cgtatgagca caaaaaagaa accattaaca caagagcagc ttgaggacgc acgtcgcctt 59220 aaagcaattt atgaaaaaaa gaaaaatgaa cttggcttat cccaggaatc tgtcgcagac 59280 aagatgggga tggggcagtc aggcgttggt gctttattta atggcatcaa tgcattaaat 59340 gcttataacg ccgcattgct tacaaaaatt ctcaaagtta gcgttgaaga atttagccct 59400 tcaatcgcca gagaaatcta cgagatgtat gaagcggtta gtatgcagcc gtcacttaga 59460 agtgagtatg agtaccctgt tttttctcat gttcaggcag ggatgttctc acctaagctt 59520 agaaccttta ccaaaggtga tgcggagaga tgggtaagca caaccaaaaa agccagtgat 59580 tctgcattct ggcttgaggt tgaaggtaat tccatgaccg caccaacagg ctccaagcca 59640 agctttcctg acggaatgtt aattctcgtt gaccctgagc aggctgttga gccaggtgat 59700 ttctgcatag ccagacttgg gggtgatgag tttaccttca agaaactgat cagggatagc 59760 ggtcaggtgt ttttacaacc actaaaccca cagtacccaa tgatcccatg caatgagagt 59820 tgttccgttg tggggaaagt tatcgctagt cagtggcctg aagagacgtt tggctgatcg 59880 gcaaggtgtt ctggtcggcg catagctgat aacaattgag caagaatctt catcgaatta 59940 ggggaatttt cactcccctc agaacataac atagtaaatg gattgaatta tgaagaatgg 60000 tttttatgcg acttaccgca gcaaaaataa agggaaagat aagcgctcaa taaacctgtc 60060 tgttttcctt aattctctgc tggctgataa tcatcacctg caggttggct ccaattattt 60120 gtatattcat aaaatcgatg gaaaaacttt tctctttacc aaaacaaatg acaagagtct 60180 ggttcagaag ataaatcgct ctaaagcttc agttgaagat attaagaaca gcctcgcaga 60240 tgacgaatca ttgggattcc catctttttt gtttgttgaa ggcgacacca ttggttttgc 60300 cagaactgtt ttcgggccga ccacatccga tctgacagat tttttaatcg ggaaaggaat 60360 gtcattaagc agtggagagc gcgttcagat agagccactg atgaggggaa ccaccaaaga 60420 cgatgttatg catatgcatt tcatcggccg aacaacggtg aaggtagaag ccaagctacc 60480 tgtatttggc gatatattaa aggtcttagg ggcaacagat attgaagggg agctttttga 60540 ctcattggat atagtcatta agccaaaatt taaaagggat ataaaaaagg ttgccaagga 60600 tattattttt aacccgtcac ctcaattttc agacattagc ctgcgggcaa aagatgaggc 60660 cggagatatt ttaacagaac attatctatc agaaaaaggc catctctcag cgcctctgaa 60720 caaggtcacc aatgctgaga tagctgaaga gatggcatat tgctacgcaa gaatgaaaag 60780 tgatatactg gaatgtttta aaaggcaggt gggcaaagtt aaggattaat tatcaggagt 60840 aattatgcgg aacagaatca tgcctggtgt ttacatagta ataattcctt acgttatcgt 60900 aagcatttgc tatctccttt tccgccacta cattcctggt gtttcttttt cagctcatag 60960 agatggtctt ggggcgacat tgtcatcata tgcaggaacc atgattgcaa tcctgattgc 61020 tgccttgacg tttctaatcg gaagcagaac gcgccgactg gccaagatta gagagtatgg 61080 gtatatgaca tcggtagtta ttgtctatgc ccttagtttt gttgagcttg gagctttgtt 61140 tttctgcggg ttattgcttc tttccagcat aagcggctac atgataccca ctatcgccat 61200 cggcattgcc tctgcatcgt tcattcatat atgcatcctt gttttccaac tatataattt 61260 gaccagagaa caagaataac ccggcctcag cgccgggttt tctttgcctc acgatcgccc 61320 ccaaaacaca taaccaattg tatttattga aaaataaata gatacaactc actaaacata 61380 gcaattcaga tctctcacct accaaacaat gcccccctgc aaaaaataaa ttcatataaa 61440 aaacatacag ataaccatct gcggtgataa attatctctg gcggtgttga cataaatacc 61500 actggcggtg atactgagca catcagcagg acgcactgac caccatgaag gtgacgctct 61560 taaaaattaa gccctgaaga agggcagcat tcaaagcaga aggctttggg gtgtgtgata 61620 cgaaacgaag cattggccgt aagtgcgatt ccggattagc tgccaatgtg ccaatcgcgg 61680 ggggttttcg ttcaggacta caactgccac acaccaccaa agctaactga caggagaatc 61740 cagatggatg cacaaacacg ccgccgcgaa cgtcgcgcag agaaacaggc tcaatggaaa 61800 gcagcaaatc ccctgttggt tggggtaagc gcaaaaccag ttaaccgccc tattctctcg 61860 ctgaatcgca aaccgaaatc acgagtagaa agcgcactaa atccgataga ccttacagtg 61920 ctggctgaat accacaaaca gattgaaagc aacctgcaac gtattgagcg caagaatcag 61980 cgcacatggt acagcaagcc tggcgaacgc ggcataacat gcagtggacg ccagaaaatt 62040 aagggaaaat cgattcctct tatctagtta cttagatatt ggccttggct ttatctcaat 62100 attatatgga tcatagctgg caactaattc agtccagtaa atatcctcaa tagggaataa 62160 tatatgcttt ccattccatc gggaaaaagt tttgttcaac acaccaagct caatcaactc 62220 actaatgtat gggaattgtt ttgatgtaac cacatacttc ctgccttcat taagggctgc 62280 gcacaaaacc atagattgct cttctgtaag gttttgaatt actgatcgca ctttatcgtt 62340 ttgcatctta atgcgttttc ttagcttaaa tcgcttatat ctggcgctgg caatagctga 62400 taatcgatgc acattaattg ctagcgaaaa tgcaagagca aagacgaaaa catgccacac 62460 atgaggaata ccgattctct cattaacata ttcaggccag ttatctgggc ttaaaagcag 62520 aagtccaacc cagataacga tcatatacat ggttctctcc agaggttcat tactgaacac 62580 tcgtccgaga ataacgagtg gatccatttc tatactcatc aaactgtagg ggttgtaata 62640 gtttatccga tttctcgctg taggggtaca cgagaaccac cgagcctgat gtggttaaaa 62700 gacaggcaca atctttacta ccgcaatcca ctatttaagg tgatatatgg aagaagaatt 62760 tgaagagttc gaagagcatc ctcaggatgt gatggaacaa taccaggact atccgtatga 62820 ctacgactat tgataaaaat caatggtgtg gacaattcaa gcgatgcaat ggatgcaagc 62880 tgcaatcgga atgcatggtt aagcctgaag aaatgtttcc tgtaatggaa gatgggaaat 62940 atgtcgataa atgggcaata cgaacgacgg caatgattgc cagagaactt ggtaaacaga 63000 acaacaaagc tgcctgatag tggcctttat ttttggcata aataacagaa taaacactgc 63060 actgtgtatt cattccaacg agtgaataca cggagcaatg tcgctcgtaa ctaaacagga 63120 gccgacttgt tctgattatt ggaaatcttc tttgccctcc agtgtgaggg cgatttttta 63180 tctgtgagga tatgaacaga tgtcaaacat caaaaaatac atcattgatt acgactggaa 63240 agcatcaata gaaattgaaa tcgaccatga cgtaatgaca gaggaaaaac ttcaccagat 63300 taataatttc tggtcagact ctgaataccg actcaataaa cacggctctg tattaaatgc 63360 tgtattaatc atgctggcgc aacatgctct gcttatagca atttcaagcg acttaaatgc 63420 atatggtgtt gtgtgtgagt tcgactggaa tgatggaaat ggtcaggaag gatggcctcc 63480 aatggatggt agcgaaggaa taagaattac cgatatcgat acatcaggaa tatttgattc 63540 agatgatatg actatcaagg ccgcctgagt gcggttttac cgcataccaa taacgcttca 63600 ctcgaggcgt ttttcgttat gtataaataa ggagcacacc atgcaatatg ccattgcagg 63660 gtggcctgtt gctggctgcc cttccgaatc tttacttgaa cgaatcaccc gtaaattacg 63720 tgacggatgg aaacgcctta tcgacatact taatcagcca ggagtcccaa agaatggatc 63780 aaacacttat ggctatccag actaaattca ctatcgccac ttttattggc gatgaaaaga 63840 tgtttcgtga agccgtcgac gcttataaaa aatggatatt aatactgaaa ctgagatcaa 63900 gcaaaagcat tcactaaccc cctttcctgt tttcctaatc agcccggcat ttcgcgggcg 63960 atattttcac agctatttca ggagttcagc catgaacgct tattacattc aggatcgtct 64020 tgaggctcag agctgggcgc gtcactacca gcagctcgcc cgtgaagaga aagaggcaga 64080 actggcagac gacatggaaa aaggcctgcc ccagcacctg tttgaatcgc tatgcatcga 64140 tcatttgcaa cgccacgggg ccagcaaaaa atccattacc cgtgcgtttg atgacgatgt 64200 tgagtttcag gagcgcatgg cagaacacat ccggtacatg gttgaaacca ttgctcacca 64260 ccaggttgat attgattcag aggtataaaa cgaatgagta ctgcactcgc aacgctggct 64320 gggaagctgg ctgaacgtgt cggcatggat tctgtcgacc cacaggaact gatcaccact 64380 cttcgccaga cggcatttaa aggtgatgcc agcgatgcgc agttcatcgc attactgatc 64440 gttgccaacc agtacggcct taatccgtgg acgaaagaaa tttacgcctt tcctgataag 64500 cagaatggca tcgttccggt ggtgggcgtt gatggctggt cccgcatcat caatgaaaac 64560 cagcagtttg atggcatgga ctttgagcag gacaatgaat cctgtacatg ccggatttac 64620 cgcaaggacc gtaatcatcc gatctgcgtt accgaatgga tggatgaatg ccgccgcgaa 64680 ccattcaaaa ctcgcgaagg cagagaaatc acggggccgt ggcagtcgca tcccaaacgg 64740 atgttacgtc ataaagccat gattcagtgt gcccgtctgg ccttcggatt tgctggtatc 64800 tatgacaagg atgaagccga gcgcattgtc gaaaatactg catacactgc agaacgtcag 64860 ccggaacgcg acatcactcc ggttaacgat gaaaccatgc aggagattaa cactctgctg 64920 atcgccctgg ataaaacatg ggatgacgac ttattgccgc tctgttccca gatatttcgc 64980 cgcgacattc gtgcatcgtc agaactgaca caggccgaag cagtaaaagc tcttggattc 65040 ctgaaacaga aagccgcaga gcagaaggtg gcagcatgac accggacatt atcctgcagc 65100 gtaccgggat cgatgtgaga gctgtcgaac agggggatga tgcgtggcac aaattacggc 65160 tcggcgtcat caccgcttca gaagttcaca acgtgatagc aaaaccccgc tccggaaaga 65220 agtggcctga catgaaaatg tcctacttcc acaccctgct tgctgaggtt tgcaccggtg 65280 tggctccgga agttaacgct aaagcactgg cctggggaaa acagtacgag aacgacgcca 65340 gaaccctgtt tgaattcact tccggcgtga atgttactga atccccgatc atctatcgcg 65400 acgaaagtat gcgtaccgcc tgctctcccg atggtttatg cagtgacggc aacggccttg 65460 aactgaaatg cccgtttacc tcccgggatt tcatgaagtt ccggctcggt ggtttcgagg 65520 ccataaagtc agcttacatg gcccaggtgc agtacagcat gtgggtgacg cgaaaaaatg 65580 cctggtactt tgccaactat gacccgcgta tgaagcgtga aggcctgcat tatgtcgtga 65640 ttgagcggga tgaaaagtac atggcgagtt ttgacgagat cgtgccggag ttcatcgaaa 65700 aaatggacga ggcactggct gaaattggtt ttgtatttgg ggagcaatgg cgatgacgca 65760 tcctcacgat aatatccggg taggcgcaat cactttcgtc tactccgtta caaagcgagg 65820 ctgggtattt cccggccttt ctgttatccg aaatccactg aaagcacagc ggctggctga 65880 ggagataaat aataaacgag gggctgtatg cacaaagcat cttctgttga gttaagaacg 65940 agtatcgaga tggcacatag ccttgctcaa attggaatca ggtttgtgcc aataccagta 66000 gaaacagacg aagaatttca tacgttagcc gcatcccttt cacaaaagct ggaaatgatg 66060 gtggcgaaag cagaagcaga tgagagaaac caggtatgac aaccacggaa tgcatttttc 66120 tggcagcggg cttcatattc tgtgtgctta tgcttgccga catgggactt gttcaatgac 66180 acctcagcag gaaaacgccc ttcgcagcat tgcccgtcag gctaattctg aaatcaaaaa 66240 aagccagaca gcagtttccg gataaaaacg tcgatgacat ttgccgtagc gtactgaaga 66300 agcaccgcga aacggtaacg ctgatgggat tcacaccgac tcatttaagc ctggcaatcg 66360 gcatgttaaa cggcgtcttt aaggaacgat gaacatgaaa agcaaaatca tcagggagct 66420 acaggctcct tttttattat tcgcattcac cctcaagcgt attaaccaac agttcaggga 66480 ttaatgaaag atggcagaca tcattgattc agcatcagaa atagaagaat tacagcgcaa 66540 cacagcaata aaaatgcgcc gcctgaacca ccaggctata tctgccactc attgttgtga 66600 gtgtggcgat ccgatagatg aacgaagacg cctggtcgtt cagggttgtc ggacttgtgc 66660 aagttgccag gaggatctgg aacttatcag taaacagaga ggttcgaagt gagcgaaatt 66720 aactctcagg cactgcgtga agcggcagag caggcaatgc atgacgactg gggatttgac 66780 gcagaccttt tccatgaatt ggtaacacca tcgattgtgc tggaactgct ggatgaacgg 66840 gaaagaaacc agcaatacat caaacgccgc gaccaggaga acgaggatat tgcgctaaca 66900 gtagggaaac tgcgtgttga gcttgaaaca gcaaaatcaa aactcaacga gcagcgtgag 66960 tattacgaag gtgttatctc ggatgggagt aagcgtattg ctaaactgga aagcaacgaa 67020 gtccgtgaag acggaaacca gtttcttgtt gttcgccatc ctgggaagac tcctgttatc 67080 aagcactgca ctggtgacct ggaagagttt ctgcggcagt taatcgaaca agacccgtta 67140 gtaactatcg acatcattac gcatcgctat tacggggttg gaggtcaatg ggttcaggat 67200 gcaggtgagt atctgcatat gatgtctgac gctggcattc gcatcaaagg agagtgagat 67260 cggttttgta aaagataacg cttgtgaaaa tgctgaattt cgcgtcgtct tcacagcgat 67320 gccagagtct gtagtgtcag atgatgaccg tactcaaaca tcgggttgag tattatctta 67380 ctgtttcttt acataaacat tgctgatacc gtttagctga aacgacatac attgcaagga 67440 gtttataaat gagtatcaat gagttagagt ctgagcaaaa agattgggcg ttatcaatgt 67500 tgtgcagatc cggtgtcttg tctccatgca gacatcacga aggtgtttat gtagatgaag 67560 gtatagatat agagtcggca tacaaatatt ccatgaaggt ttataagtct aatgaagaca 67620 aatccccatt ctgcaatgtg cgagaaatga ctgataccgt gcaaaattat tatcacgagt 67680 acggtggaaa cgatacttgc cctctctgta caaaacatat agatgattaa acccaatatt 67740 acataacaat cctcgcactc gcggggattt attttatctg aactcgctac ggcgggtttt 67800 gttttatgga gatgataaat gcacttccga gtcacaggag aatggaatgg agagccattc 67860 aacagagtta tcgaagcgga gaacatcaac gactgctacg accactggat gatatgggcg 67920 cagatagcac atgcagacgt aaccaatatt cgaattgaag aactgaaaga acaccaagcc 67980 gcctgatggc ggttttttct tgcgtgtaat tgcggagact ttgcgatgta cttgacactt 68040 caggagtgga acgcacgcca gcgacgtcca agaagccttg aaacagttcg tcgatgggtt 68100 cgggaatgca ggatattccc acctccggtt aaggatggaa gagagtatct gttccacgaa 68160 tcagcggtaa aggttgactt aaatcgacca gtaacaggtg gccttttgaa gaggatcaga 68220 aatgggaaga aggcgaagtc atgagcgccg ggatttaccc cctaaccttt atataagaaa 68280 caatggatat tactgctaca gggacccaag gacgggtaaa gagtttggat taggcagaga 68340 caggcgaatc gcaatcactg aagctataca ggccaacatt gagttatttt caggacacaa 68400 acacaagcct ctgacagcga gaatcaacag tgataattcc gttacgttac attcatggct 68460 tgatcgctac gaaaaaatcc tggccagcag aggaatcaag cagaagacac tcataaatta 68520 catgagcaaa attaaagcaa taaggagggg tctgcctgat gctccacttg aagacatcac 68580 cacaaaagaa attgcggcaa tgctcaatgg atacatagac gagggcaagg cggcgtcagc 68640 caagttaatc agatcaacac tgagcgatgc attccgagag gcaatagctg aaggccatat 68700 aacaacaaac catgtcgctg ccactcgcgc agcaaaatca gaggtaagga gatcaagact 68760 tacggctgac gaatacctga aaatttatca agcagcagaa tcatcaccat gttggctcag 68820 acttgcaatg gaactggctg ttgttaccgg gcaacgagtt ggtgatttat gcgaaatgaa 68880 gtggtctgat atcgtagatg gatatcttta tgtcgagcaa agcaaaacag gcgtaaaaat 68940 tgccatccca acagcattgc atattgatgc tctcggaata tcaatgaagg aaacacttga 69000 taaatgcaaa gagattcttg gcggagaaac cataattgca tctactcgtc gcgaaccgct 69060 ttcatccggc acagtatcaa ggtattttat gcgcgcacga aaagcatcag gtctttcctt 69120 cgaaggggat ccgcctacct ttcacgagtt gcgcagtttg tctgcaagac tctatgagaa 69180 gcagataagc gataagtttg ctcaacatct tctcgggcat aagtcggaca ccatggcatc 69240 acagtatcgt gatgacagag gcagggagtg ggacaaaatt gaaatcaaat aatgatttta 69300 ttttgactga tagtgacctg ttcgttgcaa caaattgata agcaatgctt ttttataatg 69360 ccaacttagt ataaaaaagc tgaacgagaa acgtaaaatg atataaatat caatatatta 69420 aattagattt tgcataaaaa acagactaca taatactgta aaacacaaca tatgcagtca 69480 ctatgaatca actacttaga tggtattagt gacctgtaac agagcattag cgcaaggtga 69540 tttttgtctt cttgcgctaa ttttttgtca tcaaacctgt cgcactccag agaagcacaa 69600 agcctcgcaa tccagtgcaa agctttgtgt gccacccact acgacctgca taaccagtaa 69660 gaagatagca gtgatgtcaa acgacgcagc tgacttcttt tctttcacga cttccccaca 69720 cccagcatgc atacctttcc gccataactg tagtgaatgt ctgttatgag cgaggagcgg 69780 aagttaacac ttatgaaaaa tggctacgaa gtccgtggct atctatcggc ttattagtac 69840 ttgaaacgct tcttcagaag cctgaagagc taatcgttcg gcgatactat atatgcatta 69900 atagactata tcgttggtat aaacagtgca ccatgcaaca tgaataacag tgggttatcc 69960 aaaaggaagc agaaagctaa atatggaaaa ctacaatacg atgccccgtt aagttcaata 70020 ctactaattt ttagatggaa aacgtatgta atagagagta acttaaaaga gagatcctgt 70080 gttgccgcca aataaattgc ggttatttta ataaaattaa gggttactat atgttggagt 70140 ttagtgttat tgaaagaggc gggtatattc ctgcagtaga aaaaaataag gcattcctac 70200 gagcagatgg ttggaatgac tattcctttg ttacaatgtt ttatcttact gtctttgatg 70260 agcatggtga aaaatgcgat atcggaaatg ttaaaattgg ttttgtaggt caaaaagaag 70320 aagtaagcac ttattcatta atagataaaa aattcagtca actccctgaa atgttttttt 70380 ccttaggtga aagcattgac tactatgtta atctcagcaa attaagcgat ggttttaaac 70440 ataaccttct taaagctatt caggatttag tagtatggcc aaatcgatta gccgacattg 70500 aaaatgaaag cgtccttaac acctcattac ttagaggggt aactctttca gaaattcatg 70560 gacagttcgc acgtgtgtta aatggtttgc cagaattgtc agatttccac ttttcattta 70620 atagaaaaag tgctcccgga ttcagtgatt taactatacc ttttgaggtg acggttaatt 70680 ctatgcccag cacgaacatt catgctttta tcgggcggaa tgggtgtggt aaaacaacaa 70740 ttttgaatgg aatgattggt gcaatcacca acccagaaaa caatgaatat tttttctctg 70800 aaaataatag acttatcgag tcaagaatcc caaagggata ttttcgatcg cttgtttcag 70860 tttcgtttag tgcatttgat ccttttactc ctcctaaaga acaacctgac ccagcaaaag 70920 gtacacaata cttttatatt ggactcaaga atgctgccag caatagttta aaatcactag 70980 gcgatctccg cttagaattc atttcagcat ttattggttg tatgagagta gatagaaaaa 71040 gacaactctg gcttgaagct atcaaaaaac taagtagtga tgaaaacttt tcaaatatgg 71100 aactcatcag cctcatttct aaatatgaag agttaagacg taatgaacca cagattcaag 71160 tggacgatga taaattcact aaattgtttt atgacaatat ccagaaatat ctgcttcgaa 71220 tgagctctgg acatgcaatt gttttattta ctatcacaag attagtagat gtcgttggcg 71280 aaaagtcatt agttttattc gatgaaccag aggttcatct gcatccacct ttgctctctg 71340 cttttttacg aacattaagc gacttactcg atgcacgcaa tggtgtagca ataattgcaa 71400 ctcattcccc agtagtactg caagaggttc caaaatcctg catgtggaaa gtcctacggt 71460 caagagaagc aataaatatt atccgtccgg atattgagac attcggtgag aacttaggtg 71520 ttttaactcg tgaggtgttt ttacttgaag tgacaaattc tggataccac cacttattat 71580 cgcagtccgt tgattcagag ctttcttatg aaaccattct aaaaaattat aatggtcaga 71640 taggattaga aggtcgaacc gttttaaaag cgatgataat gaacagagat gaaggtaaag 71700 tacaatgaaa aaactacctc ttccagcgag aacttatagc gaaatgctta ataaatgctc 71760 ggaaggtatg atgcagataa atgttagaaa taatttcatt actcacttcc ccactttttt 71820 gcagaaagaa caacaatata gaatattaag ctcgacaggt cagttattta cctacgacag 71880 gacacaccct cttgagccta caaccttagt agttggtaac ctgacaaagg ttaaattaga 71940 aaagctttat gaaaataatc tccgagataa aaacaaaccc gctagaacat attacgatga 72000 catgcttgtt tcatcaggtg aaaaatgtcc attttgtggt gatataggac agacaaaaaa 72060 tatagatcat tttcttccta ttgcacatta tcctgaattt tcggtgatgc ctattaattt 72120 agttccatcg tgccgcgact gcaatatggg agagaaaggt caagttttcg cagtagatga 72180 ggtacaccaa gcgattcatc cctatatcga caaggacatt ttttttcgtg agcaatgggt 72240 atatgcaaat ttcgtttccg gaactccggg tgctatcagt ttttatgttg aatgcccggc 72300 gaactggagg caggaagaca aacacagagc tcttcatcat ttcaagctat taaatattgc 72360 taacaggtat cgtttggagg cagggaagca cttgagtgaa gtgattactc aaagaaactc 72420 tttcgtaaaa gttataagga aatatagttc aaccgcaacg tttcagcagc tacagtcaga 72480 atttattgaa gcaaatctga aacctattat agatttgaat gacttcccca attattggaa 72540 aagagttatg tatcagtgcc tagcaaactc ggaagatttt ttcagaggga tctagaatat 72600 gatgaaagat agaaaattac gacgcttatc ggaagtgaac gaatactttt tatatgagga 72660 gggctgtttt tacaaaatcc ggtagtaact tgctaaccaa ttcctaggca ggtcattggc 72720 aacagtggca tgcaccgaga aggacgtttg taatgtccgc tccggcacat agcagtccta 72780 gggacagtgg cgtacagtca tagatggtcg gtgggaggtg gtacaaattc tctcatgcaa 72840 aaaatatgta aaatcggtag caactggaaa tcattcaaca cccgcactat cggaagttca 72900 ccagccagcc gcagcacgtt cctgcatacg acgtgtctgc ggctctacca tatctcctat 72960 gagcaacgtg ttagcagagc caagccacaa ctctaatttt aatacataat gaatgataat 73020 aataatatta aaaatttcct gtgtaactaa tttactatat ggtttctgat aagaatcatt 73080 gcaaagatca aacaacttgt attacattga cagttaagca gttaatttta tcacctctaa 73140 aatatatcag catctagcat gcaacctatc aaaatggaga gttttatgac taaaaaacca 73200 tgggaaagaa gacttaaaga tttatcgcac ttgctcaaat gctgcattga tacatatttt 73260 gaccctgaat tatttcgctt gaatttgaat caattcctcc aaaccgcaag aacagtaaca 73320 tttattattc aaaaaaacaa aaaccagatt ataggatatg acatttggta taacaataat 73380 gttattgaaa aatggaaaaa tgatccatta atggcttggg ctaaaaattc tcgcaatacg 73440 atagaaaaac aaggcgattt agaaatgtat agcgaggcaa aggctactct tatttcatct 73500 tacattgaag aaaatgacat tgagtttatt acaaatgaaa gtatgttaaa cattggtata 73560 aaaaagttag tcagacttgc acaaaagaaa ttaccttcat atttaactga atcatctatt 73620 attaaatcag aaagacgatg ggtcgctaat acgctaaaag attacgaatt attacatgcc 73680 ttagctataa tctatggcag aatgtataac tgctgtaact ctcttggcat acaaataaac 73740 aatccaatgg gtgacgatgt gatttcgcca acatcattcg actctttatt tgatgaagcc 73800 aggagaataa cttatttaaa attaaaagat tactccataa gcaaattgtc atttagcatg 73860 atacaatatg acaataaaat aattcctgaa gatattaaag agcgtctaaa actggtagat 73920 aagcctaaaa atatcacttc gacagaagag ttagttgact atacagccaa gcttgcagaa 73980 acgacttttt taaaggacgg ttatcacatt caaacattaa ttttttatga taaacaattc 74040 catccaattg atttaatcaa tacaacattt gaagatcaag cagataaata tattttttgg 74100 cgttatgcag ctgacagagc caaaataaca aatgcctatg gcttcatttg gatatcagag 74160 ctatggctca gaaaagcaag catctactcc aataaaccaa tacatacaat gccaattata 74220 gatgaaagac ttcaggtaat tggaattgat tcaaataata atcaaaaatg tatttcatgg 74280 aaaatagtta gagaaaacga agaaaaaaaa ccgactttag aaatatcaac agcagactca 74340 aaacatgacg aaaaaccata tttcatgcgt tcagtcttaa aagcaattgg cggtgatgta 74400 aacactatga acaattgagt catagaactt ccattattct cctgaagata ataatcgcca 74460 aataaaccaa tactcagctt tacaatatac taactaaccg cagaacgtta tttcatacaa 74520 cgtttctgcg gcatatcaca aaacgattac tccataacag ggacagcagg ccactcaata 74580 tcaggtgcag ttgatgtatc aacacggttc agcaacaccc gatacttctt ccaggcttcc 74640 agcaacgagg tttcttcctt cgttgcaatt tccagatctg cagcatcctg aagcggcgca 74700 atatgctcac tggctacctg catcaggctt ttttttgttt cttccgcctc ccggatccgg 74760 aacagttttt ctgcttccgt atccttcacc caggctgtgc cgttccactt ctgatattcc 74820 cctcccggcg ataaccaggt aaaattttcc ggtaacggac cgagttcaga aataaataac 74880 gcgtcgccgg aagccacgtc atagacggtt ttaccccgat ggtcttcaac gagatgccac 74940 gatgcctcat cactgttgaa aacagccaca aagccagccg gaatatctgg cggtgcaata 75000 tcggtactgt ttgcaggcag accggtatga ggcggaatat atgcgtcacc ttcaccaata 75060 aattcattag ttccggccag cagattataa atttttatgg tccgtggttg ttcactcatt 75120 ctgaatgcca ttatgcaagc ctcacaatat agttaaatgc aatgtttttg acggtgtttt 75180 ccgcgttacc cgcagcgtta acggtgatgg tgtgtccgtg tgaaccaata ctgaaagaat 75240 gggcatgagc accgataaca accggatgct ggtgcgcacc aataccaact gtatgcgcat 75300 gtgcaccggc actcacggct gtaccggaca atgagtgact gtggctgccc tgactgtccg 75360 ttttcgataa ataagcaata ccctgtgtgc tggttccttt aactgtggat aaacttcctg 75420 taatggttgc tgttccatac tgactccagc cagaactgtt catccttaaa ccacttgtgt 75480 gggcatgagc acccgcggcc cctgttgaac cgctcagact gtgagcatga gcccccgtgt 75540 tattcgtcga tttggtgccg taatcgaaac tgcctgttgt tttcgtcccg taatcaaacg 75600 acgatgtggt tttcgtcccc aaatccgtac cggatgcact ggcactgtgg gtgtgcgact 75660 taattccatc ctgttcctga gacaatacag cacgaccgct ggcgggtttc cccttgattg 75720 tccagcctcg catatcagga agcacacccg atggatacgc gacagcaagt tttgggtagg 75780 ctgatttgtc aaacgcctgc ccctgcatca ggacgtagcc agacggaacg atatctgatg 75840 gccacgggat cggcgcacct gccggaaagg ccgaattctc accggcccca aggtattcaa 75900 gaacatctgc aacggaattt tttgccagaa tatccctgcc aacctgagtc agttcagtca 75960 ggctggcggc atcattttcc gcaaaatacg gtaatttatt tttcgccgtg gaaagccctg 76020 ccagcgccgt cagtgtcgca ttcttcggtt gtttacccgc aagcgcgtta gtcatggtgg 76080 tagcaaaatc tggatcattc ccgagcgctg cggccagttc attcagcgta ttcagtgcgt 76140 caggtgacgc gtcgataaca tctgcaatcg cggccagtac aaaagcggtg ttcgcaatct 76200 gggtattgtt tgttcccctg agcgcggttg gtgctgttgg cgttccggtc agtgccggac 76260 tgtccagtgg gcttttctgt tcgtttcatc cattaccacc ttaaccgcct ttggcgttgc 76320 agcaagcgtt tcagacgtgc tgttggttgc actgctgagc tgcactatcc cctttctcgt 76380 tgtgtccgca tcctcaagcg cgacagctga agctatatct tctgcacgtt ttgccgaatt 76440 ttttgcacgt attgccgccg cttctgccgc acttttgctc tgcgatgctg ataccgcact 76500 tcccgcagcc tctgtcgcct tcgtggatgc cgttgacgca ctccccgccg ccgctgtttt 76560 tgcgtctgcc gcggcagagg cgctccgttc cgctgctgtt tcagatgacc tggcattcgt 76620 ctcggacgtt tttgccgccc tggcagaatt ttctgccgcc gttgccgagg aagctgcacg 76680 accggcactt gatgatgcgt tcgtttctga tgattttgct gcctcttttg aggccaccgc 76740 atctcgtgct gaagtggcgg cctctgacgc tttcgtggcc gcggtggagg cagacgtggc 76800 ggctgattgt tgtgacgctg cagcattcgt ttctgacgtt ttcgccgcac cggcactggt 76860 ggccgccgcg ttttttgagg actctgcggc tgcggcactt ttttccgctt cagtggcctt 76920 tgctgatgcc gcttctgcgc cggaggacgc ttcctgagct gacgatgcag cctgtccggc 76980 ggacgtgctg gcggcgcgtg ctgagtcagt tgcatcagtc acaagggccg cgacctgagc 77040 agctgatgca ctggcatcgc cggctgattt cttcgcgtct gccgtactct gtgccaccac 77100 ggacgcgtta cgcgccacct cttccaccat cagttcaaga cgacgcagca cctccggccg 77160 ggcatcatcc tccgtcatgg cacagagaaa atcattcagc gtccccggtt gtgaatcttc 77220 atacacggtg atggtcccgg cgtgcgatgg tggaaaaccg tcaacctgca ggatgacact 77280 gtactgaccg tactccacat ccatgctgta acgcccggct tcatccggat tctctgagcc 77340 caccgtgttc accaccaccg tggtgctgtt acgtctggct ttcagctgaa tggtgcagtt 77400 ctgtaccggt tttcctgtgc cgtctttcag gactcctgaa atctttactg ccatattcac 77460 cccacaaaaa agcccaccgg ttccggcggg ctgtcataac actgtgttac ctggctaatc 77520 agaatttata accgacccca acgatgaatc cgtcagtacg ccagtcgcca ctgccggagc 77580 cttcataagc aatatcaaca acgacggacg ctgccggatt aatctgtata cctgcactcc 77640 acgccactga ggtatgccgc attgcacttt cgtccctggc agtggtcgtc tctttcatat 77700 acccgggagt gatttccgtc ttacggtaat ccattgtact gccggaccac cgactgtgag 77760 ccactccggc catggcgtac gcactgacct gcttactgat ttgtaaaacc ggtccggcca 77820 tcacgctcac ataacgtcca cgcaggctct catagtgaaa cgtatcctcc ccggtcatca 77880 ctgtgctgct ctttttcgac gcggcgaacc ccagggaagc catcaccccc acactgtccg 77940 tcagctcata acggtacttc acgttaatcc ctttcagatg actcacaccg gtatccccgc 78000 ccgacaacga cggcaatgta cccggtttca cttgaaaata gcccaccgta aacgtaccat 78060 gtccaccttc cgcacgggcc ggagtgactg tcaccgcaag tgcggcaaag acagcaacgg 78120 caatacacac attacgcatc gttcacctct cactgtttta taataaaacg cccgttcccg 78180 gacgaacctc tgtaacacac tcagaccacg ctgatgccca gcgcctgttt cttaatcacc 78240 ataacctgca catcgctggc aaacgtatac ggcggaatat ctgccgaatg ccgtgtggac 78300 gtaagcgtga acgtcaggat cacgtttccc cgacccgctg gcatgtcaac aatacgggag 78360 aacacctgta ccgcctcgtt cgccgcgcca tcataaatca ccgcaccgtt catcagtact 78420 ttcagataac acatcgaata cgttgtcctg ccgctgacag tacgcttact tccgcgaaac 78480 gtcagcggaa gcaccactat ctggcgatca aaaggatggt catcggtcac ggtgacagta 78540 cgggtacctg acggccagtc cacactgctt tcacgctggc gcggaaaagc cgcgctcgcc 78600 gcctttacaa tgtccccgac gattttttcc gccctcagcg taccgtttat cgtacagttt 78660 tcagctatcg tcacattact gagcgtcccg gagttcgcat tcacactgcc actgatatcc 78720 gcatttttag cggtcagctt tccgtccggt gtcagggaaa aggccggagg attgccgccg 78780 ctggtaatgg tgggggccgt caggcgcttc aggaacacgt cgttcatgaa tatctggttg 78840 ccctgcgcca caaacatcgg cgtttcattc ccgtttgccg ggtcaataaa tgcgatacga 78900 ttggcggcaa ccagaaactg gctcagtttg ccttcctccg tgtcctccat gctgaggcca 78960 atacccgcga cataatgttt gccgtctttg gtctgctcaa ttttgacagc ccacatggca 79020 ttccacttat cactggcatc cttccactct ttcgaaaact cctccagtct gctggcgtta 79080 tcctccgtca gctcgacttt ttccagcagc tccttgccga gatgggattc ggttatcttg 79140 cctttgaaaa aatccaggta accttccgca tcatcgctcg cccgaccgac ggcctccacg 79200 aatgccgatt tgccaacggt gttcacactg cggatataaa agtaataatc atggcccggt 79260 ttgatattga tactggcggc tatccagtac agcgccgtac caagataacg cgtgctggtt 79320 tcaacctgtc tgatatccgc aatctgcttt tccgagaacc agaactcaaa ctgtaccgtc 79380 gggtcataaa cggcaagatg cggcgtggcg gttatctgaa aatagcccgg cgtcagctca 79440 atcctcgacg gtgctgccgg tgcggcaatc cggaacgata ccgacgccgg atcgccctgc 79500 tgcccccacg catttaccgc ccggactgtc agcctgtagt tccccagcgc cagttgcgtg 79560 aagcggtatg tggtttccgt cgtccgggcc gtgctgacca gccgctcact gccgtcgtcc 79620 gctgttacgg tcagacggag caggaaactc acgcccttca ccaccttcgg tgtgtcccat 79680 cgcgccagca cctgatattc cccgctgtct gcagtgactt ctgcggtcag gtgctgcacc 79740 gctggcggcg tgacaccatt caccgtgcca ctctgttcgc cgtcaaagtg cgccccgtta 79800 tccacgatgg cctctttttc cggcacatgc tgcacggcgg tgatggcata cgtgccgtcg 79860 tcgttctcac ggatactcac gcagcggaac agtcgctggc gcagcgtcgg cagcttcagc 79920 tcccatacgc tgtattcagc aacaccgtca ggaacacggc tcacttttac cttcacgccg 79980 tcggtgacgg actgaacctc cacgctgacc ggattgccac ttccgtcaac caggcttatc 80040 agcgcggtac cggaggatgg cagcgtgatt tcacggtcga gcgtcagcgt ccgggtctgg 80100 ctgttcaccg ccagcacacg accaccggtg ctgataccgg catagtcatc atcgcagatt 80160 tcaataacat cgcccggtac atggcgaagc ccttctgcgc cgacgctgaa atccacggtc 80220 tgcgtttcca gcagttctgt tttaatcagc cacagcccgg cgcggtgtgc ctgcccccgg 80280 ctggtacagc caaaggcatc catcttcgta acattacgac cgtaacgggc aatggcctgc 80340 gtatcttcaa caagctctgt cgccgtctcc cagccgttgt tcgggtcaat ccagttcacc 80400 tcaacggcat tatggcggtc cttcagggcg ctgaagctgt agcggaacgg cgcgccatca 80460 tccggcatca ccacattact gcggttatag gtccacgtct tatccgacgg tcggtcctgc 80520 acgaacgtca gcgtctgccc gttccatacc ggcatacagc gcatcgccga gcagaaatcg 80580 ctgagcacat cccacgcctt acgctgtgtg gtcaggtacg cattacaggt gatgcgcggc 80640 tccgtgccgc caaagccgtc cggcactgac tggtcgcagt actggccgat gacatacagc 80700 gcccatttat ccacatccgc cgcaccaaga cgtttcccca tgccgtagcg cggatgggtc 80760 agcatatccc acagacacca ggccatgttg ttgctgtatg ccggtttaaa cgttccgtcc 80820 cagataccgc tgtattgccg cgtctgcggg ttatagttcg acggcacctg cagaatacgc 80880 ccgcgcagat gataattacg gctcacctgc tggctgccga actgctccga gtccacctgc 80940 acgccgacca gtgccgtgtt cgggtagcac tgtttcacat cgatgatttc agtgtatgac 81000 gaccagagcg ttttgttctg cagctggtct gtggtgctgt ccggcgtcat cctgcgcatc 81060 cggatattaa acgggcgcgg cggcaggtta cccatcacca ccgaggccag atactgcgag 81120 gtggttttgc ccttaatggt gatgtctttt tccgtcaccc agccaccgtt acgttgtatc 81180 tgaaccagca ggcggacttc cgacggattc ctgtcaccct ttgaggtggt ttccaccagt 81240 gcctgtacac cgaaggtaaa gcgcagacgg tcgatgtttg cagacgtaat ggtgcgggtg 81300 atcggcgtgt catatttcac ttccgtaccc agcaccgtct cggagccgga ggattcaaat 81360 ccctccggcg gagtctgctc ctgctcacca gcccggaaca ccaccgtgac accggatatg 81420 ttggtattcc cctcagtgtc cagcaccggc gtactgttca gcagcacgct ttttaagcca 81480 tccaccggac cttcaatcgg cccttcgctg atggcatcga tcacactcag caactgcgtg 81540 gacttcaggt tgtccttcgc ttcgcgcggg gtatgcccct tactgcttcc tttacccatt 81600 cctcacgctc cataaatgac aaaaccgccc gcaggcggtt tcacataaaa cattttgcat 81660 cagcgaccaa tcaccacaac ctgaccaccg tccccttcgt ctgccgtgct gatctcctga 81720 gaaaccacgc gtgaccccac gcgcatttcc ccgtacagaa caggcagaac attgccctgg 81780 gcaaccatgt tatccagtga ggagaaatag gtgttctgct taccgttatc cgttgtctgt 81840 atacggggag ttctggcttt cggtgccagc atctgcgcca caccaccgag caccatactg 81900 gcaccgagag aaaacaggat gccggtcata ccaccggccc caatggctgc cccccatgct 81960 gcaagggtgg ctccggcggt aaagaatgat ccggcaatgg cggcagcccc caggacaatc 82020 tggaatacgc cacctgactt ggccccggcg actctgggaa caatatgaat tacagcgcca 82080 tcaggcagag tctcatgtaa ctgcgccgtt aacccggacg tgctgacgtc ccgcccggca 82140 atccgtacct gataccagcc gtcgctcagt ttctgacgaa acgccgggag ctgtgtggcc 82200 agtgcccgga tggcttcagc ccccgttttc acacgaaggt cgatgcggcg accaaatcgt 82260 tgtaaatccc cgtaaaggca gatgcgcgcc atgcccggtg acgccagagg gagtgtgtgc 82320 gtcgctgcca tttgtcggtg tacctctctc gtttgctcag ttgttcagga atatggtgca 82380 gcagctcgcc gtcgccgcag taaattgcgg cgtgattcgg cactgatgaa ccaaaacagc 82440 acagcagcac atcgcccggc tgtgccgctg acaacggcac ctgatacagc cccgtcgcct 82500 ccagattatc cagatagaga ttctggccgt tacgccacca gtcatcctca cgatgaaagt 82560 ccggcatctc aatccccgcc agatgataag catcccggaa cagtgtgtaa cagtccgtca 82620 caccgtgctc aaagcgccgc ccggtgagat gcggcacaca gcggaactta tgaatcgtcc 82680 cccggcagac cagccaccac ggcaaatcac tctgcacctg cagccgccgg tcggcctcac 82740 tcagccaggg cagaccaccg gggtggctgt ggaccagcgc cacaatctca ccctgcattt 82800 ctgcctgcag ccagtcttcc ggcgacatac ggaaatagcc tccggctcac cggagatatt 82860 cacgcagggg aaatatcttt ccccctccgg cgtgcttacc acgaagccgc acgactccgc 82920 tggcgcacat cgccgggcgt gcgccagaat cgctgattct gtctgtgtca tgggatttac 82980 tgcgaaagtt tgttaatgga aaggaagccg ccaaagttgc cgacgttatt gcggaactta 83040 caaccgctca ggcatttgct gcatttatcc ttcgtgatat cggacgttgg ctggtcatat 83100 tcatccgcga cagccggacc gctataaccg cactcgtcac cgcgataggt ccaggtgcag 83160 gtgttggcca gcatgatacg tcccggaaaa acagcgccat ccgtttccgt cggcgtggac 83220 agtacaaagg aggcactcac cgcgctcagt tcgctgcact gctcaatgcg ccagcggctg 83280 atcacctcct gctccggatc ggcgtaactg tttccgttga cgaagttcac cgcatccaga 83340 aaacgggcgt aaaccttacg ccggaccacc gttccgccga ccagactctg catatcttcc 83400 gccatcccgg tgaccatacc gtacaggtta gaaaccgtca gcgtggggcg cgtactggtg 83460 cctttgccat tcagttcaaa accgctcccc tgaatgggat acggctgata ctgtcgcccc 83520 tgccaggtga ccggctcacc tttttcgttc tgctcattac agaaaaaata acgttctcca 83580 ccgacctctg tcaggtcgat ttcccagagc accacgctgg ccgactgctc cgcacgggtg 83640 cattcattca gtgtttcctg ccggatatcc tgcatcagtt caccacctgt tcaaactctg 83700 cgctgaactc aacacgcagc atactgaccc gcgacgacca ttttgcgcag gtcaccttta 83760 tctgccgcca ctcataaggc ggcgtccaca gaaaggattt ccagcccccg tgctcttcca 83820 gaaacgactc cagtaccgtg gcctcctcac gggggacaga aagcgtcacg ctgtacgttt 83880 tcaggttggc attcagcccg gcaggcgctc gctgagaata gccatcacca aagcgcacct 83940 ttcttacaga agggaccgaa gccacatcca taccgggttt cactttccag cggaaggtct 84000 tcatcgtcca cctccggaga acaggccacc atcacgcatc tgtgtctgaa tttcatcacg 84060 ggcacccttg cgggccatgt catacaccgc cttcagagca gccggaccta tctgcccgtt 84120 cgtgccgtcg ttgttaatca ccacatggtt attctgctca aacgtcccgg acgcctgcga 84180 ccggctgtct gccatgctgc ccggtgtacc gacataaccg ccggtggcat agccgcgcat 84240 cagccggtaa agattcccca cgccaatccg gctggttgcc tccttcgtga agacaaactc 84300 accacggtga acaatccccg ctggctcata tttgccgccg gttcccgtaa atcctccggt 84360 tgcaaaatgg aatttcgccg cagcggcctg aatggctgta ccgcctgacg cggatgcgcc 84420 gccaccaaca gccccgccaa tggcgctgcc gatactcccg acaatcccca ccattgcctg 84480 cttaagcaga atttctgtca tcatggacag cacggaacgg gtgaagctgc gccagttctg 84540 ctcactgccg gtcagcatcg ccgccatatt ctgtgcaata ccatcaaagg tctgcgtggc 84600 tgcacttttt acctgcgaca tactgtccgt ggcgctctct tcccactcac tccagccgga 84660 cttcaggcct gccatccagt tcccgcgaag ctggtcttca gccgcccagg tctttttctg 84720 ctctgacatg acgttattca gcgccagcgg attatcgcca tactgttcct tcaggcgctg 84780 ttccgtggct tcccgttctg cctgccggtc agtcagcccc cggcttttcg catcaatggc 84840 ggcccgtttt gcccgttgct gctgtgcgaa tttatccgcc tgctgcgcca gcgcgttcag 84900 gcgctcctga tacgtaacct tgtcgccaag tgcagccagc tggcgtttgt actccagcgt 84960 ctcatcttta tgcgccagca gggatttctc ctgtgcagac agctggcgac gttgcgccgc 85020 ctcctccagt accgcgaact gactctccgc cttccacaaa tcccggcgct gctggctgat 85080 tttctcattt gctccggcat gcttctccag cgtccggagt tctgcctgaa gcgtcagcag 85140 ggcagcatga gcactgtctt cctgacgatc gcccgcagac accttcacgc tggactgttt 85200 cggctttttc agcgtcgctt cataatcctt tttcgccgcc gccatcagcg tgttgtaatc 85260 cgcctgcagg attttcccgt ctttcagtgc cttgttcagt tcttcctgac gggcggtata 85320 tttctccagc ggcgtctgca gccgttcgta agccttctgc gcctcttcgg tatatttcag 85380 ccgtgacgct tcggtatcgc tctgctgctg cgcatttttg tcctgttgag tctgctgctc 85440 agccttcttt cgggcggctt caagcgcaag acgggccttt tcacgatcat cccagtaacg 85500 cgcccgcgct tcatcgttaa caaaataatc atccttgcgc agattccaga tgtcgtctgc 85560 tttcttatac gcagcctctg ccttaatcag catctcctgc gcggtatcag gacgaccaat 85620 atccagcacc gcatcccaca tggatttgaa tgcccgcgca gtcctgtctg cccaggtctc 85680 cagcgtgccc atgttctctt tcaggcggcg ggtctggtca tcaaaccctt tcgttgcggc 85740 ctcgttcgcc gcctgcaatg ccccggcttc atcgccggaa cgctgcaact gagcaacata 85800 cgcaatctgc tccgccgaca cgttatggaa ctggcgagcc atcgccgtca gccccgacgt 85860 cgggtctgtg gtcagcttcc cgaaggcttc agcgaccttg tccacctcca cgccggatgc 85920 agaggagaaa cgcgccacac tctggctgat ggacgcaatc tgagcctcac cgcttacccc 85980 cgccttaacc agtgcgctga gtgactcgct ggtctggtta aacgtcagcc ctgccgcctg 86040 cccggctctg gacaggacca gcatacgatc tgccgtcagt cccgcctgat tgccggaaag 86100 gaccagcgtt ttgttgaaat cggacagggt tgagttgccc tgataccagg catacgccag 86160 cgcaccggtc gccaccgcca gcgaggtggc ccccaccatc ggcagggtga tcgcaccggc 86220 aagccccctg aacatgggga tcatcccgcc gaaggagtcc ttcacctgcc ccccctgttg 86280 cagcaggatc agccacggac tttgcccgcc tgcaagctgc gtggccacgt cggtgaactg 86340 tgcaggcagc atacgcatgg cggctttata ctgcccgacg gaaatccccg ctttctgtgc 86400 agccagcgcc tgtcggctca gcgactgttc aacgactgcc gctgtttttt tcgcatcact 86460 ttccgtacca gaaaaatgac gcctgactct ggccatctgc tcgtcaaatc tggccgcatc 86520 cagactcaaa tcaacgacca gatcgcctac cggttcagcc ataccggact cctcctgcga 86580 tcccttctga tactgtcatc agcattacgt catcctccgt catgtccgcc acatccgggg 86640 aagcggggat aacttcattc ccgtccgggc caaagcggac acctccggca agccctgccg 86700 ctttctgcat cagcacatca tcttcaggct cttcgtcagc ctcgcgccgg ttcagcagac 86760 tgaaatccag cggatgcata tccggatcgc tgaaaaacag gctgagcacg gtgtacgtca 86820 gcccggaaaa gtgcatatcc agcagaacat catgaaaata atgggtactg taaaagcggt 86880 gccagtcggc atactccgtg gatgacatcc cggcaagcat ggcacgccag tcgggtcgcc 86940 ccatctcacg cgccagtttc agggcaaaac tcagctcacc gtcgaacact ttcccgcaga 87000 aacaggctct gcgggcccgg cgtcctctgt ctgttcaggg gcattattca ccacaaactc 87060 atacatacca gacagccggt acaccacgtt ttcagcatga gaaattgcct ccgtgggcca 87120 ggtggtaagc acttcctgct caatctgttt aacggcttca ttcatggacg gcatctgcgt 87180 cttctgcgga tggttatgcc acagggacat cgccaccaga aacgcgccgg ttctgatggc 87240 gtcttccaca gtaaacttcc ggttgctgtc tgactccgcc tgttctgcct gccgtttcat 87300 cagggcgaga tgctcaatgc gctgcagggc tgacagttca gaaagcgtga cggtcacacc 87360 gttatgttca aatgattcgg ttttcaggaa catcgctgac tctccggatt aactggcggt 87420 gacggtaatt tctgcaaccg cagcaaactc accattaccg gatacaaccg gaatgttgac 87480 cttgcctgca gcaacgccgt tcacggtgat ggtcatacca ctgaccgaca cggtggcttt 87540 tgttttatcc gcagacaccg cacgaaagct cttgtcggtt acgccctccg gctggaaggc 87600 cacggtcagc gtggtgctct gccctttcac caccgaggtg ctggcaggcg tcacggtcat 87660 gccggttgcc gctgttaccg tgctgcgatc ttctgccatc gacggacgtc ccacattggt 87720 gactttcacc gtgcgggtga tcacttcctt cgccgtcacc gccttaccga tactgctgac 87780 ccagccacgg aacacatcga ccgtgccgtt cgggaagcgg attttatagg cacgggtatc 87840 gccttcatta aaccacgcca gcagcgcctg ctgcccctgc tctccgggca tccacgccag 87900 cgtgaagctg gtatctccgg cagatttctg cccctgcccg gtcgcagtcc agtctgcatc 87960 ttcatcatcg agatagctgt cgtcatagga ctcagcggtc agttcgccgg gcgtcaggtc 88020 tttaactttt gccagacgcg accagtcaac gtctgaaagc ggattcgcgt aagggtcacc 88080 gctcccctta taaacccaca gggtggtccc ggcacctttc accggcattg taggatttgg 88140 tacaggcata gcgtcctcac atttcatagg taatgacata agtcagatcg gctgaactcc 88200 acaagcccgc atcatcgtcg cgccggtagt catagccgct ggccaccata ctggtgatca 88260 aatctgacag tgccgggata tcgctcatca ccggataaat ccgggactcc atccacgcat 88320 ccagctctga atccggcacc tgagcaggca ggaaaacttc gatatgcagc tccgcctgcc 88380 aggtatcgct gtccagctct tcgcccgtgt attcagcgcc ggtgagataa acggcaactg 88440 ccggaaaatc cgcctcatca aaaacagcgg ggcgaccatc aaaaaacgtc gccccggtgt 88500 catgcttctc cagtgcatcc agtacggctg cacggagttc agtatgtttc atcgctttat 88560 taccatcctc agttgatgct gcagcgcata gcccagctct ttcggaagac gttcacgccg 88620 tatccgctca atattttgtt taaacgccgt ggtcagcggc accgccatcg ggattttcac 88680 cacatcaatg gggtaacggt ttttcccagc cacacgctgc atgacatgcc accggccatt 88740 tttcagttgc tgaataaacg cgccgggaat acgacggtta cccaccacaa gcacgctgcc 88800 gccacctttc agggatgaac gctgcccctt tttacgacgc ctgcggcgcg aaaggacaac 88860 ccgcgcatta cccagcttga ttacgggcaa atccccccgg ttaactttga ttctggcctg 88920 cggatttttg accgtggccc ttttcagcct ggccctttcc tttaccagtt tccggcgtac 88980 ctttgtctca cgggcaacct gtgacgccga ctgcgatatc gcggatgaag caacgcggtt 89040 aatggccatt gcggcggcac caggcaccgc cgttttgctg atacggctga ggttttcaac 89100 ggcctgctca agacctttta tggccataca tccccctttc agcggcgacg gttaacggca 89160 ggcggtacgc cccgtccaag ccagagatga caacttccgc catcatccgg cgaaacccga 89220 tctacccaga aattttcctc accgatggtc agcgtgtctc cacgccgcag ctgccgcacc 89280 tcatcagtcc ggacaaacag ggacgggctg gagccttcaa cgcgcacgcc ctgtccggca 89340 tagctgatat tttcagggtc atcaaaaaca ccacgtatca ccgcacctga ctgctcaccg 89400 gatgtaatgg tggctgacgt tcccatgtac ccgcgtatcg tttcatcggc gcgggcaatg 89460 gcagcatcga acaggttatc gaaatcagcc acagcgcctc ccgttattgc attctggcca 89520 ggccgcgctc tgtcatttcg gctgccacac cggcagagac acgaaacgcc gttcccggca 89580 gcacaaatgc cacaggttca tcccgcgtgg cgtgaagtgc atcagtatgc agcttcacca 89640 gtgccacgac cgtgaccagt tcagacgtat ccagaatcac ggtatccggc tgcgctgatc 89700 ccacctcatt ttcatgtccg gtcagcacat tttcccggct gagaggggtg tcctgaccgg 89760 cagtttcatc cgtgtcatca agctcctctt tcagctctgc cacacggagc gccagttctt 89820 ctttcgtccc cgtcaggctg acatcacggt tcagttgttc acccagcgag cggagacggg 89880 caatcagttc atctttcgtc atggactcct ccacagagaa acaatggccc cgaagggcca 89940 tgattacgcc agttgtacgg acacgaactc atcagggtca gccagcagca tcagcggtgc 90000 tgactgaatc atggtgaact cacgcgccgg atcgccggtg gtcacccagt ttttcgggta 90060 acgggcagag gcgttaatgc cttcgcgctg tgcgtccgca tcctgaatgc agccataggt 90120 gcgcagaccg cgtgcctgag tgttccccag caccatcgtg ttgtccggca ggaagttctt 90180 tttgacgccg ttttccacgt actgtccgga atacacgacg atggccacat cgccatacat 90240 ccccttatag gacaccgctt tgcccaggtc tttcaccgct gtctccagct cggaattaga 90300 gccacgacgg gtatccagct tctccttgac ggctttgaag gaacggaaca gcgcccagcc 90360 tttcggatcg aacacgatga tattcaccac accgctggcg ttcagcgcgt aggcttcgat 90420 atcgtcggtc gggtcatacg tggacttgtc acgcttgctc cactccgtgc cgccggactg 90480 cgtgatgtta ttctcctcac tgcggcccat atccacctca accggatcga aggcttcacc 90540 ggtcatggtg tatttgccct taagcacggc agaaactgcc tgcatctctt cgacctgagc 90600 aatggccagc tcttcgtcac gcatgttctg catgatgatg cgacggcggc ggtaagccgg 90660 gtccgccaga ttctgcggat cttcatccgg caggcgacgc agggtcatct gcggattcac 90720 ttcatgcttc ggcttgacat atcccggcgt aaattcagag gtggagccgc cacgggaacg 90780 gataacctca ccggaaacaa tcggcgaaac gtacagcgcc atgtttacca gtcccggaat 90840 ttgtgagaga tagactttct ccgtggtgaa gggatagctc tcacggaaaa agagacgcag 90900 aaacagcgga tcaaacttaa atttctgctc atttgccgcc agcagttggg cggttgtgta 90960 catcgacata aaaaaatccc gtaaaaaaag ccgcacaggc ggcctttagt gatgaagggt 91020 aaagttaaac gatgctgatt gccgttccgg caaacgcggt ccgttttttc gtctcgtcgc 91080 tggcagcctc cggccagagc acatcctcat aacggaacgt gccggacttg tagaacgtca 91140 gcgtggtgct ggtctggtca gcagcaaccg caagaatgcc aacggcagca ccgtcggtgg 91200 tgccatccca cgcaaccagc ttacggctgg aggtgtccag catcagcggg gtcattgcag 91260 gcgctttcgc actcaatccg ccgggcgcgg ttgcggtatg agccgggtca ctgttgccct 91320 gcggctggta atgggtaaag gtttctttgc tcgtcataaa catcccttac actggtgtgt 91380 tcagcaaatc gttaacggca tcagatgccg ggttacctgc agccagcggt gccggtgccc 91440 cctgcatcag acgatccagc gcagtgtcac tgcgcgcctg tgcactctgt ggtgctgcgg 91500 ccagaatgcg gcgggccgtt ttcacggtca taccgggggt ttctgccagc acgcgtgcct 91560 gttcttcgcg tccgtgagcc tcctcacagt tgaggatccc cataatgcgg ctgttttctg 91620 ccgcaaccgc tgcggtgatc tgcgcgttca cgtccggctg cgccgcgctg gcgttctcgc 91680 cctccgtcgc tggcaccacg tcagtaacgt cagcctgcga agcagtggct gaaacagttg 91740 ttgattgagt ctctttggtc attcgccctc ctgagagacg ggatttacgt gcatccagtg 91800 catcacgcat gacggtgatc gcatcggtgc tgttaacaag ttcatcagcc agtccggcat 91860 caatggcctc ctgaccgctg tacactgcag cctcggtatc cagcacaacc tgcacggaca 91920 ggccggtata tgccgacacc ttctgcgcaa acatctggcg ggttgcgtcc atccgggact 91980 gcagtgtctc ccggacgtca tccggaagat ggctgtaggg gttgccatcc accttatggc 92040 tgccgctgta aatcagcgtg atttccacac cctgtttctc cagcgcagca ccgtaattac 92100 tgtgagccat catgacgccg atggagcctg tccgggcggt ctgcgtgacc agacgccggg 92160 aggcggcact ggcaagcaac tgacctgcac tgcagttcat gtcgttggca agcgcccata 92220 ccggttttat gtcacgcaca cgggcgatga tgtcagcgca gtcaaatgcc cccgccacca 92280 tcccgccggg cgtgtccata tcgagcagaa tgccgtccac catcggatcg ctggcagcct 92340 gttgcagacg ggcgataatg ccgttgtaac cggtcatccc cgagtacggc tgcagcgccc 92400 gcgtccggct gaccagcgtg ccggacaccg gcagcacggc gatgccgttc atgacctgat 92460 aactgcgggc ctgtcgtggt ccgtcatcat caccggataa tgccagcgtc gcgagtgcct 92520 cctgggcagt caggctgtcg ccggacaccg catccgtcag gctgctgatc ccaagctggc 92580 ctgcaagcgc acaaaagaaa acccgcgcat aggcgggttc aagcatcagc ggctcattaa 92640 aggccatgct ggcaatatgc gggagattac gcagctctgc tgtcactctt ctcctcctct 92700 gttgattgtc gcagcccgga ttcaaatgct gcagccgccc aggcgggcgg tttaagaccg 92760 gctgcacggc gctccatcgt ttcacggacc tgctgggcaa aaatttcctg atagtcgtca 92820 ccgcgttttg cgcactcttt ctcgtaggta ctcagtccgg cttctatcag catcaccgct 92880 tcctgaactt ctttcagacc atcgatggcc atacgaccgg agcctatcca gtcgcagttc 92940 ccccaggcac tgcgggcttc ctgaaaactg aagcgcgctt ttgaaggtaa cgtcaccacg 93000 cggcgaacga tggcctcttc cagccagcac agaaacatct ggctcgcctg acgggatgcg 93060 acgaattttc gccgccccat aaagtacgcc cacgactcgt tcgcactggc ccgtgccgtg 93120 gagtagctca tctgggcgta attccgggaa agctgctcat acgagacacc cagcccggca 93180 gcgatatacc gcagcagtga ctgctcaaac acggagtagc cgttatccgt atcctgagcc 93240 gtctgcaggt tcagtgagtc acccggcatc aggtgcggta cttttgcgcc tcccagccgg 93300 accggcgctg cggcgtaata cgcggcaatt tcaccaatcc agccggtcag cctttcccgc 93360 tgctcctgac tgttcgcgcc cagaataaaa tccatcgctg actgcgtatc cagctcactc 93420 tcaatggtgg cggcatacat cgccttcaca atggcgctct gcagctgcgt gttctgcagc 93480 gtgtcgagca tcttcatctg ctccatcacg ctgtaaaaca catttgcacc gcgagtctgc 93540 ccgtcctcca cgggttcaaa aacgtgaatg aacgaggcgc gcccgccggg taactcacgg 93600 ggtatccatg tccatttctg cggcatccag ccaggatacc cgtcctcgct gacgtaatat 93660 cccagcgccg caccgctgtc attaatctgc acaccggcac ggcagttccg gctgtcgccg 93720 gtattgttcg ggttgctgat gcgcttcggg ctgaccatcc ggaactgtgt ccggaaaagc 93780 cgcgacgaac tggtatccca ggtggcctga acgaacagtt caccgttaaa ggcgtgcatg 93840 gccacacctt cccgaatcat catggtaaac gtgcgttttc gctcaacgtc aatgcagcag 93900 cagtcatcct cggcaaactc tttccatgcc gcttcaacct cgcgggaaaa ggcacgggct 93960 tcttcctccc cgatgcccag atagcgccag cttgggcgat gactgagccg gaaaaaagac 94020 ccgacgatat gatcctgatg cagctggatg gcgttggcgg catagccgtt attgcgtacc 94080 agatcgtctg cgcgggcatt gccacgggta aagttgggca acagggctgc atccacactt 94140 tcactcggtg ggttccacga ccgcaactgc cctccaaatc cgctgccacc gccgtgataa 94200 ccggcatatt cgcgcagcga tgtcatgccg tccggcccca gaagggtggg aatggtgggc 94260 gttttcatac ataaaatcct gcaggtcccc tgcgtcgctg tgtcatgccg gtctgcactt 94320 ccagctctgc aatatatttt ttcaggtcag acacggaagt ggccgtaaac tccacccttc 94380 gtccgtcttt ctgtactgtt gccacccgtt tacctgtcat caggtcatgc agtgccgcac 94440 gggcagcggc aagttcttcc tgtcgcgtca ttcatcctct ccggataagg cacgggcgta 94500 atctgccagt gttttcttgt tggttgctgc accatcctct tcctgcaggc tcgccagcag 94560 cgcactgaga tccagctgcc agcgggaaat actgatgcgc agcgccgcca gcgcataaac 94620 gaagcagtcg agtgcctcat tgcgtcgctt tttgctgtcc cacagtattt ttttcctgcc 94680 atccacccat ttttcgacct gctcttcagc agtcagctgc tgcgcttcgg tcagatcaaa 94740 aatatccggg ttattcggga agtgaacggc accgggaagc ggttcatccc cttccggcgt 94800 cagtgtgaag cggttataaa tctgctcttt cgcggtatcc gtaccgattt cggtaaggta 94860 aaccccgttt ttgtttcgct tacgtggcat gctggccacc ggctttccgt agacggatgc 94920 ccctttaatg gggatcaccc ggaacagccc atgttttttc gagcgttcat acacaatggt 94980 cgggtcaatc ccgccagtat cccagcagat acgggatatc gacatttctg caccattccg 95040 gcgggtatag gttttattga tggcctcatc cacacgcagc agcgtctgtt catcgtcgtg 95100 gcggcccata ataatctgcc ggtcaatcag ccagctttcc tcacccggcc cccatcccca 95160 tacgcgcatt tcgtagcggt ccagctggga gtcgataccg gcggtcaggt aagccacacg 95220 gtcaggaacg ggcgctgaat aatgctcttt ccgctctgcc atcacttcag catccggacg 95280 ttcgccaatt ttcgcctccc acgtctcacc gagcgtggtg tttacgaagg ttttacgttt 95340 tcccgtatcc cctttcgttt tcatccagtc tttgacaatc tgcacccagg tggtgaacgg 95400 gctgtacgct gtccagatgt gaaaggtcac actgtcaggt ggctcaatct cttcaccgga 95460 tgacgaaaac cagagaatgc catcacgggt ccagatcccg gtcttttcgc agatataacg 95520 ggcatcagta aagtccagct cctgctggcg gatgacgcag gcattatgct cgcagagata 95580 aaacacgctg gaggggtcat ccggcgtcca tttgaggcca aacggcgtct ctttgtcgcc 95640 aaatttaaga tactgctcct ccccgcaatg cgggcaggca acatgaaaac gcataaaatg 95700 cggggattca ctggctgcac gctcaatctg acaggtgcct ctcacttttg gcgtggagcc 95760 acggatggac tttggccaga ccgagccttc aatacgcttg tcacccagga acgtcggaga 95820 gccttcctgt tcaatatcat catcaaaagc agcaagttca tcataacccg ccacatccac 95880 cgacttttca cggtagtttt ttgccgcttt accgcccagg caccagaagc cacgcccatt 95940 agtgaaacgc ttcatggtga gcgtgttatc ccggtgcttt ttgccatacc acggggccag 96000 cgccagcagc gacggaatat cacgaatagt cggctcaacg tgggttttca taaagttctc 96060 ggcatcacca tccgtcggca accagataag ggtgttgcgc tgcttatgct ctataaagta 96120 ggcataaaca cccagcagca ttttggaata accgacacgg gcagacttca ccacattcac 96180 ctcacggatg tagtcgctgc ccatcgcatt catgatggcc cgctgaaagg gcagtgtttc 96240 ccagcgccct tcctggtatg cggattcttt cgggagatag taattagcat ccgcccattc 96300 aacggcggtc tgtggctccg gcctgaacag tgagcgaagc ccggcgcgga caaaatgccg 96360 cagcctgtta acctgactgt tcgatatatt cactcagcaa ccccggtatc agttcatcca 96420 gcgcggctgc tttgttcatg gctttgatga tatcccgttt caggaaatca acatgtcggt 96480 tttccagttc cggaaaacgc cgctgcaccg acagggggag cccgtcgaga atactggcaa 96540 tttcacctgc gatccgcgac agcacgaaag tacagaatgc ggtttccacc acttcagcgg 96600 agtctctggc attcttcagt tcctgtgcgt cggcctgcgc acgcgtaagt cgatggcgtt 96660 cgtactcaat agttcctggc tggagatctg cctcgctggc ctgccgcagt tcttcaacct 96720 cccggcgcag cttttcgttc tcaatttcag catccctttc ggcataccat tttatgacgg 96780 cggcagagtc ataaagcacc tcattaccct tgccaccgcc tcgcagaacg ggcattccct 96840 gttcctgcca gttctgaatg gtacggatac tcgcaccgaa aatgtcagcc agctgctttt 96900 tgttgacttc cattgttcat tccacggaca aaaacagaga aaggaaacga cagaggccaa 96960 aaagcctcgc tttcagcacc tgtcgtttcc tttcttttca gagggtattt taaataaaaa 97020 cattaagtta tgacgaagaa gaacggaaac gccttaaacc ggaaaatttt cataaatagc 97080 gaaaacccgc gaggtcgccg cccaggtcgc cgcccgtcaa tcggcccttt agtggagc 97138 <210> 12 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Examples 1 and 9 <400> 12 gcaatatcag caccaacaga aacaacct 28 <210> 13 <211> 48502 <212> DNA <213> Enterobacteria phage lambda <400> 13 gggcggcgac ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg 60 ttcttcttcg tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg 120 acaggtgctg aaagcgaggc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt 180 ggaatgaaca atggaagtca acaaaaagca gctggctgac attttcggtg cgagtatccg 240 taccattcag aactggcagg aacagggaat gcccgttctg cgaggcggtg gcaagggtaa 300 tgaggtgctt tatgactctg ccgccgtcat aaaatggtat gccgaaaggg atgctgaaat 360 tgagaacgaa aagctgcgcc gggaggttga agaactgcgg caggccagcg aggcagatct 420 ccagccagga actattgagt acgaacgcca tcgacttacg cgtgcgcagg ccgacgcaca 480 ggaactgaag aatgccagag actccgctga agtggtggaa accgcattct gtactttcgt 540 gctgtcgcgg atcgcaggtg aaattgccag tattctcgac gggctccccc tgtcggtgca 600 gcggcgtttt ccggaactgg aaaaccgaca tgttgatttc ctgaaacggg atatcatcaa 660 agccatgaac aaagcagccg cgctggatga actgataccg gggttgctga gtgaatatat 720 cgaacagtca ggttaacagg ctgcggcatt ttgtccgcgc cgggcttcgc tcactgttca 780 ggccggagcc acagaccgcc gttgaatggg cggatgctaa ttactatctc ccgaaagaat 840 ccgcatacca ggaagggcgc tgggaaacac tgccctttca gcgggccatc atgaatgcga 900 tgggcagcga ctacatccgt gaggtgaatg tggtgaagtc tgcccgtgtc ggttattcca 960 aaatgctgct gggtgtttat gcctacttta tagagcataa gcagcgcaac acccttatct 1020 ggttgccgac ggatggtgat gccgagaact ttatgaaaac ccacgttgag ccgactattc 1080 gtgatattcc gtcgctgctg gcgctggccc cgtggtatgg caaaaagcac cgggataaca 1140 cgctcaccat gaagcgtttc actaatgggc gtggcttctg gtgcctgggc ggtaaagcgg 1200 caaaaaacta ccgtgaaaag tcggtggatg tggcgggtta tgatgaactt gctgcttttg 1260 atgatgatat tgaacaggaa ggctctccga cgttcctggg tgacaagcgt attgaaggct 1320 cggtctggcc aaagtccatc cgtggctcca cgccaaaagt gagaggcacc tgtcagattg 1380 agcgtgcagc cagtgaatcc ccgcatttta tgcgttttca tgttgcctgc ccgcattgcg 1440 gggaggagca gtatcttaaa tttggcgaca aagagacgcc gtttggcctc aaatggacgc 1500 cggatgaccc ctccagcgtg ttttatctct gcgagcataa tgcctgcgtc atccgccagc 1560 aggagctgga ctttactgat gcccgttata tctgcgaaaa gaccgggatc tggacccgtg 1620 atggcattct ctggttttcg tcatccggtg aagagattga gccacctgac agtgtgacct 1680 ttcacatctg gacagcgtac agcccgttca ccacctgggt gcagattgtc aaagactgga 1740 tgaaaacgaa aggggatacg ggaaaacgta aaaccttcgt aaacaccacg ctcggtgaga 1800 cgtgggaggc gaaaattggc gaacgtccgg atgctgaagt gatggcagag cggaaagagc 1860 attattcagc gcccgttcct gaccgtgtgg cttacctgac cgccggtatc gactcccagc 1920 tggaccgcta cgaaatgcgc gtatggggat gggggccggg tgaggaaagc tggctgattg 1980 accggcagat tattatgggc cgccacgacg atgaacagac gctgctgcgt gtggatgagg 2040 ccatcaataa aacctatacc cgccggaatg gtgcagaaat gtcgatatcc cgtatctgct 2100 gggatactgg cgggattgac ccgaccattg tgtatgaacg ctcgaaaaaa catgggctgt 2160 tccgggtgat ccccattaaa ggggcatccg tctacggaaa gccggtggcc agcatgccac 2220 gtaagcgaaa caaaaacggg gtttacctta ccgaaatcgg tacggatacc gcgaaagagc 2280 agatttataa ccgcttcaca ctgacgccgg aaggggatga accgcttccc ggtgccgttc 2340 acttcccgaa taacccggat atttttgatc tgaccgaagc gcagcagctg actgctgaag 2400 agcaggtcga aaaatgggtg gatggcagga aaaaaatact gtgggacagc aaaaagcgac 2460 gcaatgaggc actcgactgc ttcgtttatg cgctggcggc gctgcgcatc agtatttccc 2520 gctggcagct ggatctcagt gcgctgctgg cgagcctgca ggaagaggat ggtgcagcaa 2580 ccaacaagaa aacactggca gattacgccc gtgccttatc cggagaggat gaatgacgcg 2640 acaggaagaa cttgccgctg cccgtgcggc actgcatgac ctgatgacag gtaaacgggt 2700 ggcaacagta cagaaagacg gacgaagggt ggagtttacg gccacttccg tgtctgacct 2760 gaaaaaatat attgcagagc tggaagtgca gaccggcatg acacagcgac gcaggggacc 2820 tgcaggattt tatgtatgaa aacgcccacc attcccaccc ttctggggcc ggacggcatg 2880 acatcgctgc gcgaatatgc cggttatcac ggcggtggca gcggatttgg agggcagttg 2940 cggtcgtgga acccaccgag tgaaagtgtg gatgcagccc tgttgcccaa ctttacccgt 3000 ggcaatgccc gcgcagacga tctggtacgc aataacggct atgccgccaa cgccatccag 3060 ctgcatcagg atcatatcgt cgggtctttt ttccggctca gtcatcgccc aagctggcgc 3120 tatctgggca tcggggagga agaagcccgt gccttttccc gcgaggttga agcggcatgg 3180 aaagagtttg ccgaggatga ctgctgctgc attgacgttg agcgaaaacg cacgtttacc 3240 atgatgattc gggaaggtgt ggccatgcac gcctttaacg gtgaactgtt cgttcaggcc 3300 acctgggata ccagttcgtc gcggcttttc cggacacagt tccggatggt cagcccgaag 3360 cgcatcagca acccgaacaa taccggcgac agccggaact gccgtgccgg tgtgcagatt 3420 aatgacagcg gtgcggcgct gggatattac gtcagcgagg acgggtatcc tggctggatg 3480 ccgcagaaat ggacatggat accccgtgag ttacccggcg ggcgcgcctc gttcattcac 3540 gtttttgaac ccgtggagga cgggcagact cgcggtgcaa atgtgtttta cagcgtgatg 3600 gagcagatga agatgctcga cacgctgcag aacacgcagc tgcagagcgc cattgtgaag 3660 gcgatgtatg ccgccaccat tgagagtgag ctggatacgc agtcagcgat ggattttatt 3720 ctgggcgcga acagtcagga gcagcgggaa aggctgaccg gctggattgg tgaaattgcc 3780 gcgtattacg ccgcagcgcc ggtccggctg ggaggcgcaa aagtaccgca cctgatgccg 3840 ggtgactcac tgaacctgca gacggctcag gatacggata acggctactc cgtgtttgag 3900 cagtcactgc tgcggtatat cgctgccggg ctgggtgtct cgtatgagca gctttcccgg 3960 aattacgccc agatgagcta ctccacggca cgggccagtg cgaacgagtc gtgggcgtac 4020 tttatggggc ggcgaaaatt cgtcgcatcc cgtcaggcga gccagatgtt tctgtgctgg 4080 ctggaagagg ccatcgttcg ccgcgtggtg acgttacctt caaaagcgcg cttcagtttt 4140 caggaagccc gcagtgcctg ggggaactgc gactggatag gctccggtcg tatggccatc 4200 gatggtctga aagaagttca ggaagcggtg atgctgatag aagccggact gagtacctac 4260 gagaaagagt gcgcaaaacg cggtgacgac tatcaggaaa tttttgccca gcaggtccgt 4320 gaaacgatgg agcgccgtgc agccggtctt aaaccgcccg cctgggcggc tgcagcattt 4380 gaatccgggc tgcgacaatc aacagaggag gagaagagtg acagcagagc tgcgtaatct 4440 cccgcatatt gccagcatgg cctttaatga gccgctgatg cttgaacccg cctatgcgcg 4500 ggttttcttt tgtgcgcttg caggccagct tgggatcagc agcctgacgg atgcggtgtc 4560 cggcgacagc ctgactgccc aggaggcact cgcgacgctg gcattatccg gtgatgatga 4620 cggaccacga caggcccgca gttatcaggt catgaacggc atcgccgtgc tgccggtgtc 4680 cggcacgctg gtcagccgga cgcgggcgct gcagccgtac tcggggatga ccggttacaa 4740 cggcattatc gcccgtctgc aacaggctgc cagcgatccg atggtggacg gcattctgct 4800 cgatatggac acgcccggcg ggatggtggc gggggcattt gactgcgctg acatcatcgc 4860 ccgtgtgcgt gacataaaac cggtatgggc gcttgccaac gacatgaact gcagtgcagg 4920 tcagttgctt gccagtgccg cctcccggcg tctggtcacg cagaccgccc ggacaggctc 4980 catcggcgtc atgatggctc acagtaatta cggtgctgcg ctggagaaac agggtgtgga 5040 aatcacgctg atttacagcg gcagccataa ggtggatggc aacccctaca gccatcttcc 5100 ggatgacgtc cgggagacac tgcagtcccg gatggacgca acccgccaga tgtttgcgca 5160 gaaggtgtcg gcatataccg gcctgtccgt gcaggttgtg ctggataccg aggctgcagt 5220 gtacagcggt caggaggcca ttgatgccgg actggctgat gaacttgtta acagcaccga 5280 tgcgatcacc gtcatgcgtg atgcactgga tgcacgtaaa tcccgtctct caggagggcg 5340 aatgaccaaa gagactcaat caacaactgt ttcagccact gcttcgcagg ctgacgttac 5400 tgacgtggtg ccagcgacgg agggcgagaa cgccagcgcg gcgcagccgg acgtgaacgc 5460 gcagatcacc gcagcggttg cggcagaaaa cagccgcatt atggggatcc tcaactgtga 5520 ggaggctcac ggacgcgaag aacaggcacg cgtgctggca gaaacccccg gtatgaccgt 5580 gaaaacggcc cgccgcattc tggccgcagc accacagagt gcacaggcgc gcagtgacac 5640 tgcgctggat cgtctgatgc agggggcacc ggcaccgctg gctgcaggta acccggcatc 5700 tgatgccgtt aacgatttgc tgaacacacc agtgtaaggg atgtttatga cgagcaaaga 5760 aacctttacc cattaccagc cgcagggcaa cagtgacccg gctcataccg caaccgcgcc 5820 cggcggattg agtgcgaaag cgcctgcaat gaccccgctg atgctggaca cctccagccg 5880 taagctggtt gcgtgggatg gcaccaccga cggtgctgcc gttggcattc ttgcggttgc 5940 tgctgaccag accagcacca cgctgacgtt ctacaagtcc ggcacgttcc gttatgagga 6000 tgtgctctgg ccggaggctg ccagcgacga gacgaaaaaa cggaccgcgt ttgccggaac 6060 ggcaatcagc atcgtttaac tttacccttc atcactaaag gccgcctgtg cggctttttt 6120 tacgggattt ttttatgtcg atgtacacaa ccgcccaact gctggcggca aatgagcaga 6180 aatttaagtt tgatccgctg tttctgcgtc tctttttccg tgagagctat cccttcacca 6240 cggagaaagt ctatctctca caaattccgg gactggtaaa catggcgctg tacgtttcgc 6300 cgattgtttc cggtgaggtt atccgttccc gtggcggctc cacctctgaa tttacgccgg 6360 gatatgtcaa gccgaagcat gaagtgaatc cgcagatgac cctgcgtcgc ctgccggatg 6420 aagatccgca gaatctggcg gacccggctt accgccgccg tcgcatcatc atgcagaaca 6480 tgcgtgacga agagctggcc attgctcagg tcgaagagat gcaggcagtt tctgccgtgc 6540 ttaagggcaa atacaccatg accggtgaag ccttcgatcc ggttgaggtg gatatgggcc 6600 gcagtgagga gaataacatc acgcagtccg gcggcacgga gtggagcaag cgtgacaagt 6660 ccacgtatga cccgaccgac gatatcgaag cctacgcgct gaacgccagc ggtgtggtga 6720 atatcatcgt gttcgatccg aaaggctggg cgctgttccg ttccttcaaa gccgtcaagg 6780 agaagctgga tacccgtcgt ggctctaatt ccgagctgga gacagcggtg aaagacctgg 6840 gcaaagcggt gtcctataag gggatgtatg gcgatgtggc catcgtcgtg tattccggac 6900 agtacgtgga aaacggcgtc aaaaagaact tcctgccgga caacacgatg gtgctgggga 6960 acactcaggc acgcggtctg cgcacctatg gctgcattca ggatgcggac gcacagcgcg 7020 aaggcattaa cgcctctgcc cgttacccga aaaactgggt gaccaccggc gatccggcgc 7080 gtgagttcac catgattcag tcagcaccgc tgatgctgct ggctgaccct gatgagttcg 7140 tgtccgtaca actggcgtaa tcatggccct tcggggccat tgtttctctg tggaggagtc 7200 catgacgaaa gatgaactga ttgcccgtct ccgctcgctg ggtgaacaac tgaaccgtga 7260 tgtcagcctg acggggacga aagaagaact ggcgctccgt gtggcagagc tgaaagagga 7320 gcttgatgac acggatgaaa ctgccggtca ggacacccct ctcagccggg aaaatgtgct 7380 gaccggacat gaaaatgagg tgggatcagc gcagccggat accgtgattc tggatacgtc 7440 tgaactggtc acggtcgtgg cactggtgaa gctgcatact gatgcacttc acgccacgcg 7500 ggatgaacct gtggcatttg tgctgccggg aacggcgttt cgtgtctctg ccggtgtggc 7560 agccgaaatg acagagcgcg gcctggccag aatgcaataa cgggaggcgc tgtggctgat 7620 ttcgataacc tgttcgatgc tgccattgcc cgcgccgatg aaacgatacg cgggtacatg 7680 ggaacgtcag ccaccattac atccggtgag cagtcaggtg cggtgatacg tggtgttttt 7740 gatgaccctg aaaatatcag ctatgccgga cagggcgtgc gcgttgaagg ctccagcccg 7800 tccctgtttg tccggactga tgaggtgcgg cagctgcggc gtggagacac gctgaccatc 7860 ggtgaggaaa atttctgggt agatcgggtt tcgccggatg atggcggaag ttgtcatctc 7920 tggcttggac ggggcgtacc gcctgccgtt aaccgtcgcc gctgaaaggg ggatgtatgg 7980 ccataaaagg tcttgagcag gccgttgaaa acctcagccg tatcagcaaa acggcggtgc 8040 ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 8100 cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 8160 aaagggccac ggtcaaaaat ccgcaggcca gaatcaaagt taaccggggg gatttgcccg 8220 taatcaagct gggtaatgcg cgggttgtcc tttcgcgccg caggcgtcgt aaaaaggggc 8280 agcgttcatc cctgaaaggt ggcggcagcg tgcttgtggt gggtaaccgt cgtattcccg 8340 gcgcgtttat tcagcaactg aaaaatggcc ggtggcatgt catgcagcgt gtggctggga 8400 aaaaccgtta ccccattgat gtggtgaaaa tcccgatggc ggtgccgctg accacggcgt 8460 ttaaacaaaa tattgagcgg atacggcgtg aacgtcttcc gaaagagctg ggctatgcgc 8520 tgcagcatca actgaggatg gtaataaagc gatgaaacat actgaactcc gtgcagccgt 8580 actggatgca ctggagaagc atgacaccgg ggcgacgttt tttgatggtc gccccgctgt 8640 ttttgatgag gcggattttc cggcagttgc cgtttatctc accggcgctg aatacacggg 8700 cgaagagctg gacagcgata cctggcaggc ggagctgcat atcgaagttt tcctgcctgc 8760 tcaggtgccg gattcagagc tggatgcgtg gatggagtcc cggatttatc cggtgatgag 8820 cgatatcccg gcactgtcag atttgatcac cagtatggtg gccagcggct atgactaccg 8880 gcgcgacgat gatgcgggct tgtggagttc agccgatctg acttatgtca ttacctatga 8940 aatgtgagga cgctatgcct gtaccaaatc ctacaatgcc ggtgaaaggt gccgggacca 9000 ccctgtgggt ttataagggg agcggtgacc cttacgcgaa tccgctttca gacgttgact 9060 ggtcgcgtct ggcaaaagtt aaagacctga cgcccggcga actgaccgct gagtcctatg 9120 acgacagcta tctcgatgat gaagatgcag actggactgc gaccgggcag gggcagaaat 9180 ctgccggaga taccagcttc acgctggcgt ggatgcccgg agagcagggg cagcaggcgc 9240 tgctggcgtg gtttaatgaa ggcgataccc gtgcctataa aatccgcttc ccgaacggca 9300 cggtcgatgt gttccgtggc tgggtcagca gtatcggtaa ggcggtgacg gcgaaggaag 9360 tgatcacccg cacggtgaaa gtcaccaatg tgggacgtcc gtcgatggca gaagatcgca 9420 gcacggtaac agcggcaacc ggcatgaccg tgacgcctgc cagcacctcg gtggtgaaag 9480 ggcagagcac cacgctgacc gtggccttcc agccggaggg cgtaaccgac aagagctttc 9540 gtgcggtgtc tgcggataaa acaaaagcca ccgtgtcggt cagtggtatg accatcaccg 9600 tgaacggcgt tgctgcaggc aaggtcaaca ttccggttgt atccggtaat ggtgagtttg 9660 ctgcggttgc agaaattacc gtcaccgcca gttaatccgg agagtcagcg atgttcctga 9720 aaaccgaatc atttgaacat aacggtgtga ccgtcacgct ttctgaactg tcagccctgc 9780 agcgcattga gcatctcgcc ctgatgaaac ggcaggcaga acaggcggag tcagacagca 9840 accggaagtt tactgtggaa gacgccatca gaaccggcgc gtttctggtg gcgatgtccc 9900 tgtggcataa ccatccgcag aagacgcaga tgccgtccat gaatgaagcc gttaaacaga 9960 ttgagcagga agtgcttacc acctggccca cggaggcaat ttctcatgct gaaaacgtgg 10020 tgtaccggct gtctggtatg tatgagtttg tggtgaataa tgcccctgaa cagacagagg 10080 acgccgggcc cgcagagcct gtttctgcgg gaaagtgttc gacggtgagc tgagttttgc 10140 cctgaaactg gcgcgtgaga tggggcgacc cgactggcgt gccatgcttg ccgggatgtc 10200 atccacggag tatgccgact ggcaccgctt ttacagtacc cattattttc atgatgttct 10260 gctggatatg cacttttccg ggctgacgta caccgtgctc agcctgtttt tcagcgatcc 10320 ggatatgcat ccgctggatt tcagtctgct gaaccggcgc gaggctgacg aagagcctga 10380 agatgatgtg ctgatgcaga aagcggcagg gcttgccgga ggtgtccgct ttggcccgga 10440 cgggaatgaa gttatccccg cttccccgga tgtggcggac atgacggagg atgacgtaat 10500 gctgatgaca gtatcagaag ggatcgcagg aggagtccgg tatggctgaa ccggtaggcg 10560 atctggtcgt tgatttgagt ctggatgcgg ccagatttga cgagcagatg gccagagtca 10620 ggcgtcattt ttctggtacg gaaagtgatg cgaaaaaaac agcggcagtc gttgaacagt 10680 cgctgagccg acaggcgctg gctgcacaga aagcggggat ttccgtcggg cagtataaag 10740 ccgccatgcg tatgctgcct gcacagttca ccgacgtggc cacgcagctt gcaggcgggc 10800 aaagtccgtg gctgatcctg ctgcaacagg gggggcaggt gaaggactcc ttcggcggga 10860 tgatccccat gttcaggggg cttgccggtg cgatcaccct gccgatggtg ggggccacct 10920 cgctggcggt ggcgaccggt gcgctggcgt atgcctggta tcagggcaac tcaaccctgt 10980 ccgatttcaa caaaacgctg gtcctttccg gcaatcaggc gggactgacg gcagatcgta 11040 tgctggtcct gtccagagcc gggcaggcgg cagggctgac gtttaaccag accagcgagt 11100 cactcagcgc actggttaag gcgggggtaa gcggtgaggc tcagattgcg tccatcagcc 11160 agagtgtggc gcgtttctcc tctgcatccg gcgtggaggt ggacaaggtc gctgaagcct 11220 tcgggaagct gaccacagac ccgacgtcgg ggctgacggc gatggctcgc cagttccata 11280 acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 11340 gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 11400 tgaaagagaa catgggcacg ctggagacct gggcagacag gactgcgcgg gcattcaaat 11460 ccatgtggga tgcggtgctg gatattggtc gtcctgatac cgcgcaggag atgctgatta 11520 aggcagaggc tgcgtataag aaagcagacg acatctggaa tctgcgcaag gatgattatt 11580 ttgttaacga tgaagcgcgg gcgcgttact gggatgatcg tgaaaaggcc cgtcttgcgc 11640 ttgaagccgc ccgaaagaag gctgagcagc agactcaaca ggacaaaaat gcgcagcagc 11700 agagcgatac cgaagcgtca cggctgaaat ataccgaaga ggcgcagaag gcttacgaac 11760 ggctgcagac gccgctggag aaatataccg cccgtcagga agaactgaac aaggcactga 11820 aagacgggaa aatcctgcag gcggattaca acacgctgat ggcggcggcg aaaaaggatt 11880 atgaagcgac gctgaaaaag ccgaaacagt ccagcgtgaa ggtgtctgcg ggcgatcgtc 11940 aggaagacag tgctcatgct gccctgctga cgcttcaggc agaactccgg acgctggaga 12000 agcatgccgg agcaaatgag aaaatcagcc agcagcgccg ggatttgtgg aaggcggaga 12060 gtcagttcgc ggtactggag gaggcggcgc aacgtcgcca gctgtctgca caggagaaat 12120 ccctgctggc gcataaagat gagacgctgg agtacaaacg ccagctggct gcacttggcg 12180 acaaggttac gtatcaggag cgcctgaacg cgctggcgca gcaggcggat aaattcgcac 12240 agcagcaacg ggcaaaacgg gccgccattg atgcgaaaag ccgggggctg actgaccggc 12300 aggcagaacg ggaagccacg gaacagcgcc tgaaggaaca gtatggcgat aatccgctgg 12360 cgctgaataa cgtcatgtca gagcagaaaa agacctgggc ggctgaagac cagcttcgcg 12420 ggaactggat ggcaggcctg aagtccggct ggagtgagtg ggaagagagc gccacggaca 12480 gtatgtcgca ggtaaaaagt gcagccacgc agacctttga tggtattgca cagaatatgg 12540 cggcgatgct gaccggcagt gagcagaact ggcgcagctt cacccgttcc gtgctgtcca 12600 tgatgacaga aattctgctt aagcaggcaa tggtggggat tgtcgggagt atcggcagcg 12660 ccattggcgg ggctgttggt ggcggcgcat ccgcgtcagg cggtacagcc attcaggccg 12720 ctgcggcgaa attccatttt gcaaccggag gatttacggg aaccggcggc aaatatgagc 12780 cagcggggat tgttcaccgt ggtgagtttg tcttcacgaa ggaggcaacc agccggattg 12840 gcgtggggaa tctttaccgg ctgatgcgcg gctatgccac cggcggttat gtcggtacac 12900 cgggcagcat ggcagacagc cggtcgcagg cgtccgggac gtttgagcag aataaccatg 12960 tggtgattaa caacgacggc acgaacgggc agataggtcc ggctgctctg aaggcggtgt 13020 atgacatggc ccgcaagggt gcccgtgatg aaattcagac acagatgcgt gatggtggcc 13080 tgttctccgg aggtggacga tgaagacctt ccgctggaaa gtgaaacccg gtatggatgt 13140 ggcttcggtc ccttctgtaa gaaaggtgcg ctttggtgat ggctattctc agcgagcgcc 13200 tgccgggctg aatgccaacc tgaaaacgta cagcgtgacg ctttctgtcc cccgtgagga 13260 ggccacggta ctggagtcgt ttctggaaga gcacgggggc tggaaatcct ttctgtggac 13320 gccgccttat gagtggcggc agataaaggt gacctgcgca aaatggtcgt cgcgggtcag 13380 tatgctgcgt gttgagttca gcgcagagtt tgaacaggtg gtgaactgat gcaggatatc 13440 cggcaggaaa cactgaatga atgcacccgt gcggagcagt cggccagcgt ggtgctctgg 13500 gaaatcgacc tgacagaggt cggtggagaa cgttattttt tctgtaatga gcagaacgaa 13560 aaaggtgagc cggtcacctg gcaggggcga cagtatcagc cgtatcccat tcaggggagc 13620 ggttttgaac tgaatggcaa aggcaccagt acgcgcccca cgctgacggt ttctaacctg 13680 tacggtatgg tcaccgggat ggcggaagat atgcagagtc tggtcggcgg aacggtggtc 13740 cggcgtaagg tttacgcccg ttttctggat gcggtgaact tcgtcaacgg aaacagttac 13800 gccgatccgg agcaggaggt gatcagccgc tggcgcattg agcagtgcag cgaactgagc 13860 gcggtgagtg cctcctttgt actgtccacg ccgacggaaa cggatggcgc tgtttttccg 13920 ggacgtatca tgctggccaa cacctgcacc tggacctatc gcggtgacga gtgcggttat 13980 agcggtccgg ctgtcgcgga tgaatatgac cagccaacgt ccgatatcac gaaggataaa 14040 tgcagcaaat gcctgagcgg ttgtaagttc cgcaataacg tcggcaactt tggcggcttc 14100 ctttccatta acaaactttc gcagtaaatc ccatgacaca gacagaatca gcgattctgg 14160 cgcacgcccg gcgatgtgcg ccagcggagt cgtgcggctt cgtggtaagc acgccggagg 14220 gggaaagata tttcccctgc gtgaatatct ccggtgagcc ggaggctatt tccgtatgtc 14280 gccggaagac tggctgcagg cagaaatgca gggtgagatt gtggcgctgg tccacagcca 14340 ccccggtggt ctgccctggc tgagtgaggc cgaccggcgg ctgcaggtgc agagtgattt 14400 gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 14460 cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 14520 tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 14580 gaatctctat ctggataatc tggaggcgac ggggctgtat caggtgccgt tgtcagcggc 14640 acagccgggc gatgtgctgc tgtgctgttt tggttcatca gtgccgaatc acgccgcaat 14700 ttactgcggc gacggcgagc tgctgcacca tattcctgaa caactgagca aacgagagag 14760 gtacaccgac aaatggcagc gacgcacaca ctccctctgg cgtcaccggg catggcgcgc 14820 atctgccttt acggggattt acaacgattt ggtcgccgca tcgaccttcg tgtgaaaacg 14880 ggggctgaag ccatccgggc actggccaca cagctcccgg cgtttcgtca gaaactgagc 14940 gacggctggt atcaggtacg gattgccggg cgggacgtca gcacgtccgg gttaacggcg 15000 cagttacatg agactctgcc tgatggcgct gtaattcata ttgttcccag agtcgccggg 15060 gccaagtcag gtggcgtatt ccagattgtc ctgggggctg ccgccattgc cggatcattc 15120 tttaccgccg gagccaccct tgcagcatgg ggggcagcca ttggggccgg tggtatgacc 15180 ggcatcctgt tttctctcgg tgccagtatg gtgctcggtg gtgtggcgca gatgctggca 15240 ccgaaagcca gaactccccg tatacagaca acggataacg gtaagcagaa cacctatttc 15300 tcctcactgg ataacatggt tgcccagggc aatgttctgc ctgttctgta cggggaaatg 15360 cgcgtggggt cacgcgtggt ttctcaggag atcagcacgg cagacgaagg ggacggtggt 15420 caggttgtgg tgattggtcg ctgatgcaaa atgttttatg tgaaaccgcc tgcgggcggt 15480 tttgtcattt atggagcgtg aggaatgggt aaaggaagca gtaaggggca taccccgcgc 15540 gaagcgaagg acaacctgaa gtccacgcag ttgctgagtg tgatcgatgc catcagcgaa 15600 gggccgattg aaggtccggt ggatggctta aaaagcgtgc tgctgaacag tacgccggtg 15660 ctggacactg aggggaatac caacatatcc ggtgtcacgg tggtgttccg ggctggtgag 15720 caggagcaga ctccgccgga gggatttgaa tcctccggct ccgagacggt gctgggtacg 15780 gaagtgaaat atgacacgcc gatcacccgc accattacgt ctgcaaacat cgaccgtctg 15840 cgctttacct tcggtgtaca ggcactggtg gaaaccacct caaagggtga caggaatccg 15900 tcggaagtcc gcctgctggt tcagatacaa cgtaacggtg gctgggtgac ggaaaaagac 15960 atcaccatta agggcaaaac cacctcgcag tatctggcct cggtggtgat gggtaacctg 16020 ccgccgcgcc cgtttaatat ccggatgcgc aggatgacgc cggacagcac cacagaccag 16080 ctgcagaaca aaacgctctg gtcgtcatac actgaaatca tcgatgtgaa acagtgctac 16140 ccgaacacgg cactggtcgg cgtgcaggtg gactcggagc agttcggcag ccagcaggtg 16200 agccgtaatt atcatctgcg cgggcgtatt ctgcaggtgc cgtcgaacta taacccgcag 16260 acgcggcaat acagcggtat ctgggacgga acgtttaaac cggcatacag caacaacatg 16320 gcctggtgtc tgtgggatat gctgacccat ccgcgctacg gcatggggaa acgtcttggt 16380 gcggcggatg tggataaatg ggcgctgtat gtcatcggcc agtactgcga ccagtcagtg 16440 ccggacggct ttggcggcac ggagccgcgc atcacctgta atgcgtacct gaccacacag 16500 cgtaaggcgt gggatgtgct cagcgatttc tgctcggcga tgcgctgtat gccggtatgg 16560 aacgggcaga cgctgacgtt cgtgcaggac cgaccgtcgg ataagacgtg gacctataac 16620 cgcagtaatg tggtgatgcc ggatgatggc gcgccgttcc gctacagctt cagcgccctg 16680 aaggaccgcc ataatgccgt tgaggtgaac tggattgacc cgaacaacgg ctgggagacg 16740 gcgacagagc ttgttgaaga tacgcaggcc attgcccgtt acggtcgtaa tgttacgaag 16800 atggatgcct ttggctgtac cagccggggg caggcacacc gcgccgggct gtggctgatt 16860 aaaacagaac tgctggaaac gcagaccgtg gatttcagcg tcggcgcaga agggcttcgc 16920 catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 16980 ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 17040 ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 17100 gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 17160 gttgctgaat acagcgtatg ggagctgaag ctgccgacgc tgcgccagcg actgttccgc 17220 tgcgtgagta tccgtgagaa cgacgacggc acgtatgcca tcaccgccgt gcagcatgtg 17280 ccggaaaaag aggccatcgt ggataacggg gcgcactttg acggcgaaca gagtggcacg 17340 gtgaatggtg tcacgccgcc agcggtgcag cacctgaccg cagaagtcac tgcagacagc 17400 ggggaatatc aggtgctggc gcgatgggac acaccgaagg tggtgaaggg cgtgagtttc 17460 ctgctccgtc tgaccgtaac agcggacgac ggcagtgagc ggctggtcag cacggcccgg 17520 acgacggaaa ccacataccg cttcacgcaa ctggcgctgg ggaactacag gctgacagtc 17580 cgggcggtaa atgcgtgggg gcagcagggc gatccggcgt cggtatcgtt ccggattgcc 17640 gcaccggcag caccgtcgag gattgagctg acgccgggct attttcagat aaccgccacg 17700 ccgcatcttg ccgtttatga cccgacggta cagtttgagt tctggttctc ggaaaagcag 17760 attgcggata tcagacaggt tgaaaccagc acgcgttatc ttggtacggc gctgtactgg 17820 atagccgcca gtatcaatat caaaccgggc catgattatt acttttatat ccgcagtgtg 17880 aacaccgttg gcaaatcggc attcgtggag gccgtcggtc gggcgagcga tgatgcggaa 17940 ggttacctgg attttttcaa aggcaagata accgaatccc atctcggcaa ggagctgctg 18000 gaaaaagtcg agctgacgga ggataacgcc agcagactgg aggagttttc gaaagagtgg 18060 aaggatgcca gtgataagtg gaatgccatg tgggctgtca aaattgagca gaccaaagac 18120 ggcaaacatt atgtcgcggg tattggcctc agcatggagg acacggagga aggcaaactg 18180 agccagtttc tggttgccgc caatcgtatc gcatttattg acccggcaaa cgggaatgaa 18240 acgccgatgt ttgtggcgca gggcaaccag atattcatga acgacgtgtt cctgaagcgc 18300 ctgacggccc ccaccattac cagcggcggc aatcctccgg ccttttccct gacaccggac 18360 ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 18420 ctcagtaatg tgacgatagc tgaaaactgt acgataaacg gtacgctgag ggcggaaaaa 18480 atcgtcgggg acattgtaaa ggcggcgagc gcggcttttc cgcgccagcg tgaaagcagt 18540 gtggactggc cgtcaggtac ccgtactgtc accgtgaccg atgaccatcc ttttgatcgc 18600 cagatagtgg tgcttccgct gacgtttcgc ggaagtaagc gtactgtcag cggcaggaca 18660 acgtattcga tgtgttatct gaaagtactg atgaacggtg cggtgattta tgatggcgcg 18720 gcgaacgagg cggtacaggt gttctcccgt attgttgaca tgccagcggg tcggggaaac 18780 gtgatcctga cgttcacgct tacgtccaca cggcattcgg cagatattcc gccgtatacg 18840 tttgccagcg atgtgcaggt tatggtgatt aagaaacagg cgctgggcat cagcgtggtc 18900 tgagtgtgtt acagaggttc gtccgggaac gggcgtttta ttataaaaca gtgagaggtg 18960 aacgatgcgt aatgtgtgta ttgccgttgc tgtctttgcc gcacttgcgg tgacagtcac 19020 tccggcccgt gcggaaggtg gacatggtac gtttacggtg ggctattttc aagtgaaacc 19080 gggtacattg ccgtcgttgt cgggcgggga taccggtgtg agtcatctga aagggattaa 19140 cgtgaagtac cgttatgagc tgacggacag tgtgggggtg atggcttccc tggggttcgc 19200 cgcgtcgaaa aagagcagca cagtgatgac cggggaggat acgtttcact atgagagcct 19260 gcgtggacgt tatgtgagcg tgatggccgg accggtttta caaatcagta agcaggtcag 19320 tgcgtacgcc atggccggag tggctcacag tcggtggtcc ggcagtacaa tggattaccg 19380 taagacggaa atcactcccg ggtatatgaa agagacgacc actgccaggg acgaaagtgc 19440 aatgcggcat acctcagtgg cgtggagtgc aggtatacag attaatccgg cagcgtccgt 19500 cgttgttgat attgcttatg aaggctccgg cagtggcgac tggcgtactg acggattcat 19560 cgttggggtc ggttataaat tctgattagc caggtaacac agtgttatga cagcccgccg 19620 gaaccggtgg gcttttttgt ggggtgaata tggcagtaaa gatttcagga gtcctgaaag 19680 acggcacagg aaaaccggta cagaactgca ccattcagct gaaagccaga cgtaacagca 19740 ccacggtggt ggtgaacacg gtgggctcag agaatccgga tgaagccggg cgttacagca 19800 tggatgtgga gtacggtcag tacagtgtca tcctgcaggt tgacggtttt ccaccatcgc 19860 acgccgggac catcaccgtg tatgaagatt cacaaccggg gacgctgaat gattttctct 19920 gtgccatgac ggaggatgat gcccggccgg aggtgctgcg tcgtcttgaa ctgatggtgg 19980 aagaggtggc gcgtaacgcg tccgtggtgg cacagagtac ggcagacgcg aagaaatcag 20040 ccggcgatgc cagtgcatca gctgctcagg tcgcggccct tgtgactgat gcaactgact 20100 cagcacgcgc cgccagcacg tccgccggac aggctgcatc gtcagctcag gaagcgtcct 20160 ccggcgcaga agcggcatca gcaaaggcca ctgaagcgga aaaaagtgcc gcagccgcag 20220 agtcctcaaa aaacgcggcg gccaccagtg ccggtgcggc gaaaacgtca gaaacgaatg 20280 ctgcagcgtc acaacaatca gccgccacgt ctgcctccac cgcggccacg aaagcgtcag 20340 aggccgccac ttcagcacga gatgcggtgg cctcaaaaga ggcagcaaaa tcatcagaaa 20400 cgaacgcatc atcaagtgcc ggtcgtgcag cttcctcggc aacggcggca gaaaattctg 20460 ccagggcggc aaaaacgtcc gagacgaatg ccaggtcatc tgaaacagca gcggaacgga 20520 gcgcctctgc cgcggcagac gcaaaaacag cggcggcggg gagtgcgtca acggcatcca 20580 cgaaggcgac agaggctgcg ggaagtgcgg tatcagcatc gcagagcaaa agtgcggcag 20640 aagcggcggc aatacgtgca aaaaattcgg caaaacgtgc agaagatata gcttcagctg 20700 tcgcgcttga ggatgcggac acaacgagaa aggggatagt gcagctcagc agtgcaacca 20760 acagcacgtc tgaaacgctt gctgcaacgc caaaggcggt taaggtggta atggatgaaa 20820 cgaacagaaa agcccactgg acagtccggc actgaccgga acgccaacag caccaaccgc 20880 gctcagggga acaaacaata cccagattgc gaacaccgct tttgtactgg ccgcgattgc 20940 agatgttatc gacgcgtcac ctgacgcact gaatacgctg aatgaactgg ccgcagcgct 21000 cgggaatgat ccagattttg ctaccaccat gactaacgcg cttgcgggta aacaaccgaa 21060 gaatgcgaca ctgacggcgc tggcagggct ttccacggcg aaaaataaat taccgtattt 21120 tgcggaaaat gatgccgcca gcctgactga actgactcag gttggcaggg atattctggc 21180 aaaaaattcc gttgcagatg ttcttgaata ccttggggcc ggtgagaatt cggcctttcc 21240 ggcaggtgcg ccgatcccgt ggccatcaga tatcgttccg tctggctacg tcctgatgca 21300 ggggcaggcg tttgacaaat cagcctaccc aaaacttgct gtcgcgtatc catcgggtgt 21360 gcttcctgat atgcgaggct ggacaatcaa ggggaaaccc gccagcggtc gtgctgtatt 21420 gtctcaggaa caggatggaa ttaagtcgca cacccacagt gccagtgcat ccggtacgga 21480 tttggggacg aaaaccacat cgtcgtttga ttacgggacg aaaacaacag gcagtttcga 21540 ttacggcacc aaatcgacga ataacacggg ggctcatgct cacagtctga gcggttcaac 21600 aggggccgcg ggtgctcatg cccacacaag tggtttaagg atgaacagtt ctggctggag 21660 tcagtatgga acagcaacca ttacaggaag tttatccaca gttaaaggaa ccagcacaca 21720 gggtattgct tatttatcga aaacggacag tcagggcagc cacagtcact cattgtccgg 21780 tacagccgtg agtgccggtg cacatgcgca tacagttggt attggtgcgc accagcatcc 21840 ggttgttatc ggtgctcatg cccattcttt cagtattggt tcacacggac acaccatcac 21900 cgttaacgct gcgggtaacg cggaaaacac cgtcaaaaac attgcattta actatattgt 21960 gaggcttgca taatggcatt cagaatgagt gaacaaccac ggaccataaa aatttataat 22020 ctgctggccg gaactaatga atttattggt gaaggtgacg catatattcc gcctcatacc 22080 ggtctgcctg caaacagtac cgatattgca ccgccagata ttccggctgg ctttgtggct 22140 gttttcaaca gtgatgaggc atcgtggcat ctcgttgaag accatcgggg taaaaccgtc 22200 tatgacgtgg cttccggcga cgcgttattt atttctgaac tcggtccgtt accggaaaat 22260 tttacctggt tatcgccggg aggggaatat cagaagtgga acggcacagc ctgggtgaag 22320 gatacggaag cagaaaaact gttccggatc cgggaggcgg aagaaacaaa aaaaagcctg 22380 atgcaggtag ccagtgagca tattgcgccg cttcaggatg ctgcagatct ggaaattgca 22440 acgaaggaag aaacctcgtt gctggaagcc tggaagaagt atcgggtgtt gctgaaccgt 22500 gttgatacat caactgcacc tgatattgag tggcctgctg tccctgttat ggagtaatcg 22560 ttttgtgata tgccgcagaa acgttgtatg aaataacgtt ctgcggttag ttagtatatt 22620 gtaaagctga gtattggttt atttggcgat tattatcttc aggagaataa tggaagttct 22680 atgactcaat tgttcatagt gtttacatca ccgccaattg cttttaagac tgaacgcatg 22740 aaatatggtt tttcgtcatg ttttgagtct gctgttgata tttctaaagt cggttttttt 22800 tcttcgtttt ctctaactat tttccatgaa atacattttt gattattatt tgaatcaatt 22860 ccaattacct gaagtctttc atctataatt ggcattgtat gtattggttt attggagtag 22920 atgcttgctt ttctgagcca tagctctgat atccaaatga agccataggc atttgttatt 22980 ttggctctgt cagctgcata acgccaaaaa atatatttat ctgcttgatc ttcaaatgtt 23040 gtattgatta aatcaattgg atggaattgt ttatcataaa aaattaatgt ttgaatgtga 23100 taaccgtcct ttaaaaaagt cgtttctgca agcttggctg tatagtcaac taactcttct 23160 gtcgaagtga tatttttagg cttatctacc agttttagac gctctttaat atcttcagga 23220 attattttat tgtcatattg tatcatgcta aatgacaatt tgcttatgga gtaatctttt 23280 aattttaaat aagttattct cctggcttca tcaaataaag agtcgaatga tgttggcgaa 23340 atcacatcgt cacccattgg attgtttatt tgtatgccaa gagagttaca gcagttatac 23400 attctgccat agattatagc taaggcatgt aataattcgt aatcttttag cgtattagcg 23460 acccatcgtc tttctgattt aataatagat gattcagtta aatatgaagg taatttcttt 23520 tgtgcaagtc tgactaactt ttttatacca atgtttaaca tactttcatt tgtaataaac 23580 tcaatgtcat tttcttcaat gtaagatgaa ataagagtag cctttgcctc gctatacatt 23640 tctaaatcgc cttgtttttc tatcgtattg cgagaatttt tagcccaagc cattaatgga 23700 tcatttttcc atttttcaat aacattattg ttataccaaa tgtcatatcc tataatctgg 23760 tttttgtttt tttgaataat aaatgttact gttcttgcgg tttggaggaa ttgattcaaa 23820 ttcaagcgaa ataattcagg gtcaaaatat gtatcaatgc agcatttgag caagtgcgat 23880 aaatctttaa gtcttctttc ccatggtttt ttagtcataa aactctccat tttgataggt 23940 tgcatgctag atgctgatat attttagagg tgataaaatt aactgcttaa ctgtcaatgt 24000 aatacaagtt gtttgatctt tgcaatgatt cttatcagaa accatatagt aaattagtta 24060 cacaggaaat ttttaatatt attattatca ttcattatgt attaaaatta gagttgtggc 24120 ttggctctgc taacacgttg ctcataggag atatggtaga gccgcagaca cgtcgtatgc 24180 aggaacgtgc tgcggctggc tggtgaactt ccgatagtgc gggtgttgaa tgatttccag 24240 ttgctaccga ttttacatat tttttgcatg agagaatttg taccacctcc caccgaccat 24300 ctatgactgt acgccactgt ccctaggact gctatgtgcc ggagcggaca ttacaaacgt 24360 ccttctcggt gcatgccact gttgccaatg acctgcctag gaattggtta gcaagttact 24420 accggatttt gtaaaaacag ccctcctcat ataaaaagta ttcgttcact tccgataagc 24480 gtcgtaattt tctatctttc atcatattct agatccctct gaaaaaatct tccgagtttg 24540 ctaggcactg atacataact cttttccaat aattggggaa gtcattcaaa tctataatag 24600 gtttcagatt tgcttcaata aattctgact gtagctgctg aaacgttgcg gttgaactat 24660 atttccttat aacttttacg aaagagtttc tttgagtaat cacttcactc aagtgcttcc 24720 ctgcctccaa acgatacctg ttagcaatat ttaatagctt gaaatgatga agagctctgt 24780 gtttgtcttc ctgcctccag ttcgccgggc attcaacata aaaactgata gcacccggag 24840 ttccggaaac gaaatttgca tatacccatt gctcacgaaa aaaaatgtcc ttgtcgatat 24900 agggatgaat cgcttggtgt acctcatcta ctgcgaaaac ttgacctttc tctcccatat 24960 tgcagtcgcg gcacgatgga actaaattaa taggcatcac cgaaaattca ggataatgtg 25020 caataggaag aaaatgatct atattttttg tctgtcctat atcaccacaa aatggacatt 25080 tttcacctga tgaaacaagc atgtcatcgt aatatgttct agcgggtttg tttttatctc 25140 ggagattatt ttcataaagc ttttctaatt taacctttgt caggttacca actactaagg 25200 ttgtaggctc aagagggtgt gtcctgtcgt aggtaaataa ctgacctgtc gagcttaata 25260 ttctatattg ttgttctttc tgcaaaaaag tggggaagtg agtaatgaaa ttatttctaa 25320 catttatctg catcatacct tccgagcatt tattaagcat ttcgctataa gttctcgctg 25380 gaagaggtag ttttttcatt gtactttacc ttcatctctg ttcattatca tcgcttttaa 25440 aacggttcga ccttctaatc ctatctgacc attataattt tttagaatgg tttcataaga 25500 aagctctgaa tcaacggact gcgataataa gtggtggtat ccagaatttg tcacttcaag 25560 taaaaacacc tcacgagtta aaacacctaa gttctcaccg aatgtctcaa tatccggacg 25620 gataatattt attgcttctc ttgaccgtag gactttccac atgcaggatt ttggaacctc 25680 ttgcagtact actggggaat gagttgcaat tattgctaca ccattgcgtg catcgagtaa 25740 gtcgcttaat gttcgtaaaa aagcagagag caaaggtgga tgcagatgaa cctctggttc 25800 atcgaataaa actaatgact tttcgccaac gacatctact aatcttgtga tagtaaataa 25860 aacaattgca tgtccagagc tcattcgaag cagatatttc tggatattgt cataaaacaa 25920 tttagtgaat ttatcatcgt ccacttgaat ctgtggttca ttacgtctta actcttcata 25980 tttagaaatg aggctgatga gttccatatt tgaaaagttt tcatcactac ttagtttttt 26040 gatagcttca agccagagtt gtctttttct atctactctc atacaaccaa taaatgctga 26100 aatgaattct aagcggagat cgcctagtga ttttaaacta ttgctggcag cattcttgag 26160 tccaatataa aagtattgtg taccttttgc tgggtcaggt tgttctttag gaggagtaaa 26220 aggatcaaat gcactaaacg aaactgaaac aagcgatcga aaatatccct ttgggattct 26280 tgactcgata agtctattat tttcagagaa aaaatattca ttgttttctg ggttggtgat 26340 tgcaccaatc attccattca aaattgttgt tttaccacac ccattccgcc cgataaaagc 26400 atgaatgttc gtgctgggca tagaattaac cgtcacctca aaaggtatag ttaaatcact 26460 gaatccggga gcactttttc tattaaatga aaagtggaaa tctgacaatt ctggcaaacc 26520 atttaacaca cgtgcgaact gtccatgaat ttctgaaaga gttacccctc taagtaatga 26580 ggtgttaagg acgctttcat tttcaatgtc ggctaatcga tttggccata ctactaaatc 26640 ctgaatagct ttaagaaggt tatgtttaaa accatcgctt aatttgctga gattaacata 26700 gtagtcaatg ctttcaccta aggaaaaaaa catttcaggg agttgactga attttttatc 26760 tattaatgaa taagtgctta cttcttcttt ttgacctaca aaaccaattt taacatttcc 26820 gatatcgcat ttttcaccat gctcatcaaa gacagtaaga taaaacattg taacaaagga 26880 atagtcattc caaccatctg ctcgtaggaa tgccttattt ttttctactg caggaatata 26940 cccgcctctt tcaataacac taaactccaa catatagtaa cccttaattt tattaaaata 27000 accgcaattt atttggcggc aacacaggat ctctctttta agttactctc tattacatac 27060 gttttccatc taaaaattag tagtattgaa cttaacgggg catcgtattg tagttttcca 27120 tatttagctt tctgcttcct tttggataac ccactgttat tcatgttgca tggtgcactg 27180 tttataccaa cgatatagtc tattaatgca tatatagtat cgccgaacga ttagctcttc 27240 aggcttctga agaagcgttt caagtactaa taagccgata gatagccacg gacttcgtag 27300 ccatttttca taagtgttaa cttccgctcc tcgctcataa cagacattca ctacagttat 27360 ggcggaaagg tatgcatgct gggtgtgggg aagtcgtgaa agaaaagaag tcagctgcgt 27420 cgtttgacat cactgctatc ttcttactgg ttatgcaggt cgtagtgggt ggcacacaaa 27480 gctttgcact ggattgcgag gctttgtgct tctctggagt gcgacaggtt tgatgacaaa 27540 aaattagcgc aagaagacaa aaatcacctt gcgctaatgc tctgttacag gtcactaata 27600 ccatctaagt agttgattca tagtgactgc atatgttgtg ttttacagta ttatgtagtc 27660 tgttttttat gcaaaatcta atttaatata ttgatattta tatcatttta cgtttctcgt 27720 tcagcttttt tatactaagt tggcattata aaaaagcatt gcttatcaat ttgttgcaac 27780 gaacaggtca ctatcagtca aaataaaatc attatttgat ttcaattttg tcccactccc 27840 tgcctctgtc atcacgatac tgtgatgcca tggtgtccga cttatgcccg agaagatgtt 27900 gagcaaactt atcgcttatc tgcttctcat agagtcttgc agacaaactg cgcaactcgt 27960 gaaaggtagg cggatcccct tcgaaggaaa gacctgatgc ttttcgtgcg cgcataaaat 28020 accttgatac tgtgccggat gaaagcggtt cgcgacgagt agatgcaatt atggtttctc 28080 cgccaagaat ctctttgcat ttatcaagtg tttccttcat tgatattccg agagcatcaa 28140 tatgcaatgc tgttgggatg gcaattttta cgcctgtttt gctttgctcg acataaagat 28200 atccatctac gatatcagac cacttcattt cgcataaatc accaactcgt tgcccggtaa 28260 caacagccag ttccattgca agtctgagcc aacatggtga tgattctgct gcttgataaa 28320 ttttcaggta ttcgtcagcc gtaagtcttg atctccttac ctctgatttt gctgcgcgag 28380 tggcagcgac atggtttgtt gttatatggc cttcagctat tgcctctcgg aatgcatcgc 28440 tcagtgttga tctgattaac ttggctgacg ccgccttgcc ctcgtctatg tatccattga 28500 gcattgccgc aatttctttt gtggtgatgt cttcaagtgg agcatcaggc agacccctcc 28560 ttattgcttt aattttgctc atgtaattta tgagtgtctt ctgcttgatt cctctgctgg 28620 ccaggatttt ttcgtagcga tcaagccatg aatgtaacgt aacggaatta tcactgttga 28680 ttctcgctgt cagaggcttg tgtttgtgtc ctgaaaataa ctcaatgttg gcctgtatag 28740 cttcagtgat tgcgattcgc ctgtctctgc ctaatccaaa ctctttaccc gtccttgggt 28800 ccctgtagca gtaatatcca ttgtttctta tataaaggtt agggggtaaa tcccggcgct 28860 catgacttcg ccttcttccc atttctgatc ctcttcaaaa ggccacctgt tactggtcga 28920 tttaagtcaa cctttaccgc tgattcgtgg aacagatact ctcttccatc cttaaccgga 28980 ggtgggaata tcctgcattc ccgaacccat cgacgaactg tttcaaggct tcttggacgt 29040 cgctggcgtg cgttccactc ctgaagtgtc aagtacatcg caaagtctcc gcaattacac 29100 gcaagaaaaa accgccatca ggcggcttgg tgttctttca gttcttcaat tcgaatattg 29160 gttacgtctg catgtgctat ctgcgcccat atcatccagt ggtcgtagca gtcgttgatg 29220 ttctccgctt cgataactct gttgaatggc tctccattcc attctcctgt gactcggaag 29280 tgcatttatc atctccataa aacaaaaccc gccgtagcga gttcagataa aataaatccc 29340 cgcgagtgcg aggattgtta tgtaatattg ggtttaatca tctatatgtt ttgtacagag 29400 agggcaagta tcgtttccac cgtactcgtg ataataattt tgcacggtat cagtcatttc 29460 tcgcacattg cagaatgggg atttgtcttc attagactta taaaccttca tggaatattt 29520 gtatgccgac tctatatcta taccttcatc tacataaaca ccttcgtgat gtctgcatgg 29580 agacaagaca ccggatctgc acaacattga taacgcccaa tctttttgct cagactctaa 29640 ctcattgata ctcatttata aactccttgc aatgtatgtc gtttcagcta aacggtatca 29700 gcaatgttta tgtaaagaaa cagtaagata atactcaacc cgatgtttga gtacggtcat 29760 catctgacac tacagactct ggcatcgctg tgaagacgac gcgaaattca gcattttcac 29820 aagcgttatc ttttacaaaa ccgatctcac tctcctttga tgcgaatgcc agcgtcagac 29880 atcatatgca gatactcacc tgcatcctga acccattgac ctccaacccc gtaatagcga 29940 tgcgtaatga tgtcgatagt tactaacggg tcttgttcga ttaactgccg cagaaactct 30000 tccaggtcac cagtgcagtg cttgataaca ggagtcttcc caggatggcg aacaacaaga 30060 aactggtttc cgtcttcacg gacttcgttg ctttccagtt tagcaatacg cttactccca 30120 tccgagataa caccttcgta atactcacgc tgctcgttga gttttgattt tgctgtttca 30180 agctcaacac gcagtttccc tactgttagc gcaatatcct cgttctcctg gtcgcggcgt 30240 ttgatgtatt gctggtttct ttcccgttca tccagcagtt ccagcacaat cgatggtgtt 30300 accaattcat ggaaaaggtc tgcgtcaaat ccccagtcgt catgcattgc ctgctctgcc 30360 gcttcacgca gtgcctgaga gttaatttcg ctcacttcga acctctctgt ttactgataa 30420 gttccagatc ctcctggcaa cttgcacaag tccgacaacc ctgaacgacc aggcgtcttc 30480 gttcatctat cggatcgcca cactcacaac aatgagtggc agatatagcc tggtggttca 30540 ggcggcgcat ttttattgct gtgttgcgct gtaattcttc tatttctgat gctgaatcaa 30600 tgatgtctgc catctttcat taatccctga actgttggtt aatacgcttg agggtgaatg 30660 cgaataataa aaaaggagcc tgtagctccc tgatgatttt gcttttcatg ttcatcgttc 30720 cttaaagacg ccgtttaaca tgccgattgc caggcttaaa tgagtcggtg tgaatcccat 30780 cagcgttacc gtttcgcggt gcttcttcag tacgctacgg caaatgtcat cgacgttttt 30840 atccggaaac tgctgtctgg ctttttttga tttcagaatt agcctgacgg gcaatgctgc 30900 gaagggcgtt ttcctgctga ggtgtcattg aacaagtccc atgtcggcaa gcataagcac 30960 acagaatatg aagcccgctg ccagaaaaat gcattccgtg gttgtcatac ctggtttctc 31020 tcatctgctt ctgctttcgc caccatcatt tccagctttt gtgaaaggga tgcggctaac 31080 gtatgaaatt cttcgtctgt ttctactggt attggcacaa acctgattcc aatttgagca 31140 aggctatgtg ccatctcgat actcgttctt aactcaacag aagatgcttt gtgcatacag 31200 cccctcgttt attatttatc tcctcagcca gccgctgtgc tttcagtgga tttcggataa 31260 cagaaaggcc gggaaatacc cagcctcgct ttgtaacgga gtagacgaaa gtgattgcgc 31320 ctacccggat attatcgtga ggatgcgtca tcgccattgc tccccaaata caaaaccaat 31380 ttcagccagt gcctcgtcca ttttttcgat gaactccggc acgatctcgt caaaactcgc 31440 catgtacttt tcatcccgct caatcacgac ataatgcagg ccttcacgct tcatacgcgg 31500 gtcatagttg gcaaagtacc aggcattttt tcgcgtcacc cacatgctgt actgcacctg 31560 ggccatgtaa gctgacttta tggcctcgaa accaccgagc cggaacttca tgaaatcccg 31620 ggaggtaaac gggcatttca gttcaaggcc gttgccgtca ctgcataaac catcgggaga 31680 gcaggcggta cgcatacttt cgtcgcgata gatgatcggg gattcagtaa cattcacgcc 31740 ggaagtgaat tcaaacaggg ttctggcgtc gttctcgtac tgttttcccc aggccagtgc 31800 tttagcgtta acttccggag ccacaccggt gcaaacctca gcaagcaggg tgtggaagta 31860 ggacattttc atgtcaggcc acttctttcc ggagcggggt tttgctatca cgttgtgaac 31920 ttctgaagcg gtgatgacgc cgagccgtaa tttgtgccac gcatcatccc cctgttcgac 31980 agctctcaca tcgatcccgg tacgctgcag gataatgtcc ggtgtcatgc tgccaccttc 32040 tgctctgcgg ctttctgttt caggaatcca agagctttta ctgcttcggc ctgtgtcagt 32100 tctgacgatg cacgaatgtc gcggcgaaat atctgggaac agagcggcaa taagtcgtca 32160 tcccatgttt tatccagggc gatcagcaga gtgttaatct cctgcatggt ttcatcgtta 32220 accggagtga tgtcgcgttc cggctgacgt tctgcagtgt atgcagtatt ttcgacaatg 32280 cgctcggctt catccttgtc atagatacca gcaaatccga aggccagacg ggcacactga 32340 atcatggctt tatgacgtaa catccgtttg ggatgcgact gccacggccc cgtgatttct 32400 ctgccttcgc gagttttgaa tggttcgcgg cggcattcat ccatccattc ggtaacgcag 32460 atcggatgat tacggtcctt gcggtaaatc cggcatgtac aggattcatt gtcctgctca 32520 aagtccatgc catcaaactg ctggttttca ttgatgatgc gggaccagcc atcaacgccc 32580 accaccggaa cgatgccatt ctgcttatca ggaaaggcgt aaatttcttt cgtccacgga 32640 ttaaggccgt actggttggc aacgatcagt aatgcgatga actgcgcatc gctggcatca 32700 cctttaaatg ccgtctggcg aagagtggtg atcagttcct gtgggtcgac agaatccatg 32760 ccgacacgtt cagccagctt cccagccagc gttgcgagtg cagtactcat tcgttttata 32820 cctctgaatc aatatcaacc tggtggtgag caatggtttc aaccatgtac cggatgtgtt 32880 ctgccatgcg ctcctgaaac tcaacatcgt catcaaacgc acgggtaatg gattttttgc 32940 tggccccgtg gcgttgcaaa tgatcgatgc atagcgattc aaacaggtgc tggggcaggc 33000 ctttttccat gtcgtctgcc agttctgcct ctttctcttc acgggcgagc tgctggtagt 33060 gacgcgccca gctctgagcc tcaagacgat cctgaatgta ataagcgttc atggctgaac 33120 tcctgaaata gctgtgaaaa tatcgcccgc gaaatgccgg gctgattagg aaaacaggaa 33180 agggggttag tgaatgcttt tgcttgatct cagtttcagt attaatatcc attttttata 33240 agcgtcgacg gcttcacgaa acatcttttc atcgccaata aaagtggcga tagtgaattt 33300 agtctggata gccataagtg tttgatccat tctttgggac tcctggctga ttaagtatgt 33360 cgataaggcg tttccatccg tcacgtaatt tacgggtgat tcgttcaagt aaagattcgg 33420 aagggcagcc agcaacaggc caccctgcaa tggcatattg catggtgtgc tccttattta 33480 tacataacga aaaacgcctc gagtgaagcg ttattggtat gcggtaaaac cgcactcagg 33540 cggccttgat agtcatatca tctgaatcaa atattcctga tgtatcgata tcggtaattc 33600 ttattccttc gctaccatcc attggaggcc atccttcctg accatttcca tcattccagt 33660 cgaactcaca cacaacacca tatgcattta agtcgcttga aattgctata agcagagcat 33720 gttgcgccag catgattaat acagcattta atacagagcc gtgtttattg agtcggtatt 33780 cagagtctga ccagaaatta ttaatctggt gaagtttttc ctctgtcatt acgtcatggt 33840 cgatttcaat ttctattgat gctttccagt cgtaatcaat gatgtatttt ttgatgtttg 33900 acatctgttc atatcctcac agataaaaaa tcgccctcac actggagggc aaagaagatt 33960 tccaataatc agaacaagtc ggctcctgtt tagttacgag cgacattgct ccgtgtattc 34020 actcgttgga atgaatacac agtgcagtgt ttattctgtt atttatgcca aaaataaagg 34080 ccactatcag gcagctttgt tgttctgttt accaagttct ctggcaatca ttgccgtcgt 34140 tcgtattgcc catttatcga catatttccc atcttccatt acaggaaaca tttcttcagg 34200 cttaaccatg cattccgatt gcagcttgca tccattgcat cgcttgaatt gtccacacca 34260 ttgattttta tcaatagtcg tagtcatacg gatagtcctg gtattgttcc atcacatcct 34320 gaggatgctc ttcgaactct tcaaattctt cttccatata tcaccttaaa tagtggattg 34380 cggtagtaaa gattgtgcct gtcttttaac cacatcaggc tcggtggttc tcgtgtaccc 34440 ctacagcgag aaatcggata aactattaca acccctacag tttgatgagt atagaaatgg 34500 atccactcgt tattctcgga cgagtgttca gtaatgaacc tctggagaga accatgtata 34560 tgatcgttat ctgggttgga cttctgcttt taagcccaga taactggcct gaatatgtta 34620 atgagagaat cggtattcct catgtgtggc atgttttcgt ctttgctctt gcattttcgc 34680 tagcaattaa tgtgcatcga ttatcagcta ttgccagcgc cagatataag cgatttaagc 34740 taagaaaacg cattaagatg caaaacgata aagtgcgatc agtaattcaa aaccttacag 34800 aagagcaatc tatggttttg tgcgcagccc ttaatgaagg caggaagtat gtggttacat 34860 caaaacaatt cccatacatt agtgagttga ttgagcttgg tgtgttgaac aaaacttttt 34920 cccgatggaa tggaaagcat atattattcc ctattgagga tatttactgg actgaattag 34980 ttgccagcta tgatccatat aatattgaga taaagccaag gccaatatct aagtaactag 35040 ataagaggaa tcgattttcc cttaattttc tggcgtccac tgcatgttat gccgcgttcg 35100 ccaggcttgc tgtaccatgt gcgctgattc ttgcgctcaa tacgttgcag gttgctttca 35160 atctgtttgt ggtattcagc cagcactgta aggtctatcg gatttagtgc gctttctact 35220 cgtgatttcg gtttgcgatt cagcgagaga atagggcggt taactggttt tgcgcttacc 35280 ccaaccaaca ggggatttgc tgctttccat tgagcctgtt tctctgcgcg acgttcgcgg 35340 cggcgtgttt gtgcatccat ctggattctc ctgtcagtta gctttggtgg tgtgtggcag 35400 ttgtagtcct gaacgaaaac cccccgcgat tggcacattg gcagctaatc cggaatcgca 35460 cttacggcca atgcttcgtt tcgtatcaca caccccaaag ccttctgctt tgaatgctgc 35520 ccttcttcag ggcttaattt ttaagagcgt caccttcatg gtggtcagtg cgtcctgctg 35580 atgtgctcag tatcaccgcc agtggtattt atgtcaacac cgccagagat aatttatcac 35640 cgcagatggt tatctgtatg ttttttatat gaatttattt tttgcagggg ggcattgttt 35700 ggtaggtgag agatctgaat tgctatgttt agtgagttgt atctatttat ttttcaataa 35760 atacaattgg ttatgtgttt tgggggcgat cgtgaggcaa agaaaacccg gcgctgaggc 35820 cgggttattc ttgttctctg gtcaaattat atagttggaa aacaaggatg catatatgaa 35880 tgaacgatgc agaggcaatg ccgatggcga tagtgggtat catgtagccg cttatgctgg 35940 aaagaagcaa taacccgcag aaaaacaaag ctccaagctc aacaaaacta agggcataga 36000 caataactac cgatgtcata tacccatact ctctaatctt ggccagtcgg cgcgttctgc 36060 ttccgattag aaacgtcaag gcagcaatca ggattgcaat catggttcct gcatatgatg 36120 acaatgtcgc cccaagacca tctctatgag ctgaaaaaga aacaccagga atgtagtggc 36180 ggaaaaggag atagcaaatg cttacgataa cgtaaggaat tattactatg taaacaccag 36240 gcatgattct gttccgcata attactcctg ataattaatc cttaactttg cccacctgcc 36300 ttttaaaaca ttccagtata tcacttttca ttcttgcgta gcaatatgcc atctcttcag 36360 ctatctcagc attggtgacc ttgttcagag gcgctgagag atggcctttt tctgatagat 36420 aatgttctgt taaaatatct ccggcctcat cttttgcccg caggctaatg tctgaaaatt 36480 gaggtgacgg gttaaaaata atatccttgg caaccttttt tatatccctt ttaaattttg 36540 gcttaatgac tatatccaat gagtcaaaaa gctccccttc aatatctgtt gcccctaaga 36600 cctttaatat atcgccaaat acaggtagct tggcttctac cttcaccgtt gttcggccga 36660 tgaaatgcat atgcataaca tcgtctttgg tggttcccct catcagtggc tctatctgaa 36720 cgcgctctcc actgcttaat gacattcctt tcccgattaa aaaatctgtc agatcggatg 36780 tggtcggccc gaaaacagtt ctggcaaaac caatggtgtc gccttcaaca aacaaaaaag 36840 atgggaatcc caatgattcg tcatctgcga ggctgttctt aatatcttca actgaagctt 36900 tagagcgatt tatcttctga accagactct tgtcatttgt tttggtaaag agaaaagttt 36960 ttccatcgat tttatgaata tacaaataat tggagccaac ctgcaggtga tgattatcag 37020 ccagcagaga attaaggaaa acagacaggt ttattgagcg cttatctttc cctttatttt 37080 tgctgcggta agtcgcataa aaaccattct tcataattca atccatttac tatgttatgt 37140 tctgagggga gtgaaaattc ccctaattcg atgaagattc ttgctcaatt gttatcagct 37200 atgcgccgac cagaacacct tgccgatcag ccaaacgtct cttcaggcca ctgactagcg 37260 ataactttcc ccacaacgga acaactctca ttgcatggga tcattgggta ctgtgggttt 37320 agtggttgta aaaacacctg accgctatcc ctgatcagtt tcttgaaggt aaactcatca 37380 cccccaagtc tggctatgca gaaatcacct ggctcaacag cctgctcagg gtcaacgaga 37440 attaacattc cgtcaggaaa gcttggcttg gagcctgttg gtgcggtcat ggaattacct 37500 tcaacctcaa gccagaatgc agaatcactg gcttttttgg ttgtgcttac ccatctctcc 37560 gcatcacctt tggtaaaggt tctaagctta ggtgagaaca tccctgcctg aacatgagaa 37620 aaaacagggt actcatactc acttctaagt gacggctgca tactaaccgc ttcatacatc 37680 tcgtagattt ctctggcgat tgaagggcta aattcttcaa cgctaacttt gagaattttt 37740 gtaagcaatg cggcgttata agcatttaat gcattgatgc cattaaataa agcaccaacg 37800 cctgactgcc ccatccccat cttgtctgcg acagattcct gggataagcc aagttcattt 37860 ttcttttttt cataaattgc tttaaggcga cgtgcgtcct caagctgctc ttgtgttaat 37920 ggtttctttt ttgtgctcat acgttaaatc tatcaccgca agggataaat atctaacacc 37980 gtgcgtgttg actattttac ctctggcggt gataatggtt gcatgtacta aggaggttgt 38040 atggaacaac gcataaccct gaaagattat gcaatgcgct ttgggcaaac caagacagct 38100 aaagatctcg gcgtatatca aagcgcgatc aacaaggcca ttcatgcagg ccgaaagatt 38160 tttttaacta taaacgctga tggaagcgtt tatgcggaag aggtaaagcc cttcccgagt 38220 aacaaaaaaa caacagcata aataaccccg ctcttacaca ttccagccct gaaaaagggc 38280 atcaaattaa accacaccta tggtgtatgc atttatttgc atacattcaa tcaattgtta 38340 tctaaggaaa tacttacata tggttcgtgc aaacaaacgc aacgaggctc tacgaatcga 38400 gagtgcgttg cttaacaaaa tcgcaatgct tggaactgag aagacagcgg aagctgtggg 38460 cgttgataag tcgcagatca gcaggtggaa gagggactgg attccaaagt tctcaatgct 38520 gcttgctgtt cttgaatggg gggtcgttga cgacgacatg gctcgattgg cgcgacaagt 38580 tgctgcgatt ctcaccaata aaaaacgccc ggcggcaacc gagcgttctg aacaaatcca 38640 gatggagttc tgaggtcatt actggatcta tcaacaggag tcattatgac aaatacagca 38700 aaaatactca acttcggcag aggtaacttt gccggacagg agcgtaatgt ggcagatctc 38760 gatgatggtt acgccagact atcaaatatg ctgcttgagg cttattcggg cgcagatctg 38820 accaagcgac agtttaaagt gctgcttgcc attctgcgta aaacctatgg gtggaataaa 38880 ccaatggaca gaatcaccga ttctcaactt agcgagatta caaagttacc tgtcaaacgg 38940 tgcaatgaag ccaagttaga actcgtcaga atgaatatta tcaagcagca aggcggcatg 39000 tttggaccaa ataaaaacat ctcagaatgg tgcatccctc aaaacgaggg aaaatcccct 39060 aaaacgaggg ataaaacatc cctcaaattg ggggattgct atccctcaaa acagggggac 39120 acaaaagaca ctattacaaa agaaaaaaga aaagattatt cgtcagagaa ttctggcgaa 39180 tcctctgacc agccagaaaa cgacctttct gtggtgaaac cggatgctgc aattcagagc 39240 ggcagcaagt gggggacagc agaagacctg accgccgcag agtggatgtt tgacatggtg 39300 aagactatcg caccatcagc cagaaaaccg aattttgctg ggtgggctaa cgatatccgc 39360 ctgatgcgtg aacgtgacgg acgtaaccac cgcgacatgt gtgtgctgtt ccgctgggca 39420 tgccaggaca acttctggtc cggtaacgtg ctgagcccgg ccaaactccg cgataagtgg 39480 acccaactcg aaatcaaccg taacaagcaa caggcaggcg tgacagccag caaaccaaaa 39540 ctcgacctga caaacacaga ctggatttac ggggtggatc tatgaaaaac atcgccgcac 39600 agatggttaa ctttgaccgt gagcagatgc gtcggatcgc caacaacatg ccggaacagt 39660 acgacgaaaa gccgcaggta cagcaggtag cgcagatcat caacggtgtg ttcagccagt 39720 tactggcaac tttcccggcg agcctggcta accgtgacca gaacgaagtg aacgaaatcc 39780 gtcgccagtg ggttctggct tttcgggaaa acgggatcac cacgatggaa caggttaacg 39840 caggaatgcg cgtagcccgt cggcagaatc gaccatttct gccatcaccc gggcagtttg 39900 ttgcatggtg ccgggaagaa gcatccgtta ccgccggact gccaaacgtc agcgagctgg 39960 ttgatatggt ttacgagtat tgccggaagc gaggcctgta tccggatgcg gagtcttatc 40020 cgtggaaatc aaacgcgcac tactggctgg ttaccaacct gtatcagaac atgcgggcca 40080 atgcgcttac tgatgcggaa ttacgccgta aggccgcaga tgagcttgtc catatgactg 40140 cgagaattaa ccgtggtgag gcgatccctg aaccagtaaa acaacttcct gtcatgggcg 40200 gtagacctct aaatcgtgca caggctctgg cgaagatcgc agaaatcaaa gctaagttcg 40260 gactgaaagg agcaagtgta tgacgggcaa agaggcaatt attcattacc tggggacgca 40320 taatagcttc tgtgcgccgg acgttgccgc gctaacaggc gcaacagtaa ccagcataaa 40380 tcaggccgcg gctaaaatgg cacgggcagg tcttctggtt atcgaaggta aggtctggcg 40440 aacggtgtat taccggtttg ctaccaggga agaacgggaa ggaaagatga gcacgaacct 40500 ggtttttaag gagtgtcgcc agagtgccgc gatgaaacgg gtattggcgg tatatggagt 40560 taaaagatga ccatctacat tactgagcta ataacaggcc tgctggtaat cgcaggcctt 40620 tttatttggg ggagagggaa gtcatgaaaa aactaacctt tgaaattcga tctccagcac 40680 atcagcaaaa cgctattcac gcagtacagc aaatccttcc agacccaacc aaaccaatcg 40740 tagtaaccat tcaggaacgc aaccgcagct tagaccaaaa caggaagcta tgggcctgct 40800 taggtgacgt ctctcgtcag gttgaatggc atggtcgctg gctggatgca gaaagctgga 40860 agtgtgtgtt taccgcagca ttaaagcagc aggatgttgt tcctaacctt gccgggaatg 40920 gctttgtggt aataggccag tcaaccagca ggatgcgtgt aggcgaattt gcggagctat 40980 tagagcttat acaggcattc ggtacagagc gtggcgttaa gtggtcagac gaagcgagac 41040 tggctctgga gtggaaagcg agatggggag acagggctgc atgataaatg tcgttagttt 41100 ctccggtggc aggacgtcag catatttgct ctggctaatg gagcaaaagc gacgggcagg 41160 taaagacgtg cattacgttt tcatggatac aggttgtgaa catccaatga catatcggtt 41220 tgtcagggaa gttgtgaagt tctgggatat accgctcacc gtattgcagg ttgatatcaa 41280 cccggagctt ggacagccaa atggttatac ggtatgggaa ccaaaggata ttcagacgcg 41340 aatgcctgtt ctgaagccat ttatcgatat ggtaaagaaa tatggcactc catacgtcgg 41400 cggcgcgttc tgcactgaca gattaaaact cgttcccttc accaaatact gtgatgacca 41460 tttcgggcga gggaattaca ccacgtggat tggcatcaga gctgatgaac cgaagcggct 41520 aaagccaaag cctggaatca gatatcttgc tgaactgtca gactttgaga aggaagatat 41580 cctcgcatgg tggaagcaac aaccattcga tttgcaaata ccggaacatc tcggtaactg 41640 catattctgc attaaaaaat caacgcaaaa aatcggactt gcctgcaaag atgaggaggg 41700 attgcagcgt gtttttaatg aggtcatcac gggatcccat gtgcgtgacg gacatcggga 41760 aacgccaaag gagattatgt accgaggaag aatgtcgctg gacggtatcg cgaaaatgta 41820 ttcagaaaat gattatcaag ccctgtatca ggacatggta cgagctaaaa gattcgatac 41880 cggctcttgt tctgagtcat gcgaaatatt tggagggcag cttgatttcg acttcgggag 41940 ggaagctgca tgatgcgatg ttatcggtgc ggtgaatgca aagaagataa ccgcttccga 42000 ccaaatcaac cttactggaa tcgatggtgt ctccggtgtg aaagaacacc aacaggggtg 42060 ttaccactac cgcaggaaaa ggaggacgtg tggcgagaca gcgacgaagt atcaccgaca 42120 taatctgcga aaactgcaaa taccttccaa cgaaacgcac cagaaataaa cccaagccaa 42180 tcccaaaaga atctgacgta aaaaccttca actacacggc tcacctgtgg gatatccggt 42240 ggctaagacg tcgtgcgagg aaaacaaggt gattgaccaa aatcgaagtt acgaacaaga 42300 aagcgtcgag cgagctttaa cgtgcgctaa ctgcggtcag aagctgcatg tgctggaagt 42360 tcacgtgtgt gagcactgct gcgcagaact gatgagcgat ccgaatagct cgatgcacga 42420 ggaagaagat gatggctaaa ccagcgcgaa gacgatgtaa aaacgatgaa tgccgggaat 42480 ggtttcaccc tgcattcgct aatcagtggt ggtgctctcc agagtgtgga accaagatag 42540 cactcgaacg acgaagtaaa gaacgcgaaa aagcggaaaa agcagcagag aagaaacgac 42600 gacgagagga gcagaaacag aaagataaac ttaagattcg aaaactcgcc ttaaagcccc 42660 gcagttactg gattaaacaa gcccaacaag ccgtaaacgc cttcatcaga gaaagagacc 42720 gcgacttacc atgtatctcg tgcggaacgc tcacgtctgc tcagtgggat gccggacatt 42780 accggacaac tgctgcggca cctcaactcc gatttaatga acgcaatatt cacaagcaat 42840 gcgtggtgtg caaccagcac aaaagcggaa atctcgttcc gtatcgcgtc gaactgatta 42900 gccgcatcgg gcaggaagca gtagacgaaa tcgaatcaaa ccataaccgc catcgctgga 42960 ctatcgaaga gtgcaaggcg atcaaggcag agtaccaaca gaaactcaaa gacctgcgaa 43020 atagcagaag tgaggccgca tgacgttctc agtaaaaacc attccagaca tgctcgttga 43080 aacatacgga aatcagacag aagtagcacg cagactgaaa tgtagtcgcg gtacggtcag 43140 aaaatacgtt gatgataaag acgggaaaat gcacgccatc gtcaacgacg ttctcatggt 43200 tcatcgcgga tggagtgaaa gagatgcgct attacgaaaa aattgatggc agcaaatacc 43260 gaaatatttg ggtagttggc gatctgcacg gatgctacac gaacctgatg aacaaactgg 43320 atacgattgg attcgacaac aaaaaagacc tgcttatctc ggtgggcgat ttggttgatc 43380 gtggtgcaga gaacgttgaa tgcctggaat taatcacatt cccctggttc agagctgtac 43440 gtggaaacca tgagcaaatg atgattgatg gcttatcaga gcgtggaaac gttaatcact 43500 ggctgcttaa tggcggtggc tggttcttta atctcgatta cgacaaagaa attctggcta 43560 aagctcttgc ccataaagca gatgaacttc cgttaatcat cgaactggtg agcaaagata 43620 aaaaatatgt tatctgccac gccgattatc cctttgacga atacgagttt ggaaagccag 43680 ttgatcatca gcaggtaatc tggaaccgcg aacgaatcag caactcacaa aacgggatcg 43740 tgaaagaaat caaaggcgcg gacacgttca tctttggtca tacgccagca gtgaaaccac 43800 tcaagtttgc caaccaaatg tatatcgata ccggcgcagt gttctgcgga aacctaacat 43860 tgattcaggt acagggagaa ggcgcatgag actcgaaagc gtagctaaat ttcattcgcc 43920 aaaaagcccg atgatgagcg actcaccacg ggccacggct tctgactctc tttccggtac 43980 tgatgtgatg gctgctatgg ggatggcgca atcacaagcc ggattcggta tggctgcatt 44040 ctgcggtaag cacgaactca gccagaacga caaacaaaag gctatcaact atctgatgca 44100 atttgcacac aaggtatcgg ggaaataccg tggtgtggca aagcttgaag gaaatactaa 44160 ggcaaaggta ctgcaagtgc tcgcaacatt cgcttatgcg gattattgcc gtagtgccgc 44220 gacgccgggg gcaagatgca gagattgcca tggtacaggc cgtgcggttg atattgccaa 44280 aacagagctg tgggggagag ttgtcgagaa agagtgcgga agatgcaaag gcgtcggcta 44340 ttcaaggatg ccagcaagcg cagcatatcg cgctgtgacg atgctaatcc caaaccttac 44400 ccaacccacc tggtcacgca ctgttaagcc gctgtatgac gctctggtgg tgcaatgcca 44460 caaagaagag tcaatcgcag acaacatttt gaatgcggtc acacgttagc agcatgattg 44520 ccacggatgg caacatatta acggcatgat attgacttat tgaataaaat tgggtaaatt 44580 tgactcaacg atgggttaat tcgctcgttg tggtagtgag atgaaaagag gcggcgctta 44640 ctaccgattc cgcctagttg gtcacttcga cgtatcgtct ggaactccaa ccatcgcagg 44700 cagagaggtc tgcaaaatgc aatcccgaaa cagttcgcag gtaatagtta gagcctgcat 44760 aacggtttcg ggatttttta tatctgcaca acaggtaaga gcattgagtc gataatcgtg 44820 aagagtcggc gagcctggtt agccagtgct ctttccgttg tgctgaatta agcgaatacc 44880 ggaagcagaa ccggatcacc aaatgcgtac aggcgtcatc gccgcccagc aacagcacaa 44940 cccaaactga gccgtagcca ctgtctgtcc tgaattcatt agtaatagtt acgctgcggc 45000 cttttacaca tgaccttcgt gaaagcgggt ggcaggaggt cgcgctaaca acctcctgcc 45060 gttttgcccg tgcatatcgg tcacgaacaa atctgattac taaacacagt agcctggatt 45120 tgttctatca gtaatcgacc ttattcctaa ttaaatagag caaatcccct tattgggggt 45180 aagacatgaa gatgccagaa aaacatgacc tgttggccgc cattctcgcg gcaaaggaac 45240 aaggcatcgg ggcaatcctt gcgtttgcaa tggcgtacct tcgcggcaga tataatggcg 45300 gtgcgtttac aaaaacagta atcgacgcaa cgatgtgcgc cattatcgcc tagttcattc 45360 gtgaccttct cgacttcgcc ggactaagta gcaatctcgc ttatataacg agcgtgttta 45420 tcggctacat cggtactgac tcgattggtt cgcttatcaa acgcttcgct gctaaaaaag 45480 ccggagtaga agatggtaga aatcaataat caacgtaagg cgttcctcga tatgctggcg 45540 tggtcggagg gaactgataa cggacgtcag aaaaccagaa atcatggtta tgacgtcatt 45600 gtaggcggag agctatttac tgattactcc gatcaccctc gcaaacttgt cacgctaaac 45660 ccaaaactca aatcaacagg cgccggacgc taccagcttc tttcccgttg gtgggatgcc 45720 taccgcaagc agcttggcct gaaagacttc tctccgaaaa gtcaggacgc tgtggcattg 45780 cagcagatta aggagcgtgg cgctttacct atgattgatc gtggtgatat ccgtcaggca 45840 atcgaccgtt gcagcaatat ctgggcttca ctgccgggcg ctggttatgg tcagttcgag 45900 cataaggctg acagcctgat tgcaaaattc aaagaagcgg gcggaacggt cagagagatt 45960 gatgtatgag cagagtcacc gcgattatct ccgctctggt tatctgcatc atcgtctgcc 46020 tgtcatgggc tgttaatcat taccgtgata acgccattac ctacaaagcc cagcgcgaca 46080 aaaatgccag agaactgaag ctggcgaacg cggcaattac tgacatgcag atgcgtcagc 46140 gtgatgttgc tgcgctcgat gcaaaataca cgaaggagtt agctgatgct aaagctgaaa 46200 atgatgctct gcgtgatgat gttgccgctg gtcgtcgtcg gttgcacatc aaagcagtct 46260 gtcagtcagt gcgtgaagcc accaccgcct ccggcgtgga taatgcagcc tccccccgac 46320 tggcagacac cgctgaacgg gattatttca ccctcagaga gaggctgatc actatgcaaa 46380 aacaactgga aggaacccag aagtatatta atgagcagtg cagatagagt tgcccatatc 46440 gatgggcaac tcatgcaatt attgtgagca atacacacgc gcttccagcg gagtataaat 46500 gcctaaagta ataaaaccga gcaatccatt tacgaatgtt tgctgggttt ctgttttaac 46560 aacattttct gcgccgccac aaattttggc tgcatcgaca gttttcttct gcccaattcc 46620 agaaacgaag aaatgatggg tgatggtttc ctttggtgct actgctgccg gtttgttttg 46680 aacagtaaac gtctgttgag cacatcctgt aataagcagg gccagcgcag tagcgagtag 46740 catttttttc atggtgttat tcccgatgct ttttgaagtt cgcagaatcg tatgtgtaga 46800 aaattaaaca aaccctaaac aatgagttga aatttcatat tgttaatatt tattaatgta 46860 tgtcaggtgc gatgaatcgt cattgtattc ccggattaac tatgtccaca gccctgacgg 46920 ggaacttctc tgcgggagtg tccgggaata attaaaacga tgcacacagg gtttagcgcg 46980 tacacgtatt gcattatgcc aacgccccgg tgctgacacg gaagaaaccg gacgttatga 47040 tttagcgtgg aaagatttgt gtagtgttct gaatgctctc agtaaatagt aatgaattat 47100 caaaggtata gtaatatctt ttatgttcat ggatatttgt aacccatcgg aaaactcctg 47160 ctttagcaag attttccctg tattgctgaa atgtgatttc tcttgatttc aacctatcat 47220 aggacgtttc tataagatgc gtgtttcttg agaatttaac atttacaacc tttttaagtc 47280 cttttattaa cacggtgtta tcgttttcta acacgatgtg aatattatct gtggctagat 47340 agtaaatata atgtgagacg ttgtgacgtt ttagttcaga ataaaacaat tcacagtcta 47400 aatcttttcg cacttgatcg aatatttctt taaaaatggc aacctgagcc attggtaaaa 47460 ccttccatgt gatacgaggg cgcgtagttt gcattatcgt ttttatcgtt tcaatctggt 47520 ctgacctcct tgtgttttgt tgatgattta tgtcaaatat taggaatgtt ttcacttaat 47580 agtattggtt gcgtaacaaa gtgcggtcct gctggcattc tggagggaaa tacaaccgac 47640 agatgtatgt aaggccaacg tgctcaaatc ttcatacaga aagatttgaa gtaatatttt 47700 aaccgctaga tgaagagcaa gcgcatggag cgacaaaatg aataaagaac aatctgctga 47760 tgatccctcc gtggatctga ttcgtgtaaa aaatatgctt aatagcacca tttctatgag 47820 ttaccctgat gttgtaattg catgtataga acataaggtg tctctggaag cattcagagc 47880 aattgaggca gcgttggtga agcacgataa taatatgaag gattattccc tggtggttga 47940 ctgatcacca taactgctaa tcattcaaac tatttagtct gtgacagagc caacacgcag 48000 tctgtcactg tcaggaaagt ggtaaaactg caactcaatt actgcaatgc cctcgtaatt 48060 aagtgaattt acaatatcgt cctgttcgga gggaagaacg cgggatgttc attcttcatc 48120 acttttaatt gatgtatatg ctctcttttc tgacgttagt ctccgacggc aggcttcaat 48180 gacccaggct gagaaattcc cggacccttt ttgctcaaga gcgatgttaa tttgttcaat 48240 catttggtta ggaaagcgga tgttgcgggt tgttgttctg cgggttctgt tcttcgttga 48300 catgaggttg ccccgtattc agtgtcgctg atttgtattg tctgaagttg tttttacgtt 48360 aagttgatgc agatcaatta atacgatacc tgcgtcataa ttgattattt gacgtggttt 48420 gatggcctcc acgcacgttg tgatatgtag atgataatca ttatcacttt acgggtcctt 48480 tccggtgatc cgacaggtta cg 48502 <210> 14 <211> 77 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Examples 2 and 3 <400> 14 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt ggttgtttct 60 gttggtgctg atattgc 77 <210> 15 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Examples 2 and 3 <400> 15 gttttcgcat ttatcgtgaa acgctttcgc gtttttcgtg cgccgcttca 50 <210> 16 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Examples 2 and 3 <400> 16 gcaatatcag caccaacaga aacaacctt 29 <210> 17 <211> 970 <212> PRT <213> Citromicrobium bathyomarinum <400> 17 Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr 1 5 10 15 Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly 20 25 30 Gln Trp Ile Gly Asp Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val 35 40 45 Glu Ala Arg Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly 50 55 60 Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu 65 70 75 80 Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys 85 90 95 Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Val Glu Ala Leu 100 105 110 His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Val Val Glu Lys Gly 115 120 125 Met Val Val Thr Gln Ala Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln 130 135 140 His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val 145 150 155 160 Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys 165 170 175 Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met 180 185 190 Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro 195 200 205 Val Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Ser Arg Glu Gln 210 215 220 Val Met Ala Phe Ser Thr Arg Arg Lys Glu Val Leu Glu Ala Arg Arg 225 230 235 240 Gly Pro Gly Leu Asp Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala 245 250 255 Ser Lys Glu Gly Ile Glu Asp Arg Ala Thr Leu Ser Lys Gln Trp Ser 260 265 270 Glu Ala Ala Gln Ser Ile Gly Leu Asp Leu Lys Pro Leu Val Asp Arg 275 280 285 Ala Arg Thr Lys Ala Leu Gly Gln Gly Met Glu Ala Thr Arg Ile Gly 290 295 300 Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Ser Arg Phe Ala Ala His 305 310 315 320 Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Pro Ser Val Leu Lys 325 330 335 Gln Asp Arg Gln Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val 340 345 350 Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr 355 360 365 Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Ile Ala Asp Val Glu 370 375 380 Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Lys 385 390 395 400 Gly Glu His Lys Gly Trp Leu Ala Ser Arg Asp Ala Val Val Thr Glu 405 410 415 Gln Arg Ile Leu Ser Glu Val Ala Ala Gly Lys Gly Asp Ser Ser Pro 420 425 430 Ala Ile Thr Pro Gln Lys Ala Ala Ala Ser Val Gln Ala Ala Ala Leu 435 440 445 Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Ala Ala Ala Arg 450 455 460 Leu Ile Leu Ile Ser Lys Asp Arg Thr Ile Ala Val Gln Gly Ile Ala 465 470 475 480 Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg 485 490 495 Asp Glu Gly His Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val 500 505 510 Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg 515 520 525 Phe Leu Gly Gly Trp Asn Lys Leu Leu Asp Asp Pro Gly Asn Val Ala 530 535 540 Leu Arg Ala Glu Ala Gln Ala Ser Leu Lys Asp His Val Leu Val Leu 545 550 555 560 Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg 565 570 575 Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Ile Gly Asp Arg 580 585 590 Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln 595 600 605 Arg Ala Gly Ile Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg 610 615 620 Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Asp Val 625 630 635 640 Arg Lys Ala Leu Arg His Leu Lys Ser His Thr Val Glu Ala Arg Gly 645 650 655 Asp Gly Ala Gln Val Ala Ala Glu Thr Trp Leu Ala Leu Asp Lys Glu 660 665 670 Thr Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser 675 680 685 Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Ser Arg Glu Ile 690 695 700 Gly Pro Ala Lys Met Lys Leu Glu Val Leu Asp Arg Val Asn Thr Thr 705 710 715 720 Arg Glu Glu Leu Arg His Leu Pro Ala Tyr Arg Ala Gly Arg Val Leu 725 730 735 Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Phe Ile Gly Glu Tyr 740 745 750 Arg Val Ile Gly Gln Asp Arg Lys Gly Lys Leu Val Glu Val Glu Asp 755 760 765 Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly 770 775 780 Lys Gly Asp Asp Asn Leu Thr Leu Leu Glu Pro Arg Lys Leu Glu Ile 785 790 795 800 His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly 805 810 815 Leu Phe Asn Ala Asp Gln Ala Arg Val Val Glu Ile Ala Asn Gly Lys 820 825 830 Val Thr Phe Glu Thr Ser Lys Gly Asp Leu Val Glu Leu Lys Lys Asp 835 840 845 Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Val His 850 855 860 Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser 865 870 875 880 Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Val Thr 885 890 895 Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ala Asp Lys Leu 900 905 910 Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Ile Glu 915 920 925 Val Thr Gly Ser Val Lys Pro Thr Ala Thr Lys Gly Ser Gly Val Asp 930 935 940 Gln Pro Lys Ser Val Glu Ala Asn Lys Ala Glu Lys Glu Leu Thr Arg 945 950 955 960 Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile 965 970 <210> 18 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 3 <220> <221> modified_base <222> (1)..(5) <223> n is I <400> 18 nnnnntgaag cggcgcacga aaaacgcgaa agcgtttcac gataaatgcg aaaac 55 <210> 19 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 2 <400> 19 gatcugaagc ggcgcacgaa aaacgcgaaa gcgtttcacg ataaatgcga aaac 54 <210> 20 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 2 <400> 20 gaagcggcgc acgaaaaacg cgaaagcgtt tcacgataaa tgcgaaaac 49 <210> 21 <400> 21 000 <210> 22 <400> 22 000 <210> 23 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 4 <400> 23 tttttttttt tttttttttt tttttttttt tttttttttt ttttttggtt gtttctgttg 60 gtgctgatat tgc 73 <210> 24 <211> 606 <212> DNA <213> Artificial Sequence <220> <223> Polynucelotide sequence used in Example 9 <400> 24 gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60 tttttgacgc tcagtaatgt gacgatagct gaaaactgta cgataaacgg tacgctgagg 120 gcggaaaaaa tcgtcgggga cattgtaaag gcggcgagcg cggcttttcc gcgccagcgt 180 gaaagcagtg tggactggcc gtcaggtacc cgtactgtca ccgtgaccga tgaccatcct 240 tttgatcgcc agatagtggt gcttccgctg acgtttcgcg gaagtaagcg tactgtcagc 300 ggcaggacaa cgtattcgat gtgttatctg aaagtactga tgaacggtgc ggtgatttat 360 gatggcgcgg cgaacgaggc ggtacaggtg ttctcccgta ttgttgacat gccagcgggt 420 cggggaaacg tgatcctgac gttcacgctt acgtccacac ggcattcggc agatattccg 480 ccgtatacgt ttgccagcga tgtgcaggtt atggtgatta agaaacaggc gctgggcatc 540 agcgtggtct gagtgtgaaa aaaaaggtac caaaaaaaac atcgtcgtga gtagtgaacc 600 gtaagc 606 <210> 25 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 5 <400> 25 ctattctgtt tatgtttctt gtttgttagc cctattctgt cccccccccc accccccccc 60 <210> 26 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Examples 5 and 6 <400> 26 acagaatagg gctaacaaac aagaaacata aacagaatag 40 <210> 27 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Examples 5 and 6 <400> 27 ctattctgtt tatgtttctt gtttgttagc cctattctgt 40 <210> 28 <211> 760 <212> PRT <213> Methanococcoides burtonii <400> 28 Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr 1 5 10 15 Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile 20 25 30 Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr 35 40 45 Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile 50 55 60 Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala 65 70 75 80 Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys 85 90 95 Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly 100 105 110 Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu 115 120 125 Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp 130 135 140 Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val 145 150 155 160 Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala 165 170 175 Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly 180 185 190 Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly 195 200 205 Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile 210 215 220 Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile 225 230 235 240 Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys 245 250 255 Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp 260 265 270 Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser 275 280 285 Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys 290 295 300 Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu 305 310 315 320 Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr 325 330 335 Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile 340 345 350 Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro 355 360 365 Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu 370 375 380 Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe 385 390 395 400 Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp 405 410 415 Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr 420 425 430 Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe 435 440 445 Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu 450 455 460 Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser 465 470 475 480 Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr 485 490 495 Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly 500 505 510 Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly 515 520 525 Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr 530 535 540 Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln 545 550 555 560 Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val 565 570 575 Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr 580 585 590 Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu 595 600 605 Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn 610 615 620 Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu 625 630 635 640 Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser 645 650 655 Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu 660 665 670 Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala 675 680 685 Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly 690 695 700 Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr 705 710 715 720 Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn 725 730 735 Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn 740 745 750 Gln Lys Thr Phe Asn Asp Phe Gln 755 760 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 5 <400> 29 cccccccccc accccccccc 20 <210> 30 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 6 <400> 30 ccccccccca ccccccccc 19 <210> 31 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 6 <400> 31 ccccccaccc cccccc 16 <210> 32 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 6 <400> 32 ctattctgtt tatgtttctt gtttgttagc cctattctgt cccccccccc accccccccc 60 accccccccc accccccccc 80 <210> 33 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 6 <400> 33 ctattctgtt tatgtttctt gtttgttagc cctattctgt cccccccccc 50 <210> 34 <211> 83 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 7 <400> 34 tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tcgctgctcc 60 acaggtctca gcttgagcag cga 83 <210> 35 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Examples 7 and 8 <400> 35 tcgctgctca agctgagacc tgtggagcag cga 33 <210> 36 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Examples 7 and 8 <400> 36 tcgctgctcc acaggtctca gcttgagcag cga 33 <210> 37 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Examples 7, 8 and 9 <400> 37 tttttttttt 10 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Examples 8 and 10 <400> 38 tttttttttt tttttttttt 20 <210> 39 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 8 <400> 39 tttttttttt tttttt 16 <210> 40 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 8 <400> 40 tttttttttt tttttttt 18 <210> 41 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 9 <400> 41 gccatcagat tgtgtttgtt agtcgct 27 <210> 42 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 9 <400> 42 gcaatatcag caccaacaga aacaacc 27 <210> 43 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Polynucleotide sequence used in Example 9 <400> 43 agcgactaac aaacacaatc tgatggc 27

Claims (51)

  1. (a) 하나 이상의 정지된 헬리카제 및 폴리뉴클레오티드를 막횡단 포어와 접촉시키는 단계, 및 (b) 전위를 포어를 통해 인가하여 폴리뉴클레오티드 상에서 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 단계를 포함하는, 폴리뉴클레오티드에서 하나 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 방법.
  2. (a) 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계;
    (b) 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 하나 이상의 스페이서에서 정지하도록 하는 단계;
    (c) 표적 폴리뉴클레오티드 및 하나 이상의 정지된 헬리카제를 포어와 접촉시키는 단계; 및
    (d) 포어를 통해 전위를 인가하여 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나 이동하도록 하고, 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하도록 하는 단계를 포함하는, 막횡단 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 방법.
  3. (a) 제2항의 방법을 수행하는 단계; 및
    (b) 폴리뉴클레오티드가 포어와 관련하여 이동함에 따라 하나 이상의 측정치를 측정하여 표적 폴리뉴클레오티드의 특징을 규명하고, 여기서 측정치는 폴리뉴클레오티드의 하나 이상의 특징을 나타내는 것인 단계를 포함하는, 표적 폴리뉴클레오티드의 특징을 규명하는 방법.
  4. 제2항 또는 제3항에 있어서, 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계가 하나 이상의 스페이서를 포함하도록 표적 폴리뉴클레오티드를 변형시키는 것을 포함하는 것인 방법.
  5. 제3항 또는 제4항에 있어서, 하나 이상의 특징이 (i) 표적 폴리뉴클레오티드의 길이, (ii) 표적 폴리뉴클레오티드의 동일성, (iii) 표적 폴리뉴클레오티드의 서열, (iv) 표적 폴리뉴클레오티드의 2차 구조, 및 (v) 표적 폴리뉴클레오티드의 변형 여부로부터 선택되는 것인 방법.
  6. 제5항에 있어서, 표적 폴리뉴클레오티드가 메틸화에 의해, 산화에 의해, 손상에 의해, 하나 이상의 단백질로, 또는 하나 이상의 표지, 태그 또는 스페이서로 변형되는 것인 방법.
  7. 제3항 내지 제6항 중 어느 한 항에 있어서, 표적 폴리뉴클레오티드의 하나 이상의 특징이 전기적 측정 및/또는 광학적 측정에 의해 측정되는 것인 방법.
  8. 제7항에 있어서, 전기적 측정이 전류 측정, 임피던스 측정, 터널링 측정 또는 전계 효과 트랜지스터 (FET) 측정인 것인 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 하나 이상의 헬리카제가 인가된 전위로부터 생성된 장을 이용하여 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 것인 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 폴리뉴클레오티드와 상이한 구조를 갖는 것인 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 폴리뉴클레오티드가 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA)이고, 하나 이상의 스페이서가 펩티드 핵산 (PNA), 글리세롤 핵산 (GNA), 트레오스 핵산 (TNA), 잠금 핵산 (LNA) 또는 뉴클레오티드 측쇄를 포함하는 합성 중합체를 포함하는 것인 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 하나 이상의 니트로인돌, 하나 이상의 이노신, 하나 이상의 아크리딘, 하나 이상의 2- 아미노퓨린, 하나 이상의 2-6-디아미노퓨린, 하나 이상의 5-브로모-데옥시우리딘, 하나 이상의 역 티미딘 (역 dT), 하나 이상의 역 디데옥시-티미딘 (ddT), 하나 이상의 디데옥시-시티딘 (ddC), 하나 이상의 5-메틸시티딘, 하나 이상의 5-히드록시메틸시티딘, 하나 이상의 2'-O-메틸 RNA 염기, 하나 이상의 이소-데옥시시티딘 (이소-dC), 하나 이상의 이소-데옥시구아노신 (이소-dG), 하나 이상의 C3 기, 하나 이상의 광절단가능한 (PC) 기, 하나 이상의 헥산디올 기, 하나 이상의 스페이서 9 (iSp9) 기, 하나 이상의 스페이서 18 (iSp18) 기, 중합체 또는 하나 이상의 티올 연결부를 포함하는 것인 방법.
  13. 제12항에 있어서, 중합체가 폴리펩티드 또는 폴리에틸렌 글리콜 (PEG)인 방법.
  14. 제1항 내지 제11항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 하나 이상의 무염기 뉴클레오티드를 포함하는 것인 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 하나 이상의 헬리카제를 정지시키는 하나 이상의 화학적 기를 포함하는 것인 방법.
  16. 제15항에 있어서, 하나 이상의 화학적 기가 하나 이상의 형광단, 스트렙트아비딘 및/또는 비오틴, 콜레스테롤, 메틸렌 블루, 디니트로페놀 (DNP), 디곡시게닌 및/또는 항-디곡시게닌 또는 디벤질시클로옥틴 기인 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 유리 뉴클레오티드의 존재, 및/또는 헬리카제 보조인자의 존재 하에 하나 이상의 헬리카제를 정지시킬 수 있는 것인 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 약 100 mM 이하의 염 농도에서 하나 이상의 헬리카제를 정지시킬 수 있는 것인 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 2개 이상의 정지된 헬리카제가 각 스페이서를 지나도록 이동시키는 단계를 포함하는 방법.
  20. 제19항에 있어서, 2개 이상의 헬리카제가 서로 부착되어 있는 것인 방법.
  21. 제20항에 있어서, 2개 이상의 헬리카제가 서로 공유 부착되어 있는 것인 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 폴리뉴클레오티드에 포함되어 있고/거나, 폴리뉴클레오티드에 혼성화된 하나 이상의 차단 분자의 일부가 아닌 것인 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 폴리뉴클레오티드의 적어도 일부가 이중 가닥인 것인 방법.
  24. 제23항에 있어서, 하나 이상의 스페이서가 폴리뉴클레오티드의 단일 가닥 영역 또는 비혼성화된 영역에 포함되어 있는 것인 방법.
  25. 제24항에 있어서, 단일 가닥 영역이 포어로 우선적으로 트레딩하는 리더 서열을 포함하는 것인 방법.
  26. 제23항 내지 제25항 중 어느 한 항에 있어서, 이중 가닥부의 두 가닥이 가교 모이어티를 사용하여 연결되는 것인 방법.
  27. 제26항에 있어서, 하나 이상의 스페이서가 가교 모이어티에 포함되는 것인 방법.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 하나 이상의 헬리카제가 (a) 하나 이상의 Hel308 헬리카제, 하나 이상의 RecD 헬리카제, 하나 이상의 XPD 헬리카제 또는 하나 이상의 Dda 헬리카제, (b) (a)의 헬리카제 중 임의의 것으로부터 유래된 하나 이상의 헬리카제; 또는 (c) (a) 및/또는 (b)의 헬리카제 중 임의의 것의 조합인 것인 방법.
  29. 제1항 내지 제28항 중 어느 한 항에 있어서, 포어가 막횡단 단백질 포어 또는 고체 상태 포어인 것인 방법.
  30. 제29항에 있어서, 막횡단 단백질 포어가 α 헤몰리신, 류코시딘, 미코박테리움 스메그마티스(Mycobacterium smegmatis) 포린 A (MspA), MspB, MspC, MspD, 리세닌, 외막 포린 F (OmpF), 외막 포린 G (OmpG), 외막 포스포리파제 A, 나이세리아(Neisseria) 자가수송체 지단백질 (NalP) 및 WZA로부터 유래되는 것인 방법.
  31. 제30항에 있어서, 막횡단 단백질 포어가
    (a) 서열 2에 제시된 바와 같은 8개의 동일한 서브유닛로 형성된 것, 또는 (b) 8개의 서브유닛 중 하나 이상이 전체 서열에 걸쳐 아미노산 동일성에 기초하여 서열 2와 50% 이상의 상동성을 갖고 포어 활성을 유지하는 그의 변이체이거나; 또는
    (c) 서열 4에 제시된 바와 같은 7개의 동일한 서브유닛으로 형성된 α 헤몰리신, 또는 (d) 7개의 서브유닛 중 하나 이상이 전체 서열에 걸쳐 아미노산 동일성에 기초하여 서열 4와 50% 이상의 상동성을 갖고 포어 활성을 유지하는 그의 변이체인 방법.
  32. 폴리뉴클레오티드 상에서 하나 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키기 위한 막횡단 포어 및 인가된 전위의 용도.
  33. 폴리뉴클레오티드를 막횡단 포어와 접촉시키기 이전에 폴리뉴클레오티드 상에서 하나 이상의 헬리카제를 정지시키기 위한 하나 이상의 스페이서의 용도.
  34. (a) 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계; 및
    (b) (a)에서 제공받은 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 표적 폴리뉴클레오티드에 결합하고, 각 스페이서에서 정지하도록 하는 단계를 포함하는, 하나 이상의 헬리카제의 표적 폴리뉴클레오티드 상에의 로딩을 제어하는 방법.
  35. 제34항에 있어서, 단계 (a)가 하나 이상의 스페이서를 포함하도록 표적 폴리뉴클레오티드를 변형시키는 것을 포함하는 것인 방법.
  36. 제34항 또는 제35항에 있어서, 표적 폴리뉴클레오티드에 5'→3' 방향으로 (L-S)n 또는 (S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수임)을 제공하는 것인 방법.
  37. 제34항 내지 제36항 중 어느 한 항에 있어서, 단계 (b)가 (a)에서 제공받은 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 표적 폴리뉴클레오티드에 결합하고, 1개의 헬리카제가 각 스페이서에서 정지하도록 하는 것을 포함하는 것인 방법.
  38. 제37항에 있어서, 단계 (a)가 표적 폴리뉴클레오티드에 5'→3' 방향으로 (L1-S)n 또는 (S-L1)n (여기서, L은 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수임)을 제공하는 것을 포함하는 것인 방법.
  39. 제34항 내지 제36항 중 어느 한 항에 있어서, 단계 (b)가 (a)에서 제공받은 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 표적 폴리뉴클레오티드에 결합하고, 2개의 헬리카제가 각 스페이서에서 정지하도록 하는 것을 포함하는 것인 방법.
  40. 제39항에 있어서, 단계 (a)가 표적 폴리뉴클레오티드에 5'→3' 방향으로 (L2-S)n 또는 (S-L2)n (여기서, L은 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수임)을 제공하는 것을 포함하는 것인 방법.
  41. 제39항 또는 제40항에 있어서, 각 스페이서에서 정지된 2개의 헬리카제가 서로 상이한 것인 방법.
  42. 제39항 내지 제41항 중 어느 한 항에 있어서, 각 스페이서에서 정지된 2개의 헬리카제가 서로 부착되어 있거나, 또는 서로 공유 부착되어 있는 것인 방법.
  43. 제41항에 있어서,
    (a) 표적 폴리뉴클레오티드에 5'→3' 방향으로 (L2-S)n 또는 (S-L2)n (여기서, L은 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수임)을 제공하는 단계;
    (b) 차단 폴리뉴클레오티드를 각 영역 L2의 부분에 혼성화시켜 각 영역 L2의 남은 부분이 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이가 되도록 하는 단계;
    (c) (b)에서 제조된 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 1개의 헬리카제가 각 영역 L2의 남은 부분에 결합하도록 하는 단계;
    (d) (c)의 하나 이상의 결합된 헬리카제에 유리 뉴클레오티드 및 헬리카제 보조인자를 제공하여 헬리카제가 각 차단 폴리뉴클레오티드를 제거하고, 각 스페이서 S에서 정지하도록 하는 단계; 및
    (e) (d)에서 제조된 표적 폴리뉴클레오티드를 (c)에서 사용된 것과는 다른 하나 이상의 헬리카제와 접촉시켜 1개의 상이한 헬리카제가 각 영역 L2에 결합하고, 각 스페이서 및 (d)에서 정지된 각 헬리카제에 의해 정지되도록 하는 것인 단계를 포함하는 방법.
  44. 제34항 내지 제43항 중 어느 한 항에 있어서, 표적 폴리뉴클레오티드에 2개 이상의 스페이서를 제공하는 것인 방법.
  45. 제34항 내지 제44항 중 어느 한 항에 있어서, 하나 이상의 정지된 헬리카제가 제1항 내지 제31항 중 어느 한 항에 따른 방법을 이용하여 하나 이상의 스페이서를 지나 이동하는 것인 방법.
  46. (a) 5'→3' 방향으로 (L-S-D)n 또는 (D-S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, D는 이중 가닥 폴리뉴클레오티드이고, 여기서, n은 정수임), 및 (b) 각 어댑터 상에서 정지된 하나 이상의 헬리카제를 포함하는, 표적 폴리뉴클레오티드의 이동을 제어하기 위한 어댑터.
  47. 제46항에 있어서, L이 단 1개의 헬리카제에 결합할 수 있거나 (L1), 또는 단 2개의 헬리카제에 결합할 수 있는 (L2) 것인 어댑터.
  48. 제47항에 있어서, n이 1이고, 1개 또는 2개의 헬리카제가 어댑터 상에서 정지되는 것인 어댑터.
  49. (a) 하나 이상의 스페이서, (b) 하나 이상의 헬리카제 및 (c) 막횡단 포어를 포함하는, 표적 폴리뉴클레오티드의 이동을 제어하기 위한 키트.
  50. 제49항에 있어서, 하나 이상의 스페이서가 제15항 내지 제18항 중 어느 한 항에서 정의된 것과 같은 것인 키트.
  51. 제49항 또는 제50항에 있어서, 키트가 제46항 내지 제48항 중 어느 한 항에 따른 어댑터를 포함하는 것인 키트.
KR1020157027690A 2013-03-08 2014-01-22 효소 정지 방법 KR102168813B1 (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201361774694P 2013-03-08 2013-03-08
US61/774,694 2013-03-08
GBGB1314695.6A GB201314695D0 (en) 2013-08-16 2013-08-16 Method
GB1314695.6 2013-08-16
GB201318464A GB201318464D0 (en) 2013-10-18 2013-10-18 Modified enzymes
GB1318465.0 2013-10-18
GB1318464.3 2013-10-18
GBGB1318465.0A GB201318465D0 (en) 2013-10-18 2013-10-18 Method
PCT/GB2014/050175 WO2014135838A1 (en) 2013-03-08 2014-01-22 Enzyme stalling method

Publications (2)

Publication Number Publication Date
KR20150126026A true KR20150126026A (ko) 2015-11-10
KR102168813B1 KR102168813B1 (ko) 2020-10-22

Family

ID=51490681

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157027690A KR102168813B1 (ko) 2013-03-08 2014-01-22 효소 정지 방법

Country Status (10)

Country Link
US (3) US10221450B2 (ko)
EP (1) EP2964779B1 (ko)
JP (1) JP6408494B2 (ko)
KR (1) KR102168813B1 (ko)
CN (1) CN105209634B (ko)
AU (1) AU2014224432B2 (ko)
BR (1) BR112015021788B1 (ko)
CA (1) CA2901545C (ko)
SG (1) SG11201507138RA (ko)
WO (1) WO2014135838A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170063889A (ko) * 2014-10-07 2017-06-08 옥스포드 나노포어 테크놀로지즈 리미티드 변형된 효소

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3092369A1 (en) 2008-09-22 2010-03-25 University Of Washington Msp nanopores and related methods
CA2750879C (en) 2009-01-30 2018-05-22 Oxford Nanopore Technologies Limited Adaptors for nucleic acid constructs in transmembrane sequencing
WO2012058638A2 (en) 2010-10-29 2012-05-03 President And Fellows Of Harvard College Nucleic acid nanostructure barcode probes
JP6480183B2 (ja) 2011-05-27 2019-03-06 オックスフォード ナノポール テクノロジーズ リミテッド 結合方法
AU2012288629B2 (en) 2011-07-25 2017-02-02 Oxford Nanopore Technologies Limited Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
KR20140090633A (ko) 2011-10-21 2014-07-17 옥스포드 나노포어 테크놀로지즈 리미티드 포어 및 hel308 헬리카제를 사용하여 표적 폴리뉴클레오티드를 특성화하는 방법
WO2013098562A2 (en) 2011-12-29 2013-07-04 Oxford Nanopore Technologies Limited Enzyme method
AU2013220156B2 (en) 2012-02-15 2018-08-09 Oxford Nanopore Technologies Limited Aptamer method
BR112014025157B1 (pt) 2012-04-10 2022-02-08 Oxford Nanopore Technologies Limited Monômero de lisenina mutante, construto, poro, método para caracterizar um analito alvo, uso de um poro, e, kit
WO2014013259A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Ssb method
JP6614972B2 (ja) 2012-07-19 2019-12-04 オックスフォード ナノポール テクノロジーズ リミテッド 修飾ヘリカーゼ
US9551023B2 (en) 2012-09-14 2017-01-24 Oxford Nanopore Technologies Ltd. Sample preparation method
WO2014072703A1 (en) 2012-11-06 2014-05-15 Oxford Nanopore Technologies Limited Quadruplex method
GB201318465D0 (en) 2013-10-18 2013-12-04 Oxford Nanopore Tech Ltd Method
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
SG11201507138RA (en) 2013-03-08 2015-10-29 Oxford Nanopore Tech Ltd Enzyme stalling method
US10760064B2 (en) 2013-03-15 2020-09-01 The General Hospital Corporation RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
CA2906553C (en) 2013-03-15 2022-08-02 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
GB201313477D0 (en) 2013-07-29 2013-09-11 Univ Leuven Kath Nanopore biosensors for detection of proteins and nucleic acids
US10011850B2 (en) 2013-06-21 2018-07-03 The General Hospital Corporation Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing
CA2927726A1 (en) 2013-10-18 2015-04-23 Oxford Nanopore Technologies Limited Modified helicases for use in nucleic acid sequencing
GB201406151D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
GB201406155D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
JP6749243B2 (ja) 2014-01-22 2020-09-02 オックスフォード ナノポール テクノロジーズ リミテッド 1つまたは複数のポリヌクレオチド結合タンパク質を標的ポリヌクレオチドに付着させる方法
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
CA2932943C (en) 2014-03-11 2023-09-26 President And Fellows Of Harvard College High-throughput and highly multiplexed imaging with programmable nucleic acid probes
WO2015150786A1 (en) 2014-04-04 2015-10-08 Oxford Nanopore Technologies Limited Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid
US10443097B2 (en) 2014-05-02 2019-10-15 Oxford Nanopore Technologies Ltd. Method of improving the movement of a target polynucleotide with respect to a transmembrane pore
CN117164682A (zh) 2014-09-01 2023-12-05 弗拉芒区生物技术研究所 突变csgg孔
EP3204511B1 (en) 2014-10-07 2021-07-28 Oxford Nanopore Technologies Limited Mutant pores
GB201418159D0 (en) * 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
GB201418469D0 (en) 2014-10-17 2014-12-03 Oxford Nanopore Tech Ltd Method
KR102457147B1 (ko) 2014-10-17 2022-10-19 옥스포드 나노포어 테크놀로지즈 피엘씨 나노 세공 rna 특징 규명을 위한 방법
EP3250716B1 (en) * 2015-01-30 2021-07-07 President and Fellows of Harvard College Microscope-free imaging
GB201502810D0 (en) 2015-02-19 2015-04-08 Oxford Nanopore Tech Ltd Method
GB201502809D0 (en) 2015-02-19 2015-04-08 Oxford Nanopore Tech Ltd Mutant pore
CN107735686B (zh) 2015-04-14 2021-06-11 鲁汶天主教大学 具有内部蛋白质衔接子的纳米孔
US9926546B2 (en) 2015-08-28 2018-03-27 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
US9512446B1 (en) 2015-08-28 2016-12-06 The General Hospital Corporation Engineered CRISPR-Cas9 nucleases
EP3387432B1 (en) 2015-12-08 2022-09-28 Katholieke Universiteit Leuven KU Leuven Research & Development Modified nanopores, compositions comprising the same, and uses thereof
EP3423485B1 (en) 2016-03-02 2021-12-29 Oxford Nanopore Technologies plc Mutant pore
WO2017174990A1 (en) 2016-04-06 2017-10-12 Oxford Nanopore Technologies Limited Mutant pore
CN109196116B (zh) 2016-05-25 2022-09-27 牛津纳米孔科技公开有限公司 一种表征靶多核苷酸的方法
GB201609221D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
GB201609220D0 (en) * 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
CN109923213B (zh) 2016-09-20 2023-02-28 哈佛学院院长及董事 分子验证系统
GB201620450D0 (en) 2016-12-01 2017-01-18 Oxford Nanopore Tech Ltd Method
EP3551765A4 (en) 2016-12-09 2020-11-11 Ultivue, Inc. IMPROVED METHODS FOR MULTIPLEX IMAGING USING LABELED NUCLEIC ACID CONTRAST AGENTS
CN108220267B (zh) * 2016-12-22 2022-10-04 丰益(上海)生物技术研发中心有限公司 磷脂酶及其应用
GB201707140D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Method
GB201707122D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Pore
WO2019002893A1 (en) 2017-06-30 2019-01-03 Vib Vzw NEW PROTEIN PORES
GB2569977A (en) 2018-01-05 2019-07-10 Oxford Nanopore Tech Ltd Method
GB201807793D0 (en) 2018-05-14 2018-06-27 Oxford Nanopore Tech Ltd Method
GB201808556D0 (en) 2018-05-24 2018-07-11 Oxford Nanopore Tech Ltd Method
GB201808554D0 (en) 2018-05-24 2018-07-11 Oxford Nanopore Tech Ltd Method
GB201808558D0 (en) 2018-05-24 2018-07-11 Oxford Nanopore Tech Ltd Method
GB201809323D0 (en) 2018-06-06 2018-07-25 Oxford Nanopore Tech Ltd Method
JP2020031557A (ja) * 2018-08-28 2020-03-05 株式会社日立ハイテクノロジーズ 生体分子分析装置
GB201907246D0 (en) 2019-05-22 2019-07-03 Oxford Nanopore Tech Ltd Method
GB201907244D0 (en) 2019-05-22 2019-07-03 Oxford Nanopore Tech Ltd Method
US11926819B2 (en) 2019-05-28 2024-03-12 The Regents Of The University Of California Methods of adding polymers to ribonucleic acids
CN114040983A (zh) * 2019-06-26 2022-02-11 南京金斯瑞生物科技有限公司 一种含有阻断物的寡核苷酸
WO2021053745A1 (ja) * 2019-09-18 2021-03-25 株式会社日立ハイテク アダプター分子、当該アダプター分子と生体分子とが結合した生体分子-アダプター分子複合体、生体分子分析装置及び生体分子分析方法
GB201915480D0 (en) 2019-10-25 2019-12-11 Oxford Nanopore Tech Ltd Improved nanopore sensing device, components and method of manufacture
CN114761799A (zh) 2019-12-02 2022-07-15 牛津纳米孔科技公开有限公司 使用纳米孔表征靶多肽的方法
GB202016874D0 (en) 2020-10-23 2020-12-09 Oxford Nanopore Tech Ltd Nanopore support structure and manufacture thereof
EP4168583A2 (en) * 2020-06-18 2023-04-26 Oxford Nanopore Technologies plc Method of characterising a polynucleotide moving through a nanopore
WO2022029449A1 (en) 2020-08-07 2022-02-10 Oxford Nanopore Technologies Limited Methods of identifying nucleic acid barcodes
GB202107192D0 (en) 2021-05-19 2021-06-30 Oxford Nanopore Tech Ltd Method
WO2022243692A1 (en) 2021-05-19 2022-11-24 Oxford Nanopore Technologies Plc Methods for complement strand sequencing
GB202107354D0 (en) 2021-05-24 2021-07-07 Oxford Nanopore Tech Ltd Method
CN113862264A (zh) * 2021-12-03 2021-12-31 北京齐碳科技有限公司 用于靶多核苷酸测序的衔接子、构建体、方法和应用
CN114262735A (zh) * 2021-12-15 2022-04-01 成都齐碳科技有限公司 用于表征多核苷酸的衔接体及其用途
GB202118906D0 (en) * 2021-12-23 2022-02-09 Oxford Nanopore Tech Ltd Method
GB202118908D0 (en) 2021-12-23 2022-02-09 Oxford Nanopore Tech Ltd Method
CN114457145B (zh) * 2022-01-29 2023-08-11 成都齐碳科技有限公司 用于表征靶多核苷酸测序的接头、构建体、方法和应用
CN116478983B (zh) * 2022-11-21 2023-10-24 北京普译生物科技有限公司 一种rna-dna嵌合接头及其应用
GB202307486D0 (en) 2023-05-18 2023-07-05 Oxford Nanopore Tech Plc Method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006028508A2 (en) * 2004-03-23 2006-03-16 President And Fellows Of Harvard College Methods and apparatus for characterizing polynucleotides
WO2010004265A1 (en) * 2008-07-07 2010-01-14 Oxford Nanopore Technologies Limited Enzyme-pore constructs
WO2010086622A1 (en) * 2009-01-30 2010-08-05 Oxford Nanopore Technologies Limited Adaptors for nucleic acid constructs in transmembrane sequencing

Family Cites Families (207)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE755065A (fr) 1969-08-20 1971-02-01 Sicli Extincteur d'incendie a rechargement
FI82266C (fi) 1982-10-19 1991-02-11 Cetus Corp Foerfarande foer framstaellning av il-2 -mutein.
US5198543A (en) 1989-03-24 1993-03-30 Consejo Superior Investigaciones Cientificas PHI29 DNA polymerase
GB8924338D0 (en) 1989-10-28 1989-12-13 Atomic Energy Authority Uk Electrodes
US5215899A (en) 1989-11-09 1993-06-01 Miles Inc. Nucleic acid amplification employing ligatable hairpin probe and transcription
US5424413A (en) 1992-01-22 1995-06-13 Gen-Probe Incorporated Branched nucleic acid probes
FR2703693B1 (fr) 1993-04-06 1995-07-13 Pasteur Institut Procédé rapide de détermination d'une séquence d'ADN et application au séquençage et au diagnostic.
US5714320A (en) 1993-04-15 1998-02-03 University Of Rochester Rolling circle synthesis of oligonucleotides and amplification of select randomized circular oligonucleotides
EP0753071A1 (en) 1993-04-28 1997-01-15 Worcester Foundation For Experimental Biology Cell-targeted lytic pore-forming agents
US5777078A (en) 1993-04-28 1998-07-07 Worcester Foundation For Experimental Biology Triggered pore-forming agents
DE4320201A1 (de) 1993-06-18 1995-01-12 Asta Medica Ag Verwendung von Cetrorelix und weiteren Nona- und Dekapeptiden zur Herstellung eines Arzneimittels zur Bekämpfung von Aids und zur Wachstumsstimulation
US7569341B2 (en) 1994-01-31 2009-08-04 Trustees Of Boston University Nucleic acid directed immobilization arrays and methods of assembly
US5561043A (en) 1994-01-31 1996-10-01 Trustees Of Boston University Self-assembling multimeric nucleic acid constructs
US5795782A (en) 1995-03-17 1998-08-18 President & Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6362002B1 (en) 1995-03-17 2002-03-26 President And Fellows Of Harvard College Characterization of individual polymer molecules based on monomer-interface interactions
US6395887B1 (en) 1995-08-01 2002-05-28 Yale University Analysis of gene expression by display of 3'-end fragments of CDNAS
US5866336A (en) 1996-07-16 1999-02-02 Oncor, Inc. Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon
DE19648625A1 (de) 1996-11-13 1998-05-14 Soft Gene Gmbh Mikroprojektil für das Einbringen von Substanzen in Zellen durch ballistischen Transfer
JP3891620B2 (ja) 1996-11-14 2007-03-14 株式会社アイシン・コスモス研究所 ヘアピン型構造の核酸プローブ分子、及び該核酸プローブ分子を利用した核酸検出方法
US20020197614A1 (en) 1997-05-16 2002-12-26 Mosaic Technologies, Inc. Electrophoretic analysis of target molecules using adapter molecules
WO1999005167A1 (en) 1997-07-25 1999-02-04 University Of Massachusetts Designed protein pores as components for biosensors
US6087099A (en) 1997-09-08 2000-07-11 Myriad Genetics, Inc. Method for sequencing both strands of a double stranded DNA in a single sequencing reaction
US6127166A (en) 1997-11-03 2000-10-03 Bayley; Hagan Molluscan ligament polypeptides and genes encoding them
JPH11137260A (ja) 1997-11-06 1999-05-25 Soyaku Gijutsu Kenkyusho:Kk 抗インフルエンザウイルス環状ダンベル型rna−dnaキメラ化合物及び抗インフルエンザウイルス剤
US6123819A (en) 1997-11-12 2000-09-26 Protiveris, Inc. Nanoelectrode arrays
DE19826758C1 (de) 1998-06-15 1999-10-21 Soft Gene Gmbh Darstellung von linearen kovalent geschlossenen DNA-Molekülen als Expressionskonstrukte
US6743605B1 (en) 1998-06-24 2004-06-01 Enzo Life Sciences, Inc. Linear amplification of specific nucleic acid sequences
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
US6150112A (en) 1998-09-18 2000-11-21 Yale University Methods for identifying DNA sequences for use in comparison of DNA samples by their lack of polymorphism using Y shape adaptors
US6235502B1 (en) 1998-09-18 2001-05-22 Molecular Staging Inc. Methods for selectively isolating DNA using rolling circle amplification
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
US6426231B1 (en) 1998-11-18 2002-07-30 The Texas A&M University System Analyte sensing mediated by adapter/carrier molecules
AU2206800A (en) 1998-12-11 2000-06-26 Regents Of The University Of California, The Targeted molecular bar codes and methods for using the same
NO986133D0 (no) 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
US6627067B1 (en) 1999-06-22 2003-09-30 President And Fellows Of Harvard College Molecular and atomic scale evaluation of biopolymers
EP1196434A2 (en) 1999-06-29 2002-04-17 University Health Network Peptide conjugates for the stabilization of membrane proteins and interactions with biological membranes
US6403319B1 (en) 1999-08-13 2002-06-11 Yale University Analysis of sequence tags with hairpin primers
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US6682649B1 (en) 1999-10-01 2004-01-27 Sophion Bioscience A/S Substrate and a method for determining and/or monitoring electrophysiological properties of ion channels
JP2003532380A (ja) 1999-12-02 2003-11-05 モレキュラー ステージング,インコーポレイテッド 線状自己アニーリングセグメントからの一本鎖環状dnaの産出
EP2083015B1 (en) 2000-02-11 2016-04-06 The Texas A & M University System Biosensor compositions and methods of use
WO2001062943A1 (en) 2000-02-25 2001-08-30 Invitrogen Corporation Topoisomerase linker-mediated amplification methods
CA2403804A1 (en) 2000-03-21 2001-09-27 Curagen Corporation Vegf-modulated genes and methods employing them
PT1265914E (pt) 2000-03-22 2008-04-08 Geneprint Inc Polipéptidos relacionados com wnt-1 e ácidos nucleicos que codificam estes polipéptidos
US6596488B2 (en) 2000-03-30 2003-07-22 City Of Hope Tumor suppressor gene
US6387624B1 (en) 2000-04-14 2002-05-14 Incyte Pharmaceuticals, Inc. Construction of uni-directionally cloned cDNA libraries from messenger RNA for improved 3′ end DNA sequencing
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
US20020132350A1 (en) 2000-09-14 2002-09-19 Pioneer Hi-Bred International, Inc. Targeted genetic manipulation using Mu bacteriophage cleaved donor complex
US6709861B2 (en) 2000-11-17 2004-03-23 Lucigen Corp. Cloning vectors and vector components
US6936433B2 (en) 2000-11-27 2005-08-30 The Regents Of The University Of California Methods and devices for characterizing duplex nucleic acid molecules
US20020197618A1 (en) 2001-01-20 2002-12-26 Sampson Jeffrey R. Synthesis and amplification of unstructured nucleic acids for rapid sequencing
US20030087232A1 (en) 2001-01-25 2003-05-08 Fred Christians Methods for screening polypeptides
US7807408B2 (en) 2001-03-19 2010-10-05 President & Fellows Of Harvard College Directed evolution of proteins
US6863833B1 (en) 2001-06-29 2005-03-08 The Board Of Trustees Of The Leland Stanford Junior University Microfabricated apertures for supporting bilayer lipid membranes
WO2003004992A2 (en) 2001-07-03 2003-01-16 The Regents Of The University Of California Mammalian sweet and amino acid heterodimeric taste receptors
US6852492B2 (en) 2001-09-24 2005-02-08 Intel Corporation Nucleic acid sequencing by raman monitoring of uptake of precursors during molecular replication
IL163822A0 (en) 2002-03-15 2005-12-18 Nuevolution As An improved method for synthesising templated molecules
EP1504114B1 (en) 2002-05-10 2017-07-12 The Texas A & M University System Stochastic sensing through covalent interactions
US7452699B2 (en) 2003-01-15 2008-11-18 Dana-Farber Cancer Institute, Inc. Amplification of DNA in a hairpin structure, and applications
US20060147935A1 (en) 2003-02-12 2006-07-06 Sten Linnarsson Methods and means for nucleic acid sequencing
US20040209299A1 (en) 2003-03-07 2004-10-21 Rubicon Genomics, Inc. In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA
CA2519309A1 (en) 2003-03-25 2004-10-14 Stratagene California Dna polymerase fusions and uses thereof
US7745116B2 (en) 2003-04-08 2010-06-29 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
US20100035254A1 (en) 2003-04-08 2010-02-11 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
US7163658B2 (en) 2003-04-23 2007-01-16 Rouvain Bension Rapid sequencing of polymers
US7344882B2 (en) 2003-05-12 2008-03-18 Bristol-Myers Squibb Company Polynucleotides encoding variants of the TRP channel family member, LTRPC3
WO2005056750A2 (en) 2003-12-11 2005-06-23 Quark Biotech, Inc. Inversion-duplication of nucleic acids and libraries prepared thereby
GB0400584D0 (en) 2004-01-12 2004-02-11 Solexa Ltd Nucleic acid chacterisation
JP2005253427A (ja) 2004-03-15 2005-09-22 Aisin Seiki Co Ltd 核酸検出方法及び核酸単離方法
GB2413796B (en) 2004-03-25 2006-03-29 Global Genomics Ab Methods and means for nucleic acid sequencing
US20050227239A1 (en) 2004-04-08 2005-10-13 Joyce Timothy H Microarray based affinity purification and analysis device coupled with solid state nanopore electrodes
US7618778B2 (en) 2004-06-02 2009-11-17 Kaufman Joseph C Producing, cataloging and classifying sequence tags
WO2005124888A1 (en) 2004-06-08 2005-12-29 President And Fellows Of Harvard College Suspended carbon nanotube field effect transistor
US7700281B2 (en) 2004-06-30 2010-04-20 Usb Corporation Hot start nucleic acid amplification
CN101103357B (zh) 2004-08-13 2012-10-03 哈佛学院院长等 超高处理量光学-纳米孔dna读出平台
US20060086626A1 (en) 2004-10-22 2006-04-27 Joyce Timothy H Nanostructure resonant tunneling with a gate voltage source
EP1842061A4 (en) 2004-12-21 2009-05-13 Texas A & M Univ Sys HIGH-TEMPERATURE ION CHANNELS AND ION PORES
US7890268B2 (en) 2004-12-28 2011-02-15 Roche Molecular Systems, Inc. De-novo sequencing of nucleic acids
GB0505971D0 (en) 2005-03-23 2005-04-27 Isis Innovation Delivery of molecules to a lipid bilayer
US7507575B2 (en) 2005-04-01 2009-03-24 3M Innovative Properties Company Multiplex fluorescence detection device having removable optical modules
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
EP1924704B1 (en) 2005-08-02 2011-05-25 Rubicon Genomics, Inc. Compositions and methods for processing and amplification of dna, including using multiple enzymes in a single reaction
WO2007024997A2 (en) 2005-08-22 2007-03-01 Fermalogic, Inc. Methods of increasing production of secondary metabolites
GB0523282D0 (en) 2005-11-15 2005-12-21 Isis Innovation Methods using pores
ATE518010T1 (de) 2005-12-22 2011-08-15 Pacific Biosciences California Aktive oberflächengekoppelte polymerasen
US7932029B1 (en) 2006-01-04 2011-04-26 Si Lok Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids and utilities
CA2642854A1 (en) 2006-02-18 2007-08-30 Michael Strathmann Massively multiplexed sequencing
US8673567B2 (en) 2006-03-08 2014-03-18 Atila Biosystems, Inc. Method and kit for nucleic acid sequence detection
WO2007114693A2 (en) 2006-04-04 2007-10-11 Keygene N.V. High throughput detection of molecular markers based on aflp and high throughput sequencing
US8889348B2 (en) 2006-06-07 2014-11-18 The Trustees Of Columbia University In The City Of New York DNA sequencing by nanopore using modified nucleotides
JP4876766B2 (ja) 2006-08-10 2012-02-15 トヨタ自動車株式会社 燃料電池
CN103230598A (zh) 2006-09-06 2013-08-07 费斯生物制药公司 融合肽治疗组合物
US20100311602A1 (en) 2006-10-13 2010-12-09 J. Craig Venter Institute, Inc. Sequencing method
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
GB2445016B (en) 2006-12-19 2012-03-07 Microsaic Systems Plc Microengineered ionisation device
DK2122344T3 (da) 2007-02-20 2019-07-15 Oxford Nanopore Tech Ltd Lipiddobbeltlags-sensorsystem
US20110005918A1 (en) 2007-04-04 2011-01-13 Akeson Mark A Compositions, devices, systems, and methods for using a nanopore
EP3543357A1 (en) 2007-05-08 2019-09-25 Trustees of Boston University Chemical functionalization of solid-state nanopores and nanopore arrays and applications thereof
EP2195648B1 (en) 2007-09-12 2019-05-08 President and Fellows of Harvard College High-resolution molecular graphene sensor comprising an aperture in the graphene layer
GB2453377A (en) 2007-10-05 2009-04-08 Isis Innovation Transmembrane protein pores and molecular adapters therefore.
KR101414713B1 (ko) 2007-10-11 2014-07-03 삼성전자주식회사 리가제 및 엔도뉴클레아제의 존재하에서 롤링서클 증폭에의하여 표적 핵산을 증폭하는 방법
WO2009052214A2 (en) 2007-10-15 2009-04-23 Complete Genomics, Inc. Sequence analysis using decorated nucleic acids
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
WO2009084721A1 (en) 2007-12-31 2009-07-09 Fujirebio Inc. Clusters of microresonators for cavity mode optical sensing
WO2009092035A2 (en) 2008-01-17 2009-07-23 Sequenom, Inc. Methods and compositions for the analysis of biological molecules
US8263367B2 (en) 2008-01-25 2012-09-11 Agency For Science, Technology And Research Nucleic acid interaction analysis
US8231969B2 (en) 2008-03-26 2012-07-31 University Of Utah Research Foundation Asymmetrically functionalized nanoparticles
JP2011515102A (ja) 2008-03-28 2011-05-19 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 核酸シーケンシング用組成物及び方法
US8143030B2 (en) 2008-09-24 2012-03-27 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
WO2009120374A2 (en) 2008-03-28 2009-10-01 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
US8628940B2 (en) 2008-09-24 2014-01-14 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
WO2009132315A1 (en) 2008-04-24 2009-10-29 Life Technologies Corporation Method of sequencing and mapping target nucleic acids
CN102066579A (zh) 2008-04-24 2011-05-18 纽约市哥伦比亚大学理事会 用于dna分子编排的几何图案和脂质双层以及它们的用途
AU2009269792A1 (en) 2008-07-07 2010-01-14 Oxford Nanopore Technologies Limited Base-detecting pore
US20100092960A1 (en) * 2008-07-25 2010-04-15 Pacific Biosciences Of California, Inc. Helicase-assisted sequencing with molecular beacons
EP2334802A4 (en) 2008-09-09 2012-01-25 Life Technologies Corp METHODS OF GENERATING SPECIFIC LIBRARIES OF GENES
US8481264B2 (en) 2008-09-19 2013-07-09 Pacific Biosciences Of California, Inc. Immobilized nucleic acid complexes for sequence analysis
CA3092369A1 (en) 2008-09-22 2010-03-25 University Of Washington Msp nanopores and related methods
US8383369B2 (en) 2008-09-24 2013-02-26 Pacific Biosciences Of California, Inc. Intermittent detection during analytical reactions
EP2376517B1 (en) 2008-10-24 2013-01-16 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
US8486630B2 (en) 2008-11-07 2013-07-16 Industrial Technology Research Institute Methods for accurate sequence data and modified base position determination
GB0820927D0 (en) 2008-11-14 2008-12-24 Isis Innovation Method
EP2370598B1 (en) 2008-12-11 2017-02-15 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates
BRPI1007215A2 (pt) 2009-01-30 2017-08-29 Oxford Nanopore Tech Ltd Método de acoplamento covalente de duas ou mais porções, primeira e segunda porções, primeiro porção acoplada a uma segunda porção, par de primeiro e segundo ligantes, e, uso de um par de ligantes.
EP2610352B1 (en) 2009-02-16 2014-10-08 Epicentre Technologies Corporation Template-independent ligation of single-stranded DNA
AU2010215761B2 (en) 2009-02-23 2017-04-06 Cytomx Therapeutics, Inc Proproteins and methods of use thereof
EP2227023A1 (en) 2009-03-05 2010-09-08 BRITISH TELECOMMUNICATIONS public limited company Video streaming
FR2943656A1 (fr) 2009-03-25 2010-10-01 Air Liquide Procede et installation de production d'hydrogene mettant en oeuvre un compresseur thermocinetique
GB0905140D0 (en) 2009-03-25 2009-05-06 Isis Innovation Method
WO2010117470A2 (en) 2009-04-10 2010-10-14 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
WO2010122293A1 (en) 2009-04-20 2010-10-28 Oxford Nanopore Technologies Limited Lipid bilayer sensor array
GB0910302D0 (en) 2009-06-15 2009-07-29 Lumora Ltd Nucleic acid amplification
US20120015821A1 (en) 2009-09-09 2012-01-19 Life Technologies Corporation Methods of Generating Gene Specific Libraries
CA2781581C (en) 2009-12-01 2018-03-06 Oxford Nanopore Technologies Limited Biochemical analysis instrument
WO2011090556A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
FR2955773B1 (fr) 2010-02-01 2017-05-26 Commissariat A L'energie Atomique Complexe moleculaire de ciblage des antigenes vers les cellules presentatrices d'antigene et ses applications pour la vaccination
KR20110100963A (ko) 2010-03-05 2011-09-15 삼성전자주식회사 미세 유동 장치 및 이를 이용한 표적 핵산의 염기 서열 결정 방법
WO2011112718A1 (en) 2010-03-10 2011-09-15 Ibis Biosciences, Inc. Production of single-stranded circular nucleic acid
US8652779B2 (en) 2010-04-09 2014-02-18 Pacific Biosciences Of California, Inc. Nanopore sequencing using charge blockade labels
CN103154729B (zh) 2010-06-08 2015-01-07 哈佛大学校长及研究员协会 具有由石墨烯支持的人工脂质膜的纳米孔装置
US20120244525A1 (en) 2010-07-19 2012-09-27 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
US20140051068A1 (en) 2010-09-07 2014-02-20 The Regents Of The University Of California Control of dna movement in a nanopore at one nucleotide precision by a processive enzyme
WO2012061832A1 (en) 2010-11-05 2012-05-10 Illumina, Inc. Linking sequence reads using paired code tags
CN103282518B (zh) 2010-12-17 2016-11-16 纽约哥伦比亚大学理事会 使用经修饰的核苷酸和纳米孔检测的dna边合成边测序
US20130291392A1 (en) 2011-01-18 2013-11-07 R.K. Swamy Multipurpose instrument for triangle solutions, measurements and geometrical applications called triometer
WO2012098562A2 (en) 2011-01-19 2012-07-26 Panacea Biotec Limited Liquid oral compositions of lanthanum salts
DK3037536T3 (da) 2011-01-28 2020-01-13 Illumina Inc Oligonukleotiderstatning for di-taggede og retnings biblioteker
US20120196279A1 (en) * 2011-02-02 2012-08-02 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
WO2012107778A2 (en) 2011-02-11 2012-08-16 Oxford Nanopore Technologies Limited Mutant pores
JP6480183B2 (ja) 2011-05-27 2019-03-06 オックスフォード ナノポール テクノロジーズ リミテッド 結合方法
US20130017978A1 (en) 2011-07-11 2013-01-17 Finnzymes Oy Methods and transposon nucleic acids for generating a dna library
US9145623B2 (en) 2011-07-20 2015-09-29 Thermo Fisher Scientific Oy Transposon nucleic acids comprising a calibration sequence for DNA sequencing
AU2012288629B2 (en) 2011-07-25 2017-02-02 Oxford Nanopore Technologies Limited Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
US9632102B2 (en) 2011-09-25 2017-04-25 Theranos, Inc. Systems and methods for multi-purpose analysis
WO2013041878A1 (en) 2011-09-23 2013-03-28 Oxford Nanopore Technologies Limited Analysis of a polymer comprising polymer units
US20140308661A1 (en) 2011-09-25 2014-10-16 Theranos, Inc. Systems and methods for multi-analysis
US9810704B2 (en) 2013-02-18 2017-11-07 Theranos, Inc. Systems and methods for multi-analysis
KR20140090633A (ko) 2011-10-21 2014-07-17 옥스포드 나노포어 테크놀로지즈 리미티드 포어 및 hel308 헬리카제를 사용하여 표적 폴리뉴클레오티드를 특성화하는 방법
GB201120910D0 (en) 2011-12-06 2012-01-18 Cambridge Entpr Ltd Nanopore functionality control
US9404147B2 (en) 2011-12-19 2016-08-02 Gen-Probe Incorporated Closed nucleic acid structures
WO2013098562A2 (en) 2011-12-29 2013-07-04 Oxford Nanopore Technologies Limited Enzyme method
CN104136631B (zh) 2011-12-29 2017-03-01 牛津纳米孔技术公司 使用xpd解旋酶表征多核苷酸的方法
CN107828877A (zh) 2012-01-20 2018-03-23 吉尼亚科技公司 基于纳米孔的分子检测与测序
NO2694769T3 (ko) 2012-03-06 2018-03-03
BR112014025157B1 (pt) 2012-04-10 2022-02-08 Oxford Nanopore Technologies Limited Monômero de lisenina mutante, construto, poro, método para caracterizar um analito alvo, uso de um poro, e, kit
WO2013185137A1 (en) 2012-06-08 2013-12-12 Pacific Biosciences Of California, Inc. Modified base detection with nanopore sequencing
TWI655213B (zh) 2012-07-13 2019-04-01 目立康股份有限公司 自我組織化肽衍生物的製造方法
JP6429773B2 (ja) 2012-07-19 2018-11-28 オックスフォード ナノポール テクノロジーズ リミテッド 酵素構築物
WO2014013259A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Ssb method
JP6614972B2 (ja) 2012-07-19 2019-12-04 オックスフォード ナノポール テクノロジーズ リミテッド 修飾ヘリカーゼ
US9551023B2 (en) 2012-09-14 2017-01-24 Oxford Nanopore Technologies Ltd. Sample preparation method
CN104936682B (zh) 2012-10-26 2017-12-15 牛津纳米孔技术公司 微滴界面
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
US9670526B2 (en) 2012-11-09 2017-06-06 Stratos Genomics, Inc. Concentrating a target molecule for sensing by a nanopore
US9683230B2 (en) 2013-01-09 2017-06-20 Illumina Cambridge Limited Sample preparation on a solid support
US20140206842A1 (en) 2013-01-22 2014-07-24 Muhammed Majeed Peptides Modified with Triterpenoids and Small Organic Molecules: Synthesis and use in Cosmeceutical
GB201318465D0 (en) 2013-10-18 2013-12-04 Oxford Nanopore Tech Ltd Method
SG11201507138RA (en) 2013-03-08 2015-10-29 Oxford Nanopore Tech Ltd Enzyme stalling method
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
CA3094792A1 (en) 2013-03-13 2014-09-18 Illumina, Inc. Methods and compositions for nucleic acid sequencing
WO2014153408A1 (en) 2013-03-19 2014-09-25 Directed Genomics, Llc Enrichment of target sequences
EP3004378B1 (en) 2013-05-24 2017-12-20 Illumina Cambridge Limited Pyrophosphorolytic sequencing using nanopores
EP3936222A1 (en) 2013-08-30 2022-01-12 University of Washington through its Center for Commercialization Selective modification of polymer subunits to improve nanopore-based analysis
CA2927726A1 (en) 2013-10-18 2015-04-23 Oxford Nanopore Technologies Limited Modified helicases for use in nucleic acid sequencing
GB201406151D0 (en) 2014-04-04 2014-05-21 Oxford Nanopore Tech Ltd Method
GB201321123D0 (en) 2013-11-29 2014-01-15 Linea Ab Q Amplification of circular molecules
JP6749243B2 (ja) 2014-01-22 2020-09-02 オックスフォード ナノポール テクノロジーズ リミテッド 1つまたは複数のポリヌクレオチド結合タンパク質を標的ポリヌクレオチドに付着させる方法
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
US10131944B2 (en) 2014-03-24 2018-11-20 The Regents Of The University Of California Molecular adapter for capture and manipulation of transfer RNA
WO2015150786A1 (en) 2014-04-04 2015-10-08 Oxford Nanopore Technologies Limited Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid
GB201417712D0 (en) 2014-10-07 2014-11-19 Oxford Nanopore Tech Ltd Method
WO2015189636A1 (en) 2014-06-13 2015-12-17 Illumina Cambridge Limited Methods and compositions for preparing sequencing libraries
US10017759B2 (en) 2014-06-26 2018-07-10 Illumina, Inc. Library preparation of tagged nucleic acid
CN112430641A (zh) 2014-06-30 2021-03-02 亿明达股份有限公司 使用单侧转座的方法和组合物
WO2016022557A1 (en) 2014-08-05 2016-02-11 Twist Bioscience Corporation Cell free cloning of nucleic acids
US10435685B2 (en) 2014-08-19 2019-10-08 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
EP3183367B1 (en) 2014-08-19 2019-06-26 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
CN117164682A (zh) 2014-09-01 2023-12-05 弗拉芒区生物技术研究所 突变csgg孔
GB201418159D0 (en) 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
WO2016138080A1 (en) 2015-02-24 2016-09-01 Trustees Of Boston University Protection of barcodes during dna amplification using molecular hairpins
GB2550712B (en) 2015-02-26 2021-01-13 Hitachi High Tech Corp Method for constructing hairpin-containing nucleic acid molecules for nanopore sequencing
GB201609220D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
CN107488656B (zh) 2016-06-13 2020-07-17 陆欣华 一种核酸等温自扩增方法
GB201807793D0 (en) 2018-05-14 2018-06-27 Oxford Nanopore Tech Ltd Method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006028508A2 (en) * 2004-03-23 2006-03-16 President And Fellows Of Harvard College Methods and apparatus for characterizing polynucleotides
WO2010004265A1 (en) * 2008-07-07 2010-01-14 Oxford Nanopore Technologies Limited Enzyme-pore constructs
WO2010086622A1 (en) * 2009-01-30 2010-08-05 Oxford Nanopore Technologies Limited Adaptors for nucleic acid constructs in transmembrane sequencing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
J. R. Soc. Interface (Published online2011. 6. 29.) Vol.8:1369-1378 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170063889A (ko) * 2014-10-07 2017-06-08 옥스포드 나노포어 테크놀로지즈 리미티드 변형된 효소

Also Published As

Publication number Publication date
BR112015021788A2 (ko) 2017-08-29
EP2964779B1 (en) 2018-08-29
US20160010147A1 (en) 2016-01-14
CN105209634A (zh) 2015-12-30
JP6408494B2 (ja) 2018-10-17
BR112015021788B1 (pt) 2023-02-28
CN105209634B (zh) 2020-05-12
US20230212665A1 (en) 2023-07-06
JP2016510593A (ja) 2016-04-11
AU2014224432A1 (en) 2015-09-10
US11560589B2 (en) 2023-01-24
CA2901545A1 (en) 2014-09-12
US20190211390A1 (en) 2019-07-11
WO2014135838A1 (en) 2014-09-12
CA2901545C (en) 2019-10-08
KR102168813B1 (ko) 2020-10-22
SG11201507138RA (en) 2015-10-29
EP2964779A1 (en) 2016-01-13
BR112015021788A8 (pt) 2022-08-02
US10221450B2 (en) 2019-03-05
AU2014224432B2 (en) 2019-10-24

Similar Documents

Publication Publication Date Title
KR102168813B1 (ko) 효소 정지 방법
KR102280161B1 (ko) 방법
KR102558931B1 (ko) 핵산 가이드 뉴클레아제
CN106460061B (zh) 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法
KR102457147B1 (ko) 나노 세공 rna 특징 규명을 위한 방법
EP2798084B1 (en) Enzyme method
EP3033435B1 (en) Method for fragmenting nucleic acid by means of transposase
KR101963918B1 (ko) 커플링 방법
EP2895618B1 (en) Sample preparation method
KR20140050067A (ko) 막횡단 포어를 사용한 이중 가닥 폴리뉴클레오티드 서열분석을 위한 헤어핀 루프 방법
KR20170005829A (ko) 모기 제어를 위한 조성물 및 그의 용도
EP2798083A1 (en) Method for characterising a polynucelotide by using a xpd helicase
KR20130117753A (ko) 포스포케톨라아제를 포함하는 재조합 숙주 세포
AU2016295174A1 (en) Genetic testing for predicting resistance of salmonella species against antimicrobial agents
AU2016295177A1 (en) Genetic testing for predicting resistance of serratia species against antimicrobial agents
JP2002355074A (ja) 腸管出血性病原性大腸菌o157:h7に特異的な核酸分子およびポリペプチド並びにこれらの使用方法
AU2016296900A1 (en) Genetic testing for predicting resistance of morganella species against antimicrobial agents
KR20240006496A (ko) Omni 90-99, 101, 104-110, 114, 116, 118-123, 125, 126, 128, 129, 및 131-138 crispr 뉴클레아제
KR20240052720A (ko) 신규한 omni 117, 140, 150-158, 160-165, 167-177, 180-188, 191-198, 200, 201, 203, 205-209, 211-217, 219, 220, 222, 223, 226, 227, 229, 231-236, 238-245, 247, 250, 254, 256, 257, 260 및 262 crispr 뉴클레아제

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right