KR20150126026A - 효소 정지 방법 - Google Patents
효소 정지 방법 Download PDFInfo
- Publication number
- KR20150126026A KR20150126026A KR1020157027690A KR20157027690A KR20150126026A KR 20150126026 A KR20150126026 A KR 20150126026A KR 1020157027690 A KR1020157027690 A KR 1020157027690A KR 20157027690 A KR20157027690 A KR 20157027690A KR 20150126026 A KR20150126026 A KR 20150126026A
- Authority
- KR
- South Korea
- Prior art keywords
- polynucleotide
- helicase
- spacer
- helicases
- seq
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N13/00—Treatment of microorganisms or enzymes with electrical or wave energy, e.g. magnetism, sonic waves
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
- G01N27/416—Systems
- G01N27/447—Systems using electrophoresis
- G01N27/44704—Details; Accessories
- G01N27/44717—Arrangements for investigating the separated zones, e.g. localising zones
- G01N27/4473—Arrangements for investigating the separated zones, e.g. localising zones by electric means
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
- G01N27/416—Systems
- G01N27/447—Systems using electrophoresis
- G01N27/44756—Apparatus specially adapted therefor
- G01N27/44791—Microapparatus
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/483—Physical analysis of biological material
- G01N33/487—Physical analysis of biological material of liquid biological material
- G01N33/48707—Physical analysis of biological material of liquid biological material by electrical means
- G01N33/48721—Investigating individual macromolecules, e.g. by translocation through nanopores
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/50—Other enzymatic activities
- C12Q2521/513—Winding/unwinding enzyme, e.g. helicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/164—Methylation detection other then bisulfite or methylation sensitive restriction endonucleases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2565/00—Nucleic acid analysis characterised by mode or means of detection
- C12Q2565/60—Detection means characterised by use of a special device
- C12Q2565/631—Detection means characterised by use of a special device being a biochannel or pore
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y306/00—Hydrolases acting on acid anhydrides (3.6)
- C12Y306/04—Hydrolases acting on acid anhydrides (3.6) acting on acid anhydrides; involved in cellular and subcellular movement (3.6.4)
- C12Y306/04012—DNA helicase (3.6.4.12)
Abstract
본 발명은 폴리뉴클레오티드 상에서 헬리카제가 스페이서를 지나도록 이동시키고, 헬리카제의 폴리뉴클레오티드 상에의 로딩을 제어하는 신규한 방법에 관한 것이다. 본 발명은 또한 헬리카제를 사용하여 표적 폴리뉴클레오티드의 특징을 규명하는 신규한 방법에 관한 것이다.
Description
본 방법은 폴리뉴클레오티드 상에서 헬리카제가 스페이서를 지나도록 이동시키고, 헬리카제의 폴리뉴클레오티드 상에의 로딩을 제어하는 신규한 방법에 관한 것이다. 본 발명은 또한 헬리카제를 사용하여 표적 폴리뉴클레오티드의 특징을 규명하는 신규한 방법에 관한 것이다.
현재 다양한 적용에 걸쳐 신속하고, 저렴한 폴리뉴클레오티드 (예컨대, DNA 또는 RNA) 서열분석 및 확인 기술이 요구되고 있다. 현재 기술은 주로 다량의 폴리뉴클레오티드를 제조하고, 신호 검출을 위해 전문가용 형광성 화학 물질을 다량으로 필요로 하기 때문에, 속도가 느리고, 고가이다.
막횡단 포어 (나노포어)는 중합체 및 다양한 소형 분자에 대한 직접적인 전기 바이오센서로서의 큰 잠재능을 가지고 있다. 특히, 최근에는 나노포어가 잠재적인 DNA 서열분석 기술로서 주목을 받아오고 있다.
전위가 나노포어를 통해 인가되면, 분석물, 예컨대, 뉴클레오티드가 일정 기간 동안 장벽에 일시적으로 존재할 때 전류는 변화하게 된다. 뉴클레오티드의 나노포어 검출이 공지된 시그니처 및 지속 기간의 전류 변화를 일으킨다. "가닥 서열분석" 방법에서, 단일 폴리뉴클레오티드 가닥은 포어를 통해 통과되고, 뉴클레오티드의 동일성가 유도된다. 가닥 서열분석은 포어를 통과하는 폴리뉴클레오티드의 이동을 제어하기 위해 뉴클레오티드 취급 단백질, 예컨대, 헬리카제를 사용하는 것을 포함할 수 있다.
폴리뉴클레오티드 중 스페이서는 전형적으로 헬리카제를 정지시킬 수 있고, 즉, 헬리카제가 스페이서를 지나 폴리뉴클레오티드를 따라 추가로 이동하지 못하도록 막을 수 있다. 본 발명자들은 놀랍게도 헬리카제 및 폴리뉴클레오티드를 막횡단 포어와 접촉시키고, 전위를 인가함으로써 폴리뉴클레오티드에서 하나 이상의 정지된 헬리카제가 스페이서를 지나도록 이동시킬 수 있다는 것을 입증하였다. 헬리카제는 전형적으로는 포어를 통과하기에는 너무 크기 때문에, 전위를 따라 포어를 통과하여 이동하는 폴리뉴클레오티드의 힘은 헬리카제가 스페이서를 지나도록 이동시킨다. 이는 폴리뉴클레오티드의 이동을 제어하고, 폴리뉴클레오티드의 특징을 규명하는 데, 예컨대, 서열분석하는 데 중요하게 적용된다. 본 발명자들은 또한 놀랍게도 하나 이상의 스페이서를 사용하여 하나 이상의 헬리카제의 폴리뉴클레오티드 상에의 로딩을 제어할 수 있는 것 또한 입증하였다.
그러므로, 본 발명은 (a) 하나 이상의 정지된 헬리카제 및 표적 폴리뉴클레오티드를 막횡단 포어와 접촉시키는 단계, 및 (b) 전위를 포어를 통해 인가하여 표적 폴리뉴클레오티드 상에서 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 단계를 포함하는, 표적 폴리뉴클레오티드에서 하나 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 방법을 제공한다.
본 발명은 또한
- (a) 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계; (b) 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 하나 이상의 스페이서에서 정지하도록 하는 단계; (c) 표적 폴리뉴클레오티드 및 하나 이상의 정지된 헬리카제를 포어와 접촉시키는 단계; 및 (d) 포어를 통해 전위를 인가하여 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나 이동하도록 하고, 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하도록 하는 단계를 포함하는, 막횡단 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 방법;
- (a) 본 발명의 막횡단 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 방법을 수행하는 단계; 및 (b) 폴리뉴클레오티드가 포어와 관련하여 이동함에 따라 하나 이상의 측정치를 측정하여 표적 폴리뉴클레오티드의 특징을 규명하고, 여기서 측정치는 폴리뉴클레오티드의 하나 이상의 특징을 나타내는 것인 단계를 포함하는, 표적 폴리뉴클레오티드의 특징을 규명하는 방법;
- (a) 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계; 및 (b) (a)에서 제공받은 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 폴리뉴클레오티드에 결합하고, 각 스페이서에서 정지하도록 하는 단계를 포함하는, 하나 이상의 헬리카제의 표적 폴리뉴클레오티드 상에의 로딩을 제어하는 방법;
- 표적 폴리뉴클레오티드의 이동을 제어하기 위한 어댑터로서, 여기서, 어댑터는 5'→3' 방향으로 (a) (L-S-D)n 또는 (D-S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, D는 이중 가닥 폴리뉴클레오티드이고, 여기서, n은 정수임), 및 (b) 각 어댑터 상에서 정지된 하나 이상의 헬리카제를 포함하는 것인, 어댑터; 및
- 표적 폴리뉴클레오티드의 이동을 제어하기 위한 키트로서, 여기서, 키트는 (a) 하나 이상의 스페이서, (b) 하나 이상의 헬리카제 및 (c) 막횡단 포어를 포함하는 것인 키트를 제공한다.
도 1은 실시예 1에서 사용된 람다 DNA 구축물의 다이어그램을 보여주는 것이다. 서열 9 (A로 표지)는 그의 3' 말단에서 4개의 iSpC3 스페이서 (B로 표지)에 부착되어 있다. 4개의 iSpC3 스페이서는 서열 10 (C로 표지)의 5' 말단에 부착되어 있다. 서열 10은, 서열 11 (E로 표지) 그의 5' 말단에 부착되어 있는 4개의 iSpC3 스페이서 (D로 표지)에 부착되어 있다. 서열 10은 서열 12 (F로 표지, 3' 콜레스테롤 테더를 가진다)에 혼성화된다.
도 2는 헬리카제 (T4 Dda - E94C/A360C (돌연변이 E94C/A360C, 및 이어서, (ΔM1)G1G2를 포함하는 서열 8))가 나노포어 (MS(B1- G75S/G77S/L88N/Q126R)8 MspA (MspA - B2C) (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 (기술된 바와 같이 0.2 nM이고, 도 1에 도시된 것과 같은) 람다 DNA 구축물의 전위를 제어할 때의, 예시적인 전류 트레이스 (y축 표지 = 전류 ((pA), 20 내지 120), x축 표지 = 시간 ((s), 3,500 내지 8,000))를 보여주는 것이다.
도 3은 도 2의 전류 트레이스에 제시된 헬리카제 제어형 DNA 이동에 대한 확대된 영역을 보여주는 것이다 (상단 및 하단 트레이스, 둘 모두에 대하여 y축 표지 = 전류 ((pA), 상단 트레이스 20 내지 80, 하단 트레이스 20 내지 60), x축 표지 = 시간 ((s), 상단 트레이스 2,995 내지 3,020, 하단 트레이스 8,140 내지 8,170)). a)는 헬리카제 제어형 DNA 이동 시작점을 보여주는 것이고, b)는 헬리카제 제어형 DNA 이동 종점을 보여주는 것이다. 화살표로 표지된 1은 (나노포어에 의해 포획되기 이전에 효소의 이동을 정지시키는 데 사용되는) 첫번째 4개의 iSpC3 스페이서가 나노포어를 통해 이동할 때의 것에 상응한다. 화살표로 표지된 2는 나노포어를 통해 이동하는 두번째 4개의 iSpC3 스페이서 기의 것에 상응한다.
도 4(a)는 실시예 2에서 사용되는 헤어핀 및 Y형 MuA 기질 디자인을 보여주는 것이다. 서열 19의 dUMP는 삼각형으로 강조 표시되어 있고, iSpC3 스페이서는 x로 제시되어 있다. 도 4(b)는 실시예 2에서 설명되는 샘플 제조 방법 동안 제조된 람다 DNA 구축물을 보여주는 것이다. 람다 DNA의 5-10 kB 단편은 X로 표지되어 있고, 폴리머라제에 의해 충전되고, 리가제에 의해서 구축물 나머지 부분에 연결되는 DNA 단편은 y로 표지되어 있고 (점선으로 제시되어 있고), iSpC3 스페이서는 x로 제시되어 있다. 테더 서열 (서열 16)은 제시된 DNA 구축물에 혼성화된다. 2개의 티민 잔기 및 3' 콜레스테롤 TEG (회색 동그라미로 제시)에 부착된 6개의 iSp18 스페이서는 서열 16의 3' 말단에 부착되어 있다.
도 5는 헬리카제 (Trwc Cba (서열 9))가 나노포어 (MS(B1-G75S/G77S/L88N/Q126R)8 MspA (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 (도 4b에 제시된) 람다 DNA 구축물의 전위를 제어할 때의, 예시적인 전류 트레이스 (상단 및 하단 트레이스, 둘 모두에 대하여 y축 표지 = 전류 (pA), x축 표지 = 시간 (s))를 보여주는 것이다. 상단 트레이스는 나노포어를 통한 전체 람다 DNA 구축물의 헬리카제 제어형 DNA 이동을 보여주는 것이고, X1로 표지된 첫번째 iSpC3 스페이서는 1로 표지된 전류 스파이크를 생성하고, X2로 표지된 두번째 iSpC3 스페이서는 2로 표지된 전류 스파이크를 생성한다. 하단 트레이스는 나노포어를 통한 헬리카제 제어형 DNA 이동 종점에 대한 확대된 영역을 보여주는 것이고, X3으로 표지된 세번째 iSpC3 스페이서는 3으로 표지된 전류 스파이크를 생성한다.
도 6(a)는 실시예 3에서 사용되는 헤어핀 및 Y형 MuA 기질 디자인을 보여주는 것이다. 5' 포스페이트는 동그라미로 표지화되어 있고, 서열 18 중의 이노신은 직사각형으로 강조 표시되어 있고, iSpC3 스페이서는 x로 제시되어 있다. 도 6(b)는 실시예 3에서 설명되는 샘플 제조 방법 동안 제조된 람다 DNA 구축물을 보여주는 것이다. 람다 DNA의 5-10 kB 단편은 X로 표지화되어 있고, x에 부착되지 않은 이노신은 직사각형으로 표지화되어 있고, iSpC3 스페이서는 x로 제시되어 있다. 테더 서열 (서열 16)은 제시된 DNA 구축물에 혼성화된다. 2개의 티민 잔기 및 3' 콜레스테롤 TEG (회색 동그라미로 제시)에 부착된 6개의 iSp18 스페이서는 서열 16의 3' 말단에 부착되어 있다.
도 7은 헬리카제 (Trwc Cba (서열 17))가 나노포어 (MS(B1-G75S/G77S/L88N/Q126R)8 MspA (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 (도 6b에 제시된) 람다 DNA 구축물의 전위를 제어할 때의, 예시적인 전류 트레이스 (상단 및 하단 트레이스, 둘 모두에 대하여 y축 표지 = 전류 (pA), x축 표지 = 시간 (s))를 보여주는 것이다. 상단 트레이스는 나노포어를 통한 전체 람다 DNA 구축물의 헬리카제 제어형 DNA 이동을 보여주는 것이고, X1로 표지된 첫번째 iSpC3 스페이서는 1로 표지된 전류 스파이크를 생성하고, X2로 표지된 두번째 iSpC3 스페이서는 2로 표지된 전류 스파이크를 생성하고, X3으로 표지된 세번째 iSpC3 스페이서는 3으로 표지된 전류 스파이크를 생성한다. 하단 트레이스는 나노포어를 통한 헬리카제 제어형 DNA 이동의 후반부에 대한 확대된 영역을 보여주는 것이고, X2로 표지된 두번째 iSpC3 스페이서는 2로 표지된 전류 스파이크를 생성하고, X3으로 표지된 세번째 iSpC3 스페이서는 3으로 표지된 전류 스파이크를 생성한다.
도 8은 효소 활성을 시험하기 위한 형광 검정법이다. 시판용 형광성 기질을 사용하여 혼성화된 dsDNA를 치환할 수 있는 헬리카제 (a로 표지)의 능력에 대해 검정하였다. 1) 형광성 기질 가닥 (최종 48.75 nM, 서열 25 및 26)은 3' ssDNA 오버행 (20개의 염기), 및 혼성화된 dsDNA의 40개의 염기 섹션을 가진다. 상단 가닥 (b)는 서열 25의 5' 말단에 카르복시플루오레세인 염기 (c)를 가지고, 혼성화된 상보체 (d)는 서열 26의 3' 말단에 블랙-홀 소광제 (BHQ-1) 염기 (e)를 가진다. 혼성화되면, 플루오레세인으로부터의 형광은 국소 BHQ-1에 의해 소광되고, 기질은 본질적으로 비형광성이 된다. 형광성 기질의 하단 가닥과 부분적으로 상보적인, 0.975 μM의 포획 가닥 (f, 서열 27)이 본 검정에 포함된다. 2) ATP (0.975 mM) 및 MgCl2 (10 mM)의 존재하에서, 헬리카제 Hel308 Mbu (12 nM, 서열 28)는 제시된 바와 같이 형광성 기질의 3' 오버행에 결합하여 상단 가닥을 따라 이동하여 상보성 가닥 (d)을 치환시킨다. 3) 일단 BHQ-1을 포함하는 상보성 가닥이 완전하게 치환되고 나면, 주요 가닥 상의 플루오레세인은 형광을 발한다 (별표 표시). 4) 치환된 하단 가닥 (d)은 과량의 포획 가닥 (f)에 어닐링하여 초기 기질의 재어닐링 및 형광 손실을 막는다.
도 9는 효소 활성을 시험하기 위한 형광 검정법이다. 2가지 가능한 형광성 기질을 사용하여 혼성화된 dsDNA를 치환할 수 있는 헬리카제 (a로 표지)의 능력에 대해 검정하였으며, 이는 도 9에 제시되어 있는데, (a) (1C-3C로 표지)는 서열 27의 3' 말단을 서열 29의 3' 말단에 연결하는 4개의 Sp9 스페이서 (검은색 삼각형으로 제시)를 가지고, (b) (1B-3B로 표지)는 서열 27의 3' 말단을 서열 29의 3' 말단에 연결하는 1개의 Sp9 스페이서 (검은색 삼각형으로 제시)를 가진다. 형광성 기질 가닥 (최종 48.75 nM, 앞서 기술된 a) 또는 b))은 3' ssDNA 오버행 (20개의 염기), 및 혼성화된 dsDNA의 40개의 염기 섹션을 가진다. 상단 가닥 (b)는 서열 27의 5' 말단에 카르복시플루오레세인 염기 (c)를 가지고, 혼성화된 상보체 (d)는 서열 26의 3' 말단에 블랙-홀 소광제 (BHQ-1) 염기 (e)를 가진다. 혼성화되면, 플루오레세인으로부터의 형광은 국소 BHQ-1에 의해 소광되고, 기질은 본질적으로 비형광성이 된다. 형광성 기질의 하단 가닥과 부분적으로 상보적인, 1 μM의 포획 가닥 (f, 서열 27)이 본 검정에 포함된다. 2 a 및 b). ATP (0.975 mM) 및 MgCl2 (10 mM)의 존재하에서, 헬리카제 Hel308 Mbu (서열 28)는 형광성 기질의 3' 오버행에 결합하여 상단 가닥을 따라 최대 Sp9 기(들)까지 이동한다. sp9 기 (B에서 1개, 및 C에서 4개)는 헬리카제가 그를 지나 이동하지 못하게 막고, 헬리카제는 상보성 가닥 (서열 26)을 치환하지 못한다. 그러므로, 플루오레세인 및 블랙 홀 소광제는 서로 매우 인접한 상태 그대로 유지되며, 형광은 관찰되지 않는다.
도 10은 400 mM의 KCl에서 Hel308 Mbu 헬리카제 (A로 표지, 서열 28)에 대한, 완충제 용액 (100 mM HEPES (pH 8), 0.975 mM ATP, 10 mM MgCl2, 1 mg/mL BSA, 48.75 nM 형광성 기질 DNA (A = 서열 25 및 26, B = 1개의 Sp9 스페이서에 의해 그의 3' 말단에서 서열 29의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27, C = 4개의 Sp9 스페이서에 의해 그의 3' 말단에서 서열 29의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27), 0.975 μM 포획 DNA (서열 27)) 중에서의 상대적인 dsDNA 교체율의 그래프 (y축 = 상대적인 dsDNA 교체율, x축 = 형광성 기질)를 보여주는 것이다.
도 11은 400 mM의 KCl에서 Hel308 Mbu 헬리카제 (A로 표지, 서열 28)에 대한, 완충제 용액 (100 mM HEPES (pH 8), 0.975 mM ATP, 10 mM MgCl2, 1 mg/mL BSA, 48.75 nM 형광성 기질 DNA (D = 서열 32 및 26, E = 1개의 idSp 기에 의해 그의 3' 말단에서 서열 30의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27, F = 4개의 idSp 기에 의해 그의 3' 말단에서 서열 31의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27, 및 G = 서열 26에 혼성화된 서열 33), 0.975 μM 포획 DNA (서열 27)) 중에서의 상대적인 dsDNA 교체율의 그래프 (y축 = 상대적인 dsDNA 교체율, x축 = 형광성 기질)를 보여주는 것이다.
도 12는 헬리카제 (1로 표지)를 정지시키는 iSpC3 또는 iSp18 스페이서를 함유하지 않는 대조군 가닥에 대한 실험 단계를 보여주는 것이다. 대조군 가닥 (서열 34)은 스페이서 또는 차단 기를 함유하지 않고, DNA의 더 짧은 상보성 가닥 (서열 35, 그의 5' 말단에 회색 동그라미로 제시된 카르복시플루오레세인이 부착되어 있다)에 혼성화된다. 이는 50개의 뉴클레오티드로 된 오버행을 갖는 부분적으로 이중 가닥 구축물을 제조한다. 구축물 (서열 35에 혼성화된 서열 34)을 T4 Dda - E94C/A360C와 함께 미리 인큐베이션시켜 상기 효소가 오버행에 결합할 수 있도록 한다. 제시된 바와 같이, 오버행의 길이로 인해, 1 초과의 효소가 그에 결합할 수 있다. 이어서, 헬리카제 이동을 촉진시키기 위해 효소에 필요한 성분을 제공한다 (ATP 및 MgCl2). ATP 및 MgCl2와 함께 추가의 포획 가닥 (서열 37) 또한 첨가한다. 이어서, 헬리카제는 대조군 가닥을 따라 전위되어 더 짧은 상보성 가닥을 치환하고, 대조군 가닥은 헬리카제를 함유하지 않게 되거나, 또는 상보성 가닥에 결합된 상태로 남게 된다 (A로 표지). 이어서, 상보성 가닥은 헤어핀을 형성함으로써, 이는 대조군 가닥에 재어닐링할 수 없다 (B로 표지). 이어서, 용액 중에 유리 상태이거나, 또는 대조군 DNA를 따라 이동하고, 말단에서 떨어진 헬리카제는 제시된 바와 같은 과량의 포획 가닥 (서열 37, C로 표지된 복합체)에 의해 결합된다. 헬리카제에 결합하지 않은 임의의 DNA는 무손상 상태 그대로 유지된다 (F 종 그대로 유지). 이어서, 샘플 혼합물을 겔 상에 전개시키고, 그를 통해 겔 상에 생성된 밴드에 의해 별개의 종을 확인한다.
도 13은 헬리카제 (1로 표지)를 정지시키기 위한 iSpC3 또는 iSp18 스페이서 (도에서 X로 표시)를 함유하는 가닥에 대한 실험 단계를 보여주는 것이다. 도 12에 제시된 것과 같은 방법을 수행하였고, 효소를 DNA 구축물과 미리 인큐베이션시켰다 (더 짧은 상보성 가닥에는 그의 5' 말단에 카르복시플루오레세인이 부착되어 있다). 스페이서 기는 이중 가닥 영역의 앞쪽에 위치하고, 헬리카제는 제시된 바와 같이 DNA에 결합할 수 있다. ATP, MgCl2 및 포획 DNA (2로 표지) 첨가시, 이때 헬리카제는 헬리카제 이동을 촉진시키는 필요 성분을 제공받게 된다. 스페이서가 헬리카제를 정지시킬 수 있다면, 이때는 짧은 상보성 가닥을 여전히 함유하는 DNA 구축물에 결합한 상태 그대로 유지될 것이다 (D로 표지). 스페이서가 헬리카제를 정지시킬 수 없다면, 이때는 스페이서를 지나 이동하여 상보성 가닥을 치환하게 되고 (B로 표지), 어떤 헬리카제도 결합되어 있지 않은 A 종이 남게 된다. 이어서, 유리 효소는 과량의 포획 가닥 (C로 표지)에 결합하고, 치환된 상보성 가닥은 헤어핀을 형성하게 될 것이다 (B로 표지). 스페이서가 2개의 헬리카제가 아닌, 1개의 헬리카제를 정지시킬 수 있다면, 이때 제1 헬리카제는 뒤쪽에 있는 헬리카제에 의해서 스페이서를 지나도록 인출될 것이며, 상보성 가닥을 치환하게 될 것이다. 그러나, 제2 헬리카제는 스페이서를 지나 이동할 수 없고, E로 표지된 복합체로 형성된다. 헬리카제에 결합하지 않은 임의의 DNA는 어떤 헬리카제도 결합되어 있지 않은 무손상 상태 그대로 유지된다 (F 종). 이어서, 샘플 혼합물을 겔 상에 전개시키고, 그를 통해 겔 상에 생성된 밴드에 의해 별개의 종을 확인한다.
도 14는 대조군 가닥 (하기 표 11에서 1)에 대하여 실행된 겔 검정법을 보여주는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1,000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 레인 1은 오직 어닐링된 DNA (서열 35에 혼성화된 서열 34)만을 함유한다. 레인 2는 대조군 가닥에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다 (연료 비첨가). 레인 3은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 대조군 가닥을 보여주는 것이다. 레인 4는 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 대조군 가닥을 보여주는 것이다. 밴드 X는 오직 서열 34에만 상응하고, 밴드 Y는 서열 35에 혼성화된 서열 34에 상응한다. 1Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 1개의 헬리카제에 상응한다. 2Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 2개의 헬리카제에 상응한다. 3Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 3개의 헬리카제에 상응한다. 4Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 4개의 헬리카제에 상응한다. 5Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 5개의 헬리카제에 상응한다.
도 15는 ssDNA와 dsDNA 사이의 연접부에 3개 (하기 표 11에서 7, 레인 = 1-4에 상응), 4개 (하기 표 11에서 8, 레인 = 5-8에 상응) 및 5개 iSp18 스페이서 (하기 표 11에서 9, 레인 = 9-12에 상응)를 함유하는 DNA 구축물에 대하여 실행된 겔 검정법을 보여주는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 레인 1은 오직 어닐링된 DNA (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)만을 함유한다. 레인 2는 연료가 첨가되지 않은 상태에서, DNA 구축물 (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다. 레인 3은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 4는 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 5는 오직 어닐링된 DNA (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)만을 함유한다. 레인 6은 연료가 첨가되지 않은 상태에서, DNA 구축물 (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다. 레인 7은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 8은 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 9는 오직 어닐링된 DNA (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)만을 함유한다. 레인 10은 연료가 첨가되지 않은 상태에서, DNA 구축물 (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다. 레인 11은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 12는 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 밴드 X는 오직 ssDNA 구축물 (예컨대, 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 36의 5' 말단에 부착되어 있다)에만 상응하고, 밴드 Y는 dsDNA 구축물 (그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에만 상응한다. 1X로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 36에 부착되어 있다)에 결합된 1개의 헬리카제에 상응한다. 1Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 1개의 헬리카제에 상응한다. 2Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 2개의 헬리카제에 상응한다. 3Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 3개의 헬리카제에 상응한다. 4Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 4개의 헬리카제에 상응한다. 5Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 5개의 헬리카제에 상응한다.
도 16은 실시예 9에서 사용된 표준 DNA 구축물을 보여주는 것이다. x는 헬리카제가 결합할 수 없는 스페이서 기를 나타낸다. 1로 표지된 영역의 길이는 상기 영역에 결합할 수 있는 헬리카제의 개수를 제어하기 위해 변경될 수 있다. 실시예와 같이, 본 도면은 영역 1에 1 또는 2개의 헬리카제가 결합되어 있는 것을 보여준다.
도 17은 표 12에 3으로 표지된 DNA 구축물 (서열 9의 5' 말단에 부착되어 있는 5개의 iSpC3 스페이서, 서열 9는 그의 3' 말단에서 4개의 iSpC3 스페이서에 부착되어 있고, iSpC3 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)의 예시적인 겔 검정법을 보여주는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1,000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 레인 1-6은 상이한 농도의 T4 Dda - E94C/A360C에 상응하는 것이다 (1 = 5,000 nM, 2 = 2,500 nM, 3 = 1,250 nM, 4 = 625 nM, 5 = 312.5 nM 및 6 = 0 nM). X 수준에서 관찰된 밴드는 비결합 dsDNA 구축물에 상응하는 것이다. 겔 좌측에 기재된 수치는 DNA에 결합된 효소의 개수에 관한 것이다. 상기 DNA 구축물의 경우, 첨가된 최고 농도의 효소에서 최대 6개까지의 헬리카제에 결합할 수 있다. 겔의 상단에 제시된 수치는 첨가된 T4 Dda - E94C/A360C의 농도에 상응하는 것이다.
도 18은 실시예 9에서 사용된 DNA 구축물을 보여주는 것이다. A 및 B로 표지된 영역은 디자인된 짧은 DNA 가닥 (서열 37)이며, 이로써, 1개의 헬리카제가 각 영역 (우측에 제시)에 결합할 수 있다. 영역 1은 25개의 SpC3 스페이서에 상응하고, 영역 2는 2개의 iSp18 스페이서에 상응하고, 영역 3은 2개의 iSp18 스페이서에 상응하고, 영역 4는 포크형 DNA로 구성될 수 있거나, 또는 구성될 수 없는 또 다른 DNA 가닥 (예컨대, 서열 42 = 비포크형 (7로 표지된 단편 결실) 및 (7로 표지된 단편으로 제시된) 6개의 iSp18 스페이서에 부착된 서열 12 = 포크형)에 혼성화하는 DNA 섹션 (서열 10)에 상응하고, 영역 5는 4개의 5-니트로인돌에 상응하고, 영역 6은 그의 상보체 (서열 43)에 혼성화된 또 다른 DNA 영역 (서열 41)에 상응한다.
도 19는 도 18에 기술되고 제시된 DNA 구축물의 겔 검정법을 보여주는 것이다. X 수준에서 관찰된 밴드는 비결합 dsDNA 구축물에 상응하는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 겔 좌측에 기재된 수치는 DNA에 결합된 효소의 개수에 관한 것이다. 상기 DNA 구축물의 경우, 475 nM 이상인 농도의 효소로부터 2개의 헬리카제 (도 18에 제시된 바와 같이, 하나는 영역 A에, 및 또 다른 하나는 영역 B에)의 결합을 관찰할 수 있었다. 겔의 상단에 제시된 수치는 첨가된 T4 Dda - E94C/A360C의 농도에 상응하는 것이다.
도 20은 실시예 10에서 사용된 DNA 구축물 (DNA 구축물 X1로 지칭)을 보여주는 것이다. 서열 38의 5' 말단에 부착된 25개의 SpC3 스페이서 (x로 표시)가 존재하고, 서열 38은 그의 3' 말단에서 4개의 iSp18 스페이서 (검은색 사각형으로 표시)에 부착되어 있다. 4개의 iSp18 스페이서는 서열 10의 5' 말단에 부착되어 있고, 서열 10은 그의 3' 말단에서 4개의 5-니트로인돌 (회식 삼각형으로 표시)에 부착되어 있다. 이어서, 4개의 니트로인돌은 서열 41의 5' 말단에 부착되어 있다. 서열 41에 혼성화되는 상보성 DNA 가닥은 서열 43이다. 서열 10에 혼성화되는 상보성 DNA 가닥은 서열 12 (서열 12의 3' 말단에는 2개의 티민 잔기 및 3' 콜레스테롤 TEG (회색 동그라미로 제시)에 부착된 6개의 iSp18 스페이서가 부착되어 있다)이다. A로 표지된 영역은 T4 Dda - E94C/A360C가 결합할 수 있는 구축물의 영역에 상응한다.
도 21은 헬리카제 (T4 Dda - E94C/A360C)가 나노포어 (MspA - B2C)를 통과하는 DNA 구축물 (0.1 nM, 도 20 설명 참조의 전위를 제어할 때의, 예시적인 전류 트레이스 (y축 표지 = 전류 ((pA), 50 내지 250), x축 표지 = 시간 ((s), 238 내지 252))를 보여주는 것이다. 1로 표지된 영역은 나노포어를 통과하는 폴리T 영역 (서열 38, 그 위에 효소가 결합되어 있는 것)의 헬리카제 제어형 전위를 보여주는 것이다. 2로 표지된 영역은 나노포어를 통과하는 나노포어를 통과하는 iSp18 스페이서의 헬리카제 제어형 전위를 보여주는 것이다.
도 22는 실시예 4에서 사용된 DNA 구축물의 다이어그램을 보여주는 것이다. 2개의 티민이 28개의 iSpC3 스페이서 (A로 표지)의 3' 말단에 부착되어 있다. 28개의 iSpC3 스페이서는 나머지 다른 한쪽 말단에서 서열 23의 5' 말단에 부착되어 있다 (서열은 영역 B = 폴리T 섹션, 및 영역 C = 테더 서열 (서열 12에 상보적인 서열에 상응한다). 서열 23의 3' 말단은 4개의 iSpC3 스페이서 (D로 표지)에 부착되어 있다. 4개의 iSpC3 스페이서의 나머지 다른 한쪽 말단은 서열 24의 5' 말단에 부착되어 있다. 테더 서열 (서열 12)은 그의 3' 말단에서, 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착되어 있는 6개의 iSp18 스페이서에 부착되어 있다.
서열 목록 설명
서열 1은 MS-B1 돌연변이체 MspA 단량체를 코딩하는 코돈 최적화된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 돌연변이체에는 신호 서열이 결실되어 있으며, 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다.
서열 2는 MspA 단량체의 MS-B1 돌연변이체의 성숙한 형태의 아미노산 서열을 보여주는 것이다. 상기 돌연변이체에는 신호 서열이 결실되어 있으며, 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다.
서열 3은 α-헤몰리신-E111N/K147N (α-HL-NN; 문헌 [Stoddart et al., PNAS, 2009; 106(19): 7702-7707])의 한 단량체를 코딩하는 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 4는 α-HL-NN의 한 단량체의 아미노산 서열을 보여주는 것이다.
서열 5 내지 7은 MspB, C 및 D의 아미노산 서열을 보여주는 것이다.
서열 8은 엔테로박테리아파지 T4로부터의 헬리카제 Dda 1993의 아미노산 서열을 보여주는 것이다.
서열 9는 실시예 1, 2, 3, 7 및 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 10은 실시예 1 및 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 11은 실시예 1에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 11은 그의 5' 말단에 의해, 서열 10의 3' 말단에 부착된 3개의 iSpC3 스페이서에 부착된다.
서열 12는 실시예 1 및 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 실시예 1에서, 서열 12는 그의 3' 말단에서, 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착된 6개의 iSp18 스페이서에 부착된다. 실시예 9에서, 서열 12는 그의 3' 말단에서 오직 6개의 iSp18 스페이서에만 부착된다.
서열 13은 엔테로박테리아파지 λ의 폴리뉴클레오티드 서열을 보여주는 것이다. 서열은 센스 가닥의 5' 말단에 부착된 추가의 12개의 염기 오버행을 함유한다. 본원에 제시된 서열은 오직 센스 가닥의 것이다.
서열 14는 실시예 2 및 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 14는 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛에 의해 서열 15의 5' 말단에 부착된다.
서열 15는 실시예 2 및 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 15는 그의 5' 말단에서 4개의 iSpC3 스페이서 유닛에 의해 서열 14의 3' 말단에 부착된다.
서열 16은 실시예 2 및 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것으로서, 상기 서열은 그의 3' 말단에서, 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착된 6개의 iSp18 스페이서를 가진다.
서열 17은 Trwc Cba 헬리카제의 아미노산 서열을 보여주는 것이다.
서열 18은 실시예 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 18은 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛에 의해 서열 9의 5' 말단에 부착된다. 상기 서열은 그의 5' 말단에 부착된 포스페이트, 및 1 내지 5번 위치에 5 데옥시이노신을 가진다.
서열 19는 실시예 2에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 20은 실시예 2에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 21 및 22는 하기 서열의 번호매김을 유지시키기 위한 플레이스 홀더이다.
서열 23은, 실시예 4에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 마지막의 것이 스페이서 기의 5' 말단에 부착된 추가의 2개의 T를 갖는 것인 28개의 iSpC3 스페이서 유닛은 상기 서열의 5' 말단에 부착되어 있다. 서열 24의 5' 말단에 부착된 4개의 iSpC3 스페이서 유닛은 상기 서열의 3' 말단에 부착되어 있다.
서열 24는 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 마지막의 것이 서열 23에 부착되어 있는 것인 4개의 iSpC3 스페이서 유닛은 상기 서열의 5' 말단에 부착되어 있다. 마지막의 것이 스페이서 기의 5' 말단에 부착된 추가의 2개의 T를 갖는 것인 28개의 iSpC3 스페이서 유닛은 서열 23의 5' 말단에 부착되어 있다.
서열 25는 실시예 5에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 26은 실시예 5 및 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 3' 말단에 블랙-홀 소광제 (BHQ-1) 염기를 가진다.
서열 27은 실시예 5 및 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 28은 Hel308 Mbu의 아미노산 서열을 보여주는 것이다.
서열 29는 실시예 5에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 서열은 그의 5' 말단에서 1 또는 4개의 iSp9 스페이서 기에 의해 서열 27에 연결된다.
서열 30은 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 서열은 그의 5' 말단에서 1개의 idSp 기에 의해 서열 27에 연결된다.
서열 31은 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 서열은 그의 5' 말단에서 4개의 idSp 기에 의해 서열 27에 연결된다.
서열 32는 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 33은 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 34는 실시예 7에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 35는 실시예 7 및 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 36은 실시예 7 및 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 37은 실시예 7, 8 및 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 38은 실시예 8 및 10에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 39는 실시예 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 40은 실시예 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 41은 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 42는 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 43은 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
도 2는 헬리카제 (T4 Dda - E94C/A360C (돌연변이 E94C/A360C, 및 이어서, (ΔM1)G1G2를 포함하는 서열 8))가 나노포어 (MS(B1- G75S/G77S/L88N/Q126R)8 MspA (MspA - B2C) (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 (기술된 바와 같이 0.2 nM이고, 도 1에 도시된 것과 같은) 람다 DNA 구축물의 전위를 제어할 때의, 예시적인 전류 트레이스 (y축 표지 = 전류 ((pA), 20 내지 120), x축 표지 = 시간 ((s), 3,500 내지 8,000))를 보여주는 것이다.
도 3은 도 2의 전류 트레이스에 제시된 헬리카제 제어형 DNA 이동에 대한 확대된 영역을 보여주는 것이다 (상단 및 하단 트레이스, 둘 모두에 대하여 y축 표지 = 전류 ((pA), 상단 트레이스 20 내지 80, 하단 트레이스 20 내지 60), x축 표지 = 시간 ((s), 상단 트레이스 2,995 내지 3,020, 하단 트레이스 8,140 내지 8,170)). a)는 헬리카제 제어형 DNA 이동 시작점을 보여주는 것이고, b)는 헬리카제 제어형 DNA 이동 종점을 보여주는 것이다. 화살표로 표지된 1은 (나노포어에 의해 포획되기 이전에 효소의 이동을 정지시키는 데 사용되는) 첫번째 4개의 iSpC3 스페이서가 나노포어를 통해 이동할 때의 것에 상응한다. 화살표로 표지된 2는 나노포어를 통해 이동하는 두번째 4개의 iSpC3 스페이서 기의 것에 상응한다.
도 4(a)는 실시예 2에서 사용되는 헤어핀 및 Y형 MuA 기질 디자인을 보여주는 것이다. 서열 19의 dUMP는 삼각형으로 강조 표시되어 있고, iSpC3 스페이서는 x로 제시되어 있다. 도 4(b)는 실시예 2에서 설명되는 샘플 제조 방법 동안 제조된 람다 DNA 구축물을 보여주는 것이다. 람다 DNA의 5-10 kB 단편은 X로 표지되어 있고, 폴리머라제에 의해 충전되고, 리가제에 의해서 구축물 나머지 부분에 연결되는 DNA 단편은 y로 표지되어 있고 (점선으로 제시되어 있고), iSpC3 스페이서는 x로 제시되어 있다. 테더 서열 (서열 16)은 제시된 DNA 구축물에 혼성화된다. 2개의 티민 잔기 및 3' 콜레스테롤 TEG (회색 동그라미로 제시)에 부착된 6개의 iSp18 스페이서는 서열 16의 3' 말단에 부착되어 있다.
도 5는 헬리카제 (Trwc Cba (서열 9))가 나노포어 (MS(B1-G75S/G77S/L88N/Q126R)8 MspA (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 (도 4b에 제시된) 람다 DNA 구축물의 전위를 제어할 때의, 예시적인 전류 트레이스 (상단 및 하단 트레이스, 둘 모두에 대하여 y축 표지 = 전류 (pA), x축 표지 = 시간 (s))를 보여주는 것이다. 상단 트레이스는 나노포어를 통한 전체 람다 DNA 구축물의 헬리카제 제어형 DNA 이동을 보여주는 것이고, X1로 표지된 첫번째 iSpC3 스페이서는 1로 표지된 전류 스파이크를 생성하고, X2로 표지된 두번째 iSpC3 스페이서는 2로 표지된 전류 스파이크를 생성한다. 하단 트레이스는 나노포어를 통한 헬리카제 제어형 DNA 이동 종점에 대한 확대된 영역을 보여주는 것이고, X3으로 표지된 세번째 iSpC3 스페이서는 3으로 표지된 전류 스파이크를 생성한다.
도 6(a)는 실시예 3에서 사용되는 헤어핀 및 Y형 MuA 기질 디자인을 보여주는 것이다. 5' 포스페이트는 동그라미로 표지화되어 있고, 서열 18 중의 이노신은 직사각형으로 강조 표시되어 있고, iSpC3 스페이서는 x로 제시되어 있다. 도 6(b)는 실시예 3에서 설명되는 샘플 제조 방법 동안 제조된 람다 DNA 구축물을 보여주는 것이다. 람다 DNA의 5-10 kB 단편은 X로 표지화되어 있고, x에 부착되지 않은 이노신은 직사각형으로 표지화되어 있고, iSpC3 스페이서는 x로 제시되어 있다. 테더 서열 (서열 16)은 제시된 DNA 구축물에 혼성화된다. 2개의 티민 잔기 및 3' 콜레스테롤 TEG (회색 동그라미로 제시)에 부착된 6개의 iSp18 스페이서는 서열 16의 3' 말단에 부착되어 있다.
도 7은 헬리카제 (Trwc Cba (서열 17))가 나노포어 (MS(B1-G75S/G77S/L88N/Q126R)8 MspA (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 (도 6b에 제시된) 람다 DNA 구축물의 전위를 제어할 때의, 예시적인 전류 트레이스 (상단 및 하단 트레이스, 둘 모두에 대하여 y축 표지 = 전류 (pA), x축 표지 = 시간 (s))를 보여주는 것이다. 상단 트레이스는 나노포어를 통한 전체 람다 DNA 구축물의 헬리카제 제어형 DNA 이동을 보여주는 것이고, X1로 표지된 첫번째 iSpC3 스페이서는 1로 표지된 전류 스파이크를 생성하고, X2로 표지된 두번째 iSpC3 스페이서는 2로 표지된 전류 스파이크를 생성하고, X3으로 표지된 세번째 iSpC3 스페이서는 3으로 표지된 전류 스파이크를 생성한다. 하단 트레이스는 나노포어를 통한 헬리카제 제어형 DNA 이동의 후반부에 대한 확대된 영역을 보여주는 것이고, X2로 표지된 두번째 iSpC3 스페이서는 2로 표지된 전류 스파이크를 생성하고, X3으로 표지된 세번째 iSpC3 스페이서는 3으로 표지된 전류 스파이크를 생성한다.
도 8은 효소 활성을 시험하기 위한 형광 검정법이다. 시판용 형광성 기질을 사용하여 혼성화된 dsDNA를 치환할 수 있는 헬리카제 (a로 표지)의 능력에 대해 검정하였다. 1) 형광성 기질 가닥 (최종 48.75 nM, 서열 25 및 26)은 3' ssDNA 오버행 (20개의 염기), 및 혼성화된 dsDNA의 40개의 염기 섹션을 가진다. 상단 가닥 (b)는 서열 25의 5' 말단에 카르복시플루오레세인 염기 (c)를 가지고, 혼성화된 상보체 (d)는 서열 26의 3' 말단에 블랙-홀 소광제 (BHQ-1) 염기 (e)를 가진다. 혼성화되면, 플루오레세인으로부터의 형광은 국소 BHQ-1에 의해 소광되고, 기질은 본질적으로 비형광성이 된다. 형광성 기질의 하단 가닥과 부분적으로 상보적인, 0.975 μM의 포획 가닥 (f, 서열 27)이 본 검정에 포함된다. 2) ATP (0.975 mM) 및 MgCl2 (10 mM)의 존재하에서, 헬리카제 Hel308 Mbu (12 nM, 서열 28)는 제시된 바와 같이 형광성 기질의 3' 오버행에 결합하여 상단 가닥을 따라 이동하여 상보성 가닥 (d)을 치환시킨다. 3) 일단 BHQ-1을 포함하는 상보성 가닥이 완전하게 치환되고 나면, 주요 가닥 상의 플루오레세인은 형광을 발한다 (별표 표시). 4) 치환된 하단 가닥 (d)은 과량의 포획 가닥 (f)에 어닐링하여 초기 기질의 재어닐링 및 형광 손실을 막는다.
도 9는 효소 활성을 시험하기 위한 형광 검정법이다. 2가지 가능한 형광성 기질을 사용하여 혼성화된 dsDNA를 치환할 수 있는 헬리카제 (a로 표지)의 능력에 대해 검정하였으며, 이는 도 9에 제시되어 있는데, (a) (1C-3C로 표지)는 서열 27의 3' 말단을 서열 29의 3' 말단에 연결하는 4개의 Sp9 스페이서 (검은색 삼각형으로 제시)를 가지고, (b) (1B-3B로 표지)는 서열 27의 3' 말단을 서열 29의 3' 말단에 연결하는 1개의 Sp9 스페이서 (검은색 삼각형으로 제시)를 가진다. 형광성 기질 가닥 (최종 48.75 nM, 앞서 기술된 a) 또는 b))은 3' ssDNA 오버행 (20개의 염기), 및 혼성화된 dsDNA의 40개의 염기 섹션을 가진다. 상단 가닥 (b)는 서열 27의 5' 말단에 카르복시플루오레세인 염기 (c)를 가지고, 혼성화된 상보체 (d)는 서열 26의 3' 말단에 블랙-홀 소광제 (BHQ-1) 염기 (e)를 가진다. 혼성화되면, 플루오레세인으로부터의 형광은 국소 BHQ-1에 의해 소광되고, 기질은 본질적으로 비형광성이 된다. 형광성 기질의 하단 가닥과 부분적으로 상보적인, 1 μM의 포획 가닥 (f, 서열 27)이 본 검정에 포함된다. 2 a 및 b). ATP (0.975 mM) 및 MgCl2 (10 mM)의 존재하에서, 헬리카제 Hel308 Mbu (서열 28)는 형광성 기질의 3' 오버행에 결합하여 상단 가닥을 따라 최대 Sp9 기(들)까지 이동한다. sp9 기 (B에서 1개, 및 C에서 4개)는 헬리카제가 그를 지나 이동하지 못하게 막고, 헬리카제는 상보성 가닥 (서열 26)을 치환하지 못한다. 그러므로, 플루오레세인 및 블랙 홀 소광제는 서로 매우 인접한 상태 그대로 유지되며, 형광은 관찰되지 않는다.
도 10은 400 mM의 KCl에서 Hel308 Mbu 헬리카제 (A로 표지, 서열 28)에 대한, 완충제 용액 (100 mM HEPES (pH 8), 0.975 mM ATP, 10 mM MgCl2, 1 mg/mL BSA, 48.75 nM 형광성 기질 DNA (A = 서열 25 및 26, B = 1개의 Sp9 스페이서에 의해 그의 3' 말단에서 서열 29의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27, C = 4개의 Sp9 스페이서에 의해 그의 3' 말단에서 서열 29의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27), 0.975 μM 포획 DNA (서열 27)) 중에서의 상대적인 dsDNA 교체율의 그래프 (y축 = 상대적인 dsDNA 교체율, x축 = 형광성 기질)를 보여주는 것이다.
도 11은 400 mM의 KCl에서 Hel308 Mbu 헬리카제 (A로 표지, 서열 28)에 대한, 완충제 용액 (100 mM HEPES (pH 8), 0.975 mM ATP, 10 mM MgCl2, 1 mg/mL BSA, 48.75 nM 형광성 기질 DNA (D = 서열 32 및 26, E = 1개의 idSp 기에 의해 그의 3' 말단에서 서열 30의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27, F = 4개의 idSp 기에 의해 그의 3' 말단에서 서열 31의 5' 말단에 부착되고, 서열 26에 혼성화된 서열 27, 및 G = 서열 26에 혼성화된 서열 33), 0.975 μM 포획 DNA (서열 27)) 중에서의 상대적인 dsDNA 교체율의 그래프 (y축 = 상대적인 dsDNA 교체율, x축 = 형광성 기질)를 보여주는 것이다.
도 12는 헬리카제 (1로 표지)를 정지시키는 iSpC3 또는 iSp18 스페이서를 함유하지 않는 대조군 가닥에 대한 실험 단계를 보여주는 것이다. 대조군 가닥 (서열 34)은 스페이서 또는 차단 기를 함유하지 않고, DNA의 더 짧은 상보성 가닥 (서열 35, 그의 5' 말단에 회색 동그라미로 제시된 카르복시플루오레세인이 부착되어 있다)에 혼성화된다. 이는 50개의 뉴클레오티드로 된 오버행을 갖는 부분적으로 이중 가닥 구축물을 제조한다. 구축물 (서열 35에 혼성화된 서열 34)을 T4 Dda - E94C/A360C와 함께 미리 인큐베이션시켜 상기 효소가 오버행에 결합할 수 있도록 한다. 제시된 바와 같이, 오버행의 길이로 인해, 1 초과의 효소가 그에 결합할 수 있다. 이어서, 헬리카제 이동을 촉진시키기 위해 효소에 필요한 성분을 제공한다 (ATP 및 MgCl2). ATP 및 MgCl2와 함께 추가의 포획 가닥 (서열 37) 또한 첨가한다. 이어서, 헬리카제는 대조군 가닥을 따라 전위되어 더 짧은 상보성 가닥을 치환하고, 대조군 가닥은 헬리카제를 함유하지 않게 되거나, 또는 상보성 가닥에 결합된 상태로 남게 된다 (A로 표지). 이어서, 상보성 가닥은 헤어핀을 형성함으로써, 이는 대조군 가닥에 재어닐링할 수 없다 (B로 표지). 이어서, 용액 중에 유리 상태이거나, 또는 대조군 DNA를 따라 이동하고, 말단에서 떨어진 헬리카제는 제시된 바와 같은 과량의 포획 가닥 (서열 37, C로 표지된 복합체)에 의해 결합된다. 헬리카제에 결합하지 않은 임의의 DNA는 무손상 상태 그대로 유지된다 (F 종 그대로 유지). 이어서, 샘플 혼합물을 겔 상에 전개시키고, 그를 통해 겔 상에 생성된 밴드에 의해 별개의 종을 확인한다.
도 13은 헬리카제 (1로 표지)를 정지시키기 위한 iSpC3 또는 iSp18 스페이서 (도에서 X로 표시)를 함유하는 가닥에 대한 실험 단계를 보여주는 것이다. 도 12에 제시된 것과 같은 방법을 수행하였고, 효소를 DNA 구축물과 미리 인큐베이션시켰다 (더 짧은 상보성 가닥에는 그의 5' 말단에 카르복시플루오레세인이 부착되어 있다). 스페이서 기는 이중 가닥 영역의 앞쪽에 위치하고, 헬리카제는 제시된 바와 같이 DNA에 결합할 수 있다. ATP, MgCl2 및 포획 DNA (2로 표지) 첨가시, 이때 헬리카제는 헬리카제 이동을 촉진시키는 필요 성분을 제공받게 된다. 스페이서가 헬리카제를 정지시킬 수 있다면, 이때는 짧은 상보성 가닥을 여전히 함유하는 DNA 구축물에 결합한 상태 그대로 유지될 것이다 (D로 표지). 스페이서가 헬리카제를 정지시킬 수 없다면, 이때는 스페이서를 지나 이동하여 상보성 가닥을 치환하게 되고 (B로 표지), 어떤 헬리카제도 결합되어 있지 않은 A 종이 남게 된다. 이어서, 유리 효소는 과량의 포획 가닥 (C로 표지)에 결합하고, 치환된 상보성 가닥은 헤어핀을 형성하게 될 것이다 (B로 표지). 스페이서가 2개의 헬리카제가 아닌, 1개의 헬리카제를 정지시킬 수 있다면, 이때 제1 헬리카제는 뒤쪽에 있는 헬리카제에 의해서 스페이서를 지나도록 인출될 것이며, 상보성 가닥을 치환하게 될 것이다. 그러나, 제2 헬리카제는 스페이서를 지나 이동할 수 없고, E로 표지된 복합체로 형성된다. 헬리카제에 결합하지 않은 임의의 DNA는 어떤 헬리카제도 결합되어 있지 않은 무손상 상태 그대로 유지된다 (F 종). 이어서, 샘플 혼합물을 겔 상에 전개시키고, 그를 통해 겔 상에 생성된 밴드에 의해 별개의 종을 확인한다.
도 14는 대조군 가닥 (하기 표 11에서 1)에 대하여 실행된 겔 검정법을 보여주는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1,000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 레인 1은 오직 어닐링된 DNA (서열 35에 혼성화된 서열 34)만을 함유한다. 레인 2는 대조군 가닥에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다 (연료 비첨가). 레인 3은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 대조군 가닥을 보여주는 것이다. 레인 4는 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 대조군 가닥을 보여주는 것이다. 밴드 X는 오직 서열 34에만 상응하고, 밴드 Y는 서열 35에 혼성화된 서열 34에 상응한다. 1Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 1개의 헬리카제에 상응한다. 2Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 2개의 헬리카제에 상응한다. 3Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 3개의 헬리카제에 상응한다. 4Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 4개의 헬리카제에 상응한다. 5Y로 표지된 영역은 서열 35에 혼성화된 서열 34에 결합된 5개의 헬리카제에 상응한다.
도 15는 ssDNA와 dsDNA 사이의 연접부에 3개 (하기 표 11에서 7, 레인 = 1-4에 상응), 4개 (하기 표 11에서 8, 레인 = 5-8에 상응) 및 5개 iSp18 스페이서 (하기 표 11에서 9, 레인 = 9-12에 상응)를 함유하는 DNA 구축물에 대하여 실행된 겔 검정법을 보여주는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 레인 1은 오직 어닐링된 DNA (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)만을 함유한다. 레인 2는 연료가 첨가되지 않은 상태에서, DNA 구축물 (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다. 레인 3은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 4는 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 3개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 5는 오직 어닐링된 DNA (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)만을 함유한다. 레인 6은 연료가 첨가되지 않은 상태에서, DNA 구축물 (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다. 레인 7은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 8은 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 4개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 9는 오직 어닐링된 DNA (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)만을 함유한다. 레인 10은 연료가 첨가되지 않은 상태에서, DNA 구축물 (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에 미리 결합된 헬리카제 (T4 Dda - E94C/A360C)를 함유한다. 레인 11은 완충제 1에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 레인 12는 완충제 2에 연료 (ATP 및 MgCl2)를 첨가한 이후의 DNA 구축물 (그의 3' 말단에서 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)을 보여주는 것이다. 밴드 X는 오직 ssDNA 구축물 (예컨대, 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 36의 5' 말단에 부착되어 있다)에만 상응하고, 밴드 Y는 dsDNA 구축물 (그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9, iSp18 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)에만 상응한다. 1X로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 36에 부착되어 있다)에 결합된 1개의 헬리카제에 상응한다. 1Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 1개의 헬리카제에 상응한다. 2Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 2개의 헬리카제에 상응한다. 3Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 3개의 헬리카제에 상응한다. 4Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 4개의 헬리카제에 상응한다. 5Y로 표지된 영역은 그의 3' 말단에서 3, 4, 또는 5개의 iSp18 스페이서에 부착되어 있는 서열 9 (iSp18 스페이서는 서열 35에 혼성화된 서열 36에 부착되어 있다)에 결합된 5개의 헬리카제에 상응한다.
도 16은 실시예 9에서 사용된 표준 DNA 구축물을 보여주는 것이다. x는 헬리카제가 결합할 수 없는 스페이서 기를 나타낸다. 1로 표지된 영역의 길이는 상기 영역에 결합할 수 있는 헬리카제의 개수를 제어하기 위해 변경될 수 있다. 실시예와 같이, 본 도면은 영역 1에 1 또는 2개의 헬리카제가 결합되어 있는 것을 보여준다.
도 17은 표 12에 3으로 표지된 DNA 구축물 (서열 9의 5' 말단에 부착되어 있는 5개의 iSpC3 스페이서, 서열 9는 그의 3' 말단에서 4개의 iSpC3 스페이서에 부착되어 있고, iSpC3 스페이서는 서열 35에 혼성화된 서열 36의 5' 말단에 부착되어 있다)의 예시적인 겔 검정법을 보여주는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1,000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 레인 1-6은 상이한 농도의 T4 Dda - E94C/A360C에 상응하는 것이다 (1 = 5,000 nM, 2 = 2,500 nM, 3 = 1,250 nM, 4 = 625 nM, 5 = 312.5 nM 및 6 = 0 nM). X 수준에서 관찰된 밴드는 비결합 dsDNA 구축물에 상응하는 것이다. 겔 좌측에 기재된 수치는 DNA에 결합된 효소의 개수에 관한 것이다. 상기 DNA 구축물의 경우, 첨가된 최고 농도의 효소에서 최대 6개까지의 헬리카제에 결합할 수 있다. 겔의 상단에 제시된 수치는 첨가된 T4 Dda - E94C/A360C의 농도에 상응하는 것이다.
도 18은 실시예 9에서 사용된 DNA 구축물을 보여주는 것이다. A 및 B로 표지된 영역은 디자인된 짧은 DNA 가닥 (서열 37)이며, 이로써, 1개의 헬리카제가 각 영역 (우측에 제시)에 결합할 수 있다. 영역 1은 25개의 SpC3 스페이서에 상응하고, 영역 2는 2개의 iSp18 스페이서에 상응하고, 영역 3은 2개의 iSp18 스페이서에 상응하고, 영역 4는 포크형 DNA로 구성될 수 있거나, 또는 구성될 수 없는 또 다른 DNA 가닥 (예컨대, 서열 42 = 비포크형 (7로 표지된 단편 결실) 및 (7로 표지된 단편으로 제시된) 6개의 iSp18 스페이서에 부착된 서열 12 = 포크형)에 혼성화하는 DNA 섹션 (서열 10)에 상응하고, 영역 5는 4개의 5-니트로인돌에 상응하고, 영역 6은 그의 상보체 (서열 43)에 혼성화된 또 다른 DNA 영역 (서열 41)에 상응한다.
도 19는 도 18에 기술되고 제시된 DNA 구축물의 겔 검정법을 보여주는 것이다. X 수준에서 관찰된 밴드는 비결합 dsDNA 구축물에 상응하는 것이다. M으로 표지된 레인은 참조에 대한 DNA 래더이다 (밴드는 최저 질량 (겔의 하단)에서부터 최고 질량 (겔의 상단)으로 200 bp (염기쌍), 300 bp, 400 bp, 500/517 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1000 bp, 1,200 bp 및 1,517 bp에 상응하는 것임). 겔 좌측에 기재된 수치는 DNA에 결합된 효소의 개수에 관한 것이다. 상기 DNA 구축물의 경우, 475 nM 이상인 농도의 효소로부터 2개의 헬리카제 (도 18에 제시된 바와 같이, 하나는 영역 A에, 및 또 다른 하나는 영역 B에)의 결합을 관찰할 수 있었다. 겔의 상단에 제시된 수치는 첨가된 T4 Dda - E94C/A360C의 농도에 상응하는 것이다.
도 20은 실시예 10에서 사용된 DNA 구축물 (DNA 구축물 X1로 지칭)을 보여주는 것이다. 서열 38의 5' 말단에 부착된 25개의 SpC3 스페이서 (x로 표시)가 존재하고, 서열 38은 그의 3' 말단에서 4개의 iSp18 스페이서 (검은색 사각형으로 표시)에 부착되어 있다. 4개의 iSp18 스페이서는 서열 10의 5' 말단에 부착되어 있고, 서열 10은 그의 3' 말단에서 4개의 5-니트로인돌 (회식 삼각형으로 표시)에 부착되어 있다. 이어서, 4개의 니트로인돌은 서열 41의 5' 말단에 부착되어 있다. 서열 41에 혼성화되는 상보성 DNA 가닥은 서열 43이다. 서열 10에 혼성화되는 상보성 DNA 가닥은 서열 12 (서열 12의 3' 말단에는 2개의 티민 잔기 및 3' 콜레스테롤 TEG (회색 동그라미로 제시)에 부착된 6개의 iSp18 스페이서가 부착되어 있다)이다. A로 표지된 영역은 T4 Dda - E94C/A360C가 결합할 수 있는 구축물의 영역에 상응한다.
도 21은 헬리카제 (T4 Dda - E94C/A360C)가 나노포어 (MspA - B2C)를 통과하는 DNA 구축물 (0.1 nM, 도 20 설명 참조의 전위를 제어할 때의, 예시적인 전류 트레이스 (y축 표지 = 전류 ((pA), 50 내지 250), x축 표지 = 시간 ((s), 238 내지 252))를 보여주는 것이다. 1로 표지된 영역은 나노포어를 통과하는 폴리T 영역 (서열 38, 그 위에 효소가 결합되어 있는 것)의 헬리카제 제어형 전위를 보여주는 것이다. 2로 표지된 영역은 나노포어를 통과하는 나노포어를 통과하는 iSp18 스페이서의 헬리카제 제어형 전위를 보여주는 것이다.
도 22는 실시예 4에서 사용된 DNA 구축물의 다이어그램을 보여주는 것이다. 2개의 티민이 28개의 iSpC3 스페이서 (A로 표지)의 3' 말단에 부착되어 있다. 28개의 iSpC3 스페이서는 나머지 다른 한쪽 말단에서 서열 23의 5' 말단에 부착되어 있다 (서열은 영역 B = 폴리T 섹션, 및 영역 C = 테더 서열 (서열 12에 상보적인 서열에 상응한다). 서열 23의 3' 말단은 4개의 iSpC3 스페이서 (D로 표지)에 부착되어 있다. 4개의 iSpC3 스페이서의 나머지 다른 한쪽 말단은 서열 24의 5' 말단에 부착되어 있다. 테더 서열 (서열 12)은 그의 3' 말단에서, 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착되어 있는 6개의 iSp18 스페이서에 부착되어 있다.
서열 목록 설명
서열 1은 MS-B1 돌연변이체 MspA 단량체를 코딩하는 코돈 최적화된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 돌연변이체에는 신호 서열이 결실되어 있으며, 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다.
서열 2는 MspA 단량체의 MS-B1 돌연변이체의 성숙한 형태의 아미노산 서열을 보여주는 것이다. 상기 돌연변이체에는 신호 서열이 결실되어 있으며, 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다.
서열 3은 α-헤몰리신-E111N/K147N (α-HL-NN; 문헌 [Stoddart et al., PNAS, 2009; 106(19): 7702-7707])의 한 단량체를 코딩하는 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 4는 α-HL-NN의 한 단량체의 아미노산 서열을 보여주는 것이다.
서열 5 내지 7은 MspB, C 및 D의 아미노산 서열을 보여주는 것이다.
서열 8은 엔테로박테리아파지 T4로부터의 헬리카제 Dda 1993의 아미노산 서열을 보여주는 것이다.
서열 9는 실시예 1, 2, 3, 7 및 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 10은 실시예 1 및 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 11은 실시예 1에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 11은 그의 5' 말단에 의해, 서열 10의 3' 말단에 부착된 3개의 iSpC3 스페이서에 부착된다.
서열 12는 실시예 1 및 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 실시예 1에서, 서열 12는 그의 3' 말단에서, 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착된 6개의 iSp18 스페이서에 부착된다. 실시예 9에서, 서열 12는 그의 3' 말단에서 오직 6개의 iSp18 스페이서에만 부착된다.
서열 13은 엔테로박테리아파지 λ의 폴리뉴클레오티드 서열을 보여주는 것이다. 서열은 센스 가닥의 5' 말단에 부착된 추가의 12개의 염기 오버행을 함유한다. 본원에 제시된 서열은 오직 센스 가닥의 것이다.
서열 14는 실시예 2 및 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 14는 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛에 의해 서열 15의 5' 말단에 부착된다.
서열 15는 실시예 2 및 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 15는 그의 5' 말단에서 4개의 iSpC3 스페이서 유닛에 의해 서열 14의 3' 말단에 부착된다.
서열 16은 실시예 2 및 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것으로서, 상기 서열은 그의 3' 말단에서, 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착된 6개의 iSp18 스페이서를 가진다.
서열 17은 Trwc Cba 헬리카제의 아미노산 서열을 보여주는 것이다.
서열 18은 실시예 3에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 서열 18은 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛에 의해 서열 9의 5' 말단에 부착된다. 상기 서열은 그의 5' 말단에 부착된 포스페이트, 및 1 내지 5번 위치에 5 데옥시이노신을 가진다.
서열 19는 실시예 2에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 20은 실시예 2에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 21 및 22는 하기 서열의 번호매김을 유지시키기 위한 플레이스 홀더이다.
서열 23은, 실시예 4에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 마지막의 것이 스페이서 기의 5' 말단에 부착된 추가의 2개의 T를 갖는 것인 28개의 iSpC3 스페이서 유닛은 상기 서열의 5' 말단에 부착되어 있다. 서열 24의 5' 말단에 부착된 4개의 iSpC3 스페이서 유닛은 상기 서열의 3' 말단에 부착되어 있다.
서열 24는 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 마지막의 것이 서열 23에 부착되어 있는 것인 4개의 iSpC3 스페이서 유닛은 상기 서열의 5' 말단에 부착되어 있다. 마지막의 것이 스페이서 기의 5' 말단에 부착된 추가의 2개의 T를 갖는 것인 28개의 iSpC3 스페이서 유닛은 서열 23의 5' 말단에 부착되어 있다.
서열 25는 실시예 5에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 26은 실시예 5 및 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 3' 말단에 블랙-홀 소광제 (BHQ-1) 염기를 가진다.
서열 27은 실시예 5 및 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 28은 Hel308 Mbu의 아미노산 서열을 보여주는 것이다.
서열 29는 실시예 5에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 서열은 그의 5' 말단에서 1 또는 4개의 iSp9 스페이서 기에 의해 서열 27에 연결된다.
서열 30은 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 서열은 그의 5' 말단에서 1개의 idSp 기에 의해 서열 27에 연결된다.
서열 31은 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 상기 서열은 그의 5' 말단에서 4개의 idSp 기에 의해 서열 27에 연결된다.
서열 32는 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 33은 실시예 6에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 34는 실시예 7에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 35는 실시예 7 및 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다. 이는 그의 5' 말단에 카르복시플루오레세인 (FAM) 염기를 가진다.
서열 36은 실시예 7 및 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 37은 실시예 7, 8 및 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 38은 실시예 8 및 10에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 39는 실시예 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 40은 실시예 8에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 41은 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 42는 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
서열 43은 실시예 9에서 사용된 폴리뉴클레오티드 서열을 보여주는 것이다.
개시된 생성물 및 방법의 상이한 적용은 관련 기술분야에서의 구체적인 요구에 맞게 적합화될 수 있다는 것을 이해하여야 한다. 또한, 본원에서 사용된 용어는 단지 본 발명의 특정 실시양태를 기술하기 위한 목적의 것이며, 제한하고자 하는 것은 아님을 이해하여야 한다.
추가로, 본 명세서 및 첨부된 청구범위에서 사용되는 바, 단수 형태인 "하나"("a", "an") 및 "그"라는 것은 내용상 달리 명백하게 명시되지 않는 한, 복수 개의 지시 대상을 포함한다. 따라서, 예를 들어, "하나의 폴리뉴클레오티드"라고 지칭하는 것은 2개 이상의 폴리뉴클레오티드를 포함하는 것이고, "하나의 스페이서"라고 지칭하는 것은 2개 이상의 스페이서를 포함하는 것이며, "1개의 헬리카제"라고 지칭하는 것은 2개 이상의 헬리카제를 포함하는 것이고, "하나의 막횡단 포어"라고 지칭하는 것은 2개 이상의 포어를 포함하는 것이며, 다른 것도 그러하다.
상기에서든 또는 하기에서든 상관없이, 본원에서 인용된 모든 공개 문헌, 특허, 및 특허 출원은 그 전문이 본원에서 참조로 포함된다.
헬리카제가
스페이서를
지나도록 이동시키는 방법
본 발명은 표적 폴리뉴클레오티드에서 하나 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 방법을 제공한다. 헬리카제는 그가 폴리뉴클레오티드를 따라 이동하는 것을 중단하였다면, 정지된 것이다. 각 스페이서는 전형적으로 하나 이상의 헬리카제를 정지시킨다. 하나 이상의 헬리카제가 정지되었는지 여부를 측정하는 방법은 하기에서 논의된다. 하나 이상의 헬리카제는 스페이서 앞에서 정지될 수 있다. 하나 이상의 헬리카제는 스페이서에 의해 정지될 수 있다. 하나 이상의 헬리카제는 스페이서 상에서 정지될 수 있다. 본 발명은 하나 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록, 즉, 그를 넘도록 이동시키는 것에 관한 것이다.
하나 이상의 정지된 헬리카제 및 표적 폴리뉴클레오티드를 막횡단 포어와 접촉시키고, 전위를 인가하다. 하기에서 더욱 상세하게 기술되는 바와 같이, 표적 폴리뉴클레오티드는 인가된 전위로부터 생성된 장을 이용하여 포어를 통해 이동한다. 하나 이상의 헬리카제는 전형적으로는 너무 크기 때문에 포어를 통해 이동하지 못한다. 표적 폴리뉴클레오티드의 일부가 포어에 진입하고, 인가된 전위로부터 생성된 장을 따라 포어를 통해 이동할 때, 표적 폴리뉴클레오티드가 포어를 통해 이동함에 따라 하나 이상의 헬리카제는 포어에 의해 스페이서를 지나 이동하게 된다. 이는 (하나 이상의 스페이서를 포함하는) 표적 폴리뉴클레오티드가 포어를 통해 이동하고, 하나 이상의 헬리카제가 포어의 상단에 그대로 남아있기 때문이다.
이를 통해 표적 폴리뉴클레오티드 상의 하나 이상의 헬리카제의 위치는 제어될 수 있다. 하나 이상의 정지된 헬리카제 및 표적 폴리뉴클레오티드가 막횡단 포어와 접촉하고, 전위가 인가되기 전에는, 하나 이상의 헬리카제는 그가 정지된 위치에 그대로 남아있다. 심지어 헬리카제 이동을 촉진시키는 데 필요한 성분 (예컨대, ATP 및 Mg2 +)이 존재하는 경우에도, 하나 이상의 헬리카제는 표적 폴리뉴클레오티드 상의 스페이서를 지나 이동하지 못할 것이며, 그가 막횡단 포어 및 인가된 전위의 존재하에 놓일 때까지는 스페이서의 다른 쪽 상의 표적 폴리뉴클레오티드 일부를 따라 이동하지 못할 것이다.
하나 이상의 헬리카제 또한 막횡단 포어의 존재하에, 그러나, 인가된 전위의 부재하에서 정지된 위치에 그대로 남아있게 될 것이다. 이러한 경우, 전위 인가를 통해 하나 이상의 헬리카제는 스페이서를 지나 이동하게 된다. 그러므로, 하나 이상의 헬리카제가 스페이서를 지나 스페이서의 다른 쪽 상의 표적 폴리뉴클레오티드 일부를 따라 이동하도록 조장하는 데에는 전위 인가가 사용될 수 있다. 예를 들어, 하나 이상의 헬리카제가 스페이서를 지나 이동하도록 하는 데에는 전압 증가가 사용될 수 있다.
본 발명은 또한 막횡단 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 방법을 제공한다. 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공한다. 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시키고, 하나 이상의 헬리카제는 하나 이상의 스페이서에서 정지한다. 이를 통해 확실하게 하나 이상의 헬리카제가 폴리뉴클레오티드 상의 하나 이상의 특정 위치에 그대로 남게 된다. 이는 하기에서 더욱 상세하게 논의된다. 표적 폴리뉴클레오티드 및 하나 이상의 정지된 헬리카제를 막횡단 포어와 접촉시킨다. 일단 전위를 인가하고 나면, 하나 이상의 헬리카제는 하나 이상의 스페이서를 지나 스페이서(들)의 다른 쪽 상의 표적 폴리뉴클레오티드 일부를 따라 이동하게 된다. 이로써, 하나 이상의 헬리카제는 포어를 통과하는 폴리뉴클레오티드의 이동을 제어할 수 있다. 또한 전위는 폴리뉴클레오티드를 포어로 트레딩(thread)하는 데에도 사용된다.
헬리카제는 적어도 2가지 활성 작동 모드로 (이동을 촉진시키는 데 필요한 모든 성분, 예컨대, ATP 및 Mg2 +를 헬리카제에 제공하였을 때) 및 1가지 불활성 작동 모드로 (이동을 촉진시키는 데 필요한 성분을 헬리카제에 제공하지 않았을 때) 폴리뉴클레오티드의 이동을 제어할 수 있다. 이동을 촉진시키는 데 필요한 모든 성분을 제공받은 경우, 헬리카제는 (헬리카제에 따라) 5'→3' 또는 3'→5' 방향으로 폴리뉴클레오티드를 따라 이동하지만, (폴리뉴클레오티드의 어느 말단이 포어에 의해 포획되었는지에 의존하는) 포어 중 폴리뉴클레오티드의 배향은 폴리뉴클레오티드를 인가된 장에 반하여 포어 밖으로 이동시키거나, 또는 폴리뉴클레오티드를 인가된 장에 따라 포어 안으로 이동시키는 데 헬리카제가 사용될 수 있다는 것을 의미한다. 헬리카제가 이동하는 방향 쪽의 폴리뉴클레오티드의 말단이 포어에 포획되었을 때, 헬리카제는 인가된 전위로부터 생성된 장의 방향에 반대로 작용하여 트레딩된 폴리뉴클레오티드를 포어 밖으로 및 시스 챔버 안으로 인입한다. 그러나, 헬리카제가 이동하는 방향 쪽으로부터 떨어져 있는 말단이 포어에 포획되었을 때, 헬리카제는 인가된 전위로부터 생성된 장의 방향에 따라 작용하여 트레딩된 폴리뉴클레오티드를 포어 안으로 및 트랜스 챔버 안으로 인출한다.
이동을 촉진시키는 데 필요한 성분을 제공받지 못한 경우, 헬리카제는 폴리뉴클레오티드에 결합하고, 폴리뉴클레오티드가 인가된 전위로부터 생성된 전에 의해 포어 안으로 인입될 때, 폴리뉴클레오티드의 이동을 저속화시키는 브레이크로서 작용할 수 있다. 불활성 모드에서, 폴리뉴클레오티드의 어느 말단이 포획되었는지는 중요하지 않고, 브레이크로서 작용하는 헬리카제와 트랜스 쪽인 방향인 포어 내로 폴리뉴클레오티드를 인입하는 인가된 전위가 중요하다. 불활성 모드일 때, 헬리카제에 의한 폴리뉴클레오티드의 이동을 제어하는 것은 라체팅, 슬라이딩 및 브레이킹을 비롯한 다수의 방식으로 기술될 수 있다.
본 발명의 방법에서, 하나 이상의 헬리카제는 바람직하게는 표적 폴리뉴클레오티드는 인가된 전위로부터 생성된 장을 이용하여 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어한다. 한 바람직한 실시양태에서, 하나 이상의 헬리카제는 활성 모드로 사용되고, 하나 이상의 헬리카제가 이동하는 방향 쪽으로부터 떨어져 있는 말단이 포어에 포획되고, 이로써, 하나 이상의 헬리카제는 인가된 전위로부터 생성된 장의 방향에 따라 작용하여 폴리뉴클레오티드가 포어를 통과하도록 인출한다. 하나 이상의 헬리카제가 5'→3' 방향으로 이동할 때, 표적 폴리뉴클레오티드의 5' 말단은 바람직하게 포어에 의해 포획된다. 상기 실시양태에서, 하나 이상의 헬리카제는 5'→3' 방향으로 하나 이상의 스페이서를 지나 이동하게 된다. 하나 이상의 헬리카제가 3'→5' 방향으로 이동할 때, 표적 폴리뉴클레오티드의 3' 말단은 바람직하게 포어에 의해 포획된다. 상기 실시양태에서, 하나 이상의 헬리카제는 3'→5' 방향으로 하나 이상의 스페이서를 지나 이동하게 된다.
또 다른 바람직한 실시양태에서, 하나 이상의 헬리카제는 불활성 모드로 사용되고, 이로써, 인가된 장은 표적 폴리뉴클레오티드가 포어를 통과하도록 인입하고, 하나 이상의 헬리카제는 브레이크로서 작용하게 된다. 본 발명의 방법에서, 하나 이상의 헬리카제는 바람직하게 인가된 전위로부터 생성된 장을 이용하여 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 저속화시키거나, 또는 제동을 건다. 어느 경우에서든, 하나 이상의 헬리카제는 전형적으로는 포어를 통해 이동하기에는 너무 크고, 폴리뉴클레오티드가 인가된 전위로부터 생성된 장을 이용하여 포어를 통해 이동함에 따라, 포어는 폴리뉴클레오티드 상에서 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 인출한다.
막횡단 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 방법은 포어를 사용하여 폴리뉴클레오티드의 특징을 규명하는 동안, 예를 들어, 가닥 서열분석을 수행하는 동안 도움이 될 수 있다. 본 발명은 또한 표적 폴리뉴클레오티드의 특징을 규명하는 방법을 제공한다. 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공한다. 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시키고, 하나 이상의 헬리카제는 하나 이상의 스페이서에서 정지한다. 이를 통해 확실하게 하나 이상의 헬리카제가 폴리뉴클레오티드 상의 하나 이상의 특정 위치에 그대로 남게 된다. 이는 하기에서 더욱 상세하게 논의된다. 표적 폴리뉴클레오티드 및 하나 이상의 정지된 헬리카제를 막횡단 포어와 접촉시킨다. 일단 전위를 인가하고 나면, 하나 이상의 헬리카제는 하나 이상의 스페이서를 지나 스페이서(들)의 다른 쪽 상의 폴리뉴클레오티드 일부를 따라 이동하게 된다. 이로써, 하나 이상의 헬리카제는 포어를 통과하는 폴리뉴클레오티드의 이동을 제어할 수 있다. 본 방법은 또한 폴리뉴클레오티드가 포어와 관련하여 이동함에 따라 하나 이상의 측정치를 측정하는 단계를 포함한다. 측정치는 폴리뉴클레오티드의 하나 이상의 특징을 나타낸다.
막횡단 포어 및 인가된 전위를 사용하여 표적 폴리뉴클레오티드 상의 하나 이상의 헬리카제를 정지시키고, 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시킬 수 있는 능력은 이를 통해 표적 폴리뉴클레오티드의 특징을 효과적으로 규명할 수 있기 때문에, 서열분석할 수 있기 때문에 이롭다. 예를 들어, 하나 이상의 헬리카제는 (하기 기술되는 바와 같이) 포어에 의해 포획되도록 디자인되고, 특징 규명될 필요가 없는 리더 서열 중의 표적 폴리뉴클레오티드의 한쪽 말단 쪽의 방향으로 정지될 수 있다. 리더 서열 중 하나 이상의 헬리카제의 정지란 하나 이상의 헬리카제는 그(들)가 포어와 접촉하고, 전위가 인가될 때까지는 리더 서열로부터 출발하여 폴리뉴클레오티드의 일부를 따라 이동하지 못한다는 것을 의미한다. 일단 1개 이상의 헬리카제 및 폴리뉴클레오티드가 포어와 접촉하게 되고, 전위가 인가되고 나면, 리더 서열은 전형적으로 포어에 의해 포획되고, 포어를 통해 이동하게 된다. (상기 기술된 바와 같이) 이러한 이동은 하나 이상의 헬리카제가 스페이서(들)를 지나 특징 규명하고자 하는 폴리뉴클레오티드 일부를 따라 움직이게 한다. 이어서, 하나 이상의 헬리카제는 특징 규명하고자 하는 폴리뉴클레오티드 일부의 이동을 제어할 수 있다.
리더 서열에서 하나 이상의 헬리카제가 정지되지 않으면, 그(들)는 리더 서열로부터 출발하여 폴리뉴클레오티드를 따라, 및 특징 규명하고자 하는 폴리뉴클레오티드 일부를 따라 이동하게 될 것이다. 상기 환경하에서 하나 이상의 헬리카제 및 폴리뉴클레오티드가 포어와 접촉하게 되고, 전위가 인가되면, 리더 서열, 및 특징 규명하고자 하는 폴리뉴클레오티드는 그 모두가 아니더라도, 그 중 일부는 인가된 전위로부터 생성된 장을 따라 제어되지 않는 방식으로 포어를 통해 이동하게 될 것이다. 오직 일단 1개 이상의 헬리카제가 포어와 접촉하게 된 경우에만, 상기 논의된 바와 같이, 그(들)는 특징 규명하고자 하는 폴리뉴클레오티드의 일부의 이동을 제어하기 시작할 것이다. 제어되지 않는 방식으로 포어를 통해 이동하는 폴리뉴클레오티드의 임의의 일부분은 하기 기술되는 바와 같이 특징 규명될 수 없다. 하나 이상의 헬리카제가 리더 서열로부터 출발하여 남은 표적 폴리뉴클레오티드 대부분을 따라 이동하게 되다면, 있다해도 극소수의 폴리뉴클레오티드만이 특징 규명될 것이다.
하기에서 더욱 상세하게 논의되는 바와 같이, 본 발명에 따른 하나 이상의 스페이서를 사용함으로써 표적 폴리뉴클레오티 상의 하나 이상의 헬리카제의 개수 및 위치는 제어될 수 있다. 예를 들어, 특정 개수의 헬리카제는, 특징 규명 이전에 표적 폴리뉴클레오티드에 결찰될 수 있는 어댑터 상의 특정 위치에서 정지될 수 있다. 상기 어댑터는 본 발명에 의해 제공되며, 이는 특징 규명을 이한 키트에 제공될 수 있다. 하나 이상의 스페이서를 사용함에 따라 확실하게 헬리카제는, 특징 규명 이전에 어댑터 및/또는 표적 폴리뉴클레오티드가 헬리카제 이동을 촉진시키는 데 필요한 성분 (예컨대, ATP 및 Mg2 +)의 존재하에 있는 경우에도, 특징 규명이 시작될 때까지 존재하게 되는 위치에 그대로 남게 된다.
폴리뉴클레오티드
폴리뉴클레오티드, 예컨대, 핵산은 2개 이상의 뉴클레오티드를 포함하는 거대분자이다. 폴리뉴클레오티드 또는 핵산은 임의의 뉴클레오티드의 임의의 조합을 포함할 수 있다. 뉴클레오티드는 자연적으로 발생된 것이거나, 또는 인공의 것일 수 있다. 폴리뉴클레오티드 중 하나 이상의 뉴클레오티드는 산화되거나, 메틸화될 수 있다. 폴리뉴클레오티드 중 하나 이상의 뉴클레오티드는 손상될 수 있다. 예를 들어, 폴리뉴클레오티드는 피리미딘 이량체를 포함할 수 있다. 상기 이량체는 전형적으로 자외선에 의한 손상과 관련이 있으며, 이는 피부 흑색종의 주요 원인이다. 폴리뉴클레오티드 중 하나 이상의 뉴클레오티드는 예를 들어, 표지 또는 태그로 변형될 수 있다. 적합한 표지는 하기 기술한다.
뉴클레오티드는 전형적으로 뉴클레오염기, 당 및 1개 이상의 포스페이트 기를 함유한다. 뉴클레오염기 및 당은 뉴클레오시드를 형성한다.
뉴클레오염기는 전형적으로 헤테로시클릭이다. 뉴클레오염기로는 퓨린 및 피리미딘, 및 더욱 구체적으로, 아데닌 (A), 구아닌 (G), 티민 (T), 우라실 (U) 및 시토신 (C)을 포함하나, 이에 제한되지는 않는다.
당은 전형적으로 펜토스 당이다. 뉴클레오티드 당은 리보스 및 데옥시리보스를 포함하나, 이에 제한되지는 않는다. 당은 바람직하게 데옥시리보스이다.
폴리뉴클레오티드 중 뉴클레오티드는 전형적으로 리보뉴클레오티드 또는 데옥시리보뉴클레오티드이다. 폴리뉴클레오티드는 하기 뉴클레오시드: 아데노신, 우리딘, 구아노신 및 시티딘을 포함할 수 있다. 뉴클레오티드는 바람직하게 데옥시리보뉴클레오티드이다. 폴리뉴클레오티드는 바람직하게 하기 뉴클레오시드: 데옥시아데노신 (dA), 데옥시우리딘 (dU) 및/또는 티미딘 (dT), 데옥시구아노신 (dG) 및 데옥시시티딘 (dC)을 포함한다.
뉴클레오티드 전형적으로 모노포스페이트, 디포스페이트 또는 트리포스페이트를 포함한다. 포스페이트는 뉴클레오티드의 5' 또는 3' 측 상에 부착될 수 있다.
적합한 뉴클레오티드는 아데노신 모노포스페이트 (AMP), 구아노신 모노포스페이트 (GMP), 티미딘 모노포스페이트 (TMP), 우리딘 모노포스페이트 (UMP), 시티딘 모노포스페이트 (CMP), 시클릭 아데노신 모노포스페이트 (cAMP), 시클릭 구아노신 모노포스페이트 (cGMP), 데옥시아데노신 모노포스페이트 (dAMP), 데옥시구아노신 모노포스페이트 (dGMP), 데옥시티미딘 모노포스페이트 (dTMP), 데옥시우리딘 모노포스페이트 (dUMP) 및 데옥시시티딘 모노포스페이트 (dCMP)를 포함하나, 이에 제한되지는 않는다. 뉴클레오티드는 바람직하게 AMP, TMP, GMP, CMP, UMP, dAMP, dTMP, dGMP, dCMP 및 dUMP로부터 선택된다. 뉴클레오티드는 가장 바람직하게 dAMP, dTMP, dGMP, dCMP 및 dUMP로부터 선택된다. 폴리뉴클레오티드는 바람직하게 하기 뉴클레오티드: dAMP, dUMP 및/또는 dTMP, dGMP 및 dCMP를 포함한다.
폴리뉴클레오티드 중 뉴클레오티드는 임의 방식으로 서로에게 부착될 수 있다. 뉴클레오티드는 전형적으로 핵산에서와 같이 그의 당 및 포스페이트 기에 의해 부착된다. 뉴클레오티드는 피리미딘 이량체에서와 같이 그의 뉴클레오염기를 통해 연결될 수 있다.
폴리뉴클레오티드는 핵산일 수 있다. 폴리뉴클레오티드는 관련 기술분야에 공지된 임의의 합성 핵산, 예컨대, 펩티드 핵산 (PNA), 글리세롤 핵산 (GNA), 트레오스 핵산 (TNA), 잠금 핵산 (LNA) 또는 뉴클레오티드 측쇄를 포함하는 다른 합성 중합체일 수 있다. PNA 백본은 펩티드 결합에 의해 연결된, 반복 N-(2-아미노에틸)-글리신으로 구성된다. GNA 백본은 포스포디에스테르 결합에 의해 연결된, 반복 글리콜 단위로 구성된다. TNA 백본은 포스포디에스테르 결합에 의해 함께 연결된 반복 트레오스 당으로 구성된다. LNA는 리보스 모이어티 중 2' 산소 및 4' 탄소를 연결하는 추가의 브릿지를 가지는, 상기 논의된 리보뉴클레오티드로부터 형성된다.
폴리뉴클레오티드는 가장 바람직하게 리보핵산 (RNA) 또는 데옥시리보핵산 (DNA)이다.
폴리뉴클레오티드는 바람직하게 하나 이상의 스페이서를 제외하면, 어떤 무염기 뉴클레오티드 (즉, 뉴클레오염기가 결실된 뉴클레오티드)도 포함하지 않는다. 폴리뉴클레오티드는 바람직하게 하나 이상의 스페이서를 제외하면, 어떤 C3 스페이서 (즉, 뉴클레오염기 및 당이 결실된 뉴클레오티드)도 포함하지 않는다.
폴리뉴클레오티드의 길이는 임의 길이일 수 있다. 예를 들어, 폴리뉴클레오티드 길이는 10개 이상, 50개 이상, 100개 이상, 150개 이상, 200개 이상, 250개 이상, 300개 이상, 400개 이상, 또는 500개 이상의 뉴클레오티드 길이일 수 있다. 폴리뉴클레오티드 길이는 1,000개 이상의 뉴클레오티드, 5,000개 이상의 뉴클레오티드 길이, 또는 100,000개 이상의 뉴클레오티드 길이일 수 있다.
헬리카제는 본 발명의 방법에서 전체 표적 폴리뉴클레오티드를 따라 또는 그의 오직 일부분만을 따라 이동할 수 있다. 본 발명의 방법을 이용하여 전체 표적 폴리뉴클레오티드 또는 그의 오직 일부분만을 특징 규명할 수 있다.
표적 폴리뉴클레오티드는 단일 가닥일 수 있다. 표적 폴리뉴클레오티드의 적어도 일부는 바람직하게 이중 가닥이다. 헬리카제는 전형적으로 단일 가닥 폴리뉴클레오티드에 결합한다. 표적 폴리뉴클레오티드의 적어도 일부는 이중 가닥일 경우, 표적 폴리뉴클레오티드는 바람직하게 단일 가닥 영역 또는 비혼성화된 영역을 포함한다. 하나 이상의 헬리카제는 단일 가닥 영역에, 또는 비혼성화된 영역의 한 가닥에 결합할 수 있다. 표적 폴리뉴클레오티드는 바람직하게 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역을 포함한다.
하나 이상의 스페이서는 바람직하게 표적 폴리뉴클레오티드의 단일 가닥 영역 또는 비혼성화된 영역에 포함된다. 표적 폴리뉴클레오티드는 1 초과의 단일 가닥 영역 또는 1 초과의 비혼성화된 영역을 포함할 수 있다. 표적 폴리뉴클레오티드는 그의 서열 내에 및/또는 한쪽 말단 또는 양측 말단에 단일 가닥 영역 또는 비혼성화된 영역을 포함할 수 있다. 하나 이상의 스페이서는 표적 폴리뉴클레오티드의 이중 가닥 영역에 포함될 수 있다.
본 방법에서 사용되는 하나 이상의 헬리카제가 5'→3' 방향으로 이동할 경우, 표적 폴리뉴클레오티드는 바람직하게 그의 5' 말단에 단일 가닥 영역 또는 비혼성화된 영역을 포함한다. 본 방법에서 사용되는 하나 이상의 헬리카제가 3'→5'방향으로 이동할 경우, 표적 폴리뉴클레오티드는 바람직하게 그의 3' 말단에 단일 가닥 영역 또는 비혼성화된 영역을 포함한다. 하나 이상의 헬리카제가 불활성 모드로 (즉, 브레이크로서) 사용될 경우, 단일 가닥 영역 또는 비혼성화된 영역이 어디 위치하는지는 중요하지 않다.
단일 가닥 영역은 바람직하게 우선적으로 포어로 트레딩하는 리더 서열을 포함한다. 리더 서열은 본 발명의 방법을 촉진시킨다. 리더 서열은 우선적으로 막횡단 포어로 트레딩하여 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 촉진시키도록 디자인된다. 리더 서열은 전형적으로 중합체를 포함한다. 중합체는 바람직하게 음으로 하전된 것이다. 중합체는 바람직하게 폴리뉴클레오티드, 예컨대, DNA 또는 RNA, 변형된 폴리뉴클레오티드 (예컨대, 무염기 DNA), PNA, LNA, 폴리에틸렌 글리콜 (PEG) 또는 폴리펩티드이다. 리더는 바람직하게 폴리뉴클레오티드를 포함하고, 더욱 바람직하게 단일 가닥 폴리뉴클레오티드를 포함한다. 리더 서열은 상기 논의된 폴리뉴클레오티드 중 임의의 것을 포함할 수 있다. 단일 가닥 리더 서열은 가장 바람직하게 DNA의 단일 가닥, 예컨대, 폴리 dT 섹션을 포함한다. 리더 서열은 바람직하게 하나 이상의 스페이서를 포함한다.
리더 서열의 길이는 임의 길이일 수 있지만, 전형적으로는 10 내지 150개의 뉴클레오티드 길이, 예컨대, 20 내지 150개의 뉴클레오티드 길이이다. 리더의 길이는 전형적으로 본 방법에서 사용되는 막횡단 포어에 의존한다.
표적 폴리뉴클레오티드의 적어도 일부가 이중 가닥일 경우, 이중 가닥부의 두 가닥은 바람직하게 예컨대, 헤어핀과 같은 가교 모이어티를 사용하여 연결되어 있다. 이는 본 발명의 특징 규명 방법을 촉진시킨다. 가교 모이어티에 의한 표적 폴리뉴클레오티드의 두 가닥의 연결은 폴리뉴클레오티드의 두 가닥 모두 막횡단 포어에 의해 특징 규명할 수 있게, 예컨대, 서열분석할 수 있게 한다. 폴리뉴클레오티드가 단일 가닥 폴리뉴클레오티드와 같이 포어를 통해 이동함에 따라 두 가닥은 탈혼성화된다. 본 방법은 단일의 이중 가닥 표적 폴리뉴클레오티드로부터 수득되는 정보의 양을 배가시키기 때문에 이롭다. 또한, 상보적인 '안티 센스' 가닥 중 서열은 '센스' 가닥의 서열에 대하여 반드시 오르소고날성이기 때문에, 두 가닥으로부터의 정보는 정보화 방식으로 조합될 수 있다. 따라서, 이러한 메커니즘은 신뢰성이 더 높은 관찰 결과를 제공하는 오르소고날성 프루프 리딩 능력을 제공한다.
국제 출원 번호 PCT/GB2012/051786 (공보 WO 2013/014451)에 개시된 실시양태 중 임의의 것이 사용될 수 있다. 가교 모이어티는 전형적으로 폴리뉴클레오티드의 두 가닥을 공유적으로 연결시킨다. 가교 모이어티는 표적 폴리뉴클레오티드의 두 가닥을 연결시킬 수 있는 임의의 것일 수 있지만, 단, 가교 모이어티는 막횡단 포어를 통과하는 폴리뉴클레오티드의 이동을 방해하지는 않는다. 적합한 가교 모이어티로는 중합성 링커, 화학 링커, 폴리뉴클레오티드 또는 폴리펩티드를 포함하나, 이에 제한되지는 않는다. 바람직하게, 가교 모이어티는 DNA, RNA, 변형된 DNA (예컨대, 무염기 DNA), RNA, PNA, LNA 또는 폴리에틸렌 글리콜 (PEG)을 포함한다. 가교 모이어티는 더욱 바람직하게 DNA 또는 RNA이다. 가교 모이어티는 하나 이상의 스페이서를 포함할 수 있다.
가교 모이어티는 가장 바람직하게 헤어핀 루프이다. 헤어핀 루프는 상기 논의된 폴리뉴클레오티드 중 임의의 것으로부터 형성될 수 있다. 헤어핀 루프 또는 헤어핀 루프의 루프의 길이는 전형적으로 약 4 내지 약 100개의 뉴클레오티드 길이, 바람직하게, 약 4 내지 약 8개의 뉴클레오티드 길이이다.
가교 모이어티는 관련 기술분야에 공지된 임의의 적합한 수단에 의해 표적 폴리뉴클레오티드의 두 가닥에 연결된다. 가교 모이어티는 별개로 합성되고, 표적 폴리뉴클레오티드에 화학적으로 부착되거나, 또는 효소적으로 결찰될 수 있다. 대안적으로, 가교 모이어티는 표적 폴리뉴클레오티드의 프로세싱에서 생성될 수 있다.
가교 모이어티는 표적 폴리뉴클레오티드의 한쪽 말단에 또는 그 부근에서 표적 폴리뉴클레오티드에 연결된다. 가교 모이어티는 바람직하게 폴리뉴클레오티드의 말단으로부터 10개 이내의 뉴클레오티드 범위 내에서 표적 폴리뉴클레오티드에 연결된다.
하나 이상의 스페이서는 바람직하게 그(들)가 하나 이상의 헬리카제를 정지시키고, 헬리카제가 제어하고자 하거나, 또는 특징 규명하고자 하는 표적 폴리뉴클레오티드를 따라 이동하지 못하게 위치한다. 예를 들어, 하나 이상의 스페이서는 바람직하게 리더 서열과 제어하고자 하거나, 또는 특징 규명하고자 하는 표적 폴리뉴클레오티드 사이에, 예를 들어, 폴리뉴클레오티드의 한쪽 말단의 리더 서열 범위 내에 위치한다. 리더 서열은 전형적으로 인가된 전위로부터 생성된 장을 이용하여 포어에 진입하고, 폴리뉴클레오티드가 포어를 통해 이동함에 따라 하나 이상의 헬리카제는 하나 이상의 스페이서를 지나 이동하게 된다. 이어서, 하나 이상의 헬리카제는 포어를 통과하는 표적 폴리뉴클레오티드의 나머지 부분의 이동을 제어할 수 있고, 그의 특징 규명을 촉진시킬 수 있다.
가장 바람직한 실시양태에서, 표적 폴리뉴클레오티드는 한쪽 말단에서 가교 모이어티, 예컨대, 헤어핀 루프에 의해 연결된 이중 가닥부, 및 리더 서열을 포함하며, 가교 모이어티로부터 나머지 다른 한쪽 말단에 위치하는 단일 가닥부를 포함한다. 하나 이상의 스페이서는 리더 서열 및/또는 가교 모이어티에 존재할 수 있다.
표적 폴리뉴클레오티드는 임의의 적합한 샘플 중에 존재한다. 본 발명은 전형적으로 표적 폴리뉴클레오티드를 함유하는 것으로 공지되어 있거나, 또는 그러할 것으로 의심되는 샘플에 대해 수행된다. 본 발명은 샘플 중 그의 존재가 공지되어 있거나, 또는 예상되는 하나 이상의 표적 폴리뉴클레오티드의 동일성를 확인하기 위한 샘플에 대해 수행될 수 있다.
샘플은 생물학적 샘플일 수 있다. 본 발명은 임의의 유기체 또는 미생물로부터 수득된, 또는 그로부터 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 유기체 또는 미생물은 전형적으로 고세균성, 원핵성 또는 진핵성이고, 전형적으로는 5가지의 계; 식물계, 동물계, 진균계, 모네라계 및 원생 생물계 중 하나에 속한다. 본 발명은 임의의 바이러스로부터 수득된, 또는 그로부터 추출된 샘플에 대해 시험관내에서 수행될 수 있다. 샘플은 바람직하게 유체 샘플이다. 샘플은 전형적으로 환자의 체액을 포함한다. 샘플은 뇨, 림프, 타액, 점액, 또는 양수일 수 있지만, 바람직하게는 혈액, 혈장 또는 혈청이다. 전형적으로, 샘플은 인간 기원의 것이지만, 대안적으로, 또 다른 포유동물로부터의 것, 예컨대, 상업상 사육 동물, 예컨대, 말, 소, 양 또는 돼지로부터의 것일 수 있거나, 또는 대안적으로, 애완동물, 예컨대, 고양이 또는 개로부터의 것일 수 있다. 대안적으로, 식물 기원의 샘플은 전형적으로 상업상 작물, 예컨대, 시리얼, 콩과 식물, 과일 또는 야채, 예를 들어, 밀, 퀴노아, 보리, 귀리, 카놀라, 옥수수, 대두, 쌀, 바나나, 사과, 토마토, 감자, 포도, 담배, 콩, 렌틸, 사탕수수, 코코아, 목화로부터 수득되는 것이다.
샘플은 비생물학적 샘플일 수 있다. 비생물학적 샘플은 바람직하게 유체 샘플이다. 비생물학적 샘플의 예로는 수술 유체, 물, 예컨대, 식수, 해수, 또는 강물 및 실험실 시험용 시약을 포함한다.
샘플은 전형적으로 검정되기 이전에, 예를 들어, 원심분리에 의해 또는 원치 않는 분자 또는 세포, 예컨대, 적혈구를 여과하는 막을 통해 통과시킴으로써 프로세싱된다. 샘플은 채취 즉시 측정될 수 있다. 샘플은 또한 전형적으로는 검정 이전에 바람직하게는 -70℃에서 보관될 수 있다.
스페이서
(들)
하나 이상의 스페이서는 표적 폴리뉴클레오티드에 포함된다. 하나 이상의 스페이서는 바람직하게 표적 폴리뉴클레오티드의 일부이고, 예를 들어, 그(들)는 폴리뉴클레오티드 서열을 방해한다. 하나 이상의 스페이서는 바람직하게 표적 폴리뉴클레오티드에 혼성화된, 하나 이상의 차단 분자, 예컨대, 과속 방지턱의 일부가 아니다.
표적 폴리뉴클레오티드 중 임의 개수의 스페이서, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 스페이서가 존재할 수 있다. 바람직하게, 표적 폴리뉴클레오티드 중 2, 4, 또는 6개의 스페이서가 존재한다. 스페이서는 표적 폴리뉴클레오티드의 상이한 영역에 존재할 수 있고, 예컨대, 스페이서는 리더 서열에 및 스페이서는 헤어핀 루프에 존재할 수 있다.
하나 이상의 스페이서는 각각 하나 이상의 헬리카제기 심지어는 활성 모드에서도 극복하지 못하는 에너지 장벽을 제공한다. 하나 이상의 스페이서는 헬리카제의 견인을 감소시킴으로써 (예를 들어, 표적 폴리뉴클레오티드 중 뉴클레오티드로부터 염기를 제거함으로써), 또는 (예를 들어, 벌키한 화학적 기를 사용하여) 하나 이상의 헬리카제의 이동을 물리적으로 차단함으로써 하나 이상의 헬리카제를 정지시킬 수 있다.
하나 이상의 스페이서는 하나 이상의 헬리카제를 정지시키는 임의의 분자 또는 분자 조합을 포함할 수 있다. 하나 이상의 스페이서는 하나 이상의 헬리카제가 표적 폴리뉴클레오티드를 따라 이동하지 못하도록 막는 임의의 분자 또는 분자 조합을 포함할 수 있다. 하나 이상의 헬리카제가 막횡단 포어 및 인가된 전위의 부재하에서 하나 이상의 스페이서에서 정지되는지 여부를 측정하는 것은 간단하다. 예를 들어, 실시예에 제시된 바와 같이 검정될 수 있다. 예를 들어, 스페이서를 지나 이동하고, DNA의 상보성 가닥을 치환할 수 있는 헬리카제의 능력은 PAGE에 의해 측정될 수 있다.
하나 이상의 스페이서는 전형적으로 선형 분자, 예컨대, 중합체를 포함한다. 하나 이상의 스페이서는 전형적으로 표적 폴리뉴클레오티드와 상이한 구조를 가진다. 예를 들어, 표적 폴리뉴클레오티드가 DNA일 경우, 하나 이상의 스페이서는 전형적으로 DNA가 아니다. 특히, 표적 폴리뉴클레오티드가 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA)일 경우, 하나 이상의 스페이서는 바람직하게 펩티드 핵산 (PNA), 글리세롤 핵산 (GNA), 트레오스 핵산 (TNA), 잠금 핵산 (LNA) 또는 뉴클레오티드 측쇄를 포함하는 합성 중합체를 포함한다.
하나 이상의 스페이서는 바람직하게 하나 이상의 니트로인돌, 예컨대, 하나 이상의 5-니트로인돌, 하나 이상의 이노신, 하나 이상의 아크리딘, 하나 이상의 2-아미노퓨린, 하나 이상의 2-6-디아미노퓨린, 하나 이상의 5-브로모-데옥시우리딘, 하나 이상의 역 티미딘 (역 dT), 하나 이상의 역 디데옥시-티미딘 (ddT), 하나 이상의 디데옥시-시티딘 (ddC), 하나 이상의 5-메틸시티딘, 하나 이상의 5-히드록시메틸시티딘, 하나 이상의 2'-O-메틸 RNA 염기, 하나 이상의 이소-데옥시시티딘 (이소-dC), 하나 이상의 이소-데옥시구아노신 (이소-dG), 하나 이상의 iSpC3 기 (즉, 당 및 염기가 결실된 뉴클레오티드), 하나 이상의 광절단가능한 (PC) 기, 하나 이상의 헥산디올 기, 하나 이상의 스페이서 9 (iSp9) 기, 하나 이상의 스페이서 18 (iSp18) 기, 중합체 또는 하나 이상의 티올 연결부를 포함한다. 하나 이상의 스페이서는 상기 기들의 임의의 조합을 포함할 수 있다. 상기 기 중 다수는 IDT® (인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies)®)로부터 상업적으로 이용가능하다.
하나 이상의 스페이서는 임의 개수의 상기 기를 함유할 수 있다. 예를 들어, 2-아미노퓨린, 2-6-디아미노퓨린, 5-브로모-데옥시우리딘, 역 dT, ddT, ddC, 5-메틸시티딘, 5-히드록시메틸시티딘, 2'-O-메틸 RNA 염기, 이소-dC, 이소-dG, iSpC3 기, PC 기, 헥산디올 기 및 티올 연결부인 경우, 하나 이상의 스페이서는 바람직하게 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과를 포함한다. 하나 이상의 스페이서는 바람직하게 2, 3, 4, 5, 6, 7, 8개 또는 그 초과의 iSp9 기를 포함한다. 하나 이상의 스페이서는 바람직하게 2, 3, 4, 5 또는 6개 또는 그 초과의 iSp18 기를 포함한다. 가장 바람직한 스페이서는 4개의 iSp18 기이다.
중합체는 바람직하게 폴리펩티드 또는 폴리에틸렌 글리콜 (PEG)이다. 폴리펩티드는 바람직하게 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과의 아미노산을 포함한다. PEG는 바람직하게 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과의 단량체 단위를 포함한다.
하나 이상의 스페이서는 바람직하게 하나 이상의 무염기 뉴클레오티드 (즉, 뉴클레오염기가 결실된 뉴클레오티드), 예컨대, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과의 무염기 뉴클레오티드를 포함한다. 뉴클레오염기는 무염기 뉴클레오티드 중 -H(idSp) 또는 -OH에 의해 치환될 수 있다. 무염기 스페이서는 하나 이상의 인접한 뉴클레오티드로부터 뉴클레오염기를 제거함으로써 표적 폴리뉴클레오티드 내로 삽입될 수 있다. 예를 들어, 폴리뉴클레오티드는 3-메틸아데닌, 7-메틸구아닌, 1,N6-에테노아데닌 이노신 또는 히포크산틴을 포함하도록 변형될 수 있고, 뉴클레오염기는 인간 알킬아데닌 DNA 글리코실라제 (hAAG)를 사용하여 상기 뉴클레오티드로부터 제거될 수 있다. 대안적으로, 폴리뉴클레오티드는 우라실을 포함하도록 변형될 수 있고, 뉴클레오염기는 우라실-DNA 글리코실라제 (UDG)를 사용하여 제거될 수 있다. 한 실시양태에서, 하나 이상의 스페이서는 임의의 무염기 뉴클레오티드를 포함하지 않는다.
하나 이상의 헬리카제는 각각의 선형 분자 스페이서에 의해 (즉, 그 앞에서), 또는 그 상에서 정지될 수 있다. 선형 분자 스페이서가 사용될 때, 표적 폴리뉴클레오티드에는 바람직하게, 하나 이상의 헬리카제가 지나서 이동하게 되는 각 스페이서의 말단에 인접한 폴리뉴클레오티드의 이중 가닥 영역이 제공된다. 이중 가닥 영역은 전형적으로 인접한 스페이서 상에서의 하나 이상의 헬리카제의 정지를 돕는다. 이중 가닥 영역(들)의 존재는 특히 본 방법이 염 농도가 약 100 mM 이하일 때 수행되는 경우에 바람직하다. 각 이중 가닥 영역의 길이는 전형적으로 10개 이상, 예컨대, 12개 이상의 뉴클레오티드 길이이다. 본 발명에서 사용되는 표적 폴리뉴클레오티드가 단일 가닥일 경우, 이중 가닥 영역은 더 짧은 폴리뉴클레오티드를 스페이서에 인접한 영역에 혼성화시킴으로써 형성될 수 있다. 더 짧은 폴리뉴클레오티드는 전형적으로 표적 폴리뉴클레오티드와 동일한 뉴클레오티드로부터 형성되지만, 상이한 뉴클레오티드로부터 형성될 수 있다. 예를 들어, 더 짧은 폴리뉴클레오티드는 LNA로부터 형성될 수 있다.
선형 분자 스페이서가 사용되는 경우, 표적 폴리뉴클레오티드에는 바람직하게, 하나 이상의 헬리카제가 지나서 이동하게 되는 말단 반대편의 각 스페이서의 말단에 차단 분자가 제공된다. 이는 확실하게 하나 이상의 헬리카제가 각 스페이서 상에 정지된 상태 그대로 유지될 수 있도록 하는 데 도움을 줄 수 있다. 이는 또한 그(들)가 용액 중에서 확산되는 경우, 표적 폴리뉴클레오티드 상에 하나 이상의 헬리카제를 유지시키는 데 도움을 줄 수 있다. 차단 분자는 하나 이상의 헬리카제를 물리적으로 정지시키는, 하기 논의되는 화학적 기 중 임의의 것일 수 있다. 차단 분자는 폴리뉴클레오티드의 이중 가닥 영역일 수 있다.
하나 이상의 스페이서는 바람직하게 하나 이상의 헬리카제를 물리적으로 정지시키는 하나 이상의 화학적 기를 포함한다. 하나 이상의 화학적 기는 바람직하게 하나 이상의 펜던트 화학적 기. 하나 이상의 화학적 기는 표적 폴리뉴클레오티드 중 하나 이상의 뉴클레오염기에 부착될 수 있다. 하나 이상의 화학적 기는 표적 폴리뉴클레오티드 백본에 부착될 수 있다. 상기 화학적 기는 임의 개수로, 예컨대, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개 또는 그 초과로 존재할 수 있다. 적합한 기로는 형광단, 스트렙트아비딘 및/또는 비오틴, 콜레스테롤, 메틸렌 블루, 디니트로페놀 (DNP), 디곡시게닌 및/또는 항-디곡시게닌 및 디벤질시클로옥틴 기를 포함하나, 이에 제한되지는 않는다.
표적 폴리뉴클레오티드 중 상이한 스페이서는 상이한 정지 분자를 포함할 수 있다. 예를 들어, 한 스페이서는 상기 논의된 선형 분자 중 하나를 포함할 수 있고, 또 다른 스페이서는 하나 이상의 헬리카제를 물리적으로 정지시키는 하나 이상의 화학적 기를 포함할 수 있다. 스페이서는 상기 논의된 선형 분자 중 하나, 및 하나 이상의 헬리카제를 물리적으로 정지시키는 하나 이상의 화학적 기, 예컨대, 하나 이상의 무염기 및 형광단을 포함할 수 있다.
적합한 스페이서는 표적 폴리뉴클레오티드의 유형, 및 본 발명의 방법이 수행되는 조건에 따라 디자인될 수 있다. 대부분의 헬리카제는 DNA에 결합하여 그를 따라 이동하며, 이로써, DNA가 아닌 임의의 것을 사용하여 정지될 수 있다. 적합한 분자는 상기에 논의된 것이다.
본 발명의 방법은 바람직하게 유리 뉴클레오티드의 존재, 및/또는 헬리카제 보조인자의 존재 하에 수행된다. 이는 하기에서 더욱 상세하게 논의된다. 막횡단 포어 및 인가된 전위의 부재하에서, 하나 이상의 스페이서는 바람직하게 유리 뉴클레오티드의 존재, 및/또는 헬리카제 보조인자의 존재 하에 하나 이상의 헬리카제를 정지시킬 수 있다.
하기 논의되는 바와 같이 본 발명의 방법이 (하나 이상의 헬리카제가 활성 모드이도록) 유리 뉴클레오티드 및 헬리카제 보조인자의 존재 하에 수행되는 경우, 확실하게 하나 이상의 헬리카제가 막횡단 포어와 접촉하기 전 및 전위가 인가되기 전에 표적 폴리뉴클레오티드 상에서 정지되게 하는 데에는 전형적으로 하나 이상의 더 긴 장쇄의 스페이서가 사용된다. 하나 이상의 더 짧은 단쇄의 스페이서는 (하나 이상의 헬리카제가 불활성 모드이도록) 유리 뉴클레오티드 및 헬리카제 보조인자의 부재하에서 사용될 수 있다.
염 농도 또한 하나 이상의 헬리카제를 정지시킬 수 있는 하나 이상의 스페이서의 능력에 영향을 미친다. 막횡단 포어 및 인가된 전위의 부재하에서, 하나 이상의 스페이서는 바람직하게 염 농도 약 100 mM 이하에서 하나 이상의 헬리카제를 정지시킬 수 있다. 본 발명의 방법에서 사용되는 염 농도가 높을수록, 전형적으로 사용되는 하나 이상의 스페이서의 길이는 더 짧아지고, 그 반대의 경우도 그러하다.
특징의 바람직한 조합은 하기 표 1에 제시되어 있다.
[표 1]
하기에서 더욱 상세하게 논의되는 바와 같이, 본 방법은 2개 이상의 헬리카제가 스페이서를 지나도록 이동시키는 것에 관한 것이다. 상기 경우에서, 스페이서의 길이는 전형적으로는, 포어 및 인가된 전위의 부재하에서 트레일링 헬리카제가 리딩 헬리카제가 스페이서를 지나도록 인출하지 못하도록 막기 위해서는 증가된다. 본 방법이 2개 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 것에 관한 것인 경우, 상기 논의된 스페이서의 길이는 1.5배 이상, 에서, 2배, 2.5배 또는 3배로 증가될 수 있다. 예를 들어, 본 방법이 2개 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 것에 관한 것인 경우, 상기 표 1의 세번째 칸의 스페이서 길이는 1.5배, 2배, 2,5배 또는 3배로 증가될 수 있다.
2개 이상의 헬리카제는 또한 각각이 그 자체의 하나 이상의 스페이서를 가지도록 이격될 수 있다. 이는 하기에서 더욱 상세하게 논의된다.
헬리카제
(들)
임의의 헬리카제가 본 발명에서 사용될 수 있다. 헬리카제는 Hel308 헬리카제, RecD 헬리카제, 예컨대, TraI 헬리카제 또는 TrwC 헬리카제, XPD 헬리카제 또는 Dda 헬리카제이거나, 또는 그로부터 유래된 것일 수 있다. 헬리카제는 국제 출원 번호 PCT/GB2012/052579 (공보 WO 2013/057495); PCT/GB2012/053274 (공보 WO 2013/098562); PCT/GB2012/053273 (공보 WO2013098561); PCT/GB2013/051925; PCT/GB2013/051924 및 PCT/GB2013/051928; 및 UK 출원 번호 1318464.3 (2013년 10월 18일 출원)에서 개시된, 헬리카제, 변형된 헬리카제 또는 헬리카제 구축물 중 임의의 것일 수 있다.
헬리카제는 바람직하게 서열 17에 제시된 서열 (Trwc Cba) 또는 그의 변이체, 서열 28에 제시된 서열 (Hel308 Mbu) 또는 그의 변이체, 또는 서열 8에 제시된 서열 (Dda) 또는 그의 변이체를 포함한다. 변이체는 막횡단 포어에 대해 하기에 논의되는 방식 중 임의의 것으로 자연 서열과 상이할 수 있다. 서열 8의 바람직한 변이체는 E94C/A360C 및 이어서, (ΔM1)G1G2 (즉, M1 결실, 및 이어서, G1 및 G2 부가)를 포함한다.
본 발명에 따라 임의 개수의 헬리카제가 하나 이상의 스페이서를 지나 이동할 수 있다. 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 헬리카제가 하나 이상의 스페이서를 지나 이동할 수 있다. 일부 실시양태에서, 상이한 개수의 헬리카제가 각 스페이서를 지나 이동할 수 있다. 예를 들어, 2개의 별개의 스페이서를 사용하여 2개의 헬리카제를 정지시키는 경우, 1개의 헬리카제 (제1 헬리카제)는 제1 스페이서를 지나 이동할 수 있지만, 2개의 헬리카제 (제1 및 제2 헬리카제)는 제2 스페이서를 지나 이동할 수 있다.
본 발명의 방법은 바람직하게 2개 이상, 예컨대, 3개 이상 또는 4개 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 것을 포함한다. 2개 이상의 헬리카제는 전형적으로 동일한 헬리카제이다. 2개 이상의 헬리카제는 상이한 헬리카제이다.
2개 이상의 헬리카제는 상기 언급된 헬리카제의 임의의 조합일 수 있다. 2개 이상의 헬리카제는 2개 이상의 Dda 헬리카제일 수 있다. 2개 이상의 헬리카제는 하나 이상의 Dda 헬리카제 및 하나 이상의 TrwC 헬리카제일 수 있다. 2개 이상의 헬리카제는 동일한 헬리카제의 상이한 변이체일 수 있다.
2개 이상의 헬리카제는 바람직하게 서로 부착되어 있다. 2개 이상의 헬리카제는 더욱 바람직하게 서로 공유 부착되어 있다. 헬리카제는 임의의 순서로 및 임의의 방법을 이용하여 부착되어 있을 수 있다. 본 발명에서 사용하는 데 바람직한 헬리카제 구축물은 국제 출원 번호 PCT/GB2013/051925; PCT/GB2013/051924 및 PCT/GB2013/051928; 및 UK 출원 번호 1318464.3 (2013년 10월 18일 출원)에 기술되어 있다.
조건 및
막횡단
포어
본 방법은 포어를 통해 전위를 인가하는 것을 포함한다. 인가된 전위는 전압 전위일 수 있다. 본 방법은 포어를 통해 전압 전위를 인가하는 것을 포함할 수 있다. 본 방법은 포어를 통해 인가되는 전압을 증가시키는 것을 포함할 수 있다. 본 실시양태에서, 초기 전압 전위는 전형적으로는 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 데에는 충분하지 않고, 증가된 전압 전위는 전형적으로 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 데 충분하다. 대안적으로, 인가된 전위는 화학 전위일 수 있다. 그의 예는 양친매성 층을 통한 염 구배를 사용하는 것이다. 염 구배는 문헌 [Holden et al., J Am Chem Soc. 2007 Jul 11;129(27):8650-5]에 개시되어 있다. 일부 경우에서, 포어와 관련하여 표적 폴리뉴클레오티드가 이동함에 따라 포어를 통과하는 전류는 표적 폴리뉴클레오티드의 서열을 결정하는 데 사용된다. 이것이 가닥 서열분석이다.
막횡단 포어는 어느 정도 막을 횡단하는 구조이다. 이는 인가된 전위에 의해 유도된, 수화된 이온이 막을 통해 또는 막 내에서 유동할 수 있도록 허용한다. 막횡단 포어는 전형적으로 전체 막을 횡단하며, 이로써 수화된 이온은 막의 한쪽에서부터 막의 다른 쪽으로 유동할 수 있다. 그러나, 막횡단 포어이 막을 횡단할 필요는 없다. 이는 한쪽 다부에 가깝게 존재할 수 있다. 예를 들어, 포어는 그를 따라 또는 그 내부로 수화된 이온이 유동하는 막 내의 웰일 수 있다.
임의의 막횡단 포어가 본 발명에서 사용될 수 있다. 포어는 생물학적인 것 또는 인공인 것일 수 있다. 적합한 포어로는 단백질 포어, 폴리뉴클레오티드 포어 및 고체 상태 포어를 포함하나, 이에 제한되지는 않는다.
임의의 막이 본 발명에 따라 사용될 수 있다. 적합한 막은 관련 기술분야에 주지되어 있다. 막은 바람직하게 양친매성 층이다. 양친매성 층은 1개 이상의 친수성 부분 및 1개 이상의 친유성 또는 소수성 부분, 둘 모두를 포함하는, 양친매성 분자, 예컨대, 인지질로부터 형성되는 층이다. 양친매성 분자는 합성 분자이거나, 또는 자연적으로 발생된 것일 수 있다. 비-자연적으로 발생된 양친매성 물질 및 단일층을 형성하는 양친매성 물질은 관련 기술분야에 공지되어 있고, 이는 예를 들어, 블록 공중합체를 포함한다 (Gonzalez-Perez et al., Langmuir, 2009. 25, 10447-10450). 블록 공중합체는 2개 이상의 단량체 서브유닛이 함께 중합화되어 단일 중합체 쇄를 생성하는 중합성 물질이다. 블록 공중합체는 전형적으로 각 단량체 서브유닛이 기여하는 특성을 가진다. 그러나, 블록 공중합체는 개별 서브유닛으로부터 형성된 중합체는 가지지 않는 독특한 특성을 가질 수 있다. 블록 공중합체는, 수성 매질 중에 있는 동안 단량체 서브유닛 중 하나는 소수성 (즉, 친유성)이고, 나머지 서브유닛(들)은 친수성이도록 조작될 수 있다. 이러한 경우, 블록 공중합체는 양친매성 특성을 가질 수 있고, 생물학적 막을 모방하는 구조를 형성할 수 있다. 블록 공중합체는 (2개의 단량체 서브유닛으로 이루어진) 디블록일 수 있지만, 이는 또한 2개 초과의 단량체 서브유닛으로부터 구축될 수 있고, 이로써 양친매성 물질로서의 작용하는 더욱 복잡한 배열을 형성할 수 있다. 공중합체는 트리블록, 테트라블록 또는 펜타블록 공중합체일 수 있다.
양친매성 층은 단일층 또는 이중층일 수 있다. 양친매성 층은 전형적으로 평면 지질 이중층 또는 지지형 이중층일 수 있다.
양친매성 층은 전형적으로 지질 이중층이다. 지질 이중층은 세포막 모델이고, 광범위한 실험 연구를 위한 탁월한 플랫폼으로서의 역할을 한다. 예를 들어, 지질 이중층은 단일 채널 기록에 의한 막 단백질에 관한 시험관내 연구에 사용될 수 있다. 대안적으로, 지질 이중층은 다양한 물질의 존재를 검출하기 위한 바이오센서로서 사용될 수 있다. 지질 이중층은 임의의 지질 이중층일 수 있다. 적합한 지질 이중층으로는 평면 지질 이중층, 지지형 이중층 또는 리포솜을 포함하나, 이에 제한되지는 않는다. 지질 이중층은 바람직하게 평면 지질 이중층이다. 적합한 지질 이중층은 국제 출원 번호 PCT/GB08/000563 (공보 WO 2008/102121), 국제 출원 번호 PCT/GB08/004127 (공보 WO 2009/077734) 및 국제 출원 번호 PCT/GB2006/001057 (공보 WO 2006/100484)에 개시되어 있다.
지질 이중층을 형성하는 방법은 관련 기술분야에 공지되어 있다. 적합한 방법은 실시예에 개시되어 있다. 지질 이중층은 보편적으로는, 지질 단일층이 수용액/대기 계면에 수직인 개구의 양측을 지나 상기 계면에서 계속 이어지는, 몬탈(Montal) 및 뮐러(Mueller) (Proc. Natl. Acad. Sci. USA., 1972; 69: 3561-3566)의 방법에 의해 형성된다.
몬탈 및 뮐러의 방법은 단백질 포어를 삽입시키는 데 적합한 우수한 품질의 지질 이중층을 형성할 수 있는 방법으로서 비용면에서 효율적이고, 상대적으로 간단하기 때문에 인기가 많다. 다른 일반적인 이중층 형성 방법으로는 팁-디핑, 이중층 페인팅 및 리포솜 이중층 패치-클램핑을 포함한다.
바람직한 실시양태에서, 지질 이중층은 국제 출원 번호 PCT/GB08/004127 (공보 WO 2009/077734)에 기술된 바와 같이 형성된다.
또 다른 바람직한 실시양태에서, 막은 고체 상태 층이다. 고체 상태 층은 생물학적 기원의 것이 아니다. 다시 말해, 고체 상태 층은 생물학적 환경, 예컨대, 유기체 또는 세포, 또는 합성적으로 제조된 생물학적으로 이용가능한 구조체 버전으로부터 유래된 것이 아니거나, 또는 그로부터 단리된 것이 아니다. 고체 상태 층은 마이크로전자 물질, 절연 물질, 예컨대, 예컨대, Si3N4, Al2O3, 및 SiO를 비롯한, 유기 물질 및 무기 물질, 둘 모두, 유기 및 무기 중합, 예컨대, 폴리아미드, 플라스틱, 예컨대, 테플론(Teflon)® 또는 엘라스토머, 예컨대, 2 성분 부가 경화형 실리콘 곱, 및 유리로부터 형성될 수 있다. 고체 상태 층은 단원자 층, 예컨대, 그래핀, 또는 단지 몇 안되는 원자 두께인 층으로부터 형성될 수 있다. 적합한 그래핀 층은 국제 출원 번호 PCT/US2008/010637 (공보 WO 2009/035647)에 개시되어 있다.
본 방법은 전형적으로 (i) 포어를 포함하는 인공 양친매성 층, (ii) 포어를 포함하는 단리된, 자연적으로 발생된 지질 이중층, 또는 (iii) 그 안에 포어가 삽입되어 있는 세포를 사용하여 수행된다. 본 방법은 전형적으로 인공 양친매성 층, 예컨대, 인공 지질 이중층을 사용하여 수행된다. 층은 포어 이외에도, 다른 막횡단 및/또는 막내 단백질 뿐만 아니라, 다른 분자를 포함할 수 있다. 적합한 장치 및 조건은 하기에서 논의된다. 본 발명의 방법은 전형적으로 시험관내에서 수행된다.
표적 폴리뉴클레오티드는 바람직하게 막에 커플링된다. 이는 임의의 공지된 방법을 이용하여 수행될 수 있다. 막이 양친매성 층, 예컨대, (상기에서 상세하게 논의된 바와 같은) 지질 이중층일 경우, 표적 폴리뉴클레오티드는 바람직하게 막에 존재하는 폴리펩티드를 통해, 또는 막에 존재하는 소수성 앵커를 통해 막에 커플링된다. 소수성 앵커는 바람직하게 지질, 지방산, 스테롤, 탄소 나노튜브 또는 아미노산이다.
표적 폴리뉴클레오티드는 막에 직접 커플링될 수 있다. 이는 국제 출원 번호 PCT/GB2012/051191 (공보 WO 2012/164270)에 개시된 방법들 중 임의의 것을 사용하여 막에 커플링될 수 있다. 표적 폴리뉴클레오티드는 바람직하게 링커를 통해 막에 커플링된다. 바람직한 링커로는 중합체, 예컨대, 폴리뉴클레오티드, 폴리에틸렌 글리콜 (PEG) 및 폴리펩티드를 포함하나, 이에 제한되지는 않는다. 표적 폴리뉴클레오티드가 막에 직접 커플링될 경우, 이때, 막과 포어 및/또는 헬리카제 사이의 거리에 기인하여 특징 규명 실행이 폴리뉴클레오티드 말단으로까지 계속 진행되지 못하기 때문에 일부 데이터는 손실될 것이다. 링커가 사용되는 경우, 이때 표적 폴리뉴클레오티드는 완전하게 프로세싱될 수 있다. 링커가 사용되는 경우, 링커는 표적 폴리뉴클레오티드의 임의의 위치에 부착될 수 있다. 링커는 전형적으로 표적 폴리뉴클레오티드 꼬리 중합체에 부착된다.
커플링은 안정적이거나, 또는 일시적인 것일 수 있다. 특정 적용의 경우, 커플링의 일시적인 성질이 바람직하다. 안정한 커플링 분자가 폴리뉴클레오티드의 5' 또는 3' 말단 중 어느 하나에 직접 부착된다면, 이때, 막과 포어 및/또는 헬리카제 사이의 거리에 기인하여 특징 규명 실행이 폴리뉴클레오티드 말단으로까지 계속 진행되지 못하기 때문에 일부 데이터는 손실될 것이다. 커플링이 일시적인 경우, 이때 커플링된 말단이 무작위적으로 막에 존재하지 않게 되었을 때, 이때 표적 폴리뉴클레오티드는 완전하게 프로세싱될 수 있다. 막과 안정적인 또는 일시적인 결합을 형성하는 화학적 기는 하기에서 더욱 상세하게 논의된다. 폴리뉴클레오티드는 콜레스테롤 또는 지방 아실 쇄를 이용하여 양친매성 층, 예컨대, 지질 이중층에 일시적으로 커플링될 수 있다. 길이가 6 내지 30개의 탄소 원자로 이루어진 임의의 지방 아실 쇄, 예컨대, 헥사데카노산이 사용될 수 있다.
바람직한 실시양태에서, 폴리뉴클레오티드는 양친매성 층에 커플링된다. 폴리뉴클레오티드를 합성 지질 이중층에 커플링시키는 것은 다양한 상이한 테더링 전략법을 이용하여 앞서 수행된 바 있다. 이는 하기 표 2에 요약되어 있다.
[표 2]
폴리뉴클레오티드는 합성 반응에서 반응성 기, 예컨대, 티올, 콜레스테롤, 지질 및 비오틴 기의 부가를 위해 쉽게 화합성을 띠는 변형된 포스포르아미다이트를 사용하여 관능화될 수 있다. 상기의 상이한 부착 화학법은 폴리뉴클레오티드에 대한 한 벌의 부착 옵션을 제공한다. 각각의 변형 기는 약간 상이한 방식으로 폴리뉴클레오티드를 테더링하고, 커플링은 항상 영구적인 것은 아니기 때문에, 폴리뉴클레오티드가 막에 존재하는 지속 시간은 상이하다. 일시적인 커플링이 갖는 장점은 상기에서 논의하였다.
폴리뉴클레오티드의 커플링은 또한, 반응성 기가 폴리뉴클레오티드에 부가될 수 있다면 다수의 다른 수단에 의해서도 달성될 수 있다. 반응성 기를 DNA의 말단에 부착시키는 것은 앞서 보고된 바 있다. 폴리뉴클레오티드 키나제 및 ATPγS를 사용하여 티올 기를 ssDNA의 5'에 부가할 수 있다 (Grant, G. P. and P. Z, Qin (2007). "A facile method for attaching nitroxide spin labels at the 5' terminus of nucleic acids." Nucleic Acids Res 35(10): e77). 변형된 올리고클레오티드를 ssDNA의 3'에 도입하는 데 말단 트랜스퍼라제를 사용하여 더욱 다양하게 선택될 수 있는 화학적 기, 예컨대, 비오틴, 티올 및 형광단을 부가할 수 있다 (Kumar, A., P. Tchen, et al. (1988). "Nonradioactive labeling of synthetic oligonucleotide probes with terminal deoxynucleotidyl transferase." Anal Biochem 169(2): 376-82).
대안적으로, 반응성 기는 이미 막에 커플링된 것에 대하여 폴리뉴클레오티드 중 짧은 단쇄 영역인 것으로 간주될 수 있고, 이로써, 부착은 혼성화를 통해 달성될 수 있다. 영역은 폴리뉴클레오티드의 일부이거나, 또는 그에 결찰될 수 있다. T4 RNA 리가제 I를 사용하여 이루어지는 짧은 ssDNA 조각의 결찰은 보고된 바 있다 (Troutt, A. B., M. G. McHeyzer-Williams, et al. (1992). "Ligation-anchored PCR: a simple amplification technique with single-sided specificity." Proc Natl Acad Sci U S A 89(20): 9823-5).
가장 바람직하게, 폴리뉴클레오티드는 폴리뉴클레오티드에 혼성화하는 콜레스테롤 태깅된 폴리뉴클레오티드를 사용하여 막에 커플링된다.
막횡단 포어는 바람직하게 막횡단 단백질 포어이다. 막횡단 단백질 포어는 수화된 이온, 예컨대, 분석물이 막의 한쪽으로부터 막의 나머지 다른 한쪽으로 유동할 수 있도록 허용하는 폴리펩티드 또는 폴리펩티드 집합이다. 본 발명에서, 막횡단 단백질 포어는 인가된 전위에 의해 유도된 수화된 이온이 막의 한쪽으로부터 나머지 다른 한쪽으로 유동할 수 있도록 허용하는 포어를 형성할 수 있다. 막횡단 단백질 포어는 바람직하게 분석물, 예컨대, 뉴클레오티드가 막, 예컨대, 지질 이중층의 한쪽으로부터 나머지 다른 한쪽으로 유동할 수 있도록 허용한다. 막횡단 단백질 포어를 통해 폴리뉴클레오티드 또는 핵산, 예컨대, DNA 또는 RNA는 포어를 통과하여 이동할 수 있다.
막횡단 단백질 포어는 단량체 또는 올리고머일 수 있다. 포어는 바람직하게 수개의 반복 서브유닛, 예컨대, 6, 7, 8 또는 9개의 서브유닛으로 구성된다. 포어는 바람직하게 육량체, 칠량체, 팔량체 또는 구량체 포어이다.
막횡단 단백질 포어는 전형적으로 이동이 그를 통해 유동할 수 있는 것인 장벽 또는 채널을 포함한다. 포어의 서브유닛은 전형적으로 중축을 둘러싸고, 가닥을 막횡단 β 장벽 또는 채널 또는 막횡단 α 나선 번들 또는 채널을 제공한다.
막횡단 단백질 포어의 장벽 또는 채널은 전형적으로 분석물, 예컨대, 뉴클레오티드, 폴리뉴클레오티드 또는 핵산과의 상호작용을 촉진시키는 아미노산을 포함한다. 이러한 아미노산은 바람직하게 장벽 또는 채널의 압축 수렴부 근처에 위치한다. 막횡단 단백질 포어는 전형적으로 하나 이상의 양으로 하전된 아미노산, 예컨대, 아르기닌, 리신 또는 히스티딘, 또는 방향족 아미노산, 예컨대, 티로신 또는 트립토판을 포함한다. 이러한 아미노산은 전형적으로 포어와 뉴클레오티드, 폴리뉴클레오티드 또는 핵산 사이의 상호작용을 촉진시킨다.
본 발명에 따라 사용하기 위한 막횡단 단백질 포어는 β 장벽 포어 또는 α 나선 번들 포어로부터 유도될 수 있다. β 장벽 포어는 β 가닥으로부터 형성되는 장벽 또는 채널을 포함한다. 적합한 β 장벽 포어로는 β 독소, 예컨대, α 헤몰리신, 탄저균 독소 및 류코시딘, 및 박테리아의 외막 단백질/포린, 예컨대, 미코박테리움 스메그마티스(Mycobacterium smegmatis) 포린 (Msp), 예를 들어, MspA, MspB, MspC 또는 MspD, 리세닌, 외막 포린 F (OmpF), 외막 포린 G (OmpG), 외막 포스포리파제 A 및 나이세리아(Neisseria) 자가수송체 지단백질 (NalP)을 포함하나, 이에 제한되지는 않는다. α 나선 번들 포어는 α 나선으로부터 형성되는 장벽 또는 채널을 포함한다. 적합한 α 나선 번들 포어로는 내막 단백질 및 외막 단백질, 예컨대, WZA 및 ClyA 독소를 포함하나, 이에 제한되지는 않는다. 막횡단 포어는 리세닌으로부터 유래될 수 있다. 리세닌으로부터 유래된 적합한 포어는 국제 출원 번호 PCT/GB2013/050667 (공보 WO 2013/153359)에 개시되어 있다. 막횡단 포어는 Msp로부터 또는 α 헤몰리신 (α-HL)으로부터 유래될 수 있다.
막횡단 단백질 포어는 바람직하게 Msp로부터, 바람직하게, MspA로부터 유래된다. 상기 포어는 올리고머가 될 것이며, 전형적으로는 Msp로부터 유래된 7, 8, 9 또는 10개의 단량체를 포함한다. 포어는 동일한 단량체를 포함하는, Msp로부터 유래된 동종올리고머 포어일 수 있다. 대안적으로, 포어는 나머지 다른 것과 상이한 1개 이상의 단량체를 포함하는, Msp로부터 유래된 이종올리고머 포어일 수 있다. 바람직하게, 포어는 MspA, 또는 그의 호모로그 또는 파라로그로부터 유래된 것이다.
Msp로부터 유래된 단량체는 전형적으로 서열 2에 제시된 서열 또는 그의 변이체를 포함한다. 서열 2는 MspA 단량체의 MS-(B1)8 돌연변이체이다. 이는 하기 돌연변이: D90N, D91N, D93N, D118R, D134R 및 E139K를 포함한다. 서열 2의 변이체는 서열 2와 다르고, 포어를 형성할 수 있는 그의 능력은 유지하는 아미노산 서열을 갖는 폴리펩티드이다. 포어를 형성할 수 있는 변이체의 능력은 관련 기술분야에 공지된 임의의 방법을 이용하여 검정될 수 있다. 예를 들어, 변이체는 다른 적절한 서브유닛을 따라 양친매성 층 내로 삽입될 수 있고, 중합화하여 포어를 형성할 수 있는 그의 능력은 측정될 수 있다. 서브유닛을 막, 예컨대, 양친매성 층 내로 삽입하는 방법은 관련 기술분야에 공지되어 있다. 예를 들어, 서브유닛은 지질 이중층을 함유하는 용액 중 정제된 형태로 현탁될 수 있고, 이로써, 서브유닛이 지질 이중층으로 확산되고, 지질 이중층에의 결합 및 기능성 상태로의 조립에 의해 삽입된다. 대안적으로, 서브유닛은 문헌 [M.A. Holden, H. Bayley. J. Am. Chem. Soc. 2005, 127, 6502-6503] 및 국제 출원 번호 PCT/GB2006/001057 (공보 WO 2006/100484)에 기술된, "픽 앤 플레이스(pick and place)" 방법을 이용하여 막으로 직접 삽입될 수 있다.
서열 2의 아미노산 서열의 전장에 걸쳐, 변이체는 바람직하게 아미노산 동일성에 기초하여 상기 서열과 50% 이상 상동성일 것이다. 더욱 바람직하게, 변이체는 아미노산 동일성에 기초하여 전체 서열에 걸쳐 서열 2의 아미노산 서열과 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 더욱 바람직하게, 95%, 97% 또는 99% 이상 상동성일 수 있다. 100개 이상, 예를 들어, 125, 150, 175 또는 200개 또는 그 초과의 인접한 아미노산으로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85%, 90% 또는 95% 이상의 아미노산 동일성을 가질 수 있다 ("엄격한(hard) 상동성").
상동성을 측정하는 데 관련 기술분야의 표준 방법이 사용될 수 있다. 예를 들어, UWGCG 패키지는, 상동성을 계산하는 데, 예를 들어, 그의 디폴트 설정 환경에서 사용될 수 있는 BESTFIT 프로그램을 제공한다 (Devereux et al., (1984) Nucleic Acids Research 12, p387-395). PILEUP 및 BLAST 알고리즘은 예를 들어, 문헌 [Altschul S. F. (1993) J Mol Evol 36:290-300]; [Altschul, S.F et al., (1990) J Mol Biol 215:403-10]에 기술된 바와 같이, 상동성을 계산하는 데 또는 서열을 정렬하는 데 (예컨대, (전형적으로 그의 디폴드 설정 환경에서) 등가인 잔기 또는 상응하는 서열을 확인하는 데) 사용될 수 있다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물 공학 정보 센터(National Center for Biotechnology Information)를 통해 공개적으로 이용가능하다 (http://www.ncbi.nlm.nih.gov/).
서열 2는 MspA 단량체의 MS-(B1)8 돌연변이체이다. 변이체는 MspA와 비교하여 MspB, C 또는 D 단량체에 돌연변이 중 임의의 것을 포함할 수 있다. 성숙한 형태의 MspB, C 및 D는 서열 5 내지 7에 제시되어 있다. 특히, 변이체는 MspB 중에 존재하는 하기 치환을 포함할 수 있다: A138P. 변이체는 MspC 중에 존재하는 하기 치환 중 하나 이상의 것을 포함할 수 있다: A96G, N102E 및 A138P. 변이체는 MspD 중에 존재하는 하기 치환 중 하나 이상의 것을 포함할 수 있다: G1 결실, L2V, E5Q, L8V, D13G, W21A, D22E, K47T, I49H, I68V, D91G, A96Q, N102D, S103T, V104I, S136K 및 G141A. 변이체는 Msp B, C 및 D로부터의 돌연변이 및 치환 중 하나 이상의 것의 조합을 포함할 수 있다. 변이체는 바람직하게 돌연변이 L88N을 포함한다. 서열 2의 변이체는 MS-(B1)8의 모든 돌연변이 이외에도 돌연변이 L88N을 가지며, 이는 MS-(B2)8로 명명된다. 본 발명에서 사용되는 포어는 바람직하게 MS-(B2)8이다. 추가로 바람직한 변이체는 돌연변이 G75S/G77S/L88N/Q126R을 포함한다. 서열 2의 변이체는 MS-(B1)8의 모든 돌연변이 이외에도 돌연변이 G75S/G77S/L88N/Q126R을 가지며, 이는 MS-(B2C)8로 명명된다. 본 발명에서 사용되는 포어는 바람직하게 MS-(B2)8 또는 MS-(B2C)8이다.
상기 논의된 것 이외에도, 서열 2의 아미노산 서열에 대하여 아미노산 치환, 예를 들어, 최대 1, 2, 3, 4, 5, 10, 20 또는 30개의 치환이 이루어질 수 있다. 보존적 치환은 아미노산을, 화학 구조가 유사한, 화학적 특성이 유사한, 또는 측쇄 부피가 유사한 다른 아미노산으로 대체한다. 도입되는 아미노산은 그가 대체하는 아미노산과 유사한 극성, 친수성, 소수성, 염기도, 산도, 중성도 또는 전하를 가질 수 있다. 대안적으로, 보존적 치환은 기존 방향족 또는 지방족 아미노산 대신 방향족 또는 지방족인 또 다른 아미노산을 도입할 수 있다. 보존적 아미노산 변이는 관련 기술분야에 주지되어 있고, 이는 하기 표 3에 정의된 바와 같은 20종의 주요 아미노산의 특성에 따라 선택될 수 있다. 아미노산이 유사한 극성을 가질 경우, 이는 또한 하기 표 4의 아미노산 측쇄에 대한 소수친수성(hydropathy) 등급을 참조로 하여 결정될 수 있다.
[표 3]
아미노산의 화학적 특성
[표 4]
소수친수성 등급
서열 2의 서열의 하나 이상의 아미노산 잔기는 추가로 상기 기술된 폴리펩티드로부터 결실될 수 있다. 최대 1, 2, 3, 4, 5, 10, 20 또는 30개 또는 그 초과의 잔기가 결실될 수 있다.
변이체는 서열 2의 단편을 포함할 수 있다. 상기 단편은 포어 형성 활성을 유지한다. 단편의 길이는 50, 100, 150 또는 200개 이상의 아미노산 길이일 수 있다. 상기 단편은 포어를 제조하는 데 사용될 수 있다. 단편은 바람직하게 서열 2의 포어 형성 도메인을 포함한다. 단편은 서열 2의 잔기 88, 90, 91, 105, 118 및 134 중 하나를 포함하여야 한다. 전형적으로, 단편은 서열 2의 잔기 88, 90, 91, 105, 118 및 134 모두를 포함한다.
하나 이상의 아미노산은 대안적으로 또는 추가로 상기 기술된 폴리펩티드에 부가될 수 있다. 신장부는 서열 2 또는 그의 폴리펩티드 변이체 또는 단편의 아미노산 서열의 아미노 말단 또는 카르복시 말단에 제공될 수 있다. 신장부는 매우 짧은 단쇄일 수 있고, 예를 들어, 길이는 1 내지 10개의 아미노산 길이일 수 있다. 대안적으로, 신장부는 더 긴 장쇄일 수 있고, 예를 들어, 최대 50 또는 100개의 아미노산일 수 있다. 캐리어 단백질은 본 발명에 따라 아미노산 서열에 융합될 수 있다. 다른 융합 단백질은 하기에서 더욱 상세하게 논의된다.
상기에서 논의된 바와 같이, 변이체는 서열 2의 것과는 다른 아미노산 서열을 가지고, 그의 포어를 형성할 수 있는 능력을 갖는 폴리펩티드이다. 변이체는 전형적으로 포어 형성을 담당하는 서열 2의 영역을 함유한다. β 장벽을 함유하는 Msp의 포어 형성 능력은 각 서브유닛 중의 β 시트에 의해 제공된다. 서열 2의 변이체는 전형적으로 β 시트를 형성하는, 서열 2 중의 영역을 포함한다. 생성된 변이체가 포어를 형성할 수 있는 그의 능력을 유지하는 한, β 시트를 형성하는, 서열 2 중의 영역에 대하여 하나 이상의 변형이 이루어질 수 있다. 서열 2의 변이체는 바람직하게 그의 α 나선 및/또는 루프 영역 내에 하나 이상의 변형, 예컨대, 치환, 부가 또는 결실을 포함한다.
Msp로부터 유래된 단량체는 그의 확인 또는 정제를 돕기 위해, 예를 들어, 히스티딘 잔기 (his 태그), 아스파르트산 잔기 (asp 태그), 스트렙트아비딘 태그 또는 플래그 태그의 부가에 의해, 또는 폴리펩티드가 자연적으로 하기 신호 서열을 함유하지 않는 세포로부터 그의 분비를 촉진시키는 신호 서열의 부가에 의해 변형될 수 있다. 유전자 태그를 도입하는 대안은 포어 상의 자연 또는 조작된 위치 상에서 태그를 화학적으로 반응시키는 것이다. 그의 일례는 포어 바깥쪽에서 조작된 시스테인에 대하여 겔 이동 시약을 반응시키는 것이 될 것이다. 이는 헤몰리신 이종올리고머를 분리시키는 방법으로서 입증되었다 (Chem Biol. 1997 Jul; 4(7):497-505).
Msp로부터 유래된 단량체는 시현 표지로 표지화될 수 있다. 시현 표지는 포어가 검출될 수 있도록 하는 임의의 적합한 표지일 수 있다. 적합한 표지는 하기 기술된다.
Msp로부터 유래된 단량체는 또한 D-아미노산을 사용하여 제조될 수 있다. 예를 들어, Msp로부터 유래된 단량체는 L-아미노산 및 D-아미노산의 혼합물을 포함할 수 있다. 이는 관련 기술분야에서 상기 단백질 또는 펩티드를 제조하는 데 통상적인 것이다.
Msp로부터 유래된 단량체는 뉴클레오티드 구별을 촉진시키기 위해 하나 이상의 특이적인 변형을 함유한다. Msp로부터 유래된 단량체는 또한 포어 형성을 하지 않는 한, 다른 비특이적인 변형을 함유할 수 있다. 다수의 비특이적인 측쇄 변형은 관련 기술분야에 공지되어 있고, Msp로부터 유래된 단량체의 측쇄에 대해 상기와 같은 변형이 이루어질 수 있다. 그러한 변형으로는 예를 들어, 알데히드와 반응시킨 후, NaBH4로 환원시키는 아미노산의 환원적 알킬화, 메틸아세트이미데이트에 의한 아미딘화 또는 아세트산 무수물에 의해 아실화를 포함한다.
Msp로부터 유래된 단량체는 관련 기술분야에 공지된 표준 방법을 이용하여 제조될 수 있다. Msp로부터 유래된 단량체는 합성적으로 또는 재조합 수단에 의해 제조될 수 있다. 예를 들어, 포어는 시험관내 번역 및 전사 (IVTT)에 의해 합성될 수 있다. 포어를 제조하는 데 적합한 방법은 국제 출원 번호 PCT/GB09/001690 (공보 WO 2010/004273), PCT/GB09/001679 (공보 WO 2010/004265) 또는 PCT/GB10/000133 (공보 WO 2010/086603)에서 논의된 바와 있다. 포어를 막 내로 삽입하는 방법이 논의된다.
막횡단 단백질 포어는 또한 바람직하게 α-헤몰리신 (α-HL)으로부터 유래된다. 야생형 α-HL 포어는 7개의 동일한 단량체 또는 서브유닛으로 형성된다 (즉, 이는 칠량체성을 띤다). α-헤몰리신-NN의 한 단량체 또는 서브유닛의 서열은 서열 4에 제시되어 있다. 막횡단 단백질 포어는 바람직하게 , 각각이 서열 4 또는 그의 변이체에 제시된 서열을 포함하는 것인, 7개의 단량체를 포함한다. 서열 4의 아미노산 1, 7 내지 21, 31 내지 34, 45 내지 51, 63 내지 66, 72, 92 내지 97, 104 내지 111, 124 내지 136, 149 내지 153, 160 내지 164, 173 내지 206, 210 내지 213, 217, 218, 223 내지 228, 236 내지 242, 262 내지 265, 272 내지 274, 287 내지 290 및 294가 루프 영역을 형성한다. 서열 4의 잔기 113 내지 147이 α-HL의 장벽 또는 채널의 압축 수렴부의 일부를 형성한다.
상기 실시양태에서, 각각이 서열 4에 제시된 서열 또는 그의 변이체를 포함하는, 7개의 단백질 또는 단량체를 포함하는 포어가 바람직하게 본 발명의 방법에서 사용된다. 7개의 단백질은 동일하거나 (동종칠량체) 또는 상이할 수 있다 (이종칠량체).
서열 4의 변이체는 서열 4의 것과는 다른 아미노산 서열을 가지고, 그의 포어를 형성할 수 있는 능력을 유지하는 단백질이다. 포어를 형성할 수 있는 변이체의 능력은 관련 기술분야에 공지된 임의의 방법을 이용하여 검정될 수 있다. 예를 들어, 변이체는 임의의 적절한 서브유닛과 함께 양친매성 층, 예컨대, 지질 이중층 내로 삽입될 수 있고, 올리고머화하여 포어를 형성할 수 있는 그의 능력이 측정될 수 있다. 양친매성 층, 예컨대, 지질 이중층 내로 서브유닛을 삽입하는 방법은 관련 기술분야에 공지되어 있다. 적합한 방법은 상기에서 논의된 바와 같다.
변이체는 헬리카제에의 공유 부착 또는 그와의 상호작용을 촉진시키는 변형을 포함할 수 있다. 변이체는 바람직하게 헬리카제에의 부착을 촉진시키는 하나 이상의 반응성 시스테인 잔기를 포함한다. 예를 들어, 변이체는 서열 4의 8, 9, 17, 18, 19, 44, 45, 50, 51, 237, 239 ? 287번 위치 중 하나 이상에서 및/또는 아미노 또는 카르복시 말단 상에 시스테인을 포함할 수 있다. 바람직한 변이체는 서열 4의 8, 9, 17, 237, 239 및 287번 위치의 잔기를 시스테인으로 치환하는 것 (A8C, T9C, N17C, K237C, S239C 또는 E287C)을 포함한다. 변이체는 바람직하게 국제 출원 번호 PCT/GB09/001690 (공보 WO 2010/004273), PCT/GB09/001679 (공보 WO 2010/004265) 또는 PCT/GB 10/000133 (공보 WO 2010/086603)에 기술된 변이체 중 어느 하나이다.
변이체는 또한 뉴클레오티드와의 임의의 상호작용을 촉진시키는 변형을 포함할 수 있다.
변이체는 유기체에 의해, 예를 들어, 스타필로코쿠스(Staphylococcus) 박테리아에 의해 자연적으로 발현되는, 자연적으로 발생된 변이체일 수 있다. 대안적으로, 변이체는 박테리아에 의해, 예컨대, 에스케리키아 콜라이(Escherichia coli)에 의해 시험관내에서 또는 재조합적으로 발현될 수 있다. 변이체는 또한 재조합 기술에 의해 제조된 비자연적으로 발생된 변이체를 포함한다. 서열 4의 아미노산 서열의 전장에 걸쳐, 변이체는 바람직하게 아미노산 동일성에 기초하여 상기 서열과 50% 이상 상동성일 것이다. 더욱 바람직하게, 변이체 폴리펩티드는 전체 서열에 걸쳐 서열 4의 아미노산 서열과 아미노산 동일성에 기초하여 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 및 더욱 바람직하게, 95%, 97% 또는 99% 이상 상동성일 수 있다. 200개 이상, 예를 들어, 230, 250, 270 또는 280개 또는 그 초과의 것으로 이루어진 스트레치에 걸쳐 80% 이상, 예를 들어, 85%, 90% 또는 95% 이상의 아미노산 동일성을 가질 수 있다 ("엄격한 상동성"). 상동성은 상기 논의된 바와 같이 측정될 수 있다.
상기 논의된 것 이외에도 서열 4의 아미노산 서열에 대하여 아미노산 치환, 예를 들어, 최대 1, 2, 3, 4, 5, 10, 20 또는 30개 또는 그 초과의 치환이 이루어질 수 있다. 보존적 치환은 상기 논의된 바와 같이 이루어질 수 있다.
서열 4의 아미노산 서열의 하나 이상의 아미노산 잔기는 추가로 상기 기술된 폴리펩티드로부터 결실될 수 있다. 최대 1, 2, 3, 4, 5, 10, 20 또는 30개 또는 그 초과의 잔기가 결실될 수 있다.
변이체는 서열 4의 단편일 수 있다. 상기 단편은 포어 형성 활성을 유지한다. 단편의 길이는 50, 100, 200 또는 250개 이상의 아미노산 길이일 수 있다. 단편은 바람직하게 서열 4의 포어 형성 도메인을 포함한다. 단편은 전형적으로 서열 4의 잔기 119, 121, 135, 113 및 139를 포함한다.
하나 이상의 아미노산은 대안적으로 또는 추가로 상기 기술된 폴리펩티드에 부가될 수 있다. 신장부는 서열 4 또는 그의 변이체 또는 단편의 아미노산 서열의 아미노 말단 또는 카르복시 말단에 제공될 수 있다. 신장부는 매우 짧은 단쇄일 수 있고, 예를 들어, 길이는 1 내지 10개의 아미노산 길이일 수 있다. 대안적으로, 신장부는 더 긴 장쇄일 수 있고, 예를 들어, 최대 50 또는 100개의 아미노산일 수 있다. 캐리어 단백질은 포어 또는 변이체에 융합될 수 있다.
상기에서 논의된 바와 같이, 서열 4의 변이체는 서열 4의 것과는 다른 아미노산 서열을 가지고, 그의 포어를 형성할 수 있는 능력을 갖는 서브유닛이다. 변이체는 전형적으로 포어 형성을 담당하는 서열 4의 영역을 함유한다. β 장벽을 함유하는 α-HL의 포어 형성 능력은 각 서브유닛 중의 β 가닥에 의해 제공된다. 서열 4의 변이체는 전형적으로 β 가닥을 형성하는, 서열 4 중의 영역을 포함한다. β 가닥을 형성하는 서열 4의 아미노산은 상기에서 논의된 바와 같다. 생성된 변이체가 포어를 형성할 수 있는 그의 능력을 유지하는 한, β 가닥을 형성하는, 서열 4 중의 영역에 대하여 하나 이상의 변형이 이루어질 수 있다. 서열 4의 β 가닥 영역에 대하여 이루어질 수 있는 구체적인 변형은 상기에서 논의된 바와 같다.
서열 4의 변이체는 바람직하게 그의 α 나선 및/또는 루프 영역 내에 하나 이상의 변형, 예컨대, 치환, 부가 또는 결실을 포함한다. α-나선 및 루프를 형성하는 아미노산은 상기 논의되어 있다.
변이체는 상기 논의된 바와 같이 그의 확인 또는 정제를 돕기 위해 변형될 수 있다.
α-HL로부터 유래된 포어는 Msp로부터 유래된 포어를 참조로 하여 상기 논의된 바와 같이 제조될 수 있다.
일부 실시양태에서, 막횡단 단백질 포어는 화학적으로 변형된다. 포어는 임의의 방식으로 및 임의의 부위에서 화학적으로 변형될 수 있다. 막횡단 단백질 포어는 바람직하게 분자의 하나 이상의 시스테인 (시스테인 연결부)에의 부착에 의해, 분자의 하나 이상의 리신에의 부착에 의해, 분자의 하나 이상의 비자연 아미노산에의 부착에 의해, 에피토프의 효소적 변형에 의해, 또는 말단 변형에 의해 화학적으로 변형된다. 상기 변형을 수행하는 데 적합한 방법은 관련 기술분야에 주지되어 있다. 막횡단 단백질 포어는 임의의 분자의 부착에 의해 화학적으로 변형될 수 있다. 예를 들어, 포어는 염료 또는 형광단의 부착에 의해 화학적으로 변형될 수 있다.
포어 중 임의 개수의 단량체가 화학적으로 변형될 수 있다. 하나 이상의, 예컨대, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 단량체는 바람직하게 상기 논의된 바와 같이 화학적으로 변형된다.
시스테인 잔기의 반응성은 인접한 잔기의 변형에 의해 증진될 수 있다. 예를 들어, 측면에 위치하는 아르기닌, 히스티딘 또는 리신 잔기의 염기성 기는 시스테인 티올 기의 pKa를 반응성이 더 큰 S- 기의 것으로 변화시킬 것이다. 시스테인 잔기의 반응성은 티올 보호기, 예컨대, dTNB에 의해 보호될 수 있다. 이는 링커 부착 이전에 포어의 하나 이상의 시스테인 잔기와 반응할 수 있다.
국제 출원 번호 PCT/GB09/001690 (공보 WO 2010/004273), PCT/GB09/001679 (공보 WO 2010/004265) 또는 PCT/GB10/000133 (공보 WO 2010/086603)에 개시된 바와 같이, (포어가 화학적으로 변형된 것인) 분자는 포어에 직접 부착될 수 있거나, 링커를 통해 부착될 수 있다.
헬리카제는 포어에 공유 부착될 수 있다. 헬리카제는 바람직하게 포어에 공유 부착되지 않는다.
본원에 기술된 단백질 중 임의의 것은 그의 확인 또는 정제를 돕기 위해, 예를 들어, 히스티딘 잔기 (his 태그), 아스파르트산 잔기 (asp 태그), 스트렙트아비딘 태그 또는 플래그 태그, SUMO 태그, GST 태그 또는 MBP 태그의 부가에 의해, 또는 폴리펩티드가 자연적으로 하기 신호 서열을 함유하지 않는 세포로부터 그의 분비를 촉진시키는 신호 서열의 부가에 의해 변형될 수 있다. 유전자 태그를 도입하는 대안은 헬리카제 또는 포어 상의 자연 또는 조작된 위치 상에서 태그를 화학적으로 반응시키는 것이다. 그의 일례는 포어 바깥쪽에서 조작된 시스테인에 대하여 겔 이동 시약을 반응시키는 것이 될 것이다. 이는 헤몰리신 이종올리고머를 분리시키는 방법으로서 입증되었다 (Chem Biol. 1997 Jul; 4(7):497-505).
표적 폴리뉴클레오티드, 헬리카제 또는 포어는 시현 표지로 표지화될 수 있다. 시현 표지는 검출될 수 있는 임의의 적합한 표지일 수 있다. 적합한 표지로는 형광성 분자, 방사성 동위 원소, 예컨대, 125I,35S, 효소, 항체, 항원, 폴리뉴클레오티드 및 리간드, 예컨대, 비오틴을 포함하나, 이에 제한되지는 않는다.
단백질은 합성적으로 또는 재조합 수단에 의해 제조될 수 있다. 예를 들어, 단백질은 시험관내 번역 및 전사 (IVTT)에 의해 합성될 수 있다. 단백질의 아미노산 서열은 비자연적으로 발생된 아미노산을 포함하도록, 또는 단백질의 안정성을 증가시키도록 변형될 수 있다. 단백질이 합성 수단에 의해 제조될 때, 상기 아미노산은 제조되는 동안 도입될 수 있다. 단백질은 또한 합성 또는 재조합 제조 이후에 변경될 수 있다.
단백질은 또한 D-아미노산을 사용하여 제조될 수 있다. 예를 들어, 포어 또는 헬리카제는 L-아미노산 및 D-아미노산의 혼합물을 포함할 수 있다. 이는 관련 기술분야에서 단백질 또는 펩티드를 제조하는 데 있어 통상적인 것이다.
본 발명에서 사용되는 단백질은 또한 단백질의 기능을 방해하지 않는 한, 다른 비특이 변형을 포함할 수 있다. 다수의 비특이 측쇄 변형이 관련 기술분야에 공지되어 있고, 단백질(들)의 측쇄에 대해 변형이 이루어질 수 있다. 그러한 변형으로는 예를 들어, 알데히드와 반응시킨 후, NaBH4로 환원시키는 환원적 알킬화, 메틸아세트이미데이트에 의한 아미딘화 또는 아세트산 무수물에 의해 아실화를 포함한다.
단백질을 코딩하는 폴리뉴클레오티드 서열은 관련 기술분야의 표준 방법을 이용하여 유래될 수 있고, 복제될 수 있다. 단백질을 코딩하는 폴리뉴클레오티드 서열은 관련 기술분야의 표준 기법을 사용하여 박테리아 숙주 세포에서 발현시킬 수 있다. 단백질은 재조합 발현 벡터로부터의 폴리펩티드의 계내 발현에 의해 세포에서 제조될 수 있다. 발현 벡터는 임의적으로 폴리펩티드의 발현을 제어하는 유도성 프로모터를 보유한다. 이러한 방법은 문헌 [Sambrook, J. and Russell, D. (2001). Molecular Cloning: A Laboratory Manual, 3rd Edition. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY]에 기술되어 있다.
관심 서열을 코딩하는 유전자는 특이 프라이머를 포함하는 PCR을 사용하여 증폭시킬 수 있다. 이어서, 증폭된 서열을 재조합 복제가능한 벡터, 예컨대, 클로닝 벡터 내로 도입할 수 있다. 벡터는 화합성인 숙주 세포에서 폴리뉴클레오티드를 복제시키는 데 사용될 수 있다. 따라서, 폴리뉴클레오티드 서열은 관심 서열을 코딩하는 폴리뉴클레오티드를 복제가능한 벡터 내로 도입하고, 벡터를 화합성인 숙주 세포 내로 도입하고, 벡터를 복제시키는 조건하에서 숙주 세포를 성장시킴으로써 제조될 수 있다. 벡터를 숙주 세포로부터 회수할 수 있다. 폴리뉴클레오티드를 클로닝하는 데 적합한 숙주 세포는 관련 기술분야에 공지되어 있고, 이는 하기에서 더욱 상세하게 기술된다.
폴리뉴클레오티드 서열을 적합한 발현 벡터로 클로닝할 수 있다. 발현 벡터에서, 폴리뉴클레오티드 서열은 전형적으로 숙주 세포에 의해 코딩 서열을 발현시킬 수 있는 제어 서열에 작동가능하게 연결된다. 상기 발현 벡터를 사용하여 구축물을 발현시킬 수 있다.
"작동가능하게 연결된"이라는 용어는 기술된 성분이 그가 의도하는 방식으로 작용할 수 있도록 허용하는 관계에 있는 것인 병렬 배치를 의미한다. 코딩 서열에 "작동가능하게 연결된" 제어 서열은 코딩 서열의 발현이 제어 서열과 화합성인 조건하에서 달성될 수 있도록 하는 방식으로 결찰된다. 다중 카피수의 동일하거나 상이한 폴리뉴클레오티드가 벡터 내로 도입될 수 있다.
이어서, 발현 벡터는 적합한 숙주 세포 내로 도입될 수 있다. 따라서, 구축물은 구축물을 코딩하는 폴리뉴클레오티드 서열을 발현 벡터 내로 삽입하고, 벡터를 화합성인 박테리아 숙주 세포 내로 도입하고, 폴리뉴클레오티드 서열을 발현시키는 조건하에서 숙주 세포를 성장시킴으로써 제조될 수 있다.
벡터는 예를 들어, 복제 기점, 임의적으로 상기 폴리뉴클레오티드 서열 의 발현을 위한 프로모터, 및 임의적으로 프로모터의 조절 인자가 장착된 플라스미드, 바이러스 또는 파지 벡터일 수 있다. 벡터는 하나 이상의 선별가능한 마커 유전자, 예를 들어, 암피실린 저항성 유전자를 하?할 수 있다. 프로모터 및 다른 발현 조절 신호는 발현 벡터의 디자인 대상이 되는 숙주 세포와 화합성인 것으로 선택될 수 있다. T7, trc, lac, ara 또는 λL 프로모터가 전형적으로 사용된다.
숙주 세포는 전형적으로 구축물을 고수준으로 발현한다. 폴리뉴클레오티드 서열로 형질전환된 숙주 세포는 세포를 형질전환시키는 데 사용된 발현 벡터와 화합성인 것으로 선택될 것이다. 숙주 세포는 전형적으로 박테리아 세포 및 바람직하게 E. 콜라이(E. coli) 세포이다. λ DE3 리소겐을 포함하는 임의의 세포, 예를 들어, Rosetta2(DE3)pLys, C41 (DE3), BL21 (DE3), JM109 (DE3), B834 (DE3), TUNER, Origami 및 Origami B가 T7 프로모터를 포함하는 벡터를 발현시킬 수 있다.
단백질은 단백질 생산 유기체로부터 임의의 단백질 액체 크로마토그래피 시스템에 의한 정제 후, 또는 재조합 발현 후에 대규모로 제조될 수 있다. 전형적인 단백질 액체 크로마토그래피 시스템으로는 FPLC, AKTA 시스템, 바이오-캐드(Bio-Cad) 시스템, 바이오-래드 바이오로직(Bio-Rad BioLogic) 시스템 및 길슨(Gilson) HPLC 시스템을 포함한다.
본 발명의 방법은 표적 폴리뉴클레오티드의 하나 이상의 특징을 측정하는 단계를 포함한다. 본 방법은 표적 폴리뉴클레오티드의 2, 3, 4, 또는 5개 또는 그 초과의 특징을 측정하는 단계를 포함할 수 있다. 하나 이상의 특징은 바람직하게 (i) 표적 폴리뉴클레오티드의 길이, (ii) 표적 폴리뉴클레오티드의 동일성, (iii) 표적 폴리뉴클레오티드의 서열, (iv) 표적 폴리뉴클레오티드의 2차 구조, 및 (v) 표적 폴리뉴클레오티드의 변형 여부로부터 선택된다. (i) 내지 (v)의 임의 조합이 본 발명에 따라 측정될 수 있다.
(i)의 경우, 표적 폴리뉴클레오티드의 길이는 예를 들어, 표적 폴리뉴클레오티드 및 포어 사이의 상호작용 회수, 또는 표적 폴리뉴클레오티드 및 포어 사이의 상호작용 지속 기간을 측정함으로써 측정될 수 있다.
(ii)의 경우, 폴리뉴클레오티드의 동일성는 다수의 방식으로 측정될 수 있다. 폴리뉴클레오티드의 동일성는 표적 폴리뉴클레오티드의 서열을 측정하면서 함께, 또는 표적 폴리뉴클레오티드의 서열을 측정하지 않으면서 측정될 수 있다. 전자의 경우가 간단하다; 폴리뉴클레오티드를 서열분석함으로써 확인한다. 후자는 여러 방식으로 수행될 수 있다. 예를 들어, 폴리뉴클레오티드 중 특정 모티프의 존재를 (폴리뉴클레오티드의 남은 서열은 측정하지 않고) 측정될 수 있다. 대안적으로, 본 방법에서 특정의 전기 및/또는 광학 신호를 측정함으로써 특정 공급원으로서 기원하는 바, 표적 폴리뉴클레오티드를 확인할 수 있다.
(iii)의 경우, 폴리뉴클레오티드의 서열은 앞서 기술된 바와 같이 측정될 수 있다. 적합한 서열분석 방법, 특히, 전기적 측정을 사용하는 것은 문헌 [Stoddart D et al., Proc Natl Acad Sci, 12;106(19):7702-7], [Lieberman KR et al., J Am Chem Soc. 2010; 132(50):17961-72], 및 국제 출원 WO 2000/28312에 기술되어 있다.
(iv)의 경우, 2차 구조는 다양한 방식으로 측정될 수 있다. 예를 들어, 본 방법인 전기적 측정을 포함할 경우, 2차 구조는 지속 시간 변화 또는 포어를 통해 흐르는 전류의 변화를 사용하여 측정될 수 있다. 이를 통해 단일 가닥 및 이중 가닥 폴리뉴클레오티드 영역이 구별될 수 있다.
(v)의 경우, 임의의 변형의 존재 또는 부재가 측정될 수 있다. 본 방법은 바람직하게 하나 이상의 단백질을 이용하여, 또는 하나 이상의 표지, 태그, 또는 스페이서를 이용하여 표적 폴리뉴클레오티드가 메틸화에 의해, 산화에 의해, 산화에 의해 변형되었는지 여부를 측정하는 단계를 포함한다. 특이적인 변형을 통해 포어와의 특이적인 상호작용이 이루어질 것이며, 이는 하기 기술되는 방법을 이용하여 특정될 수 있다. 예를 들어, 메틸시토신은 각 뉴클레오티드와 포어의 상호작용 동안 포어를 통해 흐르는 전류에 기반하여 시토신과 구별될 수 있다.
다양한 상이한 유형의 측정 방식으로 측정될 수 있다. 이는 제한 없이 전기적 측정 및 광학적 측정을 포함한다. 가능한 전기적 측정으로는 전류 측정, 임피던스 측정, 터널링 측정 (Ivanov AP et al., Nano Lett. 2011 Jan 12; 11(1):279-85), 및 FET 측정 (국제 출원 WO 2005/124888)을 포함한다. 광학적 측정은 전기적 측정과 조합될 수 있다 (Soni GV et al., Rev Sci Instrum. 2010 Jan;81 (1):014301). 측정은 막횡단 전류 측정, 예컨대, 포어를 통해 흐르는 이온 전류 측정일 수 있다.
전기적 측정은 [Stoddart D et al., Proc Natl Acad Sci, 12; 106(19):7702-7], [Lieberman KR et al., J Am Chem Soc. 2010;132(50):17961-72], 및 국제 출원 WO-2000/28312에 기술된 바와 같이, 표준 단일 채널 기록 장치를 이용하여 수행될 수 있다. 대안적으로, 전기적 측정은 예를 들어, 국제 출원 WO2009/077734 및 국제 출원 WO-2011/067559에 기술된 바와 같이, 다채널 시스템을 사용하여 수행될 수 있다.
본 방법은 포어가 막에 존재하는 것인 막/포어 시스템을 조사하는 데 적합한 임의의 장치를 사용하여 수행될 수 있다. 본 방법은 막횡단 포어 감지에 적합한 임의의 장치를 사용하여 수행될 수 있다. 예를 들어, 장치는 수용액을 포함하는 챔버, 및 챔버를 2개의 섹션으로 분리하는 장벽을 포함한다. 장벽은 전형적으로 포어를 함유하는 막이 형성되는 개구부를 가진다. 대안적으로, 장벽은 포어가 존재하는 막을 형성한다.
본 방법은 국제 출원 번호 PCT/GB08/000562 (WO 2008/102120)에 기술된 장치를 사용하여 수행될 수 있다.
본 방법은 폴리뉴클레오티드가 포어와 관련하여 이동함에 따라 포어를 통과하는 전류를 측정하는 단계를 포함할 수 있다. 그러므로, 장치는 또한 전위를 인가할 수 있고, 막 및 포어를 통과하는 전기 신호를 측정할 수 있는 전기 회로를 포함할 수 있다. 본 방법은 패치 클램프 또는 전압 클램프를 사용하여 수행될 수 있다. 본 방법은 바람직하게 전압 클램프를 사용하는 것을 포함한다.
본 발명의 방법은 폴리뉴클레오티드가 포어와 관련하여 이동함에 따라 포어를 통과하는 전류를 측정하는 단계를 포함할 수 있다. 막횡단 단백질 포어를 통과하는 이온 전류를 측정하는 데 적합한 조건은 관련 기술분야에 공지되어 있고, 실시예에 개시되어 있다. 본 방법은 전형적으로 막 및 포어를 통해 인가되는 전압을 이용하여 수행된다. 사용되는 전압은 전형적으로 +2 V 내지 -2 V, 전형적으로 -400 mV 내지 +400 mV이다. 사용되는 전압은 바람직하게 -400 mV, -300 mV, -200 mV, -150 mV, -100 mV, -50 mV, -20 mV 및 0 mV로부터 선택되는 하한 및 +10 mV, + 20 mV, +50 mV, +100 mV, +150 mV, +200 mV, +300 mV 및 +400 mV로부터 독립적으로 선택되는 상한을 갖는 범위이다. 사용되는 전압은 더욱 바람직하게 100 mV 내지 240 mV 범위이고, 가장 바람직하게는 120 mV 내지 220 mV 범위이다. 인가되는 전위 증가를 사용함으로써 포어에 의한 상이한 뉴클레오티드 사이의 차이를 증가시킬 수 있다.
본 방법은 전형적으로 임의의 전하 캐리어, 예컨대, 금속 염, 예를 들어, 알칼리 금속 염, 할라이드 염, 예를 들어, 클로라이드 염, 예컨대, 알칼리 금속 할라이드 염의 존재 하에 수행된다. 전하 캐리어로는 이온성 액체 또는 유기 염, 예를 들어, 테트라메틸 암모늄 클로라이드, 트리메틸페닐 암모늄 클로라이드, 페닐트리메틸 암모늄 클로라이드, 또는 1-에틸-3-메틸 이미다졸리움 클로라이드를 포함할 수 있다. 상기 논의된 예시적인 장치에서, 염은 챔버내 수용액 중에 존재한다. 염화칼륨 (KCl), 염화나트륨 (NaCl), 염화세슘 (CsCl) 또는 페로시안화 칼륨 및 페리시안화 칼륨의 혼합물이 전형적으로 사용된다. KCl, NaCl 및 페로시안화 칼륨 및 페리시안화 칼륨의 혼합물이 바람직한다. 염 농도는 포화 상태일 수 있다. 염 농도는 3 M 이하일 수 있고, 전형적으로 0.1 내지 2.5 M, 0.3 내지 1.9M, 0.5 내지 1.8 M, 0.7 내지 1.7 M, 0.9 내지 1.6 M, 또는 1 M 내지 1.4 M이다. 염 농도는 바람직하게 150 mM 내지 1 M이다. Hel308, XPD, RecD, TraI 및 Dda 헬리카제가 놀랍게도 높은 염 농도에서도 작용한다. 본 방법은 바람직하게 0.3 M 이상, 예컨대, 0.4 M 이상, 0.5 M 이상, 0.6 M 이상, 0.8 M 이상, 1.0 M 이상, 1.5 M 이상, 2.0 M 이상, 2.5 M 이상, 또는 3.0 M 이상의 염 농도에서 수행된다. 높은 염 농도는 높은 신호 대 잡음비를 제공하고, 이를 통해 뉴클레오티드의 존재를 나타내는 전류는 정상적인 전류 변동의 배경에 대해 확인될 수 있다.
본 방법은 전형적으로 완충제의 존재 하에 수행된다. 상기 논의된 예시적인 장치에서, 상기 논의된 예시적인 장치에서, 완충제는 챔버내 수용액 중에 존재한다. 임의의 완충제가 본 발명의 방법에 사용될 수 있다. 전형적으로, 완충제는 포스페이트 완충제이다. 다른 적합한 완충제는 HEPES 및 트리스(Tris)-HCl 완충제. 본 방법은 전형적으로 pH 4.0 내지 12.0, 4.5 내지 10.0, 5.0 내지 9.0, 5.5 내지 8.8, 6.0 내지 8.7 또는 7.0 내지 8.8 또는 7.5 내지 8.5에서 수행된다. 사용되는 pH는 바람직하게 약 7.5이다.
본 방법은 0℃ 내지 100℃, 15℃ 내지 95℃, 16℃ 내지 90℃, 17℃ 내지 85℃, 18℃ 내지 80℃, 19℃ 내지 70℃, 또는 20℃ 내지 60℃에서 수행될 수 있다. 본 방법은 전형적으로 실온에서 수행된다. 본 방법은 임의적으로 헬리카제 기능을 지지하는 온도, 예컨대, 약 37℃에서 수행된다.
본 방법은 유리 뉴클레오티드 또는 유리 뉴클레오티드 유사체 및/또는 헬리카제 작용을 촉진시키는 헬리카제 보조인자의 존재 하에 수행될 수 있다. 본 방법은 또한 유리 뉴클레오티드 또는 유리 뉴클레오티드 유사체의 부재하에서 및 헬리카제 보조인자의 부재하에서 수행될 수 있다. 유리 뉴클레오티드는 하나 이상의, 상기 논의된 개별 뉴클레오티드 중 임의의 것일 수 있다. 유리 뉴클레오티드로는 아데노신 모노포스페이트 (AMP), 아데노신 디포스페이트 (ADP), 아데노신 트리포스페이트 (ATP), 구아노신 모노포스페이트 (GMP), 구아노신 디포스페이트 (GDP), 구아노신 트리포스페이트 (GTP), 티미딘 모노포스페이트 (TMP), 티미딘 디포스페이트 (TDP), 티미딘 트리포스페이트 (TTP), 우리딘 모노포스페이트 (UMP), 우리딘 디포스페이트 (UDP), 우리딘 트리포스페이트 (UTP), 시티딘 모노포스페이트 (CMP), 시티딘 디포스페이트 (CDP), 시티딘 트리포스페이트 (CTP), 시클릭 아데노신 모노포스페이트 (cAMP), 시클릭 구아노신 모노포스페이트 (cGMP), 데옥시아데노신 모노포스페이트 (dAMP), 데옥시아데노신 디포스페이트 (dADP), 데옥시아데노신 트리포스페이트 (dATP), 데옥시구아노신 모노포스페이트 (dGMP), 데옥시구아노신 디포스페이트 (dGDP), 데옥시구아노신 트리포스페이트 (dGTP), 데옥시티미딘 모노포스페이트 (dTMP), 데옥시티미딘 디포스페이트 (dTDP), 데옥시티미딘 트리포스페이트 (dTTP), 데옥시우리딘 모노포스페이트 (dUMP), 데옥시우리딘 디포스페이트 (dUDP), 데옥시우리딘 트리포스페이트 (dUTP), 데옥시시티딘 모노포스페이트 (dCMP), 데옥시시티딘 디포스페이트 (dCDP) 및 데옥시시티딘 트리포스페이트 (dCTP)를 포함하나, 이에 제한되지는 않는다. 유리 뉴클레오티드는 바람직하게 AMP, TMP, GMP, CMP, UMP, dAMP, dTMP, dGMP 또는 dCMP로부터 선택된다. 유리 뉴클레오티드는 바람직하게 아데노신 트리포스페이트 (ATP)이다. 헬리카제 보조인자는 헬리카제 또는 구축물이 작용할 수 있도록 하는 인자이다. 헬리카제 보조인자는 바람직하게 2가 금속 양이온이다. 2가 금속 양이온은 바람직하게 Mg2 +, Mn2 +, Ca2 + 또는 Co2 +이다. 헬리카제 보조인자는 가장 바람직하게 Mg2 +이다.
하나 이상의
헬리카제의
표적 폴리뉴클레오티드 상에의 로딩을 제어하는 방법
본 발명은 또한 하나 이상의 헬리카제의 표적 폴리뉴클레오티드 상에의 로딩을 제어하는 방법 또한 제공한다. 본 방법은 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계를 포함한다. 본 방법은 바람직하게 하나 이상의 스페이서를 포함하도록 표적 폴리뉴클레오티드를 변형시키는 것을 포함한다. 상기에서 논의된 스페이서 실시양태 모두 본 방법에 동등하게 적용된다.
본 방법은 또한 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 표적 폴리뉴클레오티드에 결합하고, 하나 이상의 헬리카제가 각 스페이서에서 정지하도록 하는 단계를 포함한다. 스페이서에서 헬리카제가 정지하는 것은 상기 논의된 바와 같이 검정될 수 있다.
표적 폴리뉴클레오티드는 상기 논의된 바와 같이 임의 개수의 스페이서를 포함할 수 있다. 표적 폴리뉴클레오티드는 바람직하게 2개 이상의 스페이서, 예컨대, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 스페이서를 포함한다. 상기 논의된 바와 같이 임의 개수의 헬리카제가 각 스페이서에서 정지될 수 있다. 이러한 방식으로, 얼마나 많은 헬리카제가 표적 폴리뉴클레오티드 상의 어느 위치에 로딩되는지 제어할 수 있고, 이로써, 표적 폴리뉴클레오티드의 특징 규명을 촉진할 수 있다. 상기 논의된 본 방법 중 임의의 것을 사용하여 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시킬 수 있다.
표적 폴리뉴클레오티드는 바람직하게 하나 이상의 스페이서 S 및 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L (L은 로딩 부위에 대한 것임)을 제공받는다. 각 영역 L의 길이는 각 L에 결합하여야 하고, 각 스페이서 S에서 정지되어야 하는 헬리카제의 개수에 의존한다. 하나 이상의 스페이서 S 및 하나 이상의 영역 L은 서로 인접해 있을 수 있거나 (즉, 바로 옆에 있을 수 있거나), 또는 표적 폴리뉴클레오티드의 일부만큼 이격되어 있을 수 있다. 각 스페이서는 전형적으로 헬리카제 이동 방향으로 각 영역 L의 말단에 또는 그 근처에 위치한다. 예를 들어, 헬리카제가 5'→3' 헬리카제일 경우, 각 스페이서는 전형적으로 각 영역의 3' 말단에 또는 그 근처에 위치하고, 즉, 5'-L-S-3'이다. 헬리카제가 3'→5' 헬리카제일 경우, 각 스페이서는 전형적으로 각 영역의 5' 말단에 또는 그 근처에 위치하고, 즉, 5'-S-L-3'이다.
표적 폴리뉴클레오티드는 바람직하게 5'→3' 방향으로 (L-S)n 또는 (S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다. 5'→3' 방향은 표적 폴리뉴클레오티드를 지칭한다.
표적 폴리뉴클레오티드는 바람직하게, 각각이 양 말단에 또는 그 근처에 스페이서 S를 갖는 것인, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L을 제공받으며, 즉, (S-L-S)n을 제공받는다.
바람직한 실시양태에서, 스페이서는 상기 논의된 바와 같이 이중 가닥 영역 D에 인접해 있으며, 즉, 5'→3' 헬리카제 또는 불활성 모드로 사용되는 헬리카제인 경우, 5'-L-S-D-3'이거나, 또는 3'→5' 헬리카제 또는 불활성 모드로 사용되는 헬리카제인 경우, 5'-D-S-L-3'이다. 표적 폴리뉴클레오티드는 바람직하게 5'→3' 방향으로 (L-S-D)n 또는 (D-S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, D는 이중 가닥 폴리뉴클레오티드이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다. L은 D와 동일한 유형의 폴리뉴클레오티드일 수 있거나, D와 상이한 유형의 폴리뉴클레오티드일 수 있다. L 및/또는 D는 표적 폴리뉴클레오티드와 동일한 유형의 폴리뉴클레오티드일 수 있거나, 표적 폴리뉴클레오티드와 상이한 유형의 폴리뉴클레오티드일 수 있다.
바람직한 실시양태에서, 차단 분자 B는 하나 이상의 헬리카제가 지나 이동하는 말단 반대쪽의 각 스페이서의 말단에 제공되고, 즉, 5'→3' 헬리카제 또는 불활성화 모드로 사용되는 헬리카제인 경우, 5'-B-L-S-3'이거나, 3'→5' 헬리카제인 경우, 5'-S-L-B-3'이다. 표적 폴리뉴클레오티드는 바람직하게 5'→3' 방향으로 (B-L-S)n 또는 (S-L-B)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, B는 차단 분자이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다.
가장 바람직한 실시양태에서, 표적 폴리뉴클레오티드는 D 및 B, 둘 모두를 제공하고, 즉, 5'→3' 헬리카제 또는 불활성화 모드로 사용되는 헬리카제인 경우, 5'-B-L-S-D-3'이거나, 또는 3'→5' 헬리카제인 경우, 5'-D-S-L-B-3'이다. 표적 폴리뉴클레오티드는 가장 바람직하게 5'→3' 방향으로 (B-L-S-D)n 또는 (D-S-L-B)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, B는 차단 분자이고, D는 이중 가닥 폴리뉴클레오티드이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다.
표적 폴리뉴클레오티드는 임의 개수의 상기 스페이서 함유 유닛을 제공받을 수 있다. 예를 들어, 표적 폴리뉴클레오티드는 (5'-L-S-3')n, (5'-S-L-3')n, (S-L-S)n, (5'-L-S-D-3')n, (5'-D-S-L-3')n, (5'-B-L-S-3')n, (5'-S-L-B-3')n, (5'-B-L-S-D-3')n 또는 (5'-D-S-L-B-3')n (여기서, n은 2 또는 그 초과이고, 예컨대, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과임)을 제공받을 수 있다. 상기 실시양태를 통해 다중의 헬리카제는 표적 폴리뉴클레오티드 상에서 정지될 수 있다.
표적 폴리뉴클레오티드는 본 발명의 어댑터를 표적 폴리뉴클레오티드에 결찰시킴으로써 L, S, D 및 B를 참조하여 상기 논의된 실시양태 모두를 제공받을 수 있다.
바람직한 실시양태에서, 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 1개의 헬리카제 (즉, 단 1개의 헬리카제)가 각 스페이서에서 정지하도록 한다. 이는 표적 폴리뉴클레오티드에 하나 이상의 스페이서 S, 및 각각이 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L1을 제공함으로써 달성될 수 있다. 표적 폴리뉴클레오티드는 바람직하게 5'→3' 방향으로 (L1-S)n 또는 (S-L1)n (여기서, L1은 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다.
영역 L1의 길이는 헬리카제의 풋프린트에 의존하고, 간단한 방법으로 계산될 수 있다. 영역 L1은 표적 폴리뉴클레오티드의 일부일 수 있거나, 또는 예를 들어, 본 발명의 어댑터의 일부로서 표적 폴리뉴클레오티드에 부가될 수 있다. 영역 L1의 길이는 전형적으로 8, 9, 10, 12, 13, 14 또는 15개의 뉴클레오티드 길이이다. 하나 이상의 스페이서 S 및 하나 이상의 L1 영역은 서로 인접해 있을 수 있거나 (즉, 바로 옆에 있을 수 있거나), 또는 표적 폴리뉴클레오티드의 일부만큼 이격되어 있을 수 있다. 각 스페이서 S는 전형적으로 헬리카제 이동 방향으로 각 영역 L1의 말단에 또는 그 근처에 위치한다. 예를 들어, 헬리카제가 5'→3' 헬리카제일 경우, 각 스페이서 S는 전형적으로 각 영역 L1의 3' 말단에 또는 그 근처에 위치하고, 즉, 5'-L1-S-3'이다. 헬리카제가 3'→5' 헬리카제일 경우, 각 스페이서 S는 전형적으로 각 영역 L1의 5' 말단에 또는 그 근처에 위치하고, 즉, 5'-S-L1-3'이다. 표적 폴리뉴클레오티드는 바람직하게 각각이 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이이고, 각각이 양 말단에 또는 그 근처에 스페이서 S를 갖는 것인, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L1을 제공받으며, 즉, (S-L1-S)n을 제공받는다.
표적 폴리뉴클레오티드는 (5'-L1-S-3')n, (5'-S-L1-3')n, (S-L1-S)n, (5'-L1-S-D-3')n, (5'-D-S-L1-3')n, (5'-B-L1-S-3')n, (5'-S-L1-B-3')n, (5'-B-L1-S-D-3')n 또는 (5'-D-S-L1-B-3')n (여기서, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받을 수 있다. 상기 실시양태를 통해 n개의 헬리카제는 표적 폴리뉴클레오티드 상에서 정지될 수 있다. 1개의 헬리카제가 각 스페이서에 의해 정지된다.
또 다른 바람직한 실시양태에서, 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 2개의 헬리카제 (즉, 단 2개의 헬리카제)가 각 스페이서에서 정지하도록 한다. 이는 표적 폴리뉴클레오티드에 하나 이상의 스페이서 S, 및 각각이 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L2를 제공함으로써 달성될 수 있다. 표적 폴리뉴클레오티드는 바람직하게 5'→3' 방향으로 (L2-S)n 또는 (S-L2)n (여기서, L은 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받는다.
영역 L2의 길이는 헬리카제의 풋프린트에 의존하고, 간단한 방법으로 계산될 수 있다. 영역 L2는 표적 폴리뉴클레오티드의 일부일 수 있거나, 또는 예를 들어, 본 발명의 어댑터의 일부로서 표적 폴리뉴클레오티드에 부가될 수 있다. 영역 L2의 길이는 전형적으로 16, 17, 18, 19, 20, 21 또는 22개의 뉴클레오티드 길이이다. 하나 이상의 스페이서 S 및 하나 이상의 영역 L2는 서로 인접해 있을 수 있거나 (즉, 바로 옆에 있을 수 있거나), 또는 폴리뉴클레오티드의 일부만큼 이격되어 있을 수 있다. 각 스페이서는 전형적으로 헬리카제 이동 방향으로 각 영역의 말단에 또는 그 근처에 위치한다. 예를 들어, 헬리카제가 5'→3' 헬리카제일 경우, 각 스페이서는 전형적으로 각 영역의 3' 말단에 또는 그 근처에 위치한다. 폴리뉴클레오티드는 바람직하게 각각이 단 2개의의 헬리카제가 결합하기에 충분할 정도의 길이이고, 각각이 양 말단에 또는 그 근처에 스페이서 S를 갖는 것인, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L2를 제공받으며, 즉, (S-L2-S)n을 제공받는다.
표적 폴리뉴클레오티드는 (5'-L2-S-3')n, (5'-S-L2-3')n, (S-L2-S)n, (5'-L2-S-D-3')n, (5'-D-S-L2-3')n, (5'-B-L2-S-3')n, (5'-S-L2-B-3')n, (5'-B-L2-S-D-3')n 또는 (5'-D-S-L2-B-3')n (n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 제공받을 수 있다. 상기 실시양태를 통해 2n개의 헬리카제는 표적 폴리뉴클레오티드 상에서 정지될 수 있다. 2개의 헬리카제가 각 스페이서에 의해 정지된다.
각 스페이서에서 정지된 2개의 헬리카제는 바람직하게는 서로 상이한 것이다. 이는 여러 방식으로 제어될 수 있다. 예를 들어, 2개의 상이한 헬리카제는 서로 부착될 수 있고, 예컨대, 서로 공유 부착될 수 있고, 이어서, 각 스페이서에서 정지될 수 있다. 적합한 구축물은 상기에서 논의된 바와 같다. 대안적으로, 차단 폴리뉴클레오티드를 사용하여 확실하게 상이한 헬리카제가 각 스페이서에서 정지되도록 할 수 있다. 본 방법이 폴리뉴클레오티드에 하나 이상의 스페이서 S, 및 각각이 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역 L2를 제공하는 단계를 포함할 경우, 본 방법은 바람직하게 차단 폴리뉴클레오티드를 각 영역 L2의 부분에 혼성화시켜 각 영역의 남은 (즉, 비차단) 부분이 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이가 되도록 하는 단계를 포함한다. 차단 폴리뉴클레오티드의 길이는 전형적으로 2, 3, 4, 5, 6, 7 또는 8개의 뉴클레오티드 길이이다. 차단 폴리뉴클레오티드는 2개의 헬리카제가 동시에 같은 영역에 결합하지 못하도록 막는다. 차단 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드를 바람직하게 하나 이상의 헬리카제와 접촉시켜 1개의 헬리카제가 각 영역 L2의 남은 (즉, 비차단) 부분에 결합하게 한다. 이어서, 각 헬리카제를 사용하여 차단 폴리뉴클레오티드를 제거할 수 있다. 하나 이상의 결합된 헬리카제에 바람직하게 유리 뉴클레오티드 및 헬리카제 보조인자를 제공하여 헬리카제가 각 차단 폴리뉴클레오티드를 제거하고, 각 스페이서 S에서 정지할 수 있도록 한다. 이어서, 상기 방법으로 제조된 폴리뉴클레오티드를 바람직하게는, 본 방법에서 먼저 사용된 헬리카제와는 상이한 하나 이상의 헬리카제와 접촉시켜 1개의 상이한 헬리카제가 각 영역에 결합하고, 스페이서 및 나머지 다른 정지된 헬리카제에 의해 정지되도록 한다.
본 방법은 바람직하게 (a) 표적 폴리뉴클레오티드에 5'→3' 방향으로 (L2-S)n 또는 (S-L2)n (여기서, L은 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수임)을 제공하는 단계; (b) 차단 폴리뉴클레오티드를 각 영역 L2의 부분에 혼성화시켜 각 영역 L2의 남은 부분이 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이가 되도록 하는 단계; (c) (b)에서 제조된 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 1개의 헬리카제가 각 영역 L2의 남은 부분에 결합하도록 하는 단계; (d) (c)의 하나 이상의 결합된 헬리카제에 유리 뉴클레오티드 및 헬리카제 보조인자를 제공하여 헬리카제가 각 차단 폴리뉴클레오티드를 제거하고, 각 스페이서 S에서 정지할 수 있도록 하는 단계; 및 (e) (d)에서 제조된 표적 폴리뉴클레오티드를 (c)에서 사용된 것과 상이한 것인 하나 이상의 헬리카제와 접촉시켜 1개의 상이한 헬리카제가 각 영역 L2에 결합하고, 각 스페이서 및 (d)에서 정지된 각 헬리카제에 의해 정지되도록 하는 것인 단계를 포함한다. n은 바람직하게 1, 2, 3 또는 4이다. S 및 L2의 다른 배열, 예컨대, 상기 논의된 바와 같은, (S-L2-S)n, (5'-L2-S-D-3')n, (5'-D-S-L2-3')n, (5'-B-L2-S-3')n, (5'-S-L2-B-3')n, (5'-B-L2-S-D-3')n 및 (5'-D-S-L2-B-3')n 또한 본 실시양태에서 사용될 수 있다.
상기 논의된 바와 같이, 스페이서의 길이를 사용하여 정지되는 헬리카제의 개수, 및/또는 스페이서를 지나 이동할 수 있는 헬리카제의 개수를 제어할 수 있다. 보다 긴 장쇄의 스페이서를 사용하여 더 많은 헬리카제를 정지시킬 수 있다. 트레일링 헬리카제가 리딩 헬리카제가 스페이서를 지나도록 인출할 수 있기 때문에, 일련의 2개 이상의 헬리카제, 예컨대, 3, 4 또는 5개의 헬리카제 또한 보다 긴 장쇄의 스페이서를 지나 이동할 수 있다. 상기 L1 및 L2를 참조하여 본 실시양태는 3, 4 또는 5개의 헬리카제가 각 스페이서에서 정지되도록 변형될 수 있다. 예를 들어, 폴리뉴클레오티드는 하나 이상의 스페이서 S, 및 각각이 단 3개 (L3), 4개 (L4) 또는 5개 (L5)의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는, 하나 이상의 단일 가닥 영역 또는 하나 이상의 비혼성화된 영역을 제공받을 수 있다.
어댑터
본 발명은 또한 표적 폴리뉴클레오티드의 이동을 제어하기 위한 어댑터를 제공한다. 어댑터는 바람직하게 표적 폴리뉴클레오티드의 특징 규명을 위한 것이다. 어댑터는 (a) 5'→3' 방향으로 (L-S-D)n 또는 (D-S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, D는 이중 가닥 폴리뉴클레오티드이고, 여기서, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수임), 및 (b) 각 어댑터 상에서 정지되는 하나 이상의 헬리카제를 포함한다. n은 바람직하게 1, 2, 3 또는 4이다. 5'→3' 방향은 어댑터에서 L 및 D 폴리뉴클레오티드의 방향을 나타낸다.
하나 이상의 헬리카제는 스페이서 S 앞에서, 스페이서 S 옆에서, 또는 스페이서 S 상에서 정지될 수 있다.
어댑터는 표적 폴리뉴클레오티드가 상기 논의된 방법 중 임의의 것에 사용될 수 있도록 표적 폴리뉴클레오티드에 결찰될 수 있다.
L은 상기 논의된 바와 같이 L1 또는 L2일 수 있다. 어댑터는 L1 및 L2의 조합을 포함할 수 있다.
상기에서 논의된 스페이서 실시양태 모두 본 방법에 동등하게 적용된다.
L, S 및 D를 참조하여 상기에서 논의된 본 실시양태 중 임의의 것은 본 발명의 어댑터에 동등하게 적용된다. 어댑터는 5'→3' 방향으로 (5'-L1-S-D-3')n, (5'-D-S-L1-3')n, (5'-B-L1-S-D-3')n 또는 (5'-D-S-L1-B-3')n, (5'-L2-S-D-3')n, (5'-D-S-L2-3')n, (5'-B-L2-S-D-3')n 또는 (5'-D-S-L2-B-3')n (여기서, n은 정수, 예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 초과인 정수이고, n은 바람직하게 1, 2, 3 또는 4임)을 포함할 수 있다. L1 또는 L2는 L3, L4 또는 L5로 대체될 수 있다.
가장 바람직하게, n은 1이고, 1 또는 2개의 헬리카제가 어댑터 상에서 정지된다.
키트
본 발명은 또한 표적 폴리뉴클레오티드의 이동을 제어하기 위한 키트를 제공한다. 키트는 바람직하게 표적 폴리뉴클레오티드의 특징 규명을 위한 것이다. 키트는 (a) 하나 이상의 스페이서, (b) 하나 이상의 헬리카제 및 (c) 막횡단 포어를 포함한다. 본 방법을 참조하여 상기 논의된 스페이서 실시양태 모두 본 발명의 키트에 동등하게 적용된다. 예를 들어, 하나 이상의 스페이서는, 표적 폴리뉴클레오티드에 결찰될 수 있고, 우선적으로 포어로 트레딩하는 리더 서열을 포함하는 것인 폴리뉴클레오티드 어댑터, 바람직하게, 단일 가닥 폴리뉴클레오티드 어댑터의 일부일 수 있다. 키트는 상기 논의된 헬리카제 및 포어 중 임의의 것을 포함할 수 있다.
하나 이상의 스페이서 및 하나 이상의 헬리카제는 본 발명의 어댑터의 일부일 수 있다.
키트는 막 성분, 예컨대, 양친매성 층, 예컨대, 지질 이중층을 형성하는 데 필요한 인지질을 추가로 포함할 수 있다.
본 발명의 키트는 상기 언급된 실시양태 중 임의의 것을 수행할 수 있게 하는 하나 이상의 다른 시약 또는 장치를 추가로 포함할 수 있다. 상기 시약 또는 장치로는 하기: 적합한 완충제(들) (수용액), 대상체로부터 샘플을 수득하기 위한 수단 (예컨대, 니들을 포함하는 베쓸 또는 장치), 폴리뉴클레오티드를 증폭 및/또는 발현시키기 위한 수단, 상기 정의된 바와 같은 막 또는 전압 또는 패치 클램프 장치 중 하나 이상의 것을 포함한다. 시약은 유체 샘플이 시약을 재현탁시킬 수 있도록 건식 상태로 키트 중에 존재할 수 있다. 키트는 또한 임의적으로 키트가 본 발명의 방법에서 사용될 수 있도록 하는 설명서, 또는 본 발명이 어떤 환자를 위해 사용될 수 있는지에 관한 세부 사항을 포함할 수 있다. 키트는 임의적으로 헬리카제 이동을 촉진시키는 데 필요한 성분 (예컨대, ATP 및 Mg2 +)을 포함할 수 있다. 하기 실시예는 본 발명을 예시한다.
실시예
실시예
1
본 실시예는 T4 Dda - E94C/A360C (돌연변이 E94C/A360C, 및 이어서, (ΔM1)G1G2를 포함하는 서열 8) 헬리카제가 단일 MspA 나노포어 (MS(B1- G75S/G77S/L88N/Q126R)8 MspA (MspA - B2C) (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2))를 통과하는 무손상 DNA 가닥의 이동을 어떻게 제어할 수 있는지를 기술하는 것이다. 람다 DNA 구축물 중 iSpC3 스페이서 (그의 3' 말단에서 4개의 iSpC3 스페이서에 부착되어 있는 서열 9 (상기 4개의 iSpC3 스페이서는 서열 10의 5' 말단에 부착되어 있고, 상기 서열 10은 3개의 iSpC3 스페이서에 부착되어 있고, 상기 3개의 iSpC3 스페이서는 서열 11에 3' 말단에 부착되어 있고, 상기 구축물의 서열 10 영역은 서열 12에 혼성화된다(서열 12는 그의 3' 말단에 부착되고, 6개의 iSp18 스페이서는 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착되어 있다)))를 사용하여, 구축물이 나노포어에 의해 포획될 때까지 효소를 정지시킨다. 포획시, 인가된 전위력이 효소 T4 Dda - E94C/A360C가 정지 스페이서를 지나도록 이동시키고, 나노포어를 통과하는 람다 구축물의 효소 제어형 DNA 이동을 가능하게 한다.
물질 및 방법
실험을 세팅하기 전, 람다 DNA 구축물 (그의 3' 말단에서 4개의 iSpC3 스페이서에 부착되어 있는 서열 9 (상기 4개의 iSpC3 스페이서는 서열 10의 5' 말단에 부착되어 있고, 상기 서열 10은 서열 11에 3' 말단에 부착되어 있고, 상기 구축물의 서열 10 영역은 서열 12에 혼성화된다(서열 12는 3' 콜레스테롤 테더를 가진다))) 및 T4 Dda - E94C/A360C를 함께 완충제 (20 mM CAPS, pH 10.0, 500 mM NaCl, 5% 글리세롤, 2 mM DTT) 중에서 23℃에서 15분 동안 미리 인큐베이션시켰다.
전기적 측정은 (냉각기 플레이트 상에 실험 시스템을 배치함으로써) 20℃에서 완충제 (600 mM KCl, 25 mM 인산칼륨, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8) 중 블록 공중합체에 삽입된 단일 MspA 나노포어 (MspA - B2C)로부터 획득하였다. 블록 공중합체에 삽입된 단일 포어를 수득한 후, 이어서, 완충제 (1 mL, 600 mM KCl, 25 mM 인산칼륨, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)를 시스템을 통해 유동시켜 임의의 과량의 MspA 나노포어 (MspA - B2C)를 제거하고, 최종적으로 실험 완충제 (2 mL 960 mM KCl, 25 mM 인산칼륨, 3 mM 페로시안화 칼륨 (II), 1 mM 페리시안화 칼륨 (III), pH 8)를 시스템 내로 유동시켰다. MgCl2 (10 mM 최종 농도) 및 ATP (1 mM 최종 농도)를 완충제 (960 mM KCl, 25 mM 인산칼륨, 3 mM 페로시안화 칼륨 (II), 1 mM 페리시안화 칼륨 (III), pH 8)와 함께 혼합한 후, 람다 DNA 구축물 (0.2 nM 최종 농도), T4 Dda - E94C/A360C (10 nM 최종 농도) 완충제 (20 mM CAPS, pH 10.0, 500 mM NaCl, 5% 글리세롤, 2 mM DTT) 프리 믹스에 첨가하였다. 이어서, 프리 믹스를 단일 나노포어 실험 시스템에 첨가하였다. 전위 플립 프로세스 (2 s 동안 +100 mV, 이어서, 2 s 동안 0 V, 및 이어서, 14,500 s 동안 -120 mV로 시스 측에서 인가) 후 4시간 동안 실험을 수행하고, 헬리카제 제어형 DNA 이동을 모니터링하였다.
결과 및 논의
DNA 구축물은 도 1에 제시되어 있다. T4 Dda - E94C/A360C는 DNA 구축물과 미리 인큐베이션되었을 때 구축물 영역 (A로 표지) (서열 9)에 결합할 수 있다. 그러나, 상기 효소는 유리 용액 중에 존재할 경우에는 정지 기를 지나 이동하지 못한다 (도 1에서 B 및 D로 표지). 그러므로, DNA 구축물이 나노포어에 의해 포획될 때까지 효소는 iSpC3 스페이서 (도 1에서 B로 표지)에서 정지되어 있다. 일단 나노포어에 의해 포획되고 나면, 인가된 전위력은 효소 T4 Dda - E94C/A360C가 정지 스페이서를 지나도록 이동시키고, 나노포어를 통과하는 람다 구축물의 효소 제어형 DNA 이동을 가능하게 한다. 헬리카제 제어형 DNA 이동의 일례가 도 2에 제시되어 있다. 헬리카제 제어형 DNA 이동 기간은 5,170초였고, 이는 나노포어를 통과하는 대략 30 kB의 람다 구축물의 전위에 상응한다. 도 3은 헬리카제 제어형 DNA 이동의 시작점 (a) 및 종점 (b)에 대한 확대된 영역을 보여주는 것이다. 1 및 2는 iSpC3 스페이서가 헬리카제의 제어하에서 나노포어를 통해 전위할 때를 보여주는 것이다.
실시예
2
MuA를 사용하여 람다 DNA를 ~5-10 kB 단편으로 단편화함으로써 본 실시예에서 사용되는 DNA 구축물을 제조하였다. 이어서, 샘플 제조에 의해 제조된 단편을 나노포어를 통해 통과시켰고, 그의 이동은 헬리카제 효소에 의해 제어되었다. 헬리카제는 나노포어를 통해 인가된 전위력에 의해 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나 이동하였다. 나노포어를 통과하는 마커의 헬리카제 제어형 이동에 의해 형성되는 특징적인 차단 관찰 결과는 샘플 제조 방법이 성공적이었으며, 효소는 도 4(b)에 제시된 바와 같이 정지되었다는 것을 나타내었다. 이는 효소는 정의된 출발점을 가졌고, 나노포어에 의해 포획될 때까지는 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나 이동하지는 못하였다는 것을 의미하였다.
물질 및 방법
2.1 Y형 및 헤어핀
MuA
기질 형성을 위한 DNA 가닥의
어닐링
하기 표 5에 제시된 바와 같이 Y형 및 헤어핀 MuA 기질을 제조하였다. 이어서, Y형 및 헤어핀 MuA 기질을 형성하기 위해 DNA를 함유하는 샘플 혼합물을 2분 동안 95℃로 가열한 후, 분당 2℃의 비율로 16℃까지로 냉각시켰다. 이를 통해 서열 14 및 15 (여기서, 서열 14는 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛만큼 서열 15의 5' 말단에 부착되어 있다)가 서열 19 및 9 (여기서, 서열 19는 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛만큼 서열 9의 5' 말단에 부착되어 있다)에 어닐링하여 Y형 MuA 기질을 형성하였고, 서열 19 및 20 (여기서, 서열 19는 그의 3' 말단에서 4개의 iSpC3 스페이서 유닛만큼 서열 15의 5' 말단에 부착되어 있다)의 경우에는 헤어핀 루프 MuA 기질을 형성하였다. 형성된 2개의 MuA 기질의 DNA 기질 디자인은 도 4(a)에 제시되어 있다.
[표 5]
2.2
MuA
트랜스포사제를
이용한 DNA 주형 단편화
MuA 트랜스포사제를 이용하여 이중 가닥 람다 DNA (서열 13은 센스 가닥의 서열에 상응한다)를 길이가 대략 5-10 kB인 가닥으로 단편화시켰다. MuA 트랜스포사제는 섹션 3.1에서 어닐링된 MuA 기질 (Y형 및 헤어핀 MuA 기질)을 삽입하였고, 샘플은 하기 표 6에 제시된 바와 같이 제조하였다. 이어서, 샘플을 30℃에서 1시간 동안 인큐베이션시키고, 75℃에서 10분 동안 가열하여 불활성화시켰다. 이어서, 퀴아퀵(QIAquick)™ PCR 정제용 키트 (퀴아젠(Qiagen))를 사용하여 샘플을 추가로 정제하고, 26 ㎕ 중에서 용리시켰다.
[표 6]
2.3 삽입된
MuA
기질을 이용한 단편화된
람다
DNA의 USER 분해
서열 19로부터 dUMP를 제거하기 위해 단계 3.2로부터의 정제된 샘플 부피 1을 USER™ 분해물로 처리하였다. 적절한 부피 및 농도에 대해서는 하기 표 7을 참조할 수 있다. 이어서, 샘플을 37℃에서 30분 동안 인큐베이션시킨 후, 얼음 덩어리에서 냉각시켰다.
[표 7]
2.4 이중 가닥
람다
DNA 구축물 단편
중 단일
가닥
갭의
수복
이어서, 단일 가닥 갭을 폐쇄하기 위해 USER™ 처리 후에 제조된 샘플 부피 2를 DNA 폴리머라제 및 리가제로 처리하였다. 샘플 부피 3 (적절한 부피 및 농도에 대해서는하기 표 8 참조)을 16℃에서 30분 동안 인큐베이션시킨 후, EDTA (0.5M, 10 ㎕)를 샘플 부피 3에 첨가하였다. 이어서, 퀴아퀵™ PCR 정제용 키트를 사용하여 각 샘플을 정제하고, 50 ㎕ 물 중에서 용리시켰다. 분취량의 정제된 샘플 (1 ㎕)을 애질런트(Agilent) 12000 칩 상에서 전개시켜 샘플을 정량화하고, 트리스-HCl 및 NaCl (pH 7.5)을 각각 그 농도가 10 mM 및 50 mM이 될 때까지 나머지 샘플에 첨가하였다. 최종적으로, 서열 16 (서열의 3' 말단은 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착된 6개의 iSp18 스페이서를 가진다, 0.5 μM)을 정제된 샘플에 어닐링시켰다.
[표 8]
2.5 정제되고, 단편화된
람다
DNA 구축물의
헬리카제
제어형 DNA 이동을 보여주는 전기생리학적 실험
실험을 세팅하기 전, 람다 DNA 구축물 (0.2 nM, MuA 트랜스포사제에 의해 Y형 MuA 기질 및 헤어핀 MuA 기질이 단편의 양단에 부착되어 있는, 5-10 kB의 람다 DNA 단편 (예시적인 구축물에 대해서는 도 4 (b) 참조)) 및 Trwc Cba (서열 9, 1 μM)를 완충제 (50 mM CAPS, pH 10.0 (NaOH를 첨가함으로써 pH를 pH 10.0으로 변경), 100 mM NaCl) 중에서 1시간 동안 함께 미리 인큐베이션시켰다.
전기적 측정은 완충제 (600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8) 중 블록 공중합체에 삽입된 단일 MspA 나노포어 (MspA - B2C)로부터 획득하였다. 이중층 중에서 단일 포어를 수득한 후, 이어서, 완충제 (1 mL, 600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)를 시스템을 통해 유동시켜 임의의 과량의 MspA 나노포어 (MspA - B2C)를 제거하고, 8℃로 설정된 냉각기 플레이트 상에 실험 시스템을 배치시킴으로써 시스템 온도가 ~15℃가 되도록 만들었다. MgCl2 (10 mM) 및 dTTP (5 mM)를 함께 완충제 (600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)와 혼합한 후, 이어서, 람다 DNA 구축물 (0.2 nM), Trwc Cba (서열 9, 1 μM) 완충제 (50 mM CAPS, pH 10.0 (NaOH를 첨가함으로써 pH를 pH 10.0으로 변경), 100 mM NaCl) 프리 믹스에 첨가하였다. 이어서, 프리 믹스를 단일 나노포어 실험 시스템에 첨가하였다. 전위 플립 프로세스 (30 min 동안 +120 mV, 이어서, 2초 동안 -100 mV, 및 이어서, 2초 동안 0 mV) 후 2시간 동안 실험을 수행하고, 헬리카제 제어형 DNA 이동을 모니터링하였다.
2.6 결과 및 논의
람다 DNA 구축물에 대한 헬리카제 제어형 DNA 이동을 관찰하였고, 헬리카제 제어형 DNA 이동의 예는 도 5에 제시되어 있다. 람다 DNA 구축물에 존재하는 iSpC3 스페이서는 도 5에서 번호 1, 2, 및 3으로 강조 표시된 특징적인 차단 수준을 나타내었다. Y형 MuA 기질은 양 가닥에 4개의 iSpC3 스페이서를 가지고, 헤어핀 MuA 기질 또한 4개의 iSpC3 스페이서를 가지는데, 각 iSpC3 스페이서는, 람다 DNA 구축물의 상기 영역이 나노포어를 통해 전위됨에 따라 더 많은 전류가 흐르게 할 수 있다. 샘플이 성공적으로 제조되었다면, 이때 iSpC3 스페이서 이벤트는 람다 DNA 구축물의 시작점, 중간 (센스 및 안티센스 서열 사이의 전이를 표시) 및 종점에서 관찰될 것이다. 도 5는 iSpC3 스페이서 영역에 상응하는 전류 흐름 증가에 대한 3가지 예시를 명확하게 보여준다. 그러므로, 샘플 제조 방법은 도 4 (b)에 제시된 람다 DNA 구축물을 제조하기 위해 람다 DNA 내로 MuA 기질을 효과적으로 도입하였다. 나노포어에 의해 DNA가 포획되었을 때, 효소 (A로 표지)는 나노포어를 통해 인가된 전위력에 의해 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나 이동한다.
실시예
3
본 실시예에서 사용된 DNA 구축물은 MuA를 이용하여 람다 DNA를 ~5-10 kB 단편으로 단편화시켜 제조하였다. 본 실시예는 실시예 2에 기술된 것과 유사하지만, 본 실시예에서는 트랜스포사제 서열이 이노신을 함유하는 바, 샘플 제조 방법은 상이하다 (상기 기술된 단계 2.3 및 2.4가 필요하지 않다). 효소는 나노포어를 통해 인가된 전위력에 의해 dsDNA 영역 및 스페이서를 지나 이동하였다.
물질 및 방법
3.1 Y형 및 헤어핀 MuA 기질 형성을 위한 DNA 가닥의 어닐링
상기 실시예 2.1에 기술된 바와 같이 Y형 2 및 헤어핀 2 MuA 기질을 제조하였다. 본 실시예에서 사용된 부피, 농도 및 서열은 하기 표 9에 상세히 기술되어 있다. 형성된 2개의 구축물의 DNA 기질 디자인은 도 6 (a)에 제시되어 있다.
[표 9]
3.2
MuA
트랜스포사제를
이용한 DNA 주형 단편화
MuA 트랜스포사제를 이용하여 이중 가닥 람다 DNA (서열 13은 센스 가닥의 서열만을 나타낸다)를 길이가 대략 5-10 kB인 가닥으로 단편화시켰다. MuA 트랜스포사제는 섹션 3.1에서 어닐링된 MuA 기질 (Y형 2 및 헤어핀 2 MuA 기질)을 삽입하였다. 섹션 2.2 및 상기 표 6에 기술된 것과 유사한 방법으로 샘플을 제조하였는데, 단, 예외적으로, 사용된 MuA 기질은 Y형 2 및 헤어핀 2 MuA 기질였다. 본 경우에서, 정제된 샘플 X를 20 ㎕ 부피에서 용리시켰다.
3.3 이중 가닥
람다
DNA 구축물 단편에서의 닉 수복
일단 Y형 2 및 헤어핀 2 MuA 기질이 단편화된 람다 DNA 내로 삽입되고 나면, 가닥 중의 닉을 수복시키고, 이노신을 람다 DNA 단편에 결합시켜 완전한 이중 가닥 람다 DNA 단편을 제조하는 것이 필요하다. 한 반응물을 하기 표 10에 기술된 바와 같이 얼음 상에서 조립시켰다. EDTA (10 ㎕, 0.5 M)를 샘플에 첨가하기 전, 샘플을 16℃에서 60 min 동안 인큐베이션시켰다. 생성된 샘플 혼합물을 퀴아퀵™ 정제를 사용하여 정제하고, 50 ㎕ 물 중에서 용리시켰다. 분취량의 정제된 샘플 (1 ㎕)을 애질런트 12000 칩 상에서 전개시켜 샘플을 정량화하고, 트리스-HCl 및 NaCl (pH 7.5)을 각각 그 농도가 10 mM 및 50 mM이 될 때까지 나머지 샘플에 첨가하였다. 최종적으로, 서열 16 (서열의 3' 말단은 2개의 티민 잔기 및 3' 콜레스테롤 TEG에 부착된 6개의 iSp18 스페이서를 가진다, 0.5 μM)을 정제된 람다 DNA 구축물에 어닐링시켰다.
[표 10]
3.4
정제되고, 단편화된
람다
DNA 구축물의
헬리카제
제어형 DNA 이동을 보여주는 전기생리학적 실험
실험을 세팅하기 전, 람다 DNA 구축물 (0.2 nM, MuA 트랜스포사제에 의해 Y형 2 및 헤어핀 2 MuA 기질이 단편의 양단에 부착되어 있는, 5-10 kB의 람다 DNA 단편 (예시적인 구축물에 대해서는 도 6 (b) 참조)) 및 Trwc Cba (서열 17, 1 μM)를 완충제 (50 mM CAPS, pH 10.0 (NaOH를 첨가함으로써 pH를 pH 10.0으로 변경), 100 mM NaCl) 중에서 1시간 동안 함께 미리 인큐베이션시켰다.
전기적 측정은 완충제 (600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8) 중 블록 공중합체에 삽입된 단일 MspA 나노포어 (MspA - B2C)로부터 획득하였다. 이중층 중에서 단일 포어를 수득한 후, 이어서, 완충제 (3 mL, 600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)를 시스템을 통해 유동시켜 임의의 과량의 MspA 나노포어 (MspA - B2C)를 제거하고, 8℃로 설정된 냉각기 플레이트 상에 실험 시스템을 배치시킴으로써 시스템 온도가 ~15℃가 되도록 만들었다. MgCl2 (10 mM) 및 dTTP (5 mM)를 함께 완충제 (600 mM KCl, 25 mM KH2PO4, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)와 혼합한 후, 이어서, 람다 DNA 구축물 (0.2 nM), Trwc Cba (서열 17, 1 μM) 완충제 (50 mM CAPS, pH 10.0 (NaOH를 첨가함으로써 pH를 pH 10.0으로 변경), 100 mM NaCl) 프리 믹스에 첨가하였다. 이어서, 프리 믹스를 단일 나노포어 실험 시스템에 첨가하였다. 전위 플립 프로세스 (30 min 동안 +120 mV, 이어서, 2초 동안 -100 mV, 및 이어서, 2초 동안 0 mV) 후 2시간 동안 실험을 수행하고, 헬리카제 제어형 DNA 이동을 모니터링하였다.
3.5 결과 및 논의
람다 DNA 구축물에 대한 헬리카제 제어형 DNA 이동을 관찰하였고, 헬리카제 제어형 DNA 이동의 예는 도 7에 제시되어 있다. 람다 DNA 구축물에 존재하는 iSpC3 스페이서는 도 7에서 번호 1-3으로 강조 표시된 특징적인 차단 수준을 나타내었다. Y형 2 MuA 기질은 양 가닥에 4개의 iSpC3 스페이서를 가지고, 헤어핀 2 MuA 기질 또한 4개의 iSpC3 스페이서를 가지는데, 각 iSpC3 스페이서는, 람다 DNA 구축물의 상기 영역이 나노포어를 통해 전위됨에 따라 더 많은 전류가 흐르게 할 수 있다. 샘플이 성공적으로 제조되었다면, 이때 iSpC3 스페이서 이벤트는 람다 DNA 구축물의 시작점, 중간 (센스 및 안티센스 서열 사이의 전이를 표시) 및 종점에서 관찰될 것이다. 도 7은 iSpC3 스페이서 영역에 상응하는 전류 흐름 증가에 대한 3가지 예시를 명확하게 보여준다. 그러므로, 샘플 제조 방법은 도 6 (b)에 제시된 람다 DNA 구축물을 제조하기 위해 람다 DNA 내로 MuA 기질을 효과적으로 도입하였다. 나노포어에 의해 DNA가 포획되었을 때, 효소 (A로 표지)는 나노포어를 통해 인가된 전위력에 의해 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나 이동한다. Y형 2 및 헤어핀 2 MuA 기질에서 이노신이 사용되기 때문에, 일단 MuA 기질이 삽입되고 나면, 그 모두는 이중 가닥 DNA 구축물 중 닉을 폐쇄시키는 데 필요하였는 바, 샘플 제조 방법의 단계는 축소되었다.
실시예
4
본 실시예는 나노포어를 통한 무손상 DNA 가닥 (마지막의 것이 스페이서 기의 5' 말단에 부착된 추가의 2개의 T를 갖는 것인 28개의 iSpC3 스페이서 유닛은 서열 23의 5' 말단에 부착되어 있고, 서열 24의 5' 말단에 부착된 추가의 4개의 iSpC3 스페이서는 서열 23의 3' 말단에 부착되어 있고, 여기서, 서열 12는 서열 23의 영역에 혼성화된다)의 이동을 제어할 수 있는 TrwC Cba 단량체 (서열 17)의 능력을 TrwC Cba Q276C-3.4 kDa 이량체 (각 단량체 유닛은 돌연변이 Q276C를 포함하는 서열 17을 포함하며, 여기서, 한 단량체 유닛은 3.4 kDa PEG 링커를 사용하여 각 단량체 유닛의 276번 위치를 통해 나머지 다른 한 유닛에 연결되어 있다)의 능력과 비교한다. 본 실시예에서 사용된 DNA 구축물은 도 22에 제시되어 있다 (헬리카제는 B로 표지된 영역에 결합할 수 있다). DNA 구축물이 나노포어에 의해 포획되고 나면, 나노포어를 통한 인가된 전위는 효소가 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나도록 이동시키고, 헬리카제 제어형 DNA 이동이 관찰된다.
단량체의 헬리카제 제어형 이동을 이량체의 것과 비교하였을 때, 단량체보다 이량체의 경우에 더 큰 비율로 장시간의 지속 헬리카제 제어형 DNA 이동 (장시간의 지속 이동은 주요 집단의 헬리카제 제어형 DNA 이동의 평균치로부터의 표준 편차는 3을 초과하는 것인 헬리카제 제어형 DNA 이동임)이 이루어진 것으로 관찰되었다.
물질 및 방법
실험을 세팅하기 전, DNA (1 nM, 마지막의 것이 스페이서 기의 5' 말단에 부착된 추가의 2개의 T를 갖는 것인 28개의 iSpC3 스페이서 유닛은 서열 23의 5' 말단에 부착되어 있고, 서열 24의 5' 말단에 부착된 추가의 4개의 iSpC3 스페이서는 서열 23의 3' 말단에 부착되어 있고, 여기서, 서열 12는 서열 23에 혼성화된다) 및 효소 (TrwC Cba 단량체 (1 nM, 서열 17) 또는 TrwC Cba Q276C-3.4 kDa 이량체 (0.3 nM, 각 단량체 유닛은 돌연변이 Q276C를 포함하는 서열 17을 포함하고, 여기서, 한 단량체 유닛은 3.4 kDa PEG 링커를 사용하여 각 단량체 유닛의 276번 위치를 통해 나머지 다른 한 유닛에 연결되어 있다))를 >16시간 동안 함께 미리 인큐베이션시켰다.
전기적 측정은 완충제 (625 mM KCl, 100 mM Hepes, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8) 중 블록 공중합체에 삽입된 단일 MspA 나노포어 MS(G75S/G77S/L88N/Q126R)8 MspA (돌연변이 G75S/G77S/L88N/Q126R을 포함하는 서열 2)로부터 획득하였다. MgCl2 (10 mM) 및 dTTP (5 mM)를 완충제 (625 mM KCl, 100 mM Hepes, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)와 함께 혼합한 후, DNA (앞서 기술된 구축물), 효소 프리 믹스 (TrwC Cba 단량체 (1 nM, 서열 17) 또는 TrwC Cba Q276C-3.4 kDa 이량체 (1 nM, 각 단량체 유닛은 돌연변이 Q276C를 포함하는 서열 17을 포함하고, 여기서, 한 단량체 유닛은 3.4 kDa PEG 링커를 사용하여 각 단량체 유닛의 276번 위치를 통해 나머지 다른 한 유닛에 연결되어 있다))에 첨가하였다. 이중층 중에서 단일 포어를 수득한 후, 프리 믹스를 단일 나노포어 실험 시스템에 첨가하였다. +120 mV의 정전위에서 실험을 수행하고, 헬리카제 제어형 DNA 이동을 모니터링하였다.
결과 및 논의
헬리카제 TrwC Cba 단량체 (서열 17) 및 TrwC Cba Q276C-3.4 kDa 이량체 (각 단량체 유닛은 돌연변이 Q276C를 포함하는 서열 17을 포함하고, 여기서, 한 단량체 유닛은 3.4 kDa PEG 링커를 사용하여 각 단량체 유닛의 276번 위치를 통해 나머지 다른 한 유닛에 연결되어 있다)에 대한 헬리카제 제어형 DNA 이동을 관찰하였다. 나노포어에 의한 DNA 구축물 포획시, 헬리카제는 나노포어를 통해 인가된 전위력에 의해 dsDNA 영역 (여기서, 테더는 구축물에 혼성화된다) 및 스페이서를 지나 이동하였고, 헬리카제 제어형 이동이 관찰되었다.
관찰된 헬리카제 제어형 DNA 이동 중 주요 집단은 검출된 이동의 약 95%를 차지하였지만, 적은 비율의 이동은 지속 시간이 유의적으로 더 길었다 (주요 집단의 헬리카제 제어형 DNA 이동의 평균치로부터의 표준 편차는 3을 초과한다). 이와 같이 이동 시간이 길어짐에 따라 데이터 분석은 개선될 수 있다. TrwC Cba Q276C-3.4 kDa 이량체 (1 nM)를 사용하여 DNA 이동을 제어하였을 때, 훨씬 더 높은 비율 (TrwC Cba 단량체의 경우, 5%인 것과 비교하여, TrwC Cba Q276C-3.4 kDa 이량체의 경우, 20%)의 상기와 같이 더욱 긴 지속 시간의 이동 (주요 집단의 헬리카제 제어형 DNA 이동의 평균치로부터의 표준 편차는 3을 초과한다)이 관찰되었다. 이량체 헬리카제를 통해 나노포어 서열분석 시스템에서 개선된 데이터 분석을 수행할 수 있는 바, 이량체 헬리카제를 사용하는 것이 단량체보다 우수한 이점을 제공한다.
실시예
5
본 실시예는 효소 활성을 시험하기 위한 형광 기반 검정법에서 (ATP 및 MgCl2, 둘 모두를 제공받았을 때) Hel308 Mbu (서열 28)의 이동을 정지시키는 데 Sp9 스페이서 유닛이 사용될 수 있다는 것을 예시한다.
물질 및 방법
3개의 상이한 시판용 형광성 기질 (A = (스페이서를 함유하지 않는 대조군 가닥) 서열 25 및 26, B = (단일 Sp9 스페이서를 함유하는 가닥) 그의 3' 말단에서 1개의 Sp9 스페이서에 의해 서열 29의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27, C = (4개의 Sp9를 함유하는 가닥) 그의 3' 말단에서 4개의 Sp9 스페이서에 의해 서열 29의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27)을 사용하여 혼성화된 dsDNA를 치환할 수 있는 Hel308 Mbu (서열 28)의 능력을 검정하였다. FAM 표지된 DNA (형광성 기질을 위해, A = 서열 25, B = 서열 29의 3' 말단에 부착된 1개의 sp9 스페이서에 그의 3' 말단에 의해 부착된 서열 27, C = 서열 29의 3' 말단에 부착된 4개의 sp9 스페이서에 그의 3' 말단에 의해 부착된 서열 27)를, 그의 3' 말단에 블랙-홀 소광제가 부착되어 있는 부분적으로 상보성인 가닥 (서열 26)에 1:1 비율로 (각 가닥 1 uM씩) 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA 중에서 어닐링시켰다. 가닥을 실온에서 30분 동안 어닐링시켰다. 어닐링된 DNA (A = 서열 25 및 26, B = 그의 3' 말단에서 1개의 Sp9 스페이서에 의해 서열 29의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27, C = 그의 3' 말단에서 4개의 Sp9 스페이서에 의해 서열 29의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27)를 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA, 1 mM ATP (1 uM 포획 DNA (서열 27 또한 존재)) 중에서 50 nM으로 희석시켰다. Hel308 Mbu (서열 28)의 샘플을 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA 중에서 475 nM로 희석시켰다. 이어서, Hel308 Mbu (12 nM)를 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA, 0.975 mM ATP (0.975 uM 포획 DNA 또한 존재) 중에서 48.75 nM의 어닐링된 DNA에 대하여 (하기 기술되고, 도 8 및 9에 제시된 바와 같이) 검정하였다.
대조군 가닥 A는 도 8에 제시되어 있으며, 여기서, 1A)에서 형광성 기질 가닥 (48.75 nM 최종)은 3' ssDNA 오버행, 및 40개의 염기로 된 혼성화된 dsDNA 섹션을 가진다. 3' ssDNA 오버행을 함유하는 상단 가닥은 서열 25의 5' 말단에 부착된 카르복시플루오레세인 염기를 가지고, 혼성화된 상보체는 서열 26의 3' 말단에 부착된 블랙-홀 소광제 (BHQ-1) 염기를 가진다. 혼성화되면, 플루오레세인으로부터의 형광은 국소 BHQ-1에 의해 소광되고, 기질은 본질적으로 비형광성이 된다. 형광성 기질의 하단 가닥과 부분적으로 상보적인, 1 μM의 포획 가닥 (서열 27)이 본 검정에 포함된다. 2A)에 제시된 바와 같이, ATP (0.975 mM) 및 MgCl2 (10 mM)의 존재하에서, 기질에 첨가된 헬리카제 (12 nM)는 형광성 기질의 3' 꼬리에 결합하여 상단 가닥을 따라 이동하여 상보성 가닥을 치환시킨다. 3A)에 제시된 바와 같이, 일단 BHQ-1을 포함하는 상보성 가닥이 완전하게 치환되고 나면, 주요 가닥 상의 플루오레세인은 형광을 발한다. 4A)에 제시된 바와 같이, 치환된 가닥은 과량의 포획 가닥에 우선적으로 어닐링하여 초기 기질의 재어닐링 및 형광 손실을 막는다. 도 9는 가닥 B (1B-3B) 및 C (1C-3C)에 대한 검정 단계를 보여주는 것으로서, 이들 가닥의 경우, Sp9 스페이서는 헬리카제를 정지시키고, 헬리카제가, 플루오레세인이 부착된 가닥을 블랙-홀 소광제가 부착되어 있는 가닥으로부터 분리시키지 못하도록 막는다.
결과 및 논의
도 10의 그래프는 400 mM의 KCl에서 Hel308 Mbu (도 8 및 9에서 A로 표지; 서열 28)에 대한 완충제 용액 (100 mM Hepes pH 8.0, 0.975 mM ATP, 10 mM MgCl2, 1 mg/ml BSA, 48.75 nM 형광성 기질 DNA (상기 논의된 기질 A, B 및 C), 0.975 μM 포획 DNA (서열 27)) 중에서의 활성의 초기 속도를 보여주는 것이다. 조사된 염 농도에서, Hel308 Mbu (서열 28)는 대조군 가닥 A의 dsDNA 교체를 보였다. 그러나, 도 10은 서열 (B (1개의 Sp9 스페이서) 및 C (4개의 Sp9 스페이서))에 Sp9 스페이서를 갖는 2개의 구축물 모두, dsDNA 교체는 폐기되었다는 것을 명확하게 나타낸다. 이는 ATP 및 MgCl2의 존재 하에 Sp9 스페이서가 유리 용액 중에서 Hel308 Mbu 효소를 정지시킨다는 것을 나타낸다.
실시예
6
본 실시예는 효소 활성을 시험하기 위한 형광 기반 검정법에서 (ATP 및 MgCl2, 둘 모두를 제공받았을 때) Hel308 Mbu (서열 28)의 이동을 정지시키는 데 idSp 기가 사용될 수 있다는 것을 예시한다.
물질 및 방법
4개의 상이한 시판용 형광성 기질 (D = (스페이서를 함유하지 않는 대조군 가닥) 서열 32 및 26, E = (단일 idSp 스페이서를 함유하는 가닥) 그의 3' 말단에서 1개의 idSp 기에 의해 서열 30의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27, F = (4개의 idSp를 함유하는 가닥) 그의 3' 말단에서 4개의 idSp 기에 의해 서열 31의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27 및 G = (스페이서를 함유하지 않는 제2 대조군 가닥) 서열 33 및 26)을 사용하여 혼성화된 dsDNA를 치환할 수 있는 Hel308 Mbu (서열 28)의 능력을 검정하였다. FAM 표지된 DNA (형광성 기질을 위해, D - 서열 32, E = 서열 30의 3' 말단에 부착된 1개의 idSp 기에 그의 3' 말단에 의해 부착된 서열 27, F = 서열 31의 3' 말단에 부착된 4개의 idSp 기에 그의 3' 말단에 의해 부착된 서열 27 및 G = 서열 33)를, 그의 3' 말단에 블랙-홀 소광제가 부착되어 있는 부분적으로 상보성인 가닥 (서열 26)에 1:1.2 비율로 (1:1.2 μM) 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA 중에서 어닐링시켰다. 가닥을 실온에서 15분 동안 어닐링시켰다. 어닐링된 DNA (D = 서열 32 및 26, E = 그의 3' 말단에서 1개의 idSp 기에 의해 서열 30의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27, F = 그의 3' 말단에서 4개의 idSp 기에 의해 서열 31의 5' 말단에 부착되어 있고, 서열 26에 혼성화되는 서열 27 및 G = 서열 33 및 26)를 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA, 1 mM ATP (1 uM 포획 DNA (서열 27 또한 존재)) 중에서 50 nM으로 희석시켰다. 이어서, Hel308 Mbu (12 nM)를 400 mM KCl, 100 mM HEPES pH 8, 10 mM MgCl2, 1 mg/ml BSA, 0.975 mM ATP (0.975 uM 포획 DNA 또한 존재) 중에서 48.75 nM의 어닐링된 DNA에 대하여 (실시예 5에 기술된 바와 같이 (단, 예외적으로, DNA 구축물은 상이하고, Sp9 스페이서 대신 idSp 기를 함유한다), 및 도 8 및 9에 제시된 바와 같이 (또한, 본 도면에서 Sp9 기는 idSp 기로 대체된다)) 검정하였다.
결과 및 논의
도 11의 그래프는 400 mM의 KCl에서 Hel308 Mbu (도 8 및 9에서 A로 표지)에 대한 완충제 용액 (100 mM Hepes pH 8.0, 0.975 mM ATP, 10 mM MgCl2, 1 mg/ml BSA, 48.75 nM 형광성 기질 DNA (상기 논의된 기질 D, E, F 및 G), 0.975 μM 포획 DNA (서열 27)) 중에서의 활성의 초기 속도를 보여주는 것이다. 조사된 염 농도에서, Hel308 Mbu (서열 28)는 대조군 가닥 D 및 G의 dsDNA 교체를 보였다. 그러나, 도 11은 서열 (F)에 4개의 idSp 스페이서를 갖는 구축물의 경우, dsDNA 교체는 폐기되었다는 것을 명확하게 나타낸다. 이는 ATP 및 MgCl2의 존재 하에 4개의 idSp 기가 유리 용액 중에서 Hel308 Mbu 효소를 정지시킨다는 것을 나타낸다.
실시예
7
본 실시예는 T4 Dda - E94C/A360C의 이동을 정지시킬 수 있는 iSpC3 스페이서 및 iSp18 스페이서의 능력을 측정하는 데 사용된 겔 기반 검정법을 예시하는 것이다.
물질 및 방법
어닐링된 DNA 복합체 (시험된 서열은 하기 표 11에 제시되어 있다)를 25 mM 포스페이트 (pH 8.0), 200 mM KCl 중 T4 Dda - E94C/A360C와 (1:1, v/v)의 비로 혼합하여 최종 농도의 T4 Dda - E94C/A360C (2,000 nM) 및 DNA (100 nM)를 수득하였다. 헬리카제를 주변 온도에서 2시간 동안 DNA에 결합하게 하였다. 포획 가닥 (서열 37, 20 μM)을 각 샘플에 첨가하여 임의의 비결합 효소에 결합시키고, 샘플을 주변 온도에서 30 min 동안 인큐베이션시켰다. 완충제를 샘플에 첨가하고 (하기 표 11로부터의 DNA 구축물 = 50 nM, 포획 DNA (서열 37) = 10 μM 및 T4 Dda - E94C/A360C = 1,000 nM), 주변 온도에서 1시간 동안 인큐베이션시켰다 (완충제 1 = 25 mM 포스페이트 (pH 8.0), 200 mM KCl, 20 mM MgCl2, 10 mM ATP 또는 완충제 2 = 25 mM 포스페이트 (pH 8.0), 1 M KCl, 25 mM 페리시안화 칼륨 (III), 75 mM 페로시안화 칼륨, 20 mM MgCl2, 10 mM ATP). 로딩 완충제 (25 mM 포스페이트 (pH 8.0), 151.5 mM KCl, 25% 글리세롤, 125 mM EDTA)를 각 샘플에 첨가하여 헬리카제 활성을 켄칭시켰다. 샘플을 4-20% TBE 겔 상에 로딩하고, 겔을 1.5시간 동안 160 V에서 전개시켰다. 이어서, DNA 밴드를 관찰하기 위해 겔을 SYBR 골드로 염색시켰다.
[표 11]
결과 및 논의
도 12는, DNA 구축물이 헬리카제 (T4 Dda - E94C/A360C)를 정지시키는 스페이서를 함유하지 않는 양성 대조군 실험의 겔을 보여주는 것이다. 도 14의 레인 2는 최대 5개의 헬리카제 효소가 서열 34의 단일 가닥 섹션 상에 결합할 수 있다는 것을 보여주는 것이다. ATP 및 MgCl2 첨가시, 다중 효소에 결합한 dsDNA 구축물에 상응하는 더 높은 고역 밴드는 소실되었고, ssDNA 구축물에 상응하는 밴드 (X로 표시 및 단 서열 34에 상응)는 강도가 증가하였다. 이는 헬리카제가 연료를 받았을 때에는 DNA를 따라 이동하여 혼성화된 상보성 가닥 (서열 35)을 치환한다는 것을 나타낸다.
도 15는 표 11의 DNA 구축물 7-9 (예컨대, 예컨대, ssDNA/dsDNA 연접부 바로 앞에 3, 4, 또는 5개의 iSp18 스페이서를 갖는 DNA)에 대한 효소 활성 실험을 보여주는 겔 실시예를 보여주는 것이다. 레인 1-4는 3개의 iSp18 스페이서에 상응하고, 레인 5-7은 4개의 iSp18 스페이서에 상응하고, 레인 9-12는 5개의 iSp18 스페이서에 상응한다. 레인 2, 6 및 10은 대조군과 유사하게, 최대 5개의 헬리카제 효소가 표 11의 DNA 구축물 7-9의 단일 가닥 섹션에 결합할 수 있다는 것을 보여준다. ATP 및 MgCl2 첨가시, 헬리카제는 DNA 가닥을 따라 이동하기 위해 필요한 성분을 제공받을 것이다. 레인 3-4, 7-8 및 11-12는 ATP 및 MgCl2 첨가 첨가 후 상이한 2가지 완충제 조건 (완충제 1 및 2) 하에서의 다양한 DNA 구축물을 보여주는 것이다. 1Y 및 1X로 표지된 영역에서 2개의 밴드가 뚜렷이 보인다. 1Y는 1개의 헬리카제가 정지되어 있고, 결합되어 있는 dsDNA 구축물에 상응한다. 이는 3, 4, 및 5개의 iSP18 스페이서가 시험된 조건하에서 헬리카제를 정지시킬 수 있다는 것을 보여주는 것이다. 1X는 1개의 헬리카제가 정지되어 있고, 결합되어 있는 ssDNA 구축물에 상응한다. 상기 밴드는 DNA 구축물에 결합하는 다중 헬리카제, 및 앞쪽 헬리카제가 정지 기를 지나도록 인출하여 짧은 단쇄 상보성 가닥 (서열 35)을 치환하도록 하는 헬리카제로부터 생성된 결과이다. 그러나, 단일 헬리카제는 iSp18 스페이서를 지나 이동할 수 없는 바, 상기 밴드는 여전히 1개의 헬리카제가 결합되어 있는 것이다 (예컨대, 도 13 결과에서 종 E). 헬리카제를 정지시키는 데 4 및 5개의 iSp18 스페이서가 사용된 경우, 2Y 수준에 희미한 밴드가 존재한다. 이는 시험된 조건하에서 4/5개의 iSp18 스페이서가 사용되었을 때, 최대 2개의 헬리카제의 이동을 정지시킬 수 있다는 것을 보여주는 것이다.
1개 이상의 시험된 완충제 조건에서 조사된 다른 스페이서 조합 (표 11의 엔트리 2-6) 중 iSpC3 및 iSp18 스페이서, 둘 모두 1개의 헬리카제를 정지시킬 수 있었다. 시험된 2가지 완충제 조건 중에서 일반적으로는 완충제 1보다는 완충제 2의 경우에 더욱 효율적으로 정지된 것이 관찰되었다. 포함된 스페이서 개수가 많을수록, 시험된 조건하에서 헬리카제는 더욱 효율적으로 정지되었다.
실시예
8
본 실시예는 특정 영역에서 단 1개 또는 2개의 T4 Dda - E94C/A360C 헬리카제의 결합을 제어하는 데 필요한 염기의 개수를 조사한다.
물질 및 방법
하기 표 12에 상세하게 기술된 DNA 구축물 (1 μM 또는 100 nM 최종 농도)을 적절한 완충제 중에서 일련으로 희석된 T4 Dda - E94C/A360C와 함께 인큐베이션시켰다. 이어서, 샘플을 4-20% TBE 겔 상에 로딩하고, 90분 동안 160 V에서 전개시켰다. 이어서, 엔트리 1-6을 함유하는 겔을 SYBR로 염색시켰다. 도 16은 본 실험에서 사용된 DNA 구축물의 유형을 보여주는 것이다. 1로 표지된 영역의 길이는 DNA에 결합할 수 있는 T4 Dda - E94C/A360C 헬리카제의 개수를 제어할 수 있도록 조건을 최적화하기 위해 2 내지 50으로 가변된다.
[표 12]
결과 및 논의
2개의 염기 내지 50개의 염기로 가변된 영역 1 (도 16에 제시)에 몇개의 효소가 결합할 수 있는지 측정하기 위해 표 12에 열거되어 있는 각 DNA 구축물을 조사하였다. 시험된 각 DNA 구축물의 경우, 헬리카제가 첨가되지 않았을 때에는 오직 DNA에 비결합인 것에 대한 단일 밴드만이 관찰되었다. 조사된 조건하에서, (2개의 티민 염기로 이루어진 결합 영역을 가지는) 구축물 4 및 (4개의 티민 염기로 이루어진 결합 영역을 가지는) 구축물 5는 어느 농도에서도 임의의 헬리카제의 결합을 허용하지 않는 것으로 관찰되었다 (하기 표 14 참조). 구축물 6 (8개의 티민 염기로 이루어진 결합 영역을 갖는 것, 하기 표 14 참조) 및 (10개의 티민 염기로 이루어진 결합 영역을 가지는) 구축물 1은 오직 1개의 헬리카제만 결합하는 것으로 관찰되었다 (하기 표 13 참조). 20개의 티민 염기로 이루어진 결합 영역을 갖는 구축물 2는 시험된 더 높은 농도에서도 2개의 효소가 결합할 수 있게 하였고, 50개의 티민 염기로 이루어진 결합 영역을 갖는 구축물 3은 시험된 최고 농도에서 최대 6개까지의 효소가 결합할 수 있게 하였다 (본 실험을 보여주는 겔에 대해서는 도 17을 참조, 하기 표 13 참조). 구축물 1-6은 ssDNA/dsDNA 영역의 연접부에 헬리카제가 결합하지 못하도록 막는 데 iSpC3 스페이서를 사용하였다. 구축물 7 및 8은 ssDNA/dsDNA 영역의 연접부에 헬리카제가 결합하지 못하도록 막는 데 iSp18 스페이서를 사용하였다. (16개의 티민으로 이루어진 결합 영역을 가지는) 구축물 7 및 (18개의 티민으로 이루어진 결합 영역을 가지는) 구축물 8, 둘 모두 시험된 조건하에서 최대 2개까지의 헬리카제가 결합할 수 있게 하였다 (하기 표 15 참조). 그러므로, 길이가 8개 초과의 티민 염기 길이인 결합 영역을 통해서는 1개 이상의 효소가 DNA 구축물에 결합할 수 있다.
[표 13]
[표 14]
[표 15]
실시예
9
본 실시예는 (도 18에서 기술되고, 그에 제시된) DNA 구축물 X에 부가되었을 때, 2개의 헬리카제가 결합하도록 하는 T4 Dda - E94C/A360C 헬리카제의 농도를 조사한다.
물질 및 방법
포크형이 아닌 DNA의 상보성을 갖는 것 하나 (도 18에 제시된 바와 같이 서열 42는 DNA 구축물에 혼성화된다)와, 포크형인 것 하나 (도 18에 제시된 바와 같이 (6개의 iSp18 스페이서가 3' 말단에 부착되어 있는) 서열 12는 DNA 구축물에 혼성화된다)인, 2개의 DNA 구축물을 시험하였다. 하기 표 16에 제시된 DNA는 가닥을 25 mM 포스페이트 (pH 8.0), 1,515.5 mM KCl 중에서 1 μM로 어닐링하였다 (10% 과량의 상보성 가닥 서열 43 (하기에서 엔트리 9 및 10) 및 서열 12 (하기에서 엔트리 10) 또는 서열 42 (하기에서 엔트리 9)를 사용하였다).
[표 16]
T4 Dda - E94C/A360C를 25 mM 포스페이트 (pH 8.0), 151.5 mM KCl로 완충제 교환하고, 일련으로 희석시켰다. 이어서, 헬리카제 및 DNA (1:1, v/v)를 상기 기술된 DNA 구축물 샘플 9 및 10과 함께 혼합하였다 (DNA 최종 농도A = 100 nM, 조사된 헬리카제 농도 = 3,800 nM, 1,900 nM, 950 nM, 475 nM, 238 nM, 0 nM). 이어서, DNA 및 효소 부피를 주변 온도에서 1.5시간 동안 인큐베이션시켰다. 염료 무함유 로딩 완충제 (5x, 7.5 ㎕)를 각 샘플 (30 ㎕)에 첨가하였다. 이어서, 샘플 (37.5 ㎕)을 4-20% TBE 겔 상에 로딩하고, 90분 동안 160 V에서 전개시켰다. 이어서, 겔을 SYBR로 염색시켰다.
결과 및 논의
표 16에 열거된 2개의 DNA 구축물을 조사하여 2개의 헬리카제의 결합을 촉진시키기 위해서는 어느 농도의 T4 Dda - E94C/A360C 헬리카제가 필요한지를 측정하였다. 시험된 각 DNA 구축물의 경우, 헬리카제가 첨가되지 않았을 때에는 오직 DNA에 비결합인 것에 대한 단일 밴드만이 관찰되었다. 조사된 조건하에서, 구축물 9 (비포크형 구축물) 및 10 (포크형), 둘 모두 238 nM 헬리카제로부터 한 헬리카제에, 및 475 nM 이상으로부터 2개의 효소의 결합이 관찰되었다. 효소 농도가 증가함에 따라, 2개의 효소 결합에 상응하는 밴드의 강도는 증가하였다. 도 18에 제시된 DNA 구축물의 디자인을 통해 3,800 nM만큼 높은 농도에서 단 2개의 효소가 결합할 수 있다. 그러므로, 구축물이 미리 인큐베이션된 때에는 조사된 스페이서에 의해서는 헬리카제가 그에 결합할 수 없다.
실시예
10
본 실시예는 구축물 (DNA 구축물 X1)이 나노포어에 의해 포획되었을 때, T4 Dda - E94C/A360C가 유리 용액 중 4개의 iSp18 스페이서에 의해 어떻게 정지되는지를 보여준다. 포획시, 인가된 전위력이 효소 T4 Dda - E94C/A360C가 정지 스페이서를 지나도록 이동시키고, 나노포어를 통과하는 람다 구축물의 효소 제어형 DNA 이동을 가능하게 한다.
물질 및 방법
실험을 세팅하기 전, DNA 구축물 X1 (0.13 ㎕, 100 nM) 및 T4 Dda - E94C/A360C (15.6 ㎕, 250 nM)를 함께 완충제 (50 mM 인산칼륨, 253 mM KCl, pH 8.0) 중에서 실온에서 1시간 동안 미리 인큐베이션시켰다.
전기적 측정은 (냉각기 플레이트 상에 실험 시스템을 배치함으로써) 30℃에서 완충제 (600 mM KCl, 25 mM 인산칼륨, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8) 중 블록 공중합체에 삽입된 단일 MspA 나노포어 (MspA - B2C)로부터 획득하였다. 블록 공중합체에 삽입된 단일 포어를 수득한 후, 이어서, 완충제 (1 mL, 600 mM KCl, 25 mM 인산칼륨, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)를 시스템을 통해 유동시켜 임의의 과량의 MspA 나노포어 (MspA - B2C)를 제거하였다. 페리시안화 칼륨 (III) (200 μM 최종 농도)을 DNA (0.1 nM 최종 농도) 효소 (3 nM 최종 농도) 프리 믹스에 첨가하고, 1분 동안 방치하여 인큐베이션시킨 후, MgCl2 (10 mM 최종 농도) 및 ATP (1 mM 최종 농도)를 함께 완충제 (1,260 ㎕, 600 mM KCl, 25 mM 인산칼륨, 75 mM 페로시안화 칼륨 (II), 25 mM 페리시안화 칼륨 (III), pH 8)와 혼합하였다. 이어서, 상기 실험 믹스를 단일 나노포어 실험 시스템에 첨가하였다. 전위 플립 프로세스 (2 s 동안 +180 mV, 이어서, 2 s 동안 0 V, 및 이어서, 3,600 s 동안 -120 mV로 시스 측에서 인가(x6회 반복)) 후 6시간 동안 실험을 수행하고, 헬리카제 제어형 DNA 이동을 모니터링하였다.
결과 및 논의
DNA 구축물은 도 20에 제시되어 있다. T4 Dda - E94C/A360C는 DNA 구축물과 미리 인큐베이션되었을 때 구축물 영역 (A로 표지) (서열 9)에 결합할 수 있다. 그러나, 상기 효소는 유리 용액 중에 존재할 경우에는 정지 기 (4개의 iSp18 스페이서)를 지나 이동하지 못한다 (검은색 박스로 표지). 그러므로, DNA 구축물이 나노포어에 의해 포획될 때까지 효소는 iSp18 스페이서 (도 1에서 B로 표지)에서 정지되어 있다. 일단 나노포어에 의해 포획되고 나면, 인가된 전위력은 효소 T4 Dda - E94C/A360C가 정지 스페이서 (4개의 iSp18 스페이서)를 지나도록 이동시키고, 나노포어를 통과하는 DNA 구축물 X1 구축물의 효소 제어형 DNA 이동을 가능하게 한다. 헬리카제 제어형 DNA 이동의 일례가 도 21에 제시되어 있다. 1로 표지된 섹션은 서열 38의 pT 영역이 헬리카제의 제어하에 나노포어를 통해 전위되었을 때를 나타낸 것이다. 2로 표지된 섹션은 iSp18 스페이서가 헬리카제의 제어하에 나노포어를 통해 전위되었을 때를 나타낸 것이다. 관찰된 헬리카제 이벤트는 헬리카제 제어형 DNA 이동 시작점에서 pT 영역 및 iSp18 신호를 보였는 바, 헬리카제는 (iSp18 스페이서에 의한 헬리카제의 정지로부터 생성되는) 정의된 출발점을 갖는 것으로 관찰되었다.
SEQUENCE LISTING
<110> OXFORD NANOPORE TECHNOLOGIES LIMITED
<120> ENZYME STALLING METHOD
<130> N402011WO
<150> 61/774,694
<151> 2013-03-08
<150> 1314695.6
<151> 2013-08-16
<150> 1318464.3
<151> 2013-10-18
<160> 43
<170> PatentIn version 3.5
<210> 1
<211> 558
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence encoding the MS-B1 mutant
MspA monomer
<400> 1
atgggtctgg ataatgaact gagcctggtg gacggtcaag atcgtaccct gacggtgcaa 60
caatgggata cctttctgaa tggcgttttt ccgctggatc gtaatcgcct gacccgtgaa 120
tggtttcatt ccggtcgcgc aaaatatatc gtcgcaggcc cgggtgctga cgaattcgaa 180
ggcacgctgg aactgggtta tcagattggc tttccgtggt cactgggcgt tggtatcaac 240
ttctcgtaca ccacgccgaa tattctgatc aacaatggta acattaccgc accgccgttt 300
ggcctgaaca gcgtgattac gccgaacctg tttccgggtg ttagcatctc tgcccgtctg 360
ggcaatggtc cgggcattca agaagtggca acctttagtg tgcgcgtttc cggcgctaaa 420
ggcggtgtcg cggtgtctaa cgcccacggt accgttacgg gcgcggccgg cggtgtcctg 480
ctgcgtccgt tcgcgcgcct gattgcctct accggcgaca gcgttacgac ctatggcgaa 540
ccgtggaata tgaactaa 558
<210> 2
<211> 184
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of the mature form of the MS-B1 mutant of the
MspA monomer
<400> 2
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asn Asn Gly Asn Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Arg Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Arg Val Ser Gly Ala Lys Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 3
<211> 885
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence encoding one monomer of
alpha-hemolysin-E111N/K147N
<400> 3
atggcagatt ctgatattaa tattaaaacc ggtactacag atattggaag caatactaca 60
gtaaaaacag gtgatttagt cacttatgat aaagaaaatg gcatgcacaa aaaagtattt 120
tatagtttta tcgatgataa aaatcacaat aaaaaactgc tagttattag aacaaaaggt 180
accattgctg gtcaatatag agtttatagc gaagaaggtg ctaacaaaag tggtttagcc 240
tggccttcag cctttaaggt acagttgcaa ctacctgata atgaagtagc tcaaatatct 300
gattactatc caagaaattc gattgataca aaaaactata tgagtacttt aacttatgga 360
ttcaacggta atgttactgg tgatgataca ggaaaaattg gcggccttat tggtgcaaat 420
gtttcgattg gtcatacact gaactatgtt caacctgatt tcaaaacaat tttagagagc 480
ccaactgata aaaaagtagg ctggaaagtg atatttaaca atatggtgaa tcaaaattgg 540
ggaccatacg atcgagattc ttggaacccg gtatatggca atcaactttt catgaaaact 600
agaaatggtt ctatgaaagc agcagataac ttccttgatc ctaacaaagc aagttctcta 660
ttatcttcag ggttttcacc agacttcgct acagttatta ctatggatag aaaagcatcc 720
aaacaacaaa caaatataga tgtaatatac gaacgagttc gtgatgatta ccaattgcat 780
tggacttcaa caaattggaa aggtaccaat actaaagata aatggacaga tcgttcttca 840
gaaagatata aaatcgattg ggaaaaagaa gaaatgacaa attaa 885
<210> 4
<211> 293
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of one monomer of alpha-HL-NN
<400> 4
Ala Asp Ser Asp Ile Asn Ile Lys Thr Gly Thr Thr Asp Ile Gly Ser
1 5 10 15
Asn Thr Thr Val Lys Thr Gly Asp Leu Val Thr Tyr Asp Lys Glu Asn
20 25 30
Gly Met His Lys Lys Val Phe Tyr Ser Phe Ile Asp Asp Lys Asn His
35 40 45
Asn Lys Lys Leu Leu Val Ile Arg Thr Lys Gly Thr Ile Ala Gly Gln
50 55 60
Tyr Arg Val Tyr Ser Glu Glu Gly Ala Asn Lys Ser Gly Leu Ala Trp
65 70 75 80
Pro Ser Ala Phe Lys Val Gln Leu Gln Leu Pro Asp Asn Glu Val Ala
85 90 95
Gln Ile Ser Asp Tyr Tyr Pro Arg Asn Ser Ile Asp Thr Lys Asn Tyr
100 105 110
Met Ser Thr Leu Thr Tyr Gly Phe Asn Gly Asn Val Thr Gly Asp Asp
115 120 125
Thr Gly Lys Ile Gly Gly Leu Ile Gly Ala Asn Val Ser Ile Gly His
130 135 140
Thr Leu Asn Tyr Val Gln Pro Asp Phe Lys Thr Ile Leu Glu Ser Pro
145 150 155 160
Thr Asp Lys Lys Val Gly Trp Lys Val Ile Phe Asn Asn Met Val Asn
165 170 175
Gln Asn Trp Gly Pro Tyr Asp Arg Asp Ser Trp Asn Pro Val Tyr Gly
180 185 190
Asn Gln Leu Phe Met Lys Thr Arg Asn Gly Ser Met Lys Ala Ala Asp
195 200 205
Asn Phe Leu Asp Pro Asn Lys Ala Ser Ser Leu Leu Ser Ser Gly Phe
210 215 220
Ser Pro Asp Phe Ala Thr Val Ile Thr Met Asp Arg Lys Ala Ser Lys
225 230 235 240
Gln Gln Thr Asn Ile Asp Val Ile Tyr Glu Arg Val Arg Asp Asp Tyr
245 250 255
Gln Leu His Trp Thr Ser Thr Asn Trp Lys Gly Thr Asn Thr Lys Asp
260 265 270
Lys Trp Thr Asp Arg Ser Ser Glu Arg Tyr Lys Ile Asp Trp Glu Lys
275 280 285
Glu Glu Met Thr Asn
290
<210> 5
<211> 184
<212> PRT
<213> Mycobacterium smegmatis
<400> 5
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Ala
85 90 95
Pro Pro Phe Gly Leu Asn Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 6
<211> 184
<212> PRT
<213> Mycobacterium smegmatis
<400> 6
Gly Leu Asp Asn Glu Leu Ser Leu Val Asp Gly Gln Asp Arg Thr Leu
1 5 10 15
Thr Val Gln Gln Trp Asp Thr Phe Leu Asn Gly Val Phe Pro Leu Asp
20 25 30
Arg Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Lys Tyr
35 40 45
Ile Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu
50 55 60
Gly Tyr Gln Ile Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe
65 70 75 80
Ser Tyr Thr Thr Pro Asn Ile Leu Ile Asp Asp Gly Asp Ile Thr Gly
85 90 95
Pro Pro Phe Gly Leu Glu Ser Val Ile Thr Pro Asn Leu Phe Pro Gly
100 105 110
Val Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val
115 120 125
Ala Thr Phe Ser Val Asp Val Ser Gly Pro Ala Gly Gly Val Ala Val
130 135 140
Ser Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu
145 150 155 160
Arg Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr
165 170 175
Tyr Gly Glu Pro Trp Asn Met Asn
180
<210> 7
<211> 183
<212> PRT
<213> Mycobacterium smegmatis
<400> 7
Val Asp Asn Gln Leu Ser Val Val Asp Gly Gln Gly Arg Thr Leu Thr
1 5 10 15
Val Gln Gln Ala Glu Thr Phe Leu Asn Gly Val Phe Pro Leu Asp Arg
20 25 30
Asn Arg Leu Thr Arg Glu Trp Phe His Ser Gly Arg Ala Thr Tyr His
35 40 45
Val Ala Gly Pro Gly Ala Asp Glu Phe Glu Gly Thr Leu Glu Leu Gly
50 55 60
Tyr Gln Val Gly Phe Pro Trp Ser Leu Gly Val Gly Ile Asn Phe Ser
65 70 75 80
Tyr Thr Thr Pro Asn Ile Leu Ile Asp Gly Gly Asp Ile Thr Gln Pro
85 90 95
Pro Phe Gly Leu Asp Thr Ile Ile Thr Pro Asn Leu Phe Pro Gly Val
100 105 110
Ser Ile Ser Ala Asp Leu Gly Asn Gly Pro Gly Ile Gln Glu Val Ala
115 120 125
Thr Phe Ser Val Asp Val Lys Gly Ala Lys Gly Ala Val Ala Val Ser
130 135 140
Asn Ala His Gly Thr Val Thr Gly Ala Ala Gly Gly Val Leu Leu Arg
145 150 155 160
Pro Phe Ala Arg Leu Ile Ala Ser Thr Gly Asp Ser Val Thr Thr Tyr
165 170 175
Gly Glu Pro Trp Asn Met Asn
180
<210> 8
<211> 439
<212> PRT
<213> Enterobacteria phage T4
<400> 8
Met Thr Phe Asp Asp Leu Thr Glu Gly Gln Lys Asn Ala Phe Asn Ile
1 5 10 15
Val Met Lys Ala Ile Lys Glu Lys Lys His His Val Thr Ile Asn Gly
20 25 30
Pro Ala Gly Thr Gly Lys Thr Thr Leu Thr Lys Phe Ile Ile Glu Ala
35 40 45
Leu Ile Ser Thr Gly Glu Thr Gly Ile Ile Leu Ala Ala Pro Thr His
50 55 60
Ala Ala Lys Lys Ile Leu Ser Lys Leu Ser Gly Lys Glu Ala Ser Thr
65 70 75 80
Ile His Ser Ile Leu Lys Ile Asn Pro Val Thr Tyr Glu Glu Asn Val
85 90 95
Leu Phe Glu Gln Lys Glu Val Pro Asp Leu Ala Lys Cys Arg Val Leu
100 105 110
Ile Cys Asp Glu Val Ser Met Tyr Asp Arg Lys Leu Phe Lys Ile Leu
115 120 125
Leu Ser Thr Ile Pro Pro Trp Cys Thr Ile Ile Gly Ile Gly Asp Asn
130 135 140
Lys Gln Ile Arg Pro Val Asp Pro Gly Glu Asn Thr Ala Tyr Ile Ser
145 150 155 160
Pro Phe Phe Thr His Lys Asp Phe Tyr Gln Cys Glu Leu Thr Glu Val
165 170 175
Lys Arg Ser Asn Ala Pro Ile Ile Asp Val Ala Thr Asp Val Arg Asn
180 185 190
Gly Lys Trp Ile Tyr Asp Lys Val Val Asp Gly His Gly Val Arg Gly
195 200 205
Phe Thr Gly Asp Thr Ala Leu Arg Asp Phe Met Val Asn Tyr Phe Ser
210 215 220
Ile Val Lys Ser Leu Asp Asp Leu Phe Glu Asn Arg Val Met Ala Phe
225 230 235 240
Thr Asn Lys Ser Val Asp Lys Leu Asn Ser Ile Ile Arg Lys Lys Ile
245 250 255
Phe Glu Thr Asp Lys Asp Phe Ile Val Gly Glu Ile Ile Val Met Gln
260 265 270
Glu Pro Leu Phe Lys Thr Tyr Lys Ile Asp Gly Lys Pro Val Ser Glu
275 280 285
Ile Ile Phe Asn Asn Gly Gln Leu Val Arg Ile Ile Glu Ala Glu Tyr
290 295 300
Thr Ser Thr Phe Val Lys Ala Arg Gly Val Pro Gly Glu Tyr Leu Ile
305 310 315 320
Arg His Trp Asp Leu Thr Val Glu Thr Tyr Gly Asp Asp Glu Tyr Tyr
325 330 335
Arg Glu Lys Ile Lys Ile Ile Ser Ser Asp Glu Glu Leu Tyr Lys Phe
340 345 350
Asn Leu Phe Leu Gly Lys Thr Ala Glu Thr Tyr Lys Asn Trp Asn Lys
355 360 365
Gly Gly Lys Ala Pro Trp Ser Asp Phe Trp Asp Ala Lys Ser Gln Phe
370 375 380
Ser Lys Val Lys Ala Leu Pro Ala Ser Thr Phe His Lys Ala Gln Gly
385 390 395 400
Met Ser Val Asp Arg Ala Phe Ile Tyr Thr Pro Cys Ile His Tyr Ala
405 410 415
Asp Val Glu Leu Ala Gln Gln Leu Leu Tyr Val Gly Val Thr Arg Gly
420 425 430
Arg Tyr Asp Val Phe Tyr Val
435
<210> 9
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 1, 2, 3, 7 and 8
<400> 9
tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt 50
<210> 10
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 1 and 9
<400> 10
ggttgtttct gttggtgctg atattgc 27
<210> 11
<211> 97138
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 1
<400> 11
gctccactaa agggccgatt gacgggcggc gacctcgcgg gttttcgcta tttatgaaaa 60
ttttccggtt taaggcgttt ccgttcttct tcgtcataac ttaatgtttt tatttaaaat 120
accctctgaa aagaaaggaa acgacaggtg ctgaaagcga ggctttttgg cctctgtcgt 180
ttcctttctc tgtttttgtc cgtggaatga acaatggaag tcaacaaaaa gcagctggct 240
gacattttcg gtgcgagtat ccgtaccatt cagaactggc aggaacaggg aatgcccgtt 300
ctgcgaggcg gtggcaaggg taatgaggtg ctttatgact ctgccgccgt cataaaatgg 360
tatgccgaaa gggatgctga aattgagaac gaaaagctgc gccgggaggt tgaagaactg 420
cggcaggcca gcgaggcaga tctccagcca ggaactattg agtacgaacg ccatcgactt 480
acgcgtgcgc aggccgacgc acaggaactg aagaatgcca gagactccgc tgaagtggtg 540
gaaaccgcat tctgtacttt cgtgctgtcg cggatcgcag gtgaaattgc cagtattctc 600
gacgggctcc ccctgtcggt gcagcggcgt tttccggaac tggaaaaccg acatgttgat 660
ttcctgaaac gggatatcat caaagccatg aacaaagcag ccgcgctgga tgaactgata 720
ccggggttgc tgagtgaata tatcgaacag tcaggttaac aggctgcggc attttgtccg 780
cgccgggctt cgctcactgt tcaggccgga gccacagacc gccgttgaat gggcggatgc 840
taattactat ctcccgaaag aatccgcata ccaggaaggg cgctgggaaa cactgccctt 900
tcagcgggcc atcatgaatg cgatgggcag cgactacatc cgtgaggtga atgtggtgaa 960
gtctgcccgt gtcggttatt ccaaaatgct gctgggtgtt tatgcctact ttatagagca 1020
taagcagcgc aacaccctta tctggttgcc gacggatggt gatgccgaga actttatgaa 1080
aacccacgtt gagccgacta ttcgtgatat tccgtcgctg ctggcgctgg ccccgtggta 1140
tggcaaaaag caccgggata acacgctcac catgaagcgt ttcactaatg ggcgtggctt 1200
ctggtgcctg ggcggtaaag cggcaaaaaa ctaccgtgaa aagtcggtgg atgtggcggg 1260
ttatgatgaa cttgctgctt ttgatgatga tattgaacag gaaggctctc cgacgttcct 1320
gggtgacaag cgtattgaag gctcggtctg gccaaagtcc atccgtggct ccacgccaaa 1380
agtgagaggc acctgtcaga ttgagcgtgc agccagtgaa tccccgcatt ttatgcgttt 1440
tcatgttgcc tgcccgcatt gcggggagga gcagtatctt aaatttggcg acaaagagac 1500
gccgtttggc ctcaaatgga cgccggatga cccctccagc gtgttttatc tctgcgagca 1560
taatgcctgc gtcatccgcc agcaggagct ggactttact gatgcccgtt atatctgcga 1620
aaagaccggg atctggaccc gtgatggcat tctctggttt tcgtcatccg gtgaagagat 1680
tgagccacct gacagtgtga cctttcacat ctggacagcg tacagcccgt tcaccacctg 1740
ggtgcagatt gtcaaagact ggatgaaaac gaaaggggat acgggaaaac gtaaaacctt 1800
cgtaaacacc acgctcggtg agacgtggga ggcgaaaatt ggcgaacgtc cggatgctga 1860
agtgatggca gagcggaaag agcattattc agcgcccgtt cctgaccgtg tggcttacct 1920
gaccgccggt atcgactccc agctggaccg ctacgaaatg cgcgtatggg gatgggggcc 1980
gggtgaggaa agctggctga ttgaccggca gattattatg ggccgccacg acgatgaaca 2040
gacgctgctg cgtgtggatg aggccatcaa taaaacctat acccgccgga atggtgcaga 2100
aatgtcgata tcccgtatct gctgggatac tggcgggatt gacccgacca ttgtgtatga 2160
acgctcgaaa aaacatgggc tgttccgggt gatccccatt aaaggggcat ccgtctacgg 2220
aaagccggtg gccagcatgc cacgtaagcg aaacaaaaac ggggtttacc ttaccgaaat 2280
cggtacggat accgcgaaag agcagattta taaccgcttc acactgacgc cggaagggga 2340
tgaaccgctt cccggtgccg ttcacttccc gaataacccg gatatttttg atctgaccga 2400
agcgcagcag ctgactgctg aagagcaggt cgaaaaatgg gtggatggca ggaaaaaaat 2460
actgtgggac agcaaaaagc gacgcaatga ggcactcgac tgcttcgttt atgcgctggc 2520
ggcgctgcgc atcagtattt cccgctggca gctggatctc agtgcgctgc tggcgagcct 2580
gcaggaagag gatggtgcag caaccaacaa gaaaacactg gcagattacg cccgtgcctt 2640
atccggagag gatgaatgac gcgacaggaa gaacttgccg ctgcccgtgc ggcactgcat 2700
gacctgatga caggtaaacg ggtggcaaca gtacagaaag acggacgaag ggtggagttt 2760
acggccactt ccgtgtctga cctgaaaaaa tatattgcag agctggaagt gcagaccggc 2820
atgacacagc gacgcagggg acctgcagga ttttatgtat gaaaacgccc accattccca 2880
cccttctggg gccggacggc atgacatcgc tgcgcgaata tgccggttat cacggcggtg 2940
gcagcggatt tggagggcag ttgcggtcgt ggaacccacc gagtgaaagt gtggatgcag 3000
ccctgttgcc caactttacc cgtggcaatg cccgcgcaga cgatctggta cgcaataacg 3060
gctatgccgc caacgccatc cagctgcatc aggatcatat cgtcgggtct tttttccggc 3120
tcagtcatcg cccaagctgg cgctatctgg gcatcgggga ggaagaagcc cgtgcctttt 3180
cccgcgaggt tgaagcggca tggaaagagt ttgccgagga tgactgctgc tgcattgacg 3240
ttgagcgaaa acgcacgttt accatgatga ttcgggaagg tgtggccatg cacgccttta 3300
acggtgaact gttcgttcag gccacctggg ataccagttc gtcgcggctt ttccggacac 3360
agttccggat ggtcagcccg aagcgcatca gcaacccgaa caataccggc gacagccgga 3420
actgccgtgc cggtgtgcag attaatgaca gcggtgcggc gctgggatat tacgtcagcg 3480
aggacgggta tcctggctgg atgccgcaga aatggacatg gataccccgt gagttacccg 3540
gcgggcgcgc ctcgttcatt cacgtttttg aacccgtgga ggacgggcag actcgcggtg 3600
caaatgtgtt ttacagcgtg atggagcaga tgaagatgct cgacacgctg cagaacacgc 3660
agctgcagag cgccattgtg aaggcgatgt atgccgccac cattgagagt gagctggata 3720
cgcagtcagc gatggatttt attctgggcg cgaacagtca ggagcagcgg gaaaggctga 3780
ccggctggat tggtgaaatt gccgcgtatt acgccgcagc gccggtccgg ctgggaggcg 3840
caaaagtacc gcacctgatg ccgggtgact cactgaacct gcagacggct caggatacgg 3900
ataacggcta ctccgtgttt gagcagtcac tgctgcggta tatcgctgcc gggctgggtg 3960
tctcgtatga gcagctttcc cggaattacg cccagatgag ctactccacg gcacgggcca 4020
gtgcgaacga gtcgtgggcg tactttatgg ggcggcgaaa attcgtcgca tcccgtcagg 4080
cgagccagat gtttctgtgc tggctggaag aggccatcgt tcgccgcgtg gtgacgttac 4140
cttcaaaagc gcgcttcagt tttcaggaag cccgcagtgc ctgggggaac tgcgactgga 4200
taggctccgg tcgtatggcc atcgatggtc tgaaagaagt tcaggaagcg gtgatgctga 4260
tagaagccgg actgagtacc tacgagaaag agtgcgcaaa acgcggtgac gactatcagg 4320
aaatttttgc ccagcaggtc cgtgaaacga tggagcgccg tgcagccggt cttaaaccgc 4380
ccgcctgggc ggctgcagca tttgaatccg ggctgcgaca atcaacagag gaggagaaga 4440
gtgacagcag agctgcgtaa tctcccgcat attgccagca tggcctttaa tgagccgctg 4500
atgcttgaac ccgcctatgc gcgggttttc ttttgtgcgc ttgcaggcca gcttgggatc 4560
agcagcctga cggatgcggt gtccggcgac agcctgactg cccaggaggc actcgcgacg 4620
ctggcattat ccggtgatga tgacggacca cgacaggccc gcagttatca ggtcatgaac 4680
ggcatcgccg tgctgccggt gtccggcacg ctggtcagcc ggacgcgggc gctgcagccg 4740
tactcgggga tgaccggtta caacggcatt atcgcccgtc tgcaacaggc tgccagcgat 4800
ccgatggtgg acggcattct gctcgatatg gacacgcccg gcgggatggt ggcgggggca 4860
tttgactgcg ctgacatcat cgcccgtgtg cgtgacataa aaccggtatg ggcgcttgcc 4920
aacgacatga actgcagtgc aggtcagttg cttgccagtg ccgcctcccg gcgtctggtc 4980
acgcagaccg cccggacagg ctccatcggc gtcatgatgg ctcacagtaa ttacggtgct 5040
gcgctggaga aacagggtgt ggaaatcacg ctgatttaca gcggcagcca taaggtggat 5100
ggcaacccct acagccatct tccggatgac gtccgggaga cactgcagtc ccggatggac 5160
gcaacccgcc agatgtttgc gcagaaggtg tcggcatata ccggcctgtc cgtgcaggtt 5220
gtgctggata ccgaggctgc agtgtacagc ggtcaggagg ccattgatgc cggactggct 5280
gatgaacttg ttaacagcac cgatgcgatc accgtcatgc gtgatgcact ggatgcacgt 5340
aaatcccgtc tctcaggagg gcgaatgacc aaagagactc aatcaacaac tgtttcagcc 5400
actgcttcgc aggctgacgt tactgacgtg gtgccagcga cggagggcga gaacgccagc 5460
gcggcgcagc cggacgtgaa cgcgcagatc accgcagcgg ttgcggcaga aaacagccgc 5520
attatgggga tcctcaactg tgaggaggct cacggacgcg aagaacaggc acgcgtgctg 5580
gcagaaaccc ccggtatgac cgtgaaaacg gcccgccgca ttctggccgc agcaccacag 5640
agtgcacagg cgcgcagtga cactgcgctg gatcgtctga tgcagggggc accggcaccg 5700
ctggctgcag gtaacccggc atctgatgcc gttaacgatt tgctgaacac accagtgtaa 5760
gggatgttta tgacgagcaa agaaaccttt acccattacc agccgcaggg caacagtgac 5820
ccggctcata ccgcaaccgc gcccggcgga ttgagtgcga aagcgcctgc aatgaccccg 5880
ctgatgctgg acacctccag ccgtaagctg gttgcgtggg atggcaccac cgacggtgct 5940
gccgttggca ttcttgcggt tgctgctgac cagaccagca ccacgctgac gttctacaag 6000
tccggcacgt tccgttatga ggatgtgctc tggccggagg ctgccagcga cgagacgaaa 6060
aaacggaccg cgtttgccgg aacggcaatc agcatcgttt aactttaccc ttcatcacta 6120
aaggccgcct gtgcggcttt ttttacggga tttttttatg tcgatgtaca caaccgccca 6180
actgctggcg gcaaatgagc agaaatttaa gtttgatccg ctgtttctgc gtctcttttt 6240
ccgtgagagc tatcccttca ccacggagaa agtctatctc tcacaaattc cgggactggt 6300
aaacatggcg ctgtacgttt cgccgattgt ttccggtgag gttatccgtt cccgtggcgg 6360
ctccacctct gaatttacgc cgggatatgt caagccgaag catgaagtga atccgcagat 6420
gaccctgcgt cgcctgccgg atgaagatcc gcagaatctg gcggacccgg cttaccgccg 6480
ccgtcgcatc atcatgcaga acatgcgtga cgaagagctg gccattgctc aggtcgaaga 6540
gatgcaggca gtttctgccg tgcttaaggg caaatacacc atgaccggtg aagccttcga 6600
tccggttgag gtggatatgg gccgcagtga ggagaataac atcacgcagt ccggcggcac 6660
ggagtggagc aagcgtgaca agtccacgta tgacccgacc gacgatatcg aagcctacgc 6720
gctgaacgcc agcggtgtgg tgaatatcat cgtgttcgat ccgaaaggct gggcgctgtt 6780
ccgttccttc aaagccgtca aggagaagct ggatacccgt cgtggctcta attccgagct 6840
ggagacagcg gtgaaagacc tgggcaaagc ggtgtcctat aaggggatgt atggcgatgt 6900
ggccatcgtc gtgtattccg gacagtacgt ggaaaacggc gtcaaaaaga acttcctgcc 6960
ggacaacacg atggtgctgg ggaacactca ggcacgcggt ctgcgcacct atggctgcat 7020
tcaggatgcg gacgcacagc gcgaaggcat taacgcctct gcccgttacc cgaaaaactg 7080
ggtgaccacc ggcgatccgg cgcgtgagtt caccatgatt cagtcagcac cgctgatgct 7140
gctggctgac cctgatgagt tcgtgtccgt acaactggcg taatcatggc ccttcggggc 7200
cattgtttct ctgtggagga gtccatgacg aaagatgaac tgattgcccg tctccgctcg 7260
ctgggtgaac aactgaaccg tgatgtcagc ctgacgggga cgaaagaaga actggcgctc 7320
cgtgtggcag agctgaaaga ggagcttgat gacacggatg aaactgccgg tcaggacacc 7380
cctctcagcc gggaaaatgt gctgaccgga catgaaaatg aggtgggatc agcgcagccg 7440
gataccgtga ttctggatac gtctgaactg gtcacggtcg tggcactggt gaagctgcat 7500
actgatgcac ttcacgccac gcgggatgaa cctgtggcat ttgtgctgcc gggaacggcg 7560
tttcgtgtct ctgccggtgt ggcagccgaa atgacagagc gcggcctggc cagaatgcaa 7620
taacgggagg cgctgtggct gatttcgata acctgttcga tgctgccatt gcccgcgccg 7680
atgaaacgat acgcgggtac atgggaacgt cagccaccat tacatccggt gagcagtcag 7740
gtgcggtgat acgtggtgtt tttgatgacc ctgaaaatat cagctatgcc ggacagggcg 7800
tgcgcgttga aggctccagc ccgtccctgt ttgtccggac tgatgaggtg cggcagctgc 7860
ggcgtggaga cacgctgacc atcggtgagg aaaatttctg ggtagatcgg gtttcgccgg 7920
atgatggcgg aagttgtcat ctctggcttg gacggggcgt accgcctgcc gttaaccgtc 7980
gccgctgaaa gggggatgta tggccataaa aggtcttgag caggccgttg aaaacctcag 8040
ccgtatcagc aaaacggcgg tgcctggtgc cgccgcaatg gccattaacc gcgttgcttc 8100
atccgcgata tcgcagtcgg cgtcacaggt tgcccgtgag acaaaggtac gccggaaact 8160
ggtaaaggaa agggccaggc tgaaaagggc cacggtcaaa aatccgcagg ccagaatcaa 8220
agttaaccgg ggggatttgc ccgtaatcaa gctgggtaat gcgcgggttg tcctttcgcg 8280
ccgcaggcgt cgtaaaaagg ggcagcgttc atccctgaaa ggtggcggca gcgtgcttgt 8340
ggtgggtaac cgtcgtattc ccggcgcgtt tattcagcaa ctgaaaaatg gccggtggca 8400
tgtcatgcag cgtgtggctg ggaaaaaccg ttaccccatt gatgtggtga aaatcccgat 8460
ggcggtgccg ctgaccacgg cgtttaaaca aaatattgag cggatacggc gtgaacgtct 8520
tccgaaagag ctgggctatg cgctgcagca tcaactgagg atggtaataa agcgatgaaa 8580
catactgaac tccgtgcagc cgtactggat gcactggaga agcatgacac cggggcgacg 8640
ttttttgatg gtcgccccgc tgtttttgat gaggcggatt ttccggcagt tgccgtttat 8700
ctcaccggcg ctgaatacac gggcgaagag ctggacagcg atacctggca ggcggagctg 8760
catatcgaag ttttcctgcc tgctcaggtg ccggattcag agctggatgc gtggatggag 8820
tcccggattt atccggtgat gagcgatatc ccggcactgt cagatttgat caccagtatg 8880
gtggccagcg gctatgacta ccggcgcgac gatgatgcgg gcttgtggag ttcagccgat 8940
ctgacttatg tcattaccta tgaaatgtga ggacgctatg cctgtaccaa atcctacaat 9000
gccggtgaaa ggtgccggga ccaccctgtg ggtttataag gggagcggtg acccttacgc 9060
gaatccgctt tcagacgttg actggtcgcg tctggcaaaa gttaaagacc tgacgcccgg 9120
cgaactgacc gctgagtcct atgacgacag ctatctcgat gatgaagatg cagactggac 9180
tgcgaccggg caggggcaga aatctgccgg agataccagc ttcacgctgg cgtggatgcc 9240
cggagagcag gggcagcagg cgctgctggc gtggtttaat gaaggcgata cccgtgccta 9300
taaaatccgc ttcccgaacg gcacggtcga tgtgttccgt ggctgggtca gcagtatcgg 9360
taaggcggtg acggcgaagg aagtgatcac ccgcacggtg aaagtcacca atgtgggacg 9420
tccgtcgatg gcagaagatc gcagcacggt aacagcggca accggcatga ccgtgacgcc 9480
tgccagcacc tcggtggtga aagggcagag caccacgctg accgtggcct tccagccgga 9540
gggcgtaacc gacaagagct ttcgtgcggt gtctgcggat aaaacaaaag ccaccgtgtc 9600
ggtcagtggt atgaccatca ccgtgaacgg cgttgctgca ggcaaggtca acattccggt 9660
tgtatccggt aatggtgagt ttgctgcggt tgcagaaatt accgtcaccg ccagttaatc 9720
cggagagtca gcgatgttcc tgaaaaccga atcatttgaa cataacggtg tgaccgtcac 9780
gctttctgaa ctgtcagccc tgcagcgcat tgagcatctc gccctgatga aacggcaggc 9840
agaacaggcg gagtcagaca gcaaccggaa gtttactgtg gaagacgcca tcagaaccgg 9900
cgcgtttctg gtggcgatgt ccctgtggca taaccatccg cagaagacgc agatgccgtc 9960
catgaatgaa gccgttaaac agattgagca ggaagtgctt accacctggc ccacggaggc 10020
aatttctcat gctgaaaacg tggtgtaccg gctgtctggt atgtatgagt ttgtggtgaa 10080
taatgcccct gaacagacag aggacgccgg gcccgcagag cctgtttctg cgggaaagtg 10140
ttcgacggtg agctgagttt tgccctgaaa ctggcgcgtg agatggggcg acccgactgg 10200
cgtgccatgc ttgccgggat gtcatccacg gagtatgccg actggcaccg cttttacagt 10260
acccattatt ttcatgatgt tctgctggat atgcactttt ccgggctgac gtacaccgtg 10320
ctcagcctgt ttttcagcga tccggatatg catccgctgg atttcagtct gctgaaccgg 10380
cgcgaggctg acgaagagcc tgaagatgat gtgctgatgc agaaagcggc agggcttgcc 10440
ggaggtgtcc gctttggccc ggacgggaat gaagttatcc ccgcttcccc ggatgtggcg 10500
gacatgacgg aggatgacgt aatgctgatg acagtatcag aagggatcgc aggaggagtc 10560
cggtatggct gaaccggtag gcgatctggt cgttgatttg agtctggatg cggccagatt 10620
tgacgagcag atggccagag tcaggcgtca tttttctggt acggaaagtg atgcgaaaaa 10680
aacagcggca gtcgttgaac agtcgctgag ccgacaggcg ctggctgcac agaaagcggg 10740
gatttccgtc gggcagtata aagccgccat gcgtatgctg cctgcacagt tcaccgacgt 10800
ggccacgcag cttgcaggcg ggcaaagtcc gtggctgatc ctgctgcaac agggggggca 10860
ggtgaaggac tccttcggcg ggatgatccc catgttcagg gggcttgccg gtgcgatcac 10920
cctgccgatg gtgggggcca cctcgctggc ggtggcgacc ggtgcgctgg cgtatgcctg 10980
gtatcagggc aactcaaccc tgtccgattt caacaaaacg ctggtccttt ccggcaatca 11040
ggcgggactg acggcagatc gtatgctggt cctgtccaga gccgggcagg cggcagggct 11100
gacgtttaac cagaccagcg agtcactcag cgcactggtt aaggcggggg taagcggtga 11160
ggctcagatt gcgtccatca gccagagtgt ggcgcgtttc tcctctgcat ccggcgtgga 11220
ggtggacaag gtcgctgaag ccttcgggaa gctgaccaca gacccgacgt cggggctgac 11280
ggcgatggct cgccagttcc ataacgtgtc ggcggagcag attgcgtatg ttgctcagtt 11340
gcagcgttcc ggcgatgaag ccggggcatt gcaggcggcg aacgaggccg caacgaaagg 11400
gtttgatgac cagacccgcc gcctgaaaga gaacatgggc acgctggaga cctgggcaga 11460
caggactgcg cgggcattca aatccatgtg ggatgcggtg ctggatattg gtcgtcctga 11520
taccgcgcag gagatgctga ttaaggcaga ggctgcgtat aagaaagcag acgacatctg 11580
gaatctgcgc aaggatgatt attttgttaa cgatgaagcg cgggcgcgtt actgggatga 11640
tcgtgaaaag gcccgtcttg cgcttgaagc cgcccgaaag aaggctgagc agcagactca 11700
acaggacaaa aatgcgcagc agcagagcga taccgaagcg tcacggctga aatataccga 11760
agaggcgcag aaggcttacg aacggctgca gacgccgctg gagaaatata ccgcccgtca 11820
ggaagaactg aacaaggcac tgaaagacgg gaaaatcctg caggcggatt acaacacgct 11880
gatggcggcg gcgaaaaagg attatgaagc gacgctgaaa aagccgaaac agtccagcgt 11940
gaaggtgtct gcgggcgatc gtcaggaaga cagtgctcat gctgccctgc tgacgcttca 12000
ggcagaactc cggacgctgg agaagcatgc cggagcaaat gagaaaatca gccagcagcg 12060
ccgggatttg tggaaggcgg agagtcagtt cgcggtactg gaggaggcgg cgcaacgtcg 12120
ccagctgtct gcacaggaga aatccctgct ggcgcataaa gatgagacgc tggagtacaa 12180
acgccagctg gctgcacttg gcgacaaggt tacgtatcag gagcgcctga acgcgctggc 12240
gcagcaggcg gataaattcg cacagcagca acgggcaaaa cgggccgcca ttgatgcgaa 12300
aagccggggg ctgactgacc ggcaggcaga acgggaagcc acggaacagc gcctgaagga 12360
acagtatggc gataatccgc tggcgctgaa taacgtcatg tcagagcaga aaaagacctg 12420
ggcggctgaa gaccagcttc gcgggaactg gatggcaggc ctgaagtccg gctggagtga 12480
gtgggaagag agcgccacgg acagtatgtc gcaggtaaaa agtgcagcca cgcagacctt 12540
tgatggtatt gcacagaata tggcggcgat gctgaccggc agtgagcaga actggcgcag 12600
cttcacccgt tccgtgctgt ccatgatgac agaaattctg cttaagcagg caatggtggg 12660
gattgtcggg agtatcggca gcgccattgg cggggctgtt ggtggcggcg catccgcgtc 12720
aggcggtaca gccattcagg ccgctgcggc gaaattccat tttgcaaccg gaggatttac 12780
gggaaccggc ggcaaatatg agccagcggg gattgttcac cgtggtgagt ttgtcttcac 12840
gaaggaggca accagccgga ttggcgtggg gaatctttac cggctgatgc gcggctatgc 12900
caccggcggt tatgtcggta caccgggcag catggcagac agccggtcgc aggcgtccgg 12960
gacgtttgag cagaataacc atgtggtgat taacaacgac ggcacgaacg ggcagatagg 13020
tccggctgct ctgaaggcgg tgtatgacat ggcccgcaag ggtgcccgtg atgaaattca 13080
gacacagatg cgtgatggtg gcctgttctc cggaggtgga cgatgaagac cttccgctgg 13140
aaagtgaaac ccggtatgga tgtggcttcg gtcccttctg taagaaaggt gcgctttggt 13200
gatggctatt ctcagcgagc gcctgccggg ctgaatgcca acctgaaaac gtacagcgtg 13260
acgctttctg tcccccgtga ggaggccacg gtactggagt cgtttctgga agagcacggg 13320
ggctggaaat cctttctgtg gacgccgcct tatgagtggc ggcagataaa ggtgacctgc 13380
gcaaaatggt cgtcgcgggt cagtatgctg cgtgttgagt tcagcgcaga gtttgaacag 13440
gtggtgaact gatgcaggat atccggcagg aaacactgaa tgaatgcacc cgtgcggagc 13500
agtcggccag cgtggtgctc tgggaaatcg acctgacaga ggtcggtgga gaacgttatt 13560
ttttctgtaa tgagcagaac gaaaaaggtg agccggtcac ctggcagggg cgacagtatc 13620
agccgtatcc cattcagggg agcggttttg aactgaatgg caaaggcacc agtacgcgcc 13680
ccacgctgac ggtttctaac ctgtacggta tggtcaccgg gatggcggaa gatatgcaga 13740
gtctggtcgg cggaacggtg gtccggcgta aggtttacgc ccgttttctg gatgcggtga 13800
acttcgtcaa cggaaacagt tacgccgatc cggagcagga ggtgatcagc cgctggcgca 13860
ttgagcagtg cagcgaactg agcgcggtga gtgcctcctt tgtactgtcc acgccgacgg 13920
aaacggatgg cgctgttttt ccgggacgta tcatgctggc caacacctgc acctggacct 13980
atcgcggtga cgagtgcggt tatagcggtc cggctgtcgc ggatgaatat gaccagccaa 14040
cgtccgatat cacgaaggat aaatgcagca aatgcctgag cggttgtaag ttccgcaata 14100
acgtcggcaa ctttggcggc ttcctttcca ttaacaaact ttcgcagtaa atcccatgac 14160
acagacagaa tcagcgattc tggcgcacgc ccggcgatgt gcgccagcgg agtcgtgcgg 14220
cttcgtggta agcacgccgg agggggaaag atatttcccc tgcgtgaata tctccggtga 14280
gccggaggct atttccgtat gtcgccggaa gactggctgc aggcagaaat gcagggtgag 14340
attgtggcgc tggtccacag ccaccccggt ggtctgccct ggctgagtga ggccgaccgg 14400
cggctgcagg tgcagagtga tttgccgtgg tggctggtct gccgggggac gattcataag 14460
ttccgctgtg tgccgcatct caccgggcgg cgctttgagc acggtgtgac ggactgttac 14520
acactgttcc gggatgctta tcatctggcg gggattgaga tgccggactt tcatcgtgag 14580
gatgactggt ggcgtaacgg ccagaatctc tatctggata atctggaggc gacggggctg 14640
tatcaggtgc cgttgtcagc ggcacagccg ggcgatgtgc tgctgtgctg ttttggttca 14700
tcagtgccga atcacgccgc aatttactgc ggcgacggcg agctgctgca ccatattcct 14760
gaacaactga gcaaacgaga gaggtacacc gacaaatggc agcgacgcac acactccctc 14820
tggcgtcacc gggcatggcg cgcatctgcc tttacgggga tttacaacga tttggtcgcc 14880
gcatcgacct tcgtgtgaaa acgggggctg aagccatccg ggcactggcc acacagctcc 14940
cggcgtttcg tcagaaactg agcgacggct ggtatcaggt acggattgcc gggcgggacg 15000
tcagcacgtc cgggttaacg gcgcagttac atgagactct gcctgatggc gctgtaattc 15060
atattgttcc cagagtcgcc ggggccaagt caggtggcgt attccagatt gtcctggggg 15120
ctgccgccat tgccggatca ttctttaccg ccggagccac ccttgcagca tggggggcag 15180
ccattggggc cggtggtatg accggcatcc tgttttctct cggtgccagt atggtgctcg 15240
gtggtgtggc gcagatgctg gcaccgaaag ccagaactcc ccgtatacag acaacggata 15300
acggtaagca gaacacctat ttctcctcac tggataacat ggttgcccag ggcaatgttc 15360
tgcctgttct gtacggggaa atgcgcgtgg ggtcacgcgt ggtttctcag gagatcagca 15420
cggcagacga aggggacggt ggtcaggttg tggtgattgg tcgctgatgc aaaatgtttt 15480
atgtgaaacc gcctgcgggc ggttttgtca tttatggagc gtgaggaatg ggtaaaggaa 15540
gcagtaaggg gcataccccg cgcgaagcga aggacaacct gaagtccacg cagttgctga 15600
gtgtgatcga tgccatcagc gaagggccga ttgaaggtcc ggtggatggc ttaaaaagcg 15660
tgctgctgaa cagtacgccg gtgctggaca ctgaggggaa taccaacata tccggtgtca 15720
cggtggtgtt ccgggctggt gagcaggagc agactccgcc ggagggattt gaatcctccg 15780
gctccgagac ggtgctgggt acggaagtga aatatgacac gccgatcacc cgcaccatta 15840
cgtctgcaaa catcgaccgt ctgcgcttta ccttcggtgt acaggcactg gtggaaacca 15900
cctcaaaggg tgacaggaat ccgtcggaag tccgcctgct ggttcagata caacgtaacg 15960
gtggctgggt gacggaaaaa gacatcacca ttaagggcaa aaccacctcg cagtatctgg 16020
cctcggtggt gatgggtaac ctgccgccgc gcccgtttaa tatccggatg cgcaggatga 16080
cgccggacag caccacagac cagctgcaga acaaaacgct ctggtcgtca tacactgaaa 16140
tcatcgatgt gaaacagtgc tacccgaaca cggcactggt cggcgtgcag gtggactcgg 16200
agcagttcgg cagccagcag gtgagccgta attatcatct gcgcgggcgt attctgcagg 16260
tgccgtcgaa ctataacccg cagacgcggc aatacagcgg tatctgggac ggaacgttta 16320
aaccggcata cagcaacaac atggcctggt gtctgtggga tatgctgacc catccgcgct 16380
acggcatggg gaaacgtctt ggtgcggcgg atgtggataa atgggcgctg tatgtcatcg 16440
gccagtactg cgaccagtca gtgccggacg gctttggcgg cacggagccg cgcatcacct 16500
gtaatgcgta cctgaccaca cagcgtaagg cgtgggatgt gctcagcgat ttctgctcgg 16560
cgatgcgctg tatgccggta tggaacgggc agacgctgac gttcgtgcag gaccgaccgt 16620
cggataagac gtggacctat aaccgcagta atgtggtgat gccggatgat ggcgcgccgt 16680
tccgctacag cttcagcgcc ctgaaggacc gccataatgc cgttgaggtg aactggattg 16740
acccgaacaa cggctgggag acggcgacag agcttgttga agatacgcag gccattgccc 16800
gttacggtcg taatgttacg aagatggatg cctttggctg taccagccgg gggcaggcac 16860
accgcgccgg gctgtggctg attaaaacag aactgctgga aacgcagacc gtggatttca 16920
gcgtcggcgc agaagggctt cgccatgtac cgggcgatgt tattgaaatc tgcgatgatg 16980
actatgccgg tatcagcacc ggtggtcgtg tgctggcggt gaacagccag acccggacgc 17040
tgacgctcga ccgtgaaatc acgctgccat cctccggtac cgcgctgata agcctggttg 17100
acggaagtgg caatccggtc agcgtggagg ttcagtccgt caccgacggc gtgaaggtaa 17160
aagtgagccg tgttcctgac ggtgttgctg aatacagcgt atgggagctg aagctgccga 17220
cgctgcgcca gcgactgttc cgctgcgtga gtatccgtga gaacgacgac ggcacgtatg 17280
ccatcaccgc cgtgcagcat gtgccggaaa aagaggccat cgtggataac ggggcgcact 17340
ttgacggcga acagagtggc acggtgaatg gtgtcacgcc gccagcggtg cagcacctga 17400
ccgcagaagt cactgcagac agcggggaat atcaggtgct ggcgcgatgg gacacaccga 17460
aggtggtgaa gggcgtgagt ttcctgctcc gtctgaccgt aacagcggac gacggcagtg 17520
agcggctggt cagcacggcc cggacgacgg aaaccacata ccgcttcacg caactggcgc 17580
tggggaacta caggctgaca gtccgggcgg taaatgcgtg ggggcagcag ggcgatccgg 17640
cgtcggtatc gttccggatt gccgcaccgg cagcaccgtc gaggattgag ctgacgccgg 17700
gctattttca gataaccgcc acgccgcatc ttgccgttta tgacccgacg gtacagtttg 17760
agttctggtt ctcggaaaag cagattgcgg atatcagaca ggttgaaacc agcacgcgtt 17820
atcttggtac ggcgctgtac tggatagccg ccagtatcaa tatcaaaccg ggccatgatt 17880
attactttta tatccgcagt gtgaacaccg ttggcaaatc ggcattcgtg gaggccgtcg 17940
gtcgggcgag cgatgatgcg gaaggttacc tggatttttt caaaggcaag ataaccgaat 18000
cccatctcgg caaggagctg ctggaaaaag tcgagctgac ggaggataac gccagcagac 18060
tggaggagtt ttcgaaagag tggaaggatg ccagtgataa gtggaatgcc atgtgggctg 18120
tcaaaattga gcagaccaaa gacggcaaac attatgtcgc gggtattggc ctcagcatgg 18180
aggacacgga ggaaggcaaa ctgagccagt ttctggttgc cgccaatcgt atcgcattta 18240
ttgacccggc aaacgggaat gaaacgccga tgtttgtggc gcagggcaac cagatattca 18300
tgaacgacgt gttcctgaag cgcctgacgg cccccaccat taccagcggc ggcaatcctc 18360
cggccttttc cctgacaccg gacggaaagc tgaccgctaa aaatgcggat atcagtggca 18420
gtgtgaatgc gaactccggg acgctcagta atgtgacgat agctgaaaac tgtacgataa 18480
acggtacgct gagggcggaa aaaatcgtcg gggacattgt aaaggcggcg agcgcggctt 18540
ttccgcgcca gcgtgaaagc agtgtggact ggccgtcagg tacccgtact gtcaccgtga 18600
ccgatgacca tccttttgat cgccagatag tggtgcttcc gctgacgttt cgcggaagta 18660
agcgtactgt cagcggcagg acaacgtatt cgatgtgtta tctgaaagta ctgatgaacg 18720
gtgcggtgat ttatgatggc gcggcgaacg aggcggtaca ggtgttctcc cgtattgttg 18780
acatgccagc gggtcgggga aacgtgatcc tgacgttcac gcttacgtcc acacggcatt 18840
cggcagatat tccgccgtat acgtttgcca gcgatgtgca ggttatggtg attaagaaac 18900
aggcgctggg catcagcgtg gtctgagtgt gttacagagg ttcgtccggg aacgggcgtt 18960
ttattataaa acagtgagag gtgaacgatg cgtaatgtgt gtattgccgt tgctgtcttt 19020
gccgcacttg cggtgacagt cactccggcc cgtgcggaag gtggacatgg tacgtttacg 19080
gtgggctatt ttcaagtgaa accgggtaca ttgccgtcgt tgtcgggcgg ggataccggt 19140
gtgagtcatc tgaaagggat taacgtgaag taccgttatg agctgacgga cagtgtgggg 19200
gtgatggctt ccctggggtt cgccgcgtcg aaaaagagca gcacagtgat gaccggggag 19260
gatacgtttc actatgagag cctgcgtgga cgttatgtga gcgtgatggc cggaccggtt 19320
ttacaaatca gtaagcaggt cagtgcgtac gccatggccg gagtggctca cagtcggtgg 19380
tccggcagta caatggatta ccgtaagacg gaaatcactc ccgggtatat gaaagagacg 19440
accactgcca gggacgaaag tgcaatgcgg catacctcag tggcgtggag tgcaggtata 19500
cagattaatc cggcagcgtc cgtcgttgtt gatattgctt atgaaggctc cggcagtggc 19560
gactggcgta ctgacggatt catcgttggg gtcggttata aattctgatt agccaggtaa 19620
cacagtgtta tgacagcccg ccggaaccgg tgggcttttt tgtggggtga atatggcagt 19680
aaagatttca ggagtcctga aagacggcac aggaaaaccg gtacagaact gcaccattca 19740
gctgaaagcc agacgtaaca gcaccacggt ggtggtgaac acggtgggct cagagaatcc 19800
ggatgaagcc gggcgttaca gcatggatgt ggagtacggt cagtacagtg tcatcctgca 19860
ggttgacggt tttccaccat cgcacgccgg gaccatcacc gtgtatgaag attcacaacc 19920
ggggacgctg aatgattttc tctgtgccat gacggaggat gatgcccggc cggaggtgct 19980
gcgtcgtctt gaactgatgg tggaagaggt ggcgcgtaac gcgtccgtgg tggcacagag 20040
tacggcagac gcgaagaaat cagccggcga tgccagtgca tcagctgctc aggtcgcggc 20100
ccttgtgact gatgcaactg actcagcacg cgccgccagc acgtccgccg gacaggctgc 20160
atcgtcagct caggaagcgt cctccggcgc agaagcggca tcagcaaagg ccactgaagc 20220
ggaaaaaagt gccgcagccg cagagtcctc aaaaaacgcg gcggccacca gtgccggtgc 20280
ggcgaaaacg tcagaaacga atgctgcagc gtcacaacaa tcagccgcca cgtctgcctc 20340
caccgcggcc acgaaagcgt cagaggccgc cacttcagca cgagatgcgg tggcctcaaa 20400
agaggcagca aaatcatcag aaacgaacgc atcatcaagt gccggtcgtg cagcttcctc 20460
ggcaacggcg gcagaaaatt ctgccagggc ggcaaaaacg tccgagacga atgccaggtc 20520
atctgaaaca gcagcggaac ggagcgcctc tgccgcggca gacgcaaaaa cagcggcggc 20580
ggggagtgcg tcaacggcat ccacgaaggc gacagaggct gcgggaagtg cggtatcagc 20640
atcgcagagc aaaagtgcgg cagaagcggc ggcaatacgt gcaaaaaatt cggcaaaacg 20700
tgcagaagat atagcttcag ctgtcgcgct tgaggatgcg gacacaacga gaaaggggat 20760
agtgcagctc agcagtgcaa ccaacagcac gtctgaaacg cttgctgcaa cgccaaaggc 20820
ggttaaggtg gtaatggatg aaacgaacag aaaagcccac tggacagtcc ggcactgacc 20880
ggaacgccaa cagcaccaac cgcgctcagg ggaacaaaca atacccagat tgcgaacacc 20940
gcttttgtac tggccgcgat tgcagatgtt atcgacgcgt cacctgacgc actgaatacg 21000
ctgaatgaac tggccgcagc gctcgggaat gatccagatt ttgctaccac catgactaac 21060
gcgcttgcgg gtaaacaacc gaagaatgcg acactgacgg cgctggcagg gctttccacg 21120
gcgaaaaata aattaccgta ttttgcggaa aatgatgccg ccagcctgac tgaactgact 21180
caggttggca gggatattct ggcaaaaaat tccgttgcag atgttcttga ataccttggg 21240
gccggtgaga attcggcctt tccggcaggt gcgccgatcc cgtggccatc agatatcgtt 21300
ccgtctggct acgtcctgat gcaggggcag gcgtttgaca aatcagccta cccaaaactt 21360
gctgtcgcgt atccatcggg tgtgcttcct gatatgcgag gctggacaat caaggggaaa 21420
cccgccagcg gtcgtgctgt attgtctcag gaacaggatg gaattaagtc gcacacccac 21480
agtgccagtg catccggtac ggatttgggg acgaaaacca catcgtcgtt tgattacggg 21540
acgaaaacaa caggcagttt cgattacggc accaaatcga cgaataacac gggggctcat 21600
gctcacagtc tgagcggttc aacaggggcc gcgggtgctc atgcccacac aagtggttta 21660
aggatgaaca gttctggctg gagtcagtat ggaacagcaa ccattacagg aagtttatcc 21720
acagttaaag gaaccagcac acagggtatt gcttatttat cgaaaacgga cagtcagggc 21780
agccacagtc actcattgtc cggtacagcc gtgagtgccg gtgcacatgc gcatacagtt 21840
ggtattggtg cgcaccagca tccggttgtt atcggtgctc atgcccattc tttcagtatt 21900
ggttcacacg gacacaccat caccgttaac gctgcgggta acgcggaaaa caccgtcaaa 21960
aacattgcat ttaactatat tgtgaggctt gcataatggc attcagaatg agtgaacaac 22020
cacggaccat aaaaatttat aatctgctgg ccggaactaa tgaatttatt ggtgaaggtg 22080
acgcatatat tccgcctcat accggtctgc ctgcaaacag taccgatatt gcaccgccag 22140
atattccggc tggctttgtg gctgttttca acagtgatga ggcatcgtgg catctcgttg 22200
aagaccatcg gggtaaaacc gtctatgacg tggcttccgg cgacgcgtta tttatttctg 22260
aactcggtcc gttaccggaa aattttacct ggttatcgcc gggaggggaa tatcagaagt 22320
ggaacggcac agcctgggtg aaggatacgg aagcagaaaa actgttccgg atccgggagg 22380
cggaagaaac aaaaaaaagc ctgatgcagg tagccagtga gcatattgcg ccgcttcagg 22440
atgctgcaga tctggaaatt gcaacgaagg aagaaacctc gttgctggaa gcctggaaga 22500
agtatcgggt gttgctgaac cgtgttgata catcaactgc acctgatatt gagtggcctg 22560
ctgtccctgt tatggagtaa tcgttttgtg atatgccgca gaaacgttgt atgaaataac 22620
gttctgcggt tagttagtat attgtaaagc tgagtattgg tttatttggc gattattatc 22680
ttcaggagaa taatggaagt tctatgactc aattgttcat agtgtttaca tcaccgccaa 22740
ttgcttttaa gactgaacgc atgaaatatg gtttttcgtc atgttttgag tctgctgttg 22800
atatttctaa agtcggtttt ttttcttcgt tttctctaac tattttccat gaaatacatt 22860
tttgattatt atttgaatca attccaatta cctgaagtct ttcatctata attggcattg 22920
tatgtattgg tttattggag tagatgcttg cttttctgag ccatagctct gatatccaaa 22980
tgaagccata ggcatttgtt attttggctc tgtcagctgc ataacgccaa aaaatatatt 23040
tatctgcttg atcttcaaat gttgtattga ttaaatcaat tggatggaat tgtttatcat 23100
aaaaaattaa tgtttgaatg tgataaccgt cctttaaaaa agtcgtttct gcaagcttgg 23160
ctgtatagtc aactaactct tctgtcgaag tgatattttt aggcttatct accagtttta 23220
gacgctcttt aatatcttca ggaattattt tattgtcata ttgtatcatg ctaaatgaca 23280
atttgcttat ggagtaatct tttaatttta aataagttat tctcctggct tcatcaaata 23340
aagagtcgaa tgatgttggc gaaatcacat cgtcacccat tggattgttt atttgtatgc 23400
caagagagtt acagcagtta tacattctgc catagattat agctaaggca tgtaataatt 23460
cgtaatcttt tagcgtatta gcgacccatc gtctttctga tttaataata gatgattcag 23520
ttaaatatga aggtaatttc ttttgtgcaa gtctgactaa cttttttata ccaatgttta 23580
acatactttc atttgtaata aactcaatgt cattttcttc aatgtaagat gaaataagag 23640
tagcctttgc ctcgctatac atttctaaat cgccttgttt ttctatcgta ttgcgagaat 23700
ttttagccca agccattaat ggatcatttt tccatttttc aataacatta ttgttatacc 23760
aaatgtcata tcctataatc tggtttttgt ttttttgaat aataaatgtt actgttcttg 23820
cggtttggag gaattgattc aaattcaagc gaaataattc agggtcaaaa tatgtatcaa 23880
tgcagcattt gagcaagtgc gataaatctt taagtcttct ttcccatggt tttttagtca 23940
taaaactctc cattttgata ggttgcatgc tagatgctga tatattttag aggtgataaa 24000
attaactgct taactgtcaa tgtaatacaa gttgtttgat ctttgcaatg attcttatca 24060
gaaaccatat agtaaattag ttacacagga aatttttaat attattatta tcattcatta 24120
tgtattaaaa ttagagttgt ggcttggctc tgctaacacg ttgctcatag gagatatggt 24180
agagccgcag acacgtcgta tgcaggaacg tgctgcggct ggctggtgaa cttccgatag 24240
tgcgggtgtt gaatgatttc cagttgctac cgattttaca tattttttgc atgagagaat 24300
ttgtaccacc tcccaccgac catctatgac tgtacgccac tgtccctagg actgctatgt 24360
gccggagcgg acattacaaa cgtccttctc ggtgcatgcc actgttgcca atgacctgcc 24420
taggaattgg ttagcaagtt actaccggat tttgtaaaaa cagccctcct catataaaaa 24480
gtattcgttc acttccgata agcgtcgtaa ttttctatct ttcatcatat tctagatccc 24540
tctgaaaaaa tcttccgagt ttgctaggca ctgatacata actcttttcc aataattggg 24600
gaagtcattc aaatctataa taggtttcag atttgcttca ataaattctg actgtagctg 24660
ctgaaacgtt gcggttgaac tatatttcct tataactttt acgaaagagt ttctttgagt 24720
aatcacttca ctcaagtgct tccctgcctc caaacgatac ctgttagcaa tatttaatag 24780
cttgaaatga tgaagagctc tgtgtttgtc ttcctgcctc cagttcgccg ggcattcaac 24840
ataaaaactg atagcacccg gagttccgga aacgaaattt gcatataccc attgctcacg 24900
aaaaaaaatg tccttgtcga tatagggatg aatcgcttgg tgtacctcat ctactgcgaa 24960
aacttgacct ttctctccca tattgcagtc gcggcacgat ggaactaaat taataggcat 25020
caccgaaaat tcaggataat gtgcaatagg aagaaaatga tctatatttt ttgtctgtcc 25080
tatatcacca caaaatggac atttttcacc tgatgaaaca agcatgtcat cgtaatatgt 25140
tctagcgggt ttgtttttat ctcggagatt attttcataa agcttttcta atttaacctt 25200
tgtcaggtta ccaactacta aggttgtagg ctcaagaggg tgtgtcctgt cgtaggtaaa 25260
taactgacct gtcgagctta atattctata ttgttgttct ttctgcaaaa aagtggggaa 25320
gtgagtaatg aaattatttc taacatttat ctgcatcata ccttccgagc atttattaag 25380
catttcgcta taagttctcg ctggaagagg tagttttttc attgtacttt accttcatct 25440
ctgttcatta tcatcgcttt taaaacggtt cgaccttcta atcctatctg accattataa 25500
ttttttagaa tggtttcata agaaagctct gaatcaacgg actgcgataa taagtggtgg 25560
tatccagaat ttgtcacttc aagtaaaaac acctcacgag ttaaaacacc taagttctca 25620
ccgaatgtct caatatccgg acggataata tttattgctt ctcttgaccg taggactttc 25680
cacatgcagg attttggaac ctcttgcagt actactgggg aatgagttgc aattattgct 25740
acaccattgc gtgcatcgag taagtcgctt aatgttcgta aaaaagcaga gagcaaaggt 25800
ggatgcagat gaacctctgg ttcatcgaat aaaactaatg acttttcgcc aacgacatct 25860
actaatcttg tgatagtaaa taaaacaatt gcatgtccag agctcattcg aagcagatat 25920
ttctggatat tgtcataaaa caatttagtg aatttatcat cgtccacttg aatctgtggt 25980
tcattacgtc ttaactcttc atatttagaa atgaggctga tgagttccat atttgaaaag 26040
ttttcatcac tacttagttt tttgatagct tcaagccaga gttgtctttt tctatctact 26100
ctcatacaac caataaatgc tgaaatgaat tctaagcgga gatcgcctag tgattttaaa 26160
ctattgctgg cagcattctt gagtccaata taaaagtatt gtgtaccttt tgctgggtca 26220
ggttgttctt taggaggagt aaaaggatca aatgcactaa acgaaactga aacaagcgat 26280
cgaaaatatc cctttgggat tcttgactcg ataagtctat tattttcaga gaaaaaatat 26340
tcattgtttt ctgggttggt gattgcacca atcattccat tcaaaattgt tgttttacca 26400
cacccattcc gcccgataaa agcatgaatg ttcgtgctgg gcatagaatt aaccgtcacc 26460
tcaaaaggta tagttaaatc actgaatccg ggagcacttt ttctattaaa tgaaaagtgg 26520
aaatctgaca attctggcaa accatttaac acacgtgcga actgtccatg aatttctgaa 26580
agagttaccc ctctaagtaa tgaggtgtta aggacgcttt cattttcaat gtcggctaat 26640
cgatttggcc atactactaa atcctgaata gctttaagaa ggttatgttt aaaaccatcg 26700
cttaatttgc tgagattaac atagtagtca atgctttcac ctaaggaaaa aaacatttca 26760
gggagttgac tgaatttttt atctattaat gaataagtgc ttacttcttc tttttgacct 26820
acaaaaccaa ttttaacatt tccgatatcg catttttcac catgctcatc aaagacagta 26880
agataaaaca ttgtaacaaa ggaatagtca ttccaaccat ctgctcgtag gaatgcctta 26940
tttttttcta ctgcaggaat atacccgcct ctttcaataa cactaaactc caacatatag 27000
taacccttaa ttttattaaa ataaccgcaa tttatttggc ggcaacacag gatctctctt 27060
ttaagttact ctctattaca tacgttttcc atctaaaaat tagtagtatt gaacttaacg 27120
gggcatcgta ttgtagtttt ccatatttag ctttctgctt ccttttggat aacccactgt 27180
tattcatgtt gcatggtgca ctgtttatac caacgatata gtctattaat gcatatatag 27240
tatcgccgaa cgattagctc ttcaggcttc tgaagaagcg tttcaagtac taataagccg 27300
atagatagcc acggacttcg tagccatttt tcataagtgt taacttccgc tcctcgctca 27360
taacagacat tcactacagt tatggcggaa aggtatgcat gctgggtgtg gggaagtcgt 27420
gaaagaaaag aagtcagctg cgtcgtttga catcactgct atcttcttac tggttatgca 27480
ggtcgtagtg ggtggcacac aaagctttgc actggattgc gaggctttgt gcttctctgg 27540
agtgcgacag gtttgatgac aaaaaattag cgcaagaaga caaaaatcac cttgcgctaa 27600
tgctctgtta caggtcacta ataccatcta agtagttgat tcatagtgac tgcatatgtt 27660
gtgttttaca gtattatgta gtctgttttt tatgcaaaat ctaatttaat atattgatat 27720
ttatatcatt ttacgtttct cgttcagctt ttttatacta agttggcatt ataaaaaagc 27780
attgcttatc aatttgttgc aacgaacagg tcactatcag tcaaaataaa atcattattt 27840
gatttcaatt ttgtcccact ccctgcctct gtcatcacga tactgtgatg ccatggtgtc 27900
cgacttatgc ccgagaagat gttgagcaaa cttatcgctt atctgcttct catagagtct 27960
tgcagacaaa ctgcgcaact cgtgaaaggt aggcggatcc ccttcgaagg aaagacctga 28020
tgcttttcgt gcgcgcataa aataccttga tactgtgccg gatgaaagcg gttcgcgacg 28080
agtagatgca attatggttt ctccgccaag aatctctttg catttatcaa gtgtttcctt 28140
cattgatatt ccgagagcat caatatgcaa tgctgttggg atggcaattt ttacgcctgt 28200
tttgctttgc tcgacataaa gatatccatc tacgatatca gaccacttca tttcgcataa 28260
atcaccaact cgttgcccgg taacaacagc cagttccatt gcaagtctga gccaacatgg 28320
tgatgattct gctgcttgat aaattttcag gtattcgtca gccgtaagtc ttgatctcct 28380
tacctctgat tttgctgcgc gagtggcagc gacatggttt gttgttatat ggccttcagc 28440
tattgcctct cggaatgcat cgctcagtgt tgatctgatt aacttggctg acgccgcctt 28500
gccctcgtct atgtatccat tgagcattgc cgcaatttct tttgtggtga tgtcttcaag 28560
tggagcatca ggcagacccc tccttattgc tttaattttg ctcatgtaat ttatgagtgt 28620
cttctgcttg attcctctgc tggccaggat tttttcgtag cgatcaagcc atgaatgtaa 28680
cgtaacggaa ttatcactgt tgattctcgc tgtcagaggc ttgtgtttgt gtcctgaaaa 28740
taactcaatg ttggcctgta tagcttcagt gattgcgatt cgcctgtctc tgcctaatcc 28800
aaactcttta cccgtccttg ggtccctgta gcagtaatat ccattgtttc ttatataaag 28860
gttagggggt aaatcccggc gctcatgact tcgccttctt cccatttctg atcctcttca 28920
aaaggccacc tgttactggt cgatttaagt caacctttac cgctgattcg tggaacagat 28980
actctcttcc atccttaacc ggaggtggga atatcctgca ttcccgaacc catcgacgaa 29040
ctgtttcaag gcttcttgga cgtcgctggc gtgcgttcca ctcctgaagt gtcaagtaca 29100
tcgcaaagtc tccgcaatta cacgcaagaa aaaaccgcca tcaggcggct tggtgttctt 29160
tcagttcttc aattcgaata ttggttacgt ctgcatgtgc tatctgcgcc catatcatcc 29220
agtggtcgta gcagtcgttg atgttctccg cttcgataac tctgttgaat ggctctccat 29280
tccattctcc tgtgactcgg aagtgcattt atcatctcca taaaacaaaa cccgccgtag 29340
cgagttcaga taaaataaat ccccgcgagt gcgaggattg ttatgtaata ttgggtttaa 29400
tcatctatat gttttgtaca gagagggcaa gtatcgtttc caccgtactc gtgataataa 29460
ttttgcacgg tatcagtcat ttctcgcaca ttgcagaatg gggatttgtc ttcattagac 29520
ttataaacct tcatggaata tttgtatgcc gactctatat ctataccttc atctacataa 29580
acaccttcgt gatgtctgca tggagacaag acaccggatc tgcacaacat tgataacgcc 29640
caatcttttt gctcagactc taactcattg atactcattt ataaactcct tgcaatgtat 29700
gtcgtttcag ctaaacggta tcagcaatgt ttatgtaaag aaacagtaag ataatactca 29760
acccgatgtt tgagtacggt catcatctga cactacagac tctggcatcg ctgtgaagac 29820
gacgcgaaat tcagcatttt cacaagcgtt atcttttaca aaaccgatct cactctcctt 29880
tgatgcgaat gccagcgtca gacatcatat gcagatactc acctgcatcc tgaacccatt 29940
gacctccaac cccgtaatag cgatgcgtaa tgatgtcgat agttactaac gggtcttgtt 30000
cgattaactg ccgcagaaac tcttccaggt caccagtgca gtgcttgata acaggagtct 30060
tcccaggatg gcgaacaaca agaaactggt ttccgtcttc acggacttcg ttgctttcca 30120
gtttagcaat acgcttactc ccatccgaga taacaccttc gtaatactca cgctgctcgt 30180
tgagttttga ttttgctgtt tcaagctcaa cacgcagttt ccctactgtt agcgcaatat 30240
cctcgttctc ctggtcgcgg cgtttgatgt attgctggtt tctttcccgt tcatccagca 30300
gttccagcac aatcgatggt gttaccaatt catggaaaag gtctgcgtca aatccccagt 30360
cgtcatgcat tgcctgctct gccgcttcac gcagtgcctg agagttaatt tcgctcactt 30420
cgaacctctc tgtttactga taagttccag atcctcctgg caacttgcac aagtccgaca 30480
accctgaacg accaggcgtc ttcgttcatc tatcggatcg ccacactcac aacaatgagt 30540
ggcagatata gcctggtggt tcaggcggcg catttttatt gctgtgttgc gctgtaattc 30600
ttctatttct gatgctgaat caatgatgtc tgccatcttt cattaatccc tgaactgttg 30660
gttaatacgc ttgagggtga atgcgaataa taaaaaagga gcctgtagct ccctgatgat 30720
tttgcttttc atgttcatcg ttccttaaag acgccgttta acatgccgat tgccaggctt 30780
aaatgagtcg gtgtgaatcc catcagcgtt accgtttcgc ggtgcttctt cagtacgcta 30840
cggcaaatgt catcgacgtt tttatccgga aactgctgtc tggctttttt tgatttcaga 30900
attagcctga cgggcaatgc tgcgaagggc gttttcctgc tgaggtgtca ttgaacaagt 30960
cccatgtcgg caagcataag cacacagaat atgaagcccg ctgccagaaa aatgcattcc 31020
gtggttgtca tacctggttt ctctcatctg cttctgcttt cgccaccatc atttccagct 31080
tttgtgaaag ggatgcggct aacgtatgaa attcttcgtc tgtttctact ggtattggca 31140
caaacctgat tccaatttga gcaaggctat gtgccatctc gatactcgtt cttaactcaa 31200
cagaagatgc tttgtgcata cagcccctcg tttattattt atctcctcag ccagccgctg 31260
tgctttcagt ggatttcgga taacagaaag gccgggaaat acccagcctc gctttgtaac 31320
ggagtagacg aaagtgattg cgcctacccg gatattatcg tgaggatgcg tcatcgccat 31380
tgctccccaa atacaaaacc aatttcagcc agtgcctcgt ccattttttc gatgaactcc 31440
ggcacgatct cgtcaaaact cgccatgtac ttttcatccc gctcaatcac gacataatgc 31500
aggccttcac gcttcatacg cgggtcatag ttggcaaagt accaggcatt ttttcgcgtc 31560
acccacatgc tgtactgcac ctgggccatg taagctgact ttatggcctc gaaaccaccg 31620
agccggaact tcatgaaatc ccgggaggta aacgggcatt tcagttcaag gccgttgccg 31680
tcactgcata aaccatcggg agagcaggcg gtacgcatac tttcgtcgcg atagatgatc 31740
ggggattcag taacattcac gccggaagtg aattcaaaca gggttctggc gtcgttctcg 31800
tactgttttc cccaggccag tgctttagcg ttaacttccg gagccacacc ggtgcaaacc 31860
tcagcaagca gggtgtggaa gtaggacatt ttcatgtcag gccacttctt tccggagcgg 31920
ggttttgcta tcacgttgtg aacttctgaa gcggtgatga cgccgagccg taatttgtgc 31980
cacgcatcat ccccctgttc gacagctctc acatcgatcc cggtacgctg caggataatg 32040
tccggtgtca tgctgccacc ttctgctctg cggctttctg tttcaggaat ccaagagctt 32100
ttactgcttc ggcctgtgtc agttctgacg atgcacgaat gtcgcggcga aatatctggg 32160
aacagagcgg caataagtcg tcatcccatg ttttatccag ggcgatcagc agagtgttaa 32220
tctcctgcat ggtttcatcg ttaaccggag tgatgtcgcg ttccggctga cgttctgcag 32280
tgtatgcagt attttcgaca atgcgctcgg cttcatcctt gtcatagata ccagcaaatc 32340
cgaaggccag acgggcacac tgaatcatgg ctttatgacg taacatccgt ttgggatgcg 32400
actgccacgg ccccgtgatt tctctgcctt cgcgagtttt gaatggttcg cggcggcatt 32460
catccatcca ttcggtaacg cagatcggat gattacggtc cttgcggtaa atccggcatg 32520
tacaggattc attgtcctgc tcaaagtcca tgccatcaaa ctgctggttt tcattgatga 32580
tgcgggacca gccatcaacg cccaccaccg gaacgatgcc attctgctta tcaggaaagg 32640
cgtaaatttc tttcgtccac ggattaaggc cgtactggtt ggcaacgatc agtaatgcga 32700
tgaactgcgc atcgctggca tcacctttaa atgccgtctg gcgaagagtg gtgatcagtt 32760
cctgtgggtc gacagaatcc atgccgacac gttcagccag cttcccagcc agcgttgcga 32820
gtgcagtact cattcgtttt atacctctga atcaatatca acctggtggt gagcaatggt 32880
ttcaaccatg taccggatgt gttctgccat gcgctcctga aactcaacat cgtcatcaaa 32940
cgcacgggta atggattttt tgctggcccc gtggcgttgc aaatgatcga tgcatagcga 33000
ttcaaacagg tgctggggca ggcctttttc catgtcgtct gccagttctg cctctttctc 33060
ttcacgggcg agctgctggt agtgacgcgc ccagctctga gcctcaagac gatcctgaat 33120
gtaataagcg ttcatggctg aactcctgaa atagctgtga aaatatcgcc cgcgaaatgc 33180
cgggctgatt aggaaaacag gaaagggggt tagtgaatgc ttttgcttga tctcagtttc 33240
agtattaata tccatttttt ataagcgtcg acggcttcac gaaacatctt ttcatcgcca 33300
ataaaagtgg cgatagtgaa tttagtctgg atagccataa gtgtttgatc cattctttgg 33360
gactcctggc tgattaagta tgtcgataag gcgtttccat ccgtcacgta atttacgggt 33420
gattcgttca agtaaagatt cggaagggca gccagcaaca ggccaccctg caatggcata 33480
ttgcatggtg tgctccttat ttatacataa cgaaaaacgc ctcgagtgaa gcgttattgg 33540
tatgcggtaa aaccgcactc aggcggcctt gatagtcata tcatctgaat caaatattcc 33600
tgatgtatcg atatcggtaa ttcttattcc ttcgctacca tccattggag gccatccttc 33660
ctgaccattt ccatcattcc agtcgaactc acacacaaca ccatatgcat ttaagtcgct 33720
tgaaattgct ataagcagag catgttgcgc cagcatgatt aatacagcat ttaatacaga 33780
gccgtgttta ttgagtcggt attcagagtc tgaccagaaa ttattaatct ggtgaagttt 33840
ttcctctgtc attacgtcat ggtcgatttc aatttctatt gatgctttcc agtcgtaatc 33900
aatgatgtat tttttgatgt ttgacatctg ttcatatcct cacagataaa aaatcgccct 33960
cacactggag ggcaaagaag atttccaata atcagaacaa gtcggctcct gtttagttac 34020
gagcgacatt gctccgtgta ttcactcgtt ggaatgaata cacagtgcag tgtttattct 34080
gttatttatg ccaaaaataa aggccactat caggcagctt tgttgttctg tttaccaagt 34140
tctctggcaa tcattgccgt cgttcgtatt gcccatttat cgacatattt cccatcttcc 34200
attacaggaa acatttcttc aggcttaacc atgcattccg attgcagctt gcatccattg 34260
catcgcttga attgtccaca ccattgattt ttatcaatag tcgtagtcat acggatagtc 34320
ctggtattgt tccatcacat cctgaggatg ctcttcgaac tcttcaaatt cttcttccat 34380
atatcacctt aaatagtgga ttgcggtagt aaagattgtg cctgtctttt aaccacatca 34440
ggctcggtgg ttctcgtgta cccctacagc gagaaatcgg ataaactatt acaaccccta 34500
cagtttgatg agtatagaaa tggatccact cgttattctc ggacgagtgt tcagtaatga 34560
acctctggag agaaccatgt atatgatcgt tatctgggtt ggacttctgc ttttaagccc 34620
agataactgg cctgaatatg ttaatgagag aatcggtatt cctcatgtgt ggcatgtttt 34680
cgtctttgct cttgcatttt cgctagcaat taatgtgcat cgattatcag ctattgccag 34740
cgccagatat aagcgattta agctaagaaa acgcattaag atgcaaaacg ataaagtgcg 34800
atcagtaatt caaaacctta cagaagagca atctatggtt ttgtgcgcag cccttaatga 34860
aggcaggaag tatgtggtta catcaaaaca attcccatac attagtgagt tgattgagct 34920
tggtgtgttg aacaaaactt tttcccgatg gaatggaaag catatattat tccctattga 34980
ggatatttac tggactgaat tagttgccag ctatgatcca tataatattg agataaagcc 35040
aaggccaata tctaagtaac tagataagag gaatcgattt tcccttaatt ttctggcgtc 35100
cactgcatgt tatgccgcgt tcgccaggct tgctgtacca tgtgcgctga ttcttgcgct 35160
caatacgttg caggttgctt tcaatctgtt tgtggtattc agccagcact gtaaggtcta 35220
tcggatttag tgcgctttct actcgtgatt tcggtttgcg attcagcgag agaatagggc 35280
ggttaactgg ttttgcgctt accccaacca acaggggatt tgctgctttc cattgagcct 35340
gtttctctgc gcgacgttcg cggcggcgtg tttgtgcatc catctggatt ctcctgtcag 35400
ttagctttgg tggtgtgtgg cagttgtagt cctgaacgaa aaccccccgc gattggcaca 35460
ttggcagcta atccggaatc gcacttacgg ccaatgcttc gtttcgtatc acacacccca 35520
aagccttctg ctttgaatgc tgcccttctt cagggcttaa tttttaagag cgtcaccttc 35580
atggtggtca gtgcgtcctg ctgatgtgct cagtatcacc gccagtggta tttatgtcaa 35640
caccgccaga gataatttat caccgcagat ggttatctgt atgtttttta tatgaattta 35700
ttttttgcag gggggcattg tttggtaggt gagagatctg aattgctatg tttagtgagt 35760
tgtatctatt tatttttcaa taaatacaat tggttatgtg ttttgggggc gatcgtgagg 35820
caaagaaaac ccggcgctga ggccgggtta ttcttgttct ctggtcaaat tatatagttg 35880
gaaaacaagg atgcatatat gaatgaacga tgcagaggca atgccgatgg cgatagtggg 35940
tatcatgtag ccgcttatgc tggaaagaag caataacccg cagaaaaaca aagctccaag 36000
ctcaacaaaa ctaagggcat agacaataac taccgatgtc atatacccat actctctaat 36060
cttggccagt cggcgcgttc tgcttccgat tagaaacgtc aaggcagcaa tcaggattgc 36120
aatcatggtt cctgcatatg atgacaatgt cgccccaaga ccatctctat gagctgaaaa 36180
agaaacacca ggaatgtagt ggcggaaaag gagatagcaa atgcttacga taacgtaagg 36240
aattattact atgtaaacac caggcatgat tctgttccgc ataattactc ctgataatta 36300
atccttaact ttgcccacct gccttttaaa acattccagt atatcacttt tcattcttgc 36360
gtagcaatat gccatctctt cagctatctc agcattggtg accttgttca gaggcgctga 36420
gagatggcct ttttctgata gataatgttc tgttaaaata tctccggcct catcttttgc 36480
ccgcaggcta atgtctgaaa attgaggtga cgggttaaaa ataatatcct tggcaacctt 36540
ttttatatcc cttttaaatt ttggcttaat gactatatcc aatgagtcaa aaagctcccc 36600
ttcaatatct gttgccccta agacctttaa tatatcgcca aatacaggta gcttggcttc 36660
taccttcacc gttgttcggc cgatgaaatg catatgcata acatcgtctt tggtggttcc 36720
cctcatcagt ggctctatct gaacgcgctc tccactgctt aatgacattc ctttcccgat 36780
taaaaaatct gtcagatcgg atgtggtcgg cccgaaaaca gttctggcaa aaccaatggt 36840
gtcgccttca acaaacaaaa aagatgggaa tcccaatgat tcgtcatctg cgaggctgtt 36900
cttaatatct tcaactgaag ctttagagcg atttatcttc tgaaccagac tcttgtcatt 36960
tgttttggta aagagaaaag tttttccatc gattttatga atatacaaat aattggagcc 37020
aacctgcagg tgatgattat cagccagcag agaattaagg aaaacagaca ggtttattga 37080
gcgcttatct ttccctttat ttttgctgcg gtaagtcgca taaaaaccat tcttcataat 37140
tcaatccatt tactatgtta tgttctgagg ggagtgaaaa ttcccctaat tcgatgaaga 37200
ttcttgctca attgttatca gctatgcgcc gaccagaaca ccttgccgat cagccaaacg 37260
tctcttcagg ccactgacta gcgataactt tccccacaac ggaacaactc tcattgcatg 37320
ggatcattgg gtactgtggg tttagtggtt gtaaaaacac ctgaccgcta tccctgatca 37380
gtttcttgaa ggtaaactca tcacccccaa gtctggctat gcagaaatca cctggctcaa 37440
cagcctgctc agggtcaacg agaattaaca ttccgtcagg aaagcttggc ttggagcctg 37500
ttggtgcggt catggaatta ccttcaacct caagccagaa tgcagaatca ctggcttttt 37560
tggttgtgct tacccatctc tccgcatcac ctttggtaaa ggttctaagc ttaggtgaga 37620
acatccctgc ctgaacatga gaaaaaacag ggtactcata ctcacttcta agtgacggct 37680
gcatactaac cgcttcatac atctcgtaga tttctctggc gattgaaggg ctaaattctt 37740
caacgctaac tttgagaatt tttgtaagca atgcggcgtt ataagcattt aatgcattga 37800
tgccattaaa taaagcacca acgcctgact gccccatccc catcttgtct gcgacagatt 37860
cctgggataa gccaagttca tttttctttt tttcataaat tgctttaagg cgacgtgcgt 37920
cctcaagctg ctcttgtgtt aatggtttct tttttgtgct catacgttaa atctatcacc 37980
gcaagggata aatatctaac accgtgcgtg ttgactattt tacctctggc ggtgataatg 38040
gttgcatgta ctaaggaggt tgtatggaac aacgcataac cctgaaagat tatgcaatgc 38100
gctttgggca aaccaagaca gctaaagatc tcggcgtata tcaaagcgcg atcaacaagg 38160
ccattcatgc aggccgaaag atttttttaa ctataaacgc tgatggaagc gtttatgcgg 38220
aagaggtaaa gcccttcccg agtaacaaaa aaacaacagc ataaataacc ccgctcttac 38280
acattccagc cctgaaaaag ggcatcaaat taaaccacac ctatggtgta tgcatttatt 38340
tgcatacatt caatcaattg ttatctaagg aaatacttac atatggttcg tgcaaacaaa 38400
cgcaacgagg ctctacgaat cgagagtgcg ttgcttaaca aaatcgcaat gcttggaact 38460
gagaagacag cggaagctgt gggcgttgat aagtcgcaga tcagcaggtg gaagagggac 38520
tggattccaa agttctcaat gctgcttgct gttcttgaat ggggggtcgt tgacgacgac 38580
atggctcgat tggcgcgaca agttgctgcg attctcacca ataaaaaacg cccggcggca 38640
accgagcgtt ctgaacaaat ccagatggag ttctgaggtc attactggat ctatcaacag 38700
gagtcattat gacaaataca gcaaaaatac tcaacttcgg cagaggtaac tttgccggac 38760
aggagcgtaa tgtggcagat ctcgatgatg gttacgccag actatcaaat atgctgcttg 38820
aggcttattc gggcgcagat ctgaccaagc gacagtttaa agtgctgctt gccattctgc 38880
gtaaaaccta tgggtggaat aaaccaatgg acagaatcac cgattctcaa cttagcgaga 38940
ttacaaagtt acctgtcaaa cggtgcaatg aagccaagtt agaactcgtc agaatgaata 39000
ttatcaagca gcaaggcggc atgtttggac caaataaaaa catctcagaa tggtgcatcc 39060
ctcaaaacga gggaaaatcc cctaaaacga gggataaaac atccctcaaa ttgggggatt 39120
gctatccctc aaaacagggg gacacaaaag acactattac aaaagaaaaa agaaaagatt 39180
attcgtcaga gaattctggc gaatcctctg accagccaga aaacgacctt tctgtggtga 39240
aaccggatgc tgcaattcag agcggcagca agtgggggac agcagaagac ctgaccgccg 39300
cagagtggat gtttgacatg gtgaagacta tcgcaccatc agccagaaaa ccgaattttg 39360
ctgggtgggc taacgatatc cgcctgatgc gtgaacgtga cggacgtaac caccgcgaca 39420
tgtgtgtgct gttccgctgg gcatgccagg acaacttctg gtccggtaac gtgctgagcc 39480
cggccaaact ccgcgataag tggacccaac tcgaaatcaa ccgtaacaag caacaggcag 39540
gcgtgacagc cagcaaacca aaactcgacc tgacaaacac agactggatt tacggggtgg 39600
atctatgaaa aacatcgccg cacagatggt taactttgac cgtgagcaga tgcgtcggat 39660
cgccaacaac atgccggaac agtacgacga aaagccgcag gtacagcagg tagcgcagat 39720
catcaacggt gtgttcagcc agttactggc aactttcccg gcgagcctgg ctaaccgtga 39780
ccagaacgaa gtgaacgaaa tccgtcgcca gtgggttctg gcttttcggg aaaacgggat 39840
caccacgatg gaacaggtta acgcaggaat gcgcgtagcc cgtcggcaga atcgaccatt 39900
tctgccatca cccgggcagt ttgttgcatg gtgccgggaa gaagcatccg ttaccgccgg 39960
actgccaaac gtcagcgagc tggttgatat ggtttacgag tattgccgga agcgaggcct 40020
gtatccggat gcggagtctt atccgtggaa atcaaacgcg cactactggc tggttaccaa 40080
cctgtatcag aacatgcggg ccaatgcgct tactgatgcg gaattacgcc gtaaggccgc 40140
agatgagctt gtccatatga ctgcgagaat taaccgtggt gaggcgatcc ctgaaccagt 40200
aaaacaactt cctgtcatgg gcggtagacc tctaaatcgt gcacaggctc tggcgaagat 40260
cgcagaaatc aaagctaagt tcggactgaa aggagcaagt gtatgacggg caaagaggca 40320
attattcatt acctggggac gcataatagc ttctgtgcgc cggacgttgc cgcgctaaca 40380
ggcgcaacag taaccagcat aaatcaggcc gcggctaaaa tggcacgggc aggtcttctg 40440
gttatcgaag gtaaggtctg gcgaacggtg tattaccggt ttgctaccag ggaagaacgg 40500
gaaggaaaga tgagcacgaa cctggttttt aaggagtgtc gccagagtgc cgcgatgaaa 40560
cgggtattgg cggtatatgg agttaaaaga tgaccatcta cattactgag ctaataacag 40620
gcctgctggt aatcgcaggc ctttttattt gggggagagg gaagtcatga aaaaactaac 40680
ctttgaaatt cgatctccag cacatcagca aaacgctatt cacgcagtac agcaaatcct 40740
tccagaccca accaaaccaa tcgtagtaac cattcaggaa cgcaaccgca gcttagacca 40800
aaacaggaag ctatgggcct gcttaggtga cgtctctcgt caggttgaat ggcatggtcg 40860
ctggctggat gcagaaagct ggaagtgtgt gtttaccgca gcattaaagc agcaggatgt 40920
tgttcctaac cttgccggga atggctttgt ggtaataggc cagtcaacca gcaggatgcg 40980
tgtaggcgaa tttgcggagc tattagagct tatacaggca ttcggtacag agcgtggcgt 41040
taagtggtca gacgaagcga gactggctct ggagtggaaa gcgagatggg gagacagggc 41100
tgcatgataa atgtcgttag tttctccggt ggcaggacgt cagcatattt gctctggcta 41160
atggagcaaa agcgacgggc aggtaaagac gtgcattacg ttttcatgga tacaggttgt 41220
gaacatccaa tgacatatcg gtttgtcagg gaagttgtga agttctggga tataccgctc 41280
accgtattgc aggttgatat caacccggag cttggacagc caaatggtta tacggtatgg 41340
gaaccaaagg atattcagac gcgaatgcct gttctgaagc catttatcga tatggtaaag 41400
aaatatggca ctccatacgt cggcggcgcg ttctgcactg acagattaaa actcgttccc 41460
ttcaccaaat actgtgatga ccatttcggg cgagggaatt acaccacgtg gattggcatc 41520
agagctgatg aaccgaagcg gctaaagcca aagcctggaa tcagatatct tgctgaactg 41580
tcagactttg agaaggaaga tatcctcgca tggtggaagc aacaaccatt cgatttgcaa 41640
ataccggaac atctcggtaa ctgcatattc tgcattaaaa aatcaacgca aaaaatcgga 41700
cttgcctgca aagatgagga gggattgcag cgtgttttta atgaggtcat cacgggatcc 41760
catgtgcgtg acggacatcg ggaaacgcca aaggagatta tgtaccgagg aagaatgtcg 41820
ctggacggta tcgcgaaaat gtattcagaa aatgattatc aagccctgta tcaggacatg 41880
gtacgagcta aaagattcga taccggctct tgttctgagt catgcgaaat atttggaggg 41940
cagcttgatt tcgacttcgg gagggaagct gcatgatgcg atgttatcgg tgcggtgaat 42000
gcaaagaaga taaccgcttc cgaccaaatc aaccttactg gaatcgatgg tgtctccggt 42060
gtgaaagaac accaacaggg gtgttaccac taccgcagga aaaggaggac gtgtggcgag 42120
acagcgacga agtatcaccg acataatctg cgaaaactgc aaataccttc caacgaaacg 42180
caccagaaat aaacccaagc caatcccaaa agaatctgac gtaaaaacct tcaactacac 42240
ggctcacctg tgggatatcc ggtggctaag acgtcgtgcg aggaaaacaa ggtgattgac 42300
caaaatcgaa gttacgaaca agaaagcgtc gagcgagctt taacgtgcgc taactgcggt 42360
cagaagctgc atgtgctgga agttcacgtg tgtgagcact gctgcgcaga actgatgagc 42420
gatccgaata gctcgatgca cgaggaagaa gatgatggct aaaccagcgc gaagacgatg 42480
taaaaacgat gaatgccggg aatggtttca ccctgcattc gctaatcagt ggtggtgctc 42540
tccagagtgt ggaaccaaga tagcactcga acgacgaagt aaagaacgcg aaaaagcgga 42600
aaaagcagca gagaagaaac gacgacgaga ggagcagaaa cagaaagata aacttaagat 42660
tcgaaaactc gccttaaagc cccgcagtta ctggattaaa caagcccaac aagccgtaaa 42720
cgccttcatc agagaaagag accgcgactt accatgtatc tcgtgcggaa cgctcacgtc 42780
tgctcagtgg gatgccggac attaccggac aactgctgcg gcacctcaac tccgatttaa 42840
tgaacgcaat attcacaagc aatgcgtggt gtgcaaccag cacaaaagcg gaaatctcgt 42900
tccgtatcgc gtcgaactga ttagccgcat cgggcaggaa gcagtagacg aaatcgaatc 42960
aaaccataac cgccatcgct ggactatcga agagtgcaag gcgatcaagg cagagtacca 43020
acagaaactc aaagacctgc gaaatagcag aagtgaggcc gcatgacgtt ctcagtaaaa 43080
accattccag acatgctcgt tgaaacatac ggaaatcaga cagaagtagc acgcagactg 43140
aaatgtagtc gcggtacggt cagaaaatac gttgatgata aagacgggaa aatgcacgcc 43200
atcgtcaacg acgttctcat ggttcatcgc ggatggagtg aaagagatgc gctattacga 43260
aaaaattgat ggcagcaaat accgaaatat ttgggtagtt ggcgatctgc acggatgcta 43320
cacgaacctg atgaacaaac tggatacgat tggattcgac aacaaaaaag acctgcttat 43380
ctcggtgggc gatttggttg atcgtggtgc agagaacgtt gaatgcctgg aattaatcac 43440
attcccctgg ttcagagctg tacgtggaaa ccatgagcaa atgatgattg atggcttatc 43500
agagcgtgga aacgttaatc actggctgct taatggcggt ggctggttct ttaatctcga 43560
ttacgacaaa gaaattctgg ctaaagctct tgcccataaa gcagatgaac ttccgttaat 43620
catcgaactg gtgagcaaag ataaaaaata tgttatctgc cacgccgatt atccctttga 43680
cgaatacgag tttggaaagc cagttgatca tcagcaggta atctggaacc gcgaacgaat 43740
cagcaactca caaaacggga tcgtgaaaga aatcaaaggc gcggacacgt tcatctttgg 43800
tcatacgcca gcagtgaaac cactcaagtt tgccaaccaa atgtatatcg ataccggcgc 43860
agtgttctgc ggaaacctaa cattgattca ggtacaggga gaaggcgcat gagactcgaa 43920
agcgtagcta aatttcattc gccaaaaagc ccgatgatga gcgactcacc acgggccacg 43980
gcttctgact ctctttccgg tactgatgtg atggctgcta tggggatggc gcaatcacaa 44040
gccggattcg gtatggctgc attctgcggt aagcacgaac tcagccagaa cgacaaacaa 44100
aaggctatca actatctgat gcaatttgca cacaaggtat cggggaaata ccgtggtgtg 44160
gcaaagcttg aaggaaatac taaggcaaag gtactgcaag tgctcgcaac attcgcttat 44220
gcggattatt gccgtagtgc cgcgacgccg ggggcaagat gcagagattg ccatggtaca 44280
ggccgtgcgg ttgatattgc caaaacagag ctgtggggga gagttgtcga gaaagagtgc 44340
ggaagatgca aaggcgtcgg ctattcaagg atgccagcaa gcgcagcata tcgcgctgtg 44400
acgatgctaa tcccaaacct tacccaaccc acctggtcac gcactgttaa gccgctgtat 44460
gacgctctgg tggtgcaatg ccacaaagaa gagtcaatcg cagacaacat tttgaatgcg 44520
gtcacacgtt agcagcatga ttgccacgga tggcaacata ttaacggcat gatattgact 44580
tattgaataa aattgggtaa atttgactca acgatgggtt aattcgctcg ttgtggtagt 44640
gagatgaaaa gaggcggcgc ttactaccga ttccgcctag ttggtcactt cgacgtatcg 44700
tctggaactc caaccatcgc aggcagagag gtctgcaaaa tgcaatcccg aaacagttcg 44760
caggtaatag ttagagcctg cataacggtt tcgggatttt ttatatctgc acaacaggta 44820
agagcattga gtcgataatc gtgaagagtc ggcgagcctg gttagccagt gctctttccg 44880
ttgtgctgaa ttaagcgaat accggaagca gaaccggatc accaaatgcg tacaggcgtc 44940
atcgccgccc agcaacagca caacccaaac tgagccgtag ccactgtctg tcctgaattc 45000
attagtaata gttacgctgc ggccttttac acatgacctt cgtgaaagcg ggtggcagga 45060
ggtcgcgcta acaacctcct gccgttttgc ccgtgcatat cggtcacgaa caaatctgat 45120
tactaaacac agtagcctgg atttgttcta tcagtaatcg accttattcc taattaaata 45180
gagcaaatcc ccttattggg ggtaagacat gaagatgcca gaaaaacatg acctgttggc 45240
cgccattctc gcggcaaagg aacaaggcat cggggcaatc cttgcgtttg caatggcgta 45300
ccttcgcggc agatataatg gcggtgcgtt tacaaaaaca gtaatcgacg caacgatgtg 45360
cgccattatc gcctagttca ttcgtgacct tctcgacttc gccggactaa gtagcaatct 45420
cgcttatata acgagcgtgt ttatcggcta catcggtact gactcgattg gttcgcttat 45480
caaacgcttc gctgctaaaa aagccggagt agaagatggt agaaatcaat aatcaacgta 45540
aggcgttcct cgatatgctg gcgtggtcgg agggaactga taacggacgt cagaaaacca 45600
gaaatcatgg ttatgacgtc attgtaggcg gagagctatt tactgattac tccgatcacc 45660
ctcgcaaact tgtcacgcta aacccaaaac tcaaatcaac aggcgccgga cgctaccagc 45720
ttctttcccg ttggtgggat gcctaccgca agcagcttgg cctgaaagac ttctctccga 45780
aaagtcagga cgctgtggca ttgcagcaga ttaaggagcg tggcgcttta cctatgattg 45840
atcgtggtga tatccgtcag gcaatcgacc gttgcagcaa tatctgggct tcactgccgg 45900
gcgctggtta tggtcagttc gagcataagg ctgacagcct gattgcaaaa ttcaaagaag 45960
cgggcggaac ggtcagagag attgatgtat gagcagagtc accgcgatta tctccgctct 46020
ggttatctgc atcatcgtct gcctgtcatg ggctgttaat cattaccgtg ataacgccat 46080
tacctacaaa gcccagcgcg acaaaaatgc cagagaactg aagctggcga acgcggcaat 46140
tactgacatg cagatgcgtc agcgtgatgt tgctgcgctc gatgcaaaat acacgaagga 46200
gttagctgat gctaaagctg aaaatgatgc tctgcgtgat gatgttgccg ctggtcgtcg 46260
tcggttgcac atcaaagcag tctgtcagtc agtgcgtgaa gccaccaccg cctccggcgt 46320
ggataatgca gcctcccccc gactggcaga caccgctgaa cgggattatt tcaccctcag 46380
agagaggctg atcactatgc aaaaacaact ggaaggaacc cagaagtata ttaatgagca 46440
gtgcagatag agttgcccat atcgatgggc aactcatgca attattgtga gcaatacaca 46500
cgcgcttcca gcggagtata aatgcctaaa gtaataaaac cgagcaatcc atttacgaat 46560
gtttgctggg tttctgtttt aacaacattt tctgcgccgc cacaaatttt ggctgcatcg 46620
acagttttct tctgcccaat tccagaaacg aagaaatgat gggtgatggt ttcctttggt 46680
gctactgctg ccggtttgtt ttgaacagta aacgtctgtt gagcacatcc tgtaataagc 46740
agggccagcg cagtagcgag tagcattttt ttcatggtgt tattcccgat gctttttgaa 46800
gttcgcagaa tcgtatgtgt agaaaattaa acaaacccta aacaatgagt tgaaatttca 46860
tattgttaat atttattaat gtatgtcagg tgcgatgaat cgtcattgta ttcccggatt 46920
aactatgtcc acagccctga cggggaactt ctctgcggga gtgtccggga ataattaaaa 46980
cgatgcacac agggtttagc gcgtacacgt attgcattat gccaacgccc cggtgctgac 47040
acggaagaaa ccggacgtta tgatttagcg tggaaagatt tgtgtagtgt tctgaatgct 47100
ctcagtaaat agtaatgaat tatcaaaggt atagtaatat cttttatgtt catggatatt 47160
tgtaacccat cggaaaactc ctgctttagc aagattttcc ctgtattgct gaaatgtgat 47220
ttctcttgat ttcaacctat cataggacgt ttctataaga tgcgtgtttc ttgagaattt 47280
aacatttaca acctttttaa gtccttttat taacacggtg ttatcgtttt ctaacacgat 47340
gtgaatatta tctgtggcta gatagtaaat ataatgtgag acgttgtgac gttttagttc 47400
agaataaaac aattcacagt ctaaatcttt tcgcacttga tcgaatattt ctttaaaaat 47460
ggcaacctga gccattggta aaaccttcca tgtgatacga gggcgcgtag tttgcattat 47520
cgtttttatc gtttcaatct ggtctgacct ccttgtgttt tgttgatgat ttatgtcaaa 47580
tattaggaat gttttcactt aatagtattg gttgcgtaac aaagtgcggt cctgctggca 47640
ttctggaggg aaatacaacc gacagatgta tgtaaggcca acgtgctcaa atcttcatac 47700
agaaagattt gaagtaatat tttaaccgct agatgaagag caagcgcatg gagcgacaaa 47760
atgaataaag aacaatctgc tgatgatccc tccgtggatc tgattcgtgt aaaaaatatg 47820
cttaatagca ccatttctat gagttaccct gatgttgtaa ttgcatgtat agaacataag 47880
gtgtctctgg aagcattcag agcaattgag gcagcgttgg tgaagcacga taataatatg 47940
aaggattatt ccctggtggt tgactgatca ccataactgc taatcattca aactatttag 48000
tctgtgacag agccaacacg cagtctgtca ctgtcaggaa agtggtaaaa ctgcaactca 48060
attactgcaa tgccctcgta attaagtgaa tttacaatat cgtcctgttc ggagggaaga 48120
acgcgggatg ttcattcttc atcactttta attgatgtat atgctctctt ttctgacgtt 48180
agtctccgac ggcaggcttc aatgacccag gctgagaaat tcccggaccc tttttgctca 48240
agagcgatgt taatttgttc aatcatttgg ttaggaaagc ggatgttgcg ggttgttgtt 48300
ctgcgggttc tgttcttcgt tgacatgagg ttgccccgta ttcagtgtcg ctgatttgta 48360
ttgtctgaag ttgtttttac gttaagttga tgcagatcaa ttaatacgat acctgcgtca 48420
taattgatta tttgacgtgg tttgatggcc tccacgcacg ttgtgatatg tagatgataa 48480
tcattatcac tttacgggtc ctttccggtg atccgacagg ttacggggcg gcgacctcgt 48540
tctgtttatg tttcttgttt gttagccttt tggctaacaa acaagaaaca taaacagaac 48600
gcgtaacctg tcggatcacc ggaaaggacc cgtaaagtga taatgattat catctacata 48660
tcacaacgtg cgtggaggcc atcaaaccac gtcaaataat caattatgac gcaggtatcg 48720
tattaattga tctgcatcaa cttaacgtaa aaacaacttc agacaataca aatcagcgac 48780
actgaatacg gggcaacctc atgtcaacga agaacagaac ccgcagaaca acaacccgca 48840
acatccgctt tcctaaccaa atgattgaac aaattaacat cgctcttgag caaaaagggt 48900
ccgggaattt ctcagcctgg gtcattgaag cctgccgtcg gagactaacg tcagaaaaga 48960
gagcatatac atcaattaaa agtgatgaag aatgaacatc ccgcgttctt ccctccgaac 49020
aggacgatat tgtaaattca cttaattacg agggcattgc agtaattgag ttgcagtttt 49080
accactttcc tgacagtgac agactgcgtg ttggctctgt cacagactaa atagtttgaa 49140
tgattagcag ttatggtgat cagtcaacca ccagggaata atccttcata ttattatcgt 49200
gcttcaccaa cgctgcctca attgctctga atgcttccag agacacctta tgttctatac 49260
atgcaattac aacatcaggg taactcatag aaatggtgct attaagcata ttttttacac 49320
gaatcagatc cacggaggga tcatcagcag attgttcttt attcattttg tcgctccatg 49380
cgcttgctct tcatctagcg gttaaaatat tacttcaaat ctttctgtat gaagatttga 49440
gcacgttggc cttacataca tctgtcggtt gtatttccct ccagaatgcc agcaggaccg 49500
cactttgtta cgcaaccaat actattaagt gaaaacattc ctaatatttg acataaatca 49560
tcaacaaaac acaaggaggt cagaccagat tgaaacgata aaaacgataa tgcaaactac 49620
gcgccctcgt atcacatgga aggttttacc aatggctcag gttgccattt ttaaagaaat 49680
attcgatcaa gtgcgaaaag atttagactg tgaattgttt tattctgaac taaaacgtca 49740
caacgtctca cattatattt actatctagc cacagataat attcacatcg tgttagaaaa 49800
cgataacacc gtgttaataa aaggacttaa aaaggttgta aatgttaaat tctcaagaaa 49860
cacgcatctt atagaaacgt cctatgatag gttgaaatca agagaaatca catttcagca 49920
atacagggaa aatcttgcta aagcaggagt tttccgatgg gttacaaata tccatgaaca 49980
taaaagatat tactatacct ttgataattc attactattt actgagagca ttcagaacac 50040
tacacaaatc tttccacgct aaatcataac gtccggtttc ttccgtgtca gcaccggggc 50100
gttggcataa tgcaatacgt gtacgcgcta aaccctgtgt gcatcgtttt aattattccc 50160
ggacactccc gcagagaagt tccccgtcag ggctgtggac atagttaatc cgggaataca 50220
atgacgattc atcgcacctg acatacatta ataaatatta acaatatgaa atttcaactc 50280
attgtttagg gtttgtttaa ttttctacac atacgattct gcgaacttca aaaagcatcg 50340
ggaataacac catgaaaaaa atgctactcg ctactgcgct ggccctgctt attacaggat 50400
gtgctcaaca gacgtttact gttcaaaaca aaccggcagc agtagcacca aaggaaacca 50460
tcacccatca tttcttcgtt tctggaattg ggcagaagaa aactgtcgat gcagccaaaa 50520
tttgtggcgg cgcagaaaat gttgttaaaa cagaaaccca gcaaacattc gtaaatggat 50580
tgctcggttt tattacttta ggcatttata ctccgctgga agcgcgtgtg tattgctcac 50640
aataattgca tgagttgccc atcgatatgg gcaactctat ctgcactgct cattaatata 50700
cttctgggtt ccttccagtt gtttttgcat agtgatcagc ctctctctga gggtgaaata 50760
atcccgttca gcggtgtctg ccagtcgggg ggaggctgca ttatccacgc cggaggcggt 50820
ggtggcttca cgcactgact gacagactgc tttgatgtgc aaccgacgac gaccagcggc 50880
aacatcatca cgcagagcat cattttcagc tttagcatca gctaactcct tcgtgtattt 50940
tgcatcgagc gcagcaacat cacgctgacg catctgcatg tcagtaattg ccgcgttcgc 51000
cagcttcagt tctctggcat ttttgtcgcg ctgggctttg taggtaatgg cgttatcacg 51060
gtaatgatta acagcccatg acaggcagac gatgatgcag ataaccagag cggagataat 51120
cgcggtgact ctgctcatac atcaatctct ctgaccgttc cgcccgcttc tttgaatttt 51180
gcaatcaggc tgtcagcctt atgctcgaac tgaccataac cagcgcccgg cagtgaagcc 51240
cagatattgc tgcaacggtc gattgcctga cggatatcac cacgatcaat cataggtaaa 51300
gcgccacgct ccttaatctg ctgcaatgcc acagcgtcct gacttttcgg agagaagtct 51360
ttcaggccaa gctgcttgcg gtaggcatcc caccaacggg aaagaagctg gtagcgtccg 51420
gcgcctgttg atttgagttt tgggtttagc gtgacaagtt tgcgagggtg atcggagtaa 51480
tcagtaaata gctctccgcc tacaatgacg tcataaccat gatttctggt tttctgacgt 51540
ccgttatcag ttccctccga ccacgccagc atatcgagga acgccttacg ttgattattg 51600
atttctacca tcttctactc cggctttttt agcagcgaag cgtttgataa gcgaaccaat 51660
cgagtcagta ccgatgtagc cgataaacac gctcgttata taagcgagat tgctacttag 51720
tccggcgaag tcgagaaggt cacgaatgaa ctaggcgata atggcgcaca tcgttgcgtc 51780
gattactgtt tttgtaaacg caccgccatt atatctgccg cgaaggtacg ccattgcaaa 51840
cgcaaggatt gccccgatgc cttgttcctt tgccgcgaga atggcggcca acaggtcatg 51900
tttttctggc atcttcatgt cttaccccca ataaggggat ttgctctatt taattaggaa 51960
taaggtcgat tactgataga acaaatccag gctactgtgt ttagtaatca gatttgttcg 52020
tgaccgatat gcacgggcaa aacggcagga ggttgttagc gcgacctcct gccacccgct 52080
ttcacgaagg tcatgtgtaa aaggccgcag cgtaactatt actaatgaat tcaggacaga 52140
cagtggctac ggctcagttt gggttgtgct gttgctgggc ggcgatgacg cctgtacgca 52200
tttggtgatc cggttctgct tccggtattc gcttaattca gcacaacgga aagagcactg 52260
gctaaccagg ctcgccgact cttcacgatt atcgactcaa tgctcttacc tgttgtgcag 52320
atataaaaaa tcccgaaacc gttatgcagg ctctaactat tacctgcgaa ctgtttcggg 52380
attgcatttt gcagacctct ctgcctgcga tggttggagt tccagacgat acgtcgaagt 52440
gaccaactag gcggaatcgg tagtaagcgc cgcctctttt catctcacta ccacaacgag 52500
cgaattaacc catcgttgag tcaaatttac ccaattttat tcaataagtc aatatcatgc 52560
cgttaatatg ttgccatccg tggcaatcat gctgctaacg tgtgaccgca ttcaaaatgt 52620
tgtctgcgat tgactcttct ttgtggcatt gcaccaccag agcgtcatac agcggcttaa 52680
cagtgcgtga ccaggtgggt tgggtaaggt ttgggattag catcgtcaca gcgcgatatg 52740
ctgcgcttgc tggcatcctt gaatagccga cgcctttgca tcttccgcac tctttctcga 52800
caactctccc ccacagctct gttttggcaa tatcaaccgc acggcctgta ccatggcaat 52860
ctctgcatct tgcccccggc gtcgcggcac tacggcaata atccgcataa gcgaatgttg 52920
cgagcacttg cagtaccttt gccttagtat ttccttcaag ctttgccaca ccacggtatt 52980
tccccgatac cttgtgtgca aattgcatca gatagttgat agccttttgt ttgtcgttct 53040
ggctgagttc gtgcttaccg cagaatgcag ccataccgaa tccggcttgt gattgcgcca 53100
tccccatagc agccatcaca tcagtaccgg aaagagagtc agaagccgtg gcccgtggtg 53160
agtcgctcat catcgggctt tttggcgaat gaaatttagc tacgctttcg agtctcatgc 53220
gccttctccc tgtacctgaa tcaatgttag gtttccgcag aacactgcgc cggtatcgat 53280
atacatttgg ttggcaaact tgagtggttt cactgctggc gtatgaccaa agatgaacgt 53340
gtccgcgcct ttgatttctt tcacgatccc gttttgtgag ttgctgattc gttcgcggtt 53400
ccagattacc tgctgatgat caactggctt tccaaactcg tattcgtcaa agggataatc 53460
ggcgtggcag ataacatatt ttttatcttt gctcaccagt tcgatgatta acggaagttc 53520
atctgcttta tgggcaagag ctttagccag aatttctttg tcgtaatcga gattaaagaa 53580
ccagccaccg ccattaagca gccagtgatt aacgtttcca cgctctgata agccatcaat 53640
catcatttgc tcatggtttc cacgtacagc tctgaaccag gggaatgtga ttaattccag 53700
gcattcaacg ttctctgcac cacgatcaac caaatcgccc accgagataa gcaggtcttt 53760
tttgttgtcg aatccaatcg tatccagttt gttcatcagg ttcgtgtagc atccgtgcag 53820
atcgccaact acccaaatat ttcggtattt gctgccatca attttttcgt aatagcgcat 53880
ctctttcact ccatccgcga tgaaccatga gaacgtcgtt gacgatggcg tgcattttcc 53940
cgtctttatc atcaacgtat tttctgaccg taccgcgact acatttcagt ctgcgtgcta 54000
cttctgtctg atttccgtat gtttcaacga gcatgtctgg aatggttttt actgagaacg 54060
tcatgcggcc tcacttctgc tatttcgcag gtctttgagt ttctgttggt actctgcctt 54120
gatcgccttg cactcttcga tagtccagcg atggcggtta tggtttgatt cgatttcgtc 54180
tactgcttcc tgcccgatgc ggctaatcag ttcgacgcga tacggaacga gatttccgct 54240
tttgtgctgg ttgcacacca cgcattgctt gtgaatattg cgttcattaa atcggagttg 54300
aggtgccgca gcagttgtcc ggtaatgtcc ggcatcccac tgagcagacg tgagcgttcc 54360
gcacgagata catggtaagt cgcggtctct ttctctgatg aaggcgttta cggcttgttg 54420
ggcttgttta atccagtaac tgcggggctt taaggcgagt tttcgaatct taagtttatc 54480
tttctgtttc tgctcctctc gtcgtcgttt cttctctgct gctttttccg ctttttcgcg 54540
ttctttactt cgtcgttcga gtgctatctt ggttccacac tctggagagc accaccactg 54600
attagcgaat gcagggtgaa accattcccg gcattcatcg tttttacatc gtcttcgcgc 54660
tggtttagcc atcatcttct tcctcgtgca tcgagctatt cggatcgctc atcagttctg 54720
cgcagcagtg ctcacacacg tgaacttcca gcacatgcag cttctgaccg cagttagcgc 54780
acgttaaagc tcgctcgacg ctttcttgtt cgtaacttcg attttggtca atcaccttgt 54840
tttcctcgca cgacgtctta gccaccggat atcccacagg tgagccgtgt agttgaaggt 54900
ttttacgtca gattcttttg ggattggctt gggtttattt ctggtgcgtt tcgttggaag 54960
gtatttgcag ttttcgcaga ttatgtcggt gatacttcgt cgctgtctcg ccacacgtcc 55020
tccttttcct gcggtagtgg taacacccct gttggtgttc tttcacaccg gagacaccat 55080
cgattccagt aaggttgatt tggtcggaag cggttatctt ctttgcattc accgcaccga 55140
taacatcgca tcatgcagct tccctcccga agtcgaaatc aagctgccct ccaaatattt 55200
cgcatgactc agaacaagag ccggtatcga atcttttagc tcgtaccatg tcctgataca 55260
gggcttgata atcattttct gaatacattt tcgcgatacc gtccagcgac attcttcctc 55320
ggtacataat ctcctttggc gtttcccgat gtccgtcacg cacatgggat cccgtgatga 55380
cctcattaaa aacacgctgc aatccctcct catctttgca ggcaagtccg attttttgcg 55440
ttgatttttt aatgcagaat atgcagttac cgagatgttc cggtatttgc aaatcgaatg 55500
gttgttgctt ccaccatgcg aggatatctt ccttctcaaa gtctgacagt tcagcaagat 55560
atctgattcc aggctttggc tttagccgct tcggttcatc agctctgatg ccaatccacg 55620
tggtgtaatt ccctcgcccg aaatggtcat cacagtattt ggtgaaggga acgagtttta 55680
atctgtcagt gcagaacgcg ccgccgacgt atggagtgcc atatttcttt accatatcga 55740
taaatggctt cagaacaggc attcgcgtct gaatatcctt tggttcccat accgtataac 55800
catttggctg tccaagctcc gggttgatat caacctgcaa tacggtgagc ggtatatccc 55860
agaacttcac aacttccctg acaaaccgat atgtcattgg atgttcacaa cctgtatcca 55920
tgaaaacgta atgcacgtct ttacctgccc gtcgcttttg ctccattagc cagagcaaat 55980
atgctgacgt cctgccaccg gagaaactaa cgacatttat catgcagccc tgtctcccca 56040
tctcgctttc cactccagag ccagtctcgc ttcgtctgac cacttaacgc cacgctctgt 56100
accgaatgcc tgtataagct ctaatagctc cgcaaattcg cctacacgca tcctgctggt 56160
tgactggcct attaccacaa agccattccc ggcaaggtta ggaacaacat cctgctgctt 56220
taatgctgcg gtaaacacac acttccagct ttctgcatcc agccagcgac catgccattc 56280
aacctgacga gagacgtcac ctaagcaggc ccatagcttc ctgttttggt ctaagctgcg 56340
gttgcgttcc tgaatggtta ctacgattgg tttggttggg tctggaagga tttgctgtac 56400
tgcgtgaata gcgttttgct gatgtgctgg agatcgaatt tcaaaggtta gttttttcat 56460
gacttccctc tcccccaaat aaaaaggcct gcgattacca gcaggcctgt tattagctca 56520
gtaatgtaga tggtcatctt ttaactccat ataccgccaa tacccgtttc atcgcggcac 56580
tctggcgaca ctccttaaaa accaggttcg tgctcatctt tccttcccgt tcttccctgg 56640
tagcaaaccg gtaatacacc gttcgccaga ccttaccttc gataaccaga agacctgccc 56700
gtgccatttt agccgcggcc tgatttatgc tggttactgt tgcgcctgtt agcgcggcaa 56760
cgtccggcgc acagaagcta ttatgcgtcc ccaggtaatg aataattgcc tctttgcccg 56820
tcatacactt gctcctttca gtccgaactt agctttgatt tctgcgatct tcgccagagc 56880
ctgtgcacga tttagaggtc taccgcccat gacaggaagt tgttttactg gttcagggat 56940
cgcctcacca cggttaattc tcgcagtcat atggacaagc tcatctgcgg ccttacggcg 57000
taattccgca tcagtaagcg cattggcccg catgttctga tacaggttgg taaccagcca 57060
gtagtgcgcg tttgatttcc acggataaga ctccgcatcc ggatacaggc ctcgcttccg 57120
gcaatactcg taaaccatat caaccagctc gctgacgttt ggcagtccgg cggtaacgga 57180
tgcttcttcc cggcaccatg caacaaactg cccgggtgat ggcagaaatg gtcgattctg 57240
ccgacgggct acgcgcattc ctgcgttaac ctgttccatc gtggtgatcc cgttttcccg 57300
aaaagccaga acccactggc gacggatttc gttcacttcg ttctggtcac ggttagccag 57360
gctcgccggg aaagttgcca gtaactggct gaacacaccg ttgatgatct gcgctacctg 57420
ctgtacctgc ggcttttcgt cgtactgttc cggcatgttg ttggcgatcc gacgcatctg 57480
ctcacggtca aagttaacca tctgtgcggc gatgtttttc atagatccac cccgtaaatc 57540
cagtctgtgt ttgtcaggtc gagttttggt ttgctggctg tcacgcctgc ctgttgcttg 57600
ttacggttga tttcgagttg ggtccactta tcgcggagtt tggccgggct cagcacgtta 57660
ccggaccaga agttgtcctg gcatgcccag cggaacagca cacacatgtc gcggtggtta 57720
cgtccgtcac gttcacgcat caggcggata tcgttagccc acccagcaaa attcggtttt 57780
ctggctgatg gtgcgatagt cttcaccatg tcaaacatcc actctgcggc ggtcaggtct 57840
tctgctgtcc cccacttgct gccgctctga attgcagcat ccggtttcac cacagaaagg 57900
tcgttttctg gctggtcaga ggattcgcca gaattctctg acgaataatc ttttcttttt 57960
tcttttgtaa tagtgtcttt tgtgtccccc tgttttgagg gatagcaatc ccccaatttg 58020
agggatgttt tatccctcgt tttaggggat tttccctcgt tttgagggat gcaccattct 58080
gagatgtttt tatttggtcc aaacatgccg ccttgctgct tgataatatt cattctgacg 58140
agttctaact tggcttcatt gcaccgtttg acaggtaact ttgtaatctc gctaagttga 58200
gaatcggtga ttctgtccat tggtttattc cacccatagg ttttacgcag aatggcaagc 58260
agcactttaa actgtcgctt ggtcagatct gcgcccgaat aagcctcaag cagcatattt 58320
gatagtctgg cgtaaccatc atcgagatct gccacattac gctcctgtcc ggcaaagtta 58380
cctctgccga agttgagtat ttttgctgta tttgtcataa tgactcctgt tgatagatcc 58440
agtaatgacc tcagaactcc atctggattt gttcagaacg ctcggttgcc gccgggcgtt 58500
ttttattggt gagaatcgca gcaacttgtc gcgccaatcg agccatgtcg tcgtcaacga 58560
ccccccattc aagaacagca agcagcattg agaactttgg aatccagtcc ctcttccacc 58620
tgctgatctg cgacttatca acgcccacag cttccgctgt cttctcagtt ccaagcattg 58680
cgattttgtt aagcaacgca ctctcgattc gtagagcctc gttgcgtttg tttgcacgaa 58740
ccatatgtaa gtatttcctt agataacaat tgattgaatg tatgcaaata aatgcataca 58800
ccataggtgt ggtttaattt gatgcccttt ttcagggctg gaatgtgtaa gagcggggtt 58860
atttatgctg ttgttttttt gttactcggg aagggcttta cctcttccgc ataaacgctt 58920
ccatcagcgt ttatagttaa aaaaatcttt cggcctgcat gaatggcctt gttgatcgcg 58980
ctttgatata cgccgagatc tttagctgtc ttggtttgcc caaagcgcat tgcataatct 59040
ttcagggtta tgcgttgttc catacaacct ccttagtaca tgcaaccatt atcaccgcca 59100
gaggtaaaat agtcaacacg cacggtgtta gatatttatc ccttgcggtg atagatttaa 59160
cgtatgagca caaaaaagaa accattaaca caagagcagc ttgaggacgc acgtcgcctt 59220
aaagcaattt atgaaaaaaa gaaaaatgaa cttggcttat cccaggaatc tgtcgcagac 59280
aagatgggga tggggcagtc aggcgttggt gctttattta atggcatcaa tgcattaaat 59340
gcttataacg ccgcattgct tacaaaaatt ctcaaagtta gcgttgaaga atttagccct 59400
tcaatcgcca gagaaatcta cgagatgtat gaagcggtta gtatgcagcc gtcacttaga 59460
agtgagtatg agtaccctgt tttttctcat gttcaggcag ggatgttctc acctaagctt 59520
agaaccttta ccaaaggtga tgcggagaga tgggtaagca caaccaaaaa agccagtgat 59580
tctgcattct ggcttgaggt tgaaggtaat tccatgaccg caccaacagg ctccaagcca 59640
agctttcctg acggaatgtt aattctcgtt gaccctgagc aggctgttga gccaggtgat 59700
ttctgcatag ccagacttgg gggtgatgag tttaccttca agaaactgat cagggatagc 59760
ggtcaggtgt ttttacaacc actaaaccca cagtacccaa tgatcccatg caatgagagt 59820
tgttccgttg tggggaaagt tatcgctagt cagtggcctg aagagacgtt tggctgatcg 59880
gcaaggtgtt ctggtcggcg catagctgat aacaattgag caagaatctt catcgaatta 59940
ggggaatttt cactcccctc agaacataac atagtaaatg gattgaatta tgaagaatgg 60000
tttttatgcg acttaccgca gcaaaaataa agggaaagat aagcgctcaa taaacctgtc 60060
tgttttcctt aattctctgc tggctgataa tcatcacctg caggttggct ccaattattt 60120
gtatattcat aaaatcgatg gaaaaacttt tctctttacc aaaacaaatg acaagagtct 60180
ggttcagaag ataaatcgct ctaaagcttc agttgaagat attaagaaca gcctcgcaga 60240
tgacgaatca ttgggattcc catctttttt gtttgttgaa ggcgacacca ttggttttgc 60300
cagaactgtt ttcgggccga ccacatccga tctgacagat tttttaatcg ggaaaggaat 60360
gtcattaagc agtggagagc gcgttcagat agagccactg atgaggggaa ccaccaaaga 60420
cgatgttatg catatgcatt tcatcggccg aacaacggtg aaggtagaag ccaagctacc 60480
tgtatttggc gatatattaa aggtcttagg ggcaacagat attgaagggg agctttttga 60540
ctcattggat atagtcatta agccaaaatt taaaagggat ataaaaaagg ttgccaagga 60600
tattattttt aacccgtcac ctcaattttc agacattagc ctgcgggcaa aagatgaggc 60660
cggagatatt ttaacagaac attatctatc agaaaaaggc catctctcag cgcctctgaa 60720
caaggtcacc aatgctgaga tagctgaaga gatggcatat tgctacgcaa gaatgaaaag 60780
tgatatactg gaatgtttta aaaggcaggt gggcaaagtt aaggattaat tatcaggagt 60840
aattatgcgg aacagaatca tgcctggtgt ttacatagta ataattcctt acgttatcgt 60900
aagcatttgc tatctccttt tccgccacta cattcctggt gtttcttttt cagctcatag 60960
agatggtctt ggggcgacat tgtcatcata tgcaggaacc atgattgcaa tcctgattgc 61020
tgccttgacg tttctaatcg gaagcagaac gcgccgactg gccaagatta gagagtatgg 61080
gtatatgaca tcggtagtta ttgtctatgc ccttagtttt gttgagcttg gagctttgtt 61140
tttctgcggg ttattgcttc tttccagcat aagcggctac atgataccca ctatcgccat 61200
cggcattgcc tctgcatcgt tcattcatat atgcatcctt gttttccaac tatataattt 61260
gaccagagaa caagaataac ccggcctcag cgccgggttt tctttgcctc acgatcgccc 61320
ccaaaacaca taaccaattg tatttattga aaaataaata gatacaactc actaaacata 61380
gcaattcaga tctctcacct accaaacaat gcccccctgc aaaaaataaa ttcatataaa 61440
aaacatacag ataaccatct gcggtgataa attatctctg gcggtgttga cataaatacc 61500
actggcggtg atactgagca catcagcagg acgcactgac caccatgaag gtgacgctct 61560
taaaaattaa gccctgaaga agggcagcat tcaaagcaga aggctttggg gtgtgtgata 61620
cgaaacgaag cattggccgt aagtgcgatt ccggattagc tgccaatgtg ccaatcgcgg 61680
ggggttttcg ttcaggacta caactgccac acaccaccaa agctaactga caggagaatc 61740
cagatggatg cacaaacacg ccgccgcgaa cgtcgcgcag agaaacaggc tcaatggaaa 61800
gcagcaaatc ccctgttggt tggggtaagc gcaaaaccag ttaaccgccc tattctctcg 61860
ctgaatcgca aaccgaaatc acgagtagaa agcgcactaa atccgataga ccttacagtg 61920
ctggctgaat accacaaaca gattgaaagc aacctgcaac gtattgagcg caagaatcag 61980
cgcacatggt acagcaagcc tggcgaacgc ggcataacat gcagtggacg ccagaaaatt 62040
aagggaaaat cgattcctct tatctagtta cttagatatt ggccttggct ttatctcaat 62100
attatatgga tcatagctgg caactaattc agtccagtaa atatcctcaa tagggaataa 62160
tatatgcttt ccattccatc gggaaaaagt tttgttcaac acaccaagct caatcaactc 62220
actaatgtat gggaattgtt ttgatgtaac cacatacttc ctgccttcat taagggctgc 62280
gcacaaaacc atagattgct cttctgtaag gttttgaatt actgatcgca ctttatcgtt 62340
ttgcatctta atgcgttttc ttagcttaaa tcgcttatat ctggcgctgg caatagctga 62400
taatcgatgc acattaattg ctagcgaaaa tgcaagagca aagacgaaaa catgccacac 62460
atgaggaata ccgattctct cattaacata ttcaggccag ttatctgggc ttaaaagcag 62520
aagtccaacc cagataacga tcatatacat ggttctctcc agaggttcat tactgaacac 62580
tcgtccgaga ataacgagtg gatccatttc tatactcatc aaactgtagg ggttgtaata 62640
gtttatccga tttctcgctg taggggtaca cgagaaccac cgagcctgat gtggttaaaa 62700
gacaggcaca atctttacta ccgcaatcca ctatttaagg tgatatatgg aagaagaatt 62760
tgaagagttc gaagagcatc ctcaggatgt gatggaacaa taccaggact atccgtatga 62820
ctacgactat tgataaaaat caatggtgtg gacaattcaa gcgatgcaat ggatgcaagc 62880
tgcaatcgga atgcatggtt aagcctgaag aaatgtttcc tgtaatggaa gatgggaaat 62940
atgtcgataa atgggcaata cgaacgacgg caatgattgc cagagaactt ggtaaacaga 63000
acaacaaagc tgcctgatag tggcctttat ttttggcata aataacagaa taaacactgc 63060
actgtgtatt cattccaacg agtgaataca cggagcaatg tcgctcgtaa ctaaacagga 63120
gccgacttgt tctgattatt ggaaatcttc tttgccctcc agtgtgaggg cgatttttta 63180
tctgtgagga tatgaacaga tgtcaaacat caaaaaatac atcattgatt acgactggaa 63240
agcatcaata gaaattgaaa tcgaccatga cgtaatgaca gaggaaaaac ttcaccagat 63300
taataatttc tggtcagact ctgaataccg actcaataaa cacggctctg tattaaatgc 63360
tgtattaatc atgctggcgc aacatgctct gcttatagca atttcaagcg acttaaatgc 63420
atatggtgtt gtgtgtgagt tcgactggaa tgatggaaat ggtcaggaag gatggcctcc 63480
aatggatggt agcgaaggaa taagaattac cgatatcgat acatcaggaa tatttgattc 63540
agatgatatg actatcaagg ccgcctgagt gcggttttac cgcataccaa taacgcttca 63600
ctcgaggcgt ttttcgttat gtataaataa ggagcacacc atgcaatatg ccattgcagg 63660
gtggcctgtt gctggctgcc cttccgaatc tttacttgaa cgaatcaccc gtaaattacg 63720
tgacggatgg aaacgcctta tcgacatact taatcagcca ggagtcccaa agaatggatc 63780
aaacacttat ggctatccag actaaattca ctatcgccac ttttattggc gatgaaaaga 63840
tgtttcgtga agccgtcgac gcttataaaa aatggatatt aatactgaaa ctgagatcaa 63900
gcaaaagcat tcactaaccc cctttcctgt tttcctaatc agcccggcat ttcgcgggcg 63960
atattttcac agctatttca ggagttcagc catgaacgct tattacattc aggatcgtct 64020
tgaggctcag agctgggcgc gtcactacca gcagctcgcc cgtgaagaga aagaggcaga 64080
actggcagac gacatggaaa aaggcctgcc ccagcacctg tttgaatcgc tatgcatcga 64140
tcatttgcaa cgccacgggg ccagcaaaaa atccattacc cgtgcgtttg atgacgatgt 64200
tgagtttcag gagcgcatgg cagaacacat ccggtacatg gttgaaacca ttgctcacca 64260
ccaggttgat attgattcag aggtataaaa cgaatgagta ctgcactcgc aacgctggct 64320
gggaagctgg ctgaacgtgt cggcatggat tctgtcgacc cacaggaact gatcaccact 64380
cttcgccaga cggcatttaa aggtgatgcc agcgatgcgc agttcatcgc attactgatc 64440
gttgccaacc agtacggcct taatccgtgg acgaaagaaa tttacgcctt tcctgataag 64500
cagaatggca tcgttccggt ggtgggcgtt gatggctggt cccgcatcat caatgaaaac 64560
cagcagtttg atggcatgga ctttgagcag gacaatgaat cctgtacatg ccggatttac 64620
cgcaaggacc gtaatcatcc gatctgcgtt accgaatgga tggatgaatg ccgccgcgaa 64680
ccattcaaaa ctcgcgaagg cagagaaatc acggggccgt ggcagtcgca tcccaaacgg 64740
atgttacgtc ataaagccat gattcagtgt gcccgtctgg ccttcggatt tgctggtatc 64800
tatgacaagg atgaagccga gcgcattgtc gaaaatactg catacactgc agaacgtcag 64860
ccggaacgcg acatcactcc ggttaacgat gaaaccatgc aggagattaa cactctgctg 64920
atcgccctgg ataaaacatg ggatgacgac ttattgccgc tctgttccca gatatttcgc 64980
cgcgacattc gtgcatcgtc agaactgaca caggccgaag cagtaaaagc tcttggattc 65040
ctgaaacaga aagccgcaga gcagaaggtg gcagcatgac accggacatt atcctgcagc 65100
gtaccgggat cgatgtgaga gctgtcgaac agggggatga tgcgtggcac aaattacggc 65160
tcggcgtcat caccgcttca gaagttcaca acgtgatagc aaaaccccgc tccggaaaga 65220
agtggcctga catgaaaatg tcctacttcc acaccctgct tgctgaggtt tgcaccggtg 65280
tggctccgga agttaacgct aaagcactgg cctggggaaa acagtacgag aacgacgcca 65340
gaaccctgtt tgaattcact tccggcgtga atgttactga atccccgatc atctatcgcg 65400
acgaaagtat gcgtaccgcc tgctctcccg atggtttatg cagtgacggc aacggccttg 65460
aactgaaatg cccgtttacc tcccgggatt tcatgaagtt ccggctcggt ggtttcgagg 65520
ccataaagtc agcttacatg gcccaggtgc agtacagcat gtgggtgacg cgaaaaaatg 65580
cctggtactt tgccaactat gacccgcgta tgaagcgtga aggcctgcat tatgtcgtga 65640
ttgagcggga tgaaaagtac atggcgagtt ttgacgagat cgtgccggag ttcatcgaaa 65700
aaatggacga ggcactggct gaaattggtt ttgtatttgg ggagcaatgg cgatgacgca 65760
tcctcacgat aatatccggg taggcgcaat cactttcgtc tactccgtta caaagcgagg 65820
ctgggtattt cccggccttt ctgttatccg aaatccactg aaagcacagc ggctggctga 65880
ggagataaat aataaacgag gggctgtatg cacaaagcat cttctgttga gttaagaacg 65940
agtatcgaga tggcacatag ccttgctcaa attggaatca ggtttgtgcc aataccagta 66000
gaaacagacg aagaatttca tacgttagcc gcatcccttt cacaaaagct ggaaatgatg 66060
gtggcgaaag cagaagcaga tgagagaaac caggtatgac aaccacggaa tgcatttttc 66120
tggcagcggg cttcatattc tgtgtgctta tgcttgccga catgggactt gttcaatgac 66180
acctcagcag gaaaacgccc ttcgcagcat tgcccgtcag gctaattctg aaatcaaaaa 66240
aagccagaca gcagtttccg gataaaaacg tcgatgacat ttgccgtagc gtactgaaga 66300
agcaccgcga aacggtaacg ctgatgggat tcacaccgac tcatttaagc ctggcaatcg 66360
gcatgttaaa cggcgtcttt aaggaacgat gaacatgaaa agcaaaatca tcagggagct 66420
acaggctcct tttttattat tcgcattcac cctcaagcgt attaaccaac agttcaggga 66480
ttaatgaaag atggcagaca tcattgattc agcatcagaa atagaagaat tacagcgcaa 66540
cacagcaata aaaatgcgcc gcctgaacca ccaggctata tctgccactc attgttgtga 66600
gtgtggcgat ccgatagatg aacgaagacg cctggtcgtt cagggttgtc ggacttgtgc 66660
aagttgccag gaggatctgg aacttatcag taaacagaga ggttcgaagt gagcgaaatt 66720
aactctcagg cactgcgtga agcggcagag caggcaatgc atgacgactg gggatttgac 66780
gcagaccttt tccatgaatt ggtaacacca tcgattgtgc tggaactgct ggatgaacgg 66840
gaaagaaacc agcaatacat caaacgccgc gaccaggaga acgaggatat tgcgctaaca 66900
gtagggaaac tgcgtgttga gcttgaaaca gcaaaatcaa aactcaacga gcagcgtgag 66960
tattacgaag gtgttatctc ggatgggagt aagcgtattg ctaaactgga aagcaacgaa 67020
gtccgtgaag acggaaacca gtttcttgtt gttcgccatc ctgggaagac tcctgttatc 67080
aagcactgca ctggtgacct ggaagagttt ctgcggcagt taatcgaaca agacccgtta 67140
gtaactatcg acatcattac gcatcgctat tacggggttg gaggtcaatg ggttcaggat 67200
gcaggtgagt atctgcatat gatgtctgac gctggcattc gcatcaaagg agagtgagat 67260
cggttttgta aaagataacg cttgtgaaaa tgctgaattt cgcgtcgtct tcacagcgat 67320
gccagagtct gtagtgtcag atgatgaccg tactcaaaca tcgggttgag tattatctta 67380
ctgtttcttt acataaacat tgctgatacc gtttagctga aacgacatac attgcaagga 67440
gtttataaat gagtatcaat gagttagagt ctgagcaaaa agattgggcg ttatcaatgt 67500
tgtgcagatc cggtgtcttg tctccatgca gacatcacga aggtgtttat gtagatgaag 67560
gtatagatat agagtcggca tacaaatatt ccatgaaggt ttataagtct aatgaagaca 67620
aatccccatt ctgcaatgtg cgagaaatga ctgataccgt gcaaaattat tatcacgagt 67680
acggtggaaa cgatacttgc cctctctgta caaaacatat agatgattaa acccaatatt 67740
acataacaat cctcgcactc gcggggattt attttatctg aactcgctac ggcgggtttt 67800
gttttatgga gatgataaat gcacttccga gtcacaggag aatggaatgg agagccattc 67860
aacagagtta tcgaagcgga gaacatcaac gactgctacg accactggat gatatgggcg 67920
cagatagcac atgcagacgt aaccaatatt cgaattgaag aactgaaaga acaccaagcc 67980
gcctgatggc ggttttttct tgcgtgtaat tgcggagact ttgcgatgta cttgacactt 68040
caggagtgga acgcacgcca gcgacgtcca agaagccttg aaacagttcg tcgatgggtt 68100
cgggaatgca ggatattccc acctccggtt aaggatggaa gagagtatct gttccacgaa 68160
tcagcggtaa aggttgactt aaatcgacca gtaacaggtg gccttttgaa gaggatcaga 68220
aatgggaaga aggcgaagtc atgagcgccg ggatttaccc cctaaccttt atataagaaa 68280
caatggatat tactgctaca gggacccaag gacgggtaaa gagtttggat taggcagaga 68340
caggcgaatc gcaatcactg aagctataca ggccaacatt gagttatttt caggacacaa 68400
acacaagcct ctgacagcga gaatcaacag tgataattcc gttacgttac attcatggct 68460
tgatcgctac gaaaaaatcc tggccagcag aggaatcaag cagaagacac tcataaatta 68520
catgagcaaa attaaagcaa taaggagggg tctgcctgat gctccacttg aagacatcac 68580
cacaaaagaa attgcggcaa tgctcaatgg atacatagac gagggcaagg cggcgtcagc 68640
caagttaatc agatcaacac tgagcgatgc attccgagag gcaatagctg aaggccatat 68700
aacaacaaac catgtcgctg ccactcgcgc agcaaaatca gaggtaagga gatcaagact 68760
tacggctgac gaatacctga aaatttatca agcagcagaa tcatcaccat gttggctcag 68820
acttgcaatg gaactggctg ttgttaccgg gcaacgagtt ggtgatttat gcgaaatgaa 68880
gtggtctgat atcgtagatg gatatcttta tgtcgagcaa agcaaaacag gcgtaaaaat 68940
tgccatccca acagcattgc atattgatgc tctcggaata tcaatgaagg aaacacttga 69000
taaatgcaaa gagattcttg gcggagaaac cataattgca tctactcgtc gcgaaccgct 69060
ttcatccggc acagtatcaa ggtattttat gcgcgcacga aaagcatcag gtctttcctt 69120
cgaaggggat ccgcctacct ttcacgagtt gcgcagtttg tctgcaagac tctatgagaa 69180
gcagataagc gataagtttg ctcaacatct tctcgggcat aagtcggaca ccatggcatc 69240
acagtatcgt gatgacagag gcagggagtg ggacaaaatt gaaatcaaat aatgatttta 69300
ttttgactga tagtgacctg ttcgttgcaa caaattgata agcaatgctt ttttataatg 69360
ccaacttagt ataaaaaagc tgaacgagaa acgtaaaatg atataaatat caatatatta 69420
aattagattt tgcataaaaa acagactaca taatactgta aaacacaaca tatgcagtca 69480
ctatgaatca actacttaga tggtattagt gacctgtaac agagcattag cgcaaggtga 69540
tttttgtctt cttgcgctaa ttttttgtca tcaaacctgt cgcactccag agaagcacaa 69600
agcctcgcaa tccagtgcaa agctttgtgt gccacccact acgacctgca taaccagtaa 69660
gaagatagca gtgatgtcaa acgacgcagc tgacttcttt tctttcacga cttccccaca 69720
cccagcatgc atacctttcc gccataactg tagtgaatgt ctgttatgag cgaggagcgg 69780
aagttaacac ttatgaaaaa tggctacgaa gtccgtggct atctatcggc ttattagtac 69840
ttgaaacgct tcttcagaag cctgaagagc taatcgttcg gcgatactat atatgcatta 69900
atagactata tcgttggtat aaacagtgca ccatgcaaca tgaataacag tgggttatcc 69960
aaaaggaagc agaaagctaa atatggaaaa ctacaatacg atgccccgtt aagttcaata 70020
ctactaattt ttagatggaa aacgtatgta atagagagta acttaaaaga gagatcctgt 70080
gttgccgcca aataaattgc ggttatttta ataaaattaa gggttactat atgttggagt 70140
ttagtgttat tgaaagaggc gggtatattc ctgcagtaga aaaaaataag gcattcctac 70200
gagcagatgg ttggaatgac tattcctttg ttacaatgtt ttatcttact gtctttgatg 70260
agcatggtga aaaatgcgat atcggaaatg ttaaaattgg ttttgtaggt caaaaagaag 70320
aagtaagcac ttattcatta atagataaaa aattcagtca actccctgaa atgttttttt 70380
ccttaggtga aagcattgac tactatgtta atctcagcaa attaagcgat ggttttaaac 70440
ataaccttct taaagctatt caggatttag tagtatggcc aaatcgatta gccgacattg 70500
aaaatgaaag cgtccttaac acctcattac ttagaggggt aactctttca gaaattcatg 70560
gacagttcgc acgtgtgtta aatggtttgc cagaattgtc agatttccac ttttcattta 70620
atagaaaaag tgctcccgga ttcagtgatt taactatacc ttttgaggtg acggttaatt 70680
ctatgcccag cacgaacatt catgctttta tcgggcggaa tgggtgtggt aaaacaacaa 70740
ttttgaatgg aatgattggt gcaatcacca acccagaaaa caatgaatat tttttctctg 70800
aaaataatag acttatcgag tcaagaatcc caaagggata ttttcgatcg cttgtttcag 70860
tttcgtttag tgcatttgat ccttttactc ctcctaaaga acaacctgac ccagcaaaag 70920
gtacacaata cttttatatt ggactcaaga atgctgccag caatagttta aaatcactag 70980
gcgatctccg cttagaattc atttcagcat ttattggttg tatgagagta gatagaaaaa 71040
gacaactctg gcttgaagct atcaaaaaac taagtagtga tgaaaacttt tcaaatatgg 71100
aactcatcag cctcatttct aaatatgaag agttaagacg taatgaacca cagattcaag 71160
tggacgatga taaattcact aaattgtttt atgacaatat ccagaaatat ctgcttcgaa 71220
tgagctctgg acatgcaatt gttttattta ctatcacaag attagtagat gtcgttggcg 71280
aaaagtcatt agttttattc gatgaaccag aggttcatct gcatccacct ttgctctctg 71340
cttttttacg aacattaagc gacttactcg atgcacgcaa tggtgtagca ataattgcaa 71400
ctcattcccc agtagtactg caagaggttc caaaatcctg catgtggaaa gtcctacggt 71460
caagagaagc aataaatatt atccgtccgg atattgagac attcggtgag aacttaggtg 71520
ttttaactcg tgaggtgttt ttacttgaag tgacaaattc tggataccac cacttattat 71580
cgcagtccgt tgattcagag ctttcttatg aaaccattct aaaaaattat aatggtcaga 71640
taggattaga aggtcgaacc gttttaaaag cgatgataat gaacagagat gaaggtaaag 71700
tacaatgaaa aaactacctc ttccagcgag aacttatagc gaaatgctta ataaatgctc 71760
ggaaggtatg atgcagataa atgttagaaa taatttcatt actcacttcc ccactttttt 71820
gcagaaagaa caacaatata gaatattaag ctcgacaggt cagttattta cctacgacag 71880
gacacaccct cttgagccta caaccttagt agttggtaac ctgacaaagg ttaaattaga 71940
aaagctttat gaaaataatc tccgagataa aaacaaaccc gctagaacat attacgatga 72000
catgcttgtt tcatcaggtg aaaaatgtcc attttgtggt gatataggac agacaaaaaa 72060
tatagatcat tttcttccta ttgcacatta tcctgaattt tcggtgatgc ctattaattt 72120
agttccatcg tgccgcgact gcaatatggg agagaaaggt caagttttcg cagtagatga 72180
ggtacaccaa gcgattcatc cctatatcga caaggacatt ttttttcgtg agcaatgggt 72240
atatgcaaat ttcgtttccg gaactccggg tgctatcagt ttttatgttg aatgcccggc 72300
gaactggagg caggaagaca aacacagagc tcttcatcat ttcaagctat taaatattgc 72360
taacaggtat cgtttggagg cagggaagca cttgagtgaa gtgattactc aaagaaactc 72420
tttcgtaaaa gttataagga aatatagttc aaccgcaacg tttcagcagc tacagtcaga 72480
atttattgaa gcaaatctga aacctattat agatttgaat gacttcccca attattggaa 72540
aagagttatg tatcagtgcc tagcaaactc ggaagatttt ttcagaggga tctagaatat 72600
gatgaaagat agaaaattac gacgcttatc ggaagtgaac gaatactttt tatatgagga 72660
gggctgtttt tacaaaatcc ggtagtaact tgctaaccaa ttcctaggca ggtcattggc 72720
aacagtggca tgcaccgaga aggacgtttg taatgtccgc tccggcacat agcagtccta 72780
gggacagtgg cgtacagtca tagatggtcg gtgggaggtg gtacaaattc tctcatgcaa 72840
aaaatatgta aaatcggtag caactggaaa tcattcaaca cccgcactat cggaagttca 72900
ccagccagcc gcagcacgtt cctgcatacg acgtgtctgc ggctctacca tatctcctat 72960
gagcaacgtg ttagcagagc caagccacaa ctctaatttt aatacataat gaatgataat 73020
aataatatta aaaatttcct gtgtaactaa tttactatat ggtttctgat aagaatcatt 73080
gcaaagatca aacaacttgt attacattga cagttaagca gttaatttta tcacctctaa 73140
aatatatcag catctagcat gcaacctatc aaaatggaga gttttatgac taaaaaacca 73200
tgggaaagaa gacttaaaga tttatcgcac ttgctcaaat gctgcattga tacatatttt 73260
gaccctgaat tatttcgctt gaatttgaat caattcctcc aaaccgcaag aacagtaaca 73320
tttattattc aaaaaaacaa aaaccagatt ataggatatg acatttggta taacaataat 73380
gttattgaaa aatggaaaaa tgatccatta atggcttggg ctaaaaattc tcgcaatacg 73440
atagaaaaac aaggcgattt agaaatgtat agcgaggcaa aggctactct tatttcatct 73500
tacattgaag aaaatgacat tgagtttatt acaaatgaaa gtatgttaaa cattggtata 73560
aaaaagttag tcagacttgc acaaaagaaa ttaccttcat atttaactga atcatctatt 73620
attaaatcag aaagacgatg ggtcgctaat acgctaaaag attacgaatt attacatgcc 73680
ttagctataa tctatggcag aatgtataac tgctgtaact ctcttggcat acaaataaac 73740
aatccaatgg gtgacgatgt gatttcgcca acatcattcg actctttatt tgatgaagcc 73800
aggagaataa cttatttaaa attaaaagat tactccataa gcaaattgtc atttagcatg 73860
atacaatatg acaataaaat aattcctgaa gatattaaag agcgtctaaa actggtagat 73920
aagcctaaaa atatcacttc gacagaagag ttagttgact atacagccaa gcttgcagaa 73980
acgacttttt taaaggacgg ttatcacatt caaacattaa ttttttatga taaacaattc 74040
catccaattg atttaatcaa tacaacattt gaagatcaag cagataaata tattttttgg 74100
cgttatgcag ctgacagagc caaaataaca aatgcctatg gcttcatttg gatatcagag 74160
ctatggctca gaaaagcaag catctactcc aataaaccaa tacatacaat gccaattata 74220
gatgaaagac ttcaggtaat tggaattgat tcaaataata atcaaaaatg tatttcatgg 74280
aaaatagtta gagaaaacga agaaaaaaaa ccgactttag aaatatcaac agcagactca 74340
aaacatgacg aaaaaccata tttcatgcgt tcagtcttaa aagcaattgg cggtgatgta 74400
aacactatga acaattgagt catagaactt ccattattct cctgaagata ataatcgcca 74460
aataaaccaa tactcagctt tacaatatac taactaaccg cagaacgtta tttcatacaa 74520
cgtttctgcg gcatatcaca aaacgattac tccataacag ggacagcagg ccactcaata 74580
tcaggtgcag ttgatgtatc aacacggttc agcaacaccc gatacttctt ccaggcttcc 74640
agcaacgagg tttcttcctt cgttgcaatt tccagatctg cagcatcctg aagcggcgca 74700
atatgctcac tggctacctg catcaggctt ttttttgttt cttccgcctc ccggatccgg 74760
aacagttttt ctgcttccgt atccttcacc caggctgtgc cgttccactt ctgatattcc 74820
cctcccggcg ataaccaggt aaaattttcc ggtaacggac cgagttcaga aataaataac 74880
gcgtcgccgg aagccacgtc atagacggtt ttaccccgat ggtcttcaac gagatgccac 74940
gatgcctcat cactgttgaa aacagccaca aagccagccg gaatatctgg cggtgcaata 75000
tcggtactgt ttgcaggcag accggtatga ggcggaatat atgcgtcacc ttcaccaata 75060
aattcattag ttccggccag cagattataa atttttatgg tccgtggttg ttcactcatt 75120
ctgaatgcca ttatgcaagc ctcacaatat agttaaatgc aatgtttttg acggtgtttt 75180
ccgcgttacc cgcagcgtta acggtgatgg tgtgtccgtg tgaaccaata ctgaaagaat 75240
gggcatgagc accgataaca accggatgct ggtgcgcacc aataccaact gtatgcgcat 75300
gtgcaccggc actcacggct gtaccggaca atgagtgact gtggctgccc tgactgtccg 75360
ttttcgataa ataagcaata ccctgtgtgc tggttccttt aactgtggat aaacttcctg 75420
taatggttgc tgttccatac tgactccagc cagaactgtt catccttaaa ccacttgtgt 75480
gggcatgagc acccgcggcc cctgttgaac cgctcagact gtgagcatga gcccccgtgt 75540
tattcgtcga tttggtgccg taatcgaaac tgcctgttgt tttcgtcccg taatcaaacg 75600
acgatgtggt tttcgtcccc aaatccgtac cggatgcact ggcactgtgg gtgtgcgact 75660
taattccatc ctgttcctga gacaatacag cacgaccgct ggcgggtttc cccttgattg 75720
tccagcctcg catatcagga agcacacccg atggatacgc gacagcaagt tttgggtagg 75780
ctgatttgtc aaacgcctgc ccctgcatca ggacgtagcc agacggaacg atatctgatg 75840
gccacgggat cggcgcacct gccggaaagg ccgaattctc accggcccca aggtattcaa 75900
gaacatctgc aacggaattt tttgccagaa tatccctgcc aacctgagtc agttcagtca 75960
ggctggcggc atcattttcc gcaaaatacg gtaatttatt tttcgccgtg gaaagccctg 76020
ccagcgccgt cagtgtcgca ttcttcggtt gtttacccgc aagcgcgtta gtcatggtgg 76080
tagcaaaatc tggatcattc ccgagcgctg cggccagttc attcagcgta ttcagtgcgt 76140
caggtgacgc gtcgataaca tctgcaatcg cggccagtac aaaagcggtg ttcgcaatct 76200
gggtattgtt tgttcccctg agcgcggttg gtgctgttgg cgttccggtc agtgccggac 76260
tgtccagtgg gcttttctgt tcgtttcatc cattaccacc ttaaccgcct ttggcgttgc 76320
agcaagcgtt tcagacgtgc tgttggttgc actgctgagc tgcactatcc cctttctcgt 76380
tgtgtccgca tcctcaagcg cgacagctga agctatatct tctgcacgtt ttgccgaatt 76440
ttttgcacgt attgccgccg cttctgccgc acttttgctc tgcgatgctg ataccgcact 76500
tcccgcagcc tctgtcgcct tcgtggatgc cgttgacgca ctccccgccg ccgctgtttt 76560
tgcgtctgcc gcggcagagg cgctccgttc cgctgctgtt tcagatgacc tggcattcgt 76620
ctcggacgtt tttgccgccc tggcagaatt ttctgccgcc gttgccgagg aagctgcacg 76680
accggcactt gatgatgcgt tcgtttctga tgattttgct gcctcttttg aggccaccgc 76740
atctcgtgct gaagtggcgg cctctgacgc tttcgtggcc gcggtggagg cagacgtggc 76800
ggctgattgt tgtgacgctg cagcattcgt ttctgacgtt ttcgccgcac cggcactggt 76860
ggccgccgcg ttttttgagg actctgcggc tgcggcactt ttttccgctt cagtggcctt 76920
tgctgatgcc gcttctgcgc cggaggacgc ttcctgagct gacgatgcag cctgtccggc 76980
ggacgtgctg gcggcgcgtg ctgagtcagt tgcatcagtc acaagggccg cgacctgagc 77040
agctgatgca ctggcatcgc cggctgattt cttcgcgtct gccgtactct gtgccaccac 77100
ggacgcgtta cgcgccacct cttccaccat cagttcaaga cgacgcagca cctccggccg 77160
ggcatcatcc tccgtcatgg cacagagaaa atcattcagc gtccccggtt gtgaatcttc 77220
atacacggtg atggtcccgg cgtgcgatgg tggaaaaccg tcaacctgca ggatgacact 77280
gtactgaccg tactccacat ccatgctgta acgcccggct tcatccggat tctctgagcc 77340
caccgtgttc accaccaccg tggtgctgtt acgtctggct ttcagctgaa tggtgcagtt 77400
ctgtaccggt tttcctgtgc cgtctttcag gactcctgaa atctttactg ccatattcac 77460
cccacaaaaa agcccaccgg ttccggcggg ctgtcataac actgtgttac ctggctaatc 77520
agaatttata accgacccca acgatgaatc cgtcagtacg ccagtcgcca ctgccggagc 77580
cttcataagc aatatcaaca acgacggacg ctgccggatt aatctgtata cctgcactcc 77640
acgccactga ggtatgccgc attgcacttt cgtccctggc agtggtcgtc tctttcatat 77700
acccgggagt gatttccgtc ttacggtaat ccattgtact gccggaccac cgactgtgag 77760
ccactccggc catggcgtac gcactgacct gcttactgat ttgtaaaacc ggtccggcca 77820
tcacgctcac ataacgtcca cgcaggctct catagtgaaa cgtatcctcc ccggtcatca 77880
ctgtgctgct ctttttcgac gcggcgaacc ccagggaagc catcaccccc acactgtccg 77940
tcagctcata acggtacttc acgttaatcc ctttcagatg actcacaccg gtatccccgc 78000
ccgacaacga cggcaatgta cccggtttca cttgaaaata gcccaccgta aacgtaccat 78060
gtccaccttc cgcacgggcc ggagtgactg tcaccgcaag tgcggcaaag acagcaacgg 78120
caatacacac attacgcatc gttcacctct cactgtttta taataaaacg cccgttcccg 78180
gacgaacctc tgtaacacac tcagaccacg ctgatgccca gcgcctgttt cttaatcacc 78240
ataacctgca catcgctggc aaacgtatac ggcggaatat ctgccgaatg ccgtgtggac 78300
gtaagcgtga acgtcaggat cacgtttccc cgacccgctg gcatgtcaac aatacgggag 78360
aacacctgta ccgcctcgtt cgccgcgcca tcataaatca ccgcaccgtt catcagtact 78420
ttcagataac acatcgaata cgttgtcctg ccgctgacag tacgcttact tccgcgaaac 78480
gtcagcggaa gcaccactat ctggcgatca aaaggatggt catcggtcac ggtgacagta 78540
cgggtacctg acggccagtc cacactgctt tcacgctggc gcggaaaagc cgcgctcgcc 78600
gcctttacaa tgtccccgac gattttttcc gccctcagcg taccgtttat cgtacagttt 78660
tcagctatcg tcacattact gagcgtcccg gagttcgcat tcacactgcc actgatatcc 78720
gcatttttag cggtcagctt tccgtccggt gtcagggaaa aggccggagg attgccgccg 78780
ctggtaatgg tgggggccgt caggcgcttc aggaacacgt cgttcatgaa tatctggttg 78840
ccctgcgcca caaacatcgg cgtttcattc ccgtttgccg ggtcaataaa tgcgatacga 78900
ttggcggcaa ccagaaactg gctcagtttg ccttcctccg tgtcctccat gctgaggcca 78960
atacccgcga cataatgttt gccgtctttg gtctgctcaa ttttgacagc ccacatggca 79020
ttccacttat cactggcatc cttccactct ttcgaaaact cctccagtct gctggcgtta 79080
tcctccgtca gctcgacttt ttccagcagc tccttgccga gatgggattc ggttatcttg 79140
cctttgaaaa aatccaggta accttccgca tcatcgctcg cccgaccgac ggcctccacg 79200
aatgccgatt tgccaacggt gttcacactg cggatataaa agtaataatc atggcccggt 79260
ttgatattga tactggcggc tatccagtac agcgccgtac caagataacg cgtgctggtt 79320
tcaacctgtc tgatatccgc aatctgcttt tccgagaacc agaactcaaa ctgtaccgtc 79380
gggtcataaa cggcaagatg cggcgtggcg gttatctgaa aatagcccgg cgtcagctca 79440
atcctcgacg gtgctgccgg tgcggcaatc cggaacgata ccgacgccgg atcgccctgc 79500
tgcccccacg catttaccgc ccggactgtc agcctgtagt tccccagcgc cagttgcgtg 79560
aagcggtatg tggtttccgt cgtccgggcc gtgctgacca gccgctcact gccgtcgtcc 79620
gctgttacgg tcagacggag caggaaactc acgcccttca ccaccttcgg tgtgtcccat 79680
cgcgccagca cctgatattc cccgctgtct gcagtgactt ctgcggtcag gtgctgcacc 79740
gctggcggcg tgacaccatt caccgtgcca ctctgttcgc cgtcaaagtg cgccccgtta 79800
tccacgatgg cctctttttc cggcacatgc tgcacggcgg tgatggcata cgtgccgtcg 79860
tcgttctcac ggatactcac gcagcggaac agtcgctggc gcagcgtcgg cagcttcagc 79920
tcccatacgc tgtattcagc aacaccgtca ggaacacggc tcacttttac cttcacgccg 79980
tcggtgacgg actgaacctc cacgctgacc ggattgccac ttccgtcaac caggcttatc 80040
agcgcggtac cggaggatgg cagcgtgatt tcacggtcga gcgtcagcgt ccgggtctgg 80100
ctgttcaccg ccagcacacg accaccggtg ctgataccgg catagtcatc atcgcagatt 80160
tcaataacat cgcccggtac atggcgaagc ccttctgcgc cgacgctgaa atccacggtc 80220
tgcgtttcca gcagttctgt tttaatcagc cacagcccgg cgcggtgtgc ctgcccccgg 80280
ctggtacagc caaaggcatc catcttcgta acattacgac cgtaacgggc aatggcctgc 80340
gtatcttcaa caagctctgt cgccgtctcc cagccgttgt tcgggtcaat ccagttcacc 80400
tcaacggcat tatggcggtc cttcagggcg ctgaagctgt agcggaacgg cgcgccatca 80460
tccggcatca ccacattact gcggttatag gtccacgtct tatccgacgg tcggtcctgc 80520
acgaacgtca gcgtctgccc gttccatacc ggcatacagc gcatcgccga gcagaaatcg 80580
ctgagcacat cccacgcctt acgctgtgtg gtcaggtacg cattacaggt gatgcgcggc 80640
tccgtgccgc caaagccgtc cggcactgac tggtcgcagt actggccgat gacatacagc 80700
gcccatttat ccacatccgc cgcaccaaga cgtttcccca tgccgtagcg cggatgggtc 80760
agcatatccc acagacacca ggccatgttg ttgctgtatg ccggtttaaa cgttccgtcc 80820
cagataccgc tgtattgccg cgtctgcggg ttatagttcg acggcacctg cagaatacgc 80880
ccgcgcagat gataattacg gctcacctgc tggctgccga actgctccga gtccacctgc 80940
acgccgacca gtgccgtgtt cgggtagcac tgtttcacat cgatgatttc agtgtatgac 81000
gaccagagcg ttttgttctg cagctggtct gtggtgctgt ccggcgtcat cctgcgcatc 81060
cggatattaa acgggcgcgg cggcaggtta cccatcacca ccgaggccag atactgcgag 81120
gtggttttgc ccttaatggt gatgtctttt tccgtcaccc agccaccgtt acgttgtatc 81180
tgaaccagca ggcggacttc cgacggattc ctgtcaccct ttgaggtggt ttccaccagt 81240
gcctgtacac cgaaggtaaa gcgcagacgg tcgatgtttg cagacgtaat ggtgcgggtg 81300
atcggcgtgt catatttcac ttccgtaccc agcaccgtct cggagccgga ggattcaaat 81360
ccctccggcg gagtctgctc ctgctcacca gcccggaaca ccaccgtgac accggatatg 81420
ttggtattcc cctcagtgtc cagcaccggc gtactgttca gcagcacgct ttttaagcca 81480
tccaccggac cttcaatcgg cccttcgctg atggcatcga tcacactcag caactgcgtg 81540
gacttcaggt tgtccttcgc ttcgcgcggg gtatgcccct tactgcttcc tttacccatt 81600
cctcacgctc cataaatgac aaaaccgccc gcaggcggtt tcacataaaa cattttgcat 81660
cagcgaccaa tcaccacaac ctgaccaccg tccccttcgt ctgccgtgct gatctcctga 81720
gaaaccacgc gtgaccccac gcgcatttcc ccgtacagaa caggcagaac attgccctgg 81780
gcaaccatgt tatccagtga ggagaaatag gtgttctgct taccgttatc cgttgtctgt 81840
atacggggag ttctggcttt cggtgccagc atctgcgcca caccaccgag caccatactg 81900
gcaccgagag aaaacaggat gccggtcata ccaccggccc caatggctgc cccccatgct 81960
gcaagggtgg ctccggcggt aaagaatgat ccggcaatgg cggcagcccc caggacaatc 82020
tggaatacgc cacctgactt ggccccggcg actctgggaa caatatgaat tacagcgcca 82080
tcaggcagag tctcatgtaa ctgcgccgtt aacccggacg tgctgacgtc ccgcccggca 82140
atccgtacct gataccagcc gtcgctcagt ttctgacgaa acgccgggag ctgtgtggcc 82200
agtgcccgga tggcttcagc ccccgttttc acacgaaggt cgatgcggcg accaaatcgt 82260
tgtaaatccc cgtaaaggca gatgcgcgcc atgcccggtg acgccagagg gagtgtgtgc 82320
gtcgctgcca tttgtcggtg tacctctctc gtttgctcag ttgttcagga atatggtgca 82380
gcagctcgcc gtcgccgcag taaattgcgg cgtgattcgg cactgatgaa ccaaaacagc 82440
acagcagcac atcgcccggc tgtgccgctg acaacggcac ctgatacagc cccgtcgcct 82500
ccagattatc cagatagaga ttctggccgt tacgccacca gtcatcctca cgatgaaagt 82560
ccggcatctc aatccccgcc agatgataag catcccggaa cagtgtgtaa cagtccgtca 82620
caccgtgctc aaagcgccgc ccggtgagat gcggcacaca gcggaactta tgaatcgtcc 82680
cccggcagac cagccaccac ggcaaatcac tctgcacctg cagccgccgg tcggcctcac 82740
tcagccaggg cagaccaccg gggtggctgt ggaccagcgc cacaatctca ccctgcattt 82800
ctgcctgcag ccagtcttcc ggcgacatac ggaaatagcc tccggctcac cggagatatt 82860
cacgcagggg aaatatcttt ccccctccgg cgtgcttacc acgaagccgc acgactccgc 82920
tggcgcacat cgccgggcgt gcgccagaat cgctgattct gtctgtgtca tgggatttac 82980
tgcgaaagtt tgttaatgga aaggaagccg ccaaagttgc cgacgttatt gcggaactta 83040
caaccgctca ggcatttgct gcatttatcc ttcgtgatat cggacgttgg ctggtcatat 83100
tcatccgcga cagccggacc gctataaccg cactcgtcac cgcgataggt ccaggtgcag 83160
gtgttggcca gcatgatacg tcccggaaaa acagcgccat ccgtttccgt cggcgtggac 83220
agtacaaagg aggcactcac cgcgctcagt tcgctgcact gctcaatgcg ccagcggctg 83280
atcacctcct gctccggatc ggcgtaactg tttccgttga cgaagttcac cgcatccaga 83340
aaacgggcgt aaaccttacg ccggaccacc gttccgccga ccagactctg catatcttcc 83400
gccatcccgg tgaccatacc gtacaggtta gaaaccgtca gcgtggggcg cgtactggtg 83460
cctttgccat tcagttcaaa accgctcccc tgaatgggat acggctgata ctgtcgcccc 83520
tgccaggtga ccggctcacc tttttcgttc tgctcattac agaaaaaata acgttctcca 83580
ccgacctctg tcaggtcgat ttcccagagc accacgctgg ccgactgctc cgcacgggtg 83640
cattcattca gtgtttcctg ccggatatcc tgcatcagtt caccacctgt tcaaactctg 83700
cgctgaactc aacacgcagc atactgaccc gcgacgacca ttttgcgcag gtcaccttta 83760
tctgccgcca ctcataaggc ggcgtccaca gaaaggattt ccagcccccg tgctcttcca 83820
gaaacgactc cagtaccgtg gcctcctcac gggggacaga aagcgtcacg ctgtacgttt 83880
tcaggttggc attcagcccg gcaggcgctc gctgagaata gccatcacca aagcgcacct 83940
ttcttacaga agggaccgaa gccacatcca taccgggttt cactttccag cggaaggtct 84000
tcatcgtcca cctccggaga acaggccacc atcacgcatc tgtgtctgaa tttcatcacg 84060
ggcacccttg cgggccatgt catacaccgc cttcagagca gccggaccta tctgcccgtt 84120
cgtgccgtcg ttgttaatca ccacatggtt attctgctca aacgtcccgg acgcctgcga 84180
ccggctgtct gccatgctgc ccggtgtacc gacataaccg ccggtggcat agccgcgcat 84240
cagccggtaa agattcccca cgccaatccg gctggttgcc tccttcgtga agacaaactc 84300
accacggtga acaatccccg ctggctcata tttgccgccg gttcccgtaa atcctccggt 84360
tgcaaaatgg aatttcgccg cagcggcctg aatggctgta ccgcctgacg cggatgcgcc 84420
gccaccaaca gccccgccaa tggcgctgcc gatactcccg acaatcccca ccattgcctg 84480
cttaagcaga atttctgtca tcatggacag cacggaacgg gtgaagctgc gccagttctg 84540
ctcactgccg gtcagcatcg ccgccatatt ctgtgcaata ccatcaaagg tctgcgtggc 84600
tgcacttttt acctgcgaca tactgtccgt ggcgctctct tcccactcac tccagccgga 84660
cttcaggcct gccatccagt tcccgcgaag ctggtcttca gccgcccagg tctttttctg 84720
ctctgacatg acgttattca gcgccagcgg attatcgcca tactgttcct tcaggcgctg 84780
ttccgtggct tcccgttctg cctgccggtc agtcagcccc cggcttttcg catcaatggc 84840
ggcccgtttt gcccgttgct gctgtgcgaa tttatccgcc tgctgcgcca gcgcgttcag 84900
gcgctcctga tacgtaacct tgtcgccaag tgcagccagc tggcgtttgt actccagcgt 84960
ctcatcttta tgcgccagca gggatttctc ctgtgcagac agctggcgac gttgcgccgc 85020
ctcctccagt accgcgaact gactctccgc cttccacaaa tcccggcgct gctggctgat 85080
tttctcattt gctccggcat gcttctccag cgtccggagt tctgcctgaa gcgtcagcag 85140
ggcagcatga gcactgtctt cctgacgatc gcccgcagac accttcacgc tggactgttt 85200
cggctttttc agcgtcgctt cataatcctt tttcgccgcc gccatcagcg tgttgtaatc 85260
cgcctgcagg attttcccgt ctttcagtgc cttgttcagt tcttcctgac gggcggtata 85320
tttctccagc ggcgtctgca gccgttcgta agccttctgc gcctcttcgg tatatttcag 85380
ccgtgacgct tcggtatcgc tctgctgctg cgcatttttg tcctgttgag tctgctgctc 85440
agccttcttt cgggcggctt caagcgcaag acgggccttt tcacgatcat cccagtaacg 85500
cgcccgcgct tcatcgttaa caaaataatc atccttgcgc agattccaga tgtcgtctgc 85560
tttcttatac gcagcctctg ccttaatcag catctcctgc gcggtatcag gacgaccaat 85620
atccagcacc gcatcccaca tggatttgaa tgcccgcgca gtcctgtctg cccaggtctc 85680
cagcgtgccc atgttctctt tcaggcggcg ggtctggtca tcaaaccctt tcgttgcggc 85740
ctcgttcgcc gcctgcaatg ccccggcttc atcgccggaa cgctgcaact gagcaacata 85800
cgcaatctgc tccgccgaca cgttatggaa ctggcgagcc atcgccgtca gccccgacgt 85860
cgggtctgtg gtcagcttcc cgaaggcttc agcgaccttg tccacctcca cgccggatgc 85920
agaggagaaa cgcgccacac tctggctgat ggacgcaatc tgagcctcac cgcttacccc 85980
cgccttaacc agtgcgctga gtgactcgct ggtctggtta aacgtcagcc ctgccgcctg 86040
cccggctctg gacaggacca gcatacgatc tgccgtcagt cccgcctgat tgccggaaag 86100
gaccagcgtt ttgttgaaat cggacagggt tgagttgccc tgataccagg catacgccag 86160
cgcaccggtc gccaccgcca gcgaggtggc ccccaccatc ggcagggtga tcgcaccggc 86220
aagccccctg aacatgggga tcatcccgcc gaaggagtcc ttcacctgcc ccccctgttg 86280
cagcaggatc agccacggac tttgcccgcc tgcaagctgc gtggccacgt cggtgaactg 86340
tgcaggcagc atacgcatgg cggctttata ctgcccgacg gaaatccccg ctttctgtgc 86400
agccagcgcc tgtcggctca gcgactgttc aacgactgcc gctgtttttt tcgcatcact 86460
ttccgtacca gaaaaatgac gcctgactct ggccatctgc tcgtcaaatc tggccgcatc 86520
cagactcaaa tcaacgacca gatcgcctac cggttcagcc ataccggact cctcctgcga 86580
tcccttctga tactgtcatc agcattacgt catcctccgt catgtccgcc acatccgggg 86640
aagcggggat aacttcattc ccgtccgggc caaagcggac acctccggca agccctgccg 86700
ctttctgcat cagcacatca tcttcaggct cttcgtcagc ctcgcgccgg ttcagcagac 86760
tgaaatccag cggatgcata tccggatcgc tgaaaaacag gctgagcacg gtgtacgtca 86820
gcccggaaaa gtgcatatcc agcagaacat catgaaaata atgggtactg taaaagcggt 86880
gccagtcggc atactccgtg gatgacatcc cggcaagcat ggcacgccag tcgggtcgcc 86940
ccatctcacg cgccagtttc agggcaaaac tcagctcacc gtcgaacact ttcccgcaga 87000
aacaggctct gcgggcccgg cgtcctctgt ctgttcaggg gcattattca ccacaaactc 87060
atacatacca gacagccggt acaccacgtt ttcagcatga gaaattgcct ccgtgggcca 87120
ggtggtaagc acttcctgct caatctgttt aacggcttca ttcatggacg gcatctgcgt 87180
cttctgcgga tggttatgcc acagggacat cgccaccaga aacgcgccgg ttctgatggc 87240
gtcttccaca gtaaacttcc ggttgctgtc tgactccgcc tgttctgcct gccgtttcat 87300
cagggcgaga tgctcaatgc gctgcagggc tgacagttca gaaagcgtga cggtcacacc 87360
gttatgttca aatgattcgg ttttcaggaa catcgctgac tctccggatt aactggcggt 87420
gacggtaatt tctgcaaccg cagcaaactc accattaccg gatacaaccg gaatgttgac 87480
cttgcctgca gcaacgccgt tcacggtgat ggtcatacca ctgaccgaca cggtggcttt 87540
tgttttatcc gcagacaccg cacgaaagct cttgtcggtt acgccctccg gctggaaggc 87600
cacggtcagc gtggtgctct gccctttcac caccgaggtg ctggcaggcg tcacggtcat 87660
gccggttgcc gctgttaccg tgctgcgatc ttctgccatc gacggacgtc ccacattggt 87720
gactttcacc gtgcgggtga tcacttcctt cgccgtcacc gccttaccga tactgctgac 87780
ccagccacgg aacacatcga ccgtgccgtt cgggaagcgg attttatagg cacgggtatc 87840
gccttcatta aaccacgcca gcagcgcctg ctgcccctgc tctccgggca tccacgccag 87900
cgtgaagctg gtatctccgg cagatttctg cccctgcccg gtcgcagtcc agtctgcatc 87960
ttcatcatcg agatagctgt cgtcatagga ctcagcggtc agttcgccgg gcgtcaggtc 88020
tttaactttt gccagacgcg accagtcaac gtctgaaagc ggattcgcgt aagggtcacc 88080
gctcccctta taaacccaca gggtggtccc ggcacctttc accggcattg taggatttgg 88140
tacaggcata gcgtcctcac atttcatagg taatgacata agtcagatcg gctgaactcc 88200
acaagcccgc atcatcgtcg cgccggtagt catagccgct ggccaccata ctggtgatca 88260
aatctgacag tgccgggata tcgctcatca ccggataaat ccgggactcc atccacgcat 88320
ccagctctga atccggcacc tgagcaggca ggaaaacttc gatatgcagc tccgcctgcc 88380
aggtatcgct gtccagctct tcgcccgtgt attcagcgcc ggtgagataa acggcaactg 88440
ccggaaaatc cgcctcatca aaaacagcgg ggcgaccatc aaaaaacgtc gccccggtgt 88500
catgcttctc cagtgcatcc agtacggctg cacggagttc agtatgtttc atcgctttat 88560
taccatcctc agttgatgct gcagcgcata gcccagctct ttcggaagac gttcacgccg 88620
tatccgctca atattttgtt taaacgccgt ggtcagcggc accgccatcg ggattttcac 88680
cacatcaatg gggtaacggt ttttcccagc cacacgctgc atgacatgcc accggccatt 88740
tttcagttgc tgaataaacg cgccgggaat acgacggtta cccaccacaa gcacgctgcc 88800
gccacctttc agggatgaac gctgcccctt tttacgacgc ctgcggcgcg aaaggacaac 88860
ccgcgcatta cccagcttga ttacgggcaa atccccccgg ttaactttga ttctggcctg 88920
cggatttttg accgtggccc ttttcagcct ggccctttcc tttaccagtt tccggcgtac 88980
ctttgtctca cgggcaacct gtgacgccga ctgcgatatc gcggatgaag caacgcggtt 89040
aatggccatt gcggcggcac caggcaccgc cgttttgctg atacggctga ggttttcaac 89100
ggcctgctca agacctttta tggccataca tccccctttc agcggcgacg gttaacggca 89160
ggcggtacgc cccgtccaag ccagagatga caacttccgc catcatccgg cgaaacccga 89220
tctacccaga aattttcctc accgatggtc agcgtgtctc cacgccgcag ctgccgcacc 89280
tcatcagtcc ggacaaacag ggacgggctg gagccttcaa cgcgcacgcc ctgtccggca 89340
tagctgatat tttcagggtc atcaaaaaca ccacgtatca ccgcacctga ctgctcaccg 89400
gatgtaatgg tggctgacgt tcccatgtac ccgcgtatcg tttcatcggc gcgggcaatg 89460
gcagcatcga acaggttatc gaaatcagcc acagcgcctc ccgttattgc attctggcca 89520
ggccgcgctc tgtcatttcg gctgccacac cggcagagac acgaaacgcc gttcccggca 89580
gcacaaatgc cacaggttca tcccgcgtgg cgtgaagtgc atcagtatgc agcttcacca 89640
gtgccacgac cgtgaccagt tcagacgtat ccagaatcac ggtatccggc tgcgctgatc 89700
ccacctcatt ttcatgtccg gtcagcacat tttcccggct gagaggggtg tcctgaccgg 89760
cagtttcatc cgtgtcatca agctcctctt tcagctctgc cacacggagc gccagttctt 89820
ctttcgtccc cgtcaggctg acatcacggt tcagttgttc acccagcgag cggagacggg 89880
caatcagttc atctttcgtc atggactcct ccacagagaa acaatggccc cgaagggcca 89940
tgattacgcc agttgtacgg acacgaactc atcagggtca gccagcagca tcagcggtgc 90000
tgactgaatc atggtgaact cacgcgccgg atcgccggtg gtcacccagt ttttcgggta 90060
acgggcagag gcgttaatgc cttcgcgctg tgcgtccgca tcctgaatgc agccataggt 90120
gcgcagaccg cgtgcctgag tgttccccag caccatcgtg ttgtccggca ggaagttctt 90180
tttgacgccg ttttccacgt actgtccgga atacacgacg atggccacat cgccatacat 90240
ccccttatag gacaccgctt tgcccaggtc tttcaccgct gtctccagct cggaattaga 90300
gccacgacgg gtatccagct tctccttgac ggctttgaag gaacggaaca gcgcccagcc 90360
tttcggatcg aacacgatga tattcaccac accgctggcg ttcagcgcgt aggcttcgat 90420
atcgtcggtc gggtcatacg tggacttgtc acgcttgctc cactccgtgc cgccggactg 90480
cgtgatgtta ttctcctcac tgcggcccat atccacctca accggatcga aggcttcacc 90540
ggtcatggtg tatttgccct taagcacggc agaaactgcc tgcatctctt cgacctgagc 90600
aatggccagc tcttcgtcac gcatgttctg catgatgatg cgacggcggc ggtaagccgg 90660
gtccgccaga ttctgcggat cttcatccgg caggcgacgc agggtcatct gcggattcac 90720
ttcatgcttc ggcttgacat atcccggcgt aaattcagag gtggagccgc cacgggaacg 90780
gataacctca ccggaaacaa tcggcgaaac gtacagcgcc atgtttacca gtcccggaat 90840
ttgtgagaga tagactttct ccgtggtgaa gggatagctc tcacggaaaa agagacgcag 90900
aaacagcgga tcaaacttaa atttctgctc atttgccgcc agcagttggg cggttgtgta 90960
catcgacata aaaaaatccc gtaaaaaaag ccgcacaggc ggcctttagt gatgaagggt 91020
aaagttaaac gatgctgatt gccgttccgg caaacgcggt ccgttttttc gtctcgtcgc 91080
tggcagcctc cggccagagc acatcctcat aacggaacgt gccggacttg tagaacgtca 91140
gcgtggtgct ggtctggtca gcagcaaccg caagaatgcc aacggcagca ccgtcggtgg 91200
tgccatccca cgcaaccagc ttacggctgg aggtgtccag catcagcggg gtcattgcag 91260
gcgctttcgc actcaatccg ccgggcgcgg ttgcggtatg agccgggtca ctgttgccct 91320
gcggctggta atgggtaaag gtttctttgc tcgtcataaa catcccttac actggtgtgt 91380
tcagcaaatc gttaacggca tcagatgccg ggttacctgc agccagcggt gccggtgccc 91440
cctgcatcag acgatccagc gcagtgtcac tgcgcgcctg tgcactctgt ggtgctgcgg 91500
ccagaatgcg gcgggccgtt ttcacggtca taccgggggt ttctgccagc acgcgtgcct 91560
gttcttcgcg tccgtgagcc tcctcacagt tgaggatccc cataatgcgg ctgttttctg 91620
ccgcaaccgc tgcggtgatc tgcgcgttca cgtccggctg cgccgcgctg gcgttctcgc 91680
cctccgtcgc tggcaccacg tcagtaacgt cagcctgcga agcagtggct gaaacagttg 91740
ttgattgagt ctctttggtc attcgccctc ctgagagacg ggatttacgt gcatccagtg 91800
catcacgcat gacggtgatc gcatcggtgc tgttaacaag ttcatcagcc agtccggcat 91860
caatggcctc ctgaccgctg tacactgcag cctcggtatc cagcacaacc tgcacggaca 91920
ggccggtata tgccgacacc ttctgcgcaa acatctggcg ggttgcgtcc atccgggact 91980
gcagtgtctc ccggacgtca tccggaagat ggctgtaggg gttgccatcc accttatggc 92040
tgccgctgta aatcagcgtg atttccacac cctgtttctc cagcgcagca ccgtaattac 92100
tgtgagccat catgacgccg atggagcctg tccgggcggt ctgcgtgacc agacgccggg 92160
aggcggcact ggcaagcaac tgacctgcac tgcagttcat gtcgttggca agcgcccata 92220
ccggttttat gtcacgcaca cgggcgatga tgtcagcgca gtcaaatgcc cccgccacca 92280
tcccgccggg cgtgtccata tcgagcagaa tgccgtccac catcggatcg ctggcagcct 92340
gttgcagacg ggcgataatg ccgttgtaac cggtcatccc cgagtacggc tgcagcgccc 92400
gcgtccggct gaccagcgtg ccggacaccg gcagcacggc gatgccgttc atgacctgat 92460
aactgcgggc ctgtcgtggt ccgtcatcat caccggataa tgccagcgtc gcgagtgcct 92520
cctgggcagt caggctgtcg ccggacaccg catccgtcag gctgctgatc ccaagctggc 92580
ctgcaagcgc acaaaagaaa acccgcgcat aggcgggttc aagcatcagc ggctcattaa 92640
aggccatgct ggcaatatgc gggagattac gcagctctgc tgtcactctt ctcctcctct 92700
gttgattgtc gcagcccgga ttcaaatgct gcagccgccc aggcgggcgg tttaagaccg 92760
gctgcacggc gctccatcgt ttcacggacc tgctgggcaa aaatttcctg atagtcgtca 92820
ccgcgttttg cgcactcttt ctcgtaggta ctcagtccgg cttctatcag catcaccgct 92880
tcctgaactt ctttcagacc atcgatggcc atacgaccgg agcctatcca gtcgcagttc 92940
ccccaggcac tgcgggcttc ctgaaaactg aagcgcgctt ttgaaggtaa cgtcaccacg 93000
cggcgaacga tggcctcttc cagccagcac agaaacatct ggctcgcctg acgggatgcg 93060
acgaattttc gccgccccat aaagtacgcc cacgactcgt tcgcactggc ccgtgccgtg 93120
gagtagctca tctgggcgta attccgggaa agctgctcat acgagacacc cagcccggca 93180
gcgatatacc gcagcagtga ctgctcaaac acggagtagc cgttatccgt atcctgagcc 93240
gtctgcaggt tcagtgagtc acccggcatc aggtgcggta cttttgcgcc tcccagccgg 93300
accggcgctg cggcgtaata cgcggcaatt tcaccaatcc agccggtcag cctttcccgc 93360
tgctcctgac tgttcgcgcc cagaataaaa tccatcgctg actgcgtatc cagctcactc 93420
tcaatggtgg cggcatacat cgccttcaca atggcgctct gcagctgcgt gttctgcagc 93480
gtgtcgagca tcttcatctg ctccatcacg ctgtaaaaca catttgcacc gcgagtctgc 93540
ccgtcctcca cgggttcaaa aacgtgaatg aacgaggcgc gcccgccggg taactcacgg 93600
ggtatccatg tccatttctg cggcatccag ccaggatacc cgtcctcgct gacgtaatat 93660
cccagcgccg caccgctgtc attaatctgc acaccggcac ggcagttccg gctgtcgccg 93720
gtattgttcg ggttgctgat gcgcttcggg ctgaccatcc ggaactgtgt ccggaaaagc 93780
cgcgacgaac tggtatccca ggtggcctga acgaacagtt caccgttaaa ggcgtgcatg 93840
gccacacctt cccgaatcat catggtaaac gtgcgttttc gctcaacgtc aatgcagcag 93900
cagtcatcct cggcaaactc tttccatgcc gcttcaacct cgcgggaaaa ggcacgggct 93960
tcttcctccc cgatgcccag atagcgccag cttgggcgat gactgagccg gaaaaaagac 94020
ccgacgatat gatcctgatg cagctggatg gcgttggcgg catagccgtt attgcgtacc 94080
agatcgtctg cgcgggcatt gccacgggta aagttgggca acagggctgc atccacactt 94140
tcactcggtg ggttccacga ccgcaactgc cctccaaatc cgctgccacc gccgtgataa 94200
ccggcatatt cgcgcagcga tgtcatgccg tccggcccca gaagggtggg aatggtgggc 94260
gttttcatac ataaaatcct gcaggtcccc tgcgtcgctg tgtcatgccg gtctgcactt 94320
ccagctctgc aatatatttt ttcaggtcag acacggaagt ggccgtaaac tccacccttc 94380
gtccgtcttt ctgtactgtt gccacccgtt tacctgtcat caggtcatgc agtgccgcac 94440
gggcagcggc aagttcttcc tgtcgcgtca ttcatcctct ccggataagg cacgggcgta 94500
atctgccagt gttttcttgt tggttgctgc accatcctct tcctgcaggc tcgccagcag 94560
cgcactgaga tccagctgcc agcgggaaat actgatgcgc agcgccgcca gcgcataaac 94620
gaagcagtcg agtgcctcat tgcgtcgctt tttgctgtcc cacagtattt ttttcctgcc 94680
atccacccat ttttcgacct gctcttcagc agtcagctgc tgcgcttcgg tcagatcaaa 94740
aatatccggg ttattcggga agtgaacggc accgggaagc ggttcatccc cttccggcgt 94800
cagtgtgaag cggttataaa tctgctcttt cgcggtatcc gtaccgattt cggtaaggta 94860
aaccccgttt ttgtttcgct tacgtggcat gctggccacc ggctttccgt agacggatgc 94920
ccctttaatg gggatcaccc ggaacagccc atgttttttc gagcgttcat acacaatggt 94980
cgggtcaatc ccgccagtat cccagcagat acgggatatc gacatttctg caccattccg 95040
gcgggtatag gttttattga tggcctcatc cacacgcagc agcgtctgtt catcgtcgtg 95100
gcggcccata ataatctgcc ggtcaatcag ccagctttcc tcacccggcc cccatcccca 95160
tacgcgcatt tcgtagcggt ccagctggga gtcgataccg gcggtcaggt aagccacacg 95220
gtcaggaacg ggcgctgaat aatgctcttt ccgctctgcc atcacttcag catccggacg 95280
ttcgccaatt ttcgcctccc acgtctcacc gagcgtggtg tttacgaagg ttttacgttt 95340
tcccgtatcc cctttcgttt tcatccagtc tttgacaatc tgcacccagg tggtgaacgg 95400
gctgtacgct gtccagatgt gaaaggtcac actgtcaggt ggctcaatct cttcaccgga 95460
tgacgaaaac cagagaatgc catcacgggt ccagatcccg gtcttttcgc agatataacg 95520
ggcatcagta aagtccagct cctgctggcg gatgacgcag gcattatgct cgcagagata 95580
aaacacgctg gaggggtcat ccggcgtcca tttgaggcca aacggcgtct ctttgtcgcc 95640
aaatttaaga tactgctcct ccccgcaatg cgggcaggca acatgaaaac gcataaaatg 95700
cggggattca ctggctgcac gctcaatctg acaggtgcct ctcacttttg gcgtggagcc 95760
acggatggac tttggccaga ccgagccttc aatacgcttg tcacccagga acgtcggaga 95820
gccttcctgt tcaatatcat catcaaaagc agcaagttca tcataacccg ccacatccac 95880
cgacttttca cggtagtttt ttgccgcttt accgcccagg caccagaagc cacgcccatt 95940
agtgaaacgc ttcatggtga gcgtgttatc ccggtgcttt ttgccatacc acggggccag 96000
cgccagcagc gacggaatat cacgaatagt cggctcaacg tgggttttca taaagttctc 96060
ggcatcacca tccgtcggca accagataag ggtgttgcgc tgcttatgct ctataaagta 96120
ggcataaaca cccagcagca ttttggaata accgacacgg gcagacttca ccacattcac 96180
ctcacggatg tagtcgctgc ccatcgcatt catgatggcc cgctgaaagg gcagtgtttc 96240
ccagcgccct tcctggtatg cggattcttt cgggagatag taattagcat ccgcccattc 96300
aacggcggtc tgtggctccg gcctgaacag tgagcgaagc ccggcgcgga caaaatgccg 96360
cagcctgtta acctgactgt tcgatatatt cactcagcaa ccccggtatc agttcatcca 96420
gcgcggctgc tttgttcatg gctttgatga tatcccgttt caggaaatca acatgtcggt 96480
tttccagttc cggaaaacgc cgctgcaccg acagggggag cccgtcgaga atactggcaa 96540
tttcacctgc gatccgcgac agcacgaaag tacagaatgc ggtttccacc acttcagcgg 96600
agtctctggc attcttcagt tcctgtgcgt cggcctgcgc acgcgtaagt cgatggcgtt 96660
cgtactcaat agttcctggc tggagatctg cctcgctggc ctgccgcagt tcttcaacct 96720
cccggcgcag cttttcgttc tcaatttcag catccctttc ggcataccat tttatgacgg 96780
cggcagagtc ataaagcacc tcattaccct tgccaccgcc tcgcagaacg ggcattccct 96840
gttcctgcca gttctgaatg gtacggatac tcgcaccgaa aatgtcagcc agctgctttt 96900
tgttgacttc cattgttcat tccacggaca aaaacagaga aaggaaacga cagaggccaa 96960
aaagcctcgc tttcagcacc tgtcgtttcc tttcttttca gagggtattt taaataaaaa 97020
cattaagtta tgacgaagaa gaacggaaac gccttaaacc ggaaaatttt cataaatagc 97080
gaaaacccgc gaggtcgccg cccaggtcgc cgcccgtcaa tcggcccttt agtggagc 97138
<210> 12
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Examples 1 and 9
<400> 12
gcaatatcag caccaacaga aacaacct 28
<210> 13
<211> 48502
<212> DNA
<213> Enterobacteria phage lambda
<400> 13
gggcggcgac ctcgcgggtt ttcgctattt atgaaaattt tccggtttaa ggcgtttccg 60
ttcttcttcg tcataactta atgtttttat ttaaaatacc ctctgaaaag aaaggaaacg 120
acaggtgctg aaagcgaggc tttttggcct ctgtcgtttc ctttctctgt ttttgtccgt 180
ggaatgaaca atggaagtca acaaaaagca gctggctgac attttcggtg cgagtatccg 240
taccattcag aactggcagg aacagggaat gcccgttctg cgaggcggtg gcaagggtaa 300
tgaggtgctt tatgactctg ccgccgtcat aaaatggtat gccgaaaggg atgctgaaat 360
tgagaacgaa aagctgcgcc gggaggttga agaactgcgg caggccagcg aggcagatct 420
ccagccagga actattgagt acgaacgcca tcgacttacg cgtgcgcagg ccgacgcaca 480
ggaactgaag aatgccagag actccgctga agtggtggaa accgcattct gtactttcgt 540
gctgtcgcgg atcgcaggtg aaattgccag tattctcgac gggctccccc tgtcggtgca 600
gcggcgtttt ccggaactgg aaaaccgaca tgttgatttc ctgaaacggg atatcatcaa 660
agccatgaac aaagcagccg cgctggatga actgataccg gggttgctga gtgaatatat 720
cgaacagtca ggttaacagg ctgcggcatt ttgtccgcgc cgggcttcgc tcactgttca 780
ggccggagcc acagaccgcc gttgaatggg cggatgctaa ttactatctc ccgaaagaat 840
ccgcatacca ggaagggcgc tgggaaacac tgccctttca gcgggccatc atgaatgcga 900
tgggcagcga ctacatccgt gaggtgaatg tggtgaagtc tgcccgtgtc ggttattcca 960
aaatgctgct gggtgtttat gcctacttta tagagcataa gcagcgcaac acccttatct 1020
ggttgccgac ggatggtgat gccgagaact ttatgaaaac ccacgttgag ccgactattc 1080
gtgatattcc gtcgctgctg gcgctggccc cgtggtatgg caaaaagcac cgggataaca 1140
cgctcaccat gaagcgtttc actaatgggc gtggcttctg gtgcctgggc ggtaaagcgg 1200
caaaaaacta ccgtgaaaag tcggtggatg tggcgggtta tgatgaactt gctgcttttg 1260
atgatgatat tgaacaggaa ggctctccga cgttcctggg tgacaagcgt attgaaggct 1320
cggtctggcc aaagtccatc cgtggctcca cgccaaaagt gagaggcacc tgtcagattg 1380
agcgtgcagc cagtgaatcc ccgcatttta tgcgttttca tgttgcctgc ccgcattgcg 1440
gggaggagca gtatcttaaa tttggcgaca aagagacgcc gtttggcctc aaatggacgc 1500
cggatgaccc ctccagcgtg ttttatctct gcgagcataa tgcctgcgtc atccgccagc 1560
aggagctgga ctttactgat gcccgttata tctgcgaaaa gaccgggatc tggacccgtg 1620
atggcattct ctggttttcg tcatccggtg aagagattga gccacctgac agtgtgacct 1680
ttcacatctg gacagcgtac agcccgttca ccacctgggt gcagattgtc aaagactgga 1740
tgaaaacgaa aggggatacg ggaaaacgta aaaccttcgt aaacaccacg ctcggtgaga 1800
cgtgggaggc gaaaattggc gaacgtccgg atgctgaagt gatggcagag cggaaagagc 1860
attattcagc gcccgttcct gaccgtgtgg cttacctgac cgccggtatc gactcccagc 1920
tggaccgcta cgaaatgcgc gtatggggat gggggccggg tgaggaaagc tggctgattg 1980
accggcagat tattatgggc cgccacgacg atgaacagac gctgctgcgt gtggatgagg 2040
ccatcaataa aacctatacc cgccggaatg gtgcagaaat gtcgatatcc cgtatctgct 2100
gggatactgg cgggattgac ccgaccattg tgtatgaacg ctcgaaaaaa catgggctgt 2160
tccgggtgat ccccattaaa ggggcatccg tctacggaaa gccggtggcc agcatgccac 2220
gtaagcgaaa caaaaacggg gtttacctta ccgaaatcgg tacggatacc gcgaaagagc 2280
agatttataa ccgcttcaca ctgacgccgg aaggggatga accgcttccc ggtgccgttc 2340
acttcccgaa taacccggat atttttgatc tgaccgaagc gcagcagctg actgctgaag 2400
agcaggtcga aaaatgggtg gatggcagga aaaaaatact gtgggacagc aaaaagcgac 2460
gcaatgaggc actcgactgc ttcgtttatg cgctggcggc gctgcgcatc agtatttccc 2520
gctggcagct ggatctcagt gcgctgctgg cgagcctgca ggaagaggat ggtgcagcaa 2580
ccaacaagaa aacactggca gattacgccc gtgccttatc cggagaggat gaatgacgcg 2640
acaggaagaa cttgccgctg cccgtgcggc actgcatgac ctgatgacag gtaaacgggt 2700
ggcaacagta cagaaagacg gacgaagggt ggagtttacg gccacttccg tgtctgacct 2760
gaaaaaatat attgcagagc tggaagtgca gaccggcatg acacagcgac gcaggggacc 2820
tgcaggattt tatgtatgaa aacgcccacc attcccaccc ttctggggcc ggacggcatg 2880
acatcgctgc gcgaatatgc cggttatcac ggcggtggca gcggatttgg agggcagttg 2940
cggtcgtgga acccaccgag tgaaagtgtg gatgcagccc tgttgcccaa ctttacccgt 3000
ggcaatgccc gcgcagacga tctggtacgc aataacggct atgccgccaa cgccatccag 3060
ctgcatcagg atcatatcgt cgggtctttt ttccggctca gtcatcgccc aagctggcgc 3120
tatctgggca tcggggagga agaagcccgt gccttttccc gcgaggttga agcggcatgg 3180
aaagagtttg ccgaggatga ctgctgctgc attgacgttg agcgaaaacg cacgtttacc 3240
atgatgattc gggaaggtgt ggccatgcac gcctttaacg gtgaactgtt cgttcaggcc 3300
acctgggata ccagttcgtc gcggcttttc cggacacagt tccggatggt cagcccgaag 3360
cgcatcagca acccgaacaa taccggcgac agccggaact gccgtgccgg tgtgcagatt 3420
aatgacagcg gtgcggcgct gggatattac gtcagcgagg acgggtatcc tggctggatg 3480
ccgcagaaat ggacatggat accccgtgag ttacccggcg ggcgcgcctc gttcattcac 3540
gtttttgaac ccgtggagga cgggcagact cgcggtgcaa atgtgtttta cagcgtgatg 3600
gagcagatga agatgctcga cacgctgcag aacacgcagc tgcagagcgc cattgtgaag 3660
gcgatgtatg ccgccaccat tgagagtgag ctggatacgc agtcagcgat ggattttatt 3720
ctgggcgcga acagtcagga gcagcgggaa aggctgaccg gctggattgg tgaaattgcc 3780
gcgtattacg ccgcagcgcc ggtccggctg ggaggcgcaa aagtaccgca cctgatgccg 3840
ggtgactcac tgaacctgca gacggctcag gatacggata acggctactc cgtgtttgag 3900
cagtcactgc tgcggtatat cgctgccggg ctgggtgtct cgtatgagca gctttcccgg 3960
aattacgccc agatgagcta ctccacggca cgggccagtg cgaacgagtc gtgggcgtac 4020
tttatggggc ggcgaaaatt cgtcgcatcc cgtcaggcga gccagatgtt tctgtgctgg 4080
ctggaagagg ccatcgttcg ccgcgtggtg acgttacctt caaaagcgcg cttcagtttt 4140
caggaagccc gcagtgcctg ggggaactgc gactggatag gctccggtcg tatggccatc 4200
gatggtctga aagaagttca ggaagcggtg atgctgatag aagccggact gagtacctac 4260
gagaaagagt gcgcaaaacg cggtgacgac tatcaggaaa tttttgccca gcaggtccgt 4320
gaaacgatgg agcgccgtgc agccggtctt aaaccgcccg cctgggcggc tgcagcattt 4380
gaatccgggc tgcgacaatc aacagaggag gagaagagtg acagcagagc tgcgtaatct 4440
cccgcatatt gccagcatgg cctttaatga gccgctgatg cttgaacccg cctatgcgcg 4500
ggttttcttt tgtgcgcttg caggccagct tgggatcagc agcctgacgg atgcggtgtc 4560
cggcgacagc ctgactgccc aggaggcact cgcgacgctg gcattatccg gtgatgatga 4620
cggaccacga caggcccgca gttatcaggt catgaacggc atcgccgtgc tgccggtgtc 4680
cggcacgctg gtcagccgga cgcgggcgct gcagccgtac tcggggatga ccggttacaa 4740
cggcattatc gcccgtctgc aacaggctgc cagcgatccg atggtggacg gcattctgct 4800
cgatatggac acgcccggcg ggatggtggc gggggcattt gactgcgctg acatcatcgc 4860
ccgtgtgcgt gacataaaac cggtatgggc gcttgccaac gacatgaact gcagtgcagg 4920
tcagttgctt gccagtgccg cctcccggcg tctggtcacg cagaccgccc ggacaggctc 4980
catcggcgtc atgatggctc acagtaatta cggtgctgcg ctggagaaac agggtgtgga 5040
aatcacgctg atttacagcg gcagccataa ggtggatggc aacccctaca gccatcttcc 5100
ggatgacgtc cgggagacac tgcagtcccg gatggacgca acccgccaga tgtttgcgca 5160
gaaggtgtcg gcatataccg gcctgtccgt gcaggttgtg ctggataccg aggctgcagt 5220
gtacagcggt caggaggcca ttgatgccgg actggctgat gaacttgtta acagcaccga 5280
tgcgatcacc gtcatgcgtg atgcactgga tgcacgtaaa tcccgtctct caggagggcg 5340
aatgaccaaa gagactcaat caacaactgt ttcagccact gcttcgcagg ctgacgttac 5400
tgacgtggtg ccagcgacgg agggcgagaa cgccagcgcg gcgcagccgg acgtgaacgc 5460
gcagatcacc gcagcggttg cggcagaaaa cagccgcatt atggggatcc tcaactgtga 5520
ggaggctcac ggacgcgaag aacaggcacg cgtgctggca gaaacccccg gtatgaccgt 5580
gaaaacggcc cgccgcattc tggccgcagc accacagagt gcacaggcgc gcagtgacac 5640
tgcgctggat cgtctgatgc agggggcacc ggcaccgctg gctgcaggta acccggcatc 5700
tgatgccgtt aacgatttgc tgaacacacc agtgtaaggg atgtttatga cgagcaaaga 5760
aacctttacc cattaccagc cgcagggcaa cagtgacccg gctcataccg caaccgcgcc 5820
cggcggattg agtgcgaaag cgcctgcaat gaccccgctg atgctggaca cctccagccg 5880
taagctggtt gcgtgggatg gcaccaccga cggtgctgcc gttggcattc ttgcggttgc 5940
tgctgaccag accagcacca cgctgacgtt ctacaagtcc ggcacgttcc gttatgagga 6000
tgtgctctgg ccggaggctg ccagcgacga gacgaaaaaa cggaccgcgt ttgccggaac 6060
ggcaatcagc atcgtttaac tttacccttc atcactaaag gccgcctgtg cggctttttt 6120
tacgggattt ttttatgtcg atgtacacaa ccgcccaact gctggcggca aatgagcaga 6180
aatttaagtt tgatccgctg tttctgcgtc tctttttccg tgagagctat cccttcacca 6240
cggagaaagt ctatctctca caaattccgg gactggtaaa catggcgctg tacgtttcgc 6300
cgattgtttc cggtgaggtt atccgttccc gtggcggctc cacctctgaa tttacgccgg 6360
gatatgtcaa gccgaagcat gaagtgaatc cgcagatgac cctgcgtcgc ctgccggatg 6420
aagatccgca gaatctggcg gacccggctt accgccgccg tcgcatcatc atgcagaaca 6480
tgcgtgacga agagctggcc attgctcagg tcgaagagat gcaggcagtt tctgccgtgc 6540
ttaagggcaa atacaccatg accggtgaag ccttcgatcc ggttgaggtg gatatgggcc 6600
gcagtgagga gaataacatc acgcagtccg gcggcacgga gtggagcaag cgtgacaagt 6660
ccacgtatga cccgaccgac gatatcgaag cctacgcgct gaacgccagc ggtgtggtga 6720
atatcatcgt gttcgatccg aaaggctggg cgctgttccg ttccttcaaa gccgtcaagg 6780
agaagctgga tacccgtcgt ggctctaatt ccgagctgga gacagcggtg aaagacctgg 6840
gcaaagcggt gtcctataag gggatgtatg gcgatgtggc catcgtcgtg tattccggac 6900
agtacgtgga aaacggcgtc aaaaagaact tcctgccgga caacacgatg gtgctgggga 6960
acactcaggc acgcggtctg cgcacctatg gctgcattca ggatgcggac gcacagcgcg 7020
aaggcattaa cgcctctgcc cgttacccga aaaactgggt gaccaccggc gatccggcgc 7080
gtgagttcac catgattcag tcagcaccgc tgatgctgct ggctgaccct gatgagttcg 7140
tgtccgtaca actggcgtaa tcatggccct tcggggccat tgtttctctg tggaggagtc 7200
catgacgaaa gatgaactga ttgcccgtct ccgctcgctg ggtgaacaac tgaaccgtga 7260
tgtcagcctg acggggacga aagaagaact ggcgctccgt gtggcagagc tgaaagagga 7320
gcttgatgac acggatgaaa ctgccggtca ggacacccct ctcagccggg aaaatgtgct 7380
gaccggacat gaaaatgagg tgggatcagc gcagccggat accgtgattc tggatacgtc 7440
tgaactggtc acggtcgtgg cactggtgaa gctgcatact gatgcacttc acgccacgcg 7500
ggatgaacct gtggcatttg tgctgccggg aacggcgttt cgtgtctctg ccggtgtggc 7560
agccgaaatg acagagcgcg gcctggccag aatgcaataa cgggaggcgc tgtggctgat 7620
ttcgataacc tgttcgatgc tgccattgcc cgcgccgatg aaacgatacg cgggtacatg 7680
ggaacgtcag ccaccattac atccggtgag cagtcaggtg cggtgatacg tggtgttttt 7740
gatgaccctg aaaatatcag ctatgccgga cagggcgtgc gcgttgaagg ctccagcccg 7800
tccctgtttg tccggactga tgaggtgcgg cagctgcggc gtggagacac gctgaccatc 7860
ggtgaggaaa atttctgggt agatcgggtt tcgccggatg atggcggaag ttgtcatctc 7920
tggcttggac ggggcgtacc gcctgccgtt aaccgtcgcc gctgaaaggg ggatgtatgg 7980
ccataaaagg tcttgagcag gccgttgaaa acctcagccg tatcagcaaa acggcggtgc 8040
ctggtgccgc cgcaatggcc attaaccgcg ttgcttcatc cgcgatatcg cagtcggcgt 8100
cacaggttgc ccgtgagaca aaggtacgcc ggaaactggt aaaggaaagg gccaggctga 8160
aaagggccac ggtcaaaaat ccgcaggcca gaatcaaagt taaccggggg gatttgcccg 8220
taatcaagct gggtaatgcg cgggttgtcc tttcgcgccg caggcgtcgt aaaaaggggc 8280
agcgttcatc cctgaaaggt ggcggcagcg tgcttgtggt gggtaaccgt cgtattcccg 8340
gcgcgtttat tcagcaactg aaaaatggcc ggtggcatgt catgcagcgt gtggctggga 8400
aaaaccgtta ccccattgat gtggtgaaaa tcccgatggc ggtgccgctg accacggcgt 8460
ttaaacaaaa tattgagcgg atacggcgtg aacgtcttcc gaaagagctg ggctatgcgc 8520
tgcagcatca actgaggatg gtaataaagc gatgaaacat actgaactcc gtgcagccgt 8580
actggatgca ctggagaagc atgacaccgg ggcgacgttt tttgatggtc gccccgctgt 8640
ttttgatgag gcggattttc cggcagttgc cgtttatctc accggcgctg aatacacggg 8700
cgaagagctg gacagcgata cctggcaggc ggagctgcat atcgaagttt tcctgcctgc 8760
tcaggtgccg gattcagagc tggatgcgtg gatggagtcc cggatttatc cggtgatgag 8820
cgatatcccg gcactgtcag atttgatcac cagtatggtg gccagcggct atgactaccg 8880
gcgcgacgat gatgcgggct tgtggagttc agccgatctg acttatgtca ttacctatga 8940
aatgtgagga cgctatgcct gtaccaaatc ctacaatgcc ggtgaaaggt gccgggacca 9000
ccctgtgggt ttataagggg agcggtgacc cttacgcgaa tccgctttca gacgttgact 9060
ggtcgcgtct ggcaaaagtt aaagacctga cgcccggcga actgaccgct gagtcctatg 9120
acgacagcta tctcgatgat gaagatgcag actggactgc gaccgggcag gggcagaaat 9180
ctgccggaga taccagcttc acgctggcgt ggatgcccgg agagcagggg cagcaggcgc 9240
tgctggcgtg gtttaatgaa ggcgataccc gtgcctataa aatccgcttc ccgaacggca 9300
cggtcgatgt gttccgtggc tgggtcagca gtatcggtaa ggcggtgacg gcgaaggaag 9360
tgatcacccg cacggtgaaa gtcaccaatg tgggacgtcc gtcgatggca gaagatcgca 9420
gcacggtaac agcggcaacc ggcatgaccg tgacgcctgc cagcacctcg gtggtgaaag 9480
ggcagagcac cacgctgacc gtggccttcc agccggaggg cgtaaccgac aagagctttc 9540
gtgcggtgtc tgcggataaa acaaaagcca ccgtgtcggt cagtggtatg accatcaccg 9600
tgaacggcgt tgctgcaggc aaggtcaaca ttccggttgt atccggtaat ggtgagtttg 9660
ctgcggttgc agaaattacc gtcaccgcca gttaatccgg agagtcagcg atgttcctga 9720
aaaccgaatc atttgaacat aacggtgtga ccgtcacgct ttctgaactg tcagccctgc 9780
agcgcattga gcatctcgcc ctgatgaaac ggcaggcaga acaggcggag tcagacagca 9840
accggaagtt tactgtggaa gacgccatca gaaccggcgc gtttctggtg gcgatgtccc 9900
tgtggcataa ccatccgcag aagacgcaga tgccgtccat gaatgaagcc gttaaacaga 9960
ttgagcagga agtgcttacc acctggccca cggaggcaat ttctcatgct gaaaacgtgg 10020
tgtaccggct gtctggtatg tatgagtttg tggtgaataa tgcccctgaa cagacagagg 10080
acgccgggcc cgcagagcct gtttctgcgg gaaagtgttc gacggtgagc tgagttttgc 10140
cctgaaactg gcgcgtgaga tggggcgacc cgactggcgt gccatgcttg ccgggatgtc 10200
atccacggag tatgccgact ggcaccgctt ttacagtacc cattattttc atgatgttct 10260
gctggatatg cacttttccg ggctgacgta caccgtgctc agcctgtttt tcagcgatcc 10320
ggatatgcat ccgctggatt tcagtctgct gaaccggcgc gaggctgacg aagagcctga 10380
agatgatgtg ctgatgcaga aagcggcagg gcttgccgga ggtgtccgct ttggcccgga 10440
cgggaatgaa gttatccccg cttccccgga tgtggcggac atgacggagg atgacgtaat 10500
gctgatgaca gtatcagaag ggatcgcagg aggagtccgg tatggctgaa ccggtaggcg 10560
atctggtcgt tgatttgagt ctggatgcgg ccagatttga cgagcagatg gccagagtca 10620
ggcgtcattt ttctggtacg gaaagtgatg cgaaaaaaac agcggcagtc gttgaacagt 10680
cgctgagccg acaggcgctg gctgcacaga aagcggggat ttccgtcggg cagtataaag 10740
ccgccatgcg tatgctgcct gcacagttca ccgacgtggc cacgcagctt gcaggcgggc 10800
aaagtccgtg gctgatcctg ctgcaacagg gggggcaggt gaaggactcc ttcggcggga 10860
tgatccccat gttcaggggg cttgccggtg cgatcaccct gccgatggtg ggggccacct 10920
cgctggcggt ggcgaccggt gcgctggcgt atgcctggta tcagggcaac tcaaccctgt 10980
ccgatttcaa caaaacgctg gtcctttccg gcaatcaggc gggactgacg gcagatcgta 11040
tgctggtcct gtccagagcc gggcaggcgg cagggctgac gtttaaccag accagcgagt 11100
cactcagcgc actggttaag gcgggggtaa gcggtgaggc tcagattgcg tccatcagcc 11160
agagtgtggc gcgtttctcc tctgcatccg gcgtggaggt ggacaaggtc gctgaagcct 11220
tcgggaagct gaccacagac ccgacgtcgg ggctgacggc gatggctcgc cagttccata 11280
acgtgtcggc ggagcagatt gcgtatgttg ctcagttgca gcgttccggc gatgaagccg 11340
gggcattgca ggcggcgaac gaggccgcaa cgaaagggtt tgatgaccag acccgccgcc 11400
tgaaagagaa catgggcacg ctggagacct gggcagacag gactgcgcgg gcattcaaat 11460
ccatgtggga tgcggtgctg gatattggtc gtcctgatac cgcgcaggag atgctgatta 11520
aggcagaggc tgcgtataag aaagcagacg acatctggaa tctgcgcaag gatgattatt 11580
ttgttaacga tgaagcgcgg gcgcgttact gggatgatcg tgaaaaggcc cgtcttgcgc 11640
ttgaagccgc ccgaaagaag gctgagcagc agactcaaca ggacaaaaat gcgcagcagc 11700
agagcgatac cgaagcgtca cggctgaaat ataccgaaga ggcgcagaag gcttacgaac 11760
ggctgcagac gccgctggag aaatataccg cccgtcagga agaactgaac aaggcactga 11820
aagacgggaa aatcctgcag gcggattaca acacgctgat ggcggcggcg aaaaaggatt 11880
atgaagcgac gctgaaaaag ccgaaacagt ccagcgtgaa ggtgtctgcg ggcgatcgtc 11940
aggaagacag tgctcatgct gccctgctga cgcttcaggc agaactccgg acgctggaga 12000
agcatgccgg agcaaatgag aaaatcagcc agcagcgccg ggatttgtgg aaggcggaga 12060
gtcagttcgc ggtactggag gaggcggcgc aacgtcgcca gctgtctgca caggagaaat 12120
ccctgctggc gcataaagat gagacgctgg agtacaaacg ccagctggct gcacttggcg 12180
acaaggttac gtatcaggag cgcctgaacg cgctggcgca gcaggcggat aaattcgcac 12240
agcagcaacg ggcaaaacgg gccgccattg atgcgaaaag ccgggggctg actgaccggc 12300
aggcagaacg ggaagccacg gaacagcgcc tgaaggaaca gtatggcgat aatccgctgg 12360
cgctgaataa cgtcatgtca gagcagaaaa agacctgggc ggctgaagac cagcttcgcg 12420
ggaactggat ggcaggcctg aagtccggct ggagtgagtg ggaagagagc gccacggaca 12480
gtatgtcgca ggtaaaaagt gcagccacgc agacctttga tggtattgca cagaatatgg 12540
cggcgatgct gaccggcagt gagcagaact ggcgcagctt cacccgttcc gtgctgtcca 12600
tgatgacaga aattctgctt aagcaggcaa tggtggggat tgtcgggagt atcggcagcg 12660
ccattggcgg ggctgttggt ggcggcgcat ccgcgtcagg cggtacagcc attcaggccg 12720
ctgcggcgaa attccatttt gcaaccggag gatttacggg aaccggcggc aaatatgagc 12780
cagcggggat tgttcaccgt ggtgagtttg tcttcacgaa ggaggcaacc agccggattg 12840
gcgtggggaa tctttaccgg ctgatgcgcg gctatgccac cggcggttat gtcggtacac 12900
cgggcagcat ggcagacagc cggtcgcagg cgtccgggac gtttgagcag aataaccatg 12960
tggtgattaa caacgacggc acgaacgggc agataggtcc ggctgctctg aaggcggtgt 13020
atgacatggc ccgcaagggt gcccgtgatg aaattcagac acagatgcgt gatggtggcc 13080
tgttctccgg aggtggacga tgaagacctt ccgctggaaa gtgaaacccg gtatggatgt 13140
ggcttcggtc ccttctgtaa gaaaggtgcg ctttggtgat ggctattctc agcgagcgcc 13200
tgccgggctg aatgccaacc tgaaaacgta cagcgtgacg ctttctgtcc cccgtgagga 13260
ggccacggta ctggagtcgt ttctggaaga gcacgggggc tggaaatcct ttctgtggac 13320
gccgccttat gagtggcggc agataaaggt gacctgcgca aaatggtcgt cgcgggtcag 13380
tatgctgcgt gttgagttca gcgcagagtt tgaacaggtg gtgaactgat gcaggatatc 13440
cggcaggaaa cactgaatga atgcacccgt gcggagcagt cggccagcgt ggtgctctgg 13500
gaaatcgacc tgacagaggt cggtggagaa cgttattttt tctgtaatga gcagaacgaa 13560
aaaggtgagc cggtcacctg gcaggggcga cagtatcagc cgtatcccat tcaggggagc 13620
ggttttgaac tgaatggcaa aggcaccagt acgcgcccca cgctgacggt ttctaacctg 13680
tacggtatgg tcaccgggat ggcggaagat atgcagagtc tggtcggcgg aacggtggtc 13740
cggcgtaagg tttacgcccg ttttctggat gcggtgaact tcgtcaacgg aaacagttac 13800
gccgatccgg agcaggaggt gatcagccgc tggcgcattg agcagtgcag cgaactgagc 13860
gcggtgagtg cctcctttgt actgtccacg ccgacggaaa cggatggcgc tgtttttccg 13920
ggacgtatca tgctggccaa cacctgcacc tggacctatc gcggtgacga gtgcggttat 13980
agcggtccgg ctgtcgcgga tgaatatgac cagccaacgt ccgatatcac gaaggataaa 14040
tgcagcaaat gcctgagcgg ttgtaagttc cgcaataacg tcggcaactt tggcggcttc 14100
ctttccatta acaaactttc gcagtaaatc ccatgacaca gacagaatca gcgattctgg 14160
cgcacgcccg gcgatgtgcg ccagcggagt cgtgcggctt cgtggtaagc acgccggagg 14220
gggaaagata tttcccctgc gtgaatatct ccggtgagcc ggaggctatt tccgtatgtc 14280
gccggaagac tggctgcagg cagaaatgca gggtgagatt gtggcgctgg tccacagcca 14340
ccccggtggt ctgccctggc tgagtgaggc cgaccggcgg ctgcaggtgc agagtgattt 14400
gccgtggtgg ctggtctgcc gggggacgat tcataagttc cgctgtgtgc cgcatctcac 14460
cgggcggcgc tttgagcacg gtgtgacgga ctgttacaca ctgttccggg atgcttatca 14520
tctggcgggg attgagatgc cggactttca tcgtgaggat gactggtggc gtaacggcca 14580
gaatctctat ctggataatc tggaggcgac ggggctgtat caggtgccgt tgtcagcggc 14640
acagccgggc gatgtgctgc tgtgctgttt tggttcatca gtgccgaatc acgccgcaat 14700
ttactgcggc gacggcgagc tgctgcacca tattcctgaa caactgagca aacgagagag 14760
gtacaccgac aaatggcagc gacgcacaca ctccctctgg cgtcaccggg catggcgcgc 14820
atctgccttt acggggattt acaacgattt ggtcgccgca tcgaccttcg tgtgaaaacg 14880
ggggctgaag ccatccgggc actggccaca cagctcccgg cgtttcgtca gaaactgagc 14940
gacggctggt atcaggtacg gattgccggg cgggacgtca gcacgtccgg gttaacggcg 15000
cagttacatg agactctgcc tgatggcgct gtaattcata ttgttcccag agtcgccggg 15060
gccaagtcag gtggcgtatt ccagattgtc ctgggggctg ccgccattgc cggatcattc 15120
tttaccgccg gagccaccct tgcagcatgg ggggcagcca ttggggccgg tggtatgacc 15180
ggcatcctgt tttctctcgg tgccagtatg gtgctcggtg gtgtggcgca gatgctggca 15240
ccgaaagcca gaactccccg tatacagaca acggataacg gtaagcagaa cacctatttc 15300
tcctcactgg ataacatggt tgcccagggc aatgttctgc ctgttctgta cggggaaatg 15360
cgcgtggggt cacgcgtggt ttctcaggag atcagcacgg cagacgaagg ggacggtggt 15420
caggttgtgg tgattggtcg ctgatgcaaa atgttttatg tgaaaccgcc tgcgggcggt 15480
tttgtcattt atggagcgtg aggaatgggt aaaggaagca gtaaggggca taccccgcgc 15540
gaagcgaagg acaacctgaa gtccacgcag ttgctgagtg tgatcgatgc catcagcgaa 15600
gggccgattg aaggtccggt ggatggctta aaaagcgtgc tgctgaacag tacgccggtg 15660
ctggacactg aggggaatac caacatatcc ggtgtcacgg tggtgttccg ggctggtgag 15720
caggagcaga ctccgccgga gggatttgaa tcctccggct ccgagacggt gctgggtacg 15780
gaagtgaaat atgacacgcc gatcacccgc accattacgt ctgcaaacat cgaccgtctg 15840
cgctttacct tcggtgtaca ggcactggtg gaaaccacct caaagggtga caggaatccg 15900
tcggaagtcc gcctgctggt tcagatacaa cgtaacggtg gctgggtgac ggaaaaagac 15960
atcaccatta agggcaaaac cacctcgcag tatctggcct cggtggtgat gggtaacctg 16020
ccgccgcgcc cgtttaatat ccggatgcgc aggatgacgc cggacagcac cacagaccag 16080
ctgcagaaca aaacgctctg gtcgtcatac actgaaatca tcgatgtgaa acagtgctac 16140
ccgaacacgg cactggtcgg cgtgcaggtg gactcggagc agttcggcag ccagcaggtg 16200
agccgtaatt atcatctgcg cgggcgtatt ctgcaggtgc cgtcgaacta taacccgcag 16260
acgcggcaat acagcggtat ctgggacgga acgtttaaac cggcatacag caacaacatg 16320
gcctggtgtc tgtgggatat gctgacccat ccgcgctacg gcatggggaa acgtcttggt 16380
gcggcggatg tggataaatg ggcgctgtat gtcatcggcc agtactgcga ccagtcagtg 16440
ccggacggct ttggcggcac ggagccgcgc atcacctgta atgcgtacct gaccacacag 16500
cgtaaggcgt gggatgtgct cagcgatttc tgctcggcga tgcgctgtat gccggtatgg 16560
aacgggcaga cgctgacgtt cgtgcaggac cgaccgtcgg ataagacgtg gacctataac 16620
cgcagtaatg tggtgatgcc ggatgatggc gcgccgttcc gctacagctt cagcgccctg 16680
aaggaccgcc ataatgccgt tgaggtgaac tggattgacc cgaacaacgg ctgggagacg 16740
gcgacagagc ttgttgaaga tacgcaggcc attgcccgtt acggtcgtaa tgttacgaag 16800
atggatgcct ttggctgtac cagccggggg caggcacacc gcgccgggct gtggctgatt 16860
aaaacagaac tgctggaaac gcagaccgtg gatttcagcg tcggcgcaga agggcttcgc 16920
catgtaccgg gcgatgttat tgaaatctgc gatgatgact atgccggtat cagcaccggt 16980
ggtcgtgtgc tggcggtgaa cagccagacc cggacgctga cgctcgaccg tgaaatcacg 17040
ctgccatcct ccggtaccgc gctgataagc ctggttgacg gaagtggcaa tccggtcagc 17100
gtggaggttc agtccgtcac cgacggcgtg aaggtaaaag tgagccgtgt tcctgacggt 17160
gttgctgaat acagcgtatg ggagctgaag ctgccgacgc tgcgccagcg actgttccgc 17220
tgcgtgagta tccgtgagaa cgacgacggc acgtatgcca tcaccgccgt gcagcatgtg 17280
ccggaaaaag aggccatcgt ggataacggg gcgcactttg acggcgaaca gagtggcacg 17340
gtgaatggtg tcacgccgcc agcggtgcag cacctgaccg cagaagtcac tgcagacagc 17400
ggggaatatc aggtgctggc gcgatgggac acaccgaagg tggtgaaggg cgtgagtttc 17460
ctgctccgtc tgaccgtaac agcggacgac ggcagtgagc ggctggtcag cacggcccgg 17520
acgacggaaa ccacataccg cttcacgcaa ctggcgctgg ggaactacag gctgacagtc 17580
cgggcggtaa atgcgtgggg gcagcagggc gatccggcgt cggtatcgtt ccggattgcc 17640
gcaccggcag caccgtcgag gattgagctg acgccgggct attttcagat aaccgccacg 17700
ccgcatcttg ccgtttatga cccgacggta cagtttgagt tctggttctc ggaaaagcag 17760
attgcggata tcagacaggt tgaaaccagc acgcgttatc ttggtacggc gctgtactgg 17820
atagccgcca gtatcaatat caaaccgggc catgattatt acttttatat ccgcagtgtg 17880
aacaccgttg gcaaatcggc attcgtggag gccgtcggtc gggcgagcga tgatgcggaa 17940
ggttacctgg attttttcaa aggcaagata accgaatccc atctcggcaa ggagctgctg 18000
gaaaaagtcg agctgacgga ggataacgcc agcagactgg aggagttttc gaaagagtgg 18060
aaggatgcca gtgataagtg gaatgccatg tgggctgtca aaattgagca gaccaaagac 18120
ggcaaacatt atgtcgcggg tattggcctc agcatggagg acacggagga aggcaaactg 18180
agccagtttc tggttgccgc caatcgtatc gcatttattg acccggcaaa cgggaatgaa 18240
acgccgatgt ttgtggcgca gggcaaccag atattcatga acgacgtgtt cctgaagcgc 18300
ctgacggccc ccaccattac cagcggcggc aatcctccgg ccttttccct gacaccggac 18360
ggaaagctga ccgctaaaaa tgcggatatc agtggcagtg tgaatgcgaa ctccgggacg 18420
ctcagtaatg tgacgatagc tgaaaactgt acgataaacg gtacgctgag ggcggaaaaa 18480
atcgtcgggg acattgtaaa ggcggcgagc gcggcttttc cgcgccagcg tgaaagcagt 18540
gtggactggc cgtcaggtac ccgtactgtc accgtgaccg atgaccatcc ttttgatcgc 18600
cagatagtgg tgcttccgct gacgtttcgc ggaagtaagc gtactgtcag cggcaggaca 18660
acgtattcga tgtgttatct gaaagtactg atgaacggtg cggtgattta tgatggcgcg 18720
gcgaacgagg cggtacaggt gttctcccgt attgttgaca tgccagcggg tcggggaaac 18780
gtgatcctga cgttcacgct tacgtccaca cggcattcgg cagatattcc gccgtatacg 18840
tttgccagcg atgtgcaggt tatggtgatt aagaaacagg cgctgggcat cagcgtggtc 18900
tgagtgtgtt acagaggttc gtccgggaac gggcgtttta ttataaaaca gtgagaggtg 18960
aacgatgcgt aatgtgtgta ttgccgttgc tgtctttgcc gcacttgcgg tgacagtcac 19020
tccggcccgt gcggaaggtg gacatggtac gtttacggtg ggctattttc aagtgaaacc 19080
gggtacattg ccgtcgttgt cgggcgggga taccggtgtg agtcatctga aagggattaa 19140
cgtgaagtac cgttatgagc tgacggacag tgtgggggtg atggcttccc tggggttcgc 19200
cgcgtcgaaa aagagcagca cagtgatgac cggggaggat acgtttcact atgagagcct 19260
gcgtggacgt tatgtgagcg tgatggccgg accggtttta caaatcagta agcaggtcag 19320
tgcgtacgcc atggccggag tggctcacag tcggtggtcc ggcagtacaa tggattaccg 19380
taagacggaa atcactcccg ggtatatgaa agagacgacc actgccaggg acgaaagtgc 19440
aatgcggcat acctcagtgg cgtggagtgc aggtatacag attaatccgg cagcgtccgt 19500
cgttgttgat attgcttatg aaggctccgg cagtggcgac tggcgtactg acggattcat 19560
cgttggggtc ggttataaat tctgattagc caggtaacac agtgttatga cagcccgccg 19620
gaaccggtgg gcttttttgt ggggtgaata tggcagtaaa gatttcagga gtcctgaaag 19680
acggcacagg aaaaccggta cagaactgca ccattcagct gaaagccaga cgtaacagca 19740
ccacggtggt ggtgaacacg gtgggctcag agaatccgga tgaagccggg cgttacagca 19800
tggatgtgga gtacggtcag tacagtgtca tcctgcaggt tgacggtttt ccaccatcgc 19860
acgccgggac catcaccgtg tatgaagatt cacaaccggg gacgctgaat gattttctct 19920
gtgccatgac ggaggatgat gcccggccgg aggtgctgcg tcgtcttgaa ctgatggtgg 19980
aagaggtggc gcgtaacgcg tccgtggtgg cacagagtac ggcagacgcg aagaaatcag 20040
ccggcgatgc cagtgcatca gctgctcagg tcgcggccct tgtgactgat gcaactgact 20100
cagcacgcgc cgccagcacg tccgccggac aggctgcatc gtcagctcag gaagcgtcct 20160
ccggcgcaga agcggcatca gcaaaggcca ctgaagcgga aaaaagtgcc gcagccgcag 20220
agtcctcaaa aaacgcggcg gccaccagtg ccggtgcggc gaaaacgtca gaaacgaatg 20280
ctgcagcgtc acaacaatca gccgccacgt ctgcctccac cgcggccacg aaagcgtcag 20340
aggccgccac ttcagcacga gatgcggtgg cctcaaaaga ggcagcaaaa tcatcagaaa 20400
cgaacgcatc atcaagtgcc ggtcgtgcag cttcctcggc aacggcggca gaaaattctg 20460
ccagggcggc aaaaacgtcc gagacgaatg ccaggtcatc tgaaacagca gcggaacgga 20520
gcgcctctgc cgcggcagac gcaaaaacag cggcggcggg gagtgcgtca acggcatcca 20580
cgaaggcgac agaggctgcg ggaagtgcgg tatcagcatc gcagagcaaa agtgcggcag 20640
aagcggcggc aatacgtgca aaaaattcgg caaaacgtgc agaagatata gcttcagctg 20700
tcgcgcttga ggatgcggac acaacgagaa aggggatagt gcagctcagc agtgcaacca 20760
acagcacgtc tgaaacgctt gctgcaacgc caaaggcggt taaggtggta atggatgaaa 20820
cgaacagaaa agcccactgg acagtccggc actgaccgga acgccaacag caccaaccgc 20880
gctcagggga acaaacaata cccagattgc gaacaccgct tttgtactgg ccgcgattgc 20940
agatgttatc gacgcgtcac ctgacgcact gaatacgctg aatgaactgg ccgcagcgct 21000
cgggaatgat ccagattttg ctaccaccat gactaacgcg cttgcgggta aacaaccgaa 21060
gaatgcgaca ctgacggcgc tggcagggct ttccacggcg aaaaataaat taccgtattt 21120
tgcggaaaat gatgccgcca gcctgactga actgactcag gttggcaggg atattctggc 21180
aaaaaattcc gttgcagatg ttcttgaata ccttggggcc ggtgagaatt cggcctttcc 21240
ggcaggtgcg ccgatcccgt ggccatcaga tatcgttccg tctggctacg tcctgatgca 21300
ggggcaggcg tttgacaaat cagcctaccc aaaacttgct gtcgcgtatc catcgggtgt 21360
gcttcctgat atgcgaggct ggacaatcaa ggggaaaccc gccagcggtc gtgctgtatt 21420
gtctcaggaa caggatggaa ttaagtcgca cacccacagt gccagtgcat ccggtacgga 21480
tttggggacg aaaaccacat cgtcgtttga ttacgggacg aaaacaacag gcagtttcga 21540
ttacggcacc aaatcgacga ataacacggg ggctcatgct cacagtctga gcggttcaac 21600
aggggccgcg ggtgctcatg cccacacaag tggtttaagg atgaacagtt ctggctggag 21660
tcagtatgga acagcaacca ttacaggaag tttatccaca gttaaaggaa ccagcacaca 21720
gggtattgct tatttatcga aaacggacag tcagggcagc cacagtcact cattgtccgg 21780
tacagccgtg agtgccggtg cacatgcgca tacagttggt attggtgcgc accagcatcc 21840
ggttgttatc ggtgctcatg cccattcttt cagtattggt tcacacggac acaccatcac 21900
cgttaacgct gcgggtaacg cggaaaacac cgtcaaaaac attgcattta actatattgt 21960
gaggcttgca taatggcatt cagaatgagt gaacaaccac ggaccataaa aatttataat 22020
ctgctggccg gaactaatga atttattggt gaaggtgacg catatattcc gcctcatacc 22080
ggtctgcctg caaacagtac cgatattgca ccgccagata ttccggctgg ctttgtggct 22140
gttttcaaca gtgatgaggc atcgtggcat ctcgttgaag accatcgggg taaaaccgtc 22200
tatgacgtgg cttccggcga cgcgttattt atttctgaac tcggtccgtt accggaaaat 22260
tttacctggt tatcgccggg aggggaatat cagaagtgga acggcacagc ctgggtgaag 22320
gatacggaag cagaaaaact gttccggatc cgggaggcgg aagaaacaaa aaaaagcctg 22380
atgcaggtag ccagtgagca tattgcgccg cttcaggatg ctgcagatct ggaaattgca 22440
acgaaggaag aaacctcgtt gctggaagcc tggaagaagt atcgggtgtt gctgaaccgt 22500
gttgatacat caactgcacc tgatattgag tggcctgctg tccctgttat ggagtaatcg 22560
ttttgtgata tgccgcagaa acgttgtatg aaataacgtt ctgcggttag ttagtatatt 22620
gtaaagctga gtattggttt atttggcgat tattatcttc aggagaataa tggaagttct 22680
atgactcaat tgttcatagt gtttacatca ccgccaattg cttttaagac tgaacgcatg 22740
aaatatggtt tttcgtcatg ttttgagtct gctgttgata tttctaaagt cggttttttt 22800
tcttcgtttt ctctaactat tttccatgaa atacattttt gattattatt tgaatcaatt 22860
ccaattacct gaagtctttc atctataatt ggcattgtat gtattggttt attggagtag 22920
atgcttgctt ttctgagcca tagctctgat atccaaatga agccataggc atttgttatt 22980
ttggctctgt cagctgcata acgccaaaaa atatatttat ctgcttgatc ttcaaatgtt 23040
gtattgatta aatcaattgg atggaattgt ttatcataaa aaattaatgt ttgaatgtga 23100
taaccgtcct ttaaaaaagt cgtttctgca agcttggctg tatagtcaac taactcttct 23160
gtcgaagtga tatttttagg cttatctacc agttttagac gctctttaat atcttcagga 23220
attattttat tgtcatattg tatcatgcta aatgacaatt tgcttatgga gtaatctttt 23280
aattttaaat aagttattct cctggcttca tcaaataaag agtcgaatga tgttggcgaa 23340
atcacatcgt cacccattgg attgtttatt tgtatgccaa gagagttaca gcagttatac 23400
attctgccat agattatagc taaggcatgt aataattcgt aatcttttag cgtattagcg 23460
acccatcgtc tttctgattt aataatagat gattcagtta aatatgaagg taatttcttt 23520
tgtgcaagtc tgactaactt ttttatacca atgtttaaca tactttcatt tgtaataaac 23580
tcaatgtcat tttcttcaat gtaagatgaa ataagagtag cctttgcctc gctatacatt 23640
tctaaatcgc cttgtttttc tatcgtattg cgagaatttt tagcccaagc cattaatgga 23700
tcatttttcc atttttcaat aacattattg ttataccaaa tgtcatatcc tataatctgg 23760
tttttgtttt tttgaataat aaatgttact gttcttgcgg tttggaggaa ttgattcaaa 23820
ttcaagcgaa ataattcagg gtcaaaatat gtatcaatgc agcatttgag caagtgcgat 23880
aaatctttaa gtcttctttc ccatggtttt ttagtcataa aactctccat tttgataggt 23940
tgcatgctag atgctgatat attttagagg tgataaaatt aactgcttaa ctgtcaatgt 24000
aatacaagtt gtttgatctt tgcaatgatt cttatcagaa accatatagt aaattagtta 24060
cacaggaaat ttttaatatt attattatca ttcattatgt attaaaatta gagttgtggc 24120
ttggctctgc taacacgttg ctcataggag atatggtaga gccgcagaca cgtcgtatgc 24180
aggaacgtgc tgcggctggc tggtgaactt ccgatagtgc gggtgttgaa tgatttccag 24240
ttgctaccga ttttacatat tttttgcatg agagaatttg taccacctcc caccgaccat 24300
ctatgactgt acgccactgt ccctaggact gctatgtgcc ggagcggaca ttacaaacgt 24360
ccttctcggt gcatgccact gttgccaatg acctgcctag gaattggtta gcaagttact 24420
accggatttt gtaaaaacag ccctcctcat ataaaaagta ttcgttcact tccgataagc 24480
gtcgtaattt tctatctttc atcatattct agatccctct gaaaaaatct tccgagtttg 24540
ctaggcactg atacataact cttttccaat aattggggaa gtcattcaaa tctataatag 24600
gtttcagatt tgcttcaata aattctgact gtagctgctg aaacgttgcg gttgaactat 24660
atttccttat aacttttacg aaagagtttc tttgagtaat cacttcactc aagtgcttcc 24720
ctgcctccaa acgatacctg ttagcaatat ttaatagctt gaaatgatga agagctctgt 24780
gtttgtcttc ctgcctccag ttcgccgggc attcaacata aaaactgata gcacccggag 24840
ttccggaaac gaaatttgca tatacccatt gctcacgaaa aaaaatgtcc ttgtcgatat 24900
agggatgaat cgcttggtgt acctcatcta ctgcgaaaac ttgacctttc tctcccatat 24960
tgcagtcgcg gcacgatgga actaaattaa taggcatcac cgaaaattca ggataatgtg 25020
caataggaag aaaatgatct atattttttg tctgtcctat atcaccacaa aatggacatt 25080
tttcacctga tgaaacaagc atgtcatcgt aatatgttct agcgggtttg tttttatctc 25140
ggagattatt ttcataaagc ttttctaatt taacctttgt caggttacca actactaagg 25200
ttgtaggctc aagagggtgt gtcctgtcgt aggtaaataa ctgacctgtc gagcttaata 25260
ttctatattg ttgttctttc tgcaaaaaag tggggaagtg agtaatgaaa ttatttctaa 25320
catttatctg catcatacct tccgagcatt tattaagcat ttcgctataa gttctcgctg 25380
gaagaggtag ttttttcatt gtactttacc ttcatctctg ttcattatca tcgcttttaa 25440
aacggttcga ccttctaatc ctatctgacc attataattt tttagaatgg tttcataaga 25500
aagctctgaa tcaacggact gcgataataa gtggtggtat ccagaatttg tcacttcaag 25560
taaaaacacc tcacgagtta aaacacctaa gttctcaccg aatgtctcaa tatccggacg 25620
gataatattt attgcttctc ttgaccgtag gactttccac atgcaggatt ttggaacctc 25680
ttgcagtact actggggaat gagttgcaat tattgctaca ccattgcgtg catcgagtaa 25740
gtcgcttaat gttcgtaaaa aagcagagag caaaggtgga tgcagatgaa cctctggttc 25800
atcgaataaa actaatgact tttcgccaac gacatctact aatcttgtga tagtaaataa 25860
aacaattgca tgtccagagc tcattcgaag cagatatttc tggatattgt cataaaacaa 25920
tttagtgaat ttatcatcgt ccacttgaat ctgtggttca ttacgtctta actcttcata 25980
tttagaaatg aggctgatga gttccatatt tgaaaagttt tcatcactac ttagtttttt 26040
gatagcttca agccagagtt gtctttttct atctactctc atacaaccaa taaatgctga 26100
aatgaattct aagcggagat cgcctagtga ttttaaacta ttgctggcag cattcttgag 26160
tccaatataa aagtattgtg taccttttgc tgggtcaggt tgttctttag gaggagtaaa 26220
aggatcaaat gcactaaacg aaactgaaac aagcgatcga aaatatccct ttgggattct 26280
tgactcgata agtctattat tttcagagaa aaaatattca ttgttttctg ggttggtgat 26340
tgcaccaatc attccattca aaattgttgt tttaccacac ccattccgcc cgataaaagc 26400
atgaatgttc gtgctgggca tagaattaac cgtcacctca aaaggtatag ttaaatcact 26460
gaatccggga gcactttttc tattaaatga aaagtggaaa tctgacaatt ctggcaaacc 26520
atttaacaca cgtgcgaact gtccatgaat ttctgaaaga gttacccctc taagtaatga 26580
ggtgttaagg acgctttcat tttcaatgtc ggctaatcga tttggccata ctactaaatc 26640
ctgaatagct ttaagaaggt tatgtttaaa accatcgctt aatttgctga gattaacata 26700
gtagtcaatg ctttcaccta aggaaaaaaa catttcaggg agttgactga attttttatc 26760
tattaatgaa taagtgctta cttcttcttt ttgacctaca aaaccaattt taacatttcc 26820
gatatcgcat ttttcaccat gctcatcaaa gacagtaaga taaaacattg taacaaagga 26880
atagtcattc caaccatctg ctcgtaggaa tgccttattt ttttctactg caggaatata 26940
cccgcctctt tcaataacac taaactccaa catatagtaa cccttaattt tattaaaata 27000
accgcaattt atttggcggc aacacaggat ctctctttta agttactctc tattacatac 27060
gttttccatc taaaaattag tagtattgaa cttaacgggg catcgtattg tagttttcca 27120
tatttagctt tctgcttcct tttggataac ccactgttat tcatgttgca tggtgcactg 27180
tttataccaa cgatatagtc tattaatgca tatatagtat cgccgaacga ttagctcttc 27240
aggcttctga agaagcgttt caagtactaa taagccgata gatagccacg gacttcgtag 27300
ccatttttca taagtgttaa cttccgctcc tcgctcataa cagacattca ctacagttat 27360
ggcggaaagg tatgcatgct gggtgtgggg aagtcgtgaa agaaaagaag tcagctgcgt 27420
cgtttgacat cactgctatc ttcttactgg ttatgcaggt cgtagtgggt ggcacacaaa 27480
gctttgcact ggattgcgag gctttgtgct tctctggagt gcgacaggtt tgatgacaaa 27540
aaattagcgc aagaagacaa aaatcacctt gcgctaatgc tctgttacag gtcactaata 27600
ccatctaagt agttgattca tagtgactgc atatgttgtg ttttacagta ttatgtagtc 27660
tgttttttat gcaaaatcta atttaatata ttgatattta tatcatttta cgtttctcgt 27720
tcagcttttt tatactaagt tggcattata aaaaagcatt gcttatcaat ttgttgcaac 27780
gaacaggtca ctatcagtca aaataaaatc attatttgat ttcaattttg tcccactccc 27840
tgcctctgtc atcacgatac tgtgatgcca tggtgtccga cttatgcccg agaagatgtt 27900
gagcaaactt atcgcttatc tgcttctcat agagtcttgc agacaaactg cgcaactcgt 27960
gaaaggtagg cggatcccct tcgaaggaaa gacctgatgc ttttcgtgcg cgcataaaat 28020
accttgatac tgtgccggat gaaagcggtt cgcgacgagt agatgcaatt atggtttctc 28080
cgccaagaat ctctttgcat ttatcaagtg tttccttcat tgatattccg agagcatcaa 28140
tatgcaatgc tgttgggatg gcaattttta cgcctgtttt gctttgctcg acataaagat 28200
atccatctac gatatcagac cacttcattt cgcataaatc accaactcgt tgcccggtaa 28260
caacagccag ttccattgca agtctgagcc aacatggtga tgattctgct gcttgataaa 28320
ttttcaggta ttcgtcagcc gtaagtcttg atctccttac ctctgatttt gctgcgcgag 28380
tggcagcgac atggtttgtt gttatatggc cttcagctat tgcctctcgg aatgcatcgc 28440
tcagtgttga tctgattaac ttggctgacg ccgccttgcc ctcgtctatg tatccattga 28500
gcattgccgc aatttctttt gtggtgatgt cttcaagtgg agcatcaggc agacccctcc 28560
ttattgcttt aattttgctc atgtaattta tgagtgtctt ctgcttgatt cctctgctgg 28620
ccaggatttt ttcgtagcga tcaagccatg aatgtaacgt aacggaatta tcactgttga 28680
ttctcgctgt cagaggcttg tgtttgtgtc ctgaaaataa ctcaatgttg gcctgtatag 28740
cttcagtgat tgcgattcgc ctgtctctgc ctaatccaaa ctctttaccc gtccttgggt 28800
ccctgtagca gtaatatcca ttgtttctta tataaaggtt agggggtaaa tcccggcgct 28860
catgacttcg ccttcttccc atttctgatc ctcttcaaaa ggccacctgt tactggtcga 28920
tttaagtcaa cctttaccgc tgattcgtgg aacagatact ctcttccatc cttaaccgga 28980
ggtgggaata tcctgcattc ccgaacccat cgacgaactg tttcaaggct tcttggacgt 29040
cgctggcgtg cgttccactc ctgaagtgtc aagtacatcg caaagtctcc gcaattacac 29100
gcaagaaaaa accgccatca ggcggcttgg tgttctttca gttcttcaat tcgaatattg 29160
gttacgtctg catgtgctat ctgcgcccat atcatccagt ggtcgtagca gtcgttgatg 29220
ttctccgctt cgataactct gttgaatggc tctccattcc attctcctgt gactcggaag 29280
tgcatttatc atctccataa aacaaaaccc gccgtagcga gttcagataa aataaatccc 29340
cgcgagtgcg aggattgtta tgtaatattg ggtttaatca tctatatgtt ttgtacagag 29400
agggcaagta tcgtttccac cgtactcgtg ataataattt tgcacggtat cagtcatttc 29460
tcgcacattg cagaatgggg atttgtcttc attagactta taaaccttca tggaatattt 29520
gtatgccgac tctatatcta taccttcatc tacataaaca ccttcgtgat gtctgcatgg 29580
agacaagaca ccggatctgc acaacattga taacgcccaa tctttttgct cagactctaa 29640
ctcattgata ctcatttata aactccttgc aatgtatgtc gtttcagcta aacggtatca 29700
gcaatgttta tgtaaagaaa cagtaagata atactcaacc cgatgtttga gtacggtcat 29760
catctgacac tacagactct ggcatcgctg tgaagacgac gcgaaattca gcattttcac 29820
aagcgttatc ttttacaaaa ccgatctcac tctcctttga tgcgaatgcc agcgtcagac 29880
atcatatgca gatactcacc tgcatcctga acccattgac ctccaacccc gtaatagcga 29940
tgcgtaatga tgtcgatagt tactaacggg tcttgttcga ttaactgccg cagaaactct 30000
tccaggtcac cagtgcagtg cttgataaca ggagtcttcc caggatggcg aacaacaaga 30060
aactggtttc cgtcttcacg gacttcgttg ctttccagtt tagcaatacg cttactccca 30120
tccgagataa caccttcgta atactcacgc tgctcgttga gttttgattt tgctgtttca 30180
agctcaacac gcagtttccc tactgttagc gcaatatcct cgttctcctg gtcgcggcgt 30240
ttgatgtatt gctggtttct ttcccgttca tccagcagtt ccagcacaat cgatggtgtt 30300
accaattcat ggaaaaggtc tgcgtcaaat ccccagtcgt catgcattgc ctgctctgcc 30360
gcttcacgca gtgcctgaga gttaatttcg ctcacttcga acctctctgt ttactgataa 30420
gttccagatc ctcctggcaa cttgcacaag tccgacaacc ctgaacgacc aggcgtcttc 30480
gttcatctat cggatcgcca cactcacaac aatgagtggc agatatagcc tggtggttca 30540
ggcggcgcat ttttattgct gtgttgcgct gtaattcttc tatttctgat gctgaatcaa 30600
tgatgtctgc catctttcat taatccctga actgttggtt aatacgcttg agggtgaatg 30660
cgaataataa aaaaggagcc tgtagctccc tgatgatttt gcttttcatg ttcatcgttc 30720
cttaaagacg ccgtttaaca tgccgattgc caggcttaaa tgagtcggtg tgaatcccat 30780
cagcgttacc gtttcgcggt gcttcttcag tacgctacgg caaatgtcat cgacgttttt 30840
atccggaaac tgctgtctgg ctttttttga tttcagaatt agcctgacgg gcaatgctgc 30900
gaagggcgtt ttcctgctga ggtgtcattg aacaagtccc atgtcggcaa gcataagcac 30960
acagaatatg aagcccgctg ccagaaaaat gcattccgtg gttgtcatac ctggtttctc 31020
tcatctgctt ctgctttcgc caccatcatt tccagctttt gtgaaaggga tgcggctaac 31080
gtatgaaatt cttcgtctgt ttctactggt attggcacaa acctgattcc aatttgagca 31140
aggctatgtg ccatctcgat actcgttctt aactcaacag aagatgcttt gtgcatacag 31200
cccctcgttt attatttatc tcctcagcca gccgctgtgc tttcagtgga tttcggataa 31260
cagaaaggcc gggaaatacc cagcctcgct ttgtaacgga gtagacgaaa gtgattgcgc 31320
ctacccggat attatcgtga ggatgcgtca tcgccattgc tccccaaata caaaaccaat 31380
ttcagccagt gcctcgtcca ttttttcgat gaactccggc acgatctcgt caaaactcgc 31440
catgtacttt tcatcccgct caatcacgac ataatgcagg ccttcacgct tcatacgcgg 31500
gtcatagttg gcaaagtacc aggcattttt tcgcgtcacc cacatgctgt actgcacctg 31560
ggccatgtaa gctgacttta tggcctcgaa accaccgagc cggaacttca tgaaatcccg 31620
ggaggtaaac gggcatttca gttcaaggcc gttgccgtca ctgcataaac catcgggaga 31680
gcaggcggta cgcatacttt cgtcgcgata gatgatcggg gattcagtaa cattcacgcc 31740
ggaagtgaat tcaaacaggg ttctggcgtc gttctcgtac tgttttcccc aggccagtgc 31800
tttagcgtta acttccggag ccacaccggt gcaaacctca gcaagcaggg tgtggaagta 31860
ggacattttc atgtcaggcc acttctttcc ggagcggggt tttgctatca cgttgtgaac 31920
ttctgaagcg gtgatgacgc cgagccgtaa tttgtgccac gcatcatccc cctgttcgac 31980
agctctcaca tcgatcccgg tacgctgcag gataatgtcc ggtgtcatgc tgccaccttc 32040
tgctctgcgg ctttctgttt caggaatcca agagctttta ctgcttcggc ctgtgtcagt 32100
tctgacgatg cacgaatgtc gcggcgaaat atctgggaac agagcggcaa taagtcgtca 32160
tcccatgttt tatccagggc gatcagcaga gtgttaatct cctgcatggt ttcatcgtta 32220
accggagtga tgtcgcgttc cggctgacgt tctgcagtgt atgcagtatt ttcgacaatg 32280
cgctcggctt catccttgtc atagatacca gcaaatccga aggccagacg ggcacactga 32340
atcatggctt tatgacgtaa catccgtttg ggatgcgact gccacggccc cgtgatttct 32400
ctgccttcgc gagttttgaa tggttcgcgg cggcattcat ccatccattc ggtaacgcag 32460
atcggatgat tacggtcctt gcggtaaatc cggcatgtac aggattcatt gtcctgctca 32520
aagtccatgc catcaaactg ctggttttca ttgatgatgc gggaccagcc atcaacgccc 32580
accaccggaa cgatgccatt ctgcttatca ggaaaggcgt aaatttcttt cgtccacgga 32640
ttaaggccgt actggttggc aacgatcagt aatgcgatga actgcgcatc gctggcatca 32700
cctttaaatg ccgtctggcg aagagtggtg atcagttcct gtgggtcgac agaatccatg 32760
ccgacacgtt cagccagctt cccagccagc gttgcgagtg cagtactcat tcgttttata 32820
cctctgaatc aatatcaacc tggtggtgag caatggtttc aaccatgtac cggatgtgtt 32880
ctgccatgcg ctcctgaaac tcaacatcgt catcaaacgc acgggtaatg gattttttgc 32940
tggccccgtg gcgttgcaaa tgatcgatgc atagcgattc aaacaggtgc tggggcaggc 33000
ctttttccat gtcgtctgcc agttctgcct ctttctcttc acgggcgagc tgctggtagt 33060
gacgcgccca gctctgagcc tcaagacgat cctgaatgta ataagcgttc atggctgaac 33120
tcctgaaata gctgtgaaaa tatcgcccgc gaaatgccgg gctgattagg aaaacaggaa 33180
agggggttag tgaatgcttt tgcttgatct cagtttcagt attaatatcc attttttata 33240
agcgtcgacg gcttcacgaa acatcttttc atcgccaata aaagtggcga tagtgaattt 33300
agtctggata gccataagtg tttgatccat tctttgggac tcctggctga ttaagtatgt 33360
cgataaggcg tttccatccg tcacgtaatt tacgggtgat tcgttcaagt aaagattcgg 33420
aagggcagcc agcaacaggc caccctgcaa tggcatattg catggtgtgc tccttattta 33480
tacataacga aaaacgcctc gagtgaagcg ttattggtat gcggtaaaac cgcactcagg 33540
cggccttgat agtcatatca tctgaatcaa atattcctga tgtatcgata tcggtaattc 33600
ttattccttc gctaccatcc attggaggcc atccttcctg accatttcca tcattccagt 33660
cgaactcaca cacaacacca tatgcattta agtcgcttga aattgctata agcagagcat 33720
gttgcgccag catgattaat acagcattta atacagagcc gtgtttattg agtcggtatt 33780
cagagtctga ccagaaatta ttaatctggt gaagtttttc ctctgtcatt acgtcatggt 33840
cgatttcaat ttctattgat gctttccagt cgtaatcaat gatgtatttt ttgatgtttg 33900
acatctgttc atatcctcac agataaaaaa tcgccctcac actggagggc aaagaagatt 33960
tccaataatc agaacaagtc ggctcctgtt tagttacgag cgacattgct ccgtgtattc 34020
actcgttgga atgaatacac agtgcagtgt ttattctgtt atttatgcca aaaataaagg 34080
ccactatcag gcagctttgt tgttctgttt accaagttct ctggcaatca ttgccgtcgt 34140
tcgtattgcc catttatcga catatttccc atcttccatt acaggaaaca tttcttcagg 34200
cttaaccatg cattccgatt gcagcttgca tccattgcat cgcttgaatt gtccacacca 34260
ttgattttta tcaatagtcg tagtcatacg gatagtcctg gtattgttcc atcacatcct 34320
gaggatgctc ttcgaactct tcaaattctt cttccatata tcaccttaaa tagtggattg 34380
cggtagtaaa gattgtgcct gtcttttaac cacatcaggc tcggtggttc tcgtgtaccc 34440
ctacagcgag aaatcggata aactattaca acccctacag tttgatgagt atagaaatgg 34500
atccactcgt tattctcgga cgagtgttca gtaatgaacc tctggagaga accatgtata 34560
tgatcgttat ctgggttgga cttctgcttt taagcccaga taactggcct gaatatgtta 34620
atgagagaat cggtattcct catgtgtggc atgttttcgt ctttgctctt gcattttcgc 34680
tagcaattaa tgtgcatcga ttatcagcta ttgccagcgc cagatataag cgatttaagc 34740
taagaaaacg cattaagatg caaaacgata aagtgcgatc agtaattcaa aaccttacag 34800
aagagcaatc tatggttttg tgcgcagccc ttaatgaagg caggaagtat gtggttacat 34860
caaaacaatt cccatacatt agtgagttga ttgagcttgg tgtgttgaac aaaacttttt 34920
cccgatggaa tggaaagcat atattattcc ctattgagga tatttactgg actgaattag 34980
ttgccagcta tgatccatat aatattgaga taaagccaag gccaatatct aagtaactag 35040
ataagaggaa tcgattttcc cttaattttc tggcgtccac tgcatgttat gccgcgttcg 35100
ccaggcttgc tgtaccatgt gcgctgattc ttgcgctcaa tacgttgcag gttgctttca 35160
atctgtttgt ggtattcagc cagcactgta aggtctatcg gatttagtgc gctttctact 35220
cgtgatttcg gtttgcgatt cagcgagaga atagggcggt taactggttt tgcgcttacc 35280
ccaaccaaca ggggatttgc tgctttccat tgagcctgtt tctctgcgcg acgttcgcgg 35340
cggcgtgttt gtgcatccat ctggattctc ctgtcagtta gctttggtgg tgtgtggcag 35400
ttgtagtcct gaacgaaaac cccccgcgat tggcacattg gcagctaatc cggaatcgca 35460
cttacggcca atgcttcgtt tcgtatcaca caccccaaag ccttctgctt tgaatgctgc 35520
ccttcttcag ggcttaattt ttaagagcgt caccttcatg gtggtcagtg cgtcctgctg 35580
atgtgctcag tatcaccgcc agtggtattt atgtcaacac cgccagagat aatttatcac 35640
cgcagatggt tatctgtatg ttttttatat gaatttattt tttgcagggg ggcattgttt 35700
ggtaggtgag agatctgaat tgctatgttt agtgagttgt atctatttat ttttcaataa 35760
atacaattgg ttatgtgttt tgggggcgat cgtgaggcaa agaaaacccg gcgctgaggc 35820
cgggttattc ttgttctctg gtcaaattat atagttggaa aacaaggatg catatatgaa 35880
tgaacgatgc agaggcaatg ccgatggcga tagtgggtat catgtagccg cttatgctgg 35940
aaagaagcaa taacccgcag aaaaacaaag ctccaagctc aacaaaacta agggcataga 36000
caataactac cgatgtcata tacccatact ctctaatctt ggccagtcgg cgcgttctgc 36060
ttccgattag aaacgtcaag gcagcaatca ggattgcaat catggttcct gcatatgatg 36120
acaatgtcgc cccaagacca tctctatgag ctgaaaaaga aacaccagga atgtagtggc 36180
ggaaaaggag atagcaaatg cttacgataa cgtaaggaat tattactatg taaacaccag 36240
gcatgattct gttccgcata attactcctg ataattaatc cttaactttg cccacctgcc 36300
ttttaaaaca ttccagtata tcacttttca ttcttgcgta gcaatatgcc atctcttcag 36360
ctatctcagc attggtgacc ttgttcagag gcgctgagag atggcctttt tctgatagat 36420
aatgttctgt taaaatatct ccggcctcat cttttgcccg caggctaatg tctgaaaatt 36480
gaggtgacgg gttaaaaata atatccttgg caaccttttt tatatccctt ttaaattttg 36540
gcttaatgac tatatccaat gagtcaaaaa gctccccttc aatatctgtt gcccctaaga 36600
cctttaatat atcgccaaat acaggtagct tggcttctac cttcaccgtt gttcggccga 36660
tgaaatgcat atgcataaca tcgtctttgg tggttcccct catcagtggc tctatctgaa 36720
cgcgctctcc actgcttaat gacattcctt tcccgattaa aaaatctgtc agatcggatg 36780
tggtcggccc gaaaacagtt ctggcaaaac caatggtgtc gccttcaaca aacaaaaaag 36840
atgggaatcc caatgattcg tcatctgcga ggctgttctt aatatcttca actgaagctt 36900
tagagcgatt tatcttctga accagactct tgtcatttgt tttggtaaag agaaaagttt 36960
ttccatcgat tttatgaata tacaaataat tggagccaac ctgcaggtga tgattatcag 37020
ccagcagaga attaaggaaa acagacaggt ttattgagcg cttatctttc cctttatttt 37080
tgctgcggta agtcgcataa aaaccattct tcataattca atccatttac tatgttatgt 37140
tctgagggga gtgaaaattc ccctaattcg atgaagattc ttgctcaatt gttatcagct 37200
atgcgccgac cagaacacct tgccgatcag ccaaacgtct cttcaggcca ctgactagcg 37260
ataactttcc ccacaacgga acaactctca ttgcatggga tcattgggta ctgtgggttt 37320
agtggttgta aaaacacctg accgctatcc ctgatcagtt tcttgaaggt aaactcatca 37380
cccccaagtc tggctatgca gaaatcacct ggctcaacag cctgctcagg gtcaacgaga 37440
attaacattc cgtcaggaaa gcttggcttg gagcctgttg gtgcggtcat ggaattacct 37500
tcaacctcaa gccagaatgc agaatcactg gcttttttgg ttgtgcttac ccatctctcc 37560
gcatcacctt tggtaaaggt tctaagctta ggtgagaaca tccctgcctg aacatgagaa 37620
aaaacagggt actcatactc acttctaagt gacggctgca tactaaccgc ttcatacatc 37680
tcgtagattt ctctggcgat tgaagggcta aattcttcaa cgctaacttt gagaattttt 37740
gtaagcaatg cggcgttata agcatttaat gcattgatgc cattaaataa agcaccaacg 37800
cctgactgcc ccatccccat cttgtctgcg acagattcct gggataagcc aagttcattt 37860
ttcttttttt cataaattgc tttaaggcga cgtgcgtcct caagctgctc ttgtgttaat 37920
ggtttctttt ttgtgctcat acgttaaatc tatcaccgca agggataaat atctaacacc 37980
gtgcgtgttg actattttac ctctggcggt gataatggtt gcatgtacta aggaggttgt 38040
atggaacaac gcataaccct gaaagattat gcaatgcgct ttgggcaaac caagacagct 38100
aaagatctcg gcgtatatca aagcgcgatc aacaaggcca ttcatgcagg ccgaaagatt 38160
tttttaacta taaacgctga tggaagcgtt tatgcggaag aggtaaagcc cttcccgagt 38220
aacaaaaaaa caacagcata aataaccccg ctcttacaca ttccagccct gaaaaagggc 38280
atcaaattaa accacaccta tggtgtatgc atttatttgc atacattcaa tcaattgtta 38340
tctaaggaaa tacttacata tggttcgtgc aaacaaacgc aacgaggctc tacgaatcga 38400
gagtgcgttg cttaacaaaa tcgcaatgct tggaactgag aagacagcgg aagctgtggg 38460
cgttgataag tcgcagatca gcaggtggaa gagggactgg attccaaagt tctcaatgct 38520
gcttgctgtt cttgaatggg gggtcgttga cgacgacatg gctcgattgg cgcgacaagt 38580
tgctgcgatt ctcaccaata aaaaacgccc ggcggcaacc gagcgttctg aacaaatcca 38640
gatggagttc tgaggtcatt actggatcta tcaacaggag tcattatgac aaatacagca 38700
aaaatactca acttcggcag aggtaacttt gccggacagg agcgtaatgt ggcagatctc 38760
gatgatggtt acgccagact atcaaatatg ctgcttgagg cttattcggg cgcagatctg 38820
accaagcgac agtttaaagt gctgcttgcc attctgcgta aaacctatgg gtggaataaa 38880
ccaatggaca gaatcaccga ttctcaactt agcgagatta caaagttacc tgtcaaacgg 38940
tgcaatgaag ccaagttaga actcgtcaga atgaatatta tcaagcagca aggcggcatg 39000
tttggaccaa ataaaaacat ctcagaatgg tgcatccctc aaaacgaggg aaaatcccct 39060
aaaacgaggg ataaaacatc cctcaaattg ggggattgct atccctcaaa acagggggac 39120
acaaaagaca ctattacaaa agaaaaaaga aaagattatt cgtcagagaa ttctggcgaa 39180
tcctctgacc agccagaaaa cgacctttct gtggtgaaac cggatgctgc aattcagagc 39240
ggcagcaagt gggggacagc agaagacctg accgccgcag agtggatgtt tgacatggtg 39300
aagactatcg caccatcagc cagaaaaccg aattttgctg ggtgggctaa cgatatccgc 39360
ctgatgcgtg aacgtgacgg acgtaaccac cgcgacatgt gtgtgctgtt ccgctgggca 39420
tgccaggaca acttctggtc cggtaacgtg ctgagcccgg ccaaactccg cgataagtgg 39480
acccaactcg aaatcaaccg taacaagcaa caggcaggcg tgacagccag caaaccaaaa 39540
ctcgacctga caaacacaga ctggatttac ggggtggatc tatgaaaaac atcgccgcac 39600
agatggttaa ctttgaccgt gagcagatgc gtcggatcgc caacaacatg ccggaacagt 39660
acgacgaaaa gccgcaggta cagcaggtag cgcagatcat caacggtgtg ttcagccagt 39720
tactggcaac tttcccggcg agcctggcta accgtgacca gaacgaagtg aacgaaatcc 39780
gtcgccagtg ggttctggct tttcgggaaa acgggatcac cacgatggaa caggttaacg 39840
caggaatgcg cgtagcccgt cggcagaatc gaccatttct gccatcaccc gggcagtttg 39900
ttgcatggtg ccgggaagaa gcatccgtta ccgccggact gccaaacgtc agcgagctgg 39960
ttgatatggt ttacgagtat tgccggaagc gaggcctgta tccggatgcg gagtcttatc 40020
cgtggaaatc aaacgcgcac tactggctgg ttaccaacct gtatcagaac atgcgggcca 40080
atgcgcttac tgatgcggaa ttacgccgta aggccgcaga tgagcttgtc catatgactg 40140
cgagaattaa ccgtggtgag gcgatccctg aaccagtaaa acaacttcct gtcatgggcg 40200
gtagacctct aaatcgtgca caggctctgg cgaagatcgc agaaatcaaa gctaagttcg 40260
gactgaaagg agcaagtgta tgacgggcaa agaggcaatt attcattacc tggggacgca 40320
taatagcttc tgtgcgccgg acgttgccgc gctaacaggc gcaacagtaa ccagcataaa 40380
tcaggccgcg gctaaaatgg cacgggcagg tcttctggtt atcgaaggta aggtctggcg 40440
aacggtgtat taccggtttg ctaccaggga agaacgggaa ggaaagatga gcacgaacct 40500
ggtttttaag gagtgtcgcc agagtgccgc gatgaaacgg gtattggcgg tatatggagt 40560
taaaagatga ccatctacat tactgagcta ataacaggcc tgctggtaat cgcaggcctt 40620
tttatttggg ggagagggaa gtcatgaaaa aactaacctt tgaaattcga tctccagcac 40680
atcagcaaaa cgctattcac gcagtacagc aaatccttcc agacccaacc aaaccaatcg 40740
tagtaaccat tcaggaacgc aaccgcagct tagaccaaaa caggaagcta tgggcctgct 40800
taggtgacgt ctctcgtcag gttgaatggc atggtcgctg gctggatgca gaaagctgga 40860
agtgtgtgtt taccgcagca ttaaagcagc aggatgttgt tcctaacctt gccgggaatg 40920
gctttgtggt aataggccag tcaaccagca ggatgcgtgt aggcgaattt gcggagctat 40980
tagagcttat acaggcattc ggtacagagc gtggcgttaa gtggtcagac gaagcgagac 41040
tggctctgga gtggaaagcg agatggggag acagggctgc atgataaatg tcgttagttt 41100
ctccggtggc aggacgtcag catatttgct ctggctaatg gagcaaaagc gacgggcagg 41160
taaagacgtg cattacgttt tcatggatac aggttgtgaa catccaatga catatcggtt 41220
tgtcagggaa gttgtgaagt tctgggatat accgctcacc gtattgcagg ttgatatcaa 41280
cccggagctt ggacagccaa atggttatac ggtatgggaa ccaaaggata ttcagacgcg 41340
aatgcctgtt ctgaagccat ttatcgatat ggtaaagaaa tatggcactc catacgtcgg 41400
cggcgcgttc tgcactgaca gattaaaact cgttcccttc accaaatact gtgatgacca 41460
tttcgggcga gggaattaca ccacgtggat tggcatcaga gctgatgaac cgaagcggct 41520
aaagccaaag cctggaatca gatatcttgc tgaactgtca gactttgaga aggaagatat 41580
cctcgcatgg tggaagcaac aaccattcga tttgcaaata ccggaacatc tcggtaactg 41640
catattctgc attaaaaaat caacgcaaaa aatcggactt gcctgcaaag atgaggaggg 41700
attgcagcgt gtttttaatg aggtcatcac gggatcccat gtgcgtgacg gacatcggga 41760
aacgccaaag gagattatgt accgaggaag aatgtcgctg gacggtatcg cgaaaatgta 41820
ttcagaaaat gattatcaag ccctgtatca ggacatggta cgagctaaaa gattcgatac 41880
cggctcttgt tctgagtcat gcgaaatatt tggagggcag cttgatttcg acttcgggag 41940
ggaagctgca tgatgcgatg ttatcggtgc ggtgaatgca aagaagataa ccgcttccga 42000
ccaaatcaac cttactggaa tcgatggtgt ctccggtgtg aaagaacacc aacaggggtg 42060
ttaccactac cgcaggaaaa ggaggacgtg tggcgagaca gcgacgaagt atcaccgaca 42120
taatctgcga aaactgcaaa taccttccaa cgaaacgcac cagaaataaa cccaagccaa 42180
tcccaaaaga atctgacgta aaaaccttca actacacggc tcacctgtgg gatatccggt 42240
ggctaagacg tcgtgcgagg aaaacaaggt gattgaccaa aatcgaagtt acgaacaaga 42300
aagcgtcgag cgagctttaa cgtgcgctaa ctgcggtcag aagctgcatg tgctggaagt 42360
tcacgtgtgt gagcactgct gcgcagaact gatgagcgat ccgaatagct cgatgcacga 42420
ggaagaagat gatggctaaa ccagcgcgaa gacgatgtaa aaacgatgaa tgccgggaat 42480
ggtttcaccc tgcattcgct aatcagtggt ggtgctctcc agagtgtgga accaagatag 42540
cactcgaacg acgaagtaaa gaacgcgaaa aagcggaaaa agcagcagag aagaaacgac 42600
gacgagagga gcagaaacag aaagataaac ttaagattcg aaaactcgcc ttaaagcccc 42660
gcagttactg gattaaacaa gcccaacaag ccgtaaacgc cttcatcaga gaaagagacc 42720
gcgacttacc atgtatctcg tgcggaacgc tcacgtctgc tcagtgggat gccggacatt 42780
accggacaac tgctgcggca cctcaactcc gatttaatga acgcaatatt cacaagcaat 42840
gcgtggtgtg caaccagcac aaaagcggaa atctcgttcc gtatcgcgtc gaactgatta 42900
gccgcatcgg gcaggaagca gtagacgaaa tcgaatcaaa ccataaccgc catcgctgga 42960
ctatcgaaga gtgcaaggcg atcaaggcag agtaccaaca gaaactcaaa gacctgcgaa 43020
atagcagaag tgaggccgca tgacgttctc agtaaaaacc attccagaca tgctcgttga 43080
aacatacgga aatcagacag aagtagcacg cagactgaaa tgtagtcgcg gtacggtcag 43140
aaaatacgtt gatgataaag acgggaaaat gcacgccatc gtcaacgacg ttctcatggt 43200
tcatcgcgga tggagtgaaa gagatgcgct attacgaaaa aattgatggc agcaaatacc 43260
gaaatatttg ggtagttggc gatctgcacg gatgctacac gaacctgatg aacaaactgg 43320
atacgattgg attcgacaac aaaaaagacc tgcttatctc ggtgggcgat ttggttgatc 43380
gtggtgcaga gaacgttgaa tgcctggaat taatcacatt cccctggttc agagctgtac 43440
gtggaaacca tgagcaaatg atgattgatg gcttatcaga gcgtggaaac gttaatcact 43500
ggctgcttaa tggcggtggc tggttcttta atctcgatta cgacaaagaa attctggcta 43560
aagctcttgc ccataaagca gatgaacttc cgttaatcat cgaactggtg agcaaagata 43620
aaaaatatgt tatctgccac gccgattatc cctttgacga atacgagttt ggaaagccag 43680
ttgatcatca gcaggtaatc tggaaccgcg aacgaatcag caactcacaa aacgggatcg 43740
tgaaagaaat caaaggcgcg gacacgttca tctttggtca tacgccagca gtgaaaccac 43800
tcaagtttgc caaccaaatg tatatcgata ccggcgcagt gttctgcgga aacctaacat 43860
tgattcaggt acagggagaa ggcgcatgag actcgaaagc gtagctaaat ttcattcgcc 43920
aaaaagcccg atgatgagcg actcaccacg ggccacggct tctgactctc tttccggtac 43980
tgatgtgatg gctgctatgg ggatggcgca atcacaagcc ggattcggta tggctgcatt 44040
ctgcggtaag cacgaactca gccagaacga caaacaaaag gctatcaact atctgatgca 44100
atttgcacac aaggtatcgg ggaaataccg tggtgtggca aagcttgaag gaaatactaa 44160
ggcaaaggta ctgcaagtgc tcgcaacatt cgcttatgcg gattattgcc gtagtgccgc 44220
gacgccgggg gcaagatgca gagattgcca tggtacaggc cgtgcggttg atattgccaa 44280
aacagagctg tgggggagag ttgtcgagaa agagtgcgga agatgcaaag gcgtcggcta 44340
ttcaaggatg ccagcaagcg cagcatatcg cgctgtgacg atgctaatcc caaaccttac 44400
ccaacccacc tggtcacgca ctgttaagcc gctgtatgac gctctggtgg tgcaatgcca 44460
caaagaagag tcaatcgcag acaacatttt gaatgcggtc acacgttagc agcatgattg 44520
ccacggatgg caacatatta acggcatgat attgacttat tgaataaaat tgggtaaatt 44580
tgactcaacg atgggttaat tcgctcgttg tggtagtgag atgaaaagag gcggcgctta 44640
ctaccgattc cgcctagttg gtcacttcga cgtatcgtct ggaactccaa ccatcgcagg 44700
cagagaggtc tgcaaaatgc aatcccgaaa cagttcgcag gtaatagtta gagcctgcat 44760
aacggtttcg ggatttttta tatctgcaca acaggtaaga gcattgagtc gataatcgtg 44820
aagagtcggc gagcctggtt agccagtgct ctttccgttg tgctgaatta agcgaatacc 44880
ggaagcagaa ccggatcacc aaatgcgtac aggcgtcatc gccgcccagc aacagcacaa 44940
cccaaactga gccgtagcca ctgtctgtcc tgaattcatt agtaatagtt acgctgcggc 45000
cttttacaca tgaccttcgt gaaagcgggt ggcaggaggt cgcgctaaca acctcctgcc 45060
gttttgcccg tgcatatcgg tcacgaacaa atctgattac taaacacagt agcctggatt 45120
tgttctatca gtaatcgacc ttattcctaa ttaaatagag caaatcccct tattgggggt 45180
aagacatgaa gatgccagaa aaacatgacc tgttggccgc cattctcgcg gcaaaggaac 45240
aaggcatcgg ggcaatcctt gcgtttgcaa tggcgtacct tcgcggcaga tataatggcg 45300
gtgcgtttac aaaaacagta atcgacgcaa cgatgtgcgc cattatcgcc tagttcattc 45360
gtgaccttct cgacttcgcc ggactaagta gcaatctcgc ttatataacg agcgtgttta 45420
tcggctacat cggtactgac tcgattggtt cgcttatcaa acgcttcgct gctaaaaaag 45480
ccggagtaga agatggtaga aatcaataat caacgtaagg cgttcctcga tatgctggcg 45540
tggtcggagg gaactgataa cggacgtcag aaaaccagaa atcatggtta tgacgtcatt 45600
gtaggcggag agctatttac tgattactcc gatcaccctc gcaaacttgt cacgctaaac 45660
ccaaaactca aatcaacagg cgccggacgc taccagcttc tttcccgttg gtgggatgcc 45720
taccgcaagc agcttggcct gaaagacttc tctccgaaaa gtcaggacgc tgtggcattg 45780
cagcagatta aggagcgtgg cgctttacct atgattgatc gtggtgatat ccgtcaggca 45840
atcgaccgtt gcagcaatat ctgggcttca ctgccgggcg ctggttatgg tcagttcgag 45900
cataaggctg acagcctgat tgcaaaattc aaagaagcgg gcggaacggt cagagagatt 45960
gatgtatgag cagagtcacc gcgattatct ccgctctggt tatctgcatc atcgtctgcc 46020
tgtcatgggc tgttaatcat taccgtgata acgccattac ctacaaagcc cagcgcgaca 46080
aaaatgccag agaactgaag ctggcgaacg cggcaattac tgacatgcag atgcgtcagc 46140
gtgatgttgc tgcgctcgat gcaaaataca cgaaggagtt agctgatgct aaagctgaaa 46200
atgatgctct gcgtgatgat gttgccgctg gtcgtcgtcg gttgcacatc aaagcagtct 46260
gtcagtcagt gcgtgaagcc accaccgcct ccggcgtgga taatgcagcc tccccccgac 46320
tggcagacac cgctgaacgg gattatttca ccctcagaga gaggctgatc actatgcaaa 46380
aacaactgga aggaacccag aagtatatta atgagcagtg cagatagagt tgcccatatc 46440
gatgggcaac tcatgcaatt attgtgagca atacacacgc gcttccagcg gagtataaat 46500
gcctaaagta ataaaaccga gcaatccatt tacgaatgtt tgctgggttt ctgttttaac 46560
aacattttct gcgccgccac aaattttggc tgcatcgaca gttttcttct gcccaattcc 46620
agaaacgaag aaatgatggg tgatggtttc ctttggtgct actgctgccg gtttgttttg 46680
aacagtaaac gtctgttgag cacatcctgt aataagcagg gccagcgcag tagcgagtag 46740
catttttttc atggtgttat tcccgatgct ttttgaagtt cgcagaatcg tatgtgtaga 46800
aaattaaaca aaccctaaac aatgagttga aatttcatat tgttaatatt tattaatgta 46860
tgtcaggtgc gatgaatcgt cattgtattc ccggattaac tatgtccaca gccctgacgg 46920
ggaacttctc tgcgggagtg tccgggaata attaaaacga tgcacacagg gtttagcgcg 46980
tacacgtatt gcattatgcc aacgccccgg tgctgacacg gaagaaaccg gacgttatga 47040
tttagcgtgg aaagatttgt gtagtgttct gaatgctctc agtaaatagt aatgaattat 47100
caaaggtata gtaatatctt ttatgttcat ggatatttgt aacccatcgg aaaactcctg 47160
ctttagcaag attttccctg tattgctgaa atgtgatttc tcttgatttc aacctatcat 47220
aggacgtttc tataagatgc gtgtttcttg agaatttaac atttacaacc tttttaagtc 47280
cttttattaa cacggtgtta tcgttttcta acacgatgtg aatattatct gtggctagat 47340
agtaaatata atgtgagacg ttgtgacgtt ttagttcaga ataaaacaat tcacagtcta 47400
aatcttttcg cacttgatcg aatatttctt taaaaatggc aacctgagcc attggtaaaa 47460
ccttccatgt gatacgaggg cgcgtagttt gcattatcgt ttttatcgtt tcaatctggt 47520
ctgacctcct tgtgttttgt tgatgattta tgtcaaatat taggaatgtt ttcacttaat 47580
agtattggtt gcgtaacaaa gtgcggtcct gctggcattc tggagggaaa tacaaccgac 47640
agatgtatgt aaggccaacg tgctcaaatc ttcatacaga aagatttgaa gtaatatttt 47700
aaccgctaga tgaagagcaa gcgcatggag cgacaaaatg aataaagaac aatctgctga 47760
tgatccctcc gtggatctga ttcgtgtaaa aaatatgctt aatagcacca tttctatgag 47820
ttaccctgat gttgtaattg catgtataga acataaggtg tctctggaag cattcagagc 47880
aattgaggca gcgttggtga agcacgataa taatatgaag gattattccc tggtggttga 47940
ctgatcacca taactgctaa tcattcaaac tatttagtct gtgacagagc caacacgcag 48000
tctgtcactg tcaggaaagt ggtaaaactg caactcaatt actgcaatgc cctcgtaatt 48060
aagtgaattt acaatatcgt cctgttcgga gggaagaacg cgggatgttc attcttcatc 48120
acttttaatt gatgtatatg ctctcttttc tgacgttagt ctccgacggc aggcttcaat 48180
gacccaggct gagaaattcc cggacccttt ttgctcaaga gcgatgttaa tttgttcaat 48240
catttggtta ggaaagcgga tgttgcgggt tgttgttctg cgggttctgt tcttcgttga 48300
catgaggttg ccccgtattc agtgtcgctg atttgtattg tctgaagttg tttttacgtt 48360
aagttgatgc agatcaatta atacgatacc tgcgtcataa ttgattattt gacgtggttt 48420
gatggcctcc acgcacgttg tgatatgtag atgataatca ttatcacttt acgggtcctt 48480
tccggtgatc cgacaggtta cg 48502
<210> 14
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Examples 2 and 3
<400> 14
tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt ggttgtttct 60
gttggtgctg atattgc 77
<210> 15
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Examples 2 and 3
<400> 15
gttttcgcat ttatcgtgaa acgctttcgc gtttttcgtg cgccgcttca 50
<210> 16
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Examples 2 and 3
<400> 16
gcaatatcag caccaacaga aacaacctt 29
<210> 17
<211> 970
<212> PRT
<213> Citromicrobium bathyomarinum
<400> 17
Met Leu Ser Val Ala Asn Val Arg Ser Pro Ser Ala Ala Ala Ser Tyr
1 5 10 15
Phe Ala Ser Asp Asn Tyr Tyr Ala Ser Ala Asp Ala Asp Arg Ser Gly
20 25 30
Gln Trp Ile Gly Asp Gly Ala Lys Arg Leu Gly Leu Glu Gly Lys Val
35 40 45
Glu Ala Arg Ala Phe Asp Ala Leu Leu Arg Gly Glu Leu Pro Asp Gly
50 55 60
Ser Ser Val Gly Asn Pro Gly Gln Ala His Arg Pro Gly Thr Asp Leu
65 70 75 80
Thr Phe Ser Val Pro Lys Ser Trp Ser Leu Leu Ala Leu Val Gly Lys
85 90 95
Asp Glu Arg Ile Ile Ala Ala Tyr Arg Glu Ala Val Val Glu Ala Leu
100 105 110
His Trp Ala Glu Lys Asn Ala Ala Glu Thr Arg Val Val Glu Lys Gly
115 120 125
Met Val Val Thr Gln Ala Thr Gly Asn Leu Ala Ile Gly Leu Phe Gln
130 135 140
His Asp Thr Asn Arg Asn Gln Glu Pro Asn Leu His Phe His Ala Val
145 150 155 160
Ile Ala Asn Val Thr Gln Gly Lys Asp Gly Lys Trp Arg Thr Leu Lys
165 170 175
Asn Asp Arg Leu Trp Gln Leu Asn Thr Thr Leu Asn Ser Ile Ala Met
180 185 190
Ala Arg Phe Arg Val Ala Val Glu Lys Leu Gly Tyr Glu Pro Gly Pro
195 200 205
Val Leu Lys His Gly Asn Phe Glu Ala Arg Gly Ile Ser Arg Glu Gln
210 215 220
Val Met Ala Phe Ser Thr Arg Arg Lys Glu Val Leu Glu Ala Arg Arg
225 230 235 240
Gly Pro Gly Leu Asp Ala Gly Arg Ile Ala Ala Leu Asp Thr Arg Ala
245 250 255
Ser Lys Glu Gly Ile Glu Asp Arg Ala Thr Leu Ser Lys Gln Trp Ser
260 265 270
Glu Ala Ala Gln Ser Ile Gly Leu Asp Leu Lys Pro Leu Val Asp Arg
275 280 285
Ala Arg Thr Lys Ala Leu Gly Gln Gly Met Glu Ala Thr Arg Ile Gly
290 295 300
Ser Leu Val Glu Arg Gly Arg Ala Trp Leu Ser Arg Phe Ala Ala His
305 310 315 320
Val Arg Gly Asp Pro Ala Asp Pro Leu Val Pro Pro Ser Val Leu Lys
325 330 335
Gln Asp Arg Gln Thr Ile Ala Ala Ala Gln Ala Val Ala Ser Ala Val
340 345 350
Arg His Leu Ser Gln Arg Glu Ala Ala Phe Glu Arg Thr Ala Leu Tyr
355 360 365
Lys Ala Ala Leu Asp Phe Gly Leu Pro Thr Thr Ile Ala Asp Val Glu
370 375 380
Lys Arg Thr Arg Ala Leu Val Arg Ser Gly Asp Leu Ile Ala Gly Lys
385 390 395 400
Gly Glu His Lys Gly Trp Leu Ala Ser Arg Asp Ala Val Val Thr Glu
405 410 415
Gln Arg Ile Leu Ser Glu Val Ala Ala Gly Lys Gly Asp Ser Ser Pro
420 425 430
Ala Ile Thr Pro Gln Lys Ala Ala Ala Ser Val Gln Ala Ala Ala Leu
435 440 445
Thr Gly Gln Gly Phe Arg Leu Asn Glu Gly Gln Leu Ala Ala Ala Arg
450 455 460
Leu Ile Leu Ile Ser Lys Asp Arg Thr Ile Ala Val Gln Gly Ile Ala
465 470 475 480
Gly Ala Gly Lys Ser Ser Val Leu Lys Pro Val Ala Glu Val Leu Arg
485 490 495
Asp Glu Gly His Pro Val Ile Gly Leu Ala Ile Gln Asn Thr Leu Val
500 505 510
Gln Met Leu Glu Arg Asp Thr Gly Ile Gly Ser Gln Thr Leu Ala Arg
515 520 525
Phe Leu Gly Gly Trp Asn Lys Leu Leu Asp Asp Pro Gly Asn Val Ala
530 535 540
Leu Arg Ala Glu Ala Gln Ala Ser Leu Lys Asp His Val Leu Val Leu
545 550 555 560
Asp Glu Ala Ser Met Val Ser Asn Glu Asp Lys Glu Lys Leu Val Arg
565 570 575
Leu Ala Asn Leu Ala Gly Val His Arg Leu Val Leu Ile Gly Asp Arg
580 585 590
Lys Gln Leu Gly Ala Val Asp Ala Gly Lys Pro Phe Ala Leu Leu Gln
595 600 605
Arg Ala Gly Ile Ala Arg Ala Glu Met Ala Thr Asn Leu Arg Ala Arg
610 615 620
Asp Pro Val Val Arg Glu Ala Gln Ala Ala Ala Gln Ala Gly Asp Val
625 630 635 640
Arg Lys Ala Leu Arg His Leu Lys Ser His Thr Val Glu Ala Arg Gly
645 650 655
Asp Gly Ala Gln Val Ala Ala Glu Thr Trp Leu Ala Leu Asp Lys Glu
660 665 670
Thr Arg Ala Arg Thr Ser Ile Tyr Ala Ser Gly Arg Ala Ile Arg Ser
675 680 685
Ala Val Asn Ala Ala Val Gln Gln Gly Leu Leu Ala Ser Arg Glu Ile
690 695 700
Gly Pro Ala Lys Met Lys Leu Glu Val Leu Asp Arg Val Asn Thr Thr
705 710 715 720
Arg Glu Glu Leu Arg His Leu Pro Ala Tyr Arg Ala Gly Arg Val Leu
725 730 735
Glu Val Ser Arg Lys Gln Gln Ala Leu Gly Leu Phe Ile Gly Glu Tyr
740 745 750
Arg Val Ile Gly Gln Asp Arg Lys Gly Lys Leu Val Glu Val Glu Asp
755 760 765
Lys Arg Gly Lys Arg Phe Arg Phe Asp Pro Ala Arg Ile Arg Ala Gly
770 775 780
Lys Gly Asp Asp Asn Leu Thr Leu Leu Glu Pro Arg Lys Leu Glu Ile
785 790 795 800
His Glu Gly Asp Arg Ile Arg Trp Thr Arg Asn Asp His Arg Arg Gly
805 810 815
Leu Phe Asn Ala Asp Gln Ala Arg Val Val Glu Ile Ala Asn Gly Lys
820 825 830
Val Thr Phe Glu Thr Ser Lys Gly Asp Leu Val Glu Leu Lys Lys Asp
835 840 845
Asp Pro Met Leu Lys Arg Ile Asp Leu Ala Tyr Ala Leu Asn Val His
850 855 860
Met Ala Gln Gly Leu Thr Ser Asp Arg Gly Ile Ala Val Met Asp Ser
865 870 875 880
Arg Glu Arg Asn Leu Ser Asn Gln Lys Thr Phe Leu Val Thr Val Thr
885 890 895
Arg Leu Arg Asp His Leu Thr Leu Val Val Asp Ser Ala Asp Lys Leu
900 905 910
Gly Ala Ala Val Ala Arg Asn Lys Gly Glu Lys Ala Ser Ala Ile Glu
915 920 925
Val Thr Gly Ser Val Lys Pro Thr Ala Thr Lys Gly Ser Gly Val Asp
930 935 940
Gln Pro Lys Ser Val Glu Ala Asn Lys Ala Glu Lys Glu Leu Thr Arg
945 950 955 960
Ser Lys Ser Lys Thr Leu Asp Phe Gly Ile
965 970
<210> 18
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 3
<220>
<221> modified_base
<222> (1)..(5)
<223> n is I
<400> 18
nnnnntgaag cggcgcacga aaaacgcgaa agcgtttcac gataaatgcg aaaac 55
<210> 19
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 2
<400> 19
gatcugaagc ggcgcacgaa aaacgcgaaa gcgtttcacg ataaatgcga aaac 54
<210> 20
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 2
<400> 20
gaagcggcgc acgaaaaacg cgaaagcgtt tcacgataaa tgcgaaaac 49
<210> 21
<400> 21
000
<210> 22
<400> 22
000
<210> 23
<211> 73
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 4
<400> 23
tttttttttt tttttttttt tttttttttt tttttttttt ttttttggtt gtttctgttg 60
gtgctgatat tgc 73
<210> 24
<211> 606
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucelotide sequence used in Example 9
<400> 24
gccatcagat tgtgtttgtt agtcgctttt tttttttgga attttttttt tggaattttt 60
tttttgacgc tcagtaatgt gacgatagct gaaaactgta cgataaacgg tacgctgagg 120
gcggaaaaaa tcgtcgggga cattgtaaag gcggcgagcg cggcttttcc gcgccagcgt 180
gaaagcagtg tggactggcc gtcaggtacc cgtactgtca ccgtgaccga tgaccatcct 240
tttgatcgcc agatagtggt gcttccgctg acgtttcgcg gaagtaagcg tactgtcagc 300
ggcaggacaa cgtattcgat gtgttatctg aaagtactga tgaacggtgc ggtgatttat 360
gatggcgcgg cgaacgaggc ggtacaggtg ttctcccgta ttgttgacat gccagcgggt 420
cggggaaacg tgatcctgac gttcacgctt acgtccacac ggcattcggc agatattccg 480
ccgtatacgt ttgccagcga tgtgcaggtt atggtgatta agaaacaggc gctgggcatc 540
agcgtggtct gagtgtgaaa aaaaaggtac caaaaaaaac atcgtcgtga gtagtgaacc 600
gtaagc 606
<210> 25
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 5
<400> 25
ctattctgtt tatgtttctt gtttgttagc cctattctgt cccccccccc accccccccc 60
<210> 26
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Examples 5 and 6
<400> 26
acagaatagg gctaacaaac aagaaacata aacagaatag 40
<210> 27
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Examples 5 and 6
<400> 27
ctattctgtt tatgtttctt gtttgttagc cctattctgt 40
<210> 28
<211> 760
<212> PRT
<213> Methanococcoides burtonii
<400> 28
Met Met Ile Arg Glu Leu Asp Ile Pro Arg Asp Ile Ile Gly Phe Tyr
1 5 10 15
Glu Asp Ser Gly Ile Lys Glu Leu Tyr Pro Pro Gln Ala Glu Ala Ile
20 25 30
Glu Met Gly Leu Leu Glu Lys Lys Asn Leu Leu Ala Ala Ile Pro Thr
35 40 45
Ala Ser Gly Lys Thr Leu Leu Ala Glu Leu Ala Met Ile Lys Ala Ile
50 55 60
Arg Glu Gly Gly Lys Ala Leu Tyr Ile Val Pro Leu Arg Ala Leu Ala
65 70 75 80
Ser Glu Lys Phe Glu Arg Phe Lys Glu Leu Ala Pro Phe Gly Ile Lys
85 90 95
Val Gly Ile Ser Thr Gly Asp Leu Asp Ser Arg Ala Asp Trp Leu Gly
100 105 110
Val Asn Asp Ile Ile Val Ala Thr Ser Glu Lys Thr Asp Ser Leu Leu
115 120 125
Arg Asn Gly Thr Ser Trp Met Asp Glu Ile Thr Thr Val Val Val Asp
130 135 140
Glu Ile His Leu Leu Asp Ser Lys Asn Arg Gly Pro Thr Leu Glu Val
145 150 155 160
Thr Ile Thr Lys Leu Met Arg Leu Asn Pro Asp Val Gln Val Val Ala
165 170 175
Leu Ser Ala Thr Val Gly Asn Ala Arg Glu Met Ala Asp Trp Leu Gly
180 185 190
Ala Ala Leu Val Leu Ser Glu Trp Arg Pro Thr Asp Leu His Glu Gly
195 200 205
Val Leu Phe Gly Asp Ala Ile Asn Phe Pro Gly Ser Gln Lys Lys Ile
210 215 220
Asp Arg Leu Glu Lys Asp Asp Ala Val Asn Leu Val Leu Asp Thr Ile
225 230 235 240
Lys Ala Glu Gly Gln Cys Leu Val Phe Glu Ser Ser Arg Arg Asn Cys
245 250 255
Ala Gly Phe Ala Lys Thr Ala Ser Ser Lys Val Ala Lys Ile Leu Asp
260 265 270
Asn Asp Ile Met Ile Lys Leu Ala Gly Ile Ala Glu Glu Val Glu Ser
275 280 285
Thr Gly Glu Thr Asp Thr Ala Ile Val Leu Ala Asn Cys Ile Arg Lys
290 295 300
Gly Val Ala Phe His His Ala Gly Leu Asn Ser Asn His Arg Lys Leu
305 310 315 320
Val Glu Asn Gly Phe Arg Gln Asn Leu Ile Lys Val Ile Ser Ser Thr
325 330 335
Pro Thr Leu Ala Ala Gly Leu Asn Leu Pro Ala Arg Arg Val Ile Ile
340 345 350
Arg Ser Tyr Arg Arg Phe Asp Ser Asn Phe Gly Met Gln Pro Ile Pro
355 360 365
Val Leu Glu Tyr Lys Gln Met Ala Gly Arg Ala Gly Arg Pro His Leu
370 375 380
Asp Pro Tyr Gly Glu Ser Val Leu Leu Ala Lys Thr Tyr Asp Glu Phe
385 390 395 400
Ala Gln Leu Met Glu Asn Tyr Val Glu Ala Asp Ala Glu Asp Ile Trp
405 410 415
Ser Lys Leu Gly Thr Glu Asn Ala Leu Arg Thr His Val Leu Ser Thr
420 425 430
Ile Val Asn Gly Phe Ala Ser Thr Arg Gln Glu Leu Phe Asp Phe Phe
435 440 445
Gly Ala Thr Phe Phe Ala Tyr Gln Gln Asp Lys Trp Met Leu Glu Glu
450 455 460
Val Ile Asn Asp Cys Leu Glu Phe Leu Ile Asp Lys Ala Met Val Ser
465 470 475 480
Glu Thr Glu Asp Ile Glu Asp Ala Ser Lys Leu Phe Leu Arg Gly Thr
485 490 495
Arg Leu Gly Ser Leu Val Ser Met Leu Tyr Ile Asp Pro Leu Ser Gly
500 505 510
Ser Lys Ile Val Asp Gly Phe Lys Asp Ile Gly Lys Ser Thr Gly Gly
515 520 525
Asn Met Gly Ser Leu Glu Asp Asp Lys Gly Asp Asp Ile Thr Val Thr
530 535 540
Asp Met Thr Leu Leu His Leu Val Cys Ser Thr Pro Asp Met Arg Gln
545 550 555 560
Leu Tyr Leu Arg Asn Thr Asp Tyr Thr Ile Val Asn Glu Tyr Ile Val
565 570 575
Ala His Ser Asp Glu Phe His Glu Ile Pro Asp Lys Leu Lys Glu Thr
580 585 590
Asp Tyr Glu Trp Phe Met Gly Glu Val Lys Thr Ala Met Leu Leu Glu
595 600 605
Glu Trp Val Thr Glu Val Ser Ala Glu Asp Ile Thr Arg His Phe Asn
610 615 620
Val Gly Glu Gly Asp Ile His Ala Leu Ala Asp Thr Ser Glu Trp Leu
625 630 635 640
Met His Ala Ala Ala Lys Leu Ala Glu Leu Leu Gly Val Glu Tyr Ser
645 650 655
Ser His Ala Tyr Ser Leu Glu Lys Arg Ile Arg Tyr Gly Ser Gly Leu
660 665 670
Asp Leu Met Glu Leu Val Gly Ile Arg Gly Val Gly Arg Val Arg Ala
675 680 685
Arg Lys Leu Tyr Asn Ala Gly Phe Val Ser Val Ala Lys Leu Lys Gly
690 695 700
Ala Asp Ile Ser Val Leu Ser Lys Leu Val Gly Pro Lys Val Ala Tyr
705 710 715 720
Asn Ile Leu Ser Gly Ile Gly Val Arg Val Asn Asp Lys His Phe Asn
725 730 735
Ser Ala Pro Ile Ser Ser Asn Thr Leu Asp Thr Leu Leu Asp Lys Asn
740 745 750
Gln Lys Thr Phe Asn Asp Phe Gln
755 760
<210> 29
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 5
<400> 29
cccccccccc accccccccc 20
<210> 30
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 6
<400> 30
ccccccccca ccccccccc 19
<210> 31
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 6
<400> 31
ccccccaccc cccccc 16
<210> 32
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 6
<400> 32
ctattctgtt tatgtttctt gtttgttagc cctattctgt cccccccccc accccccccc 60
accccccccc accccccccc 80
<210> 33
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 6
<400> 33
ctattctgtt tatgtttctt gtttgttagc cctattctgt cccccccccc 50
<210> 34
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 7
<400> 34
tttttttttt tttttttttt tttttttttt tttttttttt tttttttttt tcgctgctcc 60
acaggtctca gcttgagcag cga 83
<210> 35
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Examples 7 and 8
<400> 35
tcgctgctca agctgagacc tgtggagcag cga 33
<210> 36
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Examples 7 and 8
<400> 36
tcgctgctcc acaggtctca gcttgagcag cga 33
<210> 37
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Examples 7, 8 and 9
<400> 37
tttttttttt 10
<210> 38
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Examples 8 and 10
<400> 38
tttttttttt tttttttttt 20
<210> 39
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 8
<400> 39
tttttttttt tttttt 16
<210> 40
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 8
<400> 40
tttttttttt tttttttt 18
<210> 41
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 9
<400> 41
gccatcagat tgtgtttgtt agtcgct 27
<210> 42
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 9
<400> 42
gcaatatcag caccaacaga aacaacc 27
<210> 43
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Polynucleotide sequence used in Example 9
<400> 43
agcgactaac aaacacaatc tgatggc 27
Claims (51)
- (a) 하나 이상의 정지된 헬리카제 및 폴리뉴클레오티드를 막횡단 포어와 접촉시키는 단계, 및 (b) 전위를 포어를 통해 인가하여 폴리뉴클레오티드 상에서 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 단계를 포함하는, 폴리뉴클레오티드에서 하나 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키는 방법.
- (a) 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계;
(b) 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 하나 이상의 스페이서에서 정지하도록 하는 단계;
(c) 표적 폴리뉴클레오티드 및 하나 이상의 정지된 헬리카제를 포어와 접촉시키는 단계; 및
(d) 포어를 통해 전위를 인가하여 하나 이상의 헬리카제가 하나 이상의 스페이서를 지나 이동하도록 하고, 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하도록 하는 단계를 포함하는, 막횡단 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 방법. - (a) 제2항의 방법을 수행하는 단계; 및
(b) 폴리뉴클레오티드가 포어와 관련하여 이동함에 따라 하나 이상의 측정치를 측정하여 표적 폴리뉴클레오티드의 특징을 규명하고, 여기서 측정치는 폴리뉴클레오티드의 하나 이상의 특징을 나타내는 것인 단계를 포함하는, 표적 폴리뉴클레오티드의 특징을 규명하는 방법. - 제2항 또는 제3항에 있어서, 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계가 하나 이상의 스페이서를 포함하도록 표적 폴리뉴클레오티드를 변형시키는 것을 포함하는 것인 방법.
- 제3항 또는 제4항에 있어서, 하나 이상의 특징이 (i) 표적 폴리뉴클레오티드의 길이, (ii) 표적 폴리뉴클레오티드의 동일성, (iii) 표적 폴리뉴클레오티드의 서열, (iv) 표적 폴리뉴클레오티드의 2차 구조, 및 (v) 표적 폴리뉴클레오티드의 변형 여부로부터 선택되는 것인 방법.
- 제5항에 있어서, 표적 폴리뉴클레오티드가 메틸화에 의해, 산화에 의해, 손상에 의해, 하나 이상의 단백질로, 또는 하나 이상의 표지, 태그 또는 스페이서로 변형되는 것인 방법.
- 제3항 내지 제6항 중 어느 한 항에 있어서, 표적 폴리뉴클레오티드의 하나 이상의 특징이 전기적 측정 및/또는 광학적 측정에 의해 측정되는 것인 방법.
- 제7항에 있어서, 전기적 측정이 전류 측정, 임피던스 측정, 터널링 측정 또는 전계 효과 트랜지스터 (FET) 측정인 것인 방법.
- 제1항 내지 제8항 중 어느 한 항에 있어서, 하나 이상의 헬리카제가 인가된 전위로부터 생성된 장을 이용하여 포어를 통과하는 표적 폴리뉴클레오티드의 이동을 제어하는 것인 방법.
- 제1항 내지 제9항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 폴리뉴클레오티드와 상이한 구조를 갖는 것인 방법.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 폴리뉴클레오티드가 데옥시리보핵산 (DNA) 또는 리보핵산 (RNA)이고, 하나 이상의 스페이서가 펩티드 핵산 (PNA), 글리세롤 핵산 (GNA), 트레오스 핵산 (TNA), 잠금 핵산 (LNA) 또는 뉴클레오티드 측쇄를 포함하는 합성 중합체를 포함하는 것인 방법.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 하나 이상의 니트로인돌, 하나 이상의 이노신, 하나 이상의 아크리딘, 하나 이상의 2- 아미노퓨린, 하나 이상의 2-6-디아미노퓨린, 하나 이상의 5-브로모-데옥시우리딘, 하나 이상의 역 티미딘 (역 dT), 하나 이상의 역 디데옥시-티미딘 (ddT), 하나 이상의 디데옥시-시티딘 (ddC), 하나 이상의 5-메틸시티딘, 하나 이상의 5-히드록시메틸시티딘, 하나 이상의 2'-O-메틸 RNA 염기, 하나 이상의 이소-데옥시시티딘 (이소-dC), 하나 이상의 이소-데옥시구아노신 (이소-dG), 하나 이상의 C3 기, 하나 이상의 광절단가능한 (PC) 기, 하나 이상의 헥산디올 기, 하나 이상의 스페이서 9 (iSp9) 기, 하나 이상의 스페이서 18 (iSp18) 기, 중합체 또는 하나 이상의 티올 연결부를 포함하는 것인 방법.
- 제12항에 있어서, 중합체가 폴리펩티드 또는 폴리에틸렌 글리콜 (PEG)인 방법.
- 제1항 내지 제11항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 하나 이상의 무염기 뉴클레오티드를 포함하는 것인 방법.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 하나 이상의 헬리카제를 정지시키는 하나 이상의 화학적 기를 포함하는 것인 방법.
- 제15항에 있어서, 하나 이상의 화학적 기가 하나 이상의 형광단, 스트렙트아비딘 및/또는 비오틴, 콜레스테롤, 메틸렌 블루, 디니트로페놀 (DNP), 디곡시게닌 및/또는 항-디곡시게닌 또는 디벤질시클로옥틴 기인 방법.
- 제1항 내지 제16항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 유리 뉴클레오티드의 존재, 및/또는 헬리카제 보조인자의 존재 하에 하나 이상의 헬리카제를 정지시킬 수 있는 것인 방법.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 약 100 mM 이하의 염 농도에서 하나 이상의 헬리카제를 정지시킬 수 있는 것인 방법.
- 제1항 내지 제18항 중 어느 한 항에 있어서, 2개 이상의 정지된 헬리카제가 각 스페이서를 지나도록 이동시키는 단계를 포함하는 방법.
- 제19항에 있어서, 2개 이상의 헬리카제가 서로 부착되어 있는 것인 방법.
- 제20항에 있어서, 2개 이상의 헬리카제가 서로 공유 부착되어 있는 것인 방법.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 하나 이상의 스페이서가 폴리뉴클레오티드에 포함되어 있고/거나, 폴리뉴클레오티드에 혼성화된 하나 이상의 차단 분자의 일부가 아닌 것인 방법.
- 제1항 내지 제22항 중 어느 한 항에 있어서, 폴리뉴클레오티드의 적어도 일부가 이중 가닥인 것인 방법.
- 제23항에 있어서, 하나 이상의 스페이서가 폴리뉴클레오티드의 단일 가닥 영역 또는 비혼성화된 영역에 포함되어 있는 것인 방법.
- 제24항에 있어서, 단일 가닥 영역이 포어로 우선적으로 트레딩하는 리더 서열을 포함하는 것인 방법.
- 제23항 내지 제25항 중 어느 한 항에 있어서, 이중 가닥부의 두 가닥이 가교 모이어티를 사용하여 연결되는 것인 방법.
- 제26항에 있어서, 하나 이상의 스페이서가 가교 모이어티에 포함되는 것인 방법.
- 제1항 내지 제27항 중 어느 한 항에 있어서, 하나 이상의 헬리카제가 (a) 하나 이상의 Hel308 헬리카제, 하나 이상의 RecD 헬리카제, 하나 이상의 XPD 헬리카제 또는 하나 이상의 Dda 헬리카제, (b) (a)의 헬리카제 중 임의의 것으로부터 유래된 하나 이상의 헬리카제; 또는 (c) (a) 및/또는 (b)의 헬리카제 중 임의의 것의 조합인 것인 방법.
- 제1항 내지 제28항 중 어느 한 항에 있어서, 포어가 막횡단 단백질 포어 또는 고체 상태 포어인 것인 방법.
- 제29항에 있어서, 막횡단 단백질 포어가 α 헤몰리신, 류코시딘, 미코박테리움 스메그마티스(Mycobacterium smegmatis) 포린 A (MspA), MspB, MspC, MspD, 리세닌, 외막 포린 F (OmpF), 외막 포린 G (OmpG), 외막 포스포리파제 A, 나이세리아(Neisseria) 자가수송체 지단백질 (NalP) 및 WZA로부터 유래되는 것인 방법.
- 제30항에 있어서, 막횡단 단백질 포어가
(a) 서열 2에 제시된 바와 같은 8개의 동일한 서브유닛로 형성된 것, 또는 (b) 8개의 서브유닛 중 하나 이상이 전체 서열에 걸쳐 아미노산 동일성에 기초하여 서열 2와 50% 이상의 상동성을 갖고 포어 활성을 유지하는 그의 변이체이거나; 또는
(c) 서열 4에 제시된 바와 같은 7개의 동일한 서브유닛으로 형성된 α 헤몰리신, 또는 (d) 7개의 서브유닛 중 하나 이상이 전체 서열에 걸쳐 아미노산 동일성에 기초하여 서열 4와 50% 이상의 상동성을 갖고 포어 활성을 유지하는 그의 변이체인 방법. - 폴리뉴클레오티드 상에서 하나 이상의 정지된 헬리카제가 하나 이상의 스페이서를 지나도록 이동시키기 위한 막횡단 포어 및 인가된 전위의 용도.
- 폴리뉴클레오티드를 막횡단 포어와 접촉시키기 이전에 폴리뉴클레오티드 상에서 하나 이상의 헬리카제를 정지시키기 위한 하나 이상의 스페이서의 용도.
- (a) 표적 폴리뉴클레오티드에 하나 이상의 스페이서를 제공하는 단계; 및
(b) (a)에서 제공받은 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 표적 폴리뉴클레오티드에 결합하고, 각 스페이서에서 정지하도록 하는 단계를 포함하는, 하나 이상의 헬리카제의 표적 폴리뉴클레오티드 상에의 로딩을 제어하는 방법. - 제34항에 있어서, 단계 (a)가 하나 이상의 스페이서를 포함하도록 표적 폴리뉴클레오티드를 변형시키는 것을 포함하는 것인 방법.
- 제34항 또는 제35항에 있어서, 표적 폴리뉴클레오티드에 5'→3' 방향으로 (L-S)n 또는 (S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수임)을 제공하는 것인 방법.
- 제34항 내지 제36항 중 어느 한 항에 있어서, 단계 (b)가 (a)에서 제공받은 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 표적 폴리뉴클레오티드에 결합하고, 1개의 헬리카제가 각 스페이서에서 정지하도록 하는 것을 포함하는 것인 방법.
- 제37항에 있어서, 단계 (a)가 표적 폴리뉴클레오티드에 5'→3' 방향으로 (L1-S)n 또는 (S-L1)n (여기서, L은 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수임)을 제공하는 것을 포함하는 것인 방법.
- 제34항 내지 제36항 중 어느 한 항에 있어서, 단계 (b)가 (a)에서 제공받은 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 하나 이상의 헬리카제가 표적 폴리뉴클레오티드에 결합하고, 2개의 헬리카제가 각 스페이서에서 정지하도록 하는 것을 포함하는 것인 방법.
- 제39항에 있어서, 단계 (a)가 표적 폴리뉴클레오티드에 5'→3' 방향으로 (L2-S)n 또는 (S-L2)n (여기서, L은 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수임)을 제공하는 것을 포함하는 것인 방법.
- 제39항 또는 제40항에 있어서, 각 스페이서에서 정지된 2개의 헬리카제가 서로 상이한 것인 방법.
- 제39항 내지 제41항 중 어느 한 항에 있어서, 각 스페이서에서 정지된 2개의 헬리카제가 서로 부착되어 있거나, 또는 서로 공유 부착되어 있는 것인 방법.
- 제41항에 있어서,
(a) 표적 폴리뉴클레오티드에 5'→3' 방향으로 (L2-S)n 또는 (S-L2)n (여기서, L은 단 2개의 헬리카제가 결합하기에 충분할 정도의 길이를 갖는 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, n은 정수임)을 제공하는 단계;
(b) 차단 폴리뉴클레오티드를 각 영역 L2의 부분에 혼성화시켜 각 영역 L2의 남은 부분이 단 1개의 헬리카제가 결합하기에 충분할 정도의 길이가 되도록 하는 단계;
(c) (b)에서 제조된 표적 폴리뉴클레오티드를 하나 이상의 헬리카제와 접촉시켜 1개의 헬리카제가 각 영역 L2의 남은 부분에 결합하도록 하는 단계;
(d) (c)의 하나 이상의 결합된 헬리카제에 유리 뉴클레오티드 및 헬리카제 보조인자를 제공하여 헬리카제가 각 차단 폴리뉴클레오티드를 제거하고, 각 스페이서 S에서 정지하도록 하는 단계; 및
(e) (d)에서 제조된 표적 폴리뉴클레오티드를 (c)에서 사용된 것과는 다른 하나 이상의 헬리카제와 접촉시켜 1개의 상이한 헬리카제가 각 영역 L2에 결합하고, 각 스페이서 및 (d)에서 정지된 각 헬리카제에 의해 정지되도록 하는 것인 단계를 포함하는 방법. - 제34항 내지 제43항 중 어느 한 항에 있어서, 표적 폴리뉴클레오티드에 2개 이상의 스페이서를 제공하는 것인 방법.
- 제34항 내지 제44항 중 어느 한 항에 있어서, 하나 이상의 정지된 헬리카제가 제1항 내지 제31항 중 어느 한 항에 따른 방법을 이용하여 하나 이상의 스페이서를 지나 이동하는 것인 방법.
- (a) 5'→3' 방향으로 (L-S-D)n 또는 (D-S-L)n (여기서, L은 단일 가닥 폴리뉴클레오티드 또는 비혼성화된 폴리뉴클레오티드이고, S는 스페이서이고, D는 이중 가닥 폴리뉴클레오티드이고, 여기서, n은 정수임), 및 (b) 각 어댑터 상에서 정지된 하나 이상의 헬리카제를 포함하는, 표적 폴리뉴클레오티드의 이동을 제어하기 위한 어댑터.
- 제46항에 있어서, L이 단 1개의 헬리카제에 결합할 수 있거나 (L1), 또는 단 2개의 헬리카제에 결합할 수 있는 (L2) 것인 어댑터.
- 제47항에 있어서, n이 1이고, 1개 또는 2개의 헬리카제가 어댑터 상에서 정지되는 것인 어댑터.
- (a) 하나 이상의 스페이서, (b) 하나 이상의 헬리카제 및 (c) 막횡단 포어를 포함하는, 표적 폴리뉴클레오티드의 이동을 제어하기 위한 키트.
- 제49항에 있어서, 하나 이상의 스페이서가 제15항 내지 제18항 중 어느 한 항에서 정의된 것과 같은 것인 키트.
- 제49항 또는 제50항에 있어서, 키트가 제46항 내지 제48항 중 어느 한 항에 따른 어댑터를 포함하는 것인 키트.
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361774694P | 2013-03-08 | 2013-03-08 | |
US61/774,694 | 2013-03-08 | ||
GBGB1314695.6A GB201314695D0 (en) | 2013-08-16 | 2013-08-16 | Method |
GB1314695.6 | 2013-08-16 | ||
GB201318464A GB201318464D0 (en) | 2013-10-18 | 2013-10-18 | Modified enzymes |
GB1318465.0 | 2013-10-18 | ||
GB1318464.3 | 2013-10-18 | ||
GBGB1318465.0A GB201318465D0 (en) | 2013-10-18 | 2013-10-18 | Method |
PCT/GB2014/050175 WO2014135838A1 (en) | 2013-03-08 | 2014-01-22 | Enzyme stalling method |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150126026A true KR20150126026A (ko) | 2015-11-10 |
KR102168813B1 KR102168813B1 (ko) | 2020-10-22 |
Family
ID=51490681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020157027690A KR102168813B1 (ko) | 2013-03-08 | 2014-01-22 | 효소 정지 방법 |
Country Status (10)
Country | Link |
---|---|
US (3) | US10221450B2 (ko) |
EP (1) | EP2964779B1 (ko) |
JP (1) | JP6408494B2 (ko) |
KR (1) | KR102168813B1 (ko) |
CN (1) | CN105209634B (ko) |
AU (1) | AU2014224432B2 (ko) |
BR (1) | BR112015021788B1 (ko) |
CA (1) | CA2901545C (ko) |
SG (1) | SG11201507138RA (ko) |
WO (1) | WO2014135838A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170063889A (ko) * | 2014-10-07 | 2017-06-08 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 변형된 효소 |
Families Citing this family (79)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3092369A1 (en) | 2008-09-22 | 2010-03-25 | University Of Washington | Msp nanopores and related methods |
CA2750879C (en) | 2009-01-30 | 2018-05-22 | Oxford Nanopore Technologies Limited | Adaptors for nucleic acid constructs in transmembrane sequencing |
WO2012058638A2 (en) | 2010-10-29 | 2012-05-03 | President And Fellows Of Harvard College | Nucleic acid nanostructure barcode probes |
JP6480183B2 (ja) | 2011-05-27 | 2019-03-06 | オックスフォード ナノポール テクノロジーズ リミテッド | 結合方法 |
AU2012288629B2 (en) | 2011-07-25 | 2017-02-02 | Oxford Nanopore Technologies Limited | Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores |
KR20140090633A (ko) | 2011-10-21 | 2014-07-17 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 포어 및 hel308 헬리카제를 사용하여 표적 폴리뉴클레오티드를 특성화하는 방법 |
WO2013098562A2 (en) | 2011-12-29 | 2013-07-04 | Oxford Nanopore Technologies Limited | Enzyme method |
AU2013220156B2 (en) | 2012-02-15 | 2018-08-09 | Oxford Nanopore Technologies Limited | Aptamer method |
BR112014025157B1 (pt) | 2012-04-10 | 2022-02-08 | Oxford Nanopore Technologies Limited | Monômero de lisenina mutante, construto, poro, método para caracterizar um analito alvo, uso de um poro, e, kit |
WO2014013259A1 (en) | 2012-07-19 | 2014-01-23 | Oxford Nanopore Technologies Limited | Ssb method |
JP6614972B2 (ja) | 2012-07-19 | 2019-12-04 | オックスフォード ナノポール テクノロジーズ リミテッド | 修飾ヘリカーゼ |
US9551023B2 (en) | 2012-09-14 | 2017-01-24 | Oxford Nanopore Technologies Ltd. | Sample preparation method |
WO2014072703A1 (en) | 2012-11-06 | 2014-05-15 | Oxford Nanopore Technologies Limited | Quadruplex method |
GB201318465D0 (en) | 2013-10-18 | 2013-12-04 | Oxford Nanopore Tech Ltd | Method |
GB201314695D0 (en) | 2013-08-16 | 2013-10-02 | Oxford Nanopore Tech Ltd | Method |
SG11201507138RA (en) | 2013-03-08 | 2015-10-29 | Oxford Nanopore Tech Ltd | Enzyme stalling method |
US10760064B2 (en) | 2013-03-15 | 2020-09-01 | The General Hospital Corporation | RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
CA2906553C (en) | 2013-03-15 | 2022-08-02 | The General Hospital Corporation | Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
GB201313477D0 (en) | 2013-07-29 | 2013-09-11 | Univ Leuven Kath | Nanopore biosensors for detection of proteins and nucleic acids |
US10011850B2 (en) | 2013-06-21 | 2018-07-03 | The General Hospital Corporation | Using RNA-guided FokI Nucleases (RFNs) to increase specificity for RNA-Guided Genome Editing |
CA2927726A1 (en) | 2013-10-18 | 2015-04-23 | Oxford Nanopore Technologies Limited | Modified helicases for use in nucleic acid sequencing |
GB201406151D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
GB201406155D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
JP6749243B2 (ja) | 2014-01-22 | 2020-09-02 | オックスフォード ナノポール テクノロジーズ リミテッド | 1つまたは複数のポリヌクレオチド結合タンパク質を標的ポリヌクレオチドに付着させる方法 |
GB201403096D0 (en) | 2014-02-21 | 2014-04-09 | Oxford Nanopore Tech Ltd | Sample preparation method |
CA2932943C (en) | 2014-03-11 | 2023-09-26 | President And Fellows Of Harvard College | High-throughput and highly multiplexed imaging with programmable nucleic acid probes |
WO2015150786A1 (en) | 2014-04-04 | 2015-10-08 | Oxford Nanopore Technologies Limited | Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid |
US10443097B2 (en) | 2014-05-02 | 2019-10-15 | Oxford Nanopore Technologies Ltd. | Method of improving the movement of a target polynucleotide with respect to a transmembrane pore |
CN117164682A (zh) | 2014-09-01 | 2023-12-05 | 弗拉芒区生物技术研究所 | 突变csgg孔 |
EP3204511B1 (en) | 2014-10-07 | 2021-07-28 | Oxford Nanopore Technologies Limited | Mutant pores |
GB201418159D0 (en) * | 2014-10-14 | 2014-11-26 | Oxford Nanopore Tech Ltd | Method |
GB201418469D0 (en) | 2014-10-17 | 2014-12-03 | Oxford Nanopore Tech Ltd | Method |
KR102457147B1 (ko) | 2014-10-17 | 2022-10-19 | 옥스포드 나노포어 테크놀로지즈 피엘씨 | 나노 세공 rna 특징 규명을 위한 방법 |
EP3250716B1 (en) * | 2015-01-30 | 2021-07-07 | President and Fellows of Harvard College | Microscope-free imaging |
GB201502810D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Method |
GB201502809D0 (en) | 2015-02-19 | 2015-04-08 | Oxford Nanopore Tech Ltd | Mutant pore |
CN107735686B (zh) | 2015-04-14 | 2021-06-11 | 鲁汶天主教大学 | 具有内部蛋白质衔接子的纳米孔 |
US9926546B2 (en) | 2015-08-28 | 2018-03-27 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
US9512446B1 (en) | 2015-08-28 | 2016-12-06 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
EP3387432B1 (en) | 2015-12-08 | 2022-09-28 | Katholieke Universiteit Leuven KU Leuven Research & Development | Modified nanopores, compositions comprising the same, and uses thereof |
EP3423485B1 (en) | 2016-03-02 | 2021-12-29 | Oxford Nanopore Technologies plc | Mutant pore |
WO2017174990A1 (en) | 2016-04-06 | 2017-10-12 | Oxford Nanopore Technologies Limited | Mutant pore |
CN109196116B (zh) | 2016-05-25 | 2022-09-27 | 牛津纳米孔科技公开有限公司 | 一种表征靶多核苷酸的方法 |
GB201609221D0 (en) | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
GB201609220D0 (en) * | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
CN109923213B (zh) | 2016-09-20 | 2023-02-28 | 哈佛学院院长及董事 | 分子验证系统 |
GB201620450D0 (en) | 2016-12-01 | 2017-01-18 | Oxford Nanopore Tech Ltd | Method |
EP3551765A4 (en) | 2016-12-09 | 2020-11-11 | Ultivue, Inc. | IMPROVED METHODS FOR MULTIPLEX IMAGING USING LABELED NUCLEIC ACID CONTRAST AGENTS |
CN108220267B (zh) * | 2016-12-22 | 2022-10-04 | 丰益(上海)生物技术研发中心有限公司 | 磷脂酶及其应用 |
GB201707140D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Method |
GB201707122D0 (en) | 2017-05-04 | 2017-06-21 | Oxford Nanopore Tech Ltd | Pore |
WO2019002893A1 (en) | 2017-06-30 | 2019-01-03 | Vib Vzw | NEW PROTEIN PORES |
GB2569977A (en) | 2018-01-05 | 2019-07-10 | Oxford Nanopore Tech Ltd | Method |
GB201807793D0 (en) | 2018-05-14 | 2018-06-27 | Oxford Nanopore Tech Ltd | Method |
GB201808556D0 (en) | 2018-05-24 | 2018-07-11 | Oxford Nanopore Tech Ltd | Method |
GB201808554D0 (en) | 2018-05-24 | 2018-07-11 | Oxford Nanopore Tech Ltd | Method |
GB201808558D0 (en) | 2018-05-24 | 2018-07-11 | Oxford Nanopore Tech Ltd | Method |
GB201809323D0 (en) | 2018-06-06 | 2018-07-25 | Oxford Nanopore Tech Ltd | Method |
JP2020031557A (ja) * | 2018-08-28 | 2020-03-05 | 株式会社日立ハイテクノロジーズ | 生体分子分析装置 |
GB201907246D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
GB201907244D0 (en) | 2019-05-22 | 2019-07-03 | Oxford Nanopore Tech Ltd | Method |
US11926819B2 (en) | 2019-05-28 | 2024-03-12 | The Regents Of The University Of California | Methods of adding polymers to ribonucleic acids |
CN114040983A (zh) * | 2019-06-26 | 2022-02-11 | 南京金斯瑞生物科技有限公司 | 一种含有阻断物的寡核苷酸 |
WO2021053745A1 (ja) * | 2019-09-18 | 2021-03-25 | 株式会社日立ハイテク | アダプター分子、当該アダプター分子と生体分子とが結合した生体分子-アダプター分子複合体、生体分子分析装置及び生体分子分析方法 |
GB201915480D0 (en) | 2019-10-25 | 2019-12-11 | Oxford Nanopore Tech Ltd | Improved nanopore sensing device, components and method of manufacture |
CN114761799A (zh) | 2019-12-02 | 2022-07-15 | 牛津纳米孔科技公开有限公司 | 使用纳米孔表征靶多肽的方法 |
GB202016874D0 (en) | 2020-10-23 | 2020-12-09 | Oxford Nanopore Tech Ltd | Nanopore support structure and manufacture thereof |
EP4168583A2 (en) * | 2020-06-18 | 2023-04-26 | Oxford Nanopore Technologies plc | Method of characterising a polynucleotide moving through a nanopore |
WO2022029449A1 (en) | 2020-08-07 | 2022-02-10 | Oxford Nanopore Technologies Limited | Methods of identifying nucleic acid barcodes |
GB202107192D0 (en) | 2021-05-19 | 2021-06-30 | Oxford Nanopore Tech Ltd | Method |
WO2022243692A1 (en) | 2021-05-19 | 2022-11-24 | Oxford Nanopore Technologies Plc | Methods for complement strand sequencing |
GB202107354D0 (en) | 2021-05-24 | 2021-07-07 | Oxford Nanopore Tech Ltd | Method |
CN113862264A (zh) * | 2021-12-03 | 2021-12-31 | 北京齐碳科技有限公司 | 用于靶多核苷酸测序的衔接子、构建体、方法和应用 |
CN114262735A (zh) * | 2021-12-15 | 2022-04-01 | 成都齐碳科技有限公司 | 用于表征多核苷酸的衔接体及其用途 |
GB202118906D0 (en) * | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Ltd | Method |
GB202118908D0 (en) | 2021-12-23 | 2022-02-09 | Oxford Nanopore Tech Ltd | Method |
CN114457145B (zh) * | 2022-01-29 | 2023-08-11 | 成都齐碳科技有限公司 | 用于表征靶多核苷酸测序的接头、构建体、方法和应用 |
CN116478983B (zh) * | 2022-11-21 | 2023-10-24 | 北京普译生物科技有限公司 | 一种rna-dna嵌合接头及其应用 |
GB202307486D0 (en) | 2023-05-18 | 2023-07-05 | Oxford Nanopore Tech Plc | Method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006028508A2 (en) * | 2004-03-23 | 2006-03-16 | President And Fellows Of Harvard College | Methods and apparatus for characterizing polynucleotides |
WO2010004265A1 (en) * | 2008-07-07 | 2010-01-14 | Oxford Nanopore Technologies Limited | Enzyme-pore constructs |
WO2010086622A1 (en) * | 2009-01-30 | 2010-08-05 | Oxford Nanopore Technologies Limited | Adaptors for nucleic acid constructs in transmembrane sequencing |
Family Cites Families (207)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BE755065A (fr) | 1969-08-20 | 1971-02-01 | Sicli | Extincteur d'incendie a rechargement |
FI82266C (fi) | 1982-10-19 | 1991-02-11 | Cetus Corp | Foerfarande foer framstaellning av il-2 -mutein. |
US5198543A (en) | 1989-03-24 | 1993-03-30 | Consejo Superior Investigaciones Cientificas | PHI29 DNA polymerase |
GB8924338D0 (en) | 1989-10-28 | 1989-12-13 | Atomic Energy Authority Uk | Electrodes |
US5215899A (en) | 1989-11-09 | 1993-06-01 | Miles Inc. | Nucleic acid amplification employing ligatable hairpin probe and transcription |
US5424413A (en) | 1992-01-22 | 1995-06-13 | Gen-Probe Incorporated | Branched nucleic acid probes |
FR2703693B1 (fr) | 1993-04-06 | 1995-07-13 | Pasteur Institut | Procédé rapide de détermination d'une séquence d'ADN et application au séquençage et au diagnostic. |
US5714320A (en) | 1993-04-15 | 1998-02-03 | University Of Rochester | Rolling circle synthesis of oligonucleotides and amplification of select randomized circular oligonucleotides |
EP0753071A1 (en) | 1993-04-28 | 1997-01-15 | Worcester Foundation For Experimental Biology | Cell-targeted lytic pore-forming agents |
US5777078A (en) | 1993-04-28 | 1998-07-07 | Worcester Foundation For Experimental Biology | Triggered pore-forming agents |
DE4320201A1 (de) | 1993-06-18 | 1995-01-12 | Asta Medica Ag | Verwendung von Cetrorelix und weiteren Nona- und Dekapeptiden zur Herstellung eines Arzneimittels zur Bekämpfung von Aids und zur Wachstumsstimulation |
US7569341B2 (en) | 1994-01-31 | 2009-08-04 | Trustees Of Boston University | Nucleic acid directed immobilization arrays and methods of assembly |
US5561043A (en) | 1994-01-31 | 1996-10-01 | Trustees Of Boston University | Self-assembling multimeric nucleic acid constructs |
US5795782A (en) | 1995-03-17 | 1998-08-18 | President & Fellows Of Harvard College | Characterization of individual polymer molecules based on monomer-interface interactions |
US6362002B1 (en) | 1995-03-17 | 2002-03-26 | President And Fellows Of Harvard College | Characterization of individual polymer molecules based on monomer-interface interactions |
US6395887B1 (en) | 1995-08-01 | 2002-05-28 | Yale University | Analysis of gene expression by display of 3'-end fragments of CDNAS |
US5866336A (en) | 1996-07-16 | 1999-02-02 | Oncor, Inc. | Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon |
DE19648625A1 (de) | 1996-11-13 | 1998-05-14 | Soft Gene Gmbh | Mikroprojektil für das Einbringen von Substanzen in Zellen durch ballistischen Transfer |
JP3891620B2 (ja) | 1996-11-14 | 2007-03-14 | 株式会社アイシン・コスモス研究所 | ヘアピン型構造の核酸プローブ分子、及び該核酸プローブ分子を利用した核酸検出方法 |
US20020197614A1 (en) | 1997-05-16 | 2002-12-26 | Mosaic Technologies, Inc. | Electrophoretic analysis of target molecules using adapter molecules |
WO1999005167A1 (en) | 1997-07-25 | 1999-02-04 | University Of Massachusetts | Designed protein pores as components for biosensors |
US6087099A (en) | 1997-09-08 | 2000-07-11 | Myriad Genetics, Inc. | Method for sequencing both strands of a double stranded DNA in a single sequencing reaction |
US6127166A (en) | 1997-11-03 | 2000-10-03 | Bayley; Hagan | Molluscan ligament polypeptides and genes encoding them |
JPH11137260A (ja) | 1997-11-06 | 1999-05-25 | Soyaku Gijutsu Kenkyusho:Kk | 抗インフルエンザウイルス環状ダンベル型rna−dnaキメラ化合物及び抗インフルエンザウイルス剤 |
US6123819A (en) | 1997-11-12 | 2000-09-26 | Protiveris, Inc. | Nanoelectrode arrays |
DE19826758C1 (de) | 1998-06-15 | 1999-10-21 | Soft Gene Gmbh | Darstellung von linearen kovalent geschlossenen DNA-Molekülen als Expressionskonstrukte |
US6743605B1 (en) | 1998-06-24 | 2004-06-01 | Enzo Life Sciences, Inc. | Linear amplification of specific nucleic acid sequences |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
US6150112A (en) | 1998-09-18 | 2000-11-21 | Yale University | Methods for identifying DNA sequences for use in comparison of DNA samples by their lack of polymorphism using Y shape adaptors |
US6235502B1 (en) | 1998-09-18 | 2001-05-22 | Molecular Staging Inc. | Methods for selectively isolating DNA using rolling circle amplification |
US6267872B1 (en) | 1998-11-06 | 2001-07-31 | The Regents Of The University Of California | Miniature support for thin films containing single channels or nanopores and methods for using same |
US6426231B1 (en) | 1998-11-18 | 2002-07-30 | The Texas A&M University System | Analyte sensing mediated by adapter/carrier molecules |
AU2206800A (en) | 1998-12-11 | 2000-06-26 | Regents Of The University Of California, The | Targeted molecular bar codes and methods for using the same |
NO986133D0 (no) | 1998-12-23 | 1998-12-23 | Preben Lexow | FremgangsmÕte for DNA-sekvensering |
US7056661B2 (en) | 1999-05-19 | 2006-06-06 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
US6627067B1 (en) | 1999-06-22 | 2003-09-30 | President And Fellows Of Harvard College | Molecular and atomic scale evaluation of biopolymers |
EP1196434A2 (en) | 1999-06-29 | 2002-04-17 | University Health Network | Peptide conjugates for the stabilization of membrane proteins and interactions with biological membranes |
US6403319B1 (en) | 1999-08-13 | 2002-06-11 | Yale University | Analysis of sequence tags with hairpin primers |
US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
US6682649B1 (en) | 1999-10-01 | 2004-01-27 | Sophion Bioscience A/S | Substrate and a method for determining and/or monitoring electrophysiological properties of ion channels |
JP2003532380A (ja) | 1999-12-02 | 2003-11-05 | モレキュラー ステージング,インコーポレイテッド | 線状自己アニーリングセグメントからの一本鎖環状dnaの産出 |
EP2083015B1 (en) | 2000-02-11 | 2016-04-06 | The Texas A & M University System | Biosensor compositions and methods of use |
WO2001062943A1 (en) | 2000-02-25 | 2001-08-30 | Invitrogen Corporation | Topoisomerase linker-mediated amplification methods |
CA2403804A1 (en) | 2000-03-21 | 2001-09-27 | Curagen Corporation | Vegf-modulated genes and methods employing them |
PT1265914E (pt) | 2000-03-22 | 2008-04-08 | Geneprint Inc | Polipéptidos relacionados com wnt-1 e ácidos nucleicos que codificam estes polipéptidos |
US6596488B2 (en) | 2000-03-30 | 2003-07-22 | City Of Hope | Tumor suppressor gene |
US6387624B1 (en) | 2000-04-14 | 2002-05-14 | Incyte Pharmaceuticals, Inc. | Construction of uni-directionally cloned cDNA libraries from messenger RNA for improved 3′ end DNA sequencing |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
US20020132350A1 (en) | 2000-09-14 | 2002-09-19 | Pioneer Hi-Bred International, Inc. | Targeted genetic manipulation using Mu bacteriophage cleaved donor complex |
US6709861B2 (en) | 2000-11-17 | 2004-03-23 | Lucigen Corp. | Cloning vectors and vector components |
US6936433B2 (en) | 2000-11-27 | 2005-08-30 | The Regents Of The University Of California | Methods and devices for characterizing duplex nucleic acid molecules |
US20020197618A1 (en) | 2001-01-20 | 2002-12-26 | Sampson Jeffrey R. | Synthesis and amplification of unstructured nucleic acids for rapid sequencing |
US20030087232A1 (en) | 2001-01-25 | 2003-05-08 | Fred Christians | Methods for screening polypeptides |
US7807408B2 (en) | 2001-03-19 | 2010-10-05 | President & Fellows Of Harvard College | Directed evolution of proteins |
US6863833B1 (en) | 2001-06-29 | 2005-03-08 | The Board Of Trustees Of The Leland Stanford Junior University | Microfabricated apertures for supporting bilayer lipid membranes |
WO2003004992A2 (en) | 2001-07-03 | 2003-01-16 | The Regents Of The University Of California | Mammalian sweet and amino acid heterodimeric taste receptors |
US6852492B2 (en) | 2001-09-24 | 2005-02-08 | Intel Corporation | Nucleic acid sequencing by raman monitoring of uptake of precursors during molecular replication |
IL163822A0 (en) | 2002-03-15 | 2005-12-18 | Nuevolution As | An improved method for synthesising templated molecules |
EP1504114B1 (en) | 2002-05-10 | 2017-07-12 | The Texas A & M University System | Stochastic sensing through covalent interactions |
US7452699B2 (en) | 2003-01-15 | 2008-11-18 | Dana-Farber Cancer Institute, Inc. | Amplification of DNA in a hairpin structure, and applications |
US20060147935A1 (en) | 2003-02-12 | 2006-07-06 | Sten Linnarsson | Methods and means for nucleic acid sequencing |
US20040209299A1 (en) | 2003-03-07 | 2004-10-21 | Rubicon Genomics, Inc. | In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA |
CA2519309A1 (en) | 2003-03-25 | 2004-10-14 | Stratagene California | Dna polymerase fusions and uses thereof |
US7745116B2 (en) | 2003-04-08 | 2010-06-29 | Pacific Biosciences Of California, Inc. | Composition and method for nucleic acid sequencing |
US20100035254A1 (en) | 2003-04-08 | 2010-02-11 | Pacific Biosciences Of California, Inc. | Composition and method for nucleic acid sequencing |
US7163658B2 (en) | 2003-04-23 | 2007-01-16 | Rouvain Bension | Rapid sequencing of polymers |
US7344882B2 (en) | 2003-05-12 | 2008-03-18 | Bristol-Myers Squibb Company | Polynucleotides encoding variants of the TRP channel family member, LTRPC3 |
WO2005056750A2 (en) | 2003-12-11 | 2005-06-23 | Quark Biotech, Inc. | Inversion-duplication of nucleic acids and libraries prepared thereby |
GB0400584D0 (en) | 2004-01-12 | 2004-02-11 | Solexa Ltd | Nucleic acid chacterisation |
JP2005253427A (ja) | 2004-03-15 | 2005-09-22 | Aisin Seiki Co Ltd | 核酸検出方法及び核酸単離方法 |
GB2413796B (en) | 2004-03-25 | 2006-03-29 | Global Genomics Ab | Methods and means for nucleic acid sequencing |
US20050227239A1 (en) | 2004-04-08 | 2005-10-13 | Joyce Timothy H | Microarray based affinity purification and analysis device coupled with solid state nanopore electrodes |
US7618778B2 (en) | 2004-06-02 | 2009-11-17 | Kaufman Joseph C | Producing, cataloging and classifying sequence tags |
WO2005124888A1 (en) | 2004-06-08 | 2005-12-29 | President And Fellows Of Harvard College | Suspended carbon nanotube field effect transistor |
US7700281B2 (en) | 2004-06-30 | 2010-04-20 | Usb Corporation | Hot start nucleic acid amplification |
CN101103357B (zh) | 2004-08-13 | 2012-10-03 | 哈佛学院院长等 | 超高处理量光学-纳米孔dna读出平台 |
US20060086626A1 (en) | 2004-10-22 | 2006-04-27 | Joyce Timothy H | Nanostructure resonant tunneling with a gate voltage source |
EP1842061A4 (en) | 2004-12-21 | 2009-05-13 | Texas A & M Univ Sys | HIGH-TEMPERATURE ION CHANNELS AND ION PORES |
US7890268B2 (en) | 2004-12-28 | 2011-02-15 | Roche Molecular Systems, Inc. | De-novo sequencing of nucleic acids |
GB0505971D0 (en) | 2005-03-23 | 2005-04-27 | Isis Innovation | Delivery of molecules to a lipid bilayer |
US7507575B2 (en) | 2005-04-01 | 2009-03-24 | 3M Innovative Properties Company | Multiplex fluorescence detection device having removable optical modules |
WO2007145612A1 (en) | 2005-06-06 | 2007-12-21 | 454 Life Sciences Corporation | Paired end sequencing |
US20070020640A1 (en) | 2005-07-21 | 2007-01-25 | Mccloskey Megan L | Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis |
EP1924704B1 (en) | 2005-08-02 | 2011-05-25 | Rubicon Genomics, Inc. | Compositions and methods for processing and amplification of dna, including using multiple enzymes in a single reaction |
WO2007024997A2 (en) | 2005-08-22 | 2007-03-01 | Fermalogic, Inc. | Methods of increasing production of secondary metabolites |
GB0523282D0 (en) | 2005-11-15 | 2005-12-21 | Isis Innovation | Methods using pores |
ATE518010T1 (de) | 2005-12-22 | 2011-08-15 | Pacific Biosciences California | Aktive oberflächengekoppelte polymerasen |
US7932029B1 (en) | 2006-01-04 | 2011-04-26 | Si Lok | Methods for nucleic acid mapping and identification of fine-structural-variations in nucleic acids and utilities |
CA2642854A1 (en) | 2006-02-18 | 2007-08-30 | Michael Strathmann | Massively multiplexed sequencing |
US8673567B2 (en) | 2006-03-08 | 2014-03-18 | Atila Biosystems, Inc. | Method and kit for nucleic acid sequence detection |
WO2007114693A2 (en) | 2006-04-04 | 2007-10-11 | Keygene N.V. | High throughput detection of molecular markers based on aflp and high throughput sequencing |
US8889348B2 (en) | 2006-06-07 | 2014-11-18 | The Trustees Of Columbia University In The City Of New York | DNA sequencing by nanopore using modified nucleotides |
JP4876766B2 (ja) | 2006-08-10 | 2012-02-15 | トヨタ自動車株式会社 | 燃料電池 |
CN103230598A (zh) | 2006-09-06 | 2013-08-07 | 费斯生物制药公司 | 融合肽治疗组合物 |
US20100311602A1 (en) | 2006-10-13 | 2010-12-09 | J. Craig Venter Institute, Inc. | Sequencing method |
AU2007309504B2 (en) | 2006-10-23 | 2012-09-13 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
GB2445016B (en) | 2006-12-19 | 2012-03-07 | Microsaic Systems Plc | Microengineered ionisation device |
DK2122344T3 (da) | 2007-02-20 | 2019-07-15 | Oxford Nanopore Tech Ltd | Lipiddobbeltlags-sensorsystem |
US20110005918A1 (en) | 2007-04-04 | 2011-01-13 | Akeson Mark A | Compositions, devices, systems, and methods for using a nanopore |
EP3543357A1 (en) | 2007-05-08 | 2019-09-25 | Trustees of Boston University | Chemical functionalization of solid-state nanopores and nanopore arrays and applications thereof |
EP2195648B1 (en) | 2007-09-12 | 2019-05-08 | President and Fellows of Harvard College | High-resolution molecular graphene sensor comprising an aperture in the graphene layer |
GB2453377A (en) | 2007-10-05 | 2009-04-08 | Isis Innovation | Transmembrane protein pores and molecular adapters therefore. |
KR101414713B1 (ko) | 2007-10-11 | 2014-07-03 | 삼성전자주식회사 | 리가제 및 엔도뉴클레아제의 존재하에서 롤링서클 증폭에의하여 표적 핵산을 증폭하는 방법 |
WO2009052214A2 (en) | 2007-10-15 | 2009-04-23 | Complete Genomics, Inc. | Sequence analysis using decorated nucleic acids |
GB0724736D0 (en) | 2007-12-19 | 2008-01-30 | Oxford Nanolabs Ltd | Formation of layers of amphiphilic molecules |
WO2009084721A1 (en) | 2007-12-31 | 2009-07-09 | Fujirebio Inc. | Clusters of microresonators for cavity mode optical sensing |
WO2009092035A2 (en) | 2008-01-17 | 2009-07-23 | Sequenom, Inc. | Methods and compositions for the analysis of biological molecules |
US8263367B2 (en) | 2008-01-25 | 2012-09-11 | Agency For Science, Technology And Research | Nucleic acid interaction analysis |
US8231969B2 (en) | 2008-03-26 | 2012-07-31 | University Of Utah Research Foundation | Asymmetrically functionalized nanoparticles |
JP2011515102A (ja) | 2008-03-28 | 2011-05-19 | パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド | 核酸シーケンシング用組成物及び方法 |
US8143030B2 (en) | 2008-09-24 | 2012-03-27 | Pacific Biosciences Of California, Inc. | Intermittent detection during analytical reactions |
WO2009120374A2 (en) | 2008-03-28 | 2009-10-01 | Pacific Biosciences Of California, Inc. | Methods and compositions for nucleic acid sample preparation |
US8628940B2 (en) | 2008-09-24 | 2014-01-14 | Pacific Biosciences Of California, Inc. | Intermittent detection during analytical reactions |
WO2009132315A1 (en) | 2008-04-24 | 2009-10-29 | Life Technologies Corporation | Method of sequencing and mapping target nucleic acids |
CN102066579A (zh) | 2008-04-24 | 2011-05-18 | 纽约市哥伦比亚大学理事会 | 用于dna分子编排的几何图案和脂质双层以及它们的用途 |
AU2009269792A1 (en) | 2008-07-07 | 2010-01-14 | Oxford Nanopore Technologies Limited | Base-detecting pore |
US20100092960A1 (en) * | 2008-07-25 | 2010-04-15 | Pacific Biosciences Of California, Inc. | Helicase-assisted sequencing with molecular beacons |
EP2334802A4 (en) | 2008-09-09 | 2012-01-25 | Life Technologies Corp | METHODS OF GENERATING SPECIFIC LIBRARIES OF GENES |
US8481264B2 (en) | 2008-09-19 | 2013-07-09 | Pacific Biosciences Of California, Inc. | Immobilized nucleic acid complexes for sequence analysis |
CA3092369A1 (en) | 2008-09-22 | 2010-03-25 | University Of Washington | Msp nanopores and related methods |
US8383369B2 (en) | 2008-09-24 | 2013-02-26 | Pacific Biosciences Of California, Inc. | Intermittent detection during analytical reactions |
EP2376517B1 (en) | 2008-10-24 | 2013-01-16 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
US9080211B2 (en) | 2008-10-24 | 2015-07-14 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
US8486630B2 (en) | 2008-11-07 | 2013-07-16 | Industrial Technology Research Institute | Methods for accurate sequence data and modified base position determination |
GB0820927D0 (en) | 2008-11-14 | 2008-12-24 | Isis Innovation | Method |
EP2370598B1 (en) | 2008-12-11 | 2017-02-15 | Pacific Biosciences Of California, Inc. | Classification of nucleic acid templates |
BRPI1007215A2 (pt) | 2009-01-30 | 2017-08-29 | Oxford Nanopore Tech Ltd | Método de acoplamento covalente de duas ou mais porções, primeira e segunda porções, primeiro porção acoplada a uma segunda porção, par de primeiro e segundo ligantes, e, uso de um par de ligantes. |
EP2610352B1 (en) | 2009-02-16 | 2014-10-08 | Epicentre Technologies Corporation | Template-independent ligation of single-stranded DNA |
AU2010215761B2 (en) | 2009-02-23 | 2017-04-06 | Cytomx Therapeutics, Inc | Proproteins and methods of use thereof |
EP2227023A1 (en) | 2009-03-05 | 2010-09-08 | BRITISH TELECOMMUNICATIONS public limited company | Video streaming |
FR2943656A1 (fr) | 2009-03-25 | 2010-10-01 | Air Liquide | Procede et installation de production d'hydrogene mettant en oeuvre un compresseur thermocinetique |
GB0905140D0 (en) | 2009-03-25 | 2009-05-06 | Isis Innovation | Method |
WO2010117470A2 (en) | 2009-04-10 | 2010-10-14 | Pacific Biosciences Of California, Inc. | Nanopore sequencing devices and methods |
WO2010122293A1 (en) | 2009-04-20 | 2010-10-28 | Oxford Nanopore Technologies Limited | Lipid bilayer sensor array |
GB0910302D0 (en) | 2009-06-15 | 2009-07-29 | Lumora Ltd | Nucleic acid amplification |
US20120015821A1 (en) | 2009-09-09 | 2012-01-19 | Life Technologies Corporation | Methods of Generating Gene Specific Libraries |
CA2781581C (en) | 2009-12-01 | 2018-03-06 | Oxford Nanopore Technologies Limited | Biochemical analysis instrument |
WO2011090556A1 (en) | 2010-01-19 | 2011-07-28 | Verinata Health, Inc. | Methods for determining fraction of fetal nucleic acid in maternal samples |
FR2955773B1 (fr) | 2010-02-01 | 2017-05-26 | Commissariat A L'energie Atomique | Complexe moleculaire de ciblage des antigenes vers les cellules presentatrices d'antigene et ses applications pour la vaccination |
KR20110100963A (ko) | 2010-03-05 | 2011-09-15 | 삼성전자주식회사 | 미세 유동 장치 및 이를 이용한 표적 핵산의 염기 서열 결정 방법 |
WO2011112718A1 (en) | 2010-03-10 | 2011-09-15 | Ibis Biosciences, Inc. | Production of single-stranded circular nucleic acid |
US8652779B2 (en) | 2010-04-09 | 2014-02-18 | Pacific Biosciences Of California, Inc. | Nanopore sequencing using charge blockade labels |
CN103154729B (zh) | 2010-06-08 | 2015-01-07 | 哈佛大学校长及研究员协会 | 具有由石墨烯支持的人工脂质膜的纳米孔装置 |
US20120244525A1 (en) | 2010-07-19 | 2012-09-27 | New England Biolabs, Inc. | Oligonucleotide Adapters: Compositions and Methods of Use |
US20140051068A1 (en) | 2010-09-07 | 2014-02-20 | The Regents Of The University Of California | Control of dna movement in a nanopore at one nucleotide precision by a processive enzyme |
WO2012061832A1 (en) | 2010-11-05 | 2012-05-10 | Illumina, Inc. | Linking sequence reads using paired code tags |
CN103282518B (zh) | 2010-12-17 | 2016-11-16 | 纽约哥伦比亚大学理事会 | 使用经修饰的核苷酸和纳米孔检测的dna边合成边测序 |
US20130291392A1 (en) | 2011-01-18 | 2013-11-07 | R.K. Swamy | Multipurpose instrument for triangle solutions, measurements and geometrical applications called triometer |
WO2012098562A2 (en) | 2011-01-19 | 2012-07-26 | Panacea Biotec Limited | Liquid oral compositions of lanthanum salts |
DK3037536T3 (da) | 2011-01-28 | 2020-01-13 | Illumina Inc | Oligonukleotiderstatning for di-taggede og retnings biblioteker |
US20120196279A1 (en) * | 2011-02-02 | 2012-08-02 | Pacific Biosciences Of California, Inc. | Methods and compositions for nucleic acid sample preparation |
WO2012107778A2 (en) | 2011-02-11 | 2012-08-16 | Oxford Nanopore Technologies Limited | Mutant pores |
JP6480183B2 (ja) | 2011-05-27 | 2019-03-06 | オックスフォード ナノポール テクノロジーズ リミテッド | 結合方法 |
US20130017978A1 (en) | 2011-07-11 | 2013-01-17 | Finnzymes Oy | Methods and transposon nucleic acids for generating a dna library |
US9145623B2 (en) | 2011-07-20 | 2015-09-29 | Thermo Fisher Scientific Oy | Transposon nucleic acids comprising a calibration sequence for DNA sequencing |
AU2012288629B2 (en) | 2011-07-25 | 2017-02-02 | Oxford Nanopore Technologies Limited | Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores |
US9632102B2 (en) | 2011-09-25 | 2017-04-25 | Theranos, Inc. | Systems and methods for multi-purpose analysis |
WO2013041878A1 (en) | 2011-09-23 | 2013-03-28 | Oxford Nanopore Technologies Limited | Analysis of a polymer comprising polymer units |
US20140308661A1 (en) | 2011-09-25 | 2014-10-16 | Theranos, Inc. | Systems and methods for multi-analysis |
US9810704B2 (en) | 2013-02-18 | 2017-11-07 | Theranos, Inc. | Systems and methods for multi-analysis |
KR20140090633A (ko) | 2011-10-21 | 2014-07-17 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 포어 및 hel308 헬리카제를 사용하여 표적 폴리뉴클레오티드를 특성화하는 방법 |
GB201120910D0 (en) | 2011-12-06 | 2012-01-18 | Cambridge Entpr Ltd | Nanopore functionality control |
US9404147B2 (en) | 2011-12-19 | 2016-08-02 | Gen-Probe Incorporated | Closed nucleic acid structures |
WO2013098562A2 (en) | 2011-12-29 | 2013-07-04 | Oxford Nanopore Technologies Limited | Enzyme method |
CN104136631B (zh) | 2011-12-29 | 2017-03-01 | 牛津纳米孔技术公司 | 使用xpd解旋酶表征多核苷酸的方法 |
CN107828877A (zh) | 2012-01-20 | 2018-03-23 | 吉尼亚科技公司 | 基于纳米孔的分子检测与测序 |
NO2694769T3 (ko) | 2012-03-06 | 2018-03-03 | ||
BR112014025157B1 (pt) | 2012-04-10 | 2022-02-08 | Oxford Nanopore Technologies Limited | Monômero de lisenina mutante, construto, poro, método para caracterizar um analito alvo, uso de um poro, e, kit |
WO2013185137A1 (en) | 2012-06-08 | 2013-12-12 | Pacific Biosciences Of California, Inc. | Modified base detection with nanopore sequencing |
TWI655213B (zh) | 2012-07-13 | 2019-04-01 | 目立康股份有限公司 | 自我組織化肽衍生物的製造方法 |
JP6429773B2 (ja) | 2012-07-19 | 2018-11-28 | オックスフォード ナノポール テクノロジーズ リミテッド | 酵素構築物 |
WO2014013259A1 (en) | 2012-07-19 | 2014-01-23 | Oxford Nanopore Technologies Limited | Ssb method |
JP6614972B2 (ja) | 2012-07-19 | 2019-12-04 | オックスフォード ナノポール テクノロジーズ リミテッド | 修飾ヘリカーゼ |
US9551023B2 (en) | 2012-09-14 | 2017-01-24 | Oxford Nanopore Technologies Ltd. | Sample preparation method |
CN104936682B (zh) | 2012-10-26 | 2017-12-15 | 牛津纳米孔技术公司 | 微滴界面 |
GB201313121D0 (en) | 2013-07-23 | 2013-09-04 | Oxford Nanopore Tech Ltd | Array of volumes of polar medium |
US9670526B2 (en) | 2012-11-09 | 2017-06-06 | Stratos Genomics, Inc. | Concentrating a target molecule for sensing by a nanopore |
US9683230B2 (en) | 2013-01-09 | 2017-06-20 | Illumina Cambridge Limited | Sample preparation on a solid support |
US20140206842A1 (en) | 2013-01-22 | 2014-07-24 | Muhammed Majeed | Peptides Modified with Triterpenoids and Small Organic Molecules: Synthesis and use in Cosmeceutical |
GB201318465D0 (en) | 2013-10-18 | 2013-12-04 | Oxford Nanopore Tech Ltd | Method |
SG11201507138RA (en) | 2013-03-08 | 2015-10-29 | Oxford Nanopore Tech Ltd | Enzyme stalling method |
GB201314695D0 (en) | 2013-08-16 | 2013-10-02 | Oxford Nanopore Tech Ltd | Method |
CA3094792A1 (en) | 2013-03-13 | 2014-09-18 | Illumina, Inc. | Methods and compositions for nucleic acid sequencing |
WO2014153408A1 (en) | 2013-03-19 | 2014-09-25 | Directed Genomics, Llc | Enrichment of target sequences |
EP3004378B1 (en) | 2013-05-24 | 2017-12-20 | Illumina Cambridge Limited | Pyrophosphorolytic sequencing using nanopores |
EP3936222A1 (en) | 2013-08-30 | 2022-01-12 | University of Washington through its Center for Commercialization | Selective modification of polymer subunits to improve nanopore-based analysis |
CA2927726A1 (en) | 2013-10-18 | 2015-04-23 | Oxford Nanopore Technologies Limited | Modified helicases for use in nucleic acid sequencing |
GB201406151D0 (en) | 2014-04-04 | 2014-05-21 | Oxford Nanopore Tech Ltd | Method |
GB201321123D0 (en) | 2013-11-29 | 2014-01-15 | Linea Ab Q | Amplification of circular molecules |
JP6749243B2 (ja) | 2014-01-22 | 2020-09-02 | オックスフォード ナノポール テクノロジーズ リミテッド | 1つまたは複数のポリヌクレオチド結合タンパク質を標的ポリヌクレオチドに付着させる方法 |
GB201403096D0 (en) | 2014-02-21 | 2014-04-09 | Oxford Nanopore Tech Ltd | Sample preparation method |
US10131944B2 (en) | 2014-03-24 | 2018-11-20 | The Regents Of The University Of California | Molecular adapter for capture and manipulation of transfer RNA |
WO2015150786A1 (en) | 2014-04-04 | 2015-10-08 | Oxford Nanopore Technologies Limited | Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid |
GB201417712D0 (en) | 2014-10-07 | 2014-11-19 | Oxford Nanopore Tech Ltd | Method |
WO2015189636A1 (en) | 2014-06-13 | 2015-12-17 | Illumina Cambridge Limited | Methods and compositions for preparing sequencing libraries |
US10017759B2 (en) | 2014-06-26 | 2018-07-10 | Illumina, Inc. | Library preparation of tagged nucleic acid |
CN112430641A (zh) | 2014-06-30 | 2021-03-02 | 亿明达股份有限公司 | 使用单侧转座的方法和组合物 |
WO2016022557A1 (en) | 2014-08-05 | 2016-02-11 | Twist Bioscience Corporation | Cell free cloning of nucleic acids |
US10435685B2 (en) | 2014-08-19 | 2019-10-08 | Pacific Biosciences Of California, Inc. | Compositions and methods for enrichment of nucleic acids |
EP3183367B1 (en) | 2014-08-19 | 2019-06-26 | Pacific Biosciences Of California, Inc. | Compositions and methods for enrichment of nucleic acids |
CN117164682A (zh) | 2014-09-01 | 2023-12-05 | 弗拉芒区生物技术研究所 | 突变csgg孔 |
GB201418159D0 (en) | 2014-10-14 | 2014-11-26 | Oxford Nanopore Tech Ltd | Method |
WO2016138080A1 (en) | 2015-02-24 | 2016-09-01 | Trustees Of Boston University | Protection of barcodes during dna amplification using molecular hairpins |
GB2550712B (en) | 2015-02-26 | 2021-01-13 | Hitachi High Tech Corp | Method for constructing hairpin-containing nucleic acid molecules for nanopore sequencing |
GB201609220D0 (en) | 2016-05-25 | 2016-07-06 | Oxford Nanopore Tech Ltd | Method |
CN107488656B (zh) | 2016-06-13 | 2020-07-17 | 陆欣华 | 一种核酸等温自扩增方法 |
GB201807793D0 (en) | 2018-05-14 | 2018-06-27 | Oxford Nanopore Tech Ltd | Method |
-
2014
- 2014-01-22 SG SG11201507138RA patent/SG11201507138RA/en unknown
- 2014-01-22 CN CN201480013152.3A patent/CN105209634B/zh active Active
- 2014-01-22 JP JP2015560761A patent/JP6408494B2/ja active Active
- 2014-01-22 WO PCT/GB2014/050175 patent/WO2014135838A1/en active Application Filing
- 2014-01-22 AU AU2014224432A patent/AU2014224432B2/en active Active
- 2014-01-22 KR KR1020157027690A patent/KR102168813B1/ko active IP Right Grant
- 2014-01-22 EP EP14702643.9A patent/EP2964779B1/en active Active
- 2014-01-22 CA CA2901545A patent/CA2901545C/en active Active
- 2014-01-22 US US14/773,164 patent/US10221450B2/en active Active
- 2014-01-22 BR BR112015021788-5A patent/BR112015021788B1/pt active IP Right Grant
-
2019
- 2019-01-09 US US16/243,357 patent/US11560589B2/en active Active
-
2022
- 2022-12-14 US US18/065,735 patent/US20230212665A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006028508A2 (en) * | 2004-03-23 | 2006-03-16 | President And Fellows Of Harvard College | Methods and apparatus for characterizing polynucleotides |
WO2010004265A1 (en) * | 2008-07-07 | 2010-01-14 | Oxford Nanopore Technologies Limited | Enzyme-pore constructs |
WO2010086622A1 (en) * | 2009-01-30 | 2010-08-05 | Oxford Nanopore Technologies Limited | Adaptors for nucleic acid constructs in transmembrane sequencing |
Non-Patent Citations (1)
Title |
---|
J. R. Soc. Interface (Published online2011. 6. 29.) Vol.8:1369-1378 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170063889A (ko) * | 2014-10-07 | 2017-06-08 | 옥스포드 나노포어 테크놀로지즈 리미티드 | 변형된 효소 |
Also Published As
Publication number | Publication date |
---|---|
BR112015021788A2 (ko) | 2017-08-29 |
EP2964779B1 (en) | 2018-08-29 |
US20160010147A1 (en) | 2016-01-14 |
CN105209634A (zh) | 2015-12-30 |
JP6408494B2 (ja) | 2018-10-17 |
BR112015021788B1 (pt) | 2023-02-28 |
CN105209634B (zh) | 2020-05-12 |
US20230212665A1 (en) | 2023-07-06 |
JP2016510593A (ja) | 2016-04-11 |
AU2014224432A1 (en) | 2015-09-10 |
US11560589B2 (en) | 2023-01-24 |
CA2901545A1 (en) | 2014-09-12 |
US20190211390A1 (en) | 2019-07-11 |
WO2014135838A1 (en) | 2014-09-12 |
CA2901545C (en) | 2019-10-08 |
KR102168813B1 (ko) | 2020-10-22 |
SG11201507138RA (en) | 2015-10-29 |
EP2964779A1 (en) | 2016-01-13 |
BR112015021788A8 (pt) | 2022-08-02 |
US10221450B2 (en) | 2019-03-05 |
AU2014224432B2 (en) | 2019-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102168813B1 (ko) | 효소 정지 방법 | |
KR102280161B1 (ko) | 방법 | |
KR102558931B1 (ko) | 핵산 가이드 뉴클레아제 | |
CN106460061B (zh) | 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法 | |
KR102457147B1 (ko) | 나노 세공 rna 특징 규명을 위한 방법 | |
EP2798084B1 (en) | Enzyme method | |
EP3033435B1 (en) | Method for fragmenting nucleic acid by means of transposase | |
KR101963918B1 (ko) | 커플링 방법 | |
EP2895618B1 (en) | Sample preparation method | |
KR20140050067A (ko) | 막횡단 포어를 사용한 이중 가닥 폴리뉴클레오티드 서열분석을 위한 헤어핀 루프 방법 | |
KR20170005829A (ko) | 모기 제어를 위한 조성물 및 그의 용도 | |
EP2798083A1 (en) | Method for characterising a polynucelotide by using a xpd helicase | |
KR20130117753A (ko) | 포스포케톨라아제를 포함하는 재조합 숙주 세포 | |
AU2016295174A1 (en) | Genetic testing for predicting resistance of salmonella species against antimicrobial agents | |
AU2016295177A1 (en) | Genetic testing for predicting resistance of serratia species against antimicrobial agents | |
JP2002355074A (ja) | 腸管出血性病原性大腸菌o157:h7に特異的な核酸分子およびポリペプチド並びにこれらの使用方法 | |
AU2016296900A1 (en) | Genetic testing for predicting resistance of morganella species against antimicrobial agents | |
KR20240006496A (ko) | Omni 90-99, 101, 104-110, 114, 116, 118-123, 125, 126, 128, 129, 및 131-138 crispr 뉴클레아제 | |
KR20240052720A (ko) | 신규한 omni 117, 140, 150-158, 160-165, 167-177, 180-188, 191-198, 200, 201, 203, 205-209, 211-217, 219, 220, 222, 223, 226, 227, 229, 231-236, 238-245, 247, 250, 254, 256, 257, 260 및 262 crispr 뉴클레아제 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |