KR20210112350A - 다중 복제수 변이 검출 및 대립 유전자 비율 정량화를 위한 정량적 앰플리콘 서열분석 - Google Patents

다중 복제수 변이 검출 및 대립 유전자 비율 정량화를 위한 정량적 앰플리콘 서열분석 Download PDF

Info

Publication number
KR20210112350A
KR20210112350A KR1020217024656A KR20217024656A KR20210112350A KR 20210112350 A KR20210112350 A KR 20210112350A KR 1020217024656 A KR1020217024656 A KR 1020217024656A KR 20217024656 A KR20217024656 A KR 20217024656A KR 20210112350 A KR20210112350 A KR 20210112350A
Authority
KR
South Korea
Prior art keywords
region
umi
target
erbb2
genomic dna
Prior art date
Application number
KR1020217024656A
Other languages
English (en)
Inventor
데이비드 장
펑 다이
뤄자 우
Original Assignee
윌리엄 마쉬 라이스 유니버시티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윌리엄 마쉬 라이스 유니버시티 filed Critical 윌리엄 마쉬 라이스 유니버시티
Publication of KR20210112350A publication Critical patent/KR20210112350A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/143Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Abstract

본원에서는 중합효소 연쇄 반응에 의해 올리고뉴클레오티드 바코드 서열로 DNA 샘플에서 표적화된 게놈 유전자좌의 각 가닥을 표지하고 고-처리량 서열 분석을 위해 게놈 영역(들)을 증폭시키기 위한 정량적 앰플리콘 서열 분석 방법이 제공된다. 상기 방법은 각 유전자의 추가적인 복제 빈도를 정량화함으로써 관심 유전자 세트에서 복제수 변이(CNV)의 동시 검출에 사용할 수 있다. 또한, 상기 방법은 다중 PCR을 사용하여 표적화된 게놈 유전자좌에 대한 서로 상이한 유전적 정체성의 대립 유전자 비율의 정량화를 제공한다. 또한, 상기 방법은 변이의 검출 및 변이 대립 유전자 빈도의 정량화를 제공한다.

Description

다중 복제수 변이 검출 및 대립 유전자 비율 정량화를 위한 정량적 앰플리콘 서열분석
관련 출원에 대한 참조
본 출원은 2019년 1월 4일에 출원한 미합중국 가출원 제62/788,375호의 우선권 이익을 주장하며, 그 전체 내용은 본원에 원용된다.
미연방 정부 후원 연구에 관한 선언
본 발명은 미 국립보건원이 부여한 인가 번호 제R01 HG008752호 하의 정부지원으로 실시하였다. 상기 정부는 본 발명에 대한 특정한 권리를 갖는다.
서열 목록에 대한 참조
본 출원은 EFS-Web을 통해 ASCII 형식으로 제출되고 본원에 그 전체가 원용되는 서열 목록을 포함한다. 2019년 11월 26일에 생성된 상기 ASCII 사본의 명칭은 RICEP0058WO_ST25.txt이며 크기는 145.6KB이다.
본 발명은 일반적으로 분자 생물학 및 의학 분야에 관한 것이다. 보다 상세하게는, 본 발명은 정량적 앰플리콘 서열분석을 이용한 다중 복제수 변이 검출 및 대립 유전자 비율 정량화를 위한 조성물 및 방법에 관한 것이다.
복제수 변이(CNV)는 암 형성 및 진행에 기여하는 중요한 암 바이오마커이다. 상기 복제수 변이(CNV)는 암 유형에 따라 3%에서 98% 사이로 상당한 비율의 종양에 존재한다. 많은 복제수 변이(CNV)는 표적 요법에 대한 민감성 또는 내성을 부여한다. 예를 들어, MET 증폭은 비소세포 폐암에서 MET TKI에 대한 민감성을 증가시키고 PTEN 결실은 흑색종에서 BRAF 억제제 내성을 부여한다. 종양 샘플에서, 특정 유전자의 복제수 변이(CNV)는 종양 이질성 및 정상 세포 오염으로 인해 세포의 작은 부분(<10%)에만 존재할 수 있다.
돌연변이 및 삽입-결실과 달리, 복제수 변이(CNV)는 고유한 서열이 없으므로 복제수 변이(CNV)를 검출하려면 정확한 정량화가 필요하다. 상기 정량화는 DNA 분자 샘플링의 확률성으로 인해 어렵다. 예를 들어, 유전자좌당 1200개 분자를 샘플링하는 표준 편차(σ)(즉, 600개의 정상 세포로부터 1200개의 반수체 게놈 복제, 4 ng의 게놈 DNA)는 푸아송(Poisson) 분포로 추정할 수 있다: σ =
Figure pct00001
= 35, 분자수의 3%에 해당함. 이 경우, 추가 복제의 1%를 감지하는 것은 불가능하다. 이론적으로, 입력 분자의 수를 늘리거나 또는 더 많은 유전자좌를 분석하면 분산이 동일하게 줄어들 수 있으며 σ는 σ =
Figure pct00002
로 추정할 수 있다. 게놈 복제 수 또는 유전자좌 수가 100배 증가하면, σ는 0.3%로 감소하고 추가 복제의 1%가 검출 가능하게 된다.
분자 진단에서 복제수 변이(CNV) 검출을 위한 현재 표준 방법은 인시투 혼성화(in situ hybridization, ISH)로서, 적은 수의 세포 관찰을 기초로 복제수 변이(CNV) 상태를 측정할 수 있다. 하지만, 인시투 혼성화(ISH) 기술은 형광 및 명시야 현미경 모두에서 구별가능한 색상의 수가 제한되기 때문에 여러 게놈 영역을 동시에 분석할 수 있는 능력이 부족하다. 또한, 인시투 혼성화(ISH)는 전문 실험실에서 실시해야 하는 복잡한 공정이므로, 널리 채택되지 않는다.
복제수 변이(CNV) 검출을 위한 다른 방법은 DNA 분자의 절대 정량화를 위한 PCR 기반 방법인 미세방울 디지털 PCR(ddPCR)이다. 하지만, 복제수 변이(CNV)에 대한 검출 한계(LoD)는 다수의 반복 실험을 통한 약 20% 추가 복제이다. 인시투 혼성화(ISH)와 마찬가지로, 미세방울 디지털 PCR(ddPCR)도 제한된 수의 형광 채널로 인해 다중화될 수 없는 문제가 있다. 어레이 비교 게놈 혼성화 및 SNP 어레이를 포함한 마이크로어레이 기반 방법은 대형 복제수 변이(CNV) 및 이수성의 선별에 사용되는 고도로 다중화된 방법이다. 하지만, 상기 방법은 40kb 미만의 더 작은 복제수 변이(CNV) 또는 추가 복제의 30% 미만의 저주파 CNV를 감지하는 데 좋지 않다.
차세대 서열 분석(NGS)은 고-처리량의 기술로 지난 10년 동안 비용이 급격히 감소하였다. 차세대 서열 분석(NGS)은 암 분자 진단 분야에서 인기가 있다. 0.1% 미만의 변이 대립 유전자 빈도의 검출 한계(LoD)를 갖는 고도로 다중화된 돌연변이 검출이 달성되었고 차세대 서열 분석(NGS) 플랫폼에서 상업화되었다. 하지만, 복제수 변이(CNV) 검출을 위한 차세대 서열 분석(NGS) 방법의 현재 검출 한계(LoD)는 좋지 않다. 전장엑솜 서열 분석(whole-exome sequencing, WES)은 약 30%의 추가 복제 수준에서 복제수 변이(CNV) 발견에 사용되었지만, 비용이 많이 들고, 낮은 검출 한계(LoD)를 달성하기 위해서는 훨씬 더 많은 차세대 서열 분석(NGS) 판독(비용의 비례적인 증가)이 필요하다. 파운데이션원(FoundationOne)의 상업용 패널과 같은 더 작은 교잡-포획(hybrid-capture) 패널은 더 낮은 비용으로 약 30%의 추가 복제의 검출 한계(LoD)에 도달할 수 있다.
진단용 차세대 서열 분석(NGS) 패널에서, 관련 없는 게놈 영역에서 낭비되는 차세대 서열 분석(NGS) 판독을 줄이기 위해서는 표적 농축이 필요하다. 표적 농축을 위한 두 가지 인기 있는 방법은 교잡-포획 및 다중화 PCR이다. 현재 차세대 서열 분석(NGS) 기반 복제수 변이(CNV) 패널은 대부분 교잡-포획 기반이며, 이는 표적 영역이 비오틴화된 핵산 프로브에 의해 캡처되고 스트렙타비딘 자기 비드를 사용하여 게놈의 나머지 부분으로부터 분리됨을 의미한다. 교잡-포획 패널은 패널 크기가 작을 때 표적 적중률이 낮으므로, 대부분의 패널은 100kb 초과(즉, 1000 초과의 프로브 또는 유전자좌)이다. 이는 비드 표면, 프로브 및 캡처된 표적에 원치 않는 DNA의 비특이적 결합 때문이다. 많은 수의 유전자좌로 인해, 교잡-포획 패널의 적용 범위는 균일하지 않다. 95% 및 5% 백분위수 유전자좌는 적어도 30배의 차이가 나며, 이는 정량화에서 또 다른 편향층을 유발한다. 교잡-포획(hybrid-capture) 패널은 또한 불완전한 말단-수복 및 결찰로 인한 낮은 전환율(즉, 서열 분석된 입력 분자의 백분율)로 인해 편향된 샘플링 처리를 유발하고 변이를 발생시킨다.
본원에서는 중합효소 연쇄 반응에 의해 올리고뉴클레오티드 바코드 서열로 DNA 샘플에서 표적화된 게놈 유전자좌의 각 가닥을 표지하고 고-처리량 서열 분석을 위해 게놈 영역(들)을 증폭시키기 위한 정량적 앰플리콘 서열 분석 방법이 제공된다. 상기 방법은 각 유전자의 추가적인 복제 빈도를 정량화함으로써 관심 유전자 세트에서 복제수 변이(CNV)의 동시 검출에 사용할 수 있다. 또한, 상기 방법은 다중 PCR을 사용하여 표적화된 게놈 유전자좌에 대한 서로 상이한 유전적 동일성의 대립 유전자 비율의 정량화를 제공한다.
일 구현예에서, 본원에서는 고-처리량 서열 분석을 위한 게놈 DNA의 표적화된 영역을 제조하는 방법을 제공하며, 상기 방법은: (a) 게놈 DNA 샘플을 수득하는 단계; (b) (i) 5'에서 3’ 방향으로 제1 영역, 0 내지 50개의 뉴클레오티드(예컨대, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 뉴클레오티드)의 길이를 갖는 제2 영역, 적어도 4개의 축퇴 뉴클레오티드(예컨대, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개의 축퇴 뉴클레오티드)를 포함하는 제3 영역, 및 제1 표적 게놈 DNA 영역에 상보적인 서열을 포함하는 제4 영역을 포함하는 제1 올리고뉴클레오티드; 및 (ii) 5'에서 3’ 방향으로 제5 영역, 0 내지 50개의 뉴클레오티드(예컨대, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 뉴클레오티드)의 길이를 갖는 제6 영역, 및 제2 표적 게놈 DNA 영역에 상보적인 서열을 포함하는 제7 영역을 포함하는 제2 올리고뉴클레오티드를 사용하여 2회 주기의 PCR을 실시하여 게놈 DNA 샘플의 적어도 일부를 증폭시키는 단계; (c) 단계 (b)에서 사용된 어닐링 온도보다 0~10℃(예컨대, 1~10, 2~10, 3~10, 4~10, 5~10, 1~9, 1~ 8, 1~7, 1~6, 1~5, 2~9, 2~8, 2~7℃ 또는 그 안에서 유도 가능한 임의의 범위 또는 값) 더 높은 어닐링 온도로 적어도 3회 주기의 PCR을 실시하고 (i) 상기 제1 영역의 적어도 일부의 역 보체에 혼성화될 수 있는 서열을 포함하는 제3 올리고뉴클레오티드; 및 (ii) 상기 제5 영역의 적어도 일부의 역 보체에 혼성화될 수 있는 서열을 포함하는 제4 올리고뉴클레오티드를 사용하여 단계 (b)의 생성물을 증폭시키는 단계; 및 (d) 5'에서 3’ 방향으로 제8 영역, 0 내지 50개의 뉴클레오티드(예컨대, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 뉴클레오티드)의 길이를 갖는 제9 영역, 및 제3 표적 게놈 DNA 영역에 상보적인 서열을 포함하는 제10 영역을 포함하는 제5 올리고뉴클레오티드를 사용한 적어도 1회 주기의 PCR을 실시하여 상기 단계 (c)의 생성물을 증폭시키는 단계로서, 여기서 상기 제3 표적 게놈 DNA 영역은 상기 제2 표적 게놈 DNA 영역보다 상기 제1 표적 게놈 DNA 영역에 더 가까운 적어도 하나의 뉴클레오티드인 단계를 포함하는 방법이 제공된다.
일부 양태들에서, 상기 방법은 고-처리량 서열 분석을 위한 게놈 DNA의 1 내지 10,000개의 표적화된 영역(예컨대, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 250, 500, 750, 1,000, 2,000, 3,000, 4,000 또는 5,000 및 최소 10,000, 9,000, 8,000, 7,000, 6,000, 5,000, 4,000, 3,000, 2,000, 1,000, 750, 500, 250, 100, 75 또는 50개의 표적화된 영역, 또는 그 안에서 유도 가능한 임의의 범위 또는 값)을 제조하는 방법이다. 일부 양태들에서, 상기 제3 영역은 고유 분자 식별자(UMI)이다. 일부 양태들에서, 상기 제3 표적 게놈 DNA 영역은 상기 제2 표적 게놈 DNA 영역보다 상기 제1 표적 게놈 DNA 영역에 더 가까운 1~10개(예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개)의 염기이다. 일부 양태들에서, 상기 제1 영역 및 상기 제8 영역은 범용 프라이머 결합 부위이다. 일부 양태들에서, 상기 제1 영역 및 상기 제8 영역은 전체 또는 부분 차세대 서열 분석(NGS) 어댑터 서열을 포함한다. 일부 양태들에서, 상기 제5 영역은 인간 게놈에서 발견될 수 없는 서열을 포함한다. 일부 양태들에서, 상기 제5 영역은 차세대 서열 분석(NGS) 어댑터 서열과 상이한 서열을 포함한다. 일부 양태들에서, 상기 제1 영역 및 상기 제5 영역의 용융 온도들은 상기 제4 영역 및 상기 제7 영역의 용융 온도들보다 0~10°C(예컨대, 1~10, 2~10, 3~10, 4~10, 5~10, 1~9, 1~ 8, 1~7, 1~6, 1~5, 2~9, 2~8, 2~7℃ 또는 그 안에서 유도 가능한 임의의 범위 또는 값) 더 높다. 일부 양태들에서, 상기 제3 영역의 축퇴 뉴클레오티드는 각각 독립적으로 A, T 또는 C 중 하나이다. 일부 양태들에서, 상기 제3 영역의 축퇴 뉴클레오티드 중 어느 것도 G가 아니다. 일부 양태들에서, 각각 고유한 제3 영역을 갖는 제1 올리고뉴클레오티드 군이 존재한다.
일부 양태들에서, 상기 방법은 단계 (c)의 생성물을 정제하는 단계를 추가로 포함한다. 일부 양태들에서, 상기 정제 단계는 SPRI 정제 또는 컬럼 정제를 포함한다. 일부 양태들에서, 상기 방법은 단계 (d)의 생성물을 정제하는 단계를 추가로 포함한다. 일부 양태들에서, 상기 정제 단계는 SPRI 정제 또는 컬럼 정제를 포함한다. 일부 양태들에서, 상기 방법은 상기 제1 영역 및 상기 제8 영역에 혼성화되는 프라이머들을 사용하는 PCR에 의해 상기 단계 (d)의 생성물을 증폭시키는 단계로서, 여기서 상기 프라이머들은 차세대 서열 분석을 위한 인덱스 서열을 포함하는 단계 (e)를 추가로 포함한다. 일부 양태들에서, 상기 방법은 상기 단계 (e)의 생성물을 정제하는 단계를 추가로 포함한다. 일부 양태들에서, 상기 정제 단계는 SPRI 정제 또는 컬럼 정제를 포함한다. 일부 양태들에서, 상기 방법은 상기 단계 (e)의 생성물의 고-처리량 DNA 서열 분석을 실시하는 단계 (f)를 추가로 포함한다. 일부 양태들에서, 고-처리량 DNA 서열 분석은 차세대 서열 분석을 포함한다.
일부 양태들에서, 상기 제1 표적 게놈 DNA 영역 및 상기 제2 표적 게놈 DNA 영역은 상기 게놈 DNA의 반대 가닥들 상에 있다. 일부 양태들에서, 상기 제1 표적 게놈 DNA 영역 및 상기 제2 표적 게놈 DNA 영역은 40개의 뉴클레오티드 내지 500개의 뉴클레오티드(예컨대, 40, 45, 50, 55, 60, 65, 70, 75, 80, 90, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 또는 500개의 뉴클레오티드, 또는 그 안에서 유도 가능한 임의의 값)에 의해 분리된다. 일부 양태들에서, 상기 단계 (b)는 약 30분(예컨대, 27, 28, 29, 30, 31, 32 또는 33분)의 연장 시간을 포함한다. 일부 양태들에서, 상기 단계 (c)는 약 30분(예컨대, 27, 28, 29, 30, 31, 32 또는 33초)의 연장 시간을 포함한다. 일부 양태들에서, 상기 단계 (d)는 약 30분(예컨대, 27, 28, 29, 30, 31, 32 또는 33분)의 연장 시간을 포함한다.
일 양태에서, 본원에서는 적어도 하나의 표적 유전자의 추가 복제의 빈도(FEC)를 정량화하는 방법이 제공되고, 상기 방법은: (a) 게놈 DNA 샘플을 수득하는 단계; (b) 본 구현예들 중 임의의 한 구현예의 방법에 따른 고-처리량 서열 분석을 위한 게놈 DNA를 제조하는 단계로서, 여기서 상기 제4 영역, 상기 제7 영역 및 상기 제10 영역의 서열들은 상기 적어도 하나의 표적 유전자에 혼성화되는 단계; (c) 본 구현예들 중 임의의 한 구현예의 방법에 따른 고-처리량 서열 분석을 실시하는 단계; 및 (d) 상기 단계 (c)에서 수득한 서열 분석 정보를 기초로 적어도 하나의 표적 유전자에 대한 추가 복제의 빈도(FEC)를 계산하는 단계를 포함하는 방법이 제공된다.
일부 양태들에서, 상기 방법은 표적 유전자 세트에 대한 추가 복제의 빈도(FEC)를 정량화하는 방법이며, 여기서 상기 표적 유전자 세트는 2 내지 1000개의 표적 유전자(예컨대, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 250, 500 또는 750개, 및 최대 1,000, 900, 800, 750, 700, 650, 600, 550, 500, 450, 400, 350, 300, 250, 200, 150, 100, 75, 50, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4 또는 3개의 표적화된 영역, 또는 그 안에서 유도 가능한 임의의 범위 또는 값)를 포함한다. 일부 양태들에서, 상기 단계 (b)는 제1 올리고뉴클레오티드 군, 제2 올리고뉴클레오티드 군, 및 제5 올리고뉴클레오티드 군을 사용하여 실시되고, 여기서 상기 제1, 제2 및 제5 올리고클레오티드 군의 각각의 일부는 표적 유전자 세트 중 하나에 상보적인 제4, 제7 및 제10 영역들을 포함한다. 일부 양태들에서, 상기 제4, 제7 및 제10 영역들의 각각은 인간 게놈에서 단 한번만 발견되는 서열들을 포함한다. 일부 양태들에서, 하나의 표적 유전자에 혼성화되는 각각의 제1 올리고뉴클레오티드는 동일한 표적 유전자에 혼성화되는 제1 올리고뉴클레오티드 서로에 비해 고유한 제3 영역을 갖는다. 일부 양태들에서, 상기 단계 (b)는 참조 유전자에 상보적인 제4, 제7 및 제10 영역들을 각각 포함하는 제1 올리고뉴클레오티드, 제2 올리고뉴클레오티드, 및 제5 올리고뉴클레오티드를 사용하여 실시된다. 일부 양태들에서, 상기 단계 (b)는 고-처리량 서열 분석을 위한 각각의 표적 유전자 또는 참조 유전자의 일부를 제조하고, 여기서 상기 부분은 40개의 뉴클레오티드 내지 500개의 뉴클레오티드(예컨대, 40, 45, 50, 55, 60, 65, 70, 75, 80, 90, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 또는 500개의 뉴클레오티드, 또는 그 안에서 유도 가능한 임의의 값)의 길이를 갖는다. 일부 양태들에서, 추가 복제의 빈도(FEC)는 하기와 같이 정의된다:
Figure pct00003
.
일부 양태들에서, 상기 단계 (d)는: (i) 차세대 서열 분석(NGS) 판독물을 각 표적 유전자의 표적화된 부분들에 정렬하고 상기 NGS 판독물이 정렬되는 유전자좌를 기초로 하위군으로 분류하는 단계; (ii) 동일한 UMI 서열을 수반하는 모든 NGS 판독물이 하나의 UMI 패밀리로 분류되도록 UMI 서열을 기초로 각 유전자좌에서 NGS 판독물을 나누는 단계; (iii) PCR 오류 또는 NGS 오류로 인한 UMI 패밀리들을 제거하는 단계; (iv) 각 유전자좌에서 고유한 UMI 서열의 수를 세는 단계; 및 (v) 각 표적 유전자 및 참조 유전자의 각 유전자좌에 대한 고유한 UMI 서열의 수를 기초로 추가 복제의 빈도(FEC)를 계산하는 단계를 포함한다. 일부 양태들에서, 상기 단계 (d)(iii)는 UMI 축퇴 기반 설계를 충족하지 않는 UMI 서열들을 제거하는 단계를 포함한다. 일부 양태들에서, 상기 단계 (d)(iii)는 Fmin보다 작은 UMI 패밀리 크기를 갖는 UMI 패밀리들을 제거하는 단계를 포함하고, 여기서 상기 UMI 패밀리 크기는 동일한 UMI를 수반하는 판독물의 수이고, 여기서 Fmin은 2 내지 20 사이(예컨대, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20)이다. 일부 양태들에서, 상기 단계 (d)(iv)는 더 큰 패밀리 크기를 갖는 다른 UMI 서열로부터 단지 1 또는 2개의 염기만큼 상이한 UMI 서열들을 제거하는 단계를 포함한다.
일부 양태들에서, 추가 복제의 빈도(FEC)는 하기와 같이 정의된다:
Figure pct00004
,
여기서
Figure pct00005
은 표적 유전자 유전자좌의 전체 또는 일부에 대한 고유한 UMI 수의 합이고,
Figure pct00006
은 고려할 유전자좌의 수이고,
Figure pct00007
은 상기 표적 유전자에서 유전자좌의 전체 수 이하이고;
Figure pct00008
은 참조 유전자좌의 전체 또는 일부에 대한 고유한 UMI 수의 합이고,
Figure pct00009
은 하나의 기준에 대하여 고려할 유전자좌의 수이고,
Figure pct00010
은 상기 기준에서 유전자좌의 전체 수 이하이고;
Figure pct00011
은 고려할 기준의 수이고,
Figure pct00012
은 기준의 전체 수 이하이며;
Figure pct00013
은 실험 보정에 의해 결정된다. 일부 양태들에서, 상기 추가 복제의 빈도(FEC)를 사용하여 상기 표적 유전자의 복제 수 변이(CNV) 상태를 확인한다.
일 구현예에서, 본원에서는 적어도 하나의 표적 게놈 유전자좌에 대한 상이한 유전적 동일성의 대립 유전자 비율을 정량화하는 방법이 제공되고, 상기 방법은: (a) 게놈 DNA 샘플을 수득하는 단계; (b) 본 구현예들 중 임의의 한 구현예의 방법에 따른 고-처리량 서열 분석을 위한 게놈 DNA를 제조하는 단계로서, 여기서 상기 제4 영역, 상기 제7 영역 및 상기 제10 영역의 서열들은 상기 적어도 하나의 표적 유전자좌에 가까운 게놈 DNA에 혼성화되는 단계; (c) 본 구현예들 중 임의의 한 구현예의 방법에 따른 고-처리량 서열 분석을 실시하는 단계; 및 (d) 상기 단계 (c)에서 수득한 서열 분석 정보를 기초로 적어도 하나의 표적 게놈 유전자좌에 대한 상이한 유전적 동일성의 대립 유전자 비율을 계산하는 단계를 포함한다.
일부 양태들에서, 상기 방법은 표적 게놈 유전자좌 세트에 대한 상이한 유전적 동일성의 대립 유전자 비율을 정량화하는 방법이며, 여기서 상기 표적 게놈 유전자좌 세트는 2 내지 10,000개의 표적 게놈 유전자좌(예컨대, 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 75, 100, 250, 500, 750, 1,000, 2,000, 3,000, 4,000 또는 5,000 및 최대 10,000, 9,000, 8,000, 7,000, 6,000, 5,000, 4,000, 3,000, 2,000, 1,000, 750, 500, 250, 100, 75 또는 50개의 표적 게놈 유전자좌, 또는 그 안에서 유도 가능한 임의의 범위 또는 값)를 포함한다. 일부 양태들에서, 상기 단계 (b)는 제1 올리고뉴클레오티드 군, 제2 올리고뉴클레오티드 군, 및 제5 올리고뉴클레오티드 군을 사용하여 실시되고, 여기서 상기 제1, 제2 및 제5 올리고뉴클레오티드 군들의 각각의 일부는 상기 표적 게놈 유전자좌 세트 중 적어도 하나에 가까운 게놈 DNA에 상보적인 제4, 제7 및 제10 영역들을 각각 포함한다. 일부 양태들에서, 상기 제4, 제7 및 제10 영역들의 각각은 상기 단계 (b)의 조건하에서 상기 게놈 DNA의 비-표적 영역들과 혼성화될 수 없는 서열들을 포함한다. 일부 양태들에서, 하나의 표적 게놈 유전자좌에 가까운 상기 게놈 DNA에 혼성화되는 각각의 제1 올리고뉴클레오티드는 동일한 표적 게놈 유전자좌에 가까운 게놈 DNA에 혼성화되는 제1 올리고뉴클레오티드 서로에 비해 고유한 제3 영역을 갖는다. 일부 양태들에서, 각각의 표적 게놈 유전자좌는 40개의 뉴클레오티드 내지 500개의 뉴클레오티드(예컨대, 40, 45, 50, 55, 60, 65, 70, 75, 80, 90, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 또는 500개의 뉴클레오티드, 또는 그 안에서 유도 가능한 임의의 값)의 길이를 갖는다.
일부 양태들에서, 상기 단계 (d)는: (i) 차세대 서열 분석(NGS) 판독물을 표적화된 게놈 유전자좌에 정렬하고 상기 NGS 판독물이 정렬되는 유전자좌를 기초로 하위군으로 분류하는 단계; (ii) 동일한 UMI 서열을 수반하는 모든 NGS 판독물이 하나의 UMI 패밀리로 분류되도록 UMI 서열을 기초로 각 유전자좌에서 NGS 판독물을 나누는 단계; (iii) PCR 오류 또는 NGS 오류로 인한 UMI 패밀리들을 제거하는 단계; (iv) 각각의 남은 UMI 패밀리의 유전적 동일성을 호출하는 단계; (v) 각 유전자좌에서 고유한 UMI 서열의 수를 세는 단계; 및 (vi) 대립 유전자 비율을 계산하는 단계를 포함한다. 일부 양태들에서, 상기 단계 (d)(iii)는 UMI 축퇴 기반 설계를 충족하지 않는 UMI 서열들을 제거하는 단계를 포함한다. 일부 양태들에서, 상기 단계 (d)(iii)는 Fmin보다 작은 UMI 패밀리 크기를 갖는 UMI 패밀리들을 제거하는 단계를 포함하고, 여기서 상기 UMI 패밀리 크기는 동일한 UMI를 수반하는 판독물의 수이고, 여기서 Fmin은 2 내지 20 사이(예컨대, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20)이다. 일부 양태들에서, 상기 단계 (d)(iii)는 더 큰 패밀리 크기를 갖는 다른 UMI 서열로부터 단지 1 또는 2개의 염기만큼 상이한 UMI 서열들을 제거하는 단계를 포함한다. 일부 양태들에서, 상기 단계 (d)(iv)는 UMI 패밀리의 판독물의 70% 이상(예컨대, 70%, 75%, 80%, 85%, 90%, 95%, 또는 98%)이 관심 유전자좌에서 동일한 경우에만 유전적 동일성을 호출하는 것을 포함한다. 일부 양태들에서, 상기 대립 유전자 비율은 R 대립유전자 = N 1 /N 2로 정의되고, 여기서 N 1은 제1 유전적 동일성에 대한 고유한 UMI 번호이며, N 2는 제2 유전적 동일성에 대한 고유한 UMI 번호이다.
일부 양태들에서, 상기 단계 (d)(iv)는 각 UMI 패밀리의 공통 서열을 식별하는 단계를 포함한다. 일부 양태들에서, 상기 공통 서열은 상기 UMI 패밀리에서 가장 많은 수로 출현하는 서열이다. 일부 양태들에서, 상기 단계 (d)(iv)는 상기 공통 서열을 해당 유전자좌에 대한 야생형 서열과 비교함으로써 공통 서열에서 돌연변이를 확인하는 단계를 추가로 포함한다. 일부 양태들에서, 상기 방법은 상기 확인된 돌연변이의 변이 대립 유전자 빈도(VAF)를 계산하는 단계를 추가로 포함한다. 일부 양태들에서, 상기 확인된 돌연변이의 변이 대립 유전자 빈도(VAF)는 돌연변이를 갖는 UMI 패밀리의 수/UMI 패밀리의 전체 수로 정의된다.
본원에서 사용된 바와 같이, 특정 성분에 대하여 “본질적으로 없는”이라는 용어는 특정 성분의 그 어떤 것도 조성물로 의도적으로 제형화되지 않았고/않았거나 단지 오염물질로서 존재하거나 극소량 존재한다는 것을 의미하는 것으로 본원에서 사용된다. 따라서, 조성물의 임의의 의도치않은 오염으로부터 기인한 특정 성분의 총량은 0.05% 보다 훨씬 낮고, 바람직하게는 0.01% 미만이다. 상기 특정 성분의 그 어떤 양도 표준 분석 방법으로 검출될 수 없는 조성물이 가장 바람직하다.
본원에서 사용된 단수 표현("a" 또는 "an")은 하나 이상을 의미할 수 있다. 본원의 청구범위(들)에서 사용된 바와 같이, 단어 “포함하는”과 함께 사용될 때, 단수 표현(“a” 또는 “an)은 하나 또는 하나 초과를 의미할 수 있다.
비록 본 개시가 단지 대안들과 "및/또는"을 나타내는 정의를 택하고 있지만, 청구범위에서 용어 "또는"의 사용은 분명하게 대안만을 지칭하는 것으로 나타내지 않거나 또는 상기 대안들이 상호배타적이지 않은 한 "및/또는"을 의미하기 위해 사용된다. 본원에서 사용된 "또 다른"은 적어도 두 번째 또는 그 이후의 것들을 의미할 수 있다.
본 출원의 전반에 걸쳐, 용어 "약"은 수치가 장치, 상기 수치를 측정하기 위해 사용된 방법, 또는 연구 대상체 중에 존재하는 변화에 대한 고유한 오차 변동을 포함함을 나타내기 위해 사용된다.
본 발명의 기타 목적, 특징 및 이점은 하기의 상세한 설명으로부터 명백해질 것이다. 하지만, 당해 분야의 숙련가에게는 본 발명의 사상 및 범위 내에서 다양한 변화와 변형이 상세한 설명으로부터 명백해질 것이기 때문에, 상세한 설명 및 특정한 예시가, 본 발명의 바람직한 구현예를 나타내긴 하지만, 단지 예시의 방식으로 제공됨이 이해되어야 한다.
하기의 도면은 본 명세서의 부분을 이루며 본 발명의 특정 양태를 추가로 설명하기 위해 포함된다. 본 발명은 본원에 제시된 특정 구현예의 상세한 설명과 함께 상기 도면들 중 하나 이상을 참조하여 보다 잘 이해될 수 있다.
도 1. QASeq 프라이머 설계 및 실험 워크플로우의 개략도. 각 프라이머 세트는 특이적 정방향 프라이머(SfP), 특이적 역방향 프라이머 A(SrPA) 및 특이적 역방향 프라이머 B(SrPB)의 3가지 상이한 올리고를 포함한다. 각 QASeq 패널은 범용 정방향 프라이머(UfP) 및 범용 역방향 프라이머(UrP)를 하나씩만 필요로 한다. 범용 정방향 프라이머(UfP) 또는 범용 역방향 프라이머(UrP)에서 영역 1 또는 영역 5의 5'-말단에 추가 염기가 존재할 수 있다. 한 가지 권장되는 워크플로우의 경우, DNA 샘플은 먼저 모든 특이적 정방향 프라이머(SfP), 특이적 역방향 프라이머 A(SrPA), DNA 중합효소, dNTP 및 PCR 버퍼와 혼합된다. 모든 표적 유전자좌에 UMI를 추가하기 위해 2회 주기의 긴 연장 PCR이 실시된다. 다음으로, 동일한 원래 분자 상에 다중 UMI가 추가되는 것을 방지하면서 분자를 증폭시키기 위해, 범용 정방향 프라이머(UfP) 및 범용 역방향 프라이머(UrP)를 사용하여 약 7회 주기 동안 PCR 증폭에서 어닐링 온도를 약 8ºC 올리고(짧은 연장, 약 30초), 반응에 범용 정방향 프라이머(UfP) 및 범용 역방향 프라이머(UrP)를 추가하는 것은 열순환기의 개방형 튜브 단계임을 유념한다. SPRI 자기 비드 또는 컬럼을 사용하여 정제한 후, 어댑터 교체를 위해 SrPB 프라이머, DNA 중합효소, dNTP 및 PCR 버퍼를 PCR 생성물과 혼합한다. 2회 주기의 긴 연장(약 30분) 후에, 차세대 서열 분석(NGS) 어댑터는 프라이머 이합체 또는 비특이적 생성물이 아닌 올바른 PCR 생성물에만 추가된다. SPRI 자기 비드 또는 컬럼을 사용한 다른 정제 후, 표준 차세대 서열 분석(NGS) 인덱스 PCR이 실시되고, 라이브러리가 정규화되며 일루미나 서열 분석기(illumina sequencer) 상에 로드된다.
도 2. UMI 교차-결합 에너지의 시뮬레이션. UMI 서열로서 (N)20 또는 (SWW)6SW 대신에 (H)20을 사용하면, 평균 교차-결합 에너지가 감소하여 프라이머-이합체 상호작용이 더 적음을 나타낸다. 여기서 각 UMI 패턴에 대해 500번의 시뮬레이션이 실시되었고, 각 시뮬레이션에서 상기 패턴과 일치하는 2개의 서열이 무작위로 생성되었으며, 상기 서열들 간의 교차-결합 Gº는 60ºC 및 0.18 M K+를 가정하여 계산되었다.
도 3a-b. 프라이머 및 UMI 사이의 스페이서는 PCR 편향성을 감소시킨다. (도 3a) 프라이머 및 UMI 사이의 스페이서의 유의성을 평가하기 위한 워크플로우 스페이서를 포함하지 않거나(세트 1), 정방향 프라이머 및 UMI 사이에 5 nt 스페이서를 포함하고 역방향 프라이머 및 UMI 사이에 5 nt 스페이서를 포함하거나(세트 2), 또는 정방향 프라이머 및 UMI 사이에 12 nt 스페이서를 포함하고 역방향 프라이머 및 UMI 사이의 11 nt 스페이서를 포함하는(세트 3) 프라이머 3 세트를 사용하여 입력 분자들을 개별적으로 증폭시켰다. 일루미나(Illumina) MiSeq에 의한 NGS 분석 전에 인덱스가 추가되었다. (도 3b) 상기 프라이머 3 세트에 대한 실험적 UMI 패밀리 크기 분포 히스토그램. UMI 설계 패턴과 일치하지 않는 UMI 서열이 제거되었다.
도 4a-b. 복제수 변이(CNV)에 대한 UMI 기반 절대 정량화를 위한 데이터 분석. (도 4a) 복제수 변이(CNV) 검출을 위한 데이터 분석 워크플로우. FASTQ 출력 파일의 차세대 서열 분석(NGS) 판독물을 분석하여 복제수 변이(CNV) 상태를 결과로서 생성한다. 표적 유전자의 추가 복제의 빈도(FEC)는
Figure pct00014
로 계산되고, 여기서
Figure pct00015
는 상기 표적 유전자 유전자좌의 전체 또는 일부에 대한 고유한 UMI 수의 합이고,
Figure pct00016
은 고려할 유전자좌의 수이고;
Figure pct00017
은 참조 유전자좌의 전체 또는 일부에 대한 고유한 UMI 수의 합이고,
Figure pct00018
은 한 기준에 대하여 고려할 유전자좌의 수이고;
Figure pct00019
은 고려할 기준의 수이며;
Figure pct00020
은 실험 보정에 의해 결정된다. 복제 수 변이(CNV) 상태는 추가 복제의 빈도(FEC)에 기초하여 측정된다. (도 4b) 데이터 분석에서 UMI 패밀리 크기 및 고유 UMI 번호의 정의: UMI 패밀리 크기는 동일한 UMI 서열을 수반하는 판독물의 수이고, 고유 UMI 번호는 한 유전자좌에 있는 상이한 UMI 서열의 총 수이다.
도 5. 실험적 UMI 패밀리 크기 분포의 예. 동일한 차세대 서열 분석(NGS) 라이브러리에 있는 10개의 ERBB2 앰플리콘 및 10개의 참조 앰플리콘에 대한 UMI 패밀리 크기 분포의 예. 20-플렉스 QASeq 실험을 위한 주형 입력으로서 정상 세포주 gDNA NA18562(코리엘(Coriell)에서 구입)를 사용하였고, 입력 샘플은 2500개의 반수체 게놈 복제를 함유한다. 제조된 차세대 서열 분석(NGS) 라이브러리는 일루미나 MiSeq 시약 키트 v3(Illumina MiSeq Reagent Kit v3, 150회 주기)에 의해 150만 개의 판독물을 사용하여 서열 분석하였다. 허용 및 폐기된 UMI의 비율은 파이 차트로 나타내었다. 모든 UMI 중에서 약 20%는 PCR 또는 서열 분석 오류로 인해 폐기되고(즉, G 염기가 폴리(H) UMI에서 발견됨), 약 40%는 작은 패밀리 크기로 인해 폐기된다(≤3).
도 6. 상이한 유전자좌에 대한 실험적 고유 UMI 번호의 예. 도 5에 나타낸 데이터에 해당하는 각 유전자좌의 고유한 UMI 번호의 예: 흰색 막대는 ERBB2 앰플리콘이고 회색 막대는 참조 앰플리콘이다. 입력 샘플은 2500개의 반수체 게놈 복제를 포함한다. 제조된 차세대 서열 분석(NGS) 라이브러리는 일루미나 MiSeq 시약 키트 v3(Illumina MiSeq Reagent Kit v3, 150회 주기)에 의해 150만 개의 판독물을 사용하여 서열 분석하였다.
도 7. 정상 세포주 gDNA NA18562 및 시뮬레이션된 이론 표준 편차 한계에 대한 실험적 보정 결과. CNV 비율(σCNV비율)의 표준 편차는 입력 분자 수에 대해 표시된다. LoD는 3σCNV비율로서 근사치를 계산할 수 있다. 각각 상이한 입력량(75, 250, 750 및 2500개의 반수체 게놈 복제)에 대해 5회의 반복 실험을 실시하였고, 실험 결과는 십자 기호로 표시된다. 샘플링된 분자 수의 푸아송(Poisson) 분포를 가정하여 시뮬레이션을 실시하였고, 시뮬레이션된 σCNV비율(점선으로 표시됨)은 샘플링의 확률성으로 인한 이론적 하한치이다.
도 8a-c. FFPE 샘플에 대한 복제수 변이(CNV) 검출 실험 결과의 예. ERBB2 CNV가 발생할 가능성이 없는 동일한 종양으로부터 2개의 폐암 FFPE 슬라이드를 시험하였다. 입력 추출된 DNA 샘플은 각 차세대 서열 분석(NGS) 라이브러리에 대한 2500개의 반수체 게놈 복제를 포함한다. 제조된 차세대 서열 분석(NGS) 라이브러리는 일루미나 MiSeq 시약 키트 v3(Illumina MiSeq Reagent Kit v3, 150회 주기)에 의해 150만 개의 판독물을 사용하여 서열 분석하였다. (도 8a) 앰플리콘 ERBB2_1 및 참조_1에 대한 UMI 패밀리 크기의 예시 분포가 표시되고, 허용 및 폐기된 UMI의 비율은 파이 차트로 나타내었다. (도 8b) 각 앰플리콘 영역에 대한 예시의 고유한 UMI 번호. 흰색 막대는 ERBB2 앰플리콘이고, 회색 막대는 참조 앰플리콘이다. (도 8c) 복제수 변이(CNV) 비율은 동일한 폐암 종양으로부터 2개의 FFPE 슬라이드에 대해 표시된다. ERBB2의 CNV는 이전 보정 데이터를 기초로 QASeq를 사용하여 상기 FFPE 슬라이드에서 검출되지 않는다. 평균 및 LoD = 3σCNV비율은 750-게놈 복제 입력 세포주 gDNA 라이브러리의 데이터를 기초로 계산되고(도 7 참조), FFPE 샘플과 유사한 고유 UMI 번호를 갖는다.
도 9a-e. 1차 실험 워크플로우를 사용한 프라이머 이합체 환원. (도 9a) 시험한 가장 간단한 워크플로우는 원-포트 반응이었다. UMI 추가 후, 인덱스 프라이머는 열순환기의 개방형 튜브 단계로서 반응에 직접 추가되었고, 인덱스 PCR(즉, 범용 PCR)은 이후에 실시되었다. 상기 워크플로우의 경우, 표적 적중률(on-target)이 낮았고(0.5%). 표적을 벗어난 차세대 서열 분석(NGS) 판독물은 대부분 프라이머 이합체였다. (도 9b) 프라이머 이합체를 환원시키기 위해 범용 PCR의 6회 주기 후에 SPRI 정제 단계를 추가하였고, 표적 적중율이 20%로 향상되었다. (도 9c) 프라이머 이합체를 추가로 환원시키기 위해 인덱스 PCR 후에 아가로스 겔을 사용한 크기 선택 단계를 추가하였고, 표적 적중율은 도 9b와 비교하여 개선되었지만, 여전히 50% 미만이다. (도 9d) 범용 PCR 후 어댑터 교체 및 정제를 모두 포함하는 기본 실험 워크플로우는 66%의 높은 평균 표적 적중률을 나타낸다. (도 9e) 워크플로우 도 9a-d에서 프라이머 이합체의 원천
도 10a-c. 차세대 서열 분석(NGS) 인덱스 PCR을 요구하지 않는 예시의 워크플로우. (도 10a) 인덱스 및 P5 서열은 범용 정방향 프라이머(UfP)의 5'에 추가되고, 다른 인덱스 및 P7 서열은 특이적 역방향 프라이머 B(SrPB)의 5'에 추가된다. 어댑터 교체로부터 수득한 앰플리콘은 P5, P7 및 이중 인덱스를 포함하므로, 서열 분석할 준비가 되어 있다. (도 10b) 인덱스 및 P7 서열은 특이적 역방향 프라이머 B(SrPB)의 5'에 추가되고, 인덱스 프라이머는 어댑터 교체 단계에서 특이적 역방향 프라이머 B(SrPB)와 함께 추가된다. 앰플리콘은 서열 분석할 준비가 되어 있다. (도 10c) 인덱스 및 P5 서열은 특이적 정방향 프라이머(SfP)의 5'에 추가되고, P5 서열을 수반하는 프라이머는 범용 PCR 단계에서 범용 정방향 프라이머(UfP)로서 사용된다. 다른 인덱스 및 P7 서열은 특이적 역방향 프라이머 B(SrPB)의 5'에 추가된다. 앰플리콘은 서열 분석할 준비가 되어 있다.
도 11. QASeq 프라이머 설계 및 워크플로우의 변형. 각 프라이머 세트는 특이적 정방향 프라이머(SfP), 특이적 역방향 프라이머 A(SrPA) 및 특이적 역방향 프라이머 B(SrPB)의 3가지 상이한 올리고를 포함한다. 원래 설계에 비해, 특이적 역방향 프라이머 A(SrPA)는 주형-결합 영역만 필요하고 범용 역방향 프라이머(UrP)는 필요하지 않다. 각 QASeq 패널은 하나의 범용 정방향 프라이머(UfP)만을 필요로 하고, 범용 정방향 프라이머(UfP)에서 영역 1의 5'-말단에 추가 염기가 있을 수 있다. 원래 실험 워크플로우와 비교하여, 범용 PCR 단계에서 더 많은 PCR 주기가 필요하고, ≥10 주기가 권장된다.
도 12a-b. QASeq 기반 대립 유전자 비율 정량화를 위한 데이터 분석. (도 12a) 대립 유전자 비율 정량화를 위한 데이터 분석 워크플로우. FASTQ 출력 파일의 차세대 서열 분석(NGS) 판독물은 상이한 유전적 동일성 간의 대립 유전자 비율을 생성하기 위해 분석된다. 각 표적화된 유전자좌에 대한 대립 유전자 비율은 R 대립유전자 = N 1 /N 2으로 정의되고, 여기서 N 1은 제1 유전적 동일성에 대한 고유한 UMI 번호이며, N 2는 제2 유전적 동일성에 대한 고유한 UMI 번호이다. (도 12b) 다수결에 기초하여 각 UMI 패밀리를 호출하는 유전적 동일성.
도 13. 임상적 FFPE 샘플의 급증에 대한 복제수 변이(CNV) 검출 실험 결과의 예. 이전에 특성화된 2개의 FFPE DNA 샘플(1개의 "정상" 샘플 및 1개의 "ERBB2 증폭된 비정상" 샘플)을 혼합하여 2.5%, 5% 및 10% ERBB2 FEC 샘플을 생성하였다. "정상" 샘플의 ERBB2 FEC는 0%이고, "ERBB2 증폭 비정상" 샘플의 ERBB2 FEC는 78%이다. 실험적으로 정규화된 추가 복제의 빈도(FEC) 값은 예상되는 ERBB2 FEC에 대해 표시되었다. "정상" 샘플은 5회 반복 시험하였으며, 100-플렉스 CNV 패널의 LoD는 "정상" 샘플의 3 표준 편차로 추정되었다. 2.5%, 5% 및 10% ERBB2 FEC 샘플의 복제수 변이(CNV)는 이의 계산된 추가 복제의 빈도(FEC)가 3 표준 편차 범위를 벗어났기 때문에 성공적으로 검출되었다.
도 14. QASeq를 사용한 돌연변이 정량화를 위한 생물정보학 워크플로우. 돌연변이 정량화를 위한 데이터 처리 워크플로우의 요약을 도시하였다.
도 15. 179-플렉스 종합 패널에 대해 관찰된 분자 번호. 입력은 8.3 ng(예상 분자 수 5000)의 100% 멀티플렉스(Multiplex) I 야생형 cfDNA 참조 표준(호라이즌 디스커버리(Horizon Discovery))이었다. 전환율은 평균 62%이고, 상기 플렉스의 97%는 전환율이 >10%이다.
도 16. 179-플렉스 종합 패널의 오류율. 입력은 8.3 ng의 100% 멀티플렉스 I 야생형 cfDNA 참조 표준(호라이즌 디스커버리)이었고, 동일한 샘플을 세 번 시험하였다. 3840개의 상이한 유전자좌의 오류율(UMI를 사용한 오류 수정 후)이 표시되었다. 가장 높은 오류율은 0.23%, 0.20% 및 0.23%였으며 평균 오류율은 3회 복제에 대해 0.006%, 0.005% 및 0.005%였다.
도 17. 179-플렉스 종합 패널에 대한 돌연변이 정량화 결과. 사용된 샘플은 3회 시험된 0.3% cfDNA 참조 표준(호라이즌 디스커버리의 0.1% 멀티플렉스 I cfDNA 참조 표준 및 1% 멀티플렉스 I cfDNA 참조 표준을 혼합하여 생성)이었다. 6개 돌연변이의 실험적 VAF는 일반적으로 예상된 VAF와 일치하였고, 그 차이는 대부분 돌연변이 분자의 소수(≤9)를 샘플링할 때의 확률성 때문이었다.
본원에서는 중합효소 연쇄 반응에 의해 올리고뉴클레오티드 바코드 서열로 원래의 DNA 샘플에서 표적화된 게놈 유전자좌의 각 가닥을 표지하고 고-처리량 서열 분석을 위해 게놈 영역(들)을 증폭하기 위한 정량적 앰플리콘 서열 분석의 방법이 제공된다. 또한, 본원에서는 각 유전자의 추가적인 복제 빈도를 정량화함으로써 관심 유전자 세트에서 복제수 변이(CNV)의 동시 검출을 가능하게 하는 방법이 제공된다. 다중 PCR을 사용하여 표적화된 게놈 유전자좌에 대한 상이한 유전적 동일성의 대립 유전자 비율의 정량화가 또한 개시된 방법에 의해 제공된다. 상기 방법은 종양 샘플에서 관심 유전자(들)에 대한 복제수 변이(CNV)의 검출, 표적 요법의 선택 안내, 암 형성 및 진행의 이해를 돕는 데 적용될 수 있다.
단일 유전자 질병의 산전 진단을 위한 현재의 표준 방법은 침습적이고 위험한 융모막 채취법 또는 양수천자로부터 수득한 태아 유전 물질의 서열을 분석하는 것이다. 단일 유전자 질병의 유전적 비침습적 산전 검사(NIPT)는 모체 혈장에서 태아 유래 무세포 DNA(cfDNA)의 순환을 기초로 한다. 배경 모체 DNA의 존재로 인해, 특히 모체 DNA가 관심 유전자좌에서 이형인 경우 태아 cfDNA에서 발생하는 대립 유전자 비율 변화를 확실하게 검출하는 것이 어려워진다. 질병을 유발하는 돌연변이를 수반하는 돌연변이 대립 유전자 및 NIPT에 대한 야생형 대립 유전자 사이의 대립 유전자 비율을 정량화하기 위해 미세방울 디지털 PCR(ddPCR)이 사용되었지만(Lun et al., 2008), 상기 기술의 정밀도 및 신뢰성으로 인해 실용적인 가능성이 제한된다. QASeq는 원래 입력 분자의 각 가닥에 고유한 분자 식별자를 추가함으로써 DNA 분자의 절대 정량화를 가능하게 하며 NIPT의 대립 유전자 비율 정량화에 적용할 수 있다. 이와 같이, QASeq는 대립 유전자 비율 정량화에도 사용할 수 있다. 대립 유전자 비율 정량화는 상이한 유전적 동일성을 가진 DNA 분자의 비율을 정량화하는 것을 목표로 한다. 정확한 대립 유전자 비율 정량화는 β-지중해 빈혈 및 낭포성 섬유증과 같은 단일 유전자 질환의 NIPT의 핵심이다.
II. 복제수 변이(CNV)의 추가 복제 빈도
게놈 DNA 샘플에서 복제수 변이(CNV)의 추가 복제의 빈도(FEC)는 본원에서 하기와 같이 정의된다:
Figure pct00021
추가 복제의 빈도(FEC)의 양수 값은 샘플 내 표적 게놈 영역의 증폭을 나타내고, FEC의 음수 값은 샘플 내 표적 게놈 영역의 결실을 나타낸다.
QASeq는 추가 복제의 빈도(FEC)를 정량화하는 데 사용할 수 있지만, 종양 조직 샘플에서 복제수 변이(CNV)를 포함하는 세포의 백분율에 대한 정보를 제공하지 않는다. 예를 들어, 종양 샘플에서 1%의 세포는 4개의 ERBB2 복제를 포함하고 나머지 99%의 세포는 2개의 복제를 포함하는 경우, 추가 복제의 빈도(FEC)는 1%이고, 샘플에서 0.5%의 세포는 6개의 ERBB2 복제를 포함하고 나머지 99.5%의 세포는 2개의 복제를 포함하는 경우 FEC는 여전히 1%이다. 또한, QASeq는 추가 복제의 게놈 위치에 대한 정보를 제공하지 않는다.
III. 다중화 PCR 패널 설계
QASeq 다중 PCR 패널에서, 하나의 표적 유전자는 M (M = 1~1000) 세트의 프라이머를 필요로 하며, 각각은 표적 유전자 영역에서 비중첩 작은 영역(40 nt 내지 500 nt, 일반적으로 ≤200 nt)을 증폭시킨다. 상기 패널에 다중 표적 유전자가 있는 경우, 각 유전자에 사용되는 프라이머 세트의 수는 유사하다(
Figure pct00022
M). 상기 패널은 참조 게놈 영역을 증폭시키는 유사한 수(
Figure pct00023
M)의 프라이머 세트도 포함한다. 참조 유전자좌는 로딩된 게놈 DNA(gDNA)의 양에 대한 내부 표준 역할을 하므로, 샘플 내 DNA 농도의 정확한 정량화가 필요하지 않다. 각 패널에 대해 하나 이상의 참조 프라이머 세트를 사용할 수 있다. 표적 유전자의 입력 분자 또는 유전자좌의 수를 늘리면 무작위 샘플링의 변형을 모두 감소시킬 수 있기 때문에, 유전자당 더 많은 수의 프라이머 세트를 사용하여 더 적은 양의 DNA를 포함하는 샘플 유형의 LoD를 개선할 수 있다. 이 경우, 참조 프라이머 세트의 수를 비례적으로 늘려야 한다.
각 프라이머 세트는 특이적 정방향 프라이머(SfP), 특이적 역방향 프라이머 A(SrPA) 및 특이적 역방향 프라이머 B(SrPB)의 3가지 상이한 올리고를 포함한다(도 1을 참조). 특이적 정방향 프라이머(SfP)는 5'에서 3' 방향으로 영역 1, 2, 3 및 4를 포함한다. 영역 4는 주형-결합 영역이고, 영역 3은 UMI이고, 영역 1은 전체 또는 부분 차세대 서열 분석(NGS) 어댑터이고, 영역 2는 UMI의 균일한 증폭을 위해 추가된 선택적 스페이서 영역(일반적으로 0~15nt)이다. 특이적 정방향 프라이머(SfP)는 5'에서 3’ 방향으로 영역 5, 6 및 7을 포함한다. 영역 7은 주형-결합 영역이고, 영역 5는 범용 증폭을 위한 맞춤 어댑터(즉, 차세대 서열 분석(NGS) 어댑터와 상이하고 인간 게놈에서 찾을 수 없는 서열)이며, 영역 6은 상이한 유전자좌의 균일한 증폭을 위해 추가된 선택적 스페이서 영역(일반적으로 0~15nt)이다. 특이적 역방향 프라이머 B(SrPB)는 5'에서 3’ 방향으로 영역 8, 9 및 10을 포함한다. 영역 10는 주형-결합 영역이고, 이의 3’-말단은 영역 7보다 영역 4에 1 염기만큼 가깝고, 영역 8은 전체 또는 부분 차세대 서열 분석(NGS) 어댑터이며, 영역 9는 상이한 유전자좌의 균일한 증폭을 위해 추가된 선택적 스페이서 영역(일반적으로 0~15nt)이다. 각 QASeq 패널은 범용 정방향 프라이머(UfP) 및 범용 역방향 프라이머(UrP)를 하나씩만 필요로 한다. 범용 정방향 프라이머(UfP)는 영역 1을 포함하고, 범용 역방향 프라이머(UrP)는 영역 5를 포함하며, 범용 정방향 프라이머(UfP) 또는 정방향 프라이머(UrP)에서 영역 1 또는 영역 5의 5'-말단에 추가 염기가 있을 수 있다. 주형-결합 영역 4, 7 및 10의 용융 온도(Tm)는 PCR 어닐링 온도와 대략 동일하고, 범용 정방향 프라이머(UfP) 또는 정방향 프라이머(UrP)의 Tm은 실험적 PCR 조건에서 영역 4, 7 및 10보다 낮지 않다.
프라이머를 설계할 때, 프라이머 결합 영역에서 유의미한 소수 대립 유전자 빈도(MAF)를 갖는 단일 염기 다형성(SNP)을 피해야 프라이머의 결합 친화도가 상이한 환자 샘플의 뉴클레오티드 서열 변형에 의해 영향을 받지 않을 것이다. 또한, 프라이머가 비표적 영역의 비특이적 증폭을 잘 일으키지 않도록 전체 인간 게놈 염기 서열을 검색해야 한다.
종양 샘플의 포르말린 고정 파라핀 포매(FFPE) 표본에서 ERBB2의 복제수 변이(CNV)를 표적으로 하는 예시 패널에서, 각각 60 내지 70 nt 앰플리콘을 증폭시키는 프라이머 10세트가 ERBB2 유전자 영역에서 설계되었다. 또한, 10 세트의 참조 프라이머가 설계되었으며, 각각은 상이한 염색체로부터 상이한 하우스키핑 유전자의 영역을 증폭시킨다(표 1). 프라이머는 상기 언급한 설계 원칙을 충족하면서 프라이머 상호 작용을 최소화하기 위해 매트랩(Matlab) 코드를 사용하여 자동으로 설계되었다. 또한, 군에서 >0.2% MAF를 갖는 비병원성 단일 염기 다형성(SNP)은 피했다. 온라인 도구 프라이머-블라스트(Primer-BLAST)를 사용하여 각 프라이머 세트가 인간 게놈에서 하나의 앰플리콘만 갖도록 하였다. 프라이머 서열은 표 2에 나타내었다.
앰플리콘의 위치
앰플리콘 명칭  염색체  유전자 
ERBB2 1~10  Chr. 17  ERBB2 
참조 1  Chr. 1  PSMB2 
참조 2  Chr. 3  RPL32 
참조 3  Chr. 5  RACK1 
참조 4  Chr. 6  TBP 
참조 5  Chr. 9  VCP 
참조 6  Chr. 11  HMBS 
참조 7  Chr. 12  NACA 
참조 8  Chr. 15  B2M 
참조 9  Chr. 19  GPI 
참조 10  Chr. 20  TOP1 
예시적인 QASeq 패널의 프라이머 서열
명칭 서열 서열
번호
SfP-ERBB2-1 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAATCA
TAAAAGCTAACATATAGCCTGGG
1
SfP-ERBB2-2 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCTGACTTGGGGACACAGG 2
SfP-ERBB2-3 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTTTGCAAGATGGAGGTTGCA 3
SfP-ERBB2-4 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTTGCCCTACCAGCCTCTC 4
SfP-ERBB2-5 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCACAACTGGAATCTGACGC 5
SfP-ERBB2-6 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGCTGCGGATTGTGCG 6
SfP-ERBB2-7 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAGATATAAGGGCCAAAAGTTACACA 7
SfP-ERBB2-8 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTGCTTTGGTCTCCCTTTTTGC 8
SfP-ERBB2-9 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGAATGAAATTAAACAGGGCTTGGC 9
SfP-ERBB2-10 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAAAGAAAAAAAAAAAGAATATGGGTCCAGA 10
SfP-Ref-1 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCACAACATTTTGTCTCCGGAAAATA 11
SfP-Ref-2 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGACAAATGCCCAGAAATGGAACTTA 12
SfP-Ref-3 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHATGCGGTTTCACCATTGGC 13
SfP-Ref-4 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCCAAGGAATTGAGGAAGTTGCT 14
SfP-Ref-5 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHACTGGAATGCTGTTCCTTACAATCA 15
SfP-Ref-6 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGCCTGGATAGGCAGCTTG 16
SfP-Ref-7 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAACTCAGACTATTCAGGAATACGTTT 17
SfP-Ref-8 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTCCATCCGACATTGAAGTTGACTTA 18
SfP-Ref-9 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGAATGAAGCCCTAATCCCTTAAGC 19
SfP-Ref-10 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAGGCAGAGGAAATATCGTTGAC 20
SrPA-ERBB2-1 GGATATTCCTTTCTACTCTTTGACATCATCTATGCATGCAAAACACCACAAAC 21
SrPA-ERBB2-2 GGATATTCCTTTCTACTCTTTGACATCATCTCAGATCTGGCCCAGCACC 22
SrPA-ERBB2-3 GGATATTCCTTTCTACTCTTTGACATCATCTCCTGGCAGGCACTCTCG 23
SrPA-ERBB2-4 GGATATTCCTTTCTACTCTTTGACATCATCTCCTAAGGTCAAATCCTAGGGGG 24
SrPA-ERBB2-5 GGATATTCCTTTCTACTCTTTGACATCATCTCGGGGCTCTGGTCATTGC 25
SrPA-ERBB2-6 GGATATTCCTTTCTACTCTTTGACATCATCTTCAGCGGGTCTCCATTGTCTA 26
SrPA-ERBB2-7 GGATATTCCTTTCTACTCTTTGACATCATCTGCTTGGTGGTTAAGAGACTGTGG 27
SrPA-ERBB2-8 GGATATTCCTTTCTACTCTTTGACATCATCTCCATTTACCCCTCACAACAACCA SEQ ID NO:28
SrPA-ERBB2-9 GGATATTCCTTTCTACTCTTTGACATCATCTCGAGTAACAACAGTCACTGCTC 29
SrPA-ERBB2-10 GGATATTCCTTTCTACTCTTTGACATCATCTATGTTTTTCCATGTTCTAACACCGT 30
SrPA-Ref-1 GGATATTCCTTTCTACTCTTTGACATCATCTGCTCCAGATGGGCAGCAC 31
SrPA-Ref-2 GGATATTCCTTTCTACTCTTTGACATCATCTTTGGCAGTCTTTAAGATCCATAGAAATAC 32
SrPA-Ref-3 GGATATTCCTTTCTACTCTTTGACATCATCTACTTTGGAAGGCAGAGGCG 33
SrPA-Ref-4 GGATATTCCTTTCTACTCTTTGACATCATCTTGGAACTCGTCTCACTATTCAATTTTT 34
SrPA-Ref-5 GGATATTCCTTTCTACTCTTTGACATCATCTCTGCTTGTGGATGAGGCCATA 35
SrPA-Ref-6 GGATATTCCTTTCTACTCTTTGACATCATCTAGGCAGTCACTGTTCCTTTCC 36
SrPA-Ref-7 GGATATTCCTTTCTACTCTTTGACATCATCTATGCATTTACTTCTGAAACAGTCCTT SEQ ID NO:37
SrPA-Ref-8 GGATATTCCTTTCTACTCTTTGACATCATCTCAAGTCTGAATGCTCCACTTTTTCA 38
SrPA-Ref-9 GGATATTCCTTTCTACTCTTTGACATCATCTGTCTCATTCTAGAAAGAAGTTAACTCATTATACA 39
SrPA-Ref-10 GGATATTCCTTTCTACTCTTTGACATCATCTAGGAATCAACAAATGACAAGGCAAAT 40
SrPB-ERBB2-1 AGACGTGTGCTCTTCCGATCTCATGCAAAACACCACAAACAGTTC 41
SrPB-ERBB2-2 AGACGTGTGCTCTTCCGATCTGATCTGGCCCAGCACCTTAA 42
SrPB-ERBB2-3 AGACGTGTGCTCTTCCGATCTCTCTCGGTGGATCTGCATAACAT 43
SrPB-ERBB2-4 AGACGTGTGCTCTTCCGATCTGTCAAATCCTAGGGGGTAATACGA 44
SrPB-ERBB2-5 AGACGTGTGCTCTTCCGATCTCTGGTCATTGCAGAGACCTCT 45
SrPB-ERBB2-6 AGACGTGTGCTCTTCCGATCTTCTCCATTGTCTAGCACGGC 46
SrPB-ERBB2-7 AGACGTGTGCTCTTCCGATCTAGACTGTGGAGTCTGAAACTCAG 47
SrPB-ERBB2-8 AGACGTGTGCTCTTCCGATCTCCCCTCACAACAACCAGACG 48
SrPB-ERBB2-9 AGACGTGTGCTCTTCCGATCTGTCACTGCTCTGTAGAAAGCCT 49
SrPB-ERBB2-10 AGACGTGTGCTCTTCCGATCTATGTTCTAACACCGTGATCTGGAT 50
SrPB-Ref-1 AGACGTGTGCTCTTCCGATCTATGGGCAGCACAGTGGG 51
SrPB-Ref-2 AGACGTGTGCTCTTCCGATCTGCAGTCTTTAAGATCCATAGAAATACTCTT 52
SrPB-Ref-3 AGACGTGTGCTCTTCCGATCTCAGAGGCGAGTGGATCACTT 53
SrPB-Ref-4 AGACGTGTGCTCTTCCGATCTACTATTCAATTTTTTCCTAGAGCATCTCC 54
SrPB-Ref-5 AGACGTGTGCTCTTCCGATCTGGCCATAGAAAGGGTAGTGTTGAA 55
SrPB-Ref-6 AGACGTGTGCTCTTCCGATCTTTCCTTTCCTCCTCCTCCCAT 56
SrPB-Ref-7 AGACGTGTGCTCTTCCGATCTGCATTTACTTCTGAAACAGTCCTTAATG 57
SrPB-Ref-8 AGACGTGTGCTCTTCCGATCTAATGCTCCACTTTTTCAATTCTCTCT 58
SrPB-Ref-9 AGACGTGTGCTCTTCCGATCTATTCTAGAAAGAAGTTAACTCATTATACACAGT 59
SrPB-Ref-10 AGACGTGTGCTCTTCCGATCTACAAATGACAAGGCAAATGAGACAT 60
UfP ACACTCTTTCCCTACACGACGCTCTTCCGATCT 61
UrP CCTATGGTAGTTAAATGTACATTGGATATTCCTTTCTACTCTTTGACATCATCT 62
179-플렉스 종합 패널의 프라이머 서열
명칭 프라이머 서열 서열
번호
UfP ACACTCTTTCCCTACACGACGCTCTTCCGATCT 61
UrP CCTATGGTAGTTAAATGTACATTGGATATTCCTTTCTACTCTTTGACATCATCT 62
fP-ERBB2-1 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCTTAGACAACTACCTTTCTACGGAC 63
fP-ERBB2-10 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTGCTTTGGTCTCCCTTTTTGC 64
fP-ERBB2-11 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAAAGAAAAAAAAAAAGAATATGGGTCCAGA 65
fP-ERBB2-12 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCGAGGCGATAGGGTTAAGGG 66
fP-ERBB2-13 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTTCTAGTCGCAATTGAAGTACCAC 67
fP-ERBB2-14 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCTCACCCCTTGTCAACTTTTC 68
fP-ERBB2-15 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGTCTGGTGCTTTAGCCCAAAG 69
fP-ERBB2-16 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAAAGCAAAGCTATATTCAAGACCACAT 70
fP-ERBB2-17 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGCATTGTCTGCCAGTCCG 71
fP-ERBB2-18 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTCCTTTAGCTCGTGGAATCTCAAG 72
fP-ERBB2-19 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTGGGGCATTCCAACTAGAACT 73
fP-ERBB2-2 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHATTCCAGTGGCCATCAAAGTGT 74
fP-ERBB2-20 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGGAAAACCATTATTTGATATTAAAACAAATAGG 75
fP-ERBB2-21 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAGGAAGTATAAGAATGAAGTTGTGAAGC 76
fP-ERBB2-22 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTCCCCGCTCCCCTTCA 77
fP-ERBB2-23 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAGCCTGGGCCAGGTATACT 78
fP-ERBB2-24 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHACTCTGTCCTCTGCAGGAACT 79
fP-ERBB2-25 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGTATGGGTTTTACAAATTGCAGCAAATA 80
fP-ERBB2-26 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAAAGCATGTTTAATTTTCTCGTGGTT 81
fP-ERBB2-27 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCGTGAGGGGCCAGTGT 82
fP-ERBB2-28 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGACACAGGTCATTTTACTGTAGTATTC 83
fP-ERBB2-29 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCACCCGTTCTGACCCTC 84
fP-ERBB2-3 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAGGAAGCATACGTGATGGCT 85
fP-ERBB2-30 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHACCTGCAGTGTGCAAGGG 86
fP-ERBB2-31 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCGTCTGTGTTTCCGCTAAATC 87
fP-ERBB2-32 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAAGATCTCCAAGTACTGGGGAAC 88
fP-ERBB2-33 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTGGCCTTCACCGTCATTGAAA 89
fP-ERBB2-34 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCAGATATAAGGGCCAAAAGTTACAC 90
fP-ERBB2-35 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAGCTGGCTCTCACACTGAT 91
fP-ERBB2-36 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCACCCCTGTTCTCCGATG 92
fP-ERBB2-37 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTCCTAAATGTTAGCTTTTATTCTATAGCCT 93
fP-ERBB2-38 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAGTCTCTGCCTTCTACTCTCTACC 94
fP-ERBB2-39 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCCTTTGGTGGGTGGGG 95
fP-ERBB2-4 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGATGAGCTACCTGGAGGATGTG 96
fP-ERBB2-40 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAGCCAGTTCCCTGGTTCA 97
fP-ERBB2-41 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCCTTCAGACTATGAAAAGGTTCTAAG 98
fP-ERBB2-42 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHACAGTGCTGGCAATGTTTATCAC 99
fP-ERBB2-43 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGGTGGTTCCCAGAATTGTTG 100
fP-ERBB2-44 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTTCAAAGTTCTGGTGTCGGG 101
fP-ERBB2-45 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTGACCTGTGGGTGGAAATTTTG 102
fP-ERBB2-46 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAGAGGGTTCTGATTGCCTACAAG 103
fP-ERBB2-47 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGGATCCTCATCAAGCGACG 104
fP-ERBB2-48 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCCTTTTACAGTCAAAGTCCAAAGC 105
fP-ERBB2-49 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGGTCGTCAAAGACGTTTTTGC 106
fP-ERBB2-5 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGATGGCGCTGGAGTCCATT 107
fP-ERBB2-50 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHACCTGTCCTAAGGAACCTTCCT 108
fP-ERBB2-6 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTTTGCAAGATGGAGGTTGCA 109
fP-ERBB2-7 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTTGCCCTACCAGCCTCTC 110
fP-ERBB2-8 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCACAACTGGAATCTGACGC 111
fP-ERBB2-9 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGCTGCGGATTGTGCG 112
fP-Mut1 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGGACCCACTCCATCGAGA 113
fP-Mut2 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGAGTATTTCATGAAACAAATGAATGATGC 114
fP-Mut4 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCCGCCAGGTCTTGATGTACT 115
fP-Mut5 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTCACCATCGCTATCTGAGCAG 116
fP-Mut6 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTCGTCAAGGCACTCTTGCCTA 117
fP-mut10 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGAGTATTTGGATGACAGAAACACTTT 118
fP-mut11 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHCACACGCAAATTTCCTTCCAC 119
fP-mut12 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHCCGCTCATGATCAAACGCTCTAA 120
fP-mut13 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTCCATGATCAGGTCCACCTTCT 121
fP-mut14 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTCACTCTCTCTCTGCGCATTC 122
fP-mut15 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGTAACAAAGGCATGGAGCATCT 123
fP-mut16 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGTGGGGTGAGATTTTTGTCAACTT 124
fP-mut17 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGCAGTATCAGTAGTATGAGCAGC 125
fP-mut18 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTTCTGATGTGCTTTGTTCTGGATTT 126
fP-mut19 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTGAGCCAAATGTGTATGGGTGA 127
fP-mut20 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGTTGCACATTCCTCTTCTGCATTT 128
fP-mut21 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGGTGCATTTGTTAACTTCAGCTCTG 129
fP-mut22 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTAGGTTTCTGCTGTGCCTGAC 130
fP-mut23 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGGTGGGCTTAGATTTCTACTGACTACTA 131
fP-mut24 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTCTAGGATTCTCTGAGCATGGC 132
fP-mut25 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHACTAAATAGGAAAATACCAGCTTCATAGAC 133
fP-mut26 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHACACTCTTGTGCTGACTTACCA 134
fP-mut27 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAACATCAGGGAATTCATTTAAAGTAAATAGC 135
fP-mut28 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGGAACCAAATGATACTGATCCATTAGATTC 136
fP-mut29 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGATTCTAAACTGCCAAGTCATGC 137
fP-mut30 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTGCCTGTAGTAATCAAGTGTCTCATTT 138
fP-mut31 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHCAACCAAAGTCTTTGTTCCACCTT 139
fP-mut32 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGACATCATCTGGATTATACATATTTCGC 140
fP-mut33 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAAAGAGCTAACATACAGTTAGCAGC 141
fP-mut34 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTTCCATTCTAGGACTTGCCCC 142
fP-mut35 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHACTGAATTCTCCTCAGATGACTCC 143
fP-mut36 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHACAGACACTCCTTGTTCAGCA 144
fP-mut37 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTGTGTATATAATTATTTCTTACCCTATTCGAGTC 145
fP-mut38 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTTGCTGTCATTTGGACTGGGAA 146
fP-mut39 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHCAAAAAGATACCCACCTTTCCTCCA 147
fP-mut3new ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHCAATTTCTACACGAGATCCTCTCTCT 148
fP-mut40 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGACATTACGGGCTGCCAAATC 149
fP-mut41 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHCTCAGACACACACCCAGCAA 150
fP-mut42 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHACTTACTTTATAAACCGTTCCAAAAGCA 151
fP-mut43 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTGAGTAATGTACTTACTACAATTTTCAGCTT 152
fP-mut44 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGCTGTTGTCAGTAATATAGATGTTTCCTG 153
fP-mut45 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAACTAGGGCAGGCACGC 154
fP-mut46 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGGATAATAAAAGAGAGAAATCACAGACATACAA 155
fP-mut47 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGGCATATCGATCCTCATAAAGTTTTG 156
fP-mut48 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTCCAGGTTGCCCATGACAAC 157
fP-mut49 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGTGCCAGAAGGAACCCAC 158
fP-mut50 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAAGTGTTACTCAAGAAGCAGAAAGG 159
fP-mut51 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAAAATCCCTTTGGGTTATAAATAGTGCA 160
fP-mut52 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHATGTGTTTTATAATTTAGACTAGTGAATATTTTTCTTTG 161
fP-mut53 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHCTGGAAAAATGGCTTTGAATCTTTGG 162
fP-mut54 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTGGAAAAGCTCATTAACTTAACTGACAT 163
fP-mut55 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTCCTTGGGATTACGCTCCCT 164
fP-mut56 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHACCCAGTGGAGAAGCTCCC 165
fP-mut57 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGGTGAGAAAGTTAAAATTCCCGTC 166
fP-mut58 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGGCAGATGCCCAGCAGG 167
fP-mut59 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHCCTCCACCGTGCAGCTCAT 168
fP-mut60 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGCCAGGAACGTACTGGTG 169
fP-mut61 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHACAATGTCACCACATTACATACTTACC 170
fP-mut62 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHACAGGCTCCCAGACATGACA 171
fP-mut63 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTTCAGATATTTCTTTCCTTAACTAAAGTACTCA 172
fP-mut64 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTGTTTGTTTTGTTTTAAGGTTTTTGGATTC 173
fP-mut65 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTCCTAAGTGCAAAAGATAACTTTATATCACTT 174
fP-mut66 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGTTGCAGCAATTCACTGTAAAGCT 175
fP-mut67 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHCACAAGAGGCCCTAGATTTCTATGG 176
fP-mut68 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTTGAGTTCCCTCAGCCGTTAC 177
fP-mut69 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTCTTCATACCAGGACCAGAGGAA 178
fP-mut7 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGTGAGCCCTGCTCCCC 179
fP-mut70 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGCGTGCAGATAATGACAAGGAATATCT 180
fP-mut71 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGGTTTTCATTTTAAATTTTCTTTCTCTAGGTGAA 181
fP-mut72 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTCGTGGCCATGAATGAATTCTCTA 182
fP-mut73 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTCTACAACAAGCTAACTTTCCAGCT 183
fP-mut74 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGTGATGTTCCTCCCTCATCTCTAA 184
fP-mut75 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHAGCAACATTGATGGATTTGTGAACT 185
fP-mut76 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHACGATTGGCTGAAGTACCAGAC 186
fP-mut77 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTGGACACGACAACAACCAGC 187
fP-mut78 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGCAACTTACACGTGGACGAC 188
fP-mut79 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTCCCTCTTATTGTTCCCTACAGATTG 189
fP-mut8 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHGTGCGCCGGTCTCTCC 190
fP-mut9 ACACGACGCTCTTCCGATCTTCTTHHHHHHHHHHHHHHHTGACCTGGAGTCTTCCAGTGT 191
fP-Ref-1 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCTTGTCTAAGGAAAAAACTTGATTATTTTGTAA 192
fP-Ref-10 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAGGAAGACGCTTGGTTGGG 193
fP-Ref-11 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTGAGACCTATAATGCTAAGGAAATTTCTTTAC 194
fP-Ref-12 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTGGAAGCGTTCGTTCCATCC 195
fP-Ref-13 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCTTGGCATCTGTTCTTGCTTTAA 196
fP-Ref-14 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAAAATTCTGCAAAAATAAAGGCCAAGA 197
fP-Ref-15 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTTTATTGCATGTCCTCATCCACAG 198
fP-Ref-16 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHATTGGGGATGTCCAGAATAAATTCAG 199
fP-Ref-17 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAAACAGTTCAGTGACTTGCCC 200
fP-Ref-18 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAGGCATCTCACCTCTCTTCC 201
fP-Ref-19 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGCATTATTCCAGTATTGTAGAAGAAGAA 202
fP-Ref-2 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTACATTACCAGTAGAACAGAACTAGTCTA 203
fP-Ref-20 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCTAACCGTGCTTTCCTCTTTCAT 204
fP-Ref-21 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCCTAGCAGAAGCCGACCA 205
fP-Ref-22 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAAACCACCACTTATTTCTTTATTTTATCCT 206
fP-Ref-23 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTCATTTTGTAGTCATTGTAAAACTCTTATGC 207
fP-Ref-24 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAGAGTAGCGACATGCAAATGATCT 208
fP-Ref-25 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCCAGCATTTGTTATATAGGCATCTT 209
fP-Ref-26 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGAGTAGACAGGGAAATATAGAAGCCT 210
fP-Ref-27 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCATCCTTTTTAGTGCTGTCCTCA 211
fP-Ref-28 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTCAGCTGGCCTAGCAGTTC 212
fP-Ref-29 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCATAATTTATAATGAAAACAAATACATTCTCACAG 213
fP-Ref-3 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTTATTTGCATTTGTGGCATAATATGAAAC 214
fP-Ref-30 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTAGGGTTAGTCAGGTGGTTCAA 215
fP-Ref-31 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAGAAGGGCTCTCACTGGG 216
fP-Ref-32 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCCTTATATTATTCCCTTTGAACCTTACAATAAT 217
fP-Ref-33 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCTGCAGCGGGAGTTTTCA 218
fP-Ref-34 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCGGCGCCACGTGTTCA 219
fP-Ref-35 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTGGCCCATTTTAACCTTTTTTTTTTAAAGTA 220
fP-Ref-36 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTGTGAACAGCCAGAAGCGAT 221
fP-Ref-37 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCCAGCCCCTGATCCTACCAG 222
fP-Ref-38 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAGTAACTGAACGACGAATTCTTTGTAA 223
fP-Ref-39 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCAGCTCCCACCACAGTGC 224
fP-Ref-4 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCACACAGCGGGCTCTCA 225
fP-Ref-40 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTCCCTTCTCCTACACTTCCTCC 226
fP-Ref-41 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHACTACAGGAGCAACTGCCAC 227
fP-Ref-42 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAGAGGTAGGGATTATTAGCCCCAT 228
fP-Ref-43 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTGTGTATCCAACAGGAACTCCAAA 229
fP-Ref-44 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCTGGTCTTAAAATGTCCTGGGGA 230
fP-Ref-45 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHACGCCCGGCCATCTCA 231
fP-Ref-46 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTTTTCACTGTTTCCTACAAGAAAATGC 232
fP-Ref-47 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGAAACCTGGATTTTTGAAATCTAGTGTTTAA 233
fP-Ref-48 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGCAAGGACGGAAATAGGTAAATGT 234
fP-Ref-49 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHCGAGGCACTGCGTTTGG 235
fP-Ref-5 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAGCAGATGGGTTGAGAGTTGG 236
fP-Ref-50 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTCCAATCTCTATCTGTTAGAAGTCTCC 237
fP-Ref-6 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHGGCTCTGATTTCCGCCCAAT SEQ ID NO:238
fP-Ref-7 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHTGCAAAGATTGTAGGAGCTCTGTA 239
fP-Ref-8 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAATTAGATAAAAAGCATCCACAGAGGAG 240
fP-Ref-9 ACACGACGCTCTTCCGATCTATCAHHHHHHHHHHHHHHHAGTCTTTAACAATGAGAGTCAAACCATT 241
rPin-ERBB2-1 AGACGTGTGCTCTTCCGATCTGTGCAGGGGGCAGACGA 242
rPin-ERBB2-10 AGACGTGTGCTCTTCCGATCTCCCCTCACAACAACCAGACG 243
rPin-ERBB2-11 AGACGTGTGCTCTTCCGATCTATGTTCTAACACCGTGATCTGGAT 244
rPin-ERBB2-12 AGACGTGTGCTCTTCCGATCTTGGAAAACACTTCAGTTTGCTCATTAA 245
rPin-ERBB2-13 AGACGTGTGCTCTTCCGATCTGCAAAGGTTCTACCCCGCAT 246
rPin-ERBB2-14 AGACGTGTGCTCTTCCGATCTGGCTACTTCTTACTCATTCCAACCC 247
rPin-ERBB2-15 AGACGTGTGCTCTTCCGATCTCCATCACCAGCTAGTCTGAGTC 248
rPin-ERBB2-16 AGACGTGTGCTCTTCCGATCTCCCCGTTTTATCTGTGACTCTTTG 249
rPin-ERBB2-17 AGACGTGTGCTCTTCCGATCTCCATCCTCTCTGCATCCCAAATC 250
rPin-ERBB2-18 AGACGTGTGCTCTTCCGATCTGGCAGGTGTTATCATTCCCCATTT 251
rPin-ERBB2-19 AGACGTGTGCTCTTCCGATCTGGGCCTCCTTATTTTTATGTGCTAAAT 252
rPin-ERBB2-2 AGACGTGTGCTCTTCCGATCTAGGGTGGAGGGGCTTACG 253
rPin-ERBB2-20 AGACGTGTGCTCTTCCGATCTAGCTTGCATCCTACTCCATCC 254
rPin-ERBB2-21 AGACGTGTGCTCTTCCGATCTTCCCCTGGTTTCTCCGGT 255
rPin-ERBB2-22 AGACGTGTGCTCTTCCGATCTCGACCCCGCCAGAAGC 256
rPin-ERBB2-23 AGACGTGTGCTCTTCCGATCTGCATGCAAAACACCACAAACAGTT 257
rPin-ERBB2-24 AGACGTGTGCTCTTCCGATCTGGCTACCTCCCTCTGTTTATGG 258
rPin-ERBB2-25 AGACGTGTGCTCTTCCGATCTAAAATATGAAGGAGTTCTGCAAGATTAAAAG 259
rPin-ERBB2-26 AGACGTGTGCTCTTCCGATCTGGTTCATACAGCAGGAATATGGGTAAT 260
rPin-ERBB2-27 AGACGTGTGCTCTTCCGATCTAGGACAGGCACAACTACCCT 261
rPin-ERBB2-28 AGACGTGTGCTCTTCCGATCTAGCAGAAAAGCCAATACTTCCCT 262
rPin-ERBB2-29 AGACGTGTGCTCTTCCGATCTAACACCACAGGCTCTACGG 263
rPin-ERBB2-3 AGACGTGTGCTCTTCCGATCTCCCAGAAGGCGGGAGACATA 264
rPin-ERBB2-30 AGACGTGTGCTCTTCCGATCTCAGGGAGAAGCCTGACTGAAG 265
rPin-ERBB2-31 AGACGTGTGCTCTTCCGATCTGGTGGACAGGGGACATGATCA 266
rPin-ERBB2-32 AGACGTGTGCTCTTCCGATCTGGAACACTGCCACCCCC 267
rPin-ERBB2-33 AGACGTGTGCTCTTCCGATCTCCCCCTGGTTAGCAGTGG 268
rPin-ERBB2-34 AGACGTGTGCTCTTCCGATCTAACTCAGCCCCATCACTCAC 269
rPin-ERBB2-35 AGACGTGTGCTCTTCCGATCTGGAGGGGCATGGCTTACAG 270
rPin-ERBB2-36 AGACGTGTGCTCTTCCGATCTCGGCTCTGACAATCCTCAGAA 271
rPin-ERBB2-37 AGACGTGTGCTCTTCCGATCTGGTCTCAAAAACAAAACGAAAGGTAAA 272
rPin-ERBB2-38 AGACGTGTGCTCTTCCGATCTACTGACAGGGGATATAGGGACA 273
rPin-ERBB2-39 AGACGTGTGCTCTTCCGATCTAGTCCTTGTTCACGGATAGCAT 274
rPin-ERBB2-4 AGACGTGTGCTCTTCCGATCTGTTCCGAGCGGCCAAGTC 275
rPin-ERBB2-40 AGACGTGTGCTCTTCCGATCTCCGCAGGGGACTTTTAGGG 276
rPin-ERBB2-41 AGACGTGTGCTCTTCCGATCTCTAGCACAGCCACAGTCACA 277
rPin-ERBB2-42 AGACGTGTGCTCTTCCGATCTCATTTAGTTGTCTTTAAATTGAAATGCATGAA 278
rPin-ERBB2-43 AGACGTGTGCTCTTCCGATCTCCTTGTCATCCAGGTCCACA 279
rPin-ERBB2-44 AGACGTGTGCTCTTCCGATCTACTCTAACTTGACCCCCTTATTCCT 280
rPin-ERBB2-45 AGACGTGTGCTCTTCCGATCTACAGGAATGTACACCTGATGATTTTG 281
rPin-ERBB2-46 AGACGTGTGCTCTTCCGATCTCTGCCTTGGCTCCCCG 282
rPin-ERBB2-47 AGACGTGTGCTCTTCCGATCTCAGTCTCCGCATCGTGTACT 283
rPin-ERBB2-48 AGACGTGTGCTCTTCCGATCTCTGTGCCCAGCTTAATTTTGTACA 284
rPin-ERBB2-49 AGACGTGTGCTCTTCCGATCTGGGGTGTCAAGTACTCGGG 285
rPin-ERBB2-5 AGACGTGTGCTCTTCCGATCTACACATCACTCTGGTGGGTGAA 286
rPin-ERBB2-50 AGACGTGTGCTCTTCCGATCTTGGACCCCTTCCAGCCA 287
rPin-ERBB2-6 AGACGTGTGCTCTTCCGATCTCTCTCGGTGGATCTGCATAACAT 288
rPin-ERBB2-7 AGACGTGTGCTCTTCCGATCTGTCAAATCCTAGGGGGTAATACGA 289
rPin-ERBB2-8 AGACGTGTGCTCTTCCGATCTCTGGTCATTGCAGAGACCTCT 290
rPin-ERBB2-9 AGACGTGTGCTCTTCCGATCTTCTCCATTGTCTAGCACGGC 291
rPin-Mut1 AGACGTGTGCTCTTCCGATCTCTCACAGTAAAAATAGGTGATTTTGGTCT 292
rPin-Mut2 AGACGTGTGCTCTTCCGATCTAAGATCCAATCCATTTTTGTTGTCCAG 293
rPin-Mut4 AGACGTGTGCTCTTCCGATCTGTCTGACGGGTAGAGTGTGC 294
rPin-Mut5 AGACGTGTGCTCTTCCGATCTCACATGACGGAGGTTGTGAGG 295
rPin-Mut6 AGACGTGTGCTCTTCCGATCTCTGAAAATGACTGAATATAAACTTGTGGTAGT 296
rPin-mut10 AGACGTGTGCTCTTCCGATCTCCAGTTGCAAACCAGACCTCA 297
rPin-mut11 AGACGTGTGCTCTTCCGATCTTCCTCACTGATTGCTCTTAGGTCT 298
rPin-mut12 AGACGTGTGCTCTTCCGATCTCCAACAAGGCACTGACCATC 299
rPin-mut13 AGACGTGTGCTCTTCCGATCTGAGCGCCAGACGAGACC 300
rPin-mut14 AGACGTGTGCTCTTCCGATCTCGGTGGATATGGTCCTTCTCTTC 301
rPin-mut15 AGACGTGTGCTCTTCCGATCTCGGTGGGCGTCCAGCA 302
rPin-mut16 AGACGTGTGCTCTTCCGATCTTGGTCAATGGAAGAAACCACCA 303
rPin-mut17 AGACGTGTGCTCTTCCGATCTCATCTTCAACCTCTGCATTGAAAGT 304
rPin-mut18 AGACGTGTGCTCTTCCGATCTAACAGCTACCCTTCCATCATAAGT 305
rPin-mut19 AGACGTGTGCTCTTCCGATCTCTGTTTTTAGCAAAAGCGTCCAG 306
rPin-mut20 AGACGTGTGCTCTTCCGATCTAGGTTTCAAAGCGCCAGTCA 307
rPin-mut21 AGACGTGTGCTCTTCCGATCTGTAACAAGCCAAATGAACAGACAAGT 308
rPin-mut22 AGACGTGTGCTCTTCCGATCTAGTTGTTCTAGCAGTGAAGAGATAAAGA 309
rPin-mut23 AGACGTGTGCTCTTCCGATCTAAAGCACCTAAAAAGAATAGGCTGAG 310
rPin-mut24 AGACGTGTGCTCTTCCGATCTAGGTAGATCTGAATGCTGATCCC 311
rPin-mut25 AGACGTGTGCTCTTCCGATCTGGATCTGATTCTTCTGAAGATACCGTTAA 312
rPin-mut26 AGACGTGTGCTCTTCCGATCTGATTTATCTGCTCTTCGCGTTGAA 313
rPin-mut27 AGACGTGTGCTCTTCCGATCTACTGTTTCATATACTTCATCTTCTAGGACA 314
rPin-mut28 AGACGTGTGCTCTTCCGATCTGGAGATTTTGTCACTTCCACTCTC 315
rPin-mut29 AGACGTGTGCTCTTCCGATCTTTGAATTTGACAAAACCATTTCCTCATTT 316
rPin-mut30 AGACGTGTGCTCTTCCGATCTGTTTCAGGACATCCATTTTATCAAGTTTC 317
rPin-mut31 AGACGTGTGCTCTTCCGATCTGTTAATATTCCTAACACACTGTTCAACTCT 318
rPin-mut32 AGACGTGTGCTCTTCCGATCTTTCTAGTCTCTTTTGTTGGGCCT 319
rPin-mut33 AGACGTGTGCTCTTCCGATCTCTTATCAAAACTGAAAAATTACAATGAAAGGTTT 320
rPin-mut34 AGACGTGTGCTCTTCCGATCTCTTTATTGCCAGTAAATTGTAACATTCGT 321
rPin-mut35 AGACGTGTGCTCTTCCGATCTCAAGTTCTTCGTCAGCTATTGAATTACT 322
rPin-mut36 AGACGTGTGCTCTTCCGATCTCCTTCTCTCCACATATGTTTCTCTTATTAA 323
rPin-mut37 AGACGTGTGCTCTTCCGATCTCATCCCACCTCCCATCTATACTTC 324
rPin-mut38 AGACGTGTGCTCTTCCGATCTTTTGTGTCTGATGGGCAATCTTTC 325
rPin-mut39 AGACGTGTGCTCTTCCGATCTTTTTGGGCTAGCCAGACTCTTG 326
rPin-mut3new AGACGTGTGCTCTTCCGATCTGAATCTCCATTTTAGCACTTACCTGTG 327
rPin-mut40 AGACGTGTGCTCTTCCGATCTTTGATATTTTTCAGGGAATGATGTACCTG 328
rPin-mut41 AGACGTGTGCTCTTCCGATCTGAAATCATGGTATTGCATTTTTTTCTTACAG 329
rPin-mut42 AGACGTGTGCTCTTCCGATCTAGCACCCAATCAAGCTCAACT 330
rPin-mut43 AGACGTGTGCTCTTCCGATCTACTCTTCAGCACAATCAACCAGA 331
rPin-mut44 AGACGTGTGCTCTTCCGATCTGCATCACCTCTCTACAGTTCCAGT 332
rPin-mut45 AGACGTGTGCTCTTCCGATCTGCTGAATGTTAACATTAATGCTTATTTTACC 333
rPin-mut46 AGACGTGTGCTCTTCCGATCTAGTGACTGCTGCCATCGAG 334
rPin-mut47 AGACGTGTGCTCTTCCGATCTGCTACGTGTTAGTGGCTCTTAATCA 335
rPin-mut48 AGACGTGTGCTCTTCCGATCTATAAACTGAGCTCTCTCTCTGACC 336
rPin-mut49 AGACGTGTGCTCTTCCGATCTTGAAGCCGGCGACAGG 337
rPin-mut50 AGACGTGTGCTCTTCCGATCTGGTTCAATTACTTTTAAAAAGGGTTGAAAAAG 338
rPin-mut51 AGACGTGTGCTCTTCCGATCTATTTGACTTTACCTTATCAATGTCTCGAA 339
rPin-mut52 AGACGTGTGCTCTTCCGATCTGTGTCTGTGTAATCAAACAAGTTTATATTTCC 340
rPin-mut53 AGACGTGTGCTCTTCCGATCTAGTAACACCAATAGGGTTCAGCAA 341
rPin-mut54 AGACGTGTGCTCTTCCGATCTAAAGAGTCTCAAACACAAACTAGAGTC 342
rPin-mut55 AGACGTGTGCTCTTCCGATCTTTTATTGTATTTGCATAGCACAAATTTTTGTT 343
rPin-mut56 AGACGTGTGCTCTTCCGATCTCCGTGCCGAACGCACC 344
rPin-mut57 AGACGTGTGCTCTTCCGATCTGCAAAGCAGAAACTCACATCGA 345
rPin-mut58 AGACGTGTGCTCTTCCGATCTCTCCAGGAAGCCTACGTGATG 346
rPin-mut59 AGACGTGTGCTCTTCCGATCTCGGACATAGTCCAGGAGGCAG 347
rPin-mut60 AGACGTGTGCTCTTCCGATCTGCATGGTATTCTTTCTCTTCCGCA 348
rPin-mut61 AGACGTGTGCTCTTCCGATCTGGGCAGATTACAGTGGGACAA 349
rPin-mut62 AGACGTGTGCTCTTCCGATCTGGATACAGGTCAAGTCTAAGTCGAATC 350
rPin-mut63 AGACGTGTGCTCTTCCGATCTCCTGTATACGCCTTCAAGTCTTTCT 351
rPin-mut64 AGACGTGTGCTCTTCCGATCTGCAAGCATACAAATAAGAAAACATACTTACAG 352
rPin-mut65 AGACGTGTGCTCTTCCGATCTTCTGCAATTAAATTTGGCGGTGT 353
rPin-mut66 AGACGTGTGCTCTTCCGATCTCGATGTAATAAATATGCACATATCATTACACC 354
rPin-mut67 AGACGTGTGCTCTTCCGATCTCAGGAAGAGGAAAGGAAAAACATCAA 355
rPin-mut68 AGACGTGTGCTCTTCCGATCTGATATTTCTCCCAATGAAAGTAAAGTACAAAC 356
rPin-mut69 AGACGTGTGCTCTTCCGATCTTCGATTTCTTGATCACATAGACTTCCAT 357
rPin-mut7 AGACGTGTGCTCTTCCGATCTGGGCGTGAGCGCTTCG 358
rPin-mut70 AGACGTGTGCTCTTCCGATCTCTTAAAATTTGGAGAAAAGTATCGGTTGG 359
rPin-mut71 AGACGTGTGCTCTTCCGATCTAGCCTCTGGATTTGACGGC 360
rPin-mut72 AGACGTGTGCTCTTCCGATCTGATGGCAAACTTCCCATCGTAG 361
rPin-mut73 AGACGTGTGCTCTTCCGATCTGGGACAGCTGGCTACACAA 362
rPin-mut74 AGACGTGTGCTCTTCCGATCTAGGCCCTGACACAGGATGT 363
rPin-mut75 AGACGTGTGCTCTTCCGATCTCCCATTGAGGCCGGTGAT 364
rPin-mut76 AGACGTGTGCTCTTCCGATCTTTGACCATCACCATGTAGACATCA 365
rPin-mut77 AGACGTGTGCTCTTCCGATCTAGCTGTCTCTCTCCCAGTTCATT 366
rPin-mut78 AGACGTGTGCTCTTCCGATCTCCCATGGCAAACACCATGAG 367
rPin-mut79 AGACGTGTGCTCTTCCGATCTCACCATGTGTGACTTGATTAGCAG 368
rPin-mut8 AGACGTGTGCTCTTCCGATCTGTGGTAATCTACTGGGACGGAAC 369
rPin-mut9 AGACGTGTGCTCTTCCGATCTTCCACTACAACTACATGTGTAACAGTT 370
rPin-Ref-1 AGACGTGTGCTCTTCCGATCTGTAACAGTAGGTGTTTCAATATGACTTTTATT 371
rPin-Ref-10 AGACGTGTGCTCTTCCGATCTCTCCCCTCCTCCATAGGAACTT 372
rPin-Ref-11 AGACGTGTGCTCTTCCGATCTACATACCAGGTTCTGCGCTT 373
rPin-Ref-12 AGACGTGTGCTCTTCCGATCTATCAAGGCACCGCTCTAACTT 374
rPin-Ref-13 AGACGTGTGCTCTTCCGATCTATCCCGGTGTGCATTTGAGA 375
rPin-Ref-14 AGACGTGTGCTCTTCCGATCTGGGCTATGGGGGCTTCCT 376
rPin-Ref-15 AGACGTGTGCTCTTCCGATCTGATGTGCCCTGACATCAGAAATATAC 377
rPin-Ref-16 AGACGTGTGCTCTTCCGATCTAGTGTTGATCTGAAGGAACTTCCT 378
rPin-Ref-17 AGACGTGTGCTCTTCCGATCTTGGGACCATGTTTGGCCAT 379
rPin-Ref-18 AGACGTGTGCTCTTCCGATCTTCCCATCATTGCTGCTGTCA 380
rPin-Ref-19 AGACGTGTGCTCTTCCGATCTCAAACACGTGTGATCAATAGTACCAT 381
rPin-Ref-2 AGACGTGTGCTCTTCCGATCTTCTCATATCAGAACTTAAATACATAGCAGTAG 382
rPin-Ref-20 AGACGTGTGCTCTTCCGATCTGGGGAAGGAAGATGTCACATTATGA 383
rPin-Ref-21 AGACGTGTGCTCTTCCGATCTGCATGCGCAAGAGCTACCC 384
rPin-Ref-22 AGACGTGTGCTCTTCCGATCTACGATAAAATTCTCTTATCTTGAAGGATTGAT 385
rPin-Ref-23 AGACGTGTGCTCTTCCGATCTAGTGTTTCTGATATTGAAAAATTTTAAGTGCT 386
rPin-Ref-24 AGACGTGTGCTCTTCCGATCTTTTCATCCTTCGCACATGTATACTG 387
rPin-Ref-25 AGACGTGTGCTCTTCCGATCTCTGGAGCAGATGACTCACATTTC 388
rPin-Ref-26 AGACGTGTGCTCTTCCGATCTAGGGGGCTTGGTCTTTTTTCT SEQ ID NO:389
rPin-Ref-27 AGACGTGTGCTCTTCCGATCTCACCTTTTTTAACAACCGGATCTAGT 390
rPin-Ref-28 AGACGTGTGCTCTTCCGATCTGAGGCCCTGTAATCTGTATTTTAACC 391
rPin-Ref-29 AGACGTGTGCTCTTCCGATCTCCTTAATATCAGACTTCCCAGCCTTC 392
rPin-Ref-3 AGACGTGTGCTCTTCCGATCTGGAGCTCTGAGACAGGAACC 393
rPin-Ref-30 AGACGTGTGCTCTTCCGATCTTGGCAAAGCAGAAGACAATAGTAGA 394
rPin-Ref-31 AGACGTGTGCTCTTCCGATCTCCCTTTCAGGGAGTCCTGTACA 395
rPin-Ref-32 AGACGTGTGCTCTTCCGATCTTTTTCGTTACTGTAAAATGGGAATGTTC 396
rPin-Ref-33 AGACGTGTGCTCTTCCGATCTCGGTGAACTTTCGGGAAAGG 397
rPin-Ref-34 AGACGTGTGCTCTTCCGATCTCCCACGTACAAGAGGATTTCAAAGT 398
rPin-Ref-35 AGACGTGTGCTCTTCCGATCTAGTGTGAATGTACTTAATGACACTTAGC 399
rPin-Ref-36 AGACGTGTGCTCTTCCGATCTGTGAGGCAGGTGCTCACTT 400
rPin-Ref-37 AGACGTGTGCTCTTCCGATCTCTGGTGTTCTTTTATACCCATTTTTTCTTTA 401
rPin-Ref-38 AGACGTGTGCTCTTCCGATCTCTGTTGCTCTTGACTCTGAGCT 402
rPin-Ref-39 AGACGTGTGCTCTTCCGATCTCCTCAGGTCCTTGTGGCTAAC 403
rPin-Ref-4 AGACGTGTGCTCTTCCGATCTAGGAGCCGTGGGAATCAAAA 404
rPin-Ref-40 AGACGTGTGCTCTTCCGATCTCAGCATGGCAAGGCAACTT 405
rPin-Ref-41 AGACGTGTGCTCTTCCGATCTTGAGGGACAGAAAATCAGGTCG 406
rPin-Ref-42 AGACGTGTGCTCTTCCGATCTGGCTAATGAGTTGATCTCTCTGAGC 407
rPin-Ref-43 AGACGTGTGCTCTTCCGATCTAAAAGAAAACAAAGGACATAGATTTTCCC 408
rPin-Ref-44 AGACGTGTGCTCTTCCGATCTAGAGTGCTCAAACCTTGGGAA 409
rPin-Ref-45 AGACGTGTGCTCTTCCGATCTGCTATCATGCCATGAAGAATATTCATATATTCATA 410
rPin-Ref-46 AGACGTGTGCTCTTCCGATCTAGAGAACCCACTTGGGACCA 411
rPin-Ref-47 AGACGTGTGCTCTTCCGATCTACCATATTCTTAATTTTTAAAATTCACAGCCA 412
rPin-Ref-48 AGACGTGTGCTCTTCCGATCTCTCTGTCGTAAGTCAAGTCTTTGTG 413
rPin-Ref-49 AGACGTGTGCTCTTCCGATCTCTATCGAATCAGAATGCAAAGCAAATT 414
rPin-Ref-5 AGACGTGTGCTCTTCCGATCTCGTTTCGGATACTCAGTCTCTGAA 415
rPin-Ref-50 AGACGTGTGCTCTTCCGATCTACAAATTACCTAAACTGACTCAAGAAGAA 416
rPin-Ref-6 AGACGTGTGCTCTTCCGATCTGGCTCCTTTCGTGAGCGAAG 417
rPin-Ref-7 AGACGTGTGCTCTTCCGATCTAGAGGTAGTGGAGGTCAAGGT 418
rPin-Ref-8 AGACGTGTGCTCTTCCGATCTTGACTTGCGTTCATCTTGTTATTTAAAC 419
rPin-Ref-9 AGACGTGTGCTCTTCCGATCTCCTGAAAAGGTAGGTTGGTGC 420
rPout-ERBB2-1 GGATATTCCTTTCTACTCTTTGACATCATCTTCACCTCTTGGTTGTGCAGG 421
rPout-ERBB2-10 GGATATTCCTTTCTACTCTTTGACATCATCTCATTTACCCCTCACAACAACCAG 422
rPout-ERBB2-11 GGATATTCCTTTCTACTCTTTGACATCATCTCCATGTTCTAACACCGTGATCTG 423
rPout-ERBB2-12 GGATATTCCTTTCTACTCTTTGACATCATCTCATGGAAAACACTTCAGTTTGCTC 424
rPout-ERBB2-13 GGATATTCCTTTCTACTCTTTGACATCATCTACAGCAAAGGTTCTACCCCG 425
rPout-ERBB2-14 GGATATTCCTTTCTACTCTTTGACATCATCTCCAGGCTACTTCTTACTCATTCCAA 426
rPout-ERBB2-15 GGATATTCCTTTCTACTCTTTGACATCATCTACCTCCATCACCAGCTAGTCT 427
rPout-ERBB2-16 GGATATTCCTTTCTACTCTTTGACATCATCTGGTGCCCCCGTTTTATCTGT 428
rPout-ERBB2-17 GGATATTCCTTTCTACTCTTTGACATCATCTCCAAGCAAACCCATCCTCTCTG 429
rPout-ERBB2-18 GGATATTCCTTTCTACTCTTTGACATCATCTAGGAGGCAGGTGTTATCATTCC 430
rPout-ERBB2-19 GGATATTCCTTTCTACTCTTTGACATCATCTTTTATCTGAAATTCAAATTTAACTGGGCC 431
rPout-ERBB2-2 GGATATTCCTTTCTACTCTTTGACATCATCTGGAGAGGGTGGAGGGGCT 432
rPout-ERBB2-20 GGATATTCCTTTCTACTCTTTGACATCATCTGGGGAGCTTGCATCCTACTC 433
rPout-ERBB2-21 GGATATTCCTTTCTACTCTTTGACATCATCTGGCTCCCCTGGTTTCTCC 434
rPout-ERBB2-22 GGATATTCCTTTCTACTCTTTGACATCATCTACACCCGACCCCGCC 435
rPout-ERBB2-23 GGATATTCCTTTCTACTCTTTGACATCATCTTGTTCTAGGATTAAAGGAGAATGCATG 436
rPout-ERBB2-24 GGATATTCCTTTCTACTCTTTGACATCATCTCCATAGAAGGCTACCTCCCTCT 437
rPout-ERBB2-25 GGATATTCCTTTCTACTCTTTGACATCATCTGGAATTAAAATATGAAGGAGTTCTGCAAG 438
rPout-ERBB2-26 GGATATTCCTTTCTACTCTTTGACATCATCTTTAAAAGTTAAGACAAGACAGGTTCATACA 439
rPout-ERBB2-27 GGATATTCCTTTCTACTCTTTGACATCATCTCCCAAGGACAGGCACAACTAC 440
rPout-ERBB2-28 GGATATTCCTTTCTACTCTTTGACATCATCTCTCACAGCAGAAAAGCCAATACTT 441
rPout-ERBB2-29 GGATATTCCTTTCTACTCTTTGACATCATCTCCGATAAACACCACAGGCTCTA 442
rPout-ERBB2-3 GGATATTCCTTTCTACTCTTTGACATCATCTGTCAGGCAGATGCCCAGAAG 443
rPout-ERBB2-30 GGATATTCCTTTCTACTCTTTGACATCATCTCTCCAAGTCATGCCACCTCA 444
rPout-ERBB2-31 GGATATTCCTTTCTACTCTTTGACATCATCTAGGTGGACAGGGGACATGA 445
rPout-ERBB2-32 GGATATTCCTTTCTACTCTTTGACATCATCTCTGAAATAGGAACACTGCCACC 446
rPout-ERBB2-33 GGATATTCCTTTCTACTCTTTGACATCATCTCAAAGCCTCCCCCTGGTTAG 447
rPout-ERBB2-34 GGATATTCCTTTCTACTCTTTGACATCATCTTGTGGAGTCTGAAACTCAGCC 448
rPout-ERBB2-35 GGATATTCCTTTCTACTCTTTGACATCATCTCAGGGAGGGGCATGGC 449
rPout-ERBB2-36 GGATATTCCTTTCTACTCTTTGACATCATCTCTGAGACTCACGGCTCTGAC 450
rPout-ERBB2-37 GGATATTCCTTTCTACTCTTTGACATCATCTCTAAATTCGGTCTCAAAAACAAAACGAA 451
rPout-ERBB2-38 GGATATTCCTTTCTACTCTTTGACATCATCTCCACACTGACAGGGGATATAGG 452
rPout-ERBB2-39 GGATATTCCTTTCTACTCTTTGACATCATCTCATACAAGTCCTTGTTCACGGATAG 453
rPout-ERBB2-4 GGATATTCCTTTCTACTCTTTGACATCATCTGACCAGCACGTTCCGAGC 454
rPout-ERBB2-40 GGATATTCCTTTCTACTCTTTGACATCATCTAGGGACCGCAGGGGAC 455
rPout-ERBB2-41 GGATATTCCTTTCTACTCTTTGACATCATCTCCCTAGCACAGCCACAGTC 456
rPout-ERBB2-42 GGATATTCCTTTCTACTCTTTGACATCATCTTTTTCTCATTTAGTTGTCTTTAAATTGAAATGC 457
rPout-ERBB2-43 GGATATTCCTTTCTACTCTTTGACATCATCTGGCAGCCCTTGTCATCCAG 458
rPout-ERBB2-44 GGATATTCCTTTCTACTCTTTGACATCATCTCACCCTGACTCTAACTTGACCC 459
rPout-ERBB2-45 GGATATTCCTTTCTACTCTTTGACATCATCTCATGGGTACAGGAATGTACACCT 460
rPout-ERBB2-46 GGATATTCCTTTCTACTCTTTGACATCATCTTCTAAAACCTGCCTTGGCTCC 461
rPout-ERBB2-47 GGATATTCCTTTCTACTCTTTGACATCATCTCAGCAGTCTCCGCATCGT 462
rPout-ERBB2-48 GGATATTCCTTTCTACTCTTTGACATCATCTCACTGTGCCCAGCTTAATTTTGT 463
rPout-ERBB2-49 GGATATTCCTTTCTACTCTTTGACATCATCTCCCTGGGGTGTCAAGTACTC 464
rPout-ERBB2-5 GGATATTCCTTTCTACTCTTTGACATCATCTCATAACTCCACACATCACTCTGGT 465
rPout-ERBB2-50 GGATATTCCTTTCTACTCTTTGACATCATCTTGTTCCTCTTCCAACGAGGC 466
rPout-ERBB2-6 GGATATTCCTTTCTACTCTTTGACATCATCTCAGGCACTCTCGGTGGATC 467
rPout-ERBB2-7 GGATATTCCTTTCTACTCTTTGACATCATCTCCTAAGGTCAAATCCTAGGGGGTAATA 468
rPout-ERBB2-8 GGATATTCCTTTCTACTCTTTGACATCATCTCCGGGGCTCTGGTCATTG 469
rPout-ERBB2-9 GGATATTCCTTTCTACTCTTTGACATCATCTGTTCAGCGGGTCTCCATTGT 470
rPout-Mut1 GGATATTCCTTTCTACTCTTTGACATCATCTTGAAGACCTCACAGTAAAAATAGGTGATT 471
rPout-Mut2 GGATATTCCTTTCTACTCTTTGACATCATCTTGTGGAAGATCCAATCCATTTTTGTTG 472
rPout-Mut4 GGATATTCCTTTCTACTCTTTGACATCATCTGAGGGTCTGACGGGTAGAGT 473
rPout-Mut5 GGATATTCCTTTCTACTCTTTGACATCATCTACAGCACATGACGGAGGTTG 474
rPout-Mut6 GGATATTCCTTTCTACTCTTTGACATCATCTTTATAAGGCCTGCTGAAAATGACTGAA 475
rPout-mut10 GGATATTCCTTTCTACTCTTTGACATCATCTGACCCCAGTTGCAAACCAGAC 476
rPout-mut11 GGATATTCCTTTCTACTCTTTGACATCATCTTCTGATTCCTCACTGATTGCTCTTAG 477
rPout-mut12 GGATATTCCTTTCTACTCTTTGACATCATCTCGGGGGCTCAGCATCCA 478
rPout-mut13 GGATATTCCTTTCTACTCTTTGACATCATCTCAAACAGTAGCTTCCCTGGGT 479
rPout-mut14 GGATATTCCTTTCTACTCTTTGACATCATCTCAGGACTCGGTGGATATGGTC 480
rPout-mut15 GGATATTCCTTTCTACTCTTTGACATCATCTGGCGCATGTAGGCGGTG 481
rPout-mut16 GGATATTCCTTTCTACTCTTTGACATCATCTGGAGATGTGGTCAATGGAAGAAAC 482
rPout-mut17 GGATATTCCTTTCTACTCTTTGACATCATCTTCGTGTTGGCAACATACCATCT 483
rPout-mut18 GGATATTCCTTTCTACTCTTTGACATCATCTCTTCTAACAGCTACCCTTCCATCAT 484
rPout-mut19 GGATATTCCTTTCTACTCTTTGACATCATCTAGGAAAGTTCTGCTGTTTTTAGCAAA 485
rPout-mut20 GGATATTCCTTTCTACTCTTTGACATCATCTCTCAGTATTTGCAGAATACATTCAAGGT 486
rPout-mut21 GGATATTCCTTTCTACTCTTTGACATCATCTGAAGAGTAACAAGCCAAATGAACAGA 487
rPout-mut22 GGATATTCCTTTCTACTCTTTGACATCATCTTTGATAGTTGTTCTAGCAGTGAAGAGA 488
rPout-mut23 GGATATTCCTTTCTACTCTTTGACATCATCTACAATTCAAAAGCACCTAAAAAGAATAGG 489
rPout-mut24 GGATATTCCTTTCTACTCTTTGACATCATCTACAGAAAAAAAGGTAGATCTGAATGCT 490
rPout-mut25 GGATATTCCTTTCTACTCTTTGACATCATCTAGGATCTGATTCTTCTGAAGATACCG 491
rPout-mut26 GGATATTCCTTTCTACTCTTTGACATCATCTTGGATTTATCTGCTCTTCGCGT 492
rPout-mut27 GGATATTCCTTTCTACTCTTTGACATCATCTGTATCTACAACTGTTTCATATACTTCATCTTCT 493
rPout-mut28 GGATATTCCTTTCTACTCTTTGACATCATCTCAGGCCAAAGACGGTACAACT 494
rPout-mut29 GGATATTCCTTTCTACTCTTTGACATCATCTCTCTTCTTTTTCCAATTCTTGAATTTGACA 495
rPout-mut30 GGATATTCCTTTCTACTCTTTGACATCATCTGCAGTTTCAGGACATCCATTTTATCAA 496
rPout-mut31 GGATATTCCTTTCTACTCTTTGACATCATCTCCAAGTTAATATTCCTAACACACTGTTCA 497
rPout-mut32 GGATATTCCTTTCTACTCTTTGACATCATCTAATAAGGCTTCTAGTCTCTTTTGTTGG 498
rPout-mut33 GGATATTCCTTTCTACTCTTTGACATCATCTACAAGCACTTATCAAAACTGAAAAATTACAAT 499
rPout-mut34 GGATATTCCTTTCTACTCTTTGACATCATCTGGCTTAATAATGTCCTCATTAAGGTCTATC 500
rPout-mut35 GGATATTCCTTTCTACTCTTTGACATCATCTCAATGCAAGTTCTTCGTCAGCTA 501
rPout-mut36 GGATATTCCTTTCTACTCTTTGACATCATCTTTTAAACTATTTCTAACAACGCCTTCTCT 502
rPout-mut37 GGATATTCCTTTCTACTCTTTGACATCATCTTCAACATCCCACCTCCCATCTA 503
rPout-mut38 GGATATTCCTTTCTACTCTTTGACATCATCTGAATCATATTTGTGTCTGATGGGCAAT 504
rPout-mut39 GGATATTCCTTTCTACTCTTTGACATCATCTAAACCATGTGAAAATCACAGATTTTGG 505
rPout-mut3new GGATATTCCTTTCTACTCTTTGACATCATCTCAGAGAATCTCCATTTTAGCACTTACC 506
rPout-mut40 GGATATTCCTTTCTACTCTTTGACATCATCTTGAATATCATTAAGGAACTTGATATTTTTCAGG 507
rPout-mut41 GGATATTCCTTTCTACTCTTTGACATCATCTAAATTTGAGTTGAAATCATGGTATTGCAT 508
rPout-mut42 GGATATTCCTTTCTACTCTTTGACATCATCTCACAGCACCCAATCAAGCTC 509
rPout-mut43 GGATATTCCTTTCTACTCTTTGACATCATCTGACAACACTCTTCAGCACAATCAA 510
rPout-mut44 GGATATTCCTTTCTACTCTTTGACATCATCTAGGGCATCACCTCTCTACAGTT 511
rPout-mut45 GGATATTCCTTTCTACTCTTTGACATCATCTGTTTGCTGAATGTTAACATTAATGCTTATTT 512
rPout-mut46 GGATATTCCTTTCTACTCTTTGACATCATCTACGGACCTTACGTCAGTGACT 513
rPout-mut47 GGATATTCCTTTCTACTCTTTGACATCATCTGGCTACGTGTTAGTGGCTCTTA 514
rPout-mut48 GGATATTCCTTTCTACTCTTTGACATCATCTACGGAGAATAAACTGAGCTCTCTC 515
rPout-mut49 GGATATTCCTTTCTACTCTTTGACATCATCTCCAAAAAATGAAGCCGGCGA 516
rPout-mut50 GGATATTCCTTTCTACTCTTTGACATCATCTTGCCTACTGGTTCAATTACTTTTAAAAAG 517
rPout-mut51 GGATATTCCTTTCTACTCTTTGACATCATCTCATCAGCATTTGACTTTACCTTATCAATG 518
rPout-mut52 GGATATTCCTTTCTACTCTTTGACATCATCTCTAGAGTGTCTGTGTAATCAAACAAGTTT 519
rPout-mut53 GGATATTCCTTTCTACTCTTTGACATCATCTTGATCCAGTAACACCAATAGGGTTC 520
rPout-mut54 GGATATTCCTTTCTACTCTTTGACATCATCTAGTGAAAAGAGTCTCAAACACAAACTAG 521
rPout-mut55 GGATATTCCTTTCTACTCTTTGACATCATCTTTTTTTCCAGTTTATTGTATTTGCATAGCA 522
rPout-mut56 GGATATTCCTTTCTACTCTTTGACATCATCTCCTTATACACCGTGCCGAACG 523
rPout-mut57 GGATATTCCTTTCTACTCTTTGACATCATCTCACAGCAAAGCAGAAACTCACA 524
rPout-mut58 GGATATTCCTTTCTACTCTTTGACATCATCTCCCTCCCTCCAGGAAGCCTA 525
rPout-mut59 GGATATTCCTTTCTACTCTTTGACATCATCTGGAGCCAATATTGTCTTTGTGTTCC 526
rPout-mut60 GGATATTCCTTTCTACTCTTTGACATCATCTCTCCTTCTGCATGGTATTCTTTCTC 527
rPout-mut61 GGATATTCCTTTCTACTCTTTGACATCATCTTGATGGGCAGATTACAGTGGG 528
rPout-mut62 GGATATTCCTTTCTACTCTTTGACATCATCTTGGATACAGGTCAAGTCTAAGTCG 529
rPout-mut63 GGATATTCCTTTCTACTCTTTGACATCATCTCAATATTGTTCCTGTATACGCCTTCA 530
rPout-mut64 GGATATTCCTTTCTACTCTTTGACATCATCTTTGCAAGCATACAAATAAGAAAACATACTT 531
rPout-mut65 GGATATTCCTTTCTACTCTTTGACATCATCTTCATACCTACCTCTGCAATTAAATTTGG 532
rPout-mut66 GGATATTCCTTTCTACTCTTTGACATCATCTCCCCGATGTAATAAATATGCACATATCA 533
rPout-mut67 GGATATTCCTTTCTACTCTTTGACATCATCTTGTTTTCCAATAAATTCTCAGATCCAGG 534
rPout-mut68 GGATATTCCTTTCTACTCTTTGACATCATCTTGGATATTTCTCCCAATGAAAGTAAAGTAC 535
rPout-mut69 GGATATTCCTTTCTACTCTTTGACATCATCTTGCTATCGATTTCTTGATCACATAGACT 536
rPout-mut7 GGATATTCCTTTCTACTCTTTGACATCATCTCGTGGGCGTGAGCGC 537
rPout-mut70 GGATATTCCTTTCTACTCTTTGACATCATCTCTGACCTTAAAATTTGGAGAAAAGTATCG 538
rPout-mut71 GGATATTCCTTTCTACTCTTTGACATCATCTCATCTGGTGTTACAGAAGTTGAACTG 539
rPout-mut72 GGATATTCCTTTCTACTCTTTGACATCATCTCGAAGATGGCAAACTTCCCATC 540
rPout-mut73 GGATATTCCTTTCTACTCTTTGACATCATCTCTCAGACACTTACGGGGACAG 541
rPout-mut74 GGATATTCCTTTCTACTCTTTGACATCATCTGACAGGCCCTGACACAGG 542
rPout-mut75 GGATATTCCTTTCTACTCTTTGACATCATCTATCTCTAACCCATTGAGGCCG 543
rPout-mut76 GGATATTCCTTTCTACTCTTTGACATCATCTACACTTGACCATCACCATGTAGAC 544
rPout-mut77 GGATATTCCTTTCTACTCTTTGACATCATCTTACAAGCTGTCTCTCTCCCAGT 545
rPout-mut78 GGATATTCCTTTCTACTCTTTGACATCATCTCCAGCCCATGGCAAACAC 546
rPout-mut79 GGATATTCCTTTCTACTCTTTGACATCATCTCGCTCACCATGTGTGACTTGAT SEQ ID NO:547
rPout-mut8 GGATATTCCTTTCTACTCTTTGACATCATCTTCCTATCCTGAGTAGTGGTAATCTACT 548
rPout-mut9 GGATATTCCTTTCTACTCTTTGACATCATCTTCTGACTGTACCACCATCCACT 549
rPout-Ref-1 GGATATTCCTTTCTACTCTTTGACATCATCTAGTAACAGTAGGTGTTTCAATATGACTTTT 550
rPout-Ref-10 GGATATTCCTTTCTACTCTTTGACATCATCTCCCTCCAGGAGCCCACC 551
rPout-Ref-11 GGATATTCCTTTCTACTCTTTGACATCATCTACTGCTACTACATACCAGGTTCTG 552
rPout-Ref-12 GGATATTCCTTTCTACTCTTTGACATCATCTCTGATCAAGGCACCGCTCTAA 553
rPout-Ref-13 GGATATTCCTTTCTACTCTTTGACATCATCTCTCCATCCCGGTGTGCAT 554
rPout-Ref-14 GGATATTCCTTTCTACTCTTTGACATCATCTTCAAGGGCTATGGGGGCTT 555
rPout-Ref-15 GGATATTCCTTTCTACTCTTTGACATCATCTAGATGTGCCCTGACATCAGAAATA 556
rPout-Ref-16 GGATATTCCTTTCTACTCTTTGACATCATCTTCACTTAACCTTCAGTGTTGATCTGA 557
rPout-Ref-17 GGATATTCCTTTCTACTCTTTGACATCATCTAGGAGTGGGACCATGTTTGG 558
rPout-Ref-18 GGATATTCCTTTCTACTCTTTGACATCATCTCCATCGCTCCCATCATTGCT 559
rPout-Ref-19 GGATATTCCTTTCTACTCTTTGACATCATCTCTTTCAAACACGTGTGATCAATAGTAC 560
rPout-Ref-2 GGATATTCCTTTCTACTCTTTGACATCATCTCATTCTCATATCAGAACTTAAATACATAGCAG 561
rPout-Ref-20 GGATATTCCTTTCTACTCTTTGACATCATCTACAAGTCCATCTTATAGGGGAAGGA 562
rPout-Ref-21 GGATATTCCTTTCTACTCTTTGACATCATCTAAATGCATGAGCATGCGCAA 563
rPout-Ref-22 GGATATTCCTTTCTACTCTTTGACATCATCTCCACGATAAAATTCTCTTATCTTGAAGGATT 564
rPout-Ref-23 GGATATTCCTTTCTACTCTTTGACATCATCTGTTCAAAGTGTTTCTGATATTGAAAAATTTTAAGT SEQ ID NO:565
rPout-Ref-24 GGATATTCCTTTCTACTCTTTGACATCATCTCCTTTTTCATCCTTCGCACATGTATA 566
rPout-Ref-25 GGATATTCCTTTCTACTCTTTGACATCATCTCCCTGGAGCAGATGACTCACA 567
rPout-Ref-26 GGATATTCCTTTCTACTCTTTGACATCATCTAGGCAGGGGGCTTGGT 568
rPout-Ref-27 GGATATTCCTTTCTACTCTTTGACATCATCTCACACCTTTTTTAACAACCGGATCT 569
rPout-Ref-28 GGATATTCCTTTCTACTCTTTGACATCATCTAGGTGAGGCCCTGTAATCTGTA 570
rPout-Ref-29 GGATATTCCTTTCTACTCTTTGACATCATCTACCTTAATATCAGACTTCCCAGCC 571
rPout-Ref-3 GGATATTCCTTTCTACTCTTTGACATCATCTTTTTGGGAGCTCTGAGACAGG 572
rPout-Ref-30 GGATATTCCTTTCTACTCTTTGACATCATCTCTGATGGCAAAGCAGAAGACAATA 573
rPout-Ref-31 GGATATTCCTTTCTACTCTTTGACATCATCTAGCCCTTTCAGGGAGTCCT 574
rPout-Ref-32 GGATATTCCTTTCTACTCTTTGACATCATCTTCTCTTAATCTCAGTTTTCGTTACTGTAAAAT 575
rPout-Ref-33 GGATATTCCTTTCTACTCTTTGACATCATCTCATAGCACCACTCGGTGAACTT 576
rPout-Ref-34 GGATATTCCTTTCTACTCTTTGACATCATCTAGGAGTGAGAACCCACGTACA 577
rPout-Ref-35 GGATATTCCTTTCTACTCTTTGACATCATCTCAACAGTGTGAATGTACTTAATGACACT 578
rPout-Ref-36 GGATATTCCTTTCTACTCTTTGACATCATCTCCTGTCCTGTGAGGCAGG 579
rPout-Ref-37 GGATATTCCTTTCTACTCTTTGACATCATCTTGCCCTGCTGGTGTTCTTTTATA 580
rPout-Ref-38 GGATATTCCTTTCTACTCTTTGACATCATCTTCGCTGCTGCTGTTGCT 581
rPout-Ref-39 GGATATTCCTTTCTACTCTTTGACATCATCTGGGTCCTCAGGTCCTTGTG 582
rPout-Ref-4 GGATATTCCTTTCTACTCTTTGACATCATCTGCGTTGGGAACTTCAACTGG 583
rPout-Ref-40 GGATATTCCTTTCTACTCTTTGACATCATCTTTGTAGCCCAGCATGGCAA 584
rPout-Ref-41 GGATATTCCTTTCTACTCTTTGACATCATCTTTTGCTTTTGAGGGACAGAAAATCA 585
rPout-Ref-42 GGATATTCCTTTCTACTCTTTGACATCATCTACTTGGCTAATGAGTTGATCTCTCT 586
rPout-Ref-43 GGATATTCCTTTCTACTCTTTGACATCATCTAGTTATTTTCAAAAGAAAACAAAGGACATAGATT 587
rPout-Ref-44 GGATATTCCTTTCTACTCTTTGACATCATCTGCAAAGAGTGCTCAAACCTTGG 588
rPout-Ref-45 GGATATTCCTTTCTACTCTTTGACATCATCTGTTACTAATTTTTTTGGCTATCATGCCA 589
rPout-Ref-46 GGATATTCCTTTCTACTCTTTGACATCATCTGTAGCAGAGAACCCACTTGGG 590
rPout-Ref-47 GGATATTCCTTTCTACTCTTTGACATCATCTAGCTCAAACCATATTCTTAATTTTTAAAATTCAC 591
rPout-Ref-48 GGATATTCCTTTCTACTCTTTGACATCATCTCTCCTCTGTCGTAAGTCAAGTCTTT 592
rPout-Ref-49 GGATATTCCTTTCTACTCTTTGACATCATCTCAGTCTGGTAAAGTGCTATCGAATC 593
rPout-Ref-5 GGATATTCCTTTCTACTCTTTGACATCATCTCTGAATAGTCCGTTTCGGATACTCA 594
rPout-Ref-50 GGATATTCCTTTCTACTCTTTGACATCATCTAAAAACACAAATTACCTAAACTGACTCAAG 595
rPout-Ref-6 GGATATTCCTTTCTACTCTTTGACATCATCTAGCGCCTCCCGGCT 596
rPout-Ref-7 GGATATTCCTTTCTACTCTTTGACATCATCTTGCCAGAGGTAGTGGAGGTC 597
rPout-Ref-8 GGATATTCCTTTCTACTCTTTGACATCATCTAGTGACTTGCGTTCATCTTGTTATTTA 598
rPout-Ref-9 GGATATTCCTTTCTACTCTTTGACATCATCTGGAGCCTGAAAAGGTAGGTTGG 599
I. UMI 설계
차세대 서열 분석(NGS) 라이브러리 제조 과정에서, PCR 증폭 단계는 정량화 변동을 유의적으로 증가시켜, 원래 분자 수의 작은 변화를 구별하기 어렵게 만들 수 있다. UMI 기술은 PCR 편향성을 줄이고 원래 DNA 분자의 절대 정량화를 달성하는 데 사용할 수 있다. UMI의 개념은 모든 원래 DNA 분자에 상이한 DNA 서열을 "바코드"로서 부여하여, 각 차세대 서열 분석(NGS) 판독물의 출처를 바코드 서열을 기초로 추적할 수 있도록 하는 것이다. 차세대 서열 분석(NGS) 판독물이 충분하면, 차세대 서열 분석(NGS) 출력에서 발견되는 고유한 UMI의 수는 원래 DNA 분자의 수를 반영할 수 있다. 이전에는 UMI 기술이 차세대 서열 분석(NGS) 기반 저주파 돌연변이 검출에서 오류 수정에 주로 사용되었고, 정량화에도 적용되었다. 각각의 원래 분자를 고유하게 표지화하는 것은 다수의 상이한 UMI 서열을 사용하여 달성된다. 예를 들어, 100,000개의 원래 분자에 대해 109개의 상이한 UMI 서열을 사용하면 반복된 UMI를 수반하는 <0.006% 분자를 생성하게 된다.
폴리(N)(즉, 각 위치에서 A, T, C 또는 G의 혼합)과 같은 축퇴 염기를 포함하는 DNA 서열은 종종 UMI 서열로 사용된다. QASeq에서, 폴리(H)(A, T 또는 C)는 시뮬레이션에 의해 지시된 바와 같이(도 2) 폴리(N) 또는 S(C 또는 G) 및 W(A 또는 T) 염기의 혼합에 비해 교차 결합 에너지가 약하기 때문에 UMI로서 사용된다. (H)20은 3.5 × 109개의 서로 상이한 서열을 포함하고, 이는 100,000개의 분자를 입력으로서 사용하기에 충분하며, (H)15는 1.4 × 107개의 상이한 서열을 포함하고 있어 6,000개 분자를 입력으로서 사용하기에 충분하다.
II. PCR 편향성을 줄이기 위한 스페이서
PCR 효율은 서열이 상이한 앰플리콘에 따라 가변된다. UMI는 많은 상이한 서열로 구성되기 때문에, 프라이머 및 가변 UMI 영역 사이의 스페이서를 사용하여 보다 균일한 PCR 효율을 달성할 수 있다.
스페이서가 PCR 편향성에 미치는 영향을 평가하기 위해 차세대 서열 분석(NGS)을 실시하였다(도. 3a). 주형 분자는 증폭을 위해 5’ 및 3' 말단에 2개의 어댑터를 가지며 UMI 영역은 중간에 (D)15로 구성된다. 임의의 스페이서를 포함하지 않거나(세트 1), 정방향 프라이머 및 UMI 사이에 5 nt 스페이서를 포함하고 역방향 프라이머 및 UMI 사이에 5 nt 스페이서를 포함하거나(세트 2), 또는 정방향 프라이머 및 UMI 사이에 12 nt 스페이서를 포함하고 역방향 프라이머 및 UMI 사이의 11 nt 스페이서를 포함하는(세트 3) 프라이머 3 세트를 사용하여 주형을 개별적으로 증폭시켰다. NGS 분석 전에 PCR을 통해 지수를 추가하였다. (D)15는 1.4 × 107개의 상이한 서열을 포함한다. 입력 주형 분자 번호가 가능한 서열 번호보다 훨씬 낮기 때문에, 각각의 고유한 UMI 서열만이 증폭 전에 1개의 복제를 갖는다. 동일한 UMI를 수반하는 모든 차세대 서열 분석(NGS) 판독물은 아마도 동일한 분자에서 파생된 것이다. 이와 같이, UMI 패밀리 크기(즉, 동일한 UMI를 수반하는 판독물의 수)는 PCR 효율을 나타낸다.
PCR 편향성에 대한 스페이서의 중요성을 평가하기 위해 UMI 패밀리 크기 분포를 비교하였다(도 3b). 프라이머 및 UMI 사이의 스페이서가 길수록 더 균일한 분포가 관찰되었다. 스페이서 길이가 양쪽 말단에서 10 nt보다 긴 프라이머 세트 3에서는, 유의적으로 향상된 분포가 달성되었다.
III. QASeq 워크플로우
QASeq 차세대 서열 분석(NGS) 라이브러리 제조 워크플로우의 개략도가 도 1에 도시되었다. 먼저, DNA 샘플을 모든 특이적 정방향 프라이머(SfP), 특이적 역방향 프라이머 A(SrPA), DNA 중합효소, dNTP 및 PCR 버퍼와 혼합한다. 모든 표적 유전자좌에 UMI를 추가하기 위해 2회 주기의 긴 연장(약 30분) PCR을 실시한다. 그 후, 한 DNA 분자의 각 가닥은 상이한 UMI를 수반하게 된다. 다음으로, 동일한 원래 분자에 다중 UMI가 첨가되는 것을 방지하면서 분자를 증폭시키기 위해, 어닐링 온도를 약 8ºC 올리고 범용 정방향 프라이머(UfP) 및 범용 역방향 프라이머(UrP)를 사용하여 적어도 2회 주기(예컨대, 약 7회 주기) 동안 짧은 연장(약 30초)으로 증폭을 실시한다. 반응에 범용 정방향 프라이머(UfP) 및 범용 역방향 프라이머(UrP)를 추가하는 것은 열순환기의 개방형 튜브 단계이다. SPRI 자기 비드 또는 컬럼을 사용하여 정제한 후, 어댑터 교체를 위해 SrPB 프라이머, DNA 중합효소, dNTP 및 PCR 버퍼를 PCR 생성물과 혼합하고, 적어도 1회 주기(즉, 2회 주기)의 긴 연장(약 30분) 후에, 차세대 서열 분석(NGS) 어댑터는 프라이머 이합체 또는 비특이적 생성물이 아닌 올바른 PCR 생성물에만 추가된다. SPRI 자기 비드 또는 컬럼을 사용한 다른 정제 후, 표준 차세대 서열 분석(NGS) 인덱스 PCR이 실시되고. 라이브러리가 정규화되며 일루미나 서열 분석기(illumina sequencer) 상에 로드된다.
모든 유형의 DNA 중합효소 및 PCR 슈퍼믹스를 사용할 수 있다. 사용된 특정 중합효소에 대한 표준 어닐링, 연장 및 변성 온도를(어닐링 온도가 상승하는 범용 PCR 단계를 제외하고) 따라야 한다.
IV. 대체 QASeq 워크플로우
워크플로우는 특이적 정방향 프라이머(SfP) 및 특이적 역방향 프라이머 B(SrPB)를 사용하여 2회 주기의 PCR을 사용하여 UMI를 추가한 다음 인덱스 PCR을 위한 인덱스 프라이머를 직접 추가하여 실시할 수 있다. 이를 시험하기 위해, 20세트의 특이적 정방향 프라이머(SfP) 및 특이적 역방향 프라이머 B(SrPB)가 동일한 반응에 사용되었다. 상기 방법의 실험적 표적 적중률은 매우 낮기 때문에(0.5%), 상기 방법은 진단을 위한 NGS 분석에서 유용하지 않을 수 있다(도 9a). 표적을 벗어난 차세대 서열 분석(NGS) 판독물은 대부분 프라이머 이합체였다. 제2 대체 워크플로우에서, 범용 PCR은 범용 정방향 프라이머(UfP) 및 범용 역방향 프라이머(UrP)를 사용하여 6회 주기의 범용 PCR에 대해 실시되며, 그 다음 정제 단계가 뒤따른다. 상기 추가 단계는 상이한 라이브러리에 대해 표적 적중을 12~28%(평균 표적 적중율 = 20%)로 향상시켰다(도 9b). 제2 대체 워크플로우를 기초로 제3 대체 워크플로우가 시험되었다. 이를 위해, 인덱스 PCR 후에 아가로스 겔을 사용한 크기 선택 단계를 추가하여 프라이머 이합체를 추가로 환원시켰다. 실험적 평균 표적 적중률은 42%로 개선되었지만, 여전히 50%보다 낮다(도 9c). 프라이머 이합체 환원은 범용 PCR 후 어댑터 교체 및 정제를 모두 포함하는 1차 실험 워크플로우를 사용하여 달성되었으며, 결과적으로 66%의 높은 평균 표적 적중율을 나타낸다(도 9d). 상기 언급된 워크플로우에서 프라이머 이합체의 한 출처가 도 9e에 도시되어 있다. 특이적 정방향 프라이머(SfP)의 3' 부분이 특이적 정방향 프라이머 B(SfPB)에 결합하거나, 또는 SfPB의 3' 부분이 SfP에 결합하는 경우, 5' 및 3' 말단 모두에 범용 영역이 있는 이합체 가닥이 생성되어 범용 또는 인덱스 PCR 단계에서 증폭될 수 있다.
기본 워크플로우는 인덱스 서열 및 서열 분석기의 P5/P7 서열을 앰플리콘 말단에 추가하는 최종 인덱스 PCR 단계를 포함하지만, UMI 추가, 범용 PCR 또는 어댑터 교체 단계 중에 상기에서 언급한 서열을 서열을 추가하는 대체 워크플로우가 있으므로 인덱스 PCR 단계가 필요하지 않다. 도 10a~c는 3가지 예를 도시한다. 먼저, 인덱스 및 P5 서열이 범용 정방향 프라이머(UfP)의 5'에 추가되고, 다른 인덱스 및 P7 서열은 특이적 역방향 프라이머 B(SrPB)의 5'에 추가된다. 어댑터 교체로부터 수득한 앰플리콘은 P5, P7 및 이중 인덱스를 포함하므로, 서열 분석할 준비가 되어 있다(도 10a). 둘째, 인덱스 및 P7 서열을 특이적 역방향 프라이머 B(SrPB)의 5'에 추가하고, 상기 변형된 특이적 역방향 프라이머 B(SrPB)를 어댑터 교체 단계에서 일반 P5 인덱스 프라이머와 혼합한다(도 10b). 셋째, 인덱스 및 P5 서열을 특이적 정방향 프라이머(SfP)의 5'에 추가되고, P5 서열을 수반하는 프라이머는 범용 PCR 단계에서 범용 정방향 프라이머(UfP)로서 사용된다. 다른 인덱스 및 P7 서열은 특이적 역방향 프라이머 B(SrPB)의 5'에 추가된다(도 10c).
대체 QASeq 프라이머 설계 및 워크플로우는 도 11에 도시되었다. 각 프라이머 세트는 특이적 정방향 프라이머(SfP), 특이적 역방향 프라이머 A(SrPA) 및 특이적 역방향 프라이머 B(SrPB)의 3가지 상이한 올리고를 포함한다. 특정 정방향 프라이머(SfP)는 5'에서 3' 방향으로 영역 1, 2, 3 및 4를 포함한다. 영역 4는 주형-결합 영역이고, 영역 3은 UMI이고, 영역 1은 전체 또는 부분 차세대 서열 분석(NGS) 어댑터이고, 영역 2는 UMI의 균일한 증폭을 위해 추가된 선택적 스페이서 영역(0~15nt)이다. 특이적 역방향 프라이머 A(SrPA)는 영역 5를 포함하고, 이는 주형-결합 영역이다. 특이적 역방향 프라이머 B(SrPB)는 5'에서 3’ 방향으로 영역 6, 7 및 8을 포함한다. 영역 8은 주형-결합 영역이고, 이의 3’-말단은 영역 5보다 영역 4에 1 염기만큼 가깝고, 영역 6은 전체 또는 부분 차세대 서열 분석(NGS) 어댑터이며, 영역 7은 상이한 유전자좌의 균일한 증폭을 위해 추가된 선택적 스페이서 영역(0~15nt)이다. 각 QASeq 패널 만이 영역 1을 포함하는 하나의 범용 정방향 프라이머(UfP)를 필요로 하고, 범용 정방향 프라이머(UfP)에서 영역 1의 5'-말단에 추가 염기가 있을 수 있다. 주형-결합 영역 4, 5 및 8의 용융 온도(Tm)는 PCR 어닐링 온도와 대략 동일하고, 범용 정방향 프라이머(UfP)의 Tm은 실험적 PCR 조건에서 영역 4, 5 및 8보다 낮지 않다. 원래 설계에 비해, 특이적 역방향 프라이머 A(SrPA)는 주형-결합 영역만 필요하고 범용 역방향 프라이머(UrP)는 필요하지 않다. 실험 워크플로우에서, 상기 대체 프라이머 설계의 범용 PCR 단계에서 더 많은 PCR 주기(예컨대, 최소 10회 주기)가 필요하다.
V. 데이터 분석 워크플로우
복제수 변이(CNV) 검출을 위한 데이터 분석 워크플로우의 개략도가 도 4a에 도시되었다. 첫째, 원시 차세대 서열 분석(NGS) 판독물은 앰플리콘 영역에 정렬되고, 정렬 전에 선택적 어댑터 트리밍(adapter trimming)을 실시할 수 있다. 정렬되지 않은 판독물은 폐기되고, 정렬된 판독물은 정렬된 유전자좌에 따라 분류된다.
그런 다음, 동일한 유전자좌에 정렬된 모든 판독물은 UMI 서열에 의해 추가로 분할된다. 즉, 동일한 UMI를 수반하는 판독물은 하나의 UMI 패밀리로 분류된다. UMI 패밀리 크기는 동일한 UMI를 수반하는 판독물의 수이고, 고유 UMI 번호는 한 유전자좌에 있는 상이한 UMI 서열의 총 수이다(도 4b). 다음으로, PCR 또는 차세대 서열 분석(NGS) 오류의 결과일 가능성이 있는 모든 고유 UMI 패밀리는 제거된다. 예를 들어, 설계된 UMI 패턴과 일치하지 않는 UMI 서열(예컨대, 폴리(H) UMI 서열에서 발견되는 G 염기)는 오류이므로 제거해야 한다. 또한, 두 UMI 서열이 1~2 염기 만큼만 상이할 경우, UMI 패밀리 크기가 더 작은 서열은 다른 서열에서 돌연변이될 가능성이 있으므로 선택적으로 제거할 수 있다. UMI 오류를 제거한 후, 패밀이 크기가 <F min인 UMI 패밀리가 또한 제거된다. F min은 UMI 패밀리 크기의 분포에 따라 결정되며, 대부분의 경우 F min = 4가 사용될 수 있다. UMI 제거 후 고유 UMI 번호(N)는 다음 단계에 사용된다.
표적 유전자의 추가 복제의 빈도(FEC)는 하기와 같이 계산될 수 있다:
Figure pct00024
,
여기서
Figure pct00025
은 표적 유전자 유전자좌의 전체 또는 일부에 대한 고유한 UMI 수의 합이고,
Figure pct00026
은 고려할 유전자좌의 수이고,
Figure pct00027
은 상기 표적 유전자에서 유전자좌의 전체 수 이하이고;
Figure pct00028
은 참조 유전자좌의 전체 또는 일부에 대한 고유한 UMI 수의 합이고,
Figure pct00029
은 하나의 기준에 대하여 고려할 유전자좌의 수이고,
Figure pct00030
은 상기 기준에서 유전자좌의 전체 수 이하이고;
Figure pct00031
은 고려할 기준의 수이고,
Figure pct00032
은 기준의 전체 수 이하이며;
Figure pct00033
은 실험 보정에 의해 결정된다. 임상 샘플에서 QASeq 패널을 시험하기 전에, 표적 유전자의 복제수 변이(CNV) 상태가 잘 규명된 DNA 샘플에 대해 보정 실험을 실시하였다. 미세방울 디지털 PCR(ddPCR)로 특징지어지는 CNV 상태의 정상 및 암세포주에서 추출한 gDNA를 보정에 사용할 수 있다. 일반 보정 샘플의 추가 복제의 빈도(FEC)는 0이어야 한다. 분석의 LoD도 보정 실험에 의해 결정되고, LoD는 분석에서 검출할 수 있는 추가 복제의 최소 빈도이다. 임상 샘플을 시험할 때, 관심 유전자에 대한 추가 복제의 빈도(FEC)는 복제수 변이(CNV) 상태를 추론하는 데 사용된다. FEC > LoD인 경우, 상기 샘플은 표적 유전자의 증폭을 포함하는 것으로 추론되고, FEC ≤ LoD인 경우, 상기 샘플은 표적 유전자의 결실을 포함하는 것으로 추론된다.
VI. 대립 유전자 비율 정량화
QASeq는 다중 PCR을 사용하여 1~10,000개의 게놈 유전자좌에 대한 상이한 유전적 동일성의 대립 유전자 비율을 정량화하는 데 적용할 수 있다. 표적화된 게놈 유전자좌에 대한 다중 PCR 패널 설계 및 표적화된 게놈 유전자좌의 각 가닥을 PCR에 의해 올리고뉴클레오티드 바코드 서열로 표지화한 후 고-처리량 서열 분석을 위한 게놈 영역의 증폭을 실시하기 위한 실험 워크플로우는 복제수 변이(CNV) 검출과 유사하다.
대립 유전자 비율 정량화를 위한 데이터 분석 워크플로우의 개략도가 도 12a에 도시되었다. 첫째, 원시 차세대 서열 분석(NGS) 판독물이 앰플리콘 영역에 정렬되고, 정렬 전에 선택적 어댑터 트리밍(adapter trimming)을 실시할 수 있다. 정렬되지 않은 판독물은 폐기되고, 정렬된 판독물은 정렬된 유전자좌에 따라 분류된다. 각 유전자좌에서, 차세대 서열 분석(NGS) 판독물은 UMI 서열로 나뉘고, 동일한 UMI 서열을 수반하는 모든 NGS 판독물은 하나의 UMI 패밀리로 분류된다. PCR 또는 차세대 서열 분석(NGS) 오류의 결과일 가능성이 있는 UMI 오류가 있는 고유한 UMI 패밀리는 데이터 분석 워크플로우 섹션에 설명된 대로 제거된다.
나머지 UMI 패밀리 각각에 대한 유전적 동일성(야생형 또는 돌연변이)은 다수결에 따라 검출되고, 동일한 UMI 패밀리의 부재들(판독물) 중 최소 70%로 유전적 동일성이 뒷받침되어야 한다. 도 12b의 예로서, UMI 제품군 크기 = 7인 UMI 패밀리의 경우 7개의 모든 판독물이 동일한 UMI 서열(2D 바코드로 표시됨)을 공유한다. 관심 유전자좌의 유전적 동일성은 6개의 판독물의 경우 'A', 1개의 판독물의 경우 'G'이다. UMI 패밀리의 판독물 중 70% 초과가 'A'를 지원하므로, 상기 UMI 패밀리의 유전적 동일성을 'A'라고 한다. 1개의 판독물은 PCR 또는 차세대 서열 분석(NGS) 오류의 결과인 'G'에 해당한다. 하나의 공통된 유전적 동일성을 뒷받침하는 70% 초과의 판독물이 없는 UMI 패밀리는 폐기된다.
다음으로, 고유한 UMI 번호 N(한 유전자좌에서 상이한 UMI 서열의 총 수)은 표적화된 유전자좌에서 각각 상이한 유전적 동일성에 대해 계산되고, N은 원래 가닥의 수를 나타낸다. 표적 유전자좌에 대한 대립 유전자 비율은 R 대립유전자 = N 1 /N 2으로 정의되고, 여기서 N 1은 제1 유전적 동일성에 대한 고유한 UMI 번호이며, N 2는 제2 유전적 동일성에 대한 고유한 UMI 번호이다.
VII. 정의
본원에 사용된 "증폭"은 뉴클레오티드 서열 또는 서열들의 복제 수를 증가시키기 위한 임의의 시험관내 과정을 지칭한다. 핵산 증폭은 뉴클레오티드를 DNA 또는 RNA로 통합하는 결과를 가져온다. 본원에 사용된 바와 같이, 하나의 증폭 반응은 여러 차례의 DNA 복제로 구성될 수 있다. 예를 들어, 하나의 PCR 반응은 변성 및 복제의 30~100회의 "주기"로 구성될 수 있다.
"중합 효소 연쇄 반응" 또는 "PCR"은 DNA의 상보적 가닥의 동시 프라이머 연장에 의한 특정 DNA 서열의 시험관내 증폭을 위한 반응을 의미한다. 다시 말해서, PCR은 프라이머 결합 부위에 의해 플랭킹된(flanked) 표적 핵산의 다중 복제 또는 복제물을 만드는 반응이며, 상기 반응은 하기의 단계의 하나 이상의 반복을 포함한다: (i) 표적 핵산을 변성시키고, (ii) 프라이머 결합 부위에 프라이머를 어닐링하고, (iii) 뉴클레오시드 트리포스페이트의 존재 하에 핵산 중합효소에 의해 프라이머를 연장하는 단계. 일반적으로, 상기 반응은 열 순환기 기기의 각 단계에 최적화된 상이한 온도들을 통해 순환된다. 특정 온도, 각 단계에서의 지속 시간, 및 단계 간의 변화율은 당업자에게 일반적으로 공지된 많은 요인에 따라, 예컨대 참고문헌에 예시된 바와 같이 달라진다: McPherson et al., editors, PCR: A Practical Approach and PCR2: A Practical Approach (IRL Press, Oxford, 1991 and 1995, 각각).
"프라이머"는 폴리뉴클레오티드 주형으로 이중체를 형성할 때 핵산 합성의 개시점으로 작용할 수 있고 상기 주형을 따라 3' 말단으로부터 연장되어 연장된 이중체가 형성될 수 있는 천연 또는 합성 올리고뉴클레오티드를 의미한다. 연장 과정에서 추가되는 뉴클레오티의 서열은 주형 폴리뉴클레오티드의 서열에 의해 결정된다. 일반적으로 프라이머는 DNA 중합효소에 의해 연장된다. 프라이머는 일반적으로 프라이머 연장 생성물의 합성에 사용하기에 적합한 길이를 가지며, 일반적으로 길이가 8 내지 100개의 뉴클레오티드 범위, 예컨대 10 내지 75, 15 내지 60, 15 내지 40, 18 내지 30, 20 내지 40, 21 내지 50, 22 내지 45, 25 내지 40 등, 보다 전형적으로 18 내지 40, 20 내지 35, 21 내지 30개의 뉴클레오티드 범위의 길이, 및 명시된 범위 사이의 임의의 길이를 갖는다. 전형적인 프라이머는 10~50개의 뉴클레오티드 범위의 길이, 예컨대 15~45, 18~40, 20~30, 21~25개 등의 뉴클레오티드 범위의 길이, 및 명시된 범위 사이의 임의의 길이를 갖는다. 일부 구현예들에서, 상기 프라이머는 일반적으로 약 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65 또는 70개 이하의 뉴클레오티드 길이를 갖는다.
본원에서 사용된 "통합하는"은 핵산 중합체의 일부가 되는 것을 의미한다.
본원에서 사용된 용어 "외인성 조작의 부재 하에"는 핵산 분자가 변형되는 용액을 변경하지 않고 핵산 분자가 변형되는 것을 지칭한다. 특정 구현예들에서, 이는 사람이 손대지 않는 경우 또는 완충 조건이라고도 하는 용액 조건을 변경하는 기계 장치가 없는 경우에 발생한다. 하지만, 변형 중에 온도 변화가 발생할 수 있다.
"뉴클레오시드"는 염기-당 조합, 즉 인산염이 없는 뉴클레오티드이다. 뉴클레오시드 및 뉴클레오티드라는 용어의 사용에 있어 특정한 상호 변경 가능성이 있다는 것이 당업계에서 인식되고 있다. 예를 들어, 뉴클레오티드 데옥시우리딘 삼인산, dUTP는 데옥시리보뉴클레오시드 삼인산이다. DNA에 결합된 후, 공식적으로 데옥시우리딜산, 즉 dUMP 또는 옥시우리딘 일인산인 DNA 단량체 역할을 한다. 결과로서 생성된 DNA에 dUTP 모이어티가 없더라도 dUTP를 DNA에 통합한다고 말할 수 있다. 유사하게, 단지 기질 분자의 일부일지라도 데옥시우리딘을 DNA에 통합한다고 말할 수 있다.
본원에서 사용된 "뉴클레오티드"는 염기-당-인산의 조합을 나타내는 기술 용어이다. 뉴클레오티드는 핵산 중합체, 즉 DNA 및 RNA의 단량체 단위이다. 상기 용어는 리보뉴클레오티드 삼인산, 예컨대 rATP, rCTP, rGTP 또는 rUTP, 및 데옥시리보뉴클레오티드 삼인산, 예컨대 dATP, dCTP, dUTP, dGTP 또는 dTTP를 포함한다.
"핵산" 또는 "폴리뉴클레오티드"라는 용어는 일반적으로 적어도 하나의 핵염기, 예컨대, 예를 들어 DNA(예컨대, 아데닌 "A", 구아닌 "G", 티민 "T" 및 시토신 "C") 또는 RNA(예컨대, A, G, 우라실 "U" 및 C)에서 발견되는 자연 발생 퓨린 또는 피리미딘 염기를 포함하는 DNA, RNA, DNA-RNA 키메라 또는 이의 유도체 또는 유사체의 적어도 한 분자 또는 가닥을 지칭하게 된다. 용어 "핵산"은 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"를 수반한다. 본원에서 사용된 "올리고뉴클레오티드"는 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"라는 두 가지 기술 용어를 집합적으로 및 상호교환 가능하게 지칭한다. 올리고뉴클레오티드 및 폴리뉴클레오티드는 별개의 기술 용어이지만, 두 용어 사이에 정확한 구분선이 없으며 본원에서 상호교환가능하게 사용된다는 점에 유의한다. 용어 "어댑터"는 또한 용어 "올리고뉴클레오티드" 및 "폴리뉴클레오티드"와 상호교환적으로 사용될 수 있다. 또한, 용어 "어댑터"는 선형 어댑터(단일 가닥 또는 이중 가닥) 또는 스템-루프(stem-loop) 어댑터를 나타낼 수 있다. 상기 정의들은 일반적으로 적어도 하나의 단일 가닥 분자를 지칭하지만, 특정 구현예들에서는 또한 적어도 하나의 단일 가닥 분자에 부분적으로, 실질적으로 또는 완전히 상보적인 적어도 하나의 추가 가닥을 수반할 것이다. 따라서, 핵산은 분자의 가닥을 포함하는 특정 서열의 하나 이상의 상보적 가닥(들) 또는 "보체(들)"를 포함하는 하나 이상의 이중 가닥 분자 또는 하나 이상의 삼중 가닥 분자를 수반할 수 있다. 본원에서 사용된 단일 가닥 핵산은 접두사 "ss"로, 이중 가닥 핵산은 접두사 "ds"로, 삼중 가닥 핵산은 접두사 "ts"로 표시할 수 있다.
"핵산 분자" 또는 "핵산 표적 분자"는 표준 정규 염기, 초변형 염기, 비천연 염기, 또는 이의 염기의 임의의 조합을 포함하는 임의의 단일 가닥 또는 이중 가닥 핵산 분자를 지칭한다. 예를 들어 제한 없이, 상기 핵산 분자는 4개의 정규 DNA 염기(아데닌, 시토신, 구아닌 및 티민) 및/또는 4개의 정규 RNA 염기(아데닌, 시토신, 구아닌 및 우라실)를 포함한다. 뉴클레오시드가 2'-데옥시리보스 기를 함유할 때 우라실은 티민으로 대체될 수 있다. 상기 핵산 분자는 RNA에서 DNA로, DNA에서 RNA로 변형될 수 있다. 예를 들어 제한 없이, mRNA는 역전사효소를 사용하여 상보적 DNA(cDNA)로 생성될 수 있고, DNA는 RNA 중합효소를 사용하여 RNA로 생성될 수 있다. 핵산 분자는 생물학적 또는 합성 기원일 수 있다. 핵산 분자의 예는 게놈 DNA, cDNA, RNA, DNA/RNA 하이브리드, 증폭된 DNA, 기존 핵산 라이브러리 등을 포함한다. 핵산은 인간 샘플, 예컨대 혈액, 혈청, 혈장, 뇌척수액, 뺨 찰과상, 생검, 정액, 소변, 대변, 타액, 땀 등으로부터 수득될 수 있다. 핵산 분자는 다양한 처리, 예컨대 복구 처리 및 단편화 처리를 실시할 수 있다. 단편화 처리는 기계적, 음파 및 유체역학적 전단을 포함한다. 복구 처리는 연장 및/또는 결찰을 통한 흠집 복구, 무딘 말단을 생성하기 위한 연마, 손상된 염기의 제거, 예컨대 탈아미노화, 유도체화, 염기성 또는 가교 뉴클레오티드 등을 포함한다. 관심 핵산 분자는 화학적 변형(예컨대,중아황산염 전환, 메틸화/탈메틸화), 연장, 증폭(예컨대, PCR, 등온 등) 등이 실시될 수 있다.
"상보적" 또는 "보체(들)"인 핵산(들)은 표준 왓슨-크릭(Watson-Crick), 후그스틴(Hoogsteen) 또는 역 후그스틴 결합 상보성 규칙에 따라 염기쌍을 형성할 수 있는 것들이다. 본원에서 사용된 용어 "상보적" 또는 "보체(들)"은 상기 기재된 동일한 뉴클레오티드 비교에 의해 평가될 수 있는 바와 같이 실질적으로 상보적인 핵산(들)을 지칭할 수 있다. "실질적으로 상보적인"이라는 용어는 연속적인 핵염기의 적어도 하나의 서열을 포함하는 핵산을 지칭하거나, 또는 하나 이상의 핵염기 모이어티가 분자에 존재하지 않는 경우, 모두보다 적은 핵염기가 대응하는 핵염기와 염기쌍을 이루지 않더라도 반연속적인 핵염기는 적어도 하나의 핵산 가닥 또는 이중체에 혼성화될 수 있다. 특정 구현예들에서, "실질적으로 상보적인" 핵산은 핵염기 서열의 약 70%, 약 71%, 약 72%, 약 73%, 약 74%, 약 75%, 약 76%, 약 77%, 약 77%, 약 78%, 약 79%, 약 80%, 약 81%, 약 82%, 약 83%, 약 84%, 약 85%, 약 86%, 약 87%, 약 88%, 약 89 %, 약 90%, 약 91%, 약 92%, 약 93%, 약 94%, 약 95%, 약 96%, 약 97%, 약 98%, 약 99%, 약 100%, 및 그 안에서 임의의 범위가 혼성화 중에 적어도 하나의 단일 또는 이중 가닥 핵산 분자와 염기쌍을 형성할 수 있다. 특정 구현예들에서, 용어 "실질적으로 상보적인"은 엄격한 조건에서 하나 이상의 핵산 가닥 또는 이중체에 혼성화될 수 있는 하나 이상의 핵산을 지칭한다. 특정 구현예들에서, "부분적으로 상보적인" 핵산은 덜 엄격한 조건에서 적어도 하나의 단일 또는 이중 가닥 핵산에 혼성화될 수 있는 적어도 하나의 서열을 포함하거나, 또는 핵염기 서열의 약 70%가 혼성화 중에 하나 이상의 단일 또는 이중 가닥 핵산 분자와 염기쌍을 형성할 수 있는 적어도 하나의 서열을 포함한다.
"비상보적"이라는 용어는 특정 수소 결합을 통해 하나 이상의 왓슨-크릭 염기쌍을 형성하는 능력이 부족한 핵산 서열을 지칭한다.
본원에서 사용된 용어 "축퇴"는 정의된 서열과는 대조적으로, 동일성이 다양한 선택의 뉴클레오티드로부터 선택될 수 있는 뉴클레오티드 또는 일련의 뉴클레오티드를 지칭한다. 특정 구현예들에서, 2개 이상의 상이한 뉴클레오티드로부터 선택이 이루어질 수 있다. 추가적인 특정 구현예들에서, 하나의 특정 위치에서 뉴클레오티드의 선택은 퓨린에서만, 피리미딘에서만, 또는 쌍을 이루지 않는 퓨린 및 피리미딘으로부터의 선택을 포함한다.
"샘플"은 관심 핵산을 포함하는 신선하거나 보존된 생물학적 샘플 또는 합성 생성 출처로부터 수득하거나 분리된 물질을 의미한다. 샘플은 적어도 하나의 세포, 태아 세포, 세포 배양물, 조직 표본, 혈액, 혈청, 혈장, 타액, 소변, 눈물, 질 분비물, 땀, 림프액, 뇌척수액, 점막 분비물, 복막액, 복수액, 대변 물질, 신체 삼출물, 제대혈, 융모막 융모, 양수, 배아 조직, 다세포 배아, 용해물, 추출물, 용액 또는 관심 면역 핵산을 함유하는 것으로 의심되는 반응 혼합물을 포함할 수 있다. 샘플은 또한 비인간 출처, 예컨대 비인간 영장류, 설치류 및 기타 포유동물, 기타 동물, 식물, 진균, 박테리아 및 바이러스를 포함할 수 있다.
뉴클레오티드 서열과 관련하여 본원에서 사용된 "실질적으로 공지된"은 증폭을 포함하여 핵산 분자의 제조를 허용하기에 충분한 서열 정보를 갖는 것을 지칭한다. 이는 일부 구현예들에서 어댑터 서열의 일부가 무작위적이거나 퇴화되지만 일반적으로 약 100%일 것이다. 따라서, 특정 구현예들에서, 실질적으로 공지된 것은 약 50% 내지 약 100%, 약 60% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 90% 내지 약 100%, 약 95% 내지 약 100%, 약 97% 내지 약 100%, 약 98% 내지 약 100%, 또는 약 99% 내지 약 100%를 지칭한다.
VIII. 표적 핵산의 추가 처리
A. DNA 증폭
주어진 주형 샘플에 존재하는 핵산을 증폭하기 위해 많은 주형-의존적 과정이 입수 가능하다. 가장 일반적으로 공지된 증폭 방법 중 하나는 중합효소 연쇄 반응(PCRTM이라고 함)으로, 미국 특허 제 4,683,195호, 4,683,202호, 4,800,159호 및 Innis et al., 1990에 자세히 설명되어 있으며, 각각은 전체가 본원에 원용된다. 간단히 말해서, 증폭될 주형 DNA의 두 영역(각 가닥에 대해 하나씩)에 상보적인 2개의 합성 올리고뉴클레오티드 프라이머는 과량의 데옥시뉴클레오티드(dNTP) 및 열안정성 중합효소, 예컨대, 예를 들어 Taq(Thermus Aquaticus) DNA 중합효소의 존재 하에 주형 DNA(순수할 필요 없음)에 추가된다. 일련의 온도 주기(일반적으로 30~35)에서, 표적 DNA는 반복적으로 변성되고(약 90°C), 프라이머(일반적으로 50~60°C) 및 프라이머(72°C)로부터 연장된 딸 가닥에 어닐링된다. 상기 딸 가닥이 생성되면, 후속 주기에서 주형 역할을 한다. 따라서, 두 프라이머 사이의 주형 영역은 선형이 아닌 지수적으로 증폭된다.
B. DNA 서열 분석
어댑터 연결 단편 라이브러리의 서열 분석을 위해 방법들이 또한 제공된다. 당업자에게 공지된 핵산을 서열 분석하기 위한 임의의 기술이 본 개시의 방법에 사용될 수 있다. DNA 서열 분석 기술은 표지된 종결자 또는 프라이머를 사용한 고전적인 디데옥시 서열 분석 반응(생어(Sanger) 방법) 및 슬래브 또는 모세관에서의 겔 분리, 가역적으로 종결된 표지된 뉴클레오티드를 사용한 합성에 의한 서열 분석, 파이로시퀀싱(pyrosequencing), 454 서열 분석, 표지된 올리고뉴클레오티드 프로브 라이브러리에 대한 대립 유전자 특이적 혼성화, 결찰이 뒤따르는 표지된 클론 라이브러리에 대한 대립 유전자 특이적 혼성화를 사용한 합성에 의한 서열 분석, 중합 단계 중에 표지된 뉴클레오티드 통합의 실시간 모니터링, 및 SOLiD 서열 분석을 포함한다.
핵산 라이브러리는 일루미나 서열 분석, 예컨대 넥스테라(Nextera)™ DNA 샘플 제조 키트와 호환되는 접근 방식으로 생성될 수 있고, 일루미나 차세대 서열 분석 라이브러리 제제를 생성하기 위한 추가적인 접근 방식은, 예컨대 Oyola et al. (2012)에 설명된다. 다른 구현예들에서, 핵산 라이브러리는 SOLiDTM 또는 이온 토렌트(Ion Torrent) 서열 분석 방법(예컨대, 솔리드(SOLiD)® 단편 라이브러리 구축 키트, 솔리드® 메이트-페어드(Mate-Paired) 라이브러리 구축 키트, 솔리드® ChIP-Seq 키트, 솔리드® 토탈 RNA-Seq 키트, 솔리드® SAGE™ 키트, 암비온(Ambion)® RNA-Seq 라이브러리 구축 키트 등)과 호환되는 방법으로 생성된다. 본 발명의 구현예들과 함께 사용될 수 있는 다양한 라이브러리 구축 방법을 포함한 차세대 서열 분석 방법을 위한 추가적인 방법이, 예컨대 Pareek(2011) 및 Thudi(2012)에 설명되었다.
특정 양태들에서, 본 개시의 방법에 사용되는 서열 분석 기술은 HiSeq™ 시스템(예컨대, HiSeq™ 2000 및 HiSeq™ 1000), NextSeq™ 500, 및 일루미나 사(Illumina, Inc.)의 MiSeq™ 시스템을 포함한다. 상기 HiSeq™ 시스템은 무작위로 단편화된 게놈 DNA를 평면의 광학적으로 투명한 표면에 부착하고 고체상 증폭을 사용하여 수백만 개의 단편에 대한 대규모 병렬 서열 분석을 기초로 하여 각각 평방 cm 당 약 1,000개의 주형 복제를 포함하는 수백만 개의 클러스터로 고밀도 서열 분석 흐름 세포를 생성한다. 상기 주형은 합성에 의한 4색 DNA 서열 분석 기술을 사용하여 서열 분석된다. 상기 MiSeq™ 시스템은 일루미나의 가역적 종결자 기반의 합성에 의한 서열 분석인 TruSeq™를 사용한다.
본 개시의 방법에 사용될 수 있는 DNA 서열 분석 기술의 다른 예는 454 서열 분석(로슈(Roche))(Margulies et al., 2005)이다. 454 서열 분석은 두 단계를 포함한다. 제1 단계에서, DNA는 약 300~800개의 염기쌍의 단편으로 절단되고, 상기 단편은 무딘 말단이다. 그런 다음, 올리고뉴클레오티드 어댑터는 단편의 말단에 결찰된다. 상기 어댑터는 상기 단편의 증폭 및 서열 분석을 위한 프라이머 역할을 한다. 상기 단편은, 예컨대 5'-비오틴 태그를 포함하는 어댑터 B를 사용하여 DNA 포획 비드, 예컨대 스트렙타비딘 코팅된 비드에 부착될 수 있다. 상기 비드에 부착된 단편은 오일-물 유제의 액적 내에서 PCR 증폭된다. 결과로서 각 비드 상에 클론 증폭된 DNA 단편의 다수의 복제가 생성된다. 제2 단계에서, 상기 비드는 웰(피코-리터 크기)에 포획된다. 파이로시퀀싱(pyrosequencing)은 각 DNA 단편 상에 병렬로 실시된다. 하나 이상의 뉴클레오티드를 추가하면 서열 분석 기기의 CCD 카메라에 의해 기록되는 광 신호가 생성된다. 신호 강도는 통합된 뉴클레오티드의 수에 비례한다.
본 개시의 방법에 사용될 수 있는 DNA 서열 분석 기술의 다른 예는 솔리드(SOLiD) 기술(라이프 테크놀로지스 사(Life Technologies, Inc.))이다. 솔리드 서열 분석에서, 게놈 DNA는 단편으로 절단되고, 어댑터는 단편의 5' 및 3' 말단에 부착되어 단편 라이브러리를 생성한다. 대안적으로, 내부 어댑터는 단편의 5' 및 3' 말단에 어댑터를 결찰하고, 단편을 원형화하고, 원형화된 단편을 분해하여 내부 어댑터를 생성하고, 결과로서 생성된 단편의 5' 및 3' 말단에 어댑터를 부착함으로써 짝으로 쌍을 이루는 라이브러리를 생성함으로써 도입될 수 있다. 다음으로, 클론 비드 군은 비드, 프라이머, 주형 및 PCR 구성 요소를 포함하는 마이크로반응기에서 제조된다. PCR 후, 상기 주형이 변성되고 비드가 농축되어 연장된 주형으로 상기 비드를 분리한다. 선택한 비드의 주형은 유리 슬라이드에 결합할 수 있도록 3' 변형이 실시된다.
본 개시의 방법에 사용될 수 있는 DNA 서열 분석 기술의 다른 예는 이온 토렌트 시스템(라이프 테크놀로지스 사)이다. 이온 토렌트는 고밀도 배열의 미세 가공 웰을 사용하여 상기 생화학 공정을 대규모 병렬 방식으로 실시한다. 각 웰은 상이한 DNA 주형을 유지한다. 상기 웰 아래에는 이온 민감성 층이 있고 상기 아래에는 독점적인 이온 센서가 있다. 예를 들어, C와 같은 뉴클레오티드가 DNA 주형에 추가된 다음, DNA 가닥에 통합되면 수소 이온이 방출된다. 상기 이온의 전하는 독점 이온 센서로 검출할 수 있는 용액의 pH를 변경한다. 서열 분석기는 화학 정보로부터 디지털 정보로 직접 이동하여 염기를 호출한다. 그런 다음, 이온 PGM™(Ion Personal Genome Machine) 서열 분석기는 칩에 차례로 하나의 뉴클레오티드를 플러딩(flooding)한다. 상기 칩을 플러딩하는 다음 뉴클레오티드가 일치하지 않으면, 전압 변화가 기록되지 않고 염기가 호출되지 않는다. DNA 가닥 상에 2개의 동일한 염기가 있으면, 상기 전압이 두 배가 되고 상기 칩은 호출된 2개의 동일한 염기를 기록한다. 스캐닝, 카메라, 조명 없이 직접 검출하기 때문에, 각 뉴클레오티드 통합이 몇 초 만에 기록된다.
본 개시의 방법에 사용될 수 있는 서열 분석 기술의 다른 예는 퍼시픽 바이오사이언스(Pacific Biosciences)의 단일 분자, 실시간(single molecule, real-time, SMRT™) 기술을 포함한다. SMRT™에서, 4개의 DNA 염기 각각은 4개의 상이한 형광 염료 중 하나에 부착된다. 상기 염료는 인산 결합되어 있다. 단일 DNA 중합효소는 제로 모드 도파관(ZMW)의 바닥에 있는 주형 단일 가닥 DNA의 단일 분자로 고정된다. 제로 모드 도파관(ZMW)은 ZMW 안팎으로 빠르게 확산되는(마이크로초 단위) 형광 뉴클레오티드를 배경으로 DNA 중합효소에 의한 단일 뉴클레오티드의 통합을 관찰할 수 있는 구속 구조이다. 뉴클레오티드를 성장하는 가닥에 통합하는 데 몇 밀리초가 걸린다. 상기 시간 동안, 형광 표지는 여기되어 형광 신호를 생성하고, 형광 태그는 절단된다. 염료의 해당 형광 검출은 어떤 염기가 포함되었는지 나타낸다. 상기 프로세스가 반복된다.
추가 서열 분석 플랫폼은 CGA 플랫폼(컴플리트 제노믹스(Complete Genomics))를 포함한다. 상기 CGA 기술은 원형 DNA 라이브러리의 제조 및 회전환 증폭(rolling circle amplification, RCA)을 기초로 하여 고체 지지체 상에 배열된 DNA 나노볼을 생성한다(Drmanac et al. 2009). 컴플리트 제노믹스의 CGA 플랫폼은 서열 분석을 위해 cPAL(조합의 프로브 앵커 결찰)이라는 신규 전략을 사용한다. 상기 과정은 앵커 분자 및 고유한 어댑터 중 하나 간의 혼성화로 시작된다. 4개의 축퇴 9-mer 올리고뉴클레오티드는 상기 프로브의 제1 위치에 있는 특정 뉴클레오티드(A, C, G 또는 T)에 해당하는 특정 형광단으로 표지된다. 서열 결정은 정확한 매칭 프로브가 주형에 혼성화되고 T4 DNA 리가아제를 사용하여 상기 앵커에 결찰되는 반응에서 발생한다. 결찰된 생성물의 영상화 후, 결찰된 앵커-프로브 분자가 변성된다. n + 1, n + 2, n + 3 및 n + 4 위치에 공지된 염기를 포함하는 형광 표지된 9-mer 프로브의 새로운 세트를 사용하여 혼성화, 결찰, 영상화 및 변성 과정을 5회 반복한다.
IX. 키트
본원의 기술은 DNA 샘플의 복제 수 변이 또는 대립 유전자 빈도를 분석하기 위한 키트를 포함한다. "키트"는 물리적 요소의 조합을 지칭한다. 예를 들어, 키트는, 예를 들어 하나 이상의 구성요소, 예컨대 핵산 프라이머, 효소, 반응 완충액, 지침 시트, 및 본원에 기재된 기술을 실시하는 데 유용한 기타 요소들을 포함할 수 있다. 상기 물리적 요소는 본 발명을 실시하기에 적합한 임의의 방식으로 배열될 수 있다.
상기 키트의 구성요소는 수성 매체 또는 동결건조된 형태로 포장될 수 있다. 상기 키트의 용기 수단은 일반적으로 하나 이상의 바이알, 시험관, 플라스크, 병, 주사기 또는 기타 용기 수단을 포함할 것이며, 그 안에 성분이 배치될 수 있고, 바람직하게는 적절하게 분취될 수 있다(예컨대, 미세역가 플레이트의 웰에 분취됨). 상기 키트에 하나를 초과하는 구성 요소가 있는 경우, 상기 키트는 일반적으로 추가 구성요소가 별도로 배치될 수 있는 제2, 제3 또는 기타 추가 용기를 포함할 것이다. 하지만, 성분들의 다양한 조합이 단일 바이알에 포함될 수 있다. 본 발명의 키트는 또한 전형적으로 핵산을 포함하기 위한 수단, 및 상업적 판매를 위해 밀폐된 임의의 다른 시약 용기를 포함할 것이다. 상기 용기는 원하는 바이알이 유지되는 사출 또는 블로우 성형 플라스틱 용기를 포함할 수 있다. 키트는 또한 키트 구성요소를 사용하는 지침뿐만 아니라 상기 키트에 포함되지 않은 다른 시약의 사용에 대한 지침도 포함한다. 지침에는 구현할 수 있는 변형이 포함될 수 있다.
X. 실시예
하기의 실시예가 본 발명의 바람직한 구현예를 설명하기 위해 포함된다. 하기의 실시예에 개시된 기술이 본 발명의 실시에서 본 발명자에 의해 잘 기능하는 것으로 확인된 기술을 나타내며, 따라서 본 발명의 실시의 바람직한 방식을 구성하는 것으로 간주될 수 있음을 당업자는 이해할 것이다. 그러나, 당업자는 본 개시에 비추어, 개시된 특정 구현예에 많은 변화가 이루어질 수 있으며 본 발명의 사상 및 범주를 벗어나지 않으면서 동일하거나 유사한 결과를 얻을 수 있음을 이해해야 한다.
예 1 - 보정 결과
ERBB2 QASeq 패널의 예시적인 보정 실험은 ERBB2 증폭을 포함하지 않아야 하는 정상 세포주 gDNA 샘플 NA18562에서 실시되어 정량 가변성 및 잠재적 LoD를 분석하였다. 워크플로우는 "QASeq 워크플로우" 섹션에서 설명된 바와 같다. Taq 중합효소는 모든 PCR 단계에서 사용되었다. 변성은 95ºC에서 실시되고, 어닐링/연장은 60ºC에서 실시되었다(범용 PCR 단계를 제외하고는 어닐링/연장은 68ºC에서 실시되었다). UMI가 부착된 모든 원래 분자는 차세대 서열 분석(NGS) 출력에 존재해야 하기 때문에, 각 분자/UMI에 대해 15개의 판독물이 확보되었다. 2500개의 반수체 게놈 복제 및 20개의 앰플리콘 패널을 입력하는 경우, 필요한 총 판독물은 약 2 × 2500 × 20 × 15 = 1,500,000이다. 한 DNA 이중체의 각 가닥은 상기 워크플로우에서 상이한 UMI를 수반하므로, 2500개의 반수체 게놈 복제 = 5000개의 분자 수 = 8.3 ng gDNA이다. 상기 실험은 일루미나 MiSeq 기기에서 실시되었다.
차세대 서열 분석(NGS) 판독물을 앰플리콘 서열에 정렬하기 위해 정확한 문자열 일치가 사용되었고, 정렬 비율은 상이한 라이브러리에 대해 50%에서 70% 사이였다. 다음으로, UMI 패밀리 크기 및 고유한 UMI 번호를 분석하였다. UMI 패밀리 크기의 분포는 대부분의 유전자좌에 대해
Figure pct00034
20에서 정점에 달하였다(도 5). 명백한 PCR 오류를 포함하는 UMI 패밀리(즉, 폴리(H) UMI 서열에서 발견되는 G 염기) 및 패밀리 크기가 <4인 UMI는 제거되었다(도 5). UMI 부착률이 완벽하다면, 고유한 UMI 수는 샘플의 원래 분자 수와 같아야 한다. 2500개의 반수체 게놈 복제(5000개 분자)의 입력에 대해, 유전자좌에 따라 632개에서 3065개 사이의 고유한 UMI 수가 수득되었다(도 6).
상기 분석의 LoD를 추정하기 위해, 라이브러리는 4가지 상이한 DNA 입력에 대해 제조되었다: 75, 250, 750 및 2500개의 반수체 게놈 복제; 각 조건은 5번 반복되었다. 상기 샘플의 복제수 변이(CNV) 비율은 "데이터 분석 워크플로우" 섹션에 설명된 대로 계산되었다. 5회 반복에 대한 복제수 변이(CNV) 비율(σCNV비율)의 표준 편차를 사용하여 정량 가변성을 평가하였고, 상기 분석의 LoD는 3σCNV비율로 추정할 수 있다. 이론적인 σCNV비율을 계산하기 위해 시뮬레이션도 실시하였고, 입력 분자 수가 증가하면 σCNV비율 및 LoD가 감소해야 함을 유념한다. 상기 σCNV비율는 이론값보다 높았고(도 7), UMI 부착 편향성 및 증폭 편향성을 제거할 수 없기 때문에 예상한 바와 같았다. 현재 최고의 σCNV비율은 2500개의 반수체 게놈 복제 입력에서 1%이고, 보수적으로 4개의 데이터 포인트 모두를 기초로 하는 선형 근사치가 사용되었고, σCNV비율 = 2%가 수득되어, 예상 LoD는 추가 복제의 약 6%였다. 50,000개의 반수체 게놈 복제 입력에 대한 외삽에 기초하여 잠재적 σCNV비율은 0.3%이고 LoD는 약 1%였다. LoD를 평가하는 또 다른 방법은 추가 복제의 상이한 빈도를 포함하는 일련의 보정 샘플을 시험하는 것이고, 추가 복제의 검출 가능한 가장 낮은 빈도는 LoD이다.
실시예 2 - FFPE 샘플에서 복제수 변이(CNV) 검출 결과
2개의 FFPE 슬라이드는 "다중 PCR 패널 설계" 섹션 및 실시예 1에 설명된 예시 ERBB2 패널을 사용하여 분석하였다. 상기 FFPE 슬라이드(애스터랜드(Asterand)에서 구매)는 ERBB2 복제수 변이(CNV)를 포함하지 않을 것으로 예상되는 동일한 폐암 종양에서 유래하였다. 먼저, QIAamp DNA FFPE 조직 키트(키아겐(Qiagen))를 사용하여 DNA를 추출하고 샘플당 >6 μg의 DNA를 수득하였다. 라이브러리는 실시예 1에 기재된 것과 동일한 방법을 사용하여 제조하였다. 8.3 ng의 추출된 DNA가 각 라이브러리에 사용되었으며, 이는 2500개의 반수체 게놈 복제 및 5000개 분자의 입력에 해당한다. 각 라이브러리에 대해 확보된 차세대 서열 분석(NGS) 판독물 수(1,500,000개 판독물)는 2500개의 반수체 게놈 복제 입력 세포주 gDNA 라이브러리와 동일하였다.
데이터 분석은 실시예 1에 기재된 것과 동일한 방법을 사용하여 실시하였다. 세포주 gDNA 라이브러리에 대한 유사한 패턴의 UMI 패밀리 크기 분포가 수득되었다(도 8a). 고유한 UMI 수는 2500개의 반수체 게놈 복제가 입력된 세포주 gDNA 라이브러리보다 작았다. FFPE 샘플의 UMI 부착 수율은 평균적으로 세포주 gDNA의 약 1/4로, 이는 세포주 gDNA 샘플과 동일한 LoD를 달성하기 위해 300% 초과의 FFPE DNA를 로드해야 함을 나타낸다(도 8b).
계산된 FFPE 샘플의 복제수 변이(CNV) 비율을 도 8c에 나타내었다 상기 분석의 추정된 LoD = 15%는 FFPE 라이브러리와 유사한 고유 UMI 수를 갖는 750개의 반수체 게놈 복제 입력 세포주 gDNA에 대한 보정 결과를 기초로 하였다. 현재의 결과에 따르면, 상기 FFPE 슬라이드에서는 ERBB2의 복제수 변이(CNV)가 검출되지 않았다. 입력 분자 수가 증가함에 따라 LoD가 감소하기 때문에, 2500개의 반수체 게놈 복제 입력 세포주 gDNA에 대한 보정 결과를 기초로 6%의 LoD를 달성할 수 있다.
실시예 3 - 급증하는 임상 FFPE 샘플의 복제수 변이(CNV) 정량화 결과
100-플렉스 QASeq 패널을 사용하여 유방암 FFPE 샘플에서 ERBB2의 배수성을 정량화하였다. 50-플렉스는 ERBB2 유전자 영역에 있었고(프라이머 서열은 표 3을 참조, 프라이머 이름에는 "ERBB2"가 있음), 50-플렉스는 참조로서 염색체 17의 단완(short arm)에 있었다(프라이머 서열은 표 3을 참조; 프라이머 이름에는 "Ref"가 있음).
이전에 특성화된 2개의 FFPE DNA 샘플(1개의 "정상" 샘플 및 1개의 "ERBB2 증폭된 비정상" 샘플)을 혼합하여 2.5%, 5% 및 10% ERBB2 FEC 샘플을 생성하였다. "정상" 샘플 DNA는 ERBB2 증폭(FEC = 0%)이 없어야 하는 FFPE 폐암 샘플(애스터랜드에서 구매)에서 추출하였고, “ERBB2 증폭 비정상" 샘플 DNA는 78%의 ERBB2 FEC를 갖는 FFPE 유방암 샘플(오리젠(OriGene)에서 구입)에서 추출하였다. 샘플 입력은 라이브러리당 8.3 ng DNA였다(qPCR에 의해 정량화됨). "정상" 샘플은 각각 8.3 ng DNA 입력을 갖는 개별적으로 제조된 5개의 복제된 차세대 서열 분석(NGS) 라이브러리로 시험하였다. 실험적으로 정규화된 추가 복제의 빈도(FEC) 값을 도 13에 나타내었다. 정규화된 추가 복제의 빈도(FEC)는 하기와 같이 계산되었다:
정규화된 FEC샘플 = (1+FEC샘플)/(1+FEC정상샘플) - 1
상기 FEC정상샘플은 5회 복제의 평균이었다. 복제수 변이(CNV) 패널의 LoD는 하기와 같이 추정되었다:
FECLoD = 3 × σ정상샘플 /(1+FEC정상샘플) = 0.85%
여기에서, 상기 σ정상샘플은 5회 복제의 표준 편차였다. 2.5%, 5% 및 10% ERBB2 FEC 샘플에서 복제수 변이(CNV)는 이의 계산된 추가 복제의 빈도(FEC)는 3 표준 편차 범위를 벗어났기 때문에 성공적으로 검출되었다(도 13을 참조). ERBB2의 실험적으로 정규화된 추가 복제의 빈도(FEC)는 예상 값과 높은 상관관계에 있다.
실시예 4 - 돌연변이 및 복제수 변이(CNV) 정량화를 위한 종합 패널
제시된 방법(QASeq)은 복제수 변이(CNV) 정량화뿐만 아니라 차세대 서열 분석(NGS) 오류 수정 및 돌연변이 정량화에도 사용할 수 있다. 각 QASeq 앰플리콘에서, fP의 3' 및 rPin의 3' 사이 영역은 돌연변이 검출 영역(Mutation Detection Region, MDR)이고, 상기 MDR의 임의의 작은 변형(염기 치환, 결실 및 500bp 미만의 삽입 포함)은 0.1%~0.3%의 LoD로 검출할 수 있다. 이는 LoD
Figure pct00035
1%인 돌연변이 검출을 위한 표준 비-UMI NGS 방법보다 훨씬 우수하다.
179-플렉스 종합 패널이 개발되어 유방암 샘플에서 돌연변이 및 복제수 변이(CNV) 정량화 모두에 대해 시험하였다. 모든 플렉스는 이전 섹션에서 설명한 fP(일명 SfP), rPin(일명 SrPB) 및 rPout(일명 SrPA)의 3가지 프라이머를 포함한다. 95개의 프라이머 세트는 유전자 ERBB2에서 45개, 염색체 17의 단완에서 50개를 참조로서 포함하여 복제수 변이(CNV) 정량화에만 사용하였다. 상기 ERBB2 유전자의 5개 프라이머 세트를 복제수 변이(CNV) 및 돌연변이 정량화 모두에 사용하였다. 다른 79개의 프라이머 세트는 돌연변이 정량화에만 사용하였다. 범용 정방향 프라이머(UfP) 및 범용 역방향 프라이머(UrP)는 범용 증폭에 사용되었다(서열은 표 3을 참조).
복제수 변이(CNV) 정량화는 이전 섹션에서 설명한 것과 동일한 방식으로 실시하였고, 돌연변이 정량화를 위한 데이터 처리 워크플로우는 도 14에 요약하였다. 선택적 어댑터 트리밍 후, 차세대 서열 분석(NGS) 판독물은 앰플리콘 서열에 정렬하였다. 각 유전자좌에서, 판독물은 UMI 패밀리로 나뉘었고, UMI 서열에 오류가 있는 UMI 패밀리가 제거되었으며, UMI 패밀리 크기가 작은(≤3) UMI 패밀리도 제거되었다. 다음으로, 각 UMI 패밀리의 공통 MDR 서열을 찾았는데, 이는 일반적으로 UMI 패밀리에서 가장 많이 나타나는 MDR 서열이다. 마지막 단계는 공통 서열을 야생형 MDR 서열과 비교하고, 새로운 돌연변이 호출을 실시하는 것이었다. 한 돌연변이의 VAF는 하기와 같이 계산할 수 있다: VAF = 돌연변이가 있는 UMI 패밀리의 수/UMI 패밀리의 총 수.
상기 179-플렉스 패널은 호라이즌 디스커버리의 멀티플레스 I cfDNA 참조 표준 세트에서 시험하였다. 야생형 cfDNA 참조 표준의 3개의 복제된 차세대 서열 분석(NGS) 라이브러리 및 0.3% cfDNA 참조 표준의 3개의 복제물(0.1% cfDNA 참조 표준 및 1% cfDNA 참조 표준을 혼합하여 생성)을 시험하였다. 샘플 입력은 라이브러리당 8.3 ng DNA였다(qPCR에 의해 정량화됨).
전체 표적 적중율은 모든 라이브러리에 대해 50%보다 높았고(즉, 차세대 서열 분석(NGS) 판독물의 >50%가 앰플리콘에 정렬될 수 있음), 전환율(즉, 서열 분석된 입력 분자의 백분율)은 평균 62%이고, 플렉스의 97%는 >10% 전환율을 갖는다(도 15를 참조). UMI 보정 후 오류율은 상이한 클레오티드 위치에 따라 가변되고, 호라이즌 디스커버리 멀티플렉스 I 야생형 cfDNA 참조 표준(Horizon Discovery Multiplex I Wild Type cfDNA Reference Standard)의 3개의 복제 라이브러리에서 가장 높은 오류율은 0.23%, 0.20% 및 0.23%였으며 평균 오류율은 0.006%, 0.005% 및 0.005%였다(도 16을 참조). 돌연변이 정량화 능력은 0.3% cfDNA 참조 표준을 사용하여 검증하였다. 6개 돌연변이의 실험적 VAF는 일반적으로 예상된 VAF와 일치하였고, 그 차이는 대부분 돌연변이 분자의 소수(≤9)를 샘플링할 때의 확률상 때문이었다(도 17을 참조).
* * *
본원에 개시되고 청구되는 모든 방법은, 본 개시에 비추어 과도한 실험 없이 이루어지고 실시될 수 있다. 본 발명의 조성물 및 방법이 바람직한 구현예에 관해 설명되었지만, 당업자는, 본 발명의 개념, 사상, 및 범위를 벗어나지 않고 본원에 개시된 방법 및 본원에 개시된 방법의 단계 또는 일련의 단계에 변형이 적용될 수 있음을 이해할 것이다. 보다 구체적으로는, 화학적으로 그리고 생리학적으로 관련된 특정 약제가, 본원에 개시된 약제를 대체할 수 있는 동시에 동일하거나 유사한 결과가 달성되는 것이 자명할 것이다. 당업자에게 자명한 이러한 모든 유사한 치환물 및 변형은, 첨부된 청구 범위에 의해 한정되는 본 발명의 사상, 범위, 및 개념 내에 있는 것으로 간주된다.
참조 문헌
하기의 참조 문헌은 본원에 개시된 것들에 예시적인 절차 또는 기타 상세한 보충을 제공하는 정도로 본원에 참조로서 구체적으로 포함된다.
Lun et al., “Noninvasive prenatal diagnosis of monogenic diseases by digital size selection and relative mutation dosage on DNA in maternal plasma,” Proc. Natl. Acad. Sci. U.S.A., 105:19920-19925, 2008.
SEQUENCE LISTING <110> WILLIAM MARSH RICE UNIVERSITY <120> QUANTITATIVE AMPLICON SEQUENCING FOR MULTIPLEXED COPY NUMBER VARIATION DETECTION AND ALLELE RATIO QUANTITATION <130> RICE.P0058WO <140> PCT/US2020/012089 <141> 2020-01-02 <150> US 62/788,375 <151> 2019-01-04 <160> 599 <170> KoPatentIn 3.0 <210> 1 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is any of a, c, or t <400> 1 acacgacgct cttccgatct atcannnnnn nnnnnnnnna atcataaaag ctaacatata 60 gcctggg 67 <210> 2 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 2 acacgacgct cttccgatct atcannnnnn nnnnnnnnng ctgacttggg gacacagg 58 <210> 3 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 3 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc tttgcaagat ggaggttgca 60 <210> 4 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 4 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ttgccctacc agcctctc 58 <210> 5 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 5 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc cacaactgga atctgacgc 59 <210> 6 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 6 acacgacgct cttccgatct atcannnnnn nnnnnnnnng gctgcggatt gtgcg 55 <210> 7 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 7 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc agatataagg gccaaaagtt 60 acaca 65 <210> 8 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 8 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt gctttggtct ccctttttgc 60 <210> 9 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 9 acacgacgct cttccgatct atcannnnnn nnnnnnnnng aatgaaatta aacagggctt 60 ggc 63 <210> 10 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 10 acacgacgct cttccgatct atcannnnnn nnnnnnnnna aagaaaaaaa aaaagaatat 60 gggtccaga 69 <210> 11 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 11 acacgacgct cttccgatct atcannnnnn nnnnnnnnng cacaacattt tgtctccgga 60 aaata 65 <210> 12 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 12 acacgacgct cttccgatct atcannnnnn nnnnnnnnng acaaatgccc agaaatggaa 60 ctta 64 <210> 13 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 13 acacgacgct cttccgatct atcannnnnn nnnnnnnnna tgcggtttca ccattggc 58 <210> 14 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 14 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ccaaggaatt gaggaagttg 60 ct 62 <210> 15 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 15 acacgacgct cttccgatct atcannnnnn nnnnnnnnna ctggaatgct gttccttaca 60 atca 64 <210> 16 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 16 acacgacgct cttccgatct atcannnnnn nnnnnnnnng gcctggatag gcagcttg 58 <210> 17 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 17 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc aactcagact attcaggaat 60 acgttt 66 <210> 18 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 18 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt ccatccgaca ttgaagttga 60 ctta 64 <210> 19 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 19 acacgacgct cttccgatct atcannnnnn nnnnnnnnng aatgaagccc taatccctta 60 agc 63 <210> 20 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 20 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc aggcagagga aatatcgttg 60 ac 62 <210> 21 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 21 ggatattcct ttctactctt tgacatcatc tatgcatgca aaacaccaca aac 53 <210> 22 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 22 ggatattcct ttctactctt tgacatcatc tcagatctgg cccagcacc 49 <210> 23 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 23 ggatattcct ttctactctt tgacatcatc tcctggcagg cactctcg 48 <210> 24 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 24 ggatattcct ttctactctt tgacatcatc tcctaaggtc aaatcctagg ggg 53 <210> 25 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 25 ggatattcct ttctactctt tgacatcatc tcggggctct ggtcattgc 49 <210> 26 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 26 ggatattcct ttctactctt tgacatcatc ttcagcgggt ctccattgtc ta 52 <210> 27 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 27 ggatattcct ttctactctt tgacatcatc tgcttggtgg ttaagagact gtgg 54 <210> 28 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 28 ggatattcct ttctactctt tgacatcatc tccatttacc cctcacaaca acca 54 <210> 29 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 29 ggatattcct ttctactctt tgacatcatc tcgagtaaca acagtcactg ctc 53 <210> 30 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 30 ggatattcct ttctactctt tgacatcatc tatgtttttc catgttctaa caccgt 56 <210> 31 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 31 ggatattcct ttctactctt tgacatcatc tgctccagat gggcagcac 49 <210> 32 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 32 ggatattcct ttctactctt tgacatcatc tttggcagtc tttaagatcc atagaaatac 60 <210> 33 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 33 ggatattcct ttctactctt tgacatcatc tactttggaa ggcagaggcg 50 <210> 34 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 34 ggatattcct ttctactctt tgacatcatc ttggaactcg tctcactatt caattttt 58 <210> 35 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 35 ggatattcct ttctactctt tgacatcatc tctgcttgtg gatgaggcca ta 52 <210> 36 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 36 ggatattcct ttctactctt tgacatcatc taggcagtca ctgttccttt cc 52 <210> 37 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 37 ggatattcct ttctactctt tgacatcatc tatgcattta cttctgaaac agtcctt 57 <210> 38 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 38 ggatattcct ttctactctt tgacatcatc tcaagtctga atgctccact ttttca 56 <210> 39 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 39 ggatattcct ttctactctt tgacatcatc tgtctcattc tagaaagaag ttaactcatt 60 ataca 65 <210> 40 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 40 ggatattcct ttctactctt tgacatcatc taggaatcaa caaatgacaa ggcaaat 57 <210> 41 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 41 agacgtgtgc tcttccgatc tcatgcaaaa caccacaaac agttc 45 <210> 42 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 42 agacgtgtgc tcttccgatc tgatctggcc cagcacctta a 41 <210> 43 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 43 agacgtgtgc tcttccgatc tctctcggtg gatctgcata acat 44 <210> 44 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 44 agacgtgtgc tcttccgatc tgtcaaatcc tagggggtaa tacga 45 <210> 45 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 45 agacgtgtgc tcttccgatc tctggtcatt gcagagacct ct 42 <210> 46 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 46 agacgtgtgc tcttccgatc ttctccattg tctagcacgg c 41 <210> 47 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 47 agacgtgtgc tcttccgatc tagactgtgg agtctgaaac tcag 44 <210> 48 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 48 agacgtgtgc tcttccgatc tcccctcaca acaaccagac g 41 <210> 49 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 49 agacgtgtgc tcttccgatc tgtcactgct ctgtagaaag cct 43 <210> 50 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 50 agacgtgtgc tcttccgatc tatgttctaa caccgtgatc tggat 45 <210> 51 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 51 agacgtgtgc tcttccgatc tatgggcagc acagtggg 38 <210> 52 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 52 agacgtgtgc tcttccgatc tgcagtcttt aagatccata gaaatactct t 51 <210> 53 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 53 agacgtgtgc tcttccgatc tcagaggcga gtggatcact t 41 <210> 54 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 54 agacgtgtgc tcttccgatc tactattcaa ttttttccta gagcatctcc 50 <210> 55 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 55 agacgtgtgc tcttccgatc tggccataga aagggtagtg ttgaa 45 <210> 56 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 56 agacgtgtgc tcttccgatc tttcctttcc tcctcctccc at 42 <210> 57 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 57 agacgtgtgc tcttccgatc tgcatttact tctgaaacag tccttaatg 49 <210> 58 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 58 agacgtgtgc tcttccgatc taatgctcca ctttttcaat tctctct 47 <210> 59 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 59 agacgtgtgc tcttccgatc tattctagaa agaagttaac tcattataca cagt 54 <210> 60 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 60 agacgtgtgc tcttccgatc tacaaatgac aaggcaaatg agacat 46 <210> 61 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 61 acactctttc cctacacgac gctcttccga tct 33 <210> 62 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 62 cctatggtag ttaaatgtac attggatatt cctttctact ctttgacatc atct 54 <210> 63 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 63 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc cttagacaac tacctttcta 60 cggac 65 <210> 64 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 64 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt gctttggtct ccctttttgc 60 <210> 65 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 65 acacgacgct cttccgatct atcannnnnn nnnnnnnnna aagaaaaaaa aaaagaatat 60 gggtccaga 69 <210> 66 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 66 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc gaggcgatag ggttaaggg 59 <210> 67 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 67 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ttctagtcgc aattgaagta 60 ccac 64 <210> 68 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 68 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ctcacccctt gtcaactttt 60 c 61 <210> 69 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 69 acacgacgct cttccgatct atcannnnnn nnnnnnnnng tctggtgctt tagcccaaag 60 <210> 70 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 70 acacgacgct cttccgatct atcannnnnn nnnnnnnnna aagcaaagct atattcaaga 60 ccacat 66 <210> 71 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 71 acacgacgct cttccgatct atcannnnnn nnnnnnnnng gcattgtctg ccagtccg 58 <210> 72 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 72 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt cctttagctc gtggaatctc 60 aag 63 <210> 73 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 73 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc tggggcattc caactagaac 60 t 61 <210> 74 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 74 acacgacgct cttccgatct atcannnnnn nnnnnnnnna ttccagtggc catcaaagtg 60 t 61 <210> 75 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 75 acacgacgct cttccgatct atcannnnnn nnnnnnnnng ggaaaaccat tatttgatat 60 taaaacaaat agg 73 <210> 76 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 76 acacgacgct cttccgatct atcannnnnn nnnnnnnnna ggaagtataa gaatgaagtt 60 gtgaagc 67 <210> 77 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 77 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc tccccgctcc ccttca 56 <210> 78 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 78 acacgacgct cttccgatct atcannnnnn nnnnnnnnna gcctgggcca ggtatact 58 <210> 79 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 79 acacgacgct cttccgatct atcannnnnn nnnnnnnnna ctctgtcctc tgcaggaact 60 <210> 80 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 80 acacgacgct cttccgatct atcannnnnn nnnnnnnnng tatgggtttt acaaattgca 60 gcaaata 67 <210> 81 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 81 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc aaagcatgtt taattttctc 60 gtggtt 66 <210> 82 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 82 acacgacgct cttccgatct atcannnnnn nnnnnnnnng cgtgaggggc cagtgt 56 <210> 83 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 83 acacgacgct cttccgatct atcannnnnn nnnnnnnnng gacacaggtc attttactgt 60 agtattc 67 <210> 84 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 84 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc cacccgttct gaccctc 57 <210> 85 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 85 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc aggaagcata cgtgatggct 60 <210> 86 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 86 acacgacgct cttccgatct atcannnnnn nnnnnnnnna cctgcagtgt gcaaggg 57 <210> 87 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 87 acacgacgct cttccgatct atcannnnnn nnnnnnnnng cgtctgtgtt tccgctaaat 60 c 61 <210> 88 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 88 acacgacgct cttccgatct atcannnnnn nnnnnnnnna agatctccaa gtactgggga 60 ac 62 <210> 89 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 89 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt ggccttcacc gtcattgaaa 60 <210> 90 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 90 acacgacgct cttccgatct atcannnnnn nnnnnnnnng cagatataag ggccaaaagt 60 tacac 65 <210> 91 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 91 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc agctggctct cacactgat 59 <210> 92 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 92 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc cacccctgtt ctccgatg 58 <210> 93 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 93 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc tcctaaatgt tagcttttat 60 tctatagcct 70 <210> 94 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 94 acacgacgct cttccgatct atcannnnnn nnnnnnnnna gtctctgcct tctactctct 60 acc 63 <210> 95 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 95 acacgacgct cttccgatct atcannnnnn nnnnnnnnng cctttggtgg gtgggg 56 <210> 96 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 96 acacgacgct cttccgatct atcannnnnn nnnnnnnnng atgagctacc tggaggatgt 60 g 61 <210> 97 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 97 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc agccagttcc ctggttca 58 <210> 98 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 98 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ccttcagact atgaaaaggt 60 tctaag 66 <210> 99 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 99 acacgacgct cttccgatct atcannnnnn nnnnnnnnna cagtgctggc aatgtttatc 60 ac 62 <210> 100 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 100 acacgacgct cttccgatct atcannnnnn nnnnnnnnng ggtggttccc agaattgttg 60 <210> 101 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 101 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ttcaaagttc tggtgtcggg 60 <210> 102 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 102 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt gacctgtggg tggaaatttt 60 g 61 <210> 103 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 103 acacgacgct cttccgatct atcannnnnn nnnnnnnnna gagggttctg attgcctaca 60 ag 62 <210> 104 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 104 acacgacgct cttccgatct atcannnnnn nnnnnnnnng ggatcctcat caagcgacg 59 <210> 105 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 105 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ccttttacag tcaaagtcca 60 aagc 64 <210> 106 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 106 acacgacgct cttccgatct atcannnnnn nnnnnnnnng ggtcgtcaaa gacgtttttg 60 c 61 <210> 107 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 107 acacgacgct cttccgatct atcannnnnn nnnnnnnnng atggcgctgg agtccatt 58 <210> 108 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 108 acacgacgct cttccgatct atcannnnnn nnnnnnnnna cctgtcctaa ggaaccttcc 60 t 61 <210> 109 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 109 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc tttgcaagat ggaggttgca 60 <210> 110 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 110 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ttgccctacc agcctctc 58 <210> 111 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 111 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc cacaactgga atctgacgc 59 <210> 112 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 112 acacgacgct cttccgatct atcannnnnn nnnnnnnnng gctgcggatt gtgcg 55 <210> 113 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 113 acacgacgct cttccgatct atcannnnnn nnnnnnnnng ggacccactc catcgaga 58 <210> 114 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 114 acacgacgct cttccgatct atcannnnnn nnnnnnnnng gagtatttca tgaaacaaat 60 gaatgatgc 69 <210> 115 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 115 acacgacgct cttccgatct atcannnnnn nnnnnnnnng ccgccaggtc ttgatgtact 60 <210> 116 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 116 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc tcaccatcgc tatctgagca 60 g 61 <210> 117 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 117 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt cgtcaaggca ctcttgccta 60 <210> 118 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 118 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng agtatttgga tgacagaaac 60 acttt 65 <210> 119 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 119 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnc acacgcaaat ttccttccac 60 <210> 120 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 120 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnc cgctcatgat caaacgctct 60 aa 62 <210> 121 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 121 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt ccatgatcag gtccaccttc 60 t 61 <210> 122 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 122 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt cactctctct ctgcgcattc 60 <210> 123 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 123 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna gtaacaaagg catggagcat 60 ct 62 <210> 124 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 124 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng tggggtgaga tttttgtcaa 60 ctt 63 <210> 125 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 125 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna gcagtatcag tagtatgagc 60 agc 63 <210> 126 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 126 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt tctgatgtgc tttgttctgg 60 attt 64 <210> 127 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 127 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt gagccaaatg tgtatgggtg 60 a 61 <210> 128 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 128 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng ttgcacattc ctcttctgca 60 ttt 63 <210> 129 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 129 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng gtgcatttgt taacttcagc 60 tctg 64 <210> 130 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 130 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt aggtttctgc tgtgcctgac 60 <210> 131 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 131 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng gtgggcttag atttctactg 60 actacta 67 <210> 132 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 132 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt ctaggattct ctgagcatgg 60 c 61 <210> 133 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 133 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna ctaaatagga aaataccagc 60 ttcatagac 69 <210> 134 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 134 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna cactcttgtg ctgacttacc 60 a 61 <210> 135 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 135 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna acatcaggga attcatttaa 60 agtaaatagc 70 <210> 136 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 136 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng gaaccaaatg atactgatcc 60 attagattc 69 <210> 137 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 137 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna gattctaaac tgccaagtca 60 tgc 63 <210> 138 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 138 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt gcctgtagta atcaagtgtc 60 tcattt 66 <210> 139 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 139 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnc aaccaaagtc tttgttccac 60 ctt 63 <210> 140 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 140 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna gacatcatct ggattataca 60 tatttcgc 68 <210> 141 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 141 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna aagagctaac atacagttag 60 cagc 64 <210> 142 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 142 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt tccattctag gacttgcccc 60 <210> 143 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 143 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna ctgaattctc ctcagatgac 60 tcc 63 <210> 144 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 144 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna cagacactcc ttgttcagca 60 <210> 145 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 145 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt gtgtatataa ttatttctta 60 ccctattcga gtc 73 <210> 146 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 146 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt tgctgtcatt tggactggga 60 a 61 <210> 147 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 147 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnc aaaaagatac ccacctttcc 60 tcca 64 <210> 148 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 148 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnc aatttctaca cgagatcctc 60 tctct 65 <210> 149 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 149 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng acattacggg ctgccaaatc 60 <210> 150 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 150 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnc tcagacacac acccagcaa 59 <210> 151 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 151 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna cttactttat aaaccgttcc 60 aaaagca 67 <210> 152 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 152 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt gagtaatgta cttactacaa 60 ttttcagctt 70 <210> 153 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 153 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng ctgttgtcag taatatagat 60 gtttcctg 68 <210> 154 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 154 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna actagggcag gcacgc 56 <210> 155 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 155 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng gataataaaa gagagaaatc 60 acagacatac aa 72 <210> 156 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 156 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna ggcatatcga tcctcataaa 60 gttttg 66 <210> 157 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 157 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt ccaggttgcc catgacaac 59 <210> 158 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 158 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna gtgccagaag gaacccac 58 <210> 159 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 159 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna agtgttactc aagaagcaga 60 aagg 64 <210> 160 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 160 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna aaatcccttt gggttataaa 60 tagtgca 67 <210> 161 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 161 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna tgtgttttat aatttagact 60 agtgaatatt tttctttg 78 <210> 162 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 162 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnc tggaaaaatg gctttgaatc 60 tttgg 65 <210> 163 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 163 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt ggaaaagctc attaacttaa 60 ctgacat 67 <210> 164 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 164 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt ccttgggatt acgctccct 59 <210> 165 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 165 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna cccagtggag aagctccc 58 <210> 166 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 166 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna ggtgagaaag ttaaaattcc 60 cgtc 64 <210> 167 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 167 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna ggcagatgcc cagcagg 57 <210> 168 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 168 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnc ctccaccgtg cagctcat 58 <210> 169 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 169 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna gccaggaacg tactggtg 58 <210> 170 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 170 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna caatgtcacc acattacata 60 cttacc 66 <210> 171 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 171 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna caggctccca gacatgaca 59 <210> 172 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 172 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt tcagatattt ctttccttaa 60 ctaaagtact ca 72 <210> 173 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 173 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt gtttgttttg ttttaaggtt 60 tttggattc 69 <210> 174 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 174 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt cctaagtgca aaagataact 60 ttatatcact t 71 <210> 175 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 175 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng ttgcagcaat tcactgtaaa 60 gct 63 <210> 176 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 176 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnc acaagaggcc ctagatttct 60 atgg 64 <210> 177 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 177 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt tgagttccct cagccgttac 60 <210> 178 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 178 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt cttcatacca ggaccagagg 60 aa 62 <210> 179 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 179 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna gtgagccctg ctcccc 56 <210> 180 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 180 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng cgtgcagata atgacaagga 60 atatct 66 <210> 181 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 181 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng gttttcattt taaattttct 60 ttctctaggt gaa 73 <210> 182 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 182 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt cgtggccatg aatgaattct 60 cta 63 <210> 183 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 183 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt ctacaacaag ctaactttcc 60 agct 64 <210> 184 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 184 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng tgatgttcct ccctcatctc 60 taa 63 <210> 185 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 185 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna gcaacattga tggatttgtg 60 aact 64 <210> 186 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 186 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnna cgattggctg aagtaccaga 60 c 61 <210> 187 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 187 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt ggacacgaca acaaccagc 59 <210> 188 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 188 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng caacttacac gtggacgac 59 <210> 189 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 189 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt ccctcttatt gttccctaca 60 gattg 65 <210> 190 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 190 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnng tgcgccggtc tctcc 55 <210> 191 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 191 acacgacgct cttccgatct tcttnnnnnn nnnnnnnnnt gacctggagt cttccagtgt 60 <210> 192 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 192 acacgacgct cttccgatct atcannnnnn nnnnnnnnng cttgtctaag gaaaaaactt 60 gattattttg taa 73 <210> 193 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 193 acacgacgct cttccgatct atcannnnnn nnnnnnnnna ggaagacgct tggttggg 58 <210> 194 <211> 71 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 194 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt gagacctata atgctaagga 60 aatttcttta c 71 <210> 195 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 195 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt ggaagcgttc gttccatcc 59 <210> 196 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 196 acacgacgct cttccgatct atcannnnnn nnnnnnnnng cttggcatct gttcttgctt 60 taa 63 <210> 197 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 197 acacgacgct cttccgatct atcannnnnn nnnnnnnnna aaattctgca aaaataaagg 60 ccaaga 66 <210> 198 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 198 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt ttattgcatg tcctcatcca 60 cag 63 <210> 199 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 199 acacgacgct cttccgatct atcannnnnn nnnnnnnnna ttggggatgt ccagaataaa 60 ttcag 65 <210> 200 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 200 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc aaacagttca gtgacttgcc 60 c 61 <210> 201 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 201 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc aggcatctca cctctcttcc 60 <210> 202 <211> 68 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 202 acacgacgct cttccgatct atcannnnnn nnnnnnnnng gcattattcc agtattgtag 60 aagaagaa 68 <210> 203 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 203 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc tacattacca gtagaacaga 60 actagtcta 69 <210> 204 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 204 acacgacgct cttccgatct atcannnnnn nnnnnnnnng ctaaccgtgc tttcctcttt 60 cat 63 <210> 205 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 205 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc cctagcagaa gccgacca 58 <210> 206 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 206 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc aaaccaccac ttatttcttt 60 attttatcct 70 <210> 207 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 207 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt cattttgtag tcattgtaaa 60 actcttatgc 70 <210> 208 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 208 acacgacgct cttccgatct atcannnnnn nnnnnnnnna gagtagcgac atgcaaatga 60 tct 63 <210> 209 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 209 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ccagcatttg ttatataggc 60 atctt 65 <210> 210 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 210 acacgacgct cttccgatct atcannnnnn nnnnnnnnng agtagacagg gaaatataga 60 agcct 65 <210> 211 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 211 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc catccttttt agtgctgtcc 60 tca 63 <210> 212 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 212 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt cagctggcct agcagttc 58 <210> 213 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 213 acacgacgct cttccgatct atcannnnnn nnnnnnnnng cataatttat aatgaaaaca 60 aatacattct cacag 75 <210> 214 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 214 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ttatttgcat ttgtggcata 60 atatgaaac 69 <210> 215 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 215 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc tagggttagt caggtggttc 60 aa 62 <210> 216 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 216 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc agaagggctc tcactggg 58 <210> 217 <211> 73 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 217 acacgacgct cttccgatct atcannnnnn nnnnnnnnng ccttatatta ttccctttga 60 accttacaat aat 73 <210> 218 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 218 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ctgcagcggg agttttca 58 <210> 219 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 219 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc ggcgccacgt gttca 55 <210> 220 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 220 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt ggcccatttt aacctttttt 60 ttttaaagta 70 <210> 221 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 221 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt gtgaacagcc agaagcgat 59 <210> 222 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 222 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc cagcccctga tcctaccag 59 <210> 223 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 223 acacgacgct cttccgatct atcannnnnn nnnnnnnnna gtaactgaac gacgaattct 60 ttgtaa 66 <210> 224 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 224 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc agctcccacc acagtgc 57 <210> 225 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 225 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc acacagcggg ctctca 56 <210> 226 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 226 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt cccttctcct acacttcctc 60 c 61 <210> 227 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 227 acacgacgct cttccgatct atcannnnnn nnnnnnnnna ctacaggagc aactgccac 59 <210> 228 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 228 acacgacgct cttccgatct atcannnnnn nnnnnnnnna gaggtaggga ttattagccc 60 cat 63 <210> 229 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 229 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt gtgtatccaa caggaactcc 60 aaa 63 <210> 230 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 230 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc tggtcttaaa atgtcctggg 60 ga 62 <210> 231 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 231 acacgacgct cttccgatct atcannnnnn nnnnnnnnna cgcccggcca tctca 55 <210> 232 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 232 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt tttcactgtt tcctacaaga 60 aaatgc 66 <210> 233 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 233 acacgacgct cttccgatct atcannnnnn nnnnnnnnng aaacctggat ttttgaaatc 60 tagtgtttaa 70 <210> 234 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 234 acacgacgct cttccgatct atcannnnnn nnnnnnnnng caaggacgga aataggtaaa 60 tgt 63 <210> 235 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 235 acacgacgct cttccgatct atcannnnnn nnnnnnnnnc gaggcactgc gtttgg 56 <210> 236 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 236 acacgacgct cttccgatct atcannnnnn nnnnnnnnna gcagatgggt tgagagttgg 60 <210> 237 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 237 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt ccaatctcta tctgttagaa 60 gtctcc 66 <210> 238 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 238 acacgacgct cttccgatct atcannnnnn nnnnnnnnng gctctgattt ccgcccaat 59 <210> 239 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 239 acacgacgct cttccgatct atcannnnnn nnnnnnnnnt gcaaagattg taggagctct 60 gta 63 <210> 240 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 240 acacgacgct cttccgatct atcannnnnn nnnnnnnnna attagataaa aagcatccac 60 agaggag 67 <210> 241 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <222> (25)..(39) <223> n is a, c, or t <400> 241 acacgacgct cttccgatct atcannnnnn nnnnnnnnna gtctttaaca atgagagtca 60 aaccatt 67 <210> 242 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 242 agacgtgtgc tcttccgatc tgtgcagggg gcagacga 38 <210> 243 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 243 agacgtgtgc tcttccgatc tcccctcaca acaaccagac g 41 <210> 244 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 244 agacgtgtgc tcttccgatc tatgttctaa caccgtgatc tggat 45 <210> 245 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 245 agacgtgtgc tcttccgatc ttggaaaaca cttcagtttg ctcattaa 48 <210> 246 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 246 agacgtgtgc tcttccgatc tgcaaaggtt ctaccccgca t 41 <210> 247 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 247 agacgtgtgc tcttccgatc tggctacttc ttactcattc caaccc 46 <210> 248 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 248 agacgtgtgc tcttccgatc tccatcacca gctagtctga gtc 43 <210> 249 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 249 agacgtgtgc tcttccgatc tccccgtttt atctgtgact ctttg 45 <210> 250 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 250 agacgtgtgc tcttccgatc tccatcctct ctgcatccca aatc 44 <210> 251 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 251 agacgtgtgc tcttccgatc tggcaggtgt tatcattccc cattt 45 <210> 252 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 252 agacgtgtgc tcttccgatc tgggcctcct tatttttatg tgctaaat 48 <210> 253 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 253 agacgtgtgc tcttccgatc tagggtggag gggcttacg 39 <210> 254 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 254 agacgtgtgc tcttccgatc tagcttgcat cctactccat cc 42 <210> 255 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 255 agacgtgtgc tcttccgatc ttcccctggt ttctccggt 39 <210> 256 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 256 agacgtgtgc tcttccgatc tcgaccccgc cagaagc 37 <210> 257 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 257 agacgtgtgc tcttccgatc tgcatgcaaa acaccacaaa cagtt 45 <210> 258 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 258 agacgtgtgc tcttccgatc tggctacctc cctctgttta tgg 43 <210> 259 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 259 agacgtgtgc tcttccgatc taaaatatga aggagttctg caagattaaa ag 52 <210> 260 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 260 agacgtgtgc tcttccgatc tggttcatac agcaggaata tgggtaat 48 <210> 261 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 261 agacgtgtgc tcttccgatc taggacaggc acaactaccc t 41 <210> 262 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 262 agacgtgtgc tcttccgatc tagcagaaaa gccaatactt ccct 44 <210> 263 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 263 agacgtgtgc tcttccgatc taacaccaca ggctctacgg 40 <210> 264 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 264 agacgtgtgc tcttccgatc tcccagaagg cgggagacat a 41 <210> 265 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 265 agacgtgtgc tcttccgatc tcagggagaa gcctgactga ag 42 <210> 266 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 266 agacgtgtgc tcttccgatc tggtggacag gggacatgat ca 42 <210> 267 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 267 agacgtgtgc tcttccgatc tggaacactg ccaccccc 38 <210> 268 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 268 agacgtgtgc tcttccgatc tccccctggt tagcagtgg 39 <210> 269 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 269 agacgtgtgc tcttccgatc taactcagcc ccatcactca c 41 <210> 270 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 270 agacgtgtgc tcttccgatc tggaggggca tggcttacag 40 <210> 271 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 271 agacgtgtgc tcttccgatc tcggctctga caatcctcag aa 42 <210> 272 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 272 agacgtgtgc tcttccgatc tggtctcaaa aacaaaacga aaggtaaa 48 <210> 273 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 273 agacgtgtgc tcttccgatc tactgacagg ggatataggg aca 43 <210> 274 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 274 agacgtgtgc tcttccgatc tagtccttgt tcacggatag cat 43 <210> 275 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 275 agacgtgtgc tcttccgatc tgttccgagc ggccaagtc 39 <210> 276 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 276 agacgtgtgc tcttccgatc tccgcagggg acttttaggg 40 <210> 277 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 277 agacgtgtgc tcttccgatc tctagcacag ccacagtcac a 41 <210> 278 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 278 agacgtgtgc tcttccgatc tcatttagtt gtctttaaat tgaaatgcat gaa 53 <210> 279 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 279 agacgtgtgc tcttccgatc tccttgtcat ccaggtccac a 41 <210> 280 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 280 agacgtgtgc tcttccgatc tactctaact tgaccccctt attcct 46 <210> 281 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 281 agacgtgtgc tcttccgatc tacaggaatg tacacctgat gattttg 47 <210> 282 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 282 agacgtgtgc tcttccgatc tctgccttgg ctccccg 37 <210> 283 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 283 agacgtgtgc tcttccgatc tcagtctccg catcgtgtac t 41 <210> 284 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 284 agacgtgtgc tcttccgatc tctgtgccca gcttaatttt gtaca 45 <210> 285 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 285 agacgtgtgc tcttccgatc tggggtgtca agtactcggg 40 <210> 286 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 286 agacgtgtgc tcttccgatc tacacatcac tctggtgggt gaa 43 <210> 287 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 287 agacgtgtgc tcttccgatc ttggacccct tccagcca 38 <210> 288 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 288 agacgtgtgc tcttccgatc tctctcggtg gatctgcata acat 44 <210> 289 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 289 agacgtgtgc tcttccgatc tgtcaaatcc tagggggtaa tacga 45 <210> 290 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 290 agacgtgtgc tcttccgatc tctggtcatt gcagagacct ct 42 <210> 291 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 291 agacgtgtgc tcttccgatc ttctccattg tctagcacgg c 41 <210> 292 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 292 agacgtgtgc tcttccgatc tctcacagta aaaataggtg attttggtct 50 <210> 293 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 293 agacgtgtgc tcttccgatc taagatccaa tccatttttg ttgtccag 48 <210> 294 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 294 agacgtgtgc tcttccgatc tgtctgacgg gtagagtgtg c 41 <210> 295 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 295 agacgtgtgc tcttccgatc tcacatgacg gaggttgtga gg 42 <210> 296 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 296 agacgtgtgc tcttccgatc tctgaaaatg actgaatata aacttgtggt agt 53 <210> 297 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 297 agacgtgtgc tcttccgatc tccagttgca aaccagacct ca 42 <210> 298 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 298 agacgtgtgc tcttccgatc ttcctcactg attgctctta ggtct 45 <210> 299 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 299 agacgtgtgc tcttccgatc tccaacaagg cactgaccat c 41 <210> 300 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 300 agacgtgtgc tcttccgatc tgagcgccag acgagacc 38 <210> 301 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 301 agacgtgtgc tcttccgatc tcggtggata tggtccttct cttc 44 <210> 302 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 302 agacgtgtgc tcttccgatc tcggtgggcg tccagca 37 <210> 303 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 303 agacgtgtgc tcttccgatc ttggtcaatg gaagaaacca cca 43 <210> 304 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 304 agacgtgtgc tcttccgatc tcatcttcaa cctctgcatt gaaagt 46 <210> 305 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 305 agacgtgtgc tcttccgatc taacagctac ccttccatca taagt 45 <210> 306 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 306 agacgtgtgc tcttccgatc tctgttttta gcaaaagcgt ccag 44 <210> 307 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 307 agacgtgtgc tcttccgatc taggtttcaa agcgccagtc a 41 <210> 308 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 308 agacgtgtgc tcttccgatc tgtaacaagc caaatgaaca gacaagt 47 <210> 309 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 309 agacgtgtgc tcttccgatc tagttgttct agcagtgaag agataaaga 49 <210> 310 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 310 agacgtgtgc tcttccgatc taaagcacct aaaaagaata ggctgag 47 <210> 311 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 311 agacgtgtgc tcttccgatc taggtagatc tgaatgctga tccc 44 <210> 312 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 312 agacgtgtgc tcttccgatc tggatctgat tcttctgaag ataccgttaa 50 <210> 313 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 313 agacgtgtgc tcttccgatc tgatttatct gctcttcgcg ttgaa 45 <210> 314 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 314 agacgtgtgc tcttccgatc tactgtttca tatacttcat cttctaggac a 51 <210> 315 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 315 agacgtgtgc tcttccgatc tggagatttt gtcacttcca ctctc 45 <210> 316 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 316 agacgtgtgc tcttccgatc tttgaatttg acaaaaccat ttcctcattt 50 <210> 317 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 317 agacgtgtgc tcttccgatc tgtttcagga catccatttt atcaagtttc 50 <210> 318 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 318 agacgtgtgc tcttccgatc tgttaatatt cctaacacac tgttcaactc t 51 <210> 319 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 319 agacgtgtgc tcttccgatc tttctagtct cttttgttgg gcct 44 <210> 320 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 320 agacgtgtgc tcttccgatc tcttatcaaa actgaaaaat tacaatgaaa ggttt 55 <210> 321 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 321 agacgtgtgc tcttccgatc tctttattgc cagtaaattg taacattcgt 50 <210> 322 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 322 agacgtgtgc tcttccgatc tcaagttctt cgtcagctat tgaattact 49 <210> 323 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 323 agacgtgtgc tcttccgatc tccttctctc cacatatgtt tctcttatta a 51 <210> 324 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 324 agacgtgtgc tcttccgatc tcatcccacc tcccatctat acttc 45 <210> 325 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 325 agacgtgtgc tcttccgatc ttttgtgtct gatgggcaat ctttc 45 <210> 326 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 326 agacgtgtgc tcttccgatc tttttgggct agccagactc ttg 43 <210> 327 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 327 agacgtgtgc tcttccgatc tgaatctcca ttttagcact tacctgtg 48 <210> 328 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 328 agacgtgtgc tcttccgatc tttgatattt ttcagggaat gatgtacctg 50 <210> 329 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 329 agacgtgtgc tcttccgatc tgaaatcatg gtattgcatt tttttcttac ag 52 <210> 330 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 330 agacgtgtgc tcttccgatc tagcacccaa tcaagctcaa ct 42 <210> 331 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 331 agacgtgtgc tcttccgatc tactcttcag cacaatcaac caga 44 <210> 332 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 332 agacgtgtgc tcttccgatc tgcatcacct ctctacagtt ccagt 45 <210> 333 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 333 agacgtgtgc tcttccgatc tgctgaatgt taacattaat gcttatttta cc 52 <210> 334 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 334 agacgtgtgc tcttccgatc tagtgactgc tgccatcgag 40 <210> 335 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 335 agacgtgtgc tcttccgatc tgctacgtgt tagtggctct taatca 46 <210> 336 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 336 agacgtgtgc tcttccgatc tataaactga gctctctctc tgacc 45 <210> 337 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 337 agacgtgtgc tcttccgatc ttgaagccgg cgacagg 37 <210> 338 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 338 agacgtgtgc tcttccgatc tggttcaatt acttttaaaa agggttgaaa aag 53 <210> 339 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 339 agacgtgtgc tcttccgatc tatttgactt taccttatca atgtctcgaa 50 <210> 340 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 340 agacgtgtgc tcttccgatc tgtgtctgtg taatcaaaca agtttatatt tcc 53 <210> 341 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 341 agacgtgtgc tcttccgatc tagtaacacc aatagggttc agcaa 45 <210> 342 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 342 agacgtgtgc tcttccgatc taaagagtct caaacacaaa ctagagtc 48 <210> 343 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 343 agacgtgtgc tcttccgatc ttttattgta tttgcatagc acaaattttt gtt 53 <210> 344 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 344 agacgtgtgc tcttccgatc tccgtgccga acgcacc 37 <210> 345 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 345 agacgtgtgc tcttccgatc tgcaaagcag aaactcacat cga 43 <210> 346 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 346 agacgtgtgc tcttccgatc tctccaggaa gcctacgtga tg 42 <210> 347 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 347 agacgtgtgc tcttccgatc tcggacatag tccaggaggc ag 42 <210> 348 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 348 agacgtgtgc tcttccgatc tgcatggtat tctttctctt ccgca 45 <210> 349 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 349 agacgtgtgc tcttccgatc tgggcagatt acagtgggac aa 42 <210> 350 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 350 agacgtgtgc tcttccgatc tggatacagg tcaagtctaa gtcgaatc 48 <210> 351 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 351 agacgtgtgc tcttccgatc tcctgtatac gccttcaagt ctttct 46 <210> 352 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 352 agacgtgtgc tcttccgatc tgcaagcata caaataagaa aacatactta cag 53 <210> 353 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 353 agacgtgtgc tcttccgatc ttctgcaatt aaatttggcg gtgt 44 <210> 354 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 354 agacgtgtgc tcttccgatc tcgatgtaat aaatatgcac atatcattac acc 53 <210> 355 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 355 agacgtgtgc tcttccgatc tcaggaagag gaaaggaaaa acatcaa 47 <210> 356 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 356 agacgtgtgc tcttccgatc tgatatttct cccaatgaaa gtaaagtaca aac 53 <210> 357 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 357 agacgtgtgc tcttccgatc ttcgatttct tgatcacata gacttccat 49 <210> 358 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 358 agacgtgtgc tcttccgatc tgggcgtgag cgcttcg 37 <210> 359 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 359 agacgtgtgc tcttccgatc tcttaaaatt tggagaaaag tatcggttgg 50 <210> 360 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 360 agacgtgtgc tcttccgatc tagcctctgg atttgacggc 40 <210> 361 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 361 agacgtgtgc tcttccgatc tgatggcaaa cttcccatcg tag 43 <210> 362 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 362 agacgtgtgc tcttccgatc tgggacagct ggctacacaa 40 <210> 363 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 363 agacgtgtgc tcttccgatc taggccctga cacaggatgt 40 <210> 364 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 364 agacgtgtgc tcttccgatc tcccattgag gccggtgat 39 <210> 365 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 365 agacgtgtgc tcttccgatc tttgaccatc accatgtaga catca 45 <210> 366 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 366 agacgtgtgc tcttccgatc tagctgtctc tctcccagtt catt 44 <210> 367 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 367 agacgtgtgc tcttccgatc tcccatggca aacaccatga g 41 <210> 368 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 368 agacgtgtgc tcttccgatc tcaccatgtg tgacttgatt agcag 45 <210> 369 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 369 agacgtgtgc tcttccgatc tgtggtaatc tactgggacg gaac 44 <210> 370 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 370 agacgtgtgc tcttccgatc ttccactaca actacatgtg taacagtt 48 <210> 371 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 371 agacgtgtgc tcttccgatc tgtaacagta ggtgtttcaa tatgactttt att 53 <210> 372 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 372 agacgtgtgc tcttccgatc tctcccctcc tccataggaa ctt 43 <210> 373 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 373 agacgtgtgc tcttccgatc tacataccag gttctgcgct t 41 <210> 374 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 374 agacgtgtgc tcttccgatc tatcaaggca ccgctctaac tt 42 <210> 375 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 375 agacgtgtgc tcttccgatc tatcccggtg tgcatttgag a 41 <210> 376 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 376 agacgtgtgc tcttccgatc tgggctatgg gggcttcct 39 <210> 377 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 377 agacgtgtgc tcttccgatc tgatgtgccc tgacatcaga aatatac 47 <210> 378 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 378 agacgtgtgc tcttccgatc tagtgttgat ctgaaggaac ttcct 45 <210> 379 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 379 agacgtgtgc tcttccgatc ttgggaccat gtttggccat 40 <210> 380 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 380 agacgtgtgc tcttccgatc ttcccatcat tgctgctgtc a 41 <210> 381 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 381 agacgtgtgc tcttccgatc tcaaacacgt gtgatcaata gtaccat 47 <210> 382 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 382 agacgtgtgc tcttccgatc ttctcatatc agaacttaaa tacatagcag tag 53 <210> 383 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 383 agacgtgtgc tcttccgatc tggggaagga agatgtcaca ttatga 46 <210> 384 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 384 agacgtgtgc tcttccgatc tgcatgcgca agagctaccc 40 <210> 385 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 385 agacgtgtgc tcttccgatc tacgataaaa ttctcttatc ttgaaggatt gat 53 <210> 386 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 386 agacgtgtgc tcttccgatc tagtgtttct gatattgaaa aattttaagt gct 53 <210> 387 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 387 agacgtgtgc tcttccgatc ttttcatcct tcgcacatgt atactg 46 <210> 388 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 388 agacgtgtgc tcttccgatc tctggagcag atgactcaca tttc 44 <210> 389 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 389 agacgtgtgc tcttccgatc tagggggctt ggtctttttt ct 42 <210> 390 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 390 agacgtgtgc tcttccgatc tcaccttttt taacaaccgg atctagt 47 <210> 391 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 391 agacgtgtgc tcttccgatc tgaggccctg taatctgtat tttaacc 47 <210> 392 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 392 agacgtgtgc tcttccgatc tccttaatat cagacttccc agccttc 47 <210> 393 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 393 agacgtgtgc tcttccgatc tggagctctg agacaggaac c 41 <210> 394 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 394 agacgtgtgc tcttccgatc ttggcaaagc agaagacaat agtaga 46 <210> 395 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 395 agacgtgtgc tcttccgatc tccctttcag ggagtcctgt aca 43 <210> 396 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 396 agacgtgtgc tcttccgatc tttttcgtta ctgtaaaatg ggaatgttc 49 <210> 397 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 397 agacgtgtgc tcttccgatc tcggtgaact ttcgggaaag g 41 <210> 398 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 398 agacgtgtgc tcttccgatc tcccacgtac aagaggattt caaagt 46 <210> 399 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 399 agacgtgtgc tcttccgatc tagtgtgaat gtacttaatg acacttagc 49 <210> 400 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 400 agacgtgtgc tcttccgatc tgtgaggcag gtgctcactt 40 <210> 401 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 401 agacgtgtgc tcttccgatc tctggtgttc ttttataccc attttttctt ta 52 <210> 402 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 402 agacgtgtgc tcttccgatc tctgttgctc ttgactctga gct 43 <210> 403 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 403 agacgtgtgc tcttccgatc tcctcaggtc cttgtggcta ac 42 <210> 404 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 404 agacgtgtgc tcttccgatc taggagccgt gggaatcaaa a 41 <210> 405 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 405 agacgtgtgc tcttccgatc tcagcatggc aaggcaactt 40 <210> 406 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 406 agacgtgtgc tcttccgatc ttgagggaca gaaaatcagg tcg 43 <210> 407 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 407 agacgtgtgc tcttccgatc tggctaatga gttgatctct ctgagc 46 <210> 408 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 408 agacgtgtgc tcttccgatc taaaagaaaa caaaggacat agattttccc 50 <210> 409 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 409 agacgtgtgc tcttccgatc tagagtgctc aaaccttggg aa 42 <210> 410 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 410 agacgtgtgc tcttccgatc tgctatcatg ccatgaagaa tattcatata ttcata 56 <210> 411 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 411 agacgtgtgc tcttccgatc tagagaaccc acttgggacc a 41 <210> 412 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 412 agacgtgtgc tcttccgatc taccatattc ttaattttta aaattcacag cca 53 <210> 413 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 413 agacgtgtgc tcttccgatc tctctgtcgt aagtcaagtc tttgtg 46 <210> 414 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 414 agacgtgtgc tcttccgatc tctatcgaat cagaatgcaa agcaaatt 48 <210> 415 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 415 agacgtgtgc tcttccgatc tcgtttcgga tactcagtct ctgaa 45 <210> 416 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 416 agacgtgtgc tcttccgatc tacaaattac ctaaactgac tcaagaagaa 50 <210> 417 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 417 agacgtgtgc tcttccgatc tggctccttt cgtgagcgaa g 41 <210> 418 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 418 agacgtgtgc tcttccgatc tagaggtagt ggaggtcaag gt 42 <210> 419 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 419 agacgtgtgc tcttccgatc ttgacttgcg ttcatcttgt tatttaaac 49 <210> 420 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 420 agacgtgtgc tcttccgatc tcctgaaaag gtaggttggt gc 42 <210> 421 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 421 ggatattcct ttctactctt tgacatcatc ttcacctctt ggttgtgcag g 51 <210> 422 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 422 ggatattcct ttctactctt tgacatcatc tcatttaccc ctcacaacaa ccag 54 <210> 423 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 423 ggatattcct ttctactctt tgacatcatc tccatgttct aacaccgtga tctg 54 <210> 424 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 424 ggatattcct ttctactctt tgacatcatc tcatggaaaa cacttcagtt tgctc 55 <210> 425 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 425 ggatattcct ttctactctt tgacatcatc tacagcaaag gttctacccc g 51 <210> 426 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 426 ggatattcct ttctactctt tgacatcatc tccaggctac ttcttactca ttccaa 56 <210> 427 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 427 ggatattcct ttctactctt tgacatcatc tacctccatc accagctagt ct 52 <210> 428 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 428 ggatattcct ttctactctt tgacatcatc tggtgccccc gttttatctg t 51 <210> 429 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 429 ggatattcct ttctactctt tgacatcatc tccaagcaaa cccatcctct ctg 53 <210> 430 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 430 ggatattcct ttctactctt tgacatcatc taggaggcag gtgttatcat tcc 53 <210> 431 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 431 ggatattcct ttctactctt tgacatcatc ttttatctga aattcaaatt taactgggcc 60 <210> 432 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 432 ggatattcct ttctactctt tgacatcatc tggagagggt ggaggggct 49 <210> 433 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 433 ggatattcct ttctactctt tgacatcatc tggggagctt gcatcctact c 51 <210> 434 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 434 ggatattcct ttctactctt tgacatcatc tggctcccct ggtttctcc 49 <210> 435 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 435 ggatattcct ttctactctt tgacatcatc tacacccgac cccgcc 46 <210> 436 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 436 ggatattcct ttctactctt tgacatcatc ttgttctagg attaaaggag aatgcatg 58 <210> 437 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 437 ggatattcct ttctactctt tgacatcatc tccatagaag gctacctccc tct 53 <210> 438 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 438 ggatattcct ttctactctt tgacatcatc tggaattaaa atatgaagga gttctgcaag 60 <210> 439 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 439 ggatattcct ttctactctt tgacatcatc tttaaaagtt aagacaagac aggttcatac 60 a 61 <210> 440 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 440 ggatattcct ttctactctt tgacatcatc tcccaaggac aggcacaact ac 52 <210> 441 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 441 ggatattcct ttctactctt tgacatcatc tctcacagca gaaaagccaa tactt 55 <210> 442 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 442 ggatattcct ttctactctt tgacatcatc tccgataaac accacaggct cta 53 <210> 443 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 443 ggatattcct ttctactctt tgacatcatc tgtcaggcag atgcccagaa g 51 <210> 444 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 444 ggatattcct ttctactctt tgacatcatc tctccaagtc atgccacctc a 51 <210> 445 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 445 ggatattcct ttctactctt tgacatcatc taggtggaca ggggacatga 50 <210> 446 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 446 ggatattcct ttctactctt tgacatcatc tctgaaatag gaacactgcc acc 53 <210> 447 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 447 ggatattcct ttctactctt tgacatcatc tcaaagcctc cccctggtta g 51 <210> 448 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 448 ggatattcct ttctactctt tgacatcatc ttgtggagtc tgaaactcag cc 52 <210> 449 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 449 ggatattcct ttctactctt tgacatcatc tcagggaggg gcatggc 47 <210> 450 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 450 ggatattcct ttctactctt tgacatcatc tctgagactc acggctctga c 51 <210> 451 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 451 ggatattcct ttctactctt tgacatcatc tctaaattcg gtctcaaaaa caaaacgaa 59 <210> 452 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 452 ggatattcct ttctactctt tgacatcatc tccacactga caggggatat agg 53 <210> 453 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 453 ggatattcct ttctactctt tgacatcatc tcatacaagt ccttgttcac ggatag 56 <210> 454 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 454 ggatattcct ttctactctt tgacatcatc tgaccagcac gttccgagc 49 <210> 455 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 455 ggatattcct ttctactctt tgacatcatc tagggaccgc aggggac 47 <210> 456 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 456 ggatattcct ttctactctt tgacatcatc tccctagcac agccacagtc 50 <210> 457 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 457 ggatattcct ttctactctt tgacatcatc tttttctcat ttagttgtct ttaaattgaa 60 atgc 64 <210> 458 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 458 ggatattcct ttctactctt tgacatcatc tggcagccct tgtcatccag 50 <210> 459 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 459 ggatattcct ttctactctt tgacatcatc tcaccctgac tctaacttga ccc 53 <210> 460 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 460 ggatattcct ttctactctt tgacatcatc tcatgggtac aggaatgtac acct 54 <210> 461 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 461 ggatattcct ttctactctt tgacatcatc ttctaaaacc tgccttggct cc 52 <210> 462 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 462 ggatattcct ttctactctt tgacatcatc tcagcagtct ccgcatcgt 49 <210> 463 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 463 ggatattcct ttctactctt tgacatcatc tcactgtgcc cagcttaatt ttgt 54 <210> 464 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 464 ggatattcct ttctactctt tgacatcatc tccctggggt gtcaagtact c 51 <210> 465 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 465 ggatattcct ttctactctt tgacatcatc tcataactcc acacatcact ctggt 55 <210> 466 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 466 ggatattcct ttctactctt tgacatcatc ttgttcctct tccaacgagg c 51 <210> 467 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 467 ggatattcct ttctactctt tgacatcatc tcaggcactc tcggtggatc 50 <210> 468 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 468 ggatattcct ttctactctt tgacatcatc tcctaaggtc aaatcctagg gggtaata 58 <210> 469 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 469 ggatattcct ttctactctt tgacatcatc tccggggctc tggtcattg 49 <210> 470 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 470 ggatattcct ttctactctt tgacatcatc tgttcagcgg gtctccattg t 51 <210> 471 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 471 ggatattcct ttctactctt tgacatcatc ttgaagacct cacagtaaaa ataggtgatt 60 <210> 472 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 472 ggatattcct ttctactctt tgacatcatc ttgtggaaga tccaatccat ttttgttg 58 <210> 473 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 473 ggatattcct ttctactctt tgacatcatc tgagggtctg acgggtagag t 51 <210> 474 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 474 ggatattcct ttctactctt tgacatcatc tacagcacat gacggaggtt g 51 <210> 475 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 475 ggatattcct ttctactctt tgacatcatc tttataaggc ctgctgaaaa tgactgaa 58 <210> 476 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 476 ggatattcct ttctactctt tgacatcatc tgaccccagt tgcaaaccag ac 52 <210> 477 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 477 ggatattcct ttctactctt tgacatcatc ttctgattcc tcactgattg ctcttag 57 <210> 478 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 478 ggatattcct ttctactctt tgacatcatc tcgggggctc agcatcca 48 <210> 479 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 479 ggatattcct ttctactctt tgacatcatc tcaaacagta gcttccctgg gt 52 <210> 480 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 480 ggatattcct ttctactctt tgacatcatc tcaggactcg gtggatatgg tc 52 <210> 481 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 481 ggatattcct ttctactctt tgacatcatc tggcgcatgt aggcggtg 48 <210> 482 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 482 ggatattcct ttctactctt tgacatcatc tggagatgtg gtcaatggaa gaaac 55 <210> 483 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 483 ggatattcct ttctactctt tgacatcatc ttcgtgttgg caacatacca tct 53 <210> 484 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 484 ggatattcct ttctactctt tgacatcatc tcttctaaca gctacccttc catcat 56 <210> 485 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 485 ggatattcct ttctactctt tgacatcatc taggaaagtt ctgctgtttt tagcaaa 57 <210> 486 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 486 ggatattcct ttctactctt tgacatcatc tctcagtatt tgcagaatac attcaaggt 59 <210> 487 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 487 ggatattcct ttctactctt tgacatcatc tgaagagtaa caagccaaat gaacaga 57 <210> 488 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 488 ggatattcct ttctactctt tgacatcatc tttgatagtt gttctagcag tgaagaga 58 <210> 489 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 489 ggatattcct ttctactctt tgacatcatc tacaattcaa aagcacctaa aaagaatagg 60 <210> 490 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 490 ggatattcct ttctactctt tgacatcatc tacagaaaaa aaggtagatc tgaatgct 58 <210> 491 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 491 ggatattcct ttctactctt tgacatcatc taggatctga ttcttctgaa gataccg 57 <210> 492 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 492 ggatattcct ttctactctt tgacatcatc ttggatttat ctgctcttcg cgt 53 <210> 493 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 493 ggatattcct ttctactctt tgacatcatc tgtatctaca actgtttcat atacttcatc 60 ttct 64 <210> 494 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 494 ggatattcct ttctactctt tgacatcatc tcaggccaaa gacggtacaa ct 52 <210> 495 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 495 ggatattcct ttctactctt tgacatcatc tctcttcttt ttccaattct tgaatttgac 60 a 61 <210> 496 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 496 ggatattcct ttctactctt tgacatcatc tgcagtttca ggacatccat tttatcaa 58 <210> 497 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 497 ggatattcct ttctactctt tgacatcatc tccaagttaa tattcctaac acactgttca 60 <210> 498 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 498 ggatattcct ttctactctt tgacatcatc taataaggct tctagtctct tttgttgg 58 <210> 499 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 499 ggatattcct ttctactctt tgacatcatc tacaagcact tatcaaaact gaaaaattac 60 aat 63 <210> 500 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 500 ggatattcct ttctactctt tgacatcatc tggcttaata atgtcctcat taaggtctat 60 c 61 <210> 501 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 501 ggatattcct ttctactctt tgacatcatc tcaatgcaag ttcttcgtca gcta 54 <210> 502 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 502 ggatattcct ttctactctt tgacatcatc ttttaaacta tttctaacaa cgccttctct 60 <210> 503 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 503 ggatattcct ttctactctt tgacatcatc ttcaacatcc cacctcccat cta 53 <210> 504 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 504 ggatattcct ttctactctt tgacatcatc tgaatcatat ttgtgtctga tgggcaat 58 <210> 505 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 505 ggatattcct ttctactctt tgacatcatc taaaccatgt gaaaatcaca gattttgg 58 <210> 506 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 506 ggatattcct ttctactctt tgacatcatc tcagagaatc tccattttag cacttacc 58 <210> 507 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 507 ggatattcct ttctactctt tgacatcatc ttgaatatca ttaaggaact tgatattttt 60 cagg 64 <210> 508 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 508 ggatattcct ttctactctt tgacatcatc taaatttgag ttgaaatcat ggtattgcat 60 <210> 509 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 509 ggatattcct ttctactctt tgacatcatc tcacagcacc caatcaagct c 51 <210> 510 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 510 ggatattcct ttctactctt tgacatcatc tgacaacact cttcagcaca atcaa 55 <210> 511 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 511 ggatattcct ttctactctt tgacatcatc tagggcatca cctctctaca gtt 53 <210> 512 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 512 ggatattcct ttctactctt tgacatcatc tgtttgctga atgttaacat taatgcttat 60 tt 62 <210> 513 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 513 ggatattcct ttctactctt tgacatcatc tacggacctt acgtcagtga ct 52 <210> 514 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 514 ggatattcct ttctactctt tgacatcatc tggctacgtg ttagtggctc tta 53 <210> 515 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 515 ggatattcct ttctactctt tgacatcatc tacggagaat aaactgagct ctctc 55 <210> 516 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 516 ggatattcct ttctactctt tgacatcatc tccaaaaaat gaagccggcg a 51 <210> 517 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 517 ggatattcct ttctactctt tgacatcatc ttgcctactg gttcaattac ttttaaaaag 60 <210> 518 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 518 ggatattcct ttctactctt tgacatcatc tcatcagcat ttgactttac cttatcaatg 60 <210> 519 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 519 ggatattcct ttctactctt tgacatcatc tctagagtgt ctgtgtaatc aaacaagttt 60 <210> 520 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 520 ggatattcct ttctactctt tgacatcatc ttgatccagt aacaccaata gggttc 56 <210> 521 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 521 ggatattcct ttctactctt tgacatcatc tagtgaaaag agtctcaaac acaaactag 59 <210> 522 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 522 ggatattcct ttctactctt tgacatcatc tttttttcca gtttattgta tttgcatagc 60 a 61 <210> 523 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 523 ggatattcct ttctactctt tgacatcatc tccttataca ccgtgccgaa cg 52 <210> 524 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 524 ggatattcct ttctactctt tgacatcatc tcacagcaaa gcagaaactc aca 53 <210> 525 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 525 ggatattcct ttctactctt tgacatcatc tccctccctc caggaagcct a 51 <210> 526 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 526 ggatattcct ttctactctt tgacatcatc tggagccaat attgtctttg tgttcc 56 <210> 527 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 527 ggatattcct ttctactctt tgacatcatc tctccttctg catggtattc tttctc 56 <210> 528 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 528 ggatattcct ttctactctt tgacatcatc ttgatgggca gattacagtg gg 52 <210> 529 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 529 ggatattcct ttctactctt tgacatcatc ttggatacag gtcaagtcta agtcg 55 <210> 530 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 530 ggatattcct ttctactctt tgacatcatc tcaatattgt tcctgtatac gccttca 57 <210> 531 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 531 ggatattcct ttctactctt tgacatcatc tttgcaagca tacaaataag aaaacatact 60 t 61 <210> 532 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 532 ggatattcct ttctactctt tgacatcatc ttcataccta cctctgcaat taaatttgg 59 <210> 533 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 533 ggatattcct ttctactctt tgacatcatc tccccgatgt aataaatatg cacatatca 59 <210> 534 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 534 ggatattcct ttctactctt tgacatcatc ttgttttcca ataaattctc agatccagg 59 <210> 535 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 535 ggatattcct ttctactctt tgacatcatc ttggatattt ctcccaatga aagtaaagta 60 c 61 <210> 536 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 536 ggatattcct ttctactctt tgacatcatc ttgctatcga tttcttgatc acatagact 59 <210> 537 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 537 ggatattcct ttctactctt tgacatcatc tcgtgggcgt gagcgc 46 <210> 538 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 538 ggatattcct ttctactctt tgacatcatc tctgacctta aaatttggag aaaagtatcg 60 <210> 539 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 539 ggatattcct ttctactctt tgacatcatc tcatctggtg ttacagaagt tgaactg 57 <210> 540 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 540 ggatattcct ttctactctt tgacatcatc tcgaagatgg caaacttccc atc 53 <210> 541 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 541 ggatattcct ttctactctt tgacatcatc tctcagacac ttacggggac ag 52 <210> 542 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 542 ggatattcct ttctactctt tgacatcatc tgacaggccc tgacacagg 49 <210> 543 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 543 ggatattcct ttctactctt tgacatcatc tatctctaac ccattgaggc cg 52 <210> 544 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 544 ggatattcct ttctactctt tgacatcatc tacacttgac catcaccatg tagac 55 <210> 545 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 545 ggatattcct ttctactctt tgacatcatc ttacaagctg tctctctccc agt 53 <210> 546 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 546 ggatattcct ttctactctt tgacatcatc tccagcccat ggcaaacac 49 <210> 547 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 547 ggatattcct ttctactctt tgacatcatc tcgctcacca tgtgtgactt gat 53 <210> 548 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 548 ggatattcct ttctactctt tgacatcatc ttcctatcct gagtagtggt aatctact 58 <210> 549 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 549 ggatattcct ttctactctt tgacatcatc ttctgactgt accaccatcc act 53 <210> 550 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 550 ggatattcct ttctactctt tgacatcatc tagtaacagt aggtgtttca atatgacttt 60 t 61 <210> 551 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 551 ggatattcct ttctactctt tgacatcatc tccctccagg agcccacc 48 <210> 552 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 552 ggatattcct ttctactctt tgacatcatc tactgctact acataccagg ttctg 55 <210> 553 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 553 ggatattcct ttctactctt tgacatcatc tctgatcaag gcaccgctct aa 52 <210> 554 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 554 ggatattcct ttctactctt tgacatcatc tctccatccc ggtgtgcat 49 <210> 555 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 555 ggatattcct ttctactctt tgacatcatc ttcaagggct atgggggctt 50 <210> 556 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 556 ggatattcct ttctactctt tgacatcatc tagatgtgcc ctgacatcag aaata 55 <210> 557 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 557 ggatattcct ttctactctt tgacatcatc ttcacttaac cttcagtgtt gatctga 57 <210> 558 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 558 ggatattcct ttctactctt tgacatcatc taggagtggg accatgtttg g 51 <210> 559 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 559 ggatattcct ttctactctt tgacatcatc tccatcgctc ccatcattgc t 51 <210> 560 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 560 ggatattcct ttctactctt tgacatcatc tctttcaaac acgtgtgatc aatagtac 58 <210> 561 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 561 ggatattcct ttctactctt tgacatcatc tcattctcat atcagaactt aaatacatag 60 cag 63 <210> 562 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 562 ggatattcct ttctactctt tgacatcatc tacaagtcca tcttataggg gaagga 56 <210> 563 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 563 ggatattcct ttctactctt tgacatcatc taaatgcatg agcatgcgca a 51 <210> 564 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 564 ggatattcct ttctactctt tgacatcatc tccacgataa aattctctta tcttgaagga 60 tt 62 <210> 565 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 565 ggatattcct ttctactctt tgacatcatc tgttcaaagt gtttctgata ttgaaaaatt 60 ttaagt 66 <210> 566 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 566 ggatattcct ttctactctt tgacatcatc tcctttttca tccttcgcac atgtata 57 <210> 567 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 567 ggatattcct ttctactctt tgacatcatc tccctggagc agatgactca ca 52 <210> 568 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 568 ggatattcct ttctactctt tgacatcatc taggcagggg gcttggt 47 <210> 569 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 569 ggatattcct ttctactctt tgacatcatc tcacaccttt tttaacaacc ggatct 56 <210> 570 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 570 ggatattcct ttctactctt tgacatcatc taggtgaggc cctgtaatct gta 53 <210> 571 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 571 ggatattcct ttctactctt tgacatcatc taccttaata tcagacttcc cagcc 55 <210> 572 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 572 ggatattcct ttctactctt tgacatcatc tttttgggag ctctgagaca gg 52 <210> 573 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 573 ggatattcct ttctactctt tgacatcatc tctgatggca aagcagaaga caata 55 <210> 574 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 574 ggatattcct ttctactctt tgacatcatc tagccctttc agggagtcct 50 <210> 575 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 575 ggatattcct ttctactctt tgacatcatc ttctcttaat ctcagttttc gttactgtaa 60 aat 63 <210> 576 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 576 ggatattcct ttctactctt tgacatcatc tcatagcacc actcggtgaa ctt 53 <210> 577 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 577 ggatattcct ttctactctt tgacatcatc taggagtgag aacccacgta ca 52 <210> 578 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 578 ggatattcct ttctactctt tgacatcatc tcaacagtgt gaatgtactt aatgacact 59 <210> 579 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 579 ggatattcct ttctactctt tgacatcatc tcctgtcctg tgaggcagg 49 <210> 580 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 580 ggatattcct ttctactctt tgacatcatc ttgccctgct ggtgttcttt tata 54 <210> 581 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 581 ggatattcct ttctactctt tgacatcatc ttcgctgctg ctgttgct 48 <210> 582 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 582 ggatattcct ttctactctt tgacatcatc tgggtcctca ggtccttgtg 50 <210> 583 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 583 ggatattcct ttctactctt tgacatcatc tgcgttggga acttcaactg g 51 <210> 584 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 584 ggatattcct ttctactctt tgacatcatc tttgtagccc agcatggcaa 50 <210> 585 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 585 ggatattcct ttctactctt tgacatcatc ttttgctttt gagggacaga aaatca 56 <210> 586 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 586 ggatattcct ttctactctt tgacatcatc tacttggcta atgagttgat ctctct 56 <210> 587 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 587 ggatattcct ttctactctt tgacatcatc tagttatttt caaaagaaaa caaaggacat 60 agatt 65 <210> 588 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 588 ggatattcct ttctactctt tgacatcatc tgcaaagagt gctcaaacct tgg 53 <210> 589 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 589 ggatattcct ttctactctt tgacatcatc tgttactaat ttttttggct atcatgcca 59 <210> 590 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 590 ggatattcct ttctactctt tgacatcatc tgtagcagag aacccacttg gg 52 <210> 591 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 591 ggatattcct ttctactctt tgacatcatc tagctcaaac catattctta atttttaaaa 60 ttcac 65 <210> 592 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 592 ggatattcct ttctactctt tgacatcatc tctcctctgt cgtaagtcaa gtcttt 56 <210> 593 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 593 ggatattcct ttctactctt tgacatcatc tcagtctggt aaagtgctat cgaatc 56 <210> 594 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 594 ggatattcct ttctactctt tgacatcatc tctgaatagt ccgtttcgga tactca 56 <210> 595 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 595 ggatattcct ttctactctt tgacatcatc taaaaacaca aattacctaa actgactcaa 60 g 61 <210> 596 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 596 ggatattcct ttctactctt tgacatcatc tagcgcctcc cggct 45 <210> 597 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 597 ggatattcct ttctactctt tgacatcatc ttgccagagg tagtggaggt c 51 <210> 598 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 598 ggatattcct ttctactctt tgacatcatc tagtgacttg cgttcatctt gttattta 58 <210> 599 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <400> 599 ggatattcct ttctactctt tgacatcatc tggagcctga aaaggtaggt tgg 53

Claims (57)

  1. 고-처리량 서열 분석을 위한 게놈 DNA의 표적화된 영역을 제조하는 방법으로서:
    (a) 게놈 DNA 샘플을 수득하는 단계;
    (b) 게놈 DNA 샘플의 적어도 일부를 증폭시키는 단계로서:
    (i) 5'에서 3’ 방향으로 제1 영역, 0 내지 50개의 뉴클레오티드의 길이를 갖는 제2 영역, 적어도 4개의 축퇴 뉴클레오티드를 포함하는 제3 영역, 및 제1 표적 게놈 DNA 영역에 상보적인 서열을 포함하는 제4 영역을 포함하는 제1 올리고뉴클레오티드; 및
    (ii) 5'에서 3’ 방향으로 제5 영역, 0 내지 50개의 뉴클레오티드의 길이를 갖는 제6 영역, 및 제2 표적 게놈 DNA 영역에 상보적인 서열을 포함하는 제7 영역을 포함하는 제2 올리고뉴클레오티드를 사용한 2회 주기의 PCR을 실시하여 게놈 DNA 샘플의 적어도 일부를 증폭시키는 단계:;
    (c) 단계 (b)에서 사용된 어닐링 온도보다 0~10℃ 더 높은 어닐링 온도로 적어도 3회 주기의 PCR을 실시하고:
    (i) 상기 제1 영역의 적어도 일부의 역 보체에 혼성화될 수 있는 서열을 포함하는 제3 올리고뉴클레오티드; 및
    (ii) 상기 제5 영역의 적어도 일부의 역 보체에 혼성화될 수 있는 서열을 포함하는 제4 올리고뉴클레오티드를 사용하여 단계 (b)의 생성물을 증폭시키는 단계; 및
    (d) 5'에서 3’ 방향으로 제8 영역, 0 내지 50개의 뉴클레오티드의 길이를 갖는 제9 영역, 및 제3 표적 게놈 DNA 영역에 상보적인 서열을 포함하는 제10 영역을 포함하는 제 5 올리고뉴클레오티드를 사용한 적어도 1회 주기의 PCR을 실시하여 상기 단계 (c)의 생성물을 증폭시키는 단계로서, 여기서 상기 제3 표적 게놈 DNA 영역은 상기 제2 표적 게놈 DNA 영역보다 상기 제1 표적 게놈 DNA 영역에 더 가까운 적어도 하나의 뉴클레오티드인 단계를 포함하는 것인, 방법.
  2. 제1항에 있어서,
    상기 방법은 고-처리량 서열 분석을 위한 게놈 DNA의 1 내지 10,000개의 표적화된 영역을 제조하는 방법인 것인, 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 제3 영역은 고유 분자 식별자(UMI)인 것인, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 제3 표적 게놈 DNA 영역은 상기 제2 표적 게놈 DNA 영역보다 상기 제1 표적 게놈 DNA 영역에 더 가까운 1~10개의 염기인 것인, 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 제1 영역 및 상기 제8 영역은 범용 프라이머 결합 부위인 것인, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 제1 영역 및 상기 제8 영역은 전체 또는 부분 차세대 서열 분석(NGS) 어댑터 서열인 것인, 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 제5 영역은 인간 게놈에서 발견될 수 없는 서열을 포함하는 것인, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서,
    상기 제5 영역은 차세대 서열 분석(NGS) 어댑터 서열과 상이한 서열을 포함하는 것인, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서,
    상기 제1 영역 및 상기 제5 영역의 용융 온도들은 상기 제4 영역 및 상기 제7 영역의 용융 온도들보다 0~10℃ 더 높은 것인, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서,
    상기 제3 영역의 축퇴 뉴클레오티드들은 각각 독립적으로 A, T 또는 C 중 하나인 것인, 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 제3 영역의 축퇴 뉴클레오티드들 중 어느 것도 G가 아닌 것인, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서,
    각각이 고유한 제3 영역을 갖는 제1 올리고뉴클레오티드 군이 존재하는 것인, 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서,
    상기 단계 (c)의 생성물을 정제하는 단계를 추가로 포함하는 것인, 방법.
  14. 제13항에 있어서,
    상기 정제하는 단계는 SPRI 정제 또는 컬럼 정제를 포함하는 것인, 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서,
    상기 단계 (d)의 생성물을 정제하는 단계를 추가로 포함하는 것인, 방법.
  16. 제15항에 있어서,
    상기 정제하는 단계는 SPRI 정제 또는 컬럼 정제를 포함하는 것인, 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서,
    (e) 상기 제1 영역 및 상기 제8 영역에 혼성화되는 프라이머들을 사용하는 PCR에 의해 상기 단계 (d)의 생성물을 증폭시키는 단계로서, 여기서 상기 프라이머들은 차세대 서열 분석을 위한 인덱스 서열을 포함하는 것인, 방법.
  18. 제17항에 있어서,
    상기 단계 (e)의 생성물을 정제하는 단계를 추가로 포함하는 것인, 방법.
  19. 제18항에 있어서,
    상기 정제하는 단계는 SPRI 정제 또는 컬럼 정제를 포함하는 것인, 방법.
  20. 제17항 내지 제19항 중 어느 한 항에 있어서,
    (f) 상기 단계 (e)의 생성물에 대한 고-처리량 DNA 서열 분석을 실시하는 단계를 추가로 포함하는 것인, 방법.
  21. 제20항에 있어서,
    상기 고-처리량 DNA 서열 분석은 차세대 서열 분석을 포함하는 것인, 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서,
    상기 제1 표적 게놈 DNA 영역 및 상기 제2 표적 게놈 DNA 영역은 상기 게놈 DNA의 반대 가닥 상에 있는 것인, 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서,
    상기 제1 표적 게놈 DNA 영역 및 상기 제2 표적 게놈 DNA 영역은 40개의 뉴클레오티드 내지 500개의 뉴클레오티드에 의해 분리되는 것인, 방법.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서,
    상기 단계 (b)는 약 30분의 연장 시간을 포함하는 것인, 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서,
    상기 단계 (c)는 약 30초의 연장 시간을 포함하는 것인, 방법.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서,
    상기 단계 (d)는 약 30분의 연장 시간을 포함하는 것인, 방법.
  27. 적어도 하나의 표적 유전자의 추가 복제의 빈도(FEC)를 정량화하는 방법으로서:
    (a) 게놈 DNA 샘플을 수득하는 단계;
    (b) 제1항 내지 제26항 중 어느 한 항의 방법에 따른 고-처리량 서열 분석을 위한 게놈 DNA를 제조하는 단계로서, 여기서 제4 영역, 제7 영역 및 제10 영역의 서열들은 적어도 하나의 표적 유전자에 혼성화되는 단계;
    (c) 제20항의 방법에 따른 고-처리량 서열 분석을 실시하는 단계; 및
    (d) 상기 단계 (c)에서 수득한 서열 분석 정보를 기초로 하나 이상의 표적 유전자에 대한 추가 복제의 빈도(FEC)를 계산하는 단계를 포함하는 것인, 방법.
  28. 제27항에 있어서,
    상기 방법은 표적 유전자 세트에 대한 추가 복제의 빈도(FEC)를 정량화하는 방법이고, 여기서 상기 표적 유전자 세트는 2 내지 1000개의 표적 유전자를 포함하는 것인, 방법.
  29. 제27항 또는 제28항에있어서,
    상기 단계 (b)는 제1 올리고뉴클레오티드 군, 제2 올리고뉴클레오티드 군, 및 제5 올리고뉴클레오티드 군을 사용하여 실시되고, 여기서 상기 제1, 제2 및 제5 올리고뉴클레오티드들의 군의 각각의 일부는 표적 유전자 세트 중 하나에 상보적인 것인, 방법.
  30. 제27항 내지 제29항 중 어느 한 항에 있어서,
    상기 제4, 제7, 및 제10 영역들의 각각은 인간 게놈에서 단 한번만 발견되는 서열들을 포함하는, 방법.
  31. 제27항 내지 제30항 중 어느 한 항에 있어서,
    하나의 표적 유전자에 혼성화되는 각각의 제1 올리고뉴클레오티드는 동일한 표적 유전자에 혼성화되는 제1 올리고뉴클레오티드 서로에 비해 고유한 제3 영역을 갖는, 방법.
  32. 제27항 내지 제31항 중 어느 한 항에 있어서,
    상기 단계 (b)는 참조 유전자에 상보적인 제4, 제7 및 제10 영역을 각각 포함하는 제1 올리고뉴클레오티드, 제2 올리고뉴클레오티드, 및 제5 올리고뉴클레오티드를 사용하여 실시되는, 방법.
  33. 제27항 내지 제32항 중 어느 한 항에 있어서,
    상기 단계 (b)는 고-처리량 서열 분석을 위한 각각의 표적 유전자 또는 참조 유전자의 일부를 제조하고, 여기서 상기 부분은 40개의 뉴클레오티드 내지 500개의 뉴클레오티드의 길이를 갖는, 방법.
  34. 제27항 내지 제33항 중 어느 한 항에 있어서,
    추가 복제의 빈도(FEC)는 하기와 같이 정의되는, 방법:
    Figure pct00036
    .
  35. 제27항 내지 제34항 중 어느 한 항에 있어서, 상기 단계 (d)는:
    (i) 차세대 서열 분석(NGS) 판독물을 각 표적 유전자의 표적화된 부분들에 정렬하고 상기 NGS 판독물이 정렬되는 유전자좌를 기초로 하위군으로 분류하는 단계;
    (ii) 동일한 UMI 서열을 수반하는 모든 차세대 서열 분석(NGS) 판독물이 하나의 UMI 패밀리로 분류되도록 UMI 서열을 기초로 각 유전자좌에서 NGS 판독물을 나누는 단계;
    (iii) PCR 오류 또는 차세대 서열 분석(NGS) 오류로 인한 UMI 패밀리들을 제거하는 단계;
    (iv) 각 유전자좌에서 고유한 UMI 서열의 수를 세는 단계; 및
    (v) 각 표적 유전자 및 참조 유전자의 각 유전자좌에 대한 고유한 UMI 서열의 수를 기초로 추가 복제의 빈도(FEC)를 계산하는 단계를 포함하는 것인, 방법.
  36. 제35항에 있어서,
    상기 단계 (d)(iii)는 UMI 축퇴 기반 설계를 충족하지 않는 UMI 서열들을 제거하는 단계를 포함하는, 방법.
  37. 제35항 또는 제36항에 있어서,
    상기 단계 (d)(iii)는 Fmin보다 작은 UMI 패밀리 크기를 갖는 UMI 패밀리들을 제거하는 단계를 포함하고, 여기서 상기 UMI 패밀리 크기는 동일한 UMI를 수반하는 판독물의 수이고, Fmin은 2 내지 20 사이인 것인, 방법.
  38. 제35항 내지 제37항 중 어느 한 항에 있어서,
    상기 단계 (d)(iv)는 더 큰 패밀리 크기를 갖는 다른 UMI 서열로부터 단지 1 또는 2개의 염기만큼 상이한 UMI 서열들을 제거하는 단계를 포함하는 것인, 방법.
  39. 제27항 내지 제38항 중 어느 한 항에 있어서,
    상기 추가 복제의 빈도(FEC) 하기와 같이 정의되고:
    Figure pct00037
    ,
    여기서
    Figure pct00038
    은 표적 유전자 유전자좌의 전체 또는 일부에 대한 고유한 UMI 수의 합이고,
    Figure pct00039
    은 고려할 유전자좌의 수이고,
    Figure pct00040
    은 상기 표적 유전자에서 유전자좌의 전체 수 이하이고;
    Figure pct00041
    은 참조 유전자좌의 전체 또는 일부에 대한 고유한 UMI 수의 합이고,
    Figure pct00042
    은 하나의 기준에 대하여 고려할 유전자좌의 수이고,
    Figure pct00043
    은 상기 기준에서 유전자좌의 전체 수 이하이고;
    Figure pct00044
    은 고려할 기준의 수이고,
    Figure pct00045
    은 기준의 전체 수 이하이며;
    Figure pct00046
    은 실험 보정에 의해 결정되는 것인, 방법.
  40. 제27항 내지 제39항 중 어느 한 항에 있어서,
    상기 추가 복제의 빈도(FEC)를 사용하여 상기 표적 유전자의 복제 수 변이(CNV) 상태를 확인하는 것인, 방법.
  41. 적어도 하나의 표적 게놈 유전자좌에 대한 상이한 유전적 동일성의 대립 유전자 비율을 정량화하는 방법으로서:
    (a) 게놈 DNA 샘플을 수득하는 단계;
    (b) 제1항 내지 제26항 중 어느 한 항의 방법에 따른 고-처리량 서열 분석을 위한 게놈 DNA를 제조하는 단계로서, 여기서 상기 제4 영역, 상기 제7 영역 및 상기 제10 영역의 서열들은 적어도 하나의 표적 게놈 유전자좌에 가까운 게놈 DNA에 혼성화되는 단계;
    (c) 제20항의 방법에 따른 고-처리량 서열 분석을 실시하는 단계; 및
    (d) 상기 단계 (c)에서 수득한 서열 분석 정보에 대한 적어도 하나의 표적 게놈 유전자좌에 대한 상이한 유전자 동일성의 대립 유전자 비율을 계산하는 단계를 포함하는 것인, 방법.
  42. 제41항에 있어서,
    상기 방법은 표적 게놈 유전자좌 세트에 대한 상이한 유전자 동일성의 대립 유전자 비율을 정량화하는 방법이고, 여기서 상기 표적 게놈 유전자좌 세트는 2 내지 10,000개의 표적 게놈 유전자좌를 포함하는 것인, 방법.
  43. 제41항 또는 제42항에있어서,
    상기 단계 (b)는 제1 올리고뉴클레오티드 군, 제2 올리고뉴클레오티드 군, 및 제5 올리고뉴클레오티드 군을 사용하여 실시되고, 여기서 상기 제1, 제2 및 제5 올리고뉴클레오티드 군들의 각각의 일부는 상기 표적 게놈 유전자좌 세트 중 적어도 하나에 가까운 게놈 DNA에 상보적인 제4, 제7 및 제10 영역들을 각각 포함하는 것인, 방법.
  44. 제41항 내지 제43항 중 어느 한 항에 있어서,
    상기 제4, 제7 및 제10 영역들의 각각은 상기 단계 (b)의 조건하에서 상기 게놈 DNA의 비표적 영역들과 혼성화될 수 없는 서열들을 포함하는 것인, 방법.
  45. 제41항 내지 제44항 중 어느 한 항에 있어서,
    하나의 표적 게놈 유전자좌에 가까운 상기 게놈 DNA에 혼성화되는 각각의 제1 올리고뉴클레오티드는 동일한 표적 게놈 유전자좌에 가까운 게놈 DNA에 혼성화되는 제1 올리고뉴클레오티드 서로에 비해 고유한 제3 영역을 갖는 것인, 방법.
  46. 제41항 내지 제45항 중 어느 한 항에 있어서,
    각각의 표적 게놈 유전자좌는 40개의 뉴클레오티드 내지 500개의 뉴클레오티드의 길이를 갖는 것인, 방법.
  47. 제41항 내지 제46항 중 어느 한 항에 있어서,
    상기 단계 (d)는:
    (i) 차세대 서열 분석(NGS) 판독물을 표적화된 게놈 유전자좌에 정렬하고 상기 NGS 판독물이 정렬되는 유전자좌를 기초로 하위군으로 분류하는 단계;
    (ii) 동일한 UMI 서열을 수반하는 모든 차세대 서열 분석(NGS) 판독물이 하나의 UMI 패밀리로 분류되도록 UMI 서열을 기초로 각 유전자좌에서 NGS 판독물을 나누는 단계;
    (iii) PCR 오류 또는 차세대 서열 분석(NGS) 오류로 인한 UMI 패밀리들을 제거하는 단계;
    (iv) 각각의 남은 UMI 패밀리의 유전적 동일성을 호출하는 단계;
    (v) 각 유전자좌에서 고유한 UMI 서열의 수를 세는 단계; 및
    (vi) 상기 대립 유전자 비율을 계산하는 단계를 포함하는 것인, 방법.
  48. 제47항에 있어서,
    상기 단계 (d)(iii)는 UMI 축퇴 기반 설계를 충족하지 않는 UMI 서열들을 제거하는 단계를 포함하는 것인, 방법.
  49. 제47항 또는 제48항에 있어서,
    상기 단계 (d)(iii)는 Fmin보다 작은 UMI 패밀리 크기를 갖는 UMI 패밀리들을 제거하는 단계를 포함하고, 여기서 상기 UMI 패밀리 크기는 동일한 UMI를 수반하는 판독물의 수이고, Fmin은 2 내지 20 사이인 것인, 방법.
  50. 제47항 내지 제49항 중 어느 한 항에 있어서,
    상기 단계 (d)(iii)는 더 큰 패밀리 크기를 갖는 다른 UMI 서열로부터 단지 1 또는 2개의 염기만큼 상이한 UMI 서열들을 제거하는 단계를 포함하는 것인, 방법.
  51. 제47항 내지 제50항 중 어느 한 항에 있어서,
    상기 단계 (d)(iv)는 UMI 패밀리의 판독물의 70% 이상이 관심 유전자좌에서 동일한 경우에만 유전적 동일성을 호출하는 것을 포함하는 것인, 방법.
  52. 제41항 내지 제51항 중 어느 한 항에 있어서,
    상기 대립 유전자 비율은 R 대립유전자 = N 1 /N 2으로 정의되고, 여기서 N 1은 제1 유전적 동일성에 대한 고유한 UMI 번호이며, N 2는 제2 유전적 동일성에 대한 고유한 UMI 번호인 것인, 방법.
  53. 제47항 내지 제51항 중 어느 한 항에 있어서,
    상기 단계 (d)(iv)는 각 UMI 패밀리의 공통 서열을 식별하는 단계를 포함하는 것인, 방법.
  54. 제53항에 있어서,
    상기 공통 서열은 UMI 패밀리에서 가장 많은 수로 출현하는 서열인 것인, 방법.
  55. 제53항 또는 제54항에 있어서,
    상기 공통 서열을 해당 유전자좌에 대한 야생형 서열과 비교함으로써 공통 서열에서 돌연변이를 확인하는 단계를 추가로 포함하는 것인, 방법.
  56. 제55항에 있어서,
    상기 확인된 돌연변이의 변이 대립 유전자 빈도(VAF)를 계산하는 단계를 추가로 포함하는 것인, 방법.
  57. 제56항에 있어서,
    상기 확인된 돌연변이의 변이 대립 유전자 빈도(VAF)는 돌연변이를 갖는 UMI 패밀리의 수/UMI 패밀리의 전체 수로 정의되는 것인, 방법.
KR1020217024656A 2019-01-04 2020-01-02 다중 복제수 변이 검출 및 대립 유전자 비율 정량화를 위한 정량적 앰플리콘 서열분석 KR20210112350A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962788375P 2019-01-04 2019-01-04
US62/788,375 2019-01-04
PCT/US2020/012089 WO2020142631A2 (en) 2019-01-04 2020-01-02 Quantitative amplicon sequencing for multiplexed copy number variation detection and allele ratio quantitation

Publications (1)

Publication Number Publication Date
KR20210112350A true KR20210112350A (ko) 2021-09-14

Family

ID=71406971

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217024656A KR20210112350A (ko) 2019-01-04 2020-01-02 다중 복제수 변이 검출 및 대립 유전자 비율 정량화를 위한 정량적 앰플리콘 서열분석

Country Status (8)

Country Link
US (1) US20220098642A1 (ko)
EP (1) EP3906320A4 (ko)
JP (1) JP2022516307A (ko)
KR (1) KR20210112350A (ko)
CN (1) CN113710815A (ko)
AU (1) AU2020204908A1 (ko)
CA (1) CA3125458A1 (ko)
WO (1) WO2020142631A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117437978A (zh) * 2023-12-12 2024-01-23 北京旌准医疗科技有限公司 一种二代测序数据的低频基因突变分析方法、装置及其应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023077121A1 (en) * 2021-11-01 2023-05-04 Nuprobe Usa, Inc. Rna quantitative amplicon sequencing for gene expression quantitation
CN117497056B (zh) * 2024-01-03 2024-04-23 广州迈景基因医学科技有限公司 一种无对照hrd检测方法、系统及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007101075A2 (en) * 2006-02-22 2007-09-07 Applera Corporation Double-ligation method for haplotype and large-scale polymorphism detection
JP2011515102A (ja) * 2008-03-28 2011-05-19 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 核酸シーケンシング用組成物及び方法
WO2013009175A1 (en) * 2011-07-08 2013-01-17 Keygene N.V. Sequence based genotyping based on oligonucleotide ligation assays
CN103060924B (zh) * 2011-10-18 2016-04-20 深圳华大基因科技有限公司 微量核酸样本的文库制备方法及其应用
US9347095B2 (en) * 2013-03-15 2016-05-24 Bio-Rad Laboratories, Inc. Digital assays for mutation detection
WO2016181128A1 (en) * 2015-05-11 2016-11-17 Genefirst Ltd Methods, compositions, and kits for preparing sequencing library
JP6970205B2 (ja) * 2017-03-08 2021-11-24 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft Dnaおよびrnaの同時濃縮を含むプライマー伸長標的濃縮およびそれに対する向上

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117437978A (zh) * 2023-12-12 2024-01-23 北京旌准医疗科技有限公司 一种二代测序数据的低频基因突变分析方法、装置及其应用

Also Published As

Publication number Publication date
WO2020142631A3 (en) 2021-05-27
CA3125458A1 (en) 2020-07-09
WO2020142631A2 (en) 2020-07-09
CN113710815A (zh) 2021-11-26
JP2022516307A (ja) 2022-02-25
US20220098642A1 (en) 2022-03-31
EP3906320A2 (en) 2021-11-10
AU2020204908A1 (en) 2021-07-29
EP3906320A4 (en) 2022-10-19

Similar Documents

Publication Publication Date Title
US11214798B2 (en) Methods and compositions for rapid nucleic acid library preparation
KR102475710B1 (ko) 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법
EP2802666B1 (en) Genotyping by next-generation sequencing
EP2623613B1 (en) Increasing confidence of allele calls with molecular counting
EP1727911B1 (en) Base specific cleavage of methylation-specific amplification products in combination with mass analysis
JP2009502137A (ja) 核酸変種の迅速な同定および定量のための方法
KR20100063050A (ko) 디지털 pcr에 의한 다양한 길이의 핵산의 분석
KR20210112350A (ko) 다중 복제수 변이 검출 및 대립 유전자 비율 정량화를 위한 정량적 앰플리콘 서열분석
US20220267848A1 (en) Detection and quantification of rare variants with low-depth sequencing via selective allele enrichment or depletion
CN110592215A (zh) 检测核酸序列的组合物及检测方法
KR20230124636A (ko) 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법
KR20230006852A (ko) 무보정 및 다중 변이체 대립유전자 빈도 정량화를 위한 정량적 블로커 변위 증폭(qbda) 시퀀싱
KR102237248B1 (ko) 소나무 개체식별 및 집단의 유전 분석용 snp 마커 세트 및 이의 용도
US20230250470A1 (en) Amplicon comprehensive enrichment
WO2022204685A1 (en) Methods for sequencing nucleic acid molecules with sequential barcodes