KR102412183B1 - 올리고뉴클레오타이드 최적 조합의 제공방법 - Google Patents

올리고뉴클레오타이드 최적 조합의 제공방법 Download PDF

Info

Publication number
KR102412183B1
KR102412183B1 KR1020197032056A KR20197032056A KR102412183B1 KR 102412183 B1 KR102412183 B1 KR 102412183B1 KR 1020197032056 A KR1020197032056 A KR 1020197032056A KR 20197032056 A KR20197032056 A KR 20197032056A KR 102412183 B1 KR102412183 B1 KR 102412183B1
Authority
KR
South Korea
Prior art keywords
nucleic acid
target nucleic
target
coverage
oligonucleotide
Prior art date
Application number
KR1020197032056A
Other languages
English (en)
Other versions
KR20190125533A (ko
Inventor
장미현
Original Assignee
주식회사 씨젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 씨젠 filed Critical 주식회사 씨젠
Publication of KR20190125533A publication Critical patent/KR20190125533A/ko
Application granted granted Critical
Publication of KR102412183B1 publication Critical patent/KR102412183B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • G06F17/12Simultaneous equations, e.g. systems of linear equations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Abstract

본 발명은 종래의 방식 즉 경험적이고 매뉴얼적인 방식과는 완전히 다른 접근방식으로서, 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드의 최적 조합을 제공하는 최적화 로직에 관한 것이다. 또한, 본 발명의 최적화 로직은 (i) 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합(an oligonucleotide combination)의 제공, (ii) 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별, 그리고 (iii) 복수의 타겟 핵산서열에서 보존성 구역의 결정에 이용될 수 있다.

Description

올리고뉴클레오타이드 최적 조합의 제공방법
관련출원에 대한 교차참조
본 특허출원은 2017년 4월 17일에 대한민국 특허청에 출원된 대한민국 특허출원 제2017-0049350호에 대하여 우선권을 주장하여, 상기 특허출원들의 개시 사항은 본 명세서에 참조로서 삽입된다.
기술분야
본 발명은 복수의 타겟 핵산서열의 검출을 위한 올리고뉴클레오타이드의 최적 조합을 제공하는 기술에 관한 것이다.
병원체를 이들의 타겟 핵산분자를 검출하여 아이덴티파이 하는 다양한 기술들이 개발되었고, 이를 통칭하여 분자진단(molecular diagnosis)이라 한다. 분자진단 기술들 대부분은 프라이머 및 프로브와 같은 타겟 핵산분자-혼성화 올리고뉴클레오타이드를 이용한다.
현재까지 분자진단 기술들은 많은 발전을 하였다. 그러나 유전적 다양성(genetic diversity) 또는 유전적 변이성(genetic variability)을 나타내는 지놈을 갖는 병원체의 진단과 관련하여서는 현재까지도 해결하여야 하는 기술적 과제들이 있다.
유전적 다양성 또는 유전적 변이성은 다양한 지놈에서 보고되어 있다. 특히, 유전적 다양성은 바이러스 지놈에서 가장 빈번히 발견되고 발생한다(Bastien N. et al., Journal of Clinical Microbiology, 42:3532(2004); Peret TC. et al., Journal of Infectious Diseases, 185:1660(2002); Ebihara T. et al., Journal of Clinical Microbiology, 42:126(2004); Jenny-Avital ER. et al. Clinical Infectious Diseases, 32:1227(2001); Duffy S. et. al., Nat. Rev. Genet. 9(4):267-76(2008); Tong YG et. al., Nature. 22:526(2015)).
유전적 다양성이 있는 병원체를 검출하는 경우, 이 병원체의 특정 타겟 핵산분자의 핵산서열을 고려하여 올리고뉴클레오타이드를 디자인하고 이를 이용하면 위음성 결과가 나올 가능성이 있다. 따라서, 미지 시료에 특정 병원체가 존재하는지를 판정하기 위해서는, 이 특정 병원체의 하나의 타겟 핵산분자에 대하여 공지된 유전적 다양성의 모든 핵산서열들 또는 가능한 많은 핵산서열들을 고려하여 프로브 또는 프라이머를 디자인 하여야 한다. 이러한 유전적 다양성을 나타내는 타겟 핵산분자를 검출하기 위하여, 크게 두 가지 방식이 개발되었다.
첫 번째 방법은 유전적 다양성을 나타내는 타겟 핵산분자의 복수의 핵산서열에 혼성화 되는 복수의 올리고뉴클레오타이드를 이용하여, 타겟 핵산분자를 검출한다. 예컨대, 인플루엔자 A 바이러스의 M 유전자를 타겟으로 하는 경우, M 유전자에 대하여 공지된 모든 핵산서열들을 얼라인먼트 하고, 이 핵산서열들을 모두 커버할 수 있는 프로브를 디자인 한다. 이 경우, 하나의 프로브로 다양한 서열의 M 유전자를 모두 커버할 수 없기 때문에, 복수의 프로브(프로빙 위치가 서로 다른 프로브들)를 디자인한다(참조: 도 1).
두 번째 방법은 축퇴성 올리고뉴클레오타이드를 디자인 하는 것이다. 통상적으로, 유전적 다양성을 갖는 특정 유전자의 모든 핵산서열들에서 보존성 부위를 찾아내고, 이 보존성 부위에 혼성화 하는 축퇴성 프라이머 또는 프로브(변이 위치에 축퇴성 염기를 포함)를 이용하여 소망하는 커버리지로 특정 유전자를 검출한다(참조: 미국 특허 제8735063호, 제8318423호 및 제8685649호).
상기 방법 중 첫 번째 방법과 관련하여서는, 타겟 핵산분자의 다양성의 핵산서열들을 검출하는데 이용되는 올리고뉴클레오타이드의 최적 조합을 찾는 것이 가장 중요하다. 분석의 편의성, 효율성 및 경제성을 고려하면, 최소의 올리고뉴클레오타이드의 조합으로 소망하는 커버리지로 타겟 핵산분자를 검출하는 것이 바람직하다.
종래에는 분석자들이 타겟 핵산분자의 다양성의 핵산서열들을 검출하기 위하여, 복수의 핵산서열들에 대하여 순서대로 혹은 무작위적으로 프로브들을 조합하면서 복수의 핵산서열을 커버하는 최적의 프로브 조합을 결정하였다.
예컨대, 도 1과 같이 검출하고자 하는 타겟 핵산분자에 대하여 6개의 다양성의 타겟 핵산서열이 있고 이 복수의 핵산서열을 커버하는 6개의 프로브들이 있다고 가정하였을 때, 프로브 1 및 프로브 2, 프로브 1 및 프로브 3, 그리고 프로브 2 및 프로브 3 등의 모든 조합을 manually 만들어서 6개 모든 서열을 커버하는 최소의 프로브 조합으로서 프로브 2 및 프로브 3을 제공할 수 있다.
복수의 프로브들 중 일부의 조합을 취사 선택하여 모든 서열을 커버할 수 있는 지를 순서대로 또는 무작위적으로 비교하면서 프로브 조합을 결정하는 종래의 방식은 타겟 핵산서열 및 프로브의 수가 적은 경우에는 제안할 수 있는 방법이다. 그러나, 타겟 핵산서열 및 프로브의 수가 많거나, 제한된 개수의 프로브를 이용하여 최대한의 서열을 커버하거나 특정 이상의 커버리지로 서열을 커버하는 경우와 같이 특정 목적이 요구되는 경우에는, 상기 종래 방법은 장시간 소요될 뿐만 아니라 정확도가 떨어지는 문제점이 있다.
발명자가 아는 한(To our best knowledge), 본 발명에서 달성하고자 하는 하기의 기술적 과제를 최적화 로직(optimization logic)으로 해결한 선행기술은 없다: (i) 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합(an oligonucleotide combination)의 제공, (ii) 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별, 그리고 (iii) 복수의 타겟 핵산서열에서 보존성 구역의 결정.
본 명세서 전체에 걸쳐 다수의 인용문헌 및 특허 문헌이 참조되고 그 인용이 표시되어 있다. 인용된 문헌 및 특허의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 보다 개선된 신속성 및 정확성을 가지고 복수의 타겟 핵산서열, 특히 유전적 다양성을 나타내는 타겟 핵산분자의 복수의 핵산서열(구체적으로, 타겟 핵산서열들)을 커버하는 올리고뉴클레오타이드의 최적 조합을 제공하는 기술을 개발하고자 하였다. 그 결과, 본 발명자들은 종래의 방식, 즉 경험적이고 매뉴얼적인 방식과는 완전히 다른 접근방식으로서, 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드의 최적 조합을 찾는 최적화 로직을 개발하였다. 또한, 본 발명자들은 상기 최적화 로직이 (i) 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합(an oligonucleotide combination)의 제공, (ii) 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별, 그리고 (iii) 복수의 타겟 핵산서열에서 보존성 구역의 결정에 이용될 수 있음을 규명하였다.
따라서, 본 발명의 목적은 올리고뉴클레오타이드 풀(a pool of oligonucleotides)로부터 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합(an oligonucleotide combination)의 제공 방법을 제공하는 데 있다.
본 발명의 다른 목적은 올리고뉴클레오타이드 풀에서 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별 방법을 제공하는 데 있다.
본 발명의 또 다른 목적은 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법을 제공하는 데 있다.
본 발명의 다른 목적 및 이점은 하기의 실시예, 청구범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 기술적 요지는 복수의 타겟 핵산서열, 구체적으로 서열 유사성을 갖는 복수의 타겟 핵산서열을 동시에 검출하는 것과 관련하여, 분석자가 직면할 수 있는(encountered) 결정 사항들, 구체적으로 (i) 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하기 위한 올리고뉴클레오타이드 조합의 결정, (ii) 제한된 개수의 올리고뉴클레오타이드들을 이용하여 최대 타겟 커버리지로 검출하기 위한 타겟 핵산서열들의 결정, 및 (iii) 복수의 타겟 핵산서열에서 보존성 구역의 결정을 효율적으로 실시하는 것이다.
본 발명자들은 이러한 결정들에 대하여 가장 이상적인 최적화 로직 3가지를 개발하였고, 이들 로직 사이에는 공통 사항이 있으며, 이 3가지 로직에 따라 본 발명은 크게 3가지 양태로 나누어진다. 이하 본 발명을 상세하게 설명한다.
Ⅰ. 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합의 제공
본 발명의 일 양태에 따르면, 본 발명은 다음 단계를 포함하는 올리고뉴클레오타이드 풀(a pool of oligonucleotides)로부터 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합(an oligonucleotide combination)의 제공 방법을 제공한다:
(a) 상기 복수의 타겟 핵산서열을 제공(prepare)하는 단계;
(b) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계; 및
(c) 상기 복수의 타겟 핵산서열에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별하는 단계; 상기 최소의 올리고뉴클레오타이드 조합 선별은 다음의 제한식 1과 2 또는 제한식 2를 만족하면서 다음의 목적식 1을 달성하도록 실시한다:
목적식 1
Figure 112019110637732-pct00001
상기 목적식 1에서, Min:은 최소화를 나타내고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non-sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고;
제한식 1
Figure 112019110637732-pct00002
상기 제한식 1에서, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non - cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, m은 목적의 타겟 커버리지로서 0 < m < 1 이며, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
제한식 2
Figure 112019110637732-pct00003
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non - cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 변수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100%인 미만인 경우에는 c s 는 비커버리지값(c non - cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
본 발명의 첫 번째 양태는 복수의 타겟 핵산서열을 목적의 타겟 커버리지(예컨대, 100%의 타겟 커버리지)로 검출하는데 이용되는 올리고뉴클레오타이드(예컨대, 프로브 및 프라이머)의 최적 조합을 제공하는 방법에 관한 것이다.
본 명세서에서 타겟 핵산서열을 언급하면서 사용되는 용어 “목적의 타겟 커버리지로 검출”은 목적의 타겟 커버리지를 달성할 수 있는, 즉 목적의 타겟 커버리지 값 이상으로 복수의 타겟 핵산서열을 검출하는 것을 의미한다.
본 발명을 보다 상세히 설명하면 다음과 같다:
단계 (a): 복수의 타겟 핵산서열의 제공
우선, 본 단계에서 복수의 타겟 핵산서열이 제공(prepare)된다. 복수의 타겟 핵산서열은 단계 (b)에서 올리고뉴클레오타이드 풀을 구축하는데 이용되며, 단계 (c)에서 올리고뉴클레오타이드 풀의 최적 조합을 결정할 때 고려 요소가 된다.
본 명세서에서 용어 “타겟 핵산분자”, “타겟 분자” 또는 “타겟 핵산”은 검출하고자 하는 유기체 내 뉴클레오타이드 분자를 의미한다. 타겟 핵산분자는 일반적으로 특정 이름이 붙여져 있으며, 지놈 전체 및 지놈을 구성하는 모든 뉴클레오타이드 분자(예컨대, 유전자, 슈도유전자, 비-코딩 서열분자, 비해독 구역 및 지놈의 일부 구역)를 포함한다.
타겟 핵산분자는 예컨대, 원핵세포(예건대, Mycoplasma pneumoniae , Chlamydophila pneumoniae , Legionella pneumophila , Haemophilus influenzae , Streptococcus pneumoniae , Bordetella pertussis , Bordetella parapertussis , Neisseria meningitidis , Listeria monocytogenes , Streptococcus agalactiae , Campylobacter, Clostridium difficile , Clostridium perfringens , Salmonella, Escherichia coli , Shigella, Vibrio , Yersinia enterocolitica , Aeromonas , Chlamydia trachomatis , Neisseria gonorrhoeae , Trichomonas vaginalis , Mycoplasma hominis , Mycoplasma genitalium , Ureaplasma urealyticum , Ureaplasma parvum , Mycobacterium tuberculosis), 진핵세포(예컨대, 원생동물과 기생동물, 균류, 효모, 고등 식물, 하등 동물 및 포유동물과 인간을 포함하는 고등동물), 바이러스 또는 비로이드의 핵산을 포함한다. 상기 진핵세포 중 기생충(parasite)의 예는 Giardia lamblia , Entamoeba histolytica , Cryptosporidium, Blastocystis hominis , Dientamoeba fragilis , Cyclospora cayetanensis를 포함한다. 상기 바이러스의 예는 호흡기 질환을 유발하는 인플루엔자 A 바이러스(Flu A), 인플루엔자 B 바이러스(Flu B), 호흡 씬시티얼 바이러스 A(Respiratory syncytial virus A: RSV A), 호흡 씬시티얼 바이러스 B(Respiratory syncytial virus B: RSV B), 파라인플루엔자 바이러스 1(PIV 1), 파라인플루엔자 바이러스 2(PIV 2), 파라인플루엔자 바이러스 3(PIV 3), 파라인플루엔자 바이러스 4(PIV 4), 메타뉴모바이러스(MPV), 인간 엔테로바이러스(HEV), 인간 보카바이러스(HBoV), 인간 라이노바이러스(HRV), 코로나바이러스 및 아데노바이러스; 위장관 질환을 유발하는 유발하는 노로바이러스, 로타바이러스, 아데노바이러스, 아스트로바이러스 및 사포바이러스를 포함한다. 또한, 상기 바아러스의 예는 HPV(human papillomavirus), MERS-CoV(Middle East respiratory syndrome-related coronavirus), 댕기바이러스(Dengue virus), HSV(Herpes simplex virus), HHV(Human herpes virus), EMV(Epstein-Barr virus), VZV(Varicella zoster virus), CMV(Cytomegalovirus), HIV, 간염 바이러스 및 폴리오바이러스를 포함한다.
본 명세서에서 용어 “타겟 핵산서열” 또는 “타겟 서열”은 타겟 핵산분자를 특정 핵산서열로 나타낸 것이다.
하나의 타겟 핵산분자, 예컨대 하나의 타겟 유전자는 하나의 특정 타겟 핵산서열을 가질 수 있거나, 혹은 유전적 다양성 또는 유전적 변이성을 나타내는 타겟 핵산분자인 경우에는 복수의 다양성 타겟 핵산서열을 가질 수 있다. 유전적 다양성을 나타내는 타겟 핵산분자를 위음성 결과 없이 검출하고자 하는 경우에는, 복수의 다양성 타겟 핵산서열을 커버할 수 있는 복수의 올리고뉴클레오타이드가 통상적으로 요구된다.
본 발명의 일 구현예에 따르면, 본 발명에서의 복수의 타겟 핵산서열은 서열 유사성을 갖는 타겟 핵산서열들이다. 구체적으로, 상기 서열 유사성을 갖는 타겟 핵산서열들은 하나의 타겟 핵산분자의 복수의 타겟 핵산서열이거나 또는 둘 이상의 타겟 핵산분자의 복수의 타겟 핵산서열일 수 있다.
본 발명의 일 구현예에 따르면, 본 발명에서의 복수의 타겟 핵산서열은 유전적 다양성을 갖는 하나의 타겟 핵산분자의 서열 유사성을 갖는 복수의 핵산서열들이다.
예를 들어, 본 발명에서 이용되는 복수의 타겟 핵산서열은 바이러스의 지놈 서열과 같이 유전적 다양성을 나타내는 타겟 핵산분자의 서열 유사성을 갖는 복수의 핵산서열들이다. 예를 들어, 인플루엔자 A 바이러스를 검출하고자 하며 M 유전자를 타겟 핵산분자로 정한 경우, 인플루엔자 A 바이러스의 M 유전자의 다양성 타겟 핵산서열들이 본 발명에서 이용될 수 있다. 인플루엔자 A 바이러스는 다양한 서브타입 및 변이체(variants)를 포함하며, 이들의 지놈 서열은 서로 차이가 있다. 따라서 인플루엔자 A 바이러스를 위음성 결과 없이 검출하고자 하면, 이러한 유전적 다양성에 따른 인플루엔자 A 바이러스의 타겟 핵산분자의 다양한 타겟 핵산서열들을 고려하여 올리고뉴클레오타이드를 디자인하여야 한다.
보다 구체적으로, 상기 복수의 타겟 핵산서열은 유전적 다양성을 가지고 있는 바이러스 또는 박테리아의 전체 지놈 서열, 지놈의 일부 서열 또는 하나의 유전자의 복수의 핵산서열이다.
본 발명의 일 구현예에 따르면, 상기 복수의 타겟 핵산서열은 동일한 기능, 동일한 구조 또는 동일한 유전자명을 가지는 호모로그(homologue)에 대응하는 복수의 유기체의 복수의 핵산서열이다. 상기 유기체는 하나의 속, 종, 아종, 서브타입, 지노타입, 시로타입, 스트레인, 분리종(isolate) 또는 재배종(cultivar)에 속한 유기체를 의미한다. 상기 호모로그는 단백질 및 핵산분자를 포함한다. 상기 구현예는, 동일한 기능(예컨대, 핵산서열에 의해 코딩되는 단백질의 생물학적 기능), 동일한 구조(예컨대, 핵산서열에 의해 코딩되는 단백질의 3차 구조) 또는 동일한 유전자명을 가지는 복수의 유기체의 상동성(homologous)의 생체분자들(예컨대, 단백질 또는 핵산)의 복수의 핵산서열을 본 발명에 이용하는 것이다. 예를 들어, HPV 타입 16의 E5 유전자에 대하여 공지된 복수의 핵산서열은 HPV 타입 16의 분리종들의 핵산서열로 고려될 수 있다. HPV 타입 16을 검출하기 위하여 타겟 핵산분자로서 E5 유전자를 이용하는 경우, HPV 타입 16의 E5 유전자의 복수의 다양성 핵산서열들을 커버할 수 있는 복수의 올리고뉴클레오타이드를 디자인 하여야 한다.
본 발명의 일 구현예에 따르면, 타겟 핵산서열은 어느 생물학적 분류(예컨대, 속, 종, 서브타입, 지노타입, 시로타입 및 서브종)의 하위에 속하는 핵산서열들을 포함한다(예를 들어, 타겟 핵산서열이 HPV 타입 16인 경우, 타겟 핵산서열은 그 하위 분류에 속하는 핵산서열들을 포함할 수 있다).
본 발명의 일 구현예에 따르면, 상기 복수의 타겟 핵산서열은 최소 3개, 최소 5개, 최소 10개, 최소 20개, 최소 30개, 최소 40, 최소 50개, 최소 60개, 최소 70개, 최소 80개, 최소 90개 또는 최소 100개의 핵산서열이다.
복수의 타겟 핵산서열은 다양한 서열 데이터베이스를 이용하여 제공할 수 있다. 예를 들어, GenBank, EMBL(European Molecular Biology Laboratory) 서열 데이터베이스 및 DDBJ(DNA DataBank of Japan)와 같은 공중 접근가능한 데이터베이스로부터 소망하는 복수의 타겟 핵산서열을 수집하고 제공할 수 있다.
본 발명의 일 구현예에 따르면, 단계 (b) 이전에 복수의 타겟 핵산서열을 얼라인먼트 한다. 타겟 핵산서열들의 얼라인먼트는 당업계에 공지된 다양한 방법에 따라 실시할 수 있으며, 이는 아래에 상세하게 설명되어 있다.
본 발명의 일 구현예에 따르면, 복수의 타겟 핵산서열은 각각 고유의 일련번호가 부여된다.
단계 (b): 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀의 제공
이어, 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)한다.
제공되는 올리고뉴클레오타이드 풀은 타겟 핵산서열에 혼성화 되는 것이다. 본 명세서에서 사용된 용어 “혼성화(hybridization)”는 상보적인 단일쇄 핵산으로부터 이중쇄 핵산을 형성함을 의미한다. 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드는 타겟 핵산서열에 완전히 상보적인 서열뿐만 아니라, 특정 엄격조건 하에서 타겟 핵산서열에 대하여 특이적으로 혼성화 하는데 충분한 서열도 포함한다. 예를 들어, 올리고뉴클레오타이드는 그의 특이성(specificity)이 훼손되지 않는 한, 타겟 핵산서열에 대하여 하나 이상의 비상보적 뉴클레오타이드(즉, 미스매치)를 포함할 수 있다. 따라서, 본 발명에서 올리고뉴클레오타이드는 타겟 핵산서열에 대하여 부분적 상보적 및 완전 상보적(perfectly complementary) 서열을 포함할 수 있으며, 구체적으로 완전히 상보적인서열(또는 매칭 서열)을 포함한다.
올리고뉴클레오타이드 풀은 타겟 핵산서열로서의 전체 지놈 서열, 지놈의 일부 서열 또는 하나의 유전자 서열의 일부 또는 전체 서열에 대하여 제작될 수 있다. 예를 들어, 타겟 핵산분자가 Mycobacterium tuberculosis의 전체 지놈 서열인 경우, Mycobacterium tuberculosis의 복수의 다양성 지놈 서열을 수집하고 이들을 얼라인먼트 한 다음, 전체 지놈 서열에 대해서 또는 보존성 부위들에 대해서만 올리고뉴클레오타이드들을 제작하여 올리고뉴클레오타이드 풀을 제공할 수 있다.
본 발명의 일 구현예에 따르면, 상기 올리고뉴클레오타이드 풀은 상기 복수의 타겟 핵산서열 중 최소 하나의 서열에 혼성화 되는 올리고뉴클레오타이드를 포함하며, 상기 올리고뉴클레오타이드 풀 내의 올리고뉴클레오타이드는 혼성화 영역 및/또는 길이가 서로 다르다. 구체적으로, 상기 올리고뉴클레오타이드 풀은 상기 복수의 타겟 핵산서열 각각에 혼성화 되는 복수의 올리고뉴클레오타이드를 포함하며, 상기 복수의 올리고뉴클레오타이드의 혼성화 영역 및/또는 길이를 달리하여 제공된다.
본 발명의 일 구현예에 따르면, 상기 올리고뉴클레오타이드는 프로브 및/또는 프라이머이다. 본 명세서에서 사용되는 용어“프로브(probe)"는 타겟 핵산서열에 실질적으로 상보적인 부위 또는 부위들을 포함하는 단일-가닥 핵산 분자를 의미한다. 본 명세서에서 사용되는 용어“프라이머”는 타겟 핵산서열에 상보적인 프라이머 연장 산물의 합성이 유도되는 조건, 즉, 뉴클레오타이드와 DNA 중합효소와 같은 중합제의 존재, 그리고 적합한 온도와 pH의 조건에서 합성의 개시점으로 작용할 수 있는 올리고뉴클레오타이드를 의미한다.
본 발명에 이용되는 올리고뉴클레오타이드는 타겟 핵산서열에 혼성화 되는 서열로 구성된 통상적인 프라이머 및 프로브 구조를 가질 수 있다. 또는, 본 발명에 이용되는 올리고뉴클레오타이드는 독특한 구조를 가질 수 있다. 예를 들어, 본 발명에 이용되는 올리고뉴클레오타이드는 스콜피온 프라이머, 몰리큘러 비이컨 프로브, 선라이즈 프라이머, 하이비이컨 프로브, 태깅 프로브, DPO 프라이머 또는 프로브(WO 2006/095981), 및 PTO 프로브(참조: WO 2012/096523)의 구조를 가질 수 있다.
본 발명에 이용되는 올리고뉴클레오타이드는 통상적인(conventional) 프라이머 또는 프로브이거나 혹은 축퇴성 염기-포함 올리고뉴클레오타이드 및/또는 유니버셜 염기-포함 올리고뉴클레오타이드와 같은 변형 올리고뉴클레오타이드일 수 있다. 본 명세서에서 사용되는 용어 “통상적인 프라이머”, “통상적인 프로브” 및 “통상적인 올리고뉴클레오타이드”는 축퇴성 염기 또는 비자연-염기가 도입되지 않은 일반적인 프라이머, 프로브 및 올리고뉴클레오타이드를 의미한다. 본 발명의 일 구현예에 따르면, 본 발명에서 축퇴성 염기-포함 올리고뉴클레오타이드 또는 유니버셜 염기-포함 올리고뉴클레오타이드가 이용되는 경우, 올리고뉴클레오타이드 풀에서 최소 50%, 최소 60%, 최소 70%, 최소 80%, 최소 90% 또는 최소 95%는 비변형 올리고뉴클레오타이드이다. 상기 축퇴성 염기는 당업계에 공지된 다음의 다양한 축퇴성 염기를 포함한다: R: A 또는 G; Y: C 또는 T; S: G 또는 C; W: A 또는 T; K: G 또는 T; M: A 또는 C; B: C 또는 G 또는 T; D: A 또는 G 또는 T; H: A 또는 C 또는 T; V: A 또는 C 또는 G; N: A 또는 C 또는 G 또는 T. 상기 유니버설 염기는 당업계에 공지된 다음의 다양한 유니버설 염기를 포함한다: 디옥시이노신, 이노신, 7-디아자-2'-디옥시이노신, 2-아자-2'-디옥시이노신, 2'-OMe 이노신, 2'-F 이노신, 디옥시 3-니트로피롤, 3-니트로피롤, 2'-OMe 3-니트로피롤, 2'-F 3-니트로피롤, 1-(2'-디옥시-베타-D-리보푸라노실)-3-니트로피롤, 디옥시 5-니트로피롤, 5-니트로인돌, 2'-OMe 5-니트로인돌, 2'-F 5-니트로인돌, 디옥시 4-니트로벤즈이미다졸, 4-니트로벤즈이미다졸, 디옥시 4-아미노벤즈이미다졸, 4-아미노벤즈이미다졸, 디옥시 네불라린, 2'-F 네불라린, 2'-F 4-니트로벤즈이미다졸, PNA-5-인트로인돌, PNA-네불라린, PNA-이노신, PNA-4-니트로벤즈이미다졸, PNA-3-니트로피롤, 모르포리노-5-니트로인돌, 모르포리노-네불라린, 모르포리노-이노신, 모르포리노-4-니트로벤즈이미다졸, 모르포리노-3-니트로피롤, 포스포라미데이트-5-니트로인돌, 포스포라미데이트-네불라린, 포스포라미데이트-이노신, 포스포라미데이트-4-니트로벤즈이미다졸, 포스포라미데이트-3-니트로피롤, 2'-0-메톡시에틸이노신, 2'-0-메톡시에틸 네불라린, 2'-0-메톡시에틸 5-니트로인돌, 2'-0-메톡시에틸 4-니트로-벤즈이미다졸, 2'-0-메톡시에틸 3-니트로피롤 및 상기 염기의 조합. 보다 구체적으로, 상기 유니버설 염기는 디옥시이노신, 이노신, 또는 이들의 조합이다.
본 발명에 이용되는 올리고뉴클레오타이드는 타겟 핵산서열에 혼성화 되는 서열을 포함한다는 기준(criteria)을 만족하는 것이거나 또는 하기의 추가적인 기준들 중 최소 하나의 기준을 만족하는 프로브 또는 프라이머일 수 있다: (i) 35-85℃의 Tm 값, (ii) 15-50 뉴클레오타이드의 길이, (iii) GC 컨텐츠가 30-80% 인 뉴클레오타이드 서열, (iv) 상기 올리고뉴클레오타이드가 헤어핀 구조를 형성하는 ΔG 값이 -8.0 kcal/mol 이상; (v) 상기 태깅 올리고뉴클레오타이드가 호모 다이머를 형성하는 경우, 호모 다이머의 형성에 관여하는 뉴클레오타이드의 비율이 70% 이하; (vi) 상기 올리고뉴클레오타이드가 호모 다이머를 형성하는 경우, 호모 다이머의 형성에 관여하는 연속적인 뉴클레오타이드의 비율이 65% 이하; (vii) 상기 올리고뉴클레오타이드가 다른 올리고뉴클레오타이드와 헤테로 다이머를 형성하는 경우, 헤테로 다이머의 형성에 관여하는 뉴클레오타이드의 비율이 70% 이하; 그리고 (viii) 상기 올리고뉴클레오타이드가 다른 올리고뉴클레오타이드와 헤테로 다이머를 형성하는 경우, 헤테로 다이머의 형성에 관여하는 연속적인 뉴클레오타이드의 비율이 65% 이하.
본 발명의 일 구현예에 따르면, 올리고뉴클레오타이드 풀에 포함되는 올리고뉴클레오타이드들은 각각 고유의 일련번호가 부여된다.
단계 (c): 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합의 선별
그 다음, 상기 복수의 타겟 핵산서열에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별한다.
본 명세서에서 용어 “타겟 커버리지”는 상기 선별된 올리고뉴클레오타이드들의 조합이 상기 복수의 타겟 핵산서열과 특이적으로 혼성화 하는 정도를 나타내는 값이다. 구체적으로, 용어 “타겟 커버리지”는 상기 선별된 올리고뉴클레오타이드들의 조합이 실질적 상보성으로(구체적으로, 완전한 상보성으로 또는 완전한 매치로) 혼성화 되는 타겟 핵산서열의 상기 복수의 타겟 핵산서열에 대한 비율을 의미한다. 상기 타겟 커버리지는 상기 비율 또는 퍼센티지로 표현될 수 있다. 본 명세서에서 타겟 커버리지를 언급하면서 사용되는 용어 “목적”은 “소정” 또는 “미리 결정(predetermined)”과 혼용되어 사용될 수 있다.
예컨대, 도 1의 복수의 타겟 핵산서열 1 내지 6 중에서 3개 이상의 타겟 핵산서열을 커버하도록 올리고뉴클레오타이드들를 선별하겠다고 하면, 목적의 타겟 커버리지는 0.5 이상(또는 50% 이상)이다. 예를 들어, 올리고뉴클레오타이드 2 및 3을 조합할 경우, 올리고뉴클레오타이드 2는 서열 4를 제외한 다른 서열들을 커버하며, 올리고뉴클레오타이드 3은 서열 1 및 서열 4를 커버하고 다른 서열들은 커버하지 못하는데, 이 조합으로 커버되는 타겟 핵산서열의 비율은 100%가 된다. 만일, 목적의 타겟 커버리지를 100%로 하였다면, 올리고뉴클레오타이드 2 및 3의 조합에 의해 달성될 수 있다.
단계 (c)에서, 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 찾아낸다. 본 명세서에서 올리고뉴클레오타이드들을 언급하면서 사용되는 용어 “목적의 타겟 커버리지를 나타내는”은 목적의 타겟 커버리지를 달성할 수 있는, 즉 목적의 타겟 커버리지 값 이상을 나타내는 올리고뉴클레오타이드들을 의미한다. 예를 들어, 목적의 타겟 커버리지가 90%라는 것은, 올리고뉴클레오타이드 조합을 이용하여 90% 이상의 타겟 커버리지로 타겟 핵산서열을 검출하는 것을 나타낸다.
본 발명의 일 구현예에 따르면, 상기 올리고뉴클레오타이드 풀로부터 선별되는 올리고뉴클레오타이드는 프라이머들의 조합, 프로브들의 조합 또는 프라이머들과 프로브들의 조합일 수 있다. 구체적으로, 상기 올리고뉴클레오타이드 풀로부터 선별되는 올리고뉴클레오타이드는 프로브들의 조합이다.
본 발명의 일 구현예에 따르면, 상기 올리고뉴클레오타이드 풀로부터 선별되는 올리고뉴클레오타이드는 통상적 올리고뉴클레오타이드들의 조합, 최소 1개의 통상적 올리고뉴클레오타이드와 최소 1개의 변형 올리고뉴클레오타이드의 조합, 또는 최소 2개의 변형 올리고뉴클레오타이드의 조합일 수 있다.
본 발명의 일 구현예에 따르면, 본 발명에서 이용되는 변형 올리고뉴클레오타이드는 단계 (c)에서 선별된 올리고뉴클레오타이드들의 개수가 많은 경우에는 선별된 올리고뉴클레오타이드들 중 최소 1개의 올리고뉴클레오타이드에 축퇴성-염기 또는 유니버설 염기를 도입하여 제공될 수 있다.
본 발명의 가장 큰 특징은 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 최소의 올리고뉴클레오타이드 조합을 선별하는데, 최적화 로직으로서 선형계획법(linear programming)을 응용한 것이다.
본 발명에 이용되는 “선형계획법(linear programming)”은 주어진 선형인 제약조건식(변수 ≥ 0인 변수의 비음수 조건식 포함)을 만족시키면서 선형인 목적 함수를 최대 또는 최소화 하는 최적화 기법이다. 선형계획법은 문제들을 표현하기 위해 수학적 모델을 사용하며, 목적식과 제한조건식 모두 선형의 형태(즉, 1차 함수)이다.
상기 최소의 올리고뉴클레오타이드 조합 선별은 다음의 제한식 1과 2 또는 제한식 2를 만족하면서 다음의 목적식 1을 달성하도록 실시한다:
목적식 1
Figure 112019110637732-pct00004
상기 목적식 1에서, Min:은 최소화를 나타내고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non-sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이다.
x p 는 결정 변수로서 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수(binary variable)이다. 결정 변수 x p 에 대하여, 올리고뉴클레오타이드 p를 선택하지 않는 경우에는 비선택값(x non-sel )으로 나타내고, 올리고뉴클레오타이드 p를 선택하는 경우에는 선택값(x sel )으로 나타낸다. 구체적으로, 비선택값(x non-sel )은 0이고 선택값(x sel )은 0 이외의 값이다. 보다 구체적으로, 비선택값(x non-sel )은 0이고, 선택값(x sel )은 1이다.
본 발명의 방법은 최소의 올리고뉴클레오타이드 조합을 선별 하는 것이므로, 일련번호 1 내지 a의 올리고뉴클레오타이드에 대한 결정 변수 x p 의 비선택값(x non - sel ) 및 선택값(x sel )의 합이 목적 함수가 되며, 목적 함수의 최소화가 목적식 1이 된다.
상기 올리고뉴클레오타이드 p의 일련번호는 올리고뉴클레오타이드 풀의 올리고뉴클레오타이드들에 부여되며, 상기 목적식 1에서 올리고뉴클레오타이드 p의 일련번호 a는 올리고뉴클레오타이드 풀에서 마지막 올리고뉴클레오타이드의 일련번호(구체적으로, 1보다 큰 정수)를 나타낸다.
본 발명에 따르면, 최소의 올리고뉴클레오타이드 조합을 선별하기 위해서는 다음의 제한식 1과 2 또는 제한식 2를 만족해야 한다:
제한식 1
Figure 112019110637732-pct00005
상기 제한식 1에서, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non - cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, m은 목적의 타겟 커버리지로서 0 < m < 1 이며, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이다.
본 발명에서, c s 는 결정 변수로서 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수(binary variable)이다. 본 발명에서 결정 변수 c s 를 표현할 때, 타겟 핵산서열 s를 커버하지 않는 경우에는 비커버리지값(c non-cov )으로 나타내고, 타겟 핵산서열 s를 커버하는 경우에는 커버리지값(c cov )으로 나타낸다. 구체적으로, 비커버리지값(c non-cov )은 0이고 커버리지값(c cov )은 0 이외의 값이다. 보다 구체적으로, 비커버리지값(c non-cov )은 0이고, 커버리지값(c cov )은 1이다.
본 명세서에서, 용어 “커버리지(coverage)”는 지정된 어닐링 조건 또는 엄격 조건하에서 올리고뉴클레오타이드(프라이머 또는 프로브)가 타겟 핵산서열에 선택적으로 혼성화될 정도로 충분히 상보적인 것을 의미하며, 용어 “실질적으로 상보적(substantially complementary)” 및 “완전히 상보적(perfectly complementary)”인 것을 모두 포괄하는 의미를 갖는다. 구체적으로, 본 명세서에서 용어 “커버리지(coverage)”는 완전히 상보적인 것을 의미한다.
c s 는 타겟 핵산서열 s의 커버 여부에 대한 결정 변수로서, 올리고뉴클레오타이드 p가 타겟 핵산서열 s를 서열상으로 커버할지라도 제한조건식과 관계에서 비커버리지값(c non-cov )을 가질 수 있다. 예컨대, 올리고뉴클레오타이드 1 및 2가 조합된다고 할 때, 올리고뉴클레오타이드 1은 타겟 핵산서열 s를 커버하고, 올리고뉴클레오타이드 2는 타겟 핵산서열 s를 커버하지 못하거나, 올리고뉴클레오타이드 1 및 2가 모두 타겟 핵산서열 s를 커버한다고 할지라도 제한조건식과 관계에서 타겟 핵산서열 s를 커버하지 않을 수 있다. 즉, 이 경우 결정 변수 c s 는 비커버리지값(c non-cov )으로 나타낼 수 있다.
상기 제한식 1에서 목적의 타겟 커버리지(m)는 실험자가 달성하고자 하는 타겟 커버리지로서, 0 <m < 1의 값을 갖는다. 선별되는 올리고뉴클레오타이드들은 이 목적 타겟 커버리지를 만족시켜야 한다.
상기 제한식 1에서, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열의 일련번호이다. 타겟 핵산서열 s의 일련번호 중 b는 마지막 타겟 핵산서열 s의 일련번호이므로, 타겟 핵산서열 s의 일련번호 b(구체적으로, 1보다 큰 정수)는 상기 복수의 타겟 핵산서열의 총 개수와 같게 된다. 한편, 도 1에서 타겟 핵산서열은 총 6개이므로 S는 6이고, 타겟 핵산서열 s의 일련번호 b는 6이다. 목적의 타겟 커버리지가 0.5이면, 상기 제한식 1에서 m x S는 3이 된다. 제한식 1에서, m x S는 정수이다.
제한식 1의 좌변은 타겟 핵산서열의 일련번호 1 내지 b의 결정 변수 c s 의 합이다. 예컨대, 타겟 핵산서열 s의 일련번호가 1 내지 6(즉, 타겟 핵산서열의 총 개수 S=6)이고, 목적의 타겟 커버리지가 0.83인 경우, 상기 제한식 1은 C 1 + C 2 + C 3 + C 4 + C 5 + C 6 ≥ 0.83 x 6이 된다.
제한식 2
Figure 112019110637732-pct00006
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non - cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 상수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 c s 는 비커버리지값(c non - cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
y s,p 는 타겟 핵산서열 s에 대해서 올리고뉴클레오타이드 p에 의한 커버 여부가 정해지는, 즉 주어지는 타겟 핵산서열과 올리고뉴클레오타이드에 의해 정해지는 바이너리 상수이다. 상기 y s,p 를 표현할 때, 올리고뉴클레오타이드 p가 타겟 핵산서열 s를 커버하지 못하는 경우 또는 올리고뉴클레오타이드 p가 타겟 핵산서열 s에 대해서 비-상보적인 경우에는, y s,p 비커버리지값(y non-cov )을 갖고, 올리고뉴클레오타이드 p가 타겟 핵산서열 s를 커버하는 경우 또는 올리고뉴클레오타이드 p가 타겟 핵산서열 s에 대해서 상보적인 경우에는, y s,p 는 커버리지값(y cov )을 갖는다. 구체적으로, 비커버리지값(y non-cov )은 0이고, 커버리지값(y cov )은 O 이외의 값이며, 보다 구체적으로, 비커버리지값(y non-cov )은 0이고, 커버리지값(y cov )은 1이다.
상기 제한식 2에서의 x p 는 목적식 1에서 설명한 x p 와 동일하므로, 이 둘 사이의 공통된 내용은 명세서의 과도한 복잡성을 피하기 위하여, 그 기재를 생략한다.
상기 제한식 2에서의 y s,p x p 는 타겟 핵산서열 s가 올리고뉴클레오타이드 p에 의해서 커버되는지, 그리고 상기 올리고뉴클레오타이드 p를 선택할지 여부를 나타내는 바이너리 변수이며, 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부에 대한 바이너리 상수와 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수의 곱이 된다. 구체적으로, 상기 y s,p x p 는 비커버리지값(y non-cov )과 비선택값(x non-sel )의 곱, 비커버리지값(y non-cov )과 선택값(x sel )의 곱, 커버리지값(y cov )과 비선택값(x non-sel )의 곱, 그리고 커버리지값(y cov )과 선택값(x sel )의 곱으로 나타낼 수 있다. 보다 구체적으로, 비커버리지값(y non-cov )과 비선택값(x non-sel )을 0으로 나타내고 커버리지값(y cov )과 선택값(x sel )은 0 이외의 값으로 나타내는 경우, 상기 y s,p x p 는 0 및 0 이외의 값으로 표현할 수 있으며, 커버리지값(y cov )과 선택값(x sel )을 각각 1로 나타낼 경우, 상기 y s,p x p 는 0 및 1로 표현될 수 있다.
상기 제한식 2에서 결정 변수로서 c s 는 상기 제한식 1의 결정 변수인 c s 와 동일하므로, 이 둘 사이의 공통된 내용은 명세서의 과도한 복잡성을 피하기 위하여, 그 기재를 생략한다.
목적의 타겟 커버리지가 1(100%)인 경우, 즉 올리고뉴클레오타이드를 조합하여 모든 타겟 핵산서열을 커버하고자 하는 경우에는, 상기 제한식 2에서 c s 는 모든 타겟 핵산서열에 대하여 커버리지값(c cov )을 가진다. 구체적으로, 상기 커버리지값(c cov )은 0 이외의 값이고, 보다 구체적으로, 상기 커버리지값(c cov )은 1이다.
한편, 목적의 타겟 커버리지가 1(100%) 미만인 경우, 즉 올리고뉴클레오타이드 조합으로 타겟 핵산서열들 중 최소 일부 핵산서열을 커버하고자 경우, c s 는 선택한 올리고뉴클레오타이드가 타겟 핵산서열들을 커버하지 못하는 경우에는 비커버리지값(c non-cov )이고, 최소 1개의 타겟 핵산서열을 커버하는 경우에는 커버리지값(c cov )이며, 구체적으로, 상기 비커버리지값(c non-cov )은 0이고, 상기 커버리지값(c cov )은 0 이외의 값이며, 보다 구체적으로, 상기 비커버리지값(c non-cov )은 0이고, 상기 커버리지값(c cov )은 1이다.
상기 제한식 2는 타겟 핵산서열 s 모두에 적용된다. 구체적으로 각 타겟 핵산서열 s의 일련번호만큼 제한식 2를 가지게 된다. 예컨대, 타겟 핵산서열 s의 일련번호가 1 내지 3이고, 올리고뉴클레오타이드 p의 일련번호가 1 내지 3인 경우, 제한식 2는 y 1,1 x 1 +y 1,2 x 2 +y 1,3 x 3 c 1 , y 2,1 x 1 +y 2,2 x 2 +y 2,3 x 3 c 2 y 3,1 x 1 +y 3,2 x 2 +y 3,3 x 3 c 3 이 된다.
본 발명의 일 구현예에 따르면, 상기 제한식 2의 바이너리 변수 c s x a + s 이고, x a +s 에서 a는 올리고뉴클레오타이드 p의 마지막 일련번호이며, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이다. 구체적으로, 제한식 2의 좌변에 바이너리 변수 x p 가 있으므로, 선형계획법으로 최적해를 구하기 위해서 c s x a + s 로 치환할 수 있다. 예컨대, 올리고뉴클레오타이드 p의 일련번호가 1 내지 10일 경우, 일련번호가 1인 타겟 핵산서열 s에 대한 결정 변수 c s 를 표현할 때, c 1 x 10+1 또는 x 11 로 나타낼 수 있다.
본 발명의 일 구현예에 따르면, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 상기 방법은 제한식 1과 2를 만족하면서 목적식 1을 달성하도록 실시하여, 상기 최소의 올리고뉴클레오타이드 조합을 선별하고, 상기 복수의 타겟 핵산서열 중 상기 선별된 최소의 올리고뉴클레오타이드 조합에 의해 커버 되는 타겟 핵산서열을 선별한다. 하나의 목적식을 통하여, 최소의 올리고뉴클레오타이드 조합뿐만 아니라, 타겟팅 되는 즉, 최소의 올리고뉴클레오타이드 조합에 의해 커버되는 타겟 핵산서열을 선별할 수 있는 것은 흥미로운 발견이다.
목적의 타겟 커버리지가 100% 미만인 경우에, 상기 제한식 1과 2를 만족하면서 목적식 1을 달성하도록 실시하면, 결정변수 x p c s 를 해(solution)로서 구할 수 있고, 이로 인해 최소의 올리고뉴클레오타이드 조합을 선별하고, 상기 복수의 타겟 핵산서열 중 상기 선별된 최소의 올리고뉴클레오타이드 조합에 의해 타겟팅 되는 타겟 핵산서열을 선별할 수 있다. 예컨대, 목적의 타겟 커버리지가 100% 미만인 경우에, 상기 제한식 1과 2를 만족하면서 목적식 1을 달성하도록 실시하여, x 1 =0, x 2 =1, x 3 =1, x 4 =0, x 5 =0, x 6 =0이고, c 1 =1, c 2 =1, c 3 =1, c 4 =0, c 5 =1, c 6 =1로 해를 구했다면, 최소의 올리고뉴클레오타이드 조합은 일련번호 2 및 3의 올리고뉴클레오타이드의 조합이고, 이에 의해 커버되는 타겟 핵산서열은 일련번호 1 내지 3, 5 및 6의 타겟 핵산서열이 된다.
본 발명의 일 구현예에 따르면, 상기 방법은 상기 목적의 타겟 커버리지가 100%인 경우에는 제한식 2를 만족하면서 목적식 1을 달성하도록 실시한다.
목적의 타겟 커버리지가 100%인 경우 제한식 2를 만족하면서 목적식 1을 달성하도록 실시하는 경우에는, 모든 타겟 핵산서열을 커버하는 경우이므로 모든 타겟 핵산서열에 대하여 결정변수 c s 는 커버리지값(c cov )으로서 0 이외의 값의 상수이고, 구체적으로 상기 c s 는 1이다. 이 경우 결정변수 x p 해(solution)로서 구할 수 있고, 이로 인해 최소의 올리고뉴클레오타이드 조합을 선별할 수 있다. 예컨대, 목적의 타겟 커버리지가 100%인 경우에, 상기 제한식 2를 만족하면서 목적식 1을 달성하도록 실시하여, x 1 =0, x 2 =1, x 3 =1, x 4 =0, x 5 =0, x 6 =0으로 해를 구했다면, 최소의 올리고뉴클레오타이드 조합은 일련번호 2 및 3의 올리고뉴클레오타이드의 조합이 된다.
본 발명의 일 구현예에 따르면, 상기 방법은 상기 제한식 2를 만족하면서 다음의 목적식 1-1을 달성하도록 실시하여, 목적의 타겟 커버리지가 100%인 경우에 제한된 개수의 올리고뉴클레오타이드 조합을 선별한다:
목적식 1-1
Figure 112019110637732-pct00007
상기 목적식 1-1에서, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non - sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이며; X Lim 은 상기 올리고뉴클레오타이드의 제한된 개수이다. 구체적으로, 복수의 타겟 핵산서열을 모두 커버하는 제한된 개수의 올리고뉴클레오타이드의 조합을 선별하는 경우, 상기 제한식 2를 만족하면서 상기 목적식 1-1을 달성하도록 실시하면 된다.
본 발명의 방법은 바이러스와 같은 유전적 다양성을 갖는 복수의 병원체를 검출하거나, 박테리아 속(예컨대, Campylobacter , Salmonella, Shigella , Vibrio , Aeromonas)을 스크리닝 하기 위하여 올리고뉴클레오타이드를 디자인할 때, 특히 유용하다.
Ⅱ. 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별
본 발명의 다른 양태에 따르면, 본 발명은 다음 단계를 포함하는 올리고뉴클레오타이드 풀에서 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별 방법을 제공한다: (a) 상기 복수의 타겟 핵산서열을 제공(prepare)하는 단계; (b) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계; 및 (c) 상기 복수의 타겟 핵산서열로부터 검출대상의 타겟 핵산서열을 선별하는 단계; 상기 검출대상의 타겟 핵산서열 선별은 다음의 제한식 3과 2를 만족하면서 다음의 목적식 2를 달성하도록 실시한다:
목적식 2
Figure 112019110637732-pct00008
상기 목적식 2에서, Max:는 최대화를 나타내고, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non-cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
제한식 3
Figure 112019110637732-pct00009
상기 제한식 3에서, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non-sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고; X Lim 은 상기 올리고뉴클레오타이드의 제한된 개수이며;
제한식 2
Figure 112019110637732-pct00010
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non-cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 상수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100%인 미만인 경우에는 c s 는 비커버리지값(c non-cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
본 발명의 두 번째 양태는 올리고뉴클레오타이드 풀에서 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별 방법에 관한 것으로서, 상술한 첫 번째 방법과 목적식 2, 제한식 3, 그리고 제한식 3 및 2의 조합을 제외하곤, 바이너리 변수 x p c s , 그리고 바이너리 상수 y s,p 는 동일하기 때문에, 이 둘 사이의 공통된 내용은 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
본 발명의 두 번째 방법은 올리고뉴클레오타이드들의 수는 제한된 수로 주어지고, 검출대상 타겟 핵산서열에 대한 타겟 커버리지를 최대화하는 최적화 방법이다.
본 명세서에서 올리고뉴클레오타이드들의 수를 언급하면서 사용되는 용어 “제한된 개수”는 “제한된 개수 이하”의 올리고뉴클레오타이드들에 의해 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하는 것을 의미한다. 예를 들어, 올리고뉴클레오타이드들의 제한된 개수가 3이라는 것은, 3개 이하의 올리고뉴클레오타이드 조합을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하는 것을 나타낸다.
본 발명의 보다 상세히 설명하면 다음과 같다:
단계 (a): 복수의 타겟 핵산서열의 제공
우선, 본 발명의 방법은 (a) 상기 복수의 타겟 핵산서열을 제공(prepare)한다. 본 발명의 두 번째 방법의 단계 (a)는 첫 번째 방법의 단계 (a)에 대한 설명을 참조하여 설명될 수 있다.
단계 (b): 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀의 제공(prepare)
이어, 본 발명의 방법은 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)한다. 본 발명의 두 번째 방법의 단계 (b)는, 첫 번째 방법의 단계 (b)에 대한 설명을 참조하여 설명될 수 있다.
단계 (c): 복수의 타겟 핵산서열로부터 검출대상의 타겟 핵산서열 선별
그 다음, 본 발명의 방법은 상기 복수의 타겟 핵산서열로부터 검출대상의 타겟 핵산서열을 선별한다. 상기 검출대상의 타겟 핵산서열 선별은 다음의 제한식 3과 2를 만족하면서 다음의 목적식 2를 달성하도록 실시한다.
목적식 2
Figure 112019110637732-pct00011
상기 목적식 2에서, Max:는 최대화를 나타내고, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non-cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이다.
본 발명의 두 번째 방법은 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열을 선별하는 것이므로, 상기 결정 변수로서 바이너리 변수인 c s 의 합을 목적 함수로 하여 이를 최대화 한다.
상기 목적식 2에서, 상기 바이너리 변수 c s 는 첫 번째 방법의 단계 (c)에 대한 설명을 참조하여 설명될 수 있다.
제한식 3
Figure 112019110637732-pct00012
상기 제한식 3에서, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non-sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고; X Lim 은 상기 올리고뉴클레오타이드의 제한된 개수이다.
본 발명의 두 번째 방법은 제한된 개수의 올리고뉴클레오타이드를 이용해야 하므로, 상기 제한식 3과 같이 제한조건식을 정의할 수 있다. 상기 제한식 3에서, 상기 바이너리 변수 x p 는 첫 번째 방법의 단계 (c)에 대한 설명을 참조하여 설명될 수 있다. 예컨대, 최대 3개의 올리고뉴클레오타이드들의 조합을 이용할 경우(단, 올리고뉴클레오타이드 p의 일련번호는 1 내지 6), 상기 제한식 3은 x 1 +x 2 +x 3 +x 4 +x 5 +x 6 ≤3이 된다.
제한식 2
Figure 112019110637732-pct00013
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non-cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 상수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100%인 미만인 경우에는 c s 는 비커버리지값(c non-cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
상기 제한식 2는 첫 번째 방법의 단계 (c)에 대한 설명을 참조하여 설명될 수 있다.
본 발명의 일 구현예에 따르면, 상기 방법은 검출대상 타겟 핵산서열을 선별하고, 상기 선별된 검출대상 타겟 핵산서열에 혼성화 되는 상기 제한된 개수의 올리고뉴클레오타이드 조합을 선별한다. 하나의 목적식을 통하여, 검출대상 타겟 핵산서열의 선별뿐만 아니라, 선별된 타겟 핵산서열의 검출에 이용되는 최소의 올리고뉴클레오타이드 조합을 선별할 수 있는 것은 흥미로운 발견이다.
구체적으로, 상기 제한식 3과 2를 만족하면서 상기 목적식 2를 달성하도록 실시하면, 결정변수 x p c s 를 해(solution)로서 구할 수 있으므로, 검출대상 타겟 핵산서열의 선별과 상기 선별된 검출대상 타겟 핵산서열에 혼성화 되는 상기 제한된 개수의 올리고뉴클레오타이드를 선별할 수 있다.
올리고뉴클레오타이드 최적 조합군들의 랭킹화
상술한 본 발명의 방법에 의해 제공된 올리고뉴클레오타이드 조합이 1개 이상일 수 있다. 올리고뉴클레오타이드 조합이 2개 이상일 경우, 다음과 같이 올리고뉴클레오타이드를 재선별할 수 있다. 예컨대, 상술한 본 발명의 제한식을 만족하면서 상기 목적식을 달성하는 올리고뉴클레오타이드 p의 조합으로 (ⅰ) 일련번호 1 및 2의 올리고뉴클레오타이드, (ⅱ) 일련번호 7 및 9의 올리고뉴클레오타이드, 그리고 (ⅲ) 일련번호 11 및 21의 올리고뉴클레오타이드의 3개의 조합이 제공되었다고 하였을 때, 이 중 복수의 타겟 핵산서열의 검출에 이용할 최적 조합을 선별한다.
본 발명의 일 구현예에 따르면, 2개 이상의 올리고뉴클레오타이드 조합이 선별된 경우, 보다 적합한 올리고뉴클레오타이드 조합을 선별하기 위하여 추가적인 선정을 실시할 수 있다.
본 발명의 일 구현예에 따르면, 본 발명의 방법은 상기 올리고뉴클레오타이드 조합들을 다음의 우선순위 항목 중 최소 1개의 항목에 대하여 랭킹화 하여 순위(rank)를 배정하는 단계를 추가적으로 포함한다:
(i) 상기 복수의 타겟 핵산서열에 대한 타겟-커버리지; 상기 타겟-커버리지가 클수록 우선순위가 높고,
(ⅱ) 상기 올리고뉴클레오타이드가 호모 다이머를 형성하는 경우, 호모 다이머의 형성에 관여하는 연속적 뉴클레오타이드 개수 또는 비율; 상기 개수 또는 비율이 작을수록 우선순위가 높고,
(ⅲ) 헤어핀 구조 형성 자유에너지 값(ΔG 값); 자유에너지 값이 클수록 우선순위가 높고,
(ⅳ) 길이; 길이가 짧을수록 우선순위가 높다.
본 발명에 따르면, 상기 올리고뉴클레오타이드 조합들을 최소 1개(구체적으로, (i)번의 우선순위 항목), 구체적으로 최소 2개, 보다 구체적으로 최소 3개, 보다 더 구체적으로 최소 4개의 우선순위 항목에 대하여 랭킹화 한다.
본 발명의 일 구현예에 따르면, 상기 최소 2개의 우선순위 항목은 중요도(criticality)에 차이가 있으며, 본 발명의 방법은 상기 중요도를 고려한 상기 최소 2개의 우선순위 항목에서의 순위에 따라 최소 1개의 올리고뉴클레오타이드 조합을 선정하는 단계를 추가적으로 포함한다.
보다 적합한 올리고뉴클레오타이드 조합을 선정하는 방법은 크게 두 가지 방식이 있다:
첫 번째 방식에 따르면, 상기 최소 2개의 우선순위 항목은 중요도(criticality)에 차이가 있으며 중요도가 가장 높은 우선순위 항목(예컨대, (i)번의 우선순위 항목)에 대하여 랭킹화 하여 제1위 올리고뉴클레오타이드 조합을 선정할 수 있다. 만일, 중요도가 가장 높은 우선순위 항목에서 제1위 올리고뉴클레오타이드 조합이 복수개의 경우, 차순위 우선순위 항목에서의 순위를 비교하여 가장 높은 순위를 갖는 올리고뉴클레오타이드 조합을 선정한다. 예를 들어, 우선순위 항목의 중요도가 (i), (ii) 및 (iii) 순서인 경우, (i)번 우선순위 항목에서 제1위 올리고뉴클레오타이드 조합이 5개인 경우, 이 5개 올리고뉴클레오타이드 조합의 (ii)번 우선순위 항목에서서의 순위를 비교한다. 만일, (ii)번 우선순위 항목에서서의 순위도 동일하면, (iii)번 우선순위 항목에서의 순위를 비교하여 가장 높은 순위를 갖는 올리고뉴클레오타이드 조합을 선정한다.
두 번째 방식에 따르면, 우선순위 항목들에 서로 다른 웨이트(weight)를 배정하고 각각의 우선순위 항목에서의 값들(또는 값의 범위들)에 스코어를 배정하면, 각각의 올리고뉴클레오타이드 조합의 총 스코어를 얻을 수 있다. 이 계산된 총 스코어를 고려하여, 보다 적합한 올리고뉴클레오타이드 조합을 선정할 수 있다.
만일, PTOCE(참조: WO 2012/096523) 및 TaqMan 프로브 방법과 같이 프로브와 프라이머의 적절한 조합을 이용하여 복수의 타겟 핵산서열의 검출을 실시하는 경우에는, 프로브 및 프라이머 그 자체의 우수한 특성도 중요하지만, 타겟 핵산서열의 검출에서의 프로브 및 프라이머 사이의 파트너쉽도 중요하다. 예를 들어, 프라이머는 선별한 프로브를 기준으로 하여 업스트림 및 다운스트림에 위치에 있으면서 적절한 크기(구체적으로, 100-1000, 보다 구체적으로 200-800, 보다 더 구체적으로 300-700, 보다 더욱 더 구체적으로 300-500, 보다 더 더욱 더 구체적으로 300-400 뉴클레오타이드)의 앰플리콘을 생성할 수 있어야 한다. 또한, 프라이머는 프로브와의 간섭(interference)이 없는 것이 바람직하다. 이러한 간섭의 대표적인 현상은 다이머 형성이다. 프라이머 및 프로브가 그 특성이 우수하여도, 프라이머가 프로브와 헤테로다이머를 형성하면 상기 프라이머는 적절한 프라이머가 될 수 없다. 프라이머는 프로브보다 Tm 값이 낮은 것이 바람직하다. 예를 들어, 프라이머의 Tm 값은 프로브와 관련하여 [55℃ to (프로브의 Tm minus 10℃)℃]의 범위에 있는 것이 바람직하다.
본 발명의 일 구현예에 따르면, 상기 우선순위 배정된 올리고뉴클레오타이드 조합들은 프로브 조합들이고 상기 우선순위 배정된 프로브 조합들 중에서 최상위 프로브 조합을 선택하고 상기 최상위 프로브에 적합한 프라이머를 선택한다. 상기 용어 “적합한”은 선택한 프로브 조합과 관련하여, 프라이머와 상기 프로브가 헤테로다이머를 형성하지 않은 것, 프라이머가 소망하는 크기의 앰플리콘을 형성하는 것, 및 프라이머가 [55℃ to (프로브의 Tm minus 10℃)℃]의 Tm 값을 갖는 것 중 최소 어느 하나의 특성을 갖는 것을 의미한다.
예를 들어, 본 발명에 따라 실시하여 선별된 프로브 조합 및 프라이머가 제공된 경우, 최상위 프로브 조합을 선택하고 이 프로브 조합에 적합한 최상위 프라이머를 선택한다. 만일, 최상위 프로브 조합에 적합한 프라이머가 없는 경우에는 차상위 프로브 조합에 대하여 적합한 프라이머를 선택하고, 이 차상위 프로브 조합과 프라이머의 조합이 복수의 타겟 핵산서열의 검출용 올리고뉴클레오타이드로서 이용된다.
Ⅲ. 복수의 타겟 핵산서열에서 보존성 구역의 결정(세 번째 양태)
본 발명의 세 번째 양태는 상기 첫 번째 양태에 기반하여 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법에 관한 것이다.
본 발명의 세 번째 양태에 따르면, 본 발명은 다음 단계를 포함하는 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법을 제공한다: (a) 상기 복수의 타겟 핵산서열을 제공(prepare)하는 단계; (b) 상기 복수의 타겟 핵산서열을 얼라인먼트 하는 단계; (c) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계; (d) 상기 복수의 타겟 핵산서열에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별하는 단계; 상기 최소의 올리고뉴클레오타이드 조합 선별은 다음의 제한식 1과 2 또는 제한식 2를 만족하면서 다음의 목적식 1을 달성하도록 실시한다;
목적식 1
Figure 112019110637732-pct00014
상기 목적식 1에서, Min:은 최소화를 나타내고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non-sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고;
제한식 1
Figure 112019110637732-pct00015
상기 제한식 1에서, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non-cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, m은 목적의 타겟 커버리지로서 0 < m < 1 이며, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
제한식 2
Figure 112019110637732-pct00016
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non-cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 상수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100%인 미만인 경우에는 c s 는 비커버리지값(c non-cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다; 그리고, (e) 상기 최소의 올리고뉴클레오타이드 조합에 의해 커버되는 상기 복수의 타겟 핵산서열의 구역을 보존성 구역으로 결정하는 단계.
보존성 구역은 생물학적으로 매우 중요한 부위로서, 서로 다른 유기체들 사이에 다른 핵산분자들에서 서열이 유사하거나 또는 동일한 부위를 나타낸다. 보존성 구역은 계통학적 연구에 매우 중요한 지표로 이용되며, 또한 서로 다른 유기체들을 멀티플렉스 방식으로 검출할 때 프로빙 부위로서 이용된다.
본 발명에 따르면, 서로 다른 유기체들 사이에 보존적으로 유지된 서열을 독특한 방식으로 결정할 수 있으며, 이 보존적 서열을 포함하는 보존적 구역은 프라이머 또는 프로빙가 혼성화 되는 부위(즉, 프로빙 구역)로서 이용될 수 있다.
본 발명은 보존성 구역을 결정하는 방법으로 표현되었으나, 이는 프로빙 구역을 결정하는 방법으로 표현될 수도 있다. 상술한 본 발명에 따라 최소의 올리고뉴클레오타이드 조합으로 복수의 타겟 핵산서열에 대하여 목적의 타겟 커버리지(예컨대, 100%)를 나타내는 경우, 이 최소의 올리고뉴클레오타이드 조합의 프로빙 부위는 보존성 구역으로 제시될 수 있다.
본 발명의 세 번째 양태는 상술한 본 발명의 첫 번째 양태에 기반한 것이므로, 이 둘 사이의 공통된 내용은 명세서의 과도한 복잡성을 피하기 위하여, 그 기재를 생략한다.
본 발명을 보다 상세히 설명하면 다음과 같다:
단계 (a): 복수의 타겟 핵산서열의 제공(prepare)
본 발명의 세 번째 방법의 단계 (a)는, 첫 번째 방법의 단계 (a)에 대한 설명을 참조하여 설명될 수 있다.
단계 (b): 복수의 타겟 핵산서열의 얼라인먼트
이어, 본 발명의 방법은 상기 복수의 타겟 핵산서열을 얼라인먼트 한다.
얼라인먼트는 당업계에 공지된 다양한 방법(예컨대, 글로벌 얼라인먼트 및 로컬 얼라인먼트) 및 알고리즘에 따라 실시할 수 있다.
얼라인먼트에 대한 다양한 방법 및 알고리즘은 Smith and Waterman, Adv. Appl. Math. 2:482(1981); Needleman and Wunsch, J. Mol. Bio. 48:443(1970); Pearson and Lipman, Methods in Mol. Biol. 24: 307-31(1988); Higgins and Sharp, Gene 73:237-44(1988); Higgins and Sharp, CABIOS 5:151-3(1989); Corpet et al., Nuc. Acids Res. 16:10881-90(1988); Huang et al., Comp. Appl. BioSci. 8:155-65(1992) and Pearson et al., Meth. Mol. Biol. 24:307-31(1994)에 개시되어 있다. NCBI Basic Local Alignment Search Tool (BLAST) (Altschul et al., J. Mol. Biol. 215:403-10(1990))은 NCBI (National Center for Biological Information) 등에서 접근 가능하며, 인터넷 상에서 blastn, blasm, blastx, tblastn and tblastx와 같은 서열 분석 프로그램과 연동되어 이용할 수 있다. BLAST는 http://www.ncbi.nlm.nih.gov/BLAST/에서 접속 가능하다. 이 프로그램을 이용한 서열 유사성 비교 방법은 http://www.ncbi.nlm.nih.gov/BLAST/blast_help.html에서 확인할 수 있다.
단계 (c): 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀의 제공
그런 다음, 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공하며, 이는 첫 번째 양태의 단계 (b)에 대한 설명을 참조하여 설명될 수 있다.
단계 (d): 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합의 선별
상기 복수의 타겟 핵산서열에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별한다. 상기 최소의 올리고뉴클레오타이드 조합 선별은 다음의 제한식 1과 2 또는 제한식 2를 만족하면서 다음의 목적식 1을 달성하도록 실시한다;
목적식 1
Figure 112019110637732-pct00017
상기 목적식 1에서, Min:은 최소화를 나타내고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non-sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고;
제한식 1
Figure 112019110637732-pct00018
상기 제한식 1에서, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non-cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, m은 목적의 타겟 커버리지로서 0 < m < 1 이며, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
제한식 2
Figure 112019110637732-pct00019
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non-cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 상수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 c s 는 비커버리지값(c non-cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
단계 (d)의 최소의 올리고뉴클레오타이드 조합 선별은, 첫 번째 양태의 단계 (c)에 대한 설명을 참조하여 설명될 수 있다.
단계 (e): 보존성 구역의 결정
최종적으로, 상기 최소의 올리고뉴클레오타이드 조합에 의해 커버되는 상기 복수의 타겟 핵산서열의 구역을 보존성 구역으로 결정한다.
복수의 타겟 핵산서열(예컨대, 80개의 타겟 핵산서열)이 최소의 올리고뉴클레오타이드 조합(예컨대, 2개의 올리고뉴클레오타이드)에 의해 100% 커버된다고 한다면, 이는 복수의 타겟 핵산서열이 서열 유사성이 크다는 것이고 보존성(conservative)이 높다고 할 수 있다.
본 발명의 일 구현예에 따르면, 복수의 타겟 핵산서열을 커버하는 최소의 올리고뉴클레오타이드 조합 중에서 가장 업스트림 올리고뉴클레오타이드의 5’-말단과 가장 다운스트림 올리고뉴클레오타이드의 3’-말단 사이의 구역을 보존성 구역으로 결정할 수 있다.
본 발명의 일 구현예에 따르면, 가장 업스트림 올리고뉴클레오타이드의 5’-말단과 가장 다운스트림 올리고뉴클레오타이드의 3’-말단 사이의 거리는 40-1000 뉴클레오타이드, 60-500 뉴클레오타이드 또는 70-500 뉴클레오타이드이다.
본 발명의 일 구현예에 따르면, 최소의 올리고뉴클레오타이드 조합은 구체적으로, 2-10개 올리고뉴클레오타이드, 2-8개 올리고뉴클레오타이드, 2-6개 올리고뉴클레오타이드, 2-4개 올리고뉴클레오타이드 또는 2-3개 올리고뉴클레오타이드를 포함한다.
본 발명의 일 구현예에 따르면, 본 발명은 상기 목적의 타겟 커버리지 및 상기 최소의 올리고뉴클레오타이드 조합에 포함되는 올리고뉴클레오타이드의 개수를 고려하여 상기 보존성 구역을 평가한다. 예를 들어, 목적의 타겟 커버리지가 100%이고, 최소의 올리고뉴클레오타이드 조합에 포함되는 올리고뉴클레오타이드의 개수가 2개인 경우에는, 결정된 보존성 구역은 고보존성(highly conserved) 구역으로 판단될 수 있다. 이와 같이, 본 발명에 따르면 결정된 보존성 구역이 고보존성 구역, 중간보존성 구역(moderately conserved region) 또는 저보존성 구역(low conserved region)인지를 구분할 수 있다.
본 발명의 일 구현예에 따르면, 본 발명은 단계 (b) 후에 상기 얼라인먼트 된 복수의 타겟 핵산서열에서 복수의 후보 보존성 구역을 지정하는 단계를 추가적으로 포함한다. 후보 보존성 구역의 지정은, 종래의 방식에 따라 서열 유사성이 높은 구역을 선택하여 실시할 수 있다. 이 경우, 단계(c)는 복수의 타겟 핵산서열 전체가 아닌 상기 복수의 후보 보존성 구역에 혼성화 되는 올리고뉴클레오타이드 풀을 제공하여 실시할 수 있다. 또한, 단계 (d)는 상기 복수의 후보 보존성 구역 각각에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별하여 실시할 수 있다.
Ⅳ. 복수의 타겟 핵산서열에서 보존성 구역의 결정(네 번째 양태)
본 발명의 네 번째 방법은 상기 본 발명의 두 번째 방법에 기반하여 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법에 관한 것이다.
본 발명의 다른 양태에 따르면, 본 발명은 다음 단계를 포함하는 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법을 제공한다: (a) 상기 복수의 타겟 핵산서열을 제공(prepare)하는 단계; (b) 상기 복수의 타겟 핵산서열을 얼라인먼트 하는 단계; (c) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare) 하는 단계; (d) 제한된 개수의 올리고뉴클레오타이드들에 의해 최대 타겟 커버리지로 검출되는 타겟 핵산서열들을 상기 복수의 타겟 핵산서열로부터 선별하는 단계; 상기 검출되는 타겟 핵산서열들의 선별은 다음의 제한식 3과 2를 만족하면서 다음의 목적식 2를 달성하도록 실시하며;
목적식 2
Figure 112019110637732-pct00020
상기 목적식 2에서, Max:는 최대화를 나타내고, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non-cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
제한식 3
Figure 112019110637732-pct00021
상기 제한식 3에서, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non - sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고; X Lim 은 상기 올리고뉴클레오타이드의 제한된 개수이며;
제한식 2
Figure 112019110637732-pct00022
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non - cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 상수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 c s 는 비커버리지값(c non - cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다; 그리고, (e) 상기 제한된 개수의 올리고뉴클레오타이드들에 의해 최대 타겟 커버리지로 검출되는 타겟 핵산서열들의 구역을 보존성 구역으로 결정하는 단계.
본 발명의 네 번째 방법은 상술한 본 발명의 두 번째 방법에 기반한 것이고, 상술한 본 발명의 세 번째 방법과 같이 보존성 구역을 결정하는 것이므로, 이 셋 사이의 공통된 내용은 명세서의 과도한 복잡성을 피하기 위하여, 그 기재를 생략한다.
단계 (e)에서, 최종적으로 단계 (d)에서 선별된 타겟 핵산서열들 중에서, 제한된 개수(구체적으로는, 가장 작은 개수)의 올리고뉴클레오타이드들에 의해 최대 타겟 커버리지로 커버되는 타겟 핵산서열들의 구역을 보존성 구역으로 결정한다. 예를 들어, 제한된 개수(구체적으로는, 가장 작은 개수)로서 올리고뉴클레오타이드 2개에 의해 80개의 타겟 핵산서열들 중에서 최대 60개(최대 타겟 커버리지 75%)가 커버되는 경우, 상기 2개의 올리고뉴클레오타이드에 의해 커버 되는 타겟 핵산서열들의 구역을 보존성 구역으로 결정한다.
본 발명의 일 구현예에 따르면, 본 발명은 단계 (b) 후에 상기 얼라인먼트 된 복수의 타겟 핵산서열에서 복수의 후보 보존성 구역을 지정하는 단계를 추가적으로 포함한다. 후보 보존성 구역의 지정은, 종래의 방식에 따라 서열 유사성이 높은 구역을 선택하여 실시할 수 있다. 이 경우, 단계 (c)는 복수의 타겟 핵산서열 전체가 아닌 상기 복수의 후보 보존성 구역에 혼성화 되는 올리고뉴클레오타이드 풀을 제공하여 실시할 수 있다. 또한, 단계 (d)는 상기 복수의 후보 보존성 구역 각각에 대하여 제한된 개수의 올리고뉴클레오타이드들에 의해 최대 타겟 커버리지로 검출되는 타겟 핵산서열들을 선별하여 실시할 수 있다.
Ⅴ. 기록매체, 장치 및 프로그램
본 발명의 다른 양태에 따르면, 본 발명은 올리고뉴클레오타이드 풀로부터 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합을 제공하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
상기 복수의 타겟 핵산서열에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별하는 단계; 상기 최소의 올리고뉴클레오타이드 조합 선별은 다음의 제한식 1과 2 또는 제한식 2를 만족하면서 다음의 목적식 1을 달성하도록 실시한다:
목적식 1
Figure 112019110637732-pct00023
상기 목적식 1에서, Min:은 최소화를 나타내고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non-sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고;
제한식 1
Figure 112019110637732-pct00024
상기 제한식 1에서, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non - cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, m은 목적의 타겟 커버리지로서 0 < m < 1 이며, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
제한식 2
Figure 112019110637732-pct00025
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non - cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 상수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 c s 는 비커버리지값(c non - cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
본 발명의 또 다른 양태에 따르면, 본 발명은 올리고뉴클레오타이드 풀로부터 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합을 제공하는 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 상술한 기록매체에 기재된 방법과 동일하다.
본 발명의 또 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 올리고뉴클레오타이드 풀로부터 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합을 제공하기 위한 장치를 제공한다.
본 발명의 다른 양태에 따르면, 본 발명은 올리고뉴클레오타이드 풀에서 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
상기 복수의 타겟 핵산서열로부터 검출대상의 타겟 핵산서열을 선별하는 단계; 상기 검출대상의 타겟 핵산서열 선별은 다음의 제한식 3과 2를 만족하면서 다음의 목적식 2를 달성하도록 실시한다:
목적식 2
Figure 112019110637732-pct00026
상기 목적식 2에서, Max:는 최대화를 나타내고, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non-cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
제한식 3
Figure 112019110637732-pct00027
상기 제한식 3에서, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non - sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고; X Lim 은 상기 올리고뉴클레오타이드의 제한된 개수이며;
제한식 2
Figure 112019110637732-pct00028
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non - cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 상수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 c s 는 비커버리지값(c non - cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
본 발명의 또 다른 양태에 따르면, 본 발명은 올리고뉴클레오타이드 풀에서 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별하는 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 상술한 기록매체에 기재된 방법과 동일하다.
본 발명의 또 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 올리고뉴클레오타이드 풀에서 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열을 선별하기 위한 장치를 제공한다.
본 발명의 다른 양태에 따르면, 본 발명은 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
(i) 상기 복수의 타겟 핵산서열을 얼라인먼트 하는 단계;
(ii) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계;
(iii) 상기 복수의 타겟 핵산서열에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별하는 단계; 상기 최소의 올리고뉴클레오타이드 조합 선별은 다음의 제한식 1과 2 또는 제한식 2를 만족하면서 다음의 목적식 1을 달성하도록 실시한다;
목적식 1
Figure 112019110637732-pct00029
상기 목적식 1에서, Min:은 최소화를 나타내고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non-sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고;
제한식 1
Figure 112019110637732-pct00030
상기 제한식 1에서, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non - cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, m은 목적의 타겟 커버리지로서 0 < m < 1 이며, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
제한식 2
Figure 112019110637732-pct00031
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non - cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 상수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 c s 는 비커버리지값(c non - cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다; 그리고,
(iv) 상기 최소의 올리고뉴클레오타이드 조합에 의해 커버되는 상기 복수의 타겟 핵산서열의 구역을 보존성 구역으로 결정하는 단계.
본 발명의 또 다른 양태에 따르면, 본 발명은 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 상술한 기록매체에 기재된 방법과 동일하다.
본 발명의 또 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 복수의 타겟 핵산서열에서 보존성 구역을 결정하기 위한 장치를 제공한다.
본 발명의 다른 양태에 따르면, 본 발명은 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체를 제공하며, 상기 방법은 다음의 단계를 포함한다:
(i) 상기 복수의 타겟 핵산서열을 얼라인먼트 하는 단계;
(ii) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계;
(iii) 제한된 개수의 올리고뉴클레오타이드들에 의해 최대 타겟 커버리지로 검출되는 타겟 핵산서열들을 상기 복수의 타겟 핵산서열로부터 선별하는 단계; 상기 검출되는 타겟 핵산서열들의 선별은 다음의 제한식 3과 2를 만족하면서 다음의 목적식 2를 달성하도록 실시하며;
목적식 2
Figure 112019110637732-pct00032
상기 목적식 2에서, Max:는 최대화를 나타내고, c s 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(c non-cov ) 및 커버리지값(c cov )으로 이루어진 바이너리 변수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
제한식 3
Figure 112019110637732-pct00033
상기 제한식 3에서, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(x non - sel ) 및 선택값(x sel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고; X Lim 은 상기 올리고뉴클레오타이드의 제한된 개수이며;
제한식 2
Figure 112019110637732-pct00034
상기 제한식 2에서, y s,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(y non - cov ) 및 커버리지값(y cov )으로 이루어진 바이너리 상수이고, x p 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, c s 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 c s 는 커버리지값(c cov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 c s 는 비커버리지값(c non - cov ) 및 커버리지값(c cov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다; 그리고,
(iv) 상기 제한된 개수의 올리고뉴클레오타이드들에 의해 최대 타겟 커버리지로 검출되는 타겟 핵산서열들의 구역을 보존성 구역으로 결정하는 단계.
본 발명의 또 다른 양태에 따르면, 본 발명은 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법을 실행하기 위한 프로세서를 구현하는, 컴퓨터 해독가능한 기록매체에 저장되는 컴퓨터 프로그램을 제공하며, 상기 방법은 상술한 기록매체에 기재된 방법과 동일하다.
본 발명의 또 다른 양태에 따르면, 본 발명은 (a) 컴퓨터 프로세서, 및 (b) 상기 컴퓨터 프로세서에 커플링된 상기 본 발명의 컴퓨터 해독가능한 기록매체를 포함하는, 복수의 타겟 핵산서열에서 보존성 구역을 결정하기 위한 장치를 제공한다.
본 발명의 기록 매체, 장치 및 컴퓨터 프로그램은 상술한 본 발명의 방법을 컴퓨터에서 실시할 수 있도록 한 것으로서, 이들 사이에 공통된 내용은 반복 기재에 의한 본 명세서의 과도한 복잡성을 피하기 위하여 그 기재를 생략한다.
프로그램 지시들은, 프로세서에 의해 실행될 때, 프로세서가 상술한 본 발명의 방법을 실행하도록 한다. 올리고뉴클레오타이드를 제공하는 방법을 실행하는 프로그램 지시들은 다음의 지시를 포함할 수 있다: (i) 상기 제한식 1과 2 또는 제한식 2를 만족하면서 목적식 1을 달성하는 최소의 올리고뉴클레오타이드 조합을 올리고뉴클레오타이드 풀로부터 선별하도록 하는 지시, 또는 (ii) 제한식 3과 2를 만족하면서 다음의 목적식 2를 달성하도록 검출대상의 타겟 핵산서열 선별하도록 하는 지시. 또한, 프로그램 지시는 다음의 지시들 중 최소 하나를 포함할 수 있다: (iii) 핵산서열들에 대한 데이터베이스로부터 복수의 타겟 핵산서열을 수집하도록 하는 지시, (iv) 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공하도록 하는 지시, (v) 복수의 타겟 핵산서열을 얼라인먼트 하도록 하는 지시.
본 발명의 기록매체 또는 장치는 핵산서열들에 대한 데이터베이스 및/또는 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀에 대한 데이터베이스를 포함할 수 있다.
본 발명의 방법은 프로세서에서 실행되며, 상기 프로세서는 독립 실행형 컴퓨터(stand alone computer) 또는 네트워크 부착 컴퓨터에 있는 프로세서일 수 있다.
컴퓨터 해독가능한 기록매체는 당업계에 공지된 다양한 저장 매체, 예컨대, CD-R, CD-ROM, DVD, 플래쉬 메모리, 플로피 디스크, 하드 드라이브, 포터블 HDD, USB, 마그네틱 테이프, MINIDISC, 비휘발성 메모리 카드, EEPROM, 광학 디스크, 광학 저장매체, RAM, ROM, 시스템 메모리 및 웹 서버를 포함하나, 이에 한정되는 것은 아니다.
본 발명에 의해 선별된 올리고뉴클레오타이드, 타겟 핵산서열 및/또는 보존성 구역은 다양한 방식으로 제공될 수 있다. 예를 들어, 선별된 올리고뉴클레오타이드, 타겟 핵산서열 및/또는 보존성 구역은 네트워크 연결(예컨대, LAN, VPN, 인터넷 및 인트라넷) 또는 직접 연결(예컨대, USB 또는 다른 직접 유선 연결 또는 무선 연결)에 의해 데스크탑 컴퓨터 시스템과 같은 별도의 시스템에 제공될 수 있고, 또는 CD, DVD, 플로피 디스크 및 포터블 HDD와 같은 포터블 매체 상에 제공될 수 있다. 유사하게, 선별된 올리고뉴클레오타이드, 타겟 핵산서열 및/또는 보존성 구역은, 노트북 또는 데스크탑 컴퓨터 시스템과 같은 클라이언트에 네트워크 연결(예컨대, LAN, VPN, 인터넷, 인트라넷 및 무선 통신 네트워크)을 통하여 서버 시스템에 제공될 수 있다.
본 발명을 실행하는 프로세서를 구현하는 지시들은 로직 시스템에 포함될 수 있다. 상기 지시는, 비록 소프트웨어 기록 매체(예컨대, 포터블 HDD, USB, 플로피 디스크, CD 및 DVD)로 제공될 수 있지만, 다운로드 가능하고 메모리 모듈(예컨대, 하드 드라이브 또는 로컬 또는 부착 RAM 또는 ROM과 같은 다른 메모리)에 저장될 수 있다. 본 발명을 실행하는 컴퓨터 코드는, C, C++, Java, Visual Basic, VBScript, JavaScript, Perl 및 XML과 같은 다양한 코딩 언어로 실행될 수 있다. 또한, 다양한 언어 및 프로토콜은 본 발명에 따른 신호와 명령의 외부 및 내부 저장과 전달에 이용될 수 있다.
컴퓨터 프로세서는 하나의 프로세서가 상술한 퍼포먼스를 모두 하도록 구축될 수 있다. 택일적으로, 프로세서 유닛은 여러 개의 프로세서가 각각의 퍼포먼스를 실행하도록 구축할 수 있다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 유전적 다양성을 나타내는 타겟 핵산분자의 복수의 핵산서열을 검출하는데 올리고뉴클레오타이드가 여러 개 이용되는 경우, 올리고뉴클레오타이드 최적 조합을 결정하기 위한 종래의 방법은 경험적이고 매뉴얼적인 방식이었으며, 이는 시간-소비적이고 노동-소비적인 방식이며 신속성 및 정확성이 떨어졌다.
본 발명은 상술한 종래의 문제점을 해결할 수 있는 기술로서, 상술한 종래의 방식과는 다르게 논리적이고 자동화적(logical and automatic) 방식으로 올리고뉴클레오타이드의 최적 조합을 제시할 수 있다. 올리고뉴클레오타이드의 최적 조합을 제시함에 있어서, 본 발명의 방법은 종래의 어떠한 방법보다 신속성 및 정확성이 우수하다.
(b) 본 발명의 최적화 로직은 타겟 핵산분자들의 검출에 다양하게 적용될 수 있으며, 이는 종래에 알려진 방법들과 비교하여 본 발명의 현저한 특징이다. 본 발명의 최적화 로직은 (i) 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합의 제공, (ii) 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별, 그리고 (iii) 복수의 타겟 핵산서열에서 보존성 구역의 결정에 이용될 수 있다.
(c) 본 발명의 방법은 바이러스와 같은 유전적 다양성을 갖는 복수의 병원체를 검출하거나, 박테리아 속(예컨대, Campylobacter, Salmonella, Shigella, Vibrio, Aeromonas)를 스크리닝 하기 위하여 대규모의 올리고뉴클레오타이드의 풀로부터 올리고뉴클레오타이드의 조합을 선별 및 제공할 때, 특히 유용하다.
도 1은 종래의 방법에 따라 프로브 최적 조합을 결정하는 것을 보여주기 위한 6개의 복수의 타겟 핵산서열을 커버하는 프로브 1 내지 3, 5 및 6을 보여준다.
도 2는 본 발명의 일 실시예에 따라, 타겟 핵산서열의 프로브에 의한 커버 여부를 나타내는 비커버리지값 및 커버리지값을 이진수 행렬(binary matrix)로 나타낸 결과를 보여준다.
도 3은 본 발명에 의해 프로브 최적 조합을 제공할 수 있는지를 설명하기 위하여 하기 실시예에서 사용된 타겟 핵산서열을 커버하는 프로브의 예를 보여준다.
도 4는 도 3의 프로브 1 내지 10에 의해 서열 1 내지 10이 커버되는지 여부를 나타내는 비커버리지값 및 커버리지값을 10 x 10 이진수 행렬(binary matrix)(Y=y s,p, y s,p ∈ (0,1))로 표현한 결과를 보여준다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예
실시예 1 : 타겟 핵산서열의 얼라인먼트 (alignment)
복수의 타겟 핵산서열로서, NCBI(National Center for Biotechnology Information)로부터 수집한 결핵균(Mycobacterium tuberculosis)의 전체 지놈(complete genome) 서열 39개(서열목록 제 1 내지 39 서열)를 얼라인먼트하고 수집한 결핵균의 지놈 핵산서열 각각에 대하여 일련번호를 부여하였다. NCBI GenBank에서의 서열목록 제 1 내지 39 서열의 접근 번호(accession number)는 각각 CP008983, AP017901, CP016888, CP008967, CP005082, CP004886, CP003234, CP018305, CP010339, CP008978, CP007809, CP010895, CP010330, CP008965, CP001664, CP010336, CP010334, FO203509, CP008975, CP009427, CP010333, CP008973, CP007803, FO203510, CP014617, CP008976, CP002885, AP012340, CP008974, CP018301, CP010338, CP003248, HE572590, AP014573, CP007299, CP007027, CP009426, AL123456 및 CP009480 이다.
실시예 2 : 타겟 핵산서열들에 대한 프로브 라이브러리(library)
상기 결핵균(Mycobacterium tuberculosis)의 복수의 타겟 핵산서열 각각에 혼성화 하는 24-28 bp 길이의 프로브를 디자인하고 이 디자인된 프로브들을 포함하는 라이브러리를 구축하였다. 프로브 라이브러리에 포함된 각각의 프로브에 일련번호를 부여하였다. 상기 프로브 라이브러리에서, 프로브들은 프로빙 영역이 차이가 있거나 또는 프로빙 영역이 동일한 경우에는 프로브 서열 및/또는 길이가 차이가 있다.
실시예 3: 타겟 핵산서열들을 커버(cover)하는 프로브를 행렬로 표현
상기 타겟 핵산서열들의 프로브에 의한 커버 여부를 나타내는 비커버리지값 및 커버리지값을 도 2와 같이 이진수 행렬(binary matrix)로 나타내었다. 도 2에서 프로브가 타겟 핵산서열을 커버하는 경우에는 커버리지값으로서 1로 나타내었고, 프로브가 타겟 핵산서열을 커버하지 못하는 경우에는 비커버리지값으로서 0으로 나타내었다. 도 2에서, 커버는 프로브가 타겟 핵산서열에 100% 매치하는 경우이고, 비커버는 프로브가 타겟 핵산서열에 100% 매치하지 못하는 경우이다.
예를 들어, 타겟 핵산서열을 커버하는 프로브를 행렬로 표현하기 위해서, 14499번, 17228번 및 18744번의 프로브(26 bp 길이)의 49번 내지 77번의 타겟 핵산서열에 대한 커버 여부를 바이너리(binary) 상수(0 또는 1)를 적용하여 행렬(Y=모든 프로브(p) 및 서열(s)에 대해 y s , p , y s , p ∈ (0,1))로 나타내었다(표 1):
프로브 No(p)
서열 No(s)
14499 17228 18744
49 0 0 0
50 0 0 0
51 1 0 0
52 0 0 0
53 0 0 0
54 0 0 0
55 0 0 0
56 0 0 0
57 0 0 0
58 0 0 0
59 0 0 0
60 0 0 0
61 0 0 0
62 0 0 0
63 0 0 0
64 0 1 0
65 0 1 0
66 0 0 0
67 0 0 0
68 0 0 0
69 0 0 0
70 0 0 0
71 0 0 0
72 0 0 1
73 0 0 0
74 0 0 0
75 0 0 0
76 0 0 1
77 0 0 0
y s , p 는 프로브 p가 서열 s를 커버하는지를 나타내는 바이너리(binary) 상수(0 또는 1)로서, s는 서열 ID(일련번호)를 나타내는 첨자(s=1, 2, ....., b)이고 b는 마지막 서열의 ID를 나타내며, p는 프로브 ID(일련번호)를 나타내는 첨자(p=1, 2, ....., a)이고 a는 마지막 프로브의 ID를 나타낸다. 예컨대, y s , p =0이면, 프로브 p가 서열 s를 커버하지 못 함을 나타내고, y s , p =1이면, 프로브 p가 서열 s를 커버함을 나타낸다. 상기 표 1를 간략히 정리하면 아래 표 2와 같다:
프로브 ID 서열 ID 서열 ID y s , p
14499 51 - y 51,14499 =1, y s,14499 =0 (s≠51)
17228 64 65 y 64,17228 =1, y 65,17228 =1,
y s,17228 =0 (s≠64,65)
18744 72 76 y 72,18744 =1, y 76,18744 =1,
y s,18744 =0 (s≠72,76)
실시예 4: 선형 계획법(linear programming algorithm)을 이용하여 모든 타겟 핵산서열을 커버하는 최소한의 프로브 조합의 결정
상기 복수의 타겟 핵산서열을 검출하는데 프로브가 여러 개 이용되는 경우, 프로브 최적 조합을 제공하기 위하여 선형 계획법을 응용하여 프로브 최적 조합의 선별에 적합한 최적화 로직을 만들었다.
타겟 핵산서열을 커버하는 프로브의 예를 도 3에 도식적으로 나타내었다. 예컨대, 프로브 1은 서열 7과 9를 커버하고 프로브 2는 프로브 1과 다른 위치에서 서열 5, 7, 8, 9 및 10을 커버하고 있으며, 프로브 3은 서열 7과 8을 커버하고 있다. 서열 1 내지 10의 프로브 1 내지 10에 의한 비커버리지값 및 커버리지값을 10 x 10 이진수 행렬(binary matrix)(Y=y s,p , y s,p ∈ (0,1))로 표현하였고 이는 도 4에 정리하였다. 프로브가 서열을 커버하는 경우에는 y s,p =1로 부여하였고, 커버하지 못하는 경우에는 y s,p =0으로 부여하였다. 예컨대, 서열 1의 경우 프로브 6, 7 및 9에 의해서 커버되나, 프로브 1 내지 5 및 10에 의해서는 커버되지 않으므로, y 1,6=y 1,7=y 1,9=1, 그리고 y 1,1=y 1,2=y 1,3=y 1,4=y 1,5=y 1,10=0으로 표현되었다.
그리고 프로브 p를 택하는지를 나타내는 이진수(binary) 변수(x p )를 결정 변수로 설정하였고, 프로브 p를 선택하는 경우에는 x p =1로, 프로브 p를 선택하지 않는 경우에는 x p =0으로 나타내었다.
따라서, Z=x 1+x 2+x 3+x 4+x 5+x 6+x 7+x 8+x 9+x 10은 선택한 프로브의 개수로서 목적 함수가 되며, 이를 최소화 하고자 한다.
또한, 모든 타겟 핵산서열을 커버해야 하는 제한 조건을 만족해야 한다. 예를 들어, 서열 1에 대해서 프로브 1 내지 10 중 어느 프로브에 의해 커버가 됨을 보여주는 제한 조건식은 y 1,1 x 1+y 1,2 x 2+y 1,3 x 3+y 1,4 x 4+y 1,5 x 5+y 1,6 x 6+y 1,7 x 7+y 1,8 x 8+y 1,9 x 9+y 1,10 x 10≥1와 같이 표현할 수 있다. 여기에서 y 1,1 x p은 서열 1이 프로브 p에 의해서 커버되는지 그리고 이러한 프로브 p를 선택할 것인지 여부를 나타내는 이진수 변수이며, y 1,1 x 1=1인 경우 서열 1이 프로브 1에 의해 커버가 되고, 상기 프로브 1를 선택함을 나타내며, y 1,1 x 1=0인 경우는 서열 1이 프로브 1에 의해서 커버가 되지 않거나, 커버가 되더라도 프로브 1을 택하지 않음을 나타낸다.
따라서, 선택한 프로브가 서열 1 내지 10을 모두 커버하는 제한 조건식을 보여주는 선형계획법 문제(linear programming problem)는 다음 표 3에 정리되어 있다. 프로그램 MATLAB R2015b을 이용하여 상기 선형계획법 문제의 최적해를 구하였다.
Figure 112019110637732-pct00035
상기 표 3에서, 제한식들은 상술한 제한식 y 1,1 x 1+y 1,2 x 2+y 1,3 x 3+y 1,4 x 4+y 1,5 x 5+y 1,6 x 6+y 1,7 x 7+y 1,8 x 8+y 1,9 x 9+y 1,10 x 10≥1을 10개의 모든 타겟 핵산서열에 대하여 작성된 것이다.
그 결과, MATLAB R2015b을 이용하여 구한 상기 문제의 최적해는 x 1=0, x 2=1, x 3=0, x 4=1, x 5=0, x 6=0, x 7=1, x 8=1, x 9=0, x 10=0으로 계산되었다. 즉, 서열 1 내지 10을 모두 커버하려면 최소 4개의 프로브가 필요하고 그 프로브 조합 세트는 프로브 2, 프로브 4, 프로브 7 및 프로브 8이다.
실시예 5: 선형 계획법(linear programming algorithm)을 이용하여 제한된 개수의 프로브를 이용하면서 최대한 커버되는 타겟 핵산서열 결정
도 3의 예시를 이용하여, 제한된 개수의 프로브로 커버되는 타겟 핵산서열의 최대화를 위하여 실시예 4의 결정 변수 x p 이외에, 새로운 결정 변수로 c s =x p + s (p=a)를 도입하였고, 제한 조건식 및 목적 함수를 정의하였다. 상기 결정 변수(c s )는 서열 s를 커버할 것인지를 나타내는 이진수 변수로서, c s x p + s 로 나타낼 수 있고, 상기 p는 마지막 프로브의 ID(즉, 마지막 프로브의 일련번호 a)를 나타낸다. 예컨대 서열 4를 커버하지 않을 경우에는 c 4=x 10+4=x 14=0 이고, 서열 4을 커버하고자 하는 경우에는 c 4=x 10+4=x 14=1이 된다. 그리고, 최대한 커버되는 서열을 결정해야 하므로 Z=c 1+c 2+c 3+c 4+c 5+c 6+c 7+c 8+c 9+c 10=x 11+x 12+x 13+x 14+x 15+x 16+x 17+x 18+x 19+x 20이 목적함수가 되고, 이를 최대화하고자 한다. 프로브의 수를 2개로 제한한다고 했을 때, 제한 조건식은 x 1+x 2+x 3+x 4+x 5+x 6+x 7+x 8+x 9+x 10≤2 (제한 조건식 1)이 되고, 선택한 프로브가 커버하고자 하는 서열만 커버하므로(즉, 모든 서열을 커버하는 것이 아니므로), 이에 대한 제한 조건식은 c s=x 10+sy s,1 x 1+y s,2 x 2+y s,3 x 3+y s,4 x 4+y s,5 x 5+y s,6 x 6+y s,7 x 7+y s,8 x 8+y s,9 x 9+y s,10 x 10 (제한 조건식 2)(상기 제한 조건식 2에서 s는 타겟 핵산서열의 ID, 즉 타겟 핵산서열의 일련번호를 나타낸다)이 된다.
제한 조건식 2에서 c s=x 10+s=1이기 위해서는 우변의 값은 무조건 1 이상이어야 하고 제한 조건식 2의 우변은 실시예 4에 기재된 바와 같이 서열 s가 프로브 1 내지 10 중 어느 프로브에 의해 커버가 되는 지를 나타내는 수식으로, 어느 프로브에 의해 커버가 된다면 1이상의 값을 가지며 커버가 되지 않는 경우에는 0의 값을 갖는다. 제한 조건식 2에서 서열 s가 커버되기 위해서는 프로브 1 내지 10 중 적어도 하나의 프로브에 의해 커버되어야 한다.
이러한 제한 조건식 1 및 2를 만족하면서 목적 함수를 최대화 하는 선형계획법 문제(linear programming problem)는 다음 표 4에 정리하였고, 프로그램 MATLAB R2015b을 이용하여 이 문제의 최적해를 구하였다.
Figure 112019110637732-pct00036
상기 표 4에서, 제한식들은 상술한 제한 조건식2 c s=x 10+sy s,1 x 1+y s,2 x 2+y s,3 x 3+y s,4 x 4+y s,5 x 5+y s,6 x 6+y s,7 x 7+y s,8 x 8+y s,9 x 9+y s,10 x 1을 10개의 모든 타겟 핵산서열에 대하여 작성된 것이다.
그 결과, MATLAB R2015b을 이용하여 구한 상기 문제의 최적해는 x 1=0, x 2=0, x 3=0, x 4=0, x 5=0, x 6=0, x 7=1, x 8=1, x 9=0, x 10=0, c 1=x 11=1, c 2=x 12=0, c 3=x 13=1, c 4=x 14=1, c 5=x 15=0, c 6=x 16=1, c 7=x 17=1, c 8=x 18=1, c 9=x 19=0, c 10=x 20=1로 계산되었다. 즉, 프로브 7 및 8의 프로브 2개를 이용하여 커버되는 최대한의 서열은 10개의 서열 중 7개의 서열(서열 1, 서열 3, 서열 4, 서열 6, 서열 7, 서열 8 및 서열 10)이다.
실시예 6: 선형 계획법(linear programming algorithm)을 이용하여 특정 값 이상의 커버리지를 만족하는 최소한의 프로브 조합 결정
도 3의 예시를 이용하여, 커버리지 90% 이상을 만족하는 최소한의 프로브 조합을 결정하기 위하여, x p c s=x p + s 를 결정 변수로 하고, 제한 조건식 및 목적 함수를 정의하였다. 최소한의 프로브의 수를 결정해야 하므로 목적 함수는 Z=x 1+x 2+x 3+x 4+x 5+x 6+x 7+x 8+x 9+x 10이 되고, 최소 90%의 커버리지를 만족해야 하므로, 제한 조건식 1은 c 1+c 2+c 3+c 4+c 5+c 6+c 7+c 8+c 9+c 10=x 11+x 12+x 13+x 14+x 15+x 16+x 17+x 18+x 19+x 20≥0.90×10(최소 커버리지 x 서열의 총 개수)으로 표현하였고, 선택한 프로브가 커버하고자 하는 서열만 커버하므로(즉, 모든 서열을 커버하는 것이 아니므로), 이에 대한 제한 조건식 2는 c s =x 10+sy s,1 x 1+y s,2 x 2+y s,3 x 3+y s,4 x 4+y s,5 x 5+y s,6 x 6+y s,7 x 7+y s,8 x 8+y s,9 x 9+y s,10 x 10 (상기 제한 조건식 2에서 s는 타겟 핵산서열의 ID, 즉 타겟 핵산서열의 일련번호를 나타낸다)으로 표현되었다.
이러한 제한 조건식 1 및 2를 만족하면서 목적 함수를 최소화 하는 선형계획법 문제(linear programming problem)는 다음 표 5에 정리하였고, 프로그램 MATLAB R2015b을 이용하여 이 문제의 최적해를 구하였다.
Figure 112019110637732-pct00037
상기 표 5에서, 제한식들은 상술한 제한 조건식2 c s =x 10+sy s,1 x 1+y s,2 x 2+y s,3 x 3+y s,4 x 4+y s,5 x 5+y s,6 x 6+y s,7 x 7+y s,8 x 8+y s,9 x 9+y s,10 x 10을 10개의 모든 타겟 핵산서열에 대하여 작성된 것이다.
그 결과, MATLAB R2015b을 이용하여 구한 상기 문제의 최적해는 x 1=0, x 2=1, x 3=0, x 4=0, x 5=0, x 6=0, x 7=1, x 8=1, x 9=0, x 10=0, c 1=x 11=1, c 2=x 12=0, c 3=x 13=1, c 4=x 14=1, c 5=x 15=1, c 6=x 16=1, c 7=x 17=1, c 8=x 18=1, c 9=x 19=1, c 10=x 20=1로 계산되었다. 즉, 90% 이상의 커버리지를 만족하는 최소한의 프로브 조합은 프로브 2, 프로브 7 및 프로브 8로 결정되었고, 이 경우 10개의 서열 중 커버되는 서열은 서열 1 및 서열 3 내지 서열 10 임을 확인하였다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현 예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.
<110> Seegene, Inc. <120> Methods for Preparing Optimal Combination of Oligonucleotides <130> PP180021 <150> KR 2017-0049350 <151> 2017-04-17 <160> 39 <170> KoPatentIn 3.0 <210> 1 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 1 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 2 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 2 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 3 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 3 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 4 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 4 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 5 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 5 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 6 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 6 accggrtatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 7 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 7 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 8 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 8 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 9 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 9 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 10 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 10 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 11 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 11 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 12 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 12 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 13 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 13 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 14 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 14 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 15 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 15 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgtcgtgc cgtagtagc 79 <210> 16 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 16 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 17 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 17 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 18 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 18 gtcgctcatt ttagctggtc aaacactatt tttcagcaat atctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 19 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 19 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 20 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 20 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 21 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 21 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 22 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 22 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 23 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 23 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 24 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 24 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cacgccgtgc cgtagtagc 79 <210> 25 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 25 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 26 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 26 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 27 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 27 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 28 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 28 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgtcgtgc cgtagtagc 79 <210> 29 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 29 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 30 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 30 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 31 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 31 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 32 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 32 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 33 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 33 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 34 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 34 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 35 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 35 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 36 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 36 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 37 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 37 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 38 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 38 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79 <210> 39 <211> 79 <212> DNA <213> Mycobacterium tuberculosis <400> 39 accggatatc ttagctggtc aatagccatt tttcagcaat ttctcagtaa cgctacgggg 60 cgcgccgtgc cgtagtagc 79

Claims (19)

  1. 다음 단계를 포함하는 올리고뉴클레오타이드 풀(a pool of oligonucleotides)로부터 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합(an oligonucleotide combination)을 제공하는 컴퓨터-구현 방법:
    (a) 상기 복수의 타겟 핵산서열을 제공(prepare)하는 단계;
    (b) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계; 및
    (c) 상기 복수의 타겟 핵산서열에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별하는 단계; 상기 최소의 올리고뉴클레오타이드 조합 선별은 다음의 제한식 1과 2 또는 제한식 2를 만족하면서 다음의 목적식 1을 달성하도록 실시한다:
    목적식 1
    Figure 112021132327094-pct00038

    상기 목적식 1에서, Min:은 최소화를 나타내고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(xnon-sel ) 및 선택값(xsel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고;
    제한식 1
    Figure 112021132327094-pct00039

    상기 제한식 1에서, cs 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(cnon-cov ) 및 커버리지값(ccov )으로 이루어진 바이너리 변수이고, m은 목적의 타겟 커버리지로서 0 < m < 1 이며, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
    제한식 2
    Figure 112021132327094-pct00040

    상기 제한식 2에서, ys,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(ynon-cov ) 및 커버리지값(ycov )으로 이루어진 바이너리 상수이고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, cs 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 cs 는 커버리지값(ccov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 cs 는 비커버리지값(cnon-cov ) 또는 커버리지값(ccov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
  2. 다음 단계를 포함하는 올리고뉴클레오타이드 풀에서 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열을 선별하는 컴퓨터-구현 방법:
    (a) 상기 복수의 타겟 핵산서열을 제공(prepare)하는 단계;
    (b) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계; 및
    (c) 상기 복수의 타겟 핵산서열로부터 검출대상의 타겟 핵산서열을 선별하는 단계; 상기 검출대상의 타겟 핵산서열 선별은 다음의 제한식 3과 2를 만족하면서 다음의 목적식 2를 달성하도록 실시한다:
    목적식 2
    Figure 112021132327094-pct00041

    상기 목적식 2에서, Max:는 최대화를 나타내고, cs 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(cnon-cov ) 및 커버리지값(ccov )으로 이루어진 바이너리 변수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
    제한식 3
    Figure 112021132327094-pct00042

    상기 제한식 3에서, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(xnon-sel ) 및 선택값(xsel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고; XLim 은 상기 올리고뉴클레오타이드의 제한된 개수이며;
    제한식 2
    Figure 112021132327094-pct00043

    상기 제한식 2에서, ys,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(ynon-cov ) 및 커버리지값(ycov )으로 이루어진 바이너리 상수이고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, cs 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 타겟 커버리지가 100%인 경우에는 cs 는 커버리지값(ccov )이고, 상기 타겟 커버리지가 100% 미만인 경우에는 cs 는 비커버리지값(cnon-cov ) 또는 커버리지값(ccov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
  3. 제 1 항에 있어서, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 상기 방법은 제한식 1과 2를 만족하면서 목적식 1을 달성하도록 실시하여, 상기 최소의 올리고뉴클레오타이드 조합을 선별하고, 상기 복수의 타겟 핵산서열 중 상기 선별된 최소의 올리고뉴클레오타이드 조합에 의해 커버되는 타겟 핵산서열을 선별하는 것을 특징으로 하는 방법.
  4. 제 2 항에 있어서, 상기 방법은 검출대상 타겟 핵산서열을 선별하고, 상기 선별된 검출대상 타겟 핵산서열에 혼성화 되는 상기 제한된 개수의 올리고뉴클레오타이드 조합을 선별하는 것을 특징으로 하는 방법.
  5. 제 1 항에 있어서, 상기 방법은 상기 목적의 타겟 커버리지가 100%인 경우에는 제한식 2를 만족하면서 목적식 1을 달성하도록 실시하는 것을 특징으로 하는 방법.
  6. 제 1 항 또는 제 2 항에 있어서, 상기 제한식 2의 바이너리 변수 c s x a+s 이고, x a+s 에서 a는 올리고뉴클레오타이드 p의 마지막 일련번호이며, s는 1 내지 b의 타겟 핵산서열 s의 일련번호인 것을 특징으로 하는 방법.
  7. 제 1 항 또는 제 2 항에 있어서, 상기 x p 의 비선택값(x non-sel )은 0이고, 선택값(x sel )은 1인 것을 특징으로 하는 방법.
  8. 제 1 항 또는 제 2 항에 있어서, 상기 c s 의 비커버리지값(c non-cov )은 0이고, 커버리지값(c cov )은 1인 것을 특징으로 하는 방법.
  9. 제 1 항 또는 제 2 항에 있어서, 상기 y s,p 의 비커버리지값(y non-cov )은 0이고, 커버리지값(y cov )은 1인 것을 특징으로 하는 방법.
  10. 제 1 항 또는 제 2 항에 있어서, 상기 올리고뉴클레오타이드는 프로브인 것을 특징으로 하는 방법.
  11. 제 1 항 또는 제 2 항에 있어서, 상기 복수의 타겟 핵산서열은 유전적 다양성을 나타내는 하나의 타겟 핵산분자의 서열 유사성을 갖는 복수의 핵산서열인 것을 특징으로 하는 방법.
  12. 제 1 항 또는 제 2 항에 있어서, 상기 복수의 타겟 핵산서열은 동일한 기능, 동일한 구조 또는 동일한 유전자명을 가지는 호모로그(homologue)에 대응하는 복수의 유기체의 복수의 핵산서열인 것을 특징으로 하는 방법.
  13. 제 1 항에 있어서, 상기 올리고뉴클레오타이드 풀은 상기 복수의 타겟 핵산서열 중 최소 하나의 서열에 혼성화 되는 올리고뉴클레오타이드를 포함하며, 상기 올리고뉴클레오타이드 풀 내의 올리고뉴클레오타이드는 혼성화 영역 및/또는 길이가 서로 다른 것을 특징으로 하는 방법.
  14. 다음 단계를 포함하는 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 컴퓨터-구현 방법:
    (a) 상기 복수의 타겟 핵산서열을 제공(prepare)하는 단계;
    (b) 상기 복수의 타겟 핵산서열을 얼라인먼트 하는 단계;
    (c) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계;
    (d) 상기 복수의 타겟 핵산서열에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별하는 단계; 상기 최소의 올리고뉴클레오타이드 조합 선별은 다음의 제한식 1과 2 또는 제한식 2를 만족하면서 다음의 목적식 1을 달성하도록 실시한다;
    목적식 1
    Figure 112021132327094-pct00044

    상기 목적식 1에서, Min:은 최소화를 나타내고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(xnon-sel ) 및 선택값(xsel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고;
    제한식 1
    Figure 112021132327094-pct00045

    상기 제한식 1에서, cs 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(cnon-cov ) 및 커버리지값(ccov )으로 이루어진 바이너리 변수이고, m은 목적의 타겟 커버리지이며 0 < m < 1 이며, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
    제한식 2
    Figure 112021132327094-pct00046

    상기 제한식 2에서, ys,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(ynon-cov ) 및 커버리지값(ycov )으로 이루어진 바이너리 상수이고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, cs 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 cs 는 커버리지값(ccov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 cs 는 비커버리지값(cnon-cov ) 또는 커버리지값(ccov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다; 그리고,
    (e) 상기 최소의 올리고뉴클레오타이드 조합에 의해 커버되는 상기 복수의 타겟 핵산서열의 구역을 보존성 구역으로 결정하는 단계.
  15. 다음 단계를 포함하는 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 컴퓨터-구현 방법:
    (a) 상기 복수의 타겟 핵산서열을 제공(prepare)하는 단계;
    (b) 상기 복수의 타겟 핵산서열을 얼라인먼트 하는 단계;
    (c) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계;
    (d) 제한된 개수의 올리고뉴클레오타이드들에 의해 최대 타겟 커버리지로 검출되는 타겟 핵산서열들을 상기 복수의 타겟 핵산서열로부터 선별하는 단계; 상기 검출되는 타겟 핵산서열들의 선별은 다음의 제한식 3과 2를 만족하면서 다음의 목적식 2를 달성하도록 실시하며;
    목적식 2
    Figure 112021132327094-pct00047

    상기 목적식 2에서, Max:는 최대화를 나타내고, cs 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(cnon-cov ) 및 커버리지값(ccov )으로 이루어진 바이너리 변수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
    제한식 3
    Figure 112021132327094-pct00048

    상기 제한식 3에서, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(xnon-sel ) 및 선택값(xsel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고; XLim 은 상기 올리고뉴클레오타이드의 제한된 개수이며;
    제한식 2
    Figure 112021132327094-pct00049

    상기 제한식 2에서, ys,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(ynon-cov ) 및 커버리지값(ycov )으로 이루어진 바이너리 상수이고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, cs 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 타겟 커버리지가 100%인 경우에는 cs 는 커버리지값(ccov )이고, 상기 타겟 커버리지가 100% 미만인 경우에는 cs 는 비커버리지값(cnon-cov ) 또는 커버리지값(ccov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다; 그리고,
    (e) 상기 제한된 개수의 올리고뉴클레오타이드들에 의해 최대 타겟 커버리지로 검출되는 타겟 핵산서열들의 구역을 보존성 구역으로 결정하는 단계.
  16. 올리고뉴클레오타이드 풀(a pool of oligonucleotides)로부터 복수의 타겟 핵산서열을 목적의 타겟 커버리지로 검출하는데 이용되는 올리고뉴클레오타이드 조합(an oligonucleotide combination)을 제공하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    상기 복수의 타겟 핵산서열에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별하는 단계; 상기 최소의 올리고뉴클레오타이드 조합 선별은 다음의 제한식 1과 2 또는 제한식 2를 만족하면서 다음의 목적식 1을 달성하도록 실시한다:
    목적식 1
    Figure 112021132327094-pct00050

    상기 목적식 1에서, Min:은 최소화를 나타내고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(xnon-sel ) 및 선택값(xsel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고;
    제한식 1
    Figure 112021132327094-pct00051

    상기 제한식 1에서, cs 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(cnon-cov ) 및 커버리지값(ccov )으로 이루어진 바이너리 변수이고, m은 목적의 타겟 커버리지로서 0 < m < 1 이며, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
    제한식 2
    Figure 112021132327094-pct00052

    상기 제한식 2에서, ys,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(ynon-cov ) 및 커버리지값(ycov )으로 이루어진 바이너리 상수이고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, cs 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 cs 는 커버리지값(ccov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 cs 는 비커버리지값(cnon-cov ) 또는 커버리지값(ccov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
  17. 올리고뉴클레오타이드 풀에서 제한된 개수의 올리고뉴클레오타이드들을 이용하여 복수의 타겟 핵산서열을 최대 타겟 커버리지로 검출하기 위한 검출대상 타겟 핵산서열의 선별 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    상기 복수의 타겟 핵산서열로부터 검출대상의 타겟 핵산서열을 선별하는 단계; 상기 검출대상의 타겟 핵산서열 선별은 다음의 제한식 3과 2를 만족하면서 다음의 목적식 2를 달성하도록 실시한다:
    목적식 2
    Figure 112021132327094-pct00053

    상기 목적식 2에서, Max:는 최대화를 나타내고, cs 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(cnon-cov ) 및 커버리지값(ccov )으로 이루어진 바이너리 변수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
    제한식 3
    Figure 112021132327094-pct00054

    상기 제한식 3에서, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(xnon-sel ) 및 선택값(xsel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고; XLim 은 상기 올리고뉴클레오타이드의 제한된 개수이며;
    제한식 2
    Figure 112021132327094-pct00055

    상기 제한식 2에서, ys,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(ynon-cov ) 및 커버리지값(ycov )으로 이루어진 바이너리 상수이고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, cs 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 타겟 커버리지가 100%인 경우에는 cs 는 커버리지값(ccov )이고, 상기 타겟 커버리지가 100% 미만인 경우에는 cs 는 비커버리지값(cnon-cov ) 또는 커버리지값(ccov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다.
  18. 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    (i) 상기 복수의 타겟 핵산서열을 얼라인먼트 하는 단계;
    (ii) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계;
    (iii) 상기 복수의 타겟 핵산서열에 대한 목적의 타겟 커버리지를 나타내는 최소의 올리고뉴클레오타이드 조합을 상기 올리고뉴클레오타이드 풀로부터 선별하는 단계; 상기 최소의 올리고뉴클레오타이드 조합 선별은 다음의 제한식 1과 2 또는 제한식 2를 만족하면서 다음의 목적식 1을 달성하도록 실시한다;
    목적식 1
    Figure 112021132327094-pct00056

    상기 목적식 1에서, Min:은 최소화를 나타내고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(xnon-sel ) 및 선택값(xsel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고;
    제한식 1
    Figure 112021132327094-pct00057

    상기 제한식 1에서, cs 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(cnon-cov ) 및 커버리지값(ccov )으로 이루어진 바이너리 변수이고, m은 목적의 타겟 커버리지로서 0 < m < 1 이며, S는 상기 복수의 타겟 핵산서열의 총 개수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
    제한식 2
    Figure 112021132327094-pct00058

    상기 제한식 2에서, ys,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(ynon-cov ) 및 커버리지값(ycov )으로 이루어진 바이너리 상수이고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, cs 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 목적의 타겟 커버리지가 100%인 경우에는 cs 는 커버리지값(ccov )이고, 상기 목적의 타겟 커버리지가 100% 미만인 경우에는 cs 는 비커버리지값(cnon-cov ) 또는 커버리지값(ccov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다; 그리고,
    (iv) 상기 최소의 올리고뉴클레오타이드 조합에 의해 커버되는 상기 복수의 타겟 핵산서열의 구역을 보존성 구역으로 결정하는 단계.
  19. 복수의 타겟 핵산서열에서 보존성 구역을 결정하는 방법을 실행하기 위한 프로세서를 구현하는 지시를 포함하는 컴퓨터 해독가능한 기록매체로서, 상기 방법은 다음의 단계를 포함한다:
    (i) 상기 복수의 타겟 핵산서열을 얼라인먼트 하는 단계;
    (ii) 상기 복수의 타겟 핵산서열에 혼성화 되는 올리고뉴클레오타이드 풀을 제공(prepare)하는 단계;
    (iii) 제한된 개수의 올리고뉴클레오타이드들에 의해 최대 타겟 커버리지로 검출되는 타겟 핵산서열들을 상기 복수의 타겟 핵산서열로부터 선별하는 단계; 상기 검출되는 타겟 핵산서열들의 선별은 다음의 제한식 3과 2를 만족하면서 다음의 목적식 2를 달성하도록 실시하며;
    목적식 2
    Figure 112021132327094-pct00059

    상기 목적식 2에서, Max:는 최대화를 나타내고, cs 는 타겟 핵산서열 s의 커버 여부에 대한 비커버리지값(cnon-cov ) 및 커버리지값(ccov )으로 이루어진 바이너리 변수이고, s는 1 내지 b의 타겟 핵산서열 s의 일련번호이고;
    제한식 3
    Figure 112021132327094-pct00060

    상기 제한식 3에서, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 비선택값(xnon-sel ) 및 선택값(xsel )으로 이루어진 바이너리 변수(binary variable)이고, p는 1 내지 a의 올리고뉴클레오타이드 p의 일련번호이고; XLim 은 상기 올리고뉴클레오타이드의 제한된 개수이며;
    제한식 2
    Figure 112021132327094-pct00061

    상기 제한식 2에서, ys,p 는 타겟 핵산서열 s의 올리고뉴클레오타이드 p에 의한 커버 여부를 나타내는 비커버리지값(ynon-cov ) 및 커버리지값(ycov )으로 이루어진 바이너리 상수이고, xp 는 올리고뉴클레오타이드 p의 선택 여부에 대한 바이너리 변수이며, cs 는 타겟 핵산서열 s의 커버 여부에 대한 바이너리 변수이고, 상기 타겟 커버리지가 100%인 경우에는 cs 는 커버리지값(ccov )이고, 상기 타겟 커버리지가 100% 미만인 경우에는 cs 는 비커버리지값(cnon-cov ) 또는 커버리지값(ccov )이며, for all s는 타겟 핵산서열 s 모두에 적용되는 것을 나타낸다; 그리고,
    (iv) 상기 제한된 개수의 올리고뉴클레오타이드들에 의해 최대 타겟 커버리지로 검출되는 타겟 핵산서열들의 구역을 보존성 구역으로 결정하는 단계.
KR1020197032056A 2017-04-17 2018-04-17 올리고뉴클레오타이드 최적 조합의 제공방법 KR102412183B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020170049350 2017-04-17
KR20170049350 2017-04-17
PCT/KR2018/004434 WO2018194342A2 (en) 2017-04-17 2018-04-17 Methods for preparing optimal combination of oligonucleotides

Publications (2)

Publication Number Publication Date
KR20190125533A KR20190125533A (ko) 2019-11-06
KR102412183B1 true KR102412183B1 (ko) 2022-06-23

Family

ID=63856988

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197032056A KR102412183B1 (ko) 2017-04-17 2018-04-17 올리고뉴클레오타이드 최적 조합의 제공방법

Country Status (4)

Country Link
US (1) US11961590B2 (ko)
EP (1) EP3613049B1 (ko)
KR (1) KR102412183B1 (ko)
WO (1) WO2018194342A2 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210067684A (ko) * 2019-11-29 2021-06-08 주식회사 씨젠 올리고뉴클레오타이드 세트들의 최적 조합을 제공하는 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060008810A1 (en) 2004-07-06 2006-01-12 Focus Technologies, Inc. Methods and compositions for detecting rhinoviruses
US20100196876A1 (en) 2005-12-23 2010-08-05 Siemens Healthcare Diagnostics Inc. Methods and Reagents for Genotyping HCV
US20110306036A1 (en) 2010-06-10 2011-12-15 Allison Dauner RT-LAMP assay for the detection of pan-serotype dengue virus

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5556749A (en) * 1992-11-12 1996-09-17 Hitachi Chemical Research Center, Inc. Oligoprobe designstation: a computerized method for designing optimal DNA probes
US6066625A (en) 1998-02-03 2000-05-23 Methylgene, Inc. Optimized antisense oligonucleotides complementary to DNA methyltransferase sequences
DK1639130T3 (da) * 2003-06-20 2012-07-09 Exiqon As Prober, biblioteker og kits til analyse af blandinger af nukleinsyrer og metoder til opbygning af disse
KR101666506B1 (ko) * 2015-04-15 2016-10-14 재단법인대구경북과학기술원 대규모 dna 시퀀스 데이터베이스에 대해 특이성 조건을 만족하는 유효한 모든 프라이머들을 디자인하는 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060008810A1 (en) 2004-07-06 2006-01-12 Focus Technologies, Inc. Methods and compositions for detecting rhinoviruses
US20100196876A1 (en) 2005-12-23 2010-08-05 Siemens Healthcare Diagnostics Inc. Methods and Reagents for Genotyping HCV
US20110306036A1 (en) 2010-06-10 2011-12-15 Allison Dauner RT-LAMP assay for the detection of pan-serotype dengue virus

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
S. Feng 외, "A fast and flexible approach to oligonucleotide probe design for genomes and gene families", Bioinformatics, 23(10):1195-1202. (2007.03.28.)*
W. Chung 외, "Design of oligonucleotide probes for functional gene detection in a microbial community", Bioinformatics, 21(22):4092-4100. (2005.09.13.)*

Also Published As

Publication number Publication date
EP3613049A4 (en) 2021-01-20
EP3613049A2 (en) 2020-02-26
US20200058370A1 (en) 2020-02-20
WO2018194342A3 (en) 2019-04-18
WO2018194342A2 (en) 2018-10-25
EP3613049B1 (en) 2022-08-10
US11961590B2 (en) 2024-04-16
KR20190125533A (ko) 2019-11-06

Similar Documents

Publication Publication Date Title
US20210189466A1 (en) Profiling Expression at Transcriptome Scale
Scherf et al. Highly specific localization of promoter regions in large genomic sequences by PromoterInspector: a novel context analysis approach
MXPA06009317A (es) Metodo para el diseño de oligonucleotidos para tecnicas de biologia molecular.
JP2008526249A5 (ko)
US9175339B2 (en) Method for detection of target nucleic acid
JP2021094038A (ja) 核酸を調製するための等温方法および関連組成物
Wang et al. High-throughput primer and probe design
Loftis et al. Principles of real-time PCR
KR102412183B1 (ko) 올리고뉴클레오타이드 최적 조합의 제공방법
KR101613612B1 (ko) 표적 염기를 검출하기 위한 rna를 함유한 프로브를 제조하기 위한 방법
KR102335277B1 (ko) 복수의 타겟 핵산서열을 최대의 타겟 커버리지로 검출하기 위한 올리고뉴클레오타이드의 제작방법
Apte et al. AlleleID: a pathogen detection and identification system
Tang et al. Simple and effective method for generating single-stranded DNA targets and probes
Van Poucke et al. Combined FAM-labeled TaqMan probe detection and SYBR green I melting curve analysis in multiprobe qPCR genotyping assays
Volokhov et al. Oligonucleotide microarrays for identification of microbial pathogens and detection of their virulence-associated or drug-resistance determinants
Chen et al. Design of multiplex PCR primers using heuristic algorithm for sequential deletion applications
JP2011239708A (ja) 核酸標準物質検出用プローブの設計方法、核酸標準物質検出用プローブ及び当該核酸標準物質検出用プローブを有する核酸検出系
CN102191314A (zh) 一种基于pcr的低成本、简单、高效的snp检测方法
US20220148678A1 (en) Methods for determining a designable region of oligonucleotides
WO2013053852A1 (en) Design of stem-loop probes and utilization in snp genotyping
JP5158944B2 (ja) 酵母ゲノム解析による酵母菌株判定法
CN106702007B (zh) 一种高分辨率核酸结合/熔解荧光的检测方法
Sowndarya et al. Basic Guide to Real Time PCR in the Current Scenario
Karnati Development of a Computer Algorithm for Generation of Primers for Nucleic Acid Sequence Based Amplification (NASBA)
KR20220062323A (ko) 올리고뉴클레오타이드 세트들의 최적 조합을 제공하는 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant