KR100745763B1 - Method for designing probe set probe set designed by the method microarray comprising the probe set and method for identifying target sequence using the probe set - Google Patents

Method for designing probe set probe set designed by the method microarray comprising the probe set and method for identifying target sequence using the probe set Download PDF

Info

Publication number
KR100745763B1
KR100745763B1 KR1020060019499A KR20060019499A KR100745763B1 KR 100745763 B1 KR100745763 B1 KR 100745763B1 KR 1020060019499 A KR1020060019499 A KR 1020060019499A KR 20060019499 A KR20060019499 A KR 20060019499A KR 100745763 B1 KR100745763 B1 KR 100745763B1
Authority
KR
South Korea
Prior art keywords
group
sequence
probe set
probe
target sequence
Prior art date
Application number
KR1020060019499A
Other languages
Korean (ko)
Other versions
KR20060099407A (en
Inventor
오지영
이규상
권태준
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US11/370,433 priority Critical patent/US20060204995A1/en
Priority to JP2006062806A priority patent/JP4813215B2/en
Publication of KR20060099407A publication Critical patent/KR20060099407A/en
Application granted granted Critical
Publication of KR100745763B1 publication Critical patent/KR100745763B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/30Microarray design

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명은 혼성화에 의한 표적 서열의 동정에 사용되는 프로브 세트를 설계하는 방법에 관한 것이다. 또한, 본 발명은 상기 방법에 의하여 설계된 프라이머 및 프로브 세트, 상기 프라이머 및 프로브 세트를 포함하는 키트, 상기 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체 및 상기 프라이머 및 프로브 세트를 이용한 표적 서열의 동정 방법에 관한 것이다. 본 발명에 따르면, 많은 수의 표적 서열들을 신속하게 동정할 수 있고 2종 이상의 표적 서열이 동시에 출현하더라도 정확하게 동정할 수 있는 프로브 세트를 용이하게 설계할 수 있다. The present invention relates to a method of designing a probe set used for identification of a target sequence by hybridization. The present invention also provides a primer and probe set designed by the method, a kit comprising the primer and probe set, a computer readable medium having recorded thereon a program for allowing a computer to perform the method, and the primer and probe set. It relates to a method for identifying a target sequence. According to the present invention, it is possible to easily design a probe set capable of quickly identifying a large number of target sequences and accurately identifying two or more target sequences simultaneously.

프로브, 설계, 표적 서열 동정, 마이크로어레이 Probe, design, target sequence identification, microarray

Description

프로브 세트를 설계하는 방법, 그에 의하여 설계된 프로브 세트, 상기 프로브 세트를 포함하는 마이크로어레이, 및 상기 프로브 세트를 이용한 표적 서열의 동정 방법{Method for designing probe set, probe set designed by the method, microarray comprising the probe set, and method for identifying target sequence using the probe set}Method for designing probe set, probe set designed by the method, microarray including the probe set designed by the method, a microarray including the probe set, and a method for identifying a target sequence using the probe set probe set, and method for identifying target sequence using the probe set}

도 1은 본 발명에 따른 프로브 세트의 설계 방법을 나타내는 흐름도이다. 1 is a flowchart illustrating a method of designing a probe set according to the present invention.

도 2는 2개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 한 예를 도시한 개략도이다. 2 is a schematic diagram showing an example of a method for designing a probe set of the present invention using two conserved sequences.

도 3은 2개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 다른 예를 도시한 개략도이다. 3 is a schematic diagram showing another example of a probe set design method of the present invention using two conserved sequences.

도 4는 3개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 한 예를 도시한 개략도이다. 4 is a schematic diagram showing an example of a method for designing a probe set of the present invention using three conserved sequences.

5도 5는 3개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 다른 예를 도시한 개략도이다. 5 is a schematic diagram showing another example of the method for designing a probe set of the present invention using three conserved sequences.

도 6은 도 2에 의해 설계된 프로브 세트를 포함하는 마이크로어레이의 스팟팅 배열 및 그를 이용한 표적 서열 동정 방법의 일 예를 도시한 것이다. FIG. 6 illustrates an example of a spotting arrangement of a microarray including a probe set designed by FIG. 2 and a method of identifying target sequences using the same.

도 7은 도 3에 의해 설계된 프로브 세트를 포함하는 마이크로어레이의 스팟팅 배열 및 그를 이용한 표적 서열 동정 방법의 일 예를 도시한 것이다. FIG. 7 illustrates an example of a spotting arrangement of a microarray including a probe set designed by FIG. 3 and a target sequence identification method using the same.

도 8은 도 4에 의해 설계된 프로브 세트를 포함하는 마이크로어레이의 스팟팅 배열 및 그를 이용한 표적 서열 동정 방법의 일 예를 도시한 것이다. FIG. 8 illustrates an example of a spotting arrangement of a microarray including a probe set designed by FIG. 4 and a method of identifying target sequences using the same.

도 9는 도 5에 의해 설계된 프로브 세트를 포함하는 마이크로어레이의 스팟팅 배열 및 그를 이용한 표적 서열 동정 방법의 일 예를 도시한 것이다. FIG. 9 illustrates an example of a spotting arrangement of a microarray including a probe set designed by FIG. 5 and a method of identifying target sequences using the same.

본 발명은 표적 서열의 동정에 사용될 수 있는 프로브 세트를 설계하는 방법, 그에 의하여 설계된 프로브 세트, 상기 프로브 세트를 포함하는 마이크로어레이, 상기 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체 및 상기 프로브 세트를 이용한 표적 서열의 동정 방법에 관한 것이다. The present invention relates to a method of designing a probe set that can be used for identification of a target sequence, a probe set designed thereby, a microarray including the probe set, and a computer readable medium having recorded thereon a program for allowing a computer to perform the method. And a method for identifying a target sequence using the probe set.

마이크로어레이란 기판 상에 폴리뉴클레오티드의 그룹이 높은 밀도로 고정화되어 있는 것으로서, 상기 폴리뉴클레오티드 그룹은 각각 일정한 영역에 고정화되어 있는 마이크로어레이를 의미한다. 이러한 마이크로어레이는 당업계에 잘 알려져 있다. 마이크로어레이에 관하여는 예를 들면, 미국 특허 제 5,445,934호 및 제 5,744,305호에 개시되어 있다. 또한, 상기 마이크로어레이의 제조방법에는 일반적으로 포토리소그래피를 이용하는 방법이 알려져 있다. 포토리소그래피를 이용하는 경우, 제거가능한 기로 보호된 단량체가 도포된 기판 표면 상의 일정한 영역을 에너지 원에 노출시켜 보호기를 제거하고, 제거가능한 기로 보호된 단량체를 커플링 시키는 단계를 반복함으로써, 폴리뉴클레오티드의 마이크로어레이를 제조할 수 있다. 이 경우, 마이크로어레이 상에 고정화되는 폴리뉴클레오티드는 단량체를 하나씩 연장시키는 방식으로 합성된다. 또한, 스팟팅(spotting) 법에 의하는 경우, 마이크로어레이는 이미 합성된 폴리뉴클레오티드를 일정한 위치에 고정화시킴으로써 고정화된다. 이러한 마이크로어레이의 제조방법은 예를 들면, 미국특허 제5,744,305호, 제5,143,854호 및 제5,424,186호에 개시되어 있다. 마이크로어레이 및 그의 제조방법에 관한 상기 문헌은 원용에 의하여 본 명세서에 그 전체로서 포함되어진다.A microarray is a group of polynucleotides immobilized at a high density on a substrate, and the polynucleotide groups are microarrays each immobilized in a predetermined region. Such microarrays are well known in the art. Microarrays are disclosed, for example, in US Pat. Nos. 5,445,934 and 5,744,305. In addition, a method using photolithography is generally known as a method for producing the microarray. If photolithography is used, the micronucleotides of the polynucleotide may be repeated by exposing certain regions on the substrate surface to which the monomers protected with the removable groups are applied to an energy source to remove the protecting groups and coupling the monomers protected with the removable groups. Arrays can be made. In this case, the polynucleotides immobilized on the microarray are synthesized by extending the monomers one by one. In addition, in the case of the spotting method, the microarray is immobilized by immobilizing the already synthesized polynucleotide in a fixed position. Methods of making such microarrays are disclosed, for example, in US Pat. Nos. 5,744,305, 5,143,854, and 5,424,186. The above documents on microarrays and methods for their preparation are hereby incorporated by reference in their entirety.

마이크로어레이에 고정화되는 폴리뉴클레오티드("프로브" 또는 "프로브 핵산" 또는 "프로브 폴리뉴클레오티드"라고도 한다)는 표적 핵산과 특이적으로 혼성화할 수 있어 표적 핵산을 검출 또는 확인하는데 사용되어진다. 종래 프로브 DNA는 각 표적 서열에 대한 프로브 DNA를 선택하기 위한 기준을 설정하고, 상기 기준에 맞는 DNA 서열을 선택한다. 선택된 DNA 서열에 대하여 상기 기준 및 다른 요건을 검정한 다음 가장 바람직한 프로브 서열을 선택하게 된다. 상기 기준에는 프로브의 길이, 프로브의 Tm 값(이중가닥 DNA 분자들 가운데 50%가 2개의 단일가닥으로 해리되는 온도), 및 다른 DNA와 서열 상동성의 한계값 등이 포함되어질 수 있다. 상기 기준에 맞는 후보 프로브 DNA가 선택되면, 상기 후보 프로브 DNA가 표적 서열에만 유니크한 것인지, 교차혼성화를 유도하기 쉬운 서열은 아닌지 등에 대하여 Tm 및 서열 상동성 등을 통하여 조사한다. 이들 표준들을 만족시키는 후보 프로브 DNA 중에서 가장 바람직한 것을 표적 DNA 서열에 특이적으로 결합하는 서열로서 선택하 게 된다. 그러나, 이러한 프로브 세트 설계 방법은 각 표적 서열에 대하여 혼성화하면서 다른 서열에는 교차 혼성화하지 않는 특이적 서열만을 프로브로서 선택하였기 때문에, 표적 서열간의 서열 상동성이 높거나, 동정하고자 하는 표적 서열의 수가 많아지는 경우 특이적 프로브를 설계하기 어려운 문제점이 있었다. Polynucleotides (also referred to as "probes" or "probe nucleic acids" or "probe polynucleotides") immobilized on a microarray can be specifically hybridized with a target nucleic acid and used to detect or identify the target nucleic acid. Conventional probe DNA sets criteria for selecting probe DNA for each target sequence and selects DNA sequences that meet the criteria. The above criteria and other requirements are assayed for the selected DNA sequence and then the most preferred probe sequence is selected. The criteria may include the length of the probe, the Tm value of the probe (the temperature at which 50% of the double stranded DNA molecules dissociate into two single strands), and the limit of sequence homology with other DNA. When a candidate probe DNA that meets the above criteria is selected, whether the candidate probe DNA is unique to the target sequence or not is a sequence that is easy to induce cross hybridization, and the like is examined through Tm and sequence homology. Among the candidate probe DNAs satisfying these standards, the most preferred is selected as the sequence that specifically binds to the target DNA sequence. However, since the probe set design method selects only the specific sequence as the probe that hybridizes to each target sequence but does not cross hybridize to the other sequence, the sequence sequence between the target sequences is high or the number of target sequences to be identified is large. There was a problem in designing specific probes when losing.

예컨대, 특정 박테리아 군을 구성하는 복수의 박테리아들 중 시료 내에 존재하는 박테리아가 어떤 종인지를 동정하기 위해서 종래에는 상기 복수의 박테리아의 보존 서열(consensus sequence), 특히 16S rRNA 부위를 이용하였다. 즉, 상기 16S rRNA 부위 중 상기 종들에 공통적인 서열은 프라이머로서 사용하고, 각 종들에 유니크한 서열은 프로브로서 사용하였다. 상기 방법은 몇 종의 박테리아를 동정하는데 사용될 수 있지만, 16S rRNA 부위는 고도로 보존되어 있어 10종 이상의 박테리아의 동정에 사용되기에는 어려움이 있다. 예컨대, 패혈증(sepsis)에 관련된 박테리아 37종 및 혈액 배양시 오염 또는 균혈증(bacteremia)에 관련된 박테리아 34종의 총 71종의 경우 16S rRNA 서열 1,002 bp에 있어서, 14종의 서열 상동성이 100%이고, 상기 종들의 97%의 서열 상동성이 70% 이상이고, 상기 71종의 서열 상동성의 평균은 83%로 고도로 보존되어 있다. 따라서, 종래의 방법을 이용하여 상기 71종을 동정하기 위한 프로브를 설계하는 경우, 각 프로브간 80% 이하의 상동성을 갖도록 설계하는 경우 12종을 동정할 수 있는데 불과하다. For example, the consensus sequence of the plurality of bacteria, particularly the 16S rRNA site, has been conventionally used to identify which species are present in the sample among the plurality of bacteria constituting a particular bacterial group. That is, sequences common to the species of the 16S rRNA site were used as primers, and sequences unique to each species were used as probes. The method can be used to identify several bacteria, but the 16S rRNA site is highly conserved, making it difficult to use for the identification of more than 10 bacteria. For example, for a total of 71 species of 37 bacteria related to sepsis and 34 bacteria related to contamination or bacteremia in blood culture, 14 sequence homology was 100% in 16S rRNA sequence 1,002 bp 97% sequence homology of the species is at least 70%, and the average of the 71 species sequence homology is highly conserved at 83%. Therefore, when designing probes for identifying the 71 species by using the conventional method, only 12 species can be identified when designed to have a homology of 80% or less between each probe.

또 다른 종 동정을 위한 유전자인 23S rRNA의 경우 서열이 많이 상이하여 16S rRNA를 사용하는 경우 보다 많은 수의 종들을 동정할 수 있다. 하지만, 23S rRNA 서열은 공개되어 있지 않은 경우가 많아, 이의 서열을 확인하는데는 추가의 비용이 발생한다는 문제점이 있다. 예컨대, 상기 71종의 박테리아의 경우 약 2,600 bp의 23S rRNA 서열 중 대략 반 정도 이상의 서열이 공개되어 있는 종의 수는 43종에 불과하다. 상기 23S rRNA 서열을 이용하여 30종의 박테리아를 동정하였다는 보고가 있었지만("Rapid diagnosis of bacteremia by universal amplification of 23S ribosomal DNA followed by hybridization to an oligonucleotide array, JOURNAL OF CLINICAL MICROBIOLOGY, Feb. 2000, pp.781-788), 상기 논문에는 23S rRNA 서열이 공개되어 있지 않을 뿐만 아니라, 여전히 30종 이상을 동정할 수 없다는 문제점이 있다. 23S rRNA, which is a gene for identifying another species, has a different sequence, so that more species can be identified when using 16S rRNA. However, the 23S rRNA sequence is often not disclosed, there is a problem that additional costs are required to identify the sequence. For example, in the case of the 71 kinds of bacteria, only about 43 or more of about 2,600 bp 23S rRNA sequences are disclosed. Although 30 species of bacteria were identified using the 23S rRNA sequence ("Rapid diagnosis of bacteremia by universal amplification of 23S ribosomal DNA followed by hybridization to an oligonucleotide array, JOURNAL OF CLINICAL MICROBIOLOGY, Feb. 2000, pp. 781-788), the 23S rRNA sequence is not disclosed in the paper, there is still a problem that can not identify more than 30 species.

요컨대, 기존의 프로브 세트 설계 방법을 이용하여 다수의 종을 식별 가능한 프로브를 설계하는 것은 다음과 같은 한계를 갖는다. 첫째, 다수의 종에 대해 위치가 일치하는 공개된 서열을 확보하는 것이 16S rRNA를 제외하고는 어렵고, 둘째, 16S rRNA의 경우 서열의 보존이 잘 되어 있어 같은 속(genus) 내의 다른 종과 구분을 하기 위한 서열을 발굴하기가 어렵고, 셋째, 종간의 서열이 비교적 상이한 유전자나 게놈상의 특정 위치의 서열의 경우 모든 종에 대해 서열을 확보하기 위해서는 서열을 얻기 위한 별도의 실험을 실시해야 하여 추가 비용이나 개발 기간의 지연 등이 발생하게 된다. In short, designing probes that can identify multiple species using existing probe set design methods has the following limitations. Firstly, it is difficult to obtain a published sequence of identical positions for multiple species except for 16S rRNA, and secondly, 16S rRNA is well preserved in order to distinguish it from other species in the same genus. In order to secure sequences for all species in the case of genes or sequences of specific positions on the genome, which are relatively different from one species to another, it is necessary to perform separate experiments to obtain sequences. There is a delay in the development period.

본 발명자들은 상기와 같은 종래의 문제점을 해결하기 위하여 연구를 계속 하던 중, 복수의 표적 서열들의 하나의 보존 서열을 비교하여 상기 복수의 표적 서열들을 그룹화 하고, 상기 그룹들 중 하나의 표적 서열로 구성되는 경우 표적 서열 특이적 프로브를 선택하고, 상기 그룹들 중 둘 이상의 표적 서열로 구성되는 경우 그룹 프로브를 선택하고, 상기 둘 이상의 표적 서열로 구성되는 그룹의 표적 서열들의 다른 보존 서열에 대하여 상기 과정을 반복하면 30개 이상의 표적 서열을 동정할 수 있는 프로브 세트를 설계할 수 있음을 확인함으로써 본 발명을 완성하였다. The inventors of the present invention, while continuing to research to solve the above-mentioned conventional problems, by comparing one conserved sequence of a plurality of target sequences to group the plurality of target sequences, consisting of one target sequence of the group Select a target sequence specific probe if one is selected, and if the group probe consists of two or more target sequences, repeat the procedure for other conserved sequences of target sequences of the group consisting of the two or more target sequences. The present invention was completed by confirming that repeating could design a probe set capable of identifying more than 30 target sequences.

본 발명의 목적은 표적 서열의 동정에 사용되는 프로브 세트를 설계하는 방법을 제공하는 것이다.It is an object of the present invention to provide a method of designing a set of probes used for identification of a target sequence.

본 발명의 다른 목적은 상기 방법에 따라 설계된 프로브 세트를 제공하는 것이다. Another object of the present invention is to provide a probe set designed according to the method.

본 발명의 또 다른 목적은 상기 프로브 세트를 포함하는 마이크로어레이를 제공하는 것이다.Still another object of the present invention is to provide a microarray including the probe set.

본 발명의 또 다른 목적은 상기 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체를 제공하는 것이다. It is a further object of the present invention to provide a computer readable medium having recorded thereon a program which enables a computer to carry out the method.

본 발명의 또 다른 목적은 상기 프로브 세트를 이용하여 표적 서열을 동정하는 방법을 제공하는 것이다. Still another object of the present invention is to provide a method for identifying a target sequence using the probe set.

본 발명의 목적을 달성하기 위해서, 본 발명은 a) 복수의 표적 서열들의 하나의 보존 서열을 비교하여, 상기 하나의 보존 서열에 포함되어 있는 일정 기준을 갖는 폴리뉴클레오티드를 포함하는 표적 서열들끼리 각각 그룹화하는 단계; b) 상기 a) 단계의 그룹들 중 하나의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 표적 서열 특이적 프로브(target sequence specific probe)로 선택하는 단계; c) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 각 그룹의 그룹 프로브(group probe)로 선택하는 단계; 및 d) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 2 이상의 표적 서열로 구성된 각 그룹의 복수의 표적 서열들의 다른 보존 서열에 대하여 2 이상의 표적 서열로 구성된 그룹이 존재하지 않을 때까지 상기 a) 단계 내지 c) 단계를 반복하는 단계를 포함하는 표적 서열의 동정에 사용되는 프로브 세트를 설계하는 방법을 제공한다. In order to achieve the object of the present invention, the present invention is a) comparing a single conserved sequence of a plurality of target sequences, each target sequence comprising a polynucleotide having a predetermined criteria contained in the one conserved sequence Grouping; b) in the case of a group consisting of a target sequence of one of the groups of step a), selecting an oligonucleotide that specifically binds to the polynucleotide having the predetermined criteria as a target sequence specific probe step; c) in the case of a group consisting of two or more target sequences of the groups of step a), selecting oligonucleotides that specifically bind to the polynucleotide having the predetermined criteria as a group probe of each group; And d) in the case of a group consisting of two or more target sequences of the groups of step a), there is a group consisting of two or more target sequences relative to other conserved sequences of a plurality of target sequences of each group consisting of the two or more target sequences. It provides a method of designing a probe set used for identification of the target sequence comprising repeating steps a) to c) until not.

본 발명에 따른 프로브 세트 설계 방법에 있어서, 상기 일정 기준은 서열 상동성, 염기 길이, 혼성화 융점(Tm), 혼성화 융점 차이(ΔTm), GC 함량, 자기 정렬(self-alignment), 변이 위치, 반복서열 정도 및 3' 말단의 염기 구성으로 이루어진 군에서 선택되는 하나 이상일 수 있다. In the probe set design method according to the present invention, the predetermined criteria are sequence homology, base length, hybridization melting point (Tm), hybridization melting point difference (ΔTm), GC content, self-alignment, mutation position, repetition It may be at least one selected from the group consisting of sequence degree and 3 'terminal base configuration.

본 발명에 따른 프로브 세트 설계 방법에 있어서, 상기 일정 기준은 동일 그룹의 폴리뉴클레오티드에 대해서 100%의 상동성 및 다른 그룹의 폴리뉴클레오티드에 대해서 90% 이하의 상동성인 것이 바람직하다. In the probe set design method according to the present invention, the predetermined criteria are preferably 100% homology with respect to polynucleotides of the same group and 90% homology with respect to other groups of polynucleotides.

본 발명에 따른 프로브 세트 설계 방법에 있어서, 상기 보존 서열은 16S rRNA, 23S rRNA, sodA, gyrA, groEL 및 rpoB로 구성된 군에서 선택될 수 있다. In the probe set design method according to the present invention, the conserved sequence may be selected from the group consisting of 16S rRNA, 23S rRNA, sodA, gyrA, groEL and rpoB.

본 발명의 다른 목적을 달성하기 위해서, 본 발명은 상기 프로브 세트 설계 방법에 따라 설계된 프로브 세트를 제공한다. In order to achieve another object of the present invention, the present invention provides a probe set designed according to the probe set design method.

본 발명의 또 다른 목적을 달성하기 위해서, 본 발명은 상기 프로브 세트가 기판 상에 고정화 되어 있는 것을 특징으로 하는 표적 서열 동정용 마이크로어레이를 제공한다. In order to achieve another object of the present invention, the present invention provides a microarray for identifying a target sequence, characterized in that the probe set is immobilized on a substrate.

상기 기판은 아미노-실란(amino-silane), 폴리-L-라이신(poly-L-lysine) 및 알데히드(aldehyde)로 이루어진 군에서 선택되는 활성기가 코팅될 수 있다. The substrate may be coated with an active group selected from the group consisting of amino-silane, poly-L-lysine and aldehyde.

또한, 상기 기판은 실리콘 웨이퍼, 유리, 석영, 금속 및 플라스틱으로 이루어진 군에서 선택될 수 있다. In addition, the substrate may be selected from the group consisting of silicon wafer, glass, quartz, metal and plastic.

본 발명의 또 다른 목적을 달성하기 위해서, 본 발명은 상기 프로브 세트 설계 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체를 제공한다. In order to achieve another object of the present invention, the present invention provides a computer readable medium having recorded thereon a program for allowing a computer to perform the probe set design method.

본 발명의 또 다른 목적을 달성하기 위해서, 본 발명은 상기 프로브 세트를 이용하여 표적 서열을 동정하는 방법을 제공한다. In order to achieve another object of the present invention, the present invention provides a method for identifying a target sequence using the probe set.

본 발명에 따른 표적 서열 동정 방법은 a) 본 발명에 따른 마이크로어레이에 표적 서열을 포함하는 반응 시료를 적용하는 단계; b) 프로브와 표적 서열을 혼성화시키는 단계; c) 비특이적 반응을 제거하기 위해 세척하는 단계; 및 d) 하이브리드 형성에 의한 형광 시그널을 검출하는 단계를 포함하는 것이 바람직하다. A method of identifying a target sequence according to the present invention comprises the steps of: a) applying a reaction sample comprising a target sequence to a microarray according to the present invention; b) hybridizing the probe and the target sequence; c) washing to remove nonspecific reactions; And d) detecting the fluorescence signal by hybrid formation.

이하 도면을 참조하여 본 발명을 보다 상세히 설명한다. Hereinafter, the present invention will be described in more detail with reference to the accompanying drawings.

본 발명의 일면은 표적 서열 동정용 프로브 세트 설계 방법에 관한 것이다. One aspect of the invention relates to a method of designing a probe set for identifying a target sequence.

도 1은 본 발명에 따른 프로브 세트 설계 방법을 나타내는 흐름도이다. 1 is a flowchart illustrating a probe set design method according to the present invention.

본 발명에 따른 프로브 세트 설계 방법은 a) 복수의 표적 서열들의 하나의 보 존 서열을 비교하여, 상기 하나의 보존 서열에 포함되어 있는 일정 기준을 갖는 폴리뉴클레오티드를 포함하는 표적 서열들끼리 각각 그룹화하는 단계를 포함한다. The probe set design method according to the present invention comprises: a) comparing one preservation sequence of a plurality of target sequences, and grouping each of the target sequences including polynucleotides having a predetermined criterion included in the one conserved sequence. Steps.

본 명세서에 있어서 "표적 서열(target sequence)"이란 프로브와의 결합에 의하여 동정하기 위해 선택되는 폴리뉴클레오티드를 의미한다. 상기 표적 서열은 게놈 DNA, 제한 효소에 의하여 절단된 DNA 단편, 및 PCR 산물 등을 포함한다. 일반적으로는 게놈 DNA의 특정 영역을 PCR에 의하여 증폭함으로써 얻어지는 게놈 DNA 단편이 많이 사용된다. 본 발명의 방법은 표적 서열이 복수 개인 경우에 적용할 수 있는 프로브 세트를 설계하는 방법이다. As used herein, "target sequence" refers to a polynucleotide selected for identification by binding to a probe. The target sequence includes genomic DNA, DNA fragments cut by restriction enzymes, PCR products, and the like. Generally, genomic DNA fragments obtained by amplifying a specific region of genomic DNA by PCR are frequently used. The method of the present invention is a method of designing a probe set applicable to a case where there are a plurality of target sequences.

본 명세서에 있어서 "보존 서열(consensus sequence)"이란 해당 표적 서열들 내의 동일한 부위에 위치하는 동일 또는 유사한 염기 서열을 갖는 폴리뉴클레오티드를 의미한다. 상기 보존 서열은 해당 표적 서열들의 어떤 유전자라도 상관 없다. 예컨대, 상기 a) 단계에서 비교되는 보존 서열은 16S rRNA 부위, 23S rRNA 부위, sodA 부위, gyrA 부위, groEL 부위 및 rpoB로 이루어진 군에서 선택되는 어느 하나일 수 있다. As used herein, the term "consensus sequence" refers to a polynucleotide having the same or similar base sequence located at the same site in the target sequences. The conserved sequence can be any gene of the corresponding target sequences. For example, the conserved sequence compared in step a) may be any one selected from the group consisting of 16S rRNA site, 23S rRNA site, sodA site, gyrA site, groEL site and rpoB.

본 발명에 따른 프로브 세트 설계 방법에 있어서, "기준"은 프로브를 선택하는 종래의 통상적인 기준일 수 있다. 즉, 상기 기준은 서열 상동성, 염기 길이, 혼성화 융점(Tm), 혼성화 융점 차이(ΔTm), GC 함량, 자기 정렬(self-alignment), 변이 위치, 반복서열 정도 및 3' 말단의 염기 구성으로 이루어진 군에서 선택되는 하나 이상일 수 있다. 또한, 상기 "일정 기준"은 동일 그룹의 폴리뉴클레오티드에 대해서 100% 및 다른 그룹의 폴리뉴클레오티드에 대해서 90% 이하의 상동성, 18~25 bp의 염기 길이, 72~76℃의 혼성화 융점, 30~70%의 GC 함량, 및 G 또는 C의 3' 말단 염기 구성인 것이 바람직하다.  In the probe set design method according to the present invention, the "criteria" may be a conventional conventional criterion for selecting a probe. That is, the criteria are based on sequence homology, base length, hybridization melting point (Tm), hybridization melting point difference (ΔTm), GC content, self-alignment, mutation position, degree of repetition, and base configuration of 3 'end. It may be one or more selected from the group consisting of. In addition, the "schedule" means 100% homology to polynucleotides of the same group and 90% or less homology to polynucleotides of other groups, 18-25 bp base length, hybridization melting point of 72-76 ℃, 30 ~ Preference is given to a GC content of 70% and a 3 'terminal base configuration of G or C.

또한, 본 발명에 따른 프로브 세트 설계 방법은 b) 상기 a) 단계의 그룹들 중 하나의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 표적 서열 특이적 프로브(target sequence specific probe)로 선택하는 단계를 포함한다. In addition, according to the present invention, a method for designing a probe set includes b) a target sequence specificity of an oligonucleotide that specifically binds to a polynucleotide having the predetermined criteria in the case of a group consisting of a target sequence of one of the groups of step a). Selecting as a target sequence specific probe.

본 발명에 있어서, 프로브의 선택은 상기의 기준에 따라 종래 알려진 방법을 이용하여 결정될 수 있다. 즉, 프로브 DNA를 선택하기 위한 기준을 설정하고, 상기 기준에 맞는 DNA 서열을 선택하고, 선택된 DNA 서열에 대하여 상기 기준 및 다른 요건을 검정한 다음 가장 바람직한 서열을 프로브 DNA로서 선택하게 된다. 상기 기준에 맞는 후보 프로브 DNA가 선택되면, 상기 기준을 만족시키는 후보 프로브 DNA 중에서 가장 바람직한 것을 표적 DNA 서열에 특이적으로 결합하는 프로브 서열로서 선택하게 된다. 상기 프로브 DNA는 표적 DNA에 대하여 특이적으로 결합할 수 있는 것이면 하나의 표적 DNA에 대하여 2 이상의 프로브 DNA가 선택될 수도 있다. In the present invention, the selection of the probe can be determined using a conventionally known method according to the above criteria. That is, criteria for selecting probe DNA are set, DNA sequences meeting the criteria are selected, the criteria and other requirements are assayed for the selected DNA sequence, and the most preferred sequence is selected as the probe DNA. When a candidate probe DNA that meets the above criteria is selected, the most preferred candidate DNA satisfying the above criteria is selected as a probe sequence that specifically binds to the target DNA sequence. Two or more probe DNAs may be selected for one target DNA as long as the probe DNA is capable of specifically binding to the target DNA.

또한, 본 발명에 따른 프로브 세트 설계 방법은 c) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 각 그룹의 그룹 프로브(group probe)로 선택하는 단계를 포함한다. In addition, the probe set design method according to the present invention c) in the case of a group consisting of two or more target sequences of the group of step a), the oligonucleotide that specifically binds to the polynucleotide having the predetermined criterion Selecting as a group probe.

또한, 본 발명에 따른 프로브 세트 설계 방법은 d) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 2 이상의 표적 서열로 구성된 각 그룹의 복수의 표적 서열들의 다른 보존 서열에 대하여 2 이상의 표적 서열로 구성된 그룹이 존재하지 않을 때까지 상기 a) 단계 내지 c) 단계를 반복하는 단계를 포함한다. In addition, the probe set design method according to the present invention is d) in the case of a group consisting of two or more target sequences of the group of step a), a different conserved sequence of a plurality of target sequences of each group consisting of the two or more target sequences Repeating steps a) to c) until no group consisting of two or more target sequences is present.

상기 다른 보존 서열은 상기 2 이상의 표적 서열들로 구성된 각 그룹의 복수의 표적 서열들의 어떤 유전자라도 상관 없다. 상기 d) 단계에서 비교되는 다른 보존 서열은 상기 a) 단계에서 비교된 하나의 보존 서열을 제외한 보존 서열들로부터 선택되는 어느 하나일 수 있다. 예컨대, 상기 a) 단계에서 16S rRNA 부위가 비교된 경우, d) 단계의 다른 보존 서열은 23S rRNA 부위, sodA 부위, gyrA 부위, groEL 부위 및 rpoB로 이루어진 군에서 선택되는 어느 하나일 수 있다. 또한, 각 그룹에서 비교되는 보존 서열은 반드시 동일할 필요가 없다. 예컨대, 상기 a) 단계에서 16S rRNA 부위가 비교된 경우, d) 단계에서 하나의 그룹은 23S rRNA 부위가 비교되고 다른 그룹은 sodA 부위가 비교될 수 있다. The other conserved sequence may be any gene of a plurality of target sequences of each group consisting of the two or more target sequences. The other conserved sequences compared in step d) may be any one selected from conserved sequences except for one conserved sequence compared in step a). For example, when 16S rRNA sites are compared in step a), the other conserved sequence of step d) may be any one selected from the group consisting of 23S rRNA site, sodA site, gyrA site, groEL site and rpoB. In addition, the conserved sequences compared in each group do not necessarily need to be identical. For example, when 16S rRNA sites are compared in step a), one group may be compared to 23S rRNA sites and the other group may be compared to sodA sites in step d).

본 단계는 2 이상의 표적 서열로 구성된 그룹이 존재하지 않을 때까지, 즉 모든 그룹이 하나의 표적 서열로 구성되고 각 그룹의 각 하나의 표적 서열에 대해 표적 서열 특이적 프로브를 선택할 때까지 반복된다. This step is repeated until there are no groups of two or more target sequences, ie all groups are composed of one target sequence and a target sequence specific probe is selected for each one target sequence of each group.

상기한 과정에 의하여 얻어지는 복수의 그룹 프로브 및 표적 서열 특이적 프로브는 상기 복수의 표적 서열들을 동정에 사용하기 위한 프로브 세트로서 선택된다.A plurality of group probes and target sequence specific probes obtained by the above process are selected as probe sets for use in identifying the plurality of target sequences.

도 2는 2개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 한 예를 도시한 개략도이다. 2 is a schematic diagram showing an example of a method for designing a probe set of the present invention using two conserved sequences.

이해를 돕기 위하여 본 예에서는 6개의 표적 서열을 사용하였지만, 그의 수에 제한되는 것은 아니며, 오히려 그의 수가 증가할 수록 본 발명은 보다 강력함을 당업자는 용이하게 이해할 수 있을 것이다. Although six target sequences are used in this example for the sake of understanding, the skilled person will readily understand that the present invention is more powerful as its number is increased.

도 2를 참조하면, 6개의 표적 서열들의 보존 서열 A를 비교하여, 폴리뉴클레오티드 a를 포함하는 표적 서열들인 표적 서열 1, 표적 서열 2 및 표적 서열 3을 그룹 I로 그룹화하고, 폴리뉴클레오티드 b를 포함하는 표적 서열들인 표적 서열 4, 표적 서열 5 및 표적 서열 6을 그룹 II로 그룹화한다. 상기 그룹 I 및 그룹 II가 모두 2개 이상의 표적 서열로 구성되어 있기 때문에, 상기 폴리뉴클레오티드 a 및 폴리뉴클레오티드 b를 각각 그룹 I 및 그룹 II의 그룹 프로브로 선택한다. Referring to FIG. 2, by conserving conserved sequence A of six target sequences, grouping target sequences comprising target sequence 1, target sequence 2 and target sequence 3 comprising polynucleotide a into group I, and comprising polynucleotide b Target sequences 4, target sequence 5 and target sequence 6 are grouped into group II. Since both Group I and Group II consist of two or more target sequences, the polynucleotide a and polynucleotide b are selected as group probes of Group I and Group II, respectively.

이후 상기 그룹 I 및 그룹 II 각각의 복수의 표적 서열들의 다른 보존 서열을 비교한다. 이 단계는 각 그룹에 대해서 독립적으로 수행되는 것이므로, 각 그룹에 대해 상이한 보존 서열을 사용할 수도 있다. 예컨대, 그룹 I에 대해서는 보존 서열 B를 비교하고, 그룹 II에 대해서는 보존 서열 C를 비교할 수 있다. 다시 도 2를 참조하면, 그룹 I의 표적 서열 1, 표적 서열 2 및 표적 서열 3의 보존 서열 B를 비교하여, 폴리뉴클레오티드 a'를 포함하는 표적 서열 1을 그룹 I-1, 폴리뉴클레오티드 b'를 포함하는 표적 서열 2를 그룹 I-2 및 폴리뉴클레오티드 c'를 포함하는 표적 서열 3을 그룹 I-3으로 그룹화한다. 또한, 그룹 II의 표적 서열 4, 표적 서열 5 및 표적 서열 6의 보존 서열 B를 비교하여, 폴리뉴클레오티드 d'를 포함하는 표적 서열 4를 그룹 II-1, 폴리뉴클레오티드 e'를 포함하는 표적 서열 5를 그룹 II-2 및 폴리뉴클레오티드 c'를 포함하는 표적 서열 6을 그룹 II-3으로 그룹화한 다. 상기 각 그룹들은 모두 하나의 표적 서열로 구성되어 있으므로, 상기 폴리뉴클레오티드 a', 폴리뉴클레오티드 b', 폴리뉴클레오티드 c', 폴리뉴클레오티드 d' 및 폴리뉴클레오티드 e'를 표적 서열 특이적 프로브로 선택한다. The other conserved sequences of the plurality of target sequences of each of Group I and Group II are then compared. Since this step is performed independently for each group, different conserved sequences may be used for each group. For example, conserved sequence B can be compared for group I and conserved sequence C can be compared for group II. Referring back to FIG. 2, target sequence 1, target sequence 2, and conserved sequence B of target sequence 3 of group I are compared to compare target sequence 1 comprising polynucleotide a 'to group I-1, polynucleotide b'. Target sequence 2 comprising comprises grouping target sequence 3 comprising group I-2 and polynucleotide c 'into group I-3. Further, by comparing the target sequence 4 of the group II, the target sequence 5 of the target sequence 5 and the conserved sequence B of the target sequence 6, the target sequence 4 comprising the polynucleotide d 'and the target sequence 5 comprising the group II-1, polynucleotide e' Target group 6 comprising group II-2 and polynucleotide c 'to group II-3. Since each of the above groups consists of one target sequence, the polynucleotide a ', polynucleotide b', polynucleotide c ', polynucleotide d' and polynucleotide e 'are selected as target sequence specific probes.

상기 예의 표적서열 3 및 표적서열 6과 같이 2개의 표적 서열의 그룹 프로브가 상이한 경우, 그들의 표적 서열 특이적 프로브는 동일할 수도 있다. If the group probes of the two target sequences are different, such as target sequence 3 and target sequence 6 of the above example, their target sequence specific probes may be the same.

도 3은 2개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 다른 예를 도시한 개략도이다. 3 is a schematic diagram showing another example of a probe set design method of the present invention using two conserved sequences.

도 3을 참조하면, 6개의 표적 서열들의 보존 서열 A를 비교하여, 폴리뉴클레오티드 a를 포함하는 표적 서열 1 및 표적 서열 2를 그룹 I로 그룹화하고, 폴리뉴클레오티드 b를 포함하는 표적 서열 3, 표적 서열 4 및 표적 서열 5를 그룹 II로 그룹화하고, 폴리뉴클레오티드 c를 포함하는 표적 서열 6을 그룹 III으로 그룹화한다. 상기 그룹 III은 하나의 표적 서열로 구성되어 있기 때문에 상기 폴리뉴클레오티드 c를 표적 서열 6의 표적 서열 특이적 프로브로 선택한다. 한편, 상기 그룹 I 및 그룹 II는 2개 이상의 표적 서열로 구성되어 있기 때문에, 상기 폴리뉴클레오티드 a 및 폴리뉴클레오티드 b를 각각 그룹 I 및 그룹 II의 그룹 프로브로 선택한다. 다음으로, 그룹 I의 표적 서열 1 및 표적 서열 2의 보존 서열 B를 비교하여, 폴리뉴클레오티드 a'를 포함하는 표적 서열 1을 그룹 I-1, 폴리뉴클레오티드 b'를 포함하는 표적 서열 2를 그룹 I-2로 그룹화한다. 상기 각 그룹은 하나의 표적 서열로 구성되어 있으므로, 상기 폴리뉴클레오티드 a' 및 b'를 표적 서열 1 및 2의 표적 서열 특이적 프로브로 선택한다. 마찬가지로, 그룹 II의 표적 서열 3, 표적 서열 4 및 표적 서열 5의 보존 서열 B를 비교하여, 폴리뉴클레오티드 c'를 포함하는 표적 서열 3을 그룹 II-1, 폴리뉴클레오티드 d'를 포함하는 표적 서열 4를 그룹 II-2 및 e'를 포함하는 표적 서열 5를 그룹 II-3으로 그룹화한다. 상기 각 그룹은 하나의 표적 서열로 구성되어 있으므로, 상기 폴리뉴클레오티드 c', d' 및 e'를 표적 서열 3, 4 및 5의 표적 서열 특이적 프로브로 선택한다.Referring to FIG. 3, by comparing conserved sequence A of six target sequences, target sequence 1 and target sequence 2 comprising polynucleotide a are grouped into group I, target sequence 3 comprising polynucleotide b, target sequence 4 and target sequence 5 are grouped into group II and target sequence 6 comprising polynucleotide c is grouped into group III. Since group III consists of one target sequence, the polynucleotide c is selected as the target sequence specific probe of target sequence 6. On the other hand, since the group I and group II are composed of two or more target sequences, the polynucleotide a and the polynucleotide b are selected as the group probes of the group I and the group II, respectively. Next, target sequence 1 of group I and conserved sequence B of target sequence 2 are compared, and target sequence 1 comprising polynucleotide a 'is selected from group I-1 and target sequence 2 comprising polynucleotide b' is selected from Group I. Group by -2. Since each group consists of one target sequence, the polynucleotides a 'and b' are selected as target sequence specific probes of target sequences 1 and 2. Similarly, comparing target sequence 3 of target group II, target sequence 4 of target group II, and conserved sequence B of target sequence 5, target sequence 3 comprising polynucleotide c 'and target sequence 4 comprising group II-1, polynucleotide d' Groups target sequence 5 comprising group II-2 and e 'into group II-3. Since each group consists of one target sequence, the polynucleotides c ', d' and e 'are selected as target sequence specific probes of target sequences 3, 4 and 5.

도 4는 3개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 한 예를 도시한 개략도이고, 도 5는 3개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 다른 예를 도시한 개략도이다. 4 is a schematic diagram showing an example of a probe set design method of the present invention using three conserved sequences, and FIG. 5 is a schematic diagram showing another example of a probe set design method of the present invention using three conserved sequences.

도 4 및 도 5를 참조하면, 상기 예에서와 같이 2개의 보존 서열을 비교한 후에도 하나 이상의 그룹이 2개 이상의 표적 서열로 구성되어 있는 경우, 상기 2개 이상의 표적 서열로 구성된 그룹에 대해 다시 다른 보존 서열을 비교할 수 있다. 구체적인 방법은 상기에서 설명한 바와 동일하다. 도 4 및 도 5에서는 3개의 보존 서열을 이용하였지만, 동정하고자 하는 표적 서열의 범위가 매우 많은 경우, 4개 이상의 보존 서열을 이용할 수도 있다. 4 and 5, when one or more groups are composed of two or more target sequences even after comparing two conserved sequences as in the above example, again different from the group consisting of the two or more target sequences. Conservation sequences can be compared. The specific method is the same as described above. Although four conserved sequences are used in FIGS. 4 and 5, when there are a large range of target sequences to be identified, four or more conserved sequences may be used.

본 발명의 다른 일면은 본 발명의 프로브 세트 설계 방법에 따라 설계된 프로브 세트에 관한 것이다. Another aspect of the present invention relates to a probe set designed according to the probe set design method of the present invention.

본 발명의 또 다른 일면은 상기 프로브 세트가 기판 상에 고정화 되어 있는 것을 특징으로 하는 마이크로어레이에 관한 것이다.Another aspect of the invention relates to a microarray characterized in that the probe set is immobilized on a substrate.

본 발명에 따른 마이크로어레이는 본 발명에 따른 프로브 세트를 이용하여 본 분야의 당업자에게 알려져 있는 통상적인 방법에 의해 제조될 수 있다. Microarrays according to the invention may be prepared by conventional methods known to those skilled in the art using the probe set according to the invention.

즉, 상기 기판은 아미노-실란(amino-silane), 폴리-L-라이신(poly-L-lysine) 및 알데히드(aldehyde)로 이루어진 군에서 선택되는 활성기가 코팅될 수 있다. 또한, 상기 기판은 실리콘 웨이퍼, 유리, 석영, 금속 및 플라스틱으로 이루어진 군에서 선택될 수 있다. 본 발명에 따른 프로브 세트를 기판에 고정화시키는 방법으로는 파이조일렉트릭(piezoelectric) 방식을 이용한 마이크로피펫팅(micropipetting) 법, 핀(pin) 형태의 스팟터(spotter)를 이용한 방법 등을 사용할 수 있다. That is, the substrate may be coated with an active group selected from the group consisting of amino-silane, poly-L-lysine, and aldehyde. In addition, the substrate may be selected from the group consisting of silicon wafer, glass, quartz, metal and plastic. As a method of immobilizing the probe set according to the present invention, a micropipetting method using a piezoelectric method, a method using a pin-shaped spotter, etc. may be used. .

본 발명의 또 다른 일면은 상기 프로브 세트를 이용하여 표적 서열을 동정하는 방법에 관한 것이다. 상기 동정 방법은 상기 마이크로어레이를 이용하여 수행되는 것이 바람직하다. 즉, 본 발명에 따른 표적 서열 동정 방법은 a) 본 발명에 따른 마이크로어레이에 표적 서열을 포함하는 반응 시료를 적용하는 단계; b) 프로브와 표적 서열을 혼성화시키는 단계; c) 비특이적 반응을 제거하기 위해 세척하는 단계; 및 d) 하이브리드 형성에 의한 형광 시그널을 검출하는 단계를 포함하는 것이 바람직하다.Another aspect of the invention relates to a method for identifying a target sequence using the probe set. The identification method is preferably performed using the microarray. That is, the target sequence identification method according to the present invention comprises the steps of: a) applying a reaction sample comprising the target sequence to the microarray according to the present invention; b) hybridizing the probe and the target sequence; c) washing to remove nonspecific reactions; And d) detecting the fluorescence signal by hybrid formation.

도 6 내지 도 9는 각각 도 2 내지 도 5에 의해 설계된 프로브 세트를 포함하는 마이크로어레이의 스팟팅 배열 및 그를 이용한 표적 서열 동정 방법의 일 예를 도시한 것이다. 6 to 9 illustrate an example of a spotting arrangement of a microarray including a probe set designed by FIGS. 2 to 5 and a target sequence identification method using the same.

본 발명에 따른 마이크로어레이에 있어서 프로브 세트는 도 6 내지 도 9에서와 같이, 그가 유래된 보존 서열별로 스팟팅될 수 있지만, 특정 스팟팅 배열에 특별히 한정되는 것은 아니다. In the microarray according to the present invention, the probe set may be spotted by conserved sequences from which it is derived, as shown in FIGS. 6 to 9, but is not particularly limited to a specific spotting arrangement.

도 6A를 참조하면, 보존 서열 A에서 유래된 그룹 프로브인 폴리뉴클레오티드 a 및 폴리뉴클레오티드 b를 하나의 칼럼에 배열하고, 보존 서열 B에서 유래된 각 표적 서열 특이적 프로브인 폴리뉴클레오티드 a', b', c', d' 및 e'를 다른 칼럼에 배열하여 마이크로어레이를 제작하였다. 도 6B를 참조하면, 상기에서 제조된 마이크로어레이를 이용하여 본 발명의 표적 서열 동정 방법을 수행한 결과, 프로브 a 및 프로브 c'에 혼성화 반응이 검출되었다. 다시 도 2를 참조하면, 프로브 a는 그룹 I을 의미하고, 프로브 c'는 그 중 표적 서열 3을 의미하는 것이다. 따라서, 상기 결과로부터 시료에 포함되어 있는 것은 표적 서열 3이라고 동정할 수 있다. Referring to FIG. 6A, polynucleotides a and polynucleotide b, which are group probes derived from conserved sequence A, are arranged in one column, and each target sequence specific probes derived from conserved sequence B are polynucleotides a 'and b'. , c ', d' and e 'were arranged in different columns to prepare a microarray. Referring to FIG. 6B, hybridization reactions between the probe a and the probe c ′ were detected by performing the target sequence identification method of the present invention using the microarray prepared above. Referring again to FIG. 2, probe a means group I and probe c ′ means target sequence 3. Therefore, what is contained in the sample from the said result can be identified as target sequence 3.

마찬가지로, 도 7A를 참조하면, 보존 서열 A에서 유래된 그룹 프로브인 폴리뉴클레오티드 a 및 폴리뉴클레오티드 b, 및 표적 서열 특이적 프로브인 폴리뉴클레오티드 c를 하나의 칼럼에 배열하고, 보존 서열 B에서 유래된 각 표적 서열 특이적 프로브인 폴리뉴클레오티드 a', b', c', d' 및 e'를 다른 칼럼에 배열하여 마이크로어레이를 제작하였다. 도 7B를 참조하면, 상기에서 제조된 마이크로어레이를 이용하여 본 발명의 표적 서열 동정 방법을 수행한 결과, 프로브 b 및 프로브 d'에 혼성화 반응이 검출되었다. 다시 도 3을 참조하면, 상기 결과로부터 시료에 포함되어 있는 것은 표적 서열 4라고 동정할 수 있다. Similarly, referring to FIG. 7A, polynucleotides a and polynucleotide b, which are group probes derived from conserved sequence A, and polynucleotide c, which are target sequence specific probes, are arranged in one column, and each derived from conserved sequence B Polynucleotides a ', b', c ', d' and e ', which are target sequence specific probes, were arranged in different columns to prepare microarrays. Referring to FIG. 7B, a hybridization reaction was detected between probe b and probe d ′ as a result of performing the target sequence identification method of the present invention using the prepared microarray. Referring back to FIG. 3, it can be identified from the results that the target sequence 4 is included in the sample.

또한, 도 8A를 참조하면, 보존 서열 A에서 유래된 그룹 프로브인 폴리뉴클레오티드 a 및 b를 하나의 칼럼에 배열하고, 보존 서열 B에서 유래된 그룹 프로브 또는 표적 서열 특이적 프로브인 폴리뉴클레오티드 a', b' 및 c'를 다른 칼럼에 배열하고, 보존 서열 C에서 유래된 표적 서열 특이적 프로브인 폴리뉴클레오티드 a", b" 및 c"를 다른 칼럼에 배열하여 마이크로어레이를 제작하였다. 도 8B를 참조하 면, 상기에서 제조된 마이크로어레이를 이용하여 본 발명의 표적 서열 동정 방법을 수행한 결과, 프로브 b, 프로브 c' 및 프로브 a"에 혼성화 반응이 검출되었다. 다시 도 4를 참조하면, 상기 결과로부터 시료에 포함되어 있는 것은 표적 서열 6이라고 동정할 수 있다. 8A, polynucleotides a and b, which are group probes derived from conserved sequence A, are arranged in one column, and polynucleotides a ′, which are group probes or target sequence specific probes derived from conserved sequence B, b 'and c' were arranged in different columns, and target sequences specific probes derived from the conserved sequence C, polynucleotides a ", b" and c ", were arranged in different columns. Microarrays were prepared. When the target sequence identification method of the present invention was performed using the microarray prepared above, hybridization reaction was detected on probe b, probe c ', and probe a ". Referring back to FIG. 4, it can be identified from the results that the target sequence 6 is included in the sample.

또한, 도 9A를 참조하면, 보존 서열 A에서 유래된 그룹 프로브 또는 표적 서열 특이적 프로브인 폴리뉴클레오티드 a, b 및 c를 하나의 칼럼에 배열하고, 보존 서열 B에서 유래된 그룹 프로브 또는 표적 서열 특이적 프로브인 폴리뉴클레오티드 a', b' 및 c'를 다른 칼럼에 배열하고, 보존 서열 C에서 유래된 표적 서열 특이적 프로브인 폴리뉴클레오티드 a" 및 b"를 다른 칼럼에 배열하여 마이크로어레이를 제작하였다. 도 9B를 참조하면, 상기에서 제조된 마이크로어레이를 이용하여 본 발명의 표적 서열 동정 방법을 수행한 결과, 프로브 a, 프로브 a' 및 프로브 b"에 혼성화 반응이 검출되었다. 다시 도 5를 참조하면, 상기 결과로부터 시료에 포함되어 있는 것은 표적 서열 2라고 동정할 수 있다. 9A, polynucleotides a, b and c, which are group probes or target sequence specific probes derived from conserved sequence A, are arranged in one column, and group probes or target sequence specificities derived from conserved sequence B are arranged. Polynucleotides a ', b', and c ', the red probes, were arranged in different columns, and target sequence specific probes polynucleotides a "and b", derived from the conserved sequence C, were arranged in different columns to prepare microarrays. . Referring to FIG. 9B, hybridization reactions to probe a, probe a 'and probe b "were detected by performing the target sequence identification method of the present invention using the prepared microarray. Referring to FIG. From the above results, it can be identified that the target sequence 2 is included in the sample.

본 발명의 또 다른 일면은 본 발명에 따른 프로브 세트 설계 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체에 관한 것이다. Another aspect of the present invention relates to a computer readable medium having recorded thereon a program for allowing a computer to perform the method for designing a probe set according to the present invention.

본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있다. The present invention can be embodied as code that can be read by a computer (including all devices having an information processing function) in a computer-readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of computer-readable recording devices include ROM, RAM, CD-ROM, magnetic tape, floppy disks, optical data storage devices, and the like.

본 발명의 실시예에서는 패혈증 유발과 관련된 박테리아 37종과 혈액 배양시 오염 또는 균혈증(bacteremia) 유발과 관련된 박테리아 34종을 포함하는 총 71종의 박테리아를 대상으로 상기 박테리아들을 동정할 수 있는 프로브 세트를 설계하고자 하였다. 그 결과, 총 64종을 동정할 수 있는, 24개의 그룹 프로브 및 56개의 표적 서열 특이적 프로브의 총 80개로 이루어진 프로브 세트를 설계하였다. In an embodiment of the present invention, a probe set capable of identifying the bacteria may be selected from a total of 71 bacteria including 37 bacteria associated with sepsis and 34 bacteria associated with contamination or bacteremia. Design was made. As a result, a probe set consisting of a total of 80 of 24 group probes and 56 target sequence specific probes was designed that can identify a total of 64 species.

16S rRNA 부위만을 이용하는 기존의 프로브 설계 방법은 각 프로브간 90% 이하의 상동성을 갖도록 설계하는 경우 71종 중 35종을 동정할 수 있었고 80% 이하의 상동성을 갖도록 설계하는 경우 71종 중 12종을 동정할 수 있었다. 하지만, 본 발명은 각 프로브간 80% 이하의 상동성을 갖도록 설계하는 경우에도 64종을 동정할 수 있었다. Conventional probe design method using only 16S rRNA site was able to identify 35 out of 71 species when designed to have 90% or less homology between each probe, and 12 out of 71 when designed to have 80% or less homology. I could identify the species. However, the present invention was able to identify 64 species even when designed to have a homology of 80% or less between each probe.

이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다. Hereinafter, the present invention will be described in more detail with reference to Examples. However, these examples are for illustrative purposes only and the scope of the present invention is not limited to these examples.

실시예 1Example 1

71종의 박테리아를 동정할 수 있는 프로브 세트의 설계Design of a Probe Set That Can Identify 71 Bacteria

본 실시예에서는 표 1과 같은 패혈증 유발과 관련된 박테리아 37종(1~37번)과 혈액 배양시 오염 또는 균혈증(bacteremia) 유발과 관련된 박테리아 34종(38~71번)을 포함하는 총 71종의 박테리아를 대상으로 상기 박테리아들을 동정할 수 있는 프로브 세트를 설계하고자 하였다. In this example, a total of 71 species including 37 bacteria (Nos. 1 to 37) associated with sepsis induction and 34 bacteria (Nos. 38 to 71) associated with contamination or bacteremia induction in blood culture are shown in Table 1. We wanted to design a set of probes that could identify the bacteria in bacteria.

먼저, 상기 71개의 표적 종들의 한 보존 서열인 16S rRNA 부위 서열을 비교하여, 동일 그룹의 폴리뉴클레오티드에 대해서 100%의 상동성 및 다른 그룹의 폴리뉴클레오티드에 대해서 80% 이하의 상동성을 갖고 18~25 bp의 폴리뉴클레오티를 포함하는 그룹들끼리 그룹화하고, 상기 각 폴리뉴클레오티드를 각 그룹의 프로브로 선택하였다. 각 종의 16S rRNA 서열은 균주에 따라 다양할 수 있으며, 공지의 서열 데이터베이스 예컨대, GenBank로부터 용이하게 입수할 수 있다. 그 서열의 예를 표 1에 GenBank 등록번호로 나타내었다. First, 16S rRNA site sequences, one conserved sequence of the 71 target species, were compared to have a homology of 100% for the same group of polynucleotides and 80% or less for the other group of polynucleotides. Groups containing 25 bp of polynucleotides were grouped and each of these polynucleotides was selected as a probe of each group. The 16S rRNA sequences of each species can vary depending on the strain and are readily available from known sequence databases such as GenBank. An example of the sequence is shown in Table 1 by GenBank accession number.

다음으로, 상기 각 그룹의 복수의 종들에 대해 다른 보존 서열인 23S rRNA, sodA, gyrA, groEL 또는 rpoB 부위 서열을 독립적으로 비교하여, 동일 종의 폴리뉴클레오티드에 대해서 100%의 상동성 및 다른 종의 폴리뉴클레오티드에 대해서 80% 이하의 상동성을 갖고 18~25 bp의 폴리뉴클레오티를 포함하는 그룹들끼리 그룹화하였다. 상기 그룹화는 모든 그룹이 하나의 종으로 구성될 때까지 반복 수행하였고, 상기 각 폴리뉴클레오티드를 각 종의 종 특이적 프로브로 선택하였다. 각 종의 상기 보존 서열은 균주에 따라 다양할 수 있으며, 공지의 서열 데이터베이스 예컨대, GenBank로부터 용이하게 입수할 수 있다. Next, independent comparisons of 23S rRNA, sodA, gyrA, groEL or rpoB site sequences, which are different conserved sequences, for a plurality of species in each of the groups above were used to compare 100% homology to other species of polynucleotides of the same species Groups containing 18-25 bp polynucleotides with up to 80% homology to the polynucleotides were grouped together. The grouping was repeated until all groups consisted of one species, with each polynucleotide selected as species specific probe of each species. The conserved sequence of each species can vary depending on the strain and can be readily obtained from known sequence databases such as GenBank.

상기 과정에 의해 설계된 그룹 프로브 및 종 특이적 프로브의 일부 내용을 표 2에 나타내었다. 본 실시예에 의해 그룹 프로브 24개 및 표적 서열 특이적 프로브 56개의 총 80개의 프로브 세트를 설계하였고, 상기 프로브 세트를 사용하면 총 71종의 박테리아 중 패혈증 유발과 관련된 출현 빈도가 낮은 2종(Bacteroides fragilis, Proteus penneri) 및 균혈증(bacteremia) 유발과 관련된 출현 빈도가 낮 은 5종(Enterococcus gallinarum, Lactobacillus fermentum, Propionibacterium acnes, Corynebacterium jeikeium, Aeromonas hydrophila)을 제외한 64종에 대해 동정할 수 있었다. Some contents of the group probes and species specific probes designed by the above procedure are shown in Table 2. In this example, a total of 80 probe sets of 24 group probes and 56 target sequence specific probes were designed, and using these probe sets, two low-frequency occurrences associated with sepsis induction among 71 bacteria were detected ( Bacteroides). frequency of appearance is less related to fragilis, Proteus penneri) and bacteremia (bacteremia) cause could be identified on the 64 kinds other than the five kinds (Enterococcus gallinarum, Lactobacillus fermentum, Propionibacterium acnes, Corynebacterium jeikeium, Aeromonas hydrophila).

<표 1>TABLE 1

번호number 종(species)Species 16S rRNA 부위 서열의 GenBank Accession No.GenBank Accession No. 16S rRNA site sequence 1One 박테로이데스 프라질리스(Bacteroides fragilis) Bacteroides fragilis NC_006347NC_006347 22 클로스트리디움 퍼프린젠스(Clostridium perfringens) Clostridium perfringens AB075767AB075767 33 클라미도필라 뉴모니애(Chlamydophila pneumoniae) Chlamydophila pneumoniae NC_005043NC_005043 44 엔터로박터 에어로제네스(Enterobacter aerogenes) Enterobacter aerogenes AY186054AY186054 55 엔터로코쿠스 아비움(Enterococcus avium) Enterococcus avium AY442814AY442814 66 엔터로코쿠스 카셀리플라부스(Enterococcus casseliflavus) Enterococcus casseliflavus AJ420804AJ420804 77 엔터로박터 클로아캐(Enterobacter cloacae) Enterobacter cloacae AY736548AY736548 88 에스케리키아 콜리(Escherichia coli) Escherichia coli NC_004431NC_004431 99 엔터로코쿠스 두란스(Enterococcus durans) Enterococcus durans AY683836AY683836 1010 엔터로코쿠스 패시움(Enterococcus faecium) Enterococcus faecium AY723748AY723748 1111 엔터로코쿠스 패칼리스(Enterococcus faecalis) Enterococcus faecalis NC_004668NC_004668 1212 엔터로코쿠스 라피노수스(Enterococcus raffinosus) Enterococcus raffinosus AJ301838AJ301838 1313 엔터로박터 사카자키(Enterobacter sakazakii) Enterobacter sakazakii AY702097AY702097 1414 해모필루스 인플루엔재(Haemophilus influenzae) Haemophilus influenzae NC_000907NC_000907 1515 클레브시엘라 옥시토카(Klebsiella oxytoca) Klebsiella oxytoca AJ630270AJ630270 1616 클레브시엘라 뉴모니애(Klebsiella pneumoniae) Klebsiella pneumoniae AY736552AY736552 1717 리스테리아 모노시토제네스(Listeria monocytogenes) Listeria monocytogenes NC_002973NC_002973 1818 미코박테리움 아비움(Mycobacterium avium) Mycobacterium avium X74495X74495 1919 미코박테리움 투베르쿨로시스(Mycobacterium tuberculosis) Mycobacterium tuberculosis AJ536031AJ536031

<표 1(계속)>Table 1 (continued)

번호number 종(species)Species 16S rRNA 부위 서열의 GenBank Accession No.GenBank Accession No. 16S rRNA site sequence 2020 네이세리아 고노르호애(Neisseria gonorrhoeae) Neisseria gonorrhoeae AF398329AF398329 2121 네이세리아 메닌기티디스(Neisseria meningitidis) Neisseria meningitidis AY573194AY573194 2222 슈도모나스 에어루지노사(Pseudomonas aeruginosa)Pseudomonas aeruginosa AY631058AY631058 2323 프로테우스 미라빌리스(Proteus mirabilis) Proteus mirabilis AJ605736AJ605736 2424 프로테우스 페네리(Proteus penneri) Proteus penneri AJ634474AJ634474 2525 프로테우스 불가리스(Proteus vulgaris)Proteus vulgaris (Proteus vulgaris) AY186048AY186048 2626 리케트시아 리케트시(Rickettsia rickettsii) Rickettsia rickettsii AY573599AY573599 2727 스트렙토코쿠스 아갈락티애(Streptococcus agalactiae) Streptococcus agalactiae NC_004116NC_004116 2828 스타필로코쿠스 아우레우스(Staphylococcus aureus) Staphylococcus aureus NC_002952NC_002952 2929 스트렙토코쿠스 보비스(Streptococcus bovis) Streptococcus bovis AY327523AY327523 3030 살모넬라 엔터리티디스(Salmonella enteritidis) Salmonella enteritidis AY186056AY186056 3131 스타필로코쿠스 에피더미디스(Staphylococcus epidermidis) Staphylococcus epidermidis AY728198AY728198 3232 세라티아 마세센스(Serratia marcescens) Serratia Massasesense marcescens ) AY730005AY730005 3333 스트렙토코쿠스 미티스(Streptococcus mitis) Streptococcus mitis AY005045AY005045 3434 스트렙토코쿠스 뉴모니애(Streptococcus pneumoniae) Streptococcus pneumoniae NC_003098NC_003098 3535 스트렙토코쿠스 피오제네스(Streptococcus pyogenes) Streptococcus pyogenes NC_004070NC_004070 3636 살모넬라 티피(Salmonella typhi) Salmonella typhi Z47544Z47544 3737 예르시니아 엔터로콜리티카(Yersinia enterocolitica) Yersinia enterocolitica AJ639645AJ639645

<표 1(계속)>Table 1 (continued)

번호number 종(species)Species 16S rRNA 부위 서열의 GenBank Accession No.GenBank Accession No. 16S rRNA site sequence 3838 아시네토박터 바우마니(Acinetobacter baumannii) Acinetobacter baumannii Z93435Z93435 3939 아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus) Acinetobacter calcoaceticus AY800383AY800383 4040 에어로모나스 히드로필라(Aeromonas hydrophila) Aeromonas hydrophila AB182089AB182089 4141 아시네토박터 로피(Acinetobacter lwoffii) Acinetobacter lwoffii Z93441Z93441 4242 코리네박테리움 디프테리애(Corynebacterium diphtheriae) Corynebacterium diphtheriae BX248357BX248357 4343 시트로박터 프레운디(Citrobacter freundii) Citrobacter freundii AB182200AB182200 4444 카디오박테리움 호미니스(Cardiobacterium hominis) Cardiobacterium hominis AY360343AY360343 4545 코리네박테리움 제이케윰(Corynebacterium jeikeium) Corynebacterium jeikeium X84250X84250 4646 캄필로박터 제주니(Campylobacter jejuni) Campylobacter jejuni AY830883AY830883 4747 엔터로코쿠스 갈리나룸(Enterococcus gallinarum) Enterococcus gallinarum AY346316AY346316 4848 푸소박테리움 누클레아툼(Fusobacterium nucleatum) Fusobacterium nucleatum AJ810282AJ810282 4949 해모필러스 아프로필러스(Haemophilus aphrophilus) Haemophilus aphrophilus AY362906AY362906 5050 해모필러스 파라인플루엔재(Haemophilus parainfluenzae) Haemophilus parainfluenzae AY362908AY362908 5151 락토바실러스 퍼멘텀(Lactobacillus fermentum) Lactobacillus fermentum AJ617543AJ617543 5252 마이크로코쿠스 루테우스(Micorococcus luteus) Micorococcus luteus AB182215AB182215 5353 모가넬라 모가니(Morganella morganii) Morganella morganii AB182240AB182240 5454 프로피오니박테리움 아크네스(Propionibacterium acnes) Propionibacterium acnes ) AF076032AF076032 5555 슈도모나스 플루오레센스(Pseudomonas fluorescens)Pseudomonas fluorescens NC_005043NC_005043 5656 슈도모나스 푸티다(Pseudomanas putida) Pseudomanas putida AY789573AY789573 5757 스타필로코쿠스 카피티스(Staphylococcus capitis) Staphylococcus capitis AY688039AY688039 5858 스타필로코쿠스 코흐니(Staphylococcus cohnii) Staphylococcus cohnii AJ717378AJ717378

<표 1(계속)>Table 1 (continued)

번호number 종(species)Species 16S rRNA 부위 서열의 GenBank Accession No.GenBank Accession No. 16S rRNA site sequence 5959 스타필로코쿠스 해모리티쿠스(Staphylococcus haemolyticus) Staphylococcus haemolyticus AY688062AY688062 6060 스타필로코쿠스 호미니스(Staphylococcus hominis) Staphylococcus hominis AJ717375AJ717375 6161 스트렙토코쿠스 인터메디우스(Streptococcus intermedius) Streptococcus intermedius Z69040Z69040 6262 스테토트로포모나스 말토필리아(Stenotrophomonas maltophilia) Stenotrophomonas maltophilia AY826621AY826621 6363 스트렙토코쿠스 오랄리스(Streptococcus oralis) Streptococcus oralis AY281080AY281080 6464 스트렙토코쿠스 살리바리우스(Streptococcus salivarius) Streptococcus salivarius AY669233AY669233 6565 스트렙토코쿠스 산귀니스(Streptococcus sanguinis) Streptococcus sanguinis AY691542AY691542 6666 스타필로코쿠스 사프로피티쿠스(Staphylococcus saprophyticus) Staphylococcus saprophyticus AY688090AY688090 6767 스타필로코쿠스 시물란스(Staphylococcus simulans) Staphylococcus simulans AY688101AY688101 6868 살모넬라 티피무리움(Salmonella typhimurium)Salmonella typhimurium (Salmonella typhimurium) NC_003197NC_003197 6969 스트렙토코쿠스 베스티불라리스(Streptococcus vestibularis) Streptococcus vestibularis AY581143AY581143 7070 스타필로코쿠스 와네리(Staphylococcus warneri) Staphylococcus warneri AY688106AY688106 7171 스타필로코쿠스 자일로서스(Staphylococcus xylosus) Staphylococcus xylosus AY688109AY688109

<표 2>TABLE 2

그룹group 그룹 프로브 서열Group probe sequence 그룹의 해당 종The corresponding species in the group 종 특이적 프로브 서열Species specific probe sequence I 서열번호 1SEQ ID NO: 1 Cardiobacterium hominisCardiobacterium hominis 서열번호 14SEQ ID NO: 14 IIII 서열번호 2SEQ ID NO: 2 Enterobacter aerogenesEnterobacter aerogenes Escherichia coliEscherichia coli Enterobacter sakazakiiEnterobacter sakazakii Salmonella typhimuriumSalmonella typhimurium Salmonella typhiSalmonella typhi Morganella morganiiMorganella morganii Pseudomonas aeruginosaPseudomonas aeruginosa Proteus mirabilisProteus mirabilis Proteus vulgarisProteus vulgaris Streptococcus intermediusStreptococcus intermedius Salmonella enteritidisSalmonella enteritidis Yersinia enterocoliticaYersinia enterocolitica 서열번호 15 서열번호 16 서열번호 17 서열번호 18 서열번호 19 서열번호 20 서열번호 21 서열번호 22 서열번호 23 서열번호 24 서열번호 25 서열번호 26SEQ ID NO: 15 SEQ ID NO: 16 SEQ ID NO: 17 SEQ ID NO: 18 SEQ ID NO: 19 SEQ ID NO: 20 SEQ ID NO: 21 SEQ ID NO: 22 SEQ ID NO: 23 SEQ ID NO: 24 SEQ ID NO: 25 SEQ ID NO: 26 IIIIII 서열번호 3SEQ ID NO: 3 Pseudomonas fluorescensPseudomonas fluorescens Pseudomonas putidaPseudomonas putida 서열번호 27 서열번호 28SEQ ID NO: 27 SEQ ID NO: 28 IVIV 서열번호 4SEQ ID NO: 4 Acinetobacter baumanniiAcinetobacter baumannii cinetobacter calcoaceticuscinetobacter calcoaceticus Acinetobacter lwoffiiAcinetobacter lwoffii 서열번호 29 서열번호 30 서열번호 31SEQ ID NO: 29 SEQ ID NO: 30 SEQ ID NO: 31 VV 서열번호 5SEQ ID NO: 5 Haemophilus aphrophilusHaemophilus aphrophilus Haemophilus influenzaeHaemophilus influenzae 서열번호 32 서열번호 33SEQ ID NO: 32 SEQ ID NO: 33 VIVI 서열번호 6SEQ ID NO: 6 Enterobacter cloacaeEnterobacter cloacae Klebsiella oxytocaKlebsiella oxytoca 서열번호 34 서열번호 35SEQ ID NO: 34 SEQ ID NO: 35

<표 2(계속)>Table 2 (continued)

그룹group 그룹 프로브 서열Group probe sequence 그룹의 해당 종The corresponding species in the group 종 특이적 프로브 서열Species specific probe sequence VIIVII 서열번호 7SEQ ID NO: 7 AeromonasAeromonas hydrophilahydrophila 서열번호 36SEQ ID NO: 36 VIIIVIII 서열번호 8SEQ ID NO: 8 Mycobacterium Mycobacterium aviumavium ycobacteriumycobacterium tuberculosis tuberculosis 서열번호 37 서열번호 38SEQ ID NO: 37 SEQ ID NO: 38 IXIX 서열번호 9SEQ ID NO: 9 NeisseriaNeisseria gonorrhoeaegonorrhoeae NeisseriaNeisseria meningitides meningitides StenotrophomonasStenotrophomonas maltophiliamaltophilia 서열번호 39 서열번호 40 서열번호 41SEQ ID NO: 39 SEQ ID NO: 40 SEQ ID NO: 41 XX 서열번호 10SEQ ID NO: 10 Streptococcus Streptococcus bovisbovis Streptococcus Streptococcus mitismitis Streptococcus Streptococcus pyogenespyogenes 서열번호 42 서열번호 43 서열번호 44SEQ ID NO: 42 SEQ ID NO: 43 SEQ ID NO: 44 XIXI 서열번호 11SEQ ID NO: 11 Staphylococcus Staphylococcus aureusaureus Staphylococcus Staphylococcus capitiscapitis Staphylococcus Staphylococcus cohniicohnii Staphylococcus Staphylococcus epidermidisepidermidis Staphylococcus Staphylococcus saprophyticussaprophyticus Staphylococcus Staphylococcus haemolyticushaemolyticus Staphylococcus Staphylococcus hominishominis Staphylococcus Staphylococcus simulanssimulans Staphylococcus Staphylococcus warneriwarneri Staphylococcus Staphylococcus xylosusxylosus 서열번호 45 서열번호 46 서열번호 47 서열번호 48 서열번호 49 서열번호 50 서열번호 51 서열번호 52 서열번호 53 서열번호 54SEQ ID NO: 45 SEQ ID NO: 46 SEQ ID NO: 47 SEQ ID NO: 48 SEQ ID NO: 49 SEQ ID NO: 50 SEQ ID NO: 51 SEQ ID NO: 52 SEQ ID NO: 53 SEQ ID NO: 54

<표 2(계속)>Table 2 (continued)

그룹group 그룹 프로브 서열Group probe sequence 그룹의 해당 종The corresponding species in the group 종 특이적 프로브 서열Species specific probe sequence XIIXII 서열번호 12SEQ ID NO: 12 Enterococcus aviumEnterococcus avium Enterococcus duransEnterococcus durans Enterococcus faecalisEnterococcus faecalis Enterococcus raffinosusEnterococcus raffinosus 서열번호 55 서열번호 56 서열번호 57 서열번호 58SEQ ID NO 55 SEQ ID NO 56 SEQ ID NO 57 SEQ ID NO 58 XIIIXIII 서열번호 13SEQ ID NO: 13 Streptococcus mitisStreptococcus mitis Streptococcus pyogenesStreptococcus pyogenes Streptococcus agalactiaeStreptococcus agalactiae Streptococcus oralisStreptococcus oralis Streptococcus pneumoniaeStreptococcus pneumoniae Streptococcus salivariusStreptococcus salivarius Streptococcus sanguinisStreptococcus sanguinis Septococcus vestibularisSeptococcus vestibularis 서열번호 59 서열번호 60 서열번호 61 서열번호 62 서열번호 63 서열번호 64 서열번호 65 서열번호 66SEQ ID NO: 59 SEQ ID NO: 60 SEQ ID NO: 61 SEQ ID NO: 62 SEQ ID NO: 63 SEQ ID NO: 64 SEQ ID NO: 65 SEQ ID NO: 66

본 발명에 따르면, 많은 수의 표적 서열들을 신속하게 동정할 수 있고 2종 이상의 표적 서열이 동시에 출현하더라도 정확하게 동정할 수 있는 프로브 세트를 용이하게 설계할 수 있다. According to the present invention, it is possible to easily design a probe set capable of quickly identifying a large number of target sequences and accurately identifying two or more target sequences simultaneously.

서열목록 전자파일 첨부 Attach sequence list electronic file

Claims (11)

a) 복수의 표적 서열들의 하나의 보존 서열(consensus sequnece)을 비교하여, 상기 하나의 보존 서열에 포함되어 있는 일정 기준을 갖는 폴리뉴클레오티드를 포함하는 표적 서열들끼리 각각 그룹화하는 단계; a) comparing one consensus sequence of a plurality of target sequences and grouping each of the target sequences comprising a polynucleotide having a predetermined criterion included in the one conserved sequence; b) 상기 a) 단계의 그룹들 중 하나의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 표적 서열 특이적 프로브(target sequence specific probe)로 선택하는 단계;b) in the case of a group consisting of a target sequence of one of the groups of step a), selecting an oligonucleotide that specifically binds to the polynucleotide having the predetermined criteria as a target sequence specific probe step; c) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 각 그룹의 그룹 프로브(group probe)로 선택하는 단계; 및 c) in the case of a group consisting of two or more target sequences of the groups of step a), selecting oligonucleotides that specifically bind to the polynucleotide having the predetermined criteria as a group probe of each group; And d) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 2 이상의 표적 서열로 구성된 각 그룹의 복수의 표적 서열들의 다른 보존 서열에 대하여 2 이상의 표적 서열로 구성된 그룹이 존재하지 않을 때까지 상기 a) 단계 내지 c) 단계를 반복하는 단계;를 포함하는 표적 서열의 동정에 사용되는 프로브 세트를 설계하는 방법. d) for a group consisting of two or more target sequences of the groups of step a), there is no group consisting of two or more target sequences for other conserved sequences of a plurality of target sequences of each group consisting of the two or more target sequences Repeating steps a) to c) until none is used. 제 1항에 있어서, The method of claim 1, 상기 일정 기준은 서열 상동성, 염기 길이, 혼성화 융점(Tm), 혼성화 융점 차이(ΔTm), GC 함량, 자기 정렬(self-alignment), 변이 위치, 반복서열 정도 및 3' 말단의 염기 구성으로 이루어진 군에서 선택되는 하나 이상인 것을 특징으로 하는 방법.The schedule consists of sequence homology, base length, hybridization melting point (Tm), hybridization melting point difference (ΔTm), GC content, self-alignment, mutation position, degree of repetition and base configuration of 3 'end. At least one selected from the group. 제 1항에 있어서, The method of claim 1, 상기 일정 기준은 동일 그룹의 폴리뉴클레오티드에 대해서 100%의 상동성 및 다른 그룹의 폴리뉴클레오티드에 대해서 90% 이하의 상동성인 것을 특징으로 하는 방법. Wherein said predetermined criteria is 100% homology with respect to polynucleotides of the same group and 90% homology with respect to another group of polynucleotides. 제 1항에 있어서, 상기 보존 서열은 16S rRNA, 23S rRNA, sodA (superoxide dismutase subunit A), gyrA (DNA gyrase subunit A), groEL (groEL protein coding region) 및 rpoB (DNA-directed RNA polymerase beta chain protein)로 구성된 군에서 선택되는 것을 특징으로 하는 방법.The method of claim 1, wherein the conserved sequence is 16S rRNA, 23S rRNA, superoxide dismutase subunit A (sodA), DNA gyrase subunit A (gyrA), groEL protein coding region (groEL) and DNA-directed RNA polymerase beta chain protein (rpoB) ) Is selected from the group consisting of. 제 1항의 방법에 따라 설계된 프로브 세트.A probe set designed according to the method of claim 1. 제 5항의 프로브 세트가 기판 상에 고정화 되어 있는 것을 특징으로 하는 표적 서열 동정용 마이크로어레이. The probe array of claim 5, wherein the probe set is immobilized on a substrate. 제 6항에 있어서, The method of claim 6, 상기 기판은 아미노-실란(amino-silane), 폴리-L-라이신(poly-L--sine) 및 알데히드(aldehyde)로 이루어진 군에서 선택되는 활성기가 코팅된 것을 특징으로 하는 마이크로어레이.The substrate is a microarray characterized in that the active group selected from the group consisting of amino-silane (amino-silane), poly-L- lysine (poly-L--sine) and aldehyde (aldehyde) is coated. 제 6항에 있어서, The method of claim 6, 상기 기판은 실리콘 웨이퍼, 유리, 석영, 금속 및 플라스틱으로 이루어진 군에서 선택되는 것을 특징으로 하는 마이크로어레이.The substrate is a microarray, characterized in that selected from the group consisting of silicon wafer, glass, quartz, metal and plastic. 제 1항에 따른 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한, ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크 및 광데이터 저장장치로 이루어진 군으로부터 선택된 컴퓨터 판독가능한 매체.A computer-readable medium selected from the group consisting of a ROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, and an optical data storage device having recorded thereon a program which enables a computer to carry out the method according to claim 1. 제 5항의 프로브 세트를 이용하여 표적 서열을 동정하는 방법. A method of identifying a target sequence using the probe set of claim 5. 제 10항에 있어서, The method of claim 10, 상기 방법은 The method is a) 제 6항에 따른 마이크로어레이에 표적 서열을 포함하는 반응 시료를 적용하는 단계; a) applying a reaction sample comprising a target sequence to a microarray according to claim 6; b) 프로브와 표적 서열을 혼성화시키는 단계; b) hybridizing the probe and the target sequence; c) 비특이적 반응을 제거하기 위해 세척하는 단계; 및 c) washing to remove nonspecific reactions; And d) 하이브리드 형성에 의한 형광 시그널을 검출하는 단계;를 포함하는 것을 특징으로 하는 방법. d) detecting a fluorescence signal by hybrid formation.
KR1020060019499A 2005-03-08 2006-02-28 Method for designing probe set probe set designed by the method microarray comprising the probe set and method for identifying target sequence using the probe set KR100745763B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US11/370,433 US20060204995A1 (en) 2005-03-08 2006-03-08 Method of designing probe set, probe set designed by the method, microarray comprising the probe set, computer readable medium recorded thereon program to execute the method, and method of identifying target sequence using the probe set
JP2006062806A JP4813215B2 (en) 2005-03-08 2006-03-08 Probe set design method, probe set designed thereby, microarray including the probe set, computer-readable recording medium recording a program enabling a computer to execute the method, and target sequence using the probe set Identification method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20050019065 2005-03-08
KR1020050019065 2005-03-08

Publications (2)

Publication Number Publication Date
KR20060099407A KR20060099407A (en) 2006-09-19
KR100745763B1 true KR100745763B1 (en) 2007-08-02

Family

ID=37630654

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060019499A KR100745763B1 (en) 2005-03-08 2006-02-28 Method for designing probe set probe set designed by the method microarray comprising the probe set and method for identifying target sequence using the probe set

Country Status (1)

Country Link
KR (1) KR100745763B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050104973A (en) * 2004-04-30 2005-11-03 삼성전자주식회사 A polynucleotide probe having enhanced binding specificity, a microarray having the probe immobilized thereon and a method for designing the probe
KR20060024566A (en) * 2004-09-14 2006-03-17 삼성전자주식회사 Method for designing a probe set, a microarray having a substrate immobilized thereon a probe designed by the method and a computer readable medium recorded thereon a program to execute the method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050104973A (en) * 2004-04-30 2005-11-03 삼성전자주식회사 A polynucleotide probe having enhanced binding specificity, a microarray having the probe immobilized thereon and a method for designing the probe
KR20060024566A (en) * 2004-09-14 2006-03-17 삼성전자주식회사 Method for designing a probe set, a microarray having a substrate immobilized thereon a probe designed by the method and a computer readable medium recorded thereon a program to execute the method

Also Published As

Publication number Publication date
KR20060099407A (en) 2006-09-19

Similar Documents

Publication Publication Date Title
JP7322063B2 (en) Novel primers and uses thereof
EP0395292B1 (en) Generation of specific probes for target nucleotide sequences
US5753467A (en) Method for the identification of microorganisms by the utilization of directed and arbitrary DNA amplification
US5437975A (en) Consensus sequence primed polymerase chain reaction method for fingerprinting genomes
US20090035767A1 (en) Primer for bacterium genome amplification reaction
NZ215605A (en) Preparation of a dna sequence
AU2007271709A1 (en) Identification of pathogens
Giammarinaro et al. Development of a new oligonucleotide array to identify staphylococcal strains at species level
US20100317535A1 (en) Methods and Compositions For Detecting Nucleic Acid Molecules
EP3347497A2 (en) Nucleic acid analysis by joining barcoded polynucleotide probes
Rafalski et al. Technology for molecular breeding: RAPD markers, microsatellites and machines
EP0885310B1 (en) Genetic markers and methods for the detection of escherichia coli serotype-0157:h7
JP2006246888A (en) Method for designing primer-probe set, primer-probe set designed by the same, kit comprising the set, recorded medium readable by computor obtained by recording program for executing the method on computer, and method for identification of target sequence using the same
US5656740A (en) Nucleic acid fragments useful in the detection of Salmonella
US7659388B2 (en) Method and compositions for detecting respiratory disease-causing bacterial species
KR100813263B1 (en) Method of design probes for detecting target sequence and method of detecting target sequence using the probes
EP1634959B1 (en) Method of designing probe set, microarray using it, and computer readable medium with a program for executing the said method.
US20060204995A1 (en) Method of designing probe set, probe set designed by the method, microarray comprising the probe set, computer readable medium recorded thereon program to execute the method, and method of identifying target sequence using the probe set
KR100745763B1 (en) Method for designing probe set probe set designed by the method microarray comprising the probe set and method for identifying target sequence using the probe set
Hinds et al. Glass slide microarrays for bacterial genomes
Apte et al. AlleleID: a pathogen detection and identification system
Arnold 15 Fluorescent Amplified Fragment Length Polymorphism (FAFLP) Genotyping
US20040081975A1 (en) Method for the characterization and/or identification of genomes
Apte et al. A Pathogen Detection and Identification System
MX2008003462A (en) Array of nucleotidic sequences for the detection and identification of genes that codify proteins with activities relevant in biotechnology present in a microbiological sample, and method for using this array.

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120615

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130624

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee