KR20060099407A

KR20060099407A - 프로브 세트를 설계하는 방법, 그에 의하여 설계된 프로브세트, 상기 프로브 세트를 포함하는 마이크로어레이, 및상기 프로브 세트를 이용한 표적 서열의 동정 방법

Info

Publication number: KR20060099407A
Application number: KR1020060019499A
Authority: KR
Inventors: 오지영; 이규상; 권태준
Original assignee: 삼성전자주식회사
Priority date: 2005-03-08
Filing date: 2006-02-28
Publication date: 2006-09-19
Also published as: KR100745763B1

Abstract

본 발명은 혼성화에 의한 표적 서열의 동정에 사용되는 프로브 세트를 설계하는 방법에 관한 것이다. 또한, 본 발명은 상기 방법에 의하여 설계된 프라이머 및 프로브 세트, 상기 프라이머 및 프로브 세트를 포함하는 키트, 상기 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체 및 상기 프라이머 및 프로브 세트를 이용한 표적 서열의 동정 방법에 관한 것이다. 본 발명에 따르면, 많은 수의 표적 서열들을 신속하게 동정할 수 있고 2종 이상의 표적 서열이 동시에 출현하더라도 정확하게 동정할 수 있는 프로브 세트를 용이하게 설계할 수 있다.

프로브, 설계, 표적 서열 동정, 마이크로어레이

Description

프로브 세트를 설계하는 방법, 그에 의하여 설계된 프로브 세트, 상기 프로브 세트를 포함하는 마이크로어레이, 및 상기 프로브 세트를 이용한 표적 서열의 동정 방법{Method for designing probe set, probe set designed by the method, microarray comprising the probe set, and method for identifying target sequence using the probe set}

도 1은 본 발명에 따른 프로브 세트의 설계 방법을 나타내는 흐름도이다.

도 2는 2개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 한 예를 도시한 개략도이다.

도 3은 2개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 다른 예를 도시한 개략도이다.

도 4는 3개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 한 예를 도시한 개략도이다.

5도 5는 3개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 다른 예를 도시한 개략도이다.

도 6은 도 2에 의해 설계된 프로브 세트를 포함하는 마이크로어레이의 스팟팅 배열 및 그를 이용한 표적 서열 동정 방법의 일 예를 도시한 것이다.

도 7은 도 3에 의해 설계된 프로브 세트를 포함하는 마이크로어레이의 스팟팅 배열 및 그를 이용한 표적 서열 동정 방법의 일 예를 도시한 것이다.

도 8은 도 4에 의해 설계된 프로브 세트를 포함하는 마이크로어레이의 스팟팅 배열 및 그를 이용한 표적 서열 동정 방법의 일 예를 도시한 것이다.

도 9는 도 5에 의해 설계된 프로브 세트를 포함하는 마이크로어레이의 스팟팅 배열 및 그를 이용한 표적 서열 동정 방법의 일 예를 도시한 것이다.

본 발명은 표적 서열의 동정에 사용될 수 있는 프로브 세트를 설계하는 방법, 그에 의하여 설계된 프로브 세트, 상기 프로브 세트를 포함하는 마이크로어레이, 상기 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체 및 상기 프로브 세트를 이용한 표적 서열의 동정 방법에 관한 것이다.

마이크로어레이란 기판 상에 폴리뉴클레오티드의 그룹이 높은 밀도로 고정화되어 있는 것으로서, 상기 폴리뉴클레오티드 그룹은 각각 일정한 영역에 고정화되어 있는 마이크로어레이를 의미한다. 이러한 마이크로어레이는 당업계에 잘 알려져 있다. 마이크로어레이에 관하여는 예를 들면, 미국 특허 제 5,445,934호 및 제 5,744,305호에 개시되어 있다. 또한, 상기 마이크로어레이의 제조방법에는 일반적으로 포토리소그래피를 이용하는 방법이 알려져 있다. 포토리소그래피를 이용하는 경우, 제거가능한 기로 보호된 단량체가 도포된 기판 표면 상의 일정한 영역을 에너지 원에 노출시켜 보호기를 제거하고, 제거가능한 기로 보호된 단량체를 커플링 시키는 단계를 반복함으로써, 폴리뉴클레오티드의 마이크로어레이를 제조할 수 있다. 이 경우, 마이크로어레이 상에 고정화되는 폴리뉴클레오티드는 단량체를 하나씩 연장시키는 방식으로 합성된다. 또한, 스팟팅(spotting) 법에 의하는 경우, 마이크로어레이는 이미 합성된 폴리뉴클레오티드를 일정한 위치에 고정화시킴으로써 고정화된다. 이러한 마이크로어레이의 제조방법은 예를 들면, 미국특허 제5,744,305호, 제5,143,854호 및 제5,424,186호에 개시되어 있다. 마이크로어레이 및 그의 제조방법에 관한 상기 문헌은 원용에 의하여 본 명세서에 그 전체로서 포함되어진다.

마이크로어레이에 고정화되는 폴리뉴클레오티드("프로브" 또는 "프로브 핵산" 또는 "프로브 폴리뉴클레오티드"라고도 한다)는 표적 핵산과 특이적으로 혼성화할 수 있어 표적 핵산을 검출 또는 확인하는데 사용되어진다. 종래 프로브 DNA는 각 표적 서열에 대한 프로브 DNA를 선택하기 위한 기준을 설정하고, 상기 기준에 맞는 DNA 서열을 선택한다. 선택된 DNA 서열에 대하여 상기 기준 및 다른 요건을 검정한 다음 가장 바람직한 프로브 서열을 선택하게 된다. 상기 기준에는 프로브의 길이, 프로브의 Tm 값(이중가닥 DNA 분자들 가운데 50%가 2개의 단일가닥으로 해리되는 온도), 및 다른 DNA와 서열 상동성의 한계값 등이 포함되어질 수 있다. 상기 기준에 맞는 후보 프로브 DNA가 선택되면, 상기 후보 프로브 DNA가 표적 서열에만 유니크한 것인지, 교차혼성화를 유도하기 쉬운 서열은 아닌지 등에 대하여 Tm 및 서열 상동성 등을 통하여 조사한다. 이들 표준들을 만족시키는 후보 프로브 DNA 중에서 가장 바람직한 것을 표적 DNA 서열에 특이적으로 결합하는 서열로서 선택하 게 된다. 그러나, 이러한 프로브 세트 설계 방법은 각 표적 서열에 대하여 혼성화하면서 다른 서열에는 교차 혼성화하지 않는 특이적 서열만을 프로브로서 선택하였기 때문에, 표적 서열간의 서열 상동성이 높거나, 동정하고자 하는 표적 서열의 수가 많아지는 경우 특이적 프로브를 설계하기 어려운 문제점이 있었다.

예컨대, 특정 박테리아 군을 구성하는 복수의 박테리아들 중 시료 내에 존재하는 박테리아가 어떤 종인지를 동정하기 위해서 종래에는 상기 복수의 박테리아의 보존 서열(consensus sequence), 특히 16S rRNA 부위를 이용하였다. 즉, 상기 16S rRNA 부위 중 상기 종들에 공통적인 서열은 프라이머로서 사용하고, 각 종들에 유니크한 서열은 프로브로서 사용하였다. 상기 방법은 몇 종의 박테리아를 동정하는데 사용될 수 있지만, 16S rRNA 부위는 고도로 보존되어 있어 10종 이상의 박테리아의 동정에 사용되기에는 어려움이 있다. 예컨대, 패혈증(sepsis)에 관련된 박테리아 37종 및 혈액 배양시 오염 또는 균혈증(bacteremia)에 관련된 박테리아 34종의 총 71종의 경우 16S rRNA 서열 1,002 bp에 있어서, 14종의 서열 상동성이 100%이고, 상기 종들의 97%의 서열 상동성이 70% 이상이고, 상기 71종의 서열 상동성의 평균은 83%로 고도로 보존되어 있다. 따라서, 종래의 방법을 이용하여 상기 71종을 동정하기 위한 프로브를 설계하는 경우, 각 프로브간 80% 이하의 상동성을 갖도록 설계하는 경우 12종을 동정할 수 있는데 불과하다.

또 다른 종 동정을 위한 유전자인 23S rRNA의 경우 서열이 많이 상이하여 16S rRNA를 사용하는 경우 보다 많은 수의 종들을 동정할 수 있다. 하지만, 23S rRNA 서열은 공개되어 있지 않은 경우가 많아, 이의 서열을 확인하는데는 추가의 비용이 발생한다는 문제점이 있다. 예컨대, 상기 71종의 박테리아의 경우 약 2,600 bp의 23S rRNA 서열 중 대략 반 정도 이상의 서열이 공개되어 있는 종의 수는 43종에 불과하다. 상기 23S rRNA 서열을 이용하여 30종의 박테리아를 동정하였다는 보고가 있었지만("Rapid diagnosis of bacteremia by universal amplification of 23S ribosomal DNA followed by hybridization to an oligonucleotide array, JOURNAL OF CLINICAL MICROBIOLOGY, Feb. 2000, pp.781-788), 상기 논문에는 23S rRNA 서열이 공개되어 있지 않을 뿐만 아니라, 여전히 30종 이상을 동정할 수 없다는 문제점이 있다.

요컨대, 기존의 프로브 세트 설계 방법을 이용하여 다수의 종을 식별 가능한 프로브를 설계하는 것은 다음과 같은 한계를 갖는다. 첫째, 다수의 종에 대해 위치가 일치하는 공개된 서열을 확보하는 것이 16S rRNA를 제외하고는 어렵고, 둘째, 16S rRNA의 경우 서열의 보존이 잘 되어 있어 같은 속(genus) 내의 다른 종과 구분을 하기 위한 서열을 발굴하기가 어렵고, 셋째, 종간의 서열이 비교적 상이한 유전자나 게놈상의 특정 위치의 서열의 경우 모든 종에 대해 서열을 확보하기 위해서는 서열을 얻기 위한 별도의 실험을 실시해야 하여 추가 비용이나 개발 기간의 지연 등이 발생하게 된다.

본 발명자들은 상기와 같은 종래의 문제점을 해결하기 위하여 연구를 계속 하던 중, 복수의 표적 서열들의 하나의 보존 서열을 비교하여 상기 복수의 표적 서열들을 그룹화 하고, 상기 그룹들 중 하나의 표적 서열로 구성되는 경우 표적 서열 특이적 프로브를 선택하고, 상기 그룹들 중 둘 이상의 표적 서열로 구성되는 경우 그룹 프로브를 선택하고, 상기 둘 이상의 표적 서열로 구성되는 그룹의 표적 서열들의 다른 보존 서열에 대하여 상기 과정을 반복하면 30개 이상의 표적 서열을 동정할 수 있는 프로브 세트를 설계할 수 있음을 확인함으로써 본 발명을 완성하였다.

본 발명의 목적은 표적 서열의 동정에 사용되는 프로브 세트를 설계하는 방법을 제공하는 것이다.

본 발명의 다른 목적은 상기 방법에 따라 설계된 프로브 세트를 제공하는 것이다.

본 발명의 또 다른 목적은 상기 프로브 세트를 포함하는 마이크로어레이를 제공하는 것이다.

본 발명의 또 다른 목적은 상기 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체를 제공하는 것이다.

본 발명의 또 다른 목적은 상기 프로브 세트를 이용하여 표적 서열을 동정하는 방법을 제공하는 것이다.

본 발명의 목적을 달성하기 위해서, 본 발명은 a) 복수의 표적 서열들의 하나의 보존 서열을 비교하여, 상기 하나의 보존 서열에 포함되어 있는 일정 기준을 갖는 폴리뉴클레오티드를 포함하는 표적 서열들끼리 각각 그룹화하는 단계; b) 상기 a) 단계의 그룹들 중 하나의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 표적 서열 특이적 프로브(target sequence specific probe)로 선택하는 단계; c) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 각 그룹의 그룹 프로브(group probe)로 선택하는 단계; 및 d) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 2 이상의 표적 서열로 구성된 각 그룹의 복수의 표적 서열들의 다른 보존 서열에 대하여 2 이상의 표적 서열로 구성된 그룹이 존재하지 않을 때까지 상기 a) 단계 내지 c) 단계를 반복하는 단계를 포함하는 표적 서열의 동정에 사용되는 프로브 세트를 설계하는 방법을 제공한다.

본 발명에 따른 프로브 세트 설계 방법에 있어서, 상기 일정 기준은 서열 상동성, 염기 길이, 혼성화 융점(Tm), 혼성화 융점 차이(ΔTm), GC 함량, 자기 정렬(self-alignment), 변이 위치, 반복서열 정도 및 3' 말단의 염기 구성으로 이루어진 군에서 선택되는 하나 이상일 수 있다.

본 발명에 따른 프로브 세트 설계 방법에 있어서, 상기 일정 기준은 동일 그룹의 폴리뉴클레오티드에 대해서 100%의 상동성 및 다른 그룹의 폴리뉴클레오티드에 대해서 90% 이하의 상동성인 것이 바람직하다.

본 발명에 따른 프로브 세트 설계 방법에 있어서, 상기 보존 서열은 16S rRNA, 23S rRNA, sodA, gyrA, groEL 및 rpoB로 구성된 군에서 선택될 수 있다.

본 발명의 다른 목적을 달성하기 위해서, 본 발명은 상기 프로브 세트 설계 방법에 따라 설계된 프로브 세트를 제공한다.

본 발명의 또 다른 목적을 달성하기 위해서, 본 발명은 상기 프로브 세트가 기판 상에 고정화 되어 있는 것을 특징으로 하는 표적 서열 동정용 마이크로어레이를 제공한다.

상기 기판은 아미노-실란(amino-silane), 폴리-L-라이신(poly-L-lysine) 및 알데히드(aldehyde)로 이루어진 군에서 선택되는 활성기가 코팅될 수 있다.

또한, 상기 기판은 실리콘 웨이퍼, 유리, 석영, 금속 및 플라스틱으로 이루어진 군에서 선택될 수 있다.

본 발명의 또 다른 목적을 달성하기 위해서, 본 발명은 상기 프로브 세트 설계 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체를 제공한다.

본 발명의 또 다른 목적을 달성하기 위해서, 본 발명은 상기 프로브 세트를 이용하여 표적 서열을 동정하는 방법을 제공한다.

본 발명에 따른 표적 서열 동정 방법은 a) 본 발명에 따른 마이크로어레이에 표적 서열을 포함하는 반응 시료를 적용하는 단계; b) 프로브와 표적 서열을 혼성화시키는 단계; c) 비특이적 반응을 제거하기 위해 세척하는 단계; 및 d) 하이브리드 형성에 의한 형광 시그널을 검출하는 단계를 포함하는 것이 바람직하다.

이하 도면을 참조하여 본 발명을 보다 상세히 설명한다.

본 발명의 일면은 표적 서열 동정용 프로브 세트 설계 방법에 관한 것이다.

도 1은 본 발명에 따른 프로브 세트 설계 방법을 나타내는 흐름도이다.

본 발명에 따른 프로브 세트 설계 방법은 a) 복수의 표적 서열들의 하나의 보 존 서열을 비교하여, 상기 하나의 보존 서열에 포함되어 있는 일정 기준을 갖는 폴리뉴클레오티드를 포함하는 표적 서열들끼리 각각 그룹화하는 단계를 포함한다.

본 명세서에 있어서 "표적 서열(target sequence)"이란 프로브와의 결합에 의하여 동정하기 위해 선택되는 폴리뉴클레오티드를 의미한다. 상기 표적 서열은 게놈 DNA, 제한 효소에 의하여 절단된 DNA 단편, 및 PCR 산물 등을 포함한다. 일반적으로는 게놈 DNA의 특정 영역을 PCR에 의하여 증폭함으로써 얻어지는 게놈 DNA 단편이 많이 사용된다. 본 발명의 방법은 표적 서열이 복수 개인 경우에 적용할 수 있는 프로브 세트를 설계하는 방법이다.

본 명세서에 있어서 "보존 서열(consensus sequence)"이란 해당 표적 서열들 내의 동일한 부위에 위치하는 동일 또는 유사한 염기 서열을 갖는 폴리뉴클레오티드를 의미한다. 상기 보존 서열은 해당 표적 서열들의 어떤 유전자라도 상관 없다. 예컨대, 상기 a) 단계에서 비교되는 보존 서열은 16S rRNA 부위, 23S rRNA 부위, sodA 부위, gyrA 부위, groEL 부위 및 rpoB로 이루어진 군에서 선택되는 어느 하나일 수 있다.

본 발명에 따른 프로브 세트 설계 방법에 있어서, "기준"은 프로브를 선택하는 종래의 통상적인 기준일 수 있다. 즉, 상기 기준은 서열 상동성, 염기 길이, 혼성화 융점(Tm), 혼성화 융점 차이(ΔTm), GC 함량, 자기 정렬(self-alignment), 변이 위치, 반복서열 정도 및 3' 말단의 염기 구성으로 이루어진 군에서 선택되는 하나 이상일 수 있다. 또한, 상기 "일정 기준"은 동일 그룹의 폴리뉴클레오티드에 대해서 100% 및 다른 그룹의 폴리뉴클레오티드에 대해서 90% 이하의 상동성, 18~25 bp의 염기 길이, 72~76℃의 혼성화 융점, 30~70%의 GC 함량, 및 G 또는 C의 3' 말단 염기 구성인 것이 바람직하다.

또한, 본 발명에 따른 프로브 세트 설계 방법은 b) 상기 a) 단계의 그룹들 중 하나의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 표적 서열 특이적 프로브(target sequence specific probe)로 선택하는 단계를 포함한다.

본 발명에 있어서, 프로브의 선택은 상기의 기준에 따라 종래 알려진 방법을 이용하여 결정될 수 있다. 즉, 프로브 DNA를 선택하기 위한 기준을 설정하고, 상기 기준에 맞는 DNA 서열을 선택하고, 선택된 DNA 서열에 대하여 상기 기준 및 다른 요건을 검정한 다음 가장 바람직한 서열을 프로브 DNA로서 선택하게 된다. 상기 기준에 맞는 후보 프로브 DNA가 선택되면, 상기 기준을 만족시키는 후보 프로브 DNA 중에서 가장 바람직한 것을 표적 DNA 서열에 특이적으로 결합하는 프로브 서열로서 선택하게 된다. 상기 프로브 DNA는 표적 DNA에 대하여 특이적으로 결합할 수 있는 것이면 하나의 표적 DNA에 대하여 2 이상의 프로브 DNA가 선택될 수도 있다.

또한, 본 발명에 따른 프로브 세트 설계 방법은 c) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 각 그룹의 그룹 프로브(group probe)로 선택하는 단계를 포함한다.

또한, 본 발명에 따른 프로브 세트 설계 방법은 d) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 2 이상의 표적 서열로 구성된 각 그룹의 복수의 표적 서열들의 다른 보존 서열에 대하여 2 이상의 표적 서열로 구성된 그룹이 존재하지 않을 때까지 상기 a) 단계 내지 c) 단계를 반복하는 단계를 포함한다.

상기 다른 보존 서열은 상기 2 이상의 표적 서열들로 구성된 각 그룹의 복수의 표적 서열들의 어떤 유전자라도 상관 없다. 상기 d) 단계에서 비교되는 다른 보존 서열은 상기 a) 단계에서 비교된 하나의 보존 서열을 제외한 보존 서열들로부터 선택되는 어느 하나일 수 있다. 예컨대, 상기 a) 단계에서 16S rRNA 부위가 비교된 경우, d) 단계의 다른 보존 서열은 23S rRNA 부위, sodA 부위, gyrA 부위, groEL 부위 및 rpoB로 이루어진 군에서 선택되는 어느 하나일 수 있다. 또한, 각 그룹에서 비교되는 보존 서열은 반드시 동일할 필요가 없다. 예컨대, 상기 a) 단계에서 16S rRNA 부위가 비교된 경우, d) 단계에서 하나의 그룹은 23S rRNA 부위가 비교되고 다른 그룹은 sodA 부위가 비교될 수 있다.

본 단계는 2 이상의 표적 서열로 구성된 그룹이 존재하지 않을 때까지, 즉 모든 그룹이 하나의 표적 서열로 구성되고 각 그룹의 각 하나의 표적 서열에 대해 표적 서열 특이적 프로브를 선택할 때까지 반복된다.

상기한 과정에 의하여 얻어지는 복수의 그룹 프로브 및 표적 서열 특이적 프로브는 상기 복수의 표적 서열들을 동정에 사용하기 위한 프로브 세트로서 선택된다.

이해를 돕기 위하여 본 예에서는 6개의 표적 서열을 사용하였지만, 그의 수에 제한되는 것은 아니며, 오히려 그의 수가 증가할 수록 본 발명은 보다 강력함을 당업자는 용이하게 이해할 수 있을 것이다.

도 2를 참조하면, 6개의 표적 서열들의 보존 서열 A를 비교하여, 폴리뉴클레오티드 a를 포함하는 표적 서열들인 표적 서열 1, 표적 서열 2 및 표적 서열 3을 그룹 I로 그룹화하고, 폴리뉴클레오티드 b를 포함하는 표적 서열들인 표적 서열 4, 표적 서열 5 및 표적 서열 6을 그룹 II로 그룹화한다. 상기 그룹 I 및 그룹 II가 모두 2개 이상의 표적 서열로 구성되어 있기 때문에, 상기 폴리뉴클레오티드 a 및 폴리뉴클레오티드 b를 각각 그룹 I 및 그룹 II의 그룹 프로브로 선택한다.

이후 상기 그룹 I 및 그룹 II 각각의 복수의 표적 서열들의 다른 보존 서열을 비교한다. 이 단계는 각 그룹에 대해서 독립적으로 수행되는 것이므로, 각 그룹에 대해 상이한 보존 서열을 사용할 수도 있다. 예컨대, 그룹 I에 대해서는 보존 서열 B를 비교하고, 그룹 II에 대해서는 보존 서열 C를 비교할 수 있다. 다시 도 2를 참조하면, 그룹 I의 표적 서열 1, 표적 서열 2 및 표적 서열 3의 보존 서열 B를 비교하여, 폴리뉴클레오티드 a'를 포함하는 표적 서열 1을 그룹 I-1, 폴리뉴클레오티드 b'를 포함하는 표적 서열 2를 그룹 I-2 및 폴리뉴클레오티드 c'를 포함하는 표적 서열 3을 그룹 I-3으로 그룹화한다. 또한, 그룹 II의 표적 서열 4, 표적 서열 5 및 표적 서열 6의 보존 서열 B를 비교하여, 폴리뉴클레오티드 d'를 포함하는 표적 서열 4를 그룹 II-1, 폴리뉴클레오티드 e'를 포함하는 표적 서열 5를 그룹 II-2 및 폴리뉴클레오티드 c'를 포함하는 표적 서열 6을 그룹 II-3으로 그룹화한 다. 상기 각 그룹들은 모두 하나의 표적 서열로 구성되어 있으므로, 상기 폴리뉴클레오티드 a', 폴리뉴클레오티드 b', 폴리뉴클레오티드 c', 폴리뉴클레오티드 d' 및 폴리뉴클레오티드 e'를 표적 서열 특이적 프로브로 선택한다.

상기 예의 표적서열 3 및 표적서열 6과 같이 2개의 표적 서열의 그룹 프로브가 상이한 경우, 그들의 표적 서열 특이적 프로브는 동일할 수도 있다.

도 3을 참조하면, 6개의 표적 서열들의 보존 서열 A를 비교하여, 폴리뉴클레오티드 a를 포함하는 표적 서열 1 및 표적 서열 2를 그룹 I로 그룹화하고, 폴리뉴클레오티드 b를 포함하는 표적 서열 3, 표적 서열 4 및 표적 서열 5를 그룹 II로 그룹화하고, 폴리뉴클레오티드 c를 포함하는 표적 서열 6을 그룹 III으로 그룹화한다. 상기 그룹 III은 하나의 표적 서열로 구성되어 있기 때문에 상기 폴리뉴클레오티드 c를 표적 서열 6의 표적 서열 특이적 프로브로 선택한다. 한편, 상기 그룹 I 및 그룹 II는 2개 이상의 표적 서열로 구성되어 있기 때문에, 상기 폴리뉴클레오티드 a 및 폴리뉴클레오티드 b를 각각 그룹 I 및 그룹 II의 그룹 프로브로 선택한다. 다음으로, 그룹 I의 표적 서열 1 및 표적 서열 2의 보존 서열 B를 비교하여, 폴리뉴클레오티드 a'를 포함하는 표적 서열 1을 그룹 I-1, 폴리뉴클레오티드 b'를 포함하는 표적 서열 2를 그룹 I-2로 그룹화한다. 상기 각 그룹은 하나의 표적 서열로 구성되어 있으므로, 상기 폴리뉴클레오티드 a' 및 b'를 표적 서열 1 및 2의 표적 서열 특이적 프로브로 선택한다. 마찬가지로, 그룹 II의 표적 서열 3, 표적 서열 4 및 표적 서열 5의 보존 서열 B를 비교하여, 폴리뉴클레오티드 c'를 포함하는 표적 서열 3을 그룹 II-1, 폴리뉴클레오티드 d'를 포함하는 표적 서열 4를 그룹 II-2 및 e'를 포함하는 표적 서열 5를 그룹 II-3으로 그룹화한다. 상기 각 그룹은 하나의 표적 서열로 구성되어 있으므로, 상기 폴리뉴클레오티드 c', d' 및 e'를 표적 서열 3, 4 및 5의 표적 서열 특이적 프로브로 선택한다.

도 4는 3개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 한 예를 도시한 개략도이고, 도 5는 3개의 보존서열을 이용한 본 발명의 프로브 세트 설계 방법의 다른 예를 도시한 개략도이다.

도 4 및 도 5를 참조하면, 상기 예에서와 같이 2개의 보존 서열을 비교한 후에도 하나 이상의 그룹이 2개 이상의 표적 서열로 구성되어 있는 경우, 상기 2개 이상의 표적 서열로 구성된 그룹에 대해 다시 다른 보존 서열을 비교할 수 있다. 구체적인 방법은 상기에서 설명한 바와 동일하다. 도 4 및 도 5에서는 3개의 보존 서열을 이용하였지만, 동정하고자 하는 표적 서열의 범위가 매우 많은 경우, 4개 이상의 보존 서열을 이용할 수도 있다.

본 발명의 다른 일면은 본 발명의 프로브 세트 설계 방법에 따라 설계된 프로브 세트에 관한 것이다.

본 발명의 또 다른 일면은 상기 프로브 세트가 기판 상에 고정화 되어 있는 것을 특징으로 하는 마이크로어레이에 관한 것이다.

본 발명에 따른 마이크로어레이는 본 발명에 따른 프로브 세트를 이용하여 본 분야의 당업자에게 알려져 있는 통상적인 방법에 의해 제조될 수 있다.

즉, 상기 기판은 아미노-실란(amino-silane), 폴리-L-라이신(poly-L-lysine) 및 알데히드(aldehyde)로 이루어진 군에서 선택되는 활성기가 코팅될 수 있다. 또한, 상기 기판은 실리콘 웨이퍼, 유리, 석영, 금속 및 플라스틱으로 이루어진 군에서 선택될 수 있다. 본 발명에 따른 프로브 세트를 기판에 고정화시키는 방법으로는 파이조일렉트릭(piezoelectric) 방식을 이용한 마이크로피펫팅(micropipetting) 법, 핀(pin) 형태의 스팟터(spotter)를 이용한 방법 등을 사용할 수 있다.

본 발명의 또 다른 일면은 상기 프로브 세트를 이용하여 표적 서열을 동정하는 방법에 관한 것이다. 상기 동정 방법은 상기 마이크로어레이를 이용하여 수행되는 것이 바람직하다. 즉, 본 발명에 따른 표적 서열 동정 방법은 a) 본 발명에 따른 마이크로어레이에 표적 서열을 포함하는 반응 시료를 적용하는 단계; b) 프로브와 표적 서열을 혼성화시키는 단계; c) 비특이적 반응을 제거하기 위해 세척하는 단계; 및 d) 하이브리드 형성에 의한 형광 시그널을 검출하는 단계를 포함하는 것이 바람직하다.

도 6 내지 도 9는 각각 도 2 내지 도 5에 의해 설계된 프로브 세트를 포함하는 마이크로어레이의 스팟팅 배열 및 그를 이용한 표적 서열 동정 방법의 일 예를 도시한 것이다.

본 발명에 따른 마이크로어레이에 있어서 프로브 세트는 도 6 내지 도 9에서와 같이, 그가 유래된 보존 서열별로 스팟팅될 수 있지만, 특정 스팟팅 배열에 특별히 한정되는 것은 아니다.

도 6A를 참조하면, 보존 서열 A에서 유래된 그룹 프로브인 폴리뉴클레오티드 a 및 폴리뉴클레오티드 b를 하나의 칼럼에 배열하고, 보존 서열 B에서 유래된 각 표적 서열 특이적 프로브인 폴리뉴클레오티드 a', b', c', d' 및 e'를 다른 칼럼에 배열하여 마이크로어레이를 제작하였다. 도 6B를 참조하면, 상기에서 제조된 마이크로어레이를 이용하여 본 발명의 표적 서열 동정 방법을 수행한 결과, 프로브 a 및 프로브 c'에 혼성화 반응이 검출되었다. 다시 도 2를 참조하면, 프로브 a는 그룹 I을 의미하고, 프로브 c'는 그 중 표적 서열 3을 의미하는 것이다. 따라서, 상기 결과로부터 시료에 포함되어 있는 것은 표적 서열 3이라고 동정할 수 있다.

마찬가지로, 도 7A를 참조하면, 보존 서열 A에서 유래된 그룹 프로브인 폴리뉴클레오티드 a 및 폴리뉴클레오티드 b, 및 표적 서열 특이적 프로브인 폴리뉴클레오티드 c를 하나의 칼럼에 배열하고, 보존 서열 B에서 유래된 각 표적 서열 특이적 프로브인 폴리뉴클레오티드 a', b', c', d' 및 e'를 다른 칼럼에 배열하여 마이크로어레이를 제작하였다. 도 7B를 참조하면, 상기에서 제조된 마이크로어레이를 이용하여 본 발명의 표적 서열 동정 방법을 수행한 결과, 프로브 b 및 프로브 d'에 혼성화 반응이 검출되었다. 다시 도 3을 참조하면, 상기 결과로부터 시료에 포함되어 있는 것은 표적 서열 4라고 동정할 수 있다.

또한, 도 8A를 참조하면, 보존 서열 A에서 유래된 그룹 프로브인 폴리뉴클레오티드 a 및 b를 하나의 칼럼에 배열하고, 보존 서열 B에서 유래된 그룹 프로브 또는 표적 서열 특이적 프로브인 폴리뉴클레오티드 a', b' 및 c'를 다른 칼럼에 배열하고, 보존 서열 C에서 유래된 표적 서열 특이적 프로브인 폴리뉴클레오티드 a", b" 및 c"를 다른 칼럼에 배열하여 마이크로어레이를 제작하였다. 도 8B를 참조하 면, 상기에서 제조된 마이크로어레이를 이용하여 본 발명의 표적 서열 동정 방법을 수행한 결과, 프로브 b, 프로브 c' 및 프로브 a"에 혼성화 반응이 검출되었다. 다시 도 4를 참조하면, 상기 결과로부터 시료에 포함되어 있는 것은 표적 서열 6이라고 동정할 수 있다.

또한, 도 9A를 참조하면, 보존 서열 A에서 유래된 그룹 프로브 또는 표적 서열 특이적 프로브인 폴리뉴클레오티드 a, b 및 c를 하나의 칼럼에 배열하고, 보존 서열 B에서 유래된 그룹 프로브 또는 표적 서열 특이적 프로브인 폴리뉴클레오티드 a', b' 및 c'를 다른 칼럼에 배열하고, 보존 서열 C에서 유래된 표적 서열 특이적 프로브인 폴리뉴클레오티드 a" 및 b"를 다른 칼럼에 배열하여 마이크로어레이를 제작하였다. 도 9B를 참조하면, 상기에서 제조된 마이크로어레이를 이용하여 본 발명의 표적 서열 동정 방법을 수행한 결과, 프로브 a, 프로브 a' 및 프로브 b"에 혼성화 반응이 검출되었다. 다시 도 5를 참조하면, 상기 결과로부터 시료에 포함되어 있는 것은 표적 서열 2라고 동정할 수 있다.

본 발명의 또 다른 일면은 본 발명에 따른 프로브 세트 설계 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체에 관한 것이다.

본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있다.

본 발명의 실시예에서는 패혈증 유발과 관련된 박테리아 37종과 혈액 배양시 오염 또는 균혈증(bacteremia) 유발과 관련된 박테리아 34종을 포함하는 총 71종의 박테리아를 대상으로 상기 박테리아들을 동정할 수 있는 프로브 세트를 설계하고자 하였다. 그 결과, 총 64종을 동정할 수 있는, 24개의 그룹 프로브 및 56개의 표적 서열 특이적 프로브의 총 80개로 이루어진 프로브 세트를 설계하였다.

16S rRNA 부위만을 이용하는 기존의 프로브 설계 방법은 각 프로브간 90% 이하의 상동성을 갖도록 설계하는 경우 71종 중 35종을 동정할 수 있었고 80% 이하의 상동성을 갖도록 설계하는 경우 71종 중 12종을 동정할 수 있었다. 하지만, 본 발명은 각 프로브간 80% 이하의 상동성을 갖도록 설계하는 경우에도 64종을 동정할 수 있었다.

이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.

실시예 1

71종의 박테리아를 동정할 수 있는 프로브 세트의 설계

본 실시예에서는 표 1과 같은 패혈증 유발과 관련된 박테리아 37종(1~37번)과 혈액 배양시 오염 또는 균혈증(bacteremia) 유발과 관련된 박테리아 34종(38~71번)을 포함하는 총 71종의 박테리아를 대상으로 상기 박테리아들을 동정할 수 있는 프로브 세트를 설계하고자 하였다.

먼저, 상기 71개의 표적 종들의 한 보존 서열인 16S rRNA 부위 서열을 비교하여, 동일 그룹의 폴리뉴클레오티드에 대해서 100%의 상동성 및 다른 그룹의 폴리뉴클레오티드에 대해서 80% 이하의 상동성을 갖고 18~25 bp의 폴리뉴클레오티를 포함하는 그룹들끼리 그룹화하고, 상기 각 폴리뉴클레오티드를 각 그룹의 프로브로 선택하였다. 각 종의 16S rRNA 서열은 균주에 따라 다양할 수 있으며, 공지의 서열 데이터베이스 예컨대, GenBank로부터 용이하게 입수할 수 있다. 그 서열의 예를 표 1에 GenBank 등록번호로 나타내었다.

다음으로, 상기 각 그룹의 복수의 종들에 대해 다른 보존 서열인 23S rRNA, sodA, gyrA, groEL 또는 rpoB 부위 서열을 독립적으로 비교하여, 동일 종의 폴리뉴클레오티드에 대해서 100%의 상동성 및 다른 종의 폴리뉴클레오티드에 대해서 80% 이하의 상동성을 갖고 18~25 bp의 폴리뉴클레오티를 포함하는 그룹들끼리 그룹화하였다. 상기 그룹화는 모든 그룹이 하나의 종으로 구성될 때까지 반복 수행하였고, 상기 각 폴리뉴클레오티드를 각 종의 종 특이적 프로브로 선택하였다. 각 종의 상기 보존 서열은 균주에 따라 다양할 수 있으며, 공지의 서열 데이터베이스 예컨대, GenBank로부터 용이하게 입수할 수 있다.

상기 과정에 의해 설계된 그룹 프로브 및 종 특이적 프로브의 일부 내용을 표 2에 나타내었다. 본 실시예에 의해 그룹 프로브 24개 및 표적 서열 특이적 프로브 56개의 총 80개의 프로브 세트를 설계하였고, 상기 프로브 세트를 사용하면 총 71종의 박테리아 중 패혈증 유발과 관련된 출현 빈도가 낮은 2종(Bacteroides fragilis, Proteus penneri) 및 균혈증(bacteremia) 유발과 관련된 출현 빈도가 낮 은 5종(Enterococcus gallinarum, Lactobacillus fermentum, Propionibacterium acnes, Corynebacterium jeikeium, Aeromonas hydrophila)을 제외한 64종에 대해 동정할 수 있었다.

<표 1>

번호	종(species)	16S rRNA 부위 서열의 GenBank Accession No.
1	박테로이데스 프라질리스(Bacteroides fragilis)	NC_006347
2	클로스트리디움 퍼프린젠스(Clostridium perfringens)	AB075767
3	클라미도필라 뉴모니애(Chlamydophila pneumoniae)	NC_005043
4	엔터로박터 에어로제네스(Enterobacter aerogenes)	AY186054
5	엔터로코쿠스 아비움(Enterococcus avium)	AY442814
6	엔터로코쿠스 카셀리플라부스(Enterococcus casseliflavus)	AJ420804
7	엔터로박터 클로아캐(Enterobacter cloacae)	AY736548
8	에스케리키아 콜리(Escherichia coli)	NC_004431
9	엔터로코쿠스 두란스(Enterococcus durans)	AY683836
10	엔터로코쿠스 패시움(Enterococcus faecium)	AY723748
11	엔터로코쿠스 패칼리스(Enterococcus faecalis)	NC_004668
12	엔터로코쿠스 라피노수스(Enterococcus raffinosus)	AJ301838
13	엔터로박터 사카자키(Enterobacter sakazakii)	AY702097
14	해모필루스 인플루엔재(Haemophilus influenzae)	NC_000907
15	클레브시엘라 옥시토카(Klebsiella oxytoca)	AJ630270
16	클레브시엘라 뉴모니애(Klebsiella pneumoniae)	AY736552
17	리스테리아 모노시토제네스(Listeria monocytogenes)	NC_002973
18	미코박테리움 아비움(Mycobacterium avium)	X74495
19	미코박테리움 투베르쿨로시스(Mycobacterium tuberculosis)	AJ536031

<표 1(계속)>

번호	종(species)	16S rRNA 부위 서열의 GenBank Accession No.
20	네이세리아 고노르호애(Neisseria gonorrhoeae)	AF398329
21	네이세리아 메닌기티디스(Neisseria meningitidis)	AY573194
22	슈도모나스 에어루지노사(Pseudomonas aeruginosa)	AY631058
23	프로테우스 미라빌리스(Proteus mirabilis)	AJ605736
24	프로테우스 페네리(Proteus penneri)	AJ634474
25	프로테우스 불가리스(Proteus vulgaris)	AY186048
26	리케트시아 리케트시(Rickettsia rickettsii)	AY573599
27	스트렙토코쿠스 아갈락티애(Streptococcus agalactiae)	NC_004116
28	스타필로코쿠스 아우레우스(Staphylococcus aureus)	NC_002952
29	스트렙토코쿠스 보비스(Streptococcus bovis)	AY327523
30	살모넬라 엔터리티디스(Salmonella enteritidis)	AY186056
31	스타필로코쿠스 에피더미디스(Staphylococcus epidermidis)	AY728198
32	세라티아 마세센스(Serratia marcescens)	AY730005
33	스트렙토코쿠스 미티스(Streptococcus mitis)	AY005045
34	스트렙토코쿠스 뉴모니애(Streptococcus pneumoniae)	NC_003098
35	스트렙토코쿠스 피오제네스(Streptococcus pyogenes)	NC_004070
36	살모넬라 티피(Salmonella typhi)	Z47544
37	예르시니아 엔터로콜리티카(Yersinia enterocolitica)	AJ639645

<표 1(계속)>

번호	종(species)	16S rRNA 부위 서열의 GenBank Accession No.
38	아시네토박터 바우마니(Acinetobacter baumannii)	Z93435
39	아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus)	AY800383
40	에어로모나스 히드로필라(Aeromonas hydrophila)	AB182089
41	아시네토박터 로피(Acinetobacter lwoffii)	Z93441
42	코리네박테리움 디프테리애(Corynebacterium diphtheriae)	BX248357
43	시트로박터 프레운디(Citrobacter freundii)	AB182200
44	카디오박테리움 호미니스(Cardiobacterium hominis)	AY360343
45	코리네박테리움 제이케윰(Corynebacterium jeikeium)	X84250
46	캄필로박터 제주니(Campylobacter jejuni)	AY830883
47	엔터로코쿠스 갈리나룸(Enterococcus gallinarum)	AY346316
48	푸소박테리움 누클레아툼(Fusobacterium nucleatum)	AJ810282
49	해모필러스 아프로필러스(Haemophilus aphrophilus)	AY362906
50	해모필러스 파라인플루엔재(Haemophilus parainfluenzae)	AY362908
51	락토바실러스 퍼멘텀(Lactobacillus fermentum)	AJ617543
52	마이크로코쿠스 루테우스(Micorococcus luteus)	AB182215
53	모가넬라 모가니(Morganella morganii)	AB182240
54	프로피오니박테리움 아크네스(Propionibacterium acnes)	AF076032
55	슈도모나스 플루오레센스(Pseudomonas fluorescens)	NC_005043
56	슈도모나스 푸티다(Pseudomanas putida)	AY789573
57	스타필로코쿠스 카피티스(Staphylococcus capitis)	AY688039
58	스타필로코쿠스 코흐니(Staphylococcus cohnii)	AJ717378

<표 1(계속)>

번호	종(species)	16S rRNA 부위 서열의 GenBank Accession No.
59	스타필로코쿠스 해모리티쿠스(Staphylococcus haemolyticus)	AY688062
60	스타필로코쿠스 호미니스(Staphylococcus hominis)	AJ717375
61	스트렙토코쿠스 인터메디우스(Streptococcus intermedius)	Z69040
62	스테토트로포모나스 말토필리아(Stenotrophomonas maltophilia)	AY826621
63	스트렙토코쿠스 오랄리스(Streptococcus oralis)	AY281080
64	스트렙토코쿠스 살리바리우스(Streptococcus salivarius)	AY669233
65	스트렙토코쿠스 산귀니스(Streptococcus sanguinis)	AY691542
66	스타필로코쿠스 사프로피티쿠스(Staphylococcus saprophyticus)	AY688090
67	스타필로코쿠스 시물란스(Staphylococcus simulans)	AY688101
68	살모넬라 티피무리움(Salmonella typhimurium)	NC_003197
69	스트렙토코쿠스 베스티불라리스(Streptococcus vestibularis)	AY581143
70	스타필로코쿠스 와네리(Staphylococcus warneri)	AY688106
71	스타필로코쿠스 자일로서스(Staphylococcus xylosus)	AY688109

<표 2>

그룹	그룹 프로브 서열	그룹의 해당 종	종 특이적 프로브 서열
Ⅰ	서열번호 1	Cardiobacterium hominis	서열번호 14
II	서열번호 2	Enterobacter aerogenes Escherichia coli Enterobacter sakazakii Salmonella typhimurium Salmonella typhi Morganella morganii Pseudomonas aeruginosa Proteus mirabilis Proteus vulgaris Streptococcus intermedius Salmonella enteritidis Yersinia enterocolitica	서열번호 15 서열번호 16 서열번호 17 서열번호 18 서열번호 19 서열번호 20 서열번호 21 서열번호 22 서열번호 23 서열번호 24 서열번호 25 서열번호 26
III	서열번호 3	Pseudomonas fluorescens Pseudomonas putida	서열번호 27 서열번호 28
IV	서열번호 4	Acinetobacter baumannii cinetobacter calcoaceticus Acinetobacter lwoffii	서열번호 29 서열번호 30 서열번호 31
V	서열번호 5	Haemophilus aphrophilus Haemophilus influenzae	서열번호 32 서열번호 33
VI	서열번호 6	Enterobacter cloacae Klebsiella oxytoca	서열번호 34 서열번호 35

<표 2(계속)>

그룹	그룹 프로브 서열	그룹의 해당 종	종 특이적 프로브 서열
VII	서열번호 7	Aeromonas hydrophila	서열번호 36
VIII	서열번호 8	Mycobacterium avium ycobacterium tuberculosis	서열번호 37 서열번호 38
IX	서열번호 9	Neisseria gonorrhoeae Neisseria meningitides Stenotrophomonas maltophilia	서열번호 39 서열번호 40 서열번호 41
X	서열번호 10	Streptococcus bovis Streptococcus mitis Streptococcus pyogenes	서열번호 42 서열번호 43 서열번호 44
XI	서열번호 11	Staphylococcus aureus Staphylococcus capitis Staphylococcus cohnii Staphylococcus epidermidis Staphylococcus saprophyticus Staphylococcus haemolyticus Staphylococcus hominis Staphylococcus simulans Staphylococcus warneri Staphylococcus xylosus	서열번호 45 서열번호 46 서열번호 47 서열번호 48 서열번호 49 서열번호 50 서열번호 51 서열번호 52 서열번호 53 서열번호 54

<표 2(계속)>

그룹	그룹 프로브 서열	그룹의 해당 종	종 특이적 프로브 서열
XII	서열번호 12	Enterococcus avium Enterococcus durans Enterococcus faecalis Enterococcus raffinosus	서열번호 55 서열번호 56 서열번호 57 서열번호 58
XIII	서열번호 13	Streptococcus mitis Streptococcus pyogenes Streptococcus agalactiae Streptococcus oralis Streptococcus pneumoniae Streptococcus salivarius Streptococcus sanguinis Septococcus vestibularis	서열번호 59 서열번호 60 서열번호 61 서열번호 62 서열번호 63 서열번호 64 서열번호 65 서열번호 66

본 발명에 따르면, 많은 수의 표적 서열들을 신속하게 동정할 수 있고 2종 이상의 표적 서열이 동시에 출현하더라도 정확하게 동정할 수 있는 프로브 세트를 용이하게 설계할 수 있다.

<110> SAMSUNG ELECTRONICS CO., LTD. <120> Method for designing probe set, probe set designed by the method, microarray comprising the probe set, computer readable medium recorded thereon a program to execute the method, and method for identifying target sequence using the probe set <130> PN067799 <160> 66 <170> KopatentIn 1.71 <210> 1 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 1 tgaaagagga aagcggaatt tcca 24 <210> 2 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 2 gtagaggggg gtagaattcc a 21 <210> 3 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 3 agagggtggt ggaatttcct g 21 <210> 4 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 4 gtatgggaga ggatggtaga attcc 25 <210> 5 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 5 gcagcccctt gggaatgta 19 <210> 6 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 6 ggtctgtcaa gtcggatgtg aaa 23 <210> 7 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 7 agggctgcaa gctagcgata g 21 <210> 8 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 8 acatgcacag gacgcgtct 19 <210> 9 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 9 aacacaggtg ctgcatggc 19 <210> 10 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 10 cttgacatcc cgatgcccg 19 <210> 11 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 11 tctgcaactc gactacatga agct 24 <210> 12 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 12 gtcgcgaggc taagctaatc tct 23 <210> 13 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 13 ggtgacggca agctaatctc tt 22 <210> 14 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 14 tcgacacact atcattaacg tgat 24 <210> 15 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 15 gttacagccg gcgatgtcc 19 <210> 16 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 16 acccagtgtg wttcgwcac 19 <210> 17 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 17 acttcggtgc atcatcgtta g 21 <210> 18 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 18 gcgtgtaggt gtgtgttcc 19 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 19 ccggtttaag cgtgtaggta 20 <210> 20 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 20 cctgaataca tagggtaatg aa 22 <210> 21 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 21 caaacagact ttgatccgga gat 23 <210> 22 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 22 acccggtatc caatggatac ta 22 <210> 23 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 23 catgacgtga atacatagcg tca 23 <210> 24 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 24 agcagtaagg tgtgatatga gtca 24 <210> 25 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 25 cccagtgtga ttcgtcaca 19 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 26 tccggttgct tatcaacgct 20 <210> 27 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 27 cgcacaagcg gtggagcat 19 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 28 cgcacaagcg tggagcatgt 20 <210> 29 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 29 gcgaagtggt tgatgcca 18 <210> 30 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 30 ggctgatacc atgcttcc 18 <210> 31 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 31 agcaagctag tttactagcg aag 23 <210> 32 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 32 cttttaagtg aggtgtgaaa tcccc 25 <210> 33 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 33 gactgggtaa ctagagtact ttagg 25 <210> 34 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 34 ggtacctttt aacgctgagg t 21 <210> 35 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 35 tccggaacgt taytaacgc 19 <210> 36 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 36 gagacacaac actgagacac g 21 <210> 37 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 37 aagcgaatcc ttttaaagcc ggtct 25 <210> 38 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 38 aagcgaatcc ttaaaagccg gtct 24 <210> 39 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 39 acctggtttt gacatgtgcg gaa 23 <210> 40 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 40 agaaccttac ctggtcttga catg 24 <210> 41 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 41 agccaatcca gaaaccctat ctca 24 <210> 42 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 42 ggagcatgtg gtttattcga agcaa 25 <210> 43 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 43 gctgcaactc gctacatgaa gtc 23 <210> 44 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 44 gctgcaactc gcctacatga agt 23 <210> 45 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 45 gcatcaatca ctagcggata tga 23 <210> 46 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 46 tttagatagc gtaccttca 19 <210> 47 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 47 tgcagcaatt gaaggtactg a 21 <210> 48 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 48 gccatctaat attcaaaca 19 <210> 49 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 49 tgcagcagta gaaggaactg at 22 <210> 50 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 50 gagggaacag atcttgaat 19 <210> 51 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 51 ytctgcagtt gaaggtact 19 <210> 52 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 52 atctgacatc caaactgcag tc 22 <210> 53 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 53 aagaaataac ggtggcgga 19 <210> 54 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 54 gcaaayctag rcagtgttcc ag 22 <210> 55 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 55 accgtataac aataaaccgc atgg 24 <210> 56 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 56 cgtataacaa tcgaaaccgc 20 <210> 57 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 57 gttaagtccc gcaacggcg 19 <210> 58 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 58 agaaaccgca tggtttctat ttgaa 25 <210> 59 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 59 aaaaattcca gcagacatcc gt 22 <210> 60 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 60 cttgcaccat gacaaacacc atca 24 <210> 61 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 61 tgatgtagat ctatcccagc tga 23 <210> 62 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 62 ggaacaaatc ccagctgata ttc 23 <210> 63 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 63 catcctgaaa ttggagaaga ctta 24 <210> 64 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 64 tggaaaaatt attggctgat gtgg 24 <210> 65 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 65 ggaactattg gcagatgtca cta 23 <210> 66 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 66 catgacaagc accatcaarc 20

Claims

a) 복수의 표적 서열들의 하나의 보존 서열(consensus sequnece)을 비교하여, 상기 하나의 보존 서열에 포함되어 있는 일정 기준을 갖는 폴리뉴클레오티드를 포함하는 표적 서열들끼리 각각 그룹화하는 단계;

b) 상기 a) 단계의 그룹들 중 하나의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 표적 서열 특이적 프로브(target sequence specific probe)로 선택하는 단계;

c) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 일정 기준을 갖는 폴리뉴클레오티드에 특이적으로 결합하는 올리고뉴클레오티드를 각 그룹의 그룹 프로브(group probe)로 선택하는 단계; 및

d) 상기 a) 단계의 그룹들 중 2 이상의 표적 서열로 구성된 그룹의 경우, 상기 2 이상의 표적 서열로 구성된 각 그룹의 복수의 표적 서열들의 다른 보존 서열에 대하여 2 이상의 표적 서열로 구성된 그룹이 존재하지 않을 때까지 상기 a) 단계 내지 c) 단계를 반복하는 단계;를 포함하는 표적 서열의 동정에 사용되는 프로브 세트를 설계하는 방법.
제 1항에 있어서,

상기 일정 기준은 서열 상동성, 염기 길이, 혼성화 융점(Tm), 혼성화 융점 차이(ΔTm), GC 함량, 자기 정렬(self-alignment), 변이 위치, 반복서열 정도 및 3' 말단의 염기 구성으로 이루어진 군에서 선택되는 하나 이상인 것을 특징으로 하는 방법.
제 1항에 있어서,

상기 일정 기준은 동일 그룹의 폴리뉴클레오티드에 대해서 100%의 상동성 및 다른 그룹의 폴리뉴클레오티드에 대해서 90% 이하의 상동성인 것을 특징으로 하는 방법.
제 1항에 있어서, 상기 보존 서열은 16S rRNA, 23S rRNA, sodA, gyrA, groEL 및 rpoB로 구성된 군에서 선택되는 것을 특징으로 하는 방법.
제 1항의 방법에 따라 설계된 프로브 세트.
제 5항의 프로브 세트가 기판 상에 고정화 되어 있는 것을 특징으로 하는 표적 서열 동정용 마이크로어레이.
제 6항에 있어서,

상기 기판은 아미노-실란(amino-silane), 폴리-L-라이신(poly-L--sine) 및 알데히드(aldehyde)로 이루어진 군에서 선택되는 활성기가 코팅된 것을 특징으로 하는 마이크로어레이.
제 6항에 있어서,

상기 기판은 실리콘 웨이퍼, 유리, 석영, 금속 및 플라스틱으로 이루어진 군에서 선택되는 것을 특징으로 하는 마이크로어레이.
제 1항에 따른 방법을 컴퓨터가 수행할 수 있도록 하는 프로그램을 기록한 컴퓨터 판독가능한 매체.
제 5항의 프로브 세트를 이용하여 표적 서열을 동정하는 방법.
제 10항에 있어서,

상기 방법은

a) 제 6항에 따른 마이크로어레이에 표적 서열을 포함하는 반응 시료를 적용하는 단계;

b) 프로브와 표적 서열을 혼성화시키는 단계;

c) 비특이적 반응을 제거하기 위해 세척하는 단계; 및

d) 하이브리드 형성에 의한 형광 시그널을 검출하는 단계;를 포함하는 것을 특징으로 하는 방법.