KR100882899B1 - 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효유전자 검색 방법, 이에스티 기능 검색 방법, 실험용프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그기록매체 - Google Patents

복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효유전자 검색 방법, 이에스티 기능 검색 방법, 실험용프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그기록매체 Download PDF

Info

Publication number
KR100882899B1
KR100882899B1 KR1020060095841A KR20060095841A KR100882899B1 KR 100882899 B1 KR100882899 B1 KR 100882899B1 KR 1020060095841 A KR1020060095841 A KR 1020060095841A KR 20060095841 A KR20060095841 A KR 20060095841A KR 100882899 B1 KR100882899 B1 KR 100882899B1
Authority
KR
South Korea
Prior art keywords
information
experiment
dna
dna chip
replication
Prior art date
Application number
KR1020060095841A
Other languages
English (en)
Other versions
KR20080030147A (ko
Inventor
이재원
이정복
손인석
김철민
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority to KR1020060095841A priority Critical patent/KR100882899B1/ko
Publication of KR20080030147A publication Critical patent/KR20080030147A/ko
Application granted granted Critical
Publication of KR100882899B1 publication Critical patent/KR100882899B1/ko

Links

Images

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Physiology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Data Mining & Analysis (AREA)

Abstract

복제 실험 및 염료 교환 실험의 신뢰도 검증 방법이 개시된다.
본 발명은 복수의 서로 다른 실험조건에 각각 할당된 복수의 DNA 칩들 중에서 복제 실험용 DNA 칩 및 염료 교환 실험용 DNA 칩을 선택하는 단계, 상기 선택된 복제 실험용 DNA 칩과 염료 교환 실험용 DNA 칩 사이의 강도 차이 값을 입력하는 단계 및 상기 선택된 복제 실험용 DNA 칩과 염료 교환 실험용 DNA 칩 상에서 상기 입력된 강도 차이 이상에 해당하는 반점 영역을 디스플레이하는 단계를 포함한다.
본 발명에 의하면, 실험 조건, 기능별 카테고리 등에 따라 DNA 칩 상의 유전자 정보를 분류하여 데이터베이스를 구축하고, 간단하고 직관적인 인터페이스를 이용하여 검색을 하도록 함으로써, 실험의 신뢰도를 검증하거나 유효 유전자, 기능별 유전자, 프라이머 정보를 검색함에 있어 조작정도를 최소화하여 편리성을 제공하고, 검색결과를 사용자가 용이하게 파악하기 쉽게 테이블 및 이미지로 검색결과를 디스플레이할 수 있고, 실험을 검증하기 위해 필요한 프라이머 등의 정보를 체계적으로 제공할 수 있다.

Description

복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효 유전자 검색 방법, 이에스티 기능 검색 방법, 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그 기록매체 {Method for verifying reliablity of duplication experimnent and dye-swap experiment, finding effective genes, searching EST according to function and building database with laboratory primer information and Recording medium thereof}
도 1은 본 발명이 적용되는 이에스티의 개념과 활용을 도시한 것이다.
도 2는 본 발명에 따른 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법의 흐름도이다.
도 3a은 도 2의 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법이 적용된 DNA 칩 뷰어의 화면 구성을 도시한 것이다.
도 3b는 도 3a에서 개별 DNA 칩을 클릭한 경우의 화면이다.
도 3c는 도 3b에서 제공할 수 있는 정보들을 나열한 화면이다.
도 3d는 도 3a에서 비교 버튼을 클릭한 경우의 화면이다.
도 4는 본 발명에 따른 유효 유전자 검색 방법의 흐름도이다.
도 5a은 도 4의 유효 유전자 검색 방법이 적용된 유전자 뷰어의 화면 구성을 도시한 것이다.
도 5b는 도 5a에서 복수의 테이블 뷰 중 어느 하나를 클릭한 경우의 화면이다.
도 5c는 도 5a에서 복수의 이미지 뷰 중 어느 하나를 클릭한 경우의 화면이다.
도 5d는 도 5a의 유효 유전자를 KOME 주석 정보와 연계시킨 화면이다.
도 6은 본 발명에 따른 이에스티 기능 검색 방법의 흐름도이다.
도 7a은 도 6의 이에스티 기능 검색 방법이 적용된 기능 뷰어의 화면 구성을 도시한 것이다.
도 7b는 도 7a에서 복수의 테이블 뷰 중 어느 하나를 클릭한 경우의 화면이다.
도 7c는 도 7a에서 복수의 이미지 뷰 중 어느 하나를 클릭한 경우의 화면이다.
도 8은 본 발명에 따른 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법의 흐름도이다.
도 9a는 상용 소프트웨어를 이용하여 도 8의 데이터베이스를 구축하는 과정의 흐름도이다.
도 9b는 도 9a의 데이터베이스를 적용하여 프로브셋을 검색하기 위한 큐 프로브의 화면 구성을 도시한 것이다.
도 9c는 도 9b에서 검색창에 키워드를 입력한 후의 화면이다.
도 9d는 도 9c에서 상세 정보를 클릭한 경우의 일 예를 보여주는 화면이다.
도 9e는 도 9d와 관련한 주석 정보의 일 예를 도시한 것이다.
도 9f는 도 9a에서의 검색과 관련하여 실제 실험에 사용될 프라이머 셋을 제공하는 화면이다.
본 발명은 유전체 데이터베이스에 관한 것으로, 특히, 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효 유전자 검색 방법, 이에스티 기능 검색 방법, 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그 기록매체에 관한 것이다.
도 1에서와 같이, 이에스티(Expressed Sequence Tag, EST)는 발현된 유전자 단편을 가리키며, 유전자의 발현에 관련된 cDNA(complementary DNA)의 일부를 의미한다. 또한, EST는 불특정 서열의 일부가 각 세포에서 발현되는 것으로 전장(full sequence)이고, 유전자를 찾는데 유용하게 사용된다. EST는 각 세포에서 발현되는 30억에 달하는 염기쌍 서열의 일부로서 여러 인체조직과 다른 미생물의 유전자를 비교하는 연구를 통하여 유전자의 기능을 해석할 수 있게 해준다. 즉, cDNA(complementary DNA)을 클론화하여 염기 서열화한 EST(Expressed Sequence Tag) 데이터는 여러 생물체들의 염기서열 정보들과 비교를 통해 유사점을 찾거나 기능적 부위 검색을 통해 유전자 기능을 추정할 수 있어 기능 유전체 연구에 기여를 하고 있다.
EST는 도 1과 같이 cDNA 클론 분석을 통해 얻어진 짧은 서열이다. cDNA는 mRNA를 역전사에 의해 이중나선 구조의 DNA로 다시 만든 DNA로, 세포안의 mRNA가 단백질로 발현되어지는 유전자를 나타내기 때문에 cDNA 역시 세포안에서 발현되는 유전자의 서열을 나타낸다. EST는 cDNA 각 클론의 염기서열을 3' 또는 5' 끝에서 단 한차례 자동화된 기계로 읽어서 서열을 결정한 것으로 실험으로 검증되지 않아 그 염기서열은 다소 부정확할 수 있다. 하지만, 서열을 자동화된 기계로 빠르고 값싸게 얻을 수 있다는 점에서 차차 여러 가지 연구에 응용되기 시작하면서 각광을 받기 시작하였다.
EST는 새로운 유전자의 발견, 질병에 관련된 새로운 유전자 집단의 발견, 유전자 발현의 정성 및 정량적 분석, 조직간에 차등적으로 발현되는 유전자의 클로닝, EST의 3'UTR (Untranslated region)을 새로운 STS(Sequence tagged site)로 활용한 유전자 발현 지도의 작성, 유전체 서열과의 비교를 통한 복잡한 유전체 서열의 분석 등 다양한 연구 분야의 중요한 재료로써 이용되고 있다.
EST 분석은 도 1에서와 같이, 어떤 유전자 부위(EST)가 어떤 기능으로 발현되는가를 분석하는 것이고, EST 분석 기술은 DNA 칩 데이터 분석, SNP 분석, Motif 분석, Proteomics, 신약 후보물질 탐색등에 폭넓게 적용할 수 있다. EST 분석은 제약점이 있음에도 불구하고 생명공학 연구 여러분야에서 아주 중요하게 널리 사용되고 있다.
그러나, 종래의 유전체 데이터베이스는 실험의 신뢰도를 검증하거나 유효 유전자, 기능별 유전자, 프라이머 정보를 검색함에 있어 지나치게 많은 조작을 요구 하고, 검색결과를 사용자가 용이하게 파악하기 어렵고, 실험을 검증하기 위해 필요한 프라이머 등의 정보를 체계적으로 제공할 수 없는 문제점이 있다.
따라서, 본 발명이 이루고자 하는 첫번째 기술적 과제는 실험의 신뢰도를 검증함에 있어 사용자의 조작을 최소화하여 편리성을 제공하고, 검색결과를 사용자가 용이하게 파악하기 쉽게 테이블 및 이미지로 검색결과를 디스플레이할 수 있는 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법을 제공하는데 있다.
본 발명이 이루고자 하는 두번째 기술적 과제는 유효 유전자를 검색함에 있어 사용자의 조작을 최소화하여 편리성을 제공하고, 검색결과를 사용자가 용이하게 파악하기 쉽게 테이블 및 이미지로 검색결과를 디스플레이할 수 있는 유효 유전자 검색 방법을 제공하는데 있다.
본 발명이 이루고자 하는 세번째 기술적 과제는 이에스티 기능을 검색함에 있어 사용자의 조작을 최소화하여 편리성을 제공하고, 검색결과를 사용자가 용이하게 파악하기 쉽게 테이블 및 이미지로 검색결과를 디스플레이할 수 있는 이에스티 기능 검색 방법을 제공하는데 있다.
본 발명이 이루고자 하는 네섯번째 기술적 과제는 이에스티의 프로브셋을 검색함에 있어 사용자의 조작을 최소화하여 편리성을 제공하고, 검색결과를 사용자가 용이하게 파악하기 쉽게 테이블 및 이미지로 검색결과를 디스플레이할 수 있으며, 실험을 검증하기 위해 필요한 프라이머 등의 정보를 체계적으로 제공할 수 있는 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법을 제공하는데 있다.
본 발명이 이루고자 하는 다섯번째 기술적 과제는 상기의 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효 유전자 검색 방법, 이에스티 기능 검색 방법 또는 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법 중 적어도 하나를 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 있다.
상기의 첫번째 기술적 과제를 이루기 위하여, 본 발명은 복수의 서로 다른 실험조건에 각각 할당된 복수의 DNA 칩들 중에서 복제 실험용 DNA 칩 및 염료 교환 실험용 DNA 칩을 선택하는 단계, 상기 선택된 복제 실험용 DNA 칩과 염료 교환 실험용 DNA 칩 사이의 강도 차이 값을 입력하는 단계 및 상기 선택된 복제 실험용 DNA 칩과 염료 교환 실험용 DNA 칩 상에서 상기 입력된 강도 차이 이상에 해당하는 반점 영역을 디스플레이하는 단계를 포함하는 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법을 제공한다.
상기의 두번째 기술적 과제를 이루기 위하여, 본 발명은 복수의 DNA 칩들을 이용하여 복수의 서로 다른 실험조건마다 유효한 유전자 정보를 생성하는 단계, 상기 복수의 서로 다른 실험조건의 리스트를 디스플레이하는 단계, 상기 복수의 서로 다른 실험조건 중 어느 하나의 실험 조건을 선택하는 단계 및 상기 생성된 유전자 정보로부터 상기 선택된 실험조건에 유효한 반점의 블럭 정보, 상기 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 추출하고 상기 추출된 정보를 테이블로 디스플레이하는 단계를 포함하는 유효 유전자 검색 방법을 제공한다.
상기의 세번째 기술적 과제를 이루기 위하여, 본 발명은 복수의 DNA 칩들에 포함된 이에스티를 기능별 카테고리에 따라 분류하여 기능 그룹 정보를 생성하는 단계, 상기 기능별 카테고리의 리스트를 디스플레이하는 단계 및 상기 기능별 카테고리 중 어느 하나를 선택하면 상기 선택된 카테고리에 해당하는 이에스티를 상기 기능 그룹 정보로부터 추출하고, 상기 추출된 이에스티의 블럭 정보, 상기 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 테이블로 디스플레이하는 단계를 포함하는 이에스티 기능 검색 방법을 제공한다.
상기의 네번째 기술적 과제를 이루기 위하여, 본 발명은 이에스티 서열 데이터를 수집하고, 상기 이에스티 서열 데이터를 이용하여 크로마토그램 파일을 생성하는 단계, 상기 크로마토그램 파일을 분석툴에 적용하여 분석결과를 생성하는 단계, 상기 분석결과로부터 클론 정보를 추출하고, 상기 분석결과를 주석생성툴에 적용하여 주석 정보를 생성하며, 상기 분석결과를 이에스티 클러스터링 툴에 적용하여 프라이머 정보를 생성하는 단계 및 상기 클론 정보, 주석 정보 및 프라이머 정보를 조합하여 프라이머 데이터베이스를 생성하는 단계를 포함하는 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법을 제공한다.
상기의 다섯번째 기술적 과제를 이루기 위하여, 본 발명은 상기의 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효 유전자 검색 방법, 이에스티 기능 검색 방법 또는 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법 중 적어도 하나를 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
유전체 데이터는 복잡하고 그 양과 자료의 범위가 넓다. 따라서 유전체 데이터베이스는 그 각각의 자료 타입과 값들을 유연하게 처리해야 한다. 유전체 자료는 특성상 빠르게 변화하므로 데이터베이스의 빠른 스키마의 변경을 지원할 수 있도록 해야한다. 유전체 데이터베이스는 어느 특정한 분야가 아닌 의학, 약학, 화학, 생물학 등의 다양한 분야와 관계가 있는 만큼 그 각각의 분야에서 원하는 자료의 표현 방법들이 틀리다. 따라서 비록 하나의 유전체 데이터베이스를 사용하더라도 그들 각각의 요구사항들을 충족시킬 수 있는 다양한 스키마를 제공해야 한다.
유전체 데이터베이스 시스템을 구축하는데 있어서 해결해야 할 제약 사항들은 아래와 같다.
첫째, 특정 순서에 대한 상이한 관점들이 적절히 표현 가능해야 한다. 둘째, 개념들이 항상 변하고 유동적이므로 유동성을 지원할 수 있는 환경이 필요하다. 셋째, 자료가 계속적으로 변화함으로 자료의 불일치와 모호성이 야기됨으로써 구축과정 중에 동적인 스키마를 지원해야 한다. 즉, 개념과 스키마가 계속적으로 변하기 때문에 강력한 질의어가 필요하며, 염색체의 적절한 순서와 간격 등을 식별할 수 있는 강력한 패턴 매칭 기술 등도 함께 제공해야 한다.
이하에서는 도면을 참조하여 본 발명의 바람직한 실시예를 설명하기로 한다. 그러나, 다음에 예시하는 본 발명의 실시예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 다음에 상술하는 실시예에 한정되는 것은 아니다.
도 2는 본 발명에 따른 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법의 흐름도이다.
먼저, 복수의 서로 다른 실험조건에 각각 할당된 복수의 DNA 칩들 중에서 복제 실험용 DNA 칩 및 염료 교환 실험용 DNA 칩을 선택한다(210 과정). 이때, DNA 칩 선택은 마우스를 이용한 클릭, 키보드의 단축키 입력, 터치 스크린을 직접 터치하는 등의 방식을 이용할 수 있다. 이때, 복수의 서로 다른 실험 조건은 COLD, COLD & ABA, SALT, SALT & ABA를 포함할 수 있다.
바람직하게는, 이 과정(210 과정)은 복수의 DNA 칩들 중에서 어느 하나의 DNA 칩을 선택하면, DNA 시퀀스 정보, 단백질 시퀀스 정보, 기능 정보 및 단백질 구조 정보를 포함하는 EST 주석 정보를 디스플레이하는 과정을 포함할 수 있다.
다음, 선택된 복제 실험용 DNA 칩과 염료 교환 실험용 DNA 칩 사이의 강도 차이 값을 입력한다(220 과정).
마지막으로, 선택된 복제 실험용 DNA 칩과 염료 교환 실험용 DNA 칩 상에서 입력된 강도 차이 이상에 해당하는 반점 영역을 디스플레이한다(230 과정). 이를 위해, 마이크로어레이 스캐닝 이미지 또는 데이터베이스 등으로부터 각 반점(스팟)의 강도를 미리 연산하여 저장하는 과정을 선행할 수 있다.
도 3a은 도 2의 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법이 적용된 DNA 칩 뷰어의 화면 구성을 도시한 것이다.
DNA 칩 뷰어(DNA chip viewer)는 rice EST의 주석정보와 레퍼런스 칩(reference chip) 정보를 연계한 DNA 칩 뷰어이다. 도 3a의 화면에는 4가지 실험조건에 대한 32 세트의 DNA 칩 정보가 있다. DNA 칩 번호를 클릭하면 각각의 DNA 칩정보를 볼 수 있으며, 복제 실험(Duplication Experiment)와 염료 교환 실 험(Dye-swap Experiment)에 해당하는 두 가지 chip 번호를 선택한 후 chip간의 강도(intensity) 차이 값을 넣고, 비교(comparison)을 클릭하면 복제(Duplication), 염료 교환 실험(Dye-swap Experiment)의 신뢰성을 시각적으로 쉽게 파악할 수 있는 이미지가 제공된다. 도 3a는 4가지 실험 조건과 2가지 시간경과에 따른 DNA 칩 정보를 검색할 수 있는 화면이다.
도 3b는 도 3a에서 개별 DNA 칩을 클릭한 경우의 화면이다.
도 3b는 DNA 칩 정보 검색 화면에서 하나의 DNA 칩정보를 검색하기 위해 클릭하면 나타나는 화면이다. 각 반점(spot)에 마우스를 가져다 놓으면 간단한 DNA 칩 정보를 볼 수 있으며, 클릭하면 EST 주석정보를 볼 수 있다.
도 3c는 도 3b에서 제공할 수 있는 정보들을 나열한 화면이다.
EST 주석 정보와 연계한 DNA 칩 뷰어를 보여준다. DNA 칩과 연동된 EST 주석정보로써 DNA 서열(sequence) 정보부터 모두 9가지 형태의 주석정보를 보여준다
도 3d는 도 3a에서 비교 버튼을 클릭한 경우의 화면이다.
도 3d는 복제 실험(Duplication Experiment), 염료 교환 실험(Dye-swap Experiment)을 쉽게 시각적으로 검증할 수 있는 이미지 뷰어이다. DNA 칩정보 검색 화면에서 두 가지 DNA 칩을 선택한 후, DNA 칩 사이의 강도(intensity) 차이 값을 설정한 후 클릭하면, 강도(intensity) 차이 값 이상 되는 반점(spot) 영역이 아래쪽에 진하게 나타남으로써 쉽게 실험(Experiment)의 정확성을 1차적으로 감별할 수 있다.
도 4는 본 발명에 따른 유효 유전자 검색 방법의 흐름도이다.
먼저, 복수의 DNA 칩들을 이용하여 복수의 서로 다른 실험조건마다 유효한 유전자 정보를 생성한다(410 과정). 이 과정(410 과정)은 사전처리 과정으로서, 데이터베이스 구축과정이다.
다음, 복수의 서로 다른 실험조건의 리스트를 디스플레이한다(420 과정). 이때, 리스트는 테이블 형식으로 출력하고, 리스트의 각 항목을 선택할 수 있는 수단을 함께 표시할 수 있다.
복수의 서로 다른 실험조건의 리스트가 디스플레이되면, 복수의 서로 다른 실험조건 중 어느 하나의 실험 조건을 선택한다(430 과정). 이때, 실험 조건 선택은 마우스를 이용한 클릭, 키보드의 단축키 입력, 터치 스크린을 직접 터치하는 등의 방식을 이용할 수 있다. 이때, 복수의 서로 다른 실험 조건은 COLD, COLD & ABA, SALT, SALT & ABA를 포함할 수 있다.
마지막으로, 생성된 유전자 정보로부터 선택된 실험조건에 유효한 반점이 DNA 칩 상에서 위치한 블럭 정보, 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 추출하고, 추출된 정보를 테이블로 디스플레이한다(440 과정). 바람직하게는, 이 과정(440 과정)은 유효한 반점의 블럭 정보, 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 DNA 칩 이미지 상에 디스플레이하는 과정을 포함할 수 있다.
도 5a는 도 4의 유효 유전자 검색 방법이 적용된 유전자 뷰어의 화면 구성을 도시한 것이다.
유전자 뷰어(Gene viewer)는 32세트의 DNA 칩을 통계적으로 분석하여 8가지 조건에 따른 유효한 유전자 정보를 보여준다. 도 5a는 유전자 뷰어의 초기 화면으 로써 8가지의 조건에 대해서 정보를 검색할 수 있는 화면이다. 정보 검색은 테이블 형태와 이미지 형태로 볼 수 있다.
도 5b는 도 5a에서 복수의 테이블 뷰 중 어느 하나를 클릭한 경우의 화면이다. 도 5c는 도 5a에서 복수의 이미지 뷰 중 어느 하나를 클릭한 경우의 화면이다. 도 5b 및 도 5c는 각 조건에 유효한 유전자의 결과를 테이블 형태와 이미지 형태로 보여주고 있다.
도 5d는 도 5a의 유효 유전자를 KOME 주석 정보와 연계시킨 화면이다.
도 6은 본 발명에 따른 EST 기능 검색 방법의 흐름도이다.
먼저, 복수의 DNA 칩들에 포함된 EST를 기능별 카테고리에 따라 분류하여 기능 그룹 정보를 생성한다(610 과정). 이 과정(610 과정)은 사전처리 과정으로서, 데이터베이스 구축과정이다.
다음, 기능별 카테고리의 리스트를 디스플레이한다(620 과정). 이때, 리스트는 테이블 형식으로 출력하고, 리스트의 각 항목을 선택할 수 있는 수단을 함께 표시할 수 있다.
기능별 카테고리의 리스트를 디스플레이되면, 기능별 카테고리 중 어느 하나를 선택한다(630 과정). 이때, 기능별 카테고리 선택은 마우스를 이용한 클릭, 키보드의 단축키 입력, 터치 스크린을 직접 터치하는 등의 방식을 이용할 수 있다.
기능별 카테고리 중 어느 하나가 선택되면, 선택된 카테고리에 해당하는 EST를 기능 그룹 정보로부터 추출하고, 추출된 EST가 DNA 칩 상에서 위치한 블럭 정보, 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 테이블로 디스플레이한 다(640 과정). 바람직하게는, 이 과정(640 과정)은 추출된 EST의 블럭 정보, 상기 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 DNA 칩 이미지 상에 디스플레이하는 과정을 포함할 수 있다.
바람직하게는, 기능별 카테고리는 전사 인자, 수용체 유사 단백질 키나아제, 단백질 포스파타아제 및 해독을 포함하는 유전자 발현 정보일 수 있다.
도 7a는 도 6의 EST 기능 검색 방법이 적용된 기능 뷰어의 화면 구성을 도시한 것이다.
도 7a의 기능 뷰어(Function viewer)는 14가지의 기능별 카테고리(function caterogy)에 따라서 rice EST를 분류한다.
도 7b는 도 7a에서 복수의 테이블 뷰 중 어느 하나를 클릭한 경우의 화면이다. 도 7b는 기능 그룹(Function Group)에 속하는 rice EST 검색결과이다.
도 7c는 도 7a에서 복수의 이미지 뷰 중 어느 하나를 클릭한 경우의 화면이다. 도 7c는 기능 그룹(Function Group)에 속하는 rice EST 검색결과이다.
도 8은 본 발명에 따른 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법의 흐름도이다.
먼저, EST 서열 데이터(EST sequence data)를 수집하고, EST 서열 데이터를 이용하여 크로마토그램 파일을 생성한다(810 과정). 이때, EST 서열 데이터는 농업과학시술원(NIAST) 등으로 부터 수질될 수 있다.
다음, 크로마토그램 파일을 분석툴에 적용하여 분석결과를 생성한다(820 과정). 이때, 분석툴로 Finch-Suite를 사용할 수 있다.
분석결과가 생성되면, 분석결과로부터 클론 정보를 추출하고, 분석결과를 주석생성툴에 적용하여 주석 정보를 생성하며, 분석결과를 EST 클러스터링 툴에 적용하여 프라이머 정보를 생성한다(830 과정). 이때, 주석생성툴은 Pedant-Pro를 사용하고, 클러스터링 툴은 StackPack을 사용할 수 있다. 또한 프라이머 정보를 생성하기 위한 툴로써 EST 클러스터 정보를 이용하는 Prime을 사용할 수 있다.
마지막으로, 클론 정보, 주석 정보 및 프라이머 정보를 조합하여 프라이머 데이터베이스를 생성한다(840 과정). 바람직하게는, 프라이머 데이터베이스를 복수의 클라이언트 컴퓨터와 네트워크로 연결된 서버용 컴퓨터에 저장하고, 클라이언트 컴퓨터에서 키워드를 입력하면 입력된 키워드와 관련된 정보를 프라이머 데이터베이스로부터 추출하여 클라이언트 컴퓨터로 출력하도록 하는 시스템을 설계할 수 있다. 바람직하게는, 이 과정(840 과정)은 프라이머를 이용하여 실험적으로 증폭하고 염기서열을 분석 및 확인한 후 프라이머의 정보를 데이터베이스에 기록하는 과정을 포함할 수 있다.
이때, 프라이머 정보는 실험용 프라이머 설계를 위한 각종의 파라미터 정보를 포함할 수 있다.
도 9a는 상용 소프트웨어를 이용하여 도 8의 데이터베이스를 구축하는 과정의 흐름도이다.
Finch Suite와 같은 Finch Genome Analysis System은 염기서열 품질 분석 및 유전체 분석 시스템으로서, On line이 가능하다. Pedant Pro는 유전체 기능 정보 예측 시스템으로서, 역시 On line이 가능하다. StackPACK은 EST를 분석하기 위한 툴이다.
도 9a에서, 크로마토그램은 크로마토그래피에서 시간에 따라 분리되어 나오는 성분들의 용리(熔離) 곡선 또는 그 가운데 색을 띤 반점을 의미한다.
도 9b는 도 9a의 데이터베이스를 적용하여 프로브셋을 검색하기 위한 소프트웨어인 큐 프로브의 화면 구성을 도시한 것이다.
큐 프로브(Q-Probe)의 제작을 위해서, GCG Wisconsin 패키지의 "Prime+"과 유닉스 스크립트를 이용한 자동화 모듈을 분석 개발하고, 벼 EST 주석 데이터베이스와 연계 인터페이스를 개발한다.
또한, GCG 패키지의 "Prime"과 유닉스 스크립트를 이용한 자동화 모듈을 분석한다. EST clone 에 대해서는 다음의 설계 조건으로 분석을 수행한다.
즉, 설계 파라미터(Design Parameters)는 Product MIN size=100 sets the minimum products size (bp), Product MAX size=500 sets the maximum products size (bp), DNA concentration=50.0 sets the primer DNA concentration (nM), Salt concentration=50.0 sets the salt concentration (mM), Clamp=s specifies primer 3' clamp (using IUB ambiguity codes), GC MIN primer=40.0 sets the minimum primer % G+C, GC MAX primer=55.0 sets the maximum primer % G+C, TM MIN primer=50.0 sets the minimum primer melting temperature (Celsius), TM MAX primer=65.0 sets the maximum primer melting temperature (Celsius) 으로 설정할 수 있다.
큐 프로브는 DNA 칩 분석에서 얻어진 결과의 실험적 증명을 위한 Q-RT-PCR용 프라이머(primer) 제공한다. 데이터베이스화된 프라이머(primer) 셋들은 실제 실험적으로 증폭 및 염기서열을 분석하여 확인하고 데이터베이스에 기록되어 실제 연구에 이용될 수 있는 프라이머(primer) 셋을 제공한다.
도 9b의 큐 프로브는 rice EST primary consensus contig에 대해서 분석 수행한 결과를 포함한다. 콘티그(contig)는 DNA의 세그먼트를 완전히 구성하는 일련의 클론들의 위치를 나타내는 맵을 의미하기도 하고, 개별적인 서열 정보들이 통합되어 더 큰 DNA의 서열을 나타낼 때 이와같이 조합된 서열을 의미하기도 한다.
도 9b의 검색창에 키워드를 입력하거나 버튼을 클릭하면 도 9c와 같은 화면이 출력된다.
도 9c는 도 9b에서 검색창에 키워드를 입력한 후의 화면이다.
도 9c는 EST 주석에 대한 검색결과로서, "Cluster ID" 또는 "Clone ID"를 클릭하면 해당 상세정보를 볼 수 있다. 도 9c에서, 각 항목의 상세 정보의 일례는 다음과 같다.
즉, 클론 및 서열 정보의 최적 검색 결과(Best Hit of Clone and Sequence Information), rice EST 주석 정보(rice EST annotation Information), 프라이머 설계의 상세 정보(Detail View of primer Design)이다. 각각은 도 9d 내지 도 9f에 도시되어 있다.
도 9d는 도 9c에서 상세 정보를 클릭한 경우의 일 예를 보여주는 화면이다. 도 9e는 도 9d와 관련한 주석 정보의 일 예를 도시한 것이다. 도 9f는 도 9a에서의 검색과 관련하여 실제 실험에 사용될 프라이머 셋을 제공하는 화면이다.
본 발명에 따르면, 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효 유전자 검색 방법, EST 기능 검색 방법, 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법을 통합한 하나의 소프트웨어인 레드 뷰(REDVIEW)를 제작할 수 있다.
REDVIEW는 rice EST 분석 데이터와 벼 레퍼런스(rice reference) DNA 칩을 연동한 데이터베이스 및 뷰어 시스템이다. REDVIEW는 벼 레퍼런스(rice reference) DNA 칩 활용을 위한 데이터베이스 및 뷰어시스템이다. rice EST를 분석한 주석정보와 DNA 칩정보를 연계시켜 웹으로 테이블 및 이미지 형태로 연구자들에게 정보를 제공한다. REDVIEW는 벼 레퍼런스(rice reference) DNA 칩 이미지를 보여주는 부분, 실험 조건에 따른 유효한 유전자를 찾는 부분, 기능별 카테고리에 의한 유전자를 찾는 부분, DNA 칩 분석에서 얻어진 결과의 실험적 증명을 위한 Q-RT-PCR용 프라이머 세트를 찾는 부분으로 구성된다. REDVIEW는 rice EST를 분석한 주석정보와 DNA 칩정보를 연계시켜 웹으로 테이블 및 이미지 형태로 연구자들에게 정보를 제공한다.
REDVIEW를 이용하면, 수행된 연구 결과를 일반 연구자들에게 효율적으로 제공하고, 레퍼런스 칩의 활용도를 증대시킬 수 있고, 레퍼런스 칩 정보의 관계형 데이터베이스를 구축할 수 있으며, 칩 레이아웃(Chip layout)과 클론(clone) 정보를 포함한 레퍼런스 칩 데이터베이스를 구축할 수 있고, 주석 정보의 데이터베이스 구축 및 가상 레퍼런스 칩과 연동한 정보를 제공할 수 있다.
또한, REDVIEW를 이용하면, 클러스터링 툴(Clustering tool)을 이용한 클 론(clone)의 클러스터링(clustering) 구현 및 인터페이스를 구축할 수 있고, 프라이머(primer) 데이터베이스 구축 완료 및 각 데이터베이스의 관계형 스키마를 구현할 수 있으며, 레퍼런스 칩 레이아웃(layout)을 가시화할 수 있다.
또한, REDVIEW를 이용하면, 반점 레이 아웃 뷰어(Spot layout viewer)를 구현할 수 있고, 레이아웃 뷰어(layout viewer)와 주석 데이터베이스의 링크 및 인터페이스를 구현할 수 있으며, DNA 칩의 복제, 염료 교환의 신뢰성 판단을 위한 이미디 뷰어(image viewer) 모듈을 구현할 수 있다.
또한, REDVIEW를 이용하면, 기능별 주석으로 부터 레이아웃을 확인할 수 있는 인터페이스를 제공하고, rice EST의 블래스트(BLAST) 검색을 위한 포맷 데이터베이스를 구축할 수 있으며, BLAST 검색 인터페이스 모듈을 구성할 수 있다.
바람직하게는, 본 발명의 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법을 컴퓨터에서 실행시키기 위한 프로그램을 컴퓨터로 읽을 수 있는 기록매체에 기록하여 제공할 수 있다.
바람직하게는, 본 발명의 유효 유전자 검색 방법을 컴퓨터에서 실행시키기 위한 프로그램을 컴퓨터로 읽을 수 있는 기록매체에 기록하여 제공할 수 있다.
바람직하게는, 본 발명의 이에스티 기능 검색 방법을 컴퓨터에서 실행시키기 위한 프로그램을 컴퓨터로 읽을 수 있는 기록매체에 기록하여 제공할 수 있다.
바람직하게는, 본 발명의 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법을 컴퓨터에서 실행시키기 위한 프로그램을 컴퓨터로 읽을 수 있는 기록매체에 기록하여 제공할 수 있다.
본 발명은 소프트웨어를 통해 실행될 수 있다. 소프트웨어로 실행될 때, 본 발명의 구성 수단들은 필요한 작업을 실행하는 코드 세그먼트들이다. 프로그램 또는 코드 세그먼트들은 프로세서 판독 가능 매체에 저장되거나 전송 매체 또는 통신망에서 반송파와 결합된 컴퓨터 데이터 신호에 의하여 전송될 수 있다.
컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 테이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, DVD±ROM, DVD-RAM, 자기 테이프, 플로피 디스크, 하드 디스크(hard disk), 광데이터 저장장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 장치에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
본 발명은 도면에 도시된 일 실시예를 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 발명의 기술적 보호범위내에 있다고 보아야 한다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해서 정해져야 할 것이다.
상술한 바와 같이, 본 발명에 의하면, 실험 조건, 기능별 카테고리 등에 따라 DNA 칩 상의 유전자 정보를 분류하여 데이터베이스를 구축하고, 간단하고 직관적인 인터페이스를 이용하여 검색을 하도록 함으로써, 실험의 신뢰도를 검증하거나 유효 유전자, 기능별 유전자, 프라이머 정보를 검색함에 있어 조작정도를 최소화하여 편리성을 제공하고, 검색결과를 사용자가 용이하게 파악하기 쉽게 테이블 및 이미지로 검색결과를 디스플레이할 수 있고, 실험을 검증하기 위해 필요한 프라이머 등의 정보를 체계적으로 제공할 수 있는 효과가 있다.

Claims (11)

  1. 데이터 입력장치를 통해 수신되는 입력신호에 따라 데이터베이스를 검색하여 상기 데이터베이스로부터 검색된 정보를 출력장치를 통해 디스플레이하는 컴퓨터 시스템을 이용하여 복제 실험 및 염료 교환 실험의 신뢰도를 검증하는 방법에 있어서,
    상기 출력장치를 통해 복수의 서로 다른 실험조건에 각각 할당된 복수의 DNA 칩들에 관한 정보를 디스플레이하고, 상기 데이터 입력장치를 통해 상기 복수의 DNA 칩들 중에서 복제 실험용 DNA 칩 및 염료 교환 실험용 DNA 칩을 선택하는 선택신호를 수신하는 단계;
    상기 데이터 입력장치를 통해 상기 선택신호에 따라 선택된 복제 실험용 DNA 칩 및 염료 교환 실험용 DNA 칩 간의 강도(intensity) 차이 값을 수신하는 단계; 및
    상기 출력장치를 통해 상기 선택된 복제 실험용 DNA 칩 및 염료 교환 실험용 DNA 칩 상에서 상기 강도 차이 이상에 해당하는 반점(spot) 영역을 디스플레이하는 단계를 포함하는 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법.
  2. 제 1 항에 있어서,
    상기 선택신호를 수신하는 단계는
    상기 선택신호에 따라 상기 복수의 DNA 칩들 중에서 어느 하나의 DNA 칩이 선택되면, 상기 출력장치를 통해 DNA 시퀀스 정보, 단백질 시퀀스 정보, 기능 정보 및 단백질 구조 정보를 포함하는 이에스티(EST) 주석 정보를 디스플레이하는 단계를 포함하는 것을 특징으로 하는 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법.
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 제 1 항 내지 제 2 항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020060095841A 2006-09-29 2006-09-29 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효유전자 검색 방법, 이에스티 기능 검색 방법, 실험용프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그기록매체 KR100882899B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060095841A KR100882899B1 (ko) 2006-09-29 2006-09-29 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효유전자 검색 방법, 이에스티 기능 검색 방법, 실험용프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060095841A KR100882899B1 (ko) 2006-09-29 2006-09-29 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효유전자 검색 방법, 이에스티 기능 검색 방법, 실험용프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그기록매체

Related Child Applications (3)

Application Number Title Priority Date Filing Date
KR1020080073692A Division KR20080088540A (ko) 2008-07-28 2008-07-28 이에스티 기능 검색 방법
KR1020080073687A Division KR20080088539A (ko) 2008-07-28 2008-07-28 유효 유전자 검색 방법
KR1020080073693A Division KR100915889B1 (ko) 2008-07-28 2008-07-28 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법

Publications (2)

Publication Number Publication Date
KR20080030147A KR20080030147A (ko) 2008-04-04
KR100882899B1 true KR100882899B1 (ko) 2009-02-10

Family

ID=39532340

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060095841A KR100882899B1 (ko) 2006-09-29 2006-09-29 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효유전자 검색 방법, 이에스티 기능 검색 방법, 실험용프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그기록매체

Country Status (1)

Country Link
KR (1) KR100882899B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020110267A1 (en) 2000-01-27 2002-08-15 Brown Carl S. Image metrics in the statistical analysis of DNA microarray data
KR20040039975A (ko) * 2002-11-05 2004-05-12 이원석 프로테옴 정보 통합을 위한 데이터베이스 구축방법 및 그장치
KR20040064763A (ko) * 2003-01-10 2004-07-21 바이오인포메틱스 주식회사 클라이언트/서버 기반 est 서열 분석 시스템 및 방법
KR20050096044A (ko) * 2004-03-29 2005-10-05 주식회사 이즈텍 유전자 기능 분석 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020110267A1 (en) 2000-01-27 2002-08-15 Brown Carl S. Image metrics in the statistical analysis of DNA microarray data
KR20040039975A (ko) * 2002-11-05 2004-05-12 이원석 프로테옴 정보 통합을 위한 데이터베이스 구축방법 및 그장치
KR20040064763A (ko) * 2003-01-10 2004-07-21 바이오인포메틱스 주식회사 클라이언트/서버 기반 est 서열 분석 시스템 및 방법
KR20050096044A (ko) * 2004-03-29 2005-10-05 주식회사 이즈텍 유전자 기능 분석 방법

Also Published As

Publication number Publication date
KR20080030147A (ko) 2008-04-04

Similar Documents

Publication Publication Date Title
Kanehisa et al. KEGG for taxonomy-based analysis of pathways and genomes
US6185561B1 (en) Method and apparatus for providing and expression data mining database
US20060020398A1 (en) Integration of gene expression data and non-gene data
Wilhite et al. Strategies to explore functional genomics data sets in NCBI’s GEO database
Sallaberry et al. Sequential patterns mining and gene sequence visualization to discover novelty from microarray data
US20050039123A1 (en) Method and system for importing, creating and/or manipulating biological diagrams
US10930373B2 (en) Methods and systems for knowledge discovery using biological data
US20050197783A1 (en) Methods and systems for extension, exploration, refinement, and analysis of biological networks
Wattam et al. Comparative genomic analysis at the PATRIC, a bioinformatic resource center
CN110603596B (zh) 基因组数据分析系统和方法
AU781841B2 (en) Graphical user interface for display and analysis of biological sequence data
JP2008515029A (ja) 分子機能ネットワークの表示方法
Juan et al. Bioinformatics: microarray data clustering and functional classification
US20060271513A1 (en) Method and apparatus for providing an expression data mining database
JP3563315B2 (ja) 樹状図表示方法及び樹状図表示システム
KR100882899B1 (ko) 복제 실험 및 염료 교환 실험의 신뢰도 검증 방법, 유효유전자 검색 방법, 이에스티 기능 검색 방법, 실험용프라이머 정보를 제공하는 데이터베이스 구축 방법 및 그기록매체
Ochs et al. Incorporation of gene ontology annotations to enhance microarray data analysis
van den Brandt et al. Panva: Pangenomic variant analysis
KR100915889B1 (ko) 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법
Arrais et al. GeneBrowser: an approach for integration and functional classification of genomic data
JP2001178463A (ja) 類似発現パターン抽出方法及び関連生体高分子抽出方法
Looso et al. Data mining in newt-omics, the repository for omics data from the newt
WO2000016220A1 (en) Method and apparatus for providing an expression data mining database and laboratory information management
JP4543166B2 (ja) データベース及び解析サービスの操作統合システム、その方法、及びそのプログラム
KR20080088539A (ko) 유효 유전자 검색 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
A107 Divisional application of patent
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20111209

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130111

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee