KR20080030145A - 마이크로어레이 실험 정보의 통합 관리 방법 및 그기록매체 - Google Patents

마이크로어레이 실험 정보의 통합 관리 방법 및 그기록매체 Download PDF

Info

Publication number
KR20080030145A
KR20080030145A KR1020060095838A KR20060095838A KR20080030145A KR 20080030145 A KR20080030145 A KR 20080030145A KR 1020060095838 A KR1020060095838 A KR 1020060095838A KR 20060095838 A KR20060095838 A KR 20060095838A KR 20080030145 A KR20080030145 A KR 20080030145A
Authority
KR
South Korea
Prior art keywords
information
experiment
dna chip
image
project
Prior art date
Application number
KR1020060095838A
Other languages
English (en)
Other versions
KR100836865B1 (ko
Inventor
이재원
김철민
이정복
손인석
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority to KR1020060095838A priority Critical patent/KR100836865B1/ko
Publication of KR20080030145A publication Critical patent/KR20080030145A/ko
Application granted granted Critical
Publication of KR100836865B1 publication Critical patent/KR100836865B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Library & Information Science (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physiology (AREA)
  • Molecular Biology (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

마이크로어레이 실험 정보의 통합 관리 방법 및 그 기록매체가 개시된다.
본 발명은 DNA 칩 실험에 대한 프로젝트 정보, 실험 정보, 작업 정보 및 이미지 정보를 등록하는 단계, 상기 이미지 정보의 이미지에 대한 블럭 인덱싱 및 스팟 인덱싱을 수행하고 상기 인덱싱된 이미지에 대해 통계 분석을 수행하여 분석 결과를 생성하는 단계 및 상기 분석 결과를 상기 프로젝트 정보, 실험 정보, 작업 정보에 따라 생성된 프로젝트 데이터베이스에 기록하는 단계를 포함한다.
본 발명에 의하면, DNA 칩 실험 결과에 대한 계층적인 데이터베이스를 구축하여, 통합 시스템 상에서 각종 통계 분석을 수행하고 그 결과를 가공할 수 있으며, 분석 프로그램간 데이터 호환 문제를 해소하고, 분석 데이터들을 체계적으로 관리할 수 있으며, 현장 연구자가 사용하기 편리한 인터페이스를 제공할 수 있으며, 주어진 상황에 맞는 통계방법을 선택하는 가이드라인을 제공하며, 웹기반 시스템으로 구성하는 경우 많은 사용자가 접근 가능하게 할 수 있다.

Description

마이크로어레이 실험 정보의 통합 관리 방법 및 그 기록매체 {Method for integrated management of microarray experiment informaion and Recording medium thereof}
도 1은 본 발명에 따른 마이크로어레이 실험 정보의 통합 관리 방법의 흐름도이다.
도 2는 도 1의 블럭 인덱싱 및 스팟 인덱싱과 관련하여 자동화된 마이크로어레이 이미지 분석방법의 흐름도이다.
도 3은 도 1의 통계 분석과 관련하여 마이크로 어레이 통합 분석 방법의 흐름도이다.
도 4a는 도 1의 통계 분석과 관련하여 복제 실험 및 염료교환(dye-swap) 실험의 신뢰도 검증 방법의 흐름도이다.
도 4b는 도 1의 통계 분석과 관련하여 유효 유전자 검색 방법의 흐름도이다.
도 4c는 도 1의 통계 분석과 관련하여 이에스티 기능 검색 방법의 흐름도이다.
도 4d는 도 1의 통계 분석과 관련하여 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법의 흐름도이다.
도 5a는 본 발명의 마이크로어레이 실험 정보의 통합 관리 방법이 적용된 통 합 시스템의 메인 화면의 일 예를 도시한 것이다.
도 5b는 도 5a에서 BIMS를 선택한 경우의 화면 구성의 일 예를 도시한 것이다.
도 5c는 도 5a에서 어레이저를 선택한 경우의 화면 구성의 일 예를 도시한 것이다.
도 5d는 도 5a에서 클릭-S를 선택한 경우의 화면 구성의 일 예를 도시한 것이다.
도 5e는 도 5a에서 레드 뷰를 선택한 경우의 화면 구성의 일 예를 도시한 것이다.
도 6a는 프로젝트 정보를 등록하기 위한 화면 구성의 일 예를 도시한 것이다.
도 6b는 실험 정보를 등록하기 위한 화면 구성의 일 예를 도시한 것이다.
도 6c는 작업 정보를 등록하기 위한 화면 구성의 일 예를 도시한 것이다.
도 6d는 이미지 정보를 등록하기 위한 화면 구성의 일 예를 도시한 것이다.
도 7a는 도 2의 수정 k-최근접 이웃법 적용 과정(220 과정)을 3x3 블럭에 적용한 일 예를 도시한 것이다.
도 7b는 도 2의 입실론 그래프 생성 과정(230 과정)의 일 예를 도시한 것이다.
도 7c는 도 2의 스팟 인덱싱 수행 과정(240 과정)의 일 예를 도시한 것이다.
도 8a은 도 4a의 복제 실험 및 염료교환(dye-swap) 실험의 신뢰도 검증 방법 이 적용된 소프트웨어의 화면 구성을 도시한 것이다.
도 8b는 도 8a에서 비교 버튼을 클릭한 경우의 화면이다.
도 8c는 도 4b의 유효 유전자 검색 방법이 적용된 소프트웨어의 화면 구성을 도시한 것이다.
도 8d는 도 8c에서 복수의 이미지 뷰 중 어느 하나를 클릭한 경우의 화면이다.
도 8e는 도 8c의 유효 유전자를 KOME 주석 정보와 연계시킨 화면이다.
도 8f는 도 4c의 이에스티 기능 검색 방법이 적용된 소프트웨어의 화면 구성을 도시한 것이다.
도 8g는 도 8f에서 복수의 이미지 뷰 중 어느 하나를 클릭한 경우의 화면이다.
본 발명은 DNA 칩에 관한 것으로, 특히, 마이크로어레이 실험 정보의 통합 관리 방법에 관한 것이다.
마이크로어레이 실험도 여타의 생물학 실험과 마찬가지로 실험 설계가 우선되어야 하는데, 실험 설계는 실험 목적에 의존적일 뿐 아니라, 분석 방법을 염두에 두고 결정되어야 한다. 실험의 목적은 두 군간 유의적 차이를 보이는 유전자를 검색하고, 이를 기초로 모집단 선별용 biomarker를 개발하는 연구일 수도 있고, 현재 까지의 임상 기술로 판별이 어려운 Small Round Blue Cell Tumor의 네 가지 서브 타입을 판별하는 것이 목적일 수도 있다. 혹은 초파리의 transcriptome에서 연령, 성별, 유전자型의 세 요인의 교호작용 크기를 파악하는 것이나, 어느 특정 종의 모집단 간,그리고 모집단 내 유전자 발현의 변이 양상을 파악하는 것이 실험의 목적일 수 있으며, 두개의 항암제를 동시에 투여할 때 반응을 보이는 유전자 검색이 연구의 목적일 수도 있다. 연구의 목적에 따라 실험 설계가 달라지고, 분석 방법이 달라지게 되는 것은 물론이다.
마이크로어레이는 실험의 속성상 여러 단계를 거치게 되고, 매단계마다 실험 오차가 개입할 여지가 있으므로 일반적으로 오차가 많은 실험이라고 할 수 있다. 여러 단계에서 누적된 오차는 통계 분석을 어렵게 하는 한 요인이 되고 있지만, 그 보다 더 통계학자들을 '당혹'스럽게 하는 것은 수천 개의 유전자중에서 불과 몇 개를 선별하여야 하는데 분석대상의 관찰치를 구성하는 마이크로어레이는 불과 수십 개에 불과한 이른 바 '큰 p, 작은 n'의 문제를 구성하고 있다는 점이다. 여기서 p는 설명변수의 개수이고, n은 관찰치의 개수를 나타내고 있으며, 전통적으로 통계학자들은 '큰 n, 작은 p' 자료를 주로 다루어 왔으나 마이크로어레이 자료가 대표적인 '큰 p, 작은 n' 자료를 구성하고 있다. 따라서, 마이크로어레이 실험 자료의 통계적 분석은 통계학자들에게도 새로운 도전이 되고 있다.
종래의 마이크로어레이 실험 정보 관리 방법은 계층적인 데이터베이스를 구축할 수 없고, 각 분석 방법을 수행할 때마다 별도의 프로그램을 설치하여야 하고, 각 프로그램마다 데이터 호환이 어려우며, 분석 데이터들을 체계적으로 관리할 수 없는 문제점이 있다.
따라서, 본 발명이 이루고자 하는 첫번째 기술적 과제는 DNA 칩 실험 결과에 대한 계층적인 데이터베이스를 구축하여, 통합 시스템 상에서 각종 통계 분석을 수행하고 그 결과를 가공할 수 있으며, 분석 프로그램간 데이터 호환 문제를 해소하고, 분석 데이터들을 체계적으로 관리할 수 있으며, 현장 연구자가 사용하기 편리한 인터페이스를 제공할 수 있으며, 주어진 상황에 맞는 통계방법을 선택하는 가이드라인을 제공할 수 있는 마이크로어레이 실험 정보의 통합 관리 방법을 제공하는데 있다.
본 발명이 이루고자 하는 두번째 기술적 과제는 상기의 마이크로어레이 실험 정보의 통합 관리 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 있다.
상기의 첫번째 기술적 과제를 이루기 위하여, 본 발명은 DNA 칩 실험에 대한 프로젝트 정보, 실험 정보, 작업 정보 및 이미지 정보를 등록하는 단계, 상기 이미지 정보의 이미지에 대한 블럭 인덱싱 및 스팟 인덱싱을 수행하고 상기 인덱싱된 이미지에 대해 통계 분석을 수행하여 분석 결과를 생성하는 단계 및 상기 분석 결과를 상기 프로젝트 정보, 실험 정보, 작업 정보에 따라 생성된 프로젝트 데이터베이스에 기록하는 단계를 포함하는 마이크로어레이 실험 정보의 통합 관리 방법을 제공한다.
상기의 두번째 기술적 과제를 이루기 위하여, 본 발명은 상기의 마이크로어레이 실험 정보의 통합 관리 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
본 발명은 DNA 칩 실험 결과분석을 위한 통합 시스템에 관한 것이다.
본 발명은 유전체 연구에 있어 상용화된 소프트웨어 보다 사용하기 간편하고 쉽게 활용할 수 있는 통합 소프트웨어를 제공할 수 있고, 이러한 소프트웨어에 따라 연구자들이 주어진 상황에서 가장 적합한 분석 방법을 사용할 수 있도록 적절한 분석 지침을 제공할 수 있다.
본 발명은 DNA칩 분석과 관련된 통계적 방법이 충분히 고려되고, 현장 연구자가 사용하기 편리한 인터페이스를 제공할 수 있으며, 주어진 상황에 맞는 통계방법을 선택하는 가이드라인을 제공하며, 웹기반 시스템으로 구성하는 경우 많은 사용자가 접근 가능하게 할 수 있다.
본 발명에 따른 통합시스템(Integrated Statistical System for Analyzing DNA 칩 Data)의 구성은 다음과 같이 4부분으로 나누어진다.
첫째, 비아이엠에스(Biochip Information Management System, BIMS)로서, 웹 DB를 구성하기 위해 기본 정보를 등록하고 관리하는 부분이다. 둘째는 어레이저(Arrazyer)로서, 마이크로어레이 스캐닝 이미지를 분석하고 인덱싱을 수행하는 부분이다. 셋째는 클릭-S(Click -Statistical System for Analyzing DNA 칩 Data)로서, 다양한 통계 분석을 수행하는 부분이다. 넷째는 레드 뷰(REDVIEW)로서, 통계 분석된 데이터들을 재구성하고 다양한 형태로 변형시켜 출력하는 부분이다.
이하에서는 도면을 참조하여 본 발명의 바람직한 실시 예를 설명하기로 한다. 그러나, 다음에 예시하는 본 발명의 실시 예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 다음에 상술하는 실시 예에 한정되는 것은 아니다.
도 1은 본 발명에 따른 마이크로어레이 실험 정보의 통합 관리 방법의 흐름도이다.
먼저, DNA 칩 실험에 대한 프로젝트 정보, 실험 정보, 작업 정보를 순차적으로 입력한다(110 과정). 이 과정(110 과정)은 계층적인 데이터베이스를 구성하기 위한 준비 과정이다.
바람직하게는, 프로젝트 정보는 프로젝트의 이름, 프로젝트의 타이틀, 프로젝트의 담당자, 프로젝트를 수행하는 대상, 프로젝트에 대한 개요 또는 프로젝트 수행 기간 중 적어도 하나를 포함할 수 있다.
바람직하게는, 실험 정보는 실험의 이름, 실험의 타이틀, 실험의 담당자, DNA 칩의 블럭 개수, DNA 칩 블럭 내의 스팟 개수, DNA 칩의 스팟 총수, 실험에 대한 설명 또는 실험 시작 일시 중 적어도 하나를 포함할 수 있다.
바람직하게는, 작업 정보는 작업의 이름, 작업의 타이틀, DNA 칩의 기본 실험 조건, DNA 칩 실험의 가변 조건, 반복 실험 횟수, DNA 칩 실험의 가변 조건에 대한 수치 정보 또는 작업 방법 중 적어도 하나를 포함할 수 있다.
다음, 데이터베이스의 최하위 단위인 이미지 정보를 등록한다(120 과정). 이때, 이미지 정보는 마이크로어레이 스캐닝 이미지를 포함한다.
이미지 정보가 등록되면, 이미지 정보의 이미지에 대한 블럭 인덱싱 및 스팟 인덱싱을 수행한다(130 과정). 이 과정(130 과정)은 ARRAYZER에 의해 수행될 수 있다.
다음, 인덱싱된 이미지에 대해 통계 분석을 수행하여 분석 결과를 생성한다(140 과정). 이 과정(140 과정)은 CLICK-S나 REDVIEW에 의해 수행될 수 있다.
마지막으로, 분석 결과를 프로젝트 정보, 실험 정보, 작업 정보에 따라 생성된 프로젝트 데이터베이스에 기록한다.
바람직하게는, 프로젝트 데이터베이스는 프로젝트 정보의 하위 정보가 실험 정보이고 실험 정보의 하위 정보가 작업 정보이며 작업 정보의 하위 정보가 이미지 정보가 되도록 계층화되고, 분석 결과가 이미지 정보와 대응되도록 저장되는 형태일 수 있다.
도 2는 도 1의 블럭 인덱싱 및 스팟 인덱싱과 관련하여 자동화된 마이크로어레이 이미지 분석방법의 흐름도이다.
먼저, 마이크로어레이 스캐닝 이미지를 로드한다(210 과정). 마이크로어레이 이미지는 TIFF, GIF, JPG 등의 확장자를 갖는 그림 파일이다.
바람직하게는, 이 과정(210 과정)은 사용자가 정의하는 배율로 마이크로어레이 이미지를 확대 또는 축소시키는 과정을 포함할 수 있다. 바람직하게는, 이 과정(210 과정)은 사용자가 밝기 및 명암비로 마이크로어레이 이미지의 밝기 및 명암을 조정하는 과정을 포함할 수 있다. 바람직하게는, 이 과정(210 과정)은 사용자가 칼라 맵핑 기능을 활성화시키면, 마이크로어레이 이미지에 대하여 각 반점의 색의 강도를 색 파장을 이용하여 복수의 서로 다른 색으로 변환시켜 표시하는 과정을 포 함할 수 있다. 이때, 서로 다른 색으로 변환시키기 위한 맵핑함수의 파라미터를 선택할 수 있다. 바람직하게는, 이 과정(210 과정)은 사용자가 자동 이미지 조절 기능을 활성화시키면, 각 반점의 배경에 대한 대비가 최대가 되는 밝기 및 명암비로 이미지의 밝기 및 명암을 자동으로 조정하는 과정을 포함할 수 있다.
다음, 로드된 이미지 상에서 수정 k-최근접 이웃법을 이용하여 블럭 인덱싱을 수행한다(220 과정). 바람직하게는, 이 과정(220 과정)은 로드된 이미지 상에 수정 k-최근접 이웃법에 의한 선분들을 생성하는 과정을 포함할 수 있다.
블럭 인덱싱이 완료되면, 이미지의 각 블럭 내에서 강도가 소정의 임계값보다 높은 반점을 추출하여 추출된 반점을 정점으로 입실론 그래프를 생성한다(230 과정).
바람직하게는, 이 과정(230 과정)은 블럭 인덱싱에 의한 각 블럭의 행 및 열 번호를 입력하고, 양의 정수인 입실론 값을 입력하는 과정, 각 블럭마다 입실론 그래프를 생성하고, 각 블럭에서 열 우선으로 인덱스가 가장 빠른 반점의 행 및 열의 인덱스를 표시하는 과정, 각 블럭의 시작 반점의 행 및 열의 인덱스가 화면에 표시된 행 및 열의 인덱스와 일치하지 않으면 입실론 값을 다른 값으로 변경하는 과정을 포함할 수 있다.
다음, 생성된 입실론 그래프를 이용하여 스팟 인덱싱을 수행한다(240 과정).
마지막으로, 스팟 인덱싱을 수행한 각 반점에 포함된 픽셀들을 분석하여 각 반점에 대한 프로파일 정보를 생성한다. 이때, 프로파일 정보는 유전자의 이름, 각 반점이 속한 블럭의 행 및 열의 인덱스, 각 반점의 행 및 열의 인덱스, 형광물질에 따른 강도 평균, 형광물질에 따른 픽셀 수 및 형광물질에 따른 강도의 합을 포함한다. 바람직하게는, 프로파일 정보는 포어그라운드 및 백그라운드의 임계값을 결정하기 위해 맨-휘트니 테스트를 이용할 수 있다.
도 3은 도 1의 통계 분석과 관련하여 마이크로 어레이 통합 분석 방법의 흐름도이다.
도 3의 마이크로 어레이 통합 분석 방법은 대용량의 데이터 베이스를 처리할 수 있는 컴퓨터 시스템, 서버 및 클라이언트를 포함하는 네트워크 시스템 또는 이와 유사한 처리 능력을 갖는 시스템 상에서 구현되는 것을 가정한다.
먼저, 실험 설계, 표준화, 추정과 검정, 군집 분석 및 분류로 구성된 상위 메뉴의 아이템을 화면으로 출력한다(310 과정).
아이템 중 실험 설계가 선택되면(321 과정), 염료교환(dye-swap), 기준설계(reference design) 또는 루프설계(loop design) 중 어느 하나의 실험 디자인을 선택하는 인터페이스와 선택된 실험 디자인에 사용될 설계 파라미터를 입력하는 인터페이스를 디스플레이하여, 사용자의 파라미터 입력에 따라 설계 파라미터들을 지정시킨다(331 과정). 다음, 입력된 설계 파라미터를 이용하여 선택된 실험 디자인에 대한 아노바 설계 매트릭스를 생성한다(332 과정).
한편, 아이템 중 표준화가 선택되면(322), 슬라이드 정보를 입력받고, 입력된 슬라이드 정보를 이용한 단일 슬라이드 표준화, 단일 배치 표준화 및 다중 슬라이드 표준화를 순차적으로 수행하여 표준화 결과를 생성한다(342 과정). 생성된 표준화 결과는 파일로 저장하여 추정과 검정, 군집 분석 및 분류의 수행과정에서 독 출되도록 한다(343 과정).
한편, 아이템 중 추정과 검정이 선택되면(323 과정), 표준화 결과를 독출한다(351 과정). 다음, 독출된 표준화 결과에 대해, 소정의 추정 방법을 수행하여 마이크로어레이 실험에서 유의한 유전자를 추정하고, 추정된 유전자에 따른 잘못 발견할 확률을 연산한다(352 과정). 이때, 소정의 추정 방법은 뉴턴 분석(Newton's method) 방법, B 통계량(B-statistic) 방법, 조정유의확률 방법(ADP), 에스에엠(Significant Analysis of Microarray, SAM) 그리고 이비에이엠(Empirical Bayes Analysis of Microarray, EBAM) 등의 분석방법을 포함한다. 다음, 추정된 유전자 정보, 잘못 발견할 확률을 포함하는 데이터들을 데이터 베이스에 저장하여 이하의 다른 분석 과정에서 참조되도록 한다(353 과정).
한편, 아이템 중 군집 분석이 선택되면(324 과정), 표준화 결과를 독출한다(361 과정). 다음, 독출된 표준화 결과를 이용하여 소정의 군집 분석을 수행하여 생성된 군집 분석 결과를 그래프로 디스플레이한다(362 과정). 이때, 소정의 군집 분석은 계층적 군집 분석(hierachical clustering), K-평균 군집 분석(k-means clustering), 주성분 분석(PCA: Principal Component Analysis), 자기조직도(SOM: Self-Organizing Map), 진쉐이빙(geneshaving) 등을 포함한다. 다음, 군집 분석 결과를 데이터 베이스에 저장하여 이하의 다른 분석 과정에서 참조되도록 한다(363 과정).
한편, 아이템 중 분류가 선택되면, 표준화 결과를 독출한다(371 과정).
다음, 독출된 표준화 결과를 이용하여 처리군 간의 변동과 처리군 내에서의 변동의 비를 연산하고, 연산된 변동의 비를 이용하여 후보 유전자를 선정한다(372 과정). 또한, 선정된 후보 유전자에 대해 소정의 분류를 수행하여 위에서 정한 설계 파라미터 특히, 각각의 처리군에 유의한 유전자가 분류된 그룹과 오분류율을 출력한다(372 과정). 이때, 소정의 분류는 고전적 분류 방법(DLDA, DQDA)과 Tree 방법(또는 의사결정 나무(Decision Tree))를 포함한다. 다음, 유의한 유전자가 분류된 그룹 정보 및 오분류율을 데이터 베이스에 저장하여 다른 분석 과정에서 참조되도록 한다(373 과정).
마지막으로, 모든 분석이 종료되었는지 판단한다(380 과정). 이 과정(380 과정)은 사용자에게 모든 과정을 종료 시킬 것인지 아니면 다른 분석을 연이어 수행할 것인지 선택을 요청하는 메시지를 출력하고, 사용자로부터 선택 결과를 입력받는 과정을 포함할 수 있다. 이때, 사용자가 모든 분석의 종료를 선택하면 모든 과정을 종료하고, 그렇지 않으면 위의 과정들(310-380 과정)을 반복한다.
따라서, 본 발명에 따른 CLICK-S는 마이크로어레이 스캐닝 이미지에 대해 블럭 인덱싱 및 스팟 인덱싱을 수행하여 생성된 이미지 자료를 통계적으로 분석하는 소프트웨어에 관한 것이다. 본 발명에 적용되는 CLICK-S는 크게 다섯 분야로 구분된다. 즉, 실험 설계, 표준화, 추정과 검정, 군집 분석 그리고 분류이다.
먼저, 실험 설계는 염료교환(dye-swap), 기준설계(reference design), 루프설계(loop design)에 대한 설계 파라미터 지정 및 그 분석 방법을 제공한다.
표준화는 단일 슬라이드 표준화, 염료교환(dye-swap) 표준화, 다중 슬라이드 표준화 그리고 단일 슬라이드 배치 방법을 제공한다. 단일 슬라이드 표준화는 평균 표준화, 강도 의존 표준화, 프린트 팁 표준화, 스케일 표준화 방법이 가능하고, 다중 슬라이드 표준화는 다중 스케일 표준화와 변위치 표준화 방법이 가능하다. 추정과 검정에서는 유의한 유전자를 추정하고 검정하는 방법을 제공한다. 군집 분석은 유의한 유전자를 각 군집별로 분류하는 방법이다. 마지막으로, 분류에서는 고전적 분류 방법(DLDA, DQDA)과 Tree 방법이 가능하다.
도 4a는 도 1의 통계 분석과 관련하여 복제 실험 및 염료교환(dye-swap) 실험의 신뢰도 검증 방법의 흐름도이다.
먼저, 복수의 서로 다른 실험조건에 각각 할당된 복수의 DNA 칩들 중에서 복제 실험용 DNA 칩 및 염료교환(dye-swap) 실험용 DNA 칩을 선택한다(411 과정). 이때, DNA 칩 선택은 마우스를 이용한 클릭, 키보드의 단축키 입력, 터치 스크린을 직접 터치하는 등의 방식을 이용할 수 있다. 이때, 복수의 서로 다른 실험 조건은 COLD, COLD & ABA, SALT, SALT & ABA를 포함할 수 있다.
바람직하게는, 이 과정(411 과정)은 복수의 DNA 칩들 중에서 어느 하나의 DNA 칩을 선택하면, DNA 시퀀스 정보, 단백질 시퀀스 정보, 기능 정보 및 단백질 구조 정보를 포함하는 이에스티(EST) 주석 정보를 디스플레이하는 과정을 포함할 수 있다.
다음, 선택된 복제 실험용 DNA 칩과 염료교환(dye-swap) 실험용 DNA 칩 사이의 강도 차이 값을 입력한다(412 과정).
마지막으로, 선택된 복제 실험용 DNA 칩과 염료교환(dye-swap) 실험용 DNA 칩 상에서 입력된 강도 차이 이상에 해당하는 반점 영역을 디스플레이한다(413 과 정). 이를 위해, 마이크로어레이 스캐닝 이미지 또는 데이터베이스 등으로부터 각 반점(스팟)의 강도를 미리 연산하여 저장하는 과정을 선행할 수 있다.
도 4b는 도 1의 통계 분석과 관련하여 유효 유전자 검색 방법의 흐름도이다.
먼저, 복수의 DNA 칩들을 이용하여 복수의 서로 다른 실험조건마다 유효한 유전자 정보를 생성한다(421 과정). 이 과정(421 과정)은 사전처리 과정으로서, 데이터 베이스 구축과정이다.
다음, 복수의 서로 다른 실험조건의 리스트를 디스플레이한다(422 과정). 이때, 리스트는 테이블 형식으로 출력하고, 리스트의 각 항목을 선택할 수 있는 수단을 함께 표시할 수 있다.
복수의 서로 다른 실험조건의 리스트가 디스플레이되면, 복수의 서로 다른 실험조건 중 어느 하나의 실험 조건을 선택한다(423 과정). 이때, 실험 조건 선택은 마우스를 이용한 클릭, 키보드의 단축키 입력, 터치 스크린을 직접 터치하는 등의 방식을 이용할 수 있다. 이때, 복수의 서로 다른 실험 조건은 COLD, COLD & ABA, SALT, SALT & ABA를 포함할 수 있다.
마지막으로, 생성된 유전자 정보로부터 선택된 실험조건에 유효한 반점이 DNA 칩 상에서 위치한 블럭 정보, 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 추출하고, 추출된 정보를 테이블로 디스플레이한다(424 과정). 바람직하게는, 이 과정(424 과정)은 유효한 반점의 블럭 정보, 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 DNA 칩 이미지 상에 디스플레이하는 과정을 포함할 수 있다.
도 4c는 도 1의 통계 분석과 관련하여 EST 기능 검색 방법의 흐름도이다.
먼저, 복수의 DNA 칩들에 포함된 EST를 기능별 카테고리에 따라 분류하여 기능 그룹 정보를 생성한다(431 과정). 이 과정(431 과정)은 사전처리 과정으로서, 데이터 베이스 구축과정이다.
다음, 기능별 카테고리의 리스트를 디스플레이한다(432 과정). 이때, 리스트는 테이블 형식으로 출력하고, 리스트의 각 항목을 선택할 수 있는 수단을 함께 표시할 수 있다.
기능별 카테고리의 리스트를 디스플레이되면, 기능별 카테고리 중 어느 하나를 선택한다(433 과정). 이때, 기능별 카테고리 선택은 마우스를 이용한 클릭, 키보드의 단축키 입력, 터치 스크린을 직접 터치하는 등의 방식을 이용할 수 있다.
기능별 카테고리 중 어느 하나가 선택되면, 선택된 카테고리에 해당하는 EST를 기능 그룹 정보로부터 추출하고, 추출된 EST가 DNA 칩 상에서 위치한 블럭 정보, 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 테이블로 디스플레이한다(434 과정). 바람직하게는, 이 과정(434 과정)은 추출된 EST의 블럭 정보, 상기 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 DNA 칩 이미지 상에 디스플레이하는 과정을 포함할 수 있다.
바람직하게는, 기능별 카테고리는 전사 인자, 수용체 유사 단백질 키나아제, 단백질 포스파타아제 및 해독을 포함하는 유전자 발현 정보일 수 있다.
도 4d는 도 1의 통계 분석과 관련하여 실험용 프라이머 정보를 제공하는 데이터베이스 구축 방법의 흐름도이다.
먼저, EST 서열 데이터를 수집하고, EST 서열 데이터를 이용하여 크로마토그 램 파일을 생성한다(441 과정). 이때, EST 서열 데이터는 농업과학시술원(NIAST) 등으로 부터 수질될 수 있다.
다음, 크로마토그램 파일을 분석툴에 적용하여 분석결과를 생성한다(442 과정). 이때, 분석툴로 Finch-Suite를 사용할 수 있다.
분석결과가 생성되면, 분석결과로부터 클론 정보를 추출하고, 분석결과를 주석생성툴에 적용하여 주석 정보를 생성하며, 분석결과를 EST 클러스터링 툴에 적용하여 프라이머 정보를 생성한다(443 과정). 이때, 주석생성툴은 Pedant-Pro를 사용하고, 클러스터링 툴은 StackPack을 사용할 수 있다. 또한 프라이머 정보를 생성하기 위한 툴로써 EST 클러스터 정보를 이용하는 Prime을 사용할 수 있다.
마지막으로, 클론 정보, 주석 정보 및 프라이머 정보를 조합하여 프라이머 데이터 베이스를 생성한다(444 과정). 바람직하게는, 프라이머 데이터 베이스를 복수의 클라이언트 컴퓨터와 네트워크로 연결된 서버용 컴퓨터에 저장하고, 클라이언트 컴퓨터에서 키워드를 입력하면 입력된 키워드와 관련된 정보를 프라이머 데이터 베이스로부터 추출하여 클라이언트 컴퓨터로 출력하도록 하는 시스템을 설계할 수 있다. 바람직하게는, 이 과정(444 과정)은 프라이머를 이용하여 실험적으로 증폭하고 염기서열을 분석 및 확인한 후 프라이머의 정보를 데이터베이스에 기록하는 과정을 포함할 수 있다.
이때, 프라이머 정보는 실험용 프라이머 설계를 위한 각종의 파라미터 정보를 포함할 수 있다.
도 5a는 본 발명의 마이크로어레이 실험 정보의 통합 관리 방법이 적용된 통 합 시스템의 메인 화면의 일 예를 도시한 것이다.
도 5b는 도 5a에서 BIMS를 선택한 경우의 화면 구성의 일 예를 도시한 것이다.
BIMS는 다른 응용시스템들이 정보를 공유할 수 있도록 바이오 칩 관련 프로젝트를 등록하고, 실험설계 전 과정과 실험결과를 데이터 베이스화하여 자료를 통합, 저장, 관리하는 시스템이다. 또한, 사용자의 모든 요구를 수행할 수 있도록 각 단계별 구조와 이들 사이의 인터페이스를 원활히 하고, 응용시스템이 요구하는 데이터를 전체적으로 수집, 가공 관리한다. BIMS는 마이크로어레이 실험 단계에 맞게 설계된 데이터 단위에 따라 데이터를 등록할 수 있다. BIMS는 다음과 같이 구성된다.
프로젝트 정보(Project)는 생물학자들이 실험에서 최종적인 결과를 얻기 위해 하는 일련의 모든 실험과정으로, 하나 또는 그 이상의 experiment의 집합을 나타낸다. 실험 정보(Experiment)는 마이크로어레이 실험에서 마이크로어레이 디자인이 같고, 실험 조건을 다르게 한 work들의 집합을 나타낸다. 작업 정보(Work)는 실험 조건이 같고, 마이크로어레이 실험에서 사용된 마이크로어레이 디자인이 같은 shot들의 집합을 나타낸다. 이미지 정보(Shot)는 마이크로어레이 데이터의 가장 단위로, 물리적인 red, green 채널 혹은 두개의 채널을 더한 RG 채널을 가진 이미지 하나를 나타낸다.
도 5c는 도 5a에서 ARRAYZER를 선택한 경우의 화면 구성의 일 예를 도시한 것이다.
ARRAYZER는 이미지 분석 프로그램이다. 이미지 분석은 서버 상에서 이루어지는 것이 아니라, 개별 사용자가 이미지 분석 툴을 다운 받아 로컬에서 분석 후 각각의 이미지에 대한 분석 파일을 같은 위치의 BIMS(웹 DB)에 등록하도록 통합 시스템을 구성할 수 있다.
도 5d는 도 5a에서 CLICK-S를 선택한 경우의 화면 구성의 일 예를 도시한 것이다.
CLICK-S는 마이크로어레이 스캐닝 이미지에 대해 블럭 인덱싱 및 스팟 인덱싱을 수행하여 생성된 이미지 자료를 통계적으로 분석하는 소프트웨어이다. 본 발명에 따른 CLICK-S는 크게 다섯 분야로 구분된다. 즉, 실험 설계, 표준화, 추정과 검정, 군집 분석 그리고 분류이다.
먼저, 실험 설계는 염료교환(dye-swap), 기준설계(reference design), 환 설계에 대한 파라미터 지정 및 그 분석 방법을 제공한다.
표준화는 단일 슬라이드 표준화, 염료교환(dye-swap) 표준화, 다중 슬라이드 표준화 그리고 단일 슬라이드 배치 방법을 제공한다. 단일 슬라이드 표준화는 평균 표준화, 강도 의존 표준화, 프린트 팁 표준화, 스케일 표준화 방법이 가능하고, 다중 슬라이드 표준화는 다중 스케일 표준화와 변위치 표준화 방법이 가능하다. 추정과 검정에서는 유의한 유전자를 추정하고 검정하는 방법을 제공한다. 군집 분석은 유의한 유전자를 각 군집별로 분류하는 방법이다. 마지막으로, 분류에서는 고전적 분류 방법(DLDA, DQDA)과 Tree 방법이 가능하다.
도 5e는 도 5a에서 REDVIEW를 선택한 경우의 화면 구성의 일 예를 도시한 것 이다.
REDVIEW는 기능별 관련 유전자 발현패턴 분석을 하는 프로그램이다. REDVIEW는 벼 reference chip 활용을 위한 데이터베이스 및 웹 인터페이스를 제공할 수 있다.
본 발명에 따른 BIMS는 DNA 칩 실험 데이터를 관리하기 위한 일종의 LIMS이다. DNA 칩 결과는 여러 가지 단계를 거쳐서 얻어지는데, 각 단계에서 얻어지는 데이터들은 최종적으로 의미있는 결과를 얻기 위해서 필요하다. 따라서 이러한 데이터를 저장할 수 있는 마이크로어레이 실험 및 분석에 적합한 관리시스템이 필요하다. BIMS는 DNA 칩 실험 조건 및 분석 결과와 같은 여러 가지 형태의 DNA 칩 정보를 웹 기반으로 관리하는 시스템이다.
BIMS는 DNA 칩 실험 단계에 맞게 설계된 데이터의 단위에 따라 데이터를 등록할 수 있다. BIMS의 데이터 단위는 다음과 같다.
이미지 정보(Shot)는 DNA 칩 데이터의 가장 작은 단위로, 물리적인 red, green 채널 혹은 두개의 채널을 더한 RG 채널을 가진 이미지 하나를 나타낸다. 작업 정보(Work)는 실험 조건이 같고, DNA 칩 실험에서 사용된 DNA 칩 디자인이 같은 shot들의 집합을 나타낸다. 실험 정보(Experiment)는 DNA 칩 실험에서 DNA 칩 디자인이 같고, 실험 조건을 다르게 한 work들의 집합을 나타낸다. 즉 서로 같은 어레이 디자인에서 다양한 조건으로 실험한 work들의 집합이다. 프로젝트 정보( Project)는 생물학자들이 실험에서 최종적인 결과를 얻기 위해 하는 일련의 모든 실험 과정으로, 하나 또는 그 이상의 experiment의 집합을 나타낸다. 즉 어레이 디 자인이 다르고, 다른 유전자로 다양한 실험 조건으로 실험한 것을 말한다.
BIMS에서는 데이터를 계층적으로 관리한다.
도 6a는 프로젝트 정보를 등록하기 위한 화면 구성의 일 예를 도시한 것이다.
Project는 최종적인 결과를 얻기 위해 하는 일련의 실험으로 구성된 것으로, DNA 칩 디자인이 다르고 다른 유전자로 다양한 실험 조건에서 실험한 것이다. 프로젝트 정보는 BIMS에서 관리하는 데이터 단위 중 최상위에 있는 것이다. 프로젝트 정보를 맨 처음 등록하도록 메뉴 및 화면을 구성할 수 있다.
도 6a에서, Project에는 프로젝트의 이름을 등록하고, Title에는 프로젝트에 대한 타이틀을 등록한다. Project Manager에는 프로젝트의 총괄 관리하는 담당자를 등록하고, Object에는 프로젝트를 수행하는 대상을 등록한다. Description에는 프로젝트에 대한 개요 및 설명을 등록하고, Period of Project에는 프로젝트를 수행한 기간을 등록한다.
도 6b는 실험 정보를 등록하기 위한 화면 구성의 일 예를 도시한 것이다.
Experiment는 같은 마이크로어레이 디자인에서 다양한 실험 조건으로 실험한 Work들의 집합으로 Project 바로 아래 계층에 속한다. 프로젝트 정보를 등록한 후에 실험 정보를 등록하도록 메뉴 및 화면을 구성할 수 있다.
도 6b에서, Experiment에는 실험 명을 등록하고, Title에는 Experiment에 대한 타이틀을 등록한다. Experiment Manager에는 Experiment를 관리하는 담당자를 등록하고, Block Row, Block Column에는 DNA 칩의 Block 개수를 등록하며, SubBlock Row, SubBlock Column에는 DNA 칩 Block 내의 spot 개수를 등록한다. Spot Number에는 DNA 칩의 총 spot 개수를 등록하고, Description에는 Experiment에 대한 설명을 등록한다. Start Date에는 Experiment를 시작한 일시를 등록한다.
도 6c는 작업 정보를 등록하기 위한 화면 구성의 일 예를 도시한 것이다.
Work는 Experiment 아래 계층에 속하며, 조건 및 시간을 다르게 하여 작업한 데이터를 등록한다.
도 6c에서, Work에는 작업 명을 등록하고, Title에는 Work에 대한 타이틀을 등록한다. Base Condition에는 DNA 칩의 기본적인 실험 조건을 등록하고, Variable Condition에는 DNA 칩 실험에서 시간과 같은 가변적인 조건을 등록한다. Method에는 work 방법을 등록하는 것으로서 'No Duplication', 'Slide Duplication', 'Gene Duplication', 'Channel Swapping' 중에서 하나를 선택하도록 인터페이스를 구성할 수 있다.
도 6d는 이미지 정보를 등록하기 위한 화면 구성의 일 예를 도시한 것이다.
DNA 칩 데이터 중 가장 작은 단위로써, DNA 칩에 대한 이미지 정보를 등록한다.
도 6d에서, Channel에는 DNA 칩 이미지의 형태를 등록하는 것으로 'Channel Red', 'Channel Green', 'Composite' 중에서 하나를 선택하도록 인터페이스를 구성할 수 있다. Replication에는 몇 번째 반복된 이미지인지 등록하고, Variable Title에는 variable 조건에 대한 타이틀을 등록한다. Shot Image에는 최종적으로 DNA 칩 이미지를 등록한다.
본 발명에 따른 ARRAYZER는 Java(JDK 1.3)를 이용하여 구현되어, 시스템에 독립적으로 작동할 수 있다. 그러므로 일반적인 시스템 종속적인 프로그램과 달리 JAR파일을 이용하여 모든 시스템에 그대로 동작할 수 있다. ARRAYZER는 고화질, 고용량의 이미지 처리를 요구하기 때문에 대용량의 메모리와 고속 컴퓨팅 능력의 시스템을 요구한다.
도 7a는 도 2의 수정 k-최근접 이웃법 적용 과정(220 과정)을 3x3 블럭에 적용한 일 예를 도시한 것이다.
마이크로 어레이 이미지 분석시 필요한 블럭 인덱싱(block indexing)과정을 수정 k-최근접 이웃법(Modified K-Nearest Neighbor)을 이용하여 자동화한다. 도 7a는 3x3 블럭(block)을 자동 블럭 인덱싱(Auto block indexing)한 결과이다.
도 7b는 도 2의 입실론 그래프 생성 과정(230 과정)의 일 예를 도시한 것이다.
마이크로 어레이 이미지 분석시 필요한 스팟 인덱싱(Spot indexing)과정을 입실론 그래프(epsilon graph)를 이용하여 자동화한다. 도 7b는 강도(intensity)가 높은 반점을 추출하여 각각의 반점을 정점으로 하여 만들어진 입실론 그래프(epsilon graph)와 입실론 그래프(epsilon graph)를 이용하여 스팟 인덱싱(spot indexing)한 결과이다.
입실론 그래프는 특정 반점에서 상하 및 좌우로 이웃한 반점들에 대한 검색을 할 때, 위 특정 반점에서 x좌표의 차나 y좌표의 차가 ε범위 이내에 존재하는 반점들 중 가장 가까운 반점들과 에지를 연결하여 입실론 그래프를 구성하게 된다.
도 7c는 도 2의 스팟 인덱싱 수행 과정(240 과정)의 일 예를 도시한 것이다.
도 7b의 입실론 그래프(epsilon graph)에서 스팟 인덱싱(spot indexing)을 하면 도 7c와 같이 각각의 반점에 대하여 원으로 표시되며, 각각의 원 이내에 있는 픽셀들을 분석할 수 있다.
한편, 본 발명에 따른 CLICK-S에서, 실험 설계, 표준화, 추정과 검정, 군집 분석 및 분류를 표시하는 상위 메뉴, 기타 인터페이스는 자바 서버 페이지(JSP)를 이용하여 구현될 수 있다.
본 발명에 따른 CLICK-S에서, 각 구성 요소인 실험 설계, 표준화, 추정과 검정, 군집 분석 및 분류는 데이터 베이스를 공유하는 별도의 자바 애플릿으로 구현될 수 있다. 또한, 표준화에 포함된 단일 슬라이드 표준화, 염료교환(dye-swap) 표준화, 다중 슬라이드 표준화 그리고 단일 슬라이드 배치 방법을 별도의 자바 애플릿으로 구현할 수 있다. 마찬가지로, 추정과 검정에 포함된 뉴턴(Newton) 방법, B 통계량(B-statistic) 방법, 조정유의확률 방법(ADP), SAM 그리고 EBAM 의 분석방법을 별도의 자바 애플릿으로 구현할 수 있다. 또한, 군집 분석에 포함된 계층적 군집 분석, k-평균 군집 분석, 주성분 분석, 자기조직도, 진쉐이빙을 별도의 자바 애플릿으로 구현할 수 있다.
도 8a은 도 4a의 복제 실험 및 염료교환(dye-swap) 실험의 신뢰도 검증 방법이 적용된 소프트웨어의 화면 구성을 도시한 것이다.
도 8a에 도시된 DNA 칩 뷰어는 rice EST의 주석정보와 레퍼런스 칩(reference chip) 정보를 연계한 DNA 칩 뷰어이다. 도 8a의 화면에는 4가지 실험 조건에 대한 32 세트의 DNA 칩 정보가 있다. DNA 칩 번호를 클릭하면 각각의 DNA 칩정보를 볼 수 있으며, 복제 실험(Duplication Experiment)과 염료교환 실험(Dye-swap Experiment)에 해당하는 두 가지 chip 번호를 선택한 후 chip간의 강도(intensity) 차이 값을 넣고, 비교(comparison)을 클릭하면 복제(Duplication) 및 염료교환 실험(Dye-swap Experiment)의 신뢰성을 시각적으로 쉽게 파악할 수 있는 이미지가 제공된다. 도 8a는 4가지 실험 조건과 2가지 시간경과에 따른 DNA 칩 정보를 검색할 수 있는 화면이다.
도 8b는 도 8a에서 비교 버튼을 클릭한 경우의 화면이다.
도 8b는 복제 실험(Duplication Experiment), 염료교환 실험(Dye-swap Experiment)을 쉽게 시각적으로 검증할 수 있는 이미지 뷰어이다. DNA 칩 정보 검색 화면에서 두 가지 DNA 칩을 선택한 후, DNA 칩 사이의 강도(intensity) 차이 값을 설정한 후 클릭하면, 강도(intensity) 차이 값 이상 되는 반점(spot) 영역이 아래쪽에 진하게 나타남으로써 쉽게 실험(Experiment)의 정확성을 1차적으로 감별할 수 있다.
도 8c는 도 4b의 유효 유전자 검색 방법이 적용된 소프트웨어의 화면 구성을 도시한 것이다.
도 8c의 화면은 32세트의 DNA 칩을 통계적으로 분석하여 8가지 조건에 따른 유효한 유전자 정보를 보여준다. 도 8c는 유전자 뷰어(Gene viewer)의 초기 화면으로써 8가지의 조건에 대해서 정보를 검색할 수 있는 화면이다. 정보 검색은 테이블 형태와 이미지 형태로 볼 수 있다.
도 8d는 도 8c에서 복수의 이미지 뷰 중 어느 하나를 클릭한 경우의 화면이다. 도 8e는 도 8c의 유효 유전자를 KOME 주석 정보와 연계시킨 화면이다.
도 8f는 도 4c의 EST 기능 검색 방법이 적용된 소프트웨어의 화면 구성을 도시한 것이다.
예를 들어, 기능 뷰어(Function viewer)는 14가지의 기능별 카테고리(function caterogy)에 따라서 rice EST를 분류할 수 있다. 바람직하게는, 14가지의 기능별 카테고리는 전사 인자, 수용체 유사 단백질 키나아제, 단백질 포스파타아제 및 해독을 포함하는 유전자 발현 정보일 수 있다.
도 8g는 도 8f에서 복수의 이미지 뷰 중 어느 하나를 클릭한 경우의 화면이다. 도 8g는 기능 그룹(Function Group)에 속하는 rice EST 검색결과이다.
바람직하게는, 본 발명의 마이크로어레이 실험 정보의 통합 관리 방법을 컴퓨터에서 실행시키기 위한 프로그램을 컴퓨터로 읽을 수 있는 기록매체에 기록하여 제공할 수 있다.
본 발명은 소프트웨어를 통해 실행될 수 있다. 소프트웨어로 실행될 때, 본 발명의 구성 수단들은 필요한 작업을 실행하는 코드 세그먼트들이다. 프로그램 또는 코드 세그먼트들은 프로세서 판독 가능 매체에 저장되거나 전송 매체 또는 통신망에서 반송파와 결합된 컴퓨터 데이터 신호에 의하여 전송될 수 있다.
컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 테이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, DVD±ROM, DVD-RAM, 자기 테이프, 플로피 디 스크, 하드 디스크(hard disk), 광데이터 저장장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 장치에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
본 발명은 도면에 도시된 일 실시 예를 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시 예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 발명의 기술적 보호범위내에 있다고 보아야 한다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해서 정해져야 할 것이다.
상술한 바와 같이, 본 발명에 의하면, DNA 칩 실험 결과에 대한 계층적인 데이터베이스를 구축하여, 통합 시스템 상에서 각종 통계 분석을 수행하고 그 결과를 가공할 수 있으며, 분석 프로그램간 데이터 호환 문제를 해소하고, 분석 데이터들을 체계적으로 관리할 수 있으며, 연구자들이 주어진 상황에서 가장 적합한 분석 방법을 사용할 수 있도록 적절한 분석 지침을 제공할 수 있고, 현장 연구자가 사용하기 편리한 인터페이스를 제공할 수 있으며, 주어진 상황에 맞는 통계방법을 선택하는 가이드라인을 제공하며, 웹기반 시스템으로 구성하는 경우 많은 사용자가 접근 가능하게 할 수 있는 효과가 있다.

Claims (9)

  1. DNA 칩 실험에 대한 프로젝트 정보, 실험 정보, 작업 정보 및 이미지 정보를 등록하는 단계;
    상기 이미지 정보의 이미지에 대한 블럭 인덱싱 및 스팟 인덱싱을 수행하고 상기 인덱싱된 이미지에 대해 통계 분석을 수행하여 분석 결과를 생성하는 단계; 및
    상기 분석 결과를 상기 프로젝트 정보, 실험 정보, 작업 정보에 따라 생성된 프로젝트 데이터베이스에 기록하는 단계를 포함하는 마이크로어레이 실험 정보의 통합 관리 방법.
  2. 제 1 항에 있어서,
    상기 프로젝트 정보는
    프로젝트의 이름, 프로젝트의 타이틀, 프로젝트의 담당자, 프로젝트를 수행하는 대상, 프로젝트에 대한 개요 또는 프로젝트 수행 기간 중 적어도 하나를 포함하고,
    상기 실험 정보는
    실험의 이름, 실험의 타이틀, 실험의 담당자, DNA 칩의 블럭 개수, DNA 칩 블럭 내의 스팟 개수, DNA 칩의 스팟 총수, 실험에 대한 설명 또는 실험 시작 일시 중 적어도 하나를 포함하고,
    상기 작업 정보는
    작업의 이름, 작업의 타이틀, DNA 칩의 기본 실험 조건, DNA 칩 실험의 가변 조건, 반복 실험 횟수, 상기 DNA 칩 실험의 가변 조건에 대한 수치 정보 또는 작업 방법 중 적어도 하나를 포함하는 것을 특징으로 하는 마이크로어레이 실험 정보의 통합 관리 방법.
  3. 제 1 항에 있어서,
    상기 프로젝트 데이터베이스는
    상기 프로젝트 정보의 하위 정보가 상기 실험 정보이고 상기 실험 정보의 하위 정보가 상기 작업 정보이며 상기 작업 정보의 하위 정보가 상기 이미지 정보가 되도록 계층화되고, 상기 분석 결과가 상기 이미지 정보와 대응되도록 저장되는 형태인 것을 특징으로 하는 마이크로어레이 실험 정보의 통합 관리 방법.
  4. 제 1 항에 있어서,
    상기 분석 결과를 생성하는 단계는
    상기 이미지 정보에 대응하는 마이크로어레이 스캐닝 이미지를 로드하는 단계;
    상기 이미지 상에서 수정 k-최근접 이웃법을 이용하여 블럭 인덱싱을 수행하는 단계; 및
    상기 이미지의 각 블럭 내에서 강도가 소정의 임계값보다 높은 반점을 추출 하여 추출된 반점을 정점으로 입실론 그래프를 생성하고, 상기 입실론 그래프를 이용하여 스팟 인덱싱을 수행하는 단계를 포함하는 것을 특징으로 하는 마이크로어레이 실험 정보의 통합 관리 방법.
  5. 제 1 항에 있어서,
    상기 분석 결과를 생성하는 단계는
    상기 인덱싱된 이미지를 슬라이드 정보에 적용하고, 실험 설계, 표준화, 추정과 검정, 군집 분석 및 분류로 구성된 상위 메뉴의 아이템을 디스플레이하는 단계;
    상기 아이템 중 상기 실험 설계가 선택되면, 염료교환, 기준설계 또는 루프설계 중 어느 하나의 실험 디자인을 선택하는 인터페이스와 상기 선택된 실험 디자인에 사용될 설계 파라미터를 입력하는 인터페이스를 디스플레이하고, 상기 입력된 설계 파라미터를 이용하여 상기 선택된 실험 디자인에 대한 아노바 설계 매트릭스를 생성하는 단계;
    상기 아이템 중 상기 표준화가 선택되면, 상기 슬라이드 정보를 이용한 단일 슬라이드 표준화, 단일 배치 표준화 및 다중 슬라이드 표준화를 순차적으로 수행하여 표준화 결과를 생성하는 단계;
    상기 아이템 중 상기 추정과 검정이 선택되면, 상기 표준화 결과에 대해, 소정의 추정 방법을 수행하여 마이크로어레이 실험에서 유의한 유전자를 추정하고, 상기 추정된 유전자에 따른 잘못 발견할 확률을 연산하는 단계;
    상기 아이템 중 상기 군집 분석이 선택되면, 상기 표준화 결과를 이용하여 소정의 군집 분석을 수행하여 생성된 군집 분석 결과를 그래프로 디스플레이하는 단계; 및
    상기 아이템 중 상기 분류가 선택되면, 상기 표준화 결과 및 처리군 간의 변동과 처리군 내에서의 변동의 비를 이용하여 후보 유전자를 선정하고, 상기 후보 유전자에 대해 소정의 분류를 수행하여 상기 설계 파라미터에 유의한 유전자가 분류된 그룹과 오분류율을 출력하는 단계를 실행하는 단계를 더 포함하는 것을 특징으로 하는 마이크로어레이 실험 정보의 통합 관리 방법.
  6. 제 1 항에 있어서,
    상기 분석 결과를 생성하는 단계는
    상기 인덱싱된 이미지를 실험 조건별로 분류하고, 상기 실험 조건 중 어느 하나의 실험 조건에서 복제 실험용 DNA 칩 및 염료교환 실험용 DNA 칩을 선택하는 단계;
    상기 선택된 복제 실험용 DNA 칩과 염료교환 실험용 DNA 칩 사이의 강도 차이 값을 입력하는 단계; 및
    상기 선택된 복제 실험용 DNA 칩과 염료교환 실험용 DNA 칩 상에서 상기 입력된 강도 차이 이상에 해당하는 반점 영역을 디스플레이하는 단계를 포함하는 것을 특징으로 하는 마이크로어레이 실험 정보의 통합 관리 방법.
  7. 제 1 항에 있어서,
    상기 분석 결과를 생성하는 단계는
    상기 인덱싱된 이미지를 이용하여 복수의 서로 다른 실험조건마다 유효한 유전자 정보를 생성하는 단계;
    상기 복수의 서로 다른 실험조건의 리스트를 디스플레이하는 단계;
    상기 복수의 서로 다른 실험조건 중 어느 하나의 실험 조건을 선택하는 단계; 및
    상기 생성된 유전자 정보로부터 상기 선택된 실험조건에 유효한 반점의 블럭 정보, 상기 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 추출하고 상기 추출된 정보를 테이블로 디스플레이하는 단계를 포함하는 것을 특징으로 하는 마이크로어레이 실험 정보의 통합 관리 방법.
  8. 제 1 항에 있어서,
    상기 인덱싱된 이미지에 포함된 이에스티를 기능별 카테고리에 따라 분류하여 기능 그룹 정보를 생성하는 단계;
    상기 기능별 카테고리의 리스트를 디스플레이하는 단계; 및
    상기 기능별 카테고리 중 어느 하나를 선택하면 상기 선택된 카테고리에 해당하는 이에스티를 상기 기능 그룹 정보로부터 추출하고, 상기 추출된 이에스티의 블럭 정보, 상기 블럭 내에서의 행 및 열 인덱스를 포함하는 정보를 테이블로 디스플레이하는 단계를 포함하는 것을 특징으로 하는 마이크로어레이 실험 정보의 통합 관리 방법.
  9. 제 1 항 내지 제 8 항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020060095838A 2006-09-29 2006-09-29 마이크로어레이 실험 정보의 통합 관리 방법 및 그기록매체 KR100836865B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060095838A KR100836865B1 (ko) 2006-09-29 2006-09-29 마이크로어레이 실험 정보의 통합 관리 방법 및 그기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060095838A KR100836865B1 (ko) 2006-09-29 2006-09-29 마이크로어레이 실험 정보의 통합 관리 방법 및 그기록매체

Publications (2)

Publication Number Publication Date
KR20080030145A true KR20080030145A (ko) 2008-04-04
KR100836865B1 KR100836865B1 (ko) 2008-06-11

Family

ID=39532338

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060095838A KR100836865B1 (ko) 2006-09-29 2006-09-29 마이크로어레이 실험 정보의 통합 관리 방법 및 그기록매체

Country Status (1)

Country Link
KR (1) KR100836865B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024090987A1 (ko) * 2022-10-25 2024-05-02 주식회사 씨젠 분자 진단용 어플리케이션을 관리하는 방법 및 장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100431620B1 (ko) * 2002-02-28 2004-05-17 주식회사 이즈텍 유전자 어휘 분류체계를 이용하여 디엔에이 칩을 분석하기위한 시스템 및 그 방법
KR100474852B1 (ko) * 2003-01-27 2005-03-10 삼성전자주식회사 유전자형 판별 분석을 위한 서버-클라이언트 네트워크시스템 및 이에 사용되는 기록 매체

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024090987A1 (ko) * 2022-10-25 2024-05-02 주식회사 씨젠 분자 진단용 어플리케이션을 관리하는 방법 및 장치

Also Published As

Publication number Publication date
KR100836865B1 (ko) 2008-06-11

Similar Documents

Publication Publication Date Title
Meyer et al. MulteeSum: a tool for comparative spatial and temporal gene expression data
US20200395128A1 (en) Medical analysis system
Krueger et al. Facetto: Combining unsupervised and supervised learning for hierarchical phenotype analysis in multi-channel image data
Abdelaal et al. Predicting cell populations in single cell mass cytometry data
US6847897B1 (en) Method and system for analyzing biological response signal data
US9141913B2 (en) Categorization and filtering of scientific data
EP1002264B1 (en) Method for providing a bioinformatics database
EP1388801A2 (en) Methods and system for simultaneous visualization and manipulation of multiple data types
US20020067358A1 (en) Data analysis software
Martin et al. Vesalius: high‐resolution in silico anatomization of spatial transcriptomic data using image analysis
US7877213B2 (en) System and methods for automated processing of multiple chemical arrays
Varshavsky et al. Compact: A comparative package for clustering assessment
Kaushal et al. Analyzing and visualizing expression data with Spotfire
KR100836865B1 (ko) 마이크로어레이 실험 정보의 통합 관리 방법 및 그기록매체
US20060056671A1 (en) Automated feature extraction processes and systems
Markowitz et al. Applying data warehouse concepts to gene expression data management
JP3563315B2 (ja) 樹状図表示方法及び樹状図表示システム
KR100839221B1 (ko) 마이크로어레이 통합 분석 방법
Rifkin Identifying fluorescently labeled single molecules in image stacks using machine learning
US20030208322A1 (en) Apparatus, method, and computer program product for plotting proteomic and genomic data
KR100742780B1 (ko) 자동화된 마이크로어레이 이미지 분석방법 및 그 기록매체
Imtiaz et al. A user-driven machine learning approach for RNA-based sample discrimination and hierarchical classification
THIAGARAJAN By ALEXANDER I. SAEED, NIRMAL K. BHAGABATI, JOHN C. BRAISTED, WEI LIANG, VASILY SHAROV, ELEANOR A. HOWE, JIANWEI LI, MATHANGI THIAGARAJAN, JOSEPH A. WHITE, and JOHN QUACKENBUSH
Kaushal et al. An Overview of Spotfire for Gene‐Expression Studies
Troein et al. By ALEXANDER I. SAEED, NIRMAL K. BHAGABATI, JOHN C. BRAISTED, WEI LIANG, VASILY SHAROV, ELEANOR A. HOWE, JIANWEI LI, MATHANGI THIAGARAJAN, JOSEPH A. WHITE, and JOHN QUACKENBUSH

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120319

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130405

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee