KR100753538B1 - 스트레스 단백질 내성 유전자의 검색 방법 및 장치와 이를위한 기록매체 - Google Patents

스트레스 단백질 내성 유전자의 검색 방법 및 장치와 이를위한 기록매체 Download PDF

Info

Publication number
KR100753538B1
KR100753538B1 KR1020050124431A KR20050124431A KR100753538B1 KR 100753538 B1 KR100753538 B1 KR 100753538B1 KR 1020050124431 A KR1020050124431 A KR 1020050124431A KR 20050124431 A KR20050124431 A KR 20050124431A KR 100753538 B1 KR100753538 B1 KR 100753538B1
Authority
KR
South Korea
Prior art keywords
protein
host
interaction
stress
derived
Prior art date
Application number
KR1020050124431A
Other languages
English (en)
Other versions
KR20060069325A (ko
Inventor
박종화
오동훈
조유복
박대의
윤기석
Original Assignee
오브젝트인터랙션테크놀로지스(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오브젝트인터랙션테크놀로지스(주) filed Critical 오브젝트인터랙션테크놀로지스(주)
Publication of KR20060069325A publication Critical patent/KR20060069325A/ko
Application granted granted Critical
Publication of KR100753538B1 publication Critical patent/KR100753538B1/ko

Links

Images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)

Abstract

본 발명은 스트레스 단백질 내성 유전자의 검색 방법 및 장치와, 이를 위한 기록매체에 관한 것으로 보다 자세하게는 (1) 기주 유래 단백질과 스트레스 단백질의 구조 도메인을 예측하는 단계; (2) 기주 유래 단백질의 구조 도메인과 스트레스 단백질의 구조 도메인의 상호작용 여부를 확인하여 스트레스 단백질과 상호작용하는 기주 유래 단백질을 1차 선택하는 단계; (3) 단계 (2)로부터 선택된 각 기주 유래 단백질에 포함된 각 구조 도메인의 상호작용도를 계산하는 단계; (4) 단계 (3)에서 계산된 상호작용도를 이용하여 단계 (2)에서 1차 선택된 기주 유래 단백질 각각의 총 상호작용도를 계산하여, 일정 값 이상의 상호작용도를 갖는 기주 유래 단백질 또는 총 상호작용도가 우수한 상위 적어도 하나 이상의 기주 유래 단백질을 2차 선택하는 단계를 포함한 스트레스 단백질 내성 유전자의 검색방법에 관한 것이다. 또한, 본 발명은 제어부; 스트레스 단백질 내성 유전자 검색을 위한 명령이 입력되고, 스트레스 단백질의 아미노산 서열 및 기주 유래 단백질의 아미노산 서열이 입력되며, 스트레스 단백질 내성 유전자 검색 결과를 출력하기 위한 입출력부; 상기 입출력부를 통해 스트레스 단백질 내성 유전자 검색 명령이 입력되고, 상기 스트레스 단백질 및 기주 유래 단백질의 아미노산 서열이 입력됨에 따라, 상기 스트레스 단백질과 기주 유래된 단백질의 도메인 구조를 예측하기 위한 구조 도메인 예측부; 상기 기주 유래 단백질의 구조 도메인과 스트레스 단백질의 구조 도메인의 도메인 구조 예측 결과를 참조하여 스트레스 단백질과 상호작용하는 기주 유래 단 백질을 1차 선택하고, 스트레스 단백질과 기주 유래 단백질의 총 상호작용도에 따라 기주 유래 단백질을 2차 선택하여 상기 입출력부를 통해 상기 2차 선택 결과를 출력하는 기주 유래 단백질 선택부; 및 상기 기주 유래 단백질 선택부의 1차 선택 결과에 따라, 상기 스트레스 단백질과 상호작용하는 기주 유래 단백질의 구조 도메인의 상호작용도를 계산하고 계산 결과를 저장하며, 상기 기주 유래 단백질 선택부에서 1차 선택된 기주 유래 단백질별 총 상호작용도를 계산하고 계산 결과를 저장하기 위한 상호 작용도 확인부를 포함하는 것을 특징으로 하는 스트레스 단백질 내성 유전자 검색 장치에 관한 것이다. 본 발명의 검색 방법 및 장치와, 이를 위한 기록매체를 이용하여 다양한 유기체로부터 목적한 유전자를 신속하게 검색할 수 있다.
스트레스 단백질, 내성 유전자, 상호작용도

Description

스트레스 단백질 내성 유전자의 검색 방법 및 장치와 이를 위한 기록매체{Method and Apparatus of Searching Genes Resistant to Stress Protein and Recording Medium Therefor}
도 1은 본 발명에 의한 스트레스 단백질에 대한 내성 유전자를 검색하는 방법을 설명하기 위한 흐름도,
도 2는 도 1에 도시한 상호작용도 계산 결과의 일 예를 설명하기 위한 도면,
도 3은 본 발명의 일 실시예에 의한 스트레스 단백질 내성 유전자 검색 장치의 구성도,
도 4는 본 발명의 다른 실시예에 의한 스트레스 단백질 내성 유전자 검색 장치의 구성도이다.
본 발명은 각종 스트레스 단백질 내성 유전자의 검색 방법 및 장치와 이를 위한 기록매체에 관한 것으로 보다 자세하게는 스트레스 단백질의 구조 도메인과 기주 유래 단백질의 구조 도메인의 상호작용 여부와 상호작용도를 이용하여 스트레스 내성 단백질을 선별하는 것을 특징으로 하는 스트레스 내성 유전자의 검색 방법 및 장치와 이를 위한 기록매체에 관한 것이다.
일반적으로 세포들은 스트레스를 받으면 이를 방어하거나 극복하기 위한 단백질들을 발현하게 된다. 그러한 단백질에는 항산화제, 내삼투압제(osmoprotectant), 라디칼 제거제(radical scavenger), 샤프론(chaperon)과 같이 스트레스에 직접 대응하는 단백질과 다른 단백질의 전사를 촉진하는 조절 단백질이 있다. 이와 같이 스트레스 단백질에 내성을 나타내는 유전자를 식물에 도입하면 식물이 스트레스에 대하여 개선된 내성을 보인다는 것이 알려져 있다(Tarczyznski, M. C. et al. Science, 1993, vol.259 pp.508-510).
그러나 상기 방법으로 제조된 유기체가 나타내는 내성 정도는 높지 않으며 실질적으로 내성을 높이기 위해서는 여러 내성 유전자를 유기체에 도입해야 하는데 여러 내성 유전자를 한 유기체에 도입하는 것이 불가능하므로 내성이 뛰어난 유기체를 개발하는데 어려움이 있었다. 이러한 문제점을 해결하기 위하여 스트레스 상태에 놓였을 때 다른 유전자의 발현을 촉진하는 조절 유전자를 식물에 도입함으로써 상기 방법에 비하여 내성이 보다 향상된 유기체를 제조하는 기술이 알려져 있다(Yamaguchi-Shinozaki K. et al. Nature Biotechnology, 1999, vol.17, pp.287-291).
일례로 식물의 병충해 스트레스에 대한 내성을 설명하는 유전자대 유전자 가설(gene-for-gene hypothesis)은 병원성 단백질 (avr: avirulence)에 대하여 상호작용하는 내성 단백질이 있을 때 스트레스에 내성을 보인다는 것이다. 이러한 가설을 지지하는 결과로 AvrPto(병원성 단백질)와 Pto(내성 단백질), Avr-pita(병원 성 단백질)과 Pita(내성 단백질)는 실제 물리적인 상호작용이 있다는 것이 효모 2합체(yeast two hybrid) 실험을 통하여 보고되어 있다(Tang, X. et al. Science, 1996, vol.274, pp.2060-2063; Jia, Y. et al. EMBO J. 2000, vol.19, pp.4004-4014). 이러한 형태의 질병 유발 단백질과 기주 단백질의 상호작용은 식물과 동물에서 비슷한 형태로 나타나고 있음이 보고되어 있다(Staskawicz et al. Science, 2001, vol.292, pp.2285-2289).
이러한 연구결과는 단백질-단백질 상호작용 정보를 통하여 역으로 질병 유발 단백질을 인식하여 기주에서 내성에 관여하는 단백질을 검색할 수 있음을 보여준다. 현재 내성 유전자의 대부분이 NBS-LRR 도메인을 갖고 있는 것으로 나타나며 이 도메인이 병원균 단백질과의 상호작용에 관여하고, NBS-LRR 도메인에 돌연변이를 도입할 경우 병원균 인식에 차이가 발생하는 것으로 보고되어 있다(Wang GL et al. Plant Cell, 1998, vol.10, pp.765-779; Parniske M et al. Cell, 1997, vol.91, pp.821-832). 또한 Pita를 기주인 벼에 과발현하였을 경우 병원균인 마그나포르테 그리세아(Magnaporthe grisea)에 대하여 내성을 나타냄이 보고되어 있고(Jia, Y. et al. EMBO J., 2000, vol.19, pp.4004-4014), 이외에도 RPS2, Xa7, PTO 등의 내성 단백질을 기주 식물에 과발현하였을 경우 내성이 나타나는 것으로 보고되어 있다(Martin, GB et al. Annu. Rev. Plant Biol., 2003, vol.54, pp.23-61). 따라서 단백질-단백질 상호작용 정보를 이용하여 현재 알려진 내성 단백질 및 병원균 단백질과 상호작용하는 주요 기주 단백질을 선별하면 현재까지 알려진 내성 단백질과는 새로운 형태의 내성 단백질을 검색하는 것이 가능하다.
현재 효모 2합체 실험과 같은 실험적인 방법으로 단백질 상호작용 실험을 하거나 기주에 대하여 대량의 돌연변이를 유발하고 특정 병원균에 대하여 내성을 보이는 라인(line)을 스크리닝하고 어떤 유전자에 변화가 있었는지 확인하는 방법으로 내성에 관여하는 단백질을 검색하고 있는데 이러한 방법은 결과를 얻는데 많은 시간이 걸리는 단점이 있다.
한편, 현재 생물 분자의 상호작용을 연구하기 위한 다양한 기법이 알려져 있으나 종 단위의 연구가 가능한 대량 분석 방법에는 효모 2합체(Y2H) 실험, TAP/MS, 파지 디스플레이(Phage Display)가 있고, 유전자 융합(gene fusion)과 계통발생학적 프로필(phylogenetic profile)을 이용한 생물정보학적 예측 방법이 있을 뿐이다.
이러한 단백질-단백질 상호작용 연구의 주류는 Y2H와 TAP/MS를 이용한 실험적 방법이며, 일본의 이토(Ito) 그룹이 2000년에 출아 효모(budding yeast)의 전체 단백질 네트워크를 발표하였고, 미국의 필즈(Fields) 그룹이 2001년에 역시 출아 효모의 전체 단백질 네트워크에 대해 공개하였다. 이후로 셀좀(Cellzome)사가 2002년에 TAP/MS 기법을 사용하여 출아 효모의 단백질 네트워크를 발표하였고, 캐나다의 엠디에스 프로테오믹스(MDS proteomcis) 사가 MS 기법으로 출아 효모의 단백질 네트워크를 발표하였다. 2003년에는 쿠라젠(CuraGen)사가 Y2H 기법으로 초파리에 대한 단백질 네트워크를 발표하였고, 올해에는 미국의 비달(Vidal) 그룹이 Y2H 기법으로 예쁜꼬마선충(C. elegans)의 단백질 네트워크를 발표하였다. 이들 연구 결과는 캐나다의 호구(Hogue) 그룹이 주도하고 있는 바인드 데이터베이스(BIND database)와 미국의 UCLA의 아이젠버그(Eisenberg) 그룹이 주도하고 있는 DIP에 축적되고 있다. 2003년말에는 사이토스케이프(Cytoscape)라는 대대적인 분자 상호작용 지도 프로젝트가 미국에서 몇 개 그룹의 협력으로 진행되어 있어, 전세계적으로 경쟁이 벌어지고 있는 상황이며, 유럽에서 특히 케임브리지를 중심으로 구조적 상호작용학에 대한 많은 연구가 이루어지고 있다. 그러나 Y2H나 TAP/MS와 같은 실험 기법을 이용할 경우 단백질 수준의 단백질 네트워크를 확인하는데 많은 비용과 시간을 필요로 하며 매 종마다 같은 실험을 반복해야 하는 단점이 있다.
이러한 단점을 극복하기 위한 시도로 생물정보학적 접근이 시도되고 있는데 가장 주도적인 그룹이 아이젠버그 그룹이며 유전자 융합, 계통발생학적 프로필을 이용하고 있으며, 최근에는 발렌시아(Valencia) 그룹, 러셀(Russell) 그룹, 로스트(Rost) 그룹이 구조 기반의 단백질 상호작용에 관한 연구를 진행하고 있다. 이외에 네트워크를 통하여 단백질의 기능을 파악하거나 네트워크 토폴로지를 연구하는 타이어즈(Tyers) 그룹, 독일의 보르크(Bork) 그룹, 부네(Boone) 그룹, 노틀담 대학의 바라바시(Barabasi) 그룹 등이 있다. 현재 진행되고 있는 생물정보학적 방법의 경우 대량, 고속 탐색이 가능한 장점은 있으나 포유동물, 식물 등과 같은 고등 생물 특히 진핵생물에는 적용이 어렵다는 점과 실제 상호작용과 관련된 특성으로 예측한 것이므로 정확성의 검증이 어렵다.
따라서 본 발명은 다양한 유기체에 적용 가능하면서도 대량으로 신속하게 검색할 수 있을 뿐만 아니라 그 결과를 신뢰할 수 있는 유전자의 검색 방법 및 장치 를 제공하고자 한다.
본 발명은 (1) 기주 유래 단백질과 스트레스 단백질의 구조 도메인을 예측하는 단계; (2) 기주 유래 단백질의 구조 도메인과 스트레스 단백질의 구조 도메인의 상호작용 여부를 확인하여 스트레스 단백질과 상호작용하는 기주 유래 단백질을 1차 선택하는 단계; (3) 단계 (2)로부터 선택된 각 기주 유래 단백질에 포함된 각 구조 도메인의 상호작용도를 계산하는 단계; (4) 단계 (3)에서 계산된 상호작용도를 이용하여 단계 (2)에서 1차 선택된 기주 유래 단백질 각각의 총 상호작용도를 계산하여, 일정 값 이상의 상호작용도를 갖는 기주 유래 단백질 또는 총 상호작용도가 우수한 상위 적어도 하나 이상의 기주 유래 단백질을 2차 선택하는 단계를 포함한 스트레스 단백질 내성 유전자의 검색방법을 제공한다.
또한, 본 발명은 제어부; 스트레스 단백질 내성 유전자 검색을 위한 명령이 입력되고, 스트레스 단백질의 아미노산 서열 및 기주 유래 단백질의 아미노산 서열이 입력되며, 스트레스 단백질 내성 유전자 검색 결과를 출력하기 위한 입출력부; 상기 입출력부를 통해 스트레스 단백질 내성 유전자 검색 명령이 입력되고, 상기 스트레스 단백질 및 기주 유래 단백질의 아미노산 서열이 입력됨에 따라, 상기 스트레스 단백질과 기주 유래된 단백질의 도메인 구조를 예측하기 위한 구조 도메인 예측부; 상기 기주 유래 단백질의 구조 도메인과 스트레스 단백질의 구조 도메인의 도메인 구조 예측 결과를 참조하여 스트레스 단백질과 상호작용하는 기주 유래 단백질을 1차 선택하고, 스트레스 단백질과 기주 유래 단백질의 총 상호작용도에 따라 기주 유래 단백질을 2차 선택하여 상기 입출력부를 통해 상기 2차 선택 결과를 출력하는 기주 유래 단백질 선택부; 및 상기 기주 유래 단백질 선택부의 1차 선택 결과에 따라, 상기 스트레스 단백질과 상호작용하는 기주 유래 단백질의 구조 도메인의 상호작용도를 계산하고 계산 결과를 저장하며, 상기 기주 유래 단백질 선택부에서 1차 선택된 기주 유래 단백질별 총 상호작용도를 계산하고 계산 결과를 저장하기 위한 상호 작용도 확인부를 포함하는 것을 특징으로 하는 스트레스 단백질 내성 유전자 검색 장치를 제공한다.
본 발명에서 "스트레스 단백질"은 기주에 스트레스를 일으키는 물질 중 단백질로 이루어진 물질을 의미한다. 당업계에는 다양한 스트레스 단백질과 이들의 아미노산 서열 등이 공지되어 있다. 본 발명에서는 그러한 공지된 스트레스 단백질뿐만 아니라 그 단백질과 적어도 약 70% 이상, 바람직하게는 약 80% 이상, 보다 바람직하게는 약 90% 이상의 상동성을 갖고 기주에 스트레스를 유발하는 활성을 보유한 단백질을 모두 스트레스 단백질로 포함시킨다.
본 발명에서 상기 "기주(host)"는 박테리아, 곰팡이, 곤충, 식물, 동물을 포함한 모든 원핵 생물 및 진핵 생물일 수 있으며, 바람직하게는 식물과 동물을 의미한다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 보다 상세히 설명하기로 한다.
도 1은 본 발명에 의한 스트레스에 대한 내성 유전자를 검색하는 방법을 설명하기 위한 흐름도이다.
본 발명에 따른 검색방법의 단계 (S10)에서는 기주 유래 단백질과 스트레스 단백질의 아미노산 서열을 입력받아 기주 유래 단백질과 스트레스 단백질의 구조 도메인을 각각 예측한다. 즉, 스트레스 단백질과 기주로부터 유래된 단백질이 각각 어떤 구조의 도메인으로 이루어져 있는지를 예측한다. 본 발명에서는 한 양태로 SCOP(Structure classification of protein) 도메인 서열과 스트레스 단백질의 아미노산 서열 또는 기주 유래 단백질의 아미노산 서열을 상동성 검색함으로써 예측할 수 있다. 여기서, SCOP 도메인 서열은 특정 아미노산 서열이 특정 구조의 도메인을 형성할 수 있다는 정보를 갖고 있는 데이터베이스를 의미하며, CATH, FSSP 등 기타 구조 도메인 분류 정보로 대체될 수 있다.
본 발명에 따른 검색방법의 단계 (S20)에서는 기주 유래 단백질 구조 도메인과 스트레스 단백질의 구조 도메인의 상호작용 여부를 확인하고, 단계(S30)에서는 스트레스 단백질과 상호작용하는 기주 유래 단백질을 1차적으로 선택한다. 이를 위하여, 제 1 구조의 도메인과 제 2 구조의 도메인의 상호작용 여부에 대한 정보를 갖고 있는 모든 데이터베이스를 이용할 수 있으며, PSIMAP(Protein Structure Interaction Map)을 이용하는 것이 특히 바람직하다. 이러한 데이터베이스로부터 스트레스의 구조 도메인과 상호작용하는 구조 도메인을 알 수 있으며, 이러한 구조 도메인을 갖고 있는 기주 유래 단백질은 스트레스 단백질과 상호작용하는 기주 유래 단백질로 1차 선택될 수 있다.
본 발명에 따른 검색방법의 단계 (S40)에서는 스트레스 단백질과 상호작용하는 기주 유래 단백질의 구조 도메인의 상호작용도를 계산한다. 이를 위하여 z- score 계산법을 이용하며, 이를 본 발명에 적용하여 [수학식 1]과 같이 나타낼 수 있다. z-score란 존재하는 모든 것의 속성이 정규분포라는 가정 하에 원점수의 평균을 0으로 하고, 표준편차를 1로 하여 각 평가 대상의 스코어가 평균으로부터 떨어진 거리(즉, 편차)를 표준편차로 나눈 값을 의미한다.
Figure 112005073693355-pat00001
여기에서, NL은 상호작용도 계산 대상이 되는 도메인을 갖는 단백질에 포함되는 모든 도메인의 수를 의미하고, pAB는 하나의 프로테옴 내 모든 도메인의 수에 대한 기주 유래 단백질이 갖는 상호작용도 계산 대상 도메인의 수를 의미하며, nAB는 하나의 프로테옴에 포함되는 상호작용도 계산 대상 도메인의 수를 의미한다.
기주 유래 단백질은 스트레스 단백질에 대하여 상호작용 정도가 많을수록 상호작용도가 크게 나타난다. 즉, 상호작용도가 클수록 내성이 우수한 기주 유래 단백질인 것으로 판단할 수 있다.
도 2는 도 1에 도시한 상호작용도 계산 결과의 일 예를 설명하기 위한 도면이다(*: 해당 기주 유래 단백질과 상호작용하는 스트레스 단백질의 개수를 나타낸다). 이로부터 당업계에 스트레스 내성 단백질로 알려진 단백질 ID: 2277564, 3006040, 2405992, 2405993 및 2856457의 상호작용도가 높게 나타나는 것을 확인할 수 있으며, 도 2에 나열된 다른 단백질들도 높은 상호작용도를 나타내어 스트레스 내성 단백질이 될 가능성을 보여준다.
이후, 본 발명에 따른 검색방법의 단계 (S50)에서는 단계 (S40)으로부터 계산된 각 구조 도메인별 상호작용도를 이용하여 단계 (S30)에서 1차 선택된 기주 유래 단백질별 총 상호작용도를 계산한다. 즉, 1차 선택된 기주 유래 단백질 마다 각 기주 유래 단백질이 갖는 구조 도메인의 상호작용도를 모두 합산하는 것이다.
아울러, 단계 (S60)에서는 단계 (S50)에서 계산된 값 즉, 각 기주 유래 단백질별 총 상호작용도가 지정된 값 이상이 되는 기주 유래 단백질 또는 총 상호작용도가 우수한 상위 적어도 하나 이상의 기주 유래 단백질을 2차적으로 선택한다. 일반적으로 총 상호작용도가 높을수록 해당 기주 유래 단백질이 스트레스 단백질에 대하여 높은 내성을 나타낼 수 있다. 또한, 총 상호작용도는 프로테옴의 크기에 따라 달라지므로 본 발명에서는 각 기주 유래 단백질을 총 상호작용도가 높은 순서대로 나열했을 때 적어도 100위 이상, 바람직하게는 50위 이상, 보다 바람직하게는 10위 이상의 기주 유래 단백질을 스트레스에 대한 내성 유전자로 2차 선택할 수 있다.
이상에서 설명한 본 발명의 유전자 검색 기능은 CD, DVD 등과 같은 모든 이용 가능한 기록매체에서 실행될 수 있도록 제작하여 사용할 수 있다. 또한, 복수의 통신 단말이 인터넷 등과 같은 통신망에 의해 접속되어 있는 환경에서, 어느 하나의 통신 단말에 기주 유래 단백질 및 스트레스 단백질의 구조 도메인 예측 결과, 구조 도메인의 상호작용 확인 결과 등을 데이터베이스화하여 저장하여 두고, 타 단 말에서 본 발명의 유전자 검색 기능이 기록된 기록매체를 실행하고 상기 데이터베이스가 구축된 단말에 접속하여, 상기한 과정에 의해 유전자를 검색하도록 하는 것도 가능하다.
도 3은 본 발명의 일 실시예에 의한 스트레스 단백질 내성 유전자 검색 장치의 구성도이다.
도시한 것과 같이, 본 발명의 일 실시예에 의한 스트레스 단백질 내성 유전자 검색 장치(10)는 전체적인 동작을 제어하는 제어부(110), 데이터베이스(120), 구조 도메인 예측부(130), 기주 유래 단백질 선택부(140), 상호 작용도 확인부(150) 및 입출력부(160)를 포함한다.
먼저, 입출력부(160)를 통해 스트레스 단백질 내성 유전자 검색을 위한 명령과 함께, 스트레스 단백질의 아미노산 서열 및 기주 유래 단백질의 아미노산 서열이 입력됨에 따라, 구조 도메인 예측부(130)는 스트레스 단백질과 기주 유래된 단백질이 각각 어떤 구조의 도메인으로 이루어져 있는지를 예측한다. 이를 위하여, 구조 도메인 예측부(130)는 SCOP(Structure classification of protein) 도메인 서열 데이터베이스(122)를 이용하여, 스트레스 단백질의 아미노산 서열 또는 기주 유래 단백질의 아미노산 서열의 상동성을 검색한다. 여기서, SCOP 도메인 서열은 특정 아미노산 서열이 특정 구조의 도메인을 형성할 수 있다는 정보를 갖고 있는 데이터베이스를 의미한다. 여기에서, 스트레스 단백질의 아미노산 서열 및 기주 유래 단백질의 아미노산 서열은 입출력부(160)를 통해 입력하는 것도 가능하지만 기 저장되어 있는 서열 정보를 이용하는 것도 가능하다.
그리고, 기주 유래 단백질 선택부(140)는 기주 유래 단백질의 구조 도메인과 스트레스 단백질의 구조 도메인의 상호작용 여부에 따라, 스트레스 단백질과 상호작용하는 기주 유래 단백질을 1차 선택한다. 이를 위하여, 기주 유래 단백질 선택부(140)는 제 1 구조의 도메인과 제 2 구조의 도메인의 상호작용 여부에 대한 정보를 갖고 있는 데이터베이스인 PSIMAP(Protein Structure Interaction Map)(124)를 이용할 수 있다. 아울러, 기주 유래 단백질 선택부(140)는 후술할 스트레스 단백질과 기주 유래 단백질의 총 상호작용도에 따라 기주 유래 단백질을 2차 선택한다.
기주 유래 단백질 선택부(140)에서 스트레스 단백질과 상호작용하는 기주 유래 단백질을 1차 선택하면, 상호 작용도 확인부(150)는 스트레스 단백질과 상호작용하는 기주 유래 단백질의 구조 도메인의 상호작용도를 계산하고, 이를 상호작용도 데이터베이스(126)에 저장한다. 이를 위하여 상기 [수학식 1]과 같은 z-score 계산법을 이용할 수 있다. 기주 유래 단백질은 스트레스 단백질에 대하여 상호작용 정도가 많을수록 상호작용도가 크게 나타난다. 즉, 상호작용도가 클수록 내성이 우수한 기주 유래 단백질인 것으로 판단할 수 있다.
한편, 스트레스 단백질과 상호작용하는 각 기주 유래 단백질 구조 도메인의 상호작용도가 계산되면, 상호 작용도 확인부(150)는 기주 유래 단백질 선택부(140)에서 1차 선택된 기주 유래 단백질별 총 상호작용도를 계산하고 그 결과를 상호 작용도 데이터베이스(126)에 저장한다. 즉, 1차 선택된 기주 유래 단백질 마다 각 기주 유래 단백질이 갖는 구조 도메인의 상호작용도를 모두 합산하는 것이다.
이와 같이 총 상호작용도가 계산되면, 기주 유래 단백질 선택부(140)는 총 상호작용도를 이용하여 기주 유래 단백질을 2차 선택하고, 2차 선택 결과를 입출력부(160)를 통해 출력한다. 이때에는 각 기주 유래 단백질별 총 상호작용도가 지정된 값 이상이 되는 기주 유래 단백질을 선택하거나, 또는 총 상호작용도가 우수한 상위 적어도 하나 이상의 기주 유래 단백질을 선택하게 된다.
일반적으로 총 상호작용도가 높을수록 해당 기주 유래 단백질이 스트레스 단백질에 대하여 높은 내성을 나타낼 수 있다. 또한, 총 상호작용도는 프로테옴의 크기에 따라 달라지므로 본 발명에서는 각 기주 유래 단백질을 총 상호작용도가 높은 순서대로 나열했을 때 적어도 100위 이상, 바람직하게는 50위 이상, 보다 바람직하게는 10위 이상의 기주 유래 단백질을 스트레스에 대한 내성 유전자로 2차 선택할 수 있다.
도 4는 본 발명의 다른 실시예에 의한 스트레스 단백질 내성 유전자 검색 장치의 구성도이다.
본 실시예에 의한 스트레스 단백질 내성 유전자 검색 장치(20)는 SCOP 도메인 서열 데이터베이스(122) 및 PSIMAP(124)을 통신망을 통해 검색하는 것을 제외하고는 도 3의 장치와 유사한 구성을 갖는다.
즉, 제 1 통신 단말(210)은 제어부(2110), 상호작용도 데이터베이스(2120), 구조 도메인 예측부(2130), 기주 유래 단백질 선택부(2140), 상호 작용도 확인부(2150) 및 입출력부(2160)를 구비하고, 이러한 각 구성요소의 기능은 도 3에서 설명한 것과 동일하다. 이에 더하여 제 1 통신 단말(210)은 통신망 인터페이스(2160)를 더 구비하여, SCOP 도메인 서열 데이터베이스 및 PSIMAP을 구비하고 있는 제 2 통신 단말(220)과 유선 또는 무선 통신 가능한 환경을 갖추고 있다.
도 4에 도시한 것과 같이, 제 2 통신 단말(220)은 제어부(2210), 데이터베이스(2220) 및 통신망 인터페이스(2230)를 구비하고, 데이터베이스(2220)는 SCOP 도메인 서열 데이터베이스(2222) 및 PSIMAP(2224)를 포함한다.
이와 같은 구성을 갖는 스트레스 단백질 내성 유전자 검색 장치의 경우, 수시로 업데이트되는 SCOP 도메인 서열 데이터베이스(2222) 및 PSIMAP(2224)를 각각의 개인이 업데이트 내용을 반영할 필요 없이, 이들을 관리하는 제 2 통신 단말(220)에 통신망 인터페이스를 통해 접근하는 것에 의해 용이하게 데이터를 이용할 수 있고, 이를 통해 스트레스 단백질 내성 유전자를 간편하게 검색할 수 있는 이점이 있다.
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
본 발명의 검색방법은 다양한 유기체로부터 대량으로 신속하게 목적한 유전자를 검색할 수 있다. 특히, 본 발명에 따른 스트레스 내성 유전자는 이를 해당 기주에 도입함으로써 상기 스트레스에 대하여 내성을 나타내는 기주를 생산하는데 이용할 수 있다.

Claims (10)

  1. (1) 기주 유래 단백질과 스트레스 단백질의 아미노산 서열을 입력받아 상기 기주 유래 단백질과 상기 스트레스 단백질의 구조 도메인을 예측하는 단계;
    (2) 기주 유래 단백질의 구조 도메인과 스트레스 단백질의 구조 도메인의 상호작용 여부를 확인하여 스트레스 단백질과 상호작용하는 기주 유래 단백질을 1차 선택하는 단계;
    (3) 단계 (2)로부터 선택된 각 기주 유래 단백질에 포함된 각 구조 도메인의 상호작용도를 계산하는 단계;
    (4) 단계 (3)에서 계산된 상호작용도를 이용하여 단계 (2)에서 1차 선택된 기주 유래 단백질 각각의 총 상호작용도를 계산하여, 상기 총 상호작용도로부터 적어도 하나 이상의 기주 유래 단백질을 2차 선택하는 단계를 포함한 스트레스 단백질 내성 유전자의 검색방법.
  2. 제 1 항에 있어서,
    상기 단계(1)은 SCOP(Structure classification of protein) 도메인 서열과 상기 스트레스 단백질의 아미노산 서열 또는, SCOP(Structure classification of protein) 도메인 서열과 상기 기주 유래 단백질의 아미노산 서열의 상동성 검색 단계인 것을 특징으로 하는 스트레스 단백질 내성 유전자의 검색방법.
  3. 제 1 항에 있어서,
    상기 단계(2)는 PSIMAP(Protein Structure Interaction Map)을 이용하여 상호작용 여부를 확인하는 단계인 것을 특징으로 하는 스트레스 단백질 내성 유전자의 검색방법.
  4. 제 1 항에 있어서,
    상기 단계(3)은 존재하는 모든 것의 속성이 정규분포라는 가정 하에 원점수의 평균을 0으로 하고, 표준편차를 1로 하여 각 평가 대상의 스코어가 평균으로부터 떨어진 거리를 표준편차로 나눈 값을 의미하는 z-score 계산법을 이용하여 상호작용도를 계산하는 단계인 것을 특징으로 하는 스트레스 단백질 내성 유전자의 검색방법.
  5. 제 1 항에 있어서,
    상기 단계(4)의 총 상호작용도를 계산하는 단계는 상기 1차 선택된 기주 유래 단백질 별로, 상기 기주 유래 단백질과 상호작용 관계에 있는 스트레스 단백질 구조 도메인의 상호작용도를 합산하는 단계인 것을 특징으로 하는 스트레스 단백질 내성 유전자의 검색방법.
  6. 제 1 항에 있어서,
    상기 단계(4)의 기주 유래 단백질을 2차 선택하는 단계는 일정 값 이상의 상호작용도를 갖는 기주 유래 단백질 또는 총 상호작용도가 우수한 상위 적어도 하나 이상의 기주 유래 단백질을 선택하는 단계인 것을 특징으로 하는 스트레스 단백질 내성 유전자의 검색 방법.
  7. 제어부;
    스트레스 단백질 내성 유전자 검색을 위한 명령이 입력되고, 스트레스 단백질의 아미노산 서열 및 기주 유래 단백질의 아미노산 서열이 입력되며, 스트레스 단백질 내성 유전자 검색 결과를 출력하기 위한 입출력부;
    상기 입출력부를 통해 스트레스 단백질 내성 유전자 검색 명령이 입력되고, 상기 스트레스 단백질 및 기주 유래 단백질의 아미노산 서열이 입력됨에 따라, 상기 스트레스 단백질과 기주 유래된 단백질의 도메인 구조를 예측하기 위한 구조 도메인 예측부;
    상기 기주 유래 단백질의 구조 도메인과 스트레스 단백질의 구조 도메인의 도메인 구조 예측 결과를 참조하여 스트레스 단백질과 상호작용하는 기주 유래 단백질을 1차 선택하고, 스트레스 단백질과 기주 유래 단백질의 총 상호작용도에 따라 기주 유래 단백질을 2차 선택하여 상기 입출력부를 통해 상기 2차 선택 결과를 출력하는 기주 유래 단백질 선택부; 및
    상기 기주 유래 단백질 선택부의 1차 선택 결과에 따라, 상기 스트레스 단백질과 상호작용하는 기주 유래 단백질의 구조 도메인의 상호작용도를 계산하고 계산 결과를 저장하며, 상기 기주 유래 단백질 선택부에서 1차 선택된 기주 유래 단백질별 총 상호작용도를 계산하고 계산 결과를 저장하기 위한 상호 작용도 확인부;
    를 포함하는 것을 특징으로 하는 스트레스 단백질 내성 유전자 검색 장치.
  8. 제 7 항에 있어서,
    상기 스트레스 단백질 내성 유전자 검색 장치는 통신망 인터페이스를 더 포함하는 것을 특징으로 하는 스트레스 단백질 내성 유전자 검색 장치.
  9. 제 8 항에 있어서,
    상기 스트레스 단백질 내성 유전자 검색 장치는 상기 통신망 인터페이스를 통해 타 통신단말 구비된 SCOP 도메인 서열 데이터베이스 및 PSIMAP에 접근하는 것을 특징으로 하는 스트레스 단백질 내성 유전자 검색 장치.
  10. 기주 유래 단백질와 스트레스 단백질의 아미노산 서열을 입력받아 상기 기주 유래 단백질과 상기 스트레스 단백질의 구조 도메인을 예측하는 기능;
    기주 유래 단백질의 구조 도메인과 스트레스 단백질의 구조 도메인의 상호작용 여부를 확인하여 스트레스 단백질과 상호작용하는 기주 유래 단백질을 1차 선택하는 기능;
    상기 1차 선택된 각 기주 유래 단백질에 포함된 각 구조 도메인의 상호작용도를 계산하는 기능;
    상기 상호작용도를 이용하여 상기 1차 선택된 기주 유래 단백질 각각의 총 상호작용도를 계산하여, 상기 총 상호작용도로부터 적어도 하나 이상의 기주 유래 단백질을 2차 선택하는 기능을 실행할 수 있는 프로그램이 저장된 컴퓨터로 읽을 수 있는 기록 매체.
KR1020050124431A 2004-12-17 2005-12-16 스트레스 단백질 내성 유전자의 검색 방법 및 장치와 이를위한 기록매체 KR100753538B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020040107502 2004-12-17
KR20040107502 2004-12-17

Publications (2)

Publication Number Publication Date
KR20060069325A KR20060069325A (ko) 2006-06-21
KR100753538B1 true KR100753538B1 (ko) 2007-08-30

Family

ID=37163411

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050124431A KR100753538B1 (ko) 2004-12-17 2005-12-16 스트레스 단백질 내성 유전자의 검색 방법 및 장치와 이를위한 기록매체

Country Status (1)

Country Link
KR (1) KR100753538B1 (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004329210A (ja) 2003-04-17 2004-11-25 Taisei Corp 塩ストレス耐性を付与する遺伝子
KR20040105736A (ko) * 2002-02-28 2004-12-16 안티제닉스 아이엔씨 스트레스 단백질의 올리고머화에 기초한 방법 및 산물

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040105736A (ko) * 2002-02-28 2004-12-16 안티제닉스 아이엔씨 스트레스 단백질의 올리고머화에 기초한 방법 및 산물
JP2004329210A (ja) 2003-04-17 2004-11-25 Taisei Corp 塩ストレス耐性を付与する遺伝子

Also Published As

Publication number Publication date
KR20060069325A (ko) 2006-06-21

Similar Documents

Publication Publication Date Title
Jing et al. MACOED: a multi-objective ant colony optimization algorithm for SNP epistasis detection in genome-wide association studies
Cheema et al. Computational approaches and software tools for genetic linkage map estimation in plants
Parra et al. CEGMA: a pipeline to accurately annotate core genes in eukaryotic genomes
Schmid et al. A multilocus sequence survey in Arabidopsis thaliana reveals a genome-wide departure from a neutral model of DNA sequence polymorphism
Voelckel et al. Evolutionary transcriptomics and proteomics: insight into plant adaptation
Holliday et al. Predicting adaptive phenotypes from multilocus genotypes in Sitka spruce (Picea sitchensis) using random forest
Lehner et al. A first-draft human protein-interaction map
Legrain et al. Protein–protein interaction maps: a lead towards cellular functions
Jeong et al. Prediction of protein essentiality based on genomic data
Nye et al. Statistical analysis of domains in interacting protein pairs
Cerca et al. Removing the bad apples: A simple bioinformatic method to improve loci‐recovery in de novo RADseq data for non‐model organisms
CN105989249B (zh) 用于组装基因组序列的方法、系统及装置
Willi et al. A practical guide to the study of distribution limits
Croze et al. A genome-wide scan for genes under balancing selection in Drosophila melanogaster
Masoudi-Nejad et al. RETRACTED ARTICLE: Candidate gene prioritization
Huminiecki et al. Can we predict gene expression by understanding proximal promoter architecture?
Li et al. Foster thy young: enhanced prediction of orphan genes in assembled genomes
Arunachalam et al. An alignment-free method to identify candidate orthologous enhancers in multiple Drosophila genomes
Saeed et al. An assessment of the uses of homologous interactions
KR100753538B1 (ko) 스트레스 단백질 내성 유전자의 검색 방법 및 장치와 이를위한 기록매체
Ruan et al. TreeExp1. 0: R Package for Analyzing Expression Evolution Based on RNA‐Seq Data
Mier et al. Automated selection of homologs to track the evolutionary history of proteins
Proulx et al. Direct selection on genetic robustness revealed in the yeast transcriptome
Roqueiro et al. In silico phenotyping via co-training for improved phenotype prediction from genotype
Hamm et al. Accelerating structure‐function mapping using the ViVa webtool to mine natural variation

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120824

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130823

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140825

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150904

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160823

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170824

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180906

Year of fee payment: 12