KR100957386B1 - Method and system for extracting and displaying interaction networks between proteins and signal pathways by mapping protein-protein interaction and signal pathway information - Google Patents
Method and system for extracting and displaying interaction networks between proteins and signal pathways by mapping protein-protein interaction and signal pathway information Download PDFInfo
- Publication number
- KR100957386B1 KR100957386B1 KR20080023917A KR20080023917A KR100957386B1 KR 100957386 B1 KR100957386 B1 KR 100957386B1 KR 20080023917 A KR20080023917 A KR 20080023917A KR 20080023917 A KR20080023917 A KR 20080023917A KR 100957386 B1 KR100957386 B1 KR 100957386B1
- Authority
- KR
- South Korea
- Prior art keywords
- protein
- information
- interaction
- starting
- signaling pathway
- Prior art date
Links
Images
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Analytical Chemistry (AREA)
- Data Mining & Analysis (AREA)
Abstract
본 발명은 단백질간의 상호작용 관계 정보 및 단백질 신호전달 경로 정보의 맵핑(mapping)을 통한 단백질과 신호전달 경로와의 상호관계를 도출하고 도식화하는 방법 및 시스템에 관한 것이다. 본 발명은 관심있는 단백질과 상호작용하는 단백질들의 도식화 기능을 제공하는 PPI(Protein-Protein Interaction) 모듈; 단일 단백질과 상호작용 관계가 있는 단백질을 포함하는 신호전달 경로를 찾아주는 기능을 제공하는 패스파인더(Path-Finder) 모듈; 복수의 단백질과 관심있는 신호전달경로 위에 존재하는 최종의 단백질과의 상호작용거리(interaction distance)를 나타내는 기능을 제공하는 패스링커(Path-Linker) 모듈; 복수의 단백질과 상호작용하는 최종 단백질들의 위치와 빈도를 신호전달경로지도상에 표시하는 기능을 제공하는 패스마커(Path-Marker) 모듈; 복수의 단백질이 각각 관계하고 있는 신호전달경로를 상호작용거리(interaction distance)에 따라 찾아주고, 시작 단백질과 경로수에 따른 신호전달경로, 신호전달경로 내 최종 단백질 점유율 우선순위를 통계처리하는 기능인 패스리스트(Path-Lister) 모듈; 및 사용자에게 보다 정확하고 신뢰성이 제고된 정보를 제공할 수 있는 생물 종(Organism), 상호작용 유형 (interaction Type), 상호작용 검출 방법 (Interaction detection method), 정보의 개수(제공되는 DB의 개수, 관련 논문 수, interaction detection 방법의 개수) 등의 여과 기능을 적용하는 필터(filter) 모듈을 포함한다.The present invention relates to a method and system for deriving and mapping the relationship between proteins and signaling pathways through the mapping of protein interaction information and protein signaling pathway information. The present invention provides a Protein-Protein Interaction (PPI) module that provides a schematic function of proteins interacting with the protein of interest; A Pathfinder module that provides a function of finding a signaling pathway including a protein that interacts with a single protein; A Path-Linker module that provides a function of representing an interaction distance between a plurality of proteins and a final protein present on a signaling pathway of interest; A Path-Marker module that provides a function of displaying a location and a frequency of final proteins interacting with a plurality of proteins on a signal transduction map; A path that finds a signal transduction path that is related to a plurality of proteins according to an interaction distance, statistically processes the signal transduction path according to the starting protein and the number of paths, and the priority of the final protein share in the signal transduction path. List (Path-Lister) module; And organisms, interaction types, interaction detection methods, number of information (number of DBs provided, and more) that can provide users with more accurate and reliable information. Filter module to apply filtering functions such as the number of related articles and the number of interaction detection methods).
단백질, 상호작용, 신호전달 경로, 단백질 정보 데이터베이스, 단백질상호작용 데이터베이스, 신호전달 경로 정보데이터베이스 Protein, interaction, signaling pathway, protein information database, protein interaction database, signaling pathway information database
Description
본 발명은 단백질간의 상호작용 관계 및 단백질 신호전달 경로 정보를 통해 단백질과 신호전달 경로와의 관계를 도출하고 도식화하는 방법 및 시스템에 관한 것으로, 더욱 상세하게는 시작 단백질 이름 정보, 시작 단백질과 관련된 신호전달 경로(signal pathway) 상에 존재하는 최종 단백질과 시작 단백질과의 상호작용 거리(interaction distance) 정보, 최종 단백질의 이름 정보 및 신호전달 경로 정보를 이용하여, 시작 단백질과 최종 단백질 간의 신호전달 경로 또는 상호작용 관계를 도출하는 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for deriving and plotting a relationship between a protein and a signaling pathway through interaction between proteins and protein signaling pathway information. More particularly, the present invention relates to a starting protein name information and a signal related to a starting protein. A signaling pathway between the starting protein and the final protein, using the interaction distance information between the final protein and the starting protein present on the signal pathway, the name of the final protein and the signaling pathway information. A method and system for deriving interaction relationships.
단백질은 유전자(DNA)로부터 전사(transcription) 및 번역(translation)된 산물이기 때문에 복제가 매우 어렵거나 현실적으로 불가능하다. 따라서 단백질에 대한 시료는 실제 단백질을 생산하는 생명체에서 직접 채취하여 얻어야 하기 때문 에 인간 단백질 시료를 얻기 위해서는 여러 가지 윤리적, 기술적 제약을 가진다. 이처럼 제한적인 실험환경에서는 실험의 목적에 맞는 시료에 대해 정확한 정보와 보다 집약적이고 체계화된 데이터베이스가 필요하다.Because proteins are the products of transcription and translation from DNA, replication is very difficult or practically impossible. Therefore, since a sample of a protein must be obtained directly from a living organism producing a protein, there are various ethical and technical limitations in obtaining a human protein sample. In this limited experimental environment, accurate information and a more intensive and organized database are needed for the sample that meets the purpose of the experiment.
기존의 단백질 군에 대한 데이터베이스는 단백질 신호전달 경로 및 유전자 정보만을 담고 있거나, 단백질 상호작용 관계 정보만을 담고 있거나, 단백질 신호전달 경로 지도만을 저장하고 있어 수많은 단백질들이 서로 상호작용 관계 정보를 사용자에게 체계적으로 제공하기 위한 방법이 존재하지 않는다.Databases for existing protein groups contain only protein signaling pathways and genetic information, contain only protein interaction relationship information, or store only protein signaling pathway maps, allowing numerous proteins to systematically present interaction relationship information to users. There is no way to provide it.
즉, 종래에는 단백질들 간의 상호작용이나 신호전달 경로를 각각 독립적으로 보여주어, 연구자들의 관심의 대상이 되는 단백질들이 서로 어떤 상호작용을 하고, 어떤 신호전달 경로 상에서 서로 어떻게 관련되어 있는지에 대한 체계적인 정보를 제공할 수 없어, 단백질 연구자들에게 단백질 연구에 대한 체계적인 연구 방향을 제시하지 못하는 문제점이 있다.That is, in the related art, the interaction or signaling pathways between proteins are independently displayed, so that systematic information on how proteins interacting with each other and how they are related to each other is shown. There is a problem that can not provide a systematic research direction for protein research to protein researchers.
또한, 프로테옴 분석을 진행하여 동정된 단백질의 개별적인 정보를 획득하는 일도 어렵기 때문에 동정된 프로테옴을 한꺼번에 처리하여 공통 신호전달 경로 또는 공통으로 상호 작용하는 단백질들의 정보를 얻는 것이 매우 어려운 문제점이 있다.In addition, since it is difficult to obtain individual information of the identified protein by performing proteome analysis, it is very difficult to process the identified proteome at once to obtain information of a common signaling pathway or proteins that interact in common.
상기와 같은 문제점을 해결하기 위해, 본 발명은 단백질 사이의 상호작용 관계뿐만 아니라 그와 관련된 신호전달 경로와의 관계를 도출해줌으로써, 단백질에 대한 생물학적 기능연구의 방향의 근거를 제시할 수 있는 단백질간의 상호작용 관계를 도출하는 방법 및 시스템을 제공하는데 그 목적이 있다.In order to solve the above problems, the present invention derives not only the interaction relationship between proteins but also the related signaling pathways, thereby providing a basis for the direction of biological function research on proteins. Its purpose is to provide a method and system for deriving interaction relationships.
또한, 상기와 같은 문제점을 해결하기 위해, 본 발명은 프로테옴 분석 등을 진행하여 동정된 단백질에 대한 공통 신호전달 경로 정보 또는 공통으로 상호작용하는 단백질 정보를 도식화하여 사용자에게 제공하거나 또는 우선순위를 결정할 수 있도록 하는 단백질간의 상호작용 관계를 도출하는 방법 및 시스템을 제공하는데 그 목적이 있다. In addition, in order to solve the above problems, the present invention proceeds to the proteome analysis, etc. to provide the user or to prioritize common signaling pathway information or commonly interacting protein information for the identified protein It is an object of the present invention to provide a method and system for deriving interaction relationships between proteins.
또한, 상기와 같은 문제점을 해결하기 위해, 본 발명은 사용자에게 보다 정확하고 신뢰성이 제고된 정보를 제공할 수 있도록 시작 단백질과 최종 단백질의 상호작용 관계 정보 및 신호전달 정보를 검색 하는 과정에서 정보를 여과(filter)하여 검색하는 방법 및 시스템을 제공하는데 그 목적이 있다. 여기서 생물 종 (Organism), 상호작용 유형 (interaction Type), 상호작용 검출 방법 (Interaction detection method), 정보의 개수(제공되는 DB의 개수, 관련 논문 수, interaction detection 방법의 개수) 등을 포함하는 여과 기능을 제공한다.In addition, in order to solve the above problems, the present invention provides information in the process of searching the interaction information and signaling information of the starting protein and the final protein to provide more accurate and reliable information to the user It is an object of the present invention to provide a method and system for filtering and searching. Where filtration, including species, interaction type, interaction detection method, number of information (number of DBs provided, number of related articles, number of interaction detection methods), etc. Provide the function.
상기 목적을 달성하기 위해, 본 발명은 사용자로부터 시작 단백질의 이름 정 보를 획득하는 단계; 상기 사용자로부터 상기 시작 단백질과 상호작용하는 최종 단백질과 상기 시작 단백질 사이의 상호작용 거리(interaction distance) 정보를 획득하는 단계; 상기 사용자로부터 상기 시작 단백질과 상호작용하는 최종 단백질의 이름 정보를 획득하는 단계; 단백질들간의 상호작용 관계 정보를 저장하는 제1 데이터베이스로부터 상기 시작 단백질과 상기 최종 단백질의 상호작용 관계 정보를 획득하는 단계; 신호전달 경로를 저장하는 제2 데이터베이스로부터 상기 시작 단백질 및 상기 최종 단백질이 관련된 신호전달 경로 정보들 중에서, 상기 사용자로부터 원하는 신호전달 경로(signal pathway) 정보를 획득하는 단계; 및 상기 시작 단백질의 이름 정보, 상기 상호작용 거리 정보, 상기 최종 단백질의 이름 정보, 상기 상호작용 관계 정보 및 상기 신호전달 경로 정보를 이용하여, 상기 신호전달 경로 정보를 표시하는 신호전달 경로 지도에 상기 상호작용 거리 내에서 상기 시작 단백질과 상기 최종 단백질이 상호작용하는 경로를 표시하는 단계;를 포함하는 것을 특징으로 하는 단백질과 신호전달 경로와의 관계를 도출하는 방법을 제공한다.In order to achieve the above object, the present invention comprises the steps of obtaining the name information of the starting protein from the user; Obtaining interaction distance information between a final protein interacting with the starting protein and the starting protein from the user; Obtaining name information of a final protein interacting with the starting protein from the user; Obtaining interaction relationship information of the starting protein and the final protein from a first database storing interaction relationship information between proteins; Obtaining desired signaling pathway information from the user, from among signaling pathway information related to the starting protein and the final protein, from a second database storing a signaling pathway; And the signaling path map displaying the signaling path information using the name information of the starting protein, the interaction distance information, the name information of the final protein, the interaction relationship information, and the signaling path information. The method provides a method for deriving a relationship between a protein and a signaling pathway, the method comprising: displaying a path between the starting protein and the final protein within an interaction distance.
또한, 상기 목적을 달성하기 위해, 본 발명은 사용자로부터 복수의 시작 단백질 이름 정보를 획득하는 단계; 상기 사용자로부터 원하는 신호전달 경로 정보를 획득하는 단계; 상기 사용자로부터 상기 신호전달 경로 상에 위치하는 최종 단백질과 상기 복수의 시작 단백질과의 상호작용 거리 정보를 획득하는 단계; 상기 복수의 시작 단백질 이름 정보, 상기 신호전달 경로 정보 및 상기 상호작용 거리 정보를 이용하여, 상기 복수의 시작 단백질 중 상기 신호전달 경로와 관련된 적어도 하나의 시작 단백질을 상기 최종 단백질과 상호작용 거리에 따라 표시하는 단계;를 포함하는 것을 특징으로 하는 단백질과 신호전달 경로와의 관계를 도출하는 방법을 제공한다.In addition, to achieve the above object, the present invention comprises the steps of obtaining a plurality of starting protein name information from the user; Obtaining desired signaling path information from the user; Obtaining interaction distance information between a final protein located on the signaling pathway and the plurality of starting proteins from the user; By using the plurality of starting protein name information, the signaling pathway information and the interaction distance information, at least one starting protein associated with the signaling pathway among the plurality of starting proteins according to the interaction distance with the final protein. It provides a method for deriving a relationship between a protein and a signaling pathway comprising a step of displaying.
또한, 상기 목적을 달성하기 위해, 본 발명은 사용자로부터 복수의 시작 단백질 이름 정보를 획득하는 단계; 상기 사용자로부터 원하는 신호전달 경로 정보를 획득하는 단계; 상기 사용자로부터 상기 신호전달 경로 상에 위치하는 최종 단백질과 상기 복수의 시작 단백질과의 상호작용 거리 정보를 획득하는 단계; 및 상기 복수의 단백질 이름 정보, 상기 신호전달 경로 정보 및 상기 상호작용 거리 정보를 이용하여, 상기 신호전달 경로를 표시하는 신호전달 경로 지도에 상기 상호작용 거리 내에서 상기 복수의 시작 단백질들과 상기 최종 단백질과의 상호작용하는 경로를 상기 신호전달 경로 지도에 표시하는 단계;를 포함하는 것을 특징으로 하는 단백질과 신호전달 경로와의 관계를 도출하는 방법을 제공한다.In addition, to achieve the above object, the present invention comprises the steps of obtaining a plurality of starting protein name information from the user; Obtaining desired signaling path information from the user; Obtaining interaction distance information between a final protein located on the signaling pathway and the plurality of starting proteins from the user; And using the plurality of protein name information, the signaling pathway information, and the interaction distance information, the starting proteins and the final proteins within the interaction distance on a signaling pathway map indicating the signaling pathway. It provides a method for deriving a relationship between a protein and a signaling pathway comprising the step of displaying a pathway interacting with the protein on the signaling pathway map.
또한, 상기 목적을 달성하기 위해, 본 발명은 사용자로부터 복수의 시작 단백질 이름 정보를 획득하는 단계; 상기 사용자로부터 상기 신호전달 경로 상에 위치하는 최종 단백질과 상기 복수의 시작 단백질과의 상호작용 거리 정보를 획득하는 단계; 단백질들간의 상호작용 관계 정보를 저장하는 제1 데이터베이스로부터 상기 복수의 시작 단백질과 상기 최종 단백질의 상호작용 관계 정보를 획득하고, 신호전달 경로 정보를 저장하고 있는 제2 데이터베이스로부터 신호전달 경로 정보를 획득하는 단계; 및 상기 복수의 단백질 이름 정보, 상기 상호작용 거리 정보, 상기 상호작용 관계 정보 및 상기 신호전달 경로 정보를 이용하여, 상기 상호작용 거리별로 상기 복수의 시작 단백질과 상기 최종 단백질이 상호작용하는 신호전달 경로 를 표시하는 단계;를 포함하는 것을 특징으로 하는 단백질과 신호전달 경로와의 관계를 도출하는 방법을 제공한다.In addition, to achieve the above object, the present invention comprises the steps of obtaining a plurality of starting protein name information from the user; Obtaining interaction distance information between a final protein located on the signaling pathway and the plurality of starting proteins from the user; Obtain interaction relationship information between the plurality of starting proteins and the final protein from a first database storing interaction relationship information between proteins, and obtain signaling path information from a second database storing signaling path information. Making; And a signaling pathway in which the plurality of starting proteins and the final protein interact with each other by the interaction distances using the plurality of protein name information, the interaction distance information, the interaction relationship information, and the signaling path information. It provides a method for deriving a relationship between a protein and a signaling pathway comprising a step of displaying.
또한, 상기 목적을 달성하기 위해, 본 발명은 상기 방법들 중 적어도 하나의 방법을 실행하기 위한 모듈을 포함하는 것을 특징으로 하는 단백질과 신호전달 경로와의 관계를 도출하는 네트워크 생성 시스템을 제공한다.In addition, to achieve the above object, the present invention provides a network generation system for deriving a relationship between a protein and a signaling pathway, comprising a module for executing at least one of the methods.
또한, 상기 목적을 달성하기 위해, 본 발명은 상기 방법들 중 적어도 하나의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록매체를 제공한다.In addition, to achieve the above object, the present invention provides a computer readable recording medium having recorded thereon a program for executing at least one of the above methods.
본 발명은 단백질 사이의 상호작용 관계뿐만 아니라 그와 관련된 신호전달 경로와의 관계를 도출 해줌으로써, 단백질의 생물학적 기능연구 방향의 근거를 제시할 수 있는 단백질간의 상호작용 관계를 효율적으로 도출한다.The present invention derives not only the interaction relationship between proteins but also the related signaling pathways, thereby efficiently deriving the interaction relationship between proteins that can provide a basis for the direction of protein biological function research.
또한, 본 발명은 사용자에게 보다 정확하고 신뢰성이 제고된 정보를 제공할 수 있도록, 생물 종(Organism), 상호작용 유형(interaction Type), 상호작용 검출 방법(Interaction detection method), 정보의 개수(제공되는 DB의 개수, 관련 논문 수, interaction detection 방법의 개수) 등을 효율적으로 여과하는 과정을 거쳐 정보를 검색할 수 있다.In addition, the present invention is to provide a more accurate and reliable information to the user, the species (Organism), interaction type (Interaction Type), Interaction detection method (interaction detection method), the number of information (provided) Information can be retrieved through efficient filtering of the number of DBs, the number of related papers, and the number of interaction detection methods).
또한, 본 발명은 프로테옴 분석을 진행하여 동정된 단백질에 대한 공통 신호전달 경로 정보 또는 공통으로 상호작용하는 단백질 정보를 도식화하여 사용자에게 제공하거나 또는 우선순위를 결정할 수 있도록 하는 단백질간의 상호작용 관계를 효율적으로 화면에 표시한다.In addition, the present invention is to efficiently analyze the interaction relationship between proteins that can be provided to the user to determine the common signaling pathway information or commonly interacting protein information for the identified protein by proceeding proteome analysis to determine the priority On the screen.
본 발명에서 사용되는 용어는 가능한 한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우는 해당되는 발명의 상세한 설명 부분에서 그 의미를 기재하였으므로 단순한 용어의 명칭이 아닌 용어가 가지는 의미로 본 발명을 파악하여야 한다. The terminology used in the present invention is a general term that is currently widely used as possible, but in certain cases, the term is arbitrarily selected by the applicant, in which case the meaning of the term is described in the detailed description of the invention. It should be understood that the present invention in terms of terms other than these terms.
이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 설명하지만, 본 발명이 상기 실시 예들에 의해 제한되거나 한정되는 것은 아니며, 다양하게 변형되거나 본 발명의 기술적 사상을 포함하는 실시는 모두 본 발명의 범주에 포함된다고 해야 할 것이다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings. The present invention is not limited or limited by the above embodiments, and various modifications may be made to the technical spirit of the present invention. All implementations including the present invention should be included in the scope of the present invention.
도 1은 본 발명의 전체 시스템 구성도이다. 도 1을 참조하면 상기 시스템은 UI(user interface) 모듈(100), 화면구성 모듈(200), 메인엔진 모듈, 여과 모듈(800), 데이터베이스관리자 모듈(900), 단백질정보 데이터베이스(1000), 매칭정보 데이터베이스(1100), 상호작용정보 데이터베이스(1200), 신호전달 경로정보 데이터베이스(1300)를 포함하고, 상기 메인엔진모듈은 PPI(protein-protein interaction) 모듈(300), 패스파인더(Path-Finder) 모듈(400), 패스링커(Path-Linker) 모듈(500), 패스마커(Path-Marker) 모듈(600) 및 패스리스터(Path-Lister) 모듈(700)을 포함한다. 1 is an overall system configuration diagram of the present invention. Referring to FIG. 1, the system includes a user interface (UI)
상기 UI 모듈(100)은 사용자로부터의 입/출력을 총괄하고, 상기 화면구성 모듈(200)은 단백질, 신호전달 경로 등에 대한 노드(Node), 에지(Edge)를 화면에 배 치한다. 본 발명은 상기 화면구성 모듈(200)로서 GraphiViz 엔진 또는 Tulip 엔진을 사용하나, 이에 한정되지 않는다.The
상기 PPI 모듈(300)은 관심 단백질(이하 "시작 단백질(first protein)"이라 한다)과 상호작용하는 단백질(이하, "최종 단백질(last protein)"이라 한다)을 화면에 도식화해주고, 상기 패스파인더 모듈(400)은 단일한 시작 단백질과 상호작용하는 최종 단백질을 포함하는 신호전달 경로를 찾아주는 기능을 제공한다.The
상기 패스링커 모듈(500)은 복수의 시작 단백질과 관심 있는 신호전달경로 위에 존재하는 최종 단백질과의 상호작용거리(interaction distance)를 나타내는 기능을 제공한다. 상기 패스마커 모듈(600)은 복수의 시작 단백질과 상호작용하는 최종 단백질들의 위치와 빈도를 신호전달경로 지도상에 표시하는 기능을 제공한다. The
상기 패스리스터 모듈(700)은 복수의 시작 단백질이 각각 관계하고 있는 신호전달경로를 상호작용거리(interaction distance)에 따라 찾아주고, 시작 단백질과 최종 단백질간의 경로 수에 따른 신호전달경로, 신호전달경로 내 최종 단백질 점유율(또는 빈도수) 등으로 우선순위를 통계 처리하는 기능을 제공한다.The
상기 여과 모듈(800)은 사용자에게 보다 정확하고 신뢰성이 제고된 정보를 제공하기 위해 생물 종(Organism), 상호작용 유형(interaction Type), 상호작용 검출 방법(Interaction detection method), 정보의 개수 (제공되는 DB의개수, 관련 논문 수, interaction detection 방법의 개수) 등에 대한 여과 기능을 제공한다.The
상기 데이터베이스 관리자 모듈(900)은 데이터베이스와의 연결 및 데이터 입출력을 처리한다. 상기 데이터베이스 관리자 모듈(900)은 단백질 정보 프로세서(Protein Information Process)(910), 단백질 상호작용 프로세서(Protein Interaction Processor)(920), 신호전달 경로 프로세서(Signal Pathway Processor)(930) 등과 같은 복수의 프로세서를 포함한다.The
상기 단백질 상호작용 프로세서는 IntAct, BioGrid, DIP, HPRD, MINT DB 등과 같은 상호작용정보 데이터베이스(1200)를 기반으로 특정 단백질에 대한 상호작용 관계 정보를 처리하고, 상기 신호전달 경로 프로세서는 KEGG DB와 같은 표시정보 데이터베이스(1300)를 기반으로 특정 신호전달 경로에 대한 정보를 처리한다.The protein interaction processor processes interaction relationship information for a specific protein based on the
상기 단백질정보 데이터베이스(1000)는 단백질 이름, 단백질 종류, 유전자 서열 등의 단백질 정보를 저장한다. 본 발명은 상기 단백질정보 데이터베이스(1000)로서 UniprotKB DB 및/또는 SwissProt DB를 이용하나, 이에 한정되지 않는다. 상기 신호전달 경로 데이터베이스(1300)는 단백질의 신호전달 경로 및 유전자 정보를 저장한다. 본 발명은 상기 신호전달 경로 데이터베이스(1300)로서 KEGG DB를 이용하나, 이에 한정되지 않는다.The
상기 매칭정보 데이터베이스(1100)는 단백질의 고유번호와 단백질 이름 등을 매칭시켜 원하는 단백질 정보를 쉽게 획득할 수 있게 한다. 본 발명은 상기 매칭정보 데이터베이스(1100)로서 iProClass DB를 이용하나, 이에 한정되지 않는다. 상기 iProClass DB는 NCBI gi와 UniprotKB/SwissProt과를 매칭 정보를 제공한다.The matching
상기 상호작용정보 데이터베이스(1200)는 단백질간의 상호작용 관계 정보를 저장한다. 본 발명은 상기 상호작용정보 데이터베이스(1200)로서 IntAct, BioGrid, DIP, HPRD, MINT DB 등의 DB를 이용하나, 이에 한정되지 않는다. 상기 신호전달 정 보 데이터베이스(1300)는 신호전달 경로 지도 및 단백질 명칭 등의 표시 정보를 저장한다. 본 발명은 상기 신호전달정보 데이터베이스(1300)로서 KEGG DB를 이용하나, 이에 한정되지 않는다. 또한, 본 발명은 상술한 데이터베이스 외에 다른 데이터베이스를 포함할 수 있다. 이하에서 메인엔진 모듈을 구성하는 각 모듈의 기능을 기술한다.The
도 2는 본 발명의 일실시예에 따른 PPI 모듈(300)의 기능을 설명하기 위한 흐름도 및 이용되는 데이터베이스를 도시하는 도면이다. 상기 PPI 모듈(300)은 관심 대상이 되는 시작 단백질과 상호작용하는 최종 단백질들을 화면에 도식화해 준다. 먼저, 시작 단백질의 이름 정보를 입력하기 위해, 사용자가 검색어를 입력하고(S310), 상기 검색어에 따라 리스트되는 단백질 중 시작 단백질 이름을 선택한다(S320). 이때, 데이터베이스 관리자 모듈(900)을 통해 UniProtKB/SwissProt DB(1000)에 저장된 단백질 이름 정보를 이용한다.2 is a diagram illustrating a flow chart for explaining the function of the
그 다음에 보다 정확하고 신뢰성이 제고된 정보를 제공받기 위해, 사용자는 데이터베이스에 저장된 정보를 여과하여 얻기 위한 여과 조건을 설정한다(S330). 예를 들면, 사용자는 생물 종(Organism), 상호작용 유형(interaction Type), 상호작용 검출 방법 (Interaction detection method), 정보의 개수(제공되는 DB의 개수, 관련 논문 수, interaction detection 방법의 개수) 등에 대한 여과(filter) 조건을 설정할 수 있다.(S330). Then, in order to receive more accurate and reliable information, the user sets filtering conditions for filtering and obtaining information stored in the database (S330). For example, the user may be able to determine the species, the interaction type, the interaction detection method, the number of information (the number of DBs provided, the number of related articles, and the number of interaction detection methods). Filter conditions may be set for the display (S330).
그 다음에 사용자가 상기 시작 단백질과 상호작용하는 최종 단백질의 상호작용 거리를 입력하면(S340), 상기 PPI 모듈(300)은 단백질 상호작용 프로세서(920) 를 통해 IntAct, BioGrid, DIP, HPRD, MINT 등의 DB(1200)로부터 상호작용 거리 내에서 시작 단백질과 상호작용하는 최종 단백질 정보를 검색하고(S350), 화면구성 모듈(200)은 상기 단백질 정보를 화면에 상호작용 거리에 따라 배치한다(S360). Then, when the user inputs the interaction distance of the final protein interacting with the starting protein (S340), the
이때, 선택적으로 상기 최종 단백질 검색은 여과모듈(800)을 이용하여 사용자에 의해 설정된 여과 조건에 따라 수행될 수 있다. 즉, 본 발명은 생물학적으로 유용한 정보를 획득할 수 있도록 필터 적용단계 포함하고 있으며, 상기 시작 단백질의 상호작용 관계 정보 및 신호전달 정보를 검색 하는 과정에서 정보를 여과(filter)하여 검색 할 수 있다. 따라서, 여과를 통해 획득되는 정보의 신뢰도 향상 및 높은 정확도를 확보하여 사용자의 실험을 디자인 하는데 도움을 줄 수 있다.In this case, optionally, the final protein search may be performed according to filtration conditions set by a user using the
도 3은 본 발명의 일실시예에 따른 화면상에 표시되는 PPI 모듈에 대한 도면이다. 도 3을 참조하면, 도면부호 301은 검색어를 입력하는 곳이고, 도면부호 302는 검색어에 따라 리스트되는 단백질 이름들을 도시한다. 도면부호 303은 상호작용 거리를 입력하는 곳이고, 도면부호 304는 상기 PPI 모듈(300)에 의해 수행된 결과를 나타낸다. 왼쪽의 네모 박스가 시작 단백질을 나타내고, 오른쪽의 복수의 네모 박스들이 상기 시작 단백질과 상호작용하는 최종 단백질들을 나타낸다. 도 3은 상호작용 거리를 1로 한 경우를 도시한다.3 is a diagram illustrating a PPI module displayed on a screen according to an embodiment of the present invention. Referring to FIG. 3,
도 4는 본 발명의 일실시예에 따른 패스파인더 모듈(400)의 기능을 설명하기 위한 흐름도 및 이용되는 데이터베이스를 도시하는 도면이다. 패스파인더 모듈(400)은 하나의 시작 단백질과 알려진 모든 신호전달 경로와의 관계를 찾고, 시 작 단백질의 신호전달 경로뿐만 아니라 시작 단백질과 상호작용하는 최종 단백질이 관여하는 신호전달 경로들의 정보를 제공하며, 선택된 신호전달 경로를 직접 화면에 표시한다. 상호작용 거리의 제한 없이 검색이 가능하고, 상호작용 거리별 또는 신호전달 경로별 신호전달 경로 리스트 정렬이 가능하다.4 is a flowchart illustrating a function of the
도 4를 참조하면, 먼저 시작 단백질을 검색한다(S410). 검색 방법은 사용자가 검색어를 입력하면, 단백질 정보 프로세서(910)가 UniProtKB/SwissProt DB(1000)로부터 검색어와 일치하는 단백질 정보를 찾아, 검색 결과를 UI를 통해 사용자에게 제공하고, 사용자는 상기 검색 결과 중 원하는 시작 단백질을 선택한다(S420).Referring to FIG. 4, first, a starting protein is searched for (S410). In the search method, when a user inputs a search word, the
그 다음에 보다 정확하고 신뢰성이 제고된 정보를 제공받기 위해, 사용자는 단백질 상호작용 DB(1200)에 저장된 정보를 여과하여 얻기 위한 여과 조건을 설정한다(430). 예를 들면, 사용자는 생물 종(Organism), 상호작용 유형(interaction Type), 상호작용 검출 방법 (Interaction detection method), 정보의 개수(제공되는 DB의 개수, 관련 논문 수, interaction detection 방법의 개수) 등에 대한 여과(filter) 조건을 설정한다(S430).Then, in order to be provided with more accurate and reliable information, the user sets filtration conditions for obtaining and filtering information stored in the protein interaction DB 1200 (430). For example, the user may be able to determine the species, the interaction type, the interaction detection method, the number of information (the number of DBs provided, the number of related articles, and the number of interaction detection methods). A filter condition for the setting is set (S430).
그 다음에 시작 단백질과 상호작용하는 최종 단백질의 상호작용 거리를 입력하면(S440), 패스파인더 모듈(400)은 단백질 상호작용 프로세서(920)를 이용하여 IntAct, BioGrid, DIP, HPRD, MINT 등의 DB(1200)로부터 상호작용 관계 정보를 획득하고, 신호전달 경로 프로세서(930)는 KEGG DB(1300)로부터 신호전달 경로를 검색한다(S450). 이때, 선택적으로 상기 상호작용 관계 정보 획득은 여과모듈(800)을 이용하여 사용자에 의해 설정된 여과 조건에 따라 수행될 수 있다.Then, when the interaction distance of the final protein interacting with the starting protein (S440), the
신호전달 경로를 검색하는 단계는 다음과 같다. 1) 시작 단백질과 연관된 단백질들 중에서 정해진 상호작용 거리의 범위 내의 최종 단백질을 수집한다. 2) 시작 단백질 및/또는 최종 단백질 정보와 KEGG DB(1300)의 Gene 정보와의 매칭을 수행한다. 3) KEGG DB(1300)에서 매칭된 유전자 정보의 신호전달 경로에 대한 상세 정보를 가져온다. 4) 정해진 상호작용 거리 범위 내에서 2~3번의 과정을 반복하여 얻어진 결과를 화면에 목록형태로 표시한다.The search for the signaling path is as follows. 1) Collect the final protein within a defined range of interaction distances among the proteins associated with the starting protein. 2) The matching between the starting protein and / or the final protein information and Gene information of the
그 다음에 사용자는 신호전달 경로 검색 결과 중 원하는 최종 단백질이 올라가 있는 신호전달 경로를 선택하고(S460), 화면구성 모듈(200)은 상기 상호작용 관계 정보를 이용하여 상기 선택된 신호전달 경로에 시작 단백질과 최종 단백질을 상호작용 관계를 출력한다(S470).Then, the user selects a signaling pathway in which the desired final protein is raised among the signaling pathway search results (S460), and the
신호전달 경로를 출력하는 방법은 다음과 같다. 1) 선택된 신호전달 경로에 해당하는 신호전달 경로 지도를 찾아 화면에 출력한다. 2) KEGG DB(1300)에서 선택된 최종 단백질의 지도상 위치 정보를 가져온다. 3) 상기 위치 정보를 이용하여 신호전달 경로 지도에 최종 단백질을 표시한다. 4) 시작 단백질로부터 최종 단백질까지의 상호작용 경로를 구한다.The method of outputting a signal transmission path is as follows. 1) Find the signal transmission path map corresponding to the selected signal transmission path and output it on the screen. 2) Get the location information on the map of the final protein selected in the KEGG DB (1300). 3) The final protein is displayed on the signaling pathway map using the location information. 4) Obtain the interaction pathway from the starting protein to the final protein.
상기 상호작용 경로를 구하는 방법은 다음과 같다. 4-1) 신호전달 경로 검색단계에서 수집한 최종 단백질의 계층 구조에서 최종 단백질로부터 시작하여 촌수가 작아지는 방향으로 연관된 단백질을 찾는다. 4-2) 상호작용 거리가 0인 시작 단백질에 도달할 때까지 4-1을 반복한다. 4-3) 검색 결과를 노드(Node)와 에지(Edge) 형태로 변환한 후, 화면구성 모듈(200)(예를 들면, GraphViz 엔진)로 넘겨 각각의 위치를 결정한다. 4-4) 4-3에서의 배치 결과를 토대로 화면에 표시한다.The method for obtaining the interaction path is as follows. 4-1) Search for the related protein starting from the final protein in the hierarchy of the final protein collected in the signaling pathway search step in the direction of decreasing village number. 4-2) Repeat 4-1 until you reach a starting protein with zero interaction distance. 4-3) The search results are converted into node and edge forms, and then passed to the screen configuration module 200 (eg, the GraphViz engine) to determine respective positions. 4-4) Display on the screen based on the arrangement result in 4-3.
도 5는 본 발명의 일실시예에 따른 화면상에 표시되는 패스파인더 모듈(400)에 대한 도면이다. 도 5를 참조하면, 도면부호 401은 시작 단백질을 선택하는 곳이고, 도면부호 402는 상호작용 거리를 입력하는 곳이며, 도면부호 403은 관심 있는 신호전달 경로를 선택하는 곳이고, 도면부호 404는 상기 패스파인더 모듈(400)에 의해 출력되는 단백질 경로를 나타낸다. 오른쪽의 복수의 네모 박스들 중 두꺼운 네모 상자(405)가 최종 단백질을 나타낸다.5 is a diagram of a
도 6은 본 발명의 일실시예에 따른 패스링커 모듈(500)의 기능을 설명하기 위한 흐름도 및 이용되는 데이터베이스를 도시하는 도면이다. 패스링커 모듈(500)은 복수의 시작 단백질을 입력하여, 관심 있는 신호전달 경로와의 관계를 도식화한다. 이때, 시작 단백질 수는 제한 없이 입력이 가능하고, 관심 있는 신호전달 경로와 상호작용 거리에 대한 파라미터를 설정하면, 그 결과가 화면에 표시된다.6 is a diagram illustrating a flow chart for explaining the function of the
도 6을 참조하면, 먼저 단백질 목록을 작성한다(S510). 단백질 목록을 작성하는 방법은 두 가지 방법이 이용될 수 있다. 첫 번째 방법은 사용자가 단백질의 NCBI gi를 입력하는 경우이다. 1) 단백질 정보 프로세서(910)를 통해 iProClass DB(1100)를 검색하여 NCBI gi에 해당하는 단백질의 존재여부를 검색하고, 2) 검색된 결과에서 NCBI gi에 해당하는 UniprotKB ID를 얻으며, 3) UniprotKB DB(1000)에서 UniprotKB ID에 해당하는 모든 정보를 가져온다.Referring to FIG. 6, first, a protein list is prepared (S510). There are two ways to create a protein list. The first is when the user enters the protein's NCBI gi. 1) Search the
두 번째 방법은 사용자가 단백질의 이름을 입력하는 경우이다. 1) 단백질 정 보 프로세서(910)를 통해 UniprotKB DB(1000)에서 검색어에 해당하는 단백질을 전문검색(Fulltext Search)하고, 2) 검색 결과를 사용자가 선택할 수 있도록 목록으로 표시하며, 3) UniprotKB DB(1000)에서 검색 결과에 해당하는 모든 정보를 가져온다.The second method is when the user enters the name of the protein. 1) Fulltext Search for the protein corresponding to the search word in UniprotKB DB (1000) through the protein information processor (910), 2) Display the search results in a list for the user to select, and 3) UniprotKB DB At 1000, all information corresponding to the search result is obtained.
그 다음에 사용자가 목표로 하는 신호전달 경로를 선택하고(S520), 사용자는 단백질 상호작용 DB(1200)에 저장된 정보를 여과하여 얻기 위한 여과 조건을 설정한다(S530). 예를 들면, 사용자는 생물 종(Organism), 상호작용 유형(interaction Type), 상호작용 검출 방법 (Interaction detection method), 정보의 개수(제공되는 DB의 개수, 관련 논문 수, interaction detection 방법의 개수) 등에 대한 여과(filter) 조건을 설정한다(S530).Next, the user selects a target signaling path (S520), and the user sets filtration conditions for filtering and obtaining information stored in the protein interaction DB 1200 (S530). For example, the user may be able to determine the species, the interaction type, the interaction detection method, the number of information (the number of DBs provided, the number of related articles, and the number of interaction detection methods). A filter condition for the back is set (S530).
시작 단백질과 목표로 하는 신호전달 경로에 올라와 있는 최종 단백질 사이의 최소 상호작용 거리를 입력하면(S540), 패스링커 모듈(500)은 링크 결과를 출력한다(S550).When the minimum interaction distance between the starting protein and the final protein on the target signaling path is input (S540), the
링크 결과를 출력하는 방법은 다음과 같다. 1) 시작 단백질 목록의 각 단백질에 대해서 상호작용 거리 범위 내의 최종 단백질을 구하고, 2) 신호전달 경로 프로세서(930)를 통해 KEGG DB(1300)로부터 최종 단백질들 중 목표로 하는 신호전달 경로 상에 올라와 있는 것들을 골라내며, 3) 단백질 상호작용 프로세서(920)를 통해 IntAct, BioGrid, DIP, HPRD, MINT 등의 DB(1200)로부터 시작 단백질과 최종 단백질간의 상호작용 관계 정보, 예를 들면, 각 시작 단백질의 최종 단백질들에 대한 상호작용 상호 거리의 최소값을 구하고, 4) 각 시작 단백질과 목표로 하는 신호전 달 경로를 노드로 하고, 시작 단백질과 목표로 하는 신호전달 경로를 잇는 최소 상호작용 거리를 에지로 구성하여, 화면구성 모듈(200)(예를 들면, GraphViz 엔진)에 전달하여 노드와 에지가 화면상에 배치될 위치를 결정한 후, 5) 그 결과를 화면에 출력한다. 이때, 선택적으로 상기 상호작용 관계 정보는 여과모듈(800)을 이용하여 사용자에 의해 설정된 여과 조건에 따라 획득될 수 있다.The following example shows how to output the link result. 1) obtain the final protein within the interaction distance range for each protein in the starting protein list, and 2) climb through the
도 7은 본 발명의 일실시예에 따른 화면상에 표시되는 패스링커 모듈(500)에 대한 도면이다. 도 7을 참조하면, 도면부호 501은 시작 단백질을 목록을 작성하는 곳이고, 도면부호 502는 상호작용 거리를 입력하는 곳이며, 도면부호 503은 목표로 하는 신호전달 경로를 선택하는 곳이고, 도면부호 504는 상기 패스링커 모듈(500)에 의해 수행된 결과를 나타낸다. 왼쪽의 네모 박스가 목표로 하는 신호전달 경로를 나타내며, 오른쪽의 복수의 네모 박스들이 시작 단백질 목록을 나타낸다. 신호전달 경로와 시작 단백질들과의 거리는 상호작용 거리를 나타낸다. 즉, 상호작용 거리 1은 직접 상호작용하는 것이고, 상호작용 거리 2는 시작단백질과 상호작용하는 단백질과 상호작용하는 경우이다.7 is a diagram of a
도 8은 본 발명의 일실시예에 따른 패스마커 모듈(600)의 기능을 설명하기 위한 흐름도 및 이용되는 데이터베이스를 도시하는 도면이다. 패스마커 모듈(600)은 시작 단백질이 목표로 하는 신호전달 경로 상의 어떤 단백질과 상호작용하는지를 표현한다. 시작 단백질 수는 제한 없이 입력이 가능하고, 목표로 하는 신호전달 경로와 상호작용 거리에 대한 파라미터를 설정한 후, 그 결과를 화면에 표시한다.8 is a diagram illustrating a flow chart for explaining the function of the
패스링커 모듈(500)이 단백질과 신호전달 경로와 상호작용 거리 관계를 표시 한다면, 패스마커 모듈(600)은 신호전달 경로 지도를 펼치고 그 위에서 시작 단백질이 어떤 단백질과 상호작용하는지를 표시한다.If the
도 8을 참조하면, 먼저 시작 단백질 목록을 작성한다(S610). 도 6을 참조하여 기술한 것처럼, 시작 단백질 목록을 작성하는 방법은 두 가지 방법이 있으며, 상기 두 가지 방법을 동일하게 이용할 수 있다.Referring to FIG. 8, first, a start protein list is prepared (S610). As described with reference to FIG. 6, there are two methods for preparing a starting protein list, and the two methods may be equally used.
그 다음에 목표로 하는 신호전달 경로를 선택한다(S620). 신호전달 경로를 선택하는 방법은 다음과 같다. 1) 신호전달 경로 프로세서(930)를 통해 KEGG DB(1300)로부터 DB상에 존재하는 모든 신호전달 경로를 가져오고, 2) 신호전달 경로를 화면에 표시하며, 3) 사용자가 원하는 신호전달 경로를 선택한다.Next, a target signal transmission path is selected (S620). The method of selecting a signaling path is as follows. 1) From the
그 다음에 보다 정확하고 신뢰성이 제고된 정보를 제공받기 위해, 사용자는 단백질 상호작용 DB(1200)에 저장된 정보를 여과하여 얻기 위한 여과 조건을 설정한다(S630). 예를 들면, 사용자는 생물 종(Organism), 상호작용 유형(interaction Type), 상호작용 검출 방법 (Interaction detection method), 정보의 개수(제공되는 DB의 개수, 관련 논문 수, interaction detection 방법의 개수) 등에 대한 여과(filter) 조건을 설정한다(S630). Then, in order to be provided with more accurate and reliable information, the user sets filtering conditions for filtering and obtaining information stored in the protein interaction DB 1200 (S630). For example, the user may be able to determine the species, the interaction type, the interaction detection method, the number of information (the number of DBs provided, the number of related articles, and the number of interaction detection methods). A filter condition for the setting is set (S630).
그 다음에 시작 단백질 목록과 목표로 하는 신호전달 경로에 올라와 있는 최종 단백질 사이의 최소 상호작용 거리를 입력하면(S640), 패스마커 모듈(600)은 마크 결과를 출력한다(S650).Next, if the minimum interaction distance between the starting protein list and the final protein on the target signaling path is input (S640), the
상기 마크 결과를 출력하는 방법은 다음과 같다. 1) 시작 단백질 목록의 각 단백질에 대해서 상호작용 거리 범위 내의 최종 단백질을 구하고, 2) 최종 단백질 들 중 목표로 하는 신호전달 경로 상에 올라와 있는 것들을 골라내며, 3) 목표로 하는 신호전달 경로 지도를 화면에 표시하고, 4) 신호전달 경로 프로세서(930)를 통해 KEGG DB(1300)에서 목표로 하는 신호전달 경로에 대한 최종 단백질 데이터를 가져오며, 5) KEGG DB에(1300)에서 가져온 최종 단백질에 대한 좌표 데이터를 가져오고, 단백질 상호작용 프로세서(920)를 통해 단백질 상호작용 DB(1200)로부터 상호작용 관계 정보를 획득하며, 6) KEGG DB(1300)에서 목표로 하는 신호전달 경로에 대한 최종 단백질의 좌표를 구하고, 좌표와 일치하는 단백질을 찾으며, 7) 각 시작 단백질에 해당하는 최종 단백질의 개수를 구하고, 8) 입력 단백질의 개수의 빈도에 따라서 색을 다르게 지정하며, 9) 상기 상호작용 관계 정보를 이용하여 도달한 최종 단백질들을 목표로 하는 신호전달 경로 상에 표시하고, 10) 단백질 정보를 목록 형태로 표시한다. 이때, 선택적으로 상기 상호작용 관계 정보는 여과모듈(800)을 이용하여 사용자에 의해 설정된 여과 조건에 따라 획득될 수 있다.The method of outputting the mark result is as follows. 1) For each protein in the starting protein list, find the final protein within the interaction distance range, 2) Select one of the final proteins that is on the target signaling pathway, and 3) Map the target signaling pathway. On the screen, and 4) bring the final protein data for the signaling pathway targeted by the
도 9는 본 발명의 일실시예에 따른 화면상에 표시되는 패스마커 모듈에 대한 도면이다. 도 9를 참조하면, 도면부호 601은 시작 단백질을 목록을 작성하는 곳이고, 도면부호 602는 목표로 하는 신호전달 경로를 선택하고, 상호작용 거리를 입력하는 곳이며, 도면부호 603은 상기 패스마커 모듈(600)에 의해 수행된 결과를 단백질 목록으로 나타낸 것이다. 오른쪽 그림에서 복수의 네모 박스들은 시작 단백질과 상호작용하는 최종 단백질들이다. 도면부호 605는 최종 단백질들이 시작 단백질과 상호작용하는 정도에 따라 서로 다른 색으로 표시되는 것을 나타낸다. 즉, 진한 색으로 표시된 단백질(604)은 시작 단백질들과 상호작용을 많이 한다는 것을 나타낸 다.9 is a diagram illustrating a pass marker module displayed on a screen according to an embodiment of the present invention. Referring to FIG. 9,
도 10은 본 발명의 일실시예에 따른 패스리스터 모듈(700)의 기능을 설명하기 위한 흐름도 및 이용되는 데이터베이스를 도시하는 도면이다. 도 10을 참조하면, 상기 패스리스터 모듈(700)의 기능은 다음과 같은 과정을 통해 수행된다. FIG. 10 is a diagram illustrating a flow chart and a database used for describing the function of the
먼저 시작 단백질 목록을 작성하고(S710), 결과를 저장할 폴더를 지정(S720)한다. 이때, 단백질 정보 프로세서(910)를 통해 UniprotKB DB(1000) 및 iProClass DB(1100)을 이용한다.First, a start protein list is prepared (S710), and a folder for storing a result is designated (S720). At this time, the
그 다음에 보다 정확하고 신뢰성이 제고된 정보를 제공받기 위해, 사용자는 단백질 상호작용 DB(1200)에 저장된 정보를 여과하여 얻기 위한 여과 조건을 설정한다(S730). 예를 들면, 사용자는 생물 종(Organism), 상호작용 유형(interaction Type), 상호작용 검출 방법 (Interaction detection method), 정보의 개수(제공되는 DB의 개수, 관련 논문 수, interaction detection 방법의 개수) 등에 대한 여과(filter) 조건을 설정한다(S730).Then, in order to be provided with more accurate and reliable information, the user sets filtering conditions for filtering and obtaining information stored in the protein interaction DB 1200 (S730). For example, the user may be able to determine the species, the interaction type, the interaction detection method, the number of information (the number of DBs provided, the number of related articles, and the number of interaction detection methods). A filter condition for the setting is set (S730).
그 다음에 상호작용 거리를 정하면(S740), 패스리스터 모듈(700)은 신호전달 프로세서(930) 및 단백질 상호작용 프로세서(920)를 통해 KEGG DB(1300) 및 IntAct DB(1200)를 이용하여 신호전달 경로 검색 및 상호작용 관계 정보를 획득하고(S750), 검색 결과를 저장하며(S760), 검색 결과를 신호전달 경로별로 통계를 산출(S770)한 후에, 통계 결과를 출력 및 저장(S780)한다. 이때, 상기 상호작용 관계 정보는 여과모듈(800)을 이용하여 사용자에 의해 설정된 여과 조건에 따라 획득될 수 있다. 상기 신호전달 경로를 획득하는 단계(S750)와 상기 통계 결과를 출력 및 저장하는 단계(S780) 사이의 과정은 반복될 수 있다.Next, when the interaction distance is determined (S740), the
상기 패스리스터 모듈(700)은 각각의 입력 단백질마다 상세 결과를 탭으로 보여주고, 상호작용 거리별로 신호전달 경로 우선순위 통계를 제공하며, 입력 단백질과 상호작용하는 단백질의 우선순위 통계를 제공한다.The
도 11은 본 발명의 일실시예에 따른 화면상에 표시되는 패스리스터 모듈(700)에 대한 도면이다. 도 11을 참조하면, 도면부호 701은 복수의 단백질을 입력하는 곳이고, 도면부호 702는 패스리스터 모듈(700)에 의한 출력 결과를 저장할 폴더를 지정하는 곳이다. 도면부호 703은 상호작용 거리를 입력하는 곳이고, 도면부호 704는 각각의 입력 단백질마다 상세 결과를 탭으로 보여주는 곳이며, 도면부호 705는 상호작용 거리별로 신호전달 경로 우선순위 통계를 제공하는 곳이고, 도면부호 706은 입력 단백질과 상호작용하는 단백질의 우선순위 통계를 제공하는 곳이다.FIG. 11 is a diagram illustrating a
또한, 본 발명은 상술한 방법들 중 적어도 하나의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록매체를 포함한다.The invention also includes a computer readable recording medium having recorded thereon a program for executing at least one of the above methods.
이상과 같이 본 발명에서는 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시 예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. In the present invention as described above has been described by the limited embodiment and the drawings, but this is provided only to help a more general understanding of the present invention, the present invention is not limited to the above embodiments, it is common in the field of the present invention Those skilled in the art can make various modifications and variations from this description.
따라서, 본 발명의 사상은 설명된 실시 예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허 청구범위와 균등하거나 등가적 변형이 있 는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Accordingly, the spirit of the present invention should not be limited to the described embodiments, and all of the equivalents and equivalents of the claims, as well as the claims described below, belong to the scope of the present invention. will be.
도 1은 본 발명의 전체 시스템 구성도 1 is an overall system configuration of the present invention
도 2는 본 발명의 PPI 모듈의 기능을 설명하기 위한 흐름도 및 이용되는 데이터베이스를 도시하는 도면Figure 2 shows a flow chart for explaining the functionality of the PPI module of the present invention and the database used;
도 3은 본 발명의 일실시예에 따른 화면상에 표시되는 PPI 모듈에 대한 도면3 is a diagram of a PPI module displayed on a screen according to an embodiment of the present invention;
도 4는 본 발명의 Path-Finder 모듈의 기능을 설명하기 위한 흐름도 및 이용되는 데이터베이스를 도시하는 도면4 is a flowchart illustrating a function of the Path-Finder module of the present invention and a database used.
도 5는 본 발명의 일실시예에 따른 화면상에 표시되는 Path-Finder 모듈에 대한 도면5 is a diagram of a path finder module displayed on a screen according to an embodiment of the present invention;
도 6은 본 발명의 Path-Linker 모듈의 기능을 설명하기 위한 흐름도 및 이용되는 데이터베이스를 도시하는 도면FIG. 6 shows a flow chart for explaining the function of the Path-Linker module of the present invention and a database used. FIG.
도 7은 본 발명의 일실시예에 따른 화면상에 표시되는 Path-Linker 모듈에 대한 도면7 is a diagram of a Path-Linker module displayed on a screen according to an embodiment of the present invention.
도 8은 본 발명의 Path-Marker 모듈의 기능을 설명하기 위한 흐름도 및 이용되는 데이터베이스를 도시하는 도면FIG. 8 shows a flow chart for explaining the function of the Path-Marker module of the present invention and a database used.
도 9는 본 발명의 일실시예에 따른 화면상에 표시되는 Path-Marker 모듈에 대한 도면9 is a diagram of a Path-Marker module displayed on a screen according to an embodiment of the present invention.
도 10은 본 발명의 Path-Lister 모듈의 기능을 설명하기 위한 흐름도 및 이용되는 데이터베이스를 도시하는 도면FIG. 10 is a flowchart illustrating a function of the Path-Lister module of the present invention and a database used. FIG.
도 11은 본 발명의 일실시예에 따른 화면상에 표시되는 Path-Lister 모 듈(700)에 대한 도면11 is a diagram of a Path-
<도면의 주요부분에 대한 부호의 설명><Description of the symbols for the main parts of the drawings>
100 : UI 모듈 200 : 화면구성 모듈100: UI module 200: screen configuration module
300 : PPI 모듈 400 : Path-Finder 모듈300: PPI module 400: Path-Finder module
500 : Path-Linker 모듈 600 : Path-Marker 모듈500: Path-Linker Module 600: Path-Marker Module
700 : Path-Lister 모듈 800 : 여과 모듈700: Path-Lister Module 800: Filtration Module
900 : 데이터베이스 관리자 모듈 1000 : 단백질정보 데이터베이스900: database manager module 1000: protein information database
1100 : 매칭정보 데이터베이스1100: Matching database
1200 : 상호작용정보 데이터베이스1200: Interactive Information Database
1300 : 신호전달 경로 및 유전자정보 데이터베이스1300: Signaling Pathway and Gene Information Database
Claims (27)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20080023917A KR100957386B1 (en) | 2008-03-14 | 2008-03-14 | Method and system for extracting and displaying interaction networks between proteins and signal pathways by mapping protein-protein interaction and signal pathway information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20080023917A KR100957386B1 (en) | 2008-03-14 | 2008-03-14 | Method and system for extracting and displaying interaction networks between proteins and signal pathways by mapping protein-protein interaction and signal pathway information |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090098491A KR20090098491A (en) | 2009-09-17 |
KR100957386B1 true KR100957386B1 (en) | 2010-05-11 |
Family
ID=41357561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR20080023917A KR100957386B1 (en) | 2008-03-14 | 2008-03-14 | Method and system for extracting and displaying interaction networks between proteins and signal pathways by mapping protein-protein interaction and signal pathway information |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100957386B1 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040102887A (en) * | 2003-05-30 | 2004-12-08 | 학교법인 인하학원 | A Method for Visualizing Protein Interaction Networks |
KR20060064492A (en) * | 2004-12-08 | 2006-06-13 | 한국전자통신연구원 | Method and system for predicting gene pathway using expression pattern data and protein interaction data of gene |
KR20070062025A (en) * | 2005-12-12 | 2007-06-15 | 오브젝트인터랙션테크놀로지스(주) | System and method for analysis of interfaces based on protein domain and recording medium therefor |
-
2008
- 2008-03-14 KR KR20080023917A patent/KR100957386B1/en active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20040102887A (en) * | 2003-05-30 | 2004-12-08 | 학교법인 인하학원 | A Method for Visualizing Protein Interaction Networks |
KR20060064492A (en) * | 2004-12-08 | 2006-06-13 | 한국전자통신연구원 | Method and system for predicting gene pathway using expression pattern data and protein interaction data of gene |
KR20070062025A (en) * | 2005-12-12 | 2007-06-15 | 오브젝트인터랙션테크놀로지스(주) | System and method for analysis of interfaces based on protein domain and recording medium therefor |
Also Published As
Publication number | Publication date |
---|---|
KR20090098491A (en) | 2009-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Heumos et al. | Best practices for single-cell analysis across modalities | |
Hecht et al. | Automatic identification of building types based on topographic databases–a comparison of different data sources | |
Rodríguez-Díaz et al. | Sustainability as a key factor in tourism competitiveness: A global analysis | |
CN104737160B (en) | Picture from sketch | |
JP5534007B2 (en) | Feature point detection system, feature point detection method, and program | |
WO2013025561A1 (en) | Sequence read archive interface | |
AU2014228754B2 (en) | Non-deterministic disambiguation and matching of business locale data | |
US20130246410A1 (en) | Server, information-management method, information-management program, and computer-readable recording medium with said program recorded thereon | |
Wittich et al. | Recommending plant taxa for supporting on-site species identification | |
KR101007549B1 (en) | Method and System for managing and integrating a POI | |
JP2021018459A (en) | Evaluation support method, evaluation support system, and program | |
Wang et al. | Visualizing the intellectual structure of eye movement research in cartography | |
CN115984044A (en) | Excavation method for tourism development of high-potential villages | |
KR100957386B1 (en) | Method and system for extracting and displaying interaction networks between proteins and signal pathways by mapping protein-protein interaction and signal pathway information | |
Shen et al. | Crowd-sourced city images: Decoding multidimensional interaction between imagery elements with volunteered photos | |
CN112700055A (en) | Training method for making artificial neural network have shop site selection capability, shop site selection method, storage medium and shop site selection system | |
Praneenararat et al. | Interactive, multiscale navigation of large and complicated biological networks | |
CN113010727B (en) | Live platform portrait construction method, device, equipment and storage medium | |
Bordogna et al. | Implicit, formal, and powerful semantics in geoinformation | |
CN112650949B (en) | Regional POI (point of interest) demand identification method based on multi-source feature fusion collaborative filtering | |
JP6361173B2 (en) | Information processing apparatus, information processing method, program, and information processing system | |
Atas et al. | Phylogenetic and other conservation-based approaches to predict protein functional sites | |
Lurie et al. | Searching for Representation: A sociotechnical audit of googling for members of US Congress | |
Cui et al. | Optimization framework for spatiotemporal analysis units based on floating car data | |
Tatit et al. | Navigating the Maps: Euclidean vs. Road Network Distances in Spatial Queries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130503 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20140507 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160503 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20170504 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20180503 Year of fee payment: 9 |