KR20030019681A - Web-based workbench system and method for proteome analysis and management - Google Patents
Web-based workbench system and method for proteome analysis and management Download PDFInfo
- Publication number
- KR20030019681A KR20030019681A KR1020010052555A KR20010052555A KR20030019681A KR 20030019681 A KR20030019681 A KR 20030019681A KR 1020010052555 A KR1020010052555 A KR 1020010052555A KR 20010052555 A KR20010052555 A KR 20010052555A KR 20030019681 A KR20030019681 A KR 20030019681A
- Authority
- KR
- South Korea
- Prior art keywords
- proteome
- data
- experimental
- search
- database
- Prior art date
Links
Classifications
-
- G06F17/30—
-
- G06F19/18—
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
본 발명은 프로테옴(Proteome) 분석 시스템에 관한 것으로, 특히 생물학연구 방법 중 하나인 2차원 전기영동에 의해 얻어진 프로테옴 관련 정보를 저장, 검색 및 분석할 수 있는 시스템 및 그 방법에 관한 것이다.The present invention relates to a proteome analysis system, and more particularly, to a system and method for storing, retrieving and analyzing proteome related information obtained by two-dimensional electrophoresis, which is one of biological research methods.
프로테옴은 프로테인(Protein ; 단백질)과 옴(Ome ; 전체)의 합성어로서, 모든 단백질의 총체를 일컫는다. 일반적으로, 단세포 생물의 세포는 한 가지 양상의 프로테옴을 가지는 반면, 다세포 생물의 각 세포는 같은 유전체(Genome)와 각기 다른 양상의 프로테옴을 가진다. 즉, 다세포 생물의 경우 프로테옴이 유래하는 유전체는 일정하지만 특정 세포나 특정 조건하에서 나타나는 프로테옴의 양상은 다르게 나타난다. 이와 같은 단백질들을 총체적으로 확인하고, 이들 단백질들의 발현 정도, 변형과 세포 내 위치, 이들 단백질들간의 상호 작용 등을 포괄적으로 규명하는 연구를 프로테오믹스(Proteomics)라 일컫는다. 프로테오믹스에 의해 세포 내에서 발현되는 총체적인 단백질들이 규명되고, 이들 단백질들간의 네트워크(network)가 규명됨으로써, 유전체로부터 실제 생명 현상을 이루는 단백질에 이르기까지 총체적인 생명 현상이 규명되어진다.Proteome is a compound word for protein (protein) and ome (total), and refers to the total of all proteins. In general, cells of a single cell organism have one aspect of the proteome, while each cell of the multicellular organism has the same genome and different aspects of the proteome. That is, in the case of multicellular organisms, the genome from which the proteome is derived is constant, but the appearance of the proteome under specific cells or under specific conditions is different. The study that identifies these proteins as a whole and comprehensively identifies the level of expression of these proteins, their modifications and locations within cells, and the interactions between these proteins is called proteomics. By proteomics, the total proteins expressed in cells are identified, and the networks between these proteins are identified, and the overall life phenomena from the genome to the proteins that make up real life are identified.
현재 수행되고 있는 프로테오믹스 연구는 크게 두 가지 기술로 구분될 수 있다. 첫 번째 기술은, 한 세포에서 얻어진 총 단백질군을 서로 분리하여 복수 개의 구성 단백질로 분리하는 기술이고, 두 번째 기술은, 분리된 단백질들을 분석하는 기술이다. 현재 단백질군을 분리하는 기술로는 2차원 폴리아크릴 아마이드 젤 전기영동(2 Dimensional PolyacrylAmide Gel Electrophoresis ; 2D-PAGE) 기술이 개발되어 있다. 2D-PAGE 기술은 개개의 단백질들을 염색하고, 잘라내고, 단백질 분해효소로 자르는 단계들을 자동화 기기와 컴퓨터를 통해 간단히 처리한다. 과학자들은 2D-PAGE 기술에 의해 분리한 단백질을 보다 정확히 규명하기 위해 각 단백질을 초고속 질량분석기(Mass Spectrometry ; MS)로 분석하는 과정을 더 수행한다.Currently, proteomics research can be divided into two technologies. The first technique is to separate the total protein groups obtained from one cell into a plurality of constituent proteins, and the second technique is to analyze the separated proteins. Currently, two-dimensional polyacrylamide gel electrophoresis (2D-PAGE) has been developed as a technique for separating protein groups. The 2D-PAGE technique simply processes the steps of staining, cutting and proteolytic cleavage of individual proteins through automated devices and computers. Scientists further analyze each protein with Mass Spectrometry (MS) to more accurately identify proteins isolated by 2D-PAGE technology.
이와 같은 과정을 통해 얻어진 방대한 양의 프로테옴 연구 결과물은 실험자에 의해 저장되고 분석되어진다. 효과적인 프로테옴 연구 결과물의 분석을 위해서는 프로테옴 연구 결과물에 대한 데이터베이스(database ; DB)화와 함께, 상기 데이터베이스와 기존의 데이터베이스간의 통합된 검색이 요구된다. 그러나, 실험 프로테옴 데이터와, 프로테옴 분석을 위한 기존의 데이터베이스 및 각종 프로테옴 분석 프로그램들은 서로 분리되어 제공되고 있기 때문에, 데이터의 저장, 검색 및 분석 기능이 서로 다른 환경 하에서 개별적으로 동작하여, 사용자들이 사용하는데 어려움이 있었다.The vast amount of proteome research results from this process are stored and analyzed by the experimenter. In order to analyze the results of an effective proteome study, a database (DB) of the proteome study results is required, and an integrated search between the database and the existing database is required. However, since the experimental proteome data, the existing database for proteome analysis, and various proteome analysis programs are provided separately from each other, the data storage, retrieval, and analysis functions are operated separately under different environments, and thus used by users. There was a difficulty.
본 발명이 이루고자 하는 기술적 과제는, 실험 데이터에 대한 단백질 동정 의사 결정을 수행하고, 상기 실험 데이터가 임의의 단백질에 동정된 경우, 상기 단백질 데이터 및 상기 동정 결과를 실험 데이터베이스로 구성하는 웹 기반 프로테옴 분석 및 관리 시스템을 제공하는데 있다.The technical problem to be achieved by the present invention is to perform a protein identification decision on the experimental data, and if the experimental data is identified in any protein, web-based proteome analysis that comprises the protein data and the identification results as an experimental database And to provide a management system.
본 발명이 이루고자 하는 기술적 과제는, 각각 떨어져 존재하고 있는 프로테옴 연구 결과물에 대한 데이터베이스와 기존의 데이터베이스의 저장, 검색 및 분석 기능을 효율적으로 통합한 웹 기반 프로테옴 분석 및 관리 시스템을 제공하는데 있다.The technical problem to be achieved by the present invention is to provide a web-based proteome analysis and management system that efficiently integrates the storage, retrieval and analysis function of the database and the existing database for the proteome research results that exist apart from each other.
본 발명이 이루고자 하는 다른 기술적 과제는, 키워드, 2차원 젤 이미지, 단백질 발현 프로파일, 등전점, 분자량, 펩타이드 매스 핑거프린팅(Peptide Mass Fingerprinting ; PMF) 및 단백질 서열정보 등을 이용해 원하는 데이터를 검색할 수 있고, 검색된 데이터를 바탕으로 단백질의 특성을 분석할 수 있는 웹 기반 프로테옴 분석 및 관리 시스템을 제공하는데 있다.Another technical object of the present invention is to search for desired data using keywords, two-dimensional gel images, protein expression profiles, isoelectric points, molecular weight, peptide mass fingerprinting (PMF) and protein sequence information. In addition, the present invention provides a web-based proteome analysis and management system that can characterize proteins based on retrieved data.
본 발명이 이루고자 하는 또 다른 기술적 과제는, 실험 데이터베이스 및 레퍼런스 데이터베이스에 저장된 프로테옴 데이터가 타 시스템에 저장된 데이터와 교환 및 통합될 수 있는 웹 기반 프로테옴 분석 및 관리 시스템을 제공하는데 있다.Another technical object of the present invention is to provide a web-based proteome analysis and management system in which proteome data stored in an experimental database and a reference database can be exchanged and integrated with data stored in another system.
도 1은 본 발명의 바람직한 실시 예에 따른 웹 기반 프로테옴 분석 및 관리 시스템의 블록도이다.1 is a block diagram of a web-based proteome analysis and management system according to a preferred embodiment of the present invention.
도 2는 도 1에 도시된 프로테옴 분석 및 관리 시스템에서 수행되는 기능을 개략적으로 보여주는 블록도이다.FIG. 2 is a block diagram schematically illustrating functions performed in the proteome analysis and management system shown in FIG. 1.
도 3은 도 1에 도시된 레퍼런스 프로테옴 데이터베이스 및 실험 프로테옴 데이터베이스에 저장되는 정보 및 상기 정보들간의 관계를 보여주는 블록도이다.FIG. 3 is a block diagram illustrating information stored in a reference proteome database and an experimental proteome database shown in FIG. 1 and relationships among the information.
도 4는 도 1에 도시된 데이터 관리부에서 수행하는 데이터 저장/수정/삭제 방법을 설명하는 흐름도이다.4 is a flowchart illustrating a data storage / modification / deletion method performed by the data manager shown in FIG. 1.
도 5는 도 1에 도시된 프로테옴 동정부에서 수행하는 단백질 동정 의사결정 방법을 설명하는 흐름도이다.5 is a flowchart illustrating a protein identification decision method performed by the proteome identification shown in FIG. 1.
도 6은 본 발명의 바람직한 실시 예에 따른 프로테옴 검색을 위한 검색 초기화면의 일례를 보여주는 도면이다.6 is a diagram illustrating an example of a search initial screen for proteome search according to a preferred embodiment of the present invention.
도 7은 도 1에 도시된 프로테옴 검색부에서 수행하는 프로테옴 검색 방법을 설명하는 흐름도이다.FIG. 7 is a flowchart illustrating a proteome search method performed by the proteome search unit shown in FIG. 1.
도 8a 내지 도 8c는 도 6에 도시된 키워드 검색 메뉴가 선택되었을 때 도 7에 도시된 방법에 의해 실행되는 키워드 검색 화면 및 그것의 검색 결과를 보여주는 도면이다.8A to 8C are diagrams showing a keyword search screen executed by the method shown in FIG. 7 and a search result thereof when the keyword search menu shown in FIG. 6 is selected.
도 9a 및 도 9b는 도 6에 도시된 이미지 검색 메뉴가 선택되었을 때 도 7에 도시된 방법에 의해 실행되는 이미지 검색 화면을 보여주는 도면이다.9A and 9B are diagrams illustrating an image search screen executed by the method shown in FIG. 7 when the image search menu shown in FIG. 6 is selected.
도 10a 및 도 10b는 도 6에 도시된 단백질 발현 패턴 검색 메뉴가 선택되었을 때 도 7에 도시된 방법에 의해 실행되는 단백질 발현 패턴 검색 화면 및 그것의 검색 결과를 보여주는 도면이다.10A and 10B are diagrams showing a protein expression pattern search screen executed by the method shown in FIG. 7 and a search result thereof when the protein expression pattern search menu shown in FIG. 6 is selected.
도 11a 내지 도 11c는 도 6에 도시된 고급 검색 메뉴가 선택되었을 때 도 7에 도시된 방법에 의해 실행되는 고급 검색 화면 및 그것의 검색 결과를 보여주는 도면이다.11A to 11C are views showing an advanced search screen executed by the method shown in FIG. 7 and the search results thereof when the advanced search menu shown in FIG. 6 is selected.
< 도면의 주요 부분에 대한 부호의 설명 ><Description of Symbols for Main Parts of Drawings>
10 : 인터넷100a-100z : 클라이언트 서버10: internet 100a-100z: client server
200 : 프로테옴 분석 및 관리 서버210 : 인터페이스200: proteome analysis and management server 210: interface
220 : 프로테옴 동정부230 : 프로테옴 검색부220: Proteome East Government 230: Proteome Search Department
240 : 프로테옴 분석부250 : 레퍼런스 프로테옴 DB240: proteome analysis unit 250: reference proteome DB
260 : 실험 프로테옴 DB270 : 데이터 관리부260: experimental proteome DB270: data management
280 : 플랫파일 변환부290 : XML 구성부280: flat file conversion unit 290: XML configuration unit
상기의 과제를 이루기 위하여 본 발명에 의한 웹 기반 프로테옴 분석 및 관리 시스템은, 검증된 다량의 레퍼런스 프로테옴 데이터가 저장된 제 1 데이터베이스; 실험에 의해 산출된 실험 프로테옴 데이터가 저장되는 제 2 데이터베이스; 사용자로부터 실험 프로테옴 데이터 및 검색 단서 중 어느 하나를 받아들이는 인터페이스; 상기 제 1 및 제 2 데이터베이스에 대한 데이터의 입출력 기능을 제어하는 데이터 관리 수단; 상기 실험 프로테옴 데이터가 어떤 단백질인지를 규명하는 단백질 동정 의사결정을 수행하는 프로테옴 동정부; 실험 프로테옴 데이터 및 상기 검색 단서 중 어느 하나에 응답해서 상기 제 2 데이터베이스로부터 소정의 프로테옴 데이터를 검색하고, 검색된 상기 프로테옴 데이터의 상세 정보를 상기 제 1 프로테옴 데이터베이스로부터 추출하는 프로테옴 검색부; 및 상기 검색 결과를 분석하여 상기 프로테옴의 특성을 추출하는 프로테옴 분석부를 포함하는 것을 특징으로 한다.In order to achieve the above object, a web-based proteome analysis and management system according to the present invention includes a first database in which a plurality of verified reference proteome data are stored; A second database in which experimental proteome data calculated by the experiment is stored; An interface that accepts one of experimental proteome data and a search clue from a user; Data management means for controlling an input / output function of data for the first and second databases; Proteome identification for performing protein identification decisions to identify which protein the experimental proteome data is; A proteome search unit for retrieving predetermined proteome data from the second database in response to any one of experimental proteome data and the search clue, and extracting detailed information of the retrieved proteome data from the first proteome database; And a proteome analyzer for analyzing the search results to extract the characteristics of the proteome.
상기의 과제를 이루기 위하여 본 발명에 의한 웹 기반 프로테옴 분석 및 관리 시스템의 실험 프로테옴 데이터베이스 구축 방법은, (a) 실험 프로테옴 데이터를 입력하는 단계; (b) 상기 프로테옴 데이터에 대한 펩타이드 매스 핑거프린팅, 등전점, 분자량 및 단백질 서열 정보를 참조하여 상기 프로테옴 데이터의 유사 프로테옴 데이터를 검색하는 단계; (c) 상기 검색 결과에 응답해서 상기 프로테옴 데이터에 대한 단백질 동정 의사 결정을 수행하는 단계; 및 (d) 상기 실험 프로테옴 데이터 및 상기 동정 결과를 실험 프로테옴 데이터가 저장되는 제 2 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 한다.In order to achieve the above object, an experimental proteome database construction method of a web-based proteome analysis and management system according to the present invention comprises the steps of: (a) inputting experimental proteome data; (b) retrieving similar proteome data of the proteome data with reference to peptide mass fingerprinting, isoelectric point, molecular weight and protein sequence information for the proteome data; (c) performing protein identification decisions on the proteome data in response to the search results; And (d) storing the experimental proteome data and the identification results in a second database in which the experimental proteome data is stored.
상기의 과제를 이루기 위하여 본 발명에 의한 웹 기반 프로테옴 분석 및 관리 시스템의 실험 프로테옴 데이터 저장 및 수정 방법은, (a) 전기 영동에 의해 발생된 2차원 젤 이미지를 데이터베이스에 신규 저장할 것인지 여부를 판별하는 단계; (b) 상기 2차원 젤 이미지를 신규 저장하는 경우, 상기 2차원 젤 이미지를 로딩하여 상기 2차원 젤 이미지의 ID 및 상기 2차원 젤 이미지에 대한 실험 조건을 입력하는 단계; 및 (c) 상기 2차원 젤 이미지를 신규 저장하지 않고 기존의 상기 2차원 젤 이미지를 수정하는 경우, 수정할 상기 2차원 젤 이미지를 선택하고 해당 데이터를 수정하는 단계를 포함하는 것을 특징으로 한다.In order to achieve the above object, the experimental proteome data storage and modification method of the web-based proteome analysis and management system according to the present invention includes: (a) determining whether to newly store a two-dimensional gel image generated by electrophoresis in a database; step; (b) when the 2D gel image is newly stored, loading the 2D gel image and inputting an ID of the 2D gel image and an experimental condition for the 2D gel image; And (c) when modifying the existing 2D gel image without newly storing the 2D gel image, selecting the 2D gel image to be modified and modifying the corresponding data.
상기의 과제를 이루기 위하여 본 발명에 의한 웹 기반 프로테옴 분석 및 관리 방법은, (a) 검색 방법을 선택하는 단계; (b) 상기 검색 방법으로 키워드 검색이 선택된 경우, 검색할 프로테옴 데이터의 키워드를 입력하는 단계; (c) 상기 키워드에 응답해서, 실험 프로테옴 데이터가 저장된 제 1 데이터베이스 및 검증된 다량의 레퍼런스 프로테옴 데이터가 저장된 제 2 데이터베이스로부터 해당 프로테옴 데이터가 검색되는 단계; (d) 상기 검색 방법으로 이미지 검색이 선택된 경우, 검색할 2차원 젤 이미지를 로딩하는 단계; (e) 상기 2차원 젤 이미지 상에 검색될 위치를 지정하는 단계; (f) 상기 지정된 위치에 해당되는 프로테옴 데이터가 상기 제 1 및 제 2 데이터베이스로부터 검색되는 단계; (g) 상기 검색 방법으로 고급 검색이 선택된 경우, 상기 프로테옴 데이터의 펩타이드 매스 핑거프린팅, 등전점, 분자량 및 단백질 서열 정보 중 적어도 어느 하나를 검색 단서로 받아들여, 상기 제 1 및 제 2 데이터베이스로부터 상기 프로테옴 데이터의 유사 프로테옴 데이터를 검색하는 단계; 및 (h) 상기 (c), (f) 및/또는 (g) 단계의 검색 결과를 디스플레이 하는 단계를 포함하는 것을 특징으로 한다.In order to achieve the above object, a web-based proteome analysis and management method according to the present invention includes: (a) selecting a search method; (b) inputting a keyword of proteome data to be searched if keyword search is selected as the search method; (c) responsive to the keyword, retrieving the proteome data from a first database in which experimental proteome data is stored and a second database in which a verified amount of reference proteome data is stored; (d) loading a two-dimensional gel image to be searched if image search is selected as the search method; (e) designating a location to be retrieved on the two-dimensional gel image; (f) retrieving proteome data corresponding to the designated location from the first and second databases; (g) when advanced search is selected as the search method, at least one of peptide mass fingerprinting, isoelectric point, molecular weight, and protein sequence information of the proteome data is taken as a search clue, and the proteome from the first and second databases is selected. Retrieving similar proteome data of the data; And (h) displaying the search results of steps (c), (f) and / or (g).
이하에서, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예에 대하여 상세히 설명한다.Hereinafter, with reference to the accompanying drawings will be described in detail a preferred embodiment of the present invention.
도 1은 본 발명의 바람직한 실시 예에 따른 웹 기반 프로테옴 분석 및 관리 시스템의 블록도이다. 도 1을 참조하면, 본 발명에 따른 웹 기반 프로테옴 분석 및 관리 시스템은, 인터넷(10)에 연결된 적어도 하나 이상의 클라이언트 서버(100a, 100b, …, 100z)와, 웹 상에서 상기 클라이언트 서버(100a, 100b, …, 100z)에게 프로테옴 분석 서비스를 제공하는 프로테옴 분석 및 관리 서버(200)로 구성된다. 프로테옴 분석 및 관리 서버(200)는 인터페이스(210), 프로테옴 동정부(220), 프로테옴 검색부(230), 프로테옴 분석부(240), 레퍼런스 프로테옴 데이터베이스(250),실험 프로테옴 데이터베이스(260), 데이터 관리부(270), 플랫파일 변환부(280), 및 XML 구성부(290)를 포함한다. 이들 각각의 블록이 수행하는 기능의 설명에 앞서, 상기 프로테옴 분석 및 관리 시스템이 수행하는 기능들을 도식화하여 나타내면 다음과 같다.1 is a block diagram of a web-based proteome analysis and management system according to a preferred embodiment of the present invention. Referring to FIG. 1, the web-based proteome analysis and management system according to the present invention includes at least one client server 100a, 100b,..., 100z connected to the Internet 10, and the client server 100a, 100b on the web. , ..., 100z) is composed of a proteome analysis and management server 200 to provide a proteome analysis service. Proteome analysis and management server 200 interface 210, proteome identification 220, proteome search unit 230, proteome analysis unit 240, reference proteome database 250, experimental proteome database 260, data The management unit 270, the flat file conversion unit 280, and the XML configuration unit 290 are included. Prior to the description of the functions performed by each of these blocks, the functions performed by the proteome analysis and management system are schematically illustrated as follows.
도 2는 도 1에 도시된 프로테옴 분석 및 관리 시스템에서 수행되는 기능을 개략적으로 보여주는 블록도이다. 도 2를 참조하면, 본 발명에 의한 프로테옴 분석 및 관리 시스템에서 수행하는 프로테옴 분석 및 관리 기능(2000)은, 크게 프로테옴 동정 기능(2200), 프로테옴 검색 기능(2300), 프로테옴 분석 기능(2400), 및 데이터 관리 기능(2700)으로 구분된다.FIG. 2 is a block diagram schematically illustrating functions performed in the proteome analysis and management system shown in FIG. 1. Referring to FIG. 2, the proteome analysis and management function 2000 performed by the proteome analysis and management system according to the present invention includes a proteome identification function 2200, a proteome search function 2300, a proteome analysis function 2400, And a data management function 2700.
프로테옴 검색부(230)에서 수행되는 프로테옴 검색 기능(2300)은, 키워드 검색 기능(3100), 이미지 검색 기능(3200) 및 고급검색 기능(3400)으로 구분되며, 고급검색 기능(3400)은 다시 pI/MW 유사성 검색 기능(3420), 펩타이드 매스 핑거프린팅 유사성 검색 기능(3440) 및 서열 유사성 검색 기능(3460)으로 세분화된다. 프로테옴 분석부(240)에서 수행되는 프로테옴 분석 기능(2400)은, 단백질 발현 프로파일 분석 기능(2410), 이미지 비교 분석 기능(2420), 고급 검색 결과 분석 기능(2430), 번역 후 변형 분석 기능(2440) 및 단백질 상호작용 분석 기능(2450)으로 구분된다. 그리고, 데이터 관리부(270)에 의해 수행되는 데이터 관리 기능(2700)은, 데이터 저장/수정/삭제 기능(2710), 플랫파일 변환 기능(2800) 및 XML 구성 기능(2900)으로 구성된다.The proteome search function 2300 performed by the proteome search unit 230 is divided into a keyword search function 3100, an image search function 3200, and an advanced search function 3400, and the advanced search function 3400 is again pI. / MW similarity search function 3420, peptide mass fingerprinting similarity search function 3440, and sequence similarity search function 3460. The proteome analysis function 2400 performed by the proteome analyzer 240 includes a protein expression profile analysis function 2410, an image comparison analysis function 2420, an advanced search result analysis function 2430, and a post-translational modification analysis function 2440. ) And protein interaction analysis function 2450. The data management function 2700 performed by the data manager 270 includes a data storage / modification / deletion function 2710, a flat file conversion function 2800, and an XML configuration function 2900.
도 1 및 도 2를 참조하여, 본 발명에 따른 웹기반 프로테옴 분석 및 관리 시스템을 구성하는 각각의 블록들이 수행하는 기능을 살펴보면 다음과 같다.Referring to Figures 1 and 2, look at the function of each block constituting the web-based proteome analysis and management system according to the present invention.
먼저, 인터페이스(210)는 상기 클라이언트 서버(100a, 100b, …, 100z)로부터 실험 프로테옴 데이터 및 검색 단서 중 어느 하나를 받아들이고, 프로테옴 분석 결과 및 프로테옴 검색 결과를 인터넷(10)을 통해 상기 클라이언트 서버(100a, 100b, …, 100z)로 출력한다.First, the interface 210 receives any one of experimental proteome data and a search clue from the client servers 100a, 100b,..., And 100z, and transmits a proteome analysis result and a proteome search result to the client server via the Internet 10. 100a, 100b, ..., 100z).
인터페이스(210)에 연결된 데이터 관리부(270)는, 사용자로부터 데이터를 입력받아 이를 저장하거나, 수정, 또는 삭제하는 데이터 저장/수정/삭제 기능(2710)과, 플랫파일 변환부(280) 및 XML 구성부(290)의 동작을 제어하는 플랫파일 변환 기능(2800) 및 XML 구성 기능(2900)을 수행한다.The data management unit 270 connected to the interface 210 includes a data storage / modification / deletion function 2710 that receives data from a user, stores it, modifies, or deletes it, a flat file converter 280, and XML configuration. The flat file conversion function 2800 and the XML configuration function 2900 which control the operation of the unit 290 are performed.
플랫파일(flat file) 변환부(280)는 데이터 관리부(270)의 제어에 응답해서 가공되지 않은 형태로 저장된 레퍼런스 프로테옴 데이터를 데이터베이스 구조에 맞게 입력되도록 레퍼런스 프로테옴 데이터베이스(250)의 플랫파일을 변환한다. XML 구성부(290)는 데이터 관리부(270)의 제어에 응답해서 상기 두 데이터베이스(250, 260)에 저장된 프로테옴 데이터가 타 시스템에 저장된 데이터와 교환 및 통합될 수 있도록 상기 프로테옴 데이터를 XML 파일로 구성한다. 이와 같은 데이터 관리부(270)의 동작을 통해서 모든 데이터베이스 내용이 관리된다.The flat file converter 280 converts the flat file of the reference proteome database 250 so that the reference proteome data stored in an unprocessed form is input in accordance with the database structure under the control of the data manager 270. . The XML configuration unit 290 configures the proteome data as an XML file so that the proteome data stored in the two databases 250 and 260 can be exchanged and integrated with data stored in other systems in response to the control of the data management unit 270. do. All database contents are managed through the operation of the data manager 270 as described above.
여기서, 레퍼런스 프로테옴 데이터베이스(250)는, 검증된 다량의 프로테옴 관련 데이터가 저장된 단백질 서열 데이터베이스이다. 레퍼런스 프로테옴 데이터베이스(250)로 사용될 수 있는 전문 데이터베이스에는 여러 가지가 있으나, 본 발명에서는 단백질 서열 정보 이외에 단백질의 기능과 구조, 각 도메인에 관한 정보,단백질의 번역 후 변형(post-translational modification)에 대한 정보 등, 단백질과 관련된 대부분의 정보들이 저장되어 있는 스위스-프롯(SWISS-PROT) 데이터베이스를 사용한다.Here, the reference proteome database 250 is a protein sequence database in which a large amount of verified proteome related data is stored. Although there are various specialized databases that can be used as the reference proteome database 250, in the present invention, in addition to the protein sequence information, the function and structure of the protein, information on each domain, and post-translational modification of the protein Use a SWISS-PROT database that stores most of the information related to proteins, including information.
그리고, 실험 프로테옴 데이터베이스(260)는 실험에 의해 산출된 실험 프로테옴 데이터가 저장되는 데이터베이스로서, 쥐의 간 노화 프로테옴 데이터베이스(rat liver aging proteome database) 등을 예로 들 수 있다. 상기 실험 프로테옴 데이터베이스(260)가 구성되는 과정은 대략 다음과 같다.The experimental proteome database 260 is a database in which experimental proteome data calculated by experiments is stored, and examples thereof include rat liver aging proteome database. The process of constructing the experimental proteome database 260 is as follows.
사용자에 의해 실험 단백질 데이터가 입력되면, 이는 데이터 관리부(270)를 통해 프로테옴 동정부(220)로 입력된다. 프로테옴 동정부(220)는, 연구실에서 산출된 2차원 젤 이미지, 펩타이드 매스 핑거프린팅, 분자량, 등전점 및 단백질 상세 정보가 입력되면, 상기 정보를 바탕으로 해당 프로테옴이 어떤 것인지를 규명하는 단백질 동정 의사 결정을 수행한다. 프로테옴 동정부(220)에 의해, 상기 단백질이 레퍼런스 프로테옴 데이터베이스(250)에 저장되어 있는 임의의 레퍼런스 프로테옴 데이터로 동정되면, 데이터 관리부(270)는 상기 단백질 데이터를 실험 프로테옴 데이터베이스(260)에 저장하고, 이에 해당되는 레퍼런스 프로테옴 데이터베이스(250)의 엔트리 번호를 저장한다. 이로써, 실험 프로테옴 데이터베이스(260)가 구성되고, 실험 프로테옴 데이터베이스(260)와 레퍼런스 프로테옴 데이터베이스(250)가 서로 연결된다. 이와 같이 실험 프로테옴 데이터베이스(260)가 구성이 되면, 프로테옴 검색부(230) 및 프로테옴 분석부(240)에 의해 실험 프로테옴 데이터베이스(260)에 저장되어 있는 데이터에 대한 검색 및 분석이 수행될 수 있다.When the experimental protein data is input by the user, it is input to the proteome identification part 220 through the data manager 270. The proteome identification unit 220, when a two-dimensional gel image, peptide mass fingerprinting, molecular weight, isoelectric point, and protein detailed information calculated in a laboratory are input, a protein identification decision is made to identify what the proteome is based on the information. Do this. If the protein is identified as any reference proteome data stored in the reference proteome database 250 by the proteome identification unit 220, the data manager 270 stores the protein data in the experimental proteome database 260. The entry number of the reference proteome database 250 corresponding thereto is stored. Thus, the experimental proteome database 260 is configured, and the experimental proteome database 260 and the reference proteome database 250 are connected to each other. When the experimental proteome database 260 is configured as described above, the proteome search unit 230 and the proteome analyzer 240 may search and analyze data stored in the experimental proteome database 260.
프로테옴 검색부(230)는, 사용자로부터 키워드, 2차원 젤 이미지, 펩타이드 매스 핑거프린팅(PMF), 등전점(pI), 분자량(MW) 및 단백질 서열 정보 등을 검색 단서로 받아들여 키워드 검색 기능(3100), 이미지 검색 기능(3200) 및 고급 검색 기능(3400)을 수행하고, 데이터베이스(250, 260)에 저장된 특정 데이터를 검색하여 불러온다. 예를 들어, 사용자로부터 소정의 검색 단서가 입력되면, 프로테옴 검색부(230)는 상기 검색 단서에 응답해서 실험 프로테옴 데이터베이스(260)로부터 소정의 프로테옴 데이터를 검색하고, 검색된 프로테옴 데이터의 상세 정보가 저장된 엔트리 번호를 참조하여 레퍼런스 프로테옴 데이터베이스(250)로부터 검색된 프로테옴 데이터의 상세 정보를 추출한다.The proteome search unit 230 receives a keyword, two-dimensional gel image, peptide mass fingerprinting (PMF), isoelectric point (pI), molecular weight (MW), protein sequence information, and the like as a search clue from the user, and uses a keyword search function (3100). ), The image search function 3200 and the advanced search function 3400 are performed, and the specific data stored in the databases 250 and 260 is searched and retrieved. For example, when a predetermined search clue is input from the user, the proteome search unit 230 retrieves predetermined proteome data from the experimental proteome database 260 in response to the search clue, and stores detailed information of the retrieved proteome data. The detailed information of the proteome data retrieved from the reference proteome database 250 is extracted with reference to the entry number.
프로테옴 분석부(240)는, 단백질 발현 프로파일 분석 기능(2410), 이미지 비교 분석 기능(2420), 고급 검색 결과 분석 기능(2430), 번역 후 변형 분석 기능(2440) 및 단백질 상호작용 분석 기능(2450) 등을 포함하는 프로테옴 분석 기능(2400)을 수행한다. 단백질 발현 프로파일 분석 기능(2410)은 2차원 전기영동에 의해 얻어진 단백질의 실험 조건별 발현 양상 및 유사발현 패턴을 분석하는 기능이다. 이미지 비교 분석 기능(2420)은 적어도 둘 이상의 2차원 젤 이미지를 비교하여, 이들간의 차이를 분석하는 기능이다. 고급 검색 결과 분석 기능(2430)은 고급 검색 결과에 의해서 해당 단백질의 특성을 분석하는 기능이다. 번역 후 변형 분석 기능(2440)은, 실험에 의해 얻어진 단백질 데이터와, 레퍼런스 프로테옴 데이터베이스(250)에 저장되어 있는 동종 단백질의 이론적인 데이터와의 차이를 분석하여,단백질의 번역 후 변형에 대한 기초적인 정보를 제공하는 기능이다. 그리고, 단백질 상호작용 분석 기능(2450)은 적어도 둘 이상의 단백질이 상호 작용하여 나타내는 특성을 분석하는 기능이다. 이와 같은 다양한 분석 기능에 의해서 세포 내에서 발현되는 총체적인 단백질들이 규명되어진다.Proteome analysis unit 240, protein expression profile analysis function 2410, image comparison analysis function 2420, advanced search result analysis function (2430), post-translational modification analysis function (2440) and protein interaction analysis function (2450) Perform a proteome analysis function 2400 including a). The protein expression profile analysis function 2410 is a function of analyzing the expression pattern and similar expression pattern according to the experimental conditions of the protein obtained by two-dimensional electrophoresis. The image comparison analysis function 2420 is a function of comparing at least two or more two-dimensional gel images and analyzing differences therebetween. The advanced search result analysis function 2430 is a function of analyzing the protein by the advanced search results. The post-translational modification analysis function 2440 analyzes the difference between the protein data obtained by the experiment and the theoretical data of homologous proteins stored in the reference proteome database 250, thereby providing a basic information on the post-translational modification of the protein. It is a function to provide information. In addition, the protein interaction analysis function 2450 is a function of analyzing a characteristic exhibited by interacting with at least two proteins. By such various analysis functions, the total protein expressed in the cell is identified.
앞에서 설명한 바와 같이, 데이터베이스 구축시, 레퍼런스 프로테옴 데이터베이스(250)에 저장되어 있는 데이터 자체가 실험 프로테옴 데이터베이스(260)에 저장되지 않고, 해당 데이터가 저장되어 있는 레퍼런스 프로테옴 데이터베이스(250)의 엔트리 번호가 저장된다. 이와 같이 구성되는 실험 프로테옴 데이터베이스(260) 및 레퍼런스 프로테옴 데이터베이스(250)의 데이터 모델은 다음과 같다.As described above, when the database is constructed, the data itself stored in the reference proteome database 250 is not stored in the experimental proteome database 260, and the entry number of the reference proteome database 250 in which the corresponding data is stored is stored. do. The data models of the experimental proteome database 260 and the reference proteome database 250 configured as described above are as follows.
도 3은 도 1에 도시된 레퍼런스 프로테옴 데이터베이스(250) 및 실험 프로테옴 데이터베이스(260)에 저장되는 정보 및 상기 정보들간의 관계를 보여주는 블록도이다. 도 3을 참조하면, 레퍼런스 프로테옴 데이터베이스(250)는 레퍼런스 데이터베이스 관리 정보(251), 참고문헌 관리 정보(REFERENCE ; 252), 스위스-프롯 관리 정보(SWISS_INFO ; 253), 코멘트 관리 정보(COMMENTS ; 254), 프로테옴 서열 관리 정보(SEQ_VALUE ; 255), 및 프로테옴 특성 관리 정보(FEATURE ; 256)를 포함한다. 이들 정보는 스위스-프롯과 같은 전문 데이터베이스에서 지원하는 기본적인 데이터들을 각 카테고리별로 구분한 것으로서, 여기에는 스위스-프롯 등록 번호, 접수 번호, 단백질 이름, 유전자 이름, 개체의 종, 개체의 분류, 세포 소기관, 키워드 정보, 단백질 서열 번호 등이 포함되며, 이에 대한 상세한 설명은 이하 생략하기로 한다.FIG. 3 is a block diagram illustrating the information stored in the reference proteome database 250 and the experimental proteome database 260 shown in FIG. 1 and the relationship between the information. Referring to FIG. 3, the reference proteome database 250 includes reference database management information 251, bibliographic management information REFERENCE 252, Swiss-Plot management information SWISS_INFO 253, and comment management information COMMENTS 254. , Proteome sequence management information (SEQ_VALUE; 255), and proteome characteristic management information (FEATURE; 256). This information divides the basic data supported by specialized databases, such as Swiss-Plot, into categories, including Swiss-Plot Registration Number, Receipt Number, Protein Name, Gene Name, Species of Species, Classification of Individuals, and Organelles. , Keyword information, protein sequence number, and the like, a detailed description thereof will be omitted below.
실험 프로테옴 데이터베이스(260)에 저장되는 정보에는, 전기 영동에 의해 발생된 2차원 젤 이미지를 관리하는 젤 이미지 관리 정보(L_IMAGE ; 261), 2차원 젤 이미지를 구성하는 각각의 스팟(spot)에 대한 정보를 관리하는 스팟 관리 정보(L_SPOT_INFO ; 262), 각각의 스팟에 대응되는 단백질에 대한 상세 정보를 관리하는 단백질 관리 정보(PROTEIN_INFO ; 265), 스팟에 대한 발현 데이터를 관리하는 발현도 관리 정보(SPOT_INTENSITY ; 267), 스팟에 대한 발현량 그래프와 변화 과정을 보여주는 정보를 관리하는 정량 관리 정보(SPOT_QUANTITY ; 268), 및 프로테옴 변형 여부에 대한 정보를 관리하는 변형 관리 정보(MOD_INFO ; 269)가 포함된다.Information stored in the experimental proteome database 260 includes gel image management information (L_IMAGE; 261) for managing a two-dimensional gel image generated by electrophoresis, and for each spot constituting the two-dimensional gel image. Spot management information (L_SPOT_INFO; 262) for managing information, protein management information (PROTEIN_INFO; 265) for managing detailed information on proteins corresponding to each spot, and expression management information (SPOT_INTENSITY) for managing expression data for spots 267), quantitative management information (SPOT_QUANTITY) 268 that manages the expression level graph and information showing the change process for the spot, and modification management information (MOD_INFO; 269) that manages information on whether or not the proteome is modified.
실험 프로테옴 데이터베이스(260)에 저장되는 상기 정보들 중 젤 이미지 관리 정보(L_IMAGE ; 261)는 아래의 [표 1]과 같이 구성된다.Among the information stored in the experimental proteome database 260, gel image management information L_IMAGE 261 is configured as shown in Table 1 below.
[표 1]TABLE 1
[표 1]을 참조하면, 젤 이미지 관리정보(L_IMAGE ; 261)에는 젤 번호(GEL_ID), 젤 이미지 파일명(FILE_NAME), 제 1 실험 조건(EXP_CON1), 제 2 실험 조건(EXP_CON2), 및 해당 이미지가 레퍼런스 맵(reference map)인지 여부를 알려주는 정보(REF_MAP)가 포함된다.Referring to [Table 1], gel image management information (L_IMAGE; 261) includes a gel number (GEL_ID), a gel image file name (FILE_NAME), a first experimental condition (EXP_CON1), a second experimental condition (EXP_CON2), and a corresponding image. Information indicating whether or not is a reference map is included.
아래 [표 2]는 2차원 젤 이미지를 구성하는 각각의 스팟에 대한 정보를 관리하는 스팟 관리 정보(L_SPOT_INFO ; 262)를 나타낸다.[Table 2] below shows spot management information (L_SPOT_INFO; 262) for managing information on each spot constituting the 2D gel image.
[표 2]TABLE 2
[표 2]를 참조하면, 스팟 관리 정보(L_SPOT_INFO ; 262)는 스팟에 대한 단백질 번호(RLP_ID), 젤 번호(GEL_ID), 스팟의 X 좌표(SPOT_LOCA_X) 및 스팟의 Y 좌표(SPOT_LOCA_X) 정보가 포함된다. 여기서, 스팟에 대한 단백질 번호(RLP_ID)는 해당 스팟에 대해 임의로 설정한 ID로서, 중복되지 않게 각 용도별로 자유롭게 만들어 사용할 수 있다. 아래에서 상세히 설명하겠지만, 스팟의 X 좌표(SPOT_LOCA_X) 및 스팟의 Y 좌표(SPOT_LOCA_X)의 설정에 의해서 이미지 검색이 가능해진다.Referring to [Table 2], the spot management information (L_SPOT_INFO; 262) includes a protein number (RLP_ID), a gel number (GEL_ID), a spot X coordinate (SPOT_LOCA_X), and a spot Y coordinate (SPOT_LOCA_X) information for the spot. do. Here, the protein number (RLP_ID) for the spot is an ID set arbitrarily for the spot, and can be freely made and used for each use without overlapping. As will be described in detail below, image search is enabled by setting the spot X coordinate (SPOT_LOCA_X) and the spot Y coordinate (SPOT_LOCA_X).
[표 3]은 각각의 스팟에 대응되는 실험 프로테옴 데이터를 관리하는 단백질 관리 정보(PROTEIN_INFO ; 265)를 나타낸다.Table 3 shows protein management information (PROTEIN_INFO; 265) for managing experimental proteome data corresponding to each spot.
[표 3]TABLE 3
[표 3]을 참조하면, 단백질 관리 정보(PROTEIN_INFO ; 265)는 단백질 번호(RLP_ID), 스위스-프롯 엔트리 번호(SWISS_ID), 실험 분자량(MW_EXP), 실험 등전점(PI_EXP), 실험 펩타이드 매스 핑거프린팅(PMF_EXP), 및 노화에 대한 리포트정보(AGE_REPORT)를 포함한다. 여기서, 스위스-프롯 엔트리 번호(SWISS_ID)는 실험에 의해 얻어진 해당 단백질(RLP_ID)에 대한 상세 데이터들이 레퍼런스 프로테옴 데이터베이스(예를 들면, 스위스-프롯)(250)의 어디에 저장되어 있는지를 나타내는 정보이다. 이와 같은 단백질 관리 정보(PROTEIN_INFO ; 265)의 구성에 의해서 실험에 의해 구축된 실험 프로테옴 데이터베이스(260)와 레퍼런스 프로테옴 데이터베이스(250)가 서로 연결된다.Referring to [Table 3], the protein management information (PROTEIN_INFO; 265) is a protein number (RLP_ID), Swiss-prote entry number (SWISS_ID), experimental molecular weight (MW_EXP), experimental isoelectric point (PI_EXP), experimental peptide mass fingerprinting ( PMF_EXP) and report information about aging (AGE_REPORT). Here, the Swiss-Plot entry number (SWISS_ID) is information indicating where detailed data on the protein (RLP_ID) obtained by the experiment is stored in the reference proteome database (eg, Swiss-Plot) 250. By the configuration of the protein management information PROTEIN_INFO 265, the experimental proteome database 260 and the reference proteome database 250 constructed by the experiment are connected to each other.
[표 4]는 스팟에 대한 발현 데이터를 관리하는 발현도 관리 정보(SPOT_INTENSITY ; 267)를 나타낸다.[Table 4] shows the expression management information (SPOT_INTENSITY; 267) for managing the expression data for the spot.
[표 4]TABLE 4
[표 4]를 참조하면, 발현도 관리 정보(SPOT_INTENSITY ; 267)는 발현도 번호(INTENSITY_ID), 단백질 번호(RLP_ID), 젤 번호(GEL_ID), 및 발현 정량 수치 정보(QUAN_DATA)를 포함한다.Referring to [Table 4], the expression management information (SPOT_INTENSITY; 267) includes an expression number (INTENSITY_ID), a protein number (RLP_ID), a gel number (GEL_ID), and expression quantitative numerical information (QUAN_DATA).
[표 5]는 스팟에 대한 발현량 그래프와 변화 과정을 보여주는 정보를 관리하는 정량 관리 정보(SPOT_QUANTITY ; 268)를 나타낸다.[Table 5] shows quantitative management information (SPOT_QUANTITY; 268) for managing information showing the expression level graph and the change process for the spot.
[표 5]TABLE 5
[표 5]를 참조하면, 정량 관리 정보(SPOT_QUANTITY ; 268)는 단백질번호(RLP_ID), 발현정도 그래프(GRAPH_IMG) 및 발현된 젤 이미지 정보(GEL_IMG)를 포함한다.Referring to [Table 5], the quantitative management information (SPOT_QUANTITY; 268) includes a protein number (RLP_ID), expression level graph (GRAPH_IMG) and expressed gel image information (GEL_IMG).
[표 6]은 프로테옴 변형 여부에 대한 정보를 관리하는 변형 관리 정보(MOD_INFO ; 269)를 나타낸다.Table 6 shows modification management information (MOD_INFO) 269 that manages information on whether a proteome is modified.
[표 6]TABLE 6
[표 6]을 참조하면, 변형 관리 정보(MOD_INFO ; 269)는 변형 번호(MOD_ID), 단백질 번호(RLP_ID), 변형 종류(MOD_KIND) 및 변형 설명 정보(DESCRIPTION)를 포함한다. 여기서, 변형 설명 정보(DESCRIPTION)는 실험자가 자신의 견해를 자유롭게 적을 수 있는 정보이다. 도 4 및 도 5를 참조하여, 상기와 같은 구성을 가지는 실험 프로테옴 데이터베이스(260)의 구축 방법을 살펴보면 다음과 같다.Referring to [Table 6], the modification management information (MOD_INFO) 269 includes a modification number (MOD_ID), a protein number (RLP_ID), a modification type (MOD_KIND), and modification description information (DESCRIPTION). Here, the deformation description information (DESCRIPTION) is information that allows the experimenter to freely write his or her view. Referring to FIGS. 4 and 5, the construction method of the experimental proteome database 260 having the above configuration will be described as follows.
도 4는 도 1에 도시된 데이터 관리부(270)에서 수행하는 데이터 저장/수정/삭제 방법을 설명하는 흐름도로서, 실험 프로테옴 데이터베이스(260)에 저장될 데이터의 저장 방법과, 실험 프로테옴 데이터베이스(260)에 저장되어 있는 기존의 단백질 데이터를 수정하는 방법을 보여주고 있다.4 is a flowchart illustrating a data storage / modification / deletion method performed by the data management unit 270 shown in FIG. 1, a method of storing data to be stored in the experimental proteome database 260, and an experimental proteome database 260. It shows how to modify existing protein data stored in.
도 4를 참조하면, 2차원 젤 이미지를 신규 저장할 것인지 여부가 먼저 판별된다(2711 단계). 판별 결과 2차원 젤 이미지를 신규 저장할 것으로 판명되었으면, 2차원 젤 이미지를 로딩해서(2712 단계) 해당 2차원 젤 이미지의 ID를 입력한 후(2713 단계), 2차원 젤 이미지에 대한 실험 조건을 입력한다(2714 단계). 그리고, 상기 판별 결과 2차원 젤 이미지를 신규 저장하지 않고 실험 프로테옴 데이터베이스(260)에 저장되어 있는 기존의 2차원 젤 이미지를 수정할 것으로 판명되었으면, 먼저 실험 프로테옴 데이터베이스(260)에 저장되어 있는 복수 개의 2차원 젤 이미지를 디스플레이해서(2716 단계) 수정할 2차원 젤 이미지를 선택한 후(2717 단계), 선택된 2차원 젤 이미지 또는 해당 젤 이미지의 데이터를 수정한다(2718 단계). 이와 같은 2차원 젤 이미지에 대한 저장 또는 수정이 수행되었으면, 상기 2차원 젤 이미지를 구성하는 임의의 스팟이 선택된다(2721 단계). 여기서, 2차원 젤 이미지 상에 지정되는 임의의 스팟은 2차원 젤 이미지를 구성하는 임의의 단백질에 대응된다.Referring to FIG. 4, it is first determined whether to newly store the 2D gel image (step 2711). If it is determined that the 2D gel image is to be newly stored, the 2D gel image is loaded (step 2712), the ID of the 2D gel image is input (step 2713), and the experimental conditions for the 2D gel image are input. (Step 2714). In addition, when it is determined that the existing two-dimensional gel image stored in the experimental proteome database 260 is modified without newly storing the two-dimensional gel image, first, a plurality of two stored in the experimental proteome database 260 may be used. The 2D gel image is displayed (step 2716) to select a 2D gel image to be modified (step 2725), and then the data of the selected 2D gel image or the corresponding gel image is modified (step 2718). If such storage or modification has been performed on the two-dimensional gel image, any spot constituting the two-dimensional gel image is selected (step 2721). Here, any spot designated on the two-dimensional gel image corresponds to any protein constituting the two-dimensional gel image.
2차원 젤 이미지를 구성하는 임의의 스팟이 선택되면, 선택된 스팟에 해당되는 프로테옴 데이터를 신규 저장할 것인지 여부가 판별된다(2722 단계). 판별 결과, 선택된 스팟에 해당되는 프로테옴 데이터를 신규 저장할 것으로 판명되었으면, 선택된 스팟에 대한 실험 데이터를 입력한다(2723 단계). 그리고, 상기 판별 결과, 선택된 스팟에 해당되는 프로테옴 데이터를 신규 저장하지 않고 실험 프로테옴 데이터베이스(260)에 저장되어 있는 기존의 스팟 데이터를 수정할 것으로 판명되었으면, 해당 스팟 데이터를 수정한다(2725 단계). 이와 같은 방법에 의해서 2차원 젤 이미지 및 이를 구성하는 임의의 스팟에 대한 데이터가 저장 또는 수정된다.If any spot constituting the two-dimensional gel image is selected, it is determined whether proteomic data corresponding to the selected spot is newly stored (step 2722). If it is determined that the proteome data corresponding to the selected spot is to be newly stored, the experimental data for the selected spot is input (step 2723). If it is determined that the existing spot data stored in the experimental proteome database 260 is modified without newly storing proteome data corresponding to the selected spot, the spot data is corrected (step 2725). By this method data for the two-dimensional gel image and any spots constituting it are stored or modified.
도 4에 도시된 방법에 의해서 데이터 관리부(270)에 입력된 실험 프로테옴 데이터베이스(260)에 저장될 신규 실험 단백질 데이터는, 프로테옴 동정부(220)로 입력된다. 프로테옴 동정부(220)는 도 5에 도시된 방법에 의해서 단백질 동정 의사결정의 수행하고, 단백질 동정 의사 결정 결과에 따라서 실험 단백질 데이터 및 단백질 동정 결정 결과를 실험 프로테옴 데이터베이스(260)에 저장한다. 이에 대한 상세한 방법은 다음과 같다.The new experimental protein data to be stored in the experimental proteome database 260 input to the data management unit 270 by the method shown in FIG. 4 is input to the proteome identification unit 220. The proteome identification unit 220 performs the protein identification decision by the method shown in FIG. 5, and stores the experimental protein data and the protein identification decision result in the experimental proteome database 260 according to the protein identification decision result. Detailed method for this is as follows.
도 5를 참조하면, 프로테옴 동정부(220)는 먼저 데이터 관리부(270)로부터 실험 데이터를 입력받고(2210 단계), 단백질 동정 의사 결정을 내리기 위해 필요한 데이터를 얻기 위해 상기 데이터에 대한 고급 검색을 수행한다(2220 단계). 그리고, 고급 검색 결과를 바탕으로 하여 단백질 동정 의사 결정 과정을 수행한다. 이 때, 입력된 실험 데이터에 대한 단백질 동정이 수행된 것으로 판별되면(2230 단계), 데이터 관리부(2670)에 의해 실험 단백질 데이터 및 그것의 동정 결과가 실험 프로테옴 데이터베이스(260)에 저장된다(2240 단계). 이로써, 실험 프로테옴 데이터베이스(260)가 구축된다.Referring to FIG. 5, the proteome identification unit 220 first receives experimental data from the data management unit 270 (step 2210), and performs an advanced search for the data to obtain data necessary for making protein identification decisions. (Step 2220). Then, the protein identification decision process is performed based on the advanced search results. At this time, if it is determined that protein identification has been performed on the input experimental data (step 2230), the data management unit 2670 stores the experimental protein data and its identification result in the experimental proteome database 260 (step 2240). ). This establishes an experimental proteome database 260.
상기와 같은 방법에 의해 구축된 실험 프로테옴 데이터베이스(260)는 키워드 검색, 이미지 검색, 단백질 발현 패턴 검색, 및 이들 검색 결과를 활용한 고급 검색에 사용될 수 있다. 특히, 상기 실험 프로테옴 데이터베이스(260)는 프로테옴 데이터의 검색시 레퍼런스 프로테옴 데이터베이스(250)와 연계되어 검색되는 특징을 가진다. 본 발명에 의한 프로테옴 검색 방법은 다음과 같다.The experimental proteome database 260 constructed by the above method can be used for keyword search, image search, protein expression pattern search, and advanced search using these search results. In particular, the experimental proteome database 260 has a feature that is searched in association with the reference proteome database 250 when retrieving proteome data. Proteome search method according to the present invention is as follows.
도 6은 본 발명의 바람직한 실시 예에 따른 프로테옴 분석을 위한 검색 초기화면(300)의 일례를 보여주는 도면이다. 도 6을 참조하면, 본 발명에 의한 프로테옴 분석을 위한 검색 초기화면(300)에는 데이터 검색을 위한 그래픽 사용자 인터페이스 (Graphic User Interface)로서 키워드 검색(310), 이미지 검색(320) 및 고급검색(340) 메뉴가 구비된다. 여기서, 고급 검색 메뉴(340)에는 등전점/분자량 유사성 검색 메뉴(342), 펩타이드 매스 핑거프린팅 유사성 검색 메뉴(344), 및 단백질 서열 유사성 검색 메뉴(346)로 구분된다.6 is a diagram illustrating an example of a search initial screen 300 for proteome analysis according to an exemplary embodiment of the present invention. Referring to FIG. 6, a search initial screen 300 for proteome analysis according to the present invention includes a keyword search 310, an image search 320, and an advanced search 340 as a graphic user interface for data search. ) A menu is provided. Here, the advanced search menu 340 is divided into an isoelectric point / molecular weight similarity search menu 342, a peptide mass fingerprinting similarity search menu 344, and a protein sequence similarity search menu 346.
도 7은 도 1에 도시된 프로테옴 검색부(230)에서 수행하는 프로테옴 검색 방법(2300)을 설명하는 흐름도이다. 도 7을 참조하면, 먼저 키워드 검색, 이미지 검색 및 고급검색 중 어느 하나의 검색 방법이 선택된다(3010 단계).FIG. 7 is a flowchart illustrating a proteome search method 2300 performed by the proteome search unit 230 shown in FIG. 1. Referring to FIG. 7, one of a keyword search method, an image search, and an advanced search is selected in operation 3010.
이 경우, 키워드 검색이 선택되면, 사용자로부터 검색할 키워드가 입력되고(3110 단계), 입력된 키워드에 의한 단백질 정보가 검색된 후(3120), 검색 결과가 디스플레이 된다(3500 단계). 3010 단계에서 이미지 검색이 선택되면, 데이터베이스에 저장되어 있는 레퍼런스 이미지들 중 검색을 원하는 이미지가 선택된 뒤, 검색에 사용될 2차원 젤 이미지가 로딩되고(3210), 검색될 단백질의 위치가 사용자에 의해 상기 2차원 젤 이미지 상에 지정된다(3220 단계). 이 때, 본 발명에서는 보다 정확한 위치의 지정을 위해 3220 단계에서 지정된 위치를 중심으로 소정의 영역이 확대되어 디스플레이 되는 이미지 확대 기능을 제공한다. 이 기능에 의해 사용자는 보다 정확한 위치 지정을 수행할 수 있다.In this case, when the keyword search is selected, a keyword to be searched is input from the user (step 3110), the protein information based on the input keyword is searched (3120), and the search result is displayed (step 3500). If the image search is selected in step 3010, the image to be searched is selected from the reference images stored in the database, and then the 2D gel image to be searched is loaded (3210), and the position of the protein to be searched is determined by the user. It is designated on a two-dimensional gel image (step 3220). In this case, the present invention provides an image magnification function in which a predetermined area is enlarged and displayed based on the position specified in step 3220 to designate a more accurate position. This feature allows the user to perform more accurate positioning.
이어서, 지정된 위치에 해당되는 단백질 정보가 검색된 후(3230), 검색 결과가 디스플레이 된다(3500 단계). 그리고, 3110 단계에서 고급 검색이 선택되면, 수순은 3410 단계로 진행하여 고급검색을 위한 세부 검색 방법이 선택되어진다. 이 경우, 세부 검색 방법으로서 등전점/분자량(pI/MW) 유사성 검색이 선택되면, 사용자로부터 등전점/분자량(pI/MW) 데이터를 입력받아(3421 단계), 유사 등전점/분자량(pI/MW)을 갖는 단백질들을 검색한 후(3422 단계), 검색 결과를 디스플레이 한다(3500 단계). 3410 단계에서 세부 검색 방법으로서 펩타이드 매스 핑거프린팅 유사성 검색이 선택되면, 사용자로부터 펩타이드 매스 핑거프린팅(PMF) 데이터를 입력받아(3441), 유사 펩타이드 매스 핑거프린팅을 갖는 단백질들을 검색한 후(3442 단계), 검색 결과를 디스플레이 한다(3500 단계). 그리고, 3410 단계에서 세부 검색 방법으로서 서열 유사성 검색이 선택되면, 사용자로부터 단백질 서열 정보를 입력받아(3461 단계), 유사 서열을 갖는 단백질들을 검색한 후(3462 단계), 검색 결과를 디스플레이 한다(3500 단계).Subsequently, after the protein information corresponding to the designated location is searched (3230), the search result is displayed (step 3500). If the advanced search is selected in step 3110, the procedure proceeds to step 3410, and the detailed search method for the advanced search is selected. In this case, when the isoelectric point / molecular weight (pI / MW) similarity search is selected as the detailed search method, the isoelectric point / molecular weight (pI / MW) data is input from the user (step 3421), and the pseudo isoelectric point / molecular weight (pI / MW) is obtained. After searching for the proteins having (step 3342), the search results are displayed (step 3500). When the peptide mass fingerprinting similarity search is selected as a detailed search method in step 3410, the user receives peptide mass fingerprinting (PMF) data from the user (3441), and then searches for proteins having similar peptide mass fingerprinting (step 3344). In operation 3500, the search result is displayed. When sequence similarity search is selected as a detailed search method in step 3410, the user receives protein sequence information from the user (step 3651), searches for proteins having similar sequences (step 3346), and displays the search result (3500). step).
이와 같은 방법에 의해서, 본 발명에 의한 프로테옴 분석 및 관리 시스템은 키워드 및 이미지 검색을 통해 단백질의 상세 데이터를 얻을 수 있고, 고급 검색을 통해 등전점, 분자량, 펩타이드 매스 핑거프린팅, 또는 단백질 서열정보를 분석하여 유사한 특징을 가진 단백질을 추출할 수 있다.By this method, the proteome analysis and management system according to the present invention can obtain detailed data of proteins through keyword and image search, and analyze isoelectric point, molecular weight, peptide mass fingerprinting, or protein sequence information through advanced search. Thus, proteins having similar characteristics can be extracted.
도 8a 내지 도 8c는 도 6에 도시된 키워드 검색 메뉴(310)가 선택되었을 때 도 7에 도시된 방법에 의해 실행되는 키워드 검색 화면 및 그것의 검색 결과를 보여주는 도면이다. 사용자가 도 8a에 도시된 바와 같은 키워드 검색 화면에서 단백질 등전점, 분자량, 단백질 이름 및 노화 보고 자료 등과 같은 프로테옴 관련 중심 단어를 입력하게 되면, 도 8b에 도시된 바와 같이 실험 프로테옴 데이터베이스(260)에서의 검색 결과와 레퍼런스 프로테옴 데이터베이스(250)에서의 검색 결과가 각각 테이블 형태로 표시된다. 이 경우, 사용자가 화면에 표시된 임의의 단백질 번호를 클릭하게 되면, 2차원 젤 이미지를 포함한, 보다 상세한 특성정보, 서열, 코멘트, 참고문헌, 개체종 정보 등과 같은 프로테옴 관련 정보가 레퍼런스 프로테옴 데이터베이스(250)로부터 검색되어 도 8c와 같이 디스플레이 된다.8A to 8C are diagrams illustrating a keyword search screen executed by the method shown in FIG. 7 and the search results thereof when the keyword search menu 310 shown in FIG. 6 is selected. When a user inputs proteome related central words such as protein isoelectric point, molecular weight, protein name, and aging report data in the keyword search screen as shown in FIG. 8A, the experimental proteome database 260 as shown in FIG. The search results and the search results in the reference proteome database 250 are displayed in a table form, respectively. In this case, when a user clicks on an arbitrary protein number displayed on the screen, proteome related information such as more detailed property information, sequence, comments, references, species information, etc., including a two-dimensional gel image is displayed. ) Is displayed as shown in FIG. 8C.
도 9a 및 도 9b는 도 6에 도시된 이미지 검색 메뉴(320)가 선택되었을 때 도 7에 도시된 방법에 의해 실행되는 이미지 검색 화면을 보여주는 도면이다. 사용자가 도 9a에 도시된 바와 같은 검색될 이미지를 선택하고, 해당 이미지에 포함된 임의의 위치를 지정하게 되면, 해당 위치의 x축, y축 좌표에 대응되는 프로테옴 검색이 수행된다. 만일 해당 위치에 지정된 스팟 정보가 없을 때에는 도 9b와 같이 해당 위치를 중심으로 확대된 이미지가 디스플레이 되어, 사용자가 검색될 위치를 정확하게 지정할 수 있게 된다. 이와 같은 검색 위치의 지정에 의해서 해당 스팟의 x축 및 y축 위치가 결정되면, 상기 스팟의 x 및 y축 좌표에 대응되는 프로테옴에 대한 검색이 수행되고, 해당 검색 결과가 도 8b와 같이 출력된다. 그리고, 도면에 표시되지는 않았지만, 이미지 검색 결과 역시, 사용자가 임의의 결과 데이터를 클릭하게 되면, 도 8c에 도시된 바와 같이, 2차원 젤 이미지를 포함한, 보다 상세한 프로테옴 관련 정보가 레퍼런스 프로테옴 데이터베이스(250)로부터 검색되어 디스플레이 된다.9A and 9B illustrate an image search screen executed by the method shown in FIG. 7 when the image search menu 320 shown in FIG. 6 is selected. When the user selects an image to be searched as shown in FIG. 9A and designates an arbitrary position included in the image, a proteome search corresponding to the x-axis and y-axis coordinates of the corresponding position is performed. If there is no spot information assigned to the corresponding location, an image enlarged around the corresponding location is displayed as shown in FIG. 9B, so that the user can accurately specify the location to be searched. When the x-axis and y-axis positions of the corresponding spots are determined by designating the search position as described above, a search for a proteome corresponding to the x- and y-axis coordinates of the spot is performed, and the search result is output as shown in FIG. 8B. . Although not shown in the drawing, when the user clicks on any result data, as shown in FIG. 8C, more detailed proteome related information, including a two-dimensional gel image, is displayed in the reference proteome database (not shown). 250 is retrieved and displayed.
도 10a 및 도 10b는 도 6에 도시된 단백질 발현 패턴 검색 메뉴(330)가 선택되었을 때 도 7에 도시된 방법에 의해 실행되는 단백질 발현 패턴 검색 화면 및 그것의 검색 결과를 보여주는 도면이다. 도 10a를 참조하면, 도면의 하단에 표시된 검색 초기 화면에, 검색할 단백질 발현 변화 패턴의 시간대 및 식이 여부와 같은 실험 조건을 입력하게 되면, 도 10b와 같이 시간대별 단백질 발현 변화 패턴 및 식이 여부에 따른 단백질 발현 변화 패턴이 표 형태로 디스플레이 된다. 그리고, 도면에 표시되지는 않았지만, 도 10b에 도시된 검색 결과 역시, 사용자가 임의의 결과 데이터를 클릭하게 되면, 도 8c에 도시된 바와 같이, 2차원 젤 이미지를 포함한, 보다 상세한 프로테옴 관련 정보가 레퍼런스 프로테옴 데이터베이스(250)로부터 검색되어 디스플레이 된다.10A and 10B are diagrams illustrating a protein expression pattern search screen executed by the method shown in FIG. 7 and a search result thereof when the protein expression pattern search menu 330 shown in FIG. 6 is selected. Referring to FIG. 10A, when inputting experimental conditions such as a time zone and a dietary time of a protein expression change pattern to be searched on the initial screen displayed at the bottom of the figure, the time-dependent protein expression change pattern and dietary status are shown in FIG. 10B. The resulting protein expression change pattern is displayed in tabular form. Although not shown in the drawing, the search results shown in FIG. 10B also include more detailed proteome-related information, including a two-dimensional gel image, as shown in FIG. 8C when the user clicks on arbitrary result data. It is retrieved from the reference proteome database 250 and displayed.
도 11a 내지 도 11c는 도 6에 도시된 고급 검색 메뉴(340)가 선택되었을 때 도 7에 도시된 방법에 의해 실행되는 고급 검색 화면 및 그것의 검색 결과를 보여주는 도면이다. 고급 검색은 입력 값에 따라 등전점/분자량(pI/MW) 유사성 검색(342), 펩타이드 매스 핑거프린팅 유사성 검색(344) 및 서열 유사성 검색(346)으로 구분된다. 도 11a 내지 도 11c에 도시된 바와 같이 고급 검색을 위해 필요로 하는 각각의 변수가 입력되면 각 변수에 해당되는 고급 검색(342, 244, 또는 346)이 수행된다. 그리고, 도면에 표시되지는 않았지만, 도 11a 내지 도 11c에 의한 고급 검색 결과 역시, 사용자가 임의의 결과 데이터를 클릭하게 되면 도 8c에 도시된 바와 같이, 2차원 젤 이미지를 포함한, 보다 상세한 프로테옴 관련 정보가 레퍼런스 프로테옴 데이터베이스(250)로부터 검색되어 디스플레이 된다.11A to 11C are diagrams showing an advanced search screen executed by the method shown in FIG. 7 and the search results thereof when the advanced search menu 340 shown in FIG. 6 is selected. Advanced searches are divided into isoelectric point / molecular weight (pI / MW) similarity searches (342), peptide mass fingerprinting similarity searches (344) and sequence similarity searches (346), depending on input values. As shown in FIGS. 11A to 11C, when each variable required for an advanced search is input, an advanced search 342, 244, or 346 corresponding to each variable is performed. And, although not shown in the drawing, the advanced search results according to FIGS. 11A-11C are also related to more detailed proteome, including two-dimensional gel images, as shown in FIG. 8C when the user clicks on any result data. The information is retrieved from the reference proteome database 250 and displayed.
이상에서, 본 발명의 실시 예로서 스위스-프롯 데이터베이스를 레퍼런스 프로테옴 데이터베이스로 사용하여 실험 프로테옴 데이터베이스를 구축하고, 두 데이터베이스의 검색 및 분석 기능을 통합한 웹 기반 프로테옴 분석 및 관리 시스템에 대해 구체적으로 예시되었으나, 그밖에도 다양한 단백질 서열 데이터베이스들이 본 발명에 적용될 수 있고, 웹 환경이 아닌 로컬 환경에서도 본 발명을 적용할 수 있다.In the above, as an embodiment of the present invention, an experimental proteome database was constructed using a Swiss-prot database as a reference proteome database, and a web-based proteome analysis and management system integrating search and analysis functions of two databases was specifically illustrated. In addition, various protein sequence databases may be applied to the present invention, and the present invention may be applied to a local environment rather than a web environment.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로 저장되고 실행될 수 있다.The invention can also be embodied as computer readable code on a computer readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, and may also be implemented in the form of a carrier wave (for example, transmission over the Internet). Include. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.
이상에 설명한 바와 같이, 본 발명에 의한 웹 기반 프로테옴 분석 및 관리 시스템에 의하면, 각각 떨어져 존재하고 있는 프로테옴 연구 결과물에 대한 데이터베이스와 기존의 데이터베이스의 저장, 검색 및 분석 기능이 효율적으로 통합될 수 있다. 따라서, 실험 데이터의 데이터베이스화와 단백질 검색 및 분석이 용이하게 수행될 수 있다.As described above, according to the web-based proteome analysis and management system according to the present invention, the storage, retrieval and analysis functions of the database and the existing database for the proteome research results which are separated from each other can be efficiently integrated. Thus, database of experimental data and protein search and analysis can be easily performed.
Claims (20)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020010052555A KR20030019681A (en) | 2001-08-29 | 2001-08-29 | Web-based workbench system and method for proteome analysis and management |
PCT/KR2002/001624 WO2003019417A1 (en) | 2001-08-29 | 2002-08-29 | System and method for proteome analysis and data management |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020010052555A KR20030019681A (en) | 2001-08-29 | 2001-08-29 | Web-based workbench system and method for proteome analysis and management |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20030019681A true KR20030019681A (en) | 2003-03-07 |
Family
ID=27721439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020010052555A KR20030019681A (en) | 2001-08-29 | 2001-08-29 | Web-based workbench system and method for proteome analysis and management |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20030019681A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030019682A (en) * | 2001-08-29 | 2003-03-07 | 바이오인포메틱스 주식회사 | Apparatus and method for analysing protein expression profile based on spot intensity information |
KR20040039975A (en) * | 2002-11-05 | 2004-05-12 | 이원석 | Method of Constructing Database for Intergating Proteome Information and System thereof |
KR100458609B1 (en) * | 2001-12-13 | 2004-12-03 | 주식회사 엘지생명과학 | A system for predicting interaction between proteins and a method thereof |
KR100650203B1 (en) * | 2002-12-11 | 2006-11-27 | 주식회사 씨티앤디 | Apparatus and method for performing genome sequence analysis and data management |
KR101004959B1 (en) * | 2008-04-23 | 2011-01-04 | 씨비에스바이오사이언스 주식회사 | System and method for managing information of two dimensional sds-page gel images |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0628409A (en) * | 1991-01-26 | 1994-02-04 | Internatl Business Mach Corp <Ibm> | Method and system for retrieval of molecule |
KR20000052802A (en) * | 1996-10-25 | 2000-08-25 | 모세 라르센 페터 | Proteome analysis for characterization of up- and down-regulated proteins in biological samples |
US6223186B1 (en) * | 1998-05-04 | 2001-04-24 | Incyte Pharmaceuticals, Inc. | System and method for a precompiled database for biomolecular sequence information |
KR20010108116A (en) * | 1999-01-22 | 2001-12-07 | 추후보정 | Process for pan-genomic determination of macromolecular atomic structures |
KR20020080626A (en) * | 2001-04-16 | 2002-10-26 | 학교법인연세대학교 | Providing Apparatus and Method for Proteome Data |
-
2001
- 2001-08-29 KR KR1020010052555A patent/KR20030019681A/en not_active Application Discontinuation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0628409A (en) * | 1991-01-26 | 1994-02-04 | Internatl Business Mach Corp <Ibm> | Method and system for retrieval of molecule |
KR20000052802A (en) * | 1996-10-25 | 2000-08-25 | 모세 라르센 페터 | Proteome analysis for characterization of up- and down-regulated proteins in biological samples |
US6223186B1 (en) * | 1998-05-04 | 2001-04-24 | Incyte Pharmaceuticals, Inc. | System and method for a precompiled database for biomolecular sequence information |
KR20010108116A (en) * | 1999-01-22 | 2001-12-07 | 추후보정 | Process for pan-genomic determination of macromolecular atomic structures |
KR20020080626A (en) * | 2001-04-16 | 2002-10-26 | 학교법인연세대학교 | Providing Apparatus and Method for Proteome Data |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030019682A (en) * | 2001-08-29 | 2003-03-07 | 바이오인포메틱스 주식회사 | Apparatus and method for analysing protein expression profile based on spot intensity information |
KR100458609B1 (en) * | 2001-12-13 | 2004-12-03 | 주식회사 엘지생명과학 | A system for predicting interaction between proteins and a method thereof |
KR20040039975A (en) * | 2002-11-05 | 2004-05-12 | 이원석 | Method of Constructing Database for Intergating Proteome Information and System thereof |
KR100650203B1 (en) * | 2002-12-11 | 2006-11-27 | 주식회사 씨티앤디 | Apparatus and method for performing genome sequence analysis and data management |
KR101004959B1 (en) * | 2008-04-23 | 2011-01-04 | 씨비에스바이오사이언스 주식회사 | System and method for managing information of two dimensional sds-page gel images |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Monroe et al. | VIPER: an advanced software package to support high-throughput LC-MS peptide identification | |
CN110019616B (en) | POI (Point of interest) situation acquisition method and equipment, storage medium and server thereof | |
CN109192242A (en) | Based on the microbial diversity interaction analysis system and method for calculating cloud platform | |
US10930373B2 (en) | Methods and systems for knowledge discovery using biological data | |
Carvalho et al. | Analyzing shotgun proteomic data with PatternLab for proteomics | |
Tang et al. | GE-mini: a mobile APP for large-scale gene expression visualization | |
CN115236260A (en) | Chromatographic data storage method and device, electronic equipment and storage medium | |
Appel et al. | Computer analysis of 2-D images | |
Tsaousis et al. | ExTopoDB: a database of experimentally derived topological models of transmembrane proteins | |
CN115329131A (en) | Material label recommendation method and device, electronic equipment and storage medium | |
KR100650203B1 (en) | Apparatus and method for performing genome sequence analysis and data management | |
D. LeDuc et al. | Using ProSight PTM and related tools for targeted protein identification and characterization with high mass accuracy tandem MS data | |
KR20030019681A (en) | Web-based workbench system and method for proteome analysis and management | |
Babnigg et al. | GELBANK: a database of annotated two‐dimensional gel electrophoresis patterns of biological systems with completed genomes | |
US20050146951A1 (en) | Knowledge search apparatus knowledge search method program and recording medium | |
KR100478792B1 (en) | Apparatus and method for searching similar position protein based on 2 dimensional gel image | |
US20070143042A1 (en) | Processes and systems for providing analytical device analysis advisory information | |
US11960711B2 (en) | Display control device, display control method, and display control program | |
CN114627968A (en) | Multi-modal omics data management system | |
WO2003019417A1 (en) | System and method for proteome analysis and data management | |
Wilkins et al. | Information management for proteomics: a perspective | |
Belhajjame et al. | Proteome data integration: Characteristics and challenges | |
Karmirantzou et al. | A Web-based classification system of DNA-binding protein families | |
RU2611602C1 (en) | Method for aerospace images selection from databases based on user criteria and forming of terrain coverage based on these images | |
Jones et al. | Proposal for a standard representation of two‐dimensional gel electrophoresis data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |