KR100897523B1 - 유전자 상동성 정보를 이용한 유전자 리스트의 생체패스웨이 할당 장치 및 그 방법 - Google Patents
유전자 상동성 정보를 이용한 유전자 리스트의 생체패스웨이 할당 장치 및 그 방법 Download PDFInfo
- Publication number
- KR100897523B1 KR100897523B1 KR1020070046719A KR20070046719A KR100897523B1 KR 100897523 B1 KR100897523 B1 KR 100897523B1 KR 1020070046719 A KR1020070046719 A KR 1020070046719A KR 20070046719 A KR20070046719 A KR 20070046719A KR 100897523 B1 KR100897523 B1 KR 100897523B1
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- genes
- term
- kegg
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 257
- 230000037361 pathway Effects 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000004364 calculation method Methods 0.000 claims abstract description 10
- 230000008236 biological pathway Effects 0.000 claims abstract description 6
- 238000004458 analytical method Methods 0.000 abstract description 6
- 241000894007 species Species 0.000 description 51
- 230000006870 function Effects 0.000 description 21
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 13
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 12
- 230000004060 metabolic process Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 241000282412 Homo Species 0.000 description 7
- 241000699670 Mus sp. Species 0.000 description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 238000000018 DNA microarray Methods 0.000 description 6
- POJWUDADGALRAB-UHFFFAOYSA-N allantoin Chemical compound NC(=O)NC1NC(=O)NC1=O POJWUDADGALRAB-UHFFFAOYSA-N 0.000 description 6
- 230000031018 biological processes and functions Effects 0.000 description 5
- 229930182830 galactose Natural products 0.000 description 5
- 108091008053 gene clusters Proteins 0.000 description 5
- 230000004102 tricarboxylic acid cycle Effects 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- POJWUDADGALRAB-PVQJCKRUSA-N Allantoin Natural products NC(=O)N[C@@H]1NC(=O)NC1=O POJWUDADGALRAB-PVQJCKRUSA-N 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- 229960000458 allantoin Drugs 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 239000011593 sulfur Substances 0.000 description 3
- 108010001515 Galectin 4 Proteins 0.000 description 2
- 102100039556 Galectin-4 Human genes 0.000 description 2
- 229920002472 Starch Polymers 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000029058 respiratory gaseous exchange Effects 0.000 description 2
- 238000005507 spraying Methods 0.000 description 2
- 239000008107 starch Substances 0.000 description 2
- 235000019698 starch Nutrition 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 101100314364 Caenorhabditis elegans tpk-1 gene Proteins 0.000 description 1
- 102000005853 Clathrin Human genes 0.000 description 1
- 108010019874 Clathrin Proteins 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 230000011496 cAMP-mediated signaling Effects 0.000 description 1
- 229930193282 clathrin Natural products 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 238000007417 hierarchical cluster analysis Methods 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000005787 mitochondrial ATP synthesis coupled electron transport Effects 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- -1 nucleotide sugars Chemical class 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 230000010627 oxidative phosphorylation Effects 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000009822 protein phosphorylation Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000004144 purine metabolism Effects 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003938 response to stress Effects 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Artificial Intelligence (AREA)
- Analytical Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
Claims (6)
- 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 장치에 있어서,대상 종의 유전자 리스트 중에서 비교 종과 상동성(HomoloGene)을 갖는 유전자들 또는 상기 비교 종에는 포함되어 있지 않은 유전자들을 선별하여 상동성 및 유일성 유전자 리스트를 생성하기 위한 상동성 및 유일성 유전자 리스트 생성수단;상기 상동성 및 유일성 유전자 리스트 생성수단에서 생성한 상동성 및 유일성 유전자 리스트에 GO(Gene Ontology) 용어 및 KEGG(Kyoto Encyclopedia of Genes and Genomes) 용어를 각각 할당하기 위한 용어 할당수단;상기 용어 할당수단을 통해 해당 GO 용어 및 KEGG 용어를 할당한 상동성 및 유일성 유전자 리스트에서 GO 용어 및 KEGG 용어별로 초 기하 분포(hyper-geometric distribution) 유의 확률을 계산하기 위한 통계적 유의 확률 계산수단; 및상기 통계적 유의 확률 계산수단에 의해 상기 초 기하 분포 유의 확률이 계산된 상동성 및 유일성 유전자 리스트별로 최소의 초 기하 분포 유의 확률값을 갖는 GO 용어 및 KEGG 용어를 선별하여 해당 유전자 리스트의 생체 패스웨이로 할당하기 위한 생체 패스웨이 할당수단을 포함하는 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 장치.
- 제 1 항에 있어서,상기 상동성 및 유일성 유전자 리스트 생성수단은,18개의 종에 대한 상동성(HomoloGene) 데이터를 이용하여 상동성 유전자 리스트 또는 유일성 유전자 리스트를 생성하는 것을 특징으로 하는 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 장치.
- 제 1 항 또는 제 2 항에 있어서,상기 통계적 유의 확률 계산수단은,하기의 [수학식 A]를 통해 n개의 유전자로 이루어진 클러스터 내에서 주어진 GO 용어 및 KEGG 용어를 주석으로 가지는 유전자의 개수가 k개 이상인 경우의 확률(p)을 계산하는 것을 특징으로 하는 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 장치.[수학식 A]여기서, G는 주어진 종 내에서 전체 유전자의 개수, C는 주어진 GO 용어 및 KEGG 용어를 주석정보로 가지는 유전자 개수, n은 클러스터 내 유전자의 개수, 그리고 k는 클러스터 내에서 주어진 GO 용어 및 KEGG 용어를 주석정보로 가지는 유전자의 개수를 의미한다.
- 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 방법에 있어서,대상 종의 유전자 리스트 중에서 비교 종과 상동성(HomoloGene)을 갖는 유전자들을 선별하거나, 비교 종에는 포함되어 있지 않은 유전자들을 선별하여 유전자 리스트를 생성하는 유전자 리스트 생성단계;상기 생성한 유전자 리스트에 GO(Gene Ontology) 용어 및 KEGG(Kyoto Encyclopedia of Genes and Genomes) 용어를 각각 할당하는 단계;상기 GO 용어 및 KEGG 용어가 할당된 유전자 리스트에서 GO 용어 및 KEGG 용어별로 초 기하 분포(hyper-geometric distribution) 유의 확률을 계산하는 통계적 유의 확률 계산단계; 및상기 초 기하 분포 유의 확률이 계산된 상동성 및 유일성 유전자 리스트 별로 최소의 초 기하 분포 유의 확률값을 갖는 GO 용어 및 KEGG 용어를 선별하여 해당 유전자 리스트의 생체 패스웨이로 할당하는 단계를 포함하는 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 방법.
- 제 4 항에 있어서,상기 유전자 리스트 생성단계는,18개의 종에 대한 상동성(HomoloGene) 데이터를 이용하여 유전자 리스트를 생성하는 것을 특징으로 하는 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 방법.
- 제 4 항 또는 제 5 항에 있어서,상기 통계적 유의 확률 계산단계는,하기의 [수학식 B]를 통해 n개의 유전자로 이루어진 클러스터 내에서 주어진 GO 용어 및 KEGG 용어를 주석으로 가지는 유전자의 개수가 k개 이상인 경우의 확률(p)을 계산하는 것을 특징으로 하는 유전자 상동성 정보를 이용한 유전자 리스트의 생체 패스웨이 할당 방법.[수학식 B]여기서, G는 주어진 종 내에서 전체 유전자의 개수, C는 주어진 GO 용어 및 KEGG 용어를 주석정보로 가지는 유전자 개수, n은 클러스터 내 유전자의 개수, 그리고 k는 클러스터 내에서 주어진 GO 용어 및 KEGG 용어를 주석정보로 가지는 유전자의 개수를 의미한다.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060122475 | 2006-12-05 | ||
KR20060122475 | 2006-12-05 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20080052193A KR20080052193A (ko) | 2008-06-11 |
KR100897523B1 true KR100897523B1 (ko) | 2009-05-15 |
Family
ID=39807044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070046719A Expired - Fee Related KR100897523B1 (ko) | 2006-12-05 | 2007-05-14 | 유전자 상동성 정보를 이용한 유전자 리스트의 생체패스웨이 할당 장치 및 그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100897523B1 (ko) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030071225A (ko) * | 2002-02-28 | 2003-09-03 | 주식회사 이즈텍 | 유전자 어휘 분류체계를 이용하여 디엔에이 칩을 분석하기위한 시스템 및 그 방법 |
KR20040028081A (ko) * | 2002-09-28 | 2004-04-03 | 주식회사 케이티 | 유전자 알고리즘에 있어서 효율적인 적응도 함수 계산을위한 데이터 분류 방법 |
KR20050096044A (ko) * | 2004-03-29 | 2005-10-05 | 주식회사 이즈텍 | 유전자 기능 분석 방법 |
KR20060064492A (ko) * | 2004-12-08 | 2006-06-13 | 한국전자통신연구원 | 유전자의 발현 패턴 데이터와 단백질 상호작용 데이터를이용한 유전자 패스웨이 예측 방법 및 시스템 |
-
2007
- 2007-05-14 KR KR1020070046719A patent/KR100897523B1/ko not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030071225A (ko) * | 2002-02-28 | 2003-09-03 | 주식회사 이즈텍 | 유전자 어휘 분류체계를 이용하여 디엔에이 칩을 분석하기위한 시스템 및 그 방법 |
KR20040028081A (ko) * | 2002-09-28 | 2004-04-03 | 주식회사 케이티 | 유전자 알고리즘에 있어서 효율적인 적응도 함수 계산을위한 데이터 분류 방법 |
KR20050096044A (ko) * | 2004-03-29 | 2005-10-05 | 주식회사 이즈텍 | 유전자 기능 분석 방법 |
KR20060064492A (ko) * | 2004-12-08 | 2006-06-13 | 한국전자통신연구원 | 유전자의 발현 패턴 데이터와 단백질 상호작용 데이터를이용한 유전자 패스웨이 예측 방법 및 시스템 |
Also Published As
Publication number | Publication date |
---|---|
KR20080052193A (ko) | 2008-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kong et al. | A multivariate approach for integrating genome-wide expression data and biological knowledge | |
Zambelli et al. | Motif discovery and transcription factor binding sites before and after the next-generation sequencing era | |
CN105793859A (zh) | 用于检测序列变异体的方法和系统 | |
JP2013505730A (ja) | 患者を分類するためのシステムおよび方法 | |
JP2003021630A (ja) | 臨床診断サービスを提供するための方法 | |
CN103168118A (zh) | 用减少数量的转录物测量进行的基因表达概况分析 | |
CN104508670A (zh) | 用于生成生物标志物签名的系统和方法 | |
EP1158447A1 (en) | Method for evaluating states of biological systems | |
Saei et al. | A glance at DNA microarray technology and applications | |
Gao et al. | Benchmarking short-read metagenomics tools for removing host contamination | |
US20060265135A1 (en) | Bio-information analyzer, bio-information analysis method and bio-information analysis program | |
US20120010823A1 (en) | System for the quantification of system-wide dynamics in complex networks | |
CN117766024B (zh) | 一种卵巢癌cd8+ t细胞相关预后评估方法、系统及其应用 | |
Zhang et al. | Network motif-based identification of breast cancer susceptibility genes | |
KR100897523B1 (ko) | 유전자 상동성 정보를 이용한 유전자 리스트의 생체패스웨이 할당 장치 및 그 방법 | |
Vu Manh et al. | Characterization of dendritic cell subsets through gene expression analysis | |
Grewal et al. | Analysis of expression data: an overview | |
CN108399939A (zh) | 基于基因检测为导向的个人健康管理系统 | |
Berrar et al. | Introduction to genomic and proteomic data analysis | |
Ferreira et al. | Identifying hierarchical cell states and gene signatures with deep exponential families for single-cell transcriptomics | |
Marić et al. | Approaches to metagenomic classification and assembly | |
Lauria | Rank‐Based miRNA Signatures for Early Cancer Detection | |
RU2827489C2 (ru) | Эпиэйджинг: новая экосистема для управления здоровым старением | |
Zhao et al. | Current Progress of Bioinformatics for Human Health | |
Gollwitzer et al. | MetaFast: Enabling Fast Metagenomic Classification via Seed Counting and Edit Distance Approximation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20070514 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20081028 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20090428 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20090507 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20090508 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |