KR20020005535A - BAC-end sequencing 및 STC approach genome sequencingwith shotgun 방법의 전체 염기 서열 결정 연구의 자동화및 통합화를 지원하는 소프트웨어 설계·제작 모형 - Google Patents

BAC-end sequencing 및 STC approach genome sequencingwith shotgun 방법의 전체 염기 서열 결정 연구의 자동화및 통합화를 지원하는 소프트웨어 설계·제작 모형 Download PDF

Info

Publication number
KR20020005535A
KR20020005535A KR1020010069619A KR20010069619A KR20020005535A KR 20020005535 A KR20020005535 A KR 20020005535A KR 1020010069619 A KR1020010069619 A KR 1020010069619A KR 20010069619 A KR20010069619 A KR 20010069619A KR 20020005535 A KR20020005535 A KR 20020005535A
Authority
KR
South Korea
Prior art keywords
sequencing
research
bac
model
genome
Prior art date
Application number
KR1020010069619A
Other languages
English (en)
Inventor
이현승
Original Assignee
이성섭
(주)리눅스 베이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이성섭, (주)리눅스 베이 filed Critical 이성섭
Priority to KR1020010069619A priority Critical patent/KR20020005535A/ko
Publication of KR20020005535A publication Critical patent/KR20020005535A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 생명공학 분야의 유전체(遺傳體) 연구 자동화 및 통합화를 위한 플랫폼 소프트웨어(Software)의 설계·제작 모형(模型)에 관한 것으로, 더욱 상세하게는 유전체 연구 방법론 상의 BAC-end sequencing and STC approach genome sequencing with shotgun 방법(이하 BAC-end & STC 방법)에 따른 종별(種別) 유전체 전(全) 염기 서열 결정(이하 Whole sequence) 연구를 지원하는 플랫폼 소프트웨어(이하 S/W)의 설계·제작을 위한 방법론적 모델을 제공하는 것이다.
이를 위하여 본 발명은, BAC-end & STC 방법에 따른 Whole sequence 연구 프로젝트를 입체적인 전략 모형도(戰略 模型圖)로 작성하여 S/W 설계를 위한 구조적·방법론적 컨셉(Concept)을 정의하는 단계, 상기 전략 모형도에서 추출된 단위 프로세스별로 내부적인 작업 스텝(step)을 실제 연구·실험 기법에 따라 순차적인 모식도(模式圖)로 나타내고 데이터 입출력 및 변환을 추적하는 단계, 전체 프로젝트 및 단위 프로세스 실제 전개 사이클에서의 전체적인 작업 흐름 및 데이터의 내적 연관성을 밝히고 프로세스 상세 전개도(展開圖) 양식으로 나타내는 단계, 상기 단계에서 밝혀진 모형에 따라 정의된 데이터 모델 및 기능 구성도를 획득하는 단계로 이루어진 것에 특징이 있다.

Description

BAC-end sequencing 및 STC approach genome sequencing with shotgun 방법의 전체 염기 서열 결정 연구의 자동화 및 통합화를 지원하는 소프트웨어 설계·제작 모형{The model of software design & programming to support automatic and integrated research of whole sequence alignment with BAC-end sequencing & STC approach genome sequencing through shotgun method}
본 발명은 유전체 연구의 자동화 및 통합화를 위한 플랫폼 소프트웨어의 설계·제작모형에 관한 것으로, 더욱 상세하게는 유전체 연구 방법론 상의 BAC-end sequencing and STC approach genome sequencing with shotgun 방법(이하 BAC-end & STC 방법)에 따른 종 별 유전체 전(全) 염기 서열 결정(이하 Whole sequencing)연구를 지원하는 플랫폼 소프트웨어(이하 S/W)의 설계·제작을 위한 방법론적 모델을 제공하는 것이다.
일반적으로 sequence 연구/분석을 위한 플랫폼 S/W의 주된 작업 흐름은 도면 2에서 예시한 바와 같이
첫째로 유전체 연구과정에서 일차 해독된 clone별 sequence 단편으로부터 신뢰할 수 있는 quality 값을 기준으로 각 base를 선택/배제하고 vector 부위를 제거한 뒤(base calling step)
둘째로 일차 가공된 단편의 sequence들에서 중복된 부위를 제거/연결하여 하나의 contig sequence를 얻어 내며 (Fragment Assemble step)
셋째로 contig sequnce들을 소스로 하고 국제적 범위에서 축적된 공공유전체 DB의 대량의 sequence 데이터 집합을 타겟으로 하여 BLAST/FASTA 등의 탐색/정렬 알고리즘을 이용하여 일정한 신뢰도 범위 내에서 일치하는 타겟 sequence의 부분 집합을 얻어 내며(search & alignment step)
넷째로 셋째 과정에서 얻어낸 sequence 집합으로부터 OSF 및 homology 분석 등 연구 목적에 따른 분석을 수행한다. (annotation step)
기존의 유전체 연구를 위한 플랫폼 S/W 들의 설계·제작 방식은 상기와 같은 일반적인 작업 흐름을 갖고 있는 바, 하나의 입구로부터의 입력이 있고 주어진 순서대로 진행되는 작업 스텝이 있으며 최종적으로 하나의 출구로 출력이 나오는 순차 구조를 갖는다.
반면에 whole sequencing 연구는 도면 1과 도면 5에서 예시한 바와 같이 연구 프로젝트의 전체 사이클 상의 프로세스 및 데이터 상호 연관 속에서 상기 sequence 분석 프로세스가 연쇄적/반복적으로 순환 수행된다.
그러므로 상기와 같은 순차적 방식의 플랫폼 S/W 설계·제작 모형은 특정 유전자 부위 만을 선택적으로 sequencing하는 EST sequencing 모델로는 유효하지만, 종별 유전체의 전 염기 서열을 결정하고자 하는 Whole sequencing 모델로서는 별다른 효용가치가 없다는 문제점이 발생한다.
본 발명은 상기와 같은 문제점을 해소하기 위해
첫째로 BAC-end & STC 방법에 따른 Whole sequencing 연구 프로젝트를 입체적인 전략 모형도(戰略 模型圖)로 작성하여 S/W 설계를 위한 구조적·방법론적 컨셉(Concept)을 정의하는 단계,
둘째로 상기 전략 모형도에서 추출된 단위 프로세스 별로 내부적인 작업 스텝(step)을 실제 연구·실험 기법에 따라 순차적인 모식도(模式圖)로 나타내고 데이터 입출력 및 변환을 추적하는 단계,
셋째로 전체 프로젝트 및 단위 프로세스 실제 전개 사이클에서의 전체적인 작업 흐름 및 데이터의 내적 연관성을 밝히고 프로세스 상세 전개도(詳細 展開圖) 양식으로 나타내는 단계,
넷째로 상기 단계에서 밝혀진 모형에 따라 S/W 설계·제작의 기본 골격에 해당하는 데이터 모델링 및 기능 모듈 구성도를 작성하는 단계를 거쳐 Whole sequencing 연구 용 S/W 설계·제작에 BAC-end & STC 등 genomic 연구 방법론을적용하고 데이터 통합성을 부여고자 하는 것이다.
도 1은 상기 S/W의 기본 아키텍처 예시(例示)
도 2는 일반적인 유전체 연구/분석 S/W의 아키텍처 예시
도 3는 BAC-end & STC 방식의 Whole sequencing 전략 모형도 예시
도 4 내지 도 5는 주요 단위 프로세스 내부의 작업 Step 모식도 예시
〈도면의 주요부분에 대한 기호의 설명〉
이하 첨부된 도면에 의해 상세히 설명하면 다음과 같다.
예시된 도 1은 상기 S/W의 기본 아키텍처를 나타내는 도면으로 Whole sequencing을 위해서는 clone, marker, contig 등의 연구 데이터들이 Acedb 등 유전체 연구에 최적화된 데이터베이스를 기반으로 통합되어야 하며, Physical Mapping, Genetic Mapping 등의 연구 프로세스와 sequence 분석 프로세스 및 이에 이어진 OSF 탐색, Homology 분석 등의 프로세스 들이 통합된 데이터 및 사용자 친화적 인터페이스를 기반으로 유기적으로 통합되어야 한다는 점을 나타내고 있는 도면이다.
예시된 도 3은 whole sequencing을 위한 기본 전략 모형을 나타내는 도면으로 BAC을 연구·실험하여 그 서열 정보를 밝혀 나감으로써 최종적으로 Genomic sequence를 완성하고 완성된 Genomic sequence는 유전체 연구의 다음 단계인 Functional Genomics와 Comparitive Genomics연구에 이용된다는 점을 전체적으로 도시(圖示)하는 한 편, BAC의 끝 부분 만을 읽는 BAC-end sequencing 프로세스는 물리지도 작성 프로세스에 대한 Overgo 및 유전자 지도 작성 프로세스에 대한 SSR Marker 탐색에 활용되고 물리지도 및 유전자 지도는 sequencing의 다음 단계인 STC approach genome sequencing 프로세스에 참조되는 등, 프로세스 사이에는 상호 참조 관계가 성립함을 보여 준다.
예시된 도 4, 5는 각각 기본 전략 모형에 나타난 프로세스 중 물리지도 작성프로세스와 BAC-end 및 shotgun의 sequence 분석 part 프로세스를 나타낸 순차 모식도로서 각각의 프로세스에서 내부 작업 스텝의 순차 전개와 전개 과정에서의 데이터 입출력 및 변화의 추적을 함께 나타내고 있다.
이상에서 상술한 바와같이 본 발명은, 유전체 연구의 전략 모형도, 각 단위 프로세스의 순차 모식도, 실제 연구 사이클에서의 순환 전개도 형식으로 모형을 나타냄으로써 BAC-end & STC 방법의 whole sequencing 연구 사이클에 부합하여 연구 프로세스를 자동화하고 데이터를 통합함으로써 연구를 지원하는 S/W 설계 ·제작 방법론을 제시하고 직접적으로는 실제 S/W 설계·제작의 기본 골격을 이루는 데이터 모델링 및 기능 구성도를 작성할 수 있게 한다.

Claims (1)

  1. BAC-end sequencing and STC approach genomic sequencing with shotgun 방법이 적용된 종별 유전체 전 염기 서열 결정 연구를 지원하기 위한 소프트웨어의 설계·제작 모형을 제시하기 위해,
    연쇄·순환적 구조 모델을 사용하고,
    연구 전략 모형도를 통해 설계·제작을 위한 구조적·방법론적 컨셉을 정의하고, Genetic Mappins, Physical Mapping, BAC-end sequencing, STC approach genomic sequencing with shotgun 등 단위 프로세스별 모식도를 통해 각 단위 프로세스 내부의 작업 스텝 흐름과 입출력 데이터 및 그 변화를 정의하며,
    프로세스 상세 전개도를 통해 종별 유전체 전 염기 서열 결정 연구의 전체 사이클속에서 각 단위 프로세스 및 프로세스 별 작업 스텝들이 갖는 하나의 연쇄·순환된 흐름과 데이터 간의 내적 연관성 및 형태 변화를 정의하는 방법.
KR1020010069619A 2001-11-08 2001-11-08 BAC-end sequencing 및 STC approach genome sequencingwith shotgun 방법의 전체 염기 서열 결정 연구의 자동화및 통합화를 지원하는 소프트웨어 설계·제작 모형 KR20020005535A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010069619A KR20020005535A (ko) 2001-11-08 2001-11-08 BAC-end sequencing 및 STC approach genome sequencingwith shotgun 방법의 전체 염기 서열 결정 연구의 자동화및 통합화를 지원하는 소프트웨어 설계·제작 모형

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010069619A KR20020005535A (ko) 2001-11-08 2001-11-08 BAC-end sequencing 및 STC approach genome sequencingwith shotgun 방법의 전체 염기 서열 결정 연구의 자동화및 통합화를 지원하는 소프트웨어 설계·제작 모형

Publications (1)

Publication Number Publication Date
KR20020005535A true KR20020005535A (ko) 2002-01-17

Family

ID=19715851

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010069619A KR20020005535A (ko) 2001-11-08 2001-11-08 BAC-end sequencing 및 STC approach genome sequencingwith shotgun 방법의 전체 염기 서열 결정 연구의 자동화및 통합화를 지원하는 소프트웨어 설계·제작 모형

Country Status (1)

Country Link
KR (1) KR20020005535A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100512915B1 (ko) * 2001-11-17 2005-09-07 (주)뉴로제넥스 유전자 클로닝 과정을 실지 실험과정과 동일하게시뮬레이션하고 그 결과물을 데이터베이스 형태로 저장할수 있도록 하는 컴퓨터 프로그램 및 그 구현방법.
KR100601980B1 (ko) * 2005-01-04 2006-07-18 삼성전자주식회사 유전자형 데이터 분석 방법 및 장치
KR100650203B1 (ko) * 2002-12-11 2006-11-27 주식회사 씨티앤디 유전체 서열 분석 및 데이터 관리 시스템 및 그 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05192194A (ja) * 1991-09-05 1993-08-03 Pola Chem Ind Inc 遺伝子の検索方法及び装置
JPH07274965A (ja) * 1993-11-12 1995-10-24 Kokuritsu Idengaku Kenkyusho 遺伝子のモチーフ抽出処理装置及び処理方法
WO2000028080A2 (en) * 1998-11-10 2000-05-18 Genset Methods, software and apparati for identifying genomic regions harboring a gene associated with a detectable trait
KR20030038911A (ko) * 2001-11-07 2003-05-17 (주)엔솔테크 디옥시리보핵산 염기서열정보의 통합 및 자동화 처리방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05192194A (ja) * 1991-09-05 1993-08-03 Pola Chem Ind Inc 遺伝子の検索方法及び装置
JPH07274965A (ja) * 1993-11-12 1995-10-24 Kokuritsu Idengaku Kenkyusho 遺伝子のモチーフ抽出処理装置及び処理方法
WO2000028080A2 (en) * 1998-11-10 2000-05-18 Genset Methods, software and apparati for identifying genomic regions harboring a gene associated with a detectable trait
KR20030038911A (ko) * 2001-11-07 2003-05-17 (주)엔솔테크 디옥시리보핵산 염기서열정보의 통합 및 자동화 처리방법

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
카다로그.[조선닷컴 2001년 6월 26일자 관련 인쇄물 첨부]2001.06.26 *
카다로그[전자신문 2001년 7월 19일자 관련 인쇄물 첨부]2001.07.19 *
카다로그[조선닷컴 1995년 10월 27일자 관련 인쇄물 첨부]1995.10.27 *
카다로그[조선닷컴 2001년 6월 26일자 관련 인쇄물 첨부]2001.06.26 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100512915B1 (ko) * 2001-11-17 2005-09-07 (주)뉴로제넥스 유전자 클로닝 과정을 실지 실험과정과 동일하게시뮬레이션하고 그 결과물을 데이터베이스 형태로 저장할수 있도록 하는 컴퓨터 프로그램 및 그 구현방법.
KR100650203B1 (ko) * 2002-12-11 2006-11-27 주식회사 씨티앤디 유전체 서열 분석 및 데이터 관리 시스템 및 그 방법
KR100601980B1 (ko) * 2005-01-04 2006-07-18 삼성전자주식회사 유전자형 데이터 분석 방법 및 장치

Similar Documents

Publication Publication Date Title
Ghurye et al. Integrating Hi-C links with assembly graphs for chromosome-scale assembly
Song et al. Rascaf: improving genome assembly with RNA sequencing data
EP1260918A2 (en) Database model, tools and methods for organizing information across external information objects
JP2000508096A (ja) 遺伝的プログラミングを使用した複雑な構造の自動設計の方法および装置
Persson et al. A human protein atlas based on antibody proteomics
Holman et al. Identifying Proteomic LC‐MS/MS Data Sets with Bumbershoot and IDPicker
JP4543563B2 (ja) 統合データベースシステムにおける問合せ最適化方法
CN107194204A (zh) 一种全基因组测序数据计算解读方法
Rivera-Colón et al. Population genomics analysis with RAD, reprised: Stacks 2
Huson et al. Autumn algorithm—computation of hybridization networks for realistic phylogenetic trees
KR20020005535A (ko) BAC-end sequencing 및 STC approach genome sequencingwith shotgun 방법의 전체 염기 서열 결정 연구의 자동화및 통합화를 지원하는 소프트웨어 설계·제작 모형
Pacifico et al. A database and tool, IM Browser, for exploring and integrating emerging gene and protein interaction data for Drosophila
US20130196330A1 (en) Identifying Microparticles in a Plurality of Images to Perform Polynucleotide Sequencing
Peleg et al. Qualitative models of molecular function: linking genetic polymorphisms of tRNA to their functional sequelae
CN104598591B (zh) 一种针对类型属性图模型的模型元素匹配方法
CN113001538B (zh) 一种命令解析方法及系统
CN102968576A (zh) 一种构建反映蛋白质组变化的新型可视性动态蛋白质网络的方法
Ma et al. Gene networks in Arabidopsis thaliana for metabolic and environmental functions
CN117952041B (zh) 基于驱动源码的x值追踪方法、电子设备和介质
US9633160B2 (en) Method of placement and routing in a reconfiguration of a dynamically reconfigurable processor
Tallman et al. Whole-genome sequencing of Bantu-speakers from Angola and Mozambique reveals complex dispersal patterns and interactions throughout sub-Saharan Africa
JP2002055829A (ja) 中間オブジェクト連結方法、及び、中間オブジェクト連結装置、及び、リンカ装置、及び、コンパイラドライバ装置、並びに、中間オブジェクトを連結するプログラムを記録した記憶媒体
Cheng et al. Ancestral population genomics with jocx, a coalescent hidden Markov model
Voyer et al. Rapid prototyping of the Goertzel algorithm for hardware acceleration of exon prediction
CN117238376A (zh) 基于二代测序技术的病毒载体序列分析系统和方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application