KR102082360B1 - An apparatus for detecting structural variation of chromosome and a method of manufacturing the same - Google Patents

An apparatus for detecting structural variation of chromosome and a method of manufacturing the same Download PDF

Info

Publication number
KR102082360B1
KR102082360B1 KR1020130079848A KR20130079848A KR102082360B1 KR 102082360 B1 KR102082360 B1 KR 102082360B1 KR 1020130079848 A KR1020130079848 A KR 1020130079848A KR 20130079848 A KR20130079848 A KR 20130079848A KR 102082360 B1 KR102082360 B1 KR 102082360B1
Authority
KR
South Korea
Prior art keywords
order
structural variation
chromosome
chromosomal
sample
Prior art date
Application number
KR1020130079848A
Other languages
Korean (ko)
Other versions
KR20150006267A (en
Inventor
이병철
한상조
남궁정현
윤태균
이성곤
Original Assignee
에스케이텔레콤 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이텔레콤 주식회사 filed Critical 에스케이텔레콤 주식회사
Priority to KR1020130079848A priority Critical patent/KR102082360B1/en
Publication of KR20150006267A publication Critical patent/KR20150006267A/en
Application granted granted Critical
Publication of KR102082360B1 publication Critical patent/KR102082360B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 목적대상의 시료를 수득하는 수득부; 시료의 유전 정보를 분석하는 제 1 연산부; 상기 제 1 연산부의 결과와 목적하는 기준 염색체의 서열을 대조하는 제 2 연산부; 상기 제 2 연산부의 대조결과로부터 염색체 구조변이를 검출하는 검출부; 및
상기 검출부로부터 수득된 염색체 구조변이를 절단점(breaking point)를 중심으로 노드(node) 및 엣지(edge)로 정의하여 출력하는 출력부를 포함하는 염색체 구조변이 검출 장치 및 이의 제조방법에 관한 것이다. 본 발명의 장치를 통하여, 목적하는 시료의 유전정보의 변이를 보다 정확하게 정의하여 자료를 구축함으로써, 변이에 관한 정보를 유형화할 수 있고, 대량 자료를 용이하게 구축할 수 있다
The present invention is obtained by obtaining a sample of the target; A first calculating unit analyzing genetic information of a sample; A second operation unit for collating a result of the first operation unit with a sequence of a target reference chromosome; A detector for detecting a chromosomal structural variation from the collation result of the second calculator; And
The present invention relates to a chromosome structural variation detection device and a method for manufacturing the same, including an output unit defining and outputting a chromosomal structural variation obtained from the detection unit as a node and an edge around a breaking point. Through the apparatus of the present invention, by more accurately defining the variation of the genetic information of the desired sample to construct the data, the information on the variation can be categorized and a large amount of data can be easily constructed.

Description

염색체 구조변이 검출 장치 및 이의 제조방법 {An apparatus for detecting structural variation of chromosome and a method of manufacturing the same}An apparatus for detecting structural variation of chromosome and a method of manufacturing the same

본 발명은 염색체 구조변이 검출 장치 및 이의 제조방법에 관한 것이다.The present invention relates to a chromosome structural variation detection device and a method of manufacturing the same.

인간 유전체 프로젝트가 완료된 후 인간의 DNA 염기서열이 해독되고 이로부터 인간 유전자의 다양한 기능들이 밝혀지고 있다. 특히, 다양한 유전자 변이들이 발견되어 이것들이 인간의 형질의 차이를 일으킬 뿐만 아니라, 특정 질병의 원인으로 작용될 수 있음이 밝혀짐에 따라 인간 유전체 분석 연구는 점점 더 가속화 되어가고After the completion of the human genome project, the DNA sequences of humans are deciphered and the various functions of human genes are revealed. In particular, research into human genomes is accelerating as a variety of genetic variations have been discovered that can not only cause differences in human traits, but can also cause specific diseases.

있다. 하지만, 인간 유전체에서 발생할 수 있는 방대한 유전적 변이 중 어떠한 변이가 실질적으로 병인이 될 수 있는 것인가를 밝혀내는 데에는 어려움이 있을 수 밖에 없다.have. However, it is difficult to find out which of the vast genetic variations that can occur in the human genome can be the actual etiology.

차세대 시퀀싱 기술(NGS, Next Generation Sequencing)이 발달함에 따라 개별 인간의 전체 유전체의 염기 서열 해독이 가능하게 되었고, 질병군과 정상군의 염기서열 및 변이 비교 분석 방법을 통하여 질병 특이적 유전자 변이를 추출하는 것도 가능하게 되었다. 또한, 형질에 관련된 마커를 선별하고 뉴클레오티드 수준에 기존의 변이를 확인하며 표적 뉴클레오티드 교환에 의해 상기 마커의 불변 부위의 위치들에서 하나 또는 그 이상의 뉴클레오티드의 도입으로 선별가능한 마커를 도입하여 고유한 분자 마커들의 생성을 위한 방법을 활용하기도 하였다(KR 제 10-2011-0094268호 참조). 그러나 다양한 구조 변이 타입을 정확하게 유형화하고 도식화하는 방법이 없어서 이를 대량으로 자료관리 및 새로운 정보 수득이 어려움이 있었다. 이러한 문제를 해결하고자 발명자는 본 발명을 완성하였다.With the development of Next Generation Sequencing (NGS), it is possible to decipher the entire genome of individual human genomes, and to extract disease-specific gene mutations through the comparative analysis of nucleotide sequences and mutations between disease and normal groups. It also became possible. In addition, unique molecular markers can be selected by selecting markers related to traits, identifying existing variations at the nucleotide level, and introducing selectable markers by introduction of one or more nucleotides at positions of the constant region of the marker by target nucleotide exchange. A method for the production of these plants was also used (see KR 10-2011-0094268). However, since there is no method to accurately type and diagram various types of structural variation, it is difficult to manage data and obtain new information in large quantities. In order to solve this problem, the inventors have completed the present invention.

본 발명은 염색체의 변이 정보를 유형화하고, 이를 대량으로 정보 구축하기 위하여 절단점을 기초로하여 노드(node) 및 엣지(edge)로 정의하여 표현하는 염색체 구조변이 검출 장치 및 이의 제조방법을 제공하는 것을 목적으로 한다.
The present invention provides a chromosome structural variation detection device and a method for manufacturing the same, which are defined as nodes and edges based on a cutting point in order to type mutant information of chromosomes and construct a large amount of information. For the purpose of

또한, 본 발명은 염색체 변이 정보의 절단점을 기초로 하여 노드(node) 및 엣지(edge)로 정의하여 출력하는 염색체 구조변이에 관한 정보를 제공하는 것을 목적으로 한다.In addition, an object of the present invention is to provide information on the chromosomal structural variation that is defined and outputted as a node (edge) and the edge (edge) based on the cutting point of the chromosomal variation information.

일 구체예에서, 목적대상의 시료를 수득하는 수득부; 시료의 유전 정보를 분석하는 제 1 연산부; 상기 제 1 연산부의 결과와 목적하는 기준 염색체의 서열을 대조하는 제 2 연산부; 상기 제 2 연산부의 대조결과로부터 염색체 구조변이를 검출하는 검출부; 및 상기 검출부로부터 수득된 염색체 구조변이를 절단점(breaking point)를 중심으로 노드(node) 및 엣지(edge)로 정의하여 출력하는 출력부를 포함하는 염색체 구조변이 검출 장치을 제공한다. 상기 구체예에서, 목적대상의 시료는 인간의 혈액임을 특징으로 하는 염색체 구조변이 검출 장치를 제공하고, 노드는 염색체의 번호 및 구조변이 위치를 포함하는 염색체 구조변이 검출 장치를 제공하며, 엣지는 절단점 및 오더(order)를 포함하는 염색체 구조변이 검출 장치를 제공하며, 엣지는 1개 내지 3개의 절단점 중 어느 하나 이상을 포함하는 염색체 구조변이 검출 장치를 제공하며, 오더는 제 1오더 및 제 2 오더를 포함하는 염색체 구조변이 검출 장치를 제공하며, 오더는 0 및 1로 표시되는 염색체 구조변이 검출 장치를 제공를 제공하며, 제 1 오더 및 제 2 오더의 조합으로 방향성이 생기는 염색체 구조변이 검출 장치를 제공하며, 방향성은 양쪽성, 우측, 좌측 및 무방향성 중 어느 하나인 염색체 구조변이 검출 장치를 제공하며, 절단점은 절단 리드 및 비정형 리드 쌍 정보를 이용하여 구조 변이의 절단점을 검출하는 염색체 구조변이 검출 장치를 제공하며, 염색체 구조변이란 염색체 상에서 유전자가 결실, 삽입, 역위 및 염색체 전위 중 어느 하나인 염색체 구조변이 검출 장치를 제공한다.
In one embodiment, the obtaining unit for obtaining a sample of the target; A first calculating unit analyzing genetic information of a sample; A second operation unit for collating a result of the first operation unit with a sequence of a target reference chromosome; A detector for detecting a chromosomal structural variation from the collation result of the second calculator; And it provides a chromosomal structural variation detection device including an output unit for defining and outputting the chromosomal structural variation obtained from the detection unit as a node (node) and the edge (edge) around the breaking point (breaking point). In the above embodiment, the sample of interest provides a chromosomal structural variation detection device, characterized in that the human blood, the node provides a chromosomal structural variation detection device comprising the number and structural variation position of the chromosome, the edge is cut Provided is a chromosomal structural variation detection device comprising a point and an order, wherein the edge provides a chromosomal structural variation detection device including any one or more of one to three cutting points, wherein the order is the first order and the first Provided is a chromosomal structural variation detection device comprising two orders, wherein the order provides a chromosomal structural variation detection device represented by 0 and 1, wherein the chromosomal structural variation detection device is directed by a combination of the first and second orders. The present invention provides a device for detecting a chromosomal structural variation, wherein the directionality is any one of amphoteric, right, left, and non-directional, and the cleavage point is a cleavage point. And a chromosomal structural variation detection device for detecting a cleavage point of the structural variation using atypical read pair information, wherein the chromosomal structural variation is a chromosomal structural variation detection device having any one of gene deletion, insertion, inversion, and chromosomal translocation on a chromosome. to provide.

일 구체예에서, 목적대상의 시료를 수득하는 수득부; 시료의 유전 정보를 분석하는 제 1 연산부; 상기 제 1 연산부의 결과와 목적하는 기준 염색체의 서열을 대조하는 제 2 연산부; 상기 제 2 연산부의 대조결과로부터 염색체 구조변이를 검출하는 검출부; 및 상기 검출부로부터 수득된 염색체 구조변이를 절단점(breaking point)를 중심으로 노드(node) 및 엣지(edge)로 정의하여 출력하는 출력부를 결합하여 염색체 구조변이 검출 장치를 제조하는 방법을 제공한다.
In one embodiment, the obtaining unit for obtaining a sample of the target; A first calculating unit analyzing genetic information of a sample; A second operation unit for collating a result of the first operation unit with a sequence of a target reference chromosome; A detector for detecting a chromosomal structural variation from the collation result of the second calculator; And it provides a method for producing a chromosome structural variation detection apparatus by combining the output unit to define and output the chromosomal structural variation obtained from the detection unit (node) and the edge (edge) around the breaking point (breaking point).

일 구체예에서, 목적대상의 시료를 수득하는 단계; 시료의 유전 정보를 분석하는 단계; 상기 분석하는 단계로부터 수득된 결과와 목적하는 기준 염색체의 서열을 대조하는 단계; 상기 대조하는 단계로부터 수득된 결과로부터 염색체 구조변이를 절단점(breaking point)를 중심으로 노드(node) 및 엣지(edge)로 표현하는 단계를 포함하는 염색체 구조변이에 관한 정보를 제공하는 방법을 제공한다.
In one embodiment, obtaining a sample of interest; Analyzing the genetic information of the sample; Contrasting the result obtained from the analyzing step with the sequence of the desired reference chromosome; It provides a method for providing information about the chromosomal structural variation comprising the step of expressing the chromosomal structural variation as a node (edge) and edge around the breaking point from the results obtained from the contrasting step do.

본 발명에서, “절단점”이란 염색체 내에서 유전자가 삽입, 결실, 전좌, 역위 등 유전 변이로 인하여 정상인의 염색체와 달리 절단이 발생한 지점을 말하며, 리드 맵핑을 한 후에 절단 리드 및 비정형 리드 쌍 정보를 이용하여 구조 변이의 절단지점을 찾을 수 있다.
In the present invention, the “cutting point” refers to a point at which cleavage occurs unlike a chromosome of a normal person due to genetic mutations such as insertion, deletion, translocation, and inversion in a chromosome. We can find the cut point of the structural variation using.

본 발명에서, “노드(node)”란 절단점의 염색체 번호 및 구조변이 위치에 관한 정보를 포함하는 것으로 다수의 절단점을 포함할 수 있다.
In the present invention, the term "node" includes information on the chromosome number and structural variation position of the cutting point, and may include a plurality of cutting points.

본 발명에서, “엣지(edge)”이란 절단점간의 관계를 지칭하는 말로, 컨티그(contig), 오더(order) 또는 링크(link)로 표현되기 하는데, 절단점 간의 방향성을 결정한다.
In the present invention, the term "edge" refers to a relationship between cutting points, which is expressed as a contig, an order, or a link, and determines the direction between the cutting points.

본 발명에서, “오더(order)”이란 절단점 간의 방향성을 구체적인 값으로 표현한 것으로 하나의 엣지가 염색체상 서로 다른 위치에 표시되고, 상호 배타적으로 매칭과 미매칭(소프트 클리핑:soft clipped)상태가 나타날 경우 매칭-미매칭 순서 상태를 오더 1으로 표시하고, 미매칭-매칭 순서 상태를 오더 0로 표시한다(도 8 참조).
In the present invention, the "order" is expressed as a specific value of the direction between the cutting point, one edge is displayed at different positions on the chromosome, mutually exclusive matching and unmatched (soft clipped) state If present, the match-matching order state is indicated by order 1, and the match-matching order state is indicated by order 0 (see FIG. 8).

본 발명에서, “염색체 구조변이”이란 유전자가 이에 한정하지는 않지만 삽입, 결실, 전좌, 역위 등 유전적인 변동으로 인하여 정상인의 염색체와 유전 정보가 달라지는 것을 말한다.
In the present invention, "chromosomal structural variation" means that genes are not limited thereto, but the chromosome and genetic information of a normal person are changed due to genetic variation such as insertion, deletion, translocation, and inversion.

본 발명의 “그래프 작성”은 절단점과 엣지의 오더값에 따라서 작성되고, 절단점과 절단점을 오더값 1에서 오더값 0으로 연결한다(도 9 및 도 1 내지 7 참조).
"Graph making" of the present invention is created according to the order values of the cutting point and the edge, and connects the cutting point and the cutting point from the order value 1 to the order value 0 (see FIGS. 9 and 1 to 7).

본 발명의 “리더(read)”란 목적하는 시료의 유전정보를 증폭한 서열 단편으로, 임의적으로 리더 A, 리더 B와 같이 구분하여 표현할 수 있다.
"Read" of the present invention is a sequence fragment obtained by amplifying the genetic information of the desired sample, and can be arbitrarily expressed like leader A and leader B.

본 발명의 장치 및 정보 제공방법을 통하여, 목적하는 시료의 유전정보의 변이를 보다 정확하게 정의하여 자료를 구축함으로써, 변이에 관한 정보를 유형화할 수 있고, 대량 자료를 용이하게 구축할 수 있다. 또한, 절단점간의 관계를 용이하게 파악할 수 있고, 종래의 발견되지 못한 절단점을 검출할 수 있을 뿐만 아니라, 이의 패턴에 관한 정보를 제공할 수 있다.
Through the apparatus and the information providing method of the present invention, by more accurately defining the variation of the genetic information of the desired sample to construct the data, the information on the variation can be categorized and a large amount of data can be easily constructed. In addition, it is possible to easily grasp the relationship between the cutting points, to detect a conventional undiscovered cutting point, and to provide information about the pattern thereof.

도 1은 절단점에 신규한 서열이 삽입된 경우 매칭 상태와 절단점 및 엣지를 이용하여 그래프로 표현한 그림이다.
도2는 절단점에 서열이 결실된 경우 매칭 상태와 절단점 및 엣지를 이용하여 그래프로 표현한 그림이다.
도3는 절단점에 신규한 서열이 거꾸로 삽입된 경우 매칭상태와 절단점 및 엣지를 이용하여 그래프로 표현한 그림이다.
도4는 절단점에 동일한 염색체 내에서 서열이 이동하는 경우(Internal Translocation) 매칭상태와 절단점 및 엣지를 이용하여 그래프로 표현한 그림이다.
도5 내지 7은 절단점에 상이한 염색체간에 서열이 이동하는 경우(Cross Translocation) 매칭상태와 절단점 및 엣지를 이용하여 그래프로 표현한 그림이다.
도 8은 절단점과 매칭오더와 관계를 보여주는 그림이다.
도 9는 절단점과 매칭오더를 통하여 작성된 그래프의 일 구체예이다.
Figure 1 is a graphical representation of the matching state, the cutting point and the edge when the new sequence is inserted into the cutting point.
Figure 2 is a graphical representation of the matching state, the cut point and the edge when the sequence is deleted at the cut point.
Figure 3 is a graphical representation of the matching state, the cutting point and the edge when the new sequence is inserted backwards at the cutting point.
FIG. 4 is a graphical representation of a sequence using a matching state, a cutting point, and an edge when a sequence moves within a chromosome identical to the cutting point.
5 to 7 are graphs expressed by using a matching state, a cutting point and an edge when a sequence is moved between different chromosomes at a cutting point.
8 is a diagram showing a relationship between a cutting point and a matching order.
9 is a specific example of the graph created through the cutting point and the matching order.

이하, 본 발명의 구성요소와 기술적 특징을 다음의 실시예들을 통하여 보다 상세하게 설명하고자 한다. 그러나 하기 실시예들은 본 발명의 내용을 예시하는 것일 뿐 발명의 범위가 실시예에 의해 한정되는 것은 아니다.
Hereinafter, the components and technical features of the present invention will be described in more detail with reference to the following examples. However, the following examples are merely to illustrate the content of the present invention is not limited to the scope of the invention.

본원에 기재된 다양한 구체예가 도면을 참조로 기재된다. 하기 설명에서, 본 발명의 완전한 이해를 위해서, 다양한 특이적 상세사항, 예컨대, 특이적 형태, 조성물, 및 공정 등이 기재되어 있다. 그러나, 특정의 구체예는 이들 특이적 상세 사항 중 하나 이상 없이, 또는 다른 공지된 방법 및 형태와 함께 실행될 수 있다. 다른 예에서, 공지된 공정 및 제조 기술은 본 발명을 불필요하게 모호하게 하지 않게 하기 위해서, 특정의 상세사항으로 기재되지 않는다. "한 가지 구체예" 또는 "구체예"에 대한 본 명세서 전체를 통한 참조는 구체예와 결부되어 기재된 특별한 특징, 형태, 조성 또는 특성이 본 발명의 하나 이상의 구체예에 포함됨을 의미한다. 따라서, 본 명세서 전체에 걸친 다양한 위치에서 표현 "한 가지 구체예에서" 또는 "구체예"의 상황은 반드시 본 발명의 동일한 구체예를 나타내지는 않는다. 추가로, 특별한 특징, 형태, 조성, 또는 특성은 하나 이상의 구체예에서 어떠한 적합한 방법으로 조합될 수 있다.
Various embodiments described herein are described with reference to the drawings. In the following description, for a thorough understanding of the present invention, various specific details are described, such as specific forms, compositions, processes and the like. However, certain embodiments may be practiced without one or more of these specific details, or in conjunction with other known methods and forms. In other instances, well known processes and manufacturing techniques have not been described in particular detail in order to not unnecessarily obscure the present invention. Reference throughout this specification to "one embodiment" or "embodiment" means that a particular feature, form, composition or characteristic described in connection with the embodiment is included in one or more embodiments of the invention. Thus, the context of the expression “in one embodiment” or “embodiment” in various places throughout this specification does not necessarily represent the same embodiment of the invention. In addition, particular features, forms, compositions, or properties may be combined in any suitable manner in one or more embodiments.

염색체 내에서 유전변이가 일어난 경우에, 이를 절단점 및 매칭 오더값인 0 및 1로 유전변이의 삽입, 결실, 역위, 내부 전좌 및 외부 전좌를 그래프로 표현할 수 있다.
When a genetic mutation occurs in the chromosome, the insertion point, deletion, inversion, internal translocation, and external translocation of the genetic mutation can be graphically represented as the cutting point and the matching order values 0 and 1.

염색체 상에 신규한 서열이 삽입된 경우 1개의 절단점이 발생하고, 기준 서열과 목적하는 서열인 리드를 기준 서열에 대응시켜서 매칭되는 상태에 따라서, 0 또는 1의 값을 줄 수 있으며, 이를 기초로 도 1의 우측 그래프와 같이 표현할 수 있다.
When a new sequence is inserted on a chromosome, one break point occurs, and a value of 0 or 1 may be given according to a matching state by matching a reference sequence and a read sequence, which is a desired sequence, to the reference sequence. It can be expressed as shown in the graph to the right of FIG.

염색체 상에서 서열이 결실된 경우 2개의 절단점이 발생하고, 2개의 절단점에서는 기준 서열과 시료의 리드 서열이 매칭이 되지 않게 되며 이에 따라서 0 또는 1의 값이 부여되고, 이를 2개의 절단점과 매칭상태의 값을 도 2의 우측 그래프와 같이 표현할 수 있다.
When the sequence is deleted on the chromosome, two cleavage points occur, and at the two cleavage points, the reference sequence and the lead sequence of the sample do not match, and thus a value of 0 or 1 is assigned, and the two match points are matched. The state value can be expressed as shown in the graph to the right of FIG. 2.

염색체 상에서 신규한 서열이 거꾸로 삽입된 경우, 2개의 절단점이 발생되고, 절단점간의 서열에 대하여 매칭은 되지만 2개의 절단점 외부에서는 매칭이 안되는 리드와 2개의 절단점 외부에서는 매칭이 되지만 절단점 간에는 매칭이 안되는 리드가 존재하게 되며, 이를 도 3의 우측과 같이 표현할 수 있고, 이 경우 2개의 엣지를 가지게 된다.
When a new sequence is inserted upside down on the chromosome, two cleavage points are generated and a match is made for the sequence between the cleavage points but not outside the two cleavage points, but outside the two cleavage points, but a match is made between the cleavage points. There is a lead that does not match, which can be expressed as shown in the right side of Figure 3, in this case has two edges.

동일한 염색체 상에서 서열이 이동된 경우 3개의 절단점이 발생하고, 2개의 엣지를 가지게 된다(도 4 참조).When the sequence is shifted on the same chromosome, three cleavage points occur and have two edges (see FIG. 4).

상이한 염색체상에서 서열이 이동된 경우 2개의 절단점이 발생하고, 2개의 엣지를 가지게 된다(도 5 내지 도 6 참조).
When the sequence is shifted on different chromosomes, two cleavage points occur and have two edges (see FIGS. 5-6).

일 구체예에서, 유전자가 삽입된 경우 도 1의 우측 그림과 같이, 절단점 및 이를 연결한 선으로 표현되고, 하기와 같이 전산상 DB에 저장될 수 있다In one embodiment, when the gene is inserted, it is represented by a cutting point and a line connecting the same as shown in the right figure of FIG. 1, and may be stored in a computational database as follows.

노드 Node BP_att1 BP_att1 BP_att2 BP_att2 BP1 BP1 Chr1 Chr1 123456 123456

엣지 edge BP1 BP1 오더 1 Order 1 리드A Lead A BP1 BP1 1One 리드B Lead B BP1 BP1 00

이때, At this time,

BP1은 노드상의 임의의 절단점이고,BP1 is any break point on the node,

BP_att1 및 BP_att1는 염색체 번호 및 구조변이 위치에 관한 정보이며,BP_att1 and BP_att1 are information about the chromosome number and the position of the structural variation.

리드 A 및 B는 목적하는 시료의 유전정보를 증폭한 서열 단편이며,Read A and B are sequence fragments amplified genetic information of the desired sample,

오더값 1은 절단점 간의 방향성을 구체적인 값으로, 예를 들어 값이 1인 경우 매칭-미매칭의 순서이고, 오더값 0은 미매칭-매칭의 순서이다.
Order value 1 is a specific value of the direction between the cutting points, for example, a value of 1 is an order of matching-unmatching, and an order value of 0 is an order of mismatching-matching.

일 구체예에서, 결실은 도 2의 우측 그림과 같이, 절단점 2개 및 이를 연결한 선으로 표현되고, 하기와 같이 전산상 DB에 저장될 수 있다In one embodiment, the deletion is represented by two cutting points and a line connecting the same, as shown in the right figure of FIG. 2, and may be stored in the computational database as follows.

노드 Node BP_att1 BP_att1 BP_att2 BP_att2 BP1 BP1 Chr1 Chr1 123456 123456 BP2 BP2 Chr1 Chr1 4567890 4567890

엣지 edge BP1 BP1 BP2 BP2 오더 1 Order 1 오더2 Order 2 리드A Lead A BP1 BP1 BP2 BP2 1 One 0 0

이때, At this time,

BP1 및 BP2는 노드상의 임의의 절단점이고,BP1 and BP2 are arbitrary breakpoints on the node,

BP_att1 및 BP_att1는 염색체 번호 및 구조변이 위치에 관한 정보이며,BP_att1 and BP_att1 are information about the chromosome number and the position of the structural variation.

리드 A는 목적하는 시료의 유전정보를 증폭한 서열 단편이며,Read A is a sequence fragment amplified genetic information of the desired sample,

오더값 1은 절단점 간의 방향성을 구체적인 값으로, 예를 들어 값이 1인 경우 매칭-미매칭의 순서이고, 오더값 0은 미매칭-매칭의 순서이다.
Order value 1 is a specific value of the direction between the cutting points, for example, a value of 1 is an order of matching-unmatching, and an order value of 0 is an order of mismatching-matching.

일 구체예에서, 역위는 도 3의 우측 그림과 같이, 절단점 2개 및 이를 연결한 선으로 표현되고, 하기와 같이 전산상 DB에 저장될 수 있다In one embodiment, the inversion is represented by two cutting points and a line connecting the same, as shown in the right figure of FIG. 3, and may be stored in the computational database as follows.

노드 Node BP_att1 BP_att1 BP_att2 BP_att2 BP1 BP1 Chr1 Chr1 123456 123456 BP2 BP2 Chr1 Chr1 4567890 4567890

엣지 edge BP1 BP1 BP2 BP2 오더 1Order 1 오더2 Order 2 리드A Lead A BP1 BP1 BP2 BP2 1One 1One 리드BLead B BP1 BP1 BP2 BP2 0 0 0 0

이때, At this time,

BP1 및 BP2는 노드상의 임의의 절단점이고,BP1 and BP2 are arbitrary breakpoints on the node,

BP_att1 및 BP_att1는 염색체 번호 및 구조변이 위치에 관한 정보이며,BP_att1 and BP_att1 are information about the chromosome number and the position of the structural variation.

리드 A 및 B는 목적하는 시료의 유전정보를 증폭한 서열 단편이며,Read A and B are sequence fragments amplified genetic information of the desired sample,

오더값 1은 절단점 간의 방향성을 구체적인 값으로, 예를 들어 값이 1인 경우 매칭-미매칭의 순서이고, 오더값 0은 미매칭-매칭의 순서이다.
Order value 1 is a specific value of the direction between the cutting points, for example, a value of 1 is an order of matching-unmatching, and an order value of 0 is an order of mismatching-matching.

일 구체예에서, 동일한 염색체 내에서 서열이 이동하는 경우 도 4의 우측 상단 그림과 같이, 절단점 3개 및 이를 연결한 선으로 표현되고, 하기와 같이 전산상 DB에 저장될 수 있다In one embodiment, when the sequence is shifted within the same chromosome, as shown in the upper right picture of Figure 4, it is represented by three cutting points and a line connecting them, it can be stored in a computerized database as follows

노드 Node BP_att1 BP_att1 BP_att2 BP_att2 BP1 BP1 Chr1 Chr1 111111 111111 BP2 BP2 Chr1 Chr1 200000 200000 BP3 BP3 Chr1 Chr1 200100 200100

엣지 edge BP1 BP1 BP2 BP2 오더1 Order 1 오더2 Order 2 리드ALead A BP1 BP1 BP2 BP2 1 One 0 0 리드BLead B BP1 BP1 BP3 BP3 0 0 1 One

이때, At this time,

BP1, BP2 및 BP3는 노드상의 임의의 절단점이고,BP1, BP2 and BP3 are any breakpoints on the node,

BP_att1 및 BP_att1는 염색체 번호 및 구조변이 위치에 관한 정보이며,BP_att1 and BP_att1 are information about the chromosome number and the position of the structural variation.

리드 A 및 B는 목적하는 시료의 유전정보를 증폭한 서열 단편이며,Read A and B are sequence fragments amplified genetic information of the desired sample,

오더값 1은 절단점 간의 방향성을 구체적인 값으로, 예를 들어 값이 1인 경우 매칭-미매칭의 순서이고, 오더값 0은 미매칭-매칭의 순서이다.
Order value 1 is a specific value of the direction between the cutting points, for example, a value of 1 is an order of matching-unmatching, and an order value of 0 is an order of mismatching-matching.

일 구체예에서, 동일한 염색체 내에서 서열이 역위로 이동하는 경우 도 4의 우측 하단 그림과 같이, 절단점 3개 및 이를 연결한 선으로 표현되고, 하기와 같이 전산상 DB에 저장될 수 있다In one embodiment, when the sequence is reversed in the same chromosome, as shown in the lower right of Figure 4, it is represented by three cutting points and a line connecting them, it can be stored in a computational database as follows

노드 Node BP_att1 BP_att1 BP_att2 BP_att2 BP1 BP1 Chr1 Chr1 111111 111111 BP2 BP2 Chr1 Chr1 200000 200000 BP3 BP3 Chr1 Chr1 200100 200100

엣지 edge BP1 BP1 BP2 BP2 오더 1Order 1 오더2Order 2 리드A Lead A BP1 BP1 BP3 BP3 1One 1One 리드BLead B BP1 BP1 BP2 BP2 00 00

이때, At this time,

BP1, BP2 및 BP3는 노드상의 임의의 절단점이고,BP1, BP2 and BP3 are any breakpoints on the node,

BP_att1 및 BP_att1는 염색체 번호 및 구조변이 위치에 관한 정보이며,BP_att1 and BP_att1 are information about the chromosome number and the position of the structural variation.

리드 A 및 B는 목적하는 시료의 유전정보를 증폭한 서열 단편이며,Read A and B are sequence fragments amplified genetic information of the desired sample,

오더값 1은 절단점 간의 방향성을 구체적인 값으로, 예를 들어 값이 1인 경우 매칭-미매칭의 순서이고, 오더값 0은 미매칭-매칭의 순서이다.
Order value 1 is a specific value of the direction between the cutting points, for example, a value of 1 is an order of matching-unmatching, and an order value of 0 is an order of mismatching-matching.

일 구체예에서, 상이한 염색체 내에서 서열이 이동하는 경우 도 5의 우측 그림과 같이, 절단점 2개 및 이를 연결한 선으로 표현되고, 하기와 같이 전산상 DB에 저장될 수 있다In one embodiment, when the sequence is shifted in different chromosomes, as shown in the right figure of FIG.

노드 Node BP_att1 BP_att1 BP_att2 BP_att2 BP1 BP1 Chr1 Chr1 123456 123456 BP2 BP2 Chr2 Chr2 456789 456789

엣지 edge BP1 BP1 BP2 BP2 오더 1 Order 1 오더2Order 2 리드A Lead A BP1 BP1 BP2 BP2 1 One 1 One 리드BLead B BP1 BP1 BP2 BP2 0 0 0 0

이때, At this time,

BP1 및 BP2는 노드상의 임의의 절단점이고,BP1 and BP2 are arbitrary breakpoints on the node,

BP_att1 및 BP_att1는 염색체 번호 및 구조변이 위치에 관한 정보이며,BP_att1 and BP_att1 are information about the chromosome number and the position of the structural variation.

리드 A 및 B는 목적하는 시료의 유전정보를 증폭한 서열 단편이며,Read A and B are sequence fragments amplified genetic information of the desired sample,

오더값 1은 절단점 간의 방향성을 구체적인 값으로, 예를 들어 값이 1인 경우 매칭-미매칭의 순서이고, 오더값 0은 미매칭-매칭의 순서이다.
Order value 1 is a specific value of the direction between the cutting points, for example, a value of 1 is an order of matching-unmatching, and an order value of 0 is an order of mismatching-matching.

일 구체예에서, 상이한 염색체 내에서 서열이 이동하는 경우 도 6의 우측 그림과 같이, 절단점 2개 및 이를 연결한 선으로 표현되고, 하기와 같이 전산상 DB에 저장될 수 있다In one embodiment, when the sequence is shifted in different chromosomes, as shown in the right figure of FIG.

노드 Node BP_att1 BP_att1 BP_att2 BP_att2 BP1 BP1 Chr1 Chr1 123456 123456 BP2 BP2 Chr2 Chr2 456789 456789

엣지 edge BP1 BP1 BP2 BP2 오더 1 Order 1 오더2 Order 2 리드A Lead A BP1 BP1 BP2 BP2 1 One 0 0 리드BLead B BP1 BP1 BP2 BP2 0 0 1 One

이때, At this time,

BP1 및 BP2는 노드상의 임의의 절단점이고,BP1 and BP2 are arbitrary breakpoints on the node,

BP_att1 및 BP_att1는 염색체 번호 및 구조변이 위치에 관한 정보이며,BP_att1 and BP_att1 are information about the chromosome number and the position of the structural variation.

리드 A 및 B는 목적하는 시료의 유전정보를 증폭한 서열 단편이며,Read A and B are sequence fragments amplified genetic information of the desired sample,

오더값 1은 절단점 간의 방향성을 구체적인 값으로, 예를 들어 값이 1인 경우 매칭-미매칭의 순서이고, 오더값 0은 미매칭-매칭의 순서이다.
Order value 1 is a specific value of the direction between the cutting points, for example, a value of 1 is an order of matching-unmatching, and an order value of 0 is an order of mismatching-matching.

Claims (13)

목적대상의 시료를 수득하는 수득부;
시료의 유전 정보를 분석하는 제 1 연산부;
상기 제 1 연산부의 결과와 목적하는 기준 염색체의 서열을 대조하는 제 2 연산부;
상기 제 2 연산부의 대조결과로부터 염색체 구조변이를 검출하는 검출부; 및
상기 검출부로부터 수득된 염색체 구조변이를 절단점(breaking point)를 중심으로 노드(node) 및 엣지(edge)로 정의하여 출력하는 출력부를 포함하고,
상기 엣지는 절단점 및 오더(order)를 포함하고,
상기 오더는 목적대상의 시료의 유전정보를 증폭한 서열 단편을 정열했을 때, 매칭 순서에 따라 서로 다른 오더값으로 표시되고,
상기 오더값에 따라 화살표 표시 여부 또는 화살표 방향이 결정되는 염색체 구조변이 검출 장치.
Obtaining section for obtaining a sample of the target;
A first calculating unit analyzing genetic information of a sample;
A second operation unit for collating a result of the first operation unit with a sequence of a target reference chromosome;
A detector for detecting a chromosomal structural variation from the collation result of the second calculator; And
And an output unit for defining and outputting the chromosomal structural variation obtained from the detection unit as a node and an edge around a breaking point.
The edge includes a cutting point and an order,
The order is displayed as different order values according to the matching sequence when the sequence fragments amplified the genetic information of the target sample,
Chromosome structural variation detection device that determines whether or not the arrow is displayed according to the order value.
제 1항에 있어서,
목적대상의 시료는 인간의 혈액임을 특징으로 하는 염색체 구조변이 검출 장치.
The method of claim 1,
Chromosome structural variation detection device, characterized in that the target sample is human blood.
제 1항에 있어서,
노드는 염색체의 번호 및 구조변이 위치를 포함하는 염색체 구조변이 검출 장치.
The method of claim 1,
Node is a chromosome structural variation detection device comprising a chromosome number and a structural variation position.
삭제delete 제 1항에 있어서,
엣지는 1개 내지 3개의 절단점 중 어느 하나 이상을 포함하는 염색체 구조변이 검출 장치.
The method of claim 1,
Edge detection device for chromosomal structural variation comprising any one or more of one to three cutting points.
제 1항에 있어서,
오더는 제 1오더 및 제 2 오더를 포함하는 염색체 구조변이 검출 장치.
The method of claim 1,
Order is a chromosome structural variation detection device comprising a first order and a second order.
제 1항에 있어서,
오더는 0 및 1로 표시되는 염색체 구조변이 검출 장치.
The method of claim 1,
Order is a chromosome structural variation detection device is represented by 0 and 1.
제 6항에 있어서,
제 1 오더 및 제 2 오더의 조합으로 방향성이 생기는 염색체 구조변이 검출 장치.
The method of claim 6,
An apparatus for detecting a chromosomal structural variation in which orientation occurs by combining a first order and a second order.
제 8항에 있어서,
방향성은 양쪽성, 우측, 좌측 및 무방향성 중 어느 하나인 염색체 구조변이 검출 장치.
The method of claim 8,
A device for detecting chromosomal structural alterations in which the aromaticity is any one of amphoteric, right, left and non-directional.
제 1항에 있어서,
절단점은 절단 리드 및 비정형 리드 쌍 정보를 이용하여 구조 변이의 절단점을 검출하는 염색체 구조변이 검출 장치.
The method of claim 1,
A cut point detects a cut point of a structural variation using cutting lead and atypical lead pair information.
제 1항에 있어서,
염색체 구조변이란 염색체 상에서 유전자가 결실, 삽입, 역위 및 염색체 전위 중 어느 하나인 염색체 구조변이 검출 장치.
The method of claim 1,
Chromosomal structural alteration is a chromosomal structural variation detection device, wherein any one of a gene deletion, insertion, inversion and chromosomal translocation on the chromosome.
삭제delete 목적대상의 시료를 수득하는 단계;
시료의 유전 정보를 분석하는 단계;
상기 분석하는 단계로부터 수득된 결과와 목적하는 기준 염색체의 서열을 대조하는 단계;
상기 대조하는 단계로부터 수득된 결과로부터 염색체 구조변이를 절단점(breaking point)를 중심으로 노드(node) 및 엣지(edge)로 표현하는 단계를 포함하고,
상기 엣지는 절단점 및 오더(order)를 포함하고,
상기 오더는 목적대상의 시료의 유전정보를 증폭한 서열 단편을 정열했을 때, 매칭 순서에 따라 서로 다른 오더값으로 표시되고,
상기 오더값에 따라 화살표 표시 여부 또는 화살표 방향이 결정되는 염색체 구조변이에 관한 정보를 제공하는 방법.

Obtaining a sample of interest;
Analyzing the genetic information of the sample;
Contrasting the result obtained from the analyzing step with the sequence of the desired reference chromosome;
Expressing the chromosomal structural variation as a node and an edge around a breaking point from the result obtained from the collating step,
The edge includes a cutting point and an order,
The order is displayed as different order values according to the matching sequence when the sequence fragments amplified the genetic information of the target sample,
A method for providing information on chromosomal structural variation in which an arrow is displayed or an arrow direction is determined according to the order value.

KR1020130079848A 2013-07-08 2013-07-08 An apparatus for detecting structural variation of chromosome and a method of manufacturing the same KR102082360B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130079848A KR102082360B1 (en) 2013-07-08 2013-07-08 An apparatus for detecting structural variation of chromosome and a method of manufacturing the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130079848A KR102082360B1 (en) 2013-07-08 2013-07-08 An apparatus for detecting structural variation of chromosome and a method of manufacturing the same

Publications (2)

Publication Number Publication Date
KR20150006267A KR20150006267A (en) 2015-01-16
KR102082360B1 true KR102082360B1 (en) 2020-02-27

Family

ID=52569712

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130079848A KR102082360B1 (en) 2013-07-08 2013-07-08 An apparatus for detecting structural variation of chromosome and a method of manufacturing the same

Country Status (1)

Country Link
KR (1) KR102082360B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102151716B1 (en) 2019-12-06 2020-09-04 주식회사 클리노믹스 System for providing gemetic surmane information using genomic information
KR102397822B1 (en) * 2021-11-19 2022-05-13 주식회사 클리노믹스 Apparatus and method for analyzing cells using chromosome structure and state information

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A. McPherson 외, "nFuse: Discovery of complex genomic rearrangements in cancer using high-throughput sequencing", Genome Research 22(11), 2012.11.*
J. M. Kidd 외, "A Human Genome structural Variation Sequencing Resource Reveals Insights into Mutational Mechanisms", Cell 143(5), pp.837-847, 2010.11.24.*

Also Published As

Publication number Publication date
KR20150006267A (en) 2015-01-16

Similar Documents

Publication Publication Date Title
Luebeck et al. AmpliconReconstructor integrates NGS and optical mapping to resolve the complex structures of focal amplifications
Springer et al. The gene tree delusion
Vargas et al. Conflicting phylogenomic signals reveal a pattern of reticulate evolution in a recent high‐Andean diversification (Asteraceae: Astereae: Diplostephium)
Oliveira et al. Regulation of genetic flux between bacteria by restriction–modification systems
Dassanayake et al. The genome of the extremophile crucifer Thellungiella parvula
Murray et al. The phylogeny of Rickettsia using different evolutionary signatures: how tree-like is bacterial evolution?
Yang et al. Diverse mechanisms of somatic structural variations in human cancer genomes
Maguire et al. Comparative genome analysis and gene finding in Candida species using CGOB
Markowitz et al. IMG 4 version of the integrated microbial genomes comparative analysis system
Wu et al. Most parsimonious reconciliation in the presence of gene duplication, loss, and deep coalescence using labeled coalescent trees
He et al. Genome structural evolution in Brassica crops
Boc et al. Towards an accurate identification of mosaic genes and partial horizontal gene transfers
Rajaraman et al. FPSAC: fast phylogenetic scaffolding of ancient contigs
Li et al. Complete chloroplast genomes of Zingiber montanum and Zingiber zerumbet: Genome structure, comparative and phylogenetic analyses
Friel et al. Comparative Analysis of Genotyping by Sequencing and Whole-Genome Sequencing Methods in Diversity Studies of Olea europaea L.
Yang et al. Genome-scale metabolic network validation of Shewanella oneidensis using transposon insertion frequency analysis
KR102082360B1 (en) An apparatus for detecting structural variation of chromosome and a method of manufacturing the same
Palazzo et al. Identification of Bari transposons in 23 sequenced Drosophila genomes reveals novel structural variants, MITEs and horizontal transfer
Gruenstaeudl et al. PACVr: plastome assembly coverage visualization in R
CN109949866B (en) Method and device for detecting pathogen operation group, computer equipment and storage medium
Han et al. Telomere-to-telomere and haplotype-phased genome assemblies of the heterozygous octoploid ‘Florida Brilliance’strawberry (Fragaria× ananassa)
Espinosa et al. Advancements in long-read genome sequencing technologies and algorithms
Raca et al. Disentangling Crocus series Verni and its polyploids
Spealman et al. Best practices in microbial experimental evolution: using reporters and long-read sequencing to identify copy number variation in experimental evolution
Chapal-Ilani et al. Comparing algorithms that reconstruct cell lineage trees utilizing information on microsatellite mutations

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right