KR20160082715A - Detection method of gene deletion based on next-generation sequencing - Google Patents
Detection method of gene deletion based on next-generation sequencing Download PDFInfo
- Publication number
- KR20160082715A KR20160082715A KR1020140190728A KR20140190728A KR20160082715A KR 20160082715 A KR20160082715 A KR 20160082715A KR 1020140190728 A KR1020140190728 A KR 1020140190728A KR 20140190728 A KR20140190728 A KR 20140190728A KR 20160082715 A KR20160082715 A KR 20160082715A
- Authority
- KR
- South Korea
- Prior art keywords
- gene
- deletion
- sequence
- analyzing
- sequencing
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
본 발명은 차세대 염기서열 분석법을 기반으로 하는 결실 유전자군 검출 방법에 관한 것이다.
The present invention relates to a method for detecting a deletion gene group based on a next-generation sequencing method.
인간 게놈 프로젝트가 시작된 이래로, 질병의 원인이 되는 유전자에 관한 많은 연구가 진행되었으며, 유전자의 염기 서열을 밝히기 위한 시퀀싱 기술도 계속 개발되고 있다. 최근에는, 저렴한 비용과 빠른 데이터 생산으로 인해 대용량의 짧은 서열을 생산하는 차세대 시퀀싱(NGS; Next Generation Sequencing)이 전통적인 생거(Sanger) 시퀀싱 방식을 빠르게 대체하고 있다. 차세대 시퀸싱 기술이 발전함에 따라 단편 서열을 만들어 내는 비용이 예전의 절반 이하가 되었고, 이를 질병 진단 분야에 응용할 수 있는 가용성도 증가하고 있다. 그러나 차세대 시퀀싱 기술로 사용할 수 있는 데이터의 양이 많아지면서, 대용량의 짧은 서열들을 빠른 시간에 정확하게 분석하고 처리하기 위한 기술의 필요성이 커지고 있다.Since the beginning of the human genome project, much research has been done on the genes responsible for the disease, and sequencing techniques for identifying the nucleotide sequences of the genes are being developed. In recent years, next generation sequencing (NGS), which produces large sequences of short sequences due to low cost and rapid data production, is rapidly replacing traditional Sanger sequencing. With the development of the next generation sequencing technology, the cost of producing short sequences has become less than half of what it used to be, and the availability of applications for disease diagnosis is also increasing. However, as the amount of data that can be used with the next-generation sequencing technology increases, there is a growing need for techniques for accurately analyzing and processing large sequences of short sequences in a short period of time.
시퀀싱 데이터를 분석하기 위해 가장 많이 사용되는 염기 서열 방법은 variant calling 분석 방법이나, 이는 유전자 결실 부위를 정확히 진단하지 못하는 문제점이 있다. 유전자 결실은 염색체의 일부가 유전자 재조합 과정에서 누락되어 일어나는 돌연변이로서, 유전자 발현에서 중요한 역할을 하는 유전자가 결실되었을 때 질병으로 발전하게 된다. 예를 들어, 홍체 미발달 및 각종 장기의 종양과 정신지체 증상을 나타내는 WAGR 증후군은 11번 염색체의 결실이 원인이며, 목소리가 고양이 우는 소리처럼 되고 각종 육체 및 정신 이상이 나타나는 묘성증후군은 5번 염색체의 결실이 원인이 된다. 따라서 질병의 진단을 위해, 결실 유전자 검출이 매우 중요함에도 불구하고 variant calling 분석법은 결실 유전자 검출에 한계를 보이는 것이 사실이다. 미국등록특허 제 5830665호의 경우, 유전자 결실 부위를 정확하게 진단하기 위한 기술을 기술하고 있지만, 차세대 염기서열 분석법을 기반으로 하는 것이 아니며, 유전자 결실이 의심되는 부분의 유전자만을 핵산 증폭하여 정상 유전자의 길이와 비교하는 방법으로서 유전자 결실을 검출하고 있다.The most commonly used sequencing method for analyzing sequencing data is the variant calling analysis method, which has a problem in that it can not accurately diagnose gene deletion sites. Gene deletion is a mutation that occurs when a part of the chromosome is missing in the genetic recombination process and develops into a disease when genes that play an important role in gene expression are deleted. For example, the WAGR syndrome, which is characterized by unexplored development of the iris and various organs and mental retardation, is caused by the deletion of
본 발명은 차세대 염기서열 데이터의 리드 분포도 결과를 비교함으로써 특정 유전자군의 야생형(Wild type), 이형 결실형(Hetero deletion) 및 동형 결실형(Homo deletion)을 정확하게 구분하여 진단하는 방법에 관한 것이다. 한국공개특허 제2014-0108177호에서 리드(read) 분석을 이용한 유전자 이상 진단 결정 방법에 관하여 개시하고 있으나, 리드(read) 서열들의 두께 분포(depth distribution) 및 GC 함량을 이용하여 분석한다는 점에서 본원 발명과는 차이가 있다.
The present invention relates to a method for precisely distinguishing wild type, heterotypic deletion type and homo deletion type of a specific gene group by comparing results of lead distribution of next generation nucleotide sequence data. Korean Patent Laid-Open Publication No. 2014-0108177 discloses a method for determining the diagnosis of a gene abnormality using a read analysis. However, in view of analyzing the depth distribution and the GC content of read sequences, It differs from the invention.
본 발명은 상기와 같은 종래의 기술상의 문제점을 해결하기 위해 안출된 것으로, 야생형(Wild type), 이형 결실형(Hetero deletion) 및 동형 결실형(Homo deletion)을 정확하게 구분하여 진단하는 차세대 염기서열 분석법을 기반으로 하는 결실 유전자군 검출 방법에 관한 것이다.Disclosure of Invention Technical Problem [8] Accordingly, the present invention has been made keeping in mind the above problems occurring in the prior art, and it is an object of the present invention to provide a novel method for sequencing a wild type, a hetero- To a method for detecting a deletion gene group based on the same.
그러나 본 발명이 이루고자 하는 기술적 과제는 이상에서 언급한 과제에 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당 업계에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
However, the technical problem to be solved by the present invention is not limited to the above-mentioned problems, and other matters not mentioned can be clearly understood by those skilled in the art from the following description.
이하, 본원에 기재된 다양한 구체예가 도면을 참조로 기재된다. 하기 설명에서, 본 발명의 완전한 이해를 위해서, 다양한 특이적 상세사항, 예컨대, 특이적 형태, 조성물 및 공정 등이 기재되어 있다. 그러나, 특정의 구체예는 이들 특이적 상세 사항 중 하나 이상 없이, 또는 다른 공지된 방법 및 형태와 함께 실행될 수 있다. 다른 예에서, 공지된 공정 및 제조 기술은 본 발명을 불필요하게 모호하게 하지 않게 하기 위해서, 특정의 상세사항으로 기재되지 않는다. "한 가지 구체예" 또는 "구체예"에 대한 본 명세서 전체를 통한 참조는 구체예와 결부되어 기재된 특별한 특징, 형태, 조성 또는 특성이 본 발명의 하나 이상의 구체예에 포함됨을 의미한다. 따라서, 본 명세서 전체에 걸친 다양한 위치에서 표현된 "한 가지 구체예에서" 또는 "구체예"의 상황은 반드시 본 발명의 동일한 구체예를 나타내지는 않는다. 추가로, 특별한 특징, 형태, 조성, 또는 특성은 하나 이상의 구체예에서 어떠한 적합한 방법으로 조합될 수 있다.
Hereinafter, various embodiments described herein will be described with reference to the drawings. In the following description, for purposes of complete understanding of the present invention, various specific details are set forth, such as specific forms, compositions and processes, and the like. However, certain embodiments may be practiced without one or more of these specific details, or with other known methods and forms. In other instances, well-known processes and techniques of manufacture are not described in any detail, in order not to unnecessarily obscure the present invention. Reference throughout this specification to "one embodiment" or "embodiment" means that a particular feature, form, composition, or characteristic described in connection with the embodiment is included in at least one embodiment of the invention. Accordingly, the appearances of the phrase " in one embodiment "or" an embodiment "in various places throughout this specification are not necessarily indicative of the same embodiment of the present invention. In addition, a particular feature, form, composition, or characteristic may be combined in any suitable manner in one or more embodiments.
명세서에서 특별한 정의가 없으면 본 명세서에 사용된 모든 과학적 및 기술적인 용어는 본 발명이 속하는 기술분야에서 당업자에 의하여 통상적으로 이해되는 것과 동일한 의미를 가진다.
Unless defined otherwise in the specification, all scientific and technical terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs.
본 발명의 일 구체예에서 “차세대 염기서열 분석법”이란, 짧은 시간 내에 분석대상이 되는 시료에 대해 대량의 염기서열의 판독이 가능하고 대량의 염기서열 데이터를 생성할 수 있는 신개념의 염기서열 분석 기술로서, 예를 들어 로슈/454, 일루미나(Illumina)/Solexa 및 SOLiD와 같은 장비를 이용한 이용한 염기서열 분석기술 등을 들 수 있다(Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January 2010). 차세대 염기서열 분석 과정은 하기의 3단계로 구분될 수 있다.In the embodiment of the present invention, the term " next generation nucleotide sequence analysis method " refers to a new concept of nucleotide sequence analysis technology capable of reading a large amount of nucleotide sequence to a sample to be analyzed within a short time and generating a large amount of nucleotide sequence data Sequencing techniques such as those using Roche / 454, Illumina / Solexa and SOLiD (Michael L. Metzker, Aplications of the next-generation sequencing, Sequencing technologies the next generation , Nature Reviews Genetics, Vol.11, pp31-46, January 2010). The next generation sequencing process can be divided into the following three steps.
(1) 엑솜의 포획(One) Capture of exome
질병의 원인 유전자를 찾기 위하여 차세대 염기서열 분석법을 이용해 전장유전체(Whole-genome)를 시퀀싱하거나 엑솜 영역만을 목표로 하여 시퀀싱할 수 있다(Targeted sequencing). 엑솜 영역만을 시퀀싱하는 경우에는 비용이나 효율성 측면에서 유리하다. 또한 유전자의 변화가 암과 같은 직접적인 질병으로 나타나는 경우가 많기 때문에 엑솜 영역에서의 염기서열의 변화를 보는 것이 원인 유전자를 찾는데 효과적이라고 할 수 있다. 엑솜만을 시퀀싱하기 위해서는 엑솜만 포획할 수 있는 라이브러리가 필요하다. 가장 많이 사용되는 것이 SureSelect Human All Exon Kits(http:// www.genomics.agilent.com)이나, 이에 한정하는 것은 아니다. SureSelect Human All Exon Kits는 CCDS(Consensus CDS, NCBI, EBI, UCSC, Wellcome Trust Sanger Institute가 참여하여 정의한 인간 유전체의 유전자 세트) 엑손을 기초로 디자인 되었으며, 인간유전체의 1.22%에 해당하는 영역을 포함하고 있다.Targeted sequencing can be sequenced by sequencing whole genomes or only exosomes using next-generation sequencing to find the causative genes of the disease. Sequencing only the exosome region is advantageous in terms of cost and efficiency. In addition, since changes in genes are frequently seen as direct diseases such as cancer, changes in the nucleotide sequence in the exosomal region may be effective in locating the causative genes. In order to sequence only exomes, you need a library that can capture exomes only. The most commonly used is, but not limited to, SureSelect Human All Exon Kits (http: // www.genomics.agilent.com). The SureSelect Human All Exon Kits were designed based on the exons of the human genome set by CCDS (Consensus CDS, NCBI, EBI, UCSC and Wellcome Trust Sanger Institute) and contain 1.22% of the human genome have.
(2) 대용량 병렬 DNA 시퀀싱(2) High-capacity parallel DNA sequencing
차세대 서열확인법(Next Generation Sequencing: NGS)은 기존의 모세관 서열확인법(capillary sequencing)에 비해서 빠르면서 한 번에 더 많은 양의 서열확인을 수행할 수 있고, 기존의 모세관 서열확인법에 사용하는 벡터를 이용한 시료의 증폭 과정이 생략되기 때문에 이 과정에서 발생하는 실험적인 오류를 피할 수 있다는 장점이 있다. 현재 3곳의 회사에서 제작한 NGS 시스템이 주로 사용되고 있다. 2004년에 출시된 로슈(Roche)사의 454 GS FLX는 처음 소개된 NGS 장비로, 이 장치는 피로시퀀싱(pyrosequencing) 방법과 유화제-중합효소반응(emulsion-polymerase chain reaction)을 사용하여 서열확인을 수행하고, 실험의 최종단계에서 나오는 빛의 세기에 따라서 특정 염기를 확인할 수 있다. 7시간 가동시켰을 때 100Mb 정도의 서열을 확인할 수 있는데, 기존의 ABI 3730 기기가 같은 시간에 440kb의 서열을 확인할 수 있는 것에 비해서 월등히 높은 성능을 나타낸다. 일루미나(Illumina)사의 Illimina Genome Analyzer는 합성에 의한 서열확인(sequencing by synthesis)이라는 개념을 도입한 것으로, 유리판 위에 한 가닥만으로 이루어진 DNA 조각을 부착한 후에, 이 조각들을 중합반응을 거쳐서 군집(cluster)을 이루게 한다. 이 과정을 거칠 때 검사하려는 DNA 조각에 붙은 염기의 종류를 확인하면서 서열확인법을 수행하는데, 약 4 일 정도의 작업으로 32-40 개의 염기길이를 가지는 단편이 4-5천만 개가 생산이 된다. 라이프 테크놀로지(Life Technologies)사의 SOLiD (Sequencing by Oligo Ligation) 기기는 1 μm 크기의 자성 구슬에 검사하려는 DNA 조각을 부착시킨 후에 유화제-중합효소연쇄반응을 이용하여 서열확인을 수행한다. 서열확인을 할 때는 8-mer의 단편들을 반복해서 붙이는 방식을 사용하는데, 이 8-mer의 4, 5번째에 실제 서열확인에 사용될 염기가 위치하고 있다. 그 뒤에 붙은 나머지 부위에는 형광물질이 연결되어 있어서 어느 염기가 검사하려는 DNA 조각에 상보적으로 결합하는 지를 표시해 준다. 한 번의 결합 주기마다 8-mer를 모두 5번 붙이고, 같은 작업을 5번 시행하면 총 25염기로 이루어진 DNA 조각의 서열을 확인할 수 있다. SOLiD 기기의 특징은 두 개의 염기를 이용한(two-base encoding) 서열확인으로, 이 방법은 하나의 염기의 서열을 결정할 때 같은 부위를 두 번의 서열확인을 통해서 확인하는 것이다. 자성구슬에 부착된 부착제(adaptor)쪽으로 한번의 결합 주기마다 한 염기씩 서열을 이동시키면서 서열확인을 수행한다. 이 과정을 통해서 서열확인 실험에서 발생하는 오류를 제거할 수 있는 장점이 있다.Next Generation Sequencing (NGS) can perform sequencing more quickly and at a higher rate than conventional capillary sequencing, The amplification process of the sample is omitted so that the experimental error caused in the process can be avoided. NGS systems manufactured by three companies are mainly used. Roche's 454 GS FLX, launched in 2004, is the first NGS instrument to introduce sequencing using pyrosequencing and emulsion-polymerase chain reactions. And the specific base can be identified according to the intensity of the light coming from the final stage of the experiment. When running for 7 hours, 100Mb sequence can be confirmed, and the existing ABI 3730 device shows much higher performance than 440kb sequence can be identified at the same time. Illumina Genome Analyzer from Illumina introduces the concept of sequencing by synthesis. After attaching a piece of DNA consisting of only one strand on a glass plate, the pieces are polymerized to form a cluster. . During this process, sequence identification is performed while confirming the type of base attached to the DNA fragment to be examined. In about 4 days of operation, 4-5 million fragments with a base length of 32-40 are produced. Sequencing by Oligo Ligation (SOLiD) from Life Technologies Inc. attaches a piece of DNA to a magnetic bead with a size of 1 μm and performs sequencing using an emulsifier-polymerase chain reaction. When sequencing is performed, a method of repeatedly attaching fragments of 8-mer is used. The base used for actual sequence identification is located at the 4th and 5th positions of the 8-mer. A fluorescent material is attached to the rest of the DNA to indicate which base is complementary to the DNA fragment to be examined. After 5 cycles of 8-mer every 5 cycles, 5 cycles of DNA sequencing can be performed. A feature of the SOLiD device is two-base encoding sequence identification, which identifies the same site in two sequence identifications when determining the sequence of a single base. Sequence identification is performed while moving the sequence one base at a time in one coupling cycle toward the adapter attached to the magnetic beads. This process has the advantage of eliminating the errors that occur in the sequence verification experiment.
(3) 염기서열 데이터의 분석(3) Analysis of nucleotide sequence data
질병의 원인 유전자를 찾기 위해서는 기존의 유전자 염기서열로부터 어떤 변화가 일어났는지 조사해야 하기 때문에 개인(환자)의 염기서열 데이터(sequence reads)를 레퍼런스 염기서열(reference Genome)과 비교하는 작업을 하게 된다. 이 작업을 매핑(Mapping)이라고 한다. 매핑을 통해 개인과 레퍼런스 염기서열의 차이를 알아낸 후 이를 적당한 선택 기준을 정해 신뢰할 수 있는 염기서열 변이 정보만 추출(Variant Calling)하게 된다. 이 변이 정보는 단일염기서열변이(SNV: Single Nucleotide Variation)4)이거나 짧은 삽입/결실(Short Indel)이다. 그런 다음 염기서열 변이 정보를 기존 데이터베이스(dbSNP)와 비교하여 이미 밝혀진 변이인지 새롭게 발견된 변이인지 판단한다. 그리고 그 변이가 아미노산의 변화를 가져올 것인지 아닌지, 또한 단백질 구조에 있어서 어떤 영향을 줄 것인지 예측하게 된다. 이 과정을 주석달기(Annotation)라고 한다. 추출한 단일염기서열변이와 짧은 삽입/결실에 관한 정보는 정보의 품질을 더 높이기 위하여 데이터베이스에 등재하거나 전장유전체연관분석(Genome Wild Association Study; GWAS)과 통합 연구를 통해 질병의 원인 변이를 찾는 연구를 수행할 수도 있다.
In order to find the gene responsible for the disease, it is necessary to investigate what changes have occurred from the existing gene sequence, so that the sequence of the individual (patient) sequence reads is compared with the reference genome. This operation is called mapping. After finding the difference between individuals and reference sequences through mapping, it is possible to select a suitable selection criterion and extract only reliable base sequence mutation information (Variant Calling). This mutation information is either a single nucleotide variation (SNV) 4 or a short insert. Then, the nucleotide sequence variation information is compared with an existing database (dbSNP) to determine whether the mutation is a newly discovered mutation. And whether the mutation will result in a change in amino acid or not, and what effect it will have on the protein structure. This process is called annotation. Information on single nucleotide sequence mutations and short insertions / deletions extracted can be used to increase the quality of the information or to search for mutations in the cause of the disease through integration studies with the Genome Wild Association Study (GWAS) .
본 발명의 일 구체예에서 “리드 분포도”란, 목적하는 유전자군을 구성하는 각 유전자의 리드들이 유전자군 내에서 차지하는 분포도로서, 본 발명의 도 4에 기재된 것과 같이 %로 나타내어질 수 있다.
In one embodiment of the present invention, the " lead distribution diagram " is a distribution diagram of the leads of each gene constituting the target gene group in the gene group, and can be expressed in% as shown in Fig. 4 of the present invention.
본 발명의 일 구체예에서 유전자 “야생형”이란, 유전 형질에서 야생종 생물들이 갖고 있는 유전자의 본래 형을 이르는 것으로, 유전자 이상이 없는 자연 본래 상태(정상 상태)의 유전자를 나타낸다.
In one embodiment of the present invention, the gene " wild type " refers to a gene of natural inheritance (normal state) without genetic abnormality, which inherits the inherent type of the gene possessed by wild type organisms in the genetic trait.
본 발명의 일 구체예에서 “유전자 결실”이란, 염색체의 일부가 유전자 재조합 과정에서 누락되어 일어나는 돌연변이로서, 유전자 발현에서 중요한 역할을 하는 유전자가 결실되었을 때 질병으로 발전하게 된다. 예를 들어, 홍체 미발달 및 각종 장기의 종양과 정신지체 증상을 나타내는 WAGR 증후군은 11번 염색체의 결실이 원인이며, 목소리가 고양이 우는 소리처럼 되고 각종 육체 및 정신 이상이 나타나는 묘성증후군은 5번 염색체의 결실이 원인이 된다. 또한, 암 발생의 경우, 유전자 결실로 인해 암억제 유전자에 기능 이상이 일어나 세포분열의 조절 기능을 상실하여 암으로 발전하는 경우도 관찰된다. 유전자 결실은 “이형 결실”과 “동형 결실”로 구분할 수 있다. 이형 결실이란 특정 유전자 접합체 한쌍 중에서 어느 한쪽에만 유전자 결실이 발생한 것이며, 동형 결실이란 특정 유전자 접합체 한쌍 중에서 양쪽 모두에 동일한 유전자 결실이 발생한 것을 나타낸다.
In one embodiment of the present invention, " gene deletion " is a mutation that occurs when a part of a chromosome is missing in a gene recombination process, and develops into a disease when a gene that plays an important role in gene expression is deleted. For example, the WAGR syndrome, which is characterized by unexplored development of the iris and various organs and mental retardation, is caused by the deletion of
본 발명의 일 구체예에서 “BIM 유전자”란, BCL2 유전자군에 속하는 유전자로서 BCL2L11(Bcl-2-like protein 11)이라고도 명명된다. BCL2 유전자군에 속하는 다른 패밀리 유전자와 함께 항세포사(anti-apoptosis) 또는 전세포사(pro-apatosis)의 조절자로서 세포의 다양한 활동에 폭넓게 관여한다. BIM 유전자가 활성화되면 세포사를 증가시키며, 반대로 BIM 유전자의 이상에 의한 활성 저하는 세포사를 억제하는 기능을 가진다. BIM 유전자의 활성 저하는 이상 세포 또는 돌연변이 세포의 세포사를 억제함으로써 암 발생을 증가시킬 수 있으며, 이는 폐암일 수 있으나 이에 한정하는 것은 아니다.
In one embodiment of the present invention, " BIM gene " is also referred to as BCL2L11 (Bcl-2-like protein 11) as a gene belonging to the BCL2 gene group. It is widely involved in various activities of the cell as a modulator of anti-apoptosis or pro-apatosis, together with other family genes belonging to the BCL2 gene family. Activation of the BIM gene increases cell death, and conversely, degradation of the BIM gene by its abnormality has the function of inhibiting cell death. Degradation of the BIM gene may increase the incidence of cancer by inhibiting the cell death of abnormal cells or mutant cells, which may be, but not limited to, lung cancer.
본 발명의 일 구체예에서 “진단”이란, 병리 상태의 존재 또는 특징을 확인하는 것을 의미하며, 본 발명의 목적상 진단은 선천성 유전 질환 또는 암 발생 등의 원인이 되는 유전자 결실군을 확인하는 것이나, 이제 한정하는 것은 아니다.
In one embodiment of the present invention, the term " diagnosis " means identifying a presence or characteristic of a pathologic condition. For the purpose of the present invention, the diagnosis includes identifying a genetic defect group causing congenital genetic diseases or cancer, , But is not limited to.
본 발명의 일 구체예에서 “스크리닝”이란, 여러 물질로 이루어진 후보군으로부터 목적으로 하는 어떤 특정한 성질을 갖는 물질을 특정한 조작 또는 평가 방법으로 선별하는 것이다. 본 발명의 목적상, 본 발명의 스크리닝은, 선천성 유전 질환 또는 암 발생 등의 원인이 되는 유전자 결실군을 확인하기 위한 일련의 과정을 지칭할 수 있으며, 암 발생 의심 개체 및 조직에서 유전자 결실로 인한 단백질 활성 변화를 측정하는데 사용될 수 있다.
In one embodiment of the present invention, the term " screening " is to select a substance having a specific property aimed at from a candidate group made of various substances by a specific manipulation or evaluation method. For the purpose of the present invention, the screening of the present invention may refer to a series of processes for identifying a genetic defect group causing congenital genetic diseases or cancer, etc., Can be used to measure changes in protein activity.
본 발명의 일 구체예에서 “신생혈관”이란, 혈관 내피세포가 증식하고 재구성되어 기존에 존재하는 혈관 네트워크로부터 새로운 혈관을 형성하는 세포 현상을 의미한다. 암세포가 증식 및 성장하기 위해서는 산소와 영양을 공급하는 새로운 혈관이 필요하므로, 신생혈관의 억제를 통해서 암의 전이 억제를 유도할 수 있다.
In one embodiment of the present invention, " neovascularization " refers to a cell phenomenon in which vascular endothelial cells are proliferated and reconstituted to form new blood vessels from an existing vascular network. In order for cancer cells to proliferate and grow, new blood vessels are needed to supply oxygen and nutrients, thus inhibiting cancer metastasis through inhibition of neovascularization.
본 발명의 일 구체예에서 “전이”란, 암세포가 원발장기를 떠나 다른 장기로 가는 것이다. 암이 신체의 다른 부분으로 퍼지는 것은 크게 원발암에서 암조직이 성장하여 직접적으로 주위장기를 침윤하는 것과 멀리 있는 다른 장기로 혈관이나 림프관을 따라 원격전이를 하는 것으로 나눈다. 전이는 암 발생과 관련된 유전자의 발현 억제 또는 상기 유전자의 단백질 활성 억제를 통해 조절될 수 있다.
In one embodiment of the present invention, " metastasis " refers to the cancer cells leaving the primary organs to another organ. The spread of cancer to other parts of the body is largely divided into the development of cancerous tissue in primary cancer, direct invasion of the surrounding organs, and distant metastasis along the blood vessels or lymph vessels to other organs far away. Metastasis can be regulated by inhibiting the expression of a gene associated with cancer development or inhibiting the protein activity of the gene.
본 발명의 일 구체예에서, 시료의 서열을 분석하는 단계; 목적하는 유전자 서열과 레퍼런스서열을 비교하여 분석하는 단계; 및 목적하는 유전자군의 리드 분포도를 분석하는 단계를 포함하고, 리드 분포도 내에서 최고값 대비 50% 미만값이 나타나는 경우에, 이를 이형 결실 유전자로 판별하는 방법을 제공하고, 상기 상기 이형 결실 유전자를 판별하는 방법은 시료의 서열을 분석하는 단계에서 차세대염기서열분석법을 사용하는 것인 이형 결실 유전자를 판별하는 방법을 제공하며, 상기 이형 결실 유전자는 결실 유전자 크기가 20 내지 3000 bp인 이형 결실 유전자를 판별하는 방법을 제공하며, 상기 이형 결실 유전자는 BIM인 이형 결실 유전자를 판별하는 방법을 제공하며, 상기 이형 결실 유전자는 폐암 유발 유전자인 이형 결실 유전자를 판별하는 방법을 제공한다.
In one embodiment of the invention, analyzing the sequence of the sample; Comparing and analyzing the desired gene sequence with the reference sequence; And analyzing a lead distribution degree of a target gene group. When a value less than 50% of the highest value appears in the lead distribution map, the method provides a method of discriminating the gene as a deletion deletion gene, A method for distinguishing a heterozygous deletion gene using a next-generation sequencing method in a step of analyzing a sequence of a sample, wherein the heterozygous deletion gene comprises a heterozygous deletion gene having a deletion gene size of 20 to 3000 bp Wherein the heterozygous deletion gene provides a method for identifying a heterozygous deletion gene that is a BIM, and the heterozygous deletion gene provides a method for identifying a heterozygous deletion gene that is a lung cancer inducing gene.
본 발명의 다른 구체예에서, 시료의 서열을 분석하는 단계; 목적하는 유전자 서열과 레퍼런스서열을 비교하여 분석하는 단계; 및 목적하는 유전자군의 개수(X)와 리드 분포도군의 개수(Y)를 비교하는 단계를 포함하고, X-Y가 0보다 큰 경우에, 이를 동형 결실 유전자의 수로 판별하는 방법을 제공하고, 상기 동형 결실 유전자를 판별하는 방법은 시료의 서열을 분석하는 단계에서 차세대염기서열분석법을 사용하는 것인 동형 결실 유전자를 판별하는 방법을 제공하며, 상기 동형 결실 유전자는 결실 유전자 크기가 20 내지 3000 bp인 동형 결실 유전자를 판별하는 방법을 제공하며, 상기 동형 결실 유전자는 BIM인 동형 결실 유전자를 판별하는 방법을 제공하며, 상기 동형 결실 유전자는 폐암 유발 유전자인 동형 결실 유전자를 판별하는 방법을 제공한다.
In another embodiment of the present invention, there is provided a method of analyzing a sample comprising: analyzing a sequence of a sample; Comparing and analyzing the desired gene sequence with the reference sequence; And comparing the number of desired gene groups (X) with the number of lead distribution groups (Y), and when XY is greater than 0, determining the number of homozygous deletion genes as the number of homozygous deletion genes, A method of identifying a deletion gene provides a method of identifying a homozygous deletion gene using a next-generation sequencing method in a step of analyzing a sequence of a sample, wherein the homozygous deletion gene is a homozygous deletion gene having a deletion gene size of 20 to 3000 bp Wherein said homozygous deletion gene provides a method for identifying a homozygous deletion gene that is a BIM, and said homozygous deletion gene provides a method for identifying a homozygous deletion gene that is a lung cancer inducing gene.
본 발명의 또 다른 구체예에서, 시료의 서열을 분석하는 서열분석부; 목적하는 유전자 서열과 레퍼런스서열을 비교하여 분석하는 비교분석부; 목적하는 유전자군의 리드 분포도를 분석하는 리드분석부; 및 리드 분포도 내에서 최고값 대비 50% 미만값이 나타나는 경우에, 이를 이형 결실 유전자로 판별하는 판별부를 포함하는 이형 결실 유전자 판별 장치를 제공하고, 상기 이형 결실 유전자 판별 장치는 서열분석부에서 차세대염기서열분석법을 사용하는 것을 특징으로 하는 이형 결실 유전자 판별 장치를 제공한다.
In another embodiment of the present invention, there is provided a method for analyzing a sample, comprising: a sequence analyzer for analyzing a sequence of a sample; A comparative analysis unit for comparing and analyzing a target gene sequence and a reference sequence; A lead analysis unit for analyzing a lead distribution of a target gene group; And a discriminator for discriminating the gene as a deletion deletion gene when a value less than 50% of the maximum value is found in the lead distribution map, wherein the heterozygous deletion gene discrimination apparatus comprises a sequence- A method for identifying a heterologous deletion gene characterized by using a sequence analysis method.
본 발명의 또 다른 구체예에서, 시료의 서열을 분석하는 서열분석부; 목적하는 유전자 서열과 레퍼런스서열을 비교하여 분석하는 비교분석부; 목적하는 유전자군의 개수(X)와 리드 분포도군의 개수(Y)를 비교하는 리드분석부; 및 X-Y가 0보다 큰 경우에, 이를 동형 결실 유전자의 수로 판별하는 판별부를 포함하는 동형 결실 유전자 판별 장치를 제공하고, 상기 동형 결실 유전자 판별 장치는 서열분석부에서 차세대염기서열분석법을 사용하는 것을 특징으로 하는 동형 결실 유전자 판별 장치를 제공한다.
In another embodiment of the present invention, there is provided a method for analyzing a sample, comprising: a sequence analyzer for analyzing a sequence of a sample; A comparative analysis unit for comparing and analyzing a target gene sequence and a reference sequence; A lead analysis unit for comparing the number (X) of desired gene groups and the number (Y) of lead distribution groups; And a discriminator which discriminates the number of homozygous deletion genes when XY is larger than 0, and wherein the homozygous deletion gene discrimination apparatus uses a next-generation sequencing method in the sequence analysis unit And a homologous deletion gene.
이하 상기 본 발명을 단계별로 상세히 설명한다.
Hereinafter, the present invention will be described in detail.
유전자 결실은 질병으로 발전하기 때문에 염기서열 분석에 있어서 유전자 결실 부위를 찾아내는 것이 매우 중요하다. 본 발명의 리드 분포도 염기서열 분석법은 기존의 variant calling 분석법과는 달리, 유전자의 야생형(Wild type), 이형 결실형(Hetero deletion) 및 동형 결실형(Homo deletion)을 정확하게 구분하여 진단함으로써, 질병 진단 및 모니터링에 큰 활용이 기대된다.
Since gene deletion develops into disease, it is very important to identify gene deletion sites in sequence analysis. Unlike the conventional variant calling method, the nucleotide sequence analysis method of the present invention can distinguish the wild type, the heterotypic deletion type and the homo deletion type of a gene accurately, And monitoring is expected to be greatly utilized.
도 1은 본 발명의 일 실시예에 따른 차세대 염기서열 분석(NGS)용 라이브러리 정도관리 결과를 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 이형결실 BIM 유전자 시료(18-BIM-Hetero)의 염기서열 변이 정보 추출(Variant Calling) 분석 결과를 나타낸 도면이다.
도 3은 BIM 유전자의 시퀀싱 데이터를 IGV(Integrative Genomics Viewer)로 직접 확인한 분석 결과를 나타낸 도면이다.
도 4는 BIM 유전자의 위치를 리드 분포도(read coverage) 분석한 결과를 나타낸 바코드 요약 결과이다.
도 5는 BIM 유전자의 위치를 리드 분포도(read coverage) 분석한 결과를 나타낸 도면이다.FIG. 1 is a diagram showing the results of managing the quality of a library for next generation sequencing analysis (NGS) according to an embodiment of the present invention.
FIG. 2 is a diagram showing a result of variant calling analysis of nucleotide sequence variation of a heterozygous deletion BIM gene sample (18-BIM-Hetero) according to an embodiment of the present invention.
FIG. 3 is a diagram showing an analysis result of sequencing data of the BIM gene directly confirmed by IGV (Integrative Genomics Viewer).
FIG. 4 is a bar code summary result showing the result of analyzing the read coverage of the position of the BIM gene.
FIG. 5 is a view showing the results of read coverage analysis of the position of the BIM gene. FIG.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
Hereinafter, the present invention will be described in more detail with reference to Examples. It will be apparent to those skilled in the art that these embodiments are only for describing the present invention in more detail and that the scope of the present invention is not limited by these embodiments in accordance with the gist of the present invention .
실시예 1: 차세대 염기서열분석(NGS) 수행Example 1: Next Generation Sequence Analysis (NGS)
실시예 1-1. 파라핀블럭 시료에서의 DNA 추출Example 1-1. DNA extraction from paraffin block samples
폐암 환자에게서 수술 중 분리되어 폐기된 폐 및 임파선 조직을 파라핀블럭 상태로 보관하였고, 폐, 임파선조직 파라핀블럭으로부터 QIAamp DNA 추출 키트(Qiagen, 독일)를 이용하여 DNA(gDNA)를 추출하였다. 상세한 설명은 하기와 같다. gDNA의 분리를 위해 파라핀블럭 상태로 보관되어 있는 조직에서 암조직을 잘라내어 1.5㎖ 마이크로 원심분리튜브에 넣어 1㎖의 자일렌을 첨가하여 조직에 결합되어 있는 파라핀을 녹여서 제거하였다. 2분동안 원심분리를 실시하여 상층액을 제거한 후에 1㎖의 에탄올을 첨가하여 조직을 씻어 주고, 다시 2분간 원심분리를 실시하여 상층액을 제거한 후 상온에서 10분간 방치하여 알코올을 증발시켰다. 프로테아제(protease) K 20 ㎕ 및 완충용액 180 ㎕를 혼합하였고, 1시간 56℃에서 반응시켰다. 이와 같이 얻어진 반응액을 QIAamp 스핀 컬럼(spin column)을 이용하여 정제한 후, 완충 용액으로 2회 세척하였다. 그리고 나서, 70 ℃에서 예열한 완충용액 50 ㎕로 용해하여 gDNA를 추출하였고, 이를 20℃에 보관하였다. 추출한 각 gDNA에 대해서는 큐비트(Qubit) dsDNA HS 어세이 키트(Assay Kit)와 큐비트(Qubit) 2.0 플루오로미터(Flourometer; Life Technologies, 미국)를 사용하여 gDNA의 양을 측정하였다.
In lung cancer patients, lung and lymph node tissues, which were separated and discarded during surgery, were kept in a paraffin block state and DNA (gDNA) was extracted from lung and lymph node tissue paraffin blocks using QIAamp DNA extraction kit (Qiagen, Germany). The details are as follows. For the isolation of gDNA, cancer tissues were cut from the tissues stored in a paraffin block state, and 1 ml of xylene was added thereto in a 1.5 ml microcentrifuge tube to dissolve the paraffin bound to the tissue. After centrifugation for 2 minutes, the supernatant was removed, 1 ml of ethanol was added to wash the tissues, and centrifugation was performed for 2 minutes. The supernatant was removed, and the mixture was allowed to stand at room temperature for 10 minutes to evaporate the alcohol. 20 [mu] l of protease K and 180 [mu] l of buffer solution were mixed and reacted at 56 [deg.] C for 1 hour. The reaction solution thus obtained was purified using a QIAamp spin column and washed twice with a buffer solution. Then, 50 μl of the buffer solution preheated at 70 ° C was dissolved to extract gDNA, which was stored at 20 ° C. For each extracted gDNA, the amount of gDNA was measured using a Qubit dsDNA HS Assay Kit and a Qubit 2.0 fluorometer (Flourometer; Life Technologies, USA).
실시예 1-2. 차세대 염기서열 분석(NGS)용 라이브러리 제작Examples 1-2. Generation of library for next-generation sequencing (NGS)
-20 ℃에 보관되어 있는 gDNA 10 ng을 사용하여 폐암 관련 17개를 포함한 표적유전자의 패널 프라이머를 이용하여 NGS수행을 위한 라이브러리를 제작하였다. 상기 패널 프라이머를 표 1에 기재하였다.Using 10 ng of gDNA stored at -20 ° C, a library for performing NGS was constructed using panel primers of target genes including 17 lung cancer-related genes. The panel primers are shown in Table 1.
NGS를 위한 라이브러리제작은 Ion AmpliSeq 라이브러리 키트2.0 (Life technologies, 미국)를 사용하여 제작하였다. 먼저 시료에서 추출한 DNA에서 표적유전자의 돌연변이 발생부위만을 얻어내기 위하여 선행되어진 패널 프라이머풀을 이용하여 증폭하였다. 5X HiFi 마스터믹스 4 ㎕와 패널 프라이머풀 10 ㎕, DNA 10 ng을 혼합하고, 총 반응액이 20 ㎕가 되도록 멸균증류수로 보정하여 혼합 반응액을 준비하였다. 준비된 혼합 반응액은 PCR 기기에서 99℃에서 2분, 99℃에서 15초, 60℃에서 4분의 과정을 21 Cycle반복하여 증폭하였다. 얻어진 증폭산물은 2 ㎕의 Fupa용액을 첨가하여 50℃에서 10분, 55℃에서 10분, 60℃에서 20분간 반응시켜서 증폭산물의 양 말단을 부분적으로 절단하였다. 부분적으로 절단된 증폭산물은 Ion P1 adapter 2 ㎕, Ion Xpress Barcode 2 ㎕를 첨가하여 22℃에서 30분, 72℃에서 10분간 반응하여 시퀀싱 어댑터와 시료를 구분 할 수 있는 바코드를 증폭산물에 결합시켰다. 시퀀싱 어댑터와 바코드가 결합된 증폭산물은 45 ㎕의 AMPure XP 용액을 첨가하여 세척하여 주었다.
Library production for NGS was performed using the Ion AmpliSeq library kit 2.0 (Life technologies, USA). First, DNA primers were amplified from the DNA extracted from the sample using a panel primer pool which was preceded to obtain only the mutation site of the target gene. 4 × 5 × HiFi master mix, 10 μl of panel primer pool, and 10 μg of DNA were mixed and adjusted with sterilized distilled water to make the total reaction volume 20 μl. The prepared mixed reaction solution was amplified by repeating 21 cycles of 2 minutes at 99 ° C, 15 seconds at 99 ° C, and 4 minutes at 60 ° C in a PCR instrument. The resulting amplification product was subjected to a reaction at 50 ° C for 10 minutes, 55 ° C for 10 minutes, and 60 ° C for 20 minutes, and both ends of the amplification product were partially cleaved by adding 2 μl of Fupa solution. 2 μl of Ion P1 adapter and 2 μl of Ion Xpress barcode were added to the partially digested amplified product, and the reaction was performed at 22 ° C for 30 minutes and at 72 ° C for 10 minutes to bind the sequencing adapter and the sample to the amplification product . The amplification product, in which the sequencing adapter and barcode were combined, was washed with 45 μl of AMPure XP solution.
실시예 1-3. 차세대 염기서열 분석(NGS)용 라이브러리 정도관리(Q.C)Examples 1-3. Library quality control for next-generation sequencing (NGS) (Q.C)
제작된 NGS용 라이브러리가 시퀀싱에 사용될 수 있는가를 확인하기 위하여 Agilent Bioanalyzer 2100(Agilent, 미국) 기기를 사용하여 High Sensitivity chip을 이용하여 제작된 라이브러리의 길이와 양을 측정하였고, 길이는 100 내지 300bp, 양은 100 pmol/l 이상인 조건에 만족하는 라이브러리를 시퀀싱에 사용하였다. High Sensitivity chip을 이용한 라이브러리 정도관리 결과를 도 1에 나타내었다.
The length and the amount of the library constructed using the High Sensitivity chip were measured using an Agilent Bioanalyzer 2100 (Agilent, USA) in order to check whether the prepared NGS library could be used for sequencing. The length was 100 to 300 bp, A library satisfying the condition of 100 pmol / l or more was used for sequencing. The results of library quality control using the High Sensitivity chip are shown in FIG.
실시예 1-4. 차세대 염기서열 분석(NGS) 시퀀싱 수행Examples 1-4. Sequencing of Next Generation Sequencing (NGS)
상기에서 나타낸 바와 같이 각 시료 별로 통합되고 해당 시료의 바코드 서열이 부착된 증폭산물들로 이루어진 라이브러리 8 pM에 대한 에멀션 PCR(emPCR)을 Ion PGM 템플리트 OT2 200 키트(Ion PGM Template OT2 400 Kit)(Life Technologies, 미국; Catalog Number 4479878) 및 해당 매뉴얼(Ion PGM Template OT2 200 Kit, Publication Number MAN 0007218, Revision 3.0)에 따라 수행하였다. 템플리트-양성의 ISP(Ion Sphere Particles)를 50℃에서 2분간 반응시킨 후, 다이나비즈 마이원스트렙타비딘 C1 비드(DynaBeads MyOne Streptavidin C1 Bead)(Life Technologies, 미국)로 ISP를 인리치먼트(Enrichment)하였다. PGM(Personal Genome Analyzer) 시퀀싱은 Ion 318 칩 키트 v2(Life Technologies, 미국; Catalog Number 4484354) 및 Ion PGM 시퀀싱 200 키트(Life Technologies, 미국; Catalog Number 4482002)와, 해당 매뉴얼(Ion PGM Sequencing 200 Kit, Publication Number MAN0007242, Revision 2.0)을 이용하여 수행하였다. 한편, 상기의 Ion PGM 시퀀싱 200 키트 및 Ion 318 칩 키트를 이용한 PGM(Personal Genome Analyzer) 시퀀싱 기술은 반도체 칩의 작은 구멍(well)에서 DNA 합성이 일어나면서 나타나는 pH의 변화를 직접 반도체에서 신호로 잡아내는 원리에 의해 4시간 이내에 해독이 가능한 매우 빠른 시퀀싱 플랫폼이다. 또한, PGM(Personal Genome Analyzer) 시퀀싱 기술은 여러 시료의 반응을 동시에 수행할 수 있는 멀티플렉싱 시퀀싱 능력이 있다.
As shown above, the emulsion PCR (emPCR) for 8 pM of the library, which is composed of the amplified products integrated for each sample and to which the bar code sequence of the sample was attached, was applied to the Ion
실시예 2: 표적유전자 돌연변이에 대한 리드 분포도 분석용 소프트웨어 설정Example 2: Software configuration for analysis of lead distribution for target gene mutation
상기의 PGM(Personal Genome Analyzer) 시퀀싱에 의해 얻어진 짧은 증폭산물의 염기서열 데이터들에 대한 분석은 Ion Torrent Suite 4.0.2 소프트웨어를 이용하여 수행하였다. Ion Torrent Suite 4.0.2 소프트웨어를 이용하여 NCBI의 hg19 레퍼런스(reference) 서열에 대한 정렬을 수행하였고, 각 시료에 대한 시퀀싱 데이터를 종합한 결과를 Ion Reporter의 cloud 시스템에 업로드하여 돌연변이 분석을 실시하였다. 본 발명에서 개발한 패널에 포함된 표적유전자를 효과적으로 분석하기 위하여, 패널에 포함되어 있는 유전자만을 분석 할 수 있도록 BED파일을 적용하여 분석의 시간을 단출 하였으며, 데이터의 질을 나타내는 Data Quality Stringency의 값이 6.5이상 되는 것을 분석에 사용하도록 설정하였다. 또한 빈도가 적은 체세포 돌연변이를 검출 할 수 있도록 3개 이상의 시퀀스 리드 이상에서 분석을 실시하도록 설계하였으며, 돌연변이 검출의 정확도를 높이기 위하여 10개 이상의 시퀀스 리드에서 검출된 돌연변이를 나타낼 수 있도록 하였다. 검출된 돌연변이의 정보는 신뢰성이 높은 COSMIC, dbSNP, ClinVar, VariantDB, VariantKB, 5000Exomes, OMIM, DrugBank의 데이터베이스와 연동하여 돌연변이 정보를 도출하도록 하였다. 추가적으로 BIM유전자의 경우, 약 2,000bp 의 결실 돌연변이가 발생하는 유전자이며, 이와 같이 결실의 부위가 길면 돌연변이 검출이 분석적으로 용이 하지 않으므로, 이를 극복하기 위하여 BIM유전자에서 디자인된 9개의 증폭산물은 별도의 분포도(Coverage)분석을 통하여 긴 결실이 유발되는 검체의 유무와 이러한 긴 결실 돌연변이가 동형접합체인지, 이형접합체인지 확인할 수 있도록 하였다.
Sequence data of short amplification products obtained by PGM (Personal Genome Analyzer) sequencing was analyzed using Ion Torrent Suite 4.0.2 software. Ion Torrent Suite 4.0.2 software was used to sort NCBI's hg19 reference sequence and the results of the sequencing data for each sample were uploaded to Ion Reporter's cloud system for mutation analysis. In order to effectively analyze the target gene included in the panel developed in the present invention, the analysis time is applied by applying the BED file so that only genes included in the panel can be analyzed, and the data quality stringency value Were used for analysis. In order to detect somatic mutations with low frequency, more than 3 sequencing leads were designed to perform the analysis. In order to increase the accuracy of mutation detection, mutations detected in more than 10 sequencing leads were shown. The information of the detected mutations was derived from mutation information linked with databases of highly reliable COSMIC, dbSNP, ClinVar, VariantDB, Variant KB, 5000Exomes, OMIM and DrugBank. In addition, in case of BIM gene, about 2,000 bp deletion mutation occurs. Since mutation detection is not easy analytically when a deletion site is long, 9 amplification products designed in BIM gene are separated The presence of long-deletion-induced specimens and the long deletion mutations were confirmed by homology or heterozygosity analysis through coverage analysis.
실시예 3: 표적유전자 돌연변이에 대한 리드 분포도 분석 결과Example 3: Analysis of lead distribution for target gene mutation
상기의 염기서열 변이 정보만 추출(Variant Calling)하여 분석한 결과에서는, 상기 패널 프라이머 중 BIM 유전자의 경우 시료 10개 중 7개가 결실 시료(이형결실 유전자 시료 6개, 동형결실 유전자 시료 1개)임에도 불구하고 유전자 결실 탐지가 이루어지지 않았다. 이는 염기서열 변이 정보 추출(Variant Calling) 분석법이 질병 진단에 중요한 결실 유전자 탐지에 충분치 못하다는 것을 의미한다. 이형결실 유전자 시료이나 결실 탐지가 이루어지지 않은 BIM 유전자 시료(18-BIM-Hetero)의 염기서열 변이 정보 추출(Variant Calling) 분석 결과를 도 2에 나타내었다.As a result of the analysis by variant calling of only the nucleotide sequence variation information, 7 out of 10 samples of the BIM gene among the panel primers were deleted samples (six homologous deletion gene samples and one homozygous deletion gene sample) Detection of gene deletion was not made, though. This means that the Variant Calling method is insufficient to detect deletion genes important for disease diagnosis. Fig. 2 shows the result of the variant calling analysis of the nucleotide sequence of the heterozygous deletion gene sample or the BIM gene sample (18-BIM-Hetero) without deletion detection.
두 번째로 상기 BIM 유전자의 시퀀싱 데이터를 IGV(Integrative Genomics Viewer)로 직접 확인하였다. 그 결과, 동형결실 시료에서는 리드가 나타나지 않았으나, 야생형(Wild type, WT)과 이형결실 유전자의 구분은 불가능하였다. 그 결과를 도 3에 나타내었다.Secondly, sequencing data of the BIM gene was confirmed directly by IGV (Integrative Genomics Viewer). As a result, there was no lead in homozygous deletion samples, but it was impossible to distinguish between wild type (WT) and heterozygous deletion genes. The results are shown in Fig.
마지막으로, 패널에 포함되어 있는 유전자만을 분석 할 수 있도록 BED파일을 적용하여 BIM 유전자의 위치만을 리드 분포도(read coverage) 분석하였다. 그 결과, 야생형 유전자의 경우 3% 이상의 분포도를 보이는 데 비하여, 이형결실 유전자의 경우 3% 미만의 분포도를 나타냈으며, 동형결실 유전자의 경우 0%의 분포도 결과를 나타내었다. 이는 특정 유전자군의 리드 분포도 분석 결과로 야생형, 이형결실 및 동형결실 유전자를 구분할 수 있다는 것을 의미한다. 그 결과를 도 4 및 도 5에 나타내었다.
Finally, we analyzed the read coverage of the BIM gene by applying the BED file to analyze only the genes contained in the panel. As a result, the distribution of wild type gene was more than 3%, while that of heterozygous deletion gene was less than 3% and that of homozygous deletion gene was 0%. This means that it is possible to distinguish between wild type, heterozygous deletion and homozygous deletion genes as a result of analysis of lead distribution of a specific gene group. The results are shown in Fig. 4 and Fig.
Claims (14)
목적하는 유전자 서열과 레퍼런스서열을 비교하여 분석하는 단계; 및
목적하는 유전자군의 리드 분포도를 분석하는 단계를 포함하고,
리드 분포도 내에서 최고값 대비 50% 미만값이 나타나는 경우에, 이를 이형 결실 유전자로 판별하는 방법.
Analyzing the sequence of the sample;
Comparing and analyzing the desired gene sequence with the reference sequence; And
And analyzing the lead distribution of the target gene group,
If less than 50% of the maximum value is found in the lead distribution map, it is determined as a heterozygous deletion gene.
상기 이형 결실 유전자를 판별하는 방법은 시료의 서열을 분석하는 단계에서 차세대염기서열분석법을 사용하는 것인 이형 결실 유전자를 판별하는 방법.
The method according to claim 1,
The method for discriminating the heterozygous deletion gene uses a next-generation sequencing method in the step of analyzing the sequence of the sample.
상기 이형 결실 유전자는 결실 유전자 크기가 20 내지 3000 bp인 이형 결실 유전자를 판별하는 방법.
The method according to claim 1,
Wherein said heterozygous deletion gene is a heterozygous deletion gene having a deletion gene size of 20 to 3000 bp.
상기 이형 결실 유전자는 BIM인 이형 결실 유전자를 판별하는 방법.
The method according to claim 1,
Wherein said heterozygous deletion gene is a BIM.
상기 이형 결실 유전자는 폐암 유발 유전자인 이형 결실 유전자를 판별하는 방법.
The method according to claim 1,
Wherein the heterozygous deletion gene is a lung cancer-inducing gene.
목적하는 유전자 서열과 레퍼런스서열을 비교하여 분석하는 단계; 및
목적하는 유전자군의 개수(X)와 리드 분포도군의 개수(Y)를 비교하는 단계를 포함하고,
X-Y가 0보다 큰 경우에, 이를 동형 결실 유전자의 수로 판별하는 방법.
Analyzing the sequence of the sample;
Comparing and analyzing the desired gene sequence with the reference sequence; And
(X) of the target gene group and the number (Y) of the group of lead distribution groups,
When XY is greater than 0, it is determined as the number of homozygous deletion genes.
상기 동형 결실 유전자를 판별하는 방법은 시료의 서열을 분석하는 단계에서 차세대염기서열분석법을 사용하는 것인 동형 결실 유전자를 판별하는 방법.
The method according to claim 6,
The method for discriminating the homozygous deletion gene uses a next-generation sequencing method in the step of analyzing the sequence of the sample.
상기 동형 결실 유전자는 결실 유전자 크기가 20 내지 3000 bp인 동형 결실 유전자를 판별하는 방법.
The method according to claim 6,
Wherein said homozygous deletion gene is a homozygous deletion gene having a deletion gene size of 20 to 3000 bp.
상기 동형 결실 유전자는 BIM인 동형 결실 유전자를 판별하는 방법.
The method according to claim 6,
Wherein said homozygous deletion gene is a BIM-homozygous deletion gene.
상기 동형 결실 유전자는 폐암 유발 유전자인 동형 결실 유전자를 판별하는 방법.
The method according to claim 6,
Wherein said homozygous deletion gene is a homozygous deletion gene.
목적하는 유전자 서열과 레퍼런스서열을 비교하여 분석하는 비교분석부;
목적하는 유전자군의 리드 분포도를 분석하는 리드분석부; 및
리드 분포도 내에서 최고값 대비 50% 미만값이 나타나는 경우에, 이를 이형 결실 유전자로 판별하는 판별부를 포함하는 이형 결실 유전자 판별 장치.
A sequence analyzer for analyzing the sequence of the sample;
A comparative analysis unit for comparing and analyzing a target gene sequence and a reference sequence;
A lead analysis unit for analyzing a lead distribution of a target gene group; And
And a discriminator for discriminating the gene as a deletion deletion gene when a value less than 50% of the maximum value appears in the lead distribution map.
상기 이형 결실 유전자 판별 장치는 서열분석부에서 차세대염기서열분석법을 사용하는 것을 특징으로 하는 이형 결실 유전자 판별 장치.
12. The method of claim 11,
Wherein the heterozygous deletion gene discrimination apparatus uses a next-generation sequencing method in a sequence analysis unit.
목적하는 유전자 서열과 레퍼런ㅅ서열을 비교하여 분석하는 비교분석부;
목적하는 유전자군의 개수(X)와 리드 분포도군의 개수(Y)를 비교하는 리드분석부; 및
X-Y가 0보다 큰 경우에, 이를 동형 결실 유전자의 수로 판별하는 판별부를 포함하는 동형 결실 유전자 판별 장치.
A sequence analyzer for analyzing the sequence of the sample;
A comparative analysis unit for comparing and analyzing a desired gene sequence and a reference sequence;
A lead analysis unit for comparing the number (X) of desired gene groups and the number (Y) of lead distribution groups; And
And a discriminator for discriminating, when XY is greater than 0, the number of homozygous deletion genes.
상기 동형 결실 유전자 판별 장치는 서열분석부에서 차세대염기서열분석법을 사용하는 것을 특징으로 하는 동형 결실 유전자 판별 장치.
14. The method of claim 13,
Wherein said homozygous deletion gene discrimination apparatus uses a next-generation sequencing method in a sequence analysis unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140190728A KR101638473B1 (en) | 2014-12-26 | 2014-12-26 | Detection method of gene deletion based on next-generation sequencing |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140190728A KR101638473B1 (en) | 2014-12-26 | 2014-12-26 | Detection method of gene deletion based on next-generation sequencing |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160082715A true KR20160082715A (en) | 2016-07-11 |
KR101638473B1 KR101638473B1 (en) | 2016-07-12 |
Family
ID=56499386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140190728A KR101638473B1 (en) | 2014-12-26 | 2014-12-26 | Detection method of gene deletion based on next-generation sequencing |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101638473B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020235972A1 (en) * | 2019-05-22 | 2020-11-26 | 서울대학교산학협력단 | Method and device for predicting genotype using ngs data |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101936934B1 (en) * | 2016-11-29 | 2019-01-09 | 연세대학교 산학협력단 | Methods for detecting nucleic acid sequence variations and a device for detecting nucleic acid sequence variations using the same |
KR101936933B1 (en) * | 2016-11-29 | 2019-01-09 | 연세대학교 산학협력단 | Methods for detecting nucleic acid sequence variations and a device for detecting nucleic acid sequence variations using the same |
KR102035615B1 (en) * | 2017-08-07 | 2019-10-23 | 연세대학교 산학협력단 | A methods for detecting nucleic acid sequence variations based on gene panels and a device for detecting nucleic acid sequence variations using the same |
KR102319447B1 (en) * | 2019-11-28 | 2021-10-29 | 주식회사 쓰리빌리언 | Method and Apparatus for discriminating the mutations of genes related to recessive inherited disease using next generation sequencing(NGS) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130065058A (en) * | 2011-12-09 | 2013-06-19 | 포항공과대학교 산학협력단 | A method to detect spontaneous dna double strand break points and the use thereof |
JP2013165661A (en) * | 2012-02-15 | 2013-08-29 | Obihiro Univ Of Agriculture & Veterinary Medicine | Method for determining base sequence of two or more specimens at a time by corresponding each specimen to sequence |
WO2014033455A1 (en) * | 2012-08-30 | 2014-03-06 | Zoragen Biotechnologies Llp | Method of detecting chromosomal abnormalities |
KR20140061223A (en) * | 2012-11-12 | 2014-05-21 | (주)신테카바이오 | System and method for detecting disease markers by reverse classification using allelic depth, signal intensity and quality score of ngs and snpchip |
-
2014
- 2014-12-26 KR KR1020140190728A patent/KR101638473B1/en active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130065058A (en) * | 2011-12-09 | 2013-06-19 | 포항공과대학교 산학협력단 | A method to detect spontaneous dna double strand break points and the use thereof |
JP2013165661A (en) * | 2012-02-15 | 2013-08-29 | Obihiro Univ Of Agriculture & Veterinary Medicine | Method for determining base sequence of two or more specimens at a time by corresponding each specimen to sequence |
WO2014033455A1 (en) * | 2012-08-30 | 2014-03-06 | Zoragen Biotechnologies Llp | Method of detecting chromosomal abnormalities |
KR20140061223A (en) * | 2012-11-12 | 2014-05-21 | (주)신테카바이오 | System and method for detecting disease markers by reverse classification using allelic depth, signal intensity and quality score of ngs and snpchip |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020235972A1 (en) * | 2019-05-22 | 2020-11-26 | 서울대학교산학협력단 | Method and device for predicting genotype using ngs data |
Also Published As
Publication number | Publication date |
---|---|
KR101638473B1 (en) | 2016-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hung et al. | Assessment of capture and amplicon-based approaches for the development of a targeted next-generation sequencing pipeline to personalize lymphoma management | |
Aune et al. | Long non-coding RNAs in innate and adaptive immunity | |
KR101638473B1 (en) | Detection method of gene deletion based on next-generation sequencing | |
ES2564656T3 (en) | Means and methods for the non-invasive diagnosis of chromosomal aneuploidy | |
Mori et al. | Next generation sequencing: new tools in immunology and hematology | |
DeRycke et al. | Targeted sequencing of 36 known or putative colorectal cancer susceptibility genes | |
KR20140024270A (en) | Optimization of multigene analysis of tumor samples | |
CN107312861B (en) | Marker for prognosis risk evaluation of B-ALL patient | |
KR101867011B1 (en) | Method for detecting gene rearrangement using next generation sequencing | |
Madugundu et al. | Integrated transcriptomic and proteomic analysis of primary human umbilical vein endothelial cells | |
Shih et al. | Cis-regulatory variants affect gene expression dynamics in yeast | |
KR101841673B1 (en) | Method for predicting prognosis of breast cancer patients using gene deletions as biomarkers | |
KR101977976B1 (en) | Method for increasing read data analysis accuracy in amplicon based NGS by using primer remover | |
Du et al. | Phylogenomic analyses of all species of swordtail fishes (genus Xiphophorus) show that hybridization preceded speciation | |
Sabri et al. | Whole exome sequencing of chronic myeloid leukemia patients | |
WO2016070230A1 (en) | Detecting sequence mutations in leukaemic fusion genes | |
Bartalucci et al. | A blood drop through the pore: nanopore sequencing in hematology | |
Pham et al. | The T Cell Receptor beta Chain Repertoire of Tumor Infiltrating Lymphocytes Improves Neoantigen Prediction and Prioritization | |
Li et al. | Genomic and RNA-Seq profiling of patients with HFrEF unraveled OAS1 mutation and aggressive expression | |
KR101864331B1 (en) | Predicting kit for survival of lung cancer patients and the method of providing the information for predicting survival of lung cancer patients | |
KR101805977B1 (en) | Predicting kit for survival of lung cancer patients and the method of providing the information for predicting survival of lung cancer patients | |
KR101766005B1 (en) | Predicting kit for survival of lung cancer patients and the method of providing the information for predicting survival of lung cancer patients | |
Skoufou-Papoutsaki et al. | PTEN and ARID1A haploinsufficiency equip colonic epithelium for oncogenic transformation | |
Cochran et al. | Systematic Identification of circRNAs in Alzheimer’s Disease. Genes 2021, 12, 1258 | |
Meng | Ethics statement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190701 Year of fee payment: 4 |