KR20000059431A - Family identification system from genetic database using DNA typing method and combination of markers for the system - Google Patents

Family identification system from genetic database using DNA typing method and combination of markers for the system Download PDF

Info

Publication number
KR20000059431A
KR20000059431A KR1019990006998A KR19990006998A KR20000059431A KR 20000059431 A KR20000059431 A KR 20000059431A KR 1019990006998 A KR1019990006998 A KR 1019990006998A KR 19990006998 A KR19990006998 A KR 19990006998A KR 20000059431 A KR20000059431 A KR 20000059431A
Authority
KR
South Korea
Prior art keywords
genetic information
markers
database
specific person
family
Prior art date
Application number
KR1019990006998A
Other languages
Korean (ko)
Inventor
조성우
김성만
이종은
Original Assignee
조성우
김성만
이종은
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 조성우, 김성만, 이종은 filed Critical 조성우
Priority to KR1019990006998A priority Critical patent/KR20000059431A/en
Publication of KR20000059431A publication Critical patent/KR20000059431A/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

PURPOSE: Provided are a method for identifying kinship from a genetic information database using DNA typing and also, polymorphic marker sets which are useful for DNA typing and most suitable for multiplex PCR. CONSTITUTION: The method for identifying kinship comprises the steps of: constructing database of genetic information in large numbers; extracting the genetic information of specific person; comparing the genetic information of specific person with those on the database; determining the homology of the genetic information between them; according to the degree of homology, identifying the specific person's kinship or saving the specific person's genetic information on the database. The marker set comprises many markers selected from the group consisting of d13s770, d3s2406, d2s1360, d6s1056, d3s2432, gata188f04, d11s1986, d17s1299, d15s822, d2s1356, d2s1334, d21s1446, d13s779, d7s2204, d22s683, d20s470, gata31f01, d6s1027, d11s2002,

Description

DNA 타이핑을 이용한 데이터베이스로부터의 가족 확인 방법 및 이를 위한 다형성 마커의 조합 {Family identification system from genetic database using DNA typing method and combination of markers for the system}Family identification system from genetic database using DNA typing method and combination of markers for the system}

본 발명은 유전자 정보를 이용하여 가족을 찾는 방법 및 이에 사용되는 마커 조합에 관한 것이다. 특히, 본 발명은 다수의 사람들의 유전자 정보를 데이터 베이스로 구축한 후 가족을 찾길 원하는 특정인의 유전자 정보를 데이터베이스에 있는 유전자 정보와 비교하여 가족을 찾는 방법과, 이에 사용되는 마커의 조합, 유전자 분리 및 유전자 감식 방법에 관한 것이다.The present invention relates to a method of finding a family using genetic information and a combination of markers used therein. In particular, the present invention is a method of finding a family by comparing the genetic information of a specific person who wants to find a family after building the genetic information of a large number of people in a database, a combination of markers, and gene separation And gene identification methods.

미아, 고아, 이산가족, 입양아 등은 가족을 찾길 원한다. 특히, 한국에서와 같이 전쟁 등으로 인한 사회적 변화가 많았던 나라에서는 그러한 경우가 많다.Mia, orphans, separated families, and adopted children want to find their families. This is especially the case in countries where there were many social changes caused by war, such as in Korea.

종래에도 유전자 정보를 이용하여 사람을 확인하는 경우가 있었다. 예를 들면, 범죄현장에서 입수한 유전자 정보를 이용하여 신원을 확인하는 경우이다. 입수한 유전자 정보와 데이터베이스에 있는 유전자 정보를 비교하여 동일성 여부를 판단하였다. 동일한 것으로 밝혀지면 입수한 유전자 정보의 주인공의 신원이 밝혀졌다. 그러나, 이 방법으로는 사람의 식별만이 가능할 뿐이다. 부모 관계나 형제, 사촌과 같은 관계를 확인해 주지는 못한다.Conventionally, genetic information is used to identify a person. For example, identification is done by using genetic information obtained from the crime scene. The genetic information obtained was compared with the genetic information in the database to determine the identity. If found to be the same, the identity of the protagonist of the obtained genetic information was revealed. However, in this way only human identification is possible. It does not identify relationships with parents, siblings, or cousins.

한편, 두 사람의 유전자 정보를 얻고 서로 비교하여 친자 여부를 확인하는 경우도 있었다. 이 방법에서는 당사자 사이의 비교에만 그쳤을 뿐이다.On the other hand, in some cases, the genetic information of two people is obtained and compared to each other to check paternity. In this method it was only a comparison between the parties.

이와 같이, 유전자 정보를 이용하여 특정인이 가족을 찾는 방법은 제시되지 않고 있다. 따라서, 다수인의 유전자 정보로부터 특정인의 가족을 찾아내는 방법의 제시가 필요하다.As such, a method of finding a family by using a genetic information has not been suggested. Therefore, there is a need for a method of finding a family of a specific person from the genetic information of a large number of people.

위와 같은 점을 고려하여, 본 발명은 유전자 정보를 이용하여 특정인이 다수의 모집단으로부터 가족을 찾는 방법을 제공하는 것을 목적으로 한다.In view of the above, an object of the present invention is to provide a method of finding a family from a plurality of populations using a genetic information.

본 발명의 다른 목적은 가족을 찾는 데에 유용한, 특히 한민족에게 적합한 마커의 조합을 제공하는 것이다.Another object of the present invention is to provide a combination of markers useful for finding families, particularly suitable for Koreans.

본 발명의 또 다른 목적은 상기와 같은 방법을 수행하기 위한 단위 공정인 유전자 분리 및 유전자 감식 방법을 제공하는 것이다.Still another object of the present invention is to provide a gene separation and gene identification method, which is a unit process for performing the above method.

본 발명의 또 다른 목적은 특정인에게서 얻은 유전자 정보와 데이터베이스에 보를 비교하여 가족여부를 판별하는 방법을 제공하는 것이다.Still another object of the present invention is to provide a method for determining family status by comparing gene information obtained from a specific person with a beam in a database.

도 1은 추출된 유전자 정보를 이용하여 가족을 찾는 방법의 단계를 도시한 유통도1 is a distribution diagram showing the steps of a method for finding a family using extracted genetic information

본 발명의 이러한 목적은 유전자 정보를 이용하여 가족을 찾는 방법으로서,The object of the present invention is to find a family using genetic information,

다수의 사람의 유전자 정보가 저장된 데이터베이스를 준비하는 단계와,Preparing a database storing genetic information of a plurality of humans,

특정인의 유전자정보를 추출하는 단계와,Extracting genetic information of a specific person;

상기 특정인의 유전자 정보를 상기 데이터베이스에 저장된 유전자 정보와 유사성을 판단하는 단계와,Determining similarity between the genetic information of the specific person and the genetic information stored in the database;

상기 유사성 판단 단계에서 유사성이 있다고 판단되는 경우, 가족관계를 결정하는 단계와,If it is determined that the similarity is determined in the similarity determining step, determining a family relationship;

상기 유사성 판단 단계에서 유사성이 없다고 판단되는 경우, 상기 특정인의 유전자 정보를 데이터베이스에 저장하는 단계를 포함하는 유전자 정보를 이용한 가족 찾는 방법에 의해 달성된다.If it is determined that there is no similarity in the similarity determination step, it is achieved by a family search method using the genetic information comprising the step of storing the genetic information of the specific person in a database.

본 발명의 다른 측면에 따르면, 유전자 정보를 이용하여 가족을 찾는 방법에 사용되는 마커 세트로서,According to another aspect of the present invention, a marker set used in a method of finding a family using genetic information,

d13s770, d3s2406, d2s1360, d6s1056, d3s2432, gata188f04, d11s1986, d17s1299, d15s822, d2s1356, d2s1334, d21s1446, d13s779, d7s2204, d22s683, d20s470, gata31f01, d6s1027, d11s2002 로부터 선택되는 다수의 마커로 구성되는 마커 세트가 제공된다.d13s770, d3s2406, d2s1360, d6s1056, d3s2432, gata188f04, d11s1986, d17s1299, d15s822, d2s1356, d2s1334, d21s1446, d13s779, d7s2204, d22s683, d20s470, d6s10 do.

이하 도면을 참조하여 본 발명을 상세히 설명한다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

최근 분자생물학의 발전으로 인간 개개인의 유전자 구조는 일란성 쌍생아를 제외한 모든 사람에서 특이성을 갖는다는 것이 밝혀졌다. 약 30억 염기쌍(base pair)에 달하는 인체의 유전자 중 인체의 기능에 중요하게 관여하는 부위는 거의 모든 사람이 동일한 구조를 갖고 있다. 그러나, 중요한 기능과 직접적으로 관련이 없는 약 10% 미만의 염색체 부위는 사람마다 차이를 나타낸다. 염색체상의 차이를 밝히는 분자생물학적인 기법으로는 제한효소의 인식부위의 차이를 밝히는 방법(RFLP, restriction fragment length polymorphism)과 DNA 연쇄중합반응(PCR, polymerase chain reaction)을 이용한 VNTR(variable number tandem repeats)의 감식 방법이 주로 사용되고 있다. 특히, PCR을 이용한 VNTR의 감식 방법이 최근에 들어서 주로 사용되고 있다. 본 발명은 이러한 방법들을 이용하여 밝힌 유전자 구조에 대한 정보를 이용하여 가족을 찾는 방법을 제공한다.Recent advances in molecular biology have revealed that the genetic structure of individual humans is specific for all but identical twins. Nearly 3 billion base pairs of genes in the human body are important for the functioning of the human body, almost everyone has the same structure. However, less than about 10% of chromosomal sites that are not directly related to important functions vary from person to person. Molecular biological techniques that reveal differences on chromosomes include variable number tandem repeats (VNTRs) using methods of identifying restriction sites of restriction enzymes (RFLP, restriction fragment length polymorphism) and DNA polymerase chain reaction (PCR). The identification method of is mainly used. In particular, the identification method of VNTR using PCR has been mainly used in recent years. The present invention provides a method of finding a family using information on the gene structure revealed using these methods.

본 발명에 따른 유전자 정보를 이용한 가족 찾는 방법은 크게 가족 찾기를 원하는 사람(이하 "사용자"라 한다)의 유전자 정보를 추출하는 단계와, 상기 추출된 유전자 정보를 데이터베이스에 있는 유전자 정보와 비교하여 가족을 찾는 단계로 이루어진다.A method of finding a family using gene information according to the present invention includes the steps of extracting gene information of a person who wants to find a family (hereinafter, referred to as a "user"), and comparing the extracted gene information with gene information in a database. Finding consists of steps.

먼저, 사람으로부터 필요한 유전자 정보를 추출하는 방법에 대하여 설명한다. 사람의 유전자 중에는 각각의 개체에 따라 그 염기서열 구조가 매우 다른 부위가 존재한다. 이를 고도가변영역(hyper-variable region)이라 부른다. 이러한 고도가변영역의 많은 부위는 단순한 염기서열이 반복적으로 존재하는 경우가 많으며 이러한 부위를 VNTR이라고 부른다. VNTR 부위 내에 존재하는 단순 염기서열 반복의 종류에 따라 디뉴클레오티드 반복 유전자(dinucleotide repeat), 트리뉴클레오티드 반복 유전자(trinucleotide repeat), 또는 테트라뉴클레오티드 반복유전자(tetranucleotide repeat)로 분류된다. 대표적인 디뉴클레오티드 반복 유전자(dinucleotide repeat)는 염기서열 CA가 반복적으로 특정횟수 존재하며, 트리뉴클레오티드 반복 유전자의 경우 GCT가, 그리고 테트라뉴클레오티드 반복 유전자의 경우 GATA가 반복적으로 존재한다. 이 VNTR부위에 존재하는 단순한 염기서열의 반복 횟수가 개인마다 특이한 형태로 존재할 수 있으며, 이는 멘델의 유전법칙에 따라 부모에서 자손으로 유전된다. 이러한 특정 염기서열 부위를 다형성 마커(polymorphic MARKER)라고 부르며 이들은 전체 염색체 상에 골고루 많은 숫자로 존재한다. 이들 마커는 각종 유전질병의 유전방법 연구 및 질병 유전자의 발견 등에 요긴하게 사용된다. 반복되는 특정 염기서열의 반복 횟수가 사람들 사이에서 많은 차이를 나타내며 그 분포가 전체 인구 사이에 골고루 분포할 때 더욱 중요한 가치를 가지는 마커로 구별된다.First, a description will be given of a method for extracting necessary genetic information from a person. In human genes, there are sites where the sequence structure is very different for each individual. This is called a hyper-variable region. In many of these highly variable regions, simple sequences are often present repeatedly, and these regions are called VNTRs. Dinucleotide repeats, trinucleotide repeats, or tetranucleotide repeats are classified according to the type of simple sequence repetition present in the VNTR region. Representative dinucleotide repeat genes (CA) repeat a specific number of times, a trinucleotide repeat gene GCT, and a tetranucleotide repeat gene GATA is present repeatedly. The number of repetitions of simple nucleotide sequences in the VNTR region can be unique to each individual, which is inherited from parents to offspring according to Mendel's genetic law. These specific sequences are called polymorphic markers and they are present in even numbers on the entire chromosome. These markers are useful for researching genetic methods of various genetic diseases and finding disease genes. The number of repetitions of a particular sequence of repetition shows a great difference among people and is distinguished by a marker that is more important when the distribution is evenly distributed among the entire population.

유전자 내에 존재하는 수많은 다형성 마커를 감식하는 방법으로 여러 가지 방법이 사용될 수 있다. 그 중에 하나가 PCR 증폭 방법이다. 형광물질로 표지된 프라이머(primer)를 이용하여 마커 부위의 염기서열을 PCR로 증폭한 후, 결과물을 자동염기서열 분석기기(automatic sequencing machine)로 분석한다. 자동분석기기는 특정 마커의 크기를 정확하게 판별해 준다. 그 크기를 기초로 마커 내에 단순 반복이 몇 회 존재하는지를 계산할 수 있다. 인체의 염색체는 동일한 염색체가 한 쌍으로 존재하므로 크기가 다른 특정 마커가 2개 존재할 수 있다. 이들 2개의 마커는 한 개는 아버지에게서 유전되고 다른 한 개는 어머니에게서 유전되므로 2개의 크기가 다른 마커 종류가 한 부위의 마커에 대하여 존재할 수 있다. 여러 부위의 마커에 대한 정보를 검색하여 마커 각각의 정보를 개개인에 따라 종합적으로 분석한다(이를 DNA 타이핑(typing) 이라 한다). 여러 종류의 마커를 이용한 DNA 타이핑의 결과는 각 개인의 특수한 조합을 형성한다.Various methods can be used to identify many polymorphic markers present in a gene. One of them is the PCR amplification method. A primer sequence labeled with a fluorescent material is used to amplify the nucleotide sequence of the marker region by PCR, and the result is analyzed by an automatic sequencing machine. Automated analyzers accurately determine the size of specific markers. Based on the size, it can be calculated how many simple iterations exist in the marker. Human chromosomes may have two specific markers of different sizes because the same chromosome is present in pairs. Since these two markers are inherited from the father and the other from the mother, two different marker types may exist for the marker at one site. The information on the markers of various sites is searched and the information of each marker is comprehensively analyzed according to the individual (this is called DNA typing). The results of DNA typing with different types of markers form a unique combination of individuals.

본 발명자는 한국인의 이산 가족 찾기에 적합한 다형성 DNA 마커(polymorphic DNA marker)의 조합을 선정하였다. 인체의 염색체에는 이미 수 천 종류의 마커들이 있는 것으로 알려져 있다. 이들 마커들이 모두 개인 판별을 위한 마커로 사용되기에 적합한 것은 아니다. 그러므로 목적에 맞는 마커들의 조합을 선택하는 것이 매우 중요하다. 본 발명에 사용되는 마커들은 그 분포도 및 다양성에 있어서 개체 판별 및 친족확인에 매우 적합한 마커들을 조합한 것으로 기존의 마커 세트와는 차이가 있다. 또한 본 마커 세트는 인종간의 유전자 차이를 염두에 두고 선정한 것들로 한국인의 유전자 검색에 가장 적합한 세트 중의 하나이다. 서양인에 기준을 두고 개발한 마커 세트들이 한국인의 유전자 구조에서도 똑같은 확률로 나타나지 않기 때문이다. 이는 단일 민족으로서의 한국인의 특성 상 특정 마커에서 전혀 다른 pattern을 보일 수 있다는 점에 기초를 두고 있다. 본 발명은 또한 기존의 세트에서 사용하는 테트라뉴클레오티드 반복 유전자 마커뿐만 아니라, 트리뉴클레오티드 반복 유전자(trinucleotide repeat) 마커들도 사용하고 있다. 트리뉴클레오티드 반복 유전자 마커를 사용할 경우 더욱 많은 마커들을 한번의 PCR 반응에 조합해서 사용할 수 있다. 본 발명에 따른 마커 세트는 부모 자식간의 관계 확인뿐만 아니라 형제-자매, 나아가서는 삼촌관계까지도 식별하기에 적합한 마커 세트이다.The present inventors selected a combination of polymorphic DNA markers suitable for finding discrete families in Koreans. There are already thousands of markers on the human chromosomes. Not all of these markers are suitable for use as markers for individual identification. Therefore, it is very important to choose a combination of markers that suits the purpose. The markers used in the present invention are different from the existing marker sets in combination with markers that are very suitable for individual identification and relative identification in terms of distribution and diversity. In addition, this marker set was selected with regard to gene differences among races, and is one of the most suitable sets for genetic search of Koreans. This is because the marker sets developed based on Westerners do not have the same probability in Korean genetic structure. This is based on the fact that Koreans as a single nation may show a completely different pattern on certain markers. The present invention also uses trinucleotide repeat markers as well as tetranucleotide repeat markers used in existing sets. When using trinucleotide repeat gene markers, more markers can be used in combination in one PCR reaction. The marker set according to the present invention is a marker set suitable for identifying not only the relationship between parent children but also sibling-sisters and even uncle relationships.

본 발명에서 사용하는 마커들은 표 1과 같다.Markers used in the present invention are shown in Table 1.

본 발명에 따른 마커 세트Marker set according to the invention 마커 이름Marker name 대립유전자 (Allele)의 개수Number of alleles 반복 유전자의 종류Type of repeat gene d13s770d13s770 77 tritri d3s2406d3s2406 1010 tetratetra d2s1360d2s1360 1010 tetratetra d6s1056d6s1056 77 tetratetra d3s2432d3s2432 1111 tetratetra gata188f04gata188f04 1111 tetratetra d11s1986d11s1986 1212 tetratetra d17s1299d17s1299 55 tetratetra d15s822d15s822 88 tetratetra d2s1356d2s1356 66 tritri d2s1334d2s1334 88 tetratetra d21s1446d21s1446 88 tetratetra d13s779d13s779 66 tritri d7s2204d7s2204 1212 tetratetra d22s683d22s683 1212 tetratetra d20s470d20s470 1111 tetratetra gata31f01gata31f01 88 tetratetra d6s1027d6s1027 66 tritri d11s2002d11s2002 77 tetratetra

본 발명에서는 상기 마커들 중에서 선택된 마커의 세트를 사용한다. 상기 마커들을 이용할 경우 다음과 같은 장점이 있다.The present invention uses a set of markers selected from the above markers. Using the markers has the following advantages.

많은 수의 마커들을 개별적으로 PCR로 증폭하여 DNA 타이핑하는 것은 많은 시간과 비용을 필요로 하는 과정이다. 이러한 과정을 간단히 하기 위하여 여러 개의 마커를 섞어서 한번에 PCR 증폭(이를 멀티플렉스 PCR(multiplex PCR)이라 한다) 할 수 있으나, 이에 대한 반응조건을 최적화 하는데는 많은 어려움이 있다. 본 발명의 마커들로부터 선정된 마커세트들은 멀티플렉스 PCR(multiplex PCR)을 하기에 가장 적절한 마커들로 구성되어 있다.DNA typing of a large number of markers individually by PCR is a time-consuming and expensive process. To simplify this process, several markers can be mixed and PCR amplified at once (this is called multiplex PCR), but there are many difficulties in optimizing the reaction conditions. The marker sets selected from the markers of the present invention consist of the markers most suitable for multiplex PCR.

전술한 바와 같이, 특정인의 시료를 채취하여 형광물질로 표지된 프라이머(primer)를 이용하여 마커 부위의 염기서열을 PCR로 증폭한다. 그 후, 결과물을 자동염기서열 분석기기(automatic sequencing machine)로 분석한다. 자동분석기기는 특정 마커의 크기를 정확하게 판별해 준다. 그 크기를 기초로 마커 내에 단순 반복이 몇 회 존재하는지를 계산할 수 있다. 상기 본 발명에 따른 마커들로부터 선정된 마커 세트에 대한 정보를 검색하여 개개인에 따라 종합적으로 분석한다. 그 결과 마커 세트에 속한 마커를 이용한 DNA 타이핑의 결과는 각 개인의 특수한 조합을 형성한다. 이러한 과정을 거쳐 특정인의 유전자 정보를 획득한다.As described above, a sample of a specific person is collected and amplified by a PCR using a primer labeled with a fluorescent material. The results are then analyzed with an automatic sequencing machine. Automated analyzers accurately determine the size of specific markers. Based on the size, it can be calculated how many simple iterations exist in the marker. The information on the marker set selected from the markers according to the present invention is searched and comprehensively analyzed according to the individual. As a result, the results of DNA typing using markers belonging to a marker set form a unique combination of individuals. Through this process, the genetic information of a specific person is obtained.

특정인의 유전자 정보가 확인되면 상기 추출된 유전자 정보를 데이터베이스에 있는 유전자 정보와 비교하여 가족을 찾는 단계로 이루어진다. 도 1를 참조하면, 상기 단계는 여러 단위 단계를 나뉜다.When the genetic information of a specific person is identified, the extracted genetic information is compared with the genetic information in a database to find a family. Referring to Figure 1, the step is divided into several unit steps.

먼저 유전자 정보가 추출된 특정인이 단순히 데이터베이스에 등록하기를 원하는 것인지, 아니면 가족을 바로 찾기를 원하는지 판단한다.First, it is determined whether a specific person from whom genetic information is extracted simply wants to register in a database or find a family immediately.

데이터베이스에 유전자 정보를 등록하기를 원하는 경우, 유전정보를 입력한다. 그런 후, 유전자 데이터베이스에 있는 유전자 정보와 비교하여 중복성 검사를 한다. 동일한 유전자가 없는 경우에는 상기 유전자 정보를 데이터베이스에 입력하고 작업을 마친다.If you want to register the genetic information in the database, enter the genetic information. Then, the redundancy test is compared with the genetic information in the genetic database. If there is no identical gene, the gene information is entered into the database and the operation is completed.

한편 특정인이 가족을 찾기를 원하는 경우, 추출된 특정인의 유전자 정보를 데이터베이스에 있는 유전자 정보와 비교한다. 그래서 유전자 정보의 유사성을 검토하고 가족관계에 있는 사람의 유전자 정보를 가려낸다.On the other hand, if a specific person wants to find a family, the extracted genetic information of the specific person is compared with the genetic information in the database. Therefore, the similarity of the genetic information is examined and the genetic information of the person in the family relationship is screened out.

이 때 부모, 자식 관계의 검색 및 계산 방법은 다음과 같다.At this time, parent and child relation search and calculation method are as follows.

1. 데이터베이스를 특정인의 유전정보를 갖고 검색한다.1. Search the database with specific genetic information.

2. 검색된 결과 중 최소한 50%의 대립유전자(allele)가 일치하는 사람이 있는지 검색한다. 예를 들면, 10개의 마커(marker)를 타이핑했을 경우 최소한 10개의 동일한 대립 유전자(allele)를 갖은 사람이 있는지를 검색한다.2. Search for a match for at least 50% of the alleles in the search results. For example, typing ten markers will search for a person with at least ten identical alleles.

3. 최소한 50%의 대립 유전자가 일치한 경우라도 혹시 어떤 특정 마커에 대한 대립 유전자가 모두 다른지 여부를 검사한다. 즉, DNA 타이핑에 사용한 모든 마커마다 최소한 한 개씩의 대립 유전자는 일치를 하여야 친자 관계에 있음을 증명할 수 있다.3. If at least 50% of the alleles match, then check whether all the alleles for a particular marker are all different. In other words, at least one allele for every marker used for DNA typing must be matched to prove parentage.

4. 이들이 친부모,자식일 확률을 계산한다. 이는 일치한 대립 유전자의 빈도(frequency)를 곱한 수치로 계산한다. 예를 들면 사용한 모든 마커에서 특정 대립 유전자가 나타날 확률이 동일하게 1/10 이라면 (1/10)n으로 계산한다. 이때 n은 사용한 마커의 개수이다.4. Calculate the probability that these are parents and children. This is calculated as the product of the frequencies of the matching alleles. For example, if all markers used are equally 1/10, the probability of a particular allele is equal to (1/10) n . N is the number of markers used.

형제, 남매, 자매 관계의 검색 및 계산 방법은 다음과 같다.The search and calculation methods for siblings, siblings and sisters are as follows.

1. 데이터베이스를 특정인의 유전정보를 갖고 검색한다.1. Search the database with specific genetic information.

2. 검색된 결과 중 최소한 25%의 대립 유전자가 일치하는 사람이 있는지 검색한다. 예를 들면, 10개의 마커를 타이핑했을 경우 최소한 5개의 동일한 대립 유전자를 갖은 사람이 있는지를 검색한다.2. Search for a match for at least 25% of the alleles. For example, typing 10 markers will search for a person with at least five identical alleles.

3. 이들이 친형제,자매일 확률을 계산한다. 이는 일치한 대립 유전자의 빈도(frequency)를 곱한 수치로 계산한다. 예를 들면 사용한 모든 마커에서 특정 대립 유전자가 나타날 확률이 동일하게 1/10 이라면 (1/10)n으로 계산한다. 이때 n은 일치한 대립 유전자의 개수이다.3. Calculate the probability that they are siblings or sisters. This is calculated as the product of the frequencies of the matching alleles. For example, if all markers used are equally 1/10, the probability of a particular allele is equal to (1/10) n . Where n is the number of alleles matched.

삼촌 관계의 검색 및 계산 방법은 다음과 같다.The search and calculation method of uncle relationship is as follows.

1. 데이터베이스를 특정인의 유전정보를 갖고 검색한다.1. Search the database with specific genetic information.

2. 검색된 결과 중 최소한 12.5%의 대립 유전자가 일치하는 사람이 있는지 검색한다. 예를 들면, 10개의 마커를 타이핑했을 경우 최소한 3개의 동일한 대립 유전자를 갖은 사람이 있는지를 검색한다.2. Search for a match for at least 12.5% of the alleles. For example, typing 10 markers will search for a person with at least three identical alleles.

3. 이들이 친삼촌,조카일 확률을 계산한다. 이는 일치한 대립 유전자의 빈도(frequency)를 곱한 수치로 계산한다. 예를 들면 사용한 모든 마커에서 특정 대립 유전자가 나타날 확률이 동일하게 1/10 이라면 (1/10)n으로 계산한다. 이때 n은 일치한 대립 유전자의 개수이다.3. Calculate the probability that these are relatives, nephew. This is calculated as the product of the frequencies of the matching alleles. For example, if all markers used are equally 1/10, the probability of a particular allele is equal to (1/10) n . Where n is the number of alleles matched.

이상의 예에서 볼 수 있듯이 본 발명에서 이루고자하는 친족확인 DNA 타이핑에는 일반의 경우보다 많은 수의 마커 세트를 필요로 한다. 계산상에 있을 수 있는 불확실성을 보충하기 위하여 DNA 타이핑에 사용하는 마커 세트를 최소한 2 세트 이상 사용한다.As can be seen from the above examples, the kinetic DNA typing to be achieved in the present invention requires a larger number of marker sets than in the general case. Use at least two sets of markers used for DNA typing to compensate for any uncertainty in the calculations.

유사성이 있는 유전자정보를 데이터베이스로부터 찾아내지 못한 경우에는 그 특정인의 유전자정보를 데이터베이스에 추가하고 작업을 완료한다.If similar genetic information could not be found from the database, the specific genetic information is added to the database and the work is completed.

상기 실시예에서는 데이터베이스가 이미 구축되어 있는 것으로 설명하였고, 데이터베이스에 유전자 정보를 등록하는 과정과 가족을 찾는 과정을 분리하여 설명하였다. 그러나, 이러한 과정은 통합될 수도 있음을 본 명세서로부터 당업자라면 이해할 수 있을 것이다.In the above embodiment, it has been described that a database has already been established, and the process of registering gene information in the database and finding a family is separately described. However, it will be understood by those skilled in the art from this disclosure that this process may be integrated.

즉, 처음 한 사람의 유전자 정보만을 데이터베이스에 등록시킬 수 있다. 다음에 다른 특정인에게서 획득한 유전자 정보를 데이터베이스에 있는 유전자 정보와 동일성을 검토한다. 동일한 경우에는 이미 등록되어 있는 사람으로 판단한다. 동일하지 않은 경우에는 유사성을 판단한다. 유사한 경우에는 가족관계를 판단한다. 유사성이 없는 경우에는 그 특정인의 유전자정보를 데이터베이스에 추가 등록한다.That is, only the first person's genetic information can be registered in the database. Next, the genetic information obtained from another specific person is examined for identity with the genetic information in the database. In the same case, it is determined that the person is already registered. If they are not identical, similarity is determined. In similar cases, family relations are judged. If there is no similarity, the genetic information of the specific person is additionally registered in the database.

이상 본 발명을 상기 실시예를 들어 설명하였으나, 본 발명의 취지 및 범위를 벗어나지 않고 수정 또는 변경을 가할 수 있으며, 이러한 수정 또는 변경도 특허청구범위에 의해 정해지는 본 발명의 범위에 속한다는 것을 알 수 있을 것이다.While the present invention has been described with reference to the above embodiments, it is understood that modifications or changes can be made without departing from the spirit and scope of the invention, and such modifications or changes also fall within the scope of the invention as defined by the claims. Could be.

이상과 같은 본 발명의 구성에 따르면, 다수의 유전자정보를 가진 데이터베이스로부터 가족관계에 있는 사람을 찾아낼 수 있다. 아울러, 본 발명에 따른 마커의 조합은 한국인의 가족 찾기에 적합하다. 또한, 멀티플렉스 PCR(multiplex PCR)이 가능하다.According to the configuration of the present invention as described above, it is possible to find a person in a family relationship from a database having a large number of genetic information. In addition, the combination of the marker according to the present invention is suitable for finding a Korean family. In addition, multiplex PCR is possible.

Claims (2)

유전자 정보를 이용하여 가족을 찾는 방법으로서,As a way of finding families using genetic information, 다수의 사람의 유전자 정보가 저장된 데이터베이스를 준비하는 단계와,Preparing a database storing genetic information of a plurality of humans, 특정인의 유전자정보를 추출하는 단계와,Extracting genetic information of a specific person; 상기 특정인의 유전자 정보를 상기 데이터베이스에 저장된 유전자 정보와 유사성을 판단하는 단계와,Determining similarity between the genetic information of the specific person and the genetic information stored in the database; 상기 유사성 판단 단계에서 유사성이 있다고 판단되는 경우, 가족관계를 결정하는 단계와,If it is determined that the similarity is determined in the similarity determining step, determining a family relationship; 상기 유사성 판단 단계에서 유사성이 없다고 판단되는 경우, 상기 특정인의 유전자 정보를 데이터베이스에 저장하는 단계를 포함하는 유전자 정보를 이용한 가족 찾는 방법.And if it is determined that there is no similarity in the similarity determining step, storing gene information of the specific person in a database. 유전자 정보를 이용하여 가족을 찾는 방법에 사용되는 마커 세트로서,A set of markers used to find families using genetic information. d13s770, d3s2406, d2s1360, d6s1056, d3s2432, gata188f04, d11s1986, d17s1299, d15s822, d2s1356, d2s1334, d21s1446, d13s779, d7s2204, d22s683, d20s470, gata31f01, d6s1027, d11s2002 로부터 선택되는 다수의 마커로 구성되는 마커 세트.d13s770, d3s2406, d2s1360, d6s1056, d3s2432, gata188f04, d11s1986, d17s1299, d15s822, d2s1356, d2s1334, d21s1446, d13s779, d7s2204, d22s683, d20s470, d6s10
KR1019990006998A 1999-03-03 1999-03-03 Family identification system from genetic database using DNA typing method and combination of markers for the system KR20000059431A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990006998A KR20000059431A (en) 1999-03-03 1999-03-03 Family identification system from genetic database using DNA typing method and combination of markers for the system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990006998A KR20000059431A (en) 1999-03-03 1999-03-03 Family identification system from genetic database using DNA typing method and combination of markers for the system

Publications (1)

Publication Number Publication Date
KR20000059431A true KR20000059431A (en) 2000-10-05

Family

ID=19575471

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990006998A KR20000059431A (en) 1999-03-03 1999-03-03 Family identification system from genetic database using DNA typing method and combination of markers for the system

Country Status (1)

Country Link
KR (1) KR20000059431A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030008384A (en) * 2001-07-18 2003-01-29 이경호 The family searching system of unknown graves with internet
KR101147692B1 (en) * 2008-12-11 2012-05-22 한국생명공학연구원 analyze device of genetic information elements within families.
KR101147691B1 (en) * 2008-12-11 2012-05-22 한국생명공학연구원 Genealogical test and analysis device using DNA and genetic information comparison.
KR101147690B1 (en) * 2008-12-11 2012-05-22 한국생명공학연구원 The test device for tissue immuno-compatibility test using SNP and genomic information from MHC region of the human genome.
KR101147693B1 (en) * 2008-12-19 2012-05-22 한국생명공학연구원 The selection device for clinical examination candidates using SNP and genomic information from ADME region of the genome.
CN108491812A (en) * 2018-03-29 2018-09-04 百度在线网络技术(北京)有限公司 The generation method and device of human face recognition model

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030008384A (en) * 2001-07-18 2003-01-29 이경호 The family searching system of unknown graves with internet
KR101147692B1 (en) * 2008-12-11 2012-05-22 한국생명공학연구원 analyze device of genetic information elements within families.
KR101147691B1 (en) * 2008-12-11 2012-05-22 한국생명공학연구원 Genealogical test and analysis device using DNA and genetic information comparison.
KR101147690B1 (en) * 2008-12-11 2012-05-22 한국생명공학연구원 The test device for tissue immuno-compatibility test using SNP and genomic information from MHC region of the human genome.
KR101147693B1 (en) * 2008-12-19 2012-05-22 한국생명공학연구원 The selection device for clinical examination candidates using SNP and genomic information from ADME region of the genome.
CN108491812A (en) * 2018-03-29 2018-09-04 百度在线网络技术(北京)有限公司 The generation method and device of human face recognition model
CN108491812B (en) * 2018-03-29 2022-05-03 百度在线网络技术(北京)有限公司 Method and device for generating face recognition model

Similar Documents

Publication Publication Date Title
JP7143486B2 (en) Variant Classifier Based on Deep Neural Networks
US8738297B2 (en) Method for molecular genealogical research
US6703228B1 (en) Methods and products related to genotyping and DNA analysis
Chicurel Faster, better, cheaper genotyping
US20040175715A1 (en) Method and device for simultaneously molecularly cloning and polylocus profiling of genomes or genomes mixtures
CN108350500A (en) Nucleic acid for detecting chromosome abnormality and method
CN106676182A (en) Low-frequency gene fusion detection method and device
EP1056889B1 (en) Methods related to genotyping and dna analysis
CN110257547B (en) Corn core SNP marker developed based on KASP technology and application thereof
CN108137642A (en) Application of the molecular mass ensuring method in sequencing
CN106702010B (en) Genetic marker combination, individual gene identity card, two-dimensional code, kit and application thereof
US20070143031A1 (en) Method of analyzing a bio chip
Mihelich et al. Characterization of genetic heterogeneity within accessions in the USDA soybean germplasm collection
KR20000059431A (en) Family identification system from genetic database using DNA typing method and combination of markers for the system
KR100431620B1 (en) A system for analyzing dna-chips using gene ontology, and a method thereof
CN109321660A (en) Genetic marker combination, genes of individuals identity card and its application
Li et al. Copolymerization of single-cell nucleic acids into balls of acrylamide gel
CN113832236A (en) Primer group and kit for identifying sika deer, red deer and hybrid deer and application
Wang et al. ProbeMatchDB—a web database for finding equivalent probes across microarray platforms and species
CN114836536B (en) Method and system for screening single-cell high-amplification region based on MALBAC
CN114875118B (en) Methods, kits and devices for determining cell lineage
Rossato et al. CRISPR-Cas9-based repeat depletion for high-throughput genotyping of complex plant genomes
CN109097457A (en) The method for determining predetermined site mutation type in sample of nucleic acid
US20080269063A1 (en) Method and system for preparing a microarray for a disease association gene transcript test
JP5065694B2 (en) Method and system for evaluating genotyping results

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination