KR102405758B1 - 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법 - Google Patents

집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법 Download PDF

Info

Publication number
KR102405758B1
KR102405758B1 KR1020210160791A KR20210160791A KR102405758B1 KR 102405758 B1 KR102405758 B1 KR 102405758B1 KR 1020210160791 A KR1020210160791 A KR 1020210160791A KR 20210160791 A KR20210160791 A KR 20210160791A KR 102405758 B1 KR102405758 B1 KR 102405758B1
Authority
KR
South Korea
Prior art keywords
group
genetic
generation
representative
individual
Prior art date
Application number
KR1020210160791A
Other languages
English (en)
Inventor
강성봉
Original Assignee
주식회사 클리노믹스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 클리노믹스 filed Critical 주식회사 클리노믹스
Priority to KR1020210160791A priority Critical patent/KR102405758B1/ko
Application granted granted Critical
Publication of KR102405758B1 publication Critical patent/KR102405758B1/ko
Priority to PCT/KR2022/018119 priority patent/WO2023090861A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Bioethics (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physiology (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 그 방법에 관한 것으로, 해결하고자 하는 과제는 집단을 대표하는 유전체를 만들고, 대표들간 교배 시뮬레이션을 통해 잡종 대표를 만든 후, 집단 대표 및 잡종 대표 간에 새로운 데이터 사이에 유전적 유사도를 측정하여, 집단 구성을 판별함으로써 검사 대상 개체의 유전적 집단 구성을 판별하는데 있다.
일례로, 동종 집단 내 개체에 대하여 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 상기 출현 빈도수에 따라 상기 동종 집단 별 집단 대표 개체를 선정하는 집단 대표 개체 선정부; 및 상기 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 상기 집단 대표 개체의 잡종 데이터를 생성하고, 상기 잡종 데이터와 검사 대상 개체 간의 유전적 유사도에 따라 검사 대상 개체에 대한 유전적 집단 구성을 판별하는 유전적 집단 구성 판별부를 포함하는 단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 시스템을 개시한다.

Description

집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법{SYSTEM AND METHOD FOR DETERMING GEMETIC POPULATION COMPOSITION USING HYBRID SPECIFIC REFERENCE GENETIC DATA GENERATION FOR POPULATION, BREED, DISEASE GROUPS, AND SPECIES AND ANALYSIS FOR DETERMINIG GENETIC COMPONENTS}
본 발명의 실시예는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법에 관한 것이다.
특정 집단을 대표하는 표준게놈을 생성하는 것은 잘 알려져 있다. 이전의 개 품종 특이적 표준 게놈 생성이나 최근 많은 국가들이 그 국가의 특이적인 표준 게놈을 생성하는 것에 많은 투자를 하고 있다.
대부분의 인식이 집단 표준게놈을 생성하여, 페인팅 기법을 사용하면, 잡종에 대한 유전적 구성 정보를 쉽게 얻을 수 있다. 예를 들어, A와 B 집단의 1:1잡종은 A가 50% B가 50%로 정확히 각 집단의 표준 게놈과 일치할 것이다. 그러나, 이러한 방법은 정확하지 않다. 즉, A 집단의 특정 SNP는 AA만을 가지고 같은 자리의 SNP가 B 집단에서는 GG 만을 갖는다고 할 때, A-B 잡종은 AG 유전형을 갖는다. 하지만. A 집단과 B 집단 모두 AG를 갖는 경우가 존재하지 않는다면, AG를 가질 수 있는 C 집단으로 판별될 수 있어, 잡종에 대한 유전정보가 사전에 필요하다.
한편, 종래의 조상 분석 방법은 집단의 특이적인 유전형 혹은 패턴을 찾고, 그 유전형을 가짐으로써 집단을 판별하는 'Chromosome painting' 기법을 사용하거나, 모계 유전의 MT 및 부계유전의 Y 유전체 정보를 통해 유전적 유래를 찾는다.
또한, 종래의 조상 분석을 위한 유전 원리를 설명하고 있는 멘델의 유전법칙은 1865년 그레고어 멘델(Gregor Mendel 1822~1884)이 완두콩을 통해 실험하고 유전인자들이 어떤 방식으로 유전되어 표현형이 나타나는지 정리하고, 확률적으로 해석한 법칙으로 잘 알려져 있다.
미국공개특허 US2017-0004256A1 미국공개특허 US2017-0017757A1 미국공개특허 US2017-0199959A1 미국등록특허 US8620594B2 유럽공개특허 EP3588506A1 PCT국제공개특허 WO2017-210542A1 미국공개특허 US2008-0255768A1 한국등록특허공보 제10-2138165호 한국공개특허공보 제10-2021-0089073호
본 발명의 실시예는, 집단을 대표하는 유전체를 만들고, 대표들간 교배 시뮬레이션을 통해 잡종 대표를 만든 후, 집단 대표 및 잡종 대표 간에 새로운 데이터 사이에 유전적 유사도를 측정하여, 집단 구성을 판별함으로써 검사 대상 개체의 유전적 집단 구성을 판별할 수 있는 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 시스템 및 방법을 제공한다.
본 발명의 일 실시예에 따른 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 시스템은, 동종 집단 내 개체에 대하여 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 상기 출현 빈도수에 따라 상기 동종 집단 별 집단 대표 개체를 선정하는 집단 대표 개체 선정부; 및 상기 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 상기 집단 대표 개체의 잡종 데이터를 생성하고, 상기 잡종 데이터와 검사 대상 개체 간의 유전적 유사도에 따라 검사 대상 개체에 대한 유전적 집단 구성을 판별하는 유전적 집단 구성 판별부를 포함한다.
또한, 상기 집단 대표 개체 선정부는, 집단 별로 유전체 데이터를 수집하는 유전체 데이터 수집부; 상기 유전체 데이터를 이용하여 집단 간의 유전적 유사도를 측정하고, 측정 결과에 따라 동종 집단으로 군집화하여 분류하는 동종 집단 분류부; 및 상기 동종 집단 내 개체들 간의 동일 유전적 위치마다 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 상기 출현 빈도수에 따라 상기 동종 집단 별 집단 대표 개체를 선정하여 선정된 상기 집단 대표 개체에 대한 유전체를 생성하는 집단 대표 개체 유전체 생성부를 포함할 수 있다.
또한, 상기 동종 집단 분류부는, 동종 집단으로 군집화되지 않은 개체들을 제거할 수 있다.
또한, 상기 집단 대표 개체 유전체 생성부는, 상기 출현 빈도수가 가장 많은 개체를 상기 집단 대표 개체로 선정하되, 동률의 유전자형을 갖는 둘 이상의 개체들에 대하여 무작위 방식으로 상기 집단 대표 개체를 선정할 수 있다.
또한, 상기 집단 대표 개체 유전체 생성부는, 상기 출현 빈도수가 미리 설정된 기준 빈도수 이하인 경우 해당 개체를 제거할 수 있다.
또한, 상기 집단 대표 개체 유전체 생성부는, 동일 세대 내에서 상기 집단 대표 개체 간의 유전적 유사도를 측정하고, 미리 설정된 기준 유사도 이상인 경우 해당 집단 대표 개체를 하나의 공통 집단 대표 개체로 선정할 수 있다.
또한, 상기 유전적 집단 구성 판별부는, 상기 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 상기 집단 대표 개체의 잡종 데이터를 생성하는 잡종 데이터 생성부; 및 상기 잡종 데이터와 검사 대상 개체 간의 유전적 유사도를 측정하고, 측정 결과에 따라 검사 대상 개체의 품종을 판별하는 검사 대상 개체 품종 판별부를 포함할 수 있다.
또한, 상기 잡종 데이터 생성부는, 1세대, 2세대, 3세대 및 그 이상의 세대 별 집단 대표 개체 간 반복적 교잡 시 조합을 하기의 수식(Equation, #Representator)에 따라 결정하고,
Figure 112022017340407-pat00020
상기 Equation은 이전 세대를 고려하지 않은 m세대가 갖는 집단 대표 개체의 총 수이고, 상기 #Representator는 각 세대에서 사용하는 집단 대표 개체의 총 수이고, 상기 Equation과 #Representator의 N은 집단의 수일 수 있다.
또한, 상기 검사 대상 개체 품종 판별부는, 상기 잡종 데이터 중 상기 검사 대상 개체와 유전적 유사도가 가장 높은 잡종 데이터에 해당하는 집단 대표 개체의 유전적 집단구성을 상기 검사 대상 개체의 유전적 집단구성인 것으로 추정할 수 있다.
또한, 상기 검사 대상 개체 품종 판별부는, 검사 대상 개체와 유전적 유사도가 높은 순으로 집단 대표 개체를 정렬하고, 정렬된 집단 대표 개체 별 유전적 유사도를 백분율로 환산하고, 환산된 백분율 값을 각 집단 대표 개체가 전체 집단 대표 개체 중에 차지하는 비중으로 나눈 후, 나눈 값을 양의 정수의 근사치로 추정하여 특정 세대가 아닌 다음 세대의 검사 대상 개체에 대한 유전적 집단구성을 확인할 수 있다.
본 발명의 다른 실시예에 따른 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 방법은, 동종 집단 내 개체에 대하여 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 상기 출현 빈도수에 따라 상기 동종 집단 별 집단 대표 개체를 선정하는 집단 대표 개체 선정 단계; 및 상기 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 상기 집단 대표 개체의 잡종 데이터를 생성하고, 상기 잡종 데이터와 검사 대상 개체 간의 유전적 유사도에 따라 검사 대상 개체에 대한 유전적 집단 구성을 판별하는 유전적 집단 구성 판별 단계를 포함한다.
또한, 상기 집단 대표 개체 선정 단계는, 집단 별로 유전체 데이터를 수집하는 유전체 데이터 수집 단계; 상기 유전체 데이터를 이용하여 집단 간의 유전적 유사도를 측정하고, 측정 결과에 따라 동종 집단으로 군집화하여 분류하는 동종 집단 분류 단계; 및 상기 동종 집단 내 개체들 간의 동일 유전적 위치마다 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 상기 출현 빈도수에 따라 상기 동종 집단 별 집단 대표 개체를 선정하여 선정된 상기 집단 대표 개체에 대한 유전체를 생성하는 집단 대표 개체 유전체 생성 단계를 포함할 수 있다.
또한, 상기 동종 집단 분류 단계는, 동종 집단으로 군집화되지 않은 개체들을 제거할 수 있다.
또한, 상기 집단 대표 개체 유전체 생성 단계는, 상기 출현 빈도수가 가장 많은 개체를 상기 집단 대표 개체로 선정하되, 동률의 유전자형을 갖는 둘 이상의 개체들에 대하여 무작위 방식으로 상기 집단 대표 개체를 선정할 수 있다.
또한, 상기 집단 대표 개체 유전체 생성 단계는, 상기 출현 빈도수가 미리 설정된 기준 빈도수 이하인 경우 해당 개체를 제거할 수 있다.
또한, 상기 집단 대표 개체 유전체 생성 단계는, 동일 세대 내에서 상기 집단 대표 개체 간의 유전적 유사도를 측정하고, 미리 설정된 기준 유사도 이상인 경우 해당 집단 대표 개체를 하나의 공통 집단 대표 개체로 선정할 수 있다.
또한, 상기 유전적 집단 구성 판별 단계는, 상기 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 상기 집단 대표 개체의 잡종 데이터를 생성하는 잡종 데이터 생성 단계; 및 상기 잡종 데이터와 검사 대상 개체 간의 유전적 유사도를 측정하고, 측정 결과에 따라 검사 대상 개체의 품종을 판별하는 검사 대상 개체 품종 판별 단계를 포함할 수 있다.
또한, 상기 잡종 데이터 생성 단계는, 1세대, 2세대, 3세대 및 그 이상의 세대 별 집단 대표 개체 간 반복적 교잡 시 조합을 하기의 수식(Equation, #Representator)에 따라 결정하고,
Figure 112022017340407-pat00021
상기 Equation은 이전 세대를 고려하지 않은 m세대가 갖는 집단 대표 개체의 총 수이고, 상기 #Representator는 각 세대에서 사용하는 집단 대표 개체의 총 수이고, 상기 Equation과 #Representator의 N은 집단의 수일 수 있다.
또한, 상기 검사 대상 개체 품종 판별 단계는, 상기 잡종 데이터 중 상기 검사 대상 개체와 유전적 유사도가 가장 높은 잡종 데이터에 해당하는 집단 대표 개체의 유전적 집단구성을 상기 검사 대상 개체의 유전적 집단구성인 것으로 추정할 수 있다.
또한, 상기 검사 대상 개체 품종 판별 단계는, 검사 대상 개체와 유전적 유사도가 높은 순으로 집단 대표 개체를 정렬하고, 정렬된 집단 대표 개체 별 유전적 유사도를 백분율로 환산하고, 환산된 백분율 값을 각 집단 대표 개체가 전체 집단 대표 개체 중에 차지하는 비중으로 나눈 후, 나눈 값을 양의 정수의 근사치로 추정하여 특정 세대가 아닌 다음 세대의 검사 대상 개체에 대한 유전적 집단구성을 확인할 수 있다.
본 발명에 따르면, 집단을 대표하는 유전체를 만들고, 대표들간 교배 시뮬레이션을 통해 잡종 대표를 만든 후, 집단 대표 및 잡종 대표 간에 새로운 데이터 사이에 유전적 유사도를 측정하여, 집단 구성을 판별함으로써 검사 대상 개체의 유전적 집단 구성을 판별할 수 있는 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 시스템 및 방법을 제공할 수 있다.
본 발명은 이하에서 유전형(Genotype)을 기준으로 설명되었지만, 집단 대표 haplotype을 기준으로 집단 대표 구성 및 교잡 분석 등에 대하여도 같은 원리로 적용될 수 있다.
또한, 본 발명의 대표개체 생성에 대한 예시 및 사전 분석은 유전자형 투표를 통해 생성하였으나, 뿐만아니라 시뮬레이션을 통해 생성된 가상의 개체를 말한다.
또한, 집단이란 고양이, 사람 혹은 타 애완동물 식물 등, 심지어 질병 집단에서까지 나눌 수 있는 모든 집단에서 사용 가능 하다. 질병 집단의 예를 들면, 아주 정교한 폐암집단의 대표 유전체를 생성했다면, 특정 개체의 폐암 위험도를 판단하기 위해 해당 대표 유전체에 맵핑(mapping) 하여 맵핑율(mapping rate)를 확인함으로써, 타고난(germline) 폐암의 위험도를 평가할 수 있다. 뿐만 아니라, 폐암과 위암 대표들의 교잡을 통해, 폐암-위암 잡종 대표 생성으로 특정 개체의 폐암 유전 위험, 위암 유전 위험 및 종합 유전 위험 등을 평가 가능하다. 이는 역 인구 피라미드 구조의 시대에, 웰니스(Wellness)에 대한 관심, 수요, 연구의 증가로, 본 기술의 새로운 접근법이 질병과 질병군들 간의 관계를 이해하는 데에 새로운 시각을 제공할 것을 기대한다.
도 1은 본 발명의 실시예에 따른 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 시스템의 전체 구성을 나타낸 블록도이다.
도 2는 본 발명의 실시예에 따라 개체들 간의 유전적 유사도 측정을 통해 불순 개체 및 동종 집단을 판별한 동종 집단 분류부의 실행 결과에 대한 예시를 나타낸 도면이다.
도 3은 본 발명의 실시예에 따라 유전자형 출현빈도수 측정을 통해 집단 대표 유전체 생성하는 집단 대표 개체 유전체 생성부의 실행 결과에 대한 예시를 나타낸 도면이다.
도 4는 본 발명의 실시예에 따른 잡종 데이터 생성부가 멘델의 유전법칙에 기초하여 집단 대표 개체의 유전체 간 교잡을 통해 새로운 잡종을 생성하는 일례를 나타낸 모식도이다.
도 5는 본 발명의 실시예에 따라 세대가 거듭될 때 이전 세대 대표 개체들이 다음 세대에 어떠한 방식으로 사용되는지를 보여주기 위한 도면이다.
도 6은 본 발명의 실시예에 따른 2세대까지의 분석을 통해 유전적 집단구성의 비율 및 3세대의 집단구성 판별 방식을 설명하기 위해 나타낸 도면이다.
도 7은 본 발명의 실시예에 따른 'Akita' 및 'Chow-Chow' 잡종에 대한 패턴 분석을 통해 집단구성을 확인하기 위한 예시 데이터를 나타낸 도면이다.
도 8은 본 발명의 다른 실시예에 따른 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 방법의 전체 구성을 나타낸 흐름도이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.
본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나 이상의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.
아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
도 1은 본 발명의 실시예에 따른 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 시스템의 전체 구성을 나타낸 블록도이고, 도 2는 본 발명의 실시예에 따라 개체들 간의 유전적 유사도 측정을 통해 불순 개체 및 동종 집단을 판별한 동종 집단 분류부의 실행 결과에 대한 예시를 나타낸 도면이고, 도 3은 본 발명의 실시예에 따라 유전자형 출현빈도수 측정을 통해 집단 대표 유전체 생성하는 집단 대표 개체 유전체 생성부의 실행 결과에 대한 예시를 나타낸 도면이고, 도 4는 본 발명의 실시예에 따른 잡종 데이터 생성부가 멘델의 유전법칙에 기초하여 집단 대표 개체의 유전체 간 교잡(개체들 간의 교배)을 통해 새로운 잡종을 생성하는 일례를 나타낸 모식도이고, 도 5는 본 발명의 실시예에 따라 세대가 거듭될 때 이전 세대 대표 개체들이 다음 세대에 어떠한 방식으로 사용되는지를 보여주기 위한 도면이고, 도 6은 본 발명의 실시예에 따른 2세대까지의 분석을 통해 유전적 집단구성의 비율 및 3세대의 집단구성 판별 방식을 설명하기 위해 나타낸 도면이며, 도 7은 본 발명의 실시예에 따른 'Akita' 및 'Chow-Chow' 잡종에 대한 패턴 분석을 통해 집단구성을 확인하기 위한 예시 데이터를 나타낸 도면이다.
도 1을 참조하면, 본 발명의 실시예에 따른 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 시스템(1000)은 집단 대표 개체 선정부(100)와 유전적 집단 구성 판별부(200) 중 적어도 하나를 포함할 수 있다.
상기 집단 대표 개체 선정부(100)는, 동종 집단 내 개체에 대하여 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 출현 빈도수에 따라 동종 집단 별 집단 대표 개체를 선정할 수 있다.
이를 위해 집단 대표 개체 선정부(100)는 도 1에 도시된 바와 같이 유전체 데이터 수집부(110), 동종 집단 분류부(120) 및 집단 대표 개체 유전체 생성부(130) 중 적어도 하나를 포함할 수 있다.
상기 유전체 데이터 수집부(110)는, 집단(ex. 지형적 및 외형적 집단) 별 유전체 데이터(sanger, NSG, micro-array 등)을 다량으로 수집하고, 수집된 유전체 데이터를 집단 별로 저장 관리할 수 있다.
상기 동종 집단 분류부(120)는, 유전체 데이터 수집부(110)를 통해 수집된 다량의 유전체 데이터를 이용하여 집단 간의 유전적 유사도를 측정하고, 측정 결과에 따라 동종 집단으로 군집화하여 분류할 수 있다. 이러한 동종 집단 분류부(120)는, 집단 별 유사도에 따라 동종 집단으로 분류할 수 있는 집단을 동종 집단으로 군집화하고, 그에 따른 데이터를 축적할 수 있다. 동종 집단 분류부(120)는 도 2에 도시된 'Admixture' 방법이나, 'Structure' 방법 등 집단 내 개인간 유전적 유사도를 측정하는 방법을 적용하여 같은 집단임을 밝혀 합쳐줄 수 있을 뿐만 아니라, 이와 같은 방법을 통해 집단의 구성원이 아닌 다른 개체를 제거할 수 있다. 이와는 다른 방법으로 출처가 다르게 수집된 경우 집단의 명칭의 다를 수 있게 처리할 수 있다.
상기 집단 대표 개체 유전체 생성부(130)는, 동종 집단 내 개체들 간의 동일 유전적 위치마다 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 출현 빈도수에 따라 동종 집단 별 집단 대표 개체를 선정하여 선정된 집단 대표 개체에 대한 유전체를 생성할 수 있다.
좀 더 구체적으로, 또한, 집단 대표 개체 유전체 생성부(130)는 집단 대표 개체 유전체 생성부(130)는, 출현 빈도수가 가장 많은 개체를 1세대의 집단 대표 개체로 선정하되, 동률의 유전자형을 갖는 둘 이상의 개체들에 대하여 무작위 방식으로 집단 대표 개체를 선정할 수 있다. 즉, 집단 내의 개체들 간 각 유전적 위치마다 유전자형 출현 빈도수 측정 통해 집단 대표를 만드는 과정에서 예를 들어 도 3에 도시된 바와 같이 동률의 유전자형일 시 무작위로 선정할 수 있다.
또한, 집단 대표 개체 유전체 생성부(130)는, 출현 빈도수가 미리 설정된 기준 빈도수 이하인 경우 해당 개체를 제거할 수 있다. 유전자형 출현빈도수를 측정함으로써 동종 집단 분류부(120)를 통해 걸러지지 않은 불순 개체가 존재하는 경우, 유전자형 출현빈도수 측정을 통해 불순 개체의 유전형을 제거할 수 있는 효과가 있다. 예를 들어, 100명의 한국인으로 구성된 집단을 수집했을 때 한 명의 일본인이 동종 집단 분류부(120)를 통해 걸러지지 않았다면, 유전자형의 출현빈도수 측정을 통해, 99명의 한국인의 보편적으로 가지고 있는 유전형이 채택되어 한 명의 일본인의 효과를 최대로 낮출 수 있다.
또한, 집단 대표 개체 유전체 생성부(130)는, 동일 세대 내에서 집단 대표 개체 간의 유전적 유사도를 측정하고, 미리 설정된 기준 유사도 이상인 경우 해당 집단 대표 개체를 하나의 공통 집단 대표 개체로 선정할 수 있다. 본 실시예에서 가장 처음 만들어진 집단의 대표 개체를 1세대 집단 대표 개체라 할 때, 1세대 집단 대표 개체는 그 집단에서 자주 나타나는 유전체의 구조 및 유전자형에 대한 정보의 집합체를 의미하게 된다. 만약, A집단의 1세대 대표 개체와 B집단의 1세대 대표 개체가 유전적으로 상당히 가까운 경우, A집단과 B집단 사이의 유래, 왕래, 공통 조상, 표현형 등의 특징들을 파악하여 두 집단의 공통 1세대 집단 대표 개체를 들 수 있다.
상기 유전적 집단 구성 판별부(200)는, 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 집단 대표 개체의 잡종 데이터를 생성하고, 잡종 데이터와 검사 대상 개체 간의 유전적 유사도에 따라 검사 대상 개체에 대한 유전적 집단 구성을 판별할 수 있다.
이를 위해 유전적 집단 구성 판별부(200)는 도 1에 도시된 바와 같이, 잡종 데이터 생성부(210) 및 검사 대상 개체 품종 판별부(220) 중 적어도 하나를 포함할 수 있다.
상기 잡종 데이터 생성부(210)는, 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 집단 대표 개체의 잡종 데이터를 생성할 수 있다. 도 4에는 교잡 과정의 예시를 보여주고 있는데, 잡종의 생성 과정에서 멘델의 유전법칙에 따라 유전자형이 결정된다. 생성된 1:1 잡종을 2세대라 하며, 새롭게 생성된 2세대 개체들을 도 3에 도시된 바와 같이 유전자형 투표를 진행해 2세대 대표 개체들을 생성할 수 있다. 하나의 2세대 대표 개체는 두 집단의 1세대 대표 개체의 유전적 정보가 50:50으로 들어가 있다. 이와 같은 방법으로 2세대 대표 개체와 1세대 대표 개체의 유전정보를 사용하여 3세대 개체에 대한 잡종 데이터를 만들 수 있다.
이와 같이 생성된 세대 별 대표 개체에 대한 잡종 데이터는 후술하는 세대 대표 개체 데이터를 생성하는 경우에도 이용될 수 있다. 예를 들어, 도 5에 도시된 바와 같이 3세대 개체에서 집단 A, 집단 B, 집단 C 가 각각 50:25:25의 구성으로 되어 있다면, 1세대 집단 A 대표와 2세대 집단 B-C 대표를 사용하여 3세대 'A:B:C=50:25:25' 개체를 만들 수 있다. 2세대 대표 개체를 만들 때와 마찬가지로 반복 교잡을 통해 3세대 개체들을 만들고, 이렇게 만들어진 3세대 개체들을 이용해 3세대 대표를 만들 수 있다.
상기 잡종 데이터 생성부(210)는, 3세대까지의 대표의 수는 중복을 포함한 조합 공식인 하기의 수식 1에 의해 결정될 수 있다. 즉, 1세대, 2세대, 3세대 및 그 이상의 세대 별 집단 대표 개체 간 반복적 교잡 시 조합을 하기의 수식 1(Equation, #Representator)에 따라 결정할 수 있다.
[수식 1]
Figure 112022017340407-pat00022
수식 1에서 Equation은 이전 세대를 고려하지 않은 m세대가 갖는 집단 대표 개체의 총 수이고, #Representator는 각 세대에서 사용하는 집단 대표 개체의 총 수이며, Equation과 #Representator의 N은 집단의 수를 의미한다. 좀 더 구체적으로, 수식 1의 Equation은 중복을 포함한 집단의 조합식을 나타내고, Equation의 n은 밝혀내고자 하는 집단의 수, m은 세대 수이다. Equation은 이전 세대의 수를 고려하지 않은 m세대에서 가질 수 있는 총 집단 대표 수를 나타낸다. #Representator의 N은 집단의 개수이며, m은 Equation과 마찬가지로 세대 수를 나타낸다. Equation은 각 세대에서 나온 집단대표의 총 수를 그리고 #Representator는 각 세대에서 직접적으로 사용하는 집단 대표의 수를 나타낸다.
상기 검사 대상 개체 품종 판별부(220)는, 잡종 데이터 생성부(210)를 통해 생성된 잡종 데이터와 검사 대상 개체 간의 유전적 유사도를 측정하고, 측정 결과에 따라 검사 대상 개체의 품종(유전적 집단 구성)을 판별할 수 있다. 좀 더 구체적으로, 검사 대상 개체 품종 판별부(220)는, 잡종 데이터 중 검사 대상 개체와 유전적 유사도를 측정하여 유사도가 가장 높은 잡종 데이터에 해당하는 집단 대표 개체의 유전적 집단구성을 검사 대상 개체의 유전적 집단구성인 것으로 추정할 수 있다. 이와 같이 특정 세대에서 어떤 집단과 가장 가까운지는 특정 세대와 그 세대 그리고 이전 세대 대표들과 새로운 개체와의 비교를 통해 확인 가능하다. 예를 들어, N의 개체가 부모세대(2세대)까지 어떤 집단과 가장 가까운지 확인하기 위해, 1,2세대 대표들과 비교하여 어떤 대표와 가장 가까운지 'Identity-By-Descent'로 확인할 수 있다. 만약 2세대 A-B대표와 가장 가깝다면, N의 유전적 집단 구성은 A-B이고, 1세대 A대표와 가장 가깝다면 N의 집단구성은 A-A로 나타난다. 본 실시예에서는 'Identity-By-Descent' 측정을 통한 분석 방법을 설명하였으나, 이외의 유전적 유사도를 측정할 수 있는 모든 방법을 포함할 수 있다.
또한, 검사 대상 개체 품종 판별부(220)는, 검사 대상 개체와 유전적 유사도가 높은 순으로 집단 대표 개체를 정렬하고, 정렬된 집단 대표 개체 별 유전적 유사도를 백분율로 환산하고, 환산된 백분율 값을 각 집단 대표 개체가 전체 집단 대표 개체 중에 차지하는 비중으로 나눈 후, 나눈 값을 양의 정수의 근사치로 추정하여 특정 세대가 아닌 다음 세대의 검사 대상 개체에 대한 유전적 집단구성을 확인할 수 있다. 검사 대상 개체 품종 판별부(220)는 특정 세대가 아닌 다음 세대 및 유전적 집단구성에 대한 백분율(percentage)를 확인하기 위하여 유전적 유사도 결과의 패턴 분석을 통해 다음 집단 혹은 백분율(percentage)를 확인할 수 있다. 여기서, 패턴 분석은 여러 테스트를 조합(ensemble)하여 그 결과를 확인함으로써 수행될 수 있다.
도 6에는 1, 2세대 대표들에 대한 유전적 유사도 결과를 이용하여 집단의 백분율 및 다음 세대의 집단의 가계를 어떻게 예측하는지에 대한 모식도가 나타나 있다. 우선, 1, 2세대 만으로 입력(Input)을 표현할 수 있는지 판단하고, 1, 2세대 만으로 표현할 수 없는 경우, 도 7에 도시된 바와 같이 유사도가 높은 순으로 정렬 후, 그 결과에 대한 패턴을 확인할 수 있다. 확인된 패턴에 따른 집단을 백분율(percentage)로 바꾸고 다음세대의 결과 수(3세대는 4개의 대표 개체 수)로 나누어 준다. 도 7의 경우 Akita, Chow-Chow, Jindo, Pungsan에 대한 결과를 백분율(percentage)로 바꾸어(55%, 29%, 8%, 8%) 이를 0.25 즉 전체 개체 중 각 개체가 차지하는 비중으로 나눈 후 근사치를 추정(반올림 방식)함으로써, 2, 1, 0.5, 0.5라는 3세대 결과를 얻을 수 있으며, 해당 결과는 검사 대상 개체의 유전적 집단 구성으로 추정할 수 있다. 또한, 1, 2세대로 예측한 3세대 결과는 Akita:Chow-Chow:Jindo:Punsan이 각각 2:1:0.5:0.5로써,이 개체는 3세대(조부모)의 Akita 두마리 Chow-Chow 한마리 Jindo와 Pungan 1:1 mix를 한 마리를 가지고 있다.
본 실시예에서 지형적 및 외형적 집단을 중심으로 설명하였으나, 질병 집단 및 대조군 집단, 혹은 특정 표현형으로 나뉠 수 있는 모든 집단을 대상으로 실시할 수 있다. 만약, 여러 질병의 집단군과 비 질병 집단으로 구성된 데이터 세트가 존재하는 경우 본 실시예를 통해 데이터 세트에 속하지 않은 타 샘플이 어느 질병 집단군들과 가까운지 확인할 수 있다. 이를 통해, 특정 개체가 어느 질병에 더 취약 한지 판별할 수 있다. 이는 기존의 특정 바이오 마커를 통해 질병의 위험을 측정하는 방법들과 더불어 결과를 추가적으로 제공 및 보완할 수 있다.
도 8은 본 발명의 다른 실시예에 따른 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 방법의 전체 구성을 나타낸 흐름도이다.
도 8을 참조하면, 본 발명의 다른 실시예에 따른 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 방법(S1000)은 집단 대표 개체 선정 단계(S100)와 유전적 집단 구성 판별 단계(S200) 중 적어도 하나를 포함할 수 있다.
상기 집단 대표 개체 선정 단계(S100)는, 동종 집단 내 개체에 대하여 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 출현 빈도수에 따라 동종 집단 별 집단 대표 개체를 선정할 수 있다.
이를 위해 집단 대표 개체 선정 단계(S100)는 도 8에 도시된 바와 같이 유전체 데이터 수집 단계(S110), 동종 집단 분류 단계(S120) 및 집단 대표 개체 유전체 생성 단계(S130) 중 적어도 하나를 포함할 수 있다.
상기 유전체 데이터 수집 단계(S110)는, 집단(ex. 지형적 및 외형적 집단) 별 유전체 데이터(sanger, NSG, micro-array 등)을 다량으로 수집하고, 수집된 유전체 데이터를 집단 별로 저장 관리할 수 있다.
상기 동종 집단 분류 단계(S120)는, 유전체 데이터 수집 단계(S110)를 통해 수집된 다량의 유전체 데이터를 이용하여 집단 간의 유전적 유사도를 측정하고, 측정 결과에 따라 동종 집단으로 군집화하여 분류할 수 있다. 이러한 동종 집단 분류 단계(S120)는, 집단 별 유사도에 따라 동종 집단으로 분류할 수 있는 집단을 동종 집단으로 군집화하고, 그에 따른 데이터를 축적할 수 있다. 동종 집단 분류 단계(S120)는 도 2에 도시된 'Admixture' 방법이나, 'Structure' 방법 등 집단 내 개인간 유전적 유사도를 측정하는 방법을 적용하여 같은 집단임을 밝혀 합쳐줄 수 있을 뿐만 아니라, 이와 같은 방법을 통해 집단의 구성원이 아닌 다른 개체를 제거할 수 있다. 이와는 다른 방법으로 출처가 다르게 수집된 경우 집단의 명칭의 다를 수 있게 처리할 수 있다.
상기 집단 대표 개체 유전체 생성 단계(S130)는, 동종 집단 내 개체들 간의 동일 유전적 위치마다 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 출현 빈도수에 따라 동종 집단 별 집단 대표 개체를 선정하여 선정된 집단 대표 개체에 대한 유전체를 생성할 수 있다.
좀 더 구체적으로, 또한, 집단 대표 개체 유전체 생성 단계(S130)는 집단 대표 개체 유전체 생성 단계(S130)는, 출현 빈도수가 가장 많은 개체를 1세대의 집단 대표 개체로 선정하되, 동률의 유전자형을 갖는 둘 이상의 개체들에 대하여 무작위 방식으로 집단 대표 개체를 선정할 수 있다. 즉, 집단 내의 개체들 간 각 유전적 위치마다 유전자형 출현 빈도수 측정 통해 집단 대표를 만드는 과정에서 예를 들어 도 3에 도시된 바와 같이 동률의 유전자형일 시 무작위로 선정할 수 있다.
또한, 집단 대표 개체 유전체 생성 단계(S130)는, 출현 빈도수가 미리 설정된 기준 빈도수 이하인 경우 해당 개체를 제거할 수 있다. 유전자형 출현빈도수를 측정함으로써 동종 집단 분류 단계(S120)를 통해 걸러지지 않은 불순 개체가 존재하는 경우, 유전자형 출현빈도수 측정을 통해 불순 개체의 유전형을 제거할 수 있는 효과가 있다. 예를 들어, 100명의 한국인으로 구성된 집단을 수집했을 때 한 명의 일본인이 동종 집단 분류 단계(S120)를 통해 걸러지지 않았다면, 유전자형의 출현빈도수 측정을 통해, 99명의 한국인의 보편적으로 가지고 있는 유전형이 채택되어 한 명의 일본인의 효과를 최대로 낮출 수 있다.
또한, 집단 대표 개체 유전체 생성 단계(S130)는, 동일 세대 내에서 집단 대표 개체 간의 유전적 유사도를 측정하고, 미리 설정된 기준 유사도 이상인 경우 해당 집단 대표 개체를 하나의 공통 집단 대표 개체로 선정할 수 있다. 본 실시예에서 가장 처음 만들어진 집단의 대표 개체를 1세대 집단 대표 개체라 할 때, 1세대 집단 대표 개체는 그 집단에서 자주 나타나는 유전체의 구조 및 유전자형에 대한 정보의 집합체를 의미하게 된다. 만약, A집단의 1세대 대표 개체와 B집단의 1세대 대표 개체가 유전적으로 상당히 가까운 경우, A집단과 B집단 사이의 유래, 왕래, 공통 조상, 표현형 등의 특징들을 파악하여 두 집단의 공통 1세대 집단 대표 개체를 들 수 있다.
상기 유전적 집단 구성 판별 단계(S200)는, 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 집단 대표 개체의 잡종 데이터를 생성하고, 잡종 데이터와 검사 대상 개체 간의 유전적 유사도에 따라 검사 대상 개체에 대한 유전적 집단 구성을 판별할 수 있다.
이를 위해 유전적 집단 구성 판별 단계(S200)는 도 8에 도시된 바와 같이, 잡종 데이터 생성 단계(S210) 및 검사 대상 개체 품종 판별 단계(S220) 중 적어도 하나를 포함할 수 있다.
상기 잡종 데이터 생성 단계(S210)는, 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 집단 대표 개체의 잡종 데이터를 생성할 수 있다. 도 4에는 교잡 과정의 예시를 보여주고 있는데, 잡종의 생성 과정에서 멘델의 유전법칙에 따라 유전자형이 결정된다. 생성된 1:1 잡종을 2세대라 하며, 새롭게 생성된 2세대 개체들을 도 3에 도시된 바와 같이 유전자형 투표를 진행해 2세대 대표 개체들을 생성할 수 있다. 하나의 2세대 대표 개체는 두 집단의 1세대 대표 개체의 유전적 정보가 50:50으로 들어가 있다. 이와 같은 방법으로 2세대 대표 개체와 1세대 대표 개체의 유전정보를 사용하여 3세대 개체에 대한 잡종 데이터를 만들 수 있다.
이와 같이 생성된 세대 별 대표 개체에 대한 잡종 데이터는 후술하는 세대 대표 개체 데이터를 생성하는 경우에도 이용될 수 있다. 예를 들어, 도 5에 도시된 바와 같이 3세대 개체에서 집단 A, 집단 B, 집단 C 가 각각 50:25:25의 구성으로 되어 있다면, 1세대 집단 A 대표와 2세대 집단 B-C 대표를 사용하여 3세대 'A:B:C=50:25:25' 개체를 만들 수 있다. 2세대 대표 개체를 만들 때와 마찬가지로 반복 교잡을 통해 3세대 개체들을 만들고, 이렇게 만들어진 3세대 개체들을 이용해 3세대 대표를 만들 수 있다.
상기 잡종 데이터 생성 단계(S210)는, 3세대까지의 대표의 수는 중복을 포함한 조합 공식인 하기의 수식 2에 의해 결정될 수 있다. 즉, 1세대, 2세대, 3세대 및 그 이상의 세대 별 집단 대표 개체 간 반복적 교잡 시 조합을 하기의 수식 2(Equation, #Representator)에 따라 결정할 수 있다.
[수식 2]
Figure 112022017340407-pat00023
수식 2에서 Equation은 이전 세대를 고려하지 않은 m세대가 갖는 집단 대표 개체의 총 수이고, #Representator는 각 세대에서 사용하는 집단 대표 개체의 총 수이며, Equation과 #Representator의 N은 집단의 수를 의미한다. 좀 더 구체적으로, 수식 2의 Equation은 중복을 포함한 집단의 조합식을 나타내고, Equation의 n은 밝혀내고자 하는 집단의 수, m은 세대 수이다. Equation은 이전 세대의 수를 고려하지 않은 m세대에서 가질 수 있는 총 집단 대표 수를 나타낸다. #Representator의 N은 집단의 개수이며, m은 Equation과 마찬가지로 세대 수를 나타낸다. Equation은 각 세대에서 나온 집단대표의 총 수를 그리고 #Representator는 각 세대에서 직접적으로 사용하는 집단 대표의 수를 나타낸다.
상기 검사 대상 개체 품종 판별 단계(S220)는, 잡종 데이터 생성 단계(S210)를 통해 생성된 잡종 데이터와 검사 대상 개체 간의 유전적 유사도를 측정하고, 측정 결과에 따라 검사 대상 개체의 품종(유전적 집단 구성)을 판별할 수 있다. 좀 더 구체적으로, 검사 대상 개체 품종 판별 단계(S220)는, 잡종 데이터 중 검사 대상 개체와 유전적 유사도를 측정하여 유사도가 가장 높은 잡종 데이터에 해당하는 집단 대표 개체의 유전적 집단구성을 검사 대상 개체의 유전적 집단구성인 것으로 추정할 수 있다. 이와 같이 특정 세대에서 어떤 집단과 가장 가까운지는 특정 세대와 그 세대 그리고 이전 세대 대표들과 새로운 개체와의 비교를 통해 확인 가능하다. 예를 들어, N의 개체가 부모세대(2세대)까지 어떤 집단과 가장 가까운지 확인하기 위해, 1,2세대 대표들과 비교하여 어떤 대표와 가장 가까운지 'Identity-By-Descent'로 확인할 수 있다. 만약 2세대 A-B대표와 가장 가깝다면, N의 유전적 집단 구성은 A-B이고, 1세대 A대표와 가장 가깝다면 N의 집단구성은 A-A로 나타난다. 본 실시예에서는 'Identity-By-Descent' 측정을 통한 분석 방법을 설명하였으나, 이외의 유전적 유사도를 측정할 수 있는 모든 방법을 포함할 수 있다.
또한, 검사 대상 개체 품종 판별 단계(S220)는, 검사 대상 개체와 유전적 유사도가 높은 순으로 집단 대표 개체를 정렬하고, 정렬된 집단 대표 개체 별 유전적 유사도를 백분율로 환산하고, 환산된 백분율 값을 각 집단 대표 개체가 전체 집단 대표 개체 중에 차지하는 비중으로 나눈 후, 나눈 값을 양의 정수의 근사치로 추정하여 특정 세대가 아닌 다음 세대의 검사 대상 개체에 대한 유전적 집단구성을 확인할 수 있다. 검사 대상 개체 품종 판별 단계(S220)는 특정 세대가 아닌 다음 세대 및 유전적 집단구성에 대한 백분율(percentage)를 확인하기 위하여 유전적 유사도 결과의 패턴 분석을 통해 다음 집단 혹은 백분율(percentage)를 확인할 수 있다. 여기서, 패턴 분석은 여러 테스트를 조합(ensemble)하여 그 결과를 확인함으로써 수행될 수 있다.
도 6에는 1, 2세대 대표들에 대한 유전적 유사도 결과를 이용하여 집단의 백분율 및 다음 세대의 집단의 가계를 어떻게 예측하는지에 대한 모식도가 나타나 있다. 우선, 1, 2세대 만으로 입력(Input)을 표현할 수 있는지 판단하고, 1, 2세대 만으로 표현할 수 없는 경우, 도 7에 도시된 바와 같이 유사도가 높은 순으로 정렬 후, 그 결과에 대한 패턴을 확인할 수 있다. 확인된 패턴에 따른 집단을 백분율(percentage)로 바꾸고 다음세대의 결과 수(3세대는 4개의 대표 개체 수)로 나누어 준다. 도 7의 경우 Akita, Chow-Chow, Jindo, Pungsan에 대한 결과를 백분율(percentage)로 바꾸어(55%, 29%, 8%, 8%) 이를 0.25 즉 전체 개체 중 각 개체가 차지하는 비중으로 나눈 후 근사치를 추정(반올림 방식)함으로써, 2, 1, 0.5, 0.5라는 3세대 결과를 얻을 수 있으며, 해당 결과는 검사 대상 개체의 유전적 집단 구성으로 추정할 수 있다. 또한, 1, 2세대로 예측한 3세대 결과는 Akita:Chow-Chow:Jindo:Punsan이 각각 2:1:0.5:0.5로써,이 개체는 3세대(조부모)의 Akita 두마리 Chow-Chow 한마리 Jindo와 Pungan 1:1 mix를 한 마리를 가지고 있다.
이하에서는 본 발명의 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 시스템과 방법에 대한 실험예에 대하여 설명한다.
본 실시예에 따른 방법론을 활용하여 개 품종 판별 분석을 진행하였다. 총 8,344 마리 200 이상의 품 종(집단)이 수집되었으며 하기의 표 1과 도 2에 도시된 방법, 그리고 영국 켄넬클럽(Kennell Club)에 등록된 품종만을 사용하였을 때, 129 품 종(집단) 6,799마리의 개를 본 실험예에 적용하였다.
Figure 112021133981305-pat00005
<표 1>
만들어진 집단 대표들을 테스트하기 위해 하기의 표 2에 도시된 바와 같이 7:3 Training Test 분할을 실시하였다.
Figure 112021133981305-pat00006
<표 2>
표 2를 참조하면, Training set 4,793마리, Test set 1,976 마리로 분할하였으며, 품종 별 데이터 수가 다르기 때문에, 고려하여 7:3으로 맞추었다.
또한, 도 3에 도시된 바와 같이 유전자형 투표를 통해 129 마리의 집단 대표 표준 게놈을 생성하였으며, 도 4에 도시된 멘델의 유전법칙을 이용하여 2세대 집단을 다량 생성하였, 도 3에 도시된 방법으로 다시 투표를 통해 8,256 마리의 2세대 잡종 대표 표준게놈을 만들었다.
이와 같이, 도 3, 도 4, 도 5에 도시된 방법을 통해 3세대 잡종 대표 표준 게놈 약 1,200만 마리를 생성하였다. 만들어진 표준게놈 데이터의 수는 하기의 표 3에 나타나 있으며, 이는 수식 1 및 수식 2에 따른 수이다.
Figure 112021133981305-pat00007
<표 3>
본 실험예에 다른 테스트를 위한 잡종 데이터를 생산하기 위해 테스트 데이터 세트 1976마리를 무작위로 교잡하여 표 1에 나타낸 바와 같이 50:50, 25:25:25:25, 75:25, 50:25:25 비율의 조합을 각각 500마리씩 만들었다. 순종 1,976마리, 시뮬레이션으로 생성된 잡종 2천 마리로 총 3,976마리의 테스트 데이터로 테스트를 진행하였다. 도 6 및 도 7에 도시된 방법을 통해 4세대 구성 품종들을 확인 하였고, 결과는 표 1에 나타나 있다.
여기서, 특이점은 3세대까지 비교를 하기 위해선 약 1,200만번의 유사도 측정 테스트를 진행 하여야 하지만, 1, 2세대의 테스트를 먼저 진행하여(8,385번), 가장 가까운 두 품종을 고정하고, 3세대 테스트를 진행하였다. 따라서 테스트 진행 횟수는 8,385+8,385 번, 총 16,770(0.14%)의 비교만을 진행하였다.
많은 품종의 잡종으로 만들어진 잭러셀 테리어는 많은 품종들과 유전적 유사도가 높은 특성을 보인다. 이러한 특성을 조정 하기 위해 도 6에 도시된 조합 테스트에서 한 항을 추가해 잭러셀 테리어의 효과를 조정한다.
본 실험예에 따르면, 개 129 품 종 4천 마리를 집단 대표 개체 생성부를 통해 3세대까지의 집단 대표 개체들을 만들고, 또 다른 약 4천마리(1,976마리는 실제 유전체 데이터, 2천마리는 simulated mix data)를 통해 유전적 집단 구성 판별부를 통해 4세대 집단구성을 확인하였으며, 4세대 변환 결과 TPR(True positive Rate)는 평균 93.4%로 준수한 결과를 얻을 수 있었다.
이하 상술한 실험예의 비교예에 대하여 설명하면 다음과 같다.
Labradodle은 Labrado-Retriver와 Poodle의 잡종이다. 하기의 표 4에서는 Labradoodle의 유전체 데이터를 본 실시예의 시스템 및 방법에 적용하였을 때, 품종 구성을 어떻게 맞추는지 볼 수 있다.
Figure 112021133981305-pat00008
<표 4>
Cane-Corse는 본 발명에 사용된 표준게놈에는 존재하지 않는 품 종이다(표 2 참조). 그러나, 어떤 해당 품종이 어떤 품종들의 조합으로 이루어져 있는지는 확인할 수 있다. 실제로, American Kennel Club에 따르면 Neapolitan Mastiff와 가장 제일 가까운 품 종이라고 명시되어 있으며, 결과 또한 하기의 표 5와 같이 가장 많은 Nepolitan-Mastiff와 다른 품 종 들의 조합을 얻을 수 있었다
Figure 112021133981305-pat00009
<표 5>
본 발명은 대표개체 생성을 통한 유전적 특성 보존이 가능하다. 예를 들어, 한국인과 일본인 영국인을 합친 집단에서 특정 암 대표 유전체를 만들 때, 지역적 차이 때문에, 많은 유전적 위치에서 서로 다름이 관찰될 것이다. 하지만, 유전적 공통 부분에 대한 보존의 개념으로 접근 시, 인구집단의 다양성은 사라지고 암 특이적 유전좌위(Genetic locus) 추출이 가능하다.
이상에서 설명한 것은 본 발명에 의한 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 시스템 및 방법을 실시하기 위한 하나의 실시예에 불과한 것으로서, 본 발명은 상기 실시예에 한정되지 않고, 이하의 특허청구범위에서 청구하는 바와 같이 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변경 실시가 가능한 범위까지 본 발명의 기술적 정신이 있다고 할 것이다.
1000: 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 시스템
100: 집단 대표 개체 선정부
110: 유전체 데이터 수집부
120: 동종 집단 분류부
130: 집단 대표 개체 유전체 생성부
200: 유전적 집단 구성 판별부
210: 잡종 데이터 생성부
220: 검사 대상 개체 품종 판별부
S1000: 집단 및 잡종의 특이적 표준게놈 데이터를 이용한 유전적 집단 구성 판별 방법
S100: 집단 대표 개체 선정 단계
S110: 유전체 데이터 수집 단계
S120: 동종 집단 분류 단계
S130: 집단 대표 개체 유전체 생성 단계
S200: 유전적 집단 구성 판별 단계
S210: 잡종 데이터 생성 단계
S220: 검사 대상 개체 품종 판별 단계

Claims (20)

  1. 동종 집단 내 개체에 대하여 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 상기 출현 빈도수에 따라 상기 동종 집단 별 집단 대표 개체를 선정하는 집단 대표 개체 선정부; 및
    상기 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 상기 집단 대표 개체의 잡종 데이터를 생성하고, 상기 잡종 데이터와 검사 대상 개체 간의 유전적 유사도에 따라 검사 대상 개체에 대한 유전적 집단 구성을 판별하는 유전적 집단 구성 판별부를 포함하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템.
  2. 제1 항에 있어서,
    상기 집단 대표 개체 선정부는,
    집단 별로 유전체 데이터를 수집하는 유전체 데이터 수집부;
    상기 유전체 데이터를 이용하여 집단 간의 유전적 유사도를 측정하고, 측정 결과에 따라 동종 집단으로 군집화하여 분류하는 동종 집단 분류부; 및
    상기 동종 집단 내 개체들 간의 동일 유전적 위치마다 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 상기 출현 빈도수에 따라 상기 동종 집단 별 집단 대표 개체를 선정하여 선정된 상기 집단 대표 개체에 대한 유전체를 생성하는 집단 대표 개체 유전체 생성부를 포함하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템.
  3. 제2 항에 있어서,
    상기 동종 집단 분류부는,
    동종 집단으로 군집화되지 않은 개체들을 제거하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템.
  4. 제2 항에 있어서,
    상기 집단 대표 개체 유전체 생성부는,
    상기 출현 빈도수가 가장 많은 개체를 상기 집단 대표 개체로 선정하되, 동률의 유전자형을 갖는 둘 이상의 개체들에 대하여 무작위 방식으로 상기 집단 대표 개체를 선정하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템.
  5. 제2 항에 있어서,
    상기 집단 대표 개체 유전체 생성부는,
    상기 출현 빈도수가 미리 설정된 기준 빈도수 이하인 경우 해당 개체를 제거하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템.
  6. 제2 항에 있어서,
    상기 집단 대표 개체 유전체 생성부는,
    동일 세대 내에서 상기 집단 대표 개체 간의 유전적 유사도를 측정하고, 미리 설정된 기준 유사도 이상인 경우 해당 집단 대표 개체를 하나의 공통 집단 대표 개체로 선정하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템.
  7. 제1 항에 있어서,
    상기 유전적 집단 구성 판별부는,
    상기 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 상기 집단 대표 개체의 잡종 데이터를 생성하는 잡종 데이터 생성부; 및
    상기 잡종 데이터와 검사 대상 개체 간의 유전적 유사도를 측정하고, 측정 결과에 따라 검사 대상 개체의 품종을 판별하는 검사 대상 개체 품종 판별부를 포함하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템.
  8. 제7 항에 있어서,
    상기 잡종 데이터 생성부는,
    1세대, 2세대, 3세대 및 그 이상의 세대 별 집단 대표 개체 간 반복적 교잡 시 조합을 하기의 수식(Equation, #Representator)에 따라 결정하고,
    Figure 112022017340407-pat00024

    상기 Equation은 이전 세대를 고려하지 않은 m세대가 갖는 집단 대표 개체의 총 수이고,
    상기 #Representator는 각 세대에서 사용하는 집단 대표 개체의 총 수이고,
    상기 Equation과 #Representator의 N은 집단의 수이고,
    상기 Equation의 n은 밝혀내고자 하는 집단의 수인 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템.
  9. 제7 항에 있어서,
    상기 검사 대상 개체 품종 판별부는,
    상기 잡종 데이터 중 상기 검사 대상 개체와 유전적 유사도가 가장 높은 잡종 데이터에 해당하는 집단 대표 개체의 유전적 집단구성을 상기 검사 대상 개체의 유전적 집단구성인 것으로 추정하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템.
  10. 제7 항에 있어서,
    상기 검사 대상 개체 품종 판별부는,
    검사 대상 개체와 유전적 유사도가 높은 순으로 집단 대표 개체를 정렬하고, 정렬된 집단 대표 개체 별 유전적 유사도를 백분율로 환산하고, 환산된 백분율 값을 각 집단 대표 개체가 전체 집단 대표 개체 중에 차지하는 비중으로 나눈 후, 나눈 값을 양의 정수의 근사치로 추정하여 특정 세대가 아닌 다음 세대의 검사 대상 개체에 대한 유전적 집단구성을 확인하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템.
  11. 동종 집단 내 개체에 대하여 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 상기 출현 빈도수에 따라 상기 동종 집단 별 집단 대표 개체를 선정하는 집단 대표 개체 선정 단계; 및
    상기 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 상기 집단 대표 개체의 잡종 데이터를 생성하고, 상기 잡종 데이터와 검사 대상 개체 간의 유전적 유사도에 따라 검사 대상 개체에 대한 유전적 집단 구성을 판별하는 유전적 집단 구성 판별 단계를 포함하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 방법.
  12. 제11 항에 있어서,
    상기 집단 대표 개체 선정 단계는,
    집단 별로 유전체 데이터를 수집하는 유전체 데이터 수집 단계;
    상기 유전체 데이터를 이용하여 집단 간의 유전적 유사도를 측정하고, 측정 결과에 따라 동종 집단으로 군집화하여 분류하는 동종 집단 분류 단계; 및
    상기 동종 집단 내 개체들 간의 동일 유전적 위치마다 미리 선정된 유전자형의 출현 빈도수를 측정하고, 측정된 상기 출현 빈도수에 따라 상기 동종 집단 별 집단 대표 개체를 선정하여 선정된 상기 집단 대표 개체에 대한 유전체를 생성하는 집단 대표 개체 유전체 생성 단계를 포함하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 방법.
  13. 제12 항에 있어서,
    상기 동종 집단 분류 단계는,
    동종 집단으로 군집화되지 않은 개체들을 제거하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 방법.
  14. 제12 항에 있어서,
    상기 집단 대표 개체 유전체 생성 단계는,
    상기 출현 빈도수가 가장 많은 개체를 상기 집단 대표 개체로 선정하되, 동률의 유전자형을 갖는 둘 이상의 개체들에 대하여 무작위 방식으로 상기 집단 대표 개체를 선정하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 방법.
  15. 제12 항에 있어서,
    상기 집단 대표 개체 유전체 생성 단계는,
    상기 출현 빈도수가 미리 설정된 기준 빈도수 이하인 경우 해당 개체를 제거하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 방법.
  16. 제12 항에 있어서,
    상기 집단 대표 개체 유전체 생성 단계는,
    동일 세대 내에서 상기 집단 대표 개체 간의 유전적 유사도를 측정하고, 미리 설정된 기준 유사도 이상인 경우 해당 집단 대표 개체를 하나의 공통 집단 대표 개체로 선정하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 방법.
  17. 제11 항에 있어서,
    상기 유전적 집단 구성 판별 단계는,
    상기 집단 대표 개체 간의 반복적 교잡을 통해 세대 별로 상기 집단 대표 개체의 잡종 데이터를 생성하는 잡종 데이터 생성 단계; 및
    상기 잡종 데이터와 검사 대상 개체 간의 유전적 유사도를 측정하고, 측정 결과에 따라 검사 대상 개체의 품종을 판별하는 검사 대상 개체 품종 판별 단계를 포함하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 방법.
  18. 제17 항에 있어서,
    상기 잡종 데이터 생성 단계는,
    1세대, 2세대, 3세대 및 그 이상의 세대 별 집단 대표 개체 간 반복적 교잡 시 조합을 하기의 수식(Equation, #Representator)에 따라 결정하고,
    Figure 112022017340407-pat00025

    상기 Equation은 이전 세대를 고려하지 않은 m세대가 갖는 집단 대표 개체의 총 수이고,
    상기 #Representator는 각 세대에서 사용하는 집단 대표 개체의 총 수이고,
    상기 Equation과 #Representator의 N은 집단의 수이고,
    상기 Equation의 n은 밝혀내고자 하는 집단의 수인 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 방법.
  19. 제17 항에 있어서,
    상기 검사 대상 개체 품종 판별 단계는,
    상기 잡종 데이터 중 상기 검사 대상 개체와 유전적 유사도가 가장 높은 잡종 데이터에 해당하는 집단 대표 개체의 유전적 집단구성을 상기 검사 대상 개체의 유전적 집단구성인 것으로 추정하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 방법.
  20. 제17 항에 있어서,
    상기 검사 대상 개체 품종 판별 단계는,
    검사 대상 개체와 유전적 유사도가 높은 순으로 집단 대표 개체를 정렬하고, 정렬된 집단 대표 개체 별 유전적 유사도를 백분율로 환산하고, 환산된 백분율 값을 각 집단 대표 개체가 전체 집단 대표 개체 중에 차지하는 비중으로 나눈 후, 나눈 값을 양의 정수의 근사치로 추정하여 특정 세대가 아닌 다음 세대의 검사 대상 개체에 대한 유전적 집단구성을 확인하는 것을 특징으로 하는 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 방법.
KR1020210160791A 2021-11-19 2021-11-19 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법 KR102405758B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210160791A KR102405758B1 (ko) 2021-11-19 2021-11-19 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법
PCT/KR2022/018119 WO2023090861A1 (ko) 2021-11-19 2022-11-16 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210160791A KR102405758B1 (ko) 2021-11-19 2021-11-19 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR102405758B1 true KR102405758B1 (ko) 2022-06-08

Family

ID=81981685

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210160791A KR102405758B1 (ko) 2021-11-19 2021-11-19 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법

Country Status (2)

Country Link
KR (1) KR102405758B1 (ko)
WO (1) WO2023090861A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023090861A1 (ko) * 2021-11-19 2023-05-25 주식회사 클리노믹스 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080255768A1 (en) 2006-01-18 2008-10-16 Martin Lucas Methods of determining relative genetic likelihoods of an individual matching a population
US8620594B2 (en) 2009-10-20 2013-12-31 Genepeeks, Inc. Method and system for generating a virtual progeny genome
US20170004256A1 (en) 2014-03-24 2017-01-05 Kabushiki Kaisha Toshiba Methods and apparatuses for generating reference genome data, generating difference genome data, and recovering data
US20170017757A1 (en) 2012-08-28 2017-01-19 Inova Health System Ancestral-specific reference genomes and methods of constructing
US20170199959A1 (en) 2016-01-13 2017-07-13 Seven Bridges Genomics Inc. Genetic analysis systems and methods
WO2017210542A1 (en) 2016-06-03 2017-12-07 The Children's Medical Center Corporation Cross-genera target genome capture and analysis
EP3588506A1 (en) 2018-06-29 2020-01-01 Molecular Health GmbH Systems and methods for genomic and genetic analysis
KR102138165B1 (ko) 2020-01-02 2020-07-27 주식회사 클리노믹스 국가, 민족, 및 인종별 표준게놈지도를 이용한 정체성 분석 서비스 제공 방법
KR20210089073A (ko) 2020-01-07 2021-07-15 주식회사 클리노믹스 유전자 정보에 기반한 품종정보 제공 시스템 및 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102139646B1 (ko) * 2019-12-31 2020-07-30 주식회사 클리노믹스 동물의 품종 별 표준게놈지도를 이용한 유전적 품종 정보 제공 시스템 및 그 방법
KR20210129977A (ko) * 2020-04-21 2021-10-29 주식회사 클리노믹스 개체 개별 표준게놈지도의 생성 방법 및 그 시스템
KR102405758B1 (ko) * 2021-11-19 2022-06-08 주식회사 클리노믹스 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080255768A1 (en) 2006-01-18 2008-10-16 Martin Lucas Methods of determining relative genetic likelihoods of an individual matching a population
US8620594B2 (en) 2009-10-20 2013-12-31 Genepeeks, Inc. Method and system for generating a virtual progeny genome
US20170017757A1 (en) 2012-08-28 2017-01-19 Inova Health System Ancestral-specific reference genomes and methods of constructing
US20170004256A1 (en) 2014-03-24 2017-01-05 Kabushiki Kaisha Toshiba Methods and apparatuses for generating reference genome data, generating difference genome data, and recovering data
US20170199959A1 (en) 2016-01-13 2017-07-13 Seven Bridges Genomics Inc. Genetic analysis systems and methods
WO2017210542A1 (en) 2016-06-03 2017-12-07 The Children's Medical Center Corporation Cross-genera target genome capture and analysis
EP3588506A1 (en) 2018-06-29 2020-01-01 Molecular Health GmbH Systems and methods for genomic and genetic analysis
KR102138165B1 (ko) 2020-01-02 2020-07-27 주식회사 클리노믹스 국가, 민족, 및 인종별 표준게놈지도를 이용한 정체성 분석 서비스 제공 방법
KR20210089073A (ko) 2020-01-07 2021-07-15 주식회사 클리노믹스 유전자 정보에 기반한 품종정보 제공 시스템 및 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
J. Harmoineh 외, BMC Genomics (2021) 22:473., 2020.10.30. *
W. Kriangwanich 외, PeerJ8:e10215, 2020.10.30. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023090861A1 (ko) * 2021-11-19 2023-05-25 주식회사 클리노믹스 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법

Also Published As

Publication number Publication date
WO2023090861A1 (ko) 2023-05-25

Similar Documents

Publication Publication Date Title
Wolc et al. Genome‐wide association analysis and genetic architecture of egg weight and egg uniformity in layer chickens
AU2011261447B2 (en) Methods and compositions for predicting unobserved phenotypes (PUP)
CN109346130A (zh) 一种直接从全基因组重测序数据中得到微单体型及其分型的方法
KR102206211B1 (ko) 문치가자미 친자 식별용 유전자 마커 및 이를 이용한 친자 확인방법
KR102405758B1 (ko) 집단과 질병군, 품종 등의 혼합체 또는 잡종의 특이적 표준게놈 데이터 생성과 유전적 집단 구성 판별 시스템 및 방법
CN105404793A (zh) 基于概率框架和重测序技术快速发现表型相关基因的方法
CN109207606A (zh) 用于亲权鉴定的ssr位点的筛选方法和应用
Fan et al. Development and validation of a 1 K sika deer (Cervus nippon) SNP Chip
KR101539737B1 (ko) 유전체 정보와 분자마커를 이용한 여교잡 선발의 효율성 증진 기술
CN108875307A (zh) 一种基于孕妇外周血中胎儿游离dna的亲子鉴定方法
Daïnou et al. DNA taxonomy in the timber genus Milicia: evidence of unidirectional introgression in the West African contact zone
CN105052729B (zh) 一种基于受选择位点指数评估动植物品种育种潜力的方法
CN117095745A (zh) 用于检测孕妇血浆游离dna中胎儿非整倍体和拷贝数变异的方法和装置及应用
CN108416189B (zh) 一种基于分子标记技术的农作物品种杂种优势模式鉴定方法
CN107871060B (zh) 基于dna标记的犬类品系鉴定方法
CN113096734B (zh) 一种筛选用于二倍体群体亲子鉴定的分子标记组合的方法
CN111826429B (zh) 一种基于简化基因组测序和snp次等位基因频率的非杂交后代鉴定方法
KR20220091223A (ko) 품종 식별이 가능한 유전마커 선발 시스템 및 이를 이용한 품종 식별방법
CN112102880A (zh) 品种鉴定的方法、其预测模型的构建方法和装置
CN111051537B (zh) 确定snp位点集合的方法、装置及其应用
Raffini et al. Phenotypic divergence and genomic architecture at two different stages of speciation in a marine snail
KR101911307B1 (ko) 유전자 단위에서 단상형을 구분하는 태그-snp 선발 및 활용 기술
US20140136121A1 (en) Method for assembling sequenced segments
US20030170638A1 (en) Methods to determine genetic risk through analysis of very large families
Garrick et al. Opportunities and challenges for genomic selection of beef cattle

Legal Events

Date Code Title Description
GRNT Written decision to grant