KR102163657B1 - 넙치 유전자형 분석을 이용한 전형매관계 분석방법 - Google Patents

넙치 유전자형 분석을 이용한 전형매관계 분석방법 Download PDF

Info

Publication number
KR102163657B1
KR102163657B1 KR1020180066025A KR20180066025A KR102163657B1 KR 102163657 B1 KR102163657 B1 KR 102163657B1 KR 1020180066025 A KR1020180066025 A KR 1020180066025A KR 20180066025 A KR20180066025 A KR 20180066025A KR 102163657 B1 KR102163657 B1 KR 102163657B1
Authority
KR
South Korea
Prior art keywords
relationship
analysis
blood
genotyping
ibd
Prior art date
Application number
KR1020180066025A
Other languages
English (en)
Other versions
KR20190139480A (ko
Inventor
한지성
이우재
Original Assignee
주식회사 불루젠코리아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 불루젠코리아 filed Critical 주식회사 불루젠코리아
Priority to KR1020180066025A priority Critical patent/KR102163657B1/ko
Publication of KR20190139480A publication Critical patent/KR20190139480A/ko
Application granted granted Critical
Publication of KR102163657B1 publication Critical patent/KR102163657B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

마커를 기반으로 혈연관계를 파악하고자 하는 개체들의 유전자형을 분석하는 단계(가); 상기 (가)단계의 결과로 유전자형 분석결과 데이터를 입력하는 단계(나); 상기 (나)단계의 유전자형 분석결과의 데이터로부터 대립유전자빈도를 입력하는 단계(다); 혈연관계를 파악하고자 하는 개체 사이의 대립유전자형의 일치여부를 비교하고, 상기 대립유전자형의 일치되는 경우의 수에 따른 IBD공식을 설정하며, 상기 설정된 IBD공식에 혈연관계에 대한 경우의 수에 따른 IBD상수를 적용하여 혈연관계지수(likelihood ratio)를 추출하는 단계(라); 상기 (라)단계의 가장 높은 수치의 확률결과를 확인하여 혈연관계를 결정하는 단계(마)로 이루어진 유전자형 분석을 이용한 혈연관계분석 방법을 제공함으로써, 분석 과정 간소화로 인해 짧은 시간에 분석이 가능하여 업무에 대한 정확성, 효율성, 간편성, 전문성이 향상되고 나아가 가계확인, 선발육종, 방류효과조사(방류종자에 대한 형제관계분석)에서 정확한 결과를 제공할 수 있다.

Description

넙치 유전자형 분석을 이용한 전형매관계 분석방법 {Full siblings analysis using Genotyping}
본 발명은 단순반복염기서열(simple sequence repeat, SSR) 부위의 초위성체마커(Microsatellite marker)의 분석 결과에 대한 누적되는 대립유전자빈도데이터(Allele frequency data)를 이용하여 보다 높은 신뢰도로 혈연관계를 분석할 수 있는 넙치 유전자형 분석을 이용한 전형매관계분석 방법에 관한 것이다.
생명체의 모든 생물학적 형질들은 핵산(DNA)이라는 화학물질로 구성된 유전정보에 의해 결정된다는 것이 밝혀진 이래로 유전정보의 이해 및 이를 통한 유전정보의 산업적, 의학적 이용을 위한 많은 새로운 연구방법들이 개발되었다.
DNA marker란 염색체상에 존재하는 짧은 DNA부분을 지칭하는 용어로 분자표지 또는 DNA표지로 불린다. 실험학적인 측면에서 크게 두 가지 용도로 사용된다. 첫째는 유전자형의 차이에 의한 개체식별이며, 이를 통하여 염색체상에서 특정 염색체 부위의 부계유전 또는 모계유전과 같은 후대전달양식의 추정을 가능하게 해준다. 둘째는 염색체상에서 특정 DNA부분의 위치를 나타내기 위한 용도이다. 이를 통하여 DNA library에 내포되어 있는 DNA단편들을 하나의 큰 단위로 연결시키는 것을 가능하게 한다.
DNA marker의 가장 중요한 용도 중의 하나는 유전자형분석이다. 유전자형분석이란, 특정 좌위들에 대한 DNA 다형성의 형태를 분석하는 것을 말하여, 이를 통하여 이들 유전좌위들의 후대전달양식을 판단할 수 있다. 대부분의 유전자형분석은 아가로즈 또는 아크릴아마이드 젤을 이용한 전기영동으로 DNA크기와 염기서열 변이에 따라 나타나는 DNA밴드 이동성 차이에 의해 유전자형을 판별하는 방법이 주로 사용되고 있다.
이처럼 DNA marker는 유전정보의 이용연구를 위한 기본 도구로 동물 분자육종법에서 다양한 DNA marker들이 개발되어 표현형이 아닌 유전자형을 선발의 대상으로 유전자 지도제작, 우량유전자 또는 질병 유전자의 발굴, 유전자 기능의 이해 및 분자표지인자 의존선발 등에 사용된다.
유전자지도작성, 표현형과 유전자형 사이의 연관분석 등을 위해 가장 중요한 요소는 개체간의 차이가 큰 DNA marker 들의 확보이다. 이를 위해 다양한 DNA marker들이 개발되었으며 실험방법 및 DNA 다형성의 형태에 따른 주요 DNA marker로는 SSLP, SNP, RFLP, RAPD, AFLP등이 있다.
DNA marker의 유용성은 부계와 모계에서 유전된 대립유전자들 간의 변별력이 클수록 높아지며, 변별력은 마커의 다형성이 높을수록 높아져 마커의 유용성은 결국 마커의 다형성의 정도에 따라 결정된다. DNA marker의 다형성을 나타내는 방법으로는 marker의 이형접합자빈도(heterozygosity, H)를 측정하는 방법과 다양성정보상수(polymorphism information content, PIC)값을 측정하는 두가지 방법이 사용된다.
현재 국제적으로 검증된 DNA 분석법인 단순반복염기서열 마커를 이용한 친자확인 및 혈연관계를 확인하는 시스템이 사람뿐만 아니라 가축, 식물 등에 많이 이용되고 있다. 친자확인 분석방법은 최근 수산분야에서 많이 이용되고 있으며 유전적 분석 데이터는 지속적으로 증가하고 있다.
그러나, 혈연관계에서 정확한 전형매관계(Full-sib)확인을 위한 분석 프로그램 및 그에 따른 방법은 없어 가계확인, 선발육종, 방류효과조사(방류종자에 대한 형제관계분석)에서 다소 부정확하고 오류의 가능성이 높은 결과가 사용되고 있다.
또한 분석을 위해 사용되는 단순반복염기서열(simple sequence repeat, SSR) 부위의 초위성체마커(Microsatellite marker)의 분석 결과에 대한 누적되는 대립유전자빈도데이터(Allele frequency data)를 적용시킬 수가 없어 전형매관계 및 혈연관계 분석에 많은 어려움이 있다. 현재 국내에서 전형매관계 확인을 위해 사용되는 분석프로그램이 있긴 하지만 도출되는 결과 값은 관계 확인을 위한 개체 간 비교 또는 전형매관계 확인법이 아니므로 적합하지 않은 문제점이 있다.
이에 국내 공개특허공보 제10-2017-0068347호에는 말의 모계혈연관계 및 운동능력 예측 방법에 관하여 개시하고 있고, 국내 공개특허공보 특2002-0081704호에는 혈연을 감정하는 방법 및 이를 이용한 DNA 타이핑 키트에 관하여 게시하고 있으나, 상기 선행문헌은 본 발명의 마커를 기반으로 혈연관계를 파악하고자 하는 개체들의 유전자형을 분석하는 단계(가); 상기 (가)단계의 결과로 유전자형 분석결과 데이터를 입력하는 단계(나); 상기 (나)단계의 유전자형 분석결과의 데이터로부터 대립유전자빈도를 입력하는 단계(다); 혈연관계를 파악하고자 하는 개체 사이의 대립유전자형의 일치여부를 비교하고, 상기 대립유전자형의 일치되는 경우의 수에 따른 IBD공식을 설정하며, 상기 설정된 IBD공식에 혈연관계에 대한 경우의 수에 따른 IBD상수를 적용하여 혈연관계지수(likelihood ratio)를 추출하는 단계(라); 상기 (라)단계의 가장 높은 수치의 확률결과를 확인하여 혈연관계를 결정하는 단계(마)로 이루어진 구성은 개시하지 않아 차이를 보인다.
국내 공개특허공보 제10-2017-0068347호에는 자마와 모마의 DNA 시퀀스를 추출하는 제1 단계, 제1 단계에서 추출된 DNA로 모계혈통 분석범위가 가능한 프라이머를 이용하여 PCR을 수행하는 제2 단계, 자마와 모마의 모계혈통 확인 및 운동능력을 위하여 상기 PCR의 산물을 미토콘드리아 DNA의 조절 영역의 시퀀스 분석을 수행하여 DNA 시퀀스에 대응하는 8개의 하플로그룹을 확인하는 제3 단계, 상기 PCR 수행된 자마와 모마의 DNA 시퀀스의 피크를 분석하여 어느 하플로 그룹에 속하는지 판단하여 말의 모계혈통분석 및 운동 능력을 예측 표시할 수 있도록 하는 모계혈통 및 운동능력 예측과 관련된 단일염기 다형성 (SNP, Single-nucleotide polymorphism)을 이용한 말의 모계혈연관계 및 운동능력 예측 방법에 관하여 개시하고 있다. 국내 공개특허공보 특2002-0081704호에는 X 염색체 상의 대립연쇄반복 DNA를 비교함으로써 아버지의 DNA가 없는 상태에서 혈연을 확인하는 방법 및 이를 이용한 혈연 확인용 DNA 타이핑 키트에 관한 것이다. 본 발명의 혈연을 감정하는 방법은 할머니와 손녀의 X 염색체 상의 STR을 비교 분석함으로써 아버지의 DNA가 없는 경우에도 친생자임을 확인할 수 있고 이복자매의 경우에는 각 피검자의 어머니의 대립유전자를 제외하고 남은 X 염색체 STR 대립유전자를 각 피검자가 공유하는지를 관찰함으로써 아버지의 동일성 여부를 판정할 수 있으므로 아버지의 DNA가 없는 상태에서도 부녀간의 혈연을 확인하는데 유용하게 사용될 수 있는 X염색체 STR의 대립유전자를 비교하여 혈연을 감정하는 방법 및 이를 이용한 DNA 타이핑 키트에 관하여 개시하고 있다. 국내 등록특허번호 제10-1533792호에는 NGS 기반(next generation sequencing-based) 인간 객체(human subject)의 상염색체 분석방법에 관한것으로, (a) 인간 객체 DNA 시료의 D3S1358, TH01, D21S11, D18S51, PentaE, D5S818, D13S317, D7S820, D16S539, CSF1PO (Human c-fms proto-oncogene for CSF-1 receptor gene), PentaD, vWA (von Willebrandfactor A), D8S1179, TPOX (Human thyroid peroxidase gene), FGA (Human fibrinogen alpha chain) 및 아멜로제닌(amelogenin) 유전좌위에 상보적으로 결합하는 각각의 프라이머를 이용하여 멀티플렉스 증폭을 실시하는 단계; 및 (b) 상기 단계 (a)의 멀티플렉스 증폭 산물의 NGS 데이터를 이용하여 상기 유전좌위의 STR (short tandem repeat) 대립유전자형을 결정하여, 상기 인간 객체를 유전자로 감식하는 단계를 포함하는 NGS기반 인간 객체의 상염색체 분석방법에 관하여 개시하고 있다. 국내 등록특허번호 제10-1147691호에는 특정 두 개체 이상의 유전정보를 비교하여 대(generation)를 거친 부모자식 관계(1촌)와 같은 친자확인과 혈연관계 및 비혈연 관계를 판별하여 서로간의 촌수 정보를 제공하여 정확한 가계 정보를 도출할 수 있는 유전 정보 비교를 이용한 혈연관계 판별장치에 관하여 개시하고 있다.
현재 수산분야에서의 유전자형 분석 결과를 이용한 전형매관계(Full-sib) 분석소프트웨어 또는 이를 이용한 혈연관계 분석방법에 관하여 개발되지 않아 정확한 혈연관계를 분석을 할 수 없을 뿐만 아니라 해외에서 개발된 집단 간 비교분석법을 이용하고 있는 상기 문제점을 해결하기 위해서, 본 발명은 수산분야에 적용할 수 있는 전형매 관계분석방법을 제공하고자 한다.
상기 과제를 해결하기 위한 수단으로서 본 발명은 마커를 기반으로 혈연관계를 파악하고자 하는 개체들의 유전자형을 분석하는 단계(가); 상기 (가)단계의 결과로 유전자형 분석결과 데이터를 입력하는 단계(나); 상기 (나)단계의 유전자형 분석결과의 데이터로부터 대립유전자빈도를 입력하는 단계(다); 전형매관계를 파악하고자 하는 개체 사이의 대립유전자형의 일치여부를 비교하고, 상기 대립유전자형의 일치되는 경우의 수에 따른 IBD공식을 설정하며, 상기 설정된 IBD공식에 전형매관계에 대한 경우의 수에 따른 IBD상수를 적용하여 전형매관계지수(likelihood ratio)를 추출하는 단계(라); 상기 (라)단계에서 추출된 전형매관계지수 결과를 이용하여 로그 중앙값[Log10 (median LR)]에 대한 평균 값과 표준편차를 Micro Excel로 계산한 후, 전형매관계(Full-sib)에서의 1~100000 범위의 전형매관계지수(likelihood ratio) 값을 기준으로 거짓양성률(false-positive rate)과 거짓음성률(false-negative rate)을 조사하여 전형매 관계 판정하는 단계(마)로 이루어진 전형매관계 분석방법을 제공한다.
현재 전세계적으로 법의학에서 사용되는 분석방법인 혈연관계확인공식과 Identity by descent (IBD) 상수를 수산종의 전형매관계 및 가계 확인을 위한 소프트웨어에 적용하고 있다. 그러나, 어류의 경우는 사람보다 다양한 대립유전자(allele)를 갖고 있기 때문에 동일 대립유전자가 발견될 확률이 낮아지는데 이는 마커의 식별력이 높아졌기 때문이다. 또한, 실질적으로 형제관계에 있는 경우에도 이복형제관계지수나 다른 관계의 지수가 높은 확률로 나오는 경우도 많이 있으며 오판의 가능성에 대한 통계적인 기준은 따로 설정이 되어 있지 않은 실정이다.
이에 본 발명은 분석하고자하는 특정관계를 지정하여 분석하고 거짓양성과 거짓음성률에 대한 통계적인 정규분포결과를 산출하여 이를 기준으로 정확한 판정이 이루어 질 수 있는 효과가 있다.
본 발명의 개발된 마커를 이용하여 유전자형분석을 실시하고, 누적되는 대립유전형빈도데이터를 계산하는 단계는 마커의 이용에서 무분별하게 다양한 대립유전자가 있다거나 여러 대립유전자 중에 특정 대립유전자에 빈도가 편중되는 마커를 피할 수 있다.
본 발명의 실시예에 따른 전형매관계 확인을 위한 지수 계산 방법은 일반적인 친자관계 지수계산방법과 동일하게 비교하기 위한 2개체의 대립유전자를 비교하고 일치 여부에 따라 대립유전형빈도와 혈연관계확인공식과 Identity by descent (IBD) 상수를 적용하는 단계를 포함한다.
또한, 본 발명의 실시예에 따른 전형매관계 산출된 혈연관계지수(likelihood ratio)값을 이용하여 우도비의 로그 중앙값 [Log10 (median LR)]에 대한 평균(mean)과 표준편차 (standard deviation)를 Microsoft Excel로 계산하고, 각각의 관계에서 1~100,000 범위의 우도비 값을 기준으로 거짓 양성률(false-positive rate)과 거짓 음성률(false-negative rate)을 조사하는 것일 수 있다.
본 발명은 대량의 유전형 분석결과를 최대 100만 개까지 생산할 수 있을 뿐만 아니라 한 번에 많은 개체(1000개x1000개) 분석이 가능하여 시간절약, 비용절감, 노동력 감소 등의 효과가 있다.
또한, 기존에 분석에는 전문적인 기술이 필요할 뿐만 아니라 시간적으로도 많이 소요되었지만 본 발명은 분석 과정 간소화로 인해 짧은 시간에 분석이 가능하여 업무에 대한 정확성, 효율성, 간편성, 전문성에 대한 문제점들을 해결하였다.
더불어, 수산분야에서 분석하기 어려운 전형매관계(Full-sib)의 혈연관계 분석에 대한 통계적 검증을 통해 신뢰성과 정확성이 높은 결과를 제공할 수 있고, 지속적으로 누적되는 유전자형 분석 결과에 대한 데이터베이스를 체계적으로 관리와 이용이 가능하다. 이로서, 정확한 전형매관계(Full-sib)확인을 통해 가계확인, 선발육종, 방류효과조사(방류종자에 대한 형제관계분석)에서 정확한 결과를 제공이 가능하다.
도 1은 본 발명의 유전자형 분석을 이용한 전형매관계 분석방법의 모식도를 나타낸다.
도 2는 전형매관계지수 계산 수식을 나타낸다.
도 3은 유전자형 분석이 완료된 집단 F0과 집단F1 에 대한 유전자형 분석결과를 입력하는 소프트웨어를 나타낸다.
도 4은 각각의 마커에 대한 대립유전자 빈도를 추출한 결과 값을 나타낸다.
도 5는 대립유전자 빈도값을 입력이 가능한 실시예에 따른 소프트웨어를 나타낸다.
도 6는 본 발명의 실시예 1에 따른 마커에 대해 산출된 전형매관계지수(likelihood ratio)를 나타낸다.
도 7은 (라)단계에 따라 시스템에 저장된 전형매관계지수값을 나타낸다.
도 8는 실험예 1에 따른 실제 형제관계에서의 전형매관계지수(Likelihood ratio) 값에 대한 분포혈연관계 확률을 분석한 결과를 나타낸다.
도 9은 실험예 1에 따른 거짓양성률(false-positive rate)과 거짓음성률(false-negative rate)을 이용한 전형매관계지수(Likelihood ratio) 분포의 평가결과를 나타낸다.
도 10의 혈연관계확률 식을 나타낸다.
이하, 본 발명을 첨부한 도면과 함께 상세히 설명하면 다음과 같다. 도 1은 본 발명의 유전자형 분석을 이용한 전형매관계 분석방법의 모식도를 나타낸다. 마커를 기반으로 혈연관계를 파악하고자 하는 개체들의 유전자형을 분석하는 단계(가); 상기 (가)단계의 결과로 유전자형 분석결과 데이터를 입력하는 단계(나); 상기 (나)단계의 유전자형 분석결과의 데이터로부터 대립유전자빈도를 입력하는 단계(다); 전형매관계를 파악하고자 하는 개체 사이의 대립유전자형의 일치여부를 비교하고, 상기 대립유전자형의 일치되는 경우의 수에 따른 IBD공식을 설정하며, 상기 설정된 IBD공식에 전형매관계에 대한 경우의 수에 따른 IBD상수를 적용하여 전형매관계지수(likelihood ratio)를 추출하는 단계(라); 상기 (라)단계에서 추출된 전형매관계지수 결과를 이용하여 로그 중앙값[Log10 (median LR)]에 대한 평균 값과 표준편차를 Micro Excel로 계산한 후, 전형매관계(Full-sib)에서의 1~100000 범위의 전형매관계지수(likelihood ratio) 값을 기준으로 거짓양성률(false-positive rate)과 거짓음성률(false-negative rate)을 조사하여 전형매 관계 판정하는 단계(마)로 이루어진다.
본 발명의 유전자형 분석단계(가)는 집단 F0과 집단F1의 시료에서 DNA를 추출하고 마커를 이용하여 PCR을 실시한 후, 상기 PCR산물을 이용하여 자동염기 서열분석장치를 이용하여 크기별로 분류되도록 전기영동한 후 각 마커에 대한 표준 allele ladder를 제작하고 분석프로그램을 이용하여 모든 개체를 scoring하고 크기와 표식자의 종류별로 분류하는 단계를 포함한다.
본 발명에 따른 집단 F0과 집단F1 은 전형매관계(Full-sib)의 여부를 검증하고자 하는 개체를 지칭한다. 상기 마커는 바람직하게는 초위성체 (microsatellite) 마커가 이용될 수 있고 상기 PCR은 다중증폭 중합효소연쇄반응(Mutiplex-PCR)일 수 있다.
본 발명의 용어, “마커(marker)”는 유전적으로 불특정 연관된 유전자좌를 동정할 때 참고점으로 사용되는 염기서열을 의미한다.
본 발명에서 용어, "멀티플렉스 PCR (multiplex PCR)"은, 하나의 주형 DNA에 대한 한 개의 유전자을 증폭하는 단일 PCR과 달리 여러 개의 유전자를 동시에 증폭하는 PCR 기법을 의미한다. 멀티플렉스 PCR에서는 단일 PCR 혼합물에 여러 프라이머쌍이 포함시키는 데, 이때 서로 다른 DNA 서열에 대해서는 각각에 특이적인 증폭 산물의 크기 범위를 나타내어 크기가 서로 중첩되지 않도록 하는 것이 바람직하다.
멀티플레스 PCR 기법에서는 여러 종류의 다른 프라이머 쌍을 한 튜브에 넣고 반응시키기 때문에, 프라이머 간에 억제 (inhibition)가 발생할 수 있으므로, 멀티플렉스 PCR에 적용할 때에는 증폭하고자 하는 유전자들에 대한 프라이머 들의 선정이 중요하다. 또한 포함되는 여러 프라이머 마다 적합한 결합 온도가 다를 수 있으므로, 멀티플렉스 PCR 적용 시에는 단일 PCR 반응에서 포함되는 PCR 프라이머 쌍 모두가 효과적으로 결합할 수 있도록 멀티플렉스 PCR에 적합한 결합 온도의 최적화가 요구된다.
본 발명에서 "프라이머(Primer)"는 일반적으로, 올리고뉴클레오타이드를 의미하는 것으로, 여기에 정의된 프라이머들이라는 용어는 DNA의 합성을 준비할 수 있는 DNA 가닥들을 말한다. DNA 중합효소(polymerase)는 프라이머 없이 처음부터 DNA를 합성할 수 없다. DNA 중합효소는 오직 상보적인 가닥이 조립되는 뉴클레오티드들의 순서를 지시하기 위한 주형으로서 사용되는 반응에서 존재하는 DNA 가닥을 연장할 수 있다. 그리고 적합한 온도와 pH의 조건에서 합성의 개시점으로 작용할 수 있다. 바람직하게는, 프라이머는 디옥시리보뉴클레오타이드이며 단일쇄이다. 본 발명에서 이용되는 프라이머는 자연 dNMP(즉, dAMP, dGMP, dCMP 및 dTMP), 변형된 뉴클레오타이드 또는 합성 뉴클레오타이드를 포함할 수 있다. 또한, 프라이머는 리보뉴클레오타이드도 포함할 수 있다.
유전자형 분석결과 데이터 입력단계(나)는 상기 (가)단계의 마커 값을 기반으로 결정된 유전자형 분석결과(Allele scoring data)데이터를 입력하는 단계이다.
대립유전자 빈도값 입력단계(다)는 상기 (나)단계의 유전자형 분석결과의 데이터로부터 얻어진 대립유전자빈도(allele frequency)를 입력하는 단계를 포함할 수 있다.
본 발명의 전형매관계지수 추출단계(라)는 각 마커의 집단 F0과 집단F1의 대립유전자형을 일치여부를 비교하는 단계; 상기 비교된 대립유전자형이 일치하는 경우에 따라 IBD공식을 설정하는 단계; 상기 설정된 IBD공식에 집단 F0과 집단 F1 사이의 전형매 관계에 따른 IBD상수를 적용하여 전형매관계지수(likelihood ratio)를 추출하는 단계로 이루어질 수 있다.
하기의 표 1은 집단 F0과 집단 F1의 각 좌위의 대립유전자형의 일치여부에 따른 경우(CASE)와 그에 따른 혈족관계확인 공식(kinship Formulas)을 나타낸다. P는 대립유전자 빈도를 나타낸다. 하기의 표 2는 부모집단과 자식 집단의 관계에 따른 Identity by descent coefficients(IBD상수)를 나타낸다.
혈족관계확인 공식(kinship Formulas)
부모집단(F0) 대립유전자형 자식집단(F1) 대립유전자형 Frequency
case 1 AB AB Φ2+0.5Φ1(PA+PB)+2Φ0PAPB
case 2 AA AA Φ21PA0PA 2
case 3 AA AB Φ1PB+2Φ0PAPB
case 4 AB AA 0.5Φ1PA0PA 2
case 5 AB AC 0.5Φ1PC+2Φ0PAPC
case 6 AB CD 0PCPD
case 7 AA BB Φ0PB 2
case 8 AA BC 0PBPC
case 9 BC AA Φ0PA 2
Identity by descent coefficients(IBD상수)
Relationship Φ2 Φ1 Φ0
Parent-child 0 1 0
Full siblings(전형매) 1/4 1/2 1/4
Half siblings 1/2 1/2 0
Grandparent-grandchild 1/2 1/2 0
Uncle-nephew 1/2 1/2 0
First cousins 3/4 1/4 0
Second cousins 15/16 1/16 0
Unrelated 0 0 1
상기의 대립유전자형 일치여부를 비교하는 단계는 각 마커의 집단F0와 집단F1의 각 좌위의 대립유전자형의 일치여부를 비교하고, 상기 일치여부에 해당하는 경우에 따른 빈도 공식을 설정하는 단계를 포함한다. 대립유전자의 타입이 양쪽 모두 일치하는 경우, 한쪽만 일치하는 경우, 양쪽 모두 일치 하지 않는 경우로 구분하여 값을 산출한다. 산출방식은 표 1의 case 에 따라 각 allele 에 대한 알파벳을 부여하고 비교하여 적용 값을 달리하여 계산한다.
도 2는 전형매관계지수 계산 수식을 나타낸다. 전형매관계지수(likelihood ratio) 계산 수식에서 Hp는 두 개체가 서로 혈연관계에 있는 경우로 표 2에 도시된 관계(relation)에 따라 구해진 상기 빈도 공식이 적용된 값을 지칭한다. 상기 전형매관계는 집단 F0과 집단 F1 사이의 관계로 Full siblings의 확인이 포함된다. Hd는 두 개체가 서로 혈연관계가 없는 경우(Unrelated)를 지칭한다.
상기 혈연관계 확인 검증 알고리즘은 혈연관계 확인을 위한 마커에 대한 값(Allele score)을 통해 유전자형을 분석하고, Identity by descent 상수 확립, 대립유전자형빈도(allele frequency)를 추출하여 각각의 상기 표1에 기재된 각 마커에서의 대립유전자에 대한 비교를 하여 그에 맞는 frequency를 설정한다.
이후, 표 2의 IBD상수(Identity by descent coefficients)에서 Full siblings 부분의 Φ 값을 표1에 적용함으로써 각 마커에 대한 혈연관계지수가 도 6과 같이 산출될 수 있다. 이 때 상기 소프트웨어를 이용한 결과값에서 혈연관계지수 계산을 위해 비교되는 마커의 수가 50%미만인 경우에는 비교 대상에서 제외하고 자동으로 혈연관계가 없는 것으로 판별이 나고, 마커의 개수가 비교에 사용될 수 있는 50%이상일 경우에는 다음 단계로의 분석이 진행된다.
전형매 관계 판정단계(마)는 거짓양성률(false-positive rate)과 거짓음성률(false-negative rate)을 조사하여 작성된 정규분포도와, 상기 (라)단계에서 추출된 혈연관계지수 결과를 이용하여 로그 중앙값[Log10 (median LR)]에 대한 평균 값과 표준편차를 Micro Excel로 계산한 후, 전형매관계(Full-sib)에서의 1~100000 범위의 전형매 관계지수(likelihood ratio) 값을 기준으로 상기 정규분포도에 적용하여 전형매(Full-sib)관계를 판정하는 단계로 이루어질 수 있다.
상기 정규분포도의 작성은 다음과 같다. 실제 전형매 관계가 있는 개체군과 전형매 관계가 없는 개체군을 선발하고 상기 개체군으로부터 상기 (가) 내지 (라)단계를 실시하여 혈연관계지수를 계산한다.
전형매 관계가 있는 개체군과 전형매 관계가 없는 개체군으로부터 계산된 전형매관계지수에 대한 정규분포 확률을 계산하여 Log10 값에 대한 정규분포 그래프를 작성하고, 정규분포 그래프를 이용하여 도 8에 도시된 바와 같이, log 기준값에 대한 거짓양성률 및 거짓음성률 값 산출이 가능하다.
일 실시예로서, Log10 0을 기준으로 두고 판정을 한다면 false-negative 3.671%, false-positive 2.747%의 가능성이 있다는 것을 의미한다. 따라서 이러한 결과들을 이용하여 전형매관계에 대한 판정을 위해 거짓 양성 및 거짓음성의 오류를 최소화 및 최적으로 할 수 있다.
일 실시예로서 집단 F0과 집단F1은 상기 (가) 내지 (라)단계로 추출된 전형매관계지수 결과를 이용하여 로그 중앙값[Log10 (median LR)]에 대한 평균 값과 표준편차를 Micro Excel로 계산한 후, 전형매관계(Full-sib)에서의 1~100000 범위의 혈연관계지수(likelihood ratio) 값을 기준으로 상기 정규분포도에 적용한다. 상기 정규분포도에 거짓양성률과 거짓음성률 정규분포도 각각의 중심 축과 정규분포에 적용된 혈연관계지수가 거짓양성률과 가까울 경우 전형매 관계가 없는 것으로 판정되고 거짓음성률과 가까울 경우 전형매 관계가 있는것으로 전형매(Full-sib)관계를 판정될 수 있다.
이하, 본 발명의 유전자형 분석을 이용한 전형매관계분석 방법과 관련한 구체적인 실시예를 설명하면 다음과 같다.
<실시예 1> 넙치 유전자형 분석을 이용한 전형매관계분석
(가) 유전자형 분석단계
본 발명에 따른 실험어의 자식집단은 동일 부모에서 생산된 것으로 확인된 전형매 관계의 넙치 개체를 집단 F0과 집단F1로 설정하여 유전자형 분석단계를 실시하였고, 본 발명의 실험예는 상기 집단 사이가 전형매관계가 성립하는지 확인한 것이다. 상기 전형매관계는 일반적인 육종학에 따른 가계에서 동일한 부모로부터 생산된 형제자매(full-sib)들로 구성된 관계를 지칭한다.
(나) 유전자형 분석결과 입력단계
도 3은 유전자형 분석이 완료된 집단 F0과 집단F1 에 대한 유전자형 분석결과를 입력하는 소프트웨어를 나타낸다. 일실시예로서 CSV 파일로 저장하고 sample 1, 2 부분의 open-파일선택-확인 과정을 통해 소프트웨어상에 결과값을 입력하였다.
(다) 대립유전자빈도값 입력단계
도 4은 각각의 마커에 대한 대립유전자 빈도를 추출한 결과 값을 나타내고, 도 5는 대립유전자 빈도값을 입력하는 본 발명의 실시예에 따른 소프트웨어를 나타낸다. 모든 개체에 대한 유전형 결과 값을 이용하여 대립유전자 수를 계산하고 각 대립유전자에 대해 총 갯수로 나누어 대립유전자빈도를 생성하며 각 대립유전자에 대한 빈도를 모두 합치면 1.0 이 나온다.
상기와 같은 방법으로 추출한 대립유전자 빈도값은 본 발명의 실시예에 따른 소프트웨어에 입력할 수 있다. 본 발명에 따른 스프트웨어에 대한 기능에서 Save as는 선택한 대립유전자빈도 파일을 다른 이름으로 저장(엑셀)을, Data는 선택한 대립유전자빈도 파일 보기를, Import 저장되어있는 대립유전자빈도 파일을 선택하고, Create는 모든 개체의 유전형데이터를 이용한 대립유전자빈도를 계산하고 선택할 수 있게 파일 생성을 할 수 있다.
(라) 전형매관계(Full siblings)지수 추출단계
상기 (나)단계의 집단 F0의 1번 개체와 집단 F1의 1번 개체를 1:1비교를 진행한다. 표1과 같이 각 마커에서의 대립유전자에 대한 비교를 하여 그에 맞는 frequency를 사용하고 표2의 Identity by descent coefficients에서 Full siblings 부분의 Φ 값을 표1에 적용하면 각 마커에 대한 전형매 관계지수는 도 6과 같이 산출된다.
도 6는 본 발명의 실시예 1에 따른 마커에 대해 산출된 전형매관계지수(likelihood ratio)를 나타낸다. 전형매관계지수는 산출된 Identity by descent(IBD) 상수와 대립유전자형빈도를 적용하여 각각의 마커에 대한 전형매관계지수를 산출하였다.
전형매관계지수는 도 2에 도시된 수식에 따라 계산을 실시하였다. 계산은 서로 특정 혈연관계에 있는 경우(related, H p )와 서로 혈연관계가 없는 경우(unrelated, H d )의 두 가지 상반되는 가정 하에 특정 집단에서 주어진 유전자형이 나타날 짝 확률의 비로 최종 전형매관계지수를 계산하였다. 도 7은 (라)단계에 따라 시스템에 저장된 전형매관계지수값을 나타낸다.
(마) 전형매관계 결정단계
상기 전형매관계지수(likelihood ratio) 결과를 이용하여 도 8와 같이 로그 중앙값[Log10 (median LR)]에 대한 평균 값과 표준편차를 Micro Excel로 계산하고 전형매관계(Full-sib)에서의 1~100000 범위의 혈연관계지수(likelihood ratio) 값을 기준으로 거짓양성률(false-positive rate)과 거짓음성률(false-negative rate)을 조사한다. 상기 정규분포도에 거짓양성률과 거짓음성률 정규분포도 각각의 중심 축과 정규분포에 적용된 혈연관계지수가 거짓양성률과 가까울 경우, 전형매 관계가 없는 것으로 판정되고 거짓음성률과 가까울 경우 전형매 관계가 있는 것으로 전형매(Full-sib)관계를 판정될 수 있다.
도 8는 실험예 1에 따른 실제 형제관계에서의 전형매관계지수(Likelihood ratio) 값에 대한 분포혈연관계 확률을 분석한 결과를 나타낸다. 예를 들어 정규분포에 적용된 혈연관계지수 값의 좌표 위치로부터 거리가 거짓양성률의 정규분포도 중심축 3.15보다 거짓음성률의 정규분포도 중심 축 -1.98에 가깝게 위치하면 전형매 관계가 있는 것으로 전형매(Full-sib)관계를 판정할 수 있다.
도 9은 실험예 1에 따른 거짓양성률(false-positive rate)과 거짓음성률(false-negative rate)을 이용한 전형매관계지수(Likelihood ratio) 분포의 평가결과를 나타낸다. 최종적으로 전형매관계 분석결과, 집단 F0과 집단F1 사이의 전형매관계(Full-sib)판정은 혈연관계지수의 기준과 도 10의 혈연관계확률을 적절히 이용하여 판정이 가능할 것이다.
본 발명의 실시예에 따라 도출된 전형매관계는 99.999%의 확률로 형제관계(Full-sib)로 판정할 수 있었으며 실제로 실험어 집단 F0과 집단F1 는 전형매 관계이므로 본 발명에 따른 방법은 검증효과 및 높은 신뢰도를 가지고 있는 것으로 판단된다.
기존의 어류 양식은 과학적이지 못한 친어집단의 관리 및 유전학적 다양성 축소와 집단의 근친도 증가와 유전적 병목현상으로 인해, 성장 저하, 빈번한 질병 발생, 기형 등의 발생과 집단크기가 축소되고 단순히 양성, 사료, 시설, 유통 등의 기술 개발로는 상기 문제점을 해결하기가 어렵다. 이에 본 발명의 유전자형 분석을 이용한 혈연관계 분석은 보다 신속하고 높은 신뢰도의 혈연관계 분석 결과를 제공이 가능함으로 혼획률 조사, 유전적 다양성 분석, 가계 확인, 선발육종 등 많은 부분에 활용이 가능함으로 산업상 이용가능성이 있다.

Claims (2)

  1. 마커를 기반으로 혈연관계를 파악하고자 하는 넙치 개체들의 유전자형을 분석하는 단계(가); 상기 (가)단계의 결과로 유전자형 분석결과 데이터를 입력하는 단계(나); 상기 (나)단계의 유전자형 분석결과의 데이터로부터 대립유전자빈도를 입력하는 단계(다); 혈연관계를 파악하고자 하는 개체 사이의 대립유전자형의 일치여부를 비교하고, 상기 대립유전자형의 일치되는 경우의 수에 따른 IBD공식을 설정하며, 상기 설정된 IBD공식에 혈연관계에 대한 경우의 수에 따른 IBD상수를 적용하여 혈연관계지수(likelihood ratio)를 추출하는 단계(라);
    상기 (라)단계에서 추출된 혈연관계지수(likelihood ratio)값을 이용하여 우도비의 로그 중앙값 [Log10 (median LR)]에 대한 평균(mean)과 표준편차 (standard deviation)를 계산하고, 전형매관계(Full-sib)에서 1~100,000 범위의 전형매 관계지수(likelihood ratio) 값을 기준으로 정규분포도에 적용하여 거짓 양성률(false-positive rate)과 거짓음성률(false-negative rate)의 정규분포도를 조사하며,
    상기 혈연관계지수 값의 좌표 위치로부터 거리가 거짓양성률의 정규분포도 중앙값 3.15와 거짓음성률의 정규분포도 중앙값 -1.98을 기준으로, 정규분포도의 중앙값과 정규분포에 적용된 혈연관계지수가 거짓양성률과 가까울 경우, 전형매 관계가 없는 것으로 판정하고, 거짓음성률과 가까울 경우 전형매 관계가 있는 것으로 판정하는 것을 특징으로 하는 넙치 유전자형 분석을 이용한 전형매관계 분석방법
  2. 삭제
KR1020180066025A 2018-06-08 2018-06-08 넙치 유전자형 분석을 이용한 전형매관계 분석방법 KR102163657B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180066025A KR102163657B1 (ko) 2018-06-08 2018-06-08 넙치 유전자형 분석을 이용한 전형매관계 분석방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180066025A KR102163657B1 (ko) 2018-06-08 2018-06-08 넙치 유전자형 분석을 이용한 전형매관계 분석방법

Publications (2)

Publication Number Publication Date
KR20190139480A KR20190139480A (ko) 2019-12-18
KR102163657B1 true KR102163657B1 (ko) 2020-10-08

Family

ID=69052216

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180066025A KR102163657B1 (ko) 2018-06-08 2018-06-08 넙치 유전자형 분석을 이용한 전형매관계 분석방법

Country Status (1)

Country Link
KR (1) KR102163657B1 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101135443B1 (ko) * 2009-12-29 2012-06-27 대한민국 성장이 빠른 육종 넙치의 육종 방법
KR20130077658A (ko) * 2011-12-29 2013-07-09 대한민국(관리부서:행정안전부 국립과학수사연구원장) 유전자 분석을 이용한 친자확인 검증시스템 및 그 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
https://www.researchgate.net/publication/251697107(2008)
Korean J Leg Med (2013), Vol.37, pp57-65.*

Also Published As

Publication number Publication date
KR20190139480A (ko) 2019-12-18

Similar Documents

Publication Publication Date Title
KR102184868B1 (ko) 카피수 변이를 판정하기 위한 dna 단편 크기의 사용
KR102373647B1 (ko) 사본수 변동을 결정함에 있어서 검출의 감수성을 향상시키기 위한 방법
EP3327123B1 (en) Methods of sequencing the immune repertoire
Thomson et al. Validation of short tandem repeat analysis for the investigation of cases of disputed paternity
US20140206552A1 (en) Methods for preimplantation genetic diagnosis by sequencing
CN105779280A (zh) 由母本生物样品鉴定新生胎儿突变
CN110997936B (zh) 基于低深度基因组测序进行基因分型的方法、装置及其用途
US10822662B2 (en) Diagnostic methods for identifying T-cell lymphoma and leukemia by high-throughput TCR-β sequencing
KR102206211B1 (ko) 문치가자미 친자 식별용 유전자 마커 및 이를 이용한 친자 확인방법
TW201936921A (zh) 次世代定序儀用引子以及其製造方法、使用次世代定序儀用引子之dna庫以及其製造方法,及使用dna庫之基因體dna解析方法
CN110863056A (zh) 一种人类dna精准分型的方法、试剂和应用
CN110622250A (zh) 用于检测插入和缺失的方法和系统
CN112592981B (zh) 用于dna档案建库的引物组、试剂盒和方法
KR20220013349A (ko) 검출 한계 기반 품질 제어 메트릭
Stewart et al. Genetics, health care and public policy: an introduction to public health genetics
KR102163657B1 (ko) 넙치 유전자형 분석을 이용한 전형매관계 분석방법
EP3626835A1 (en) Method for genotypically identifying both alleles of at least one locus of a subject&#39;s hla gene
CN107354151B (zh) 基于梅花鹿全基因组开发的str分子标记及其应用
Arizmendi et al. Analysis of Doberman Pinscher and Toy Poodle samples with targeted next-generation sequencing
Bradley et al. 19. The evolutionary genetics and molecular ecology of chimpanzees and bonobos
CN111379032A (zh) 一种用于构建同时实现基因组拷贝数变异检测和基因突变检测的测序文库的方法和试剂盒
CN110643713A (zh) 用于大熊猫的str基因座集及用途
Bano et al. Evaluating emerging technologies applied in forensic analysis
Krishnamurthy et al. Understanding the basics of DNA fingerprinting in forensic science
Colucci Next-generation kinship, ancestry and phenotypic deduction for forensic and genealogical analysis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right