KR20220115952A - 조상 근연도를 결정하기 위한 방법 및 시스템 - Google Patents

조상 근연도를 결정하기 위한 방법 및 시스템 Download PDF

Info

Publication number
KR20220115952A
KR20220115952A KR1020227020233A KR20227020233A KR20220115952A KR 20220115952 A KR20220115952 A KR 20220115952A KR 1020227020233 A KR1020227020233 A KR 1020227020233A KR 20227020233 A KR20227020233 A KR 20227020233A KR 20220115952 A KR20220115952 A KR 20220115952A
Authority
KR
South Korea
Prior art keywords
individual
algorithm
degree
population
relationship
Prior art date
Application number
KR1020227020233A
Other languages
English (en)
Inventor
아론 제이 샘스
사무엘 에이치 보어
아담 에스 가드너
매트 바톤
라이언 보이코
아담 알 보이코
Original Assignee
엠바크 베터리너리, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엠바크 베터리너리, 인크. filed Critical 엠바크 베터리너리, 인크.
Publication of KR20220115952A publication Critical patent/KR20220115952A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Ecology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Ignition Installations For Internal Combustion Engines (AREA)
  • Structure Of Transmissions (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 개시내용은 개체 간의 조상 근연도 정도를 추정하는 방법을 제공한다. 한 측면에서, 본 방법은 개체 집단 사이에서 공유되는 유전자 마커를 포함하는 하플로타입 데이터를 수신하는 단계; 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계; 각 시험 개체 집단에 대해: (i) 유전자 마커에 기초하여, 두 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계, (ii) 각각의 매칭된 세그먼트에 대해: 매칭된 세그먼트를 이산 게놈 간격으로 나누는 단계, 개체들 내 또는 개체들 간의 매칭 정도에 기초하여 각 이산 게놈 간격을 점수화하는 단계, 일관성에 대해 점수를 보정하는 단계, 및 (iii) 보정된 점수 및 할당된 가중치에 기초하여 매칭된 세그먼트의 이산 게놈 간격에 대한 가중 합을 계산하는 단계; 및 (d) 매칭된 세그먼트의 가중 합에 기초하여 개체 간의 조상 근연도 정도를 추정하는 단계를 포함한다.

Description

조상 근연도를 결정하기 위한 방법 및 시스템
관련 출원에 대한 상호 참조
본 출원은 2019년 11월 18일에 출원된 미국 가출원 제62/936,879호의 이익을 주장하며, 상기 가출원은 그 전문이 본원에서 참조로 포함된다.
배경
개체 집단 내 DNA의 작은 차이는 개체 간에 관찰되는 많은 유전적 및 표현형 변이의 원인이 될 수 있다. 개체들이 공유하는 특정 직계 동형(IBD: identical-by-descent) 하플로타입(예로서, 함께 유전되는 DNA의 작은 영역)은 상기 개체 간의 가족 관계를 나타낼 수 있다. 따라서, IBD 분석은 개체들의 조상 근연도 정도를 결정하기 위해 복수의 개체에 대해 수행될 수 있다.
요약
본 개시내용은 개체 간의 조상 근연도 정도를 추정하는 방법을 제공한다. 한 측면에서, 본 방법은 개체 집단 사이에서 공유되는 유전자 마커를 포함하는 하플로타입 데이터를 수신하는 단계; 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계; 각 시험 개체 집단에 대해: (i) 유전자 마커에 기초하여, 두 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계, (ii) 각각의 매칭된 세그먼트에 대해: 매칭된 세그먼트를 이산 게놈 간격으로 나누는 단계, 개체들 내 또는 개체들 간의 매칭 정도에 기초하여 각 이산 게놈 간격을 점수화하는 단계, 일관성에 대해 점수를 보정하는 단계, 및 (iii) 보정된 점수 및 할당된 가중치에 기초하여 매칭된 세그먼트의 이산 게놈 간격에 대한 가중 합을 계산하는 단계; 및 (d) 매칭된 세그먼트의 가중 합에 기초하여 개체 간의 조상 근연도 정도를 추정하는 단계를 포함한다.
한 측면에서, 본 개시내용은 (a) 시험 개체 집단에 대한 하플로타입 데이터를 수신하는 단계로서, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함하는 것인 단계; (b) 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계; (c) 각 시험 개체 집단에 대해: (i) 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계로서, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함하는 것인 단계; (ii) 제1 개체와 제2 개체 간의 각각의 매칭된 세그먼트에 대해: 매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누는 단계; (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도, 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 점수를 생성하는 단계; 복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하는 단계; 및 이산 게놈 간격의 복수의 보정된 점수에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계; 및 (iii) 복수의 보정된 점수 및 복수의 가중치에 기초하여 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계; 및 (d) 매칭된 세그먼트의 가중 합에 기초하여 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계를 포함하는, 이배체 집단의 두 개체 간의 조상 근연도 정도를 추정하기 위한 컴퓨터 구현 방법을 제공한다.
일부 실시양태에서, 이배체 집단은 포유동물 집단이다. 일부 실시양태에서, 포유동물 집단은 개과 집단, 고양이과 집단, 스포츠 동물 집단, 또는 설치류 집단이다. 일부 실시양태에서, 포유동물 집단은 개과 집단이다. 일부 실시양태에서, 개과 집단은 개 집단이다. 일부 실시양태에서, 포유동물 집단은 고양이과 집단이다. 일부 실시양태에서, 고양이과 집단은 고양이 집단이다. 일부 실시양태에서, 포유동물 집단은 스포츠 동물 집단이다. 일부 실시양태에서, 스포츠 동물 집단은 말 집단이다. 일부 실시양태에서, 개 집단은 아펜핀셔(Affenpinscher), 아프간 하운드(Afghan Hound), 아프리카니스(Africanis), 아이디(Aidi), 에어데일 테리어(Airedale Terrier), 악바쉬 도그(Akbash Dog), 아키타견(Akita Inu), 알랑구 마스티프(Alangu Mastiff), 알라노 에스파뇰(Alano Espanol), 알라파하 블루 블러드 불독(Alapaha Blue Blood Bulldog), 알래스칸 클리 카이(Alaskan Klee Kai), 알래스칸 말라뮤트(Alaskan Malamute), 얼라운트(Alaunt), 알로페키스(Alopekis), 알파인 닥스브래크(Alpine Dachsbracke), 알자시안 셰팔류트(Alsatian Shepalute), 아메리칸 아키타(American Akita), 아메리칸 불독(American Bulldog), 아메리칸 코커 스패니얼(American Cocker Spaniel), 아메리칸 에스키모 도그(American Eskimo Dog), 아메리칸 폭스하운드(American Foxhound), 아메리칸 헤어리스 테리어(American Hairless Terrier), 아메리칸 마스티프(American Mastiff), 아메리칸 핏 불 테리어(American Pit Bull Terrier), 아메리칸 스태퍼드셔 테리어(American Staffordshire Terrier), 아메리칸 워터 스패니얼(American Water Spaniel), 아나톨리안 셰퍼드 도그(Anatolian Shepherd Dog), 앵글로-프랑세 드 쁘티 베네리(Anglo-Francais de Petite Venerie), 아펜젤러 세넨훈드(Appenzeller Sennenhund), 아르헨틴 도고(Argentine Dogo), 아리에주 포인터(Ariege Pointer), 아리에쥬아(Ariegeois), 아르만트(Armant), 아르토이스 하운드(Artois Hound), 오스트레일리안 불독(Australian Bulldog), 오스트레일리안 캐틀 도그(Australian Cattle Dog), 오스트레일리안 켈피(Australian Kelpie), 오스트레일리안 셰퍼드(Australian Shepherd), 오스트레일리안 실키 테리어(Australian Silky Terrier), 오스트레일리안 스텀피 테일 캐틀 도그(Australian Stumpy Tail Cattle Dog), 오스트레일리안 테리어(Australian Terrier), 오스트리안 블랙 앤 탠 하운드, 오스트리안 핀셔(Austrian Pinscher), 아자와크(Azawakh), 바카르왈 도그(Bakharwal Dog), 바베트(Barbet), 바센지(Basenji), 바스크 셰퍼드 도그(Basque Shepherd Dog), 바셋 아르테지앙 노르만(Basset Artesien Normand), 바셋 블뢰 드 가스코뉴(Basset Bleu de Gascogne), 바셋 포브 드 브르타뉴(Basset Fauve de Bretagne), 그랑 바셋 그리퐁 방댕(Grand Basset Griffon Vendeen), 쁘티 바셋 그리퐁 방댕(Petit Basset Griffon Vendeen), 바이에른 마운틴 하운드(Bavarian Mountain Hound), 비글(Beagle), 비글-해리어(Beagle-Harrier), 비어디드 콜리(Bearded Collie), 보스롱(Beauceron), 베들링턴 테리어(Bedlington Terrier), 벨지안 셰퍼드 도그(Belgian Shepherd Dog), 벨지안 셰퍼드 도그(그루넨달(Groenendael)), 벨지안 셰퍼드 도그(라케노이즈(Laekenois)), 벨지안 셰퍼드 도그(말리노이즈(Malinois)), 벨지안 셰퍼드(테뷰런(Tervuren)), 베르가마스코 셰퍼드(Bergamasco Shepherd), 베르거 블랑 스위스(Berger Blanc Suisse), 베르거 피카르드(Berger Picard), 베른 라우프훈트(Berner Laufhund), 버니즈 마운틴 도그(Bernese Mountain Dog), 비숑 프리제(Bichon Frise), 빌리(Billy), 비스벤(Bisben), 블랙 앤 탠 쿤하운드(Black and Tan Coonhound), 블랙 앤 탠 버지니아 폭스하운드(Black and Tan Virginia Foxhound), 불렌바이저(Bullenbeisser), 블랙 노르웨이 엘크하운드(Black Norwegian Elkhound), 블랙 러시안 테리어(Black Russian Terrier), 블랙마우스 커(Blackmouth Cur), 그랑 블루 드 가스코뉴(Grand Bleu de Gascogne), 쁘티 블루 드 가스코뉴(Petit Bleu de Gascogne), 블러드하운드(Bloodhound), 블루 레이시(Blue Lacy), 블루 폴 테리어(Blue Paul Terrier), 블루틱 쿤하운드(Bluetick Coonhound), 보어보엘(Boerboel), 보헤미안 셰퍼드(Bohemian Shepherd), 볼로네제(Bolognese), 보더 콜리(Border Collie), 보더 테리어(Border Terrier), 보르조이(Borzoi), 보스니아 코즈-헤어드 하운드(Bosnian Coarse-haired Hound), 보스톤 테리어(Boston Terrier), 부비에 데 아르덴(Bouvier des Ardennes), 부비에 데 플랑드르(Bouvier des Flandres), 복서(Boxer), 보이킨 스패니얼(Boykin Spaniel), 브라코 이탈리아노(Bracco Italiano), 브라크 디 오베르뉴(Braque d'Auvergne), 브라크 뒤 부르보네(Braque du Bourbonnais), 블라크 더 파이(Braque du Puy), 브라크 프랑세(Braque Francais), 브라크 생-제르맹(Saint-Germain), 브라질리언 테리어(Brazilian Terrier), 브리아드(Briard), 브리케 그리퐁 방댕(Briquet Griffon Vendeen), 브리타니(Brittany), 브로홀머(Broholmer), 브루노 쥬라 하운드(Bruno Jura Hound), 부코비나 셰퍼드 도그(Bucovina Shepherd Dog), 불 앤 테리어(Bull and Terrier), 불 테리어(Bull Terrier), 불 테리어(미니어처(Miniature)), 불마스티프(Bullmastiff), 불리 쿠타(Bully Kutta), 케언 테리어(Cairn Terrier), 케이넌 도그(Canaan Dog), 캐내디언 에스키모 도그(Canadian Eskimo Dog), 캐내디언 포인터(Canadian Pointer), 카네 코르소(Cane Corso), 카오 다 세라 아이레스(Cao da Serra de Aires), 카오 데 카스트로 라보레이로(Cao de Castro Laboreiro), 카오 필라 드 사오 미구엘(Cao Fila de Sao Miguel), 캐롤리나 도그(Carolina Dog), 카르파티안 셰퍼드 도그(Carpathian Shepherd Dog), 카타호울라 커(Catahoula Cur), 카탈란 쉽독(Catalan Sheepdog), 코카시안 셰퍼드 도그(Caucasian Shepherd Dog), 카발리에 킹 찰스 스패니얼(Cavalier King Charles Spaniel), 센트럴 아시안 셰퍼드 도그(Central Asian Shepherd Dog), 체스키 푸섹(Cesky Fousek), 체스키 테리어(Cesky Terrier), 폴리시 그레이하운드(Polish Greyhound), 체서피크 베이 리트리버(Chesapeake Bay Retriever), 시엥-그리스(Chien-gris), 시엥 프랑세 블랑 이 느와르(Chien Francais Blanc et Noir), 시엥 프랑세 블랑 이 오렌지(Chien Francais Blanc et Orange), 시엥 프랑세 트리콜로르(Chien Francais Tricolore), 치와와(Chihuahua), 칠리안 폭스 테리어(Chilean Fox Terrier), 차이니즈 충칭 도그(Chinese Chongqing Dog), 차이니즈 크레스티드 도그(Chinese Crested Dog), 차이니즈 임페리얼 도그(Chinese Imperial Dog), 치누크(Chinook), 치피파라이(Chippiparai), 차우차우(Chow Chow), 시마론 우루과요(Cimarron Uruguayo), 시에르니 세리(Cierny Sery), 시르네코 델레트나(Cirneco dell'Etna), 클럼버 스패니얼(Clumber Spaniel), 러프 콜리(Rough Collie), 스무스 콜리(Smooth Collie), 콤바이(Combai), 코르도바 파이팅 도그(Cordoba Fighting Dog), 코통 드 튈레아르(Coton de Tulear), 크레탄 하운드(Cretan Hound), 크로아티안 쉽독(Croatian Sheepdog), 컴벌랜드 쉽독(Cumberland Sheepdog), 컬리 코티드 리트리버(Curly Coated Retriever), 체코슬로바키아 울프도그(Czechoslovakian Wolfdog), 닥스훈트(Dachshund), 달마시안(Dalmatian), 댄디 딘몬트 테리어(Dandie Dinmont Terrier), 데니쉬 스웨디쉬 팜도그(Danish Swedish Farmdog), 딩고(Dingo), 도베르만 핀셔(Doberman Pinscher), 도그 드 보르도(Dogue de Bordeaux), 도고 쿠바노(Dogo Cubano), 도고 과테말테코(Dogo Guatemalteco), 도고 사르데스코(Dogo Sardesco), 드렌체 파트리혼트(Drentse Patrijshond), 드레버(Drever), 덩커(Dunker), 더치 셰퍼드 도그(Dutch Shepherd Dog), 더치 스모우스혼드(Dutch Smoushond), 이스트 유러피안 셰퍼드(East-European Shepherd), 이스트 시베리안 라이카(East Siberian Laika), 엘로(Elo), 잉글리시 코커 스패니얼(English Cocker Spaniel), 잉글리시 쿤하운드(English Coonhound), 잉글리시 폭스하운드(English Foxhound), 잉글리시 마스티프(English Mastiff), 잉글리시 포인터(English Pointer), 잉글리시 세터(English Setter), 잉글리시 셰퍼드(English Shepherd), 잉글리시 스프링거 스패니얼(English Springer Spaniel), 잉글리시 토이 테리어(English Toy Terrier)(블랙 & 탄(Black & Tan)), 잉글리시 워터 스패니얼(English Water Spaniel), 잉글리시 화이트 테리어(English White Terrier), 엔틀버쳐 마운틴 도그(Entlebucher Mountain Dog), 에파뉴엘 블뢰 드 피카르디(Epagneul Bleu de Picardie), 에스토니안 하운드(Estonian Hound), 에스트렐라 마운틴 도그(Estrela Mountain Dog), 유라시에(Eurasier), 필드 스파니엘(Field Spaniel), 휠라 브라질레이로(Fila Brasileiro), 핀도(Findo), 피니쉬 하운드(Finnish Hound), 피니쉬 라프훈트(Finnish Lapphund), 피니쉬 스피츠(Finnish Spitz), 플랫-코티드 리트리버(Coated Retriever), 포모산 마운틴 도그(Formosan Mountain Dog), 폭스 테리어(Fox Terrier)(스무스(Smooth)), 와이어 폭스 테리어(Wire Fox Terrier), 프렌치 브리타니(French Brittany), 프렌치 불독(French Bulldog), 프렌치 스패니얼(French Spaniel), 갈고 에스파뇰(Galgo Espanol), 저먼 롱헤어드 포인터(German Longhaired Pointer), 저먼 핀셔(German Pinscher), 저먼 셰퍼드 도그(German Shepherd Dog), 저먼 쇼트헤어드 포인터(German Shorthaired Pointer), 저먼 스패니얼(German Spaniel), 저먼 스피츠(German Spitz), 저먼 와이어헤어드 포인터(German Wirehaired Pointer), 자이언트 슈나우저(Giant Schnauzer), 글렌 오브 이말 테리어(Glen of Imaal Terrier), 골든 리트리버(Golden Retriever), 고든 세터(Gordon Setter), 그랑 앵글로-프랑세 블랑 이 느와르(Grand Anglo-Francais Blanc et Noir), 그랑 앵글로-프랑세 블랑 이 오렌지(Grand Anglo-Francais Blanc et Orange), 그랑 앵글로-프랑세 트리콜로르(Grand Anglo-Francais Tricolore), 그랑 그리퐁 방댕(Grand Griffon Vendeen), 그랑 마스팅 드 보링켄(Gran Mastin de Borinquen), 그레이트 데인(Great Dane), 그레이트 피레니즈(Great Pyrenees), 그레이터 스위스 마운틴 도그(Greater Swiss Mountain Dog), 그린란드 도그(Greenland Dog), 그레이하운드(Greyhound), 그리퐁 블뢰 드 가스코뉴(Griffon Bleu de Gascogne), 그리퐁 브뤼셀루아(Griffon Bruxellois), 그리퐁 포브 드 브르타뉴(Griffon Fauve de Bretagne), 그리퐁 니베르네(Griffon Nivernais), 굴 동(Gull Dong), 굴 테르(Gull Terr), 해어 인디언 도그(Hare Indian Dog), 해밀턴스퇴바레(Hamiltonstovare), 하노버 하운드(Hanover Hound), 해리어(Harrier), 하바네세(Havanese), 하와이안 포이 도그(Hawaiian Poi Dog), 히말라얀 쉽독(Himalayan Sheepdog), 홋카이도(Hokkaido), 호르타야 보르자야(Hortaya Borzaya), 호바와트(Hovawart), 헝가리안 하운드(Hungarian Hound), 뉴질랜드 헌터웨이(New Zealand Huntaway), 하이겐훈트(Hygenhund), 이비잔 하운드(Ibizan Hound), 아이슬란딕 쉽독(Icelandic Sheepdog), 인디안 스피츠(Indian Spitz), 아이리시 불 테리어(Irish Bull Terrier), 아이리시 레드 앤드 화이트 세터(Irish Red and White Setter), 아이리시 세터(Irish Setter), 아이리시 스타포드셔 불 테리어(Irish Staffordshire Bull Terrier), 아이리시 테리어(Irish Terrier), 아이리시 워터 스패니얼(Irish Water Spaniel), 아이리시 울프하운드(Irish Wolfhound), 이스트리안 쇼트헤어드 하운드(Istrian Shorthaired Hound), 이스트리안 코즈-헤어드 하운드(Istrian Coarse-haired Hound), 이탈리안 그레이하운드(Italian Greyhound), 잭 러셀 테리어(Jack Russell Terrier), 잭테리어(Jagdterrier), 쟘툰드(Jamthund), 재패니즈 친(Japanese Chin), 재패니즈 스피츠(Japanese Spitz), 재패니즈 테리어(Japanese Terrier), 조낭이(Jonangi), 카이카디(Kaikadi), 카이 켄(Kai Ken), 캉갈 도그(Kangal Dog), 카니(Kanni), 카라카찬 도그(Karakachan Dog), 커릴리언 베어 도그(Karelian Bear Dog), 카르스트 셰퍼드(Karst Shepherd), 키스혼드(Keeshond), 케리 비글(Kerry Beagle), 케리 블루 테리어(Kerry Blue Terrier), 킹 찰스 스패니얼(King Charles Spaniel), 킹 셰퍼드(King Shepherd), 킨타마니(Kintamani), 기슈(Kishu), 코몬도르(Komondor), 쿠이커혼제(Kooikerhondje), 쿨리(Koolie), 한국 진돗개(Korean Jindo Dog), 한국 마스티프(Korean Mastiff), 크롬폴란데(Kromfohrlander), 쿤밍 울프 도그(Kunming Wolf-dog), 쿠리(Kuri), 쿠바즈(Kuvasz), 카이-레오(Kyi-Leo), 래브라도 허스키(Labrador Husky), 래브라도 리트리버(Labrador Retriever), 라고토 로마그놀로(Lagotto Romagnolo), 레이크랜드 테리어(Lakeland Terrier), 랭카셔 힐러(Lancashire Heeler), 랜드시어(Landseer), 라포니안 허더(Lapponian Herder), 레온베르거(Leonberger), 라사 압소(Lhasa Apso), 리투아니안 하운드(Lithuanian Hound), 롱헤어드 휘핏(Longhaired Whippet), 로타토레 브린디시노(Lottatore Brindisino), 로첸(Lowchen), 마자르 아가(Magyar Agar), 마제스틱 트리 하운드(Majestic Tree Hound), 말티즈(Maltese), 맨체스터 테리어(Manchester Terrier), 마렘마 쉽독(Maremma Sheepdog), McNab, 멕시칸 헤어리스 도그(Mexican Hairless Dog), 미니어처 오스트레일리안 셰퍼드(Miniature Australian Shepherd), 미니어처 폭스 테리어(Miniature Fox Terrier), 미니어처 핀셔(Miniature Pinscher), 미니어처 슈나우저(Miniature Schnauzer), 미니어처 시베리안 허스키(Miniature Siberian Husky), 미오리틱(Mioritic), 몰로수스(Molossus), 몬터니그런 마운틴 하운드(Montenegrin Mountain Hound), 모스크바 워치독(Moscow Watchdog), 모스크바 워터 도그(Moscow Water Dog), 마운틴 커(Mountain Cur), 마운틴 뷰 커(Mountain View Cur), 무쿠치(Mucuchies), 무디(Mudi), 머드홀 하운드(Mudhol Hound), 라지 문스터랜더(Large Munsterlander), 스몰 문스터랜더(Small Munsterlander), 머레이 리버 컬리 코티드 리트리버(Murray River Curly Coated Retriever), 나폴리탄 마스티프(Neapolitan Mastiff), 뉴펀들랜드(Newfoundland), 뉴 기니아 싱잉 도그(New Guinea Singing Dog), 노포크 스패니얼(Norfolk Spaniel), 노포크 테리어(Norfolk Terrier), 노르보텐스피츠(Norrbottenspets), 노스 컨트리 비글(North Country Beagle), 노던 이누이트 도그(Northern Inuit Dog), 노르웨이안 부훈트(Norwegian Buhund), 노르웨이안 엘크하운드(Norwegian Elkhound), 노르웨이안 룬트훈트(Norwegian Lundehund), 노리치 테리어(Norwich Terrier), 노바 스코셔 덕-톨링 리트리버(Nova Scotia Duck-Tolling Retriever), 올드 대니시 포인터(Old Danish Pointer), 올드 잉글리시 쉽독(Olde English Sheepdog), 올드 잉글리시 불독(Olde English Bulldog), 올드 잉글리시 테리어(Old English Terrier), 올드 저먼 셰퍼드 도그(Old German Shepherd Dog), 올드 잉글리시 불도그(Olde English Bulldogge), 오터하운드(Otterhound), 파촌 나바로(Pachon Navarro), 페이즐리 테리어(Paisley Terrier), 빠삐용(Papillon), 파슨 러셀 테리어(Parson Russell Terrier), 페터데일 테리어(Patterdale Terrier), 페키니즈(Pekingese), 페로 드 프레사 카나리오(Perro de Presa Canario), 페르로 드 프레사 말로르퀸(Perro de Presa Mallorquin), 페루비안 헤어리스 도그(Peruvian Hairless Dog), 파렌(Phalene), 파라오 하운드(Pharaoh Hound), 피카디 스패니얼(Picardy Spaniel), 플롯 하운드(Plott Hound), 포덴코 카나리오(Podenco Canario), 포인터(Pointer), 폴리시 하운드(Polish Hound), 폴리시 헌팅 도그(Polish Hunting Dog), 폴리시 로우랜드 쉽독(Polish Lowland Sheepdog), 폴리시 타트라 쉽독(Polish Tatra Sheepdog), 포메라니안(Pomeranian), 퐁토드메르 스패니얼(Pont-Audemer Spaniel), 푸들(Poodle), 포르셀엔(Porcelaine), 포르투기스 포덴고(포르투기스 Podengo), 포르투기스 포인터(Portuguese Pointer), 포르투기스 워터 도그(Portuguese Water Dog), 프라츠키 크리사릭(Prazsky Krysarik), 푸들포인터(Pudelpointer), 퍼그(Pug), 풀리(Puli), 푸미(Pumi), 풍산개(Pungsan Dog), 피레니안 마스티프(Pyrenean Mastiff), 피레니언 셰퍼드(Pyrenean Shepherd), 라페이로 도 알렌테조(Rafeiro do Alentejo), 라자팔라얌(Rajapalayam), 람퍼 그레이하운드(Rampur Greyhound), 라스트레아도르 브라질레이로(Rastreador Brasileiro), 래토네로 보데게로 안달루즈(Ratonero Bodeguero Andaluz), 래트 테리어(Rat Terrier), 레드본 쿤하운드(Redbone Coonhound), 로디지안 리지백(Rhodesian Ridgeback), 로트바일러(Rottweiler), 러시안 스패니얼(Russian Spaniel), 러스키 토이(Russkiy 토이), 루소-유러피안 라이카(Russo-European Laika), 러셀 테리어(Russell Terrier), 사를로스울프하운드(Saarlooswolfhound), 사부에소 에스파뇰(Sabueso Espanol), 세이지 아샤예리(Sage Ashayeri), 세이지 마잔다라니(Sage Mazandarani), 사할린 허스키(Sakhalin Husky), 살루키(Saluki), 사모예드(Samoyed), 삽살리(Sapsali), 샤플래니낙(Sarplaninac), 샤펜도스(Schapendoes), 실레르스퇴바레(Schillerstovare), 스키퍼키(Schipperke), 올드 크로아티안 사이트하운드(Old Croatian Sighthound), 자이언트 슈나우저(Giant Schnauzer), 미니어처 슈나우저(Miniature Schnauzer), 스탠다드 슈나우저(Standard Schnauzer), 슈바이처 라우프훈트(Schweizer Laufhund), 슈바이체리셔 니데를라우프훈트(Schweizerischer Niederlaufhund), 스카치 콜리(Scotch Collie), 스코티시 디어하운드(Scottish Deerhound), 스코티시 테리어(Scottish Terrier), 실리엄 테리어(Sealyham Terrier), 세구지오 이탈리아노(Segugio Italiano), 세팔라 시베리안 슬레드독(Seppala Siberian Sleddog), 세르비안 하운드(Serbian Hound), 세르비안 트라이칼라 하운드(Serbian Tricolour Hound), 샤페이(Shar Pei), 셔틀랜드 쉽독(Shetland Sheepdog), 시바견(Shiba Inu), 시추(Shih Tzu), 시코쿠(Shikoku), 샤일로 셰퍼드 도그(Shiloh Shepherd Dog), 시라크(Shirak), 시베리안 허스키(Siberian Husky), 실켄 윈드하운드(Silken Windhound), 싱할라 하운드(Sinhala Hound), 스카이 테리어(Skye Terrier), 슬루기(Sloughi), 슬로박 쿠바크(Slovak Cuvac), 슬로바키안 러프-헤어드 포인터(Slovakian Rough-haired Pointer), 슬로벤스키 코포브(Slovensky Kopov), 스말랜드스퇴바레(Smalandsstovare), 스몰 그리크 도메스틱 도그(Small Greek Domestic Dog), 소프트-코티드 휘튼 테리어(Soft-Coated Wheaten Terrier), 사우스 러시안 오브차카(South Russian Ovcharka), 써던 하운드(Southern Hound), 스패니쉬 마스티프(Spanish Mastiff), 스패니쉬 워터 도그(Spanish Water Dog), 스피노네 이탈리아노, 스포팅 루카스 테리어(Sporting Lucas Terrier), 세인트 버나드(St. Bernard), 세인트 존스 워터 도그(St. John's Water Dog), 스테비훈(Stabyhoun), 스타포드셔 불 테리어(Staffordshire Bull Terrier), 스테펜스 커(Stephens Cur), 스타이리안 코즈-헤어드 하운드(Styrian Coarse-haired Hound), 서식스 스패니얼(Sussex Spaniel), 스웨디시 라프훈트(Swedish Lapphund), 스위디쉬 발훈트(Swedish Vallhund), 스위디쉬 비글(Swedish Beagle), 탈탄 베어 도그(Tahltan Bear Dog), 타이간(Taigan), 타마스칸 도그(Tamaskan Dog), 테디 루스벨트 테리어(Teddy Roosevelt Terrier), 텔로미안(Telomian), 텐터필드 테리어(Tenterfield Terrier), 타이 방깨우 도그(Thai Bangkaew Dog), 타이 리지백(Thai Ridgeback), 티베탄 마스티프(Tibetan Mastiff), 티베탄 스패니얼(Tibetan Spaniel), 티베탄 테리어(Tibetan Terrier), 토른쟈크(Tornjak), 토사(Tosa), 토이 불독(Toy Bulldog), 토이 폭스 테리어(Toy Fox Terrier), 토이 맨체스터 테리어(Toy Manchester Terrier), 트리잉 커(Treeing Cur), 트리잉 워커 쿤하운드(Treeing Walker Coonhound), 티롤리언 하운드(Tyrolean Hound), 우토나간, 비즐라, 볼피노 이탈리아노(Volpino Italiano), 와이머라너(Weimaraner), 카디건 웰시 코기(Cardigan Welsh Corgi), 펨브록 웰시 코기(Pembroke Welsh Corgi), 웰시 쉽독(Welsh Sheepdog), 웰시 스프링어 스패니얼(Welsh Springer Spaniel), 웰시 테리어(Welsh Terrier), 웨스트 하이랜드 화이트 테리어(West Highland White Terrier), 웨스트 시베리안 라이카(West Siberian Laika), 웨스트팔리안 닥스브라케(Westphalian Dachsbracke), 웨터훈(Wetterhoun), 휘핏(Whippet), 화이트 잉글리시 불독(White English Bulldog), 화이트 셰퍼드 도그(White Shepherd Dog), 와이어헤어드 비즐라(Wirehaired Vizsla), 와이어헤어드 포인팅 그리퐁(Wirehaired Pointing Griffon), 및 요크셔 테리어(Yorkshire Terrier)로 구성된 군으로부터 선택되는 하나 이상의 개 품종을 포함한다. 일부 실시양태에서, 집단은 하나 이상의 순종 개(예컨대, 단일 품종 유형을 갖는 것) 또는 하나 이상의 혼합 품종 개(예컨대, 복수의 품종 유형을 갖는 것)를 포함한다. 일부 실시양태에서, 집단은 임의 개수의(예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 10개 초과의) 순종 개 또는 순종 개의 조합으로부터의 DNA를 갖는 혼합 품종 개 집단이다.
일부 실시양태에서, 하플로타입 데이터는 하플로타입 페이징 알고리즘을 사용하여 시험 개체 집단의 유전자형 데이터를 프로세싱함으로써 생성된다. 일부 실시양태에서, 하플로타입 페이징 알고리즘은 참조 기반 하플로타입 페이징 알고리즘을 포함한다. 일부 실시양태에서, 참조 기반 하플로타입 페이징 알고리즘은 은닉 마르코프 모형(HMM: Hidden Markov Model) 기반 검색을 포함한다. 일부 실시양태에서, 참조 기반 하플로타입 페이징 알고리즘은 Eagle1 알고리즘, Eagle2 알고리즘, PHASE 알고리즘, fastPHASE 알고리즘, BEAGLE 알고리즘, Findhap 알고리즘, Impute 알고리즘, FImpute 알고리즘, AlphaImpute 알고리즘, IMPUTE2 알고리즘, MaCH 알고리즘, SHAPEIT1 알고리즘, SHAPEIT2 알고리즘, SHAPEIT3 알고리즘, SHAPEIT4 알고리즘, 또는 그의 조합을 포함한다. 일부 실시양태에서, 하플로타입 페이징 알고리즘은 코호트 기반 하플로타입 페이징 알고리즘을 포함한다.
일부 실시양태에서, 유전자형 데이터는 시험 개체 집단으로부터 수득된 생물학적 샘플을 검정함으로써 수득된다. 일부 실시양태에서, 생물학적 샘플은 혈액 샘플, 타액 샘플, 스왑 샘플, 세포 샘플, 또는 조직 샘플을 포함한다. 일부 실시양태에서, 검정은 생물학적 샘플 또는 그의 유도체를 시퀀싱하는 것을 포함한다.
일부 실시양태에서, 복수의 유전자 마커는 적어도 약 500, 적어도 약 1,000, 적어도 약 2,000, 적어도 약 3,000, 적어도 약 4,000, 적어도 약 5,000, 적어도 약 6,000, 적어도 약 7,000, 적어도 약 8,000, 적어도 약 9,000, 또는 적어도 약 10,000개의 별개의 유전자 마커를 포함한다.
일부 실시양태에서, 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계는 GERMLINE 알고리즘, PLINK 알고리즘, PREST 알고리즘, IBD 검출을 위한 랜덤 프로젝션(RaPID: Random Projection for IBD Detection) 알고리즘, IBD 공유 하플로타입 신속 발견(FISHR: Find IBD Shared Haplotypes Rapidly) 알고리즘, 정련된 직계 동형(IBD) 알고리즘, fastIBD 알고리즘, KING 알고리즘, HaploScore 알고리즘, TRUFFLE 알고리즘, 또는 그의 조합을 사용하는 것을 포함한다. 일부 실시양태에서, 미리 결정된 임계값 크기는 약 100 킬로 염기쌍(kbp: kilobase pair), 약 200 kbp, 약 300 kbp, 약 400 kbp, 약 500 kbp, 약 600 kbp, 약 700 kbp, 약 800 kbp, 약 900 kbp, 또는 약 1,000 kbp이다. 일부 실시양태에서, 유전자 마커의 미리 결정된 개수는 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 또는 약 100개의 별개의 유전자 마커이다.
일부 실시양태에서, 본 방법은 복수의 이산 게놈 간격의 이산 게놈 간격이 동일한 크기를 갖도록 매칭된 세그먼트를 나누는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 복수의 이산 게놈 간격의 이산 게놈 간격이 가변 크기를 갖도록 매칭된 세그먼트를 나누는 단계를 추가로 포함한다. 일부 실시양태에서, 복수의 이산 게놈 간격의 주어진 이산 게놈 간격의 가변 크기는 적어도 부분적으로는 주어진 이산 게놈 간격에 근접한 IBD 매치의 시작 위치 및 종료 위치, 주어진 이산 게놈 간격에서 유전자 마커의 밀도, 주어진 이산 게놈 간격에 대한 마커의 최대 개수, 주어진 이산 게놈 간격의 최대 길이, 또는 그의 조합에 기초하여 결정된다.
일부 실시양태에서, 본 방법은 (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도, 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 동형접합성 매칭 점수 및 복수의 쌍별 매칭 점수를 생성하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 상응하는 동형접합성 매칭 점수와의 주어진 쌍별 매칭 점수의 일관성에 기초하여 복수의 쌍별 매칭 점수를 보정하여 복수의 보정된 쌍별 매칭 점수를 생성하는 단계를 추가로 포함한다.
일부 실시양태에서, 본 방법은 두 이배체 개체에서의 두 대립유전자에 대한 복수의 일치 상태(identity state)에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계를 추가로 포함한다. 일부 실시양태에서, 복수의 일치 상태는 표 1로부터 선택되는 일치 상태를 포함하고, 복수의 가중치는 표 1에 열거된 복수의 근연도 r xy 에의 기여도에 기초하여 할당된다. 일부 실시양태에서, 조상 근연도 정도는 근연도 계수를 포함한다. 일부 실시양태에서, 본 방법은 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계를 추가로 포함하고, 여기서, 가중 합은
Figure pct00001
로 표현된다. 일부 실시양태에서, 조상 근연도 정도는 친족관계 계수를 포함한다. 일부 실시양태에서, 본 방법은 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계를 추가로 포함하고, 여기서, 가중 합은
Figure pct00002
로 표현된다.
일부 실시양태에서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계는 제1 개체 또는 제2 개체의 근친교배 정도를 결정하는 것을 포함한다. 일부 실시양태에서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계는 제1 개체 및 제2 개체의 근친교배 정도를 결정하는 것을 포함한다. 일부 실시양태에서, 본 방법은 적어도 부분적으로는 제1 개체 및 제2 개체의 근친교배 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 가족 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다. 일부 실시양태에서, 가족 관계는 한 쌍의 인간 사이의 관계로 주어지며, 이로써, 제1 개체와 제2 개체 간의 조상 근연도 정도는 한 쌍의 인간 사이에 예상되는 조상 근연도 정도와 유사하다. 일부 실시양태에서, 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다.
일부 실시양태에서, 본 방법은 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도를 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도에 기초하여 제1 개체 및 제2 개체를 함께 교배시킬지 여부를 나타내는 권장 사항을 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하지 않는 경우, 제1 개체 및 제2 개체를 함께 교배시키는 것을 나타내는 권장 사항을 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하는 경우, 제1 개체 및 제2 개체를 함께 교배시키지 않는 것을 나타내는 권장 사항을 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 미리 결정된 근친교배 정도 임계값은 약 0.10, 약 0.15, 약 0.20, 약 0.25, 약 0.30, 약 0.35, 약 0.40, 약 0.45, 또는 약 0.50이다.
일부 실시양태에서, 본 방법은 적어도 부분적으로는 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도에 기초하여 제1 개체와 연관된 제1인과 제2 개체와 연관된 제2인 사이의 사회적 관계를 생성하는 단계를 추가로 포함한다. 일부 실시양태에서, 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도가 미리 결정된 임계값을 초과하는 경우, 사회적 관계가 생성된다. 일부 실시양태에서, 미리 결정된 임계값은 약 0.00001, 약 0.0001, 약 0.001, 약 0.01, 약 0.02, 약 0.04, 약 0.06, 약 0.08, 약 0.1, 약 0.12, 약 0.14, 약 0.16, 약 0.18, 약 0.2, 약 0.25, 약 0.3, 약 0.35, 약 0.4, 약 0.45, 또는 약 0.5이다. 일부 실시양태에서, 사회적 관계가 소셜 미디어 네트워크를 통해 생성된다. 일부 실시양태에서, 제1인은 제1 개체의 애완동물 소유자이고, 제2인은 제2 개체의 애완동물 소유자이다. 일부 실시양태에서, 동일인은 제1 개체와 제2 개체의 애완동물 소유자이다. 일부 실시양태에서, 제1인과 제2인 사이의 사회적 관계를 생성하는 단계는 제1인 또는 제2인의 위치를 제공하는 것을 포함한다. 일부 실시양태에서, 제1인과 제2인 사이의 사회적 관계를 생성하는 단계는 제1인과 제2인 사이의 통신 링크를 제공하는 것을 포함한다.
일부 실시양태에서, 본 방법은 적어도 부분적으로는 조상 근연도 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 가족 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다. 일부 실시양태에서, 가족 관계는 한 쌍의 인간 사이의 관계로 주어지며, 이로써, 제1 개체와 제2 개체 간의 조상 근연도 정도는 한 쌍의 인간 사이에 예상되는 조상 근연도 정도와 유사하다. 일부 실시양태에서, 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다.
일부 실시양태에서, 본 방법은 시험 개체 집단의 하나 이상의 개체 각각에 대해 개체에서의 유전적 또는 건강 상태의 존재, 부재, 위험, 또는 보인자 상태를 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 유전적 또는 건강 상태는 혈소판병증(RASGRP2 엑손 8); 피루베이트 키나제 결핍증(PKLR 엑손 7 퍼그 변이체); 인자 IX 결핍, 혈우병 B(F9 엑손 7, 테리어 변이체); 피루베이트 키나제 결핍증(PKLR 엑손 7 비글 변이체); P2Y12 수용체 혈소판 장애(P2RY12); 글란즈만 혈소판기능저하증 타입 I(Glanzmann's Thrombasthenia Type I)(ITGA2B 엑손 12); 폰빌레브란트병 타입 II, 타입 II vWD(Von Willebrand Disease)(VWF); 메이-헤글린 이상(May-Hegglin Anomaly)(MYH9); 혈소판병증(RASGRP2 엑손 5, 아메리칸 에스키모 도그 변이체); 인자 IX 결핍, 혈우병 B(F9 엑손 7, 로디지안 리지백 변이체); 폰빌레브란트병 타입 I(VWF); 개과 타원적혈구증(SPTB 엑손 30); 개과 백혈구 부착 결핍증 타입 III, LAD3(FERMT3); 프리칼리크레인 결핍증(KLKB1 엑손 8); 폰빌레브란트병 타입 III, 타입 III vWD (VWF 엑손 4); 인자 VIII 결핍, 혈우병 A(F8 엑손 10, 복서 변이체); 트랩형 호중구 증후군(VPS13B); 피루베이트 키나제 결핍증(PKLR 엑손 7 래브라도 변이체); 혈소판병증(RASGRP2 엑손 5, 바셋 하운드 변이체); 피루베이트 키나제 결핍증(PKLR 엑손 5); 인자 VIII 결핍, 혈우병 A(F8 엑손 1, 셰퍼드 변종 2); 인자 VII 결핍증(F7 엑손 5); 선천성 거대 혈소판 감소증(TUBB1 엑손 1, 카발리에 킹 찰스 스패니얼 변이체); 목질막염, LM(PLG); 피루베이트 키나제 결핍증(PKLR 엑손 10); 인자 VIII 결핍, 혈우병 A(F8 엑손 11, 셰퍼드 변종 1); 다른 시스템; 샤페이 자가염증 질환, SPAID(Shar-Pei Autoinflammatory Disease), 샤페이 열(MTBP); 상염색체 열성 유전성 불완전형성증, 가족성 에나멜 형성저하증(이탈리안 그레이하운드 변이체); 지속성 뮬러관 증후군, PMDS(Persistent Mullerian Duct Syndrome)(AMHR2); 도베르만, DVDob, DINGS의 청각장애 및 전정 증후군; 눈; 진행성 망막 위축, crd2(IQCB1); 원발성 수정체 탈구(ADAMTS17); 녹내장 원발성 개방각 녹내장(ADAMTS17 엑손 2); 진행성 망막 위축, crd1(PDE6B); 진행성 망막 위축, rcd1 간상-원추세포 이형성증, rcd1(PDE6B 엑손 21 아이리시 세터 변이체); 콜리 눈 이상, 맥락막 형성저하증, CEA(NHEJ1); 진행성 망막 위축(SAG); 색맹(CNGA3 엑손 7 저먼 셰퍼드 변이체); 개과 다초점 망막병증 cmr2(BEST1 엑손 5); 녹내장 원발성 개방각 녹내장(ADAMTS17 엑손 11); 진행성 망막 위축, prcd 진행성 간상-원추세포 변성증(진행성 rod-cone degeneration)(PRCD 엑손 1); 유전성 백내장, 조기 발병 백내장, 소아 백내장(HSF4 엑손 9 셰퍼드 변이체); 상염색체 우성 진행성 망막 위축(RHO); 개과 다초점 망막병증 cmr3(BEST1 엑손 10 SNP); 색맹(CNGA3 엑손 7 래브라도 리트리버 변이체); 개과 다초점 망막병증 cmr1(BEST1 엑손 2); 진행성 망막 위축, rcd3 간상-원추세포 이형성증, rcd3(PDE6A); 진행성 망막 위축(CNGB1); 골든 리트리버 진행성 망막 위축 2, GR-PRA2(TTC8); 진행성 망막 위축, CNGA(CNGA1 엑손 9); 골든 리트리버 진행성 망막 위축 1, GR-PRA1(SLC4A3); 진행성 망막 위축 - crd4/cord1(RPGRIP1); 선천 비진행성 야맹증(RPE65); 반점 각막 이상증, MCD(Macular Corneal Dystrophy)(CHST6); 녹내장 원발성 개방각 녹내장(ADAMTS10 엑손 9); 개과 다초점 망막병증 cmr3(BEST1 엑손 10 결실); 녹내장 원발성 개방각 녹내장(ADAMTS10 엑손 17); 근육; 중심핵성 근병증(PTPLA); 선천성 근긴장증(CLCN1 엑손 7); 그레이트 데인의 유전성 근병증(BIN1); 선천성 근긴장증(CLCN1 엑손 23); 근이영양증 근이영양증(DMD 펨브록 웰시 코기 변이체); 운동 유발성 허탈증(DNM1); 근이영양증 근이영양증(DMD 골든 리트리버 변이체); 미오스타틴 결핍증, 불리 휘핏 증후군(MSTN); 근세관성 근병증 1, X 연관 근세관성 근병증, XL-MTM(MTM1, 래브라도 변이체); 근이영양증 카발리에 킹 찰스 스패니얼 변이체 1; 다계통; 원발성 섬모운동 이상증, 복서 변이체CCDC39 엑손 3); GM1 강글리오시드증(GLB1 엑손 2); 뮤코다당류증 타입 IIIA, 산필리포 증후군 타입 A, MPS IIIA(SGSH 엑손 6 변이체 1); 성인 발병 신경 세로이드 리포푸신증(ATP13A2); GM1 강글리오시드증(GLB1 엑손 15 시바견 변이체); 신경 세로이드 리포푸신증2, NCL 2(TPP1 엑손 4); 뮤코다당류증 타입 VII, 슬라이 증후군, MPS VII(GUSB 엑손 3); 개과 푸코시드축적증(FUCA1); GM1 강글리오시드증(GLB1 엑손 15 알래스칸 허스키 변이체); 라고토 축적병(ATG4D); 선천성 건성 각결막염 및 어린선상 피부병, 안구 건조증 컬리 코트 증후군, CKCSID(Congenital Keratoconjunctivitis Sicca and Ichthyosiform Dermatosis)(FAM83H 엑손 5); 글리코겐 축적병 타입 VII, 포스포프럭토키나제 결핍증(Phosphofructokinase Deficiency), PFK 결핍증(PFKM 휘핏 및 잉글리시 스프링거 스패니얼 변이체); 글리코겐 축적병 타입 IA, 폰기르케병(Von Gierke Disease), GSD IA(G6PC); 글리코겐 축적병 타입 VII, 포스포프럭토키나제 결핍증, PFK 결핍증(PFKM 바흐텔훈트 변이체); 신경 세로이드 리포푸신증 1, NCL 1(Neuronal Ceroid Lipofuscinosis 1)(CLN5 보더 콜리 변이체); 신경 세로이드 리포푸신증 1, 소뇌성 실조증, NCL-A (ARSG 엑손 2); 신경 세로이드 리포푸신증 6, NCL 6(CLN6 엑손 7); 뮤코다당류증 타입 I, MPS I(IDUA); 신장 낭선암종 및 결절성 피부섬유증, RCND(Renal Cystadenocarcinoma and Nodular Dermatofibrosis)(FLCN 엑손 7); 신경 세로이드 리포푸신증 10, NCL 10(CTSD 엑손 5); 구형체 세포 백질이영양증, 크라베병(GALC 엑손 5); 글리코겐 축적병 타입 IIIA, GSD IIIA(AGL); 신경 세로이드 리포푸신증(MFSD8); GM2 강글리오시드증(HEXB, 푸들 변이체); X 연관 외배엽 이형성증, 무한증성 외배엽 이형성증(EDA 인트론 8); 신경 세로이드 리포푸신증(CLN8 오스트레일리안 셰퍼드 변이체); 신경 세로이드 리포푸신증 8, NCL 8(CLN8 잉글리시 세터 변이체); 신경 세로이드 리포푸신증 1, NCL 1(PPT1 엑손 8); 신경 세로이드 리포푸신증(CLN5 골든 리트리버 변이체); 뮤코다당류증 타입 VII, 슬라이 증후군, MPS VII(GUSB 엑손 5); 글리코겐 축적병 타입 II, 폼페병, GSD II(GAA); GM2 강글리오시드증(HEXA); 뮤코다당류증 타입 IIIA, 산필리포 증후군 타입 A, MPS IIIA(SGSH 엑손 6 변이체 2); 피부 & 결합 조직; 어린선(PNPLA1); 어린선(SLC27A4); 이영양성 수포성 표피박리증(COL7A1); 어린선, 표피박리 과다각화증(KRT10); 외배엽 이형성증, 피부 취약 증후군(PKP1); 어린선(NIPAL4); 무슬라딘 루케(Musladin-Lueke) 증후군(ADAMTSL2); 국소 비표피박리 손발바닥 각질피부증, 선천성 손발톱비대증(KRT16); 유전성 코 부전각화증(SUV39H2); 유전성 발바닥 과다각화증(FAM83G); 뇌 및 척수; 청소년 발병 다발신경병증, 레온베르거 다발신경병증 1, LPN1(LPN1, ARHGEF10); 소뇌 위축, 신생아 소뇌 피질 변성, NCCD(Neonatal Cerebellar Cortical Degeneration)(SPTBN2); 기면증(HCRTR2 인트론 6); L-2-하이드록시글루타르산뇨증, L2HGA(L2HGDH); 소뇌성 실조증을 동반한 해면상 변성 2, SDCA2(Spongy Degeneration with Cerebellar Ataxia 2)(ATP1B2); 진행성 뉴런 위축, 개과 다계통 변성, CMSD(Canine Multiple System Degeneration)(SERAC1 엑손 15); 태아 발병 신생아 신경축삭 이영양증(MFN2); 발작을 동반한 신생아 뇌병증, NEWS(ATF2); 양성 가족성 청소년 간질, 완화성 국소 간질(LGI2); 청소년 후두 마비 및 다발신경병증, 안구 기형 및 신경 공포형성을 동반한 다발신경병증, POANV(RAB3GAP1, 로트바일러 변이체); 진행성 뉴런 위축, 개과 다계통 변성, CMSD(SERAC1 엑손 4); 소뇌성 실조증, 진행성 조기 발병 소뇌성 실조증(SEL1L); 유전성 감각 자율 신경병증, 말단 손상 증후군, AMS(Acral Mutilation Syndrome)(GDNF-AS); 진전 강아지 증후군, X 연관 전신 떨림 증후군(PLP); 저수초화 및 떨림(FNIP2); 척수소뇌성 실조증, 후기 발병 실조증, LoSCA(CAPN1); 다발신경병증, NDRG1 그레이하운드 변종 (NDRG1 엑손 15); 다발신경병증, NDRG1 말라뮤트 변이체(NDRG1 엑손 4); 소뇌 형성저하증(VLDLR); 소뇌성 실조증을 동반한 해면상 변성 1, SDCA1(Spongy Degeneration with Cerebellar Ataxia 1), SeSAME/EAST 증후군(KCNJ10); 근잔떨림 및/또는 발작을 동반한 척수소뇌성 실조증(KCNJ10); 알래스칸 허스키 뇌병증, 아급성 괴사성 뇌척수병(SLC19A3); 퇴행성 골수병증, DM(Degenerative Myelopathy)(SOD1A); 알렉산더병(GFAP); 심장; 확장성 심근병증, DCM1(PDK4); 긴 QT 증후군(KCNQ1); 확장성 심근병증, DCM2(TTN); 골격; 유전성 비타민 D 저항성 구루병(VDR: Vitamin D-Resistant Ricket); 골형성부전증, 취성 골 질환(COL1A1); 골형성부전증, 취성 골 질환(SERPINH1); 연골이영양증 및 추간판 질환, CDDY/IVDD, 타입 I IVDD(FGF4 레트로유전자 - CFA12); 골형성부전증, 취성 골 질환(COL1A2); 두개하악 골병증, CMO(Craniomandibular Osteopathy)(SLC37A2); 골격 이형성증 2, SD2(Skeletal Dysplasia 2)(COL11A2); 구순구개열 및/또는 구개열(ADAMTS20); 눈골격 이형성증 1, 왜소증-망막 이형성증, OSD1(COL9A3, 래브라도 리트리버); 골연골이형성증, 골격 왜소증(SLC13A1); 대사; 악성 고열(RYR1); 카탈라제저하증, 무카탈라제혈증(CAT); 피루베이트 데하이드로게나제 결핍증(PDP1); 신장 및 방광; 고요산뇨증 및 고요산혈증 또는 요로결석증, HUU(SLC2A9); 다낭성 신장 질환, PKD(Polycystic Kidney Disease)(PKD1); 단백질 손실 신병증, PLN(단백질 손실 신병증)(NPHS1); 시스틴뇨증 타입 II-A(SLC3A1); 원발성 고옥소산뇨증(AGXT); 시스틴뇨증 타입 I-A(SLC3A1); 상염색체 열성 유전성 신병증, 가족성 신병증, ARHN(COL4A4 엑손 3); X 연관 유전성 신병증, XLHN(COL4A5 엑손 35, 사모예드 변이체 2); 시스틴뇨증 타입 II-B(SLC7A9); 2,8-디하이드록시아데닌 요로결석, 2,8-DHA 요로결석(APRT); 신경근; 간헐적 낙상 증후군(BCAN); 선천성 근무력증 증후군(COLQ); 선천성 근무력증 증후군(CHAT); 면역; 중증 복합 면역결핍증(RAG1); X 연관 중증 복합 면역결핍증(IL2RG 변이체 1); 중증 복합 면역결핍증(PRKDC); X 연관 중증 복합 면역결핍증(IL2RG 변이체 2); 보체 3 결핍증, C3 결핍증(C3); 위장; 이머슬룬드-그레스베트 증후군(Imerslund-Grasbeck Syndrome), 선택적 코발라민 흡수 장애(CUBN 엑손 53); 이머슬룬드-그레스베트 증후군, 선택적 코발라민 흡수 장애(CUBN 엑손 8); 임상; MDR1 약물 감수성(MDR1); 알라닌 아미노트랜스퍼라제 활성(GPT); 호르몬; 및 선천성 갑상선 기능 저하증(TPO, 텐터필드 테리어 변이체)로 구성된 군으로부터 선택된다. 일부 실시양태에서, 위험은 유전적 또는 건강 상태를 갖는 개체의 확률 또는 상대적 위험으로 표현된다. 일부 실시양태에서, 상대적 위험은 수치(예컨대, 상대적 위험비) 또는 범주형 값(예컨대, "위험한 상태," "위험하지 않은 상태," 또는 "명백한 위험 상태")이다. 일부 실시양태에서, 보인자 상태는 개체가 유전적 또는 건강 상태의 보인자라는 것을 나타내는 양성 또는 음성 표시로 표현된다.
일부 실시양태에서, 본 방법은 시험 개체 집단의 하나 이상의 개체 각각에 대해, 개체의 하나 이상의 개 품종을 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 시험 개체 집단의 하나 이상의 개체 각각에 대해, 개체의 하나 이상의 개 품종의 하나 이상의 비율을 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 시험 개체 집단의 복수의 개체의 가계도를 생성하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 시험 개체 집단의 하나 이상의 개체 각각에 대해, 개체에서 표현형 또는 형질의 존재, 부재 또는 위험을 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 표현형 또는 형질은 베이스 코트 색상(예컨대, 진한 색상 또는 옅은 색상의 털, 색소의 색상, 및 색상 희석), 색상 코트 모디파이어(예컨대, 은닉 패터닝, 신체 패턴 및 안면 패턴), 코트 형질(예컨대, 퍼니싱, 코트 길이, 털 빠짐, 코트 질감, 털 없음(졸로(Xolo) 타입), 털 없음(테리어 타입), 및 백색증), 신체 특징(예컨대, 주둥이 길이, 꼬리 길이, 뒷이슬 발톱, 등 근육 및 벌크, 눈 색상), 신체 크기(예컨대, 더 작음, 중간 및 더 큼), 수행능(예컨대, 고도 적응), 유전적 다양성(예컨대, 근친교배 정도, 및 면역 반응의 다양성)으로 구성된 군으로부터 선택된다.
일부 실시양태에서, 본 방법은 조상 근연도 정도; 가족 관계; 유전적 또는 건강 상태의 존재, 부재, 위험 또는 보인자 상태; 하나 이상의 개 품종; 하나 이상의 개 품종의 하나 이상의 비율; 가계도; 표현형 또는 형질의 존재, 부재, 위험 또는 보인자 상태; 및 그의 임의의 조합 중 하나 이상의 것을 나타내는 보고서를 작성하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 보고서를 수의사에게 전송하는 단계를 추가로 포함한다.
또 다른 측면에서, 본 개시내용은 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함하는 것인, 시험 개체 집단에 대한 하플로타입 데이터를 저장하도록 구성된 데이터베이스; 및 데이터베이스에 작동하도록 연결된 하나 이상의 컴퓨터 프로세서를 포함하는, 이배체 집단의 두 개체 간의 조상 근연도 정도를 추정하기 위한 컴퓨터 시스템으로서, 여기서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 (a) 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누고; (b) 각 시험 개체 집단에 대해: (i) 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하고, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함하는 것이고; (ii) 제1 개체와 제2 개체 간의 각각의 매칭된 세그먼트에 대해: 매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누고; (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도, 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 점수를 생성하고; 복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하고; 이산 게놈 간격의 복수의 보정된 점수에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하고; (iii) 복수의 보정된 점수 및 복수의 가중치에 기초하여 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하고; (c) 매칭된 세그먼트의 가중 합에 기초하여 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하도록 프로그래밍된 것인 컴퓨터 시스템을 제공한다.
일부 실시양태에서, 이배체 집단은 포유동물 집단이다. 일부 실시양태에서, 포유동물 집단은 개과 집단, 고양이과 집단, 스포츠 동물 집단, 또는 설치류 집단이다. 일부 실시양태에서, 포유동물 집단은 개과 집단이다. 일부 실시양태에서, 개과 집단은 개 집단이다. 일부 실시양태에서, 포유동물 집단은 고양이과 집단이다. 일부 실시양태에서, 고양이과 집단은 고양이 집단이다. 일부 실시양태에서, 포유동물 집단은 스포츠 동물 집단이다. 일부 실시양태에서, 스포츠 동물 집단은 말 집단이다. 일부 실시양태에서, 개 집단은 아펜핀셔, 아프간 하운드, 아프리카니스, 아이디, 에어데일 테리어, 악바쉬 도그, 아키타견, 알랑구 마스티프, 알라노 에스파뇰, 알라파하 블루 블러드 불독, 알래스칸 클리 카이, 알래스칸 말라뮤트, 얼라운트, 알로페키스, 알파인 닥스브래크, 알자시안 셰팔류트, 아메리칸 아키타, 아메리칸 불독, 아메리칸 코커 스패니얼, 아메리칸 에스키모 도그, 아메리칸 폭스하운드, 아메리칸 헤어리스 테리어, 아메리칸 마스티프, 아메리칸 핏 불 테리어, 아메리칸 스태퍼드셔 테리어, 아메리칸 워터 스패니얼, 아나톨리안 셰퍼드 도그, 앵글로-프랑세 드 쁘티 베네리, 아펜젤러 세넨훈드, 아르헨틴 도고, 아리에주 포인터, 아리에쥬아, 아르만트, 아르토이스 하운드, 오스트레일리안 불독, 오스트레일리안 캐틀 도그, 오스트레일리안 켈피, 오스트레일리안 셰퍼드, 오스트레일리안 실키 테리어, 오스트레일리안 스텀피 테일 캐틀 도그, 오스트레일리안 테리어, 오스트리안 블랙 앤 탠 하운드, 오스트리안 핀셔, 아자와크, 바카르왈 도그, 바베트, 바센지, 바스크 셰퍼드 도그, 바셋 아르테지앙 노르만, 바셋 블뢰 드 가스코뉴, 바셋 포브 드 브르타뉴, 그랑 바셋 그리퐁 방댕, 쁘티 바셋 그리퐁 방댕, 바이에른 마운틴 하운드, 비글, 비글-해리어, 비어디드 콜리, 보스롱, 베들링턴 테리어, 벨지안 셰퍼드 도그, 벨지안 셰퍼드 도그(그루넨달), 벨지안 셰퍼드 도그(라케노이즈), 벨지안 셰퍼드 도그(말리노이즈), 벨지안 셰퍼드(테뷰런), 베르가마스코 셰퍼드, 베르거 블랑 스위스, 베르거 피카르드, 베른 라우프훈트, 버니즈 마운틴 도그, 비숑 프리제, 빌리, 비스벤, 블랙 앤 탠 쿤하운드, 블랙 앤 탠 버지니아 폭스하운드, 불렌바이저, 블랙 노르웨이 엘크하운드, 블랙 러시안 테리어, 블랙마우스 커, 그랑블루 드 가스코뉴, 쁘티 블루 드 가스코뉴, 블러드하운드, 블루 레이시, 블루 폴 테리어, 블루틱 쿤하운드, 보어보엘, 보헤미안 셰퍼드, 볼로네제, 보더 콜리, 보더 테리어, 보르조이, 보스니아 코즈-헤어드 하운드, 보스톤 테리어, 부비에 데 아르덴, 부비에 데 플랑드르, 복서, 보이킨 스패니얼, 브라코 이탈리아노, 브라크 디 오베르뉴, 브라크 뒤 부르보네, 블라크 더 파이, 브라크 프랑세, 브라크 생-제르맹, 브라질리언 테리어, 브리아드, 브리케 그리퐁 방댕, 브리타니, 브로홀머, 브루노 쥬라 하운드, 부코비나 셰퍼드 도그, 불 앤 테리어, 불 테리어, 불 테리어(미니어처), 불마스티프, 불리 쿠타, 케언 테리어, 케이넌 도그, 캐내디언 에스키모 도그, 캐내디언 포인터, 카네 코르소, 카오 다 세라 아이레스, 카오 데 카스트로 라보레이로, 카오 필라 드 사오 미구엘, 캐롤리나 도그, 카르파티안 셰퍼드 도그, 카타호울라 커, 카탈란 쉽독, 코카시안 셰퍼드 도그, 카발리에 킹 찰스 스패니얼, 센트럴 아시안 셰퍼드 도그, 체스키 푸섹, 체스키 테리어, 폴리시 그레이하운드, 체서피크 베이 리트리버, 시엥-그리스, 시엥 프랑세 블랑 이 느와르, 시엥 프랑세 블랑 이 오렌지, 시엥 프랑세 트리콜로르, 치와와, 칠리안 폭스 테리어, 차이니즈 충칭 도그, 차이니즈 크레스티드 도그, 차이니즈 임페리얼 도그, 치누크, 치피파라이, 차우차우, 시마론 우루과요, 시에르니 세리, 시르네코 델레트나, 클럼버 스패니얼, 러프 콜리, 스무스 콜리, 콤바이, 코르도바 파이팅 도그, 코통 드 튈레아르, 크레탄 하운드, 크로아티안 쉽독, 컴벌랜드 쉽독, 컬리 코티드 리트리버, 체코슬로바키아 울프도그, 닥스훈트, 달마시안, 댄디 딘몬트 테리어, 데니쉬 스웨디쉬 팜도그, 딩고, 도베르만 핀셔, 도그 드 보르도, 도고 쿠바노, 도고 과테말테코, 도고 사르데스코, 드렌체 파트리혼트, 드레버, 덩커, 더치 셰퍼드 도그, 더치 스모우스혼드, 이스트 유러피안 셰퍼드, 이스트 시베리안 라이카, 엘로, 잉글리시 코커 스패니얼, 잉글리시 쿤하운드, 잉글리시 폭스하운드, 잉글리시 마스티프, 잉글리시 포인터, 잉글리시 세터, 잉글리시 셰퍼드, 잉글리시 스프링거 스패니얼, 잉글리시 토이 테리어(블랙 & 탄), 잉글리시 워터 스패니얼, 잉글리시 화이트 테리어, 엔틀버쳐 마운틴 도그, 에파뉴엘 블뢰 드 피카르디, 에스토니안 하운드, 에스트렐라 마운틴 도그, 유라시에, 필드 스파니엘, 휠라 브라질레이로, 핀도, 피니쉬 하운드, 피니쉬 라프훈트, 피니쉬 스피츠, 플랫-코티드 리트리버, 포모산 마운틴 도그, 폭스 테리어(스무스), 와이어 폭스 테리어, 프렌치 브리타니, 프렌치 불독, 프렌치 스패니얼, 갈고 에스파뇰, 저먼 롱헤어드 포인터, 저먼 핀셔, 저먼 셰퍼드 도그, 저먼 쇼트헤어드 포인터, 저먼 스패니얼, 저먼 스피츠, 저먼 와이어헤어드 포인터, 자이언트 슈나우저, 글렌 오브 이말 테리어, 골든 리트리버, 고든 세터, 그랑 앵글로-프랑세 블랑 이 느와르, 그랑 앵글로-프랑세 블랑 이 오렌지, 그랑 앵글로-프랑세 트리콜로르, 그랑 그리퐁 방댕, 그랑 마스팅 드 보링켄, 그레이트 데인, 그레이트 피레니즈, 그레이터 스위스 마운틴 도그, 그린란드 도그, 그레이하운드, 그리퐁 블뢰 드 가스코뉴, 그리퐁 브뤼셀루아, 그리퐁 포브 드 브르타뉴, 그리퐁 니베르네, 굴 동, 굴 테르, 해어 인디언 도그, 해밀턴스퇴바레, 하노버 하운드, 해리어, 하바네세, 하와이안 포이 도그, 히말라얀 쉽독, 홋카이도, 호르타야 보르자야, 호바와트, 헝가리안 하운드, 뉴질랜드 헌터웨이하이겐훈트, 이비잔 하운드, 아이슬란딕 쉽독, 인디안 스피츠, 아이리시 불 테리어, 아이리시 레드 앤드 화이트 세터, 아이리시 세터, 아이리시 스타포드셔 불 테리어, 아이리시 테리어, 아이리시 워터 스패니얼, 아이리시 울프하운드, 이스트리안 쇼트헤어드 하운드, 이스트리안 코즈-헤어드 하운드, 이탈리안 그레이하운드, 잭 러셀 테리어, 잭테리어, 쟘툰드, 재패니즈 친, 재패니즈 스피츠, 재패니즈 테리어, 조낭이, 카이카디, 카이 켄, 캉갈 도그, 카니, 카라카찬 도그, 커릴리언 베어 도그, 카르스트 셰퍼드, 키스혼드, 케리 비글, 케리 블루 테리어, 킹 찰스 스패니얼, 킹 셰퍼드, 킨타마니, 기슈, 코몬도르, 쿠이커혼제, 쿨리, 한국 진돗개, 한국 마스티프, 크롬폴란데, 쿤밍 울프 도그, 쿠리, 쿠바즈, 카이-레오, 래브라도 허스키, 래브라도 리트리버, 라고토 로마그놀로, 레이크랜드 테리어, 랭카셔 힐러, 랜드시어, 라포니안 허더, 레온베르거, 라사 압소, 리투아니안 하운드, 롱헤어드 휘핏, 로타토레 브린디시노, 로첸, 마자르 아가, 마제스틱 트리 하운드, 말티즈, 맨체스터 테리어, 마렘마 쉽독, McNab, 멕시칸 헤어리스 도그, 미니어처 오스트레일리안 셰퍼드, 미니어처 폭스 테리어, 미니어처 핀셔, 미니어처 슈나우저, 미니어처 시베리안 허스키, 미오리틱, 몰로수스, 몬터니그런 마운틴 하운드, 모스크바 워치독, 모스크바 워터 도그, 마운틴 커, 마운틴 뷰 커, 무쿠치, 무디, 머드홀 하운드, 라지 문스터랜더, 스몰 문스터랜더, 머레이 리버 컬리 코티드 리트리버, 나폴리탄 마스티프, 뉴펀들랜드, 뉴 기니아 싱잉 도그, 노포크 스패니얼, 노포크 테리어, 노르보텐스피츠, 노스 컨트리 비글, 노던 이누이트 도그, 노르웨이안 부훈트, 노르웨이안 엘크하운드, 노르웨이안 룬트훈트, 노리치 테리어, 노바 스코셔 덕-톨링 리트리버, 올드 대니시 포인터, 올드 잉글리시 쉽독, 올드 잉글리시 불독, 올드 잉글리시 테리어, 올드 저먼 셰퍼드 도그, 올드 잉글리시 불도그, 오터하운드, 파촌 나바로, 페이즐리 테리어, 빠삐용, 파슨 러셀 테리어, 페터데일 테리어, 페키니즈, 페로 드 프레사 카나리오, 페르로 드 프레사 말로르퀸, 페루비안 헤어리스 도그, 파렌, 파라오 하운드, 피카디 스패니얼, 플롯 하운드, 포덴코 카나리오, 포인터, 폴리시 하운드, 폴리시 헌팅 도그, 폴리시 로우랜드 쉽독, 폴리시 타트라 쉽독, 포메라니안, 퐁토드메르 스패니얼, 푸들, 포르셀엔, 포르투기스 포덴고, 포르투기스 포인터, 포르투기스 워터 도그, 프라츠키 크리사릭, 푸들포인터, 퍼그, 풀리, 푸미, 풍산개, 피레니안 마스티프, 피레니언 셰퍼드, 라페이로 도 알렌테조, 라자팔라얌, 람퍼 그레이하운드, 라스트레아도르 브라질레이로, 래토네로 보데게로 안달루즈, 래트 테리어, 레드본 쿤하운드, 로디지안 리지백, 로트바일러, 러시안 스패니얼, 러스키 토이, 루소-유러피안 라이카, 러셀 테리어, 사를로스울프하운드, 사부에소 에스파뇰, 세이지 아샤예리, 세이지 마잔다라니, 사할린 허스키, 살루키, 사모예드, 삽살리, 샤플래니낙, 샤펜도스, 실레르스퇴바레, 스키퍼키, 올드 크로아티안 사이트하운드, 자이언트 슈나우저, 미니어처 슈나우저, 스탠다드 슈나우저, 슈바이처 라우프훈트, 슈바이체리셔 니데를라우프훈트, 스카치 콜리, 스코티시 디어하운드, 스코티시 테리어, 실리엄 테리어, 세구지오 이탈리아노, 세팔라 시베리안 슬레드독, 세르비안 하운드, 세르비안 트라이칼라 하운드, 샤페이, 셔틀랜드 쉽독, 시바견, 시추, 시코쿠, 샤일로 셰퍼드 도그, 시라크, 시베리안 허스키, 실켄 윈드하운드, 싱할라 하운드, 스카이 테리어, 슬루기, 슬로박 쿠바크, 슬로바키안 러프-헤어드 포인터, 슬로벤스키 코포브, 스말랜드스퇴바레, 스몰 그리크 도메스틱 도그, 소프트-코티드 휘튼 테리어, 사우스 러시안 오브차카, 써던 하운드, 스패니쉬 마스티프, 스패니쉬 워터 도그, 스피노네 이탈리아노, 스포팅 루카스 테리어, 세인트 버나드, 세인트 존스 워터 도그, 스테비훈, 스타포드셔 불 테리어, 스테펜스 커, 스타이리안 코즈-헤어드 하운드, 서식스 스패니얼, 스웨디시 라프훈트, 스위디쉬 발훈트, 스위디쉬 비글, 탈탄 베어 도그, 타이간, 타마스칸 도그, 테디 루스벨트 테리어, 텔로미안, 텐터필드 테리어, 타이 방깨우 도그, 타이 리지백, 티베탄 마스티프, 티베탄 스패니얼, 티베탄 테리어, 토른쟈크, 토사, 토이 불독, 토이 폭스 테리어, 토이 맨체스터 테리어, 트리잉 커, 트리잉 워커 쿤하운드, 티롤리언 하운드, 우토나간, 비즐라, 볼피노 이탈리아노, 와이머라너, 카디건 웰시 코기, 펨브록 웰시 코기, 웰시 쉽독, 웰시 스프링어 스패니얼, 웰시 테리어, 웨스트 하이랜드 화이트 테리어, 웨스트 시베리안 라이카, 웨스트팔리안 닥스브라케, 웨터훈, 휘핏, 화이트 잉글리시 불독, 화이트 셰퍼드 도그, 와이어헤어드 비즐라, 와이어헤어드 포인팅 그리퐁, 및 요크셔 테리어로 구성된 군으로부터 선택되는 하나 이상의 개 품종을 포함한다. 일부 실시양태에서, 집단은 하나 이상의 순종 개(예컨대, 단일 품종 유형을 갖는 것) 또는 하나 이상의 혼합 품종 개(예컨대, 복수의 품종 유형을 갖는 것)를 포함한다. 일부 실시양태에서, 집단은 임의 개수의(예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 10개 초과의) 순종 개 또는 순종 개의 조합으로부터의 DNA를 갖는 혼합 품종 개 집단이다.
일부 실시양태에서, 하플로타입 데이터는 하플로타입 페이징 알고리즘을 사용하여 시험 개체 집단의 유전자형 데이터를 프로세싱함으로써 생성된다. 일부 실시양태에서, 하플로타입 페이징 알고리즘은 참조 기반 하플로타입 페이징 알고리즘을 포함한다. 일부 실시양태에서, 참조 기반 하플로타입 페이징 알고리즘은 은닉 마르코프 모형(HMM) 기반 검색을 포함한다. 일부 실시양태에서, 참조 기반 하플로타입 페이징 알고리즘은 Eagle1 알고리즘, Eagle2 알고리즘, PHASE 알고리즘, fastPHASE 알고리즘, BEAGLE 알고리즘, Findhap 알고리즘, Impute 알고리즘, FImpute 알고리즘, AlphaImpute 알고리즘, IMPUTE2 알고리즘, MaCH 알고리즘, SHAPEIT1 알고리즘, SHAPEIT2 알고리즘, SHAPEIT3 알고리즘, SHAPEIT4 알고리즘, 또는 그의 조합을 포함한다. 일부 실시양태에서, 하플로타입 페이징 알고리즘은 코호트 기반 하플로타입 페이징 알고리즘을 포함한다.
일부 실시양태에서, 유전자형 데이터는 시험 개체 집단으로부터 수득된 생물학적 샘플을 검정함으로써 수득된다. 일부 실시양태에서, 생물학적 샘플은 혈액 샘플, 타액 샘플, 스왑 샘플, 세포 샘플, 또는 조직 샘플을 포함한다. 일부 실시양태에서, 검정은 생물학적 샘플 또는 그의 유도체를 시퀀싱하는 것을 포함한다.
일부 실시양태에서, 복수의 유전자 마커는 적어도 약 500, 적어도 약 1,000, 적어도 약 2,000, 적어도 약 3,000, 적어도 약 4,000, 적어도 약 5,000, 적어도 약 6,000, 적어도 약 7,000, 적어도 약 8,000, 적어도 약 9,000, 또는 적어도 약 10,000개의 별개의 유전자 마커를 포함한다.
일부 실시양태에서, 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계는 GERMLINE 알고리즘, PLINK 알고리즘, PREST 알고리즘, IBD 검출을 위한 랜덤 프로젝션(RaPID) 알고리즘, IBD 공유 하플로타입 신속 발견(FISHR) 알고리즘, 정련된 직계 동형(IBD) 알고리즘, fastIBD 알고리즘, KING 알고리즘, HaploScore 알고리즘, TRUFFLE 알고리즘, 또는 그의 조합을 사용하는 것을 포함한다. 일부 실시양태에서, 미리 결정된 임계값 크기는 약 100 킬로 염기쌍(kbp), 약 200 kbp, 약 300 kbp, 약 400 kbp, 약 500 kbp, 약 600 kbp, 약 700 kbp, 약 800 kbp, 약 900 kbp, 또는 약 1,000 kbp이다. 일부 실시양태에서, 유전자 마커의 미리 결정된 개수는 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 또는 약 100개의 별개의 유전자 마커이다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 복수의 이산 게놈 간격의 이산 게놈 간격이 동일한 크기를 갖도록 매칭된 세그먼트를 나누도록 프로그래밍된다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 복수의 이산 게놈 간격의 이산 게놈 간격이 가변 크기를 갖도록 매칭된 세그먼트를 나누도록 프로그래밍된다. 일부 실시양태에서, 복수의 이산 게놈 간격의 주어진 이산 게놈 간격의 가변 크기는 적어도 부분적으로는 주어진 이산 게놈 간격에 근접한 IBD 매치의 시작 위치 및 종료 위치, 주어진 이산 게놈 간격에서 유전자 마커의 밀도, 주어진 이산 게놈 간격에 대한 마커의 최대 개수, 주어진 이산 게놈 간격의 최대 길이, 또는 그의 조합에 기초하여 결정된다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 및 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 동형접합성 매칭 점수 및 복수의 쌍별 매칭 점수를 생성하도록 프로그래밍된다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 상응하는 동형접합성 매칭 점수와의 주어진 쌍별 매칭 점수의 일관성에 기초하여 복수의 쌍별 매칭 점수를 보정하여 복수의 보정된 쌍별 매칭 점수를 생성하도록 프로그래밍된다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 두 이배체 개체에서의 두 대립유전자에 대한 복수의 일치 상태에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하도록 프로그래밍된다. 일부 실시양태에서, 복수의 일치 상태는 표 1로부터 선택되는 일치 상태를 포함하고, 복수의 가중치는 표 1에 열거된 복수의 근연도 r xy 에의 기여도에 기초하여 할당된다. 일부 실시양태에서, 조상 근연도 정도는 근연도 계수를 포함한다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하도록 프로그래밍되고, 여기서, 가중 합은
Figure pct00003
로 표현된다. 일부 실시양태에서, 조상 근연도 정도는 친족관계 계수를 포함한다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하도록 프로그래밍되고, 여기서, 가중 합은
Figure pct00004
로 표현된다.
일부 실시양태에서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 것은 제1 개체 또는 제2 개체의 근친교배 정도를 결정하는 것을 포함한다. 일부 실시양태에서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 것은 제1 개체 및 제2 개체의 근친교배 정도를 결정하는 것을 포함한다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 적어도 부분적으로는 제1 개체 및 제2 개체의 근친교배 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 결정하도록 프로그래밍된다. 일부 실시양태에서, 가족 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다. 일부 실시양태에서, 가족 관계는 한 쌍의 인간 사이의 관계로 주어지며, 이로써, 제1 개체와 제2 개체 간의 조상 근연도 정도는 한 쌍의 인간 사이에 예상되는 조상 근연도 정도와 유사하다. 일부 실시양태에서, 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도를 결정하도록 프로그래밍된다. 일부 실시양태에서, 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도에 기초하여 제1 개체 및 제2 개체를 함께 교배시킬지 여부를 나타내는 권장 사항을 결정하도록 프로그래밍된다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하지 않는 경우, 제1 개체 및 제2 개체를 함께 교배시키는 것을 나타내는 권장 사항을 결정하도록 프로그래밍된다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하는 경우, 제1 개체 및 제2 개체를 함께 교배시키지 않는 것을 나타내는 권장 사항을 결정하도록 프로그래밍된다. 일부 실시양태에서, 미리 결정된 근친교배 정도 임계값은 약 0.10, 약 0.15, 약 0.20, 약 0.25, 약 0.30, 약 0.35, 약 0.40, 약 0.45, 또는 약 0.50이다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 적어도 부분적으로는 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도에 기초하여 제1 개체와 연관된 제1인과 제2 개체와 연관된 제2인 사이의 사회적 관계를 생성하도록 프로그래밍된다. 일부 실시양태에서, 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도가 미리 결정된 임계값을 초과하는 경우, 사회적 관계가 생성된다. 일부 실시양태에서, 미리 결정된 임계값은 약 0.00001, 약 0.0001, 약 0.001, 약 0.01, 약 0.02, 약 0.04, 약 0.06, 약 0.08, 약 0.1, 약 0.12, 약 0.14, 약 0.16, 약 0.18, 약 0.2, 약 0.25, 약 0.3, 약 0.35, 약 0.4, 약 0.45, 또는 약 0.5이다. 일부 실시양태에서, 사회적 관계가 소셜 미디어 네트워크를 통해 생성된다. 일부 실시양태에서, 제1인은 제1 개체의 애완동물 소유자이고, 제2인은 제2 개체의 애완동물 소유자이다. 일부 실시양태에서, 동일인은 제1 개체와 제2 개체의 애완동물 소유자이다. 일부 실시양태에서, 제1인과 제2인 사이의 사회적 관계를 생성하는 것은 제1인 또는 제2인의 위치를 제공하는 것을 포함한다. 일부 실시양태에서, 제1인과 제2인 사이의 사회적 관계를 생성하는 것은 제1인과 제2인 사이의 통신 링크를 제공하는 것을 포함한다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 적어도 부분적으로는 조상 근연도 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 확인하도록 프로그래밍된다. 일부 실시양태에서, 가족 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다. 일부 실시양태에서, 가족 관계는 한 쌍의 인간 사이의 관계로 주어지며, 이로써, 제1 개체와 제2 개체 간의 조상 근연도 정도는 한 쌍의 인간 사이에 예상되는 조상 근연도 정도와 유사하다. 일부 실시양태에서, 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 시험 개체 집단의 하나 이상의 개체 각각에 대해 개체에서의 유전적 또는 건강 상태의 존재, 부재, 위험, 또는 보인자 상태를 확인하도록 프로그래밍된다. 일부 실시양태에서, 유전적 또는 건강 상태는 혈소판병증(RASGRP2 엑손 8); 피루베이트 키나제 결핍증(PKLR 엑손 7 퍼그 변이체); 인자 IX 결핍, 혈우병 B(F9 엑손 7, 테리어 변이체); 피루베이트 키나제 결핍증(PKLR 엑손 7 비글 변이체); P2Y12 수용체 혈소판 장애(P2RY12); 글란즈만 혈소판기능저하증 타입 I(ITGA2B 엑손 12); 폰빌레브란트병 타입 II, 타입 II vWD(VWF); 메이-헤글린 이상(MYH9); 혈소판병증(RASGRP2 엑손 5, 아메리칸 에스키모 도그 변이체); 인자 IX 결핍, 혈우병 B(F9 엑손 7, 로디지안 리지백 변이체); 폰빌레브란트병 타입 I(VWF); 개과 타원적혈구증(SPTB 엑손 30); 개과 백혈구 부착 결핍증 타입 III, LAD3(FERMT3); 프리칼리크레인 결핍증(KLKB1 엑손 8); 폰빌레브란트병 타입 III, 타입 III vWD (VWF 엑손 4); 인자 VIII 결핍, 혈우병 A(F8 엑손 10, 복서 변이체); 트랩형 호중구 증후군(VPS13B); 피루베이트 키나제 결핍증(PKLR 엑손 7 래브라도 변이체); 혈소판병증(RASGRP2 엑손 5, 바셋 하운드 변이체); 피루베이트 키나제 결핍증(PKLR 엑손 5); 인자 VIII 결핍, 혈우병 A(F8 엑손 1, 셰퍼드 변종 2); 인자 VII 결핍증(F7 엑손 5); 선천성 거대 혈소판 감소증(TUBB1 엑손 1, 카발리에 킹 찰스 스패니얼 변이체); 목질막염, LM(PLG); 피루베이트 키나제 결핍증(PKLR 엑손 10); 인자 VIII 결핍, 혈우병 A(F8 엑손 11, 셰퍼드 변종 1); 다른 시스템; 샤페이 자가염증 질환, SPAID, 샤페이 열(MTBP); 상염색체 열성 유전성 불완전형성증, 가족성 에나멜 형성저하증(이탈리안 그레이하운드 변이체); 지속성 뮬러관 증후군, PMDS(AMHR2); 도베르만, DVDob, DINGS의 청각장애 및 전정 증후군; 눈; 진행성 망막 위축, crd2(IQCB1); 원발성 수정체 탈구(ADAMTS17); 녹내장 원발성 개방각 녹내장(ADAMTS17 엑손 2); 진행성 망막 위축, crd1(PDE6B); 진행성 망막 위축, rcd1 간상-원추세포 이형성증, rcd1(PDE6B 엑손 21 아이리시 세터 변이체); 콜리 눈 이상, 맥락막 형성저하증, CEA(NHEJ1); 진행성 망막 위축(SAG); 색맹(CNGA3 엑손 7 저먼 셰퍼드 변이체); 개과 다초점 망막병증 cmr2(BEST1 엑손 5); 녹내장 원발성 개방각 녹내장(ADAMTS17 엑손 11); 진행성 망막 위축, prcd 진행성 간상-원추세포 변성증(PRCD 엑손 1); 유전성 백내장, 조기 발병 백내장, 소아 백내장(HSF4 엑손 9 셰퍼드 변이체); 상염색체 우성 진행성 망막 위축(RHO); 개과 다초점 망막병증 cmr3(BEST1 엑손 10 SNP); 색맹(CNGA3 엑손 7 래브라도 리트리버 변이체); 개과 다초점 망막병증 cmr1(BEST1 엑손 2); 진행성 망막 위축, rcd3 간상-원추세포 이형성증, rcd3(PDE6A); 진행성 망막 위축(CNGB1); 골든 리트리버 진행성 망막 위축 2, GR-PRA2(TTC8); 진행성 망막 위축, CNGA(CNGA1 엑손 9); 골든 리트리버 진행성 망막 위축 1, GR-PRA1(SLC4A3); 진행성 망막 위축 - crd4/cord1(RPGRIP1); 선천 비진행성 야맹증(RPE65); 반점 각막 이상증, MCD (CHST6); 녹내장 원발성 개방각 녹내장(ADAMTS10 엑손 9); 개과 다초점 망막병증 cmr3(BEST1 엑손 10 결실); 녹내장 원발성 개방각 녹내장(ADAMTS10 엑손 17); 근육; 중심핵성 근병증(PTPLA); 선천성 근긴장증(CLCN1 엑손 7); 그레이트 데인의 유전성 근병증(BIN1); 선천성 근긴장증(CLCN1 엑손 23); 근이영양증 근이영양증(DMD 펨브록 웰시 코기 변이체); 운동 유발성 허탈증(DNM1); 근이영양증 근이영양증(DMD 골든 리트리버 변이체); 미오스타틴 결핍증, 불리 휘핏 증후군(MSTN); 근세관성 근병증 1, X 연관 근세관성 근병증, XL-MTM(MTM1, 래브라도 변이체); 근이영양증 카발리에 킹 찰스 스패니얼 변이체 1; 다계통; 원발성 섬모운동 이상증, PCD(Primary Ciliary Dyskinesia)(CCDC39 엑손 3); GM1 강글리오시드증(GLB1 엑손 2); 뮤코다당류증 타입 IIIA, 산필리포 증후군 타입 A, MPS IIIA(SGSH 엑손 6 변이체 1); 성인 발병 신경 세로이드 리포푸신증(ATP13A2); GM1 강글리오시드증(GLB1 엑손 15 시바견 변이체); 신경 세로이드 리포푸신증2, NCL 2(TPP1 엑손 4); 뮤코다당류증 타입 VII, 슬라이 증후군, MPS VII(GUSB 엑손 3); 개과 푸코시드축적증(FUCA1); GM1 강글리오시드증(GLB1 엑손 15 알래스칸 허스키 변이체); 라고토 축적병(ATG4D); 선천성 건성 각결막염 및 어린선상 피부병, 안구 건조증 컬리 코트 증후군, CKCSID(FAM83H 엑손 5); 글리코겐 축적병 타입 VII, 포스포프럭토키나제 결핍증, PFK 결핍증, PFKM 휘핏 및 잉글리시 스프링거 스패니얼 변이체); 글리코겐 축적병 타입 IA, 폰기르케병, GSD IA(G6PC); 글리코겐 축적병 타입 VII, 포스포프럭토키나제 결핍증, PFK 결핍증(PFKM 바흐텔훈트 변이체); 신경 세로이드 리포푸신증 1, NCL 1(CLN5 보더 콜리 변이체); 신경 세로이드 리포푸신증 1, 소뇌성 실조증, NCL-A (ARSG 엑손 2); 신경 세로이드 리포푸신증 6, NCL 6(CLN6 엑손 7); 뮤코다당류증 타입 I, MPS I(IDUA); 신장 낭선암종 및 결절성 피부섬유증, RCND(FLCN 엑손 7); 신경 세로이드 리포푸신증 10, NCL 10(CTSD 엑손 5); 구형체 세포 백질이영양증, 크라베병(GALC 엑손 5); 글리코겐 축적병 타입 IIIA, GSD IIIA(AGL); 신경 세로이드 리포푸신증(MFSD8); GM2 강글리오시드증(HEXB, 푸들 변이체); X 연관 외배엽 이형성증, 무한증성 외배엽 이형성증(EDA 인트론 8); 신경 세로이드 리포푸신증(CLN8 오스트레일리안 셰퍼드 변이체); 신경 세로이드 리포푸신증 8, NCL 8(CLN8 잉글리시 세터 변이체); 신경 세로이드 리포푸신증 1, NCL 1(PPT1 엑손 8); 신경 세로이드 리포푸신증(CLN5 골든 리트리버 변이체); 뮤코다당류증 타입 VII, 슬라이 증후군, MPS VII(GUSB 엑손 5); 글리코겐 축적병 타입 II, 폼페병, GSD II(GAA); GM2 강글리오시드증(HEXA); 뮤코다당류증 타입 IIIA, 산필리포 증후군 타입 A, MPS IIIA(SGSH 엑손 6 변이체 2); 피부 & 결합 조직; 어린선(PNPLA1); 어린선(SLC27A4); 이영양성 수포성 표피박리증(COL7A1); 어린선, 표피박리 과다각화증(KRT10); 외배엽 이형성증, 피부 취약 증후군(PKP1); 어린선(NIPAL4); 무슬라딘 루케 증후군(ADAMTSL2); 국소 비표피박리 손발바닥 각질피부증, 선천성 손발톱비대증(KRT16); 유전성 코 부전각화증(SUV39H2); 유전성 발바닥 과다각화증(FAM83G); 뇌 및 척수; 청소년 발병 다발신경병증, 레온베르거 다발신경병증 1, LPN1(LPN1, ARHGEF10); 소뇌 위축, 신생아 소뇌 피질 변성, NCCD(SPTBN2); 기면증(HCRTR2 인트론 6); L-2-하이드록시글루타르산뇨증, L2HGA(L2HGDH); 소뇌성 실조증을 동반한 해면상 변성 2, SDCA2(ATP1B2); 진행성 뉴런 위축, 개과 다계통 변성, CMSD(SERAC1 엑손 15); 태아 발병 신생아 신경축삭 이영양증(MFN2); 발작을 동반한 신생아 뇌병증, NEWS(ATF2); 양성 가족성 청소년 간질, 완화성 국소 간질(LGI2); 청소년 후두 마비 및 다발신경병증, 안구 기형 및 신경 공포형성을 동반한 다발신경병증, POANV(RAB3GAP1, 로트바일러 변이체); 진행성 뉴런 위축, 개과 다계통 변성, CMSD(SERAC1 엑손 4); 소뇌성 실조증, 진행성 조기 발병 소뇌성 실조증(SEL1L); 유전성 감각 자율 신경병증, 말단 손상 증후군, AMS(GDNF-AS); 진전 강아지 증후군, X 연관 전신 떨림 증후군(PLP); 저수초화 및 떨림(FNIP2); 척수소뇌성 실조증, 후기 발병 실조증, LoSCA(CAPN1); 다발신경병증, NDRG1 그레이하운드 변종 (NDRG1 엑손 15); 다발신경병증, NDRG1 말라뮤트 변이체(NDRG1 엑손 4); 소뇌 형성저하증(VLDLR); 소뇌성 실조증을 동반한 해면상 변성 1, SDCA1, SeSAME/EAST 증후군(KCNJ10); 근잔떨림 및/또는 발작을 동반한 척수소뇌성 실조증(KCNJ10); 알래스칸 허스키 뇌병증, 아급성 괴사성 뇌척수병(SLC19A3); 퇴행성 골수병증, DM(SOD1A); 알렉산더병(GFAP); 심장; 확장성 심근병증, DCM1(PDK4); 긴 QT 증후군(KCNQ1); 확장성 심근병증, DCM2(TTN); 골격; 유전성 비타민 D 저항성 구루병(VDR); 골형성부전증, 취성 골 질환(COL1A1); 골형성부전증, 취성 골 질환(SERPINH1); 연골이영양증 및 추간판 질환, CDDY/IVDD, 타입 I IVDD(FGF4 레트로유전자 - CFA12); 골형성부전증, 취성 골 질환(COL1A2); 두개하악 골병증, CMO(SLC37A2); 골격 이형성증 2, SD2(COL11A2); 구순구개열 및/또는 구개열(ADAMTS20); 눈골격 이형성증 1, 왜소증-망막 이형성증, OSD1(COL9A3, 래브라도 리트리버); 골연골이형성증, 골격 왜소증(SLC13A1); 대사; 악성 고열(RYR1); 카탈라제저하증, 무카탈라제혈증(CAT); 피루베이트 데하이드로게나제 결핍증(PDP1); 신장 및 방광; 고요산뇨증 및 고요산혈증 또는 요로결석증, HUU(SLC2A9); 다낭성 신장 질환, PKD(PKD1); 단백질 손실 신병증, PLN(NPHS1); 시스틴뇨증 타입 II-A(SLC3A1); 원발성 고옥소산뇨증(AGXT); 시스틴뇨증 타입 I-A(SLC3A1); 상염색체 열성 유전성 신병증, 가족성 신병증, ARHN(COL4A4 엑손 3); X 연관 유전성 신병증, XLHN(COL4A5 엑손 35, 사모예드 변이체 2); 시스틴뇨증 타입 II-B(SLC7A9); 2,8-디하이드록시아데닌 요로결석, 2,8-DHA 요로결석(APRT); 신경근; 간헐적 낙상 증후군(BCAN); 선천성 근무력증 증후군(COLQ); 선천성 근무력증 증후군(CHAT); 면역; 중증 복합 면역결핍증(RAG1); X 연관 중증 복합 면역결핍증(IL2RG 변이체 1); 중증 복합 면역결핍증(PRKDC); X 연관 중증 복합 면역결핍증(IL2RG 변이체 2); 보체 3 결핍증, C3 결핍증(C3); 위장; 이머슬룬드-그레스베트 증후군, 선택적 코발라민 흡수 장애(CUBN 엑손 53); 이머슬룬드-그레스베트 증후군, 선택적 코발라민 흡수 장애(CUBN 엑손 8); 임상; MDR1 약물 감수성(MDR1); 알라닌 아미노트랜스퍼라제 활성(GPT); 호르몬; 및 선천성 갑상선 기능 저하증(TPO, 텐터필드 테리어 변이체)으로 구성된 군으로부터 선택된다. 일부 실시양태에서, 위험은 유전적 또는 건강 상태를 갖는 개체의 확률 또는 상대적 위험으로 표현된다. 일부 실시양태에서, 상대적 위험은 수치(예컨대, 상대적 위험비) 또는 범주형 값(예컨대, "위험한 상태," "위험하지 않은 상태," 또는 "명백한 위험 상태")이다. 일부 실시양태에서, 보인자 상태는 개체가 유전적 또는 건강 상태의 보인자라는 것을 나타내는 양성 또는 음성 표시로 표현된다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 시험 개체 집단의 하나 이상의 개체 각각에 대해, 개체의 하나 이상의 개 품종을 확인하도록 프로그래밍된다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 시험 개체 집단의 하나 이상의 개체 각각에 대해, 개체의 하나 이상의 개 품종의 하나 이상의 비율을 확인하도록 프로그래밍된다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 시험 개체 집단의 복수의 개체의 가계도를 생성하도록 프로그래밍된다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 시험 개체 집단의 하나 이상의 개체 각각에 대해, 개체에서 표현형 또는 형질의 존재, 부재 또는 위험을 확인하도록 프로그래밍된다. 일부 실시양태에서, 표현형 또는 형질은 베이스 코트 색상(예컨대, 진한 색상 또는 옅은 색상의 털, 색소의 색상, 및 색상 희석), 색상 코트 모디파이어(예컨대, 은닉 패터닝, 신체 패턴 및 안면 패턴), 코트 형질(예컨대, 퍼니싱, 코트 길이, 털 빠짐, 코트 질감, 털 없음(졸로 타입), 털 없음(테리어 타입), 및 백색증), 신체 특징(예컨대, 주둥이 길이, 꼬리 길이, 뒷이슬 발톱, 등 근육 및 벌크, 눈 색상), 신체 크기(예컨대, 더 작음, 중간 및 더 큼), 수행능(예컨대, 고도 적응), 유전적 다양성(예컨대, 근친교배 정도, 및 면역 반응의 다양성)로 구성된 군으로부터 선택된다.
일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 추가로 조상 근연도 정도; 가족 관계; 유전적 또는 건강 상태의 존재, 부재, 위험 또는 보인자 상태; 하나 이상의 개 품종; 하나 이상의 개 품종의 하나 이상의 비율; 가계도; 표현형 또는 형질의 존재, 부재, 위험 또는 보인자 상태; 및 그의 임의의 조합 중 하나 이상의 것을 나타내는 보고서를 작성하도록 프로그래밍된다. 일부 실시양태에서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로 하도록 추가로 보고서를 수의사에게 전송하도록 프로그래밍된다.
또 다른 측면에서, 본 개시내용은 하나 이상의 컴퓨터 프로세서에 의해 실행될 때, (a) 시험 개체 집단에 대한 하플로타입 데이터를 수신하는 단계로서, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함하는 것인 단계; (b) 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계; (c) 각 시험 개체 집단에 대해: (i) 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계로서, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함하는 것인 단계; (ii) 제1 개체와 제2 개체 간의 각각의 매칭된 세그먼트에 대해: 매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누는 단계; (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 점수를 생성하는 단계; 복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하는 단계; 및 이산 게놈 간격의 복수의 보정된 점수에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계; 및 (iii) 복수의 보정된 점수 및 복수의 가중치에 기초하여 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계; 및 (d) 매칭된 세그먼트의 가중 합에 기초하여 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계를 포함하는, 이배체 집단의 두 개체 간의 조상 근연도 정도를 추정하기 위한 방법을 구현하는 기계 실행가능 코드를 포함하는 비일시적 컴퓨터 판독가능 매체를 제공한다.
일부 실시양태에서, 이배체 집단은 포유동물 집단이다. 일부 실시양태에서, 포유동물 집단은 개과 집단, 고양이과 집단, 스포츠 동물 집단, 또는 설치류 집단이다. 일부 실시양태에서, 포유동물 집단은 개과 집단이다. 일부 실시양태에서, 개과 집단은 개 집단이다. 일부 실시양태에서, 포유동물 집단은 고양이과 집단이다. 일부 실시양태에서, 고양이과 집단은 고양이 집단이다. 일부 실시양태에서, 포유동물 집단은 스포츠 동물 집단이다. 일부 실시양태에서, 스포츠 동물 집단은 말 집단이다. 일부 실시양태에서, 개 집단은 아펜핀셔, 아프간 하운드, 아프리카니스, 아이디, 에어데일 테리어, 악바쉬 도그, 아키타견, 알랑구 마스티프, 알라노 에스파뇰, 알라파하 블루 블러드 불독, 알래스칸 클리 카이, 알래스칸 말라뮤트, 얼라운트, 알로페키스, 알파인 닥스브래크, 알자시안 셰팔류트, 아메리칸 아키타, 아메리칸 불독, 아메리칸 코커 스패니얼, 아메리칸 에스키모 도그, 아메리칸 폭스하운드, 아메리칸 헤어리스 테리어, 아메리칸 마스티프, 아메리칸 핏 불 테리어, 아메리칸 스태퍼드셔 테리어, 아메리칸 워터 스패니얼, 아나톨리안 셰퍼드 도그, 앵글로-프랑세 드 쁘티 베네리, 아펜젤러 세넨훈드, 아르헨틴 도고, 아리에주 포인터, 아리에쥬아, 아르만트, 아르토이스 하운드, 오스트레일리안 불독, 오스트레일리안 캐틀 도그, 오스트레일리안 켈피, 오스트레일리안 셰퍼드, 오스트레일리안 실키 테리어, 오스트레일리안 스텀피 테일 캐틀 도그, 오스트레일리안 테리어, 오스트리안 블랙 앤 탠 하운드, 오스트리안 핀셔, 아자와크, 바카르왈 도그, 바베트, 바센지, 바스크 셰퍼드 도그, 바셋 아르테지앙 노르만, 바셋 블뢰 드 가스코뉴, 바셋 포브 드 브르타뉴, 그랑 바셋 그리퐁 방댕, 쁘티 바셋 그리퐁 방댕, 바이에른 마운틴 하운드, 비글, 비글-해리어, 비어디드 콜리, 보스롱, 베들링턴 테리어, 벨지안 셰퍼드 도그, 벨지안 셰퍼드 도그(그루넨달), 벨지안 셰퍼드 도그(라케노이즈), 벨지안 셰퍼드 도그(말리노이즈), 벨지안 셰퍼드(테뷰런), 베르가마스코 셰퍼드, 베르거 블랑 스위스, 베르거 피카르드, 베른 라우프훈트, 버니즈 마운틴 도그, 비숑 프리제, 빌리, 비스벤, 블랙 앤 탠 쿤하운드, 블랙 앤 탠 버지니아 폭스하운드, 불렌바이저, 블랙 노르웨이 엘크하운드, 블랙 러시안 테리어, 블랙마우스 커, 그랑블루 드 가스코뉴, 쁘티 블루 드 가스코뉴, 블러드하운드, 블루 레이시, 블루 폴 테리어, 블루틱 쿤하운드, 보어보엘, 보헤미안 셰퍼드, 볼로네제, 보더 콜리, 보더 테리어, 보르조이, 보스니아 코즈-헤어드 하운드, 보스톤 테리어, 부비에 데 아르덴, 부비에 데 플랑드르, 복서, 보이킨 스패니얼, 브라코 이탈리아노, 브라크 디 오베르뉴, 브라크 뒤 부르보네, 블라크 더 파이, 브라크 프랑세, 브라크 생-제르맹, 브라질리언 테리어, 브리아드, 브리케 그리퐁 방댕, 브리타니, 브로홀머, 브루노 쥬라 하운드, 부코비나 셰퍼드 도그, 불 앤 테리어, 불 테리어, 불 테리어(미니어처), 불마스티프, 불리 쿠타, 케언 테리어, 케이넌 도그, 캐내디언 에스키모 도그, 캐내디언 포인터, 카네 코르소, 카오 다 세라 아이레스, 카오 데 카스트로 라보레이로, 카오 필라 드 사오 미구엘, 캐롤리나 도그, 카르파티안 셰퍼드 도그, 카타호울라 커, 카탈란 쉽독, 코카시안 셰퍼드 도그, 카발리에 킹 찰스 스패니얼, 센트럴 아시안 셰퍼드 도그, 체스키 푸섹, 체스키 테리어, 폴리시 그레이하운드, 체서피크 베이 리트리버, 시엥-그리스, 시엥 프랑세 블랑 이 느와르, 시엥 프랑세 블랑 이 오렌지, 시엥 프랑세 트리콜로르, 치와와, 칠리안 폭스 테리어, 차이니즈 충칭 도그, 차이니즈 크레스티드 도그, 차이니즈 임페리얼 도그, 치누크, 치피파라이, 차우차우, 시마론 우루과요, 시에르니 세리, 시르네코 델레트나, 클럼버 스패니얼, 러프 콜리, 스무스 콜리, 콤바이, 코르도바 파이팅 도그, 코통 드 튈레아르, 크레탄 하운드, 크로아티안 쉽독, 컴벌랜드 쉽독, 컬리 코티드 리트리버, 체코슬로바키아 울프도그, 닥스훈트, 달마시안, 댄디 딘몬트 테리어, 데니쉬 스웨디쉬 팜도그, 딩고, 도베르만 핀셔, 도그 드 보르도, 도고 쿠바노, 도고 과테말테코, 도고 사르데스코, 드렌체 파트리혼트, 드레버, 덩커, 더치 셰퍼드 도그, 더치 스모우스혼드, 이스트 유러피안 셰퍼드, 이스트 시베리안 라이카, 엘로, 잉글리시 코커 스패니얼, 잉글리시 쿤하운드, 잉글리시 폭스하운드, 잉글리시 마스티프, 잉글리시 포인터, 잉글리시 세터, 잉글리시 셰퍼드, 잉글리시 스프링거 스패니얼, 잉글리시 토이 테리어(블랙 & 탄), 잉글리시 워터 스패니얼, 잉글리시 화이트 테리어, 엔틀버쳐 마운틴 도그, 에파뉴엘 블뢰 드 피카르디, 에스토니안 하운드, 에스트렐라 마운틴 도그, 유라시에, 필드 스파니엘, 휠라 브라질레이로, 핀도, 피니쉬 하운드, 피니쉬 라프훈트, 피니쉬 스피츠, 플랫-코티드 리트리버, 포모산 마운틴 도그, 폭스 테리어(스무스), 와이어 폭스 테리어, 프렌치 브리타니, 프렌치 불독, 프렌치 스패니얼, 갈고 에스파뇰, 저먼 롱헤어드 포인터, 저먼 핀셔, 저먼 셰퍼드 도그, 저먼 쇼트헤어드 포인터, 저먼 스패니얼, 저먼 스피츠, 저먼 와이어헤어드 포인터, 자이언트 슈나우저, 글렌 오브 이말 테리어, 골든 리트리버, 고든 세터, 그랑 앵글로-프랑세 블랑 이 느와르, 그랑 앵글로-프랑세 블랑 이 오렌지, 그랑 앵글로-프랑세 트리콜로르, 그랑 그리퐁 방댕, 그랑 마스팅 드 보링켄, 그레이트 데인, 그레이트 피레니즈, 그레이터 스위스 마운틴 도그, 그린란드 도그, 그레이하운드, 그리퐁 블뢰 드 가스코뉴, 그리퐁 브뤼셀루아, 그리퐁 포브 드 브르타뉴, 그리퐁 니베르네, 굴 동, 굴 테르, 해어 인디언 도그, 해밀턴스퇴바레, 하노버 하운드, 해리어, 하바네세, 하와이안 포이 도그, 히말라얀 쉽독, 홋카이도, 호르타야 보르자야, 호바와트, 헝가리안 하운드, 뉴질랜드 헌터웨이하이겐훈트, 이비잔 하운드, 아이슬란딕 쉽독, 인디안 스피츠, 아이리시 불 테리어, 아이리시 레드 앤드 화이트 세터, 아이리시 세터, 아이리시 스타포드셔 불 테리어, 아이리시 테리어, 아이리시 워터 스패니얼, 아이리시 울프하운드, 이스트리안 쇼트헤어드 하운드, 이스트리안 코즈-헤어드 하운드, 이탈리안 그레이하운드, 잭 러셀 테리어, 잭테리어, 쟘툰드, 재패니즈 친, 재패니즈 스피츠, 재패니즈 테리어, 조낭이, 카이카디, 카이 켄, 캉갈 도그, 카니, 카라카찬 도그, 커릴리언 베어 도그, 카르스트 셰퍼드, 키스혼드, 케리 비글, 케리 블루 테리어, 킹 찰스 스패니얼, 킹 셰퍼드, 킨타마니, 기슈, 코몬도르, 쿠이커혼제, 쿨리, 한국 진돗개, 한국 마스티프, 크롬폴란데, 쿤밍 울프 도그, 쿠리, 쿠바즈, 카이-레오, 래브라도 허스키, 래브라도 리트리버, 라고토 로마그놀로, 레이크랜드 테리어, 랭카셔 힐러, 랜드시어, 라포니안 허더, 레온베르거, 라사 압소, 리투아니안 하운드, 롱헤어드 휘핏, 로타토레 브린디시노, 로첸, 마자르 아가, 마제스틱 트리 하운드, 말티즈, 맨체스터 테리어, 마렘마 쉽독, McNab, 멕시칸 헤어리스 도그, 미니어처 오스트레일리안 셰퍼드, 미니어처 폭스 테리어, 미니어처 핀셔, 미니어처 슈나우저, 미니어처 시베리안 허스키, 미오리틱, 몰로수스, 몬터니그런 마운틴 하운드, 모스크바 워치독, 모스크바 워터 도그, 마운틴 커, 마운틴 뷰 커, 무쿠치, 무디, 머드홀 하운드, 라지 문스터랜더, 스몰 문스터랜더, 머레이 리버 컬리 코티드 리트리버, 나폴리탄 마스티프, 뉴펀들랜드, 뉴 기니아 싱잉 도그, 노포크 스패니얼, 노포크 테리어, 노르보텐스피츠, 노스 컨트리 비글, 노던 이누이트 도그, 노르웨이안 부훈트, 노르웨이안 엘크하운드, 노르웨이안 룬트훈트, 노리치 테리어, 노바 스코셔 덕-톨링 리트리버, 올드 대니시 포인터, 올드 잉글리시 쉽독, 올드 잉글리시 불독, 올드 잉글리시 테리어, 올드 저먼 셰퍼드 도그, 올드 잉글리시 불도그, 오터하운드, 파촌 나바로, 페이즐리 테리어, 빠삐용, 파슨 러셀 테리어, 페터데일 테리어, 페키니즈, 페로 드 프레사 카나리오, 페르로 드 프레사 말로르퀸, 페루비안 헤어리스 도그, 파렌, 파라오 하운드, 피카디 스패니얼, 플롯 하운드, 포덴코 카나리오, 포인터, 폴리시 하운드, 폴리시 헌팅 도그, 폴리시 로우랜드 쉽독, 폴리시 타트라 쉽독, 포메라니안, 퐁토드메르 스패니얼, 푸들, 포르셀엔, 포르투기스 포덴고, 포르투기스 포인터, 포르투기스 워터 도그, 프라츠키 크리사릭, 푸들포인터, 퍼그, 풀리, 푸미, 풍산개, 피레니안 마스티프, 피레니언 셰퍼드, 라페이로 도 알렌테조, 라자팔라얌, 람퍼 그레이하운드, 라스트레아도르 브라질레이로, 래토네로 보데게로 안달루즈, 래트 테리어, 레드본 쿤하운드, 로디지안 리지백, 로트바일러, 러시안 스패니얼, 러스키 토이, 루소-유러피안 라이카, 러셀 테리어, 사를로스울프하운드, 사부에소 에스파뇰, 세이지 아샤예리, 세이지 마잔다라니, 사할린 허스키, 살루키, 사모예드, 삽살리, 샤플래니낙, 샤펜도스, 실레르스퇴바레, 스키퍼키, 올드 크로아티안 사이트하운드, 자이언트 슈나우저, 미니어처 슈나우저, 스탠다드 슈나우저, 슈바이처 라우프훈트, 슈바이체리셔 니데를라우프훈트, 스카치 콜리, 스코티시 디어하운드, 스코티시 테리어, 실리엄 테리어, 세구지오 이탈리아노, 세팔라 시베리안 슬레드독, 세르비안 하운드, 세르비안 트라이칼라 하운드, 샤페이, 셔틀랜드 쉽독, 시바견, 시추, 시코쿠, 샤일로 셰퍼드 도그, 시라크, 시베리안 허스키, 실켄 윈드하운드, 싱할라 하운드, 스카이 테리어, 슬루기, 슬로박 쿠바크, 슬로바키안 러프-헤어드 포인터, 슬로벤스키 코포브, 스말랜드스퇴바레, 스몰 그리크 도메스틱 도그, 소프트-코티드 휘튼 테리어, 사우스 러시안 오브차카, 써던 하운드, 스패니쉬 마스티프, 스패니쉬 워터 도그, 스피노네 이탈리아노, 스포팅 루카스 테리어, 세인트 버나드, 세인트 존스 워터 도그, 스테비훈, 스타포드셔 불 테리어, 스테펜스 커, 스타이리안 코즈-헤어드 하운드, 서식스 스패니얼, 스웨디시 라프훈트, 스위디쉬 발훈트, 스위디쉬 비글, 탈탄 베어 도그, 타이간, 타마스칸 도그, 테디 루스벨트 테리어, 텔로미안, 텐터필드 테리어, 타이 방깨우 도그, 타이 리지백, 티베탄 마스티프, 티베탄 스패니얼, 티베탄 테리어, 토른쟈크, 토사, 토이 불독, 토이 폭스 테리어, 토이 맨체스터 테리어, 트리잉 커, 트리잉 워커 쿤하운드, 티롤리언 하운드, 우토나간, 비즐라, 볼피노 이탈리아노, 와이머라너, 카디건 웰시 코기, 펨브록 웰시 코기, 웰시 쉽독, 웰시 스프링어 스패니얼, 웰시 테리어, 웨스트 하이랜드 화이트 테리어, 웨스트 시베리안 라이카, 웨스트팔리안 닥스브라케, 웨터훈, 휘핏, 화이트 잉글리시 불독, 화이트 셰퍼드 도그, 와이어헤어드 비즐라, 와이어헤어드 포인팅 그리퐁, 및 요크셔 테리어로 구성된 군으로부터 선택되는 하나 이상의 개 품종을 포함한다. 일부 실시양태에서, 집단은 하나 이상의 순종 개(예컨대, 단일 품종 유형을 갖는 것) 또는 하나 이상의 혼합 품종 개(예컨대, 복수의 품종 유형을 갖는 것)를 포함한다. 일부 실시양태에서, 집단은 임의 개수의(예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 10개 초과의) 순종 개 또는 순종 개의 조합으로부터의 DNA를 갖는 혼합 품종 개 집단이다.
일부 실시양태에서, 하플로타입 데이터는 하플로타입 페이징 알고리즘을 사용하여 시험 개체 집단의 유전자형 데이터를 프로세싱함으로써 생성된다. 일부 실시양태에서, 하플로타입 페이징 알고리즘은 참조 기반 하플로타입 페이징 알고리즘을 포함한다. 일부 실시양태에서, 참조 기반 하플로타입 페이징 알고리즘은 은닉 마르코프 모형(HMM) 기반 검색을 포함한다. 일부 실시양태에서, 참조 기반 하플로타입 페이징 알고리즘은 Eagle1 알고리즘, Eagle2 알고리즘, PHASE 알고리즘, fastPHASE 알고리즘, BEAGLE 알고리즘, Findhap 알고리즘, Impute 알고리즘, FImpute 알고리즘, AlphaImpute 알고리즘, IMPUTE2 알고리즘, MaCH 알고리즘, SHAPEIT1 알고리즘, SHAPEIT2 알고리즘, SHAPEIT3 알고리즘, SHAPEIT4 알고리즘, 또는 그의 조합을 포함한다. 일부 실시양태에서, 하플로타입 페이징 알고리즘은 코호트 기반 하플로타입 페이징 알고리즘을 포함한다.
일부 실시양태에서, 유전자형 데이터는 시험 개체 집단으로부터 수득된 생물학적 샘플을 검정함으로써 수득된다. 일부 실시양태에서, 생물학적 샘플은 혈액 샘플, 타액 샘플, 스왑 샘플, 세포 샘플, 또는 조직 샘플을 포함한다. 일부 실시양태에서, 검정은 생물학적 샘플 또는 그의 유도체를 시퀀싱하는 것을 포함한다.
일부 실시양태에서, 복수의 유전자 마커는 적어도 약 500, 적어도 약 1,000, 적어도 약 2,000, 적어도 약 3,000, 적어도 약 4,000, 적어도 약 5,000, 적어도 약 6,000, 적어도 약 7,000, 적어도 약 8,000, 적어도 약 9,000, 또는 적어도 약 10,000개의 별개의 유전자 마커를 포함한다.
일부 실시양태에서, 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계는 GERMLINE 알고리즘, PLINK 알고리즘, PREST 알고리즘, IBD 검출을 위한 랜덤 프로젝션(RaPID) 알고리즘, IBD 공유 하플로타입 신속 발견(FISHR) 알고리즘, 정련된 직계 동형(IBD) 알고리즘, fastIBD 알고리즘, KING 알고리즘, HaploScore 알고리즘, TRUFFLE 알고리즘, 또는 그의 조합을 사용하는 것을 포함한다. 일부 실시양태에서, 미리 결정된 임계값 크기는 약 100 킬로 염기쌍(kbp), 약 200 kbp, 약 300 kbp, 약 400 kbp, 약 500 kbp, 약 600 kbp, 약 700 kbp, 약 800 kbp, 약 900 kbp, 또는 약 1,000 kbp이다. 일부 실시양태에서, 유전자 마커의 미리 결정된 개수는 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 또는 약 100개의 별개의 유전자 마커이다.
일부 실시양태에서, 본 방법은 복수의 이산 게놈 간격의 이산 게놈 간격이 동일한 크기를 갖도록 매칭된 세그먼트를 나누는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 복수의 이산 게놈 간격의 이산 게놈 간격이 가변 크기를 갖도록 매칭된 세그먼트를 나누는 단계를 추가로 포함한다. 일부 실시양태에서, 복수의 이산 게놈 간격의 주어진 이산 게놈 간격의 가변 크기는 적어도 부분적으로는 주어진 이산 게놈 간격에 근접한 IBD 매치의 시작 위치 및 종료 위치, 주어진 이산 게놈 간격에서 유전자 마커의 밀도, 주어진 이산 게놈 간격에 대한 마커의 최대 개수, 주어진 이산 게놈 간격의 최대 길이, 또는 그의 조합에 기초하여 결정된다.
일부 실시양태에서, 본 방법은 (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도, 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 동형접합성 매칭 점수 및 복수의 쌍별 매칭 점수를 생성하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 상응하는 동형접합성 매칭 점수와의 주어진 쌍별 매칭 점수의 일관성에 기초하여 복수의 쌍별 매칭 점수를 보정하여 복수의 보정된 쌍별 매칭 점수를 생성하는 단계를 추가로 포함한다.
일부 실시양태에서, 본 방법은 두 이배체 개체에서의 두 대립유전자에 대한 복수의 일치 상태에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계를 추가로 포함한다. 일부 실시양태에서, 복수의 일치 상태는 표 1로부터 선택되는 일치 상태를 포함하고, 복수의 가중치는 표 1에 열거된 복수의 근연도 r xy 에의 기여도에 기초하여 할당된다. 일부 실시양태에서, 조상 근연도 정도는 근연도 계수를 포함한다. 일부 실시양태에서, 본 방법은 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계를 추가로 포함하고, 여기서, 가중 합은
Figure pct00005
로 표현된다. 일부 실시양태에서, 조상 근연도 정도는 친족관계 계수를 포함한다. 일부 실시양태에서, 본 방법은 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계를 추가로 포함하고, 여기서, 가중 합은
Figure pct00006
로 표현된다.
일부 실시양태에서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계는 제1 개체 또는 제2 개체의 근친교배 정도를 결정하는 것을 포함한다. 일부 실시양태에서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계는 제1 개체 및 제2 개체의 근친교배 정도를 결정하는 것을 포함한다. 일부 실시양태에서, 본 방법은 적어도 부분적으로는 제1 개체 및 제2 개체의 근친교배 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 가족 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다. 일부 실시양태에서, 가족 관계는 한 쌍의 인간 사이의 관계로 주어지며, 이로써, 제1 개체와 제2 개체 간의 조상 근연도 정도는 한 쌍의 인간 사이에 예상되는 조상 근연도 정도와 유사하다. 일부 실시양태에서, 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다.
일부 실시양태에서, 본 방법은 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도를 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도에 기초하여 제1 개체 및 제2 개체를 함께 교배시킬지 여부를 나타내는 권장 사항을 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하지 않는 경우, 제1 개체 및 제2 개체를 함께 교배시키는 것을 나타내는 권장 사항을 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하는 경우, 제1 개체 및 제2 개체를 함께 교배시키지 않는 것을 나타내는 권장 사항을 결정하는 단계를 추가로 포함한다. 일부 실시양태에서, 미리 결정된 근친교배 정도 임계값은 약 0.10, 약 0.15, 약 0.20, 약 0.25, 약 0.30, 약 0.35, 약 0.40, 약 0.45, 또는 약 0.50이다.
일부 실시양태에서, 본 방법은 적어도 부분적으로는 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도에 기초하여 제1 개체와 연관된 제1인과 제2 개체와 연관된 제2인 사이의 사회적 관계를 생성하는 단계를 추가로 포함한다. 일부 실시양태에서, 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도가 미리 결정된 임계값을 초과하는 경우, 사회적 관계가 생성된다. 일부 실시양태에서, 미리 결정된 임계값은 약 0.00001, 약 0.0001, 약 0.001, 약 0.01, 약 0.02, 약 0.04, 약 0.06, 약 0.08, 약 0.1, 약 0.12, 약 0.14, 약 0.16, 약 0.18, 약 0.2, 약 0.25, 약 0.3, 약 0.35, 약 0.4, 약 0.45, 또는 약 0.5이다. 일부 실시양태에서, 사회적 관계가 소셜 미디어 네트워크를 통해 생성된다. 일부 실시양태에서, 제1인은 제1 개체의 애완동물 소유자이고, 제2인은 제2 개체의 애완동물 소유자이다. 일부 실시양태에서, 동일인은 제1 개체와 제2 개체의 애완동물 소유자이다. 일부 실시양태에서, 제1인과 제2인 사이의 사회적 관계를 생성하는 단계는 제1인 또는 제2인의 위치를 제공하는 것을 포함한다. 일부 실시양태에서, 제1인과 제2인 사이의 사회적 관계를 생성하는 단계는 제1인과 제2인 사이의 통신 링크를 제공하는 것을 포함한다.
일부 실시양태에서, 본 방법은 적어도 부분적으로는 조상 근연도 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 가족 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다. 일부 실시양태에서, 가족 관계는 한 쌍의 인간 사이의 관계로 주어지며, 이로써, 제1 개체와 제2 개체 간의 조상 근연도 정도는 한 쌍의 인간 사이에 예상되는 조상 근연도 정도와 유사하다. 일부 실시양태에서, 관계는 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 조부모-손자 관계, 또는 증조부모-증손자 관계이다.
일부 실시양태에서, 본 방법은 시험 개체 집단의 하나 이상의 개체 각각에 대해 개체에서의 유전적 또는 건강 상태의 존재, 부재, 위험, 또는 보인자 상태를 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 유전적 또는 건강 상태는 혈소판병증(RASGRP2 엑손 8); 피루베이트 키나제 결핍증(PKLR 엑손 7 퍼그 변이체); 인자 IX 결핍, 혈우병 B(F9 엑손 7, 테리어 변이체); 피루베이트 키나제 결핍증(PKLR 엑손 7 비글 변이체); P2Y12 수용체 혈소판 장애(P2RY12); 글란즈만 혈소판기능저하증 타입 I(ITGA2B 엑손 12); 폰빌레브란트병 타입 II, 타입 II vWD(VWF); 메이-헤글린 이상(MYH9); 혈소판병증(RASGRP2 엑손 5, 아메리칸 에스키모 도그 변이체); 인자 IX 결핍, 혈우병 B(F9 엑손 7, 로디지안 리지백 변이체); 폰빌레브란트병 타입 I(VWF); 개과 타원적혈구증(SPTB 엑손 30); 개과 백혈구 부착 결핍증 타입 III, LAD3(FERMT3); 프리칼리크레인 결핍증(KLKB1 엑손 8); 폰빌레브란트병 타입 III, 타입 III vWD (VWF 엑손 4); 인자 VIII 결핍, 혈우병 A(F8 엑손 10, 복서 변이체); 트랩형 호중구 증후군(VPS13B); 피루베이트 키나제 결핍증(PKLR 엑손 7 래브라도 변이체); 혈소판병증(RASGRP2 엑손 5, 바셋 하운드 변이체); 피루베이트 키나제 결핍증(PKLR 엑손 5); 인자 VIII 결핍, 혈우병 A(F8 엑손 1, 셰퍼드 변종 2); 인자 VII 결핍증(F7 엑손 5); 선천성 거대 혈소판 감소증(TUBB1 엑손 1, 카발리에 킹 찰스 스패니얼 변이체); 목질막염, LM(PLG); 피루베이트 키나제 결핍증(PKLR 엑손 10); 인자 VIII 결핍, 혈우병 A(F8 엑손 11, 셰퍼드 변종 1); 다른 시스템; 샤페이 자가염증 질환, SPAID, 샤페이 열(MTBP); 상염색체 열성 유전성 불완전형성증, 가족성 에나멜 형성저하증(이탈리안 그레이하운드 변이체); 지속성 뮬러관 증후군, PMDS(AMHR2); 도베르만, DVDob, DINGS의 청각장애 및 전정 증후군; 눈; 진행성 망막 위축, crd2(IQCB1); 원발성 수정체 탈구(ADAMTS17); 녹내장 원발성 개방각 녹내장(ADAMTS17 엑손 2); 진행성 망막 위축, crd1(PDE6B); 진행성 망막 위축, rcd1 간상-원추세포 이형성증, rcd1(PDE6B 엑손 21 아이리시 세터 변이체); 콜리 눈 이상, 맥락막 형성저하증, CEA(NHEJ1); 진행성 망막 위축(SAG); 색맹(CNGA3 엑손 7 저먼 셰퍼드 변이체); 개과 다초점 망막병증 cmr2(BEST1 엑손 5); 녹내장 원발성 개방각 녹내장(ADAMTS17 엑손 11); 진행성 망막 위축, prcd 진행성 간상-원추세포 변성증(PRCD 엑손 1); 유전성 백내장, 조기 발병 백내장, 소아 백내장(HSF4 엑손 9 셰퍼드 변이체); 상염색체 우성 진행성 망막 위축(RHO); 개과 다초점 망막병증 cmr3(BEST1 엑손 10 SNP); 색맹(CNGA3 엑손 7 래브라도 리트리버 변이체); 개과 다초점 망막병증 cmr1(BEST1 엑손 2); 진행성 망막 위축, rcd3 간상-원추세포 이형성증, rcd3(PDE6A); 진행성 망막 위축(CNGB1); 골든 리트리버 진행성 망막 위축 2, GR-PRA2(TTC8); 진행성 망막 위축, CNGA(CNGA1 엑손 9); 골든 리트리버 진행성 망막 위축 1, GR-PRA1(SLC4A3); 진행성 망막 위축 - crd4/cord1(RPGRIP1); 선천 비진행성 야맹증(RPE65); 반점 각막 이상증, MCD (CHST6); 녹내장 원발성 개방각 녹내장(ADAMTS10 엑손 9); 개과 다초점 망막병증 cmr3(BEST1 엑손 10 결실); 녹내장 원발성 개방각 녹내장(ADAMTS10 엑손 17); 근육; 중심핵성 근병증(PTPLA); 선천성 근긴장증(CLCN1 엑손 7); 그레이트 데인의 유전성 근병증(BIN1); 선천성 근긴장증(CLCN1 엑손 23); 근이영양증 근이영양증(DMD 펨브록 웰시 코기 변이체); 운동 유발성 허탈증(DNM1); 근이영양증 근이영양증(DMD 골든 리트리버 변이체); 미오스타틴 결핍증, 불리 휘핏 증후군(MSTN); 근세관성 근병증 1, X 연관 근세관성 근병증, XL-MTM(MTM1, 래브라도 변이체); 근이영양증 카발리에 킹 찰스 스패니얼 변이체 1; 다계통; 원발성 섬모운동 이상증, 복서 변이체CCDC39 엑손 3); GM1 강글리오시드증(GLB1 엑손 2); 뮤코다당류증 타입 IIIA, 산필리포 증후군 타입 A, MPS IIIA(SGSH 엑손 6 변이체 1); 성인 발병 신경 세로이드 리포푸신증(ATP13A2); GM1 강글리오시드증(GLB1 엑손 15 시바견 변이체); 신경 세로이드 리포푸신증2, NCL 2(TPP1 엑손 4); 뮤코다당류증 타입 VII, 슬라이 증후군, MPS VII(GUSB 엑손 3); 개과 푸코시드축적증(FUCA1); GM1 강글리오시드증(GLB1 엑손 15 알래스칸 허스키 변이체); 라고토 축적병(ATG4D); 선천성 건성 각결막염 및 어린선상 피부병, 안구 건조증 컬리 코트 증후군, CKCSID(FAM83H 엑손 5); 글리코겐 축적병 타입 VII, 포스포프럭토키나제 결핍증, PFK 결핍증(PFKM 휘핏 및 잉글리시 스프링거 스패니얼 변이체); 글리코겐 축적병 타입 IA, 폰기르케병, GSD IA(G6PC); 글리코겐 축적병 타입 VII, 포스포프럭토키나제 결핍증, PFK 결핍증(PFKM 바흐텔훈트 변이체); 신경 세로이드 리포푸신증 1, NCL 1(CLN5 보더 콜리 변이체); 신경 세로이드 리포푸신증 1, 소뇌성 실조증, NCL-A (ARSG 엑손 2); 신경 세로이드 리포푸신증 6, NCL 6(CLN6 엑손 7); 뮤코다당류증 타입 I, MPS I(IDUA); 신장 낭선암종 및 결절성 피부섬유증, RCND(FLCN 엑손 7); 신경 세로이드 리포푸신증 10, NCL 10(CTSD 엑손 5); 구형체 세포 백질이영양증, 크라베병(GALC 엑손 5); 글리코겐 축적병 타입 IIIA, GSD IIIA(AGL); 신경 세로이드 리포푸신증(MFSD8); GM2 강글리오시드증(HEXB, 푸들 변이체); X 연관 외배엽 이형성증, 무한증성 외배엽 이형성증(EDA 인트론 8); 신경 세로이드 리포푸신증(CLN8 오스트레일리안 셰퍼드 변이체); 신경 세로이드 리포푸신증 8, NCL 8(CLN8 잉글리시 세터 변이체); 신경 세로이드 리포푸신증 1, NCL 1(PPT1 엑손 8); 신경 세로이드 리포푸신증(CLN5 골든 리트리버 변이체); 뮤코다당류증 타입 VII, 슬라이 증후군, MPS VII(GUSB 엑손 5); 글리코겐 축적병 타입 II, 폼페병, GSD II(GAA); GM2 강글리오시드증(HEXA); 뮤코다당류증 타입 IIIA, 산필리포 증후군 타입 A, MPS IIIA(SGSH 엑손 6 변이체 2); 피부 & 결합 조직; 어린선(PNPLA1); 어린선(SLC27A4); 이영양성 수포성 표피박리증(COL7A1); 어린선, 표피박리 과다각화증(KRT10); 외배엽 이형성증, 피부 취약 증후군(PKP1); 어린선(NIPAL4); 무슬라딘 루케 증후군(ADAMTSL2); 국소 비표피박리 손발바닥 각질피부증, 선천성 손발톱비대증(KRT16); 유전성 코 부전각화증(SUV39H2); 유전성 발바닥 과다각화증(FAM83G); 뇌 및 척수; 청소년 발병 다발신경병증, 레온베르거 다발신경병증 1, LPN1(LPN1, ARHGEF10); 소뇌 위축, 신생아 소뇌 피질 변성, NCCD(SPTBN2); 기면증(HCRTR2 인트론 6); L-2-하이드록시글루타르산뇨증, L2HGA(L2HGDH); 소뇌성 실조증을 동반한 해면상 변성 2, SDCA2(ATP1B2); 진행성 뉴런 위축, 개과 다계통 변성, CMSD(SERAC1 엑손 15); 태아 발병 신생아 신경축삭 이영양증(MFN2); 발작을 동반한 신생아 뇌병증, NEWS(ATF2); 양성 가족성 청소년 간질, 완화성 국소 간질(LGI2); 청소년 후두 마비 및 다발신경병증, 안구 기형 및 신경 공포형성을 동반한 다발신경병증, POANV(RAB3GAP1, 로트바일러 변이체); 진행성 뉴런 위축, 개과 다계통 변성, CMSD(SERAC1 엑손 4); 소뇌성 실조증, 진행성 조기 발병 소뇌성 실조증(SEL1L); 유전성 감각 자율 신경병증, 말단 손상 증후군, AMS(GDNF-AS); 진전 강아지 증후군, X 연관 전신 떨림 증후군(PLP); 저수초화 및 떨림(FNIP2); 척수소뇌성 실조증, 후기 발병 실조증, LoSCA(CAPN1); 다발신경병증, NDRG1 그레이하운드 변종 (NDRG1 엑손 15); 다발신경병증, NDRG1 말라뮤트 변이체(NDRG1 엑손 4); 소뇌 형성저하증(VLDLR); 소뇌성 실조증을 동반한 해면상 변성 1, SDCA1, SeSAME/EAST 증후군(KCNJ10); 근잔떨림 및/또는 발작을 동반한 척수소뇌성 실조증(KCNJ10); 알래스칸 허스키 뇌병증, 아급성 괴사성 뇌척수병(SLC19A3); 퇴행성 골수병증, DM(SOD1A); 알렉산더병(GFAP); 심장; 확장성 심근병증, DCM1(PDK4); 긴 QT 증후군(KCNQ1); 확장성 심근병증, DCM2(TTN); 골격; 유전성 비타민 D 저항성 구루병(VDR); 골형성부전증, 취성 골 질환(COL1A1); 골형성부전증, 취성 골 질환(SERPINH1); 연골이영양증 및 추간판 질환, CDDY/IVDD, 타입 I IVDD(FGF4 레트로유전자 - CFA12); 골형성부전증, 취성 골 질환(COL1A2); 두개하악 골병증, CMO(SLC37A2); 골격 이형성증 2, SD2(COL11A2); 구순구개열 및/또는 구개열(ADAMTS20); 눈골격 이형성증 1, 왜소증-망막 이형성증, OSD1(COL9A3, 래브라도 리트리버); 골연골이형성증, 골격 왜소증(SLC13A1); 대사; 악성 고열(RYR1); 카탈라제저하증, 무카탈라제혈증(CAT); 피루베이트 데하이드로게나제 결핍증(PDP1); 신장 및 방광; 고요산뇨증 및 고요산혈증 또는 요로결석증, HUU(SLC2A9); 다낭성 신장 질환, PKD(PKD1); 단백질 손실 신병증, PLN(NPHS1); 시스틴뇨증 타입 II-A(SLC3A1); 원발성 고옥소산뇨증(AGXT); 시스틴뇨증 타입 I-A(SLC3A1); 상염색체 열성 유전성 신병증, 가족성 신병증, ARHN(COL4A4 엑손 3); X 연관 유전성 신병증, XLHN(COL4A5 엑손 35, 사모예드 변이체 2); 시스틴뇨증 타입 II-B(SLC7A9); 2,8-디하이드록시아데닌 요로결석, 2,8-DHA 요로결석(APRT); 신경근; 간헐적 낙상 증후군(BCAN); 선천성 근무력증 증후군(COLQ); 선천성 근무력증 증후군(CHAT); 면역; 중증 복합 면역결핍증(RAG1); X 연관 중증 복합 면역결핍증(IL2RG 변이체 1); 중증 복합 면역결핍증(PRKDC); X 연관 중증 복합 면역결핍증(IL2RG 변이체 2); 보체 3 결핍증, C3 결핍증(C3); 위장; 이머슬룬드-그레스베트 증후군, 선택적 코발라민 흡수 장애(CUBN 엑손 53); 이머슬룬드-그레스베트 증후군, 선택적 코발라민 흡수 장애(CUBN 엑손 8); 임상; MDR1 약물 감수성(MDR1); 알라닌 아미노트랜스퍼라제 활성(GPT); 호르몬; 및 선천성 갑상선 기능 저하증(TPO, 텐터필드 테리어 변이체)으로 구성된 군으로부터 선택된다. 일부 실시양태에서, 위험은 유전적 또는 건강 상태를 갖는 개체의 확률 또는 상대적 위험으로 표현된다. 일부 실시양태에서, 상대적 위험은 수치(예컨대, 상대적 위험비) 또는 범주형 값(예컨대, "위험한 상태," "위험하지 않은 상태," 또는 "명백한 위험 상태")이다. 일부 실시양태에서, 보인자 상태는 개체가 유전적 또는 건강 상태의 보인자라는 것을 나타내는 양성 또는 음성 표시로 표현된다.
일부 실시양태에서, 본 방법은 시험 개체 집단의 하나 이상의 개체 각각에 대해, 개체의 하나 이상의 개 품종을 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 시험 개체 집단의 하나 이상의 개체 각각에 대해, 개체의 하나 이상의 개 품종의 하나 이상의 비율을 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 시험 개체 집단의 복수의 개체의 가계도를 생성하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 시험 개체 집단의 하나 이상의 개체 각각에 대해, 개체에서 표현형 또는 형질의 존재, 부재 또는 위험을 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 표현형 또는 형질은 베이스 코트 색상(예컨대, 진한 색상 또는 옅은 색상의 털, 색소의 색상, 및 색상 희석), 색상 코트 모디파이어(예컨대, 은닉 패터닝, 신체 패턴 및 안면 패턴), 코트 형질(예컨대, 퍼니싱, 코트 길이, 털 빠짐, 코트 질감, 털 없음(졸로 타입), 털 없음(테리어 타입), 및 백색증), 신체 특징(예컨대, 주둥이 길이, 꼬리 길이, 뒷이슬 발톱, 등 근육 및 벌크, 눈 색상), 신체 크기(예컨대, 더 작음, 중간 및 더 큼), 수행능(예컨대, 고도 적응), 유전적 다양성(예컨대, 근친교배 정도, 및 면역 반응의 다양성)으로 구성된 군으로부터 선택된다.
일부 실시양태에서, 본 방법은 조상 근연도 정도; 가족 관계; 유전적 또는 건강 상태의 존재, 부재, 위험 또는 보인자 상태; 하나 이상의 개 품종; 하나 이상의 개 품종의 하나 이상의 비율; 가계도; 표현형 또는 형질의 존재, 부재, 위험 또는 보인자 상태; 및 그의 임의의 조합 중 하나 이상의 것을 나타내는 보고서를 작성하는 단계를 추가로 포함한다. 일부 실시양태에서, 본 방법은 보고서를 수의사에게 전송하는 단계를 추가로 포함한다.
본 개시내용의 또 다른 측면은 하나 이상의 컴퓨터 프로세서에 의해 실행될 때, 상기 또는 본원 다른 곳의 방법 중 임의의 것을 구현하는 기계 실행가능 코드를 포함하는 비일시적 컴퓨터 판독가능 매체를 제공한다.
본 개시내용의 또 다른 측면은 하나 이상의 컴퓨터 프로세서 및 그에 커플링된 컴퓨터 메모리를 포함하는 시스템을 제공한다. 컴퓨터 메모리는 하나 이상의 컴퓨터 프로세서에 의해 실행될 때, 상기 또는 본원 다른 곳의 방법 중 임의의 것을 구현하는 기계 실행가능 코드를 포함한다.
본 개시내용의 추가 측면 및 이점은 본 개시내용의 예시적인 실시양태만이 제시되고, 기술되는 하기 상세한 설명으로부터 당업자에게 용이하게 자명해질 것이다. 인식되는 바와 같이, 본 개시내용은 다른 및 상이한 실시양태가 가능하고, 그의 여러 세부사항은 모두 본 개시내용으로부터 벗어남 없이, 다양한 명백한 측면에서 변형될 수 있다. 따라서, 도면 및 설명은 본질적으로 예시적인 것으로 간주되어야 하며, 제한적인 것으로 간주되어서는 안된다.
참조에 의한 포함
본 명세서에서 언급된 모든 공개문헌, 특허 및 특허 출원은 각각의 개별 공개문헌, 특허 또는 특허 출원이 참조로 포함되는 것으로 구체적이고, 개별적으로 명시된 것처럼 동일한 정도로 본원에서 참조로 포함된다. 참조로 포함된 공개문헌 및 특허 또는 특허 출원이 본 명세서에 포함된 본 개시내용과 상반되는 경우, 본 명세서는 상기 임의의 상반되는 자료를 대체 및/또는 우선하는 것으로 의도된다.
도면의 간단한 설명
본 발명의 신규한 특징은 첨부된 청구범위에서 구체적으로 기술된다. 본 발명의 특징 및 이점에 대해서는 본 발명의 원리가 이용되는 예시적인 실시양태를 설명하는 하기 상세한 설명 및 첨부 도면(또한 본원에서 "도(Figure)" 및 "도(FIG.)")을 참조함으로써 더욱 잘 이해될 것이며, 첨부 도면 중
도 1은 일부 실시양태에 따라 이배체 집단의 두 개체 간의 조상 근연도 정도를 추정하는 방법의 예를 도시한 것이다.
도 2는 본원에 제공된 방법을 프로그래밍하거나, 또는 다르게는 구현하는 컴퓨터 시스템을 도시한 것이다.
상세한 설명
본 발명의 다양한 실시양태가 본원에 제시되고, 기술되었지만, 그러한 실시양태는 단지 예로서만 제공된다는 것이 당업자에게 명백할 것이다. 당업자는 본 발명으로부터 벗어남 없이 다수의 변형, 변경 및 치환을 착안해낼 수 있다. 본원에 기술된 본 발명의 실시양태에 대한 다양한 대안이 사용될 수 있다는 것을 이해하여야 한다.
본 명세서 및 청구범위에서 사용된 바, 단수형 "하나'("a," "an") 및 "그"는 문맥상 달리 명백하게 명시하지 않는 한, 복수의 지시 대상을 포함한다. 예를 들어, "한 샘플"은 그의 혼합물을 비롯한, 복수의 샘플을 포함한다.
본원에서 사용되는 바, 용어 "피험체"는 일반적으로 시험가능하거나, 또는 검출가능한 유전 정보를 갖는 엔티티 또는 매체를 지칭한다. 피험체는 사람, 개체 또는 환자일 수 있다. 피험체는 예를 들어, 포유동물과 같은 척추동물일 수 있다. 포유동물의 비제한적 예로는 인간, 유인원, 농장 동물, 스포츠 동물, 설치류 및 애완동물(예컨대, 개과, 예컨대, 개, 또는 고양이과, 예컨대, 고양이)을 포함한다. 피험체는 정상 또는 비정상적인 건강 또는 생리학적 상태 또는 병태를 갖거나, 또는 정상 또는 비정상적인 건강 또는 생리학적 상태 또는 병태를 갖는 것으로 의심될 수 있다. 피험체는 건강 또는 생리학적 상태 또는 병태를 나타내는 증상(들)을 나타낼 수 있다. 대안으로, 피험체는 상기 건강 또는 생리학적 상태 또는 병태와 관련하여 무증상일 수 있다.
용어 "핵산" 또는 "폴리뉴클레오티드"는 일반적으로 하나 이상의 핵산 서브유닛 또는 뉴클레오티드를 포함하는 분자를 지칭한다. 핵산은 아데노신(A), 시토신(C), 구아닌(G), 티민(T) 및 우라실(U), 또는 그의 변이체로부터 선택된 하나 이상의 뉴클레오티드를 포함할 수 있다. 뉴클레오티드는 일반적으로 뉴클레오시드 및 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 포스페이트(P03) 기를 포함한다. 뉴클레오티드는 핵염기, 5 탄당(리보스 또는 데옥시리보스), 및 하나 이상의 포스페이트 기를 개별적으로 또는 조합하여 포함할 수 있다. 리보뉴클레오티드는 당이 리보스인 뉴클레오티드이다. 데옥시리보뉴클레오티드는 당이 데옥시리보스인 뉴클레오티드이다. 뉴클레오티드는 뉴클레오시드 모노포스페이트 또는 뉴클레오시드 폴리포스페이트일 수 있다. 뉴클레오티드는 데옥시리보뉴클레오시드 폴리포스페이트, 예컨대, 예로서, 데옥시리보뉴클레오시드 트리포스페이트(dNTP: deoxyribonucleoside triphosphate)일 수 있으며, 이는 데옥시아데노신 트리포스페이트(dATP: deoxyadenosine triphosphate), 데옥시시티딘 트리포스페이트(dCTP: deoxycytidine triphosphate), 데옥시구아노신 트리포스페이트(dGTP), 우리딘 트리포스페이트(dUTP: uridine triphosphate) 및 데옥시티미딘 트리포스페이트(dTTP: deoxythymidine triphosphate) dNTP로부터 선택될 수 있으며, 이는 예컨대, 발광 태그 또는 마커(예컨대, 형광단)와 같은 검출가능한 태그를 포함한다. 뉴클레오티드는 성장하는 핵산 가닥에 도입될 수 있는 임의의 서브유닛을 포함할 수 있다. 상기 서브유닛은 A, C, G, T, 또는 U, 또는 하나 이상의 상보적 A, C, G, T 또는 U에 특이적인 또는 퓨린(즉, A 또는 G, 또는 그의 변이체) 또는 피리미딘(즉, C, T 또는 U, 또는 그의 변이체)에 상보적인 임의의 다른 서브유닛일 수 있다. 일부 예에서, 핵산은 데옥시리보핵산(DNA: deoxyribonucleic acid), 리보핵산(RNA: ribonucleic acid), 또는 그의 유도체 또는 변이체이다. 핵산은 단일 가닥 또는 이중 가닥일 수 있다. 핵산 분자는 선형, 곡선형, 원형 또는 그의 임의의 조합일 수 있다.
본원에서 사용되는 바, 용어 "핵산 분자," "핵산 서열," "핵산 단편," "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 일반적으로 예컨대, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드(RNA), 또는 그의 유사체와 같은 다양한 길이를 가질 수 있는 폴리뉴클레오티드를 지칭한다. 핵산 분자의 길이는 적어도 약 5개의 염기, 10개의 염기, 20개의 염기, 30개의 염기, 40개의 염기, 50개의 염기, 60개의 염기, 70개의 염기, 80개의 염기, 90, 100개의 염기, 110개의 염기, 120개의 염기, 130개의 염기, 140개의 염기, 150개의 염기, 160개의 염기, 170개의 염기, 180개의 염기, 190개의 염기, 200개의 염기, 300개의 염기, 400개의 염기, 500개의 염기, 1 킬로염기(kb: kilobase), 2 kb, 3, kb, 4 kb, 5 kb, 10 kb, 또는 50 kb 길이일 수 있거나, 또는 상기 언급된 값 중 임의의 둘 사이의 임의 개수의 염기를 가질 수 있다. 올리고뉴클레오티드는 전형적으로 4개의 뉴클레오티드 염기: 아데닌(A); 시토신(C); 구아닌(G); 및 티민(T)(폴리뉴클레오티드가 RNA인 경우, 티민(T) 대신 우라실(U))의 특정 서열로 구성된다. 따라서, 용어 "핵산 분자," "핵산 서열," "핵산 단편," "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 적어도 부분적으로 폴리뉴클레오티드 분자의 알파벳순 표현으로 의도된다. 대안적으로, 용어는 폴리뉴클레오티드 분자 자체에 적용될 수 있다. 상기 알파벳순 표현은 중앙 처리 장치가 있는 컴퓨터의 데이터베이스에 입력될 수 있고/거나, 기능 유전체학 및 상동성 검색과 같은 생물정보학 애플리케이션에 사용될 수 있다. 올리고뉴클레오티드는 하나 이상의 비표준 뉴클레오티드(들), 뉴클레오티드 유사체(들) 및/또는 변형된 뉴클레오티드를 포함할 수 있다.
본원에서 사용되는 바, 용어 "샘플"은 일반적으로 생물학적 샘플을 지칭한다. 생물학적 샘플의 예로는 핵산 분자, 아미노산, 폴리펩티드, 단백질, 탄수화물, 지방 또는 바이러스를 포함한다. 예에서, 생물학적 샘플은 하나 이상의 핵산 분자를 포함하는 핵산 샘플이다. 생물학적 샘플은 혈액 샘플, 타액 샘플, 스왑 샘플, 세포 샘플, 또는 조직 샘플을 포함하거나, 또는 그로부터 유래할 수 있다. 핵산 분자는 예컨대, 무세포 DNA(cfDNA: cell-free DNA) 또는 무세포 RNA(cfRNA: cell-free RNA)와 같은 무세포 핵산 분자일 수 있다. 핵산 분자는 인간, 포유동물(예컨대, 개), 비인간 포유동물, 유인원, 원숭이, 침팬지, 파충류, 양서류 또는 조류 공급원을 비롯한 다양한 공급원으로부터 유래될 수 있다. 추가로, 샘플은 체액 샘플, 예컨대, 혈액, 혈청, 혈장, 유리체, 가래, 소변, 눈물, 땀, 타액, 정액, 점막 배출물, 점액, 척수액, 뇌척수액(CSF: cerebrospinal fluid), 흉막액, 복막액, 양수, 림프액 등을 포함하나, 이에 제한되지 않는, 다양한 동물 체액으로부터 추출될 수 있다. 생물학적 샘플은 에틸렌디아민테트라아세트산(EDTA) 수집 튜브, 무세포 RNA 수집 튜브(예컨대, 스트렉(Streck)) 또는 무세포 DNA 수집 튜브(예컨대, 스트렉)를 사용하여 피험체로부터 수득되거나, 또는 유래될 수 있다. 생물학적 샘플은 분획화에 의해 전혈 샘플로부터 유래될 수 있다. 생물학적 샘플 또는 그의 유도체는 세포가 함유할 수 있다. 예를 들어, 생물학적 샘플은 혈액 샘플 또는 그 유도체(예컨대, 수집 튜브에 의해 수집된 혈액 또는 혈액 방울) 또는 세포 또는 조직 샘플(예컨대, 스왑)일 수 있다.
본원에서 사용되는 바, 용어 "전혈"은 일반적으로 (예컨대, 원심분리에 의해) 하위 성분으로 분리되지 않은 혈액 샘플을 지칭한다. 혈액 샘플의 전혈은 cfDNA 및/또는 생식계열 DNA를 함유할 수 있다. (cfDNA 및/또는 생식계열 DNA를 함유할 수 있는) 전혈 DNA는 혈액 샘플로부터 추출될 수 있다. (cfDNA 시퀀싱 리드 및/또는 생식계열 DNA 시퀀싱 리드를 함유할 수 있는) 전혈 DNA 시퀀싱 리드는 전혈 DNA로부터 추출될 수 있다.
한 측면에서, 본 개시내용은 (a) 시험 개체 집단에 대한 하플로타입 데이터를 수신하는 단계로서, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함하는 것인 단계; (b) 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계; (c) 각 시험 개체 집단에 대해: (i) 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계로서, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함하는 것인 단계; (ii) 제1 개체와 제2 개체 간의 각각의 매칭된 세그먼트에 대해: 매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누는 단계; (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도, 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 점수를 생성하는 단계; 복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하는 단계; 및 이산 게놈 간격의 복수의 보정된 점수에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계; 및 (iii) 복수의 보정된 점수 및 복수의 가중치에 기초하여 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계; 및 (d) 매칭된 세그먼트의 가중 합에 기초하여 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계를 포함하는, 이배체 집단의 두 개체 간의 조상 근연도 정도를 추정하기 위한 컴퓨터 구현 방법을 제공한다.
도 1은 일부 실시양태에 따라 이배체 집단의 두 개체 간의 조상 근연도 정도를 추정하는 방법(100)의 예를 도시한 것이다. 연산(102)에서, 방법(100)은 시험 개체 집단에 대한 하플로타입 데이터를 수신하는 단계를 포함할 수 있다. 예를 들어, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함할 수 있다. 이어서, 연산(104)에서, 방법(100)은 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계를 포함할 수 있다. 이어서, 연산(106)에서, 각 시험 개체 집단에 대해, 방법(100)은 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계를 포함할 수 있다. 예를 들어, 각각의 매칭된 세그먼트는 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함할 수 있다. 이어서, 연산(108)에서, 각 시험 개체 집단에 대해, 방법(100)은 제1 개체와 제2 개체 간의 각각의 매칭된 세그먼트에 대해: (a) 매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누는 단계; (b) 복수의 이산 게놈 간격을 각각 점수화하여 복수의 점수를 생성하는 단계; (c) 복수의 점수를 보정하여 복수의 보정된 점수를 생성하는 단계; 및 (d) 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계를 포함할 수 있다. 일부 실시양태에서, 복수의 이산 게놈 간격은 각각 (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도, 및/또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 점수화된다. 일부 실시양태에서, 복수의 점수는 복수의 점수의 일관성에 기초하여 보정된다. 일부 실시양태에서, 복수의 가중치는 이산 게놈 간격의 복수의 보정된 점수에 기초하여 복수의 이산 게놈 간격에 할당된다.
일부 실시양태에서, 이배체 집단의 두 개체 간의 조상 근연도 정도를 추정하는 방법은 집단 중 개체(예컨대, 개) 쌍 사이의 관계 계수(COR: coefficient of relationship)를 계산하는 단계를 포함할 수 있다. 계산된 COR 값에 기초하여, 개체의 가장 가까운 유전적 친족 목록을 포함하는 집단 내 각 개체에 대한 목록이 생성될 수 있다. 예를 들어, 이러한 친족 목록은 COR의 내림차순으로 정렬될 수 있다. 추가로, 관련된 두 개체(예컨대, 관련된 개의 소유자) 간의 COR에 기초하여 소셜 네트워크 연결이 생성될 수 있다.
개에 대한 COR 값을 계산하는 다른 방법은 가계도를 사용할 수 있는데, 이는 개의 조상 및 다른 친족의 "가계도" 매핑으로 구성될 수 있다. 상기 방법은 알려진 가계 정보가 없는 개(예컨대, 구조 동물)의 COR을 추정하는 데 사용될 수 없기 때문에 최소한 제한될 수 있다. 추가로, 정확성이 일관되게 높지 않을 수 있고, 가계가 몇 세대의 가계 정보만 제공할 수 있기 때문에, 및 가계가 "예상" 근연도(예컨대, 두 개체의 관계에 기초하여 그들이 공유할 것으로 예상되는 DNA의 양)만을 계산하는 데 사용될 수 있기 때문에, COR을 계산하기 위해 가계를 사용하는 것도 문제가 될 수 있다. 일반적으로, 두 개체(예컨대, 개)의 실제 근연도 또한 가계도를 통한 DNA의 무작위 분리 및 전달에 따라 달라질 수 있으며, 근연도를 정확하게 계산하려면 동물 간에 공유된 DNA 트랙을 확인하고, 집계해야 할 수 있다. 일부 방법은 유전자형 데이터를 페이징하고, 개체 간의 공유 트랙을 확인하는 데 사용할 수 있지만, 이는 COR를 계산할 때, 트랙에 적절한 가중치를 부여하기 위해, 및 구조적 변형 및 누락 또는 품질이 낮은 마커로부터 데이터 잡음을 처리하기 위해 통계적 아티팩트인 트랙과 진정 직계 동형 트랙인 트랙을 구별하는 것도 통계적으로 어려울 수 있다.
추가로, 개 사이의 COR을 계산하기 위한 접근법은 전형적인 인간 집단보다 개에서 근친교배 발생률이 훨씬 더 높기 때문에 인간에서보다 더 복잡해진다. 이러한 필요성을 인식하여, 본 개시내용은 두 개체 간의 COR을 결정할 때, 근친교배를 고려하는 (예컨대, 개 사이의) COR을 결정하기 위한 방법 및 시스템을 제공한다. 예를 들어, 근친교배 집단에서 또 다른 한 쌍의 두 형매의 COR은 0.7 이상일 수 있다는 것과 비교하여, 이계교배 집단에서 한 쌍의 두 형매의 COR은 대략 0.5일 수 있다. 본 개시내용의 방법 및 시스템을 사용하여, 개체가 근친교배 집단의 일부인 경우에도 두 개체 간의 관계 유형이 결정될 수 있다. 예를 들어, COR이 0.5인 2마리의 개로 이루어진 모든 쌍은 전체 형매의 것과 유사한 근연도를 갖는다고 결정하는 대신, 본 개시내용의 방법 및 시스템을 적용하여 COR이 0.5인 특정의 한 쌍의 개가 전체 형매인 제1 사례와 COR이 0.5인 또 다른 한 쌍의 개는 근친교배 계통의 삼촌-조카와 관련된 것인 제2 사례를 구별할 수 있다.
추가로, 본 개시내용의 방법 및 시스템을 사용하여 개의 유전자 검정 결과에 가치 있는 사회적 구성요소를 추가할 수 있다. 개 소유자가 그의 애완동물의 근연도에 기초하여 서로 직접 연결할 수 있게 함으로써 소유자는 관련된 개 소유자로부터 그 자신의 개의 이력에 대한 정보(예컨대, 입양된 개 소유자에게 중요하거나, 바람직한 정보일 수 있다), 및 유전자 검정의 일부가 아닌 복잡한 형질에 대한 잠재적인 건강상 위험에 대한 정보(예컨대, 개의 형매에게 암의 병력이 있다면, 이때 개는 암에 걸릴 위험이 더 높을 수 있다)를 더 많이 획득할 수 있다.
본 개시내용의 방법 및 시스템은 하나 이상의 알고리즘을 사용하여 (예컨대, 이배체 집단의) 두 개체 간의 조상 근연도 정도(COR)를 결정할 수 있다. 예를 들어, 이배체 집단은 포유동물 집단(예컨대, 개과 집단, 고양이과 집단, 스포츠 동물 집단, 또는 설치류 집단)일 수 있다. 일부 실시양태에서, 개과 집단은 개 집단이다. 일부 실시양태에서, 개 집단은 아펜핀셔, 아프간 하운드, 아프리카니스, 아이디, 에어데일 테리어, 악바쉬 도그, 아키타견, 알랑구 마스티프, 알라노 에스파뇰, 알라파하 블루 블러드 불독, 알래스칸 클리 카이, 알래스칸 말라뮤트, 얼라운트, 알로페키스, 알파인 닥스브래크, 알자시안 셰팔류트, 아메리칸 아키타, 아메리칸 불독, 아메리칸 코커 스패니얼, 아메리칸 에스키모 도그, 아메리칸 폭스하운드, 아메리칸 헤어리스 테리어, 아메리칸 마스티프, 아메리칸 핏 불 테리어, 아메리칸 스태퍼드셔 테리어, 아메리칸 워터 스패니얼, 아나톨리안 셰퍼드 도그, 앵글로-프랑세 드 쁘티 베네리, 아펜젤러 세넨훈드, 아르헨틴 도고, 아리에주 포인터, 아리에쥬아, 아르만트, 아르토이스 하운드, 오스트레일리안 불독, 오스트레일리안 캐틀 도그, 오스트레일리안 켈피, 오스트레일리안 셰퍼드, 오스트레일리안 실키 테리어, 오스트레일리안 스텀피 테일 캐틀 도그, 오스트레일리안 테리어, 오스트리안 블랙 앤 탠 하운드, 오스트리안 핀셔, 아자와크, 바카르왈 도그, 바베트, 바센지, 바스크 셰퍼드 도그, 바셋 아르테지앙 노르만, 바셋 블뢰 드 가스코뉴, 바셋 포브 드 브르타뉴, 그랑 바셋 그리퐁 방댕, 쁘티 바셋 그리퐁 방댕, 바이에른 마운틴 하운드, 비글, 비글-해리어, 비어디드 콜리, 보스롱, 베들링턴 테리어, 벨지안 셰퍼드 도그, 벨지안 셰퍼드 도그(그루넨달), 벨지안 셰퍼드 도그(라케노이즈), 벨지안 셰퍼드 도그(말리노이즈), 벨지안 셰퍼드(테뷰런), 베르가마스코 셰퍼드, 베르거 블랑 스위스, 베르거 피카르드, 베른 라우프훈트, 버니즈 마운틴 도그, 비숑 프리제, 빌리, 비스벤, 블랙 앤 탠 쿤하운드, 블랙 앤 탠 버지니아 폭스하운드, 불렌바이저, 블랙 노르웨이 엘크하운드, 블랙 러시안 테리어, 블랙마우스 커, 그랑블루 드 가스코뉴, 쁘티 블루 드 가스코뉴, 블러드하운드, 블루 레이시, 블루 폴 테리어, 블루틱 쿤하운드, 보어보엘, 보헤미안 셰퍼드, 볼로네제, 보더 콜리, 보더 테리어, 보르조이, 보스니아 코즈-헤어드 하운드, 보스톤 테리어, 부비에 데 아르덴, 부비에 데 플랑드르, 복서, 보이킨 스패니얼, 브라코 이탈리아노, 브라크 디 오베르뉴, 브라크 뒤 부르보네, 블라크 더 파이, 브라크 프랑세, 브라크 생-제르맹, 브라질리언 테리어, 브리아드, 브리케 그리퐁 방댕, 브리타니, 브로홀머, 브루노 쥬라 하운드, 부코비나 셰퍼드 도그, 불 앤 테리어, 불 테리어, 불 테리어(미니어처), 불마스티프, 불리 쿠타, 케언 테리어, 케이넌 도그, 캐내디언 에스키모 도그, 캐내디언 포인터, 카네 코르소, 카오 다 세라 아이레스, 카오 데 카스트로 라보레이로, 카오 필라 드 사오 미구엘, 캐롤리나 도그, 카르파티안 셰퍼드 도그, 카타호울라 커, 카탈란 쉽독, 코카시안 셰퍼드 도그, 카발리에 킹 찰스 스패니얼, 센트럴 아시안 셰퍼드 도그, 체스키 푸섹, 체스키 테리어, 폴리시 그레이하운드, 체서피크 베이 리트리버, 시엥-그리스, 시엥 프랑세 블랑 이 느와르, 시엥 프랑세 블랑 이 오렌지, 시엥 프랑세 트리콜로르, 치와와, 칠리안 폭스 테리어, 차이니즈 충칭 도그, 차이니즈 크레스티드 도그, 차이니즈 임페리얼 도그, 치누크, 치피파라이, 차우차우, 시마론 우루과요, 시에르니 세리, 시르네코 델레트나, 클럼버 스패니얼, 러프 콜리, 스무스 콜리, 콤바이, 코르도바 파이팅 도그, 코통 드 튈레아르, 크레탄 하운드, 크로아티안 쉽독, 컴벌랜드 쉽독, 컬리 코티드 리트리버, 체코슬로바키아 울프도그, 닥스훈트, 달마시안, 댄디 딘몬트 테리어, 데니쉬 스웨디쉬 팜도그, 딩고, 도베르만 핀셔, 도그 드 보르도, 도고 쿠바노, 도고 과테말테코, 도고 사르데스코, 드렌체 파트리혼트, 드레버, 덩커, 더치 셰퍼드 도그, 더치 스모우스혼드, 이스트 유러피안 셰퍼드, 이스트 시베리안 라이카, 엘로, 잉글리시 코커 스패니얼, 잉글리시 쿤하운드, 잉글리시 폭스하운드, 잉글리시 마스티프, 잉글리시 포인터, 잉글리시 세터, 잉글리시 셰퍼드, 잉글리시 스프링거 스패니얼, 잉글리시 토이 테리어(블랙 & 탄), 잉글리시 워터 스패니얼, 잉글리시 화이트 테리어, 엔틀버쳐 마운틴 도그, 에파뉴엘 블뢰 드 피카르디, 에스토니안 하운드, 에스트렐라 마운틴 도그, 유라시에, 필드 스파니엘, 휠라 브라질레이로, 핀도, 피니쉬 하운드, 피니쉬 라프훈트, 피니쉬 스피츠, 플랫-코티드 리트리버, 포모산 마운틴 도그, 폭스 테리어(스무스), 와이어 폭스 테리어, 프렌치 브리타니, 프렌치 불독, 프렌치 스패니얼, 갈고 에스파뇰, 저먼 롱헤어드 포인터, 저먼 핀셔, 저먼 셰퍼드 도그, 저먼 쇼트헤어드 포인터, 저먼 스패니얼, 저먼 스피츠, 저먼 와이어헤어드 포인터, 자이언트 슈나우저, 글렌 오브 이말 테리어, 골든 리트리버, 고든 세터, 그랑 앵글로-프랑세 블랑 이 느와르, 그랑 앵글로-프랑세 블랑 이 오렌지, 그랑 앵글로-프랑세 트리콜로르, 그랑 그리퐁 방댕, 그랑 마스팅 드 보링켄, 그레이트 데인, 그레이트 피레니즈, 그레이터 스위스 마운틴 도그, 그린란드 도그, 그레이하운드, 그리퐁 블뢰 드 가스코뉴, 그리퐁 브뤼셀루아, 그리퐁 포브 드 브르타뉴, 그리퐁 니베르네, 굴 동, 굴 테르, 해어 인디언 도그, 해밀턴스퇴바레, 하노버 하운드, 해리어, 하바네세, 하와이안 포이 도그, 히말라얀 쉽독, 홋카이도, 호르타야 보르자야, 호바와트, 헝가리안 하운드, 뉴질랜드 헌터웨이하이겐훈트, 이비잔 하운드, 아이슬란딕 쉽독, 인디안 스피츠, 아이리시 불 테리어, 아이리시 레드 앤드 화이트 세터, 아이리시 세터, 아이리시 스타포드셔 불 테리어, 아이리시 테리어, 아이리시 워터 스패니얼, 아이리시 울프하운드, 이스트리안 쇼트헤어드 하운드, 이스트리안 코즈-헤어드 하운드, 이탈리안 그레이하운드, 잭 러셀 테리어, 잭테리어, 쟘툰드, 재패니즈 친, 재패니즈 스피츠, 재패니즈 테리어, 조낭이, 카이카디, 카이 켄, 캉갈 도그, 카니, 카라카찬 도그, 커릴리언 베어 도그, 카르스트 셰퍼드, 키스혼드, 케리 비글, 케리 블루 테리어, 킹 찰스 스패니얼, 킹 셰퍼드, 킨타마니, 기슈, 코몬도르, 쿠이커혼제, 쿨리, 한국 진돗개, 한국 마스티프, 크롬폴란데, 쿤밍 울프 도그, 쿠리, 쿠바즈, 카이-레오, 래브라도 허스키, 래브라도 리트리버, 라고토 로마그놀로, 레이크랜드 테리어, 랭카셔 힐러, 랜드시어, 라포니안 허더, 레온베르거, 라사 압소, 리투아니안 하운드, 롱헤어드 휘핏, 로타토레 브린디시노, 로첸, 마자르 아가, 마제스틱 트리 하운드, 말티즈, 맨체스터 테리어, 마렘마 쉽독, McNab, 멕시칸 헤어리스 도그, 미니어처 오스트레일리안 셰퍼드, 미니어처 폭스 테리어, 미니어처 핀셔, 미니어처 슈나우저, 미니어처 시베리안 허스키, 미오리틱, 몰로수스, 몬터니그런 마운틴 하운드, 모스크바 워치독, 모스크바 워터 도그, 마운틴 커, 마운틴 뷰 커, 무쿠치, 무디, 머드홀 하운드, 라지 문스터랜더, 스몰 문스터랜더, 머레이 리버 컬리 코티드 리트리버, 나폴리탄 마스티프, 뉴펀들랜드, 뉴 기니아 싱잉 도그, 노포크 스패니얼, 노포크 테리어, 노르보텐스피츠, 노스 컨트리 비글, 노던 이누이트 도그, 노르웨이안 부훈트, 노르웨이안 엘크하운드, 노르웨이안 룬트훈트, 노리치 테리어, 노바 스코셔 덕-톨링 리트리버, 올드 대니시 포인터, 올드 잉글리시 쉽독, 올드 잉글리시 불독, 올드 잉글리시 테리어, 올드 저먼 셰퍼드 도그, 올드 잉글리시 불도그, 오터하운드, 파촌 나바로, 페이즐리 테리어, 빠삐용, 파슨 러셀 테리어, 페터데일 테리어, 페키니즈, 페로 드 프레사 카나리오, 페르로 드 프레사 말로르퀸, 페루비안 헤어리스 도그, 파렌, 파라오 하운드, 피카디 스패니얼, 플롯 하운드, 포덴코 카나리오, 포인터, 폴리시 하운드, 폴리시 헌팅 도그, 폴리시 로우랜드 쉽독, 폴리시 타트라 쉽독, 포메라니안, 퐁토드메르 스패니얼, 푸들, 포르셀엔, 포르투기스 포덴고, 포르투기스 포인터, 포르투기스 워터 도그, 프라츠키 크리사릭, 푸들포인터, 퍼그, 풀리, 푸미, 풍산개, 피레니안 마스티프, 피레니언 셰퍼드, 라페이로 도 알렌테조, 라자팔라얌, 람퍼 그레이하운드, 라스트레아도르 브라질레이로, 래토네로 보데게로 안달루즈, 래트 테리어, 레드본 쿤하운드, 로디지안 리지백, 로트바일러, 러시안 스패니얼, 러스키 토이, 루소-유러피안 라이카, 러셀 테리어, 사를로스울프하운드, 사부에소 에스파뇰, 세이지 아샤예리, 세이지 마잔다라니, 사할린 허스키, 살루키, 사모예드, 삽살리, 샤플래니낙, 샤펜도스, 실레르스퇴바레, 스키퍼키, 올드 크로아티안 사이트하운드, 자이언트 슈나우저, 미니어처 슈나우저, 스탠다드 슈나우저, 슈바이처 라우프훈트, 슈바이체리셔 니데를라우프훈트, 스카치 콜리, 스코티시 디어하운드, 스코티시 테리어, 실리엄 테리어, 세구지오 이탈리아노, 세팔라 시베리안 슬레드독, 세르비안 하운드, 세르비안 트라이칼라 하운드, 샤페이, 셔틀랜드 쉽독, 시바견, 시추, 시코쿠, 샤일로 셰퍼드 도그, 시라크, 시베리안 허스키, 실켄 윈드하운드, 싱할라 하운드, 스카이 테리어, 슬루기, 슬로박 쿠바크, 슬로바키안 러프-헤어드 포인터, 슬로벤스키 코포브, 스말랜드스퇴바레, 스몰 그리크 도메스틱 도그, 소프트-코티드 휘튼 테리어, 사우스 러시안 오브차카, 써던 하운드, 스패니쉬 마스티프, 스패니쉬 워터 도그, 스피노네 이탈리아노, 스포팅 루카스 테리어, 세인트 버나드, 세인트 존스 워터 도그, 스테비훈, 스타포드셔 불 테리어, 스테펜스 커, 스타이리안 코즈-헤어드 하운드, 서식스 스패니얼, 스웨디시 라프훈트, 스위디쉬 발훈트, 스위디쉬 비글, 탈탄 베어 도그, 타이간, 타마스칸 도그, 테디 루스벨트 테리어, 텔로미안, 텐터필드 테리어, 타이 방깨우 도그, 타이 리지백, 티베탄 마스티프, 티베탄 스패니얼, 티베탄 테리어, 토른쟈크, 토사, 토이 불독, 토이 폭스 테리어, 토이 맨체스터 테리어, 트리잉 커, 트리잉 워커 쿤하운드, 티롤리언 하운드, 우토나간, 비즐라, 볼피노 이탈리아노, 와이머라너, 카디건 웰시 코기, 펨브록 웰시 코기, 웰시 쉽독, 웰시 스프링어 스패니얼, 웰시 테리어, 웨스트 하이랜드 화이트 테리어, 웨스트 시베리안 라이카, 웨스트팔리안 닥스브라케, 웨터훈, 휘핏, 화이트 잉글리시 불독, 화이트 셰퍼드 도그, 와이어헤어드 비즐라, 와이어헤어드 포인팅 그리퐁, 및 요크셔 테리어로 구성된 군으로부터 선택되는 하나 이상의 개 품종을 포함한다. 일부 실시양태에서, 집단은 하나 이상의 순종 개(예컨대, 단일 품종 유형을 갖는 것) 또는 하나 이상의 혼합 품종 개(예컨대, 복수의 품종 유형을 갖는 것)를 포함한다. 일부 실시양태에서, 집단은 임의 개수의(예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 10개 초과의) 순종 개 또는 순종 개의 조합으로부터의 DNA를 갖는 혼합 품종 개 집단이다.
일부 실시양태에서, 근연도 rxy는 공통 조상으로부터의 직계 동형에 기인하여 두 개체 사이에서 공유되는 상동 대립유전자의 비율로서 계산될 수 있고, 이는 개체가 근친교배가 아니라고 가정할 때, 2 * 친족관계 계수 fxy와 같을 수 있다. 친족관계 계수는 2개의 개체에서의 동일한 유전자좌로부터 샘플링된 2개의 대립유전자가 직계 동형일 확률을 나타낼 수 있다. 이는 두 개체 xy 사이의 잠재적 자손에 대한 근친교배 계수와 같을 수 있다. 그러나, 두 개체 xy가 근친교배된 경우, rxy = 2*fxy라는 가정은 유효하지 않다.
일부 실시양태에서, 두 개체 사이의 조상 근연도 정도(COR)를 결정하는 방법은 WOOPHS(쌍별 하플로타입 공유의 가중 관측값: Weighted Observation of Pairwise Haplotype Sharing)로 명명된다. 일부 실시양태에서, WOOPHS는 유전자 데이터베이스 중 시험 개체와 다른 개체들 간의 관계 계수(COR)의 추정치를 계산하도록 구성된다. 일부 실시양태에서, WOOPHS는 두 개체의 미래 자손의 예상되는 근친교배 정도를 계산하도록 구성된다. 본 방법은 입력값으로서 유전자형 데이터를 수신하는 것을 포함할 수 있다. 예를 들어, 유전자형 데이터는 테스트 개체 집단에서 얻은 생물학적 샘플을 분석하여 얻을 수 있다. 예를 들어, 유전자형 데이터는 시험 개체 집단으로부터 수득된 생물학적 샘플을 검정함으로써 수득될 수 있다. 일부 실시양태에서, 생물학적 샘플은 혈액 샘플, 타액 샘플, 스왑 샘플, 세포 샘플(예컨대, 구강 또는 협부 스왑), 또는 조직 샘플을 포함한다. 일부 실시양태에서, 검정하는 것은 생물학적 샘플 또는 그의 유도체를 시퀀싱하여 유전자형 데이터를 생성하는 것을 포함한다. 예를 들어, 시퀀싱 리드는 임의의 적합한 시퀀싱 방법을 사용하여 생물학적 샘플로부터 생성될 수 있다. 시퀀싱 방법은 제1 세대 시퀀싱 방법, 예컨대, 맥삼-길버트(Maxam-Gilbert) 또는 생어(Sanger) 시퀀싱, 또는 고처리량 시퀀싱(예컨대, 차세대 시퀀싱 또는 NGS(next-generation sequencing)) 방법일 수 있다. 고처리량 시퀀싱 방법은 적어도 약 10,000, 100,000, 100만, 1,000만, 1억, 10억 개 또는 그 초과의 폴리뉴클레오티드 분자를 동시에(또는 실질적으로 동시에) 시퀀싱할 수 있다. 시퀀싱 방법으로는 파이로시퀀싱, 합성에 의한 시퀀싱, 단일 분자 시퀀싱, 나노포어 시퀀싱, 반도체 시퀀싱, 라이게이션에 의한 시퀀싱, 하이브리드화에 의한 시퀀싱, 디지털 진 익스프레션(Digital Gene Expression)(Helicos), 대규모 병렬 시퀀싱, 예컨대, 헬리코스(Helicos), 클로날 싱글 몰레큘러 어레이(Clonal Single Molecule Array)(Solexa/Illumina), PacBio, SOLiD, 이온 토렌트(Ion Torrent), 또는 나노포어(Nanopore) 플랫폼을 이용한 시퀀싱을 포함할 수 있지만, 이에 제한되지 않는다.
일부 실시양태에서, 시퀀싱은 전체 게놈 시퀀싱(WGS: whole genome sequencing)을 포함한다. 시퀀싱은 원하는 성능(예컨대, 정확도, 민감도, 특이도, 양성 예측도(PPV: positive predictive value), 음성 예측도(NPV: negative predictive value), 또는 수신자 조작 특성(ROC: receiver operator characteristic)의 곡선하면적(AUC: area under curve))으로 원하는 하플로타입을 생성하는 데 충분한 심도로 수행될 수 있다. 일부 실시양태에서, 시퀀싱은 약 20X, 약 30X, 약 40X, 약 50X, 약 60X, 약 70X, 약 80X, 약 90X, 약 100X, 약 150X, 약 200X, 약 250X, 약 300X, 약 350X, 약 400X, 약 450X, 약 500X, 또는 약 500X 초과의 심도로 수행된다. 일부 실시양태에서, 시퀀싱은 "로우 패스" 방식으로, 예를 들어, 약 12X 이하, 약 11X 이하, 약 10X 이하, 약 9X 이하, 약 8X 이하, 약 7X 이하, 약 6X 이하, 약 5X 이하, 약 4X 이하, 약 3.5X 이하, 약 3X 이하, 약 2.5X 이하, 약 2X 이하, 약 1.5X 이하, 또는 약 1X 이하의 심도로 수행된다.
일부 실시양태에서, 시퀀싱 리드는 참조 게놈에 정렬될 수 있다. 참조 게놈은 게놈(예컨대, 개 게놈 또는 인간 게놈)의 적어도 일부를 포함할 수 있다. 참조 게놈은 전체 게놈(예컨대, 전체 개 게놈 또는 전체 인간 게놈)을 포함할 수 있다. 참조 게놈은 게놈의 코딩 및/또는 비코딩 게놈 영역에 상응하는 복수의 게놈 영역을 포함하는 데이터베이스를 포함할 수 있다. 데이터베이스는 예컨대, 단일 뉴클레오티드 변이체(SNV: single nucleotide variant), 단일 뉴클레오티드 다형성(SNP: single nucleotide polymorphism), 카피수 변이체(CNV: copy number variant), 삽입 또는 결실(indels), 및 융합 유전자와 같은 게놈의 IBD 코딩 및/또는 비코딩 게놈 영역에 해당하는 복수의 게놈 영역을 포함할 수 있다. 정렬은 Burrows-Wheeler 알고리즘 또는 또 다른 정렬 알고리즘을 사용하여 수행될 수 있다.
일부 실시양태에서, 시퀀싱 리드의 정량적 측정값은 복수의 게놈 영역 각각에 대해 생성될 수 있다. 예컨대, 주어진 게놈 영역과 정렬된 DNA 시퀀싱 리드의 계수와 같은 시퀀싱 리드의 정량적 측정값이 생성될 수 있다. 주어진 게놈 영역과 정렬되는 시퀀싱 리드의 일부 또는 그들 모두를 갖는 시퀀싱 리드는 상기 게놈 영역에 대한 정량적 측정값으로 포함되도록 계수될 수 있다. 일부 실시양태에서, 게놈 영역은 예컨대, IBD 마커와 같은 유전적 마커를 포함할 수 있다. 특정 및 비특정 게놈 영역의 패턴은 개체 간의 근연도를 나타낼 수 있다.
일부 실시양태에서, DNA 시퀀싱 리드의 복수의 계수를 측정하는 것은 복수의 게놈 영역 각각에서 복수의 DNA 분자의 결합 측정을 수행하는 것을 포함한다. 일부 실시양태에서, 결합 측정을 수행하는 것은 복수의 DNA 분자 중 복수의 게놈 영역의 적어도 일부에 대해 선택적인 프로브를 사용하여 복수의 DNA 분자를 검정하는 것을 포함한다. 일부 실시양태에서, 프로브는 복수의 게놈 영역의 핵산 서열과 서열 상보성을 갖는 핵산 분자이다. 일부 실시양태에서, 핵산 분자는 프라이머 또는 농축 서열이다. 일부 실시양태에서, 검정은 어레이 하이브리드화 또는 중합효소 연쇄 반응(PCR: polymerase chain reaction), 또는 핵산 시퀀싱의 사용을 포함한다.
일부 실시양태에서, 본 방법은 복수의 게놈 영역의 적어도 일부에 대해 복수의 DNA 분자를 농축시키는 단계를 추가로 포함한다. 일부 실시양태에서, 농축은 복수의 DNA 분자를 증폭시키는 것을 포함한다. 예를 들어, 복수의 DNA 분자는 (예컨대, 복수의 게놈 영역의 핵산 서열과 서열 상보성을 갖는 핵산 분자를 포함하는 프라이머 또는 프로브 세트를 사용함으로써) 선택적 증폭에 의해 증폭될 수 있다. 대안적으로 또는 조합하여, 복수의 DNA 분자는 범용 증폭에 의해(예컨대, 범용 프라이머를 사용하여) 증폭될 수 있다. 일부 실시양태에서, 농축은 복수의 DNA 분자의 적어도 일부(예컨대, 모노뉴클레오티드 및/또는 디뉴클레오티드)를 선택적으로 단리시키는 것을 포함한다.
일부 실시양태에서, DNA 시퀀싱 리드의 계수는 정규화되거나, 또는 보정될 수 있다. 예를 들어, DNA 시퀀싱 리드의 계수는 시퀀싱 및 라이브러리 제작에서 알려진 편향 및/또는 시퀀싱 및 라이브러리 제작에서 알려진 편향을 설명하기 위해 정규화 및/또는 보정될 수 있다. 일부 실시양태에서, 예컨대, 시퀀싱 리드의 품질 점수에 기초하여 정량적 측정값 또는 계수의 서브세트를 필터링할 수 있다.
두 개체 간의 조상 근연도 정도(COR)를 결정하는 방법은 페이징 알고리즘을 사용하여 유전자형 데이터를 프로세싱함으로써 하플로타입 데이터를 생성하는 것을 포함할 수 있다. 예를 들어, 이는 염색체를 따라 개체 간에 공유되는 다수의 단일 뉴클레오티드 다형성(SNP)에 대해 관찰된 유전자형을 하플로타입의 연속성(예컨대, 동일한 부모 염색체에 존재하고, 함께 유전될 가능성이 있는 대립유전자)으로 분리하여 달성할 수 있다. 예를 들어, 하플로타입 페이징 알고리즘은 참조 기반 하플로타입 페이징 알고리즘(예컨대, 은닉 마르코프 모형(HMM) 기반 검색 포함)을 포함할 수 있다. 일부 실시양태에서, 참조 기반 하플로타입 페이징 알고리즘은 Eagle1 알고리즘, Eagle2 알고리즘, PHASE 알고리즘, fastPHASE 알고리즘, BEAGLE 알고리즘, Findhap 알고리즘, Impute 알고리즘, FImpute 알고리즘, AlphaImpute 알고리즘, IMPUTE2 알고리즘, MaCH 알고리즘, SHAPEIT1 알고리즘, SHAPEIT2 알고리즘, SHAPEIT3 알고리즘, SHAPEIT4 알고리즘, 또는 그의 조합을 포함한다. 대안적으로, 하플로타입 페이징 알고리즘은 코호트 기반 하플로타입 페이징 알고리즘을 포함할 수 있다.
일부 실시양태에서, 두 개체 간의 조상 근연도 정도(COR)를 결정하는 방법은 하플로타입 데이터를 프로세싱하여 집단 중 복수의 개체 간에 직계 동형인 매칭 하플로타입을 확인하는 단계를 포함한다. 예를 들어, IBD 하플로타입은 집단 중의 모든 개체 사이에서, 또는 시험 개체 세트와 참조 개체 세트 사이에서 확인될 수 있다. 일부 실시양태에서, 매칭 하플로타입은 그가 크기 임계값(예컨대, 크기 임계값, 예컨대, 약 100 킬로 염기쌍(kbp), 약 200 kbp, 약 300 kbp, 약 400 kbp, 약 500 kbp, 약 600 kbp, 약 700 kbp, 약 800 kbp, 약 900 kbp, 또는 약 1,000 kbp 초과)을 충족시키고거나, 최소 임계값 개수의 유전자 마커(예컨대, 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 또는 약 100개의 별개의 유전자 마커)를 포함할 경우에 확인된다. 매칭 하플로타입의 확인은 GERMLINE 알고리즘(예컨대, -하플로이드 플래그 이용), PLINK 알고리즘, PREST 알고리즘, IBD 검출을 위한 랜덤 프로젝션(RaPID) 알고리즘, IBD 공유 하플로타입 신속 발견(FISHR) 알고리즘, 정련된 직계 동형(IBD) 알고리즘, fastIBD 알고리즘, KING 알고리즘, HaploScore 알고리즘, TRUFFLE 알고리즘, 또는 그의 조합을 사용하여 수행될 수 있다.
일부 실시양태에서, 두 개체 간의 조상 근연도 정도(COR)를 결정하는 방법은 매치 포스트 프로세싱 알고리즘을 사용하여 개 1마리당 2개의 하플로타입(예컨대, A.0, A.1, B.0, 및 B.1)을 비롯한, 개별 개 2마리(예컨대, 개 A 및 개 B) 간의 매칭 하플로타입을 취하고, 이를 이산 게놈 간격으로 나누는 단계를 포함한다.
일부 실시양태에서, 두 개체 간의 조상 근연도 정도(COR)를 결정하는 방법은 각 이산 게놈 간격에 대해 이산 게놈 간격에서 모든 가능한 하플로타입 매치 타입의 상태를 점수화하고, 상기 매치 개수를 계수하는(이를 통해 게놈 간격당 1 또는 2개의 점수를 구하는) 단계를 포함한다. 예를 들어, 매치는 개 1마리 내에서의 "동형접합성" 매치(예컨대 A.0|A.1), 또는 개 2마리에서의 하플로타입 간의 "쌍별" 매치(예컨대 A.0|B.1)를 포함할 수 있다. 일부 실시양태에서, 이산 게놈 간격은 (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 및 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 점수화되고, 이로써, 복수의 동형접합성 매칭 점수 및 복수의 쌍별 매칭 점수가 생성된다.
일부 실시양태에서, 두 개체 간의 조상 근연도 정도(COR)를 결정하는 방법은 상응하는 동형접합성 매칭 점수와의 주어진 쌍별 매칭 점수의 일관성에 기초하여 복수의 쌍별 매칭 점수를 보정하여 복수의 보정된 쌍별 매칭 점수를 생성하는 단계를 포함한다. 예를 들어, 동형접합성 매치를 사용하여 일관되지 않거나, 또는 불가능한 개수의 쌍별 매치로 이산 게놈 간격의 점수화를 "보정" 또는 조정할 수 있다. 하플로타입 단계의 고유한 불확실성 때문에, 개 내에서의 하플로타입 매치는 개 2마리 간의 하플로타입 매치보다 진정한 IBD를 나타낼 가능성이 더 높을 수 있다. 따라서, WOOPHS는 동형접합성 매치를 사용하여 일관되지 않거나, 또는 불가능한 개수의 쌍별 매치로 이산 게놈 간격을 "보정"할 수 있다. 예를 들어, 진정한 매치는 제한된 개수의 방식으로만 이루어질 수 있다. 예를 들어, 한 쌍의 개(A와 B) 중 1마리 및 단 1마리의 개가 동형접합성인 경우(예컨대, A.0 = A.1), 이때는 오직 2 또는 4개의 쌍별 매치(예컨대, {A.0 = A.1 = B.0, 또는 A.0 = A.1 = B.1}; 또는 {A.0 = A.1 = B.0 = B.1})만이 존재할 수 있다. 이러한 보정은 모든 이산 간격의 점수화를 가능한 상태와 일관되도록 보정함으로써 수행될 수 있다.
일부 실시양태에서, 두 개체 간의 조상 근연도 정도(COR)를 결정하는 방법은 두 이배체 개체에서의 두 대립유전자에 대한 복수의 일치 상태에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계, 및 게놈 간격 점수의 가중 합을 계산하여 COR 및/또는 COK를 구하는 단계를 포함한다. 예를 들어, 가중치는 (예컨대, 근연도 계수(COR) 및/또는 친족관계 계수 (COK))에 대한) 근연도 및/또는 친족관계에의 그의 부분적 기여도에 대한 각 이산 게놈 간격에 대하여 결정될 수 있다. 이는 예를 들어, 문헌 [Hedrick and Lacy, J. Hered ., "Measuring relatedness between inbred individuals," 2015 Jan-Feb, 106(1): 20-5](상기 문헌은 그 전문이 본원에서 참조로 포함된다)에 의해 기술된 접근법에 따라 수행될 수 있다. 예를 들어, 복수의 일치 상태는 표 1로부터 선택되는 일치 상태를 포함할 수 있고, 복수의 가중치는 표 1에 열거된 복수의 근연도 r xy 에의 기여도에 기초하여 할당될 수 있다. 일부 실시양태에서, 조상 근연도 정도는 근연도 계수를 포함한다. 예를 들어, 가중 합은 매칭된 세그먼트의 복수의 이산 게놈 간격에 대해 계산될 수 있고, 이로써, 가중 합은
Figure pct00007
로 표현된다. 일부 실시양태에서, 조상 근연도 정도는 친족관계 계수를 포함한다. 예를 들어, 가중 합은 매칭된 세그먼트의 복수의 이산 게놈 간격에 대해 계산될 수 있고, 이로써, 가중 합은
Figure pct00008
로 표현된다.
Figure pct00009
요약하면, 두 개체 간의 조상 근연도 정도(COR)를 결정하는 방법은 페이징된 데이터로부터 IBD 트랙을 확인하는 단계, 관측된 쌍별 하플로타입 매치 계수에 기초하여 이산 게놈 간격을 점수화하는 단계, 이산 게놈 간격에서의 동형접합성 상태에 기초하여 쌍별 매치 계수 보정을 수행하는 단계, 가중치를 이산 트랙에 할당하는 단계, 및 가중 합을 계산하여 관계 계수 및/또는 친족관계 계수 점수를 구하는 단계를 포함할 수 있다.
컴퓨터 시스템
본 개시내용은 본 개시내용의 방법을 구현하도록 프로그래밍된 컴퓨터 시스템을 제공한다. 도 2는 예를 들어, 시험 개체 집단에 대한 하플로타입 데이터를 수신하고(예컨대, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함한다); 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누고; 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하고(예컨대, 여기서, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함한다); 매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누고; (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 이산 게놈 간격을 점수화하여 복수의 점수를 생성하고; 복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하고; (예컨대, 이산 게놈 간격의 복수의 보정된 점수에 기초하여) 복수의 가중치를 복수의 이산 게놈 간격에 할당하고; (예컨대, 복수의 보정된 점수 및 복수의 가중치에 기초하여) 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하고; (예컨대, 매칭된 세그먼트의 가중 합에 기초하여) 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하도록 프로그래밍되거나, 또는 다르게는 구성된 컴퓨터 시스템(201)을 보여주는 것이다. 컴퓨터 시스템(201)은 본 개시내용의 분석, 계산 및 생성의 다양한 측면, 예컨대, 예를 들어, 시험 개체 집단에 대한 하플로타입 데이터를 수신하는 단계(예컨대, 여기서, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함한다); 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계; 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계(예컨대, 여기서, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함한다); 매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누는 단계; (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 이산 게놈 간격을 점수화하여 복수의 점수를 생성하는 단계; 복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하는 단계; (예컨대, 이산 게놈 간격의 복수의 보정된 점수에 기초하여) 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계; (예컨대, 복수의 보정된 점수 및 복수의 가중치에 기초하여) 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계; 및 (예컨대, 매칭된 세그먼트의 가중 합에 기초하여) 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계를 조절할 수 있다. 컴퓨터 시스템(201)은 사용자의 전자 장치이거나, 또는 전자 장치에 대해 원격으로 위치한 컴퓨터 시스템일 수 있다. 전자 장치는 모바일 전자 장치일 수 있다.
컴퓨터 시스템(201)은 단일 코어 또는 다중 코어 프로세서, 또는 병렬 프로세싱을 위한 복수의 프로세서일 수 있는 중앙 처리 장치(CPU(central processing unit), 본원에서는 또한 "프로세서" 및 "컴퓨터 프로세서")(205)를 포함한다. 컴퓨터 시스템(201)은 또한 메모리 또는 메모리 위치(210)(예컨대, 랜덤 액세스 메모리, 읽기 전용 메모리, 플래시 메모리), 전자 저장 장치(215)(예컨대, 하드 디스크), 하나 이상의 다른 시스템과의 통신을 위한 통신 인터페이스(220)(예컨대, 네트워크 어댑터), 및 주변 장치(225), 예컨대, 캐시, 다른 메모리, 데이터 저장 및/또는 전자 디스플레이 어댑터를 포함한다. 메모리(210), 저장 장치(215), 인터페이스(220) 및 주변 장치(225)는 예컨대, 마더보드와 같은, 통신 버스(실선)를 통해 CPU(205)와 통신한다. 저장 장치(215)는 데이터를 저장하기 위한 데이터 저장 장치(또는 데이터 저장소)일 수 있다. 컴퓨터 시스템(201)은 통신 인터페이스(220)의 도움으로 컴퓨터 네트워크("네트워크")(230)에 작동적으로 커플링될 수 있다. 네트워크(230)는 인터넷, 인터넷 및/또는 엑스트라넷, 또는 인터넷과 통신하는 인트라넷 및/또는 엑스트라넷일 수 있다. 네트워크(230)은 일부 경우에 전기통신 및/또는 데이터 네트워크이다. 네트워크(230)는 하나 이상의 컴퓨터 서버를 포함할 수 있으며, 이는 예컨대, 클라우드 컴퓨팅과 같은 분산 컴퓨팅을 가능하게 할 수 있다. 예를 들어, 하나 이상의 컴퓨터 서버는 네트워크(230)("클라우드")를 통한 클라우드 컴퓨팅이 예컨대, 예를 들어, 본 개시내용의 분석, 계산 및 생성의 다양한 측면, 예컨대, 예를 들어, 시험 개체 집단에 대한 하플로타입 데이터를 수신하는 단계(예컨대, 여기서, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함한다); 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계; 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계(예컨대, 여기서, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함한다); 매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누는 단계; (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 이산 게놈 간격을 점수화하여 복수의 점수를 생성하는 단계; 복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하는 단계; (예컨대, 이산 게놈 간격의 복수의 보정된 점수에 기초하여) 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계; (예컨대, 복수의 보정된 점수 및 복수의 가중치에 기초하여) 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계; 및 (예컨대, 매칭된 세그먼트의 가중 합에 기초하여) 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계를 수행할 수 있게 할 수 있다. 상기 클라우드 컴퓨팅은 예컨대, 예를 들어, 아마존 웹 서비스(AWS: Amazon Web Services), 마이크로소프트 애저(Microsoft Azure), 구글 클라우드 플랫폼(Google Cloud Platform), 및 IBM 클라우드와 같은 클라우드 컴퓨팅 플랫폼에 의해 제공될 수 있다. 네트워크(230)는 컴퓨터 시스템(201)의 도움으로 일부 경우에 피어-투-피어(peer-to-peer) 네트워크를 실시할 수 있고, 이는 컴퓨터 시스템(201)에 커플링된 장치가 클라이언트 또는 서버로서 거동하도록 만들 수 있다.
CPU(205)는 기계 판독가능 명령 순서를 실행할 수 있고, 이는 프로그램 또는 소프트웨어에서 구현될 수 있다. 명령은 메모리 위치, 예컨대, 메모리(210)에 저장될 수 있다. 명령은 CPU(205)에 전송될 수 있고, 이는 이어서 본 개시내용의 방법을 구현하도록 CPU(205)를 프로그래밍하거나, 또는 다르게는 구성할 수 있다. CPU(205)에 의해 실행되는 연산의 예로는 호출, 해독, 실행, 및 라이트백을 포함할 수 있다.
CPU(205)는 회로, 예컨대, 집적 회로의 일부일 수 있다. 시스템(201)의 하나 이상의 다른 구성성분은 회로 내에 포함될 수 있다. 일부 경우에, 회로는 주문형 집적 회로(ASIC: application specific integrated circuit)이다.
저장 장치(215)는 파일, 예컨대, 드라이버, 라이브러리 및 저장된 프로그램을 저장할 수 있다. 저장 장치(215)는 사용자 데이터, 예컨대, 사용자 선호도 및 사용자 프로그램을 저장할 수 있다. 컴퓨터 시스템(201)은 일부 경우에 인트라넷 또는 인터넷을 통해 컴퓨터 시스템(201)과 통신하는 원격 서버에 위치한 바와 같은 컴퓨터 시스템(201)에 외부에 있는 하나 이상의 추가의 데이터 저장 장치를 포함할 수 있다.
컴퓨터 시스템(201)은 네트워크(230)를 통한 하나 이상의 원격 컴퓨터 시스템과 통신할 수 있다. 예를 들어, 컴퓨터 시스템(201)은 사용자(예컨대, 애완동물 소유자, 사육장 소유자, 수의사, 사육자, 동물 보호소 직원, 의사, 간호사, 보호자, 환자 또는 피험체)의 원격 컴퓨터 시스템과 통신할 수 있다. 원격 컴퓨터 시스템의 예는 개인용 컴퓨터(예컨대, 휴대용 PC), 슬레이트 또는 태블릿 PC(예컨대, Apple® iPad, Samsung® Galaxy Tab), 휴대폰, 스마트폰(예컨대, Apple® iPhone, Android 지원 장치, Blackberry®), 또는 개인용 정보 단말기를 포함한다. 사용자는 네트워크(230)를 통해 컴퓨터 시스템(201)에 접근할 수 있다.
본원에 기술된 바와 같은 방법은 예컨대, 예를 들어, 메모리(210) 또는 전자 저장 장치(215)에 대한 컴퓨터 시스템(201)의 전자 저장 위치 상에 저장된 기계(예컨대, 컴퓨터 프로세서) 실행가능 코드의 방식에 의해 구현될 수 있다. 기계 실행가능 또는 기계 판독가능 코드는 소프트웨어 형태로 제공될 수 있다. 사용 동안, 코드는 프로세서(205)에 의해 실행될 수 있다. 일부 경우에, 코드는 저장 장치(215)로부터 검색될 수 있고, 프로세서(205)에 의한 레디 액세스 메모리(210)에 저장될 수 있다. 일부 상황에서, 전자 저장 장치(215)는 배제될 수 있고, 기계 실행가능 명령은 메모리(210)에 저장된다.
코드는 미리 컴파일링되고, 코드를 실행하도록 개조된 프로세서가 있는 기계와 함께 사용하도록 구성될 수 있거나, 실행 시간 동안 컴파일링될 수 있다. 코드는 미리 컴파일링되거나, 또는 실시간으로 컴파일링되는 방식으로 코드가 실행되도록 선택될 수 있는 프로그래밍 언어로 공급될 수 있다.
본원에 제공된 시스템 및 방법, 예컨대, 컴퓨터 시스템(201)의 측면은, 프로그래밍으로 구현될 수 있다. 기술의 다양한 측면은 전형적으로 기계 판독가능 매체 타입으로 보유되거나, 또는 구현되는 기계(또는 프로세서) 실행가능 코드 및/또는 연관된 데이터 형태의 "생산품" 또는 "제조물품"으로서 간주될 수 있다. 기계 실행가능 코드는 전자 저장 장치, 예컨대, 메모리(예컨대, 읽기 전용 메모리, 랜덤 액세스 메모리, 플래시 메모리) 또는 하드 디스크에 저장될 수 있다. "저장" 타입 매체는 컴퓨터, 프로세서 등의 임의의 또는 모든 유형 메모리, 또는 그의 연관된 모듈, 예컨대, 다양한 반도체 메모리, 테이프 드라이브, 디스크 드라이브 등을 포함할 수 있으며, 이는 소프트웨어 프로그래밍을 위해 언제든지 비일시적 저장을 제공할 수 있다. 소프트웨어 모두 또는 그 일부는 때때로 인터넷 또는 다양한 다른 전기통신 네트워크를 통해 통신될 수 있다. 상기 통신은, 예를 들어, 하나의 컴퓨터 또는 프로세서로부터 또 다른 것으로, 예를 들어, 관리 서버 또는 호스트 컴퓨터로부터 어플리케이션 서버의 컴퓨터 플랫폼으로 소프트웨어의 로딩을 가능하게 할 수 있다. 따라서, 소프트웨어 요소를 보유할 수 있는 또 다른 타입의 매체는 예컨대, 유선 및 광지상선 네트워크 및 다양한 공중 연결을 통해 로컬 장치 간의 물리적 인터페이스에 걸쳐 사용되는 광학, 전기 및 전자기파를 포함한다. 이러한 파를 보유한 물리적 요소, 예컨대, 유선 또는 무선 회선, 광회선 등은 또한 소프트웨어를 보유한 매체로서 간주될 수 있다. 본원에서 사용되는 바, 비일시적, 유형의 "저장" 매체로 제한되지 않는 한, 예컨대, 컴퓨터 또는 기계 "판독가능 매체"와 같은 용어는 실행을 위해 프로세서에 명령어를 제공하는 데 참여하는 임의의 매체를 지칭한다.
그러므로, 기계 판독가능 매체, 예컨대, 컴퓨터 실행가능 코드는 유형 저장 매체, 반송파 매체, 또는 물리 전송 매체를 포함하나, 이에 제한되지 않는 많은 형태를 취할 수 있다. 비휘발성 저장 매체는, 예를 들어, 광학 또는 자기 디스크, 예컨대, 임의의 컴퓨터(들)의 임의의 저장 장치 등, 예컨대, 도면에 제시된 데이터베이스를 실행하는 데 사용될 수 있는 것 등을 포함한다. 휘발성 저장 매체는 동적 메모리, 예컨대, 이러한 컴퓨터 플랫폼의 메인 메모리를 포함한다. 유형 전송 매체는 동축 케이블; 동선 및 광학 섬유를 포함하고, 이는 컴퓨터 시스템 내에 버스를 포함하는 선을 포함한다. 반송파 전송 매체는 전기 또는 전자기 신호, 또는 음향 또는 광파의 형태, 예컨대, 라디오 주파수(RF: radio frequency) 및 적외선(IR) 데이터 통신 동안 생성된 형태를 가질 수 있다. 그러므로, 컴퓨터 판독가능 매체의 일반적인 형태로는 예를 들어, 플로피 디스크, 플렉시블 디스크, 하드 디스크, 자기 테이프, 임의의 다른 자기 매체, CD-ROM, DVD 또는 DVD-ROM, 임의의 다른 광학 매체, 펀치 카드 종이 테이프, 구멍 패턴이 있는 임의의 다른 물리적 저장 매체, RAM, ROM, PROM 및 EPROM, FLASH-EPROM, 임의의 다른 메모리 칩 또는 카트리지, 반송파 전송 데이터 또는 명령어, 케이블 또는 회선 전송, 예컨대, 반송파, 또는 이로부터 컴퓨터가 프로그래밍 코드 및/또는 데이터를 판독할 수 있는 임의의 다른 매체를 포함한다. 이러한 형태의 컴퓨터 판독 가능 매체 중 다수는 실행을 위하여 하나 이상의 명령어의 하나 이상의 시퀀스를 프로세서로 전달하는 데 관여할 수 있다.
컴퓨터 시스템(201)은 예를 들어, 하플로타입 데이터, 유전자 마커, 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 매칭된 세그먼트, 이산 게놈 간격의 점수, 이산 게놈 간격의 보정된 점수, 계산된, 복수의 이산 게놈 간격에 대한 가중 합, 및 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도를 제공하기 위한 사용자 인터페이스(UI: user interface)(240)를 포함하는 전자 디스플레이(235)를 포함하거나, 또는 그와 통신될 수 있다. UI의 예로는, 제한 없이, 그래픽 사용자 인터페이스(GUI: graphical user interface) 및 웹 기반 사용자 인터페이스를 포함한다.
본 개시내용의 방법 및 시스템은 하나 이상의 알고리즘에 의해 구현될 수 있다. 알고리즘은 중앙 처리 장치(205)에 의한 실행시 소프트웨어에 의해 구현될 수 있다. 알고리즘은 예를 들어, 예를 들어, 시험 개체 집단에 대한 하플로타입 데이터를 수신할 수 있고(예컨대, 여기서, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함한다); 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나눌 수 있고; 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭할 수 있고(예컨대, 여기서, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함한다); 매칭된 세그먼트를 복수의 이산 게놈 간격으로 나눌 수 있고; (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 이산 게놈 간격을 점수화하여 복수의 점수를 생성할 수 있고; 복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성할 수 있고; (예컨대, 이산 게놈 간격의 복수의 보정된 점수에 기초하여) 복수의 가중치를 복수의 이산 게놈 간격에 할당할 수 있고; (예컨대, 복수의 보정된 점수 및 복수의 가중치에 기초하여) 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산할 수 있고; (예컨대, 매칭된 세그먼트의 가중 합에 기초하여) 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정할 수 있다. 컴퓨터 시스템(201)은 본 개시내용의 분석, 계산 및 생성의 다양한 측면, 예컨대, 예를 들어, 시험 개체 집단에 대한 하플로타입 데이터를 수신하는 단계(예컨대, 여기서, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함한다); 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계; 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계(예컨대, 여기서, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함한다); 매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누는 단계; (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 이산 게놈 간격을 점수화하여 복수의 점수를 생성하는 단계; 복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하는 단계; (예컨대, 이산 게놈 간격의 복수의 보정된 점수에 기초하여) 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계; (예컨대, 복수의 보정된 점수 및 복수의 가중치에 기초하여) 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계; 및 (예컨대, 매칭된 세그먼트의 가중 합에 기초하여) 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계를 조절할 수 있다.
실시예
실시예 1: 근연도 또는 친족관계 정도를 평가하기 위한 WOOPHS 알고리즘
본 개시내용의 방법 및 시스템을 사용하여, 개체(예컨대, 개) 간의 근연도 또는 친족관계 정도를 평가하기 위해 쌍별 하플로타입 공유의 가중 관측값(WOOPHS) 알고리즘을 수행한다. 먼저, 개체로부터 쌍별 및 동형접합성 매치 어레이를 생성하기 위해 GERMLINE을 사용하여 개체 집단으로부터의 유전자형 데이터를 프로세싱한다. 이어서, 주어진 개체 쌍에 대하여, WOOPHS 알고리즘을 하기와 같이 진행한다. 매치 간격(매치_어레이)을 염색체, 출발 위치, 및 종료 위치에 의해 정렬한다. 이어서, 0으로 필링된 어레이(ibd _점수)가 생성되고, 이를 초기화하여 이산 게놈 간격에 쌍별 계수 및 동형접합성 계수를 저장한다. 이어서, 빈 목록(선행_간격)이 생성되고, 이를 초기화하여 폐기될 때까지, 모든 이산 게놈 간격을 저장한다. 이어서, 모든 염색체에 대해: (a) 이산 간격 브레이크(간격_브레이크)로 표시되는 염색체 상의 모든 위치에 대한 정렬된 어레이가 생성되고, 데이터베이스에 저장되고; (b) 염색체 상의 매치_어레이에 있는 모든 행(매치_행)에 대해: 이전 행에서 이미 발생한 임의의 이산 간격에 대한 현재 매치 행을 점수화하고, 완전히 초과된 임의의 이전 간격은 메모리에서 삭제되고, 매치_어레이에 새 이산 간격이 생성되고, 저장되고, 새 간격이 선행_간격에 저장된다.
(매치 타입 및 가중치에 기초한) 점수화 및 계수 보정/조정은 하기와 같이 수행한다. 매칭된 이산 게놈 간격의 초기 점수화는 경험적인 것이다. WOOPHS 알고리즘이 염색체 상의 이산 게놈 간격에 걸쳐 진행됨에 따라, 개체 간의 쌍별 매치수(0, 1, 2, 3 또는 4) 또는 각 개체 내의 동형접합성 매치수(0 또는 1)가 증분식으로 기록된다. 그러나, 실제로는 동형접합성 및 쌍별 매치의 합법적인 조합수는 제한되어 있다. 모든 매치가 GERMLINE에 의해 반드시 기록되는 것은 아니기 때문에, ((Hedrick and Lacy)로부터 재현된, 표 1에서 상기 가능한 계수 구성의 요약에서 제시된 바와 같이) 사용된 특정 플래그에 따라, WOOPHS 알고리즘은 관측된 계수를 조정하여 합법적인 계수 구성과 매칭시킨다. 상기 표에서 9개의 상태 중 오직 5개만이 근연도 및 친족관계에 기여하고, 2개(상태 3 및 5)는 가중치 할당의 관점에서 동일하므로 추가로 압축될 수 있다. 나머지 상태는 근연도 또는 친족관계 계산에 가중치가 기여하지 않기 때문에 무시될 수 있다(예컨대, 가중치 0 할당).
따라서, WOOPHS는 하기 4개의 매치 계수 상태 구성으로 작동한다:
(1) 상태 1 = {쌍별 = 4, 동형접합성 = 2}
(2) 상태 3 = {쌍별 = 2, 동형접합성 = 1}
(3) 상태 7 = {쌍별 = 2, 동형접합성 = 0}
(4) 상태 8 = {쌍별 = 1, 동형접합성 = 0}.
이어서, WOOPHS 알고리즘은 하기와 같이 무효 매치 계수 상태 구성에서 쌍별 매치 계수를 조정하는 단계를 포함한다:
{쌍별 = 3, 동형접합성 = 1} 관측값은 {쌍별 = 2, 동형접합성 = 1}(상태 3)으로 보정된다.
{쌍별 = 3, 동형접합성 = 0} 관측값은 {쌍별 = 1, 동형접합성 = 0(상태 8)으로 보정된다.
{쌍별 = 4, 동형접합성 = 0 또는 1} 관측값은 {쌍별 = 2(동형접합성 = 0일 경우, 상태 8; 동형접합성 = 1일 경우, 상태 7)로 보정된다.
{쌍별 = 2, 동형접합성 = 2} 관측값은 {쌍별 = 4}(상태 1)로 보정된다.
{쌍별 = 1, 동형접합성 = 1 또 2} 관측값은 {쌍별 = 2(동형접합성 = 1일 경우, 상태 3; 동형접합성 = 2일 경우, 무시)로 보정된다.
{쌍별 = 3, 동형접합성 = 2} 관측값은 {쌍별 = 4(상태 1)로 보정된다.
매칭된 이산 게놈 간격을 점수화하고, 보정한 후, 관계 계수(COR) 및/또는 친족관계 계수(COK)를 하기와 같이 계산한다. 쌍별 매치 계수 상태 보정 후, 표 1에 제시된 바와 같이, 모든 트랙에 근연도 및 친족관계에 대한 그의 기여도에 대하여 가중치를 할당한다. 마지막으로, 근연도 및 친족관계를 하기와 같이 계산한다. Δi는 4개의 매치 계수 중 하나인 i에 할당된 게놈 길이의 총합을 나타내는 것으로 한다. 이어서, 근연도 r xy 및 친족관계 k xy 를 하기 식으로부터 계산할 수 있다:
Figure pct00010
Figure pct00011
여기서, L은 고려되는 게놈의 총 길이이다.
일부 실시양태에서, 개체 집단으로부터 수집된 유전자형 데이터 및/또는 하플로타입 데이터는 향후 검색을 위해 데이터베이스에 저장될 수 있다. 이어서, 시험 개체로부터 샘플을 수집할 수 있고, 이어서, 시험 개체에 대한 유전자형 데이터 및 하플로타입 데이터를 생성할 수 있다. 이어서, WOOPHS 알고리즘을 실행하여 시험 개체와 개체 집단을 이루어는 하나 이상의 각각의 개체 사이의 근연도 또는 친족관계 정도를 생성할 수 있다. 마지막으로, 데이터베이스를 검색하여 미리 결정된 임계값을 초과하는 근연도 또는 친족관계 정도를 갖는 개체 집단의 서브세트를 검색할 수 있다. 이러한 관련된 개체의 서브세트는 시험 개체와의 근연도 또는 친족관계 정도에 기초하여 정렬 또는 순위화될 수 있다.
본 발명의 바람직한 실시양태는 본원에 제시되고, 기술되었지만, 상기 실시양태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 본 발명이 명세서 내에 제공된 구체적인 예에 의해 제한되는 것으로 의도되지 않는다. 본 발명이 상기 언급된 명세서를 참조하여 설명되었지만, 본원의 실시양태의 설명 및 예시는 제한적인 의미로 해석되어서는 안 된다. 이제 당업자는 본 발명으로부터 벗어남 없이 다수의 변형, 변경 및 치환을 착안해낼 것이다. 추가로, 본 발명의 모든 측면은 다양한 조건 및 변수에 의존하는 본원에 기술된 구체적인 묘사, 구성 또는 상대적 비율로 제한되지 않는다는 것을 이해해야 한다. 본원에 기술된 본 발명의 실시양태에 대한 다양한 대안이 본 발명을 실시하는 데 이용될 수 있다는 것을 이해하여야 한다. 따라서, 본 발명은 그러한 대안, 수정, 변형 또는 등가물도 또한 포함하는 것으로 고려된다. 하기 청구범위는 본 발명의 범주를 정의하고, 이러한 청구범위 및 그의 등가물의 범주 내의 방법 및 구조는 그에 의해 포함되는 것으로 의도된다.

Claims (129)

  1. 이배체 집단의 두 개체 간의 조상 근연도 정도(degree of ancestral relatedness)를 추정하기 위한 컴퓨터 구현 방법으로서,
    (a) 시험 개체 집단에 대한 하플로타입 데이터(haplotype data)를 수신하는 단계로서, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함하는 것인 단계;
    (b) 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계;
    (c) 각 시험 개체 집단에 대해:
    (i) 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형(identical-by-descent)인 하플로타입 데이터의 세그먼트를 매칭하는 단계로서, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함하는 것인 단계;
    (ii) 제1 개체와 제2 개체 간의 각각의 매칭된 세그먼트에 대해:
    매칭된 세그먼트를 복수의 이산 게놈 간격(discrete genomic interval)으로 나누는 단계;
    (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 점수를 생성하는 단계;
    복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하는 단계; 및
    이산 게놈 간격의 복수의 보정된 점수에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계; 및
    (iii) 복수의 보정된 점수 및 복수의 가중치에 기초하여 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계; 및
    (d) 매칭된 세그먼트의 가중 합에 기초하여 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계
    를 포함하는, 이배체 집단의 두 개체 간의 조상 근연도 정도를 추정하기 위한 컴퓨터 구현 방법.
  2. 제1항에 있어서, 이배체 집단이 포유동물 집단인 방법.
  3. 제2항에 있어서, 포유동물 집단이 개과 집단인 방법.
  4. 제3항에 있어서, 개과 집단이 개 집단인 방법.
  5. 제1항에 있어서, 하플로타입 데이터가 하플로타입 페이징 알고리즘을 사용하여 시험 개체 집단의 유전자형 데이터를 프로세싱함으로써 생성되는 것인 방법.
  6. 제5항에 있어서, 하플로타입 페이징 알고리즘이 참조 기반 하플로타입 페이징 알고리즘을 포함하는 것인 방법.
  7. 제6항에 있어서, 참조 기반 하플로타입 페이징 알고리즘이 은닉 마르코프 모형(HMM) 기반 검색을 포함하는 것인 방법.
  8. 제7항에 있어서, 참조 기반 하플로타입 페이징 알고리즘이 Eagle1 알고리즘, Eagle2 알고리즘, PHASE 알고리즘, fastPHASE 알고리즘, BEAGLE 알고리즘, Findhap 알고리즘, Impute 알고리즘, FImpute 알고리즘, AlphaImpute 알고리즘, IMPUTE2 알고리즘, MaCH 알고리즘, SHAPEIT1 알고리즘, SHAPEIT2 알고리즘, SHAPEIT3 알고리즘, SHAPEIT4 알고리즘, 또는 그의 조합을 포함하는 것인 방법.
  9. 제5항에 있어서, 하플로타입 페이징 알고리즘이 코호트 기반 하플로타입 페이징 알고리즘을 포함하는 것인 방법.
  10. 제5항에 있어서, 유전자형 데이터가 시험 개체 집단으로부터 수득된 생물학적 샘플을 검정함으로써 수득되는 것인 방법.
  11. 제10항에 있어서, 생물학적 샘플이 혈액 샘플, 타액 샘플, 스왑 샘플, 세포 샘플, 또는 조직 샘플을 포함하는 것인 방법.
  12. 제10항에 있어서, 검정이 생물학적 샘플 또는 그의 유도체를 시퀀싱하는 것을 포함하는 것인 방법.
  13. 제1항에 있어서, 복수의 유전자 마커가 적어도 약 500, 적어도 약 1,000, 적어도 약 2,000, 적어도 약 3,000, 적어도 약 4,000, 적어도 약 5,000, 적어도 약 6,000, 적어도 약 7,000, 적어도 약 8,000, 적어도 약 9,000, 또는 적어도 약 10,000개의 별개의 유전자 마커를 포함하는 것인 방법.
  14. 제1항에 있어서, 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계가 GERMLINE 알고리즘, PLINK 알고리즘, PREST 알고리즘, IBD 검출을 위한 랜덤 프로젝션(RaPID: Random Projection for IBD Detection) 알고리즘, IBD 공유 하플로타입 신속 발견(FISHR: Find IBD Shared Haplotypes Rapidly) 알고리즘, 정련된 직계 동형(IBD) 알고리즘, fastIBD 알고리즘, KING 알고리즘, HaploScore 알고리즘, TRUFFLE 알고리즘, 또는 그의 조합을 사용하는 것을 포함하는 것인 방법.
  15. 제1항에 있어서, 미리 결정된 임계값 크기가 약 100 킬로 염기쌍(kbp), 약 200 kbp, 약 300 kbp, 약 400 kbp, 약 500 kbp, 약 600 kbp, 약 700 kbp, 약 800 kbp, 약 900 kbp, 또는 약 1,000 kbp인 방법.
  16. 제1항에 있어서, 유전자 마커의 미리 결정된 개수가 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 또는 약 100개의 별개의 유전자 마커인 방법.
  17. 제1항에 있어서, 복수의 이산 게놈 간격의 이산 게놈 간격이 동일한 크기를 갖도록 매칭된 세그먼트를 나누는 단계를 추가로 포함하는 방법.
  18. 제1항에 있어서, 복수의 이산 게놈 간격의 이산 게놈 간격이 가변 크기를 갖도록 매칭된 세그먼트를 나누는 단계를 추가로 포함하는 방법.
  19. 제18항에 있어서, 복수의 이산 게놈 간격의 주어진 이산 게놈 간격의 가변 크기가 적어도 부분적으로는 주어진 이산 게놈 간격에 근접한 IBD 매치의 시작 위치 및 종료 위치, 주어진 이산 게놈 간격에서 유전자 마커의 밀도, 주어진 이산 게놈 간격에 대한 마커의 최대 개수, 주어진 이산 게놈 간격의 최대 길이, 또는 그의 조합에 기초하여 결정되는 것인 방법.
  20. 제1항에 있어서, (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 및 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 동형접합성 매칭 점수 및 복수의 쌍별 매칭 점수를 생성하는 단계를 추가로 포함하는 방법.
  21. 제20항에 있어서, 상응하는 동형접합성 매칭 점수와의 주어진 쌍별 매칭 점수의 일관성에 기초하여 복수의 쌍별 매칭 점수를 보정하여 복수의 보정된 쌍별 매칭 점수를 생성하는 단계를 추가로 포함하는 방법.
  22. 제20항에 있어서, 두 이배체 개체에서의 두 대립유전자에 대한 복수의 일치 상태에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계를 추가로 포함하는 방법.
  23. 제22항에 있어서, 복수의 일치 상태가 표 1로부터 선택되는 일치 상태를 포함하고, 여기서, 복수의 가중치는 표 1에 열거된 복수의 근연도 r xy 에의 기여도에 기초하여 할당되는 것인 방법.
  24. 제23항에 있어서, 조상 근연도 정도가 근연도 계수를 포함하는 것인 방법.
  25. 제24항에 있어서, 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계를 추가로 포함하고, 여기서, 가중 합은
    Figure pct00012
    로 표현되는 것인 방법.
  26. 제23항에 있어서, 조상 근연도 정도가 친족관계 계수를 포함하는 것인 방법.
  27. 제26항에 있어서, 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계를 추가로 포함하고, 여기서, 가중 합은
    Figure pct00013
    로 표현되는 것인 방법.
  28. 제1항에 있어서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계가 제1 개체 또는 제2 개체의 근친교배 정도를 결정하는 것을 포함하는 것인 방법.
  29. 제1항에 있어서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계가 제1 개체 및 제2 개체의 근친교배 정도를 결정하는 것을 포함하는 것인 방법.
  30. 제29항에 있어서, 적어도 부분적으로는 제1 개체 및 제2 개체의 근친교배 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 결정하는 단계를 추가로 포함하는 방법.
  31. 제30항에 있어서, 가족 관계가 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 또는 조부모-손자 관계인 방법.
  32. 제28항 또는 제29항에 있어서, 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도를 결정하는 단계를 추가로 포함하는 방법.
  33. 제32항에 있어서, 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도에 기초하여 제1 개체 및 제2 개체를 함께 교배시킬지 여부를 나타내는 권장 사항을 결정하는 단계를 추가로 포함하는 방법.
  34. 제33항에 있어서, 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하지 않는 경우, 제1 개체 및 제2 개체를 함께 교배시키는 것을 나타내는 권장 사항을 결정하는 단계를 추가로 포함하는 방법.
  35. 제33항에 있어서, 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하는 경우, 제1 개체 및 제2 개체를 함께 교배시키지 않는 것을 나타내는 권장 사항을 결정하는 단계를 추가로 포함하는 방법.
  36. 제34항 또는 제35항에 있어서, 미리 결정된 근친교배 정도 임계값이 약 0.10, 약 0.15, 약 0.20, 약 0.25, 약 0.30, 약 0.35, 약 0.40, 약 0.45, 또는 약 0.50인 방법.
  37. 제1항에 있어서, 적어도 부분적으로는 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도에 기초하여 제1 개체와 연관된 제1인과 제2 개체와 연관된 제2인 사이의 사회적 관계를 생성하는 단계를 추가로 포함하는 방법.
  38. 제37항에 있어서, 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도가 미리 결정된 임계값을 초과하는 경우, 사회적 관계가 생성되는 것인 방법.
  39. 제38항에 있어서, 미리 결정된 임계값이 약 0.00001, 약 0.0001, 약 0.001, 약 0.01, 약 0.02, 약 0.04, 약 0.06, 약 0.08, 약 0.1, 약 0.12, 약 0.14, 약 0.16, 약 0.18, 약 0.2, 약 0.25, 약 0.3, 약 0.35, 약 0.4, 약 0.45, 또는 약 0.5인 방법.
  40. 제37항에 있어서, 사회적 관계가 소셜 미디어 네트워크를 통해 생성되는 것인 방법.
  41. 제37항에 있어서, 제1인이 제1 개체의 애완동물 소유자이고, 여기서, 제2인이 제2 개체의 애완동물 소유자인 방법.
  42. 제1항에 있어서, 적어도 부분적으로는 조상 근연도 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 확인하는 단계를 추가로 포함하는 방법.
  43. 제42항에 있어서, 가족 관계가 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 또는 조부모-손자 관계인 방법.
  44. 하플로타입 데이터가 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함하는 것인, 시험 개체 집단에 대한 하플로타입 데이터를 저장하도록 구성된 데이터베이스; 및
    데이터베이스에 작동하도록 연결된 하나 이상의 컴퓨터 프로세서를 포함하는, 이배체 집단의 두 개체 간의 조상 근연도 정도를 추정하기 위한 컴퓨터 시스템으로서,
    여기서, 하나 이상의 컴퓨터 프로세서는 개별적으로 또는 집단적으로
    (a) 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누고;
    (b) 각 시험 개체 집단에 대해:
    (i) 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하고, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함하는 것이고;
    (ii) 제1 개체와 제2 개체 간의 각각의 매칭된 세그먼트에 대해:
    매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누고;
    (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 점수를 생성하고;
    복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하고;
    이산 게놈 간격의 복수의 보정된 점수에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하고;
    (iii) 복수의 보정된 점수 및 복수의 가중치에 기초하여 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하고;
    (c) 매칭된 세그먼트의 가중 합에 기초하여 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하도록 프로그래밍된 것인 컴퓨터 시스템.
  45. 제44항에 있어서, 이배체 집단이 포유동물 집단인 컴퓨터 시스템.
  46. 제45항에 있어서, 포유동물 집단이 개과 집단인 컴퓨터 시스템.
  47. 제46항에 있어서, 개과 집단이 개 집단인 컴퓨터 시스템.
  48. 제44항에 있어서, 하플로타입 데이터가 하플로타입 페이징 알고리즘을 사용하여 시험 개체 집단의 유전자형 데이터를 프로세싱함으로써 생성되는 것인 컴퓨터 시스템.
  49. 제48항에 있어서, 하플로타입 페이징 알고리즘이 참조 기반 하플로타입 페이징 알고리즘을 포함하는 것인 컴퓨터 시스템.
  50. 제49항에 있어서, 참조 기반 하플로타입 페이징 알고리즘이 은닉 마르코프 모형(HMM) 기반 검색을 포함하는 것인 컴퓨터 시스템.
  51. 제50항에 있어서, 참조 기반 하플로타입 페이징 알고리즘이 Eagle1 알고리즘, Eagle2 알고리즘, PHASE 알고리즘, fastPHASE 알고리즘, BEAGLE 알고리즘, Findhap 알고리즘, Impute 알고리즘, FImpute 알고리즘, AlphaImpute 알고리즘, IMPUTE2 알고리즘, MaCH 알고리즘, SHAPEIT1 알고리즘, SHAPEIT2 알고리즘, SHAPEIT3 알고리즘, SHAPEIT4 알고리즘, 또는 그의 조합을 포함하는 것인 컴퓨터 시스템.
  52. 제48항에 있어서, 하플로타입 페이징 알고리즘이 코호트 기반 하플로타입 페이징 알고리즘을 포함하는 것인 컴퓨터 시스템.
  53. 제48항에 있어서, 유전자형 데이터가 시험 개체 집단으로부터 수득된 생물학적 샘플을 검정함으로써 수득되는 것인 컴퓨터 시스템.
  54. 제53항에 있어서, 생물학적 샘플이 혈액 샘플, 타액 샘플, 스왑 샘플, 세포 샘플, 또는 조직 샘플을 포함하는 것인 컴퓨터 시스템.
  55. 제53항에 있어서, 검정이 생물학적 샘플 또는 그의 유도체를 시퀀싱하는 것을 포함하는 것인 컴퓨터 시스템.
  56. 제44항에 있어서, 복수의 유전자 마커가 적어도 약 500, 적어도 약 1,000, 적어도 약 2,000, 적어도 약 3,000, 적어도 약 4,000, 적어도 약 5,000, 적어도 약 6,000, 적어도 약 7,000, 적어도 약 8,000, 적어도 약 9,000, 또는 적어도 약 10,000개의 별개의 유전자 마커를 포함하는 것인 컴퓨터 시스템.
  57. 제44항에 있어서, 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계가 GERMLINE 알고리즘, PLINK 알고리즘, PREST 알고리즘, IBD 검출을 위한 랜덤 프로젝션(RaPID) 알고리즘, IBD 공유 하플로타입 신속 발견(FISHR) 알고리즘, 정련된 직계 동형(IBD) 알고리즘, fastIBD 알고리즘, KING 알고리즘, HaploScore 알고리즘, TRUFFLE 알고리즘, 또는 그의 조합을 사용하는 것을 포함하는 것인 컴퓨터 시스템.
  58. 제44항에 있어서, 미리 결정된 임계값 크기가 약 100 킬로 염기쌍(kbp), 약 200 kbp, 약 300 kbp, 약 400 kbp, 약 500 kbp, 약 600 kbp, 약 700 kbp, 약 800 kbp, 약 900 kbp, 또는 약 1,000 kbp인 컴퓨터 시스템.
  59. 제44항에 있어서, 유전자 마커의 미리 결정된 개수가 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 또는 약 100개의 별개의 유전자 마커인 컴퓨터 시스템.
  60. 제44항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 복수의 이산 게놈 간격의 이산 게놈 간격이 동일한 크기를 갖도록 매칭된 세그먼트를 나누도록 프로그래밍된 것인 컴퓨터 시스템.
  61. 제44항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 복수의 이산 게놈 간격의 이산 게놈 간격이 가변 크기를 갖도록 매칭된 세그먼트를 나누도록 프로그래밍된 것인 컴퓨터 시스템.
  62. 제61항에 있어서, 복수의 이산 게놈 간격의 주어진 이산 게놈 간격의 가변 크기가 적어도 부분적으로는 주어진 이산 게놈 간격에 근접한 IBD 매치의 시작 위치 및 종료 위치, 주어진 이산 게놈 간격에서 유전자 마커의 밀도, 주어진 이산 게놈 간격에 대한 마커의 최대 개수, 주어진 이산 게놈 간격의 최대 길이, 또는 그의 조합에 기초하여 결정되는 것인 컴퓨터 시스템.
  63. 제44항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 및 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 동형접합성 매칭 점수 및 복수의 쌍별 매칭 점수를 생성하도록 프로그래밍된 것인 컴퓨터 시스템.
  64. 제63항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 상응하는 동형접합성 매칭 점수와의 주어진 쌍별 매칭 점수의 일관성에 기초하여 복수의 쌍별 매칭 점수를 보정하여 복수의 보정된 쌍별 매칭 점수를 생성하도록 프로그래밍된 것인 컴퓨터 시스템.
  65. 제63항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 두 이배체 개체에서의 두 대립유전자에 대한 복수의 일치 상태에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하도록 프로그래밍된 것인 컴퓨터 시스템.
  66. 제65항에 있어서, 복수의 일치 상태가 표 1로부터 선택되는 일치 상태를 포함하고, 여기서, 복수의 가중치는 표 1에 열거된 복수의 근연도 r xy 에의 기여도에 기초하여 할당되는 것인 컴퓨터 시스템.
  67. 제66항에 있어서, 조상 근연도 정도가 근연도 계수를 포함하는 것인 컴퓨터 시스템.
  68. 제67항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하도록 프로그래밍되고, 여기서, 가중 합은
    Figure pct00014
    로 표현되는 것인 컴퓨터 시스템.
  69. 제66항에 있어서, 조상 근연도 정도가 친족관계 계수를 포함하는 것인 컴퓨터 시스템.
  70. 제69항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하도록 프로그래밍되고, 여기서, 가중 합은
    Figure pct00015
    로 표현되는 것인 컴퓨터 시스템.
  71. 제44항에 있어서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 것이 제1 개체 또는 제2 개체의 근친교배 정도를 결정하는 것을 포함하는 것인 컴퓨터 시스템.
  72. 제44항에 있어서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 것이 제1 개체 및 제2 개체의 근친교배 정도를 결정하는 것을 포함하는 것인 컴퓨터 시스템.
  73. 제72항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 적어도 부분적으로는 제1 개체 및 제2 개체의 근친교배 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 결정하도록 프로그래밍된 것인 컴퓨터 시스템.
  74. 제73항에 있어서, 가족 관계가 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 또는 조부모-손자 관계인 컴퓨터 시스템.
  75. 제71항 또는 제72항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도를 결정하도록 프로그래밍된 것인 컴퓨터 시스템.
  76. 제75항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도에 기초하여 제1 개체 및 제2 개체를 함께 교배시킬지 여부를 나타내는 권장 사항을 결정하도록 프로그래밍된 것인 컴퓨터 시스템.
  77. 제76항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하지 않는 경우, 제1 개체 및 제2 개체를 함께 교배시키는 것을 나타내는 권장 사항을 결정하도록 프로그래밍된 것인 컴퓨터 시스템.
  78. 제76항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하는 경우, 제1 개체 및 제2 개체를 함께 교배시키지 않는 것을 나타내는 권장 사항을 결정하도록 프로그래밍된 것인 컴퓨터 시스템.
  79. 제77항 또는 제78항에 있어서, 미리 결정된 근친교배 정도 임계값이 약 0.10, 약 0.15, 약 0.20, 약 0.25, 약 0.30, 약 0.35, 약 0.40, 약 0.45, 또는 약 0.50인 컴퓨터 시스템.
  80. 제44항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 적어도 부분적으로는 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도에 기초하여 제1 개체와 연관된 제1인과 제2 개체와 연관된 제2인 사이의 사회적 관계를 생성하도록 프로그래밍된 것인 컴퓨터 시스템.
  81. 제80항에 있어서, 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도가 미리 결정된 임계값을 초과하는 경우, 사회적 관계가 생성되는 것인 컴퓨터 시스템.
  82. 제81항에 있어서, 미리 결정된 임계값이 약 0.00001, 약 0.0001, 약 0.001, 약 0.01, 약 0.02, 약 0.04, 약 0.06, 약 0.08, 약 0.1, 약 0.12, 약 0.14, 약 0.16, 약 0.18, 약 0.2, 약 0.25, 약 0.3, 약 0.35, 약 0.4, 약 0.45, 또는 약 0.5인 컴퓨터 시스템.
  83. 제80항에 있어서, 사회적 관계가 소셜 미디어 네트워크를 통해 생성되는 것인 컴퓨터 시스템.
  84. 제80항에 있어서, 제1인이 제1 개체의 애완동물 소유자이고, 여기서, 제2인이 제2 개체의 애완동물 소유자인 컴퓨터 시스템.
  85. 제44항에 있어서, 하나 이상의 컴퓨터 프로세서가 개별적으로 또는 집단적으로 추가로 적어도 부분적으로는 조상 근연도 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 확인하도록 프로그래밍된 것인 컴퓨터 시스템.
  86. 제85항에 있어서, 가족 관계가 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 또는 조부모-손자 관계인 컴퓨터 시스템.
  87. 하나 이상의 컴퓨터 프로세서에 의해 실행될 때,
    (a) 시험 개체 집단에 대한 하플로타입 데이터를 수신하는 단계로서, 하플로타입 데이터는 시험 개체 집단 사이에서 공유되는 복수의 유전자 마커를 포함하는 것인 단계;
    (b) 복수의 유전자 마커에 기초하여 하플로타입 데이터를 세그먼트로 나누는 단계;
    (c) 각 시험 개체 집단에 대해:
    (i) 복수의 유전자 마커에 기초하여, 시험 개체 집단 중 제1 개체와 제2 개체 간에 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계로서, 각각의 매칭된 세그먼트는 적어도 미리 결정된 임계값 크기인 제1 크기를 갖고, 적어도 미리 결정된 개수의 유전자 마커를 포함하는 것인 단계;
    (ii) 제1 개체와 제2 개체 간의 각각의 매칭된 세그먼트에 대해:
    매칭된 세그먼트를 복수의 이산 게놈 간격으로 나누는 단계;
    (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 또는 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 점수를 생성하는 단계;
    복수의 점수의 일관성에 기초하여 복수의 점수를 보정하여 복수의 보정된 점수를 생성하는 단계; 및
    이산 게놈 간격의 복수의 보정된 점수에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계; 및
    (iii) 복수의 보정된 점수 및 복수의 가중치에 기초하여 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계; 및
    (d) 매칭된 세그먼트의 가중 합에 기초하여 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계를 포함하는, 이배체 집단의 두 개체 간의 조상 근연도 정도를 추정하기 위한 방법을 구현하는 기계 실행가능 코드를 포함하는 비일시적 컴퓨터 판독가능 매체.
  88. 제87항에 있어서, 이배체 집단이 포유동물 집단인 비일시적 컴퓨터 판독가능 매체.
  89. 제88항에 있어서, 포유동물 집단이 개과 집단인 비일시적 컴퓨터 판독가능 매체.
  90. 제89항에 있어서, 개과 집단이 개 집단인 비일시적 컴퓨터 판독가능 매체.
  91. 제87항에 있어서, 하플로타입 데이터가 하플로타입 페이징 알고리즘을 사용하여 시험 개체 집단의 유전자형 데이터를 프로세싱함으로써 생성되는 것인 비일시적 컴퓨터 판독가능 매체.
  92. 제91항에 있어서, 하플로타입 페이징 알고리즘이 참조 기반 하플로타입 페이징 알고리즘을 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  93. 제92항에 있어서, 참조 기반 하플로타입 페이징 알고리즘이 은닉 마르코프 모형(HMM) 기반 검색을 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  94. 제93항에 있어서, 참조 기반 하플로타입 페이징 알고리즘이 Eagle1 알고리즘, Eagle2 알고리즘, PHASE 알고리즘, fastPHASE 알고리즘, BEAGLE 알고리즘, Findhap 알고리즘, Impute 알고리즘, FImpute 알고리즘, AlphaImpute 알고리즘, IMPUTE2 알고리즘, MaCH 알고리즘, SHAPEIT1 알고리즘, SHAPEIT2 알고리즘, SHAPEIT3 알고리즘, SHAPEIT4 알고리즘, 또는 그의 조합을 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  95. 제91항에 있어서, 하플로타입 페이징 알고리즘이 코호트 기반 하플로타입 페이징 알고리즘을 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  96. 제91항에 있어서, 유전자형 데이터가 시험 개체 집단으로부터 수득된 생물학적 샘플을 검정함으로써 수득되는 것인 비일시적 컴퓨터 판독가능 매체.
  97. 제96항에 있어서, 생물학적 샘플이 혈액 샘플, 타액 샘플, 스왑 샘플, 세포 샘플, 또는 조직 샘플을 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  98. 제96항에 있어서, 검정이 생물학적 샘플 또는 그의 유도체를 시퀀싱하는 것을 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  99. 제87항에 있어서, 복수의 유전자 마커가 적어도 약 500, 적어도 약 1,000, 적어도 약 2,000, 적어도 약 3,000, 적어도 약 4,000, 적어도 약 5,000, 적어도 약 6,000, 적어도 약 7,000, 적어도 약 8,000, 적어도 약 9,000, 또는 적어도 약 10,000개의 별개의 유전자 마커를 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  100. 제87항에 있어서, 직계 동형인 하플로타입 데이터의 세그먼트를 매칭하는 단계가 GERMLINE 알고리즘, PLINK 알고리즘, PREST 알고리즘, IBD 검출을 위한 랜덤 프로젝션(RaPID) 알고리즘, IBD 공유 하플로타입 신속 발견(FISHR) 알고리즘, 정련된 직계 동형(IBD) 알고리즘, fastIBD 알고리즘, KING 알고리즘, HaploScore 알고리즘, TRUFFLE 알고리즘, 또는 그의 조합을 사용하는 것을 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  101. 제87항에 있어서, 미리 결정된 임계값 크기가 약 100 킬로 염기쌍(kbp), 약 200 kbp, 약 300 kbp, 약 400 kbp, 약 500 kbp, 약 600 kbp, 약 700 kbp, 약 800 kbp, 약 900 kbp, 또는 약 1,000 kbp인 비일시적 컴퓨터 판독가능 매체.
  102. 제87항에 있어서, 유전자 마커의 미리 결정된 개수가 약 30, 약 40, 약 50, 약 60, 약 70, 약 80, 약 90, 또는 약 100개의 별개의 유전자 마커인 비일시적 컴퓨터 판독가능 매체.
  103. 제87항에 있어서, 방법이 복수의 이산 게놈 간격의 이산 게놈 간격이 동일한 크기를 갖도록 매칭된 세그먼트를 나누는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  104. 제87항에 있어서, 방법이 복수의 이산 게놈 간격의 이산 게놈 간격이 가변 크기를 갖도록 매칭된 세그먼트를 나누는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  105. 제104항에 있어서, 복수의 이산 게놈 간격의 주어진 이산 게놈 간격의 가변 크기가 적어도 부분적으로는 주어진 이산 게놈 간격에 근접한 IBD 매치의 시작 위치 및 종료 위치, 주어진 이산 게놈 간격에서 유전자 마커의 밀도, 주어진 이산 게놈 간격에 대한 마커의 최대 개수, 주어진 이산 게놈 간격의 최대 길이, 또는 그의 조합에 기초하여 결정되는 것인 비일시적 컴퓨터 판독가능 매체.
  106. 제87항에 있어서, 방법이 (i) 제1 개체 또는 제2 개체 내의 이산 게놈 간격의 동형접합성 매칭 정도 및 (ii) 제1 개체와 제2 개체 간의 이산 게놈 간격의 쌍별 매칭 정도에 기초하여 복수의 이산 게놈 간격을 각각 점수화하여 복수의 동형접합성 매칭 점수 및 복수의 쌍별 매칭 점수를 생성하는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  107. 제106항에 있어서, 방법이 상응하는 동형접합성 매칭 점수와의 주어진 쌍별 매칭 점수의 일관성에 기초하여 복수의 쌍별 매칭 점수를 보정하여 복수의 보정된 쌍별 매칭 점수를 생성하는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  108. 제106항에 있어서, 방법이 두 이배체 개체에서의 두 대립유전자에 대한 복수의 일치 상태에 기초하여 복수의 가중치를 복수의 이산 게놈 간격에 할당하는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  109. 제108항에 있어서, 복수의 일치 상태가 표 1로부터 선택되는 일치 상태를 포함하고, 여기서, 복수의 가중치는 표 1에 열거된 복수의 근연도 r xy 에의 기여도에 기초하여 할당되는 것인 비일시적 컴퓨터 판독가능 매체.
  110. 제109항에 있어서, 조상 근연도 정도가 근연도 계수를 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  111. 제110항에 있어서, 방법이 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계를 추가로 포함하고, 여기서, 가중 합은
    Figure pct00016
    로 표현되는 것인 비일시적 컴퓨터 판독가능 매체.
  112. 제109항에 있어서, 조상 근연도 정도가 친족관계 계수를 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  113. 제112항에 있어서, 방법이 매칭된 세그먼트의 복수의 이산 게놈 간격에 대한 가중 합을 계산하는 단계를 추가로 포함하고, 여기서, 가중 합은
    Figure pct00017
    로 표현되는 것인 비일시적 컴퓨터 판독가능 매체.
  114. 제87항에 있어서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계가 제1 개체 또는 제2 개체의 근친교배 정도를 결정하는 것을 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  115. 제87항에 있어서, 제1 개체와 제2 개체 간의 조상 근연도 정도를 추정하는 단계가 제1 개체 및 제2 개체의 근친교배 정도를 결정하는 것을 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  116. 제115항에 있어서, 방법이 적어도 부분적으로는 제1 개체 및 제2 개체의 근친교배 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 결정하는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  117. 제116항에 있어서, 가족 관계가 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 또는 조부모-손자 관계인 비일시적 컴퓨터 판독가능 매체.
  118. 제114항 또는 제115항에 있어서, 방법이 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도를 결정하는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  119. 제118항에 있어서, 방법이 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도에 기초하여 제1 개체 및 제2 개체를 함께 교배시킬지 여부를 나타내는 권장 사항을 결정하는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  120. 제119항에 있어서, 방법이 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하지 않는 경우, 제1 개체 및 제2 개체를 함께 교배시키는 것을 나타내는 권장 사항을 결정하는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  121. 제119항에 있어서, 방법이 제1 개체 및 제2 개체의 잠재적 자손의 예상되는 근친교배 정도가 미리 결정된 근친교배 정도 임계값을 초과하는 경우, 제1 개체 및 제2 개체를 함께 교배시키지 않는 것을 나타내는 권장 사항을 결정하는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  122. 제120항 또는 제121항에 있어서, 미리 결정된 근친교배 정도 임계값이 약 0.10, 약 0.15, 약 0.20, 약 0.25, 약 0.30, 약 0.35, 약 0.40, 약 0.45, 또는 약 0.50인 비일시적 컴퓨터 판독가능 매체.
  123. 제87항에 있어서, 방법이 적어도 부분적으로는 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도에 기초하여 제1 개체와 연관된 제1인과 제2 개체와 연관된 제2인 사이의 사회적 관계를 생성하는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  124. 제123항에 있어서, 제1 개체와 제2 개체 간의 추정된 조상 근연도 정도가 미리 결정된 임계값을 초과하는 경우, 사회적 관계가 생성되는 것인 비일시적 컴퓨터 판독가능 매체.
  125. 제124항에 있어서, 미리 결정된 임계값이 약 0.00001, 약 0.0001, 약 0.001, 약 0.01, 약 0.02, 약 0.04, 약 0.06, 약 0.08, 약 0.1, 약 0.12, 약 0.14, 약 0.16, 약 0.18, 약 0.2, 약 0.25, 약 0.3, 약 0.35, 약 0.4, 약 0.45, 또는 약 0.5인 비일시적 컴퓨터 판독가능 매체.
  126. 제123항에 있어서, 사회적 관계가 소셜 미디어 네트워크를 통해 생성되는 것인 비일시적 컴퓨터 판독가능 매체.
  127. 제123항에 있어서, 제1인이 제1 개체의 애완동물 소유자이고, 여기서, 제2인이 제2 개체의 애완동물 소유자인 비일시적 컴퓨터 판독가능 매체.
  128. 제87항에 있어서, 방법이 적어도 부분적으로는 조상 근연도 정도에 기초하여 제1 개체와 제2 개체 간의 가족 관계를 확인하는 단계를 추가로 포함하는 것인 비일시적 컴퓨터 판독가능 매체.
  129. 제128항에 있어서, 가족 관계가 부모-자식 관계, 형매 관계, 고모/삼촌-남조카/여조카 관계, 사촌 관계, 또는 조부모-손자 관계인 비일시적 컴퓨터 판독가능 매체.
KR1020227020233A 2019-11-18 2020-11-17 조상 근연도를 결정하기 위한 방법 및 시스템 KR20220115952A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962936879P 2019-11-18 2019-11-18
US62/936,879 2019-11-18
PCT/US2020/060899 WO2021101896A1 (en) 2019-11-18 2020-11-17 Methods and systems for determining ancestral relatedness

Publications (1)

Publication Number Publication Date
KR20220115952A true KR20220115952A (ko) 2022-08-19

Family

ID=75980898

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227020233A KR20220115952A (ko) 2019-11-18 2020-11-17 조상 근연도를 결정하기 위한 방법 및 시스템

Country Status (12)

Country Link
US (2) US11501851B2 (ko)
EP (1) EP4062411A4 (ko)
JP (1) JP2023501006A (ko)
KR (1) KR20220115952A (ko)
CN (1) CN115004304A (ko)
AU (1) AU2020388555A1 (ko)
BR (1) BR112022009494A2 (ko)
CA (1) CA3162092A1 (ko)
GB (1) GB2608502A (ko)
IL (1) IL292997A (ko)
MX (1) MX2022005956A (ko)
WO (1) WO2021101896A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230131539A1 (en) * 2021-10-27 2023-04-27 Mars, Incorporated Systems and methods for a pet relative finder

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1233366T1 (de) * 1999-06-25 2003-03-20 Genaissance Pharmaceuticals Verfahren zur herstellung und verwendung von Haplotype Daten
JP2003523176A (ja) 1999-10-15 2003-08-05 ダブリュー. ジーン ドッヅ, 動物健康診断
US6730023B1 (en) 1999-10-15 2004-05-04 Hemopet Animal genetic and health profile database management
US7548839B2 (en) 1999-10-15 2009-06-16 Hemopet System for animal health diagnosis
WO2003014143A2 (en) * 2001-08-04 2003-02-20 Whitehead Institute For Biomedical Research Haplotype map of the human genome and uses therefor
US20060147962A1 (en) 2003-06-16 2006-07-06 Mars, Inc. Genotype test
CA2543785A1 (en) 2003-10-24 2005-05-06 Mmi Genomics, Inc. Compositions, methods, and systems for inferring canine breeds for genetic traits and verifying parentage of canine animals
JP2007518403A (ja) * 2003-12-17 2007-07-12 フレッド ハッチンソン キャンサー リサーチ センター イヌ科動物血統の同定のための方法および材料
US20060045909A1 (en) 2004-08-30 2006-03-02 Colgate-Palmolive Company Genome-based diet design
US20060200320A1 (en) 2005-03-02 2006-09-07 Hill's Pet Nutrition, Inc. Methods and systems for designing animal food compositions
EP1798295A1 (en) 2005-12-14 2007-06-20 Gregory M Acland Method for identifying progressive rod-cone degeneration in dogs
WO2009035792A1 (en) 2007-08-03 2009-03-19 Melba Ketchum Compositions, methods and systems for the simultaneous determination of parentage, identity, sex, genotype and/or phenotype and breed determination in animals
GB0722068D0 (en) 2007-11-09 2007-12-19 Mars Inc Predictive test
WO2009108918A2 (en) * 2008-02-29 2009-09-03 John Boyce Methods and systems for social networking based on nucleic acid sequences
WO2009134226A1 (en) * 2008-05-01 2009-11-05 The Board Of Trustees Of The Leland Stanford Junior University Canine coat color prediction
US8463554B2 (en) * 2008-12-31 2013-06-11 23Andme, Inc. Finding relatives in a database
US20150344959A1 (en) 2013-01-14 2015-12-03 Cornell University Compositions and methods for genotyping canines
EP3621080B1 (en) * 2014-10-14 2023-09-06 Ancestry.com DNA, LLC Reducing error in predicted genetic relationships

Also Published As

Publication number Publication date
WO2021101896A1 (en) 2021-05-27
CA3162092A1 (en) 2021-05-27
EP4062411A4 (en) 2023-12-20
GB202207365D0 (en) 2022-07-06
AU2020388555A1 (en) 2022-06-02
BR112022009494A2 (pt) 2022-09-20
CN115004304A (zh) 2022-09-02
EP4062411A1 (en) 2022-09-28
US20230061512A1 (en) 2023-03-02
US20220122693A1 (en) 2022-04-21
JP2023501006A (ja) 2023-01-17
US11501851B2 (en) 2022-11-15
GB2608502A (en) 2023-01-04
MX2022005956A (es) 2022-09-07
IL292997A (en) 2022-07-01

Similar Documents

Publication Publication Date Title
Zhang et al. Asian water buffalo: domestication, history and genetics
Zhang et al. Whole-genome resequencing reveals signatures of selection and timing of duck domestication
Ostrander et al. Unleashing the canine genome
Norris et al. Parentage and relatedness determination in farmed Atlantic salmon (Salmo salar) using microsatellite markers
JP5656678B2 (ja) イヌ科動物血統の同定のための方法および材料
Rehan et al. The genome and methylome of a subsocial small carpenter bee, Ceratina calcarata
Araki et al. Whole genome sequencing of greater amberjack (Seriola dumerili) for SNP identification on aligned scaffolds and genome structural variation analysis using parallel resequencing
Jun et al. Whole genome sequence and analysis of the Marwari horse breed and its genetic origin
Shi et al. Genome survey sequencing of red swamp crayfish Procambarus clarkii
US20230106107A1 (en) Methods and systems for determining pigmentation phenotypes
Zhang et al. The genetic architecture of phenotypic diversity in the Betta fish (Betta splendens)
Mohamed Yusoff et al. De novo sequencing, assembly and analysis of eight different transcriptomes from the Malayan pangolin
US20230061512A1 (en) Methods and systems for determining ancestral relatedness
Silva et al. Genome wide association study reveals new candidate genes for resistance to nematodes in Creole goat
Qiu et al. Whole-genome resequencing reveals aberrant autosomal SNPs affect chicken feathering rate
Das et al. Genomic selection: a molecular tool for genetic improvement in livestock
EA046341B1 (ru) Способы и системы для определения родственного отношения
JPWO2021101896A5 (ko)
Ullah et al. Population genetic characterization and family reconstruction in brood bank collections of the Indian major carp Labeo rohita (Cyprinidae: Cypriniformes)
Gu et al. Domestication affects sex-biased gene expression evolution in the duck
Zhao et al. Whole-genome resequencing of Hu sheep identifies candidate genes associated with agronomic traits
Kumar et al. Hands on training on Aquaculture Genomics and Bioinformatics
Danoff et al. Epigenetic and neurodevelopmental consequences of early life experience
CA3182083A1 (en) Methods and systems for determination of gene similarity
CN116134546A (zh) 用于诊断检验的有效样本混合的方法和系统