JP2023501006A - 祖先血縁を決定するための方法およびシステム - Google Patents

祖先血縁を決定するための方法およびシステム Download PDF

Info

Publication number
JP2023501006A
JP2023501006A JP2022554739A JP2022554739A JP2023501006A JP 2023501006 A JP2023501006 A JP 2023501006A JP 2022554739 A JP2022554739 A JP 2022554739A JP 2022554739 A JP2022554739 A JP 2022554739A JP 2023501006 A JP2023501006 A JP 2023501006A
Authority
JP
Japan
Prior art keywords
individual
algorithm
readable medium
degree
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022554739A
Other languages
English (en)
Other versions
JPWO2021101896A5 (ja
Inventor
サムズ,アーロン・ジェイ
ボール,サミュエル・エイチ
ガードナー・アダム・エス
バートン,マット
ボイコ,ライアン
ボイコ,アダム・アール
Original Assignee
エンバーク ヴェテリナリー,インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エンバーク ヴェテリナリー,インコーポレーテッド filed Critical エンバーク ヴェテリナリー,インコーポレーテッド
Publication of JP2023501006A publication Critical patent/JP2023501006A/ja
Publication of JPWO2021101896A5 publication Critical patent/JPWO2021101896A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Ecology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Ignition Installations For Internal Combustion Engines (AREA)
  • Structure Of Transmissions (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本開示は、個体間の祖先血縁度を推定する方法を提供する。一態様において、方法は、個体集団の中で共有される遺伝子マーカーを含むハプロタイプデータを受け取るステップと、遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割するステップと、被験個体集団の各々に対して、(i)遺伝子マーカーに基づいて、2つの個体間で同祖的であるハプロタイプデータのセグメントをマッチングさせ、(ii)マッチングされたセグメントごとに、マッチングされたセグメントを個別のゲノム範囲に分割し、個体内または個体間でのマッチング度に基づいて個別のゲノム範囲の各々を得点付け、整合性のために得点を補正し、(iii)補正された得点および割り当てられた重みに基づいて、マッチングされたセグメントの個別のゲノム範囲に対する加重和を算出するステップと、(d)マッチングされたセグメントの加重和に基づいて個体間の祖先血縁度を推定するステップとを含む。

Description

関連出願の相互参照
[0001]本出願は、その全体が参照により本明細書に組み込まれている、2019年11月18日に出願された米国仮出願第62/936,879号の有益性を主張するものである。
[0002]個体間に観察される遺伝子および表現型変異の多くは、個体集団内のDNAの小さな差異に起因するものと考えられる。個体が共有する特定の同祖(IBD)ハプロタイプ(例えば、一緒に遺伝するDNAの小領域)は、それらの個体間の家族関係を示すものと考えられる。したがって、IBD解析を実施することで、それらの祖先血縁を決定することができる。
[0003]本開示は、個体間の祖先血縁度を推定する方法を提供する。一態様において、方法は、個体集団の中で共有される遺伝子マーカーを含むハプロタイプデータを受け取るステップと、遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割するステップと、被験個体集団の各々に対して、(i)遺伝子マーカーに基づいて、2つの個体間で同祖的であるハプロタイプデータのセグメントをマッチングさせ、(ii)マッチングされたセグメントごとに、マッチングされたセグメントを個別のゲノム範囲に分割し、個体内または個体間でのマッチング度に基づいて個別のゲノム範囲の各々を得点付け、整合性のために得点を補正し、(iii)補正された得点および割り当てられた重みに基づいて、マッチングされたセグメントの個別のゲノム範囲に対する加重和を算出するステップと、(d)マッチングされたセグメントの加重和に基づいて個体間の祖先血縁度を推定するステップとを含む。
[0004]一態様において、本開示は、2倍体集団の2つの個体間の祖先血縁度を推定するためのコンピュータ実装方法であって、(a)被験個体集団に対するハプロタイプデータを受け取るステップであって、ハプロタイプデータが、被験個体集団中で共有される複数の遺伝子マーカーを含む、ステップと、(b)複数の遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割するステップと、(c)被験個体集団の各々に対して、(i)複数の遺伝子マーカーに基づいて、被験個体集団の中の第1の個体と第2の個体との間で同祖的であるハプロタイプデータのセグメントをマッチングさせ、マッチングされたセグメントの各々が少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含み、(ii)第1の個体と第2の個体との間のマッチングされたセグメントの各々に対して、マッチングされたセグメントを複数の個別のゲノム範囲に分割し、(i)第1の個体もしくは第2の個体内の個別のゲノム範囲のホモ接合性マッチング度または(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて複数の個別のゲノム範囲の各々を得点付けることにより、複数の得点を生成し、複数の得点の整合性に基づいて複数の得点を補正することにより、複数の補正された得点を生成し、個別のゲノム範囲の複数の補正された得点に基づいて、複数の重みを複数の個別のゲノム範囲に割り当て、(iii)複数の補正された得点および複数の重みに基づいて、マッチングされたセグメントの複数の個別のゲノム範囲に対する加重和を算出するステップと、(d)マッチングされたセグメントの加重和に基づいて、第1の個体と第2の個体との間の祖先血縁度を推定するステップとを含む方法を提供する。
[0005]いくつかの実施形態において、2倍体集団は哺乳動物集団である。いくつかの実施形態において、哺乳動物集団は、イヌ科動物集団、ネコ科動物集団、スポーツ動物集団または齧歯動物集団である。いくつかの実施形態において、哺乳動物集団はイヌ科動物集団である。いくつかの実施形態において、哺乳動物集団は犬集団である。いくつかの実施形態において、哺乳動物集団はネコ科動物集団である。いくつかの実施形態において、ネコ科動物集団は猫集団である。いくつかの実施形態において、哺乳動物集団はスポーツ動物集団である。いくつかの実施形態において、スポーツ動物集団は馬集団である。いくつかの実施形態において、犬集団は、アーフェンピンシャー、アフガンハウンド、アフリカニス、アイディ、エアデールテリア、アクバシュ、秋田犬、アラングマスティフ、アラノエスパニョール、アルパハブルーブラッドブルドッグ、アラスカンクリーカイ、アラスカンマラミュート、アーラント、アロペキス、アルペンダックスブラッケ、アルセイシアンシェパルート、アメリカンアキタ、アメリカンブルドッグ、アメリカンコッカースパニエル、アメリカンエスキモードッグ、アメリカンフォックスハウンド、アメリカンヘアレステリア、アメリカンマスティフ、アメリカンピットブルテリア、アメリカンスタッフォードシャーテリア、アメリカンウォータースパニエル、アナトリアンシェパードドッグ、アングロフランセドゥプティットヴェヌリー、アッペンツェラーキャトルドッグ、アルゼンチンドゴ、アリエージュポインター、アリエージョワ、アーマント、アルトワハウンド、オーストラリアンブルドッグ、オーストラリアンキャトルドッグ、オーストラリアンケルピー、オーストラリアンシェパード、オーストラリアンシルキーテリア、オーストラリアンスタンピーテールキャトルドッグ、オーストラリアンテリア、オーストラリアンブラック・アンド・タンハウンド、オーストラリアンピンシャー、アザワク、カシミールシープドッグ、バルビー、バセンジー、バスクシェパードドッグ、バセーアルティジャンノルマン、バセーブルードガスコーニュ、バセーフォーブドブルターニュ、グランバセットグリフォンバンデーン、プチバセットグリフォンバンデーン、バヴァリアンマウンテンハウンド、ビーグル、ビーグルハーリア、ベアデットコリー、ボースロン、ベドリントンテリア、ベルジアンシェパードドッグ、ベルジアンシェパードドッグ(グローネンダール)、ベルジアンシェパードドッグ(ラケノア)、ベルジアンシェパードドッグ(マリノア)、ベルジアンシェパード(タービュレン)、ベルガマスコシェパード、ホワイトスイスシェパードドッグ、ピカルディシープドッグ、ベルナーラウフフント、バーニーズマウンテンドッグ、ビションフリーゼ、ビリー、ビスベン、ブラック・アンド・タンクーンハウンド、ブラック・アンド・タンバージニアフォックスハウンド、ブレンバイザー、ノルウェジアンエルクハウンドブラック、ブラックロシアンテリア、ブラックマウスカー、グランブルードガスコーニュ、プティブルードガスコーニュ、ブラッドハウンド、ブルーレーシー、ブルーポールテリー、ブルーティッククールハウンド、ボーアボール、ボヘミアンシェパード、ボロニーズ、ボーダーコリー、ボーダーテリア、ボルゾイ、ボスニアンラフヘアードハウンド、ボストンテリア、ブービエデアルデンヌ、ブービエデフランダース、ボクサー、ボイキンスパニエル、ブラッコイタリアーノ、ブラクドオーヴェルニュー、ブラクデュブルボネ、ブラクデュプイ、ブラクフランセ、ブラクサンジェルマン、ブラジリアンテリア、ブリアード、ブリケグリフォンバンデーン、ブリタニー、ブロホルマー、ブルーノシュラハウンド、ブコビナシーパードドッグ、ブル・アンド・テリア、ブルテリア、ブルテリア(ミニチュア)、ブルマスティフ、シンドマスティフ、ケアンテリア、カナーンドッグ、カナディアンエスキモードッグ、カナディアンポインター、カネコルソ、カオダセラデアイレス、カオデカストロラボレイロ、カオデフィラデサンミゲル、カロライナドッグ、カルパチアンシェパードドッグ、カタフーラカー、カタロニアンシープドッグ、コーカシアンシェパードドッグ、キャバリアキングチャールズスパニエル、セントラルアジアシェパードドッグ、チェスキーフォーセク、チェスキーテリア、ポーリッシュグレーハウンド、チェサピークベイレトリーバ、セントルイスグレイドッグ、シャンフランセブランエノワール、シャンフランセブランエオランジュ、シャンフランセトリコロール、チワワ、チリアンフォックステリア、重慶犬、チャイニーズクレステッドドッグ、チャイニーズインペリアルドッグ、チヌーク、チッピパライ、チャウチャウ、シマロンウルグアヨ、チェリーシェリー、チルネコデルエトナ、クランバースパニエル、ラフコリー、スムースコリー、コンバイ、コルトバファイティングドッグ、コトンドテュレアール、クレタンハウンド、クロアチアンシープドッグ、カンバーランドシープドッグ、カーリーコーテッドレトルバー、チェコスロバキアンウルフドッグ、ダックスフント、ダルメシアン、ダンディディンモントテリア、ダーニッシュスウェーディッシュファームドッグ、ディンゴ、ドーベルマンピンシャー、ドーグドボルドー、ドゴキューバン、ドゴグアテマルテコ、ドゴサルデスコ、ドレンチェパトリッシュホンド、ドレーファー、ドゥンケル、ダッチシェパードドッグ、ダッチスムースフント、イーストヨーロピアンシェパード、イーストシベリアンライカ、エロ、イングリッシュコッカースパニエル、イングリッシュクーンハウンド、イングリッシュフォックスハウンド、イングリッシュマスティフ、イングリッシュポインター、イングリッシュセター、イングリッシュセパード、イングリッシュスプリンガースパニエル、イングリッシュトイテリア(ブラック&タン)、イングリッシュウォータースパニエル、イングリッシュホワイトテリア、エントレブッハーマウンテンドッグ、ブルーピカルディースパニエル、エストニアンハウンド、エストレラマウンテンドッグ、ユーラシア、フィールドスパニエル、フィラブラジレイロ、フィド、フィニッシュハウンド、フィニッシュラップフンド、フィニッシュスピッツ、フラットコーテッドレトリーバー、フォーモウサンマウンテンドッグ、フォックステリア(スムース)、ワイアーフォックステリア、フレンチブリタニー、フレンチブルドッグ、フレンチスパニエル、スパニッシュグレーハウンド、ジャーマンロングヘアードポインター、
ジャーマンピンシャー、ジャーマンシェパードドッグ、ジャーマンショートエアードポインター、ジャーマンスパニエル、ジャーマンスピッツ、ジャーマンワイアーヘアードポインター、ジャイアントシュナウザー、グラン・オブ・イマールテリア、ゴールデンレトリバー、ゴードンセッター、グランアングロフランセブランエノワール、グランアングロフランセブランエオランジェ、グランアングロフランセトリコロール、グラングリフォンバンデーン、グランマスティンデボリンケン、グレートデン、グレートピレニーズ、グレータースイスマウンテンドッグ、グリーンランドドッグ、グレーハウンド、グリフォンブルードガスコーニュ、ブリュッセルグリフォン、グリフォンフォーヴドブルターニュ、グリフォンニヴェルネ、ガルドン、ガルテリア、ヘアインディアンドッグ、ハミルトンシュトーヴァレ、ハノーヴァリアンハウンド、ハーリア、ハバニーズ、ハワイアンポイドッグ、ヒマラヤンシープドッグ、北海道犬、スホルタイ、ホファヴァルト、ハンガリアンハウンド、ニュージーランドハンタウェイ、ハイゲンハウンド、イビザンハウンド、アイスランドシープドッグ、インディアンスピッツ、アイリッシュブルテリア、アイリッシュレッド・アンド・ホワイトセッター、アイリッシュセッター、アイリッシュスタッフォードシャーブルテリア、アイリッシュテリア、アイリッシュウォータースパニエル、アイリッシュウルフハウンド、イストリアンスムースヘアードハウンド、イストリアンコースヘアードハウンド、イタリアングレーハウンド、ジャックラッセルテリア、ヤークトテリア、イェムトフント、狆、日本スピッツ、日本テリア、ジョナンギ、カイカディ、甲斐犬、カンガルードッグ、カンニ、カラカハンドッグ、カレリアンベアドッグ、カルストシェパード、キースホンド、ケリービーグル、ケリーブルーテリア、キングチャールズスパニエル、キングシェパード、キンタマーニ、紀州犬、コモンドール、コーイケルホンディエ、クーリー、珍島犬、コリアンマスティフ、クロムフォルレンダー、クンミングウルフドッグ、クリ、クーバース、キーレオ、ラブラドールハスキー、ラブラドールレトリバー、ラゴットロマニョーロ、レークランドテリア、ランカシャーヒーラー、ランドシーア、ラポニアンハーダー、レオンベルガー、ラサアプソ、リトアニアンハウンド、ロングヘアードウィペット、ロッタローレブリンディジノ、ローシェン、マジャールアガール、マジェスティックツリーハウンド、マルチーズ、マンチェスターテリア、マレンマシープドッグ、マクナブ、メキシカンヘアレスドッグ、ミニチュアオーストラリアンシェパード、ミニチュアフォックステリア、ミニチュアピンシャー、ミニチュアシュナウザー、ミニチュアシベリアンハスキー、ミオリティック、モロサス、モンテネグリンマウンテンハウンド、モスクワンガーディアンマスティフ、モスコーウォータードッグ、マウンテンカー、マウンテンビューカー、ムクチェス、ムーディ、ムドホルハウンド、ラージミュンスターレンダー、スモールミュンスターレンダー、マレーリバーカーリーコーテッドレトリーバー、ナポリタンマスティフ、ニューファンドランド、ニューギニアンシンギングドッグ、ノーフォークスパニエル、ノーフォークテリア、ノルボッテンスペッツ、ノースカントリービーグル、ノーザンイヌイットドッグ、ノルウェジアンブーフンド、ノルウェジアンエルクハウンド、ノルウェジアンルンデフンド、ノーリッチテリア、ノヴァスコシアダックトーリングレトリーバー、オールドデニッシュポインター、オールドイングリッシュシープドッグ、オールドイングリッシュブルドッグ、オールドイングリッシュテリア、オールドジャーマンシェパードドッグ、オールディイングリッシュブルドッグ、オッターハウンド、パチョンナヴァロ、ペイズリーテリア、パピヨン、パーソンラッセルテリア、パタデールテリア、ペキニーズ、ペロデプレサカナリオ、ペロデプレサマヨルキン、ペルービアンヘアレスドッグ、ファレーヌ、ファラオハウンド、ピカルディスパニエル、プロットハウンド、ポデンコカナリオ、ポインター、ポリッシュハウンド、ポリッシュハンティングドッグ、ポリッシュローランドシープドッグ、ポリッシュタトラシープドッグ、ポメラニアン、ポンオードメルスパニエル、プードル、ポルスヌーレ、ポーチュギースポデンゴ、ポーチュギースポインター、ポーチュギーズウォータードッグ、プラシュスキークリサジーク、プードルポインター、パグ、プーリー、プーミー、豊山犬、ピレニアンマスティフ、ピレニアンシェパード、ラフェイロドアレンティジョ、ラジャパラヤム、ランプールグレーハウンド、ハストレアドールブラジレイロ、ラトネーロボデグエロアンダルース、ラットテリア、レッドボーンクーンハウンド、ローデシアンリッジバック、ロットワイラー、ロシアンスパニエル、ロシアントイ、ラッソヨーロピアンライカ、ラッセルテリア、サーロスウルフホンド、サブエソエスパニョール、セージアッシャーエリ(Sage Ashayeri)、セージマザンダラニ(Sage Mazandarani)、樺太犬、サルーキ、サモエド、サプサル、シャルプラニナッツ、シャーペンドース、シラーシュトーヴァレ、スキッパーキ、オールドクロアチアンサイトハウンド、ジャイアントシュナウザー、ミニチュアシュナウザー、スタンダードシュナウザー、スイスハウンド、スモールスイスハウンド、スコッチコリー、スコティッシュディアハウンド、スコティッシュテリア、シーリハムテリア、セグージョイタリアーノ、セッパラシベリアンスレッドドッグ、セルビアンハウンド、セルビアントライカラーハウンド、シャーペイ、シェットランドシープドッグ、柴犬、シーズー、四国犬、シャイロシェパードドッグ、シラク、シベリアンハスキー、シルケンウインドハウンド、シンハラハウンド、スカイテリア、スルーギ、スロヴァークチュヴァック、スロバキアンラフヘアードポインター、スロヴェンスキーコポフ、スモーラントシュトーヴァレ、スモールグリークドメスティックドッグ、ソフトコーテッドウィートンテリア、サウスロシアンオフチャルカ、サザンハウンド、スパニッシュマスティフ、スパニッシュウォータードッグ、スピノーネイタリアーノ、スポーティングルーカステリア、セントバーナード、セントジョンズウォータードッグ、シュタバイフーン、スタッフォードシャーブルテリア、スティーブンスカー、スティリアンコースヘアードハウンド、サセックススパニエル、スウェーディッシュラップフンド、スウェーディッシュヴァルフント、スウェーディッシュビーグル、タールタンベアドッグ、タイガン、タマスカンドッグ、テディルーズベルトテリア、テロミアン、テンターフィールドテリア、タイバーンケオドッグ、タイリッジバック、チベタンマスティフ、チベタンスパニエル、チベタンテリア、トルニャック、土佐犬、トイブルドッグ、トイフォックステリア、トイマンチェスターテリア、ツリーイングカー、ツリーイングウォーカークーンハウンド、ティロリアンハウンド、ウトナーガン、ビズラ、ヴォルピーノイタリアーノ、ワイマラナー、カーディガンウェルシュコーギ、ペンブロークウェルシュコーギ、ウェルシュシープドッグ、ウェルシュスプリンガースパニエル、ウェルシュテリア、ウエストハイランドホワイトテリア、ウエストシベリアンライカ、ウェストファリアンダックスブラッケ、ヴェッターフーン、ウィペット、ホワイトイングリッシュブルドッグ、ホワイトシェパードドッグ、ワイアーヘアードヴィズラ、ワイアーヘアードポインティンググリフォンおよびヨークシャーテリアからなる群から選択される1つまたは複数の犬種を含む。いくつかの実施形態において、該集団は、(例えば、単一品種を有する)1つまたは複数の純血種の犬、または(例えば、複数の品種を有する)1つまたは複数の雑種犬を含む。いくつかの実施形態において、該集団は、任意の数の(例えば1、2、3、4、5、6、7、8、9、10もしくは10以上の)純血種の犬またはそれらの組合せのDNAを有する雑種犬の集団である。
[0006]いくつかの実施形態において、ハプロタイプデータは、ハプロタイプフェージングアルゴリズムを使用して被験個体集団の遺伝子型データを処理することによって生成される。いくつかの実施形態において、ハプロタイプフェージングアルゴリズムは、参照ベースのハプロタイプフェージングアルゴリズムを含む。いくつかの実施形態において、参照ベースのハプロタイプフェージングアルゴリズムは、隠れマルコフモデル(HMM)ベースのサーチを含む。いくつかの実施形態において、参照ベースのハプロタイプフェージングアルゴリズムは、Eagle1アルゴリズム、Eagle2アルゴリズム、PHASEアルゴリズム、fastPHASEアルゴリズム、BEAGLEアルゴリズム、Findhapアルゴリズム、Imputeアルゴリズム、FImputeアルゴリズム、AlphaImputeアルゴリズム、IMPUTE2アルゴリズム、MaCHアルゴリズム、SHAPEIT1アルゴリズム、SHAPEIT2アルゴリズム、SHAPEIT3アルゴリズム、SHAPEIT4アルゴリズム、またはそれらの組合せを含む。いくつかの実施形態において、ハプロタイプフェージングアルゴリズムは、コホートベースのハプロタイプフェージングアルゴリズムを含む。
[0007]いくつかの実施形態において、遺伝子型データは、被験個体集団から得られた生体試料を検定することによって得られる。いくつかの実施形態において、生体試料は、血液試料、唾液試料、スワブ試料、細胞試料または組織試料を含む。いくつかの実施形態において、検定は、生体試料またはそれらの派生物の配列決定を含む。
[0008]いくつかの実施形態において、複数の遺伝子マーカーは、少なくとも約500個、少なくとも約1000個、少なくとも約2000個、少なくとも約3000個、少なくとも約4000個、少なくとも約5000個、少なくとも約6000個、少なくとも約7000個、少なくとも約8000個、少なくとも約9000個、または少なくとも約10000個の異なる遺伝子マーカーを含む。
[0009]いくつかの実施形態において、同祖的であるハプロタイプのセグメントのマッチングは、GERMLINEアルゴリズム、PLINKアルゴリズム、PRESTアルゴリズム、IBD検出用ランダムプロジェクション(RaPID)アルゴリズム(Random Projection for IBD Detection (RaPID) algorithm)、IBD共有ハプロタイプ高速発見(FISHR)アルゴリズム(Find IBD Shared Haplotypes Rapidly (FISHR) algorithm)、精密同祖(IBD)アルゴリズム(refined identical-by-descent (IBD) algorithm)、fastIBDアルゴリズム、KINGアルゴリズム、HaploScoreアルゴリズム、TRUFFLEアルゴリズム、またはそれらの組合せの使用を含む。いくつかの実施形態において、所定の閾値サイズは、約100キロベース塩基対(kbp)、約200kbp、約300kbp、約400kbp、約500kbp、約600kbp、約700kbp、約800kbp、約900kbpまたは約1000kbpである。いくつかの実施形態において、所定の数の遺伝子マーカーは、約30個、約40個、約50個、約60個、約70個、約80個、約90個または約100個の異なる遺伝子マーカーである。
[0010]いくつかの実施形態において、該方法は、複数の個別のゲノム範囲の個別のゲノム範囲が等しいサイズを有するように、マッチングされたセグメントを分割するステップをさらに含む。いくつかの実施形態において、該方法は、複数の個別のゲノム範囲の個別のゲノム範囲が可変サイズを有するように、マッチングされたセグメントを分割するステップをさらに含む。いくつかの実施形態において、複数の個別のゲノム範囲の所与の個別のゲノム範囲の可変サイズは、所与の個別のゲノム範囲に近接するIBDマッチの開始位置および終了位置、所与の個別のゲノム範囲における遺伝子マーカーの密度、所与の個別のゲノム範囲に対するマーカーの最大数、所与の個別のゲノム範囲の最大長さ、またはそれらの組合せに少なくとも部分的に基づいて決定される。
[0011]いくつかの実施形態において、該方法は、(i)第1の個体または第2の個体内の個別のゲノム範囲の等しいサイズ度、および(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて、複数の個別のゲノム範囲の各々を得点付けることにより、複数の等しいサイズ得点および複数の対合マッチング得点を生成するステップをさらに含む。いくつかの実施形態において、該方法は、所与の対合マッチング得点と対応する等しいサイズ得点との整合性に基づいて、複数の対合マッチング得点を補正することにより、複数の補正対合マッチング得点を生成するステップをさらに含む。
[0012]いくつかの実施形態において、該方法は、2つの2倍体個体における2つのアレルについての複数の同一性状態に基づいて、複数の個別のゲノム範囲に複数の重みを割り当てるステップをさらに含む。いくつかの実施形態において、複数の同一性状態は、表1から選択される同一性状態を含み、複数の重みは、表1に記載される血縁rxyに対する複数の寄与に基づいて割り当てられる。いくつかの実施形態において、祖先血縁度は、血縁係数を含む。いくつかの実施形態において、該方法は、
Figure 2023501006000002
で表される、マッチングされたセグメントの複数の個別のゲノム範囲に対する加重和を算出するステップをさらに含む。いくつかの実施形態において、祖先血縁度は、親縁係数を含む。いくつかの実施形態において、該方法は、
Figure 2023501006000003
で表される、マッチングされたセグメントの複数の個別のゲノム範囲に対する加重和を算出するステップをさらに含む。
[0013]いくつかの実施形態において、第1の個体と第2の個体との間の祖先血縁度を推定するステップは、第1の個体または第2の個体の近親交配の程度を決定するステップを含む。いくつかの実施形態において、第1の個体と第2の個体との間の祖先血縁度を推定するステップは、第1の個体および第2の個体の近親交配の程度を決定するステップを含む。いくつかの実施形態において、該方法は、第1の個体および第2の個体の近親交配の程度に少なくとも部分的に基づいて、第1の個体と第2の個体との家族関係を決定するステップをさらに含む。いくつかの実施形態において、家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。いくつかの実施形態において、家族関係は、第1の個体と第2の個体との間の祖先血縁度が一対のヒトの間に想定される祖先血縁度に匹敵するように一対のヒトの間の関係として示される。いくつかの実施形態において、該関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。
[0014]いくつかの実施形態において、該方法は、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度を決定するステップをさらに含む。いくつかの実施形態において、該方法は、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度に基づいて、第1の個体と第2の個体とを交配させるか否かを示す提案を決定するステップをさらに含む。いくつかの実施形態において、該方法は、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度が近親交配の所定の閾値の程度を超えない場合に、第1の個体と第2の個体とを交配させることを示す提案を決定するステップをさらに含む。いくつかの実施形態において、該方法は、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度が近親交配の所定の閾値の程度を超える場合に、第1の個体と第2の個体とを交配させないことを示す提案を決定するステップをさらに含む。いくつかの実施形態において、近親交配の所定の閾値の程度は、約0.10、約0.15、約0.20、約0.25、約0.30、約0.35、約0.40、約0.45または約0.50である。
[0015]いくつかの実施形態において、該方法は、第1の個体と第2の個体との推定される祖先血縁度に少なくとも部分的に基づいて、第1の個体に関連する第1の人間と第2の個体に関連する第2の人間との社会的つながりを生成するステップをさらに含む。いくつかの実施形態において、社会的つながりは、第1の個体と第2の個体との推定される祖先血縁度が所定の閾値を超える場合に生成される。いくつかの実施形態において、所定の閾値は、約0.00001、約0.0001、約0.001、約0.01、約0.02、約0.04、約0.06、約0.08、約0.1、約0.12、約0.14、約0.16、約0.18、約0.2、約0.25、約0.3、約0.35、約0.4、約0.45または約0.5である。いくつかの実施形態において、社会的つながりは、ソーシャルメディアネットワークを通じて生成される。いくつかの実施形態において、第1の人間は第1の個体のペット所有者であり、第2の人間は第2の個体のペット所有者である。いくつかの実施形態において、同じ人間が、第1の個体および第2の個体のペット所有者である。いくつかの実施形態において、第1の人間と第2の人間との社会的つながりを生成するステップは、第1の人間または第2の人間の位置を提供するステップを含む。いくつかの実施形態において、第1の人間と第2の人間との社会的つながりを生成するステップは、第1の人間と第2の人間との通信リンクを提供するステップを含む。
[0016]いくつかの実施形態において、該方法は、祖先血縁度に少なくとも部分的に基づいて、第1の個体と第2の個体との家族関係を特定するステップをさらに含む。いくつかの実施形態において、家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。いくつかの実施形態において、家族関係は、第1の個体と第2の個体との間の祖先血縁度が一対のヒトの間に想定される祖先血縁度に匹敵するように一対のヒトの間の関係として示される。いくつかの実施形態において、該関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。
[0017]いくつかの実施形態において、該方法は、被験個体集団の1つまたは複数の個体の各々に対して、個体における遺伝または健康状態の存在、不在、リスクまたはキャリア状態を特定するステップをさらに含む。いくつかの実施形態において、遺伝または健康状態は、血小板病症(RASGRP2エキソン8)、ピルビン酸キナーゼ欠損症(PKLRエキソン7パグ種)、第IX因子欠乏症、B型血友病(F9エキソン7、テリア種)、ピルビン酸キナーゼ欠損症(PKLRエキソン7ビーグル種)、P2Y12受容体血小板異常(P2RY12)、I型グランツマン血小板無力症(ITGA2Bエキソン12)、II型フォンヴィルブランド病、II型vWD(VWF)、メイヘグリン異常症(MYH9)、血小板病症(RASGRP2エキソン5、アメリカンエスキモードッグ種)、第IX因子欠乏症、B型血友病(F9エキソン7、ローでシアンリッジバック種)、I型フォンヴィルブランド病(VWF)、犬の楕円赤血球症(SPTBエキソン30)、犬のIII型白血球接着不全症、LAD3(FERMT3)、プレカリクレイン欠乏症(KLKB1エキソン8)、III型フォンヴィルブランド病、III型vWD(VWFエキソン4)、第VIII因子欠乏症、A型血友病(F8エキソン10、ボクサー種)、捕捉好中球症候群(VPS13B)、ピルビン酸キナーゼ欠損症(PKLRエキソン7ラブラドール種)、血小板病症(RASGRP2エキソン5、バセットハウンド種)、ピルビン酸キナーゼ欠損症(PKLRエキソン5)、第VIII因子欠乏症、A型血友病(F8エキソン1、シェパード種2)、第VII因子欠乏症(F7エキソン5)、先天性巨大血小板性血小板減少症(TUBB1エキソン1、キャバリアキングチャールズスパニエル種)、木質膜炎、LM(PLG)、ピルビン酸キナーゼ欠損症(PKLRエキソン10)、および第VIII因子欠乏症、A型血友病(F8エキソン11、シェパード種1)、他の系として、シャーペイ自己炎症性疾患、SPAID、シャーペイ熱(MTBP)、常染色体劣性エナメル質形成不全症、家族性エナメル質形成不全(イタリアングレーハウンド種)、持続性ミュラー管症候群、PMDS(AMHR2)、ならびにドーベルマンの難聴および前庭症候群、DVDob、DINGS、眼系として、進行性網膜萎縮症、crd(IQCB1)、原発性水晶体脱臼(ADAMTS17)、緑内障原発性開放隅角緑内障(ADAMTS17エキソン2)、進行性網膜萎縮症、crd1(PDE6B)、進行性網膜萎縮症、rcd1桿体錐体形成不全、rcd1(PDE6Bエキソン21アイリッシュセッター種)、コリーの眼異常、脈絡膜形成不全、CEA(NHEJ1)、進行性網膜萎縮症(SAG)、色覚異常(CNGA3エキソン7ジャーマンシェパード種)、犬の多発性網膜症cmr2(BEST1エキソン5)、緑内障原発性開放隅角緑内障(ADAMTS17エキソン11)、進行性網膜萎縮症、prcd進行性桿体錐体変性症(PRCDエキソン1)、遺伝性白内障、早発性白内障、若年性白内障(HSF4エキソン9シェパード種)、常染色体優性進行性網膜萎縮症(RHO)、犬の多発性網膜症cmr3(BESTエキソン10SNP)、色覚異常(CNGA3エキソン7ラブラドールレトリバー種)、犬の多発性網膜症cmr1(BEST1エキソン2)、進行性網膜萎縮症、rcd3桿体錐体形成不全、rcd3(PDE6A)、進行性網膜萎縮症(CNGB1)、ゴールデンレトリバー進行性網膜萎縮症1、GR-PRA1(SLC4A3)、進行性網膜萎縮症-crd4/cord1(RPGRIP1)、先天性停止性夜盲(RPE65)、斑状角膜変性症、MCD(CHST6)、緑内障原発性開放隅角緑内障(ADAMTS10エキソン9)、犬の多発性網膜症cmr3(BEST1エキソン10欠損)、および緑内障原発性開放隅角緑内障(ADAMTS10エキソン17)、筋肉系として、中心核ミオパチー(PTPLA)、先天性ミオトニー(CLCN1エキソン7)、グレートデンの遺伝性ミオパチー(BIN1)、先天性ミオトニー(CLCN1エキソン23)、筋ジストロフィー(DMDウェルシュコーギーペンブローク種)、運動誘導虚脱(DNM1)、筋ジストロフィー(DMDゴールデンレトリバー種)、ミオスタチン欠損、ブリーウィペット症候群(MSTN)、筋細管ミオパチー1、X連鎖筋細管ミオパチー、XL-MTM(MTM1、ラブラドール種)、および筋ジストロフィー(キャバリアキングチャールズスパニエル種1)、多系として、原発性線毛運動障害、PCD(CCDC39エキソン3)、
GM1ガングリオシドーシス(GLB1エキソン2)、IIIA型ムコ多糖症、A型サンフィリポ症候群、MPSIIIA(SGSHエキソン6種1)、成体発症神経セロリドリポフスチン症(ATP13A2)、GM1ガングリオシドーシス(GLB1エキソン15柴犬種)、神経セロリドリポフスチン症2、NCL2(TPP1エキソン4)、VII型ムコ多糖症、スライ症候群、MPSVII(GUSBエキソン3)、犬のフコシドーシス(FUCA1)、GM1ガングリオシドーシス(GLB1エキソン15アラスカンハスキー種)、ラゴット蓄積症(ATG4D)、乾性角結膜炎・魚鱗癬様皮膚炎、乾性眼カーリーコート症候群、CKCSID(FAM83Hエキソン5)、VII型グリコーゲン蓄積症、ホスホフルクトキナーゼ欠乏症、PFK欠乏症(PFKMウィペットおよびイングリッシュスプリンガースパニエル、IA型グリコーゲン蓄積症、フォンギールケ病、GSDIA(G6PC)、VII型グリコーゲン蓄積症、ホスホスルフトキナーゼ欠乏症、PFK欠乏症(PFKMヴァハテルフント種)、神経セロリドリポフスチン症1、NCL1(CLN5ボーダーコリー種)、神経セロリドリポフスチン症1、小脳性運動失調、NCL-A(ARSGエキソン2)、神経セロリドリポフスチン症6、NCL6(CLN6エキソン7)、I型ムコ多糖症、MPSI(IDUA)、腎嚢胞腺がん・結節性皮膚線維症、RCND(FLCNエキソン7)、神経セロリドリポフスチン症10、NCL10(CTSDエキソン5)、球様細胞白質萎縮症、クラッベ病(GALCエキソン5)、IIIA型グリコーゲン蓄積症、GSDIIIA(AGL)、神経セロリドリポフスチン症(MFSD8)、GM2ガングリオシドーシス(HEXB、プードル種)、X連鎖外胚葉性異形成症、無汗性外胚葉性形性異常(EDAイントロン8)、神経セロリドリポフスチン症(CLN8オーストラリアンシェパード種)、神経セロリドリポフスチン症8、NCL8(CLN8イングリッシュセッター種)、神経セロリドリポフスチン症1、NCL1(PPT1エキソン8)、神経セロリドリポフスチン症(CLN5ゴールデンレトリバー種)、VII型ムコ多糖症、スライ症候群、VII型MPS(GUSBエキソン5)、II型グリコーゲン蓄積症、ポンペ病、GSDII(GAA)、GM2ガングリオシドーシス(HEXA)、IIIA型ムコ多糖症、A型サンフィリポ症候群、MPSIIIA(SGSHエキソン6種2)、皮膚&結合組織、魚鱗癬(SLC27A4)、栄養障害性表皮水疱症(COL7A1)、魚鱗癬、表皮剥離性角質増殖症(KRT10)、外胚葉性異形成症、表皮水疱症候群(PKP1)、魚鱗癬(NIPAL4)、ムスラディン・ルーク症候群(ADAMTSL2)、限局性非表皮剥離性掌蹠角化症、先天性爪肥厚症(KRT16)、遺伝性鼻不全角化症(SUV39H2)、および遺伝性足蹠角化亢進症(FAM83G)、脳および脊髄系として、若年発症多発ニューロパシー、レオンベルガー多発ニューロパシー1、LPN1(LPN1、ARHGEF10)、小脳無生活力症、新生児小脳皮質変性症、NCCD(SPTBN2)、ナルコレプシー(HCRTR2イントロン6)、L-2-ヒドロキシグルタル酸尿症、L2HGA(L2HGDH)、小脳性運動失調に伴う海綿状変性症2、SDCA2(ATP1B2)、進行性神経無生活力症、犬の多系統変性症、CMSD(SERAC1エキソン15)、胎児発症新生児神経軸索ジストロフィー(MFN2)、発作に伴う新生児脳症、NEWS(ATF2)、良性若年性家族性てんかん、寛解性焦点てんかん(LGI2)、若年性喉頭麻痺・多発ニューロパシー、眼球異常および神経空胞形成に伴う眼球異常、POANV(PAB3GAP1、ロットワイラー種)、進行性神経無生活力症、犬の多系統変性症、CMSD(SERAC1エキソン4)、小脳性運動失調症、進行性早発性小脳性失調症(SEL1L)、遺伝性感覚自立性ニューロパシー、肢端切断症候群、AMS(GDNF-AS)、振戦幼犬症候群、X連鎖全身性振戦症候群(PLP)、低髄鞘形成(FNIP2)、脊髄小脳失調症、後発生運動失調症、LoSCA(CAPN1)、多発ニューロパシー、NDRG1グレーハウンド種(NDRG1エキソン15)、多発ニューロパシー、NDRG1マラミュート種(NDRG1エキソン4)、小脳形成不全(VLDLR)、小脳性運動失調に伴う海綿状変性症1、SDCA1、SeSAME/EAST症候群(KCNJ10)、ミオキミアおよび/または発作に伴う脊髄小脳失調症(KCNJ10)、アラスカンハスキー脳症、亜急性壊死性脊髄症(SLC19A3)、変性性脊髄症、DM(SOD1A)、およびアレキサンダー病(GFAP)、心臓系として、拡張型心筋症、DCM1(PDK4)、QT延長症候群(KCNQ1)、および拡張型心筋症、DCM2(TTN)、骨格系として、遺伝性ビタミンD抵抗性くる病(VDR)、骨形成不全症、骨粗鬆症(SERPINH1)、軟骨異形成症・椎間板疾患、CDDY/IVDD、I型IVDD(FGF4レトロゲン-CFA12)、骨形成不全症、骨粗鬆症(COL1A2)、頭蓋骨下顎骨骨症、CMO(SLC37A2)、骨格異形成症2、SD2(COL11A2)、口唇口蓋裂(ADAMTS20)、眼骨格異形成症1、小人症・網膜異形成症、OSD1(COL9A3、ラブラドールレトリバー種)、骨軟骨異形成症、および骨格小人症(SLC13A1)、代謝系として、悪性高体温症(RYR1)、低カタラーゼ血症、無カタラーゼ血症(CAT)、およびピルビン酸デヒドロゲナーゼ欠乏症(PDP1)、腎臓および膀胱系として、高尿酸尿症および高尿酸血症または尿石症、HUU(SLC2A9)、多発性嚢胞腎、PKD(PKD1)、タンパク喪失性腎症、PLN(NPHS1)、II-A型シスチン尿症(SLC3A1)、原発性高シュウ酸尿症(AGXT)、I-A型シスチン尿症(SLC3A1)、常染色体潜性遺伝性腎症、家族性腎症、ARHN(COL4A4エキソン3)、X連鎖遺伝性腎症、XLHN(COL4A5エキソン35、サモエド種2)、II-B型シスチン尿症(SLC7A9)、2,8-ジヒドロキシアデニン尿石症、および2,8-DHA尿石症(APRT)、神経筋系として、発作性減退症候群(BCAN)、先天性筋無力症症候群(CHAT)、免疫:重症複合型免疫不全症(RAG1)、X連鎖重症複合型免疫不全症(IL2RG種1)、重症複合型免疫不全症(PRKDC)、X連鎖重症複合型免疫不全症(IL2RG種2)、補体3欠損症、およびC3欠損症(C3)、胃腸系として、イマースルンド-グレスベック症候群、選択的コバラミン吸収不良(CUBNエキソン53)、イマースルンド-グレスベック症候群、および選択的コバラミン吸収不良(CUBNエキソン8)、臨床系として、MDR1薬物感受性(MDR1)、アラニンアミノトランスフェラーゼ活性(GPT)、ならびにホルモン系として、先天性甲状腺機能低下症(TPO、テンターフィールドテリア種)からなる群から選択される。いくつかの実施形態において、リスクは、該遺伝または健康状態個体の確率または相対リスクとして表される。いくつかの実施形態において、相対リスクは、数値(例えば相対リスク比)またはカテゴリー値(例えば「リスクあり」、「リスクなし」または「クリア」)である。いくつかの実施形態において、キャリア状態は、個体が遺伝または健康状態のキャリアであることについての肯定的または否定的指標として表される。
[0018]いくつかの実施形態において、該方法は、被験個体集団の1つまたは複数の個体の各々に対して、個体の1つまたは複数の犬種を特定するステップをさらに含む。いくつかの実施形態において、該方法は、被験個体集団の1つまたは複数の個体の各々に対して、個体の1つまたは複数の犬種の1つまたは複数の割合を特定するステップをさらに含む。いくつかの実施形態において、該方法は、被験個体集団の複数の個体の系譜を生成するステップをさらに含む。いくつかの実施形態において、該方法は、被験個体集団の1つまたは複数の個体の各々に対して、個体における表現型または形質の存在、不在またはリスクを特定するステップをさらに含む。いくつかの実施形態において、表現型または形質は、基本的な外被色(例えば、毛皮の明暗、色素の色および色の濃淡)、色彩的な外被修飾(例えば、隠れ模様、ボディパターンおよびフェースパターン)、外被形質(例えば、ファニッシング、外被長さ、脱毛、外被質感、無毛(ショロ型)、無毛(テリア型)および白色化)、ボディの特徴(例えば、鼻口の長さ、尾の長さ、狼爪、背の筋肉の盛り具合および分厚さ、ならびに目の色)、ボディサイズ(例えば、小さめ、中程度および大きめ)、行動(例えば高所順応性)、ならびに遺伝的多様性(例えば、近親交配の程度および免疫反応の多様性)からなる群から選択される。
[0019]いくつかの実施形態において、該方法は、祖先血縁、家族関係、遺伝または健康状態の存在、不在、リスクまたはキャリア状態、1つまたは複数の犬種、1つまたは複数の犬種の1つまたは複数の割合、系譜、表現型または形質の存在、不在、リスクまたはキャリア状態、およびそれらの組合せの1つまたは複数を示すレポートを生成するステップをさらに含む。いくつかの実施形態において、該方法は、レポートを獣医師に送信するステップをさらに含む。
[0020]別の態様において、本開示は、2倍体の2つの個体の間の祖先血縁度を推定するためのコンピュータシステムであって、被験個体集団のハプロタイプデータを格納するように構成されているデータベースであって、ハプロタイプデータが被験個体集団の中で共有される複数の遺伝子マーカーを含む、データベースと、データベースに動作可能に接続された1つまたは複数のコンピュータプロセッサとを備え、(a)複数の遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割し、(b)被験個体集団の各々に対して、(i)複数の遺伝子マーカーに基づいて、被験個体集団の中の第1の個体と第2の個体との間で同祖的であるハプロタイプデータのセグメントをマッチングさせ、マッチングされたセグメントの各々が少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含み、(ii)第1の個体と第2の個体との間のマッチングされたセグメントの各々に対して、マッチングされたセグメントを複数の個別のゲノム範囲に分割し、(i)第1の個体もしくは第2の個体内の個別のゲノム範囲の等しいサイズ度または(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて複数の個別のゲノム範囲の各々を得点付けることにより、複数の得点を生成し、複数の得点の整合性に基づいて複数の得点を補正することにより、複数の補正された得点を生成し、個別のゲノム範囲の複数の補正された得点に基づいて、複数の重みを複数の個別のゲノム範囲に割り当て、(iii)複数の補正された得点および複数の重みに基づいて、マッチングされたセグメントの複数の個別のゲノム範囲に対する加重和を算出し、(c)マッチングされたセグメントの加重和に基づいて、第1の個体と第2の個体との間の祖先血縁度を推定するように個別にまたは全体としてプログラミングされる、コンピュータシステムを提供する。
[0021]いくつかの実施形態において、2倍体集団は哺乳動物集団である。いくつかの実施形態において、哺乳動物集団は、イヌ科動物集団、ネコ科動物集団、スポーツ動物集団または齧歯動物集団である。いくつかの実施形態において、哺乳動物集団はイヌ科動物集団である。いくつかの実施形態において、哺乳動物集団は犬集団である。いくつかの実施形態において、哺乳動物集団はネコ科動物集団である。いくつかの実施形態において、ネコ科動物集団は猫集団である。いくつかの実施形態において、哺乳動物集団はスポーツ動物集団である。いくつかの実施形態において、スポーツ動物集団は馬集団である。いくつかの実施形態において、犬集団は、アーフェンピンシャー、アフガンハウンド、アフリカニス、アイディ、エアデールテリア、アクバシュ、秋田犬、アラングマスティフ、アラノエスパニョール、アルパハブルーブラッドブルドッグ、アラスカンクリーカイ、アラスカンマラミュート、アーラント、アロペキス、アルペンダックスブラッケ、アルセイシアンシェパルート、アメリカンアキタ、アメリカンブルドッグ、アメリカンコッカースパニエル、アメリカンエスキモードッグ、アメリカンフォックスハウンド、アメリカンヘアレステリア、アメリカンマスティフ、アメリカンピットブルテリア、アメリカンスタッフォードシャーテリア、アメリカンウォータースパニエル、アナトリアンシェパードドッグ、アングロフランセドゥプティットヴェヌリー、アッペンツェラーキャトルドッグ、アルゼンチンドゴ、アリエージュポインター、アリエージョワ、アーマント、アルトワハウンド、オーストラリアンブルドッグ、オーストラリアンキャトルドッグ、オーストラリアンケルピー、オーストラリアンシェパード、オーストラリアンシルキーテリア、オーストラリアンスタンピーテールキャトルドッグ、オーストラリアンテリア、オーストラリアンブラック・アンド・タンハウンド、オーストラリアンピンシャー、アザワク、カシミールシープドッグ、バルビー、バセンジー、バスクシェパードドッグ、バセーアルティジャンノルマン、バセーブルードガスコーニュ、バセーフォーブドブルターニュ、グランバセットグリフォンバンデーン、プチバセットグリフォンバンデーン、バヴァリアンマウンテンハウンド、ビーグル、ビーグルハーリア、ベアデットコリー、ボースロン、ベドリントンテリア、ベルジアンシェパードドッグ、ベルジアンシェパードドッグ(グローネンダール)、ベルジアンシェパードドッグ(ラケノア)、ベルジアンシェパードドッグ(マリノア)、ベルジアンシェパード(タービュレン)、ベルガマスコシェパード、ホワイトスイスシェパードドッグ、ピカルディシープドッグ、ベルナーラウフフント、バーニーズマウンテンドッグ、ビションフリーゼ、ビリー、ビスベン、ブラック・アンド・タンクーンハウンド、ブラック・アンド・タンバージニアフォックスハウンド、ブレンバイザー、ノルウェジアンエルクハウンドブラック、ブラックロシアンテリア、ブラックマウスカー、グランブルードガスコーニュ、プティブルードガスコーニュ、ブラッドハウンド、ブルーレーシー、ブルーポールテリー、ブルーティッククールハウンド、ボーアボール、ボヘミアンシェパード、ボロニーズ、ボーダーコリー、ボーダーテリア、ボルゾイ、ボスニアンラフヘアードハウンド、ボストンテリア、ブービエデアルデンヌ、ブービエデフランダース、ボクサー、ボイキンスパニエル、ブラッコイタリアーノ、ブラクドオーヴェルニュー、ブラクデュブルボネ、ブラクデュプイ、ブラクフランセ、ブラクサンジェルマン、ブラジリアンテリア、ブリアード、ブリケグリフォンバンデーン、ブリタニー、ブロホルマー、ブルーノシュラハウンド、ブコビナシーパードドッグ、ブル・アンド・テリア、ブルテリア、ブルテリア(ミニチュア)、ブルマスティフ、シンドマスティフ、ケアンテリア、カナーンドッグ、カナディアンエスキモードッグ、カナディアンポインター、カネコルソ、カオダセラデアイレス、カオデカストロラボレイロ、カオデフィラデサンミゲル、カロライナドッグ、カルパチアンシェパードドッグ、カタフーラカー、カタロニアンシープドッグ、コーカシアンシェパードドッグ、キャバリアキングチャールズスパニエル、セントラルアジアシェパードドッグ、チェスキーフォーセク、チェスキーテリア、ポーリッシュグレーハウンド、チェサピークベイレトリーバ、セントルイスグレイドッグ、シャンフランセブランエノワール、シャンフランセブランエオランジュ、シャンフランセトリコロール、チワワ、チリアンフォックステリア、重慶犬、チャイニーズクレステッドドッグ、
チャイニーズインペリアルドッグ、チヌーク、チッピパライ、チャウチャウ、シマロンウルグアヨ、チェリーシェリー、チルネコデルエトナ、クランバースパニエル、ラフコリー、スムースコリー、コンバイ、コルトバファイティングドッグ、コトンドテュレアール、クレタンハウンド、クロアチアンシープドッグ、カンバーランドシープドッグ、カーリーコーテッドレトルバー、チェコスロバキアンウルフドッグ、ダックスフント、ダルメシアン、ダンディディンモントテリア、ダーニッシュスウェーディッシュファームドッグ、ディンゴ、ドーベルマンピンシャー、ドーグドボルドー、ドゴキューバン、ドゴグアテマルテコ、ドゴサルデスコ、ドレンチェパトリッシュホンド、ドレーファー、ドゥンケル、ダッチシェパードドッグ、ダッチスムースフント、イーストヨーロピアンシェパード、イーストシベリアンライカ、エロ、イングリッシュコッカースパニエル、イングリッシュクーンハウンド、イングリッシュフォックスハウンド、イングリッシュマスティフ、イングリッシュポインター、イングリッシュセター、イングリッシュセパード、イングリッシュスプリンガースパニエル、イングリッシュトイテリア(ブラック&タン)、イングリッシュウォータースパニエル、イングリッシュホワイトテリア、エントレブッハーマウンテンドッグ、ブルーピカルディースパニエル、エストニアンハウンド、エストレラマウンテンドッグ、ユーラシア、フィールドスパニエル、フィラブラジレイロ、フィド、フィニッシュハウンド、フィニッシュラップフンド、フィニッシュスピッツ、フラットコーテッドレトリーバー、フォーモウサンマウンテンドッグ、フォックステリア(スムース)、ワイアーフォックステリア、フレンチブリタニー、フレンチブルドッグ、フレンチスパニエル、スパニッシュグレーハウンド、ジャーマンロングヘアードポインター、ジャーマンピンシャー、ジャーマンシェパードドッグ、ジャーマンショートエアードポインター、ジャーマンスパニエル、ジャーマンスピッツ、ジャーマンワイアーヘアードポインター、ジャイアントシュナウザー、グラン・オブ・イマールテリア、ゴールデンレトリバー、ゴードンセッター、グランアングロフランセブランエノワール、グランアングロフランセブランエオランジェ、グランアングロフランセトリコロール、グラングリフォンバンデーン、グランマスティンデボリンケン、グレートデン、グレートピレニーズ、グレータースイスマウンテンドッグ、グリーンランドドッグ、グレーハウンド、グリフォンブルードガスコーニュ、ブリュッセルグリフォン、グリフォンフォーヴドブルターニュ、グリフォンニヴェルネ、ガルドン、ガルテリア、ヘアインディアンドッグ、ハミルトンシュトーヴァレ、ハノーヴァリアンハウンド、ハーリア、ハバニーズ、ハワイアンポイドッグ、ヒマラヤンシープドッグ、北海道犬、スホルタイ、ホファヴァルト、ハンガリアンハウンド、ニュージーランドハンタウェイ、ハイゲンハウンド、イビザンハウンド、アイスランドシープドッグ、インディアンスピッツ、アイリッシュブルテリア、アイリッシュレッド・アンド・ホワイトセッター、アイリッシュセッター、アイリッシュスタッフォードシャーブルテリア、アイリッシュテリア、アイリッシュウォータースパニエル、アイリッシュウルフハウンド、イストリアンスムースヘアードハウンド、イストリアンコースヘアードハウンド、イタリアングレーハウンド、ジャックラッセルテリア、ヤークトテリア、イェムトフント、狆、日本スピッツ、日本テリア、ジョナンギ、カイカディ、甲斐犬、カンガルードッグ、カンニ、カラカハンドッグ、カレリアンベアドッグ、カルストシェパード、キースホンド、ケリービーグル、ケリーブルーテリア、キングチャールズスパニエル、キングシェパード、キンタマーニ、紀州犬、コモンドール、コーイケルホンディエ、クーリー、珍島犬、コリアンマスティフ、クロムフォルレンダー、クンミングウルフドッグ、クリ、クーバース、キーレオ、ラブラドールハスキー、ラブラドールレトリバー、ラゴットロマニョーロ、レークランドテリア、ランカシャーヒーラー、ランドシーア、ラポニアンハーダー、レオンベルガー、ラサアプソ、リトアニアンハウンド、ロングヘアードウィペット、ロッタローレブリンディジノ、ローシェン、マジャールアガール、マジェスティックツリーハウンド、マルチーズ、マンチェスターテリア、マレンマシープドッグ、マクナブ、メキシカンヘアレスドッグ、ミニチュアオーストラリアンシェパード、ミニチュアフォックステリア、ミニチュアピンシャー、ミニチュアシュナウザー、ミニチュアシベリアンハスキー、ミオリティック、モロサス、モンテネグリンマウンテンハウンド、モスクワンガーディアンマスティフ、モスコーウォータードッグ、マウンテンカー、マウンテンビューカー、ムクチェス、ムーディ、ムドホルハウンド、ラージミュンスターレンダー、スモールミュンスターレンダー、マレーリバーカーリーコーテッドレトリーバー、ナポリタンマスティフ、ニューファンドランド、ニューギニアンシンギングドッグ、ノーフォークスパニエル、ノーフォークテリア、ノルボッテンスペッツ、ノースカントリービーグル、ノーザンイヌイットドッグ、ノルウェジアンブーフンド、ノルウェジアンエルクハウンド、ノルウェジアンルンデフンド、ノーリッチテリア、ノヴァスコシアダックトーリングレトリーバー、オールドデニッシュポインター、オールドイングリッシュシープドッグ、オールドイングリッシュブルドッグ、オールドイングリッシュテリア、オールドジャーマンシェパードドッグ、オールディイングリッシュブルドッグ、オッターハウンド、パチョンナヴァロ、ペイズリーテリア、パピヨン、パーソンラッセルテリア、パタデールテリア、ペキニーズ、ペロデプレサカナリオ、ペロデプレサマヨルキン、ペルービアンヘアレスドッグ、ファレーヌ、ファラオハウンド、ピカルディスパニエル、プロットハウンド、ポデンコカナリオ、ポインター、ポリッシュハウンド、ポリッシュハンティングドッグ、ポリッシュローランドシープドッグ、ポリッシュタトラシープドッグ、ポメラニアン、ポンオードメルスパニエル、プードル、ポルスヌーレ、ポーチュギースポデンゴ、ポーチュギースポインター、ポーチュギーズウォータードッグ、プラシュスキークリサジーク、プードルポインター、パグ、プーリー、プーミー、豊山犬、ピレニアンマスティフ、ピレニアンシェパード、ラフェイロドアレンティジョ、ラジャパラヤム、ランプールグレーハウンド、ハストレアドールブラジレイロ、ラトネーロボデグエロアンダルース、ラットテリア、レッドボーンクーンハウンド、ローデシアンリッジバック、ロットワイラー、ロシアンスパニエル、ロシアントイ、ラッソヨーロピアンライカ、ラッセルテリア、サーロスウルフホンド、サブエソエスパニョール、セージアッシャーエリ、セージマザンダラニ、樺太犬、サルーキ、サモエド、サプサル、シャルプラニナッツ、シャーペンドース、シラーシュトーヴァレ、スキッパーキ、オールドクロアチアンサイトハウンド、ジャイアントシュナウザー、ミニチュアシュナウザー、スタンダードシュナウザー、スイスハウンド、スモールスイスハウンド、スコッチコリー、スコティッシュディアハウンド、スコティッシュテリア、シーリハムテリア、セグージョイタリアーノ、セッパラシベリアンスレッドドッグ、セルビアンハウンド、セルビアントライカラーハウンド、シャーペイ、シェットランドシープドッグ、柴犬、シーズー、四国犬、シャイロシェパードドッグ、シラク、シベリアンハスキー、シルケンウインドハウンド、シンハラハウンド、スカイテリア、スルーギ、スロヴァークチュヴァック、スロバキアンラフヘアードポインター、スロヴェンスキーコポフ、スモーラントシュトーヴァレ、スモールグリークドメスティックドッグ、ソフトコーテッドウィートンテリア、サウスロシアンオフチャルカ、サザンハウンド、スパニッシュマスティフ、スパニッシュウォータードッグ、スピノーネイタリアーノ、スポーティングルーカステリア、セントバーナード、セントジョンズウォータードッグ、シュタバイフーン、スタッフォードシャーブルテリア、スティーブンスカー、スティリアンコースヘアードハウンド、サセックススパニエル、スウェーディッシュラップフンド、スウェーディッシュヴァルフント、スウェーディッシュビーグル、タールタンベアドッグ、タイガン、タマスカンドッグ、テディルーズベルトテリア、テロミアン、テンターフィールドテリア、タイバーンケオドッグ、タイリッジバック、チベタンマスティフ、チベタンスパニエル、チベタンテリア、トルニャック、土佐犬、トイブルドッグ、トイフォックステリア、トイマンチェスターテリア、ツリーイングカー、ツリーイングウォーカークーンハウンド、ティロリアンハウンド、ウトナーガン、ビズラ、ヴォルピーノイタリアーノ、ワイマラナー、カーディガンウェルシュコーギ、ペンブロークウェルシュコーギ、ウェルシュシープドッグ、ウェルシュスプリンガースパニエル、ウェルシュテリア、ウエストハイランドホワイトテリア、ウエストシベリアンライカ、ウェストファリアンダックスブラッケ、ヴェッターフーン、ウィペット、ホワイトイングリッシュブルドッグ、ホワイトシェパードドッグ、ワイアーヘアードヴィズラ、ワイアーヘアードポインティンググリフォンおよびヨークシャーテリアからなる群から選択される1つまたは複数の犬種を含む。いくつかの実施形態において、該集団は、(例えば、単一品種を有する)1つまたは複数の純血種の犬、または(例えば、複数の品種を有する)1つまたは複数の雑種犬を含む。いくつかの実施形態において、該集団は、任意の数(例えば1、2、3、4、5、6、7、8、9、10もしくは10以上の)純血種の犬またはそれらの組合せのDNAを有する雑種犬の集団である。
[0022]いくつかの実施形態において、ハプロタイプデータは、ハプロタイプフェージングアルゴリズムを使用して被験個体集団の遺伝子型データを処理することによって生成される。いくつかの実施形態において、ハプロタイプフェージングアルゴリズムは、参照ベースのハプロタイプフェージングアルゴリズムを含む。いくつかの実施形態において、参照ベースのハプロタイプフェージングアルゴリズムは、隠れマルコフモデル(HMM)ベースのサーチを含む。いくつかの実施形態において、参照ベースのハプロタイプフェージングアルゴリズムは、Eagle1アルゴリズム、Eagle2アルゴリズム、PHASEアルゴリズム、fastPHASEアルゴリズム、BEAGLEアルゴリズム、Findhapアルゴリズム、Imputeアルゴリズム、FImputeアルゴリズム、AlphaImputeアルゴリズム、IMPUTE2アルゴリズム、MaCHアルゴリズム、SHAPEIT1アルゴリズム、SHAPEIT2アルゴリズム、SHAPEIT3アルゴリズム、SHAPEIT4アルゴリズム、またはそれらの組合せを含む。いくつかの実施形態において、ハプロタイプフェージングアルゴリズムは、コホートベースのハプロタイプフェージングアルゴリズムを含む。
[0023]いくつかの実施形態において、遺伝子型データは、被験個体集団から得られた生体試料を検定することによって得られる。いくつかの実施形態において、生体試料は、血液試料、唾液試料、スワブ試料、細胞試料または組織試料を含む。いくつかの実施形態において、検定は、生体試料またはそれらの派生物の配列決定を含む。
[0024]いくつかの実施形態において、複数の遺伝子マーカーは、少なくとも約500個、少なくとも約1000個、少なくとも約2000個、少なくとも約3000個、少なくとも約4000個、少なくとも約5000個、少なくとも約6000個、少なくとも約7000個、少なくとも約8000個、少なくとも約9000個、または少なくとも約10000個の異なる遺伝子マーカーを含む。
[0025]いくつかの実施形態において、同祖的であるハプロタイプのセグメントのマッチングは、GERMLINEアルゴリズム、PLINKアルゴリズム、PRESTアルゴリズム、IBD検出用ランダムプロジェクション(RaPID)アルゴリズム、IBD共有ハプロタイプ高速発見(FISHR)アルゴリズム、精密同祖(IBD)アルゴリズム、fastIBDアルゴリズム、KINGアルゴリズム、HaploScoreアルゴリズム、TRUFFLEアルゴリズム、またはそれらの組合せの使用を含む。いくつかの実施形態において、所定の閾値サイズは、約100キロベース塩基対(kbp)、約200kbp、約300kbp、約400kbp、約500kbp、約600kbp、約700kbp、約800kbp、約900kbp、または約1000kbpである。いくつかの実施形態において、所定の数の遺伝子マーカーは、約30個、約40個、約50個、約60個、約70個、約80個、約90個、または約100個の異なる遺伝子マーカーである。
[0026]いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、複数の個別のゲノム範囲の個別のゲノム範囲が等しいサイズを有するように、マッチングされたセグメントをさらに分割するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、複数の個別のゲノム範囲の個別のゲノム範囲が可変サイズを有するように、マッチングされたセグメントをさらに分割するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、複数の個別のゲノム範囲の所与の個別のゲノム範囲の可変サイズは、所与の個別のゲノム範囲に近接するIBDマッチの開始位置および終了位置、所与の個別のゲノム範囲における遺伝子マーカーの密度、所与の個別のゲノム範囲に対するマーカーの最大数、所与の個別のゲノム範囲の最大長さ、またはそれらの組合せに少なくとも部分的に基づいて決定される。
[0027]いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、(i)第1の個体または第2の個体内の個別のゲノム範囲の等しいサイズ度、および(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて、複数の個別のゲノム範囲の各々をさらに得点付けることにより、複数の等しいサイズ得点および複数の対合マッチング得点を生成するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、所与の対合マッチング得点と対応する等しいサイズ得点との整合性に基づいて、複数の対合マッチング得点をさらに補正することにより、複数の補正対合マッチング得点を生成するように個別にまたは全体としてプログラミングされる。
[0028]いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、2つの2倍体個体における2つのアレルについての複数の同一性状態に基づいて、複数の個別のゲノム範囲に複数の重みをさらに割り当てるように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、複数の同一性状態は、表1から選択される同一性状態を含み、複数の重みは、表1に記載される血縁rxyに対する複数の寄与に基づいて割り当てられる。いくつかの実施形態において、祖先血縁度は血縁係数を含む。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、
Figure 2023501006000004
で表される、マッチングされたセグメントの複数の個別のゲノム範囲に対する加重和をさらに算出するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、祖先血縁度は、親縁係数を含む。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、
Figure 2023501006000005
で表される、マッチングされたセグメントの複数の個別のゲノム範囲に対する加重和をさらに算出するように個別にまたは全体としてプログラミングされる。
[0029]いくつかの実施形態において、第1の個体と第2の個体との間の祖先血縁度を推定することは、第1の個体または第2の個体の近親交配の程度を決定することを含む。いくつかの実施形態において、第1の個体と第2の個体との間の祖先血縁度を推定することは、第1の個体および第2の個体の近親交配の程度を決定することを含む。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、第1の個体および第2の個体の近親交配の程度に少なくとも部分的に基づいて、第1の個体と第2の個体との家族関係をさらに決定するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。いくつかの実施形態において、家族関係は、第1の個体と第2の個体との間の祖先血縁度が一対のヒトの間に想定される祖先血縁度に匹敵するように一対のヒトの間の関係として示される。いくつかの実施形態において、該関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。
[0030]いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度をさらに決定するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度に基づいて、第1の個体と第2の個体とを交配させるか否かを示す提案をさらに決定するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度が近親交配の所定の閾値の程度を超えない場合に、第1の個体と第2の個体とを交配させることを示す提案をさらに決定するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度が近親交配の所定の閾値の程度を超える場合に、第1の個体と第2の個体とを交配させないことを示す提案をさらに決定するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、近親交配の所定の閾値の程度は、約0.10、約0.15、約0.20、約0.25、約0.30、約0.35、約0.40、約0.45または約0.50である。
[0031]いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、第1の個体と第2の個体との推定される祖先血縁度に少なくとも部分的に基づいて、第1の個体に関連する第1の人間と第2の個体に関連する第2の人間との社会的つながりをさらに生成するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、社会的つながりは、第1の個体と第2の個体との推定される祖先血縁度が所定の閾値を超える場合に生成される。いくつかの実施形態において、所定の閾値は、約0.00001、約0.0001、約0.001、約0.01、約0.02、約0.04、約0.06、約0.08、約0.1、約0.12、約0.14、約0.16、約0.18、約0.2、約0.25、約0.3、約0.35、約0.4、約0.45または約0.5である。いくつかの実施形態において、社会的つながりは、ソーシャルメディアネットワークを通じて生成される。いくつかの実施形態において、第1の人間は第1の個体のペット所有者であり、第2の人間は第2の個体のペット所有者である。いくつかの実施形態において、同じ人間が、第1の個体および第2の個体のペット所有者である。いくつかの実施形態において、第1の人間と第2の人間との社会的つながりを生成するステップは、第1の人間または第2の人間の位置を提供するステップを含む。いくつかの実施形態において、第1の人間と第2の人間との社会的つながりを生成するステップは、第1の人間と第2の人間との通信リンクを提供するステップを含む。
[0032]いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、祖先血縁度に少なくとも部分的に基づいて、第1の個体と第2の個体との家族関係をさらに特定するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。いくつかの実施形態において、家族関係は、第1の個体と第2の個体との間の祖先血縁度が一対のヒトの間に想定される祖先血縁度に匹敵するように一対のヒトの間の関係として示される。いくつかの実施形態において、該関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。
[0033]いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、被験個体集団の1つまたは複数の個体の各々に対して、個体における遺伝または健康状態の存在、不在、リスクまたはキャリア状態をさらに特定するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、遺伝または健康状態は、血小板病症(RASGRP2エキソン8)、ピルビン酸キナーゼ欠損症(PKLRエキソン7パグ種)、第IX因子欠乏症、B型血友病(F9エキソン7、テリア種)、ピルビン酸キナーゼ欠損症(PKLRエキソン7ビーグル種)、P2Y12受容体血小板異常(P2RY12)、I型グランツマン血小板無力症(ITGA2Bエキソン12)、II型フォンヴィルブランド病、II型vWD(VWF)、メイヘグリン異常症(MYH9)、血小板病症(RASGRP2エキソン5、アメリカンエスキモードッグ種)、第IX因子欠乏症、B型血友病(F9エキソン7、ローデシアンリッジバック種)、I型フォンヴィルブランド病(VWF)、犬の楕円赤血球症(SPTBエキソン30)、犬のIII型白血球接着不全症、LAD3(FERMT3)、プレカリクレイン欠乏症(KLKB1エキソン8)、III型フォンヴィルブランド病、III型vWD(VWFエキソン4)、第VIII因子欠乏症、A型血友病(F8エキソン10、ボクサー種)、捕捉好中球症候群(VPS13B)、ピルビン酸キナーゼ欠損症(PKLRエキソン7ラブラドール種)、血小板病症(RASGRP2エキソン5、バセットハウンド種)、ピルビン酸キナーゼ欠損症(PKLRエキソン5)、第VIII因子欠乏症、A型血友病(F8エキソン1、シェパード種2)、第VII因子欠乏症(F7エキソン5)、先天性巨大血小板性血小板減少症(TUBB1エキソン1、キャバリアキングチャールズスパニエル種)、木質膜炎、LM(PLG)、ピルビン酸キナーゼ欠損症(PKLRエキソン10)、および第VIII因子欠乏症、A型血友病(F8エキソン11、シェパード種1)、他の系として、シャーペイ自己炎症性疾患、SPAID、シャーペイ熱(MTBP)、常染色体劣性エナメル質形成不全症、家族性エナメル質形成不全(イタリアングレーハウンド種)、持続性ミュラー管症候群、PMDS(AMHR2)、ならびにドーベルマンの難聴および前庭症候群、DVDob、DINGS、眼系として、進行性網膜萎縮症、crd(IQCB1)、原発性水晶体脱臼(ADAMTS17)、緑内障原発性開放隅角緑内障(ADAMTS17エキソン2)、進行性網膜萎縮症、crd1(PDE6B)、進行性網膜萎縮症、rcd1桿体錐体形成不全、rcd1(PDE6Bエキソン21アイリッシュセッター種)、コリーの眼異常、脈絡膜形成不全、CEA(NHEJ1)、進行性網膜萎縮症(SAG)、色覚異常(CNGA3エキソン7ジャーマンシェパード種)、犬の多発性網膜症cmr2(BEST1エキソン5)、緑内障原発性開放隅角緑内障(ADAMTS17エキソン11)、進行性網膜萎縮症、prcd進行性桿体錐体変性症(PRCDエキソン1)、遺伝性白内障、早発性白内障、若年性白内障(HSF4エキソン9シェパード種)、常染色体優性進行性網膜萎縮症(RHO)、犬の多発性網膜症cmr3(BESTエキソン10SNP)、色覚異常(CNGA3エキソン7ラブラドールレトリバー種)、犬の多発性網膜症cmr1(BEST1エキソン2)、進行性網膜萎縮症、rcd3桿体錐体形成不全、rcd3(PDE6A)、進行性網膜萎縮症(CNGB1)、ゴールデンレトリバー進行性網膜萎縮症1、GR-PRA1(SLC4A3)、進行性網膜萎縮症-crd4/cord1(RPGRIP1)、先天性停止性夜盲(RPE65)、斑状角膜変性症、MCD(CHST6)、緑内障原発性開放隅角緑内障(ADAMTS10エキソン9)、犬の多発性網膜症cmr3(BEST1エキソン10欠損)、および緑内障原発性開放隅角緑内障(ADAMTS10エキソン17)、筋肉系として、中心核ミオパチー(PTPLA)、先天性ミオトニー(CLCN1エキソン7)、グレートデンの遺伝性ミオパチー(BIN1)、先天性ミオトニー(CLCN1エキソン23)、筋ジストロフィー(DMDウェルシュコーギーペンブローク種)、運動誘導虚脱(DNM1)、筋ジストロフィー(DMDゴールデンレトリバー種)、ミオスタチン欠損、ブリーウィペット症候群(MSTN)、筋細管ミオパチー1、X連鎖筋細管ミオパチー、XL-MTM(MTM1、ラブラドール種)、および筋ジストロフィー(キャバリアキングチャールズスパニエル種1)、多系として、原発性線毛運動障害、PCD(CCDC39エキソン3)、
GM1ガングリオシドーシス(GLB1エキソン2)、IIIA型ムコ多糖症、A型サンフィリポ症候群、MPSIIIA(SGSHエキソン6種1)、成体発症神経セロリドリポフスチン症(ATP13A2)、GM1ガングリオシドーシス(GLB1エキソン15柴犬種)、神経セロリドリポフスチン症2、NCL2(TPP1エキソン4)、VII型ムコ多糖症、スライ症候群、MPSVII(GUSBエキソン3)、犬のフコシドーシス(FUCA1)、GM1ガングリオシドーシス(GLB1エキソン15アラスカンハスキー種)、ラゴット蓄積症(ATG4D)、乾性角結膜炎・魚鱗癬様皮膚炎、乾性眼カーリーコート症候群、CKCSID(FAM83Hエキソン5)、VII型グリコーゲン蓄積症、ホスホフルクトキナーゼ欠乏症、PFK欠乏症(PFKMウィペットおよびイングリッシュスプリンガースパニエル、IA型グリコーゲン蓄積症、フォンギールケ病、GSDIA(G6PC)、VII型グリコーゲン蓄積症、ホスホスルフトキナーゼ欠乏症、PFK欠乏症(PFKMヴァハテルフント種)、神経セロリドリポフスチン症1、NCL1(CLN5ボーダーコリー種)、神経セロリドリポフスチン症1、小脳性運動失調、NCL-A(ARSGエキソン2)、神経セロリドリポフスチン症6、NCL6(CLN6エキソン7)、I型ムコ多糖症、MPSI(IDUA)、腎嚢胞腺がん・結節性皮膚線維症、RCND(FLCNエキソン7)、神経セロリドリポフスチン症10、NCL10(CTSDエキソン5)、球様細胞白質萎縮症、クラッベ病(GALCエキソン5)、IIIA型グリコーゲン蓄積症、GSDIIIA(AGL)、神経セロリドリポフスチン症(MFSD8)、GM2ガングリオシドーシス(HEXB、プードル種)、X連鎖外胚葉性異形成症、無汗性外胚葉性形性異常(EDAイントロン8)、神経セロリドリポフスチン症(CLN8オーストラリアンシェパード種)、神経セロリドリポフスチン症8、NCL8(CLN8イングリッシュセッター種)、神経セロリドリポフスチン症1、NCL1(PPT1エキソン8)、神経セロリドリポフスチン症(CLN5ゴールデンレトリバー種)、VII型ムコ多糖症、スライ症候群、VII型MPS(GUSBエキソン5)、II型グリコーゲン蓄積症、ポンペ病、GSDII(GAA)、GM2ガングリオシドーシス(HEXA)、IIIA型ムコ多糖症、A型サンフィリポ症候群、MPSIIIA(SGSHエキソン6種2)、皮膚&結合組織、魚鱗癬(SLC27A4)、栄養障害性表皮水疱症(COL7A1)、魚鱗癬、表皮剥離性角質増殖症(KRT10)、外胚葉性異形成症、表皮水疱症候群(PKP1)、魚鱗癬(NIPAL4)、ムスラディン・ルーク症候群(ADAMTSL2)、限局性非表皮剥離性掌蹠角化症、先天性爪肥厚症(KRT16)、遺伝性鼻不全角化症(SUV39H2)、および遺伝性足蹠角化亢進症(FAM83G)、脳および脊髄系として、若年発症多発ニューロパシー、レオンベルガー多発ニューロパシー1、LPN1(LPN1、ARHGEF10)、小脳無生活力症、新生児小脳皮質変性症、NCCD(SPTBN2)、ナルコレプシー(HCRTR2イントロン6)、L-2-ヒドロキシグルタル酸尿症、L2HGA(L2HGDH)、小脳性運動失調に伴う海綿状変性症2、SDCA2(ATP1B2)、進行性神経無生活力症、犬の多系統変性症、CMSD(SERAC1エキソン15)、胎児発症新生児神経軸索ジストロフィー(MFN2)、発作に伴う新生児脳症、NEWS(ATF2)、良性若年性家族性てんかん、寛解性焦点てんかん(LGI2)、若年性喉頭麻痺・多発ニューロパシー、眼球異常および神経空胞形成に伴う眼球異常、POANV(PAB3GAP1、ロットワイラー種)、進行性神経無生活力症、犬の多系統変性症、CMSD(SERAC1エキソン4)、小脳性運動失調症、進行性早発性小脳性失調症(SEL1L)、遺伝性感覚自立性ニューロパシー、肢端切断症候群、AMS(GDNF-AS)、振戦幼犬症候群、X連鎖全身性振戦症候群(PLP)、低髄鞘形成(FNIP2)、脊髄小脳失調症、後発生運動失調症、LoSCA(CAPN1)、多発ニューロパシー、NDRG1グレーハウンド種(NDRG1エキソン15)、多発ニューロパシー、NDRG1マラミュート種(NDRG1エキソン4)、小脳形成不全(VLDLR)、小脳性運動失調に伴う海綿状変性症1、SDCA1、SeSAME/EAST症候群(KCNJ10)、ミオキミアおよび/または発作に伴う脊髄小脳失調症(KCNJ10)、アラスカンハスキー脳症、亜急性壊死性脊髄症(SLC19A3)、変性性脊髄症、DM(SOD1A)、およびアレキサンダー病(GFAP)、心臓系として、拡張型心筋症、DCM1(PDK4)、QT延長症候群(KCNQ1)、および拡張型心筋症、DCM2(TTN)、骨格系として、遺伝性ビタミンD抵抗性くる病(VDR)、骨形成不全症、骨粗鬆症(SERPINH1)、軟骨異形成症・椎間板疾患、CDDY/IVDD、I型IVDD(FGF4レトロゲン-CFA12)、骨形成不全症、骨粗鬆症(COL1A2)、頭蓋骨下顎骨骨症、CMO(SLC37A2)、骨格異形成症2、SD2(COL11A2)、口唇口蓋裂(ADAMTS20)、眼骨格異形成症1、小人症・網膜異形成症、OSD1(COL9A3、ラブラドールレトリバー種)、骨軟骨異形成症、および骨格小人症(SLC13A1)、代謝系として、悪性高体温症(RYR1)、低カタラーゼ血症、無カタラーゼ血症(CAT)、およびピルビン酸デヒドロゲナーゼ欠乏症(PDP1)、腎臓および膀胱系として、高尿酸尿症および高尿酸血症または尿石症、HUU(SLC2A9)、多発性嚢胞腎、PKD(PKD1)、タンパク喪失性腎症、PLN(NPHS1)、II-A型シスチン尿症(SLC3A1)、原発性高シュウ酸尿症(AGXT)、I-A型シスチン尿症(SLC3A1)、常染色体潜性遺伝性腎症、家族性腎症、ARHN(COL4A4エキソン3)、X連鎖遺伝性腎症、XLHN(COL4A5エキソン35、サモエド種2)、II-B型シスチン尿症(SLC7A9)、2,8-ジヒドロキシアデニン尿石症、および2,8-DHA尿石症(APRT)、神経筋系として、発作性減退症候群(BCAN)、先天性筋無力症症候群(CHAT)、免疫:重症複合型免疫不全症(RAG1)、X連鎖重症複合型免疫不全症(IL2RG種1)、重症複合型免疫不全症(PRKDC)、X連鎖重症複合型免疫不全症(IL2RG種2)、補体3欠損症、およびC3欠損症(C3)、胃腸系として、イマースルンド-グレスベック症候群、選択的コバラミン吸収不良(CUBNエキソン53)、イマースルンド-グレスベック症候群、および選択的コバラミン吸収不良(CUBNエキソン8)、臨床系として、MDR1薬物感受性(MDR1)、アラニンアミノトランスフェラーゼ活性(GPT)、ならびにホルモン系として、先天性甲状腺機能低下症(TPO、テンターフィールドテリア種)からなる群から選択される。いくつかの実施形態において、リスクは、該遺伝または健康状態個体の確率または相対リスクとして表される。いくつかの実施形態において、相対リスクは、数値(例えば相対リスク比)またはカテゴリー値(例えば「リスクあり」、「リスクなし」または「クリア」)である。いくつかの実施形態において、キャリア状態は、個体が遺伝または健康状態のキャリアであることについての肯定的または否定的指標として表される。
[0034]いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、被験個体集団の1つまたは複数の個体の各々に対して、個体の1つまたは複数の犬種をさらに特定するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、被験個体集団の1つまたは複数の個体の各々に対して、個体の1つまたは複数の犬種の1つまたは複数の割合をさらに特定するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、被験個体集団の複数の個体の系譜をさらに生成するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、被験個体集団の1つまたは複数の個体の各々に対して、個体における表現型または形質の存在、不在またはリスクをさらに特定するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、表現型または形質は、基本的な外被色(例えば、毛皮の明暗、色素の色および色の濃淡)、色彩的な外被修飾(例えば、隠れ模様、ボディパターンおよびフェースパターン)、外被形質(例えば、ファニッシング、外被長さ、脱毛、外被質感、無毛(ショロ型)、無毛(テリア型)および白色化)、ボディの特徴(例えば、鼻口の長さ、尾の長さ、狼爪、背の筋肉の盛り具合および分厚さ、ならびに目の色)、ボディサイズ(例えば、小さめ、中程度および大きめ)、行動(例えば高所順応性)、ならびに遺伝的多様性(例えば、近親交配の程度および免疫反応の多様性)からなる群から選択される。
[0035]いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、祖先血縁、家族関係、遺伝または健康状態の存在、不在、リスクまたはキャリア状態、1つまたは複数の犬種、1つまたは複数の犬種の1つまたは複数の割合、系譜、表現型または形質の存在、不在、リスクまたはキャリア状態、およびそれらの組合せの1つまたは複数を示すレポートをさらに生成するように個別にまたは全体としてプログラミングされる。いくつかの実施形態において、1つまたは複数のコンピュータプロセッサは、レポートを獣医師にさらに送信するように個別にまたは全体としてプログラミングされる。
[0036]別の態様において、本開示は、1つまたは複数のコンピュータプロセッサにより実行されると、2倍体集団の2つの個体間の祖先血縁度を推定するための方法であって、(a)被験個体集団に対するハプロタイプデータを受け取るステップであって、ハプロタイプデータが、被験個体集団中で共有される複数の遺伝子マーカーを含む、ステップと、(b)複数の遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割するステップと、(c)被験個体集団の各々に対して、(i)複数の遺伝子マーカーに基づいて、被験個体集団の中の第1の個体と第2の個体との間で同祖的であるハプロタイプデータのセグメントをマッチングさせ、マッチングされたセグメントの各々が少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含み、(ii)第1の個体と第2の個体との間のマッチングされたセグメントの各々に対して、マッチングされたセグメントを複数の個別のゲノム範囲に分割し、(i)第1の個体もしくは第2の個体内の個別のゲノム範囲の等しいサイズ度または(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて複数の個別のゲノム範囲の各々を得点付けることにより、複数の得点を生成し、複数の得点の整合性に基づいて複数の得点を補正することにより、複数の補正された得点を生成し、個別のゲノム範囲の複数の補正された得点に基づいて、複数の重みを複数の個別のゲノム範囲に割り当て、(iii)複数の補正された得点および複数の重みに基づいて、マッチングされたセグメントの複数の個別のゲノム範囲に対する加重和を算出するステップと、(d)マッチングされたセグメントの加重和に基づいて、第1の個体と第2の個体との間の祖先血縁度を推定するステップとを含む方法を実施する機械実行可能コードを含む非一時的コンピュータ可読媒体を提供する。
[0037]いくつかの実施形態において、2倍体集団は哺乳動物集団である。いくつかの実施形態において、哺乳動物集団は、イヌ科動物集団、ネコ科動物集団、スポーツ動物集団または齧歯動物集団である。いくつかの実施形態において、哺乳動物集団はイヌ科動物集団である。いくつかの実施形態において、哺乳動物集団は犬集団である。いくつかの実施形態において、哺乳動物集団はネコ科動物集団である。いくつかの実施形態において、ネコ科動物集団は猫集団である。いくつかの実施形態において、哺乳動物集団はスポーツ動物集団である。いくつかの実施形態において、スポーツ動物集団は馬集団である。いくつかの実施形態において、犬集団は、アーフェンピンシャー、アフガンハウンド、アフリカニス、アイディ、エアデールテリア、アクバシュ、秋田犬、アラングマスティフ、アラノエスパニョール、アルパハブルーブラッドブルドッグ、アラスカンクリーカイ、アラスカンマラミュート、アーラント、アロペキス、アルペンダックスブラッケ、アルセイシアンシェパルート、アメリカンアキタ、アメリカンブルドッグ、アメリカンコッカースパニエル、アメリカンエスキモードッグ、アメリカンフォックスハウンド、アメリカンヘアレステリア、アメリカンマスティフ、アメリカンピットブルテリア、アメリカンスタッフォードシャーテリア、アメリカンウォータースパニエル、アナトリアンシェパードドッグ、アングロフランセドゥプティットヴェヌリー、アッペンツェラーキャトルドッグ、アルゼンチンドゴ、アリエージュポインター、アリエージョワ、アーマント、アルトワハウンド、オーストラリアンブルドッグ、オーストラリアンキャトルドッグ、オーストラリアンケルピー、オーストラリアンシェパード、オーストラリアンシルキーテリア、オーストラリアンスタンピーテールキャトルドッグ、オーストラリアンテリア、オーストラリアンブラック・アンド・タンハウンド、オーストラリアンピンシャー、アザワク、カシミールシープドッグ、バルビー、バセンジー、バスクシェパードドッグ、バセーアルティジャンノルマン、バセーブルードガスコーニュ、バセーフォーブドブルターニュ、グランバセットグリフォンバンデーン、プチバセットグリフォンバンデーン、バヴァリアンマウンテンハウンド、ビーグル、ビーグルハーリア、ベアデットコリー、ボースロン、ベドリントンテリア、ベルジアンシェパードドッグ、ベルジアンシェパードドッグ(グローネンダール)、ベルジアンシェパードドッグ(ラケノア)、ベルジアンシェパードドッグ(マリノア)、ベルジアンシェパード(タービュレン)、ベルガマスコシェパード、ホワイトスイスシェパードドッグ、ピカルディシープドッグ、ベルナーラウフフント、バーニーズマウンテンドッグ、ビションフリーゼ、ビリー、ビスベン、ブラック・アンド・タンクーンハウンド、ブラック・アンド・タンバージニアフォックスハウンド、ブレンバイザー、ノルウェジアンエルクハウンドブラック、ブラックロシアンテリア、ブラックマウスカー、グランブルードガスコーニュ、プティブルードガスコーニュ、ブラッドハウンド、ブルーレーシー、ブルーポールテリー、ブルーティッククールハウンド、ボーアボール、ボヘミアンシェパード、ボロニーズ、ボーダーコリー、ボーダーテリア、ボルゾイ、ボスニアンラフヘアードハウンド、ボストンテリア、ブービエデアルデンヌ、ブービエデフランダース、ボクサー、ボイキンスパニエル、ブラッコイタリアーノ、ブラクドオーヴェルニュー、ブラクデュブルボネ、ブラクデュプイ、ブラクフランセ、ブラクサンジェルマン、ブラジリアンテリア、ブリアード、ブリケグリフォンバンデーン、ブリタニー、ブロホルマー、ブルーノシュラハウンド、ブコビナシーパードドッグ、ブル・アンド・テリア、ブルテリア、ブルテリア(ミニチュア)、ブルマスティフ、シンドマスティフ、ケアンテリア、カナーンドッグ、カナディアンエスキモードッグ、カナディアンポインター、カネコルソ、カオダセラデアイレス、カオデカストロラボレイロ、カオデフィラデサンミゲル、カロライナドッグ、カルパチアンシェパードドッグ、カタフーラカー、カタロニアンシープドッグ、コーカシアンシェパードドッグ、キャバリアキングチャールズスパニエル、セントラルアジアシェパードドッグ、チェスキーフォーセク、チェスキーテリア、ポーリッシュグレーハウンド、チェサピークベイレトリーバ、セントルイスグレイドッグ、シャンフランセブランエノワール、シャンフランセブランエオランジュ、シャンフランセトリコロール、チワワ、チリアンフォックステリア、重慶犬、チャイニーズクレステッドドッグ、
チャイニーズインペリアルドッグ、チヌーク、チッピパライ、チャウチャウ、シマロンウルグアヨ、チェリーシェリー、チルネコデルエトナ、クランバースパニエル、ラフコリー、スムースコリー、コンバイ、コルトバファイティングドッグ、コトンドテュレアール、クレタンハウンド、クロアチアンシープドッグ、カンバーランドシープドッグ、カーリーコーテッドレトルバー、チェコスロバキアンウルフドッグ、ダックスフント、ダルメシアン、ダンディディンモントテリア、ダーニッシュスウェーディッシュファームドッグ、ディンゴ、ドーベルマンピンシャー、ドーグドボルドー、ドゴキューバン、ドゴグアテマルテコ、ドゴサルデスコ、ドレンチェパトリッシュホンド、ドレーファー、ドゥンケル、ダッチシェパードドッグ、ダッチスムースフント、イーストヨーロピアンシェパード、イーストシベリアンライカ、エロ、イングリッシュコッカースパニエル、イングリッシュクーンハウンド、イングリッシュフォックスハウンド、イングリッシュマスティフ、イングリッシュポインター、イングリッシュセター、イングリッシュセパード、イングリッシュスプリンガースパニエル、イングリッシュトイテリア(ブラック&タン)、イングリッシュウォータースパニエル、イングリッシュホワイトテリア、エントレブッハーマウンテンドッグ、ブルーピカルディースパニエル、エストニアンハウンド、エストレラマウンテンドッグ、ユーラシア、フィールドスパニエル、フィラブラジレイロ、フィド、フィニッシュハウンド、フィニッシュラップフンド、フィニッシュスピッツ、フラットコーテッドレトリーバー、フォーモウサンマウンテンドッグ、フォックステリア(スムース)、ワイアーフォックステリア、フレンチブリタニー、フレンチブルドッグ、フレンチスパニエル、スパニッシュグレーハウンド、ジャーマンロングヘアードポインター、ジャーマンピンシャー、ジャーマンシェパードドッグ、ジャーマンショートエアードポインター、ジャーマンスパニエル、ジャーマンスピッツ、ジャーマンワイアーヘアードポインター、ジャイアントシュナウザー、グラン・オブ・イマールテリア、ゴールデンレトリバー、ゴードンセッター、グランアングロフランセブランエノワール、グランアングロフランセブランエオランジェ、グランアングロフランセトリコロール、グラングリフォンバンデーン、グランマスティンデボリンケン、グレートデン、グレートピレニーズ、グレータースイスマウンテンドッグ、グリーンランドドッグ、グレーハウンド、グリフォンブルードガスコーニュ、ブリュッセルグリフォン、グリフォンフォーヴドブルターニュ、グリフォンニヴェルネ、ガルドン、ガルテリア、ヘアインディアンドッグ、ハミルトンシュトーヴァレ、ハノーヴァリアンハウンド、ハーリア、ハバニーズ、ハワイアンポイドッグ、ヒマラヤンシープドッグ、北海道犬、スホルタイ、ホファヴァルト、ハンガリアンハウンド、ニュージーランドハンタウェイ、ハイゲンハウンド、イビザンハウンド、アイスランドシープドッグ、インディアンスピッツ、アイリッシュブルテリア、アイリッシュレッド・アンド・ホワイトセッター、アイリッシュセッター、アイリッシュスタッフォードシャーブルテリア、アイリッシュテリア、アイリッシュウォータースパニエル、アイリッシュウルフハウンド、イストリアンスムースヘアードハウンド、イストリアンコースヘアードハウンド、イタリアングレーハウンド、ジャックラッセルテリア、ヤークトテリア、イェムトフント、狆、日本スピッツ、日本テリア、ジョナンギ、カイカディ、甲斐犬、カンガルードッグ、カンニ、カラカハンドッグ、カレリアンベアドッグ、カルストシェパード、キースホンド、ケリービーグル、ケリーブルーテリア、キングチャールズスパニエル、キングシェパード、キンタマーニ、紀州犬、コモンドール、コーイケルホンディエ、クーリー、珍島犬、コリアンマスティフ、クロムフォルレンダー、クンミングウルフドッグ、クリ、クーバース、キーレオ、ラブラドールハスキー、ラブラドールレトリバー、ラゴットロマニョーロ、レークランドテリア、ランカシャーヒーラー、ランドシーア、ラポニアンハーダー、レオンベルガー、ラサアプソ、リトアニアンハウンド、ロングヘアードウィペット、ロッタローレブリンディジノ、ローシェン、マジャールアガール、マジェスティックツリーハウンド、マルチーズ、マンチェスターテリア、マレンマシープドッグ、マクナブ、メキシカンヘアレスドッグ、ミニチュアオーストラリアンシェパード、ミニチュアフォックステリア、ミニチュアピンシャー、ミニチュアシュナウザー、ミニチュアシベリアンハスキー、ミオリティック、モロサス、モンテネグリンマウンテンハウンド、モスクワンガーディアンマスティフ、モスコーウォータードッグ、マウンテンカー、マウンテンビューカー、ムクチェス、ムーディ、ムドホルハウンド、ラージミュンスターレンダー、スモールミュンスターレンダー、マレーリバーカーリーコーテッドレトリーバー、ナポリタンマスティフ、ニューファンドランド、ニューギニアンシンギングドッグ、ノーフォークスパニエル、ノーフォークテリア、ノルボッテンスペッツ、ノースカントリービーグル、ノーザンイヌイットドッグ、ノルウェジアンブーフンド、ノルウェジアンエルクハウンド、ノルウェジアンルンデフンド、ノーリッチテリア、ノヴァスコシアダックトーリングレトリーバー、オールドデニッシュポインター、オールドイングリッシュシープドッグ、オールドイングリッシュブルドッグ、オールドイングリッシュテリア、オールドジャーマンシェパードドッグ、オールディイングリッシュブルドッグ、オッターハウンド、パチョンナヴァロ、ペイズリーテリア、パピヨン、パーソンラッセルテリア、パタデールテリア、ペキニーズ、ペロデプレサカナリオ、ペロデプレサマヨルキン、ペルービアンヘアレスドッグ、ファレーヌ、ファラオハウンド、ピカルディスパニエル、プロットハウンド、ポデンコカナリオ、ポインター、ポリッシュハウンド、ポリッシュハンティングドッグ、ポリッシュローランドシープドッグ、ポリッシュタトラシープドッグ、ポメラニアン、ポンオードメルスパニエル、プードル、ポルスヌーレ、ポーチュギースポデンゴ、ポーチュギースポインター、ポーチュギーズウォータードッグ、プラシュスキークリサジーク、プードルポインター、パグ、プーリー、プーミー、豊山犬、ピレニアンマスティフ、ピレニアンシェパード、ラフェイロドアレンティジョ、ラジャパラヤム、ランプールグレーハウンド、ハストレアドールブラジレイロ、ラトネーロボデグエロアンダルース、ラットテリア、レッドボーンクーンハウンド、ローデシアンリッジバック、ロットワイラー、ロシアンスパニエル、ロシアントイ、ラッソヨーロピアンライカ、ラッセルテリア、サーロスウルフホンド、サブエソエスパニョール、セージアッシャーエリ、セージマザンダラニ、樺太犬、サルーキ、サモエド、サプサル、シャルプラニナッツ、シャーペンドース、シラーシュトーヴァレ、スキッパーキ、オールドクロアチアンサイトハウンド、ジャイアントシュナウザー、ミニチュアシュナウザー、スタンダードシュナウザー、スイスハウンド、スモールスイスハウンド、スコッチコリー、スコティッシュディアハウンド、スコティッシュテリア、シーリハムテリア、セグージョイタリアーノ、セッパラシベリアンスレッドドッグ、セルビアンハウンド、セルビアントライカラーハウンド、シャーペイ、シェットランドシープドッグ、柴犬、シーズー、四国犬、シャイロシェパードドッグ、シラク、シベリアンハスキー、シルケンウインドハウンド、シンハラハウンド、スカイテリア、スルーギ、スロヴァークチュヴァック、スロバキアンラフヘアードポインター、スロヴェンスキーコポフ、スモーラントシュトーヴァレ、スモールグリークドメスティックドッグ、ソフトコーテッドウィートンテリア、サウスロシアンオフチャルカ、サザンハウンド、スパニッシュマスティフ、スパニッシュウォータードッグ、スピノーネイタリアーノ、スポーティングルーカステリア、セントバーナード、セントジョンズウォータードッグ、シュタバイフーン、スタッフォードシャーブルテリア、スティーブンスカー、スティリアンコースヘアードハウンド、サセックススパニエル、スウェーディッシュラップフンド、スウェーディッシュヴァルフント、スウェーディッシュビーグル、タールタンベアドッグ、タイガン、タマスカンドッグ、テディルーズベルトテリア、テロミアン、テンターフィールドテリア、タイバーンケオドッグ、タイリッジバック、チベタンマスティフ、チベタンスパニエル、チベタンテリア、トルニャック、土佐犬、トイブルドッグ、トイフォックステリア、トイマンチェスターテリア、ツリーイングカー、ツリーイングウォーカークーンハウンド、ティロリアンハウンド、ウトナーガン、ビズラ、ヴォルピーノイタリアーノ、ワイマラナー、カーディガンウェルシュコーギ、ペンブロークウェルシュコーギ、ウェルシュシープドッグ、ウェルシュスプリンガースパニエル、ウェルシュテリア、ウエストハイランドホワイトテリア、ウエストシベリアンライカ、ウェストファリアンダックスブラッケ、ヴェッターフーン、ウィペット、ホワイトイングリッシュブルドッグ、ホワイトシェパードドッグ、ワイアーヘアードヴィズラ、ワイアーヘアードポインティンググリフォンおよびヨークシャーテリアからなる群から選択される1つまたは複数の犬種を含む。いくつかの実施形態において、該集団は、(例えば、単一品種を有する)1つまたは複数の純血種の犬、または(例えば、複数の品種を有する)1つまたは複数の雑種犬を含む。いくつかの実施形態において、該集団は、任意の数の(例えば1、2、3、4、5、6、7、8、9、10もしくは10以上の)純血種の犬またはそれらの組合せのDNAを有する雑種犬の集団である。
[0038]いくつかの実施形態において、ハプロタイプデータは、ハプロタイプフェージングアルゴリズムを使用して被験個体集団の遺伝子型データを処理することによって生成される。いくつかの実施形態において、ハプロタイプフェージングアルゴリズムは、参照ベースのハプロタイプフェージングアルゴリズムを含む。いくつかの実施形態において、参照ベースのハプロタイプフェージングアルゴリズムは、隠れマルコフモデル(HMM)ベースのサーチを含む。いくつかの実施形態において、参照ベースのハプロタイプフェージングアルゴリズムは、Eagle1アルゴリズム、Eagle2アルゴリズム、PHASEアルゴリズム、fastPHASEアルゴリズム、BEAGLEアルゴリズム、Findhapアルゴリズム、Imputeアルゴリズム、FImputeアルゴリズム、AlphaImputeアルゴリズム、IMPUTE2アルゴリズム、MaCHアルゴリズム、SHAPEIT1アルゴリズム、SHAPEIT2アルゴリズム、SHAPEIT3アルゴリズム、SHAPEIT4アルゴリズム、またはそれらの組合せを含む。いくつかの実施形態において、ハプロタイプフェージングアルゴリズムは、コホートベースのハプロタイプフェージングアルゴリズムを含む。
[0039]いくつかの実施形態において、遺伝子型データは、被験個体集団から得られた生体試料を検定することによって得られる。いくつかの実施形態において、生体試料は、血液試料、唾液試料、スワブ試料、細胞試料または組織試料を含む。いくつかの実施形態において、検定は、生体試料またはそれらの派生物の配列決定を含む。
[0040]いくつかの実施形態において、複数の遺伝子マーカーは、少なくとも約500個、少なくとも約1000個、少なくとも約2000個、少なくとも約3000個、少なくとも約4000個、少なくとも約5000個、少なくとも約6000個、少なくとも約7000個、少なくとも約8000個、少なくとも約9000個、または少なくとも約10000個の異なる遺伝子マーカーを含む。
[0041]いくつかの実施形態において、同祖的であるハプロタイプのセグメントのマッチングは、GERMLINEアルゴリズム、PLINKアルゴリズム、PRESTアルゴリズム、IBD検出用ランダムプロジェクション(RaPID)アルゴリズム、IBD共有ハプロタイプ高速発見(FISHR)アルゴリズム、精密同祖(IBD)アルゴリズム、fastIBDアルゴリズム、KINGアルゴリズム、HaploScoreアルゴリズム、TRUFFLEアルゴリズム、またはそれらの組合せの使用を含む。いくつかの実施形態において、所定の閾値サイズは、約100キロベース塩基対(kbp)、約200kbp、約300kbp、約400kbp、約500kbp、約600kbp、約700kbp、約800kbp、約900kbp、または約1000kbpである。いくつかの実施形態において、所定の数の遺伝子マーカーは、約30個、約40個、約50個、約60個、約70個、約80個、約90個、または約100個の異なる遺伝子マーカーである。
[0042]いくつかの実施形態において、該方法は、複数の個別のゲノム範囲の個別のゲノム範囲が等しいサイズを有するように、マッチングされたセグメントを分割するステップをさらに含む。いくつかの実施形態において、該方法は、複数の個別のゲノム範囲の個別のゲノム範囲が可変サイズを有するように、マッチングされたセグメントを分割するステップをさらに含む。いくつかの実施形態において、複数の個別のゲノム範囲の所与の個別のゲノム範囲の可変サイズは、所与の個別のゲノム範囲に近接するIBDマッチの開始位置および終了位置、所与の個別のゲノム範囲における遺伝子マーカーの密度、所与の個別のゲノム範囲に対するマーカーの最大数、所与の個別のゲノム範囲の最大長さ、またはそれらの組合せに少なくとも部分的に基づいて決定される。
[0043]いくつかの実施形態において、該方法は、(i)第1の個体または第2の個体内の個別のゲノム範囲の等しいサイズ度、および(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて、複数の個別のゲノム範囲の各々を得点付けることにより、複数の等しいサイズ得点および複数の対合マッチング得点を生成するステップをさらに含む。いくつかの実施形態において、該方法は、所与の対合マッチング得点と対応する等しいサイズ得点との整合性に基づいて、複数の対合マッチング得点を補正することにより、複数の補正対合マッチング得点を生成するステップをさらに含む。
[0044]いくつかの実施形態において、該方法は、2つの2倍体個体における2つのアレルについての複数の同一性状態に基づいて、複数の個別のゲノム範囲に複数の重みを割り当てるステップをさらに含む。いくつかの実施形態において、複数の同一性状態は、表1から選択される同一性状態を含み、複数の重みは、表1に記載される血縁rxyに対する複数の寄与に基づいて割り当てられる。いくつかの実施形態において、祖先血縁度は、血縁係数を含む。いくつかの実施形態において、該方法は、
Figure 2023501006000006
で表される、マッチングされたセグメントの複数の個別のゲノム範囲に対する加重和を算出するステップをさらに含む。いくつかの実施形態において、祖先血縁度は、親縁係数を含む。いくつかの実施形態において、該方法は、
Figure 2023501006000007
で表される、マッチングされたセグメントの複数の個別のゲノム範囲に対する加重和を算出するステップをさらに含む。
[0045]いくつかの実施形態において、第1の個体と第2の個体との間の祖先血縁度を推定するステップは、第1の個体または第2の個体の近親交配の程度を決定するステップを含む。いくつかの実施形態において、第1の個体と第2の個体との間の祖先血縁度を推定するステップは、第1の個体および第2の個体の近親交配の程度を決定するステップを含む。いくつかの実施形態において、該方法は、第1の個体および第2の個体の近親交配の程度に少なくとも部分的に基づいて、第1の個体と第2の個体との家族関係を決定するステップをさらに含む。いくつかの実施形態において、家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。いくつかの実施形態において、家族関係は、第1の個体と第2の個体との間の祖先血縁度が一対のヒトの間に想定される祖先血縁度に匹敵するように一対のヒトの間の関係として示される。いくつかの実施形態において、該関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。
[0046]いくつかの実施形態において、該方法は、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度を決定するステップをさらに含む。いくつかの実施形態において、該方法は、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度に基づいて、第1の個体と第2の個体とを交配させるか否かを示す提案を決定するステップをさらに含む。いくつかの実施形態において、該方法は、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度が近親交配の所定の閾値の程度を超えない場合に、第1の個体と第2の個体とを交配させることを示す提案を決定するステップをさらに含む。いくつかの実施形態において、該方法は、第1の個体と第2の個体の潜在的子孫の想定される近親交配の程度が近親交配の所定の閾値の程度を超える場合に、第1の個体と第2の個体とを交配させないことを示す提案を決定するステップをさらに含む。いくつかの実施形態において、近親交配の所定の閾値の程度は、約0.10、約0.15、約0.20、約0.25、約0.30、約0.35、約0.40、約0.45または約0.50である。
[0047]いくつかの実施形態において、該方法は、第1の個体と第2の個体との推定される祖先血縁度に少なくとも部分的に基づいて、第1の個体に関連する第1の人間と第2の個体に関連する第2の人間との社会的つながりを生成するステップをさらに含む。いくつかの実施形態において、社会的つながりは、第1の個体と第2の個体との推定される祖先血縁度が所定の閾値を超える場合に生成される。いくつかの実施形態において、所定の閾値は、約0.00001、約0.0001、約0.001、約0.01、約0.02、約0.04、約0.06、約0.08、約0.1、約0.12、約0.14、約0.16、約0.18、約0.2、約0.25、約0.3、約0.35、約0.4、約0.45または約0.5である。いくつかの実施形態において、社会的つながりは、ソーシャルメディアネットワークを通じて生成される。いくつかの実施形態において、第1の人間は、第1の個体のペット所有者であり、第2の人間は、第2の個体のペット所有者である。いくつかの実施形態において、同じ人間が、第1の個体および第2の個体のペット所有者である。いくつかの実施形態において、第1の人間と第2の人間との社会的つながりを生成するステップは、第1の人間または第2の人間の位置を提供するステップを含む。いくつかの実施形態において、第1の人間と第2の人間との社会的つながりを生成するステップは、第1の人間と第2の人間との通信リンクを提供するステップを含む。
[0048]いくつかの実施形態において、該方法は、祖先血縁度に少なくとも部分的に基づいて、第1の個体と第2の個体との家族関係を特定するステップをさらに含む。いくつかの実施形態において、家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。いくつかの実施形態において、家族関係は、第1の個体と第2の個体との間の祖先血縁度が一対のヒトの間に想定される祖先血縁度に匹敵するように一対のヒトの間の関係として示される。いくつかの実施形態において、該関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、祖父母-孫関係、または曾祖父母-曾孫関係である。
[0049]いくつかの実施形態において、該方法は、被験個体集団の1つまたは複数の個体の各々に対して、個体における遺伝または健康状態の存在、不在、リスクまたはキャリア状態を特定するステップをさらに含む。いくつかの実施形態において、遺伝または健康状態は、血小板病症(RASGRP2エキソン8)、ピルビン酸キナーゼ欠損症(PKLRエキソン7パグ種)、第IX因子欠乏症、B型血友病(F9エキソン7、テリア種)、ピルビン酸キナーゼ欠損症(PKLRエキソン7ビーグル種)、P2Y12受容体血小板異常(P2RY12)、I型グランツマン血小板無力症(ITGA2Bエキソン12)、II型フォンヴィルブランド病、II型vWD(VWF)、メイヘグリン異常症(MYH9)、血小板病症(RASGRP2エキソン5、アメリカンエスキモードッグ種)、第IX因子欠乏症、B型血友病(F9エキソン7、ローデシアンリッジバック種)、I型フォンヴィルブランド病(VWF)、犬の楕円赤血球症(SPTBエキソン30)、犬のIII型白血球接着不全症、LAD3(FERMT3)、プレカリクレイン欠乏症(KLKB1エキソン8)、III型フォンヴィルブランド病、III型vWD(VWFエキソン4)、第VIII因子欠乏症、A型血友病(F8エキソン10、ボクサー種)、捕捉好中球症候群(VPS13B)、ピルビン酸キナーゼ欠損症(PKLRエキソン7ラブラドール種)、血小板病症(RASGRP2エキソン5、バセットハウンド種)、ピルビン酸キナーゼ欠損症(PKLRエキソン5)、第VIII因子欠乏症、A型血友病(F8エキソン1、シェパード種2)、第VII因子欠乏症(F7エキソン5)、先天性巨大血小板性血小板減少症(TUBB1エキソン1、キャバリアキングチャールズスパニエル種)、木質膜炎、LM(PLG)、ピルビン酸キナーゼ欠損症(PKLRエキソン10)、および第VIII因子欠乏症、A型血友病(F8エキソン11、シェパード種1)、他の系として、シャーペイ自己炎症性疾患、SPAID、シャーペイ熱(MTBP)、常染色体劣性エナメル質形成不全症、家族性エナメル質形成不全(イタリアングレーハウンド種)、持続性ミュラー管症候群、PMDS(AMHR2)、ならびにドーベルマンの難聴および前庭症候群、DVDob、DINGS、眼系として、進行性網膜萎縮症、crd(IQCB1)、原発性水晶体脱臼(ADAMTS17)、緑内障原発性開放隅角緑内障(ADAMTS17エキソン2)、進行性網膜萎縮症、crd1(PDE6B)、進行性網膜萎縮症、rcd1桿体錐体形成不全、rcd1(PDE6Bエキソン21アイリッシュセッター種)、コリーの眼異常、脈絡膜形成不全、CEA(NHEJ1)、進行性網膜萎縮症(SAG)、色覚異常(CNGA3エキソン7ジャーマンシェパード種)、犬の多発性網膜症cmr2(BEST1エキソン5)、緑内障原発性開放隅角緑内障(ADAMTS17エキソン11)、進行性網膜萎縮症、prcd進行性桿体錐体変性症(PRCDエキソン1)、遺伝性白内障、早発性白内障、若年性白内障(HSF4エキソン9シェパード種)、常染色体優性進行性網膜萎縮症(RHO)、犬の多発性網膜症cmr3(BESTエキソン10SNP)、色覚異常(CNGA3エキソン7ラブラドールレトリバー種)、犬の多発性網膜症cmr1(BEST1エキソン2)、進行性網膜萎縮症、rcd3桿体錐体形成不全、rcd3(PDE6A)、進行性網膜萎縮症(CNGB1)、ゴールデンレトリバー進行性網膜萎縮症1、GR-PRA1(SLC4A3)、進行性網膜萎縮症-crd4/cord1(RPGRIP1)、先天性停止性夜盲(RPE65)、斑状角膜変性症、MCD(CHST6)、緑内障原発性開放隅角緑内障(ADAMTS10エキソン9)、犬の多発性網膜症cmr3(BEST1エキソン10欠損)、および緑内障原発性開放隅角緑内障(ADAMTS10エキソン17)、筋肉系として、中心核ミオパチー(PTPLA)、先天性ミオトニー(CLCN1エキソン7)、グレートデンの遺伝性ミオパチー(BIN1)、先天性ミオトニー(CLCN1エキソン23)、筋ジストロフィー(DMDウェルシュコーギーペンブローク種)、運動誘導虚脱(DNM1)、筋ジストロフィー(DMDゴールデンレトリバー種)、ミオスタチン欠損、ブリーウィペット症候群(MSTN)、筋細管ミオパチー1、X連鎖筋細管ミオパチー、XL-MTM(MTM1、ラブラドール種)、および筋ジストロフィー(キャバリアキングチャールズスパニエル種1)、多系として、原発性線毛運動障害、PCD(CCDC39エキソン3)、
GM1ガングリオシドーシス(GLB1エキソン2)、IIIA型ムコ多糖症、A型サンフィリポ症候群、MPSIIIA(SGSHエキソン6種1)、成体発症神経セロリドリポフスチン症(ATP13A2)、GM1ガングリオシドーシス(GLB1エキソン15柴犬種)、神経セロリドリポフスチン症2、NCL2(TPP1エキソン4)、VII型ムコ多糖症、スライ症候群、MPSVII(GUSBエキソン3)、犬のフコシドーシス(FUCA1)、GM1ガングリオシドーシス(GLB1エキソン15アラスカンハスキー種)、ラゴット蓄積症(ATG4D)、乾性角結膜炎・魚鱗癬様皮膚炎、乾性眼カーリーコート症候群、CKCSID(FAM83Hエキソン5)、VII型グリコーゲン蓄積症、ホスホフルクトキナーゼ欠乏症、PFK欠乏症(PFKMウィペットおよびイングリッシュスプリンガースパニエル、IA型グリコーゲン蓄積症、フォンギールケ病、GSDIA(G6PC)、VII型グリコーゲン蓄積症、ホスホスルフトキナーゼ欠乏症、PFK欠乏症(PFKMヴァハテルフント種)、神経セロリドリポフスチン症1、NCL1(CLN5ボーダーコリー種)、神経セロリドリポフスチン症1、小脳性運動失調、NCL-A(ARSGエキソン2)、神経セロリドリポフスチン症6、NCL6(CLN6エキソン7)、I型ムコ多糖症、MPSI(IDUA)、腎嚢胞腺がん・結節性皮膚線維症、RCND(FLCNエキソン7)、神経セロリドリポフスチン症10、NCL10(CTSDエキソン5)、球様細胞白質萎縮症、クラッベ病(GALCエキソン5)、IIIA型グリコーゲン蓄積症、GSDIIIA(AGL)、神経セロリドリポフスチン症(MFSD8)、GM2ガングリオシドーシス(HEXB、プードル種)、X連鎖外胚葉性異形成症、無汗性外胚葉性形性異常(EDAイントロン8)、神経セロリドリポフスチン症(CLN8オーストラリアンシェパード種)、神経セロリドリポフスチン症8、NCL8(CLN8イングリッシュセッター種)、神経セロリドリポフスチン症1、NCL1(PPT1エキソン8)、神経セロリドリポフスチン症(CLN5ゴールデンレトリバー種)、VII型ムコ多糖症、スライ症候群、VII型MPS(GUSBエキソン5)、II型グリコーゲン蓄積症、ポンペ病、GSDII(GAA)、GM2ガングリオシドーシス(HEXA)、IIIA型ムコ多糖症、A型サンフィリポ症候群、MPSIIIA(SGSHエキソン6種2)、皮膚&結合組織、魚鱗癬(SLC27A4)、栄養障害性表皮水疱症(COL7A1)、魚鱗癬、表皮剥離性角質増殖症(KRT10)、外胚葉性異形成症、表皮水疱症候群(PKP1)、魚鱗癬(NIPAL4)、ムスラディン・ルーク症候群(ADAMTSL2)、限局性非表皮剥離性掌蹠角化症、先天性爪肥厚症(KRT16)、遺伝性鼻不全角化症(SUV39H2)、および遺伝性足蹠角化亢進症(FAM83G)、脳および脊髄系として、若年発症多発ニューロパシー、レオンベルガー多発ニューロパシー1、LPN1(LPN1、ARHGEF10)、小脳無生活力症、新生児小脳皮質変性症、NCCD(SPTBN2)、ナルコレプシー(HCRTR2イントロン6)、L-2-ヒドロキシグルタル酸尿症、L2HGA(L2HGDH)、小脳性運動失調に伴う海綿状変性症2、SDCA2(ATP1B2)、進行性神経無生活力症、犬の多系統変性症、CMSD(SERAC1エキソン15)、胎児発症新生児神経軸索ジストロフィー(MFN2)、発作に伴う新生児脳症、NEWS(ATF2)、良性若年性家族性てんかん、寛解性焦点てんかん(LGI2)、若年性喉頭麻痺・多発ニューロパシー、眼球異常および神経空胞形成に伴う眼球異常、POANV(PAB3GAP1、ロットワイラー種)、進行性神経無生活力症、犬の多系統変性症、CMSD(SERAC1エキソン4)、小脳性運動失調症、進行性早発性小脳性失調症(SEL1L)、遺伝性感覚自立性ニューロパシー、肢端切断症候群、AMS(GDNF-AS)、振戦幼犬症候群、X連鎖全身性振戦症候群(PLP)、低髄鞘形成(FNIP2)、脊髄小脳失調症、後発生運動失調症、LoSCA(CAPN1)、多発ニューロパシー、NDRG1グレーハウンド種(NDRG1エキソン15)、多発ニューロパシー、NDRG1マラミュート種(NDRG1エキソン4)、小脳形成不全(VLDLR)、小脳性運動失調に伴う海綿状変性症1、SDCA1、SeSAME/EAST症候群(KCNJ10)、ミオキミアおよび/または発作に伴う脊髄小脳失調症(KCNJ10)、アラスカンハスキー脳症、亜急性壊死性脊髄症(SLC19A3)、変性性脊髄症、DM(SOD1A)、およびアレキサンダー病(GFAP)、心臓系として、拡張型心筋症、DCM1(PDK4)、QT延長症候群(KCNQ1)、および拡張型心筋症、DCM2(TTN)、骨格系として、遺伝性ビタミンD抵抗性くる病(VDR)、骨形成不全症、骨粗鬆症(SERPINH1)、軟骨異形成症・椎間板疾患、CDDY/IVDD、I型IVDD(FGF4レトロゲン-CFA12)、骨形成不全症、骨粗鬆症(COL1A2)、頭蓋骨下顎骨骨症、CMO(SLC37A2)、骨格異形成症2、SD2(COL11A2)、口唇口蓋裂(ADAMTS20)、眼骨格異形成症1、小人症・網膜異形成症、OSD1(COL9A3、ラブラドールレトリバー種)、骨軟骨異形成症、および骨格小人症(SLC13A1)、代謝系として、悪性高体温症(RYR1)、低カタラーゼ血症、無カタラーゼ血症(CAT)、およびピルビン酸デヒドロゲナーゼ欠乏症(PDP1)、腎臓および膀胱系として、高尿酸尿症および高尿酸血症または尿石症、HUU(SLC2A9)、多発性嚢胞腎、PKD(PKD1)、タンパク喪失性腎症、PLN(NPHS1)、II-A型シスチン尿症(SLC3A1)、原発性高シュウ酸尿症(AGXT)、I-A型シスチン尿症(SLC3A1)、常染色体潜性遺伝性腎症、家族性腎症、ARHN(COL4A4エキソン3)、X連鎖遺伝性腎症、XLHN(COL4A5エキソン35、サモエド種2)、II-B型シスチン尿症(SLC7A9)、2,8-ジヒドロキシアデニン尿石症、および2,8-DHA尿石症(APRT)、神経筋系として、発作性減退症候群(BCAN)、先天性筋無力症症候群(CHAT)、免疫:重症複合型免疫不全症(RAG1)、X連鎖重症複合型免疫不全症(IL2RG種1)、重症複合型免疫不全症(PRKDC)、X連鎖重症複合型免疫不全症(IL2RG種2)、補体3欠損症、およびC3欠損症(C3)、胃腸系として、イマースルンド-グレスベック症候群、選択的コバラミン吸収不良(CUBNエキソン53)、イマースルンド-グレスベック症候群、および選択的コバラミン吸収不良(CUBNエキソン8)、臨床系として、MDR1薬物感受性(MDR1)、アラニンアミノトランスフェラーゼ活性(GPT)、ならびにホルモン系として、先天性甲状腺機能低下症(TPO、テンターフィールドテリア種)からなる群から選択される。いくつかの実施形態において、リスクは、該遺伝または健康状態個体の確率または相対リスクとして表される。いくつかの実施形態において、相対リスクは、数値(例えば相対リスク比)またはカテゴリー値(例えば「リスクあり」、「リスクなし」または「クリア」)である。いくつかの実施形態において、キャリア状態は、個体が遺伝または健康状態のキャリアであることについての肯定的または否定的指標として表される。
[0050]いくつかの実施形態において、該方法は、被験個体集団の1つまたは複数の個体の各々に対して、個体の1つまたは複数の犬種を特定するステップをさらに含む。いくつかの実施形態において、該方法は、被験個体集団の1つまたは複数の個体の各々に対して、個体の1つまたは複数の犬種の1つまたは複数の割合を特定するステップをさらに含む。いくつかの実施形態において、該方法は、被験個体集団の複数の個体の系譜を生成するステップをさらに含む。いくつかの実施形態において、該方法は、被験個体集団の1つまたは複数の個体の各々に対して、個体における表現型または形質の存在、不在またはリスクを特定するステップをさらに含む。いくつかの実施形態において、表現型または形質は、基本的な外被色(例えば、毛皮の明暗、色素の色および色の濃淡)、色彩的な外被修飾(例えば、隠れ模様、ボディパターンおよびフェースパターン)、外被形質(例えば、ファニッシング、外被長さ、脱毛、外被質感、無毛(ショロ型)、無毛(テリア型)および白色化)、ボディの特徴(例えば、鼻口の長さ、尾の長さ、狼爪、背の筋肉の盛り具合および分厚さ、ならびに目の色)、ボディサイズ(例えば、小さめ、中程度および大きめ)、行動(例えば高所順応性)、ならびに遺伝的多様性(例えば、近親交配の程度および免疫反応の多様性)からなる群から選択される。
[0051]いくつかの実施形態において、該方法は、祖先血縁、家族関係、遺伝または健康状態の存在、不在、リスクまたはキャリア状態、1つまたは複数の犬種、1つまたは複数の犬種の1つまたは複数の割合、系譜、表現型または形質の存在、不在、リスクまたはキャリア状態、およびそれらの組合せの1つまたは複数を示すレポートを生成するステップをさらに含む。いくつかの実施形態において、該方法は、レポートを獣医師に送信するステップをさらに含む。
[0052]本開示の別の態様は、1つまたは複数のコンピュータプロセッサにより実行されると、上記または本明細書の他の箇所に記載の方法のいずれかを実施する機械実行可能コードを含む非一時的コンピュータ可読媒体を提供する。
[0053]本開示の別の態様は、1つまたは複数のコンピュータプロセッサと、それに接続されたコンピュータメモリを備えるシステムを提供する。該コンピュータメモリは、1つまたは複数のコンピュータプロセッサにより実行されると、上記または本明細書の他の箇所に記載の方法のいずれかを実施する機械実行可能コードを含む。
[0054]本開示のさらなる態様および利点は、本開示の単に例示的な実施形態を明示および記載する以下の詳細な説明から当業者が容易に理解するであろう。認識されるように、本開示は、他の実施形態および異なる実施形態が可能であり、そのいくつかの詳細は、いずれも開示内容から逸脱することなく種々の明らかな点において修正可能である。よって、図面および説明は、本質的に例示であると捉えられるべきであり、限定するものと捉えられるべきでない。
参照による援用
[0055]本明細書に記載の全ての出版物、特許および特許出願は、個々の出版物、特許または特許出願が、参照により組み込まれていることが示されるのと同程度に、参照により本明細書に組み込まれている。本明細書は、参照により組み込まれている出版物および特許または特許出願が本明細書に含まれる開示内容と矛盾する程度まで、あらゆる当該矛盾する文献を凌駕し、かつ/またはそれらに優先することを意図する。
[0056]本発明の新規の特徴は、特に請求の範囲に記載される。本発明の特徴および利点は、発明の原理を利用する例示的な実施形態を記載する以下の詳細な説明、および以下に説明する添付の図面(本明細書では「図」(「Figure」および「FIG.」)とも称する)を参照することによってより深く理解されるであろう。
[0057]いくつかの実施形態に係る、2倍体集団の2つの個体間の祖先血縁度を推定する例示的方法を示す図である。 [0058]本明細書に提示の方法を実施するようにプログラミング、または他の形態で構成されるコンピュータシステムを示す図である。
[0059]発明の様々な実施形態を本明細書に明示および記載したが、当該実施形態は、単に例として提示されていることが当業者に明らかである。本発明から逸脱することなく多くの改変、変更および置き換えが行われることを当業者は理解できる。本明細書に記載の発明の様々な代替物を採用できることが理解されるべきである。
[0060]明細書および請求の範囲に用いられるように、単数形「a」、「an」および「the」は、文脈上明白に他の意味に解釈すべき場合を除いて、複数形を含む。例えば、「試料(a sample)」という用語は、それらの混合物を含む複数の試料を含む。
[0061]本明細書に用いられるように、「被験者」という用語は、通常、試験可能または検出可能な遺伝情報を有する実体または媒体を指す。被験者は、人間、個体または患者であり得る。被験者は、例えば哺乳動物などの脊椎動物であり得る。哺乳動物の非限定的な例としては、ヒト、サル、家畜、スポーツ動物、齧歯動物、およびペット(例えば犬などのイヌ科動物、または猫などのネコ科動物)が挙げられる。被験者は、正常または異常な健康または生理学的状態を有してもよく、正常または異常な健康または生理学的状態を有することが疑われてもよい。被験者は、健康または生理学的状態を示す兆候を示していてもよい。あるいは、被験者は、当該健康または生理学的状態に関して無症状であり得る。
[0062]本明細書で用いられる「核酸」または「ポリヌクレオチド」という用語は、通常、1つまたは複数の核酸サブユニットまたはヌクレオチドを含む分子を指す。核酸は、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)およびウラシル(U)、またはそれらの変異体から選択される1つまたは複数のヌクレオチドを含んでいてもよい。ヌクレオチドは、通常、ヌクレオシド、および少なくとも1、2、3、4、5、6、7、8、9または10個以上のリン酸(P03)基を含む。ヌクレオチドは、核酸塩基、五炭糖(リボースまたはデオキシリボース)、および1つまたは複数のリン酸基を個々にまたは組み合わせて含むことができる。リボヌクレオチドは、糖がリボースであるヌクレオチドである。デオキシリボヌクレオチドは、糖がデオキシリボースであるヌクレオチドである。ヌクレオチドは、一リン酸ヌクレオシドまたはポリリン酸ヌクレオシドであり得る。ヌクレオチドは、例えば、発酵性タグまたはマーカー(例えばフルオロフォア)などの検出可能タグを含む、トリリン酸デオキシアデノシン(dATP)、トリリン酸デオキシシチジン(dCTP)、トリリン酸デオキシグアノシン(dGTP)、トリリン酸ウリジン(dUTP)およびトリリン酸デオキシチミジン(dTTP)dNTPから選択され得るトリリン酸デオキシリボヌクレオシド(dNTP)などのポリリン酸デオキシリボヌクレオシドであり得る。ヌクレオチドは、成長する核酸鎖に組み込むことができる任意のサブユニットを含むことができる。当該サブユニットは、A、C、G、TもしくはU、または1つまたは複数の相補的なA、C、G、TもしくはUに特異的である任意の他のサブユニット、またはプリン(すなわちAもしくはG、またはその変異体)、またはピリミジン(すなわちC、TもしくはU、またはその変異体)であり得る。いくつかの例において、核酸は、デオキシリボ核酸(DNA)、リボ核酸(RNA)、またはそれらの誘導体もしくは変異体である。核酸は、一本鎖または二本鎖であってもよい。核酸分子は、線形、湾曲形、円形、またはそれらの任意の組合せであってもよい。
[0063]本明細書で用いられるように、「核酸分子」、「核酸配列」、「核酸断片」、「オリゴヌクレオチド」および「ポリヌクレオチド」という用語は、通常、様々な長さを有してもよいポリヌクレオチド、例えば、デオキシリボヌクレオチドもしくはリボヌクレオチド(RNA)、またはその類似体を指す。核酸分子は、少なくとも約5塩基、10塩基、20塩基、30塩基、40塩基、50塩基、60塩基、70塩基、80塩基、90塩基、100塩基、110塩基、120塩基、130塩基、140塩基、150塩基、160塩基、170塩基、180塩基、190塩基、200塩基、300塩基、400塩基、500塩基、1キロ塩基(kb)、2kb、3kb、4kb、5kb、10kbもしくは50kbの長さを有することができる、または前述の値の任意の2つの間の任意の数の塩基を有してもよい。オリゴヌクレオチドは、典型的には、アデニン(A)、シトシン(C)、グアニン(G)およびチミン(T)(ポリヌクレオチドがRNAの場合はチミン(T)の代わりにウラシル(U))の4つのヌクレオチド塩基の特異的配列で構成される。したがって、「核酸分子」、「核酸配列」、「核酸断片」、「オリゴヌクレオチド」および「ポリヌクレオチド」という用語は、少なくとも部分的に、ポリヌクレオチド分子のアルファベット順表記であることを意図する。あるいは、該用語は、ポリヌクレオチド分子自体に適用されてもよい。このアルファベット順表記を、中央処理装置を有するコンピュータのデータベースに入れ、かつ/または機能ゲノミクスおよび相同性検索などの生物情報学の用途に利用することができる。オリゴヌクレオチドとしては、1つまたは複数の標準ヌクレオチド、ヌクレオチド類似体および/または修飾ヌクレオチドを挙げることができる。
[0064]本明細書に用いられるように、「試料」という用語は、通常、生体試料を指す。生体試料の例としては、核酸分子、アミノ酸、ポリペプチド、タンパク質、炭水化物、脂肪またはウイルスが挙げられる。一例において、生体試料は、1つまたは複数の核酸分子を含む核酸試料である。生体試料は、血液試料、唾液試料、スワブ試料、細胞試料または組織試料を含んでいても、該試料に由来するものであってもよい。核酸分子は、無細胞DNA(cfDNA)または無細胞RNA(cfRNA)などの無細胞核酸分子であってもよい。核酸分子は、ヒト、哺乳動物(例えば犬)、ヒト以外の哺乳動物、類人猿、サル、チンパンジー、爬虫類、両生類、または鳥類の起源など様々な起源に由来するものであってもよい。さらに、試料は、血液、血清、血漿、硝子体液、痰、尿、涙、汗、唾液、精液、粘膜排泄物、粘液、髄液、脳脊髄液(CSF)、胸膜液、腹水、羊水およびリンパ液などの体液試料を含むが、それらに限定されない様々な動物液から抽出されてもよい。生体試料は、エチレンジアミン四酢酸(EDTA)採取管、無細胞RNA採取管(例えばストリーク)または無細胞DNA採取管(例えばストリーク)を使用して被験者から取得または導出されてもよい。生体試料は、分別により全血試料から導出されてもよい。生体試料またはその派生物は、細胞を含んでいてもよい。例えば、生体試料は、血液試料またはその派生物(例えば、採取管により採取された血液、もしくは血滴)、または細胞もしくは組織試料(例えばスワブ)であってもよい。
[0065]本明細書に用いられるように、「全血」という用語は、通常、(例えば遠心分離により)小成分に分離されていない血液試料を指す。血液試料の全血は、cfDNAおよび/または生殖系DNAを含んでいてもよい。(cfDNAおよび/または生殖系DNAを含んでいてもよい)全血DNAは、血液試料から抽出されてもよい。(cfDNA配列決定リードおよび/または生殖系DNA配列決定リードを含んでいてもよい)全血DNA配列決定リードは、全血DNAから抽出されてもよい。
[0066]一態様において、本開示は、2倍体集団の2つの個体間の祖先血縁度を推定するためのコンピュータ実装方法であって、(a)被験個体集団に対するハプロタイプデータを受け取るステップであって、ハプロタイプデータが、被験個体集団中で共有される複数の遺伝子マーカーを含む、ステップと、(b)複数の遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割するステップと、(c)被験個体集団の各々に対して、(i)複数の遺伝子マーカーに基づいて、被験個体集団の中の第1の個体と第2の個体との間で同祖的であるハプロタイプデータのセグメントをマッチングさせ、マッチングされたセグメントの各々が少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含み、(ii)第1の個体と第2の個体との間のマッチングされたセグメントの各々に対して、マッチングされたセグメントを複数の個別のゲノム範囲に分割し、(i)第1の個体もしくは第2の個体内の個別のゲノム範囲の等しいサイズ度または(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて複数の個別のゲノム範囲の各々を得点付けることにより、複数の得点を生成し、複数の得点の整合性に基づいて複数の得点を補正することにより、複数の補正された得点を生成し、個別のゲノム範囲の複数の補正された得点に基づいて、複数の重みを複数の個別のゲノム範囲に割り当て、(iii)複数の補正された得点および複数の重みに基づいて、マッチングされたセグメントの複数の個別のゲノム範囲に対する加重和を算出するステップと、(d)マッチングされたセグメントの加重和に基づいて、第1の個体と第2の個体との間の祖先血縁度を推定するステップとを含む方法を提供する。
[0067]図1は、いくつかの実施形態に係る、2倍体集団の2つの個体間の祖先血縁度を推定するための例示的方法100を示す図である。方法100は、動作102において、被験個体集団に対するハプロタイプデータを受け取るステップを含み得る。例えば、ハプロタイプデータは、被験個体集団の中で共有される複数の遺伝子マーカーを含んでいてもよい。方法100は、次に動作104において、複数の遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割するステップを含み得る。方法100は、次に動作106において、被験個体集団の各々に対して、複数の遺伝子マーカーに基づいて、被験個体集団の中の第1の個体と第2の個体との間で同祖的であるハプロタイプデータのセグメントをマッチングさせるステップを含み得る。例えば、マッチングされたセグメントの各々は、少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含んでいてもよい。方法100は、次に動作108において、被験個体集団の各個体について、第1の個体と第2の個体との間のマッチングされたセグメントの各々に対して、(a)マッチングされたセグメントを複数の個別のゲノム範囲に分割し、(b)複数の個別のゲノム範囲の各々を得点付けることにより、複数の得点を生成し、(c)複数の得点を補正することにより、複数の補正された得点を生成し、(d)複数の重みを複数の個別のゲノム範囲に割り当てるステップを含み得る。いくつかの実施形態において、複数の個別のゲノム範囲の各々は、(i)第1の個体もしくは第2の個体内の個別のゲノム範囲の等しいサイズ度および/または(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて得点付けされる。いくつかの実施形態において、複数の得点は、複数の得点の整合性に基づいて補正される。いくつかの実施形態において、複数の重みは、個別のゲノム範囲の個別のゲノム範囲の複数の補正された得点に基づいて複数の個別のゲノム範囲に割り当てられる。
[0068]いくつかの実施形態において、2倍体集団の2つの個体の間の祖先血縁度を推定するための方法は、集団の中の個体(例えば犬)の対の間の血縁関係係数(COR)を算出するステップを含み得る。算出されたCOR値に基づいて、集団における個体ごとに、個体の最も近い遺伝的親類のリストを含むリストが生成されてもよい。例えば、当該親類リストは、CORの大きい順に分類されてもよい。さらに、社会的ネットワークのつながりは、関連する2つの個体の間(例えば関連する犬の所有者)のCORに基づいて生成されてもよい。
[0069]犬についてのCOR値を算出する他の方法としては、犬の祖先および他の親類の「系譜」図からなるものであってもよい血統図を使用できる。当該方法は、少なくとも、血統情報が不明の犬(例えば救援動物)についてのCORを推定するのに使用できないという理由により限定され得る。さらに、精度が一貫して高いとは言えず、血統書は数世代分の祖先情報しか提供できず、血統書は「想定される」祖先関係(例えば、2つの個体がそれらの関係に基づいて共用すると想定されるDNAの量)を演算するためにしか使用できないとの理由からも、CORを算出するための血統書の使用には問題があると考えられる。概して、2つの個体(例えば犬)の実際の血縁は、系譜によるDNAの無作為の分離および伝達にも依存すると考えられ、血縁の正確な算出には、動物間の共有されたDNA経路を特定し、符合させることが必要であると考えられる。遺伝子型データをフェージングし、個体間の共有された経路を特定するためにいくつかの方法が使用され得るが、血糖経路で本物である経路を統計上の作り事である経路から区別して、CORを算出する際に経路に重み付けするとともに、構造的変化および欠落または低品質マーカーによるデータのノイズに対処することは、やはり困難であると考えられる。
[0070]さらに、犬同士のCORを算出するための手法は、犬の方が典型的なヒト集団より近親交配の発生率がはるかに高いため、ヒトの場合より複雑になる。この必要性を認識し、本開示は、2つの個体間のCORを決定する際に近親交配を考慮した(例えば犬同士の)CORを決定するための方法およびシステムを提供する。例えば、異系交配集団における一対の2つの兄弟姉妹のCORが約0.5であるのに対して、近親交配集団における一対の2つの兄弟姉妹のCORが約0.7であり得る。2つの個体が近親交配集団の一部であっても、本開示の方法およびシステムを使用して、それらの個体間の血縁関係のタイプを決定できる。例えば、CORが0.5の2匹の犬は、実の兄弟姉妹のそれと類似の血縁を有すると決定する代わりに、本開示の方法およびシステムを適用して、CORが0.5の特定の一対の犬が実の兄弟姉妹である第1の事例と、CORが0.5の別の一対の犬が近親交配系から叔父-姪として関連付けられる第2の事例とを区別することができる。
[0071]また、本開示の方法およびシステムを使用して、貴重な社会的成分を犬の遺伝学的検定に付加することができる。犬の所有者が、彼らのペットの血縁に基づいて互いに直接つながることを可能にすることによって、所有者は、(例えば、採用した犬の所有者にとって重要な情報または望ましい情報であり得る)彼ら自身の犬の履歴、および(例えば、犬の兄弟姉妹ががんの病歴を有する場合に、その犬はがんになるリスクがより高いと考えられる等)遺伝子学的検定に含まれない複雑な形質についての潜在的健康リスクに関するより多くの情報を、関連する犬の所有者から得ることができる。
[0072]本開示の方法およびシステムは、1つまたは複数のアルゴリズムを使用して、(例えば2倍体集団の)2つの個体間の祖先血縁度(COR)を決定することができる。例えば、2倍体集団は哺乳動物集団(例えば、イヌ科動物集団、ネコ科動物集団、スポーツ動物集団または齧歯動物集団)であってもよい。いくつかの実施形態において、イヌ科動物集団は犬集団である。いくつかの実施形態において、犬集団は、アーフェンピンシャー、アフガンハウンド、アフリカニス、アイディ、エアデールテリア、アクバシュ、秋田犬、アラングマスティフ、アラノエスパニョール、アルパハブルーブラッドブルドッグ、アラスカンクリーカイ、アラスカンマラミュート、アーラント、アロペキス、アルペンダックスブラッケ、アルセイシアンシェパルート、アメリカンアキタ、アメリカンブルドッグ、アメリカンコッカースパニエル、アメリカンエスキモードッグ、アメリカンフォックスハウンド、アメリカンヘアレステリア、アメリカンマスティフ、アメリカンピットブルテリア、アメリカンスタッフォードシャーテリア、アメリカンウォータースパニエル、アナトリアンシェパードドッグ、アングロフランセドゥプティットヴェヌリー、アッペンツェラーキャトルドッグ、アルゼンチンドゴ、アリエージュポインター、アリエージョワ、アーマント、アルトワハウンド、オーストラリアンブルドッグ、オーストラリアンキャトルドッグ、オーストラリアンケルピー、オーストラリアンシェパード、オーストラリアンシルキーテリア、オーストラリアンスタンピーテールキャトルドッグ、オーストラリアンテリア、オーストラリアンブラック・アンド・タンハウンド、オーストラリアンピンシャー、アザワク、カシミールシープドッグ、バルビー、バセンジー、バスクシェパードドッグ、バセーアルティジャンノルマン、バセーブルードガスコーニュ、バセーフォーブドブルターニュ、グランバセットグリフォンバンデーン、プチバセットグリフォンバンデーン、バヴァリアンマウンテンハウンド、ビーグル、ビーグルハーリア、ベアデットコリー、ボースロン、ベドリントンテリア、ベルジアンシェパードドッグ、ベルジアンシェパードドッグ(グローネンダール)、ベルジアンシェパードドッグ(ラケノア)、ベルジアンシェパードドッグ(マリノア)、ベルジアンシェパード(タービュレン)、ベルガマスコシェパード、ホワイトスイスシェパードドッグ、ピカルディシープドッグ、ベルナーラウフフント、バーニーズマウンテンドッグ、ビションフリーゼ、ビリー、ビスベン、ブラック・アンド・タンクーンハウンド、ブラック・アンド・タンバージニアフォックスハウンド、ブレンバイザー、ノルウェジアンエルクハウンドブラック、ブラックロシアンテリア、ブラックマウスカー、グランブルードガスコーニュ、プティブルードガスコーニュ、ブラッドハウンド、ブルーレーシー、ブルーポールテリー、ブルーティッククールハウンド、ボーアボール、ボヘミアンシェパード、ボロニーズ、ボーダーコリー、ボーダーテリア、ボルゾイ、ボスニアンラフヘアードハウンド、ボストンテリア、ブービエデアルデンヌ、ブービエデフランダース、ボクサー、ボイキンスパニエル、ブラッコイタリアーノ、ブラクドオーヴェルニュー、ブラクデュブルボネ、ブラクデュプイ、ブラクフランセ、ブラクサンジェルマン、ブラジリアンテリア、ブリアード、ブリケグリフォンバンデーン、ブリタニー、ブロホルマー、ブルーノシュラハウンド、ブコビナシーパードドッグ、ブル・アンド・テリア、ブルテリア、ブルテリア(ミニチュア)、ブルマスティフ、シンドマスティフ、ケアンテリア、カナーンドッグ、カナディアンエスキモードッグ、カナディアンポインター、カネコルソ、カオダセラデアイレス、カオデカストロラボレイロ、カオデフィラデサンミゲル、カロライナドッグ、カルパチアンシェパードドッグ、カタフーラカー、カタロニアンシープドッグ、コーカシアンシェパードドッグ、キャバリアキングチャールズスパニエル、セントラルアジアシェパードドッグ、チェスキーフォーセク、チェスキーテリア、ポーリッシュグレーハウンド、チェサピークベイレトリーバ、セントルイスグレイドッグ、シャンフランセブランエノワール、シャンフランセブランエオランジュ、シャンフランセトリコロール、チワワ、チリアンフォックステリア、重慶犬、チャイニーズクレステッドドッグ、チャイニーズインペリアルドッグ、チヌーク、チッピパライ、チャウチャウ、シマロンウルグアヨ、チェリーシェリー、チルネコデルエトナ、クランバースパニエル、ラフコリー、スムースコリー、コンバイ、コルトバファイティングドッグ、コトンドテュレアール、クレタンハウンド、クロアチアンシープドッグ、カンバーランドシープドッグ、カーリーコーテッドレトルバー、チェコスロバキアンウルフドッグ、ダックスフント、ダルメシアン、ダンディディンモントテリア、ダーニッシュスウェーディッシュファームドッグ、ディンゴ、ドーベルマンピンシャー、
ドーグドボルドー、ドゴキューバン、ドゴグアテマルテコ、ドゴサルデスコ、ドレンチェパトリッシュホンド、ドレーファー、ドゥンケル、ダッチシェパードドッグ、ダッチスムースフント、イーストヨーロピアンシェパード、イーストシベリアンライカ、エロ、イングリッシュコッカースパニエル、イングリッシュクーンハウンド、イングリッシュフォックスハウンド、イングリッシュマスティフ、イングリッシュポインター、イングリッシュセター、イングリッシュセパード、イングリッシュスプリンガースパニエル、イングリッシュトイテリア(ブラック&タン)、イングリッシュウォータースパニエル、イングリッシュホワイトテリア、エントレブッハーマウンテンドッグ、ブルーピカルディースパニエル、エストニアンハウンド、エストレラマウンテンドッグ、ユーラシア、フィールドスパニエル、フィラブラジレイロ、フィド、フィニッシュハウンド、フィニッシュラップフンド、フィニッシュスピッツ、フラットコーテッドレトリーバー、フォーモウサンマウンテンドッグ、フォックステリア(スムース)、ワイアーフォックステリア、フレンチブリタニー、フレンチブルドッグ、フレンチスパニエル、スパニッシュグレーハウンド、ジャーマンロングヘアードポインター、ジャーマンピンシャー、ジャーマンシェパードドッグ、ジャーマンショートエアードポインター、ジャーマンスパニエル、ジャーマンスピッツ、ジャーマンワイアーヘアードポインター、ジャイアントシュナウザー、グラン・オブ・イマールテリア、ゴールデンレトリバー、ゴードンセッター、グランアングロフランセブランエノワール、グランアングロフランセブランエオランジェ、グランアングロフランセトリコロール、グラングリフォンバンデーン、グランマスティンデボリンケン、グレートデン、グレートピレニーズ、グレータースイスマウンテンドッグ、グリーンランドドッグ、グレーハウンド、グリフォンブルードガスコーニュ、ブリュッセルグリフォン、グリフォンフォーヴドブルターニュ、グリフォンニヴェルネ、ガルドン、ガルテリア、ヘアインディアンドッグ、ハミルトンシュトーヴァレ、ハノーヴァリアンハウンド、ハーリア、ハバニーズ、ハワイアンポイドッグ、ヒマラヤンシープドッグ、北海道犬、スホルタイ、ホファヴァルト、ハンガリアンハウンド、ニュージーランドハンタウェイ、ハイゲンハウンド、イビザンハウンド、アイスランドシープドッグ、インディアンスピッツ、アイリッシュブルテリア、アイリッシュレッド・アンド・ホワイトセッター、アイリッシュセッター、アイリッシュスタッフォードシャーブルテリア、アイリッシュテリア、アイリッシュウォータースパニエル、アイリッシュウルフハウンド、イストリアンスムースヘアードハウンド、イストリアンコースヘアードハウンド、イタリアングレーハウンド、ジャックラッセルテリア、ヤークトテリア、イェムトフント、狆、日本スピッツ、日本テリア、ジョナンギ、カイカディ、甲斐犬、カンガルードッグ、カンニ、カラカハンドッグ、カレリアンベアドッグ、カルストシェパード、キースホンド、ケリービーグル、ケリーブルーテリア、キングチャールズスパニエル、キングシェパード、キンタマーニ、紀州犬、コモンドール、コーイケルホンディエ、クーリー、珍島犬、コリアンマスティフ、クロムフォルレンダー、クンミングウルフドッグ、クリ、クーバース、キーレオ、ラブラドールハスキー、ラブラドールレトリバー、ラゴットロマニョーロ、レークランドテリア、ランカシャーヒーラー、ランドシーア、ラポニアンハーダー、レオンベルガー、ラサアプソ、リトアニアンハウンド、ロングヘアードウィペット、ロッタローレブリンディジノ、ローシェン、マジャールアガール、マジェスティックツリーハウンド、マルチーズ、マンチェスターテリア、マレンマシープドッグ、マクナブ、メキシカンヘアレスドッグ、ミニチュアオーストラリアンシェパード、ミニチュアフォックステリア、ミニチュアピンシャー、ミニチュアシュナウザー、ミニチュアシベリアンハスキー、ミオリティック、モロサス、モンテネグリンマウンテンハウンド、モスクワンガーディアンマスティフ、モスコーウォータードッグ、マウンテンカー、マウンテンビューカー、ムクチェス、ムーディ、ムドホルハウンド、ラージミュンスターレンダー、スモールミュンスターレンダー、マレーリバーカーリーコーテッドレトリーバー、ナポリタンマスティフ、ニューファンドランド、ニューギニアンシンギングドッグ、ノーフォークスパニエル、ノーフォークテリア、ノルボッテンスペッツ、ノースカントリービーグル、ノーザンイヌイットドッグ、ノルウェジアンブーフンド、ノルウェジアンエルクハウンド、ノルウェジアンルンデフンド、ノーリッチテリア、ノヴァスコシアダックトーリングレトリーバー、オールドデニッシュポインター、オールドイングリッシュシープドッグ、オールドイングリッシュブルドッグ、オールドイングリッシュテリア、オールドジャーマンシェパードドッグ、オールディイングリッシュブルドッグ、オッターハウンド、パチョンナヴァロ、ペイズリーテリア、パピヨン、パーソンラッセルテリア、パタデールテリア、ペキニーズ、ペロデプレサカナリオ、ペロデプレサマヨルキン、ペルービアンヘアレスドッグ、ファレーヌ、ファラオハウンド、ピカルディスパニエル、プロットハウンド、ポデンコカナリオ、ポインター、ポリッシュハウンド、ポリッシュハンティングドッグ、ポリッシュローランドシープドッグ、ポリッシュタトラシープドッグ、ポメラニアン、ポンオードメルスパニエル、プードル、ポルスヌーレ、ポーチュギースポデンゴ、ポーチュギースポインター、ポーチュギーズウォータードッグ、プラシュスキークリサジーク、プードルポインター、パグ、プーリー、プーミー、豊山犬、ピレニアンマスティフ、ピレニアンシェパード、ラフェイロドアレンティジョ、ラジャパラヤム、ランプールグレーハウンド、ハストレアドールブラジレイロ、ラトネーロボデグエロアンダルース、ラットテリア、レッドボーンクーンハウンド、ローデシアンリッジバック、ロットワイラー、ロシアンスパニエル、ロシアントイ、ラッソヨーロピアンライカ、ラッセルテリア、サーロスウルフホンド、サブエソエスパニョール、セージアッシャーエリ、セージマザンダラニ、樺太犬、サルーキ、サモエド、サプサル、シャルプラニナッツ、シャーペンドース、シラーシュトーヴァレ、スキッパーキ、オールドクロアチアンサイトハウンド、ジャイアントシュナウザー、ミニチュアシュナウザー、スタンダードシュナウザー、スイスハウンド、スモールスイスハウンド、スコッチコリー、スコティッシュディアハウンド、スコティッシュテリア、シーリハムテリア、セグージョイタリアーノ、セッパラシベリアンスレッドドッグ、セルビアンハウンド、セルビアントライカラーハウンド、シャーペイ、シェットランドシープドッグ、柴犬、シーズー、四国犬、シャイロシェパードドッグ、シラク、シベリアンハスキー、シルケンウインドハウンド、シンハラハウンド、スカイテリア、スルーギ、スロヴァークチュヴァック、スロバキアンラフヘアードポインター、スロヴェンスキーコポフ、スモーラントシュトーヴァレ、スモールグリークドメスティックドッグ、ソフトコーテッドウィートンテリア、サウスロシアンオフチャルカ、サザンハウンド、スパニッシュマスティフ、スパニッシュウォータードッグ、スピノーネイタリアーノ、スポーティングルーカステリア、セントバーナード、セントジョンズウォータードッグ、シュタバイフーン、スタッフォードシャーブルテリア、スティーブンスカー、スティリアンコースヘアードハウンド、サセックススパニエル、スウェーディッシュラップフンド、スウェーディッシュヴァルフント、スウェーディッシュビーグル、タールタンベアドッグ、タイガン、タマスカンドッグ、テディルーズベルトテリア、テロミアン、テンターフィールドテリア、タイバーンケオドッグ、タイリッジバック、チベタンマスティフ、チベタンスパニエル、チベタンテリア、トルニャック、土佐犬、トイブルドッグ、トイフォックステリア、トイマンチェスターテリア、ツリーイングカー、ツリーイングウォーカークーンハウンド、ティロリアンハウンド、ウトナーガン、ビズラ、ヴォルピーノイタリアーノ、ワイマラナー、カーディガンウェルシュコーギ、ペンブロークウェルシュコーギ、ウェルシュシープドッグ、ウェルシュスプリンガースパニエル、ウェルシュテリア、ウエストハイランドホワイトテリア、ウエストシベリアンライカ、ウェストファリアンダックスブラッケ、ヴェッターフーン、ウィペット、ホワイトイングリッシュブルドッグ、ホワイトシェパードドッグ、ワイアーヘアードヴィズラ、ワイアーヘアードポインティンググリフォンおよびヨークシャーテリアからなる群から選択される1つまたは複数の犬種を含む。いくつかの実施形態において、該集団は、(例えば、単一品種を有する)1つまたは複数の純血種の犬、または(例えば、複数の品種を有する)1つまたは複数の雑種犬を含む。いくつかの実施形態において、該集団は、任意の数の(例えば1、2、3、4、5、6、7、8、9、10もしくは10以上の)純血種の犬またはそれらの組合せのDNAを有する雑種犬の集団である。
[0073]いくつかの実施形態において、血縁rxyは、共通の祖先から同祖的であることにより2つの個体間で共有される相同性アレルの割合として算出でき、個体が近親交配でないと仮定すると、親縁係数fxyの2倍に等しいと考えられる。親縁係数は、2つの個体における同じ遺伝子座からサンプリングされた2つのアレイが同祖的である確率を表すと考えられる。これは、2つの個体xとyとの間の潜在的な子孫についての近親交配係数に等しくなると考えられる。しかし、2つの個体xとyが近親交配されない場合は、rxy=2*fxyは無効である。
[0074]いくつかの実施形態において、2つの個体間の祖先血縁度(COR)を決定するための方法は、WOOPHS(対合ハプロタイプ共有の加重観察)(Weighted Observation of Pairwise Haplotype Sharing)と呼ばれる。いくつかの実施形態において、WOOPHSは、遺伝子データベースにおける被験個体と他の個体との血縁関係係数(COR)の推定値を算出するように構成される。いくつかの実施形態において、WOOPHSは、2つの個体の見込まれる子孫の想定される近親交配の程度を算出するように構成される。該方法は、遺伝子型データをインプットとして受け取るステップを含み得る。例えば、遺伝子型データは、被験個体集団から得られる生体試料を検定することによって得ることができる。いくつかの実施形態において、生体試料は、血液試料、唾液試料、スワブ試料、細胞試料(例えば口もしくは頬スワブ)または組織試料を含む。いくつかの実施形態において、検定は、生体試料またはそれらの派生物の配列決定を行って、遺伝子型データを生成するステップを含む。例えば、配列決定リードは、任意の好適な配列決定法を使用して生体試料から生成できる。マクサム・ギルバートもしくはサンガー配列決定などの第1世代の配列決定法、または高スループット配列決定(例えば次世代配列決定もしくはNGS)法であり得る。高スループット配列決定法は、少なくとも約10000、100000、100万、1000万、1億または10億以上のポリヌクレオチド分子の配列決定を同時に(または実質的に同時に)行うことができる。配列決定法としては、ピロ配列決定、合成による配列決定、単一分子配列決定、ナノ細孔配列決定、半導体配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、デジタル遺伝子発現(Helicos)、超並列配列決定、例えばHelicos、クローン単一分子アレイ(Solexa/Illumina)、PacBio、SoLiD、イオントレントまたはナノ細孔プラットフォームを挙げることができるが、それらに限定されない。
[0075]いくつかの実施形態において、配列決定は、全ゲノム配列決定(WGS)を含む。配列決定は、所望の性能(例えば、精度、感度、特異性、陽性予測値(PPV)、陰性予測値(NPV)、または受信者操作特性(ROC)の曲線下領域)の所望のハプロタイプを生成するのに十分な深さで実施できる。いくつかの実施形態において、配列決定は、約20X、約30X、約40X、約50X、約60X、約70X、約80X、約90X、約100X、約150X、約200X、約250X、約300X、約350X、約400X、約450X、または約500X以上の深さで実施される。いくつかの実施形態において、配列決定は、「低域」、例えば、約12X以下、約11X以下、約10X以下、約9X以下、約8X以下、約7X以下、約6X以下、約5X以下、約4X以下、約3.5X以下、約3X以下、約2.5X以下、約2X以下、約1.5X以下、または約1X以下の深さで実施される。
[0076]いくつかの実施形態において、配列決定リードを参照ゲノムと整列させることができる。参照ゲノムは、ゲノム(例えば、犬ゲノムまたはヒトゲノム)の少なくとも一部を含んでいてもよい。参照ゲノムは、全ゲノム(例えば、全犬ゲノムまたは全ヒトゲノム)を含んでいてもよい。参照ゲノムは、ゲノムのコードおよび/または非コードゲノム領域に対応する複数のゲノム領域を含むデータベースを含んでいてもよい。データベースは、一塩基変異(SNV)、一塩基多型(SNP)、コピー数多型(CNV)、挿入または欠失(インデル)および融合遺伝子などの、ゲノムのIBDコードおよび/または非コードゲノム領域に対応する複数のゲノム領域を含んでいてもよい。整列は、バローズ-ホィーラーアルゴリズムまたは別のアルゴリズムを使用して実施できる。
[0077]いくつかの実施形態において、複数のゲノム領域の各々について配列決定リードの定量的測度を生成することができる。所与のゲノム領域と整列したDNA配列決定リードのカウント値などの配列決定リードの定量的測度を生成することができる。所与のゲノム領域と整列する配列決定リードの一部または全てを有する配列決定リードを、そのゲノム領域についての定量的測度に向かってカウントすることができる。いくつかの実施形態において、ゲノム領域は、IBDマーカーなどの遺伝子マーカーを含んでいてもよい。特異的および非特異的領域のパターンは、個体間の血縁を示すものであってもよい。
[0078]いくつかの実施形態において、DNA配列決定リードの複数のカウント値を測定するステップは、複数のゲノム領域の各々における複数のDNA分子の結合測定を実施するステップを含む。いくつかの実施形態において、結合測定を実施するステップは、複数のDNA分子における複数のゲノム領域の少なくとも一部に対して選択的であるプローブを使用して複数のDNA分子を検定するステップを含む。いくつかの実施形態において、プローブは、複数のゲノム領域の核酸配列と配列相補性を有する核酸分子である。いくつかの実施形態において、核酸分子は、プライマーまたは富化配列である。いくつかの実施形態において、検定は、アレイハイブリダイゼーションもしくはポリメラーゼ連鎖反応(PCR)、または核酸配列決定の使用を含む。
[0079]いくつかの実施形態において、該方法は、複数のゲノム領域の少なくとも一部に対して複数のDNA分子を富化するステップを含む。いくつかの実施形態において、富化は、複数のDNA分子を増幅させるステップを含む。例えば、複数のDNA分子は、(例えば、複数のゲノム領域の核酸配列と配列相補性を有する核酸分子を含む一組のプライマーまたはプローブを使用することによる)選択的増幅によって増幅されてもよい。代替的に、または併せて、複数のDNA分子は、(例えば汎用的プライマーを使用することによる)汎用的増幅によって増幅されてもよい。いくつかの実施形態において、富化は、複数のDNA分子の少なくとも一部(例えばモノヌクレオチドおよび/またはジヌクレオチド)を選択的に分離するステップを含む。
[0080]いくつかの実施形態において、DNA配列決定リードのカウント値は、正規化または補正できる。例えば、DNA配列決定リードのカウント値は、配列決定およびライブラリ調製における既知のバイアスを満たすように正規化および/または補正されてもよい。いくつかの実施形態において、定量的測度またはカウント値の部分集合は、例えば、配列決定リードの品質得点に基づいて選別できる。
[0081]2つの個体間の祖先血縁度(COR)を決定するための方法は、フェージングアルゴリズムを使用して、遺伝子型データを処理してハプロタイプデータを生成するステップを含み得る。例えば、これは、染色体に沿って個体間で共有される多数の一塩基多型(SNP)についての観察された遺伝子型をハプロタイプ群(例えば、同じ親染色体上で生じやすく、一緒に遺伝されたアレル)に分離することによって達成されてもよい。例えば、ハプロタイプフェージングアルゴリズムは、(例えば、隠れマルコフモデル(HMM)ベースのサーチを含む)参照ベースのハプロタイプフェージングアルゴリズムを含んでいてもよい。いくつかの実施形態において、参照ベースのハプロタイプフェージングアルゴリズムは、Eagle1アルゴリズム、Eagle2アルゴリズム、PHASEアルゴリズム、fastPHASEアルゴリズム、BEAGLEアルゴリズム、Findhapアルゴリズム、Imputeアルゴリズム、FImputeアルゴリズム、AlphaImputeアルゴリズム、IMPUTE2アルゴリズム、MaCHアルゴリズム、SHAPEIT1アルゴリズム、SHAPEIT2アルゴリズム、SHAPEIT3アルゴリズム、SHAPEIT4アルゴリズム、またはそれらの組合せを含む。あるいは、ハプロタイプフェージングアルゴリズムは、コホートベースのハプロタイプフェージングアルゴリズムを含んでいてもよい。
[0082]いくつかの実施形態において、2つの個体間の祖先血縁度(COR)を決定するための方法は、ハプロタイプデータを処理して、集団における複数の個体間で同祖的(IBD)であるマッチングハプロタイプを特定するステップを含む。例えば、IBDハプロタイプは、集団の中の全ての個体間、または一組の被験個体と一組の参照個体との間で特定されてもよい。いくつかの実施形態において、マッチングハプロタイプは、サイズ閾値を満たす場合(例えば、サイズ閾値より大きいサイズ、例えば、約100キロベース塩基対(kbp)、約200kbp、約300kbp、約400kbp、約500kbp、約600kbp、約700kbp、約800kbp、約900kbpまたは約1000kbpである場合)および/または遺伝子マーカーの最小閾値数を網羅する場合(例えば、異なる遺伝子マーカーの数が約30、約40、約50、約60、約70、約80、約90または約100である場合)に特定される。マッチングハプロタイプの特定は、GERMLINEアルゴリズム()、PLINKアルゴリズム、PRESTアルゴリズム、IBD検出用ランダムプロジェクション(RaPID)アルゴリズム、IBD共有ハプロタイプ高速発見(FISHR)アルゴリズム、精密同祖(IBD)アルゴリズム、fastIBDアルゴリズム、KINGアルゴリズム、HaploScoreアルゴリズム、TRUFFLEアルゴリズム、またはそれらの組合せを使用して実施できる。
[0083]いくつかの実施形態において、2つの個体間の祖先血縁度(COR)を決定するための方法は、マッチ後処理アルゴリズムを使用して、犬1匹当たり2つのハプロタイプ(例えばA.0、A.1、B.0およびB.1)を含む2つの個々の犬(例えば犬Aと犬B)の間のマッチングハプロタイプを取得し、それらを個別のゲノム範囲に分割するステップを含む。
[0084]いくつかの実施形態において、2つの個体間の祖先血縁度(COR)を決定するための方法は、個別のゲノム範囲ごとに、個別のゲノム範囲における全ての可能なハプロタイプマッチ型の状態を得点付け、当該マッチの数をカウントする(ゲノム範囲1つ当たり1つまたは2つの得点を生成する)ステップを含む。例えば、マッチは、単一の犬の中の「ホモ接合性」マッチ(例えばA.0|A.1)または2匹の犬におけるハプロタイプ間の「対合」マッチ(例えばA.0|B.1)を含んでいてもよい。いくつかの実施形態において、個別のゲノム範囲が、(i)第1の個体または第2の個体の中の個別のゲノム範囲の等しいサイズ度および(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて得点付けされることにより、複数の接合性マッチング得点および複数の対合マッチング得点が生成される。
[0085]いくつかの実施形態において、2つの個体間の祖先血縁度(COR)を決定するための方法は、所与の対合マッチング得点と対応する等しいサイズ得点との整合性に基づいて複数の対合マッチング得点を補正することにより、複数の補正された対合マッチング得点を生成するステップを含む。例えば、ホモ接合性マッチを使用して、対合マッチの数が不整合または不可能な個別のゲノム範囲の得点付けを「補正」または調整することができる。ハプロタイプフェーズの本質的な不確実性のために、1匹の犬の中でのハプロタイプマッチは、2匹の犬の間のハプロタイプマッチより真のIBDを表しやすいと考えられる。したがって、WOOPHSは、ホモ接合性マッチを使用して、対合マッチの数が不整合または不可能な個別のゲノム範囲を「補正」することを含み得る。例えば、真のマッチは、限定された形でしか生じないと考えられる。例えば、一対の犬(AおよびB)のうちの1匹だけがホモ接合性(例えばA.0=A.1)である場合は、2つまたは4つの対合マッチ(例えば、{A.0=A.1=B.0もしくはA.0=A.1=B.1}または{A.0=A.1=B.0=B.1})しか生じないと考えられる。この補正は、全ての個別の範囲の得点付けを、可能な状態と整合するように補正するために実施されてもよい。
[0086]いくつかの実施形態において、2つの個体間の祖先血縁度(COR)を決定するための方法は、2つの2倍体の個体における2つのアレルについての複数の同一性状態に基づいて、複数の重みを複数の個別のゲノム範囲に割り当て、ゲノム範囲得点の加重和を算出してCORおよび/またはCOKを生成するステップを含む。例えば、重みは、個別のゲノム範囲ごとに、血縁および/または親縁に対するその部分寄与に応じて(例えば、血縁係数(COR)および/または親縁係数(COK)に合わせて)決定できる。これは、例えば、その全体が参照により本明細書に組み込まれているHedrickおよびLacy、J.Hered、「Measuring relatedness between inbred individuals(近親交配の個体の間の血縁の測定)」、2015年1~2月、106(1):20-5に記載の手法に従って実施されてもよい。例えば、複数の同一性状態は、表1から選択される同一性状態を含んでいてもよく、複数の重みが、表1に記載の血縁rxyに対する複数の寄与に基づいて割り当てられてもよい。いくつかの実施形態において、祖先血縁度は、血縁係数を含む。例えば、加重和は、加重和が
Figure 2023501006000008
で表されるように、マッチングされたセグメントの複数の個別のゲノム範囲に対して算出されてもよい。いくつかの実施形態において、祖先血縁度は親縁係数を含む。例えば、加重和は、加重和が
Figure 2023501006000009
で表されるように、マッチングされたセグメントの複数の個別のゲノム範囲に対して算出されてもよい。
Figure 2023501006000010
個体xにおける2つのアレルはaおよびbであり、個体yにおける2つのアレルはcおよびdである。水平線は、同祖の個体におけるホモ接合性を示す。所与の同一性状態に対して、Δ値は同祖の確率を示し、右の2つの欄は、個体xおよびyの子孫の近親交配係数fxyに対する寄与、ならびに個体xとyの間の血縁rxyを示す。
[0087]表1:同祖状態が線でつながれた2つの2倍体の個体における2つのアレルに対する9つの同一性状態
[0088]要約すると、2つの個体間の祖先血縁度(COR)を決定するための方法は、フェージングしたデータからIBD経路を特定し、観察された対合ハプロタイプマッチカウントに基づいて個別のゲノム範囲を得点付け、個別のゲノム範囲におけるホモ接合性状態に基づいて対合マッチカウント補正を実施し、重みを個別の経路に割り当て、加重和を算出して血縁関係係数および/または親縁係数の得点を生成するステップを含み得る。
[0089]コンピュータシステム
[0090]本開示は、本開示の方法を実施するようにプログラミングされるコンピュータシステムを提供する。図2は、例えば、被験個体集団についてのハプロタイプデータ(例えば、ハプロタイプデータは、被験個体集団の中で共有される複数の遺伝子マーカーを含む)を受け取り、複数の遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割し、複数の遺伝子マーカーに基づいて、被験個体集団の中の第1の個体と第2の個体との間で同祖的なハプロタイプデータのセグメントをマッチングさせ(例えば、マッチングされたセグメントの各々は、少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含む)、マッチングされたセグメントを複数の個別のゲノム範囲に分割し、(i)第1の個体もしくは第2の個体内の個別のゲノム範囲の等しいサイズ度、または(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて個別のゲノム範囲を得点付けることにより、複数の得点を生成し、複数の得点の整合性に基づいて複数の得点を補正することにより、複数の補正された得点を生成し、(例えば、個別のゲノム範囲の複数の補正された得点に基づいて)複数の重みを複数の個別のゲノム範囲に割り当て、(例えば、複数の補正された得点および複数の重みに基づいて)マッチングされたセグメントの複数の個別のゲノム範囲に対する重みを算出し、(例えば、マッチングされたセグメントの加重和に基づいて)第1の個体と第2の個体との間の祖先血縁度を推定するようにプログラミング、または他の形態で構成されるコンピュータシステム201を示す。コンピュータシステム201は、例えば、被験個体集団についてのハプロタイプデータ(例えば、ハプロタイプデータは、被験個体集団の中で共有される複数の遺伝子マーカーを含む)を受け取ること、複数の遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割すること、複数の遺伝子マーカーに基づいて、被験個体集団の中の第1の個体と第2の個体との間で同祖的なハプロタイプデータのセグメントをマッチングさせること(例えば、マッチングされたセグメントの各々は、少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含む)、マッチングされたセグメントを複数の個別のゲノム範囲に分割すること、(i)第1の個体もしくは第2の個体内の個別のゲノム範囲の等しいサイズ度、または(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて個別のゲノム範囲を得点付けることにより、複数の得点を生成すること、複数の得点の整合性に基づいて複数の得点を補正することにより、複数の補正された得点を生成すること、(例えば、個別のゲノム範囲の複数の補正された得点に基づいて)複数の重みを複数の個別のゲノム範囲に割り当てること、(例えば、複数の補正された得点および複数の重みに基づいて)マッチングされたセグメントの複数の個別のゲノム範囲に対する重みを算出すること、および(例えば、マッチングされたセグメントの加重和に基づいて)第1の個体と第2の個体との間の祖先血縁度を推定することなどの本開示の解析、算出および生成の様々な態様を調節することができる。コンピュータシステム201は、ユーザの電子機器、または電子機器に対して遠隔に位置するコンピュータシステムであり得る。電子機器は、携帯型電子機器であり得る。
[0091]コンピュータシステム201は、シングルコアもしくはマルチコアプロセッサ、または並行処理用の複数のプロセッサであり得る中央処理装置(CPU、本明細書では「プロセッサ」および「コンピュータプロセッサ」とも称する)205を含む。コンピュータシステム201は、メモリまたはメモリロケーション210(例えば、ランダムアクセスメモリ、読取り専用メモリ、フラッシュメモリ)、電子記憶装置215(例えばハードディスク)、1つまたは複数の他のシステムとの通信のための通信インターフェース220(例えばネットワークアダプター)、ならびにキャッシュメモリ、他のメモリ、データ記憶および/または電子表示アダプターなどの周辺機器225をも含む。メモリ210、電子記憶装置215、インターフェース220および周辺機器225は、マザーボードなどの通信バス(実線)を介してCPU205と通信する。記憶装置215は、データを記憶するためのデータ記憶装置(またはデータ記憶場所)であり得る。コンピュータシステム201は、通信インターフェース220を利用してコンピュータネットワーク(「ネットワーク」)230に動作可能に接続され得る。ネットワーク230は、インターネット、インターネットおよび/またはエクストラネット、またはインターネットと通信するイントラネットおよび/またはエクストラネットであり得る。ネットワーク230は、場合により、遠隔通信および/またはデータネットワークである。ネットワーク230は、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる1つまたは複数のコンピュータサーバーを含むことができる。例えば、1つまたは複数のコンピュータサーバーは、ネットワーク230(クラウド)上でのクラウドコンピューティングが、例えば、被験個体集団についてのハプロタイプデータ(例えば、ハプロタイプデータは、被験個体集団の中で共有される複数の遺伝子マーカーを含む)を受け取ること、複数の遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割すること、複数の遺伝子マーカーに基づいて、被験個体集団の中の第1の個体と第2の個体との間で同祖的なハプロタイプデータのセグメントをマッチングさせること(例えば、マッチングされたセグメントの各々は、少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含む)、マッチングされたセグメントを複数の個別のゲノム範囲に分割すること、(i)第1の個体もしくは第2の個体内の個別のゲノム範囲の等しいサイズ度、または(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて個別のゲノム範囲を得点付けることにより、複数の得点を生成すること、複数の得点の整合性に基づいて複数の得点を補正することにより、複数の補正された得点を生成すること、(例えば、個別のゲノム範囲の複数の補正された得点に基づいて)複数の重みを複数の個別のゲノム範囲に割り当てること、(例えば、複数の補正された得点および複数の重みに基づいて)マッチングされたセグメントの複数の個別のゲノム範囲に対する重みを算出すること、および(例えば、マッチングされたセグメントの加重和に基づいて)第1の個体と第2の個体との間の祖先血縁度を推定することなどの本開示の解析、算出および生成の様々な態様を実施することを可能にすることができる。当該クラウドコンピューティングは、例えば、アマゾンウェブサービス(AWS)、マイクロソフトアジュール、グーグルクラウドプラットフォームおよびIBMクラウドなどのクラウドコンピューティングプラットフォームによって実現されてもよい。ネットワーク230は、場合によりコンピュータシステム201を利用して、コンピュータシステム201に接続された機器がクライアントまたはサーバーとして動作することを可能にすることができるピアツーピアネットワークを実装することができる。
[0092]CPU205は、プログラムまたはソフトウェアで具現化できる一連の機械可読命令を実行できる。それらの命令は、メモリ210などのメモリロケーションに記憶されてもよい。それらの命令は、後に本開示の方法を実施するようにCPU205をプログラミング、または他の形態で構成することができるCPU205に送達され得る。CPU205によって実施される動作の例としては、フェッチ、復号、実行およびライトバックを挙げることができる。
[0093]CPU205は、集積回路などの回路の一部であり得る。システム201の1つまたは複数の他の構成要素を回路に含めることができる。場合により、回路は、特定用途向け集積回路(ASIC)である。
[0094]記憶装置215は、ドライバ、ライブラリおよび保存プログラムなどのファイルを記憶することができる。記憶装置215は、ユーザデータ、例えばユーザの好みおよびユーザプログラムを記憶することができる。コンピュータシステム201は、場合により、コンピュータシステム201の外部の1つまたは複数の追加的なデータ記憶装置、例えば、インターネットまたはイントラネットを介してコンピュータシステム201と通信するリモートサーバー上に配置されたデータ記憶装置を含むことができる。
[0095]コンピュータシステム201は、ネットワーク230を介して1つまたは複数のリモートコンピュータシステムと通信することができる。例えば、コンピュータシステム201は、ユーザ(例えば、ペット所有者、犬舎所有者、獣医師、ブリーダー、動物保護施設従業員、医師、看護師、介護者、患者または被験者)のリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば携帯用コンピュータ)、スレートもしくはタブレットPC(例えばApple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、アンドロイド(登録商標)・イネーブルド・デバイス、Blackberry(登録商標))または携帯型情報端末が挙げられる。ユーザは、ネットワーク230を介してコンピュータシステム201にアクセスすることができる。
[0096]本明細書に記載の方法は、例えばメモリ210または電子記憶装置215などのコンピュータシステム201の電子記憶場所に記憶された機械(例えばコンピュータプロセッサ)実行可能コードにより実施できる。機械実行可能または機械可読コードは、ソフトウェアの形で実現できる。使用時に、コードをプロセッサ205により実行することができる。場合により、コードを記憶装置215から読み出し、プロセッサ205により容易にアクセスするためにメモリ210に記憶させることができる。場合により、電子記憶装置215を除外することができ、機械実行可能命令をメモリ210に記憶させる。
[0097]コードを事前にコンパイルし、コードを実行するように構成されたプロセッサを有する機械に使用するために構成することもできるし、実行時にコンパイルすることもできる。コードは、コードを事前にコンパイルする方式または実行時にコンパイルする方式で実行することを可能にするように選択され得るプログラミング言語で供給できる。
[0098]コンピュータシステム201などの本明細書に提示のシステムおよび方法の態様は、プログラミングで具現化できる。該技術の様々な態様は、典型的には、機械(またはプロセッサ)実行可能コード、および/またはある種の機械可読媒体で配信または具現化される関連データの形の「製品」または「物品」と捉えられてもよい。機械実行可能コードをメモリ(例えば読取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶することができる。「記憶」型媒体は、コンピュータもしくはプロセッサ等の有形メモリ、またはその関連モジュール、例えば、ソフトウェアプログラミングのためにいつでも持続的記憶域を提供できる様々な半導体メモリ、テープ駆動装置およびディスク駆動装置等のいずれかまたは全てを含むことができる。時には、ソフトウェアの全体または一部が、インターネットまたは様々な他の電気通信ネットワークを介して通信されてもよい。当該通信は、例えば、あるコンピュータまたはプロセッサから他のコンピュータまたはプロセッサ、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへのソフトウェアのローディングを可能にすることができる。したがって、ソフトウェアエレメントを担持することができる別の種類の媒体は、光波、電波および電磁波、例えばローカル装置の間、有線および光回線ネットワーク経由、ならびに様々な無線回線上の物理的インターフェースを交差して使用されるものを含む。当該波動を伝達する物理的エレメント、例えば有線もしくは無線回線または光回線は、ソフトウェアを担持する媒体と考えられてもよい。本明細書に用いられているように、持続性の有形「記憶」媒体に限定しなければ、コンピュータまたは機械「可読媒体」などの用語は、実行用プロセッサに対する命令の伝達に関与する任意の媒体を指す。
[0099]よって、コンピュータ実行可能コードなどの機械可読媒体は、有形記憶媒体、搬送波媒体または物理的伝送媒体を含むが、それらに限定されない多くの形態をとることができる。非揮発性記憶媒体としては、例えば、任意の構成要素等における記憶装置のいずれかなどの光または磁気ディスク、例えば、図面に示されるデータベース等を実装するのに使用できるディスクが挙げられる。揮発性記憶装置としては、当該コンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、コンピュータシステム内にバスを備えるワイヤを含む同軸ケーブル、銅線および光ファイバーが挙げられる。搬送波伝送媒体は、電気もしくは電磁信号、または音波もしくは光波、例えば、無線周波(RF)および赤外線(IR)データ通信時に生成される音波もしくは光波の形をとることができる。したがって、一般的な形態のコンピュータ可読媒体としては、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光媒体、パンチカード紙テープ、孔のパターンを有する任意の他の物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH(登録商標)-EPROM、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を運ぶ搬送波、当該搬送波を運ぶケーブルもしくは回線、またはコンピュータがそこからプログラミングコードおよび/またはデータを読み取ることができる任意の他の媒体が挙げられる。これらの形態のコンピュータ可読媒体の多くが、1つまたは複数の命令の1つまたは複数の連続体を実行用プロセッサに伝達することに関与することができる。
[0100]コンピュータシステム201は、例えば、ハプロタイプデータ、遺伝子マーカー、第1の個体と第2の個体との間で同祖的であるハプロタイプデータのマッチングされたセグメント、個別のゲノム範囲の得点、個別のゲノム範囲の補正された得点、複数の個別のゲノム範囲に対する算出された加重和、第1の個体と第2の個体との間の推定される祖先血縁度を提供するためのユーザインターフェース(UI)240を備える電子ディスプレイ235を含む、またはそれと通信することができる。UIの例としては、限定することなく、グラフィカル・ユーザ・インターフェース(GUI)およびウェブベースのユーザインターフェースが挙げられる。
[0101]本開示の方法およびシステムは、1つまたは複数のアルゴリズムにより実施できる。アルゴリズムは、中央処理装置205による実行によりソフトウェアによって実施できる。アルゴリズムは、例えば、被験個体集団についてのハプロタイプデータ(例えば、ハプロタイプデータは、被験個体集団の中で共有される複数の遺伝子マーカーを含む)を受け取り、複数の遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割し、複数の遺伝子マーカーに基づいて、被験個体集団の中の第1の個体と第2の個体との間で同祖的なハプロタイプデータのセグメントをマッチングさせ(例えば、マッチングされたセグメントの各々は、少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含む)、マッチングされたセグメントを複数の個別のゲノム範囲に分割し、(i)第1の個体もしくは第2の個体内の個別のゲノム範囲の等しいサイズ度、または(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて個別のゲノム範囲を得点付けることにより、複数の得点を生成し、複数の得点の整合性に基づいて複数の得点を補正することにより、複数の補正された得点を生成し、(例えば、個別のゲノム範囲の複数の補正された得点に基づいて)複数の重みを複数の個別のゲノム範囲に割り当て、(例えば、複数の補正された得点および複数の重みに基づいて)マッチングされたセグメントの複数の個別のゲノム範囲に対する重みを算出し、(例えば、マッチングされたセグメントの加重和に基づいて)第1の個体と第2の個体との間の祖先血縁度を推定することができる。コンピュータシステム201は、例えば、被験個体集団についてのハプロタイプデータ(例えば、ハプロタイプデータは、被験個体集団の中で共有される複数の遺伝子マーカーを含む)を受け取ること、複数の遺伝子マーカーに基づいてハプロタイプデータをセグメントに分割すること、複数の遺伝子マーカーに基づいて、被験個体集団の中の第1の個体と第2の個体との間で同祖的なハプロタイプデータのセグメントをマッチングさせること(例えば、マッチングされたセグメントの各々は、少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含む)、マッチングされたセグメントを複数の個別のゲノム範囲に分割すること、(i)第1の個体もしくは第2の個体内の個別のゲノム範囲の等しいサイズ度、または(ii)第1の個体と第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて個別のゲノム範囲を得点付けることにより、複数の得点を生成すること、複数の得点の整合性に基づいて複数の得点を補正することにより、複数の補正された得点を生成すること、(例えば、個別のゲノム範囲の複数の補正された得点に基づいて)複数の重みを複数の個別のゲノム範囲に割り当てること、(例えば、複数の補正された得点および複数の重みに基づいて)マッチングされたセグメントの複数の個別のゲノム範囲に対する重みを算出すること、および(例えば、マッチングされたセグメントの加重和に基づいて)第1の個体と第2の個体との間の祖先血縁度を推定することなどの本開示の解析、算出および生成の様々な態様を調節することができる。
[0102]実施例1:血縁または親縁の程度を評価するためのWOOPHSアルゴリズム
[0103]本開示の方法およびシステムを使用して、個体間(例えば犬同士)の血縁または親縁の程度を評価するための対合ハプロタイプ共有の加重観察(WOOPHS)アルゴリズムを実施する。まず、GERMLINEを使用して個体集団の遺伝子型データを処理して、個体から対合およびホモ接合マッチのアレイを生成する。次いで、所与の一対の個体に対して、WOOPHSアルゴリズムが以下のように進行する。マッチ範囲(matches_array)を染色体、開始位置および終了位置により分類する。ゼロ埋めアレイ(ibd_score)を作成し初期化して、個別のゲノム範囲における対合およびホモ接合カウントのカウント値を記憶させる。次に、空リスト(prior_intervals)を作成し初期化して、全ての個別のゲノム範囲をそれらが廃棄されるまで記憶させる。次に、染色体ごとに、(a)個別の範囲の途切れ(interval_breaks)によって表される、染色体上の全ての位置の記憶されたアレイを生成してデータベースに記憶させ、(b)染色体上のmatches_arrayにおける列(match_row)ごとに、既に前の列に見られたあらゆる個別の範囲に対する現行のマッチ列を記憶させ、全面的にそれを下回る前の範囲を全てメモリから削除し、match_rowにおける新たな個別の範囲を作成して記憶させ、新たな範囲を記憶させてprior_intervalsとする。
[0104](マッチ型および重みに基づく)得点付けおよびカウント補正/調整を以下のように実施する。マッチングされた個別のゲノム範囲の初期の得点付けは、経験に基づく。染色体上の個別のゲノム範囲を横断してWOOPHSを進行させながら、個体間の対合マッチの数(0、1、2、3もしくは4)、または各個体内のホモ接合性マッチの数(0もしくは1)を昇順に記録する。しかし、実際には、ホモ接合および対合マッチの正規の組合せの数は限定される。全てのマッチがGERMILINEにより報告されるとは限らないため、使用される特定のフラグに応じて、WOOPHSアルゴリズムは、観察されたカウント値を(HedrickおよびLacyから再現される、表1におけるこれらの可能なカウント構成の概要によって示される)正規のカウント構成に合致するように調整する。この表における9つの状態のうち、5つの状態のみが血縁および親縁に寄与し、2つの状態(状態3および5)は、重み割り当ての観点で同一であるため、さらに集約できる。残りの状態は、血縁または親縁に対して重みを与えないため無視できる(重み0を割り当てられる)。
[0105]したがって、WOOPHSは、以下の4つのマッチカウント状態構成で動作する。
[0106](1)状態1={対合=4、ホモ接合=2}
[0107](2)状態3={対合=2、ホモ接合=1}
[0108](3)状態7={対合=2、ホモ接合=0}
[0109](4)状態8={対合=1、ホモ接合=0}
[0110]次に、WOOPHSアルゴリズムは、以下のように無効なマッチカウント状態構成における対合マッチカウント値を調整することを含む。
[0111]{対合=3、ホモ接合=1}の観測値を{対合=2、ホモ接合=1}(状態3)に補正する。
[0112]{対合=3、ホモ接合=0}の観測値を{対合=1、ホモ接合=0}(状態8)に補正する。
[0113]{対合=4、ホモ接合=0または1}の観測値を{対合=2}(ホモ接合=0の場合は状態8、ホモ接合=1の場合は状態7)に補正する。
[0114]{対合=2、ホモ接合=2}の観測値を{対合=4}(状態1)に補正する。
[0115]{対合=1、ホモ接合=1または2}の観測値を{対合=2}(ホモ接合=1の場合は状態3、ホモ接合=2の場合は無視)に補正する。
[0116]{対合=3、ホモ接合=2}の観測値を{対合=4}(状態1)に補正する。
[0117]マッチングされた個別のゲノム範囲を記憶させて補正した後、血縁係数(COR)および/または親縁係数(COK)を以下のように算出する。対合マッチカウント状態の補正後、表1に示されるように、全ての経路に対して、血縁および親縁に対するそれらの寄与に応じた重みを割り当てる。最後に、血縁および親縁を以下のように算出する。Δiは、4つのマッチカウント状態iのうちの1つに割り当てられたゲノム長さの総和を表すものとする。すると、血縁rxyおよび親縁kxyを以下の式から算出することができる。
Figure 2023501006000011
式中、Lは、対象とするゲノムの全長を表す。
[0118]いくつかの実施形態において、収集された個体集団からの遺伝子型データおよび/またはハプロタイプデータをさらなる検索のためにデータベースに記憶させることができる。次いで、被験個体から試料を採取し、次いで被験個体についての遺伝子型データおよびハプロタイプデータを生成することができる。次に、WOOPHSアルゴリズムを実施して、被験個体と個体集団の1つまたは複数の個体の各々との間の血縁または親縁の程度を生成することができる。最後に、データベースをサーチして、所定の閾値を超える血縁または親縁の程度を有する個体集団の部分集合を検索することができる。血縁関係にある固体の部分集合を記憶させ、被験個体に対する血縁または親縁の程度に基づいて順位付けする。
[0119]発明の様々な実施形態を本明細書に明示および記載したが、当該実施形態は、単に例として提示されていることが当業者に明らかである。本発明を明細書内に示される具体的な例によって限定することを意図するものではない。上記明細書を参照にしながら本発明を説明したが、本明細書における実施形態の説明および例示は、限定する意味で捉えられることを意図するものではない。本発明から逸脱することなく多くの改変、変更および置き換えが行われることを当業者は理解するであろう。また、本発明のいずれの態様も本明細書に記載の具体的な特徴、構成または相対的割合に限定されず、それらは、様々な条件および変動要素に依存する。本発明を実施するに際して、本明細書に記載の発明の様々な代替物を採用できることが理解されるべきである。したがって、本発明は、当該代替物、改造物、改変物または同等物をも包含するものと考えられる。以下の請求の範囲が本発明の範囲を規定し、これらの請求の範囲に含まれる方法および構造ならびにそれらの同等物が請求の範囲に包含されることを意図するものである。

Claims (129)

  1. 2倍体集団の2つの個体間の祖先血縁度を推定するためのコンピュータ実装方法であって、
    (a)被験個体集団に対するハプロタイプデータを受け取るステップであって、前記ハプロタイプデータは、前記被験個体集団中で共有される複数の遺伝子マーカーを含む、ステップと、
    (b)前記複数の遺伝子マーカーに基づいて前記ハプロタイプデータをセグメントに分割するステップと、
    (c)前記被験個体集団の各々に対して、
    (i)前記複数の遺伝子マーカーに基づいて、前記被験個体集団の中の第1の個体と第2の個体との間で同祖的である前記ハプロタイプデータのセグメントをマッチングさせ、マッチングされた前記セグメントの各々は少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含み、
    (ii)前記第1の個体と前記第2の個体との間のマッチングされた前記セグメントの各々に対して、
    マッチングされた前記セグメントを複数の個別のゲノム範囲に分割し、
    前記複数の個別のゲノム範囲の各々を、(i)前記第1の個体もしくは前記第2の個体内の個別のゲノム範囲の等しいサイズ度または(ii)前記第1の個体と前記第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて得点付け、それによって複数の得点を生成し、
    前記複数の得点の整合性に基づいて前記複数の得点を補正し、それによって複数の補正された得点を生成し、
    前記個別のゲノム範囲の前記複数の補正された得点に基づいて、複数の重みを前記複数の個別のゲノム範囲に割り当て、
    (iii)前記複数の補正された得点および前記複数の重みに基づいて、マッチングされた前記セグメントの前記複数の個別のゲノム範囲に対する加重和を算出する
    ステップと、
    (d)マッチングされた前記セグメントの前記加重和に基づいて、前記第1の個体と前記第2の個体との間の前記祖先血縁度を推定するステップと
    を含む方法。
  2. 請求項1に記載の方法であって、前記2倍体集団は哺乳動物集団である、方法。
  3. 請求項2に記載の方法であって、前記哺乳動物集団はイヌ科動物集団である、方法。
  4. 請求項3に記載の方法であって、前記イヌ科動物集団は犬集団である、方法。
  5. 請求項1に記載の方法であって、前記ハプロタイプデータは、ハプロタイプフェージングアルゴリズムを使用して前記被験個体集団の遺伝子型データを処理することによって生成される、方法。
  6. 請求項5に記載の方法であって、前記ハプロタイプフェージングアルゴリズムは参照ベースのハプロタイプフェージングアルゴリズムを含む、方法。
  7. 請求項6に記載の方法であって、前記参照ベースのハプロタイプフェージングアルゴリズムは隠れマルコフモデル(HMM)ベースのサーチを含む、方法。
  8. 請求項7に記載の方法であって、前記参照ベースのハプロタイプフェージングアルゴリズムは、Eagle1アルゴリズム、Eagle2アルゴリズム、PHASEアルゴリズム、fastPHASEアルゴリズム、BEAGLEアルゴリズム、Findhapアルゴリズム、Imputeアルゴリズム、FImputeアルゴリズム、AlphaImputeアルゴリズム、IMPUTE2アルゴリズム、MaCHアルゴリズム、SHAPEIT1アルゴリズム、SHAPEIT2アルゴリズム、SHAPEIT3アルゴリズム、SHAPEIT4アルゴリズム、または、それらの組合せを含む、方法。
  9. 請求項5に記載の方法であって、前記ハプロタイプフェージングアルゴリズムはコホートベースのハプロタイプフェージングアルゴリズムを含む、方法。
  10. 請求項5に記載の方法であって、前記遺伝子型データは、前記被験個体集団から得られる生体試料を検定することによって得られる、方法。
  11. 請求項10に記載の方法であって、前記生体試料は、血液試料、唾液試料、スワブ試料、細胞試料、または、組織試料を含む、方法。
  12. 請求項10に記載の方法であって、前記検定は生体試料またはそれらの派生物の配列決定を含む、方法。
  13. 請求項1に記載の方法であって、前記複数の遺伝子マーカーは、少なくとも約500個、少なくとも約1000個、少なくとも約2000個、少なくとも約3000個、少なくとも約4000個、少なくとも約5000個、少なくとも約6000個、少なくとも約7000個、少なくとも約8000個、少なくとも約9000個、または、少なくとも約10000個の異なる遺伝子マーカーを含む、方法。
  14. 請求項1に記載の方法であって、同祖的である前記ハプロタイプデータの前記セグメントのマッチングは、GERMLINEアルゴリズム、PLINKアルゴリズム、PRESTアルゴリズム、IBD検出用ランダムプロジェクション(RaPID)アルゴリズム、IBD共有ハプロタイプ高速発見(FISHR)アルゴリズム、精密同祖(IBD)アルゴリズム、fastIBDアルゴリズム、KINGアルゴリズム、HaploScoreアルゴリズム、TRUFFLEアルゴリズム、または、それらの組合せの使用を含む、方法。
  15. 請求項1に記載の方法であって、前記所定の閾値サイズは、約100キロベース塩基対(kbp)、約200kbp、約300kbp、約400kbp、約500kbp、約600kbp、約700kbp、約800kbp、約900kbp、または、約1000kbpである、方法。
  16. 請求項1に記載の方法であって、前記所定の数の遺伝子マーカーは、約30個、約40個、約50個、約60個、約70個、約80個、約90個、または、約100個の異なる遺伝子マーカーである、方法。
  17. 請求項1に記載の方法であって、前記複数の個別のゲノム範囲のうちの個別のゲノム範囲が等しいサイズを有するように、マッチングされた前記セグメントを分割するステップをさらに含む方法。
  18. 請求項1に記載の方法であって、前記複数の個別のゲノム範囲のうちの個別のゲノム範囲が可変サイズを有するように、マッチングされた前記セグメントを分割するステップをさらに含む方法。
  19. 請求項18に記載の方法であって、前記複数の個別のゲノム範囲のうちの所与の個別のゲノム範囲の前記可変サイズは、少なくとも部分的に、前記所与の個別のゲノム範囲に近接するIBDマッチの開始位置および終了位置、前記所与の個別のゲノム範囲における遺伝子マーカーの密度、前記所与の個別のゲノム範囲に対するマーカーの最大数、前記所与の個別のゲノム範囲の最大長さ、または、それらの組合せに基づいて決定される、方法。
  20. 請求項1に記載の方法であって、前記複数の個別のゲノム範囲の各々を、(i)前記第1の個体または前記第2の個体内の前記個別のゲノム範囲の前記等しいサイズ度、および、(ii)前記第1の個体と前記第2の個体との間の前記個別のゲノム範囲の前記対合マッチング度に基づいて得点付けし、それによって複数の等しいサイズ得点および複数の対合マッチング得点を生成するステップをさらに含む方法。
  21. 請求項20に記載の方法であって、所与の対合マッチング得点の対応する等しいサイズ得点との整合性に基づいて、前記複数の対合マッチング得点を補正し、それによって複数の補正対合マッチング得点を生成するステップをさらに含む方法。
  22. 請求項20に記載の方法であって、2つの2倍体個体における2つのアレルについての複数の同一性状態に基づいて、前記複数の個別のゲノム範囲に前記複数の重みを割り当てるステップをさらに含む方法。
  23. 請求項22に記載の方法であって、前記複数の同一性状態は、表1から選択される同一性状態を含み、前記複数の重みは、表1に記載される血縁rxyに対する複数の寄与に基づいて割り当てられる、方法。
  24. 請求項23に記載の方法であって、前記祖先血縁度は血縁係数を含む、方法。
  25. 請求項24に記載の方法であって、マッチングされた前記セグメントの前記複数の個別のゲノム範囲に対する前記加重和を算出するステップであって、前記加重和は、
    Figure 2023501006000012
    で表される、ステップをさらに含む方法。
  26. 請求項23に記載の方法であって、前記祖先血縁度は親縁係数を含む、方法。
  27. 請求項26に記載の方法であって、マッチングされた前記セグメントの前記複数の個別のゲノム範囲に対する前記加重和を算出するステップであって、前記加重和は、
    Figure 2023501006000013
    で表される、ステップをさらに含む方法。
  28. 請求項1に記載の方法であって、前記第1の個体と前記第2の個体との間の前記祖先血縁度を推定するステップは、前記第1の個体または前記第2の個体の近親交配の程度を決定するステップを含む、方法。
  29. 請求項1に記載の方法であって、前記第1の個体と前記第2の個体との間の前記祖先血縁度を推定するステップは、前記第1の個体および前記第2の個体の近親交配の程度を決定するステップを含む、方法。
  30. 請求項29に記載の方法であって、前記第1の個体および前記第2の個体の近親交配の前記程度に少なくとも部分的に基づいて、前記第1の個体と前記第2の個体との家族関係を決定するステップをさらに含む、方法。
  31. 請求項30に記載の方法であって、前記家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、または、祖父母-孫関係である、方法。
  32. 請求項28または29に記載の方法であって、前記第1の個体と前記第2の個体の潜在的子孫の想定される近親交配の程度を決定するステップをさらに含む方法。
  33. 請求項32に記載の方法であって、前記第1の個体と前記第2の個体の前記潜在的子孫の想定される近親交配の前記程度に基づいて、前記第1の個体と前記第2の個体とを交配させるか否かを示す提案を決定するステップをさらに含む方法。
  34. 請求項33に記載の方法であって、前記第1の個体と前記第2の個体の前記潜在的子孫の想定される近親交配の前記程度が近親交配の所定の閾値の程度を超えない場合に、前記第1の個体と前記第2の個体とを交配させることを示す提案を決定するステップをさらに含む方法。
  35. 請求項33に記載の方法であって、前記第1の個体と前記第2の個体の前記潜在的子孫の想定される近親交配の前記程度が近親交配の所定の閾値の程度を超える場合に、前記第1の個体と前記第2の個体とを交配させないことを示す提案を決定するステップをさらに含む方法。
  36. 請求項34または35に記載の方法であって、近親交配の前記所定の閾値の程度は、約0.10、約0.15、約0.20、約0.25、約0.30、約0.35、約0.40、約0.45、または、約0.50である、方法。
  37. 請求項1に記載の方法であって、前記第1の個体に関連する第1の人間と前記第2の個体に関連する第2の人間との社会的つながりを、前記第1の個体と前記第2の個体との推定される前記祖先血縁度に少なくとも部分的に基づいて生成するステップをさらに含む方法。
  38. 請求項37に記載の方法であって、前記社会的つながりは、前記第1の個体と前記第2の個体との推定される前記祖先血縁度が所定の閾値を超える場合に生成される、方法。
  39. 請求項38に記載の方法であって、前記所定の閾値は、約0.00001、約0.0001、約0.001、約0.01、約0.02、約0.04、約0.06、約0.08、約0.1、約0.12、約0.14、約0.16、約0.18、約0.2、約0.25、約0.3、約0.35、約0.4、約0.45、または、約0.5である、方法。
  40. 請求項37に記載の方法であって、前記社会的つながりはソーシャルメディアネットワークを通じて生成される、方法。
  41. 請求項37に記載の方法であって、前記第1の人間は前記第1の個体のペット所有者であり、前記第2の人間は前記第2の個体のペット所有者である、方法。
  42. 請求項1に記載の方法であって、前記祖先血縁度に少なくとも部分的に基づいて、前記第1の個体と前記第2の個体との家族関係を特定するステップをさらに含む方法。
  43. 請求項42に記載の方法であって、前記家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、または、祖父母-孫関係である、方法。
  44. 2倍体の2つの個体の間の祖先血縁度を推定するためのコンピュータシステムであって、
    被験個体集団のハプロタイプデータを格納するように構成されたデータベースであって、前記ハプロタイプデータは前記被験個体集団の中で共有される複数の遺伝子マーカーを含む、データベースと、
    前記データベースに動作可能に接続された1つまたは複数のコンピュータプロセッサと
    を備え、前記1つまたは複数のコンピュータプロセッサは、個別にまたは全体として、
    (a)前記複数の遺伝子マーカーに基づいて前記ハプロタイプデータをセグメントに分割し、
    (b)前記被験個体集団の各々に対して、
    (i)前記複数の遺伝子マーカーに基づいて、前記被験個体集団の中の第1の個体と第2の個体との間で同祖的である前記ハプロタイプデータのセグメントをマッチングさせ、マッチングされた前記セグメントの各々は少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含み、
    (ii)前記第1の個体と前記第2の個体との間のマッチングされた前記セグメントの各々に対して、
    マッチングされた前記セグメントを複数の個別のゲノム範囲に分割し、
    前記複数の個別のゲノム範囲の各々を、(i)前記第1の個体もしくは前記第2の個体内の個別のゲノム範囲の等しいサイズ度または(ii)前記第1の個体と前記第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて得点付け、それによって複数の得点を生成し、
    前記複数の得点の整合性に基づいて前記複数の得点を補正し、それによって複数の補正された得点を生成し、
    前記個別のゲノム範囲の前記複数の補正された得点に基づいて、複数の重みを前記複数の個別のゲノム範囲に割り当て、
    (iii)前記複数の補正された得点および前記複数の重みに基づいて、マッチングされた前記セグメントの前記複数の個別のゲノム範囲に対する加重和を算出し、
    (d)マッチングされた前記セグメントの前記加重和に基づいて、前記第1の個体と前記第2の個体との間の前記祖先血縁度を推定する
    ようにプログラミングされた、コンピュータシステム。
  45. 請求項44に記載のコンピュータシステムであって、前記2倍体集団は哺乳動物集団である、コンピュータシステム。
  46. 請求項45に記載のコンピュータシステムであって、前記哺乳動物集団はイヌ科動物集団である、コンピュータシステム。
  47. 請求項46に記載のコンピュータシステムであって、前記イヌ科動物集団は犬集団である、コンピュータシステム。
  48. 請求項44に記載のコンピュータシステムであって、前記ハプロタイプデータは、ハプロタイプフェージングアルゴリズムを使用して前記被験個体集団の遺伝子型データを処理することによって生成される、コンピュータシステム。
  49. 請求項48に記載のコンピュータシステムであって、前記ハプロタイプフェージングアルゴリズムは参照ベースのハプロタイプフェージングアルゴリズムを含む、コンピュータシステム。
  50. 請求項49に記載のコンピュータシステムであって、前記参照ベースのハプロタイプフェージングアルゴリズムは隠れマルコフモデル(HMM)ベースのサーチを含む、コンピュータシステム。
  51. 請求項50に記載のコンピュータシステムであって、前記参照ベースのハプロタイプフェージングアルゴリズムは、Eagle1アルゴリズム、Eagle2アルゴリズム、PHASEアルゴリズム、fastPHASEアルゴリズム、BEAGLEアルゴリズム、Findhapアルゴリズム、Imputeアルゴリズム、FImputeアルゴリズム、AlphaImputeアルゴリズム、IMPUTE2アルゴリズム、MaCHアルゴリズム、SHAPEIT1アルゴリズム、SHAPEIT2アルゴリズム、SHAPEIT3アルゴリズム、SHAPEIT4アルゴリズム、または、それらの組合せを含む、コンピュータシステム。
  52. 請求項48に記載のコンピュータシステムであって、前記ハプロタイプフェージングアルゴリズムはコホートベースのハプロタイプフェージングアルゴリズムを含む、コンピュータシステム。
  53. 請求項48に記載のコンピュータシステムであって、前記遺伝子型データは、前記被験個体集団から得られる生体試料を検定することによって得られる、コンピュータシステム。
  54. 請求項53に記載のコンピュータシステムであって、前記生体試料は、血液試料、唾液試料、スワブ試料、細胞試料、または、組織試料を含む、コンピュータシステム。
  55. 請求項53に記載のコンピュータシステムであって、前記検定は前記生体試料またはそれらの派生物の配列決定を含む、コンピュータシステム。
  56. 請求項44に記載のコンピュータシステムであって、前記複数の遺伝子マーカーは、少なくとも約500個、少なくとも約1000個、少なくとも約2000個、少なくとも約3000個、少なくとも約4000個、少なくとも約5000個、少なくとも約6000個、少なくとも約7000個、少なくとも約8000個、少なくとも約9000個、または、少なくとも約10000個の異なる遺伝子マーカーを含む、コンピュータシステム。
  57. 請求項44に記載のコンピュータシステムであって、同祖的である前記ハプロタイプの前記セグメントのマッチングは、GERMLINEアルゴリズム、PLINKアルゴリズム、PRESTアルゴリズム、IBD検出用ランダムプロジェクション(RaPID)アルゴリズム、IBD共有ハプロタイプ高速発見(FISHR)アルゴリズム、精密同祖(IBD)アルゴリズム、fastIBDアルゴリズム、KINGアルゴリズム、HaploScoreアルゴリズム、TRUFFLEアルゴリズム、または、それらの組合せの使用を含む、コンピュータシステム。
  58. 請求項44に記載のコンピュータシステムであって、前記所定の閾値サイズは、約100キロベース塩基対(kbp)、約200kbp、約300kbp、約400kbp、約500kbp、約600kbp、約700kbp、約800kbp、約900kbp、または、約1000kbpである、コンピュータシステム。
  59. 請求項44に記載のコンピュータシステムであって、前記所定の数の遺伝子マーカーは、約30個、約40個、約50個、約60個、約70個、約80個、約90個、または、約100個の異なる遺伝子マーカーである、コンピュータシステム。
  60. 請求項44に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、前記複数の個別のゲノム範囲のうちの個別のゲノム範囲が等しいサイズを有するように、マッチングされた前記セグメントをさらに分割するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  61. 請求項44に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、前記複数の個別のゲノム範囲のうちの個別のゲノム範囲が可変サイズを有するように、マッチングされた前記セグメントをさらに分割するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  62. 請求項61に記載のコンピュータシステムであって、前記複数の個別のゲノム範囲のうちの所与の個別のゲノム範囲の前記可変サイズは、前記所与の個別のゲノム範囲に近接するIBDマッチの開始位置および終了位置、前記所与の個別のゲノム範囲における遺伝子マーカーの密度、前記所与の個別のゲノム範囲に対するマーカーの最大数、前記所与の個別のゲノム範囲の最大長さ、または、それらの組合せに少なくとも部分的に基づいて決定される、コンピュータシステム。
  63. 請求項44に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、前記複数の個別のゲノム範囲の各々を、(i)前記第1の個体または前記第2の個体内の前記個別のゲノム範囲の前記等しいサイズ度、および、(ii)前記第1の個体と前記第2の個体との間の前記個別のゲノム範囲の前記対合マッチング度に基づいてさらに得点付け、それによって複数の等しいサイズ得点および複数の対合マッチング得点を生成するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  64. 請求項63に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、所与の対合マッチング得点の対応する等しいサイズ得点との整合性に基づいて、複数の対合マッチング得点をさらに補正し、それによって複数の補正対合マッチング得点を生成するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  65. 請求項63に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、2つの2倍体個体における2つのアレルについての複数の同一性状態に基づいて、前記複数の個別のゲノム範囲に前記複数の重みをさらに割り当てるように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  66. 請求項65に記載のコンピュータシステムであって、前記複数の同一性状態は、表1から選択される同一性状態を含み、前記複数の重みは、表1に記載される血縁rxyに対する複数の寄与に基づいて割り当てられる、コンピュータシステム。
  67. 請求項66に記載のコンピュータシステムであって、前記祖先血縁度は血縁係数を含む、コンピュータシステム。
  68. 請求項67に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、マッチングされた前記セグメントの前記複数の個別のゲノム範囲に対する前記加重和をさらに算出するように個別にまたは全体としてプログラミングされ、前記加重和は、
    Figure 2023501006000014
    で表される、コンピュータシステム。
  69. 請求項66に記載のコンピュータシステムであって、前記祖先血縁度は親縁係数を含む、コンピュータシステム。
  70. 請求項69に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、マッチングされた前記セグメントの前記複数の個別のゲノム範囲に対する前記加重和をさらに算出するように個別にまたは全体としてプログラミングされ、前記加重和は、
    Figure 2023501006000015
    で表される、コンピュータシステム。
  71. 請求項44に記載のコンピュータシステムであって、前記第1の個体と前記第2の個体との間の前記祖先血縁度を推定することは、前記第1の個体または前記第2の個体の近親交配の程度を決定することを含む、コンピュータシステム。
  72. 請求項44に記載のコンピュータシステムであって、前記第1の個体と前記第2の個体との間の前記祖先血縁度を推定することは、前記第1の個体および前記第2の個体の近親交配の程度を決定することを含む、コンピュータシステム。
  73. 請求項72に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、前記第1の個体および前記第2の個体の近親交配の前記程度に少なくとも部分的に基づいて、前記第1の個体と前記第2の個体との家族関係をさらに決定するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  74. 請求項73に記載のコンピュータシステムであって、前記家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、または、祖父母-孫関係である、コンピュータシステム。
  75. 請求項71または72に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、前記第1の個体と前記第2の個体の潜在的子孫の想定される近親交配の程度をさらに決定するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  76. 請求項75に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、前記第1の個体と前記第2の個体の前記潜在的子孫の想定される近親交配の前記程度に基づいて、前記第1の個体と前記第2の個体とを交配させるか否かを示す提案をさらに決定するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  77. 請求項76に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、前記第1の個体と前記第2の個体の前記潜在的子孫の想定される近親交配の前記程度が近親交配の所定の閾値の程度を超えない場合に、前記第1の個体と前記第2の個体とを交配させることを示す提案をさらに決定するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  78. 請求項76に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、前記第1の個体と前記第2の個体の前記潜在的子孫の想定される近親交配の前記程度が近親交配の所定の閾値の程度を超える場合に、前記第1の個体と前記第2の個体とを交配させないことを示す提案をさらに決定するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  79. 請求項77または78に記載のコンピュータシステムであって、近親交配の前記所定の閾値の程度は、約0.10、約0.15、約0.20、約0.25、約0.30、約0.35、約0.40、約0.45、または、約0.50である、コンピュータシステム。
  80. 請求項44に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、前記第1の個体に関連する第1の人間と前記第2の個体に関連する第2の人間との社会的つながりを、前記第1の個体と前記第2の個体との推定される前記祖先血縁度に少なくとも部分的に基づいてさらに生成するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  81. 請求項80に記載のコンピュータシステムであって、前記社会的つながりは、前記第1の個体と前記第2の個体との推定される前記祖先血縁度が所定の閾値を超える場合に生成される、コンピュータシステム。
  82. 請求項81に記載のコンピュータシステムであって、前記所定の閾値は、約0.00001、約0.0001、約0.001、約0.01、約0.02、約0.04、約0.06、約0.08、約0.1、約0.12、約0.14、約0.16、約0.18、約0.2、約0.25、約0.3、約0.35、約0.4、約0.45、または、約0.5である、コンピュータシステム。
  83. 請求項80に記載のコンピュータシステムであって、前記社会的つながりは、ソーシャルメディアネットワークを通じて生成される、コンピュータシステム。
  84. 請求項80に記載のコンピュータシステムであって、前記第1の人間は前記第1の個体のペット所有者であり、前記第2の人間は前記第2の個体のペット所有者である、コンピュータシステム。
  85. 請求項44に記載のコンピュータシステムであって、前記1つまたは複数のコンピュータプロセッサは、前記祖先血縁度に少なくとも部分的に基づいて、前記第1の個体と前記第2の個体との家族関係をさらに特定するように個別にまたは全体としてプログラミングされた、コンピュータシステム。
  86. 請求項85に記載のコンピュータシステムであって、前記家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、または、祖父母-孫関係である、コンピュータシステム。
  87. 1つまたは複数のコンピュータプロセッサにより実行されると、2倍体集団の2つの個体間の祖先血縁度を推定するための方法実施する機械実行可能コードを含む非一時的コンピュータ可読媒体であって、前記方法は、
    (a)被験個体集団に対するハプロタイプデータを受け取るステップであって、前記ハプロタイプデータは、前記被験個体集団中で共有される複数の遺伝子マーカーを含む、ステップと、
    (b)前記複数の遺伝子マーカーに基づいて前記ハプロタイプデータをセグメントに分割するステップと、
    (c)前記被験個体集団の各々に対して、
    (i)前記複数の遺伝子マーカーに基づいて、前記被験個体集団の中の第1の個体と第2の個体との間で同祖的である前記ハプロタイプデータのセグメントをマッチングさせ、マッチングされた前記セグメントの各々は少なくとも所定の閾値サイズである第1のサイズを有するとともに少なくとも所定の数の遺伝子マーカーを含み、
    (ii)前記第1の個体と前記第2の個体との間のマッチングされた前記セグメントの各々に対して、
    マッチングされた前記セグメントを複数の個別のゲノム範囲に分割し、
    前記複数の個別のゲノム範囲の各々を、(i)前記第1の個体もしくは前記第2の個体内の個別のゲノム範囲の等しいサイズ度または(ii)前記第1の個体と前記第2の個体との間の個別のゲノム範囲の対合マッチング度に基づいて得点付け、それによって複数の得点を生成し、
    前記複数の得点の整合性に基づいて前記複数の得点を補正し、それによって複数の補正された得点を生成し、
    前記個別のゲノム範囲の前記複数の補正された得点に基づいて、複数の重みを前記複数の個別のゲノム範囲に割り当て、
    (iii)前記複数の補正された得点および前記複数の重みに基づいて、マッチングされた前記セグメントの前記複数の個別のゲノム範囲に対する加重和を算出する
    ステップと、
    (d)マッチングされた前記セグメントの前記加重和に基づいて、前記第1の個体と前記第2の個体との間の前記祖先血縁度を推定するステップと
    を含む、非一時的コンピュータ可読媒体。
  88. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記2倍体集団は哺乳動物集団である、非一時的コンピュータ可読媒体。
  89. 請求項88に記載の非一時的コンピュータ可読媒体であって、前記哺乳動物集団はイヌ科動物集団である、非一時的コンピュータ可読媒体。
  90. 請求項89に記載の非一時的コンピュータ可読媒体であって、前記イヌ科動物集団は犬集団である、非一時的コンピュータ可読媒体。
  91. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記ハプロタイプデータは、ハプロタイプフェージングアルゴリズムを使用して前記被験個体集団の遺伝子型データを処理することによって生成される、非一時的コンピュータ可読媒体。
  92. 請求項91に記載の非一時的コンピュータ可読媒体であって、前記ハプロタイプフェージングアルゴリズムは参照ベースのハプロタイプフェージングアルゴリズムを含む、非一時的コンピュータ可読媒体。
  93. 請求項92に記載の非一時的コンピュータ可読媒体であって、前記参照ベースのハプロタイプフェージングアルゴリズムは隠れマルコフモデル(HMM)ベースのサーチを含む、非一時的コンピュータ可読媒体。
  94. 請求項93に記載の非一時的コンピュータ可読媒体であって、前記参照ベースのハプロタイプフェージングアルゴリズムは、Eagle1アルゴリズム、Eagle2アルゴリズム、PHASEアルゴリズム、fastPHASEアルゴリズム、BEAGLEアルゴリズム、Findhapアルゴリズム、Imputeアルゴリズム、FImputeアルゴリズム、AlphaImputeアルゴリズム、IMPUTE2アルゴリズム、MaCHアルゴリズム、SHAPEIT1アルゴリズム、SHAPEIT2アルゴリズム、SHAPEIT3アルゴリズム、SHAPEIT4アルゴリズム、または、それらの組合せを含む、非一時的コンピュータ可読媒体。
  95. 請求項91に記載の非一時的コンピュータ可読媒体であって、前記ハプロタイプフェージングアルゴリズムはコホートベースのハプロタイプフェージングアルゴリズムを含む、非一時的コンピュータ可読媒体。
  96. 請求項91に記載の非一時的コンピュータ可読媒体であって、前記遺伝子型データは、前記被験個体集団から得られる生体試料を検定することによって得られる、非一時的コンピュータ可読媒体。
  97. 請求項96に記載の非一時的コンピュータ可読媒体であって、前記生体試料は、血液試料、唾液試料、スワブ試料、細胞試料、または、組織試料を含む、非一時的コンピュータ可読媒体。
  98. 請求項96に記載の非一時的コンピュータ可読媒体であって、前記検定は前記生体試料またはそれらの派生物の配列決定を含む、非一時的コンピュータ可読媒体。
  99. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記複数の遺伝子マーカーは、少なくとも約500個、少なくとも約1000個、少なくとも約2000個、少なくとも約3000個、少なくとも約4000個、少なくとも約5000個、少なくとも約6000個、少なくとも約7000個、少なくとも約8000個、少なくとも約9000個、または、少なくとも約10000個の異なる遺伝子マーカーを含む、非一時的コンピュータ可読媒体。
  100. 請求項87に記載の非一時的コンピュータ可読媒体であって、同祖的である前記ハプロタイプのセグメントのマッチングは、GERMLINEアルゴリズム、PLINKアルゴリズム、PRESTアルゴリズム、IBD検出用ランダムプロジェクション(RaPID)アルゴリズム、IBD共有ハプロタイプ高速発見(FISHR)アルゴリズム、精密同祖(IBD)アルゴリズム、fastIBDアルゴリズム、KINGアルゴリズム、HaploScoreアルゴリズム、TRUFFLEアルゴリズム、または、それらの組合せの使用を含む、非一時的コンピュータ可読媒体。
  101. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記所定の閾値サイズは、約100キロベース塩基対(kbp)、約200kbp、約300kbp、約400kbp、約500kbp、約600kbp、約700kbp、約800kbp、約900kbp、または、約1000kbpである、非一時的コンピュータ可読媒体。
  102. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記所定の数の遺伝子マーカーは、約30個、約40個、約50個、約60個、約70個、約80個、約90個、または、約100個の異なる遺伝子マーカーである、非一時的コンピュータ可読媒体。
  103. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記方法は、前記複数の個別のゲノム範囲のうちの個別のゲノム範囲が等しいサイズを有するように、マッチングされた前記セグメントを分割するステップをさらに含む、非一時的コンピュータ可読媒体。
  104. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記方法は、前記複数の個別のゲノム範囲のうちの個別のゲノム範囲が可変サイズを有するように、マッチングされた前記セグメントを分割するステップをさらに含む、非一時的コンピュータ可読媒体。
  105. 請求項104に記載の非一時的コンピュータ可読媒体であって、前記複数の個別のゲノム範囲の所与の個別のゲノム範囲の前記可変サイズは、前記所与の個別のゲノム範囲に近接するIBDマッチの開始位置および終了位置、前記所与の個別のゲノム範囲における遺伝子マーカーの密度、前記所与の個別のゲノム範囲に対するマーカーの最大数、前記所与の個別のゲノム範囲の最大長さ、または、それらの組合せに少なくとも部分的に基づいて決定される、非一時的コンピュータ可読媒体。
  106. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記方法は、(i)前記第1の個体または前記第2の個体内の前記個別のゲノム範囲の前記等しいサイズ度、および、(ii)前記第1の個体と前記第2の個体との間の前記個別のゲノム範囲の前記対合マッチング度に基づいて、前記複数の個別のゲノム範囲の各々をさらに得点付け、それによって複数の等しいサイズ得点および複数の対合マッチング得点を生成するステップをさらに含む、非一時的コンピュータ可読媒体。
  107. 請求項106に記載の非一時的コンピュータ可読媒体であって、前記方法は、所与の対合マッチング得点の対応する等しいサイズ得点との整合性に基づいて、前記複数の対合マッチング得点を補正し、それによって複数の補正対合マッチング得点を生成するステップをさらに含む、非一時的コンピュータ可読媒体。
  108. 請求項106に記載の非一時的コンピュータ可読媒体であって、前記方法は、2つの2倍体個体における2つのアレルについての複数の同一性状態に基づいて、前記複数の個別のゲノム範囲に前記複数の重みを割り当てるステップをさらに含む、非一時的コンピュータ可読媒体。
  109. 請求項108に記載の非一時的コンピュータ可読媒体であって、前記複数の同一性状態は、表1から選択される同一性状態を含み、前記複数の重みは、表1に記載される血縁rxyに対する複数の寄与に基づいて割り当てられる、非一時的コンピュータ可読媒体。
  110. 請求項109に記載の非一時的コンピュータ可読媒体であって、前記祖先血縁度は血縁係数を含む、非一時的コンピュータ可読媒体。
  111. 請求項110に記載の非一時的コンピュータ可読媒体であって、前記方法は、マッチングされた前記セグメントの前記複数の個別のゲノム範囲に対する前記加重和を算出するステップであって、前記加重和は、
    Figure 2023501006000016
    で表される、ステップをさらに含む、非一時的コンピュータ可読媒体。
  112. 請求項109に記載の非一時的コンピュータ可読媒体であって、前記祖先血縁度は親縁係数を含む、非一時的コンピュータ可読媒体。
  113. 請求項112に記載の非一時的コンピュータ可読媒体であって、前記方法は、マッチングされた前記セグメントの前記複数の個別のゲノム範囲に対する前記加重和を算出するステップであって、前記加重和は、
    Figure 2023501006000017
    で表される、ステップをさらに含む、非一時的コンピュータ可読媒体。
  114. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記第1の個体と前記第2の個体との間の前記祖先血縁度を推定するステップは、前記第1の個体または前記第2の個体の近親交配の程度を決定するステップを含む、非一時的コンピュータ可読媒体。
  115. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記第1の個体と前記第2の個体との間の前記祖先血縁度を推定するステップは、前記第1の個体および前記第2の個体の近親交配の程度を決定するステップを含む、非一時的コンピュータ可読媒体。
  116. 請求項115に記載の非一時的コンピュータ可読媒体であって、前記方法は、前記第1の個体および前記第2の個体の近親交配の前記程度に少なくとも部分的に基づいて、前記第1の個体と前記第2の個体との家族関係を決定するステップをさらに含む、非一時的コンピュータ可読媒体。
  117. 請求項116に記載の非一時的コンピュータ可読媒体であって、前記家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、または、祖父母-孫関係である、非一時的コンピュータ可読媒体。
  118. 請求項114または115に記載の非一時的コンピュータ可読媒体であって、前記方法は、前記第1の個体と前記第2の個体の潜在的子孫の想定される近親交配の程度を決定するステップをさらに含む、非一時的コンピュータ可読媒体。
  119. 請求項118に記載の非一時的コンピュータ可読媒体であって、前記方法は、前記第1の個体と前記第2の個体の前記潜在的子孫の想定される近親交配の前記程度に基づいて、前記第1の個体と前記第2の個体とを交配させるか否かを示す提案を決定するステップをさらに含む、非一時的コンピュータ可読媒体。
  120. 請求項119に記載の非一時的コンピュータ可読媒体であって、前記方法は、前記第1の個体と前記第2の個体の前記潜在的子孫の想定される近親交配の前記程度が近親交配の所定の閾値の程度を超えない場合に、前記第1の個体と前記第2の個体とを交配させることを示す提案を決定するステップをさらに含む、非一時的コンピュータ可読媒体。
  121. 請求項119に記載の非一時的コンピュータ可読媒体であって、前記方法は、前記第1の個体と前記第2の個体の前記潜在的子孫の想定される近親交配の前記程度が近親交配の所定の閾値の程度を超える場合に、前記第1の個体と前記第2の個体とを交配させないことを示す提案を決定するステップをさらに含む、非一時的コンピュータ可読媒体。
  122. 請求項120または121に記載の非一時的コンピュータ可読媒体であって、近親交配の前記所定の閾値の程度は、約0.10、約0.15、約0.20、約0.25、約0.30、約0.35、約0.40、約0.45、または、約0.50である、非一時的コンピュータ可読媒体。
  123. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記方法は、前記第1の個体と前記第2の個体との推定される前記祖先血縁度に少なくとも部分的に基づいて、前記第1の個体に関連する第1の人間と前記第2の個体に関連する第2の人間との社会的つながりを生成するステップをさらに含む、非一時的コンピュータ可読媒体。
  124. 請求項123に記載の非一時的コンピュータ可読媒体であって、前記社会的つながりは、前記第1の個体と前記第2の個体との推定される前記祖先血縁度が所定の閾値を超える場合に生成される、非一時的コンピュータ可読媒体。
  125. 請求項124に記載の非一時的コンピュータ可読媒体であって、前記所定の閾値は、約0.00001、約0.0001、約0.001、約0.01、約0.02、約0.04、約0.06、約0.08、約0.1、約0.12、約0.14、約0.16、約0.18、約0.2、約0.25、約0.3、約0.35、約0.4、約0.45、または、約0.5である、非一時的コンピュータ可読媒体。
  126. 請求項123に記載の非一時的コンピュータ可読媒体であって、前記社会的つながりは、ソーシャルメディアネットワークを通じて生成される、非一時的コンピュータ可読媒体。
  127. 請求項123に記載の非一時的コンピュータ可読媒体であって、前記第1の人間は前記第1の個体のペット所有者であり、前記第2の人間は前記第2の個体のペット所有者である、非一時的コンピュータ可読媒体。
  128. 請求項87に記載の非一時的コンピュータ可読媒体であって、前記方法は、前記祖先血縁度に少なくとも部分的に基づいて、前記第1の個体と前記第2の個体との家族関係を特定するステップをさらに含む、非一時的コンピュータ可読媒体。
  129. 請求項128に記載の非一時的コンピュータ可読媒体であって、前記家族関係は、親子関係、兄弟姉妹関係、叔父/叔母-甥/姪関係、従兄弟姉妹関係、または、祖父母-孫関係である、非一時的コンピュータ可読媒体。
JP2022554739A 2019-11-18 2020-11-17 祖先血縁を決定するための方法およびシステム Pending JP2023501006A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962936879P 2019-11-18 2019-11-18
US62/936,879 2019-11-18
PCT/US2020/060899 WO2021101896A1 (en) 2019-11-18 2020-11-17 Methods and systems for determining ancestral relatedness

Publications (2)

Publication Number Publication Date
JP2023501006A true JP2023501006A (ja) 2023-01-17
JPWO2021101896A5 JPWO2021101896A5 (ja) 2023-11-15

Family

ID=75980898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022554739A Pending JP2023501006A (ja) 2019-11-18 2020-11-17 祖先血縁を決定するための方法およびシステム

Country Status (12)

Country Link
US (2) US11501851B2 (ja)
EP (1) EP4062411A4 (ja)
JP (1) JP2023501006A (ja)
KR (1) KR20220115952A (ja)
CN (1) CN115004304A (ja)
AU (1) AU2020388555A1 (ja)
BR (1) BR112022009494A2 (ja)
CA (1) CA3162092A1 (ja)
GB (1) GB2608502A (ja)
IL (1) IL292997A (ja)
MX (1) MX2022005956A (ja)
WO (1) WO2021101896A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230131539A1 (en) * 2021-10-27 2023-04-27 Mars, Incorporated Systems and methods for a pet relative finder

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1233366T1 (de) * 1999-06-25 2003-03-20 Genaissance Pharmaceuticals Verfahren zur herstellung und verwendung von Haplotype Daten
JP2003523176A (ja) 1999-10-15 2003-08-05 ダブリュー. ジーン ドッヅ, 動物健康診断
US6730023B1 (en) 1999-10-15 2004-05-04 Hemopet Animal genetic and health profile database management
US7548839B2 (en) 1999-10-15 2009-06-16 Hemopet System for animal health diagnosis
WO2003014143A2 (en) * 2001-08-04 2003-02-20 Whitehead Institute For Biomedical Research Haplotype map of the human genome and uses therefor
US20060147962A1 (en) 2003-06-16 2006-07-06 Mars, Inc. Genotype test
CA2543785A1 (en) 2003-10-24 2005-05-06 Mmi Genomics, Inc. Compositions, methods, and systems for inferring canine breeds for genetic traits and verifying parentage of canine animals
JP2007518403A (ja) * 2003-12-17 2007-07-12 フレッド ハッチンソン キャンサー リサーチ センター イヌ科動物血統の同定のための方法および材料
US20060045909A1 (en) 2004-08-30 2006-03-02 Colgate-Palmolive Company Genome-based diet design
US20060200320A1 (en) 2005-03-02 2006-09-07 Hill's Pet Nutrition, Inc. Methods and systems for designing animal food compositions
EP1798295A1 (en) 2005-12-14 2007-06-20 Gregory M Acland Method for identifying progressive rod-cone degeneration in dogs
WO2009035792A1 (en) 2007-08-03 2009-03-19 Melba Ketchum Compositions, methods and systems for the simultaneous determination of parentage, identity, sex, genotype and/or phenotype and breed determination in animals
GB0722068D0 (en) 2007-11-09 2007-12-19 Mars Inc Predictive test
WO2009108918A2 (en) * 2008-02-29 2009-09-03 John Boyce Methods and systems for social networking based on nucleic acid sequences
WO2009134226A1 (en) * 2008-05-01 2009-11-05 The Board Of Trustees Of The Leland Stanford Junior University Canine coat color prediction
US8463554B2 (en) * 2008-12-31 2013-06-11 23Andme, Inc. Finding relatives in a database
US20150344959A1 (en) 2013-01-14 2015-12-03 Cornell University Compositions and methods for genotyping canines
EP3621080B1 (en) * 2014-10-14 2023-09-06 Ancestry.com DNA, LLC Reducing error in predicted genetic relationships

Also Published As

Publication number Publication date
WO2021101896A1 (en) 2021-05-27
CA3162092A1 (en) 2021-05-27
EP4062411A4 (en) 2023-12-20
GB202207365D0 (en) 2022-07-06
AU2020388555A1 (en) 2022-06-02
BR112022009494A2 (pt) 2022-09-20
CN115004304A (zh) 2022-09-02
EP4062411A1 (en) 2022-09-28
US20230061512A1 (en) 2023-03-02
US20220122693A1 (en) 2022-04-21
US11501851B2 (en) 2022-11-15
KR20220115952A (ko) 2022-08-19
GB2608502A (en) 2023-01-04
MX2022005956A (es) 2022-09-07
IL292997A (en) 2022-07-01

Similar Documents

Publication Publication Date Title
Zagalska-Neubauer et al. 454 sequencing reveals extreme complexity of the class II Major Histocompatibility Complex in the collared flycatcher
Norris et al. Parentage and relatedness determination in farmed Atlantic salmon (Salmo salar) using microsatellite markers
JP5656678B2 (ja) イヌ科動物血統の同定のための方法および材料
Karlsson et al. Leader of the pack: gene mapping in dogs and other model organisms
Wolf et al. General lack of global dosage compensation in ZZ/ZW systems? Broadening the perspective with RNA-seq
Henkel et al. First draft genome sequence of the Japanese eel, Anguilla japonica
Dawson et al. High-utility conserved avian microsatellite markers enable parentage and population studies across a wide range of species
Palti et al. A first generation integrated map of the rainbow trout genome
WO2015051275A1 (en) Methods for analyzing genotypes
Baker et al. Comparative genomic hybridization (CGH) reveals a neo-X chromosome and biased gene movement in stalk-eyed flies (genus Teleopsis)
US20230106107A1 (en) Methods and systems for determining pigmentation phenotypes
Mohamed Yusoff et al. De novo sequencing, assembly and analysis of eight different transcriptomes from the Malayan pangolin
Urban et al. High contiguity de novo genome assembly and DNA modification analyses for the fungus fly, Sciara coprophila, using single-molecule sequencing
US20230061512A1 (en) Methods and systems for determining ancestral relatedness
Das et al. Genomic selection: a molecular tool for genetic improvement in livestock
JPWO2021101896A5 (ja)
EA046341B1 (ru) Способы и системы для определения родственного отношения
CN114258572A (zh) 用于确定基因组倍性的系统和方法
Lapian Molecular genetic approaches on cattle and chicken breeding: A Review
US20220036970A1 (en) Methods and systems for determination of gene similarity
Malde et al. Using sequencing coverage statistics to identify sex chromosomes in minke whales
CN116134546A (zh) 用于诊断检验的有效样本混合的方法和系统
Karuppannan et al. De novosequencing, assembly and analysis of eight different transcriptomes from the Malayan pangolin
Young Evolution and function of long noncoding RNAs in Drosophila
Fitzsimmons Exploring the realm of gene expression differences between White Leghorn and red junglefowl chickens

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231107

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231107