JP2013223507A

JP2013223507A - イヌ科動物血統の同定のための方法および材料

Info

Publication number: JP2013223507A
Application number: JP2013144684A
Authority: JP
Inventors: Elaine Ostrander; オストランダーイレーヌ; Leonid Kruglyak; クルーグリャックレオニード; Heidi G Parker; ジー．パーカーヘイディ; Lisa V Kim; ブイ．キムリサ; Matthew Stephens; スティーブンズマシュー; Tiffany B Malek; ビー．マレクティファニー; Nathan B Sutter; ビー．サッターネイサン; Scott Carlson; カールソンスコット
Original assignee: Fred Hutchinson Cancer Research Center
Current assignee: Fred Hutchinson Cancer Center
Priority date: 2003-12-17
Filing date: 2013-07-10
Publication date: 2013-10-31
Also published as: EP1711812A2; US7729863B2; WO2005059110A2; EP3438287B1; IL176258A0; US20060235625A1; EP1711812A4; EP2360472B1; AU2010210020B2; CA2733144C; US20230279505A1; EP2333541A2; AU2004298606B2; US20100217534A1; EP2333541B1; CA2771330C; AU2010210020A1; CA2771330A1; JP2011115174A; EP2360472A3

Abstract

【課題】イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を決定する方法を提供すること。
【解決手段】この方法は、以下の工程を包含する：（ａ）各マーカーセットについての試験イヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性を得る工程；および（ｂ）この試験イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を、この試験イヌ科動物ゲノム中の対立遺伝子と、イヌ科動物個体群プロファイルを含むデータベースとを比較することによって決定する工程。工程（ｂ）において、各イヌ科動物ゲノム個体群プロファイルは、上記イヌ科動物個体群における上記マーカーセットについての遺伝子型情報を含む。
【選択図】なし

Description

（関連出願の相互参照）
本出願は、２００３年１２月１７日に出願された米国仮特許出願第６０／５３０，４６４号の利益を主張する。

（政府のライセンス権に関する記載）
米国政府は、本発明における支払い済みのライセンスを有し、そして限定された状況において、特許権者が米国国立衛生研究所によって与えられたＨＧ３０００３５の条件で規定されるような妥当な条件でライセンスを他者に供与するよう要求する権利を有する。

（発明の分野）
本発明は、多型マーカーを用いてイヌ科動物ゲノムへの１種以上のイヌ科動物個体群の寄与度を決定することに関する。

（発明の背景）
Ｃａｎｉｓｆａｍｉｌｉａｒｉｓ（イエイヌ）は、表現型が分化し遺伝的に隔離された４００種以上の血統に分岐した単一種であり、これらのうちの１５２種は、米国でアメリカンケンネルクラブ公認である（非特許文献１）。別個の犬血統は、形態学、挙動、および疾患罹患率の特有の集まりによって特徴付けられる（非特許文献２）。種々のイヌの形態学は、１０００年前から存在し、そしてイヌ間での生殖隔離は、１９世紀中頃において血統クラブおよび血統標準の出現とともに形式化された。その時以来、「品種の境界（ｂｒｅｅｄｂａｒｒｉｅｒ）」規則（すなわち、イヌの雌親と雄親の両方が登録された一員でなければ、いずれのイヌも品種登録された一員になり得ないという規則）が発布され、各犬種間で比較的閉じた遺伝子プール（ｇｅｎｅｔｉｃｐｏｏｌ）を保証している。

３５０種類以上の遺伝性障害は、純血種イヌ個体群を分離する（非特許文献３）。これらの多くはヒトの一般的な障害と類似しており、特有の形態を生成するために使用された積極的な同系交配プログラムの結果として、特定の品種または品種群に限定されている。

個々の犬種を客観的に決定すること（例えば、特定品種に帰属するイヌであるという証明）のための多くの可能な使用が存在する。歴史的記録物は信頼度において品種ごとに変動するので、前の個体群情報に基づかない遺伝分析が、個体群構造を決定する最も直接的かつ正確な方法である。過去１０年間にわたり、分子生物学的方法（ｍｏｌｅｃｕｌａｒ
ｍｅｔｈｏｄ）が、野生イヌ科動物種についての我々の理解を深めるために、そしてイエイヌとそれら野生種との関係を決定するために使用されてきた。ミトコンドリアＤＮＡ配列分析は、イエイヌとオオカミとの間の関係を説明し、４万〜１０万年前に起こった複数の家畜化事象を解明する（非特許文献４；非特許文献５；非特許文献６）。しかし、ミトコンドリアＤＮＡの進化は、現代の犬種間での関係を推論することを可能にするには遅すぎる。ほとんどの現代の犬種は、４００年未満の間ずっと存在してきた。加えて、系統学的距離尺度および系統樹作成プログラムは、イヌ個体群において一般に観察されるような網目状進化を扱うための機能がない（非特許文献７；非特許文献８；非特許文献９）。ある先行研究は、核のマイクロサテライトの座位が５種からそれらの起源種へとイヌを割り当てるために使用され得そしてこれらの品種間で大きな遺伝的距離を示すことを示した（非特許文献１０）。別の研究は、２８種の収集物中の２種のペアの関連性を検出するためにマイクロサテライトを使用したが、品種間の広範な系統学的関係を証明し得なかった（非特許文献９）。このような関連性を見出すことの失敗は、マイクロサテライトの座位の特質（非特許文献９）、検査した限定された数の品種、またはこの研究において使用された分析方法を反映し得る。その代わりに、この失敗は、大部分の品種の最も近い起源およびそれらの生物における先祖型の混合によって、純血種イヌ個体群における複雑な構造を反映し得る。

ＣｒｏｗｌｅｙおよびＡｄｅｌｍａｎ編、ＡｍｅｒｉｃａｎＫｅｎｎｅｌＣｌｕｂ「ＴｈｅＣｏｍｐｌｅｔｅＤｏｇＢｏｏｋ」、ＨｏｗｅｌｌＢｏｏｋＨｕｅｓ，ＮｅｗＹｏｒｋ，ＮＹ、１９９８年Ｏｓｔｒａｎｄｅｒら、「ＴｒｅｎｄｓｉｎＧｅｎｅｔｉｃｓ」、２０００年、第１６号、ｐ．１１７−２３Ｐａｔｔｅｒｓｏｎら、Ｊ．Ａｍ．Ｖｅｔ．Ｍｅｄ．Ａｓｓｏｃ．、１９８８年、第１９３号、ｐ．１１３１Ｖｉｌａら、Ｓｃｉｅｎｃｅ、１９９７年、第２７６号、ｐ．１６８７−９Ｓａｖｏｌａｉｎｅｎら、Ｓｃｉｅｎｃｅ、２００２年、第２９８号、ｐ．１６１０−３Ｌｅｏｎａｒｄら、Ｓｃｉｅｎｃｅ、２００２年、第２９８号、ｐ．１６１３−６Ｚａｊｃら、Ｍａｍｍ．Ｇｅｎｏｍｅ、１９９７年第８巻、第３号、ｐ．１８２−５ＫｏｓｋｉｎｅｎおよびＢｒｅｄｂａｃｋａ、ＡｎｉｍａｌＧｅｎｅｔｉｃｓ、２０００年、第３１号、ｐ．３１０−１７Ｉｒｉｏｎら、Ｊ．Ｈｅｒｅｄ．、２００３年、第９４巻、第１号、ｐ８１−７Ｋｏｓｋｉｎｅｎ、Ａｎｉｍ．Ｇｅｎｅｔ，、２００３年、第３４号、ｐ２９７

関連する品種群を規定する方法、および個々のイヌゲノムへの品種の寄与度を明確に同定する方法の必要性が存在する。本発明は、この必要性および他の必要性に取り組む。

（発明の要旨）
一局面において、本発明は、イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を決定する方法を提供する。この方法は、以下の工程を包含する：（ａ）各マーカーセットについての試験イヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性を得る工程；および（ｂ）この試験イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を、この試験イヌ科動物ゲノム中の対立遺伝子と、イヌ科動物個体群プロファイルを含むデータベースとを比較することによって決定する工程。工程（ｂ）において、各イヌ科動物ゲノム個体群プロファイルは、上記イヌ科動物個体群におけるマーカーセットについての遺伝子型情報を含む。このマーカーセットは、少なくとも約５個のマーカー（例えば、イヌ科動物ゲノムの地図上に示される少なくとも約５個のマーカー）を含み得る。本発明の方法における使用に適する例示的なマーカーとしては、例えば、マイクロサテライトマーカー、一塩基多型（ＳＮＰ）、ミトコンドリアマーカー、および制限酵素断片長多型が挙げられる。例えば、上記マーカーセットは、表２に示すＳＮＰマーカーのうちの少なくとも５個、および／または、表１に示すマイクロサテライトマーカーのうちの少なくとも５個を含み得る。上記マーカーセットは、１つ以上の個体群特異的マーカー（例えば、１つ以上の個体群特異的ＳＮＰマーカー、または１つ以上の個体群特異的マイクロサテライトマーカー）を含み得る。例えば、１つ以上のＳＮＰマーカーは、３７２ｃ５ｔ−８２、３７２ｅ１３ｔ−５７、３７２ｍ６ｔ−８８、３７２ｍ２３ｔ−７６、３７３ａ１５ｔ−１１２、３７３ｅ１ｔ−５０、３７３ｅｌｔ−１３０、３７３ｇ１９ｔ−２４６、３７３ｉ８ｓ−２２４、３７３ｋ８ｓ−１８１、３７２ｃ５ｓ−１６８、３７２Ｃ１５Ｓ−１９６、３７２ｅ１５ｓ−７１、および３７３ａ２１ｔ−９３からなる群より選択され得る。

上記マーカーセットの各々についての試験イヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性は、当該分野において標準的な方法（例えば、ハイブリダイゼーション法、ポリメラーゼ連鎖反応法、サイズ分画法、ＤＮＡ塩基配列決定法など）を用いて得られ得る。例えば、上記方法の工程（ａ）は、上記マーカーセットの各々に特異的なプライマーを用いて、上記試験イヌ科動物のゲノムＤＮＡを増幅する工程、およびこの増幅産物のサイズを決定する工程を包含し得る。工程（ａ）はまた、上記マーカーセットの各々に特異的なプライマーを用いて、上記試験イヌ科動物のゲノムＤＮＡを増幅する工程、およびこの増幅産物のヌクレオチド配列を決定する工程を包含し得る。いくつかの実施形態において、上記プライマーは、配列番号１〜２００からなる群より選択される。いくつかの実施形態において、上記プライマーは、配列番号１〜２４４〜３２７からなる群より選択される。

イヌ科動物個体群プロファイルにおける遺伝子型情報は、例えば、そのイヌ科動物個体群の一員である１種以上のイヌ科動物におけるマーカーセット中のほとんどまたはすべてのマーカーの片方または両方の対立遺伝子の同一性、および／または、そのイヌ科動物個体群におけるマーカーセット中のほとんどまたはすべてのマーカーの少なくとも１つの対立遺伝子について推定された対立遺伝子頻度のような情報を含み得る。イヌ科動物個体群プロファイル中の推定された対立遺伝子頻度の各々は、代表的には、このイヌ科動物個体群の一員である少なくとも２つのイヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性に基づいている。イヌ科動物個体群プロファイルデータベースは、約５個と約数百個のとの間のイヌ科動物個体群プロファイル（例えば、少なくとも１００個のイヌ科動物個体群プロファイル）を含み得る。いくつかの実施形態において、上記イヌ科動物個体群プロファイルは、登録種（例えば、アメリカンケンネルクラブに登録された品種）のプロファイルを含む。

いくつかの実施形態において、上記マーカーセットは、約１５００個より少ないＳＮＰマーカーを含み、そして上記方法は、上記試験イヌ科動物ゲノムへの少なくとも８７種のイヌ科動物個体群の寄与度を決定する。いくつかの実施形態において、上記マーカーセットは、約２００個より少ないＳＮＰマーカー（例えば、約１００個のＳＮＰマーカー、または約５０個のＳＮＰマーカー）を含み、そして上記方法は、上記試験イヌ科動物ゲノムへの少なくとも８７種のイヌ科動物個体群の寄与度を決定する。

上記方法の工程（ｂ）において、１種以上のイヌ科動物個体群が上記試験イヌ科動物ゲノムへ寄与した可能性は、任意の適切なアルゴリズム（例えば、ベイジアンモデルベースのクラスタリングアルゴリズムまたは割り当てアルゴリズム）を用いて決定され得る。いくつかの実施形態において、工程（ｂ）は、特定のイヌ科動物個体群が上記試験イヌ科動物ゲノムへ寄与した確率を決定する工程を包含し、この確率は、この試験イヌ科動物ゲノム中の対立遺伝子がこの特定のイヌ科動物個体群中で生じる条件付き確率を、この試験イヌ科動物ゲノム中の対立遺伝子が上記データベース内の、各イヌ科動物個体群中で生じる条件付き確率の合計で割って決定することにより決定される。いくつかの実施形態において、工程（ｂ）は、上記試験イヌ科動物ゲノムへの２つ以上の遺伝的に関連するイヌ科動物個体群の寄与度の間を、この試験イヌ科動物ゲノム中の対立遺伝子をこの２つ以上の遺伝的に関連するイヌ科動物個体群プロファイルを含むデータベースと比較することによって識別する工程を包含する。例示的な遺伝的に関連したイヌ科動物個体群としては、ベルジアンシープドッグおよびベルジアンタービュレン；コリーおよびシェトランドシープドッグ；ウィペットおよびグレイハウンド；シベリアンハスキーおよびアラスカンマラミュート；マスチフおよびブルマスチフ；グレータースイスマウンテンドックおよびバーニーズマウンテンドッグ；ウェストハイランドホワイトテリアおよびケアーンテリア；ならびにラサアプソ、シーズー、およびペキニーズが挙げられるが、これらに限定されない。いくつかの実施形態において、本発明の方法は、上記試験イヌ科動物ゲノムのゲノムへの１種以上のイヌ科動物個体群の寄与度を表示する文書を提供する工程をさらに包含する。この文書は、上記試験イヌ科動物ゲノムまたは上記試験イヌ科動物へ寄与した１種以上のイヌ科動物個体群に関する情報（例えば、健康に関する情報（例えば、疾患の素因）、保険情報、または任意の他の種類の情報）を提供し得る。上記文書はまた、上記試験イヌ科動物ゲノムのゲノムへの１種以上のイヌ科動物個体群の寄与度についての証明書を提供し得る。いくつかの実施形態において、上記文書は、上記試験イヌ科動物のゲノムへ寄与した１種以上のイヌ科動物個体群についての表示（ｒｅｐｒｅｓｅｎｔａｔｉｏｎ）（例えば、写真、図、または他の描写）を提供する。

いくつかの実施形態において、本発明は、１種以上のイヌ科動物個体群を規定する方法を提供する。この方法は、以下の工程を包含する：（ａ）各イヌ科動物ゲノムセットについて、各マーカーセットのついての片方または両方の対立遺伝子の同一性を得る工程；および、（ｂ）上記イヌ科動物ゲノムセットの１つ以上の一員が、統計的モデリングを用いて各マーカーについて１セットの対立遺伝子頻度によって特徴付けられる別個のイヌ科動物個体群を規定する可能性を決定することによって、１種以上のイヌ科動物個体群を規定する工程。

別の局面において、本発明は、各マーカーセットについてイヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性を得るために、核酸配列を含む基材を提供する。

さらなる局面において、本発明は、イヌ科動物個体群の区別に使用するために、媒体上に保存されたデータ構造を含むコンピュータ読み取り可能な媒体を提供し、このデータ構造は：（ａ）マーカーの名称またはこのマーカーの対立遺伝子の名称を保存することが可能である、マーカーフィールド；および（ｂ）イヌ科動物個体群におけるそのマーカーについての遺伝子型情報を保存することが可能である遺伝子型情報フィールドであって、１つのレコードは、そのマーカーフィールドのインスタンス化およびこの遺伝子型情報フィールドのインスタンス化を含み、そして１セットのレコードは、１つのイヌ科動物プロファイルを表す、遺伝子型情報フィールドを備える。例えば、この遺伝子型情報フィールドは、イヌ科動物個体群におけるマーカー（例えば、ＳＮＰマーカー）の対立遺伝子頻度の推定値を保存することが可能であり得る。上記遺伝子型情報フィールドはまた、そのイヌ科動物個体群の一員である１種以上のイヌ科動物における各マーカーセットの片方または両方の対立遺伝子の同一性を保存することが可能であり得る。いくつかの実施形態において、上記コンピュータに読み取り可能媒体は、以下をこの媒体上に保存したものを有する基板を備える：
（ａ）イヌ科動物個体群の区別に使用するためのデータ構造であって、このデータ構造は；
（ｉ）マーカーの名称またはこのマーカーの対立遺伝子の名称を保存することが可能である、マーカーフィールド；および
（ｉｉ）イヌ科動物個体群におけるそのマーカーについての遺伝子型情報を保存することが可能である遺伝子型情報フィールドであって、１つのレコードは、このマーカーフィールドのインスタンス化およびこの遺伝子型情報フィールドのインスタンス化を含み、そして１セットのレコードは、１つのイヌ科動物プロファイルを表す、遺伝子型情報フィールド
を備える、データ構造；ならびに
（ｂ）イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を決定する方法を実施するための、コンピュータが実行可能な命令であって、以下の工程：
（ｉ）各マーカーセットについて試験イヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性を得る工程；および
（ｉｉ）この試験イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を、この試験イヌ科動物ゲノム中の対立遺伝子と、イヌ科動物プロファイルを含むデータベースとを比較することによって決定する工程であって、イヌ科動物個体群プロファイルの各々は、そのイヌ科動物個体群における上記マーカーセットについての遺伝子型情報を含む、工程を包含する、コンピュータが実行可能な命令を備える、コンピュータに読み取り可能な情報を含む。

本発明の上述の局面および付随する多くの利益は、添付の図面と一緒に以下の詳細な説明を参照することによってより良く理解されるので、より容易に理解される。

例えば、本発明は、以下の項目を提供する。
（項目１）
イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を決定する方法であって、以下の工程：
（ａ）各マーカーセットについての試験イヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性を得る工程；および
（ｂ）該試験イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を、該試験イヌ科動物ゲノム中の対立遺伝子と、イヌ科動物個体群プロファイルを含むデータベースとを比較することによって決定する工程であって、各イヌ科動物個体群プロファイルは、該イヌ科動物個体群におけるマーカーセットに関する遺伝子型情報を含む、工程
を包含する、方法。
（項目２）
項目１に記載の方法であって、前記マーカーセットは、少なくとも約５個のマーカーを含む、方法。
（項目３）
項目１に記載の方法であって、前記マーカーセットは、マイクロサテライトマーカーを含む、方法。
（項目４）
項目３に記載の方法であって、前記マイクロサテライトマーカーは、表１に示すマイクロサテライトマーカーのうちの少なくとも５個を含む、方法。
（項目５）
項目１に記載の方法であって、前記マーカーセットは、一塩基多型（ＳＮＰ）を含む、方法。
（項目６）
項目５に記載の方法であって、前記ＳＮＰマーカーは、表２に示すＳＮＰマーカーのうちの少なくとも５個を含む、方法。
（項目７）
項目１に記載の方法であって、前記マーカーセットは、１つ以上の個体群特異的マーカーを含む、方法。
（項目８）
項目７に記載の方法であって、前記１つ以上の個体群特異的マーカーは、１つ以上のＳＮＰマーカーを含む、方法。
（項目９）
項目８に記載の方法であって、前記１つ以上のＳＮＰマーカーは、３７２ｃ５ｔ−８２、３７２ｅ１３ｔ−５７、３７２ｍ６ｔ−８８、３７２ｍ２３ｔ−７６、３７３ａ１５ｔ−１１２、３７３ｅ１ｔ−５０、３７３ｅｌｔ−１３０、３７３ｇ１９ｔ−２４６、３７３ｉ８ｓ−２２４、３７３ｋ８ｓ−１８１、３７２ｃ５ｓ−１６８、３７２Ｃ１５Ｓ−１９６、３７２ｅ１５ｓ−７１、および３７３ａ２１ｔ−９３からなる群より選択される、方法。
（項目１０）
項目１に記載の方法であって、イヌ科動物個体群プロファイルにおける前記遺伝子型情報は、前記マーカーセットの各々の片方または両方の対立遺伝子の同一性を含む、方法。（項目１１）
項目１に記載の方法であって、イヌ科動物個体群プロファイルにおける前記遺伝子型情報は、前記マーカーセットの各々の少なくとも片方の対立遺伝子についての対立遺伝子頻度を含む、方法。
（項目１２）
項目１に記載の方法であって、前記イヌ科動物個体群プロファイルデータベースは、約５個と約５００個と間のイヌ科動物個体群プロファイルを含む、方法。
（項目１３）
項目１に記載の方法であって、前記イヌ科動物個体群プロファイルデータベースは、少なくとも約５種のアメリカンケンネルクラブ公認血統種についてプロファイルを含む、方法。
（項目１４）
項目１に記載の方法であって、前記マーカーセットは、約１５００個よりも少ないＳＮＰマーカーを含み、そして該方法は、前記試験イヌ科動物ゲノムへの少なくとも８７種のイヌ科動物個体群の寄与度を決定する、方法。
（項目１５）
項目１に記載の方法であって、前記マーカーセットは、約２００個よりも少ないＳＮＰマーカーを含み、そして該方法は、前記試験イヌ科動物ゲノムへの少なくとも８７種のイヌ科動物個体群の寄与度を決定する、方法。
（項目１６）
項目１に記載の方法であって、工程（ａ）は、前記マーカーセットの各々に特異的なプライマーを用いて、前記試験イヌ科動物のゲノムＤＮＡを増幅する工程、および該増幅産物のサイズを決定する工程を包含する、方法。
（項目１７）
項目１に記載の方法であって、工程（ｂ）は、遺伝子型クラスタリングプログラムを用いる工程を包含する、方法。
（項目１８）
項目１に記載の方法であって、工程（ｂ）は、割当てアルゴリズムを用いる工程を包含する、方法。
（項目１９）
項目１に記載の方法であって、工程（ｂ）は、特定のイヌ科動物個体群が前記試験イヌ科動物ゲノムへ寄与した確率を決定する工程を包含し、該確率は、該試験イヌ科動物ゲノム中の対立遺伝子が該特定のイヌ科動物個体群中で生じる条件付き確率を、該試験イヌ科動物ゲノム中の対立遺伝子が前記データベース内の、各イヌ科動物個体群中で生じる条件付き確率の合計で割って決定することにより決定される、方法。
（項目２０）
項目１に記載の方法であって、工程（ｂ）は、前記試験イヌ科動物ゲノムへの２つ以上の遺伝的に関連するイヌ科動物個体群の寄与度の間を、該試験イヌ科動物ゲノム中の対立遺伝子を該２つ以上の遺伝的に関連するイヌ科動物個体群プロファイルを含むデータベースと比較することによって識別する工程を包含する、方法。
（項目２１）
項目２０に記載の方法であって、前記２つ以上の遺伝的に関連するイヌ科動物個体群は、ベルジアンシープドッグおよびベルジアンタービュレンを含む、方法。
（項目２２）
項目２０に記載の方法であって、前記２つ以上の遺伝的に関連するイヌ科動物個体群は、コリーおよびシェトランドシープドッグを含む、方法。
（項目２３）
項目２０に記載の方法であって、前記２つ以上の遺伝的に関連するイヌ科動物個体群は、ウィペットおよびグレイハウンドを含む、方法。
（項目２４）
項目２０に記載の方法であって、前記２つ以上の遺伝的に関連するイヌ科動物個体群は、シベリアンハスキーおよびアラスカンマラミュートを含む、方法。
（項目２５）
項目２０に記載の方法であって、前記２つ以上の遺伝的に関連するイヌ科動物個体群は、マスチフおよびブルマスチフを含む、方法。
（項目２６）
項目２０に記載の方法であって、前記２つ以上の遺伝的に関連するイヌ科動物個体群は、グレータースイスマウンテンドックおよびバーニーズマウンテンドッグを含む、方法。
（項目２７）
項目２０に記載の方法であって、前記２つ以上の遺伝的に関連するイヌ科動物個体群は、ウェストハイランドホワイトテリアおよびケアーンテリアを含む、方法。
（項目２８）
項目２０に記載の方法であって、前記２つ以上の遺伝的に関連するイヌ科動物個体群は、ラサアプソ、シーズー、およびペキニーズを含む、方法。
（項目２９）
項目１に記載の方法であって、前記方法は、前記試験イヌ科動物ゲノムへの１種以上のイヌ科動物個体群の寄与度を表示する文書を提供する工程をさらに包含する、方法。
（項目３０）
項目２９に記載の方法であって、前記文書は、前記試験イヌ科動物ゲノムまたは前記イヌ科動物へ寄与した前記１種以上のイヌ科動物個体群に関する情報を提供する、方法。
（項目３１）
項目３０に記載の方法であって、前記情報は、健康に関する情報である、方法。
（項目３２）
項目３０に記載の方法であって、前記情報は、保険情報である、方法。
（項目３３）
項目２９に記載の方法であって、前記文書は、１種以上のイヌ科動物個体群の前記試験イヌ科動物ゲノムのゲノムへの寄与度の証明書を提供する、方法。
（項目３４）
項目２９に記載の方法であって、前記文書は、前記試験イヌ科動物ゲノムへ寄与した１種以上のイヌ科動物個体群の表示を提供する、方法。
（項目３５）
１種以上のイヌ科動物個体群を規定する方法であって、以下の工程：
（ａ）各イヌ科動物ゲノムセットについて、各マーカーセットのついての片方または両方の対立遺伝子の同一性を得る工程；および
（ｂ）イヌ科動物ゲノムセットの１つ以上の一員が、統計的モデリングを用いて各マーカーについて１セットの対立遺伝子頻度によって特徴付けられる別個のイヌ科動物個体群を規定する可能性を決定することによって、１種以上のイヌ科動物個体群を規定する工程を包含する、方法。
（項目３６）
コンピュータに読み取り可能な媒体であって、イヌ科動物個体群の区別に使用するために、該媒体上に保存されたデータ構造を含み、該データ構造は：
（ａ）マーカーの名称または該マーカーの対立遺伝子の名称を保存することが可能である、マーカーフィールド；および
（ｂ）イヌ科動物個体群における該マーカーについての遺伝子型情報を保存することが可能である遺伝子型情報フィールドであって、１つのレコードは、該マーカーフィールドのインスタンス化および該遺伝子型情報フィールドのインスタンス化を含み、そして１セットのレコードは、１つのイヌ科動物プロファイルを表す、遺伝子型情報フィールド
を備える、コンピュータに読み取り可能な媒体。
（項目３７）
コンピュータに読み取り可能な媒体であって、以下：
（ａ）イヌ科動物個体群の区別に使用するために該媒体上に保存されたデータ構造であって、該データ構造は；
（ｉ）マーカーの名称または該マーカーの対立遺伝子の名称を保存することが可能である、マーカーフィールド；および
（ｉｉ）イヌ科動物個体群における該マーカーについての遺伝子型情報を保存することが可能である遺伝子型情報フィールドであって、１つのレコードは、該マーカーフィールドのインスタンス化および該遺伝子型情報フィールドのインスタンス化を含み、そして１セットのレコードは、１つのイヌ科動物プロファイルを表す、遺伝子型情報フィールド
を備える、データ構造；ならびに
（ｂ）イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を決定する方法を実施するための、コンピュータが実行可能な命令であって、以下の工程：
（ｉ）各マーカーセットについて試験イヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性を得る工程；および
（ｉｉ）該試験イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を、該試験イヌ科動物ゲノム中の対立遺伝子と、イヌ科動物プロファイルを含むデータベースとを比較することによって決定する工程であって、イヌ科動物個体群プロファイルの各々は、該イヌ科動物個体群における該マーカーセットについての遺伝子型情報を含む、工程
を包含する、コンピュータが実行可能な命令；
を該媒体上に保存したものを備える、コンピュータに読み取り可能な媒体。

図１は、２種のイヌ科動物個体群に対する疾患素因に関する情報とともに、試験イヌ科動物（ファイド（Ｆｉｄｏ））ゲノムへの２種のイヌ科動物個体群（ボーダーコリーおよびブルマスチフ）の寄与度を表示する例示的な文書を示す。図２は、実施例４に記載されるように、８５種の犬種とハイイロオオカミとのコンセンサス近隣結合木（ｃｏｎｓｅｎｓｕｓｎｅｉｇｈｂｏｒ−ｊｏｉｎｉｎｇｔｒｅｅ）を示す。統計学的支持によって枝を形成する９種が示される。残りの７６種は、わずかに系統学的構造を示し、そして簡略化のために「他のすべての品種」と標識した１つの枝にまとめている。このコンセンサスを形成した木は、コード距離尺度に基づいている。このデータについて５００回のブートストラップ複製が行われ、そして各枝を支持するブートストラップの比が、複製で５０％を超える場合には、支持された枝に関して百分率で、対応するノードにて示される。木の根にあるオオカミ個体群は、８個体から構成される。この個体は、以下の各国々（中国、オマーン、イラン、スウェーデン、イタリア、メキシコ、カナダ、および米国）に由来する１つの個体である。枝の長さは、ブートストラップ値に比例している。

（好ましい実施形態の詳細な説明）
本明細書は、本明細書とともに提出された２枚のコンパクトディスクに含まれるファイルを、それらの全体を参考して本明細書により援用する。第１のコンパクトディスクは表３および表４を含み、第２のコンパクトディスクは、配列表を含む。

本明細書中で具体的に規定されない限り、本明細書中で使用される全ての用語は、本発明の当業者が使用するのと同じ意味を有する。

第一の局面において、本発明は、イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を決定する方法を提供する。この方法は、以下の工程：
（ａ）各マーカーセットについての試験イヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性を得る工程；および
（ｂ）この試験イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を、この試験イヌ科動物ゲノム中の対立遺伝子と、イヌ科動物個体群プロファイルを含むデータベースとを比較することによって決定する工程であって、この工程において各イヌ科動物個体群プロファイルは、このイヌ科動物個体群におけるマーカーセットに関する遺伝子型情報を含む、工程
を包含する。

本明細書中で使用される場合、用語「イヌ科動物個体群の寄与度を決定する」とは、１種以上のイヌ科動物個体群が試験イヌ科動物ゲノムへ寄与したか否かについて推論をするために、イヌ科動物個体群の寄与度を統計学的方法を使用して推定または推測することをいう。

本明細書中で使用される場合、用語「イヌ科動物」とは、オオカミ、ジャッカル、キツネ、コヨーテ、およびイエイヌを含む、Ｃａｎｉｄａｅ科の一員である動物をいう。例えば、イヌ科動物は、イエイヌ、オオカミ、またはＣａｎｉｄａｅ科の一種以上からの何らかの遺伝的寄与度を有する動物であり得る。用語「イヌ科動物個体群」は、血統関係にあるイヌ科動物の一群（例えば、イエイヌ種）をいう。用語「品種（ｂｒｅｅｄ）」とは、ヒトによって制御された状況下で選択されている比較的均一な表現型の形質を有する種内の動物の一群をいう。例えば、アメリカンケンネルクラブ（ＡＫＣ）は、７種の群（ハーディング、ハウンド、ノンスポーティング、スポーティング、テリア、トイ、およびワーキング）に分かれる１５２種を認めている（ＡｍｅｒｉｃａｎＫｅｎｎｅｌＣｌｕｂ（１９９８）「ＴｈｅＣｏｍｐｌｅｔｅＤｏｇＢｏｏｋ」、ＣｒｏｗｌｅｙおよびＡｄｅｌｍａｎ編、ＨｏｗｅｌｌＢｏｏｋＨｕｅｓ、ＮｅｗＹｏｒｋ、ＮＹ）。本発明の方法は、任意の犬種の遺伝的寄与度を推定するために使用され得る。この任意の犬種としては、アフガンハウンド、エアデールテリア、秋田犬、アラスカンマラミュート、アメリカンエスキモードッグ、アメリカンフォックスハウンド、アメリカンへアレスラットテリア、アメリカンスタッフォードシャーテリア、アメリカンウォータースパニエル、オーストラリアンキャトルドッグ、オーストラリアンシェパード、オーストラリアンテリア、バセニー、バセットハウンド、ビーグル、ビアデッドコリー、ベドリントンテリア、ベルジアンラケノア、ベルジアンマリノア、ベルジアンシープドッグ、ベルジアンタービュレン、バーニーズマウンテンドッグ、ビションフリーゼ、ブラットハウンド、ボーダーコリー、ボーダーテリア、ボルゾイ、ボストンテリア、ブーヴィエデフランドル、ボイキンスパニエル、ボクサー、ブリアード、ブリタニー、ブルドッグ、ブラッセルグリフォン、ブルマスチフ、ブルテリア、ケアーンテリア、カーディガンウェルシュコーギー、キャバリアキングチャールズスパニエル、チェサピークベイレトリバー、チワワ、チャイニーズクレステッド、チャイニーズシャーペイ、チャウチャウ、クライバースパニエル、コッカースパニエル、コリー、カーリーコーテッドレトリバー、ダックスフンド、ダルメシアン、ダンディーディンモントテリア、ドーベルマンピンシェル、ドゴカナリオ、イングリッシュコッカースパニエル、イングリッシュフォックスハウンド、イングリッシュセッター、イングリッシュスプリンガースパニエル、エントレブッハーマウンテンドッグ、フィールドスパニエル、フラットコーテッドレトリバー、フレンチブルドッグ、ジャーマンロングヘアードポインター、ジャーマンシェパードドッグ、ジャーマンショートヘアードポインター、ジャーマンワイヤーヘアードポインター、ジャイアントシュナウザー、ゴールデンレトリバー、ゴードンセッター、グレートデーン、グレートピレニーズ、グレートスミスマウンテンドッグ、グレイハウンド、ハリヤー、ハバニーズ、イビザンハウンド、アイリッシュセッター、アイリッシュテリア、アイリッシュウォータースパニエル、アイリッシュウルフハウンド、イタリアングレイハウンド、ジャックラッセルテリア、キースホンド、ケリーブルーテリア、コモンドール、クバーズ、ラブラドールレトリバー、レオンベルガー、ラサアプソ、ローシェン、マルチーズ、スタンダードマンチェスターテリア、トイマンチェスターテリア、マスチフ、ミニチュアブルテリア、ミニチュアピンシャー、ミニチュアプードル、ミニチュアシュナウザー、ミュンスターレンダー、ナポリタンマスチフ、ニューファンドランド、ニューギニアシンギングドッグ、ノルウェジアンエルクハウンド、ノーリッチテリア、オールドイングリッシュシープドッグ、パピヨン、ペキニーズ、ウェルシュコーギーペンブローク、プチバセットグリフォンヴァンデーン、ファラオハウンド、ポインター、ポリッシュローランドシープドッグ、ポメラニアン、ポルトガルウォータードッグ、プレサカナリオ、パグ、プーリー、プーミー、ローデシアンリッジバック、ロットワイラー、セントバーナード、サルーキ、サモエド、スキッパーキ、スコティッシュディアハウンド、スコティッシュテリア、シルキーテリア、シェトランドシープドッグ、柴犬、シーズー、シベリアンハスキー、スムースフォックステリア、ソフトコーテッドウィートンテリア、スピノニイタリアーノ、スタッフォードシャーブルテリア、スタンダードプードル、スタンダードシュナウザー、サセックススパニエル、チベタンスパニエル、チベタンテリア、トイフォックステリア、トイプードル、ビズラ、ワイマラナー、ウェルシュスプリンガースパニエル、ウェルシュテリア、ウェストハイランドホワイトテリア、ワイヤーヘアードポインティンググリフォン、ウィペット、ヨークシャーテリアが挙げられるが、これらに限定されない。

本発明の方法はまた、イヌ科動物個体群からの遺伝的寄与度を決定するために使用され得る。この個体群は、認められた品種のサブセット（例えば、特定のブリーダーが起源であるダルマシアンの一群）または品種として認められていないか未だ認められていないイヌ科動物の一群である。同様に、本発明の方法は、イエイヌではないイヌ科動物個体群からの遺伝的寄与度を決定するために使用され得る。

本発明の方法の第１工程は、各マーカーセットについての試験イヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性を得る工程を包含する。用語「マーカー」は、試験イヌ科動物ゲノムへのこれらのイヌ科動物個体群の遺伝的寄与度を推定するために有用である、本発明の方法において使用されたイヌ科動物個体群にわたって十分に情報価値のある、任意の多型のゲノム座（ｇｅｎｏｍｉｃｌｏｃｕｓ）をいう。ゲノム座は、それが少なくとも２つの対立遺伝子を有する場合、多型である。用語「対立遺伝子」とは、ゲノム座の他の形態からその核酸配列によって区別され得るゲノム座の特定の形態をいう。従って、ゲノム座の異なる対立遺伝子は、その座位（ｌｏｃｕｓ）で代替的な核酸配列を表す。任意の個体のイヌ科動物ゲノムにおいて、各マーカーについて２つの対立遺伝子が存在する。両方の対立遺伝子が同じである場合、ゲノムは、そのマーカーにホモ接合性である。逆に、その２つの対立遺伝子が異なる場合、ゲノムは、そのマーカーにヘテロ接合性である。

個体群特異的対立遺伝子は、あるイヌ科動物個体群においていくらかの頻度で存在する対立遺伝子であるが、比較イヌ科動物個体群からサンプル抽出されたイヌ科動物中で観察されていない（しかし、それらは、実に低い頻度で存在し得る）。個体群特異的対立遺伝子は、特定の個体群に個体を割り当てるために使用され得る。従って、個体群間の対立遺伝子頻度における差異は、遺伝的寄与度を決定するために使用され得る。

「マーカーセット」とは、試験イヌ科動物ゲノムへの本発明の方法に使用されたイヌ科動物個体群の遺伝的寄与度を決定するために十分なマーカーの最小数をいう。この必要とされるマーカーの最小数は、以下にさらに記載されるように、使用されている特定のイヌ科動物個体群についてのマーカーの情報性（ｉｎｆｏｒｍａｔｉｖｅｎｅｓｓ）に依存する。マーカーセットは、少なくとも約５個のマーカー、少なくとも約１０個のマーカー、少なくとも約５０個のマーカー、または約１００個より多いマーカーを含み得る。

本発明に従って使用され得る代表的なマーカーとしては、マイクロサテライトマーカー、ミトコンドリアマーカー、制限酵素断片長多型、および一塩基多型（ＳＮＰ）が挙げられる。有用なイヌ科動物のマイクロサテライトマーカーとしては、ジヌクレオチドリピート（例えば、（ＣＡ）_ｎ）、トリヌクレオチドリピート、およびテトラヌクレオチドリピート（例えば、（ＧＡＡＡ）_ｎ）が挙げられるが、これらに限定されない（Ｆｒａｎｃｉｓｃｏら、（１９９６）Ｍａｍｍ．Ｇｅｎｏｍｅ７：３５９−６２；Ｏｓｔｒａｎｄｅｒら、（１９９３）Ｇｅｎｏｍｉｃｓ１６：２０７−１３）。本発明の方法における使用のための例示的なマーカーとしては、表１に示すマイクロサテライトマーカー、表２に示すＳＮＰマーカー、およびＧｕｙｏｎら（２００３）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．ＳｃｉＵ．Ｓ．Ａ．１００（９）：５２９６−５３０１に記載されるマーカーが挙げられる。本発明の方法において使用されるマーカーセットは、表１のマイクロサテライトマーカーからの少なくとも約５個のマーカー、および／または、表２のＳＮＰマーカーからの少なくとも約５個のマーカーを含み得る。いくつかの実施形態において、マーカーセットは、３７２ｃ５ｔ−８２、３７２ｅ１３ｔ−５７、３７２ｍ６ｔ−８８、３７２ｍ２３ｔ−７６、３７３ａ１５ｔ−１１２、３７３ｅ１ｔ−５０、３７３ｅｌｔ−１３０、３７３ｇ１９ｔ−２４６、３７３ｉ８ｓ−２２４、３７３ｋ８ｓ−１８１、３７２ｃ５ｓ−１６８、３７２Ｃ１５Ｓ−１９６、３７２ｅ１５ｓ−７１、および３７３ａ２１ｔ−９３からなる群より選択される。いくつかの実施形態において、約１５００個よりも少ない数のＳＮＰマーカーを含む１セットのマーカーは、試験イヌ科動物ゲノムへの少なくとも８７種のイヌ科動物個体群の寄与度を決定するために使用される。いくつかの実施形態において、約２００個よりも少ない数のＳＮＰマーカーを含む１セットのマーカーは、試験イヌ科動物ゲノムへの少なくとも約８７種のイヌ科動物個体群の寄与度を決定するために使用される。

本発明の方法に従って、各マーカーの片方または両方の対立遺伝子の同一性が、得られ得る。いくつかの実施形態において、試験イヌ科動物における片方または両方の対立遺伝子の同一性は、当該分野において標準的な方法を使用して実験的に決定され得る。例えば、ゲノムマーカーの片方または両方の対立遺伝子の同一性は、当該分野で公知の任意の遺伝子型決定方法を使用して決定され得る。例示的な遺伝子型決定方法としては、ハイブリダイゼーション法、ポリメラーゼ連鎖反応法（ＰＣＲ）、サイズ分画法、ＤＮＡ塩基配列決定法、ＤＮＡマイクロアレイ法、ビーズの高密度光ファイバーアレイ法（ｈｉｇｈｄｅｎｓｉｔｙｆｉｂｅｒ−ｏｐｔｉｃａｒｒａｙｓｏｆｂｅａｄｓ）（例えば、Ｊｉａｎｂｉｎｇら、（２００３）Ｃｈｉｎ．Ｓｃｉ．Ｂｕｌｌ．４８（１８）：１９０３−５を参照のこと）、プライマー伸長法、質量分析法（例えば、Ｊｕｒｉｎｋｅら、（２００２）Ｍｅｔｈ．Ｍｏｌ．Ｂｉｏｌ．１８７：１７９−９２を参照のこと）、およびホールゲノムサンプリング分析法（ｗｈｏｌｅ−ｇｅｎｏｍｅｓａｍｐｌｉｎｇａｎａｌｙｓｉｓ）（例えば、Ｋｅｎｎｅｄｙら、（２００３）Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．２１（１０）：１２３３−７を参照のこと）の使用が挙げられるが、これらに限定されない。試験イヌ科動物におけるマーカーの対立遺伝子の同一性はまた、既に決定されており、かつ例えば刊行された文献のような供給源から利用可能であり得る。

いくつかの実施形態において、試験イヌ科動物のゲノムＤＮＡは、マーカーに特異的なプライマーを使用して増幅され得、その後にこの増幅産物のサイズ分析または配列決定が続く。イヌ科動物ゲノム中のマーカーの片方または両方の対立遺伝子の同一性を得るための例示的な方法は、実施例１に記載される。いくつかの実施形態において、マイクロサテライトマーカーを含むゲノムＤＮＡを増幅するために使用されたプライマーは、配列番号１〜２００からなる群より選択されるが、他のプライマーおよび他のマイクロサテライトマーカーも使用され得る。いくつかの実施形態において、ＳＮＰマーカーを含むゲノムＤＮＡを増幅するために使用されたプライマーは、配列番号２４４〜３２７からなる群より選択されるが、他のプライマーおよび他のＳＮＰマーカーも使用され得る。４２２匹のイヌ科動物（８５品種を表す４１４匹のイヌと８匹のオオカミとを含む）における６８個〜１００個のマイクロサテライトの対立遺伝子の同一性は、（同封して提出したコンパクトディスク中の）表３に示される。１８９種のイヌ科動物（６７品種を表す１８６匹のイヌと２匹のオオカミと１匹のコヨーテとを含む）における１００個のＳＮＰマーカーの対立遺伝子の同一性は、（同封して提出したコンパクトディスク中の）表４に示される。

本発明の方法の第１工程において使用されるマーカーセット中に含まれるマーカーの最小数は、使用される特定のイヌ科動物個体群のついてのマーカーの情報性に依存する。このマーカーの情報は、本発明の方法において使用されるイヌ科動物個体群内かつこれら個体群間で異なる対立遺伝子数の関数、これらの対立遺伝子の頻度、および座位における変異率の割合である。ゲノム座の多型の程度（ｄｅｇｒｅｅｏｆｐｏｌｙｍｏｒｐｈｉｓｍ）は、多型情報内容（ＰＩＣ）の推定によって評価され得る。この多型情報量は、対立遺伝子数およびそれらの分配頻度の関数である。本発明の方法における使用に適切なマイクロサテライトマーカーについての例示的なＰＩＣ値は、表１に示される。本発明の方法における使用に適切なマーカーは、実施例１に示されるように、約０．６５％の平均ＰＩＣ値を有し得る。

異なるイヌ科動物個体群中のマーカーの対立遺伝子数、およびイヌ科動物個体群内およびこれら個体群間での対立遺伝子頻度を決定する方法は、実施例１に記載される。例えば、マーカーごとの対立遺伝子の平均数、（ハーディワインバーグ平衡の推定に基づいて）予測されたヘテロ接合性、観察されたヘテロ接合性、および９４匹のイヌ科動物（１８品種を表す９０匹のイヌと、４匹のオオカミとを含む）における９５個のマイクロサテライトマーカー間での推定された同系交配係数は、実施例１に記載される。品種の境界の存在は、同種由来のイヌが異種由来のイヌよりも遺伝学的により類似しているはずであることを予測する。この予測を試験するために、品種の構成員（ｍｅｍｂｅｒｓｈｉｐ）に起因し得る個々のイヌ間における遺伝的多様性の割合が、推定された。マイクロサテライトデータ（６８品種を表す３２８匹のイヌにおける９６個のマーカーを含む）についての分子変動の分析は、実施例１に記載されるように、遺伝分散の合計の２７％よりも多くの割合を占める品種間の分散を示した。同様に、ＳＮＰマーカーデータ（６０品種を表す１２０匹のイヌにおける７５個のＳＮＰを含む）から計算された品種間の遺伝学的距離は、実施例１に記載されるように、Ｆ_ＳＴ＝０．３６であった。これらの観察は、少数の犬種を分析したこれまでの報告（Ｋｏｓｋｉｎｅｎ（２００３）Ａｎｉｍ．Ｇｅｎｅｔ．３４：２９７；Ｉｒｉｏｎら、（２００３）Ｊ．Ｈｅｒｅｄ．９４：８１）と一致し、品種の境界が品種間で顕著な遺伝的隔離をもたらしていたということを予測し、そしてヒト個体群の間で見出されたより低い遺伝学的差異（代表的には、５％〜１０％の範囲内）とは著しく異なる（Ｒｏｓｅｎｂｅｒｇら、（２００２）Ｓｃｉｅｎｃｅ２９８：２３８１−５；Ｃａｖｅｌｌｉ−Ｓｆｏｒｚａら、（１９９４）ＴｈｅＨｉｓｔｏｒｙａｎｄＧｅｏｇｒａｐｈｙｏｆＨｕｍａｎＧｅｎｅｓ、ＰｒｉｎｃｅｔｏｎＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ，Ｐｒｉｎｃｅｔｏｎ）。イヌにおける品種間での変動は、家畜個体群について報告された範囲よりも高い（ＭａｃＨｕｇｈら、（１９９８）Ａｎｉｍ．Ｇｅｎｅｔ．２９：３３３；Ｌａｖａｌら、（２０００）Ｇｅｎ．Ｓｅｌ．Ｅｖｏｌ．３２：１８７）。犬種間での顕著な遺伝学的差異は、品種の構成員が、個々のイヌ科動物についての遺伝子型情報から決定され得ることを示す。

マーカーの情報性に関するデータセットにおけるマーカーの別個の対立遺伝子の数の影響は、実施例２に示される。例えば、１９種のイヌ科動物個体群および９５個のマイクロサテライトマーカーの分析において、イヌ科動物の８６％が、１０個よりも多い別個の対立遺伝子をそれぞれ有した５個のマーカーを使用して、イヌ科動物の品種に正確に割当てられ、そしてイヌ科動物の９５％が、１０個よりも多い別個の対立遺伝子をそれぞれ有した１０個のマーカーを使用して、イヌ科動物の品種に正確に割当てられた。１個〜３個の別個の対立遺伝子を有するマーカーについて、イヌ科動物の４６％が、５個のマーカーを使用してイヌ科動物の品種に正確に割当てられ、そしてイヌ科動物の６２％が、１０個以上のマーカーを使用して正確に割当てられた。

イヌ科動物個体群ごとに４種もしくは５種のイヌ科動物についての９５個のマーカーに関する遺伝子型情報を使用して、１９種のイヌ科動物個体群間で識別する能力に対する使用されたマーカー数の影響は、実施例２に示される。例えば、個体を正しいイヌ科動物個体群に１００％首尾よく割当てるために必要とされるマーカーの最小数は、イヌ科動物個体群に依存して２個（ペキニーズ）と５２個（アメリカンへアレステリア）との間に及んだ。１００％の精度を有する選択されたイヌ科動物個体群を有する、１９種のイヌ科動物個体群にわたって試験された９４匹のすべての個体にうちの少なくとも９０％をうまく割当てるために必要とされるマイクロサテライトマーカーの最小数は、８個（ペキニーズについて）と９５個（プレサカナリオ、チワワ、およびアメリカンへアレステリアについて）との間に及んだ。

本発明の第一局面の方法の第２工程は、試験イヌ科動物ゲノム中の対立遺伝子とイヌ科動物プロファイルを含むデータベースとを比較することによって、試験イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を決定する工程を包含する。第２工程において、各イヌ科動物個体群プロファイルは、イヌ科動物個体群におけるマーカーセット中のマーカーの対立遺伝子に関する遺伝子型情報を含む。本明細書中において使用される「イヌ科動物個体群プロファイル」とは、イヌ科動物個体群におけるマーカーセットに関する遺伝子型情報の収集物をいう。従って、イヌ科動物個体群プロファイルは、イヌ科動物個体群におけるマーカーセット中のほとんどまたは全てのマーカーのほとんどまたは全ての対立遺伝子に関する遺伝子型情報を含み得る。例えば、イヌ科動物個体群プロファイルは、イヌ科動物個体群におけるマーカーセット中の各マーカーの各対立遺伝子に関する遺伝子型情報を含み得る。イヌ科動物個体群プロファイル中の遺伝子型情報は、例えば、そのイヌ科動物個体群の一員である１種以上のイヌ科動物におけるマーカーセット中のほとんどもしくは全てのマーカーの片方もしくは両方の対立遺伝子の同一性、および／または、そのイヌ科動物個体群におけるマーカーセット中のほとんどもしくは全てのマーカーの少なくとも１つの対立遺伝子について推定された対立遺伝子頻度のような情報を含み得る。「対立遺伝子頻度」とは、個体群中の対立遺伝子の発生率をいう。対立遺伝子頻度は、代表的には直接計数（ｄｉｒｅｃｔｃｏｕｎｔｉｎｇ）によって推定される。一般に、イヌ科動物個体群における対立遺伝子頻度は、そのイヌ科動物個体群の少なくとも約５種の一員中の各マーカーセットについての片方または両方の対立遺伝子の同一性を得ることによって推定される。「イヌ科動物個体群プロファイルデータベース」とは、本発明の例示的な方法において使用される全てのイヌ科動物個体群についてのイヌ科動物個体群プロファイルの収集物をいう。いくつかの実施形態において、イヌ科動物個体群プロファイルデータベースは、約５個と約５００個の間のイヌ科動物プロファイル（例えば、約２０個のイヌ科動物プロファイル、約５０個のイヌ科動物プロファイル、または約１００個のイヌ科動物プロファイル）を含む。

試験イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を決定する工程は、イヌ科ゲノムを特定のイヌ科動物個体群へ割当てる工程、および１種以上のイヌ科動物個体群に由来したイヌ科動物ゲノムの比を決定する工程の両方を包含する。この方法のいくつかの実施形態において、ベイジアンモデルベースのクラスタリングアプローチが使用される。個体を個体群に割り当てるために使用されるクラスタリング法の２つの広範なクラスが存在する（Ｐｒｉｔｃｈａｒｄら（２０００）Ｇｅｎｅｔｉｃｓ１５５：９４５−５９）。距離に基づく方法は、個体のすべてのペアの間の距離を提供するためにペアワイズ距離行列を計算する。各クラスターからの知見を考慮することによって進められるモデルベースの方法は、いくつかのパラメーターモデルからランダムに抽出される；次いで、各クラスターに対応するパラメーターについての推論が、標準的な統計学的方法を使用して、各個体のクラスターの構成員についての推論と一緒に行われる。任意の標準的な統計学的方法は、本発明の方法（最大尤度法、ブートストラップ手法、ベイジアン法、および遺伝子型データを分析するために使用され得る任意の他の統計学的手法を含む）において使用され得る。これらの統計学的方法は、当該分野において周知である。集団遺伝学研究のための多くのソフトウェアプログラムが開発されており、本発明の方法において使用され得る。このプログラムとしては、ＴＦＰＧＡ、Ａｒｌｅｑｕｉｎ、ＧＤＡ、ＧＥＮＥＰＯＰ、ＧｅｎｅＳｔｒｕｔ、ＰＯＰＧＥＮＥ（Ｌａｂａｔｅ（２０００）Ｃｒｏｐ．Ｓｃｉ．４０：１５２１−１５２８）、およびｓｔｒｕｃｔｕｒｅ（Ｐｒｉｔｃｈａｒｄら、（２０００）Ｇｅｎｅｔｉｃｓ１５５：９４５−５９）が挙げられるが、これらに限定されない。

例示的なベイジアンモデルベースのクラスタリングアプローチは、遺伝子型クラスタリングプログラムであるｓｔｒｕｃｔｕｒｅ（Ｐｒｉｔｃｈａｒｄら、（２０００）Ｇｅｎｅｔｉｃｓ１５５：９４５−５９）によって提供される、このプログラムは、種内で個体群を規定するために有用であると証明されている（Ｒｏｓｅｎｂｕｒｇら、（２００１）Ｇｅｎｅｔｉｃｓ１５９：６９９−７１３；Ｒｏｓｅｎｂｕｒｇら、（２００２）Ｓｃｉｅｎｃｅ２９８：２３８１−５；Ｆａｌｕｓｈら、（２００３）Ｇｅｎｅｔｉｃｓ
１６４（４）：１５６７−８７）。ｓｔｒｕｃｔｕｒｅによって使用されるクラスタリング方法は、個体群中で個体または関連する個体のセットを正確に配置するために遺伝子型または遺伝学的起源のいずれに関する以前の情報も必要としない。

任意のマルチローカス（ｍｕｌｔｉ−ｌｏｃｕｓ）遺伝子型分析に有用なアルゴリズム（例えば従来の割り当てアルゴリズム）は、本発明の方法において使用され得る。適切なアルゴリズムとしては、ＲａｎｎａｌａおよびＭｏｕｎｔａｉｎ、（１９９７）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．９４：９１９７−９２０１と、Ｃｏｒｎｕｅｔら、（１９９９）Ｇｅｎｅｔｉｃｓ１５３：１９８９−２０００とに記載されるアルゴリズム、ならびにそれらの変形物が挙げられる。マルチプルローカス遺伝子型分析について利用可能な例示的なプログラムとしては、Ｄｏｈ（ｗｗｗ２．ｂｉｏｌｏｇｙ．ｕａｌｂｅｒｔａ．ｃａ／ｊｂｒｚｕｓｔｏ／Ｄｏｈ．ｐｈｐにて利用可能）およびＧｅｎｅＣｌａｓｓ（ｗｗｗ．ｍｏｎｔｐｅｌｌｉｅｒ．ｉｎｒａ．ｆｒ／ＵＲＬＢ／ｇｅｎｅｃｌａｓｓ／ｇｅｎｅｃａｓｓ．ｈｔｍにて利用可能）が挙げられる。

いくつかの実施形態において、本発明の方法は、特定のイヌ科動物個体群が試験イヌ科動物ゲノムへ寄与した条件付き確率を決定する工程を包含し、この条件付き確率は、試験イヌ科動物ゲノム中の対立遺伝子が特定のイヌ科動物個体群中で生じる条件付き確率を、試験イヌ科動物ゲノム中の対立遺伝子がデータベース内の、各イヌ科動物個体群中で生じる条件付き確率の合計で割って決定することにより決定される。

本発明の方法のいくつかの実施形態は、試験イヌ科動物ゲノム中の対立遺伝子と遺伝学的に関連する２種以上のイヌ科動物個体群のプロファイルを含むデータベースとを比較することによって、試験イヌ科動物ゲノムへの遺伝学的に関連する２種以上のイヌ科動物個体群の寄与度の間を識別する工程を包含する。この遺伝学的に関連する２種以上のイヌ科動物個体群は、ベルジアンシープドッグおよびベルジアンタービュレン；コリーおよびシェトランドシープドッグ；ウィペットおよびグレイハウンド；シベリアンハスキーおよびアラスカンマラミュート；マスチフおよびブルマスチフ；グレータースイスマウンテンドックおよびバーニーズマウンテンドッグ；ウェストハイランドホワイトテリアおよびケアーンテリア；またはラサアプソ、シーズー、およびペキニーズを含み得る。

９４匹のイヌ科動物（１８品種を表す９０匹のイヌ科動物と４匹のオオカミとを含む）からの９５個のマイクロサテライトマーカーについての遺伝子型情報に割り当てアルゴリズムを使用することにより、本発明の方法が、実施例２に記載されるように、９９％の精度で各個々のイヌ科動物をその品種へと割り当てるために使用されている。実施例３に記載されるように、同じ遺伝子型情報に使用したクラスタリングアルゴリズムは、２０種のイヌ科動物個体群を予測し、そして各イヌ科動物を９９％の精度で１種の個体群へと割り当てた。

７２品種を表す３４１匹のイヌ科動物からの６８個のマイクロサテライトマーカーについての遺伝子型情報に割り当てアルゴリズムを使用することにより、本発明の方法が、実施例２に記載されるように、イヌ科動物の９６％を正しい品種へと割り当てるために使用されている。８５品種を表す４１４匹のイヌ科個体群からの９６個のマイクロサテライトマーカーについての遺伝子型情報に割り当てアルゴリズムを使用することにより、本発明の方法が、実施例４に記載されるように、イヌ科動物の９９％を正しい品種へと割り当てるために使用されている。同様の結果が、クラスタリングアルゴリズムを使用して得られた。６７品種を表す１８９匹のイヌ科動物からの１００個のＳＮＰマーカーについての遺伝子型情報に割り当てアルゴリズムを使用することにより、本発明の方法が、実施例６に記載されるように、９９％よりも高い確率でイヌ科動物の８０％を正しい品種へと割り当てるために使用されている。

本発明の方法はまた、雑種イヌ科動物へのイヌ科動物個体群の寄与度を決定するために有用である。交配された（ａｄｍｉｘｅｄ）個体は、イヌ科動物個体群のおよそ５０％を表す。個体の交配された（ａｄｍｉｘｅｄ）状態を検出するモデルは、群を以下の２つのクラスに分けて考えられ得る：先祖個体群の考えられる交配種（ｍｉｘｔｕｒｅ）の各々について独特の対立遺伝子の組み合わせセットを必要とするモデル（ＮａｓｏｎおよびＥｌｌｓｔｒａｎｄ（１９９３）Ｊ．Ｈｅｒｅｄ．８４：１−１２；Ｅｐｉｆａｎｉｏ＆Ｐｈｉｌｉｐｐ（１９９７）Ｊ．Ｈｅｒｅｄ．８８：６２−５）と、先祖個体群は特有の対立遺伝子を説明する組み合わせを含む必要がないがその代わりに個体間の対立遺伝子頻度における差異に確率論的に基づいて交配された（ａｄｍｉｘｅｄ）状態へと個体を割り当てる、ベイジアン法のモデル（Ｃｏｒａｎｄｅｒら（２００３）Ｇｅｎｅｔｉｃｓ１６３（１）：３６７−７４；ＡｎｄｅｒｓｏｎおよびＴｈｏｍｐｓｏｎ（２００２）Ｇｅｎｅｔｉｃｓ１６０：１２１７−２９；Ｐｒｉｔｃｈａｒｄら（２０００）Ｇｅｎｅｔｉｃｓ１５５：９４５−５９；ＲａｎｎａｌａおよびＭｏｕｎｔａｉｎ（１９９７）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．９４：９１９７−９２０１）。後者のモデルセットが、各々の個体群／世代の組み合わせについてのベイジアン事後確率割り当てベクトルを考慮にいれ、それによって、その割り当てベクトルに組み入れられる不確定度分析を考慮に入れる際、それら後者のモデルセットは、ほとんどの個体群およびデータセット関して、より情報価値があるが、複数種の先祖個体群からの個体の正確な近い世代で交配された種（ｒｅｃｅｎｔａｄｍｉｘｔｕｒｅ）の割り当てのための既存のモデルは、それらモデルが開発されてきた際の範囲内(２世代の予測のみ、および数種の先祖個
体群のみを考慮する程度まで)に制限される。例えば、ＡｎｄｅｒｓｏｎおよびＴｈｏｍ
ｐｓｏｎ（２００２）の方法は、非連鎖マイクロサテライトデータを有する、２世代の２種の個体群のために開発されている。ナイーブベイジアン分類モデルは、先祖の部分個体群への交配種（ｍｉｘｔｕｒｅ）への個体の確率論的割り当てのために、連鎖マイクロサテライト座位および非連鎖マイクロサテライト座位の情報、高次元の先祖個体群、ならびに高度に秩序だった（ｈｉｇｈｅｒ−ｏｒｄｅｒｅｄ）世代系図を組み入れ、このモデルは、実施例７に記載される。このモデルは、実施例７に記載されるように、既存モデルの世代、部分個体群（ｓｕｂｐｏｐｕｌａｔｉｏｎ）、および連鎖の制限に対して同時に取り組み、そして２世代モデルおよび３世代モデルは、正確な交配種（ａｄｍｉｘｔｕｒｅ）の検出および割り当てのために実施されている。

１８品種の８１匹のイヌ科動物と４匹のオオカミから構成される８５匹のイヌ科動物からの９５個のマーカーについての遺伝子型情報のインシリコでの交配（ｍｉｘ）に、クラスタリングアルゴリズムを使用することにより、本発明の方法は、実施例５に記載されるように、１００％の精度で両親レベルにおけるインシリコでの交配を同定するために使用されている。本発明の方法また、実施例５に記載されるように、祖父母レベルおけるインシリコでの交配の検出においても非常に正確であり、そして曽祖父母レベルにおけるインシリコでの交配を検出においてもかなり正確であった。従って、本発明の方法は、純血種のイヌ（イヌ由来の１／２オオカミ交配種および１／４オオカミ交配種も同様）から、両親レベルおよび祖父母レベルにおける交配を識別するために使用され得、そして、雑種のイヌのゲノムにおける品種の寄与度を同定し得る。

８８品種の４２９匹のイヌ科動物からの９６個のマーカーについての遺伝子型情報のインシリコでの交配にベイジアン分類モデルを使用することにより、本発明の方法は、実施例７に記載されるように、９８％より高いＦ１交配種（ｍｉｘ）および９４％より高いＦ２交配種の正確な割り当てのために使用されている。この１６０匹の既知の雑種イヌ科動物からの７２個のマーカーについての遺伝子型情報に関するモデルを使用して、本発明の方法は、実施例７に記載されるように、９６％より高いＦ１交配種および９１％より高いＦ２交配種を正確に割り当てるために使用されている。

本発明の方法は、試験イヌ科動物ゲノムのゲノムへの１種以上のイヌ科動物個体群の寄与度を表示する文書を提供する工程をさらに包含し得る。用語「文書」は、図表、証明書、カード、または任意の他の種類の書類をいう。文書は、試験イヌ科動物ゲノムへの１種以上のイヌ科動物個体群の寄与度を、数値形式または図画形式で表示し得る。例えば、文書としては、１種以上のイヌ科動物個体群の写真もしくは他の描写、図、または表示が挙げられ得る。文書はまた、決定された寄与度についての信頼値（例えば、８０％、８５％、９０％、９５％、または９９％の信頼度）を提供し得る。いくつかの実施形態において、文書は、試験イヌ科動物ゲノムのゲノムへの１種以上のイヌ科動物個体群の寄与度の証明書を提供する。

いくつかの実施形態において、文書は、試験イヌ科動物ゲノムまたは試験イヌ科動物へ寄与した１種以上のイヌ科動物個体群に関する情報をさらに提供する。試験イヌ科動物ゲノムへ寄与したイヌ科動物個体群に関する情報としては、イヌ科動物個体群の特徴および起源に関連する情報、または試験イヌ科動物の所有者にとって有用である任意の他の種類の情報が挙げられ得る。いくつかの実施形態において、情報は、健康に関する情報を含む。多くのイヌ科動物個体群は、特定の疾患または状態になりやすい素因を有する。例えば、アフガンハウンドは、緑内障、肝炎、および甲状腺機能低下症に罹りやすく；バセニーは、大腸菌腸炎およびピルビン酸キナーゼ欠乏症に罹りやすく；ビーグルは、膀胱癌および難聴に罹りやすく；バーニーズマウンテンドッグは、小脳変性症に罹りやすく；ボーダーテリアは、乏突起細胞腫に罹りやすく；そしてラブラドールレトリバーは、食物アレルギーに罹りやすい（Ｄｒ．Ｂｏｂ‘ｓＡｌｌＣｒｅａｔｕｒｅｓＳｉｔｅ，ＢｒｅｅｄＰｒｅｄｉｓｐｏｓｉｔｉｏｎｔｏＤｉｓｅａｓｅａｎｄＣｏｎｇｅｎｉｔａｌＣｏｎｄｉｔｉｏｎｓ，ｈｔｔｐ：／／ｗｗｗ．ｐｅｔｄｏｃ．ｗｓ／ＢｒｅｅｄＰｒｅ．ｈｔｍ；Ｐａｔｔｅｒｓｏｎら、（１９９８）Ｊ．Ａｍ．Ｖｅｔ．Ｍｅｄ．Ａｓｓｏｃ．１９３：１１３１を参照のこと）。イヌにおいて発見された遺伝疾患に関して、４６％は、１種または数種において、支配的または排他的に生じると考えられる（Ｐａｔｔｅｒｓｏｎら（１９９８）Ｊ．Ａｍ．Ｖｅｔ．Ｍｅｄ．Ａｓｓｏｃ．１９３：１１３１）。従って、試験イヌ科動物ゲノムのゲノムへの１種以上のイヌ科動物個体群の寄与度に関する情報は、試験された個々の動物について健康上のリスクを前向きに検討する目的のために、雑種のイヌ科動物の所有者または世話人（専門家および非専門家の両方）にとって、特に有益である。例えば、ニューファンドランドとバーニーズマウンテンドッグとの交配種（ｍｉｘｔｕｒｅ）であると見出される雑種のイヌは、一般的なイヌ個体群においてはまれな頻度で生じるがこれら特定の品種においてはかなりの頻度で生じる遺伝疾患について、活発にモニターされるべきである。従って、このタイプの雑種個体は、悪性組織球増殖症についてのスクリーニングから恩恵を受け（ｄｉｓｅａｓｅｈｅｒｉｔａｂｉｌｉｔｙｏｆ．２９８ｉｎＢｅｒｎｅｓｅＭｏｕｎｔａｉｎｄｏｇｓ，Ｐａｄｇｅｔｔら、１９９５Ｊ．ＳｍａｌｌＡｎｉｍ．Ｐｒａｃｔ．３６（３）：９３−８）、加えて、Ｉ型シスチン尿症の遺伝的スクリーニングからも恩恵を受ける（ｎｏｎｓｅｎｓｅｍｕｔａｔｉｏｎｉｓｏｌａｔｅｄｉｎＮｅｗｆｏｕｎｄｌａｎｄｓａｔｅｘｏｎ２ｏｆＳＬＣ３Ａ１ｇｅｎｅ，Ｈｅｎｔｈｏｒｎら、（２０００）Ｈｕｍ．Ｇｅｎｅｔ．１０７（４）：２９５−３０３）。

健康に関する情報としてはまた、可能性のある処置、特別食または製品、診断情報、および保険情報が挙げられ得る。試験イヌ科動物のゲノムへの１種以上のイヌ科動物個体群の寄与度を表示する例示的な文書は、図１に示される。

いくつかの実施形態において、本発明は、１種以上のイヌ科動物個体群を規定する方法を提供する。この方法は、（ａ）各イヌ科動物ゲノムセットについて、各マーカーセットのついての片方または両方の対立遺伝子の同一性を得る工程；および（ｂ）イヌ科動物ゲノムセットの１つ以上の一員が、統計的モデリングを用いて各マーカーについて１セットの対立遺伝子頻度によって特徴付けられる別個のイヌ科動物個体群を規定する可能性を決定することによって、１種以上のイヌ科動物個体群を規定する工程を包含する。１種以上のイヌ科動物個体群を規定するための本発明の例示的な方法は、実施例３および実施例４に記載される。

別の局面において、本発明は、各マーカーセットについてイヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性を決定するための核酸配列を含む基材を、提供する。基材は、マーカーの対立遺伝子の同一性を決定するために適切な任意の形態であり得る。例えば、基材は、マイクロアレイまたはビーズの集合体の形態であり得る。

さらなる局面において、本発明は、イヌ科動物個体群の区別に使用するために、媒体上に保存されたデータ構造を含むコンピュータ読み取り可能な媒体を提供し、このデータ構造は：マーカーの名称（例えば、ＳＮＰマーカー）またはこのマーカーの対立遺伝子の名称を保存することが可能である、マーカーフィールド；および、そのマーカーについての遺伝子型情報（例えば、イヌ科動物ゲノムにおけるマーカーの片方または両方の対立遺伝子の同一性、あるいはイヌ科動物個体群におけるマーカーの対立遺伝子頻度の推定値）を保存することが可能である遺伝子型情報フィールドであって、１つのレコードは、そのマーカーフィールドのインスタンス化およびこの遺伝子型情報フィールドのインスタンス化を含み、そして１セットのレコードは、１つのイヌ科動物プロファイルを表す、遺伝子型情報フィールドを備える。

「コンピュータに読み取り可能な媒体」とは、コンピュータによってアクセスされ得る任意の利用可能な媒体をいい、そして揮発性媒体および非揮発性媒体の両方の、取り外し可能な媒体および取り外しができない媒体が挙げられる。一例であり限定はしないが、コンピュータに読み取り可能な媒体は、コンピュータ記憶媒体および通信媒体を備え得る。コンピュータ記憶媒体としては、情報（例えば、コンピュータに読み取り可能な命令、データ構造、プログラムモジュール、または他のデータ）を保存するための任意の方法または技術で実施される、揮発性および非揮発性の両方の、取り外し可能な媒体および取り外しができない媒体が挙げられる。コンピュータ記憶媒体としては、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリまたは他のメモリー技術、ＣＤ−ＲＯＭ、デジタル多用途ディスク（ＤＶＤ）または他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶デバイス、あるいは任意の他のコンピュータ記憶媒体が挙げられるが、それらに限定されない。通信媒体は、代表的には、コンピュータに読み取り可能な命令、データ構造、プログラムモジュール、または変調されたデータ信号（例えば、搬送波または、任意の情報伝達媒体を含む他の転送機構）で具体化する。用語「変調されたデータ信号」は、その信号の特性セットを１セット以上有する信号か、またはその信号のコード化情報のような方式で変更された信号を意味する。一例であり限定されないが、通信媒体としては、有線媒体（例えば、有線ネットワーク通信または直接配線された（ｄｉｒｅｃｔ−ｗｉｒｅｄ）通信）および無線媒体（例えば、音響媒体、ＲＦ赤外線媒体、および他の無線媒体）が挙げられる。上述の任意の組み合わせがまた、コンピュータに読み取り可能な媒体の範囲内に含まれるはずである。

「データ構造」とは、データの概念的配置をいい、そして代表的には、列および行によって特徴付けられる。そのデータは、列と行の交差（ｒｏｗ−ｃｏｌｕｍｎｉｎｔｅｒｓｅｃｔｉｏｎ）によって形成された各セルを占めるかまたは潜在的に占めている。本発明のコンピュータに読み取り可能な媒体中のデータ構造は、上述のように、マーカーフィールドおよび遺伝子型情報フィールドを含む。マーカーフィールドおよび遺伝子型情報フィールドのインスタンス化は、１つのレコードを提供し、そして１セットのレコードは、１つのイヌ科動物個体群プロファイルを提供する。従って、データ構造は、イヌ科動物個体群プロファイルのデータベースを作製するために使用され得る。

いくつかの実施形態において、コンピュータに読み取り可能な媒体は、以下をこの媒体上に保存されたものを有する基板を備える：
（ａ）イヌ科動物個体群の区別に使用するためのデータ構造であって、このデータ構造は；
（ｉ）マーカーの名称またはこのマーカーの対立遺伝子の名称を保存することが可能である、マーカーフィールド；および
（ｉｉ）そのマーカーについての遺伝子型情報を保存することが可能である遺伝子型情報フィールドであって、１つのレコードは、このマーカーフィールドのインスタンス化およびこの頻度フィールドのインスタンス化を含み、そして１セットのレコードは、１つのイヌ科動物プロファイルを表す、遺伝子型情報フィールド
を備える、データ構造；ならびに
（ｂ）イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を決定する方法を実施するための、コンピュータが実行可能な命令であって、以下の工程：
（ｉ）各マーカーセットについて試験イヌ科動物ゲノム中の片方または両方の対立遺伝子の同一性を得る工程；および
（ｉｉ）この試験イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を、この試験イヌ科動物ゲノム中の対立遺伝子と、イヌ科動物プロファイルを含むデータベースとを比較することによって決定する工程であって、イヌ科動物個体群プロファイルの各々は、そのイヌ科動物個体群における上記マーカーセットについての遺伝子型情報を含む、工程
を包含する、コンピュータが実行可能な命令。

以下の実施例は、本発明を実施するための現在考えられている最良の形態を単に例示するが、本発明を限定するために構成されるべきではない。

（実施例１）
この実施例は、１セットのマーカーについての片方または両方の対立遺伝子の同一性を得るため、かつイヌ科動物ゲノムへのイヌ科動物個体群の寄与度を決定するのに適切なマーカーを選択するための、本発明の代表的な方法を説明する。

（Ａ．方法）
（１．サンプル収集およびＤＮＡ抽出）
８ヶ国（中国、オマーン、イタリア、イラン、米国（アラスカ）、カナダ（ケベック）、スウェーデン、メキシコ）からの、１０３品種の５１３匹のアメリカンケンネルクラブに登録されたイヌ、および８匹のハイイロオオカミからのイヌ科動物ＤＮＡサンプルを、ドッグショーおよびドッグクラブの特別イベントで、ボランティアから口内（頬）塗抹標本および／または血液サンプルを収集することで得た。同様に、これらは、郵送による提供によっても得られた。アメリカンケンネルクラブ登録番号および詳細な系統情報が、全てのイヌについて要求される。なぜなら、この実施例への参加は、共通の祖父母を有さない無関係のイヌには制限されたからである。系統情報がまた、サンプル抽出された個体の８４％について収集された。多くの場合、５世代の系図が得られ、イヌは時折、曽祖父母レベルまたそれより高いレベルで、重複して現れるが、その一方で、完全連鎖検査は、同犬種間での高い無関連度（ｈｉｇｈｄｅｇｒｅｅｏｆｕｎｒｅｌａｔｅｄｎｅｓｓ）を示している。系図が利用可能でなかった場合、これら個体について、無関連性（ｕｎｒｅｌａｔｅｄｎｅｓｓ）を血統クラブの代表犬（ｒｅｐｒｅｓｅｎｔａｔｉｖｅ）で検証した。個体イヌ科動物の各々に、イヌ科動物識別番号を与えた。品種および他のイヌ科動物個体群について使用される略称は、表５に示される。加えて、２０種のＡＫＣ品種からの交配コンポーネント（ａｄｍｉｘｔｕｒｅｃｏｍｐｏｎｅｎｔ）を含む１６０匹の雑種イヌ科動物からのＤＮＡサンプルを、口内塗抹標本を収集することによって得た。

口内塗抹標本を、アメリカンケンネルクラブ（ＡＫＣ）ウェブサイト（ｈｔｔｐ：／／ｗｗｗ．ａｋｃ．ｏｒｇ／）より提案されるものと類似する様式で、細胞学的ブラシ（ＭｅｄｉｃａｌＰａｃｋａｇｉｎｇＣｏｒｐ．，Ｃａｍａｒｉｌｌｏ，ＣＡ）を使用して収集した。ＤＮＡを、製造元（Ｑｉａｇｅｎ，Ｖａｌｅｎｃｉａ，ＣＡ）のプロトコルに従い、ＱｉａＡｍｐ血液キットを使用して口内塗抹標本から抽出した。血液からのＤＮＡ抽出は、以前に記載されたように行った（Ｃｏｍｓｔｏｃｋら、（２００２）Ｍｏｌ．Ｅｃｏｌ．１１：２４８９−９８）。

（２．マイクロサテライトマーカーの分析）
１００個のジヌクレオチドマイクロサテライトマーカーを、イヌの３３００個のマーカー地図上に現在位置決めされている１５９６個のマイクロサテライトから選択した（Ｇｕｙｏｎら、（２００３）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．ＳｃｉＵ．Ｓ．Ａ．１００（９）：５２９６−５３０１）（表１）。マーカーを情報性（ｉｎｆｏｒｍａｔｉｖｅｎｅｓｓ）に基づいて選択し、ＰＩＣ値として計算し、そして、３８種すべての常染色体にわたって分布させた。選択されたマーカーは、０．６５％（３６％〜８６％の範囲）の平均ＰＩＣ値、および２９．５Ｍｂ（２１．５Ｍｂ〜５０．９Ｍｂの範囲）の平均間隔を有した。テトラヌクテオチドマイクロサテライトよりもジヌクレオチドマイクロサテライトを、品種同定を妨害し得る、観察された偽の変異（ｓｐｕｒｉｏｕｓｍｕｔａｔｉｏｎ）の数を減らすように選択した。

ＤＮＡサンプルを９６ウェルプレート上に並べた。ポジティブコントロールを、一貫した対立遺伝子のビニングを保証するために各プレート上に含めた。ＰＣＲを、１ｎｇのゲノムＤＮＡおよび最終濃度の以下の試薬を含有する１０μｌの反応液中で行った。以下の試薬とは、１６ｍＭの硫酸アンモニウム、６７ｍＭのＴｒｉｓ−ＨＣｌｐＨ８．８、２．０ｍＭのＭｇＣｌ_２、０．１ｍＭのｄＮＴＰ、３００ｎＭの順方向プライマー（配列番号１〜１００）、逆方向プライマー（配列番号１０１〜２００）、および色素標識したＭ１３プライマー（ＰＥＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ，ＦｏｓｔｅｒＣｉｔｙ，ＣＡＵＳＡ）である。順方向プライマーを、５’末端上に１９塩基のＭ１３順方向（−２９）配列（５’−ＣＡＣＧＡＣＧＴＴＧＴＡＡＡＡＣＧＡＣ−３’）（配列番号２０１）を含むように再設計した。６ＦＡＭ^ＴＭ、ＶＩＣ^ＴＭ、ＮＥＤ^ＴＭ、またはＰＥＴ^ＴＭ（ＡＢＩ，ＦｏｓｔｅｒＣｉｔｙ，ＣＡ）色素のいずれかで標識された０．２５ｐｍｏｌのＭ１３プライマー（配列番号２０１）を各反応液に加えることで、サンプルを標識した。ＰＣＲのインキュベーションを、標準的なプロトコル（例えば、Ｌｏｗｅら、（２００３）Ｇｅｎｏｍｉｃｓ８２：８６−９５；ｈｔｔｐ：／／ｗｗｗ．ｆｈｃｒｃ．ｏｒｇ／ｓｃｉｅｎｃｅ／ｄｏｇ＿ｇｅｎｏｍｅ／ｄｏｇ．ｈｔｍｌを参照のこと）に従って行った。使用されたアニ−リング温度は、表１に示される。異なる色素で標識された４つのサンプルを、１枚の９６ウェルプレート内で３μｌの各反応混合液を混ぜ合わせることにより、ＰＣＲの終了後に、多重化した。サンプルを、１６ｐｍｏｌのＧｅｎｅＳｃａｎ^ＴＭ−５００ＬＩＺ^ＴＭサイズ標準（ＡＢＩ，ＦｏｓｔｅｒＣｉｔｙ，ＣＡ）を含有する２容量のＨｉ−Ｄｉ^ＴＭホルムアミド中で、製造元のプロトコルに従って変性させた。全てのサンプルを、対立遺伝子を分離するために、ＡＢＩ３７３０ＤＮＡＡｎａｌｙｚｅｒ^ＴＭ（ＰＥａｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）キャピラリー電気泳動装置上にロードした。遺伝子型を、ＧｅｎｅＭａｐｐｅｒ^ＴＭｖ３．０ソフトウェア（ＡＢＩ，ＦｏｓｔｅｒＣｉｔｙ，ＣＡ）を使用してコールした。全てのコールを、手動で確認し、そして次に続く各実行（ｒｕｎ）をビン（ｂｉｎ）外にある新たな対立遺伝子の出現についてスキャンした。４個のマーカーを、一貫して増幅できなかったので切り捨てた。

（３．ＳＮＰの発見および遺伝子型決定）
５０種のイヌ動物の細菌性人工染色体（ＢＡＣ）を、イヌ科動物の放射線ハイブリッド地図（Ｇｕｙｏｎら（２００３）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．ＳｃｉＵ．Ｓ．Ａ．１００（９）：５２９６−５３０１）からランダムに選択した。Ｐｒｉｍｅｒ３プログラム（ｈｔｔｐ：／／ｗｗｗ．ｇｅｎｏｍｅ．ｗｉ．ｍｉｔ．ｅｄｕ／ｓｃｉ−ｂｉｎ／ｐｒｉｍｅｒ／ｐｒｉｍｅｒ３＿ｗｗｗ．ｃｇｉにて利用可能）を、ＢＡＣの各末端配列から、プライマーを設計するために使用した。結果として平均３３４塩基対の単位複製配列が得られた。プライマーを、６７種のイエイヌ種の１８９匹のイヌと、コヨーテとハイイロオオカミの１９８６７塩基対の非連続ゲノム配列を増幅するために使用した。結果として得られたＰＣＲ産物を、標準的なＡＢＩ色素ターミネ−ター化学を用いてＡＢＩ３７００キャピラリーシーケンサー（ＡＢＩ，ＦｏｓｔｅｒＣｉｔｙ，ＣＡ）上で、標準的な方法を使用して配列決定し、そして再度、配列決定した。読み取った全ての配列を、Ｐｈｒｅｄ、Ｐｈｒａｐ、およびＣｏｎｓｅｄ（ＥｗｉｎｇおよびＧｒｅｅｎ（１９９８）ＧｅｎｏｍｅＲｅｓ．８：１８６−９４；Ｅｗｉｎｇら（１９９８）ＧｅｎｏｍｅＲｅｓ．８：１７５−８５；ｗｗｗ．ｇｅｎｏｍｅ．ｗａｓｈｉｎｇｔｏｎ．ｅｄｕにて利用可能）を使用して整列させ、表示した。コンピュータプログラムＰｏｌｙｐｈｒｅｄを、読み取った配列内およびその配列間で、多型領域（ＳＮＰおよび挿入／欠失の両方）を同定するために使用した（Ｎｉｃｋｅｒｓｏｎら（１９９７）Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．２５：２７４５−５１、ｄｒｏｏｇ．ｍｂｔ．ｗａｓｈｉｎｇｔｏｎ．ｅｄｕにて利用可能）。全ての対立遺伝子のコールを、手動で確認し、そのトレースを目視検査によって確認した。

（４．統計分析）
分子分散分析（ＡＭＯＶＡ）を、ハーディワインバーグ平衡の仮定の下で、ＧＤＡ（ＬｅｗｉｓおよびＺａｙｋｉｎ（２００１）ＧｅｎｅｔｉｃＤａｔａＡｎａｌｙｓｉｓ：ＣｏｍｐｕｔｅｒＰｒｏｇｒａｍｆｏｒｔｈｅＡｎａｌｙｓｉｓｏｆＡｌｌｅｌｉｃＤａｔａ，Ｖｅｒｓｉｏｎ１．０（ｄ１６ｃ）、ｈｔｔｐ：／／ｌｅｗｉｓ．ｅｅｂ．ｕｃｏｎｎ．ｅｄｕ／ｌｅｗｉｓｈｏｍｅ／ｓｏｆｔａｒｅ．ｈｔｍｌにて利用可能）を使用して行った。分析において同系交配が考慮された場合、品種間の遺伝的変動の比について、同様の結果が得られた。

各品種についての予測したヘテロ接合性を、Ｔａｊｉｍａ不変推定量（Ｔａｊｉｍａ（１９８９）Ｇｅｎｅｔｉｃｓ１２３：５８５−９５）を使用して、対立遺伝子頻度から計算した。

（Ｂ．結果）
（１．ジヌクレオチドマイクロサテライトの情報性）
４２２匹のイヌ科動物（８５品種の４１４匹のイヌと８匹のオオカミとを含む）における６８個〜１００個のマイクロサテライトの対立遺伝子（増幅した領域の長さ）の同一性は、（本明細書とともに提出されたコンパクトディスク中の）表３に示される。１４８個の対立遺伝子が、特定のイヌ科動物個体群に特有であることが見出されている：１個は各々、ＡＣＫＲ、ＡＵＳＴ、ＢＯＲＤ、ＢＯＸ、ＢＵＬＤ、ＤＡＣＨ、ＧＯＬＤ、ＧＳＨＰ、ＧＳＭＤ、ＩＢＩＺ、ＫＥＥＳ、ＮＥＬＫ、ＰＥＫＥ、ＰＯＭ、ＲＯＴＴ、ＳＦＸＴ、ＴＥＲＶおよびＷＨＩＰに特有であり、２個は各々、ＢＥＡＧ、ＣＡＩＲ、ＨＵＳＫ、ＩＲＳＥ、ＭＡＳＴ、ＯＥＳ、ＳＣＨＰ、ＳＣＷＴ、ＳＰＯＯおよびＳＳＨＰに特有であり、３個は各々、ＡＭＡＬ、ＢＭＤ、ＫＯＭＯ、ＮＥＷＦ、ＳＴＢＤおよびＷＳＳＰに特有であり、４個は各々、ＫＵＶＺ、ＰＮＴＲおよびＰＲＥＳに特有であり、５個は各々、それぞれＢＳＩＪおよびＳＨＡＲに特有であり、６個は、ＡＫＩＴに特有であり、そして、６４個の対立遺伝子は、ＷＯＬＦに特有である。

６つの異なるデータセットを、実施例２〜５、および実施例７にさらに記載されるように、後の分析に使用した。第１のデータセットは、９４匹のイヌ科動物（１８品種の９０匹のイヌ科動物と４匹のオオカミとを含む）における、９５個のマイクロサテライトマーカー（マイクロサテライトマーカー１〜１４、１６、１８〜２１、２３〜２６、３９〜１００；表１参照のこと）についての遺伝子型情報を含んだ（データセット１；表６）。第２のデータセットは、７２品種の３４１匹のイヌ科動物における６８個のマイクロサテライトマーカー（マイクロサテライトマーカー２〜８、１１、１２、１４〜１６、１８〜２１、２３、２４、２６〜３２、３４〜３６、３８、４１、４２、４４〜４６、５０、５１、５３、５４、５６、６０〜６４、６７、６８、７０〜７４、７８、７９、８１〜８３、８５、８７〜９１、９３〜９８；表１参照のこと）についての遺伝型情報を含んだ（データセット２；表７）。第３のデータセットは、８５品種の４１４匹のイヌ科動物における９６個のマクロサテライトマーカー（マイクロサテライトマーカー１〜９、１１〜３８、４０〜４２、４４〜７５、７７〜１００；表１参照のこと）についての遺伝型情報を含んだ（データセット３；表８）。第４のデータセットは、８５匹のイヌ科動物（１８品種の８１匹のイヌと４種のオオカミとを含む）における９６個のマイクロサテライトマーカー（マイクロサテライトマーカー１〜９、１１〜３８、４０〜４２、４４〜７５、７７〜１００；表１参照のこと）についての遺伝型情報を含んだ（データセット４；表９）。第５のデータセットは、８８品種の４２９匹のイヌ科動物における９６個のマイクロサテライトマーカー（マイクロサテライトマーカー１〜９、１１〜３８、４０〜４２、４４〜７５、７７〜１００；表１参照のこと）についての遺伝子型情報を含んだ。第６のデータセットは、（本明細書とともに提出されたコンパクトディスク中の）表３に示されるような、１６０種の雑種イヌ科動物における、表１中の７２個のマイクロサテライトマーカーについての遺伝子型情報を含んだ。

多型マーカーの比、マーカーごとの対立遺伝子の平均数、多型マーカーごとの対立遺伝子の平均数、（ハーディワインバーグ平衡の推定に基づいて）予測されたヘテロ接合性、観察されたヘテロ接合性、およびデータセット１中の９５個のマイクロサテライトマーカーにわたる推定された同系交配係数は、表１０に示される。Ｔａｊｉｍａ不変推定量を使用して、９６個のマイクロサテライト（データセット３）にわたって平均された８５種のイヌ科動物個体群の予測されたヘテロ接合性は、表１１に示される。

品種の境界の存在は、同種由来のイヌが異種由来のイヌよりも遺伝学的により類似しているはずであることを予測する。この予測を試験するために、品種の構成員（ｍｅｍｂｅｒｓｈｉｐ）に起因し得る個々のイヌ間における遺伝的多様性の割合が、推定された。マイクロサテライトデータ（８５品種の４１４匹のイヌにおける９６個のマーカーを含む）（データセット３、表８）についての分子変動の分析は、遺伝分散の合計の２７％よりも多くの割合を占める品種間の分散を示した。

（２．ＳＮＰマーカーの情報性）
６７種のイエイヌの１８９匹のイヌ科動物、コヨーテ、およびオオカミを使用して、およそ２０Ｋｂの非連続のイヌ科動物ゲノム配列中の１００個の多型部位を、表２に記載されるように同定した。これらは、９２個の一塩基置換、および１１個の挿入または欠失変異（長さ１ヌクレオチド〜８ヌクレオチドの範囲）を含む。１８９匹のイヌ科動物（６７品種の１８６匹のイヌ、２匹のオオカミ、および１匹のコヨーテを含む）における１００個のＳＮＰマーカーについての対立遺伝子の同一性は、（本明細書とともに提出されたコンパクトディスク中の）表４に示される。６０品種の１２０匹のイヌからの７５個のＳＮＰにおけるマイナー対立遺伝子頻度は、表２に示されるように、０．４％〜４８％の範囲に及んだ。これらのうちの１４個のＳＮＰは、以下の品種に特異的であった：３７２ｃ５ｔ−８２（イングリッシュシェパード）、３７２ｅ１３ｔ−５７（コッカースパニエル）、３７２ｍ６ｔ−８８（イングリッシュシェパード）、３７２ｍ２３ｔ−７６（アラスカンマラミュート）、３７３ａ１５ｔ−１１２（チェサピークベイレトリバー）、３７３ｅ１ｔ−５０（スピノニイタリアーノ）、３７３ｅｌｔ−１３０（スコティッシュディアハウンド）、３７３ｇ１９ｔ−２４６（ボルゾイ）、３７３ｉ８ｓ−２２４（チェサピークベイレトリバー）、３７３ｋ８ｓ−１８１（チベタンテリア）、３７２ｃ５ｓ−１６８（秋田犬）、３７２Ｃ１５Ｓ−１９６（ラブラドールレトリバー）、３７２ｅ１５ｓ−７１（フィールドスパニエル）、および３７３ａ２１ｔ−９３（イタリアングレイハウンド）。

すべてのイヌが１個体群として考慮された場合、観察されたヘテロ接合性（Ｔａｊｉｍａ＆Ｎｅｉ（１９８４）Ｍｏｌ．Ｂｉｏｌ．Ｅｖｏｌ．１：２６９−８５）は、８×１０^−４であった。これは、ヒト個体群において見られる値と基本的に同じである（Ｓａｃｈｉｄａｎａｎｄａｍら、（２００１）Ｎａｔｕｒｅ４０９：９２８−３３；Ｖｅｎｔｅｒら（２００１）Ｓｃｉｅｎｃｅ２９１：３１０４−５１）。しかし、品種が分岐される場合、最小非近交系（スコティッシュディアハウンド；２．５×１０^−４）から最大非近交系（イングリッシュスパニエル；１．０×１０^−３）の間のヘテロ接合性における範囲は、４倍である。６０品種の１２０匹のイヌにおける７５個のＳＮＰについてのＳＮＰデータから計算された品種間の遺伝的距離は、Ｆ_ＳＴ＝０．３６であった。

Ｔａｊｉｍａ不変推定量を使用し、７５個のＳＮＰ座位における対立遺伝子頻度（データセット３）に基づいて予測された６０種のイヌ科動物個体群のヘテロ接合性は、表１２に示される。各品種は、２匹のイヌで表される。

（実施例２）
この実施例は、９４匹のイヌ科動物からの９５個のマイクロサテライトマーカーについての遺伝子型情報、および３４１匹のイヌ科動物からの６８個のマイクロサテライトマーカーについての遺伝子型情報に関して、割り当て試験計算器を使用する、イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を推定するための本発明の代表的な方法を説明する。

（Ａ．方法）
（１．データセット）
データセット１は、１８品種の９０匹のイヌと４匹のオオカミを含む、９４匹のイヌ科動物（ＡＨＲＴ、ＡＫＩＴ、ＢＥＡＧ、ＢＭＤ、ＢＯＸ、ＢＵＬＤ、ＢＵＬＭ、ＣＨＩＨ、ＤＡＣＨ、ＧＯＬＤ、ＩＢＩＺ、ＭＡＳＴ、ＮＥＷＦ、ＰＥＫＥ、ＰＯＭ、ＰＲＥＳ、ＰＵＧ、ＲＯＴＴ、ＷＯＬＦ；イヌ科動物個体群の略称については表５を参照のこと）からの９５個のマイクロサテライトマーカーについての遺伝子型情報を含んだ。９５個のマイクロサテライトマーカーは、マイクロサテライトマーカー１〜１４、１６、１８〜２１、２３〜２６、３９〜１００であった（表１）。このデータセットは、各品種についての５匹のイヌ科動物と４匹のオオカミからの遺伝子型情報を含んだ（表６）。データセット１中のイヌ科動物についての遺伝子型情報は、（本明細書とともに提出されたコンパクトディスク中の）表３に示される。

データセット２は、７２品種の３４１匹のイヌ科動物（ＡＣＫＲ、ＡＦＧＨ、ＡＨＲＴ、ＡＩＲＴ、ＡＫＩＴ、ＡＭＡＬ、ＡＭＷＳ、ＡＵＳＳ、ＡＵＳＴ、ＢＡＳＳ、ＢＥＡＧ、ＢＥＤＴ、ＢＥＬＳ、ＢＬＤＨ、ＢＭＤ、ＢＯＲＤ、ＢＯＲＺ、ＢＯＸ、ＢＳＪＩ、ＢＵＬＤ、ＢＵＬＭ、ＣＡＩＲ、ＣＨＢＲ、ＣＨＩＨ、ＣＫＣＳ、ＣＬＳＰ、ＣＯＬＬ、ＤＡＣＨ、ＤＡＮＥ、ＤＮＤＴ、ＤＯＢＰ、ＥＣＫＲ、ＦＣＲ、ＧＯＬＤ、ＧＲＥＹ、ＧＳＤ、ＧＳＨＰ、ＧＳＭＤ、ＨＵＳＫ、ＩＢＩＺ、ＩＲＳＥ、ＩＲＴＲ、ＩＷＯＦ、ＫＥＥＳ、ＫＯＭＯ、ＫＵＶＺ、ＬＡＢ、ＭＡＳＴ、ＭＢＬＴ、ＭＮＴＹ、ＮＥＬＫ、ＮＥＷＦ、ＯＥＳ、ＰＥＫＥ、ＰＮＴＲ、ＰＯＭ、ＰＲＥＳ、ＰＴＷＤ、ＰＵＧ、ＲＨＯＤ、ＲＯＴＴ、ＳＣＨＰ、ＳＣＷＴ、ＳＦＸＴ、ＳＨＡＲ、ＳＰＯＯ、ＳＳＨＰ、ＳＴＢＤ、ＴＥＲＶ、ＷＨＩＰ、ＷＨＷＴ、ＷＳＳＰ；イヌ科動物個体群の略称については表５を参照のこと）からの６８個のマーカーについての遺伝子型情報を含んだ。６８個のマイクロサテライトマーカーは、マイクロサテライトマーカー２〜８、１１、１２、１４〜１６、１８〜２１、２３、２４、２６〜３２、３４〜３６、３８、４１、４２、４４〜４６、５０、５１、５３、５４、５６、６０〜６４、６７、６８、７０〜７４、７８、７９、８１〜８３、８５、８７〜９１、９３〜９８であった（表１）。このデータセットは、ＳＦＸＴ（２匹のイヌ科動物）、ＡＣＫＲ、ＡＦＧＨ、ＤＮＤＴ、ＯＥＳ（各々３匹のイヌ科動物）、ＡＩＲＴ、ＢＡＳＳ、ＢＥＤＴ、ＩＲＴＲ、ＭＮＴＹ、ＳＣＨＰ、ＳＣＷＴ、および、ＴＥＲＶ（各々４匹のイヌ科動物）を除き、各品種についての５匹のイヌ科動物からの遺伝子型情報を含んだ（表７）。データセット２中のイヌ科動物についての遺伝子型情報は、（本明細書とともに提出されたコンパクトディスク中の）表３に示される。

（２．Ｄｏｈ分析）
割り当て試験計算器Ｄｏｈ（ｗｗｗ２．ｂｉｏｌｏｇｙ．ｕａｌｂｅｒｔａ．ｃａ／ｊｂｒｚｕｓｔｏ／Ｄｏｈ．ｐｈｐにて利用可能）を、遺伝子型情報の２つのデータセットの分析のために使用した。個々のイヌ科動物すべてを、試験されるイヌ科動物を除いたそれらの公知の個体群で指定した。次いでこれを、試験イヌ科動物の遺伝子型を生成する最も高い可能性を有するイヌ科動物個体群へと、プログラムを使用して割り当てた。このプログラムは、この手順を、試験イヌ科動物としての各イヌ科動物に対して繰り返す。

（Ｂ．結果）
（１．データセット１を使用するＤｏｈ分析）
９４匹のイヌ科動物（１８品種の９０匹のイヌと４匹のオオカミ）における９５個のマイクロサテライトマーカーについての遺伝子型情報を含む、データセット１中の遺伝子型情報にＤｏｈを使用して、イヌ科動物の９９％を、正確なイヌ科動物個体群へと割り当てた。イヌ科動物の１００％を、以下の品種（ＡＨＲＴ、ＡＫＩＴ、ＢＥＡＧ、ＢＭＤ、ＢＯＸ、ＢＵＬＤ、ＣＨＩＨ、ＤＡＣＨ、ＧＯＬＤ、ＩＢＩＺ、ＭＡＳＴ、ＮＥＷＦ、ＰＥＫＥ、ＰＯＭ、ＰＵＧ、ＲＯＴＴ、ＷＯＬＦ）について、正確に割り当てた。誤って割り当てられた唯一のイヌ科動物は、（５匹のイヌ中の）プレサカナリオ種のイヌ一匹であった。誤って割り当てられたプレサカナリオ犬は、チワワに割り当てられていた。

対立遺伝子パターンの識別能力は、個々のマイクロサテライトマーカー座位の数、各座位における対立遺伝子の多様性、および各品種からサンプル抽出された個体の数に、依存したことが見出された。マーカーの対立遺伝子の数およびマーカーの数の、そのマーカーの情報性への影響を評価するために、最初の１９品種についてのＤｏｈ割り当て分析を、５個、１０個、１５個、および２０個のマーカー、データセット中に見出された１〜３個の別個の対立遺伝子を有するビニングマーカー、４〜６個の別個の対立遺伝子、７〜１０個の別個の対立遺伝子、および１０個より多い別個の対立遺伝子を使用して、行った。２０個のマーカーを含まなかったビンについては、最大数のマーカーを使用した。１０個より多い個別の対立遺伝子を有するマーカーについては、イヌ科動物の８６％を、５個のマーカーを使用してそれらの品種へと正確に割り当て、そしてイヌ科動物の９５％を、１０個、１５個、または２０個のマーカーを使用して正確に割り当てた。７〜１０個の別個の対立遺伝子を含むマーカーについては、イヌ科動物の８４％を、５個のマーカーを使用してそれらの品種へと正確に割り当て、そしてイヌ科動物の９１％を、１０個のマーカーを使用して正確に割り当て、そしてイヌ科動物の９４％を、１５個、または２０個のマーカーを使用して正確に割り当てた。４〜６個の別個の対立遺伝子を含むマーカーについては、イヌ科動物の６２％を、５個のマーカーを使用してそれらの品種へと正確に割り当て、そしてイヌ科動物の７１％を、１０個、１５個、または２０個のマーカーを使用して正確に割り当てた。１〜３個の別個の対立遺伝子を含むマーカーについては、イヌ科動物の４６％を、５個のマーカーを使用してそれらの品種へと正確に割り当て、そしてイヌ科動物の６２％を、１０個、１５個、または２０個のマーカーを使用して正確に割り当てた。正しいイヌ科動物個体群へと個体の１００％をうまく割り当てるのに必要な（他のどの品種への割り当ても誤った割り当てである）、９５個のマーカー内の対立遺伝子頻度の探索に向けられた２つのクラス（０―１）において見出されたマイクロサテライトマーカーの最小数とは、ＰＥＫＥについて２個、ＢＯＸ、ＰＯＭ、およびＷＯＬＦについて３個、ＡＫＩＴ、ＭＡＳＴ、およびＰＵＧについて４個、ＮＥＷＦおよびＲＯＴＴについて５個、ＢＭＤについて６個、ＢＥＡＧについて８個、ＩＢＩＺについて１１個、ＧＯＬＤについて１２個、ＤＡＣＨについて１７個、ＢＵＬＤについて１９個、ＢＵＬＭについて２６個、ＰＲＥＳについて４４個、ＣＨＩＨについて４９個、そしてＡＨＲＴについて５２個であった。１００％（０−１）の識別に必要なマイクロサテライトマーカーの最小数と、１９品種のイヌ科動物において試験された９４匹のイヌ科動物についての９５個のマイクロサテライトマーカーにわたる対立遺伝子の平均数（表１０参照のこと）との間に、正の相関が存在する。１００％の精度を有する選択されたイヌ科動物個体群を有す、１９種のイヌ科動物個体群にわたって試験された９４匹すべての個体の少なくとも９０％をうまく割り当てるのに必要な、９５個のマーカー内の対立遺伝子頻度の探索の向けた複数のクラス（０、１、２、．．．１８）において見出されたマイクロサテライトマーカーの最小数とは、ＰＥＫＥ、ＢＯＸ、ＰＯＭ、ＷＯＬＦ、ＡＫＩＴ、ＭＡＳＴ、ＰＵＧ、ＮＥＷＦ、ＲＯＴＴ、およびＢＭＤについて８個、ＢＥＡＧについて１１個、ＧＯＬＤについて１４個、ＤＡＣＨについて２３個、ＢＵＬＤについて２４個、ＢＵＬＭについて２８個、そしてＰＲＥＳ、ＣＨＩＨ、およびＡＨＲＴについて９５個であった。

予想どおり、識別能力は、各品種において観察される同系交配のレベルを反映する。例えば、ある品種は、品種の対立遺伝子変動の平均の３倍未満の対立遺伝子変動を有し、これらの品種は、高い識別能力と、個体群の長いボトルネックおよび小さな有効個体群サイズといった独特な個体群の動態との両方を有する。

（２．データセット２を使用するＤｏｈ分析）
７２品種の３４１匹のイヌ科動物からの６８個についての遺伝子型情報を含む、データセット２中の遺伝子型情報にＤｏｈ分析を使用して、試験されたイヌの９６％を、表１３に記載されるように、正しい品種へと割り当てた。両方のベルジアン種（ベルジアンシープドッグおよびベルジアンタービュレン）を１つの品種として数えた場合、試験されたイヌの９８％を、正しい品種へと割り当てた。

（実施例３）
この実施例は、９４匹のイヌ科動物からの９５匹のマイクロサテライトマーカーについての遺伝子型情報にクラスター分析を使用して、イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を推定するための本発明の代表的な方法を説明する。

（Ａ．方法）
（１．データセット）
データセット１は、実施例２に記載されるように、１８品種の９０匹のイヌおよび４匹のオオカミを含む、９４匹のイヌ科動物からの９５個のマイクロサテライトマーカーについての遺伝子型情報を含んだ。

（２．クラスター分析）
クラスター分析を、マルチローカス遺伝子型クラスタリングプログラムであるｓｔｒｕｃｔｕｒｅ（Ｐｒｉｔｃｈａｒｄら（２０００）Ｇｅｎｅｔｉｃｓ１５５：９４５〜５９；Ｆａｌｕｓｈら（２００３）Ｓｃｉｅｎｃｅ２９９：１５８２〜５）を使用して、行った。このプログラムは、対立遺伝子頻度のパターンに基づいて遺伝的に別個の部分個体群を同定するために、ベイジアンモデルベースのクラスタリングアルゴリズムを利用する。複数の実行を、バーンインの長さが１０，０００工程で、かつＧｉｂｂｓサンプラーを１００，０００回繰り返す設定状態で、各Ｋ値（遺伝クラスター数）について完了した。相関対立遺伝子頻度モデルを、許容された非対称な交配種（ａｄｍｉｘｔｕｒｅ）に使用した。２〜８０のＫ値すべてを試験し、そして最も高い尤度を生じたクラスタリング解を、さらなる検証のために保持した。データセットについての全体的に最良のクラスタリング解を選択するために、全ペアＷｉｌｃｏｘｏｎ２サンプル試験（ａｌｌ−ｐａｉｒＷｉｌｃｏｘｏｎｔｗｏ−ｓａｍｐｌｅｔｅｓｔ）を、最も高い尤度の５つのＫ値について行った。

（３．ネスト化した（ｎｅｓｔｅｄ）セットのクラスタリング）
完全なデータセットで開始して、すべての個体を、サブクラスターへ階層的に分けた。この場合において、各（Ｋ＋１）番目のサブクラスターを、１０回の実行にわたって観察された最も高い尤度の値に基づいて、前のＫクラスターのうちの１つを分岐させることにより作製した。個体のクラスターを派生させるための階層的方法を利用することにより、部分個体群間の遺伝的多様性が、修正された交配種（ａｄｍｉｘｔｕｒｅ）の量が原因で減少される場合に、個体群の系統発生を解明するための合理的な方法論を推測し得る。

（Ｂ．結果）
ｓｔｒｕｃｔｕｒｅを使用する最大尤度の計算は、データセット１（１９匹のイヌ科動物個体群中の９５個のマーカー）中の２０個体群を予測し、そして、表１４に示されるように、各個体を９９％の精度で１つの群に割り当てた。個体の品種群に割り当てられなかった１個体とは、たった１匹のプレサカナリオだけであった。この種は、ブルドッグ群とブルマチフ郡との間に配置された。プレサカナリオは、種々のマスチフ型の交配（ａｄｍｉｘｔｕｒｅ）を介して育成されてきた再現種である。誤って割り当てられたイヌは、具体的には、最近の１２世代内のブルドッグおよびブルマスチフの両者まで、その遺伝形質を辿り得る。

クラスタリングの割り当てでは、この分析レベルにおいては、ブルマスチフとマスチフとの間を区別することができないが、これは、表１５Ａ〜Ｄに示されるように、ネスト化（ｎｅｓｔｅｄ）分析によって解決される。ネスト化分析において、同様のクラスタリングアルゴリズムを、段階的様式で適用した。まず、全体のセットを、２つの個体群へと分けた。最大尤度に基づき、次いでこれら２つの個体群の一方を、合計３つの個体群を提供するために２つに分けた。この手順を、すべての個体群が決定されるまで繰り返した。５〜９つの群からの分岐は、マスチフ型品種の間の関係性を明確に示す。この関係性および予想された階層は、品種の説明書（ａｃｃｏｕｎｔ）から予測された関係性と完全に一致する。

（実施例４）
この実施例は、８５匹のイヌ科動物からの９６個のマイクロサテライトマーカーについての遺伝子型情報にクラスター分析を使用して、イヌ科動物ゲノムへのイヌ科動物個体群の寄与度を推定するための本発明の代表的な方法を説明する。

（Ａ．方法）
（１．データセット）
データセット３は、８５品種の４１４匹のイヌ科動物（ＡＣＫＲ、ＡＦＧＨ、ＡＨＲＴ、ＡＩＲＴ、ＡＫＩＴ、ＡＭＡＬ、ＡＭＷＳ、ＡＵＳＳ、ＡＵＳＴ、ＢＡＳＳ、ＢＥＡＧ、ＢＥＤＴ、ＢＥＬＳ、ＢＩＣＨ、ＢＬＤＨ、ＢＭＤ、ＢＯＲＤ、ＢＯＲＺ、ＢＯＸ、ＢＳＪＩ、ＢＵＬＤ、ＢＵＬＭ、ＣＡＩＲ、ＣＨＢＲ、ＣＨＩＨ、ＣＨＯＷ、ＣＫＣＳ、ＣＬＳＰ、ＣＯＬＬ、ＤＡＣＨ、ＤＡＮＥ、ＤＯＢＰ、ＥＣＫＲ、ＦＢＬＤ、ＦＣＲ、ＧＯＬＤ、ＧＲＥＹ、ＧＳＤ、ＧＳＨＰ、ＧＳＭＤ、ＧＳＮＺ、ＨＵＳＫ、ＩＢＩＺ、ＩＲＳＥ、ＩＲＴＲ、ＩＴＧＲ、ＩＷＯＦ、ＫＥＥＳ、ＫＥＲＹ、ＫＯＭＯ、ＫＵＶＺ、ＬＡＢ、ＬＨＳＡ、ＭＡＳＴ、ＭＢＬＴ、ＭＮＴＹ、ＭＳＮＺ、ＮＥＬＫ、ＮＥＷＦ、ＯＥＳ、ＰＥＫＥ、ＰＨＡＲ、ＰＮＴＲ、ＰＯＭ、ＰＲＥＳ、ＰＴＷＤ、ＰＵＧ、ＲＨＯＤ、ＲＯＴＴ、ＳＡＬＵ、ＳＡＭＯ、ＳＣＨＰ、ＳＣＷＴ、ＳＨＡＲ、ＳＨＩＢ、ＳＨＩＨ、ＳＰＯＯ、ＳＳＨＰ、ＳＳＮＺ、ＳＴＢＤ、ＴＩＢＴ、ＴＥＲＶ、ＷＨＩＰ、ＷＨＷＴ、ＷＳＳＰ；イヌ科動物個体群の略称については表５を参照のこと）からの９６個のマーカーについての遺伝子型情報を含んだ。９６個のマイクロサテライトマーカーは、マイクロサテライトマーカー１〜９、１１〜３８、４０〜４２、４４〜７５、７７〜１００であった（表１）。このデータセットは、ＡＩＲＴ、ＢＡＳＳ、ＢＥＤＴ、ＢＩＣＨ、ＦＢＬＤ、ＩＲＴＲ、ＭＮＴＹ、ＰＨＡＲ、ＳＣＨＰ、ＳＣＷＴ、ＴＥＲＶ（それぞれ４匹のイヌ科動物）を除き、全品種についての５匹のイヌ科動物についての遺伝子型情報を含んだ（表８）。このデータセット中のイヌ科動物についての遺伝子型情報は、（本明細書とともに提出したコンパクトディスク中）表３に示される。

（２．統計分析）
ｓｔｒｕｃｔｕｒｅを、２０，０００回繰り返すバーンインの後、Ｇｉｂｂｓサンプラーを１００，０００回繰り返す間、実行した。相関対立遺伝子頻度モデルを、許容された非対称の交配種（ａｄｍｉｘｔｕｒｅ）に使用した。ｓｔｒｕｃｔｕｒｅの実行全体にわたる類似度係数を、（Ｒｏｓｅｎｂｅｒｇら、（２００２）Ｓｃｉｅｎｃｅ２９８：２３８１−５）に記載されるようにコンピュータで計算した。このプログラムを６８品種の部分的なデータセットに実行した場合、４０を超えるＫ値において、プログラムは、個体が何も割り当てられなかったクラスターを生じ、このクラスターは実行から実行への間、不安定であったことに注目のこと。このことは、２〜３の個体群に分岐するよう初期設定されたアルゴリズムが、このような多数の個体群を同時に扱うことが不可能であるため、最も起こりやすい。ｓｔｒｕｃｔｕｒｅは、信頼できる別々の２０の個体群を既に示しているので（Ｒｏｓｅｎｂｅｒｇら（２００１）Ｇｅｎｅｔｉｃｓ１５９：６９９〜７１３）、このデータは、１０〜１１品種のそれぞれを８個のサブセットへ分けたセットであり、これらのサブセットの可能性のあるすべてのペアを分析した。歴史的に関連がある品種、または形態学的に類似する品種を、同じサブセット中に保持した。

次いで、ｓｔｒｕｃｔｕｒｅを、各Ｋにおいて１５回実行する設定で、Ｋ＝２〜Ｋ＝１０において全体のデータに適用した。Ｋが増加するほど、ｓｔｒｕｃｔｕｒｅはまず、最も多岐した群をクラスターへと分け、その後に、より近縁種の分岐を続ける（Ｒｏｓｅｎｂｅｒｇら（２００２）Ｓｃｉｅｎｃｅ２９８：２３８１）。分析において、尤度は、Ｋが増加するとともに増加し、各Ｋにおいて見出されたさらなる構造を反映するが、複数の異なるクラスタリング解が、Ｋ＞４で見出され、そしてそれ故に、Ｋ＝２〜４を、包括的な品種構造を記述するために使用した。これは、サブグループの系統発生分析およびクラスター分析を近縁種の一群（ｃｏｎｓｔｅｌｌａｔｉｏｎ）を規定するために使用した。Ｋ＝２〜５におけるｓｔｒｕｃｔｕｒｅの実行を、類似する結果を有する交配モデル（ａｄｍｉｘｔｒｕｅｍｏｄｅｌ）がない状態下で繰り返した。別の分析において、８匹のオオカミを、Ｋ＝２におけるｓｔｒｕｃｔｕｒｅの実行に加えた。このオオカミを、８ヶ国（中国、オマーン、イラン、イタリア、スウェーデン、メキシコ、カナダ（オンタリオ）、および米国（アラスカ））からサンプル抽出した。すべてのオオカミを、表１６に示される犬種の第１のクラスターとともにクラスター形成した。

各品種を、品種の平均的な多数派に基づいて４つの群のうちの１つに割り当て、ｓｔｒｕｃｔｕｒｅを、Ｋ＝２〜４において各郡に実行した。さらなる一貫したパターンは、報告された品種ペアおよび品種トリオ以外の個々の群内では、観察されなかった。異常値分析を、ｈｔｔｐ：／／ｗｗｗ．ｒｕｂｉｃ．ｒｄｇ．ａｃ．ｕｋ／〜ｍａｂ／ｓｏｆｔｗａｒｅ．ｈｔｍｌにて利用可能なソフトウェアパッケージｆｄｉｓｔ２を使用して行った。１１個のマーカーを、８５種の個体群を仮定した無限対立遺伝子モデルおよび１個体群あたり１０個のハプロタイプ遺伝子型の平均のもとでの、シミュレーションによって達成された、９５番目のパーセント点を超えるＦｓｔ値を有する潜在的な「異常値」として同定した（ＢｅａｕｍｏｎｔおよびＮｉｃｈｏｌｓ（Ｄｅｃ．２２，１９９６）Ｐｒｏｃｅｅｄｉｎｇｓ：ＢｉｏｌｏｇｉｃａｌＳｃｉｅｎｃｅｓ２６３：１６１９）。これらの除かれたマーカーで行われた割り当ておよび構造分析は、有意な変化を生じなかった。

系統樹分析について、個々のイヌおよびオオカミを、品種または種に基づいて、８６種の個体群のうちの１つに割り当てた。個体群間の距離を、コード距離尺度（ｃｈｏｒｄｄｉｓｔａｎｃｅｍｅａｓｕｒｅ）を用い、プログラムＭｉｃｒｏｓａｔ（Ｅ．Ｍｉｎｃｈ、Ａ．Ｒｕｉｚ−Ｌｉｎａｒｅｓ、Ｄ．Ｇｏｌｄｓｔｅｉｎ、Ｍ．Ｆｅｌｄｍａｎ，Ｌ．Ｌ．Ｃａｖａｌｌｉ−Ｓｆｏｒｚａ（１９９５、１９９６））を使用して、コンピュータで計算した。５００回のブートストラップ複製を作成した。このプログラムは、ウェブサイトｈｔｔｐ：／／ｈｐｇｌ．ｓｔａｎｆｏｒｄ．ｅｄｕ／ｐｒｏｊｅｃｔｓ／ｍｉｃｒｏｓａｔ／ｍｉｃｒｏｓａｔ．ｈｔｍｌからダウンロードされ得る。近接結合樹を、プログラムＮｅｉｇｈｂｏｒを使用して各複製について構築し、そしてプログラムＣｏｎｓｅｎｓｅを、多数派支配型（ｍａｊｏｒｉｔｙ−ｒｕｌｅ）コンセンサス樹を作成するため使用した。これらプログラムは両方とも、ｈｔｔｐ：／／ｅｖｏｌｕｔｉｏｎ．ｇｅｎｅｔｉｃｓ．ｗａｓｈｉｎｇｔｏｎ．ｅｄｕ／ｐｈｙｌｉｐ．ｈｔｍｌにて利用可能な、Ｐｈｙｌｉｐパッケージ（Ｆｅｌｓｅｎｓｔｅｉｎ（１９８９）Ｃｌａｄｉｓｔｉｃｓ
５：１６４）の一部である。オオカミの個体群を、その樹の基礎を成す（ｒｏｏｔ）ために外群（ｏｕｔｇｒｏｕｐ）として指定した。異なる８つの国々からのオオカミを、図２に示される樹において、簡略化のために１個体群にまとめた。個体として考えられる場合、すべてのオオカミは、枝の根が同じ場所にある１つの枝から分岐され。系統分析における分岐の順番は、ヘテロ接合性と相関し（表１１）、一番よく似ている（ｃｌｏｓｅｌｙｍｉｒｒｏｒｅｄ）最初のクラスターに分岐する１２品種が、ｓｔｒｕｃｔｕｒｅによって同定された。これらの知見は、この分析が、異常に同系交配であるかまたは最近野生のイヌ科動物と交配された特異体質品種に分岐するのではなく、遺伝的に関連する品種の別個の部分群を同定したことを、主張する。

割り当て試験を、Ｊ．Ｂｒｚｕｓｔｏｗｓｋｉ（ｈｔｔｐ：／／ｗｗｗ２．ｂｉｏｌｏｇｙ．ｕａｌｂｅｒｔａ．ｃａ／ｊｂｒｚｕｓｔｏ／Ｄｏｈ．ｐｈｐ）から利用可能なＤｏｈ割り当て試験計算器を用いて行った。すべてのイヌを、試験される１種のイヌを除いて、それらの公知の品種で指定した。次いでこれを、試験イヌの遺伝子型を生成する可能性が最も高い品種へと、プログラムを使用して割り当てた。このプログラムは、この手順を、試験イヌとしての各イヌに対して繰り返す。ベルジアンシープドッグ種およびベルジアンタービュレン種を、この分析のために１つの記号表示にまとめた；それらが別個の品種として扱われる場合、個々のイヌを、基本的にランダムにどちらか一方に割り当てる。

（Ｂ．結果）
ｓｔｒｕｃｔｕｒｅを２０〜２２品種のオーバーラップするサブセットに同時に適用した場合、表１７に示されるように、ほとんどの品種がその品種からのすべてのイヌだけから構成される別個のクラスターを形成することが、観察された。以下の４品種のイヌだけが、一貫して、他の同種とクラスター形成できなかった：ペロデプレサカナリオ、ジャーマンショートヘアードポインター、オーストラリアンシェパード、およびチワワ。加えて、以下の品種の６つのペアが、実行の大部分において、ともにクラスター形成した：ベルジアンシープドッグおよびベルジアンタービュレン、コリーおよびシェトランドシープドック、ウィペットおよびグレイハウンド、シベリアハスキーおよびアラスカンマラミュート、マスチフおよびブルマスチフ、グレートスミスマウンテンドックおよびバーニーズマウンテンドッグ。これらの組み合わせは、公知の品種の歴史に基づいて予測される。これらの近縁種のペアがそれでもなお遺伝的に別個であるかどうかを試験するために、ｓｔｒｕｃｔｕｒｅをこれらの各クラスターに適用した。１つだけを除いてすべてのクラスターは、表１８に示されるように、個々の品種に対応する２種の個体群へと分岐した。１つの例外は、ベルジアンシーブドックとベルジアンタービュレンであった。ヨーロッパケンネルクラブおよび日本ケンネルクラブは、それらを、１品種の毛色および毛長の変種として分類し（ＹａｍａｚａｋｉおよびＹａｍａｚａｋｉ（１９９５）ＬｅｇａｃｙｏｆｔｈｅＤｏｇ：ＴｈｅＵｌｔｉｍａｔｅＩｌｌｕｓｔｒａｔｅｄＧｕｉｄｅｔｏＯｖｅｒ２００Ｂｒｅｅｄｓ，ＣｈｒｏｎｉｃｌｅＢｏｏｋｓ，ＳａｎＦｒａｃｉｓｃｏ，ＣＡ；ＷｉｌｃｏｘおよびＷａｌｋｏｗｉｃｚ（１９９５）ＡｔｌａｓｏｆＤｏｇＢｒｅｅｄｓｏｆｔｈｅＷｏｒｌｄ，Ｔ．Ｆ．Ｈ．Ｐｕｂｌｉｃａｔｉｏｎｓ，ＮｅｐｔｕｎｅＣｉｔｙ，ＮＪ）、そして、その一方で、アメリカンケンネルクラブが、これらを別個の品種として認識するとはいえ、品種の境界は、遺伝的差異を結果としてもたらすには、明らかに近い世代（ｒｅｃｅｎｔ）でありまたは厳密さが不十分である。これらの例は、アルゴリズムは真の遺伝的差異を有する群に分けるだけに過ぎないことを確認する（Ｆａｌｓｈら（２００３）Ｓｃｉｅｎｃｅ２９９：１５８２−５；ＰｒｉｔｃｈａｒｄおよびＲｏｓｅｎｂｅｒｇ（１９９９）Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．６５：２００−８）。

イヌが遺伝子型データだけを基にしてその品種へと割り当てられ得るかどうかを試験するために、ｌｅａｖｅｏｎｅ−ｏｕｔ分析を用いる直接割り当て方法（Ｐａｅｔｋａｕら（１９９５）Ｍｏｌ．Ｅｃｏｌ．４：３４７−５４）を、使用した。９９％の個々のイヌが、正しい品種へと正確に割り当てられた。４１４匹のうちの４匹のイヌのみが、誤って割り当てられた：１匹は（ペロデプレサカナリオに割り当てられた）ビーグルであり、１匹は（ケーアンテリアに割り当てられた）チワワであり、そして２匹は、（クバーズおよびスタンダードプードルそれぞれに割り当てられた）ジャーマンショートヘアードポインターである。品種に関連する４つエラーは、ｓｔｒｕｃｔｕｒｅ分析において単独の品種クラスターを形成しなかった品種を含んだ。

現代のイヌの品種が別個の遺伝単位を形成することが示されると、品種間の広範な歴史的関係性を規定することが試みられた。最初に、標準的な近隣結合法を、コード距離尺度（Ｃａｖａｌｌｉ−ＳｆｏｒｚａおよびＥｄｗａｒｄｓ（１９６７）Ｅｖｏｌｕｔｉｏｎ
３２：５５０）を使用して計算された距離を用い、品種の多数派支配型コンセンサス樹を構築するために使用した（図２）。これは、特定の変異モデルを仮定せず、そして近縁の分類群に対して良好に機能すると考えられる（Ｇｏｌｄｓｔｅｉｎら（１９９５）Ｇｅｎｅｔｉｃｓ１３９：４６３）。この樹を、オオカミサンプルを使用して基礎を成した（ｒｏｏｔ）。樹の最も深い分岐は、４種のアジアスピッツ型品種に分かれ、そしてこの枝内でシャーペイが最初に分岐し、その後に柴犬が続き、秋田犬およびチャウチャウは一緒のグループになった。第２の分岐は、バセンジー（古代アフリカ品種）に分かれた。第３の分岐は、２種の北極スピッツ型品種（アラスカンマラミュートとシベリアンハスキー）に分かれ、そして第４の分岐は、残りの品種から、２種の中東品種のハウンド（アフガンとサルーキ）に分かれた。

最初の４つの分岐は、半分より多くのブートストラップ複製が示すように、「多数派支配」基準を超えた。対照的に、残りの品種は、わずかなに系統学的に一致する関係性を示した。これは、ｓｔｒｕｃｔｕｒｅ分析でともにクラスター形成される５品種のペアの近縁群を除いて、近縁関係にあるウェストハイランドホワイトテリアとケアーンテリアとの新たな１つのペアであり、そして類似する外見を有する仲間の品種（ｃｏｍｐａｎｉｏｎｂｒｅｅｄ）であるアジアの３種（ラサアプソ、シーズー、およびペキニーズ）の有意な分類である。これらの３種の間の近縁関係はまた、実行の大部分において３つのうちの少なくとも２つが一緒にクラスター形成することで、ｓｔｒｕｃｔｕｒｅ分析において観察された。樹のフラットトポロジーは、おそらく、より大きな共通の創始系統（ｆｏｕｎｄｅｒｓｔｏｃｋ）ならびに、血統クラブおよび品種の境界規則の出現より前の、表現型的に異なるイヌ間での広範な遺伝子流動の発生を反映する。加えて、これは、表現型的に類似するか歴史的に関連するイヌ由来の系統を使用した、飢饉（１９世紀および２０世紀の不況および戦争）の間に絶滅したいくつかの歴史的に古い品種の再生を示す可能性がある。

系統発生分析は、現代のヨーロッパ血統と推定されたより大きな品種群からの古代血統を有するいくつかの品種の分岐を示したが、更なる部分個体群は、少なくとも２つの理由によってこのアプローチでは検出されない後者の郡内に、存在し得る（Ｒｏｓｅｎｂｅｒｇら、（２００１）Ｇｅｎｅｔｉｃｓ１５９：６９９）。第一に、犬種の真の進化の歴史は、この方法によって仮定された二分岐樹モデルでは、十分には表されないが、新種を生成するための現存種の交配（現在まで続くプロセス）に関しては、かなり関与した。第二に、遺伝的距離マトリックスに基づいた方法は、品種のペアについてのすべての遺伝子型データを、１つの数字へと激減させることで情報を失う。

ｓｔｒｕｃｔｕｒｅに組み込まれたクラスタリングアルゴリズムは、これらの制限を克服するために明示的に設計され（Ｐｒｉｔｃｈａｒｄら（２０００）Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．６７：１７０−８１；Ｆａｌｕｓｈら（２００３）Ｇｅｎｅｔｉｃｓ１６４：１５６７；Ｒｏｓｅｎｂｅｒｇら（２００１）Ｇｅｎｅｔｉｃｓ１５９：６９−７１３）、そして、いくつかの種の遺伝学的構造を推測するために適用されている（Ｒｏｓｅｎｂｅｒｇら（２００２）Ｓｃｉｎｅｃｅ２９８：２１８１−５；Ｆａｌｕｓｈら（２００３）Ｓｃｉｅｎｃｅ２９９：１５８２−５；Ｒｏｓｅｎｂｅｒｇら（２００１）Ｇｅｎｅｔｉｃｓ１５９：６９９−７１３）。ｓｔｒｕｃｔｕｒｅを、先祖の個体群源を同定するためにＫの増加値（プログラムが発見しようと試みた部分個体群の数）を使用して、全体のデータセットに対して実行した。この分析において、現代種は、１つの先祖個体群と厳密に酷似し得るか、または２つ以上の先祖タイプの交配種を表し得る。

Ｋ＝２において、１つのクラスターが、系統発生分析において分岐するために、最初の７品種によって支えられたが、一方で、他のクラスターは、フラットな系統発生のトポロジーで多数の品種を含んだ（表１９Ａ）。プログラムの５つ実行は、実行にわたって０．９９の類似する係数で、ほぼ同一の結果を生成した（Ｒｏｓｅｎｂｅｒｇら（２００２）Ｓｃｉｅｎｃｅ２９８：２３８１）。７種の他の品種は、それらの祖先の相当大きな部分を、最初のクラスターと共有する。これら１４種のすべては古代から始まり、そしてそれらの祖先をアジアまたはアフリカまでさかのぼる。８つの異なる国々からのオオカミの多様なセットが分析に含まれた場合は、これらは、完全にこのクラスター内にある（表２０）。オオカミの外群へとつながる枝もまた、系統発生分析においてこの群の品種内にある（図２）。

Ｋ＝３において、系統樹からは容易には明白に理解されなかったさらなる構造が検出された（表１９Ｂ）。新たな３つクラスターは、マスチフの遺伝形質および外見において関連した品種から主に構成され、そして、それらの近縁種（ブルマスチフ、フレンチブルドッグ、ミニチュアブルテリア、およびペロデプレサカナリオ）とともに、マスチフ、ブルドック、およびボクサーによって支えられる。クラスター内に含まれるものはまた、古代マスチフタイプの祖先からそれらの大きさを獲得したと報告されている大型品種である、ロットワイラー、ニューファンドランド、およびバーニーズマウンテンドッグである。ジャーマンシェパードドッグを含むことはあまり期待されない。この品種の正確な起源は未知であるが、この結果は、作業犬タイプ（例えば、ボクサー）の前で軍用犬および警察犬として費やした年数が、この有名な品種の遺伝学的背景の形成に関与することを示唆する。他の３つの品種は、ｓｔｒｕｃｔｕｒｅの実行にわたってこのクラスター中に部分的でかつ不定な構成員を示した（表１６）。これは、類似係数を０．８４まで低下させた。

Ｋ＝４において、４つのクラスターが観察された。これは、牧畜犬として使用された数品種：ベルジアンシープドッグ、ベルジアンタービュレン、コリー、およびシェットランドシープドッグを含んだ（表１９Ｃ）。アイリッシュウルフハウンド、グレイハウンド、ボルゾイ、およびセントバーナードもまた、頻繁にこのクラスターへと割り当てられた。歴史的記録物は、これらのイヌがこれまでに家畜を集めるために使用されていたとは示唆しないが、得られた結果は、これらの品種が牧畜タイプの祖先かまたは子孫であるかのいずれかであることを示唆する。残りのクラスター中の品種は、主に比較的最近のヨーロッパ血統からなり、そして、主には異なるタイプの猟犬（セントハウンド、テリア、スパニエル、ポインター、およびレトリバー）である。Ｋ＝４におけるクラスタリングは、０．６１の類似係数を示した。これは、ほとんどの品種についての類似クラスター構成員の割り当てを反映するが、実行にわたって他の品種についての割り当て変数を反映しない（表１６）。Ｋ＝５において、類似係数は、０．２６まで下がり、さらに一致する部分個体群は推測されなかった。これは、サンプル抽出された純血種のイヌ個体群においてさらに高レベルの部分構造が欠けていることを示唆している。

得られた結果は、イエイヌ種にわたる関係性の下記の構図を描く。異なる品種は、遺伝学的に別個であり、そして個体は、それらの遺伝子型に基づいて品種へと容易に割り当てられ得る。この分岐レベルは、ほとんどの品種の起源が祖先血統から交配されたときからの短い時間を考慮すると驚くべきものであり、そして、品種の境界規則の結果として生じる、各品種内の強力な生殖隔離を支持する。この結果は、別個の「適応放散」を表す少なくともの４つの別個の品種分離を支持する。アジア血統およびアフリカ血統を有する品種の部分セットは、残りの品種から分かれ、そして共有の対立遺伝子頻度パターンを示す。一見したところ、１つの遺伝クラスター内に、中央アフリカ由来種（バセンジー）、中東由来種（サルーキおよびアフガン）、同様にチベット由来種（チベタンテリア、ラサアプソ）、中国由来種（チャウチャウ、ペキニーズ、シャーペイ、シーズー）、日本由来種（秋田犬、柴犬）、ならびに北極由来種（アラスカンマラミュート、シベリアンハスキー、サモエド）を包含するようであり、これは驚くべきことである。しかし、初期の雑種の野良犬は、アジアに由来し、そして遊牧民族とともに、南はアフリカまでそして北は北極まで移動し、結果としてアジアの至るところに移動したという仮説が立てられている（Ｓａｖｏｌａｉｎｅｎら（２００２）Ｓｃｉｅｎｃｅ２９８：１６１０；Ｌｅｏｎａｒｄら（２００２）Ｓｃｉｅｎｃｅ２９８：１６１３；ＳａｂｌｉｎおよびＫｈｌｏｐａｃｈｅｖ（２００２）ＣｕｒｒｅｎｔＡｎｔｈｒｏｐｏｌｏｇｙ４３：７９５）。このクラスターは、オオカミに表現型的に似ている北欧種（例えば、アラスカンマラミュートおよびシベリアンハスキー）を含み、そして、イエイヌの直接の祖先であるオオカミに対して最も近い遺伝学的関係性を示す。従って、これらの品種由来のイヌは、祖先イヌの遺伝子プールの最も代表的な生物であり得る。古代起源の品種であると一般に考えられている数種（例えば、ファラオハウンドおよびイビザンハウンド）は、この群に含まれないことは、注目すべきことである。これらは、すべての犬種のうち最も古い種であるとしばしば考えられている。この種は、５０００年以上前に墓の壁に描かれた古代エジプトのイヌから直接的に由来する種である。しかし、この結果は、これら２つの種が、より近代において、他の種の組み合わせから再生されていることを示す。したがって、それらの外見は古代エジプト種のハウンドと一致するが、それらのゲノムは一致しない。同様の結論をノルウェジアンエルクハウンドへと適用すると、これは、５０００年前以上にスカンジナビア起源種から直接的に伝わったという報告（ＡｍｅｒｉｃａｎＫｅｎｎｅｌＣｌｕｂ（１９９８）「ＴｈｅＣｏｍｐｌｅｔｅＤｏｇＢｏｏｋ」、ＣｒｏｗｌｅｙおよびＡｄｅｌｍａｎ編、ＨｏｗｅｌｌＢｏｏｋＨｏｕｅｓ、ＮｅｗＹｏｒｋ、ＮＹ；ＷｉｌｃｏｘおよびＷａｌｋｏｗｉｃｚ（１９９５）ＡｔｌａｓｏｆＤｏｇＢｒｅｅｄｓｏｆｔｈｅＷｏｒｌｄ，Ｔ．Ｆ．Ｈ．Ｐｕｂｌｉｃａｔｉｏｎｓ，ＮｅｐｔｕｎｅＣｉｔｙ，ＮＪ）とは異なり、他の北極犬よりも近代のヨーロッパ種でクラスター形成する。

大多数の品種は、共通のヨーロッパ血統由来の、より最近の放散（ｒａｄｉａｔｉｏｎ）を表すようである。個々の品種が遺伝学的に分化される間、それらは、基本的に同時期に分化されたようである。この放散は、１８００年代のヨーロッパにおける血統の概念の導入および血統クラブの創設の後に、あまり体系化されてなかった表現型的多様性からの別個の品種の繁殖をおそらくは反映する。より高感度なクラスター分析は、この群内の３つの部分個体群のさらなる遺伝学的構造を見分けることが可能である。あるクラスターは、マスチフ様品種を含み、そして共通祖先由来の共通する形態を反映するように見える。別のクラスターは、シェットランドシープドッグ、２匹のベルジアンシープドッグ、およびコリーを含み、そして、共通する祖先の牧畜習性を反映し得る。残りの個体群は、狩猟の種々の局面に献身的な品種の繁殖によって、主に占められている。これらの品種について、歴史的記録および血統クラブの記録は、高度に絡み合った血統を示唆し、これは、得られた結果と一致する。

犬種は、伝統的に、人間の活動におけるイヌの役割、身体的な表現型、および歴史的記録に基づいて、分類されてきた。上に記載された結果は、遺伝学的多様性のパターンに基づいて、個々の分類を提供する。この分類は、伝統的な分類の部分セットを支持し、そしてまた、品種間の以前は認識されていなかった関係を解明する。品種間の遺伝学的関係性の正確な理解は、形態、習性、および疾患罹患率における品種の差異の複雑な遺伝学的基礎を解明することを目的とした研究のための基礎を築く。

（実施例５）
この実施例は、マイクロサテライトマーカーを用いて、交配されたイヌ科動物の子孫のゲノムへの、異なるイヌ科動物個体群からの親、祖父母、および曽祖父母の寄与度を推定する、インシリコでの方法を説明する。

（Ａ．方法）
（１．データセット）
データセット４は、１８種の異なる犬種の８１匹のイヌと４匹のオオカミからなる、８５匹のイヌ科動物（ＡＨＲＴ、ＡＫＩＴ、ＢＥＡＧ、ＢＭＤ、ＢＯＸ、ＢＵＬＤ、ＢＵＬＭ、ＣＨＩＨ、ＤＡＣＨ、ＧＯＬＤ、ＩＢＩＺ、ＭＡＳＴ、ＮＥＷＦ、ＰＥＫＥ、ＰＯＭ、ＰＲＥＳ、ＰＵＧ、ＲＯＴＴ、ＷＯＬＦ；イヌ科動物個体群の略称については表５を参照のこと）からの９５のマーカーについての遺伝子型情報を含んだ。９５個のマイクロサテライトマーカーは、マイクロサテライトマーカー１〜１４、１６、１８〜２１、２３〜２６、３９〜１００であった（表１）。このデータセットは、８５匹のイヌ科動物の各々の９０％よりも多くが、正確な品種へと割り当てられた事実に基づいて選択された。４匹のオオカミは、１種のイヌ科動物個体群として設計された。１２品種は、５匹のイヌで、３品種は、４匹のイヌで、そして３品種は３匹のイヌで、表９に示されるように表された。各イヌ科動物において使用されたマイクロサテライトマーカーの各々についての遺伝子型は、（本明細書とともに提出されたコンパクトディスク中の）表３に示される。

（２．クラスター分析）
インシリコでのイヌ科動物の交配種を、各座位における各親からの２つの対立遺伝子のうちの１つをランダムに引き出し、そしてそれらをその座位における交配種の対立遺伝子として設計することにより、作製した。Ｆ１交配種を、８１匹の原種イヌ科動物の２つの対立遺伝子をインシリコで交配することによって作製した。次いで、Ｎ２交配種を、それらの２つの親のうちの１つとＦ１とをインシリコで交配することによって作製し、そして、Ｎ３交配種を、同じ親とＮ２とをインシリコで交配することによって作製した。

３つのタイプの交配種が形成された（試験交配種、コントロール交配種、祖父母交配種）。試験交配種において、２つの親を、ランダムに選択された異なる２種から選択した。１００個のＦ１交配種、Ｎ２交配種、およびＮ３交配種が、形成された。Ｆ１交配種が、異なる品種からの親を２つ有し、Ｎ２交配種が、１種からの祖父母および別の種から祖父母の４つのうちの３つを有し、そしてＮ３交配種が、１種からの曽祖父母および別の種から曽祖父母の８つのうちの７つを有することに注目のこと。

コントロール交配種において、２つの親を同種から選択し、そして１００個のＦ１混合種、Ｎ２混合種、およびＮ３混合種を、同じ手順によって形成した。これらすべての混合種が選択された品種からの純血種のイヌに対応することに注目のこと。

いくつかの祖父母交配種をまた、異なる４種の品種から４つの祖父母を選択することにより形成した。

３００個すべての試験混合種を、選択された８５匹のイヌ科動物を用いるｓｔｒｕｃｔｕｒｅの実行において、同時に実行した。同様の分析を、コントロール交配種について、および４つの祖父母交配種について行った。プログラムを、以下のパラメーター設定で実行した：＃ｄｅｆｉｎｅＮＵＭＩＮＤＳ３９５；＃ｄｅｆｉｎｅＮＵＭＬＯＣＩ９５；＃ｄｅｆｉｎｅＬＡＢＥＬ１；＃ｄｅｆｉｎｅＰＯＰＤＡＴＡ１；＃ｄｅｆｉｎｅＰＯＰＦＬＡＧ１；＃ｄｅｆｉｎｅＰＨＥＮＯＴＹＰＥ０；＃ｄｅｆｉｎｅＭＡＲＫＥＲＮＡＭＥＳ０；＃ｄｅｆｉｎｅＭＡＰＤＩＳＴＡＮＣＥＳ０；＃ｄｅｆｉｎｅＯＮＥＲＯＷＰＥＲＩＮＤ１；＃ｄｅｆｉｎｅＰＨＡＳＥＩＮＦＯ０；＃ｄｅｆｉｎｅＰＨＡＳＥＤ０；＃ｄｅｆｉｎｅＥＸＴＲＡＣＯＬＳ０；＃ｄｅｆｉｎｅＭＩＳＳＩＮＧ０；＃ｄｅｆｉｎｅＰＬＯＩＤＹ２；＃ｄｅｆｉｎｅＭＡＸＰＯＰＳ１９；＃ｄｅｆｉｎｅＢＵＲＮＩＮ５０００；＃ｄｅｆｉｎｅＮＵＭＲＥＰＳ５０００；＃ｄｅｆｉｎｅＵＳＥＰＯＩＮＦＯ１；＃ｄｅｆｉｎｅＧＥＮＳＢＡＣＫ０；＃ｄｅｆｉｎｅＭＩＧＲＰＲＩＯＲ０．０；＃ｄｅｆｉｎｅＮＯＡＤＭＩＸ０；＃ｄｅｆｉｎｅＬＩＮＫＡＧＥ０；＃ｄｅｆｉｎｅＩＮＦＥＲＡＬＰＨＡ１；＃ｄｅｆｉｎｅＡＬＰＨＡ１．０；＃ｄｅｆｉｎｅＰＯＰＡＬＰＨＡＳ０；＃ｄｅｆｉｎｅＵＮＩＦＰＲＩＯＰＡＬＰＨＡ１；＃ｄｅｆｉｎｅＡＬＰＨＡＭＡＸ１０．０；＃ｄｅｆｉｎｅＡＬＰＨＡＰＲＯＰＳＤ０．０２５；＃ｄｅｆｉｎｅＦＲＥＱＳＣＯＲＲ１；＃ｄｅｆｉｎｅＯＮＥＦＳＴ０；＃ｄｅｆｉｎｅＦＰＲＩＯＲＭＥＡＮ０．０１；＃ｄｅｆｉｎｅＦＰＲＩＯＲＳＤ０．０５；＃ｄｅｆｉｎｅＩＮＦＥＲＬＡＭＢＤＡ０；＃ｄｅｆｉｎｅＬＡＭＢＤＡ１；＃ｄｅｆｉｎｅＣＯＭＰＵＴＥＰＲＯＢ１；＃ｄｅｆｉｎｅＰＦＲＯＭＰＯＰＦＬＡＧＯＮＬＹ０；＃ｄｅｆｉｎｅＡＮＣＥＳＴＤＩＳＴ１；＃ｄｅｆｉｎｅＮＵＭＢＯＸＥＳ１０００；＃ｄｅｆｉｎｅＡＮＣＥＳＴＰＩＮＴ０．９５；＃ｄｅｆｉｎｅＳＴＡＲＴＡＴＰＯＰＩＮＦＯ１；＃ｄｅｆｉｎｅＭＥＴＲＯＦＲＥＱ１０；＃ｄｅｆｉｎｅＵＰＤＡＴＥＦＲＥＱ１；＃ｄｅｆｉｎｅＰＲＩＮＴＱＨＡＴ１。

８５匹のイヌ科動物の各々は、それらの適切な品種に属するように設計され、そして、その交配種は、どの品種にも割り当てられなかった。

（Ｂ．結果）
コントロール交配種について、各交配種は、常に、プログラムによって正しい品種へと割り当てられた。そして、その品種へと割り当てられたゲノムの比率は、３００回のケースすべてにおいて９５％を超え（最小値は９５．７５％であった）、２９７回のケースにおいては９８％を超え、そして２６６回のケースにおいては９９％を超えた。従って、単一の種への９５％を超えるゲノムの割り当ては、試験交配種についての交配の明白な検出を提供した。そして９８％を超える割り当ては、０．９９の信頼度における交配の強固な証拠を提供する。

Ｆ１試験交配種について、１００個の交配種すべては、各品種の寄与度が２８％〜７０％の範囲で正確に割り当てられた、２つの親種からゲノム寄与度であった。１００回のケースのうち８２回において、２つの親種の各々は、４０％より高い寄与度、および６０％より低い寄与度で割り当てられた。このことは、２種間での交配種が、親レベルの時点で１００％確実に同定され得ることを示している。

Ｎ２試験交配種について、１００回のケースのうちの９９回は、１つの品種へと割り当てられたゲノムのうちの９８％未満を有し、１００回のケースのうちの９７回は、１つの品種へと割り当てられたゲノムのうちの９５％未満を有した。これは、祖父母レベルにおける交配を検出する高度に正確な能力を示した。交配が検出されたケースの１つを除いて、交配に寄与する両方の品種は、正確に割り当てられた（１つのケースにおいて、４つの祖父母のうちの１つに寄与する品種は、有意に寄与するものとしては検出されなかった）。８０〜８５％のケースにおいて、Ｎ２交配種は、Ｆ１交配種から確実に識別され得る（すなわち、親レベルではなく祖父母レベルで生じた交配が検出され得る）。

Ｎ３試験交配種について、１００回のケースのうちの８５回は、１つの品種へと割り当てられたゲノムのうちの９８％未満を有し、１００回のケースのうちの７７回は、１つの品種へと割り当てられたゲノムのうちの９５％未満を有した。これは、祖父母レベルにおける交配を検出するかなり良好な能力を示した。交配が検出されたケースの１つを除いて、交配に寄与する両方の品種は、正確に割り当てられた。すべてのケースにおいて、Ｎ３交配種は、Ｆ１交配種から確実に識別され得る（すなわち、親レベルではなく祖父母レベルで生じた交配が検出され得る）が、祖父母レベルおよび曽祖父母レベルにおける交配の間で区別する能力は低かった。

最終的に、４つの異なる祖父母を有する交配種について、４つの祖父母種すべてが、２０〜３０％の範囲と推定された各品種の交配種のゲノムへの寄与度で、正確に同定された。

これらの結果は、いくらかが曽祖父母レベルにおける交配を識別する能力で、純血種のイヌからの（イヌ由来の１／２オオカミ交配種および１／４オオカミ交配種も同様）、親レベルおよび祖父母レベルにおける交配を識別する方法の能力を明白に証明している。この方法また、雑種イヌのゲノムにおける品種の寄与度を正確に同定する。各品種からのより多くのイヌ、および本明細書に他で記載された基準に従って選択された追加にマーカーおよび最適化されたマーカーセットを含む、より大きなデータベースは、曽祖父母レベルにおける交配をより正確に識別することを可能にし、そして、単純な拡張によって、より遠い祖先において生じる交配も正確に識別することを可能にする。

（実施例６）
この実施例は、ＳＮＰマーカーを使用する、試験イヌ科動物のゲノムへのイヌ科動物の寄与度を推定するための本発明の代表的な方法を説明する。

（Ａ．方法）
（１．データセット）
種々の犬種における一塩基多型（ＳＮＰ）のデータセットを、各品種における各対立遺伝子頻度を計算するために使用した。データベースは、実施例１に記載されるように、品種ごとに１１純血種のうちの２種に関しての、６７品種の１８９匹のイヌ科動物からの１００個のＳＮＰについての遺伝子型情報を含んだ。イヌ科動物における対立遺伝子の同一性は、（本明細書とともに提出されたコンパクトディスク中の）表４に示される。

（２．Ｄｏｈ分析）
ｌｅａｖｅ−ｏｎｅ−ｏｕｔ手順を使用して、各イヌをデータベースから一時的に除き、各品種の対立遺伝子頻度とイヌの遺伝子型との比較に基づいて、品種へと割り当てた。ベイズの定理を、割り当てについて使用した：所与の品種から生じた確率とは、その品種のイヌにおいて生じる観察された遺伝子型を、データベース内のすべての品種について生じる観察された遺伝子型である条件付き確率の合計で割った条件付き確率である（基本的に、Ｃｏｒｎｕｅｔら（１９９９）Ｇｅｎｅｔｉｃｓ１５３：１９８９〜２０００において記載される）。ソフトウェアを、このアルゴリズムを実施するために開発した。２個体のみを有する品種をデータベース内に含んだが、それらの一員を分類する試みはしなかった。なぜなら、２つの一員のうちの１つを一時的に除くことは、信頼できる対立遺伝子頻度を計算するための十分な情報を残さなかったからである。

（Ｂ．結果）
この分析の出力結果は、表２１に示されるような、各イヌについての、データベース中の各品種から生じた確率のリストである。８０％のイヌは、９９％以上の確率で正確な品種へと割り当てられた。遺伝子型が５個以上の個体について得られた品種について、８８％のイヌが、９９％の確率で正確な品種へと割り当てられた。１４匹のイヌ（試験された合計のうちの１６％）は、６５％よりも良好な確率で正確な品種へと割り当てられた。これらについて、１３匹は、５０％よりも良好な確率（９０％よりも高い確率のほぼ１／３）で誤って割り当てられた。残りのイヌは、数種から生じた２０〜４５％の確率で割り当てられ、これらのうちの１つは、正しかった。

これらの結果は、ＳＮＰマーカーに基づいた品種割り当ての実行可能性を実証している。性能は、より多く（各品種について５匹以上）のイヌについてのＳＮＰ遺伝子型プロファイルを、より大きなＳＮＰセットを使用して生成すること、および最大限の情報性となるＳＮＰを選択することによって増強され得る。ＳＮＰは、品種にわたる高いヘテロ接合性を有すること（すなわち、高頻度で生じる両方の対立遺伝子）に基づくパネル、および品種間の頻度における大きな差異に基づくパネルの両方を包含して選択され得る。

（実施例７）
この実施例は、マイクロサテライトマーカーを用いて、交配された子孫イヌ科動物のゲノムへの、異なるイヌ科動物個体群からの親および祖父母イヌ科動物の寄与度を推定するためのナイーブベイジアン分類モデルを説明する。

（Ａ．方法）
（１．データセット）
データセット５は、８８品種の４２９匹のイヌ科動物（ＡＣＫＲ、ＡＦＧＨ、ＡＨＲＴ、ＡＩＲＴ、ＡＫＩＴ、ＡＭＡＬ、ＡＭＷＳ、ＡＳＢＴ、ＡＵＳＳ、ＡＵＳＴ、ＢＡＳＳ、ＢＥＡＧ、ＢＥＤＴ、ＢＥＬＳ、ＢＩＣＨ、ＢＬＤＨ、ＢＭＤ、ＢＯＲＤ、ＢＯＲＺ、ＢＯＸ、ＢＲＩＡ、ＢＳＪＩ、ＢＵＬＤ、ＢＵＬＭ、ＣＡＩＲ、ＣＨＢＲ、ＣＨＩＨ、ＣＨＯＷ、ＣＫＣＳ、ＣＬＳＰ、ＣＯＬＬ、ＤＡＣＨ、ＤＡＮＥ、ＤＯＢＰ、ＥＣＫＲ、ＦＢＬＤ、ＦＣＲ、ＧＯＬＤ、ＧＲＥＹ、ＧＳＤ、ＧＳＨＰ、ＧＳＭＤ、ＧＳＮＺ、ＨＵＳＫ、ＩＢＩＺ、ＩＲＳＥ、ＩＲＴＲ、ＩＴＧＲ、ＩＷＯＦ、ＫＥＥＳ、ＫＥＲＹ、ＫＯＭＯ、ＫＵＶＺ、ＬＡＢ、ＬＨＳＡ、ＭＡＳＴ、ＭＢＬＴ、ＭＮＴＹ、ＭＳＮＺ、ＮＥＬＫ、ＮＥＷＦ、ＯＥＳ、ＰＥＫＥ、ＰＨＡＲ、ＰＮＴＲ、ＰＯＭ、ＰＲＥＳ、ＰＴＷＤ、ＰＵＧ、ＲＨＯＤ、ＲＯＴＴ、ＳＡＬＵ、ＳＡＭＯ、ＳＣＨＰ、ＳＣＷＴ、ＳＨＡＲ、ＳＨＩＢ、ＳＨＩＨ、ＳＰＯＯ、ＳＳＨＰ、ＳＳＮＺ、ＳＴＢＤ、ＴＩＢＴ、ＴＥＲＶ、ＴＰＯＯ、ＷＨＩＰ、ＷＨＷＴ、ＷＳＳＰ；イヌ科動物個体群の略称については表５を参照のこと）からの９６個のマーカーについての遺伝子型情報を含んだ。９６個のマイクロサテライトマーカーは、マイクロサテライトマーカー１〜９、１１〜３８、４０〜４２、４４〜７５、７７〜１００であった（表１）。このデータセット中のイヌ科動物についての遺伝子型情報は、（本明細書とともに提出したコンパクトディスク中）表３に示される。

データセット６は、既知の交配種構成員を有する１６０匹の雑種イヌ科動物からの、表１における７２個のマーカーについての遺伝子型情報を含んだ。このデータセット中の雑種イヌ科動物についての遺伝子型情報は、（本明細書とともに提出したコンパクトディスク中）表３に示される。

（２．分析）
ナイーブベイジアンモデルを構築した。これは、先祖の部分個体群の交配種への個体の確率論的割り当てのために、連鎖および非連鎖マイクロサテライト座位情報、高次元の先祖個体群、および高度に秩序だった世代系図を組み込んでいる。２世代および３世代のモデルを、既存モデルの世代、部分個体群、および連鎖の制限を同時に対処し、正確に交配種を検出しかつ割り当てるために、組み込んだ。

２世代モデルは、「純血の」部分個体群の２つのクラスよりもより大きく拡張して、ＡｎｄｅｒｓｏｎおよびＴｈｏｍｐｓｏｎ（２００２）Ｇｅｎｅｔｉｃｓ１６０：１２１７−２９に概説されたモデルに、厳密に従っている。非連鎖座位（Ｌ）について、部分個体群（Ｎ）（品種とみなされる）、および第１番目の座位における対立遺伝子（ｊ_１）を有する。座位（Ｌ）における各個体について、遺伝子型：（ｇ_１ ^（０）、ｇ_１ ^（１））を含めた。部分個体群対立遺伝子情報を集めることは、任意の所与の対立遺伝子に頻度（ｆ_ｉｊ ^（ｉ）で表される）についての情報を提供する。したがって個体について、交配されなかった（ｎｏｎ−ａｄｍｉｘｅｄ）部分個体群の割り当てには、以下：

を与える。ここで親の交配種の割り当てについては、以下：

を有する。ここで上付き添え字（０）は、父親と子との関係、そして（１）は、母親と子との関係を、（明白で交換可能なオプションとともに）表す。

３世代モデルは、モデルの拡張が、部分個体群（Ｎ）にわたる４個体群の２世代の表示（ｒｅｐｒｅｓｅｎｔａｔｉｏｎ）を考慮することを可能にする：

最も高い後方確率での交配種の徹底的な探索は、２世代および３世代モデルについて可能である。

インシリコでの個体について、モデルの評価は、ｌｅａｖｅ−ｏｎｅ−ｏｕｔクロス検定によって行われた。この場合、インシリコ雑種個体の生成に使用した、サンプル抽出された対立遺伝子は、先祖個体群から除かれ、そして対立遺伝子頻度は、最大尤度の交配比率の割り当ての前に、更新される。

（Ｂ．結果）
９６個すべてのジヌクレオチドマーカーのわたるインシリコ雑種個体群についての分析は、２世代および３世代におけるモデルが、品種特異的に不足するというような明らかな傾向がない状態で、Ｆ１交配種の９８．４％およびＦ２交配種の９４．３％を正しく非常に良好に割り当てることを示している。９６個のジヌクレオチドマーカーのうちの７２個において遺伝子型決定された既知の雑種個体１６０匹についての分析は、２世代および３世代におけるモデルが、ほぼ正確に、Ｆ１交配種の９６．２％およびＦ２交配種の９１．８％を正しく割り当てることを示している。

本発明の好ましい実施形態が例示されそして説明されているが、種々の変更が、本発明の精神および範囲を逸脱することなく、本発明において行われ得ることが理解される。