JP3600891B2 - Animal species discrimination method by SINE method - Google Patents

Animal species discrimination method by SINE method Download PDF

Info

Publication number
JP3600891B2
JP3600891B2 JP2001126667A JP2001126667A JP3600891B2 JP 3600891 B2 JP3600891 B2 JP 3600891B2 JP 2001126667 A JP2001126667 A JP 2001126667A JP 2001126667 A JP2001126667 A JP 2001126667A JP 3600891 B2 JP3600891 B2 JP 3600891B2
Authority
JP
Japan
Prior art keywords
dolphin
whale
whales
locus
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001126667A
Other languages
Japanese (ja)
Other versions
JP2003009866A (en
Inventor
典弘 岡田
Original Assignee
財団法人理工学振興会
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財団法人理工学振興会 filed Critical 財団法人理工学振興会
Priority to JP2001126667A priority Critical patent/JP3600891B2/en
Publication of JP2003009866A publication Critical patent/JP2003009866A/en
Application granted granted Critical
Publication of JP3600891B2 publication Critical patent/JP3600891B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、SINE法により動物の種を判別する方法に関する。より特に、SINEサブファミリーを用いた鯨目を含む哺乳動物の種判別の方法に関する。
【0002】
【従来の技術】
DNA配列決定及び分子クローニング技術の自動化は、生物のゲノムへのアクセスを劇的に拡大している。さらに、ゲノムのディジタル情報の洪水は、多数の生物学者をコンピューターを使用したバイオ・インフォマティックスティクに惹きつけている。ヒトゲノム計画の如き包括的な努力の結果は、核酸再生試験により30年程前に明らかにされたものを極めて詳細に示した。すなわち、真核生物のゲノムの大部分は、特定のタンパク質産物をコードしておらず、明らかな機能をもたない反復要素から構成されている (Kazazian et al., 1998)。ゲノム解析の結果として、たんぱく質をコードしていない、いわゆる「ジャンクヤード」は、DNAタイプの転移因子やRNA性の転移因子などの活動的な要素で満ちたダイナミックな分子の「ジャングル」として新たに認識されている。レトロポゾンは、系統学の再構築及び集団分析のための分類学のツールとして利用されることができると考えられつつある興味深い遍在性の反復配列であり、上記RNA性の転移因子の一員である(Brosius, 1991; Shedlock and Okada, 2000)。これゆえ、レトロポゾンによる診断は、個体レベルあるいは種レベルにおける進化生物学の関連亜分野の間の重要な橋渡しをする。
【0003】
用語「レトロポジション」とは、上記要素が、RNA中間体によりゲノム内の親遺伝子座と標的遺伝子座の間でどのように移動するかをいう (Rogers, 1983)。このコピー・アンド・ペースト過程は、RNAから染色体DNAへの遺伝情報の逆流を作り出す (Weiner, et al., 1986, Schmid, 1996)。それは親遺伝子座に元のコピーを残さないような様式、則ちカット・アンド・ペースト様式で、染色体の周辺をジャンプするDNAタイプのトランスポゾン、例えば、mariner及びPエレメントとは異なる (Clark and Kidwell, 1997; Hartl et al, 1997)。レトロポゾンを分類するために使用される重要な特徴は、自己増幅のために不可欠な酵素である逆転写酵素(RTase)をコードしているか否かである (Okada, 1991; Eickbush, 1994)。自己増幅しないレトロポゾンンの中で、短い散在性の要素(short interspersed elements, SINEs)は、ゲノム内に多数存在するので、真核生物の分類学の研究のためには極めて有用であると考えられる。SINEは、サイズが70〜500bpの範囲にあり、そして2つのカテゴリー、tRNA由来のものと7SLRNA由来のものに分類される。7SLRNA由来のSINEは、2つのSINEファミリー、すなわち、霊長類のAluファミリーとげっ歯類のB1ファミリーだけを含む。それ以外のこれまで調べられた他のSINEの全てがtRNA由来であることが示されている。増幅のためのRTaseをコードするLINEも、2つのカテゴリーに分類される。すなわち、増幅のための特定の配列を必要とせずに単純なポリA配列のみを逆転写のために必要とする哺乳動物のL1、と増幅のためにRTaseに認識されるべく3’末端に厳格な配列モチーフを必要とする、ほとんどのLINEを含むの他のカテゴリーである。ほとんどの非哺乳動物のSINEとLINEは、同一の3’末端尾配列を共有し、その存在により、SINEは、LINEによりコードされるRTaseにより増幅されることができる (Ohshima et al, 1997; Okada et al, 1997; Terai et al., 1998)。哺乳動物の場合、tRNAと7SLRNA由来のものを含むSINEは、哺乳動物のL1によりコードされるRTaseの助けを借りて増幅されるようである。それゆえ、この場合、上記の保存された配列モチーフは、SINEの3’末端尾には観察されない。SINEのレトロポジションに関する一般ダイアグラムを図1に示す。
【0004】
レトロポジションが一方向性に常に生じると云う事実とSINEの10以上のコピーが宿主ゲノムの全体にわたって散在するという事実は、SINE挿入分析が分子分類学への強力な新規アプローチであることを際立たせている。このSINE挿入分析は、キャラクター・データをもつ他の形態の、最も顕著にはDNA配列及び形態学の分析を補う (例えば、Murata et al, 1993, Shimamura et al., 1997, Takahashi et al, 1998; Nikaido et al, 1999)。分類学のツールとしてのSINE進化とそれらの重要性に関する論文は入手できる (Weiner et al, 1996, Deininger and Batzer, 1993, Schmid, 1996, Rokas and Holland, 2000; Shedlock and Okada, 2000, Shedlock et al. 2000)。
【0005】
ところで、鯨類を含む動物種の判別においては、PCRでミトコンドリア遺伝子の或る特定の領域を増幅した後、それらをアガロース・ゲルで電気泳動して増幅を確認し、その後シークエンス法を用いて塩基配列を決定して、その配列の違いを指標にして種判別がなされてきた。シークエンス法実験設備は高額であるため、それらの解析は現在ほとんど専門会社により行われている。したがって、膨大な数の個体数についての種を判別するためには、その解析数も当然に膨大となり、そのコストは多大なものとなる。さらに、塩基配列の解析は、以下に述べるように未だ不十分・不確実な面もあり、それらの解釈もしばしば問題視されている。
【0006】
【発明が解決しようとする課題】
したがって、塩基配列の解析を用いずに、簡易・迅速・安価に、鯨類を含む動物種を判別するための検定方法の必要性が未だ存在する。
【0007】
【課題を解決するための手段】
今般、本願発明者は、SINEが、上述のように系統学・分類学の研究に利用できるだけでなく、鯨類を含む動物の種判別のための簡易・迅速・安価な検定方法に利用できることを発見した。そして広範囲にわたる試料について鋭意実験を重ねた結果その確実性を証明して本願発明を完成するに至った。すなわち、以下に詳細に述べるように、SINEの挿入が共通にあれば、それらの共通に挿入のある種どうしが互いに単系統であるということを系統学的に明らかにできるわけであるが、それらのSINEファミリー又はサブファミリーの挿入が、ある特定の種内に特有であれば、その挿入の有無が種判別に利用できることがわかる。このような種に特有のSINEサブファミリー配列の単離・同定方法も本願発明の範囲内にある。
従来SINEファミリーを使った系統樹作成はなされて来たが、それはSINEファミリーを用いてサブファミリーとして分類する事なく行なわれて来た。種の同定を可能にするSINEは、最近に増幅を行ったSINEでなくては行う事が出来ないので、最近に増幅したサブファミリーを特異的に単離する必要が有る。本方法はその方法を提出するものである。
【0008】
本願発明の1の態様においては、SINE法により動物の種を判別する方法であって、以下のステップ:
判別しようとする1以上の動物種からそれぞれゲノムDNAライブラリーを作成し;
上記各ライブラリーから、上記動物種の中の少なくとも1種においてSINEファミリー又はサブファミリーが特異的に挿入されているオルソロガス遺伝子座を含むクローンをそれぞれ単離し;
上記遺伝子座において上記SINEファミリー又はサブファミリーの両側に位置するフランキング配列にアニールするPCRプライマーのセットを用いて、上記動物種のそれぞれについて上記遺伝子座の配列をPCRにより増幅し;そして得られたPCR産物をゲル電気泳動して、上記SINEファミリー又はサブファミリー挿入遺伝子座の存在を示すバンドの有無により、上記動物の種を判別する;
を含む、前記方法が提供される。
前記SINEファミリー又はサブファミリーは、配列番号3〜7から成る群から選ばれる配列を有するDNA又は上記DNAとストリンジェント条件下でハイブリダイズするSINE DNAであることができる。例えば、前記SINEサブファミリーは、配列番号6に示すCD配列又は配列番号7に示すCDO配列を有するDNAである。
【0009】
本願発明の他の態様においては、配列番号3〜7から成る群から選ばれる配列を有するSINEファミリー又はサブファミリーDNA又は上記DNAとストリンジェント条件下でハイブリダイズするSINE DNAが提供される。
前記オルソロガス遺伝子座が、配列番号8〜21のいずれか1に示す配列に相当するBando1であるか、配列番号22〜35のいずれか1に示す配列に相当するSp316であるか、配列番号36〜46のいずれか1に示す配列に相当するMago19であるか、配列番号47〜51のいずれか1に示す配列に相当するIshi14であるか、配列番号52〜65のいずれか1に示す配列に相当するIshi36であるか、配列番号66〜79のいずれか1に示す配列に相当するIshi38であるか、配列番号211〜224のいずれか1に示す配列に相当するMago24であるか、配列番号225〜238のいずれか1に示す配列に相当するMago26であるか、配列番号80〜93のいずれか1に示す配列に相当するMago32であるか、配列番号94〜98のいずれか1に示す配列に相当するMago8であるか、配列番号99〜112のいずれか1に示す配列に相当するMago13であるか、配列番号113〜117のいずれか1に示す配列に相当するMago21であるか、配列番号239〜252のいずれか1に示す配列に相当するMago22であるか、配列番号118〜129のいずれか1に示す配列に相当するSperm8であるか、配列番号130〜135のいずれか1に示す配列に相当するSperm28であるか、配列番号136〜140のいずれか1に示す配列に相当するSperm47であるか、配列番号141〜145のいずれか1に示す配列に相当するAmz13であるか、配列番号146〜151のいずれか1に示す配列に相当するAmz11であるか、配列番号152〜156のいずれか1に示す配列に相当するTuti24であるか、配列番号157〜171のいずれか1に示す配列に相当するTuti35であるか、配列番号172〜185のいずれか1に示す配列に相当するSp2であるか、配列番号186〜190のいずれか1に示す配列に相当するSp9であるか、配列番号191〜204のいずれか1に示す配列に相当するHump20であるか、又は配列番号205〜210のいずれか1に示す配列に相当するHump203であることができる。
【0010】
本願発明の他の態様においては、配列番号8〜238のいずれか1に示す配列を有するDNA又は上記DNAとストリンジェント条件下でハイブリダイズするオルソロガスDNAが提供される。
前記PCRプライマーは、配列番号276〜325から成る群から選ばれることができる。前記動物が哺乳動物であることができる。かかる哺乳動物は鯨偶蹄目に属することができる。
【0011】
本願発明の他の態様においては、SINEサブファミリーのコンセンサス配列の獲得方法であって、以下のステップ:
インビトロにおける全ゲノム転写又は60kbpより大きなゲノムDNAの自動配列決定により反復単位の多数コピーの配列を決定し;
数種由来の上記配列をアラインメントして、コンセンサス配列を得;
RNAポリメラーゼIIIのための第2プロモーターのコンセンサス配列を見つけて、この配列を含むステム・ループ構造を作り;
上記ステム領域から5’上流方向にある5塩基を1ユニットとして、3’−PyPyPuPuPu−5’配列であることを確かめ;
tRNA構造のアンチコドン−ステム領域を形成する次の5塩基を、他のユニットとみなし;
tRNA構造のアンチコドン−ループ領域を形成する次の7塩基を、さらに他のユニットとみなし、ここで、その3’末端がAA残基であり、かつ、5’末端が3’−TC−5’残基であることを確認し;
次の5塩基を他のユニットとみなし、アンチコドン−ステム領域に割り当てられた5塩基との塩基対の形成を確認し、ここで、このユニットを正確に整列させるために上記アンチコドン−ステムの3’側の第1塩基の位置に欠失を配置し;
このtRNA様構造のD領域のためのステム・ループ構造を構築し、ここで、上記RNAポリメラーゼIIIの第1プロモーター領域内の2つのGの存在を確認し;
上記配列とtRNAの間の配列類似性を、DNAデータベースを用いて検索して、その二次構造の類似性を確認し;
複数の種由来の上記のようにして得られたSINEファミリー配列をアランメントして、特徴的なヌクレオチド又は欠失の存在からSINEサブファミリーを得;そして
上記SINEサブファミリーのアラインメントからSINEサブファミリーのコンセンサス配列を得る、
前記方法が提供される。
【0012】
前記SINEサブファミリーは、上記のSINEサブファミリーのコンセンサス配列の獲得方法により得られたSINEサブファミリーのコンセンサス配列を有するDNAであることができる。
本願発明の他の態様においては、上記のSINEサブファミリーのコンセンサス配列の獲得方法により得られたSINEサブファミリーのコンセンサス配列を有するDNAが提供される。
【0013】
定義
本願明細書中、「SINE」とは、その1次構造上の長さは約100〜400塩基である短い散在性の反復配列であって、その5’末端から順にtRNA相同領域、tRNA非相同領域、ATに富む領域を含むものをいう。その両端にはSINEがゲノム内に挿入される際にできると考えられている約5〜20塩基の同方向の繰返し配列(direct repeats)が存在することを特徴とする。
本願明細書中、「SINEファミリー」とは、同一のtRNAに由来する、お互いに配列の似通ったSINEのメンバーをいう。
一方、本願明細書中、「SINEサブファミリー」とは、同じ起源(ファミリー)に由来するが、特徴的(diagnostic)な変異が見られるため、SINEファミリーの中の同じ祖先メンバーから増幅したようSINE群のメンバーをいう。サブファミリーはタイプとも互換使用される。
本願明細書中、オルソロガス遺伝子座とは、二つの遺伝子座がある共通祖先からの種分化に由来することをいう。一方,種分化ではなく遺伝子重複によって二つの遺伝子が生じたとき、それらは「パラロガス」である。分子系統樹の推定にとって必要な情報を与えるのは、パラロガス遺伝子ではなく、オルソロガス遺伝子である。
【0014】
本願明細書中、「フランキング配列」とは、オルソロガス遺伝子座内に特異的にSINEファミリー又はサブファミリーが挿入された場合、その挿入部位の両側に位置する配列をいう。かかるフランキング配列内でPCRプライマーを任意に設計することができる。
本明細書中、ストリンジェント条件とは、鋳型DNAを、ハイブリバックに入れ、そこにプレハイブリ溶液(6 X SSC, 1 % SDS ) を適当量加え、ハイブリバックをシーラーでパックし1時間以上インキュベートし、溶液を捨て、ハイブリ溶液(6 X SSC, 1 % SDS, 1 X Denhart’s solution , Carrier DNA (Shared Herring Sperm DNA solution)を加えた後、さらに予め調整したプローブを95 ℃で3分間熱変性しておいたものを加え、またハイブリバックをシールし、その後42 ℃のウォーターバスで一晩(〜15時間程度)インキュベートし、それらのメンブレンを適当量のウォッシュ溶液(2X SSC, 1 % SDS)で軽く濯いだとき、プローブが上記鋳型DNAとハイブリダイズするような条件をいう。
【0015】
本願明細書中、「外群比較」とは、系統推定論において,外群 (outgroup),すなわち対象生物群すなわち内群 (ingroup)に対して最も近縁であると仮定される種または種群に基づく形質極性の決定法をいう。外群を解析に含めることにより、内群根(内群系統樹全体の共通祖先)の位置を決めることができる。分岐分類学の初期の理論では、まず初めに外群のもつ形質状態に基づいて内群の形質状態の極性すなわち原始的形質状態と派生的形質状態の判定を行い、次に、あらかじめ判定された形質の極性に基づいて,派生的形質状態を共有する種を単系統群としてまとめる。外群比較は、とりわけ形態形質の極性を判別する主たる方法として広く用いられる。その論理的根拠は最節約原理とよばれるもので、内群根に連なる枝での仮想的形質状態(内群での極性判別の基準)を外群の形質分布から最節約的に推定しているからである。Maddison, Donoghue & Maddison(1984)とSwofford & Maddison(1987)は、外群比較に基づく内群の系統推定が、内群と外群をあわせた群に対する極性判定を行わない最節約的な系統推定と論理的に等価であることを証明した。
したがって,特に制限酵素の切断部位や核酸の塩基配列など極性判定が困難な分子データからも分岐分類学に基づく最節約系統推定が可能になった。
【0016】
本願明細書中、「共有派生形質」とは、外群比較などを用いて極性の推定をした結果、派生的と判定された形質状態 (apomorphy)を共有することをいう。分岐分類学の理論では共有派生形質だけが系統関係を推定する情報を与えると主張される。推定された派生形質を共有する種群を生んだ直接共通祖先を仮定できるからである。したがって、共有派生形質は単系統群(正確には完系統群)を構築する手掛かりとなる。ここで,もしも形質分布に不整合が生じたときには,いくつかの形質の派生的形質状態は,ある共通祖先からではなく別々の枝で進化したホモプラシーであると考えなければならない。共有派生形質という仮説の妥当性は,最節約原理に基づいて選択された系統仮説,すなわち分岐図との整合性によって検証される。
【0017】
本願明細書中、「極性」とは、ある形質の形質状態間の遷移順序の進化方向という。したがって、極性は遷移順序(order)のモデルに依存する。形質状態の遷移順序は、系統推定に用いる形質データの形質を反映する。質的な形態形質では直線状または分岐状の遷移順序を仮定できることもまれではない。一方、核酸塩基配列や制限酵素切断サイトなどの分子データの多くは、形質状態の間に順序付けができない無順序的(unordered)な形質である。分岐分類学や進化分類学では、系統解析に先立って形質進化の極性推定を要求している。極性を推定する規準としては、外群比較あるいは化石記録や個体発生の情報などが利用されているが、もっとも広く用いられているのは外群比較である。
【0018】
SINEの進化
系統推定及び本願発明に係る単離・同定方法並びに種判別方法に、SINEを有効に利用する為には、SINEがどのように進化してきたかを理解することが重要である。SINEは、以下詳細に記載するように、配列類似性に基づくファミリーと特徴的なヌクレオチド存在及び/又は欠失に基づくサブファミリーとに分類されることができる。一旦ゲノム内に挿入されたSINEがどのような運命を辿るかは、染色体環境中の様々な要因(Schmit and Maraia 1992)とSINEに蓄積する増幅を妨げるような突然変異とのバランスによって決定される。さらに、SINEの増幅の為にはLINEにコードされたRTaseが必要であるので、LINEがゲノム中で増幅能力を失い死んでしまえば、それはその生物中でのSINEの死も同時に意味するところとなる (Okada et al., 1997)。
【0019】
ゲノム内でSINEが進化過程でどのように増幅するかに関しては、これまでにSINE進化の2つの対立モデル:マスター遺伝子モデルと多数源遺伝子モデルが提唱されて来た。マスター遺伝子モデル(図2(A))は、1又は数個の「マスター」遺伝子座だけが、全ての子孫コピーの元であり、この子孫コピーはそれら自身の上で複製する能力はもたない、というものである。このシナリオにおいては、時間の経過にわたるその増幅率は、そのマスター遺伝子の条件及び活性に完全に依存する。一方、多数源遺伝子モデル(図2(B))では、子孫も親コピーと同様の増幅する能力を持つ事が出来るので、進化の時間の経過にわたり「多数源遺伝子」として機能する、というものである。後者モデルにおいては、増幅率は、源遺伝子の全てに由来する合計コピー数の増加又は減少率の関数である。マスター遺伝子モデルはげっ歯類のID SINE (Kim et al, 1994)及びヒトAlu反復の初期の研究 (Shen et al., 1991) からの経験的証拠により提唱された。しかし、その後の詳細なAlu配列の研究や他の様々な分類群からの比較研究により、今では大部分のSINEファミリーの増幅は、上記多数源遺伝子モデルにより起こると解釈することが最も妥当であると考えられている(Matera et al, 1990; Schmid and Maraia, 1992; Leeflang et al, 1992; Kido et al., 1994; Takasaki et al. 1994; Shedlock and Okada, 2000)。実際には、特徴的なヌクレオチドの存在及び/又は欠失を特徴とするサブファミリーが、それぞれの源遺伝子を表すことになる。
【0020】
SINEの誕生と死の間の期間が、宿主ゲノム内のSINEの活動の期間であり、その寿命が分類学の及び本願発明におけるツールとしてのそれらの使用に直接関連する。SINEサブファミリーのメンバー間の平均配列相違度が小さい場合、そのサブファミリーはかなり若く、かつ、その宿主内で未だ活動的に増幅していると推定することが妥当である。そのSINEサブファミリーのメンバー間の平均配列相違度が大きい場合、そのサブファミリーは比較的古く、かつ、その宿主内で既に不活性又は死んでいると推定することが妥当である。しかしながら、SINE挿入を用いた宿主分類群間の共通先祖の診断は、与えられたサブファミリーの活動寿命内でのみ可能である。このSINE法の基本原理を、以下の「手順」欄でさらに説明する。
【0021】
SINE挿入動態及び特徴理論
SINEがなぜ強力な分類学のツールであるかということの鍵は、それらが宿主ゲノム内に不可逆的に独立して挿入されるということである (Murata et al, 1993; Shedlock and Okada 2000)。ゲノムからSINEを特異的に除去する既知のメカニズムは存在せず、かつ、2つの要素が全く同じ遺伝子座内に挿入され又は同一遺伝子座内から正確に切除される確率は極めて低いので、本願発明者は、2つの異なる分類群内の同一遺伝子座のSINEの存在を、そのゲノムにおける極性化された派生表現型であるとみなすことができる。これは系統発生仮説を構築するために、共有派生形質、又は共有された派生した特性だけを使用するHennig (1966)の方法の厳格な意味において、1の分岐群又は単系統群を定める。この分岐群においては、既知の先祖条件、又は与えられた遺伝子座におけるSINE挿入の欠如が、周知の人工物を作り出す競合方法を介して特性極性を確立する必要とせずに外群を一義的に定める(Hendy and Penny, 1989)(図3参照)。
【0022】
SINEの単離及び特徴付け方法
以下、ゲノム・ライブラリーから新規SINEを単離するための戦略、そのスクリーニング方法、クローンの配列決定及びSINEのファミリーからサブファミリーへの特徴付け、代表的な宿主分類群におけるコピー数の定量、並びに系統発生学的な情報を提供するSINE挿入パターンの決定的な診断について説明する。
【0023】
手順
ゲノム・ライブラリーを作成するための種の選択方法
SINE法は、以下の基本ステップ:1)選択された種からのゲノム・ライブラリーの作成;2)SINE遺伝子座を含むクローンの単離;3)クローンのDNA配列の決定;4)そのSINE遺伝子座のフランキング配列内でのポリメラーゼ・チェイン・リアクション(PCR)プライマーの設計;及び5)着目の関連種間のSINEの存在又は非存在のPCR診断、を含む。SINE法は一旦確立することができれば迅速・確実に確定的な結果を提供することができるけれども、その手順及び条件の確立及び立にはかなりの時間及び労力を要する。
【0024】
例えば、密接に関連する種A,B,C,及びDの間の系統発生関係を決定する場合を考える。上記種の実際の系統樹を図4(A)に示す。この場合、種Dが、それからSINEを単離するための宿主として選ばれた場合、系統発生の情報を提供するSINE遺伝子座は得られない。なぜなら、種Dは、着目の4つの分類群の共通先祖内及びさらに古い起源内に挿入されたSINE遺伝子座を含むからである。4種の全ての先祖内に挿入された遺伝子座を図4(B)中SINE3として示す。SINE3の挿入の存在(+)又は非存在(−)を示すPCRの電気泳動ゲルのパターンを図4(C)の下段に示す。系統発生の情報を提供するSINEを単離するためには、図4(B)中に示す3つのSINE遺伝子座、SINE1、SINE2、及びSINE3を提供することができる種A又は種Bを選ばなければならない。これらの遺伝子座のそれぞれが、これらの種の進化の歴史において共通の先祖を共有する分岐群、又は単系統群を定める。
【0025】
特定の種からの新規SINEファミリーの単離方法
特定の種、例えば、図4(A)中の種AにおいてSINEファミリーが全く知られていないとき、そのゲノムからSINEファミリーを新たに単離し分析することが必要である。選択された種から新規SINEファミリーを単離することができる2つの方法がある。1は、インビトロにおける全ゲノムDNA転写 (Endoh and Okada, 1986)を含み、そして他は、新たな高処理量自動DNA配列決定法により容易化された約60Kbp以上のゲノムDNA配列決定(Nikaido and Okada, 公表に至らず)を含む。
【0026】
インビトロにおける全ゲノムDNA転写
ほとんどのSINEは、tRNA由来であることが知られている、それゆえ、SINEは、RNAポリメラーゼIIIのための内部プロモーターをもっている。SINEはインビボにおいては極めて稀に転写されるけれども、SINEはインビトロにおいては裸DNAから容易に転写されることができる。放射標識された前駆体ヌクレオチド、例えば、アルファP32−GTPを用いたHeLa細胞抽出物中である種の全ゲノムDNAを転写するとき、通常、放射標識されたRNAが転写される。いくつかの場合、これらの放射標識転写産物は、それらがゲル電気泳動に供されるときクリアなバンドを形成する(Endoh and Okada. 1986; Matsumoto et al. 1986)。
【0027】
この放射標識されたRNAは着目の選択された種からのゲノム・ライブラリーをスクリーニングするためのプローブとして使用されることができる。この転写産物がゲル内でクリアなバンドを形成する場合、それは実際のSINEファミリーを表している。なぜなら、与えられたSINEファミリーの各遺伝子座からの同一転写産物の全てが集合して区別されるバンドを形成するからである。ゲノムDNAから不明瞭なバンドが生じた場合でさえ、スクリーニングのためのプローブとしてそれらを用いることができる。しかしながら、後者の場合には、その転写産物は多数のSINEファミリーを表している可能性がある。
【0028】
本願発明者のこれまでの経験から、脊椎動物及び/又は無脊椎動物のゲノム中に10,000以上のコピー数のSINEが存在するとき、それらは全ゲノムDNAのインビトロ転写産物により検出されることができる。図4は、選択された動物種由来の全ゲノムDNAからの転写産物のいくつかのパターン例を示す(Endoh and Okada, 1986)。
【0029】
自動シーケンサーによる60kbpより大きなゲノムDNAの配列決定
本願発明者の経験によれば、ゲノム内のSINEファミリーのコピー数は通常10,000を超える。全ゲノムが長さ3x10bpであり、かつ、あるSINEのサイズが300bpであると仮定すると、このようなSINEファミリーはそのゲノムの0.1%を占めることになる(例えば、300x10=3x10)。したがって、60kbp以上にわたり配列決定することによりこの種のランダムに単離されたDNA断片内に2つの独立したSINE配列を見つけることができるであろう(例えば、600x100/0.1=6x10)。
【0030】
これは、高処理量自動DNAシーケンサーの最新モデルへのアクセスにより実験室において簡単に達成できるようになってきた。例えば、新規SINEファミリーが最近ゾウのゲノムから特徴づけされ、そしてこの新規SINEがAfrotheriaの全ての種間に分布していることが示された (Nikaido and Okada,未発表)。この方法は、全ての哺乳動物及びおそらくほとんどの脊椎動物のゲノムに適用されることができる。
【0031】
SINEファミリーを正確に同定し、そしてそのtRNA構造を演繹する方法
上記の方法に従って反復単位の多数コピーの配列を決定した後、それらを整列させ、そして反復ファミリーのコンセンサス配列を演繹することができる。SINE要素以外にもゲノム内には多くの反復配列が存在するので、その配列を適切に診断することが不可欠である。ほとんどのSINEはtRNA由来であることが知られているので、それらはRNAポリメラーゼIIIのためのプロモーターを含む。RNAポリメラーゼIIIプロモーターは保存された配列ブロックであり、そのゲノム内で互いに分離された第1プロモーターと第2プロモーターの特性を有する。この第2プロモーターは高く保存されており、そして経験的に容易に認識されることができる。
【0032】
以下、CHR−2 SINEの例を考える。これらの要素のtRNA様構造を以下のように確立することができる(図6参照):
1.まず、CHR−2のいくつかの配列の整列からCHR−2 SINEのコンセンサス配列を構築する(図8参照)。
2.目視により、RNAポリメラーゼIIIのための第2プロモーターのコンセンサス配列を検索する。この配列は5’−GT(又はA)TCG(又はA)−3’である。このプロモーターをスクリーニングするとき、このモチーフに対する例外は存在しない。このモチーフが存在するとき、この第2プロモーター配列を含むステム・ループ構造を作る。ループ内の塩基の数は7であり、そしてステム内の塩基対の数は5である。ステム領域内の塩基の全てが塩基対を形成しない場合でさえも、図6(A)に示すように、tRNA内の適当な位置にそれらの塩基を配置する。
【0033】
3.上記ステム領域から5’上流方向にある5塩基を1のユニットを考える。なぜなら、原形質クラスItRNAにおいては、この余分ループ領域は5塩基から成るからである。CHR−2 SINEの場合、5塩基のこのユニットの配列は3’−CAGGG−5’である。3’−PyPyPuPuPu−5’配列がいくつかのtRNAにおけるこの余分ループに典型的であり(Sprinzl et al. 19 87)、そしてこれにより、上記SINEのtRNA起源を演繹することができる(図6(B)参照)。
4.tRNA構造のアミノアシル−ステム領域を形成する次の5塩基を、他のユニットとみなす。この場合、3’−GACGT−5’である(図6(C)参照)。
5.tRNA構造のアンチコドン−ループ領域を形成する次の7塩基を、さらに他のユニットとみなす。この場合、3’−AACCGTC−5’である。その3’末端におけるAA残基5’末端における3’−TC−5’残基はこのSINEのtRNA起源の良い指標である。なぜなら、これらの塩基はほとんどのtRNAにおいて高く保存されているからである(Galli et al.,1981)。これはさらにこのSINEのtRNA起源を支持する(図6(D)参照)。
6.通常、次の5塩基は他のユニットとみなし、そしてそれらはアンチコドン−ステム領域(図6(C))に割り当てられた5塩基と塩基対を形成するはずである。この場合、その配列は3’−CGTCT−5’であり、そしてその最初の4塩基だけが上記アンチコドン−ステム領域の相手とよくマッチする。このユニットを正確に整列させるためには、上記アンチコドン−ステムの3’側の第1塩基の位置に欠失を配置する(図6(E)参照)。
7.次に、このtRNA様構造のD領域のためのステム・ループ構造を構築する。このステムとループの塩基の数は通常それぞれ4と8であるが、特にSINEのtRNA様構造においては、1〜2塩基程変化することができる。明らかに、CHR−2次のいくつかの塩基対は意味のある二次構造を形成しない。この場合、その第1プロモーター領域に注目する。第1プロモーター領域における最も目立った特徴は、その領域内の2つのGの存在である。他の特徴はこのループ内の15位(tRNAのナンバリングシステムによる。以下同じ。)におけるGと14位におけるAである。この14位におけるAは5’側上そのループ内の最初の塩基である。それゆえ、これらの塩基を、このtRNA様構造のループの対応の位置に配置する(図6(F)参照)。図6(F)中の最初の塩基であるTはtRNA分子の全てにおいて高く保存されていることは周知である。
8.CHR−2 SINEのtRNA様構造は、図6(F)に示す配列を、このファミリーのための他の配列(図7(A))と併合することにより、演繹することができる。
9.次に、GenBank DNAデータベース中のBLASTNプログラムを用いて(Altschul et al. 1990)、CHR−2 SINEと実際のtRNAの間の類似性について検索する。この例では、tRNA GluがCHR−2の配列に最も類似する。図7(B)はヒトtRNA Gluの二次構造を示す。
【0034】
SINEファミリーをサブファミリーに特徴付ける方法
あるSINEファミリーが系統発生において種Aのゲノム内に特徴付けられ、かつ、このSINEファミリーが進化の間に最初に生成された時が知られていないと仮定する。さらに、このSINEファミリーが図9中の分岐群Yの全ての分類群の古い共通先祖において最初に生成されたと仮定する。この場合、種Aのゲノム内に存在するSINEのコピーは、図9のtの時に増幅された古いSINEと、uの時に増幅された若いSINEを含む。種Aのゲノム・ライブラリーをこのSINEファミリーのコンセンサス配列を用いてスクリーニングするとき、上記の古いSINEと新しいSINEの両者を単離することができる。種A,B,C,及びDの系統関係だけが求められているので、単離されたSINEの増幅事件の全ての時を調べるのは効率が悪い。むしろ、種Dの分岐付近の時に増幅され、かつ、図9中の分岐群Xを含む4つの分類群の全ての分岐にわたるSINE遺伝子座を単離するように試みるのがはるかに効率がよい。
【0035】
上述のように、SINEとLINEは多数源遺伝子モデルに従って増幅されると信じられている (Schmit and Maraia 1992; Smit et al. 1995)。ある源遺伝子が突然変異を受け、そして進化の間に首尾よく増幅された場合、この突然変異した源遺伝子はその対応のSINEファミリー内のサブファミリーとして認識されることができる (Britten et al. 1988; Jurka et al. 1995)。サブファミリーは進化のある段階において増幅される。それゆえ、あるサブファミリーが種A,B,C,及びDの共通先祖においてのみ増幅された場合、このサブファミリーのコピーは、これら4つの分岐群の系統発生関係を決定するために有効に使用されることができる。
【0036】
種AにおけるSINEファミリーのコンセンサス配列は、上記手順の一部として確立され、そしてそのSINE配列の5’末端における1のPCRプライマー及びその3’末端付近の保存領域における他のプライマーの設計を可能にする。このプライマー・セットにより増幅される配列はそのSINE配列の全体を包含する。このプライマー・セットは、種A由来のゲノムDNAを用いたPCRによるSINEの多くのコピーを増幅するために使用されることができる。この反応のPCR産物は適当なベクターDNA内でクローニングされ、そして配列決定されることができる。この時点で、そのPCR産物からのSINEの100コピーの配列決定は困難な仕事ではない。これらの配列を整列させることにより、このSINEファミリーのサブファミリーを表す特徴的なヌクレオチド又は可能な欠失を同定することができる(図10参照)。特徴的なヌクレオチドは、特定のサブファミリー内の3以上のヌクレオチド位置において協調的に変更されており、かつ、進化の間のSINE配列内でランンダムに蓄積した自然突然変異から区別されうるものとして定義される。特徴的なヌクレオチドの存在及びしばしば特異的な欠失に基づきサブファミリーを首尾よく特徴づけた後に初めて、ドット−ブロット・ハイブリダイゼーション又はPCRにより与えられたサブファミリーの分類学的分布を調べることができるようになる。
【0037】
CHR−2 SINEのサブファミリー
図8は、クジラ目(Cetaceans)、猪豚亜目(Hippopotamuses)、及び核脚亜目(Ruminants)のゲノム中に存在すると元々特徴づけられたCHR−2 SINEファミリー(Shimamura et al. 1997)のコピーのアラインメントを示す。CHR−2 SINEには6つのサブファミリーが存在することが容易に分かる。欠失の存在に因り、FL(完全長)、MDI(中央欠失I)、MDII(中央欠失II)、及び最短群を特徴付けした。次に、この最短群を、DT(欠失型)、CD(クジラ欠失型)、及びCDO(クジラ欠失歯クジラ特異的)のサブファミリーに分類することができる。図11は、これらサブファミリーのコンセンサス配列のアラインメント結果を示す。配列番号1は上位コンセンサス配列、配列番号2はFLコンセンサス配列、配列番号3はMDIコンサンサス配列、配列番号4はMDIIコンセンサス配列、配列番号は5DTコンセンサス配列、配列番号6はCDコンセンサス配列、そして配列番号7はCDOコンサンサス配列を表す。
【0038】
図12に、CD,CDO,及び他のサブファミリーに特異的なプローブを、それぞれ、用いたドット−ハイブリダイゼーション実験の結果を示す。この結果はCDサブファミリーがクジラ目(歯クジラ及び髭クジラ)のゲノムに特異的であり、そしてCDOサブファミリーが歯クジラのゲノムに特異的であることをはっきりと示している。それゆえ、CDサブファミリーに属するSINEは、クジラ目の、特に髭クジラの系統関係を推定するために有用であり、一方、CDOサブファミリーに属するSINEは、歯クジラの系統関係を推定するために有用である。CDOサブファミリーのコピーの分布は、哺乳動物の分類生物学において最も争いのある点の中の1つであったマッコウクジラを含む歯クジラ亜目の単系統性をも示唆する。
【0039】
フランキングSINE PCR
図9中に示す分岐群Xの共通先祖において生成されたサブファミリーに属する、種AからのSINE遺伝子座を単離し、そしてそれらの配列を決定した後、与えられた遺伝子座における挿入の存在又は非存在を診断するために、PCR実験を行うことができる。そのフランキング(隣接)配列を見て、プライマー配列を選択する。プライマーの設計に際しては、二次構造の折り畳みの形成に対して及び上流プライマーと下流プライマーの間のタンデム・アニーリンングに対して注意しなければならない。これは、商業的に又はインターネットを通して入手できるPCRプライマー設計を容易にするために書かれたさまざまな標準的なソフトウェア・プログラムを用いて容易にチェックすることができる。オリゴヌクレオチド・プライマーの溶融温度は55℃付近に設定する。それゆえ、PCRのためのアニーリング温度は、種B,C,及びDからのオルソロガスな遺伝子座の増幅を最適化するとき、この温度に基づかなければならない。ときに種B,C,及びDについてのプライマー結合領域内の突然変異の蓄積が、この反応の間の効率的なプライマー−鋳型アニーリングを阻害する。この場合、アニーリング温度は、約45〜50℃まで低下されなければならない。PCR産物が最初のプライマーを用いたPCRにより増幅されない場合、PCRの効率を低下させるかもしれない潜在的な人工物に関してさらに注意して、新たなPCRプライマーを設計すべきである。図13にフランキングSINE PCRの原理を模式的に示す。
【0040】
図14は、PCR結果の1例を示す。また、2つの異なるプローブを用いた同一フィルターを用いて行ったハイブリダイゼーション実験結果を同時に示す。図14(A)は、海イルカが単系統である証拠を提供するPCRパターンである。なぜなら、海イルカからのPCR産物は挿入された要素を含む予想断片サイズをもっており、一方、他の歯クジラからの断片はMago 19における挿入を欠く予想断片サイズをもつからである。図14(B)は、SINEプローブを使用したハイブリダイゼーション実験を示し、一方、図14(C)は、上記遺伝子座のフランキングDNAを使用したハイブリダイゼーション実験を示す。この後者の実験は、オルソロガスな遺伝子座が、それから上記遺伝子座が元々単離されかつ特徴付けられたところのマゴンドウ以外の種においてPCRにより忠実に増幅されたことを証明するために行われた。
【0041】
PCRデータの解釈
比較的最近分岐した種を調べる場合、オルソロガスなSINE遺伝子座におけるフランンキング配列は忠実に保存され、そして典型的には、PCR診断を阻害する問題を引き起こさない。しかしながら、比較的古く分岐した分類群を調べる場には、PCRはより頻繁に失敗し、そして実験結果の解釈を困難にする。不成功のPCRにおいては、SINE−マイナス・データが現れる。すなわち、SINE挿入の非存在を示す与えられた遺伝子座における成功したPCR増幅がある。不成功のPCRは、失われたデータを表し、そして挿入の存在又は非存在のパターンをコードするSINEキャラクター・マトリックスの最節約分析を行うとき、そのまま(例えば、「?」)コードされる。
調べた独立した遺伝子座の間に矛盾した挿入パターンが存在するとき、先祖の多型性及びその後の不完全な系統分類が、あるはずである。
【0042】
哺乳類ゲノム中のSINEの分布
一般にほとんどの哺乳動物は大量のSINEをもっている。それらは、調べた種間のハイブリダイゼーション・パターン(例えば、図12中のCHR−2 SINEの分布)に基づき、明らかに目、亜目、上科、科、属、又は種に特異的である。このような経験的な証拠は、SINEファミリーが多くの先祖哺乳動物系統において新たに生成したことを示している。但し、その生成メカニズムは十分に理解されていない。哺乳動物のゲノム中にこのように多数のSINE又はレトロポゾンが存在する理由は、哺乳動物のL1によりコードされるRTaseが哺乳動物の共通先祖においてその鋳型認識の特異性を変更したためであると思われる。これは、ステム−ループ構造の形成に責任を負う3’尾を厳格に認識する多くのLINE内に存在するレトロポジションのために要求されるポリA尾の認識を可能 (Ohshima et al. 1996; Okada et al. 1997; Kajikawa et al.)。このようなシナリオは、哺乳動物ゲノム内のL1 RTaseを介してポリA含有RNAが擬似遺伝子となることを可能にすることができたのであろう。
【0043】
図15は、最近提案された哺乳動物の系統樹を示す (Waddell et al. 1999; Cao et al. 2000; Nikaido et al. 2000)。現在まで特徴付けられた哺乳動物SINEファミリーを図15上に記す。簡単に言えば、全哺乳動物ゲノム中に分布する最も古いSINEファミリーはMIRである (Smit and Riggs 1995; Jurka et al. 1995)。Aluファミリーは明らかに霊長類ゲノムに特異的であるが、その近縁種、例えば、ヒヨケザル間のその分布は詳細に調べられていない。げっ歯類B1,B2,及びIDはげっ歯目のゲノムに特異的である。ウサギのCファミリーはウサギ目のゲノム内に報告されているが、その近縁種間の分布は報告されていない。鯨偶蹄目ゲノム内に存在するSINEファミリー、例えば、CHR−1,CHR−2,CHRS,CHRS−S,PRE−1,及びBov−tAは、詳細に調べられている (Shimamura et al. 1997; Shimamura et al. 1999; Nikaido et al. 1999)。CanSINEAはCanidaeゲノムから最初に報告されたが(Minnick et al. 1992; Coltman and Wright 1994)、多くの他の食肉目ゲノム内の進化の間に生じたことがその後示された (van der Vlugt and Lenstra 1995)。EREファミリーと命名されたウマSINEが報告され、そしてその分布が調べられた (Sakagami et al. 1994; Gallagher et al. 1999)。コウモリSINEファミリーがBorodulina and Kramerov (1999)により単離され、そしてVESと命名され、そして他のコウモリSINEファミリーも最近特徴付けられた (Kawai et al. )。ゾウSINEファミリーが最近単離され、Afrotheriaの種間に分布していることが示された (Nikaido and Okada)。ここで、由来するtRNAが異なっていたり、まったく違った配列であるSINEをfamilyとして区別し、同じ起源に由来するがdiagnosticな変異が見うけられるようなSINEをTypeまたはsubfamilyとして区別している。あるSINEはある時期に爆発的にそのコピー数を増やし、その爆発的増幅時期と生物全体の進化における時間軸がそれらの系統関係とSINEの分布との関連性につながっていると考えられる。
【0044】
重要なことは、哺乳動物ゲノム内に多くのSINEファミリーが今日まで単離されてきたけれども、それらは未だそのサブファミリー構造まで特徴付けられていないということである。したがって、本願発明に従って、今後、そのサブファミリー構造が明らかにされるであろうし、新たな哺乳動物SINEファミリー又はサブファミリーもさらに獲得されることができる。
【0045】
SINEの新しい増幅:固定及び短期間の種分岐
SINEがゲノムの進化においてひじょうに新しく増幅され、そして1の種の集団の間で固定されていない場合、共通派生形質としての地位は不安定であり、そしてそれは系統樹作成のために使用されるべきではない。しかしながら、このようなSINEの分布は、集団構造の分析のためには使用されることができる (例えば、Hamada et al. 1998)。種分岐が短期間に生じた場合、すなわち、大部分のSINEが遺伝的浮動を介して集団の間に固定される前には、先祖の多型性その後の不完全な系統分類は矛盾したSINE挿入パターンを作り出す。この現象は、SINEレトロポジションの不可逆な性質と結合して、爆発的に派生した分類群における系統分類の歴史的パターンを調べるためにSINEを使用するためのバイアスを提供する。先祖に多型性があり、その後不完全にSINEが子孫に分配され、矛盾する挿入パターンを作り出した場合には、系統樹作成法の一つである最節約法を用いて、各遺伝子座における挿入の存在又は非存在についてのSINEキャラクター・マトリックスを評価することが有用である。固定されていない、多形性SINEは、高レベルの系統関係のためには有用ではないけれども、それらは、集団分析のための優れた分類学的ツールとなることが知られている(Deininger and Batzer, 1994, Stoneking et al, 1997; Hamada et al, 1998)。したがって、本願明細書に記載する方法に従って、SINEファミリー又はサブファミリーを同定し、かつ、特徴付けすることにより、かかるSINEファミリー又はサブファミリーを利用して動物の種判別方法を行うことができる。
【0046】
フランキング配列の機能及び価値(有用性)
SINE挿入について調べられた遺伝子座内のヌクレオチド・フランキング配列の情報は有用である。もちろん挿入データは系統樹の作成及び本願発明に係る方法に使用するために有用であるけれども、フランキング配列との挿入配列の統合は、独立したSINE挿入事件により定められる分岐群間の枝の長さについての情報を提供する (Lum et al, 2000; Shedlock and Okada, 2000)。さらに、与えられた挿入要素と会合したフランキング配列は文字通り連結されているので、SINE由来のトポロジー対フランキング配列の間の一貫性は、各遺伝子座における不可逆挿入の基本的仮定の評価への数多くのアプローチを提供する (Lum et al, 2000)。独立したSINE遺伝子座にホモプラシー(成因的相同)、又は形質矛盾が存在する場合、系統発生樹の間には明らかに矛盾があるかもしれない。このようなアプローチはSINE分析の新たな次元として始まりつつあり、そしてSINE法の統計学的評価を高めるための基礎を提供する。
【0047】
【実施例】
以下、本発明を実施例により詳細に説明する。但し、以下の実施例により本発明の技術的範囲が限定されるものではない。
【0048】
材料及び方法
緩衝液、酵素類その他試薬
核酸の操作に用いる種々の緩衝液、酵素、大腸菌の培養に用いる培地、その他の試薬類は、和光純薬(株)、Sigma社、Difco社、FMC社より購入したものをSambrook et al. (1989)の文献を参考にして調整した。各種制限酵素、修飾酵素、ベクターDNAは、宝酒造(株)、東洋紡績(株)、アマシャムライフサイエンス社より購入した。ラジオアイソトープは、第一化学薬品(株)より購入した。PCRプライマーに関してはOligoExpress(アマシャムファルマシアバイオテク(株))に合成を委託注文したものを使用した。
【0049】
ゲノム DNA
本研究に使用した各種サンプル(組織もしくはDNA)について以下に示す。尚解析に用いた鯨、偶蹄類の英名、和名、学名等について以下の表1:
【表1】

Figure 0003600891
に示す。
フタコブラクダは東京大学医学部の吉田穣博士より提供された筋肉組織からDNAを抽出した。ブタについては当研究室に保管されていたDNAをそのまま用いた。ペッカリーは農水省畜産試験場の安江博博士より提供されたDNAを用いた。ジャワマメジカは米国サンディエゴ動物園から提供されたDNAを用いた。アクシスジカ、アミメキリン、セーブルアンテロープ、ニホンカモシカ、マーコール、ムフロン、カバに関しては千葉市立動物公園の宗近功氏より提供されたDNAを用いた。ヒツジは長野県上田食肉衛生検査場の向井康氏より提供された肝臓から抽出したものを使用した。ウシに関しては神奈川県食肉衛生試験場相模出張所より提供された腎臓からDNAを抽出して用いた。
【0050】
イッカク、オオギハクジラのサンプルについては、千葉県立中央博物館の宮正樹博士より筋肉と思われる組織片を入手しDNAを抽出して用いた。オオギハクジラのサンプルに関してはアカボウクジラ科オオギハクジラ属であることは判明しているが種名は不明である。カワイルカ類を除くその他のサンプルは、水産庁遠洋水産研究所大型鯨類研究室の加藤秀弘博士より提供された各種組織片からDNAを抽出して用いた。カワイルカ類のサンプルについては、アメリカ合衆国南西漁業科学センターのブラウネル博士(Dr. Robert L. Brownell, Jr.: Chief Marine Mammal Division, Southeast Fisheries Science Center, P.O. BOX 271, La Jolla, California 92038)により日本国への入手手続きを行ってもらった。それに基づいて、アマゾンカワイルカの皮下組織片、ラプラタカワイルカの肝臓組織片についてはカリフォルニア州立大学バークレー校のHealy H. Hamilton 氏より提供を受けDNAを抽出した。ガンジスカワイルカは乾燥骨サンプルを国立科学博物館の山田格氏より提供されDNAを抽出した。ヨウスコウカワイルカに関しては中国科学院水生生物研究所の付属水族館に飼育されている個体から鮮血を採取しその場でヘパリン処理したものを研究所へ搬送し即座にDNAを抽出した。抽出したDNAは、日本への持ち込みが不可能なため現在は中国の研究所において保管されている。
【0051】
ゲノム DNA の抽出
解析に用いた動物種の組織からのゲノムDNA抽出は、簡便法(Rapid法;ProteinaseKを用いる方法)で行った。抽出したゲノムDNAはライブラリーの作製及びPCRの鋳型として使用した。また、それらは4℃で保管している。−40℃のフリザーに保存しておいた鯨、偶蹄類の組織(肝臓、筋肉)をメスで数ミリ角に切り出し、マイクロチューブに移してから組織の重量を測った後、そのマイクロチューブに1X TNE buffer (10mM Tris−HCl(pH8.0),100mM NaCl, 1mM EDTA (pH 8.0))を500μl加えた。チューブ内の組織片をパスツールピペットを用いて細かく粉砕したらその、組織及びTNE bufferに1X Lysis buffer (20mg/ml Proteinase K,2% SDS, 10mM Tris−HCl(pH8.0), 150mM NaCl, 10mM EDTA (pH8.0)) を加え、転倒撹拌した後、55℃のウォーターバスを用いてインキュベートし組織片を完全に溶解させた。その溶液と等量のフェノールを加え、ベリーダンサー(200〜300rpm)で1〜2時間撹拌した。遠心分離後 (室温、12000rpm, 5min), 上清を別の2.0ml マイクロチューブに移した。同様にしてフェノール/クロロホルム抽出に続きクロロホルム抽出を繰り返し、最終的な上清に0.1倍量の3M 酢酸ナトリウム及び2倍量のエタノールを加えた。この際多くの場合ファイバーが確認され、その後70%エタノールを用いてリンスした後適当量のTE bufferを加えペレットを溶解させた。ヨウスコウカワイルカの血液サンプルからのDNAの抽出は市販のカラム(QIAamp Tissue/Blood Kit Cat. No.29306: キアゲン(株)社製)を用いて行った。
【0052】
フランキング PCR (主に相同遺伝子座の増幅に用いる)
フランキングPCRとはSINE配列を挟む様にその両側(上流及び下流)の近傍領域にプライマーを設計し、ゲノムDNAを鋳型としてPCRを行う事を意味している。その際に用いるプライマーは長さにしておよそ17〜30ヌクレオチドでTm(Melting Temperature)値はおおよそ55℃周辺になるように設計した。その設計に関しては、マッキントッシュ版フリーソフトとしてインターネット上でダウンロードが可能なCPrimer (Ver.1.08, Bristol and Anderson(1995))を使用した。
反応組成:Template DNA (100 〜 500 ng); 10 X PCR Buffer (100 mM Tris − HCl (pH8.3), 500 mM KCl, 15 mM MgCl 5 μl; dNTP Mixture (2.5 mM each) 4 μl; Forward and Reverse Primer (5 pmol/μl) 2 μl each; TaKaRa TaqTM (5 U/μl) 0.25 μl; adds ddHO up to final volume 50 μl。
反応条件: 94 ℃(Pre−denature) 2〜3 min.; and 30 cycles of 94 ℃ (Denature) 30 sec.; 45 ℃〜60 ℃(Annealing) 1 min; 72 ℃ (Extension) 30〜90 sec.。この際Annealingの温度はプライマーのTm値はもちろんのこと、その遺伝子座の増えやすさなどに応じて適宜変えていき最適な温度を探した。
【0053】
コロニー PCR
コロニーPCRはサブクローニングを行う時、目的のDNA断片がインサートとしてあるクローンに含まれているか否かを選別するのに大変簡便な方法である。従来はプラスミドDNAをMiniprepによって調整した後に、制限酵素で消化してそのインサートの有無を確認していたが、この行程をPCRによるチェックのみで済ませる事が可能となるので、時間と労力の大幅な短縮につながる。まずプレートに生えた大腸菌のコロニーを爪楊枝で軽くつつき0.5 ml PCR 用マイクロチューブに擦り付け、それを鋳型にして通常のPCRを20 μlの反応系にして行うだけである。この際用いるプライマーはベクターに特異的な配列に基づいて作製されている。PCR反応における熱変性の際に大腸菌の細胞膜が破壊され鋳型となるベクターDNAが溶液中に溶け出すことでこのPCRが可能になる。後で述べるがこのPCRによってインサートの有無を確認した後、このPCR産物を直接ABIシークエンサーを用いて配列決定の鋳型とすることが可能なので、インサートチェックの直後にそのインサートのシークエンスも可能なので時間的にもかなりの短縮になった。
【0054】
塩基配列の決定
塩基配列の決定には以下に示すシークエンサー及びシークエンス反応キットを使用した。LI−COR dNA Sequencer (Model 4000) を用いたシークエンス:SequiTherm EXCELL(商標)II Long−ReadTM DNA Sequence Kit−LC (Cat. No. SE7701LC, EPICENTRE TECHNOLOGIES社製);ABI PRIZM(商標) 310 Genetic Analyser を用いたシークエンス: BigDye Terminator Cycle Sequencing FS Ready Reaction Kit (P/N 4303152, Perkin Elmer社製)。
サブクローニングしたプラスミドDNAをシークエンス反応の鋳型に用いる場合は、 SDS−Alkaline and Mg沈殿法を用いて調整したものを使用した。
スクリーニングによって単離したSINE配列を含んだ遺伝子座の塩基配列を決定する場合はベクター配列上のM4及びRV、そしてSINEのコンセンサス配列に基づいて作製した蛍光の付加しているオリゴヌクレオチドプライマー(アロカ(株)社製)を用いた。
PCR産物をダイレクトシークエンスする場合は、PCR産物にShrimp Alkaline Phosphatase (SAP) 2U/μl 0.5μl; Exonuclease I 10U/μl 0.5 μl (共にアマシャムライフサイエンス社製)を直接加え、37 ℃で30 分インキュベートしてオリゴヌクレオチドを分解した後、85 ℃で15 分間インキュベートして酵素を失活させたものをシークエンス反応の鋳型として用いた。
【0055】
ゲノム・ライブラリーの作製
スクロース勾配
ゲノムDNA約50 μgを適当な制限酵素(本研究においては主にHind IIIを使用した)で完全消化し、フェノール/クロロホルム抽出、エタノール沈殿を行った後、200 μ l の TE buffer に溶解した。15 ml の超遠心分離用プラスチックチューブ (Centrifuge Tubes − 50 Ultra − Clear(商標)Tube 14 X 89 mm, Order No. 344059: BECKMAN 社製)に10−40 %スクロース勾配を作製し、この上にDNA 溶液を加え、ローターに取り付け、超遠心分離機(L8−70M, Serial No. 7C869: BECKMAN 社製)で遠心分離(25000 rpm., 15 ℃, 15 時間)した。遠心後、1.5 ml マイクロチューブに10〜15滴ずつ滴下して分画(約250〜400 μl/フラクション)した。その分画を0.7〜1 %アガロースゲル電気泳動し、約2〜4 kbpの断片を含むフラクションを挟むように4〜6本のフラクションチューブを選別しエタノール沈殿を行った後、適当量のTE bufferに溶解した。再び0.7〜1 %アガロース電気泳動を行い、ライブラリー作製に用いるフラクションを決定した。
【0056】
プラスミド・ライブラリーの構築
今回の実験においてはpUC18/HindIIIもしくはpUC19/HindIIIを使用したプラスミド・ライブラリーのみを用い、ファージライブラリーは作製しなかった。それは鯨、偶蹄類ゲノム中にはSINEのコピー数が十分量存在し、ファージライブラリーを使用しなくても十分量のポジティブクローンが得られる事が、当研究室での経験上わかっていたため、時間の節約を考えて比較的操作行程の少ないプラスミド・ライブラリーを活用した。プラスミド・ライブラリーの作製は以下の様にして行った。組成はTaKaRa Ligation Kit Ver.1 A液, 12 μl; 同 B液, 1.5 μl; Vector DNA (pUC18 or 19/HindIII〜100 ng/μl), 0.5 μl; Insert DNA (Genomic DNA Sucrose Density Gradient Fraction), 1.0 μl : 以上の溶液を0.5 mlチューブ中で混合した後、クールブロック上で16 ℃で30分以上放置した。このゲノム・ライブラリーは−20 ℃で保存している。
【0057】
SINE 配列を含むクローン単離までの流れ
図16にSINE法における実験の流れを示す。
スクリーニング
スクリーニングに使用するメンブレンの作製
0.5 mlチューブに前述のゲノム・ライブラリー混合液を1 μl、大腸菌( E.coli JM105株)のコンピテントセルを適当量加えて混合した後、氷上で30分間静置した。42〜45 ℃で 45 秒間ヒートショックした後、あらかじめ 37 ℃ でインキュベートしておいた L/amp/X−gal/IPTG プレートにプレーティングし、37 ℃インキュベーターに一晩放置した。プレート1枚当たりのコロニー数が200〜300個になるように調整し、プレート10〜20枚分のライブラリーをまいた。このプレート上に生えたコロニーをナイロンメンブレン(Colony/Plaque Screen(商標)NEF−978:NEN Research Products 社製)にトランスファーし、変性溶液(0.4 M NaOH, 0.6 M NaCl), 中和溶液(1 M NaCl, 0.5 M Tris−HCl (pH7.0)) の順に3分間程度放置した。そのメンブレンは水分を切った後よく乾燥させておいた。コロニーをトランスファーした後のプレートは37℃でインキュベートして再度コロニーが十分に生えた状態にしておき、後述のポジティブクローンのピックアップをしやすいようにした。
【0058】
スクリーニングに使用するプローブの作製
スクリーニングにはオリゴヌクレオチドもしくはPCR産物を使用した。実際に使用したオリゴヌクレオチド配列を以下の表2:
【表2】
Figure 0003600891
に示す。その作製方法はまず、オリゴヌクレオチドの場合:ddH2O 27〜37μl; Oligo Nucleotide (5 pmol/μl) 1 μl; 10 X T4 Polynucleotide Kinase Buffer 5 μl; T4 polynucleotide Kinase 2μl; [γ−32P]ATP 5〜15μlを0.5mlチューブに混合した後、37℃でインキュベートした。プローブとして用いたオリゴヌクレオチドの配列を上記表2に示す。PCR産物を用いる場合(Primer−Extension法): Template DNA, 500 μg; Forward primer (12.5 nmol/μl) 2 μl; Reverse primer (12.5 nmol/μl) 2 μl dDTP Mixture (dATP, dGTP, dTTP) 2.5 μl; 以上の混合液を95 ℃で5分間熱変性し、続いて55 ℃で1分間アニールさせた後氷上に移した。さらに以下の試薬を順に混合した後60 ℃で30分間インキュベートした。10XBcaBEST(商標)Buffer 2.5 μl; BcaBEST(商標)DNA polymerase 2 μl; [α− 32P] dCTP。反応後のそれぞれのプローブはNICK Column (Sephadex G−50 DNA Grade: アマシャムファルマシアバイオテク(株)社製)で溶出させて精製した。RIのカウントは液体シンチレーションカウンターで測定した。(簡易的測定にガイガーカウンターも使用した。)
【0059】
ハイブリダイゼーション
メンブレンをハイブリバックに入れ、そこにプレハイブリ溶液(6 X SSC, 1 % SDS ) を適当量加えた。ハイブリバックをシーラーでパックし1時間以上インキュベートした。溶液を捨て、ハイブリ溶液(6 X SSC, 1 % SDS, 1 X Denhart’s solution , Carrier DNA (Shared Herring Sperm DNA solution)を加えた後、さらに予め調整したプローブを95 ℃で3分間熱変性しておいたものを加え、またハイブリバックをシールした。その後42 ℃のウォーターバスで一晩(〜15時間程度)インキュベートした。それらのメンブレンを適当量のウォッシュ溶液(2X SSC, 1 % SDS)で軽くすすぎカウントを測定し確認してから、さらに新たなウォッシュ溶液を用いてウォーターバスの温度を55〜60 ℃に設定してウォッシュを行った。
【0060】
現像
ウォッシュ溶液を捨て新たなウォッシュ溶液で軽くすすいだ後、カウントを、ガイガーカウンターを用いて確認した。暗室内で台紙、メンブレン、X線フィルム、Intensifierの順にカセットを入れ、これを−80 ℃のフリザーに入れて感光させた。暗室内でカセットからX線フィルムを取り出し、現像液、停止液、定着液の順にX線フィルムを入れて現像した。
【0061】
Positive Clone の単離
現像したX線フィルムとライブラリーをまいたプレートを重ね合わせる様にしてそのポジティブクローンの位置を確認した。そのポジティブクローンだと思われるコロニーについてはMiniprepを行う前に、そのクローン中におけるSINE配列の有無の確認のためにベクターの配列ではなく、スクリーニングに用いたSINE配列のコンセンサス配列に基づいて作製したプライマーを用いてコロニーPCRを行った。その後、ポジティブクローンのプラスミドを調製し、LI−CORシークエンサーを用いてその近傍領域の配列決定を行った。その後の操作に関しては上述の通りであるので、以下、簡単に述べる。
【0062】
まず、そのフランキング配列を基にしてプライマーを作製し、種々の生物のゲノムDNAを鋳型にしてフランキングPCRを行った。そして多くの場合、スクリーニングに用いた生物種の近縁種に関しては相同遺伝子座を簡単に増幅させることが可能であるが、それとは遠縁のグループもしくは分岐が古い時代に起こったと考えられる種の相同遺伝子座については、その近傍領域における塩基置換がより多く蓄積しているのでスクリーニングに用いた1種の配列に基づいたプライマーではアニールがうまくいかず、最初のフランキングPCRでは増幅できない場合もしばしば見られた。その際には増幅した様々な種の相同遺伝子座の塩基配列を決定してそれらのコンセンサスをとりそれを考慮してまた新たなフランキングプライマーを作製し再度PCRを行った。
【0063】
鯨・偶蹄目間の系統関係の推定の際にはアガロース・ゲル電気泳動の後、増幅されたバンドが相同遺伝子座なのか否かを確認するためにサザンハイブリダイゼーションを行った。その行程は以下に示す。アガロース・ゲル電気泳動後エチジウム・ブロマイド(EtBr)溶液で染色し、デジタルカメラによって泳動パターンを確認、撮影した。その後変性溶液(0.4 NaOH, 0.6M NaCl) に十分浸したメンブレン1枚、ろ紙2枚をこの順で、間に気泡が入らないようにゲルにのせてその上にJKワイパー、キムタオル(商標)、重しとして辞典などを載せ、一晩(〜15時間)放置した。メンブレンを中和溶液(1 M NaCl, 0.5 M Tris − HCl (pH 7.0))に15分程度放置して中和した後十分に乾燥させた。その後のハイブリダイゼーション、現像などの操作は前述のスクリーニングの時と同じなので省略する。また鯨目内の系統関係推定の際には殆どの遺伝子座についてそれらの塩基配列を決定したので基本的にサザンハイブリダイゼーションによる確認は行わなかった。
【0064】
実施例1:鯨偶蹄目ゲノム内における CHR−2 各サブファミリーの分布
鯨の起源ついてはその内部系統について形態による分類と分子による分類で見解がわかれている。鯨目は現生の多くの種類を含む歯鯨亜目と髭鯨亜目、そしてこれらの祖先となったと考えられている原鯨亜目(ムカシクジラ亜目とも呼ばれている)の3つの亜目に分けられており(Fordyce et al., 1994)、現生の鯨類の分類はその分類名からも明らかなように、歯を持つか否かによって区別されている。しかし、髭鯨類も発生のかなり最後の方の段階まで歯が確認できるし原鯨類の化石種の中には当然のことながら歯鯨と髭鯨の中間段階にあると思われるような形質を備えたもの(つまり歯を持った髭鯨)も存在しているので、実際の問題として歯の存在だけで歯鯨の単系統性を主張することはできない。それは系統的に考えた時に髭鯨の「髭」はおそらく共有派生形質であるが歯鯨の「歯」という形質は原始形質とみなされるためである。しかし歯鯨のみがエコロケーションをする能力を持ち、それに付随するメロン体の存在も歯鯨の単系統性を示唆する最も有名な形質のひとつである。
【0065】
形態的分類が歯鯨、髭鯨類のそれぞれの単系統性を強く主張しているのに対して、現在までに行われてきた分子を用いた系統解析によればその殆どが歯鯨が単系統群を形成しないことを示唆している。その中でも大きな論争の火種となったのがMilinkovith and Meyer(1993)のミトコンドリア遺伝子配列の比較解析により提唱された系統樹でこの解析によれば歯鯨に含まれているマッコウクジラ上科のグループが他の歯鯨類よりむしろ髭鯨類に近縁である(つまり歯鯨は多系統である)という。この結果に続いて多くの分子統計学的研究がなされたが多くは歯鯨が多系統もしくは解決不可能という結果となっていた(e. g., Arnason et al., 1994; Adachi et al., 1996; Smith et al., 1996:図17参照)。そこで、以下の問題を解決すべくSINE法を用いて種判別を行った:問題(1)歯鯨の単系統性の問題;(2)全てのカワイルカ類を含めたそれらの鯨目における系統関係;(3)鯨類それぞれの分岐年代。本願発明により、系統関係の決定のみならず現在まで絶対的な信頼性をもって進められてきた統計学的解析の問題点なども明らかにすることができた。
【0066】
上述のように、本願発明者は、偶蹄目ゲノム中に存在するCHR−2には大きく分けてFL(Full Length), MD(Middle Deletion type)、DT(Deletion Type)、CD(Cetacea Deletion type)、 CDO(Cetacea Deletion type Odontoceti)のサブファミリーが存在することを発見した。それぞれのサブファミリーは進化の過程における増幅時期が異なるためそれらの分布は系統関係を反映すると考えられる。各サブファミリーのコンセンサス配列のアラインメントを図18に示す。図18から明らかなように各サブファミリーはそれらにDiagnosticな塩基置換や欠失が認められる。
【0067】
これらSINE各サブファミリーの鯨、偶蹄目における分布を確認するためにドットハイブリダイゼーションを行った。用いたプローブは、CDとCDOに関してはそれらの区別が可能な位置にオリゴプローブを設計し(アラインメントの太線)、FLに関してはPCR産物を使用した。ドットハイブリダイゼーションの結果を図12に示す。まずFLは全ての鯨目そして偶蹄目ではカバ、ウシ(反すう亜目を代表)のみに分布し、ブタやラクダ及びその他外群として加えた哺乳類ゲノム中には存在しないことが示唆された。次にCDは鯨目のみに特異的に分布し偶蹄目には分布してないと考えられ、鯨目の単系統性を強く支持している。さらにCDOに関しては、歯鯨にのみ強くシグナルが確認されることからこのサブファミリーは歯鯨亜目特異的に爆発的な増幅をしたと考えられ、分子による解析から疑問視されている歯鯨の単系統性を支持するデータである。しかしドットハイブリダイゼーションによる解析においてシグナルが確認されないだけでは、単にその系統でコピー数が少なかっただけという可能性を否定できないので、その結果だけで系統関係を推定することはできない。そこで実際にそれらのSINEが鯨目ゲノム中に挿入している様な遺伝子座を単離して系統関係の推定を行った。
【0068】
実施例2−1: SINE のゲノム中への挿入を指標とした鯨目内部系統の解析
鯨目内部系統に関する研究においては、鯨目に存在するSINEの中から鯨目全体に特異的に分布しているCD及び、歯鯨亜目に特異的に増幅していると考えられるCDOに注目し、鯨目各種のゲノム・ライブラリーからこれらのサブファミリーに属するSINE配列を含む遺伝子座の単離を行った。上述のように効率的に系統解析を行うにはサブファミリーの分布とその増幅時期を対応させて予測ができる。マッコウクジラの系統解析に関しては、歯鯨の単系統性を示唆するような遺伝子座の探索を続けられてきたにもかかわらずそのような遺伝子座が単離できなかった理由として、主に歯鯨にのみ分布しているCDOに注目して行っていたからではないかと考えた。そこでマッコウクジラのゲノム・ライブラリーのスクリーニングだけはCDOより一つ前に増幅したと思われるCDの配列を用いて行った。以下に記載する各遺伝子座の名称と使用したゲノム・ライブラリーがどの鯨種由来かの対応関係をまとめておく:Mago:マゴンドウ、Isi:イシイルカ、 Amz:アマゾンカワイルカ、Tuti:ツチクジラ、Sp 及びSperm:マッコウクジラ、Bando:バンドイルカ、並びに Hump:ザトウクジラ。鯨目の系統関係を示唆する遺伝子座の単離に用いたPCRプライマーを以下の表3:
【表3】
Figure 0003600891
に示す。
【0069】
実施例2−2:鯨目の単系統性を支持する遺伝子座
遺伝子座Bando1をバンドウイルカ、遺伝子座Sp316をマッコウクジラのゲノム・ライブラリーから単離した。これらの遺伝子座の塩基配列決定、SINE近傍領域におけるプライマー設計、鯨偶蹄目のゲノムDNAを鋳型としたPCR反応、アガロース・ゲル電気泳動による分離を行った。その結果、図19に示す通り遺伝子座Bando1とSp316では鯨目に共通にSINEの挿入があったようなバンドパターンが確認できた。最も近縁な外群として用いたカバにはこの挿入はないので、鯨目が共通祖先であった時期にその挿入が起こったものと考えられる。これらの遺伝子座は鯨目の単系統性を強く支持している。遺伝子座Bando1においてはまずCDが鯨目の共通祖先時に挿入し、その後南米のカワイルカ2種アマゾンカワイルカ、ラプラタカワイルカの共通祖先種においてCDOの挿入があったものと考えられる。よってこの遺伝子座は鯨目の単系統性だけでなく南米カワイルカの単系統性も同時に示唆している。遺伝子座Sp316ではCHR−1typeIIIが鯨目の共通祖先で挿入ことを示している。図20〜22に遺伝子座Bando1のアラインメントの結果を、そして図23に遺伝子座Sp316のアラインメントの結果を示す。
【0070】
実施例2−3:イルカ上科の単系統性を支持する遺伝子座
遺伝子座Mago19においてはイルカ上科4種(マイルカ科:コビレゴンドウ、バンドウイルカ;ネズミイルカ科:イシイルカ;イッカク科:イッカク)に特異的なCDOの挿入が確認された(図24参照)。この遺伝子座はイルカ上科の単系統性を強く支持している。図25と26に遺伝子座Mago19のアラインメントの結果を示す。
【0071】
実施例2−4: Infraorder: Delphinida を支持する遺伝子座
遺伝子座Mago24, Mago26, Mago32, Isi14, Isi36, Isi38ではCDOの挿入がイルカ上科4種、南米カワイルカ2種アマゾンカワイルカ、ラプラタカワイルカ及びヨウスコウカワイルカにのみ確認された(図27と28参照)。よってこれらの遺伝子座はこのグループの単系統性を支持している。Muizon(1988,1994)は形態的特徴からこれらのグループをDelphinida下目(亜目よりも階級的には下)としてまとめているがこの考えにもよく一致している。またArnason(1996)らのミトコンドリアCytb遺伝子の配列による解析でもこのことは強く支持されている。またカワイルカ類が多系統群でガンジスカワイルカが他のカワイルカ類より原始的であることを示唆している。図29に遺伝子座Ishi14のアラインメントの結果を示す。図30〜31に遺伝子座Ishi36のアラインメントの結果を示す。図32〜33に遺伝子座Ishi38のアラインメントの結果を示す。図34〜35に遺伝子座Mago24のアラインメントの結果を示す。図36〜37に遺伝子座Mago26のアラインメントの結果を示す。図38〜39に遺伝子座Mago32のアラインメントの結果を示す。
【0072】
実施例2−5:アカボウクジラ科の系統関係を示唆する遺伝子座
遺伝子座Mago8, Mago13においてはDelphinidaとアカボウクジラ科に属する2種ツチクジラ、オオギハクジラに特異的なCDOの挿入が確認された(図40参照)。このことから現生種ではアカボウクジラ科がDelphinidaに最も近縁な分類群であるといえる。またガンジスカワイルカ科はアカボウクジラ科よりさらに原始的なグループであることがわかる。図41に遺伝子座Mago8のアラインメントの結果を示す。図42に遺伝子座Mago13のアラインメントの結果を示す。
【0073】
実施例2−6:ガンジスカワイルカ科の系統関係を示唆する遺伝子座
遺伝子座Mago21, Mago22においてはDelphinida、アカボウクジラ科及びガンジスカワイルカに特異的なCDOの挿入が確認された(図43参照)。よってガンジスカワイルカ科(インダスカワイルカはサンプルがないため解析には加えていないがおそらくガンジスカワイルカと単系統群を形成する。)はマッコウクジラを除く歯鯨の中では最も原始的なグループであることが明らかとなった。図44に遺伝子座Mago21のアラインメントの結果を示す。図45〜47に遺伝子座Mago22のアラインメントの結果を示す。
【0074】
実施例2−7:歯鯨の単系統性を支持する遺伝子座
遺伝子座Sperm8, Sperm28, Sperm47においてはマッコウクジラも含めた歯鯨亜目全ての種で共通にCDの挿入が確認された(図48参照)。これらの遺伝子座の解析結果は分子統計学的研究から疑問視され続けてきた歯鯨の単系統性が強く支持された。図49〜50に遺伝子座Sperm8のアラインメントの結果を示す。図51に遺伝子座Sperm28のアラインメントの結果を示す。図52に遺伝子座Sperm47のアラインメントの結果を示す。
【0075】
実施例2−8:南米カワイルカの単系統性を支持する遺伝子座
遺伝子座Amz13, Bando1においては南米カワイルカ2種アマゾンカワイルカ、ラプラタカワイルカにおいて共通にCDOの挿入が見られた(図53参照)。南米カワイルカ2種及びヨウスコウカワイルカの3者の系統関係に関してはいくつかの仮説がありヨウスコウカワイルカが南米カワイルカ類のいずれかと単系統群を形成する説もあったが(Kasuya, 1973; Barnes et al., 1985)これら2つの遺伝子座によって南米カワイルカ類が単系統であることが強く支持された。今までに提唱されてきたいくつかの仮説の中では生物地理学的にも最も理想的な系統関係であると考えられる。図54に遺伝子座Amz13のアラインメントの結果を示す。
【0076】
実施例2−9:アマゾンカワイルカに特異的な遺伝子座 Amz11
図55にアマゾンカワイルカに特異的にCDOの挿入があったことを示す遺伝子座Amz11のバンドパターンを示す。図56に遺伝子座Amz11のアラインメントの結果を示す。
【0077】
実施例2−10:アカボウクジラ科に特異的な遺伝子座 Tuti24, Tuti35
図57にアカボウクジラ科に特異的にCDOの挿入があったことを示す遺伝子座Tuti24, Tuti35のバンドパターンを示す。図58に遺伝子座Tuti24のアラインメントの結果を示す。図59〜60に遺伝子座Tuti35のアラインメントの結果を示す。
【0078】
実施例2−11:マッコウクジラ上科3種に特異的な遺伝子座 Sp9 、及びマッコウクジラ科に特異的な Sp2
図61にマッコウクジラ上科3種にCDOの挿入があったことを示す遺伝子座Sp9、及びマッコウクジラ科に特異的なSp2のバンドパターンを示す。図62〜63に遺伝子座Sp2のアラインメントの結果を示す。図64に遺伝子座Sp9のアラインメントの結果を示す。
【0079】
実施例2−12:ナガスクジラ科(又は髭鯨)に特異的な遺伝子座 Hump20, Hump203
図65にナガスクジラ科(又は髭鯨)に特異的なCDの挿入があったことを示す遺伝子座Hump20, Hump203のバンドパターンを示す。図66〜68に遺伝子座Hump20のアラインメントの結果を示す。図69に遺伝子座Hump203のアラインメントの結果を示す。
【0080】
実施例3:鯨目内部の系統樹の作成
以上の結果から得られたSINEの挿入パターンをマトリックスにまとめた(図70参照)。これに基づき推定される鯨目内部の系統発生樹を図71に示す。
それぞれの遺伝子座の解析の際に得られたPCR産物の塩基配列は可能な限りすべて決定し、アラインメントした。その結果得られたバンドパターンが2次的な挿入や欠失などによってもたらされたものでないことを確認した。またこれらの配列は鯨目の核遺伝子配列情報として今後の研究に重要であると考えている。
【0081】
結果
上記実施例によって明らかになった現生歯鯨類の系統関係を以下にまとめる。1.歯鯨類は単系統群を形成する。マッコウクジラ上科は現生歯鯨の中で最初に分岐したグループである。
2.ガンジスカワイルカ(おそらくインダスカワイルカと単系統)がマッコウクジラ類の次に分岐した。他のカワイルカ類とは別の系統群から派生したものである。
3.次にアカボウクジラ科のグループが分岐する。またアカボウクジラ科のBe radius属及びMesoplodon属は単系統である。
4.南米のカワイルカ2種アマゾンカワイルカ、ラプラタカワイルカが単系統である。
5.イルカ上科に属するマイルカ科、ネズミイルカ科及びイッカク科は単系統群を形成する。
【0082】
以上の系統関係は、系統発生学的に重要な意味をもつだけではなく、数種の動物から成る検体が提供された場合、SINEが挿入された適当な遺伝子座を選択することにより、塩基配列分析を省略してその検体がどの種であるか判別することができる本願発明に係るSINE法を用いた種判別方法の信頼性の基礎をなす。鯨目以外の動物についてもSINE法により、さらに系統発生樹を確立することによって、それらの目内においても鯨目内におけるものと同様な種判別方法を確立することができる。なぜなら、分子統計学的手法を用いた系統解析には以下に述べるように限界があるからである。
過去にマッコウクジラの系統関係に関して行われた分子統計学的な研究で歯鯨の単系統性を示唆するような結果は殆ど得られていなかった。これらの解析が主にミトコンドリア遺伝子の配列を用いていたことから当初はミトコンドリアに特異的な現象なのかとも考えられたが、ミオグロビンのアミノ酸配列の解析(Czelusniak et al., 1990)でも同じ結果であったし、核遺伝子IRBPの解析 (Smith et al., 1996) でも歯鯨の多系統性(マッコウクジラがよりヒゲクジラに近縁である)の方が統計的に有利である結果を示していることから、分子配列を統計学的に解析するとどうしても歯鯨が多系統であるような結果が得られるようである(図72参照)。しかし上記の結果は明らかに歯鯨が単系統群を形成する事を示唆しているし、また形態学的な特徴から考えても歯鯨の単系統性はまず間違いないであろう。
【0083】
では何故鯨類を分子統計学的に解析するとマッコウクジラがヒゲクジラにより近縁であるような結果が出てしまうのだろうか。しばしば問題視されるのがアウトグループの選択である。つまり分子の情報からわかるのは各グループの分子的な距離だけでありそれらのグループ(この場合はイルカ、マッコウクジラ、ヒゲクジラ)が分岐する以前に分岐した外群を用いて系統樹の根(Root)の位置を確定する必要がある。しかしその位置は外群の種類と数の違いによって異なる場合があり、初期のArnason(1994)の解析のように外群をウシ一種しか用いない様な解析はかなり信頼度は低いと考えられる。実際にCytb遺伝子に関してはAdachiとHasegawa(1995)の研究によればアウトグループを変えることでその結果が大きく変わることがわかっている。しかしその後の多数の偶蹄目及びその他有蹄類を外群に用いて行った解析(Arnason et al., 1996)でも、歯鯨の単系統性を示唆することができなかったことから単にアウトグループの選択が問題であったとは考えにくい。次に鯨類それぞれの分類群の間で分子進化速度が異なる可能性が考えられる。Martin(1993)らの研究では塩基置換速度に影響を及ぼすと考えられる代謝の影響などと生物の体のサイズの相関関係を示し、一般に体のサイズが大きいほど塩基置換速度が遅くなる傾向があることを示唆した。つまりイルカ類などの小型の歯鯨類がマッコウクジラやナガスクジラ類の様な大型の髭鯨類に比べて分子進化速度が大きいために統計的な誤差をもたらしたとも考えられる。しかし最終的にHasegawa(1997)らが解析に用いた最尤法(Maximum likelihood analysis)は最大節約法(Maximum parsimony analysis)とは異なり、各分類群間で分子進化速度が違うような場合においても結果的に間違えた系統樹をつくることは少ないのが特徴であるにもかかわらず結果は変わらなかった。
【0084】
また種の分岐が短時間の間に起こった可能性も十分に考えられる。例えば歯鯨類ニ髭鯨類の分岐の後、極めて短時間で歯鯨類からマッコウクジラ類が分岐してしまったような場合は歯鯨の間で共通な塩基置換が蓄積するのに十分な時間がなく、しかもマッコウクジラ類がその後の現在に至るまでの長い時間を独自の歴史を経てしまえばその間に蓄積した塩基置換が、歯鯨が共通祖先の時期に蓄積したであろうわずかな共通塩基置換をうやむやにしてしまうことが考えられる。実際に今から3500万年程前に起きた、オーストラリア大陸の北偏がもたらした南極海流の成立で鯨類の適応放散による種分化はかなりのスピードで起こったことが予想される(Fordyce, 1992)。このような場合はどのような解析方法を用いても分子統計学的な解析による系統推定は不可能であると考えられる。また、もし様々な統計学的な仮定を前提にしてより確からしい系統推定ができたとしてもかなり人為的な系統樹になってしまうのではないだろうか。これでは形態的研究よりも勝っている「客観性」という観念からはずれてしまうように思われる。
【0085】
【発明の効果】
本発明に係る動物種の判別方法の有利な効果の1つは、配列決定工程を省略できることである。一般に、シークエンス装置は最低でも1500万円であり、そして消耗品については、1回のシークエンスにかかる費用はおよそ1200円である。したがって、多数の検体を分析する場合、かなりの費用がかかる。さらに、検査会社により商業的に分析する場合、現状、1検体当たり1万円以上請求される。時間的にも、配列決定工程には1検体当たり少なくとも1時間30分程かかるので、これが省略できるSINE法を用いた種判別方法は分析効率が高い。最も重要なことは、DNA塩基配列の解析は統計的な操作を伴うということである。上述のように、このうような統計学的な手法はその解析方法によっても結果がことなるという問題が生じている。これに対し、SINE法は、SINEの挿入という不可逆現象を指標として種判別を行うので、その結果は明瞭であり、特別な統計学的処理は必要とされない。結論として、本願発明に係るSINE法を用いた種判別方法は、従来技術の塩基配列の比較に基づく種判別方法よりも、金銭的に、時間的にさらにはその信頼性に関しても優れているといえる。
【0086】
参考文献一覧
1.Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. Basic local alignment search tool. J. Mol. Biol. 1990; 215:403−410
2.Batzer, M. A. et al. African origin of human−specific polymorphic Alu insertions. Proc. Nat. Acad. Sci. USA 1994; 91: 12288−12292
3.Borodulina OR, Kramerov DA. Wide distribution of short interspersed elements among eukaryotic genomes. FEBS Lett. 1999; 457:409−13
4.Britten RJ, Baron WF, Stout DB, Davidson Eli. Sources and evolution of human Alu repeated sequences. Proc. Natl. Acad. Sci. USA 1988;85:4770−4774
5.Brosius J. Retroposons −− seeds of evolution. Science 1991; 251: 753
6.Bucci S, Ragghianti M, Mancino G, Petroni G, Guerrini F, Giampaoli S. Rana/Pol III: a family of SINE−like sequences in the genomes of western Palearctic water frogs. Genoine 1999; 42:504−511
7.Cao Y, Fujiwara M, Nikaido M, Okada N, Hasegawa M. Interordinal relationships and timescale of eutherian evolution as inferred from mitochondrial genome data. 2000 (in press)
8.Clark JB, Kidwell M. A phylogenetic perspective on P transposable element evolution in Drosophila. Proc. Natl. Acad. Sci. USA 1197; 94:11428−11433
9.Coltman DW, Wright JM. Can SINEs: a family of tRNA−derived retroposons specific to the superfamily Canoidea. Nucleic Acids Res. 1994;22:2726−2730
10.Deininger PL, Batzer MA. Evolution of retroposons. Evol. Biol. 1993;27:157−196
11.Deragon JM, Landry BS, Pelissier T, Tutois 5, Tourmente 5, Picard G. An analysis of retroposition in plants based on a family of SINEs from Brassica napus. J. Mol. Evol. 1994; 39:378−386
12.Eickbush TH. Origin and evolutionary relationships of retroelements. In Morse SS. ed; The Evolutionary Biology of Viruses. New York: Raven Press. 1994. Pp.121−157
13.Gallagher PC, Lear TL, Coogle LD, Bailey E. Two SINE families associated with equine microsatellite loci. Mamm Genome. 1999; 10: 140−144
14.Galli G, Hofstetter H, Birnstiel ML. Two conserved sequence blocks within eukaryotic tRNA genes are major promoter elements. Nature 1981;294:626−631
15.Hamada M, Takasaki N, Reist JD, De Cicco, Goto A, Okada N. Detection of the ongoing sorting of ancestrally polymorphic SINEs toward fixation or loss in populations of two species of charr during speciation. Genetics 1998;150: 301−311
16.Hartl DL, Lohe AR, Lozovskya ER. Modern thoughts on an ancyent marinere: function, evolution, regulation. Annu. Rev. Genet. 1997; 31:337−358.
17.Hendy MD, Penny D. Syst. Zool. 1989;38:297−000
18.Hennig W. Phylogenetic Systematics. Urbana−Champagne: University of Illinois Press. 1966.
19.Hillis DM. SINEs of the perfect character. Proc. Natl. Acad. Sci., USA 1999;96: 9979−9981
20.Izsvak Z, Ivics Z, Garcia−Estefania D, Fahrenkrug SC, Hackett PB. DANA elements: a family of composite, tRNA−derived short interspersed DNA elements associated with mutational activities in zebrafish (Danio rerio). Proc. Natl. Acad. Sci. USA 1996;93:1077− 1081
21.Jurka J, Zeitkiewicz E, Labuda D. Ubiquitous mammalian−wide interspersed repeats (MIR5) are molecular fossils from the Mesozonic era. Nucleic Acids Res. 1995;23:170−175
22.Kass DH, Raynor ME, Williams TM. Evolutionary history of B1 retroposons in the genus Mus. J Mol Evol. 2000;51:256−64
23.Kazazian HH Jr, Moran JV. The impact of Li retrotransposons on the human genome. Nature Genetics 1998;19:19−24
24.Kido Y, Himberg M, Takasaki N, Okada N. Amplification of distinct subfamilies of short interspersed elements (SINEs) during evolution of the Salmonidae. J. Mol. Biol. 1994;241: 633−644
25.Kido Y, Saitoh M, Murata 5, Okada N. Evolution of the active sequences of the HpaI short interspersed elements. J. Mol. Evol. 1995;41:986−995
26.Kim J, Martignetti JA, Shen MR, Brosius J, Deininger P. Rodent BC1 RNA gene as a master gene for ID element amplification. Proc. Natl. Acad. Sci., USA 1994;91: 3607−3611
27.Kramerov D, Vassetzky N, Serdobova I. The evolutionary position of dormice (Gliridae) in Rodentia determined by a novel short retroposon. Mol. Biol. Evol. 1999;16:715−717
28.Leeflang EP, Liu W−M, Hashimoto C, Choudary PV, Schmid CW. Phylogenetic evidence for multiple Alu source genes. J. Mol. Evol. 1992;35: 7−16
29.Luan DD, Korman MH, Jakubczak JL, Eickbush TH. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non−RTL retrotransposition. Cell 1993 ;72: 595−605
30.Lum JK, Nikaido M, Shimamura M, Shimodaira H, Shedlock AM, Okada N, Hasegawa M. Consistency of SINE insertion topology and flanking sequence tree: Quantifying relationships among cetartiodactyls. Mol. Biol. Evol. 2000; 17:1417−1424
31.Matera A G, Hellman U, Schmid CW. A transpositionally and transcriptionally competent Alu subfamily. Mol. Cell. Biol. 1990; i0: 5424−5432
32.Minnick MF, Stillwell LC, Heineinan JM, Stiegler GL. A highly repetitive DNA sequence possibly unique to canids. Gene 1992; 110: 235−238
33.Miyamoto MM. Perfect SINEs of evolutionary history? Current Biology 2000;9:816−819
34.Mochizuki K, Umeda M, Ohtsubo H, Ohtsubo E. Characterization of a plant SINE, p−SINE1, in rice genoines. Jpn. J. Genet. 1992; 67: 155−166
35.Murata S, Takasaki N, Saitoh M, Okada N. Determination of the phylogenetic relationships among Pacific salmonids by using short interspersed elements (SINEs) as temporal landmarks of evolution. Proc. Natl. Acad. Sci., USA 1993; 90: 6995−6999
36.Murata S, Takasaki N, Saitoh M, Tachida H, Okada N. Details of retropositional genoine dynamics that provide a rationale for a genetic division: the distinct branching of all the Pacific salmon and trout (Oncorhynchus) from the Atlantic salmon and trout (Salmo). Genetics 1996;142:915−926
37.Nagahashi 5, Endoh H, Suzuki Y, Okada N. Characterization of a tandemly repeated DNA sequence family originally derived by retroposition of tRNA(Glu) in the newt. J. Mol. Biol. 1991; 222: 391−404
38.Nei, M, Kumar S. Molecular evolution and phylogenetics. Oxford University Press, New York. 2000.
39.Nikaido M, Rooney AP, Okada N. Phylogenetic relationships among cetartiodactyls based on insertions of short and long interspersed elements: Hippopotamuses are the closest extant relatives of whales. Proc. Natl. Acad. Sci., USA 1999;96: 10261−10266
40.Nikaido M, Matsuno F, Hamilton H, Brownell Jr. RL, Cao Yin, Ding Wang, Zuoyan Zhu, Shedlock AM, Fordyce E, Hasegawa M, Okada N. Retroposon analysis of major cetacean lineages: the monophyly of toothed whales and the paraphyly of river dolphins. Proc. Natl. Acad. Sci. USA 2001 (in press)
41.Nikaido M, Harada M, Cao Y, Hasegawa M, Okada N. Monophyletic origin of the order Chiroptera and its phylogenetic position among mammalia, as inferred from the complete sequence of the mitochondrial DNA of a Japanese megabat, the Ryukyu flying fox (Pteropus dasymallus). J. Mol. Evol. 2000;51 :318−328
42.Ohshima K, Koishi R, Matsuo M, Okada N. Several short interspersed repetitive elements (SINEs) in distant species may have originated from a common ancestral retrovirus: characterization of a squid SINE and a possible mechanism for generation of tRNA−derived retroposons. Proc. Natl. Acad. Sci. USA 1993;90:6260−6264
43.Ohshima K, Okada N. Generality of the tRNA origin of short interspersed repetitive elements (SINEs). Characterization of three different tRNA−derived retroposons in the octopus. J. Mol. Biol. 1994;243:25−37
44.Ohshima K, Hamada M, Terai Y, Okada N. The 3’ ends of tRNAderived short interspersed repetitive elements are derived from the 3’ ends of long interspersed repetitive elements. Mol. Cell. Biol. 1996;16: 3756−3764
45.Okada N. SINEs: short interspersed repeated elements of the eukaryotic genome. TREE 1991a;6:358−361
46.Okada N. SINEs. Curr. Opin. Genet. Dev. 1991b;1:498−504
47.Okada N, Ohshima K. Evolution of tRNA−derived SINEs. In Maraia RJ. ed; The impact of short interspersed elements (SINEs) on the host genoine. Austin: RG Landes Co. 1995. p 62−79.
48.Okada N, Hamada M, Ogiwara I, Ohshima K. SINEs and LINEs share common 3’ sequences: a review. Gene 1997;205: 229−243
49.Waddel PJ, Okada N, Hasegawa M Towards resolving the interordinal relationships of placental mammals. Syst. Biol. 1999;48:1−5
50.Rogers J. Retroposons defined. Nature 1983;301:460
51.Rokas A, Holland PWH. Rare molecular changes as a tool for phylogenetics. TREE (in press)
52.Sakagami M, Ohshima K, Mukoyama H, Yasue H, Okada N. A novel tRNA species as an origin of short interspersed repetitive elements (SINEs). Equine SINEs may have originated from tRNA(Ser). J. Mol. Biol. 1994;239:731−735
53.Schmid C. Alu: structure, origin, evolution, significance and function of one−tenth of human DNA. Prog. Nucl. Acid Res. and Mol. Biol. 1996;53:283−319
54.Schmid CW, Maraia R. Transcriptional regulation and transpositional selection of active SINE sequences. Curr. Opin. Genet. Devel. 1992;2: 874−882
55.Schmitz J, Ohxne M, Zischler H. SINE insertions in cladistic analyses and the phylogenetic affiliations of Tarsius bancanus to other Primates.Genetics 2001 (in press)
56.Shedlock, AM., Okada N. SINE insertions: Powerful tools for molecular systematics. BioEssays 2000; 22:148−160
57.Shedlock AM, Milinkovitch MC, Okada N. SINE evolution, missing data, and the origin of whales. Syst. Biol. 2000; 49:808−817
58.Shedlock AM, Takahashi K, Okada N. SINEs of speciation: tracking the sorting of lineages with retroposons. TREE 2001
59.Shen MR, Batzer MA, Deininger PL. Evolution of the Master Alu Gene (s). J. Mol. Evol. 1991;33: 311−320
60.Sherry ST, Harpending HC, Batzer MA, Stoneking M. Alu evolution in human populations: Using the coalescent to estimate effective population size. Genetics 1997; 147:1977−1982
61.Shimamura M, Yasue H, Ohshima K, Abe H, Kato H, Kishiro T, Goto M, Munechika I, Okada N. Molecular evidence from retroposons that whales form a dade within even−toed ungulates. Nature 1997;388: 666−670
62.Shimamura M, Abe H, Nikaido M, Ohshima K, Okada N. Genealogy of families of SINEs in cetacean and artiodactyls: The presence of a huge superfamily of tRNAG1u−derived families of SINEs. Mol. Biol. Evol. 1999;16:1046−1060
63.Smit AFA, Toth G, Riggs AD, Jurka J. Ancestral, mammalian−wide subfamilies of LINE−i repetitive sequences. J. Mol. Evol. 1995; 246:401−417
64.Smit AFA, Riggs AD. MIR5 are classic, tRNA−derived SINEs that amplified before the mammalian radiation. Nucleic Acids Res. 1995; 23:98−102
65.Sprinzl M. Hartmann T, Meissner F, Moll J, Vorderwiilbecke T. Compilation of tRNA sequences and sequences of tRNA genes. Nucleic Acids Res. 1987;15:r53−r188
66.Stoneking M. et al. Alu insertion polymorphisms and human evolution: Evidence for a larger population size in Africa. Genome Res. 1997;7:1061−1071
67.Surzycki SA, Belknap WR. Characterization of repetitive DNA elements in Arabidopsis. J. Mol. Biol. 1999;48:684−691
68.Takahashi K, Terai Y, Nishida M, Okada N. A novel family of short interspersed repetitive elements (SINEs) from cichlids: the pattern of insertion of SINEs at orthologoous loci support the proposed monophyly of four major groups of cichlid fishes in Lake Tanganyika. Mol. Biol. Evol. 1998;15:391−407
69.Takasaki N, Murata 5, Saitoh M, Kobayashi T, Park L, Okada N. Species−specific amplification of tRNA−derived short interspersed repetitive elements (SINEs) by retroposition: A process of parasitization of entire genoines during the evolution of salmonids. Proc. Natl. Acad. Sci. USA 1994;91: 10153−10157
70.Takasaki N, Park L, Kaeriyaina M, Gharrett AJ, Okada N. Characterization of species−specifically amplified SINEs in three salmonid species − chum salmon, pink salmon, and kokanee: the local enviroment of the genoine may be important for the generation of a dominant source gene at a newly retroposed locus. J. Mol. Evol. 1996;42:103−106
71.Terai Y, Takahashi K, Okada N. SINE Cousins: The 3’ end tails of the two oldest and distantly related families of SINEs are descended from the 3’ ends of LINEs with the same geneological origin. Mol. Biol. Evol. 1998;15: 1460−1471
72.Unsal K, Morgan GT. A novel group of families of short interspersed repetitive elements (SINEs) in Xenopus: evidence of a specific target site for DNA−mediated transposition of inverted− repeat SINEs. J. Mol. Biol. 1995; 248:812−823
73.van der Vlugt HHJ, Lenstra JA. SINE elements of carnivores. Mammal. Genome 1995;6:49−51
74.Weiner A, Deininger PL, Efstratiadis A. Nonviral retroposons: genes, pseudogenes, and transposable elements generated by the reverse flow of genetic information. Ann. Rev. Biochem. 1986;55: 631−661
75.Yoshioka Y, Matsumoto 5, Kojiina 5, Ohshima K, Okada N, Machida Y. Molecular characterization of a short interspersed repetitive element from tobacco that exhibits sequence homology to specific tRNA5. Proc. Natl. Acad. Sci. USA 1993; 90:6562−6566
【0087】
【配列表】
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891

【図面の簡単な説明】
【図1】SINEのレトロポジションに関する一般ダイアグラム。
【図2】図2(A)はマスター遺伝子モデルを表し、そして図2(B)は多数源遺伝子モデルを表す。
【図3】SINEの進化の指標としての有用性を示す。
【図4】種A〜Dの系統樹モデルを表す。図4(C)はPCRパターンを示す。
【図5】選択された動物種由来の全ゲノムDNAからの転写産物のいくつかのパターン例である。
【図6】CHR−2 SINEのtRNA様構造を示す。
【図7】図7(A)はCHR−2 SINEのtRNA様二次構造を示し、そして図7(B)はヒトtRNA Gluの二次構造を示す。
【図8】CHR−2のいくつかの配列アラインメントからのCHR−2 SINEのコンセンサス配列の構築を表す。
【図9】tの時に増幅された古いSINEと、uの時に増幅された若いSINEを含む系統分類樹。
【図10】アラインメントによるSINEファミリーのサブファミリーを表す特徴的なヌクレオチド又は可能な欠失の同定を表す。
【図11】CHR−2 SINEファミリーのサブファミリーのコンセンサス配列のアラインメントを示す。
【図12】CD,CDO,及び他のサブファミリーに特異的なプローブを、それぞれ、用いたドット−ハイブリダイゼーション実験の結果を示す。
【図13】フランキングSINE PCRの原理を模式的に示す。
【図14】フランキングPCR結果の1例を示す。また、図14(B)と(C)に2つの異なるプローブを用いた同一フィルターを用いて行ったハイブリダイゼーション実験結果を同時に示す。
【図15】哺乳動物の系統発生樹を示す。
【図16】SINE法における実験の流れを示す。
【図17】分子統計学的研究から提唱された系統樹(歯鯨類の単系統性の問題をめぐる論争)を示す。
【図18】CHR−2各サブファミリーのコンセンサス配列のアラインメントを示す。
【図19】鯨目に共通にSINEの挿入があったことを示す遺伝子座Bando1とSp316のバンドパターンを示す。
【図20】遺伝子座Bando1のアラインメントの結果を示す。
【図21】遺伝子座Bando1のアラインメントの結果を示す。
【図22】遺伝子座Bando1のアラインメントの結果を示す。
【図23】遺伝子座Sp316のアラインメントの結果を示す。
【図24】イルカ上科4種(マイルカ科:コビレゴンドウ、バンドウイルカ;ネズミイルカ科:イシイルカ;イッカク科:イッカク)に特異的なCDOの挿入があったことを示す遺伝子座Mago19のバンドパターンを示す。この遺伝子座はイルカ上科の単系統性を強く支持する。
【図25】遺伝子座Mago19のアラインメントの結果を示す。
【図26】遺伝子座Mago19のアラインメントの結果を示す。
【図27】イルカ上科4種、南米カワイルカ2種アマゾンカワイルカ、ラプラタカワイルカ及びヨウスコウカワイルカにCDOの挿入があったことを示す遺伝子座Isi14, Isi36, Isi38のバンドパターンを示す。
【図28】イルカ上科4種、南米カワイルカ2種アマゾンカワイルカ、ラプラタカワイルカ及びヨウスコウカワイルカにCDOの挿入があったことを示す遺伝子座Mago24, Mago26, Mago32のバンドパターンを示す。
【図29】遺伝子座Ishi14のアラインメントの結果を示す。
【図30】遺伝子座Ishi36のアラインメントの結果を示す。
【図31】遺伝子座Ishi36のアラインメントの結果を示す。
【図32】遺伝子座Ishi38のアラインメントの結果を示す。
【図33】遺伝子座Ishi38のアラインメントの結果を示す。
【図34】遺伝子座Mago24のアラインメントの結果を示す。
【図35】遺伝子座Mago24のアラインメントの結果を示す。
【図36】遺伝子座Mago26のアラインメントの結果を示す。
【図37】遺伝子座Mago26のアラインメントの結果を示す。
【図38】遺伝子座Mago32のアラインメントの結果を示す。
【図39】遺伝子座Mago32のアラインメントの結果を示す。
【図40】Delphinidaとアカボウクジラ科に属する2種ツチクジラ、オオギハクジラに特異的なCDOの挿入があったことを示す遺伝子座Mago8, Mago13のバンドパターンを示す。
【図41】遺伝子座Mago8のアラインメントの結果を示す。
【図42】遺伝子座Mago13のアラインメントの結果を示す。
【図43】Delphinida、アカボウクジラ科及びガンジスカワイルカに特異的なCDOの挿入があったことを示す遺伝子座Mago21, Mago22のバンドパターンを示す。
【図44】遺伝子座Mago21のアラインメントの結果を示す。
【図45】遺伝子座Mago22のアラインメントの結果を示す。
【図46】遺伝子座Mago22のアラインメントの結果を示す。
【図47】遺伝子座Mago22のアラインメントの結果を示す。
【図48】マッコウクジラも含めた歯鯨亜目全ての種で共通にCDの挿入があったことを示す遺伝子座Sperm8, Sperm28, Sperm47のバンドパターンを示す。
【図49】遺伝子座Sperm8のアラインメントの結果を示す。
【図50】遺伝子座Sperm8のアラインメントの結果を示す。
【図51】遺伝子座Sperm28のアラインメントの結果を示す。
【図52】遺伝子座Sperm47のアラインメントの結果を示す。
【図53】南米カワイルカ2種アマゾンカワイルカ、ラプラタカワイルカにおいて共通にCDOの挿入があったことを示す遺伝子座Amz13, Bando1のバンドパターンを示す。
【図54】遺伝子座Amz13のアラインメントの結果を示す。
【図55】アマゾンカワイルカに特異的にCDOの挿入があったことを示す遺伝子座Amz11のバンドパターンを示す。
【図56】遺伝子座Amz11のアラインメントの結果を示す。
【図57】アカボウクジラ科に特異的にCDOの挿入があったことを示す遺伝子座Tuti24, Tuti35のバンドパターンを示す。
【図58】遺伝子座Tuti24のアラインメントの結果を示す。
【図59】遺伝子座Tuti35のアラインメントの結果を示す。
【図60】遺伝子座Tuti35のアラインメントの結果を示す。
【図61】マッコウクジラ上科3種にCDOの挿入があったことを示す遺伝子座Sp9、及びマッコウクジラ科に特異的なSp2のバンドパターンを示す。
【図62】遺伝子座Sp2のアラインメントの結果を示す。
【図63】遺伝子座Sp2のアラインメントの結果を示す。
【図64】遺伝子座Sp9のアラインメントの結果を示す。
【図65】ナガスクジラ科(又は髭鯨)に特異的なCDの挿入があったことを示す遺伝子座Hump20, Hump203のバンドパターンを示す。
【図66】遺伝子座Hump20のアラインメントの結果を示す。
【図67】遺伝子座Hump20のアラインメントの結果を示す。
【図68】遺伝子座Hump20のアラインメントの結果を示す。
【図69】遺伝子座Hump203のアラインメントの結果を示す。
【図70】SINEの挿入パターンをまとめたマトリックスを示す。
【図71】図70に示すマトリックスに基づき推定される鯨目内部の系統発生樹を示す。
【図72】分子統計学的解析の結果(限界)を示す。[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a method for determining the species of an animal by the SINE method. More particularly, the present invention relates to a method for discriminating the species of mammals including cetaceans using the SINE subfamily.
[0002]
[Prior art]
The automation of DNA sequencing and molecular cloning techniques has dramatically increased access to an organism's genome. In addition, the flood of genomic digital information has attracted many biologists to computer-aided bioinformatics. The results of a comprehensive effort, such as the Human Genome Project, have shown in great detail what nucleic acid regeneration studies have revealed about 30 years ago. That is, the vast majority of eukaryotic genomes do not encode specific protein products and are composed of repetitive elements with no apparent function (Kazazian et al., 1998). As a result of genome analysis, the so-called "junk yard", which does not code for proteins, has become a new "jungle" of dynamic molecules filled with active elements such as DNA type transposable elements and RNA type transposable elements. Be recognized. Retroposons are interesting ubiquitous repetitive sequences that are being considered as taxonomic tools for phylogenetic reconstruction and population analysis, and are members of the RNA transposable element (Brosius, 1991; Shedlock and Okada, 2000). Therefore, retroposon diagnosis provides an important bridge between relevant sub-disciplines of evolutionary biology at the individual or species level.
[0003]
The term "retroposition" refers to how such elements move between a parent locus and a target locus in the genome by an RNA intermediate (Rogers, 1983). This copy and paste process creates a reversal of genetic information from RNA to chromosomal DNA (Weiner, et al., 1986, Schmid, 1996). It differs from DNA-type transposons, such as the mariner and P elements, which jump around the chromosome in a manner that leaves no original copy at the parent locus, ie, in a cut-and-paste manner (Clark and Kidwell, 1997; Hartl et al, 1997). An important feature used to classify retroposons is whether they encode reverse transcriptase (RTase), an enzyme essential for self-amplification (Okada, 1991; Eickbush, 1994). Among non-self-amplifying retroposons, short interspersed elements (SINEs) are considered to be extremely useful for the study of eukaryotic taxonomy because of their large number in the genome. . SINEs range in size from 70-500 bp and fall into two categories, those derived from tRNA and those derived from 7SLRNA. The SINE from 7SLRNA contains only two SINE families, the Alu family of primates and the B1 family of rodents. All other SINEs examined so far have been shown to be derived from tRNA. LINEs that encode RTase for amplification also fall into two categories. That is, a mammalian L1 that requires only a simple polyA sequence for reverse transcription without the need for a specific sequence for amplification, and a strict 3 ′ end to be recognized by RTase for amplification. Other categories, including most LINEs, that require a unique sequence motif. Most non-mammalian SINEs and LINEs share the same 3 'tail sequence, and their presence allows SINE to be amplified by the LINE encoded RTase (Ohshima et al, 1997; Okada). et al, 1997; Terai et al., 1998). In the case of mammals, SINE, including those from tRNA and 7SL RNA, appears to be amplified with the help of RTase encoded by mammalian L1. Therefore, in this case, the above conserved sequence motif is not observed at the 3 'tail of SINE. A general diagram for the SINE retroposition is shown in FIG.
[0004]
The fact that a retro position always occurs in one direction and 10 of SINE4The fact that these copies are scattered throughout the host genome highlights that SINE insertion analysis is a powerful new approach to molecular taxonomy. This SINE insertion analysis complements the analysis of other forms with character data, most notably DNA sequence and morphology (eg, Murata et al, 1993, Shimamura et al., 1997, Takahashi et al, 1998). Nikaido et al, 1999). Papers on SINE evolution as a tool for taxonomy and their importance are available (Weiner et al, 1996, Deininger and Batzer, 1993, Schmid, 1996, Rokas and Holland, 2000; Shedlock and Okadah, 2000, Shedlock and Okadah, 2000; 2000).
[0005]
By the way, in discriminating animal species including whales, after amplifying a specific region of the mitochondrial gene by PCR, electrophoresing them on an agarose gel and confirming the amplification, and then sequencing using a sequencing method Species have been determined by determining the sequence and using the difference in the sequence as an index. Due to the high cost of the sequencing method equipment, most of these analyzes are currently performed by specialized companies. Therefore, in order to determine the species of an enormous number of individuals, the number of analyzes is naturally enormous, and the cost is enormous. Furthermore, the analysis of the base sequence still has insufficient and uncertain aspects as described below, and their interpretation is often regarded as a problem.
[0006]
[Problems to be solved by the invention]
Therefore, there is still a need for an assay method for simply, rapidly and inexpensively discriminating animal species including whales without using nucleotide sequence analysis.
[0007]
[Means for Solving the Problems]
Recently, the inventor of the present application has found that SINE can be used not only for the study of phylogeny and taxonomy as described above, but also for a simple, rapid and inexpensive test method for discriminating the species of animals including whales. discovered. As a result of intensive experiments on a wide range of samples, the present inventors have proved their reliability and completed the present invention. That is, as described in detail below, if the SINE insertions are common, it is possible to phylogenetically reveal that certain commonly inserted species are monophylic to each other. If the insertion of the SINE family or subfamily is unique within a particular species, it can be seen that the presence or absence of the insertion can be used for species discrimination. Methods for isolating and identifying the SINE subfamily sequence specific to such species are also within the scope of the present invention.
Conventionally, phylogenetic trees have been created using the SINE family, but this has been done without using the SINE family to classify as a subfamily. Since the SINE that enables species identification cannot be performed without a recently amplified SINE, it is necessary to specifically isolate the recently amplified subfamily. This method submits the method.
[0008]
In one embodiment of the present invention, there is provided a method for determining an animal species by the SINE method, comprising the following steps:
Creating a genomic DNA library from one or more animal species to be identified;
Isolating from each said library a clone containing an orthologous locus in which at least one of said animal species has specifically inserted the SINE family or subfamily;
Using a set of PCR primers that anneal to flanking sequences flanking the SINE family or subfamily at the locus, PCR amplify the sequence at the locus for each of the animal species; Gel species of the PCR product to determine the species of the animal by the presence or absence of a band indicating the presence of the SINE family or subfamily insertion locus;
The method is provided, comprising:
The SINE family or subfamily can be a DNA having a sequence selected from the group consisting of SEQ ID NOs: 3 to 7 or a SINE DNA that hybridizes with the above DNA under stringent conditions. For example, the SINE subfamily is a DNA having the CD sequence shown in SEQ ID NO: 6 or the CDO sequence shown in SEQ ID NO: 7.
[0009]
In another aspect of the present invention, there is provided a SINE family or subfamily DNA having a sequence selected from the group consisting of SEQ ID NOs: 3 to 7, or a SINE DNA that hybridizes with the above DNA under stringent conditions.
Whether the orthologous locus is Bandol corresponding to the sequence shown in any one of SEQ ID NOs: 8 to 21, Sp316 corresponding to the sequence shown in any one of SEQ ID NOs: 22 to 35, or SEQ ID NO: 36 to 46 is Mago19 corresponding to the sequence shown in any one of SEQ ID NOs: 47 to 51, is Ishi14 corresponding to the sequence shown in any one of SEQ ID NOs: 47 to 51, or is equivalent to the sequence shown in any one of SEQ ID NOS: 52 to 65 Ishi36, Ishi38 corresponding to the sequence shown in any one of SEQ ID NOs: 66 to 79, Mago24 corresponding to the sequence shown in any one of SEQ ID NOs: 211 to 224, or SEQ ID NO: 225 238, or Mago26 corresponding to the sequence shown in any one of SEQ ID NOs: 80 to 93. 2, Mago8 corresponding to the sequence shown in any one of SEQ ID NOs: 94 to 98, Mago13 corresponding to the sequence shown in any one of SEQ ID NOs: 99 to 112, or SEQ ID NOS: 113 to 117 Or Mago22 corresponding to the sequence shown in any one of SEQ ID NOs: 239 to 252, or corresponds to the sequence shown in any one of SEQ ID NOS: 118 to 129 Sperm8, Sperm28 corresponding to the sequence shown in any one of SEQ ID NOS: 130 to 135, Sperm47 corresponding to the sequence shown in any one of SEQ ID NOS: 136 to 140, SEQ ID NOS: 141 to 145 Amz13 corresponding to the sequence shown in any one of SEQ ID NOs: 146 to 151, or Amti11, Tuti24 corresponding to the sequence shown in any one of SEQ ID NOs: 152 to 156, Tuti35 corresponding to the sequence shown in any one of SEQ ID NOs: 157 to 171, SEQ ID NO: 172 It is Sp2 corresponding to the sequence shown in any one of SEQ ID NOs: 185, 186 to 190, or Sp9 corresponding to the sequence shown in any one of SEQ ID NOS: 186 to 190, or equivalent to the sequence shown in any one of SEQ ID NOs: 191 to 204 Hump20, or Hump203 corresponding to the sequence shown in any one of SEQ ID NOS: 205 to 210.
[0010]
In another aspect of the present invention, there is provided a DNA having the sequence shown in any one of SEQ ID NOs: 8 to 238 or an orthologous DNA which hybridizes with the above DNA under stringent conditions.
The PCR primer can be selected from the group consisting of SEQ ID NOs: 276-325. The animal can be a mammal. Such mammals may belong to the artiodactyla order.
[0011]
In another aspect of the invention, there is provided a method of obtaining a consensus sequence of the SINE subfamily, comprising the following steps:
Sequencing multiple copies of the repeat unit by whole genome transcription in vitro or automated sequencing of genomic DNA larger than 60 kbp;
Aligning the above sequences from several species to obtain a consensus sequence;
Finding the consensus sequence of the second promoter for RNA polymerase III and creating a stem-loop structure containing this sequence;
Confirm that the sequence is 3'-PyPyPuPuPu-5 'with 5 bases 5' upstream from the stem region as one unit;
the next five bases forming the anticodon-stem region of the tRNA structure are considered other units;
The next seven bases forming the anticodon-loop region of the tRNA structure are considered as further units, where the 3 'end is an AA residue and the 5' end is 3'-TC-5 ' Confirm that it is a residue;
The next 5 bases were considered as other units and the formation of base pairs with the 5 bases assigned to the anticodon-stem region was confirmed, where 3 ′ of the anticodon-stem to align this unit correctly. Placing the deletion at the position of the first base on the side;
Constructing a stem-loop structure for the D region of this tRNA-like structure, confirming the presence of two Gs in the first promoter region of the RNA polymerase III;
Searching for sequence similarity between the sequence and the tRNA using a DNA database to confirm similarity in its secondary structure;
Arranging the SINE family sequences obtained as described above from a plurality of species to obtain the SINE subfamily from the presence of characteristic nucleotides or deletions;
Obtaining a consensus sequence of the SINE subfamily from the alignment of the SINE subfamily,
The method is provided.
[0012]
The SINE subfamily can be a DNA having a SINE subfamily consensus sequence obtained by the above-described method for obtaining a SINE subfamily consensus sequence.
In another aspect of the present invention, there is provided a DNA having a SINE subfamily consensus sequence obtained by the above-described method for obtaining a SINE subfamily consensus sequence.
[0013]
Definition
In the specification of the present application, “SINE” is a short scattered repetitive sequence having a primary structure length of about 100 to 400 bases, and a tRNA homologous region and a tRNA heterologous sequence in order from the 5 ′ end. Region, including those rich in AT. At both ends, there are characterized by direct repeats of about 5 to 20 bases which are considered to be formed when SINE is inserted into the genome.
As used herein, the “SINE family” refers to members of SINE that are derived from the same tRNA and have similar sequences.
On the other hand, in the present specification, the “SINE subfamily” is derived from the same origin (family), but has characteristic mutations. Therefore, the SINE subfamily was amplified from the same ancestral member in the SINE family. A member of a group. Subfamily is used interchangeably with type.
As used herein, an orthologous locus means that two loci are derived from speciation from a common ancestor. On the other hand, when two genes arise due to gene duplication rather than speciation, they are "paralogous". It is the orthologous gene, not the paralogous gene, that provides the information necessary for estimating the molecular phylogenetic tree.
[0014]
As used herein, the term "flanking sequence" refers to a sequence located on both sides of the insertion site when the SINE family or subfamily is specifically inserted into the orthologous locus. PCR primers can be arbitrarily designed within such flanking sequences.
In the present specification, the stringent condition means that a template DNA is put in a hybrid bag, a suitable amount of a prehybridization solution (6 × SSC, 1% SDS) is added thereto, the hybrid bag is packed with a sealer, and incubated for 1 hour or more. After discarding the solution and adding a hybridization solution (6 × SSC, 1% SDS, 1 × Denhart's solution, Carrier DNA (Shared Herring Sperm DNA solution)), the probe prepared in advance was heat denatured at 95 ° C. for 3 minutes. Then, the hybrid bag is sealed and the hybrid bag is sealed, and then incubated overnight (about 15 hours) in a water bath at 42 ° C., and the membranes are washed with an appropriate amount of a wash solution (2 × SSC, 1% SDS). Lightly Idatoki, probe refers to conditions that hybridize to the template DNA.
[0015]
In the present specification, the term “outer group comparison” refers to an outgroup, ie, a species or species group that is assumed to be most closely related to a target organism group, ie, an ingroup, in phylogenetic estimation theory. It refers to a method of determining trait polarity based on By including the outer group in the analysis, the location of the inner group root (common ancestor of the entire inner group phylogenetic tree) can be determined. In the early theory of bifurcation taxonomy, the polarity of the trait state of the inner group, that is, the primitive trait state and the derivative trait state, was first determined based on the trait state of the outer group, and then, it was determined in advance. Based on the trait polarity, species that share a derivative trait state are grouped together as a monophyletic group. Outer group comparisons are widely used, among other things, as the primary method of determining the polarity of morphological traits. The rationale for this is called the principle of maximum savings, in which the virtual trait state (criterion for polarity discrimination in the inner group) at the branch connected to the inner group root is estimated in the most conservative manner from the trait distribution of the outer group. Because there is. Maddison, Donogue & Maddison (1984) and Swofford & Maddison (1987) are the most conservative phylogenetic estimation of the inner group based on the comparison of the outer group without performing the polarity judgment for the group combining the inner group and the outer group. Has been proved to be logically equivalent to
Therefore, it has become possible to estimate the least conserved strain based on branching taxonomy even from molecular data for which polarity determination is difficult, such as restriction enzyme cleavage sites and nucleic acid base sequences.
[0016]
In the specification of the present application, the “shared derived trait” refers to sharing a trait state (apomorphy) determined to be derivative as a result of estimating the polarity using an outer group comparison or the like. The theory of clad taxonomy argues that only shared derivative traits provide information for estimating phylogenetic relationships. This is because a direct common ancestor that produced a group of species that share the estimated derived trait can be assumed. Therefore, the shared derived trait is a key to constructing a single lineage (more precisely, a complete lineage). Here, if there is an inconsistency in the trait distribution, the derivative trait state of some traits must be considered to be homoplasty that evolved on separate branches rather than from a common ancestor. The validity of the shared derivative trait is verified by its consistency with the phylogenetic hypothesis, which is selected based on the principle of least cost, that is, the clade diagram.
[0017]
As used herein, “polarity” refers to the direction of evolution of the transition order between the trait states of a certain trait. Therefore, the polarity depends on the model of the transition order. The transition order of the trait state reflects the trait of the trait data used for lineage estimation. It is not uncommon for qualitative morphological traits to assume a linear or branched transition order. On the other hand, many molecular data such as nucleic acid base sequences and restriction enzyme cleavage sites are unordered traits that cannot be ordered among trait states. Branching taxonomy and evolutionary taxonomy require polarity estimation of trait evolution prior to phylogenetic analysis. As a criterion for estimating the polarity, outer group comparison or information on fossil records or ontogeny is used, but the outer group comparison is most widely used.
[0018]
Evolution of SINE
It is important to understand how SINE has evolved in order to effectively utilize SINE in the lineage estimation, the isolation / identification method and the species identification method according to the present invention. SINEs can be divided into families based on sequence similarity and subfamilies based on characteristic nucleotide occurrences and / or deletions, as described in detail below. The fate of SINE, once inserted into the genome, is determined by the balance between various factors in the chromosomal environment (Schmit and Maria 1992) and mutations that prevent amplification that accumulates in SINE. . Furthermore, since LINE-encoded RTase is required for amplification of SINE, if LINE loses its ability to amplify in the genome and dies, it means that SINE also died in the organism. (Okada et al., 1997).
[0019]
Regarding how SINE amplifies in the genome during evolution, two alternative models of SINE evolution have been proposed so far: a master gene model and a multi-source gene model. The master gene model (FIG. 2A) shows that only one or several "master" loci are the source of all progeny copies, which have no ability to replicate on themselves. That is. In this scenario, its amplification over time is completely dependent on the condition and activity of the master gene. On the other hand, the multi-source gene model (Fig. 2 (B)) indicates that offspring can function as a "multi-source gene" over the course of evolution because they can have the same amplifying ability as the parent copy. is there. In the latter model, the amplification factor is a function of the rate of increase or decrease in total copy number from all of the source genes. The master gene model was proposed with empirical evidence from rodent ID SINE (Kim et al, 1994) and early studies of the human Alu repeat (Shen et al., 1991). However, due to subsequent detailed Alu sequence studies and comparative studies from various other taxa, it is now most pertinent to interpret that most SINE family amplifications occur with the multi-source gene model described above. (Matera et al, 1990; Schmid and Maraia, 1992; Leeflang et al, 1992; Kido et al., 1994; Takasaki et al. 1994; Shedlock and 2000). In practice, subfamilies characterized by the presence and / or deletion of characteristic nucleotides will represent each source gene.
[0020]
The period between the birth and death of SINE is the period of activity of SINE in the host genome, and its lifespan is directly related to its use in taxonomics and as a tool in the present invention. If the average sequence divergence between members of the SINE subfamily is small, it is reasonable to assume that the subfamily is quite young and is still actively amplifying in its host. If the average sequence difference between members of the SINE subfamily is large, it is reasonable to assume that the subfamily is relatively old and already inactive or dead in its host. However, diagnosis of common ancestry among host taxa using SINE insertion is only possible within the active life of a given subfamily. The basic principle of the SINE method will be further described in the “Procedure” section below.
[0021]
SINE insertion dynamics and feature theory
The key to why SINEs are powerful taxonomic tools is that they are independently and irreversibly inserted into the host genome (Murata et al, 1993; Shedlock and Okada 2000). Because there is no known mechanism to specifically remove SINE from the genome, and the probability that two elements are inserted or exactly excised from exactly the same locus is very low. One can regard the presence of SINE at the same locus in two different taxa as a polarized derivative phenotype in its genome. This defines one clade or monophyly in the strict sense of the method of Hennig (1966), which uses only shared derivative traits, or shared derived traits, to construct the phylogenetic hypothesis. In this clade, known ancestral conditions, or the lack of a SINE insertion at a given locus, uniquely define the outer group without the need to establish characteristic polarity via competitive methods of creating known artifacts. (Hendy and Penny, 1989) (see FIG. 3).
[0022]
Methods for isolating and characterizing SINE
Hereafter, strategies for isolating novel SINEs from genomic libraries, screening methods thereof, sequencing of clones and characterization of SINE families from subfamilies, quantification of copy number in representative host taxa, and The definitive diagnosis of the SINE insertion pattern providing phylogenetic information is described.
[0023]
procedure
How to select species to create a genomic library
The SINE method comprises the following basic steps: 1) creation of a genomic library from a selected species; 2) isolation of a clone containing the SINE locus; 3) determination of the DNA sequence of the clone; 4) its SINE gene. Design of polymerase chain reaction (PCR) primers within the flanking sequence of the locus; and 5) PCR diagnosis of the presence or absence of SINE between related species of interest. Although the SINE method can provide deterministic results quickly and reliably once established, it requires considerable time and effort to establish and establish its procedures and conditions.
[0024]
For example, consider the case of determining a phylogenetic relationship between closely related species A, B, C, and D. The actual phylogenetic tree of the above species is shown in FIG. In this case, if species D is selected as a host from which to isolate SINE, no SINE locus providing phylogenetic information is obtained. Species D contains the SINE locus inserted within the common ancestry of the four taxa of interest and within older sources. The locus inserted into all four ancestors is shown as SINE3 in FIG. 4 (B). The pattern of the electrophoresis gel of PCR showing the presence (+) or absence (-) of SINE3 insertion is shown in the lower part of FIG. To isolate a SINE that provides phylogenetic information, one must select species A or B that can provide the three SINE loci, SINE1, SINE2, and SINE3, shown in FIG. 4 (B). Must. Each of these loci defines a clade, or monophy, that shares a common ancestor in the evolutionary history of these species.
[0025]
Method for isolation of novel SINE family from specific species
When no SINE family is known for a particular species, eg, species A in FIG. 4 (A), it is necessary to newly isolate and analyze the SINE family from its genome. There are two ways in which a new SINE family can be isolated from a selected species. One involves in vitro whole genomic DNA transcription (Endoh and Okada, 1986), and the other involves genomic DNA sequencing of about 60 Kbp or more (Nikaido and Okada) facilitated by a new high-throughput automated DNA sequencing method. , Not announced).
[0026]
In vitro whole genomic DNA transcription
Most SINEs are known to be derived from tRNA; therefore, SINEs have an internal promoter for RNA polymerase III. Although SINE is very rarely transcribed in vivo, SINE can be easily transcribed in vitro from naked DNA. When transcribing certain total genomic DNA in HeLa cell extracts using a radiolabeled precursor nucleotide, eg, alpha P32-GTP, radiolabeled RNA is usually transcribed. In some cases, these radiolabeled transcripts form a clear band when they are subjected to gel electrophoresis (Endoh and Okada. 1986; Matsumoto et al. 1986).
[0027]
This radiolabeled RNA can be used as a probe to screen a genomic library from the selected species of interest. If this transcript forms a clear band in the gel, it represents the actual SINE family. This is because all of the same transcripts from each given locus of the SINE family collectively form distinct bands. Even when obscured bands arise from genomic DNA, they can be used as probes for screening. However, in the latter case, the transcript may represent multiple SINE families.
[0028]
Our experience shows that when vertebrate and / or invertebrate genomes have more than 10,000 copies of SINE, they are detected by in vitro transcripts of whole genomic DNA. Can be. FIG. 4 shows some example patterns of transcripts from total genomic DNA from selected animal species (Endoh and Okada, 1986).
[0029]
Sequencing of genomic DNA larger than 60 kbp by automated sequencer
According to the experience of the present inventor, the copy number of the SINE family in the genome is usually over 10,000. The whole genome is 3x10 in length9bp and the size of a SINE is 300 bp, such a SINE family would occupy 0.1% of its genome (eg, 300 x 104= 3x106). Thus, by sequencing over 60 kbp, one would be able to find two independent SINE sequences within this type of randomly isolated DNA fragment (eg, 600 × 100 / 0.1 = 6 × 106).
[0030]
This has become easily achievable in the laboratory with access to the latest models of high-throughput automated DNA sequencers. For example, a new SINE family has recently been characterized from the genome of elephants, and it has been shown that this new SINE is distributed among all species of Afrotheria (Nikaido and Okada, unpublished). This method can be applied to the genomes of all mammals and possibly most vertebrates.
[0031]
Method for accurately identifying the SINE family and deducing its tRNA structure
After determining the sequence of multiple copies of the repeat unit according to the methods described above, they can be aligned and a consensus sequence for the repeat family can be deduced. Since there are many repetitive sequences in the genome other than the SINE element, it is essential to appropriately diagnose the sequences. Since most SINEs are known to be derived from tRNA, they contain a promoter for RNA polymerase III. The RNA polymerase III promoter is a conserved sequence block that has the properties of a first promoter and a second promoter separated from one another in its genome. This second promoter is highly conserved and can be easily recognized empirically.
[0032]
Hereinafter, an example of CHR-2 SINE will be considered. The tRNA-like structures of these elements can be established as follows (see FIG. 6):
1. First, a CHR-2 SINE consensus sequence is constructed from the alignment of several CHR-2 sequences (see FIG. 8).
2. Visually search the second promoter consensus sequence for RNA polymerase III. This sequence is 5'-GT (or A) TCG (or A) -3 '. There are no exceptions to this motif when screening this promoter. When this motif is present, it creates a stem-loop structure containing this second promoter sequence. The number of bases in the loop is 7 and the number of base pairs in the stem is 5. Even if all of the bases in the stem region do not form base pairs, place those bases at appropriate positions in the tRNA, as shown in FIG. 6 (A).
[0033]
3. One unit is assumed to be 5 bases 5 ′ upstream from the stem region. This is because in the plasma class ItRNA, this extra loop region consists of 5 bases. In the case of CHR-2 SINE, the sequence of this unit of 5 bases is 3'-CAGGG-5 '. The 3'-PyPyPuPuPu-5 'sequence is typical of this extra loop in some tRNAs (Sprinzl et al. 1987) and this allows deduction of the tRNA origin of the SINE (FIG. 6 ( B)).
4. The next 5 bases forming the aminoacyl-stem region of the tRNA structure are considered as other units. In this case, it is 3'-GACGT-5 '(see FIG. 6C).
5. The next seven bases forming the anticodon-loop region of the tRNA structure are considered as further units. In this case, it is 3'-AACCGTC-5 '. AA residues at the 3 'end 3'-TC-5' residues at the 5 'end are good indicators of the tRNA origin of this SINE. This is because these bases are highly conserved in most tRNAs (Galli et al., 1981). This further supports the tRNA origin of this SINE (see FIG. 6 (D)).
6. Normally, the next five bases are considered other units, and they should base pair with the five bases assigned to the anticodon-stem region (FIG. 6 (C)). In this case, the sequence is 3'-CGTCT-5 ', and only its first four bases match well with the anticodon-stem region partner. In order to correctly align this unit, a deletion is placed at the position of the first base 3 'to the anticodon-stem (see FIG. 6 (E)).
7. Next, a stem-loop structure for the D region of this tRNA-like structure is constructed. The number of bases in this stem and loop is usually 4 and 8, respectively, but can vary by about 1 to 2 bases, especially in the tRNA-like structure of SINE. Clearly, some base pairs next to the CHR-2 do not form a meaningful secondary structure. In this case, attention is paid to the first promoter region. The most striking feature in the first promoter region is the presence of two Gs in that region. Other features are G in position 15 in this loop (depending on the tRNA numbering system; the same applies hereinafter) and A in position 14. A at position 14 is the first base in the loop on the 5 'side. Therefore, these bases are arranged at the corresponding positions of the loop of this tRNA-like structure (see FIG. 6 (F)). It is well known that T, the first base in FIG. 6 (F), is highly conserved in all tRNA molecules.
8. The tRNA-like structure of CHR-2 SINE can be deduced by combining the sequence shown in FIG. 6 (F) with other sequences for this family (FIG. 7 (A)).
9. Next, the BLASTN program in the GenBank DNA database is used (Altschul et al. 1990) to search for similarities between CHR-2 SINE and the actual tRNA. In this example, tRNA Glu is most similar to the sequence of CHR-2. FIG. 7 (B) shows the secondary structure of human tRNA Glu.
[0034]
How to characterize the SINE family into subfamilies
Suppose that a SINE family is characterized in the genome of species A in phylogeny, and it is unknown when this SINE family was first generated during evolution. Further assume that this SINE family was first generated in the old common ancestor of all taxa of clade Y in FIG. In this case, the copies of SINE present in the genome of species A include the old SINE amplified at t in FIG. 9 and the young SINE amplified at u. When screening a species A genomic library with this SINE family consensus sequence, both the old and new SINEs described above can be isolated. Since only the phylogenetic relationships of species A, B, C, and D are sought, it is inefficient to examine all times of an isolated SINE amplification event. Rather, it is much more efficient to attempt to isolate the SINE locus that is amplified near the divergence of species D and spans all branches of the four taxa, including clade X in FIG.
[0035]
As described above, SINE and LINE are believed to be amplified according to a multi-source gene model (Schmit and Maria 1992; Smit et al. 1995). If a source gene is mutated and successfully amplified during evolution, the mutated source gene can be recognized as a subfamily within its corresponding SINE family (Britten et al. 1988). Jurka et al., 1995). Subfamilies are amplified at some stage in evolution. Therefore, if a subfamily is amplified only in the common ancestor of species A, B, C, and D, copies of this subfamily can be used effectively to determine the phylogenetic relationship of these four clades Can be done.
[0036]
The SINE family consensus sequence in species A was established as part of the above procedure and allowed the design of one PCR primer at the 5 'end of the SINE sequence and other primers in a conserved region near its 3' end. I do. The sequence amplified by this primer set encompasses the entire SINE sequence. This primer set can be used to amplify many copies of SINE by PCR using genomic DNA from species A. The PCR product of this reaction can be cloned into a suitable vector DNA and sequenced. At this point, sequencing 100 copies of SINE from the PCR product is not a difficult task. By aligning these sequences, characteristic nucleotides or possible deletions representing this SINE family subfamily can be identified (see FIG. 10). Characteristic nucleotides are defined as those that are cooperatively altered at three or more nucleotide positions within a particular subfamily and that can be distinguished from spontaneous mutations that have accumulated at random within the SINE sequence during evolution. Is done. Only after successfully characterizing a subfamily based on the presence of characteristic nucleotides and often specific deletions, the taxonomic distribution of a given subfamily can be determined by dot-blot hybridization or PCR. Become like
[0037]
CHR-2 SINE subfamily
FIG. 8 shows the CHR-2 SINE family (Shimamura et al. 1997) originally characterized as being present in the genomes of the orders Cetaceans, Hippopotamus, and Ruminants. Shows copy alignment. It is readily apparent that CHR-2 SINE has six subfamilies. FL (full length), MDI (central deletion I), MDII (central deletion II), and shortest groups were characterized due to the presence of the deletion. This shortest group can then be classified into the subfamilies DT (deletion type), CD (whale deletion type), and CDO (whale deletion tooth specific whale). FIG. 11 shows the alignment results of the consensus sequences of these subfamilies. SEQ ID NO: 1 is the upper consensus sequence, SEQ ID NO: 2 is the FL consensus sequence, SEQ ID NO: 3 is the MDI consensus sequence, SEQ ID NO: 4 is the MDII consensus sequence, SEQ ID NO: 5DT consensus sequence, SEQ ID NO: 6 is the CD consensus sequence, and SEQ ID NO: 7 represents the CDO consensus sequence.
[0038]
FIG. 12 shows the results of dot-hybridization experiments using probes specific to CD, CDO, and other subfamilies, respectively. This result clearly shows that the CD subfamily is specific for the genome of the order Whale (Dental and Beard Whales), and that the CDO subfamily is specific for the genome of the tooth whale. Therefore, SINE belonging to the CD subfamily is useful for estimating the phylogenetic relationship of whales, especially bearded whales, while SINE belonging to the CDO subfamily is useful for estimating the phylogenetic relationship of tooth whales. Useful. The distribution of copies of the CDO subfamily also suggests monophyly of the subclinical whales, including sperm whales, which was one of the most controversial points in the taxonomic biology of mammals.
[0039]
Flanking SINE PCR
After isolating the SINE loci from species A and belonging to the subfamily generated in the common ancestor of clade X shown in FIG. 9 and determining their sequence, the presence of an insertion at a given locus or PCR experiments can be performed to diagnose the absence. Looking at the flanking (adjacent) sequence, a primer sequence is selected. Care must be taken in designing primers for the formation of secondary structure folds and for tandem annealing between the upstream and downstream primers. This can be easily checked using a variety of standard software programs written to facilitate PCR primer design, commercially or via the Internet. The melting temperature of the oligonucleotide primer is set around 55 ° C. Therefore, the annealing temperature for PCR must be based on this temperature when optimizing the amplification of orthologous loci from species B, C, and D. Sometimes the accumulation of mutations in the primer binding region for species B, C, and D prevents efficient primer-template annealing during this reaction. In this case, the annealing temperature must be reduced to about 45-50 ° C. If the PCR product is not amplified by PCR with the first primer, new PCR primers should be designed with further care for potential artifacts that may reduce the efficiency of the PCR. FIG. 13 schematically shows the principle of flanking SINE PCR.
[0040]
FIG. 14 shows an example of the PCR result. Also, the results of hybridization experiments performed using the same filter using two different probes are shown simultaneously. FIG. 14 (A) is a PCR pattern that provides evidence that sea dolphins are a single line. This is because PCR products from marine dolphins have the expected fragment size containing the inserted elements, while fragments from other tooth whales have the expected fragment size lacking the insertion in Mago 19. FIG. 14 (B) shows a hybridization experiment using the SINE probe, while FIG. 14 (C) shows a hybridization experiment using the flanking DNA at the above locus. This latter experiment was performed to demonstrate that the orthologous loci were faithfully amplified by PCR in species other than Magondo from which the loci were originally isolated and characterized.
[0041]
Interpretation of PCR data
When examining relatively recently diverged species, the flanking sequence at the orthologous SINE locus is faithfully conserved, and typically does not cause problems that inhibit PCR diagnosis. However, where relatively old divergent taxa are examined, PCR fails more frequently and makes interpretation of experimental results difficult. In an unsuccessful PCR, SINE-minus data appears. That is, there is a successful PCR amplification at a given locus indicating the absence of a SINE insertion. Unsuccessful PCRs represent lost data and are coded as is (eg, "?") When performing the most parsimonious analysis of the SINE character matrix encoding patterns with or without insertions.
When there is a conflicting insertion pattern between the examined independent loci, there should be an ancestral polymorphism and subsequent incomplete phylogeny.
[0042]
Distribution of SINE in mammalian genome
Generally, most mammals have a large amount of SINE. They are apparently specific to the order, suborder, superfamily, family, genus, or species, based on the hybridization pattern between the species examined (eg, the distribution of CHR-2 SINE in FIG. 12). . Such empirical evidence indicates that the SINE family is newly generated in many ancestral mammalian strains. However, its generation mechanism is not fully understood. The reason for such a large number of SINEs or retroposons in the mammalian genome may be due to the fact that the RTase encoded by the mammalian L1 has altered its template recognition specificity in a common mammalian ancestor. . This allows the recognition of the poly A tail required for retropositions present in many LINEs that strictly recognize the 3 'tail responsible for the formation of the stem-loop structure (Ohshima et al. 1996; (Okada et al. 1997; Kajikawa et al.). Such a scenario could have enabled poly-A-containing RNA to become a pseudogene via L1 RTase in the mammalian genome.
[0043]
FIG. 15 shows a recently proposed mammalian phylogenetic tree (Waddell et al. 1999; Cao et al. 2000; Nikaido et al. 2000). The mammalian SINE family that has been characterized to date is described on FIG. Briefly, the oldest SINE family distributed in the entire mammalian genome is the MIR (Smit and Riggs 1995; Jurka et al. 1995). Although the Alu family is clearly specific to the primate genome, its distribution among closely related species, such as lemurs, has not been investigated in detail. Rodents B1, B2, and ID are specific to the rodent genome. The rabbit C family has been reported in the genome of Lagomorpha, but its distribution among closely related species has not been reported. The SINE family present in the whale artiodactyl genome, for example, CHR-1, CHR-2, CHRS, CHRS-S, PRE-1, and Bov-tA, has been investigated in detail (Shimamura et al. 1997; Shimamura et al. 1999; Nikaido et al. 1999). Although CanSINEA was first reported from the Canidae genome (Minnick et al. 1992; Coltman and Wright 1994), it was subsequently shown that it occurred during evolution within many other carnivorous genomes (van der Vlugt and Lenstra 1995). The equine SINE, named the ERE family, has been reported and its distribution examined (Sakagami et al. 1994; Gallagher et al. 1999). The bat SINE family was isolated by Borodulina and Kramerov (1999) and named VES, and other bat SINE families have recently been characterized (Kawai et al.). The elephant SINE family has recently been isolated and shown to be distributed among the species of Afroteria (Nikaido and Okada). Here, SINEs having different or totally different tRNAs are distinguished as family, and SINEs derived from the same source but having a diagnostic mutation are identified as Type or subfamily. It is considered that a certain SINE explosively increases its copy number at a certain time, and its explosive amplification time and the time axis in the evolution of the whole organism are linked to the relationship between their phylogenetic relationship and the distribution of the SINE.
[0044]
Importantly, although many SINE families have been isolated to date in the mammalian genome, they have not yet been characterized to their subfamily structure. Thus, in accordance with the present invention, its subfamily structure will be elucidated in the future, and new mammalian SINE families or subfamilies may be further obtained.
[0045]
New amplification of SINE: fixed and short-term species divergence
If SINE is very newly amplified in genome evolution and is not fixed among a population of one species, its status as a common derivative is unstable and it should be used for phylogenetic tree construction is not. However, such a distribution of SINEs can be used for analysis of population structure (eg, Hamada et al. 1998). If species divergence occurs in a short period of time, ie, before most SINEs are fixed among populations via genetic drift, ancestral polymorphisms and subsequent incomplete phylogeny will result in inconsistent SINEs. Create an insertion pattern. This phenomenon, combined with the irreversible nature of the SINE retroposition, provides a bias for using SINE to examine the historical pattern of phylogeny in explosively derived taxa. If there is a polymorphism in the ancestor, and then the SINE is incompletely distributed to the offspring, creating an inconsistent insertion pattern, one of the phylogenetic tree construction methods, the most conservative method, can be used at each locus It is useful to evaluate the SINE character matrix for the presence or absence of the insertion. Unfixed, polymorphic SINEs are not useful for high-level phylogenetic relationships, but they are known to be excellent taxonomic tools for population analysis (Deininger and Batzer, 1994, Stoneking et al, 1997; Hamada et al, 1998). Therefore, by identifying and characterizing the SINE family or subfamily according to the method described in the present specification, an animal species discrimination method can be performed using the SINE family or subfamily.
[0046]
Function and value of flanking sequences (usefulness)
Information of nucleotide flanking sequences within the locus examined for SINE insertions is useful. Of course, although the insertion data is useful for generating a phylogenetic tree and for use in the method of the present invention, the integration of the insertion sequence with the flanking sequence is dependent on the length of the branches between the clades determined by the independent SINE insertion case. To provide information about the protein (Lum et al, 2000; Shedlock and Okada, 2000). In addition, since the flanking sequences associated with a given insertion element are literally linked, the consistency between the SINE-derived topology versus the flanking sequences may be a factor in assessing the basic assumption of irreversible insertion at each locus. It offers a number of approaches (Lum et al, 2000). If there is a homopathy (genetic homology) or trait discrepancy at independent SINE loci, there may be a clear discrepancy between the phylogenetic trees. Such an approach is starting as a new dimension of SINE analysis and provides the basis for enhancing the statistical evaluation of the SINE method.
[0047]
【Example】
Hereinafter, the present invention will be described in detail with reference to examples. However, the technical scope of the present invention is not limited by the following examples.
[0048]
Materials and methods
Buffers, enzymes and other reagents
Various buffers, enzymes, culture media for culturing Escherichia coli, and other reagents used for nucleic acid manipulation were purchased from Wako Pure Chemical Industries, Ltd., Sigma, Difco, and FMC, and purchased from Sambrook et al. (1989). Various restriction enzymes, modification enzymes, and vector DNA were purchased from Takara Shuzo Co., Ltd., Toyobo Co., Ltd., and Amersham Life Science Company. Radioisotopes were purchased from Daiichi Pure Chemicals. The PCR primers used were those ordered by OligoExpress (Amersham Pharmacia Biotech) for synthesis.
[0049]
genome DNA
Various samples (tissue or DNA) used in this study are shown below. Table 1 below shows the English names, Japanese names, scientific names, etc. of whales and artiodactyls used in the analysis.
[Table 1]
Figure 0003600891
Shown in
Bactrian camel extracted DNA from muscle tissue provided by Dr. Minoru Yoshida of the University of Tokyo School of Medicine. For pigs, the DNA stored in this laboratory was used as it was. Peccary used DNA provided by Dr. Hiroshi Yasue of the Ministry of Agriculture and Livestock Experiment Station. Java deer used DNA provided from the San Diego Zoo in the United States. For Axis deer, Amimekirin, Sable antelope, Japanese serow, Markor, Mflon, and Hippo, DNA provided by Mr. Isao Munechika of Chiba Zoological Park was used. The sheep used were extracted from the liver provided by Yasushi Mukai of the Ueda Meat Sanitation Laboratory in Nagano Prefecture. For cattle, DNA was extracted from the kidney provided by the Kanagawa Prefectural Meat Sanitation Laboratory Sagami Branch and used.
[0050]
As for the samples of narwhals and giant whales, DNAs were extracted from DNA fragments extracted from a tissue piece considered to be muscle from Dr. Masaki Miya of Chiba Prefectural Central Museum and used. It is known that the sample of the giant whale is belonging to the genus Giant Sperm, but the species name is unknown. Other samples except for the dolphins were used by extracting DNA from various tissue pieces provided by Dr. Hidehiro Kato of the Large Whale Laboratory of the Fisheries Agency, Ocean Fisheries Research Institute. For samples of dolphins, see Dr. Robert L. Brownell, Jr .: Chief Marine Mammal Division, Southeast Fisheries, California, California, USA, USA, Dr. Robert L. Brownell, Jr., 27th. We had you perform acquisition procedure to Japan. Based on that, a subcutaneous tissue section of Amazon dolphin and a liver tissue section of Laplata dolphin were described by Heally H. of the University of California, Berkeley. DNA was extracted from Hamilton. Ganges dolphins provided DNA from dried bone samples provided by Tadashi Yamada of the National Museum of Nature and Science. As for the dolphins, the freshwater was collected from an individual kept in the aquarium of the Institute of Aquatic Biology of the Chinese Academy of Sciences, treated with heparin on the spot, transported to the laboratory, and immediately extracted with DNA. Since the extracted DNA cannot be brought into Japan, it is currently stored at a Chinese laboratory.
[0051]
genome DNA Extraction
Genomic DNA was extracted from the tissue of the animal species used for the analysis by a simple method (Rapid method; a method using Proteinase K). The extracted genomic DNA was used as a template for library preparation and PCR. They are also stored at 4 ° C. Tissues (liver, muscle) of whales and cloven-hoofs stored in a freezer at −40 ° C. are cut out into several millimeter squares with a scalpel, transferred to a microtube, weighed, and then 1X into the microtube. 500 μl of TNE buffer (10 mM Tris-HCl (pH 8.0), 100 mM NaCl, 1 mM EDTA (pH 8.0)) was added. When the tissue piece in the tube is finely pulverized using a Pasteur pipette, the tissue and the TNE buffer are subjected to 1X Lysis buffer (20 mg / ml Proteinase K, 2% SDS, 10 mM Tris-HCl (pH 8.0), 150 mM NaCl, 10 mM). EDTA (pH 8.0)) was added, and the mixture was stirred by inversion, and then incubated using a 55 ° C water bath to completely dissolve the tissue pieces. An equivalent amount of phenol was added to the solution, and the mixture was stirred with a belly dancer (200 to 300 rpm) for 1 to 2 hours. After centrifugation (room temperature, 12000 rpm, 5 min), the supernatant was transferred to another 2.0 ml microtube. In the same manner, phenol / chloroform extraction and chloroform extraction were repeated, and 0.1 times volume of 3M sodium acetate and 2 times volume of ethanol were added to the final supernatant. At this time, in many cases, a fiber was confirmed. Thereafter, the fiber was rinsed with 70% ethanol, and then an appropriate amount of TE buffer was added to dissolve the pellet. Extraction of DNA from a blood sample of Aedes aegypti was performed using a commercially available column (QIAamp Tissue / Blood Kit Cat. No. 29306: manufactured by Qiagen Co., Ltd.).
[0052]
Flanking PCR (Mainly used for amplification of homologous loci)
Flanking PCR means that primers are designed on both sides (upstream and downstream) of the SINE sequence so as to sandwich the SINE sequence, and PCR is performed using genomic DNA as a template. The primer used at that time was designed to have a length of about 17 to 30 nucleotides and a Tm (melting temperature) value of about 55 ° C. With regard to the design, a CP Primer (Ver. 1.08, Bristol and Anderson (1995)) which can be downloaded on the Internet as Macintosh version free software was used.
Reaction composition: Template DNA (100 to 500 ng); 10X PCR Buffer (100 mM Tris-HCl (pH 8.3), 500 mM KCl, 15 mM MgCl)2  5 μl; dNTP Mixture (2.5 mM each) 4 μl; Forward and Reverse Primer (5 pmol / μl) 2 μl each; TaKaRa TaqTM (5 U / μl) 0.25 μl; addsd250 μl of O to to final volume.
Reaction conditions: 94 ° C. (Pre-denature) 2-3 min. And 30 cycles of 94 ° C. (Denature) 30 sec. 45 ° C to 60 ° C (Annealing) 1 min; 72 ° C (Extension) 30 to 90 sec. . At this time, the optimum annealing temperature was determined by appropriately changing the annealing temperature according to not only the Tm value of the primer but also the easiness of increasing the number of loci.
[0053]
colony PCR
Colony PCR is a very simple method for selecting whether or not a target DNA fragment is contained in a certain clone as an insert when performing subcloning. Conventionally, plasmid DNA was prepared by Miniprep and then digested with a restriction enzyme to confirm the presence or absence of the insert. However, since this step can be performed only by PCR, a significant amount of time and labor is required. It leads to shortening. First, colonies of Escherichia coli grown on the plate are gently plucked with a toothpick, rubbed against a 0.5 ml PCR microtube, and then used as a template to perform a normal PCR in a 20 μl reaction system. The primer used at this time is prepared based on a sequence specific to the vector. During thermal denaturation in the PCR reaction, the cell membrane of Escherichia coli is destroyed, and the vector DNA serving as a template dissolves into the solution, thereby enabling this PCR. As will be described later, after confirming the presence or absence of the insert by this PCR, this PCR product can be directly used as a template for sequencing using an ABI sequencer, so that the insert can be sequenced immediately after the insert check. Was also considerably shortened.
[0054]
Determination of nucleotide sequence
For the determination of the nucleotide sequence, the following sequencer and sequence reaction kit were used. Sequence using LI-COR dNA Sequencer (Model 4000): SequiTherm EXCELL (TM) II Long-ReadTM DNA Sequence Kit-LC (Cat. No. SE7701LC; Sequence used: BigDye Terminator Cycle Sequencing FS Ready Reaction Kit (P / N 4303152, manufactured by Perkin Elmer).
When the subcloned plasmid DNA was used as a template for a sequencing reaction, a DNA prepared using SDS-Alkaline and Mg precipitation was used.
When the nucleotide sequence of the locus containing the SINE sequence isolated by screening is determined, M4 and RV on the vector sequence, and an oligonucleotide primer to which fluorescence has been prepared based on the SINE consensus sequence (Aloca ( Co., Ltd.) was used.
When the PCR product is directly sequenced, shrimp alkaline phosphatase (SAP) 2 U / μl 0.5 μl; Exonuclease I 10 U / μl 0.5 μl (both manufactured by Amersham Life Science) are directly added to the PCR product, and the mixture is added at 30 ° C. at 30 ° C. After decomposing the oligonucleotide by incubating for minutes, the enzyme inactivated by incubating at 85 ° C. for 15 minutes was used as a template for the sequencing reaction.
[0055]
Preparation of genomic library
Sucrose gradient
About 50 μg of genomic DNA was completely digested with an appropriate restriction enzyme (mainly Hind III was used in this study), extracted with phenol / chloroform, and precipitated with ethanol, and then dissolved in 200 μl of TE buffer. A 10-40% sucrose gradient was prepared in a 15 ml plastic tube for ultracentrifugation (Centrifuge Tubes-50 Ultra-Clear (registered trademark) Tube 14 X 89 mm, Order No. 344059: manufactured by BECKMAN), and DNA was placed thereon. The solution was added, attached to a rotor, and centrifuged (25000 rpm, 15 ° C., 15 hours) with an ultracentrifuge (L8-70M, Serial No. 7C869: manufactured by BECKMAN). After centrifugation, 10 to 15 drops were added dropwise to a 1.5 ml microtube to fractionate (about 250 to 400 μl / fraction). The fraction was subjected to 0.7-1% agarose gel electrophoresis, and 4-6 fraction tubes were selected so as to sandwich a fraction containing a fragment of about 2-4 kbp, followed by ethanol precipitation. Dissolved in TE buffer. 0.7-1% agarose electrophoresis was performed again, and the fraction used for library preparation was determined.
[0056]
Construction of plasmid library
In this experiment, only a plasmid library using pUC18 / HindIII or pUC19 / HindIII was used, and no phage library was prepared. Our laboratory knows that a sufficient number of SINE copies exist in the genomes of whales and artiodactyls, and that a sufficient number of positive clones can be obtained without using a phage library. In order to save time, a plasmid library with relatively few operation steps was used. The plasmid library was prepared as follows. The composition was TaKaRa Ligation Kit Ver. Solution A, 12 μl; Solution B, 1.5 μl; Vector DNA (pUC18 or 19 / HindIII to 100 ng / μl), 0.5 μl; Insert DNA (Genomic DNA Sucrose Radiation Fraction, 1.0 fraction) μl: After mixing the above solution in a 0.5 ml tube, the mixture was left on a cool block at 16 ° C. for 30 minutes or more. This genomic library is stored at -20 ° C.
[0057]
SINE Flow to clone isolation including sequence
FIG. 16 shows the flow of the experiment in the SINE method.
screening
Preparation of membrane used for screening
To a 0.5 ml tube, 1 μl of the above-mentioned genomic library mixture, an appropriate amount of competent cells of Escherichia coli (E. coli strain JM105) were added and mixed, and the mixture was allowed to stand on ice for 30 minutes. After heat shock at 42 to 45 ° C for 45 seconds, the plate was plated on an L / amp / X-gal / IPTG plate that had been incubated at 37 ° C in advance, and left overnight in a 37 ° C incubator. The number of colonies per plate was adjusted to 200 to 300, and a library for 10 to 20 plates was spread. The colonies that grew on this plate were transferred to a nylon membrane (Colony / Plaque Screen (trademark) NEF-978: manufactured by NEN Research Products), and denaturation solution (0.4 M NaOH, 0.6 M NaCl), neutralized The solution (1 M NaCl, 0.5 M Tris-HCl (pH 7.0)) was left in this order for about 3 minutes. The membrane was dried well after draining. After transferring the colonies, the plate was incubated at 37 ° C. so that the colonies were sufficiently grown again, so that the positive clones described later could be easily picked up.
[0058]
Preparation of probes used for screening
Oligonucleotides or PCR products were used for screening. The oligonucleotide sequences actually used are shown in Table 2 below:
[Table 2]
Figure 0003600891
Shown in First, in the case of an oligonucleotide: 27 to 37 μl of ddH2O; 1 μl of Oligo Nucleotide (5 pmol / μl); 5 μl of 10 × T4 Polynucleotide Kinase Buffer 5 μl; Was mixed in a 0.5 ml tube and incubated at 37 ° C. The sequence of the oligonucleotide used as the probe is shown in Table 2 above. When a PCR product is used (Primer-Extension method): Template DNA, 500 μg; Forward primer (12.5 nmol / μl) 2 μl; Reverse primer (12.5 nmol / μl) 2 μl dDTP Mixture, GTP, GTP dTTP) 2.5 μl; The above mixture was heat-denatured at 95 ° C. for 5 minutes, then annealed at 55 ° C. for 1 minute, and then transferred to ice. Further, after mixing the following reagents in order, the mixture was incubated at 60 ° C. for 30 minutes. 2.5 μl of 10 × BcaBEST ™ Buffer; 2 μl of BcaBEST ™ DNA polymerase; [α- 32 P] dCTP. Each probe after the reaction was purified by elution with NICK Column (Sephadex G-50 DNA Grade: Amersham Pharmacia Biotech Co., Ltd.). The RI count was measured with a liquid scintillation counter. (A Geiger counter was also used for simple measurements.)
[0059]
Hybridization
The membrane was placed in a hybrid bag, and an appropriate amount of a prehybridization solution (6 × SSC, 1% SDS) was added thereto. The hybrid back was packed with a sealer and incubated for 1 hour or more. After discarding the solution and adding a hybridization solution (6 × SSC, 1% SDS, 1 × Denhart's solution, Carrier DNA (Shared Herring Sperm DNA solution)), the probe prepared in advance is heat-denatured at 95 ° C. for 3 minutes. Then, the hybrid bag was sealed, and the hybrid bag was sealed, followed by incubation overnight (about 15 hours) in a water bath at 42 ° C. The membrane was washed with an appropriate amount of a wash solution (2 × SSC, 1% SDS). After measuring and confirming the rinse count lightly, washing was performed by further setting the temperature of the water bath at 55 to 60 ° C. using a fresh washing solution.
[0060]
developing
After discarding the wash solution and rinsing lightly with a fresh wash solution, the count was checked using a Geiger counter. In a dark room, a cassette, a membrane, an X-ray film, and an intensifier were placed in this order, and the cassette was placed in a freezer at -80 ° C and exposed. The X-ray film was taken out of the cassette in the dark room, and the X-ray film was put into the developer, the stop solution, and the fixer in this order, and developed.
[0061]
Positive Clone Isolation
The position of the positive clone was confirmed by overlapping the developed X-ray film and the plate with the library. Before performing Miniprep on the colonies considered to be positive clones, primers prepared based on the consensus sequence of the SINE sequence used for screening instead of the vector sequence to confirm the presence or absence of the SINE sequence in the clone Was used to perform colony PCR. Thereafter, a plasmid of a positive clone was prepared, and the region near the plasmid was determined using an LI-COR sequencer. Since the subsequent operation is as described above, it will be briefly described below.
[0062]
First, primers were prepared based on the flanking sequences, and flanking PCR was performed using genomic DNAs of various organisms as templates. And, in many cases, homologous loci can be easily amplified for closely related species of the species used for screening, but only for homologous species that are likely to have a distantly related group or divergence in an earlier age. At the locus, primers based on one type of sequence used for screening did not anneal well because amplification of more base substitutions in the vicinity of the locus, and it was often observed that amplification was not possible with the first flanking PCR. Was done. At that time, the base sequences of the amplified homologous loci of various species were determined, a consensus was obtained, new flanking primers were prepared again in consideration of the consensus, and PCR was performed again.
[0063]
When estimating the phylogenetic relationship between whales and hoofed fishes, Southern hybridization was performed after agarose gel electrophoresis to confirm whether the amplified band was a homologous locus. The process is described below. After agarose gel electrophoresis, staining with ethidium bromide (EtBr) solution was performed, and the migration pattern was confirmed and photographed with a digital camera. Thereafter, one membrane and two filter papers sufficiently immersed in a denaturing solution (0.4 NaOH, 0.6 M NaCl) are placed on the gel in this order so as to prevent air bubbles from entering between them, and a JK wiper, Kim towel ( Trademark) and a dictionary as a weight, and left overnight (~ 15 hours). The membrane was neutralized by leaving it in a neutralization solution (1 M NaCl, 0.5 M Tris-HCl (pH 7.0)) for about 15 minutes, and then dried sufficiently. Subsequent operations such as hybridization and development are the same as those in the above-described screening, and thus description thereof is omitted. In addition, when estimating the lineage relationship in the order of whales, since their base sequences were determined for most loci, they were not basically confirmed by Southern hybridization.
[0064]
Example 1: Within the whale artiodactyl genome CHR-2 Distribution of each subfamily
Regarding the origin of whales, their internal phylogeny has been categorized by morphological classification and molecular classification. There are three subspecies of the order Coleoptera, which includes many indigenous species, the Coleoptera and the Beards, and the Genius Coleoptera (also known as the Whales), which is believed to have been the ancestor of these species. It is divided into eyes (Fordyce et al., 1994), and the classification of modern whales is distinguished by having or not having teeth, as is clear from the classification name. However, bearded whales have teeth that can be confirmed to the very last stage of the outbreak, and among the fossil species of original whales, naturally, traits that are thought to be in the middle stage between tooth whales and bearded whales There are also some with whales (that is, bearded whales with teeth), so as a matter of fact, it is not possible to assert the monophylicity of tooth whales simply by the presence of teeth. This is because, when considered systematically, the "whiskers" of bearded whales are probably co-derived traits, but the "tooth" trait of tooth whales is considered a primitive trait. However, only tooth whales have the ability to eco-locate, and the accompanying melon body is one of the most famous traits suggesting monophyly of whales.
[0065]
While the morphological classification strongly insists on the monophyly of whales and bearded whales, most of the phylogenetic analyzes using molecules that have been performed so far indicate that This suggests that no phylogenetic group is formed. Among them, the spark of great controversy was the phylogenetic tree proposed by the comparative analysis of mitochondrial gene sequences of Milinkovith and Meyer (1993). According to this analysis, the sperm whale superfamily group included in tooth whales It is more closely related to bearded whales than other toothed whales (that is, toothed whales are multi-lineage). A number of molecular statistical studies have been conducted following this result, but many have resulted in multi-lineage or unresolvable dental whales (eg, Arnason et al., 1994; Adachi et al. Smith et al., 1996: see FIG. 17). Therefore, species discrimination was performed using the SINE method in order to solve the following problems: Problem (1) Problems of monophyly of cetaceans; (2) Phylogenetic relationships in the order Coleoptera including all dolphins (3) Divergence age of each cetacean. According to the present invention, it was possible to clarify not only the determination of the systematic relationship but also the problems of the statistical analysis which has been carried out with absolute reliability up to now.
[0066]
As described above, the inventor of the present application roughly divided into CHR-2 present in the artiodactyl genome, FL (Full Length), MD (Middle Deletion Type), DT (Deletion Type), and CD (Cetacea Deletion type). It has been discovered that there is a subfamily of CDOs (Cetacea Deletion type Odontoceti). The distribution of each subfamily is thought to reflect a phylogenetic relationship because the amplification stages differ during the evolution process. An alignment of the consensus sequences for each subfamily is shown in FIG. As is apparent from FIG. 18, each subfamily has a diagnostic base substitution or deletion.
[0067]
Dot hybridization was performed to confirm the distribution of these SINE subfamilies in whales and artiodactyla. For the probe used, an oligo probe was designed at a position at which the CD and CDO could be distinguished from each other (thick line of the alignment), and the PCR product was used for FL. FIG. 12 shows the results of dot hybridization. First, it was suggested that FL was distributed only in hippos and cattle (representing ruminants) in all cetaceans and artiodactyla, and was not present in the genomes of mammals added as pigs, camels and other external groups. Next, it is thought that CD is specifically distributed only in the order Coleoptera and not in the even-toothed order, strongly supporting the monophyly of the order Coleoptera. Furthermore, regarding CDO, since a strong signal is confirmed only in tooth whales, this subfamily is thought to have explosively amplified specifically in subspecies of tooth whales. Data supporting single system. However, if no signal is confirmed in the analysis by dot hybridization, it is not possible to deny the possibility that the copy number was simply low in the strain, and therefore the strain relationship cannot be estimated from the result alone. Therefore, the loci actually inserted by the SINE into the genome of the order Coleoptera were isolated and the lineage relationship was estimated.
[0068]
Example 2-1: SINE Of the internal lineage of the order Coleoptera using insertion into the genome
In the study on the internal lineage of Coleoptera, CDs that are specifically distributed throughout the Coleoptera among SINEs present in Coleoptera and CDOs that are thought to specifically amplify in the subspecies of Coleoptera are noted. Then, loci containing SINE sequences belonging to these subfamilies were isolated from various genomic libraries of the order Coleoptera. As described above, for efficient phylogenetic analysis, a prediction can be made by associating the distribution of subfamilies with their amplification times. Regarding the phylogenetic analysis of sperm whales, the reason that such loci could not be isolated despite the continued search for loci suggesting monophyly of whales is mainly It was thought that this was because they were paying attention to CDOs distributed only in. Therefore, only screening of the sperm whale genomic library was carried out using the sequence of the CD which was presumed to have been amplified immediately before the CDO. The correspondence between the names of the loci described below and the whale species used in the genomic library is summarized below: Mago: Magondow, Isi: Dolphin, Amz: Amazon dolphin, Tuti: Beaked whale, Sp and Sperm : Sperm whale, Bando: band dolphin, and Hump: humpback whale. The PCR primers used to isolate loci suggesting a phylogenetic relationship in Coleoptera are shown in Table 3 below:
[Table 3]
Figure 0003600891
Shown in
[0069]
Example 2-2: Locus supporting monophyly of cetaceans
The locus Bando1 was isolated from bottlenose dolphins, and the locus Sp316 from a sperm whale genomic library. The nucleotide sequences of these loci were determined, primers were designed in the vicinity of SINE, PCR was performed using genomic DNA of the artiodactyla as a template, and separation was performed by agarose gel electrophoresis. As a result, as shown in FIG. 19, a band pattern was confirmed at the loci Bando1 and Sp316, which had a SINE insertion commonly in whale eyes. The birch, which was used as the most closely related outer group, did not have this insertion, so it is probable that the insertion occurred when the whale was a common ancestor. These loci strongly support the monophyly of cetaceans. At the locus Bando1, it is probable that CD was first inserted into the common ancestor of the order Coleoptera, followed by insertion of CDO in the common ancestors of two species of dolphins in South America, Amazon dolphin and Laplata dolphin. Thus, this locus suggests not only the monophyly of the cetacean but also the monophyly of South African dolphins. At locus Sp316, it indicates that CHR-1 type III is a common ancestor of the order Coleoptera. 20 to 22 show the results of alignment of locus Bando1, and FIG. 23 shows the results of alignment of locus Sp316.
[0070]
Example 2-3: Locus supporting monophyly of dolphins
At the locus Mago19, insertion of CDO specific to four species of dolphins (Dermatidae: Coleoptera: Aegypti, bottlenose dolphins; Dolphinid: Dolphins; Narwidae: Narwhal) was confirmed (see FIG. 24). This locus strongly supports the monophyly of dolphins. Figures 25 and 26 show the results of the alignment of the locus Mago19.
[0071]
Example 2-4: Infraorder: Delphinida Loci that support
At loci Mago24, Mago26, Mago32, Isi14, Isi36, and Isi38, insertion of CDO was confirmed only in four species of dolphin superfamily, two species of South American dolphins, Amazon dolphin, Laplata dolphin, and Yousko dolphin (see FIGS. 27 and 28). Thus, these loci support the monophyly of this group. According to Muizon (1988, 1994), these groups are grouped as Delphinida lower order (order lower than suborder) based on morphological characteristics, but this idea is well consistent. This is strongly supported in the analysis by the sequence of the mitochondrial Cytb gene of Arnason (1996). It also suggests that the dolphins are a multi-lineage group and that Ganges dolphins are more primitive than other dolphins. FIG. 29 shows the result of alignment of the locus Ishi14. 30 to 31 show the results of alignment of the locus Ishi36. 32 to 33 show the results of alignment of the locus Ishi38. 34 to 35 show the results of alignment of the locus Mago24. 36 to 37 show the results of alignment of the locus Mago26. 38 to 39 show the results of alignment of the locus Mago32.
[0072]
Example 2-5: Locus indicating phylogenetic relationship of red whales
At the locus Mago8 and Mago13, insertion of CDOs specific to Delphinida and two species of ape and whale belonging to the family Spermaceae was confirmed (see FIG. 40). From this, it can be said that among the current species, the red whale family is the most closely related taxon to Delphinida. It can also be seen that Ganges dolphins are a more primitive group than red whales. FIG. 41 shows the result of alignment of the locus Mago8. FIG. 42 shows the result of alignment of the locus Mago13.
[0073]
Example 2-6: Gene locus suggesting a phylogenetic relationship of Ganges dolphinaceae
At the locus Mago21 and Mago22, insertion of CDOs specific to Delphinida, red whale family and Ganges dolphin was confirmed (see FIG. 43). Thus, the Ganges dolphins (Indus dolphins are not included in the analysis due to lack of samples, but probably form a monophyletic group with Ganges dolphins) may be the most primitive group of tooth whales except sperm whales It became clear. FIG. 44 shows the result of alignment of the locus Mago21. FIGS. 45-47 show the alignment results for the locus Mago22.
[0074]
Example 2-7: Gene loci supporting monophyly of whales
At loci Sperm8, Sperm28, and Sperm47, insertion of CD was confirmed in all species of the order Ceratidae including sperm whales (see FIG. 48). Analysis of these loci strongly supported the monophyly of whales, which have been questioned by molecular statistical studies. 49 to 50 show the results of alignment of the gene locus Sperm8. FIG. 51 shows the alignment result of the gene locus Sperm28. FIG. 52 shows the result of alignment of the gene locus Sperm47.
[0075]
Example 2-8: Gene loci supporting monophyly of dolphins in South America
At loci Amz13 and Bando1, CDO insertion was commonly observed in two species of South American dolphins, Amazon dolphin and Laplata dolphin (see FIG. 53). There are several hypotheses regarding the phylogenetic relationship between the two species of South American dolphins and the three species of dolphins, and that the dolphins form a monophyletic group with any of the dolphins in South America (Kasuya, 1973; Barnes et al.). al., 1985) These two loci strongly supported that the South American dolphins are monophylic. Among the several hypotheses that have been proposed so far, it is considered that this is the most ideal phylogenetic relationship in biogeography. FIG. 54 shows the result of alignment of the locus Amz13.
[0076]
Example 2-9: Locus specific for Amazon dolphins Amz11
FIG. 55 shows the band pattern of the locus Amz11 indicating that CDO was specifically inserted into the Amazon dolphin. FIG. 56 shows the alignment result of the locus Amz11.
[0077]
Example 2-10: Locus specific for red whale family Tuti24, Tuti35
FIG. 57 shows the band patterns of loci Tuti24 and Tuti35 indicating that CDO was specifically inserted into the red whale family. FIG. 58 shows the result of alignment of the locus Tuti24. FIGS. 59-60 show the results of alignment of Tuti35 locus.
[0078]
Example 2-11: Gene-specific loci for three sperm whales Sp9 And sperm whale-specific Sp2
FIG. 61 shows the locus Sp9 indicating that CDO was inserted into three species of Sperm whales, and the band pattern of Sp2 specific to Sperm whales. 62 to 63 show the results of alignment of the gene locus Sp2. FIG. 64 shows the result of alignment of the locus Sp9.
[0079]
Example 2-12: Locus specific to fin whales (or bearded whales) Hump20, Hump203
FIG. 65 shows the band patterns of the lump Hump20 and Hump203, which indicate that a CD specific to the fin whale family (or bearded whale) was inserted. 66 to 68 show the results of alignment of the locus Hump20. FIG. 69 shows the result of alignment of the locus Hump203.
[0080]
Example 3: Creation of a phylogenetic tree inside Whale
The SINE insertion patterns obtained from the above results are summarized in a matrix (see FIG. 70). FIG. 71 shows a phylogenetic tree inside the whales estimated based on this.
The nucleotide sequences of the PCR products obtained at the time of analysis of each locus were all determined and aligned as much as possible. It was confirmed that the resulting band pattern was not caused by secondary insertion or deletion. We also believe that these sequences will be important for future research as nuclear gene sequence information for whales.
[0081]
result
The phylogenetic relationships of modern cetaceans as revealed by the above examples are summarized below. 1. Dental whales form a monophyletic group. The sperm whale superfamily is the first branch of the modern dentate whale.
2. Ganges dolphins (probably Indus dolphins and a single line) diverged next to sperm whales. It is derived from a different family from other dolphins.
3. Next, the red whale family diverges. The genus Beradius and the genus Mesoprodon of the family Red Whale are a single line.
4. Two species of dolphins in South America, Amazon dolphin and Laplata dolphin, are single strains.
5. Dolphins, porpoises and narwhals belonging to the dolphin family form a monophyletic group.
[0082]
The above phylogenetic relationship is not only phylogenetically significant, but also when a sample consisting of several animals is provided, by selecting an appropriate locus in which SINE has been inserted, the base sequence can be determined. This forms the basis of the reliability of the species discrimination method using the SINE method according to the present invention, which can discriminate which specimen the specimen is without analysis. By establishing a phylogenetic tree for animals other than whales by the SINE method, a species discrimination method similar to that in the whales can be established in those eyes. This is because phylogenetic analysis using molecular statistical techniques has limitations as described below.
In the past, molecular statistical studies on phylogenetic relationships in sperm whales have yielded few results suggestive of monophyly in tooth whales. Since these analyzes mainly used the sequence of the mitochondrial gene, it was initially thought that this was a phenomenon specific to mitochondria. However, the same results were obtained in the analysis of the amino acid sequence of myoglobin (Czelusniak et al., 1990). In addition, analysis of the nuclear gene IRBP (Smith et al., 1996) shows that the multilineage of tooth whales (sperm whales are more closely related to baleen whales) is statistically advantageous. From this, it seems that statistical analysis of the molecular sequence would give a result such that the tooth whale is multi-lineage (see FIG. 72). However, the above results clearly suggest that whales form a monophyletic group, and morphological characteristics suggest that whales are monophylic.
[0083]
So why would molecular statistical analysis of whales result in sperm whales being more closely related to baleen whales? Often the issue is the choice of outgroups. In other words, only molecular distance of each group is known from the molecular information, and the roots of the phylogenetic tree (Root) are obtained by using the outer group branched before the group (in this case, dolphin, sperm whale, and baleen whale) branch. ) Needs to be determined. However, the position may differ depending on the type and number of the outer group, and an analysis in which the outer group uses only one type of cattle, such as the analysis of the earlier Arnason (1994), is considered to be considerably less reliable. In fact, according to the study of Adachi and Hasegawa (1995) regarding the Cytb gene, it has been found that changing the outgroup greatly changes the results. However, subsequent analyzes using a large number of artiodactyla and other ungulates as the outer group (Arnason et al., 1996) failed to suggest monophylogeny of dendrites, and thus were simply outgrouped. It is unlikely that the choice was a problem. Next, it is possible that the rate of molecular evolution differs between taxonomic groups. The study of Martin (1993) et al. Shows a correlation between the influence of metabolism, which is thought to affect the rate of base substitution, and the size of the body of an organism. In general, the larger the body size, the slower the rate of base substitution. Suggested that. In other words, it is considered that small-sized tooth whales such as dolphins caused a statistical error because their molecular evolution rate was higher than that of large bearded whales such as sperm whales and fin whales. However, the maximum likelihood analysis (Maximum likelihood analysis) finally used by Hasegawa (1997) for analysis is different from the maximum parsimony analysis (Maximum parsimony analysis). As a result, the result was not changed despite the fact that it is rare that a phylogenetic tree was made incorrectly.
[0084]
It is also quite possible that seed branching occurred in a short time. For example, if the sperm whales diverge from the cetacean in a very short time after the divergence of the cetaceans, it is not sufficient for the common base substitution to accumulate between the cetaceans. If there is no time, and if sperm whales have their own history for a long time until the present, the base substitution accumulated during that time will be a little common that tooth whales would have accumulated during the period of common ancestry It is considered that the base substitution is neglected. Indeed, speciation through adaptive radiation of whales is expected to have taken place at a considerable rate due to the establishment of the Antarctic Current caused by the northern deviation of the Australian continent about 35 million years ago (Fordyce, 1992). ). In such a case, it is considered that systematic estimation by molecular statistical analysis is impossible using any analysis method. Also, even if a more probable phylogenetic estimation could be made on the basis of various statistical assumptions, it would result in a rather artificial phylogenetic tree. This seems to deviate from the notion of "objectivity", which is superior to morphological research.
[0085]
【The invention's effect】
One of the advantageous effects of the method for determining an animal species according to the present invention is that the sequencing step can be omitted. In general, a sequencer costs at least 15 million yen, and for consumables, the cost of a single sequence is approximately 1200 yen. Therefore, when analyzing a large number of samples, it is very expensive. Furthermore, in the case of a commercial analysis by a test company, at present, a charge of 10,000 yen or more per sample is charged. In terms of time, the sequence determination step requires at least about one and a half hours per sample, and the species discrimination method using the SINE method, which can omit this, has high analysis efficiency. Most importantly, DNA sequence analysis involves statistical manipulations. As described above, such a statistical method has a problem in that the result differs depending on the analysis method. On the other hand, in the SINE method, the species is determined using the irreversible phenomenon of SINE insertion as an index, so that the result is clear and no special statistical processing is required. In conclusion, the species discrimination method using the SINE method according to the present invention is superior to the conventional species discrimination method based on comparison of nucleotide sequences in terms of money, time, and reliability. I can say.
[0086]
List of references
1. Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ. Basic local alignment search tool. J. Mol. Biol. 1990; 215: 403-410.
2. Batzer, M .; A. et al. African original of human-specific polymorphic Alu insertions. Proc. Nat. Acad. Sci. USA 1994; 91: 12288-12292.
3. Borodulina OR, Kramerov DA. Wide distribution of short interspersed elements amon eukaryotic genomes. FEBS Lett. 1999; 457: 409-13.
4. Britten RJ, Baron WF, Stout DB, Davidson Eli. Sources and evolution of human Alu repeated sequences. Proc. Natl. Acad. Sci. USA 1988; 85: 4770-4774.
5. Brosius J. Retroposons-seeds of evolution. Science 1991; 251: 753.
6. Bucci S, Raggianti M, Mancino G, Petroni G, Guerini F, Giampaoli S. Rana / Pol III: a family of like sequences in the genomes of western Paralytic water frogs. Genoine 1999; 42: 504-511.
7. Cao Y, Fujiwara M, Nikaido M, Okada N, Hasegawa M. International relations and timescale of european evolution as an inferred from mitochondrial genome data. 2000 (in press)
8. Clark JB, Kidwell M. A phylogenetic perspective on P transposable element evolution in Drosophila. Proc. Natl. Acad. Sci. USA 1197; 94: 11428-11433.
9. Coltman DW, Wright JM. Can SINEs: a family of tRNA-derived retropons specific to the superfamily Canoidea. Nucleic Acids Res. 1994; 22: 2726-2730.
10. Deininger PL, Batzer MA. Evolution of retroposons. Evol. Biol. 1993; 27: 157-196.
11. Deragon JM, Landry BS, Pelissier T, Tutois 5, Tourmente 5, Picard G. Analysis of retroposition in plants based on a family of SINEs from Brasica napus. J. Mol. Evol. 1994; 39: 378-386.
12. Eickbush TH. Origin and evolutionary relations of retroelements. In Morse SS. ed; The Evolutionary Biology of Viruses. New York: Raven Press. 1994. Pp. 121-157
13. Gallagher PC, Lear TL, Cool LD, Bailey E. et al. Two SINE families associated with microsatellite loci. Mamm Genome. 1999; 10: 140-144.
14. Galli G, Hofsetter H, Birnstel ML. Two conserved sequence blocks with within eukaryotic tRNA genes are major promoter elements. Nature 1981; 294: 626-631.
15. Hamada M, Takasaki N, Reist JD, De Cicco, Goto A, Okada N. Detection of the ongoing sorting of ancestry polymorphic SINEs ward fixing or loss in populations of two of the specialties. Genetics 1998; 150: 301-311.
16. Hartl DL, Lohe AR, Lozovskya ER. Modem heights on an ancident marinee: function, evolution, regulation. Annu. Rev .. Genet. 1997; 31: 337-358.
17. Hendy MD, Penny D. Syst. Zool. 1989; 38: 297-000.
18. Hennig W.M. Physiological Systems. Urbana-Champagne: University of Illinois Press. 1966.
19. Hillis DM. SINEs of the perfect character. Proc. Natl. Acad. Sci. , USA 1999; 96: 9797-9981.
20. Izsvak Z, Ivics Z, Garcia-Estefania D, Fahrnkrug SC, Hackett PB. DANA elements: a family of composite, tRNA-derived short interspersed DNA elements associated with Mutational activities in zebrashish. Proc. Natl. Acad. Sci. USA 1996; 93: 1077-1081.
21. Jurka J, Zeitkiewicz E, Labuda D. Ubiquitous mammarian-wide interspersed repeats (MIR5) are molecular fossils from the Mesozonic era. Nucleic Acids Res. 1995; 23: 170-175.
22. Kas DH, Raynor ME, Williams TM. Evolutionary history of B1 retroposons in the genus Mus. J Mol Evol. 2000; 51: 256-64.
23. Kazian HH Jr, Moran JV. The impact of Li retrotranspositions on the human genome. Nature Genetics 1998; 19: 19-24.
24. Kido Y, Himberg M, Takasaki N, Okada N. Amplification of distinct subfamilies of short interspersed elements (SINEs) duration evolution of the salmonidae. J. Mol. Biol. 1994; 241: 633-644.
25. Kido Y, Saito M, Murata 5, Okada N .; Evolution of the active sequences of the HpaI short interspersed elements. J. Mol. Evol. 1995; 41: 986-995.
26. Kim J, Martignetti JA, Shen MR, Brosius J, Deininger P. Rodent BC1 RNA gene as a master gene for ID element amplification. Proc. Natl. Acad. Sci. , USA 1994; 91: 3607-3611.
27. Kramerov D, Vassetsky N, Serdovava I. et al. The evolutionary position of Dormice (Grilidae) in Rodentia determined by a novel short retroson. Mol. Biol. Evol. 1999; 16: 715-717.
28. Leeflang EP, Liu WM, Hashimoto C, Choudary PV, Schmid CW. Phylogenetic evidence for multiple Alu source genes. J. Mol. Evol. 1992; 35: 7-16
29. Luan DD, Korman MH, Jakubczak JL, Eickbush TH. Reverse transcription of R2Bm RNA is primed by a Nick at the chromosomal target site: a mechanism for non-RTL retrotransposition. Cell 1993; 72: 595-605.
30. Lum JK, Nikaido M, Shimamura M, Shimodaira H, Shedlock AM, Okada N, Hasegawa M. Consistency of SINE insertion topology and flanking sequence tree: Quantifying relations amor- ping metatactyls. Mol. Biol. Evol. 2000; 17: 1417-1424.
31. Mater AG, Hellman U, Schmid CW. A transpositionally and transscriptionally competent Alu subfamily. Mol. Cell. Biol. 1990; i0: 5424-5432
32. Minnick MF, Stillwell LC, Heineinan JM, Stiegler GL. A high repetitive DNA sequence positively to canids. Gene 1992; 110: 235-238.
33. Miyamoto MM. Perfect SINEs of evolutionary history? Current Biology 2000; 9: 816-819.
34. Mochizuki K, Umeda M, Ohtsubo H, Ohtsubo E. Characterization of a plant SINE, p-SINE1, inlice genes. Jpn. J. Genet. 1992; 67: 155-166.
35. Murata S, Takasaki N, Saito M, Okada N. Determination of the phylogenetic relations ammong Pacific salmonids by using short interspersed elements (SINEs) astemporal landmarks. Proc. Natl. Acad. Sci. , USA 1993; 90: 6995-6999.
36. Murata S, Takasaki N, Saito M, Tachida H, Okada N. Details of retropositional genoine dynamics that provide a rationale for a genetic division: the distinct branching of all the Pacific salmon and trout (Oncorhynchus) from the Atlantic salmon and trout (Salmo). Genetics 1996; 142: 915-926.
37. Nagahashi 5, Endoh H, Suzuki Y, Okada N .; Characterization of a tandemly repeated DNA sequence family of originally derived by retroposition of tRNA (Glu) in the newt. J. Mol. Biol. 1991; 222: 391-404
38. Nei, M, Kumar S .; Molecular evolution and phylogenetics. Oxford University Press, New York. 2000.
39. Nikaido M, Rooney AP, Okada N .; Phylogenetic relations ammonium acetartiodactyls based on insertions of short and long interspersed elements resp.residences. Proc. Natl. Acad. Sci. , USA 1999; 96: 10261-10266.
40. Nikaido M, Matsuno F, Hamilton H, Brownell Jr. RL, Cao Yin, Ding Wang, Zooyan Zhu, Shedlock AM, Fordyce E, Hasegawa M, Okada N. Retroposon analysis of major cetacean lines: the monophyly of toothed whos and the paraphyly of river dolphins. Proc. Natl. Acad. Sci. USA 2001 (in press)
41. Nikaido M, Harada M, Cao Y, Hasegawa M, Okada N. Monophyletic origin of the order Chiroptera and its phylogenetic position among mammalia, as inferred from the complete sequence of the mitochondrial DNA of a Japanese megabat, the Ryukyu flying fox (Pteropus dasymallus). J. Mol. Evol. 2000; 51: 318-328.
42. Ohshima K, Koishi R, Matsuo M, Okada N. Several short interspersed repetitive elements (SINEs) in distant species may have originated from a common ancestral retrovirus: characterization of a squid SINE and a possible mechanism for generation of tRNA-derived retroposons. Proc. Natl. Acad. Sci. USA 1993; 90: 6260-6264.
43. Ohshima K, Okada N. Generality of the tRNA original of short interspersed repetitive elements (SINEs). Characterization of three different tRNA-derived retroposons in the octopus. J. Mol. Biol. 1994; 243: 25-37.
44. Ohshima K, Hamada M, Terai Y, Okada N. The 3 'ends of tRNA-derived short interspersed repetitive elements are derived from the 3' ends of long interspersed repetitive elements. Mol. Cell. Biol. 1996; 16: 3756-3764.
45. Okada N.A. SINEs: short interspersed repeated elements of the eukaryotic genome. TREE 1991a; 6: 358-361.
46. Okada N.A. SINEs. Curr. Opin. Genet. Dev. 1991b; 1: 498-504.
47. Okada N, Ohshima K. Evolution of tRNA-derived SINEs. In Maria RJ. ed; The impact of short interspersed elements (SINEs) on the host geneoine. Austin: RG Landes Co. 1995. p. 62-79.
48. Okada N, Hamada M, Ogiwara I, Ohshima K. SINEs and LINEs share common 3 'sequences: a review. Gene 1997; 205: 229-243.
49. Waddel PJ, Okada N, Hasegawa M Howards resolving the internal relations of practical mammals. Syst. Biol. 1999; 48: 1-5.
50. Rogers J. Retroposons defined. Nature 1983; 301: 460.
51. Rokas A, Holland PWH. Rare molecular changes as a tool for phylogenetics. TREE (in press)
52. Sakagami M, Ohshima K, Mukoyama H, Yasue H, Okada N. A novel tRNA species as an original of short interspersed repetitive elements (SINEs). Equine SINEs may have originated from tRNA (Ser). J. Mol. Biol. 1994; 239: 731-735.
53. Schmid C.I. Alu: structure, origin, evolution, significance and function of one-tenth of human DNA. Prog. Nucl. Acid Res. and Mol. Biol. 1996; 53: 283-319.
54. Schmid CW, Maria R .; Transcriptional regulation and transpositional selection of active SINE sequences. Curr. Opin. Genet. Devel. 1992; 2: 874-882.
55. Schmitz J, Ohxne M, Zischler H. SINE insertions in classical analysis and the phylogenetic affinities of Tarsius bancanus to other Primates. Genetics 2001 (in press)
56. Shedlock, AM. , Okada N .; SINE insertions: Powerful tools for molecular systems. BioEssays 2000; 22: 148-160.
57. Shedlock AM, Milinkovitch MC, Okada N .; SINE evolution, missing data, and the original of wholes. Syst. Biol. 2000; 49: 808-817.
58. Shedlock AM, Takahashi K, Okada N. SINEs of specification: tracking the sorting of lineswith with retroposons. TREE 2001
59. Shen MR, Batzer MA, Deininger PL. Evolution of the Master Alu Gene (s). J. Mol. Evol. 1991; 33: 311-320.
60. Sherry ST, Harpending HC, Batzer MA, Stoneking M. Alu evolution in human populations: Using the coalesced to estimate effective population size. Genetics 1997; 147: 1977-1982.
61. Shimamura M, Yasue H, Ohshima K, Abe H, Kato H, Kishiro T, Goto M, Munechika I, Okada N. Molecular evidence from retroposons that whos form a dad with even-toed ungulates. Nature 1997; 388: 666-670.
62. Shimamura M, Abe H, Nikai M, Ohshima K, Okada N. Genealogy of families of SINEs in cetacean and artiactyls: The presence of a huge superfamily of tRNAG1u-derivatives. Mol. Biol. Evol. 1999; 16: 1046-1060.
63. Smit AFA, Toth G, Riggs AD, Jurka J. Ancestral, mammarian-wide subfamilies of LINE-i repetitive sequences. J. Mol. Evol. 1995; 246: 401-417.
64. Smit AFA, Riggs AD. MIR5 are classic, tRNA-derived SINEs that amplified before the mammarian radiation. Nucleic Acids Res. 1995; 23: 98-102.
65. Springzl M .; Hartmann T, Meissner F, Moll J, Vorderwilbecke T. Compilation of tRNA sequences and sequences of tRNA genes. Nucleic Acids Res. 1987; 15: r53-r188.
66. Stoneing M. et al. Alu insertion polymorphisms and human evolution: Evidence for a large population size in Africa. Genome Res. 1997; 7: 1061-11071.
67. Surzykki SA, Belknap WR. Characterization of repetitive DNA elements in Arabidopsis. J. Mol. Biol. 1999; 48: 684-691.
68. Takahashi K, Terai Y, Nishida M, Okada N. A novel family of short interspersed repetitive elements (SINEs) from cichlids: the pattern of insertion of SINEs at orthologoous loci support the proposed monophyly of four major groups of cichlid fishes in Lake Tanganyika. Mol. Biol. Evol. 1998; 15: 391-407.
69. Takasaki N, Murata 5, Saito M, Kobayashi T, Park L, Okada N. Species-specific amplification of tRNA-derived short interspersed repetitive elements. (SINEs) by repositioning agreement: A process of proofing operations. Proc. Natl. Acad. Sci. USA 1994; 91: 10153-10157.
70. Takasaki N, Park L, Kaeriyaina M, Gharret AJ, Okada N. Characterization of species-specifically amplified SINEs in three salmonid species - chum salmon, pink salmon, and kokanee: the local enviroment of the genoine may be important for the generation of a dominant source gene at a newly retroposed locus. J. Mol. Evol. 1996; 42: 103-106.
71. Terai Y, Takahashi K, Okada N .; SINE Coinsins: The 3 'end tails of the two oldest and distillally related families of SINEs are descended from the most important items of the three years. Mol. Biol. Evol. 1998; 15: 1460-1471.
72. Unsal K, Morgan GT. A group of services of short interspersed repetitive elements (SINEs) in Xenopus: evidence of a specific matter. J. Mol. Biol. 1995; 248: 812-823.
73. van der Vlugt HHJ, Lenstra JA. SINE elements of carnivores. Mammal. Genome 1995; 6: 49-51.
74. Weiner A, Deininger PL, Estratidis A. Nonvirtual retroposons: genes, pseudogenes, and transposable elements generated by the reverse flow of genetic information. Ann. Rev .. Biochem. 1986; 55: 631-661.
75. Yoshioka Y, Matsumoto 5, Kojina 5, Ohshima K, Okada N, Machida Y. Molecular Characterization of a short interspersed repetitive element from tobacco that exhibits sequence homology to specific tRNA5. Proc. Natl. Acad. Sci. USA 1993; 90: 6562-6566.
[0087]
[Sequence list]
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891
Figure 0003600891

[Brief description of the drawings]
FIG. 1 is a general diagram for the SINE retroposition.
FIG. 2 (A) represents a master gene model, and FIG. 2 (B) represents a multi-source gene model.
FIG. 3 shows the utility of SINE as an indicator of evolution.
FIG. 4 shows a phylogenetic tree model of species AD. FIG. 4C shows a PCR pattern.
FIG. 5 is an example of some patterns of transcripts from total genomic DNA from selected animal species.
FIG. 6 shows the tRNA-like structure of CHR-2 SINE.
FIG. 7 (A) shows the tRNA-like secondary structure of CHR-2 SINE, and FIG. 7 (B) shows the secondary structure of human tRNA Glu.
FIG. 8 depicts the construction of a CHR-2 SINE consensus sequence from several sequence alignments of CHR-2.
FIG. 9 is a phylogenetic tree including an old SINE amplified at t and a young SINE amplified at u.
FIG. 10 depicts the identification of characteristic nucleotides or possible deletions representing subfamilies of the SINE family by alignment.
FIG. 11 shows an alignment of consensus sequences for subfamilies of the CHR-2 SINE family.
FIG. 12 shows the results of dot-hybridization experiments using probes specific for CD, CDO, and other subfamilies, respectively.
FIG. 13 schematically shows the principle of flanking SINE PCR.
FIG. 14 shows an example of a flanking PCR result. 14 (B) and (C) simultaneously show the results of a hybridization experiment performed using the same filter using two different probes.
FIG. 15 shows a mammalian phylogenetic tree.
FIG. 16 shows a flow of an experiment in the SINE method.
FIG. 17 shows a phylogenetic tree (controversy over the problem of monophyly of cetaceans) proposed from molecular statistical studies.
FIG. 18 shows an alignment of consensus sequences for each subfamily of CHR-2.
FIG. 19 shows the band patterns of loci Bando1 and Sp316 indicating that SINE was commonly inserted in the order of Whales.
FIG. 20 shows the results of alignment of the locus Bando1.
FIG. 21 shows the results of alignment of the locus Bando1.
FIG. 22 shows the results of alignment of the locus Bando1.
FIG. 23 shows the results of alignment of the locus Sp316.
FIG. 24 shows the band pattern of the locus Mago19, which indicates that there was a specific CDO insertion in four dolphin superfamily species (Dolphinidae: Scarabaeidae, bottlenose dolphins; porpoises; This locus strongly supports the monophyly of dolphins.
FIG. 25 shows the results of alignment of the locus Mago19.
FIG. 26 shows the results of alignment of the locus Mago19.
FIG. 27 shows the band patterns of the loci Isi14, Isi36, and Isi38, which indicate that CDO was inserted into four species of dolphins, four species of dolphins, two species of dolphins in South America;
FIG. 28 shows the band patterns of loci Mago24, Mago26, and Mago32 indicating that CDO was inserted into four species of dolphins, four species of dolphins, two species of dolphins in South America;
FIG. 29 shows the results of alignment of the locus Ishi14.
FIG. 30 shows the results of alignment of the locus Ishi36.
FIG. 31 shows the results of alignment of the locus Ishi36.
FIG. 32 shows the results of alignment of the locus Ishi38.
FIG. 33 shows the results of alignment of the locus Ishi38.
FIG. 34 shows the results of alignment of the locus Mago24.
FIG. 35 shows the results of alignment of the locus Mago24.
FIG. 36 shows the results of alignment of the locus Mago26.
FIG. 37 shows the results of alignment of the locus Mago26.
FIG. 38 shows the results of alignment of the locus Mago32.
FIG. 39 shows the results of alignment of the locus Mago32.
FIG. 40 shows the band patterns of loci Mago8 and Mago13 indicating that specific CDOs were inserted into Delphinida and two species of ape and whale that belong to the family Spermaceae.
FIG. 41 shows the results of alignment of the locus Mago8.
FIG. 42 shows the results of alignment of the locus Mago13.
FIG. 43 shows the band pattern of the locus Mago21, Mago22 indicating that there was a CDO insertion specific for Delphinida, red whale family and Ganges dolphin.
FIG. 44 shows the results of alignment of the locus Mago21.
FIG. 45 shows the results of alignment of the locus Mago22.
FIG. 46 shows the results of alignment of the locus Mago22.
FIG. 47 shows the results of alignment of the locus Mago22.
FIG. 48 shows the band patterns of the loci Sperm8, Sperm28, and Sperm47, which indicate that CD was commonly inserted in all species of the subclinical order, including sperm whales.
FIG. 49 shows the results of alignment of the gene locus Sperm8.
FIG. 50 shows the results of alignment of the Sperm8 locus.
FIG. 51 shows the results of alignment of the Sperm28 locus.
FIG. 52 shows the results of alignment of the Sperm47 locus.
FIG. 53 shows the band patterns of the loci Amz13 and Bando1 indicating that CDO was commonly inserted in two species of South American dolphins, Amazon dolphin and Laplata dolphin.
FIG. 54 shows the results of alignment of the locus Amz13.
FIG. 55 shows the band pattern of the locus Amz11 indicating that CDO was specifically inserted into the Amazon dolphin.
FIG. 56 shows the results of alignment of the locus Amz11.
FIG. 57 shows a band pattern of loci Tuti24 and Tti35 indicating that CDO was specifically inserted into the red whale family.
FIG. 58 shows the results of alignment of the Tuti24 locus.
FIG. 59 shows the results of alignment of the Tuti35 locus.
FIG. 60 shows the results of alignment of the locus Tuti35.
FIG. 61 shows the band pattern of Sp9, a locus indicating that CDO was inserted into three species of Sperm whales, and Sp2 specific to Sperm whales.
FIG. 62 shows the results of alignment of the locus Sp2.
FIG. 63 shows the results of alignment of the locus Sp2.
FIG. 64 shows the results of alignment of the locus Sp9.
FIG. 65 shows the band patterns of the loci Hump20 and Hump203, which indicate the insertion of a CD specific to the fin whale family (or bearded whale).
FIG. 66 shows the results of alignment of the Hump20 locus.
FIG. 67 shows the results of alignment of the Hump20 locus.
FIG. 68 shows the results of alignment of the Hump20 locus.
FIG. 69 shows the results of alignment of the Hump203 locus.
FIG. 70 shows a matrix in which SINE insertion patterns are summarized.
FIG. 71 shows a phylogenetic tree in the order of Coleoptera estimated based on the matrix shown in FIG. 70.
FIG. 72 shows the results (limits) of molecular statistical analysis.

Claims (25)

SINE法によりバンドウイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ、ラプラタカワイルカ、ツチクジラ、オオギハクジラ、ガンジスカワイルカ、マッコウクジラ、ザトウクジラ、ナガスクジラ、及びミンククジラを含む鯨類内の種を判別する方法であって、以下のステップ:
判別しようとする上記鯨類内の1種からゲノムDNAライブラリーを作成し;
上記ライブラリーから、配列番号6に示すCD配列及び配列番号7に示すCDO配列から成る群から選ばれる配列を含むオルソロガス遺伝子座を含むクローンを単離し;
上記遺伝子座において上記CD配列又はCDO配列の両側に位置するフランキング配列にアニールするPCRプライマーのセットを用いて、上記種について上記遺伝子座の配列をPCRにより増幅し;そして
得られたPCR産物をゲル電気泳動して、上記遺伝子座の存在を示すバンドの有無により、上記種を判別する;
を含む、前記方法。
A method for discriminating among species including a bottlenose dolphin, a humpback whale, a fin whale, a fin whale, a fin whale and a fin whale, a sperm whale, a humpback whale, and a fin whale, a sperm whale, a humpback whale, a ganji swelling dolphin, a sperm whale, a giant whale, a fin whale, a fin whale, a fin whale, a fin whale, a fin whale, and a fin whale There are the following steps:
Creating a genomic DNA library from one of the above whales to be identified;
Isolating from said library a clone containing an orthologous locus comprising a sequence selected from the group consisting of the CD sequence shown in SEQ ID NO: 6 and the CDO sequence shown in SEQ ID NO: 7;
Amplifying by PCR the sequence at the locus for the species using a set of PCR primers that anneal to flanking sequences located on either side of the CD or CDO sequence at the locus; Gel electrophoresis to determine the species by the presence or absence of a band indicating the presence of the locus;
The method, comprising:
前記オルソロガス遺伝子座が、配列番号8〜21のいずれか1に示す配列に相当するBando1であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がアマゾンカワイルカ又はラプラタカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Bando1, which corresponds to the sequence shown in any one of SEQ ID NOs: 8 to 21, and its presence in the gel electrophoresis indicates that one species of the cetacean to be discriminated is Amazon dolphin Or the method of claim 1, wherein the method is indicative of Laplata dolphin. 前記オルソロガス遺伝子座が、配列番号36〜46のいずれか1に示す配列に相当するMago19であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ又はイッカクであることを指標する、請求項1に記載の方法。The orthologous locus is Mago19 corresponding to the sequence shown in any one of SEQ ID NOs: 36 to 46, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a Pacific dolphin 2. The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin or a narwhal. 前記オルソロガス遺伝子座が、配列番号47〜51のいずれか1に示す配列に相当するIshi14であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ又はラプラタカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Ishi14 corresponding to the sequence shown in any one of SEQ ID NOs: 47 to 51, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a bottlenose dolphin 2. The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin, a porpoise, a narwhal, a northern dolphin, an Amazon dolphin, or a laplata dolphin. 前記オルソロガス遺伝子座が、配列番号52〜65のいずれか1に示す配列に相当するIshi36であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ又はラプラタカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Ishi36 corresponding to the sequence shown in any one of SEQ ID NOS: 52 to 65, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a Pacific dolphin 2. The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin, a porpoise, a narwhal, a northern dolphin, an Amazon dolphin, or a laplata dolphin. 前記オルソロガス遺伝子座が、配列番号66〜79のいずれか1に示す配列に相当するIshi38であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ又はラプラタカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Ishi38 corresponding to the sequence shown in any one of SEQ ID NOs: 66 to 79, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a Pacific dolphin 2. The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin, a porpoise, a narwhal, a northern dolphin, an Amazon dolphin, or a laplata dolphin. 前記オルソロガス遺伝子座が、配列番号211〜224のいずれか1に示す配列に相当するMago24であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ又はラプラタカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Mago24 corresponding to the sequence shown in any one of SEQ ID NOs: 211 to 224, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a bottlenose dolphin 2. The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin, a porpoise, a narwhal, a northern dolphin, an Amazon dolphin, or a laplata dolphin. 前記オルソロガス遺伝子座が、配列番号225〜238のいずれか1に示す配列に相当するMago26であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ又はラプラタカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Mago26 corresponding to the sequence shown in any one of SEQ ID NOs: 225 to 238, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a bottlenose dolphin 2. The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin, a porpoise, a narwhal, a northern dolphin, an Amazon dolphin, or a laplata dolphin. 前記オルソロガス遺伝子座が、配列番号80〜93のいずれか1に示す配列に相当するMago32であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ又はラプラタカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Mago32 corresponding to the sequence shown in any one of SEQ ID NOs: 80 to 93, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a bottlenose dolphin 2. The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin, a porpoise, a narwhal, a northern dolphin, an Amazon dolphin, or a laplata dolphin. 前記オルソロガス遺伝子座が、配列番号94〜98のいずれか1に示す配列に相当するMago8であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ、ラプラタカワイルカ、ツチクジラ又はオオギハクジラであることを指標する、請求項1に記載の方法。The orthologous locus is Mago8 corresponding to the sequence shown in any one of SEQ ID NOs: 94 to 98, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a Pacific dolphin The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin, a porpoise, a narwhal, a dolphin, a dolphin, an Amazon dolphin, a laplata dolphin, a beaked whale, or a giant whale. 前記オルソロガス遺伝子座が、配列番号99〜112のいずれか1に示す配列に相当するMago13であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ、ラプラタカワイルカ、ツチクジラ又はオオギハクジラであることを指標する、請求項1に記載の方法。The orthologous locus is Mago13 corresponding to the sequence shown in any one of SEQ ID NOs: 99 to 112, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a bottlenose dolphin The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin, a porpoise, a narwhal, a dolphin, a dolphin, an Amazon dolphin, a laplata dolphin, a beaked whale, or a giant whale. 前記オルソロガス遺伝子座が、配列番号113〜117のいずれか1に示す配列に相当するMago21であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ、ラプラタカワイルカ、ツチクジラ、オオギハクジラ又はガンジスカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Mago21 corresponding to the sequence shown in any one of SEQ ID NOS: 113 to 117, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a bottlenose dolphin The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin, a porpoise, a narwhal, a dolphin, a dolphin, an Amazon dolphin, a La Plata dolphin, a beaked whale, a giant whale, or a Ganges dolphin. 前記オルソロガス遺伝子座が、配列番号239〜252のいずれか1に示す配列に相当するMago22であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ、ラプラタカワイルカ、ツチクジラ、オオギハクジラ又はガンジスカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Mago22 corresponding to the sequence shown in any one of SEQ ID NOs: 239 to 252, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a bottlenose dolphin The method of claim 1, wherein the method is indicative of being a dolphin, a dolphin, a porpoise, a narwhal, a dolphin, a dolphin, an Amazon dolphin, a La Plata dolphin, a beaked whale, a giant whale, or a Ganges dolphin. 前記オルソロガス遺伝子座が、配列番号118〜129のいずれか1に示す配列に相当するSperm8であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ、ラプラタカワイルカ、ツチクジラ、オオギハクジラ、ガンジスカワイルカ又はマッコウクジラであることを指標する、請求項1に記載の方法。The orthologous locus is Sperm8 corresponding to the sequence shown in any one of SEQ ID NOs: 118 to 129, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a bottlenose dolphin The method of claim 1, wherein the indicator indicates that the species is a dolphin, a dolphin, a porpoise, a narwhal, a dolphin, a dolphin, an Amazon dolphin, a Laplata dolphin, a beaked whale, a giant whale, a Ganges dolphin or a sperm whale. 前記オルソロガス遺伝子座が、配列番号130〜135のいずれか1に示す配列に相当するSperm28であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ、ラプラタカワイルカ、ツチクジラ、オオギハクジラ、ガンジスカワイルカ又はマッコウクジラであることを指標する、請求項1に記載の方法。The orthologous locus is Sperm28 corresponding to the sequence shown in any one of SEQ ID NOS: 130 to 135, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a Pacific dolphin The method of claim 1, wherein the indicator indicates that the animal is a dolphin, a dolphin, a porpoise, a narwhal, a dolphin, a dolphin, an Amazon dolphin, a laplata dolphin, a beaked whale, a giant whale, a Ganges dolphin or a sperm whale. 前記オルソロガス遺伝子座が、配列番号136〜140のいずれか1に示す配列に相当するSperm47であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がバンドウカワイルカ、コビレゴンドウ、イシイルカ、イッカク、ヨウスコウカワイルカ、アマゾンカワイルカ、ラプラタカワイルカ、ツチクジラ、オオギハクジラ、ガンジスカワイルカ又はマッコウクジラであることを指標する、請求項1に記載の方法。The orthologous locus is Sperm47 corresponding to the sequence shown in any one of SEQ ID NOs: 136 to 140, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a bottlenose dolphin The method of claim 1, wherein the indicator indicates that the species is a dolphin, a dolphin, a porpoise, a narwhal, a dolphin, a dolphin, an Amazon dolphin, a Laplata dolphin, a beaked whale, a giant whale, a Ganges dolphin or a sperm whale. 前記オルソロガス遺伝子座が、配列番号141〜145のいずれか1に示す配列に相当するAmz13であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がアマゾンカワイルカ又はラプラタカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Amz13 corresponding to the sequence shown in any one of SEQ ID NOs: 141 to 145, and its presence in the gel electrophoresis indicates that one species of the cetacean species to be discriminated is Amazon dolphin Or the method of claim 1, wherein the method is indicative of Laplata dolphin. 前記オルソロガス遺伝子座が、配列番号146〜151のいずれか1に示す配列に相当するAmz11であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がアマゾンカワイルカであることを指標する、請求項1に記載の方法。The orthologous locus is Amz11 corresponding to the sequence shown in any one of SEQ ID NOs: 146 to 151, and its presence in the gel electrophoresis indicates that one species of the cetacean to be discriminated is Amazon dolphin The method of claim 1, wherein the method indicates: 前記オルソロガス遺伝子座が、配列番号152〜156のいずれか1に示す配列に相当するTuti24であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がツチクジラ又はオオギハクジラであることを指標する、請求項1に記載の方法。The orthologous locus is Tuti24 corresponding to the sequence shown in any one of SEQ ID NOs: 152 to 156, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a sperm whale or The method of claim 1, wherein the method is indicative of a giant whale. 前記オルソロガス遺伝子座が、配列番号157〜171のいずれか1に示す配列に相当するTuti35であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がツチクジラ又はオオギハクジラであることを指標する、請求項1に記載の方法。The orthologous locus is Tuti35 corresponding to the sequence shown in any one of SEQ ID NOs: 157 to 171, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a sperm whale or The method of claim 1, wherein the method is indicative of a giant whale. 前記オルソロガス遺伝子座が、配列番号172〜185のいずれか1に示す配列に相当するSp2であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がマッコウクジラであることを指標する、請求項1に記載の方法。The orthologous locus is Sp2 corresponding to the sequence shown in any one of SEQ ID NOs: 172 to 185, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a sperm whale The method of claim 1, wherein the method indicates: 前記オルソロガス遺伝子座が、配列番号186〜190のいずれか1に示す配列に相当するSp9であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がマッコウクジラであることを指標する、請求項1に記載の方法。The orthologous locus is Sp9 corresponding to the sequence shown in any one of SEQ ID NOs: 186 to 190, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is one of the sperm whales The method of claim 1, wherein the method indicates: 前記オルソロガス遺伝子座が、配列番号191〜204のいずれか1に示す配列に相当するHump20であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がザトウクジラ、ナガスクジラ又はミンククジラであることを指標する、請求項1に記載の方法。The orthologous locus is Hump20 corresponding to the sequence shown in any one of SEQ ID NOs: 191 to 204, and its presence in the gel electrophoresis indicates that one of the whales to be identified is a humpback whale. The method of claim 1, wherein the method is indicative of being a fin or minke whale. 前記オルソロガス遺伝子座が、配列番号205〜210のいずれか1に示す配列に相当するHump203であり、そして前記ゲル電気泳動におけるその存在が、前記判別しようとする前記鯨類内の1種がザトウクジラ、ナガスクジラ又はミンククジラであることを指標する、請求項1に記載の方法。The orthologous locus is Hump203 corresponding to the sequence shown in any one of SEQ ID NOS: 205 to 210, and its presence in the gel electrophoresis indicates that one of the whales to be discriminated is a humpback whale. The method of claim 1, wherein the method is indicative of being a fin or minke whale. 前記PCRプライマーが、配列番号276〜325から成る群から選ばれる、請求項1に記載の方法。2. The method of claim 1, wherein said PCR primer is selected from the group consisting of SEQ ID NOs: 276-325.
JP2001126667A 2001-04-24 2001-04-24 Animal species discrimination method by SINE method Expired - Fee Related JP3600891B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001126667A JP3600891B2 (en) 2001-04-24 2001-04-24 Animal species discrimination method by SINE method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001126667A JP3600891B2 (en) 2001-04-24 2001-04-24 Animal species discrimination method by SINE method

Publications (2)

Publication Number Publication Date
JP2003009866A JP2003009866A (en) 2003-01-14
JP3600891B2 true JP3600891B2 (en) 2004-12-15

Family

ID=18975661

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001126667A Expired - Fee Related JP3600891B2 (en) 2001-04-24 2001-04-24 Animal species discrimination method by SINE method

Country Status (1)

Country Link
JP (1) JP3600891B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5601746B2 (en) 2006-03-16 2014-10-08 日本ソフトウェアマネジメント株式会社 Two-step nucleic acid test method using the same sample

Also Published As

Publication number Publication date
JP2003009866A (en) 2003-01-14

Similar Documents

Publication Publication Date Title
Du et al. The sterlet sturgeon genome sequence and the mechanisms of segmental rediploidization
Rastas et al. Construction of ultradense linkage maps with Lep-MAP2: stickleback F 2 recombinant crosses as an example
Waeschenbach et al. Adding resolution to ordinal level relationships of tapeworms (Platyhelminthes: Cestoda) with large fragments of mtDNA
Bely et al. Lessons from leeches: a call for DNA barcoding in the lab
Mouse Genome Sequencing Consortium Genome Sequencing Center: Chinwalla Asif T. 1 Cook Lisa L. 1 Delehaunty Kimberly D. 1 Fewell Ginger A. 1 Fulton Lucinda A. 1 Fulton Robert S. 1 Graves Tina A. 1 Hillier LaDeana W. 1 Mardis Elaine R. 1 McPherson John D. 1 Miner Tracie L. 1 Nash William E. 1 Nelson Joanne O. 1 Nhan Michael N. 1 Pepin Kymberlie H. 1 Pohl Craig S. 1 Ponce Tracy C. 1 Schultz Brian 1 Thompson Johanna 1 Trevaskis Evanne 1 Waterston Robert H. waterston@ gs. washington. edu 1 y Wendl Michael C. 1 Wilson Richard K. 1 Yang Shiaw-Pyng 1 et al. Initial sequencing and comparative analysis of the mouse genome
Papillon et al. Identification of chaetognaths as protostomes is supported by the analysis of their mitochondrial genome
Cheng et al. The American paddlefish genome provides novel insights into chromosomal evolution and bone mineralization in early vertebrates
CN110313034A (en) The method and system of generation and error correction for the unique molecular index set with non-homogeneous molecular length
Yazawa et al. EST and mitochondrial DNA sequences support a distinct Pacific form of salmon louse, Lepeophtheirus salmonis
Okada et al. Retroposon mapping in molecular systematics
Martins et al. Cytogenetic mapping and contribution to the knowledge of animal genomes
Ferchaud et al. Chromosome-level assembly reveals a putative Y-autosomal fusion in the sex determination system of the Greenland Halibut (Reinhardtius hippoglossoides)
Petrosino et al. Identification of LINE retrotransposons and long non-coding RNAs expressed in the octopus brain
Brabec et al. The evolution of endoparasitism and complex life cycles in parasitic platyhelminths
Lehmann et al. DNA transposon expansion is associated with genome size increase in mudminnows
Alam et al. Complete mitochondrial genomes and novel gene rearrangements in two dicroglossid frogs, Hoplobatrachus tigerinus and Euphlyctis hexadactylus, from Bangladesh
Zhang et al. Mitochondrial genome of Episesarma lafondii (Brachyura: Sesarmidae) and comparison with other sesarmid crabs
Dong et al. A chromosome-level genome assembly of Ostrea denselamellosa provides initial insights into its evolution
Pasa et al. Ten complete mitochondrial genomes of Gymnocharacini (Stethaprioninae, Characiformes). insights into evolutionary relationships and a repetitive element in the control region (D-loop)
Park et al. Light microscopic observations, ultrastructure, and molecular phylogeny of Hicanonectes teleskopos ng, n. sp., a deep‐branching relative of diplomonads
JP3600891B2 (en) Animal species discrimination method by SINE method
Perez et al. Third-generation sequencing reveals the adaptive role of the epigenome in three deep-sea polychaetes
Li et al. A workflow of massive identification and application of intron markers using snakes as a model
Mota et al. Unzipped genome assemblies of polyploid root-knot nematodes reveal unusual and clade-specific telomeric repeats
Peichel et al. Assembly of a young vertebrate Y chromosome reveals convergent signatures of sex chromosome evolution

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20040128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040511

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040831

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees