JP2004000115A - Method for judging development risk of diabetes - Google Patents

Method for judging development risk of diabetes Download PDF

Info

Publication number
JP2004000115A
JP2004000115A JP2002261405A JP2002261405A JP2004000115A JP 2004000115 A JP2004000115 A JP 2004000115A JP 2002261405 A JP2002261405 A JP 2002261405A JP 2002261405 A JP2002261405 A JP 2002261405A JP 2004000115 A JP2004000115 A JP 2004000115A
Authority
JP
Japan
Prior art keywords
nucleotide
seq
gene
intron
gfat1
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002261405A
Other languages
Japanese (ja)
Inventor
Mitsuo Itakura
板倉 光夫
Hiroaki Yasukumo
安雲 浩明
Ichiro Watanabe
渡辺 一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sankyo Co Ltd
Original Assignee
Sankyo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sankyo Co Ltd filed Critical Sankyo Co Ltd
Priority to JP2002261405A priority Critical patent/JP2004000115A/en
Publication of JP2004000115A publication Critical patent/JP2004000115A/en
Withdrawn legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide a simple method for judging the relative development risk of diabetes. <P>SOLUTION: The method for judging the development risk of diabetes comprises detecting genetic polymorphism existing on one or more positions selected from nucleotides at the 36th of first intron on GFAT1 gene, at the 7th of intron 11, at -147th of 12 intron, at 1853th to 1877th of intron 8, at 1988th to 2007th of 12 intron, at -11th to -22th of intron 18, at 2632th to 2661th of intron 3 and at 66th of exon 18 of GFTA2 gene or a haplotype comprising its combination from a specimen containing a human genome DNA. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、糖尿病の発症危険性判定方法に関する。より詳しくは、ヒトゲノムDNAを含む試料から、糖尿病の発症に関連した新規遺伝子多型を検出することにより、該試料提供者が糖尿病を発症する潜在的な危険度を判定する方法に関する。
【0002】
【従来の技術】
糖尿病は近年その患者数が増加しており、成人病のひとつとして注目されている。糖尿病には、インスリン依存型の1型糖尿病と非依存型の2型糖尿病があるが、このうち2型糖尿病(インスリン非依存性糖尿病、NIDDM)は日本人に多い糖尿病のタイプであり、早期発見、早期治療がその予後の点から重要である。
【0003】
しかし、2型糖尿病はその成因が多様であり、予想される原因についての知見は乏しい。2型糖尿病におけるインスリン作用不足の原因としては、インスリン感受性機構の異常とインスリン分泌の低下が挙げられる。欧米では多くは前者、すなわちインスリン抵抗性が2型糖尿病の主な原因であるが、日本ではインスリン分泌不全が主な原因である場合も少なくない。
【0004】
一方、糖尿病はその合併症として、網膜症、神経症、動脈硬化、あるいは、腎症などを発症する。特に、糖尿病患者が腎症を併発すると、腎障害が原因となって高血圧症や高脂血症を悪化させ、患者の予後を更に悪化させる。そのため、糖尿病合併症の中でも、腎症の予防や治療は特に重要な問題となる。
【0005】
近年、分子生物学の急速な進展により、インスリン作用機作に関する知見が集積されてきた。インスリン受容体構造の解明にはじまり、受容体以降のシグナル伝達機構も次第に明らかとなってきた。こうしたなかで、従来の経口血糖低下薬とは作用メカニズムの全く異なる糖尿病治療薬〔α−グリコシダーゼ阻害薬:Acarbose, Voglibose(例えば、非特許文献1〜6参照)、インスリン抵抗性改善薬:Troglitazone, Pioglitazone(例えば、非特許文献7〜11参照)〕も登場し、発売された。一方、米国では1996年にビグアナイド剤が糖尿病治療薬として認可され、日常診療での糖尿病治療が可能となり注目を集めている(例えば、非特許文献12および13参照)。これらの薬剤はいずれも、日常診療で古くから汎用されてきたスルフォニル尿素(SU)剤とは異なり、膵β細胞からのインスリン分泌を促進することなく血糖を下げる作用を有している。
【0006】
現在、インスリン抵抗性を改善する働きをもった糖尿病治療薬の作用メカニズムとしては、以下の9項目が考えられている。インスリン受容体キナーゼの活性化、糖輸送担体の細胞膜への移行促進、糖代謝の律速酵素の働きや糖代謝異常の是正、肝糖新生の抑制、肝による糖取り込み促進、肝グリコーゲン生成の亢進、血中脂質の低下、血中脂質の低下に伴う肝糖新生の減少、血中脂質の低下に伴うインスリン感受性の亢進である。
【0007】
ところで、グルタミン:フルクトース−6−リン酸アミドトランスフェラーゼ(以下「GFAT」という)は、ヘキソサミン生合成経路において、律速段階であるフルクトース−6−リン酸からグルコサミン−6−リン酸への反応を触媒する重要な酵素である。GFAT活性を阻害する薬剤は細胞内へのグルコースの取り込みを促進し、血糖値を低下させることができると考えられており、そのため糖尿病治療薬としての開発が期待されている。このGFAT阻害剤の作用機作は、以下のように説明される。
【0008】
ヘキソサミン生合成経路はその代謝過程において、UDP−N−アセチルグルコサミン、CMP−N−アセチルノイラミン酸等を産生するが、これらはタンパク質の糖化修飾やプロテオグリカンあるいはガングリオシド等の粗原料として流れていくと考えられている。
【0009】
一方、インスリンが細胞表面のレセプターに結合すると細胞内シグナルが活性化され、細胞内にプールされていた糖輸送担体(GLUT4など)が膜表層に移行し、グルコースの取り込みが促進される。取り込まれたグルコースは解糖系により代謝され、エネルギー源としてのATPを蓄積するが、過剰に取り込まれた場合はグルコース代謝物であるフルクトース−6−リン酸がヘキソサミン生合成経路へ流れることになる。流れたフルクトース−6−リン酸は、GFATによりグルコサミン−6−リン酸に変換される。詳細な機構は不明であるが、様々な状況証拠から、このグルコサミン−6−リン酸代謝産物が糖輸送担体の膜移行を抑制し、それによって細胞内へのグルコース取り込みが抑制されることが判明している(例えば、非特許文献14〜18参照)。これらのことから、ヘキソサミン生合成経路は、その一つの役割として、グルコースの過剰取り込みに対するフィードバック機構として機能するものと考えられる。そして、GFATはその経路における律速酵素として重要な役割を担う。
【0010】
また、最近、GFATのアンチセンスヌクレオチドを過剰発現させたトランスジェニックマウスではGFATの発現が構成的に抑制され、膵臓のβ細胞の選択的破壊薬であるストレプトゾトシンを投与すると、β細胞のアポトーシスが抑制されて、血糖値が改善されることが報告されている(例えば、非特許文献19参照)。
【0011】
糖尿病患者においては、このGFAT活性が一般的に高いことが知られており、高血糖値を示す一つの原因であると考えられる(例えば、非特許文献20参照)。
【0012】
ヒト由来のGFATは、現在GFAT1(例えば、非特許文献21参照)とGFAT2(例えば、特許文献1および非特許文献22参照)の2種が知られている。GFAT1は681アミノ酸から、GFAT2は682アミノ酸からなる、それぞれ77kDaのタンパク質であることが報告されているが、GFAT1遺伝子については、その全長配列は未だ解明されていない。また、ヒトGFAT1と同GFAT2のアミノ酸配列相同性は78%である。また、マウス由来(例えば、非特許文献23参照)、酵母由来GFAT(例えば、非特許文献24参照)、あるいは、大腸菌由来GFAT(例えば、非特許文献25参照)も報告されているが、いずれもヒトGFATに高い相同性を示す。
【0013】
最近のファーマコジェノミクス研究の進展により、遺伝子多型と薬効、あるいは遺伝子多型と副作用の関係から、個々の患者に対する薬物の効果や副作用を、遺伝子診断で予測することが可能になりつつある。また、遺伝子多型と疾患との関係を調べることにより、一部の疾患の事前診断や予後の判定も可能になりつつある。前者の例としては、薬物代謝酵素の遺伝子多型の例が挙げられる。多型により活性が増加、あるいは、減少する薬物代謝酵素としては、シトクロムP4501A2、シトクロムP4502A6、シトクロムP4502C9、シトクロムP4502C19,シトクロムP4502D6、シトクロムP4502E1などが知られている。また、チオプリンメチルトランスフェラーゼ、N−アセチルトランスフェラーゼ、UDP−グルクウロノシルトランスフェラーゼ、および、グルタチオンS−トランスフェラーゼなど抱合酵素と呼ばれる一群の酵素群にも遺伝子多型が存在し、多型により活性が減少することが報告されている(例えば、非特許文献26参照)。後者の例としては、多型解析研究から見出された、疾患原因遺伝子が多数報告されている。例えば、▲1▼潰瘍性大腸炎の原因遺伝子としてのHLA、▲2▼慢性関節リウマチの原因遺伝子としてのTCRα、▲3▼アルツアイマー病の原因遺伝子としてのAPOE4、▲4▼精神分裂症の原因遺伝子としてのドーパミンD3受容体、▲5▼躁鬱病の原因遺伝子としてのトリプトファン水酸化酵素、▲6▼アルブミン尿症の原因遺伝子としてのアンジオテンシン前駆体、▲7▼心筋梗塞の原因遺伝子としての血液凝固因子VII、▲8▼肥満の原因遺伝子としてのレプチンなどが挙げられる(例えば、非特許文献27参照)。
【0014】
TNF−αは、各種炎症性疾患の病態形成に関与する重要な物質であると考えられているが、最近、TNF−α遺伝子の5’末端側上流域にこの遺伝子の発現を亢進する多型が存在することが見出された(例えば、非特許文献28参照)。これらの多型は、TNF−α遺伝子の発現量を亢進させるものであるため、多型を検出することにより、若年性関節リウマチ、慢性関節リウマチ、糖尿病等のTNF−αが関与する疾患の事前診断が可能となる(例えば、特許文献2参照)。
【0015】
糖尿病に関しても、遺伝子の変異と糖尿病発症との関連が検討されている。現在までに明らかになっている、単独の異常によって糖尿病を発症するとされている遺伝子としては、インスリン、インスリン受容体、インスリンプロモーター因子、グルコキナーゼ、ヘパトサイトニュークレアーファクター、アミリン、骨格筋グリコーゲン合成酵素、およびミトコンドリア遺伝子などがある。また、2型糖尿病の発症に関与すると考えられる遺伝子として、インスリンレセプターサブストレイト、グルコーストランスポーター、ミトコンドリアグリセロリン酸デヒドロゲナーゼ、脂肪酸結合タンパク質、アドレナリンレセプター、グルカゴンレセプター、カリウムチャンネル、CD38などが挙げられる(例えば、非特許文献29参照)。
【0016】
また、最近、CD38におけるArg140Trp多型は、糖尿病のリスクを上昇させることが報告された(例えば、非特許文献30参照)。この多型は、日本人の糖尿病患者に約13%の頻度で見出されていることから、糖尿病の対するリスク診断に有用であると考えられている。
【0017】
しかしながら、GFAT遺伝子の多型と2型糖尿病との関係については何ら知られていない。また、2型糖尿病は、単一の遺伝子の変異や多型によって生じるというよりは、複数の遺伝子多型、あるいは、食生活などの外的要因で発症すると考えられており、その発症機構には未解明な点が多い。したがって、2型糖尿病の発症に関与する遺伝子やその多型については、今後さらにその研究を進めることが望まれている。
【0018】
【特許文献1】
特開平10−108683号公報
【特許文献2】
国際公開第98/54361号パンフレット
【0019】
【非特許文献1】
ダイアビティース・フロンティア(Diabetes Frontier), 3, 557−564 (1992)
【非特許文献2】
ドラッグス(Drugs), 46,1025−1054 (1994)
【非特許文献3】
医学のあゆみ, 149, 591−618 (1989)
【非特許文献4】
臨床と研究,67, 219−233 (1990)
【非特許文献5】
臨床と研究, 69, 919−932 (1992)
【非特許文献6】
臨床医21(増刊), 578−587(1995)
【非特許文献7】
ダイアビティース(Diabetes), 37, 1549−1558 (1998)
【非特許文献8】
ライフ・サイエンス(Life Sci.), 67, 2405−2416 (2000)
【非特許文献9】
メタボリズム(Metabolism), 44, 486−490 (1995)
【非特許文献10】
ニュー・イングランド・ジャーナル・オブ・メディシン(New Engl. J.Med.), 331, 1188−1193 (1994)
【非特許文献11】
後藤由夫編,「新しい糖尿病治療薬」,医薬ジャーナル社,大阪, (1994)
【非特許文献12】
ニュー・イングランド・ジャーナル・オブ・メディシン(New Engl. J. Med.), 333, 541−549 (1995)
【非特許文献13】
ダイアビティース・スペクトラム(Diabetes Spectrum), 8, 194 −197(1995)
【非特許文献14】
ファセブ・ジャーナル(FASEB J.),5, 3031−3036 (1991)
【非特許文献15】
ダイアビィトロジア(Diabetologia), 38, 518−524 (1995)
【非特許文献16】
ジャーナル・オブ・バイオロジカル・ケミストリー(J. Biol. Chem.), 266,10155−10161 (1991)
【非特許文献17】
ジャーナル・オブ・バイオロジカル・ケミストリー(J. Biol. Chem.), 266,4706−4712 (1991)
【非特許文献18】
エンドクリノロジー(Endocrinology), 136, 2809−2816 (1995)
【非特許文献19】
プロシーディングス・オブ・ザ・ナショナル・アカデミィ・オブ・サイエンシズ・オブ・ザ・ユナイテット・ステーツ・オブ・アメリカ(Proc. Natl. Acad. Sci. USA), 97, 2820−2825 (2000)
【非特許文献20】
ダイアビティース(Diabetes), 45, 302−307 (1996)
【非特許文献21】
ジャーナル・オブ・バイオロジカル・ケミストリー(J. Biol. Chem.), 267,25208−25212 (1992)
【非特許文献22】
ゲノミクス(Genomics), 57, 227−234 (1999)
【非特許文献23】
ジーン(Gene), 140, 289−290 (1994)
【非特許文献24】
ジャーナル・オブ・バイオロジカル・ケミストリー(J. Biol. Chem.), 264,8753−8758 (1989)
【非特許文献25】
バイオケミカル・ジャーナル(Biochem. J.), 224, 779−815 (1984)
【非特許文献26】
中村祐輔編,「SNP遺伝子多型の戦略」,中山書店,東京, (2000)
【非特許文献27】
ネイチャー・ジェネティクス(Nat. Genet.), 22, 139−144 (1999)
【非特許文献28】
ティシュー・アンチゲンズ(Tissue Antigens), 51, 605−612 (1998)
【非特許文献29】
門脇孝編,「糖尿病の最前線」,羊土社,東京, (1997)
【非特許文献30】
ダイアベトロジア(Diabetologia), 41, 1024−1028 (1998)
【0020】
【発明が解決しようとする課題】
本発明の目的は、糖尿病、特に2型糖尿病の発症の危険度を判定するための判定方法、および該方法のための試薬およびキットを提供することにある。
【0021】
【課題を解決するための手段】
本発明者らは、糖尿病患者および健常者から単離したDNA試料を対象として、GFAT1遺伝子およびGFAT2遺伝子中に存在する遺伝子多型の頻度を調べた結果、糖尿病患者に高い頻度で現れる複数の遺伝子多型が存在することを見出した。そして、該遺伝子多型を検出することにより、糖尿病を発症する潜在的な危険度を高い確率で判定できることを見出し、本発明を完成させた。
【0022】
すなわち、本発明は以下の(1)〜(13)を提供する。
(1)ヒトゲノムDNAを含む試料において、下記a)〜h)から選ばれるいずれか一つまたは二つ以上の位置に存在する遺伝子多型、および/またはその組合せからなるハプロタイプを検出することにより、該試料提供者の糖尿病の発症危険度を判定する方法。
a)GFAT(グルタミン:フルクトース−6−リン酸アミドトランスフェラーゼ)1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)
d)GFAT1遺伝子の第8イントロンの1853〜1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)
e)GFAT1遺伝子の第12イントロンの1988〜2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)
f)GFAT1遺伝子の第18イントロンの−11〜−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)
g)GFAT1遺伝子の第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)
h)GFAT2遺伝子の第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)
【0023】
(2)糖尿病が2型糖尿病である、上記(1)に記載の方法。
【0024】
(3)検出対象が、下記a)〜f)およびh)の位置に存在する遺伝子多型、ならびに下記x)〜z)で示されるハプロタイプ、から選ばれるいずれか一つまたは二つ以上である、上記(1)または(2)に記載の方法。
a)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)
d)GFAT1遺伝子の第8イントロンの1853〜1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)
e)GFAT1遺伝子の第12イントロンの1988〜2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)
f)GFAT1遺伝子の第18イントロンの−11〜−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)
h)GFAT2遺伝子の第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)
x)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)、および同第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在する遺伝子多型の組合せからなるハプロタイプ
y)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)、および同第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在する遺伝子多型の組合せからなるハプロタイプ
z)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)、および同第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)に存在する遺伝子多型の組合せからなるハプロタイプ
【0025】
(4)ヒトゲノムDNAを含む試料において、下記h)の位置に存在する遺伝子多型、およびx)〜z)で示されるハプロタイプから選ばれるいずれか一つまたは二つ以上を検出することにより、該試料提供者の腎症を伴わない2型糖尿病の発症危険度を判定する方法。
h)GFAT2遺伝子の第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)
x)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)、および同第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在する遺伝子多型の組合せからなるハプロタイプ
y)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)、および同第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在する遺伝子多型の組合せからなるハプロタイプ
z)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)、および同第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)に存在する遺伝子多型の組合せからなるハプロタイプ
【0026】
(5)ヒトゲノムDNAを含む試料において、下記a)、b)の位置に存在する遺伝子多型、およびz)で示されるハプロタイプから選ばれるいずれか一つまたは二つ以上を検出することにより、該試料提供者の腎症を伴う2型糖尿病の発症危険度を判定する方法。
a)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
z)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)、および同第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)に存在する遺伝子多型の組合せからなるハプロタイプ
【0027】
(6)ヒトゲノムDNAを含む試料において、下記z)で示されるハプロタイプを検出することにより、該試料提供者の1型糖尿病の発症危険度を判定する方法。
z)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)、および同第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)に存在する遺伝子多型の組合せからなるハプロタイプ
【0028】
(7)検出が、RFLP法、PCR−SSCP法、ASOハイブリダイゼーション、ダイレクトシークエンス法、ARMS法、変性剤濃度勾配ゲル電気泳動法、RNaseA切断法、化学切断法、DOL法、TaqMan PCR法、インベーダー法、MALDI−TOF/MS法、TDI法、モレキュラー・ビーコン法、ダイナミック・アレルスペシフィック・ハイブリダイゼーション法、パドロック・プローブ法、UCAN法、DNAチップまたはDNAマイクロアレイを用いた核酸ハイブリダイゼーション法、、およびECA法からなる群より選ばれる一つまたは二つ以上の方法を用いて行われることを特徴とする、上記(1)〜(6)のいずれか1項に記載の方法。
【0029】
(8)検出が、PCR−SSCP法またはダイレクトシークエンス法を用いて行われることを特徴とする、上記(7)に記載の方法。
【0030】
(9)配列番号22で示されるGFAT1遺伝子上において、下記a)〜g)から選ばれるいずれか一つのヌクレオチドまたはヌクレオチド配列を含む、16〜500塩基長の連続したポリヌクレオチド、またはその標識物;
a)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)
d)GFAT1遺伝子の第8イントロンの1853〜1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)
e)GFAT1遺伝子の第12イントロンの1988〜2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)
f)GFAT1遺伝子の第18イントロンの−11〜−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)
g)GFAT1遺伝子の第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)
もしくは、配列番号23で示されるGFAT2遺伝子断片上において、第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)を含む、16〜500塩基長の連続したポリヌクレオチド、またはその標識物。
(ただし、上記ポリヌクレオチドがRNAである場合、配列表中の塩基記号「t」は「u」に読み替えるものとする)。
【0031】
(10)配列番号22で示されるGFAT1遺伝子上において、下記a)〜g)から選ばれるいずれか一つのヌクレオチドまたはヌクレオチド配列を含む、16〜1000塩基長の連続したポリヌクレオチドの一部にハイブリダイズし、該ポリヌクレオチドを特異的に増幅するための、15〜30塩基長のオリゴヌクレオチド、またはその標識物;
a)GFAT(グルタミン:フルクトース−6−リン酸アミドトランスフェラーゼ)1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)
d)GFAT1遺伝子の第8イントロンの1853〜1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)
e)GFAT1遺伝子の第12イントロンの1988〜2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)
f)GFAT1遺伝子の第18イントロンの−11〜−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)
g)GFAT1遺伝子の第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)
もしくは、配列番号23で示されるGFAT2遺伝子断片上において、第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)を含む、16〜1000塩基長の連続したポリヌクレオチドの一部にハイブリダイズし、該ポリヌクレオチドを特異的に増幅するための、15〜30塩基長のオリゴヌクレオチド、またはその標識物。
(ただし、上記ポリヌクレオチドがRNAである場合、配列表中の塩基記号「t」は「u」に読み替えるものとする)。
【0032】
(11)上記(9)に記載のポリヌクレオチドを固定した固相化試料。
【0033】
(12)以下の1)〜3)から選ばれる少なくとも一つ以上を含む、糖尿病の発症危険性判定用試薬またはキット。
1)上記(9)に記載のポリヌクレオチド、またはその標識物
2)上記(10)に記載のオリゴヌクレオチド、またはその標識物
3)上記(11)に記載の固相化試料
【0034】
(13)以下の(A)または(B)のDNA。
(A)配列番号22で示されるヌクレオチド配列からなるDNA
(B)配列番号22で示されるヌクレオチド配列からなるDNAと少なくとも85%以上の相同性を有し、かつGFAT活性を有するヒト由来のタンパク質をコードするDNA
【0035】
【発明の実施の形態】
本発明の方法は、ヒトゲノムDNAを含む試料において、GFAT1遺伝子および/またはGFAT2遺伝子上に存在する新規遺伝子多型を検出することにより、該試料提供者の糖尿病の発症危険度を判定する方法である。
【0036】
本明細書中において、「遺伝子多型」には、いわゆる単一ヌクレオチド多型(1塩基多型:single nucleotide polymorphism:SNP)、および連続した複数ヌクレオチドにわたる多型、の両方を含むものとする。すなわち、ヒトの集団において、ある一個体のゲノム配列を基準として、他の1または複数の個体ゲノム中の特定部位に、1または複数ヌクレオチドの置換、欠失、挿入、転位、逆位等の変異が存在するとき、その変異が当該1または複数の個体に生じた突然変異でないことが統計的に確実か、または当該個体内突然変異でなく、1%以上の頻度で集団内に存在することが家系的に証明される場合、その変異を「遺伝子多型」とする。
【0037】
以下、本発明の方法について詳細に説明する。
1.糖尿病の発症に関連した新規遺伝子多型
本発明で検出対象とする遺伝子多型は、糖尿病患者に高い頻度で現れることが確認された、GFAT1遺伝子またはGFAT2遺伝子上に存在する新規遺伝子多型である。該遺伝子多型は、具体的には、以下のa)〜h)の位置に存在する。
a)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)
d)GFAT1遺伝子の第8イントロンの1853から1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)
e)GFAT1遺伝子の第12イントロンの1988から2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)
f)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)
g)GFAT1遺伝子の第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)
h)GFAT2遺伝子の第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)
【0038】
本発明の方法においては、上記a)〜h)から選ばれるいずれか一つまたは二つ以上の位置に存在する、遺伝子多型および/またはその組合せからなるハプロタイプを検出して、糖尿病の発症危険度を判定する。すなわち、判定は一つまたは二つ以上の遺伝子多型の検出結果に基づいて行っても良いし、二つ以上の遺伝子多型を組合せたハプロタイプの検出結果に基づいて行ってもよい。また、上記多型とハプロタイプを組み合わせて判定してもよい。
【0039】
2.ヒトゲノムDNAを含む試料の調製
本発明の方法で用いられる「ヒトゲノムDNAを含む試料」は、被験者および臨床検体等から単離されたあらゆる細胞(生殖細胞を除く)、組織、臓器等を材料として調製される。該材料としては、末梢血から分離した白血球または単核球が好ましく、特に白血球が最も好適である。これらの材料は、臨床検査において通常用いられる方法にしたがって単離される。
【0040】
例えば白血球を材料とする場合、まず被験者より単離した末梢血から常法に従って白血球を分離する。次いで、得られた白血球にプロテイナーゼKとドデシル硫酸ナトリウム(SDS)を加えてタンパク質を分解、変性させた後、フェノール/クロロホルム抽出を行うことによりゲノムDNA(RNAを含む)を得る。RNAは、必要に応じてRNaseにより除去することができる。ただし、ゲノムDNAの抽出は、上記の方法に限定されず、当該技術分野で周知の方法(例えば、Sambrook, J. et al. (1989):”Molecular Cloning: A Laboratory Manual (2nd Ed.)” Cold Spring Harbor Laboratory, NY)や、市販のDNA抽出キット等を利用して行ってもよい。
【0041】
3.遺伝子多型の検出
次に、得られたヒトゲノムDNAを含む試料から、本発明者らによって解明された、糖尿病(特に2型糖尿病)と極めて関連の深い新規遺伝子多型を検出する。以下、代表的な遺伝子多型検出方法について説明する。
【0042】
(1)RFLP(制限酵素切断断片長多型)法
遺伝子多型部位が制限酵素認識部位に含まれる場合、その制限酵素の消化により生じるDNA断片の長さの違いにから、当該遺伝子多型の検出が可能である。この場合、▲1▼ゲノムDNAを制限酵素で分解後、サザンブロットを行なう方法と、▲2▼多型部位を含むDNA断片をPCR増幅後、制限酵素で切断し、電気泳動により切断されたDNA断片の大きさを解析する方法が挙げられる。▲1▼の方法で用いられるプローブとしては、目的の多型部位を含んで、かつその多型部位から5’末端側および3’末端側にそれぞれ約0.05〜2kbにわたる配列に相当するDNA断片(アイソトープ、ビオチンあるいは蛍光色素等で標識されたもの)が好ましい。また、▲2▼の方法に用いられるPCRプライマーとしては、多型部位を含む約0.05〜4kbのDNA断片を増幅するための、15〜30merのオリゴヌクレオチドが好ましい。
【0043】
(2)PCR−SSCP法(一本鎖DNA高次構造多型解析)
PCR−SSCP法は、遺伝子多型部位を含むDNA断片をPCRで増幅後、熱変性し、電気泳動により、高次構造の異なる1本鎖DNAを分離する方法である〔Biotechniques, 16,296−297 (1994), Biotechniques, 21, 510−514 (1996)〕。遺伝子多型の有無により、1本鎖DNAの泳動距離が異なるため、そのパターンを解析することにより、多型のタイピングが可能である。タイピングの標準とするために、予め多型部位のヌクレオチド配列が確認されているヒトゲノム由来のDNA試料を、PCRの際の鋳型DNAとして、被検試料と同時に用いることが好ましい。PCR増幅用プライマーとしては、5’末端を蛍光色素で標識した、多型部位を含む約50〜500bpのDNA断片を増幅するための15〜30merのオリゴヌクレオチドが好ましい。
【0044】
(3)ASO(Allele Specific Oligonucleotide)ハイブリダイゼーション法
ASOハイブリダイゼーション法は、遺伝子多型部位を含むPCR産物をナイロンフィルターなどの支持体にドットブロットし、それぞれの遺伝子多型に対応したプローブとのハイブリダイゼーション後、そのプローブのTm値に準じた洗浄操作を行い、多型を検出(ミスマッチがあればハイブリッドが外れる)する方法である〔Clin. Chim. Acta, 189, 153−157 (1990)〕。プローブとしては、通常15〜25mer程度の合成オリゴヌクレオチド(シグナルを得るにはラジオアイソトープ、ビオチンまたは蛍光色素による標識が必要)が用いられる。また、PCRプライマーとしては、多型部位を含む約0.05〜4kbのDNA断片を増幅するための、15〜30merのオリゴヌクレオチドが好ましい。
【0045】
(4)ダイレクトシークエンス法
ダイレクトシークエンス法は、遺伝子多型部位を含むDNA断片をPCR増幅した後、増幅されたDNAのヌクレオチド配列を直接ダイデオキシ法により解析する方法である〔Biotechniques, 11, 246−249 (1991)〕。この方法で用いられるPCRプライマーは、好ましくは、多型部位を含む約0.05〜4kbのDNA断片を増幅するための、15〜30merのオリゴヌクレオチドである。また、シークエンスプライマーとしては、好ましくは、多型部位から50〜300ヌクレオチド程度5’末端側の位置に相当する15〜30merのオリゴヌクレオチドを用いる。
【0046】
(5)ARMS(Amplification Refracting Mutation System)法
PCRでは、鋳型DNAにプライマーがアニールした後、DNAポリメラーゼにより5’末端側から3’末端側に相補鎖DNAが合成される。プライマーの3’末端ヌクレオチドにミスマッチがあると、PCRの効率が低下し、電気泳動による検出が不可能になる。ARMS法は、その3’末端ヌクレオチドが検出しようとする変異ヌクレオチドに相補的になるように設計されたプライマーを用いてPCRを行い、増幅産物の有無で遺伝子多型を検出する方法である〔Nuc. Acids. Res., 19, 3561−3567 (1991), Nuc. Acids. Res., 20,4831−4837 (1992)〕。この方法で用いられるPCRプライマーは、1つは3’末端に多型部位が位置するように設計された、好ましくは15〜30merのオリゴヌクレオチドであり、もう1つは、好ましくは、多型部位から0.05〜2kb程度離れた部分の15〜30merのオリゴヌクレオチドである。
【0047】
(6)変性剤濃度勾配ゲル電気泳動(Denaturing Gradient Gel Electrophoresis、以下「DGGE」という)法
DGGE法は、PCR産物中の、ミスマッチを有するヘテロデュプレックスが、ホモデュプレックスよりも解離が容易であることを利用して遺伝子多型を検出する方法である〔Biotechniqus, 27, 1016−1018 (1999)〕。ヘテロデュプレックスは、解離が進むにつれ、ゲル電気泳動における移動度が低下するので、使用するポリアクリルアミドゲル中に尿素およびホルムアミドの密度勾配を設定しておくと、ホモデュプレックスとの移動度の差がさらに強調され、ミスマッチを含む2本鎖DNAの存在、すなわち変異の存在が検出される。この方法で用いられるPCRプライマーは通常、多型部位を含む約0.05〜0.5kbのDNA断片を増幅するための、15〜30merのオリゴヌクレオチドである。
【0048】
(7)RNaseA切断法
RNaseA(RNA分解酵素)は、2本鎖RNAもしくはRNA/DNAコンプレックスを分解せず、1本鎖のRNAのみを分解する特性を有する。したがって、多型部位を含むDNA断片をPCR増幅した後、アイソトープ標識したRNAプローブを、変性して1本鎖にしたPCR産物とハイブリダイズさせ、RNaseA処理後、電気泳動により分離すれば、変異型とハイブリダイズしたRNAプローブはミスマッチ部位で切断されるため、2本のバンドとして検出できる〔DNA Cell. Biol., 14, 87−94 (1995)〕。この方法で用いられるRNAプローブとしては、多型部位を含む通常15〜30merのオリゴヌクレオチドが好ましい。
【0049】
(8)化学切断法
多型部位を含むDNA断片をPCRにより増幅後、2本鎖DNAのミスマッチ部位の「c(シトシン)」に対してはヒドロキシルアミン、「t(チミン)」に対してはオスミウムテトラオキシドで別個に修飾し、ピペリジン処理をすると、糖が切断される。標識プローブを用いて2本鎖を形成させ、上記処理を行った後、電気泳動し、プローブのサイズが短くなっていれば変異が検出されたことになる〔Biotechniques, 21, 216−218 (1996)〕。この方法で用いられるPCRプライマーは通常、多型部位を含む約0.05〜4kbのDNA断片を増幅するための、15〜30merのオリゴヌクレオチドである。
【0050】
(9)DOL(Dye−labeled Oligonucleotide Ligation)法
DOL法は、遺伝子多型を含むDNA断片をPCR増幅した後、蛍光標識された多型部位の直前の塩基まで含むダイプライマーと、それぞれのアレルに特異的な蛍光色素で標識されたダイターミネーターを耐熱性DNAリガーゼで連結させる方法である〔Genome Res., 8, 549−556 (1998)〕。この方法で用いられるPCRプライマーは、通常多型部位を含む約0.05〜2kbのDNA断片を増幅するための、15〜30merのオリゴヌクレオチドである。
【0051】
(10)TaqMan PCR法
TaqMan PCR法は、蛍光標識したアレル特異的オリゴヌクレオチド(TaqManプローブ)とTaqDNAポリメラーゼによるPCRを利用した方法である〔Genet. Anal., 14, 143−149 (1999), J. Clin. Microbiol., 34, 2933−2936 (1996)〕。この方法で用いられるPCRプライマーは、通常多型部位を含む約0.05〜2kbのDNA断片を増幅するための、15〜30merのオリゴヌクレオチドである。また、TaqManプローブは、多型部位を含む15〜30塩基程度のオリゴヌクレオチドであり、5’末端は蛍光レポーター色素によって標識されており、3’末端はクエンチャー(消光物質)によって標識されている。このプローブを用いることにより、野生型と変異型のヌクレオチド変化の検出が可能である。
【0052】
(11)インベーダー法
インベーダー法では、2種類の非蛍光標識オリゴヌクレオチドと1種類の蛍光標識オリゴヌクレオチドが使用される。非蛍光標識オリゴヌクレオチドの一つは、その5’末端側に、検出しようとする多型部位の存在するゲノム配列(以下「鋳型」という)とは無関係な配列(以下「フラップ」という)を有しており、フラップより3’末端側は、鋳型の多型部位から5’末端側の配列に特異的な相補配列となっている(以下「アレルプローブ」という)。すなわちアレルプローブの鋳型に特異的な相補配列部分の5’末端は鋳型の多型部位に相当する。もう一つの非蛍光標識オリゴヌクレオチドは、鋳型の多型部位から3’末端側の配列に特異的な相補配列を有する(以下「インベーダープローブ」という)。インベーダープローブの3’末端も鋳型の多型部位に相当するが、鋳型の多型部位のヌクレオチドとは相補的でなくてもよい。蛍光標識オリゴヌクレオチド(以下「FRET(fluorescence resonance energy transfer)プローブ」という)は、3’末端側部分がフラップと相補的な配列であり、5’末端側はパリンドローム配列になっているため自ら二本鎖を形成している。またFRETプローブの5’末端近傍は蛍光色素で標識され、5’末端にはその蛍光を打ち消すクエンチャーが結合している。まず鋳型にアレルプローブとインベーダープローブをハイブリダイズさせると、アレルプローブと鋳型とが多型部位において相補的である場合は、その多型部位において、鋳型、アレルプローブの5’末端およびインベーダープローブの3’末端が特殊な構造を形成する。この構造を特異的に認識してエンドヌクレアーゼ活性を表す酵素(以下「クリベース」という)が、アレルプローブからフラップ部分を切り離す。遊離したフラップはFRETプローブの3’末端側とハイブリダイズする。このとき、フラップとFRETプローブとが、FRETプローブのクエンチャーが結合している5’末端の位置において、クリベースに特異的に認識される構造を形成するため、クエンチャーが結合している5’末端ヌクレオチドがクリベースによりFRETプローブから切り離されて、FRETプローブに残った蛍光色素が蛍光を発する。一方、鋳型配列に変異が存在し、アレルプローブと鋳型とが多型部位において相補的でなく、ミスマッチとなっている場合は、クリベースに特異的に認識される構造が形成されないため、フラップはアレルプローブから切り離されない。このとき、切り離されずにアレルプローブに残ったままのフラップもFRETプローブの3’末端側とハイブリダイズ可能であるが、アレルプローブから切り離されたフラップがハイブリダイズした場合と比較すると、クエンチャーが結合している5’末端ヌクレオチドがクリベースによってFRETプローブから切り離される反応効率が低いため、FRETプローブが発する蛍光強度も低い。以上の原理により、多型の検出が可能となる〔Science, 5109, 778−783(1993), J. Biol. Chem., 30, 21387−21394 (1999), Nat. Biotechnol., 17, 292−296 (1999)〕。
【0053】
(12)MALDI−TOF/MS法(Matrix Assisted Laser Desorption−time ofFlight/Mass Spectrometry)法
MALDI−TOF/MS法は、遺伝子多型のアレルに対応して異なるヌクレオチドを含む1本鎖オリゴヌクレオチドを合成してその質量を測定し、その差異を質量分析器により検出することによりタイピングする方法である〔Genome Res., 7, 378−388 (1997), Eur. J. Clin. Chem. Clin. Biochem., 35, 545−548 (1997)〕。MALDI−TOF/MS法では、はじめに多型部位を含むDNA断片をPCR増幅し、その後、多型部位に隣接するプライマーを用いた伸張反応により、それぞれのアレルに特異的なDNA伸張反応物をマススペクトルに基づき解析する。このときに用いられPCRプライマーは、通常多型部位を含む約0.05〜0.5kbのDNA断片を増幅するための、15〜30merのオリゴヌクレオチドである。また、多型を検出するためのプライマーは、多型部位に隣接した15から30merのオリゴヌクレオチドを用いる。
【0054】
(13)TDI(Template−directed Dye−terminator Incorporation)法
TDI法は、遺伝子多型を含むDNA断片をPCRで増幅させた後、多型部位の直前に設計されたプライマーを用いて、プライマー伸張反応により、それぞれのアレルに対応する異なる蛍光色素で標識されたダイデオキシヌクレオチドを多型部位に取りこませる方法である〔Proc. Natl. Acad. Sci. USA, 94, 10756−10761 (1997)〕。プライマー伸張産物は、DNAシークエンサー(ABIプリズム377、アプライドバイオシステムズ社製)などを用いて解析する。このときに用いられるPCRプライマーは、通常多型部位を含む約0.05〜1kbのDNA断片を増幅するための、15〜30merのオリゴヌクレオチドである。
【0055】
(14)モレキュラー・ビーコン(Molecular Beacons)法
Molecular Beaconsは両末端に発光抑制体(Quencher)と蛍光体(Fluorophore)を持ったオリゴヌクレオチドである。通常はステム部分が5−7ヌクレオチドでループ構造が15−30ヌクレオチドのステムループ構造である。したがって蛍光体は発光抑制体の働きにより、励起光照射下でも発光しない。一方、ループ構造内の塩基配列と相同なターゲットのDNAとループ構造内の塩基配列がハイブリダイズすると、発光抑制体と蛍光体の距離が離れるために蛍光体が励起光下で励起し蛍光を発する〔Nat. Biotechnol.,1, p49−53 (1998)、遺伝子医学、4,p46−48(2000)〕。Molecular Beaconのステム部分の塩基配列は、ターゲットDNAとは相補的でない。Molecular Beaconsのステム構造のTm値(溶解温度:melting temperature)は、ターゲットDNAとPCRプライマーのTm値より、7−10℃高くなるように設計する。そして、ターゲット領域をPCRで増幅させるときにMolecular Beaconsを反応液にいれて、PCRのアニーリング温度で励起光を当て蛍光を測定するとMolecular Beaconsがターゲット遺伝子に完全に相同な配列であればHybridizeするため蛍光を発する。逆にミスマッチがあれば、Molecular Beaconsはターゲットにハイブリダイズできず蛍光を発することができない。この方法により遺伝子多型を見つけることができる。
【0056】
(15)ダイナミック・アレル−スペシフィック・ハイブリダイゼーション法(Dynamic Allele−Specific Hybridization (DASH)法
ターゲットDNA(60−90塩基対)をゲノムDNAからPCRで増幅する際に、末端をビオチン化したプライマーを用いて行う方法である〔Nat. Biotechnol.,1, p87−88, (1999)、遺伝子医学, 4, p47−48 (2000)〕。PCR終了後、ビオチン化したプライマー側のストランド(strand)はストレプトアビジン(Streptavidin)でコーティングされたマイクロタイターウェルに結合する。これに対して未修飾のPrimer側のストランドは結合することができず、アルカリ溶液でリンスすると除去される。その後、このビオチン化したプライマーのストランドに対して、プローブDNA(15−21ヌクレオチド)をハイブリダイズさせる。この時に2本鎖DNAに特異的に結合し蛍光を発する蛍光物質(Syber Green I dye)を一緒に取込ませる。その後、この蛍光強度を観察しながら変性(denature)させる。ターゲットDNAとプローブDNAが完全に相補的でなくミスマッチが有ったときには完全に相補的である場合に比べ変性し発光しなくなる温度が低くなる。この温度の違いを観察することにより、遺伝子多型を検出することができる。
【0057】
(16)パドロック・プローブ(Padlock Probe)法
Lizardiらによって開発された方法である〔Nat. Genet., 3, p225−232 (1998)、遺伝子医学, 4, p50−51 (2000)〕。一本鎖ターゲットDNAにハイブリダイズするとプローブが環状になるように設計したプローブを用い、ターゲットDNAにハイブリダイズした後にDNAリガーゼで結合させて完全な環状にしその後アルカリフォスファターゼ(Calf intestinal Alkaline Phosphatase (CIAP))の脱リン酸化酵素でリン酸基を除去する。末端にミスマッチがあり環状になれなかった場合リン酸基がなくなり環状化できなくなる。この環状DNAに対してプライマー(1)を設計し、DNAポリメラーゼで複製してレプリコン多量体を得る。このレプリコンに対してもプライマー(2)を設計し、この2種類のプライマーを一緒に混ぜてDNAポリメラーゼで反応し、2本鎖DNAを増幅する。プライマー(1)はターゲットDNAとは相補的でない部分に設計し、プライマー(2)は環状になったプローブ(Padlock Probe)の末端部分(ターゲットDNAと相補的な配列(3’末端に遺伝子多型を含む)に設計し、多型検出には3’末端の一塩基置換させたプライマーを用いる。環状化したプローブ(Padlock Probe)に対してローリング・サイクル・反応(Rolling Circle−Reaction:RCR)を改良したハイパーブランチド・ローリング−サークル増幅法(Hyperbranched Rolling−Circle Amplification (HRCA))法を用いて増幅させた後に、Padlock Probe内にある制限酵素認識サイトの制限酵素で処理し、電気泳動でバンドの有無を確認する。
【0058】
(17)UCAN法
UCAN法[タカラ酒造株式会社ホームページ(http://www.takara.co.jp)参照]は、RNAをDNAが両側からはさんだ型のDNA−RNA−DNAプライマー(DRDプライマー)の3’末端のDNAを化学変化させておき、DNAポリメラーゼによる鋳型DNAの複製が起こらないようにしておく。次に、一塩基変換が起こっている可能性のある塩基部分に、RNA部分が結合するように設計したDRDプライマーと鋳型DNAを対合させる。DRDプライマーと鋳型が完全にマッチしている場合のみRNaseHにより、対合したDRDプライマーのRNA部分が切断される。この切断によって3’末端が新しく出現するのでDNAポリメラーゼによる伸長反応が進み、鋳型DNAが増幅される。一方、DRDプライマーと鋳型DNAがその場所でマッチしていない場合、つまりSNPが存在するときは、RNaseHがDRDプライマーを切断しないので、DNA増幅が起こらない。この遺伝子増幅の有無を検出することで遺伝子多型を検出することができる。
【0059】
(18)DNAチップまたはDNAマイクロアレイ
DNAチップまたはDNAマイクロアレイは多種類の多型部位を含むDNAプローブをガラス基盤上に固定したもので、これに標識した核酸試料をハイブリダイゼーションして、蛍光シグナルによって多型の有無を検出する。一般にガラス基盤上にcDNAを乗せていくものをDNAマイクロアレイ、DNAをガラス基盤上で合成していくものをDNAチップ(オリゴDNAチップ)という。基盤上に固定(または合成)されるプローブは、オリゴDNAアレイであれば、通常多型部位を含む20mer程度のオリゴヌクレオチド、cDNAマイクロアレイであれば、100〜1500mer程度の2本鎖DNAが用いられる。
【0060】
(19)ECA法
ECA(Electrochemical Array)法は、DNAの2本鎖に結合するインターカレーターの電気化学的性質を利用した遺伝子タイピング法である。すなわち、ゲノム上の多型を含む領域をPCR法により増幅し、基盤に固定化したそれぞれのアレルと相補するプローブとハイブリダイズ後にインターカレーターを作用させる。このとき、プローブに対して完全相補と不完全相補の場合で結合するインターカレーターの量が異なる。ECA法で用いるインターカレーターは、電気化学的性質を有するフェロセンという物質を含有しているため、結合したインターカレーターの量に比例して電気的シグナルが異なる。ECA法は、この違いを利用して遺伝子多型を検出する方法である〔Anal. Chem., 72, p1334−1341, 2000〕。
【0061】
以上は代表的な多型検出方法であるが、これらに限定されず、他の公知の遺伝子多型検出方法を本発明の判定方法のために利用することができる。また、本発明の方法においては、これらの遺伝子多型検出方法を単独で用いても、二つ以上を組み合わせて用いてもよい。本発明の好適な実施形態の一つとして、後述する実施例では、PCR−SSCP法またはダイレクトシークエンス法を用いた判定方法を示す。
【0062】
4.糖尿病発症危険性判定用試薬、またはキット
本発明の判定方法では、糖尿病の発症に関連した遺伝子多型を検出するために、検出すべき遺伝子多型が存在する部位またはその近傍の配列を検出するためのプローブまたは固相化試料、もしくは該配列を特異的に増幅するためのプライマーが用いられる。これらのプローブ、プライマーおよび固相化試料は、本発明の判定方法を実施するための試薬、またはキットとして有用である。
【0063】
すなわち、本発明は、GFAT1遺伝子またはGFAT2遺伝子上の遺伝子多型を検出するためのプローブ、プライマーおよび固相化試料、ならびにこれらの少なくとも一つ以上を含む、糖尿病の発症危険性判定用試薬またはキットを提供する。
【0064】
(1)プローブ
本発明の方法で用いられるプローブは、GFAT1遺伝子またはGFAT2遺伝子上の新規遺伝子多型を含む部位に特異的にハイブリダイズし、該多型部位を検出するためのポリヌクレオチドプローブである。
【0065】
そのようなプローブは、配列番号22で示されるGFAT1遺伝子上において、下記a)〜g)から選ばれるいずれか一つのヌクレオチドまたはヌクレオチド配列を含む、16〜500塩基長、好ましくは20〜200塩基長、より好ましくは20〜50塩基長の連続したポリヌクレオチド;
a)GFAT(グルタミン:フルクトース−6−リン酸アミドトランスフェラーゼ)1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)
d)GFAT1遺伝子の第8イントロンの1853〜1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)
e)GFAT1遺伝子の第12イントロンの1988〜2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)
f)GFAT1遺伝子の第18イントロンの−11〜−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)
g)GFAT1遺伝子の第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)
もしくは、配列番号23で示されるGFAT2遺伝子断片上において、第18エキソンの66番目のヌクレオチド(配列番号3のヌクレオチド番号2251)を含む、16〜500塩基長、好ましくは20〜200塩基長、より好ましくは20〜50塩基長の連続したポリヌクレオチドとして設計される。
【0066】
(2)プライマー
本発明の方法で用いられるプライマーは、GFAT1遺伝子またはGFAT2遺伝子上の新規遺伝子多型を含む部位を特異的に増幅するためのオリゴヌクレオチドプライマーである。
【0067】
そのようなプライマーは、配列番号22で示されるGFAT1遺伝子上において、前項a)〜g)から選ばれるいずれか一つのヌクレオチドまたはヌクレオチド配列を含む連続したポリヌクレオチドの一部にハイブリダイズし、該ポリヌクレオチドを特異的に増幅するための、15〜30塩基長、好ましくは18〜25塩基長程度のオリゴヌクレオチド;
もしくは、配列番号23で示されるGFAT2遺伝子断片上において、第18エキソンの66番目のヌクレオチドを含む、連続したポリヌクレオチドの一部にハイブリダイズし、該ポリヌクレオチドを特異的に増幅するための、15〜30塩基長のオリゴヌクレオチド、好ましくは18〜25塩基長程度のオリゴヌクレオチドとして設計される。
【0068】
増幅するポリヌクレオチドの長さは、用いられる検出方法に応じて適宜設定されるが、一般的には16〜1000塩基長、好ましくは20〜500塩基長、より好ましくは20〜200塩基長である。
【0069】
以上のことから、多型部位近傍の配列(例えば、配列番号1〜7および配列番号23のいずれか一つで示されるヌクレオチド配列)に含まれる、15塩基以上の連続したヌクレオチド配列からなるポリヌクレオチドは、上記プライマーまたはプローブとして利用することができる。
【0070】
本発明のプライマーまたはプローブには、その配列の末端に、検出のための適当な標識、例えば、蛍光色素、酵素、タンパク、放射性同位体、化学発光物質、ビオチン等が付加されたものも含むものとする。
【0071】
なお、本発明において用いられる蛍光色素としては、一般にヌクレオチドを標識して、核酸の定量、検出等に用いられるものが好適に使用でき、例えば、HEX(4,7,2’,4’,5’,7’−hexachloro−6−carboxyfluorescein、緑色蛍光色素)、フルオレセイン(fluorescein)、NED(アプライドバイオシステムズ社商品名、黄色蛍光色素)、あるいは、6−FAM(アプライドバイオシステムズ社商品名、黄緑色蛍光色素)、ローダミン(rhodamin)またはその誘導体(例えば、テトラメチルローダミン(TMR))等を挙げることができるが、これらに限定されない。蛍光色素でヌクレオチドを標識する方法は、公知の標識法のうち適当なものを使用できる〔Nature Biotechnology, 14, p303−308 (1996)参照〕。また、市販の蛍光標識キットを使用することもできる(例えば、アマシャム・ファルマシア社製 オリゴヌクレオチドECL 3’−オリゴラベリングシステム等)。
【0072】
また、本発明のプライマーには、その末端に多型検出のためのリンカー配列が付加されたものも含むものとする。このようなリンカー配列としては、例えば、前述したインベーダー法で用いられるオリゴヌクレオチド5’末端に付加される、フラップ(多型近傍の配列とは全く無関係な配列)等が挙げられる。
【0073】
なお、本明細書中において、「ポリヌクレオチド」は核酸と同義であって、DNAおよびRNAの両方を含むものとする。また、2本鎖であっても1本鎖であってもよく、したがって、ある配列を有するポリヌクレオチドには、これに相補的な配列を有するポリヌクレオチドも常に包含される(オリゴヌクレオチドも同様)。さらに、ポリヌクレオチドがRNAである場合、配列表に示される塩基記号「t」は「u」に読み替えるものとする。
【0074】
本発明の1つの実施形態である、SSCP法およびダイレクトシークエンス法を用いた検出について、上記プライマーの好適な例を以下に示す。
i)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)の遺伝子多型検出用:
センス鎖プライマーとしては、好適には配列番号1のヌクレオチド番号1から631に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号432から631に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列を選択する。例えば、配列番号8に示されるヌクレオチド配列が挙げられる。
【0075】
アンチセンス鎖プライマーとしては、好適には配列番号1のヌクレオチド番号633から782に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号633から682に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列のアンチセンス配列を選択する。例えば、配列番号9に示されるヌクレオチド配列が挙げられる。
【0076】
ii)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)の遺伝子多型検出用:
センス鎖プライマーとしては、好適には配列番号2のヌクレオチド番号1から265に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号66から265に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列を選択する。例えば、配列番号10に示されるヌクレオチド配列が挙げられる。
【0077】
アンチセンス鎖プライマーとしては、好適には配列番号2のヌクレオチド番号267から675に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号267から466に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列のアンチセンス配列を選択する。例えば、配列番号11に示されるヌクレオチド配列が挙げられる。
【0078】
iii)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)の遺伝子多型検出用:
センス鎖プライマーとしては、好適には配列番号3のヌクレオチド番号1から337に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号138から337に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列を選択する。例えば、配列番号12に示されるヌクレオチド配列が挙げられる。
【0079】
アンチセンス鎖プライマーとしては、好適には配列番号3のヌクレオチド番号339から780に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号339から538に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列のアンチセンス配列を選択する。例えば、配列番号13に示されるヌクレオチド配列が挙げられる。
【0080】
iv)GFAT1遺伝子の第8イントロンの1853から1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)の遺伝子多型検出用:
センス鎖プライマーとしては、好適には配列番号4のヌクレオチド番号1から335に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号136から335に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列を選択する。例えば、配列番号14に示されるヌクレオチド配列が挙げられる。
【0081】
アンチセンス鎖プライマーとしては、好適には配列番号4のヌクレオチド番号361から720に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号361から560に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列のアンチセンス配列を選択する。例えば、配列番号15に示されるヌクレオチド配列が挙げられる。
【0082】
v)GFAT1遺伝子の第12イントロンの1988から2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)の遺伝子多型検出用:センス鎖プライマーとしては、好適には配列番号5のヌクレオチド番号1から327に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号128から327に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列を選択する。例えば、配列番号16に示されるヌクレオチド配列が挙げられる。
【0083】
アンチセンス鎖プライマーとしては、好適には配列番号5のヌクレオチド番号348から659に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号348から546に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列のアンチセンス配列を選択する。例えば、配列番号17に示されるヌクレオチド配列が挙げられる。
【0084】
vi)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)の遺伝子多型検出用:
センス鎖プライマーとしては、好適には配列番号6のヌクレオチド番号1から252に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号53から252に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列を選択する。例えば、配列番号18に示されるヌクレオチド配列が挙げられる。
【0085】
アンチセンス鎖プライマーとしては、好適には配列番号6のヌクレオチド番号265から540に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号265から464に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列のアンチセンス配列を選択する。例えば、配列番号19に示されるヌクレオチド配列が挙げられる。
【0086】
vii)GFAT1遺伝子の第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)の遺伝子多型検出用:
センス鎖プライマーとしては、好適には配列番号7のヌクレオチド番号1から236に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号37から236に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列を選択する。例えば、配列番号20に示されるヌクレオチド配列が挙げられる。
【0087】
アンチセンス鎖プライマーとしては、好適には配列番号7のヌクレオチド番号267から360に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号267から340に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列のアンチセンス配列を選択する。例えば、配列番号21に示されるヌクレオチド配列。
【0088】
viii)GFAT2遺伝子の第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)の遺伝子多型検出用:
センス鎖プライマーとしては、好適には配列番号23のヌクレオチド番号1751から2250に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号2051から2199に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列を選択する。例えば、配列番号24に示されるヌクレオチド配列が挙げられる。
【0089】
アンチセンス鎖プライマーとしては、好適には配列番号23のヌクレオチド番号2252から2751に示されるヌクレオチド配列中、より好適には同ヌクレオチド番号2252から2451に示されるヌクレオチド配列中の、15ヌクレオチド以上(好ましくは15〜30ヌクレオチド)の連続したヌクレオチド配列のアンチセンス配列を選択する。例えば、配列番号25に示されるヌクレオチド配列。
【0090】
上記プライマーまたはプローブとして用いられ得るポリヌクレオチドは、当該技術分野で周知の方法に基づき化学合成することにより得ることができる。これらのプローブまたはプライマーとして用いられるポリヌクレオチドは、糖尿病発症危険性判定用試薬として利用できる。
【0091】
(3)固相化試料
本発明の固相化試料は、(1)記載のプローブとして用いられるポリヌクレオチドを、ガラス板、ナイロンメンブレン、マイクロビーズ、シリコンチップ、キャピラリー等の固相に固定することにより作製される。固相への固定は、予め合成したポリヌクレオチドを固相上に乗せる方法であってもよいし、目的とするポリヌクレオチドを固相上で合成する方法であってもよい。固定方法は、例えばDNAマイクロアレイであれば、市販のスポッター(Amersham社製等)を利用するなど、目的とする固相化試料に適した方法が、当該技術分野で周知である。このような固相化試料としては、例えば、遺伝子チップ、cDNAマイクロアレイ、オリゴアレイ、メンブレンフィルター等を挙げることができる。
【0092】
(4)キット
本発明のキットは、上記プローブまたはプライマーとして用いられ得るポリヌクレオチド、ならびに固相化試料から選ばれる少なくとも一つ以上を含む。本発明のキットは上記した構成要素のほか、必要に応じて、ハイブリダイゼーション、プローブの標識、ラベル体の検出等、本発明の判定方法に必要な他の試薬、器具等を適宜含んでいてもよい。
【0093】
5.検出結果の解析と評価
糖尿病患者および健常人における、前記新規遺伝子多型検出の統計解析結果から、本発明の方法は高い確率で1型、2型糖尿病、糖尿病性腎症を伴なう2型糖尿病、あるいは、糖尿病性腎症を伴わない2型糖尿病を発症する潜在的危険度の判定が可能であることが判明している。
【0094】
例えば、本発明の方法にしたがい、単離されたヒトゲノムDNAを含む試料における遺伝子多型を調べた結果、下記のいずれか一つまたは二つ以上の条件に該当した被験者に対しては、2型糖尿病を発症する危険度が相対的に高いとの情報を提供することができる。
a)GFAT1遺伝子の第1イントロンの36番目(配列表の配列番号1のヌクレオチド番号632)のヌクレオチドがc(シトシン)である遺伝子を有する;
b)GFAT1遺伝子の第11イントロンの7番目(配列表の配列番号2のヌクレオチド番号266)のヌクレオチドがg(グアニン)である遺伝子を有する;
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)がt(チミン)である遺伝子を有する;
d)GFAT1遺伝子の第8イントロンの1853から1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)に存在するt(チミン)の繰り返しが25回である遺伝子を有する;
e)GFAT1遺伝子の第12イントロンの1988から2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)に存在するa(アデニン)の繰り返しが19回である遺伝子を有する;
f)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在するt(チミン)の繰り返しが11または12回である遺伝子を有する;
h)GFAT2遺伝子の第18エキソンの66番目(配列番号3のヌクレオチド番号2251)のヌクレオチドがt(チミン)である遺伝子を有する;
このうち、a)および/またはb)の条件に該当した被験者は、特に糖尿病性腎症を伴う2型糖尿病を発症する危険度が相対的に高く、h)の条件に該当した被験者は、特に腎症を伴わない2型糖尿病を発症する危険度が相対的に高い。
【0095】
また、二つ以上の遺伝子多型を組み合わせたハプロタイプを検出することによっても、糖尿病を発症する潜在的危険度の判定が可能である。たとえば、以下のx)〜z)のハプロタイプの一つまたは二つ以上を検出することにより、被験者が2型糖尿病または腎症を伴わない2型糖尿病を発症する危険度を判定することができる。さらに、z)のハプロタイプは、1型糖尿病または腎症を伴う2型糖尿病を発症する危険度の判定にも利用できる。
【0096】
x)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)、および同第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在する遺伝子多型を組合せたハプロタイプ
y)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)、および同第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在する遺伝子多型を組合せたハプロタイプ
z)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)、および同第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)に存在する遺伝子多型を組合せたハプロタイプ
【0097】
本発明によって、上記判定基準から糖尿病を発症する危険度が相対的に高いことが判明した被験者に対しては、その旨を告知し、予め糖尿病の発症を防ぐための対策を講じることができる。したがって、本発明は糖尿病(特に、2型糖尿病)を予防するための検査方法としてきわめて有用である。
【0098】
6.GFAT1をコードするDNA
本発明はまた、ヒトGFAT1(グルタミン:フルクトース−6−リン酸アミドトランスフェラーゼ1)をコードするDNAを提供する。
【0099】
本発明者らが特定したヒトGFAT1をコードするDNAは、配列番号22に示すようなヌクレオチド配列を有し、全長93390塩基で、19のエキソンと18のイントロンからなる。しかし、このヌクレオチド配列に限定されず、配列番号22で表されるヌクレオチド配列と少なくとも85%以上、好ましくは90%以上、さらに好ましくは95%以上の相同性を有するヌクレオチド配列からなるDNAも、ヒト由来のGFAT活性を有するタンパク質:GFAT1をコードする限り、本発明のDNAに含まれる。
【0100】
また、配列番号22で示されるヌクレオチド配列からなるDNAと相補的なヌクレオチド配列からなるDNAとストリンジェントな条件下でハイブリダイズするDNAも、ヒト由来のGFAT活性を有するタンパク質:GFAT1をコードする限り、本発明のDNAに含まれる。なお、ストリンジェントな条件とは、好ましくは0.5×SSCかつ温度55℃、より好ましくは0.1×SSCかつ温度65℃の条件をいう。
【0101】
ヒトGFAT1遺伝子は変異に富んでおり、1.に記載したように、そのヌクレオチド配列上には糖尿病の発症に関連した複数の遺伝子多型が存在する。したがって、本発明のDNAは、糖尿病の発症危険度の判定に極めて有用である。
【0102】
また、GFATは、ヘキソサミン生合成経路において、律速段階であるフルクトース−6−リン酸からグルコサミン−6−リン酸への反応を触媒する酵素である。したがって、GFAT活性を阻害する薬剤は、細胞内へのグルコースの取り込みを促進し、血糖値を低下させることができ、糖尿病治療薬としての可能性が期待される。つまり、本発明のDNAの発現量を指標として、糖尿病治療薬のスクリーニングをすることも可能である。
【0103】
【実施例】
以下、実施例により本発明をさらに具体的に説明するが、本発明はこれらに限定されるものではない。
〔実施例1〕 末梢血からのゲノムDNAの調製
日本人の健常人、1型糖尿病患者、2型糖尿病患者(腎症なし)、および2型糖尿病患者(腎症あり)の末梢血から白血球を分離した。この白血球より、自動DNA抽出装置(NA−1000:クラボウ社製)を用いて、各被験者のゲノムDNA試料を抽出した。得られたDNA試料について、260nmの吸光度を測定し、各試料のDNA濃度を算出した。その後、滅菌蒸留水を用いてゲノムDNAを50ng/μlに希釈し、PCR用試料とした。
【0104】
〔実施例2〕 PCR法による多型を含むDNA断片の増幅
実施例1で得られた各被験者のゲノムDNA試料を鋳型として、以下に記載する方法により、GFAT1遺伝子上の7箇所の多型部位のいずれかを含むDNA断片を増幅した。
【0105】
なお、本実施例で用いた各PCRプライマーは、5’末端をHEX(4,7,2’,4’,5’,7’−hexachloro−6−carboxy fluorescein、緑色蛍光色素)、NED(アプライドバイオシステムズ社商品名、黄色蛍光色素)、あるいは、6−FAM(アプライドバイオシステムズ社商品名、黄緑色蛍光色素)の蛍光色素で標識されたものをアプライドバイオシステムズ社に発注、購入した。
【0106】
1)GFAT1遺伝子の第1イントロンの36番目(配列番号1のヌクレオチド番号632)のヌクレオチドがc(シトシン)であるかt(チミン)であるかを検出するためのPCR:
以下のプライマーおよび反応条件でPCRを行い、多型部位を含む0.16kbpのDNA断片を増幅した。
PCRプライマー:
プライマーNo.1: 5’−CACCGAAGCTCGTGTGTGCA−3’(配列番号8)
プライマーNo.2: 5’−CGCCTTGGGCCTTAGCGGCA−3’(配列番号9)
(No.1、No.2ともに、HEXで5’末端を標識)
反応系:                            
PCRエンハンサー(ギブコ社、11495−017) 6μl
2.5mM dNTP                2.4μl
50mM 硫酸マグネシウム             1.5μl
10μM プライマーNo.1            2μl
10μM プライマーNo.2            2μl
50ng/μl ゲノムDNA            2μl
10×PCR反応緩衝液               2μl
(PCRxエンハンサーシステム:キ゛フ゛コ・ヒ゛ーアールエル社製に添付)
滅菌水                       2μl
Taqポリメラーゼ                 0.1μl
 ( Takara Ex Taq :宝酒造(株)社製、 単位 μ )        
Total                   20 μl
PCR条件:94℃1分、55℃1分、72℃2分を40サイクル
【0107】
2)GFAT1遺伝子の第11イントロンの7番目(配列番号2のヌクレオチド番号266)のヌクレオチドがg(グアニン)であるか、a(アデニン)であるかを検出するためのPCR:
以下のプライマーおよび反応条件でPCRを行い、多型部位を含む0.22kbpのDNA断片を増幅した。
PCRプライマー:
プライマーNo.3: 5’−GGAAACTTTTAGTTGTGTAC−3’(配列番号10)
プライマーNo.4: 5’−CTGTCAGAGACACTGAAATA−3’(配列番号11)
(No.3、No.4ともに、HEXで5’末端を標識)
反応系:                           
ジメチルスルホキシド(DMSO)         1μl
2.0mM dNTP               2μl
25mM 硫酸マグネシウム            1.5μl
10μM プライマーNo.3           2μl
10μM プライマーNo.4           2μl
50ng/μl ゲノムDNA           2μl
10×PCR反応緩衝液(AmpliTaq Goldに添付)  2μl
滅菌水                      7.4μl
Taqポリメラーゼ                0.1μl
 ( Gold Taq アフ゜ライト゛ハ゛イオシステムス゛ 社製)、 単位 μ )      
Total                 20μl
PCR条件:94℃1分、55℃1分、72℃2分を40サイクル
【0108】
3)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)がA(アデニン)、T(チミン)、あるいは、欠失であるかを検出するためのPCR:
以下のプライマーおよび反応条件でPCRを行い、多型部位を含む0.14kbpのDNA断片を増幅した。
PCRプライマー:
プライマーNo.5: 5’−GCCATGCTTATCTCAAGTGGT−3’(配列番号12)
プライマーNo.6: 5’−CATCGGACTTCTTTGGATTCA−3’(配列番号13)
(No.5、No.6ともに、HEXで5’末端を標識)
反応系:                           
2.5mM dNTP               1.2μl
50mM 硫酸マグネシウム            0.3μl
10μM プライマーNo.5           0.5μl
10μM プライマーNo.6           0.5μl
50ng/μl ゲノムDNA           1μl
10×PCR反応緩衝液              1μl
(フ゜ラチナTaqDNAホ゜リメラーセ゛:インヒ゛トロシ゛ェン社、型番10966−018に添付)
滅菌水                      5.45μl
プラチナTaqDNAポリメラーゼ         0.05μl
 ( インヒ゛トロシ゛ェン 社 型番 10966−018 単位 μ )            
Total                  10μl
PCR条件:94℃30秒、56℃30秒、72℃1分を35サイクル
【0109】
4)GFAT1遺伝子の第8イントロンの1853から1877番目のヌクレオチドT(チミン)(配列番号4のヌクレオチド番号336〜360)の繰り返しが24回あるいは25回であるかを検出するためのPCR:
以下のプライマーおよび反応条件でPCRを行い、多型部位を含む0.26kbpのDNA断片を増幅した。
PCRプライマー:
プライマーNo.7: 5’−AAAAAACACAGTGAAACTCAAG−3’(配列番号14)、
プライマーNo.8: 5’−AAACCCCGTCTCTACTAAAA−3’(配列番号15)
(No.7、No.8ともに、NEDで5’末端を標識)
反応系:                           
2.5mM dNTP               1.2μl
25mM 硫酸マグネシウム            0.75μl
10μM プライマーNo.7           0.5μl
10μM プライマーNo.8           0.5μ
l50ng/μl ゲノムDNA          1μl
10×PCR反応緩衝液              1μl
(PCRxエンハンサーシステム:キ゛フ゛コ・ヒ゛ーアールエル社製 に添付)
PCRエンハンサー                3μl
(キ゛フ゛コ・ヒ゛ーアールエル社製 に添付)
滅菌水                      2μl
Taqポリメラーゼ                0.05μl
 ( Takara Ex Taq :宝酒造(株)社製、 単位 μ )          
Total                  10μl
PCR条件:94℃30秒、54℃30秒、72℃1分を35サイクル
【0110】
5)GFAT1遺伝子の第12イントロンの1988から2007番目のヌクレオチドA(アデニン)(配列番号5のヌクレオチド番号328〜347)の繰り返しが18回、19回、24回、あるいは、25回であるかを検出するためのPCR:
以下のプライマーおよび反応条件でPCRを行い、多型部位を含む0.22kbpのDNA断片を増幅した。
PCRプライマー:
プライマーNo.9: 5’−AGAATCATGCCTCTGAATAG−3’(配列番号16)
プライマーNo.10: 5’−GATGGGGAAAGAAGAGAGAA−3’(配列番号17)
(No.9、No.10ともに、FAMで5’末端を標識)
反応系:                           
2.5mM dNTP               1.2μl
50mM 硫酸マグネシウム            0.3μl
10μM プライマーNo.9           0.5μl
10μM プライマーNo.10          0.5μl
50ng/μl ゲノムDNA           1μl
10×PCR反応緩衝液              1μl
(フ゜ラチナTaqDNAホ゜リメラーセ゛:インヒ゛トロシ゛ェン社、型番10966−018 に添付)
滅菌水                      5.45μl
プラチナTaqDNAポリメラーゼ         0.05μl
 ( インヒ゛トロシ゛ェン 社、型番 10966−018 単位 μ )            
Total                  10μl
PCR条件:94℃30秒、54℃30秒、72℃1分を35サイクル
【0111】
6)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチドT(チミン)(配列番号6のヌクレオチド番号253〜264)の繰り返しが11回、12回、あるいは、13回であるかを検出するためのPCR:
以下のプライマーおよび反応条件でPCRを行い、多型部位を含む0.21kbpのDNA断片を増幅した。
PCRプライマー:
プライマーNo.11: 5’−GATGGTTAATGAATGTATTGT−3’(配列番号18)
プライマーNo.12: 5’−GCTTAATCATACAGTTTCGT−3’(配列番号19)
(No.11はFAMで5’末端を標識、No.12はHEXで5’末端を標識)
反応系:                            
2.5mM dNTP               1.1μl
50mM 塩化マグネシウム            1μl
10μM プライマーNo.11          1μl
10μM プライマーNo.12          1μl
50ng/μl ゲノムDNA           1μl
10×PCR反応緩衝液              1μl
(LA Taq DNAホ゜リメラーセ゛:宝酒造社、型番RR002A に添付)
滅菌水                      3.85μl
LATaqDNAポリメラーゼ          0.05μl
 (宝酒造社、型番 RR002A 単位 μ )             
Total                  10μl
PCR条件:94℃30秒、54℃30秒、72℃1分30秒を35サイクル
【0112】
7)GFAT1遺伝子の第3イントロンの2632から2661番目のマイクロサテライトマーカーCAA(シトシン、アデニン、アデニン)(配列番号7のヌクレオチド番号237〜266の領域)の繰り返しが7回、9回、10回、11回、あるいは、12回であるかを検出するためのPCR:
以下のプライマーおよび反応条件でPCRを行い、多型部位を含む0.26kbpのDNA断片を増幅した。
PCRプライマー:
プライマーNo.13: 5’−CCCATCTCTACTAAAATACA−3’(配列番号20)
プライマーNo.14: 5’−CACTTCTTTCAAAAGCTACA−3’(配列番号21)
(No.13、No.14ともに、HEXで5’末端を標識)
反応系:                          
2.5mM dNTP              1.1μl
50mM 塩化マグネシウム           0.8μl
10μM プライマーNo.13         1μl
10μM プライマーNo.14         1μl
50ng/μl ゲノムDNA          1μl
10×PCR反応緩衝液             1μl
(LA Taq DNAホ゜リメラーセ゛:宝酒造社、型番RR002A に添付)
滅菌水                     4.05μl
LATaqDNAポリメラーゼ         0.05μl
 (宝酒造社、型番 RR002A 単位 μ )            
Total                 10μl
PCR条件:94℃30秒、56℃30秒、72℃1分30秒を40サイクル
【0113】
8) GFAT2遺伝子の第18エキソンの66番目(配列表の配列番号3のヌクレオチド番号2251)のヌクレオチドがc(シトシン)であるかt(チミン)であるかを検出するためのPCR:
以下のプライマーおよび反応条件でPCRを行い、多型部位を含む205bpのDNA断片を増幅した。
PCRプライマー:
プライマーNo.15: 5’−CCCATCTCTACTAAAATACA−3’(配列番号24)
プライマーNo.16: 5’−CACTTCTTTCAAAAGCTACA−3’(配列番号25)
(No.15、No.16ともに、HEXで5’末端を標識)
反応系:                            
2.5mM dNTP                3.2μl
2.5mM 硫酸マグネシウム            2.8μl
10μM プライマーNo.15           2μl
10μM プライマーNo.16           2μl
50ng/μl ゲノムDNA            2μl
10×PCR反応緩衝液               2μl
(LA Taq DNAホ゜リメラーセ゛:宝酒造社、型番RR002A に添付)
滅菌水                       9μl
LATaqDNAポリメラーゼ           0.1μl
 (宝酒造社、型番 RR002A 単位 μ )             
Total                   20μl
PCR条件:94℃30秒、56℃30秒、72℃1分30秒を40サイクル
【0114】
〔実施例3〕 GFAT遺伝子の多型の検出
1)DNAシークエンサーによる解析
GFAT遺伝子の各多型部位を同定するためのヌクレオチド配列の決定は、DNAシークエンサー(ABI PRISM 377:アプライドバイオシステムズ社製)を用いて常法により行った。
【0115】
その結果、以下の位置に各多型が存在することが確認された。
a)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632);
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266);
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338);
d)GFAT1遺伝子の第8イントロンの1853から1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360);
e)GFAT1遺伝子の第12イントロンの1988から2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347);
f)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264);
g)GFAT1遺伝子の第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)
h)GFAT2遺伝子の第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)
【0116】
2)SSCP法
実施例2で得られた各PCR産物を、ホルムアミド溶液:ローディングバッファー(0.03g/mlのブルーデキストランを含む0.05MのEDTA水溶液)=5:1の混合液に1/5量加え混合し、95℃で2分間の熱変性後、氷冷して電気泳動用試料とした。この試料を非変性ポリアクリルアミドゲルで電気泳動し、アレルの違いに基づくDNA断片の移動度の違いにより多型を検出した。電気泳動のゲルは、12%ポリアクリルアミドゲルにグリセロ―ルを5%添加したもの(ゲル厚さ0.2mm)を用いた。なお、測定条件の違いにより多型検出に変化がないことを確認するために、10%ポリアクリルアミドにグルセロ―ルを5%添加したもの、および12%ポリアクリルアミドゲルにグルセロ―ルを10%添加したもの、の2条件で行った。電気泳動は、DNAシークエンサー(ABI PRISM 377:アプライドバイオシステムズ社製)を用いて、30ワット定電力でAフィルターを使用し、3〜12時間通電した。蛍光バンドはDNAシークエンサーの検出機能を用いて検出した。なお、電気泳動中は、ゲル板温度を保つため、冷却装置(RTE−III、NESLAB社製)で20℃に調節した水をゲル板外部に循環させるようにした。なお、実施例3の1)で記載した方法にしたがい、多型部位のヌクレオチド配列を決定したDNA断片をポジティブコントロールとし、GFAT遺伝子多型の遺伝子型を判定した。
【0117】
〔実施例4〕 GFAT遺伝子の多型と糖尿病との関連
GFAT1遺伝子と1型糖尿病、2型糖尿病、および糖尿病性腎症との関連を関連解析法(アソシエーション法)により解析した(フィッシャーら、バイオスタティスティクス(Biostatistics)、John Willey &Sons社、1993年)。なお、ハプロタイプ解析は、Arlequinプログラムを用いて行なった(Laurent Excoffier社製統計解析ソフトウェア、URL:http://lgb.unige.ch/arlequin/)。有意差検定には、Fisherの直接確率計算法を拡張したexact test of population differentiation (PD検定)を用いた(「基礎医学統計学 改訂第4版」、加納克己、高橋秀人共著、南江堂、1995年)。有意水準は危険率5%とし、危険率5%未満のものを有意差ありと判定した。
【0118】
1)2型糖尿病とGFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)の多型との関係
日本人の健常人141名、日本人の2型糖尿病患者388名(腎症あり156名、腎症なし232名)について、GFAT1遺伝子の第1イントロンの36番目(配列番号1のヌクレオチド番号632)における多型頻度を算出し、アソシエーション法により糖尿病との関連を解析した。結果を表1に示す。
【0119】
【表1】

Figure 2004000115
【0120】
表1において、GFAT1遺伝子の第1イントロンの36番目がt(チミン)である遺伝子をホモで有する被験者は「TT」、当該部位がc(シトシン)である遺伝子をホモで有する被験者は「CC」、両遺伝子をヘテロで有する被験者は「TC」として表されている。表1の結果より、健常人と2型糖尿病患者(腎症あり)との間において、GFAT1遺伝子のイントロン1の36番目ヌクレオチドにおけるアレル頻度が統計的に有意に異なることが示された。このことは、GFAT1遺伝子の第1イントロンの36番目ヌクレオチドにおける遺伝子多型を調べることにより、糖尿病性腎症を併発する2型糖尿病を発症する相対的危険度を判定できることを示すものである。
【0121】
2)2型糖尿病とGFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)における多型との関係
日本人の健常人137名、日本人の2型糖尿病患者377名(腎症あり149名、腎症なし228名)について、GFAT1遺伝子の第11イントロンの7番目(配列番号2のヌクレオチド番号266)のヌクレオチドにおける多型頻度を算出し、アソシエーション法により糖尿病との関連を解析した。結果を表2に示す。
【0122】
【表2】
Figure 2004000115
【0123】
表2において、GFAT1遺伝子の第11イントロンの7番目がg(グアニン)である遺伝子をホモで有する被験者は「GG」、当該部位がa(アデニン)である遺伝子をホモで有する被験者は「AA」、両遺伝子をヘテロで有する被験者は「GA」として表されている。表2の結果より、健常人と2型糖尿病患者(腎症あり)との間において、GFAT1遺伝子の第11イントロンの7番目のヌクレオチドにおけるアレル頻度が統計的に有意に異なることが示された。このことは、GFAT1遺伝子の第11イントロンの7番目のヌクレオチドにおける遺伝子多型を調べることにより、糖尿病性腎症を併発する2型糖尿病を発症する相対的危険度を判定できることを示すものである。
【0124】
3)2型糖尿病とGFAT2遺伝子の第18エキソン(配列番号23のヌクレオチド番号2251)の66番目のヌクレオチドにおける遺伝子多型との関係
日本人の健常人144名、日本人の2型糖尿病患者398名(腎症あり158名、腎症なし240名)について、GFAT2遺伝子のエキソン18の66番目のヌクレオチド(配列番号3のヌクレオチド番号2251)の多型頻度を算出し、アソシエーション法により糖尿病との関連を解析した。結果を表3に示す。
【0125】
【表3】
Figure 2004000115
【0126】
表3において、GFAT2遺伝子の第18エキソンの66番目がc(シトシン)である遺伝子をホモで有する被験者は「CC」、当該部位が、t(チミン)である遺伝子をホモで有する被験者は「TT」、両遺伝子をヘテロで有する被験者は「TC」として表されている。表3の結果より、健常人と2型糖尿病患者(腎症なし)との間において、また2型糖尿病患者(腎症あり)と2型糖尿病患者(腎症なし)との間において、それぞれGFAT2遺伝子の第18エキソンの66番目のヌクレオチドの多型頻度が統計的に有意に異なることが示された。このことは、GFAT2遺伝子の第18エキソンの66番目のヌクレオチドの多型を調べることにより、糖尿病性腎症を伴わない2型糖尿病を発症する相対的危険度を判定できることを示すものである。
【0127】
4)2型糖尿病とGFAT1遺伝子の第8イントロンにおけるTの繰り返し多型(配列番号4のヌクレオチド番号336〜360)との関係
日本人の健常人191名、日本人の2型糖尿病患者384名について、GFAT1遺伝子の第8イントロンにおけるTの繰り返し多型(配列番号4のヌクレオチド番号336〜360)におけるアレル頻度を算出し、アソシエーション法により糖尿病との関連を解析した。結果を表4に示す。
【0128】
【表4】
Figure 2004000115
【0129】
表4において、GFAT1遺伝子の第8イントロンにおけるTの繰り返し(配列番号4のヌクレオチド番号336〜360)回数が24回の場合は「T24」、あるいは25回の場合は「T25」として表されている。表4の結果より、健常人と2型糖尿病患者との間において、GFAT1遺伝子の第8イントロンにおけるTの繰り返し多型のアレル頻度が、統計的に有意に異なることが示された。このことは、GFAT1遺伝子の第8イントロンにおけるTの繰り返し多型を調べることにより、2型糖尿病を発症する相対的危険度を判定できることを示すものである。
【0130】
5)2型糖尿病とGFAT1遺伝子の第12イントロンにおけるAの繰り返し多型(配列番号5のヌクレオチド番号328〜347)との関係
日本人の健常人189名、日本人の2型糖尿病患者389名について、2型糖尿病とGFAT1遺伝子の第12イントロンにおけるAの繰り返し多型のアレル頻度を算出し、アソシエーション法により糖尿病との関連を解析した。結果を表5に示す。
【0131】
【表5】
Figure 2004000115
【0132】
表5において、GFAT1遺伝子の第12イントロンにおけるAの繰り返し(配列番号5のヌクレオチド番号328〜347)回数が18回の場合は「A18」、19回の場合は「A19」、24回の場合は「A24」、あるいは25回の場合は「A25」として表されている。表5の結果より、健常人と2型糖尿病患者との間において、GFAT1遺伝子の第12イントロンにおけるTの繰り返し多型のアレル頻度が統計的に有意に異なることが示された。このことは、GFAT1遺伝子の第12イントロンにおけるAの繰り返し多型を調べることにより、2型糖尿病を発症する相対的危険度を判定できることを示すものである。
【0133】
6)2型糖尿病とGFAT1遺伝子の第18イントロンにおけるTの繰り返し多型(配列番号6のヌクレオチド番号253〜264)との関係
日本人の健常人192名、日本人の2型糖尿病患者373名について、GFAT1遺伝子の第18イントロンにおけるTの繰り返し多型(配列番号6のヌクレオチド番号253〜264)におけるアレル頻度を算出し、アソシエーション法により糖尿病との関連を解析した。結果を表6に示す。
【0134】
【表6】
Figure 2004000115
【0135】
表6において、GFAT1遺伝子の第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)回数が11回の場合は「T11」、12回の場合は「T12」、あるいは13回の場合は「T13」として表されている。表6の結果より、健常人と2型糖尿病患者との間において、2型糖尿病とGFAT1遺伝子の第18イントロンにおけるTの繰り返し多型のアレル頻度が統計的に有意に異なることが示された。このことは、GFAT1遺伝子の第18イントロンにおけるTの繰り返し多型を調べることにより、2型糖尿病を発症する相対的危険度を判定できることを示すものである。
【0136】
7)2型糖尿病とGFAT1遺伝子の第12イントロンにおけるヌクレオチド(配列番号3のヌクレオチド番号338)の多型との関係
日本人の健常人192名、日本人の2型糖尿病患者377名について、2型糖尿病とGFAT1遺伝子の第12イントロンにおけるヌクレオチド(配列番号3のヌクレオチド番号338)多型のアレル頻度を算出し、アソシエーション法により糖尿病との関連を解析した。結果を表7に示す。
【0137】
【表7】
Figure 2004000115
【0138】
表7において、GFAT1遺伝子の第12イントロンのヌクレオチド(配列番号3のヌクレオチド番号338)部位がアデニンの場合は「A」、チミンの場合は「T」、あるいは、欠失の場合は「del」として表されている。表7の結果より、健常人と2型糖尿病患者との間において、GFAT1遺伝子の第12イントロンにおけるヌクレオチド(配列番号3のヌクレオチド番号338)多型のアレル頻度が統計的に有意に異なることが示された。このことは、GFAT1遺伝子の第12イントロンにおけるヌクレオチド(配列番号3のヌクレオチド番号338)の多型を調べることにより、2型糖尿病を発症する相対的危険度を判定できることを示すものである。
【0139】
8)2型糖尿病とGFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)多型と第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)多型を組み合わせたハプロタイプとの関係
日本人の健常人141名、日本人の2型糖尿病患者366名(腎症あり145名、腎症なし221名)について、GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)多型と第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)多型を組み合わせたハプロタイプ頻度を算出し、アソシエーション法により糖尿病との関連を解析した。結果を表8に示す。
【0140】
【表8】
Figure 2004000115
【0141】
表8において、GFAT1遺伝子の第1イントロンの36番目がT(チミン)である遺伝子をホモで有する被験者は「T/T」、当該部位がC(シトシン)である遺伝子をホモで有する被験者は「C/C」、両遺伝子をヘテロで有する被験者は「T/C」として表されている。また、表8において、GFAT1遺伝子の第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)回数が11回の場合は「T11」、12回の場合は「T12」、あるいは13回の場合は「T13」として表されている。さらに、それぞれの組み合わせにより生じる遺伝子型は、「T13/T13」、「T13/T12」、「T12/T12」、「T13/T11」、「T12/T11」、あるいは、「T11/T11」として表されている。表8の結果より、健常人と2型糖尿病患者全体との比較、および、健常人と2型糖尿病患者(腎症なし)との比較において、それぞれのハプロタイプにおける頻度分布が有意に異なることが示された。このことは、GFAT1遺伝子のGFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)多型と第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)多型を組み合わせたハプロタイプを調べることにより、2型糖尿病あるいは糖尿病性腎症を伴わない2型糖尿病を発症する相対的危険度を判定できることを示すものである。
【0142】
9)2型糖尿病とGFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)多型と第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)多型を組み合わせたハプロタイプとの関係
日本人の健常人143名、日本人の2型糖尿病患者367名(腎症あり145名、腎症なし222名)について、GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)多型と第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)多型を組み合わせたハプロタイプ頻度を算出し、アソシエーション法により糖尿病との関連を解析した。結果を表9に示す。
【0143】
【表9】
Figure 2004000115
【0144】
表9において、GFAT1遺伝子の第11イントロンの7番目がG(グアニン)である遺伝子をホモで有する被験者は「G/G」、当該部位がA(アデニン)である遺伝子をホモで有する被験者は「A/A」、両遺伝子をヘテロで有する被験者は「G/A」として表されている。また、表9において、GFAT1遺伝子の第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)回数が11回の場合は「T11」、12回の場合は「T12」、あるいは13回の場合は「T13」として表されている。さらに、それぞれの組み合わせにより生じる遺伝子型は、「T13/T13」、「T13/T12」、「T12/T12」、「T13/T11」、「T12/T11」、あるいは、「T11/T11」として表されている。表9の結果より、健常人と2型糖尿病患者全体との比較、および、健常人と2型糖尿病患者(腎症なし)との比較において、それぞれのハプロタイプにおける頻度分布が有意に異なることが示された。このことは、GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)多型と第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)多型を組み合わせたハプロタイプを調べることにより、2型糖尿病あるいは糖尿病性腎症を伴わない2型糖尿病を発症する相対的危険度を判定できることを示すものである。
【0145】
10)1型および2型糖尿病とGFAT1遺伝子の第3イントロンにおけるマイクロサテライト(配列番号7のヌクレオチド番号237〜266)多型と第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)多型を組み合わせたハプロタイプとの関係
日本人の健常人143名、日本人の1型糖尿病患者64名、日本人の2型糖尿病患者372名(腎症あり143名、腎症なし229名)について、GFAT1遺伝子の第3イントロンにおけるマイクロサテライト(配列番号7のヌクレオチド番号237〜266)多型と第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)多型を組み合わせたハプロタイプ頻度を算出し、アソシエーション法により糖尿病との関連を解析した。結果を表10に示す。
【0146】
【表10】
Figure 2004000115
【0147】
表10において、GFAT1遺伝子の第3イントロンにおけるマイクロサテライト(配列番号7のヌクレオチド番号237〜266)CAA(シトシン、アデニン、アデニン)の繰り返し回数が7回の場合は「7」、9回の場合は「9」、10回の場合は「10」、11回の場合は「11」、あるいは12回の場合は「12」として表されている。また、それぞれの組み合わせにより生じる遺伝子型は、「9/9」、「9/10」、「10/10」、「9/11」、「10/11」、「11/11」、「9/12」、「10/12」、「11/12」、「12/12」、「9/7」、「10/7」、「11/7」、「12/7」、あるいは「7/7」として表されている。さらに、表10において、GFAT1遺伝子の第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)回数が11回の場合は「T11」、12回の場合は「T12」、あるいは13回の場合は「T13」として表されており、それぞれの組み合わせにより生じる遺伝子型は、「T13/T13」、「T13/T12」、「T12/T12」、「T13/T11」、「T12/T11」、あるいは、「T11/T11」として表されている。表10の結果より、健常人と2型糖尿病患者全体との比較、健常人と2型糖尿病患者(腎症あり)、健常人と2型糖尿病患者(腎症なし)、および健常人と1型糖尿病患者との比較すべておいて、それぞれのハプロタイプにおける頻度分布が有意に異なることが示された。このことは、GFAT1遺伝子の第3イントロンにおけるマイクロサテライト(配列番号7のヌクレオチド番号237〜266)多型と第18イントロンにおけるTの繰り返し(配列番号6のヌクレオチド番号253〜264)多型を組み合わせたハプロタイプを調べることにより、1型、2型糖尿病、糖尿病性腎症を伴なう2型糖尿病、あるいは、糖尿病性腎症を伴わない2型糖尿病を発症する相対的危険度を判定できることを示すものである。
【0148】
【発明の効果】
本発明によれば、1型、2型糖尿病、糖尿病性腎症を伴なう2型糖尿病、あるいは、糖尿病性腎症を伴わない2型糖尿病を発症する、相対的危険度を簡便に判定することができる。すなわち、本発明は糖尿病の発症危険性判定方法と該方法のための材料を提供する。
【0149】
【配列表】
SEQUENCE LISTING
<110> Itakura, Mitsuo
Sankyo Company, Limited
<120> Method for determining a risk of developing diabetes<130> 2002095SU
<150> JP2001−271870
<151> 2001−09−07
<150> JP2002−090861
<151> 2002−03−28
<160> 25
<170> PatentIn Ver. 2.1
<210> 1
<211> 782
<212> DNA
<213> Homo sapiens
<220>
<223> inventor:Itakura, Mitsuo; Yasumo, Hiroaki; Watanabe, Ichiro<220>
<221> variation
<222> (632)
<223> Description of variation: single nucleotide polymorphism involvingreplacement of (C) and (T)
<400> 1
ccaggattcc cttttcatac ttcctgcttt tttcctcctc tttcctcgct tcgtgcagtg 60
ctggcgcctg gggcctgggg ctgcacgggg cacgcacccg ggctattgct ttgctaacaa 120
ttccatcctt ctctttccgt cattccctgc caggtgctga gtttctccct ccctctcggc 180
tcggtccctc ccgcggctcg ccccggggcg ggcgtctcca ggaactccag gcggacgcgg 240
ccacgagcca ctgccacgtc gccgccgcca gcagtccagc gcctgcgtgg gctcgggggg 300
cggggcagcg ctgggaggcg ggacttgcgc gtgagcggcg cgtgagcggt tcaatggagc 360
ctacgggcgg cggcgcgctg cgcgccgagg ggcggggccc ggcggcggtt gctggcggag 420
cccgggaggc ggagaaggct gtcgttgcct tggccgtcgc atccccgagg gagtcgtgtc 480
ggcgccaccc cggcccccga gcccgcagat tgcccaccga agctcgtgtg tgcacccccg 540
atcccgccag ccactcgccc ctggcctcgc gggccgtgtc tccggcatca tgtgtggtaa 600
gggggccggg agcggggggc gtgttgccgg gyggcgctgg ggtgcggtgc gggtgccgct 660
aaggcccaag gcgacgggcg gaagcgggag tgtggagggt gcgaagtctg ggtgatgggc 720
aaggggcgcc cagtggtggc tgcgggggcg ggggccggca tccacgggcg ggagaggggg 780
tg                                                                782
<210> 2
<211> 675
<212> DNA
<213> Homo sapiens
<220>
<221> variation
<222> (266)
<223> Description of variation: single nucleotide polymorphism involvingreplacement of (G) and (A)
<400> 2
agagtaaaat atgttcaccc agtcttttag gcagtcatgt ctattgcatg aacttttgtt 60
atattttatt taccaagatt atattaaagg aaacttttag ttgtgtacaa attcttttat 120
ttgatttgtt tttgttttaa ttatgtgatt tctattacta taggcaactt cagttcattt 180
atgcagaagg aaatatttga gcagccagag tctgtcgtga acacaatgag aggaagagtc 240
aactttgatg actatactgg taattrcata tgaattattt tattatttca gtgtctctga 300
cagtaggagg tgccattaac aacctgaaag ttcattgccc ttaatagcct tgtagaacaa 360
ctacagctgc cagccatcag tggagcccag ccatcttgga aaaagttctt tagtgtgtga 420
ttctacctat ataagatatc tagaatagtc agattcacag aaagagaaag tagattaatg 480
gttaccaagg gctgtgggga ggggaaatgg ggagtcactg tttaaagggt acagagtttc 540
agttgtggga tgatgaaatt acagaaatgg attgtagtga tggttgcaca ataatgtgaa 600
tgtgcttaat gccactgaat tgtacattta aacatagtta aaatggtaaa ttttatgtgt 660
aggtcaccca ctgtg                                                  675
<210> 3
<211> 780
<212> DNA
<213> Homo sapiens
<220>
<221> variation
<222> (338)
<223> Description of variation: single nucleotide polymorphism involvingreplacement of (A) and (T)
<400> 3
ctttgggagg ctgaggcgag cagatcatga ggtcaggaga ttgagaccat cctggccaac 60
atggtgaaac cccatctcta ctaagctggg catggtggcg cacgcctata gtcccagcta 120
ctcaggaggc tgaggcagga gaattgcttg aacccgggag gcggaggtta cggtgagccg 180
agatggcacc actgcactcc agcctggcga cagagcgaga ctccgtctca aaaaaaaaaa 240
aaaaaaaagg aatgtataca tagatagttg tctaaagaga ctgatagtaa aatgttagcc 300
atgcttatct caagtggtag gattttgatt tttttttwaa aatattttaa tctgggttgt 360
ttttattttc taacgtgtca tttttgtaat cagaaaaagc aaaaactata cattgaatcc 420
aaagaagtcc gatgaaagag tatttgaagg aaagttctgt gaccaagtca tattttctct 480
gcagacacgt caagttcttg aggagctgac tgagttgcct gtgatggtgg aactagcaag 540
tgacttcctg gacagaaaca caccagtctt tcgagatgat gtttgctttt tccttagtca 600
atcaggtgtg ttaattttaa agacttaaaa ggaaggaaag ttattctttc taataattct 660
agcatatctt ggcaaaagct gatatttaaa gataaactgg cattgcagat gacttgacga 720
atacagattt attttaatgt tacataattc tttatgaatt agtaaaaatg aacacctttt 780
<210> 4
<211> 720
<212> DNA
<213> Homo sapiens
<220>
<221> variation
<222> (336)..(360)
<223> Description of variation: (T)24 or (T)25 repeat polymorphism<400> 4
cgggttcaag cgagtctcat gcctcagcct ccagagtagc tgggactacc agtgcacacc 60
accacacccg gctaactttt gtatttttag tagagacggg gtttcgccat tttggccggg 120
ctaatctcga actcctgacc tcaggtgatc cgcccacctc ggcctcccaa agtgctggga 180
ttacaggtgt gagccgctgc acccagcctc aaattttttt tacatatttt aactaaatat 240
actttgttat ttgaagaatg aaattatcaa tatttggaga aaaaacacag tgaaactcaa 300
gcctattagg acattttata agcaaaagta gttggttttt tttttttttt tttttttttt 360
gagacgaagt ctcgctctgt tgctcaggct gtagtgcagt ggcgtgatct cggctcactg 420
caacctcggc ctcccgggtt caagcgagtc tcttgcctca gcctcctgag tagctgggat 480
tacaggcacg tgccaccaca cccagcaaat ttttctattt ttagtagaga cggggtttca 540
ggctgttgct caggctggtc tcaaactcct gacctcatga tccgcccacc tcggcctccc 600
aaagtgctgg gattacaggc ctgagccacc acacctggtt gcatttattt tttttaaatg 660
ctgagctctc tttttatgtg tttttaaatt cacttttttg ttttgttttt gagacaaagt 720
<210> 5
<211> 660
<212> DNA
<213> Homo sapiens
<220>
<221> variation
<222> (328)..(347)
<223> Description of variation: (A)18, (A)19, (A)24 or (A)25 repeat polymorphism
<400> 5
atggaacact aggcataaat gatttaagta tagcctactt aatatgcttt tcaaaatttt 60
aattttctct aggttttgta gtggcattca gtggaattta tagcattaag ttactctatt 120
gtgatggaaa tatgtcattt tgtgtattta taaaaagttg tttgcagctg ggtgcagtgg 180
tgtgtgccta tagttccagc tcctcggaag ctggggcagg aggatcactt gagaccagga 240
atttgaggcc acagtgccct agaatcatgc ctctgaatag ctactacact ccagcctggg 300
caacaaacca agaccccatc tttaaccaaa aaaaaaaaaa aaaaaaagtt gccccaacta 360
aaataataaa ctattaatta gcacagataa atcttgagat tacttttttg gggtttatta 420
cttttaaata tctggtaagc ctccagattt ctatctttct ctcttctttc cccatctttt 480
tattttgaag aatatgattc caatgtaaca tttatattat aaactgggtg aaaaggtttg 540
gtttacattt atttgtggga aaacatttag cattttagtg tcggtaactt aattatgtat 600
aataaaatat attaatggaa aagaataata aaaaatagga gcattttatc ttcaatgatt 660
<210> 6
<211> 540
<212> DNA
<213> Homo sapiens
<220>
<221> variation
<222> (253)..(264)
<223> Description of variation: (T)11, (T)12, or (T)13 repeat polymorphism
<400> 6
tatgagggct actacttctg tagaggacca cagtagctct ttctgtgtga actggcacct 60
ttagaatgct ttttcctaac caatttcagt ttttttcagg acacattatg tgattatatt 120
ttctaatcta attctttgta gtctgtaata aagatggtta atgaatgtat tgttttctgt 180
ttttataaac aaaaataatt tgcttatagt aaccaccccc ttccccagtc tatataatct 240
ctcaaatctt gctttttttt ttttcttttt gcaggttgat ttcccacgga atcttgccaa 300
atctgtgact gtagagtgag gaatatctat acaaaatgta cgaaactgta tgattaagca 360
acacaagaca ccttttgtat ttaaaacctt gatttaaaat atcacccctt gaagcctttt 420
tttagtaaat ccttatttat atatcagtta taattattcc actcaatatg tgatttttgt 480
gaagttacct cttacatttt cccagtaatt tgtggaggac tttgaataat ggaatctata 540
<210> 7
<211> 360
<212> DNA
<213> Homo sapiens
<220>
<221> variation
<222> (237)..(266)
<223> Description of variation: (CAA)7, (CAA)9, (CAA)10, (CAA)11 or (CAA)12 microsatellite repeat polymorphism
<400> 7
gggcggattg cctgagctct ggagtttgag accagcctgg gcaacatggt gaaaccccat 60
ctctactaaa atacaaaaaa ttagccgggt gtggcggcgt gcacctgtag ttccagctat 120
tcgggaggct gaggcaggag aatcacttga atccaggagg cggaggttgc agtgagctga 180
gatcgtgcca ctgcactcca gcctgggtga cagagtgaga ctccgtctcc acaaaacaac 240
aacaacaaca acaacaacaa caacaaaaaa taagttgtat atgatagtga atgagcatat 300
gtagcttttg aaagaagtgt actgaatctg gttctgcata tgggaacatg gataattcct 360
<210> 8
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer<400> 8
caccgaagct cgtgtgtgca                                             20
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 9
cgccttgggc cttagcggca                                             20
<210> 10
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 10
ggaaactttt agttgtgtac                                             20
<210> 11
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 11
ctgtcagaga cactgaaata                                             20
<210> 12
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 12
gccatgctta tctcaagtgg t                                           21
<210> 13
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 13
catcggactt ctttggattc a                                           21
<210> 14
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 14
aaaaaacaca gtgaaactca ag                                          22
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 15
aaaccccgtc tctactaaaa                                             20
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 16
agaatcatgc ctctgaatag                                             20
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 17
gatggggaaa gaagagagaa                                             20
<210> 18
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 18
gatggttaat gaatgtattg t                                           21
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 19
gcttaatcat acagtttcgt                                             20
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 20
cccatctcta ctaaaataca                                             20
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 21
cacttctttc aaaagctaca                                             20
<210> 22
<211> 93390
<212> DNA
<213> Homo sapiens
<220>
<221> exon
<222> (16824)..(16952)
<220>
<221> intron
<222> (16953)..(29910)
<220>
<221> exon
<222> (29911)..(30019)
<220>
<221> intron
<222> (30020)..(33917)
<220>
<221> exon
<222> (33918)..(34025)
<220>
<221> intron
<222> (34026)..(40361)
<220>
<221> exon
<222> (40362)..(40487)
<220>
<221> intron
<222> (40488)..(44706)
<220>
<221> exon
<222> (44707)..(44765)
<220>
<221> intron
<222> (44766)..(45569)
<220>
<221> exon
<222> (45570)..(45704)
<220>
<221> intron
<222> (45705)..(47473)
<220>
<221> exon
<222> (47474)..(47535)
<220>
<221> intron
<222> (47536)..(49463)
<220>
<221> exon
<222> (49464)..(49543)
<220>
<221> intron
<222> (49544)..(53849)
<220>
<221> exon
<222> (53850)..(53955)
<220>
<221> intron
<222> (53956)..(55698)
<220>
<221> exon
<222> (55699)..(55862)
<220>
<221> intron
<222> (55863)..(58034)
<220>
<221> exon
<222> (58035)..(58130)
<220>
<221> intron
<222> (58131)..(61782)
<220>
<221> exon
<222> (61783)..(61880)
<220>
<221> intron
<222> (61881)..(65464)
<220>
<221> exon
<222> (65465)..(65585)
<220>
<221> intron
<222> (65586)..(65974)
<220>
<221> exon
<222> (65975)..(66132)
<220>
<221> intron
<222> (66133)..(74228)
<220>
<221> exon
<222> (74229)..(74343)
<220>
<221> intron
<222> (74344)..(74602)
<220>
<221> exon
<222> (74603)..(74730)
<220>
<221> intron
<222> (74731)..(75591)
<220>
<221> exon
<222> (75592)..(75759)
<220>
<221> intron
<222> (75760)..(76953)
<220>
<221> exon
<222> (76954)..(77115)
<220>
<221> intron
<222> (77116)..(77794)
<220>
<221> exon
<222> (77795)..(78753)
<220>
<221> variation
<222> (16988)
<223> Description of variation: single nucleotide polymorphism involvingreplacement of (C) and (T)
<220>
<221> variation
<222> (36657)..(36686)
<223> Description of variation: (CAA)7, (CAA)9, (CAA)10, (CAA)11 or (CAA)12 microsatellite repeat polymorphism
<220>
<221> variation
<222> (51396)..(51420)
<223> Description of variation: (T)24 or (T)25 repeat polymorphism
<220>
<221> variation
<222> (58137)
<223> Description of variation: single nucleotide polymorphism involvingreplacement of (G) and (A)
<220>
<221> variation
<222> (63868)..(63887)
<223> Description of variation: (A)18, (A)19, (A)24 or (A)25 repeat polymorphism
<220>
<221> variation
<222> (65318)
<223> Description of variation: single nucleotide polymorphism involvingreplacement of (A) and (T)
<220>
<221> variation
<222> (77773)..(77784)
<223> Description of variation: (T)11, (T)12, or (T)13 repeat polymorphism
<400> 22
aaccytgtct ctattaaaaa tmcaaaaaat tagccgggca tggtggcggg ggcctgtagt 60
cccagctact cgggaggctg aggcaggaga atggcgtgaa cctgggaggc ggagcttgca 120
gtgacccaag attgcaccac tgcactccag cctgggcgac agagtgagac tctatctcaa 180
aaaaaaaaaa agtaaccctg gaactaaaat tataataact gaacttaaga actcattaga 240
ttggacatag ttgaagagaa gattagtata ctggaattta agtcagtaga aaatattcag 300
cctgaagcac agggagagaa gagaatagaa gatatgggaa agaagcatga gatggtgggc 360
atggtgctca cacctataat tccagcactt tgggaggctg aggtaggagg attgcttgag 420
ctcagaagtt agagaccacc ctggcaacat agtgagacct tgtctctaca aaaaattaaa 480
aaattagctg ggtgtggtgg tgtgcacctg tagtctcagc tgttcctgag gcgggaagat 540
tgcttgagcc cgggagattg aggctgcagt gggctgtgat cacaccattg cactctggtc 600
aaggagacag aacaagaccc tgtctcacca gaaaaaaaaa aatgaatcaa acctctggag 660
gggagaaata gaataaaaaa taattcatca atctgaaaca atgcaaaata ggaaacagta 720
aatggtaata taaactcaaa agtgttggca tttaaatgac agtagtttga tgaacaaaaa 780
taagattgtc aaattggatg tgaaaaaaca aaaaaacaaa atcaactata gactgcttag 840
aagagatata ggggccaggc atggcggcta atgcctgtaa tcctagcatt ttgggaggcc 900
aaggtggcag attgcttgag cccaggagtt tgagaccagc ctgggcaaca tagtgagacc 960
ccgtctctac aatgaaagaa agagagaaag agaaagaaag agagagggag ggaggaagga 1020
agtgaaggaa ggaaggaggg agggagggga aaagaaaaga gaaaaggaaa gaaatagaat 1080
atttgtatga ccttcgggta ggcaattttt ttttttttcc ccaacgggac acaagaaatc 1140
agataaagac cgggcgcggt ggcttacacc tgtaatccca gcactttgag aggccgaggt 1200
gaatggatca tctgaggttg ggagttcgag accaccctga ccaacatgga gaaaccttgt 1260
gtctactaaa aaaataaaaa attagccacg catggtggcg ggcacctgta atcccagcta 1320
ctcgggaggc tgaggcagga gaatcccttg aacccgggag gcggaggtta cagtgagccg 1380
agatcgagcc attgcactcc agcctgggca acaagagcga aactccgtct taaaaaataa 1440
atatatgtat atatatatca gataaaaatc aaggaaaata catataaatt ggactacagt 1500
aaaattgtga ctgtctcttc atcagaagat gccattggct gggcacagtg gcttgtgcct 1560
gtaattccag ctacttaaaa ggctgaggca ggggaggctc ccttgagcct aggagtttta 1620
ggtagcagtg agtgagctgt gatcatgcca ctgtattcca gcctatgtga caaagcgaga 1680
ctgttgaaaa gtgccattta cagtcaaaag gcagggtaca gattagaaga tatttacagt 1740
gtttatatga caatacataa ataacttgta caaattggta agaaaaagac aatcagacac 1800
tggagcaggt acttcgcaaa agatgatcaa atagtggctg ggcgcagtgg ctgacaccca 1860
taatcccggc actttgggag gctgaggtga gcggatcacc tgaggtcagg agttcaagat 1920
cagcttggcc aacatggtga aacatggtct ctactaaaaa tacaaaaaat tagctggggg 1980
tattggtgca tgcctgtgat cccagctatc tgggaggctg aggcaggaga atcacctgta 2040
cccgggaggc ggaagttgca gtgagctgag atcgtgccat tgcactccag cctgggcaac 2100
agagtgagac tctgtctcca aaaaaaaaaa ggaaaaaaga taatcaagta gccactaaac 2160
atgaaaaaat gcttaacctc attagttatt gtgaatattc aaaccataat taaatatttg 2220
tacaaatcca gtagaatagt taaaactatt aagactgaca acaccaattg ttggtgagga 2280
tgtggagcaa cagaaactct catacactgc tggtgggaat gtaagtttat ataactggaa 2340
aactatatgg cagtatttat taaatctcaa catattcata ctctttattc agcaatttca 2400
ctttcaggta tattcccagt agtaatatat atgcatacca aaagacattt ctaagaatct 2460
ttataactgc actatttgta aaagccaaaa cctaatgtta acctaaatgt ctatcaacag 2520
tagaatggat aaataaattc tggtatattt gcttaatgga gtactatgca gcagtgagag 2580
taaatgacct agtactatac tcagcaacat aggtgaatct cacaaagagc ataggaagcc 2640
agatacaaaa gagtaattct acgtgattta taaatagaat ttatatttgt aaattataaa 2700
gttcagagac tggcaaaact catcagtggt gatatgaatt aggataatgg cagcattttt 2760
gttgtgggga gtgattggaa ggaagcccaa aggggacttc tggaggtttg gtgttgtttc 2820
ttggtttggg tggttataaa tgtgtgttca ctttgtgaaa acttagtgaa ctgtgcatac 2880
atgatttaag catttttctg tattaatgtt gtatttcaat gaaaagttta cctgaaaatg 2940
aagccagcat gtgacagtct cccttttcct tcactcaaaa gaagtgactg agtatatttt 3000
aggtaatcac aataattatt aggaaatttg aaatcttaag tgctgtaaaa tattgtttta 3060
tttaaaaaaa atttctttag agacagggtc tcgctgtgtc acccaagctg gagtgcactg 3120
gtgtgataat agctcactgc agcttccaac tcctgggctc aagcagtcct cctaccttgg 3180
cctctcaaat tgctgggaat ataggtgtga gccaccatgc ccagccttaa aaagatatta 3240
gtaagcaaga tcaaatgcgg taagcggagg aaatatttgt atgagtgaat tttggtattt 3300
tacctgagag taaaaaaaaa aaaatttaat tctaaataaa acttagccac agttattatt 3360
ctgtattata aaagtagctc taactttgtg aattttacta atataaaatt taagctctga 3420
gctgtattaa attttttcaa tgaaaacttg tattttaaag aatatgtcat aaatattctt 3480
tgacctcaca ggccaactgt gcaggaagat ggaggggatg taatctacaa aggctttgaa 3540
gatggcattg tacagctgaa actccagggt tcttgtacca gctgccctag ttcaatcatt 3600
actctgaaaa atggaattca gaacatgctg cagttttata ttccggaggt agaaggcgta 3660
gaacaggtat gccaatatta tatgacagtc tagatttttt tcattttttc tttttctttg 3720
tagatacaaa ggctggaaat agatgttaag gcaagtattt gaaaagaagt tcatgaccta 3780
gctttttctt caagggctgg atttttgtgt tgcaattttt atcagacttg aagtctctta 3840
ttttagaagt aactttgggc tgggcgcagt ggctcaaacc tataatccca gcactttggg 3900
aggctgaggt gggtggatca cctgaggttg ggagttccag accagcctga ccaacatgga 3960
gaaaaccccg tctctactaa aaatacaaaa ttagctgggc atggtggcag acgcctgtaa 4020
tcccagctac ttgggaggct gaggcaggag aattgcttga acctgggagg cggaggttgc 4080
ggtgagccga gatcgcgcca ttgcactcca gcctgggcaa caaaagcgaa actccgtcaa 4140
aaaaaaaaaa aatgaagtaa ctttagtgtt atgagaacct actatgtgcc aggcattttt 4200
gctcatttca tcttctaatg acacagtgca ttaagtcatt cccattttgc acataaggct 4260
acagagactc agagggcata ttgctgccct gattgcacaa aaattatgaa aaaggtttaa 4320
aatgtaacac agtgttttat agatgagatt tagaaatctt tagtggaaga actctactac 4380
atcatattta ccaatttttt tttttttttt tttgtagaga cggggtcttg ctatgttgcc 4440
caagttggtc ttgaattcct ggcctcaggt gatcctccca aaatgctggg attaaggatt 4500
aacacaactg gcctaatcta tgtattctta aatatgcaag caagaagccc attaagaaat 4560
catagtttgt tgttatactg agtagaattc tagagcttta cgtgtagcac aatatcaaca 4620
tttttttttt tgccaacata cctaaggagt ataacacagc accttgtcat cagtaataat 4680
gagtctcact gcagtgattc tcaaccaaaa agcatggcct tatggagaga gattatcaag 4740
gagtgaaggg atgtgtggaa attagaaatt tccaacccac agaatttcag gtaattcatt 4800
cttttttttt ttttttttgg agacagaatc ttgttctgtt gcccaggctg gagtgcagtg 4860
acacgctatc tcggctcact gcaacctcca cctcccaggt tgaagcagtt cccatccctc 4920
agcctcatga gtagctggga ttacaggcac atgccaccat tttttgtatt ttgtatttta 4980
gtagagacgg ggtttcatca tgttgcccag gctgatttca aactcctgag ctcaggcaat 5040
ttgcccgcct cggcctccca gagtgctagg attacaggca tgagccaccg tgcctgacca 5100
cctcaggtaa ttctgtgccc ttaagggctc cattgggaat cactcatcct tgggtagtat 5160
taaaattcat ctgttccaca gtgagcaggt ctatatagac ctatccccaa agtcttaggg 5220
agctgagagg ctgaagacag aggctggcaa atccagttgg tcagaaagaa acatttaata 5280
gggactgagg aacagaagcc atttatcggg cagctgcaag atgatggatt cctgcattgt 5340
tacccgctag actcagggct tatataccag gaggaatggg tatacatgct tcagaagata 5400
tgtgtaggac aattgaagtc agcccctctg gaaaaggcaa gaatgctatt tgcctaatag 5460
cctataattt gcttaagggc aagatttatg ctaagtatgt gtttgtttag gataacatca 5520
aggttatttt gacctaaagg cagaattaag tagaaaactt agaggcattc ctagaactga 5580
gggtagtcaa tgtggcagat tagcatccaa gatggagttg ctttagcctc cacaccatcg 5640
ttttggtcca gtacatgaca tctcctcttt gaagttttta tccatccccc acttggaatt 5700
aagttcttct ttgacaggtc caaagcttct gtttttgctt tatgtttatg tagctttctg 5760
tatctgtttt agctttatgt ttacgtggaa gctccctaag agacttgaaa tcatatccaa 5820
gtctttgtgt tcctctgcaa caactagctg tgtgccttac aaatgtccta tacatgcttt 5880
gtattaagta tttgggaata ttattccaaa ttaaggaata attctgccta aaatatgagt 5940
tggttgacaa aattttttgg attgggtatt gttgaaattg gatgtaaaat attaatttct 6000
tggaaataaa taccaatttt tactcaacca aaaagacagc ctatgaaaga attctttttc 6060
tattgattgt ctcagatcag agccagaatc tggatttttt tttttttttt ttgagacgta 6120
gtttcactct tgttgcccag gctggagtac aatggctcga tcttggctca ctgcagcctc 6180
cacctcccga gttcaaatga ttctcctgcc ttagcttccc aggtagctgg gattacaggc 6240
gcgcgccacc acgcctggct aatttttata tttttagtag agatgggggt ttcgccatgt 6300
tgaccgggct ggtcttgaac tcttgacctc aggtgatcca cctgcctcag cctcccaaag 6360
tgctgggatt acaggcatga gccactgtgc ctggcctaga tttttttttt aaaaaaaaaa 6420
ccttactttg ttccattatc atctatatgc cttaaaaaat tatgttagtt gatactttgg 6480
tggattgact gaggaacatt tttattcaat tgtccagggt agggtgatga attggccttc 6540
agattagaaa cttgaattgg catctaattg tagtaggtgt gatgaggaga aaaaaacatt 6600
cttaggttta tgtaactttt tccttctcca atggagttag tctgttatct tagtaataca 6660
ttaactcatg gaaagataat agctgttgta acattttcct gaggcttaaa atgatctttt 6720
atctcagtaa gactaaaata attagttcct aatatggtgg ggtttttttg ttttgttttg 6780
ttttttactt tccttgggga ttcattttaa taaaaataaa tgtttttaaa ataacaattt 6840
ggtatagctt cacagaatat atttaagtaa ataagatggt tttgaaaaaa agaaaaagtc 6900
atttacatta gtcttatggc tagagaatac cagttaaatt gttttttttt ttttgagacg 6960
gagtcttgct ctatcaccaa gccggagtgc tctatcacca ggcactaggc tcactgcaac 7020
ctccacctcc ccagttcatg ccattctcct gcctcagtct cccgggtacc tgggactaca 7080
ggcgcccacc accacgaccg gctaattttt tgtattttta gtagagacgg ggtttcactg 7140
tgttagccag gatggtcttg atcttctgcc ctcatgatct gcccgcctca gcctcccaaa 7200
gtgctgggat tacaggcgtg agccaccgcg cctggcccca gttaattatt tatagtcttt 7260
tctgcccagc tgagactctg ctatgggtag cctctttgag acaaggagaa gtgatcaatg 7320
ctttaattaa tttccaaata tttaatttgc ttttatttta ttttattttt tttttgagac 7380
agagtctcgc tgtgttgccc acgctggagt gcagtggcgc gatctcggct cactgcaagc 7440
tctgcttccc aggttcacgc catcctcctg cctcagcctc ccgagtagct gggactacag 7500
gcgcccgcct ggctaatttt ttgtattttc agtagagatg gggttgcttt tatgttttta 7560
ggataccggg ttatgattca aaccttgttc tttggggctg ttgatagatt tattcttact 7620
ggcttgtcat gcctcattat agagtgtatc aggtaaagaa gtaatattaa aatcaggaaa 7680
acagcaaaat ctaatcattt tcttaattct taaattgtct ttgttttttg gttttaggtt 7740
atggatgatg aatcagatga aaaagaagca aactcacctt aaaataatct ggattttctt 7800
tgggcataac agtcagactt gttgataata tatatcaagt ttttattatt aatatgctga 7860
ggaacttgaa gattaataaa atatgctctt cagagaatga tatataaata ttgcatgttt 7920
gctttacctc atatgagtta tttataacct cttgaatcat cttctgtaca cgtggatttt 7980
atccaaggat atttttattt ttgtccctca tttcccatgg ctccttcttt gcatatgtgt 8040
gaaggagttt aaaatacatt tccccccatc taatttattt acttttttcc atacaggaag 8100
aaacagaatg ctttttagaa tattctaaaa tagctttttg tgaaatatct aaaactattt 8160
ttactgaagt ttttagctta agaaacagct aaacaagtct gttttaaaaa tggtatctgg 8220
ctactagccc ccaattaagt agcaaagaac tgcttaagac caaaaaaaag aaatcaaaaa 8280
tgtccgggta tggtggctaa cgcctataat cccagcactt tgggaggccg aggtgggcag 8340
atcacgaggt caggagtttg agaccagcct gaacaacatg gtgaaacccc gtctccacta 8400
aaaatacaaa aattagccgg gcgcggaggc acgcgcctgt aatcccagct acttaggagg 8460
ctgaggcagg agaactgctt gaacccggga ggcggaggtg gcagtgagct gagatcacgc 8520
cactgcactc cagcctgggg gacggagcga gactccatct caaaaaaaaa aaaaaaaaaa 8580
aaaaaaggtg aaaaacttga aaactaactc ccagaatctg gacacagttt ctattggtta 8640
agatggagat ggccaaatta gaaaaactgc ctcagcatgc ccagccttta ccttatcaat 8700
cagaattgct gaagaaaaga gaagaagctg ctttggtcct cccactggct tctgactcag 8760
agatccaaaa tctgtaccat gccagaagtg tgcatcatta tttttgtact ctaggggtac 8820
tgctttttca ggtagccaaa agagtgattt agccttctct ctcatttttc tacagtaatt 8880
cagagactgc agttaacaga aaatacaggg aaaggaaaga tgggaaaaat agttgtgatg 8940
cattgcatct ctggaattct agtccctcaa attaaggaga ttaagatagt gatggaaaca 9000
ggaagaactc tagcagttgt gagtgctggg aattgaagtt tttactttta tcctttggtt 9060
cactgaacca aatagtaggg ttggagaatt cattccttga gatatcatgt atgaatttaa 9120
tttagacact gggaattgct tcataagcaa ggcaacttaa cctgcccttt agttgaagct 9180
acaggaaatt gacatcgtgg atgagatgca agtaatggca gatcttgtat gtggccatga 9240
aataagtggc tgaattggat ggaggattag tttattagaa gagaggaaat tggcctggcg 9300
cagtggctca tgcctgtaat cccaacactt tgggaggctg aggtgggtgg atcacttgag 9360
gtaaggaatt cgagaccagc ctggccaatg gtgaaacctt gtctctacta aaaatacaac 9420
aattagccag gcaaggtggc atgtgcctgt aatcccagct actcaggagg atgaggcacg 9480
aaaatccctt gaacctggga ggcggaggtt gcagtgagct gggatcgtgc cattgcactc 9540
caacctgggt gacagagcga gagtctgtct caaacaaaca aacaaaaaaa caggaaatta 9600
ttcaattgag aggccaaaga ggaagagagg aaagattttc tacaaaagca acagccatga 9660
agaacaagga ggaaaggtgt gggaagaaca ttctaggcat aagaacagta taatcagaat 9720
tgtaagtgtg aaatgtattt gggaacctca agaaactaag tatggcttga gtataaagtg 9780
aaaatggtgc atgagtaggc agtggtagta tagagagtgc cacagaaact cttggttgcc 9840
tacccaacat acaccctcac ttcttgttaa ggaaggcact ctcagtaggt ctcacctcag 9900
tcccagggga tagttatgat taaaccagtc actttaactc catttttctt ttccaatcat 9960
tagtctgtgg gtagccatat gacctagctc tggccagtaa actggaagag aaagtctatt 10020
ggagaattct ggaaagattg tctttcctag ttaagagagt gtgtatgtga gttaatctct 10080
ggaaagaagg ctcttttttt tttcctccat ccattccttt tcttcctgct tggtacactg 10140
tagagtgtga tgttcaaagc aatgacagtc aacttgtaat catgactaaa aggtggtcca 10200
ctgagaatag caaagagcaa agaaagggtc tggatccttg gccttgcacg gtggctcaca 10260
cctgtaatcc caccactttg ggacacccag gcgggtagat cacttgaggc caagggtttg 10320
agaccagtgt ggccaccatg gtgaaacccc atctctactt aaaaacacaa aaattagcct 10380
ggtgcagtgg cacatgccac ctagtagtcc cagctactag ggagtctgag gcttgagaat 10440
cacttgagcc tggaaggtgg aggttgcagt gagccgagat cacatcactg cactccacca 10500
tgggcgacag caagactctg tctcaggaaa aaaaaaaaaa gggtctggat ccttgaggca 10560
ttgttggcct tttggccaga ctaagaatta ctcactttca gagtttatat gatgtgagat 10620
aaatgttttt cttgttttag ctattgttat caggtattct gtaacttgaa gctgattgca 10680
ttctgagaga ctggtaaatg atggaggact tggtaaatac ttttaccgat ttttcatttg 10740
tggtaaactg ccaaatgtca accttaaaat gaaaacaggc cggccgcggt ggctcacacc 10800
tgtaattcca gcactttggg aggctgaggc gggtggatca cctgaggtca ggagttcgag 10860
accagtctgg ccaacatggt aaaaccctgt ctctactaaa aaaatacaaa aattagctgg 10920
gcatggtggt gggcgcctgt aatcccagat actcgggagg cagaggcagg agaaccgctg 10980
gaacccagga ggcagaggtg gcagtgagcc gagatcacgc aactgcactc cagcctcggt 11040
gacagagcaa gacgccatgt caaacaacaa aaacaacaac aacaaattaa catgtatttt 11100
ttaattaatt gaaccactat tcaaaggtta agtttaatca ggtaatggtt tttattctgg 11160
aatatttata ctgaatttct ccctatctaa tcccaaagaa agactaataa tcactattag 11220
ttgtgtttag ccagaacaaa aattaaacaa aaaccaaaaa tacaagaaac ccccaaaatg 11280
tataaaatat tttgtatcta ttttattttt ttctttttaa aatagagatg gggtcttact 11340
ctgttgccca ggctggagtt gcagtggtgc aatcatagct cagtgcagcc tcaaactcct 11400
gggctcaagc catcttcctg cctcagcctc ccaagtagct aggactacag gcatgcacaa 11460
ccatgtccag cttttataaa atattttaca tgaaatatcc tgaaaacact ttgtaaatat 11520
gggatgcttc agtaagtatt tgaaactaag attattggtc aagagtaagc caggcacttg 11580
gagggttttt ctttttgaga cagggtgtca ctctactgcc caggctggag tgcagtggcg 11640
tgattatggg tcactgcagc cttgacttcc cagactcaag tgattcccca cctccacctc 11700
tcaagtagtt gggactatag gtgcgcacta ccacacccag ctaattttcg ttttgttttt 11760
tttttttttt ttttgtagag acggaatttt accatgttgc tcaggtggat ctgcaactcg 11820
tgggcttaag tgatccacct gcctcagcat cccaaagtgc tgagattaca ggcgtgagcc 11880
accacgcctg gcctgaggat ttttcactaa ccaaaattag gatgaagccc tatgcaggat 11940
gacatacagt cacatgagag caacatatat aagaatagca aacgttcatt gaacattcag 12000
tgttcattta ttcattgaac atccttcatc ctcaagcctg aggttttcac aaagactgtt 12060
ctaagcacct tatatttatg aagtcattta atcctacgtg atagttaact attgtccctc 12120
ctccgccccc ccccaccgcc cctgcctttt tattttgaga cgaagtcttg ctctgtcgtc 12180
caggctggag tgcagtggca ccatctcagc tcactgcaac ctcctcctcc caagttcaag 12240
caattcttct ggaattacag gcatgcgcca ccacacctga ctatttttgt atttttggta 12300
gagacagggt ttcaccatat tggccaggct ggtccctgac ctcaagtgat ccacccgcct 12360
tggcctccca aagtgctggg attacaggct tgagccactg tgcccggcct attgtcccca 12420
tttttataaa ctggaagatg gaggcacaag gaaaagtaca ttgtccattg ccatgcaact 12480
tgagtggaaa agctaggaac atgaactctg gcattctggc tgcagggcct atgcacatta 12540
tagctatact attctgcctt aaggaagttg ggcccatacc cctcttgagt attcctactt 12600
gagggaggag agaagctttc cttgctttca tagctactta cgagtgggca agagtctaga 12660
accacagtag acaaaagcag tggtatgtac atgtgtgtcc atttttttat gcaggaatat 12720
gaaactagtt gctttccagt ccagagggaa tctacacccc tcttgggaaa tcccagccat 12780
atactccatt ttgccatatc agtgttatct gtgattattc cctaggagct tacaagatac 12840
acagaagcaa cttttcaagt atcccttgaa agaaacccta gaaaaatagt actttttctg 12900
tgtccttacg tttcaagtga tctttcagtt ctaggcagct ccctgaatgg tccacccctt 12960
attgtggctc tgttcacatc caacaggaca gaaatagtag gttaaaggta ggaccagttt 13020
atctcatggt tttcaatttg ttgactttct tggcagtaga aagagtttct ttctcgcaga 13080
gctagaaaac tctgccccag cttctgccta ctggaaaaat ttggagccac gttggagagg 13140
agtattgggg agggcatagc ttctagttgg agttagcatc ctttgtcctc aagcctcagg 13200
ttttctgggg ggcaatcagg tcatatttgc ttgatgcggt ggacatattt ttttgtgtgc 13260
cttcttggtg ttcttctttt agcaacacct tcccctttcc tttgaagaac tgcttcctct 13320
tgccgtatgt ggctatatga ctctataggg ctttggtgga gctgtcctat cacaatgtct 13380
tgccttcttt gccacaggag tggggcatgt gactcacgct ggactggcca gaatccttgt 13440
ctagaatata aaaagtaagg atggaggaat agcctctctc attttgggct gcaagctata 13500
aagttgtgat tacagagcta tttgaggatt atttccctgt ccatgaggtc agagaggtag 13560
ttcaagagtt ctgacaacat tctgtccctg ggtataaatg tgctgaaagc tgtttgtatt 13620
cctgttcttt ccaattacgt gagctagtaa atccccttct ttagtttgag tggtcttcta 13680
tttattattt gtcagtgaaa gctctgccct ctaggcacat ctttcaccat gactgtgaga 13740
aataaatttg tgagagctgc atccttgaag agctctgtga aagctctttc tgtgggagtg 13800
ctgccactga attgggaaat ctagtactca tcctgtgggt gaagagtaac cacgatattg 13860
gaagcaagga aaaactggat cacatttgta tttttgacag gtccctctgg agccaaagtg 13920
tgtgggatga actgcgggag gctaaagggg ttcactcaaa gggtctttct gaggccttga 13980
ttggtgcctt ttgttcttgt cctcatttct tttcacaggc ctcaggggct caacctattt 14040
ctttttcctt tgatacttgc taccatcttc tctgtccact ggggtacatt tctccacaaa 14100
gctccctaaa aagtaggaca tatgtacccc agctccccat attcttatgc aaaggaattt 14160
ttattttaat aattttattg ctattactgg aattcacata agggttaata aaaatgacta 14220
cagctatttc aattaaggtt cttcgttgcg ttagtaatgg caactggaag ctctgatggc 14280
cttcagccat cagatccaat gggactgaat ctacgaacag ggaaatggac ttacataaag 14340
agatggtgaa tgacaccccc ttgccatcat tacttttttt gttgtcgttc agaatgtttt 14400
gatcaggaga gaaaatccat tccctcattt gtttgaatta gacccagatg tccccttccc 14460
ttcatagatc atttattttc ttctccttca ggccttattc ccaaaggtcc agttaaggcg 14520
gagctctgta taaagggagg tcaggcaccc aaagtgtgta tcttaactgg cgcatggtta 14580
caaagagttc tttgttgtgt tgggttagtg aggttcttca aggctgattt gggaaaatac 14640
tgtccttcaa agtttcttct cttttttgtc aaattatttt tttatttact ttttttttaa 14700
cttttttttt ttttctgagt tggggacttt ccagtcttta ctgaaaactt ttaaaaattt 14760
gtatttagac aaattctaaa agacctgtaa cactagtttc ttcttctcaa ctgattcata 14820
aatatcttcc aaaatagttt gttgagtgga gatggataag acaaattgat agtcattgtg 14880
gtggagtagc aggcagaaga agaaagcaaa gggttaaata gattactata gttggagcat 14940
gagaactctg gtagtactgc tgacattttc tttgtggcat tgacaggttt gctgccagtg 15000
cacaaagatg ttgcttaagc attggaacca taccttggct tttaggtaat acaacggagt 15060
tctaaccaga gccttagatg agggttctga ggctagatgt atatccacag tcttttgttt 15120
cttgaattaa gaaatgtatt attaccaaaa agctcactgt tttttttttt tttaaacttt 15180
gctctgggtg atccagggac ctgtttaagg gattgaaata tcaaaagggc ttttaggtga 15240
gaaatactct gcttagttaa atgtgacatt tttcagcttc tctgaggcaa gtgaaaaaag 15300
gcacttttcc ccgtaagaag aactgaaagc cttatgctca cttaatcata taaccagcca 15360
tagaaggtta attccgctaa gaaaatagga ctttttttca ctcattccaa aataaatttg 15420
atcttttact ttgtgctgtg gtctaaaagt gttgggtatg taaaatctag ttctagcttc 15480
aagaaactta cagcccagtg ggaaaataca gaaaatcata aaatatcaaa gaatatttct 15540
ttacagtgag tagctcaaag agtaagaggt taatgcatgt ctccaagtct gtctaggggg 15600
gataaaaaag gctttcctga agaggtagca tctaaacaga gacgtggtgg ggattctatg 15660
cagagtaacc aaagtgtgca aaagatttga gaatcttggc ccagttgagg aactacctgt 15720
tgagcctgtt gggagtgtat agggctggaa ggacggctaa gaccagacac atgaacagca 15780
gtcagcaggc taagaccaga cacatgaaca gcagtcagca ctccaggaat tctgtgtgcc 15840
atgtacgttt ttaatactac tctactctag agccattata gagttctgat tactccacat 15900
ttgactaaag ataccattta aggctgttta aagcaaatgc ccaggtaata aattctcaga 15960
aacatcatcc ctctctaatc aagtctctct tgtcagacat ggcgcattaa ttcatagaat 16020
gaatcgttcg taagtcaaac gcgcggctgt taaagctagg gaattcctag ccgtctcagg 16080
tgggtcatgg gaggaggtgg gccagcagtt tcttacgtcc aggctcatag tcggatagtt 16140
gagccttaca ttcctcctct acccctccac aataaactga gggttatgga ggcaacggat 16200
gcggagggct tttaggggcc aagcatatta cacaaggaat tgaattgctt attaccagag 16260
aggctgacct ttggggcttt acagtcaaga attttgttat ctctctcctc ccacctcaac 16320
cataatyctt tgcaattttt ttcagcctta tgttccccag gattcccttt tcatacttcc 16380
tgcttttttc ctcctctttc ctcgcttcgt gcagtgctgg cgcctggggc ctggggctgc 16440
acggggcacg cacccgggct attgctttgc taacaattcc atccttctct ttccgtcatt 16500
ccctgccagg tgctgagttt ctccctccct ctcggctcgg tccctcccgc ggctcgcccc 16560
ggggcgggcg tctccaggaa ctccaggcgg acgcggccac gagccactgc cacgtcgccg 16620
ccgccagcag tccagcgcct gcgtgggctc ggggggcggg gcagcgctgg gaggcgggac 16680
ttgcgcgtga gcggcgcgtg agcggttcaa tggagcctac gggcggcggc gcgctgcgcg 16740
ccgaggggcg gggcccggcg gcggttgctg gcggagcccg ggaggcggag aaggctgtcg 16800
ttgccttggc cgtcgcatcc ccgagggagt cgtgtcggcg ccaccccggc ccccgagccc 16860
gcagattgcc caccgaagct cgtgtgtgca cccccgatcc cgccagccac tcgcccctgg 16920
cctcgcgggc cgtgtctccg gcatcatgtg tggtaagggg gccgggagcg gggggcgtgt 16980
tgccgggygg cgctggggtg cggtgcgggt gccgctaagg cccaaggcga cgggcggaag 17040
cgggagtgtg gagggtgcga agtctgggtg atgggcaagg ggcgcccagt ggtggctgcg 17100
ggggcggggg ccggcatcca cgggcgggag agggggtggc ggccgggaga aaggcacctg 17160
agaggaaggc gggccccctt tgccgggggc cagcgggcgc cttggcgcgg agaaggaacc 17220
gagaggggag agaaacgcct ttattgaaaa aggaggagag agctgaggga attgaggtgt 17280
ggagggggtt gccttcaaaa gggcccacca ggtgagtgag gaaacctgtg gaacctcggg 17340
cgaggtctct tgaacttacc ttgcattttt ctaaaaatct ttaaaaaaat attttacttg 17400
tttctgggga ggcccaatag aaaacagacc ctagctagag ccacggtagt gccattaaac 17460
gtgatacttc ctgccatccc ttgtctcaac agaaaccatt gctaatcaat aacttggttc 17520
atgggcttag acctgatcct ctggtggaag aggccttcaa atgtctgtgg cgataggtta 17580
tacataattt atcatttgcg tgtgcaccca ttaaaaatgc cagctctgaa aaatatcagt 17640
tataccttgg atgtataccc ctttagaata ccaactatga aaaatatcat ttatcccttg 17700
catgtgcatc cattaaaaat actagctatg aaaagttgag caaatatctt tcctagagcc 17760
ttaaaaaatt aaggttaggc ccttttattc catgttttga gagtcgttta ttatgaccta 17820
agtgttagtg aaagagactt tgagaatcgt gtctgacatg actgatatct tctaaaattg 17880
gtgttaattt ggctattgcc agtaaaaata attgtattct tacctttctt attgaaattt 17940
acaaccgact ttatccctgg aagaaaagta cacttttttt tttttttttt taaagggaag 18000
taccattgta agagaattga aaactctctg ggagacttct tatttgcagc cttttacacg 18060
aaggaactga acaggaggtg gattgtactc gttagtgtat atatttcctg tatttaactt 18120
tatgctcatt tcagcttctg aaaatgagga gcaggtttaa atttagagta gattaaaaaa 18180
aaacccacat aaaaacagaa acacctataa atagcttact gaaattatta gagtagagct 18240
gacttcagaa tcagactttt gcagtgtcta cttagtagaa tggttttgca tttagtttgg 18300
agctgtgaag tagtgaattt gcaaactggt caatctccaa gtgtgcttca tttggtagtt 18360
aactgttcct gaatgatgag gggtgtgcct catcaagtac tcaacattct ggttgcaggt 18420
catttcatca tgttccaaga aaaaaacgta gtcaaagtac ttactgaaaa aaaataaata 18480
aataaataaa tcagcgctgg gcgtggtggc tcccgcctat aatctcagca ctttgggagg 18540
ccgaggcagg tggatcacct gagctcagga gttcaagact agcctggcca acatggtgaa 18600
actccatctc tactaaaaat acaaaattag ctgggcgtgg tggtacgcgc ctgtaatccc 18660
agctactcgg gaggctgagg caggagaatt gcttgaaccc aggaggtgga ggttgcagtg 18720
agccgggatc gcgccattgt aatccagcct gggtaaaaaa gagcaaaact ccatctcaaa 18780
aatgataaat aaatataaat aaataaatca gatatggaaa tcaggttcag ataagggaga 18840
tacctttagg gtggagacta aatgttggga gttttcacat agtttgtgtc tccattccat 18900
agagttttac ggctgaggaa acaggtattg aagaaataaa aagtgaatat ttgaggcatt 18960
tctgaggtcc tgcttttaag tcataccacg gttttgcctg attctaggga tagggttcag 19020
aatttatttt ctctctaatg taaattctga aagataagaa gatgagtgtc attattttcc 19080
tcccacatct tagtcattga actaaaattc ctgagcagag aaatggagtg aaaattagac 19140
tagatgggaa aatctggaag cttactttct gattacttgc tatctagtta agtttttctc 19200
tttctttcct tctttctttt cttttctttc tttctttctt tttctttctt tcttctttct 19260
ctctctttct ttctttctct tctttctttt ctttctttct tttttctttt tttttttttt 19320
ttgtgacggg gcctctctct gtcgcccagg ctggagtgca gcggcatgat cttggctcac 19380
tgcagcctct gtctccgggg ttcaacctcc cgagtagctg ggattacagg ggtgtaccac 19440
cacacctggc taatttttgc atttttggta gaggtggggt ttcaccatgt tgaccagact 19500
ggtctgctga cctcaggtaa tccacctacc acagcctccc aaagtgctgg gattacagga 19560
gtgagccacc ttacccggcc ctagttaaat ttgcctaaaa gattatttta tttcaaccgt 19620
tgtgcattgt tgaagcagaa gaatgaggat tgaagattct gatatgcttt ttttcaatca 19680
gatatactga taaaattgat atgtttacca gcttgtattg ggatgttaat aagtgttagg 19740
aaaaaagatc ctctggtcca gtaaatttgg gaagcaacat attaaatcgc gtggtaatgt 19800
tttgttttgt tttttgattg gaggatttct tggaatcttt aatgtattaa taataagcat 19860
tgagaattct cccagagaag aatagtgtgt ctattttcca aatttatttt atcttccttt 19920
ttcttggtag tttggaatat actttgtcct ttttatttgc attatttttg gttttgctga 19980
gtgtcaagtc acttaagcta tccctagctt ttaacagatt ttgctattgt ttttataaat 20040
gtgaagttat acccttctga ttcgacggtg tatataaaat ggaattttgg ggatgggcgc 20100
ggtggctcac gcctgcaatc ccagcacttt gggaggctga ggtgggtgga tcacctgagg 20160
tcaggagttt gagaccagcc tgaccaacat ggtgaaaccc tgtctctact aaaaatccaa 20220
aaaaattagc cgggcgtagt ggcgcatgcc tgtaatccta gttactcgga agcccgaggc 20280
aggagaatct cttgaaccca ggaggtggag gttgcagtga gctgagatag tgccattcta 20340
ctccagcctg ggcgacaaga gtgagagact gtctcaaaat aaataaataa ataagtaaat 20400
aaataaataa ataaatggaa tgtttgcaaa tgagatcctt tttaaaagca gtaaaggaac 20460
ttgcaatttt aaagtatcct aaaatgaatt tttcaaaagt tttttgtaat tatactgtct 20520
aatggctttg gagataattg agggatgctg agattggctg ctaggattgg tcataaaacc 20580
agtactatta acatatcctt acatatactg gatatgaaga agttgtgaga gaaaataatt 20640
gcttaataag catttcttca attgtcccct ggaaatggag gttaataggt tctggtaatg 20700
agcagtagaa ggcgggaaag ggttttgtaa cacaagtttg ggaaattctg ctcttggaga 20760
ttcacaatta gcaagattaa aggttccaga aagttctaaa tatataccta actttaacca 20820
ggtagttctt aaacctttaa ttatgaaacc tttctttact tcattccttt ttagcatccg 20880
gtgaaatagt gttctgtttc tgtggtttga gaattttttg accgtatatt tcaggtgcct 20940
agaaagtgtt agaagatact tgcaggtatt tgaaatgatg gctttatact tggcactctg 21000
ccctttgcag agatgactaa aataagagag ttgccttcaa gaaatcgctg cctgatcaga 21060
ggaaagaaaa tgaatgcaca tgcaacagct tcaggtgaaa atacacagtc cttgttcatt 21120
gccatgtcat agaccacaag tagaatgagt agaaatttag agactggaga gctctggggt 21180
ttgggtatct gtgttaggtt caggaatgtt ctgggtgatg gggcaggact tttactcaac 21240
ttgtagagta ttagtatact gtgagaggta atcattaatg gcatatgtta accgtcagtg 21300
aatggaggcg gaaatagttt gagaactact accagatgaa ggaggaaata gaagtgccag 21360
gaaaacagac caaggaacag tggttaaagg cagaagagtt ccaaagtagt atattgcctt 21420
gaacagagtc tataaaagta gaaaaaggtc attcatatgt aatactgcag agaagttaat 21480
tggatatggt tatgaagaaa ttattagaga aattgcatat gtcaaggcag aagggtctca 21540
gtttgtgttt aggaggaggg ctgcaagtaa tatgaaaaag aagaggattt tgggattgag 21600
gtcccctggg agtgttgaga agttgaattc tagagctgtg gttcctgacc tacaagccct 21660
gaagttgtta cagggtgttc attgcttatt catatgctta taactttgtc tgtaagttga 21720
ataaagattg ttctagatca ttgaataata aaaatttaac ccattgttgt gaaggagcct 21780
cagaatattt tgatgttaac aaaagagttc tgtatttaca aagttggaga aacactcatc 21840
aagagttagg agtaaggccc agtgtggggt tccctctggt aataccagca ttttgggagg 21900
ctgaggtggg cgaatcactt gaggtcagga gtttgagacc agcctggcca acatagcgaa 21960
gccccatctc tactaaaaat acaaaaatta gccagctgtt gtggtacgca cctgtaatcc 22020
cagctacttg ggaggctaag ggaggagaag tgcttggacc tgggaggtga aggttgcagt 22080
gagctgagaa cacgccactg taccccagcc tgggtgactg agtgacactc tgtctcaatt 22140
aaaaaaaaaa aaaaagagtt ataagtagcc agtgttttgg cttacacctg taatcccagc 22200
cactcaggaa gctgaggcag gaggattgct tgacgctagg agttcaagat cagcccgggc 22260
aacatagtga gatcccatct ctattaaaaa aaaaaaaaat tagccaggca tggtggtgca 22320
tacctgtagt ccagtctact tagaagactg aggtgggagg attgagtcca ggagtttgag 22380
gctgcagtga gctatgattg tgctgctgca ctccagcctg ggtactgggt gacagagcag 22440
gactgttaaa aaaaaaaaaa aaagttacaa gtaggggaga ggctagcttc agagagtagt 22500
atgtgtaata tgtctctctt gagattacaa ggaaggatga gaagtattta tatattgtta 22560
aactgttgaa aagaagatgg gtgaggggca gtgactcatg cttgtgaact cagcattttg 22620
ggaggctgag gtgggaggat cacttgaggc ttggagtttg ataccagccc ggacagcata 22680
ttgagacctt gtctctatat tttaaaaaca aaaaaagaaa atgaagactt taattctggc 22740
caggcgcagt ggctcacgcc tataatccca gcactttggg aggccgaggc gggcagatca 22800
cctgaggtca ggagttcgag accagcctgg ccagcgtggt gaaaccctgt cactgctaaa 22860
aatacaaaaa ttagccaggc gtggtaacac acgcctgtaa tcccagctgc tgctcaagag 22920
gctgaggcgg gagaatcgct tgaactcagg aggtggaggt tgcagtgagc tgagatagcg 22980
ccactgccct ccagcctggg tgacagaacg agactctgtc taaaaaaaaa aaagacttta 23040
attctataaa gtaagaatct accaaaaatg aaaaagaagc tgggaagaga aaatgaggat 23100
ttgagagtag tatgtagctt agactctaaa ataatatctg ggagaagttt gaaagttaag 23160
caagtgatga attaatagga ttggtcagca gttcggaggg cccatccgaa agtggaccga 23220
aatggatagg atagatgagt tctccttggc tgtcatagtt cagtgtagag atgctcagag 23280
actaggagtc agagcacagt ggacccagag ggtttgactt ggcagtatga tgaaaaattg 23340
tagtctgatg tgaatggtca gaagagagag agatggaata tttgaagatt gtgagcagga 23400
agtacatgct tttttttctc aagaaagatg atgacatagg ttgactgtga gggaatgtat 23460
agagatgtca tgacttaact agtgatttga gctccagaat gttaaatgtg caagagacgt 23520
gtcatggagc cccttctagt ggcaatagtt acagtaaagt aggggagaca tgaaccaatt 23580
aaacacacaa ataattgaaa gtcttaattg tttcactcca tatgttattt ttgtatgtgt 23640
gatttatttt attttacttt tacatttttt atttttttga gacagagtct cactgtgtcg 23700
cccagcctgg agtgcagtgg cgcaatctcg gcccacttca ccctctgccc cacctcctgg 23760
gctcaagtga ttctcctgcc tcagcctcct gagtagctgg gacaggcacg cgtcaccatg 23820
cctggctagg aattttgtat ttttaatgga gacggggttt caccatgttg gccaggctga 23880
tctcgaactc ctgacctcaa gtgatccacc ctcctcagcc tcccaaattg ctgggattac 23940
aggcgtgagc cacggcatct ggcctttata tgtgctttta ggattgtaga agatgtacct 24000
tggctggatg cattggctca tgcctgtaat cccagcactt tgggaggccg aaacaagagg 24060
atcgcttgag tccaggagtt cgagaccagc ctgggcaatg tagtaagacc tcatttctac 24120
aagaaataaa aaaataactg ggcgtggtag cttacgtctg taatcccagc tactccagag 24180
gctgaggcag gagaattgct tgaacctggg agacaggttg cagtgagcca agatcgcatc 24240
actatactcc agccttggcg acaagagcaa aactccatct caaaaattaa aaataaataa 24300
gtaaataaat aaataaatta caggcacatt agcatgtgcc tgtggtccca gctacttggg 24360
aggctgagat gaggggatca cttgagtcca ggaggtggtg gttttaatga gctgggattg 24420
tgccactgta ctccagcctg ggcgacagag cagacccctg gtgaaaagaa aaaagaaaat 24480
gtatctcaaa taatacttaa ttttaaagaa atcttaaatg tagaatgtga ttccataatt 24540
ataatattga ctagttcact gcaaccttga acccctgggc tcaagtgatt ctctcacctc 24600
agccttccaa gtatctggga ctacaggcat gcaccaccat gcctaatttt ttatttttgg 24660
tagaggcagg gtctccctgt attgcccagg ctgatctcaa actcctgccc atgatcctcc 24720
cgccttggcc tacgaaagtg ctgggattac aggtatctgc tactgtgcct ggcctgtaga 24780
aaaatttata gctgaaggac tgggagtgtg tgtataggaa taacagtagt tatctctgag 24840
aaaggggttg gaacctgtgt ggagacagaa aggagagatt ttcacaattc tgtagcatct 24900
gtatagtttt aatatttatt tatttatttc aaattttaat agagacaggg tcttggtatg 24960
ttgccctggc tggtttcgaa ctcctgagct caagtaacct ctgcctctct tcccacagtg 25020
ctgggattac agatgtgagc cactgctcct ggcctacttt gaatttttaa tgatggtgat 25080
gaattaattt gtgactagca ttataagaaa aataaaattt agagtttaag tgacattgta 25140
ggtagatttt gattcagaag ttttaagttt agagaatgaa tttgaacact tatcactgat 25200
aagttacaat gtttagggtc ccaaaatatt gcagctgtca aatgataaaa tatataaaaa 25260
taaaatttag tattcataag gacataaatg caaccagaca taggaatttt aataatttga 25320
cgagtcagtt ttcttttcag taaggtttaa cagtctgtat ttgcagctac attgctttca 25380
accaggtgtg tctagtctgt gatccagatt gcttctgaaa ttttgttagc aaggtgctca 25440
taattgcttt tttgtcattg aatttaagtt gccatttatt gagaatgatg cctgtaggtt 25500
caagcatctg cttcagttat ggagttattt tattccaagt atattccatt agtaagaaag 25560
cttacacttg tgaagtgcat gctgatttgg gggtagagat tctatgctta tacagctact 25620
gtgtgtgctc ttagagcaat tactgaagag tggcggaaag ttgatattag gcttttgtca 25680
ttaccttact taagaactgt ttattgggag tttaggccgg gtgcagtggc ttatgcctgt 25740
aatcctagca ctttgggagg ctgaggcgag tggatcacct gaggtcagga gttcgagacc 25800
agcctagcca acatggcgaa accccatctc tactaaaaat acaaaaaatt agccgggcat 25860
ggcggcggcc actgtaattc cagctacttg ggaggctgag gcaggagaat tgctggaacc 25920
tgggaggtgg aggttgcagt gagctgagat ggcgccagcc ttggcgacaa agcgagactc 25980
tgtttcaaaa aaacaaaaaa caaaaaactg tttattggga gttttgataa gacaagtcaa 26040
agacctgaaa atagaggtca gactaacgat ttctgctcta acaagcatca ttgtgagttg 26100
tgaatgcctc ccttgtgaac atgccctgtg tacctgatga attgctgcca gtattgtctc 26160
gggcacccca agattacagt taacccggta tccccgcagg tggaatgtct tgggctagta 26220
gtgctatcaa gggacagggc tatgaaactg acaggttcaa cttcttagct cccattttcc 26280
tcatcaggta tgtctgaggc taatcccctt ccttcttcta gctctgttac ttttttgttt 26340
gtttctttgt ttgttttttt gagacggagt cttgctctgt tgcccaggct ggagtgcagt 26400
ggtgcagtct aggttcactg caacctctgc ctcccaggtt caagctattc tcgtgcctca 26460
gcctcccgag tagctgagac tacaggcacg tgccaccaca gctggctatt tttttttttt 26520
ttttttgtat ttttagtaga gacggggttt caccatgttg gttaggctgg tcttgaactc 26580
ctgacctcgt gatccgcccg cctcggcctc ccaaagtgtc gggattacag gtgtgagcca 26640
ctgtgcccag ccaaaatgtt cttaagctct caagattcat atagtgagcc attataaacc 26700
aaggagattg gagttagaag tattattaaa gttgaatgct gttgttgagt tacattatta 26760
aaaacagtga atttaatatt gcattactta atcttttttt tttttttttt ttttgagacg 26820
gagtcttgct ctgttgccca ggctagagtg cagtggcacg atctcagctc actgcaacct 26880
ctgcctccca ggttcaagca attctcctgc ttcagccgcc tgagtagctg cgattacagg 26940
cacctgccat catgcctggc taattttggt atttttgtgg agacggagtt tcagcgtgtt 27000
gcccaggctg gtcttgaact ccttacctca tgtgatccac tcgccttggc ctccaagttg 27060
ctgggattac aggcgtgagc cacccagccc tgccgcatta atctttaaaa aaaagtagag 27120
tctataaatt gtcttaaaaa caattttata tcattagcat ttaaatagtt ttaacacatt 27180
catatacatc tttaatcttt aaatcattta ccatccggct tacattttta tgtttttacc 27240
aactttcatt tttatcatct ggcttacatt tttactttta ctatcagact tagatttctt 27300
aaaaaagaga gagtttagga gtgagttttt ctggatgtgc ttagaatttg gcagctctgg 27360
acaatctgca aacaatcctc gacaggcttc tgttttcaaa taagctagat tgtatcctcc 27420
tttagtggac tctagctgat gcagtcacag tggtgggaac tagttcagat tcagtttttt 27480
tcacactttt tttttttttc ttttgagatg gagtctcgct ctgtctccca ggctggagtg 27540
cagcagtgcg atctcggctc actgcaacct ccgcctcctg ggttcaaggg ttcaagtgat 27600
tctccccgtc tcagcctacc aagtagctgg agtacaggtg cacgccacca tgcccggcca 27660
atttttgtat ttttagtagt aactatgggt ttcgccatgt tggccaggct ggtcttgatt 27720
tcctggcttc aggtgatgcg cctgccttag cttcccaaag ttgggattac aggcgtgagc 27780
cactgcacct ggcccacatt tgtattaaag tattgtttta gaaaagattt gtgtgctgtg 27840
tattgtcttt taatgacctg gttaaaatac ttaattgata gttatctgta gatgtttaat 27900
ctttctcaaa gatcagtgac ccataggtga agagtgcaaa gtttgattta caattgggtt 27960
attcgtttat tcatattaca gatacttcat gaaggaacag cagtaacaac aaaaaccccg 28020
gactcattct tctgaattaa atgggtgcag attggtctgg agactcttct actgccctct 28080
agtgtttata tcatgagtag ccattgaaag ttggaagctg cacattgctg tgccgctacc 28140
actcttacct tagcaatatc cttaagcagc atgttgttta tccttatctt aattgctgtg 28200
ctttgaggtt gggaatgcta tttgtgggta tctctgggat atcagttaac tcaatttcta 28260
tttttgaatt atgtaagata gatgttctac cctcccttac agggtggtgg tgctgtgaaa 28320
gtaagatgac tgtacattac aggaaagctt aaaaaaataa aaatgtaagg tgtgtgtgta 28380
tcttttttta atctgaatga aatatgggat ttctgtaagt ctttggcctg gaactgcttc 28440
tttggggaga gttgaaaccg ttgtttcagg ttattttgga ttttaatgtg tgagtttctc 28500
ttttttaggg cataataatt tgtttgagaa aattgcaatg tattgatcat ggtgatcagc 28560
atgtatgtta tggctttcct gttgggtatc aacaatgtgc catttttgta tactgaaata 28620
tttcagtagg atcacactct atagaagtaa atgtctcttt tcagatggaa atgaagacta 28680
gttttttggg agttctatct cacagaatta atttaaactt cttatgaatc agaattacag 28740
tgaaatgtag ttaagaaaaa aggaagttta aaataagcag cttgaacttg tatttttgta 28800
tattttatat aatttagtct tcagttttga tacattaaag ctgtgtccac tctggccaaa 28860
gcacagccat ggaaaacctc agataatgcc catgctgcca ttcctaaaag tgtggatttc 28920
ctttacctgt gttttgttac ttctttgctt atcccgttca gttcacattg tattacctgc 28980
tttgatttct agttttgttt ttccaaatga ttgctctttt tctgtgaatt ttcaagggtt 29040
gttatgtggt tgtcatttgc taatgtgatg aacaagtaat tcaagcaatt atcttttaag 29100
atagttatat atttggtcag tttttactat tttacgtaat tatttaaggg gtgagtattt 29160
ttcatatcat ttattcctaa atgtcactga tagcatggtt attggaaata agcaaaatta 29220
atctcattgg tacagatttt agggcctata tatgttgctt aaattacttt agaaattttt 29280
ttcttgaaac gaaatgctct gtatatagga cataaaccat gaatttgtta attggttttt 29340
aaaaaaatta aatttcactt gacaaaaatg gcagtcatgg aaaataagta gccagcttta 29400
taagcttctt tgccaggtgc agtggctcac acctgtaatc ctagcacttt gggaggccga 29460
ggcgggcaga tcacgaggtc aggagattga gaccatcctg gctaacatag taaaaccccg 29520
tttctactaa atatacaaaa aattagctgg gcgtggtggc aggcacctgt agtcccagct 29580
actcgggagg ctgaggcagg agaatggtgt gaacccggga ggcggagctt gccgtgagcc 29640
gagatcgtgc tgttggactc catcctgcgt gacagagtga gactctgtct caaaaaaaaa 29700
aaaagaaaaa attataaatg tgtattttga catgtttagt tttttatact tatgagaaac 29760
tcccccttga aaaagttcca ttgcctttaa acggtttgaa atgtttgaaa gacagaatct 29820
aacttcacgt tttttcacat acttgacata attatgctaa ttttgatttt ttaaatcaga 29880
atttttcatt aaatatttgt ttatttgcag gtatatttgc ttacttaaac taccatgttc 29940
ctcgaacgag acgagaaatc ctggagaccc taatcaaagg ccttcagaga ctggagtaca 30000
gaggatatga ttctgctggt actttaaaaa aaatactatg gattttgcat gattctttaa 30060
atagatacta tttttattgt tattaggaga ctagactatt aaagtctgtt ttgttttgag 30120
taagtgtaaa ttggaagaat ttttgtcttt tatcatattt aaaggattta tttatgtaat 30180
ctcaacagtg ttaccattta tgtggagtat tgcttatgat gatctcttaa gaatattatt 30240
gtaaaaacat catatggggg attattgtgg taaaacaaaa ttcgtgaagg tcttactcta 30300
aattcttttt tctttcctat aactttaatt tttatccatt gatttcatgc tttgacacat 30360
aaacttgcct cagattcttt tttcttattt ttattattta tttttgagat agggtctcac 30420
tctgtcaccc cagctggagt gtagtggtgc ggtcatagct cactgcagtc tcaaactctg 30480
ggctcaggca atcctccctc cgtagcctcc tcagtagcta ggactatagc tgtgtgccac 30540
catgcccagc taatttttaa aaagtttttg tagacacgag agtctcacta tgttgcctgg 30600
gctggtctca aactcctggc ctcaagtgat cctcctgcct tggcctttca aagtgctggg 30660
attacaggca agccactgat tccagcctct tctatcttaa ataaattaca cataaacata 30720
actttctggc aactttatgt tctaccctag ctccttccct caactatgtc agaggttcct 30780
aagaccatcc tcagatttga cgattcccta ggaggactca cagaactcag catttggttg 30840
tactcatggc tatgtttcat tataacaaaa gaatacaaag cacaatcagc aaagggagaa 30900
ggtgcaggaa ttgaagtctt gagaaagcta ggcacaagct gctcaccagt ggatcagtgc 30960
ctaaggtttt cattgggggt tggtcacata ggcaccctct gcccagcatg taccaaaatt 31020
ctagactccc aaaataagag cagatgttca gcataaacca ctttgtttgc acagtttgtg 31080
tagtgagaca cttttggtta gggtggtagg aatccttcca aaaaccaagt ttctagacac 31140
cagtgaaggg ccaaccttga aaacaggcct ttctgaggat agcagtttca cacctgctgt 31200
gttaactctt ttttgtacac ttaacattgc cacatggaat ggacatttgt cttccttgac 31260
tttccttagt aatggaaagt cagttcctca actcctttgt ttttaaaatt ctctccttcc 31320
ttagcttcct tgacagcaca tcttattctc ttcctaagat gctaagatta cttcttttct 31380
gtttgctttg gaggctcctt tcttctactt acagctcaaa tattaatgtt cttcaagatt 31440
cttttttttt ttgaggtgag tcttgctctg tcacccaggc tggagtgcaa tggtgcgatc 31500
tcggctgact gttgcaacct ctgtcttccg gattcagctg attcttctgc cttagcctct 31560
ccagtagctg ggataacagg catgcaccac cacgcctggc taatttttgt atttttagta 31620
gagatggggt ttcaccatgt tgcctaggct ggtcttgaac tcctgacctc aggagatcca 31680
cccgccctgg cctcccaaag tgctgggatt ataggcgtga gccactgcac ccagccaata 31740
ttcttttcta gatccacttc tcttatttgg tgtcttcatg ggtgagctct gactcatcaa 31800
tcttcttttt tttttttttt tttttgagat ggagtctcac tctgtcacaa ggctggagtg 31860
cagtggcgtg atcttggctc actgcagcct ccacctcccg agttcaagca attctcctgc 31920
ctcaccctcc tgagtagctg ggattacagg tgcctgccac cacacccagc taatttttgt 31980
atttttagta gagacggggt ttcaccatgt tggccaggat ggtctcgatc tcctgacctc 32040
gtgatctgcc cgcctcggcc tcccaaagtg ctgggattac aggcgtgagc cgccgtgcct 32100
ggcccatcag ccttctgtta atatatgttg gtaacttctt tgttttattc tttttatttt 32160
ttatttattt ttaattttta tttttttgag atggagtctt gctctgtcgc ccagcctgga 32220
gtgcagtggc atgatctcag ctcactgcaa gctccacctc ccgggttcac gccattctcc 32280
tgcctcagcc tcccgagtag ctgggacaac aggcacccgc caccacgcct ggctaatttt 32340
ttgtattttt agtagaggac ggggtttcac catgttagcc aggatggtct cgatctcctg 32400
acctcgtgat ctgcccgcct caccctccca aaatgctggg attacagaca tgagccaccn 32460
gcgcccggct agtatttttt atttttaatt ttaatttttt tgtgtgagag tatgttggtg 32520
acttctaatc cagatgtatt tcttttaatc cagatttatc tcccaagctg tattctaggc 32580
ctcctacaag tttcttccta gttagaccat gatattttaa actttgcatg ttcaaaaatt 32640
gaactgaggc cgggcgtggt gactcacgcc tgtaatccca gcactttggg aggctgaggt 32700
ggatggatca cttgaggtaa ggagttcaag accagcctaa ccaacatggt gaaaccccat 32760
ctctacttaa aaaaaaaaaa aaattagcca cgcattgtgg tgtgcacctg tgatcccagc 32820
tatttgggag gctgaggcag gagaattgct gaacctggga ggcagaggtt gcagggagct 32880
gagattgcgc cactgccctc catcctgggc gacaaagcaa gaacctgtct caaaaaaaaa 32940
aaaaaaaaag aaaagaaaag aaaaataagc tgaatacatt gcagtcctca ccctgctccc 33000
caccctgttt tttgtttgtt tgtttttgag atgaatctca ctctgtcgcc caggctggaa 33060
tgcagtggtg tgatctcagc tcactgcaac ctccacctct cgggttcaag ccattctcct 33120
gcctcagcct cccaagtagc tgggattaca ggcatgccca ctctgttttt ctatgtccct 33180
tttattgaga atcattcaac aagtccttca agccattcaa caagtccttt gaggtattcc 33240
acacttctcc tgctttctca cttacattca gtcagttcca cttttcaata tcatttattt 33300
ctgtctgcat taccactgtt tagttcaggt cgtcttcatt tttgctttgc tgtagctgta 33360
gcttttgaca gctggtttct tccttccgtt tctctccctc cagttctttc cctacacttg 33420
tttctagaag ggctttgcta aacatttttg ccgaatcact tctctgctta aaggacagtg 33480
ttttcccagt atcttcaggg tagctttttc aaattcctta gcaacttaag gagactctta 33540
agagatgtat tctgtgacct tctttcctta gctaccttct gaggtgggtg cccatctttt 33600
gcatttctcc attgtatccc aattgtaacc tgtagtattt ttattataat tcataatcac 33660
gctgaattat tttttccttg tctgtcttct cgatagactt agaaatttga ggacaggaat 33720
ggagttattt ttgtttttgt gtctagcagc tatcctggtt cttgacacac aataggtttt 33780
cagtaggtaa ttgaattaat acattagtga attaattaga tgagaatgta ttttttaatt 33840
aaaaattttg cctcacatta ataattttat cagtagccag tttctaaatt ttgctttttt 33900
acctcatgat ggtttaggtg tgggatttga tggaggcaat gataaagatt gggaagccaa 33960
tgcctgcaaa ayccagctta ttaagaagaa aggaaaagtt aaggcactgg atgaagaagt 34020
tcacagtaac gtacttaatt tgatttttgt cccctttccc cttctcttcc ttttcccctc 34080
cccattctcc tctaagttac tccctccccc catattttgg gaccaatttt aatgataatg 34140
gtctgtaaca ttgaagggag gaaagaaaag tagttttgtt actgtctgga ctagttttaa 34200
aatgtacctg agcctgaaaa ataatcattg caactaggga aggaaattag ttaggtatat 34260
taccttcagt gtaagctctg aatattaaat gaagtatctt cagagccacc attcctgagg 34320
aagagctttt cataagacaa aaggtatttt tagtgatgcc cttttacaca tgtcttcact 34380
tgctaattgt cttcactttg gattaaatgc ctagcttgga tgtagtcaat tttgacattg 34440
cacctttgaa taggtctgat ataatctggt aagtatcatg ttttccctca cagttttctt 34500
ctctggcaca aggagttgtc agagatgtat gccccatcaa agaggattta cttctcagta 34560
tttagatcat aacattattc ttacacattt tatttttttc acaagaaact tgaaaacaaa 34620
gcaaactttg aagtagattg attgaaaaaa tatttttaaa attctccaca aaacccagga 34680
aaccgcaagt attttatgta cctactcata tgaatgccat cataatcatt gtaaaagagt 34740
acaggtagag gaaaatgatg gattttgtct tttttttttc ccacataagc catacgttta 34800
gctctgtagt acttgtttaa cgaattaaat caatacttat tttgcctgta ttgtagtgta 34860
agattagcta ggggtaaagc agacacccaa ataactatac ttcaaaaaca gtagtataaa 34920
tatctactat gtgttctgca tcctgtatac caggctgatt gtagcgggtt ctgtaggaga 34980
gaacagacat tgctgtgaga ttcaggggag agttcccaca agttgacgag actgggaata 35040
catagggaat gggtgctgat tatatttggt cagtgaagat gtgaagggag gaccttctga 35100
gtagatagca tagcaagata agaagagtaa tggcaggcgt gttgatggaa tgatagtagt 35160
cctttttatt tacagtattg gtagacaaat aagggaggct agaaaggcag attgtgaaca 35220
gaatcaccat ttttcaatgt cagcatattg aaacatgcct cttcgtggtc aacttttttt 35280
tttttttctt cccttcccag atggagtctc gctgtaacgc ccaggctgga gtgcaatggt 35340
gcaatcttgg ttcactgcaa cttctgcctc ccagattcaa gcgattctcc tgtttcagac 35400
tcccgagtgg ctgggattac caggcgtgtg ccatcatgcc cggctaattt ttgtattttt 35460
ggtagagatg gggtttcacc atattggcca ggctggtctt gaactcctga cctcaagtga 35520
ttcgcctgcc tcggcctctc aaagtagtgg gattacaggc attagccact gagcctggcc 35580
aactggtttg tttttgaagt gtagttatct gagtgtctac tttactcaca gctaattttt 35640
ttttaagatg gactcttggt ctgttgcaca ggctggagtg tagtgacaca atctcggttc 35700
actgcaacct ctgcttcctg gttcacgcca ttctcctgcc tcagcctcct gagtagctgg 35760
gaccacaggc gcccgccaca acgcctggct aattatttcg tatttttagt agagatgggg 35820
tttcaccatg ttagccagga tagtctcgat ctcctgacct cgtgatctgc ccgccttggc 35880
ctcccaagtg ctgggattgc aggcgtgagc caccacacct tgctaatttt tgtattttta 35940
gtagagacgg ggttttgcca tgttggccag gctggtcttg aactcctgac ctcaggcgat 36000
ccaccctctt tgacctccca aagtgctaga attacaggct tgaaccactg cacctggcca 36060
acccctagct aatcttaccc tgcaatacat gcaaaataag tattgattga atttattatc 36120
tacaaatgga aacttgtaga tattgctggt gaatttgtaa ctggtaaatc actttaaaga 36180
gcaatctggc catatctaca tgggaaatgc ctataacctg agactaagca cttccactct 36240
tggatatata cttgaaggaa acacagtgaa caaggtgaca tgacaacaag attcactgtt 36300
gcaaaatatt agaaacagcc taaatgtcta taagtaaggg aatgggatga tataataagt 36360
tgtgtgtgcc gggcngtggt ggctcacgct tgtaatcctg gcactttggg aggccgaggt 36420
gggcggattg cctgagctct ggagtttgag accagcctgg gcaacatggt gaaaccccat 36480
ctctactaaa atacaaaaaa ttagccgggt gtggcggcgt gcacctgtag ttccagctat 36540
tcgggaggct gaggcaggag aatcacttga atccaggagg cggaggttgc agtgagctga 36600
gatcgtgcca ctgcactcca gcctgggtga cagagtgaga ctccgtctcc acaaaacaac 36660
aacaacaaca acaacaacaa caacaaaaaa taagttgtat atgatagtga atgagcatat 36720
gtagcttttg aaagaagtgt actgaatctg gttctgcata tgggaacatg gataattcct 36780
ggtatgtaaa gtataggaca tttaaaaaca caaaacggta ctatcattta tggtctcatg 36840
ttaacataat catagtttaa aaggcatgaa tagtaagact gtgtcaactt gaaaatcttc 36900
tgaggagtaa gtgaatggga tggggatata aaggaggtta tcaactgcat tttttacatt 36960
tatttatttc aagtttccat ataccacact gattttttac attttagatc ttaaaaaata 37020
tgtaaagcac agatgactag atgttttgtt aactctgagt atgggtagtt gggtgttcat 37080
tattcccagc aaatttaaat atgtttgaag tatttttttt gaaaagggaa gatgacatct 37140
gagaaaaggc aggcagaggg caaggagcca tgggagtaga ggtagggtaa gatagaagat 37200
gcaaatgagg aaattattga agcactacgg cccaagaaga tcaaggcaca ggcaaggagt 37260
tagcctttaa aggaaaaagt gtactttagg aatcaaagat gaaagacaaa cttaaagcag 37320
ataattacca ggtgagagga caaaagctga gtaaagtgga aattgaggga ttgcaggtag 37380
gattgagctt tatggagaat agaaaagata tgatgaactg tcagggaact ggattgagct 37440
atcagtttaa tgaataagga acttggatac atgtttctta ggtagcaaca gtgaaataga 37500
tatgtgaatt tgaaagggtc ttaatttaca gaattttctg actttcttca gtattgcttg 37560
gcagtagatg ggagaagaga aaccgagtgt gggggttaat ctagacttaa gattcagcaa 37620
agggctttaa aatgggtaac agacaataag gaagcgtcaa ggattcaaag tcatgattaa 37680
tttatatgac aggaaatatt tattatgaga aatgtgctta ttgtcatagc aataattttt 37740
tcttactaga cattcggtaa tgttcctacg gaaacagtga aataaaggtg tggtaattat 37800
catgaatttg aaatggattc aatatataga atcttgtgac tttctccaat attgcctgcc 37860
agcatgtgca aggagatact gctttaatta tagttagctt aaaaaagttg tcaaagaggc 37920
caggcgtggt ggctcacgcc tgtaatccca gcactttggg aggttgaggt gggcggatca 37980
cctgaggtca ggagttcgag accagcctgg ccaacatggt gaaaccctgt ctgtactaaa 38040
aatacaaaaa attagccagg cgtggtggtg cgtgcctgta atcccagcta ctcaggaggc 38100
tgagatagga gaatcgcttg aacccgggag ggagaggttg cagtgagcca agattgcgcc 38160
attgtactta ctccagcttg ggcacaagag caaaactccg tttcaaaaaa aaaataaaaa 38220
aaatagtcaa agatgttttc atttcttgca ttggcctgtt gaataatggt aaatggtact 38280
tttcttgagg tcatttatca ggttgcctta attacttaga acacagttaa gccaggaaag 38340
aatagatgcc tgagtttatt cattgataga ttgagccatc caacaaaaag gtatctgcca 38400
tgtatacctt ttagtgctta ggattcaaaa ataataaggt aggctgctgt ttttgtagaa 38460
ctcaaattct ggtggaagct aggttgacaa catataaatg taatagtaca atagaatata 38520
ccattgtggt tttatttatt tatttattta cttatttttg agacagagtc ttgctctttc 38580
gcccaggctg gagggcagtg gcatgatctc agctcactgc agcttcccct tcctgggttc 38640
aattgattct cctacctcag cctcctgagt agctgggatt acaggcgtgt gctaccacgc 38700
ccagctaatt ttttcagtag agacagggtt tcaccatgtt ggccaggctg gtcttaaact 38760
cctgacctct ggtgatccac ctgcctcagc ctcccaaagt gctgggatta caggcatgag 38820
ccgtggtgcc cggccagttt gctcttaatt tagacctaac tctgataaac tttgttatct 38880
gggttcttag ccaaattaat tttatattta ggaaattaag agcattacta gttaataact 38940
ggagctgtcc atttttttaa gaaaccccaa gaaaagatag cttatatgaa aaataagaat 39000
cagctacttc tttttttttt tttttttttt tttttttgag agggagtctt gctctgtcac 39060
ccaggctgga gtgcagtgat gtgatctcag ctcactgtaa cctctacctc ctgggttcaa 39120
gcgattctcc tgcctcaacc tcccgagtag ctgggattac aggcgcgcac caccacaccc 39180
ggctaatttt tgtagtttta gtagagacag ggtttcacca tgttggtaag gctggtcttg 39240
gactcctgac cttgtgtccc acccgcctct gcctcccgaa gtgctgggat tacgggcatg 39300
agccaccaca tctggacaaa tcagctactt ttcaagataa aggaacattg gcctatgccg 39360
atttcccagt agccccatac tttcatagca ttgctcggtt cttaaatacc tatttgattt 39420
tggaggcact ccatagttgc agtttctatt gtgagacgtg tgtacactca ccagagacca 39480
aagaaattgc agtcataagg ttgtgtgtca ttgggaaaat gaatttattt ttacatgttt 39540
aattaaattg ataatgactt tttaaggcaa gaattaaata tagatttaaa agattacatt 39600
aattgttttt gtccttaact cttgagtatt tgtatctcca ggaaacttga aagaatagta 39660
cattattacc tatatatact tcacctaact ttatctgtta ttaaaatttt gtcatgtttg 39720
ctttaactct gtattagttt tttggttgtt attgaaacca tttgccttca atatttcagt 39780
tgcataaact cctaaatctt tatttatctt tatttttaat ttttgtgggt atatagtagg 39840
tgtataaact tactgggtac atgagatgtc ttgatacaga cgtacaatgt gttcctaagt 39900
cttttttttt tttttttgag atggagtctc gctctgttgc ccaggctgga gtgcagtggc 39960
atgatctcag ctcactgcaa cctctgcctc ctgggttcaa gcgaatatcc tgcctctgcc 40020
tccggagtag ccaggactac aggcgcgtgc caccatgcct ggccaatttt tgtattttta 40080
gtagagatgg ggtttcccca tgttggccag actggtcttg aactcctgac ctcaggtgat 40140
ccacctgcct cggcctccca cagtgctggg attacgggcg tgagccactg caccctgcct 40200
cctaagtctt ttaatcacta ttttgaatat gcctgatctt tagtttcagt gattgtatat 40260
tccaagagag cagcattgta ataattgtat ttaaatatag cttatagcat tatctctgca 40320
gcatgattta atattgaaat ttttcttttc atattcttca gagcaacaag atatggattt 40380
ggatatagaa tttgatgtac accttggaat agctcatacc cgttgggcaa cacatggaga 40440
acccagtcct gtcaatagcc acccccagcg ctctgataaa aataatggta tggaaagatt 40500
ttttgtgctt tggaatgatt gtggaaacct aataatgggg gcagaatgaa ggcttttaga 40560
ttttcattat tttaataatt tttcatctgg aaaatttcaa acattcagaa gtagtagaga 40620
gcatatggag ctgagagtgc tggctcatgc ctgtaatccc agcactttgg gagcctgagt 40680
tgggaggatt gcttgagtcc aggagttcac gatcagccgt ggcaacatag tgagaccctg 40740
tctctacaaa aaataaaaaa ataagttagg cattgtggtg catgcttgta gtctcagcta 40800
ctcgggagac tgaggtggga ggatcgttta agcccaggag gtagaggctg cagtgagccg 40860
tggtcacacc tcatgccatt gccctccaac ctggacaaca gaatgagacc ctgtctgtcc 40920
accatgcctg gctaattttt gtatttttag tagagacggg gtttcactgt gttgaccagg 40980
ctggtcttga actcctgacc tcaagtgatc ctcccgtctc ggcctcccaa agtgctggga 41040
ttataggcat gaaccactgc tcctggctga gaacttttgt tattggtttt gtccttaggg 41100
catatctctc tagaaatgta taatcaaatt actgtgtttt agagttactt ggaatagtct 41160
ttctccatgc agttgtgcta cgtgttactt taatatgttt tagaaacatt ttttttattt 41220
ttattattat tttttgagac caagtctcgc tgtgtcgccc aggctggagt gcagtggtgc 41280
gatatcggct cactgcaacc tccaccttcc aggttcaagc aattctcctg cctcagcctc 41340
ccaagtagct gggactacag gtgtgtgcca ctacacccgg gtaatttttt gtatttttag 41400
tagagacggc atttcactgt attagccagg atggtctcga tctcctgacc ttgtgatccg 41460
cccacctcag cctcctaaag tgctgggatt acaggagtga gccactgtac ctgtcctatt 41520
ttttattttt aaggattgat attctttaaa aataaatgtt atttataatt atttaaaata 41580
tttacataat tccgaagtca catctttaaa ataagacaca ctaaaagaag tctacccagc 41640
actttggaag gctgagatgg agggattgcc tgagcccagg agtttgagac cagcctgagc 41700
aacatggcaa aatcctgtgc ctacagaaaa tacaaaaatt agcttgatgg tggcatgcgc 41760
ccatagtccc agctactcag gaggctaagg caggaggatc acctgaacct gggggttgag 41820
gctgcagtga gccatgattg ccccattgca cttcagcctg ggtgacagag tgagactgtc 41880
tcaacaaaac aagtctagac tcttctgttt cctcttattc ccctcgtagg taacattcac 41940
caattattga gtctgttctt tcatttaaaa aaaataagca aatacataca gaatacatac 42000
aaaagtgtgt atgtgtgtat ttatccctcc ccattttttt tccttttatt ttagagacag 42060
ggtctcactc ctccacccag gctgggtaca gtggtgggat catagctcac tgtaacctca 42120
aattcttggg cacaagtgat cttcctgcct cagcctcctg agtagctagg atcacaggct 42180
tgcaccacca cacccagcta atttatttta tttttgtaga gataggggtc ttgctttgtt 42240
gctcaggctg gttacaaatt tctggactca agtaatcttc ccacctcagc ctcccaaagt 42300
gctgagatta caggcatgaa ccactgcacc cagcccttgc tgatttttag tttaattcag 42360
aagctgccta tttaggcttc ttgtgcttca atacttactg ttgaatttga tcataatgct 42420
agcaataatt tagacttttg acactgacaa ggcctttatg aaagattccc gaaaacttac 42480
atctagatta tgttttgaga atttggcttt aagttaagac ctttaaatta gctgtttatt 42540
aatctctttg ttctagcatg aagttttttt tttttttttt tttgagaagg aatctcgctc 42600
tttctccaag gctggagtgc aatggcatgc tttccgctca ctgcaacctc tgcctcctgg 42660
attcagcgat tcttctgcct caagcctccc aagtagctgg aattacaggc gcctgacacc 42720
acgcctggca attttttgta tttttagtag agacaaggtt tcaccatgtt ggctaggctg 42780
gtctcgaact cctgagctca ggtgatccat ctatctcagc cccccagaat gctgggatta 42840
caggcatgag ccaccgcacc cggcaagttt ttttataaat ttatttttgt ggttgctatc 42900
atctctaaaa aatctagtga aaatgtttat tatttggttt ctaattactg tcagccaaaa 42960
tatcagatct ttatgtatat taagaacatt gttgggggcc gggtgtggtg actcatgcct 43020
gtaatcctag cactttggga ggccaaggca ggtggatcac ctgaaattag gagttggaga 43080
ccagcctgac caatatggca aaaccccatc tctattaaaa atacaaaaat tagctgggta 43140
tggtggcatg cacctgtaat cccagctact tgagaggctg agccaggaga atcgctggaa 43200
cccaagaggt ggaggttgca gtgagccgag atcgtgccac ttcactccag tctgggtgac 43260
agagcaagac tttgtctcag aaaaggaaaa agaacatttt ggcctggcat agtggctcat 43320
gtctgtaatc tcaagacact ggaaggatga agtgggagga ttgcttcagc tcaggagact 43380
agcctgggca acatagcgag actctctcta cagaaaaata aaaaaattag ttgagtgtgg 43440
tgtaagcagc tgtaatccca gctgcttgga aggctgatgt ggaagaatca cctgagccca 43500
ggagtttaag gctgcagtga gtcatgattg agccactgta ctccagcttg gtgacagagc 43560
aacatcgtgt ctccaaaaaa aaaaaaaaaa tattttgata atttcatata aaatttaatt 43620
tagcagtaat ttttctccta actgaaatga actctgaata ataaatccag gattggtagg 43680
attttttttt tttttttttt ttttgagaca gaatctcact ctgttgccca ggctggaatg 43740
cagtggtggg atctcggctc actgcaacct ctgcctccca gattcaagcg attctcctgc 43800
ctcagcctcc caagtagctg ggtttacagg cacgtgccac cacgcctggc taatgttttg 43860
tatttttagt agagacaggg tttcgccatg ttgaacagga tggtctcaaa ctcctgacct 43920
caggtggtct gcccatctcg acctcttaaa gtgctgggat tacaggcatg agccaccgtg 43980
ctcagccgga ttggtagttt ttatgtacca gcagtcgcta caaataatga tattgtcaac 44040
tcttgattat ctgttcttac agttttcaaa attagttaaa aaagatgaaa attatcccga 44100
gatcatgtct attttctctt ggaatgatat tttaacattt atgtttctga cattctatga 44160
cttatttgga tctcaaacaa gtaaatttaa ctatggaact gattggtttt tcttagcaaa 44220
ttccttagtt ctagttctta aattcattta gtgtaaatca gattattgtt ttagtttgaa 44280
aggacttctc tttaaacttt tactcaagaa tgaatgaaca gagaaataag aagaatattt 44340
agttcagctc tctcattttg caaatgaggc aacagaccca ataaacttgc tcctttcaca 44400
tgggtaacat ttgattacta gtttagccac aactgaaatt gttatctcta gacttcctgt 44460
ttatttccct actgtaccca cctcccctgc actgtttgct tcagctatgc cacataaaca 44520
atgctgctga tctacctgat gataatctgg taaatgagaa gtagatgtaa ttatgttata 44580
aataacataa atagtatata gcatgttaaa aatttttgac ttgagaaaaa tccagttaga 44640
gtaatagcta ttttagattt atcatacttc taactttttt gtcttcaaca cttttacctc 44700
ttttagaatt tatcgttatt cacaatggaa tcatcaccaa ctacaaagac ttgaaaaagt 44760
ttttggtaag taaggtgacc tcaaaagacc ccagcctttg agaatacttc taacgagagc 44820
actggggtcg gttgttggga tgtgcaacaa acaccatatg tgtgtcatca agtaatttct 44880
tggacaattc caagggcacg gtggtttatt ggatttttct ttgctaacag tggaacaatt 44940
gtgtttttta atatgaaaag gaaatgatta gcatttgact gtaatataca tgacaaaagg 45000
ctcaaataaa attggaattt tgtggagaca ttttttgcat tctgagagat tgtcatgctt 45060
taaagttcct aggatatatt aatacaagaa gaatcaggac aaattaaatg aaagttttat 45120
gtcgtaaata gctatatact gtatagtagt ggtcatagtg ctgacctgca tgagtgcttt 45180
cttagggctg ttcaattgaa ctttctccag tgttggaaga cagtgtatct gggctattca 45240
gtatagtagc cactgtccac atgtggttgt tgagctagta tgactgagga actgaatttt 45300
aaattttatt taattttaat taaattgaaa tagccacata cagctaatgg ctatttatta 45360
gacagtaagt taagtgtatg ttcagttaaa cagagtccca cactgtttta gagtcactga 45420
tcagctggtg actttaattt tgaataatgg gatatggtgt tcaaagaata ttagaaatta 45480
gtggcatttt gacggaacaa ttctgtagaa aaggtttttt tatcattaat atttctttaa 45540
ttgtatcttt tttttctttc tacttacagg aaagcaaagg ctatgacttc gaatctgaaa 45600
cagacacaga gacaattgcc aagctcgtta agtatatgta tgacaatcgg gaaagtcaag 45660
ataccagctt tactaccttg gtggagagag ttatccaaca attggtatta agccacattt 45720
ttaaagataa ttatgccaac attaatgctg agaaactttc tggaaattaa gtttgataag 45780
caggaactgt gctatttttt tatttttggc ttttatttct catataacta ttcaagttga 45840
ataattttga gaaactgatt gatttattga ttccccccca ccctccattt aaaattctac 45900
ttacttcatt caggtttaat gtcatgaaaa tgaaaattaa tccaaaatca gtgtgtctaa 45960
aaactatgca tatatgcaca catccatacg caccacacgt ggacatgtac acagtacaca 46020
cgatggagga ttagttattc ccttgcttct tgctcatccg agtgttcttc tcaaccaata 46080
acttagcaca atagtagctt cacagctacc acagtttatt ttctgggata atgcctgctt 46140
gtctctgagc caacaaagtc aactacttat ttttcctttt ggggactttc ccttggctct 46200
gaacttctat agaaaagcat ttccaagccc atgagaaaat cagtattctt tttgattcca 46260
tccaacattc ctaattaaag attaaagaca tcaaagatct acaaatgtcc aaatccatag 46320
tgatacctac atttcccttc cccactcata actctagctt tcccacttaa aagtccttta 46380
cttcccaaat acggtccagc cctcacttct ctcccacctg cacccaaatc ttatatctgt 46440
agcaaaaaga ggaagcagga agatggagaa tgtagaggcc tattccttcc ctttccccaa 46500
ggcagagtgg agtagtgtgc cttcccagcc ttttctcgtt tctaacaggc tttgcctttt 46560
attcattgta taatccagtt tgtgttccaa ggtggttctt ccctctccta cttcatgttc 46620
ctcttttatc tgttcttgat tcctgtaagc tctgtccctg aggattcggg ttgatggagt 46680
tgtatggtgt gcatgttaat aattgtatat atttatatct ctaatatcaa ggtcagaaag 46740
agtggaagtt aacagtggtg tacaattata gggcagagaa taggttttgg attttgatct 46800
taggatcttt tctaattctg tcgttcctct gataattcat agtattatga cgatatagat 46860
aggtagatga tggagatagg atatataggt tcagaagtgt tcatagcctg tagaaaggat 46920
gactttttaa atgatctatt tttgtagttg ttatctattg agcatatttt gggtgtaggc 46980
ttggttaaaa aagtgggtct tggctgcgcg tggtggctca cgcctgtaat cccagcactt 47040
tgggaggccg aggtgggcag atcacgaggt caagagatgg agaccatcct ggccaacatg 47100
gtgaaaccct gtctctatta aaaatacaaa aattagcgtg ggggtgcgtg cctgtaatcc 47160
cagctactcg ggaggctgag gcaggagaat cacttgaacc agggagttgg gggttgcagt 47220
gagccgagat cgtgccactg caccccagcc tggtcacaga gtgagacccc atctcaaaaa 47280
aaaaaaaaat gtgggtcttg gatacaccaa agcttaggag taagtgttta cttaaacttt 47340
agacttgttt ataaactggt acaaaagagc atttgtgtga acaaaaaatt tctgcgctga 47400
agccagtatg ttctaggcat ttctgacttg ataattgatt aaatagtgct aatggatttt 47460
tttccctccc taggaaggtg cttttgcact tgtgtttaaa agtgttcatt ttcccgggca 47520
agcagttggc acaaggtaca tataactcta acaatgacta atgtatttca acatatttga 47580
gttacatgtt tattcttcgt agactataca tgacccttta ttataaaggc tctgcccttt 47640
attagatata ttcatgtgag catattttca catcttcctt cttgtctgtt gcttaccact 47700
cttccattta acagaatccc tgaagaaagc aaatacaggc tgggcgctgt ggctcacacc 47760
tgtaatccta gcattttggg aggtcgaggc aggcggatca tctgaggtca ggagtttgag 47820
accagccagg ccaacatggc gaaaccccgt ctctactaaa tatacaaaaa ttagccgggt 47880
gtggtagcac atgcctgtaa tcccagctac tcgggaggct gaggcaagga gaaccgcttg 47940
aacccaggag gcaagaggtt tcagtgagcc gagatcgtgc cactgcactc cagcctggcc 48000
tacagagcga gactctgtct gaaaaaaaaa aaaaaaaaaa aaaagaaagc aaatatattt 48060
tggcatttaa ttggcctttt gtctttgttg ggcgcaccaa ggttactttg tgaatttgga 48120
tattgaatat tatctaataa agttaaaata ttagcttttt ctgtattttt tgaaacatat 48180
attctagaca gattcctaga taattgtacc atcactactt cttgctagga tatttaggcc 48240
tgatcatgaa gtcctaagtg aggcacccta agatattatg gtaagagaga tatttttaat 48300
ctgaaaacag ggtgactaag gagaaggtgc tacactttca tatattggca ttctgtgcac 48360
aattgaaagg aaggttccct ttaacattac aaaggaaaaa aattaaaata cattgttaca 48420
gaacaggtgt tggcaagttt tctggagtgg gccggatagt aactatttta ggctttctgg 48480
accatgtagc ctctgtagca actactcaac tttgcagttg tagtgtgaaa gcagctgcag 48540
aaaataagta aaagaatggg catgggtatg ttccaaaata actgtattta atacaatttt 48600
tatttgtcaa ttaagaaaag aaataattaa aaaaaaaccc aaaaacctgt attaggctgg 48660
gcgtggtgac tcatgcctgt aatcccagca ctttgggagg ctgagatggg tggattgctt 48720
gaccccagga gttccagatc agcctaggca acatgacaaa atcccatctc tataaaaaat 48780
aaaaaattta gctgggtgtg gtggtgcatg cctgtagtcc cagctactca ggaggctgag 48840
gcaaggggat cacttgaggc caggaggtca aggctgcagt gagctgtgat tgcgccactg 48900
cactctagcc tgggagacag agcaaggctg ttgtcaaaaa acaaacaaat aaacaaaaac 48960
cgtttattta taaaaataaa ccctggggct gcaggtcagt ttgctgaccc ctgatagaga 49020
atattttgga tataggatct tgttctgtca tccaggctgg agtgcagtgg cgcgatcttg 49080
gctcactcca accttcacct cccagactca ggcaatcctc ctaactcagc cttccaagta 49140
gctgagactg taggcacgtg ccatcacacc tggctaatta ggagacgggg ttttgccatg 49200
tttcccagag tggtcttgaa ctcgtgggct caagtgatct gcctgcctag gcctcctgaa 49260
gtgctgggat tacgggtgtg agccattgca cctggcccaa tactgatttt tttaaaaaat 49320
tctttttatc tagttcttat atctgaagtt gagcttgggg aggatgattt aaacatttga 49380
agagtattgg cccattaaat tttatgtcat tagtccatta tttataaaaa tggtttaatt 49440
ctaactgctt ttgcaattta caggcgaggt agccctctgt tgattggtgt acggagtgaa 49500
cataaacttt ctactgatca cattcctata ctctacagaa caggtaaaat tacctctaca 49560
aatgcagtgc agtagatatg aagaattatt ttccttaagt tggaatagat ggctctttgg 49620
tcagatgcac atgtatatat agttctgtct agacatgaaa aagatttgtt tttgtgagtt 49680
ctctgatgat tagaattttt ttctgttgtg tatccttagc taggactcag attggatcaa 49740
aattcacacg gtggggatca cagggagaaa gaggtgggaa atgcactctg catggatggg 49800
gaggatctta tcctcttttg tttattcttt actaattctt ttgttcttgg agtgaatgaa 49860
tgtgctgggc ctctaaaaat gtgcttattt tgtggggaag catattttga catttttcta 49920
atttgcggag tatattttgc gtgtctgctt ttggcattta gaaagtgctt ttaataattt 49980
cattaaaatt tctgaaattt gagaaaatag ttgaaattgt aaattatttt ttcctttgtt 50040
ttaaaatcat gtaggatgta tgcttagatt aggaaaagag cattgtgtgc taggttatta 50100
tagattgact aagtggtagt tatttgaatc atttaggcta acttttaact gaaatatgtt 50160
taagtggtct ttatttttta tacatgacat attgttggat ttacatttgc tatcttgatt 50220
ggctttattt gaatttgtag tgattgttct tttatattgt ttatgtgtaa agtttatttt 50280
ttgtttttct tatttattta cttcgatgta acttttttat agagcggcag ggggagacag 50340
ggtcttgctc tgttgcccag gctggagtgc agtgcagtgg tatggtcata cctcactgca 50400
atttcgaact cttgggctca ggtggatcct cttgcctcag cctctcaaat agctagtact 50460
acaagcgtgt gccatcacac ccagctaatt cttattttta gccagggttt tgctctctca 50520
gccaggctgg agtgcagtgg tttcgtcatg gctcacttca gccttggctg cctaggctca 50580
agtgattctc ccacctcagc ctcttgagta gctgggacca caggcatgtg ccaccacccc 50640
cagccaattt ttttatttgt aaaaaggaag tcttgctatg ttggccaggc tggtctcaaa 50700
ctcttgggct taagggatcc tcccacctca acctcctaaa ttacagggat tacaggaatg 50760
agccactgtg cctggctccc agctaacttt aaattttttg tacaaatgga gtcttgctat 50820
attgcccagg ctgttcttga actcctggag tcaagtgatc cacctgcctc agcctcccaa 50880
agtgctgaga tcacaggtgt gagccactgt gcccagccca gaagtgttct tttcatttaa 50940
acagacattg atatctcaaa ttttttttac cttatttatt tattttttga aacagtcttg 51000
ttctgttgcc caggctggag tgcagtgaca tgatcttggc tcactgcaac ctctgcctcc 51060
cgggttcaag cgagtctcat gcctcagcct ccagagtagc tgggactacc agtgcacacc 51120
accacacccg gctaactttt gtatttttag tagagacggg gtttcgccat tttggccggg 51180
ctaatctcga actcctgacc tcaggtgatc cgcccacctc ggcctcccaa agtgctggga 51240
ttacaggtgt gagccgctgc acccagcctc aaattttttt tacatatttt aactaaatat 51300
actttgttat ttgaagaatg aaattatcaa tatttggaga aaaaacacag tgaaactcaa 51360
gcctattagg acattttata agcaaaagta gttggttttt tttttttttt tttttttttt 51420
gagacgaagt ctcgctctgt tgctcaggct gtagtgcagt ggcgtgatct cggctcactg 51480
caacctcggc ctcccgggtt caagcgagtc tcttgcctca gcctcctgag tagctgggat 51540
tacaggcacg tgccaccaca cccagcaaat ttttctattt ttagtagaga cggggtttca 51600
ggctgttgct caggctggtc tcaaactcct gacctcatga tccgcccacc tcggcctccc 51660
aaagtgctgg gattacaggc ctgagccacc acacctggtt gcatttattt tttttaaatg 51720
ctgagctctc tttttatgtg tttttaaatt cacttttttg ttttgttttt gagacaaagt 51780
catgctctgt cacccaggct ggagtgcaat ggcacaatct cacctcactg caacctccac 51840
ctcccaggtt caagcgattc tcccacctca gcctccggaa tagctgagac tacaggtgta 51900
ctctaccact ctcagctaat tttttgtgtt tttagtagag acgaggtttc accatgttgg 51960
ccaggctggt cttgaactcc tgacctcaag tgatctgccc acctcggcct cccaaagtgc 52020
tgggattaaa agcatgagcc actgtgcctg gtctctgttt tttaacatac agtaatattt 52080
actctttttc atgtagtttc accaattttg tcagatgcga aattgcataa gtaccaccat 52140
aatcaagata cagaacaatt tcatcactca ataaggtccc tcaacctgcc ctctgtcatc 52200
aacccttgtc tcattcccag cccctggcaa acactaatat gttatttttc tataatgtta 52260
ctttttcttg gatgtcatct tacatttatt tttcagtttg gcatctttgc tgttaaatat 52320
gaatgggaaa agttactttg ttttcatcac taaaacatca aataatcaca gatggtggaa 52380
aacttcgaat atactttttt tggcttttat ttttaataga tatataatta tatgtttatg 52440
tggtgtatat ttcaatacat gtgtacaatg tataatgatc agctcaggat aaatagcaca 52500
tttgaatgta catttctgat aattatcaag tctgccttta tatgtgcatt ttaagaggat 52560
agatgaaata gcagttttta taagtatact tgtgatgttc tctggctatt gtgtccatag 52620
ttctaagttc tgttatgtcc tggccttgaa gaaaggtgca tttttgtctc taggacattt 52680
atgtagtctt caactaatag atttttttcc tatataaggc caatttataa aaccttagca 52740
ttccagtttt gatgaaaaag ttaatattaa tgtcttgaca aattaagtag aggtgtcata 52800
attctgaaat acaagaatta aaaggatatt agctttgcaa aaagacccta ctttatcctg 52860
acttaaagga agcgtaagaa aacccaagtt gaagaaagga gagtttcttg gtttataaat 52920
tttgtctcta acagtgggtg ccacatatga tataccgtga ttagagagtg atatgcatct 52980
gttttgtttt caaatcagaa ttagtgtaga ctacaacttg atttgttatg ctgacttgct 53040
gctaaaatct agtgaggttt tgttatgata caataaaaat taatttgcca ctagccttca 53100
ttttcttttt cttttttttt tttttttgag acagagtttt tgctctgttg cccaggctgg 53160
agtacaatgg cgtgtgattt cggctcactg cagcctccac ttcctgggtt caagtgattc 53220
tcctgcctaa gcctcccaag tagctgggat tataggcgtc tgccaccacg tctggccaat 53280
ttttgtattt tcagtagaga tggggtttcg ccatgttgac caggctggtc ttgaactcct 53340
gacctcaagt gattcacctg cctcggcctt ccaaagtgct aggattacag gcgtgagccc 53400
ctgtgttcat tttatttttc attgcacaat tttgatattt taaatgtaat tttgttataa 53460
ttataggtac acaaactttt atgtgttaag atcattgttt tgtataaagt taaaattaat 53520
ttatacatac ttttgattta aaaaaccggt taatattaag gaattacttg tcttttacct 53580
ggaaaataaa tattatatta aaaaaacata taatgtagca cttttacctg ccacgcactc 53640
tttgatagtt gctacttcac tgtacacttt ttgtctgttc ttattggctt attgcatgga 53700
aataaggtga tctacttggc tttttaaatt tgctaaaatt gttttgtgtt gctatgattt 53760
tttcttgatt ttatagaata ttatgcatat ttctacattg gacatgattt tctacatgtt 53820
tgccaattca tgttaactat atgctttagg caaagacaag aaaggaagct gcaatctctc 53880
tcgtgtggac agcacaacct gccttttccc ggtggaagaa aaagcagtgg agtattactt 53940
tgcttctgat gcaaggtgag cttccttagt tgattcaaag agatttttag taaaacttct 54000
cattctgcag gaaacccaag aagtcattgt gtatcagtct agttgtgctc tgtgagataa 54060
ctttttaaat taaagaaata caggtgacca ttttggagat ggggctgtaa ggacactttt 54120
tctgtcattt caaagtatgt gggtcagttt actaagaaca catatactgc ttgagacttg 54180
ttccagtgta tttattttag agctcttaca tttttttcct tcttatttca ggagccttat 54240
ccaggttttg aagggaggag attctagatt gaagagtaaa atggcttagt tagtatccca 54300
atagttatag catagttgct aaactattgt agttttagtc taatgtagat actcatcttt 54360
tacatttaga attaatttgc agcataatca tttttataaa gggatagtag tagactaaga 54420
tattttgaga gaaaatgcag ggggatgttt acatgcattt gtaaatgaaa tagtaatgag 54480
gataaaataa aatcaccgaa attgcaaaca agtatttgag tcatccactg tacctgaaaa 54540
taagagaaaa taataaaaat aagaaaataa tgccatttag gacatcaggg aatatattat 54600
ctcagtggga aaacaagctt tactctttaa tgtttttaca ggtgtgtaag gtgtgtagtc 54660
agggctaaga tgtgtaagat tacacagttg acagttatgg cttaaataca ctggaattac 54720
agaaacatat cagccttttc tcattcattt atacattcat attgaacact gggtgaagtc 54780
atatgctagc gtcaggagat aatggtgagt aaaaataaaa atattacttt tccttaggag 54840
ctcttccata gtgaggaggc aaattttaaa caatgatcac agaagtgtag aattccagct 54900
gtgacaagag ctgcagaatg ctagtaacag agtgatttac ccttggtggg taaatttctt 54960
taagggaatg atgtttgaac tgagagttaa ggagagatta ggagttaatt aggttaagag 55020
gtagagggag gaacattcat tctttgcaaa tggctcagcc tgtgagagtt taggatggct 55080
ttgagtgtgg ccagaataga gagagtgaga ggaagcttgg ggggagatga agctggagaa 55140
ggaggtatag ggattacggt aaggcacttt gttgtctctc tgagagccaa agggaaactg 55200
tcaaatggtt tgttgagtga aggagaaatc tttattagag ttgttgcctt ttgatatcaa 55260
ttttggcaga aatggaggat ggacggagag agatcagaga gaaagtgggt ggactaattg 55320
ggagatcgct gcagtagtcc agccgaggag ctgatgggag cttgaatttg tctggtggtg 55380
gacatagaaa ctaagaatat ttggaagtta aaatttcagg acttggtaat ggatagaatg 55440
aggaggaaac aaccatgctt tctgatctaa tctgtttggt ttagattgct atgcagagtt 55500
ccttttattt tttgtccaca atgaccacct tccccatact ttcctgtagg ggttggcatt 55560
agtaaccaga aaattctctg agatactgca gagtgataga gtttatattg aaatttggtt 55620
cttgtatcca aatgatagtt tcatttgtaa taatgatcct tggttatcga ttgtaatatc 55680
tccttgaaaa ctttatagtg ctgtcataga acacaccaat cgcgtcatct ttctggaaga 55740
tgatgatgtt gcagcagtag tggatggacg tctttctatc catcgaatta aacgaactgc 55800
aggagatcac cccggacgag ctgtgcaaac actccagatg gaactccagc agatcatgaa 55860
gggtgaaagt ttttgtcatg ttatagcttg ctgtccttac tggaaagaat atattctact 55920
tcctttccta gcatattaaa tctagtaatg aatgatgagt ggaatcttcc acatgattag 55980
tgaagggaca acgctaggaa aagggatgat tctttagaga aattatctgc tgtttttaca 56040
atcgtcttca aactaattaa tgatttgtta tttgtaacat tataaaaagg ttattaacac 56100
ttgatacttt aaagatactt tataaacata aaaatagtta atgttctgtt cctttttatt 56160
ctctttgtgc tttagttttc ttatatataa catgaggata atatagcctg cctcattaag 56220
gttgttttga ggattaagaa gctactatat ggctgggtgc ggtggctcac acctgtaatc 56280
ttagcacttt gggaggccga ggtgggcaga tcacctaagg tggggagttt gagaccagtc 56340
tggccttgcc aacgtggaga aaccccgact gtactaaaaa atacaaaatt agctgggtgt 56400
ggtggcgcat acctgtaatc ccagctactc gggaggctga ggcaggagaa tggcttgaac 56460
ccgggaggca gaggtttcag tgagccgaga ttgcgccatt gcactccagc cttggcaaca 56520
agagcaaaac tctgtctcaa aaaaaaaaaa aaagaagctt aaaacagtgt ctgacacact 56580
tagtcgtatg taatatttgc ttctgttaac tattataatt attatgattt ggattatttt 56640
attcctttct gatgggattg tggtaggaat aaaaactaac attggccagg cacggtggct 56700
catgcctgta atctcaacac ttagggaggc caaggtagga ggatcacttg agctcaggag 56760
tttgagacca gcctgggcaa catagtgaga ccttatctct actacaaact aaaaaaaaaa 56820
aaagtccagg tgcactggct cacacctgta atcctagcac tttgggaggc tgaagcaggc 56880
agattgccag agctcaggag ttcaagacca gcctcagcaa catagcaaaa ccctgtttct 56940
actaaaaata caaagaaaat tatgggcatg gtggcatgta cctgtagtct cagtgactgg 57000
ggaggctgag gtgggagaat cacttgaacc caggaggcag aggttgcagt gaggtgagat 57060
cgtgccgctg cactccagcc tgggcgacag agtgagactc tgtctcaaac aaaacaaaac 57120
aaaacaaaac aaaactatga gccgggcatg gtagtgtgtg cctgtagtct cagctactca 57180
ggtggctgag gtgtgagaat tgcttgagcc caggagattg aggctgcagt gagcggtgat 57240
cttgcggtga tcacttcagt ctgggtgaca aagaccctgt ctcaaaaaaa aaagtaaaaa 57300
taagaaataa catttattgc ataactctat atatatatat gtcagatttt ttgctttatt 57360
aatccatact acaatccata ctgtgaagta attggtctct tattttatag attaataatt 57420
tccccagttt agatagtaaa ggatagaact acagtttggg tgggttgcac tccaaaactt 57480
aaagcttgtc ccagttgact gagtgcggtg gctcacgcct gtaatcccag cactttggga 57540
ggccgaggtg gttggatcat gaggtcagga gttcgagacc agcctggtca gtatggtgaa 57600
accttgtctc tactaaaaat acaaaaaatt agccgggcgt ggtagcacac gcctgtagtc 57660
acagctactc aggaggctga ggcaggggaa tcccttgaat ccaggaggcc aagattgcag 57720
tgagcctaca tcatgccact ccactccagc ctgggtgaca gagcaagact ccgtctcaaa 57780
aaaaaaaaag cttgtctcat tcacttgttg taactgcaca tttcaagtat gaagttaatt 57840
aaaagtgact tttactgtta tttttttcca cagagtaaaa tatgttcacc cagtctttta 57900
ggcagtcatg tctattgcat gaacttttgt tatattttat ttaccaagat tatattaaag 57960
gaaactttta gttgtgtaca aattctttta tttgatttgt ttttgtttta attatgtgat 58020
ttctattact ataggcaact tcagttcatt tatgcagaag gaaatatttg agcagccaga 58080
gtctgtcgtg aacacaatga gaggaagagt caactttgat gactatactg gtaattrcat 58140
atgaattatt ttattatttc agtgtctctg acagtaggag gtgccattaa caacctgaaa 58200
gttcattgcc cttaatagcc ttgtagaaca actacagctg ccagccatca gtggagccca 58260
gccatcttgg aaaaagttct ttagtgtgtg attctaccta tataagatat ctagaatagt 58320
cagattcaca gaaagagaaa gtagattaat ggttaccaag ggctgtgggg aggggaaatg 58380
gggagtcact gtttaaaggg tacagagttt cagttgtggg atgatgaaat tacagaaatg 58440
gattgtagtg atggttgcac aataatgtga atgtgcttaa tgccactgaa ttgtacattt 58500
aaacatagtt aaaatggtaa attttatgtg taggtcaccc actgtgtacc agggactgtc 58560
ctaggtactg tgaattctaa gaagaataag acctggtccc gttgctgggc agcttatgtg 58620
tatctgcctg gcctaggttt cctttctgag tgtataaata agtaaaagtg tgaacttccc 58680
cagaggtctt tcagttattt gcctgatgcc tttggataac ctgtaccctc ctgcattttt 58740
aaggtagagg tgagagtaca acactactct tttttttagg atggagtttt gctattgttg 58800
cccaggctgg ggtgcagtgg tgccatctcg gctcaccgca actgctgcct cccgggttca 58860
agtgattctc ctgcctcagc ctcccaagta gctgggatta caggcatgta ccaccagagg 58920
aattgtatct gcctctgtag acagaggtgg ttgttgaaga tggttgagct ggaagaactg 58980
ggagagtagc agtaaattct tttatggtat ttatggaaat gaggtcagga aaaagatttg 59040
ttttataagg gaagaaaatg agacaaactt tgggaagttc acggttttaa aaagtacttt 59100
tggctgggtg cagtggctca tgcctgtaat cccagcgctt tgggaaccca aagcgggagg 59160
atcgcttgag ctcaggaatt ctagaccagt ctgacctcct ttttactaaa aatttttaaa 59220
aaattagctg ggtgtggtgg tgggtgcctg tagccctggc tactgaagag cctgaggtgg 59280
gaggattgct tgagccctgt agatcaaggc tgcagtgagc tctgactcca ccactgcact 59340
gcagcctggt tgaaagacct gtctcaaaaa aaaaaaataa aaaagagtac ttatatctgt 59400
attatgtaca taaaagttct gtaataaaac aggatagctg tcatcttttt tgttgttagg 59460
atgaggagat tgaggctttc agtttgtcaa aggtcacatt gttagtcatt tattgaacca 59520
aactactccc catgtattca ttgttctaag tgctctccat cccctcccct gtccatcagg 59580
cattctttct tttgcctgta gtgatggctt acctcatctc aaaagggatc aggcttttct 59640
caaaagcatc aaatttagag ctttgggcag cttctttcag aactatccca actatcctca 59700
gccaccagaa atttctagga ctaattttaa ggaaacaacc gtggccagct aatctcactg 59760
tcttacatcc atgtcattct ttgtcatcat ctgcaataca ggtctttctg gtagttggtc 59820
tgcctttttt tttttttttt tttttgcttt gcttttatat tgagtctttg cctttgcatg 59880
accctgatcc agccttttac tgctgtttcc tttcttctca aacatttgta attaatgcca 59940
aggtctgtgg aaaacactgt aggcagaggt acacaaacag gcttggtcta gtgcagtaac 60000
agcaagaagg ccagtctggc tggtgtggcc tgagtgagag gggatgtgct aggtcagagt 60060
aagcaggaga caggtcttat gggacttgaa ggccaaagta agtagttcgg atttgattat 60120
aaattatttg ggaagctagt gacacttttt attttgtttg gttttgtttt ctacttgcta 60180
attttttaaa atagagaaac ataccttctt tcattattga aattcaaaac ggagaacata 60240
taattattca aaagataaaa agtaaaacac ataccttggt tttatagtat aactaactaa 60300
gataaaaaag aaggtggact ggctgggcgt ggtggctgac acctgtaatc ccagcacttt 60360
gggaggccaa ggtgggtaga ttacttgagg tcaggagtcc gagacgagcc tagccaacat 60420
ggtgaaaccc tctctactaa aaatagaaaa aaattagctg ggcgtggtgg ctcgcggcct 60480
gtaatcccag ctactaagga ggccaaggct ggagaatcgc ttgaacctgg gaggtggagg 60540
ttgcagtgag ccgagattgc accactgcac tccagcttgg gctacagagc aagactctgt 60600
ctcaaaaaaa aaaaaaaggt gaggagatga agagagcagg ggcagagtag acagactgaa 60660
aatggttcag agagagcagc aggatgaggc ccacgaggag gtacctgtca ttctcctcag 60720
ccagatttgg aattgtttga gtccagaagc tctcagtgcc ttgaccacta tatttacttg 60780
gtgggtgatt agggaatttt agttgaccag ttgaatgaat gttgaatgag aatttctcac 60840
agatagaaaa ctagcctgtg tggaaggatt tctggacaag acacatggag aacaacatgt 60900
aaatagctat agaaactgaa aatgaaaaag aggacagact tcattggagg gtctttatgt 60960
ttttaaagga tcactgtaag agatccttct ggtagcatat ggagagcaga ctccaggagg 61020
tggagaacag aagagagaac tggagaatgt tgctgtcgtc cagggagaga tgctgggttt 61080
gaagataaat gtggagggat cagaacaatc aagcattttg actgaagcat taggggaatg 61140
gggacggcaa agactgagag gagagtgggt ttatgttact ctacagagca cctttctggg 61200
caccagaggg gaaataaacg taactgagat aatatttttc ccagacaggt ttattgagac 61260
ataattagat ataataaaat tcaccattcc tagtgtataa ctctaagttt gacaaacctc 61320
tacaacatag tcataatcat aacctctaca aagtcaagat gtagaacagt tccatcactc 61380
ccaaaatttc cttgcaccct attgttgtca acccctcctc cagctccagc cctctacatc 61440
taatgatctg ttttctgtgt ccctctactt ttgcctttaa gataactttc aaagagaaga 61500
atgtaaaaat aactaactaa ggtagaatgt aataaatact gtaattgtgt ggggatgtag 61560
agaggtgagt aaggtcagtt acaagtttgg gggcgccagt gaagttgtga cttatttaat 61620
ttacttttca aaattacaga gaactgtgct ttccaagagg aatattaatt ctttaaaaca 61680
gcagtattct tcctcatatt ggcagtggat actcacaaaa tgcgattgcc tagttcacat 61740
ggttctttgc taaataatta tgtacacaaa cttttatttc agtgaatttg ggtggtttga 61800
aggatcacat aaaggagatc cagagatgcc ggcgtttgat tcttattgct tgtggaacaa 61860
gttaccatgc tggtgtagca gtaagtgctt tttaaaattt taattatgtt gaatattaga 61920
gaatatctgt agaccaagta gtagtctaat aacatactgt gtaaaactat gttttgttaa 61980
tgtgttatct tttccctttt gtgataaaaa aagaaggtaa ggggagaaat ttaccagctg 62040
cttggaatta tttatccatg gaagatctgt agaaaaggtc cctagatata cagatagacc 62100
tcctgcaacg gacttcatga aaggccaaga gggggagagt ttgtgtactg tcctagactt 62160
gtagcctagg gagcttgcct acatgtgtaa gagccatcgt tgggttttgc ttagcattgt 62220
tcacttgccc tagacagatg gcctgcatca tgtgtgaacc tcagtgcaat tttactttgt 62280
gggcacatta ctgcaaagaa aggtagtctg cttttttttt taaatcagat tttattcttt 62340
aaattgttct tttagaagct gaaattcagt atcaaaaatg tgtattgtca gtgcagaagc 62400
ataggtgtat gagggtcttt tattccaata aaagaccaat atttgcccac gtagtttcct 62460
tagaaagaga cagtttatgt gctgctgatg tcaactgtta tgaacagaag acctttacat 62520
tcaatttctg cttttaggat tgacttccaa agttcctgac ataacttatt tatttgctga 62580
ggcataaata tttattagga gccatttatt taagcagtga gtgaaactat ctggtcacct 62640
gcccttgcat ctcaacaagc tttgctcttt tctaagacta caccaaatac ctcctcccct 62700
cctcccccaa aattatatgg tcctaaacag aaagtctatg taatgttgaa gggtagaggt 62760
ctaaaaaagt gattgttttg tctgggtgtt gtggctcaca cctgtaatcc cagcactttg 62820
ggagggcaaa gtgggaggat cagttgaccc taggagtttg agcctgggca acatagcgag 62880
accccgtctc taccaaaaaa aaaaaattat cggggtgtgg tggcaactcc ctgtagtcct 62940
agctacttgg gaggctgagg caggaggatc gcttgagtcc agaaggtgag gctgcagtga 63000
gcctagattg caccgctgaa ctccaacctg ggcgacaaaa ccaggccctg tctcaaaaaa 63060
aaaaaaaaat tttgaacacg ggaagaagaa agatgtaaac acgttagtgg tggcttagat 63120
ctattactga atgagccctg tattcagaaa tagaaaattt gattaaacgc ttcatctaat 63180
gctaagacaa tttgggggca gaaattatat actctgttag aattctctaa tgtaagattt 63240
tttgttgttt tgtggatgcc aagactactg tagtaaacaa acattagaaa tccccctgtg 63300
gtttatcaga caaaatagta ccatttattt tatcctgttt tacatttttg ttgttgtttc 63360
atgacacatt tacatgtttt ttttttagta tctatatcct gaataactga ctacactcta 63420
atcattctta actcatttat gccagaggtt gcaaaatttt tttgtgaaaa atcatcagac 63480
cttggtgatg accttgagca gtaggatata aataactccc acatgcttaa cgttccagtg 63540
atggaacact aggcataaat gatttaagta tagcctactt aatatgcttt tcaaaatttt 63600
aattttctct aggttttgta gtggcattca gtggaattta tagcattaag ttactctatt 63660
gtgatggaaa tatgtcattt tgtgtattta taaaaagttg tttgcagctg ggtgcagtgg 63720
tgtgtgccta tagttccagc tcctcggaag ctggggcagg aggatcactt gagaccagga 63780
atttgaggcc acagtgccct agaatcatgc ctctgaatag ctactacact ccagcctggg 63840
caacaaacca agaccccatc tttaaccaaa aaaaaaaaaa aaaaaaagtt gccccaacta 63900
aaataataaa ctattaatta gcacagataa atcttgagat tacttttttg gggtttatta 63960
cttttaaata tctggtaagc ctccagattt ctatctttct ctcttctttc cccatctttt 64020
tattttgaag aatatgattc caatgtaaca tttatattat aaactgggtg aaaaggtttg 64080
gtttacattt atttgtggga aaacatttag cattttagtg tcggtaactt aattatgtat 64140
aataaaatat attaatggaa aagaataata aaaaatagga gcattttatc ttcaatgatt 64200
ttctttacat gatgttgtaa tattgttaaa aaatgccaaa tcaaagttat ttaatatttt 64260
tgggggaacc aagtaaaacg attctgttca aatttgtggg caagcaaaag ttaagggcta 64320
tgaaataagg gcacctttaa gttctttatt gctgagaagg aggaaagctg agatgggtga 64380
gagatgggga gggccacttg cctgaagagg ctggtgaaag gctgtcaggt taggtgagct 64440
ccacagttag aattaaagca acactaaatg tatacattgg ttgagcttaa agtttttgct 64500
gcctaaaaga taatttttct gtttttgatt ttccgatgtt tagtgtaaaa ataattagaa 64560
tggaaattta ctgaaatgaa ggttaaacta cgttttgcac agaggcatac tgctccctac 64620
ttcattcccc ctgccccatg ccacaaaagt tgaaaatagt gagccctgtt aaacaagatt 64680
tctaaaatat attgacttct tttgggaaat ggtcatattt atgaatacgt tgtactttta 64740
aagtgtttaa tttttctcta tatatttgta catctgttac ctgatttgaa acccctccct 64800
aacatgggta ttacatgaat tttcatttta aagattagga attgggaggt tagagataac 64860
acacaagctg actcagaacc atgctctttc cacttctcaa aacgttttat atgtgtgggt 64920
atgtttcctt ataagaatgt atgtgtccag gcgcagtggc tcatgcctgt aatcccagca 64980
ctttgggagg ctgaggcgag cagatcatga ggtcaggaga ttgagaccat cctggccaac 65040
atggtgaaac cccatctcta ctaagctggg catggtggcg cacgcctata gtcccagcta 65100
ctcaggaggc tgaggcagga gaattgcttg aacccgggag gcggaggtta cggtgagccg 65160
agatggcacc actgcactcc agcctggcga cagagcgaga ctccgtctca aaaaaaaaaa 65220
aaaaaaaagg aatgtataca tagatagttg tctaaagaga ctgatagtaa aatgttagcc 65280
atgcttatct caagtggtag gattttgatt tttttttwaa aatattttaa tctgggttgt 65340
ttttattttc taacgtgtca tttttgtaat cagaaaaagc aaaaactata cattgaatcc 65400
aaagaagtcc gatgaaagag tatttgaagg aaagttctgt gaccaagtca tattttctct 65460
gcagacacgt caagttcttg aggagctgac tgagttgcct gtgatggtgg aactagcaag 65520
tgacttcctg gacagaaaca caccagtctt tcgagatgat gtttgctttt tccttagtca 65580
atcaggtgtg ttaattttaa agacttaaaa ggaaggaaag ttattctttc taataattct 65640
agcatatctt ggcaaaagct gatatttaaa gataaactgg cattgcagat gacttgacga 65700
atacagattt attttaatgt tacataattc tttatgaatt agtaaaaatg aacacctttt 65760
gtgttcaaag agctggattt tcaatgacag agaaggaaga gagatcctga caagccgtat 65820
tacttaaagt tttataaatt tattaagtgg atgttttgta ttttatttaa aacaagtaat 65880
attgttgaaa gtgtggtcaa tttgtttttg ctcctaagaa acagcatatg ttaaaactgt 65940
tctgtgtgtt atggttggcc tactttttac acaggtgaga cagcagatac tttgatgggt 66000
cttcgttact gtaaggagag aggagcttta actgtgggga tcacaaacac agttggcagt 66060
tccatatcac gggagacaga ttgtggagtt catattaatg ctggtcctga gattggtgtg 66120
gccagtacaa aggtaaattc ttgactcatt tctctgatga ttatttaatc atagtgtcag 66180
tgaagcagac tagtctgtag actagtctgt atcttatttt tgttagcagt tatagaactc 66240
acacatttta tttttgttag cagttataga actcacacat tttactaatc attgtaatta 66300
ttgtaggact ttagggtcag atagataaaa gacttgtcat tctctccctc ttcctgatag 66360
agtttaaaag ggacttatgt atataatgta agtccatttt gaaaaggtct ctgctggcta 66420
tccttgtcta tcgcttactg ccctcctgct aggcacagta ggatacataa caagtatata 66480
acatcccctt cttttatgaa gtatagtctg gaatttgaaa agtaacaaat tagaaacatc 66540
cactttaacc atttttggaa tttttattta cctatttatg gtttctaata aataatgtaa 66600
aaatatacat actacctctg aaagtttgta aggaggaata cacctttggt ataaaatttg 66660
gcaactgcca ggcatggtgg ctcacgcctg taatcccagc actttgggag gctgaggcgg 66720
gcggatcatt tgagctcagg agttcaagac cagcctggcc aacatggtga atcccgtctc 66780
tactaaaaat acaaaaatta gccaggtgtg gtagcacgtg cctgtaatcc cagcatacgc 66840
gggaggctga ggcaagagaa tcacttgatc ctgggaggtg gaggttgcag tgaagcgaga 66900
ttgtgccact gcactccagt ctgggtgaca gagcaagagt ccatctaaaa aaaaaaaaaa 66960
aaaaaaaatt taaaatttgg caattaaaaa aaatttttta atgagtattg tatgacaata 67020
tctttctctt tagatattgc tctggggagg tttaaaggta ctgtcttgtg ttttgaaggc 67080
ctggtaagac tactttgctc tttggaattg gaatatgcat aaatttaggt ggctaataaa 67140
aataggaaat cttagaaagt tgtataaata caagagatgt tatccctcca caagtgtttt 67200
tttggggttt taggtttgtt tggttgttat ttagagacag ggtcttgttt tgtcacccag 67260
gctggggctg gagtgcagtg acaggaatca tagctccctg cagcctcaga ctcatgggct 67320
caagtgatct ctgcctcagc ttcctgagtg gctgggactg cagatgcacc aggctagttt 67380
tttttttttt ttaagatggg gtctcactat gttgtccaat gtgttacttt ttatgatttc 67440
acatttttgt tttctcaata tttttctact taagtttgat atttcttgct gattatctaa 67500
taagatgttg ggatattggt ggatttgagt ttaattaaag gattgtgaaa gacaatgtta 67560
atgtgtacat aactgcattt gaattctttt ccctcaaaga ttctcataga gaattttttg 67620
tagaaagttt gtgattctta tataaaaatt cttcttttct ttttcttttt cttttttttt 67680
tttttttttg gagacagact ctcactctgt tggccaggct ggagtgcagt ggcgtgatct 67740
cagctcactg caacccccgc ctcctgggtt caagcgattc tcctgcctca gcctcccagg 67800
tagctgggat tacaggcacc tgccaccacg cctggctaat ttttgtattt ttgatagcaa 67860
tggggtttca ccatgttggc caggcttgtc ttgaactcct gacctcaagt gatctgcctg 67920
cctcaacctc ccaaagtgct ggaattacag gcatgagcca cactgtacct ggcccccacc 67980
tttttttttt tttttggaga cagggtctct cctctttatc atccagagta catagagtgc 68040
agtggtgctc atggcttact gcagcctgga ccttcccagg ctcaggtgat cctcccacct 68100
tagcctcctg agtagctggg actacaggta caggccacta cccatgcctg gctaattttt 68160
gtattttttt gtagagacgg agttttacca tgttgcctag gccagtctcg aactcttggg 68220
ctcaaatgat ctgcctgctt tggcctccca aagtgctggg gttacaggca taaaaactct 68280
tgagtgagat ttttatttct tgggtatttc gatattgcta acactataat ttacagagtg 68340
ctgaaacttg aattttctcc atatggtaat taaaacgtgt tacatgtttg tgcttgggtt 68400
tccatcctgt ggctgaataa atgaccagcc acctttagta gcacttaagg atttgattgg 68460
gggattggaa tcccagaggc tctttattta taacagattg tgaaacaagg gctacaacgt 68520
ggtgtatgtg ggatatggga ttgtttggat ggatgccatt gacttaatct tttcataaaa 68580
tgtttctgga attgtgagct gccaagggaa atatatattt tacatttctc attcctttgt 68640
ttatgagaac tttaatttgc ctcaacattt tatgatgatg attttcaaat atacagcaga 68700
gttttaaaaa ttttacatac aggctgggtg cagtggctca caactgttat cctggcactt 68760
tgggaggctg aattgggagg atcacttgag gctaagagtt caagaccagc cgaggcatca 68820
gagtgagacc ttatctctat aaaaaataca aaaattagcg gggcatggtg gtgcatgcgt 68880
gtagtcccag ctactcagga ggctgaggca cgaggatccc ttgagcctga gagtttgagg 68940
ctgcagtgag ccatgatcac accactacac tctagcttgg atgatagagt gagaccctgt 69000
cttaaaaaaa aaaataaaaa ttttacatta gcgttggtat acccaccatc tagcttctac 69060
catagcatat tcaccaattt taagtgtaca gttttagtaa attcatttgg ctgtacaact 69120
gttatcacaa tccagtttta gaagatgatc acctgaaata ttcctttgtg tttctttgta 69180
gtcaatcctt actcctaccc tccagcctca tactcaggaa ctactgtttt ctcttgctgt 69240
attatggcat tttccagaaa atttttgtaa atggaattgt ataacacgtc ttgtgtgtct 69300
agcttctttc atttagcctg aagtttgttt tttaaataaa gccagttaaa tttagcagtg 69360
aggtattgta taccaacttt agtaacgcta atgttaatga gttctagtga cccactattg 69420
gactacccta gcctgaagtt tttgagattt gttcatgttg ttatttgtat cattagttct 69480
ttctttctgc aaatcttttt tttaaatatt tttattttga aataactata taggaagttg 69540
caaagatagt acagagaagt cttacatact ttttacccat taccccagtg gttaccacct 69600
atataagaaa aattagcatc tttttagtac agactttaat ttttttcaaa aataactctt 69660
aaaaaaattg agtaagtatg gcaatttagt atttcatttt tcttggattc taaagtaatt 69720
ttattcaaat gtcttagaca ttttgggctt agttacttac aataagtttt gggttattta 69780
gtcacagacc attccaggtg gcaaataaga gtttttatgt taatgggtat tgaaagaagt 69840
cgattattat tactattatt attattattt tgagatggag ttttgctctt gttgcccagg 69900
ctggagtgca gtggtgtgat ctctgctcac tgtaacttcc gccctccggt ttcaagtgat 69960
tctcctgcct cagcctctca agtagctggg attacaggta actgccacca cgcctggcca 70020
atttttgtat ttttagtaga gactgggtgt caccttgttg gccagtctgg tctcgaactc 70080
ctgacctcgt gatccacccg tcttggcctc ccaaagtgct gggattacag gcgtaagcca 70140
ccgcgcccag ccaaaagttg attattgatc ctaatccctg ggcccagtga tggagcacat 70200
agaagaattc tgtgatcttg cctgtaaatt ctcaactttg cctgaaaaac tgtcaggatt 70260
agagggatct tactgagttt ctcatagtat cagaccatag acaagttgat actactggag 70320
gaattgatgg gtataaatgg taggttcagc aatttttata tgttattgca ggtgtttaga 70380
atttcaccac agtgctgact tttgttgatt taaaaaaata aaaatgtaac tttgtttttg 70440
gctgaacaaa aagaaaaacc aagtttaaaa tttcagagtc agcattttcc tggtaaactc 70500
tttcaaacct cggtagattc tgaatgtagg gtatagctta tttttcctca taattggttt 70560
cctggtatgt attgatgaaa ttaaaaatat gaaattcaaa ttagaaatta aactgtaata 70620
gcaatgcaat ggaaaaacat ggattaaagt tgctccgttt aatatttgta cttaaaaact 70680
agtgttcaga tggtttcagt tcaaacaaat aaacactagt ttgtagaata acatttttag 70740
ttatgggcta caggaactgg aatactcatt atctgatcag tttggattgg aaacagttta 70800
agtattccag gggtccaaga tacctctggc ctggtagtat gttttgtgat taattgatta 70860
attgaaaagt aaaccacagt aggaagaagt agactggaag agtctggaat ttagaatata 70920
gatgtgctca ttagtctcgg aggcagagga ctccaaattc actttagtgt tatgggaaaa 70980
gattccagtc tgctggtgga atataatagg tgtacaggga ggcagttgtg gaggaccatg 71040
tgagcagctg gaggctggga agtccagcag gaggaaacag ggagtctcat ttaactattg 71100
ggatgttaag gagttaccag actgtgattt tattatagag ggagtctcat tatccacatc 71160
atgccaggaa atcactaatg gagtaatccc ttatcaagag aagagtaata gaaattcagc 71220
atataatccg cgcgcgcaca cacacacccc tcagcataaa tttcctaaag ctaaaattat 71280
atctaacact gtaactgaca acagcacaat aacctactga aagagatgta aataaaagcc 71340
tcaaatatct gaaacataaa aatgtttttc aaaataacta ttggattaaa aaaaatcaga 71400
actaccatta agaaagactt actagaggcc gggcgtggtg gctcatgctt gtaatcccag 71460
cactttgggc agatcacttg aggacaggag ttcaagacca gcctggccaa catagtgaaa 71520
ccccgtctct actaaaaaaa cacgagaaaa ttagccgggc atggtggcgg gcgcctgtaa 71580
tcccagctac ttggggtggc tgaagcagga gaatcacgcg aacccaggag gctgaggttg 71640
cagtgagcca agatcatgcc attgcaatcc agcctgggca acaagagcaa aactgtgtct 71700
caaaaaaaaa aaaaaaagaa aagaaaagaa agactagaaa aaagtaaaca ataaataata 71760
ggggtaaaaa tttagagtgt gtggccaaag tgataaatag agggaaatag cattaaattc 71820
ctagcacaaa ttgatgaaaa tgccatattt ttaaatggaa agattgtttt gtaaagaaat 71880
gacatatctt gggttagaat tagtgttcct tcaacttgca ctaaaattaa tttcaaacag 71940
gctaaaaagg aaaatgttaa aaaaataaaa aggaacagtg aaaacaaaag aagtaagaaa 72000
atttaataat acttagttta tgtaggatgt ggaagagtta tctgagtcta aaagtactac 72060
gtaaaagtta aaaaattatg tcagcaccaa tataaaaggt cagtccacga tgagaaaaaa 72120
tatttgagac ataacaataa ctaccttctt ttttttaatt ttagagaata gtattgtatt 72180
gaatacgttt tattcacaga aaaataaact ttaatctaca atgaatgcca gattatacag 72240
cagaaagcag ttttcttagt tttccacata gaaaggttct aagtgaaaaa aaccataaaa 72300
ttatattcag aaatatagta ctctgtctca aaacatttca catgattatt cacaatacta 72360
atacaattag atcagtcatt cagtcaggtt aaaatataac agtaatgaaa aaaatgcaaa 72420
atctaacata aattacatta aaacccttgt tacatcacac caaaaatgca aatttcttac 72480
taaatccaga aaaatggtaa catatatagt aatttaaggt attacattaa tggtacagaa 72540
taagaaagaa gtggtaaact ctgaaaatct gtaggcatat ctgcaaactt cagacttcaa 72600
agtagaatct gaccacccaa acattaatgt agcatttgtc taattttttt gttttgaaca 72660
ataactacct tcttaaaacc aatttgaata aagaaactca agttgaaaaa caggtgagga 72720
acaacaaagt cagttgtcaa aagagaaaat ataaatggtc aacaaacatg aaaaaaaagc 72780
ttagctttag gattcaagat atgtatgcta aaatagtagt gaaggttcat tgtcccgcag 72840
tcaaaatggt aaaagtttgc taaagagata attctcagta tttcacagaa cttgacaaaa 72900
caggcacatc tcacagtcac ataaagttag taagaatgaa aatagtcttg gcagtaggat 72960
tgtgagtttt gaaatacata caattctgta tcctaagaaa ctaattgtct tttagttcaa 73020
gctgtcatca ataaaattta tagtacgttt tgagcctgtg tgtcagggat tatacagaac 73080
tgaatgcgtt acatttgtct catttaattg tcattataat cttgtaagtg tcatgtgcat 73140
ttaacagatg gggtatctga ggcctaaaga gatgaaaact gctcaaggtt ataatgtaac 73200
ttgacagagt tcagttttag gattacactt gtactattat ttaggagtga aagcaagtta 73260
taaaattgta cctgctaatt aattttctta actgtgtaaa gaaaagaaaa acagtaaaaa 73320
ctttaaggca atattcacaa gtgttattaa tagcatatta ttaatgtaat tatttctaat 73380
aacagatgag attaaatatt atttctgttt acttttctac aactgtagtt ttcctttttt 73440
ttttttttaa tgcaaactta aaacataaaa ctgggattga ggaacaggca ataggcaaag 73500
gtggaaatca aagagcaatt aaaaaaaaaa atccagcaat accagtgcaa gtaccccaag 73560
gagagtttat caagcacttg ccttttgact tacaccaaaa actaaatgtg gttaggcaca 73620
tgctgatttg ctcatctttt ccttcctttc ttagggatat taggaatttt ataagcattc 73680
aatgggttat aaggtgtttg gcttttgtat ctaagaaata aaggttgagt catttgttca 73740
agattcagaa aaggagaata gtgatagatt tcccaagtac tggttcagtt cactgttact 73800
aagatagttt atttttgttt tttggagaca gggtctcact ctgtcccagg ctgcagtgct 73860
gtggtgcgat cctggttcac tgcaacctct gcctcccggg ctcaagtgat cctcctgagt 73920
agctgggacc acaggtgcac accaccacac ccagctaatt tttgtatttt ttttagagac 73980
agggtttcgc tatgttgccc aggctggtct cgaactccta agctcaagcg atccccctgc 74040
cctggccttc caaagtgctg agattacagg catgagccac catgcttggc cctaacgtag 74100
ttttaagaga tagagaatat atactgtaaa accaatggga attttatttt cagcttttta 74160
aaattaaaag ttctaaattc ttcagatgca gctgcaacta attgtcctgc ttttttgtga 74220
tgtttcaggc ttataccagc cagtttgtat cccttgtgat gtttgccctt atgatgtgtg 74280
atgatcggat ctccatgcaa gaaagacgca aagagatcat gcttggattg aaacggctgc 74340
ctggtacaaa gacactcata tattacactt ttgttgtcta agggagtggg taataggtaa 74400
aattctctta tccttgaagc tgtggcttgt agctatttag tcaataagat ctttctacgt 74460
ttgctccgat gtattaaaaa aatacccata ctgattgata gcacagagga atagaaacac 74520
tggtcttttg ttatttgctg ccaatatatt gttattttat ttgtttggtt tattgtcctt 74580
ttttgctaat attacttctt agatttgatt aaggaagtac tgagcatgga tgacgaaatt 74640
cagaaactag caacagaact ttatcatcag aagtcagttc tgataatggg acgaggctat 74700
cattatgcta cttgtcttga aggggcactg gtaagttttc tcagttctaa ttagtatcag 74760
tccattgacc tgcagacctg acacatagtc atacttttac attaaatgaa tgaaataggt 74820
agaacttttg aaagtgcttc tgtatttatg cattgtggtt tgtttacttt gagaaagtgc 74880
aacagagaac tctgttcaga agtgaaaatc aaaaagagta cattttaaca tgataaactt 74940
ggatttagca agtaacttgg gttaatttgt tcaaatatga ataaagatta agttctctag 75000
ataagaaatt taattgaggt caagctgggc acagtggctc acgtctataa tcccagcact 75060
ttgggaggac atggcaggta gatcaaactt gaagtcagaa gttcgagacc agcctggcca 75120
acgtggtgaa accccatctc tactaataat acaaaaacat tagctggatg tggtaatgca 75180
tgactataat cccagctact tgggaggcta aggcgggaag atcacttgaa cctaggaggt 75240
ggaggtggca gtgagccgag atcacaccac tgtactccag cctgggcgat cgaagaagac 75300
tctgtcttaa aaaaaaaaaa aaaaaaaagg gttaaccaga aatatgaata tgtttgtgat 75360
aatctaaaat ctttaaaaag tccttgtgga gctttaaaac ttccaattac atgttgataa 75420
tatagaaata gtgatctatt aacttgttag atatatttat agatcagtgg tcctttaata 75480
cttttggata gatagacagt ggcttgacat atcagatgct ttttataata tttacttaaa 75540
catggatttt tgaaaagtgg attgaagaca aatctggttc tttcctatta gaaaatcaaa 75600
gaaattactt atatgcactc tgaaggcatc cttgctggtg aattgaaaca tggccctctg 75660
gctttggtgg ataaattgat gcctgtgatc atgatcatca tgagagatca cacttatgcc 75720
aagtgtcaga atgctcttca gcaagtggtt gctcggcagg taagtcgggg gactgtgaga 75780
acaccttggg gatcaaagag gggagttacg ctagcttatt tgaatgactt acaaaacatg 75840
tttacacgtg ttaactcatt tactttggaa tacagccttt gaggtttaca tgtgaggaat 75900
cagatactta agagtttttt tttttttttt ttttgagatg gagtctctgt cacccaccct 75960
ggagtgcagt ggcacaatct tggctcactg caacctctgc ctcctgggtt caggcaattt 76020
tcctgcctca gcctcccaag tagctgggat tacaggcaca ctccaccacg cctggctaat 76080
tttgtatttt tggtagagat ggggtttcat gttggccagg ctggtgtcga actcctgacc 76140
tgaagtgatc cacctgcctc aaccccccaa agttctggga ttacaggcat gagccacccc 76200
gcctggccca gatacttaga gctttaagaa gaccaaggtc atagatctca tattgggcag 76260
aaccaagacc agaactgagg tcttggtctc cacatcctgt cttcttttag ttaacatatg 76320
ctgttccttt ttaatttaat acttctaaaa catttaaaaa tgtattttaa aatattttta 76380
aatatatatt tcagctggtt gcagtggcac atgactgtag tcccagctac tctggggact 76440
gaggcaggag gatcacttga gtccaggagt ttgaatacag cctgggtagc atagtgagac 76500
cctgtctcta aaacagtaaa taaaataaat taaaaaaaat tacacacacg cgatatattt 76560
caggggaaat ctaacatcta ggttttattt taatattata taattgagtt ttcttcagat 76620
cagttggctt tatatataaa ttccaaaaga tattattccc taagcacaat gtggtggtaa 76680
tgaacttgag ctttgaagtt aggcaaacct gcagtcaagt actaagcctg gtatttctta 76740
gttgcatgag tttaaacaaa ttactggatc ccataacgct tctgtttcct cgactataag 76800
taataacaat cagatttact acacaggaat ttaaagaagt ctgtccgtga ggcttcatat 76860
ggattatgca gtgcaatttt tgcacattcg taagctatag ccctgccttt gcccaccagt 76920
gatgttgtgt atgtgtgtga ttttctttcc taggggcggc ctgtggtaat ttgtgataag 76980
gaggatactg agaccattaa gaacacaaaa agaacgatca aggtgcccca ctcagtggac 77040
tgcttgcagg gcattctcag cgtgatccct ttacagttgc tggctttcca ccttgctgtg 77100
ctgagaggct atgatgtaag tcatctacca ctgcagaaat cttgggatgg ttttttacct 77160
ggatacattc tgattttttt ctcctaaatt tttaacaata gtgtttgaga aatctatcaa 77220
atatatatct gtcacctgtt atattttcat ggcccaattt gtaggttaca tcacaacatc 77280
ttcttaccca tagaacttga aggaaccttg gggttcacct ccaagattgt gactcacctt 77340
gggtagtctc cacctgtttt cttaatataa cctctatctc ttaacagggc agctattggc 77400
atttggcagg acaattcttt tttgtttgga actgtcccac acattgaaga ctttgtagca 77460
ttcctggttt ctcagccatt gtggcaacca aaacatagtg cttttgtttt tagtgtcccc 77520
tatgagggct actacttctg tagaggacca cagtagctct ttctgtgtga actggcacct 77580
ttagaatgct ttttcctaac caatttcagt ttttttcagg acacattatg tgattatatt 77640
ttctaatcta attctttgta gtctgtaata aagatggtta atgaatgtat tgttttctgt 77700
ttttataaac aaaaataatt tgcttatagt aaccaccccc ttccccagtc tatataatct 77760
ctcaaatctt gctttttttt ttttcttttt gcaggttgat ttcccacgga atcttgccaa 77820
atctgtgact gtagagtgag gaatatctat acaaaatgta cgaaactgta tgattaagca 77880
acacaagaca ccttttgtat ttaaaacctt gatttaaaat atcacccctt gaagcctttt 77940
tttagtaaat ccttatttat atatcagtta taattattcc actcaatatg tgatttttgt 78000
gaagttacct cttacatttt cccagtaatt tgtggaggac tttgaataat ggaatctata 78060
ttggaatctg tatcagaaag attctagcta ttattttctt taaagaatgc tgggtgttgc 78120
atttctggac cctccacttc aatctgagaa gacaatatgt ttctaaaaat tggtacttgt 78180
ttcaccatac ttcattcaga ccagtgaaag agtagtgcat ttaattggag tatctaaagc 78240
cagtggcagt gtatgctcat acttggacag ttagggaagg gtttgccaag ttttaagaga 78300
agatgtgatt tattttgaaa tttgtttctg ttttgttttt aaatcaaact gtaaaactta 78360
aaactgaaaa attttattgg taggatttat atctaagttt ggttagcctt agtttctcag 78420
acttgttgtc tattatctgt aggtggaaga aatttaggaa gcgaaatatt acagtagtgc 78480
attggtgggt ctcaatcctt aacatatttg cacaatttta tagcacaaac tttaaattca 78540
agctgctttg gacaactgac aatatgattt taaatttgaa gatgggatgt gtacatgttg 78600
ggtatcctac tactttgtgt tttcatctcc taaaagtgtt ttttatttcc ttgtatctgt 78660
agtcttttat tttttaaatg actgctgaat gacatatttt atcttgttct ttaaaatcac 78720
aacacagagc tgctattaaa ttaatattga tatattcagt attctcttca actttgtcac 78780
gaggaagaat ttcctgtagt taattttaac tttccttcat tacattgttg cataaaacta 78840
gtcccttagt gccagtttgg aagttacttg caattgtttg gaagatttgc aggtcgctga 78900
cctcatcatt tcactctaag tatatgtggt aggctaagct cagaaaaagg tatgtatgct 78960
ttacactgat aggcaccaaa tttagtattg tatcctaagt atttttcctc ttctgtattt 79020
tctgtgctct acccctgaaa tatatttagg aataaagaag atataaataa agtgatattg 79080
gggtatgttc agcttgtaag tgtcagaaat ggaagttgac aatttggatt aaaatattta 79140
aagtagaatg ttattatttg atacccccaa aattgtgagt aataatttct taatggagct 79200
tttctggcca gatcttcagg gctataggag agtgtgtttg tttttggtga agtccttctt 79260
tttcaaaggt ttttactttt aaattgtgaa gataagctat ttagcacaat tatttaagta 79320
agctgttttt tcctttcttt tctttctttt cttgttttaa cttctgggtg aggttaagat 79380
tttctaatag ttattgttgt tgccagagaa gcatagaatt ctgcttgtgt cttagggtta 79440
gagaaagatt tgttatattt tgaggtaatt tggaaggact ttcatacatg gtgactagaa 79500
acctgatctt tttaagaata aaatagggtc actatttaca ttatatataa tatatggcta 79560
ttatagctat attaatctac tttaattgtt tctaagatta ttttgtgtaa gtcagctagc 79620
gtgtgtatag tgtcatttct tatgttttgt atattaacgt tttacaaaca caatttgtgt 79680
gggtttgtag catttcttat agtttaaagt atgattcagc attctaagtt aaaactaata 79740
tgtgaagtca gtcattagtc tgcataatct ctgtctccct ctgtgtgtgt ctttctataa 79800
agcacatgtg tacacacaca cacacaaata tactgaaagc tagggtaagt tctaaactga 79860
atatcaaaaa ccaaaatcaa gaacaaagaa gtgatatttt ccaaacaaac atggattctc 79920
tgccgggtgc agtggctcag cctgtaatac cagcctccac tttgggagtc tgaggtggga 79980
gtattgcttg agctcaagag ttggagaaca gcctgggcaa catggtgaga cctggtcttt 80040
acaaaaattt ttttggccgg acgcagtggc tcacacctgt aatcccagca ctttgggagg 80100
ccgaggcggg ttgatcatga ggtcaagaga tcgagaccat cctggccagc atggtgaaac 80160
cccgtcttta ctaaaaatac aaaaattagc tgggagtggt ggcgtgcgcc tgtagtccca 80220
actacttggg aggctgaggc aggagaatcg cttgaaccca ggaggcggag gttgcagtga 80280
ggcgagatca cgccactaca ctccagcctg gcgacagagc aagactctct caaaaaaaaa 80340
aaaaaaaatt ttttttttaa atgggctggg catggtggct tgtgcctgta gtctcagcaa 80400
cttgggaggc ttaagtagta ggatcgcttg agcctgggag gttgaggctg cagtgagctg 80460
tgattgtgcc actgtgcttc agcttgagtg acagagtgag accctcttga ctcaaaacaa 80520
aaaacatggt ttctcctctc tctcctgtct tcttactctc tatcccattt gatgtagtga 80580
tttttaaatg cttttgtaag ttaattctta acacaaaaga gacattgtaa tgaggcacac 80640
cactaaagtg agcatgccca attaaaacca gtgtaatata ggataagaaa atctgatttt 80700
tcaaaaaaga tactctacat aaagaatcct tcatataaaa agttctttct tgtagtacat 80760
ttaaagtttt aattcactca tgtataactg agagttcctt tgagcccttt ttaggcaggg 80820
aggcatgtct gtcatctagc gtgtggccca gtaagtgatt attacattgg aatcagtttt 80880
tcagtctttt aaaataaatt ctatgccata agaataaaag ataaagagca aaattaatgt 80940
taactatttt tagcttatta taactatgtc aacaagtgtt tattaatacc tattatggga 81000
aagtcactgt ggttggcatt gaaaattaca tcatctttaa agcagtattt gtccccagat 81060
ggactcatca ctagcaaaga ctaggttcat tggaaggcat agggtgagag aatgggaaga 81120
tggagtggag gcgggttgtt aaagtgctgt cagtgagtga ttttgtctac ttgaataatg 81180
gtccatgttt gggggcatat tgtgtttcat aagaagtgaa aggtatttgc aaagtaagct 81240
acaaatgacc cataaatctg ttaacaacag tccttaatat gcaaagatga aaaacaagca 81300
ttactgctac ccaaagggaa ctggtgcttg gtgatgtgca gatggggctg ttggttaaga 81360
gagctattac aggttttctc tcttaggttt cataggaggt agttactgag atgagattgt 81420
tttatctttt tgaatacaga tctcttgtct tgagttagtt ctgaggatgg gagtaataaa 81480
ggagtttttt gtttttttgt ttgtttgttt gttttggctc cttagtaata ctcctctgac 81540
atttatttct attattcttc aaagaaagga aaccaactga aatgtttgct ttaacaaaca 81600
ttttaataag ttctctgggt ttttttttcc ccttttaaaa aaattagcat ataccatagc 81660
aataaaagaa ctaatgttaa ctattgtatg ctacaactta agtgattttt ctaaagaagc 81720
acaatgtcat tgaaagtatt attgaaaagg atcatagtca cattgaattt gtgaaggcca 81780
aagaaattga agggagtgat attttcattt tatgatattc acatatttag taaattttgt 81840
gtacaagaat accaggcaga gtgttttacc catggaaaca ggtttcagat tactttgttt 81900
ttactgttag agtctcaagt ttagaaatgc taacacttaa atcagttttt ttctcactat 81960
acttgaagat tgttaatatt ttgatatctt cctagcttga tgaatttaaa catatcttca 82020
gatctgtgac agtgacagcc aataggactg ataatattag cttcaaacca ataatatcca 82080
gggttaaaat aaaaatcata gtgaaagtac gattgtaaaa ttatgctata ttaactttta 82140
agtctgtaat aacttgacat caaaatgtta tgtaattacc ataaataatg gctagcgaga 82200
acatctttgg aaattctcaa attacctttc ttactacact gtttgcagaa tgaatgtaga 82260
aatgatcctg ttagctttct gaatgttctg tggttgaatg tgtttttgct taaataaagc 82320
ttttggtatt tgtttaaatt acacttcttg agaagtggaa attttaggat catctttgct 82380
ttgtttcagt tttgtgattt ttgaaatgaa tgtttagttt actgagccag ttggtcattt 82440
cttcctcatg tcgttaagtc cagtgagtaa gcctgaactg tgaataaatt accaaaaact 82500
tgcttagaat ttcattttga agcaatttgc taatatttga agtgtataca catttgtagt 82560
tatgttaaaa attgtattgt actaagaatg taatcaatgt ctactttagt tgtaaacatt 82620
tctgatgtca aaactttatt cattactgtt gattttaaga ataagaaatc actgcctaaa 82680
tattaccaaa agccactgtc tctacccgaa cttcccagtt tgggaaagaa tcgttagata 82740
aaacaaaggc tctgcccttt ctgataccaa actccacaga tactttctca catcttttaa 82800
aacattttgc aataacatat tgtttatagg aagtttacag ggtatgcaat gattaaaact 82860
tttaagtgaa ttgatagttg caaaagaaag gataatattt aaggtcagtg agtagcaaga 82920
caatctaaag tttctgtaat atctggctct ctgttaatta tagagcaaag tttcccttac 82980
agaatccttt tatgaacagc aagctagagt ctatccctag tggttatagc acctgctgcg 83040
tttttcagga gacagttagg ccagggtgat ttgaatggat agatgtgctg ttttgcctgc 83100
ttgtagaatt cagcccagtc tttggtctct ctctctctct ccctcctcca cctctccctc 83160
tctcttcttc tgcaccagag cctaaggctg cgccaccaag atgcgtcatt ttttccagag 83220
gcttcttttt tttttttttg agatggagtt ttgctctgtt gcccaggctg gcatgcagtg 83280
ctgcaatctt ggctgactgc aacttccacc tcccgtgttc acacgagtct tttgcctcag 83340
cctctggatt agctgggatt acaggcacgt gccaccatgc ctagctaatt tttgtgtttt 83400
tagtagagac ggggtttcac catgttggcc aggctagtct caaactcctg accttaagtg 83460
atctgcccgc cttggcctcc caaagtgctg ggattacagg catgagtcac cgtgtcctgc 83520
ccagacatat caaatttgac aggtattgta taccctttgg atctttagga attaattttt 83580
gcctctgtca ctcagctttg tatattttga aatggagata agtataggga ggtcttggaa 83640
ggaaaattgc cagaattccc aaaccatgta acactcattg agaattccag atccattata 83700
tctaaagggc aagtgaagga aacagtattg tgaactgggt ataactcctt ggttcttaac 83760
tagtacattc ttaatctgtg agacccaaag gttgataaac aataatttaa gattgtacaa 83820
gtactctaaa cgtctgcaaa ggtctagatg ttatcagtat cactagtttt tatttctgcc 83880
agtagctccc ttttaggtta cattgttgtc ctctttccag tgtggcatct gtcattggtt 83940
tttcactatg gcaagttcat taaaaagctt gctccattgt tatcttcaag taatgcccat 84000
aaggagatgg aagatatctg agacaattaa ggctttagct tctaggcaag agaaataacg 84060
ttgcattaaa tttcaagttt ctttctgcta gacttgaatg tgtctagcca ctctaattta 84120
tgggggcttt tggttttttc ctattgtact ttgtatgtag aattgttttg aaatatcaag 84180
catatttact ttgaatttga actctttctt aattttgtat ttatcctttg aataaaatgt 84240
aaatccaata tttattatta atttactttc attgctgcta cgtagaaacc taggaagtgt 84300
tgggaatctt tgtaggattt ctgtcttttg ttcttggttg ttagcttgga cccatgtggc 84360
attactaaag tttagagcat ttctttgttt gaaaaaaact aatttagaaa ctttttcata 84420
tatgtagtct ttttttggtg cttgaagtgg taaaaataag ctggcctctg aatacagaat 84480
tgactttgct gacatgacac tgggaattta aatgatttct gtcttcccag cagggacaaa 84540
tttgtataaa ttagtttgtg cattcctagt tctattagaa gatagggctg attattatta 84600
ttattatttt gagaaagggt ctctcccagt tgcctaggct ggaaggcagt ggcatgatca 84660
tagctcaatg cagccttgac ctcctaggct caaggtgtcc ttccaactca gccttccaag 84720
ttgttgggac cacaggtatg ctctagtaca tgcagctaat tttttattag tacagaatat 84780
tcagcagaca ttgtccagca cagttcaccc tttgcaacac acatctagac tcacccttga 84840
actcatgttt aaagttccaa agaaaaacat ggtgaaaccc catctctact aaaaatacaa 84900
aaaattagcc gggcgtggtg gcaggcccct gtagccccag ctactcggga ggctgaggca 84960
ggagaatggc atgaatctgg gaggcggagc ttgcagtgag tggagatcgc gccactgcac 85020
tccagcctgg gcgacagtga gactccgact caaaaaaaag actatcatga ttctgcctgc 85080
catggatcag ctatcccttt tgaaatgaag acacgctcac cctcttccca agaagaggag 85140
ataagaagtt acacaaatta cttggtccat ttctgtgtgg tattattcct cttgcttaat 85200
cacaacctcc cttgatataa aagtcttata cacagtcatc ccctcttgtc tacaagggat 85260
atattccaag acccccagtg gatacctgaa accacagata gtaccaatcc ctatttatat 85320
ttatactggt tttttttgtt tttttttttg atctgataac cggcatagct actaagtgat 85380
taatggacag gtagtgtata agggtagaga caccagacat aggggtgttt catgtcctgg 85440
gtgggacagc tcaaggtttc atcatgctac tcagatggca tgcaatttaa aacttattaa 85500
ttgaagccat gcttgtaatc ccctaggact ttgggaggcc aaggcaggag aattacactc 85560
ccataagtat tccaagacat aaaagctcaa aatccaaaat gatacacatg ggagataaga 85620
tactacaaat gatagaatca aatttgccaa cactgcaaac attttaggca gtcctcccgc 85680
ctcagcctcc tgaatagctg ggactacagg tgcatgccac cacacctgat ttttttcctt 85740
tatgtagaga tggggtcttg ctatgtttgc ctaggctggt ttcaaactcc tggcctcatg 85800
caattctccc ccattcaaaa gaagagagac tctctagaat ctctttatct gactaaggaa 85860
actactttcc aaaaaaatgc aattgtctta agaccccctt ttctaggaat cttataacca 85920
ggaaagataa accactggag aagacaaaga gattaaaagt tgtcatcatg cccagataga 85980
cttttcatct gttcttctga gaacagcttt gagagtttac ttgaaagact atttgcataa 86040
ggcaaccttt gttcacaatg tagttctacc cctcaccttc ctgtaatttg ctgatcatat 86100
tcagttttct aagataatca attataagat aatgtctgcc tcccaggttg attcattttc 86160
cctagaaatt atttactacc cttccaaaac agctccccac cccattttcc tcttccttat 86220
aaagagggtg tttgaatttc agccatgtgt ccttgctttg agtctcatat ttgtgggatt 86280
cccatgtcca tgtgcatatg aaatttgtgt gccttttctc ctgttaatct gtcatagctc 86340
atttcagcaa accttcagag aggaaagaag gaaagcttta cttccatctc tgcaatctgt 86400
agattactta taatacctaa tacagccagg catagtggct cacacctgca accccagtgc 86460
tttgggaggc tgaggcagga ggattgttgg agtccaggag cttgagacta gcctaggcaa 86520
tgtaatgaga caccatctct agaaaaataa aaataaaaaa attagccagg catggtggct 86580
tgtgcctgta gtcctaccta ctcaggaggc tgagatagga gaattacttg agcctaggag 86640
ttcaaggttg cagtgagcta tgattgtgtc attgcactcc agcctggacg acagaacaag 86700
accatgtctc taaacaaaac agaccaccca atataatgta aatgctgtgt aaatagttgt 86760
attgtatttt aaaattggta ttttttattg ttgtaatttt atatatcttt ttaaacaaat 86820
attttggatc catggttggt tgagtccatg gatgtagaac ccatgggtac aaagggctga 86880
ctgtatcaga agcagtaaga ggaatcaaat gtatgacaaa ggaataagac aataaagaag 86940
gacaaggcag atttcaggaa ggactgaaaa tgaaatataa caattgaaat tagaatggat 87000
aaacagatta ggcccagctg aagagagaat tagtgaacaa aaagataggt ctgaagaaat 87060
aatccagaat gcagcattta ctatagagag tgatagaaaa tgagaaaagt caaagcttct 87120
tgacttttta gagaattttc tagaccagat taaaggcaaa tcctagaatt tagagtgctt 87180
cacacatctt aagctgataa aaggaaattg cattcttaaa cacattgttt tgaaactgaa 87240
cacaaaagat gaagagatct aaaaagccag agagataaga ctacccacaa aaagtcaata 87300
attagactga cagcttattt cccaactgca ccagtggaaa caaggacaat ggaactattt 87360
caaagtgctg aaaaaataat tcatgaaact gaatttgaag actgatggga aaaatgtgct 87420
atctgatgaa taaaaactgg gactctcact aaaatcttcc aaagataaat gctaaggtga 87480
tggaaaatga tcccacaaag gcttaagata caacataatg aatggtggct gggtgtggtg 87540
gcacatacct gtagtcccag ttactcagga ggctgaggca gcaggatcac ttaagccaag 87600
gagttcaagg ctgtagtgga ctatgatcat gcctgtgaat agccactgca ctccagcctg 87660
agcaacatag caagatccca tctctttaaa aaataaaaaa gaatggtgag cgaaacaaaa 87720
caaaacactt ttaagtgagg gtaaatctaa agcactaacg gtctaaaaca gtaatatttt 87780
aggagctata aaacaatcca taatgaacta aaatgctaga caataatatt gtaacttagg 87840
agtagatgag cagggttaaa acataaggct ctttttatga tgtggcaaga gggtaaagat 87900
aacttctgac tttgtgaagt taaatatgga tatttaaact tttatgaaaa ctaagattag 87960
agaatatagt tcccaaagta acagaagaaa aaaaatggaa tttaggaaat ccaagtacat 88020
tggtaataat cacaacaagt atagaagaca tctaaaacac agggacacag aaaagttgaa 88080
tgtgaaaggc tggaaaaagg tacaccaggc aaatcccaac ccaaggaaag atggcaagct 88140
acatgaatat gacaagatag actgtaagtg aaaatgactt atttgaaaat agtgcgtctt 88200
ccatggaaaa gtttggtagc ttctcaaaaa gttaaacatg gaattaccat acgaaccagc 88260
agttccactc ctaggtatat acccaataga actgaaaaca gaaactcagg tacttgtaca 88320
ccaatgttta tatcaggatt acttataaca gccaaaaggc ggaaacaacc caagtgtcca 88380
tcaacgaatg aataaaggaa atgtgatata tacacacaat ggaatactac tgagtcataa 88440
agaggaatga agtcctgata cactccaaat catagctgaa ccttgaaaac ataagcaaaa 88500
taagccagac attaacgaac aaatattata tgattccatt tatataaaat atctacaata 88560
ggcaaattca tagagacaga aagtaaatta gagattacca gaggcttgaa agaggaaaaa 88620
atggggagtt attgcttaat agatacagag tttccatttt gggtgatgaa aacttttgaa 88680
gatggatagt ggtgatcatt gcacaacatt gtgaatgtaa ttagtgccac tggattgtac 88740
actgaagaat ggttaaaatg gcaaatttta tgttatatgt attttaccac aataaaaaca 88800
gtttaagact ggatgtagtg gctcgtgcct gtaatccaag cactttggga tgctgaagct 88860
ggaggatcac ttgagctcag gagtttatac cagcctgggc cacatagtga gttcctgtgt 88920
ctacaaaaca aacaaaaaac caaaaccctt aactgggtgt ggtggtgcat ctgtggtccc 88980
agctactcag gaggctgagg tagaaggatc acttgtgcca ggagcttgag tctacagtga 89040
gctatgattg taccactgca ctccagcctg ggtaacagag caagaccctg tcccaaaaaa 89100
aagtttaaaa aagcattact agagacaaaa attgttacca tcaaatgata aaagtttcaa 89160
ttcaacaggt attgcattta acacttttgc caaatggtga ataaatcttt gtctctcatt 89220
atggttttaa tttatatttc ctttttttct ttttttggag atggagtctt gctctgtcac 89280
ccaggctgga gtgcagtggc gccatctcgg ctcactgcaa cctctgcctc ccgggttcaa 89340
gcgattctct tgcctcagcc tcccgagtag ctgagactac aggtgagcgc caccacgccc 89400
agctgatagt ttgtattttt agtagagacg gggtttcacc attttagcaa ggatggtctc 89460
gatctcctga cctcatgatc cgcccacctc agcctcccaa agtgctggga ttacaggcgt 89520
gagccactgt gcctggccta tatttccttg attattaatg atttgagcat cttttcatat 89580
gtgtattgac tgcttttttt ggtgatgaat ctgatcaaat ctttttaaaa tcagttttta 89640
aaaattggat gatttattgt ttacttttta acttggaggg gttttttaca tattctgaat 89700
tctagttctt tgttgtgtat tgcaaatatg ttctcccctt tgtgacctgt cttttcattc 89760
tctttttggt attgtataga aattcttaac tttaatgtag tcaaattgat tacttatttt 89820
ccctgatatt gtgcttttat gtaacttgtt caaggaatcc ttcctaggtc ttaaacatat 89880
cctcctgtat tgttttctaa aacccttaaa gcttttcctt tcatccttgg atttttagtt 89940
cacctgaaat ggattttaag tttgatatga tgtaggaatt cattttaact tttttttttt 90000
ttttttggcc gggcatggtg gctcatgcct gtaatcccag cactttagga ggccgaggtg 90060
gatagatctc ttgacgtcag gagttcgaga ccagcctggc caacattaca aaatcccgtc 90120
tgcattaaaa atacaaaaat tagccaggca tagtggcggg cgcctgtaat cctggctact 90180
cgggaggctt aggcatgaga atcgcttgaa cctgggaggc agaggttgca gtgagccaag 90240
gtcacgccat tgcactccaa cctgggtgat agagccagtc agtctcaaaa agaaaaaaaa 90300
caaaaacaac aacaaaaaaa acactttttt ttttaatgaa gatatcctat ttcccagcat 90360
gtttatcaaa aatcccatcc tttcccaatt tctctgcaac gtcacctctc atatcaagtg 90420
ttcatataag tgggtttgtt tccatgggct atttgtctct gtaccaattc aacactgtct 90480
gcattatgta gctttataag aagtcttgat atctggtagg gcaaccctcc ttttctcact 90540
gtttttcttc aagaatatct tggctattct ttttcttttc aatttatata aggattttag 90600
aagcagcttg tcaagttaca caactgctga ggtttttatt ggaattgcct taatattata 90660
gatgaatatg gggagaattg gcagttttac aatgttgagc cttccaggct atgcatgtgg 90720
tttgagcaca tctctgctta tttgtgtctc attaatgact ctacatttct ataattttta 90780
tccatagagt ctgttgtaga ctgaataatg acttccaaag atatcaggtc ctaaccctgg 90840
gaccttgtaa atgttacctt atatggaaaa gagtatttgc agatgtgatt gagttaagga 90900
tcttgggatg cagaggtttt cctggattat ttgggtgggg cctgtaggta tcattgtaag 90960
agggaggcag aaggagattt gacacaaaga ggagaaggca cttaaccaca gaggtagaaa 91020
ctggagggat gcagccacaa gccaaggaat gccagcagcc accagaagct ggaagggaca 91080
agaaagattt ttcccataga gctgccatac cagcatccac tcagtcatac tgacttcgga 91140
cttctggtct ccagaacaac tgtgaaagga taaatctctg ttgtttttag gtcaccaagt 91200
tagtggtaac ttgtttcagc agccacagga aacaattcag aggctttgca catctttcgt 91260
tatatttatt cctaggtatt tgatattttc tgttgttctt aaaatgatat atttttaaaa 91320
gctgtttgtt gctgttatgg aaaatccagt gaaatttgct gtgttgattt ttgtttgctg 91380
caactttgct aaacttactt gttaattcta atggattttt ctaggtatat actcatatta 91440
cctgtgaata acagcacgtt tgtttctttt cttctaatct ttacgtattt ttaaaaaatt 91500
gctctacagt gctgcctagg gcatccatta cagtttgaac tgaaatggta atggaaacat 91560
ctttgttttg tccctgatct caaaggaaag gtttcaacat tttatcatta tatttactgt 91620
agacttttgt agatactctc tatcaggtta agaacttttt tcttcttctt cttggtttct 91680
aagaggtagg gggttttttg tttgttgctt ttttgctttt gtttttgagc agggtcttgc 91740
tctgtcactc aggctggagt gcagtggcgt gatcctggct cactgcaacc tccacctccc 91800
tggttcaagc gattctcatg cctcagcctc ccaagtacct gtgatttcag gtgcctgcca 91860
ccacgcctgg ctaatttttt tgtattttta gtagagacag ggtttcacca tgttggccag 91920
gctggttttg aactcctgag ctcaggcagt ctacccgcct cggcctccca gagtgctagg 91980
attacaggtg tgagccacca cgcctggccg aaacatcatc tttagatctc atagttttat 92040
tgtgtccatt gtacaacctc aggcaacagt gtgcgggagc cacgactctg tcttcctgga 92100
gggggaaatg ttcattgaaa tttgttcagg aaccattttc tctttatata tgtggacaga 92160
gccactgaaa tctattgttt gaaccttggt atgggaggga gcactgtgtg ctcacgcaga 92220
cctggatctc agtgaaataa taggggcaaa aggaccttgc atatagttgc ttatatattt 92280
ataacacttt gaagaaagta atgatgtaaa agtccagatt tatgctaata ttttgtttag 92340
cttctctttc cctgctctga ggattggtgc tagagctaaa gagagagaca tcattttctc 92400
agtgttatgt ttggattgaa acaccaggat aagccagttt gcccttatct gaaagtcatt 92460
ttgattcccg tctaccctgg gttgagttag aaatgtgtga aatgaatcct gagttgaggt 92520
gtgaaaaagc aaatgaagat cttacacaca tattcattga aagaatgtct ataaaagggc 92580
ttttaatgct gcaatatagg taacatgtgt aatacctgta acatgtggaa ggtaaaactc 92640
atcagaaatg tgaatgggaa gtagaaaatc aagagacaga gacagcatta tttattctct 92700
attaaatgaa gaactttaaa aacgttgaaa agtaagcaaa actatggcca gccaagtaag 92760
agaagcagag aaataccaaa actgaccaaa ctcaataaat aactttaact tggcttattg 92820
caacatcaca gtatctctgc aggtctggtt ccatatcagg ctgtttccct aatgtatctc 92880
taggagaaca tttcaagtca aagacatact ttatgctcag ccataaatct catgctttat 92940
acgcttgaaa ataataaaag ttctagagtc gagttaattt cacttctttc ttttatatta 93000
ttaatgctcc catccttttg gagattggaa tgtggaatgc aatgtggcaa atattaaaaa 93060
gtgggaaaag atgtaggaaa ataatctgat gtcaattttc ttttcccttg gagtggagca 93120
atcctttccc ccagagctca ggcccagctt ggcttctcgg cagcctcagg cggccacacg 93180
gagagggtgg ctctcccacc tgccttcttg aatgggctct ctcggatgga gaggttggag 93240
aagggacccc acttggggct aagtggatac agatgtgctt ggacatgtcg gaatggggcg 93300
gcctggccac ccaaaagact tcttgtgggg agggcctgag gagcttcctg cagggcagaa 93360
atgatgagtt tgccctcagc cacaggagga                                  93390
<210> 23
<211> 2688
<212> DNA
<213> Homo sapiens
<220>
<221> variation
<222> (2251)
<223> Description of variation: single nucleotide polymorphism involvingreplacement of (C) and (T)
<400> 23
gtgagggctc tccactggac tgggccagct ctctcctgct tttccccatg catgcccacc 60
tcaccactgt ctgccaatac cagtgatgga tggtctggcc agtgagtggc tgtgaccaca 120
caccctcccc cgggccccct gtggggagtg cacacacttg gaaaggagct ggtcagcccg 180
cagctgtccc acacagctct ttggtggggc ccagggaccc acactgctgt gagcagcacc 240
agatcctagc ctggagctca ggggaggtac tcctggtgga catccctggg gcagggtttc 300
cccagtttct gcggccaagc agctccgatg ggaactacct ggagttaggt caggtctcat 360
agggcagggg cacagctttc cataagactg cccttgattc aggcacctgt tgcaagccag 420
gggtccaccc acacatctga gcaactgact atgaatccaa ggattcccac tctcccctga 480
agttcagtaa ttttctagaa cgacccatag aactcaggag atgactatat gattacagtt 540
ttattataaa agatataaat cacagccaac ccaaaagaag agacccctag tttgagggcc 600
ccagatgtga agcttgtgtc ctcaggatgt gtcaccctcc cagcacgtca ctgtgtgtcg 660
cccgggagct cccctgagct gctagctcca gtgtccagag tttgtattgt ggttttatta 720
agtaggcagg atggagtgaa ccattggcca tgtgatcgaa ctcagtcgcc agccccactt 780
ttgtccttgg aggttgggag gtcagactga caggctcatg tctcaaagcc ccaaccttct 840
aatcatgtgg ctggcctttc tagcagggcc agacgccatc ctggaactat ctacaggccc 900
accacgagtc gtcaccttag cataaagtca ggtatagtcc aagggacctc ccataaataa 960
caaagatgct tttgtcacat gggaaagtcc agaagccagg agctcccttc ctggaaccgg 1020
ccacaaagac caaccaaatg ctttgtacac agcagctgcc ctgaggtagg agggcagagt 1080
tcatgaagtt tcggggaggt gaaatccaat gaggtgcccc atccagatgt tgccacctgg 1140
ctcagcacag aggtcagagt gagggtataa aacacaatgg catcatttcc ccacttaaaa 1200
ccctcccata cctgcctgtc aagccacaga gacccacagt cctgcgttat ctggcccttt 1260
cctcctgttt cagtgagttc caggcactcc agccttcctt ctgcgtccca ctctcattgc 1320
gcccgcgccc gcctccgggc ctttgcgctg gccgctcctg ctgtctggaa tgcccttccc 1380
acagaatgct ccgccgaggg ttgtcccctc atcatttagg gttcagtcca gatgtctcct 1440
gtttttgaga gagctttgga gacctcacca gtctcccaat gacattatcc tgttttctag 1500
ccttggtggc atttctttgg aattcatttt tttttttttt tgtgacggag tctggctctg 1560
tcgcccaggc tggagtgcag tggcgcaatc tcggctcact gcaagctccg cctcccaggt 1620
tcacgccatt ctcctgcctc agcctcccga gtagctggga ctacaggcgc ccgccaccgc 1680
gcccggctca ttttttgtat ttttagtaga gacggggttt caccgtgtta gccaggatgg 1740
tctcgatctc ctgacctcgt gatccgcccg cctcagcctc ccaaagtgtt gggattacag 1800
gcgtgagcca ccacgcccgg cctggaattc atctttattt cttggtttgc ttgtctaggt 1860
ttttgttttc taccactaga ctatgagccc cgctagagtt aggagtgagt ctgccccgct 1920
ctcggcaagg cacaaatggg tgccaaatga tgcagcagga tggcaatctc cttaccaggg 1980
aaggggaaga aacccccaaa aagcatcaga cactttatcc tttccaagca tttgtgtccc 2040
acacatacca cctcacccat gactccagca aatgcaaaag aggactgttc tcatcacagt 2100
aatgtagctt ccagatactc tgtatgcatc agggatagct tctttcagag agggtctatt 2160
ttatgatgct atttctctgc tctagggtcg ccccattata ctgtgctcca aggacgatac 2220
tgaaagttcc aagtttgcgt ataagacaat ygagctgccc cacactgtgg actgcctcca 2280
gggcatcctg agcgtgattc cgctgcagct gctgtccttc cacctggctg ttctccgagg 2340
atatgacgtg cgtctaaaaa ctgcacctaa cagcagagag gagagacata accccagagt 2400
tcctttctgt tctttaaata cttggagtaa atagtcatag aataaataat tttatttaaa 2460
gtagctttct tttttttttt tttgagattg agtctcgctc tgtcgcccag gctggagggc 2520
agtggcacaa cctcggctca ctgcaagctc cacctcctgg gttcaagcga ttctcctgcc 2580
tcagcctccc gagtagctgg gactacaagc acccgccacc atgcctggct aattttttgt 2640
attttttgta gagacggggt ttcaccgtgt tagccaggat gaccttga              2688
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 24
atgctatttc tctgctctag                                             20
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence:primer
<400> 25
ttaggtgcag tttttagacg                                             20

【0150】
Figure 2004000115
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a method for determining the risk of developing diabetes. More specifically, the present invention relates to a method for determining a potential risk of developing diabetes by detecting a novel gene polymorphism associated with the development of diabetes from a sample containing human genomic DNA.
[0002]
[Prior art]
Diabetes has been increasing in the number of patients in recent years and is attracting attention as one of adult diseases. Diabetes includes insulin-dependent type 1 diabetes and non-dependent type 2 diabetes. Among them, type 2 diabetes (non-insulin-dependent diabetes mellitus, NIDDM) is a type of diabetes that is common in Japanese and is detected early. Early treatment is important in terms of its prognosis.
[0003]
However, the causes of type 2 diabetes are diverse and little is known about the possible causes. Causes of insufficient insulin action in type 2 diabetes include abnormalities in the insulin sensitivity mechanism and decreased insulin secretion. In Europe and the United States, the former, that is, insulin resistance is the main cause of type 2 diabetes, but in Japan, insulin secretion deficiency is often the main cause.
[0004]
On the other hand, diabetes develops retinopathy, neuropathy, arteriosclerosis or nephropathy as its complications. In particular, when a diabetic suffers from nephropathy, the renal disorder causes hypertension and hyperlipidemia to worsen, further worsening the prognosis of the patient. Therefore, prevention and treatment of nephropathy are particularly important problems among diabetic complications.
[0005]
In recent years, with the rapid progress of molecular biology, knowledge on the mechanism of insulin action has been accumulated. Beginning to elucidate the structure of the insulin receptor, the signal transduction mechanism after the receptor has also been gradually elucidated. Under these circumstances, a therapeutic agent for diabetes [α-glycosidase inhibitor: Acarbose, ΔVoglibose (for example, see Non-Patent Documents 1 to 6), an insulin sensitizer: Troglitazone, Pioglitazone (for example, see Non-Patent Documents 7 to 11)] has also appeared and been released. On the other hand, in the United States, a biguanide agent was approved as a therapeutic agent for diabetes in 1996, and has been attracting attention because it can be used for daily medical treatment of diabetes (for example, see Non-Patent Documents 12 and 13). All of these drugs, unlike sulfonylurea (SU) drugs which have been widely used in daily medical practice since ancient times, have an action of lowering blood glucose without promoting insulin secretion from pancreatic β cells.
[0006]
At present, the following nine items are considered as an action mechanism of a therapeutic drug for diabetes having a function of improving insulin resistance. Activation of insulin receptor kinase, promotion of transfer of sugar transporter to cell membrane, action of rate-limiting enzyme of glucose metabolism and correction of abnormal glucose metabolism, suppression of hepatic gluconeogenesis, promotion of hepatic glucose uptake, enhancement of hepatic glycogen production, It is a decrease in blood lipid, a decrease in hepatic gluconeogenesis due to a decrease in blood lipid, and an increase in insulin sensitivity due to a decrease in blood lipid.
[0007]
By the way, glutamine: fructose-6-phosphate amide transferase (hereinafter referred to as “GFAT”) catalyzes the rate-limiting reaction of fructose-6-phosphate to glucosamine-6-phosphate in the hexosamine biosynthesis pathway. It is an important enzyme. It is thought that a drug that inhibits GFAT activity promotes the uptake of glucose into cells and can lower the blood glucose level, and is therefore expected to be developed as a therapeutic agent for diabetes. The mechanism of action of this GFAT inhibitor is explained as follows.
[0008]
The hexosamine biosynthesis pathway produces UDP-N-acetylglucosamine, CMP-N-acetylneuraminic acid, and the like in the metabolic process, and these flow as crude materials such as saccharification modification of proteins and proteoglycans or gangliosides. It is considered.
[0009]
On the other hand, when insulin binds to a receptor on the cell surface, an intracellular signal is activated, and a sugar transporter (GLUT4 or the like) pooled in the cell is transferred to the membrane surface, and glucose uptake is promoted. Incorporated glucose is metabolized by the glycolysis system and accumulates ATP as an energy source, but when incorporated in excess, fructose-6-phosphate, a glucose metabolite, will flow to the hexosamine biosynthesis pathway. . The flowing fructose-6-phosphate is converted to glucosamine-6-phosphate by GFAT. Although the detailed mechanism is unknown, various circumstantial evidences have shown that this glucosamine-6-phosphate metabolite suppresses the translocation of the sugar transporter to the membrane, thereby suppressing glucose uptake into cells. (For example, see Non-Patent Documents 14 to 18). From these facts, it is considered that the hexosamine biosynthetic pathway functions as a feedback mechanism for glucose uptake as one of its roles. And GFAT plays an important role as a rate-limiting enzyme in the pathway.
[0010]
In addition, recently, transgenic mice overexpressing antisense nucleotides of GFAT constitutively suppress the expression of GFAT, and administration of streptozotocin, a selective destroyer of pancreatic β cells, inhibits β cell apoptosis. Thus, it has been reported that the blood glucose level is improved (for example, see Non-Patent Document 19).
[0011]
In diabetics, this GFAT activity is generally known to be high, and is considered to be one of the causes of high blood sugar levels (for example, see Non-Patent Document 20).
[0012]
At present, two types of human-derived GFATs are known: GFAT1 (for example, see Non-Patent Document 21) and GFAT2 (for example, see Patent Document 1 and Non-Patent Document 22). It has been reported that GFAT1 is a 77 kDa protein consisting of 681 amino acids and GFAT2 is composed of 682 amino acids, but the full-length sequence of the GFAT1 gene has not yet been elucidated. The amino acid sequence homology between human GFAT1 and GFAT2 is 78%. In addition, mouse-derived (for example, see Non-Patent Document 23), yeast-derived GFAT (for example, see Non-Patent Document 24), or Escherichia coli-derived GFAT (for example, see Non-Patent Document 25) have been reported. Shows high homology to human GFAT.
[0013]
Recent progress in pharmacogenomics research has made it possible to predict the effects and side effects of drugs on individual patients by genetic diagnosis from the relationship between genetic polymorphisms and drug effects or between genetic polymorphisms and side effects. In addition, by examining the relationship between a genetic polymorphism and a disease, it is becoming possible to make a preliminary diagnosis of some diseases and determine a prognosis. Examples of the former include gene polymorphisms of drug metabolizing enzymes. Known drug metabolizing enzymes whose activity increases or decreases due to polymorphism include cytochrome P4501A2, cytochrome P4502A6, cytochrome P4502C9, cytochrome P4502C19, cytochrome P4502D6, and cytochrome P4502E1. In addition, gene polymorphism also exists in a group of enzymes called conjugating enzymes such as thiopurine methyltransferase, N-acetyltransferase, UDP-glucuronosyltransferase, and glutathione S-transferase, and the activity decreases due to the polymorphism. (For example, see Non-Patent Document 26). As an example of the latter, a large number of disease-causing genes found from polymorphism analysis studies have been reported. For example, (1) HLA as a causative gene for ulcerative colitis, (2) TCRa as a causative gene for rheumatoid arthritis, (3) APOE4 as a causative gene for Alzheimer's disease, (4) a causative gene for schizophrenia Dopamine D3 receptor, 5) tryptophan hydroxylase as a causative gene for manic depression, 6) angiotensin precursor as a causative gene for albuminuria, 7) blood coagulation factor as a causative gene for myocardial infarction VII, (8) Leptin as a causal gene of obesity and the like (see, for example, Non-Patent Document 27).
[0014]
TNF-α is considered to be an important substance involved in the pathogenesis of various inflammatory diseases. Recently, a polymorphism that enhances the expression of this gene is located in the 5′-terminal upstream region of the TNF-α gene. Was found to exist (for example, see Non-Patent Document 28). Since these polymorphisms enhance the expression level of the TNF-α gene, detection of the polymorphisms leads to advancement of TNF-α-related diseases such as juvenile rheumatoid arthritis, rheumatoid arthritis and diabetes. Diagnosis becomes possible (for example, see Patent Document 2).
[0015]
Regarding diabetes, the relationship between gene mutation and the onset of diabetes has been studied. Genes that have been identified so far to cause diabetes by a single abnormality include insulin, insulin receptor, insulin promoter factor, glucokinase, hepatocyte nucleus factor, amylin, and skeletal muscle glycogen synthesis. Enzymes and mitochondrial genes. In addition, genes considered to be involved in the development of type 2 diabetes include insulin receptor substrate, glucose transporter, mitochondrial glycerophosphate dehydrogenase, fatty acid binding protein, adrenergic receptor, glucagon receptor, potassium channel, CD38 and the like (for example, Non-Patent Document 29).
[0016]
Recently, it has been reported that the Arg140Trp polymorphism in CD38 increases the risk of diabetes (see, for example, Non-Patent Document 30). Since this polymorphism is found in Japanese diabetic patients at a frequency of about 13%, it is considered to be useful for diagnosing risk for diabetes.
[0017]
However, nothing is known about the relationship between the GFAT gene polymorphism and type 2 diabetes. Type 2 diabetes is thought to be caused by multiple genetic polymorphisms or external factors such as diet, rather than being caused by mutation or polymorphism of a single gene. There are many unclear points. Therefore, it is desired to further study the genes and polymorphisms involved in the onset of type 2 diabetes in the future.
[0018]
[Patent Document 1]
JP-A-10-108683
[Patent Document 2]
International Publication No. 98/54361 Pamphlet
[0019]
[Non-patent document 1]
Diabetes Frontier, {3, 557-564} (1992)
[Non-patent document 2]
Drugs, {46, 1025-1054} (1994)
[Non-Patent Document 3]
History of Medicine, {149, 591-618} (1989)
[Non-patent document 4]
Clinical and Research, 67, {219-233} (1990)
[Non-Patent Document 5]
Clinical and Research, {69, {919-932} (1992)
[Non-Patent Document 6]
Clinician 21 (extra edition), $ 578-587 (1995)
[Non-Patent Document 7]
Diabetes, {37, {1549-1558} (1998)
[Non-Patent Document 8]
Life Science (Life @ Sci.), {67, {2405-2416} (2000)
[Non-Patent Document 9]
Metabolism, {44, 486-490} (1995)
[Non-Patent Document 10]
New England Journal of Medicine (New Engl. J. Med.), 331, 1188-1193 (1994)
[Non-Patent Document 11]
Edited by Yoshio Goto, “New Diabetes Drugs”, Pharmaceutical Journal, Osaka, (1994)
[Non-Patent Document 12]
New England Journal of Medicine (New Engl. J. Med.), 333, 541-549 (1995)
[Non-patent document 13]
Diabetes Spectrum, $ 8, $ 194-197 (1995)
[Non-patent document 14]
Faseb Journal, 5, 3031-3036 (1991)
[Non-Patent Document 15]
Diabetologia, {38, {518-524} (1995)
[Non-Patent Document 16]
Journal of Biological Chemistry (J. Biol. Chem.), {266, 10155-10161} (1991)
[Non-Patent Document 17]
Journal of Biological Chemistry (J. Biol. Chem.), {266, 4706-4712} (1991)
[Non-Patent Document 18]
Endocrinology, {136, {2809-2816} (1995)
[Non-Patent Document 19]
Proceedings of the National Academy of Sciences of the United States of America (Proc. Natl. Acad. Sci. USA), {97, 2820-2825} (2000)
[Non-Patent Document 20]
Diabetes, {45, {302-307} (1996)
[Non-Patent Document 21]
Journal of Biological Chemistry (J. Biol. Chem.), {267, 25208-25212} (1992)
[Non-Patent Document 22]
Genomics, {57, {227-234} (1999).
[Non-Patent Document 23]
Gene, {140, {289-290} (1994)
[Non-Patent Document 24]
Journal of Biological Chemistry (J. Biol. Chem.), {264, 8753-8758} (1989)
[Non-Patent Document 25]
Biochemical Journal (Biochem. @J.), {224, {779-815} (1984)
[Non-Patent Document 26]
Edited by Yusuke Nakamura, "Strategy for SNP gene polymorphism", Nakayama Shoten, Tokyo, (2000)
[Non-Patent Document 27]
Nature Genetics (Nat. Genet.), {22, 139-144} (1999)
[Non-Patent Document 28]
Tissue Antigens, {51, {605-612} (1998)
[Non-Patent Document 29]
Edited by Takashi Kadowaki, "The Forefront of Diabetes", Yodosha, Tokyo, (1997)
[Non-Patent Document 30]
Diabetologia, {41, {1024-1028} (1998)
[0020]
[Problems to be solved by the invention]
An object of the present invention is to provide a determination method for determining the risk of developing diabetes, particularly type 2 diabetes, and a reagent and a kit for the method.
[0021]
[Means for Solving the Problems]
The present inventors examined the frequency of gene polymorphisms present in the GFAT1 gene and the GFAT2 gene for DNA samples isolated from diabetic patients and healthy subjects, and found that a plurality of genes appearing in diabetic patients at a high frequency. We found that polymorphism exists. Then, they have found that by detecting the gene polymorphism, the potential risk of developing diabetes can be determined with a high probability, and completed the present invention.
[0022]
That is, the present invention provides the following (1) to (13).
(1) In a sample containing human genomic DNA, by detecting a gene polymorphism present at any one or more positions selected from the following a) to h), and / or a haplotype consisting of a combination thereof, A method for determining the risk of developing diabetes of the sample provider.
a) The 36th nucleotide of the first intron of the GFAT (glutamine: fructose-6-phosphate amide transferase) 1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
c) The nucleotide at position -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3)
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
e) nucleotides 1988 to 2007 of the twelfth intron of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
f) -11th to -22nd nucleotides of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
g) nucleotides 2632 to 2661 of the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 in SEQ ID NO: 7)
h) The 66th nucleotide of the 18th exon of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 23)
[0023]
(2) The method according to the above (1), wherein the diabetes is type 2 diabetes.
[0024]
(3) The detection target is any one or two or more selected from the gene polymorphisms present at the following positions a) to f) and h) and the haplotypes indicated by the following x) to z) , The method according to the above (1) or (2).
a) The 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
c) The nucleotide at position -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3)
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
e) nucleotides 1988 to 2007 of the twelfth intron of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
f) -11th to -22nd nucleotides of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
h) The 66th nucleotide of the 18th exon of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 23)
x) Present at the 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1) and at the -11th to -22nd nucleotides of the 18th intron (nucleotide numbers 253 to 264 of SEQ ID NO: 6) Haplotype consisting of combinations of genetic polymorphisms
y) Present at the seventh nucleotide of intron 11 of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2) and the nucleotides -11 to -22 of the intron 18 (nucleotide numbers 253 to 264 of SEQ ID NO: 6) Haplotype consisting of combinations of genetic polymorphisms
z) The nucleotides -11 to -22 of intron 18 of the GFAT1 gene (nucleotides 253-264 of SEQ ID NO: 6) and the nucleotides 2632-2661 of intron 3 of the GFAT1 gene (nucleotides 237-264 of SEQ ID NO: 7) 266) A haplotype comprising a combination of polymorphisms present in
[0025]
(4) detecting, in a sample containing human genomic DNA, any one or two or more selected from the polymorphisms present at the position h) below and the haplotypes x) to z) A method for determining the risk of developing type 2 diabetes without nephropathy of a sample provider.
h) The 66th nucleotide of the 18th exon of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 23)
x) Present at the 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1) and at the -11th to -22nd nucleotides of the 18th intron (nucleotide numbers 253 to 264 of SEQ ID NO: 6) Haplotype consisting of combinations of genetic polymorphisms
y) Present at the seventh nucleotide of intron 11 of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2) and the nucleotides -11 to -22 of the intron 18 (nucleotide numbers 253 to 264 of SEQ ID NO: 6) Haplotype consisting of combinations of genetic polymorphisms
z) The nucleotides -11 to -22 of intron 18 of the GFAT1 gene (nucleotides 253-264 of SEQ ID NO: 6) and the nucleotides 2632-2661 of intron 3 of the GFAT1 gene (nucleotides 237-264 of SEQ ID NO: 7) 266) A haplotype comprising a combination of polymorphisms present in
[0026]
(5) detecting, in a sample containing human genomic DNA, any one or two or more selected from the polymorphisms present at the following positions a) and b) and the haplotype represented by z), A method for determining the risk of developing type 2 diabetes associated with nephropathy in a sample provider.
a) The 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
z) The nucleotides -11 to -22 of intron 18 of the GFAT1 gene (nucleotides 253-264 of SEQ ID NO: 6) and the nucleotides 2632-2661 of intron 3 of the GFAT1 gene (nucleotides 237-264 of SEQ ID NO: 7) 266) A haplotype comprising a combination of polymorphisms present in
[0027]
(6) A method for determining the risk of type 1 diabetes of a sample provider by detecting a haplotype represented by z) in a sample containing human genomic DNA.
z) The nucleotides -11 to -22 of intron 18 of the GFAT1 gene (nucleotides 253-264 of SEQ ID NO: 6) and the nucleotides 2632-2661 of intron 3 of the GFAT1 gene (nucleotides 237-264 of SEQ ID NO: 7) 266) A haplotype comprising a combination of polymorphisms present in
[0028]
(7) Detection is performed by RFLP method, PCR-SSCP method, ASO hybridization, direct sequencing method, ARMS method, denaturing gradient gel electrophoresis, RNaseA cleavage method, chemical cleavage method, DOL method, TaqMan @ PCR method, Invader Method, MALDI-TOF / MS method, TDI method, molecular beacon method, dynamic allele-specific hybridization method, padlock probe method, UCAN method, nucleic acid hybridization method using DNA chip or DNA microarray, and ECA The method according to any one of the above (1) to (6), wherein the method is performed using one or more methods selected from the group consisting of:
[0029]
(8) The method according to (7) above, wherein the detection is performed using a PCR-SSCP method or a direct sequencing method.
[0030]
(9) On the GFAT1 gene represented by SEQ ID NO: 22, a continuous polynucleotide having a length of 16 to 500 bases containing any one nucleotide or nucleotide sequence selected from the following a) to g), or a labeled product thereof;
a) The 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
c) The nucleotide at position -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3)
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
e) nucleotides 1988 to 2007 of the twelfth intron of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
f) -11th to -22nd nucleotides of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
g) nucleotides 2632 to 2661 of the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 in SEQ ID NO: 7)
Alternatively, on the GFAT2 gene fragment represented by SEQ ID NO: 23, a continuous polynucleotide having a length of 16 to 500 bases, including the 66th nucleotide of exon 18 (nucleotide number 2251 of SEQ ID NO: 23), or a labeled product thereof.
(However, when the polynucleotide is RNA, the base symbol “t” in the sequence listing should be read as “u”).
[0031]
(10) On the GFAT1 gene represented by SEQ ID NO: 22, hybridizes to a part of a continuous polynucleotide having a length of 16 to 1000 bases and containing any one nucleotide or nucleotide sequence selected from the following a) to g): An oligonucleotide having a length of 15 to 30 bases, or a labeled product thereof, for specifically amplifying the polynucleotide;
a) The 36th nucleotide of the first intron of the GFAT (glutamine: fructose-6-phosphate amide transferase) 1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
c) The nucleotide at position -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3)
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
e) nucleotides 1988 to 2007 of the twelfth intron of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
f) -11th to -22nd nucleotides of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
g) nucleotides 2632 to 2661 of the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 in SEQ ID NO: 7)
Alternatively, on the GFAT2 gene fragment represented by SEQ ID NO: 23, it hybridizes to a part of a continuous polynucleotide having a length of 16 to 1000 bases and including the 66th nucleotide of exon 18 (nucleotide number 2251 of SEQ ID NO: 23). And an oligonucleotide having a length of 15 to 30 bases, or a labeled product thereof, for specifically amplifying the polynucleotide.
(However, when the polynucleotide is RNA, the base symbol “t” in the sequence listing should be read as “u”).
[0032]
(11) An immobilized sample on which the polynucleotide according to (9) is immobilized.
[0033]
(12) A reagent or kit for determining the risk of developing diabetes, comprising at least one or more selected from the following 1) to 3).
1) The polynucleotide according to (9) or a labeled product thereof
2) The oligonucleotide according to (10) or a labeled product thereof
3) The solid-phased sample according to (11) above
[0034]
(13) The DNA of the following (A) or (B).
(A) DNA comprising a nucleotide sequence represented by SEQ ID NO: 22
(B) DNA encoding a human-derived protein having at least 85% homology with the DNA consisting of the nucleotide sequence represented by SEQ ID NO: 22 and having GFAT activity
[0035]
BEST MODE FOR CARRYING OUT THE INVENTION
The method of the present invention is a method for determining the risk of developing diabetes of a sample provider by detecting a novel gene polymorphism present on the GFAT1 gene and / or GFAT2 gene in a sample containing human genomic DNA. .
[0036]
In the present specification, the term “gene polymorphism” includes both so-called single nucleotide polymorphisms (single nucleotide polymorphisms: single nucleotide polymorphism: SNP) and polymorphisms over a plurality of consecutive nucleotides. That is, in a human population, a mutation such as substitution, deletion, insertion, transposition, or inversion of one or more nucleotides at a specific site in one or more other individual genomes with reference to the genome sequence of a certain individual. Is present, it is statistically certain that the mutation is not a mutation that occurred in the one or more individuals, or it is not a mutation within the individual and is present in the population at a frequency of 1% or more. If it is proven in a family, the mutation is called a “gene polymorphism”.
[0037]
Hereinafter, the method of the present invention will be described in detail.
1. Novel genetic polymorphisms associated with the development of diabetes
The gene polymorphism to be detected in the present invention is a novel gene polymorphism present on the GFAT1 gene or GFAT2 gene, which has been confirmed to appear at high frequency in diabetic patients. The gene polymorphism specifically exists at the following positions a) to h).
a) The 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
c) The nucleotide at position -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3)
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
e) nucleotides 1988 to 2007 of intron 12 of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
f) nucleotides -11 to -22 of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
g) nucleotides 2632 to 2661 of the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 in SEQ ID NO: 7)
h) The 66th nucleotide of the 18th exon of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 23)
[0038]
In the method of the present invention, a haplotype consisting of a genetic polymorphism and / or a combination thereof present at any one or more positions selected from the above a) to h) is detected, and the risk of developing diabetes is detected. Determine the degree. That is, the determination may be performed based on the detection result of one or more gene polymorphisms, or may be performed based on the detection result of a haplotype in which two or more gene polymorphisms are combined. Alternatively, the determination may be made by combining the polymorphism and the haplotype.
[0039]
2. Preparation of sample containing human genomic DNA
The “sample containing human genomic DNA” used in the method of the present invention is prepared using any cells (excluding germ cells), tissues, organs, and the like isolated from subjects and clinical samples. As the material, leukocytes or mononuclear cells separated from peripheral blood are preferable, and leukocytes are most preferable. These materials are isolated according to methods commonly used in clinical tests.
[0040]
For example, when using leukocytes as a material, first, leukocytes are separated from peripheral blood isolated from a subject according to a conventional method. Next, proteinase K and sodium dodecyl sulfate (SDS) are added to the obtained leukocytes to decompose and denature the protein, followed by phenol / chloroform extraction to obtain genomic DNA (including RNA). RNA can be removed by RNase if necessary. However, the extraction of genomic DNA is not limited to the above-mentioned method, and is well-known in the art (for example, Sambrook, {J. et al. (1989): "Molecular Cloning: A Laboratory Manual (2nd Ed.)"). Cold Spring Harbor Laboratory, NY) or a commercially available DNA extraction kit or the like.
[0041]
3. Gene polymorphism detection
Next, from the sample containing the obtained human genomic DNA, a novel gene polymorphism which is elucidated by the present inventors and which is extremely related to diabetes (particularly type 2 diabetes) is detected. Hereinafter, a typical gene polymorphism detection method will be described.
[0042]
(1) RFLP (restriction fragment length polymorphism) method
When the gene polymorphism site is included in the restriction enzyme recognition site, the gene polymorphism can be detected from the difference in the length of the DNA fragment generated by digestion of the restriction enzyme. In this case, (1) a method in which genomic DNA is digested with a restriction enzyme, followed by Southern blotting; and (2) a DNA fragment containing a polymorphic site is amplified by PCR, cut with a restriction enzyme, and the DNA cut by electrophoresis. A method of analyzing the size of a fragment is exemplified. The probe used in the method (1) may be a DNA containing a polymorphic site of interest and corresponding to a sequence ranging from about 0.05 to 2 kb on the 5 'end and 3' end from the polymorphic site, respectively. Fragments (labeled with an isotope, biotin, a fluorescent dye, or the like) are preferred. The PCR primer used in the method (2) is preferably a 15-mer to 30-mer oligonucleotide for amplifying a DNA fragment of about 0.05 to 4 kb containing a polymorphic site.
[0043]
(2) PCR-SSCP method (single-stranded DNA higher-order structural polymorphism analysis)
The PCR-SSCP method is a method of amplifying a DNA fragment containing a gene polymorphism site by PCR, heat denaturation, and separating single-stranded DNAs having different higher-order structures by electrophoresis [Biotechniques, # 16, 296- 297 (1994), {Biotechniques, {21, {510-514} (1996)]. Since the migration distance of single-stranded DNA differs depending on the presence or absence of the gene polymorphism, the polymorphism can be typed by analyzing the pattern. In order to use it as a standard for typing, it is preferable to use a DNA sample derived from the human genome in which the nucleotide sequence of the polymorphic site has been confirmed in advance, as a template DNA for PCR, simultaneously with the test sample. As a primer for PCR amplification, a 15 to 30 mer oligonucleotide for amplifying a DNA fragment of about 50 to 500 bp containing a polymorphic site, which is labeled at the 5 'end with a fluorescent dye, is preferable.
[0044]
(3) ASO (Allele Specific Oligonucleotide) hybridization method
In the ASO hybridization method, a PCR product containing a gene polymorphism site is dot-blotted on a support such as a nylon filter, hybridized with a probe corresponding to each gene polymorphism, and then washed according to the Tm value of the probe. This is a method for detecting polymorphisms (hybrids are removed if there is a mismatch) [Clin. {Chim. {Acta, {189, {153-157} (1990)]. As the probe, a synthetic oligonucleotide of about 15 to 25 mer is usually used (labeling with a radioisotope, biotin or a fluorescent dye is necessary to obtain a signal). As the PCR primer, an oligonucleotide of 15 to 30 mer for amplifying a DNA fragment of about 0.05 to 4 kb containing a polymorphic site is preferable.
[0045]
(4) Direct sequence method
The direct sequencing method is a method in which a DNA fragment containing a gene polymorphism site is PCR-amplified and the nucleotide sequence of the amplified DNA is directly analyzed by the dideoxy method [Biotechniques, {11, {246-249} (1991)]. The PCR primer used in this method is preferably a 15 to 30 mer oligonucleotide for amplifying a DNA fragment of about 0.05 to 4 kb containing a polymorphic site. Further, as the sequence primer, preferably, a 15 to 30-mer oligonucleotide corresponding to a position on the 5 'end side of about 50 to 300 nucleotides from the polymorphic site is used.
[0046]
(5) ARMS (Amplification Refracting Mutation System) method
In PCR, after a primer anneals to a template DNA, a complementary strand DNA is synthesized from the 5 'end to the 3' end by a DNA polymerase. If there is a mismatch at the 3 'terminal nucleotide of the primer, the efficiency of the PCR will be reduced, making detection by electrophoresis impossible. The ARMS method is a method in which PCR is performed using primers designed so that the 3 ′ terminal nucleotide is complementary to the mutant nucleotide to be detected, and a gene polymorphism is detected based on the presence or absence of an amplification product [Nuc . {Acids. Res. , {19, {3561-3567} (1991), {Nuc. {Acids. Res. , {20, 4831-4837} (1992)]. The PCR primers used in this method are preferably 15-30 mer oligonucleotides designed such that the polymorphic site is located at the 3 'end, and the other is preferably the polymorphic site. The oligonucleotide is a 15 to 30-mer oligonucleotide at a distance of about 0.05 to 2 kb from the oligonucleotide.
[0047]
(6) Denaturing gradient gel electrophoresis (denaturing gradient gel electrophoresis, hereinafter referred to as "DGGE")
The DGGE method is a method for detecting a genetic polymorphism by utilizing the fact that a heteroduplex having a mismatch in a PCR product is easier to dissociate than a homoduplex [Biotechniques, {27, {1016-1018} (1999). ]. Since the mobility of the heteroduplex in gel electrophoresis decreases as the dissociation progresses, if the density gradient of urea and formamide is set in the polyacrylamide gel to be used, the difference in mobility from the homoduplex will further increase. The presence of the highlighted double-stranded DNA containing the mismatch, ie, the presence of the mutation, is detected. The PCR primer used in this method is usually a 15 to 30 mer oligonucleotide for amplifying a DNA fragment of about 0.05 to 0.5 kb containing a polymorphic site.
[0048]
(7) RNase A cleavage method
RNase A (RNA degrading enzyme) has the property of degrading only single-stranded RNA without degrading double-stranded RNA or RNA / DNA complex. Therefore, after PCR-amplifying a DNA fragment containing a polymorphic site, an isotope-labeled RNA probe is hybridized with a denatured and single-stranded PCR product, treated with RNaseA, and then separated by electrophoresis. Since the RNA probe hybridized with DNA is cleaved at the mismatch site, it can be detected as two bands [DNA @ Cell. {Biol. , {14, {87-94} (1995)]. As the RNA probe used in this method, an oligonucleotide of usually 15 to 30 mer containing a polymorphic site is preferable.
[0049]
(8) Chemical cutting method
After amplifying the DNA fragment containing the polymorphic site by PCR, the mismatch site of the double-stranded DNA, "c (cytosine)", is separately hydroxylamine, and "t (thymine)" is osmium tetraoxide. Modification and piperidine treatment cleaves the sugar. After forming a double strand using a labeled probe and performing the above-mentioned treatment, electrophoresis is performed, and if the size of the probe is short, mutation has been detected [Biotechniques, {21, {216-218} (1996) )]. The PCR primer used in this method is usually a 15 to 30 mer oligonucleotide for amplifying a DNA fragment of about 0.05 to 4 kb containing a polymorphic site.
[0050]
(9) DOL (Dye-labeled Oligonucleotide Ligation) method
In the DOL method, after a DNA fragment containing a gene polymorphism is PCR-amplified, a dye primer containing up to a base immediately before the fluorescently labeled polymorphic site and a dye terminator labeled with a fluorescent dye specific to each allele are used. This is a method of ligation using thermostable DNA ligase [Genome Res. , {8, {549-556} (1998)]. The PCR primer used in this method is usually a 15 to 30 mer oligonucleotide for amplifying a DNA fragment of about 0.05 to 2 kb containing a polymorphic site.
[0051]
(10) TaqMan @ PCR method
The TaqMan @ PCR method is a method using PCR using a fluorescently labeled allele-specific oligonucleotide (TaqMan probe) and Taq DNA polymerase [Genet. {Anal. , {14, {143-149} (1999), {J. Clin. {Microbiol. , {34, 2933-2936} (1996)]. The PCR primer used in this method is usually a 15 to 30 mer oligonucleotide for amplifying a DNA fragment of about 0.05 to 2 kb containing a polymorphic site. The TaqMan probe is an oligonucleotide of about 15 to 30 bases including a polymorphic site, the 5 ′ end is labeled with a fluorescent reporter dye, and the 3 ′ end is labeled with a quencher (quencher). . By using this probe, it is possible to detect a nucleotide change between a wild type and a mutant type.
[0052]
(11) Invader method
In the invader method, two types of non-fluorescently labeled oligonucleotides and one type of fluorescently labeled oligonucleotide are used. One of the non-fluorescent-labeled oligonucleotides has a sequence (hereinafter, referred to as “flap”) at the 5 ′ end thereof, which is unrelated to the genomic sequence (hereinafter, referred to as “template”) in which the polymorphic site to be detected exists. The 3 'end of the flap is a complementary sequence specific to the sequence at the 5' end from the polymorphic site of the template (hereinafter referred to as "allele probe"). That is, the 5 'end of the complementary sequence portion specific to the template of the allele probe corresponds to the polymorphic site of the template. The other non-fluorescently labeled oligonucleotide has a complementary sequence specific to a sequence at the 3 'end from the polymorphic site of the template (hereinafter referred to as "invader probe"). The 3 'end of the invader probe also corresponds to the polymorphic site of the template, but need not be complementary to the nucleotide at the polymorphic site of the template. Fluorescently labeled oligonucleotides (hereinafter referred to as “FRET (fluorescence, energy, energy, transfer) probes”) have a sequence complementary to the flap at the 3 ′ end and a palindromic sequence at the 5 ′ end, so that the oligonucleotide itself has a sequence. It forms a main chain. A portion near the 5 'end of the FRET probe is labeled with a fluorescent dye, and a quencher for canceling the fluorescence is bound to the 5' end. First, when the allele probe and the invader probe are hybridized to the template, if the allele probe and the template are complementary at the polymorphic site, the template, the 5 'end of the allele probe and the 3' 'Terminal forms a special structure. An enzyme that specifically recognizes this structure and exhibits endonuclease activity (hereinafter referred to as “Crybase”) separates the flap portion from the allele probe. The released flap hybridizes with the 3 'end of the FRET probe. At this time, since the flap and the FRET probe form a structure specifically recognized by Clebase at the position of the 5 ′ end where the quencher of the FRET probe is bonded, the 5 ′ to which the quencher is bonded is formed. The terminal nucleotide is cleaved from the FRET probe by the cleabase, and the fluorescent dye remaining on the FRET probe emits fluorescence. On the other hand, when a mutation is present in the template sequence, and the allele probe and the template are not complementary at the polymorphic site and are mismatched, a structure specifically recognized by Clebase is not formed. Not detached from the probe. At this time, the flap remaining on the allele probe without being detached can also hybridize with the 3 ′ end of the FRET probe, but the quencher binds as compared with the case where the flap detached from the allele probe is hybridized. Since the reaction efficiency at which the 5 ′ terminal nucleotide is cleaved from the FRET probe by cleabase is low, the fluorescence intensity emitted by the FRET probe is also low. Based on the above principle, polymorphism can be detected [Science, # 5109, # 778-783 (1993), {J. {Biol. {Chem. , {30, {21387-21394} (1999), {Nat. Biotechnol. , {17, {292-296} (1999)].
[0053]
(12) MALDI-TOF / MS method (Matrix Assisted Laser Desorption-time ofFlight / Mass Spectrometry) method
The MALDI-TOF / MS method is a method of synthesizing a single-stranded oligonucleotide containing a different nucleotide corresponding to an allele of a gene polymorphism, measuring the mass thereof, and detecting the difference with a mass spectrometer for typing. [Genome @ Res. , {7, {378-388} (1997), {Eur. {J. Clin. {Chem. Clin. Biochem. , {35, {545-548} (1997)]. In the MALDI-TOF / MS method, first, a DNA fragment containing a polymorphic site is PCR-amplified, and then a DNA extension reaction product specific to each allele is masked by an extension reaction using primers adjacent to the polymorphic site. Analyze based on spectrum. The PCR primer used at this time is usually a 15 to 30 mer oligonucleotide for amplifying a DNA fragment of about 0.05 to 0.5 kb containing a polymorphic site. As a primer for detecting a polymorphism, an oligonucleotide of 15 to 30 mer adjacent to the polymorphic site is used.
[0054]
(13) TDI (Template-directed Dye-terminator Incorporation) method
In the TDI method, a DNA fragment containing a gene polymorphism is amplified by PCR, and then labeled with different fluorescent dyes corresponding to each allele by a primer extension reaction using a primer designed immediately before the polymorphic site. Is incorporated into a polymorphic site [Proc. {Natl. {Acad. {Sci. {USA, {94, {10756-10761} (1997)]. The primer extension product is analyzed using a DNA sequencer (ABI Prism 377, manufactured by Applied Biosystems) or the like. The PCR primer used at this time is usually a 15 to 30 mer oligonucleotide for amplifying a DNA fragment of about 0.05 to 1 kb containing a polymorphic site.
[0055]
(14) Molecular beacon method
Molecular @ Beacons is an oligonucleotide having a luminescence suppressor (Quencher) and a fluorescent substance (Fluorophore) at both ends. Usually, it is a stem-loop structure having a stem portion of 5 to 7 nucleotides and a loop structure of 15 to 30 nucleotides. Therefore, the phosphor does not emit light even under the excitation light irradiation due to the function of the light emission suppressor. On the other hand, when the target DNA homologous to the base sequence in the loop structure and the base sequence in the loop structure hybridize, the phosphor is excited under the excitation light to emit fluorescence because the distance between the luminescence suppressor and the phosphor is large. [Nat. Biotechnol. , 1, {p49-53} (1998), Gene Medicine, 4, p46-48 (2000)]. The base sequence of the stem of Molecular @ Beacon is not complementary to the target DNA. The Tm value (melting temperature: melting temperature) of the stem structure of Molecular Beacons is designed to be 7-10 ° C. higher than the Tm values of the target DNA and the PCR primer. Then, when the target region is amplified by PCR, Molecular Beacons is added to the reaction solution, and excitation light is measured at the annealing temperature of PCR to measure fluorescence. If Molecular Beacons is a sequence completely homologous to the target gene, it is hybridized. Fluorescent. Conversely, if there is a mismatch, Molecular @ Beacons cannot hybridize to the target and cannot emit fluorescence. Genetic polymorphisms can be found by this method.
[0056]
(15) Dynamic Allele-Specific Hybridization (DASH) method
This is a method in which a target DNA (60-90 base pairs) is amplified from genomic DNA by PCR using primers whose ends are biotinylated [Nat. Biotechnol. , 1, {p87-88, {(1999), Gene Medicine, {4, {p47-48} (2000)]. After completion of the PCR, the strand on the side of the biotinylated primer binds to a microtiter well coated with streptavidin. On the other hand, the unmodified Primer strand cannot be bonded and is removed by rinsing with an alkaline solution. Thereafter, probe DNA (15-21 nucleotides) is hybridized to the biotinylated primer strand. At this time, a fluorescent substance (Syber Green I dye) that specifically binds to the double-stranded DNA and emits fluorescence is incorporated together. Thereafter, denaturation is performed while observing the fluorescence intensity. When the target DNA and the probe DNA are not completely complementary and have a mismatch, the temperature at which the target DNA denatures and emits no light is lower than in the case where it is completely complementary. By observing this difference in temperature, a gene polymorphism can be detected.
[0057]
(16) Padlock Probe method
Lizardi et al. [Nat. {Genet. , {3, {p225-232} (1998), Gene Medicine, {4, {p50-51} (2000)]. A probe designed to be circular when hybridized to a single-stranded target DNA is used. The probe is hybridized to the target DNA, and then ligated with DNA ligase to form a complete circular shape. The phosphate group is removed with the phosphatase of (2). When the terminal cannot be circularized due to a mismatch at the end, the phosphate group is lost and the circularization cannot be performed. A primer (1) is designed for this circular DNA and replicated with a DNA polymerase to obtain a replicon multimer. A primer (2) is also designed for this replicon, and the two types of primers are mixed together and reacted with DNA polymerase to amplify double-stranded DNA. The primer (1) is designed on a portion that is not complementary to the target DNA, and the primer (2) is a terminal portion of a circular probe (Padlock @ Probe) (a sequence complementary to the target DNA (gene polymorphism at the 3 ′ end). ), And a primer having a single nucleotide substitution at the 3 ′ end is used for polymorphism detection.Rolling cycle-reaction (RCR) is performed on the circularized probe (Padlock @ Probe). After amplification using the improved Hyperbranched Rolling-Circle Amplification (HRCA) method, the DNA was treated with a restriction enzyme at a restriction enzyme recognition site in Padlock Probe. To confirm the presence or absence of the band by electrophoresis.
[0058]
(17) UCAN method
The UCAN method [refer to the Takara Shuzo Co., Ltd. homepage (http://www.takara.co.jp)] is based on the 3 ′ end of a DNA-RNA-DNA primer (DRD primer) of a type in which RNA is sandwiched between DNA on both sides. The DNA is chemically changed so that the replication of the template DNA by the DNA polymerase does not occur. Next, the DRD primer designed so that the RNA part binds to the base part where the single base conversion may have occurred is paired with the template DNA. Only when the DRD primer and the template completely match, the RNA portion of the paired DRD primer is cleaved by RNaseH. As a result of this cleavage, a new 3 'end appears, the extension reaction by the DNA polymerase proceeds, and the template DNA is amplified. On the other hand, when the DRD primer and the template DNA do not match at that position, that is, when an SNP is present, RNaseH does not cut the DRD primer, and thus DNA amplification does not occur. By detecting the presence or absence of this gene amplification, a gene polymorphism can be detected.
[0059]
(18) DNA chip or DNA microarray
DNA chips or DNA microarrays are obtained by immobilizing DNA probes containing various types of polymorphic sites on a glass substrate, and hybridizing a labeled nucleic acid sample to detect the presence or absence of the polymorphism by a fluorescent signal. In general, a method of placing cDNA on a glass substrate is called a DNA microarray, and a method of synthesizing DNA on a glass substrate is called a DNA chip (oligo DNA chip). The probe immobilized (or synthesized) on the substrate is usually an oligonucleotide of about 20 mer containing a polymorphic site in the case of an oligo DNA array, or a double-stranded DNA of about 100 to 1500 mer in the case of a cDNA microarray. .
[0060]
(19) ECA method
The ECA (Electrochemical Array) method is a genotyping method utilizing the electrochemical properties of an intercalator that binds to a double strand of DNA. That is, a region containing a polymorphism on the genome is amplified by a PCR method, and an intercalator is acted after hybridizing with a probe complementary to each allele immobilized on a substrate. At this time, the amount of the intercalator to be bound differs depending on whether the probe is completely complementary or incompletely complementary to the probe. Since the intercalator used in the ECA method contains a substance called ferrocene having electrochemical properties, the electrical signal differs in proportion to the amount of the intercalator bound. The ECA method is a method for detecting a gene polymorphism using this difference [Anal. {Chem. , $ 72, $ p1334-1341, $ 2000].
[0061]
The above are typical polymorphism detection methods, but are not limited thereto. Other known gene polymorphism detection methods can be used for the determination method of the present invention. Further, in the method of the present invention, these gene polymorphism detection methods may be used alone or in combination of two or more. As a preferred embodiment of the present invention, a determination method using a PCR-SSCP method or a direct sequence method will be described in Examples described later.
[0062]
4. Diabetes risk assessment reagent or kit
In the determination method of the present invention, in order to detect a genetic polymorphism associated with the onset of diabetes, a probe or solid-phased sample for detecting a sequence at or near the site where the gene polymorphism to be detected is present, or Primers for specifically amplifying the sequence are used. These probes, primers and immobilized samples are useful as reagents or kits for performing the determination method of the present invention.
[0063]
That is, the present invention provides a probe, a primer, and an immobilized sample for detecting a gene polymorphism on the GFAT1 gene or GFAT2 gene, and a reagent or kit for determining the risk of developing diabetes, comprising at least one or more of these. I will provide a.
[0064]
(1) Probe
The probe used in the method of the present invention is a polynucleotide probe that specifically hybridizes to a site containing a novel gene polymorphism on the GFAT1 gene or GFAT2 gene and detects the polymorphic site.
[0065]
Such a probe contains, on the GFAT1 gene represented by SEQ ID NO: 22, any one nucleotide or nucleotide sequence selected from the following a) to g), a length of 16 to 500 nucleotides, preferably a length of 20 to 200 nucleotides: , More preferably a continuous polynucleotide of 20 to 50 bases in length;
a) The 36th nucleotide of the first intron of the GFAT (glutamine: fructose-6-phosphate amide transferase) 1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
c) The nucleotide at position -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3)
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
e) nucleotides 1988 to 2007 of the twelfth intron of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
f) -11th to -22nd nucleotides of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
g) nucleotides 2632 to 2661 of the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 in SEQ ID NO: 7)
Alternatively, on the GFAT2 gene fragment represented by SEQ ID NO: 23, the nucleotide containing the 66th nucleotide of exon 18 (nucleotide number 2251 of SEQ ID NO: 3), 16 to 500 bases in length, preferably 20 to 200 bases in length, more preferably Is designed as a continuous polynucleotide of 20-50 bases in length.
[0066]
(2) Primer
The primer used in the method of the present invention is an oligonucleotide primer for specifically amplifying a site containing a novel polymorphism on the GFAT1 gene or GFAT2 gene.
[0067]
Such a primer hybridizes on the GFAT1 gene represented by SEQ ID NO: 22 to a portion of a continuous polynucleotide containing any one nucleotide or nucleotide sequence selected from the above a) to g), and An oligonucleotide having a length of 15 to 30 bases, and preferably about 18 to 25 bases, for specifically amplifying nucleotides;
Alternatively, on the GFAT2 gene fragment represented by SEQ ID NO: 23, a portion of a continuous polynucleotide containing the 66th nucleotide of exon 18 is hybridized to a part of a continuous polynucleotide to specifically amplify the polynucleotide. It is designed as an oligonucleotide having a length of 30 bases, preferably an oligonucleotide having a length of about 18-25 bases.
[0068]
The length of the polynucleotide to be amplified is appropriately set depending on the detection method used, but is generally 16 to 1000 bases, preferably 20 to 500 bases, and more preferably 20 to 200 bases. .
[0069]
From the above, a polynucleotide comprising a continuous nucleotide sequence of 15 nucleotides or more contained in a sequence near the polymorphic site (for example, the nucleotide sequence represented by any one of SEQ ID NOS: 1 to 7 and SEQ ID NO: 23) Can be used as the above primer or probe.
[0070]
The primers or probes of the present invention include those in which an appropriate label for detection, for example, a fluorescent dye, an enzyme, a protein, a radioisotope, a chemiluminescent substance, biotin, or the like is added to the end of the sequence. .
[0071]
As the fluorescent dye used in the present invention, those generally used for labeling nucleotides and used for quantification and detection of nucleic acids can be suitably used. For example, HEX (4, 7, 2 ', 4', 5 ', 7'-hexachloro-6-carboxyfluorescein, green fluorescent dye, fluorescein, NED (Applied Biosystems, trade name, yellow fluorescent dye), or 6-FAM (Applied Biosystems, trade name, yellow green) Fluorescent dye), rhodamine or a derivative thereof (for example, tetramethylrhodamine (TMR)), but are not limited thereto. As a method of labeling nucleotides with a fluorescent dye, an appropriate one of known labeling methods can be used [see Nature {Biotechnology, {14, {p303-308} (1996)]. Alternatively, a commercially available fluorescent labeling kit can be used (for example, oligonucleotide ECL 3'-oligolabeling system manufactured by Amersham Pharmacia).
[0072]
The primers of the present invention also include those to which a linker sequence for detecting a polymorphism is added at the end. Such a linker sequence includes, for example, a flap (a sequence completely unrelated to the sequence near the polymorphism) added to the 5'-terminal of the oligonucleotide used in the aforementioned invader method.
[0073]
In the present specification, “polynucleotide” is synonymous with nucleic acid, and includes both DNA and RNA. It may be double-stranded or single-stranded, and thus, a polynucleotide having a certain sequence always includes a polynucleotide having a sequence complementary thereto (similarly, an oligonucleotide). . Furthermore, when the polynucleotide is RNA, the base symbol “t” shown in the sequence listing shall be read as “u”.
[0074]
Preferred examples of the above primers for detection using the SSCP method and the direct sequence method, which are one embodiment of the present invention, are shown below.
i) For detecting a gene polymorphism at the 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1):
As the sense strand primer, 15 nucleotides or more (preferably 15 nucleotides or more) in the nucleotide sequence represented by nucleotide numbers 1 to 631 of SEQ ID NO: 1, more preferably in the nucleotide sequence represented by nucleotide numbers 432 to 631 of SEQ ID NO: 1 30 nucleotides) are selected. For example, the nucleotide sequence shown in SEQ ID NO: 8 can be mentioned.
[0075]
As the antisense strand primer, 15 nucleotides or more (preferably, in the nucleotide sequence represented by nucleotide numbers 633 to 782 of SEQ ID NO: 1), more preferably in the nucleotide sequence represented by nucleotide numbers 633 to 682 of SEQ ID NO: 1 An antisense sequence of a contiguous nucleotide sequence (15-30 nucleotides) is selected. For example, the nucleotide sequence shown in SEQ ID NO: 9 can be mentioned.
[0076]
ii) For the detection of a polymorphism at the seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2):
The sense strand primer is preferably 15 nucleotides or more (preferably 15 nucleotides or more) in the nucleotide sequence represented by nucleotide numbers 1 to 265 of SEQ ID NO: 2, more preferably in the nucleotide sequence represented by nucleotide numbers 66 to 265 of the same. 30 nucleotides) are selected. For example, the nucleotide sequence shown in SEQ ID NO: 10 can be mentioned.
[0077]
As the antisense strand primer, 15 nucleotides or more (preferably, in the nucleotide sequence represented by nucleotide numbers 267 to 675 of SEQ ID NO: 2, more preferably in the nucleotide sequence represented by nucleotide numbers 267 to 466 of SEQ ID NO: 2) An antisense sequence of a contiguous nucleotide sequence (15-30 nucleotides) is selected. For example, the nucleotide sequence shown in SEQ ID NO: 11 can be mentioned.
[0078]
iii) For detecting a gene polymorphism at the -147th nucleotide of the intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3):
The sense strand primer is preferably 15 nucleotides or more (preferably 15 nucleotides or more) in the nucleotide sequence represented by nucleotide numbers 1 to 337 of SEQ ID NO: 3, more preferably the nucleotide sequence represented by nucleotide numbers 138 to 337 of the same. 30 nucleotides) are selected. For example, the nucleotide sequence shown in SEQ ID NO: 12 can be mentioned.
[0079]
As the antisense strand primer, 15 nucleotides or more (preferably, in the nucleotide sequence represented by nucleotide numbers 339 to 780 of SEQ ID NO: 3, more preferably in the nucleotide sequence represented by nucleotide numbers 339 to 538 of SEQ ID NO: 3) An antisense sequence of a contiguous nucleotide sequence (15-30 nucleotides) is selected. For example, the nucleotide sequence shown in SEQ ID NO: 13 can be mentioned.
[0080]
iv) For detecting a gene polymorphism at nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4):
The sense strand primer is preferably 15 nucleotides or more (preferably 15 nucleotides or more) in the nucleotide sequence represented by nucleotide numbers 1 to 335 of SEQ ID NO: 4, and more preferably in the nucleotide sequence represented by nucleotide numbers 136 to 335 of SEQ ID NO: 4. 30 nucleotides) are selected. For example, the nucleotide sequence shown in SEQ ID NO: 14 can be mentioned.
[0081]
As the antisense strand primer, 15 nucleotides or more (preferably, in the nucleotide sequence represented by nucleotide numbers 361 to 720 of SEQ ID NO: 4), more preferably in the nucleotide sequence represented by nucleotide numbers 361 to 560 of SEQ ID NO: 4 An antisense sequence of a contiguous nucleotide sequence (15-30 nucleotides) is selected. For example, the nucleotide sequence shown in SEQ ID NO: 15 can be mentioned.
[0082]
v) For the detection of a gene polymorphism at nucleotides 1988 to 2007 (nucleotide numbers 328 to 347 of SEQ ID NO: 5) of the twelfth intron of the GFAT1 gene. A continuous nucleotide sequence of 15 nucleotides or more (preferably 15 to 30 nucleotides) in the nucleotide sequence of 327, more preferably the nucleotide sequence of nucleotides 128 to 327, is selected. For example, the nucleotide sequence shown in SEQ ID NO: 16 can be mentioned.
[0083]
As the antisense strand primer, 15 nucleotides or more (preferably, in the nucleotide sequence represented by nucleotide numbers 348 to 659 of SEQ ID NO: 5, more preferably in the nucleotide sequence represented by nucleotide numbers 348 to 546 of SEQ ID NO: 5) An antisense sequence of a contiguous nucleotide sequence (15-30 nucleotides) is selected. An example is the nucleotide sequence shown in SEQ ID NO: 17.
[0084]
vi) For detecting a gene polymorphism at nucleotides -11 to -22 of intron 18 of the GFAT1 gene (nucleotide numbers 253-264 in SEQ ID NO: 6):
The sense strand primer is preferably 15 nucleotides or more (preferably 15 nucleotides or more) in the nucleotide sequence represented by nucleotide numbers 1 to 252 of SEQ ID NO: 6, more preferably in the nucleotide sequence represented by nucleotide numbers 53 to 252 of the same. 30 nucleotides) are selected. For example, the nucleotide sequence shown in SEQ ID NO: 18 can be mentioned.
[0085]
As the antisense strand primer, 15 nucleotides or more (preferably, in the nucleotide sequence represented by nucleotide numbers 265 to 540 of SEQ ID NO: 6), more preferably in the nucleotide sequence represented by nucleotide numbers 265 to 464 of SEQ ID NO: 6 An antisense sequence of a contiguous nucleotide sequence (15-30 nucleotides) is selected. For example, the nucleotide sequence shown in SEQ ID NO: 19 can be mentioned.
[0086]
vii) For detecting a gene polymorphism at nucleotides 2632 to 2661 of the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 in SEQ ID NO: 7):
The sense strand primer is preferably 15 nucleotides or more (preferably 15 nucleotides or more) in the nucleotide sequence represented by nucleotide numbers 1 to 236 of SEQ ID NO: 7, more preferably in the nucleotide sequence represented by nucleotide numbers 37 to 236 of the same. 30 nucleotides) are selected. For example, the nucleotide sequence shown in SEQ ID NO: 20 can be mentioned.
[0087]
As the antisense strand primer, 15 nucleotides or more (preferably, in the nucleotide sequence represented by nucleotide numbers 267 to 360 of SEQ ID NO: 7, more preferably in the nucleotide sequence represented by nucleotide numbers 267 to 340 of SEQ ID NO: 7) An antisense sequence of a contiguous nucleotide sequence (15-30 nucleotides) is selected. For example, the nucleotide sequence shown in SEQ ID NO: 21.
[0088]
viii) For detecting a polymorphism at the 66th nucleotide of exon 18 of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 23):
As the sense strand primer, 15 nucleotides or more (preferably 15 nucleotides or more) in the nucleotide sequence represented by nucleotide numbers 1751 to 2250 of SEQ ID NO: 23, and more preferably in the nucleotide sequence represented by nucleotide numbers 2051 to 2199 of SEQ ID NO: 23 30 nucleotides) are selected. An example is the nucleotide sequence shown in SEQ ID NO: 24.
[0089]
As the antisense strand primer, 15 nucleotides or more (preferably, in the nucleotide sequence represented by nucleotide numbers 2252 to 2751 of SEQ ID NO: 23, more preferably in the nucleotide sequence represented by nucleotide numbers 2252 to 2451 of SEQ ID NO: 23) An antisense sequence of a contiguous nucleotide sequence (15-30 nucleotides) is selected. For example, the nucleotide sequence shown in SEQ ID NO: 25.
[0090]
The polynucleotide that can be used as the above primer or probe can be obtained by chemical synthesis based on a method well-known in the art. Polynucleotides used as these probes or primers can be used as reagents for determining the risk of developing diabetes.
[0091]
(3) Immobilized sample
The immobilized sample of the present invention is produced by immobilizing the polynucleotide used as the probe described in (1) on a solid phase such as a glass plate, a nylon membrane, a microbead, a silicon chip, or a capillary. Immobilization to a solid phase may be a method of placing a previously synthesized polynucleotide on a solid phase, or a method of synthesizing a target polynucleotide on a solid phase. As a fixing method, for example, in the case of a DNA microarray, a method suitable for a target solid-phased sample, such as using a commercially available spotter (manufactured by Amersham), is well known in the art. Examples of such an immobilized sample include a gene chip, a cDNA microarray, an oligo array, a membrane filter, and the like.
[0092]
(4) Kit
The kit of the present invention contains a polynucleotide that can be used as the probe or the primer, and at least one or more selected from a solid-phased sample. The kit of the present invention may contain, as necessary, other reagents, instruments, and the like necessary for the determination method of the present invention, such as hybridization, labeling of a probe, detection of a label, and the like, as necessary. Good.
[0093]
5. Analysis and evaluation of detection results
From the results of the statistical analysis of the detection of the novel gene polymorphisms in diabetic patients and healthy subjects, the method of the present invention has a high probability that the type 1 diabetes, type 2 diabetes, type 2 diabetes with diabetic nephropathy, or diabetic It has been found that it is possible to determine the potential risk of developing type 2 diabetes without nephropathy.
[0094]
For example, according to the method of the present invention, as a result of examining a gene polymorphism in a sample containing an isolated human genomic DNA, a subject who meets one or more of the following conditions is identified as having the type 2 Information that the risk of developing diabetes is relatively high can be provided.
a) having a gene in which the nucleotide at position 36 (nucleotide number 632 of SEQ ID NO: 1 in the sequence listing) of the first intron of the GFAT1 gene is c (cytosine);
b) having a gene in which the seventh nucleotide (nucleotide number 266 of SEQ ID NO: 2 in the sequence listing) of the eleventh intron of the GFAT1 gene is g (guanine);
c) having a gene in which the -147th nucleotide (nucleotide number 338 of SEQ ID NO: 3) of intron 12 of the GFAT1 gene is t (thymine);
d) having a gene in which t (thymine) present at nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4) is repeated 25 times;
e) the GFAT1 gene has a gene in which a (adenine) is present 19 times at nucleotides 1988 to 2007 (nucleotide numbers 328 to 347 of SEQ ID NO: 5) in the 12th intron of the GFAT1 gene;
f) having a gene in which t (thymine) repeats at nucleotides -11 to -22 (nucleotide numbers 253-264 of SEQ ID NO: 6) of intron 18 of the GFAT1 gene are repeated 11 or 12 times;
h) having a gene in which the nucleotide at position 66 (nucleotide number 2251 in SEQ ID NO: 3) of exon 18 of the GFAT2 gene is t (thymine);
Among them, subjects meeting the conditions of a) and / or b) have a relatively high risk of developing type 2 diabetes with diabetic nephropathy, and subjects meeting the condition of h) have a particularly high risk. The risk of developing type 2 diabetes without nephropathy is relatively high.
[0095]
Also, by detecting a haplotype in which two or more gene polymorphisms are combined, it is possible to determine the potential risk of developing diabetes. For example, by detecting one or two or more of the following haplotypes x) to z), the risk of the subject developing type 2 diabetes or type 2 diabetes without nephropathy can be determined. Furthermore, the haplotype of z) can also be used to determine the risk of developing type 1 diabetes or type 2 diabetes with nephropathy.
[0096]
x) Present at the 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1) and at the -11th to -22nd nucleotides of the 18th intron (nucleotide numbers 253 to 264 of SEQ ID NO: 6) Haplotype combining different genetic polymorphisms
y) Present at the seventh nucleotide of intron 11 of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2) and at the nucleotides -11 to -22 of the intron 18 (nucleotide numbers 253-264 of SEQ ID NO: 6) Haplotypes combining different genetic polymorphisms
z) The nucleotides -11 to -22 of intron 18 of the GFAT1 gene (nucleotides 253-264 of SEQ ID NO: 6) and the nucleotides 2632-2661 of intron 3 of the GFAT1 gene (nucleotides 237-264 of SEQ ID NO: 7) 266) Haplotype combining gene polymorphisms
[0097]
According to the present invention, a subject whose relative risk of developing diabetes is found to be relatively high based on the above-described criteria can be notified to that effect, and measures can be taken in advance to prevent the development of diabetes. Therefore, the present invention is extremely useful as a test method for preventing diabetes (particularly, type 2 diabetes).
[0098]
6. DNA encoding GFAT1
The present invention also provides a DNA encoding human GFAT1 (glutamine: fructose-6-phosphate amide transferase 1).
[0099]
The DNA encoding human GFAT1 specified by the present inventors has a nucleotide sequence as shown in SEQ ID NO: 22, is 93390 bases in length, and consists of 19 exons and 18 introns. However, the DNA is not limited to this nucleotide sequence, and DNA consisting of a nucleotide sequence having at least 85% or more, preferably 90% or more, more preferably 95% or more homology with the nucleotide sequence represented by SEQ ID NO: 22 is also a human DNA. Derived protein having GFAT activity: Included in the DNA of the present invention as long as it encodes GFAT1.
[0100]
Further, DNA that hybridizes under stringent conditions with DNA consisting of a nucleotide sequence complementary to the DNA consisting of the nucleotide sequence represented by SEQ ID NO: 22 is also a human-derived protein having GFAT activity: GFAT1. Included in the DNA of the present invention. Note that the stringent condition preferably refers to a condition of 0.5 × SSC and a temperature of 55 ° C., more preferably 0.1 × SSC and a temperature of 65 ° C.
[0101]
The human GFAT1 gene is rich in mutations. As described above, there are a plurality of genetic polymorphisms associated with the development of diabetes on the nucleotide sequence. Therefore, the DNA of the present invention is extremely useful for determining the risk of developing diabetes.
[0102]
GFAT is an enzyme that catalyzes the reaction from fructose-6-phosphate to glucosamine-6-phosphate, which is the rate-limiting step, in the hexosamine biosynthesis pathway. Therefore, a drug that inhibits GFAT activity can promote uptake of glucose into cells and reduce blood sugar level, and is expected to be a potential therapeutic drug for diabetes. That is, it is possible to screen for a therapeutic agent for diabetes using the expression level of the DNA of the present invention as an index.
[0103]
【Example】
Hereinafter, the present invention will be described more specifically with reference to Examples, but the present invention is not limited thereto.
Example 1 Preparation of Genomic DNA from Peripheral Blood
Leukocytes were separated from peripheral blood of healthy Japanese healthy subjects, type 1 diabetic patients, type 2 diabetic patients (without nephropathy), and type 2 diabetic patients (with nephropathy). From this leukocyte, a genomic DNA sample of each subject was extracted using an automatic DNA extraction device (NA-1000: manufactured by Kurabo Industries). The absorbance at 260 nm of the obtained DNA samples was measured, and the DNA concentration of each sample was calculated. Thereafter, the genomic DNA was diluted to 50 ng / μl using sterile distilled water to obtain a PCR sample.
[0104]
Example 2 Amplification of DNA fragment containing polymorphism by PCR method
Using the genomic DNA sample of each subject obtained in Example 1 as a template, a DNA fragment containing any of the seven polymorphic sites on the GFAT1 gene was amplified by the method described below.
[0105]
The 5′-end of each PCR primer used in this example was HEX (4,7,2 ′, 4 ′, 5 ′, 7′-hexachloro-6-carboxy @ fluorescein, green fluorescent dye), NED (Applied BioSystems, trade name, yellow fluorescent dye, or 6-FAM (Applied Biosystems, trade name, yellow-green fluorescent dye) labeled with a fluorescent dye was ordered and purchased from Applied Biosystems.
[0106]
1) PCR for detecting whether the nucleotide at position 36 (nucleotide number 632 of SEQ ID NO: 1) of the first intron of the GFAT1 gene is c (cytosine) or t (thymine):
PCR was performed with the following primers and reaction conditions to amplify a 0.16 kbp DNA fragment containing a polymorphic site.
PCR primers:
Primer No. 1: '5'-CACCGAAGCTCGTGTGTGCA-3' (SEQ ID NO: 8)
Primer No. 2: '5'-CGCCTTGGGCCTTAGCGGCA-3' (SEQ ID NO: 9)
(In both No. 1 and No. 2, the 5 'end is labeled with HEX.)
Reaction system:
PCR enhancer (Gibco, 11495-017) 6 μl
2.5 mM dNTP 2.4 μl
50 mM magnesium sulfate 1.5 μl
10 μM Primer No. 1 2μl
10 μM Primer No. 2 2μl
50 ng / μl genomic DNA 2 μl
10 × PCR reaction buffer 2 μl
(PCRx enhancer system: Attached to KYF Co., Ltd.)
Sterile water 2μl
Taq polymerase 0.1μl
( Takara Ex Taq : Takara Shuzo Co., Ltd. 5 unit / μ l )
Total 20 μl
PCR conditions: 94 ° C for 1 minute, 55 ° C for 1 minute, 72 ° C for 2 minutes, 40 cycles
[0107]
2) PCR for detecting whether the seventh nucleotide (nucleotide number 266 of SEQ ID NO: 2) of the 11th intron of the GFAT1 gene is g (guanine) or a (adenine):
PCR was performed using the following primers and reaction conditions to amplify a 0.22 kbp DNA fragment containing a polymorphic site.
PCR primers:
Primer No. 3: '5'-GGAAACTTTTAGTGTGTGTAC-3' (SEQ ID NO: 10)
Primer No. 4: '5'-CTGTCAGAGACACTGAAATA-3' (SEQ ID NO: 11)
(Both No. 3 and No. 4 label the 5 'end with HEX.)
Reaction system:
Dimethyl sulfoxide (DMSO) 1μl
2.0 mM dNTP 2 μl
25 mM magnesium sulfate 1.5 μl
10 μM Primer No. 3 2μl
10 μM Primer No. 4 2μl
50 ng / μl genomic DNA 2 μl
10 x PCR reaction buffer (attached to AmpliTaq Gold) 2 μl
Sterile water 7.4μl
Taq polymerase 0.1μl
( Gold Taq : AFRIO Biosystems Company), 5 unit / μ l )
Total 20μl
PCR conditions: 94 ° C for 1 minute, 55 ° C for 1 minute, 72 ° C for 2 minutes, 40 cycles
[0108]
3) PCR for detecting whether the -147th nucleotide (nucleotide number 338 of SEQ ID NO: 3) of intron 12 of the GFAT1 gene is A (adenine), T (thymine), or deletion:
PCR was performed using the following primers and reaction conditions to amplify a 0.14 kbp DNA fragment containing a polymorphic site.
PCR primers:
Primer No. 5: '5'-GCCATGCTTATCTCAAGTGGT-3' (SEQ ID NO: 12)
Primer No. 6: '5'-CATCGGGACTTCTTTGGATTCA-3' (SEQ ID NO: 13)
(Both No. 5 and No. 6 label the 5 'end with HEX.)
Reaction system:
2.5 mM dNTP 1.2 μl
50 mM {magnesium sulfate} 0.3 μl
10 μM Primer No. 5 0.5μl
10 μM Primer No. 6 0.5μl
50 ng / μl genomic DNA 1 μl
10 × PCR reaction buffer 1 μl
(Furatina Taq DNA polymerase: attached to Invitrogen, model number 10966-018)
Sterile water 5.45 μl
Platinum Taq DNA polymerase 0.05 μl
( Invitrogen Company model number 10966-018 , 5 unit / μ l )   
Total 10μl
PCR conditions: 35 cycles of 94 ° C for 30 seconds, 56 ° C for 30 seconds, and 72 ° C for 1 minute
[0109]
4) PCR for detecting whether the repetition of the nucleotide T (thymine) at nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 of SEQ ID NO: 4) is 24 or 25 times:
PCR was performed using the following primers and reaction conditions to amplify a 0.26 kbp DNA fragment containing a polymorphic site.
PCR primers:
Primer No. 7: '5'-AAAAAACACAGTGAAACTCAAG-3' (SEQ ID NO: 14),
Primer No. 8: '5'-AACCCCGTCTCTACTAAAA-3' (SEQ ID NO: 15)
(Both No. 7 and No. 8 label the 5 'end with NED)
Reaction system:
2.5 mM dNTP 1.2 μl
25 mM {magnesium sulfate} 0.75 μl
10 μM Primer No. 7 0.5μl
10 μM Primer No. 8 0.5μ
150 ng / μl genomic DNA 1 μl
10 × PCR reaction buffer 1 μl
(PCRx enhancer system: Attached to KYF Co., Ltd.)
PCR enhancer 3μl
(Attached to KYF Co., Ltd.)
Sterile water 2μl
Taq polymerase 0.05μl
( Takara Ex Taq : Takara Shuzo Co., Ltd. 5 unit / μ l )   
Total 10μl
PCR conditions: 35 cycles of 94 ° C for 30 seconds, 54 ° C for 30 seconds, and 72 ° C for 1 minute
[0110]
5) Determine whether the number of repetitions of the nucleotide A (adenine) at positions 1988 to 2007 of the twelfth intron of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5) is 18, 19, 24, or 25 times PCR to detect:
PCR was performed using the following primers and reaction conditions to amplify a 0.22 kbp DNA fragment containing a polymorphic site.
PCR primers:
Primer No. 9: '5'-AGAATCATGCCTCTGAATAG-3' (SEQ ID NO: 16)
Primer No. 10: '5'-GATGGGGAAAGAAGAGAGAAA-3' (SEQ ID NO: 17)
(Both No. 9 and No. 10 label the 5 'end with FAM)
Reaction system:
2.5 mM dNTP 1.2 μl
50 mM {magnesium sulfate} 0.3 μl
10 μM Primer No. 9 0.5μl
10 μM Primer No. 10 0.5μl
50 ng / μl genomic DNA 1 μl
10 × PCR reaction buffer 1 μl
(Furatina Taq DNA polymerase: attached to Invitrogen, Model No. 10966-018)
Sterile water 5.45 μl
Platinum Taq DNA polymerase 0.05 μl
( Invitrogen Company, model number 10966-018 , 5 unit / μ l )   
Total 10μl
PCR conditions: 35 cycles of 94 ° C for 30 seconds, 54 ° C for 30 seconds, and 72 ° C for 1 minute
[0111]
6) Detecting whether the repetition of nucleotides T (thymine) at positions −11 to −22 of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6) is 11, 12, or 13 times PCR for:
PCR was performed with the following primers and reaction conditions to amplify a 0.21 kbp DNA fragment containing a polymorphic site.
PCR primers:
Primer No. 11: '5'-GATGGTTAATGAATGTATTGT-3' (SEQ ID NO: 18)
Primer No. 12: '5'-GCTTAATCATACAGTTTCTGT-3' (SEQ ID NO: 19)
(No. 11 labels the 5 'end with FAM, No. 12 labels the 5' end with HEX)
Reaction system:
2.5 mM dNTP 1.1 μl
50 mM {magnesium chloride} 1 μl
10 μM Primer No. 11 1μl
10 μM Primer No. 12 1μl
50 ng / μl genomic DNA 1 μl
10 × PCR reaction buffer 1 μl
(LA Taq DNA Polymerase: Takara Shuzo, attached to model number RR002A)
Sterile water 3.85 μl
LATaq DNA polymerase 0.05 μl
(Takara Shuzo, model number RR002A , 5 unit / μ l )
Total 10μl
PCR conditions: 35 cycles of 94 ° C for 30 seconds, 54 ° C for 30 seconds, 72 ° C for 1 minute and 30 seconds
[0112]
7) Repeating the microsatellite marker CAA (cytosine, adenine, adenine) at positions 2632 to 2661 of the third intron of the GFAT1 gene (the region of nucleotide numbers 237 to 266 of SEQ ID NO: 7) 7 times, 9 times, 10 times, PCR for detecting 11 times or 12 times:
PCR was performed using the following primers and reaction conditions to amplify a 0.26 kbp DNA fragment containing a polymorphic site.
PCR primers:
Primer No. 13: '5'-CCCATCTCTACTAAAATACCA-3' (SEQ ID NO: 20)
Primer No. 14: '5'-CACTTCTTTCAAAAGCTACA-3' (SEQ ID NO: 21)
(In both No. 13 and No. 14, the 5 'end is labeled with HEX.)
Reaction system:
2.5 mM dNTP 1.1 μl
50 mM magnesium chloride 0.8 μl
10 μM Primer No. 13 1μl
10 μM Primer No. 14 1μl
50 ng / μl genomic DNA 1 μl
10 × PCR reaction buffer 1 μl
(LA Taq DNA Polymerase: Takara Shuzo, attached to model number RR002A)
Sterile water 4.05μl
LATaq DNA polymerase 0.05 μl
(Takara Shuzo, model number RR002A , 5 unit / μ l )
Total 10μl
PCR conditions: 94 ° C for 30 seconds, 56 ° C for 30 seconds, 72 ° C for 1 minute and 30 seconds for 40 cycles
[0113]
8) PCR for detecting whether the nucleotide at the 66th position of exon 18 of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 3 in the sequence listing) is c (cytosine) or t (thymine):
PCR was performed using the following primers and reaction conditions to amplify a 205 bp DNA fragment containing the polymorphic site.
PCR primers:
Primer No. 15: '5'-CCCATCTCTACTAAAATACCA-3' (SEQ ID NO: 24)
Primer No. 16: '5'-CACTTCTTTCAAAAGCTACA-3' (SEQ ID NO: 25)
(In both No. 15 and No. 16, the 5 'end is labeled with HEX.)
Reaction system:
2.5 mM dNTP 3.2 μl
2.5 mM {magnesium sulfate} 2.8 μl
10 μM Primer No. 15 2μl
10 μM Primer No. 16 2μl
50 ng / μl genomic DNA 2 μl
10 × PCR reaction buffer 2 μl
(LA Taq DNA Polymerase: Takara Shuzo, attached to model number RR002A)
Sterile water 9μl
LATaq DNA polymerase 0.1 μl
(Takara Shuzo, model number RR002A , 5 unit / μ l )
Total 20μl
PCR conditions: 94 ° C for 30 seconds, 56 ° C for 30 seconds, 72 ° C for 1 minute and 30 seconds for 40 cycles
[0114]
[Example 3] Detection of polymorphism of GFAT gene
1) Analysis using DNA sequencer
The nucleotide sequence for identifying each polymorphic site of the GFAT gene was determined by a conventional method using a DNA sequencer (ABI PRISM 377: manufactured by Applied Biosystems).
[0115]
As a result, it was confirmed that each polymorphism exists at the following positions.
a) the 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1);
b) the seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2);
c) nucleotide -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3);
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4);
e) nucleotides 1988 to 2007 of intron 12 of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5);
f) nucleotides -11 to -22 of intron 18 of the GFAT1 gene (nucleotide numbers 253-264 of SEQ ID NO: 6);
g) nucleotides 2632 to 2661 of the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 in SEQ ID NO: 7)
h) The 66th nucleotide of the 18th exon of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 23)
[0116]
2) SSCP method
One-fifth of each PCR product obtained in Example 2 was added to a 5: 1 mixture of formamide solution: loading buffer (0.05 M EDTA aqueous solution containing 0.03 g / ml blue dextran) and mixed. After heat denaturation at 95 ° C. for 2 minutes, the mixture was cooled on ice to prepare a sample for electrophoresis. This sample was electrophoresed on a non-denaturing polyacrylamide gel, and a polymorphism was detected based on a difference in mobility of a DNA fragment based on a difference in allele. The electrophoresis gel used was a 12% polyacrylamide gel to which 5% glycerol was added (gel thickness: 0.2 mm). In addition, in order to confirm that there is no change in polymorphism detection due to a difference in measurement conditions, 10% polyacrylamide and 5% glycerol were added, and 12% polyacrylamide gel was added with 10% glycerol. The test was performed under the following two conditions. In the electrophoresis, a DNA sequencer (ABI PRISM 377: manufactured by Applied Biosystems) was used and an A filter was used at a constant power of 30 watts for 3 to 12 hours. The fluorescent band was detected using the detection function of the DNA sequencer. During the electrophoresis, in order to maintain the gel plate temperature, water adjusted to 20 ° C. by a cooling device (RTE-III, manufactured by Neslab) was circulated outside the gel plate. In addition, according to the method described in 1) of Example 3, the genotype of the GFAT gene polymorphism was determined using the DNA fragment for which the nucleotide sequence of the polymorphic site was determined as a positive control.
[0117]
[Example 4] Association between polymorphism of GFAT gene and diabetes
The association of the GFAT1 gene with type 1 diabetes, type 2 diabetes, and diabetic nephropathy was analyzed by association analysis (association method) (Fisher et al., Biostatistics, John Willey & Sons, 1993). . The haplotype analysis was performed using the Arlequin program (statistical analysis software manufactured by Laurent @ Excoffier, URL: http://lgb.unige.ch/arlequin/). For the significance test, exact {test} of {population} differentiation (PD test), which is an extension of Fisher's direct probability calculation method, was used ("Basic Medical Statistics: Revised 4th Edition", co-authored by Katsumi Kano and Hideto Takahashi, Nankodo, 1995). Year). The significance level was set at a risk rate of 5%, and those having a risk rate of less than 5% were determined to have a significant difference.
[0118]
1) Relationship between type 2 diabetes and polymorphism at nucleotide 36 (nucleotide number 632 of SEQ ID NO: 1) of the first intron of the GFAT1 gene
For 141 healthy Japanese subjects and 388 Japanese type 2 diabetic patients (156 with nephropathy and 232 without nephropathy), the 36th position of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1) The polymorphism frequency in was calculated, and the association with diabetes was analyzed by the association method. Table 1 shows the results.
[0119]
[Table 1]
Figure 2004000115
[0120]
In Table 1, a subject homozygous for the gene in which the thirty-sixth intron of the GFAT1 gene is t (thymine) is “TT”, and a subject homozygous for the gene whose site is c (cytosine) is “CC”. Subjects with both genes heterozygously are designated as "TC". From the results in Table 1, it was shown that the allele frequency at the 36th nucleotide of intron 1 of the GFAT1 gene was statistically significantly different between healthy subjects and type 2 diabetic patients (with nephropathy). This indicates that the relative risk of developing type 2 diabetes associated with diabetic nephropathy can be determined by examining the gene polymorphism at the 36th nucleotide of the first intron of the GFAT1 gene.
[0121]
2) Relationship between type 2 diabetes and polymorphism at the seventh nucleotide (nucleotide number 266 of SEQ ID NO: 2) of intron 11 of the GFAT1 gene
For 137 Japanese healthy people and 377 Japanese type 2 diabetic patients (149 with nephropathy, 228 without nephropathy), the seventh intron 11 of the GFAT1 gene (nucleotide number 266 in SEQ ID NO: 2) The nucleotide polymorphism frequency was calculated, and the association with diabetes was analyzed by the association method. Table 2 shows the results.
[0122]
[Table 2]
Figure 2004000115
[0123]
In Table 2, a subject homozygous for the gene in which the 7th intron of the GFAT1 gene is g (guanine) is “GG”, and a subject homozygous for the gene in which the site is a (adenine) is “AA”. Subjects with heterozygous both genes are designated as "GA". The results in Table 2 showed that the allele frequency at the seventh nucleotide of the eleventh intron of the GFAT1 gene was statistically significantly different between healthy individuals and patients with type 2 diabetes (with nephropathy). This indicates that the relative risk of developing type 2 diabetes associated with diabetic nephropathy can be determined by examining the gene polymorphism at the seventh nucleotide of the 11th intron of the GFAT1 gene.
[0124]
3) Relationship between type 2 diabetes and a genetic polymorphism at the 66th nucleotide of exon 18 (nucleotide number 2251 of SEQ ID NO: 23) of the GFAT2 gene
For 144 Japanese healthy subjects and 398 Japanese patients with type 2 diabetes (158 with nephropathy and 240 without nephropathy), the 66th nucleotide of exon 18 of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 3) ) Was calculated, and the association with diabetes was analyzed by the association method. Table 3 shows the results.
[0125]
[Table 3]
Figure 2004000115
[0126]
In Table 3, subjects having a homozygous gene whose c-position is c (cytosine) at exon 18 of the GFAT2 gene are “CC”, and subjects having a homozygous gene whose site is t (thymine) are “TT”. And subjects with both genes heterozygously are designated as "TC". From the results in Table 3, GFAT2 was found between healthy subjects and type 2 diabetic patients (without nephropathy) and between type 2 diabetic patients (with nephropathy) and type 2 diabetic patients (without nephropathy), respectively. It was shown that the polymorphism frequency of nucleotide 66 of exon 18 of the gene was statistically significantly different. This indicates that the relative risk of developing type 2 diabetes without diabetic nephropathy can be determined by examining the polymorphism at the 66th nucleotide of exon 18 of the GFAT2 gene.
[0127]
4) Relationship between type 2 diabetes and the T repetitive polymorphism in the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
For 191 Japanese healthy people and 384 Japanese type 2 diabetic patients, the allele frequency at the T repeat polymorphism in the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 of SEQ ID NO: 4) was calculated, and the association was calculated. The relationship with diabetes was analyzed by the method. Table 4 shows the results.
[0128]
[Table 4]
Figure 2004000115
[0129]
In Table 4, when the number of T repetitions (nucleotide numbers 336 to 360 of SEQ ID NO: 4) in the eighth intron of the GFAT1 gene is 24, it is represented as "T24", and when it is 25, it is represented as "T25". . From the results in Table 4, it was shown that the allele frequency of the T polymorphism in the eighth intron of the GFAT1 gene was statistically significantly different between healthy individuals and patients with type 2 diabetes. This indicates that the relative risk of developing type 2 diabetes can be determined by examining the repeated T polymorphism in the eighth intron of the GFAT1 gene.
[0130]
5) Relationship between type 2 diabetes and the repetitive polymorphism of A in the twelfth intron of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
For all 189 healthy Japanese people and 389 Japanese type 2 diabetic patients, the allele frequency of type 2 diabetes and the A polymorphism in the intron 12 of the GFAT1 gene was calculated, and the association with diabetes was determined by the association method. Analyzed. Table 5 shows the results.
[0131]
[Table 5]
Figure 2004000115
[0132]
In Table 5, when the number of A repeats (nucleotide numbers 328 to 347 of SEQ ID NO: 5) in the twelfth intron of the GFAT1 gene is 18, "A18", 19 times, "A19", and 24 times It is represented as "A24" or "A25" in the case of 25 times. From the results in Table 5, it was shown that the allele frequency of the T repetitive polymorphism in the intron 12 of the GFAT1 gene was statistically significantly different between healthy individuals and patients with type 2 diabetes. This indicates that the relative risk of developing type 2 diabetes can be determined by examining the repeated A polymorphism in the twelfth intron of the GFAT1 gene.
[0133]
6) Relationship between type 2 diabetes and the T repetitive polymorphism in intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
For 192 Japanese healthy volunteers and 373 Japanese type 2 diabetic patients, the allele frequency at the repeated T polymorphism (nucleotide numbers 253 to 264 of SEQ ID NO: 6) in the 18th intron of the GFAT1 gene was calculated, and the association was calculated. The relationship with diabetes was analyzed by the method. Table 6 shows the results.
[0134]
[Table 6]
Figure 2004000115
[0135]
In Table 6, when the number of T repetitions (nucleotide numbers 253 to 264 of SEQ ID NO: 6) in the 18th intron of the GFAT1 gene is 11, “T11”, 12 times, “T12”, or 13 times Is represented as “T13”. From the results in Table 6, it was shown that the allele frequencies of type 2 diabetes and the T polymorphism in the intron 18 of the GFAT1 gene were statistically significantly different between healthy individuals and patients with type 2 diabetes. This indicates that the relative risk of developing type 2 diabetes can be determined by examining the repeated T polymorphism in the intron 18 of the GFAT1 gene.
[0136]
7) Relationship between type 2 diabetes and nucleotide polymorphism (nucleotide number 338 in SEQ ID NO: 3) in intron 12 of the GFAT1 gene
For 192 Japanese healthy people and 377 Japanese type 2 diabetic patients, the allele frequency of type 2 diabetes and nucleotide polymorphism in the intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3) was calculated, and the association was calculated. The relationship with diabetes was analyzed by the method. Table 7 shows the results.
[0137]
[Table 7]
Figure 2004000115
[0138]
In Table 7, when the nucleotide (nucleotide number 338 in SEQ ID NO: 3) of the twelfth intron of the GFAT1 gene is adenine, it is expressed as "A", thymine as "T", or deletion as "del". Is represented. The results in Table 7 indicate that the allele frequency of the nucleotide (nucleotide 338 in SEQ ID NO: 338) polymorphism in the 12th intron of the GFAT1 gene is statistically significantly different between healthy individuals and patients with type 2 diabetes. Was done. This indicates that the relative risk of developing type 2 diabetes can be determined by examining the polymorphism of the nucleotide (nucleotide number 338 of SEQ ID NO: 3) in the twelfth intron of the GFAT1 gene.
[0139]
8) Type 2 diabetes and a polymorphism at nucleotide 36 (nucleotide number 632 of SEQ ID NO: 1) of the first intron of the GFAT1 gene and a polymorphism of T repeat (nucleotide numbers 253-264 of SEQ ID NO: 6) at intron 18 Relationship to combined haplotypes
For 141 healthy Japanese subjects and 366 Japanese type 2 diabetic patients (145 with nephropathy and 221 without nephropathy), the 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number of SEQ ID NO: 1) 632) The haplotype frequency was calculated by combining the polymorphism and the polymorphism of T repeats (nucleotide numbers 253 to 264 of SEQ ID NO: 6) in the 18th intron, and the association with diabetes was analyzed by the association method. Table 8 shows the results.
[0140]
[Table 8]
Figure 2004000115
[0141]
In Table 8, subjects having a homozygous gene in which the 36th of the first intron of the GFAT1 gene is T (thymine) are “T / T”, and subjects having a homozygous gene in which the site is C (cytosine) are represented as “T / T”. C / C ”and subjects having both genes heterozygously are represented as“ T / C ”. In Table 8, when the number of T repetitions (nucleotide numbers 253 to 264 of SEQ ID NO: 6) in the 18th intron of the GFAT1 gene is 11, "T11", when it is 12, "T12", or 13 Is represented as “T13”. Furthermore, genotypes generated by each combination are represented as “T13 / T13”, “T13 / T12”, “T12 / T12”, “T13 / T11”, “T12 / T11”, or “T11 / T11”. Have been. From the results in Table 8, it is shown that the frequency distribution of each haplotype is significantly different in the comparison between healthy subjects and type 2 diabetic patients and between healthy subjects and type 2 diabetic patients (without nephropathy). Was done. This indicates that the 36th nucleotide (nucleotide number 632 of SEQ ID NO: 1) polymorphism of the first intron of the GFAT1 gene and the T repetition (nucleotide numbers 253-264 of SEQ ID NO: 6) polymorphism in the 18th intron. This indicates that the relative risk of developing type 2 diabetes or type 2 diabetes without diabetic nephropathy can be determined by examining a haplotype in which is combined.
[0142]
9) Type 2 diabetes and a polymorphism at the seventh nucleotide (nucleotide number 266 of SEQ ID NO: 2) of the 11th intron of the GFAT1 gene and a polymorphism of T repeat (nucleotide numbers 253-264 of SEQ ID NO: 6) at the 18th intron. Relationship to combined haplotypes
For 143 Japanese healthy subjects and 367 Japanese type 2 diabetic patients (145 with nephropathy and 222 without nephropathy), the seventh nucleotide of the 11th intron of the GFAT1 gene (nucleotide number of SEQ ID NO: 2) 266) The haplotype frequency was calculated by combining the polymorphism and the polymorphism of the T repeat (nucleotide numbers 253 to 264 of SEQ ID NO: 6) in the 18th intron, and the association with diabetes was analyzed by the association method. Table 9 shows the results.
[0143]
[Table 9]
Figure 2004000115
[0144]
In Table 9, subjects homozygous for the gene in which the seventh intron of the GFAT1 gene is G (guanine) are “G / G”, and subjects homozygous for the gene whose site is A (adenine) are “G / G”. A / A ", and subjects having both genes heterozygously are represented as" G / A ". In Table 9, “T11” when the number of T repetitions (nucleotide numbers 253 to 264 of SEQ ID NO: 6) in the 18th intron of the GFAT1 gene is 11; “T12” when the number is 12; Is represented as “T13”. Furthermore, genotypes generated by each combination are represented as “T13 / T13”, “T13 / T12”, “T12 / T12”, “T13 / T11”, “T12 / T11”, or “T11 / T11”. Have been. From the results in Table 9, it is shown that the frequency distribution of each haplotype is significantly different in the comparison between healthy subjects and type 2 diabetic patients and between healthy subjects and type 2 diabetic patients (without nephropathy). Was done. This combined the 7th nucleotide (nucleotide number 266 of SEQ ID NO: 2) polymorphism of the 11th intron of the GFAT1 gene with the T repeat (nucleotide numbers 253-264 of SEQ ID NO: 6) polymorphism at the 18th intron. This indicates that the relative risk of developing type 2 diabetes or type 2 diabetes without diabetic nephropathy can be determined by examining haplotypes.
[0145]
10) Type 1 and type 2 diabetes and microsatellite in the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 of SEQ ID NO: 7) and T repeat in intron 18 (nucleotide numbers 253 to 264 of SEQ ID NO: 6) Relationship with haplotypes combining polymorphisms
In 143 Japanese healthy subjects, 64 Japanese type 1 diabetic patients, and 372 Japanese type 2 diabetic patients (143 with nephropathy, 229 without nephropathy), the microstructure in the third intron of the GFAT1 gene was determined. The haplotype frequency was calculated by combining the satellite (nucleotide numbers 237 to 266 of SEQ ID NO: 7) polymorphism and the T repetition (nucleotide numbers 253 to 264 of SEQ ID NO: 6) polymorphism in the 18th intron. The association was analyzed. Table 10 shows the results.
[0146]
[Table 10]
Figure 2004000115
[0147]
In Table 10, when the number of repetitions of the microsatellite (nucleotide numbers 237 to 266 of SEQ ID NO: 7) CAA (cytosine, adenine, adenine) in the third intron of the GFAT1 gene is 7 times, "7"; "9", "10" for 10 times, "11" for 11 times, or "12" for 12 times. The genotypes produced by each combination are “9/9”, “9/10”, “10/10”, “9/11”, “10/11”, “11/11”, “9/9”. 12 "," 10/12 "," 11/12 "," 12/12 "," 9/7 "," 10/7 "," 11/7 "," 12/7 ", or" 7/7 " ”. Furthermore, in Table 10, when the number of T repetitions (nucleotide numbers 253 to 264 of SEQ ID NO: 6) in the 18th intron of the GFAT1 gene is 11, "T11", when it is 12, "T12", or 13 Is represented as “T13”, and the genotypes generated by each combination are “T13 / T13”, “T13 / T12”, “T12 / T12”, “T13 / T11”, and “T12 / T11”. , Or “T11 / T11”. From the results in Table 10, comparison between healthy subjects and type 2 diabetic patients as a whole, healthy subjects and type 2 diabetic patients (with nephropathy), healthy subjects and type 2 diabetic patients (without nephropathy), and healthy subjects with type 1 diabetes All comparisons with diabetic patients showed that the frequency distribution in each haplotype was significantly different. This combined the microsatellite (nucleotide numbers 237-266 of SEQ ID NO: 7) polymorphism in the third intron of the GFAT1 gene with the T repeat (nucleotide numbers 253-264 of SEQ ID NO: 6) polymorphism in the 18th intron. Demonstrates that the relative risk of developing type 1 diabetes, type 2 diabetes, type 2 diabetes with diabetic nephropathy, or type 2 diabetes without diabetic nephropathy can be determined by examining haplotypes It is.
[0148]
【The invention's effect】
According to the present invention, the relative risk of developing type 1 diabetes, type 2 diabetes, type 2 diabetes with diabetic nephropathy, or type 2 diabetes without diabetic nephropathy is easily determined. be able to. That is, the present invention provides a method for determining the risk of developing diabetes and materials for the method.
[0149]
[Sequence list]
SEQUENCE LISTING
<110> @Itakura, @Mitsuo
Sankyo Company, Limited
<120> Method for determining a risk of developing diabetes <130> 20020205SU
<150> JP2001-271870
<151> $ 2001-09-07
<150> JP2002-090861
<151> 2002-03-28
<160> $ 25
<170> \ PatentIn \ Ver. 2.1
<210> 1
<211> $ 782
<212> DNA
<213> \ Homo \ sapiens
<220>
<223> @inventor: Itakura, @Mitsuo; @Yasumo, @Hiroaki; @Watanabe, @Ichiro <220>
<221> @variation
<222> @ (632)
<223> Description of version: single nucleotide polymorphism involving replacement of of (C) and (T)
<400> $ 1
ccagatttcc \ ctttttcatac \ ttcctgcttttttttcctcctc \ ttttcctcgct \ tcgtgcagtg @ 60
ctggcgcctg gggcctggggg ctgcacgggg cacgcacccg ggcttattgct ttgctaacaa 120
ttccatcctt \ ctcttttccgt \ cattcccctgc \ caggtgctga \ gtttctccct \ ccctctcggc 180
tcggtccctc ccgcggctcg ccccgggggcg ggcgtccca ggaactccag gcggacgcgg 240
cccacgccca @ ctgccacgtc @ gccgccgcca @ gcagtccagc @ gcctgcgtgtg @ gctcgggggg300
cgggggagcg ctggggagcg ggacttgcgc gtgagcggcg cgtgagcggt tcaatggagc 360
ctacggggcgg cggcgcgctg cgcgccgagg ggcggggccc ggcggcgggtt gctggcggag 420
cccggggagggc ggagaaggct gtcgttgcct tggccgtcgc atccccgagg gagtcgtgtc 480
ggcgccaccc cggcccccga gccccgcatat tgccccaccga agctcgtgtg tgcacccccg 540
atcccgccag ccactcgccc ctggcctcgc gggccgtgtc tccggcatca tgtgtgggtaaa600
ggggggccgggg agcggggggggc gtgttgccgg gyggcgctgg gggtgcgggtgc gggtgccgct 660
aagccccaag @ gcgacggggcg @ gaagcgggag @ tgtgggaggt @ gcgaagtctg @ ggtgatggggc720
aagggggcgcc @ cagtgggtgc @ tgcggggggcg @ ggggccggca @ tccacggggcg @ gagaggggg @ 780
tg $ 782
<210> $ 2
<211> $ 675
<212> DNA
<213> \ Homo \ sapiens
<220>
<221> @variation
<222> (266)
<223> Description of version: single nucleotide polymorphism involving replacement of (G) and (A)
<400> $ 2
agtagaaaat \ attgtcaccc \ agtcttttag \ gcagtcatgt \ cttatgcatg \ aacttttttt60
atattttattt @ taccagaattt @ attattaaagg @ aaacttttag @ ttgtgttcaaaa @ attcttttt @ 120
ttgattttgtt ttttgttttaa tttatgtgatt tcttatacta taggcaactt cagttcatt 180
atgcagaagg aaattattga gcagccagag tctgtcgtga acacaatgag aggaagagtc 240
aacttgatg actatactgg taatttrcata tgaattatttt tattattttca gtgtctctgag300
catagtagggg \ tgccattaac \ acctgaaaag \ ttcattgccc \ tatatagcct \ tgttagaaaca 360
ctacagctgc cagccatcag tggagcccag ccatcttga aaaagttcttt tagtgtgtga 420
ttctacctat @ ataagatatc @ tagatagtc @ agattcacag @ aaagaagaag @ tagattataatg @ 480
gttaccagg @ gctgtgggga @ gggggaaatgg @ gagtcactg @ tttaaaagggt @ acagagtttc @ 540
agttgtgggga tgatgaaatt acagaaatgg attgtagtga tggttgcaca ataatgtgaa 600
tgtgcttaat \ gccactgaat \ tgtactattta \ aacatagtta \ aaatggtaaaa \ ttttattgtgt \ 660
aggtacccca ctgtg 675
<210> $ 3
<211> $ 780
<212> DNA
<213> \ Homo \ sapiens
<220>
<221> @variation
<222> (338)
<223> Description of version: single nucleotide polymorphism involving replacement of of (A) and (T)
<400> $ 3
ctttggggagg ctgaggcgag cacatcatga ggtcaggaga ttgagaccat cctggccaac 60
atggtgaaac cccatctctta ctaagctggg catgggtggcg cacgcctata gtccccagcta 120
ctcaggaggc tgaggcagga gaattgctttg aacccggggag gcgggaggtta cgggtgagccg 180
agatggcacc actgcactcc agcctggcga cagagcgaga ctccgtctca aaaaaaaaa 240
aaaaaaaaagg aatgtataca tagatagttg tctaaaagaga ctgatatagtaa aattgttagcc 300
atgcttattct \ caagtggtag \ gattttgatt \ ttttttwaa \ aattttttaa \ tctggggttgt \ 360
tttattttttc \ taacgtgtca \ ttttttgtat \ kagaaaaagc \ aaaaaactata \ cattgaatcc \ 420
aaaagagtcc \ gattgaaaag \ tatttgaagg \ aaagttctgt \ gaccaagtca \ tatttttctct \ 480
gcagacacgt caagtctttg aggagctgac tgagttgcct gtgatgggtggg aactagcaag 540
tgacttcctg \ gacagaaaaca \ caccagtcttt \ tcgagatat \ gtttgcttttt \ tccttagtca \ 600
atcaggtgtg \ ttaattttaa \ agacttaaaa \ ggaaggaaag \ ttattctttttc \ taataatttct \ 660
agcatatcttt ggcaaaagct gattattaaa gataaaactgg cattgcagat gactgacga 720
atacagatttt @ attttattagtt tacataattc @ tttatgaatt @ agtaaaaattg @ aaccacctttt780
<210> $ 4
<211> $ 720
<212> DNA
<213> \ Homo \ sapiens
<220>
<221> @variation
<222> @ (336). . (360)
<223> \ Description \ of \ variation: \ (T) 24 \ or \ (T) 25 \ repeat \ polymorphism <400> \ 4
cgggttcaag \ cgagtctcat \ gcctcagcct \ ccagagtagc \ tgggactaccc \ agtgcaacc \ 60
accacaccccg gctactactt gttatttttag tagagacgggg gttttcgccat tttggccgggg 120
ctaatctcga \ actcctgacc \ tcaggtgac \ cgccccacctc \ ggcctcccaa \ agtgctgggga 180
ttacaggtgt \ gagccgctgc \ accccagcctc \ aaatttttttt \ tacatattttt \ aactaatat \ 240
actttgttat ttgaagaatg aaattattcaa tatttggaga aaaacacag tgaaactcaa 300
gcctattagg \ acattttata \ agcaaaagta \ gttggttttttt \ tttttttttttt \ tttttttttt \ 360
gagacgaagt ctcgctctgtt tgctcaggct gtagtgcagt ggcgtgatct cggctcactg 420
caacctcggc ctcccggggttt caagcgagtc tcttgcctca gcctcctgag tagctgggat 480
tacaggcacg \ tgccaccaca \ ccccagcaat \ ttttcttattt \ ttagtagaga \ cgggggtttca \ 540
ggctgtttgct caggctgggtc tcaactcct gacctcatga tccgcccacc tcggcctccc 600
aaagtgctgg \ gattacaggc \ ctgagccacc \ acacctgtt \ gcatttatttt \ ttttttaaatg \ 660
ctgagctctc \ ttttttagtgg \ ttttttaattt \ actttttttg \ ttttgttttttt \ gagcaaaagt \ 720
<210> $ 5
<211> $ 660
<212> DNA
<213> \ Homo \ sapiens
<220>
<221> @variation
<222> @ (328). . (347)
<223> Description of version: (A) 18, (A) 19, (A) 24 or (A) 25 repeat polymorphism
<400> $ 5
atggaactact aggcataaat gatttaagta taggcctact aatatgcttt tcaaaaatttt 60
aattttctctcaggtttttgta gtggcattca gtggaatttta tagcattaag tactcttatt 120
gtgatggaaa tatgtcatttt tgtgttattta taaaaagtttg tttgcagctgg ggtgcagtgg 180
tgtgtgccta tagttccagc tcctcggaag ctgggggaggg aggcactt gagaccagga 240
attgaggcc @acagtgccct \ agaatcatgc \ ctctgaatag \ ctactactact \ ccagcctggg \ 300
caacaaacca agaccccatc tttaaccacaa aaaaaaaaaaaaaaaaagtt gccccaacta 360
aaaataaaaaa \ cttattaatta \ gcacagataaa \ attctgagat \ tactttttttg \ gggttttatta \ 420
ctttataata \ tctgggtaagc \ ctccagattt \ ctattctttct \ ctcttctttttc \ ccccatttttt \ 480
tattttgaag ataatatgattc caatgttaaca tttattattat aaactgggtg aaaaggtttg 540
gttttacattt @ attttgtggga \ aaacattag \ cattttaggtg \ tcggtaactt \ aatttatgtat \ 600
aaaaaaatat attaatggaa agaataata aaaaaatagga gcatttttatc ttcaatgatt 660
<210> $ 6
<211> $ 540
<212> DNA
<213> \ Homo \ sapiens
<220>
<221> @variation
<222> @ (253). . (264)
<223> \ Description \ of \ variation: \ (T) 11, \ (T) 12, \ or \ (T) 13 \ repeat \ polymorphism
<400> $ 6
tatgagggct actactctg tagaggcca ctagtagctct ttctgttgtga actggcacct 60
ttagattgctcttttcctaac caatttcagt ttttttcagg acactattatg tgattattatt 120
ttcttaatcta \ attctttttgta \ gtctgtaata \ agagggtta \ atgaatgtat \ tgtttttctgt180
tttttaaaaac aaaaaaattt tgctttatagt aaccacccccc ttccccaggtc tatataattct 240
ctcaaattctt gcttttttttt ttttcttttttt gcaggttgat ttcccacggga attctgcca 300
atctgtgact \ gtagaggtgag \ gaatatcttat \ acaaaatgta \ cgaaactgta \ tgattatagca \ 360
acacaagaca \ cctttttttat \ ttaaaacctt \ gatttaaaat \ atcaccccttt \ gaagcctttt \ 420
tttagtaat @ cctttatttat @ atcatcatta \ taattatttcc \ actcaatatg \ tgattttttgt \ 480
gagttacct \ ctttacatttt \ cccagtaatt \ tgtgggaggac \ ttttgaataat \ ggaatctata \ 540
<210> $ 7
<211> $ 360
<212> DNA
<213> \ Homo \ sapiens
<220>
<221> @variation
<222> @ (237). . (266)
<223> Description of version: (CAA) 7, (CAA) 9, (CAA) 10, (CAA) 11 or (CAA) 12 microsatellite repeat polymorphism
<400> $ 7
gggcgggattg cctgagctct ggagttttgag accagcctgg gcaacatggt gaaccaccccat 60
ctctactaaa \ atacaaaaaaa \ ttagccgggt \ gtggcggcgt \ gcacctgtag \ ttccagctat \ 120
tcgggaggtt gaggaggag aatcactga g atccaggagg cggaggttgc agtgagctga 180
gatcgtgcca ctgcactcca gcctgggtgagcagagtgagagctccgttctcc acaaaacaaca240
aacacaacaaca acaacaacaaa caacaaaaaa taagttgtat atgatagtga atgagcatat 300
gtagctttttg \ aaaagaaggtt \ actgaatctg \ gttctgcata \ tgggaacatg \ gataattcct \ 360
<210> $ 8
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer <400> \ 8
caccgaagct cgtgtgtggca 20
<210> $ 9
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 9
cgccttggggc cttagcggca 20
<210> $ 10
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 10
ggaaactttttagttgtgtac $ 20
<210> $ 11
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 11
ctgtcagaga actgaaata 20
<210> $ 12
<211> $ 21
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 12
gccatgctta @ tctcaagtgg @ t @ 21
<210> $ 13
<211> $ 21
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 13
catcggactt ctttggattc a 21
<210> $ 14
<211> $ 22
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 14
aaaaaaacaca gtgaaactca ag 22
<210> $ 15
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 15
aaaccccgtc tctactaaaaa 20
<210> $ 16
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 16
agaatcatgc ctctgaatag 20
<210> $ 17
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 17
gatgggggaaaa @ gaagagagaa @ 20
<210> $ 18
<211> $ 21
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 18
gagggttaat @ gaatgttattg @ t @ 21
<210> $ 19
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 19
gcttaatcat {acagttttcgt} 20
<210> $ 20
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 20
cccatctcta ctaaataacaac20
<210> $ 21
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 21
actctttttc aaaagctacaac20
<210> $ 22
<211> $ 93390
<212> DNA
<213> \ Homo \ sapiens
<220>
<221> @exon
<222> @ (16824). . (16952)
<220>
<221> @intron
<222> @ (16953). . (29910)
<220>
<221> @exon
<222> @ (29911). . (30019)
<220>
<221> @intron
<222> @ (30020). . (33917)
<220>
<221> @exon
<222> @ (33918). . (34025)
<220>
<221> @intron
<222> @ (34026). . (40361)
<220>
<221> @exon
<222> @ (40362). . (40487)
<220>
<221> @intron
<222> @ (40488). . (44706)
<220>
<221> @exon
<222> @ (44707). . (44765)
<220>
<221> @intron
<222> @ (44766). . (45569)
<220>
<221> @exon
<222> @ (45570). . (45704)
<220>
<221> @intron
<222> @ (45705). . (47473)
<220>
<221> @exon
<222> @ (47474). . (47535)
<220>
<221> @intron
<222> @ (47536). . (49463)
<220>
<221> @exon
<222> @ (49464). . (49543)
<220>
<221> @intron
<222> @ (49544). . (53849)
<220>
<221> @exon
<222> @ (53850). . (53955)
<220>
<221> @intron
<222> @ (53956). . (55698)
<220>
<221> @exon
<222> @ (55699). . (55862)
<220>
<221> @intron
<222> @ (55863). . (58034)
<220>
<221> @exon
<222> @ (58035). . (58130)
<220>
<221> @intron
<222> @ (58131). . (61782)
<220>
<221> @exon
<222> @ (61783). . (61880)
<220>
<221> @intron
<222> @ (61881). . (65464)
<220>
<221> @exon
<222> @ (65465). . (65585)
<220>
<221> @intron
<222> @ (65586). . (65974)
<220>
<221> @exon
<222> @ (65975). . (66132)
<220>
<221> @intron
<222> @ (66133). . (74228)
<220>
<221> @exon
<222> @ (74229). . (74343)
<220>
<221> @intron
<222> @ (74344). . (74602)
<220>
<221> @exon
<222> @ (74603). . (74730)
<220>
<221> @intron
<222> @ (74731). . (75591)
<220>
<221> @exon
<222> @ (75592). . (75759)
<220>
<221> @intron
<222> @ (75760). . (76953)
<220>
<221> @exon
<222> @ (76954). . (77115)
<220>
<221> @intron
<222> @ (77116). . (77794)
<220>
<221> @exon
<222> @ (77795). . (78753)
<220>
<221> @variation
<222> (16988)
<223> Description of version: single nucleotide polymorphism involving replacement of of (C) and (T)
<220>
<221> @variation
<222> @ (36657). . (36686)
<223> Description of version: (CAA) 7, (CAA) 9, (CAA) 10, (CAA) 11 or (CAA) 12 microsatellite repeat polymorphism
<220>
<221> @variation
<222> @ (51396). . (51420)
<223> \ Description \ of \ variation: \ (T) 24 \ or \ (T) 25 \ repeat \ polymorphism
<220>
<221> @variation
<222> (58137)
<223> Description of version: single nucleotide polymorphism involving replacement of (G) and (A)
<220>
<221> @variation
<222> @ (63868). . (638787)
<223> Description of version: (A) 18, (A) 19, (A) 24 or (A) 25 repeat polymorphism
<220>
<221> @variation
<222> (65318)
<223> Description of version: single nucleotide polymorphism involving replacement of of (A) and (T)
<220>
<221> @variation
<222> @ (77773). . (77784)
<223> \ Description \ of \ variation: \ (T) 11, \ (T) 12, \ or \ (T) 13 \ repeat \ polymorphism
<400> $ 22
aaccygtctct \ cttataaaaaa \ tmcaaaaaaat \ tagccggggca \ tggtgggcgggg \ ggcctgtagt \ 60
cccagctact cggggaggctg aggcaggaga atggcgtgaa cctgggagggc ggagcttgca 120
gtgaccccag attgcaccac tgactcccag cctgggcgac agagtgagac tctatctcaa 180
aaaaaaaaaaa agtaaccctg gaactaaaaat taataactact gaacttaaga actcattaga 240
ttggcatagtttgaagagaa gattatagta ctggaatttta agtcagtaga aaaatttag 300
cctgaagcac \ aggggagagaa \ gagaatagaa \ gatatgggaa \ agaagcatga \ gatgggtgggc \ 360
atgggtgctca cacctaatat tccagcact tggggaggttg aggtaggaggtattgcttgag 420
ctcagaagtt \ agagaccacc \ ctggcaacat \ agtgagacct \ tgtctctaca \ aaaaattaaaa \ 480
aaatagctg ggtgtggtggg tgtgcacctg tagtctcagc tgttcctgag gcgggaagat 540
tgcttgagcc cgggagattg aggctgcagt gggctgtgat caccaccttg cactctggtc 600
aaggagagag aaaaaagaccc tgtctcacca gaaaaaaaaaaatgaatcaa acctctggag 660
gggaagaata gaataaaaaa taattcatca attctgaaaa atgcaaaaata ggaaacagtat720
aatggtaata \ taaactcaaa \ aggtgttggca \ tttaatatac \ agtaggttga \ tgaacaaaaa \ 780
taagattgtc aaattgggatg taaaaaaacaacaaaaaaaaa atcaactata gactgcttag 840
aagagatata gggggccagggc atggcggcta atgcctgtaa tcctagcatt ttggggagcc 900
aaggtggcag \ attgctttgag \ cccaggagtt \ tgagccagc \ ctggggcaaca \ tagtgagcc \ 960
ccgtctctac @ aatgaaaagaaagagagaagagagaagaagaagagagaggggaggggagagagga1020
agtgaaggaa ggaaggggg agggagggga aaagaaaaagaggaaaaaggaaaa gaatatagatat 1080
attgttatga ccttcggggta ggcaatttttt ttttttttcc ccaacggggac acaagaaatc 1140
agataaaagac \ cggggcgcggt \ ggcttacacc \ tgtaatccca \ gcactttgag \ aggccgaggt \ 1200
gaatggatca \ tctgaggttg \ ggagttcgag \ accacctga \ ccacatatga \ gaacctttgt \ 1260
gtctactaaaaaaaaaaaaaaaaattagccacgcatgggtggcgggggacctgtaatccccagcta1320
ctcgggaggc @ tgaggcagga @ gaatcccttt @ aaccccgggag @ gcgggggtta @ cagtgagccg @ 1380
agatcgagcc attgcactcc agcctgggca acagaagcga aactccgtct taaaaaaaata 1440
atatatgtat @ atatatatca @ gataaaaatc @ agagaaaaata @ catataattt @ ggactacagt @ 1500
aaaattgtga \ ctgtctctttc \ atcagaagat \ gccatttggct \ gggcacagtg \ gctttgtgcct \ 1560
gtaattccag \ ctacttaaaa \ ggctgaggca \ ggggggggtc \ cctttgagcct \ aggagtttta \ 1620
gggtagcagtg \ agtgagctgt \ gatcatgcca \ ctgtattcca \ gcctatgtga \ caaagcgaga \ 1680
ctgttgaaaa gtgccatttta cagtcaaaag gcagggtaca gattatagagaa tatttacagt 1740
gtttatatga caatataaaaataacttta caatttggta agaaaaagac aatcagacac 1800
tggagcagtt actcgcaaaa agatgatcaa attgggctg ggcgcagtgg ctgacaccca 1860
taatcccggc actttgggag gctgaggtga gcgatcacc tgaggtcagg agttcaagat 1920
cagctttggcc aacatggtga aacatggtct ctactaaaaa tacaaaaaaat tagctgggggg 1980
tatttggtgca tgcctgtgat cccagctatc tgggaggttg aggcaggaga atcacctgta 2040
cccggggaggc @ ggaagttgca @ gtgagctgag @ atcgtgccat @ tgactcccag @ cctgggcaac @ 2100
aggtgagac tctgtctccca aaaaaaaaaaa ggaaaaaaagataatcaagta gccactaac 2160
atgaaaaaaat \ gcttaacctc \ atttagttatt \ gtgaattattc \ aaaccataat \ taaaattttg \ 2220
tacaaaaccca \ gtagatatagt \ taaaactatt \ agagtgaca \ acaccatttg \ ttgggtgagga \ 2280
tgtgggagcaa caagaactact catacactgc tgggtgggaat gtaagttttat actactggaa 2340
aactatggg catagtattat taaattctca catattcata ctcttttattc agcaattttca 2400
ctttcaggta \ tattccccagt \ agtaatat \ atgcatacca \ aaagacattt \ ctagaagaattct \ 2460
tatataactgc \ actattttgta \ aaagccaaaa \ cctaatgtta \ acctaaatgt \ cttatcaacag \ 2520
tagatatgat aaaataattc tggtattattt gcttaatgga gtactatgca gcagtgagag 2580
taaatgacct agtactatac tcagcaatat aggtgaatct cacaaagagc ataggaagcc 2640
agatacaaaaa \ gagtataattct \ acgtgattta \ taatatagaat \ tattatttgtt \ aaattataaaa \ 2700
gttcagagac tggcaaaaact catcaggtgt gatatgaatt aggataatgg cagcattttt 2760
gttgtggggga gtgatttggaa ggaagcccaa aggggactc tggaggttttg gtgttgtttc 2820
ttggttttgggg \ tggttaaaa \ tgtgtgtttca \ ctttgtgaaa \ acttaggtgaa \ ctgtgcatac \ 2880
atgattatagacatttttctg tattaattgtt gtattttcaat gaaaagtttta cctgaaaaatg 2940
aagccagcat \ gtgacagctct \ ccctttttcct \ tcactcaaaa \ gaagtgactg \ agtatattttt \ 3000
aggtaatcac aataattattt aggaattttg aaattcttagatgctgtaaaaa tatttgttttta 3060
ttaaaaaaaaa @ atttttttag \ agacagggtc \ tcgctgtgtc \ accccagctg \ gagtgcactg \ 3120
gtgtgataat \ agctcactgc \ agcttccaac \ tcctgggctc \ agaggtcct \ cctaccttttg \ 3180
cctctcaat \ tgctggggat \ ataggtgtga \ gccaccatgc \ ccagccttaa \ aaagatatta3240
gtaagcaaga \ tcaatgcgg \ taagcggagg \ aaattatttgt \ atgagtgaat \ ttttgtatttt \ 3300
tacctgagag \ taaaaaaaaaa \ aaaattttaat \ tctaaaataaaa \ acttaggacac \ agttattatt @ 3360
ctgttatata \ aaagtagctc \ taactttgtg \ aattttactta \ atataaaatt \ taagctctga \ 3420
gctgttattaa @ attttttcaa tgaaaactg @ tatttattaag aaattgtcat @ aaaatttcttt @ 3480
tgacctcaca ggccaactgt gcaggaagat gggggggatg taatctacaa aggctttgaa 3540
gatggcattg \ tacagctgaa \ actccagggt \ tcttgtacca \ gctgccctag \ ttcaatcatt \ 3600
actctgaaaa \ atggaatttca \ gaacatgctg \ cagtttata \ ttccggaggt \ agaagggcgta \ 3660
gaacaggtat \ gccaattata \ tatgacagtc \ tagattttttt \ tcatttttttc \ ttttttctttg \ 3720
tagatacaaaa ggctggaat agattgttag gcaagtattt gaaaaagaagt tcatgaccta 3780
gcttttttttt \ caagggctggg \ attttttgtgt \ tgcaatttttt \ atcagacttg \ aagtctctta \ 3840
ttttagaagt \ aattttggggc \ tggggcgcagt \ ggctcaaacc \ tataatccca \ gcactttggg \ 3900
aggctgaggt gggtggatca cctgaggttg ggagttccag accagcctga ccacatgga 3960
gaaaaccccg tctctactaa aaattacaaaa ttagctgggc atgggtggcag acgcctgtaa 4020
tcccagctac ttggggaggtt ggggcaggag attgctttga acctggggaggg cggaggttgc 4080
ggtgagccga \ gatcgcgcca \ ttgcactcca \ gcctgggcaa \ caaaagcgaa \ actccgttca \ 4140
aaaaaaaaaaaa \ aatgaagtaa \ ctttataggttt \ atgagaacct \ actatgtgcc \ agggcattttt \ 4200
gctcatttca \ tcttctataatg \ acacagtgca \ ttaagtcatt \ cccatttttgc \ actataaggtt \ 4260
acagagactc agagggcata ttgctgccct gattgcaaaaaaaattattgaa aaaggtttaa 4320
aatgtaacac agtgtttttat agatgagatt tagaaattctt tagtggaaga actctactact 4380
atcatattta ccaattttttt ttttttttttt tttttagtaga cgggggtctttg ctatgttgcc 4440
cagttggtc \ ttgaattcct \ ggcctcaggt \ gatcctccca \ aaagctgggg \ attagaggatt \ 4500
aacacaactg \ gcctaatctta \ tgtatttctta \ aatatgcaag \ caagaagccc \ attagaagaat \ 4560
catttttgt tgttatactactg agtagattc tagagcttta cgtgtaggacac atatcaacaac4620
tttttttttttt \ tgccacaata \ cctaaggagt \ ataacacagc \ acctttgtcat \ cagtaataat \ 4680
gagtctcact \ gcagtgattc \ tcaaccaaaaaa \ agcatggcct \ tatgggagaga \ gattattcaag \ 4740
gagtgagggg @ attgtgtggaa @ attagaaatt @ tccaaccccac \ agaatttcag \ gtaattcat @ 4800
ctttttttttt ttttttttttg agacagaatc ttgttctgtt gccccaggctg gagtgcagtg 4860
acacgctatc \ tcggctcact \ gcaacctcca \ cctccccaggt \ tgaagcagtt \ cccatccctc \ 4920
agcctcatga \ gtagctgggga \ ttacaggcac \ atgccaccat \ ttttttgtattt \ ttgttatttta \ 4980
gtagagacgg ggttttcatca tgttgccccag gctgattttca aactcctgag ctcaggcaat 5040
ttgcccgcct \ cggcctccca \ gagtgctagg \ attacaggca \ tgagccaccg \ tgcctgcca \ 5100
cctcaggtaa \ ttctgtgccc \ ttaagggctc \ cattgggaat \ actcatccct \ tgggttagtat \ 5160
taaaattcat \ ctgttccaca \ gtgagcaggt \ ctatatagac \ ctatccccaa \ agtcttaggg \ 5220
agctgagagg ctgaagagag aggctggcaa atccagtttgg tcagaaaaagaa acatttaataat5280
gggactggg aacagaagcc atttatcggg cagctgcaag atgatgggatt cctgcattgt 5340
tacccgctag \ actcagggct \ tatataccag \ gaggaatggg \ tatacatgct \ tcagaagata \ 5400
tgtgtaggac aattgaagtc agcccctctg gaaaaggcaa gaatgctattt tgcctaatag 5460
cctatatttt \ gcttaagggc \ aagatattattg \ ctatagtattgt \ gtttgttttag \ gataacacatca \ 5520
aggtatttttt \ gacctaaaagg \ cagaattatag \ tagaaactt \ agaggcattc \ ctagaactga \ 5580
gggtaggtcaa tgtggcagat tagcatccaa gatggagttggctttagcctc caccaccatcg 5640
tttttgtcca \ gtcatcatgaca \ tctcctctttt \ gaagtttttta \ tccatccccc \ acttggaatt \ 5700
aagttcttctcttgacaggtc caagcttct gtttttgctt tatgttttatg tagcttctg 5760
tatctgttttt agcttttatgt ttacgtggaa gctccctaag agacttgaaaa tcatatccaa 5820
gtctttgtgtgt tcctctgcaa caactagctg tgtgccttac aaatgtccta tacatgcttt 5880
gtattaagta \ ttttgggaata \ ttattccaaa \ ttaaggaata \ attctgccta \ aaaatgagt \ 5940
tggtttgacaa @ attttttttg @ attggggtatt @ gttgaaattg @ gattgaaaaaat @ attatatttct @ 6000
tggaaaaaa \ taccaatttt \ tactcaacca \ aaaagacagc \ ctatgaaaaga \ attctttttttc 6060
tatttatttgt \ ctcagacatcag \ agccagaatc \ tggatttttt \ tttttttttttt \ ttgagaggta \ 6120
gtttactct tgttgcccag gctggagtac aatggctcga tcttggctca ctgcagcctc 6180
cacctcccga gttcaatga ttctcctgcc ttagcttccc aggtagctggg gattacaggc 6240
gcgcgccacc acgcctgggtt attttttata tttttagtag agatggggggt ttcgccatgt 6300
tgaccggggct ggtcttgaac tcttgacctc aggtgatcca cctgcctcag cctcccaaag 6360
tgctggggatt \ acggcatga \ gccactgtgc \ ctggcctaga \ ttttttttttt \ aaaaaaaaaaaa 6420
cctacttttg \ ttccattattc \ atcttatatgc \ cttaaaaat \ tatgttagttt \ gactatttgg \ 6480
tggatttgact \ gaggaactt \ ttttattcaat \ tgtccagggt \ agggtgatga \ attggccttc \ 6540
agtaggaaaa \ ctttgaatttgg \ catcttaattg \ tagtagggtgt \ gatgaggaga \ aaaaaaactt \ 6600
cttaggttta \ tgtaactttt \ tcctctctcca \ atggaggttag \ tctgttattct \ tagtaataca \ 6660
ttaactcatg \ gaaaagataat \ agctgttgta \ actatttcct \ gaggcttaaaa \ atgattcttttt 6720
atctcagtaa @ gactaaaa @ atttagtcct \ aatatggtgg \ ggttttttttg \ ttttgtttttg \ 6780
ttttttactt tccttttggggga tttcattttaa taaaaaaaa tgtttttttaaa aataaatttt 6840
ggttaggctt cacagaatat atttaagtaa ataagatgtt ttttgaaaaaaa agaaaaaaagtc 6900
attacattata \ gtctttatggc \ tagagaatac \ cagttaattt \ gtttttttttt \ ttttgagacg \ 6960
gagctttgctcctatcacca gccggagtgc tctatacca ggcactagggc tcactgcaac 7020
ctccacctcc ccagttcatg ccattctcct gcctcagtct cccggggtacc tgggactaca 7080
ggcgcccacc accacgaccg gctattatttt tgtatttttta gtagagacgg ggttttcactg 7140
tgttaggccag \ gatgtctttg \ attcttctgcc \ ctcatgatct \ gcccgcctca \ gcctcccaaa \ 7200
gtgctggggat \ tacaggcgtg \ agccaccgcg \ cctggcccca \ gttaattattt \ tatagcttttt \ 7260
tctgcccagc \ tgagactctg \ ctatgggtag \ cctctttgag \ acagaggagaa \ gtgatcaatg \ 7320
ctttaatttaa \ ttttcaaaa \ ttttaattttgc \ ttttattttatattttattttttt \ ttttttgagac 7380
agctctcgc tgtgttgccc acgctggagt gcagtggcgc gatctcggct actgcaagc 7440
tctgcttccc aggttcacgc catcctcctg cctcagcctc ccgagtagct gggactacag 7500
gcgcccgcct ggctaattttt ttgttatttttc agtagagatg gggttgcttt tatgttttta 7560
ggataccgggg ttattgattca acctttgttc ttttggggctg ttgatatagattt tattcttact 7620
ggctttgtcat gcctcattat agaggttatc aggtaaagaa gtatatattaa aatcaggaaaa 7680
acacaaaaat \ ctatacatttt \ tcttaatttct \ taatttgtct \ ttgtttttttg \ gttttagtagtt \ 7740
atgggatgat aatcagatga aaaagaagca aactcacttt aaaataattct ggatttttttt 7800
tggggcataac agtcagactt gttgataata tatatcaagt tttttattatt aatggtgag7860
ggaacttga @ gattataaaa @ atgctcttt @ kagagaatga @ tatataatata @ ttgcatgtttt7920
gcttacctc @ atatgagtta \ ttttaacct \ ctttgaatcat \ ctttctgtaca \ cgtgggatttt \ 7980
atccaaggat @ attttttattt @ ttgtccctca @ tttcccatgg @ ctcctttcttt @ gcatatgtgt @ 8040
gaaggagttt \ aaaatactatt \ tccccccatc \ taattttattt \ actttttttcc \ atacaggaag \ 8100
aaaacagaatg \ cttttttagaa \ tattcttaaaa \ tagctttttg \ tgaaattattct \ aaaactattt \ 8160
ttactgaagt tttttagctta agaaaagagtt aaacaagctct gtttttaaaaaa tggtatctggg8220
ctactagccc ccaattaagt agcaaaaac tgcttaagac caaaaaaaag aaaatcaaaaa8280
tgtccggggta tggtggctaa cgcctaat cccagcactt tgggaggccg aggtggggcag 8340
atcacgaggt \ caggagttttg \ agaccagcct \ gaacacaatg \ gtgaaaacccc \ gtctccacta \ 8400
aaaatacaaa aattagccgggcgcgggggggc acgcgcctgt aatcccagct acttaggag 8460
ctgggcagg agaactgcttt gaaccccggga ggcgggggtg gcagtgagct gagatcacgc208520
actgcactc cagcctggggg gacggagcga gactccatct caaaaaaaaaa aaaaaaaaa 58080
aaaaaaaggtg aaaaaactga aaaactactc cccagaattctg gacaagtttt ctattggtta 8640
agtagggagat \ ggccaaattta \ aaaaaactgc \ ctcagcatgc \ ccagcctttta \ cctttatcaat \ 8700
cagaattgct gaagaaaaaga gaagaagctgt ctttgggtcct cccactgggtt tctgactcag 8760
agatccaaaaaa \ tctgtaccat \ gccagaaggtg \ tgcatcatta \ ttttttgtact \ ctaggggtac \ 8202
tgctttttttca ggtaggccaa agagtgattt agcctctctct ctcattttttc tacagttaatt 8880
cagactactcc agttaacagaa aaattacaggg aaaaggaaaaga tgggaaaaat agttgtgatg 8940
cattgcatct ctggaatttct agtccctcaa attagagaga ttaagatagtt gatggaaaca 9000
ggaagaactc tagcagttgt gagtgctgggg aattgaagtt tttacttttta tcctttggtt 9060
actgacca \ aattagtaggg \ ttggagaatt \ cattccttga \ gatcatcatgt \ atgaattttaa \ 9120
tttagact gggaatttct tcatagcaa ggcaacttaa cctgccctttt agttgaagct 9180
acaggaattt gacatcgtgg atgagatca agtaatggca gattttgtat gtggccatga 9240
aataagtggc @ tgaattggat @ gaggatttag @ ttttattagaa @ gagaggaat @ tggcctggcg @ 9300
cagtggctca \ tgcctgtatat \ ccccactact \ tggggggctg \ aggtggggtgg \ atcactgag \ 9360
gtaaggaatt \ cgagaccagc \ ctggccaatg \ gtgaaaacctt \ gtctctactacta \ aaaatacaac \ 9420
aattagccag gcaaggtggc atgtgcctgt aatccccagct actcaggggg atgaggacag 9480
aaaatccctt @ gaacctgggga @ ggcgggggtt @ gcagtgagct @ gggatcgtgc @ cattgactc $ 9540
caacctgggtt gacagagcga gagctctgtct caaacaaaca aaaaaaaaaa cagagaattta 9600
ttcaattgag aggccaaaga ggaagagagg aaaagattttc tacaaaaagca acagccatga 9660
agaacagagga ggaaaggtgt gggaagaaca ttctagggcat aaagaacagta taatcagaat 9720
tgtaaggtgtg aaattgtattt gggaccaccca agaaactag tatggcttga gtataaggtg 9780
aaaatggtgc @ atgagtaggc @ agtgtagtatatagaggtgc @ cacagaaact @ ctttgtttgcc @ 9840
tacccaacat \ acacccctacac \ ttctttgttatta \ ggaaggactt \ ctcagtaggt \ ctcacctcag \ 9900
tcccggggga \ tagttatgat \ taaccacctc \ actttaactc \ cattttttttt \ ttcccaatcat \ 9960
tagtctgtggg gtagccatat gacctagctc tggccagtaa actggaagag aaaagtctatt 10020
ggagaattct ggaaaagattg tctttcctag ttagagagt gtgtatgttga gttaattctct 10080
ggaaaagagg \ ctctttttttt \ ttttcctccat \ ccattccttt \ tcttcctgct \ tggtactactg \ 10140
tagggtgtga tgttcaaaagc aatgacagtc aactttaat catgactaaaa aggtgtgtca 10200
ctgaagatag caagagcaa agaaaagggtc tgatcctttg gccttgcacg gtggctcaca 10260
cctgtaatcc \ caccactttg \ ggacaccccag \ gcggggtagat \ cacttggggc \ caagggttttg \ 10320
agaccaggtgt ggccaccatg gtgaaacccc attctctact aaaacacaa aaattagcct 10380
ggtgcagtgg cacatgccac ctagtagtcc cagctactag gaggtctgag gcttgagaat 10440
cactgagcc @ tgggaaggtgg @ aggttgcagt @ gagccgagat * cacatcactg @ cactccacca @ 10500
tggggcgacag caagactctg tctcaggaaaa aaaaaaaaaa gggtctgggat ccttgaggca 10560
ttgtttggcct ttttggccaga ctagagaattta ctcactttca gagttttatat gatgtgagat 10620
aaagtttttt ctttgttttag cttattgttat caggtattct gtaacttgaa gctgattgca 10680
ttctgagaga ctgggtaaatg @ atgggagact @ tggtaaatac @ ttttaccgat @ ttttcattttg @ 10740
tggtaaactg ccaaatgtca acctaaaat gaaaaacaggc cggccgcggt ggctcaccacc 10800
tgtataattcca \ gcactttggg \ aggctgaggc \ gggtggatca \ cctgaggtca \ ggagttcgag \ 10860
accagtctgg ccacatggt aaaaccctgt ctctactaaa aaaatacaaaa aattagctgg 10920
gcatgggtggt ggggcgcctgt aatcccagat actcggggag cagggcaggg agaaccgctg 10980
gaaccccagga ggcagaggtg gcagtgagcc gagatcacgc aactgcactc cagcctcggt 11040
gacagagcaa gacgccatgt caaacaacaa aaacaacaaac aacaattataa catgtattttt 11100
ttaattattt @ gaaccactat \ tcaaggtta \ agtttaatca \ ggtaatgggtt \ ttttattctgg @ 11160
aattattata \ ctgaattttct \ ccctattctaa \ tccccaaagaa \ agactataataa \ tcactattag \ 11220
ttgtgttttag ccagaacaaa aattaaacaaa aaaccaaaaa tacaagaaac ccccaaaatg 11280
tataaaaatat \ ttttgttatctta \ ttttatttttt \ ttctttttaa \ aatagagatg \ gggtcttact \ 11340
ctgttgccca \ ggctggagtt \ gcagtggtgc \ aatcatagct \ cagtgcagcc \ tcaactcct \ 11400
ggggctcaagc catcttcctg cctcagcctc ccaagtagct aggactacag gcatgcacaa 11460
ccatgtccag \ ctttttaaaa \ attttttaca \ tgaaatatcc \ tgaaaaactt \ ttgtaaaat \ 11520
gggatgcttc gagtaagtatt tgaactaag tattattggtc aagagtaagc caggcactg 11580
gagggtttttt \ ctttttgaga \ caggttgtca \ ctctactgcc \ caggctgggag \ tgcagtggcg \ 11640
tgattatgggg \ tcactgcagc \ cttgacttcc \ cagactcaag \ tgattcccca \ cctccacctc \ 11700
tcaagtagtt \ ggggactatag \ gtgcgcacta \ ccacaccagg \ ctatattttcg \ ttttgttttttt \ 11760
ttttttttttt @ ttttgtagag @ acgggaattttt accatgttgc @ tcaggtggat @ ctgcaactcg @ 11820
tggggcttagatgatccacct gcctcagcat cccaaaggtgc tgagattaca ggcgtgagcc 11880
accacgcctg \ gcctgagat \ ttttcactaa \ ccaaaaatag \ gatgaagccc \ tatgcaggat \ 11940
gacatacagt cacatgagag caacatat agaatatagca aacgttcatt gaacattag 12000
tgttcatttta \ ttcattgaac \ attcctcatc \ ctcaagcctg \ aggtttttcac \ aaaagagtgtt \ 12060
ctagagcact \ tattattattg \ agtcattta \ atcctacgtg \ atagttaact \ atttgtccctc \ 12120
ctccgccccc ccccaccgcc cctgcctttttttatttttgagacgaagtctttg ctctgtcgtc 12180
caggctgggag \ tgcagtggca \ ccatctcagc \ tactgcaac \ ctcctcctcc \ caagttcaag \ 12240
caattcttct \ ggaattacag \ gcatgcgcca \ ccaccacctga \ ctattttttgt \ attttttggta \ 12300
gagacagggt \ ttcaccatat \ tggccagggct \ ggtccctgac \ ctcaagtgat \ ccacccgcct \ 12360
tggcctccca aagtgctgggg attacaggct tgagccactg tgcccgggcct attgtcccca 12420
tttttataaaa \ ctgggaagatg \ gaggcacaag \ gaaaagtaca \ ttgtccattg \ ccatgcaact \ 12480
tgagtggaaaa \ agcttaggaac \ atgaactctg \ gcattctggc \ tgcagggcct \ atgcacatta \ 12540
tagctactact attctgcctt agagagttt ggcccatacc cctcttgagt attcctactt 12600
gagggagagag agaagctttc cttgctttca tagctactta cgagtggggca agagtctaga 12660
accacagtag \ acaaaagcag \ tggtattagtac \ atgtgtgtgtcc \ attttttttat gcaggaatat \ 12720
gaactagttt gctttccagt cccaggggaa tctaccacccc tctttgggaaaa tccccagcatat 12780
attachccatttttgccatatcagtgttatcttgtgattattcccctaggagcttacaagacatac 12840
acagaagcaa ctttttcaagt atccccttgaa agaaacccca gaaaaatagtt actttttctg 12900
tgtcccttacg \ ttttcaagtga \ tctttcagtt \ ctagggagct \ ccctgaatgg \ tccacccctt \ 12960
attgtggctc tgttcacatc caacaggaca gaatatagtag gttaaaaggta ggaccagtttt 13020
attcatggt ttttcaatttg ttgacttctt tggcagtaga agagttttct ttctcgcaga 13080
gctagaaaac tctgccccag cttctgccta ctggaaaaat ttgggagccac gttggagag 13140
agtattgggg agggcatagc ttcttagttgg agttagcatc ctttgttcctc aagcctcagg 13200
tttttctgggggggcaatcaggtcattatttgcttttatgcggtgggacatatttttttttgtgtgtcc13260
ctctttgggtg ttcttcttttt agcaacct tccccttttcc ttttgaagaac tgcttcctct 13320
tgccgtatgtt ggctatatga ctctatagggg ctttggtgagtggtgtcctat cacaatgtct 13380
tgcctttcttt @ gccacaggag @ tggggcatgtt gactcacgct @ ggactggcca @ gaatccttgt @ 13440
ctagataata @ aaaagtaagg @ atggggaat @ agcctctctc @ atttttgggct @ gcaagctata @ 13500
aagttgtgat \ tacagagcta \ tttgaggatt \ atttccctgt \ ccatgaggtc \ agagagtag \ 13560
ttcaaggtt ctgacaacat tctgtccctg ggtataaatg tgctgaaaagc tgtttgtattt 13620
cctgttcttt @ ccaattacgt \ gagtagtagaa \ atcccctctt \ ttagtttgag \ tggtcttctta \ 13680
ttttattattt \ gtcagtgaaaa \ gctctgccct \ ctaggcat \ ctttcaccat \ gactgtgaga \ 13740
aaaaaattttg \ tgagagctgc \ atccttgaag \ agctctgtga \ aagctctttttc \ tgtggggagtg \ 13800
ctgccactga \ attgggaaaat \ ctagtactca \ tcctgtgggt \ gaagagtaac \ cacgattattg \ 13860
gaagcaagga aaactggat cacatttgta ttttttgacag gtccctctggg agccaaagtg 13920
tgtgggatga actgcggggag gctaaaagggg ttcactcaaaa gggtcttttct gaggccttga 13980
ttgggtgccttt ttgtttctttgt cctcattttct tttcacaggc ctcaggggct cacacctattt 14040
cttttttcctt \ tgactactgc \ taccactcttc \ tctgtccact \ ggggtactatt \ tctccacaaa \ 14100
gctccctaaaa \ aagtaggaca \ tatgtacccc \ agctccccat \ attctttatgc \ aaaggatttt \ 14160
ttattttaat \ aattttatttg \ ctattactgg \ aattcatata \ agggttaata \ aaaatgacta \ 14220
cagctatttc aattaaggtt cttcgttgcg ttagtaatgg caactggaag ctctgatggc 14280
cttcagccat \ cagatccaat \ ggggactgaat \ ctacgaacag \ ggaaatggac \ ttacataaaag \ 14340
agatggtgaa \ tgacacccccc \ ttgccatcat \ tactttttttt \ gttgtcgttc \ agaatgttttt \ 14400
gatcaggaga aaaaatccat tccctcatttt gttttgaattta gaccccagatg tccccttccc $ 14460
ttcatagatc @ attttattttc @ ttctcctttca @ ggcctttattc @ ccaaggtcc @ agttaaggcg @ 14520
gagctctgta \ taaagggaggg \ tcaggcaccc \ aaagtgtgta \ tcttaactgg \ cgcatggtta \ 14580
caagagttc ttttgttgtgtt tgggtttagtg aggttctca aggctgatttt gggaaaaatac 14640
tgtcccttcaa agttttcttct ctttttttgtc aaattattttt ttttatttact ttttttttaa 14700
cttttttttttt \ ttttctgagt \ tgggggacttt \ ccagtcttta \ ctgaaaaactt \ ttaaaaattt \ 14760
gtatttagac aaattcttaaaa agacctgtaa cactagttttc ttcttcttcaa ctgattcata 14820
aattatttcc \ aaaattgttt \ gttgagtgga \ gattggataag \ acaaaattgat \ agtcattgtg \ 14880
gtgggagtagc aggcagaaga agaaaagcaaaa gggttaata gattactata gttggagcat 14940
gagaactctg \ gtagtactgc \ tgacatttttc \ ttttgtgggcat \ tgacaggttt \ gctgccaggtg \ 15000
cacaaaagtg @ ttgcttaggc @ attggaacca @ tacctttggct @ tttagggtaat @ acacaggagt @ 15060
tctaccacca gcctttagatg agggttctga ggcttagatgt atatccacag tctttttgttt 15120
cttgaattaa \ gaaattgtatt \ attaccaaaa \ agctcactgt \ tttttttttttt \ ttttaaacttt \ 15180
gctctggggtg atccagggac ctgtttatagg gattgaatatatcaaaaggggc tttttaggtga 15240
gaaactactt gcttagttaa atgttgacatt ttttcagcttc tctgaggcaa gtgaaaaaaag 15300
gcactttttcc \ ccgtaagaag \ aactgaaaag \ cttatgctca \ cttaatcata \ taaccagccca \ 15360
tagaaggtta @ attccgctaa @ gaaaaatagga @ ctttttttca @ ctcattccaa @ aataaattttg @ 15420
atcttttact \ ttgtggtgtgg \ gtctaaaagt \ gttggggtatg \ taaaatctag \ ttctagcttc \ 15480
aagaaactta cagccccagtg ggaaaaataca gaaatcata aatatcaaaa gaattatttct 15540
ttacagtgag \ tagctcaag \ agtaagaggt \ taatgcatgt \ ctccaagctct \ gtctagggggg \ 15600
gataaaaaaag @ gctttcctga \ agggtaggca \ tctaaaacaga \ gacgtggtggg \ ggattcttatg \ 15660
cagtagaccc aaagtgtgca aaaagattttga gaattcttggc ccagttgagg aaaactctgt 15720
tgagcctgtt ggggaggtat agggctggaa ggacggctaa gaccagacac atgaacagca 15780
gtcagcagc @ taagaccaga @ cacatgaaca @ gcagtcagca @ ctccaggaat @ tctgtgtgtgcc @ 15840
atgtacgttt \ ttataactact \ tctactcttag \ agccattata \ gagttctgat \ tactccacat \ 15900
ttgactaaag \ accacctta \ aggctgtttta \ aagcaaatgc \ ccaggtataa \ aattctcaga \ 15960
aacatcatcc \ ctctctataatc \ aagtctctct \ tgtcagacat \ ggcgcattaa \ ttcatagaat \ 16020
gaatcgttcg \ taagtcaac \ gcgcgggttgt \ taaagctagg \ gaatttctag \ ccgtctcagg \ 16080
tgggtcatgg gaggaggtgg gccagcagttctcttacgtcc aggctcatag tcggatagtt 16140
gagccttaca ttcctcctct acccctccac aataaactga gggttatggga ggcaacggat 16200
gcggggggct tttaggggcc aagcattat cacaaggaat tgaatttgctt attaccagag 16260
aggctgacct ttggggccttt acagtcaaga attttgttat ctctctcctc ccacctcaac 16320
catatcttt \ tgcaatttttt \ ttcagccttta \ tgttccccag \ gattccctttt \ tcatacttcc @ 16380
tgctttttttc ctcctctttc ctcgcttcgt gcagtgctgg cgcctggggcc ctggggctgc 16440
acggggcacg @ cacccggggct @ attgctttgc @ taacaatttcc @ attcctctctct @ ttccgttatt @ 16500
ccctgccaggg \ tgctgagtttt \ ctccctccct \ ctcggctcgg \ tccctcccgc \ ggctcgcccc \ 16560
ggggcggggcg tctccaggaa ctccagggcgg acgcggccac gagccactgc cacgtcgccg 16620
ccgccagcag tccagcgcct gcgtgggctc gggggggggg gcagcgctggg ggggcggac 16680
ttgcgcgtga gcggcgcgtg agcggttcaa tggagcctac gggcgggcggc gcctgcgcg 16740
ccgggggcg @ gggcccgggcg @ ggggttgctg @ gcggagcccg @ ggaggcgggag @ aagctgtcg @ 16800
ttgcctttggc \ cgtcgcatcc \ ccgggggt \ cgtgtcggcg \ ccaccccgggc \ ccccgagccc \ 16860
gcagattgcc caccgaagct cgtgtgtgca cccccgatcc cgccagccac tcgcccctgg 16920
cctcgcggggc cgtgtctccg gcatcatgtg tggtaagggg gccggggagcg ggggcgtgt 16980
tgccggggggg cgctgggggtg cggtgcggggt gccgctaagg cccaaggcga cgggcggaag 17040
cgggaggtgtg \ gagggtgcga \ agtctggggtg \ atggggcaagg \ ggcgcccaggt \ gggtggctgcg \ 17100
ggggcgggggg ccggcatcca cggggcggggag gggggtggc ggccggggagaga aagcacctg 17160
aggagaagcc gggccccctttgccggggggccagcggggcgcctttggcggcggagagaagaccac17220
gaggggggag aagaaacgcct ttattgaaaa aggagagag agctgaggga attgaggtgt 17280
ggggggggtt @ gccttcaaaa @ ggggcccacca @ ggtgagtgag @ gaacctgtgg @ gaacctcggg @ 17340
cgaggtctct tgaacttacc ttgcattttt ctaaaaaattt ttaaaaaaaat atttacttg 17400
tttctggggga ggcccatatag aaaacagacc ctagctagag ccacgggtagt gccattataac 17460
gtgactactc ctgccatccc ttgtctcaac agaacacct gctataatcaat aactggttc 17520
atggggcttag acctgatcct ctggtggaag aggccttcaa attgtctgtggg cgatataggtta 17580
tacatatttt @ atcatttgcg \ tgtgcaccca \ ttaaaaatgc \ cagctctgaa \ aaaattcagt \ 17640
tataccttgg atgtataccc ctttagaata ccaactatga aaaatatcat tttatcccttg 17700
catgtgcatc cattaaaaat actagctatg aaagtttgag caatattctt tcctagaggcc 17760
ttaaaaaaatt @ aaggttaggc \ ccttttatttc \ catgtttttga \ gagtcgttta \ tttatgaccta \ 17820
agtgttagtg aaagagactt tgagaatcgt gtctgacatg actgatatct tctaaaattg 17880
gtgttaattt ggctatttgcc agtaaaaata attgtattct taccttttctt atttgaatttt 17940
aacaccgact \ tttatcccctgg \ agaaaaagta \ cacttttttt \ ttttttttttt \ taaaagggaag \ 18000
taccattgta agagaatttga aaactctctg ggagactctt tatttgcagc cttttacacg 18060
aaggaactga acaggaggtg gattgtactc gttaggtgtat attttcctg tatttaactt 18120
tatgctcatt tcagctttctg aaaaaaggga gcaggtttaa atttagagta gattaaaaaaa 18180
aaaaccaccat aaaaaagaagaa accaccataa aggttact gaaaattatta gagtagagct 18240
gacttgaaaa \ tcagactttt \ gcagtgtcta \ cttagtagaa \ tggtttttgca \ tttagttttgg \ 18300
agctgtgaag \ tagtgaattt \ gcaaactggt \ caattcccaa \ gtgtgcttca \ ttttgtaggtt \ 18360
aactgttcct \ gaatgatgag \ gggttgtgcct \ catcaagtac \ tcaacttct \ ggttgcaggt \ 18420
catttcatca tgttccagaaga aaaaaaacgta gtcaaaagtac tactgaaaaa aaaataaata 18480
aataaaaaaaa tcagcgctgg gcgtgggtggc tcccgcctat aatctcagca cttttgggggg 18540
ccgaggcagg tgatcacct gagctcagga gttcaagact agcctggccca acatggtgaa 18600
actccatctc tactaaaaaaat acaaaattag ctggggcgtgg tggtacgcgc ctgtaatccc 18660
agctactcgg \ gaggctgagg \ caggagaatt \ gcttgaaccc \ agggggtggga \ ggttgcagtg \ 18720
agccggggatc gcgccatttgt aatccagcct gggtaaaaa gagcaaaact ccatctcaaaa 18780
aatgataaaat aaaataaat aaaataaatca tatatggaaaa tcaggttcag ataagggaga 18840
tacctttagg gtgggagacta aattgttggga gttttcatat agtttgtgtcc tccatttccat 18900
aggttttac ggctgaggaa acaggtattg agaaataaaa aagtgaatat ttgaggcatt 18960
tctgaggtcc tgcttttagatcataccacg gtttttgcctg attctagggga tagggttcag 19020
aattatttttt \ ctctcttaatg \ taatttctga \ aaagataagaa \ gatgaggtgtc \ attattttttcc \ 19080
tcccacatct tagtcattga actaaattc ctgagcagag aaatggaggtg aaaattagac 19140
tagatgggaa aattctggaag cttacttctt gattacttgc tatcttagtta agttttttcc 19200
tttcttttcct @ tcttttctttt @ cttttcttttc @ ttttctttctt @ tttcttttcttt @ tcttctttct @ 19260
ctctctttttct ttcttttctct tcttttcttttt ctttcttttct ttttttcttttt tttttttttt 19320
ttgtgacgggg gcctctctct gtcgcccaggg ctggaggtgca gcggcatgat cttggctcac 19380
tgcagcctct gtctccggggg ttcaacctcc cgagtagctg ggattacaggg ggtgtaccac 19440
caacctggc \ taattttttgc \ attttttggta \ gaggtggggt \ ttcaccatgtt \ tgaccagact \ 19500
ggtctgctga cctcaggtaa tccacctacc acagcctccc aaagtgctgg gattacagaga 19560
gtgagccacc @ ttaccccgcc \ cttagttaat \ ttgcctaaaa \ gattattttta \ ttttcaaccgt @ 19620
tgtgcattgt tgaagcagaa gaatgaggat tgaagattct gatatgcttt ttttcaatca 19680
gatatactga \ taaaaattgat \ attgttacca \ gcttgttattg \ ggattgttaat \ aagtgttagg \ 19740
aaaaaaagatc \ ctctgggtcca \ gtaaattttgg \ gaagcaacat \ attaatcgc \ gtgggtaatgt \ 19800
tttgtttttgttttttttgattg \ gaggattttct \ tggaattcttt \ aatgtattaa \ taataagcat \ 19860
tgaatttct cccagagaag aattgtgtt ctattttttca aatttattttt attcttcctttt 19920
ttctttgtag ttttggaatatacttgtcct ttttattttgc attattttttg gtttttgctga 19980
gtgtcaagtc \ acttaggcta \ tcccctagcttt \ ttaacagatt \ ttgcttattgt \ ttttataaat \ 20040
gtgaagttat \ acccttctga \ ttcgacgggtg \ tataaaaat \ ggaattttttgg \ ggtagggggcgc \ 20100
ggtggctcac @ gcctgcaatc @ ccagcacttt @ ggggggctga @ ggtggggtggga @ tcacctggg @ 20160
tcaggatttt \ gaccaccagcc \ tgccacacat \ ggtgaaaccc \ tgtctctact \ aaaaaaatccaa \ 20220
aaaaaatagc \ cggggcgtagt \ ggcgcatgcc \ tgtaatccta \ gttactcgga \ agcccgaggc \ 20280
aggagaattct ctttgaaccca ggaggtggag gttgcagtga gctgagatag tgccattcta 20340
ctccagcctg ggcgacaaga gtgagagact gtctcaaaaat aaataaaataa ataagtaaat 20400
aaaataaaaaa @ ataaatggaa @ tgtttgcaaa @ tgagatcctt @ tttaaaaagca @ gtaaagagaac @ 20460
ttgcaattttt aaagtattcct aaaattgaatt ttttaaaaaat ttttttgtatat tatactgtct 20520
aatggcttttg \ gagataatttg \ agggatgctg \ agattggctg \ ctaggattggg \ tcataaaaacc @ 20580
agtatactta \ acatatcctt \ acatatactg \ gatatgaaga \ agttgtgaga \ gaaaaattt \ 20640
gcttaataag \ catttctttca \ atttgtcccct \ ggaatggag \ gttaatagggt \ tctgggtaatg \ 20700
aggtagtagaa ggcggggaaag ggtttttgtaa cacaagttttg ggaatttctg ctcttgaga 20760
ttcacaattta @ gcaagattaa @ aggttccaga @ aatttctaaa @ tatataccta @ actttaacca @ 20820
ggttagtcttt aaacctttaa tttatgaacct ttcttttact tcattcctttt ttagcatccg 20880
gtgaaattt \ gttctgtttttc \ tgtggtttga \ gaatttttttg \ accgtattatt \ tcaggtgcct \ 20940
agaaaagtgtt agaagatact tgcaggtatt tgaatgatg gcttttatact tggcactctg 21000
cccttttgcag agatgactaa aataagagag ttgccttcaa gaatcgctg cctgatcaga 21060
ggaaaaaaaaa tgaatgcaca tgcaacagct tcaggtgaaaa atacacagtc cttgtttcatt 21120
gccatgtcat agaccacaag tagatatgtt agaaatttag agactgggaga gctctgggggt 21180
ttgggtattct gtgttaggtt caggaatgtt ctgggtgatg ggggcaggact tttactcaac 21240
ttgtaggta \ ttagtact \ gtgagaggta \ atcattaatg \ gcatatgtta \ accgttcagtg \ 21300
aatgggggcg gaaattgttt gagaactact accagatgaa ggaggaataata gaagtgccag 21360
aaaacagac caaggaacag tgttaaaag cagaagattt ccaaagtagt attattgcctt 21420
gaacagagtc @ taaaaagta @ gaaaaaggtc @ attcatatgt @ aattactgcag @ agaagttataat @ 21480
tggatatggt \ tatgaagaaaa \ tttattagaga \ aattgcatat \ gtcaaggcag \ aagggtctca \ 21540
gttttgtgttt \ agggaggggg \ ctgcaagtaa \ tatgaaaaag \ aaagagatttt \ tgggattgag \ 21600
gtcccctgggg agtgttgaga agttgaattc tagagctgtg gttcctgacc tacaagcccct 21660
gaagttgtta \ cagggtgttc \ attgctttatt \ catatgctta \ taactttgtc \ tgtaagttga \ 21720
ataaaaagtg \ ttcttagatca \ ttgaataata \ aaaatttaac \ ccatttgttgt \ gaaggagcct \ 21780
cagaattattt tgattgttaac aaaagagttc tgttatttaca aagttggaga aaactcatc 21840
aagagttagg agtaagggccc aggtgtggggt tcctctgtgt aattaccagca ttttgggggg 21900
ctgaggtgggg \ cgaatcactt gaggtcagga \ gtttgagacc \ agcctggcca \ acatagcgaa \ 21960
gccccatctc @ tactaaaaaa @ acaaaaaatta @ gccagctgtt @ gtgggtacgca @ cctgtaatcc @ 22020
cagctacttg ggaggctaag gggaggaag tgcttggacc tggggagggtga aggttgcagt 22080
gagctgagaa cacgccactg taccccgcc tgggtgactg agtgactactc tgtctcaatt 22140
aaaaaaaaaaaa @ aaaaaaggtt @ ataagtagcc @ aggtttttgg @ cttaccacctg @ taatcccagc @ 22200
actcggaa @ gctgaggag @ gaggattgct @ tgacgctagg @ agttcaagat @ cagcccgggc @ 22260
aacatagtga \ gatcccactt \ cttattaaaa \ aaaaaaaaaat \ tagccaggca \ tgggtgggtgca \ 22320
tacctgtagt ccagtctact tagagagactg aggtgggggg attgagtcca ggagttttgag 22380
gctgcagtga \ gctatgattg \ tgctgctgca \ ctccagcctg \ ggtactgggt \ gacagagcag 22440
gactgttaaaa aaaaaaaaaaa aaagttacaaa gtaggggaga ggctagctctc agagtagt 22500
atgtgtaata \ tgtctctcttt \ gagattacaa \ ggaaggatga \ gaagtattta \ tattatttgtta \ 22560
aactgtttgaa agaagagggg gtgaggggca gtgactcatg cttgtgaact cagcattttg 22620
gggggctgag gtggggaggat acttggggc ttggagttttg ataccagccc ggacagcata 22680
ttgaccacct \ gtctcttatat \ tttaaaaaca \ aaaaaaaaaa @ atgaagactt \ taatttctggc \ 22740
caggcgcagt ggctcacgcc ataatccca gcactttggg aggccgaggc ggggcagatca 22800
cctgaggtca ggagttcgag accagcctgg ccagcgtggt gaaaccctgtt cactgctaaa 22860
aatacaaaaaa \ ttagccagggc \ gtggtaacac \ acgcctgtaa \ tcccagctgc \ tgctcaagag \ 22920
gctgaggcgg gagaatcgct tgaactcagg aggtggaggt tgcagtgagc tgagatagcg 22980
cccactgccct cccagcctgggg tgacagaacg agactctgtc taaaaaaaaaaaagacttta 23040
attctataaaa \ gtagaagatct \ accaaaaaatg \ aaaaaaagagc \ tgggaagagaga \ aaaatgagat \ 23100
ttgagtag tatgtagcttt agactctaaa ataatattctg ggagaagtttt gaaagttaga23160
caagtgga attatatagga ttggtcagca gttcgggaggg cccatccgaa agtgggaccga 23220
aatgggatagggatagatgagt tctccttggc tgtcatatagtt cagtgtagag atgcttagag 23280
actaggagtc agagcacagt ggaccccagag ggttttgactt ggcagtatga tgaaaaattg 23340
tagtctgatg tgaatgggtca gaagagagag agatggaata ttttgaagattt gtgagcagga 23400
agtacatgct ttttttttctc agaagaagatg atgacataggg ttgactgtga gggaatgtat 23460
agaggtgtca tgacttaact agtgatttga gctccagaat gttaaatgtg caagagaggt 23520
gtcatggagc cccttcttagt ggcaatagtt acagtaaagt aggggagaca tgaaccaatt 23580
aaaacacacaa @ attattgaaaa \ gtcttaatttg \ ttttcactcca \ tatgttatttt \ ttgttatgtgtt \ 23640
gattttatttt @ attttacttt \ tacattttttt \ attttttttga \ gacagagctct \ actctgtgtcg \ 23700
cccagcctgg agtgcagtgg cgcaatctcg gccactactca ccctctgccc cacctcctgg 23760
gctcaagtga ttctcctgcc tcagcctcct gagtagctgg gacaggcacg cgtcaccatg 23820
cctggctaggg \ attttttgtat \ ttttaattgga \ gacggggttt \ caccatgttg \ gccagggctga \ 23880
tctcgaactc ctgacctcaa gtgatccacc ctcctcagcc tcccaaaattg ctgggattac 23940
aggcgtgagc cacggcatct ggcctttata tgtgcttttta ggattttagagagagatgtacct 24000
tggctgggatg cattggctca tgcctgtaat cccagcactt tgggagccg gaaaacagagg24060
atcgcttgag \ tccaggagtt \ cgagaccagc \ ctggggcaatg \ tagtagacacc \ tcattctcac \ 24120
aaaaaaaaaaa aaaataactg \ ggcgtgggtag \ cttactgtctg \ taatcccagc \ tactccagag \ 24180
gctgaggcag \ gagaattgct \ tgaacctgggg \ agacaggttg \ cagtgagcca \ agatcgcatc \ 24240
actactactcc agccttttgcg acagagcaa aactccatct caaaaattataa aaaataaaaaa 24300
gtaaaaaaat @ aaataaaattacaggcacattagcatgtgcc @ tgtgggtccca @ gctacttgg @ 24360
aggctgagat gaggggatca cttgagtcca ggaggtggtg gtttttaatga gctgggattg 24420
tgccactgta ctccagcctg ggcgacagag cagacccctg gtgaaaaagaa aaaaaaaaaat 24480
gtattccaaaa \ taatacttaa \ ttttaaaagaa \ attctataatg \ tagaatgtga \ ttccataatt \ 24540
ataattattga \ cttagtcact \ gcaacctga \ acccctgggc \ tcaagtgatt \ ctctcacctc \ 24600
agccttccaa \ gttatctggga \ ctacaggcat \ gcaccaccat \ gcctaattttt \ tttatttttgg \ 24660
taggggcagg \ gtctccctgt \ attgcccaggg \ ctgatctcaa \ actcctgccc \ atgatcctcc \ 24720
ggccttgggcc @ tacgaaaagtg \ ctgggattac \ aggtatctgc \ tactgtgcct \ ggcctgtaga \ 24780
aaaatttata \ gctgaaggac \ tgggaggtgtg \ tgtataggaa \ taacagtagt \ tatctctgag \ 24840
aaaggggttg \ gaacctgtgt \ ggagagagaa \ aggagattt \ ttcacaattc \ tgtagcatct \ 24900
gttagttttt \ aattattattt \ tatttattattc \ aaatttttaat \ agagagggg \ tctttggtatg \ 24960
ttgccctggc tggtttcgaa ctcctgagct caagtaacct ctgcctctct tcccacagtg 25020
ctgggattac \ agatgtgagc \ actgctcct \ ggcctacttt \ gaattttttaa \ tgatgtgtat \ 25080
gaattataattt gtgactagca ttataagaaa aataaaaattt agagtttagatgacattgta 25140
ggtagattttt \ gatttagagtt \ ttttatagtttt \ agagaatgaa \ ttttgaactact \ tatactactat \ 25200
aagttacaat \ gttttagggtc \ ccaaattatt \ gcagctgtca \ aatgataaaaa \ tatataaaaaa 25260
taaaaatttag tattcataag gacataaattg accaccagaca taggaatttt aataattttga 25320
cgagtcagtt \ ttctttttcag \ taaggtttaa \ cagtctgtat \ ttgcagctac \ attgctttca \ 25380
accaggtgtg \ tcttagtctgt \ gatccagattt ggttctgaaaa \ ttttgtttaggc \ aaggtgctca \ 25440
taattgcttt ttttgtcattg aatttaagtt gccatttatt gagaatgatg cctgtaggtt 25500
caagcatctg \ ctttcagttat \ ggagtttattt \ tatttccaagt \ attattccattt \ agtaagaaaag \ 25560
ctactacttg \ tgaagtgcat \ gctgatttgg \ ggggtagagat \ tctatgctta \ tacagctact \ 25620
gtgtgtgtctc @ ttagagcaat \ tactgaagag \ tggcgggaaag \ ttgatattag \ gctttttgtca \ 25680
ttacttact \ taagaactgt \ ttattggggag \ tttaggccgg \ gtgcaggtggc \ ttatgcctgt \ 25740
aatcctagca \ ctttggggaggg \ ctgaggcgag \ tgatcacct \ gaggtcagga \ gttcgagacc \ 25800
aggcctagcca @ acatggcgaa @ accccatctc @ tactaaaaat @ acaaaaaaatt @ agccggggcat @ 25860
ggcggcggcc @ actgtaattc @ cagtctattg @ gggggctgag @ gcaggagaat @ tgctggaacc @ 25920
tgggaggtgg aggttgcagt gagctgagat ggcgccagcc ttggcgcaaaa agcgagactc 25980
tgtttcaaaa aaaacaaaaaa caaaaaaactg tttatttggga gtttttgataaa gacaagtca 26040
agacctgaaaa \ tagaggtca \ gactaacgat \ ttctgctctta \ acaagcatca \ ttgtgaggttg \ 26100
tgaatgcctc ccttttgaac atgccctgtg tacctgatga attgctgcca gtattgtctc 26160
ggggacccca agattacagtt actaccccggta tccccgcagg tggaatgtct tgggctagta 26220
gtgctatcaa gggcaagggc tatgaaactg acaggttcaa cttcttaggct cccatttttcc 26280
tcatcaggta tgtctgaggc taatcccctt cctcttctta gctctgttact ttttttgttttt 26340
gttttctttgtt ttgttttttttggagacggagtgcttgctctgt tgcccagggct ggagtgcagt 26400
ggtgcagctct aggttcactg caacctctgccctcccaggtt caagctattc tcgtgcctca6026460
gcctcccgag tagctgagac tacaggcacg tgccaccaca gctgggttatt tttttttttt 26520
tttttttgtat tttttagtaga gacgggggtt caccatgttg gttagggctggg tcttgaactc 26580
ctgacctcgt \ gatccgcccg \ cctcggcctc \ ccaagtgtc \ gggattacag \ gtgtgagcca \ 26640
ctgtgccccag \ ccaaattgtt \ cttaagctct \ caagattcat \ atagtgagcc \ attataaaacc 26700
aaggagattg gagttagagag tattattaaaa gttgaatgct gttgttgagtt tacattatta 26760
aaaacagtga \ attttaattt \ gcattactta \ attcttttttt \ ttttttttttt \ ttttgagacg \ 26820
gagctttgctcctgttgccca ggctagaggtg cagtggcacg atctcagctc actgcaacct 26880
ctgcctccca ggttcaagcatattctcctgc ttcagccgcc tgagtagctg cgattattagg 26940
cacctgccat \ catgcctggc \ taatttttggt \ attttttgtggg \ agacgggagtt \ tcagcgtgtt \ 27000
gccccaggctg gtcttgaact ccttacctca tgtgatccac tcgccttggc ctccaagttg 27060
ctgggattac aggcgtgagc caccccagccc tgccgcatta attcttaaaa aaaagtagag 27120
tctataaaat \ gtcttaaaaaa \ caattttata \ tcattagcat \ ttaatagttt \ ttaacacatt \ 27180
catatacatc \ ttttaattcttt \ aaatcattta \ ccatccgggtt \ tacatttttta \ tgtttttacccc 27240
aattttcatt ttttacatct ggcttactatt ttttactttata cttagcactact tagatttcttt 27300
aaaaaaagaga \ gagtttagga \ gtgagtttttt \ ctggatgtgc \ tttagattttg \ gcagctctgg \ 27360
acaatctgca \ aacaatcctc \ gacaggcttc \ tgtttttcaaaa \ taagctagat \ tgtatcctcc \ 27420
tttaggtgac \ tcttagctgat \ gcagtcacag \ tggtgggaac \ tagttcagat \ tcagttttttt \ 27480
tcactactttt tttttttttttc tttttgagat gagtctcgct ctgtctccca gggtgggagtg 27540
cagcagtgcg @ attccggctc @ actgcaacct @ ccgcctcctg \ ggttcaaggg @ ttcaagtgat \ 27600
tctccccgtc tcagcctaccaaagtagctgg agtacaggtg cacgccacca tgcccgggca 27660
atttttgtat \ tttttagtagt \ aactatgggt \ ttcgccatgt \ tggccagggct \ ggtctttgatt \ 27720
tcctggctttc aggtgatgcg cctgccttag ctttccaaag ttgggatttac aggcgtgagc 27780
actgcacct ggcccactatt tgtattaag tatttgtttta gaaaagattt gtgtgctgtgtg 27840
tatttgtcttt \ taatgacctg \ gttaaaattac \ ttaattgata \ gttatctgtta \ gattgtttat @ 27900
cttttctaaa \ gatcagtgac \ ccataggtga \ aggtgcaaaa \ gtttgatttta \ caatttgggtt \ 27960
attcgttttat \ tcatattaca \ gactattcat \ gaaggaacag \ cagtataacac \ aaaaccccg \ 28020
gactcattct tctgaattaa atggggtgcag attggtctgg agactcttct actgccctct 28080
agtgtttdata \ tcatgagtag \ ccatttaaaag \ ttggaagctg \ cacattgctg \ tgccgctacc 28140
actctacct tagcaatatc cttagagcc atgttgttta tccttatcttt aattgctgtg 28200
ctttgaggtt \ gggaatgcta \ ttttgtggggta \ tctctgggat \ atcagttaac \ tcaatttcta \ 28260
tttttgaatt \ attgatagata \ gagtttctac \ cctcccctac \ agggtgggtgg \ tgctgtgaaaa \ 28320
gtaagatgac \ tgttacattac \ aggaaagcttt \ aaaaaaataa \ aaatgtaagg \ tgtgtgtgta \ 28380
tctttttttta \ attctgaatga \ aatatgggat \ ttctgtaagt \ ctttggcctg \ gaactgcttc \ 28440
tttgggggaga gttgaaaccg ttgttttcagg ttatttttga ttttataatgtg tgagtttctc 28500
ttttttaggg \ catataattt \ tgtttgagaa \ aattgcaatg \ tattgatcat \ ggtgattaggc \ 28560
atgttatgtta \ tggcttttcct \ gttggggtatc \ aacaatgtgc \ catttttttta \ tactgaata \ 28620
atttagtaggg @ atcactct @ atagagtaa @ attgtctcttt @ tcagatggaa @ atgaagacta $ 28680
gttttttgggg \ agttctattct \ cacagaattta \ atttaaactt \ cttatgaatc \ agaattacag \ 28740
tgaaatgtag ttaagaaaaaa aggaagttta aaataagcag cttgaacttg tatttttgta 28800
tattttatat \ aatttaggtt \ tcagtttttga \ tacatttaaaag \ ctgtgtccac \ tctggccaaa \ 28860
gcaagccat \ gaaaacctc \ agataatgcc \ catgctgcca \ ttcctaaaaag \ tgtgggattc \ 28920
cttacctgt @ gtttttgttac @ ttcttttgcttt @ ccccgttca @ gttcacattg @ tattacctgc @ 28980
tttgattttct \ agttttgtttt \ ttccaatga \ ttgctcttttt \ tctgtgaatt \ ttcaagggtt \ 29040
gttatgtgtgt @ tgtcattttgc @ taatgtgatg @ aacaagtaat @ tcaagcaatt @ attcttttag29100
attagttat @ atttggtcag @ tttttactat @ tttactgtaat @ tatttatagggg @ gtgagtattt @ 29160
ttcatatcat \ tttattcctaa \ attgtcactga \ tagcatggtt \ attggaaaata \ agcaaaatta29220
attcattgg @ tacagatttt @ agggccata @ tatgttgctt @ aaaattttt @ agaaaatttt @ 29280
ttcttgaaac \ gaaatgctct \ gtatatagga \ cataaaaccat \ gaattttgtta \ atttggttttt \ 29340
aaaaaaattta aatttcactt gacaaaaatg gcagtcatgg aaaaaagta gccagctttta 29400
taagcttcttt \ tgccaggtgc \ agtggctcac \ acctgtaatc \ ctagcacttt \ ggggagccga \ 29460
ggcggggcaga @ tcacgaggtc @ aggagattga @ gaccatcctg @ gctaacatag @ taaaaccccg @ 29520
tttctactaa atatacaaaa aattagctgg gcgtgggtggc aggacctgtt agtcccagct 29580
actcgggggg ctggggcagg agaatggtgt gaaccccggga ggcgggagcttt gccgtgagcc 29640
gagatcgtgc tgttgggactc catcctgcgt gacagagtga gactctgttct caaaaaaaaa 29700
aaaaaaaaaaaattattaaattgtgtattttttgacatgttttagtttttttatacttattagagaaac29760
tccccccttga \ aaaagttcca \ ttgccttttaa \ acggttttgaa \ attgtttgaaaa \ gacagaattct \ 29820
aactcacgt ttttttcatat acttgata atttgctaa ttttgattttt ttaatcaga 29880
atttttcatt aaaattttgt ttattttgcag gttattttcc ttacttaaac tatcatgtttc 29940
ctcgaacgag acgagaaatc ctgggaaccc taatcaaaagg ccttcagaga ctgggagtaca 30000
gaggatga tttctgctggt \ actttaaaaaaaacattg \ gattttgcat \ gattctttaa \ 30060
atatagacta @ ttttttattgtt @ tattaggaga \ cttagactatt \ aaagtctgtt \ ttgtttttgag 30120
taaggtgtaa ttggaagaat ttttgtctttttttatcatattt aaaggattttattttatgtataat 30180
ctcaaaggtg \ ttaccattta \ tgtggagtat \ tgcttatatat \ gactctctaa \ gaattattatt \ 30240
gtaaaaacat \ catatgggggg \ attattgtggg \ taaaaacaaaa \ ttcgtgaagg \ tcttactctta \ 30300
aattctttttt tctttcctatt aacttattt tttattccattt gatttcatgc ttttgacatat 30360
aaactgcct \ cagattctttt \ ttttcttttt \ tttatttatta \ ttttttgagat \ agggtctcac \ 30420
tctgtcaccc cagctgggagt gtagtggtgc ggtcatagct cactgcagtc tcaactctg 30480
ggctcaggca atcctccctc cgtagcctcc tcagtagcta ggactatagc tgtgtggacac 30540
catgcccagc taattttttaa aaattttttg tagacacgag agtctcacta tgttgcctgg 30600
gctgggtctca aactcctggc ctcaagtgat cctcctgcct tggccttttca aagtgctggg 30660
attacaggca \ agccactgat \ tccagcctct \ tctattcttaa \ ataaaattaca \ cataaaacata 30720
actttctggc \ aactttatagt \ tctacccctag \ ctcctttccct \ caactatgtc \ agaggttcct \ 30780
aagaccatcc \ tcagattttga \ cgattcccta \ ggaggactca \ cagaactcag \ catttgggttg \ 30840
tactcatggc tatgtttcat tataaaaaaa gaatacaaaag cacaatcagc aaagggagaa 30900
ggtgcaggaa ttgaagtcttt gagaaaagcta ggcacaagct gctcaccagtt gatcagtgc 30960
ctaaggttttt \ cattggggggt \ tggtcatata \ ggcaccctct \ gccccagcatg \ taccaaaatt \ 31020
ctagactccc aaaataagag cagattttca gcataaaacca ctttgtttgc acagttttgtg 31080
tagtgagaca ctttttggtta gggtgggtaggg aattccttcca aaaaccacaagt ttctagacac 31140
cagtgaaggg cccaccttga aaaacggcct ttctgagat agcagtttca cacctgctgt 31200
gttaactcttt ttttgtacac ttaacttgc cacatgggaat ggacatttgt cttcctttac 31260
tttccttagt aatggaaaagt cagttcctca actccttttgt ttttaaaaatt ctctccttttcc 31320
ttagcttcct tgacagcaca tcttattctc ttcctaagat gctaagattata cttctttttct 31380
gttttgctttg \ gaggctcctt \ tcttctactt \ aagctcaaaa \ tattaatgtt \ ctttcaagat \ 31440
cttttttttttt \ ttgaggtgag \ tcttgctctg \ tcaccccggc \ tggaggtgcaa \ tggtgcgatc \ 31500
tcggctgact gttgcaacct ctgtcttccg gattcagctg attcttcttgc cttaggctct 31560
ccagtagctg \ ggataacaggg \ catgcaccac \ cacgcctggc \ taattttttgt \ atttttagtag \ 31620
gagatggggt ttcaccatgt tgcctaggct ggtcttgaac tcctgacctc aggagatcca 31680
cccgccctgg cctccccaaag tgctgggatt ataggcgtga gccactgcac ccagccatata 31740
ttctttttcta \ gatccacttc \ tcttatttgg \ tgtcttcatg \ ggtgagctct \ gactcatca \ 31800
tcttcttttttt \ ttttttttttt \ ttttttgagat ggagtctcac \ tctgttcacaa \ ggctgggagtg \ 31860
cagtggcgtg attctgggtc actgcagcct ccacctcccg agttcaagca attctcctgc 31920
ctcacccctcc \ tgagtagctg \ ggattacagg \ tgcctgccac \ caccaccaggc \ taattttttgt \ 31980
atttttagta \ gagacgggggt \ ttcaccatgt \ tggccaggat \ ggtctcgatc \ tcctgacctc \ 32040
gtgatctgcc \ cgcctcgggcc \ tcccaaagtg \ ctgggattac \ aggcgtgagc \ cgccgtgcct \ 32100
ggcccatcag \ cctctctgtta \ atatattgttg \ gtacttcttt \ tgtttttattc \ ttttttatttt 32160
ttattttattt \ ttatattttta \ ttttttttgag \ atggaggtctt \ gctctgttcgc \ ccagcctga \ 32220
gtgcagtggc @ atgattctcag \ ctcactgcaa \ gctccacctc \ ccgggttcac \ gccattctcc @ 32280
tgcctcagcc tcccgagtag ctggggacaac aggaccccgc caccacgcct ggctataatttt 32340
ttgttattttt \ agtagaggac \ gggggtttcac \ catgttaggcc \ agggggttct \ cgactctcctg \ 32400
acctcgtgat \ ctgcccgcct \ acccctccca \ aaatgctgggg \ attacagaca \ tgagccaccn \ 32460
gcgccccggct \ agttatttttt \ attttttaatt \ ttatatttttt \ tgtgtgagag \ tatgttgggtg \ 32520
actcttaatc \ cagattgattt \ tcttttaatc \ cagatttatc \ tcccaagctg \ tattcttaggc \ 32580
ctcctacaag \ ttttcttccta \ gttagaccat \ gattatttta \ actttgcatg \ ttcaaaaaatt \ 32640
gaactgaggc \ cggggcgtggt \ gactcacgcc \ tgtaatccca \ gcactttggg \ aggctgaggt \ 32700
ggatggatca \ ctttgaggtaa \ ggagttcaag \ accagcctaa \ ccacatggt \ gaaaaccccat \ 32760
ctctacttaa aaaaaaaaaaaa aaaattagcca cgcattgtgtgg tgtgcacctg ttgaccccagc 32820
tatttggggag @ gctgaggcag @ gagaatttgt @ gaacctggga @ ggcagaggttt @ gcaggagct @ 32880
gagattgcgc actgccctc catcctgggc gacaaaagcaa gaacctgtct caaaaaaaaaa 32940
aaaaaaaaaag aaaagaaaaag aaaaaaagc tgaatactt gcagtcctca ccctgctccc 33000
caccctgttt @ ttttgtttgttt @ tgtttttgag @ atgaattctca @ ctctgtcgcc @ caggctggaa 33060
tgcaggtgtg tgatctcagc tcactgcaac ctccacctct cgggttcaag ccattctcct 33120
gcctcagcct cccagagtagc tgggattaca ggcatgccca ctctgtttttt ctatgtccct 33180
tttattgaga atcattcaac aagtccttca agccattcaa caagtcctttt gaggtattcc 33240
actctctcc \ tgctttctca \ cttattattca \ gtcagttcca \ cttttcaata \ tcatttattt @ 33300
ctgtctgcat \ taccactgtt \ tagttcaggt \ cgtcttcatt \ tttgctttgc \ tgtagctgta \ 33360
gctttttgaca gctggttttct tccttccgtt tctctccctc cagttcttttc cctactactg 33420
tttctagaag \ ggctttttcta \ aattatttttg \ ccgaatcact \ tctctgctta \ aaggacagtg \ 33480
tttccccagt @ attctcaggg \ tagctttttc \ aaattccctta \ gcaacttaag \ gagactctta \ 33540
agagggtat \ tctgtgacct \ tctttccctta \ gctaccttct \ gaggtggggtg \ cccatcttttt 33600
gcatttctcc @ attgtatccc @ aattgtaacc @ tgtagtatttt @ tattatataat @ tcatatatac @ 33660
gctgaattat \ ttttttcctttg \ tctgtcttct \ cgatagactt \ agaaattttga \ ggacagagaat \ 33720
ggagttatttt ttgtttttttgt gtctaggagc tatcctgggtt ctttgacacac aataggttttt 33780
catagtagtaa \ ttgaatttaat \ actattagtga \ attatattaga \ tgagaatgta \ ttttttattatt \ 33840
aaaaaattttg \ cctcacatta \ ataatttttat \ catagtagccag \ ttttctaaatt \ ttgcttttttt \ 33900
acctcatgat \ ggttttaggtg \ tgggatttga \ tgggggcaat \ gataaaagatt \ gggaaggccaa \ 33960
tgcctgcaaaa \ ayccagctta \ ttagagaagaa \ aggaaaagtt \ aaggcactgg \ atgaagaagt \ 34020
tcagtaac \ gtactttaatt \ tgattttttgt \ ccccttttccc \ cttctcttcc \ ttttcccctc \ 34080
cccattctctcc tcttagttac tccctccccc catatttttgg gaccattttt aatgataatg 34140
gtctgtaaca ttgaagggag gaaaaagaaag tagttttgtt actgttctgga ctagttttaa 34200
aatgtacctg agcctgaaaa ataatcattg caactaggga aggaatttag ttaggtatat 34260
taccttcagt \ gttagctctgg \ aattattaaat \ gaagtattctt \ cagagccacc \ attcctgagg \ 34320
aagagttttt \ cataagacaaa \ aaggtatttt \ tagtgatgcc \ cttttacaca \ tgtcttact \ 34380
tgctaatttgt \ cttcacttttg \ gttataatgc \ ctagcttgga \ tgtaggtcaat \ ttttcatattg \ 34440
caccttttgaa taggtctgat ataattcgtt aagtatcatg ttttccctca cagtttttct 34500
ctctggcaca aggagttgtc agagatgtat gccccatcaa agagatttatcttctcagta 34560
tttagatcat aacattattc ttacatattt tatttttttc acagaagaact tgaaaaacaaa 34620
gcaacttttg aatagtagattg \ attgaaaaaaa \ tatttttaaa \ attctccaca \ aaaccccagga \ 34680
aaccgcaagt @ attttattgta \ cctactcata \ tgaatgccat \ cataatcatt \ gtaaaaaggt \ 34740
acaggtagag gaaaaatgatg gattttgtttttttttttttc ccacataagc catacgttta 34800
gctctgtagt \ acttgtttaa \ cgaatttaat \ caatacttat \ tttgcctgta \ ttgtaggtgta \ 34860
agtagtagta gggggtaaagc agacacccaa ataactatac ttcaaaaaaca gttagtaaaa 34920
tatctactat gtgttctgca tcctgtatac caggctgatt gtagcgggtt ctgtaggaga 34980
gaacagacat \ tgctgtgaga \ ttcaggggag \ agttcccaca \ agttgacgag \ actgggaata \ 35040
catggggat @ gggtgctgat \ tattatttggt \ cagtgaagat \ gtgaaggggag \ gaccttctga \ 35100
gtagatagca tagcaagata agaagagtaa tggcaggcgt gttgatggaga tgatagtag 35160
cctttttattt tacagtattg gtagacaaat aaggggagct agaaaggcag attgtgaaca 35220
gaatcaccat \ ttttcaatgt \ cagcatattg \ aaacatgcct \ cttcgtgtgtc \ aacttttttt 35280
tttttttcttt \ cccttcccag \ atgggagtctc \ gctgtaacgc \ ccaggctgga \ gtgcaatggt \ 35340
gcaatcttgg ttcactgcaa cttctgcctc ccagatttca gcgattctctcc tgtttcagac 35400
tcccgagtgg ctgggattactcaggcgtgtg ccatcatgcc cggctaatttt ttgttatttttt35460
ggtagagatg \ gggtttcacc \ atttggcca \ ggctgtgtttt \ gaactcctga \ cctcaagtga \ 35520
ttcgcctgcc tcggcctctc aaagtaggtgg gattacaggc attagccact gagcctggcc 35580
aactggttttg ttttttgaagt gttagtattct gagtgtctact tttactcaca gctataatttttt 35640
ttttaagagtg \ gactcttggt \ ctgttgcaca \ ggctggagtg \ tagtgacaca \ atctcggttc \ 35700
actgcaacct ctgcttcctg gttcacgcca ttctcctgcc tcagcctcct gagtagctgg 35760
gaccacaggc @ gcccgccaca @ acgcctggct @ aattattttcg @ tattttttagtagagatgggg @ 35820
tttcaccatg \ ttagccagga \ tagtctcgat \ ctcctgacct \ cgtgatctgc \ ccgcctttgc \ 35880
ctcccaagtg ctgggatttgc aggcgtgagc caccaccacct tgtaattttt tgttattttta 35940
gtagagacgg \ ggtttttgcca \ tgttgggccag \ gctggtcttg \ aactcctgac \ ctcaggcgat \ 36000
cccaccctcttt \ tgacctccca \ aagtgctaga \ attacaggct \ tgaaccactg \ cacctggcca \ 36060
acccctagct aattctaccc tgcaatacat gcaaaaataag tattgatttga atttattattc 36120
tacaaatgga aactttagaga tattgctggt gaatttgtaa ctggtaaaatc actttaaaag36180
gcaatctggc catatctaca tgggaaatgc ctataacctg agactaagca cttccactct 36240
tggatadata \ cttgaaggaa \ acacagtgaa \ caaggtgaca \ tgacaacaag \ attcactgtt \ 36300
gcaaaaattt agaaaagcccc taaattgtcta taagtaaggg aatgggatga tatataatagt 36360
tgtgtgtgcc gggcnggtggt ggctcacgct tgtaatcctg gcactttggg aggccgaggt 36420
gggcgggattg \ cctgagctct \ ggagttttgag \ accagcctgg \ gcaacatgtg \ gaaaaccccat \ 36480
ctctactaaa \ atacaaaaaaa \ ttagccgggtt \ gtggcggcgt \ gcacctgtag \ ttccaggcat \ 36540
tcgggaggtt gaggaggag aatcactgga atccaggagg cggaggttgc agtgagctga 36600
gatcgtgcca ctgcactcca gcctgggtga cagagtgaga ctccgttctcc acaaaacaac 36660
aacacaacaaca acaacaacaaa caacaaaaaa taagttgtat atgatagtga atgagcatat 36720
gtagctttttg \ aaaagaaggtt \ actgaatctg \ gttctgcata \ tgggaacatg \ gatattacct \ 36780
ggtatgtaa gtataggaca tttaaaaaca caaaagggta tatcattatta tggtctcatg 36840
ttaatacat @ catagtttaa \ aggcatgaa \ tagtaagact \ gtgtcaactt \ gaaaaattttc \ 36900
tgaggagtaa gtgaatgggga tgggggatata aaggaggtta tcaactgcat ttttttacatt 36960
tatttattttc aagtttccat attaccact gattttttac atttttagatc ttaaaaata 37020
tgtaaagcac \ agatgacttag \ atgtttttgtt \ aactctgagt \ atgggtaggtt \ gggttgtcat \ 37080
tatttcccagc aaattttaaat attgtttgaag tattttttttt gaaaaggggaa gattgcatct 37140
gagaaaaaggc agggagaggg caaggagca tgggagtaga ggtaggggtaa gatagaagat 37200
gcaatgagg aaattattga agcactacgg cccaagaagaatcaaggcaca ggcaaggagtg37260
tagccttttaa aggaaaaagt gtactttagg atataaaagat gaaaagacaaaa cttaagagagc37320
ataattacca \ ggtgagagaga \ caaaagctga \ gtaagtgga \ aattgagggga \ ttgcaggtag \ 37380
gattgagctt tatggagaat agaaaaagata tgatgaactg tcagggaact ggattgagct 37440
atcagtttaa \ tgaataagga \ acttgatac \ atgtttcttta \ ggtaggcaaca \ gtgaaaataga \ 37500
tatgtgaatt @ tgaaaagggtc @ ttattattacagaatttttctg @ actttcttca @ gtattgctttg @ 37560
gcagtagatg ggagaagaga aaccgagtgtggggggttaat ctagacttaa gattcagca 37620
aggggttttaa aatggggtaac agacaataag gaagcgtcaa ggattcaaaag tcatgattaa 37680
tttatatgac \ aggaaattt \ tattatgaga \ aatgtgctta \ ttgtcatatagc \ aataatttttt \ 37740
tcttactaga \ cattcggtaa \ tgttcctacg \ gaaacagtga \ aataaaagtg \ tggtaattat \ 37800
catgaatttg @ aaatggattc @ aatatataga @ attttgtgac @ ttttctcaat @ attgcctgcc @ 37860
agcatgtgca aggagactact gctttaattta tagttagcttt aaaaaagttg tcaaaagggc 37920
caggcgtggt ggctcacgcc tgtaatccca gcactttggg aggttgaggt gggcggatca 37980
cctgaggtca \ ggagttcgag \ accagcctgg \ ccacatggt \ gaacccctgt \ ctgtactaaaa \ 38040
aatacaaaaaa @ attagccaggg \ cgtgggtggtg \ cgtgcctgta \ atccccagcta \ ctcaggaggc \ 38100
tgagataggga gaatcgcttg aaccccgggag ggagaggttg cagtgagcca agattgcgcc 38160
attgtactta ctccagctttg ggcacaagag caaaactccg ttttcaaaaaa aaaaaaaaa 38220
aaatagcaa agatgtttttc atttcttgca ttggcctgtt gaataatggt aaattggtact 38280
tttcttgagg \ tcatttatca \ ggttgccttta \ attacttaga \ acacagttaa \ gccaggaaaag \ 38340
aatagatgcc \ tgagtttattt \ cattgataga \ ttgagccatc \ caacaaaaag \ gttatctgcca \ 38400
tgtattacctt \ ttagtgctta \ gatttaaaa \ ataataaggt \ aggctgctgtt \ ttttgttagaa \ 38460
ctcaatttct ggtgggaagct aggttgacaa catataaatg taatagttaca atagataata 38520
ccattgtgtgttttatttattttatttattattatacttatttttgagacagagtcttgctctttttc38580
gcccaggctg gagggcagtg gcatgatctc agctcactgc agcttcccct tcctgggttc 38640
aattgattct cctacctcag cctcctgagt agctgggatt acaggcgtgt gctaccacgc 38700
cccctataatt \ ttttcagtag \ agacagggtt \ tacccatgtt \ ggccagggctg \ gtcttaaact \ 38760
cctgacctct ggtgatccac ctgcctcagc ctcccaaagt gctggggatta caggcatgag 38820
ccgtgggtgcc \ cggccaggttt \ gctcttaatt \ tagacctaac \ tctgtaaaac \ ttttgttatct \ 38880
gggttcttag ccaaattatat tttattatta ggaaattataag agcattacta gttaataact 38940
ggagctgtcc attttttttaa gaaccccaa gaaaatagag cttatatgaa aaaataagaat 39000
cagctacttc ttttttttttt tttttttttttt ttttttttgag agggaggtctt gctctgtcac 39060
cccggctggga gtgcagtgat gtgatctcag ctcactgtaa cctctacctc ctggggttca 39120
gcgattctcc tgcctcaacc tcccgagtag ctgggattac aggcgcgcac caccacaccc 39180
gggtaattttt tgtagttttta gtagagacagtggtttcaccagtgttggtagag gctggtcttg 39240
gactcctgac \ cttgtgtccc \ acccgcctct \ gcctcccgaa \ gtgctggggat \ tacggggcatg \ 39300
agccaccaca \ tctgggaaaaaa \ tcagctactt \ ttcaagataa \ aggaacttg \ gcctatgccg \ 39360
attccccagt @ agccccatac \ ttttcatagca \ ttgctcggtt \ cttaaaccc \ tatttttatttt \ 39420
tgggggact \ ccatagttgc \ agttttctatt \ gtgagaggtg \ tgtactactca \ ccagagacca \ 39480
aaaaaaattgc agtcataagg ttgtgtgtgtacttgggaaaaat gaatttattttt tcatatgttt 39540
aattaaattg \ ataatgactt \ tttaaggcaa \ gaattataata \ tagatttaaa \ agattactatt \ 39600
aattgtttttt gtccttaact \ cttgagtatt \ tgtatctcca \ ggaacttga \ agaagatagta \ 39660
cattatacct tatataactt tcacctaact tttatctgtta ttaaaatttt gtcatgttttg 39720
ctttaactct \ gttattagttt \ ttttggttgtt \ attgaaaaccattttgccttca \ attatttcagt \ 39780
tgcataaact \ cctaaattctt \ tatttattactt \ tattttttaat \ ttttgtggggt \ atatagtagg \ 39840
tgtataaact \ tactggggtac \ atgagatgtc \ ttgatacataga \ cgtacaatgt \ gttcctaagt \ 39900
ctttttttttt @ ttttttttgag @ atggagtctc @ gctctgttgc @ ccaggctgga @ gtgcagtggc @ 39960
atgattctag \ ctcactgcaa \ cctctgcctc \ ctgggttcaa \ gcgaatatcc \ tgcctctgcc \ 40020
tccgggagtag cccaggactac aggcgcgtgc caccatgcct ggccaattttt tgttatttttta 40080
gtagagatgg ggttttcccca tgttggccag actggtctttg aactcctgac ctcaggtgat 40140
cccacctgcct \ cggcctccca \ cagtgctgggg \ attacggggcg \ tgagccactg \ caccctgcct \ 40200
cctaagctttt ttaatcacta @ ttttgaatat gcctgatctt tagtttcagt @ gattgtatat 40260
tccagagag \ cagcattgta \ ataattgtat \ ttaatatag \ cttatagcat \ tatctctgca \ 40320
gcatgattatta @ attattgaat @ ttttctttttc @ atttctttca @ gagcaacaag @ atatggatt @ 40380
ggatatagaa \ ttttgatgtac \ accttgggaat \ agctcatacc \ cgttggggcaa \ cacatggaga 40440
accccgtcct gtcaatagcc accccaggg ctctgataaaa aataatggta tggaaaagtatt 40500
tttttgtgctt \ tggaatgatt \ gtggaaaacct \ aataatggggg \ gcagaatgaa \ ggctttttaga \ 40560
tttcattatt tttaataattt ttttcatctgg aaaattttcaa actattcagaa gtagtagaga 40620
gcatatggag ctgagagtgc tggctcatgc ctgtaatccc agcacttggg gagcctgagt 40680
tgggaggatt \ gctttgagtcc \ aggagttac \ gatcagccgt \ ggcaacatag \ tgagacccctg \ 40740
tctctacaaaa \ aaaataaaaaa \ ataagttagg \ cattgtggtg \ catgctttgta \ gtctcagcta \ 40800
ctcgggagac tgaggtgggga ggatcgttta agcccaggag gtagaggctg ctaggagccg 40860
tggtcaaccc tcatgccattt gccctccaac ctgggacaaca gaatgagacc ctgtctgtcccc 40920
accatgcctg gctattatttt gttattttag tagagacgggg gtttcactgt gttgaccaggg 40980
ctggtcttga actcctgacc tcaagtgac ctcccgttcc ggcctcccaa agtgctggga 41040
tattaggcat \ gaaccactgc \ tcctggctga \ gaactttttg \ tattggttttt \ gtcctttaggg \ 41100
cattctctc tagaaattgta taatcaattt actgtgttttt agagtactt ggaatagtct 41160
ttctccatgc \ agttgtgtcta \ cgtgttactt \ taatattgttt \ tagaaactatt \ ttttttttatt \ 41220
tttattattat @ ttttttgagac \ cagtctcgc \ tgtgtcgccc \ aggttggagt \ gcagtggtgc \ 41280
gatatcggct actgcaacc tccaccttcc aggttcaagc atttctcctg cctcagcctc 41340
ccaagtagct ggggactacag gtgtgtggcca ctacaccggg gtatatttttt gttattttag 41400
tagagacggc @ atttcactgt @ attagccagg @ atggtctcga @ tctcctgacc @ ttgtgatccg @ 41460
cccacctcag \ cctcctaaag \ tgctggggatt \ acaggagtga \ gccactgtac \ ctgtccstatt 41520
tttttatttttt aagagattgat attctttaaa aaaaaattgtt atttataattt atttaaaaata 41580
tttatacat @ tccgaagtca \ catttttaaa \ ataagacaca \ ctaaaagaag \ tctaccccagc \ 41640
actttgggaag \ gctgagatgg \ agggattgcc \ tgagccccgg \ agttttgagac \ cagcctgagc \ 41700
aacatggcaa aattcctgtgc ctacagaaaaa tacaaaaatt agcttgatgg tggcatgcgc 41760
ccatagtccc agctactcag gaggctaagg caggagatc acctgaacct ggggggtttgag 41820
gctgcagtga gccatgattg ccccattgca cttcagcctg ggtgacagag tgagactgtc 41880
tcaaaaaac \ aagtcttagac \ tcttctgttt \ cctcttattc \ ccctcgtaggg \ taaatttcac \ 41940
caattattga gtctgttcttt tcatttaaaaaaaaataagca aatacataca gaatacatacac42000
aaaaggtgtgt @ atgtgtgttat @ ttattccctcc @ ccatttttttt @ tccttttttatt @ ttagagacag # 42060
ggtctactactc ctccaccccag gctgggtaca gtgggtgggat catagctcac tgtaccaccca 42120
aattcttgggg \ cacaagtgat \ cttcctgcct \ cagcctcctg \ agtagctagg \ atcacaggct \ 42180
tgcaccacca caccccagcta attttatttta ttttttgtaga gataggggtc ttgcttttgttt 42240
gctcaggctg gttacaaaat tctggactca agtaattctc ccacctcagc ctcccaaagt 42300
gctgagtta \ caggcatgaa \ ccactgcacc \ cagcctttgc \ tgatttttag \ ttttaatttag \ 42360
aagctgccta tttaggcttc ttgtgcttca attactactg ttgaattttga tcatatgct 42420
agcaatatt \ tagactttttg \ actactgacaa \ ggccttttat \ aaaagattccc \ gaaaactac \ 42480
atttagattata \ tgtttttgaga \ attttggcttt \ aagttaagac \ ctttaaattta \ gctgtttatt \ 42540
aattcctttttg ttcttagcatg aaagttttttt ttttttttttt ttttgaagagg aaactcgctc 42600
tttctccaag \ gctgggagtgc \ aatggcatgc \ ttttccgctca \ ctgcaacctc \ tgcctcctgg \ 42660
attcagcgat \ tcttctgcct \ caagcctccc \ aagtagctgg \ aattacaggc \ gcctgacacc \ 42720
acgcctggca attttttgtta tttttagtag agacaaggtt tcaccatgtt ggctagggctg 42780
gtctcgaact \ cctgagctca \ ggtgatccat \ ctattctcagc \ ccccagagaat \ gctggggatta \ 42840
caggcatgag \ ccaccgcacc \ cggcaagtttt \ ttttataat \ tttatttttgt \ gggttgctatc \ 42900
attcttaaaa \ aattctagtga \ aaattgttat \ tatttggttt \ ctatattactg \ tcagccaaaa \ 42960
tatcagctct tttatgtatat taagaactt gtttggggggcc ggggtgtgggtg actcatgcct 43020
gtaatcctag \ cactttgggga \ ggccaaggca \ ggtggcatcac \ ctgaaatttag \ gagtttggaga \ 43080
ccccctgac \ caatatggca \ aaaccccatc \ tcttattaaaa \ atacaaaaaaat \ tagctggggta \ 43140
tgggtggcatg \ cacctgtaat \ cccagctact \ tgagagctg \ agccaggaga \ atcgctggaa \ 43200
cccaagaggt ggaggttgca gtgagccgag atcgtgccac ttcactccag tctggggtgac 43260
aggcaagac ttttgtctcag aaaaggaaaa agaactttt ggcctggcat agtggctcat 43320
gtctgtaatc tcaagactact ggaaggatga agtgggagga ttgcttcagc tcaggagact 43380
agcctggggca \ atacataggag \ actctctcta \ cagaaaaata \ aaaaaaatttag \ ttgagtgtgg \ 43440
tgtagagcc tgtaatccca gctgcttggga aggttggtt ggaagaatca cctgagccca 43500
ggagtttaag \ gctgcagtga \ gtcatgatttg \ agccactgta \ ctccagctttg \ gtgacagagc \ 43560
aacatcgtgt \ ctccaaaaaa \ aaaaaaaaaaa \ tatttttata \ atttcatata \ aaattttaatt \ 43620
tagcagtaat \ ttttctccta \ actgaaatga \ actctgaata \ ataaatccag \ gattggtaggg \ 43680
attttttttttt \ ttttttttttt \ ttttgagaca \ gaattctact \ ctgttgccca \ ggctggaatg \ 43740
cagtgggtggg @ attccggctc @ actgcaacct @ ctgcctccca @ gattcaagcg @ attctcctgc @ 43800
ctcagcctcc \ caagtagctg \ ggttttacagg \ cacgtgccac \ cacgcctggc \ taatgtttttg \ 43860
tatttttagt @ agagacaggg @ ttttcgccatg @ ttgaacagga @ tgttctcaaaa @ ctcctgacct @ 43920
caggtgggtct @ gcccatctcg @ acctcttaaaa @ gtgctggggat @ taagggcatg @ agccaccgtg @ 43980
ctcagccgga @ ttggtagtttt \ tttatgtacca \ gcagtcgcta \ caataatga \ tatttgtcaac \ 44040
tcttgattat \ ctgttcttac \ agttttcaaaa \ atttagtaaa \ aaaagatgaaaa \ attattcccga \ 44100
gatcatgtct @ attttctcttt @ ggaatgatat tttaacattt @ atgttttctga @ cattctatga @ 44160
cttatttgga \ tctcaaaaca \ gtaaattttaa \ ctatgggaact \ gattgggtttt \ tcttaggaaa \ 44220
ttccttagtt \ cttagtctta \ aattcattta \ gtgtaaatca \ gattattttgtt \ ttagttttgaa 44280
aggacttctc tttaaacttt tactcaagaa tgaatgaaca gagaaaatag agaagaattttat44340
agttcagctc tctcatttttg caatatgggc aacagaccca ataaacttgc tccttttcaca 44400
tgggttaacat \ ttgattactata \ gttttagccac \ aactgaaaat \ gttatctctta \ gacttcctgt \ 44460
ttatttccct \ actgtacccca \ cctcccctgc \ actgtttgct \ tcagctatgc \ catataaaaca 44520
atgctgctga \ tctacctgat \ gataatctggg \ taaatgagaa \ gtagatgtaa \ tttatgttata \ 44580
aataacataa @ atagtatata @ gcatgttaaaa @ aattttttgac @ ttgagaaaaaa @ tccagttaga @ 44640
gtatagcta \ tttttagattt \ atcatacttc \ taactttttt \ gtcttcaaca \ cttttacctc \ 44700
ttttagattt @ tatcgtttatt \ cacaatggaa \ tcatcaccaa \ ctacaaaagac \ ttgaaaaaaagt \ 44760
ttttggtagag taaggtgacc tcaaaaaccc cccccttttg agaatactc c taacgagagc 44820
actgggggtcg gttgttgggga tgtgcaacaa accaccatg tgtgtcatca agtaatttct 44880
tggacaattc caagggcacg gtggttttatt ggattttttct ttgctaacag tggaacaatt 44940
gtgttttttta atatgaaaaag gaatattatta gcatttgact gtatatataca tgacaaaagg 45000
ctcaaaaaa @ attggaattt @ tgtggagaca @ ttttttgcat \ tctgagagat \ tgtcatgcttt \ 45060
taaagttcct aggatatatt aatacaagaa gaatcaggac aaattataatg aaagtttttat 45120
gtcgtaaata \ gctatatatact \ gtagtagtagt \ ggtcatataggg \ ctgacctgca \ tgaggtgcttt \ 45180
cttaggggctg ttcaatttgaa ctttctccag tgttggaaga caggtgtatct ggggtattca 45240
gtagtaggc actgtccac atgtggttgt tgagtagta tgactgagga actgaatttt 45300
aaattttattt \ taatttttaat \ taatttgaaa \ taggccatata \ cagctaatgg \ cttatttatta \ 45360
gacagtaagt taaggtgtatg \ ttcagttaaa \ cagctccca \ actgtttttta \ gagcactga \ 45420
tcagctgggtg \ actttaattt \ tgaataatgg \ gatatgggtt \ tcaaaagata \ ttagaaaattta \ 45480
gtggcatttt \ gacgggaacaa \ ttctgttagaa \ aggttttttt \ tatcattaat \ atttctttaaa \ 45540
ttgttatctttt tttttcttttc tacttacagg aaaagcaagg ctatgacttc gaatctgaaaa 45600
cagacacaga gacaattgcc aagctcgtta agtatatgta tgacaatcgg gaaagtcaag $ 45660
ataccagctt \ tactacctttg \ gtgggagag \ ttattccacaa \ attggttatta \ agccacattt \ 45720
ttaaagataaa \ ttattgccaac \ attaatgctg \ agaaactttc \ tggaattataa \ gtttgataag \ 45780
caggaactgt \ gctattttttt \ tatttttttgc \ ttttattttct \ catataacta \ ttcaagtttga \ 45840
aaaattttga gaaactgatt gattattattaga ttccccccca ccctccattt aaaattctac 45900
ttactcatt \ caggtttaat \ gtcatgaaaa \ tgaaaaattaa \ tccaaaatca \ gtgtgtgtaa \ 45960
aaaactgca \ tatatgcaca \ catccatacg \ caccacacgt \ ggacatgtac \ acagtacaca \ 46020
cgatgggaga ttagtatttc ccttgcttct tgctcatccg agtgttcttc tcaaccaata 46080
acttagcaca attagtagcttt cacagctacc acagtttatt ttctgggata atgcctgcttt 46140
gtctctgagc caacaaaagtc aactactat tttttccttttgggggactttc cccttggctct 46200
gaactcttat \ agaaaaagcat \ ttccaagccc \ atgagaaaaat \ cagtattcttt \ ttttgattcca \ 46260
tccacattc \ ctataattagag \ attaaagaca \ tcaaaagctt \ acaaaattgtcc \ aaatccatag \ 46320
tgaccactac @ atttcccttccccactactataactcttagctttcccacttaaagtcctttta $ 46380
cttccccaaat \ acgggtccagc \ cctactctct \ ctcccacctg \ cacccaatc \ tttatctctgt \ 46440
agcaaaaaga @ ggaagcagaga agtagggagaa @ tgtagaggcc \ tatttcctttcc \ ctttccccaa \ 46500
ggcaggtgg agtaggtgtgc cttccccagcc ttttctcgtt tctacaagggc ttttgcctttt 46560
attcattgta \ taatccagttt \ tgtgttccaa \ ggtggttcttt \ ccctctccta \ ctttcatgttc \ 46620
ctcttttatc tgttcttgat cctcctgtaagc tctgtccctg aggattcggg ttgatggag 46680
tgtatgggtgt \ gcatgttaat \ aattgtatat \ attttatatct \ ctatatcaa \ ggtcagaaaag \ 47740
agtggaagtt @ aaaggtggtg @ tacaattata @ ggggcagaagaataggtttttgg @ attttgatct 46800
taggattcttt \ tctataattctg \ tcgttcctct \ gataatttcat \ agtattatga \ cgatatagat \ 46860
aggtagatga tggagatagg atatataggtgtcagaaggtgtgtcatagcctg tagagaaggat 46920
gactttttaa @ atgattctatt @ tttttagtagtg @ tttattattg @ agcatattttt @ gggtgttaggc @ 46980
ttggttaaaaaaggtgggtt tgggtgcgcg tgggtggctca cgcctgtaat cccagactt 47040
tggggggccg aggtggggag atcacgaggt caagagatgg agaccatcct ggccacaatg 47100
gtgaaccct gtctcttatta aaaatacaaa aattagcgtg gggggtgcgtg cctgtaatcc 47160
cagctactcg ggaggctgag gcaggaat acttgaacc agggagtttgg gggttgcagt 47220
gagccgagat \ cgtgccactg \ caccccgcc \ tggtcacaga \ gtgagacccc \ atctcaaaaaa \ 47280
aaaaaaaaaat \ gtggggtctttg \ gataaccacca \ agcttaggag \ taaggtgttta \ cttaaacttt \ 47340
agacttgttt @ aaaaactggt @ acaaaagagc @ atttgtgtga @ acaaaaaaatt @ tctgcgctga @ 47400
agccagtatg \ ttctaggcat \ ttctgacttg \ ataatttattt \ aaataggct \ aatggatttt \ 47460
tttccctccc \ taggaaggtg \ ctttttgact \ tgtgtttaaa \ aggtgttcatt \ ttcccggggca \ 47520
agcagttggc \ acaaggtaca \ taactactcta \ acaatgacta \ atgttatttca \ acatatttga \ 47580
gttacatgtt \ tattcttcgt \ agactataca \ tgaccccttta \ ttataaggc \ tctgccctttt \ 47640
attagata tattcatgtgag cattatttca catcttcctt \ ctttgtctgtt \ gcttaccact 47700
cttccatttta \ acagaatccc \ tgaagaaaagc \ aaatacaggc \ tgggcgctgt \ gggtcaccacc \ 47760
tgtaatccta \ gcattttgggg \ aggtcgaggc \ aggcggatca \ tctgaggtca \ ggagttttgag 47820
accagccaggg ccaacatggc gaacccccgt ctctactaaa tatacaaaaa ttagccggggt 47880
gtggtagcac @ atgcctgtaa \ tccccagctac \ tcgggaggtt \ gaggcaagga \ gaaccgctttg \ 47940
aaccccaggag gcaagaggtt tcagtgagcc gagatcgtgc cactgcactc cagcctggcc 48000
tacagagcga gactctgtct gaaaaaaaaaaaaaaaaaaaaaaaaaagaagc aaattatttt 48060
tggcatttaa ttggccttttt gtcttttgttg ggcgcccaa ggttacttttg tgaatttgga 48120
tattgaatat tatctataaa agttaaaata tttagcttttt ctgtatttttt tgaaaacatat 48180
attcttagaca \ gattcctaga \ taattgtacc \ atcactactt \ cttgctaggaga \ tatttaggcc \ 48240
tgatcatgaa gtcctaagtg aggaccccta agatattatg gtaagagaga tattttttaat 48300
ctgaaaaacag \ ggtgactaag \ gagaaggtgc \ tacttttca \ tattattggca \ ttctgtgcac \ 48360
aattgaaaagg aagttccct ttaacattac aaaggaaaaaa attattaaaata catttgtaca 48420
gaaaggtgt @ tggcaagtttt @ tctggagtgg @ gccggatagtt aactattttta @ ggctttctgg @ 48480
accatgtagc \ ctctgtagca \ actactcaac \ ttttgcagttg \ tagtgtgaaaa \ gcagctgcag \ 48540
aaaataagta aaaagaatggg catggggtatg ttccaaaata actgtatttata atacaatttt 48600
tatttgtcaa ttagaaaaag aaaataattaa aaaaaaaccc aaaacctgt atttaggctgg 48660
gcgtgggtgac tcatgcctgt aatcccagca ctttgggggg ctgagatggg tggattgcttt 48720
gaccccaggaggttccagatc agcctaggca acatgacaaaa atcccatctc tataaaaat 48780
aaaaaaattta \ gctggggtgtg \ gtgggtgcatg \ cctgtagtcc \ cagctactca \ ggaggctgag \ 48840
gcaaggggat acttgaggc caggaggtca aggctgcagt gagctgttgat tggccactg 48900
actctaggcc tggggagagagagcaaggtg ttgtcaaaaaa acaaacaaaat aaaacaaaaac 48960
cgtttatttta \ taaaaaaaaa \ ccctgggggtt \ gcaggtcagt \ ttgctgaccc \ ctgatagga \ 49020
atattttggga \ tagtaggct \ tgttctgtca \ tccagggctgg \ agtgcaggtgg \ cgcgatcttg \ 49080
gctcactcca acctcacct cccagactca ggcaatcctc ctactactgc cttccagagta 49140
gctgagactg \ taggcacgtg \ ccatcaccacc \ tggctaattta \ ggagacggggg \ ttttgccatg \ 49200
tttcccagag tgtgtcttgaa ctcgtggggct caagtgactt gcctgcctag gcctcctgaa 49260
gtgctggggat \ tacgggttgtg \ agccattgca \ cctggcccaa \ tactgattttt \ ttttaaaaat \ 49320
tcttttttatc tagtctttat attctgaagtt gagcttggggg aggattattt aaacatttga 49380
aggattattgg ¥ cccattaaat ¥ tttatgtcat ¥ tagtccatta ¥ ttttaaaaaa ¥ tggttttaatt ¥ 49440
ctaactgctt ttgcaatttatcaggcgaggt agccctctgt tgattggttgt acgggagtgaa 49500
cataacttt \ ctactgatca \ cattccata \ ctcttacagaa \ caggtaaaat \ tacctctaca \ 49560
aatgcagtgc agtagatatg agaattattt ttccttaagt tgaatatagat ggctctttttgg 49620
ttagatgcac atgtatat agttcttgtct agacatataaa agattttgtt ttttgtgagttt 49680
ctctgatgattagatttttttttctgttgtggtatccttagctaggactcagattggatcaa49740
aattcacacg \ gtgggggatca \ cagggagaaaa \ gaggtgggaa \ atgcactctg \ catggatggg \ 49800
gaggcttta tcctctttttg ttttattcttt actaattcttt ttgttcttggg agtgaatgaa 49860
tgtgctggggc \ ctctaaaaaat \ gtgctttattatt \ tgtgggggaag \ catattttttga \ catttttcta \ 49920
attgcggag @ tatattttgc @ gtgtctgctt @ ttggcattta @ gaaaagtgcttt @ ttaataattt @ 49980
cattaaaaatt @ tctgaaaatt @ gagaaaatag @ ttgaaaattgt @ aaattattttt @ ttccttttgttt @ 50040
ttaaaatcat \ gtaggattgta \ tgcttagattt \ aggaaaaagg \ cattgtgtggc \ taggttatta \ 50100
tagattgact aagtggtagt tatttgaatc atttaggcta acttttaact gaaatattgtt 50160
taaggtgtct tttatttttta tacatgacat attgttggat tcatatttgc tatcttgatt 50220
gggttttattt gaatttgtag tgattgttct tttattattgt ttatgtgttaa agttttatttt 50280
ttgtttttttct \ tatttattatta \ ctttcgatta \ acttttttat \ agagcggcag \ gggggagacag \ 50340
ggtcttgctc tgttgcccag gctggagtgc agtgcagtgg tatggtcatata cctcactgca 50400
atttcgaact \ cttggggctca \ ggtggatcct \ cttgcctcag \ cctctcaat \ agcttagtact \ 50460
acaagcgtgt \ gccatcacac \ ccagctattt \ ctttattttta \ gccagggttt \ tgctctctca \ 50520
gccagggctgg agtgcagtgg ttttcgtcatg gctcactca gcctttggctg cctaggctca 50580
agtgattctcc cccacctagc ctcttgagta gctggggacca caggcatgttg cccaccacccc 50640
cagccatttt \ ttttattttttt \ aaaaaagaag \ tcttgctatg \ ttggccagggc \ tggtctcaaaa \ 50700
ctcttggggct \ taagggatcc \ tccccacctca \ acctcctaaa \ ttacagggat \ tacagggaatg \ 50760
agccactgtg cctggctccc agctaacttt aaattttttg tacaatgga gtcttgctat 50820
attgcccagg ctgttcttga actcctggag tcaagtgatc cacctgcctc agcctcccaa 50880
agtgctgaga tcacaggtgt gagccactgt gccccagccca gaggtgttct tttcatttaa 50940
acacacattg \ attattcaaa \ tttttttttac \ cttattttatt \ tatttttttga \ aacagtctttg \ 51000
ttctgttgcc \ caggctggag \ tgcagtgaca \ tgattcttggc \ tcactgcaac \ ctctgcctcc \ 51060
cgggttcaag \ cgagtctcat \ gcctcagcct \ ccagagtagc \ tgggactacc \ agtgcaccac \ 51120
accacacccg \ gctactacttt \ gttattttag \ tagagacgggg \ gtttcgccat \ ttttggccgggg \ 51180
ctaatctcga \ actcctgacc \ tcaggtgatc \ cgccccacctc \ ggcctcccaa \ agtgctggga \ 51240
ttacaggtgt \ gagccgctgc \ accccgcctc \ aaatttttttt \ tacatattttt \ aactaaaat \ 51300
actttgttat ttgaagaatg aaattattcaa tatttggaga aaaacacag tgaaactcaa 51360
gcctattagg acattttatata agcaaaagta gttggtttttt tttttttttttt tttttttttt 51420
gagacgaagt ctcgctctgtt tgctcaggtt gtagtgcagt ggcgtgatct cggctcactg 51480
caacctcggc \ ctcccggggtt \ caagcgagtc \ tcttgcctca \ gcctcctgag \ tagctgggat \ 51540
tacaggcacg tgccaccaca ccccagcaat ttttcttattt ttagtagaga cgggggtttca 51600
ggctgtttgct \ caggctgggtc \ tcaaactcct \ gacctcatga \ tccgcccacc \ tcggcctccc \ 51660
aaagtgctgg \ gattacaggc \ ctgagccacc \ acacctggtt \ gcattattttt \ ttttttaaatg \ 51720
ctgagctctc @ ttttttagtgtg @ ttttttaattt @ cactttttttg @ ttttgttttttt @ gagcaaaagt @ 51780
catgctctgt \ caccccaggtt \ ggagtgcaat \ ggcacaatct \ cacctcactg \ caacctccac \ 51840
ctcccaggtt \ caagcgattc \ tcccacctca \ gcctccggaa \ tagctgagac \ tacagggtta \ 51900
ctctaccact \ ctcagctaat \ ttttttgtgtt \ tttagtagag \ acgaggttttc \ accatgttgg \ 51960
cccggctggt cttgaactcc tgacctcaag tgatctgccc acctcggcct cccaaaagtgc 52020
tgggttattaa agcatgagcc actgtgcctg gtctctgtttt tttaacatac agtaattatt 52080
actctttttc @ atgtagttttc @ accattttttg @ tcatatgcga @ aattgcataa @ gtaccaccat @ 52140
aatcaagata cagaacaatt tcatactca ataaggtccc tcaacctgcc ctctgtcatc 52200
aacccttgtc tcattccccag cccctggcaa actataatat gttatttttttc tatataatttta 52260
cttttttcttg \ gattgtcatt \ tactatttatt \ ttttcagtttg \ gcatcttttgc \ tgttaatat \ 52320
gaatgggaaaa \ agttacttttg \ ttttcatcac \ taaaacatca \ aataatcaca \ gatggtgggaa \ 52380
aactcgaat \ attactttttt \ tggctttttat \ ttttaataga \ tatataattta \ tatgttttatg \ 52440
tgggtgtatat ttcaatacat gtgttacaatg tatataatgc agctcaggat aaatagcaca 52500
tttgaatgta \ catttctgat \ aattattcaag \ tctgccttta \ tatgtgcatt \ ttagagagat \ 52560
agtaggaaata \ gcagttttta \ taagtactact \ tgtgatgttc \ tctggcttatt \ gtgtccatag \ 52620
ttcttaagttc @ tgttattagtcc @ tggcctttgaa @ gaaggtgca @ ttttttgttctc @ taggcattt @ 52680
atgtagtcttt \ caactatatag \ attttttttcc \ tatataaggc \ caatttataa \ aaccttagca \ 52740
ttccagtttt \ gatgaaaaag \ ttaattattaa \ tgtcttcaca \ aattagtagag \ aggtgtcata \ 52800
attctgaaat \ acaaagatta \ aaaggattatt \ agctttgcaa \ aaagaccccta \ ctttattcctg \ 52860
acttaaaaga agcgtaagaa aaccccagttt gaagaaaagga gagttttctttg gtttataaat 52920
tttgtctctta \ acaggggggtg \ ccacatatga \ tataccgtga \ tattagaggtg \ atatgcatct \ 52980
gttttgttttt \ caatcagaa \ ttagtgtaga \ ctacaacttg \ atttgtttatg \ ctgacttgct \ 53040
gctaaaaactct agtgaggttt tgttatgata caataaaaat taatttgcca ctagccttca 53100
ttttctttttt \ ctttttttttt \ ttttttttgag \ acagagtttt \ tgctctgtttg \ ccccggctgg \ 53160
agtacaatgggcgtgtgattt cggctcactg cagcctccac ttcctgggtt caagtgattc 53220
tcctgcctaa \ gcctccccag \ tagctgggat \ tagggcgtc \ tgccaccacg \ tctggccaat \ 53280
ttttttatttt \ tcagtagaga \ tgggggttttcg \ ccatgttgac \ caggctggtc \ ttgaactcct \ 53340
gacctcaagt gattcacctg cctcggcctt ccaagtgct aggattacaag gcgtgagccc 53400
ctgtgttcat @ ttttattttttc attgcacaat @ ttttgatattt @ taatgttaat @ ttttgttataa @ 53460
ttataggtac \ acaaacttt \ attgtgttag \ atcattgttt \ tgtataaaagt \ taaaaattataat \ 53520
ttatacatac \ ttttgattata \ aaaaccggt \ taattattag \ gaatttacttg \ tcttttacct \ 53580
ggaaaaataaa @ tattattatta @ aaaaaaatatataattgtagca @ cttttacctg @ ccacgcactc @ 53640
tttgatagtt \ gctacttcac \ tgtactactt \ ttgtctgttc \ tttattggctt \ attgcatgga \ 53700
aataaggtga \ tctacttggc \ ttttttaaatt \ tgctaaaatt \ gtttttgttgtt \ gctatgattt \ 53760
tttcttgatt \ ttatagata \ ttattgcatat \ ttctcatattg \ gacatgattt \ tctatacatgtt \ 53820
tgccatttca \ tgttaactat \ atgcttttagg \ caaaagaagag \ aaaggagagtt \ gcaattctctc \ 53880
tcgtgtggac @ agcaacacct @ gccttttccc @ ggtggaagaaaaaagaggtgg @ agtattactt @ 53940
tgcttctgat \ gcaaggtgag \ cttccttagt \ tgattcaag \ agatttttttag \ taaaactct \ 54000
cattctgcag \ gaaaccccag \ agtcattgt \ gtatcagtct \ agttgtgctc \ tgtgagataaa \ 54060
ctttttaat @ taaaagaata \ caggtgacca \ ttttgggacat \ gggggttgtaa \ ggactacttt \ 54120
tctgtcattt \ caaaagtgt \ gggtcagttt \ actaagaaca \ catatactgc \ ttgagacttg \ 54180
ttccaggtgta tttattttag agctctttaca ttttttttcct tcttattttca ggagcctttat 54240
ccaggtttttg aaggggagag attctagattt gaagagtaaa atgggtttagt tagtatccca 54300
attagttag \ catagttgct \ aaactattgt \ agtttttagtc \ taatgtagat \ actcatttt \ 54360
tactatttaga attatattgc agcatatatca ttttttaaaa ggtagatagtag tagactataga 54420
tatttttgaga gaaaaatgcag gggggagtttt acatgcattt gtaaatgaaa tagtagatgag 54480
gataaaaataa @ aatcaccgaa @ attgcaaaca \ agtatttgag \ tcatccactg \ tacctgaaaa \ 54540
taagagaaaaaa @ ataaaaaaat @ agaaaaataaa @ tgcatatttag @ gacatcagggg @ atatattattat 54600
ctcagtggga aaacaagcttt tactctttaa tgtttttaca ggtgtgtaag gtgtgtaggtc 54660
agggctaaga tgtgttaagat tacacagtttg acagttatggg cttaataacaca ctgggaattac 54720
agaaacatat cagccttttc tcattcattt atactattcat attgaactact gggtgaagtc 54780
atatgctagc gtcaggagat aatggtgagt aaaaaaaaa attattactt tccttaggag 54840
ctcttccata \ gtgaggagggc \ aaattttaaa \ caatgatcac \ agaagtgtag \ aattccagct \ 54900
gtgacaagag ctgcagaatg cttagtaagag agtgatttac cctttgtgggg taaatttcttt 54960
taaggggaatg \ atgtttgaac \ tgagagttaa \ ggagagatta \ ggagttaattt \ aggttaagag \ 55020
gtagagggag gaactattcat tctttgcaaa tggctcagcc tgtgagagtt taggatggct 55080
ttgagtgtgg ccagaataga gagagtgaga ggaagctttgg gggggagatga agctggagaa 55140
ggagtagtag ggattacggt aggcacttt gttgtctctc tgagagccaa agggaaactg 55200
tcaatggtt tgttgagtga aggaagaatc tttattagag ttgttgccttt ttgatatca 55260
ttttggcaga aatgggagat ggacggagag agatcagaga gaaagtgggtt ggactataattg 55320
ggagatcgct gcagtagtcc agccgaggag ctgatggggag cttgaattttg tctggtggtg 55380
gacatagaaa ctagaagatat ttgggaagtta aaattttcagg acttggtaat ggatatagatg 55440
aggaggaac @ acaccgcttt @ tctgatctaa @ tctgtttttgtt @ ttagattgct @ atgcagagtt @ 55500
ccttttatttt \ ttttgtccaca \ atgaccacct \ tccccatact \ ttcctgtaggg \ ggttggggatt \ 55560
agtaaccaga \ aaattctctg \ agatactgca \ gagtgataga \ gttttattattg \ aaattttggtt \ 55620
cttgtattcca \ aatgatagttt \ tcatttgtaa \ taatgatcct \ tggttatcga \ ttgtaatatc \ 55680
tccttgaaaa \ cttttaggtg \ ctgtcataga \ acaccaccat \ cgcgtcatctt \ ttctggaaga \ 55740
tgatgattt @ gcagcagtag \ tggatggacg \ tctttcttatc \ catcgaattta \ aacgaactgc \ 55800
aggagcatcac cccgggacgag ctgtgcaaac actccagatg gactcccagc agatcatgaa 55860
gggtgaaaagt @ ttttgtcatgg @ ttatagctttg @ ctgtccttac @ tggaaaagaat @ atttctact @ 55920
tccttttccta \ gcattataaa \ tcttagtaatg \ aatgatgagt \ ggaatcttcc \ acatgattag \ 55980
tgaagggaca acgctaggaaa aagggatgat tcttagaga aattattctgc tgtttttaca 56040
atcgtcttca \ aactataatta \ tgattttgtta \ ttttgtaacat \ tataaaaagg \ tttattaacac \ 56100
ttgactacttt \ aaatagactt \ tataaaacat \ aaaatagtta \ atgttctgttt \ ccttttttatt \ 56160
ctctttgtgtc @ tttagttttc @ ttatattaa @ catgaggata @ atagcctg @ cctcattag @ 56220
gttgtttttga ggattaagaa gctactatat ggctgggtgc ggtggctcacacacctgtataatc 56280
ttagcacttt ggggggccga ggtggggcaga tacctaagg tgggggagtttt gagaccagtc 56340
tggcctttcccc aacgtgggagaacaccccgactgtactaaaaaatacaaaaattgaggtgggtgt56400
ggtggcgcat acctgtaatc ccagctactc ggggggctga ggcaggagaa tggcttgaac 56460
ccggggggca gaggttttcag tgagccgaga ttgcgccatt gcactccaggc ctttggcaaca 56520
aggcaaaaac tctgtctcaa aaaaaaaaaaaa aaaagaagcttt aaaacaggtgt ctgacactact 56580
tagtcgttatg \ taattatttgc \ ttctgttaac \ tattatatat \ atttatgattt \ ggattatttttt \ 56640
attccttttct \ gatgggattg \ tggtaggaat \ aaaactaac \ attggccaggg \ cacgggtggct \ 56700
catgcctgta @ attccaacac @ ttagggagggc @ caagtaggaga @ gatcacttg @ agctcaggag @ 56760
tttgagacca gcctggggcaa catagtgaga ccttatctctct actacaaaact aaaaaaaaa 56820
aaagtccaggg \ tgcactggct \ caacctgta \ atcctaggac \ ttttggggagc \ tgaagcaggc \ 56880
agattgccag \ agctcatgag \ ttcaagacca \ gcctcagcaa catagcaaaa \ ccctgtttct \ 56940
actaaaaaata caagaagaaat tatggggcatg gtggcatgtta cctgtaggtct cataggactgg 57000
gggggctgag gtggggagaat acttgaacc caggagggag aggttgcagt gaggtgacat 57060
cgtgccgctg actccagcc tgggcgacag agtgagactc tgtctcaaac aaaacaaaac 57120
aaaacaaaac @ aaaactatga \ gccggggcatg \ gttaggtgtgt \ cctgtaggtct \ cagctactca \ 57180
ggtggctgag gtgtggaat tgcttgagcc caggagattg aggctgcagt gagcgttat 57240
cttgcgggtga \ tactctcagt \ ctggggtgaca \ aaaccctgt \ ctcaaaaaaa \ aaagtaaaaaa 57300
tagagaataa \ catttattgc \ ataactctat \ atatatatat \ gtcagatttt \ ttgcttttatt \ 57360
aatccatact acaatccata ctgtgaagta attggtctct tatttttatag attataattt 57420
tccccagtttt agatagtaaa ggatagaact acagttttggg tgggttgcac tccaaaactt 57480
aaagctttgtc \ ccagttgact \ gagtgcggtg \ gctcacgcct \ gtaatcccag \ cactttggga \ 57540
ggccgaggtg gttggatcat gaggtcagga gttcgagacc agcctggtca gtatggtgaa 57600
accttgtctc @ tactaaaaaat @ acaaaaaaatt @ agccggggcgt @ ggtaggacacac gcctgttaggtc @ 57660
acagtactc agggggctga ggcaggggaa tcccttgaat ccaggagcc aagattgcag 57720
tgagcctaca \ tcatgccact \ ccactccagc \ ctgggtgaca \ gagcaagact \ ccgtctcaaaa \ 57780
aaaaaaaaaag \ ctttgtctcat \ tcacttgttg \ taactgcaca \ ttttcaagtat \ gaagttattat \ 57840
aaaagtgact \ ttttactgtta \ ttttttttcca \ cagagtaaaa \ tatgttcacc \ cagtctttta \ 57900
ggcagtcatg \ tcttattgcat \ gaacttttgt \ tattattttat \ taccacaagat \ tattatataag \ 57960
gaactttta \ gtttgtgtaca \ aattcttttta \ ttttgatttgt \ ttttttgtttta \ atttatgtgat \ 58020
ttcttatact \ tagggcaact \ tcagttcatt \ tatgcagaag \ gaaatttttg \ agcagccaga \ 58080
gtctgtcgtg aacacaatga gaggaagagt caacttgat gactatactg gtaatttrcat 58140
atgaattattt tttatttattc aggtgtctctg acagtaggag gtgccatttaa caacctgaaaa 58200
gttcattgcc cttaatagcc ttgttagacaca actacagctg ccagccatca gtggagccca 58260
gccatctttgg aaaaaagttct ttagtgtgtg attctaccta taatagatat ctagaatagt 58320
cagattcaca agaagagaaaa gtagattataat ggttaccaag ggctgtggggg aggggaaaatg 58380
gggagtcact gtttaaaaggg tacagagttt cagttgtggg atgatgaaat tacagaaatg 58440
gattgtagtg @ atggttgcac @ aatatgtga @ atgtgcttaa @ tgccactgaa @ ttgttacattt @ 58500
aaacatagtt aaaaaaggtaa atttttagtgtg taggtcaccc actgtgtaccc agggactgtcc 58560
ctaggtactg tgaattctaa gaagaataag acctggtccc gttgctggggc agcttattgtg 58620
tatctgcctg gcctaggtttt cctttctgag tgtaataata agtaaaagtg tgaacttccc 58680
cagggtcttt \ tcagttatttt \ gcctgatgcc \ ttttgataac \ ctgtacccctc \ ctgcattttt \ 58740
aagtagaggg tgagagtaca actactct tttttttagg atgggagtttt gcttatgtttg 58800
cccagggctgg ggtgcagtgg tgccatctcg gctcaccgca actgctgcct cccggggttca 58860
agtgattctcc ctgcctcagc ctccccagta gctggggatta caggcatgta cccaccagag 58920
aattgtattct gcctctgtag acagaggtgg ttgttgaaga tggttgagct ggaagaactg 58980
ggagtaggc agtaatttct tttattaggtat ttatggaatat gaggtcagga aaaagattttg 59040
ttttataagg gaagaaaaattg agacaaactt tgggaagttc acgggttttaa aaagtacttt 59100
tggctgggggtg cagtggctca tgcctgtaat cccagcgctt tgggaaccca aagcggggag 59160
atcgcttgag \ ctcaggaatt \ cttagaccagt \ ctgacctcct \ ttttactataa \ aaattttaaa \ 59220
aaatagctg @ ggtgttggtgg @ tggggtgcctg @ tagccctggc @ tactgaagag @ cctgaggtgg @ 59280
gaggattgct tgagccctgt agatcaaggc tgcagtgagc tctgactcca ccactgcact 59340
gcagcctggt tgaaaacct gtctcaaaaaa aaaaaaataa aaaaaaggtac tattatctgt 59400
attatgtaca \ taaaagttct \ gtataaaaac \ aggatatagctg \ tcatctttttt \ tgtttgttaggg \ 59460
atgaggatatgaggctttcagtttgtcaaaggtcacattgttaggtcatttattatgaacca59520
aactactccc \ catgtattca \ ttgttcttag \ tgctctccat \ cccctcccct \ gtccatcagg \ 59580
cattcttttct ttttgcctgta gtgatgggtt acctcatctc aaaaagggatc aggctttttct 59640
aaaagcatc aaatttaggag ctttgggcag ctctttttag aactatccca actatcctca 59700
gccaccagaa atttcttagga ctatattttaa ggaaacacc gtggccagctct aattcactg 59760
tcttatcatcc \ atgtcattct \ ttgtcatcat \ ctgcaataca \ ggtctttttctg \ gtagttgtgtc \ 59820
tgcctttttttt ttttttttttt ttttttgcttt gcttttatat tgagtctttttg cctttgcatg 59880
accccgatcc \ agccttttac \ tgctgtttttcc \ ttttcttctca \ aattattgta \ attaatgcca \ 59940
aggtctgtgg aaaacactgt aggagaggt acacaaacag gcttgggtcta gtgcagtaac 60000
agcaagaagg \ ccagtctggc \ tggtgttgggcc \ tgagtgagaggggatgtgct \ aggtcagagt 60060
aagcaggaga cagtcttatt gggacttgaa ggccaaagta aggtagtcgg @ atttgattat 60120
aaaattatttg \ ggaagctagt \ gactactttt \ attttgtttttg \ gtttttgttttt \ ctacttgcta \ 60180
attttttaaaa \ ataggaaaac \ attacctcttt \ tcattattga \ aattcaaaaac \ ggagaacaata \ 60240
taattattca aaaagaaaaaa agtaaaacac attacctgtgt tttattagtat aactaactaa 60300
gataaaaaaaag \ aaggtgggact \ ggctggggcgt \ gggtggctgac \ acctgtaatc \ ccaggacttt \ 60360
ggggggccaa ggtggggtaga tacttgagg tcagagtcc gagacgagcc tagccaat 60420
ggtgaaaccc tctctactaa aaattagaaaa aaattagctg ggcgtgggtgg ctcgcggcct 60480
gtaatcccag ctactaagga ggccaaggtt ggagaatcgc ttgaacctgg gaggtgggag 60540
ttgcagtgag ccgagattgc accactgcac tccagcttgg gctacagagc agaactctgt 60600
ctcaaaaaaaaaaaaaaaaggt gaggagatga agaggaggg ggcagagtag acagactgaa 60660
aatggttcag \ agagagcgc \ aggatgagc \ ccacgaggag \ gtacctgtca \ ttctcctcag \ 60720
ccagatttgg \ aattgttttga \ gtccagaagc \ tctcagtgcc \ ttgaccacta \ tatttacttg \ 60780
gtggggtgatt aggggaatttt agttgaccag ttgaatgaat gttgaatgag aatttctcac 60840
agatagaaaa ctagcctgtg tggaaggatt tctgggcaag acacatggag aacacaatgt 60900
aaatagctat agaaactgaa aatgaaaaag aggacagact tcattggagg gtcttttatgtt 60960
ttttaagga \ tcactgtag \ agatcccttct \ ggtagcatat \ ggagagcaga \ ctccaggag \ 61020
tgggaacag @ aagagagaac @ tggagaatgt @ tgctgtcgtc @ cagggagaga @ tgctgggtttt @ 61080
gaagataaat \ gtgggagggat \ cagaacaatc \ aagcatttttg \ actgaagcat \ taggggaatg \ 61140
ggggacggcaa agactgagag gagagtgggt ttattgtact ctacagagca ccttttctgg 61200
caccagaggg aaaataaacg g taactgagat at aattattttc cccagaggtt ttattgagac 61260
atatatagat \ ataataaaat \ taccacctcc \ tagtgtataa \ ctctatagttt \ gacaaaacctc \ 61320
tacaacatag tcatataatcat aacctctaca aagtcaagat gtagacaagt tccatcactc 61610
ccaaaaatttc ctttgacccct attgttgtca acccctcctc cagctccagc cctctatacatc 61440
taatgatctg \ ttttctgtgtt \ ccctctactt \ ttgcctttaa \ gataactttc \ aaaagagaaga \ 61500
atgtaaaaaat \ aactaactaa \ ggtagagaatgt \ aataaaact \ gtatattgtgt \ gggggagttag \ 61560
agggtgagt aaggtcagtt acaagttttgg gggcgccaggt gaagtgtgtga cttatttataat 61620
ttactttttca aaaattacaga gaactgtgct ttccaaagggg aaattattatt ctttaaaaca 61680
gcagtattct \ tcctcatatt \ ggcagttgat \ actcaaaaaa \ tgcgattgcc \ tagtcatat \ 61740
ggttcttttgc taaataatta tgtacacaaaa ctttttattc agtgaattttg gggtggtttga 61800
aggatcatat aaaaggacatc cagatgcc ggcgtttgat tcttattgct tgtgggaacaa 61860
gttaccatgc \ tggtgtagca \ gtaagtgcttt \ tttaaaattt \ taatttatgtt \ gaattattaga \ 61920
gaatctctgt agaccaagta gttagtctat aacatactgt gtaaaaactat gtttttgttaa 61980
tgtgttattct ttttcccctttt gtgataaaaa agaaggtaa gggggagaaat ttaccagctg 62040
cttggaattta ttttaccatg gaagattctgt agaaaaaggtc cctagatata tagatagacc 62100
tcctgcaacg gactcatga aaggccaaga ggggggagaggt ttgtgtactactg tcctagactt 62160
gtagcctaggg gagcttgcct \ acatgtgtaa \ gagccatcgt \ tgggtttttgc \ ttagcattgt \ 62220
tcacttgccc \ tagacagatg \ gcctgcatca \ tgtgtgaacc \ tcagtgcaat \ tttacttttgt @ 62280
gggcacatta \ ctgcaaaaga \ agtagtagtctg \ cttttttttt \ taaatcagat \ tttattcttt \ 62340
aaaattgttct \ tttagagaagct \ gaatttcagt \ atcaaaaatg \ tgtatttgtca \ gtgcaagaagc \ 62400
ataggtgtat \ gagggtcttt \ tattcccaata \ aaaaccacaat \ atttgcccac \ gtagttttcct \ 62460
tagagaagaga \ cagtttattgt \ gctgctgatg \ tcaactgtta \ tgaacagaagaag \ accttttacat \ 62520
tcaatttctg \ cttttaggat \ tgacttccaa \ agttcctgac \ ataacttatt \ tatttgctga \ 62580
ggcataaata \ ttttattagga \ gccatttatt \ taagcagtga \ gtgaaactat \ ctggtcacct \ 62640
gcccctgcat \ ctcaacaagc \ ttttgcctttt \ tctaagacta \ caccaaaatac \ ctcctcccct \ 62700
cctcccccaa \ aattattatgg \ tcctaaaacag \ aaagtctatg \ taatgttgaa \ ggggtagaggtt \ 62760
ctaaaaaagt \ gattgtttttg \ tctggggtgtt \ gtggctcaca \ cctgtaatcc \ cagcactttg \ 62820
ggggggcaaaa gtggggagat cagttgaccc taggagttttg agcctgggca acatagcgag 62880
accccgtctc @ taccaaaaaa @ aaaaaaattat @ cgggggtgtgg @ tggcaactcc @ ctgtaggtcct @ 62940
agctacttgg \ gaggctgagg \ caggaggatc \ gcttgagtcc \ agaaggtgag \ gctgcagtga \ 63000
gcctagatttg \ caccgctgaa \ ctccaccacctg \ ggcgaaaaaa \ ccaggccctg \ tctcaaaaaa \ 63060
aaaaaaaaaat \ ttttgaacacg \ ggaagaagaa \ agatgtaaac \ acgttaggtgg \ tggcttagat \ 63120
ctattactga \ atgagccctg \ tattcagaaaa \ tagaaatttt \ gattaaacgc \ ttcatcctat \ 63180
gctagagaaaa @ ttttggggggca \ gaattattat \ actctgttag \ aattctcttaa \ tgtaagaattt \ 63240
tttgtttgttt tgtgggatgcc agactactg tagtaaaaca actattagaaaa tccccctgtg 63300
gtttatcaga \ caaaatagta \ ccatttattt \ tatcctgttt \ tacattttttg \ ttgtttgtttc \ 63360
atgacactatt tacatgttttt ttttttagta tctatatcct gaataactga ctactactcta 63420
atcattctta \ actcatttat \ gccagaggtt \ gcaaaatttt \ ttttgtgaaaa \ atcatcatagac \ 63480
cttggtgatg accttgagca gtaggata aataactccc acatgcttaa cgttccaggtg 63540
atggaactact aggcataaat gatttaagta taggcctact aatatgcttt tcaaaaatttt 63600
aattttctct \ aggtttttgta \ gtggcattca \ gtggaatttta \ tagcattaag \ tactcttatt \ 63660
gtgatggaaaa \ tatgtcatttt \ tgtgttattta \ taaaaagtttg \ tttgcagctgg \ ggtgcagtgg \ 63720
tgtgtgccta tagttccagc tcctcggaag ctggggcagg agatcactt gagaccagga 63780
attgaggcc \ acagtgccct \ agaatcatgc \ ctctgaatag \ ctactactact \ ccagcctgggg \ 63840
caacaaaacca agaccccatc tttaaccacaa aaaaaaaaaaaaaaaaagtt gccccaacta 63900
aaaataaaaaa \ cttattaatta \ gcacagataaa \ attcttgagata \ tactttttttg \ gggttttatta \ 63960
ctttataata \ tctgggtaagc \ ctccagatttt \ ctattctttct \ ctcttcttttc \ ccccatttttt \ 64020
tatttttgaag aatatgattc caatgttaaca tttattattat aaactgggtg aaaaggtttg 64080
gttttacattt @ attttgtggga \ aaacattag \ cattttaggtg \ tcggtaactt \ aatttatgtat \ 64140
aataaaaatat @ attaatggaa @ agaataatataaaaaaatagga @ gcatttttatc @ ttcaatgatt @ 64200
ttctttacat \ gattgtttaaa \ tatttgttaaa \ aaaatgccaaa \ tcaaaagttat \ ttaattatttt \ 64260
tggggggacccc aagtaaaaacg attctgtttca aattttgtggg caagcaaaag ttaagggcta 64320
tgaataagg gcacctttaa gttcttttatt gctgagaagg aggaaagctg agatgggtga 64380
gagatggggga ggggccactg cctgaaggg ctgggtgaaag gctgtcaggt taggtgagct 64440
cccagtagtag \ aattaaagca \ actactaaattg \ tatacattgg \ ttgagctttaa \ agttttttgct \ 64500
gcctaaaaga \ taattttttct \ gtttttttatttttccgattgtt \ taggtgtaaaa \ ataatttagaa \ 64560
tggaatttta \ ctgaaaattgaa \ ggttaaacta \ cgtttttgcac \ agggcatac \ tgctccctac \ 64620
ttcattcccc ctgccccatg ccacaaaagt tgaaaatagt gagccccgttt aaaacagattat64680
tctaaaatat @ attgactctt @ ttttgggaat @ ggtcatattt @ atgaatacgt @ tgtactttta @ 64740
aaggtgtttaa \ ttttttctta \ tattatttgta \ catctgttac \ ctgattttgaa \ acccctccct \ 64800
aacatggggta \ ttacatgaat \ ttttcatttta \ aagatatagga \ attggggaggt \ tagagataac \ 64860
acacaagctg actcagaacc atgctcttttc actctctaa aacgtttttat attgtgtgggt 64920
atgttttcctt @ ataagaatgt @ atgtgtcccag @ gcgcagtggc @ tcatgcctgt @ aatcccagca @ 64980
ctttggggagg ctgaggcgag catagcatga ggtcaggaga ttgagaccat cctggccaac 65040
atgggtgaaac \ cccatctctta \ ctaagctggg \ catgggtggcg \ cacgcctata \ gtcccgagta \ 65100
ctcaggggc @ tgaggcagga @ gaattgctttg @ aaccccgggag @ gcgggaggtta @ cggtgagccg @ 65160
agtagggcacc actgcactcc agcctggcga cagagcgaga ctccgtctca aaaaaaaaaaa65220
aaaaaaaaagg aatgtataca tagatagttg tctaaaagaga ctgatatagtaa aattgttagcc 65280
atgcttattct caagtggtag gattttgatt ttttttwaa aattttttaa tctggggttgt 65340
tttttattttc \ taacgtgtca \ ttttttgtaat \ cagaaaaagc \ aaaaaactata \ cattgaatcc \ 65400
aaaagaagtcc \ gattgaaaag \ tatttgaagg \ aaagttctgt \ gaccaaggtca \ tatttttctct \ 65460
gcagacacgt caagtctttg aggagctgac tgagttgcct gtgatgggtggg aactagcaag 65520
tgacttcctg \ gacagaaaaca \ caccagtctt \ tcgagatat \ gtttgcttttt \ tccttagtca \ 65580
atcaggtgtg \ ttaattttaa \ agacttaaaa \ ggaaggaaag \ ttattctttttc \ taataatttct \ 65640
agcatatctt ggcaaaagct gattattaaa gataaaactgg cattgcagat gacttgacga 65700
atacagatttt @ attttattagtt tacatataattc @ tttatgaatt @ agtaaaaatg @ aaccacctttt 65760
gtgttcaaag \ agctggattt \ tcaatgacag \ agaaggaaga \ gagatcctga \ caagccgtat \ 65820
tacttaaaagt \ ttttaataatt \ tatttaagtgg \ atgtttttgta \ ttttattttataa \ aacaagtaat \ 65880
attgttgaaaa \ gtgtgtgtcaa \ ttttgtttttttg \ ctcctaagaa \ acagcatatg \ ttaaaactgt \ 65940
tctgtgtgtt atgggttgggcc tactttttac acaggtgaga cagcagacat ttttgatgggt 66000
cttcgttact gtaaggagag aggagcttta actgtggggga tccaaaaacac agttgggagt 66060
tccatatcac gggagacaga ttgtggagtt cattatataatg ctggtcctga gattgggtgtg 66120
gccagtacaa aggtaaattc ttgactcatt tctctgatga tttattaatc atagtgtcag 66180
tgaagcacac tagtctgtag actagtctgt attttattattt tgttaggagt tatagaactc 66240
acacttttta \ ttttttgttag \ cagttataga \ actcacacat \ tttactataatc \ attgtaattta \ 66300
ttgttaggact ttagggtcag atagataaaa gacttgtcat tctctccctc ttcctgatag 66360
agttaaaag \ ggacttattgt \ atataatgta \ agtccattttt \ gaaaaggtct \ ctgctgggta \ 66420
tccttgtctta \ tcgcttactg \ ccctcctgct \ agccagta \ ggatacataa \ caagtata \ 66480
acatccccttt ctttttgaa gttaggtctg gaattttgaaa agtaacaaaat tamagaacatc 66540
cactttaacc @ attttttggaa tttttttattata cctattttatg \ gtttctaata \ aataatgtaa \ 66600
aaaatcatat actacctctg aaagtttgta aggaggaata caccttttggt aaaaaattttg 66660
gcaactgcca ggcatgggtgg ctcacgcctg taatcccagc acttggggag gctgaggcgg 66720
gcggatcatt tgagctcagg agttcaagac cagcctggcc aacatgggtga atcccgtcctc 66780
tactaaaaaat \ acaaaaaatta \ gccaggtgtg \ gtagcacgtg \ cctgtaatcc \ cagcatacgc \ 66840
ggggggctga ggcaagagaa tcactgatc ctgggaggtg gaggttgcag tgaagcgaga 66900
ttgtgccact gcactccagt ctggggtgaca gagcaagagt ccatctaaaaa aaaaaaaaa 66960
aaaaaaaaatt @ taaaaattttgg @ caattataaaa @ aaaatttttta @ atgagtatttg @ tatgacaata @ 67020
tctttctcttt tagatattgc tctggggggag tttaaggta ctgttcttgtgg ttttgaaggc 67080
ctggtagagac tactttgctc tttggaatttg gaatatgcat aaatttagggt gggctataaaa 67140
aataggaaat \ cttagaaaaat \ tgtaaaaata \ caagagattt \ tatccctcca \ caaggtgttt \ 67200
tttgggggttt taggtttgtt tggttgttat ttatagacag ggtcttgttttt tgtcaccag 67260
gctgggggctg gagtgcagtg acaggaatca tagctccctg cagcctcaga ctcatggggct 67320
caagtgactt ctgcctcagc ttcctgagtg gctggggactg cagatgcacc aggtagtagtt 67380
ttttttttttt \ ttaagatgggg \ gtctcactat \ gttgtccaat \ gtgttactttt \ ttatgattttc \ 67440
actatttttgt \ ttttctcaata \ ttttttctact \ taagttttat \ atttcttgct \ gattattactaa \ 67500
taagagtgttg ggatattggt ggattttgagt tattataaag gattgtgaaaa gacaattgtta 67560
atgtgttacat \ aactgcattt \ gaattcttttt \ ccctcaaaa \ ttctcataga \ gaattttttg \ 67620
tagaaagttt \ gtgatttctta \ tataaaaatt \ ctttttttct \ tttttttttttt \ cttttttttt \ 67680
tttttttttttg \ gagacagact \ ctcactctgt \ tggccaggct \ ggaggtgcagt \ ggcgtgatct \ 67740
cagctcactg \ caaccccccgc \ ctcctgggtt \ caagcgattc \ tcctgcctca \ gcctcccaggg \ 67800
tagctgggat \ tacaggcacc \ tgccaccacg \ cctggctaat \ ttttgttattt \ ttgatagcaa \ 67860
tgggggtttca ccatgttggc caggcttgtc ttgaactcct gacctcaagt gatctgcctg 67920
cctcaacctc cccaaagtgct ggaattacag gcatgagca cactgtacct gggcccccacc 67980
ttttttttttttttttttggaa cagggttctct cctcttttatc atccagagtatacatagagtc 68040
agtgggtgctc @ atggcttact @ gcagcctggga @ ccttcccaggg @ ctcaggtgat @ cctcccacct @ 68100
tagcctcctg agtagctgggg actacaggta caggccacta cccatgcctg gctataatttttt 68160
gtatttttttt gttagagacgg agttttacca tgttgcctag gccagtctcg aactcttgggg 68220
ctcaatgat \ ctgcctgcttt \ tggcctccca \ aagtgctgggg \ gttacaggca \ taaaactct \ 68280
tgagtgagat tttttatttct tggggtatttc c gattattgcta acactataat ttacagaggtg 68340
ctgaacttg \ aattttctcc \ atatggtaat \ taaaactgtt \ tacatgttttg \ tgctttgggtt \ 68400
tccatcctgt ggctgaataa atgaccagcc acctttagta gcacttaagg atttgattgg 68460
gggattgggaa \ tcccagaggc \ tctttatttta \ taacagatttg \ tgaaaaaagg \ gctacaacagtt 68520
ggtgttatgtgg gtatatggga ttgttttgat ggatgccatt gacttaattct ttttcataaaa 68580
tgtttctgga \ atttgtgagct \ gccaagggaa \ attatatttt \ tacatttctc \ attccttttgt \ 68640
tttatgaacac ttttaattttgc ctcaaatttt tatgatgatg ttttttcaat @ atacagcaga 68700
gttttaaaaaa tttttacatac aggctgggggtg cagtggctca caactgttatt cctggcact 68687
tgggaggctg aattggggagg atcacttgag gctaagagtt cacagaccagc cgaggcatca 68820
gagtgacccc ttattctctat aaaaaaataca aaaattagcg ggggcatgggtg gtgcatgcgt 68880
gtagtcccag ctactcgaga ggctgagca cgagatccc ttgagcctga gagtttgagg 68940
ctgcagtgag \ ccatgatcac \ accactacac \ tctagctttgg \ atgatagagt \ gagacccgtt \ 69000
cttaaaaaaaaaaaaaaaaaatttttacattagcgttgggtataccaccatctagtagtctacac69060
catcatcattcaccatttttaaggtgtaca @ gttttagtaa @ attcattttgg @ ctgttaactact 69120
gttatcacaa tccagtttttaagaagatgatc acctgaata ttccttttgtg ttttctttgta 69180
gtcaatcctt \ actcctaccc \ tccagcctca \ tactcaggaa \ ctactgttttt \ ctcttgctgt \ 69240
attattggcat \ ttttccgaaaa \ attttttgtaa \ atgggaattgt \ ataacacgtc \ ttgtgtgtgtct \ 69300
agctttctttc @ atttaggctgg aagttttgttt @ tttaataaaa @ gccagttaaaaa @ tttagcagtg @ 69360
aggtattgta \ taccactattt \ agtaacgcta \ atgttaatga \ gttcttagtga \ cccactattg \ 69420
gactaccccta \ gcctgaagtt \ ttttgagattt \ gttcatgttg \ tttatttgtat \ cattaggttct \ 69480
ttctttctgc aaattcttttt tttaattattt tttatttttga ataactataattaggaagtttt69540
caagatagt \ acagagaagt \ cttatacatact \ ttttacccat \ taccccagtg \ gttaccacct \ 69600
atataagaaaa \ atttagcatc \ tttttagtac \ agactttaat \ ttttttcaaaa \ aataactcttt \ 69660
aaaaaaattg agtaagtatg gcaatttagt atttcattttt tcttggattc taaaagtatt 69720
ttattcaat \ gtcttagagaca \ ttttggggctt \ agttacttac \ aataagtttt \ ggggttatttta \ 69780
gtcacagacc \ attccagggtg \ gcaataaga \ gtttttattgt \ taatgggtat \ tgaaaagagt \ 69840
cgatattattat tactattattt attatttattt tgagatggagttttttgctcttt gttgcccaggg 69900
ctggaggtgca \ gtgggtgtgat \ ctctgctcac \ tgtaacttcc \ gccctccggt \ ttcaagtgat \ 69960
tctcctgcct cagcctctca agtagctgggg attacaggta actgccacca cgcctggcca 70020
attttttgtat \ tttttagtaga \ gactggggtgt \ caccttttttg \ gccagctctggg \ tctcgaactc \ 70080
ctgacctcgt \ gatccaccccg \ tcttggcctc \ ccaaaggtgct \ gggattacaag \ gcgtaagccca \ 70140
ccgcgccccag \ ccaaaaagttg \ attattgatc \ ctatacccctg \ ggcccaggtga \ tggagcacat \ 70200
agaagaattc tgtgattcttg cctgtaattt ctcaacttg cctgaaaaac tgtcagagatt 70260
agggggactt tactgagttt ctcatagtat cagccatag acaagttgat actactggag 70320
gaattgatgg gtataaatgg taggttcagc atttttatata tgttattgca gggtgtttaga 70380
attcaccac \ agtgctgact \ ttttgttattt \ taaaaaaaata \ aaaatgtaac \ ttttgtttttg \ 70440
gctgaacaaa agaaaaaacc aagttaaaaa tttcagagtc agcatttttcc tggtaaaactc 70500
tttcaacct \ cggtagtagtc \ tgaatgtaggg \ gttagcttta \ ttttttcctca \ taatttggttt \ 70560
cctggtattgt @ attgatgaaaa @ taaaaaaat @ gaattattaa @ ttagaaaattaaactgtata @ 70620
gcaatgcaat \ ggaaaaaaat \ ggattaaaagt \ tgctccgtt \ aaattttgta \ cttaaaaact \ 70680
agtgttcaga tggtttcagt tcaaaaaaat aaacactagt ttgttagataata acattttag 70740
ttatgggcta caggaactgg aattactcatt attctgatcag tttggattggg aaacagtttta 70800
agattttccag \ gggtccaaga \ tacctctggc \ ctggtagtat \ gtttttgtgat \ taatttgatata 70860
attgaaaagt aaaccacagt aggaagaagt agactggaag agtctggaat ttagataata 70920
gatgtgctca ttagtctcgg aggcagagga ctccaaattc actttaggtgt tatgggaaa 70980
gattccaggtc \ tgctgggtgga \ atataatagg \ tgtacagggga \ ggcagttgtg \ gaggaccatg \ 71040
tgaggctgg gaggctgggga agtccagcag gaggaaacag ggagctctcat ttaactattg 71100
gggtgttag \ gagttaccag \ actgtgattt \ tatttatagg \ ggagtctcat \ tatccacatc 71160
atgccaggaa @ atcactaatg \ gagtaatccc \ ttatcaagag \ aagagtaata \ gaaattcagc \ 71220
atataatccg \ cgcgcgcaca \ cacacccc \ tcagcataaaa \ ttttcctaaaag \ ctaaattatt \ 71280
attactact @ gtactactgaca @ acagcacaat @ acctactga @ agagatgta @ ataaaaagcc @ 71340
tcaatattct gaaaacataaa aattgtttttc aaaataacta ttggattataa aaaaaatagga 71400
actaccatta agaagaagactt actagggcc ggggcgtgggtg gctcatgctt gtaatcccag 71460
actttggggc agatcactg aggacaggag ttcaagacca gcctggccaa catagtgaaaa 71520
ccccgtctct \ actaaaaaaa \ cacgagaaaa \ ttagggggc \ atgggtggcgg \ gcgcctgtaa \ 71580
tcccagctac ttgggggtggc tgaagcagga gaatcacgcg aaccccaggag gctgaggttg 71640
cagtgagcca agatcatgcc attgcaatcc agcctggggca acaagagcaa actgtgtctt71700
caaaaaaaaaaaaaaaaaaaaaaaagaaaaagaaagactagaaaaaagtaaaacaataaaataata71760
ggggtaaaaaa tttagaggtgt gtggccaaag ttataaaatag agggaaaatag catattaattc 718820
ctagcaaaaa ttgatgaaaa tgccatattt ttaatggaa agattgtttt gtaaaaaaaaat 71880
gacatatctt ggggttagat tagtgttcct tcaacttgca ctaaaaattaa ttttcaaaag4071940
gctaaaaaagg aaaatgttaa aaaaaaaaaa aggaaaggtg aaaaaaaaaag aagtaaaaaa 72000
attataatat \ acttagtttta \ tgtaggattgt \ ggaagagtta \ tctgaggtcta \ aaagtactac \ 72060
gtaaaagttataaaaattattag tcagcaccaa taaaaaggt cagtccacga tgagaaaaaa 72120
tatttgagac \ ataacaataa \ ctacctcttt \ ttttttatat \ ttagagaata \ gttatgtattt \ 72180
gaatacgttt \ tattcacaga \ aaaataaact \ ttaatctaca \ atgaatgcca \ gattattacag \ 72240
caagaagcag \ ttttcttagt \ ttttccatata \ gaaaggttct \ aagtgaaaaaa \ acaccataaaa \ 72300
ttatatttag \ aaatatagta \ ctctgtctca \ aaacattca \ catgattattt \ cacaatacta \ 72360
atacaattag atcagtcatt cagtcaggtt aaaatataac agtaatgaaaa aaaatgcaaaa 72420
atctaacata \ aattactatta \ aaacccttgt \ tacatcacac \ caaaaatgca \ aatttcttac \ 72480
taaattccaga aaaaaaggtaa catatatagt aatttaaggt atttacattaa tggttacaagaa 72540
taagaaaaagaa gtgggtaaact ctgaaaattct gtaggcatat ctgcaaactt cagactcaa 72600
agtagattc gaccacccca actattatttgagcatttgtc taatttttttt gtttttgaaca 72660
atactactt tctttaaaacc aatttgaata aagaaactca agttgaaaaaa caggtgagga 72720
acacaaaagt @ cagtttgtcaa @ agagaaaaat @ ataaatgtc @ aaacaaacatg @ aaaaaaaaagc @ 72780
ttagcttttag \ gattcaagat \ atgttatgcta \ aaatagtagt \ gaaggttcat \ tgtcccgcag \ 72840
tcaaaaggtt aaaagttttgc ttaagagata ttctcagta ttttcacagaa ctttgaaaaaa 72900
caggcatatc tcacagtcac ataagatttag taagaatgaa atagtctttg gcagtaggat 72960
tgtgagtttt \ gaaaacatata \ caattctgtta \ tcctaagaaaa \ ctatattgtct \ tttaggttca \ 73020
gctgtcatca ataaaatttta tagtacgttt tgagcctgtg tgtcagggat tatacagaac 73080
tgaatgcgtt \ actatttgtct \ catttattattg \ tcattatataat \ cttgtaagtg \ tcatgttgcat \ 73140
ttaacagatg ggggtatctga ggcctaaaaggatgaaaaact gctcaaggtt ataatgtaac 73200
ttgacagagt tcagtttttag gattactactt gtacttattat ttaggagtga aagcaagtta 73260
taaaaattgta cctgctaatt aattttctta actgtgtaa gaaaaaaaaaa acagtaaaa 73320
cttataggca @ attattcaaaa \ gtgtttattaa \ tagcattatta \ tattagttaat \ tatttcttaat \ 73380
aacatatgag \ attaaattt \ atttctgtttt \ actttttctac \ aactgtagttt \ ttcctttttt \ 73440
tttttttttaa tgcaaaacta aaacataaaaa ctgggattga ggaaacaggca ataggcaaaa 73500
gtggaaaatcacagagcaatt aaaaaaaaaaa atccagcaat accagtgcaa gtaccccaaaga73560
gagattttat caagcactg g cctttttgact tacaccaaaa actaatgtg gtttaggcaca 73620
tgctgattttg \ ctcatcttttt \ ccttccttttc \ ttagggatat \ taggaattttt \ ataagcattc \ 73680
aatgggttat aaggtgttttg gctttttgtat ctaagaaaata aaggttgagt cattgtttca 73740
agattcagaa aaggagaata gtgatagatt tcccaagtac tggttcagtt cactgttact 73800
aagatagttt @ attttttgttttttttggagaca @ gggtctctactctgtcccaggg @ ctgcagtgct @ 73860
gtgggtgcgat cctggttcac tgcaacctct gcctcccgggg ctcaagtgat cctcctgagt 73920
agctgggacc \ acaggtgcac \ accaccacac \ ccagctattt \ ttttgtattttt \ tttttagagac 73980
agggtttcgc tatgttgccc aggctggtct cgaactccta agctcaagcg atccccctgc 74040
cctggccttc acaagtgctg agattacagg catgagccac catgcttggc cctaacgtag 74100
ttttaagaga tagagaatat attactgtaaa accaatggga attttatttttt cagcttttta 74160
aaaattaaaag \ ttctaaaattc \ ttcagatgca \ gctgcaacta \ atttgtcctgc \ ttttttgtga \ 74220
tgtttcaggc ttataccagc cagtttgtat cccttgtgat gtttgccctt atgatgtgtg 74280
atgatcggat ctccatgcaa gaagagacgca aagagatcat gctttggattg aaaacggctgc 743340
ctggtacaaaa \ gactactata \ tattactact \ ttgtttgtcta \ agggagtgggg \ taataggtaa \ 74400
aattctctta tcctttgaagc tgtggcttgt agctatttag tcaataagat ctttctactgt 74460
ttgctccgat \ gttataaaaa \ aataccccata \ ctgatttgata \ gcacagagga \ atagaaaacac \ 75520
tggtctttttg tttattgctg ccatatattt gttatttttat ttgtttggtt tatttgtcctt 74580
ttttgctaat \ attacttctt \ agatttgatt \ aaggaagtac \ tgagcatgga \ tgacgaaaat \ 74640
cagaactag caacagaact ttatcatcag aagtcagttc ttataatggg acagggctat 74700
cattatgcta \ ctttgtctttga \ aggggcactg \ gtaagttttc \ tcagttcttaa \ ttagtattag \ 74760
tccattgacc \ tgcagacctg \ acacatagtc \ attactttac \ attaatgaa \ tgaatataggt \ 74820
agaacttttg aaagtgcttc tgttattttatg atcattgtggtt ttgttactttt gaagaagtgc 74880
aacagagaac @ tctgtttcaga \ agtgaaaaatc \ aaaagagta \ catttttaacaa \ tgataaaact \ 74940
ggatttagca \ agtaactggg \ gttaattttgt \ tcaatatga \ ataaaagatata \ agttctctag \ 75000
ataaaaatt @ taattgaggt @ caagctgggc @ acagtggctc @ acgtctataa @ tccccagact @ 75060
ttggggagac @ atggcaggta \ gtcaactt \ gaagtcagaa \ gttcgagacc \ agcctggcca \ 75120
acgtgggtgaa accccatctc tactataatataacaaaaaacat tagctggatg tggtaatgca 75180
tgactataat \ ccccagctact \ tggggggcta \ agggggggagag \ atcacttgaa \ cctaggaggt \ 75240
ggaggtggca gtgagccgag atcacaccac tgtactccag cctgggcgat cgaagaagac 75300
tctgtctttaa aaaaaaaaaaa aaaaaaaaagg gttaaccaga aatatgaata tgtttgtgat 75360
aatctaaaaat \ ctttaaaaaag \ tccttgtgtga \ gctttaaaac \ ttccaaattac \ atgtttgataaa \ 75420
tatagaaata \ gtgatcttatt \ aacttgttag \ atatatttat \ agatcagtgg \ tcctttataata \ 75480
cttttggata \ gatagacagt \ ggctttgacat \ atcagaggtt \ ttttataata \ tttacttaaaa \ 75540
catggatttt \ tgaaaagtggg \ attgaagaca \ aattctggttc \ ttttcctatta \ gaaaaatcaaa \ 75600
gaattactt @ atatgactc @ tgaaggcatc @ cttgctgggtg @ aattgaaaaca @ tggccctctg @ 75660
gctttgggtgg \ ataaattgat \ gcctgtgatc \ atgatcatca \ tgagagatca \ cacttatgcc \ 75720
aaggtgtcaga \ atgctctttca \ gcaagtggtt \ gctcggcagg \ taagtcgggg \ gactgtgaga \ 75780
aacctttggg \ gatcaaaag \ gggagttacg \ ctagcttatt \ tgaatgactt \ acaaaacatg \ 75840
tttacacgtg \ ttaactcatt \ tactttggaa \ tacagcctttt \ gaggtttcaa \ tgtgaggaat \ 75900
catagactta \ agatttttttt \ tttttttttttt \ ttttgagatg gagctctctgt \ caccccacct \ 75960
ggagtgcagt \ ggcacaatct \ tggctcactg \ caacctctgc \ ctcctggggtt \ caggcaattt \ 76020
tcctgcctca gcctccccag tagctgggat tacaggcaca ctccaccacg cctggctaat 76080
tttgttattttt \ tgtagtagat \ gggggtttcat \ gttggccaggg \ ctgggtgtcga \ actcctgacc \ 76140
tgaagtgac \ cacctgcctc \ aaccccccaa \ agttctgggga \ ttacaggcat \ gagccacccc \ 76200
gcctggccca gactactaga gctttaagaa gaccaaggtc atagatctca tattggggag 76260
aaccagaaccc agaactgagg tcttggtctc cacatcctgt cttctttttag ttacatatg 76320
ctgttcctttt \ ttattattaat \ acttctaaa \ catttaaaaa \ tgttattttaa \ aaatttttta \ 76380
aatatattt \ tcagctgggtt \ gcagtggcac \ atgactgtag \ tcccagctact \ tctgggggact \ 76440
gaggaggag \ gactactga \ gtccaggagt \ ttgaatacag \ cctgggtaggc \ atagtgagac \ 76500
cctgtctcta \ aaacagtaaa \ taaaaataaat \ taaaaaaaat \ tacacacacg \ cgatatattt \ 76560
cagggggaat \ ctatacattta \ ggttttatttt \ taattatata \ taatttgagtt \ ttctttcagata \ 76620
cagttggctt \ tatataaaa \ ttccaaaaaa \ tattattccc \ taagcacaat \ gtgggtgggtaa \ 76680
tgaactgag ctttgaagtt aggcaacct gcagtcaagt actaagcctg gtatttctta 76740
gttgcatgag \ tttaaaacaaaa \ tactggatc \ ccataacgct \ tctgttttcct \ cgactataag \ 76800
taataacaat \ cagattattact \ acacagggaat \ ttaaaagagt \ ctgtccgtgga \ ggcttcatat \ 76860
ggattattgca \ gtgcaattttt \ tgcacattg \ taagctatag \ ccctgcctttt \ gccccaccagt \ 76920
gattttgtgtt @ attgtgtgtga @ ttttcttttcc @ taggggcggc @ ctgtgggtaat @ ttgtgataag @ 76980
gaggactactg agaccattaa gaacacaaaaa agaacgatca aggtgcccca ctcagtggac 77040
tgcttgcagg \ gcattctcag \ cgtgatccct \ ttacagttgc \ tggcttttcca \ ccttgctgtg \ 77100
ctgagggct @ atgatgtag @ tcatctacca @ ctgcagaat @ cttgggatggg @ ttttttacct 77160
ggatacattc \ tgatttttttt \ ctcctaattt \ tttaacaata \ gtgttttgaga \ aattctatca \ 77220
atatatattct \ gtcacctgtt \ attatttcat \ ggccccattt \ gttaggttaca \ tcacaatc @ 77280
ttcttaccca \ tagactactga \ aggaaccttg \ gggttcacct \ ccagagattgtt \ gactcacctt \ 77340
gggtaggttccacctgttttt \ cttaataaaa \ cctcttatctc \ ttaacagggc \ agcttattggc \ 77400
atttggcagg acaattctttt ttttgtttgga actgtcccac actattgaaga ctttgtagca 77460
ttcctggttt \ ctcagccatt \ gtggcaacca \ aaacatagtg \ cttttgttttt \ taggtgtcccc \ 77520
tatgagggct actactctg tagaggcca ctagtagctct ttctgtgtgtga actggcacct 77580
ttagaatgct ttttcctaac caatttcagt ttttttcagg acactattatg tgattatatatt 77640
ttctaatcta \ attctttttgta \ gtctgtaata \ aagagtgtta \ atgaatgtat \ tgtttttctgt \ 77700
tttttaaaaac aaaaaaattt tgctttatagt aaccacccccc ttccccaggtc tatataattct 77760
ctcaattcttt \ gcttttttttt \ ttttcttttttt \ gcaggttgat \ ttcccacggga \ attctgccaa \ 77820
atctgtgact \ gtagaggtgag \ gaatatctat \ acaaaatgta \ cgaaactgta \ tgattatagca \ 77880
acacaagaca \ cctttttttat \ ttaaaacctt \ gattattaaat \ atcacccctt \ gaagcctttt \ 77940
tttagtaat \ cctttatttat \ atatcagtta \ taattatttcc \ actcaatatg \ tgattttttgt \ 78000
gagttacct \ ctttacatttt \ cccagtaatt \ tgtgggaggac \ ttttgaataat \ ggaatctata \ 78060
ttggaatctg \ tattagagaag \ attctagctta \ ttattttcttt \ taaaagaatgc \ tgggtgttgc \ 78120
attcttggac \ cctccacttc \ aattctgaaaa \ gacaatattt \ ttcttaaaat \ tggtacttgt \ 78180
ttcaccatac ttcattcaga ccagtgaaag agtagtgcat ttattggag tatctaaaagc 78240
cagtggcagt \ gtatgctcat \ acttggacag \ ttagggaagg \ gtttgcccaag \ ttttaagaga \ 78300
agattgtgatt \ tatttttgaaaa \ ttttgtttctg \ ttttgtttttt \ aaatcaact \ gtaaaaactta \ 78360
aaaactgaaaa @ attttattttgg @ taggatttat @ atttagttt @ ggttaggcctt \ agttttctcag \ 78420
actgtttgtc tattatctgtt aggtggaaga aatttaggaa gcgaaaattt acagtaggtgc 78480
attggtggggt \ ctcaatcctt \ aacatatttg \ cacaattttta \ tagcaacaac \ tttaattattca \ 78540
agctgcttttg \ gacaactgac \ aatatgattt \ taaattttgaa \ gatgggatgt \ gtacatgttg \ 78600
ggtatcctac \ tactttgtgtt \ ttttcatctcc \ taaaagtgtt \ ttttatttttcc \ ttgttatctgtgt \ 78660
agtctttttat tttttaaaatg \ actgctgaat \ gacatatttt \ attcttgttct \ ttaaaaattcac 78720
aacacagagc tgcttattaaa ttatatattga tattattagt attctcttca sttttgtcac 78780
gaggaagaat \ ttcctgtagt \ taattttaac \ tttcctttcat \ tacattgttg \ cataaaaacta \ 78840
gtcccttagt \ gccagttttgg \ aagttacttg \ caatttttttg \ gaagattttgc \ aggtcgctga \ 78900
cctcatcatt ttactcttag <tatgtgtggt> aggctaagct \ cagaaaaagg \ tatgtatgct \ 78960
ttactactgat aggcaccaaattttagtattg tatcctaagtatttttcctctttctgtatttt 79020
tctgtgctct \ acccctgaaaa \ tattattagg \ aataaaagaag \ atataaaataa \ agtgattattg \ 79080
gggttatgttc agcttgtagttgtcagaaat ggaagttgac aatttggatt aaaattatta 79140
aagtagagaatg \ tattatattttg \ ataccccccaa \ atttgtgagt \ aataatttct \ taatggagct \ 79200
tttctggcca \ gattttcagg \ gctataggag \ aggtgtgtttg \ ttttttggtga \ agtcctcttt \ 79260
tttcaaaagttttttactttttaaaattgtgaagatatagctatttagcacaattattattagta79320
aggtgtttttt tccttttcttt tctttttcttttt cttgttttaa ctttctggggtg aggttaagat 79380
tttctatatag \ tttatgtgttgt \ tgccagagaa \ gcatagaattt ctgcttgtgtgt \ cttagggtta \ 79440
gagaaaagatt \ tgttattattt \ tgaggtaatt \ tggaaggact \ ttcatacatg \ gtgactagaa \ 79500
acctgatttttttttaagaataaaaatagggtcactattttacatattatataatattatggcta79560
ttatagctat @ attatactact @ ttttaattgttt @ tctatagatattattttgtgtgtaa @ gtcagctagc @ 79620
gtgtgttagatgtcattttct tatgtttttgt attataacgt tttacaaaaca caatttgtgt 79680
gggttttgtag \ cattctttat \ agtttaaagt \ atgattcagc \ attcttagttt \ aaaactata \ 79740
tgtgaagtca \ gtcattaggtc \ tgcataattct \ ctgtctccct \ ctgtgtgtgtt \ ctttctataa \ 79800
agcacatgtg tacacacaca cacacaata tactgaaaagc tagggtaagt tctaaactga 79860
atatcaaaaaa @ ccaaaatcaa @ gaacaaaagaa @ gtgattatttt @ ccaaacaac @ atggatttctc @ 79920
tgccggggtgc agtggctcag cctgtataac cagcctccac ttttgggagtc tgaggtggga 79980
gtattgcttg \ agctcaagag \ ttggagaaca \ gcctggggca \ catgggtgaga \ cctggtcttt \ 80040
aaaaaaattt @ ttttgggccgg \ acgcagtggc \ tcaccacctgt \ aatcccagca \ ctttggggagg 80100
ccgaggcgggg ttgatcatga ggtcaagaga tcgagcatat cctggccagc atgggtgaaac 80160
cccgtctttta ctaaaaaattac aaaaaatagc tgggagtggt ggcgtgcgcc tgttagtccca 80220
actacttgg agggctgaggc aggagaatcg cttgaaccca ggagggcggagg gttgcagtga 80280
ggcgagcatca cgccactaca ctccagcctg gcgagagagc aagactctct caaaaaaaaaa 80340
aaaaaaaaatt @ ttttttttaa @ atggggctgggg @ catgggtggct @ tgtgcctgta @ gtctcagca @ 80400
cttgggaggc @ ttaagtagta @ gatcgctttg @ agcctgggag @ gttgaggctg @ cagtgagctg @ 80460
tgattgtgcc \ actgtgctttc \ agcttgagtg \ acagagtgag \ accctcttga \ ctcaaaaacaa \ 80520
aaaacatggt \ ttctcctctc \ tctcctgtct \ tcttactctc \ tatcccattt \ gattagtagga \ 80580
tttttaaatg \ ctttttgtag \ ttaatttctta \ acacaaaaaga \ gacattgtaa \ tgaggcacac \ 80640
actaaaagtg \ agcatgccca \ attaaaacca \ gtgtaatata \ ggataaaaaa \ attctgatttt \ 80700
tcaaaaaaa \ tactctcat \ aaaagaatcct \ tcatataaaa \ agttctttctt \ tgttagtcat \ 80760
ttaaagttttt aattcactca tgtataactg agagttcctt tgagccccttt ttagggcagg 80820
aggcatgtct gtcatctagc gtgtgggccca gtaagtgatt attacattgg aatcagtttt 80880
tcagtcttttt \ aaaataaaat \ ctatgccata \ agaataaaaag \ ataaaaggca \ aaaattaattgt \ 80940
taactatttt \ tagcttattta \ taactattgtc \ aacaaggtgtt \ tattaattacc \ tattattaggga \ 81000
aagtcactgt \ ggttggcatt \ gaaaaattaca \ tcatctttaa \ agcagtattt \ gtccccagat \ 81060
ggactcatca ctagcaaaa ctaggttcat tggaaggcat agggtgagag aatgggagag81120
tggaggtggag @ gcgggttgttt @ aaagtgctgt @ cagtgagtga @ ttttgtgtctac @ ttgaataatg @ 81180
gtccatgttt ggggggcatat tgtgtttcat agaagattgaa aggtattttgc aaagtaagct 81240
acaaaatgacc \ cataaaattgg \ ttaacaacag \ tccttaatat \ gcaaaagga \ aaaacaagca \ 81300
ttactgctac cccaaagggaa ctgggtgctttg gtgatgtgca gaggggggctg ttgtgtaaga 81360
gagctattac aggtttttctc tcttaggttt catagaggtttagtactgaggatgagattgt 81420
ttattcttttt \ tgaatacaga \ tctcttgttct \ tgagtaggtt \ ctgaggatgg \ gagtaaaaa \ 81480
ggagttttttt \ gtttttttttg \ ttgtttttgttt \ gtttttggctc \ cttaggataata \ ctcctctgac \ 81540
attatttttct attatttcttc aaaagaagga accaccactga aattgttgct ttaacaaaca 816
ttttaataag \ ttctctggggt \ ttttttttttcc \ ccttttaaaaaaatagcat \ attaccatagc \ 81660
aataaaaagaa \ ctatagttaa \ ctatttgtatg \ ctacaactta \ agtgatttttt \ ctaaagaagc \ 81720
acaatgtcat \ tgaaaagtatt \ attgaaaagg \ atcatagtca \ cattgaatttt \ gtgaaggcca \ 81780
aagaaattga @ agggaggtgat @ attttcattt @ tatgatattc @ acatatttag @ taattttttgt @ 81840
gtacagaat @ accagggcaga \ gtgtttttacc \ catggaaaca \ ggttttcagat \ tactttgttt \ 81900
ttactgttag agtctcaagt ttagaaatgc taactacta atcagttttt ttctcactat 81960
actgaagat \ tgttaattatt \ ttgatattactt \ cctagctttga \ tgaattttaaa \ catattctca \ 82020
gattctgtgac agtgacagcc aataggactg ataatatttag cttcaacacca ataatatcca 82080
gggttaaaaat aaaaaacatata gtgaaaagtac gattgtaaaaa tttaggcatata ttaactttata 82140
agtctgtaat \ aacttgacat \ caaaatgtta \ tgtaatttacc \ ataaataatg \ gctagcgaga \ 82200
actattttgg aaattctcaa attacctttc tactactact gttttgcagaa tgaatgtaga 82260
aatgatcctg ttagctttctt gaatgttctg tggttgaatg tgttttttgct taaaaaagc 82320
tttttgtattt tgtttaaaatt actacttttg agaagtggaaatttttaggat catttttgct 82380
ttgtttcagt ttttgtgattt ttgaaatgaa tgtttagttt actgagccag ttgtgtcattt 82440
cttcctcatg tcgttaagtc cagtgagtaa gcctgaactg tgaataaaatt accaaaaact 82500
tgcttagagaat \ ttcatttttga \ agcaatttgc \ taattattga \ aggtgtataca \ catttgttagt \ 82560
tatgttaaaa \ attgttattgt \ actaagaatg \ taatcaatgt \ ctactttagt \ tgtaaacatt \ 82620
tctgatgtca aaacttattt cattactgtt gattttaaga ataagaaatc actgcctaaaa 82680
tatttaccaaa agccactgtc tctaccccgaa cttccccagtt tgggaaaagaa tcgttagata 82740
aaaacaaaggc \ tctgcccttt \ ctgataccaa \ actccacaga \ tacttctctca \ catcttttta \ 82800
aaattttttcc aataacatat tgtttatagg aagtttacag ggttatgcaat gattaaaaact 82860
tttaagtgaa ttgatatagttg caaaaagaaag gataattattt aaggtcagtg agtagcaaga 82920
caatctaaag \ ttttctgtaat \ attctggcttct \ ctgttaattta \ taggcaaaag \ ttttcccttac \ 82980
agaatcctttt \ tatgaacagc \ aagctagagt \ ctatccctag \ tggttattagc \ acctgctgcg \ 83040
tttttcagaga gacagttagg cccagggtgat ttgaatggat agatgtgctg gttttgcctgc 83100
ttgttagatt @ cagccccgtc \ ttttggtctct \ ctctctctct \ ccctcctcca \ cctctccctc \ 83160
tctcttctttc \ tgcaccagag \ cctaaggctg \ cgccaccaag \ atgcgtcatt \ ttttccagag \ 83220
gcttctttttt ttttttttttg agatggagtt ttgctctgtt gcccagggctg gcatgcagtg 83280
ctgcaatcttt ggctgactgc aacttccacc tcccgttttc acacgagtct tttgcctcag 83340
cctctggattt agctggggatt acagcacgt gccaccatgc ctagctattt ttttgtgttttt 83400
tagtagagac ggggttttcac catgttggcc aggttagtct caaactcctg accttaagtg 83460
atctgcccgc cttggcctcc caaggtgctg ggattacaggg catgagtcac cgtgtcctgc 83520
cccacacatat caattttgac aggttattgta taccccttttgg atttttagga attaatttttt 83580
gcctctgtca \ ctcagctttg \ tattattttga \ aatggagata \ agtatagggga \ ggtctttggaa \ 83640
ggaaaaattgc caagaattccc aaaccattgta c actcattg agaatttccag atccattata 83700
tctaaaaaggc aagtgaaggagaacagtattg tgaactgggt ataactccttt ggttcttaac 83760
tagtactattc ttatactgtgg agaccccaaag gttgataaaac aataattttaa gattgttaaaa 83820
gtactctaaa \ cgtctgcaaaa \ ggtcttagatg \ tttatcagtat \ cactagttttt \ tatttctgcc \ 83880
agtagctccc \ tttttaggtta \ cattgttgtc \ ctctttccag \ tgtggcatct \ gtcattgggtt \ 83940
tttcactatg \ gcaagttcat \ taaaaagcttt \ gctccatttgt \ tatcttcaag \ taatgcccat \ 84000
aaggaggggg aagatatctgg agacaatttaa gggttttagtct tctagggcaag agaaaataacg 84060
ttgcattaaa \ ttttcaagtttt \ ctttctgtcta \ gacttgaatg \ tgtctaggcca \ ctctataattta \ 84120
tggggggctttt tggtttttttc ctatttgtact ttgttatgtag aaattgtttttg aaaattcaag 84180
cattattact \ ttgaattttga \ actcttcttt \ aattttgtat \ ttattccttttg \ ataaaaattgt \ 84240
aaaattcaata \ ttttattattataatttattttc \ attgctgcta \ cgtagaaaacc \ taggaaggtgt \ 84300
tgggaatcttt \ tgttaggattt \ ctgtctttttg \ ttcttggttg \ ttagcttggga \ cccatgtggc \ 84360
attactaag \ tttagagcat \ tttttttgttt \ gaaaaaaact \ aaatttagaaaa \ ctttttcata \ 84420
tatgttagtct ttttttttggtg cttgaagtgg taaaaataag ctggcctctg aatacagaat 84480
tgactttgct gacatgacac tgggaattta atattatttct gtcttcccag cagggacaaa 84040
tttgttaaaa \ ttagttttgtg \ cattcctagt \ tcttattagaaa \ gataggggctg \ atttattatta \ 84600
tttattattttt \ gagaaaagggt \ ctctcccagt \ tgcctaggct \ ggagaggcagt \ ggcatgatca \ 84660
tagctcaatg \ cagcctttac \ ctcctaggct \ caaggtgtcc \ ttccaactca \ gccttccaaag \ 84720
ttgttggggac cacaggtatg ctcttagtaca tgcagctaat ttttttattag tacagataat 84780
tcagcacaca tttgtccagca cagttcaccc tttgcaacac acatcttagac tcaccccttga 84840
actcatgttt aaagttccaa aagaaaaacat ggtgaaaccc catctctact aaaaaatacaa 84900
aaaattgcc \ ggggcgtgggtg \ gcaggcccct \ gtagccccag \ ctactcggga \ ggctgaggca \ 84960
ggagaatggc @ atgaatctggg @ ggggcggagc @ ttgcagtgag @ tggagatcgc @ gccactgcac @ 85020
tccagcctgg gcgacagtga gactccgact caaaaaaaag actatcatga ttctgcctgc 85080
catggcatcag ctatccctttt tgaatgaag acacgctcac ccctcttccca agaagagag 85140
ataagaagtt \ acacaaatta \ cttggtccat \ ttctgtgtgtgg \ tattattcct \ cttgcttaat \ 85200
caaccacctcc cttgatataa agtctttata cacagtcatc cccctcttgtc tacaaagggat 85260
atattccaag \ acccccagtg \ gaccacctgaa \ accaccagata \ gtaccaatcc \ cttattattat \ 85320
ttactactggt \ ttttttttgtt \ ttttttttttg \ atctgataac \ cggcatagct \ actaagtgat \ 85380
taatggacag \ gtaggtgata \ agggtagagaga \ caccagacat \ aggggtgttt \ catgtcctgg \ 85440
gtggggacagc @ tcaaggtttc @ atcatgctac @ tcatatggca @ tgcaattttaa @ aacttattaa @ 85500
ttgaagccat \ gctttgtaatc \ ccctaggact \ ttggggggcc \ aaggcaggag \ aattactactc \ 85560
ccataagtatt tccagagacat aaaagctcaa aatccaaaat gattacatat ggagagataaga 85620
tactacaaat \ gatagaatca \ aatttgccaa \ actgcaaac \ atttttaggca \ gtcctcccgc \ 85680
ctcagcctcc \ tgaatagctg \ ggactacaggg \ tgcatgccac \ caacctgat \ ttttttttcctt \ 85740
tatgtagaga \ tgggggtcttg \ cttaggtttgc \ ctaggttgtt \ ttcaaactcc \ tggcctcatg \ 85800
caattctccc \ ccattcaaaa \ gaagagagac \ tctctagaat \ ctctttattct \ gactaaggaa \ 85860
actacttcc aaaaaaattgc atttgtctta agacccccctt ttcttaggaat cttatacca 85920
ggaaaagataaa accactggag aagacaaaaga gattaaaagt tgtcatcatg ccctagataga 85980
cttttcatct \ gttcttctga \ gaacagcttt \ gagagtttac \ ttgaaaactact @ atttgcataa \ 86040
ggcaaccttt \ gttcacaatg \ tagtctaccc \ cctcacctttc \ ctgtaattttg \ ctgatcatat \ 86100
tcagtttttct agataatca attataagat aattgtctgcc tcccaggttg attcatttttc 86160
cctagaaaatt @ atttactacc \ ctttccaaaac \ agctccccac \ cccattttcc \ tcttcctttat \ 86220
aaaaggggtg ttttgaatttc agccatgtgt tccttgctttg agtctcatat gttgtggggatt 86280
cccatgtcca \ tgtgcatatg \ aaatttgtgt \ gccttttctc \ ctgttaatct \ gtcattagctc \ 86340
attcagcaa accttagag aggaaaagaag gaagctttta cttccatctc tgcaatctgt 86400
agattactta \ taattacctaa \ tacaccccagg \ catagtggct \ caacctgca \ accccagtgc \ 86460
tttggggaggc tgaggcagga ggattgtttgg agtccaggag ctttgagacta gcctaggcaa 86520
tgtaatgaga caccactctct agaaaaaaaaaaaaaaaaaaatttagccagggcatgggtggct86580
tgtgcctgta \ gtcctaccta \ ctcaggaggc \ tgatatagga \ gaattacttg \ agcctaggag \ 86640
ttcaaggttg cagtgagcta tgattgtgtc attgcactcc agcctgggacg acagaacaag 86700
accatgtctc taaaaaaaaac agaccaccca atataatgta aatgctgtgt aaatagttgt 86760
attgtatttttt \ aaaattgggta \ ttttttattg \ ttgtataatttt \ attatactttt \ ttaaaaaaaat \ 86820
atttttggatc \ catgggttgtt \ tgagtccatg \ gatgtagaac \ ccatgggtac \ aaaggggtga \ 88080
ctgtatcaga \ agcagtaaga \ ggaatcaaat \ gtatgacaaaa \ ggaataagac \ aataaaagaag \ 86940
gacaaggcag @ attttaggaaa @ ggactgaaaa @ tgaatataa @ caattgaaat @ tagatatgat @ 87000
aaaacattatta ggcccagctg agaagagaat tagtgaacaa aaatagaggt ctgaagaaat 87060
aatccagaat \ gcagcattta \ ctatagagag \ tgatagaaaaa \ tgagaaaaagt \ caaaagttct \ 87120
tgactttttatgagaattttcttagaccagat taagaggcaaa tcctagagaatt tagagtgctt 87180
cacacatcttt aagctgataaa agagaaattg cattcttaaaa cacattgttt tgaaactgaa 87240
cacaaaatag @ gaagagctct @ aaaaaacccag @ agagataaga @ ctaccccacaa @ aaagtcata @ 87300
attagactga cagtctatttt cccactactca ccagtggaaaa caaggcaat ggaactattt 87360
caaagtgctg aaaaaaatat tcatgaaact gaatttgaag actgatgggga aaaattgtgct 87420
atctgatgaa taaaaactgg gactctact aaaattcttcc aaagataaaat gctagaggtga 87480
tggaaaaatga \ tccccaaaaag \ gcttaagata \ caacataatg \ aatggtgggtt \ ggggtgtgtgtg \ 87540
gcacatacct gtagtcccag tactcagga ggctgaggca gcagatcac ttagccaag 87600
gagttcaagg ctgttaggtga ctatgatcat gcctgtgaat agccactgca ctccaggcctg 87660
agcaacatag caagatccca tctctttaaa aaaataaaaaa gaatggtgag cgaaaaaaa 87720
caaaactact ttaagtgagg gtaaattctaa agcactaacg gtctaaaaaca gtataatttt 87780
aggcctata aaacaatcca taatgaacta aaattgctaga caataattt gtaacttagg 87840
agtagatgag cagggttaaa acataaggtt ctttttga tgtggcaaga gggtaaagat 87900
aactctgac \ ttttgtgaagt \ taaatatgga \ tatttaaact \ ttttagaaaaa \ cttagatatag \ 87960
agaatatagttcccaaaagtaacaagaagaaaaaaatggaatttaggaaatcccaagtacat880020
tggtaataat cacaacaagt atagaagaca tctaaaacac agggacacag aaaagttgaa 88080
tgtgaaaaggc @ tggaaaaaaagg @ taaccaccggc @ aaatcccaac @ ccagaggaaaag @ atggcaagct @ 88140
acatgaatat \ gacaagatag \ actgtaagtg \ aaaatgactt \ atttgaaaaat \ agtgcgtcttt \ 88200
ccatggaaaa gtttgggtagc ttctcaaaa gttaacatg gaattaccat acgaaccagc 88260
agttccactc ctaggtatat acccaataga actgaaaaaca gaaactcaggg tactgtaca 88320
ccaattgttta \ tatcagattt \ acttaacaca \ gccaaaaaggc \ ggaaaaaccc \ caaggtgtca \ 88380
tcaacgaatg aataaaaggaa atgtgatata tacacacaat ggaatactac tgagtcataa 88440
agggaatga \ agtcctgata \ actcccaat \ catagctgaa \ cctttaaaaaa \ ataagcaaaa \ 88500
taagccagac @ attacgaac \ aaattatata \ tgattccatt \ tatataaaat \ attctacaata \ 88560
ggcaattattca tagagacaga agattaaatta gagattaccca gaggctttgaa agaggaaaa 88620
atgggggagtt attgcttaat agatacagag ttttcatattt ggggtgatgaa aattttgaa 88680
gattgtagtt ggtgatcatt gcacaactt gtgaatgtaa ttagtgccac tggattgtac 88740
actgaagaat \ ggttaaaatg \ gcaattttta \ tgttattatgt @ attttaccac \ aataaaaaca $ 88800
gtttaagact ggatgtaggtg gctcgtgcct gtaatccaag cactttggga tgctgaagct 88860
ggagcatcac ttgagctcag gagtttatac cagcctgggc cacatagtga gttcctgtgt 88920
ctacaaaacaa aaacaaaaaaac aaaaccctt aactgggtt gggtggtgcat ctgtgggtccc 88980
agctactcag \ gaggctgagg \ tagagaggatc \ acttgtgcca \ ggagctttgag \ tctacagtga \ 89040
gctatgattg \ taccactgca \ ctccagcctg \ ggtaacagag \ caagaccctg \ tccccaaaaaa \ 89100
aagtttaaaa \ agcattact \ agagacaaaa \ attgttaccca \ tcaatgata \ aaagtttcaa 89160
ttcaacgtt @ attgcattta @ actattttgc @ caatgggtga @ ataattcttt @ gtctctcatt @ 89220
atgggttttaa \ ttttattattc \ cttttttttct \ ttttttggag \ atgggagtcttt \ gctctgtcac \ 89280
cccggctggga gtgcagtggc gccatctcgg ctcactgcaa cctctgcctc ccgggttca 89340
gcgattctct tgcctcagcc tcccgagtag ctgagactac aggtgagcgc caccacgccc 89400
agctgatagt ttgttattttt agtagagacg gggtttcacc atttttagcaa ggtaggtctc 89460
gactccctga \ cctcatgatc \ cgccccacctc \ agcctccccaa \ agtgctgggga \ ttaagggcgt \ 89520
gagccactgt gcctggccta tatttccttg atttattaatg atttgagcatcctttttcatat 89580
gtgttatttgac \ tgctttttttt \ ggtgatgaat \ ctgatcaat \ ctttttaaaaa \ tcagtttttta \ 89640
aaaattggat @ gattttattgt @ tactttttta @ acttggggg @ gtttttttaca @ tattctgaat @ 89700
tcttagtcttt \ tgttgtgtat \ tgcaatatg \ ttctcccctt \ tgtgacctgt \ ctttttcattc \ 89760
tctttttttgtt @ attgtataga \ atttctataac \ tttaatgtag \ tcaatttgat \ tacttattttt \ 89820
ccctgaattt gtgctttttat gtacttgtt caaggaatcc ttcctaggtc ttaaacatat 89880
cctcctgtat \ tgtttttctaa \ aacccctaaa \ gctttttccttttcatcctttgg \ atttttttagtt \ 89940
cacctgaaat \ ggattttatag \ ttttgatatga \ tgtaggaatt \ catttttaact \ tttttttttttt 90000
tttttttggcc \ ggggcatgggtg \ gctcatgcct \ gtaatccccag \ cacttaggga \ ggccgaggtg \ 90060
gatagatctc ttgacgtcag gagttcgaga ccagcctggc caactattaca aaatcccgtc 90120
tgcattaaaa \ atacaaaaaaat \ tagccaggca \ taggtggcgggg \ cgcctgtataat \ cctggctact \ 90180
cggggggctt aggcatgaga atcgcttgaa cctggggagc agaggttgca gtgagccag 90240
gtcacgccat \ tgcactccaa \ cctgggttat \ agagccagtc \ agtctcaaaaaa \ agaaaaaaa90300
caaaaaacaac \ aaaaaaaaaaa \ actttttt \ ttttataatgaatatcccctat \ ttcccagcat \ 90360
gttttcaaaa \ aatcccatcc \ ttttcccaatt \ tctctgcaac \ gtcacctctc \ atatcaagtg \ 90420
ttcatataag \ tgggttttgtt \ tccatggggt \ attttgtctct \ gtaccacaattc \ aactgtctct \ 90480
gcattattgta \ gctttataag \ aagtcttgat \ attctggtaggg \ gcaaccctcc \ ttttcttact \ 90540
gttttttcttc agaatattct tggcttattct ttttctttttc aatttatata aggattttag 90600
aagcagctttg \ tcaagttaca \ caactgctga \ ggttttttatt \ ggaattgcct \ taattatata \ 90660
gatgaatatg \ ggggagaattg \ gcagttttac \ aattgtgagc \ ctttccaggct \ atgcatgttgg \ 90720
tttgagcaca tctctgctta ttttgtgtctc attaattgact ctactatttct ataatttttta 90780
tctagaggt \ ctgtttgtaga \ ctgaatatg \ acttccaaag \ atatcaggtc \ ctaaccctgg \ 90840
gaccttgttaa @ attgttacctt @ atatgggaaaa \ gagtatttgc \ agatgtgattt gagttatagga 90900
tcttgggatg \ cagaggtttt \ cctggattat \ ttgggtggggg \ cctgtaggta \ tcattgtaag \ 90960
aggggggcag aaggagattt gacacaaaaga ggagaaggca cttaaccaca gagtagagaa 91020
ctggggggat @ gcagccacaa @ gccagagat @ gccagcagcc @ accagaagctct @ ggaagggaca @ 91080
agaaaagattt ttcccataga gctgccatac cagcatccac tcagtcatac tgacttcgga 91140
cttctgtgtct \ ccagaacacac \ tgtgaaaagga \ taaattctctg \ ttgttttttag \ gtcaccagt \ 91200
tagtggtaac ttgtttcagc agccacagga aacaattcag aggtttttgca catctttcgt 91260
tattattatt \ cctaggattt \ tgattattttc \ tgttgttcttt \ aaaatgatat @ atttttaaaa \ 91320
gctgtttttgtt @ gctgttatgg @ aaaattccagt @ gaattttgct @ gtgttgatttt @ ttgtttgctg @ 91380
caacttgct \ aaactactt \ gttaatttta \ atggatttttt \ ctaggtatat \ actcatatta \ 91440
cctgtgaata \ acagcacgtt \ tgtttcttttt \ cttttaattct \ ttacgattttt \ ttaaaaatt \ 91500
gctctacagt gctgcctagg gcatcccattagcagtttgaacatgaatgggta atggaaaacat 91560
ctttgtttttg \ tccctgatct \ caaaggaaaag \ gtttcaacat \ tttatcattatatatttactgt \ 91620
agactttttgt agatactctc tatcaggtta agaacttttt tcttcttcttt cttggttct 91680
aagggtaggg gggtttttttg ttttgttgcttt ttttgctttt gttttttgagc agggtctttgc 91740
tctgtcactc aggctgggagt gcagtggcgt gatcctggct cactgcaacc tccacctccc 91800
tggttcaagc \ gattctcatg \ cctcagcctc \ ccaagtacct \ gtgattttcag \ gtgcctgcca \ 91860
ccacgcctgg \ ctatatttttt \ tgtatttttta \ gttagagacag \ ggttttcacca \ tgttgggccag \ 91920
gctgggtttttg \ aactcctgag \ ctcaggcagt \ ctaccccgcct \ cggcctccca \ gagtgctaggg \ 91980
attacagggtg \ tgagccacca \ cgcctggccg \ aaacatcatc \ tttagatctc \ atagttttat @ 92040
tgtgtccattt gtacacctc aggcaacgt gtgcggggagc cacgactctg tcttcctgga 92100
ggggggaaatg ttcattgaaaa ttttgttcagg accattttttc tcttttatata tgtgggagaga 92160
gccactgaaa \ tcttattgttt \ gaaccttgtt \ atggggagga \ gcactgtgtgg \ ctcacgcaga \ 92220
cctgggctcc agtgaaaaaa tagggggcaaaa aggaccttgc atatagttgc ttatatatttt92280
ataactacttt \ gaagaaaagta \ atgatgtaaaa \ agtccagatt \ tatgctaata \ ttttgttttag \ 92340
cttctctttttc cctgctctga ggatttggtgc tagagctaaa gagagagaca tcattttctc 92400
agtgttatgtt ttggatttgaa accaccaggat aagccagtttt gcccttatctct gaaaagtcatt 92460
ttgattcccg tctacccctgg gttgagttag aaatgtgtga aatgaatcct gagttgaggt 92520
gtgaaaaagc aaatgaagat cttacacaca tattcattga agaaatgtct ataaaaagggc 92580
ttttaatgct gcaatatagg taacatgtgt aattacctgta acatgtggaa ggtaaaaactc 92640
atcagaaatg tgaatgggaaa gtagaaaatc agagacagaga gacagcatta tttattctct 92700
attaaatgaa @ gaactttaaa @ aacgttgaaaa @ agtaagcaaaa @ actatggcca @ gccaagtag @ 92760
agaagcagag aaaattaccaaa actgccaaa ctcaataaat aactttaact tgggttatttg 92820
caacatcaca gttatctctgc aggtctggtt ccatatcagg ctgtttccct aatgttatctc 92880
taggagaaca \ ttttcaagtca \ agacatact \ tttatgctcag \ ccataaattct \ catgcttttat \ 92940
acgcttgaaaa \ ataataaaag \ ttcttagagtc \ gagttaattt \ actctcttttc \ ttttatatta \ 93000
ttaatgctcc \ catccttttttg \ gagattgggaa \ tgtgggaatgc \ aatgtggcaa \ attattaaaaaa \ 93060
gtgggaaaaag @ atgttaggaaaa @ ataattctgatgtcaattttttcttttccccttggaggtggagca93120
atccttttccc ccagagctca ggcccagcttt ggcttctcgg cagcctcagg cggccacacg 93180
gagggggtgg ctctcccacc tgccttcttg aatggggctct ctcgatggga gaggttgag 93240
aagggacccc @ acttggggct @ aagtggatac @ agagtgtctt @ ggacatgtcg @ gaatgggggcg 93300
gcctggccacacccaaaagacttctttgtgggggagggcctgag gagcttcctgcagggcagaa93360
atgatgagtt @ tgccctcagc @ cacaggagga @ 93390
<210> $ 23
<211> $ 2688
<212> DNA
<213> \ Homo \ sapiens
<220>
<221> @variation
<222> (2251)
<223> Description of version: single nucleotide polymorphism involving replacement of of (C) and (T)
<400> $ 23
gtgggggctc \ tccactgggac \ tgggccagct \ ctctcctgct \ ttttccccatg \ catgcccacc @ 60
tcaccactgt ctgccatac cagtgatggga tggtctgggcc agtgaggtggc tgtgaccaca 120
caccctcccc cggggccccct gtggggaggtg caccacttg gaagaggct ggtcagcccg 180
cagctgtccc acacactct ttggtggggccccagggaccc actgctgt gagcagcack 240
agatcctagc \ ctgggagctca \ ggggggagtac \ tcctggtggga \ catccctgggg \ gcagggtttc 300
cccagttttct gcggccaagc agctccgatg ggaactacct gaggttaggtt caggtctcat 360
aggggcagggg cacagctttc cataagactg cccttgattc agcacctgtt tgcaagccag 420
gggtccaccc \ acactctga \ gcaactgact \ atgaatccaa \ ggattcccac \ tctcccctga \ 480
agttcagtaa \ ttttcttagaa \ cgaccccatag \ aactcatgag \ atgactatat \ gattacagatt \ 540
ttattataaaa \ agataataat \ cacagcccaac \ ccaaaaagaag \ agacccctag \ ttttgagggcc \ 600
ccagatgtga \ agctttgtgtc \ ctcagatgt \ gtcacccctcc \ cagcacgtca \ ctgtgtggtcg \ 660
cccggggagct cccctgagct gctagctcca gtgtccagag ttttgtatttgt ggtttttatta 720
aggtagggag @ atggaggtgaa cccattggcca tgtgatcgaa ctcagtcgcc @agccccactt 780
ttgtcctttgg \ aggttggggag \ gtcagactga \ caggctcatg \ tctcaaaagcc \ ccacctctct \ 840
aatcatgtgg ctgggccttttc tagcagggcc agacgccatc ctgggaactat ctacaggccc 900
accacgagtc \ gtcaccttag \ cataaaagtca \ ggtatagtcc \ aagggacctc \ ccataaaaata \ 960
caagaggtct ttttgtcatat gggaaaactcc agaagccaggg agctccctttc ctgggaaccgg 1020
cccacaagac caaccaatg cttttgtacac agcagctgcc cctgaggtagg aggggagaggt 1080
tcatgaagtt @ tcgggggaggt @ gaaatccaat @ gaggtgcccc @ atccagatgt @ tgccacctgg @ 1140
ctcagcacag aggtcagagt gagggtataa aacacaatgg catcattttcc ccacttaaaa 1200
ccctcccata \ cctgcctgtc \ aagccacaga \ gaccccacagt \ cctgcgttat \ ctggccctttt \ 1260
cctcctgttt \ cagtgagttc \ caggcactcc \ agcctttcctt \ ctgcgtccca \ ctctcattgc \ 1320
gccccgcgccc gcctccggggc ctttgcgctg gccgctcctg ctgtctggaa tgcccttccc 1380
acagaatgct @ ccgccgagggg @ ttgtcccctc @ atcatttagg @ gttcagtcca @ gattgtccct @ 1440
gttttttgaga gagctttgga \ gacctcacca \ gtctcccat \ gacattatcc \ tgtttttctag \ 1500
ccttgggtggc @ atttctttttg \ atttcatttt \ ttttttttttt \ tgtgacgggag \ tctgggtctg \ 1560
tcgccccagcc tggaggtgcag tggcgcaatc tcggctcact gcaagcttccg cctcccaggt 1620
tcacgccatt ctcctgcctc agcctcccga gtagctggga ctacaggcgc ccgccaccgc 1680
gccccggctcactttttttttat tttttagtaga gacggggttt caccggtgtta gccagggg 1740
tctcgatctc ctgacctcgt gatccgcccg cctcagcctc ccaaggtgtt gggattacag 1800
gcgtgagcca ccacgcccgg cctgggaattc attctttattt cttggtttgc ttgtcttaggt 1860
tttttttttc \ taccactaga \ ctatgagccc \ cgtagaggtt \ aggagtgagt \ ctgccccgct \ 1920
ctcggcaagg cacaatggg tgccaatga tgcagcagga tggcaatctc cttaccaggg 1980
aagggggaagaaacccccaaaaagcatcagaactttatcctttcccaagcattttgtgtccc2040
acacatacca ccccaccat gactccagca aatgcaaaag aggactgttc tcatcatacagt 2100
aatgtagctt ccagataactc tgtatgcatc agggatagct tctttcagag agggtctatt 2160
ttatgatgct atttctctgc tcttagggtcg ccccattata ctgtgctcca agggacatac 2220
tgaaagttcc aattttgcgt ataagacaat ygagctgccc cactactgtgg actgcctcca 2280
gggcatcctg agcgtgattc cgctgcagct gctgttccttc cacctggctg ttctccggg 2340
atatgacgtg \ cgtctaaaaaa \ ctgcacctaa \ cagcagagag \ gagagcatata \ accccagagt \ 2400
tccttttctgt \ tctttataata \ cttggagtaa \ atagtcatag \ ataataataat \ ttttattattaa2460
gtagctttttct ttttttttttt ttttgagattg agtctcgctc tgtcgcccag gctggagggc 2520
agtggcacaa cctcggctca ctgcaagctc cacctcctgg gttcaagcga ttctcctgcc 2580
tcagcctccc \ gagtagctggg \ gactacaagc \ acccgccacc \ atgcctggct \ aaattttttgt \ 2640
atttttttgta \ gagacgggggt \ ttcaccgttgt \ tagccaggat \ gaccttga \ 2688
<210> $ 24
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 24
atgctattttc tctgctcttag 20
<210> $ 25
<211> $ 20
<212> DNA
<213> \ Artificial \ Sequence
<220>
<223> \ Description \ of \ Artificial \ Sequence: primer
<400> $ 25
ttaggtgcag {tttttagacg} 20

[0150]
Figure 2004000115

Claims (13)

ヒトゲノムDNAを含む試料において、下記a)〜h)から選ばれるいずれか一つまたは二つ以上の位置に存在する遺伝子多型、および/またはその組合せからなるハプロタイプを検出することにより、該試料提供者の糖尿病の発症危険度を判定する方法。
a)GFAT(グルタミン:フルクトース−6−リン酸アミドトランスフェラーゼ)1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)
d)GFAT1遺伝子の第8イントロンの1853〜1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)
e)GFAT1遺伝子の第12イントロンの1988〜2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)
f)GFAT1遺伝子の第18イントロンの−11〜−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)
g)GFAT1遺伝子の第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)
h)GFAT2遺伝子の第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)
In a sample containing human genomic DNA, the sample is provided by detecting a gene polymorphism present at any one or more positions selected from the following a) to h) and / or a haplotype consisting of a combination thereof. For determining the risk of developing diabetes in an elderly person.
a) The 36th nucleotide of the first intron of the GFAT (glutamine: fructose-6-phosphate amide transferase) 1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
c) The nucleotide at position -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3)
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
e) nucleotides 1988 to 2007 of the intron 12 of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
f) -11th to -22nd nucleotides of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
g) nucleotides 2632 to 2661 of the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 in SEQ ID NO: 7)
h) The 66th nucleotide of the 18th exon of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 23)
糖尿病が2型糖尿病である、請求項1記載の方法。2. The method of claim 1, wherein the diabetes is type 2 diabetes. 検出対象が、下記a)〜f)およびh)の位置に存在する遺伝子多型、ならびに下記x)〜z)で示されるハプロタイプ、から選ばれるいずれか一つまたは二つ以上である、請求項1または2記載の方法。
a)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)
d)GFAT1遺伝子の第8イントロンの1853〜1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)
e)GFAT1遺伝子の第12イントロンの1988〜2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)
f)GFAT1遺伝子の第18イントロンの−11〜−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)
h)GFAT2遺伝子の第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)
x)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)、および同第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在する遺伝子多型の組合せからなるハプロタイプ
y)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)、および同第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在する遺伝子多型の組合せからなるハプロタイプ
z)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)、および同第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)に存在する遺伝子多型の組合せからなるハプロタイプ
The detection target is any one or two or more selected from gene polymorphisms present at the following positions a) to f) and h) and haplotypes indicated by the following x) to z). 3. The method according to 1 or 2.
a) The 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
c) The nucleotide at position -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3)
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
e) nucleotides 1988 to 2007 of the intron 12 of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
f) -11th to -22nd nucleotides of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
h) The 66th nucleotide of the 18th exon of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 23)
x) Present at the 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1) and at the -11th to -22nd nucleotides of the 18th intron (nucleotide numbers 253 to 264 of SEQ ID NO: 6) Y) a haplotype consisting of a combination of the following polymorphisms: y) the seventh nucleotide of the intron 11 of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2) and the nucleotides -11 to -22 of the intron 18 (SEQ ID NO: 6) A) a haplotype consisting of a combination of genetic polymorphisms present at nucleotide numbers 253 to 264); nucleotides -11 to -22 of the intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6); From 2632 of 3 introns 661 nt haplotype consisting of the combination of genetic polymorphisms present in the (nucleotide number 237-266 of SEQ ID NO: 7)
ヒトゲノムDNAを含む試料において、下記h)の位置に存在する遺伝子多型、およびx)〜z)で示されるハプロタイプから選ばれるいずれか一つまたは二つ以上を検出することにより、該試料提供者の腎症を伴わない2型糖尿病の発症危険度を判定する方法。
h)GFAT2遺伝子の第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)
x)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)、および同第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在する遺伝子多型の組合せからなるハプロタイプ
y)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)、および同第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)に存在する遺伝子多型の組合せからなるハプロタイプ
z)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)、および同第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)に存在する遺伝子多型の組合せからなるハプロタイプ
In a sample containing human genomic DNA, by detecting any one or two or more selected from the polymorphisms present at the following position h) and the haplotypes x) to z), the sample provider For determining the risk of developing type 2 diabetes without nephropathy.
h) The 66th nucleotide of the 18th exon of the GFAT2 gene (nucleotide number 2251 of SEQ ID NO: 23)
x) Present at the 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1) and at the -11th to -22nd nucleotides of the 18th intron (nucleotide numbers 253 to 264 of SEQ ID NO: 6) Y) a haplotype consisting of a combination of the following polymorphisms: y) the seventh nucleotide of the intron 11 of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2) and the nucleotides -11 to -22 of the intron 18 (SEQ ID NO: 6) A) a haplotype consisting of a combination of genetic polymorphisms present at nucleotide numbers 253 to 264); nucleotides -11 to -22 of the intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6); From 2632 of 3 introns 661 nt haplotype consisting of the combination of genetic polymorphisms present in the (nucleotide number 237-266 of SEQ ID NO: 7)
ヒトゲノムDNAを含む試料において、下記a)、b)の位置に存在する遺伝子多型、およびz)で示されるハプロタイプから選ばれるいずれか一つまたは二つ以上を検出することにより、該試料提供者の腎症を伴う2型糖尿病の発症危険度を判定する方法。
a)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
z)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)、および同第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)に存在する遺伝子多型の組合せからなるハプロタイプ
In a sample containing human genomic DNA, by detecting any one or two or more selected from the gene polymorphisms present at the following positions a) and b) and the haplotype represented by z), the sample provider For determining the risk of developing type 2 diabetes with nephropathy.
a) The 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
z) The nucleotides -11 to -22 of intron 18 of the GFAT1 gene (nucleotides 253-264 of SEQ ID NO: 6) and the nucleotides 2632-2661 of intron 3 of the GFAT1 gene (nucleotides 237-264 of SEQ ID NO: 7) 266) A haplotype comprising a combination of polymorphisms present in
ヒトゲノムDNAを含む試料において、下記z)で示されるハプロタイプを検出することにより、該試料提供者の1型糖尿病の発症危険度を判定する方法。
z)GFAT1遺伝子の第18イントロンの−11から−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)、および同第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)に存在する遺伝子多型の組合せからなるハプロタイプ
A method for determining the risk of type 1 diabetes of a sample provider by detecting a haplotype represented by z) below in a sample containing human genomic DNA.
z) The nucleotides -11 to -22 of intron 18 of the GFAT1 gene (nucleotides 253-264 of SEQ ID NO: 6) and the nucleotides 2632-2661 of intron 3 of the GFAT1 gene (nucleotides 237-264 of SEQ ID NO: 7) 266) A haplotype comprising a combination of polymorphisms present in
検出が、RFLP法、PCR−SSCP法、ASOハイブリダイゼーション、ダイレクトシークエンス法、ARMS法、変性剤濃度勾配ゲル電気泳動法、RNaseA切断法、化学切断法、DOL法、TaqMan PCR法、インベーダー法、MALDI−TOF/MS法、TDI法、モレキュラー・ビーコン法、ダイナミック・アレルスペシフィック・ハイブリダイゼーション法、パドロック・プローブ法、UCAN法、DNAチップまたはDNAマイクロアレイを用いた核酸ハイブリダイゼーション法、およびECA法からなる群より選ばれる一つまたは二つ以上の方法を用いて行われることを特徴とする、請求項1〜6のいずれか1項に記載の方法。Detection includes RFLP, PCR-SSCP, ASO hybridization, direct sequencing, ARMS, denaturing gradient gel electrophoresis, RNaseA cleavage, chemical cleavage, DOL, TaqManqPCR, Invader, MALDI A group consisting of the TOF / MS method, the TDI method, the molecular beacon method, the dynamic allele-specific hybridization method, the padlock probe method, the UCAN method, the nucleic acid hybridization method using a DNA chip or a DNA microarray, and the ECA method The method according to any one of claims 1 to 6, wherein the method is performed using one or more methods selected from the group consisting of: 検出が、PCR−SSCP法またはダイレクトシークエンス法を用いて行われることを特徴とする、請求項7記載の方法。The method according to claim 7, wherein the detection is performed using a PCR-SSCP method or a direct sequence method. 配列番号22で示されるGFAT1遺伝子上において、下記a)〜g)から選ばれるいずれか一つのヌクレオチドまたはヌクレオチド配列を含む、16〜500塩基長の連続したポリヌクレオチド、またはその標識物;
a)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)
d)GFAT1遺伝子の第8イントロンの1853〜1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)
e)GFAT1遺伝子の第12イントロンの1988〜2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)
f)GFAT1遺伝子の第18イントロンの−11〜−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)
g)GFAT1遺伝子の第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)
もしくは、配列番号23で示されるGFAT2遺伝子断片上において、第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)を含む、16〜500塩基長の連続したポリヌクレオチド、またはその標識物。
(ただし、上記ポリヌクレオチドがRNAである場合、配列表中の塩基記号「t」は「u」に読み替えるものとする)。
On the GFAT1 gene represented by SEQ ID NO: 22, a continuous polynucleotide having a length of 16 to 500 bases, comprising any one nucleotide or nucleotide sequence selected from the following a) to g), or a labeled product thereof:
a) The 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
c) The nucleotide at position -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3)
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
e) nucleotides 1988 to 2007 of the intron 12 of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
f) -11th to -22nd nucleotides of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
g) nucleotides 2632 to 2661 of the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 in SEQ ID NO: 7)
Alternatively, on the GFAT2 gene fragment represented by SEQ ID NO: 23, a continuous polynucleotide having a length of 16 to 500 bases, including the 66th nucleotide of exon 18 (nucleotide number 2251 of SEQ ID NO: 23), or a labeled product thereof.
(However, when the polynucleotide is RNA, the base symbol “t” in the sequence listing should be read as “u”).
配列番号22で示されるGFAT1遺伝子上において、下記a)〜g)から選ばれるいずれか一つのヌクレオチドまたはヌクレオチド配列を含む、16〜1000塩基長の連続したポリヌクレオチドの一部にハイブリダイズし、該ポリヌクレオチドを特異的に増幅するための、15〜30塩基長のオリゴヌクレオチド、またはその標識物;
a)GFAT1遺伝子の第1イントロンの36番目のヌクレオチド(配列番号1のヌクレオチド番号632)
b)GFAT1遺伝子の第11イントロンの7番目のヌクレオチド(配列番号2のヌクレオチド番号266)
c)GFAT1遺伝子の第12イントロンの−147番目のヌクレオチド(配列番号3のヌクレオチド番号338)
d)GFAT1遺伝子の第8イントロンの1853〜1877番目のヌクレオチド(配列番号4のヌクレオチド番号336〜360)
e)GFAT1遺伝子の第12イントロンの1988〜2007番目のヌクレオチド(配列番号5のヌクレオチド番号328〜347)
f)GFAT1遺伝子の第18イントロンの−11〜−22番目のヌクレオチド(配列番号6のヌクレオチド番号253〜264)
g)GFAT1遺伝子の第3イントロンの2632から2661番目のヌクレオチド(配列番号7のヌクレオチド番号237〜266)
もしくは、配列番号23で示されるGFAT2遺伝子断片上において、第18エキソンの66番目のヌクレオチド(配列番号23のヌクレオチド番号2251)を含む、16〜1000塩基長の連続したポリヌクレオチドの一部にハイブリダイズし、該ポリヌクレオチドを特異的に増幅するための、15〜30塩基長のオリゴヌクレオチド、またはその標識物。
(ただし、上記ポリヌクレオチドがRNAである場合、配列表中の塩基記号「t」は「u」に読み替えるものとする)。
On the GFAT1 gene represented by SEQ ID NO: 22, it hybridizes to a part of a continuous polynucleotide having a length of 16 to 1000 bases, including any one nucleotide or nucleotide sequence selected from the following a) to g); An oligonucleotide having a length of 15 to 30 bases, or a labeled product thereof, for specifically amplifying the polynucleotide;
a) The 36th nucleotide of the first intron of the GFAT1 gene (nucleotide number 632 of SEQ ID NO: 1)
b) The seventh nucleotide of the eleventh intron of the GFAT1 gene (nucleotide number 266 of SEQ ID NO: 2)
c) The nucleotide at position -147 of intron 12 of the GFAT1 gene (nucleotide number 338 of SEQ ID NO: 3)
d) nucleotides 1853 to 1877 of the eighth intron of the GFAT1 gene (nucleotide numbers 336 to 360 in SEQ ID NO: 4)
e) nucleotides 1988 to 2007 of the intron 12 of the GFAT1 gene (nucleotide numbers 328 to 347 of SEQ ID NO: 5)
f) -11th to -22nd nucleotides of intron 18 of the GFAT1 gene (nucleotide numbers 253 to 264 of SEQ ID NO: 6)
g) nucleotides 2632 to 2661 of the third intron of the GFAT1 gene (nucleotide numbers 237 to 266 in SEQ ID NO: 7)
Alternatively, on the GFAT2 gene fragment represented by SEQ ID NO: 23, it hybridizes to a part of a continuous polynucleotide having a length of 16 to 1000 bases and including the 66th nucleotide of exon 18 (nucleotide number 2251 of SEQ ID NO: 23). And an oligonucleotide having a length of 15 to 30 bases, or a labeled product thereof, for specifically amplifying the polynucleotide.
(However, when the polynucleotide is RNA, the base symbol “t” in the sequence listing should be read as “u”).
請求項9記載のポリヌクレオチドを固定した固相化試料。A solid-phased sample on which the polynucleotide according to claim 9 is immobilized. 以下の1)〜3)から選ばれる少なくとも一つ以上を含む、糖尿病の発症危険性判定用試薬またはキット。
1)請求項9記載のポリヌクレオチド、またはその標識物
2)請求項10記載のオリゴヌクレオチド、またはその標識物
3)請求項11記載の固相化試料
A reagent or kit for determining the risk of developing diabetes, comprising at least one selected from the following 1) to 3):
1) The polynucleotide according to claim 9 or a labeled product thereof 2) The oligonucleotide according to claim 10 or a labeled product thereof 3) The immobilized sample according to claim 11
以下の(A)または(B)のDNA。
(A)配列番号22で示されるヌクレオチド配列からなるDNA
(B)配列番号22で示されるヌクレオチド配列からなるDNAと少なくとも85%以上の相同性を有し、かつGFAT活性を有するヒト由来のタンパク質をコードするDNA
DNA of the following (A) or (B):
(A) DNA comprising a nucleotide sequence represented by SEQ ID NO: 22
(B) DNA encoding a human-derived protein having at least 85% homology with the DNA consisting of the nucleotide sequence represented by SEQ ID NO: 22 and having GFAT activity
JP2002261405A 2001-09-07 2002-09-06 Method for judging development risk of diabetes Withdrawn JP2004000115A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002261405A JP2004000115A (en) 2001-09-07 2002-09-06 Method for judging development risk of diabetes

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001271870 2001-09-07
JP2002090861 2002-03-28
JP2002261405A JP2004000115A (en) 2001-09-07 2002-09-06 Method for judging development risk of diabetes

Publications (1)

Publication Number Publication Date
JP2004000115A true JP2004000115A (en) 2004-01-08

Family

ID=30449026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002261405A Withdrawn JP2004000115A (en) 2001-09-07 2002-09-06 Method for judging development risk of diabetes

Country Status (1)

Country Link
JP (1) JP2004000115A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2003031652A1 (en) * 2001-10-02 2005-01-27 彰方 木村 Testing method for type I diabetes
WO2006014013A1 (en) 2004-08-04 2006-02-09 Riken Bone/joint disease sensitivity gene and use thereof
WO2006057346A1 (en) * 2004-11-25 2006-06-01 Meiji Dairies Corporation Ameliorant for renal insufficiency
WO2007093137A1 (en) 2006-02-14 2007-08-23 Siemens Aktiengesellschaft Method for identifying an earth fault in a resonant-earthed three-phase power transmission system, or a three-phase power transmission system which is isolated from earth potential

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2003031652A1 (en) * 2001-10-02 2005-01-27 彰方 木村 Testing method for type I diabetes
WO2006014013A1 (en) 2004-08-04 2006-02-09 Riken Bone/joint disease sensitivity gene and use thereof
EP2311953A1 (en) 2004-08-04 2011-04-20 Riken Bone/joint disease susceptibility gene and use thereof
WO2006057346A1 (en) * 2004-11-25 2006-06-01 Meiji Dairies Corporation Ameliorant for renal insufficiency
JPWO2006057346A1 (en) * 2004-11-25 2008-06-05 明治乳業株式会社 Kidney dysfunction improving agent
JP4869078B2 (en) * 2004-11-25 2012-02-01 株式会社明治 Kidney dysfunction improving agent
WO2007093137A1 (en) 2006-02-14 2007-08-23 Siemens Aktiengesellschaft Method for identifying an earth fault in a resonant-earthed three-phase power transmission system, or a three-phase power transmission system which is isolated from earth potential

Similar Documents

Publication Publication Date Title
KR101374304B1 (en) Genetic variants in the TCF7L2 gene as diagnostic markers for risk of type 2 diabetes mellitus
KR102657306B1 (en) Use of markers including filamin a in the diagnosis and treatment of prostate cancer
CN111183234A (en) Inhibition of HSD17B13 in the treatment of liver disease in patients expressing the PNPLA3I 148M variant
CA2651376A1 (en) Method for diagnosis and treatment of a mental disease
TW201632629A (en) Methods for cancer diagnosis and prognosis
KR20150023904A (en) Use of markers in the diagnosis and treatment of prostate cancer
KR102613599B1 (en) Prediction method for risk of ischemic stroke onset
US20030235847A1 (en) Association of polymorphisms in the SOST gene region with bone mineral density
KR20130123357A (en) Methods and kits for diagnosing conditions related to hypoxia
US20030099958A1 (en) Diagnosis and treatment of vascular disease
KR102102051B1 (en) Composition and method for diagnosing atopic dermatitis
IL179831A (en) In vitro method for detecting the presence of or predisposition to autism or to an autism spectrum disorder, and an in vitro method of selecting biologically active compounds on autism or autism spectrum disorders
KR101256928B1 (en) Single Nucleotide Polymorphisms Implicated in Obesity or Diabetes and Use Thereof
TW202309298A (en) Prediction method for risk of ischemic stroke of large-artery atherosclerosis onset timing
CN114277123B (en) Polynucleotide containing SNP site related to schizophrenia and application
WO2006022634A1 (en) Methods for identifying risk of type ii diabetes and treatments thereof
JP2004000115A (en) Method for judging development risk of diabetes
CA2400954C (en) Methods and composition for diagnosing and treating pseudoxanthoma elasticum and related conditions
CA2441701C (en) Detection of il4 and il13 polymorphisms in determination of type 1 diabetes susceptibility
US20040138441A1 (en) Novel gene functionally related to dyslexia
KR102464776B1 (en) Genetic polymorphic markers associated with female pattern hair loss and uses thereof
US20040166491A1 (en) Vhl promoter diagnostic polymorphism
TW201217537A (en) Method for estimating a risk of developing kidney stone in a subject, method for estimating a risk of recurring kidney stone in a subject suffering from or being used to suffer from kidney stone and use of SNP rs12313273 (C/T) as a biomarker for developm
CA2527588A1 (en) Disease risk estimating method using sequence polymorphisms in a specific region of chromosome 19
KR101090742B1 (en) Makers for the diagnosis of susceptibility to lung cancer using HER-2 gene and method for predicting and analyzing susceptibility to lung cancer using the same

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061024

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20061220