TW202321213A - Kif18a抑制劑化合物之鹽和固態形式 - Google Patents

Kif18a抑制劑化合物之鹽和固態形式 Download PDF

Info

Publication number
TW202321213A
TW202321213A TW111126873A TW111126873A TW202321213A TW 202321213 A TW202321213 A TW 202321213A TW 111126873 A TW111126873 A TW 111126873A TW 111126873 A TW111126873 A TW 111126873A TW 202321213 A TW202321213 A TW 202321213A
Authority
TW
Taiwan
Prior art keywords
compound
ser
leu
glu
solvate
Prior art date
Application number
TW111126873A
Other languages
English (en)
Inventor
天 吳
佩若瑄 阿賈瓦
安德列斯 R 羅勒里
賢秀 朴
麥可 J 佛朗
Original Assignee
美商安進公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商安進公司 filed Critical 美商安進公司
Publication of TW202321213A publication Critical patent/TW202321213A/zh

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/14Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing three or more hetero rings

Abstract

本文揭露了游離鹼化合物2-(6-氮雜螺[2.5]辛-6-基)- N-[2-(4,4-二氟哌啶-1-基)-6-甲基嘧啶-4-基]-4-[(2-羥基乙烷磺醯基)胺基]苯甲醯胺(化合物A)之鹽、結晶無水形式、水合物、溶劑合物或共晶體;製備方法、藥物組成物以及治療由馬達蛋白驅動蛋白家族成員18A(KIF18A)抑制介導的疾病之方法,其中所述疾病係腫瘤病,包括癌症或腫瘤。

Description

KIF18A抑制劑化合物之鹽和固態形式
本揭露關於游離鹼化合物2-(6-氮雜螺[2.5]辛-6-基)- N-[2-(4,4-二氟哌啶-1-基)-6-甲基嘧啶-4-基]-4-[(2-羥基乙烷磺醯基)胺基]苯甲醯胺(化合物A)之鹽、水合物、溶劑合物或共晶體;或該化合物A,包括其結晶無水形式、鹽、水合物、溶劑合物或共晶體之固體形式;製備方法、藥物組成物以及治療由馬達蛋白驅動蛋白家族成員18A(KIF18A)抑制介導的疾病之方法。
游離鹼化合物2-(6-氮雜螺[2.5]辛-6-基)- N-[2-(4,4-二氟哌啶-1-基)-6-甲基嘧啶-4-基]-4-[(2-羥基乙烷磺醯基)胺基]苯甲醯胺(化合物A)可用作馬達蛋白驅動蛋白家族成員18A(KIF18A)之抑制劑:
Figure 02_image001
(A)。
驅動蛋白係在細胞分裂和細胞內囊泡和細胞器運輸中起重要作用的分子馬達。有絲分裂驅動蛋白在紡錘體組裝、染色體分離、中心體分離和動力學之若干個方面起作用。基於所稱的「馬達結構域」內的序列同源性,人驅動蛋白被分類為14個亞家族;此結構域之ATP酶活性驅動沿著微管(MT)單向運動。該等蛋白質之非馬達結構域負責貨物附接;「貨物」可以包括多種不同的膜狀細胞器、訊息傳遞支架系統和染色體中之任一種。驅動蛋白使用ATP水解能量來沿著極化微管移動貨物。因此,驅動蛋白通常被稱為「正端」或「負端」定向馬達。
KIF18A基因屬於驅動蛋白-8亞家族並且是一種正端定向馬達。據信KIF18A影響著絲點微管之正端的動力學以控制正確的染色體定位和紡錘體張力。人KIF18A之耗盡在HeLa子宮頸癌細胞中導致更長的紡錘體,在中期增加的染色體振盪(chromosome oscillation)以及有絲分裂紡錘體組裝檢查點之活化。KIF18A看起來是癌症治療之可行靶標。KIF18A在各種類型的癌症中過表現,該等癌症包括但不限於結腸癌、乳癌、肺癌、胰臟癌、前列腺癌、膀胱癌、頭癌、頸癌、子宮頸癌和卵巢癌。此外,在癌細胞系中,KIF18A之基因缺失或敲除或者抑制影響有絲分裂紡錘體裝置。特別地,已發現抑制KIF18A誘導有絲分裂細胞停滯,這係一種已知的弱點,其可以經由細胞凋亡、有絲分裂災變或在分裂間期中有絲分裂滑脫之後的多極驅動致死性或死亡來促進有絲分裂中之細胞死亡。
人KIF18A基因序列、人KIF18A mRNA序列和編碼的KIF18A蛋白在本文中分別提供為SEQ ID NO: 12、13和11。
化合物A以及其示例性製備方法描述於國際專利申請公開案號WO 2020/132648中,將該國際專利申請藉由援引以其全文併入本文。然而,特別是對於化合物A之商業藥物生產而言,化合物A之穩定鹽、水合物、溶劑合物或共晶體,以及化合物A(包括結晶無水化合物A或無定形化合物A)、化合物A之穩定鹽、水合物、溶劑合物或共晶體之固體形式係期望的。
在一個方面,本文揭露了化合物A之鹽、水合物、溶劑合物或共晶體,該化合物A具有以下結構:
Figure 02_image001
(化合物A);其化學名稱係2-(6-氮雜螺[2.5]辛-6-基)- N-[2-(4,4-二氟哌啶-1-基)-6-甲基嘧啶-4-基]-4-[(2-羥基乙烷磺醯基)胺基]苯甲醯胺;或也稱為N-(2-(4,4-二氟哌啶-1-基)-6-甲基嘧啶-4-基)-4-((2-羥基乙基)磺醯胺基)-2-(6-氮雜螺[2.5]辛-6-基)苯甲醯胺;或化合物A(包括結晶無水化合物A或無定形化合物A)、其鹽、水合物、溶劑合物或共晶體之固體形式。
在另一個方面,本文揭露了化合物A,包括化合物A之結晶無水形式、鹽、水合物、溶劑合物或共晶體之固體形式。該固體形式可為結晶形式或無定形形式。
在各種實施方式中,本文揭露了選自以下的如請求項1所述之鹽、無水合物、水合物、溶劑合物或共晶體:鹽酸鹽(化合物A-HCl)、甲磺酸鹽(化合物A-MsA)、甲苯磺酸鹽(化合物A-TsA)、硫酸鹽(化合物A-硫酸鹽)、可變水合物(化合物A-可變水合物)、四氫呋喃溶劑合物(化合物A-THF)、乙醇溶劑合物(化合物A-乙醇)、1-丙醇溶劑合物(化合物A-1-丙醇)、異丙醇溶劑合物(化合物A-IPA)、甲醇溶劑合物(化合物A-甲醇)、乙酸異丙酯溶劑合物(化合物A-IPAc)、丙酮溶劑合物(化合物A-丙酮)、環戊基甲基醚溶劑合物(化合物A-CPME)、二㗁烷溶劑合物(化合物A-二㗁烷)、乙酸乙酯溶劑合物(化合物A-EtOAc)、乙腈溶劑合物(化合物A-MeCN)、甲基三級丁基醚溶劑合物(化合物A-MTBE)、甲苯溶劑合物(化合物A-甲苯)、十二烷基硫酸鹽(化合物A-十二烷基硫酸鹽)、二甲基甲醯胺(DMF)溶劑合物水合物(化合物A-DMF-水合物)、二甲基乙醯胺(DMAC)溶劑合物(化合物A-DMAC)、單苯磺酸鹽水合物(化合物A-苯磺酸鹽-水合物)、咖啡因共晶體(化合物A-咖啡因)、檸檬酸共晶體(化合物A-檸檬酸)、糖精共晶體(化合物A-糖精)、L-酒石酸共晶體(化合物A-L-酒石酸)或尿素共晶體(化合物A-尿素);或其固體形式。
在實施方式1中,本發明提供了一種化合物A之鹽酸鹽,其具有以下結構:
Figure 02_image005
(化合物A-HCl)。
在實施方式1a中,本發明提供了一種化合物A-HCl之固體形式。在子實施方式中,該固體形式係結晶形式1(化合物A-HCl-形式1)。在另一個子實施方式中,該固體形式係結晶形式2(化合物A-HCl-形式2)。
在實施方式1b中,本發明提供了一種結晶化合物A-HCl-形式1,其特徵在於在-91和-103 ppm處的固態 19F NMR峰。
在實施方式1c中,本發明提供了一種結晶化合物A-HCl-形式1,其特徵進一步在於使用Cu Kα輻射在7.5、16.9和20.2 ± 0.2° 2θ處的X射線粉末繞射(XRPD)圖譜峰。
在實施方式1d中,本發明提供了一種結晶化合物A-HCl-形式1,其特徵進一步在於使用Cu Kα輻射在12.8、18.2、22.7、23.6、24.8和26.1 ± 0.2° 2θ處的X射線粉末繞射(XRPD)圖譜峰。
在實施方式1e中,本發明提供了一種結晶化合物A-HCl-形式1,其特徵進一步在於使用Cu Kα輻射在10.9、14.5、15.7、15.9、19.8、20.6、21.6、23.2、26.1和26.8 ± 0.2° 2θ處的X射線粉末繞射(XRPD)圖譜峰。
在實施方式1f中,本發明提供了一種結晶化合物A-HCl-形式1,其具有基本上如圖1所示的XRPD圖譜。
在實施方式1g中,本發明提供了一種結晶化合物A-HCl-形式1,其具有在268.5°C至274.5°C處的吸熱轉變,此係藉由微差掃描熱量法測量。
在實施方式1h中,本發明提供了一種結晶化合物A-HCl-形式1,其中該吸熱轉變係在271.5°C ± 3°C處。
在實施方式1i中,本發明提供了一種結晶化合物A-HCl-形式1,其具有基本上如圖2所示的熱重分析(TGA)。
在實施方式1j中,本發明提供了一種結晶化合物A-HCl-形式1,其具有基本上如圖5所示的單晶結構。
在實施方式2中,本發明提供了一種化合物A之甲磺酸鹽,其具有以下結構:
Figure 02_image007
(化合物A-MsA)。
在實施方式2a中,本發明提供了一種化合物A-MsA之固體形式。在子實施方式中,該固體形式係結晶形式1(化合物A-MsA-形式1)。在另一個子實施方式中,該固體形式係結晶形式2(化合物A-MsA-形式2)。
在實施方式2b中,本發明提供了一種結晶化合物A-MsA-形式1,其特徵在於在-95.2和-103.2 ± 0.5 ppm處的固態 19F NMR峰。自旋邊帶由(*)指示。
在實施方式2c中,本發明提供了一種結晶化合物A-MsA-形式1,其特徵進一步在於使用Cu Kα輻射在7.0、16.5和23.9 ± 0.2° 2θ處的X射線粉末繞射(XRPD)圖譜峰。
在實施方式2d中,本發明提供了一種結晶化合物A-MsA-形式1,其特徵進一步在於使用Cu Kα輻射在12.6、15.7、17.4、18.5、20.0和21.0 ± 0.2° 2θ處的XRPD圖譜峰。
在實施方式2e中,本發明提供了一種結晶化合物A-MsA-形式1,其特徵進一步在於使用Cu Kα輻射在5.8、11.8、13.5、15.3、16.1、18.0、20.6、25.2、28.0和30.5 ± 0.2° 2θ處的XRPD圖譜峰。
在實施方式2f中,本發明提供了一種結晶化合物A-MsA-形式1,其具有基本上如圖10所示的XRPD圖譜。
在實施方式2g中,本發明提供了一種結晶化合物A-MsA-形式1,其具有在247°C至253°C處的吸熱轉變,此係藉由微差掃描熱量法測量。
在實施方式2h中,本發明提供了一種結晶化合物A-MsA-形式1,其中該吸熱轉變係在250°C ± 3°C處。
在實施方式2i中,本發明提供了一種結晶化合物A-MsA-形式1,其具有基本上如圖11所示的熱重分析(TGA)。
在實施方式3中,本發明提供了一種化合物A之甲苯磺酸鹽,其具有以下結構:
Figure 02_image009
(化合物A-TsA)。
在實施方式3a中,本發明提供了一種化合物A-TsA之固體形式。在子實施方式中,該固體形式係結晶形式1(化合物A-TsA-形式1)。在另一個子實施方式中,該固體形式係結晶形式2(化合物A-TsA-形式2)。在子實施方式中,該固體形式係結晶形式3(化合物A-TsA-形式3)。在另一個子實施方式中,該固體形式係結晶形式4(化合物A-TsA-形式4)。在另一個子實施方式中,該固體形式係結晶形式5(化合物A-TsA-形式5)。在又另一個子實施方式中,該固體形式係二甲苯磺酸鹽結晶形式6(化合物A-DiTsA-形式6)。
在實施方式3b中,本發明提供了一種結晶化合物A-TsA-形式4,其特徵在於使用Cu Kα輻射在6.2、14.7和23.5 ± 0.2° 2θ處的X射線粉末繞射(XRPD)圖譜峰。
在實施方式3c中,本發明提供了一種結晶化合物A-TsA-形式4,其特徵進一步在於使用Cu Kα輻射在10.5、12.4、14.2、19.1、21.5和29.0 ± 0.2° 2θ處的XRPD圖譜峰。
在實施方式3d中,本發明提供了一種結晶化合物A-TsA-形式4,其特徵進一步在於使用Cu Kα輻射在15.5、16.5、17.7、18.3、18.6、20.1、20.8、24.1和25.3 ± 0.2° 2θ處的XRPD圖譜峰。
在實施方式3e中,本發明提供了一種結晶化合物A-TsA-形式4,其具有基本上如圖24a所示的XRPD圖譜。
在實施方式3f中,本發明提供了一種結晶化合物A-TsA-形式4,其具有基本上如圖24b所示的單晶結構。
在實施方式3g中,本發明提供了一種結晶化合物A-TsA-形式4,其具有在250°C至256°C處的吸熱轉變,此係藉由微差掃描熱量法測量。
在實施方式3h中,本發明提供了一種結晶化合物A-TsA-形式4,其中該吸熱轉變係在253°C ± 3°C處。
在實施方式3i中,本發明提供了一種結晶化合物A-TsA-形式4,其具有基本上如圖25所示的熱重分析(TGA)。
在實施方式3j中,本發明提供了一種結晶化合物A-TsA-形式4,其特徵在於基本上如圖26所示的在-96.93和-101.60 ± 0.5 ppm處的固態 19F NMR峰。自旋邊帶由(*)指示。
在實施方式4中,本發明提供了一種化合物A之固體形式。在子實施方式中,該固體形式係無定形形式(化合物A-無定形)。在另一個子實施方式中,該固體形式係結晶化合物A-形式1(化合物A-形式1)。
在實施方式4a中,本發明提供了化合物A-無定形,其具有基本上如圖33所示的XRPD圖譜。
在實施方式4b中,本發明提供了化合物A-無定形,其具有在88°C至94°C處的熔融起始,此係藉由微差掃描熱量法測量。在子實施方式中,化合物A-無定形具有在91°C ± 3°C處的熔融起始。在子實施方式中,化合物A-無定形具有基本上如圖34所示的DSC熱譜圖圖譜。
在實施方式4c中,本發明提供了化合物A-無定形,其具有基本上如圖35所示的熱重分析(TGA)。
在實施方式4d中,本發明提供了結晶化合物A-形式1,其具有基本上如圖52所示的熱重分析(TGA)。
在實施方式5中,本發明提供了一種化合物A之硫酸鹽,其具有以下結構:
Figure 02_image011
(化合物A-硫酸鹽)。
在實施方式5a中,本發明提供了一種化合物A-硫酸鹽之固體形式。在子實施方式中,該固體形式係結晶形式1(化合物A-硫酸鹽-形式1)。在另一個子實施方式中,化合物A-硫酸鹽-形式1具有基本上如圖30所示的XRPD圖譜。在另一個子實施方式中,化合物A-硫酸鹽-形式1具有在261°C至267°C處的吸熱轉變,此係藉由微差掃描熱量法測量。在又另一個子實施方式中,化合物A-硫酸鹽-形式1具有在264°C ± 3°C處的吸熱轉變。在又另一個子實施方式中,化合物A-硫酸鹽-形式1具有基本上如圖31所示的熱重分析(TGA)。
在實施方式6中,本發明提供了一種化合物A之水合物,其具有以下結構:
Figure 02_image013
(化合物A-水合物);其中n係在0.5至2的範圍內的數值,或其變數(混合物)。n值可以作為各種製備方法和/或儲存條件之結果而變化。
在實施方式6a中,本發明提供了一種化合物A-水合物之固體形式。
在實施方式6b中,本發明提供了結晶化合物A-可變水合物-形式2,其特徵在於使用Cu Kα輻射在13.9、16.2和19.6 ± 0.2° 2θ處的X射線粉末繞射(XRPD)圖譜峰。
在實施方式6c中,本發明提供了化合物A-可變水合物-形式2,其特徵進一步在於使用Cu Kα輻射在3.5、17.4,18.4、18.7、20.0、20.2、22.6、22.9、27.5和30.8 ± 0.2° 2θ處的XRPD圖譜峰。
在實施方式6d中,本發明提供了化合物A-可變水合物-形式2,其特徵進一步在於使用Cu Kα輻射在3.5、10.1、11.2、13.9、16.2、18.2、19.2、23.2和26.0 ± 0.2° 2θ處的XRPD圖譜峰。
在實施方式6e中,本發明提供了化合物A-可變水合物形式2,其具有基本上如圖36所示的XRPD圖譜。
在實施方式6f中,本發明提供了化合物A-可變水合物-形式2,其具有在48°C至54°C處的脫水起始和136°C的熔點,此係藉由微差掃描熱量法測量。在子實施方式中,化合物A-可變水合物-形式2具有基本上如圖37所示的DSC熱譜圖圖譜。
在實施方式6g中,本發明提供了化合物A-可變水合物-形式2,其具有在51°C ± 3°C處的吸熱轉變。
在實施方式6h中,本發明提供了化合物A-可變水合物-形式2,其具有基本上如圖38所示的熱重分析(TGA)。
在實施方式7中,本發明提供了一種化合物A之結晶無水形式(化合物A-無水)。
在實施方式7a中,該固體形式係結晶無水形式3(化合物A-無水-形式3)。在子實施方式中,化合物A-無水-形式3具有基本上如圖40所示的XRPD圖譜。在另一個子實施方式中,化合物A-無水-形式3具有在193.5°C至199.5°C處的熔融起始,此係藉由微差掃描熱量法測量。在又另一個子實施方式中,化合物A-無水-形式3具有在196.5°C ± 3°C處的熔融起始。在又另一個子實施方式中,化合物A-無水-形式3具有基本上如圖42所示的動態蒸汽吸附(「DVS」)。
在實施方式7b中,該固體形式係結晶無水形式4(化合物A-無水-形式4)。在子實施方式中,化合物A-無水-形式4具有基本上如圖43所示的XRPD圖譜。
在實施方式7c中,該固體形式係結晶無水形式5(化合物A-無水-形式5)。在子實施方式中,化合物A-無水-形式5具有基本上如圖44所示的XRPD圖譜。在另一個子實施方式中,化合物A-無水-形式5具有基本上如圖45所示的在188.5°C至194.5°C處的熔融起始,此係藉由微差掃描熱量法測量。在又另一個子實施方式中,化合物A-無水-形式5具有在191.5°C ± 3°C處的熔融起始。在又另一個子實施方式中,化合物A-無水-形式5具有基本上如圖46所示的動態蒸汽吸附(「DVS」),其顯示無水形式5再水合為化合物A-單水合物。
在實施方式7d中,該固體形式係結晶無水形式6(化合物A-無水-形式6)。在子實施方式中,化合物A-無水-形式6具有基本上如圖47所示的XRPD圖譜。在另一個子實施方式中,化合物A-無水-形式6具有在183.4°C至189.4°C處的熔融起始,此係藉由微差掃描熱量法測量。在又另一個子實施方式中,化合物A-無水-形式6具有在186.4°C ± 3°C處的熔融起始。
在實施方式7e中,該固體形式係結晶無水形式7(化合物A-無水-形式7)。在子實施方式中,化合物A-無水-形式7具有基本上如圖49所示的XRPD圖譜。
在實施方式7f中,該固體形式係結晶無水形式8(化合物A-無水-形式8)。在子實施方式中,化合物A-無水-形式8具有基本上如圖50所示的XRPD圖譜。
在實施方式8中,本發明提供了一種化合物A之四氫呋喃(THF)溶劑合物,其具有以下結構:
Figure 02_image015
(化合物A-THF)。
在實施方式8a中,本發明提供了一種化合物A-THF之固體形式。在子實施方式中,化合物A-THF具有基本上如圖53所示的XRPD圖譜。在另一個子實施方式中,化合物A-THF具有在188.5°C至194.5°C處的熔融起始,此係藉由微差掃描熱量法測量。在又另一個子實施方式中,化合物A-THF具有在191.5°C ± 3°C處的熔融起始。在又另一個子實施方式中,化合物A-THF具有基本上如圖54所示的熱重分析(TGA)。
在實施方式9中,本發明提供了一種化合物A之乙醇溶劑合物。在實施方式9a中,本發明提供了一種化合物A-乙醇之固體形式。在子實施方式中,化合物A-乙醇具有基本上如圖55所示的XRPD圖譜。在另一個子實施方式中,化合物A-乙醇具有在162.6°C至168.6°C處的熔融起始,此係藉由微差掃描熱量法測量。在又另一個子實施方式中,化合物A-乙醇具有在165.6°C ± 3°C處的熔融起始。在又另一個子實施方式中,化合物A-乙醇具有基本上如圖56所示的熱重分析(TGA)。
在實施方式10中,本發明提供了一種1-丙醇溶劑合物(化合物A-1-丙醇)。在實施方式10a中,本發明提供了一種化合物A-1-丙醇之固體形式。在子實施方式中,化合物A-1-丙醇具有基本上如圖58所示的XRPD圖譜。在另一個子實施方式中,化合物A-1-丙醇具有在191.2°C至197.2°C處的熔融起始,此係藉由微差掃描熱量法測量。在又另一個子實施方式中,化合物A-1-丙醇具有在194.2°C ± 3°C處的熔融起始。在又另一個子實施方式中,化合物A-1-丙醇具有基本上如圖59所示的熱重分析(TGA)。
在實施方式11中,本發明提供了一種化合物A之異丙醇溶劑合物(化合物A-IPA)。在實施方式11a中,本發明提供了一種化合物A-IPA之固體形式。在子實施方式中,化合物A-IPA具有基本上如圖60所示的XRPD圖譜。在另一個子實施方式中,化合物A-IPA具有在155.7°C至161.7°C處的熔融起始,此係藉由微差掃描熱量法測量。在又另一個子實施方式中,化合物A-IPA具有在158.7°C ± 3°C處的熔融起始。在又另一個子實施方式中,化合物A-IPA具有基本上如圖61所示的熱重分析(TGA)。
在實施方式12中,本發明提供了一種化合物A之甲醇溶劑合物(化合物A-甲醇)。在實施方式12a中,本發明提供了一種化合物A-甲醇之固體形式。在子實施方式中,化合物A-甲醇具有基本上如圖62所示的XRPD圖譜。
在實施方式13中,本發明提供了一種化合物A之乙酸異丙酯溶劑合物(化合物A-IPAc)。在實施方式13a中,本發明提供了一種化合物A-IPAc之固體形式。在子實施方式中,化合物A-IPAc具有基本上如圖63所示的XRPD圖譜。
在實施方式14中,本發明提供了一種化合物A之丙酮溶劑合物(化合物A-丙酮)。在實施方式14a中,本發明提供了一種化合物A-丙酮之固體形式。在子實施方式中,化合物A-丙酮具有基本上如圖64所示的XRPD圖譜。
在實施方式15中,本發明提供了一種化合物A之環戊基甲基醚溶劑合物(化合物A-CPME)。在實施方式15a中,本發明提供了一種化合物A-CPME之固體形式。在子實施方式中,化合物A-CPME具有基本上如圖65所示的XRPD圖譜。
在實施方式16中,本發明提供了一種化合物A之二㗁烷溶劑合物(化合物A-二㗁烷)。在實施方式16a中,本發明提供了一種化合物A-二㗁烷之固體形式。在子實施方式中,化合物A-二㗁烷具有基本上如圖66所示的XRPD圖譜。
在實施方式17中,本發明提供了一種化合物A之乙酸乙酯溶劑合物(化合物A-EtOAc)。在實施方式17a中,本發明提供了一種化合物A-EtOAc之固體形式。在子實施方式中,化合物A-EtOAc具有基本上如圖67所示的XRPD圖譜。
在實施方式18中,本發明提供了一種化合物A之乙腈溶劑合物(化合物A-MeCN)。在實施方式18a中,本發明提供了一種化合物A-MeCN之固體形式。在子實施方式中,化合物A-MeCN具有基本上如圖68所示的XRPD圖譜。
在實施方式19中,本發明提供了一種化合物A之甲基三級丁基醚溶劑合物(化合物A-MTBE)。在實施方式19a中,本發明提供了一種化合物A-MTBE之固體形式。在子實施方式中,化合物A-MTBE具有基本上如圖69所示的XRPD圖譜。
在實施方式20中,本發明提供了一種化合物A之甲苯溶劑合物(化合物A-甲苯)。在實施方式20a中,本發明提供了一種化合物A-甲苯之固體形式。在子實施方式中,化合物A-甲苯具有基本上如圖70所示的XRPD圖譜。
在實施方式21中,本發明提供了一種化合物A之十二烷基硫酸鹽(化合物A-十二烷基硫酸鹽)。在實施方式21a中,本發明提供了一種十二烷基硫酸鹽之固體形式(化合物A-十二烷基硫酸鹽)。在子實施方式中,化合物A-十二烷基硫酸鹽具有基本上如圖71所示的XRPD圖譜。
在實施方式22中,本發明提供了一種化合物A之二甲基甲醯胺(DMF)溶劑合物水合物(化合物A-DMF-水合物)。在實施方式22a中,本發明提供了一種化合物A-DMF-水合物之固體形式。在子實施方式中,化合物A-DMF-水合物具有基本上如圖73所示的XRPD圖譜。在另一個子實施方式中,化合物A-DMF-水合物具有在104.8°C至110.8°C處的熔融起始,此係藉由微差掃描熱量法測量。在又另一個子實施方式中,化合物A-DMF-水合物具有在107.8°C ± 3°C處的熔融起始。在又另一個子實施方式中,化合物A-DMF-水合物具有基本上如圖74所示的DSC圖譜。
在實施方式23中,本發明提供了一種化合物A之二甲基乙醯胺(DMAC)溶劑合物(化合物A-DMAC)。在實施方式23a中,本發明提供了一種化合物A-DMAC之固體形式。在子實施方式中,化合物A-DMAC具有基本上如圖75所示的XRPD圖譜。在另一個子實施方式中,化合物A-DMAC具有在147°C至153°C處的熔融起始,此係藉由微差掃描熱量法測量。在又另一個子實施方式中,化合物A-DMAC具有在150°C ± 3°C處的熔融起始。在又另一個子實施方式中,化合物A-DMAC具有基本上如圖76所示的DSC圖譜。
在實施方式24中,本發明提供了一種化合物A之單苯磺酸鹽水合物(化合物A-苯磺酸鹽-水合物)。在實施方式24a中,本發明提供了一種化合物A-苯磺酸鹽-水合物之固體形式。在實施方式24b中,本發明提供了一種化合物A-苯磺酸鹽-水合物形式1之固體形式。在子實施方式中,化合物A-苯磺酸鹽-水合物形式1具有基本上如圖77所示的XRPD圖譜。在又另一個子實施方式中,化合物A-苯磺酸鹽-水合物形式1具有基本上如圖78所示的DSC圖譜。
在實施方式25中,本發明提供了一種化合物A之咖啡因共晶體(化合物A-咖啡因)。在實施方式25a中,本發明提供了一種化合物A-咖啡因之固體形式。在實施方式25b中,該化合物A-咖啡因之固體形式係結晶化合物A-咖啡因共晶體形式1。在子實施方式中,化合物A-咖啡因共晶體形式1具有基本上如圖79所示的XRPD圖譜。在又另一個子實施方式中,化合物A-咖啡因共晶體形式1具有基本上如圖80所示的DSC圖譜。在又另一個子實施方式中,化合物A-咖啡因共晶體形式1具有基本上如圖81所示的DVS圖譜。
在實施方式26中,本發明提供了一種化合物A之檸檬酸共晶體(化合物A-檸檬酸)。在實施方式26a中,本發明提供了一種化合物A-檸檬酸之固體形式。在實施方式26b中,該化合物A-檸檬酸之固體形式係結晶化合物A-檸檬酸共晶體形式1。在子實施方式中,化合物A-檸檬酸共晶體形式1具有基本上如圖82所示的XRPD圖譜。在又另一個子實施方式中,化合物A-檸檬酸共晶體形式1具有基本上如圖83所示的DSC圖譜。
在實施方式26c中,該化合物A-檸檬酸之固體形式係結晶化合物A檸檬酸共晶體形式2。在子實施方式中,化合物A-檸檬酸共晶體形式2具有基本上如圖84所示的XRPD圖譜。在又另一個子實施方式中,化合物A-檸檬酸共晶體形式2具有基本上如圖85所示的DSC和TGA圖譜。
在實施方式27中,本發明提供了一種化合物A之糖精共晶體(化合物A-糖精)。在實施方式27a中,本發明提供了一種化合物A-糖精之固體形式。在實施方式27b中,該化合物A-糖精之固體形式係結晶化合物A-糖精共晶體形式1。在子實施方式中,化合物A-糖精共晶體形式1具有基本上如圖86所示的XRPD圖譜。在又另一個子實施方式中,化合物A-糖精共晶體形式1具有基本上如圖87所示的DSC圖譜。在又另一個子實施方式中,化合物A-糖精共晶體形式1具有基本上如圖88所示的DVS圖譜。
在實施方式28中,本發明提供了一種L-酒石酸共晶體(化合物A-L-酒石酸)。在實施方式28a中,本發明提供了一種化合物A-L-酒石酸之固體形式。在實施方式28b,該化合物A-L-酒石酸之固體形式係結晶化合物A-L-酒石酸共晶體形式1。在子實施方式中,化合物A-L-酒石酸共晶體形式1具有基本上如圖89所示的XRPD圖譜。在又另一個子實施方式中,化合物A-L-酒石酸共晶體形式1具有基本上如圖90所示的DSC圖譜。在又另一個子實施方式中,化合物A-L-酒石酸共晶體形式1具有基本上如圖91所示的DVS圖譜。
在實施方式29中,本發明提供了一種尿素共晶體(化合物A-尿素)。在實施方式29a中,本發明提供了一種化合物A-尿素之固體形式。在實施方式29b中,該化合物A-尿素之固體形式係結晶化合物A-尿素共晶體形式1。在子實施方式中,化合物A-尿素共晶體形式1具有基本上如圖92所示的XRPD圖譜。在又另一個子實施方式中,化合物A-尿素共晶體形式1具有基本上如圖93所示的DSC圖譜。在又另一個子實施方式中,化合物A-尿素共晶體形式1具有基本上如圖94所示的DVS圖譜。
在實施方式30中,本發明提供了一種藥物組成物,該藥物組成物包含化合物A之鹽、水合物、溶劑合物或共晶體;或化合物A、其鹽、水合物、溶劑合物或共晶體之固體形式。
在實施方式30a中,本發明提供了一種藥物組成物,該藥物組成物包含化合物A、化合物A之鹽、水合物、溶劑合物或共晶體之固體形式。在子實施方式中,該固體形式係結晶的或無定形的。在子實施方式中,該固體形式係結晶化合物A-形式1。在另一個子實施方式中,該固體形式係無水化合物A之結晶形式,包括結晶無水形式3、4、5、6、7或8。
在實施方式30b中,本發明提供了一種藥物組成物,該藥物組成物包含選自以下的化合物A之鹽、水合物、溶劑合物或共晶體:鹽酸鹽(化合物A-HCl)、甲磺酸鹽(化合物A-MsA)、甲苯磺酸鹽(化合物A-TsA)、硫酸鹽(化合物A-硫酸鹽)、可變水合物(化合物A-可變水合物)、四氫呋喃溶劑合物(化合物A-THF)、乙醇溶劑合物(化合物A-乙醇)、1-丙醇溶劑合物(化合物A-1-丙醇)、異丙醇溶劑合物(化合物A-IPA)、甲醇溶劑合物(化合物A-甲醇)、乙酸異丙酯溶劑合物(化合物A-IPAc)、丙酮溶劑合物(化合物A-丙酮)、環戊基甲基醚溶劑合物(化合物A-CPME)、二㗁烷溶劑合物(化合物A-二㗁烷)、乙酸乙酯溶劑合物(化合物A-EtOAc)、乙腈溶劑合物(化合物A-MeCN)、甲基三級丁基醚溶劑合物(化合物A-MTBE)、甲苯溶劑合物(化合物A-甲苯)、十二烷基硫酸鹽(化合物A-十二烷基硫酸鹽)、二甲基甲醯胺(DMF)溶劑合物水合物(化合物A-DMF-水合物)、二甲基乙醯胺(DMAC)溶劑合物(化合物A-DMAC)、單苯磺酸鹽水合物(化合物A-苯磺酸鹽-水合物)、咖啡因共晶體(化合物A-咖啡因)、檸檬酸共晶體(化合物A-檸檬酸)、糖精共晶體(化合物A-糖精)、L-酒石酸共晶體(化合物A-L-酒石酸)或尿素共晶體(化合物A-尿素);或其固體形式。
在實施方式30c中,本發明提供了一種藥物組成物,該藥物組成物包含如實施方式1a-1j中任一項或其任何子實施方式所述之化合物A-HCl之固體形式、和藥學上可接受的賦形劑。較佳的是,該化合物A-HCl之固體形式係化合物A-HCl之結晶形式1,其具有基本上如圖1所示的XRPD圖譜。
在實施方式30d中,本發明提供了一種藥物組成物,該藥物組成物包含如實施方式2a-2j中任一項或其任何子實施方式所述之化合物A-MsA之固體形式、和藥學上可接受的賦形劑。較佳的是,該化合物A-MsA之固體形式係化合物A-MsA之結晶形式1,其具有基本上如圖10所示的XRPD圖譜。
在實施方式30e中,本發明提供了一種藥物組成物,該藥物組成物包含如實施方式3a-3j中任一項或其任何子實施方式所述之化合物A-TsA之固體形式、和藥學上可接受的賦形劑。較佳的是,該化合物A-TsA之固體形式係化合物A-TsA之結晶形式4,其具有基本上如圖20所示的XRPD圖譜。
在實施方式30f中,本發明提供了一種藥物組成物,該藥物組成物包含如實施方式6a-6e中任一項或其任何子實施方式所述之化合物A-可變水合物之固體形式、和藥學上可接受的賦形劑。較佳的是,化合物A-可變水合物係化合物A-可變水合物形式2,其具有基本上如圖36所示的XRPD圖譜。
在實施方式30g中,本發明提供了一種藥物組成物,該藥物組成物包含化合物A之結晶無水形式、和藥學上可接受的賦形劑。較佳的是,化合物A之結晶無水形式具有基本上如圖40、43、44、47、49或50中任一個所示的XRPD圖譜。
在實施方式30h中,本發明提供了一種藥物組成物,該藥物組成物包含化合物A-檸檬酸共晶體形式1之固體形式、和藥學上可接受的賦形劑。較佳的是,化合物A-檸檬酸共晶體形式1具有基本上如圖82所示的XRPD圖譜。
在實施方式30i中,本發明提供了一種藥物組成物,該藥物組成物包含化合物A-檸檬酸共晶體形式2之固體形式、和藥學上可接受的賦形劑。較佳的是,化合物A-檸檬酸共晶體形式2具有基本上如圖84所示的XRPD圖譜。
在實施方式30j中,本發明提供了一種藥物組成物,該藥物組成物包含化合物A-十二烷基硫酸鹽之固體形式、和藥學上可接受的賦形劑。較佳的是,化合物A-十二烷基硫酸鹽具有基本上如圖71所示的XRPD圖譜。
在實施方式31中,本發明提供了一種治療罹患由KIF18A抑制介導的疾病的個體之方法,該方法包括向有需要的個體投與藥學有效量的如實施方式30-30j中任一項所述之藥物組成物。
在實施方式31a中,本發明提供了一種如實施方式31所述之方法,其中所述由KIF18A抑制介導的疾病係腫瘤病。在子實施方式中,該腫瘤病係癌症或腫瘤。在另一子實施方式中,該癌症係卵巢癌、乳癌、肺癌或子宮內膜癌。在另一子實施方式中,該卵巢癌係高分級漿液性卵巢癌(HGSOC)、視需要地轉移性或不可切除的HGSOC。在另一子實施方式中,該HGSOC係鉑抗性HGSOC或者其中該HGSOC在6個月的含鉑方案期間或之內進展。在另一子實施方式中,該癌症係原發性腹膜癌和/或輸卵管癌。在另一子實施方式中,該乳癌係三陰性乳癌。在另一子實施方式中,該子宮內膜癌係漿液性子宮內膜癌。在另一子實施方式中,該漿液性子宮內膜癌係轉移性或再發性漿液性子宮內膜癌。在另一子實施方式中,該漿液性子宮內膜癌對至少一線的全身性化學療法已復發或係難治性。在另一子實施方式中,該漿液性子宮內膜癌對至少一線的全身性化學療法已復發或係難治性。在另一子實施方式中,該肺癌係非小細胞肺癌。在另一子實施方式中,該腫瘤係晚期實性瘤。在另一子實施方式中,該腫瘤係不可切除的、轉移性的和/或非局部的。在另一子實施方式中,該腫瘤對至少一線的全身性化學療法已復發或係難治性。
在實施方式31b中,本發明提供了一種如實施方式31、31a或其任何子實施方式所述之方法,其中該個體對至少一線的全身性化學療法已復發或係難治性。在子實施方式中,該全身性化學療法包括紫杉烷、吉西他濱或多柔比星。在另一子實施方式中,該全身性化學療法包括順鉑、卡鉑或樂伐替尼(levantinib)。
在實施方式31c中,本發明提供了一種如實施方式31、31a、31b或其任何子實施方式所述之方法,其中該癌症或腫瘤包含對於失活的TP53基因呈陽性和/或對於以下中之至少一項呈陽性的細胞:(i) 失活的Rb基因,(ii) 擴增的CCNE1基因或過表現的CCNE1基因產物,(iii) 失活的BRCA基因或 (iv) 其組合。
在實施方式31c中,本發明提供了一種如實施方式31、31a、31b、31c或其任何子實施方式所述之方法,其中該個體係成年人。
在實施方式32中,本發明提供了一種用於製備如實施方式1-1j中任一項或其任何子實施方式所述之化合物A-HCl之方法,該方法包括:將鹽酸、化合物A和合適的溶劑合併以形成化合物A-HCl鹽或其固體形式。在子實施方式中,該合適的溶劑選自乙腈/水、乙腈/1,4-二㗁烷、四氫呋喃/水、N-甲基-2-吡咯啶酮/乙醇或丙酮/水。
在實施方式33中,本發明提供了一種用於製備如實施方式2-2j中任一項或其任何子實施方式所述之化合物A-MsA之方法,該方法包括:將甲磺酸、化合物A和合適的溶劑合併以形成化合物A-MsA鹽或其固體形式。在子實施方式中,該合適的溶劑選自乙腈或乙酸乙酯。
在實施方式34中,本發明提供了一種用於製備如實施方式3-3i中任一項或其任何子實施方式所述之化合物A-TsA之方法,該方法包括:將對甲苯磺酸、化合物A和合適的溶劑合併以形成化合物A-TsA鹽或其固體形式。在子實施方式中,該合適的溶劑選自乙醇或異丙醇。
在實施方式35中,本發明提供了一種用於製備如實施方式6b-6h中任一項或其任何子實施方式所述之化合物A-可變水合物-形式2之固體形式之方法,該方法包括:(a) 將水與化合物A-甲醇溶劑合物形式1和化合物A-乙醇溶劑合物形式1之混合物合併以形成化合物A-可變水合物-形式2;或 (b) 將混合物A合併在醇溶劑中,之後添加水、過濾並在升高的溫度下乾燥以除去該醇溶劑。在子實施方式中,該醇溶劑係甲醇和乙醇之混合物。在另一個子實施方式中,該升高的溫度係50°C。
在實施方式36中,本發明提供了一種化合物A之鹽酸鹽,其具有以下結構:
Figure 02_image005
(化合物A-HCl)。
在實施方式37中,本發明提供了一種化合物A之甲磺酸鹽,其具有以下結構:
Figure 02_image007
(化合物A-MsA)。
在實施方式38中,本發明提供了一種化合物A之甲苯磺酸鹽,其具有以下結構:
Figure 02_image009
(化合物A-TsA)。
在實施方式39中,本發明提供了一種化合物A之水合物,其具有以下結構:
Figure 02_image013
(化合物A-水合物);其中n在0.5至2的範圍內。
除非另有定義,否則本文所用的所有技術及科學術語均具有與本揭露所屬領域的普通技術者通常所瞭解的含義相同的含義。本文描述了用於本揭露之方法和材料;還可以使用本領域已知的其他合適方法和材料。該等材料、方法和實例僅為說明性且不旨在進行限制。本文所提及的所有出版物、專利申請、專利、序列、數據庫專案及其他參考文獻均藉由援引以其全文併入。在出現衝突的情況下,將以本說明書(包括定義)為准。
根據以下詳細描述的綜述,結合附圖,其他方面及優勢對熟悉該項技術者將是清楚的。下文的描述包括具體實施方式,應理解,本揭露係說明性的,並且不旨在將本發明限於本文所述之具體實施方式。
藉由援引併入以電子方式提交的材料
藉由援引以其全文併入的是與本文同時提交的電腦可讀核苷酸/胺基酸序列表,並且其標識如下:名稱為「A-2832-US-PSP_Seq_Listing_072121.txt」的220 KB ASCII(文本)文件;創建於2021年7月21日。
本文提供了一種化合物A之鹽、水合物、溶劑合物或共晶體;一種化合物A、其鹽、水合物、溶劑合物或共晶體之固體形式;其藥物組成物;以及治療罹患癌症的個體之方法,該等方法包括向個體投與治療有效量的藥物組成物。
化合物A係KIF18A抑制劑,並且在各個方面,具有約0.071 μM的KIF18A ATP酶IC50。KIF18A基因屬於驅動蛋白-8亞家族並且是一種正端定向馬達。據信KIF18A影響著絲點微管之正端的動力學以控制正確的染色體定位和紡錘體張力。人KIF18A之耗盡在HeLa子宮頸癌細胞中導致更長的紡錘體,在中期增加的染色體振盪以及有絲分裂紡錘體組裝檢查點之活化(MI Mayr等人,Current Biology [當代生物學] 17, 488-98, 2007)。KIF18A在各種類型的癌症中過表現,該等癌症包括但不限於結腸癌、乳癌、肺癌、胰臟癌、前列腺癌、膀胱癌、頭癌、頸癌、子宮頸癌和卵巢癌。KIF18A之過表現抑制姊妹染色分體振盪,導致緊密的中期板。在KIF18A敲除小鼠中的或在KIF18A gcd2/gcd2小鼠中藉由誘變甲磺酸乙酯(EMS)處理(馬達結構域中的錯義突變(R308K))進行的KIF18A馬達功能之失活導致在大部分器官中沒有重大異常(除了清楚的睪丸萎縮和不育症之外)的活小鼠(J Stumpff等人 Developmental Cell [發育細胞]. 2008;14:252-262;J Stumpff等人 Developmental Cell [發育細胞]. 2012;22:1017-1029;XS Liu等人 Genes & Cancer [基因和癌症]. 2010;1:26-39;CL Fonseca等人 J Cell Biol. [細胞生物學雜誌] 2019;1-16;A Czechanski等人 Developmental Biology [發育生物學]. 2015;402:253-262;O Rath, F Kozielski. Nature Reviews Cancer [自然-癌症綜述]. 2012;12:527-539)。正常人和小鼠KIF18A缺陷型體細胞顯示出完成細胞分裂,具有相對正常的有絲分裂進程但是沒有正確的染色體排列,從而導致具有正常核型的子細胞,注意到在正常細胞之子集中有一些在退出有絲分裂方面的缺陷,從而導致在更慢的增殖中之微核形成(CL Fonseca等人 J Cell Biol. [細胞生物學雜誌] 2019;1-16)。該等遺傳研究表明正常生殖細胞和體細胞對染色體排列的要求具有不同的依賴性並且表明KIF18A在正常整倍性體細胞分裂中可為不必須的(XS Liu等人 Genes & Cancer [基因和癌症]. 2010;1:26-39;A Czechanski等人 Developmental Biology [發育生物學]. 2015;402:253-262)。在正常的人體組織中,KIF18A之表現在具有活躍循環的細胞之組織中升高,在睪丸中具有最高表現(GTEx Portal [基因型組織表現], GTEx Portal [基因型組織表現], J Lonsdale等人 Nature Genetics [自然 遺傳學]. 2013:29;45:580)。在各個方面,化合物A抑制ATP酶活性。例如,化合物A抑制MT-ATP酶活性並且不是基礎ATP酶活性。
本文揭露的化合物可以在本文中藉由其化學結構和/或化學名稱標識。當化學結構和化學名稱衝突時,則化學結構將確定化合物之身份。
當針對物理特性(諸如分子量)或化學特性(諸如化學式)在本文中使用範圍時,旨在包括範圍和其中的具體實施方式之所有組合和子組合。
如本文所用,含有一或多個以虛鍵和粗鍵(即,
Figure 02_image021
Figure 02_image023
)描繪的立構中心之化學結構意在指示化學結構中存在的一或多個立構中心之絕對立體化學。如本文所用,藉由簡單線表示的鍵不指示立體偏好。除非另有相反指示,否則包括一或多個本文中說明的立構中心而不指示絕對或相對立體化學之化學結構涵蓋化合物之所有可能的立體異構形式(例如,非鏡像異構物、鏡像異構物)及其混合物。具有單一粗線或虛線和至少一條另外簡單線之結構涵蓋所有可能的非鏡像異構物之單一鏡像異構物系列。
術語「約」意在解釋由實驗誤差所致的變化。除非另有明確說明,否則應理解,本文所報告的所有測量值均由術語「約」修飾,不管該術語是否明確使用。除非上下文中另有明確指明,否則如本文所用,單數形式「一個/種(a/an)」和「該」包括複數個指示物。
如本文所用,術語「化合物」意在包括所描繪結構之所有立體異構物、幾何異構物、互變異構物和同位素。除非另有指定,否則本文中藉由名稱或結構標識為一種特定互變異構形式之化合物旨在包括其他互變異構形式。
術語「水合物」係指藉由水和化合物之相互作用形成的化學實體,包括例如半水合物、單水合物、二水合物、三水合物等。如本文所用,水合物可以具有可變量的水,通常每個化合物A分子從0.5至2個水分子,諸如0.5、1、1.5或2個水分子,稱為「可變水合物」。水分子之數目可以根據水合物形式之各種製備方法和儲存條件而變化。
除非提及特定結晶形式或無定形形式,否則術語「固體形式」和「物理形式」意在包括化合物之所有結晶形式和無定形形式,包括例如同質異晶物、假同質異晶物、溶劑合物、水合物、非溶劑化同質異晶物(包括無水合物)、構象同質異晶物和無定形形式以及其混合物。
如本文所用,術語「共晶體」係指藉由非共價相互作用(通常包括氫鍵)在晶格中結合在一起的中性分子成分和化合物A之結晶複合物。共晶體之實例包括咖啡因共晶體(化合物A-咖啡因)、檸檬酸共晶體(化合物A-檸檬酸)、糖精共晶體(化合物A-糖精)、L-酒石酸共晶體(化合物A-L-酒石酸)或尿素共晶體(化合物A-尿素)。
術語「玻璃轉換溫度」係指一個溫度範圍,其中隨著溫度增加,無定形固體形式經歷從硬且相對脆的「玻璃」態至黏性或橡膠態的逐漸和可逆轉變。
化合物A之鹽、水合物、溶劑合物、共晶體;以及化合物A,包括其結晶無水形式、鹽、溶劑合物和共晶體之固體形式之分離和純化。
化合物A具有可離子化官能基,其具有3.9的一個弱鹼性p Ka值和7.3的一個弱酸性p Ka值。藉由高通量和手動同質異晶物篩選,本發明諸位發明人產生了化合物A之各種鹽、水合物、溶劑合物、共晶體;以及化合物A,包括其結晶無水形式、鹽、水合物、溶劑合物和共晶體之固體形式。乙醇溶劑合物藉由乾燥進行的去溶劑化產生了相對穩定的化合物A-水合物-形式2,其在25°C下開始脫水並且具有非常低的溶解度。化合物A-THF溶劑合物之去溶劑化產生了無水-化合物-A-形式3,其在水性介質中或在吸收水分後快速轉化為化合物A水合物-形式2。基於化合物A之游離鹼形式的固態特性及其形成溶劑合物之傾向,本發明諸位發明人產生了可以適於原料藥放大和結晶以便藥物開發的化合物A之各種鹽、水合物、溶劑合物和共晶體。
藉由高通量和手動鹽篩選,測試了各種抗衡離子和溶劑,並且產生了化合物A之結晶鹽和溶劑合物。化合物A之若干種鹽、水合物、溶劑合物(包括硫酸鹽、苯磺酸鹽、甲磺酸鹽和甲苯磺酸鹽)形成為多種同質異晶物。在進一步的溶解度和穩定性測試之後,由於其可接受的溶解度和穩定性曲線、改善的生物醫藥特性和有利的結晶過程,優先將化合物A-HCl鹽形式1用於進一步評價。化合物A-HCl鹽形式1之同質異晶物篩選從384種結晶條件中回收了總共126個結晶樣本。在該等之中,90個樣本的XRPD圖譜與HCl鹽形式1之XRPD圖譜相同。其他樣本可以包括歧化的化合物A或化合物A溶劑合物形式。化合物-A-HCl鹽之同質異晶物篩選揭示化合物-A-HCl-形式1係最熱力學穩定的形式。也從共晶體篩選中產生了化合物A之多種共晶體,例如檸檬酸、酒石酸、咖啡因和尿素共晶體。
結晶化合物 A- 鹽酸鹽形式 1 (化合物 A-HCl 鹽形式 1 )。
本文還提供了一種結晶化合物A-HCl鹽形式1。結晶化合物A-HCl鹽形式1之特徵可以在於如實例中所述獲得的具有在-91和-103 ± 0.5 ppm處的峰之固態 19F NMR。在一些實施方式中,結晶化合物A-HCl鹽形式1具有基本上如圖4所示的固態 19F NMR,其中「基本上」意指所報告的峰可以變化約 ± 0.5 ppm。
結晶化合物A-HCl鹽形式1之特徵可以進一步在於如實例中所述獲得的使用Cu Kα輻射具有在7.5、16.9和20.2 ± 0.2° 2θ處的峰之X射線粉末繞射圖譜。結晶化合物A-HCl鹽形式1之特徵可以視需要地進一步在於使用Cu Kα輻射具有在12.8、18.2、22.7、23.6、24.8和26.1 ± 0.2° 2θ處的另外峰之X射線粉末繞射圖譜。結晶化合物A-HCl鹽形式1之特徵可以視需要地進一步在於使用Cu Kα輻射具有在10.9、14.5、15.7、15.9、19.8、20.6、21.6、23.2、26.1和26.8 ± 0.2° 2θ處的另外峰之X射線粉末繞射圖譜。在一些實施方式中,結晶化合物A-HCl鹽形式1具有基本上如圖1所示的X射線粉末繞射圖譜,其中「基本上」意指所報告的峰可以變化± 0.2°。熟悉該項技術者知道,在XRPD領域中,雖然光譜中的相對峰高取決於若干種因素,諸如樣本製備和儀器幾何結構,但是峰位置對實驗細節相對不敏感。
如實例中所述,獲得結晶化合物A-HCl鹽形式1之微差掃描熱量法(DSC)熱譜圖。DSC曲線指示在271.5°C ± 3°C處的吸熱轉變。因此,在一些實施方式中,結晶化合物A-HCl鹽形式1之特徵可以在於具有轉變吸熱的DSC熱譜圖,該轉變吸熱之起始在268.5°C至274.5°C。例如,在一些實施方式中,結晶化合物A-HCl鹽形式1之特徵在於如圖2所示的DSC。
結晶化合物A-HCl鹽形式1之特徵還可以在於熱重分析(TGA)。因此,結晶化合物A-HCl鹽形式1之特徵可以在於約4%的重量損失,起始溫度為268.3°C至273.7°C。例如,結晶化合物A-HCl鹽形式1之特徵可以在於高達約271°C下約4%的重量損失。在一些實施方式中,結晶化合物A-HCl鹽形式1具有基本上如圖2所描繪的熱重分析,其中「基本上」意指所報告的TGA特徵可以變化約4%重量損失之 ± 1%。
結晶化合物A-HCl鹽形式1之特徵可以在於水分吸附曲線。例如,在一些實施方式中,結晶化合物A-HCl鹽形式1之特徵在於如圖3所示的水分吸附曲線(DVS),其示出了在95% RH下小於0.5%的重量增加。
結晶化合物A-HCl鹽形式1之特徵進一步在於基本上如圖5所示或如實例中所述之單晶結構。
本文進一步提供了藥物組成物,該等藥物組成物包含如本文所述之結晶化合物A-HCl鹽形式1和藥學上可接受的賦形劑。
結晶化合物 A- 甲磺酸鹽形式 1 (化合物 A-MsA 鹽形式 1 )。
本文還提供了一種結晶化合物A-MsA鹽形式1。結晶化合物A-MsA鹽形式1之特徵可以在於如實例中所述獲得的具有在-95.2和-103.2 ± 0.5 ppm處的峰之固態 19F NMR。在一些實施方式中,結晶化合物A-MsA鹽形式1具有基本上如圖13所示的固態 19F NMR,其中「基本上」意指所報告的峰可以變化約 ± 0.5 ppm。
結晶化合物A-MsA鹽形式1之特徵可以進一步在於如實例中所述獲得的使用Cu Kα輻射具有在7.0、16.5和23.9 ± 0.2° 2θ處的峰之X射線粉末繞射圖譜。結晶化合物A-MsA鹽形式1之特徵可以視需要地進一步在於使用Cu Kα輻射具有在12.6、15.7、17.4、18.5、20.0和21.0 ± 0.2° 2θ處的另外峰之X射線粉末繞射圖譜。結晶化合物A-MsA鹽形式1之特徵可以視需要地進一步在於使用Cu Kα輻射具有在5.8、11.8、13.5、15.3、16.1、18.0、20.6、25.2、28.0和30.5 ± 0.2° 2θ處的另外峰之X射線粉末繞射圖譜。在一些實施方式中,結晶化合物A-MsA鹽形式1具有基本上如圖10所示的X射線粉末繞射圖譜,其中「基本上」意指所報告的峰可以變化± 0.2°。熟悉該項技術者知道,在XRPD領域中,雖然光譜中的相對峰高取決於若干種因素,諸如樣本製備和儀器幾何結構,但是峰位置對實驗細節相對不敏感。
如實例中所述,獲得結晶化合物A-MsA鹽形式1之微差掃描熱量法(DSC)熱譜圖。DSC曲線指示在250°C ± 3°C處的吸熱轉變。因此,在一些實施方式中,結晶化合物A-MsA鹽形式1之特徵可以在於具有轉變吸熱的DSC熱譜圖,該轉變吸熱之起始在247°C至253°C。例如,在一些實施方式中,結晶化合物A-MsA鹽形式1之特徵在於如圖11所示的DSC。
結晶化合物A-MsA鹽形式1之特徵還可以在於熱重分析(TGA)。因此,結晶化合物A-MsA鹽形式1之特徵可以在於約0.2%的重量損失,起始溫度為247°C至253°C。例如,結晶化合物A-MsA鹽形式1之特徵可以在於高達約250°C下約0.2%的重量損失。在一些實施方式中,結晶化合物A-MsA鹽形式1具有基本上如圖11所描繪的熱重分析,其中「基本上」意指所報告的TGA特徵可以變化0.2%重量損失之 ± 1%。
結晶化合物A-MsA鹽形式1之特徵可以在於水分吸附曲線。例如,在一些實施方式中,結晶化合物A-MsA鹽形式1之特徵在於如圖12所示的水分吸附曲線,其示出了在95% RH下小於1.2%的重量增加。
本文進一步提供了藥物組成物,該等藥物組成物包含如本文所述之結晶化合物A-MsA鹽形式1和藥學上可接受的賦形劑。
結晶化合物 A- 甲苯磺酸鹽形式 1 (化合物 -A-TsA 形式 4 )。
本文還提供了一種結晶化合物A-TsA鹽形式4。結晶化合物A-TsA鹽形式4之特徵可以在於如實例中所述獲得的使用Cu Kα輻射具有在6.2、14.7和23.5 ± 0.2° 2θ處的峰之X射線粉末繞射圖譜。結晶化合物A-TsA鹽形式4之特徵可以視需要地進一步在於使用Cu Kα輻射具有在10.5、12.4、14.2、19.1、21.5和29.0 ± 0.2° 2θ處的另外峰之X射線粉末繞射圖譜。結晶化合物A-TsA鹽形式4之特徵可以視需要地進一步在於使用Cu Kα輻射具有在15.5、16.5、17.7、18.3、18.6、20.1、20.8、24.1和25.3 ± 0.2° 2θ處的另外峰之X射線粉末繞射圖譜。在一些實施方式中,結晶化合物A-TsA鹽形式4具有基本上如圖24a所示的X射線粉末繞射圖譜,其中「基本上」意指所報告的峰可以變化± 0.2°。熟悉該項技術者知道,在XRPD領域中,雖然光譜中的相對峰高取決於若干種因素,諸如樣本製備和儀器幾何結構,但是峰位置對實驗細節相對不敏感。
結晶化合物A-TsA鹽形式4之特徵進一步在於基本上如圖24b所示或如實例中所述之單晶結構。
如實例中所述,獲得結晶化合物A-TsA鹽形式4之微差掃描熱量法(DSC)熱譜圖。DSC曲線指示在253°C ± 3°C處的吸熱轉變。因此,在一些實施方式中,結晶化合物A-TsA鹽形式4之特徵可以在於具有轉變吸熱的DSC熱譜圖,該轉變吸熱之起始在250°C至256°C。例如,在一些實施方式中,結晶化合物A-TsA鹽形式4之特徵在於如圖25所示的DSC。
結晶化合物A-TsA鹽形式4之特徵還可以在於熱重分析(TGA)。因此,結晶化合物A-TsA鹽形式4之特徵可以在於約0.07%的重量損失,起始溫度為250°C至256°C。例如,結晶化合物A-TsA鹽形式4之特徵可以在於高達約253°C下約0.07%的重量損失。在一些實施方式中,結晶化合物A-TsA鹽形式4具有基本上如圖25所描繪的熱重分析,其中「基本上」意指所報告的TGA特徵可以變化0.07%重量損失之 ± 1%。
結晶化合物A-TsA鹽形式4還具有基本上如圖26所示的具有在-96.93和-101.60 ppm處的峰之固態 19F NMR,其中「基本上」意指所報告的峰可以變化 ± 0.5 ppm。
本文進一步提供了藥物組成物,該等藥物組成物包含如本文所述之結晶化合物A-HCl鹽形式4和藥學上可接受的賦形劑。
藥物組成物
可以將如以上實施方式及其子實施方式中之任一項中所述之化合物A與藥學上可接受的賦形劑組合以提供藥物配製物(也可互換地稱為組成物)。賦形劑可為稀釋劑或載體。配製物可以影響所投與藥劑之物理狀態、穩定性、體內釋放速率和體內清除速率。短語「藥學上可接受的」或「藥理學上可接受的」係指在投與至動物或人時不產生不良反應、過敏反應或其他不利反應之分子實體和組成物。如本文所用,「藥學上可接受的」包括任何和所有溶劑、分散介質、包衣、抗菌劑和抗真菌劑、等滲劑和吸收延遲劑等。此類賦形劑用於藥學活性物質的使用係本領域所熟知的。除非任何常規介質或藥劑與治療性組成物不相容,否則設想將其用於治療性組成物中。還可以將補充性活性成分摻入組成物中。在示例性實施方式中,配製物可以包含玉米糖漿固體、高油酸紅花子油、椰子油、大豆油、L-白胺酸、磷酸三鈣、L-酪胺酸、L-脯胺酸、乙酸L-離胺酸、DATEM(乳化劑)、L-麩醯胺酸、L-纈胺酸、磷酸氫二鉀、L-異白胺酸、L-精胺酸、L-丙胺酸、甘胺酸、L-天冬醯胺單水合物、L-絲胺酸、檸檬酸鉀、L-蘇胺酸、檸檬酸鈉、氯化鎂、L-組胺酸、L-甲硫胺酸、抗壞血酸、碳酸鈣、L-麩胺酸、L-胱胺酸二鹽酸鹽、L-色胺酸、L-天冬胺酸、氯化膽鹼、牛磺酸、m-肌醇、硫酸亞鐵、抗壞血酸棕櫚酸酯、硫酸鋅、L-肉鹼、α-生育酚乙酸酯、氯化鈉、菸鹼醯胺、混合生育酚、泛酸鈣、硫酸酮、氯化硫胺素鹽酸鹽、維生素A棕櫚酸酯、硫酸錳、核黃素、鹽酸吡哆辛、葉酸、β-胡蘿蔔素、碘化鉀、葉醌、生物素、硒酸鈉、氯化鉻、鉬酸鈉、維生素D3和氰鈷胺。
對於口服投與,可以藉由將化合物A與本領域熟知的藥學上可接受的賦形劑(諸如載體)組合來配製合適的組成物。此類賦形劑和載體使得能夠將化合物A配製為片劑、丸劑、糖衣丸、膠囊、液體、凝膠、糖漿、漿料、懸浮液等,以供待治療的患者口服攝食。用於口服使用的藥物製劑可以藉由以下方式來獲得:向化合物A中添加固體賦形劑,視需要地研磨所得混合物,並且在添加合適的輔助劑之後(如果需要)加工顆粒混合物,以獲得片劑或糖衣丸核心。合適的賦形劑包括例如填充劑和纖維素製劑。如果需要,可以添加崩散劑。用於各種類型的配製物之藥學上可接受的成分係熟知的,並且可為例如用於各種配製物類型的黏合劑(例如,天然或合成聚合物)、潤滑劑、界面活性劑、甜味和調味劑、包衣材料、防腐劑、染料、增稠劑、佐劑、抗微生物劑、抗氧化劑和載體。
在口服投與治療有效量的化合物A時,組成物典型地呈固體(例如,片劑、膠囊、丸劑、粉末或糖錠)或液體配製物(例如,水性懸浮液、溶液、酏劑或糖漿)之形式。
在以片劑形式投與時,組成物可以另外含有功能性固體和/或固體載體,諸如明膠或佐劑。
在以液體或懸浮液形式投與時,可以添加功能性液體和/或液體載體,諸如水、石油或動物或植物來源的油。組成物之液體形式可以進一步含有生理鹽水溶液、糖醇溶液、右旋糖或其他糖溶液或二醇。在設想到的一個實施方式中,液體載體係非水性的或基本上非水性的。對於以液體形式投與,組成物可以作為快速溶解的固體配製物來供應,用於在即將投與前溶解或懸浮。
對於藉由吸入投與,化合物A可以以氣溶膠噴霧呈遞的形式從加壓包裝或霧化器使用合適的推進劑來遞送。在加壓氣溶膠之實施方式中,可以藉由提供閥來確定劑量單位,以遞送經計量的量。用於吸入器或吹入器的例如明膠的膠囊和藥筒可以經配製含有化合物與合適的粉末基質(諸如乳糖或澱粉)之粉末混合物。
特別地,化合物A可以以含有賦形劑(諸如澱粉或乳糖)的片劑之形式,或單獨地或與賦形劑混合地以膠囊或珠囊(ovule),或以含有調味劑或著色劑的酏劑或懸浮液之形式,口服、經頰或舌下投與。此類液體製劑可以用藥學上可接受的添加劑(諸如懸浮劑)來製備。
安全性
在一些方面,該方法包括以下述量投與化合物A或其藥學上可接受的鹽,該量在用化合物A或其鹽治療期間不引起劑量限制性毒性(DLT)。視需要地,個體在治療期期間未表現出與化合物A治療相關的DLT。在各種情況下,個體在治療期期間未表現出與化合物A治療相關的任何3級或4級不良事件。在各種情況下,治療期係至少兩週或至少一個月(如果不更長),例如2個月、3個月、4個月、5個月、6個月、7個月、8個月、9個月、10個月、11個月、12個月、1年、1.5年、2年。
在示例性方面,該方法進一步包括在化合物A治療之前、期間或之後,監測個體之全血計數。在各個方面,全血計數包括對以下中之一或多種的數目之計數:紅血球、白血球、血小板和嗜中性白血球。視需要地,全血計數包括對血細胞比容和/或血色素的測量。在示例性方面,每週一次進行監測,持續約兩個月。在各個方面,在化合物A治療期間,個體之血小板計數大於約100,000/μL血液。
在示例性實施方式中,本揭露之方法有利地對腫瘤病之細胞具有高度特異性。在各個方面,化合物A有效地治療腫瘤病、誘導或增加腫瘤消退、減少腫瘤或癌症生長或者誘導或增加腫瘤或癌細胞之死亡而對個體之正常體細胞具有很小的毒性或幾乎沒有毒性。在各個方面,以下述量投與化合物A或其藥學上可接受的鹽,該量有效地治療腫瘤病、誘導或增加腫瘤消退、減少腫瘤或癌症生長和/或誘導或增加腫瘤或癌細胞之死亡而不伴有個體之正常體細胞增殖之實質性減少。在示例性情況下,以下述量投與化合物A或其藥學上可接受的鹽,該量有效地治療腫瘤病、誘導或增加腫瘤消退、減少腫瘤或癌症生長或者誘導或增加腫瘤或癌細胞之死亡而不伴有正常體細胞的細胞凋亡之實質性增加。如本文所用,關於細胞的術語「正常」意指不是贅生性的和/或不是患病的細胞。在各個方面,正常體細胞係人骨髓單核細胞或T細胞。在各種情況下,正常體細胞在基因方面不表徵為TP53 MUT或者在基因方面表徵為TP53 WT。在各個方面,化合物A或其藥學上可接受的鹽在正常體細胞之細胞凋亡方面引起不超過25%的增加。在各個方面,化合物A或其藥學上可接受的鹽在個體之正常體細胞之增殖方面引起不超過25%的減少。視需要地,正常體細胞的細胞凋亡之增加或者正常體細胞的增殖之減少係小於約20%、小於約15%、小於約10%、小於約9%、小於約8%、小於約7%、小於約6%、小於約5%、小於約4%、小於約3%、小於約2%或小於約1%。
紫杉烷之主要副作用係骨髓抑制,主要地是嗜中性白血球減少症,而其他副作用包括周圍性水腫和神經毒性(周邊神經病變)。在示例性方面,本揭露之方法治療個體之腫瘤病而未引起在用紫杉烷治療的患者中觀察到的該等副作用中之任一種;或者治療腫瘤病,其中此類副作用相比於在用紫杉烷治療的患者中觀察到的在嚴重程度方面得以減輕。
治療功效
如本文所用,術語「治療」以及與其相關的詞不一定暗示100%或完全治療。更確切些,存在熟悉該項技術者認為具有潛在益處或治療作用的不同程度的治療。在此方面,本揭露之治療腫瘤病之方法可以提供任何量或任何水平的治療。此外,由本揭露之方法提供的治療可以包括治療所治療腫瘤病之一或多種病症或症狀或體征。另外,由本揭露之方法提供的治療可以涵蓋減緩腫瘤病之進展。例如,該等方法可以藉由增強T細胞活性或針對腫瘤病之免疫響應、減少腫瘤或癌症生長或腫瘤負荷、減少腫瘤細胞轉移、增加腫瘤或癌細胞之細胞死亡或增加腫瘤消退等而治療腫瘤病。根據前述,本文提供了在個體中減少腫瘤生長、腫瘤體積或腫瘤負荷或者增加腫瘤消退之方法。在示例性實施方式中,該方法包括向個體投與化合物A或其藥學上可接受的鹽。如本文所用,術語「治療(treat、treating和treatment)」係指療法,包括但不限於治癒性療法、預防性療法和預防療法。預防性治療通常包括完全預防個體障礙之發作或延遲個體障礙之臨床前明顯階段之發作。
在各個方面,該等方法藉由延遲腫瘤病之發作或再發或者延遲轉移之發生或發作而進行治療。在各個方面,該等方法藉由增加個體之存活而進行治療。在示例性情況下,將發作或再發或者發生延遲至少1天、2天、4天、6天、8天、10天、15天、30天、兩個月、3個月、4個月、6個月、1年、2年、3年、4年或更長時間。
在各個方面,由本揭露之方法提供的治療提供了根據實性瘤響應評價標準(RECIST)或其他類似標準的治療性響應。RECIST係由美國國家癌症研究所、加拿大國家癌症研究所臨床試驗組和歐洲癌症研究和治療組織共同建立的一組評價腫瘤和/或癌細胞之進展、穩定化或響應性的標準。根據RECIST,在評價(例如,臨床試驗)的開始測量某些腫瘤,以為與用藥物治療之後作比較提供基線。Eisenhauer等人, Eur J Cancer [歐洲癌症雜誌] 45:228-247 (2009)和Litière等人, Journal of Clinical Oncology [臨床腫瘤學雜誌] 37(13): 1102-1110 (2019) DOI: 10.1200/JCO.18.01100發表了腫瘤之響應評估和評價標準。在各種情況下,由本揭露之方法提供的治療提供了根據修改的RECIST腫瘤響應評估的治療性響應,如下:
基於修改的 RECIST 1.1 的測量和腫瘤響應評估之匯總
可測量病變 非結病變:≥ 10 mm(單維測量) 病理性淋巴結:最長直徑短軸 ≥ 15 mm
每個病變之測量 非結病變:軸向平面中的最長直徑(mm) 病理性淋巴結:最長直徑:短軸(mm)
腫瘤負荷 所有指標病變中的最長直徑總和(SLD) 多達5個病變/器官,總共多達10個
響應評估:指標病變(由腫瘤負荷之變化%計算) CR:所有病變消失。病理性淋巴結短軸 < 10 mm。 PR:相對於基線的 ≥ 30%減少 SD:不滿足CR、PR或疾病進展之標準 疾病進展:相對於最低點的 ≥ 20%增加(且 ≥ 5 mm絕對增加)
響應評估:非指標病變 CR:所有病變消失。病理性淋巴結短軸 < 10 mm。 SD:持續一或多個非指標病變 疾病進展:現有非指標病變之明確進展
新病變 一或多個新病變之存在定義進展
確認 對於CR、PR和疾病進展需要在 ≥ 4週之後藉由後續評估進行確認
修改的 RECIST 1.1 總體響應評估之匯總
指標病變(腫瘤負荷) a,% 非指標病變 新病變 使用修改的RECIST 1.1之總體響應
↓ 100% 不存在 不存在 CR b
d 不存在 不存在 CR b
↓ 100% 存在 不存在 PR b
↓ ≥ 30% 不存在/存在 不存在 PR b
↓ < 30%至↑ < 20% 不存在/存在 不存在 SD
d 存在 不存在 SD
↑ ≥ 20% 任意 任意 疾病進展 c
任意 明確的進展 任意 疾病進展 c
任意 任意 存在 疾病進展 c
NA/ND/UE 不存在/存在 不存在 UE
d NA/ND/UE 不存在 UE
CR = 完全響應;NA = 不可用;ND = 未檢;PR = 部分響應;RECIST = 實性瘤響應評價標準;UE = 無法評價 a相對於基線評估減少。相對於最低點評估增加。 b響應:CR和PR需要在 ≥ 4週之後的確認評估,也可以等待直到下一計畫成像 c進展:疾病進展需要在觀察到初始放射線照相疾病進展之後4至6週的確認評估 d僅具有非指標病變的個體
在各種情況下,個體在用化合物A或其藥學上可接受的鹽治療之後至少表現出疾病穩定(SD)。在各個方面,個體在用化合物A或其藥學上可接受的鹽治療之後至少表現出部分響應(PR)。在各個方面,相比於基線,個體表現出癌症抗原125(CA125)水平之至少10%、至少15%、至少25%、至少30%、至少40%或至少50%減少。在示例性情況下,個體在用化合物A治療之後表現出腫瘤體積之至少10%、至少15%、至少25%、至少30%、至少40%或至少50%減少。
腫瘤病
如本文所用,術語「腫瘤病」係指引起腫瘤生長的任何病症。在示例性方面,腫瘤係良性腫瘤。在示例性方面,腫瘤係惡性腫瘤。在各個方面,腫瘤病係腫瘤或癌症。在各個方面,癌症係急性淋巴細胞癌,急性骨髓性白血病,腺泡狀橫紋肌肉瘤,骨癌,腦癌,乳癌,肛門、肛管或肛門直腸之癌症,眼癌,肝內膽管癌,關節癌,頸、膽囊或胸膜之癌症,鼻、鼻腔或中耳之癌症,口腔癌,外陰癌,慢性淋巴球性白血病,慢性髓性癌,結腸癌,食管癌,子宮頸癌,胃腸道類癌腫瘤,何杰金氏淋巴瘤,舌癌,腎癌,喉癌,肝癌,肺癌,惡性間皮瘤,黑色素瘤,多發性骨髓瘤,鼻咽癌,非何杰金氏淋巴瘤,卵巢癌,胰臟癌,腹膜、網膜、腸系膜癌,咽癌,前列腺癌,直腸癌,腎癌(例如,腎細胞癌(RCC)),小腸癌,軟組織癌,胃癌、睪丸癌,甲狀腺癌,輸尿管癌或膀胱癌。在特定方面,癌症係頭頸癌、卵巢癌、子宮頸癌、膀胱癌、食管癌、胰臟癌、胃腸癌、胃癌、乳癌、子宮內膜癌、大腸直腸癌、肝細胞癌、神經膠質母細胞瘤、膀胱癌、肺癌(例如,非小細胞肺癌(NSCLC))或細支氣管肺泡癌。在特定實施方式中,腫瘤係非小細胞肺癌(NSCLC)、頭頸癌、腎癌、三陰性乳癌或胃癌。在示例性方面,個體患有腫瘤(例如,實性瘤、血液惡性腫瘤或淋巴惡性腫瘤)並且向個體投與有效治療個體之腫瘤的量的藥物組成物。在其他示例性方面,腫瘤係非小細胞肺癌(NSCLC)、小細胞肺癌(SCLC)、頭頸癌、腎癌、乳癌、黑色素瘤、卵巢癌、肝癌、胰臟癌、結腸癌、前列腺癌、胃癌、淋巴瘤或白血病,並且向個體投與有效治療個體之腫瘤的量的藥物組成物。
當在本文中使用時,術語「癌症」和「癌性的」係指或描述在哺乳動物中典型地以不受調控的細胞生長為特徵之生理病症。癌症之實例包括但不限於癌、淋巴瘤、肉瘤、母細胞瘤和白血病。此類癌症之更特定實例包括鱗狀細胞癌、肺癌、胰臟癌、子宮頸癌、膀胱癌、肝癌、乳癌、結腸癌以及頭頸癌、卵巢癌和子宮內膜癌。雖然如本文所用,術語「癌症」不限於疾病之任一具體形式,但是據信本發明之方法對於發現伴有不受調控的KIF18A水平或依賴於KIF18A以便在哺乳動物中正確染色體分離和存活的癌症特別有效。
在各個方面,癌症係轉移性的,腫瘤係不可切除的,或其組合。在各種情況下,癌症係染色體不穩定的非整倍性癌症。在各個方面,腫瘤病(例如,癌症或腫瘤)包含對於失活的 TP53基因呈陽性和/或對於以下中之至少一項呈陽性的細胞:(i) 失活的 Rb1基因,(ii) 擴增的 CCNE1基因 CCNE1基因之基因拷貝數增加 或CCNE1基因產物之過表現,(iii) 失活的 BRCA基因或 (iv) 其組合。在各個方面,腫瘤病係三陰性乳癌(TNBC)、非管腔型乳癌(例如,基底樣間質的)或高分級漿液性卵巢癌(HGSOC)。在各個方面,腫瘤病對用CDK4/6抑制劑的治療具有抗性或不具有敏感性(不敏感)。在各個方面,腫瘤病對用CDK4/6抑制劑的治療具有抗性或不具有敏感性(不敏感)並且是Rb1功能正常(proficient)的(相對於Rb1缺陷的)。在各個方面,腫瘤病對用KIF18A抑制劑的治療具有抗性。在各個方面,腫瘤病對用KIF18A抑制劑的治療具有抗性並且是Rb1缺陷的(相對於Rb1功能正常的)。
在示例性方面,腫瘤病係乳癌、視需要地管腔型乳癌或TNBC。在各個方面,乳癌已經是 (a) 組織學或細胞學確認的轉移性或局部再發性的雌激素受體(ER)陰性的(例如,藉由免疫組織化學 [IHC] < 1%),(b) 黃體素受體(PR)陰性的(例如,< 1% IHC)和 (c) 人上皮生長因子受體2(Her2)陰性的(螢光原位雜交 [FISH] 陰性,藉由IHC為0或1+,或者根據ASCO/CAP定義,為IHC2+ 和FISH陰性。在示例性方面,腫瘤病在轉移性背景中對至少一線的全身性化學療法係復發和/或難治性或者不耐受已知為腫瘤病提供臨床益處的現有一或多種療法。在示例性情況下,癌症已用免疫檢查點抑制劑治療。在各種情況下,乳癌係激素受體(HR)陽性的和/或HER2陰性的。在各個方面,乳癌係晚期乳癌和/或轉移性乳癌。在各個方面,乳癌係在內分泌療法之後進展了的HR+/HER2- 晚期或轉移性乳癌。在一些方面,乳癌係在癌症已擴散/轉移之後用內分泌療法和化學療法進行先前治療過的激素受體陽性(HR+)/HER2陰性(HER2-)晚期或轉移性乳癌。在各種情況下,癌症係尚未用激素療法(瑞寧得(Arimidex)(化學名稱:阿那曲唑)、阿諾新(Aromasin)(化學名稱:伊析美斯坦)和弗隆(Femara)(化學名稱:利妥唑))治療過的HR+/HER2- 晚期或轉移性乳癌。在各種情況下,乳癌係在用激素療法治療之後生長了的HR+/HER2- 晚期或轉移性乳癌。在各種情況下,乳癌係HER2陽性乳癌,包括但不限於與表2之HER2陽性乳癌細胞相似的那些。視需要地,乳癌係HER2陽性的雌激素受體(ER)陰性乳癌。在各個方面,腫瘤病係卵巢癌、視需要地高分級漿液性卵巢癌(HGSOC)。視需要地,卵巢癌係鉑抗性HGSOC。在示例性方面,卵巢癌係原發性腹膜癌或輸卵管癌。在各個方面,腫瘤病係轉移性或不可切除的HGSOC,其具有鉑抗性,鉑抗性被定義為在6個月的含鉑方案期間或之內之進展。在各個方面,卵巢癌已用或正在用鉑抗性再發療法治療。在各個方面,腫瘤病係漿液性子宮內膜癌。視需要地,腫瘤病係轉移性或再發性漿液性子宮內膜癌。在各種情況下,子宮內膜癌在轉移性/再發性背景中對至少一個全身性療法線係復發的和/或難治性的或者不耐受已知為腫瘤病提供臨床益處的現有一或多種療法。在各種情況下,腫瘤病係晚期或轉移性實性瘤,其係不可切除的並且對至少一線的全身性化學療法係復發和/或難治性或不耐受的。視需要地,晚期或轉移性實性瘤係TP53 MUT
在各個方面,癌症係卵巢癌、乳癌或子宮內膜癌。在各個方面,卵巢癌係透明細胞卵巢癌或高分級漿液性卵巢癌(HGSOC)、視需要地轉移性或不可切除的HGSOC 。視需要地,HGSOC係鉑抗性HGSOC或者其中HGSOC在6個月的含鉑方案期間或之內進展。在各種情況下,癌症係原發性腹膜癌和/或輸卵管癌。在示例性情況下,乳癌係三陰性乳癌。在一些方面,個體對至少一線的全身性化學療法已復發或係難治性 。視需要地,全身性化學療法包括紫杉烷、吉西他濱或多柔比星。在各種情況下,子宮內膜癌係漿液性子宮內膜癌、視需要地轉移性或再發性漿液性子宮內膜癌。在某些方面,漿液性子宮內膜癌對至少一線的全身性化學療法(例如,順鉑、卡鉑或樂伐替尼)已復發或係難治性。
在各個方面,腫瘤係晚期實性瘤 。在各種情況下,腫瘤係不可切除的、轉移性的和/或非局部的。在示例性方面,腫瘤對至少一線的全身性化學療法已復發或係難治性。
在各種情況下,腫瘤病對用一或多種藥物的治療具有抗性。在各個方面,腫瘤病表現出對用一或多種藥物的治療的降低敏感性。視需要地,腫瘤病係多藥抗性腫瘤病。在示例性情況下,腫瘤或癌細胞(例如,腫瘤病之腫瘤或癌細胞)係多藥抗性腫瘤或癌細胞和/或表現出多藥抗性1(MDR-1)基因和/或其基因產物之增加表現。在示例性情況下,腫瘤或癌細胞(例如,腫瘤病之腫瘤或癌細胞)表現出MDR-1基因編碼的P-醣蛋白(P-gp)之增加表現。在各個方面,腫瘤病表現出對用抗有絲分裂劑或蒽環抗生素(視需要地,紫杉醇或多柔比星)的治療的降低敏感性或抗性。在各個方面,腫瘤或癌細胞(例如,腫瘤病之腫瘤或癌細胞)表現出在微管蛋白基因中之突變、微管蛋白之過表現、微管蛋白擴增和/或同種型轉換的微管蛋白表現。在各個方面,α或β微管蛋白中之突變抑制紫杉烷與微管上的正確位置之結合,從而使得紫杉烷無效。在示例性方面,腫瘤病表現出對用鉑藥劑、蒽環抗生素、靶向療法(例如,TKI、PARP抑制劑)中之任何一或多種的治療的降低敏感性或抗性。
在各個方面,腫瘤病係包含一或多個全基因組重複或全基因組加倍(WGD)事件之癌症。在癌症之上下文中的WGD討論於Lens和Hemdema, Nature Reviews Cancer [自然 癌症綜述] 19: 32-45 (2019);Ganem 等人, Current Opinion in Genetics & Development [遺傳學與發育新見] 17, 157-162和Davoli等人, Annual Review of Cell and Developmental Biology [細胞和發育生物學年鑒] 27, 585-610中。
失活的基因、擴增的基因和表現水平
如本文所用,在基因之上下文中術語「失活的」係指基因或基因編碼的基因產物之功能的降低或喪失。基因之失活可以由一或多種已知的機制引起。例如,基因之失活可為由DNA序列、RNA序列或蛋白質序列相對於相應的野生型基因、RNA或蛋白質之變化(包括例如喪失)引起的或者可為由不涉及基因的DNA序列中之任何改變的表觀遺傳變化引起的。
在各個方面,癌症之細胞包含基因或基因編碼的基因產物中之變化或異常,該變化或異常係相對於相應的野生型基因或基因產物的,並且該變化之存在導致以下或與以下相關:基因之緘默化、基因或基因編碼的基因產物之表現的降低或喪失、基因或基因編碼的基因產物之功能的降低或喪失、或其組合。在各種情況下,基因產物係RNA轉錄物或蛋白質。在各種情況下,該變化至少導致基因或基因編碼的基因產物之功能的降低或喪失。在各種情況下,該變化至少導致 TP53基因或 TP53基因編碼的基因產物之功能的降低或喪失。在各種情況下,該變化至少導致 Rb1基因或 Rb1基因編碼的基因產物之功能的降低或喪失。在各種情況下,該變化至少導致 BRCA基因或 BRCA基因編碼的基因產物之功能的降低或喪失。
基因之變化可以出現在基因之任何部分,例如在內含子或外顯子內,在5’-非翻譯區(5’-UTR)或3’-非翻譯區(3’-UTR)內。該變化可以存在於基因編碼的轉錄物(例如,RNA轉錄物、初級轉錄物、前mRNA、mRNA)內或者其任何部分處,或者可以存在於基因編碼的蛋白質內或其任何部分處。
在各個方面,該變化係DNA序列、RNA序列或蛋白質序列中相對於相應的野生型基因、RNA或蛋白質之差異。在各個方面,藉由以下方式來檢測失活的基因:分析基因之核苷酸序列、分析基因編碼的RNA之核苷酸序列或分析基因編碼的蛋白質之胺基酸序列並且將樣本之基因序列與相應的野生型人基因、RNA或蛋白質序列進行比較。在示例性方面,該變化包含相對於相應的野生型基因、RNA、或蛋白質,在DNA序列或RNA序列中一或多個核苷酸之缺失、插入、或取代,在蛋白質序列中一或多個胺基酸之缺失、插入、或取代。在示例性方面,該變化包含相對於相應的野生型基因、RNA或蛋白質,在DNA序列或RNA序列中一或多個核苷酸之缺失、插入、或取代,在蛋白質序列中一或多個胺基酸之缺失、插入、或取代,其可以導致基因拷貝數增加或DNA、RNA或蛋白質之擴增。在各個方面,癌症之細胞包含基因中之基因突變。在各個方面,癌症之細胞包含基因中之基因突變或基因中核苷酸之喪失。在示例性情況下,基因突變係錯義突變、無義突變、插入、缺失、重複、框移突變、截短或重複擴增。在各種情況下,失活的 TP53基因包含突變、缺失或截短,失活的 Rb1基因包含突變、缺失或截短,和/或失活的 BRCA基因包含突變、缺失或截短。如本文所用,術語「 BRCA基因」係指 BRCA1BRCA2基因。在示例性情況下, BRCA基因係 BRCA1 在示例性方面, BRCA基因係 BRCA2
在各種情況下,該變化係表觀遺傳的並且不涉及基因的DNA序列中之任何改變。在示例性方面,失活的基因係表觀遺傳緘默化的並且視需要地涉及DNA或組蛋白之共價修飾。DNA之共價修飾可為例如胞嘧啶甲基化或羥基甲基化。組蛋白之共價修飾可為例如離胺酸乙醯化、離胺酸或精胺酸甲基化、絲胺酸或蘇胺酸磷酸化或離胺酸泛蛋白化或蘇素化(sumoylation)。基因緘默化之機制可以在轉錄或翻譯期間發生。基因緘默化之示例性機制包括但不限於DNA甲基化、組蛋白修飾和RNA干擾(RNAi)。在各個方面,失活的基因係具有表觀遺傳緘默化的啟動子的表觀遺傳緘默化之基因。視需要地,失活的 TP53基因具有表觀遺傳緘默化的 TP53啟動子或者失活的 Rb1基因具有表觀遺傳緘默化的 Rb1啟動子或者失活的 BRCA基因具有表觀遺傳緘默化的 BRCA啟動子。測定表觀遺傳緘默化之合適技術包括但不限於染色質免疫沈澱(晶片上ChIP、ChIP-Seq)、螢光原位雜交(FISH)、甲基化敏感性限制酶、DNA腺嘌呤甲基轉移酶鑒定(DamID)和亞硫酸鹽定序。參見例如,Verma等人, Cancer Epidemiology, Biomarkers, and Prevention [腫瘤流行病學、生物標誌物和預防] 23: 223-233 (2014)。
在各個方面,失活的基因係由病毒誘導的基因緘默化(VIGS)失活的。在各種情況下,失活的 TP53基因係由病毒蛋白,例如人乳突病毒(HPV)E6蛋白失活的。視需要地,HPV E6蛋白與 TP53基因編碼的p53蛋白相互作用並且使得p53蛋白失活。在各種情況下,失活的 Rb1基因係由病毒蛋白,例如HPV E7蛋白失活的。視需要地,HPV E7蛋白與 Rb1基因編碼的Rb蛋白相互作用並且使得Rb蛋白失活。此類緘默化方式係本領域已知的。參見例如,Jiang和Milner, Oncogene [致癌基因] 21: 6041-6048 (2002)。
在本揭露之方法的各種實施方式中,癌症之細胞包含基因擴增(例如, CCNE1擴增)或基因拷貝數增加(例如,基因之基因拷貝數增加)。在各種情況下,癌症之細胞包含基因拷貝數增加或擴增基因,其可以藉由基於DNA或RNA的技術(基因表現分析 [比較性基因組雜交、基於RNA的雜交]、NGS、PCR或DNA墨點)或藉由分子細胞遺傳學技術(具有基因特異性探針的FISH2、CISH(顯色原位雜交))來檢測。在各個方面,進行競爭性或定量PCR、與cDNA微陣列的基因組雜交、基因探針與RNA的雜交和定量以檢測基因擴增或基因拷貝數增加。參見例如,Harlow和Stewart, Genome Res [基因組研究] 3: 163-168 (1993);Heiskanen等人, Cancer Res [癌症研究] 60(4): 799-802 (2000)。在各種情況下,癌症之細胞包含 MDM2基因之基因拷貝數增加或擴增和/或 FBXW7基因之基因拷貝數增加或擴增或突變。在示例性方面,癌症之細胞包含 MDM2基因之基因拷貝數增加或擴增和p53蛋白水平之降低。在示例性方面,癌症之細胞包含 FBXW7基因中之突變和 CCNE1基因編碼的基因產物之過表現。下一代定序(NGS)也可以用作檢測基因拷貝數增加或喪失或基因擴增之方法,由此對基因區域進行定序,並且將定序讀段與其他基因進行比較以推斷目的基因之增加或喪失。
在示例性方面,失活的TP53基因 (i) 包含TP53基因突變、缺失、截短和/或表觀遺傳緘默化的 TP53啟動子,(ii) 由病毒蛋白或經由 MDM2基因之基因擴增來失活,或 (iii) 其組合。視需要地,病毒蛋白係人乳突病毒(HPV)E6蛋白。在示例性方面,失活的 Rb1基因 (i) 包含 Rb1基因突變、缺失、截短和/或表觀遺傳緘默化的 Rb1啟動子,(ii) 由病毒蛋白來失活或 (iii) 其組合。視需要地,病毒蛋白係人乳突病毒(HPV)E7蛋白。在示例性方面,失活的 BRCA基因 (i) 包含 BRCA基因突變、缺失、截短和/或表觀遺傳緘默化的 BRCA啟動子。視需要地,BRCA基因係BRCA1基因。替代性地,BRCA基因係BRCA2基因。
在各個方面,失活的 TP53基因、失活的 Rb1基因、 CCNE1基因拷貝數增加或擴增和/或失活的 BRCA基因存在於腫瘤病(例如,癌症)之生殖系列細胞中。在各個方面,失活的 TP53基因、失活的 Rb1基因、 CCNE1基因拷貝數增加或擴增和/或失活的 BRCA基因存在於腫瘤病(例如,癌症)之生殖系列細胞中並且不存在於腫瘤病(例如,癌症)之體細胞中。視需要地,由於腫瘤病之體細胞突變,腫瘤病之體細胞迴歸到了野生型基因型並且因此未表現出失活的 TP53基因、失活的 Rb1基因、 CCNE1基因拷貝數增加或擴增和/或失活的 BRCA基因,但是腫瘤病之生殖系列細胞仍然展示出失活的 TP53基因、失活的 Rb1基因、 CCNE1基因拷貝數增加或擴增和/或失活的 BRCA基因。例如,腫瘤病可為PARP抑制劑抗性癌症並且僅癌症之生殖系列細胞具有失活的BRCA1基因,而癌症之體細胞表現出恢復的BRCA1編碼區和功能。
細胞遺傳學方法和/或分子方法可以用於檢測失活的或擴增的基因之存在或基因拷貝數增加,例如失活的 TP53基因、失活的 Rb1基因、擴增的 CCNE1基因或失活的 BRCA基因。在示例性方面,使用了直接DNA定序、DNA雜交和/或限制性酶消化。視需要地,細胞遺傳學方法包括核型分析、螢光原位雜交(FISH)、比較性基因組雜交(CGH)或其組合。在各種情況下,分子方法包括限制性片段長度多態性(RFLP)、擴增受阻突變系統(ARMS)、聚合酶鏈反應(PCR)、多重連接依賴性探針擴增(MLPA)、變性梯度凝膠電泳(DGGE)、單股構象多態性(SSCP)、異源雙股體分析、誤配化學切割(CCM)、蛋白質截短測試(PTT)、寡核苷酸連接測定(OLA)或其組合。視需要地,PCR係多重PCR、嵌模式PCR、RT-PCR或即時定量PCR。在各個方面,測定TP53基因、 Rb1基因、CCNE1基因和/或BRCA基因編碼的RNA或蛋白質之表現水平。在各個方面,採用了ARMS、FISH、IHC或NGS。此類技術描述於Su等人, J Experimental Clin Cancer Research [實驗和臨床癌症研究雜誌] 36: 121 (2017)和He等人, Blood [血液] 127(24): 3004-3014 (2016)中。在各種情況下,使用全外顯子組定序或全基因組定序。在示例性方面,測定包括液體活組織檢查。液體活組織檢查在本領域已詳細描述。參見例如,Poulet等人, Acta Cytol [細胞學報] 63(6): 449-455 (2019), Chen和Zhao, Hum Genomics [人類基因組學] 13(1): 34 (2019)。
在各個方面,基因拷貝數增加或擴增導致過表現的或增加的基因編碼的基因產物(例如,RNA和/或蛋白質)水平。檢測增加的RNA和/或蛋白質水平之方法係本領域已知的。在示例性方面, CCNE1基因之基因拷貝數增加或擴增導致過表現的或增加的由 CCNE1基因編碼的基因產物水平。在示例性方面,CCNE1基因產物之過表現係由 FBXW7基因中之突變導致的。在各個方面,樣本對於CCNE1基因產物之過表現和 FBXW7基因中之突變呈陽性。
確定核酸(例如,基因、RNA、mRNA)之表現水平的合適方法係本領域已知的並且包括但不限於定量聚合酶鏈反應(qPCR)(例如,定量即時PCR(qRT-PCR))、RNAseq、奈米串(Nanostring)和RNA墨點。用於測量基因表現之技術還包括例如使用或不使用基因晶片或基因表現微陣列之基因表現測定,描述於下列文獻中:Onken等人, J Molec Diag [分子診斷雜誌] 12(4): 461-468 (2010);和Kirby等人, Adv Clin Chem [臨床化學進展] 44: 247-292 (2007)。昂飛公司(Affymetrix)基因晶片和RNA晶片和基因表現測定套組(kit)(例如,Applied Biosystems™ TaqMan®基因表現測定)亦為可從諸如賽默飛世爾科技公司(ThermoFisher Scientific)(麻塞諸塞州沃爾瑟姆)和納斯瑞公司(Nanostring)(Geiss等人, Nature Biotechnology [自然生物技術] 26: 317-325 (2008))的公司商購獲得的。確定蛋白質表現水平之合適方法係本領域已知的並且包括免疫測定(例如,西方墨點法、酶聯免疫吸附測定(ELISA)、放射性免疫分析法(RIA)和免疫組化測定)或基於珠粒的多重測定,例如描述於下列文獻中的那些:Djoba Siawaya JF, Roberts T, Babb C, Black G, Golakai HJ, Stanley K等人 (2008) An Evaluation of Commercial Fluorescent Bead-Based Luminex Cytokine Assays [基於商業螢光珠粒的Luminex細胞介素測定的評估]. PLoS ONE [公共科學圖書館期刊] 3(7): e2535。對具有特定生物學系統的蛋白質之系統鑒定和定量之蛋白質組學分析係已知的。質譜法典型地是用於此目的的技術。
在示例性方面,該方法包括基於所述基因編碼的RNA測量互補DNA(cDNA)的水平。簡而言之,該方法包括從樣本中提取或分離RNA(例如,從樣本之一或多個腫瘤細胞中)並且基於從樣本中分離的RNA合成cDNA。替代性地或另外地,在一些方面,測量表現水平包括從樣本中分離RNA、從RNA產生互補DNA(cDNA)、擴增cDNA並且使cDNA與基因表現微陣列雜交。因此,在一些方面,測量表現水平包括從樣本中分離RNA並且藉由RNA-Seq定量RNA。在替代性或另外的方面,經由免疫組織化學測定確定表現之水平。在示例性方面,測量表現水平包括使樣本與針對 TP53Rb1BRCA、或 CCNE1、或其基因產物或其組合的結合劑接觸。在一些方面,結合劑係抗體或其抗原結合片段。在一些方面,結合劑係對於 TP53Rb1BRCA、或 CCNE1、或其RNA轉錄物或其互補序列具有特異性的核酸探針。
一旦測量了來自從個體獲得的樣本之 TP53Rb1BRCA、或 CCNE1、或其基因產物之表現水平,可以將測量的表現水平與參考水平進行比較,歸一化為管家基因,經數學變換。在示例性情況下, TP53Rb1BRCACCNE1或其基因產物之測量的表現水平被集中和縮放。集中和縮放生物數據之合適技術係本領域已知的。參見例如,van den Berg等人, BMC Genomics [BMC基因組學] 7: 142 (2006)。
野生型 TP53Rb1CCNE1BRCA基因以及該等基因編碼的RNA和蛋白質係本領域已知的。每一個的示例性序列可獲得自美國國家生物技術資訊中心(NCBI)之網站並且提供於本文提交的序列表中。 [表A]
基因名稱(縮寫,全稱) NCBI、HUGO基因ID號 mRNA登錄號 SEQ ID NO: 蛋白質登錄號 SEQ ID NO:
TP53 7157、11998 NM_000546.6 1 NP_000537.3 2
RB1 5925、9884 NM_000321.3 3 NP_000312.2 4
CCNE1 898、1589 NM_001238.4 5 NP_001229.1 6
BRCA1 672、1100 NM_007294.4 7 NP_009225.1 7
BRCA2 675、1101 NM_000059.4 9 NP_000050.3 10
癌症之細胞可以對於 (a) 失活的 TP53基因和/或 (b) 以下中之至少一項鑒定為「陽性」或「陰性」:(i) 失活的 Rb1基因,(ii) 擴增的 CCNE1基因、 CCNE1基因之基因拷貝數增加或 CCNE1基因產物之過表現,(iii) 失活的 BRCA基因或 (iv) 其組合。如本文所用,在樣本之上下文中的術語「陽性」係指失活的 TP53基因和/或 (b) 以下中之至少一項存在於樣本中:(i) 失活的 Rb1基因,(ii) 擴增的 CCNE1基因、 CCNE1基因之基因拷貝數增加或 CCNE1基因產物之過表現,(iii) 失活的 BRCA基因或 (iv) 其組合。如本文所用,在樣本之上下文中的術語「陰性」係指失活的 TP53基因和/或 (b) 以下中之至少一項不存在於樣本中:(i) 失活的 Rb1基因,(ii) 擴增的 CCNE1基因、 CCNE1基因之基因拷貝數增加或 CCNE1基因產物之過表現,(iii) 失活的 BRCA基因或 (iv) 其組合,例如,樣本不具有失活的 TP53基因和/或 (b) 以下中之至少一項存在於樣本中:(i) 失活的 Rb1基因,(ii) 擴增的 CCNE1基因、 CCNE1基因之基因拷貝數增加或 CCNE1基因產物之過表現,(iii) 失活的 BRCA基因或 (iv) 其組合。
個體
在本揭露之示例性實施方式中,個體係哺乳動物,包括但不限於嚙齒目哺乳動物,諸如小鼠和倉鼠;和兔目哺乳動物,諸如兔;來自食肉目的哺乳動物,包括貓科動物(貓)和犬科動物(犬);來自偶蹄目的哺乳動物,包括牛科動物(奶牛)和豬科動物(豬);或奇蹄目,包括馬科動物(馬)。在一些方面,哺乳動物屬於靈長目、闊鼻小目(Ceboid)或猴目(Simoid)(猴)或類人猿目(人類和猿類)。在一些方面,哺乳動物係人。在各個方面,個體患有腫瘤病,例如本文所述之那些中之任一種。如本文所用,術語「患者」、「個體」或「哺乳動物」係指任何「患者」、「個體」或「哺乳動物」,包括人、牛、馬、狗和貓。在本發明之一個實施方式中,哺乳動物係人。在各個方面,個體係成年人。視需要地,個體已接受過用至少一種化學治療劑的先前治療。
在示例性方面,個體患有具有轉移的癌症、不可切除的腫瘤或其組合。在各個方面,癌症或腫瘤表現出或已表現出對用CDK4/6抑制劑的治療之抗性或降低敏感性。在示例性方面,個體患有乳癌、視需要地管腔型乳癌或三陰性乳癌(TNBC)。在各個方面,乳癌已經是 (a) 組織學或細胞學確認的轉移性或局部再發性的雌激素受體(ER)陰性的(例如,藉由免疫組織化學 [IHC] < 1%),(b) 黃體素受體(PR)陰性的(例如,< 1% IHC)和 (c) 人上皮生長因子受體2(Her2)陰性的(螢光原位雜交 [FISH] 陰性,藉由IHC為0或1+,或者根據ASCO/CAP定義,為IHC2+ 和FISH陰性。在示例性方面,個體在轉移性背景中對至少一線的全身性化學療法係復發和/或難治性或者不耐受已知為他們的病症提供臨床益處的現有一或多種療法。在示例性情況下,個體先前已暴露於免疫檢查點抑制劑。在各種情況下,乳癌係激素受體(HR)陽性的和/或HER2陰性的。在各個方面,乳癌係晚期乳癌和/或轉移性乳癌。在各個方面,個體患有在接受內分泌療法之後進展了的HR+/HER2- 晚期或轉移性乳癌。在一些方面,個體係在癌症已擴散/轉移之後用內分泌療法和化學療法進行先前治療過的激素受體陽性(HR+)/HER2陰性(HER2-)晚期或轉移性乳癌患者。在各種情況下,個體患有HR+/HER2- 晚期或轉移性乳癌,在停經後婦女中其先前未用激素療法(瑞寧得(Arimidex)(化學名稱:阿那曲唑)、阿諾新(Aromasin)(化學名稱:伊析美斯坦)、和弗隆(Femara)(化學名稱:利妥唑))治療過。在各種情況下,個體係停經後婦女,其患有在用激素療法治療之後生長了的HR+/HER2- 晚期或轉移性乳癌。在某些方面,個體係停經前期/圍停經期或停經後婦女,其患有HR+、人上皮生長因子受體2(HER2)陰性晚期或轉移性乳癌,並且已接受過基於內分泌的療法。視需要地,個體係停經後婦女,其患有HR+、HER2- 晚期或轉移性乳癌,並且已接受過初始的基於內分泌的療法或在用內分泌療法治療後有疾病進展。在各個方面,個體患有卵巢癌、視需要地高分級漿液性卵巢癌(HGSOC)。視需要地,卵巢癌係鉑抗性HGSOC。在示例性方面,個體患有原發性腹膜癌和/或輸卵管癌。在各個方面,個體具有組織學或細胞學確認診斷的轉移性或不可切除的HGSOC,其具有鉑抗性,鉑抗性被定義為在6個月的含鉑方案期間或之內的進展。在各個方面,個體患有卵巢癌並且已接受過或正在接受鉑抗性再發療法。在各個方面,個體患有漿液性子宮內膜癌。視需要地,個體具有組織學或細胞學確認診斷的轉移性或再發性漿液性子宮內膜癌。在各種情況下,個體在轉移性/再發性背景中對至少一個全身性療法線係復發的和/或難治性的或者不耐受已知為他們的病症提供臨床益處的現有一或多種療法。在各種情況下,個體患有晚期或轉移性實性瘤,其是不可切除的並且對至少一線的全身性化學療法係復發和/或難治性或不耐受的。視需要地,晚期或轉移性實性瘤係TP53 MUT
在示例性方面,個體不具有以下中之任一項:(a) 活動性腦轉移瘤,(b) 原發性中樞神經系統(CNS)腫瘤、血液惡性腫瘤或淋巴瘤,(c) 不受控的胸腔積液、心包積液或腹水,(d) 引起不能口服給藥的胃腸(GI)道疾病。
個體選擇和治療結果
在一些實施方式中,在所揭露的方法中用化合物A治療的個體係已經歷過一或多種先前全身性癌症療法(例如,化合物A係二線或三線療法)之個體。先前全身性癌症療法可為經監管機構(例如,FDA或EMA)批准為治療給定癌症類型和階段之療法。在一些情況下,先前全身性癌症療法係尚未經監管機構批准但正在進行臨床試驗之癌症療法。如果個體已進行了先前全身性癌症療法,在一些情況下,個體已在開始如本文所揭露的用化合物A的療法前之至少一個月、至少兩個月、至少三個月、至少四個月、至少五個月或至少六個月內沒有進行任何全身性癌症療法。
在療法過程中監測經歷療法的個體之不良事件(AE)。與治療相關的AE係與治療藥物相關的AE。治療突發性AE係個體在療法開始前不存在、在經歷治療中發生的AE。在一些情況下,治療期突發性AE與治療本身無關或被懷疑與治療本身無關。AE被表徵為以下五個級別之一:1級係輕度AE;2級係中度AE;3級係嚴重AE;4級係危及生命或致殘的AE;5級係AE相關死亡。在一些情況下,個體未表現出治療相關的任何3級AE。在一些情況下,個體未表現出任何3級AE。在一些情況下,個體未表現出治療相關的任何4級AE。在一些情況下,個體未表現出任何4級AE。在各種情況下,個體在投與化合物A至少一個月或至少三個月之後未表現出治療相關的3級或4級AE。
在各種情況下,在本文揭露的方法中用化合物A治療的個體在投與的劑量下未表現出任何劑量限制性毒性(DLT)。DLT係在化合物A之第一治療週期(第1天至第21天)期間發生的滿足以下列出的標準之任何AE,其中不能排除與藥物的關係。AE之分級係基於CTCAE 5.0版中提供的指南。用於DLT評估的AE:血液學毒性:發熱性嗜中性白血球減少症;嗜中性白血球減少性感染;4級嗜中性白血球減少症;持續 > 7天的≥ 3級血小板減少症;3級血小板減少症伴 ≥ 2級出血;4級血小板減少;4級貧血 非血液學毒性 ≥ 4級、嘔吐或腹瀉;儘管有最佳醫療支持,但3級腹瀉或3級嘔吐持續超過3天;儘管有最佳醫療支持,但 ≥ 3級噁心持續3天或更多天;任何其他 ≥ 3級AE。
在各種情況下,所揭露的方法之個體表現出對療法的響應。在一些情況下,個體由於化合物A之投與至少表現出疾病穩定(SD)。在一些情況下,個體由於化合物A之投與至少表現出部分響應(PR)。個體之響應藉由如由RECIST 1.1定義的標準來評估,例如如討論於Eisenhauer等人, Eur J Cancer[歐洲癌症雜誌] ,45:228-247 (2009)中。完全響應(CR)係所有靶病變消失,並且任何病理性淋巴結之短軸降低至小於10 mm。部分響應(PR)係以基線直徑總和為參考,靶病變直徑總和減少至少30%。疾病進展係以研究中的最小總和(如果基線總和係研究中的最小總和,則包括基線總和)為參考,靶病變直徑總和增加至少20%,並且除了20%的相對增加之外,還必須有至少5 mm的絕對增加。疾病穩定係既未充分縮減以符合PR,也未充分增加以符合PD。受控的疾病狀態係患者可以在表現出疾病穩定和部分響應之間交替的情況。腫瘤大小可以藉由放射線照相掃描來測量。
其他實施方式
本文進一步提供了選自以下的化合物A之任何鹽、水合物、溶劑合物或共晶體之任何無定形或結晶形式:鹽酸鹽(化合物A-HCl)、甲磺酸鹽(化合物A-MsA)、甲苯磺酸鹽(化合物A-TsA)、硫酸鹽(化合物A-硫酸鹽)、可變水合物(化合物A-可變水合物)、四氫呋喃溶劑合物(化合物A-THF)、乙醇溶劑合物(化合物A-乙醇)、1-丙醇溶劑合物(化合物A-1-丙醇)、異丙醇溶劑合物(化合物A-IPA)、甲醇溶劑合物(化合物A-甲醇)、乙酸異丙酯溶劑合物(化合物A-IPAc)、丙酮溶劑合物(化合物A-丙酮)、環戊基甲基醚溶劑合物(化合物A-CPME)、二㗁烷溶劑合物(化合物A-二㗁烷)、乙酸乙酯溶劑合物(化合物A-EtOAc)、乙腈溶劑合物(化合物A-MeCN)、甲基三級丁基醚溶劑合物(化合物A-MTBE)、甲苯溶劑合物(化合物A-甲苯)、十二烷基硫酸鹽(化合物A-十二烷基硫酸鹽)、二甲基甲醯胺(DMF)溶劑合物水合物(化合物A-DMF-水合物)、二甲基乙醯胺(DMAC)溶劑合物(化合物A-DMAC)、單苯磺酸鹽水合物(化合物A-苯磺酸鹽-水合物)、咖啡因共晶體(化合物A-咖啡因)、檸檬酸共晶體(化合物A-檸檬酸)、糖精共晶體(化合物A-糖精)、L-酒石酸共晶體(化合物A-L-酒石酸)或尿素共晶體(化合物A-尿素),如藉由本文之圖和實例中XRPD、DSC、TGA、水分吸附(DVS)中之任一種表徵的;以及藥物組成物,該等藥物組成物包含化合物A之鹽、溶劑合物或共晶體中之任一種和藥學上可接受的賦形劑。
在各種實施方式中,有機溶劑可以選自以下群組,該群組由以下組成:醚溶劑、非極性溶劑及其任何組合。在一些情況下,有機溶劑可為醚溶劑。合適的醚溶劑可以包括例如四氫呋喃(THF)、2-甲基四氫呋喃(MeTHF)、環戊基甲基醚、三級丁基甲基醚、1,2-二甲氧基乙烷、1,4-二㗁烷、二乙醚、二異丙基醚、雙(2-甲氧基乙基)醚、丙二醇甲基醚及其任何組合。在實施方式中,醚溶劑可為THF或2-甲基四氫呋喃。在一些情況下,有機溶劑可為非極性溶劑。合適的非極性溶劑可以包括例如己烷、戊烷、甲苯、苯、庚烷、二甲苯及其任何組合。在實施方式中,非極性溶劑可為甲苯、己烷、庚烷或其任何組合。在實施方式中,有機溶劑可以選自以下群組,該群組由以下組成:THF、2-甲基四氫呋喃、環戊基甲基醚、三級丁基甲基醚、1,2-二甲氧基乙烷、甲苯、己烷、庚烷、1,4-二㗁烷及其任何組合。在一些實施方式中,有機溶劑係THF。
應理解,雖然本揭露結合其詳細描述來閱讀,但是前述描述旨在說明且不限制本揭露之範圍,該範圍藉由所附申請專利範圍之範圍來限定。其他方面、優點和修改在以下申請專利範圍之範圍內。例如,如實例1-45所示。 實例
提供以下實例用於說明而非旨在限制本發明之範圍。 材料與方法
除非指定,否則可商購獲得的試劑原樣使用而不進行進一步純化。製備按重量計1.0 M在THF中的MeI之溶液。分批和流動化學設備(反應器、管材、泵、連接件和配件)係來自可商購獲得的來源。
用於以下合成方法的起始材料(化合物A)之合成揭露在於2019年12月20日提交、於2020年7月30日公開為U.S. 2020-0239441的美國非臨時專利申請案號16/724,119中。反應之起始材料、中間體和終產物可以使用常規技術進行分離和純化(如果需要),該等常規技術包括但不限於過濾、蒸餾、結晶、層析法等。此類材料可以使用常規方式(包括物理常數和光譜數據)來表徵。
除非作出相反指定,否則本文所述之反應在大氣壓和以下範圍內的溫度下進行:約-78°C至約150°C、或約0°C至約50°C、或約15°C至約25°C。
帕納科公司(PANalytical)X’Pert PRO MPD繞射儀 - 透射幾何結構
除非作出相反指定,否則使用由Optix長、細焦點源產生的Cu輻射之入射光束,用帕納科公司X’Pert PRO MPD繞射儀收集XRPD圖譜。使用橢圓梯度多層反射鏡來將Cu Kα X射線聚焦通過試樣並且到檢測器上。在分析前,分析矽試樣(NIST SRM 640f)以證實Si 111峰位置。將樣本之試樣夾置在3 μm厚膜之間,並且以透射幾何結構進行分析。使用光束阻擋器和短防散射延伸來使空氣產生的背景最小化。使用用於入射和繞射光束的索勒狹縫來使來自軸向發散的增寬最小化。使用位於距試樣240 mm處的掃描位置敏感性檢測器(X'Celerator)和Data Collector軟體v.5.5收集繞射圖譜(原樣材料除外,其中使用Data Collector軟體v.2.2b)。每個圖譜之數據獲取參數在此報告的數據部分中之圖像上方展示。
帕納科公司X’Pert PRO MPD繞射儀 - 反射幾何結構
除非作出相反指定,否則使用由長、細焦點源和鎳濾光片產生的Cu Kα輻射之入射光束,用帕納科公司X'Pert PRO MPD繞射儀收集XRPD圖譜。使用對稱布拉格-布倫塔諾(Bragg-Brentano)幾何結構配置繞射儀。使用Data Collector軟體v. 2.2b收集和分析數據。在分析前,分析矽試樣(NIST SRM 640f)以證實所觀察到的Si 111峰位置與NIST證實的位置一致。將樣本之試樣裝填在鎳塗覆的銅孔中。使用防散射狹縫(SS)來使空氣產生的背景最小化。使用用於入射和繞射光束的索勒狹縫來使來自軸向發散的增寬最小化。使用位於距樣本240 mm處的掃描位置敏感性檢測器(X'Celerator)和Data Collector軟體v. 2.2b收集繞射圖譜。每個圖譜之數據獲取參數在此報告的數據部分中之圖像上方展示,包括發散狹縫(DS)和入射光束防散射狹縫(SS)。
在具有RTMS檢測器的帕納科公司X’Pert PRO X射線繞射系統上獲得X射線粉末繞射(XRPD)數據。在45 kV和40 mA下以每50 s步進一次0.0334°步長、以從5至45°(2θ)的連續模式在環境溫度下用CuKα輻射(1.541874 Å)掃描樣本。
用專有SSCI軟體進行XRPD指標化,TRIADS™由美國專利案號8,576,985涵蓋。
使用梅特勒-托利多公司(Mettler-Toledo)DSC3+差示掃描量熱儀進行微差掃描熱量法(DSC)。用銦、錫和鋅進行τ滯後調整。用辛烷、水楊酸苯酯、銦、錫和鋅調整溫度和焓。然後用辛烷、水楊酸苯酯、銦、錫和鋅驗證調整。將樣本放入氣密地密封的鋁DSC盤中,並且準確記錄重量。藉由工具刺穿盤蓋並且然後插入至DSC小室中進行分析。將配置為樣本盤的稱重鋁盤放置於小室之參考側上。
替代性地,還在乾氮氣下在鋁盤中以10°C/min從25°C至250°C至350°C在TA儀器公司(TA Instruments)Q和Discovery系列量熱儀上以50 ml/min進行微差掃描熱量法(DSC)分析。
使用梅特勒-托利多公司TGA/DSC3+分析儀進行熱重分析(TGA)和TGA/DSC組合分析。使用銦、錫和鋅進行溫度和焓調整,並且然後用銦驗證。用草酸鈣驗證平衡。將樣本放入開放鋁盤中。將盤氣密地密封,刺穿蓋,然後插入至TG爐中。將配置為樣本盤的稱重鋁盤放置於參考平臺上。在氮氣下加熱爐。
在乾氮氣下在鉑盤中以10°C/min從環境溫度在250°C至350°C之間在TA儀器公司Q和Discovery系列分析儀上以25 ml/min進行熱重分析(TGA)。
使用VTI SGA 100對稱蒸汽吸附分析儀收集水分吸附數據。在鉑盤中使用大約5 mg至10 mg的樣本量。以5% RH的增量從5% RH至95% RH評價吸濕性。收集吸附和解吸循環之數據。將平衡標準設定為10分鐘內重量變化0.001%,最大平衡時間為180分鐘。
藉由伊利諾州香檳城(Champaign)的波譜數據服務公司(Spectral Data Services)(SSCI)在25°C下用Varian UNITY INOVA-400波譜儀採集溶液質子NMR波譜。將樣本溶解於DMSO- d6中。在一些情況下,也在SSCI處用安捷倫DD2-400波譜儀使用氘化DMSO或甲醇採集溶液NMR波譜。
在於600 Mhz( 1H)下操作的布魯克公司(Bruker)DSX波譜儀上收集 19F SSNMR數據。所有實驗均使用以14 kHz旋轉頻率操作的4 mm H/F/X旋轉探針。以10 s的循環延遲使用HPDEC程式,並且以特氟隆作參考。使用2.5 µs的 1H 90°脈衝和5 µs的 19F 90°脈衝。使用spinal64序列進行去耦。採集256個暫態以進行訊息平均化。用Topspin 3.0軟體處理數據。 實例 1 :結晶化合物 A-HCl 形式 1
可以在用鹽酸對化合物A進行原位質子化後在多種溶劑體系中實現化合物A-HCl形式1之結晶化。最初,藉由在環境條件下將一當量HCl在乙腈/水90/10中漿化來製備化合物A-HCl形式1。後來,使用無水過程,即在升高的溫度下用鹽酸處理在乙腈/1,4-二㗁烷體系中之化合物A(表1,編目號1)。在NMP/EtOH、THF/水和丙酮/水中開發了使用不同鹽酸源的可替代反應性結晶過程(表1,編目號2-5)。由於原料藥始終如一高純度和根據ICH指南限制對殘餘溶劑量之控制而選擇丙酮/水作為最終結晶體系。該等批次之表徵結果匯總於表1中。
[表1]:用於產生化合物A-HCl形式1之各種結晶過程
編號 規模 溶劑 HCl 當量 HCl 產率( % HPLC 純度 殘餘溶劑 氯化物含量
1. 2.5 g MeCN/ 1,4-二㗁烷 在1,4-二㗁烷中的4 M HCl 1.0 95 97.98 LCAP 6136 ppm MeCN 5.5
2. 5 g THF/水 0.5 M HCl(水溶液) 1.5 82 98.85 LCAP 3649 ppm THF 5.7
3. 5 g NMP/EtOH 在EtOH中的1.25 M HCl 1.5 84 99.07 LCAP 15112 ppm NMP 1205 ppm EtOH 5.7
4. 0.5 g 丙酮/ 水 1.5 M HCl(水溶液) 2.0 89 98.97 LCAP 4830 ppm丙酮 N/A
5. 1 kg 丙酮/ 水 1.5 M HCl(水溶液) 2.0 78 98.99 LCAP 1346 ppm丙酮 5.9
在環境溫度下將化合物A溶解於30體積丙酮中,之後精密過濾、添加5體積水和2.0當量鹽酸(2.5體積1.5 N HCl水溶液)。用於結晶和漿料老化的最終溶劑組成係80/20(v/v)丙酮/水,其為化合物A(即約18 mg/mL)和化合物A-HCl形式1(即約8 mg/mL)兩者提供了適當的溶解度以實現晶體生長和雜質排除。該過程係未加晶種的,並且在向化合物A溶液中添加鹽酸過程中發生晶體生長。將最終漿料在環境溫度下老化10 h,然後冷卻至10°C,之後濕法研磨。在10°C下進行研磨材料之分離,之後用8體積丙酮洗滌濾餅。將材料在真空下在40°C下乾燥。在THF/水和丙酮/水兩者中進行的濕法研磨實驗顯示出如表2中匯總的粒度減小至指定目標範圍,並且按XRPD、固態NMR和DSC,該形式純度 ≥ 95%。
[表2]. 從THF/水和丙酮/水漿料獲得的未研磨和研磨化合物A HCl粒度之比較。
溶劑 THF/ 丙酮 /
粒度 研磨前 研磨後 研磨前 研磨後
D[4,3],µm 54.2 28.1 50.6 26.9
D10,µm 13.7 6.7 8.9 4.5
D50,µm 47.6 26.2 41.7 24.6
D90,µm 106.0 52.5 106.0 53.3
跨度 1.9 1.8 2.3 2.0
X射線粉末繞射:在具有RTMS檢測器的帕納科公司X’Pert PRO X射線繞射系統上獲得X射線粉末繞射數據。在45 kV和40 mA下以0.0334°的步長以從5-45°(2θ)的連續模式使用CuKα輻射(1.54 Å)掃描樣本。入射光束路徑配備有0.02弧度的索勒狹縫、15 mm掩模、4°固定防散射狹縫和可程式設計發散狹縫。繞射光束配備有0.02弧度的索勒狹縫、可程式設計防散射狹縫和0.02 mm鎳濾光片。在低背景樣本架上製備樣本並且將其放置於旋轉臺上,旋轉時間為2 s。對於可變溫度研究,在平板樣本架上製備樣本並且將其放置於TTK-450溫度控制台上。對於可變濕度研究,使用模組式濕度發生器(ProUmid)來控制THC濕度樣本室中的氣氛。結晶化合物A-HCl形式1材料之XRPD圖譜示出於圖1中,並且XRPD峰列出於表3中。
[表3]:結晶化合物A-HCl形式1之XRPD數據
位置 [°2θ] FWHM [°2θ] d- 間距 [Å] 高度 [cts] 相對強度 [%]
7.46 0.12 11.85 4968.86 98.51
9.92 0.05 8.92 392.44 7.78
10.93 0.15 8.10 999.90 19.82
12.22 0.10 7.24 215.45 4.27
12.80 0.22 6.92 2194.48 43.51
13.65 0.17 6.49 156.86 3.11
14.45 0.13 6.13 1141.27 22.63
15.08 0.12 5.87 608.16 12.06
15.65 0.12 5.66 1160.06 23.00
15.91 0.13 5.57 1267.80 25.14
16.38 0.12 5.41 906.12 17.96
16.86 0.13 5.26 4628.60 91.77
17.60 0.13 5.04 694.56 13.77
18.22 0.17 4.87 3169.70 62.84
18.61 0.13 4.77 878.26 17.41
19.37 0.10 4.58 432.63 8.58
19.77 0.12 4.49 1876.76 37.21
20.19 0.15 4.40 5043.90 100.00
20.61 0.08 4.31 1142.70 22.66
20.93 0.10 4.24 357.31 7.08
21.15 0.10 4.20 195.64 3.88
21.63 0.15 4.11 1043.33 20.69
22.65 0.12 3.93 2116.42 41.96
23.15 0.08 3.84 876.92 17.39
23.55 0.15 3.78 4553.07 90.27
24.11 0.10 3.69 733.98 14.55
24.77 0.13 3.59 3403.62 67.48
25.94 0.14 3.43 1409.32 27.94
26.05 0.12 3.42 1700.20 33.71
26.25 0.08 3.39 608.23 12.06
26.76 0.10 3.33 1195.89 23.71
27.40 0.13 3.26 136.88 2.71
27.88 0.10 3.20 164.48 3.26
28.39 0.10 3.14 618.61 12.26
28.72 0.10 3.11 307.94 6.11
29.29 0.10 3.05 720.00 14.27
29.77 0.12 3.00 427.49 8.48
30.12 0.20 2.97 320.39 6.35
31.02 0.17 2.88 501.91 9.95
31.46 0.17 2.84 301.61 5.98
32.00 0.13 2.80 319.71 6.34
32.84 0.10 2.73 585.65 11.61
33.09 0.08 2.71 505.83 10.03
33.94 0.10 2.64 832.84 16.51
34.39 0.13 2.61 255.97 5.07
35.05 0.27 2.56 139.37 2.76
36.08 0.12 2.49 307.30 6.09
36.95 0.23 2.43 567.46 11.25
37.35 0.20 2.41 318.94 6.32
37.98 0.20 2.37 39.69 0.79
38.67 0.17 2.33 252.64 5.01
39.30 0.10 2.29 353.28 7.00
40.76 0.12 2.21 443.34 8.79
41.52 0.20 2.17 230.44 4.57
41.97 0.17 2.15 176.56 3.50
43.31 0.17 2.09 161.12 3.19
44.03 0.16 2.06 141.80 2.81
[表4]:結晶化合物A-HCl形式1之固態 19F NMR數據
ν(F1) [ppm]
1 -91
2 -103
熱分析:在乾氮氣下在Tzero鋁盤中在TA儀器公司Q1000/2000熱量計上,以50 ml/min流動,進行微差掃描熱量法(DSC)。在乾氮氣下在鉑盤中在TA儀器公司Q500分析儀上,以60 ml/min流動,進行熱重分析(TGA)。結晶化合物A-HCl形式1之DSC和TGA示出於圖2中。結晶化合物A-HCl形式1之典型DSC和TGA指示出271.5°C的熔融起始和在熔融和分解之前的約4%重量損失。
動態蒸汽吸附(DVS):使用表面測量系統公司(Surface Measurement Systems)DVSAdvantage儀器收集水分吸附數據。將平衡標準設定為10分鐘內重量變化 ± 0.001%,最大平衡時間為360分鐘。結晶化合物A-HCl形式1之水分吸附曲線示出於圖3中。結晶化合物A-HCl形式1之典型DVS顯示出在95% RH下小於約0.5%的重量增加。 單晶數據:在室溫下,從具有過量HCl的DMF、DMAC或NMP中生長出結晶化合物A-HCl形式1之單晶。將化合物A-HCl形式1之單一無色針形晶體用於單晶結構確定。選擇用於數據收集的試樣係具有大約尺寸0.29 x 0.08 x 0.06 mm 3的針。將晶體藉由巴拉通油(paratone oil)安裝在布魯克公司APEX-II CCD繞射儀上的尼龍環上。在數據收集期間,使晶體保持在穩態 T= 173(2) K。使用Intrinsic Phasing解析方法並且藉由使用 Olex2(Dolomanov等人, 2009)作為圖形介面,用ShelXT(Sheldrick, G.M. (2015). Acta Cryst. [晶體學報] A71, 3-8)結構解析程式解析結構。用使用最小平方最小化的2018/3版ShelXL(Sheldrick, Acta Cryst. [晶體學報] A64 2008, 112-122)精修模型。表5示出了結晶化合物A-HCl形式1之晶體學數據匯總。如從X射線晶體結構確定發現的結晶化合物A-HCl形式1之分子結構示出於圖5中。
[表5]:結晶化合物A-HCl形式1之X射線單晶體學數據匯總:
波長 1.5418 Å
晶系 單斜
空間群 P2 1/n
晶胞 a = 8.9026 Å
   b = 13.8562 Å
   c = 23.5472 Å
   α = 90°
   β = 94.987°
   γ = 90°
體積 2893.7 Å 3
Z 4
密度(計算值) 1.380 Mg/m 3
絕對結構參數 NA*
*中心對稱的
實例 2 :結晶化合物 A-HCl 形式 2
在高通量漿化條件下用在90/10丙酮/水溶劑中之一當量HCl產生結晶化合物A-HCl形式2。此亞穩態形式具有低熔點並且不能放大或再現。
X射線粉末繞射:結晶化合物A-HCl形式2材料之XRPD圖譜示出於圖7中。
熱分析:結晶化合物A-HCl形式2之DSC示出於圖8中。結晶化合物A-HCl形式2之典型DSC指示出113.2°C的熔融起始。
實例 3 :無定形化合物 A-HCl
將無定形化合物A-HCl從在甲醇中的旋轉蒸發中分離出,並且顯示出具有一或多個寬峰之X射線無定形。玻璃轉換溫度(T g)係124°C,如藉由調製DSC分析(MDSC)(圖9)所示的。化合物在165°C至180°C下加熱時轉化為結晶化合物A-HCl形式1。化合物在用水加壓力時轉化為結晶化合物A-HCl形式1和化合物A水合物形式2。
實例 4 :結晶化合物 A-MsA 形式 1
藉由在環境條件下將一莫耳當量甲磺酸和化合物A在乙腈中漿化來製備結晶化合物A-MsA形式1。藉由在具有頂置式攪拌器的梅特勒-托利多公司EasyMax控制的實驗室反應器中在60°C下將3 g化合物A溶解於乙酸乙酯(30 ml)中來以更大規模製備克水平。添加一莫耳當量甲磺酸(350 µl),並且觀察到沈澱。將漿料在60°C下老化8小時,並且然後以0.1°C/min冷卻至20°C。在20°C下老化過夜之後藉由真空過濾分離固體。將濕餅用乙酸乙酯(15 ml)洗滌。XRPD分析指示濕餅係化合物A-MsA形式1。然後將濕餅在環境溫度下真空乾燥4天並表徵。產率係89%。
X射線粉末繞射:結晶化合物A-MsA形式1材料之XRPD圖譜示出於圖10中,並且XRPD峰列出於表6中。
[表6]:結晶化合物A-MsA形式1之XRPD數據:
位置 [°2θ] FWHM [°2θ] d- 間距 [Å] 高度 [cts] 相對強度 [%]
5.7617 0.1171 15.33923 3563.27 31.19
6.9624 0.1506 12.69635 7042.91 61.65
10.3789 0.1506 8.5234 1384.44 12.12
11.4149 0.1004 7.75206 1349.12 11.81
11.757 0.1004 7.52727 2469.54 21.62
12.6462 0.1171 6.99991 4221.79 36.96
13.2625 0.184 6.676 1562.02 13.67
13.5157 0.184 6.55151 2979.83 26.09
13.9748 0.1506 6.33726 1876.93 16.43
15.2984 0.2509 5.79185 4150.19 36.33
15.7192 0.1171 5.63773 6578.37 57.59
16.0526 0.1338 5.52139 3477.55 30.44
16.5226 0.1338 5.36536 11423.3 100
17.3718 0.1673 5.10495 6589.9 57.69
18.0232 0.1673 4.92188 3151.82 27.59
18.4749 0.1506 4.80257 4712.45 41.25
19.0636 0.1338 4.65555 986.66 8.64
20.0335 0.184 4.43231 6106.14 53.45
20.5715 0.1171 4.31758 3925.51 34.36
20.9518 0.2007 4.24007 5418.76 47.44
22.0197 0.1338 4.03679 1294.16 11.33
22.5862 0.1004 3.9368 1497.18 13.11
22.9684 0.1338 3.87216 1723.17 15.08
23.1804 0.2007 3.83722 2033.44 17.8
23.9206 0.184 3.72013 7336.95 64.23
25.1798 0.2007 3.53687 2531.92 22.16
25.9079 0.2007 3.43911 1506.44 13.19
26.783 0.368 3.32869 1541.01 13.49
28.0224 0.1673 3.18422 1898.47 16.62
28.5556 0.1338 3.12597 899.77 7.88
29.4476 0.2676 3.03328 499.68 4.37
30.4832 0.368 2.93255 1823.75 15.97
31.9437 0.2007 2.80173 433.97 3.8
32.4773 0.1338 2.7569 977.85 8.56
32.8882 0.2007 2.72339 757.89 6.63
33.4218 0.1338 2.68112 398.32 3.49
34.7631 0.4015 2.58069 207.81 1.82
36.3258 0.5353 2.47317 143.17 1.25
37.1502 0.2007 2.42017 108.9 0.95
38.7259 0.3346 2.32525 207.39 1.82
結晶化合物A-MsA形式1之指標化解析:XRPD指標化係可用於提取資訊並説明解釋XRPD圖譜之方法。XRPD指標化係確定負責XRPD圖譜中之一組峰之結晶組分的晶體學晶胞之大小、形狀和對稱性的過程。用Cu-Kα輻射收集結晶化合物A-MsA形式1,並且指標化結果製錶於下表7中。
[表7]:結晶化合物A-MsA形式1的XRPD數據之指標化結果:
布拉維(Bravais)晶格類型 簡單單斜
a [Å] 16.157
b [Å] 7.860
c [Å] 26.462
α [度] 90
β [度] 106.71
γ [度] 90
體積 [Å 3/晶胞] 3,218.6
手性內容? 未指定
消光符號 P 1 2 1/n 1
空間群 P2 1/n (14)
熱分析:結晶化合物A-MsA形式1之DSC和TGA示出於圖11中。結晶化合物A-MsA形式1之典型DSC指示在250°C處的熔融起始。結晶化合物A-MsA形式1之TGA顯示出在分解前0.2%的重量損失。
吸濕性分析:結晶化合物A-MsA形式1之吸濕曲線示出於圖12中。結晶化合物A-MsA形式1之典型DVS顯示出在95% RH下約1.2%的重量增加。
實例 5 :結晶化合物 A-MsA 形式 2
藉由在環境條件下將一當量MSA和化合物A在90/10 THF/水v/v溶劑中漿化來製備結晶化合物A-MsA形式2。
X射線粉末繞射:結晶化合物A-MsA形式2材料之XRPD圖譜示出於圖14中。
熱分析:結晶化合物A-MsA形式2之DSC示出於圖15中。結晶化合物A-MsA形式2之典型DSC指示出38.0°C和177.1°C吸熱事件之熔融起始。結晶化合物A-MsA形式2之TGA顯示出在分解前約0.3%的重量損失(參見圖16)。
實例 6 :結晶化合物 A-TsA 形式 1 和形式 5
藉由在環境條件下將一莫耳當量對甲苯磺酸和化合物A在乙腈中漿化來製備結晶化合物A-TsA形式1。
X射線粉末繞射:結晶化合物A-TsA形式1材料之XRPD圖譜示出於圖17中。
結晶化合物A-TsA形式1之可變溫度X射線繞射(VTXRD)顯示出在 ≥ 180°C溫度處的重結晶,並且新的結晶形式被指定為結晶化合物A-TsA形式5。VTXRD圖譜示出於圖18中。
熱分析:結晶化合物A-TsA形式1之DSC和TGA圖譜示出於圖19中。結晶化合物A-TsA形式1之典型DSC指示出193.9°C和258.4°C吸熱事件之起始。結晶化合物A-TsA形式1之TGA顯示出在分解前約0.07%的重量損失。
實例 7 :結晶化合物 A-TsA 形式 3
藉由在環境條件下將一莫耳當量對甲苯磺酸和化合物A在90/10 EtOH/水v/v中漿化來製備結晶化合物A-TsA形式3。
X射線粉末繞射:結晶化合物A-TsA形式3之XRPD圖譜示出於圖22中。
熱分析:結晶化合物A-TsA形式3之DSC和TGA圖譜示出於圖23中。結晶化合物A-TsA形式3之典型DSC指示出161.0°C和248.9°C吸熱事件之起始。結晶化合物A-TsA形式3之TGA顯示出在分解前約0.48%的重量損失。
實例 8 :結晶化合物 A-TsA 形式 4
藉由在環境條件下將一莫耳當量對甲苯磺酸和化合物A在EtOH中漿化來製備結晶化合物A-TsA形式4。替代性地,該化合物還從化合物A-TsA形式1在以下條件下的真空乾燥中產生:在95°C至103°C的溫度下持續1天且然後在107°C至109°C的溫度下持續3天;或在150°C至170°C下持續1天。
藉由對TSA鹽形式1之化合物A-異丙醇溶劑合物進行去溶劑化來製備放大的化合物A-TsA鹽形式4。該程序涉及在具有頂置式攪拌器的梅特勒-托利多公司EasyMax控制的實驗室反應器中在60°C下將3.5 g化合物A和1莫耳當量對甲苯磺酸(1.08 g)在異丙醇(60 ml)中攪拌。將漿料在60°C下攪拌1天,並且以0.1°C/min冷卻至20°C。將固體藉由真空過濾分離並且用異丙醇(10 ml)洗滌兩次。XRPD分析指示材料由甲苯磺酸鹽形式1和微量游離形式異丙醇溶劑合物之混合物構成。為了試圖完成反應,在環境溫度下將固體在具有約0.15莫耳當量對甲苯磺酸(0.21 g)的異丙醇(30 ml)中再漿化4天。將固體藉由真空過濾分離並且用異丙醇(10 ml)洗滌兩次。XRPD分析指示固體由甲苯磺酸鹽形式1構成並且仍含有痕量的游離形式異丙醇溶劑合物。在60°C下將固體再次用在異丙醇(50 ml)中的0.25莫耳當量對甲苯磺酸(0.34 g)再漿化。在攪拌1天之後藉由真空過濾分離固體。將濕餅用異丙醇(15 ml)洗滌並且藉由XRPD分析。XRPD圖譜與化合物A-TsA鹽形式1和微量化合物A-TsA鹽形式4一致。在145°C下真空乾燥材料導致向化合物A-TsA鹽形式4之完全轉化(根據XRPD)。結晶化合物A-TsA形式4材料之XRPD圖譜示出於圖24a中,並且XRPD峰列出於表7中。
[表7]:結晶化合物A-TsA形式4之XRPD數據
位置 [°2θ] FWHM [°2θ] d- 間距 [Å] 高度 [cts] 相對強度 [%]
6.202 0.0836 14.25126 11841.62 100
8.3596 0.0669 10.57727 862.73 7.29
10.485 0.1171 8.4374 1865.49 15.75
11.1414 0.0836 7.94174 551.39 4.66
12.1296 0.0669 7.29686 779.83 6.59
12.4404 0.0836 7.11527 1853.58 15.65
12.9743 0.0669 6.82362 774.13 6.54
13.129 0.0669 6.74358 977.91 8.26
14.2446 0.1004 6.21785 3903.03 32.96
14.6709 0.0836 6.03811 9322.96 78.73
14.8356 0.0502 5.97147 2122.89 17.93
15.5616 0.1004 5.69447 1034.9 8.74
16.4028 0.1004 5.40427 1127.73 9.52
16.7652 0.0836 5.28828 347.28 2.93
17.0513 0.0669 5.20018 378.6 3.2
17.6527 0.1004 5.02433 3101.72 26.19
18.331 0.1004 4.83993 1556.97 13.15
18.6311 0.1171 4.76264 2952.46 24.93
19.0787 0.1004 4.65191 4994.87 42.18
20.1393 0.1171 4.40924 1475.66 12.46
20.8195 0.1338 4.2667 1419.22 11.98
21.47 0.1004 4.13888 3668.99 30.98
21.8269 0.0836 4.07201 644.54 5.44
22.3718 0.1506 3.97404 2361.38 19.94
23.0541 0.0669 3.85796 516.62 4.36
23.4894 0.1338 3.78744 4553.16 38.45
24.1138 0.1673 3.69076 1930.58 16.3
24.3771 0.1171 3.65149 717.86 6.06
25.1314 0.0836 3.54357 990.68 8.37
25.2663 0.0836 3.52496 1313.91 11.1
25.4626 0.1004 3.49823 879.29 7.43
26.1153 0.1171 3.41226 751.94 6.35
26.5717 0.0836 3.35468 434.08 3.67
26.9761 0.0836 3.3053 711.31 6.01
28.6593 0.0836 3.11489 1044.32 8.82
29.0205 0.1506 3.07694 1315.89 11.11
29.5827 0.1004 3.01973 526.68 4.45
29.932 0.2007 2.98528 624.8 5.28
30.3779 0.2007 2.94247 321.63 2.72
30.7184 0.1171 2.91063 272.55 2.3
31.1915 0.1338 2.86755 235.81 1.99
32.7035 0.2342 2.73835 148.16 1.25
33.71 0.1171 2.65885 200.45 1.69
34.1773 0.1673 2.62357 235.65 1.99
35.1349 0.0836 2.55422 478.92 4.04
36.7215 0.1673 2.44742 226.97 1.92
37.7829 0.2007 2.38108 112.12 0.95
38.3197 0.2342 2.34895 204.82 1.73
38.6344 0.2007 2.33054 201.61 1.7
39.7904 0.0669 2.26546 288.15 2.43
單晶數據:表8示出了結晶化合物A-TsA形式4之晶體學數據匯總。如從X射線晶體結構確定發現的結晶化合物A-TsA形式4之分子結構示出於圖24b中。
[表8]:結晶化合物A-TsA形式4之X射線單晶體學數據匯總:
波長 _1.542 Å
晶系 正交晶
空間群 Pbcn
晶胞 a = 24.7407 Å
   b = 10.7567 Å
   c = 26.4846 Å
   α = 90°
   β = 90°
   γ = 90°
體積 7048.3 Å 3
Z 8
密度(計算值) 1.391 Mg/m 3
熱分析:結晶化合物A-TsA形式4之DSC和TGA圖譜示出於圖25中。結晶化合物A-TsA形式4之典型DSC指示在253°C處的熔融起始。結晶化合物A-TsA形式4之TGA顯示出在分解前0.145%的重量損失。
固態NMR:結晶化合物A-TsA形式4之固態 19F NMR波譜示出於圖26中,該圖指示出在-96.93和-101.60 ppm處的2個峰。
實例 9 :結晶化合物 A-TsA 形式 5
藉由將結晶化合物A-TsA形式1加熱至高於180°C來製備結晶化合物A-TsA形式5。
X射線粉末繞射:XRPD圖譜示出於圖27中。
實例 10 :結晶化合物 A-DiTsA 形式 6
藉由在高通量背景中將兩莫耳當量對甲苯磺酸和化合物A在乙腈中漿化來製備結晶化合物A-DiTsA形式6。化合物之放大嘗試未成功。
X射線粉末繞射:XRPD圖譜示出於圖28中。
實例 11 :結晶化合物 A- 硫酸鹽形式 1
藉由在環境條件下將一當量硫酸和化合物A在乙腈中漿化來製備結晶化合物A-硫酸鹽形式1。
X射線粉末繞射:XRPD圖譜示出於圖30中。
熱分析:結晶化合物A-硫酸鹽形式1之DSC和TGA示出於圖31中。結晶化合物A-硫酸鹽形式1之典型DSC指示出在182.3°C和263.7°C吸熱事件處的起始。結晶化合物A-硫酸鹽形式1之TGA顯示出在分解前6.47%的重量損失。
吸濕性分析:結晶化合物A-硫酸鹽形式1之吸濕曲線示出於圖32中。結晶化合物A-硫酸鹽形式1之動態蒸汽吸附(DVS)表明硫酸鹽在90% RH下潮解。
實例 12 :無定形化合物 A
藉由將1.99 g化合物A-可變水合物形式2(參見實例# 13)溶解於100 mL丙酮中並且振盪以形成黃色溶液來製備無定形化合物A。然後將溶液以2 mL/min的噴霧速率噴霧乾燥,其中入口溫度為54°C,出口溫度為54°C,抽吸器在95%下,乾燥空氣流量為0.55 kg/min,噴嘴空氣在6.0 sL/min下並且噴嘴冷卻在20°C下。收集無定形產物,並且在40°C下、具有-10巴壓力的真空爐下乾燥2.5小時以除去殘餘丙酮。
X射線粉末繞射:無定形化合物A之XRPD圖譜示出於圖33中。
熱分析:無定形化合物A之DSC示出於圖38中。無定形化合物A之典型DSC指示出在91°C處的玻璃轉換溫度(T g)。無定形化合物A之TGA-IR示出於圖34中。無定形化合物A之TGA-IR顯示出在100°C以下水分子之1.05%重量損失,如圖35所示。
實例 13 :化合物 A- 可變水合物形式 2
藉由將化合物A-甲醇形式1和化合物A-乙醇形式1產物的混合物在水中漿化24小時來製備化合物A-可變水合物形式2。然後過濾和空氣乾燥產物。
替代性地,藉由將化合物A在甲醇和乙醇溶劑混合物中混合來製備化合物A-可變水合物形式2。化合物A首先形成化合物A-甲醇和化合物A-乙醇溶劑合物混合物,然後將其在水中漿化以引發向化合物A-可變水合物形式2產物的轉化。為了實現完全轉化,將化合物A-可變水合物形式2產物過濾,並且在升高的溫度(例如50C)下乾燥過夜以除去所有剩餘有機溶劑。
X射線粉末繞射:化合物A-可變水合物形式2之XRPD圖譜示出於圖36中,並且XRPD峰列出於表9中。
[表9]:結晶化合物A-可變水合物形式2之XRPD數據。
位置 [°2θ] FWHM [°2θ] d- 間距 [Å] 高度 [cts] 相對強度 [%]
3.5259 0.0465 25.05944 3874.4 9.47
7.0727 0.0465 12.49861 817.33 2
8.4034 0.0697 10.52216 249.56 0.61
10.0657 0.0465 8.78788 7370.33 18.02
10.6175 0.0697 8.33241 210.38 0.51
11.1919 0.0465 7.90602 13007.2 31.81
11.6612 0.0465 7.58891 766.31 1.87
13.1983 0.0697 6.70835 236.22 0.58
13.858 0.0581 6.39044 16389.41 40.08
14.7185 0.0581 6.01871 1238.31 3.03
15.7803 0.0465 5.61604 1430.57 3.5
16.2049 0.0581 5.46983 40895.73 100
16.3899 0.0465 5.40851 7422.06 18.15
17.2502 0.0348 5.14065 3019.89 7.38
17.3745 0.0465 5.10417 3630.09 8.88
17.7541 0.0581 4.99588 717.93 1.76
18.1174 0.0581 4.8965 2212.42 5.41
18.4171 0.0697 4.81749 3123.43 7.64
18.6966 0.0581 4.74611 4195.83 10.26
19.3851 0.0465 4.57908 7495.87 18.33
19.5557 0.0581 4.53951 18007.58 44.03
19.9635 0.0581 4.44769 5786.34 14.15
20.2172 0.0581 4.39244 3988.37 9.75
20.7733 0.0465 4.27609 400.1 0.98
21.1641 0.0929 4.19801 1496.44 3.66
21.9302 0.0929 4.05307 400.41 0.98
22.4926 0.0465 3.95297 2032.91 4.97
22.6875 0.0465 3.91945 4501.02 11.01
22.9495 0.0465 3.8753 3327.64 8.14
23.2126 0.0708 3.8288 8736.19 21.36
23.2929 0.0425 3.82526 8096.88 19.8
24.0078 0.1133 3.70374 821.54 2.01
25.0842 0.0708 3.5472 683.37 1.67
25.6238 0.0992 3.47371 1376.56 3.37
26.0061 0.0992 3.4235 6312.46 15.44
26.5611 0.0708 3.35322 1159.46 2.84
27.0761 0.085 3.29059 1684.78 4.12
27.5641 0.085 3.23343 3930.25 9.61
27.9337 0.0708 3.19149 961.99 2.35
28.1181 0.0708 3.17097 1269.02 3.1
28.5516 0.0992 3.12381 1112.73 2.72
29.8219 0.1417 2.99358 411.91 1.01
30.2018 0.1133 2.95677 311.5 0.76
30.8316 0.0992 2.8978 1695.28 4.15
31.2945 0.085 2.85598 483.95 1.18
31.6143 0.085 2.82782 997.71 2.44
32.0573 0.0567 2.78974 929.07 2.27
32.2146 0.0567 2.77648 1013.24 2.48
32.9146 0.0567 2.71901 791.51 1.94
33.1229 0.0567 2.70239 1184.3 2.9
33.5895 0.1133 2.66591 219.49 0.54
34.5176 0.0708 2.59633 365.15 0.89
35.286 0.2267 2.54153 211.54 0.52
35.9712 0.1133 2.49467 323.7 0.79
36.9248 0.0567 2.43241 1163.96 2.85
37.5393 0.1417 2.39398 184.66 0.45
38.5019 0.0567 2.33632 401.22 0.98
39.0919 0.1133 2.3024 351.71 0.86
熱分析:化合物A-可變水合物形式2之DSC示出於圖37中。化合物A-可變水合物形式2之典型DSC指示出51°C的脫水起始和136°C的熔點。化合物A-可變水合物形式2之TGA示出於圖38中。化合物A-可變水合物形式2之TGA顯示出在100°C以下水分子之2.0%重量損失。
吸濕性分析:化合物A-可變水合物形式2之吸濕曲線示出於圖39中。化合物A-可變水合物形式2之動態蒸汽吸附(DVS)顯示出在95% RH下約3.4%的重量增加。
實例 14 :無水化合物 A 形式 3
藉由將化合物A-THF溶劑合物加熱至150°C的溫度,保持3分鐘,然後在RT下平衡來獲得無水化合物A形式3。
X射線粉末繞射:無水化合物A形式3之XRPD圖譜示出於圖40中。
熱分析:無水化合物A形式3之DSC示出於圖41中。無水化合物A形式3之典型DSC指示出196.5°C的熔融起始。
吸濕性分析:將無水化合物A形式3之吸濕曲線示出於圖42中。無水化合物A形式3之動態蒸汽吸附(DVS)顯示出在95% RH下約1.5%的重量增加。
實例 15 :無水化合物 A 形式 4
藉由在40°C下將混合的無水化合物A形式3和化合物A-可變水合物形式2(實例13)在庚烷中漿化5天來獲得無水化合物A形式4。
X射線粉末繞射:無水化合物A形式4之XRPD圖譜示出於圖43中。
實例 16 :無水化合物 A 形式 5
藉由在70°C的溫度下將350 mg無水化合物A形式3和化合物A-可變水合物形式2(實例13)混合物在18 mL庚烷中漿化一天來獲得無水化合物A形式5。然後將固體從熱板移除並過濾,並且用5 mL庚烷洗滌;然後用氮氣流下乾燥過夜。
X射線粉末繞射:無水化合物A形式5之XRPD圖譜示出於圖44中。
熱分析:無水化合物A形式5之DSC和TGA圖譜示出於圖45中。無水化合物A形式5之典型DSC指示出136.5°C的熔融起始。無水化合物A形式5之TGA顯示出0.17%重量損失。
吸濕性分析:將無水化合物A形式5之吸濕曲線示出於圖46中。無水化合物A形式5之動態蒸汽吸附(DVS)顯示化合物再水合為化合物A-可變水合物形式2(實例13)。
實例 17 :無水化合物 A 形式 6
藉由在80°C的溫度下將無水化合物A形式3和化合物A-可變水合物形式2(實例13)混合物在庚烷中漿化過夜來獲得無水化合物A形式6。
X射線粉末繞射:無水化合物A形式6之XRPD圖譜示出於圖47中。
熱分析:無水化合物A形式6之DSC和TGA示出於圖48中。無水化合物A形式6之典型DSC指示出186.4°C的起始。無水化合物A形式6之TGA顯示出0.38%重量損失。
實例 18 :無水化合物 A 形式 7
藉由在70°C的溫度下將無水化合物A形式3和化合物A-可變水合物形式2(實例13)在庚烷中漿化3天來獲得無水化合物A形式7。
X射線粉末繞射:無水化合物A形式7之XRPD圖譜示出於圖49中。
實例 19 :無水化合物 A 形式 8
藉由在50°C的溫度下將無水化合物A形式3和化合物A-可變水合物形式2(實例13)在甲苯中漿化3天來獲得無水化合物A形式8。
X射線粉末繞射:無水化合物A形式8之XRPD圖譜示出於圖50中。
熱分析:無水化合物A形式8之DSC和TGA示出於圖51中。無水化合物A形式8之典型DSC指示出156.3°C和185.9°C的熔融起始。無水化合物A形式8之TGA顯示出0.73%重量損失。
實例 20 :結晶化合物 A 形式 1
為了獲得結晶化合物A形式1,將化合物A藉由使用預裝填的Redi Sep柱(12 g)和使用在庚烷中的20%至100% EtOH作為洗脫液的組合式急速矽膠柱層析法進行純化。然後,將具有期望產物的級分減壓濃縮,並且將殘餘物溶解於乙腈/水溶劑混合物中並冷凍乾燥。
X射線粉末繞射:結晶化合物A形式1之XRPD圖譜示出於圖52中。
實例 21 :結晶化合物 A-THF 溶劑合物。
藉由將化合物A在以下多種溶劑中漿化來製備結晶化合物A-THF溶劑合物:即,a) 50 mg/mL THF溶液;b) 50-50 THF/水混合物;c) 50-50 THF/甲醇混合物;或d) 50-25-25 THF-NMP-水混合物。
X射線粉末繞射:結晶化合物A-THF溶劑合物之XRPD圖譜示出於圖53中。
熱分析:結晶化合物A-THF溶劑合物之DSC和TGA示出於圖54中。結晶化合物A-THF溶劑合物之典型DSC指示出122.6°C的熔融起始和在191.5°C處的去溶劑化起始。結晶化合物A-THF溶劑合物之TGA顯示出11.4%重量損失,這對應於1莫耳當量THF分子之去溶劑化吸熱。
單晶數據:表10示出了結晶化合物A-THF溶劑合物之晶體學數據匯總。
[表10]:結晶化合物A-THF溶劑合物之X射線單晶體學數據匯總:
波長 0.71073 Å
晶系 三斜晶系
空間群 P-1
晶胞 a = 9.36460(10) Å
   b = 10.6617(2) Å
   c = 16.2424(3) Å
   α = 79.3910(10)°
   β = 80.7010(10)°
   γ = 79.6150(10)º
體積 1553.94(4) Å 3
Z 2
密度(計算值) 1.357 Mg/m 3
實例 22 :結晶化合物 A- 乙醇溶劑合物。
藉由將化合物A在乙醇中漿化來製備結晶化合物A-乙醇溶劑合物。
X射線粉末繞射:結晶化合物A-乙醇溶劑合物之XRPD圖譜示出於圖55中。
熱分析:結晶化合物A-乙醇溶劑合物之TGA示出於圖56中。結晶化合物A-乙醇溶劑合物之TGA顯示出7.58%重量損失,這對應於一莫耳當量乙醇分子的損失。結晶化合物A-乙醇溶劑合物之DSC示出於圖57中。結晶化合物A-乙醇溶劑合物之典型DSC指示出131.8°C、165.6°C和198.1°C吸熱事件之起始。
實例 23 :結晶化合物 A- 丙醇溶劑合物。
藉由將化合物A在1-丙醇中漿化來製備結晶化合物A-丙醇溶劑合物。
X射線粉末繞射:結晶化合物A-丙醇溶劑合物之XRPD圖譜示出於圖58中。
熱分析:結晶化合物A-丙醇溶劑合物之TGA和DSC示出於圖59中。結晶化合物A-丙醇溶劑合物之TGA顯示出9.95%重量損失,這對應於一莫耳當量1-丙醇分子的損失。結晶化合物A-丙醇溶劑合物之典型DSC指示出112.2°C和194.2°C的熔融起始。
實例 24 :結晶化合物 A- 異丙醇( IPA )溶劑合物。
藉由將化合物A在50-50 1-丙醇/水混合物中漿化來製備結晶化合物A-IPA溶劑合物。
X射線粉末繞射:結晶化合物A-IPA溶劑合物之XRPD圖譜示出於圖60中。
熱分析:結晶化合物A-IPA溶劑合物之TGA和DSC示出於圖61中。結晶化合物A-IPA溶劑合物之TGA顯示出8.5%重量損失,這對應於一莫耳當量異丙醇分子的損失。結晶化合物A-IPA溶劑合物之典型DSC指示出114.6°C、158.7°C和194.9°C吸熱事件之起始。
實例 25 :結晶化合物 A- 甲醇溶劑合物。
藉由將化合物A在甲醇中漿化來製備結晶化合物A-甲醇溶劑合物。
X射線粉末繞射:結晶化合物A-甲醇溶劑合物之XRPD圖譜示出於圖62中。
實例 26 :結晶化合物 A- 乙酸異丙酯( IPAc )溶劑合物。
藉由將化合物A在乙酸異丙酯中漿化來製備結晶化合物A-IPAc溶劑合物。
X射線粉末繞射:結晶化合物A-IPAc溶劑合物之XRPD圖譜示出於圖63中。
實例 27 :結晶化合物 A- 丙酮溶劑合物。
藉由將化合物A在丙酮中漿化來製備結晶化合物A-丙酮溶劑合物。
X射線粉末繞射:結晶化合物A-丙酮溶劑合物之XRPD圖譜示出於圖64中。
實例 28 :結晶化合物 A- 環戊基甲基醚( CPME )溶劑合物。
藉由將化合物A在環戊基甲基醚中漿化來製備結晶化合物A-CPME溶劑合物。
X射線粉末繞射:結晶化合物A-CPME溶劑合物之XRPD圖譜示出於圖65中。
實例 29 :結晶化合物 A- 二㗁烷溶劑合物。
藉由將化合物A在二㗁烷中漿化來製備結晶化合物A-二㗁烷溶劑合物。
X射線粉末繞射:結晶化合物A-二㗁烷溶劑合物之XRPD圖譜示出於圖66中。
實例 30 :結晶化合物 A- 乙酸乙酯( EtoAc )溶劑合物。
藉由將化合物A在乙酸乙酯中漿化來製備結晶化合物A-EtOAc溶劑合物。
X射線粉末繞射:結晶化合物A-EtOAc溶劑合物之XRPD圖譜示出於圖67中。
實例 31 :結晶化合物 A- 乙腈( MeCN )溶劑合物。
藉由將化合物A在乙腈中漿化來製備結晶化合物A-MeCN溶劑合物。
X射線粉末繞射:結晶化合物A-MeCN溶劑合物之XRPD圖譜示出於圖68中。
實例 32 :結晶化合物 A- 甲基三級丁基醚( MTBE )溶劑合物。
藉由將化合物A在甲基三級丁基醚中漿化來製備結晶化合物A-MTBE溶劑合物。
X射線粉末繞射:結晶化合物A-CMTBE溶劑合物之XRPD圖譜示出於圖69中。
實例 33 :結晶化合物 A- 甲苯溶劑合物。
藉由在25°C下將化合物A在甲苯中漿化18小時來製備結晶化合物A-甲苯溶劑合物。
X射線粉末繞射:結晶化合物A-甲苯溶劑合物之XRPD圖譜示出於圖70中。
實例 34 :結晶化合物 A- 十二烷基硫酸鹽。
藉由在37°C下將100 mg化合物A-HCl在具有或不具有0.01 N HCl的0.5%十二烷基硫酸鈉(SDS)中漿化三小時來製備結晶化合物A-十二烷基硫酸鹽。將固體然後移除並過濾,然後用1 mL DI水洗滌,並且用氮氣流乾燥過夜。獲得新的晶體形式,並且溶液NMR分析指示出1 : 1 API : 十二烷基硫酸鹽比率,並且測定確認69%化合物A含量,這與一當量十二烷基硫酸鹽相關聯。
X射線粉末繞射:結晶化合物A-十二烷基硫酸鹽之XRPD圖譜示出於圖71中。
熱分析:結晶化合物A-十二烷基硫酸鹽之TGA和DSC示出於圖72中。結晶化合物A-十二烷基硫酸鹽之TGA顯示出21.1%重量損失。結晶化合物A-十二烷基硫酸鹽之典型DSC指示出75.8°C的熔融起始和在174.8°C處的分解。
實例 35 :結晶化合物 A- 二甲基甲醯胺( DMF )溶劑合物水合物。
藉由將化合物A-HCl形式1溶解於DMF溶劑中來製備結晶化合物A-DMF溶劑合物水合物。然後將溶液過濾以從溶液中除去剩餘固體顆粒。將澄清溶液在室溫下在通風櫃中靜置以進行慢溶劑蒸發。在一週之後觀察到單晶。
X射線粉末繞射:結晶化合物A-DMF溶劑合物水合物之XRPD圖譜示出於圖73中。
熱分析:結晶化合物A-DMF溶劑合物水合物之DSC示出於圖74中。結晶化合物A-DMF溶劑合物水合物之典型DSC指示出107.8°C的熔融起始。
單晶數據:在提供的晶體之單晶結構中,DMF分子顯示為無序的,並且水分子精修0.25的部分占位元率。DMF分子顯示未與化合物A氫鍵合 表11示出了結晶化合物A-DMF溶劑合物水合物之晶體學數據匯總。
[表11]:結晶化合物A-DMF溶劑合物水合物之X射線單晶體學數據匯總:
波長 0.710730 Å
晶系 三斜晶系
空間群 P-1
晶胞 a = 9.289(2) Å
   b = 10.897(2) Å
   c = 16.619(4) Å
   α = 100.605(2)°
   β = 106.204(2)°
   γ = 99.216(6)º
體積 1547.5(6)Å 3
Z 2
密度(計算值) 1.378 Mg/m 3
實例 36 :結晶化合物 A- 二甲基乙醯胺( DMAC )溶劑合物。
藉由將化合物A-HCl形式1溶解於DMAC溶劑中來製備結晶化合物A-DMAC溶劑合物。然後將溶液過濾以從溶液中除去剩餘固體顆粒。將澄清溶液在室溫下在通風櫃中靜置以進行慢溶劑蒸發。在一週之後觀察到單晶。
X射線粉末繞射:結晶化合物A-DMAC溶劑合物之XRPD圖譜示出於圖75中。
熱分析:結晶化合物A-DMAC溶劑合物之DSC示出於圖76中。結晶化合物A-DMAC溶劑合物之典型DSC指示出約150°C的熔融起始。
單晶數據:在提供的晶體之單晶結構中,DMAC分子顯示為無序的。然而,DMAC分子仍顯示與化合物A氫鍵合 表12示出了結晶化合物A-DMAC溶劑合物之晶體學數據匯總。
[表12]:結晶化合物A-DMAC溶劑合物之X射線單晶體學數據匯總:
波長 0.710730 Å
晶系 三斜晶系
空間群 P-1
晶胞 a = 12.5010(15) Å
   b = 12.5268(15) Å
   c = 13.2651(15) Å
   α = 77.2990(10)°
   β = 65.6460(10)°
   γ = 61.1020(3)º
體積 1656.2(3) Å 3
Z 2
密度(計算值) 1.3333 Mg/m 3
實例 37 :結晶化合物 A- 單苯磺酸鹽水合物形式 1
藉由將92.6 mg化合物A和29.3 mg苯磺酸溶解於1 mL甲醇溶劑中來製備結晶化合物A-單苯磺酸鹽水合物形式1。然後將溶液在60°C下攪拌1天。產生漿液,並且藉由真空過濾來分離固體。將固體空氣乾燥1小時並且然後分析。
X射線粉末繞射:結晶化合物A-單苯磺酸鹽水合物形式1之XRPD圖譜示出於圖77中。
熱分析:結晶化合物A-單苯磺酸鹽水合物形式1之DSC和TGA示出於圖78中,該圖指示出約230.8°C的熔融起始。結晶化合物A-單苯磺酸鹽水合物形式1之TGA顯示出高達142.3°C下的約1.3%重量損失。
實例 38 :結晶化合物 A- 咖啡因共晶體形式 1
藉由使用1 : 1化合物A : 咖啡因莫耳比在乙腈中從70°C至5°C的慢冷卻實驗來製備化合物A-咖啡因共晶體形式1。所得產物含有與咖啡因共晶體形式1混合的剩餘化合物A起始材料以及未進一步鑒定的其他雜質。然後將所得產物藉由在氮氣流下將混合物在DSC爐中加熱至167°C來進一步純化以形成純化合物A-咖啡因共晶體形式1。
X射線粉末繞射:結晶化合物A-咖啡因共晶體形式1之XRPD圖譜示出於圖79中。結晶化合物A-咖啡因共晶體形式1之單晶結構數據製表於下表13中。
[表13]:結晶化合物A-咖啡因共晶體形式1之單晶數據:
波長 1.5418 Å
晶系 三斜晶系
空間群 P-1
晶胞 a = 11.2224 Å
   b = 11.5160 Å
   c = 14.1909 Å
   α = 96.317°
   β = 96.403°
   γ = 100.279°
體積 1777.40 Å 3
Z 4
密度(計算值) 1.418 Mg/m 3
熱分析:結晶化合物A-咖啡因共晶體形式1之DSC和TGA圖譜示出於圖80中。DSC指示出約169.5°C的熔融起始。結晶化合物A-咖啡因共晶體形式1之TGA顯示出高達135.3°C的約0.39%重量損失。
吸濕性分析:結晶化合物A-咖啡因共晶體形式1之吸濕曲線示出於圖81中。結晶化合物A-咖啡因共晶體形式1之動態蒸汽吸附(DVS)顯示出在約95% RH下低於0.20%的重量增加。
實例 39 :結晶化合物 A- 檸檬酸共晶體形式 1
藉由使用1 : 1化合物A : 檸檬酸莫耳比在乙酸乙酯中從70°C至5°C的慢冷卻實驗來獲得結晶化合物A-檸檬酸共晶體形式1。
X射線粉末繞射:結晶化合物A-檸檬酸共晶體形式1之XRPD圖譜示出於圖82中。用Cu-Kα輻射收集結晶化合物A-檸檬酸共晶體形式1,並且指標化結果製表於下表14中。
[表14]:結晶化合物A-檸檬酸共晶體形式1的XRPD數據之指標化結果:
布拉維晶格類型 三斜晶系
a [Å] 10.062
b [Å] 13.643
c [Å] 15.685
α [度] 107.03
β [度] 91.86
γ [度] 94.05
體積 [Å 3/晶胞] 2,505.5
手性內容? 未指定
消光符號 P -
空間群 P1 (1),PῙ (2)
熱分析:結晶化合物A-檸檬酸共晶體形式1之DSC和TGA示出於圖83中,該圖指示出約107.7°C的熔融起始。結晶化合物A-檸檬酸共晶體形式1之TGA顯示出高達140.2°C下0.8 mg的約6.3%重量損失。
實例 40 :結晶化合物 A- 檸檬酸共晶體形式 2
藉由使用1 : 2化合物A : 檸檬酸莫耳比在乙腈中從70°C至冷藏機溫度的慢冷卻實驗來獲得結晶化合物A-檸檬酸共晶體形式2。最初使樣本出油(oiled out)並且在5°C下攪拌3天,產生灰白色沈澱物。
X射線粉末繞射:結晶化合物A-檸檬酸共晶體形式2之XRPD圖譜示出於圖84中。用Cu-Kα輻射收集結晶化合物A-檸檬酸共晶體形式2,並且指標化結果製表於下表15中。
[表15]:結晶化合物A-檸檬酸共晶體形式2的XRPD數據之指標化結果:
布拉維晶格類型 三斜晶系
a [Å] 12.564
b [Å] 13.497
c [Å] 14.075
α [度] 115.41
β [度] 103.54
γ [度] 93.81
體積 [Å 3/晶胞] 2,057.8
手性內容? 未指定
消光符號 P -
空間群 P1 (1),PῙ (2)
熱分析:結晶化合物A-檸檬酸共晶體形式2之DSC和TGA圖譜示出於圖85中。DSC指示出約93.8°C的吸熱起始。結晶化合物A-檸檬酸共晶體形式2之TGA顯示出高達135.3°C下0.6 mg的約5.3%重量損失。
實例 41 :結晶化合物 A- 糖精 - 共晶體形式 1
藉由使用1 : 1化合物A : 糖精莫耳比在乙腈中從70°C至5°C的慢冷卻實驗來製備結晶化合物A-糖精共晶體形式1。
X射線粉末繞射:結晶化合物A-糖精共晶體形式1之XRPD圖譜示出於圖86中。用Cu-Kα輻射收集結晶化合物A-糖精共晶體形式1,並且指標化結果製表於下表16中。
[表16]:結晶化合物A-糖精共晶體形式1的XRPD數據之指標化結果:
布拉維晶格類型 三斜晶系
a [Å] 10.249
b [Å] 11.000
c [Å] 17.389
α [度] 91.62
β [度] 101.30
γ [度] 113.03
體積 [Å 3/晶胞] 1,757.2
手性內容? 未指定
消光符號 P -
空間群 P1 (1),PῙ (2)
熱分析:結晶化合物A-糖精共晶體形式1之DSC和TGA示出於圖87中。DSC指示出約177.0°C的熔融起始。結晶化合物A-糖精共晶體形式1之TGA顯示出高達100.2°C下0.3 mg的約2.2%重量損失。
吸濕性數據:結晶化合物A-糖精共晶體形式1之吸濕曲線示出於圖88中。結晶化合物A-糖精共晶體形式1之動態蒸汽吸附(DVS)顯示出在95% RH下約0.3%的重量增加。
實例 42 :結晶化合物 A-L- 酒石酸共晶體形式 1
藉由使用1 : 1化合物A : L-酒石酸莫耳比在乙腈中從70°C至5°C的慢冷卻實驗來製備結晶化合物A-L-酒石酸共晶體形式1。
X射線粉末繞射:結晶化合物A-L-酒石酸共晶體形式1之XRPD圖譜示出於圖89中。用Cu-Kα輻射收集結晶化合物A-L-酒石酸共晶體形式1,並且指標化結果製表於下表17中。
[表17]:結晶化合物A-L-酒石酸共晶體形式1的XRPD數據之指標化結果:
布拉維晶格類型 三斜晶系
a [Å] 10.417
b [Å] 12.106
c [Å] 15.398
α [度] 67.51
β [度] 76.14
γ [度] 81.86
體積 [Å 3/晶胞] 1,739.2
手性內容? 手性
消光符號 P -
空間群 P1 (1)
熱分析:結晶化合物A-L-酒石酸共晶體形式1之DSC和TGA示出於圖90中。DSC指示出約157.0°C的起始。結晶化合物A-酒石酸共晶體形式1之TGA顯示出高達140.2°C下0.2 mg的約2.5%重量損失。
吸濕性數據:結晶化合物A-L-酒石酸共晶體形式1之吸濕曲線示出於圖91中。結晶化合物A-L-酒石酸共晶體形式1之動態蒸汽吸附顯示出在95% RH下約4.75%的重量增加。
實例 43 :結晶化合物 A- 尿素共晶體形式 1
藉由使用2 : 1化合物A : 尿素莫耳比在乙腈中從70°C至在-15°C至-25°C之間的冷凍器溫度的慢冷卻實驗來製備結晶化合物A-尿素共晶體形式1。
X射線粉末繞射:結晶化合物A-尿素共晶體形式1之XRPD圖譜示出於圖92中。用Cu-Kα輻射收集結晶化合物A-尿素共晶體形式1,並且指標化結果製表於下表18中。
[表18]:結晶化合物A-尿素共晶體形式1的XRPD數據之指標化結果:
布拉維晶格類型 三斜晶系
a [Å] 10.754
b [Å] 11.715
c [Å] 13.612
α [度] 88.37
β [度] 87.73
γ [度] 81.51
體積 [Å 3/晶胞] 1,694.3
手性內容? 未指定
消光符號 P -
空間群 P1 (1),PῙ (2)
熱分析:結晶化合物A-尿素共晶體形式1之DSC和TGA示出於圖93中。DSC指示出約106.4°C的第一吸熱起始和約156.8°C的第二吸熱起始。結晶化合物A-尿素共晶體形式1之TGA顯示出高達155.2°C下0.5 mg的約4.5%重量損失。
吸濕性數據:結晶化合物A-尿素共晶體形式1之吸濕曲線示出於圖94中。結晶化合物A-尿素共晶體形式1之動態蒸汽吸附(DVS)顯示出在95% RH下小於40%的重量增加。
溶解度、粉末溶離度( PD )和固有溶離速率( IDR )測試
實例 44 :相比於非鹽化合物 A 之各種形式的化合物 A-HCl 形式 1 PD IDR 測試
在禁食狀態類比胃液(FaSSGF)、禁食狀態類比腸液(FaSSIF)、進食狀態類比腸液(FaSSIF)和水中測量化合物A和化合物A-HCl形式1之各種形式的溶解度。粉末溶離度測量測試結果顯示,結晶化合物A-HCl形式1表現出比化合物A-可變水合物形式2或化合物A-無水形式3更快的溶離度,但表現出比無定形化合物A更慢的溶離度。溶解度和IDR數據分別列出於表19和20中。數據顯示,結晶化合物A-HCl形式1相比於在此測試的任一種形式具有溶解度和IDR優勢。
[表19]:相比於各種化合物A形式的化合物A-HCl形式1之溶解度測試結果。
形式                                     介質 FaSSGF 溶解度( pH ), µg/mL FaSSIF 溶解度( pH ), µg/mL FeSSIF 溶解度( pH ), µg/mL 溶解度( pH ), µg/mL
Cmp A1-HCl 形式 1 6.3 ± 0.5 (1.6)^ 62.7 ± 9.0 (6.5)^ 437.1 ± 16.3 (5.0)^ 7.9 (1.14) 13 (1.58)
Cmp A- 可變水合物形式 2 20 (1.6)^ 10.6 (6.5)^ 144.5 (5.0)^ 243 (1.08) 23 (1.64)
Cmp A- 無水形式 3 99.3 (1.6)* 87 (6.5)* 352 (5.0)* 5.4 (8.0)*
Cmp = 化合物。^來自粉末溶離度測量的溶解度。*來自2 h時間點的溶解度,來自實驗結束時的pH
[表20]:相比於化合物A可變水合物形式2(參見實例13)和無定形化合物A形式的化合物A-HCl形式1之IDR測試結果。
形式 IDR ug/min*cm 2
Cmp A-HCl 形式 1 2.14
Cmp A- 可變水合物形式 2 0.42
無定形 Cmp A 36.2
Cmp = 化合物。
實例 45 :生物學數據
化合物A-HCl形式1、化合物A-無水形式3和無定形化合物A之狗交叉PK研究。
最初分配了總共3隻雄性狗進行研究。所有動物在給藥前至少八小時和在血液樣本收集的前四小時內禁食(如果適用,在以4小時收集間隔收集最後一次血液樣本後,在30分鐘內恢復食物)。
每隻動物接受含有化合物A的適當測試品溶液之口服管飼劑量(PO),如以下研究設計表中概述的。在整個給藥過程中連續攪拌口服管飼給藥溶液。在給藥後(在移除管飼管前)用大約10 mL自來水沖洗管飼管。在每個階段之劑量之間有最少10天清除期。
[表21]:狗交叉PK研究方案匯總
測試品 劑量途徑 媒介物 劑量水平 mg/kg 劑量體積 mL/kg 收集間隔
第1階段
Cmp A-HCl 形式 1 PO A 10 5 血液 a
第2階段
Cmp A- 無水形式 3 PO A 10 5 血液 a
第3階段
無定形 Cmp A PO a 10 5 血液 a
a在給藥前以及在給藥後0.25、0.5、1、2、4、6、8、24、48和72小時收集用於血漿的血液樣本。
狗PK交叉研究結果列出於表22中。如圖95所示的數據顯示,化合物A-HCl形式1具有比無定形化合物A形式更低的暴露量。然而,化合物A-HCl形式1相比於化合物A-無水形式3表現出暴露量的約2倍增加,比化合物A-無水形式3顯示出更高的溶解度。
[表22]:狗交叉PK研究結果:
形式 D 50/D 90 µm C max µM AUC t µM*Hr T max hr
Cmp A1-HCl 形式 1 19.6/36 4.7 ± 1.4 181 ± 79 6.0 ± 0
Cmp A- 無水形式 3 5.0/13.7 2.3 ± 0.2 69 ± 6 4.7 ± 1.2
無定形 Cmp A 9.9/20 6.9 ± 1.3 237 ± 68 6.7 ± 2.3
Cmp = 化合物。
實例 46 :相比於化合物 A-MsA A1-TsA 之化合物 A-HCl 形式 1 PD IDR 測試
在進食狀態類比腸液(FaSSIF)中在pH 6.5下測量化合物A-HCl形式1、化合物A-MsA形式1和化合物A-TsA形式4之溶解度。
所有三種鹽與化合物A相比在FaSSIF中顯示出更大的動力學溶解度和更快的溶離度。甲苯磺酸鹽(A-TsA或A-TSA)鹽形式4之溶離速率優於甲磺酸鹽(A-MsA或A-MSA)鹽形式1(其優於HCl鹽形式1)。所有三種鹽可以轉化為游離鹼,但在FaSSIF中維持過飽和一定時間,這指示在以藥物劑型使用時的潛在良好吸收。溶解度測試結果數據列出於表23中。
[表23]:化合物A-HCl形式1、化合物A-MsA(MSA)形式1和化合物A-TsA(TSA)形式4之溶解度測試結果。
形式                                     介質 FaSSIF 溶解度( pH ), µg/mL
Cmp A-HCl 形式 1 104.2 (6.5)
Cmp A-MSA 形式 1 133.0 (6.5)
Cmp A-TSA 形式 4 160.6 (6.5)
Cmp = 化合物。
提供前述描述僅為了清楚理解,而不應理解為無必要的限制,因為在本發明之範圍內的修改方案對熟悉該項技術者可能是清楚的。
貫穿本說明書及以下申請專利範圍,除非上下文另有要求,否則單詞「包含(comprise)」及變化形式諸如「包含(comprises/comprising)」應理解為隱含包括所陳述的整數或步驟或者整數或步驟的組,而不是排除任何其他整數或步驟或者整數或步驟的組。
貫穿本說明書,在組成物描述為包括組分或材料時,除非另有描述,否則設想該等組成物也可以基本上由或由所敘述的組分或材料之任何組合組成。同樣,在描述方法時,除非另有描述,否則設想該等方法也可以基本上由或由所敘述的步驟之任何組合組成。本文中說明性地揭露的本發明可以在不存在本文中未明確揭露的任何要素或步驟的情況下適當地實踐。
如在閱讀本揭露時對熟悉該項技術者清楚的,本文所述和說明的單獨實施方式中之每一個具有離散組分和特徵,其可以容易地與其他若干實施方式中之任一個之特徵分離或組合而不脫離本揭露之範圍或精神。任何所述方法可以按敘述事件之順序或邏輯上可能的任何其他順序進行。
本文中所揭露的方法及其單獨步驟之實踐可以人工和/或在電子設備輔助或由其提供的自動化下進行。雖然已參考特定實施方式描述了諸多方法,但熟悉該項技術者應容易瞭解到,可以使用執行與該等方法相關的動作的其他方式。例如,除非另有描述,否則可以在不脫離該方法之範圍或精神的情況下改變各步驟之順序。另外,一些單獨步驟可以組合、省略或進一步再分成其他步驟。
除非另有指示,否則本文的揭露內容之上下文中(尤其是在申請專利範圍之上下文中)術語「一個(種)(a/an)」、「該(the)」及類似參考物之使用應解釋為涵蓋單數和複數兩者。除非本文另有指示,否則本文有關值的範圍之敘述僅旨在用作個別地提及在該範圍內的每個單獨值之簡寫方法,並且每個單獨值併入說明書中,就如同在本文個別地敘述該值一般。除非另有指示,否則本文所提供的任何和所有實例、或示例性語言(例如,「諸如」)之使用旨在更好地說明本文之揭露內容且並非對本文之揭露內容的範圍之限制。說明書中的語言不應當被解釋為指示任何未要求保護的要素為實踐本文之揭露內容所必需的。
本文中所引用的所有專利、出版物和參考文獻均藉由援引以其全文併入本文中。在本揭露與所併入的專利、出版物和參考文獻之間出現衝突的情況下,應以本揭露為主。
[圖1]描繪了結晶化合物A-HCl形式1之X射線粉末繞射(「XRPD」)圖譜。
[圖2]描繪了結晶化合物A-HCl形式1之微差掃描熱量法(DSC)熱譜圖和熱重分析(TGA)。
[圖3]描繪了結晶化合物A-HCl形式1之動態蒸汽吸附(DVS)曲線。
[圖4]描繪了結晶化合物A-HCl形式1之固態 19F NMR。
[圖5]描繪了結晶化合物A-HCl形式1之單晶X射線晶體結構。
[圖6]描繪了化合物A-無水-形式3、化合物A-可變水合物形式2、化合物A-HCl形式1和化合物A-無定形形式之粉末溶離度。
[圖7]描繪了結晶化合物A-HCl形式2之XRPD圖譜。
[圖8]描繪了結晶化合物A-HCl形式2之DSC熱譜圖。
[圖9]描繪了化合物A-HCl的無定形形式之調製DSC。
[圖10]描繪了結晶化合物A-MsA形式1之XRPD圖譜。
[圖11]描繪了結晶化合物A-MsA形式1之DSC熱譜圖和TGA。
[圖12]描繪了結晶化合物A-MsA形式1之DVS水分吸附曲線。
[圖13]描繪了結晶化合物A-MsA形式1之固態 19F NMR。
[圖14]描繪了結晶化合物A-MsA形式2之XRPD圖譜。
[圖15]描繪了結晶化合物A-MsA形式2之DSC熱譜圖。
[圖16]描繪了結晶化合物A-MsA形式2之TGA。
[圖17]描繪了結晶化合物A-TsA形式1之XRPD圖譜。
[圖18]描繪了結晶化合物A-TsA形式1之可變溫度X射線繞射(VTXRD),其顯示出在 ≥ 180°C處重結晶並形成新的結晶化合物A-TsA形式5。
[圖19]描繪了結晶化合物A-TsA形式1之DSC熱譜圖和TGA。
[圖20]描繪了結晶化合物A-TsA形式2之XRPD圖譜。
[圖21]描繪了結晶化合物A-TsA形式2之DSC熱譜圖和TGA。
[圖22]描繪了結晶化合物A-TsA形式3之XRPD圖譜。
[圖23]描繪了結晶化合物A-TsA形式3之DSC熱譜圖和TGA。
[圖24A]描繪了結晶化合物A-TsA形式4之XRPD圖譜。
[圖24B]描繪了結晶化合物A-TsA形式4之單晶X射線晶體結構。
[圖25]描繪了結晶化合物A-TsA形式4之DSC熱譜圖和TGA。
[圖26]描繪了結晶化合物A-TsA形式4之固態 19F NMR。
[圖27]描繪了結晶化合物A-TsA形式5之XRPD圖譜。
[圖28]描繪了結晶化合物A-DiTsA形式6之XRPD圖譜。
[圖29]描繪了化合物A-HCl鹽形式1、化合物A-甲磺酸鹽形式1和化合物A-甲苯磺酸鹽形式4在禁食模擬小腸液(FaSSIF)中的粉末溶離度和動力溶解度。
[圖30]描繪了結晶化合物A-硫酸鹽形式1之XRPD圖譜。
[圖31]描繪了結晶化合物A-硫酸鹽形式1之DSC熱譜圖和TGA。
[圖32]描繪了結晶化合物A-硫酸鹽形式1之DVS。
[圖33]描繪了化合物A-無定形形式之XRPD圖譜。
[圖34]描繪了DSC熱譜圖,其指示出化合物A-無定形形式在91°C處的玻璃轉換溫度(Tg)。
[圖35]描繪了TGA-IR,其顯示出在100°C以下化合物A無定形形式中水之約1.05%重量損失。
[圖36]描繪了結晶化合物A-可變水合物形式2之XRPD圖譜。
[圖37]描繪了結晶化合物A-可變水合物形式2之DSC熱譜圖。
[圖38]描繪了結晶化合物A-可變水合物形式2之TGA。
[圖39]描繪了結晶化合物A-可變水合物形式2之DVS水分吸附曲線。
[圖40]描繪了結晶化合物A-無水形式3之XRPD圖譜。
[圖41]描繪了結晶化合物A-無水形式3之DSC熱譜圖。
[圖42]描繪了結晶化合物A-無水形式3之DVS曲線。
[圖43]描繪了結晶化合物A-無水形式4之XRPD圖譜。
[圖44]描繪了結晶化合物A-無水形式5之XRPD圖譜。
[圖45]描繪了結晶化合物A-無水形式5之DSC熱譜圖和TGA。
[圖46]描繪了結晶化合物A-無水形式5之DVS曲線,其中無水形式5再水合為化合物A-單水合物。
[圖47]描繪了結晶化合物A-無水形式6之XRPD圖譜。
[圖48]描繪了結晶化合物A-無水形式6之DSC熱譜圖和TGA。
[圖49]描繪了結晶化合物A-無水形式7之XRPD圖譜。
[圖50]描繪了結晶化合物A-無水形式8之XRPD圖譜。
[圖51]描繪了結晶化合物A-無水形式8之DSC熱譜圖和TGA。
[圖52]描繪了結晶化合物A形式1之XRPD圖譜。
[圖53]描繪了結晶化合物A-THF溶劑合物之XRPD圖譜。
[圖54]描繪了結晶化合物A-THF溶劑合物之DSC熱譜圖和TGA。
[圖55]描繪了結晶化合物A-乙醇溶劑合物之XRPD圖譜。
[圖56]描繪了結晶化合物A-乙醇溶劑合物之TGA。
[圖57]描繪了結晶化合物A-乙醇溶劑合物之DSC熱譜圖。
[圖58]描繪了結晶化合物A-1-丙醇溶劑合物之XRPD圖譜。
[圖59]描繪了結晶化合物A-1-丙醇溶劑合物之DSC熱譜圖和TGA。
[圖60]描繪了結晶化合物A-異丙醇(IPA)溶劑合物之XRPD圖譜。
[圖61]描繪了結晶化合物A-IPA溶劑合物之DSC熱譜圖和TGA。
[圖62]描繪了結晶化合物A-甲醇溶劑合物之XRPD圖譜。
[圖63]描繪了結晶化合物A-乙酸異丙酯(IPAc)溶劑合物之XRPD圖譜。
[圖64]描繪了結晶化合物A-丙酮溶劑合物之XRPD圖譜。
[圖65]描繪了結晶化合物A-環戊基甲基醚(CPME)溶劑合物之XRPD圖譜。
[圖66]描繪了結晶化合物A-二㗁烷溶劑合物之XRPD圖譜。
[圖67]描繪了結晶化合物A-乙酸乙酯(EtOAc)溶劑合物之XRPD圖譜。
[圖68]描繪了結晶化合物A-乙腈(MeCN)溶劑合物之XRPD圖譜。
[圖69]描繪了結晶化合物A-甲基三級丁基醚(MTBE)溶劑合物之XRPD圖譜。
[圖70]描繪了結晶化合物A-甲苯溶劑合物之XRPD圖譜。
[圖71]描繪了結晶化合物A-十二烷基硫酸鹽溶劑合物之XRPD圖譜。
[圖72]描繪了結晶化合物A-十二烷基硫酸鹽溶劑合物之DSC熱譜圖和TGA。
[圖73]描繪了結晶化合物A-二甲基甲醯胺(DMF)溶劑合物水合物之XRPD圖譜。
[圖74]描繪了結晶化合物A-二甲基甲醯胺(DMF)溶劑合物水合物之DSC熱譜圖。
[圖75]描繪了結晶化合物A-二甲基乙醯胺(DMAC)溶劑合物之XRPD圖譜。
[圖76]描繪了結晶化合物A-二甲基乙醯胺(DMAC)溶劑合物之DSC熱譜圖。
[圖77]描繪了結晶化合物A-單苯磺酸鹽水合物形式1之XRPD圖譜。
[圖78]描繪了結晶化合物A-單苯磺酸鹽水合物形式1之DSC熱譜圖和TGA。
[圖79]描繪了結晶化合物A-咖啡因共晶體形式1之XRPD圖譜。
[圖80]描繪了結晶化合物A-咖啡因共晶體形式1之DSC熱譜圖和TGA。
[圖81]描繪了結晶化合物A-咖啡因共晶體形式1之DVS曲線。
[圖82]描繪了結晶化合物A-檸檬酸共晶體形式1之XRPD圖譜。
[圖83]描繪了結晶化合物A-檸檬酸共晶體形式1之DSC熱譜圖和TGA。
[圖84]描繪了結晶化合物A-檸檬酸共晶體形式2之XRPD圖譜。
[圖85]描繪了結晶化合物A-檸檬酸共晶體形式2之DSC熱譜圖和TGA。
[圖86]描繪了結晶化合物A-糖精共晶體形式1之XRPD圖譜。
[圖87]描繪了結晶化合物A-糖精共晶體形式1之DSC熱譜圖和TGA。
[圖88]描繪了結晶化合物A-糖精共晶體形式1之DVS曲線。
[圖89]描繪了結晶化合物A-L-酒石酸共晶體形式1之XRPD圖譜。
[圖90]描繪了結晶化合物A-L-酒石酸共晶體形式1之DSC熱譜圖和TGA。
[圖91]描繪了結晶化合物A-L-酒石酸共晶體形式1之DVS曲線。
[圖92]描繪了結晶化合物A-尿素共晶體形式1之XRPD圖譜。
[圖93]描繪了結晶化合物A-尿素共晶體形式1之DSC熱譜圖和TGA。
[圖94]描繪了結晶化合物A-尿素共晶體形式1之DVS曲線。
[圖95]描繪了化合物A-HCl形式1、化合物A-無水形式3和化合物A-無定形之狗交叉PK研究。
<![CDATA[<110>  美商安進公司(Amgen Inc.)]]>
          <![CDATA[<120>  KIF18A抑制劑化合物之鹽和固態形式]]>
          <![CDATA[<130>  A-2832-US-PSP]]>
          <![CDATA[<160>  13    ]]>
          <![CDATA[<170>  PatentIn 3.5版]]>
          <![CDATA[<210>  1]]>
          <![CDATA[<211>  2512]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  1]]>
          ctcaaaagtc tagagccacc gtccagggag caggtagctg ctgggctccg gggacacttt       60
          gcgttcgggc tgggagcgtg ctttccacga cggtgacacg cttccctgga ttggcagcca      120
          gactgccttc cgggtcactg ccatggagga gccgcagtca gatcctagcg tcgagccccc      180
          tctgagtcag gaaacatttt cagacctatg gaaactactt cctgaaaaca acgttctgtc      240
          ccccttgccg tcccaagcaa tggatgattt gatgctgtcc ccggacgata ttgaacaatg      300
          gttcactgaa gacccaggtc cagatgaagc tcccagaatg ccagaggctg ctccccccgt      360
          ggcccctgca ccagcagctc ctacaccggc ggcccctgca ccagccccct cctggcccct      420
          gtcatcttct gtcccttccc agaaaaccta ccagggcagc tacggtttcc gtctgggctt      480
          cttgcattct gggacagcca agtctgtgac ttgcacgtac tcccctgccc tcaacaagat      540
          gttttgccaa ctggccaaga cctgccctgt gcagctgtgg gttgattcca cacccccgcc      600
          cggcacccgc gtccgcgcca tggccatcta caagcagtca cagcacatga cggaggttgt      660
          gaggcgctgc ccccaccatg agcgctgctc agatagcgat ggtctggccc ctcctcagca      720
          tcttatccga gtggaaggaa atttgcgtgt ggagtatttg gatgacagaa acacttttcg      780
          acatagtgtg gtggtgccct atgagccgcc tgaggttggc tctgactgta ccaccatcca      840
          ctacaactac atgtgtaaca gttcctgcat gggcggcatg aaccggaggc ccatcctcac      900
          catcatcaca ctggaagact ccagtggtaa tctactggga cggaacagct ttgaggtgcg      960
          tgtttgtgcc tgtcctggga gagaccggcg cacagaggaa gagaatctcc gcaagaaagg     1020
          ggagcctcac cacgagctgc ccccagggag cactaagcga gcactgccca acaacaccag     1080
          ctcctctccc cagccaaaga agaaaccact ggatggagaa tatttcaccc ttcagatccg     1140
          tgggcgtgag cgcttcgaga tgttccgaga gctgaatgag gccttggaac tcaaggatgc     1200
          ccaggctggg aaggagccag gggggagcag ggctcactcc agccacctga agtccaaaaa     1260
          gggtcagtct acctcccgcc ataaaaaact catgttcaag acagaagggc ctgactcaga     1320
          ctgacattct ccacttcttg ttccccactg acagcctccc acccccatct ctccctcccc     1380
          tgccattttg ggttttgggt ctttgaaccc ttgcttgcaa taggtgtgcg tcagaagcac     1440
          ccaggacttc catttgcttt gtcccggggc tccactgaac aagttggcct gcactggtgt     1500
          tttgttgtgg ggaggaggat ggggagtagg acataccagc ttagatttta aggtttttac     1560
          tgtgagggat gtttgggaga tgtaagaaat gttcttgcag ttaagggtta gtttacaatc     1620
          agccacattc taggtagggg cccacttcac cgtactaacc agggaagctg tccctcactg     1680
          ttgaattttc tctaacttca aggcccatat ctgtgaaatg ctggcatttg cacctacctc     1740
          acagagtgca ttgtgagggt taatgaaata atgtacatct ggccttgaaa ccacctttta     1800
          ttacatgggg tctagaactt gacccccttg agggtgcttg ttccctctcc ctgttggtcg     1860
          gtgggttggt agtttctaca gttgggcagc tggttaggta gagggagttg tcaagtctct     1920
          gctggcccag ccaaaccctg tctgacaacc tcttggtgaa ccttagtacc taaaaggaaa     1980
          tctcacccca tcccacaccc tggaggattt catctcttgt atatgatgat ctggatccac     2040
          caagacttgt tttatgctca gggtcaattt cttttttctt tttttttttt ttttttcttt     2100
          ttctttgaga ctgggtctcg ctttgttgcc caggctggag tggagtggcg tgatcttggc     2160
          ttactgcagc ctttgcctcc ccggctcgag cagtcctgcc tcagcctccg gagtagctgg     2220
          gaccacaggt tcatgccacc atggccagcc aacttttgca tgttttgtag agatggggtc     2280
          tcacagtgtt gcccaggctg gtctcaaact cctgggctca ggcgatccac ctgtctcagc     2340
          ctcccagagt gctgggatta caattgtgag ccaccacgtc cagctggaag ggtcaacatc     2400
          ttttacattc tgcaagcaca tctgcatttt caccccaccc ttcccctcct tctccctttt     2460
          tatatcccat ttttatatcg atctcttatt ttacaataaa actttgctgc ca             2512
          <![CDATA[<210>  2]]>
          <![CDATA[<211>  393]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  2]]>
          Met Glu Glu Pro Gln Ser Asp Pro Ser Val Glu Pro Pro Leu Ser Gln 
          1               5                   10                  15      
          Glu Thr Phe Ser Asp Leu Trp Lys Leu Leu Pro Glu Asn Asn Val Leu 
                      20                  25                  30          
          Ser Pro Leu Pro Ser Gln Ala Met Asp Asp Leu Met Leu Ser Pro Asp 
                  35                  40                  45              
          Asp Ile Glu Gln Trp Phe Thr Glu Asp Pro Gly Pro Asp Glu Ala Pro 
              50                  55                  60                  
          Arg Met Pro Glu Ala Ala Pro Pro Val Ala Pro Ala Pro Ala Ala Pro 
          65                  70                  75                  80  
          Thr Pro Ala Ala Pro Ala Pro Ala Pro Ser Trp Pro Leu Ser Ser Ser 
                          85                  90                  95      
          Val Pro Ser Gln Lys Thr Tyr Gln Gly Ser Tyr Gly Phe Arg Leu Gly 
                      100                 105                 110         
          Phe Leu His Ser Gly Thr Ala Lys Ser Val Thr Cys Thr Tyr Ser Pro 
                  115                 120                 125             
          Ala Leu Asn Lys Met Phe Cys Gln Leu Ala Lys Thr Cys Pro Val Gln 
              130                 135                 140                 
          Leu Trp Val Asp Ser Thr Pro Pro Pro Gly Thr Arg Val Arg Ala Met 
          145                 150                 155                 160 
          Ala Ile Tyr Lys Gln Ser Gln His Met Thr Glu Val Val Arg Arg Cys 
                          165                 170                 175     
          Pro His His Glu Arg Cys Ser Asp Ser Asp Gly Leu Ala Pro Pro Gln 
                      180                 185                 190         
          His Leu Ile Arg Val Glu Gly Asn Leu Arg Val Glu Tyr Leu Asp Asp 
                  195                 200                 205             
          Arg Asn Thr Phe Arg His Ser Val Val Val Pro Tyr Glu Pro Pro Glu 
              210                 215                 220                 
          Val Gly Ser Asp Cys Thr Thr Ile His Tyr Asn Tyr Met Cys Asn Ser 
          225                 230                 235                 240 
          Ser Cys Met Gly Gly Met Asn Arg Arg Pro Ile Leu Thr Ile Ile Thr 
                          245                 250                 255     
          Leu Glu Asp Ser Ser Gly Asn Leu Leu Gly Arg Asn Ser Phe Glu Val 
                      260                 265                 270         
          Arg Val Cys Ala Cys Pro Gly Arg Asp Arg Arg Thr Glu Glu Glu Asn 
                  275                 280                 285             
          Leu Arg Lys Lys Gly Glu Pro His His Glu Leu Pro Pro Gly Ser Thr 
              290                 295                 300                 
          Lys Arg Ala Leu Pro Asn Asn Thr Ser Ser Ser Pro Gln Pro Lys Lys 
          305                 310                 315                 320 
          Lys Pro Leu Asp Gly Glu Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu 
                          325                 330                 335     
          Arg Phe Glu Met Phe Arg Glu Leu Asn Glu Ala Leu Glu Leu Lys Asp 
                      340                 345                 350         
          Ala Gln Ala Gly Lys Glu Pro Gly Gly Ser Arg Ala His Ser Ser His 
                  355                 360                 365             
          Leu Lys Ser Lys Lys Gly Gln Ser Thr Ser Arg His Lys Lys Leu Met 
              370                 375                 380                 
          Phe Lys Thr Glu Gly Pro Asp Ser Asp 
          385                 390             
          <![CDATA[<210>  3]]>
          <![CDATA[<211>  4768]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  3]]>
          agttgccggg cgggggaggg cgcgtccggt ttttctcagg ggacgttgaa attatttttg       60
          taacgggagt cgggagagga cggggcgtgc cccgacgtgc gcgcgcgtcg tcctccccgg      120
          cgctcctcca cagctcgctg gctcccgccg cggaaaggcg tcatgccgcc caaaaccccc      180
          cgaaaaacgg ccgccaccgc cgccgctgcc gccgcggaac ccccggcacc gccgccgccg      240
          ccccctcctg aggaggaccc agagcaggac agcggcccgg aggacctgcc tctcgtcagg      300
          cttgagtttg aagaaacaga agaacctgat tttactgcat tatgtcagaa attaaagata      360
          ccagatcatg tcagagagag agcttggtta acttgggaga aagtttcatc tgtggatgga      420
          gtattgggag gttatattca aaagaaaaag gaactgtggg gaatctgtat ctttattgca      480
          gcagttgacc tagatgagat gtcgttcact tttactgagc tacagaaaaa catagaaatc      540
          agtgtccata aattctttaa cttactaaaa gaaattgata ccagtaccaa agttgataat      600
          gctatgtcaa gactgttgaa gaagtatgat gtattgtttg cactcttcag caaattggaa      660
          aggacatgtg aacttatata tttgacacaa cccagcagtt cgatatctac tgaaataaat      720
          tctgcattgg tgctaaaagt ttcttggatc acatttttat tagctaaagg ggaagtatta      780
          caaatggaag atgatctggt gatttcattt cagttaatgc tatgtgtcct tgactatttt      840
          attaaactct cacctcccat gttgctcaaa gaaccatata aaacagctgt tatacccatt      900
          aatggttcac ctcgaacacc caggcgaggt cagaacagga gtgcacggat agcaaaacaa      960
          ctagaaaatg atacaagaat tattgaagtt ctctgtaaag aacatgaatg taatatagat     1020
          gaggtgaaaa atgtttattt caaaaatttt atacctttta tgaattctct tggacttgta     1080
          acatctaatg gacttccaga ggttgaaaat ctttctaaac gatacgaaga aatttatctt     1140
          aaaaataaag atctagatgc aagattattt ttggatcatg ataaaactct tcagactgat     1200
          tctatagaca gttttgaaac acagagaaca ccacgaaaaa gtaaccttga tgaagaggtg     1260
          aatgtaattc ctccacacac tccagttagg actgttatga acactatcca acaattaatg     1320
          atgattttaa attcagcaag tgatcaacct tcagaaaatc tgatttccta ttttaacaac     1380
          tgcacagtga atccaaaaga aagtatactg aaaagagtga aggatatagg atacatcttt     1440
          aaagagaaat ttgctaaagc tgtgggacag ggttgtgtcg aaattggatc acagcgatac     1500
          aaacttggag ttcgcttgta ttaccgagta atggaatcca tgcttaaatc agaagaagaa     1560
          cgattatcca ttcaaaattt tagcaaactt ctgaatgaca acatttttca tatgtcttta     1620
          ttggcgtgcg ctcttgaggt tgtaatggcc acatatagca gaagtacatc tcagaatctt     1680
          gattctggaa cagatttgtc tttcccatgg attctgaatg tgcttaattt aaaagccttt     1740
          gatttttaca aagtgatcga aagttttatc aaagcagaag gcaacttgac aagagaaatg     1800
          ataaaacatt tagaacgatg tgaacatcga atcatggaat cccttgcatg gctctcagat     1860
          tcacctttat ttgatcttat taaacaatca aaggaccgag aaggaccaac tgatcacctt     1920
          gaatctgctt gtcctcttaa tcttcctctc cagaataatc acactgcagc agatatgtat     1980
          ctttctcctg taagatctcc aaagaaaaaa ggttcaacta cgcgtgtaaa ttctactgca     2040
          aatgcagaga cacaagcaac ctcagccttc cagacccaga agccattgaa atctacctct     2100
          ctttcactgt tttataaaaa agtgtatcgg ctagcctatc tccggctaaa tacactttgt     2160
          gaacgccttc tgtctgagca cccagaatta gaacatatca tctggaccct tttccagcac     2220
          accctgcaga atgagtatga actcatgaga gacaggcatt tggaccaaat tatgatgtgt     2280
          tccatgtatg gcatatgcaa agtgaagaat atagacctta aattcaaaat cattgtaaca     2340
          gcatacaagg atcttcctca tgctgttcag gagacattca aacgtgtttt gatcaaagaa     2400
          gaggagtatg attctattat agtattctat aactcggtct tcatgcagag actgaaaaca     2460
          aatattttgc agtatgcttc caccaggccc cctaccttgt caccaatacc tcacattcct     2520
          cgaagccctt acaagtttcc tagttcaccc ttacggattc ctggagggaa catctatatt     2580
          tcacccctga agagtccata taaaatttca gaaggtctgc caacaccaac aaaaatgact     2640
          ccaagatcaa gaatcttagt atcaattggt gaatcattcg ggacttctga gaagttccag     2700
          aaaataaatc agatggtatg taacagcgac cgtgtgctca aaagaagtgc tgaaggaagc     2760
          aaccctccta aaccactgaa aaaactacgc tttgatattg aaggatcaga tgaagcagat     2820
          ggaagtaaac atctcccagg agagtccaaa tttcagcaga aactggcaga aatgacttct     2880
          actcgaacac gaatgcaaaa gcagaaaatg aatgatagca tggatacctc aaacaaggaa     2940
          gagaaatgag gatctcagga ccttggtgga cactgtgtac acctctggat tcattgtctc     3000
          tcacagatgt gactgtataa ctttcccagg ttctgtttat ggccacattt aatatcttca     3060
          gctctttttg tggatataaa atgtgcagat gcaattgttt gggtgattcc taagccactt     3120
          gaaatgttag tcattgttat ttatacaaga ttgaaaatct tgtgtaaatc ctgccattta     3180
          aaaagttgta gcagattgtt tcctcttcca aagtaaaatt gctgtgcttt atggatagta     3240
          agaatggccc tagagtggga gtcctgataa cccaggcctg tctgactact ttgccttctt     3300
          ttgtagcata taggtgatgt ttgctcttgt ttttattaat ttatatgtat atttttttaa     3360
          tttaacatga acacccttag aaaatgtgtc ctatctatct tccaaatgca atttgattga     3420
          ctgcccattc accaaaatta tcctgaactc ttctgcaaaa atggatatta ttagaaatta     3480
          gaaaaaaatt actaatttta cacattagat tttattttac tattggaatc tgatatactg     3540
          tgtgcttgtt ttataaaatt ttgcttttaa ttaaataaaa gctggaagca aagtataacc     3600
          atatgatact atcatactac tgaaacagat ttcatacctc agaatgtaaa agaacttact     3660
          gattattttc ttcatccaac ttatgttttt aaatgaggat tattgatagt actcttggtt     3720
          tttataccat tcagatcact gaatttataa agtacccatc tagtacttga aaaagtaaag     3780
          tgttctgcca gatcttaggt atagaggacc ctaacacagt atatcccaag tgcactttct     3840
          aatgtttctg ggtcctgaag aattaagata caaattaatt ttactccata aacagactgt     3900
          taattatagg agccttaatt tttttttcat agagatttgt ctaattgcat ctcaaaatta     3960
          ttctgccctc cttaatttgg gaaggtttgt gttttctctg gaatggtaca tgtcttccat     4020
          gtatcttttg aactggcaat tgtctattta tcttttattt ttttaagtca gtatggtcta     4080
          acactggcat gttcaaagcc acattatttc tagtccaaaa ttacaagtaa tcaagggtca     4140
          ttatgggtta ggcattaatg tttctatctg attttgtgca aaagcttcaa attaaaacag     4200
          ctgcattaga aaaagaggcg cttctcccct cccctacacc taaaggtgta tttaaactat     4260
          cttgtgtgat taacttattt agagatgctg taacttaaaa taggggatat ttaaggtagc     4320
          ttcagctagc ttttaggaaa atcactttgt ctaactcaga attattttta aaaagaaatc     4380
          tggtcttgtt agaaaacaaa attttatttt gtgctcattt aagtttcaaa cttactattt     4440
          tgacagttat tttgataaca atgacactag aaaacttgac tccatttcat cattgtttct     4500
          gcatgaatat catacaaatc agttagtttt taggtcaagg gcttactatt tctgggtctt     4560
          ttgctactaa gttcacatta gaattagtgc cagaatttta ggaacttcag agatcgtgta     4620
          ttgagatttc ttaaataatg cttcagatat tattgcttta ttgctttttt gtattggtta     4680
          aaactgtaca tttaaaattg ctatgttact attttctaca attaatagtt tgtctatttt     4740
          aaaataaatt agttgttaag agtcttaa                                        4768
          <![CDATA[<210>  4]]>
          <![CDATA[<211>  928]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  4]]>
          Met Pro Pro Lys Thr Pro Arg Lys Thr Ala Ala Thr Ala Ala Ala Ala 
          1               5                   10                  15      
          Ala Ala Glu Pro Pro Ala Pro Pro Pro Pro Pro Pro Pro Glu Glu Asp 
                      20                  25                  30          
          Pro Glu Gln Asp Ser Gly Pro Glu Asp Leu Pro Leu Val Arg Leu Glu 
                  35                  40                  45              
          Phe Glu Glu Thr Glu Glu Pro Asp Phe Thr Ala Leu Cys Gln Lys Leu 
              50                  55                  60                  
          Lys Ile Pro Asp His Val Arg Glu Arg Ala Trp Leu Thr Trp Glu Lys 
          65                  70                  75                  80  
          Val Ser Ser Val Asp Gly Val Leu Gly Gly Tyr Ile Gln Lys Lys Lys 
                          85                  90                  95      
          Glu Leu Trp Gly Ile Cys Ile Phe Ile Ala Ala Val Asp Leu Asp Glu 
                      100                 105                 110         
          Met Ser Phe Thr Phe Thr Glu Leu Gln Lys Asn Ile Glu Ile Ser Val 
                  115                 120                 125             
          His Lys Phe Phe Asn Leu Leu Lys Glu Ile Asp Thr Ser Thr Lys Val 
              130                 135                 140                 
          Asp Asn Ala Met Ser Arg Leu Leu Lys Lys Tyr Asp Val Leu Phe Ala 
          145                 150                 155                 160 
          Leu Phe Ser Lys Leu Glu Arg Thr Cys Glu Leu Ile Tyr Leu Thr Gln 
                          165                 170                 175     
          Pro Ser Ser Ser Ile Ser Thr Glu Ile Asn Ser Ala Leu Val Leu Lys 
                      180                 185                 190         
          Val Ser Trp Ile Thr Phe Leu Leu Ala Lys Gly Glu Val Leu Gln Met 
                  195                 200                 205             
          Glu Asp Asp Leu Val Ile Ser Phe Gln Leu Met Leu Cys Val Leu Asp 
              210                 215                 220                 
          Tyr Phe Ile Lys Leu Ser Pro Pro Met Leu Leu Lys Glu Pro Tyr Lys 
          225                 230                 235                 240 
          Thr Ala Val Ile Pro Ile Asn Gly Ser Pro Arg Thr Pro Arg Arg Gly 
                          245                 250                 255     
          Gln Asn Arg Ser Ala Arg Ile Ala Lys Gln Leu Glu Asn Asp Thr Arg 
                      260                 265                 270         
          Ile Ile Glu Val Leu Cys Lys Glu His Glu Cys Asn Ile Asp Glu Val 
                  275                 280                 285             
          Lys Asn Val Tyr Phe Lys Asn Phe Ile Pro Phe Met Asn Ser Leu Gly 
              290                 295                 300                 
          Leu Val Thr Ser Asn Gly Leu Pro Glu Val Glu Asn Leu Ser Lys Arg 
          305                 310                 315                 320 
          Tyr Glu Glu Ile Tyr Leu Lys Asn Lys Asp Leu Asp Ala Arg Leu Phe 
                          325                 330                 335     
          Leu Asp His Asp Lys Thr Leu Gln Thr Asp Ser Ile Asp Ser Phe Glu 
                      340                 345                 350         
          Thr Gln Arg Thr Pro Arg Lys Ser Asn Leu Asp Glu Glu Val Asn Val 
                  355                 360                 365             
          Ile Pro Pro His Thr Pro Val Arg Thr Val Met Asn Thr Ile Gln Gln 
              370                 375                 380                 
          Leu Met Met Ile Leu Asn Ser Ala Ser Asp Gln Pro Ser Glu Asn Leu 
          385                 390                 395                 400 
          Ile Ser Tyr Phe Asn Asn Cys Thr Val Asn Pro Lys Glu Ser Ile Leu 
                          405                 410                 415     
          Lys Arg Val Lys Asp Ile Gly Tyr Ile Phe Lys Glu Lys Phe Ala Lys 
                      420                 425                 430         
          Ala Val Gly Gln Gly Cys Val Glu Ile Gly Ser Gln Arg Tyr Lys Leu 
                  435                 440                 445             
          Gly Val Arg Leu Tyr Tyr Arg Val Met Glu Ser Met Leu Lys Ser Glu 
              450                 455                 460                 
          Glu Glu Arg Leu Ser Ile Gln Asn Phe Ser Lys Leu Leu Asn Asp Asn 
          465                 470                 475                 480 
          Ile Phe His Met Ser Leu Leu Ala Cys Ala Leu Glu Val Val Met Ala 
                          485                 490                 495     
          Thr Tyr Ser Arg Ser Thr Ser Gln Asn Leu Asp Ser Gly Thr Asp Leu 
                      500                 505                 510         
          Ser Phe Pro Trp Ile Leu Asn Val Leu Asn Leu Lys Ala Phe Asp Phe 
                  515                 520                 525             
          Tyr Lys Val Ile Glu Ser Phe Ile Lys Ala Glu Gly Asn Leu Thr Arg 
              530                 535                 540                 
          Glu Met Ile Lys His Leu Glu Arg Cys Glu His Arg Ile Met Glu Ser 
          545                 550                 555                 560 
          Leu Ala Trp Leu Ser Asp Ser Pro Leu Phe Asp Leu Ile Lys Gln Ser 
                          565                 570                 575     
          Lys Asp Arg Glu Gly Pro Thr Asp His Leu Glu Ser Ala Cys Pro Leu 
                      580                 585                 590         
          Asn Leu Pro Leu Gln Asn Asn His Thr Ala Ala Asp Met Tyr Leu Ser 
                  595                 600                 605             
          Pro Val Arg Ser Pro Lys Lys Lys Gly Ser Thr Thr Arg Val Asn Ser 
              610                 615                 620                 
          Thr Ala Asn Ala Glu Thr Gln Ala Thr Ser Ala Phe Gln Thr Gln Lys 
          625                 630                 635                 640 
          Pro Leu Lys Ser Thr Ser Leu Ser Leu Phe Tyr Lys Lys Val Tyr Arg 
                          645                 650                 655     
          Leu Ala Tyr Leu Arg Leu Asn Thr Leu Cys Glu Arg Leu Leu Ser Glu 
                      660                 665                 670         
          His Pro Glu Leu Glu His Ile Ile Trp Thr Leu Phe Gln His Thr Leu 
                  675                 680                 685             
          Gln Asn Glu Tyr Glu Leu Met Arg Asp Arg His Leu Asp Gln Ile Met 
              690                 695                 700                 
          Met Cys Ser Met Tyr Gly Ile Cys Lys Val Lys Asn Ile Asp Leu Lys 
          705                 710                 715                 720 
          Phe Lys Ile Ile Val Thr Ala Tyr Lys Asp Leu Pro His Ala Val Gln 
                          725                 730                 735     
          Glu Thr Phe Lys Arg Val Leu Ile Lys Glu Glu Glu Tyr Asp Ser Ile 
                      740                 745                 750         
          Ile Val Phe Tyr Asn Ser Val Phe Met Gln Arg Leu Lys Thr Asn Ile 
                  755                 760                 765             
          Leu Gln Tyr Ala Ser Thr Arg Pro Pro Thr Leu Ser Pro Ile Pro His 
              770                 775                 780                 
          Ile Pro Arg Ser Pro Tyr Lys Phe Pro Ser Ser Pro Leu Arg Ile Pro 
          785                 790                 795                 800 
          Gly Gly Asn Ile Tyr Ile Ser Pro Leu Lys Ser Pro Tyr Lys Ile Ser 
                          805                 810                 815     
          Glu Gly Leu Pro Thr Pro Thr Lys Met Thr Pro Arg Ser Arg Ile Leu 
                      820                 825                 830         
          Val Ser Ile Gly Glu Ser Phe Gly Thr Ser Glu Lys Phe Gln Lys Ile 
                  835                 840                 845             
          Asn Gln Met Val Cys Asn Ser Asp Arg Val Leu Lys Arg Ser Ala Glu 
              850                 855                 860                 
          Gly Ser Asn Pro Pro Lys Pro Leu Lys Lys Leu Arg Phe Asp Ile Glu 
          865                 870                 875                 880 
          Gly Ser Asp Glu Ala Asp Gly Ser Lys His Leu Pro Gly Glu Ser Lys 
                          885                 890                 895     
          Phe Gln Gln Lys Leu Ala Glu Met Thr Ser Thr Arg Thr Arg Met Gln 
                      900                 905                 910         
          Lys Gln Lys Met Asn Asp Ser Met Asp Thr Ser Asn Lys Glu Glu Lys 
                  915                 920                 925             
          <![CDATA[<210>  5]]>
          <![CDATA[<211>  1954]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  5]]>
          aggagcagcc ggcgcggccg ccagcgcggt gtagggggca ggcgcggatc ccgccaccgc       60
          cgcgcgctcg gcccgccgac tcccggcgcc gccgccgcca ctgccgtcgc cgccgccgcc      120
          tgccgggact ggagcgcgcc gtccgccgcg gacaagaccc tggcctcagg ccggagcagc      180
          cccatcatgc cgagggagcg cagggagcgg gatgcgaagg agcgggacac catgaaggag      240
          gacggcggcg cggagttctc ggctcgctcc aggaagagga aggcaaacgt gaccgttttt      300
          ttgcaggatc cagatgaaga aatggccaaa atcgacagga cggcgaggga ccagtgtggg      360
          agccagcctt gggacaataa tgcagtctgt gcagacccct gctccctgat ccccacacct      420
          gacaaagaag atgatgaccg ggtttaccca aactcaacgt gcaagcctcg gattattgca      480
          ccatccagag gctccccgct gcctgtactg agctgggcaa atagagagga agtctggaaa      540
          atcatgttaa acaaggaaaa gacatactta agggatcagc actttcttga gcaacaccct      600
          cttctgcagc caaaaatgcg agcaattctt ctggattggt taatggaggt gtgtgaagtc      660
          tataaacttc acagggagac cttttacttg gcacaagatt tctttgaccg gtatatggcg      720
          acacaagaaa atgttgtaaa aactctttta cagcttattg ggatttcatc tttatttatt      780
          gcagccaaac ttgaggaaat ctatcctcca aagttgcacc agtttgcgta tgtgacagat      840
          ggagcttgtt caggagatga aattctcacc atggaattaa tgattatgaa ggcccttaag      900
          tggcgtttaa gtcccctgac tattgtgtcc tggctgaatg tatacatgca ggttgcatat      960
          ctaaatgact tacatgaagt gctactgccg cagtatcccc agcaaatctt tatacagatt     1020
          gcagagctgt tggatctctg tgtcctggat gttgactgcc ttgaatttcc ttatggtata     1080
          cttgctgctt cggccttgta tcatttctcg tcatctgaat tgatgcaaaa ggtttcaggg     1140
          tatcagtggt gcgacataga gaactgtgtc aagtggatgg ttccatttgc catggttata     1200
          agggagacgg ggagctcaaa actgaagcac ttcaggggcg tcgctgatga agatgcacac     1260
          aacatacaga cccacagaga cagcttggat ttgctggaca aagcccgagc aaagaaagcc     1320
          atgttgtctg aacaaaatag ggcttctcct ctccccagtg ggctcctcac cccgccacag     1380
          agcggtaaga agcagagcag cgggccggaa atggcgtgac caccccatcc ttctccacca     1440
          aagacagttg cgcgcctgct ccacgttctc ttctgtctgt tgcagcggag gcgtgcgttt     1500
          gcttttacag atatctgaat ggaagagtgt ttcttccaca acagaagtat ttctgtggat     1560
          ggcatcaaac agggcaaagt gttttttatt gaatgcttat aggttttttt taaataagtg     1620
          ggtcaagtac accagccacc tccagacacc agtgcgtgct cccgatgctg ctatggaagg     1680
          tgctacttga cctaagggac tcccacaaca acaaaagctt gaagctgtgg agggccacgg     1740
          tggcgtggct ctcctcgcag gtgttctggg ctccgttgta ccaagtggag caggtggttg     1800
          cgggcaagcg ttgtgcagag cccatagcca gctgggcagg gggctgccct ctccacatta     1860
          tcagttgaca gtgtacaatg cctttgatga actgttttgt aagtgctgct atatctatcc     1920
          attttttaat aaagataata ctgtttttga gaca                                 1954
          <![CDATA[<210>  6]]>
          <![CDATA[<211>  410]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  6]]>
          Met Pro Arg Glu Arg Arg Glu Arg Asp Ala Lys Glu Arg Asp Thr Met 
          1               5                   10                  15      
          Lys Glu Asp Gly Gly Ala Glu Phe Ser Ala Arg Ser Arg Lys Arg Lys 
                      20                  25                  30          
          Ala Asn Val Thr Val Phe Leu Gln Asp Pro Asp Glu Glu Met Ala Lys 
                  35                  40                  45              
          Ile Asp Arg Thr Ala Arg Asp Gln Cys Gly Ser Gln Pro Trp Asp Asn 
              50                  55                  60                  
          Asn Ala Val Cys Ala Asp Pro Cys Ser Leu Ile Pro Thr Pro Asp Lys 
          65                  70                  75                  80  
          Glu Asp Asp Asp Arg Val Tyr Pro Asn Ser Thr Cys Lys Pro Arg Ile 
                          85                  90                  95      
          Ile Ala Pro Ser Arg Gly Ser Pro Leu Pro Val Leu Ser Trp Ala Asn 
                      100                 105                 110         
          Arg Glu Glu Val Trp Lys Ile Met Leu Asn Lys Glu Lys Thr Tyr Leu 
                  115                 120                 125             
          Arg Asp Gln His Phe Leu Glu Gln His Pro Leu Leu Gln Pro Lys Met 
              130                 135                 140                 
          Arg Ala Ile Leu Leu Asp Trp Leu Met Glu Val Cys Glu Val Tyr Lys 
          145                 150                 155                 160 
          Leu His Arg Glu Thr Phe Tyr Leu Ala Gln Asp Phe Phe Asp Arg Tyr 
                          165                 170                 175     
          Met Ala Thr Gln Glu Asn Val Val Lys Thr Leu Leu Gln Leu Ile Gly 
                      180                 185                 190         
          Ile Ser Ser Leu Phe Ile Ala Ala Lys Leu Glu Glu Ile Tyr Pro Pro 
                  195                 200                 205             
          Lys Leu His Gln Phe Ala Tyr Val Thr Asp Gly Ala Cys Ser Gly Asp 
              210                 215                 220                 
          Glu Ile Leu Thr Met Glu Leu Met Ile Met Lys Ala Leu Lys Trp Arg 
          225                 230                 235                 240 
          Leu Ser Pro Leu Thr Ile Val Ser Trp Leu Asn Val Tyr Met Gln Val 
                          245                 250                 255     
          Ala Tyr Leu Asn Asp Leu His Glu Val Leu Leu Pro Gln Tyr Pro Gln 
                      260                 265                 270         
          Gln Ile Phe Ile Gln Ile Ala Glu Leu Leu Asp Leu Cys Val Leu Asp 
                  275                 280                 285             
          Val Asp Cys Leu Glu Phe Pro Tyr Gly Ile Leu Ala Ala Ser Ala Leu 
              290                 295                 300                 
          Tyr His Phe Ser Ser Ser Glu Leu Met Gln Lys Val Ser Gly Tyr Gln 
          305                 310                 315                 320 
          Trp Cys Asp Ile Glu Asn Cys Val Lys Trp Met Val Pro Phe Ala Met 
                          325                 330                 335     
          Val Ile Arg Glu Thr Gly Ser Ser Lys Leu Lys His Phe Arg Gly Val 
                      340                 345                 350         
          Ala Asp Glu Asp Ala His Asn Ile Gln Thr His Arg Asp Ser Leu Asp 
                  355                 360                 365             
          Leu Leu Asp Lys Ala Arg Ala Lys Lys Ala Met Leu Ser Glu Gln Asn 
              370                 375                 380                 
          Arg Ala Ser Pro Leu Pro Ser Gly Leu Leu Thr Pro Pro Gln Ser Gly 
          385                 390                 395                 400 
          Lys Lys Gln Ser Ser Gly Pro Glu Met Ala 
                          405                 410 
          <![CDATA[<210>  7]]>
          <![CDATA[<211>  7088]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  7]]>
          gctgagactt cctggacggg ggacaggctg tggggtttct cagataactg ggcccctgcg       60
          ctcaggaggc cttcaccctc tgctctgggt aaagttcatt ggaacagaaa gaaatggatt      120
          tatctgctct tcgcgttgaa gaagtacaaa atgtcattaa tgctatgcag aaaatcttag      180
          agtgtcccat ctgtctggag ttgatcaagg aacctgtctc cacaaagtgt gaccacatat      240
          tttgcaaatt ttgcatgctg aaacttctca accagaagaa agggccttca cagtgtcctt      300
          tatgtaagaa tgatataacc aaaaggagcc tacaagaaag tacgagattt agtcaacttg      360
          ttgaagagct attgaaaatc atttgtgctt ttcagcttga cacaggtttg gagtatgcaa      420
          acagctataa ttttgcaaaa aaggaaaata actctcctga acatctaaaa gatgaagttt      480
          ctatcatcca aagtatgggc tacagaaacc gtgccaaaag acttctacag agtgaacccg      540
          aaaatccttc cttgcaggaa accagtctca gtgtccaact ctctaacctt ggaactgtga      600
          gaactctgag gacaaagcag cggatacaac ctcaaaagac gtctgtctac attgaattgg      660
          gatctgattc ttctgaagat accgttaata aggcaactta ttgcagtgtg ggagatcaag      720
          aattgttaca aatcacccct caaggaacca gggatgaaat cagtttggat tctgcaaaaa      780
          aggctgcttg tgaattttct gagacggatg taacaaatac tgaacatcat caacccagta      840
          ataatgattt gaacaccact gagaagcgtg cagctgagag gcatccagaa aagtatcagg      900
          gtagttctgt ttcaaacttg catgtggagc catgtggcac aaatactcat gccagctcat      960
          tacagcatga gaacagcagt ttattactca ctaaagacag aatgaatgta gaaaaggctg     1020
          aattctgtaa taaaagcaaa cagcctggct tagcaaggag ccaacataac agatgggctg     1080
          gaagtaagga aacatgtaat gataggcgga ctcccagcac agaaaaaaag gtagatctga     1140
          atgctgatcc cctgtgtgag agaaaagaat ggaataagca gaaactgcca tgctcagaga     1200
          atcctagaga tactgaagat gttccttgga taacactaaa tagcagcatt cagaaagtta     1260
          atgagtggtt ttccagaagt gatgaactgt taggttctga tgactcacat gatggggagt     1320
          ctgaatcaaa tgccaaagta gctgatgtat tggacgttct aaatgaggta gatgaatatt     1380
          ctggttcttc agagaaaata gacttactgg ccagtgatcc tcatgaggct ttaatatgta     1440
          aaagtgaaag agttcactcc aaatcagtag agagtaatat tgaagacaaa atatttggga     1500
          aaacctatcg gaagaaggca agcctcccca acttaagcca tgtaactgaa aatctaatta     1560
          taggagcatt tgttactgag ccacagataa tacaagagcg tcccctcaca aataaattaa     1620
          agcgtaaaag gagacctaca tcaggccttc atcctgagga ttttatcaag aaagcagatt     1680
          tggcagttca aaagactcct gaaatgataa atcagggaac taaccaaacg gagcagaatg     1740
          gtcaagtgat gaatattact aatagtggtc atgagaataa aacaaaaggt gattctattc     1800
          agaatgagaa aaatcctaac ccaatagaat cactcgaaaa agaatctgct ttcaaaacga     1860
          aagctgaacc tataagcagc agtataagca atatggaact cgaattaaat atccacaatt     1920
          caaaagcacc taaaaagaat aggctgagga ggaagtcttc taccaggcat attcatgcgc     1980
          ttgaactagt agtcagtaga aatctaagcc cacctaattg tactgaattg caaattgata     2040
          gttgttctag cagtgaagag ataaagaaaa aaaagtacaa ccaaatgcca gtcaggcaca     2100
          gcagaaacct acaactcatg gaaggtaaag aacctgcaac tggagccaag aagagtaaca     2160
          agccaaatga acagacaagt aaaagacatg acagcgatac tttcccagag ctgaagttaa     2220
          caaatgcacc tggttctttt actaagtgtt caaataccag tgaacttaaa gaatttgtca     2280
          atcctagcct tccaagagaa gaaaaagaag agaaactaga aacagttaaa gtgtctaata     2340
          atgctgaaga ccccaaagat ctcatgttaa gtggagaaag ggttttgcaa actgaaagat     2400
          ctgtagagag tagcagtatt tcattggtac ctggtactga ttatggcact caggaaagta     2460
          tctcgttact ggaagttagc actctaggga aggcaaaaac agaaccaaat aaatgtgtga     2520
          gtcagtgtgc agcatttgaa aaccccaagg gactaattca tggttgttcc aaagataata     2580
          gaaatgacac agaaggcttt aagtatccat tgggacatga agttaaccac agtcgggaaa     2640
          caagcataga aatggaagaa agtgaacttg atgctcagta tttgcagaat acattcaagg     2700
          tttcaaagcg ccagtcattt gctccgtttt caaatccagg aaatgcagaa gaggaatgtg     2760
          caacattctc tgcccactct gggtccttaa agaaacaaag tccaaaagtc acttttgaat     2820
          gtgaacaaaa ggaagaaaat caaggaaaga atgagtctaa tatcaagcct gtacagacag     2880
          ttaatatcac tgcaggcttt cctgtggttg gtcagaaaga taagccagtt gataatgcca     2940
          aatgtagtat caaaggaggc tctaggtttt gtctatcatc tcagttcaga ggcaacgaaa     3000
          ctggactcat tactccaaat aaacatggac ttttacaaaa cccatatcgt ataccaccac     3060
          tttttcccat caagtcattt gttaaaacta aatgtaagaa aaatctgcta gaggaaaact     3120
          ttgaggaaca ttcaatgtca cctgaaagag aaatgggaaa tgagaacatt ccaagtacag     3180
          tgagcacaat tagccgtaat aacattagag aaaatgtttt taaagaagcc agctcaagca     3240
          atattaatga agtaggttcc agtactaatg aagtgggctc cagtattaat gaaataggtt     3300
          ccagtgatga aaacattcaa gcagaactag gtagaaacag agggccaaaa ttgaatgcta     3360
          tgcttagatt aggggttttg caacctgagg tctataaaca aagtcttcct ggaagtaatt     3420
          gtaagcatcc tgaaataaaa aagcaagaat atgaagaagt agttcagact gttaatacag     3480
          atttctctcc atatctgatt tcagataact tagaacagcc tatgggaagt agtcatgcat     3540
          ctcaggtttg ttctgagaca cctgatgacc tgttagatga tggtgaaata aaggaagata     3600
          ctagttttgc tgaaaatgac attaaggaaa gttctgctgt ttttagcaaa agcgtccaga     3660
          aaggagagct tagcaggagt cctagccctt tcacccatac acatttggct cagggttacc     3720
          gaagaggggc caagaaatta gagtcctcag aagagaactt atctagtgag gatgaagagc     3780
          ttccctgctt ccaacacttg ttatttggta aagtaaacaa tataccttct cagtctacta     3840
          ggcatagcac cgttgctacc gagtgtctgt ctaagaacac agaggagaat ttattatcat     3900
          tgaagaatag cttaaatgac tgcagtaacc aggtaatatt ggcaaaggca tctcaggaac     3960
          atcaccttag tgaggaaaca aaatgttctg ctagcttgtt ttcttcacag tgcagtgaat     4020
          tggaagactt gactgcaaat acaaacaccc aggatccttt cttgattggt tcttccaaac     4080
          aaatgaggca tcagtctgaa agccagggag ttggtctgag tgacaaggaa ttggtttcag     4140
          atgatgaaga aagaggaacg ggcttggaag aaaataatca agaagagcaa agcatggatt     4200
          caaacttagg tgaagcagca tctgggtgtg agagtgaaac aagcgtctct gaagactgct     4260
          cagggctatc ctctcagagt gacattttaa ccactcagca gagggatacc atgcaacata     4320
          acctgataaa gctccagcag gaaatggctg aactagaagc tgtgttagaa cagcatggga     4380
          gccagccttc taacagctac ccttccatca taagtgactc ttctgccctt gaggacctgc     4440
          gaaatccaga acaaagcaca tcagaaaaag cagtattaac ttcacagaaa agtagtgaat     4500
          accctataag ccagaatcca gaaggccttt ctgctgacaa gtttgaggtg tctgcagata     4560
          gttctaccag taaaaataaa gaaccaggag tggaaaggtc atccccttct aaatgcccat     4620
          cattagatga taggtggtac atgcacagtt gctctgggag tcttcagaat agaaactacc     4680
          catctcaaga ggagctcatt aaggttgttg atgtggagga gcaacagctg gaagagtctg     4740
          ggccacacga tttgacggaa acatcttact tgccaaggca agatctagag ggaacccctt     4800
          acctggaatc tggaatcagc ctcttctctg atgaccctga atctgatcct tctgaagaca     4860
          gagccccaga gtcagctcgt gttggcaaca taccatcttc aacctctgca ttgaaagttc     4920
          cccaattgaa agttgcagaa tctgcccaga gtccagctgc tgctcatact actgatactg     4980
          ctgggtataa tgcaatggaa gaaagtgtga gcagggagaa gccagaattg acagcttcaa     5040
          cagaaagggt caacaaaaga atgtccatgg tggtgtctgg cctgacccca gaagaattta     5100
          tgctcgtgta caagtttgcc agaaaacacc acatcacttt aactaatcta attactgaag     5160
          agactactca tgttgttatg aaaacagatg ctgagtttgt gtgtgaacgg acactgaaat     5220
          attttctagg aattgcggga ggaaaatggg tagttagcta tttctgggtg acccagtcta     5280
          ttaaagaaag aaaaatgctg aatgagcatg attttgaagt cagaggagat gtggtcaatg     5340
          gaagaaacca ccaaggtcca aagcgagcaa gagaatccca ggacagaaag atcttcaggg     5400
          ggctagaaat ctgttgctat gggcccttca ccaacatgcc cacagatcaa ctggaatgga     5460
          tggtacagct gtgtggtgct tctgtggtga aggagctttc atcattcacc cttggcacag     5520
          gtgtccaccc aattgtggtt gtgcagccag atgcctggac agaggacaat ggcttccatg     5580
          caattgggca gatgtgtgag gcacctgtgg tgacccgaga gtgggtgttg gacagtgtag     5640
          cactctacca gtgccaggag ctggacacct acctgatacc ccagatcccc cacagccact     5700
          actgactgca gccagccaca ggtacagagc cacaggaccc caagaatgag cttacaaagt     5760
          ggcctttcca ggccctggga gctcctctca ctcttcagtc cttctactgt cctggctact     5820
          aaatatttta tgtacatcag cctgaaaagg acttctggct atgcaagggt cccttaaaga     5880
          ttttctgctt gaagtctccc ttggaaatct gccatgagca caaaattatg gtaatttttc     5940
          acctgagaag attttaaaac catttaaacg ccaccaattg agcaagatgc tgattcatta     6000
          tttatcagcc ctattctttc tattcaggct gttgttggct tagggctgga agcacagagt     6060
          ggcttggcct caagagaata gctggtttcc ctaagtttac ttctctaaaa ccctgtgttc     6120
          acaaaggcag agagtcagac ccttcaatgg aaggagagtg cttgggatcg attatgtgac     6180
          ttaaagtcag aatagtcctt gggcagttct caaatgttgg agtggaacat tggggaggaa     6240
          attctgaggc aggtattaga aatgaaaagg aaacttgaaa cctgggcatg gtggctcacg     6300
          cctgtaatcc cagcactttg ggaggccaag gtgggcagat cactggaggt caggagttcg     6360
          aaaccagcct ggccaacatg gtgaaacccc atctctacta aaaatacaga aattagccgg     6420
          tcatggtggt ggacacctgt aatcccagct actcaggtgg ctaaggcagg agaatcactt     6480
          cagcccggga ggtggaggtt gcagtgagcc aagatcatac cacggcactc cagcctgggt     6540
          gacagtgaga ctgtggctca aaaaaaaaaa aaaaaaaagg aaaatgaaac tagaagagat     6600
          ttctaaaagt ctgagatata tttgctagat ttctaaagaa tgtgttctaa aacagcagaa     6660
          gattttcaag aaccggtttc caaagacagt cttctaattc ctcattagta ataagtaaaa     6720
          tgtttattgt tgtagctctg gtatataatc cattcctctt aaaatataag acctctggca     6780
          tgaatatttc atatctataa aatgacagat cccaccagga aggaagctgt tgctttcttt     6840
          gaggtgattt ttttcctttg ctccctgttg ctgaaaccat acagcttcat aaataatttt     6900
          gcttgctgaa ggaagaaaaa gtgtttttca taaacccatt atccaggact gtttatagct     6960
          gttggaagga ctaggtcttc cctagccccc ccagtgtgca agggcagtga agacttgatt     7020
          gtacaaaata cgttttgtaa atgttgtgct gttaacactg caaataaact tggtagcaaa     7080
          cacttcca                                                              7088
          <![CDATA[<210>  8]]>
          <![CDATA[<211>  1863]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  8]]>
          Met Asp Leu Ser Ala Leu Arg Val Glu Glu Val Gln Asn Val Ile Asn 
          1               5                   10                  15      
          Ala Met Gln Lys Ile Leu Glu Cys Pro Ile Cys Leu Glu Leu Ile Lys 
                      20                  25                  30          
          Glu Pro Val Ser Thr Lys Cys Asp His Ile Phe Cys Lys Phe Cys Met 
                  35                  40                  45              
          Leu Lys Leu Leu Asn Gln Lys Lys Gly Pro Ser Gln Cys Pro Leu Cys 
              50                  55                  60                  
          Lys Asn Asp Ile Thr Lys Arg Ser Leu Gln Glu Ser Thr Arg Phe Ser 
          65                  70                  75                  80  
          Gln Leu Val Glu Glu Leu Leu Lys Ile Ile Cys Ala Phe Gln Leu Asp 
                          85                  90                  95      
          Thr Gly Leu Glu Tyr Ala Asn Ser Tyr Asn Phe Ala Lys Lys Glu Asn 
                      100                 105                 110         
          Asn Ser Pro Glu His Leu Lys Asp Glu Val Ser Ile Ile Gln Ser Met 
                  115                 120                 125             
          Gly Tyr Arg Asn Arg Ala Lys Arg Leu Leu Gln Ser Glu Pro Glu Asn 
              130                 135                 140                 
          Pro Ser Leu Gln Glu Thr Ser Leu Ser Val Gln Leu Ser Asn Leu Gly 
          145                 150                 155                 160 
          Thr Val Arg Thr Leu Arg Thr Lys Gln Arg Ile Gln Pro Gln Lys Thr 
                          165                 170                 175     
          Ser Val Tyr Ile Glu Leu Gly Ser Asp Ser Ser Glu Asp Thr Val Asn 
                      180                 185                 190         
          Lys Ala Thr Tyr Cys Ser Val Gly Asp Gln Glu Leu Leu Gln Ile Thr 
                  195                 200                 205             
          Pro Gln Gly Thr Arg Asp Glu Ile Ser Leu Asp Ser Ala Lys Lys Ala 
              210                 215                 220                 
          Ala Cys Glu Phe Ser Glu Thr Asp Val Thr Asn Thr Glu His His Gln 
          225                 230                 235                 240 
          Pro Ser Asn Asn Asp Leu Asn Thr Thr Glu Lys Arg Ala Ala Glu Arg 
                          245                 250                 255     
          His Pro Glu Lys Tyr Gln Gly Ser Ser Val Ser Asn Leu His Val Glu 
                      260                 265                 270         
          Pro Cys Gly Thr Asn Thr His Ala Ser Ser Leu Gln His Glu Asn Ser 
                  275                 280                 285             
          Ser Leu Leu Leu Thr Lys Asp Arg Met Asn Val Glu Lys Ala Glu Phe 
              290                 295                 300                 
          Cys Asn Lys Ser Lys Gln Pro Gly Leu Ala Arg Ser Gln His Asn Arg 
          305                 310                 315                 320 
          Trp Ala Gly Ser Lys Glu Thr Cys Asn Asp Arg Arg Thr Pro Ser Thr 
                          325                 330                 335     
          Glu Lys Lys Val Asp Leu Asn Ala Asp Pro Leu Cys Glu Arg Lys Glu 
                      340                 345                 350         
          Trp Asn Lys Gln Lys Leu Pro Cys Ser Glu Asn Pro Arg Asp Thr Glu 
                  355                 360                 365             
          Asp Val Pro Trp Ile Thr Leu Asn Ser Ser Ile Gln Lys Val Asn Glu 
              370                 375                 380                 
          Trp Phe Ser Arg Ser Asp Glu Leu Leu Gly Ser Asp Asp Ser His Asp 
          385                 390                 395                 400 
          Gly Glu Ser Glu Ser Asn Ala Lys Val Ala Asp Val Leu Asp Val Leu 
                          405                 410                 415     
          Asn Glu Val Asp Glu Tyr Ser Gly Ser Ser Glu Lys Ile Asp Leu Leu 
                      420                 425                 430         
          Ala Ser Asp Pro His Glu Ala Leu Ile Cys Lys Ser Glu Arg Val His 
                  435                 440                 445             
          Ser Lys Ser Val Glu Ser Asn Ile Glu Asp Lys Ile Phe Gly Lys Thr 
              450                 455                 460                 
          Tyr Arg Lys Lys Ala Ser Leu Pro Asn Leu Ser His Val Thr Glu Asn 
          465                 470                 475                 480 
          Leu Ile Ile Gly Ala Phe Val Thr Glu Pro Gln Ile Ile Gln Glu Arg 
                          485                 490                 495     
          Pro Leu Thr Asn Lys Leu Lys Arg Lys Arg Arg Pro Thr Ser Gly Leu 
                      500                 505                 510         
          His Pro Glu Asp Phe Ile Lys Lys Ala Asp Leu Ala Val Gln Lys Thr 
                  515                 520                 525             
          Pro Glu Met Ile Asn Gln Gly Thr Asn Gln Thr Glu Gln Asn Gly Gln 
              530                 535                 540                 
          Val Met Asn Ile Thr Asn Ser Gly His Glu Asn Lys Thr Lys Gly Asp 
          545                 550                 555                 560 
          Ser Ile Gln Asn Glu Lys Asn Pro Asn Pro Ile Glu Ser Leu Glu Lys 
                          565                 570                 575     
          Glu Ser Ala Phe Lys Thr Lys Ala Glu Pro Ile Ser Ser Ser Ile Ser 
                      580                 585                 590         
          Asn Met Glu Leu Glu Leu Asn Ile His Asn Ser Lys Ala Pro Lys Lys 
                  595                 600                 605             
          Asn Arg Leu Arg Arg Lys Ser Ser Thr Arg His Ile His Ala Leu Glu 
              610                 615                 620                 
          Leu Val Val Ser Arg Asn Leu Ser Pro Pro Asn Cys Thr Glu Leu Gln 
          625                 630                 635                 640 
          Ile Asp Ser Cys Ser Ser Ser Glu Glu Ile Lys Lys Lys Lys Tyr Asn 
                          645                 650                 655     
          Gln Met Pro Val Arg His Ser Arg Asn Leu Gln Leu Met Glu Gly Lys 
                      660                 665                 670         
          Glu Pro Ala Thr Gly Ala Lys Lys Ser Asn Lys Pro Asn Glu Gln Thr 
                  675                 680                 685             
          Ser Lys Arg His Asp Ser Asp Thr Phe Pro Glu Leu Lys Leu Thr Asn 
              690                 695                 700                 
          Ala Pro Gly Ser Phe Thr Lys Cys Ser Asn Thr Ser Glu Leu Lys Glu 
          705                 710                 715                 720 
          Phe Val Asn Pro Ser Leu Pro Arg Glu Glu Lys Glu Glu Lys Leu Glu 
                          725                 730                 735     
          Thr Val Lys Val Ser Asn Asn Ala Glu Asp Pro Lys Asp Leu Met Leu 
                      740                 745                 750         
          Ser Gly Glu Arg Val Leu Gln Thr Glu Arg Ser Val Glu Ser Ser Ser 
                  755                 760                 765             
          Ile Ser Leu Val Pro Gly Thr Asp Tyr Gly Thr Gln Glu Ser Ile Ser 
              770                 775                 780                 
          Leu Leu Glu Val Ser Thr Leu Gly Lys Ala Lys Thr Glu Pro Asn Lys 
          785                 790                 795                 800 
          Cys Val Ser Gln Cys Ala Ala Phe Glu Asn Pro Lys Gly Leu Ile His 
                          805                 810                 815     
          Gly Cys Ser Lys Asp Asn Arg Asn Asp Thr Glu Gly Phe Lys Tyr Pro 
                      820                 825                 830         
          Leu Gly His Glu Val Asn His Ser Arg Glu Thr Ser Ile Glu Met Glu 
                  835                 840                 845             
          Glu Ser Glu Leu Asp Ala Gln Tyr Leu Gln Asn Thr Phe Lys Val Ser 
              850                 855                 860                 
          Lys Arg Gln Ser Phe Ala Pro Phe Ser Asn Pro Gly Asn Ala Glu Glu 
          865                 870                 875                 880 
          Glu Cys Ala Thr Phe Ser Ala His Ser Gly Ser Leu Lys Lys Gln Ser 
                          885                 890                 895     
          Pro Lys Val Thr Phe Glu Cys Glu Gln Lys Glu Glu Asn Gln Gly Lys 
                      900                 905                 910         
          Asn Glu Ser Asn Ile Lys Pro Val Gln Thr Val Asn Ile Thr Ala Gly 
                  915                 920                 925             
          Phe Pro Val Val Gly Gln Lys Asp Lys Pro Val Asp Asn Ala Lys Cys 
              930                 935                 940                 
          Ser Ile Lys Gly Gly Ser Arg Phe Cys Leu Ser Ser Gln Phe Arg Gly 
          945                 950                 955                 960 
          Asn Glu Thr Gly Leu Ile Thr Pro Asn Lys His Gly Leu Leu Gln Asn 
                          965                 970                 975     
          Pro Tyr Arg Ile Pro Pro Leu Phe Pro Ile Lys Ser Phe Val Lys Thr 
                      980                 985                 990         
          Lys Cys Lys Lys Asn Leu Leu Glu  Glu Asn Phe Glu Glu  His Ser Met 
                  995                 1000                 1005             
          Ser Pro  Glu Arg Glu Met Gly  Asn Glu Asn Ile Pro  Ser Thr Val 
              1010                 1015                 1020             
          Ser Thr  Ile Ser Arg Asn Asn  Ile Arg Glu Asn Val  Phe Lys Glu 
              1025                 1030                 1035             
          Ala Ser  Ser Ser Asn Ile Asn  Glu Val Gly Ser Ser  Thr Asn Glu 
              1040                 1045                 1050             
          Val Gly  Ser Ser Ile Asn Glu  Ile Gly Ser Ser Asp  Glu Asn Ile 
              1055                 1060                 1065             
          Gln Ala  Glu Leu Gly Arg Asn  Arg Gly Pro Lys Leu  Asn Ala Met 
              1070                 1075                 1080             
          Leu Arg  Leu Gly Val Leu Gln  Pro Glu Val Tyr Lys  Gln Ser Leu 
              1085                 1090                 1095             
          Pro Gly  Ser Asn Cys Lys His  Pro Glu Ile Lys Lys  Gln Glu Tyr 
              1100                 1105                 1110             
          Glu Glu  Val Val Gln Thr Val  Asn Thr Asp Phe Ser  Pro Tyr Leu 
              1115                 1120                 1125             
          Ile Ser  Asp Asn Leu Glu Gln  Pro Met Gly Ser Ser  His Ala Ser 
              1130                 1135                 1140             
          Gln Val  Cys Ser Glu Thr Pro  Asp Asp Leu Leu Asp  Asp Gly Glu 
              1145                 1150                 1155             
          Ile Lys  Glu Asp Thr Ser Phe  Ala Glu Asn Asp Ile  Lys Glu Ser 
              1160                 1165                 1170             
          Ser Ala  Val Phe Ser Lys Ser  Val Gln Lys Gly Glu  Leu Ser Arg 
              1175                 1180                 1185             
          Ser Pro  Ser Pro Phe Thr His  Thr His Leu Ala Gln  Gly Tyr Arg 
              1190                 1195                 1200             
          Arg Gly  Ala Lys Lys Leu Glu  Ser Ser Glu Glu Asn  Leu Ser Ser 
              1205                 1210                 1215             
          Glu Asp  Glu Glu Leu Pro Cys  Phe Gln His Leu Leu  Phe Gly Lys 
              1220                 1225                 1230             
          Val Asn  Asn Ile Pro Ser Gln  Ser Thr Arg His Ser  Thr Val Ala 
              1235                 1240                 1245             
          Thr Glu  Cys Leu Ser Lys Asn  Thr Glu Glu Asn Leu  Leu Ser Leu 
              1250                 1255                 1260             
          Lys Asn  Ser Leu Asn Asp Cys  Ser Asn Gln Val Ile  Leu Ala Lys 
              1265                 1270                 1275             
          Ala Ser  Gln Glu His His Leu  Ser Glu Glu Thr Lys  Cys Ser Ala 
              1280                 1285                 1290             
          Ser Leu  Phe Ser Ser Gln Cys  Ser Glu Leu Glu Asp  Leu Thr Ala 
              1295                 1300                 1305             
          Asn Thr  Asn Thr Gln Asp Pro  Phe Leu Ile Gly Ser  Ser Lys Gln 
              1310                 1315                 1320             
          Met Arg  His Gln Ser Glu Ser  Gln Gly Val Gly Leu  Ser Asp Lys 
              1325                 1330                 1335             
          Glu Leu  Val Ser Asp Asp Glu  Glu Arg Gly Thr Gly  Leu Glu Glu 
              1340                 1345                 1350             
          Asn Asn  Gln Glu Glu Gln Ser  Met Asp Ser Asn Leu  Gly Glu Ala 
              1355                 1360                 1365             
          Ala Ser  Gly Cys Glu Ser Glu  Thr Ser Val Ser Glu  Asp Cys Ser 
              1370                 1375                 1380             
          Gly Leu  Ser Ser Gln Ser Asp  Ile Leu Thr Thr Gln  Gln Arg Asp 
              1385                 1390                 1395             
          Thr Met  Gln His Asn Leu Ile  Lys Leu Gln Gln Glu  Met Ala Glu 
              1400                 1405                 1410             
          Leu Glu  Ala Val Leu Glu Gln  His Gly Ser Gln Pro  Ser Asn Ser 
              1415                 1420                 1425             
          Tyr Pro  Ser Ile Ile Ser Asp  Ser Ser Ala Leu Glu  Asp Leu Arg 
              1430                 1435                 1440             
          Asn Pro  Glu Gln Ser Thr Ser  Glu Lys Ala Val Leu  Thr Ser Gln 
              1445                 1450                 1455             
          Lys Ser  Ser Glu Tyr Pro Ile  Ser Gln Asn Pro Glu  Gly Leu Ser 
              1460                 1465                 1470             
          Ala Asp  Lys Phe Glu Val Ser  Ala Asp Ser Ser Thr  Ser Lys Asn 
              1475                 1480                 1485             
          Lys Glu  Pro Gly Val Glu Arg  Ser Ser Pro Ser Lys  Cys Pro Ser 
              1490                 1495                 1500             
          Leu Asp  Asp Arg Trp Tyr Met  His Ser Cys Ser Gly  Ser Leu Gln 
              1505                 1510                 1515             
          Asn Arg  Asn Tyr Pro Ser Gln  Glu Glu Leu Ile Lys  Val Val Asp 
              1520                 1525                 1530             
          Val Glu  Glu Gln Gln Leu Glu  Glu Ser Gly Pro His  Asp Leu Thr 
              1535                 1540                 1545             
          Glu Thr  Ser Tyr Leu Pro Arg  Gln Asp Leu Glu Gly  Thr Pro Tyr 
              1550                 1555                 1560             
          Leu Glu  Ser Gly Ile Ser Leu  Phe Ser Asp Asp Pro  Glu Ser Asp 
              1565                 1570                 1575             
          Pro Ser  Glu Asp Arg Ala Pro  Glu Ser Ala Arg Val  Gly Asn Ile 
              1580                 1585                 1590             
          Pro Ser  Ser Thr Ser Ala Leu  Lys Val Pro Gln Leu  Lys Val Ala 
              1595                 1600                 1605             
          Glu Ser  Ala Gln Ser Pro Ala  Ala Ala His Thr Thr  Asp Thr Ala 
              1610                 1615                 1620             
          Gly Tyr  Asn Ala Met Glu Glu  Ser Val Ser Arg Glu  Lys Pro Glu 
              1625                 1630                 1635             
          Leu Thr  Ala Ser Thr Glu Arg  Val Asn Lys Arg Met  Ser Met Val 
              1640                 1645                 1650             
          Val Ser  Gly Leu Thr Pro Glu  Glu Phe Met Leu Val  Tyr Lys Phe 
              1655                 1660                 1665             
          Ala Arg  Lys His His Ile Thr  Leu Thr Asn Leu Ile  Thr Glu Glu 
              1670                 1675                 1680             
          Thr Thr  His Val Val Met Lys  Thr Asp Ala Glu Phe  Val Cys Glu 
              1685                 1690                 1695             
          Arg Thr  Leu Lys Tyr Phe Leu  Gly Ile Ala Gly Gly  Lys Trp Val 
              1700                 1705                 1710             
          Val Ser  Tyr Phe Trp Val Thr  Gln Ser Ile Lys Glu  Arg Lys Met 
              1715                 1720                 1725             
          Leu Asn  Glu His Asp Phe Glu  Val Arg Gly Asp Val  Val Asn Gly 
              1730                 1735                 1740             
          Arg Asn  His Gln Gly Pro Lys  Arg Ala Arg Glu Ser  Gln Asp Arg 
              1745                 1750                 1755             
          Lys Ile  Phe Arg Gly Leu Glu  Ile Cys Cys Tyr Gly  Pro Phe Thr 
              1760                 1765                 1770             
          Asn Met  Pro Thr Asp Gln Leu  Glu Trp Met Val Gln  Leu Cys Gly 
              1775                 1780                 1785             
          Ala Ser  Val Val Lys Glu Leu  Ser Ser Phe Thr Leu  Gly Thr Gly 
              1790                 1795                 1800             
          Val His  Pro Ile Val Val Val  Gln Pro Asp Ala Trp  Thr Glu Asp 
              1805                 1810                 1815             
          Asn Gly  Phe His Ala Ile Gly  Gln Met Cys Glu Ala  Pro Val Val 
              1820                 1825                 1830             
          Thr Arg  Glu Trp Val Leu Asp  Ser Val Ala Leu Tyr  Gln Cys Gln 
              1835                 1840                 1845             
          Glu Leu  Asp Thr Tyr Leu Ile  Pro Gln Ile Pro His  Ser His Tyr 
              1850                 1855                 1860             
          <![CDATA[<210>  9]]>
          <![CDATA[<211>  11954]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  9]]>
          agaggcggag ccgctgtggc actgctgcgc ctctgctgcg cctcgggtgt cttttgcggc       60
          ggtgggtcgc cgccgggaga agcgtgaggg gacagatttg tgaccggcgc ggtttttgtc      120
          agcttactcc ggccaaaaaa gaactgcacc tctggagcgg acttatttac caagcattgg      180
          aggaatatcg taggtaaaaa tgcctattgg atccaaagag aggccaacat tttttgaaat      240
          ttttaagaca cgctgcaaca aagcagattt aggaccaata agtcttaatt ggtttgaaga      300
          actttcttca gaagctccac cctataattc tgaacctgca gaagaatctg aacataaaaa      360
          caacaattac gaaccaaacc tatttaaaac tccacaaagg aaaccatctt ataatcagct      420
          ggcttcaact ccaataatat tcaaagagca agggctgact ctgccgctgt accaatctcc      480
          tgtaaaagaa ttagataaat tcaaattaga cttaggaagg aatgttccca atagtagaca      540
          taaaagtctt cgcacagtga aaactaaaat ggatcaagca gatgatgttt cctgtccact      600
          tctaaattct tgtcttagtg aaagtcctgt tgttctacaa tgtacacatg taacaccaca      660
          aagagataag tcagtggtat gtgggagttt gtttcataca ccaaagtttg tgaagggtcg      720
          tcagacacca aaacatattt ctgaaagtct aggagctgag gtggatcctg atatgtcttg      780
          gtcaagttct ttagctacac cacccaccct tagttctact gtgctcatag tcagaaatga      840
          agaagcatct gaaactgtat ttcctcatga tactactgct aatgtgaaaa gctatttttc      900
          caatcatgat gaaagtctga agaaaaatga tagatttatc gcttctgtga cagacagtga      960
          aaacacaaat caaagagaag ctgcaagtca tggatttgga aaaacatcag ggaattcatt     1020
          taaagtaaat agctgcaaag accacattgg aaagtcaatg ccaaatgtcc tagaagatga     1080
          agtatatgaa acagttgtag atacctctga agaagatagt ttttcattat gtttttctaa     1140
          atgtagaaca aaaaatctac aaaaagtaag aactagcaag actaggaaaa aaattttcca     1200
          tgaagcaaac gctgatgaat gtgaaaaatc taaaaaccaa gtgaaagaaa aatactcatt     1260
          tgtatctgaa gtggaaccaa atgatactga tccattagat tcaaatgtag caaatcagaa     1320
          gccctttgag agtggaagtg acaaaatctc caaggaagtt gtaccgtctt tggcctgtga     1380
          atggtctcaa ctaacccttt caggtctaaa tggagcccag atggagaaaa tacccctatt     1440
          gcatatttct tcatgtgacc aaaatatttc agaaaaagac ctattagaca cagagaacaa     1500
          aagaaagaaa gattttctta cttcagagaa ttctttgcca cgtatttcta gcctaccaaa     1560
          atcagagaag ccattaaatg aggaaacagt ggtaaataag agagatgaag agcagcatct     1620
          tgaatctcat acagactgca ttcttgcagt aaagcaggca atatctggaa cttctccagt     1680
          ggcttcttca tttcagggta tcaaaaagtc tatattcaga ataagagaat cacctaaaga     1740
          gactttcaat gcaagttttt caggtcatat gactgatcca aactttaaaa aagaaactga     1800
          agcctctgaa agtggactgg aaatacatac tgtttgctca cagaaggagg actccttatg     1860
          tccaaattta attgataatg gaagctggcc agccaccacc acacagaatt ctgtagcttt     1920
          gaagaatgca ggtttaatat ccactttgaa aaagaaaaca aataagttta tttatgctat     1980
          acatgatgaa acatcttata aaggaaaaaa aataccgaaa gaccaaaaat cagaactaat     2040
          taactgttca gcccagtttg aagcaaatgc ttttgaagca ccacttacat ttgcaaatgc     2100
          tgattcaggt ttattgcatt cttctgtgaa aagaagctgt tcacagaatg attctgaaga     2160
          accaactttg tccttaacta gctcttttgg gacaattctg aggaaatgtt ctagaaatga     2220
          aacatgttct aataatacag taatctctca ggatcttgat tataaagaag caaaatgtaa     2280
          taaggaaaaa ctacagttat ttattacccc agaagctgat tctctgtcat gcctgcagga     2340
          aggacagtgt gaaaatgatc caaaaagcaa aaaagtttca gatataaaag aagaggtctt     2400
          ggctgcagca tgtcacccag tacaacattc aaaagtggaa tacagtgata ctgactttca     2460
          atcccagaaa agtcttttat atgatcatga aaatgccagc actcttattt taactcctac     2520
          ttccaaggat gttctgtcaa acctagtcat gatttctaga ggcaaagaat catacaaaat     2580
          gtcagacaag ctcaaaggta acaattatga atctgatgtt gaattaacca aaaatattcc     2640
          catggaaaag aatcaagatg tatgtgcttt aaatgaaaat tataaaaacg ttgagctgtt     2700
          gccacctgaa aaatacatga gagtagcatc accttcaaga aaggtacaat tcaaccaaaa     2760
          cacaaatcta agagtaatcc aaaaaaatca agaagaaact acttcaattt caaaaataac     2820
          tgtcaatcca gactctgaag aacttttctc agacaatgag aataattttg tcttccaagt     2880
          agctaatgaa aggaataatc ttgctttagg aaatactaag gaacttcatg aaacagactt     2940
          gacttgtgta aacgaaccca ttttcaagaa ctctaccatg gttttatatg gagacacagg     3000
          tgataaacaa gcaacccaag tgtcaattaa aaaagatttg gtttatgttc ttgcagagga     3060
          gaacaaaaat agtgtaaagc agcatataaa aatgactcta ggtcaagatt taaaatcgga     3120
          catctccttg aatatagata aaataccaga aaaaaataat gattacatga acaaatgggc     3180
          aggactctta ggtccaattt caaatcacag ttttggaggt agcttcagaa cagcttcaaa     3240
          taaggaaatc aagctctctg aacataacat taagaagagc aaaatgttct tcaaagatat     3300
          tgaagaacaa tatcctacta gtttagcttg tgttgaaatt gtaaatacct tggcattaga     3360
          taatcaaaag aaactgagca agcctcagtc aattaatact gtatctgcac atttacagag     3420
          tagtgtagtt gtttctgatt gtaaaaatag tcatataacc cctcagatgt tattttccaa     3480
          gcaggatttt aattcaaacc ataatttaac acctagccaa aaggcagaaa ttacagaact     3540
          ttctactata ttagaagaat caggaagtca gtttgaattt actcagttta gaaaaccaag     3600
          ctacatattg cagaagagta catttgaagt gcctgaaaac cagatgacta tcttaaagac     3660
          cacttctgag gaatgcagag atgctgatct tcatgtcata atgaatgccc catcgattgg     3720
          tcaggtagac agcagcaagc aatttgaagg tacagttgaa attaaacgga agtttgctgg     3780
          cctgttgaaa aatgactgta acaaaagtgc ttctggttat ttaacagatg aaaatgaagt     3840
          ggggtttagg ggcttttatt ctgctcatgg cacaaaactg aatgtttcta ctgaagctct     3900
          gcaaaaagct gtgaaactgt ttagtgatat tgagaatatt agtgaggaaa cttctgcaga     3960
          ggtacatcca ataagtttat cttcaagtaa atgtcatgat tctgttgttt caatgtttaa     4020
          gatagaaaat cataatgata aaactgtaag tgaaaaaaat aataaatgcc aactgatatt     4080
          acaaaataat attgaaatga ctactggcac ttttgttgaa gaaattactg aaaattacaa     4140
          gagaaatact gaaaatgaag ataacaaata tactgctgcc agtagaaatt ctcataactt     4200
          agaatttgat ggcagtgatt caagtaaaaa tgatactgtt tgtattcata aagatgaaac     4260
          ggacttgcta tttactgatc agcacaacat atgtcttaaa ttatctggcc agtttatgaa     4320
          ggagggaaac actcagatta aagaagattt gtcagattta acttttttgg aagttgcgaa     4380
          agctcaagaa gcatgtcatg gtaatacttc aaataaagaa cagttaactg ctactaaaac     4440
          ggagcaaaat ataaaagatt ttgagacttc tgatacattt tttcagactg caagtgggaa     4500
          aaatattagt gtcgccaaag agtcatttaa taaaattgta aatttctttg atcagaaacc     4560
          agaagaattg cataactttt ccttaaattc tgaattacat tctgacataa gaaagaacaa     4620
          aatggacatt ctaagttatg aggaaacaga catagttaaa cacaaaatac tgaaagaaag     4680
          tgtcccagtt ggtactggaa atcaactagt gaccttccag ggacaacccg aacgtgatga     4740
          aaagatcaaa gaacctactc tattgggttt tcatacagct agcgggaaaa aagttaaaat     4800
          tgcaaaggaa tctttggaca aagtgaaaaa cctttttgat gaaaaagagc aaggtactag     4860
          tgaaatcacc agttttagcc atcaatgggc aaagacccta aagtacagag aggcctgtaa     4920
          agaccttgaa ttagcatgtg agaccattga gatcacagct gccccaaagt gtaaagaaat     4980
          gcagaattct ctcaataatg ataaaaacct tgtttctatt gagactgtgg tgccacctaa     5040
          gctcttaagt gataatttat gtagacaaac tgaaaatctc aaaacatcaa aaagtatctt     5100
          tttgaaagtt aaagtacatg aaaatgtaga aaaagaaaca gcaaaaagtc ctgcaacttg     5160
          ttacacaaat cagtcccctt attcagtcat tgaaaattca gccttagctt tttacacaag     5220
          ttgtagtaga aaaacttctg tgagtcagac ttcattactt gaagcaaaaa aatggcttag     5280
          agaaggaata tttgatggtc aaccagaaag aataaatact gcagattatg taggaaatta     5340
          tttgtatgaa aataattcaa acagtactat agctgaaaat gacaaaaatc atctctccga     5400
          aaaacaagat acttatttaa gtaacagtag catgtctaac agctattcct accattctga     5460
          tgaggtatat aatgattcag gatatctctc aaaaaataaa cttgattctg gtattgagcc     5520
          agtattgaag aatgttgaag atcaaaaaaa cactagtttt tccaaagtaa tatccaatgt     5580
          aaaagatgca aatgcatacc cacaaactgt aaatgaagat atttgcgttg aggaacttgt     5640
          gactagctct tcaccctgca aaaataaaaa tgcagccatt aaattgtcca tatctaatag     5700
          taataatttt gaggtagggc cacctgcatt taggatagcc agtggtaaaa tcgtttgtgt     5760
          ttcacatgaa acaattaaaa aagtgaaaga catatttaca gacagtttca gtaaagtaat     5820
          taaggaaaac aacgagaata aatcaaaaat ttgccaaacg aaaattatgg caggttgtta     5880
          cgaggcattg gatgattcag aggatattct tcataactct ctagataatg atgaatgtag     5940
          cacgcattca cataaggttt ttgctgacat tcagagtgaa gaaattttac aacataacca     6000
          aaatatgtct ggattggaga aagtttctaa aatatcacct tgtgatgtta gtttggaaac     6060
          ttcagatata tgtaaatgta gtatagggaa gcttcataag tcagtctcat ctgcaaatac     6120
          ttgtgggatt tttagcacag caagtggaaa atctgtccag gtatcagatg cttcattaca     6180
          aaacgcaaga caagtgtttt ctgaaataga agatagtacc aagcaagtct tttccaaagt     6240
          attgtttaaa agtaacgaac attcagacca gctcacaaga gaagaaaata ctgctatacg     6300
          tactccagaa catttaatat cccaaaaagg cttttcatat aatgtggtaa attcatctgc     6360
          tttctctgga tttagtacag caagtggaaa gcaagtttcc attttagaaa gttccttaca     6420
          caaagttaag ggagtgttag aggaatttga tttaatcaga actgagcata gtcttcacta     6480
          ttcacctacg tctagacaaa atgtatcaaa aatacttcct cgtgttgata agagaaaccc     6540
          agagcactgt gtaaactcag aaatggaaaa aacctgcagt aaagaattta aattatcaaa     6600
          taacttaaat gttgaaggtg gttcttcaga aaataatcac tctattaaag tttctccata     6660
          tctctctcaa tttcaacaag acaaacaaca gttggtatta ggaaccaaag tgtcacttgt     6720
          tgagaacatt catgttttgg gaaaagaaca ggcttcacct aaaaacgtaa aaatggaaat     6780
          tggtaaaact gaaacttttt ctgatgttcc tgtgaaaaca aatatagaag tttgttctac     6840
          ttactccaaa gattcagaaa actactttga aacagaagca gtagaaattg ctaaagcttt     6900
          tatggaagat gatgaactga cagattctaa actgccaagt catgccacac attctctttt     6960
          tacatgtccc gaaaatgagg aaatggtttt gtcaaattca agaattggaa aaagaagagg     7020
          agagcccctt atcttagtgg gagaaccctc aatcaaaaga aacttattaa atgaatttga     7080
          caggataata gaaaatcaag aaaaatcctt aaaggcttca aaaagcactc cagatggcac     7140
          aataaaagat cgaagattgt ttatgcatca tgtttcttta gagccgatta cctgtgtacc     7200
          ctttcgcaca actaaggaac gtcaagagat acagaatcca aattttaccg cacctggtca     7260
          agaatttctg tctaaatctc atttgtatga acatctgact ttggaaaaat cttcaagcaa     7320
          tttagcagtt tcaggacatc cattttatca agtttctgct acaagaaatg aaaaaatgag     7380
          acacttgatt actacaggca gaccaaccaa agtctttgtt ccacctttta aaactaaatc     7440
          acattttcac agagttgaac agtgtgttag gaatattaac ttggaggaaa acagacaaaa     7500
          gcaaaacatt gatggacatg gctctgatga tagtaaaaat aagattaatg acaatgagat     7560
          tcatcagttt aacaaaaaca actccaatca agcagtagct gtaactttca caaagtgtga     7620
          agaagaacct ttagatttaa ttacaagtct tcagaatgcc agagatatac aggatatgcg     7680
          aattaagaag aaacaaaggc aacgcgtctt tccacagcca ggcagtctgt atcttgcaaa     7740
          aacatccact ctgcctcgaa tctctctgaa agcagcagta ggaggccaag ttccctctgc     7800
          gtgttctcat aaacagctgt atacgtatgg cgtttctaaa cattgcataa aaattaacag     7860
          caaaaatgca gagtcttttc agtttcacac tgaagattat tttggtaagg aaagtttatg     7920
          gactggaaaa ggaatacagt tggctgatgg tggatggctc ataccctcca atgatggaaa     7980
          ggctggaaaa gaagaatttt atagggctct gtgtgacact ccaggtgtgg atccaaagct     8040
          tatttctaga atttgggttt ataatcacta tagatggatc atatggaaac tggcagctat     8100
          ggaatgtgcc tttcctaagg aatttgctaa tagatgccta agcccagaaa gggtgcttct     8160
          tcaactaaaa tacagatatg atacggaaat tgatagaagc agaagatcgg ctataaaaaa     8220
          gataatggaa agggatgaca cagctgcaaa aacacttgtt ctctgtgttt ctgacataat     8280
          ttcattgagc gcaaatatat ctgaaacttc tagcaataaa actagtagtg cagataccca     8340
          aaaagtggcc attattgaac ttacagatgg gtggtatgct gttaaggccc agttagatcc     8400
          tcccctctta gctgtcttaa agaatggcag actgacagtt ggtcagaaga ttattcttca     8460
          tggagcagaa ctggtgggct ctcctgatgc ctgtacacct cttgaagccc cagaatctct     8520
          tatgttaaag atttctgcta acagtactcg gcctgctcgc tggtatacca aacttggatt     8580
          ctttcctgac cctagacctt ttcctctgcc cttatcatcg cttttcagtg atggaggaaa     8640
          tgttggttgt gttgatgtaa ttattcaaag agcataccct atacagtgga tggagaagac     8700
          atcatctgga ttatacatat ttcgcaatga aagagaggaa gaaaaggaag cagcaaaata     8760
          tgtggaggcc caacaaaaga gactagaagc cttattcact aaaattcagg aggaatttga     8820
          agaacatgaa gaaaacacaa caaaaccata tttaccatca cgtgcactaa caagacagca     8880
          agttcgtgct ttgcaagatg gtgcagagct ttatgaagca gtgaagaatg cagcagaccc     8940
          agcttacctt gagggttatt tcagtgaaga gcagttaaga gccttgaata atcacaggca     9000
          aatgttgaat gataagaaac aagctcagat ccagttggaa attaggaagg ccatggaatc     9060
          tgctgaacaa aaggaacaag gtttatcaag ggatgtcaca accgtgtgga agttgcgtat     9120
          tgtaagctat tcaaaaaaag aaaaagattc agttatactg agtatttggc gtccatcatc     9180
          agatttatat tctctgttaa cagaaggaaa gagatacaga atttatcatc ttgcaacttc     9240
          aaaatctaaa agtaaatctg aaagagctaa catacagtta gcagcgacaa aaaaaactca     9300
          gtatcaacaa ctaccggttt cagatgaaat tttatttcag atttaccagc cacgggagcc     9360
          ccttcacttc agcaaatttt tagatccaga ctttcagcca tcttgttctg aggtggacct     9420
          aataggattt gtcgtttctg ttgtgaaaaa aacaggactt gcccctttcg tctatttgtc     9480
          agacgaatgt tacaatttac tggcaataaa gttttggata gaccttaatg aggacattat     9540
          taagcctcat atgttaattg ctgcaagcaa cctccagtgg cgaccagaat ccaaatcagg     9600
          ccttcttact ttatttgctg gagatttttc tgtgttttct gctagtccaa aagagggcca     9660
          ctttcaagag acattcaaca aaatgaaaaa tactgttgag aatattgaca tactttgcaa     9720
          tgaagcagaa aacaagctta tgcatatact gcatgcaaat gatcccaagt ggtccacccc     9780
          aactaaagac tgtacttcag ggccgtacac tgctcaaatc attcctggta caggaaacaa     9840
          gcttctgatg tcttctccta attgtgagat atattatcaa agtcctttat cactttgtat     9900
          ggccaaaagg aagtctgttt ccacacctgt ctcagcccag atgacttcaa agtcttgtaa     9960
          aggggagaaa gagattgatg accaaaagaa ctgcaaaaag agaagagcct tggatttctt    10020
          gagtagactg cctttacctc cacctgttag tcccatttgt acatttgttt ctccggctgc    10080
          acagaaggca tttcagccac caaggagttg tggcaccaaa tacgaaacac ccataaagaa    10140
          aaaagaactg aattctcctc agatgactcc atttaaaaaa ttcaatgaaa tttctctttt    10200
          ggaaagtaat tcaatagctg acgaagaact tgcattgata aatacccaag ctcttttgtc    10260
          tggttcaaca ggagaaaaac aatttatatc tgtcagtgaa tccactagga ctgctcccac    10320
          cagttcagaa gattatctca gactgaaacg acgttgtact acatctctga tcaaagaaca    10380
          ggagagttcc caggccagta cggaagaatg tgagaaaaat aagcaggaca caattacaac    10440
          taaaaaatat atctaagcat ttgcaaaggc gacaataaat tattgacgct taacctttcc    10500
          agtttataag actggaatat aatttcaaac cacacattag tacttatgtt gcacaatgag    10560
          aaaagaaatt agtttcaaat ttacctcagc gtttgtgtat cgggcaaaaa tcgttttgcc    10620
          cgattccgta ttggtatact tttgcttcag ttgcatatct taaaactaaa tgtaatttat    10680
          taactaatca agaaaaacat ctttggctga gctcggtggc tcatgcctgt aatcccaaca    10740
          ctttgagaag ctgaggtggg aggagtgctt gaggccagga gttcaagacc agcctgggca    10800
          acatagggag acccccatct ttacaaagaa aaaaaaaagg ggaaaagaaa atcttttaaa    10860
          tctttggatt tgatcactac aagtattatt ttacaagtga aataaacata ccattttctt    10920
          ttagattgtg tcattaaatg gaatgaggtc tcttagtaca gttattttga tgcagataat    10980
          tccttttagt ttagctacta ttttagggga ttttttttag aggtaactca ctatgaaata    11040
          gttctcctta atgcaaatat gttggttctg ctatagttcc atcctgttca aaagtcagga    11100
          tgaatatgaa gagtggtgtt tccttttgag caattcttca tccttaagtc agcatgatta    11160
          taagaaaaat agaaccctca gtgtaactct aattcctttt tactattcca gtgtgatctc    11220
          tgaaattaaa ttacttcaac taaaaattca aatactttaa atcagaagat ttcatagtta    11280
          atttattttt tttttcaaca aaatggtcat ccaaactcaa acttgagaaa atatcttgct    11340
          ttcaaattgg cactgattct gcctgcttta tttttagcgc tatcacagga cccagagcct    11400
          atgccctttt aaacttacca caaaagcaga agattaattc aatttaagat gatactctca    11460
          tttgttacgt cctttttttt tttttttgga gatggagtct tgctttgtcg cccatgctgg    11520
          agtgcagtgg catgatcctg gctcactgca gcctccactt cccgggttca cgtaattctc    11580
          ccacctcaag cctccctagt agctgggatt acagggacgc accaccatgc ccagctaatt    11640
          tttgcatttt tagtagagac tgggttttac catgttggcc aagctggtct caaactcctg    11700
          atgtcaggtg atccatctgc ctcagcctcc caaagtgctg ggattatagg cgtgagccac    11760
          tgtgcccggc caatatttgt tactttctta ggtttaatag agaaaaggga taaaacattt    11820
          ctaactggga gttaattgca tggagaaggt cttaaatcag atgttttaat gccttaaatg    11880
          tctgtataat atcatgtttt caaatctaat tataaatacg tttaaagcca agaataaatc    11940
          ttttaaaaaa ttga                                                      11954
          <![CDATA[<210>  10]]>
          <![CDATA[<211>  3418]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  10]]>
          Met Pro Ile Gly Ser Lys Glu Arg Pro Thr Phe Phe Glu Ile Phe Lys 
          1               5                   10                  15      
          Thr Arg Cys Asn Lys Ala Asp Leu Gly Pro Ile Ser Leu Asn Trp Phe 
                      20                  25                  30          
          Glu Glu Leu Ser Ser Glu Ala Pro Pro Tyr Asn Ser Glu Pro Ala Glu 
                  35                  40                  45              
          Glu Ser Glu His Lys Asn Asn Asn Tyr Glu Pro Asn Leu Phe Lys Thr 
              50                  55                  60                  
          Pro Gln Arg Lys Pro Ser Tyr Asn Gln Leu Ala Ser Thr Pro Ile Ile 
          65                  70                  75                  80  
          Phe Lys Glu Gln Gly Leu Thr Leu Pro Leu Tyr Gln Ser Pro Val Lys 
                          85                  90                  95      
          Glu Leu Asp Lys Phe Lys Leu Asp Leu Gly Arg Asn Val Pro Asn Ser 
                      100                 105                 110         
          Arg His Lys Ser Leu Arg Thr Val Lys Thr Lys Met Asp Gln Ala Asp 
                  115                 120                 125             
          Asp Val Ser Cys Pro Leu Leu Asn Ser Cys Leu Ser Glu Ser Pro Val 
              130                 135                 140                 
          Val Leu Gln Cys Thr His Val Thr Pro Gln Arg Asp Lys Ser Val Val 
          145                 150                 155                 160 
          Cys Gly Ser Leu Phe His Thr Pro Lys Phe Val Lys Gly Arg Gln Thr 
                          165                 170                 175     
          Pro Lys His Ile Ser Glu Ser Leu Gly Ala Glu Val Asp Pro Asp Met 
                      180                 185                 190         
          Ser Trp Ser Ser Ser Leu Ala Thr Pro Pro Thr Leu Ser Ser Thr Val 
                  195                 200                 205             
          Leu Ile Val Arg Asn Glu Glu Ala Ser Glu Thr Val Phe Pro His Asp 
              210                 215                 220                 
          Thr Thr Ala Asn Val Lys Ser Tyr Phe Ser Asn His Asp Glu Ser Leu 
          225                 230                 235                 240 
          Lys Lys Asn Asp Arg Phe Ile Ala Ser Val Thr Asp Ser Glu Asn Thr 
                          245                 250                 255     
          Asn Gln Arg Glu Ala Ala Ser His Gly Phe Gly Lys Thr Ser Gly Asn 
                      260                 265                 270         
          Ser Phe Lys Val Asn Ser Cys Lys Asp His Ile Gly Lys Ser Met Pro 
                  275                 280                 285             
          Asn Val Leu Glu Asp Glu Val Tyr Glu Thr Val Val Asp Thr Ser Glu 
              290                 295                 300                 
          Glu Asp Ser Phe Ser Leu Cys Phe Ser Lys Cys Arg Thr Lys Asn Leu 
          305                 310                 315                 320 
          Gln Lys Val Arg Thr Ser Lys Thr Arg Lys Lys Ile Phe His Glu Ala 
                          325                 330                 335     
          Asn Ala Asp Glu Cys Glu Lys Ser Lys Asn Gln Val Lys Glu Lys Tyr 
                      340                 345                 350         
          Ser Phe Val Ser Glu Val Glu Pro Asn Asp Thr Asp Pro Leu Asp Ser 
                  355                 360                 365             
          Asn Val Ala Asn Gln Lys Pro Phe Glu Ser Gly Ser Asp Lys Ile Ser 
              370                 375                 380                 
          Lys Glu Val Val Pro Ser Leu Ala Cys Glu Trp Ser Gln Leu Thr Leu 
          385                 390                 395                 400 
          Ser Gly Leu Asn Gly Ala Gln Met Glu Lys Ile Pro Leu Leu His Ile 
                          405                 410                 415     
          Ser Ser Cys Asp Gln Asn Ile Ser Glu Lys Asp Leu Leu Asp Thr Glu 
                      420                 425                 430         
          Asn Lys Arg Lys Lys Asp Phe Leu Thr Ser Glu Asn Ser Leu Pro Arg 
                  435                 440                 445             
          Ile Ser Ser Leu Pro Lys Ser Glu Lys Pro Leu Asn Glu Glu Thr Val 
              450                 455                 460                 
          Val Asn Lys Arg Asp Glu Glu Gln His Leu Glu Ser His Thr Asp Cys 
          465                 470                 475                 480 
          Ile Leu Ala Val Lys Gln Ala Ile Ser Gly Thr Ser Pro Val Ala Ser 
                          485                 490                 495     
          Ser Phe Gln Gly Ile Lys Lys Ser Ile Phe Arg Ile Arg Glu Ser Pro 
                      500                 505                 510         
          Lys Glu Thr Phe Asn Ala Ser Phe Ser Gly His Met Thr Asp Pro Asn 
                  515                 520                 525             
          Phe Lys Lys Glu Thr Glu Ala Ser Glu Ser Gly Leu Glu Ile His Thr 
              530                 535                 540                 
          Val Cys Ser Gln Lys Glu Asp Ser Leu Cys Pro Asn Leu Ile Asp Asn 
          545                 550                 555                 560 
          Gly Ser Trp Pro Ala Thr Thr Thr Gln Asn Ser Val Ala Leu Lys Asn 
                          565                 570                 575     
          Ala Gly Leu Ile Ser Thr Leu Lys Lys Lys Thr Asn Lys Phe Ile Tyr 
                      580                 585                 590         
          Ala Ile His Asp Glu Thr Ser Tyr Lys Gly Lys Lys Ile Pro Lys Asp 
                  595                 600                 605             
          Gln Lys Ser Glu Leu Ile Asn Cys Ser Ala Gln Phe Glu Ala Asn Ala 
              610                 615                 620                 
          Phe Glu Ala Pro Leu Thr Phe Ala Asn Ala Asp Ser Gly Leu Leu His 
          625                 630                 635                 640 
          Ser Ser Val Lys Arg Ser Cys Ser Gln Asn Asp Ser Glu Glu Pro Thr 
                          645                 650                 655     
          Leu Ser Leu Thr Ser Ser Phe Gly Thr Ile Leu Arg Lys Cys Ser Arg 
                      660                 665                 670         
          Asn Glu Thr Cys Ser Asn Asn Thr Val Ile Ser Gln Asp Leu Asp Tyr 
                  675                 680                 685             
          Lys Glu Ala Lys Cys Asn Lys Glu Lys Leu Gln Leu Phe Ile Thr Pro 
              690                 695                 700                 
          Glu Ala Asp Ser Leu Ser Cys Leu Gln Glu Gly Gln Cys Glu Asn Asp 
          705                 710                 715                 720 
          Pro Lys Ser Lys Lys Val Ser Asp Ile Lys Glu Glu Val Leu Ala Ala 
                          725                 730                 735     
          Ala Cys His Pro Val Gln His Ser Lys Val Glu Tyr Ser Asp Thr Asp 
                      740                 745                 750         
          Phe Gln Ser Gln Lys Ser Leu Leu Tyr Asp His Glu Asn Ala Ser Thr 
                  755                 760                 765             
          Leu Ile Leu Thr Pro Thr Ser Lys Asp Val Leu Ser Asn Leu Val Met 
              770                 775                 780                 
          Ile Ser Arg Gly Lys Glu Ser Tyr Lys Met Ser Asp Lys Leu Lys Gly 
          785                 790                 795                 800 
          Asn Asn Tyr Glu Ser Asp Val Glu Leu Thr Lys Asn Ile Pro Met Glu 
                          805                 810                 815     
          Lys Asn Gln Asp Val Cys Ala Leu Asn Glu Asn Tyr Lys Asn Val Glu 
                      820                 825                 830         
          Leu Leu Pro Pro Glu Lys Tyr Met Arg Val Ala Ser Pro Ser Arg Lys 
                  835                 840                 845             
          Val Gln Phe Asn Gln Asn Thr Asn Leu Arg Val Ile Gln Lys Asn Gln 
              850                 855                 860                 
          Glu Glu Thr Thr Ser Ile Ser Lys Ile Thr Val Asn Pro Asp Ser Glu 
          865                 870                 875                 880 
          Glu Leu Phe Ser Asp Asn Glu Asn Asn Phe Val Phe Gln Val Ala Asn 
                          885                 890                 895     
          Glu Arg Asn Asn Leu Ala Leu Gly Asn Thr Lys Glu Leu His Glu Thr 
                      900                 905                 910         
          Asp Leu Thr Cys Val Asn Glu Pro Ile Phe Lys Asn Ser Thr Met Val 
                  915                 920                 925             
          Leu Tyr Gly Asp Thr Gly Asp Lys Gln Ala Thr Gln Val Ser Ile Lys 
              930                 935                 940                 
          Lys Asp Leu Val Tyr Val Leu Ala Glu Glu Asn Lys Asn Ser Val Lys 
          945                 950                 955                 960 
          Gln His Ile Lys Met Thr Leu Gly Gln Asp Leu Lys Ser Asp Ile Ser 
                          965                 970                 975     
          Leu Asn Ile Asp Lys Ile Pro Glu Lys Asn Asn Asp Tyr Met Asn Lys 
                      980                 985                 990         
          Trp Ala Gly Leu Leu Gly Pro Ile  Ser Asn His Ser Phe  Gly Gly Ser 
                  995                 1000                 1005             
          Phe Arg  Thr Ala Ser Asn Lys  Glu Ile Lys Leu Ser  Glu His Asn 
              1010                 1015                 1020             
          Ile Lys  Lys Ser Lys Met Phe  Phe Lys Asp Ile Glu  Glu Gln Tyr 
              1025                 1030                 1035             
          Pro Thr  Ser Leu Ala Cys Val  Glu Ile Val Asn Thr  Leu Ala Leu 
              1040                 1045                 1050             
          Asp Asn  Gln Lys Lys Leu Ser  Lys Pro Gln Ser Ile  Asn Thr Val 
              1055                 1060                 1065             
          Ser Ala  His Leu Gln Ser Ser  Val Val Val Ser Asp  Cys Lys Asn 
              1070                 1075                 1080             
          Ser His  Ile Thr Pro Gln Met  Leu Phe Ser Lys Gln  Asp Phe Asn 
              1085                 1090                 1095             
          Ser Asn  His Asn Leu Thr Pro  Ser Gln Lys Ala Glu  Ile Thr Glu 
              1100                 1105                 1110             
          Leu Ser  Thr Ile Leu Glu Glu  Ser Gly Ser Gln Phe  Glu Phe Thr 
              1115                 1120                 1125             
          Gln Phe  Arg Lys Pro Ser Tyr  Ile Leu Gln Lys Ser  Thr Phe Glu 
              1130                 1135                 1140             
          Val Pro  Glu Asn Gln Met Thr  Ile Leu Lys Thr Thr  Ser Glu Glu 
              1145                 1150                 1155             
          Cys Arg  Asp Ala Asp Leu His  Val Ile Met Asn Ala  Pro Ser Ile 
              1160                 1165                 1170             
          Gly Gln  Val Asp Ser Ser Lys  Gln Phe Glu Gly Thr  Val Glu Ile 
              1175                 1180                 1185             
          Lys Arg  Lys Phe Ala Gly Leu  Leu Lys Asn Asp Cys  Asn Lys Ser 
              1190                 1195                 1200             
          Ala Ser  Gly Tyr Leu Thr Asp  Glu Asn Glu Val Gly  Phe Arg Gly 
              1205                 1210                 1215             
          Phe Tyr  Ser Ala His Gly Thr  Lys Leu Asn Val Ser  Thr Glu Ala 
              1220                 1225                 1230             
          Leu Gln  Lys Ala Val Lys Leu  Phe Ser Asp Ile Glu  Asn Ile Ser 
              1235                 1240                 1245             
          Glu Glu  Thr Ser Ala Glu Val  His Pro Ile Ser Leu  Ser Ser Ser 
              1250                 1255                 1260             
          Lys Cys  His Asp Ser Val Val  Ser Met Phe Lys Ile  Glu Asn His 
              1265                 1270                 1275             
          Asn Asp  Lys Thr Val Ser Glu  Lys Asn Asn Lys Cys  Gln Leu Ile 
              1280                 1285                 1290             
          Leu Gln  Asn Asn Ile Glu Met  Thr Thr Gly Thr Phe  Val Glu Glu 
              1295                 1300                 1305             
          Ile Thr  Glu Asn Tyr Lys Arg  Asn Thr Glu Asn Glu  Asp Asn Lys 
              1310                 1315                 1320             
          Tyr Thr  Ala Ala Ser Arg Asn  Ser His Asn Leu Glu  Phe Asp Gly 
              1325                 1330                 1335             
          Ser Asp  Ser Ser Lys Asn Asp  Thr Val Cys Ile His  Lys Asp Glu 
              1340                 1345                 1350             
          Thr Asp  Leu Leu Phe Thr Asp  Gln His Asn Ile Cys  Leu Lys Leu 
              1355                 1360                 1365             
          Ser Gly  Gln Phe Met Lys Glu  Gly Asn Thr Gln Ile  Lys Glu Asp 
              1370                 1375                 1380             
          Leu Ser  Asp Leu Thr Phe Leu  Glu Val Ala Lys Ala  Gln Glu Ala 
              1385                 1390                 1395             
          Cys His  Gly Asn Thr Ser Asn  Lys Glu Gln Leu Thr  Ala Thr Lys 
              1400                 1405                 1410             
          Thr Glu  Gln Asn Ile Lys Asp  Phe Glu Thr Ser Asp  Thr Phe Phe 
              1415                 1420                 1425             
          Gln Thr  Ala Ser Gly Lys Asn  Ile Ser Val Ala Lys  Glu Ser Phe 
              1430                 1435                 1440             
          Asn Lys  Ile Val Asn Phe Phe  Asp Gln Lys Pro Glu  Glu Leu His 
              1445                 1450                 1455             
          Asn Phe  Ser Leu Asn Ser Glu  Leu His Ser Asp Ile  Arg Lys Asn 
              1460                 1465                 1470             
          Lys Met  Asp Ile Leu Ser Tyr  Glu Glu Thr Asp Ile  Val Lys His 
              1475                 1480                 1485             
          Lys Ile  Leu Lys Glu Ser Val  Pro Val Gly Thr Gly  Asn Gln Leu 
              1490                 1495                 1500             
          Val Thr  Phe Gln Gly Gln Pro  Glu Arg Asp Glu Lys  Ile Lys Glu 
              1505                 1510                 1515             
          Pro Thr  Leu Leu Gly Phe His  Thr Ala Ser Gly Lys  Lys Val Lys 
              1520                 1525                 1530             
          Ile Ala  Lys Glu Ser Leu Asp  Lys Val Lys Asn Leu  Phe Asp Glu 
              1535                 1540                 1545             
          Lys Glu  Gln Gly Thr Ser Glu  Ile Thr Ser Phe Ser  His Gln Trp 
              1550                 1555                 1560             
          Ala Lys  Thr Leu Lys Tyr Arg  Glu Ala Cys Lys Asp  Leu Glu Leu 
              1565                 1570                 1575             
          Ala Cys  Glu Thr Ile Glu Ile  Thr Ala Ala Pro Lys  Cys Lys Glu 
              1580                 1585                 1590             
          Met Gln  Asn Ser Leu Asn Asn  Asp Lys Asn Leu Val  Ser Ile Glu 
              1595                 1600                 1605             
          Thr Val  Val Pro Pro Lys Leu  Leu Ser Asp Asn Leu  Cys Arg Gln 
              1610                 1615                 1620             
          Thr Glu  Asn Leu Lys Thr Ser  Lys Ser Ile Phe Leu  Lys Val Lys 
              1625                 1630                 1635             
          Val His  Glu Asn Val Glu Lys  Glu Thr Ala Lys Ser  Pro Ala Thr 
              1640                 1645                 1650             
          Cys Tyr  Thr Asn Gln Ser Pro  Tyr Ser Val Ile Glu  Asn Ser Ala 
              1655                 1660                 1665             
          Leu Ala  Phe Tyr Thr Ser Cys  Ser Arg Lys Thr Ser  Val Ser Gln 
              1670                 1675                 1680             
          Thr Ser  Leu Leu Glu Ala Lys  Lys Trp Leu Arg Glu  Gly Ile Phe 
              1685                 1690                 1695             
          Asp Gly  Gln Pro Glu Arg Ile  Asn Thr Ala Asp Tyr  Val Gly Asn 
              1700                 1705                 1710             
          Tyr Leu  Tyr Glu Asn Asn Ser  Asn Ser Thr Ile Ala  Glu Asn Asp 
              1715                 1720                 1725             
          Lys Asn  His Leu Ser Glu Lys  Gln Asp Thr Tyr Leu  Ser Asn Ser 
              1730                 1735                 1740             
          Ser Met  Ser Asn Ser Tyr Ser  Tyr His Ser Asp Glu  Val Tyr Asn 
              1745                 1750                 1755             
          Asp Ser  Gly Tyr Leu Ser Lys  Asn Lys Leu Asp Ser  Gly Ile Glu 
              1760                 1765                 1770             
          Pro Val  Leu Lys Asn Val Glu  Asp Gln Lys Asn Thr  Ser Phe Ser 
              1775                 1780                 1785             
          Lys Val  Ile Ser Asn Val Lys  Asp Ala Asn Ala Tyr  Pro Gln Thr 
              1790                 1795                 1800             
          Val Asn  Glu Asp Ile Cys Val  Glu Glu Leu Val Thr  Ser Ser Ser 
              1805                 1810                 1815             
          Pro Cys  Lys Asn Lys Asn Ala  Ala Ile Lys Leu Ser  Ile Ser Asn 
              1820                 1825                 1830             
          Ser Asn  Asn Phe Glu Val Gly  Pro Pro Ala Phe Arg  Ile Ala Ser 
              1835                 1840                 1845             
          Gly Lys  Ile Val Cys Val Ser  His Glu Thr Ile Lys  Lys Val Lys 
              1850                 1855                 1860             
          Asp Ile  Phe Thr Asp Ser Phe  Ser Lys Val Ile Lys  Glu Asn Asn 
              1865                 1870                 1875             
          Glu Asn  Lys Ser Lys Ile Cys  Gln Thr Lys Ile Met  Ala Gly Cys 
              1880                 1885                 1890             
          Tyr Glu  Ala Leu Asp Asp Ser  Glu Asp Ile Leu His  Asn Ser Leu 
              1895                 1900                 1905             
          Asp Asn  Asp Glu Cys Ser Thr  His Ser His Lys Val  Phe Ala Asp 
              1910                 1915                 1920             
          Ile Gln  Ser Glu Glu Ile Leu  Gln His Asn Gln Asn  Met Ser Gly 
              1925                 1930                 1935             
          Leu Glu  Lys Val Ser Lys Ile  Ser Pro Cys Asp Val  Ser Leu Glu 
              1940                 1945                 1950             
          Thr Ser  Asp Ile Cys Lys Cys  Ser Ile Gly Lys Leu  His Lys Ser 
              1955                 1960                 1965             
          Val Ser  Ser Ala Asn Thr Cys  Gly Ile Phe Ser Thr  Ala Ser Gly 
              1970                 1975                 1980             
          Lys Ser  Val Gln Val Ser Asp  Ala Ser Leu Gln Asn  Ala Arg Gln 
              1985                 1990                 1995             
          Val Phe  Ser Glu Ile Glu Asp  Ser Thr Lys Gln Val  Phe Ser Lys 
              2000                 2005                 2010             
          Val Leu  Phe Lys Ser Asn Glu  His Ser Asp Gln Leu  Thr Arg Glu 
              2015                 2020                 2025             
          Glu Asn  Thr Ala Ile Arg Thr  Pro Glu His Leu Ile  Ser Gln Lys 
              2030                 2035                 2040             
          Gly Phe  Ser Tyr Asn Val Val  Asn Ser Ser Ala Phe  Ser Gly Phe 
              2045                 2050                 2055             
          Ser Thr  Ala Ser Gly Lys Gln  Val Ser Ile Leu Glu  Ser Ser Leu 
              2060                 2065                 2070             
          His Lys  Val Lys Gly Val Leu  Glu Glu Phe Asp Leu  Ile Arg Thr 
              2075                 2080                 2085             
          Glu His  Ser Leu His Tyr Ser  Pro Thr Ser Arg Gln  Asn Val Ser 
              2090                 2095                 2100             
          Lys Ile  Leu Pro Arg Val Asp  Lys Arg Asn Pro Glu  His Cys Val 
              2105                 2110                 2115             
          Asn Ser  Glu Met Glu Lys Thr  Cys Ser Lys Glu Phe  Lys Leu Ser 
              2120                 2125                 2130             
          Asn Asn  Leu Asn Val Glu Gly  Gly Ser Ser Glu Asn  Asn His Ser 
              2135                 2140                 2145             
          Ile Lys  Val Ser Pro Tyr Leu  Ser Gln Phe Gln Gln  Asp Lys Gln 
              2150                 2155                 2160             
          Gln Leu  Val Leu Gly Thr Lys  Val Ser Leu Val Glu  Asn Ile His 
              2165                 2170                 2175             
          Val Leu  Gly Lys Glu Gln Ala  Ser Pro Lys Asn Val  Lys Met Glu 
              2180                 2185                 2190             
          Ile Gly  Lys Thr Glu Thr Phe  Ser Asp Val Pro Val  Lys Thr Asn 
              2195                 2200                 2205             
          Ile Glu  Val Cys Ser Thr Tyr  Ser Lys Asp Ser Glu  Asn Tyr Phe 
              2210                 2215                 2220             
          Glu Thr  Glu Ala Val Glu Ile  Ala Lys Ala Phe Met  Glu Asp Asp 
              2225                 2230                 2235             
          Glu Leu  Thr Asp Ser Lys Leu  Pro Ser His Ala Thr  His Ser Leu 
              2240                 2245                 2250             
          Phe Thr  Cys Pro Glu Asn Glu  Glu Met Val Leu Ser  Asn Ser Arg 
              2255                 2260                 2265             
          Ile Gly  Lys Arg Arg Gly Glu  Pro Leu Ile Leu Val  Gly Glu Pro 
              2270                 2275                 2280             
          Ser Ile  Lys Arg Asn Leu Leu  Asn Glu Phe Asp Arg  Ile Ile Glu 
              2285                 2290                 2295             
          Asn Gln  Glu Lys Ser Leu Lys  Ala Ser Lys Ser Thr  Pro Asp Gly 
              2300                 2305                 2310             
          Thr Ile  Lys Asp Arg Arg Leu  Phe Met His His Val  Ser Leu Glu 
              2315                 2320                 2325             
          Pro Ile  Thr Cys Val Pro Phe  Arg Thr Thr Lys Glu  Arg Gln Glu 
              2330                 2335                 2340             
          Ile Gln  Asn Pro Asn Phe Thr  Ala Pro Gly Gln Glu  Phe Leu Ser 
              2345                 2350                 2355             
          Lys Ser  His Leu Tyr Glu His  Leu Thr Leu Glu Lys  Ser Ser Ser 
              2360                 2365                 2370             
          Asn Leu  Ala Val Ser Gly His  Pro Phe Tyr Gln Val  Ser Ala Thr 
              2375                 2380                 2385             
          Arg Asn  Glu Lys Met Arg His  Leu Ile Thr Thr Gly  Arg Pro Thr 
              2390                 2395                 2400             
          Lys Val  Phe Val Pro Pro Phe  Lys Thr Lys Ser His  Phe His Arg 
              2405                 2410                 2415             
          Val Glu  Gln Cys Val Arg Asn  Ile Asn Leu Glu Glu  Asn Arg Gln 
              2420                 2425                 2430             
          Lys Gln  Asn Ile Asp Gly His  Gly Ser Asp Asp Ser  Lys Asn Lys 
              2435                 2440                 2445             
          Ile Asn  Asp Asn Glu Ile His  Gln Phe Asn Lys Asn  Asn Ser Asn 
              2450                 2455                 2460             
          Gln Ala  Val Ala Val Thr Phe  Thr Lys Cys Glu Glu  Glu Pro Leu 
              2465                 2470                 2475             
          Asp Leu  Ile Thr Ser Leu Gln  Asn Ala Arg Asp Ile  Gln Asp Met 
              2480                 2485                 2490             
          Arg Ile  Lys Lys Lys Gln Arg  Gln Arg Val Phe Pro  Gln Pro Gly 
              2495                 2500                 2505             
          Ser Leu  Tyr Leu Ala Lys Thr  Ser Thr Leu Pro Arg  Ile Ser Leu 
              2510                 2515                 2520             
          Lys Ala  Ala Val Gly Gly Gln  Val Pro Ser Ala Cys  Ser His Lys 
              2525                 2530                 2535             
          Gln Leu  Tyr Thr Tyr Gly Val  Ser Lys His Cys Ile  Lys Ile Asn 
              2540                 2545                 2550             
          Ser Lys  Asn Ala Glu Ser Phe  Gln Phe His Thr Glu  Asp Tyr Phe 
              2555                 2560                 2565             
          Gly Lys  Glu Ser Leu Trp Thr  Gly Lys Gly Ile Gln  Leu Ala Asp 
              2570                 2575                 2580             
          Gly Gly  Trp Leu Ile Pro Ser  Asn Asp Gly Lys Ala  Gly Lys Glu 
              2585                 2590                 2595             
          Glu Phe  Tyr Arg Ala Leu Cys  Asp Thr Pro Gly Val  Asp Pro Lys 
              2600                 2605                 2610             
          Leu Ile  Ser Arg Ile Trp Val  Tyr Asn His Tyr Arg  Trp Ile Ile 
              2615                 2620                 2625             
          Trp Lys  Leu Ala Ala Met Glu  Cys Ala Phe Pro Lys  Glu Phe Ala 
              2630                 2635                 2640             
          Asn Arg  Cys Leu Ser Pro Glu  Arg Val Leu Leu Gln  Leu Lys Tyr 
              2645                 2650                 2655             
          Arg Tyr  Asp Thr Glu Ile Asp  Arg Ser Arg Arg Ser  Ala Ile Lys 
              2660                 2665                 2670             
          Lys Ile  Met Glu Arg Asp Asp  Thr Ala Ala Lys Thr  Leu Val Leu 
              2675                 2680                 2685             
          Cys Val  Ser Asp Ile Ile Ser  Leu Ser Ala Asn Ile  Ser Glu Thr 
              2690                 2695                 2700             
          Ser Ser  Asn Lys Thr Ser Ser  Ala Asp Thr Gln Lys  Val Ala Ile 
              2705                 2710                 2715             
          Ile Glu  Leu Thr Asp Gly Trp  Tyr Ala Val Lys Ala  Gln Leu Asp 
              2720                 2725                 2730             
          Pro Pro  Leu Leu Ala Val Leu  Lys Asn Gly Arg Leu  Thr Val Gly 
              2735                 2740                 2745             
          Gln Lys  Ile Ile Leu His Gly  Ala Glu Leu Val Gly  Ser Pro Asp 
              2750                 2755                 2760             
          Ala Cys  Thr Pro Leu Glu Ala  Pro Glu Ser Leu Met  Leu Lys Ile 
              2765                 2770                 2775             
          Ser Ala  Asn Ser Thr Arg Pro  Ala Arg Trp Tyr Thr  Lys Leu Gly 
              2780                 2785                 2790             
          Phe Phe  Pro Asp Pro Arg Pro  Phe Pro Leu Pro Leu  Ser Ser Leu 
              2795                 2800                 2805             
          Phe Ser  Asp Gly Gly Asn Val  Gly Cys Val Asp Val  Ile Ile Gln 
              2810                 2815                 2820             
          Arg Ala  Tyr Pro Ile Gln Trp  Met Glu Lys Thr Ser  Ser Gly Leu 
              2825                 2830                 2835             
          Tyr Ile  Phe Arg Asn Glu Arg  Glu Glu Glu Lys Glu  Ala Ala Lys 
              2840                 2845                 2850             
          Tyr Val  Glu Ala Gln Gln Lys  Arg Leu Glu Ala Leu  Phe Thr Lys 
              2855                 2860                 2865             
          Ile Gln  Glu Glu Phe Glu Glu  His Glu Glu Asn Thr  Thr Lys Pro 
              2870                 2875                 2880             
          Tyr Leu  Pro Ser Arg Ala Leu  Thr Arg Gln Gln Val  Arg Ala Leu 
              2885                 2890                 2895             
          Gln Asp  Gly Ala Glu Leu Tyr  Glu Ala Val Lys Asn  Ala Ala Asp 
              2900                 2905                 2910             
          Pro Ala  Tyr Leu Glu Gly Tyr  Phe Ser Glu Glu Gln  Leu Arg Ala 
              2915                 2920                 2925             
          Leu Asn  Asn His Arg Gln Met  Leu Asn Asp Lys Lys  Gln Ala Gln 
              2930                 2935                 2940             
          Ile Gln  Leu Glu Ile Arg Lys  Ala Met Glu Ser Ala  Glu Gln Lys 
              2945                 2950                 2955             
          Glu Gln  Gly Leu Ser Arg Asp  Val Thr Thr Val Trp  Lys Leu Arg 
              2960                 2965                 2970             
          Ile Val  Ser Tyr Ser Lys Lys  Glu Lys Asp Ser Val  Ile Leu Ser 
              2975                 2980                 2985             
          Ile Trp  Arg Pro Ser Ser Asp  Leu Tyr Ser Leu Leu  Thr Glu Gly 
              2990                 2995                 3000             
          Lys Arg  Tyr Arg Ile Tyr His  Leu Ala Thr Ser Lys  Ser Lys Ser 
              3005                 3010                 3015             
          Lys Ser  Glu Arg Ala Asn Ile  Gln Leu Ala Ala Thr  Lys Lys Thr 
              3020                 3025                 3030             
          Gln Tyr  Gln Gln Leu Pro Val  Ser Asp Glu Ile Leu  Phe Gln Ile 
              3035                 3040                 3045             
          Tyr Gln  Pro Arg Glu Pro Leu  His Phe Ser Lys Phe  Leu Asp Pro 
              3050                 3055                 3060             
          Asp Phe  Gln Pro Ser Cys Ser  Glu Val Asp Leu Ile  Gly Phe Val 
              3065                 3070                 3075             
          Val Ser  Val Val Lys Lys Thr  Gly Leu Ala Pro Phe  Val Tyr Leu 
              3080                 3085                 3090             
          Ser Asp  Glu Cys Tyr Asn Leu  Leu Ala Ile Lys Phe  Trp Ile Asp 
              3095                 3100                 3105             
          Leu Asn  Glu Asp Ile Ile Lys  Pro His Met Leu Ile  Ala Ala Ser 
              3110                 3115                 3120             
          Asn Leu  Gln Trp Arg Pro Glu  Ser Lys Ser Gly Leu  Leu Thr Leu 
              3125                 3130                 3135             
          Phe Ala  Gly Asp Phe Ser Val  Phe Ser Ala Ser Pro  Lys Glu Gly 
              3140                 3145                 3150             
          His Phe  Gln Glu Thr Phe Asn  Lys Met Lys Asn Thr  Val Glu Asn 
              3155                 3160                 3165             
          Ile Asp  Ile Leu Cys Asn Glu  Ala Glu Asn Lys Leu  Met His Ile 
              3170                 3175                 3180             
          Leu His  Ala Asn Asp Pro Lys  Trp Ser Thr Pro Thr  Lys Asp Cys 
              3185                 3190                 3195             
          Thr Ser  Gly Pro Tyr Thr Ala  Gln Ile Ile Pro Gly  Thr Gly Asn 
              3200                 3205                 3210             
          Lys Leu  Leu Met Ser Ser Pro  Asn Cys Glu Ile Tyr  Tyr Gln Ser 
              3215                 3220                 3225             
          Pro Leu  Ser Leu Cys Met Ala  Lys Arg Lys Ser Val  Ser Thr Pro 
              3230                 3235                 3240             
          Val Ser  Ala Gln Met Thr Ser  Lys Ser Cys Lys Gly  Glu Lys Glu 
              3245                 3250                 3255             
          Ile Asp  Asp Gln Lys Asn Cys  Lys Lys Arg Arg Ala  Leu Asp Phe 
              3260                 3265                 3270             
          Leu Ser  Arg Leu Pro Leu Pro  Pro Pro Val Ser Pro  Ile Cys Thr 
              3275                 3280                 3285             
          Phe Val  Ser Pro Ala Ala Gln  Lys Ala Phe Gln Pro  Pro Arg Ser 
              3290                 3295                 3300             
          Cys Gly  Thr Lys Tyr Glu Thr  Pro Ile Lys Lys Lys  Glu Leu Asn 
              3305                 3310                 3315             
          Ser Pro  Gln Met Thr Pro Phe  Lys Lys Phe Asn Glu  Ile Ser Leu 
              3320                 3325                 3330             
          Leu Glu  Ser Asn Ser Ile Ala  Asp Glu Glu Leu Ala  Leu Ile Asn 
              3335                 3340                 3345             
          Thr Gln  Ala Leu Leu Ser Gly  Ser Thr Gly Glu Lys  Gln Phe Ile 
              3350                 3355                 3360             
          Ser Val  Ser Glu Ser Thr Arg  Thr Ala Pro Thr Ser  Ser Glu Asp 
              3365                 3370                 3375             
          Tyr Leu  Arg Leu Lys Arg Arg  Cys Thr Thr Ser Leu  Ile Lys Glu 
              3380                 3385                 3390             
          Gln Glu  Ser Ser Gln Ala Ser  Thr Glu Glu Cys Glu  Lys Asn Lys 
              3395                 3400                 3405             
          Gln Asp  Thr Ile Thr Thr Lys  Lys Tyr Ile 
              3410                 3415             
          <![CDATA[<210>  11]]>
          <![CDATA[<211>  898]]>
          <![CDATA[<212>  PRT]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  11]]>
          Met Ser Val Thr Glu Glu Asp Leu Cys His His Met Lys Val Val Val 
          1               5                   10                  15      
          Arg Val Arg Pro Glu Asn Thr Lys Glu Lys Ala Ala Gly Phe His Lys 
                      20                  25                  30          
          Val Val His Val Val Asp Lys His Ile Leu Val Phe Asp Pro Lys Gln 
                  35                  40                  45              
          Glu Glu Val Ser Phe Phe His Gly Lys Lys Thr Thr Asn Gln Asn Val 
              50                  55                  60                  
          Ile Lys Lys Gln Asn Lys Asp Leu Lys Phe Val Phe Asp Ala Val Phe 
          65                  70                  75                  80  
          Asp Glu Thr Ser Thr Gln Ser Glu Val Phe Glu His Thr Thr Lys Pro 
                          85                  90                  95      
          Ile Leu Arg Ser Phe Leu Asn Gly Tyr Asn Cys Thr Val Leu Ala Tyr 
                      100                 105                 110         
          Gly Ala Thr Gly Ala Gly Lys Thr His Thr Met Leu Gly Ser Ala Asp 
                  115                 120                 125             
          Glu Pro Gly Val Met Tyr Leu Thr Met Leu His Leu Tyr Lys Cys Met 
              130                 135                 140                 
          Asp Glu Ile Lys Glu Glu Lys Ile Cys Ser Thr Ala Val Ser Tyr Leu 
          145                 150                 155                 160 
          Glu Val Tyr Asn Glu Gln Ile Arg Asp Leu Leu Val Asn Ser Gly Pro 
                          165                 170                 175     
          Leu Ala Val Arg Glu Asp Thr Gln Lys Gly Val Val Val His Gly Leu 
                      180                 185                 190         
          Thr Leu His Gln Pro Lys Ser Ser Glu Glu Ile Leu His Leu Leu Asp 
                  195                 200                 205             
          Asn Gly Asn Lys Asn Arg Thr Gln His Pro Thr Asp Met Asn Ala Thr 
              210                 215                 220                 
          Ser Ser Arg Ser His Ala Val Phe Gln Ile Tyr Leu Arg Gln Gln Asp 
          225                 230                 235                 240 
          Lys Thr Ala Ser Ile Asn Gln Asn Val Arg Ile Ala Lys Met Ser Leu 
                          245                 250                 255     
          Ile Asp Leu Ala Gly Ser Glu Arg Ala Ser Thr Ser Gly Ala Lys Gly 
                      260                 265                 270         
          Thr Arg Phe Val Glu Gly Thr Asn Ile Asn Arg Ser Leu Leu Ala Leu 
                  275                 280                 285             
          Gly Asn Val Ile Asn Ala Leu Ala Asp Ser Lys Arg Lys Asn Gln His 
              290                 295                 300                 
          Ile Pro Tyr Arg Asn Ser Lys Leu Thr Arg Leu Leu Lys Asp Ser Leu 
          305                 310                 315                 320 
          Gly Gly Asn Cys Gln Thr Ile Met Ile Ala Ala Val Ser Pro Ser Ser 
                          325                 330                 335     
          Val Phe Tyr Asp Asp Thr Tyr Asn Thr Leu Lys Tyr Ala Asn Arg Ala 
                      340                 345                 350         
          Lys Asp Ile Lys Ser Ser Leu Lys Ser Asn Val Leu Asn Val Asn Asn 
                  355                 360                 365             
          His Ile Thr Gln Tyr Val Lys Ile Cys Asn Glu Gln Lys Ala Glu Ile 
              370                 375                 380                 
          Leu Leu Leu Lys Glu Lys Leu Lys Ala Tyr Glu Glu Gln Lys Ala Phe 
          385                 390                 395                 400 
          Thr Asn Glu Asn Asp Gln Ala Lys Leu Met Ile Ser Asn Pro Gln Glu 
                          405                 410                 415     
          Lys Glu Ile Glu Arg Phe Gln Glu Ile Leu Asn Cys Leu Phe Gln Asn 
                      420                 425                 430         
          Arg Glu Glu Ile Arg Gln Glu Tyr Leu Lys Leu Glu Met Leu Leu Lys 
                  435                 440                 445             
          Glu Asn Glu Leu Lys Ser Phe Tyr Gln Gln Gln Cys His Lys Gln Ile 
              450                 455                 460                 
          Glu Met Met Cys Ser Glu Asp Lys Val Glu Lys Ala Thr Gly Lys Arg 
          465                 470                 475                 480 
          Asp His Arg Leu Ala Met Leu Lys Thr Arg Arg Ser Tyr Leu Glu Lys 
                          485                 490                 495     
          Arg Arg Glu Glu Glu Leu Lys Gln Phe Asp Glu Asn Thr Asn Trp Leu 
                      500                 505                 510         
          His Arg Val Glu Lys Glu Met Gly Leu Leu Ser Gln Asn Gly His Ile 
                  515                 520                 525             
          Pro Lys Glu Leu Lys Lys Asp Leu His Cys His His Leu His Leu Gln 
              530                 535                 540                 
          Asn Lys Asp Leu Lys Ala Gln Ile Arg His Met Met Asp Leu Ala Cys 
          545                 550                 555                 560 
          Leu Gln Glu Gln Gln His Arg Gln Thr Glu Ala Val Leu Asn Ala Leu 
                          565                 570                 575     
          Leu Pro Thr Leu Arg Lys Gln Tyr Cys Thr Leu Lys Glu Ala Gly Leu 
                      580                 585                 590         
          Ser Asn Ala Ala Phe Glu Ser Asp Phe Lys Glu Ile Glu His Leu Val 
                  595                 600                 605             
          Glu Arg Lys Lys Val Val Val Trp Ala Asp Gln Thr Ala Glu Gln Pro 
              610                 615                 620                 
          Lys Gln Asn Asp Leu Pro Gly Ile Ser Val Leu Met Thr Phe Pro Gln 
          625                 630                 635                 640 
          Leu Gly Pro Val Gln Pro Ile Pro Cys Cys Ser Ser Ser Gly Gly Thr 
                          645                 650                 655     
          Asn Leu Val Lys Ile Pro Thr Glu Lys Arg Thr Arg Arg Lys Leu Met 
                      660                 665                 670         
          Pro Ser Pro Leu Lys Gly Gln His Thr Leu Lys Ser Pro Pro Ser Gln 
                  675                 680                 685             
          Ser Val Gln Leu Asn Asp Ser Leu Ser Lys Glu Leu Gln Pro Ile Val 
              690                 695                 700                 
          Tyr Thr Pro Glu Asp Cys Arg Lys Ala Phe Gln Asn Pro Ser Thr Val 
          705                 710                 715                 720 
          Thr Leu Met Lys Pro Ser Ser Phe Thr Thr Ser Phe Gln Ala Ile Ser 
                          725                 730                 735     
          Ser Asn Ile Asn Ser Asp Asn Cys Leu Lys Met Leu Cys Glu Val Ala 
                      740                 745                 750         
          Ile Pro His Asn Arg Arg Lys Glu Cys Gly Gln Glu Asp Leu Asp Ser 
                  755                 760                 765             
          Thr Phe Thr Ile Cys Glu Asp Ile Lys Ser Ser Lys Cys Lys Leu Pro 
              770                 775                 780                 
          Glu Gln Glu Ser Leu Pro Asn Asp Asn Lys Asp Ile Leu Gln Arg Leu 
          785                 790                 795                 800 
          Asp Pro Ser Ser Phe Ser Thr Lys His Ser Met Pro Val Pro Ser Met 
                          805                 810                 815     
          Val Pro Ser Tyr Met Ala Met Thr Thr Ala Ala Lys Arg Lys Arg Lys 
                      820                 825                 830         
          Leu Thr Ser Ser Thr Ser Asn Ser Ser Leu Thr Ala Asp Val Asn Ser 
                  835                 840                 845             
          Gly Phe Ala Lys Arg Val Arg Gln Asp Asn Ser Ser Glu Lys His Leu 
              850                 855                 860                 
          Gln Glu Asn Lys Pro Thr Met Glu His Lys Arg Asn Ile Cys Lys Ile 
          865                 870                 875                 880 
          Asn Pro Ser Met Val Arg Lys Phe Gly Arg Asn Ile Ser Lys Gly Asn 
                          885                 890                 895     
          Leu Arg 
          <![CDATA[<210>  12]]>
          <![CDATA[<211>  87562]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  12]]>
          cactttaaaa tctacatctt taatatatca agtagcaagg gacaatattt tatttgtgat       60
          gactaaataa tatttacaat gattttatgg gcacatatat ttacacttgt acattaaagt      120
          atttttgaaa aggaaagtca tatatatgat taaaataatg tatcaaaaca taatagagaa      180
          ccaaatacat cttgggccat aattttacca cttctaaatt cttattttta aaaaataata      240
          aagataattt aactcactac catttactaa aatgtcctag tcaacttgtt gtggcatagt      300
          aaaactaagc tgccaccatg gtaacttaca ctcagggatt ttaaaaggca acaaatattt      360
          aaaaaactta aaagacaacc ttttcttttg aaattttatt tttttagaac acaaaagaag      420
          aaaacaaaga gtttcatttt tctgcttgct gaaagtactt gggtaaactt agctttaaga      480
          tgggtcttct ttcaaagatt ttaaatatat ttttgaaagg gtattgataa actttgaaaa      540
          gcagatttga tcaacttcat tttgcttggt tttgaagtga tttatcttag atttcctttt      600
          gaaatatttc ttccaaattt tctaaccatg cttggattta ttttacagat gtttctttta      660
          tgttctagag aagaaataaa aagatgcata aatatggcat aaatatcatt caaaaagttt      720
          tcatcgttca acttataaaa attatgacca tagaaagaaa aatttactct tgaaattcat      780
          agttgttagt taacataatt taaaatataa caacaacaaa gagacattaa tacctttggt      840
          ttaaaagctg ttcaaattca tattgcaaac taaagtttca gtgagtgcgt gcacatacac      900
          agacatcggg tgaagtcgct gaattaaata ctatgttcat tttctttctt tctgactaat      960
          aaaagaccat ttctacaagc atttcttcat tttctttgtt gtatcaccat tttttctcat     1020
          tccttggatt atatttcccc agggatttaa acttccatat ttttccaatt ttaaaattat     1080
          catttgcatc tagtacttcc taaagggctg atcttaatcc tatagctctt ttttctttta     1140
          ctgccacctc tcaagtatgt tctatttatg cccattcttc tggttcttca ttagctttca     1200
          ccgtcatttt ctactcaaca aagtgttgtt acaacagggt gccattgact tttttcagga     1260
          ttagtttaat tgcttatcca ctttgttggc catattaggt tttagtttta gagggacata     1320
          ttcccttaac actctctgtt atttctctaa ctgctaagtt aacaggagtt gcctttttcc     1380
          ctactgatgg tcctatgttt ctttatttgt acattgttag ttagaaaact ggtttaatac     1440
          atttttcact tgaacattat aatgtatata aaatatcttt ccttacaaac taatacctct     1500
          ttggcaagca ttgtggttta ttatcatctc ccactttttt ttccccatag tagatatttt     1560
          tactcacatc tctttataca tgaaatattt gatgaatttg tatcttcaga taataagcat     1620
          attagaaaaa gccaagttct atgatttgag tttttttttt ttttgagacg gagttttgct     1680
          cagtcgccca ggctggagtg cagtggtgcg atctcggctc actgcaagct ccgcctccca     1740
          ggttcacgcc attctcctgc ctcagcttcc cgagtagctg ggactacagc cgcctgccac     1800
          catgcccggc taatttttta aaattttttt ggtagagacg gggtttcacc atgttagcca     1860
          ggatggtctc gatctcctga cctcgtgatc cacccgcctc agcctcccaa agtgctggga     1920
          ttacaggcgt gagccacggc gcccggccaa tttgagagtt tttataaatt tattatttgg     1980
          ctgtagaatt atgattcttg aagaactttt taagaagatc agtggggcag tacacaccta     2040
          aactaactac agatacacat ttttaagcat tattaaatac aacatgtcaa accaaatgat     2100
          caaggtaaat tttgtacttt actaccttac tgtctgatgt ttcaatttgc tgtctgatgc     2160
          ttcaatttcc attgaactta aggtaaacac tggctactac aggaagcagg catttaccaa     2220
          tatagtttga caaagttact gaggaatttt atattactct aatcaaaggg catcgacaga     2280
          aaaaaactaa caatagcttt catgttatcc ttagaaaaat tatatcatga gacaccttta     2340
          aattgcattt gctataatta tcagttccta tagagaacaa tcaaactgtg tcttactgct     2400
          ctctgtattc atcacaggac atggtaaatg cctagtgaat aaatagtttc tgaatgaagt     2460
          cttaggaact gtagtatcag agacagaggt ctagatgttg gggcctgaaa actggctggc     2520
          atgatacacc actagtttaa ctgaagtggt tttgttacca taaactcatg tcactcccat     2580
          atgcggttga tggaatgtag tatctttcat actgatggga aagatccatc agtatctttt     2640
          ccaacttgcc aatgggagtt acaatatgat tgtaactaga tacagactgg aatctgtgta     2700
          gtagttacac attgagttag aggccaaatt attcaaaata ttacgctaag agaaaaattt     2760
          aaagtgggta tagtttatct gcaaaataca cttaattagt aacattaagt aatacattta     2820
          gccaattatt tcaattatta tgagacagta gggataacta aaagggtgta gaaagtagag     2880
          ttttaagatc tggttcttga gttttggctc taccaatata atatctgtgt gatcttgggt     2940
          aaatgctttt gtgttttaaa gtttccttat ctataatatg tggataatca tacttgttct     3000
          accacatagt aaaggtgatg aataaaggga gattcttatg aaaacacaat aaaaaacgta     3060
          aagtactata tgtgtgttac agagtcatac cattaaatat caaattaaaa gctgagacat     3120
          acccattgtt ggtttgtttt cttgtaagtg cttctcactt gaattatctt gtcgaacacg     3180
          tttggcaaat ccagaattta cgtctgcagt taacgaactg tttgatgtag aacttgagag     3240
          gaaaagtttt taatttagtt aagcattttt tttatacctc aaagttctaa tacatattgt     3300
          acatgcgaca atgattaaag aaataaaaca caaaaatatt aagttgtgaa atctcacaga     3360
          agtggaggta ctaaatacat ttttggccca cagagaaatt tagctgtgtg tgattttaaa     3420
          ttggatattt tatattttta ttcaaattga atgttatgat tgtaggtgta tgttacaatt     3480
          ctgtagcaga atattccagg gtgctttgct ggcagataag taagcactat tattcaaaat     3540
          gtagagatca gtagcacata gtcacaagag gttaaaaaaa aaaaaaaaaa aaactaagct     3600
          catgttacaa atttggacca agaatcctaa tgtgaaaggt ataaacaagt gagattgttt     3660
          gaaaaacctt gttttaaaat gaaagcaggg taacaataaa aatctctaat tattacaatc     3720
          acagaaactg aaataaaaag aatgacctgt tttcatttgc tctagcttca aaaatttaat     3780
          cagtcttaca ctgctgatgg ttcaactttc ttactcaatt tgagttgcca tattagtaaa     3840
          cacctattat ggccttgtgt tacatgatat acaagtaaac aaggcacaaa aatccctgtc     3900
          ctaaaaactt atagaataga catacagtgg agatgagaaa aaaataagat aaatacatga     3960
          aataatataa ggtaaagtaa aaatatagtg ccaaggtttc cataatacaa ggagctatag     4020
          attcttgagt gtagagtaag aaagaataat ggaaattttg tggatgcaat gaatttgatc     4080
          tgggtcctga aaaacagcaa tccttcctag tcctaaagag gatcaatttt taacaggtag     4140
          gattgggggg ggttgggtgg aaaaagaaca tccttccacg ctgattcaaa caacctaagc     4200
          ttagggaaat tctggctaat aaagatacta tatagtaatc ccccttatcg acggggggga     4260
          tatcttctaa gatcgccagt ggatgcctgc aaccgaggat agtatcaaac cggatatata     4320
          ctatgtattc tcctacacat atctatgata aagtttaaat tataaattag gcacagtaag     4380
          agattaacaa taataataaa atagagcaat tataattata attattataa ggttatgtga     4440
          atgtggtctc gctctctatt aaaatatctt attgttctac aatcgcctgt ttttgaactg     4500
          cggttgacca tgggtaactg aaaccacaga aagcaaaact tgaataaggg gtgactactc     4560
          agtggaagta atgaaaatga cacagtttaa gaagataaaa tcacaaattt gtatgcacaa     4620
          atattatatc aactacagta gtccccactt cttaaatggt gataaattac tatgattctg     4680
          ttttgcatat taaacacact tttgtatata tcagctgtcc aaggcagaaa ttcttttttg     4740
          atcatttggt gattttattt tttcaaatat aaagatcaat attattagtt acttttgata     4800
          aaacattgtt ttttcttaaa tttatcccaa agttgtcttt attatttcat agtacgatta     4860
          tgcattatgg ctagttccag gaccctactt tttactcata gcatgttctt tcttgaaaat     4920
          taggcttttg aataaagcca tttgattaga actcatattt ctagaaatca aatccaaccc     4980
          taataaattg cgtatttata taaaagtaaa atatacccaa acatgtttac gatttagtta     5040
          aatagtccac tgatgaaatg tttaacattt atgttgtagg tcataaacta caaagactta     5100
          aaactgatga gcgcaagttc aaattatgtt aaaggctata ctgaaaaatc caaagacact     5160
          tccagttgtg cacaaaacat attcccataa ctataaataa agttaagaat taaccttttg     5220
          ctcccttata taggtagaat gtttctactc aacataatac ctcttctact attttatctg     5280
          aaataatttc tagttgaaat aattagacat ctttcaaaac aaaataaaag tgtatggcaa     5340
          atatgaaact gctttggggt gctcagaaga ttgtggacaa acaaaaaacc aatcaaccaa     5400
          acaaatacaa aacaaacaat ccaaaactct gattaatata attgagaagt aaaagctaac     5460
          attatgtatg cattatattt aaatatttga taggctaatc aatttagtaa aatagtgtgc     5520
          tagagaaata ttaaataaat tgttaagatt aaaaatctaa tatactcaat tatttaaaca     5580
          aatctgttgg gtaggttttg gaatatccag tgctttcaaa ctctaatgcc attttatgca     5640
          aaataaatga aatacatata tagagagctt ccccttcttt attttaaaaa ctatattaga     5700
          atatatacac aactaaatat gtatataaag ctgctaaatg gaaaatacca cagtttatta     5760
          ctctgaagcg catgtaactt taattgggga aaaagaagat taaaaaaagt aatcatgtac     5820
          atttctagca ttaatctctt ttaaccttag ttaatggcag gatctaatta ctggtaccag     5880
          agggaatgta atagaacaat taataggcta taagaaatca agttactttc tttacatgtc     5940
          ctttaatatt atttcacaat attagttgtt catgtggaag ccctttaact tatctaaaat     6000
          cactccaaat acacaattca catacctgga catttcctga aaaactattt gattttataa     6060
          tagctaagtt catatttaaa aattattctt atctataaac atttgtgaca tcttagtaaa     6120
          cacaacatac taccagtgaa ggacaagaaa actcactaaa attaattaat ggaacaaatg     6180
          acaaaactga cactatgcaa attagtgata aaagtagacg aaacagatga ttgtggttag     6240
          ctaggctcac tcataaagtg acagacttct gtatataaac cagaataatt gtacaaatca     6300
          aatttgtacc ttagcaaata taaaatttta aatgtcatag atgagacatt taggaaaaat     6360
          ccataaattt taaatttaca cattccaagt ctctgttata ctttgtttag gagggacaag     6420
          gacagatatt aaattcactt atgagaagat actctatgta gcacaaataa gtaggctact     6480
          tgtaaattcg cttcctgtta cttaaatgat aacaggctcc tggtggaaaa tacatttaaa     6540
          aagagtcatt ttaaggtctt ctataaactt ttctccccat aatcacatag caaagaaaaa     6600
          gaggtagagg aagtcagatc cattttatat ttattgagta tatttgtcat tgcattcaat     6660
          ttataggata taaagaatgc atcatgaact tctagtcata taactcaata tatttaagat     6720
          ttttccttat ctttagtttt tagttgtttt actactatat acctaggtat gtttctcttt     6780
          atattaaccc ggcttttggt ttgcagtgct actcaaatcc atggtttaat gtcttttgtt     6840
          agttttgaat aagtattagc catcatctca aatattactt ttccctattc tttctctcac     6900
          tcccttctga gacacaaaat acatattttc tagactttta aaaattgtgt cccatgtctc     6960
          tttcacttct tcccatattt ttatcatact gcacatcagt ttggatattt tcctaccagt     7020
          ctatctttca gaaaaaattc caaaacctga acaaatgaat aataagtaac aaaatcaaag     7080
          tcataataaa gtctcccagc aaagaaaagc ttggaatttg atggcttcac tgctgatttt     7140
          taccaaacat ttaaaaaaga accaatacca atcttactca aactattctg aaaaacagag     7200
          gcggaaggaa tacttccaaa atcattatat gaggccagta ttactctgat accaaaacca     7260
          gacaaggaca catcaaaaca agaaaactcc aggccaatat ccctgatgaa cacatgcaca     7320
          aatccttaac aaaatactag caaactgaat ccaataacaa acctgaaaga tcattcatca     7380
          tggccaagtg ggatttatcc cagggatgca agatggttca acatatgcaa attaaccaat     7440
          gtgatacatt gtatcaatag aatgaagaac aaaaaccata tgatcatttc aatagatgct     7500
          gaaaaagtat ttgataaaat tcaacatccc tttatgataa aaactctcac caagcggact     7560
          taatagacgt ctacagaact ctccacccac aatcaacaga atatacattc ttttcagcac     7620
          cacactgcac ttattccaaa attgaccaca tagttggaag taaagcactc ctcagcaaat     7680
          ataaaagaac agaaattaga acaatctgtc tctcagaata cagtgcaatc aaactagaac     7740
          tcaggattaa gacactcact caaaaccact caactacatg gaaactgaac aacctgctcc     7800
          tgaatgacta ctgggtacat aacgaaatga aggcagaaat aaagacgttc tttgaaacca     7860
          acgagaacaa agacatgaca taccagaatc tctgggacac atttaaagca gtgtgtagag     7920
          ggaaatttat agcagtaaat gcccacaaga gaaagcagga aagatctaaa attgacaccc     7980
          taacatcaca attaaaagaa ctagagaagc aagagcaaac acattaaaaa gccagcagaa     8040
          ggcaagaaat aactaagatc agagcagaac tgaaggagat agagacgcaa aaaacccttc     8100
          aaaaaatcaa tgaatccagg agctggtttt ttgaaaagat caacaaaatt gatagactgc     8160
          tagcaagact aagaaagagg aaaagagaga agaatcaaat agacacaata aaaaaagata     8220
          aaggggatat caccaccgat cccacagaaa tacaaactac catcagagaa tactacaaac     8280
          acctctatgc aaataaacta gaaaatctag aagaaatgga taaattcctg gacacataca     8340
          ccctcccaag actaaaccag gacgaagttg aatctctgaa tagaccaata ataggctctg     8400
          aaattgaggc aataattaat agcataccaa ccgaaaaaag tccaggaccg ggcggattca     8460
          cagctgaatt ctaccagagg tacaaagagg agctggtacc attccttctg aaactatttc     8520
          aatctataga aaaagaggga atcctcccta actcatttta tgagaccagc atcatcctga     8580
          taccaaagcc tggcagagac acaacaaaaa aagagaattt tagaccaata tccctgaaga     8640
          acattgatgc aaaaatcctc aataaactac tggcaagccc aatccagcag cacatcaaaa     8700
          agcttatcca ccatgagcaa gtgggcttca tccctgggat gcaaggctgg ttcaatatac     8760
          gcaaatcaat aaatgtaatc cagcatatac acagaaccaa agacaaaaac cacatgatta     8820
          tctcaataga tgcagaaaag gcctttgaca aaattcaaca gcccttcatg ctaaaaactc     8880
          tcaataaatt aggtattgat gggacgtatc tcaaaataat aagagctatc tatgacaaac     8940
          ccacagccaa tatcatactg aatgtgcaaa aactggaagc attccctttg aaaactggca     9000
          caagacaggg atgccctctc tcaccactcc tactcaatat agtgtgggaa gttctggcca     9060
          gggcaatgag gcaagagaag gaaataaaag gtattcaatt aggaaaagaa gaagtcaaat     9120
          tgtccctgtt tgcagatgac atgattgtat atctagaaaa ccccatcgtc tcagcccaaa     9180
          atctccttaa gctgataagc aacttcagca aagtctcagg atacaaaatc aatatacaaa     9240
          aatcacaagc attcttatac accaataaca gacaaacaga gagacaaatc atgagtgaac     9300
          tcccattcac aactgcttca aagagaataa aatacctagg aatccaactt acaagggatg     9360
          tgaaggacct cttcaaggag aactacaaac cactgctcaa tgaaataaaa gaggacacaa     9420
          acaaatggaa gaacattcca tgctcatgga taggaagaat caatatcatg aaaatgtcca     9480
          tactgcccaa ggtaatttat agattcagtg ccatccccat caagctacca atgactttct     9540
          tcacagaatt ggaaaagact actttaaagt tcatatggaa ccagaaaaca gcccgcattg     9600
          ccaagacaat cctaaggcaa aagaacaaaa ctggaggcat cacgctacct gacttcaaac     9660
          tatactacaa ggctacagta accaaaacag cctggtactg gtaccaaaac agagatatag     9720
          accaatggaa cagaacagag ccctcagaaa taataccata catctacaac catctgatct     9780
          ttgacaaatc tgacaaaaac aagaaatggg gaaaggattc cccatttaat aaatggtgct     9840
          gggaaaactg gctagccata tgtagaaagc tgaaactgga tcccttcctt acaccttata     9900
          caaaaattaa ttcaagatgg attaaagact taaatgttag agctaaaacc ataaaaaccc     9960
          cagaagaaaa cctaggcaat accattcagg acataggcat gggtaaggac ttcatgtcta    10020
          aaacaccaaa agcaatggca acaaaagcca aaattgacaa atgggatcta attaaactaa    10080
          agagcttctg cacagcaaaa gaaactacca tcagagtgaa caggcaacct acagaatggg    10140
          agaaaatttt cgcaacctac tcatctgaca aagggctaat atccagaatc tacaatgaac    10200
          tcaaacaaat ttacaagaaa aaaacaaaca accccatcaa aaagtgggcg aaggacatga    10260
          acagacactt ctcaaaagaa gacatttatg cagccaaaaa acacatgaaa aaatgctcat    10320
          gatcactggc catcagagaa atgcaaatca aaaccacaat gagataccat ctcacaccag    10380
          ttagaatggc aatcattaaa aagtcaggaa acaacaggtg ctggagagga tgtggagaaa    10440
          taggaacact tttacactgt tggtgggact gtaaactagt tcaaccattg tggaagacag    10500
          tgtggcgatt tctcaaggat ctagaactag aaataccatt tgacccagcc atgtcgttac    10560
          tgggtatata cccaaaggat tataaatcat gctgctataa agacacatgc acacgtatgt    10620
          ttattgcggc actattcaca atagcaaaga cttgtaccca atccaaatgt ccatcaatga    10680
          tagactggat taagaagatg tggcacatat acaccatgga agactatgca gccataaaaa    10740
          aggatgagtt catgtccttt gtagggacag gatgaagctg aaaaccatca ttctcagcaa    10800
          actatcgcaa ggacaaaaaa ccaaacaccg catgttctca ctcataggtg ggaactgaac    10860
          aatgagaaca catggacaca ggaaggtgaa catcacacac cggggcctgt tgtggggtag    10920
          ggggagcgca gagggaaagc attaggagat ataccaaatg taaataacga gttaatgggt    10980
          gcagcacacc aacatggcac atgtatacat atgtaacaaa cctgcacgtt atgcacatgt    11040
          accgtggaac ttaaagcata aaaaaaaaaa acaactctca aaaaactggg tatagaagga    11100
          acatatctca acacgataaa agccatacac gacagaccca cagctggtac tatcctgaat    11160
          gcagaaaatc tgaaattctt ttctctaagt tgtggaacat gacaaggatg cccactttca    11220
          ccagtattta ttatttaaca tattactgga agtcctaagt agagcaatca gacaagagaa    11280
          agaaaagaaa gaaagaacat ccaaattgga aaggaagaag tgaaattatc cttgtttgca    11340
          gatgacatga tcttatcata tatttggaaa aacgtagagt ccacaaaaaa ctatgagaac    11400
          ctagaaacaa attcagtaga gttccagaat acaaaatcaa tatacaaaaa tcagtagcat    11460
          atctatatac aaacactgaa ataatttgaa aaaaaaagta atccccttta caaaagctaa    11520
          aaataaaata agtaggagtt aaccaaagaa gtaaaagagc tccataatga aaactataaa    11580
          acactgatgt aagaaaagca gatacaaaaa aatagaaaga tattccatgt tcatggattg    11640
          gaagaatcaa tattgttaaa atgtccacac tactcacagt ggtctacaga atcaatgcaa    11700
          tccctatcaa aataccaatg acactcttca tagaaataga aaaaacaatc ctaaaattta    11760
          tatggaatca caaaagaccc agaatagcca aagctatcct gagcaaaaag atcaaaactg    11820
          gaggaatcac attacctgac ttcaaattac actacagagc tatagtaacc aaaaaagcac    11880
          gggactggca taaaaccaga cacacaaacc agtggaacag aatagagagc cccaaaataa    11940
          atctacatat ttacaataaa cttatttttg acaaagctgc caagaacata cattgggaaa    12000
          aaagatagtc tcttcaataa acagtgctgg aaaactgttt atccatatgc agaagaatga    12060
          agctagatcc ctatctcttg caatatacag aaatgaaatc aaaatggata aaaatttaaa    12120
          tttaagacct caaactatga aactgctaaa agaaaacatt ggggaaactc tccaggacac    12180
          tggactggac aaagatttct tgagtaatac cctacacagg gaaccaaagc aaaaatggat    12240
          aaatgggatc acatcaagtt aaaaagcttc tgtaaagcaa aggaaacaat caataaagtg    12300
          aagagacaac ccacagaatt acagaaaata cctgcaaact atctatctga caagggatta    12360
          ataaccataa tacataagga gctcaaacaa ctctaggaaa aaaatctaat gatctgattt    12420
          ttaaaatggg caaaagaata gacatttctc aaaagaagac ataaatggca aagaagctta    12480
          tgaaaaggta ctcaacatca ctgattatca gaaaaatgta aatcaaaact acaatgagat    12540
          atcatctcac cccagttaaa atggcttttt ttccaaaaga cagtcaacaa caaacactgg    12600
          caaggatatg gagaaaaggg aacacttgta tactgttcat ggggatgtaa attagtacaa    12660
          ccactataaa gaaaagtttg aagagtcctc aaaaaactaa aaatagtgct accatacgat    12720
          ccagcaatgc ccctactaga tacatgccaa aatgaaagga aatcagtata ctgaagagat    12780
          atctgcacta ccatgtttat tgcaacacta ctcacaatag ccaagatttg gaagcaacct    12840
          aagtgccaat caacagatga atagaaaaag aaaatatagt acctatacac aatagagtac    12900
          cattcagcca tgaaacaaga atgagaccct gtcatttgca acagcatgga tggaactgat    12960
          ggtaattatg ttaagtgaaa taagccaggt acagaaagat aagcttggca tgttctcact    13020
          tattttgggg agctaaaaaa taaattgaac tcatggagat agagagtaga atgatggtta    13080
          ccagaggctg ggaagggttt ttcgggagat tggggaggat ggttaatggg gggatgctta    13140
          atctaaatat aacgaataag atctagtatt tgatagcaca acagggtaac tacagtcaac    13200
          aataatgtat tgtacattta aaaaataact aagagtataa ttagattgtt tataacacaa    13260
          aggataaatg gatgaatact ccatttacac tgatgtgatt attacacatt gtatgcttgt    13320
          atcaaaatat cccatgcacc ccctaatata tacacctact acgtacccac aaaaataaaa    13380
          agtaaaaaac aaatccatct ttcagttcac taatactctc ttctgctgta tgtaatctgc    13440
          tgaattgatt tattgagttc ttcatctcag taaattctat attttcagtt ctagaatatc    13500
          cacttgatta attttaatag aatctggttc tttggggaag tatctatttg ttgaaattat    13560
          tacagttaaa atttttaaat tcctatctga taattccaat atctgcctca cgtatgaatc    13620
          actgctccca tgatgttttt ttctcttaat ttttagtcat ttggtcctgt ctcctggcat    13680
          actttgtaat ttttgtttaa gtgccaaaca ttgatgcaga gcaaagataa atcaccttga    13740
          tccaatcaag aattaagttg gtctaaggtc tgtttcagac tttcaagaac tggcctattt    13800
          ctaggttgcc ctactcctag tgaaacaccc ttcagggatc tcaaataaaa tcctaatgtg    13860
          tttaacaggg tcttttcttc atggtggtcc ctgaactcca atttttctgt gaaagcctca    13920
          taagaacatc aaaactctgc ttaatacttt agcctcttag cagctacttt cagctaggca    13980
          tcttagcctc tcattccaca aagctgagaa cttggcgaat accttgagga caaaacctgt    14040
          acagaataat tttgtttccc tagctcagag taagacagct gatagctcta agtttccatt    14100
          ttctgttcgg cctctatgcc ttatgccata aattggcaaa tgctaaataa aaaacagagg    14160
          cagagaaagt ctagctgtct atagcatgtt tctcttttct ctgggatctc aggctctcca    14220
          tcctggctat catggttgtt ctccattgcc ttcaagcagc tgttggttct attttatgca    14280
          ctttttacaa ctgttcttga taggtagctt ggtctgatac aagctacact gtcttaggca    14340
          gaaataaaag tctcttcact cattatattt tagtcatata tcttaatcca ttaaaataac    14400
          ataattctat gatggaagaa atttggtaat gtttaaaaag gataatgaag taagtagaaa    14460
          taacgaaata agtaaaaatt gtcaccccag aaaagttaaa attaagtagt ttttgacaga    14520
          aaacttttca atttattttt aagtctgtaa tatgaaatat tttataaaat atcaagtgaa    14580
          atacttgagt ttttcaagat ctccctttga taatataaat ccagtacccc attcagagaa    14640
          atttatccta agtatgctta aacatgaatt gagagtctaa ttataaaaaa taaaaaagca    14700
          atagcatata atatataaag attatcttat ataactacag aaccaaacca gtttatgttt    14760
          aatcatacct tgttaatttc cgtttccttt tggcagcagt agtcattgcc atgtaggatg    14820
          gcaccatgct tggtacaggc atagaatgct tagttgagaa tgaagaagga tcaagcctgt    14880
          atattaatag tgacaaataa aaaataataa ttttgatttg aactatgaag agaaaaggaa    14940
          gcaaatgtgt ccataattag aaaaccattt ggtattaata tataaagaaa aacattctgc    15000
          tatactgtaa agattccctt gcttgtcctg gggtattctt ttctctttat aacacaggta    15060
          aagttgctat caagagattt ctgcattccc agtggcatag aatagtgaag gtatttttct    15120
          ttccatattt agattgggta tgattatgca gataaagtga gaaggatatg tttgcttgga    15180
          tgacacacat tcaaccatac tttaggggta tgaccatttc agagtaagtt gaggtttgct    15240
          aaacatcaat agaaagtgtg aaatttcctt cagtgaaaat attaatgaat aataaacatg    15300
          ataatcctcc aacaatagct tgtataatcc accttcagag taagaagaac aaactaaaca    15360
          tatcttaagg tctctcctag actaacgacg gtcaactgac ttaagatatc aaatttaaga    15420
          ctttaaaata ttttgttagt gaattaatat tcagagagaa agataattaa aatttaatga    15480
          aaataaaaca gactgtttta taatcaaaat ggcacacttg gtttatgaaa taaacctcaa    15540
          ctaatagttg aaagtctatg ttaaaaaaaa agaattggca aatattattt ttttgtaccg    15600
          ttgtaaaatg tctttgttat catttggtag tgattcttgt tcgggtaatt tacacttcga    15660
          gctcttgatg tcttcacata tagtaaatgt agagtccaag tcctcctgtc cacattcttt    15720
          tcttctatta tgagggatag ctacttcaca caacattttc agacaattat cactgtttat    15780
          gtttgagctg atagcctgaa aacttgtagt aaatgatgat ggtttcatta aggttactgt    15840
          agacggattt tgaaaagctt ttctacagtc ttctggtgta tatacaatag gctgaagttc    15900
          tttgctaaga gaatcattga gctgcacact ttgagatggt ggagacttta gagtatgctg    15960
          tcctttcaag ggagatggca ttagttttct ccgagttctt ttttctgtag gaatcttaac    16020
          cagattagtt ccacctgaag atgagcctat tcaaaaaaat aaaaaaagac actcgataat    16080
          gtttcctagt tttttaaata acccccatta cttttaaaac taagaaaccc taataataag    16140
          gtatttttat gccaattgat aaaaatctga aaaatataag ttggaaagga aaatatcacg    16200
          gtttactgct aaaaacttta aataaagata aactcattat aaagaaattc tataacaaaa    16260
          gaatatattg ctaatatcaa tattaattta taggtatagc tttcttgaga tattgggtaa    16320
          ttaggaaaca aattatcaat caattccaat aaaattcaca atttctagct ttcatgtttg    16380
          atttgggttt aagatgaaaa cagtattaaa cttttatagg cacagaggtt aacacttgtt    16440
          ccattgtaaa atattaccag tttattactt ttgttttgcc ttgtttttta gatttgcggg    16500
          tacacgtaca ggtttgttat atgagtatac tgggtgatgc tagggtttgg gtgtcagtga    16560
          ccagtttatt actaattgag tggaagtcta gtctaaatga acaagaatgg caataaccag    16620
          taaaattctg ggtgaatgaa agcattgttt ctgttacagt gtcaggtata cagagttgac    16680
          cctcagtagc tgcagattct gcatctgtgg attcaaccaa ccagagactg aaaatattca    16740
          caaaacaaac aaacaaataa accaaaacaa ttaaaaaaat atacaatata acaaccactt    16800
          aatggcattt gtattgtatt aggtattata agtaatctag agatgattta aagtacacag    16860
          aaggatacat gtaggctata tactatgcca ttttatgtaa gggacttgag tatccatgga    16920
          ttttggtatc tgggagggtt cctggaatca acttgcctgt ccccaggata ttgagagaaa    16980
          actgtagtca attaagcatt ctagttaact gatttgtctc ctgtatcata cataactcat    17040
          aggtttgtaa aaacaagatt taatactaaa gataaatgaa ataattcaga gagttcagag    17100
          tactttcacc ctcatcactc tggagaagtc agtctcccaa atgtcaagag gtcactaagt    17160
          ctgatgatct ttctcagcct tatctgataa ttcctgtagc ttttcaaaat tatatctgta    17220
          ctattctaac atctgtgtta ttctcttctt ccatctagta aatgtacaca tttccctaag    17280
          gagctgtact tgaccctcta gttgccttgt tctacacagt ttctcatatt tctaattatc    17340
          ctcttaccat taccttctct gtcacctggg ttccaaatta ctagattttt ttttctacct    17400
          tttcccttgc attttccaat gtataccaat tctgtctttt ttatgcttat agttaaaaca    17460
          taattctgtt catgtcatcc ttctgattaa agacttttta gtaatcttta aatagaaaca    17520
          aaatatgctg atatttttag ttgggtaatt cttggtcctt ggtccaaaat taagaaacaa    17580
          attgtttcat tagaatttat taccacaata ctagatttag tatttaatgt ttaacattta    17640
          aaaacacaaa catctggtaa acacctttta ttaatgcccc aaataatgac atatgtaaca    17700
          atacacttga tcaacttcag tgtgattatc ttatattttt caattaactt ttttctactc    17760
          tacctacttc attctggtga acttcatggt gtctgacatg aaataccttt gcttggagtg    17820
          tacggtcaat ggaagaaact attacgtgta tttccattca cgttgtctaa tcatgaagta    17880
          aaattcccag ttgatattta ctttactgta taatactaac ttaaagaaca ttgaaagcag    17940
          aataagataa gtgttatgca tttcaataaa gcaattcaaa ctttcaacca agttagaaaa    18000
          tacacttaaa caatcagcaa cagtacaagc actattctta ttatattagt tgacaatatg    18060
          ctctgctttg gctaggttga caattaccct ctaggaaata aaattcaaaa acagaagaaa    18120
          aatatgatcc ctgttctact gaggaatttt acttttctga gaactagata aatgagatcc    18180
          agatcttaaa ataattttcc actcccttta acatgacatt tgtcaaattt tccattacca    18240
          gatattttta tactaatgct gcagagtaaa gacagttact tttctccact gtgctgctac    18300
          caccaatttg gtggctatta atagctggca gattaacttc ttttcccatg agaggcagca    18360
          ggggtatagg ggatagaaaa ctacatggag ggtagaggac tgaattggga gtcaggagac    18420
          ttggattcta tttctggctc caccaacagc tcaccaagtg accttgggca actcacttaa    18480
          gcagtgtggg cattaatatc ccctagaaaa aagcggatat taccttttta tatatgaata    18540
          ggattatatg ataagggttc aaagaaaggc tctagaaatg caaatatgtt tcaactgtta    18600
          atattacaac ttttacaagg agagttgtaa tttactttcc aatcatcaaa aacttactgt    18660
          tatctctaaa acaatatatt tcaaacagtg cttcactttc agtttatcag atatccagtt    18720
          tatcaaggct gatgattaat ataaaccaca ggtattattg aaacaggtat atatgttctt    18780
          tgcaaatgca gaccttataa taacatttta aactttaaaa tacaatggaa catgaaatct    18840
          caagggacaa gaattataga gtcattattt tttaaaatac atacttagca ggtataatct    18900
          ctgggagtgg caactgggca aattcccatc atggtggacc acattttccc tactgctagt    18960
          aaagagtgat aaaaatcaca gtcttctggt agaacactga agaaatatcc acgtgtcctc    19020
          tgggataatc taagcataca cccgacatca aatttagtat gatcagactg actaacaatt    19080
          tgtcagtaaa aggaatagtg gtgttacagt gatatatctt tagctataat cctgctctcc    19140
          tggcagagta taagctgaag gaatagcatg gagatgtggt agttaatgtg gatttacata    19200
          caattgtttt actgggccta gaagaagaga tgctacagac acacaacatg tatatgatat    19260
          aaatctaaag agttcttttc attctctcaa ttattaagtt cagataaaat aaaagggcag    19320
          aaggcagatg gtcaattcag aactacttag gctgattagt tgcttagaaa gcttcaggag    19380
          ctaaccagag caaaaacaaa atttaaaggt ttaaataaaa atttaagtca atcttctgta    19440
          actataaaca taaaaggaaa atgacccaac ttaatgaaaa ctaaaagcat aaacaactaa    19500
          attttactct gaatacaatt tttataatat ataaatacaa ttacataaca aataattatt    19560
          atcctttagc taagttaggt aataaagaac tttatgtggg tatggcaagt ggagagtgtt    19620
          gagttggggg atcagaaagt tcaataggct ataagaactg ttggatatgt taggtctatg    19680
          tctataaaag agatctgctg tacttttcca ttagaggaaa agggtgtaca gtaaatttcc    19740
          agaagagcag gcatgggaca gttgtagttt cccctgattc agcttgggaa aacactatct    19800
          aacaatattc cataattctt gtgcttatag agtagaagtg ataagaagga acttggaggc    19860
          agattataat tccttcagaa aggccccata aaatgagaaa atgaatcaca aagttgcagg    19920
          ctgtgccttg cagaacaaga gaccatatag atgatgatag cccataaaat accctagcaa    19980
          cgtgggtgct acacagaagg gaacaggaaa ttaaaaatgc attgttataa ggcacgctct    20040
          tgcaaactgg aatagggaag actggcagtc acttgggaag acatatctct agggtctatc    20100
          taaggaacta gtccagtgta tcatatactt aaatataaga ggtagtgggt agcaatgtat    20160
          gttatggttt ctgagtaatt ttgctatttc cacaacatct cttgagactt taactcctca    20220
          acatattgta agtgtgctcc atttctatta ccttgaatga ttatgaccca tgggatgtaa    20280
          gtgaatagga ctttttgaaa tttatgccca aataataaca ggaagcataa tgtcaaaaaa    20340
          tttaaaagaa aaaaatcact actactattt tgaatccagg atcaacatat gttttattta    20400
          tgaaaaaaag ttgtagtcag ctatggtaca aaagcaacaa tctaaaagga gtacacctgc    20460
          ataaaaagaa ttcactgttc atcccaccca atatttatta agtacctacc ataccatgct    20520
          aggtacagtg gtaaacaaga cagttaagaa tttacatttt tgaggggaga aggcagatga    20580
          caataaacaa ataaaataaa ttaggatgat aaattaattg taaagacaat aaaacagaga    20640
          aatggaatag acagtgatgg gagataggat gttttaacta tgatggctag aataacaatt    20700
          ctaaggatgg aatatgtgat ctgagacttg aatggctaag gaggcagttc tatgaagatc    20760
          tgggggaaaa ggcagaaaaa atagcatgtg cagagatcca acggcaacaa tgaatttgtt    20820
          gagctcgagg aaaagaggct agtttgattg aagtgctgtg agttagaggg acaggcagaa    20880
          taagaggcta gagagatcaa aaggggcaac ttatgttagg atttatggac aagacaaggg    20940
          tttttattta ttccaagtgt aaagggagat ctgtggaggg tttcaaatat ggatataatg    21000
          tgatctgatt gatgtttagg aaaaagagtg atttgcttgc tgtgtcaaga atggtcaaga    21060
          gagaaaacag aaaaatcggt aacaaggcta ttgctatagc ttaagcaaga aatgacagct    21120
          tgggtaagag tggtaggagc agtgatggag agatgtgaga agggtattat aatatctata    21180
          tatgtaatta gctgccttat aataaagagt tcacagaaag tagtatatat taattctaca    21240
          taagtaaatt aagagaaatt gacaatgctc cataaaacca tgaaccattt atgcatgtca    21300
          ttccctcaac tttggcattc tttttttttt gacatcccct tccctctact cccactcatc    21360
          aagcttggga tcctgtcctc tattcaggag ttctgatcca tgtaactgta ggagtcctgg    21420
          aatctgcatt tttccctttc tagtttggac actcatagag acttgaggca gtagaaactc    21480
          tttggggttt gaggctgtga tttcttattc agagacgatg agtgttatta ttatgctgag    21540
          gtaggggaaa ggaaagaaaa ggagtaagga taagtaggaa acagtcctag aacaaaagta    21600
          gcagatagag acagtattga aaatgaagtt cacctcctag gaagttgtac caaaggcaat    21660
          taatgggtaa gatttaagtt ggtagaatga tgttaaaaac agcatctctt tttaggttag    21720
          gcaccctact gtctctgcat attcatctct ggacactccc aaacaattaa aacaggttta    21780
          tagacagttc caggcataga catactatgt tttcagatac aaggtctaat tgctcctctt    21840
          ataatatttt gttagtatag cattcagttc tttaaaaagg agccaatgca ttttgatcca    21900
          tgtttaagga agcttgaaaa tgcaaaatgc aaacttgtaa tgaatgagtt ttgataaaag    21960
          aatatacata ttagaatctt ttctttttga tagggaagga atttagaaag acactggctg    22020
          cttgaagaat ttctcactag aaacagtact tggttggcac acttgagaaa tacccatagt    22080
          acaaggaggc atttgaaggt taactgcaaa agacaatttt aaccaaagtg ataacctgaa    22140
          tagaggcatc tagcgcccac tcagattccc tttaaaatga tcacatcatt aaaaaaaggg    22200
          taaacttgac ctaatgttgg taatgggaaa acattatcat ctgagtgcca gaacattaga    22260
          ggactttcta aagagtattg tatagctcag actcttaagg gaaggcatgg aggagaatga    22320
          cttatagtac tccctatcct ttacccttca gtgctatccc aaggagttaa gtaaaagaca    22380
          ctggcagata tcagtaaagg gccttaaatt agaaccaggg atgatggggt aaggtgggag    22440
          ttggggagaa tgagtgagac acagctatgc aatatagtaa aatggcaaca tctgaacact    22500
          aaaagtagcg ctaagaggct ctaaaattca gtcctggctc agttgtttca gtgcagaaaa    22560
          aaaatattaa aaagtacccg atattatcag gcttgttccc atcactgttg gctatatcac    22620
          acatggatga gatactcttg ggcaaagggg cagatttcta gctgagacta cctgtggctc    22680
          tggttccttc cctacattcc ctgggctgtt ggatcagtgg acaggaatat attttttccc    22740
          cttaatttta caggaaaaaa cataattata ataagcaaac agaaaactca ctggacctat    22800
          aaaaagaaaa tgtaaagaaa tgacagaact ggcatacaaa ctcagacctt ttgctaatcc    22860
          agatgccaag ttcttcacca ccacacaatg ctgagcccct accacagaag ttaattaaat    22920
          cacttaggca atgactaaat aactaaatga acatgaacat ccacaattac actgatattt    22980
          aaaactatat tttatagatt atttgatgat ataaaaaaat gttcattaat gaggtagtat    23040
          acagtatgat cccaattttg acaaaacaaa aacaaaaaca aaaacaaaaa ccaaatcaaa    23100
          gcgcacaaac ctcctgagca aaaatggggg gaaaagtaat agaaaacaga gaaggaaata    23160
          taatccaatt catcaaaatg ttaacacagg tttatagctc actgggaaaa taatgaatta    23220
          ttttattttc ctttttatac atttgattat tttatataat aaatataatc ctgctctgta    23280
          aaataataaa tgaccaaaaa aaaaaagggg gaataatgtt tggggtggtg ggtaggaagc    23340
          caataaaaaa tcagctcttt caaacctctg aagatctcag gaactgaagg catgaggttg    23400
          tctctgaaag cacagggtgg agttaaaaca ggagaattct tggaagtctg tataaggaag    23460
          ttggattccc agatctccct taccccatta ccatcaccta cattgctagg taactgctcc    23520
          tttgttaccc tattaaaaga catgaagttt tactctctgg ataggctgta gactggggcc    23580
          aacatgcaca gctgacacta ggtgcattaa ataatttctt aataataaat atatgctgat    23640
          ttttctccca cttctctgta atactggtag ccaggcccat atacccccta aatggaaaat    23700
          caaaaagttc tttgtaaatg aaacataaaa ataaaaaaga tggacatctg taggttcccc    23760
          cagattgact agttttctgg agataactat aaatcagagc tttgtttaat aagtccaacc    23820
          ctagttttgt aatagttact cattaatagt ttagcaaaca tttttaaaat atttatatga    23880
          tgctttaagg catcctataa aaaactgaaa gtatgcgttt caggataaag tggcgagtgt    23940
          tctattcatc tgttcctgca ttatggctag agattcccgc ttcaaaaagt ttgtttactg    24000
          taagtccaaa gacagactta aaaaggaagt tagacaaaaa cattttgttg agactgccaa    24060
          gttttagaag cctctcaaaa gacttttaag tattaaaacc acttttaaaa ttaactgtaa    24120
          atgcatgcac tgaaatcatg gattagatgg agaagaaata caaatatttt catcaataac    24180
          ccaggttcta aaacaatgta acatggatta caacagaagt atattaacat tagtattata    24240
          gagtattaaa tttgctatta ataaaaccac agctaaaaat aaaaacaaaa acagtgaaat    24300
          cataatgaaa acataattaa tttgcatgac aaactacatt tgctaagtgg ttataaaaat    24360
          tataaataaa tatttggtga gtggttaagt ggttaaaaaa gtaaacaaag tttggatatt    24420
          catctgccat tcactatctc tcaaatgtgt aggattttaa gacatataat tgatgaatgg    24480
          tagtgtaata aaagcaataa attgggcatt ttgattttga caataaaaca taggataatc    24540
          tgatgaagta cataaaaaag acttgaaaaa agtttgataa attgactgcc tatacctcaa    24600
          gagaaacatc tacaaatgta tttattggtg gtattgctct ttaagctact taagtctacc    24660
          tataaggaca atcaatctac ttcagtattt gcatctttca aatatttcaa ttctccagga    24720
          agtctatctc acagatttgg ctgaggactg tgaaacgttt ccagtaaaaa gcagaaaaaa    24780
          aggaaaaaaa aaaagagatg cttcatgtct gtttccctaa aattagtttt aagaaatgtc    24840
          agtatattct tacttctaat aaatgtttta aataatattt tatttaatta taaaatattt    24900
          ccttaagtag gctctaaatg ttacacatat taacatatgt ataaatataa tgtgaaattg    24960
          catactttat gtatatatta tataacatac acatgtcact tcttacctga tcctgctaaa    25020
          atacattagc aaaaccagag aagaaataag gtggcggtgt tgtaagtgag ctaattcttc    25080
          atctctcatg attagaagtt ataacatcta aacactaatg aatcaagaaa cagcagtata    25140
          gcatactgtt tagaaatatt gtaggttgca acctactcat ctgacaaagg gctaatatcc    25200
          agaatctaca atgaactcaa acaaatttac aagaaaaaaa caaccccatc aaaaagtggg    25260
          tgaaggacat gaacagacac ttctcaaaag aagacattta tgcagccaaa aaacacatga    25320
          aaaaatgctc atcatcactg gccatcagag aaatgcaaat caaaaccaca atgagatacc    25380
          atctcacacc agttagaatg gcaatcatta aaaagtcagg aaacaacagg tgctggagag    25440
          gatgtagaga aataggaaca cttttacact gttggtggga ctgtcaacta gttcaaccat    25500
          tgtggaagtc agtgtggcga ttcctcaggg atctagaact agaagtacca tttgacccag    25560
          ccatcccatt actgggtata tatacccaaa ggactataaa tcatgctgct ataaagacac    25620
          atgcacacgt atgtttattg cggcactatt cacaatagca aagacttgga accaacccaa    25680
          atgtccaaca atgatagact ggattaagaa aatgtggcac atatacacca tggaagacta    25740
          tgcagccata aaaaatgatg agttcatgtc ctttgtaggg acatggatga aattggaaat    25800
          catcattctc agtaaactat tgcaagaaca aaaaaccaaa caccgcatat tctcactcat    25860
          aggtgggaat tgaacaatga gatcacatgg acacaggaag gggaacatca cactctgggg    25920
          actgttgtgg ggtaggggga ggggggaggg atagcattgg gagatatacc taatgctaga    25980
          tgacgagtta gtgggtgcag cgcaccagca tggcacatgt atacatatgt aactaacctg    26040
          cacaatgtgc acatgtaccc taaaacttaa agtataataa taaaagaaaa aaaaaaagaa    26100
          aaaaaatatt gaaattaaat gaaaaaaaaa aaaagaaata ttgtaaatac tgtctggctg    26160
          tggtggctca tgcctgtaat cccagcactt tgggaggctg agataggtgg atcaccggag    26220
          gtcaggagtt taagaccagc ctggtaaatg tggtgaaacc ccttctctac taaaaataca    26280
          aaaaaattag ccgggcctgg tggtgggcgc ctgtaatccc agctatttgg gaggctgagg    26340
          gaggagaatc gcttgaacct gggatgcaga ggttgcagtg agcctaggtc atgccattgc    26400
          agtccagcct gggcaacaag agcaacactt cgtctcagaa aaaaaaaaaa aaaaaaaaaa    26460
          gagaaagaaa tattgtaaat attgtaagtt tgttatatat aatcatccag catatattcc    26520
          aatagaaaac agaaaaatcc ccagtaattt tatatcttcc taaggatagt tttaagaaat    26580
          gttggaaatg tccttaaaac agttgtcaat gacaagtcaa atccaaataa tttgaaacca    26640
          aatgcttggt tttagtccat cgctacaaga aaaaaggaat aaacttacac acaaatgttt    26700
          cctaatagca aaaactgaaa ggctcaagca agataaggcc ttacgtactt taactatgac    26760
          atttctatgt catgggaatt atatagttta gcaatctata tctatttttc actgaatctc    26820
          tactttaaaa gagtggtcct aactactggc caccaggaaa gttacaatgg ggatcatctt    26880
          atacaaacaa ccagaattta gtactagatg gttttagtgt ttatttaaac ttcattattt    26940
          tataatttgt tgctcacagc aagaaaatga cattctcaaa gtcatgatag caattatatt    27000
          tgttgttgcc agagttggag tcatgtttct tattttccag gtagaagtca ggtaaaaagt    27060
          aatgcaagta atacagagta ataacatata taataaacat aatggagact taaaaaaata    27120
          aaactttctt cacagactca aaaatatgaa taggaggcaa catactactt cattgctccc    27180
          aaaatgaaat gctatttcct attattactg aaaagagaaa gtaggcaaat aaaatatgaa    27240
          tatcttcata acttaaaatt gggttacata aaaatcaaaa ccaaccatga ataagagaga    27300
          aaaaaataca tgtaacacat ttggcaaagg atttagagct cgtgtatgtg tatgtatgta    27360
          tgtctatgta tacatgtgta tataggttgg ctggtctgtc tctgagagaa ataattctta    27420
          caaaacaaaa tggataagag caaaataagg caaaggaaga ggcagttaat tcagaacaaa    27480
          ctataactag acaaaaagca catgaaaaaa tgttcacctt caccttcatt acccacttac    27540
          aatggtagac tacacttata atagttctgg gggtggggaa tctgacaatg catatctaat    27600
          gcctttaaag tatacatact gtttgattaa gctattcttc ttctaagggc ttagcctaag    27660
          gaaataatta ggcaagttgc aaaataaata cacatgcaca gacatttaat ggggtgtcgc    27720
          ttgtaataat aaagtgaaaa caaactaaat gttaattagc aggagattag gcaaatataa    27780
          tatgcagcta ttaaaaatga cttaaattca tattcgttga tagcaaaatg tgtctacagc    27840
          aagtagttca gtgaaaaaga ggctggttat caactatata tatataatag attccactgt    27900
          tcttgtttta aaaaagcaaa ccacaaatgt atgcttagaa aaaaagttca gtaggctatt    27960
          aaaactaaat actaatataa gttaataaag tatatcttgt ttcttttggc ttcacttttt    28020
          tccaaattaa aataaacaaa tatttattgc taagacagta acaaggttaa aacactagtg    28080
          aaaggaataa aaaacttaaa agccatggga atacagatga atatatgcag gcaaaggaaa    28140
          gatgatccat taaaaggaag atttaataaa gaaggaagta tctgaattgg actctcattg    28200
          tggagaaaga tttaggccaa gaagtgggat ggatgtagag aaaacaagca tttgaaattg    28260
          atggaaaagc ttggaaattg cagaggccag aaacagaaat catgataaca gaaggttggg    28320
          atacaaggtg ctggacaaaa gtatgcctat agcttgacac tggacttgga aagcctttga    28380
          agactcttct gagaggtcta cactttatta ggaagatcac tttgttggca gtgtgaagtg    28440
          tagactgcag tggaaagaga caagagaaat taaaactagt ttagatgtca ctatattatt    28500
          catttcttat gccaaatttt ctaaaaatat tttaaaataa attaagaaac atctttttct    28560
          ctctttgttt taaataaatc tctaaaacat aattgctaaa tggcaattca tgtggtttct    28620
          taagtagagg gggctttata tttatttttc agcttttgga aatatttcac agatggttcc    28680
          tttacataaa ataaagagac tagataattt atcactaatg ggtttaaaat ccctctctta    28740
          aaaatgggca gggcttttgg ggtcatcttt tgatgtgcca tatcatgtgt tctgaatgat    28800
          tttacccaga ggaagtaatt tatcaaaagt ttaagactgt aaacgttaag agatttatag    28860
          agctgtatgt tattgtaaag gaagaatgcg gtatttagca aacatgagtc ataggctgca    28920
          aagtagggtt catgacaggg agacattgat gaatgggatt agatctaatt gaggtttggt    28980
          acaaaacgat ggcaaggatt cttcctttgc aagcaagcac tcctgttaat atgtacgtga    29040
          ggagaaattc tgggaaactg tgctaaatca aaattagttg gcaaagttct aaagtgaaat    29100
          caaatattaa tgtatacatt tcaataaaaa cttctaggct acaaatgatt gatacaatta    29160
          gtgtactcat cataaatctg gattcttttt aacagcctta tgactcatgg aattcatagt    29220
          tgcaaatgat acaggtaaat gaattttaac tatttataag atacgtaaac ttatcttata    29280
          agataaagta ccattaaatt aaccaaatat aagataaggt accactaaat taaccaaact    29340
          aataaacatt ttataataca cttatgagac actctcatgg ttagggatgt ataatagttc    29400
          cctaatacat agggaactat tgtcctaata catagggaac tattatagtc ctttaaatta    29460
          atccagcact ttgaataata aatcaaccca taaccttttg atattttttc tgtgggaaat    29520
          agcagatatc atgtttctct ctcagtttca ttttctcagt atttacactt accaaagatg    29580
          gaaaagaagg gacaatacaa agaacctttt aattcacagt aatatttgca gctatagatg    29640
          aataactaaa tactgtctta tgtacatggg gatgataagt caaacaaaat gtatttaggg    29700
          atacaagcat gatttccatt gtttcatgat taaattttgt tgccaaatgg aaaaaatatg    29760
          gaagatttgg tttattaaca ttttcctgct ttatatttgt tatatgagaa attagtatag    29820
          agatttccta tctttcaaat gaaatttcct tgtattcaag taattttagg ggaaacttaa    29880
          acttatgtgt gaactctata ttcaatcaga atattggtac tatgttaaga gactggttct    29940
          cctagtatct tttattgtac tttaagataa aatcactgac attgggtgca aaattttaaa    30000
          aaaggaaagg ttacagacag aagtattacc aaatgtgagt ttccagatgg ataatgagga    30060
          aatcttgact tttcatttaa tgtcagaaat tttatcagtt ccataaataa attttgctgt    30120
          cagcaccccc gtcttgcact acacttagtg agtgtgctat ctattttcca gaccccaaaa    30180
          taggtacata ttttactctt agtcaataca cttgtagttt gaaggtaaag atttcacgtc    30240
          aaataaatat ctattcaaaa atcaagtcta tttattagaa aataattaaa attcataaaa    30300
          tttacaaaat tagtttcttc caaaataaga atttaggctt attaatttaa gaaaagtaaa    30360
          aagtagtcta tgtcacaaaa atacaaaata ttgtatctag ggatctattc agtcaaattt    30420
          ataaaacact tacgaagaaa actctgaaac tttgctgagg aacatacaaa aagatatgca    30480
          tacagggaga caaactattc tagagtacga agatttgata ttggaaatat gtgaagtcaa    30540
          tttatgaatt aaaaaaattt catttccttg aaactggaaa ttattctgat attcatttcc    30600
          tagacaaagc aaagaatatt tttcagacaa agaataatga agaagggcta gcatactata    30660
          taaaaaaaac tataaagtat cacatattaa aataatagct actggcccta agacagacaa    30720
          acaggtgaaa caatagagta gaaattgagt aaacagaatt atatatgact acttactgta    30780
          caaaaaacac agtggctgtt aaggatgcat tgccaatata tctatataag aatgctagtc    30840
          tccttggaaa aaataaattt agattcttgc ctatcattta acaccaacat aaattaggag    30900
          aaagtggaaa caaaaattta aaagcttatg aatggaaagg ccttttgagg aaagatcccg    30960
          aaggcagtaa gagagagaaa aaagctattt tactacataa atgttttaac tttcagcatt    31020
          aaaaaggaaa cctcaaacaa aagcaagaat aagtggcaaa tcttgaaggg tatagttata    31080
          ctatgtatat tacaggaaaa agttaatatc ccttagtgat ttcatcctgt cctatggctt    31140
          taaatatcat ctaaatgtta acaactctcg aatttatgtt ttagcttaga cttctctcct    31200
          gaacttcaga ttcttaactg cctacatgat gtctccactt ggatgtatct tagacaaatt    31260
          taacatgcct agaactgaac tcctaatttt ctacaacctc caccctgtat acctgctcca    31320
          tctgaagtct tccttatctc tctgaaggtg actcaattct tttagatgct aagttccaaa    31380
          attttagatt cagtcttaag catttctttc tctcctattc caaatctaat tttcttggaa    31440
          atcttgctgg ctctaccttc aaaacatttt agaatctgac cacttctcac cagctccaat    31500
          gctattatcc tggtctgaat aacctccatc ttttgcctgg gttattctag tgcctcctca    31560
          tgtttcagcc cttgccatag tataatctat tctcaccaca gcagtcagag agatctttta    31620
          agagcacaat tgaggtatgt tacatttctg ctcagaccat gtcatggctc cttgttttat    31680
          tcagagtaaa agactaatta agtcctgata gtaacctaca aggccctatg tgatctgcct    31740
          tccttccctt tatctctctg atctcctcac tactttcatt ctctttttct ttgtaccagt    31800
          tatatatcct caccagcctt tgaatatgtc aggcaaattc ctatgttaga gattttgcac    31860
          tgtgattgtg tccctctacc taaaaaagtt tcttctccca gatattcata tagctagtcc    31920
          tgtgaagtcc ttcaagtttt atcagtgaga tcctccctga ccatgctact gaaaatagca    31980
          atctctctcc tccctggcca cactcctgaa ctccctttat ttctttctta tagcatgtag    32040
          tacctcctag cattctgttt aatttattta ctatattatt gtctttctct actagaagtg    32100
          agctccttga gggtggtgga gtttgtttca tactttgatc cctatcatca gacaagtgcc    32160
          tgaaatactg ctgtaagtta aacactgttg aatgaatgaa aaaaaaccta cacttaagat    32220
          cttgtaaaaa agtaacgatt gttactaaag atgactatat cagaaaaatg tcaaaggatg    32280
          gctgggcaat tcacagaaaa aagactcttc aattaaaaaa aacacactca actatattag    32340
          taatgaatat ggaaaaaaga tagtatttat gactattggc aaagtatcaa caagcattgc    32400
          cattactttc aatgatgaaa accacaatta cttctgcact aacctaaaaa ttagcaaaga    32460
          caaaagtggg agagagtgtc caagattaaa aaagactgca taggcatgaa ccttgtttgt    32520
          atcttaattc aaacaaatca tagaaacaaa taatttatga gacaatgggg gaaatttgca    32580
          cacattagat atttgatgac atttttcttt tatacacact tgatgtaaat ggaagaaatg    32640
          atgtgctgtc tgagatctac ttttttttgt tttgtttttt gaaataaaac tttatttatt    32700
          aacactgaaa tttgaatgtt ttataattat caggtgtcac aaaatatttt tctaattttt    32760
          tccagtcata tacaaatgtg aaaaaaaaaa tcttggcaca tgggacataa aaaacagata    32820
          gtgaatcagc tttggcctgc aagctacaac taaatgaatc ctaatctttt tttaatttta    32880
          ttatttattt attttttaat tatactttaa gttttagggt acatgtgcac aacgtgcagg    32940
          ttagttacat atgtatacat gtgccatgtt ggtgtgctgc acccattaac ttgtcattta    33000
          acattaggta tacctcctaa tgctatccct cccccctttc ccccacccca taacaggccc    33060
          cagtgtatga tgttcccctt cctgtgtcca tgtgttctcc gagatctact ttaaaataat    33120
          ctagtgtaag agctggggtg gaggaaagca gatgggtttt caagactaga catgagctga    33180
          taagttttaa agttaggtgt tgggcacatg gtactcatag tattctttgt gcttatatac    33240
          atgtttgtaa ttgatttact aaaggtagaa attaaaaata ttttaacatc aaaagctggt    33300
          gaggctaaaa aaaaaaaaaa agctccttca tttatactgc ttgatggggg ttaaatcact    33360
          tgaaggagga gagttatttg gcaatatata tttcaaattt tgcataatgg gcatttatct    33420
          tgagccagaa attttacttc taagaattta ttgtagggat agtcagatat gagcacaaag    33480
          ataaatatac atatttgctt actaaaacat tattggcaat aatagtgaaa atttattaaa    33540
          caacccaaat gcccaacaat atagactata ttcattatag ttaatctcat cagatttttt    33600
          tttttttttt gagacagagt cttgctttgt tgcctaggct gaagtgcaat ggtgcaatct    33660
          cggctcactg cagcctcaac ttcccaagct gaagtgttcc tcccagttca gcctcccaag    33720
          tagctaggat tacaggcatg ggccacaatg ccttgccaag ttttgtattt tttgtagaga    33780
          cagggtttcg ccctgttgct caggctggtc ttgaactcct gactcaagcg atcggcctgc    33840
          gtcagtctcc caaaatactg ggattgcagg cgtaagccac tgtccctggc ccagattctt    33900
          aaaagcactg catgtgtgtg tatttaagta aaaagaatat agttaatcta gtaaatactt    33960
          ttaaaggtcc ctaaggcact tgaactcact tataaacacc gttcctatta ttcctccttg    34020
          acactattag tcatgtatac aacatacata attcatgaaa tggaaaatac ataataaata    34080
          aatagttgat ctctaaaatc atttgaatga aatagtaaag taacgaacca agaacaaaac    34140
          attataaaaa caaaactcac cttctaatat gtgttcaaga gaaaacacgt taattataaa    34200
          atgtaacatg gcttcaagtc tttccttcaa aaatatcatg agaaggaatt aagagtcaag    34260
          taaattcttt tgttttattg ttgacaagta tagtctgtgc aattatactg tatgtgaaat    34320
          atagattttt aaataaggaa taatgagcat catatagcag gtggtcagta tttctcaatc    34380
          ttggtgttaa aatcctattt cctttctaac atcttgagta cattataaaa aatgaatcat    34440
          gcccgaaagg tatgagagaa tctgaaaaaa acttaagttt tgctttccag agatcacaac    34500
          taggtcaggt ctaatgcttt attaaaagaa aaagaataca tatgtgtata tacaatatat    34560
          atgttttaag ataatctatc caacttccgt attttcttaa tgtaaaggta taatataggg    34620
          aacttctgct aataataaag atggagataa ctcagaccaa cctttcttct gaaggcaact    34680
          aaaagtctgg acaaaatata aaaaacatct gtttgaaggc actggattat taataagatg    34740
          gtgaaaaatt acaggtgagt atcaggagga agctggaggc tcaggaaagt aatttctgca    34800
          atttcagcta atttcccctt gaggttgttt gcttatgctg gaagagctgg cagaaaagca    34860
          tagcaacagt gctaagagct ttgggggaat agggtgctgg aactggaatt taggatcttt    34920
          gtaaatcttc cttgctttga gttgggactc tgaacagcta tactgtagag ggcaaatcag    34980
          aaataggcag gacctcagga aactacagtt tagtatcaaa ttacctcagt ctctgaaata    35040
          ggactgaggt gattctgaat tgctaatgct acctagaata tgaaagaagg aactgtaaat    35100
          attctctgag atatttaata tcatgatcag atgcatcaaa atattctgca aataattttg    35160
          caaatacctg actggcacac aaaaaatttg catgcatatg aggaattaag accacatgca    35220
          agaaaatcag tctaaacaga tccagtggtt acagactttg gaattctcag acacagactt    35280
          taaattatag ttgtctctca gtatctgtga gggataggtt gcatgaccat actaaaattc    35340
          atggatgctc atatccttta tatataaaat aatacagcat ttgcacacaa cctatacaat    35400
          cctcccatat gctttaataa tctctagatt acttacaata cctaatacta tatatatata    35460
          ctatgtaaat agttatgatg cattgttcag ggaataatga ccaaaaaaag tctatatgtt    35520
          cagtacagat gaaaccatcc atgttttttt tttttttgat tagttggttg aatccatgga    35580
          tgcagaaccc atggaatatg gatggctgac tataattata ccctttgtgc ttaataacaa    35640
          tttttgcaaa gatatgaaac tataaaaaag aataaaatgg aaattccaga attggaaata    35700
          tagcgactga aattaaaaat tttatggatt taaggatcat ttgataaagc tgaaaaaaga    35760
          aagtaaactg aagaatgtga gaaacaaaat tatccaggaa gagaaaaaaa cattaaaagc    35820
          aaaagagtaa agggcataga caatacaatg ggaaagtgcc atgcaatata attggagtcc    35880
          cagaagtaga ggagagagca aaagtgacaa aagcaatagg tgaggagata atggttaaga    35940
          attttccaaa acaaacaaaa gataatgcag aaacaaattc agaaagtcag gaacccactt    36000
          aagagaagta aaaataaagt caactaggca taacataata aaactattac aagccaaaga    36060
          ctgaggaaat atttcaataa gccagaagac agattgtatt cagaggggca acacttaaca    36120
          taaaatctga cttcaacaga ctattattct ctgtgaataa ggtcttacat attagccctt    36180
          cactcccaac tatttgtcta tttgtcttag gtgagctaaa tgtgtgctgg gacacatttg    36240
          agccaaatgt cccagcacac atttagctca cataagaaaa atggactcta gttgggagtg    36300
          aggggctaat aaacaccaga tcccaagaaa attccccata atggaaaata taggcagatt    36360
          tgactatata aaagttaaaa gtccaataaa ttgatcaatt attgctcaac atatatataa    36420
          aaaaaagcag caccaaatga acaaagagtt attagatacg aagtgccaag taaaaaacca    36480
          agcaaacaaa aagcccctca aacccataac aaataaacaa aaatttccac tagtgtgaat    36540
          gagcaaagga tacctgacag gggatgaatt ggcctcatcg ataatctgag agttacacat    36600
          tttaaaagac tatgcagctg ggcgcggtgg ctcacgcctg taatcccagc actttgggag    36660
          gccgaggtgg atggatcacg aggtcaggag attgagacca tcctggctaa catggtgaaa    36720
          ctctgtctct actaaaaatg caaaaaatta gccaggcatg atggcgggca cctgtagtcc    36780
          cagcttcttt ggaggctgag gcaggagaat ggtgtgaacc caggagacgg agcttgcagt    36840
          gagcagagat cgcgccactg cactccagcc tgggtgacag agcgagactc ggtctcaaaa    36900
          caaaacaaaa caaaaaaaac aaaacaaaaa agactatgca ttattattgc tgttgttact    36960
          atttttggtt taggtaaaga tgaaacagtt actctcatgg gtactaagta cagaaaaaaa    37020
          ttatgaaaag cagtttaaca tgatgcatta aaaaaaaaat gatatgtcct ttaacctggc    37080
          aaatcagctt ctaggattct gctatgcacg cacaaatgtg aatacacaga tgtgttctct    37140
          gatgtactgt tcactaatag aaaaaaggtt aattaaatta tggtacatct attctctgga    37200
          ttctcaaaaa caataaaaaa atgaggtaga ttcttcatgt atgcacccta aaaatgttca    37260
          taataaacaa ataaaaccaa taaacataat aaactaaaca aaaaagttgc aggtcactat    37320
          gtgtaatgtg ctagcattca cgtgaaacct aacaaaaagc tttatgtaat acatgtgtat    37380
          tacacacata ctgcaaagat aaatatttaa cagcatttaa tctctgagat agggcataaa    37440
          attgaggttc tgagaagagt tgaaggtggc agtctacttc ttttcttcta cattgtctga    37500
          atttttttct taactaagat tatatgttag ctttgcaatt aaaatgtctc acacatactt    37560
          ttatgagaga aagagaaata tcaagtgatt tgtcaataga aaaatagtaa actctacact    37620
          gttagttgat cttaagaaca gattattatc ataaaatatg atatgattaa ttataatttc    37680
          ctgcccttaa tagaggttac attttaaaga aggatgggaa gcaaaattgt tccatcaaaa    37740
          atagataaaa tgggttaggc acagcagctc atgcctataa tctcagcaat ttgggaggcc    37800
          aggggagaca actgcttgag cccaggagtt tgaggtcagc ctgggtaaca gtgatacttt    37860
          gtttctacag gaaaaaaaaa aaaaaaaaaa aaaaaagcca ggagtggtgg tgcatgcctg    37920
          taattcctag ctacttgtgg ggctgaagtg gaaggattgc tagagcccag gaggtggagg    37980
          ctgcagcaag ctttgattgc accactggac tccaggctgg gcaacagggt gagaccctgt    38040
          caccaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaaa agagttgtaa aatgaatttt    38100
          actgctagag ttatatagaa catcaatgca tacttgttct agatctttgg aagatactgg    38160
          ttaattgaaa tgactataaa gctaattttc ccattaattt tcataaaata gacaaaccta    38220
          ttaaaattaa ctgttctata gattgatata caaaggttct ctttagaaat aatgttacta    38280
          tttacttaaa acgaaagtta tacttacaac aaggaatagg ctgaactggt ccaagttgtg    38340
          gaaaggtcat aagaacagaa atccctggta gatcgttttg ctttggttgt tcggcagttt    38400
          ggtcagccca aactaccact tttttcctct ctaccaaatg ttcgatctct ttgaagtcag    38460
          attcaaaagc agcatttgac aggccggctt cttttaatgt gcaatattgt tttcttaggg    38520
          ttggaagtaa agcattcaat actctatata cagaagatga gaagaaagga gagataaata    38580
          tgacatttta aacacattat tttagttctt ttatgtaaca cccaaagcat tagcatatca    38640
          ttaaaataat ttcccatgta tgaactgagt tctagtctca gattgtcttc acttgcttcc    38700
          atatgacctt ggacaaggca aaaactgaag tttttcctct gtaatgtgag ggacagataa    38760
          atagccacta cttataatag gagattgctt tgagggctaa atgagttaag tatatttgtt    38820
          tatttatttt ttagagacag ggtctcactc tgtggcccag gctggagtgt agtggcatga    38880
          tcatctcatt gcagcctcga actcctggcc tcacttgatc ctcccacctt aggctcccaa    38940
          gttgctggga ccacagatgt gtgccactac actgactaat ttttttattt tttggtagag    39000
          atggggtctt gctatgttgt ccaggttggt ctcaaacact tagcctcaag agatcttctt    39060
          gcctccacct cccaaagtgc tgggattaca gggatgagcc actgtcccta gctaaatgaa    39120
          ttaaatgtac ataaaagctt tttgcaaaac ataatgtgat ttccaaacta cagatgttgt    39180
          tactgctact aattatcata aaattgaaat gaaaaattaa tatactatgt gaaatgatga    39240
          gacatatttt aggtatacaa cattaaaaca cacacacaca cacaaacaca taacaaaata    39300
          acaaaaccta cctctccttt aagttaaatg acctaaagaa atggcttttg gaatggcact    39360
          taaagggatt ttaaggagaa aagttgtgga taaggatggg gagtataaat aatcgttagg    39420
          gcactggatt cacggcttta actcaaaatc tcccttatta gcaacaatta cagcagcacc    39480
          gaatgtaatt ttttgtgtat cagacctctg tgtaagtgtt cattgaagaa atgtcacagc    39540
          taaacagtta taaatttata cactcaatca gtggttccca aattttctat aaagaaatat    39600
          gtctaacaac atgaatgatc ttgaaatgat tcagtcctgg aatcctgagt ccatcaatag    39660
          atgatgttcc agttgactca taacatcgag gagaagagaa ccattagaag tatggatagg    39720
          gtagtgggaa aagactaatc gggcattcac tttcatacac aaagaaatac caccttttaa    39780
          cctacaagtc ttaaatattt caatagcagc acaagaaatt gtgacctttt tccttttggt    39840
          gggggtggct ggagggtgct gcatttaagt caagtaggta acaagtacaa gaaaaagtta    39900
          ttaatcaaag tcatttaaac aattacttat ttagcatcta cactaatcag gtactgtgca    39960
          ggaaagttat catagtaggt ctgacactgc taagaaaggc ttggttataa ggttgatacc    40020
          tggctggtat tttaaaatat ggattttagg agggttccca gcatttccag aactcatatg    40080
          acaagagtgg ctcactgtgc ttaaactgtt tgcacaaaca atgtggttta tgctaaaaca    40140
          ccttctctcc ttttgaaaag tctggaattt tgatacatcc tggcagaaag tgcctatgca    40200
          accagctccc aataaaaacc tgggacatgg aactcaaaag agcttccaaa gcagagaaca    40260
          tttcacatgt gctgccacaa ctttttgctg gaggaattgt gcacattctg tgtgattcca    40320
          ctggaggaag actcttgaaa ctctgtgtca gggttcctgc agactttgcg ccctgtacct    40380
          tttccctttg ccgaatgtgc tttgtagcct cttgctgaaa taaagcacag ctaagaatac    40440
          aactatctga tgagtcctgt gagtcctcct aatgaatcac tgaacctgaa agtagtccta    40500
          ggcacctata acacaggaat tatatcatgt tatttatttt tatgtttaat cttttcaaaa    40560
          actttatatg aaatgtatta taatctattc ataaccttta tatgaactgt attataatct    40620
          atttttatat aagaaaacta tagcttagca aagctaaata atcagcgtaa ggttatattg    40680
          ctcatataag ctagaattca agattgattc caaaactcat cctctttctt ctatgctaca    40740
          tttcctctgt gatcctctgg ttcaccagtt ttctaaattg ttgagttagt ctttttcccc    40800
          ccattttaag gtaaatgttt atcttaagat agtatattca tctggggtct gatatagcaa    40860
          atgtaatatg gttaaaagaa attattgttt cttgatgact tcagctcttg taagtggttt    40920
          gagtgttagt aaatgaatat tcaatatctg ctctaggaat agacacagaa agtataaaga    40980
          gattagtctg aacttccatc cacataagag taactccctg aagtttttca tttttctttt    41040
          ttaaaaaaag ctatactaat atgatttcct ctaaatcaag ataattatca gttatttgag    41100
          cataccagta gaacatgaat agattcttag agtagcagaa agcacttaga gaaataaata    41160
          tcccatttgc atggaacatc aaagtgatgc ctaaggagtt gactgacgta tccaatgtga    41220
          caaaaaaaag attaagccat actttttatt attatgtttt aaaaactaaa tgactaatgt    41280
          tactactgag ctagaagaga gaacataaaa ggtctgttat agcatcacat aaaaatcagg    41340
          acacctgata tttagcaact tcactgtaat gacagcaaaa aattctggaa ttatgaataa    41400
          ttaacaattg cctacttaaa aattcaagtg atgttaacag caattgcttc taagtggaga    41460
          aatggatggc tagaagatag aggtagaagg cagatttctt ttcaatgtgt gtaggtactt    41520
          atgaaatttt gtattacata gcatatatta agtaaaagta acatactttt aaagaaaaac    41580
          actttcaaat ttataaacca atgtaaaaac tttgttggaa ggaaataact ctcttaatgt    41640
          tttctggttc agacagacac ttaaaaataa tgtatcctgt aacacataaa actcaacttt    41700
          ctggcagtgg aaaattgaac ttctgtgctt cagatatagt gttaaaattg gaaaataggt    41760
          aaatgtatgt actcacgctt cagtctgcct gtgttgctgt tcctgaagac aagctagatc    41820
          catcatatgt ctaatttgtg ctttcaaatc tttgttctgg aggtgcaaat ggtgacaatg    41880
          aagatctttc ttgagttcct agggcaaaca atacaaaatg tacttcagat cactctaaga    41940
          atattgaaat taaatcagtt taataatttt atattgttgc caatagtttt aattcttttt    42000
          agatattaaa taatatgttt agaaacaatt tgaaaaataa gagttctgga aaaggtggtc    42060
          tataatttac aagcaagata agttttcatg tttcctcaga aactgaatgt taggaattca    42120
          gaagaaattt tactatgatg acagcttctt ggtctatcca acttgttcac aatgttgtaa    42180
          aaatacataa atatgaccag tttttgctta aatgtcactt cctcagaaag gctttccttg    42240
          agcattgtat ttggatagac actctccacc cctcaatatt gtcatagcat ttactctatt    42300
          gatgagtaac aatttcattg atgtattcat ttatttataa tttctctgtt cacaccagaa    42360
          catatagttt accaccagga caggcaccga gtcaggttag ttcagtgtta aagccccagt    42420
          gtacaaagtc ttgagttgtg tgcaataaaa atttctgttt ttgcatgaaa caaaagatca    42480
          tatggttgat atcacctttg gttggatgac atggttagag cactggccta tgagtcatgt    42540
          gattttagag atgggcttat aaggccttga aacaaatgct accttaagtt gaatatacag    42600
          cctttatgga gatcagttta ctggactaaa atttaagagc tggatcagat gatctcttca    42660
          gtcctttcca gttagaaaat taaatgatcc taatagtgtg aacatgtttg ccaaatatta    42720
          cgtctgttct cctttaaaag aaaaatatcc tttatataca tcctctcata atctccttta    42780
          tcttcttgaa tctttcttct tttaaagaga caagacttga gacccactct tgatattagc    42840
          tccatcctag gcaaaagtgt gaaaatgttt ttttgcaggc tccattttcc taagcctcat    42900
          ctgtctaggg ccaggtgtcc tgtaatctac cacctaaagt tacttgtctt tccttaaacc    42960
          tactaaacct tatctacaga atatatcagc gaagggatta caccaaagta taaatggtga    43020
          taatctagta acattctcag aaattttatt ggaaaaattt caaacaatac aatgaaaaaa    43080
          atttaaattc tttggacatt ttgaatggct aagacaggaa ccccatatgc aggggagcta    43140
          tgcctggaaa ctggaaactt cctcctaggg acaattctca taatccatct tagctttagc    43200
          gagtggaaac aatgcaaagt attcttcaga ttcttttaaa gaatattaag attaaatcaa    43260
          ttttaataaa ataattttaa taaatcaaat ttaataaaac tcctttccaa tctgcagttg    43320
          accaataatt ttctaaaatg tcaaagttat ttttctcctt tttagaaagt acttccaatg    43380
          ccagttattg agactatgac agagaacaat gtcactcatc ctatttatat attaaagtta    43440
          ggagttattt atatatatta aagttaggat atattaaatt taggagttat ttatataatt    43500
          cattatactt caagaaatat agtatattta tatattaaag ttaggagtta tttatataat    43560
          tcattatact tcaagaaata tagcaaatgt tttagaaaaa aatttatctt tatggaggca    43620
          ggacgatacg gctagagtca tgtgatttta gagacgggct tagccttgaa acaaatgtca    43680
          ccttaagcca aatatatgcc ctttatggag atcagtttac ttgactaaaa tttaagagct    43740
          ggatcagatg atctcttcag ttctttctat tactagttag aaaattggat gatcataata    43800
          gtgtgaacat gtttgccaca tattgcatct tttttccttt aaaaaaatct ctccttatag    43860
          cattaggaga aatacctaat gtaaatgatg aattgatggg tgcagcaaac caatatggta    43920
          catgtatacc tatgtaacaa acctacatgt tgtgctcatg taccctaaaa cttaaagtat    43980
          aaagaaaaaa caatccctcc tttatataca tcctctgata atcttattcc tttatcttct    44040
          tgagtcattc ttttaaagag acaagacttg attgtataat tgtattagta ataatgggtc    44100
          tttggctagc ctgttaactt tggaaaatca agtttacaat ttaagtcttt cttgacatac    44160
          taatgactaa atctgattgg aagaacatgg cttattttga gaactataag taggccagta    44220
          atggctaaag tatagagtat aatgaaaggt gatatacaag ccttgagaag tattcaggtg    44280
          ccagaccatg ctaggcttgg taaatcacaa tggagaattt attctaggga gaaggcagtg    44340
          aagaacaaca agatcagttt tgcgttttaa aaacttgctt tggttgcagt ggagagaatg    44400
          aattgcagta gaacatgaac gaaagcagaa ggaccaaacg tagcagtcca ataatggggc    44460
          ataggagtct gcattaggat agcagcagag gggcataaag agaagtggat agattcagaa    44520
          tattgaagag taaataatgc aggagagtac agagaaaaca gcaccaattt gaaagtcaga    44580
          agttctgggt atctgtccag agttgtgtga ccttggataa gtccctttat cgtaaagtta    44640
          tgtctcaatt tgcttatgta aaaaataatg gcttataact agataatttt ctcagctatt    44700
          ttttcagcta taaatatctg cacaaaaaag aattgagggt tagatttggg tgatggcaat    44760
          gaaaatggtt ttaattttat ttgctcaagt tatttgtgat aaaatgcata aaaatcaaag    44820
          atacaaaaat caattccagg ttcacattca ggtgtacaaa agttcttcgt aagagaaatc    44880
          tagaagacag attgctagaa aaattagatt tgaccatatt gaaaaagttt taatttatta    44940
          aaaatccaga caatattgat taacttcata aacactacta agtagacaaa aaagcaaaca    45000
          caaaatagcg ataataatga tatcagaaac aataccatac catttttaaa attggaagct    45060
          tacggtaatg tgggatagaa aaggcaaact agtaaatttc tacaatcgac ttttttgcct    45120
          gcttaatact tcataagttc ttagtacttc tgtagttgga atgctgatta catggacaaa    45180
          catataatac aagcataatg taaattaagt taggatcttg agaggtgaaa atactctagc    45240
          aatatcattt aaaacttata tacacaaaca tatttaaaat ttttaatgaa tatacttaat    45300
          gccactgaac tgtatatgta cacatggtta agatggtaaa ttttatttta tattttacta    45360
          cacacaaaaa attgtttcaa gactcttctt gagaaaattt ttgccaacta taaggggtaa    45420
          ataatctatg agaatatcac agccataagt aaacaaacaa attaaggaag cttcagtagt    45480
          taattttaaa tgaggtcaaa gtttaatact aaccaaaaga cttagtttta tgtagtttag    45540
          aaaatgataa tcttgagaat atgactgctt tagatataca gtctccaaat aaactattaa    45600
          ataataagtg aaataaactg aaaagtactg tcaacattcc acacctgcta ccaatccaag    45660
          agaatcaact cttgtgtatt aaatgagaaa cactcatttg gccagggtta tccagctgtt    45720
          ttctttgaag tgattttatc aacaacataa ccatatttca gtattcctac aggcactgtg    45780
          atagagcctg ttgcattcta tgatgagcct ctatggcttt atatggaatt tcagaagtta    45840
          tatcctctga tcctagctaa cttatattat agtttattaa tgaatcttgt ctttttttgc    45900
          ttactccttt tgagtcatta tatcatctta agatggacac aacgtttaaa aaaaacgtgc    45960
          tatagtttcc ttctgaagta gatattctta atcttgtgtc aatggaaggg ctttaggaaa    46020
          cccaatgact taggaaatat gcaaaattgt ataaatttga cctccccaat ctcccagctg    46080
          gaagaaaatc tacacagctt tgaacagatt ctcaaaggca tctatgaccc ccaaaaaggt    46140
          cagaatcatt gttctggaag agaaattata ttatattata ttatattata ttatattata    46200
          ttatattata ttatatgatg cagttaactc tgttgttaac tatgtacact tttctttgta    46260
          caacttgctt ggatattgat gtctatgcta ttgttgctta gaatagtatt aaactattat    46320
          ttatcatcca ttattatttg ttaagtgttg ctaggttttg aatgtagcac tccacttaag    46380
          ctcataatat cttaaataca tttacagatg acaaattaag acatcaatgt taaacacact    46440
          gtccaaagtc atataattat tgttagagtt gttattcaaa acaactacta tatgccagaa    46500
          ttaccaaaca ctccaactcc aaagtctatc cttttcccaa tgtttacatt atttttgtgg    46560
          ggaatatttt aaagtgcctt acaaactaag ttatattatt gcaaaatatt actagaatgt    46620
          gctgtattct atgtttaatg tcctaatcta cttaactaac tgactggtat gcttttatca    46680
          agatattttg aggtgcagat taaattgttg gctcaataaa tatccacaat aaggaaatac    46740
          tgtctttggt ttccttctta ggaaacagga tatctgctgc ttgctccttt cactactttg    46800
          aactgtcatc attaactact actgctagtc ttttctctcc agtcatgtct gagcttccat    46860
          attaacagaa taatcattta cagccattgc tagcccatca gagaatccat tccccagtca    46920
          taatgcattg actagtatct ttgaattata aaaaaattag tacttttgaa catttaaaga    46980
          tctctggcat ttgttggtaa atatttcata ttttccttca cctgtatttt ctgtctggtg    47040
          cctttctagg aattcaaaga ttttagaagt ttccatatca attagctgat acagagttat    47100
          agaatttcag aagagcatca ccaaagtaga gactgtagat attttttctt ttagaaaaag    47160
          actgaaaaga agttgttctt ttaaactatt aagtatttgg gtgaaaatta gttatttcat    47220
          agcagttgct cctagttgct tagcccacat ttactttctt cttctttctt attaagagat    47280
          ctccaatccc attactgggt atatactcaa aggattataa attattctac tataaagaca    47340
          catgcacaca tatgtttatt gcagtgctat ttacaatagc aaagacttga aaccaaccca    47400
          aatgcccatc aatgataggc tggataaaga aaaggtatat tgcacatata taccatgcaa    47460
          tactatgcag ccataaaaaa gaatgagttc acgtcctttg cagggacatg gatgaagctg    47520
          gaagccatca ttctcagcaa actaacacag gaacagaaaa ctaaacactg cacgttctca    47580
          ctcacaagtg ggagttgaac aatgagaaca catggacaca gggaggggaa catcacatgc    47640
          cagaggctgt caggggtagg gggcaagggg agggagagca ttaggacaaa tacctaatgc    47700
          atgccgggct taaaacatag atgacgagtt gataggtgca gcaaaccacc acagcacatc    47760
          tatacctatg taacaaacct gcacattctg catatgtatc ccagaactta aagttaaaaa    47820
          aaaaaaaaag ggagctccaa tactgttcag agtaattatg caaaaaaaaa aaaagacaat    47880
          cttttcagag tgtcttctat ctacagatag ccatgtgaca tatttctagc caatacatta    47940
          gtctgttagg aatttttgga aacatctttg ctctcctgat atagacatcc ctcctccttt    48000
          ctttcctctt cttctggctt aggtgtgtaa acttgagact agatatgaaa cagtaatatt    48060
          acaatcatga aacgacaagc acgataatga cattttaaag gtactgcatt agaaatgaac    48120
          tgcatacttc caagacttat tgttaagaga acaaaagaca gcccacacta gttaaggcac    48180
          taaagttaga ctactgcaac cttgtagcag aacataattc taatatgata ctgtcattac    48240
          ccatcactac acttcaaaaa taaaaccttt tgccattcta aggtggaata tcttcagtta    48300
          cacacacaca ccccctttca aatcaacttt ctttaaccat aacacattta atgttgacct    48360
          catttaaact atttttgcat aaaatatcaa gatttcaaac aaattaccta cataatgaat    48420
          cctcaagtgc aggttgaaat agaattgttt attttaacct aaaagctacc ttataaaagg    48480
          atgcaatcac ttagaaataa catttaaaag taaattaaat ctcagagtta tgaggcaata    48540
          atagttgtct tatgaaagac atttactcaa taagaaaaag aacacatttt aggagctcag    48600
          ttcctacaaa ttaaatctga acatacagag atatttgtac ctttggaata tgaccgtttt    48660
          gacttaagag tcccatttct ttttcgacac gatggagcca attagtattc tcatcaaatt    48720
          gcttcaattc ctcctccctc cttttctcca ggtaggagcg acgagttttc aacattgcaa    48780
          gtctatgatc tcgttttcca gtggcctgaa acacgattca tttaacagta aatctaattt    48840
          ttatgatatt tgatgtacat gatattagta aactagtata ttttcttatg tgtactattg    48900
          tagtaaatta agttaggcta catttttgta tttaaagcta tttccccctt gaaatctcag    48960
          aatactactg cttgcaagaa aataggaaat tgagctgtga gtcattttta taaaattaca    49020
          ggttgagagt ttatggcttt aagaaataca acgaccaaat caaagactat aacttttttt    49080
          ttttttggcg ttaaagtaca gtcccttcag tatgtttcat ttgaaaagtt catacaaggt    49140
          cagatacatt ccatgatctc cttactcaaa atcaaagcag atgcatatat tgctcttgtc    49200
          tttgatgtga agaaataatg tgttctattg ttctgtgttt gcctataagg cctcaaattg    49260
          gctgatataa atcacagaaa aaagagctta tatcagagtg cttatcagta tctgatcttg    49320
          cctgtagctt ggttcaggag ccataatgag tattcaaaat atttttggtg ttttacctag    49380
          gcacaaattg aaattaaaat tagtctttga tttcttaccc taagggtctt gcacactatc    49440
          atgaaaacaa tgggccagaa catcttgacg tctctggggt atttgcccac agacactaaa    49500
          gtcaataatt atcagatagg atgggtagac ctgaaacagt ggatccccaa aggttaaaat    49560
          aagcatttgc agctggttct ggaagcagga aatcaaaaaa aagaagagca gaaactagat    49620
          ttgaatttgg tcgaagaact ccccctcttt gggagataaa tatctcttaa ttttgacaaa    49680
          agatgtacta ttgagacttg ggcatataat agaaaaatat ggttatcttc atctggatag    49740
          aggatatgag cttataaatg atttaaggtc aggcaaaggt ggctatcatg aagtcataac    49800
          caaatcttag atattcataa aattttactt accttcccct caagggaaat acaagagtca    49860
          gagagaagca gattccattt caggctagag tcatagataa gggaaaaata gttgatagcc    49920
          accgtcattc tcactaaggt tcctgactct tttttatggc ttctctggtt aattataata    49980
          tcctagtctc tgtctgtcac agtaagacag taacaaaaac aaaacaaatg tctcaaagaa    50040
          acaaaaacct ggatagtcaa gaagagaaaa caaaacaaaa tgtaacccat caaactgacc    50100
          acagcgctag gatgagaatt gtgacagaat gctacaatgc aggctgggat ggtggctcat    50160
          gccagtaatt ctagcacttt gggaggctga ggcaggagga ctgcttgagg ccagaagtgc    50220
          aagaccatcc tggacaacat agagagaccg tgtctccaca caaaaattaa aaaataaatt    50280
          taggctggtt tcgtggcatg tgcctgtagt tccagctact tggtggggtg gaggggctga    50340
          tgtgggagca tcacttgagt ccgggaggtt gaggctgcag tgcagtgagc catgactgca    50400
          tgattgtgcc actgcactct agcctaggca acaaagtgag accctgacag caaaaactaa    50460
          aaaaagaatg ctatcatgca aaggttaccc aagcatggta cagggacccc taaggattcc    50520
          tgagatcctt tcagagagtt cacaaggtta aaactatcaa aaccattttt ataatatcag    50580
          gaaaatgtta ttagtctttt aaaattcttg tttgctcata cagttagttg cacagtagtt    50640
          ttctagaggc taaatgatgt gtaacatcac aacagaataa caattcagca gttatgagaa    50700
          tagagctgat atgaaaagcc aggcattaaa gaaatttgca aacatgtaaa acaacgccac    50760
          tcttctattt tcactatttt tgagaaaata aaattattta tgtaaccaca cataattttt    50820
          attttaatta ttatttaaca tttaattatt tataatttat tgctatttat tatattttat    50880
          taatataatt tttattattt acaattaagc tattatttaa tattatttat tttaaaatga    50940
          atcaatgcat aaatatattt ttataaatct gttttaattt ctaatataga aatattggta    51000
          gagggaatac atataaacaa aagctctttg aagtcctaaa taatttttaa aagcagaaag    51060
          gggtcctgaa acttgaagtt tagagccact gctataacag aaggtgggag gtgtgaccta    51120
          ttgacttttc tctgctattc agcagatgta aaaatttagg caaacagatt ttagtgggtc    51180
          ttcagttact tcgtctgaaa aatgaagatg aaaatattgt acctaactga aggcaggcag    51240
          ctaattaaat catctttatt ttgctttagc atttacagtc gtagggactc ttagaaacca    51300
          gggcatgtgg gtctggtggc agcaatattt aatatcagaa aatcctaaat gaaacctcaa    51360
          aaagtccatt tatgactttt tacttctaat gtccatcaaa tgtatcctct gtgatggttc    51420
          tcagaggaca ttttccatca gaatactacc accacccatt gctctaaaat ggcaagtaag    51480
          tgtttgggaa tacattctaa aatatgcatg ttaaaccctg acattagagt gaaatgtttc    51540
          ccattaagtt ttaaaaaagc tttacatatt tcattaacaa aatcccctgc acaccacaaa    51600
          agtcttgcga gagaacaaac ataattctac aattttagtt gttactactg ctttgtgtaa    51660
          aataattgct aatatggtaa attcatattt ttacattaaa aacaatctta cagattattt    51720
          ttatggggtc atgaaattac ccaggagctt ccctttaata gtaatttcaa aatccatact    51780
          ccagaactat ttatagctga atcgatgtta tgagattctt tcagcacttc tgataacaaa    51840
          cctctattgg agagaatcca aaacataaaa ttccttgcct tagaaaagca gtttactcat    51900
          actacagttt gacacttctg tgtaaaaaca aaacgaatca acctctagat gtcttcctat    51960
          gtttttcagt gggttaacta cacccaataa ctcaagagtt tttatctcca ctgcttacct    52020
          agtctcataa gaatagctat gataattggg aacctgagga ttgaaatgac caaaagtaag    52080
          agatcagaaa aggcaattgg gttgaaaaaa gtctaagcta ctgtgcagaa aaataaggat    52140
          gaaaacagaa aaaaaaaaaa caaaaccata aaaccagtca aacccattct attactctat    52200
          gtcttaatct ttctagataa ccacattcaa aattcaatgg aggaattaag acagtaaaat    52260
          aacaattatc taaattactt tgggattaca tagtccaagc tcattaatta tactaaataa    52320
          taatattcaa gtgtttaaaa aatggaactc aaagttttga taatgctact cccttgcttg    52380
          aaagactgca ttttggctac aaaaatagat tttagactcc tagcaaccaa caatttcaca    52440
          atctatacca atatcctacc ttcccaatct attgttaata attcctaaca tggcaaatat    52500
          gtttaacatc atgtgccaac tccagtccat tcattgtggt tctggctact ttcaaattct    52560
          gagagaaggt atggccacag atcagtgaaa tttgctgtgg gtaagggagt gggaattggc    52620
          acgaagtttt gagtatagtt atgcatttct acacgtattg tccaacaaat gtgacctgct    52680
          ctggtcaaac tcagcagagc aagtcacatt tgttggacaa tatgtataga aatgcaaggc    52740
          ccagtacaaa tctcatcttt ccaccaggaa gccttcttac taaaaatagg aagtcactgc    52800
          ttacttttct gaatagctat agcattcacg gtacttagaa tatagcagag tgattaagag    52860
          tgcaggctct gaagccagac agctggggtt taatattggt tcagccacat taattaggta    52920
          agtaactcca gacaacctac ttgagttctc agtgcctctg ttcctcacaa atggtgataa    52980
          tattagatct atctcatagg cttgttataa atactaaatt aattaatcca tgcaaaaaac    53040
          tttgaaaaat gtctggcaaa tagcgttcaa tatcagctgt ttttattatt actatttata    53100
          tgacaagcat atagtgcctt atcattttta ttatttttat tgctccaact agtatgtaaa    53160
          taattgaagg acaaacactt ctctttcttt acctccattg tgtcaagcac aagggtttta    53220
          catgtaaaca agtgttcaat aagagtttcg ttaaagttga gatgttaagt caatatcagc    53280
          ttcctatggc tgcatttctt gccttttgtc aaaaagtaaa tcttagataa ctgcacattc    53340
          aaataattga cacttatata atctacacaa aactgagaag aattattacc cactgaagat    53400
          tactatgtaa tataagtgct aataattgaa ataaaccagg catggtggtg gacacctgta    53460
          gtctcagcta cttgggagtc tgagctactt gggaggtttg tgtgagttgt ggagtgagac    53520
          cttatctcca aaaataaaat aaaataaaca taaaaaataa agaaaagaag aaaaacatct    53580
          taaaaatttg aaataaaata tataattctt atataatatg gtactattcc agaattctgt    53640
          tcagcaacca tatgaaagaa gttcacaaca acaaattgat aaattaatcc aatgagatag    53700
          ttatttggaa gtcattacat ttatcaaaga atattggcaa caatttgaag ttcatgaaag    53760
          tgaaagtaca aatatagcag caagatataa attcgaagaa ataaattgtt tcctttctgc    53820
          cttaaaagaa tgcaaggaac atcttaaatg catctcaaaa cacaaaattg aaaagaaaat    53880
          ttcattaagg cataaaaagc acacactcaa taaatatatt actaattttg ataatatagt    53940
          ttaatagcta ctgacaaact ggtatcaatg atacattact gaatgcttta tgattaattt    54000
          ccggtacagc gtatctttcc catttcatag gctaacaaaa atctaaaatg ttagctttga    54060
          aaagcactct ttaaaatctg acagcttctg gacattaaga aatgcaaaat ttttctatat    54120
          aattattact tctgtgaaag taggaaaaga agaaaacatg tttggggtgg tagtttgaga    54180
          ggaatgggtt gttacttata agataaagct ttttaataag tagtatttga acatcatatg    54240
          tctatgtaat taaattacat aaaatacata aaaatacaaa taaactcatc accaatgaat    54300
          atcgaaactg gggagaattg tcagtatttt caaaatattt atttttctga tctttggtgc    54360
          tccgtagttt cacacgttta ggtatatatt tatcttatac tgcttagaac tcatgcttct    54420
          tgaatttaca tcttattagt cctagataat tctcaaccac aaatttttgc atattgctct    54480
          ttttcactaa atatctcctt ctgaaatgcc tattagatgc atgtatgact tttcttcttg    54540
          ttacatgaag tctatccttt atacaacatc ttgtccacat gtgttatctt tatcctgcat    54600
          ttggtgtaat tttctcaaat ctgtctccca gctcatgtaa aaaagcataa acataagagc    54660
          acaggctcta gatctggcat gctgcagatc aaatcagaac tcagcaccta ggagctgtgt    54720
          caccttggac aaaatgactt gtattttggt ttcctcattg attattagga taatattact    54780
          aaatatttca tggggttttc tgagaattaa aaagagtcaa tatatgtaaa gtgctttaac    54840
          attttctgat attgtatcaa taaggtgagt ttttaatttt aatgaataaa tttttaattt    54900
          ctggaagttt catgtgtttt ttacctcata tttgaaagtt ctttttttgt ggtgtcttta    54960
          tctttgattc ctttatcttt gttcattctt atattttcta ttagattgct ctagtatcta    55020
          aagatttggg agttctgtca tatttgctaa gagtactgaa tcttgtctag agtgaattat    55080
          ttctccatct gttttgtaat tttgaaagtt gaatttatta gtggctagag ttgagaatct    55140
          gtttctctta agaggctgat ttttgcattg cttctgccag gttttctagt ggtatcattg    55200
          gtttgataat gtgcattgta attgaccaac tttaggggtt ttctatacaa aatacatggg    55260
          ttgtaacaat ttaaacctca atcattgtga aaagcaagcc tataatggta gtgttcaaat    55320
          gacttttttt tcttacccca ggcatggtta cttggggtaa gaaaagcaac catccttgcc    55380
          aacagtgatg gttggcaaga attttttttt tcctggtata cccctagtat aaaggatata    55440
          ggccactgaa atttcaggct ttagatagga gctctcattt ctaactcacc gtctcctttg    55500
          ggtctcttat ctaagtagtg atgtaatcaa agttagaaga gtgggagtgg tctgtgtttg    55560
          gaagggagag ggcagtatat tattgtatta aaaaaaatag taaaactgat taaatgtttg    55620
          gtctgctttt cattaggccc ctgccctggc acatctaaca atttcagtga taaaattctt    55680
          ctctgacaac aaaaatctcc tgttggtcta agttgtaagc tactgcctgc atccaggata    55740
          gactgcttct attgctctac ctttagtaac tggctaacct gagtgggtaa acttcgtgtt    55800
          aaaagttcca taaaatgccc agaaaaacaa cagttgtaac tgagattctg ttgtttttgt    55860
          ttatttcctt tttgttactg acatccagga attaaaattt ctttcttgtg cacttaacta    55920
          tgtattttaa aaaatgtttg ctacattttc tccaacattt ccagatgtct gtaaagaatg    55980
          ggtgagtaag tagccttgac tataaaattt ccagagttag aaccaccgcc accaggccgg    56040
          gcacagtggc tcagcctgta atcccagcac tttgggaggc tgaggcggat ggatcacctg    56100
          aagtcaggag ttcaagacta gcatggccaa cattgtgaaa catcatctct actaaaaata    56160
          caaaaattag ctgggcgtag tggtgcacgc ttgtaatacc agctagctgg gaggctgagg    56220
          caggagaatt gcttgaatcc ggaaggcaga ggttgcagtg agctgaggtt gtgccactgc    56280
          actccagctt gggcaacaga agaagagact ccttctgaaa aaaaaaaaaa aaaaaaagcc    56340
          cccatgtttt tatactttct aaaatttaat tataaaattg ttaattacct tttctacttt    56400
          gtcttcagaa cacatcattt ctatttgttt atggcactgt tgttggtaga atgatttaag    56460
          ttcattttct ttaagtaaca tttccaactt cagatattct tgtctaattt cttctcgatt    56520
          ctggaacaag cagttcagga tttcttgaaa cctaccaaaa ttaaaacaca ttacagaatc    56580
          tcactaattt tgtagcaaat catacaaagt ttacttaaga gaaatgcata aacaaaggaa    56640
          tatatgtaat tcacagaact acactcaatg ataaacagca aataggtaaa aatgactatt    56700
          tcctattata aaaaatgttt agaaaaagtt attaacttta cttatactac attaggtttc    56760
          tttctcaccc aaggaagatc atgttgctga aagatatggg catcataagg tgtctggtat    56820
          tgctaacata ctgcattttg tctatgctta catctatatg taatcctatt gcttagcaaa    56880
          aataaaataa tttttgtttg ttggaaaagg atgataacct gggcatgcac tatccaaatt    56940
          cacaaggccc tattagcaac acagcattat gtgttgttac ggtgttggct caccgtgaag    57000
          gaataagcag taggaggcat aatcatatgg tgcctccatg gccccctagg gaaagtgaca    57060
          gagccagttt ttagcttcag aatttgttat agtgaaaaca gaccatacgg ttaggtaccc    57120
          cctacagcct ggctaagaat caactgacac ttccaggact taaaacatcc aagtttataa    57180
          tgtggtaaac ctagaaaagc tgctgcagtg tgcttcctcc taagggcaat gtaggtctag    57240
          aatatcaaag atgaggagtt tgattcatat ttccaaatgg ccacagactt caagctgatt    57300
          aaattttatg aaaactctgg atggaacctg caatcctgta tccttctggg tcagtagaac    57360
          actggtcaca gtaatatttt aattttttaa aatatattca tggttttaag tcatagatca    57420
          gctctgagct acagtaacag tataaacatt cataacagtg aagactttaa aataaagtaa    57480
          aatcaagtac atgcatttaa aaaaaatgtt ctaaactggc cagaatttta gatatactca    57540
          taaggatcag cggtaaaaac actgccaatt tacgtcagta gctcttaatg aaactctatt    57600
          gggaatgaat ataagccaca aaacactgac tttactgcag ttttgtcaaa ctgataaata    57660
          tttcatagga aatatgtaca gacactgtga tttcattgca ttatattaca ccaacggtaa    57720
          tgccagtaaa tgaattgata agttatcttt aggttatact taaagagata atttcttagt    57780
          ttttctataa ctttttattc aaggacaaag ttaatatttg tcaattttgt gatctagact    57840
          tattttaggt ggtggtgttc actgattagg atgaaaggaa gggaattggt atcaaaggtt    57900
          tctagagagc tccttaacaa caccaaaaaa agctatcgtt ttaaaactga aagagttcta    57960
          agcaaacatt caagttaaaa gtatctgcac caatattttt aggtaataca tgagtattaa    58020
          actccacaat tttcttggta tagtcataag tgaagtttta taattactct ttataaaaga    58080
          acaattgtgt tttcttttta tgatttcctt ttgagaatta cctttccaaa tagctctgat    58140
          agacagaaaa tactgcagat tcttcctttt atctgtttaa acttcataaa aatgttattt    58200
          aagttttata acaaaagaca ctttgaaaat tcatggcatt aaaaaagtcc catgtaacag    58260
          tatgatggat aaaataaaag atatttcata catttatttc aaaaggcagt aatttttagg    58320
          ggaaataaca aaagttattt ggtacataat ttttatcatt aacttcttca taaatacaag    58380
          taagttactt aacatattgc cagaattaaa atcaaagctt ttattgttgg tcaaaagtca    58440
          ggttgaaata tgaaaaacat ccaaataaat acttatttca tagctcaggc ccttccctcc    58500
          tgagaggagg gccttaccag aaagaaaggt tcaattattt aaagccatca actccagaaa    58560
          agtttactaa tctgtaaggt tttaattggt atagtagact tggttaagca gtgctgagca    58620
          attttatgga atcagttact ctaaatttga gaagctggag aattctaata gatatccaat    58680
          tacatgagga ccgctcccac atttaactaa caaaatgaaa taacaacaac taataatact    58740
          atatcagagt taaaagtttt ctttgatgag atgaaaaacc agaaatcatt tttacttatt    58800
          tcttaagaaa tactgtaaaa tattttatgt aaaacttcaa cacacaaatg caattttaaa    58860
          aaattatagc tgaatcaggt ctgaaagcca cttttgacta taatcttgtt ttccttatag    58920
          atactgagac actttctact aattctagag ctccaaaaca gtatgaataa ccattggttt    58980
          aagttgtagt tggtttctca tactaataac agataactgg ctctgcagaa tgtcaaataa    59040
          gtttaccttt actcaatttt aatgaaagtt gaacagattc ctttactaca ggttttccct    59100
          ttaataagct gatgtacttt ggaagtttcc tagattcctt atggagtaat ttccaaactt    59160
          gtttatacag gaattcctta ttgtcctcct agaagtactc aagattaaca tcttgatcca    59220
          gtgtctcaat gggtcaattt ggaaaactgt cttagctgct tgaggaaaaa gtacttttgc    59280
          atactgtatt actaactgct ttctttttaa aaatttacct gctaagaagc ttagtagaaa    59340
          cctctcaaaa ttctgtattg gtttatatca ctgacagatg ttcattcaaa taattaccca    59400
          ttcaggctca ataagtagat tagttaagct atagagagtt aataaaatga agaatagagt    59460
          agatttacat gaaatataca aataatgatt atgtcagaaa agaacaatat gagcgccact    59520
          aaaattaaac taagtctaca gggtgacata actggctttg tctccactat cttataccta    59580
          agttctggtt ctcttcaata tatgtaaaat aaaaactaaa attacttgat ctacaaagtg    59640
          tgaaatataa agagaaatca ctgacttctt gaattcagtt gagaatatat atacaggcat    59700
          accttgtttt attgtgcttt gcagacactg tttttttttt ttttttttaa acaaactgaa    59760
          ggtttgtggc aatcttgctg tgagcaagtc tataagcatc atttttccta cagcatgagc    59820
          attcagtgtc acattttggc aattcttgaa atattgtaaa ctttttcatt attacatatc    59880
          tgtcatggtg atttgtgacc aatgatcttt gatgttacca ttgtaattgc tttagagtgt    59940
          cacaaattgt gcccatataa gacagtaaac ttaatcaagt gttgtgtgtg ctctgacggc    60000
          tccactgact ggctgtttcc ctacctctcc tcagccctcc ctattccttg aaacacgttg    60060
          aaatcgggca aattaataac cctaaaatgg cctccaagtg ttcaagtgaa agagttagtt    60120
          gcatgtctat cattttaaat caaaagctgg aaattactaa gcttctaagg aaggcttgta    60180
          gaaagccaag ataggcgaaa agctaggtct cttgcacaaa acatttagcc aagttgtgaa    60240
          tgcaaaggaa aaattcttga aggaaattaa aagtgctact ccagtgaaca cacacactaa    60300
          gaaagtgaaa cagccttatt gctgatatgg aaaaagtttc aatggtctgg atagattaaa    60360
          ctagctatca catttcttta agtcaaagcc ttatccagag caagccttct aaatctgttc    60420
          aattctacaa aggctgagag aggtgaggaa gttgcagagg aaaattctga aactagcagg    60480
          tgttggttca taaagtttaa aagtgtaaga aaaaaagcct tctctagaac ataaaagtct    60540
          aggtgaagca gcaagtgctg atgtagaagc tgcagcaagt tatcgagaaa atttaggtaa    60600
          gatcactgat gaaggtggct acactaaaca acagattttc aagatagaca aatcagcttt    60660
          taattggaac aatatgccat ctaggacctt catatctaga gagaagtaaa tacctacttt    60720
          caaagcttta aagaacaggc tgactctctt gtcaggggct tttgcagctg gtgactttaa    60780
          gttgaagtcg atgttcattt accatttaca aacatcctag ggcccttatg aaatatgcta    60840
          aatttaactc tgcttgtgct ctacaaatag aacaacaaag tctagaggac agcacatccg    60900
          tttacttaat aattttaagc ccactgttaa gacctattgc tcagaaaaaa agattccttt    60960
          caaaatacta atgctcactg acaatacacc tggtcactca ggagttctca tggagatgga    61020
          cgagaagatt aatgttgttt tcatgtctgc taactcaaca cccagtctgc agctcatgga    61080
          tcatgcaatt ttgacttttg tgtcttctta tttaggaaat acattttgta gggctatagc    61140
          tgctatagat actttctttc atggatcatg cttctctgac ggatctaggc aaaataaatt    61200
          gaaaagcatc tgaaaagaat ttgccattgt agatgccatt aagaacattt gtgatatgtg    61260
          taaggaggtc aaaatatcaa cattaatagg aatttggagg aagtagattc caatcctcat    61320
          ggataactat gaggggttca agatttcagt gaagaaacta actgcagatg tggtggacat    61380
          gaaagagaac tagaattaga agtggagcct gaagacagga ctgaattgct gcaatctcat    61440
          gattaaactt gaagaaatga agagctgctt ctatggataa ccaaagaaaa tggtttcttg    61500
          agaaagttta ccacctactc cctataaaga tgctatctac gttgaaataa caaaggattt    61560
          agaatatgac ataaatatag ctgatagagc agtggcaagg tttgaaaaga ttgtctcaaa    61620
          tttttaaaga agttctaccg tgggtaaaat gctatcaaag agcatcacac actacagata    61680
          aatctttcat gaaaggacga gtcaatctat gcagtaaact tcattgttgc cttattttca    61740
          gaaattgtca cagccactcc aacttgcagc aaccattact cttactagtc agatgccata    61800
          aacattgagg gaagacctcc accagcaaaa agattatgac ttgctgaagg ttcagattat    61860
          cattagcatg ttttagcaat aaagtatgtc taaaattaaa gcaaggcatt atcttttcag    61920
          atataatgct attgcacact taatagacta tagtgtagtg taaacataat ttttatatgc    61980
          accggaaaac caaaacattt gtgtgactca ttttattatg atatttcatt tattgcagtg    62040
          gtctggagaa ctaaatctgc aatatctctg agtcaagcct gttatgtatg tatgtatgta    62100
          tgtgtgtata tataaaatta taaacataca tatctatgta catataaaag acataacaaa    62160
          tgataattaa cataaaatac ttaacaaaat tttaaaacaa taaattcctc aaaattagat    62220
          cttaatgtaa tgtttacctt tcgatttctt tttcctgagg gtttgaaatc attaactttg    62280
          cttggtcatt ttcattagtg aaggctttct gttcttcata ggcttttagt ttttctttta    62340
          acaataaaat ctagtagaga gaaatcacta gttaaaatac aaaagaagtc atttacatgg    62400
          ccacagccaa atttagctgt aaaaaataac tgaattaacc agattttaat tttaatagaa    62460
          aaatatgtta aatttttgga caattaagat tataaaattc tataaatgaa gaactgcgca    62520
          agactagcat aaaaatataa acagacatac ctctgccttc tgctcattac agatctttac    62580
          atattgagtt atatgattat tgacattaag aacattgctc ttcaactgtt gaaagataga    62640
          aattatgatt gtttatagag agataataat cacagagata aatacatgaa taacatgaca    62700
          ttgcattttc attgagttcc atgaattcag aatttgtgat aattatgctc acatttaaaa    62760
          tctatgacaa gaggatctgc tgagcacatt aataatgtaa atgaaattat aaagaaatta    62820
          ctttattgag aaaaggtatt tataagcatg taattgcaat ataataaaat tccctacttt    62880
          cttactcctt tgacttctaa gtaatgcaga gatagttttt catgctaccc tttcaggaat    62940
          tcagttggtt ttcactgagt tcttactata ttttaacatt tttatcatag tatgggcccc    63000
          ttgacattta tggtatagta gagaggatat taaacatata aatccaaata cttgatattg    63060
          agaccttgcc tacttctcac ttaacctgac ttagaattcg aactgtttga tgtttgggtt    63120
          actcatctgt aaagtggagc taagaattca ttcctcaagg ggctagtgta agggctacat    63180
          gaaaatcatg tgttacaaac ctttctgtac acccatatag tatgaccttt tacaattaat    63240
          tatataatga gcctgggaac atttttctta agatgacaat aacatgctca tcttcagaca    63300
          cttaaggaga gtggcagagg ggaaagggag aagaggagga gtcatcacaa cagcttaact    63360
          ctaggttttt tcaaccccga tatattataa tttaaacata catattttga tatacatgtt    63420
          tttaagtaca acacatcttt ggcaaaaata ctaatgtaac caattattat tattatattt    63480
          ctggagaaat acagagattg gtacatcaac atcatgaatg tggactataa attatgtaga    63540
          aaagactttt taaaaaataa gctttatacc tattttacag atgaaataat aggcttggaa    63600
          agcttaacta acatatccaa gattttcagg tgaaagtttt ggttctcagc taaagcagag    63660
          catcatcctg ggctgcaaca aatgtgttca agttttgagt gattactcca agatgccatc    63720
          caaatacaat acgccatgac atcaaagagg ttagggagaa agccactcaa gtaccatagt    63780
          acccaaaaga tcgaataata gtatctatta tatatatata tatataatca agatgcttta    63840
          tggtttaacc gtctaaatta atgttcgact aagcaggtta gcaaagaccc ttctaaccct    63900
          cagctgccta actcattatg tagaaacata acctgaatta atactttcat tacaattata    63960
          aaaatcatat gcagacaata ccttcacaac aaaggcagag taaacagact tacagaagat    64020
          ttaatgtcct ttgcccggtt agcatactta agagtgttat atgtgtcatc gtagaataca    64080
          gaggaaggac taacagcagc tatcattata gtttgacagt ttcctccaag agaatccttt    64140
          aacaagcgag taagcttact atttctgtaa gggatatgct gattctttct ctgaaagcac    64200
          aaaaaagaga tcttatgtca ttttccacat ttaaatgcaa acctgctacc actttagcac    64260
          ttcactgtgg ggggaggatt acctaggtgc cgaggcaaga gactgaaggt ataaactgtt    64320
          tcagtataat gaaaaaaata gctagaataa gaatagtcat aatacaactt agatatagag    64380
          atgatcatgg acaattatca atcactatta taaacattat taatcattag cttttaatat    64440
          tactctttgt tgcattacga atataaccta ggaataaccg gcgggtatgg ggtcagctgc    64500
          tgaagggaca ttgtgagaag tgatctagaa ggcaagaggt gagccttctg ttatgccggc    64560
          acaaacgccg cttgagggct ccttggtcaa gtggtaatgc cagtgtctgg gaagacaccc    64620
          attacttaga agaccgcgaa agggagtctc ctttccttgg aggagtcagg gaacactctg    64680
          ctccaccagc ttcctgtgga aggctggata ttatccaggc ctgcccgcag tcatccggag    64740
          gcctaaaccc ctccctgtgg tgctgtgctt caatggtcat gctccttgtc cactttcatg    64800
          ttcctcctgt actcctggtt cctctttgaa gttcacagta gacagcaaca gaagaaatag    64860
          tgaaagtctt aaagtctttg atctttctta taagtgcaca gaagaaaaca cggatgtatg    64920
          cgccatctct ctctctgtta tcggctacct aagagggaag ggtcccctgt cctatgatca    64980
          cgtgacttgc ctcaccttgt caatcactta gaagattcac cctccttacc ctgccccctt    65040
          gtcttgtatg caataaatat cagcgcgccc agctgttcgg ggccactacc ggtctccgtg    65100
          tcttgatggt agtggtcccc tggggcccag ctgttttctc tttatctctt tgtcttgtgt    65160
          ctttatttat tacaatctct cgtctccgca cacggggagg acacctgcca agtcccgtag    65220
          ggcttgaccc tacacttcac tataagaact taagcgctac ccaattttat ccagacttat    65280
          aattggtgat tgaggtgatg acaaagaatc ttacaggatt attcagtgaa tatatgaaac    65340
          aaatatcata tttaaaaata tctgcatctg agtaagtatg aactttagtt caaaataaaa    65400
          taatacatta atattggttc attagttgtg atatatgtac catattaata taaaaaatta    65460
          acaataggga aaaccaggtg tggagcatat ttaacaaaat ctgtatcatc ttagtaactt    65520
          ttctgtaaat ctaaaactat ttgaaaatgt ctatttaaaa atatttccaa tcattgaaaa    65580
          aaattaaaac acaaaagtaa acagatgtcc tatacaaata tactagagga ataataactg    65640
          catggcttag agctactttt ctccttaaat aaccatctaa tatcgatatg aaataaatta    65700
          taattacaat gttacagaca tttctcctga aatcactata gtgttctaaa agaacctaat    65760
          acttcaagat tttcttttac ctaaaaagaa aaaagtaaaa gtaacaaata aattttgtta    65820
          agttttgttt ctgattttga agtaacaaat aaattttcca gaaagtagaa tgtttatata    65880
          agaacagatt ctttacaatg ttaagctaaa agcaacctaa tgttatccaa tgtatacctt    65940
          tcatattgca aaacaggaaa ttgaagctaa gcataaagtg aaatgatttg actagggtca    66000
          caaagctagt agttcaaaga gccagaaata ggtcctagtt cccccaattc tcagtagcaa    66060
          tgtgcttcca ccatagcagt ctttcccaaa cagtgtgaaa tatgcactgc tggtgctatt    66120
          ttaagtgatt ttacatgtac aagacatata ttaaacattg actcacaaat gactcaatag    66180
          gagtcattat taaaaaatta tagattagtt catatggcaa aaatcttatg aatggcttaa    66240
          gtttacaaaa tccgtctctg tgtcatgctg tctgcttaca agtttgagat tttaactcag    66300
          aatataaaag acatcttgct tttgcaatct tcatgtgatt tcagtaattt gccttttttt    66360
          aaaaaaaaaa cctgctccaa ttattttaat atacttattc taaatcaaag gtaacatttt    66420
          gaacagttta acaagccaaa gcttttttaa aaaaattaaa tttaattttt taattatatt    66480
          ttaagttctg ggatacatgt gcagaacgtg caggtttctt acataggtat acatgtgcca    66540
          tggtggtttg ctgcacccat caacctgtaa tctacattag gtatttctcc taatgctatc    66600
          cctcccctag cccccacacc ccctgacagg ccctgcctgg cgtgtaatgt tcccctccct    66660
          gtgtccatgt gttctcattg ttcaactccc acttatgagt gagaacctgc tatgcagtgt    66720
          ttggttttct gttcctgtgt tagtttgctg aaaatgatgg tttctagctt aatccatgtg    66780
          cctgtaaagg acatgaactc atcctttttc atggctgcat agtattgcat ggtgtatatg    66840
          tgccacattt tctttatcta gtctatcatt gatgggcatt tgggttggtt tcaagtcttt    66900
          gctactgtga atagtgctgc aataaacata ggtgtgcatg tgtctttcta gtaatgattt    66960
          ataattcttt gggcgtatat acccagtaat gggatggctg ggtcaaatgg tatttctggt    67020
          tctagatcct tgaggaatcg ccacactgtc ttccacaatg gttcaactaa tttacactcc    67080
          caccaacagt gtaaaagtgt tcctatttct ccacatcctc tccagcatct gttgtttcct    67140
          gactttttaa tgatcgccat tctaactggc atgagatggt atctcattgt ggttttgatt    67200
          tgcatttttc taatgactaa tgatgagctt ttcgaacagt ttaacaagct aaagctttcg    67260
          agtatggttt aacttaaatt gccatattat aatttttttg aaaggatgtc atttttacaa    67320
          atatctatgt tgtgaaatac actgtgttct aggtaagcac ttctggcata tggtatatgt    67380
          aaactatatt taaatatgcc cagaagcatc tagtaaacat taccttatta ggtgatttca    67440
          tgacatttta taacttaaac cccccttaaa aaaaaatcaa cactctttaa tacttaaccc    67500
          tattttataa tatataaaat actaaacaac agaatttagt ttttaaaaat atggttagtt    67560
          tgtcttcatg ccaatttaat taacatgttt gctgtgtagt gatcacttta aaaaccaagt    67620
          tcaaaataag tgatgagaat gtaccataaa atattaacta tcaatctggt attcattact    67680
          ttctatttaa ccaattctca ttataaaact ggaaattaaa aaagaaataa aaatcagttt    67740
          aatacactag gttttctgag gtctttgatc tatatattaa cattactgat atacccttga    67800
          aatgtgatat atatcagacc tttaaaacaa aatcatatta aatagtatct ttcttatcta    67860
          tttcaatatt tcaaactatt taacaaataa acatataatg cctacctttg aatctgctaa    67920
          ggcattgatg acattcccaa gagctaaaag tgatctatta atatttgtgc cttctacaaa    67980
          tcgggtcccc ttagcaccgg aagtacttgc tcgctcagat cctgccaggt caatgagtga    68040
          catcttggca atacggacat tttgattgat acttgctgtt ttgtcttgtt gtcgcaagta    68100
          aatctttttg aaattacaaa atagaaaaaa atgaggataa gatttaacaa aattaaaagg    68160
          gaaatatata ctttaataga gcacaaaatc aaaattattt tcattttaaa aaacaactga    68220
          acaaggtata atctaattga tatttaagag cactataagt aatcactata gctgagaaaa    68280
          atataaaaat gaaaagactt tctatatgtg taccagagga aaaataactc ttgacttgat    68340
          agaagatcaa aacttccatt tctattctgg taccccttga accaggacat ggaattatca    68400
          gaggtgatgg ttagaaacac aggtcctata gaaataacgt tcctaagaaa aaaccaaagc    68460
          tactcgttag aatgccttgt atgtatctag agattgcccc tcaagggaag ctgaattcga    68520
          atcttgatcc aaactgaaga gtaaatttat tctaatcccc caaacctgta tatgtcctca    68580
          taattaaaat atcatatata aaaaagatag tacagtcttg catcacttaa caacacagct    68640
          actttctgag aaatgcactg ttaggtgatt tcctcattgt gaaaatatca taaatcaaac    68700
          atgagagaaa atgataaaat ccacagactt ggtaaacaga atgtagcaga ctgcttttgg    68760
          ggtaataagt aggagcatac tctaaaataa caataaaaag taaatacata aaccagtaac    68820
          acagtcattt attaccaagt ctcatgtact gtacataatt gtatgtacta tattttcata    68880
          tgactggcag tgcaggttcg tttacaccaa caacaccaca aacatttgag taatgtgtta    68940
          cgccacgaca ttatgatgag tatgacatca ctagatgaat aggaactttt cagctctgtt    69000
          gtaatcttat gggaccactg ttgtatatgt ggactgttgt tgactgaaat gtcgttatgc    69060
          ggcacatgac tatacagtaa agtctacttg tcattttcaa ctgcctagta aagcataatt    69120
          tattcaaata ttttaagcta ctctgtaagg attatctgaa ctacattagg tggcaaacaa    69180
          aagatgagga aagtaagata ttacttaatt ataaacccat ttattaaatt gttttataaa    69240
          gcaggatcta agatatttca gagacatctc agtttcacag agaaacattt ctctcaagac    69300
          tattaataac cgaagagtta gtggtaagaa caaaaaagat taatgaaatt tttgttgacc    69360
          agggactata tgaatggttt gattgccttc aatatcaatt ctttcaacta taacaatttc    69420
          tttcttataa gatgtatctc agatggcata atactaaaag aagctttata ttatcatttg    69480
          ggtattaaaa ggactagaaa ctataagaaa taatagctat taacctatgc tttagctctt    69540
          tctggaattg tattcctaag acttactgtg ccaactgaat catacttcct taaggaatgc    69600
          gactatttac atggtcctta tggtgaaatc ttttaaagat gaatcagtat gttcccaaat    69660
          tattagttct acaagtctag atttatagag ataagtttta ctgtgaatat aagattattt    69720
          attggaaaga ttaaatattt tcagcaaaaa caaaactttt attactacaa ctttatcctc    69780
          ctgtatgttt acaaaggtag aaattttgta tttttgtttt aagcatctca attataaata    69840
          ctcttggtga cagaaacttt tcaaagctat aaaggaaagt actgacaagt gaagtctaca    69900
          gacagatttt tttcacatgt atgaaaatga tgattcatga atttagcttc atttatttta    69960
          aatccaattt taagagtgat agtctagtgg cctcttactt ggaaaacagc atgagaacga    70020
          gaagatgtgg cattcatatc agtgggatgt tgtgtcctgt ttttgtttcc attatccaat    70080
          aaatgtaaaa tttcttctga ggatttgggc tggagaagtt taagtagaag caaaatttaa    70140
          aaatcagcaa tatatcttta aatttttcaa taaatgttca aaaaacaaaa agatttaaag    70200
          gtaaaagaaa atgttttcta taaattcaat cctattaaat actaactttg tctcatctgc    70260
          ttagtattgt gtgtgtttat atgaagaata aaagataaaa tctagtttct caggagtgga    70320
          gtctattgag tagaataata tgacattaaa tgttcaagca gatttttgaa agaaaagctc    70380
          actcattggg aggctgaggc aggcagatct tgagccccag agtttgagac cagcctgaat    70440
          aacatggtga actcccgctt tctaccaaaa atacaaaaat tagccagtct catagcccgg    70500
          tcacaaaata aataaataaa taaataaata aatacataca tacatacata catacataca    70560
          tacatacgta gattaaaatt taaaaataaa atttaaaaaa tgtttttaaa aagttcactc    70620
          tattttaaaa gaaaacaaaa taagactaaa aatataccct aatcatttaa attctgtacc    70680
          tcattagttt tttttctcaa acaggatgga aagtaagtgc atggctggtg aaaatagctt    70740
          aatagtcaca tttgctattc taacagggaa aaagatgttt atatacatac ctggtgtaaa    70800
          gtaagtccat gaacgaccac ccctttttgg gtatcttccc ggacagcaag tggccctgaa    70860
          tttactaaga gatcacgaat ctgttcatta tataccttaa aataaaaaga actgctttag    70920
          cattgatgta aaaaaaaaaa atggtgatta catcacacat acactgctaa tttaaagtta    70980
          ttagaatttt atcctaaaga caagcagcac ctcactttta ttcacctcat accttcgatc    71040
          tcatgttgcc attaattttc tatcattcca gaaaattgaa gagtttgatt acctaggttt    71100
          gaaattgaaa cttaaagttg gagtcatccc ctcactcata attcctgcct tgatgactat    71160
          ggtgaaacag agataagtaa gatagctgaa gtgcattttc ttcttttctt tttttttgag    71220
          acggagtctc gctgtctccc aggctggagt acagtggcgc aatctcggct cactgcaagc    71280
          tccgcctccc gggttctcac cattctgctg cctcagcctc cccagtagct gggactactg    71340
          gcgcctgcca ccacgcctgg ctaatttttt gtatttttag tggagacagg gtttcaccat    71400
          gttagccagg atggtcttga tcttctgacc tcgtgatccg cccacctcgg cctcccaaag    71460
          tgctgggatt acaggcgtga gccaccgcgc ccggcccatt ttcttatttt caggaaatgt    71520
          atggaacaca cggtactggg aaactctggg aaatgcaggt tgtatggaga tggcatggtt    71580
          cttactgtgg aagatatcta ttatttcaca atgtccaagt agtccaaact tttgaaattt    71640
          tagagcttaa atgttacaga aaacccatac caaggacagg tggtatttgt ttcggttatc    71700
          cttcaattac attaattttg acatataatt actaataata aatttcaaaa ggagacccat    71760
          ttgaatgatg agggaactaa gactctgaga ggttaaatga tttgtccatg gtcataaagg    71820
          tattagcaga gtaggaactg gagcctagac agcttcactc tactgcatca tactgaatac    71880
          atatctgtag tttatatctc tggccatttt ttaaaaagta atttttataa gtaacacaca    71940
          tttctatgta gtactagtga cccgatttta tgaatttatt aaaggtataa agtttattac    72000
          ttgctaacca aatgacaatt acaactatta ctgacaagat ttaagaaaaa aaataacaaa    72060
          atttagtctc taaaaaatta ttttgtgtta tttccttctg tgttctaata agtagctcat    72120
          agtgataatt cattgctggt acaattctct acaatgaatg ataggcatta gaatgtaata    72180
          aacccttaaa agtagtaaaa tgataatatg aagaaatatt tttaaatcat atctttttga    72240
          tgagcagcag tcactttact attgcttccc cttacccact tcaatcataa caaatcaaaa    72300
          attagaataa ttgttctcaa gctggtctat gtatgacact caccaaggag catttaaaaa    72360
          acacagatgc ctcagccaca ccccagacct actaaattaa aatatcccaa gtgtgaggcc    72420
          taggcctatt tttaaaaagt tctataggca attctggtgc acagcttgag tagaaaacca    72480
          tattatacac tgccttatca ttaataatat gaaagtagat taaaagaaaa aataaaaatt    72540
          gtgaaaataa ccaaacttca aaattctccc agttataaaa aggatctaag gaaaaaataa    72600
          tgaatgctgg caccctcttt tcccaattga gttcagaaca attcttttca tagttaacca    72660
          accaaagaaa atgagtttta cttctttttt atctataagt tctaatgaag aaatttttag    72720
          caacatatat gattttaatc aatctttgga agaaattctc agtagggacc aaactacaag    72780
          atgttaataa gagagaaatt ttatggcacc agaaataaat aggcaatgaa atcagggttt    72840
          ttatgtttct gcactggttt ctgaaacact atttgaatgc aaagttagag tgtctgccac    72900
          ttagttacca tttgttgact attaagaggg tagaaggcct caaagaatga tggggtattt    72960
          caaaaggaca caagagacaa catgaagaag tctcaactag ccaaatctta cacaatttga    73020
          acatacaaaa aatgattaca gaaagggatt ataatctatt caataaagta aaaatgcagg    73080
          aggctgatat aataagggga aaactcttcc ttatagtaga aagtcaataa agaaatgtac    73140
          aagaaatgat ggaatttaaa aatcaccatc atctaccatc ataatagtaa ttgattcagt    73200
          caccaatcat cagtggatac taataacaat agataaaagt ttgaggagta aggaatattt    73260
          acattgtcta catacatagt acttactaat tataaatggt aaaacgtatc ttcaaagtgg    73320
          agaaactcta cagaccacag cataataaaa ctgatcaaag ttaacattcc cagtatgggg    73380
          actaatcaac ggcttaagcc ttttttgatg cagtaagaag tgaacatcac tttgcttgtg    73440
          ttactgtcag tgcataatct gaatctaatc atgataaatc caaactaagg atttttatgg    73500
          cagtgttata aaagacaaaa aattacagat taaggagact aagatataac aactgaatac    73560
          aattttcttt tacaataaag ggtattaatg aaataactag caaaatctca ctaagatcta    73620
          cagataatta tattgtatca ttgctaattt cctgattttg gtacctattt agcagttatt    73680
          tttaaaaagt cctgttttta caagtctgca acctagctca gaaagaaaga aatgtataca    73740
          cacacataga aagcaaatgc agtaaaatgc taacatatgg gggatctgta tgaagggtat    73800
          ctggaagttc tttgtactat tgttgcaact tctctataag tctgaaattt tgccaaagta    73860
          aaaaaaaaaa aaattaacag aaaaagatgc ataacaaata ttcaagacaa ggaattttaa    73920
          tgattttata tattcaccgg aaaactctta tataataaaa tcatttgtat gaatcatgtc    73980
          aatgatttcc caaaactatt gattaatcta aattcccaac ttacctccag atatgaaact    74040
          gcagtactac atattttctc ttctttaatc tcatccatgc atttgtaaag gtgtaacatt    74100
          gttagataca tcactccagg ttcatcagct gatcctagca tagtgtgggt cttcccagca    74160
          ccagtggcac cataggcaag tactgagttt ttaagaaagg gatcaaaact ctttgttatg    74220
          aaatataact ctattatatc tactatctag tggatagttc catctggata tcctgaacag    74280
          tatctttaaa ccctacaaat ccaaaattat agtcttatcc ttaaaacctg ggaatgttac    74340
          cacaaatcta ctcttactcc tatgttcttt actctgataa atggtatcac tacccccggc    74400
          cccccactct aacaactact ctttcaaagc aatcttaaaa tctccctaca gattagtctt    74460
          catcttccat cttctttatc ctttgcaatt tgtagtcatc tttatgaaaa agaaattgga    74520
          atacgttaaa ccttcttaat tgttccaggt ttacataagt tcaaattcct cactttggaa    74580
          tattataaag cactcagagg gtgcctgctt attttgccag cctactgctt ccttgctgtg    74640
          atctagggat acttaattat tcaatactct cagcatttgc tgctcctttc tactctgctg    74700
          tctttgttct gaggagtccc tctacttgat ccagctggaa aacttccacc tgcttctaaa    74760
          tgctcagcac aaatatcatt tttctctgcc ttccctcatt gtcctaggca gacacatcca    74820
          ctctttcact tcagccctta gtatatgctg catatccaca tccctctctt ctggcatgta    74880
          tcacactgta tttccaattg agtgctccac caaggcagag gccatgtatc cttatcacct    74940
          aacaaatcac ttgccacaaa gcaggtactt gaataaatac cagatagatg ccatttataa    75000
          gattcctttt taagtttttg ttttaggtga attactttgt ttcctagatt ctattcagta    75060
          caagaaagtc atgtgaattt cttccaatgt ataaaaaatc cactctgtgg gccaggctcg    75120
          gtggctcatc cctacaatcc cagtactttg gacagctaag gtgggaggac tgcttgagcc    75180
          caggagtttg agaccagcct gggcaacaca gtgagaccct gtatccacaa aaattttcaa    75240
          aaaattagct gagggcagtg gctcattcct gtagtccagc tattcaggag gctaagatgg    75300
          gaggattgct taagcccagc aggttgaggc tgcagtgagc tgtgattgta ccagcgcact    75360
          ccagcctggg caacacagca agacttcatc aaaaaaaaaa aaaagacaaa gaaaaagaaa    75420
          aaaatccact ctgtgaatta catatggtaa atacccaata caataatcag ttaaggcaat    75480
          aacttctcat atcattgcag tgagctgtga ttgcaccagc gcactccagc ctgggcaaca    75540
          cagcaagact tcatcaaaaa aaaaaaaaaa aaaaaaaaga caaagagaaa gaaaaaaatc    75600
          cactctgtga attacatatg gtaaacaccc aatacaataa tcagttaagg caataacttc    75660
          tcatatcatt attggttgaa aatattttta taaattcaat ctgtctgcta aaccaaatgt    75720
          taacaaacca caaaaatact tttcagtagg atgaattaag atggtgtata ttttactttg    75780
          ttctatttta tgtaagctgg tatataagga aggtttaaaa tggcttattc ttaagcttat    75840
          tcttaagctg tcttaaagac agggtaagaa tataaagaaa gccaaaaaga aaccaaaaat    75900
          tcaatagtag tttgatagag agtctacttt ttttcttaga gttaagaaga tttcaaaatc    75960
          tctagagaca tatgaagttt catgaaagag gaaaagaata tcttcttaaa aatgggaatc    76020
          acagtagtac caatcaataa accacactcc atccttactt gatcaagagg gtatgtcttc    76080
          catgataaaa ctgaaatgaa tcaggaaaag acagtgaaac atgttatagt tgtgagctgt    76140
          cttggggaaa atatcataaa tactaataat tacaaaaata agatattaat aatggtgttt    76200
          agtgcctggt aggcactgaa aaactggcca ttttgcatct tgggtatctc tctctctctc    76260
          tctctttttt tttttttaaa aaggaaatca acatggcttt cttgaaaggc caaaaaaagc    76320
          actaaagatg cttcttgggc taacaatgag ctaaagggca tgagataatt aacatgggat    76380
          cttaacactt ttaccccctt tccaattttt attttaggtt tgggggtaca gtgcaggttt    76440
          gttacatggg taaattgcat gctgcggggt ttagtgtaca gattttttca tcactcaggt    76500
          aaggagtgta gtaccccata ggtagttttt tgatcctcag tctcctccta tccttcgcca    76560
          acttaaacat ttttatttca atgtgccatg aagaaaaact gctgaaaaga aactgtcaaa    76620
          tgttcagaaa tgtctgacta ctctccagga atagataatt acataggtaa gctgtaggaa    76680
          aagttataaa tacaggttat gagaaaactg atgttaattg caataagcat gtggtttaat    76740
          aacataggca actgaaagga cagatgtcta taggggccac agtaaggccc tggaagagaa    76800
          aggtttacaa atgatgtata agttatatat gataactaaa atttcaaagt ctatatttac    76860
          agttcaagtc tattgaattt cttaagaatt tttagcatac aagctcctta aatttgatta    76920
          tatttagaag ggtcaagtag atgtccgtcc taatgcaaaa gtgaaatcgg atagagaaat    76980
          taaatcccaa attgaaacaa atacctgtgc aattatatcc attcaaaaaa ctacgaagaa    77040
          ttggcttagt agtgtgttca aaaacttctg actgagttga cgtttcatca aaaacagcat    77100
          caaatacaaa tttaagatcc ttattttgtt tctttataac attttgattt gtagttttct    77160
          ttccatggaa aaaactgact tcttcttgtt tgggatcaaa aactaggata tgtttatcca    77220
          caacatgaac cactttatga aatccagctg ctttttcttt agtgttttcc ggacgtacac    77280
          gaactactac tttcatatgg tggcacaggt cttcctcagt gacagacatt gttgattatc    77340
          ttgattccta tctgtataaa tacttgaata cttctctgaa attaaaaaag aaaataaagt    77400
          tttaatatca gtttttactt tcatgcaaaa caactggcat gtagtattca ttcaaaaaag    77460
          atgttaataa ttctgtttca ctcactaggt aaacactggg ggaaaaatac atacatacgt    77520
          aggcacacac aacacacaca cacaaatata tgcacacata cacacatatg cacttaagta    77580
          ccctaaaaca aacaattaaa tggcacatac gtacacacaa ctacgataaa aatctcttta    77640
          cctgaaatat tagtaggata tttggcttaa actcaaatac tatagctgaa ccatatataa    77700
          tcacagatat gctatcctaa aacccagatt tgattttcac aagccctcca gcactatttc    77760
          agcttaggtc atgggaatga atagaaaagg atctcccaga accatatcaa ggtatgattg    77820
          gagagcctta gcttgtgaac tatttttagt aaaagtgatc ttggctgcaa gccccttggc    77880
          cgtggaaagt gatacaccca ggctggtctc tacctgtatc tcagaagccc atagggttaa    77940
          aaatagttcc aaggatgcat tcaactagat agctcaggtc tgaaggtgat agagatggca    78000
          tagactcctt ggtgtattca gagacctagt ctctgaatat tgatcctact ctctgctttc    78060
          taattgtgtg caagtttaag gaatcaatga tagcaggttt aaaaattatg gtctgatttt    78120
          atgactggtt cacatgcaaa gaagaaaagt aaagtaacaa agatcaataa tttggaagtc    78180
          tcaactatcc agaaaatact ctagaatctg cagacccaaa aaccaaaaca aaaaaacaaa    78240
          caacaacaac aacaaaaaga caaaaaaaaa ccaaaccaca aaacaaaata aaacacccca    78300
          aaacaacaag atctgagtaa ggaccaaaag gtgagactta ggacgatcct gcaatcccac    78360
          ttctgagtat atatccaaag gaattaaaat cagtatgttg aagagatatt tgccctgcca    78420
          tgttcgctac aacattattc acaataacta agatatataa acaatctaag tgcctatcaa    78480
          cagataaata gatcgaaaaa atgtggtata tgcactcaat gaaatactat tcagccttaa    78540
          aaaagactaa aattctgtca tttatgacga catgaatgaa tctagggggc attatgctaa    78600
          gtaaaataag ccaggtacaa aaagacaaat atcacatgat ctcactttta tgcagaatct    78660
          aaaaatatga acacagagaa gtagagtaat ggttaccaga ggctgaggag ggtggggtgg    78720
          gtggtaaaag gggaaatgtt ggtcaaaggg tacaaagttt cagttataca agaggaatag    78780
          ttttggtgat ctattgcaca gcaaggtgac catggttaat tgctaagagt acattttaaa    78840
          tgttctcaca acaaaaaaat ggtatgtgag gtgatggata tgttaattaa ttagcctgat    78900
          atgctcattc cactgtgtac acatgtatca aaacattaca ttgtatccta taaacttaca    78960
          catttttttt gtcatttgta agttaaaata aaagagacaa aaataataaa ttcacccaaa    79020
          acaacattta agtaaggact tgaaggaggt gagggagtta gtcatacagg tattgtagga    79080
          agcttttccc catagagaga aggacccagg gtgctacttt atgttggcca gaatggagtg    79140
          agcaaagggg agtgtagtaa gacatgagag gagaaatgga ggccattaaa agaactttgg    79200
          cttgtactct gagtaagaca aagaacaact ggaagtcgtt ttgagcacag gagtgacata    79260
          atctatcact ctcactgcta tgtggataat ataatagact agtctattga agtaatgtag    79320
          acaagagaca actctgtcag ctcagaatag ggtagtggca gcagaggtgg taagtggtca    79380
          gattatgggt gtattctgag ggtaaaggtg acagaattta ctgacaggta gatgtagagt    79440
          gaaagagaga gacaggattg aagaataact ccaaggtttt tggcttgaga attagaagga    79500
          taaagtagtc accaactgag atggaaataa gaagcagggc ttttttcagc agggcgggaa    79560
          gtggtgggag gcagggtcag atcagttcag ttttggatag cttaagtctc agagttttga    79620
          cagacatcca ggtggaaatg tcagggcagg tggaagttaa gaaaataaga aaataaaggc    79680
          tgtcctcagt cttaatgcag tattaagctt taaaaacttt cgggaaatcc taaatgaagg    79740
          aggaaacagc gatctattgt gttaaatact gctaataggt caagtactta ctgagaatta    79800
          accatgggat ttactaacac agaggccatc gagaaaagca attttggggc agtagtgggg    79860
          aaaaaacccg aaaggagaag atccatagac aaggtatatg gaaaggactg tttcaaaggg    79920
          aggagaaaaa tggtgtgagt gaaggggggg ggtggtgtca agatgttttg tttgtatttt    79980
          tttttaaatg ggagaaatag caatattcaa gctgaaatat gtcacaaaac cacttagcca    80040
          tatactttcg gacagaattc aaataaggac agaattcaaa ggaatctaaa agcagtagat    80100
          gctagacata tctttgcctt tttaggactc tgtctttggc caaaaataga atactgaaaa    80160
          ggaagggatg gtcatttgga ttctaagtca ggtcccaggt gaattactac tttgtttttc    80220
          atccctgagc ttccgtctag ccaagtgtca caaagcacct acacctcact tttatgacct    80280
          tggacaagtt acttaacccc atgagtctca ggtttctatt tgtataaaag agataataat    80340
          acctcaatgt ttgttgcaaa ggctaaaagg ggtaagtatt aaggtattca gtaaatacca    80400
          attctcttcc tatctgcccc actcctgctt cttcttgcca aagagactga gttcatcttt    80460
          tgagtttttc tcaatgggct tatgactagc actttgggta ggccaattct tccttgctta    80520
          gaactgccct gttatagggc atttagaact gccctattag aggatgtttg gcatttctct    80580
          cccctgtcta ttaaaggcca gcagtgtccc atattccttg tgataacaaa aactatctcc    80640
          tatacacatt tctaaaagct tttagaaata ttcaacaata ttttaacaga tatactattt    80700
          ttaaatgata gattaaatat acataaatga aattgttaac aaagtaaaca taaaatacta    80760
          agtgattatt tcaaaataaa ccttagaatc tcaaggctgg aggatatccc tccctaatta    80820
          attagttaat taattcatga caactattac atgttggagc caggcagcct aggttaaaat    80880
          ctcagctcta tgacgtactg actgtgatag tggataagtt acttaacctc cttgtggctc    80940
          agcttcccca tctgtaaagt aagactaaca acagtaccta tctcataaag ttgtaaagat    81000
          tacacactta gaacaatact ttgtacagag tatgaactac aagtgtttgc tattattatt    81060
          tacagtgtag tgagggaaac agatattaat aaaatattga cacaaacatg taaaggtata    81120
          actgtgacaa gtgccattat agggaaaagg ttaacagtgc tttataagac tataatgagg    81180
          ggattattta agtaacattc cagggagaaa tttggacaat tacctaaagg aatgaggact    81240
          aaactctgat tttttatttt gcccaaattc ctatctaagg ggtctgggga gtcacgccct    81300
          ataaatcatg gattttcatt agatgcgttt tatttgaccc cgtatattgt gacttgcttt    81360
          tcaattgact ctggcataac attatgagac aaagaaaaaa tatttaacac ccaaaataga    81420
          tttacttgcc aagccttgaa attgccctgc aaagtttctt gttggaaaag tccacgttct    81480
          atagagaatc cccttccctc tttgttttcc tcttttcttt gcagatccag tagataatca    81540
          actaaaagcc aggcaccctt ttagctctgc ggagaaacat tttacaacct gctctctctc    81600
          tctgaaattt gctgagagct tcctctgcaa aataaaactt ggtctccaca attattttta    81660
          acctgaacat tcctttctat caatcccagg tctttagaca aactcaacca attgtcaacc    81720
          agaaaatgtt taaatttacc tatagcttgg aagcccccgc tttgagttgt cccgcctttc    81780
          tgaaccaaac caacgtattt cttaaatgta tttgattgat gtctcatgcc tctctaaaat    81840
          ataaaaaacc acgctgtaca ctgaccactt tgggcacatg ctctcaggac ctcctgaggg    81900
          ctgagtcatg ggccatggtc actcatattt ggctcagaat aaatctcttc aaatatttta    81960
          cagagtttga ctctttcagt caatagaatt taagtataat gtcaaatata actttgtttc    82020
          acaactagtt gcatatttta acaaagacat ggatgttaat ttttaaagta tcatgtattt    82080
          ccctatcttt taaaaacaaa tatgtggata gaattttctt aataaaaatg cctaaggtca    82140
          acagaatcat caaatgtaaa aattaatcta tgttcaaata tacttacatc tgcaggaatt    82200
          aatgagatcg ttcctacatt attatgtggt gccttctttg ttttctagga tggctgacta    82260
          aaagaaatga gcatttagtt gattctgaat aaggcacaga gagagtaaat tcttcaacca    82320
          tgtttaatat gaagcagcaa aagaaaagcc taaatatcgt tatctgcgca agaatgtgtg    82380
          gattcacaaa ttcttttcag acagctgttc agaagatagt attatagcct ctgatcaatt    82440
          ttgtcctatc tacccctaag tggtatttac tgaacagaat caaaagagca aactggtagg    82500
          atttcattgg tggaactaaa acatgaaaga caaatacttc caacgtgatt attcattata    82560
          atcaggttga gcattccaaa tttgaaaatc taaaatctaa aactttgtga gcaccaacat    82620
          gacactcaaa ggaaatgctc attagagtat tttggatttt cagattagag atcctcaacc    82680
          agtaagcaca atgcaaaaat taaaaaaaaa aaaaaattcc aaaattcaaa aaaacttctg    82740
          gtaccaagca ttttatataa tagatactaa acctgaagaa gaatatttgt ctagtctaga    82800
          gagagtaggg tatcaaaaaa gaagaatgaa ggggctaagg aaaggggctt tacttgctaa    82860
          tgtataaaac aaaagggtta gattatatga tacggaaagt ctttttctag ctccaaaatt    82920
          ttatgattat tatgcatgat tagaaaaggg tacaagagaa taagaaatga cagttaatag    82980
          acttttactt tatatcccta ttctctcata gagagtctag tatatagtaa attttcaaat    83040
          ataccaatga atgaattaat aaactataaa aaatgctcac agaccccaaa aagcaattta    83100
          ctcacttaga gtagaaggaa aaagaaaatg tatatctcca agagaaacaa catattagag    83160
          tacaatagtt gacaacaaca ggcaatcaca atgagaaccc tgaggcatca aaaagaaaaa    83220
          aataagaaag aaataatgtt cccaatttct tgtttagaaa attaaagaaa tggcaagatc    83280
          atgttttatt ttcatcatta agtgtggtta aaatacttta ttacttagca aagctaatat    83340
          tcaattttct ggaagattca tttatgtaga acagctcatg cctctgcaat gtttaatgag    83400
          gtattaaaat ctatttatcc tgaatacttg catggtaata agccaagttg aacaggtcaa    83460
          tttttaactt ataacatatg tagctagtgc tcatcccaga ttaaagattc acccctaatt    83520
          atatgcaagt acaataaatt ttatttaatt cattgattgt atgcactgat actttcttca    83580
          aaagcattca gatcatgata tgtattgcat gtcatttacc tgctccaaac tatccaatga    83640
          cttctcatca taagaataaa atacaaactc cttaccatgg cctataaatt ccacatatgg    83700
          ccctgcctac ctctctgaca atgacttcta ctgctgtctc cccatttcat tattctgctt    83760
          cagctgcaat gactttctta gcattcctaa aacacttcag tcttgttttg gcctcctggc    83820
          ttttttattt ttgcttactg gcaggcatta cctccagata tttgcaaatt gtaatccctc    83880
          acttcattat tcaggtctct tcaaatgcca ctttacagag gctttcccta aagaatctat    83940
          ctaagatagt gtcaccctgc ctttgcttct ccaatccctt actaggttta tttttctttc    84000
          ttgagtttag cactaattgg aaagtatatg ttatctggtt acatatttat tgcttgtttt    84060
          ccctctagaa tgtaagcact gtgagagcac ggagttcatc tgcacaccag cacctaggac    84120
          actgcttgtc aaatatttag gacccaataa atacttgttg aataaatgaa tgaataaacc    84180
          agtacagttt taatagactt atagcatgtt accatttgta tttttaaaag atatatatgt    84240
          atatgcatgg tcattcccag aagggtacac aagaaattga taataccact ttccctatag    84300
          aagggaaata tgaaggtctg agtgagagac aggtttattt tccatttcat attcttttgt    84360
          aatatttaaa ttttaaacaa ggtctaggta tttttatttc aaaacagaca aacaacaaca    84420
          acaaaaccac tattaaaatt taccttaatc gcaacattta atttagtaac aataagttat    84480
          attttctatt gagctcatat cccacaaata gaaatgtact aacaattgac atactcttac    84540
          taaatcgtca taacaaccta tgacataaac cctgtactgt cattcctatt ttattaaggc    84600
          agaaagtgta atacagagaa attaactggc taaagtcaca caactgagga agcacatgcc    84660
          atgggatttg aactcagact gactgaatct aaaggccaaa tacttaatca ctactctccc    84720
          tgatgtaaat atataaccct cagaaatttt cttatagaag ttaaaaatat atatattgct    84780
          tactttttta gaaattttaa aacatttaat tggcaaagat tgtataaaac gaagatgtac    84840
          aatgtgatgg tctcatattc ttatacacaa tggaatgatt accacaatta aattaatacg    84900
          tctatcacca ttgatgctgt acattaaatg ccatgaactt atttatctta taacttaaag    84960
          tgtacccttt gaccaaaatc tccctatttc ccccaaaact cagcttctgg taccactctc    85020
          ttatatttcc ttacttttga tagaaacctc agggcctggc acaggagctc ttgaatgtga    85080
          aaataaaact gattatgatt tctctgtact tgtcagatat cacagagtgg ccattctcaa    85140
          taagtatgct ttaacaatgc ttagattagg ttgatatggt gataattatt aataatgaac    85200
          aacaatgctt ttcatttgag tatgtacact ctgtctcatg cattatagta aacacttgac    85260
          attcgtcatt gcattcaatc cttataataa tcacgtaagg taggttgtag tagtatttcc    85320
          attttacaaa aacaaagact tagccttagg ataagtaact tttccaagat gacgtaacaa    85380
          gtgggcaacc aaatgtcaaa tataagtcaa ttcagtcaaa gattcacccc taattttatg    85440
          aaagtactat aataaattta attcattgat tgtattcact gatacgttca tcaaaagcat    85500
          tcagatcatg tgatgcatca catggcattc acctgctcta aagtctccaa tgacttctca    85560
          ccagaagaat aaaacacaaa ctccttaacg ggtacaaatc taaagtccat gttattaaca    85620
          gctaggttct actggaatca gaagagaatg cttccaaaca atgatacaga agtagagtga    85680
          cagttatgat atattaaata caaactcaaa cctgaattag attcagattc aacaaacact    85740
          gtataggact gaaaacgata ctcaacacta tcatctacag tccatcttaa agctcttttt    85800
          ggaatatcag tcttgggggc actactccca ccaacttaca accatcaggg aagaataaaa    85860
          ggttcaactg gagggaaggc cggcactgac agctgagcta ttttttttcc tcttagtttt    85920
          cacagttgtc agcaaaaaaa aaaaaaaaaa aaaaatcatt tttatcgtgt ctcttaattg    85980
          atttggggta tttctatgat gggacaagat gcactttcaa tataaaaata ttatgtattt    86040
          gtaaatactt ttcaatagta gaagaggaag ggctgggtgc cctgcctcac acctgtaatt    86100
          cctgcacttt aggaggccga ggcgggcaga tggcttgagg tcaggagttc gagaccagcc    86160
          tggccaacac agtgaatccc cgtctctacc aaagatacaa aaattagccg agtgtggtgg    86220
          caaacgcctg taatcccagc tactcgggag gctgaggcac gagaattgct tgaacctggg    86280
          aggtggaggt tgcagtgagc agcgatcacg tcactgcact ccagcttgga ccacagagcg    86340
          agactctgtc tcaaataaat gaataaataa tagaaaagga gattaattac tactattaaa    86400
          ggcagataat cttttaagtt tttttctttg tgattgtgct ttgtagataa tctttgttta    86460
          ttgaaatagt tcttacaaac tatgaactta ataagaagca ctatctagtc attggatatc    86520
          acattctcta gcatcaaagt ttataaaaac cttacaaaaa cgaaacagga ggctagacgt    86580
          ggtggaatga cactaaaaat taaaatctgt agagtgccta aatttctacc taattatcca    86640
          taatctaaac tatatattat accacaaaat cagttcattc tggtcaaata ctctcttctc    86700
          atataataaa cagcagtcag tcttggcttc tctgtaactg agtgactaat gagctcctaa    86760
          aaaaaaaaaa aagtcctgcg gaaaccaaga acagactata ggactgattc taaatgttta    86820
          cagtttaatt tcatctgcag agcatttgcc aaacagtatc tcttccgtac ctcatctgat    86880
          cctcggcaat cccgttaggc agtcagagcg gcttttatct cgatgctacc tacaactggg    86940
          gctcaggagg ggttcccgat tgaccagtgc aagactaaca gttaaagctc ttcagacaaa    87000
          aattttatgc agtgatgaac aaaagctcct cgtttgatag gtaagcccct gggtacgctt    87060
          atatgtgagt ctgaaacaaa acactcccaa tttggagtcc ggaaaaaagc tgacactaca    87120
          aggtgctggg cagttaaagt tctctgccag tctgggaaag gggccaagat gccctttaaa    87180
          acttaagact tcctctcagg acttaaggag atccctgccc ttccagctga gcagtcgagg    87240
          attacggtca agcagagctg tgctcttagc aggttctcga atcccttttt cctttcactt    87300
          tctccccagg taccctgatc ccccacccct caacgcttct gtgtttgtca agaagcccac    87360
          ctggtcttct agacctgaag cggcaggacc ctccgttccc aataatacaa gtcaccaaaa    87420
          ggagcgtccc agagtccagt tttaccttca tgtgcctctc actcacttca ggcccaggcc    87480
          aggttaccgc aaccacttca ctttaatgtc cgcctcccag cgcttcagac tcaaccacaa    87540
          tattcaaacc caagccactt tc                                             87562
          <![CDATA[<210>  13]]>
          <![CDATA[<211>  3435]]>
          <![CDATA[<212>  DNA]]>
          <![CDATA[<213>  智人]]>
          <![CDATA[<400>  13]]>
          gtggttgagt ctgaagcgct gggaggcgga cattaaagtg aagtggttgc ggtaacctgg       60
          cctgggcctg aagtgagtga gaggcacatg aagagaagta ttcaagtatt tatacagata      120
          ggaatcaaga taatcaacaa tgtctgtcac tgaggaagac ctgtgccacc atatgaaagt      180
          agtagttcgt gtacgtccgg aaaacactaa agaaaaagca gctggatttc ataaagtggt      240
          tcatgttgtg gataaacata tcctagtttt tgatcccaaa caagaagaag tcagtttttt      300
          ccatggaaag aaaactacaa atcaaaatgt tataaagaaa caaaataagg atcttaaatt      360
          tgtatttgat gctgtttttg atgaaacgtc aactcagtca gaagtttttg aacacactac      420
          taagccaatt cttcgtagtt ttttgaatgg atataattgc acagtacttg cctatggtgc      480
          cactggtgct gggaagaccc acactatgct aggatcagct gatgaacctg gagtgatgta      540
          tctaacaatg ttacaccttt acaaatgcat ggatgagatt aaagaagaga aaatatgtag      600
          tactgcagtt tcatatctgg aggtatataa tgaacagatt cgtgatctct tagtaaattc      660
          agggccactt gctgtccggg aagataccca aaaaggggtg gtcgttcatg gacttacttt      720
          acaccagccc aaatcctcag aagaaatttt acatttattg gataatggaa acaaaaacag      780
          gacacaacat cccactgata tgaatgccac atcttctcgt tctcatgctg ttttccaaat      840
          ttacttgcga caacaagaca aaacagcaag tatcaatcaa aatgtccgta ttgccaagat      900
          gtcactcatt gacctggcag gatctgagcg agcaagtact tccggtgcta aggggacccg      960
          atttgtagaa ggcacaaata ttaatagatc acttttagct cttgggaatg tcatcaatgc     1020
          cttagcagat tcaaagagaa agaatcagca tatcccttac agaaatagta agcttactcg     1080
          cttgttaaag gattctcttg gaggaaactg tcaaactata atgatagctg ctgttagtcc     1140
          ttcctctgta ttctacgatg acacatataa cactcttaag tatgctaacc gggcaaagga     1200
          cattaaatct tctttgaaga gcaatgttct taatgtcaat aatcatataa ctcaatatgt     1260
          aaagatctgt aatgagcaga aggcagagat tttattgtta aaagaaaaac taaaagccta     1320
          tgaagaacag aaagccttca ctaatgaaaa tgaccaagca aagttaatga tttcaaaccc     1380
          tcaggaaaaa gaaatcgaaa ggtttcaaga aatcctgaac tgcttgttcc agaatcgaga     1440
          agaaattaga caagaatatc tgaagttgga aatgttactt aaagaaaatg aacttaaatc     1500
          attctaccaa caacagtgcc ataaacaaat agaaatgatg tgttctgaag acaaagtaga     1560
          aaaggccact ggaaaacgag atcatagact tgcaatgttg aaaactcgtc gctcctacct     1620
          ggagaaaagg agggaggagg aattgaagca atttgatgag aatactaatt ggctccatcg     1680
          tgtcgaaaaa gaaatgggac tcttaagtca aaacggtcat attccaaagg aactcaagaa     1740
          agatcttcat tgtcaccatt tgcacctcca gaacaaagat ttgaaagcac aaattagaca     1800
          tatgatggat ctagcttgtc ttcaggaaca gcaacacagg cagactgaag cagtattgaa     1860
          tgctttactt ccaaccctaa gaaaacaata ttgcacatta aaagaagccg gcctgtcaaa     1920
          tgctgctttt gaatctgact tcaaagagat cgaacatttg gtagagagga aaaaagtggt     1980
          agtttgggct gaccaaactg ccgaacaacc aaagcaaaac gatctaccag ggatttctgt     2040
          tcttatgacc tttccacaac ttggaccagt tcagcctatt ccttgttgct catcttcagg     2100
          tggaactaat ctggttaaga ttcctacaga aaaaagaact cggagaaaac taatgccatc     2160
          tcccttgaaa ggacagcata ctctaaagtc tccaccatct caaagtgtgc agctcaatga     2220
          ttctcttagc aaagaacttc agcctattgt atatacacca gaagactgta gaaaagcttt     2280
          tcaaaatccg tctacagtaa ccttaatgaa accatcatca tttactacaa gttttcaggc     2340
          tatcagctca aacataaaca gtgataattg tctgaaaatg ttgtgtgaag tagctatccc     2400
          tcataataga agaaaagaat gtggacagga ggacttggac tctacattta ctatatgtga     2460
          agacatcaag agctcgaagt gtaaattacc cgaacaagaa tcactaccaa atgataacaa     2520
          agacatttta caacggcttg atccttcttc attctcaact aagcattcta tgcctgtacc     2580
          aagcatggtg ccatcctaca tggcaatgac tactgctgcc aaaaggaaac ggaaattaac     2640
          aagttctaca tcaaacagtt cgttaactgc agacgtaaat tctggatttg ccaaacgtgt     2700
          tcgacaagat aattcaagtg agaagcactt acaagaaaac aaaccaacaa tggaacataa     2760
          aagaaacatc tgtaaaataa atccaagcat ggttagaaaa tttggaagaa atatttcaaa     2820
          aggaaatcta agataaatca cttcaaaacc aagcaaaatg aagttgatca aatctgcttt     2880
          tcaaagttta tcaataccct ttcaaaaata tatttaaaat ctttgaaaga agacccatct     2940
          taaagctaag tttacccaag tactttcagc aagcagaaaa atgaaactct ttgttttctt     3000
          cttttgtgtt ctaaaaaaat aaaatttcaa aagaaaaggt tgtcttttaa gttttttaaa     3060
          tatttgttgc cttttaaaat ccctgagtgt aagttaccat ggtggcagct tagttttact     3120
          atgccacaac aagttgacta ggacatttta gtaaatggta gtgagttaaa ttatctttat     3180
          tattttttaa aaataagaat ttagaagtgg taaaattatg gcccaagatg tatttggttc     3240
          tctattatgt tttgatacat tattttaatc atatatatga ctttcctttt caaaaatact     3300
          ttaatgtaca agtgtaaata tatgtgccca taaaatcatt gtaaatatta tttagtcatc     3360
          acaaataaaa tattgtccct tgctacttga tatattaaag atgtagattt taaagtggat     3420
          gtagatttta aagtg                                                      3435
          
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008
Figure 12_A0101_SEQ_0009
Figure 12_A0101_SEQ_0010
Figure 12_A0101_SEQ_0011
Figure 12_A0101_SEQ_0012
Figure 12_A0101_SEQ_0013
Figure 12_A0101_SEQ_0014
Figure 12_A0101_SEQ_0015
Figure 12_A0101_SEQ_0016
Figure 12_A0101_SEQ_0017
Figure 12_A0101_SEQ_0018
Figure 12_A0101_SEQ_0019
Figure 12_A0101_SEQ_0020
Figure 12_A0101_SEQ_0021
Figure 12_A0101_SEQ_0022
Figure 12_A0101_SEQ_0023
Figure 12_A0101_SEQ_0024
Figure 12_A0101_SEQ_0025
Figure 12_A0101_SEQ_0026
Figure 12_A0101_SEQ_0027
Figure 12_A0101_SEQ_0028
Figure 12_A0101_SEQ_0029
Figure 12_A0101_SEQ_0030
Figure 12_A0101_SEQ_0031
Figure 12_A0101_SEQ_0032
Figure 12_A0101_SEQ_0033
Figure 12_A0101_SEQ_0034
Figure 12_A0101_SEQ_0035
Figure 12_A0101_SEQ_0036
Figure 12_A0101_SEQ_0037
Figure 12_A0101_SEQ_0038
Figure 12_A0101_SEQ_0039
Figure 12_A0101_SEQ_0040
Figure 12_A0101_SEQ_0041
Figure 12_A0101_SEQ_0042
Figure 12_A0101_SEQ_0043
Figure 12_A0101_SEQ_0044
Figure 12_A0101_SEQ_0045
Figure 12_A0101_SEQ_0046
Figure 12_A0101_SEQ_0047
Figure 12_A0101_SEQ_0048
Figure 12_A0101_SEQ_0049
Figure 12_A0101_SEQ_0050
Figure 12_A0101_SEQ_0051
Figure 12_A0101_SEQ_0052
Figure 12_A0101_SEQ_0053
Figure 12_A0101_SEQ_0054
Figure 12_A0101_SEQ_0055
Figure 12_A0101_SEQ_0056
Figure 12_A0101_SEQ_0057
Figure 12_A0101_SEQ_0058
Figure 12_A0101_SEQ_0059
Figure 12_A0101_SEQ_0060
Figure 12_A0101_SEQ_0061
Figure 12_A0101_SEQ_0062
Figure 12_A0101_SEQ_0063
Figure 12_A0101_SEQ_0064
Figure 12_A0101_SEQ_0065
Figure 12_A0101_SEQ_0066
Figure 12_A0101_SEQ_0067
Figure 12_A0101_SEQ_0068
Figure 12_A0101_SEQ_0069
Figure 12_A0101_SEQ_0070
Figure 12_A0101_SEQ_0071
Figure 12_A0101_SEQ_0072
Figure 12_A0101_SEQ_0073
Figure 12_A0101_SEQ_0074
Figure 12_A0101_SEQ_0075
Figure 12_A0101_SEQ_0076
Figure 12_A0101_SEQ_0077
Figure 12_A0101_SEQ_0078
Figure 12_A0101_SEQ_0079
Figure 12_A0101_SEQ_0080
Figure 12_A0101_SEQ_0081
Figure 12_A0101_SEQ_0082
Figure 12_A0101_SEQ_0083
Figure 12_A0101_SEQ_0084
Figure 12_A0101_SEQ_0085
Figure 12_A0101_SEQ_0086
Figure 12_A0101_SEQ_0087
Figure 12_A0101_SEQ_0088
Figure 12_A0101_SEQ_0089
Figure 12_A0101_SEQ_0090
Figure 12_A0101_SEQ_0091
Figure 12_A0101_SEQ_0092
Figure 12_A0101_SEQ_0093
Figure 12_A0101_SEQ_0094
Figure 12_A0101_SEQ_0095
Figure 12_A0101_SEQ_0096
Figure 12_A0101_SEQ_0097
Figure 12_A0101_SEQ_0098
Figure 12_A0101_SEQ_0099
Figure 12_A0101_SEQ_0100
Figure 12_A0101_SEQ_0101
Figure 12_A0101_SEQ_0102
Figure 12_A0101_SEQ_0103
Figure 12_A0101_SEQ_0104
Figure 12_A0101_SEQ_0105
Figure 12_A0101_SEQ_0106
Figure 12_A0101_SEQ_0107
Figure 12_A0101_SEQ_0108
Figure 12_A0101_SEQ_0109
Figure 12_A0101_SEQ_0110
Figure 12_A0101_SEQ_0111
Figure 12_A0101_SEQ_0112
Figure 12_A0101_SEQ_0113
Figure 12_A0101_SEQ_0114
Figure 12_A0101_SEQ_0115
Figure 12_A0101_SEQ_0116
Figure 12_A0101_SEQ_0117
Figure 12_A0101_SEQ_0118
Figure 12_A0101_SEQ_0119
Figure 12_A0101_SEQ_0120
Figure 12_A0101_SEQ_0121
Figure 12_A0101_SEQ_0122
Figure 12_A0101_SEQ_0123
Figure 111126873-A0101-11-0002-1

Claims (20)

  1. 一種化合物A之鹽、水合物、溶劑合物或共晶體,該化合物A具有以下化學結構:
    Figure 03_image001
    (化合物A);或 化合物A,包括其結晶無水形式、鹽、溶劑合物或共晶體之固體形式。
  2. 如請求項1之鹽、水合物、溶劑合物或共晶體,其選自鹽酸鹽(化合物A-HCl)、甲磺酸鹽(化合物A-MsA)、甲苯磺酸鹽(化合物A-TsA)、硫酸鹽(化合物A-硫酸鹽)、可變水合物(化合物A-可變水合物)、四氫呋喃溶劑合物(化合物A-THF)、乙醇溶劑合物(化合物A-乙醇)、1-丙醇溶劑合物(化合物A-1-丙醇)、異丙醇溶劑合物(化合物A-IPA)、甲醇溶劑合物(化合物A-甲醇)、乙酸異丙酯溶劑合物(化合物A-IPAc)、丙酮溶劑合物(化合物A-丙酮)、環戊基甲基醚溶劑合物(化合物A-CPME)、二㗁烷溶劑合物(化合物A-二㗁烷)、乙酸乙酯溶劑合物(化合物A-EtOAc)、乙腈溶劑合物(化合物A-MeCN)、甲基三級丁基醚溶劑合物(化合物A-MTBE)、甲苯溶劑合物(化合物A-甲苯)、十二烷基硫酸鹽(化合物A-十二烷基硫酸鹽)、二甲基甲醯胺(DMF)溶劑合物水合物(化合物A-DMF-水合物)、二甲基乙醯胺(DMAC)溶劑合物(化合物A-DMAC)、單苯磺酸鹽水合物(化合物A-苯磺酸鹽-水合物)、咖啡因共晶體(化合物A-咖啡因)、檸檬酸共晶體(化合物A-檸檬酸)、糖精共晶體(化合物A-糖精)、L-酒石酸共晶體(化合物A-L-酒石酸)或尿素共晶體(化合物A-尿素);或其固體形式。
  3. 如請求項2之化合物A-HCl之固體形式。
  4. 如請求項3之化合物A-HCl之固體形式,該固體形式係結晶形式1,其特徵在於,在-91和-103 ± 0.5 ppm處的固態 19F NMR峰。
  5. 如請求項4之化合物A-HCl之結晶形式1,其特徵進一步在於,使用Cu Kα輻射在7.5、16.9和20.2 ± 0.2° 2θ處的XRPD圖譜峰。
  6. 如請求項5之化合物A-HCl之結晶形式1,其特徵進一步在於,使用Cu Kα輻射在12.8、18.2、22.7、23.6、24.8和26.1 ± 0.2° 2θ處的XRPD圖譜峰。
  7. 如請求項6之化合物A-HCl之結晶形式1,其特徵進一步在於,使用Cu Kα輻射在10.9、14.5、15.7、15.9、19.8、20.6、21.6、23.2、26.1和26.8 ± 0.2° 2θ處的XRPD圖譜峰。
  8. 如請求項4至7中任一項之化合物A-HCl之結晶形式1,其具有基本上如圖1所示的XRPD圖譜。
  9. 如請求項4至8中任一項之化合物A-HCl之結晶形式1,其具有在268.5°C至274.5°C處的吸熱轉變,此係藉由微差掃描熱量法測量。
  10. 如請求項9之化合物A-HCl之結晶形式1,其中該吸熱轉變係在271.5°C ± 3°C處。
  11. 如請求項10之化合物A-HCl之結晶形式1,其具有基本上如圖2所示的熱重分析(TGA)。
  12. 如請求項4至11中任一項之化合物A-HCl之結晶形式1,其具有基本上如圖5所示的單晶結構。
  13. 如請求項2之化合物A之鹽酸鹽,其具有以下結構:
    Figure 03_image005
    (化合物A-HCl)。
  14. 一種藥物組成物,該藥物組成物包含如請求項2至12中任一項之化合物A-HCl之固體形式或如請求項13之化合物A之HCl鹽、和藥學上可接受的賦形劑。
  15. 一種治療罹患由KIF18A抑制介導的疾病的個體之方法,該方法包括向有需要的個體投與藥學有效量的如請求項14之藥物組成物。
  16. 如請求項15之方法,其中該由KIF18A抑制介導的疾病係癌症,該癌症選自卵巢癌、乳癌、肺癌或子宮內膜癌。
  17. 如請求項15所述之方法,其中該個體對至少一線的全身性化學療法已復發或係難治性。
  18. 如請求項16之方法,其中該癌症包含對於失活的TP53基因呈陽性和/或對於以下中之至少一項呈陽性的細胞:(i) 失活的Rb基因,(ii) 擴增的CCNE1基因或過表現的CCNE1基因產物,(iii) 失活的BRCA基因或 (iv) 其組合。
  19. 一種用於製備如請求項2之化合物A-HCl鹽或其固體形式之方法,該方法包括:將鹽酸、化合物A和合適的溶劑合併以形成該化合物A-HCl或其固體形式。
  20. 如請求項19之方法,其中該合適的溶劑選自乙腈/水、乙腈/1,4-二㗁烷、四氫呋喃/水、N-甲基-2-吡咯啶酮/乙醇、或丙酮/水。
TW111126873A 2021-07-21 2022-07-18 Kif18a抑制劑化合物之鹽和固態形式 TW202321213A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202163224208P 2021-07-21 2021-07-21
US63/224,208 2021-07-21

Publications (1)

Publication Number Publication Date
TW202321213A true TW202321213A (zh) 2023-06-01

Family

ID=83148993

Family Applications (1)

Application Number Title Priority Date Filing Date
TW111126873A TW202321213A (zh) 2021-07-21 2022-07-18 Kif18a抑制劑化合物之鹽和固態形式

Country Status (9)

Country Link
KR (1) KR20240051338A (zh)
CN (1) CN117940416A (zh)
AR (1) AR126537A1 (zh)
AU (1) AU2022313961A1 (zh)
CA (1) CA3226614A1 (zh)
IL (1) IL310234A (zh)
TW (1) TW202321213A (zh)
UY (1) UY39866A (zh)
WO (1) WO2023004075A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023198209A1 (zh) * 2022-04-15 2023-10-19 武汉人福创新药物研发中心有限公司 一种kif18a抑制剂及其用途

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8576985B2 (en) 2009-09-01 2013-11-05 Aptuit (West Lafayette) Llc Methods for indexing solid forms of compounds
CR20210387A (es) 2018-12-20 2021-08-19 Amgen Inc Inhibidores de kif18a
KR20230011932A (ko) * 2020-04-14 2023-01-25 암젠 인크 신생물 질환의 치료를 위한 kif18a 저해제

Also Published As

Publication number Publication date
UY39866A (es) 2023-01-31
KR20240051338A (ko) 2024-04-19
IL310234A (en) 2024-03-01
AR126537A1 (es) 2023-10-18
CA3226614A1 (en) 2023-01-26
CN117940416A (zh) 2024-04-26
AU2022313961A1 (en) 2024-02-08
WO2023004075A1 (en) 2023-01-26

Similar Documents

Publication Publication Date Title
CN112220797B (zh) C/EBPα组合物和使用方法
KR102291355B1 (ko) Pd-l1 억제제 공동치료를 필요로 하는 환자의 식별방법
CN115667551A (zh) 用于治疗赘生性疾病的kif18a抑制剂
US20190300967A1 (en) Compositions and methods for predicting response and resistance to ctla4 blockade in melanoma using a gene expression signature
KR101778036B1 (ko) 전립선암 마커로서의 포스포디에스테라제 4d7
KR102110469B1 (ko) 악성의 호르몬 민감성 전립선 암에 대한 마커로서의 포스포디에스테라제 4d7
CN107223159A (zh) 源自特定细胞类型的dna的检测及相关方法
WO1998045436A2 (en) SECRETED EXPRESSED SEQUENCE TAGS (sESTs)
CA2936612A1 (en) Atf6 polymorphisms associated with myocardial infarction, method of detection and uses thereof
EP0973898A2 (en) SECRETED EXPRESSED SEQUENCE TAGS (sESTs)
KR20210138587A (ko) 개선된 면역요법을 위한 조합 유전자 표적
AU2018223879A1 (en) An inhibitor of ATR kinase for use in a method of treating a hyper-proliferative disease
KR101621273B1 (ko) 카텝신 c의 용도
KR20230034198A (ko) 종양 침윤 림프구의 활성화 및 확장 방법
KR20070099564A (ko) 급성 골수성 백혈병 환자를 평가하는 방법
KR20220113743A (ko) 병태 및 질환의 치료를 위한 안티센스 올리고머
TW202321213A (zh) Kif18a抑制劑化合物之鹽和固態形式
JP2001245666A (ja) 新規ポリペプチド
KR20220025806A (ko) 핵산의 무작위 구성 표적화 통합
KR20190126812A (ko) 질환 진단용 바이오마커
TW202227102A (zh) 治療脂肪肝病之方法
KR20230005933A (ko) Atxn1을 조정하는 화합물 및 방법
KR102477906B1 (ko) 유도만능 줄기세포 분화 특이적 lncRNA, 및 이의 용도
KR101804678B1 (ko) Bis 억제제 스크리닝용 마커, 이를 포함하는 스크리닝 키트 및 이를 이용한 bis 억제제 스크리닝 방법
CN112534265A (zh) 预选个体的抗癌治疗及鉴定易患病个体的筛选方法