CN114432311B - 抗特发性肺纤维化化合物及其计算机预测筛选方法 - Google Patents

抗特发性肺纤维化化合物及其计算机预测筛选方法 Download PDF

Info

Publication number
CN114432311B
CN114432311B CN202111359694.4A CN202111359694A CN114432311B CN 114432311 B CN114432311 B CN 114432311B CN 202111359694 A CN202111359694 A CN 202111359694A CN 114432311 B CN114432311 B CN 114432311B
Authority
CN
China
Prior art keywords
leu
lys
ala
glu
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111359694.4A
Other languages
English (en)
Other versions
CN114432311A (zh
Inventor
聂怡初
邓文斌
刘焕彬
麦扬
刘赣
徐健
赵景新
谢芫
萧倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202111359694.4A priority Critical patent/CN114432311B/zh
Publication of CN114432311A publication Critical patent/CN114432311A/zh
Application granted granted Critical
Publication of CN114432311B publication Critical patent/CN114432311B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/496Non-condensed piperazines containing further heterocyclic rings, e.g. rifampin, thiothixene or sparfloxacin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/41Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having five-membered rings with two or more ring hetero atoms, at least one of which being nitrogen, e.g. tetrazole
    • A61K31/41641,3-Diazoles
    • A61K31/41781,3-Diazoles not condensed 1,3-diazoles and containing further heterocyclic rings, e.g. pilocarpine, nitrofurantoin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5044Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/10Screening for compounds of potential therapeutic value involving cells
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • General Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Toxicology (AREA)
  • Software Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Evolutionary Computation (AREA)
  • Analytical Chemistry (AREA)

Abstract

本发明涉及一种抗特发性肺纤维化化合物及其计算机预测筛选方法,属于药物研发技术领域。通过本发明的预测筛选方法,得到具有式I或II结构特征的抗特发性肺纤维化化合物可有效延缓肺组织中炎症与纤维化的发展进程,达到治疗特发性肺纤维化的效果。

Description

抗特发性肺纤维化化合物及其计算机预测筛选方法
技术领域
本发明涉及药物研发技术领域,特别是涉及一种抗特发性肺纤维化化合物及其计算机预测筛选方法。
背景技术
特发性肺纤维化是一种慢性进行性肺部疾病,其特征是进行性肺瘢痕和普通型间质性肺炎(UIP)。特发性肺纤维化是一种不常见的致命性肺部疾病,可造成肺容积缩小,并形成永久性肺纤维化疤痕,进而导致缺氧与肺功能不可逆性地持续衰退。目前特发性肺纤维化的发病机制仍旧不清晰,现有研究认为炎症可能仅具有辅助作用,多种异常生理过程均与特发性肺纤维化有关。
特发性肺纤维化可以从抗炎、抗纤维化、抗氧化以及氧疗等多个角度进行综合治疗。目前临床推荐的抗纤维化药物仅有两款,分别为尼达尼布以及吡非尼酮。尼达尼布可同时抑制包括血管内皮生长因子受体(VEGFRs)、血小板源性生长因子受体(PDGFRs)与纤维母细胞生长因子受体(FGFRs),是新一代治疗晚期肺癌及特发性肺纤维化的口服酪氨酸激酶抑制剂。尼达尼布通过抑制肺纤维化进程中起信号传导作用的生长因子受体发挥抗特发性肺纤维化作用。吡非尼酮则是强效的细胞因子抑制剂,通过抑制参与纤维化形成生长因子及其受体(如TGFβ1R,b-FGF,PDGFR),从而减少成纤维细胞增殖和胶原蛋白生成,最终发挥抗纤维化作用。然而,尼达尼布和吡非尼酮仅报道的副作用非常多,患者依从性非常差。
药物研发是一个风险大、周期长、成本高的领域。据统计,一款新药的研发通常需要花费5~10亿美金,需要消耗10~15年甚至更长的研发时间,而且有很大的偶然性和盲目性,许多制药企业一直致力于尝试运用数字化创新提高药物研究的成功率并降低研发成本。计算机辅助药物设计(简称CADD技术),是一种以计算机化学为基础,通过计算机的模拟来预测试和计算配体与受体生物大分子之间的关系,从而进行先导化合物的优化与设计。
自从1894年科学家第一次提出配体与受体的“锁钥模型”以来,经过科学家们多年潜心研究,目前CADD方法已经逐渐成熟并在多个疾病领域中得到应用,日益成为药物研究的核心技术之一。对于已知解析结构或者已有配体信息的靶点,基于合理药物设计的CADD正逐步体现出其优势,让科学家能充分的利用现有的研究信息提高药物开发的效率。CADD使新药的开发成为不同领域的新理论、新方法和新技术。
然而,目前并没有针对特发性肺纤维化采用CADD技术进行药物设计或筛选的研究报道,亟需采用CADD技术,针对更广泛的肺纤维化受体,设计开发出对肺纤维化多治疗靶点具有高效抑制、且毒副作用较低的抗肺纤维化先导化合物。
发明内容
基于此,有必要针对上述问题,提供一种抗特发性肺纤维化化合物,该化合物可有效延缓肺组织中炎症与纤维化的发展进程,达到治疗特发性肺纤维化的效果。
具有如下式I或II结构特征的化合物或其药用盐、水合物、立体异构体在制备用于治疗和/或预防特发性肺纤维化的药物中的用途:
本发明还公开了一种用于抗特发性肺纤维化的药物组合物,包括上述的化合物或其药学上可接受的盐、水合物、立体异构体,以及药学上可接受的辅料。
本发明还公开了一种抗特发性肺纤维化化合物的计算机预测筛选方法,包括以下步骤:
蛋白模型准备:获取与特发性肺纤维化相关的靶点蛋白的三维结构模型及其序列;
配体准备:选取Enamine数据库中分子量为370-960的候选化合物作为配体,构成筛选数据库;
分子对接:以Lamarckian genetic algorithm软件程序进行对接,设定蛋白为刚性,配体为柔性,并以ADT工具在配体和蛋白上增加了Koollman charges;同时根据靶点蛋白已知配体设置grid,使grid覆盖整个配体结合区域,并以的grid spacing和介电常数的距离相关函数计算结合自由能,获得ADT对化合物结合能的分析结果,按照结合能大小,由小到大进行排序,备用;
选取其中前20%的化合物与机器学习活性预测模型预测结果比对,选取虚拟对接与机器学习模型评分综合性得分最高的化合物进行后续的生物学验证;
建立机器学习模型:获取靶点蛋白已知配体的结构文件以及pIC50活性数据,将已知配体的活性数据转换为-log(pIC50),利用python中RDkit模块的MolecularDescriptorCalculator程序对已知配体进行分子特征的提取;利用sklearn模块的StandardScaler对所述分子特征进行标准化处理;再利用sklearn模块进行基于随机森林和RFE的组合特征选择;最后使用python中Scikit-Learn中的Support Vector Machine,AdaBoost,Random Forrest,Gradient Boosting,K-Nearest Neighbor以及BayesianRidge算法对已知配体数据进行拟合计算,得出用于活性筛选的机器学习模型;
虚拟筛选:按照上述对已知配体的处理方法,对筛选数据库中候选化合物进行分子特征的提取,代入上述机器学习模型中,进行拟合计算,得到各候选化合物的机器学习得分;
模型优化:综合各候选化合物的机器学习得分和结合能大小,整合得到虚拟活性值,选取虚拟活性值佳的候选化合物,以PGLuc-promCol1A2-A549细胞进行活性筛选,将获得的化合物细胞活性数据反馈到所述机器学习模型中,进行机器学习模型的优化,得优化机器学习模型;
化合物筛选:将筛选数据库中候选化合物进行分子特征的提取,代入上述优化机器学习模型进行分析,得到机器筛选结果,即得预测抗特发性肺纤维化化合物。
在其中一个实施例中,所述靶点蛋白包括:VEGFR1,VEGFR2,FGFR1,FGFR2,FGFR3,PDGFRα,TGFβ1R,VEGFR3和PDGFRβ。
在其中一个实施例中,所述VEGFR3的三维结构模型通过以下方法构建:获取VEGFR3蛋白的氨基酸序列,去除配体结合域以外的序列,保留重点结构相关序列,以VEGFR2三维结构为模板,通过SWISS-MODEL完成同源模拟;
所述PDGFRβ的三维结构模型通过以下方法构建:获取PDGFRβ蛋白的氨基酸序列,去除配体结合域以外的序列,保留重点结构相关序列,以FLT3三维结构为模板,通过SWISS-MODEL完成同源模拟。
在其中一个实施例中,所述标准化处理为:将选用的配体database进行加氢、设置为PH=7.4的状态;靶点蛋白文件去除原有的溶剂分子和配体分子、添加氢原子;设定好对接的网格范围及大小。
在其中一个实施例中,所述虚拟活性值Consensus score通过以下公式得到:
其中:
Targets表示指各靶点蛋白;
STargets表示各候选化合物针对靶点蛋白,分别根据模型计算得到的机器学习得分和根据该化合物对每个靶点的结合能计算得到的分数;
所述STargets按照以下标准评分:
所述排名通过以下方法得到:以所述筛选数据库中所有化合物针对每个靶点的结合能由低到高进行排位,机器学习的得分由高到低排列;某候选化合物在所述的排位中的顺序位置,即为该候选化合物的排名。
可以理解的,所述虚拟活性值佳的候选化合物即是指该数值较大,排名靠前的候选化合物,如得分排名在前20%的候选化合物。
在其中一个实施例中,所述pGLuc-promCol1A2报告基因A549细胞通过以下方法构建:
构建质粒:PCR扩增COL1A2基因序列,将扩增产物与Luc载体分别用NheI/HindIII双酶切,回收酶切产物,加入T4 DNA Ligase酶连接,将连接产物转化至DH5α感受态细胞,LB培养基培养,取阳性克隆,得COL1A2-荧光色素酶质粒,备用;
转染:使用Lipofectamine 2000转染试剂,Opti-MEM培养基,将上述pGLuc-promCol1A2质粒转染至A549细胞,即得。
在其中一个实施例中,所述转染步骤之后,还包括细胞稳定表型筛选步骤,所述稳定筛选按照以下方法进行:
转染后进行细胞传代,待细胞贴壁后用遗传霉素G418进行压力筛选,压力筛选后置于镜下观察,将每个细胞群圈出后以胰酶消化,得细胞团;收集细胞团以小孔板培养,继续用遗传霉素G418进行压力筛选,并挑选能正常增殖的细胞群进行传代,再以遗传霉素G418维持稳定培养后即可得高表达COL1A2的pGLuc-promCol1A2-A549细胞。
与现有技术相比,本发明具有以下有益效果:
本发明基于网络药理学,结合虚拟筛选以及机器学习活性预测等方法筛选与设计创新性的抗特发性肺纤维化先导化合物,并采用高效的细胞模型与动物模型进行药物活性评价。为了验证这些小分子的活性,以I型胶原蛋白为主要的指标,构建了荧光色素酶标记的CollagenIA2-A549细胞,在细胞水平上评价两轮共29个小分子化合物抑制成纤维细胞活化的能力。在这个过程中,我们将第一轮pGLuc-promCol1A2-A549细胞筛选的化合物数据代入机器学习模型中,对模型进行相应的优化,模型的假阳性率85%降低至66.7%。我们最终获得具有潜力的化合物Z103080500和Z104578368。化合物Z103080500(抑制率67.88%,50μM,36h,P<0.05)和Z104578368(抑制率69.54%,50μM,36h,P<0.05)能有效降低胶原蛋白含量,且在这个剂量下对pGLuc-promCol1A2-A549细胞的毒性较低。在博来霉素诱导的C57BL/6小鼠肺纤维化模型中,Z103080500与Z104578368灌胃给药50mg/kg能有效减少小鼠肺组织中炎症细胞的数量和α-SMA表达,胶原蛋白表达分别下降了67.15%和52.72%(P<0.05),IFN-γmRNA表达分别降低了54.87%和37.29%(P<0.05),IL-17mRNA表达分别降低了47.01%和49.38%(P<0.05)以及HYP表达分别下降了23.15%和15.24%(P<0.05)。细胞模型和动物模型实验初步证明了化合物Z103080500与Z104578368能有效延缓肺组织中炎症与纤维化的发展进程,达到治疗特发性肺纤维化的效果。综上所述,本研究采取了计算机辅助药物设计的方法发现了具有抗特发性肺纤维化潜力的先导化合物Z103080500与Z104578368,为治疗特发性肺纤维化提供了潜在的新途径。
附图说明
图1为pGLuc-promCol1A2质粒示意图;
图2为pGLuc-promCol1A2-A549细胞功能验证结果示意图;
图3为靶点验证结果示意图;
图4为VEGFR3和PDGFRβ的Ramachandran图示;
图5为VEGFR3和PDGFRβ二级结构预测示意图;
图6为VEGFR1/2、FGFR1/2/3和PDGFRα配体结合域结构叠合示意图;
图7为VEGFR1/2/3、FGFR1/2/3和PDGFRα/β的序列比对示意图;
图8为蛋白序列比对分析示意图;
图9为9种蛋白的关联性分析示意图;
图10为计算机预测Z103080500及Z104578368与目标靶点FGFR2的结合模式;
图11为Z103080500与Z104578368与其他靶点结合的方式示意;
图12为HE染色切片结果;
图13为Masson染色切片结果;
图14为Masson染色切片进行定量分析结果;
图15为α-SMA免疫荧光染色切片结果;
图16为目标靶点表达量的检测结果;
图17为羟脯氨酸含量测定结果;
图18为各组小鼠体重变化结果;
图19为各组小鼠生存率结果。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
以下实施例所用试剂,如非特别说明,均为市售可得;以下实施例所用方法,如非特别说明,均为本领域常规方法可实现。
实施例1
构建pGLuc-promCol1A2报告基因A549细胞。
1、构建pGLuc-promCol1A2报告基因A549细胞
1.1 PCR钓取人基因组
人源基因组模板的制备(基因组DNA纯化试剂盒,Promega,Cat.#A1125):收集人的细胞至干净的1.5mL EP管中。加入600μL裂解液,用移液枪反复放以裂解组织,直到可见的组织块消失,65°处理20min,加入3μL RNA酶,颠倒2-5次,37°处理30min,然后冷却至室温。加入200μL蛋白沉淀液并使用涡旋振荡器高速剧烈振荡20s,转移至冰上冷却5min;室温12 000rpm离心4min,形成白色致密的蛋白沉淀;小心移取上清(含DNA)至干净的1.5mLEP管中,加入600μL异丙醇,移取上清时勿碰到沉淀;轻轻上下颠倒混匀溶液,直至白色线状DNA形成块状沉淀。室温12 000rpm离心5min,此时可见白色DNA沉淀,小心弃去上清;加入600μL 70%乙醇,轻轻颠倒EP管数次清洗DNA 沉淀,室温12 000rpm离心2min;小心弃去上清,并将EP管倒置于干净的吸水纸上,自然干燥10~15min;加入100μL ddH2O,60℃烘箱中孵育1h以溶解DNA;DNA样品保存于-20℃冰箱。随后电泳检测基因组DNA,且未出现弥散条带,说明所提取人的基因组DNA很完整,没有RNA与蛋白质污染,也没有发生降解,因此,可用于作为模板扩增目的基因。
1.2 PCR扩增COL1A2
在0.2mL EP管中配制以下体系,模板原液稀释20倍后取0.5μL扩增COL1A2。
表1.COL1A2扩增体系
注:KOD Plus Neo DNA Polymerase购于东洋纺公司,货号:KOD 401。
混匀后,置于GeneAmp PCR System 2400型PCR扩增仪扩增。
COL1A2基因的扩增条件:94℃1min,98℃15s,58℃15s(30循环),68℃2min,68℃5min,16℃保存。
1.3 PCR产物回收
本法主要采用DNA凝胶回收试剂盒(DONGSHENG BIOTECH,Guangzhou)。PCR产物经1%凝胶电泳后,在紫外灯下,用手术刀切取含目的基因片段的凝胶条带至干净1.5mL EP管中,称重后,按100mg凝胶对应100μL溶液BD的比例向离心管中加入溶液BD。60℃水浴10min至凝胶完全溶化,水浴期间振荡混合3次。将溶液转移至DNA纯化柱中,静置2min,室温12000rpm离心1min,弃滤液。向柱上加入500μL溶液PE,室温12000rpm离心1min,弃滤液。重复上一操作一次。室温空柱12000rpm离心1min以彻底去除纯化柱中残留的液体。将柱子置于新的1.5mL EP管上,向柱中央加入30μL 60℃预热的无菌水,13 400g离心1min以洗脱出DNA。
1.4 PCR回收产物及载体双酶切
在2个无菌的0.2mL EP反应管,分别取COL1A2 PCR回收产物和pCDNA3.1+Luc载体各15μL,分别用NheI/HindIII双酶切,酶切体系如下。
表2.COL1A2双酶切体系
混匀后,37℃反应3h左右。
1.5酶切产物回收
在本法主要采用DNA凝胶回收试剂盒(DONGSHENG BIOTECH,Guangzhou)。酶切产物经1%凝胶电泳后,在紫外灯下,用手术刀分别切取含目的片段和载体的凝胶条带至干净的1.5mL EP管中,按100mg凝胶对应100μL溶液BD的比例向离心管中加入溶液BD。60℃水浴10min至凝胶完全溶化,水浴期间振荡混合3次。将溶液转移至DNA纯化柱中,静置2min,室温12 000rpm离心1min,弃滤液。向柱上加入500μL溶液PE,室温12 000rpm离心1min,弃滤液。重复上一操作一次。空柱12 000rpm离心1min以彻底去除纯化柱中残留的液体。将柱子置于新的1.5mL EP管上,向柱中央加入30μL 60℃预热的无菌水,13400g离心1min以洗脱出DNA。
1.6目标片段与载体连接
向0.2mL EP管中加入以下试剂T4 DNA Ligase酶(TaKaRa,Cat.D2011A),16℃连接1h。
表3.目标片段与载体连接体系
1.7连接产物的转化
冰浴中将5μL连接产物分别加入至50μL DH5α感受态细胞中。轻轻旋转混匀,冰浴30min。42℃水浴热休克90s。快速将管转移至冰浴中,冰浴2min。分别加入200μL LB培养基,混匀,37℃、200rpm振荡培养1h。于超净工作台中,将菌液均匀涂布于含氨苄青霉素(Amp)(100μg/mL)的LB平板上,室温下放置,至液体吸收。倒置平板,转移入37℃生化培养箱过夜培养。得到如图1所示pGLuc-promCol1A2质粒。
1.8质粒酶切鉴定阳性克隆
从平板上挑取若干单克隆于3mL LB管中摇床过夜培养。质粒提取则用1.5mL EP管收集3μL菌液,12000rpm离心1min,去上清。加入250μL溶液I/RNase A混合液,重悬菌体。加入250μL溶液II,温和反复颠倒混匀6次,室温放置2min。加入350μL溶液III,温和反复颠倒混匀6次。12000rpm离心10min,小心吸去上清至DNA纯化柱中,静置2min。12000rpm离心1min,弃滤液。加入500μL溶液PB至柱中,12 000rpm离心1min,弃滤液。加入500μL溶液W至柱中,12 000rpm离心1min,弃滤液。重复一次。空柱12 000rpm离心3min。将柱取出置于新的1.5mL EP管中,加入50μL无菌水(60℃预热),静置2min,13 400rpm离心1min以洗脱出质粒。酶切鉴定所提取质粒,酶切反应体系如下。37℃酶切2h。酶切产物以含溴化乙锭(EB)的1%琼脂糖凝胶电泳分离,UVP凝胶成像系统成像。
表4.质粒酶切体系
1.9 G418筛选的细胞杀伤曲线
为了确保G418能筛选出质粒转染后的细胞,我们进行了G418对细胞的杀伤曲线实验。第一天把A549细胞铺于96孔板,第二天加不同浓度的G418于细胞培养基中,浓度分别为0、100、200、300、400、500、600、700、800、900、1000μg/mL,每个浓度6个平行孔。观察一周,7天后0-200μg/mL G418浓度处理的细胞有不同孔数细胞存活,而300μg/mL及以上浓度G418处理的细胞全部死亡。因此,选择300μg/mL的G418为最佳筛选浓度。
1.10质粒细胞转染
转染前一天对A549细胞进行传代,使其汇合度为70%-80%,转染采用Lipofectamine 2000(invitrogen,Cat.No.11668019)转染试剂,转染时使用Opti-MEM(invitrogen,Cat.No.31985070)培养基。使用是24孔板,每孔加入1ug质粒,稀释到100μlOpti-MEM培养基为A液,取1μl Lipofectamine 2000溶解于Opti-MEM培养基为B液,B液混合5分钟后,A液和B液混合,静止20分钟后加到细胞培养板中。以上操作是每孔用量。孵育4-6小时后换为细胞生长培养基。
1.11细胞转染后的稳定筛选
转染24h后进行细胞传代,控制细胞密度为其生长表面积的30%,24h待细胞贴壁后往细胞培养基中添加G418使其终浓度为300μg/mL。压力筛选1周,中间更换1次含300μg/mL G418的培养基。1周后在倒置显微镜下观察,把单独每一个细胞群用标记笔在细胞培养板上圈出。用0.25%胰酶消化画圈的细胞群,每一团细胞收集到新的24孔板的一个孔培养。继续用300μg/mL的G418压力筛选1周,做亚克隆筛选。再用倒置显微镜下观察,挑选出正常生长细胞群传代。用50μg/mL的G418维持一个月稳定培养。
2、pGLuc-promCol1A2-A549细胞功能验证。
2.1功能验证
培养pGLuc-promCol1A2-A549细胞,并接种于96孔板中,生长12h。给予PBS、TGFβ1(10ng/μL、5ng/μL和1ng/μL)、FGF1(10ng/μL、5ng/μL和1ng/μL)、或PDGFα(10ng/μL、5ng/μL和1ng/μL)(California),分别培养12、24或36h;给予PBS,吡非尼酮(10μM、1μM和0.5μM),尼达尼布(10μM、1μM和0.5μM),地塞米松(10μM、1μM和0.5μM)(Enamine,UKRAINE),分别培养12、24或36h,利用Luciferase Reporter Gene Assay Kit(/>Guangzhou)进行标准处理后,使用多功能酶标仪(PerkinElmer,Finland)在570nm处进行测定。
验证结果如图2所示,酪氨酸激酶激动剂FGF1(10ng/μL,36h)上调73.29%,P<0.05;酪氨酸激酶激动剂TGFβ1(10ng/μL,12h)上调54.25%,P<0.05;PDGFα(10ng/μL,36h)上调56.53%,P<0.05,拮抗剂尼达尼布(10μM,24h)抑制率87.24%,P<0.05;拮抗剂吡非尼酮(10μM,36h)抑制率84.72%,P<0.05;拮抗剂地塞米松(50μM,36h)抑制率44.95%,P<0.05。
2.2靶点验证
培养pGLuc-promCol1A2-A549细胞和A549细胞,并接种于100mm培养皿中,生长24h。使用细胞总RNA提取试剂盒(离心柱型)(广州昂飞生物科技有限公司,广州)提取总RNA;利用Fast cDNA合成试剂盒对提取的总RNA进行逆转录;使用热启动荧光定量PCR试剂盒,加入引物(引物序列如下表所示)后进行样本目标靶点表达量的检测。
表5.引物序列
Primer Sequence of primer(5'-3') 序列号
M-GAPDH-S CCTCGTCCCGTAGACAAAATG SEQ ID NO.10
M-GAPDH-A TGAGGTCAATGAAGGGGTCGT SEQ ID NO.11
H-VEGFR1-S CAGCAGGTGCTTGAAACCGTAG SEQ ID NO.12
H-VEGFR1-A CTCAGTCGCAGGTAACCCATCT SEQ ID NO.13
H-VEGFR2-S ACCCCTTGAGTCCAATCACACA SEQ ID NO.14
H-VEGFR2-A CTTCCTCCAACTGCCAATACCA SEQ ID NO.15
H-VEGFR3-S CAAGATGTTTGCCCAGCGTAG SEQ ID NO.16
H-VEGFR3-A TCCCTCCACAAACTCGGTCC SEQ ID NO.17
H-FGFR1-S GAGGCTACAAGGTCCGTTATGC SEQ ID NO.18
H-FGFR1-A CCAATCTTGCTCCCATTCACCT SEQ ID NO.19
H-FGFR2-S AAGCAGGAGCATCGCATTG SEQ ID NO.20
H-FGFR2-A GCTGGGCATCACTGTAAACCT SEQ ID NO.21
H-FGFR3-S TGGAGCCTGGTCATGGAAAG SEQ ID NO.22
H-FGFR3-A CCTTGTCGGTGGTGTTAGCG SEQ ID NO.23
H-PDGFRA-S CCTTCAATGGACTTACCCTGGAG SEQ ID NO.24
H-PDGFRA-A GCCCGCACCTCTACAACAAA SEQ ID NO.25
H-PDGFRB-S TGACTGACTTCCTCTTGGATATGC SEQ ID NO.26
H-PDGFRB-A AAATTGTAGTGTGCCCACCTCTC SEQ ID NO.27
H-TGFB1R-S ATCCTTCAAACGTGCTGACATC SEQ ID NO.28
H-TGFB1R-A TGCCTTCCTGTTGACTGAGTTG SEQ ID NO.29
M-IL17A-S ATCTGTGTCTCTGATGCTGTTGCT SEQ ID NO.30
M-IL17A-A CGTGGAACGGTTGAGGTAGTCT SEQ ID NO.31
M-IFNγ-S AGCAAGGCGAAAAAGGATGC SEQ ID NO.32
M-IFNγ-A TCATTGAATGCTTGGCGCTG SEQ ID NO.33
结果如图3所示,酪氨酸激酶受体以及TGFβ1R通常在HDF细胞中高表达,以HDF为参照,对比A549细胞以及pGLuc-promCol1A2-A549细胞中各靶点表达量的差别。从数据中我们看到虽然改造后细胞各靶点表达量相对HDF较低,但pGLuc-promCol1A2-A549细胞中各靶点均有表达,其中VEGFR3表达量较高。因此,改造后的细胞可供我们后续的实验验证。
实施例2
联用虚拟筛选和机器学习模型筛选抗特发性肺纤维化先导化合物。
1、靶点序列、空间结构以及生理作用关联性
筛选和设计同时针对九个靶点的多靶点抗肺纤维化抑制剂存在难度,我们通过分析九个靶点的ATP配体结合域空间结构相似性、蛋白序列相似性和生理通路关联性,评估筛选和设计的可行性。
1.1方法。
从Protein Data Bank((https://www.rcsb.org/)获取靶点蛋白的3D结构及其序列,分别为VEGFR1(PDB:3HNG),VEGFR2(PDB:2OH4),FGFR1(PDB:5A46),FGFR2(PDB:3RI1),FGFR3(PDB:4K33),PDGFRα(PDB:5GRN),TGFβ1R(PDB:3TZM)。使用开源版的PyMOL 2.4软件将模型中的水分子和配体等与靶点无关的元素移除,并选取保留其中的ATP配体结合域。
上述括号内编号为protein data bank网站(https://www.rcsb.org/)中相应文件编号。
由于VEGFR3和PDGFRβ暂无已解析的模型,我们需要通过同源模拟构建VEGFR3和PDGFRβ的三维模型。VEGFR3(identifier:P17948-1)和PDGFRβ(identifier:P16234-1)的蛋白序列从Uniprot中获取(https://www.uniprot.org/),同时需要去除配体结合域以外的序列,保留重点结构相关序列,VEGFR2保留序列如SEQ ID NO.1所示,VEGFR1保留序列如SEQID NO.2所示,FGFR2保留序列如SEQ ID NO.3所示,TGFβ1R保留序列如SEQ ID NO.4所示,FGFR1保留序列如SEQ ID NO.5所示,FGFR3保留序列如SEQ ID NO.6所示,PDGFRa保留序列如SEQ ID NO.7所示,PDGFRb保留序列如SEQ ID NO.8所示,VEGFR3保留序列如SEQ ID NO.9所示。
同源模拟通过SWISS-MODEL(https://swissmodel.expasy.org/)完成,其中参考模板分别为VEGFR3(Template:VEGFR2,PDB:4AGC),PDGFRβ(Template:FLT3,PDB:4RT7)。完成模型的构建后使用RAMPGE(http://www-cryst.bioc.cam.ac.uk/rampage/)进行拉氏图的分析;verify 3D则使用SAVESv6.0(https://saves.mbi.ucla.edu/)完成,作图工具为Origin 9.0;使用PSIPRED(http://bioinf.cs.ucl.ac.uk/psipred/)中的PSIPRED 4.0,DISOPRED3,MEMSAT-SVM和pGen THREADER模块进行紊乱蛋白分析。(https://string-db.org/)
随后将上述靶点进行结构叠合和序列比对,再通过String数据库分析各靶点在生理通路上的关联性。
1.2结果。
(1)VEGFR3和PDGFRβ的同源建模以及Verify三维结构验证。
使用SAVESv6.0完成VEGFR3和PDGFRβ的Verify 3D验证。VEGFR3的总分是144.17,高于预期的高分。PDGFRβ总分为113.98,高于预期的低分,接近预期的高分。因此,Verify3D的结果证明VEGFR3和PDGFRβ的结构是合理可靠的。VEGFR3和PDGFRβ的拉氏图和PSIPRED二级结构验证结果分别如图4和5所示,图4为VEGFR3(图4中A部分)和PDGFRβ(图4中B部分)的Ramachandran图示,其中,VEGFR3中处于合理构象的氨基酸残基占比为94.8%,处于不合理构象的仅占2.0%,处于允许构象的占3.3%;相似的,PDGFRβ中处于合理构象的氨基酸残基占93.8%,处于不合理构象的仅占0.4%,处于允许构象的占5.9%。图5为VEGFR3和PDGFRβ二级结构预测,根据PSIPRED的预测,VEGFR3和PDGFRβ中不存在紊乱的氨基酸残基,结构较为稳定。
(2)靶点序列、空间结构以及生理作用关联性。
已解析的VEGFR1/2、FGFR1/2/3、PDGFRα、TGFβ1R的三维结构模型的配体结核域高度相似,同时该区域的蛋白序列相对保守,同时这些靶点呈现出的生理作用关联性较强,VEGFR3和PDGFRβ同源模拟结果较为可信。
通过对靶点模型进行叠合分析(图6,图7)以及蛋白序列比对分析(图8),图6为VEGFR1/2、FGFR1/2/3和PDGFRα配体结合域结构叠合。黑色表示一致的氨基酸残基,灰色表示结构性质类似的氨基酸残基(图中仅标记配体结核域的氨基酸残基类似度)。(a)为不同角度的VEGFR1/2、FGFR1/2/3和PDGFRα三维模型结构叠合。结果显示VEGFR1/2、FGFR1/2/3和PDGFRα空间结构较为类似,同时配体结合域上的相同或类似的氨基酸残基数量较多。(b)为VEGFR1/2、FGFR1/2/3和PDGFRα配体结合域结构叠合。结果显示,与配体ATP或抑制剂相结合的区域空间结构类似,氨基酸残基较为保守。图7为VEGFR1/2/3、FGFR1/2/3和PDGFRα/β的序列比对。颜色范围从深到浅,表明氨基酸残基从相似到不相关。在配体结合域中,相同残基的比例为32.3%,相似残基的比例为54.5%。这表明空腔的氨基酸残基是保守的。
即VEGFRs、FGFRs和PDGFRs配体结核域存在一定的相似性。同时,String数据库分析表明,靶点间生理作用关联密切,如图8所示,图8为从String数据库中筛选出9种蛋白的关联性分析。上述结果表明,设计出同时针对VEGFRs,FGFRs,PDGFRs和TGFβ1R的多靶点先导化合物是可行的。
2、Autodock虚拟筛选
2.1分子对接。
为了确保数据库的多样性和效率,选择Enamine(https://enamine.net/hit-finding)中的Diversity Libraries,同时切割出分子量在370-960的配体数据库(约60000个化合物)。Docking则选用了Autodock 4.2中的Lamarckian genetic algorithm。标准对接程序用于柔性配体和刚性蛋白。利用ADT工具在配体和的蛋白上增加了Koollmancharges。同时,根据靶点上已有的配体设置grid,使grid可以覆盖整个配体结合区域。我们用的grid spacing和介电常数的距离相关函数计算结合自由能。所有其他参数都使用默认设置。最后,用ADT对结合能最小的化合物结构文件进行分析。
2.2建立机器学习模型。
通过已知配体的结构与生理活性之间的关系,构建出通过候选小分子结果信息预测其活性的机器学习模型。具体如下:
从DrugBank数据库(https://go.drugbank.com/)和Selleck(https://www.selleck.cn/)中获取靶点现有配体的结构文件以及pIC50活性数据。我们将配体的活性数据转换成-log(pIC50)形式。利用python中RDkit模块的MolecularDescriptorCalculator程序对现有配体以及筛选数据库进行分子特征的提取。利用sklearn模块的StandardScaler对分子特征进行标准化处理。利用sklearn模块进行基于随机森林和RFE的组合特征选择。
最后使用python中Scikit-Learn中的Support Vector Machine(SVM),AdaBoost(ADB),Random Forrest(RF),Gradient Boosting(GDB),K-Nearest Neighbor(KNN)以及Bayesian Ridge(BR)算法分别对现有配体数据进行拟合计算,最终得出用于活性筛选的机器学习模型。
之后,我们利用机器学习模型选取配体数据库中活性值最大的配体进行分析。具体如下:
从各数据库中收集各靶点已知配体的相关信息,并成功构建机器学习模型。我们随机地将80%的配体分给训练组,20%的配体分给测试组。随后我们使用python中Scikit-Learn中SVM、ADB、RF、GDB、KNN和BR算法进行建模,最终获得多个机器学习模型,我们发现ADB、RF和GDB等含有多个分类器的集成算法的性能优于仅有一个分类器的单一算法,集成算法的训练集和测试集的判定系数均大于0.85。机器学习模型预测的数据处理与虚拟筛选数据处理方法一致。
2.3虚拟筛选。
再根据候选化合物在每个靶点的排位,结合自由能由低到高排位进行给分,根据如下设定的评分规则计算虚拟活性值Consensus score,结合经验挑选出综合评分高且具有潜力的化合物。
其中:
Targets表示指各靶点蛋白;
STargets表示各候选化合物针对靶点蛋白,分别根据模型计算得到的分数和根据该化合物对每个靶点的结合自由能计算得到的分数,单个靶点的一次虚拟筛选被认为是一次独立的计算,单个机器学习模型对单个靶点的预测被视为一次独立的计算;
所述STargets按照以下标准评分:
所述排名通过以下方法得到:以所述筛选数据库中所有化合物针对每个靶点的结合自由能由低到高进行排位,机器学习的得分由高到低排列;某候选化合物在所述的排位中的顺序位置,即为该候选化合物的排名。
最终,我们从第一轮计算机筛选后的前100名化合物中挑选了20个化合物(如下表),以实施例1的PGLuc-promCol1A2-A549细胞进行后续细胞实验。具体操作如下:
从Enamine(https://enamine.net/hit-finding)购买化合物。培养PGLuc-promCol1A2-A549细胞,接种于96孔板中,生长12min。给与PBS以及化合物50μM,分别培养12、24、或36h。利用Luciferase Reporter Gene Assay Kit(Guangzhou)进行处理后,使用酶标仪在570nm波长处进行测定。
表6.第一轮计算的综合性评分(Consensus score)结果
/>
细胞实验结果显示,化合物Z16441565(抑制率58.78%,50μM,36h,p<0.05),Z131775190(抑制率48.70%,50μM,36h,P<0.05)和Z45361437(抑制率72.29%,50μM,36h,P<0.05)表现相对较好,荧光色素酶的表达量较低,这提示这些化合物能有效降低细胞模型中胶原蛋白的表达。
我们需要排除由于毒副作用致死细胞,从而降低了胶原蛋白表达的化合物。因此,我们将上述化合物进行CCK8实验。实验方法如下:
使用CCK-8Cell Proliferation and Cytotoxicity Assay Kit(Solarbio LifeSciences,Beijing)进行化合物细胞毒性的测试。接种不同浓度的PGLuc-promCol1A2-A549细胞,按照标准处理获得标准曲线。培养PGLuc-promCol1A2-A549细胞,接种于96孔板中,生长24h。分别加入6.25、12.5、25、50或100μM的化合物和PBS,培养24h后加入10μL CCK8试剂,孵育3h,用酶标仪检测450nm处吸光值。
CCK8实验表明,化合物Z16441565(致死率52.95%,50μM,36h,P<0.05),Z131775190(致死率41.87%,50μM,36h,P<0.05)和Z45361437对A549细胞毒性均较大(致死率78.70%,50μM,36h,P<0.05)。
经过数据分析处理后,我们得到第一轮20个化合物数据,其中假阳性率为85%。经过Autodock虚拟筛选以及机器学习模型综合评分后,候选先导化合物的假阳性率仍旧比较高,同时对A549细胞毒副作用相对较大。
2.4模型优化。
在进行PGLuc-promCol1A2-A549细胞筛选后,将实验结果为阴性的化合物作为惩罚项,代入到机器学习模型中,从而获得优化后的机器学习模型。
2.5化合物筛选。
优化后的机器学习模型对处理后的Enamine数据库重新进行预测。结合机器学习最新的预测结果以及Autodock的筛选结果,我们从中挑选出9个化合物(如下表),即为预测抗特发性肺纤维化化合物。
表7.第二轮计算的综合性评分(Consensus score)结果
实施例3
选取上述9个候选化合物,进行后续的细胞验证实验。
选取表7化合物,进行了PGLuc-promCol1A2-A549细胞筛选以及细胞毒性检测。第二轮9个化合物的细胞模型验证结果如图9所示。实验数据表明,假阳性率约为66%,明显优于第一轮筛选的实验。这提示我们根据实验数据不断地调整筛选的模型,将有助于提高筛选的准确率。
我们对两轮表现较好的候选化合物做了荧光色素酶浓度梯度检测,化合物Z103080500(抑制率67.88%,50μM,36h,P<0.05)和Z104578368(抑制率69.54%,50μM,36h,P<0.05)在能有效降低胶原蛋白含量。同时化合物Z103080500(致死率29.84%,50μM,36h,P<0.05)和Z104578368(致死率29.93%,50μM,36h,P<0.05)对A549细胞毒性较低。
因此我们挑选如下结构式I和II的化合物Z103080500和Z104578368进行后续的动物实验。
根据ADT分析的结果,Z103080500与Z104578368与目标靶点均具有较好的结合潜力。以靶点FGFR2(PDB:3RI1)为例,Z103080500与Z104578368被良好的锁定在疏水性空腔内。Z103080500与Z104578368与疏水性空腔内的残基形成紧密的结合力,图10为计算机预测Z103080500及Z104578368与目标靶点FGFR2的结合模式。由于靶点过多,Z103080500与Z104578368与其他靶点结合的方式见图11,其中A-H分别为化合物Z103080500分别与靶点VEGFR1(PDB:3HNG)、VEGFR2(PDB:2OH4)、VEGFR3(Template:VEGFR2,PDB:4AGC)、FGFR1(PDB:5A46)、FGFR2(PDB:3RI1)、FGFR3(PDB:4K33)、PDGFRα(PDB:5GRN)、PDGFRβ(Template:FLT3,PDB:4RT7)、TGFβ1R(PDB:3TZM)的结合方式,I-R分别为化合物Z104578368分别与靶点VEGFR1(PDB:3HNG)、VEGFR2(PDB:2OH4)、VEGFR3(Template:VEGFR2,PDB:4AGC)、FGFR1(PDB:5A46)、FGFR2(PDB:3RI1)、FGFR3(PDB:4K33)、PDGFRα(PDB:5GRN)、PDGFRβ(Template:FLT3,PDB:4RT7)、TGFβ1R(PDB:3TZM)的结合方式。
机器学习模型评分结果如表8所示,Z103080500与Z104578368也同样具有较好生物活性。对比尼达尼布,Z103080500与Z104578368能同时结合TGFβ1R,阻断Smad通路,减少胶原蛋白的分泌,从而抑制肺纤维化的发生。对比吡非尼酮,Z103080500与Z104578368能同时结合VEGFRs、FGFRs和PDGFRs,抑制各类纤维化因子的作用。因此,Z103080500与Z104578368与尼达尼布以及吡非尼酮相比抗肺纤维化靶点的亲和力更多靶点。
表8.虚拟筛选及机器学习模型预测Z103080500及Z104578368生物活性
实施例4
博来霉素诱导的C57BL/6小鼠肺纤维化模型验证先导化合物的疗效。
1、肺纤维化小鼠模型的构建与给药
配制博来霉素溶液:向15mg的博来霉素包装瓶中注射7500uL生理盐水,避光操作使用。配制1%戊巴比妥钠:5mg戊巴比妥钠与5mL生理盐水混匀后,避光放置4℃冰箱保存。动物实验分组:野生型小鼠随机分为正常对照组、肺纤维化模型组、尼达尼布组、吡非尼酮组、尼达尼布联用吡非尼酮组、高浓度Z103080500组(50mg/kg)、低浓度Z103080500组(12.5mg/kg)、高浓度Z104578368组(50mg/kg)和低浓度Z104578368(12.5mg/kg)。先用生理盐水将保存的戊巴比妥钠稀释100倍,成1%的戊巴比妥钠。每只小鼠按0.005mL/g腹腔注射1%戊巴比妥钠麻醉,待小鼠被麻醉后,用胶带将小鼠四肢固定在泡沫板上,用绳子一头套上小鼠牙齿,另一端拉伸一定长度,使小鼠颈部呈现一定拉伸的状态,和头部保持同一直线上,用专用的喉镜挑起会厌,看到一张一合的声门,再用22G蓝色套管针插进去,插进去后,把针拔出来,往套管打气,验证是否插对位置,如果插进气管,打气后小鼠心跳会马上停止跳动,如果插进食管,打气后,观察小鼠心跳,无明显改变,而且小鼠肚子可能会因为打气过多,肚子会鼓起来。判断插管成功后,用移液枪往套管针中加50μL配制好的博来霉素,博来霉素现配现用,再用1mL注射器往套管打针0.2mL左右空气,保证液体充分进入肺部,最后将小鼠放置笼内。
造模后第三天进行灌胃给药。按照分组,尼达尼布组每天给予0.3mL 50mg/kg的尼达尼布,吡非尼酮组每天给予0.3mL 100mg/kg的吡非尼酮,尼达尼布联用吡非尼酮组每天给予0.3mL 50mg/kg的尼达尼布和100mg/kg的吡非尼酮,高浓度Z103080500组每天给予0.3mL 50mg/kg的Z103080500,低浓度Z103080500组每天给予0.3mL 12.5mg/kg的Z103080500,高浓度Z104578368组每天给予0.3mL 50mg/kg的Z104578368,低浓度Z104578368组每天给予0.3mL 12.5mg/kg的Z104578368,连续给药21天后取肺组织检测。
2、组织切片包埋
准备预冷的4%多聚甲醛。头颈脱臼处死小鼠剪开腹腔,将肝挪开,剪破隔膜,肺立即塌陷,再剪开颈、胸、使气管、心脏、肺完全暴露出来。在气管上端用眼科剪剪开一个小口,然后用1mL注射器接好平头不锈钢进样针,吸取预冷好的4%多聚甲醛,沿着气管开口插进去,用绳子沿气管下面将平头不锈钢进样针绑紧在气管里,将4%多聚甲醛打进肺部,拔出平头不锈钢进样针,立刻用绳子将气管绑紧,以防进入肺部的4%多聚甲醛流漏出来。用眼科剪将肺分离出来,浸泡于新鲜4%多聚甲醛中固定。将已经用4%多聚甲醛固定的肺组织用流水冲洗后脱水,依次在梯度酒精(70%、80%、90%、95%、100%、100%)中进行充分浸泡20min。将组织进行透明,浸泡在乙醇和二甲苯(1:1)的混合溶液中20min,然后将其转移到二甲苯Ⅰ、二甲苯Ⅱ、二甲苯Ⅲ溶液中,每次40min,直至组织透明。将透明的组织浸入石蜡三次,2h。将浸好蜡的组织于包埋机内进行包埋。先将融化的蜡放入包埋框,待蜡凝固之前将组织从脱水盒内取出按照包埋面的要求放入包埋框并贴上对应的标签。于-20°冻台冷却,蜡凝固后将蜡块从包埋框中取出并修整蜡块。将修整好的蜡块置于石蜡切片机切片,厚4μm。切片漂浮于摊片机40℃温水上将组织展平,载玻片将组织捞起,60℃烘箱内烤片。水烤干蜡烤化后取出常温保存备用。
3、HE染色
将肺组织的石蜡切片进行脱蜡,将石蜡切片依次放入二甲苯Ⅰ(15min),二甲苯Ⅱ(15min)。将组织切片进行水化,将切片依次放入梯度酒精(100%、100%、95%、90%、80%、70%、50%),每次浸泡5min。将水化后的切片浸泡在苏木素中进行染色10min,然后用dd-H2O进行冲洗,浸入1%盐酸2s用dd-H2O进行冲洗组织切片,再依次将组织切片浸泡在酒精(50%、70%、80%)和伊红溶液中,每次浸泡2min。将染色完毕后的组织切片进行脱水,依次放到梯度酒精(80%、90%、95%、100%、100%),每次浸泡2min。将组织切片依次浸泡在二甲苯Ⅰ,二甲苯Ⅱ,每次浸泡15min。将组织切片用中性树脂进行封片,镜检。
HE染色切片结果如图12所示,结果显示,化合物Z103080500与Z104578368高浓度组(50mg/kg)的炎症细胞明显减少。同时Z103080500与Z104578368高浓度组表现均优于低浓度组(12.5mg/kg),且表现不差于尼达尼布+吡非尼酮联用组(P>0.05)。HE染色切片提示化合物Z103080500与Z104578368能有效延缓肺组织中炎症发生进程,达到治疗特发性肺纤维化的效果。
4、Masson染色
石蜡切片脱蜡至水:依次将切片放入二甲苯Ⅰ20min-二甲苯Ⅱ20min-无水乙醇Ⅰ5min-无水乙醇Ⅱ5min-75%酒精5min,自来水洗。重铬酸钾染色:切片入重铬酸钾浸泡过夜,自来水洗。铁苏木素染色:铁苏木素A液与B液等比混合成铁苏木素染液,切片入铁苏木素3min,自来水洗,分化液分化,自来水洗,返蓝液返蓝,流水冲洗。丽春红酸性品红染色:切片入丽春红酸性品红浸染5-10min,自来水漂洗。磷钼酸染色:磷钼酸水溶液浸染1-3min。苯胺蓝染色:磷钼酸之后不用水洗,直接入苯胺蓝染液染3-6min。分化:切片用1%冰醋酸分化,两缸无水乙醇脱水。透明封片:切片放入第三缸无水乙醇5min,二甲苯5min透明,中性树胶封片。显微镜镜检,图像采集分析。
Masson染色切片结果如图13所示,结果显示,Masson染色切片与HE染色切片结果基本一致,化合物Z103080500(抑制率67.15%,P<0.05)与Z104578368(抑制率52.72%,P<0.05)高浓度组(50mg/kg)的胶原蛋白含量明显减少。同时Z103080500与Z104578368高浓度组(50mg/kg)的Masson染色切片显示肺组织结构较为正常,没有发生明显的结构改变,但仍分泌少量的胶原蛋白。
对Masson染色切片进行定量分析,结果表明Z103080500高浓度组(50mg/kg)胶原蛋白含量与尼达尼布+吡非尼酮联用组胶原蛋白含量相当。Z104578368高浓度组(50mg/kg)的胶原蛋白含量则略高于尼达尼布+吡非尼酮联用组(P<0.05),显著低于造模组(P<0.05)(图14A)。Ashcroft score评分与上述一致(图14B)。
5、α-SMA免疫荧光染色
室温4%多聚甲醛固定20min,冷PBS漂洗3次,每次5min。0.25%Triton X-100破膜处理15min,冷PBS漂洗3次,每次5min。再用5%BSA封闭50min,吸干液体。加入5%BSA稀释的一抗(1:100稀释),振荡两次,4℃恒温孵育过夜。用冷PBS漂洗4次,每次5-10min,避光加入5%BSA稀释的荧光二抗(1:100稀释),振荡两次,37℃恒温孵育30min,冷PBS漂洗4次,每次5-10min。用DAPI进行细胞核染色3-5min,用PBS液漂洗2-3次,每次3-5min。封片,观察,拍照。
α-SMA免疫荧光染色切片结果如图15所示,显示化合物Z103080500与Z104578368高浓度组(50mg/kg)和低浓度组(12.5mg/kg)均能降低α-SMA的表达。这说明化合物Z103080500与Z104578368能有效抑制纤维化的进程。
6、IFN-γ、IL-17实时荧光定量PCR实验
取出各组肺组织剪碎,随后先加入Trizol并充分匀浆。使用组织总RNA提取试剂盒(离心柱型)(广州昂飞生物科技有限公司,广州)提取总RNA;利用Fast cDNA合成试剂盒对总RNA进行逆转录;使用热启动荧光定量PCR试剂盒,加入各靶点引物在PCR仪中进行样本目标靶点表达量的检测。
数据表明化合物Z103080500与Z104578368高浓度组(50mg/kg)能有效降低IFN-γ和IL-17的mRNA表达(图16A,图16B)。对比模型组,其中化合物Z103080500高浓度组与尼达尼布+吡非尼酮联用组效果相当,分别降低了54.87%和60.54%IFN-γ的mRNA表达。化合物Z103080500高浓度组与尼达尼布+吡非尼酮联用组分别降低了47.01%和50.19%IL-17的mRNA表达。化合物Z104578368高浓度组则略差于尼达尼布+吡非尼酮联用组,分别降低了37.29%IFN-γ和49.38%IL-17的mRNA表达。这与Masson染色切片的结果较为接近。
7、羟脯氨酸含量测定
试剂一:临用时将试剂一粉剂先加甲液10mL充分溶解,从瓶口向内看,完全溶解,然后再加乙液20mL充分混匀。试剂三:临用时将试剂三粉剂一支加到30mL溶剂中充分溶解。100μg/mL标准贮备液的配制:测试前将一支标准品用双蒸馏水溶解后定容至50mL。5μg/mL标准应用液的配制:取100μg/mL标准贮备液1mL加双蒸馏水定容至20mL,现配现用。
精确称取组织湿重30~100mg放入试管中,精确加水解液1mL,混匀。加盖后95℃或者沸水浴水解20min(水解10分钟时混匀一次,目的是使水解更充分)。调节PH值至6.0~6.8左右:将各试管流水冷却后各管加指示剂10μL,摇匀;各试管准确加入调PH甲液1.0mL,混匀(此时溶液应为红色);用200μL的加样器吸取调PH的乙液向各管内逐滴小心加入调PH的乙液,每滴加入后均要混匀,直至液体中指示剂的颜色变成黄绿色(亦即红色消失时)。此时PH值在6.0~6.8左右(约加入调PH乙液100~500μL左右),加调PH乙液时,每加一滴均要混匀,为防止液体外溢,如果没有带盖的玻璃磨口试管,可用普通玻璃试管代替,每次混匀时可用塑料薄膜或者冰箱保鲜膜压住试管口,充分旋涡混匀即可。然后加双蒸馏水至10mL,混匀;取3~4mL稀释的水解液加适量活性炭(约20~30mg左右,以上清液离心后澄清无色为准),混匀,3500转/分离心10min,小心取上清1mL检测。随后按照下表进行配液检测。
表8.羟脯氨酸检测体系
混匀,静置10min。随后空白管、标准管和测定管中分别加入试剂二0.5mL。混匀,静置5min。空白管、标准管和测定管中分别加入试剂三0.5mL。混匀,60℃水浴15min,冷却后,3500转/分离心10min,取上清于波长550nm,1cm光径,双蒸水调零,测定各管吸光度值。羟脯氨酸含量按照公式计算。
羟脯氨酸含量(μg/mg湿重)=(测定OD值-空白OD值)/(标准OD值-空白OD值)×标准品含量(5μg/mL)×水解液总体积(10mL)/组织湿重(mg)
羟脯氨酸含量测定结果如图17所示,数据表明,化合物Z103080500与Z104578368高浓度组(50mg/kg)能有效降低羟脯氨酸的表达。其中化合物Z103080500与尼达尼布+吡非尼酮联用组效果相当(P>0.05),分别降低23.15%和27.62%羟脯氨酸的表达。化合物Z104578368则略差于尼达尼布+吡非尼酮联用组,降低了15.24%羟脯氨酸的表达(图17)。
模型组、阳性对照组和实验组的小鼠体重均出现了不同程度的下降。三个小组体重下降没有明显差异,空白组的小鼠体重则稳步上升(图18)。从死亡率来看,模型组,吡非尼酮组和两个药物的低浓度组(12.5mg/kg)死亡率较高,为30%。尼达尼布组和Z103080500高浓度组死亡率最低,为10%。这提示我们尼达尼布组和Z103080500高浓度可以提高特发性肺纤维化小鼠的生存率(图19)。
综上所述,本发明通过第一轮的虚拟筛选及机器学习模型预测后,选取了20个候选化合物进行Collagen1A2-A549细胞验证试验,将20个候选化合物实验数据反馈回机器学习模型,结合虚拟计算结果获得第二轮的9个候选化合物。经过细胞和动物实验验证后我们获得具备成药活性的化合物Z103080500与Z104578368。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 中山大学
<120> 抗特发性肺纤维化化合物及其计算机预测筛选方法
<160> 33
<170> SIPOSequenceListing 1.0
<210> 1
<211> 303
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 1
His Cys Glu Arg Leu Pro Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg
1 5 10 15
Asp Arg Leu Asn Leu Gly Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln
20 25 30
Val Ile Glu Ala Asp Ala Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg
35 40 45
Thr Val Ala Val Lys Met Leu Lys Glu Gly Ala Thr His Ser Glu His
50 55 60
Arg Ala Leu Met Ser Glu Leu Lys Ile Leu Ile His Ile Gly His His
65 70 75 80
Leu Asn Val Val Asn Leu Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro
85 90 95
Leu Met Val Ile Val Glu Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr
100 105 110
Leu Arg Ser Lys Arg Asn Glu Phe Val Pro Tyr Lys Thr Pro Glu Asp
115 120 125
Leu Tyr Lys Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser Phe
130 135 140
Gln Val Ala Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile His
145 150 155 160
Arg Asp Leu Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val Val
165 170 175
Lys Ile Cys Asp Phe Gly Leu Ala Arg Asp Ile Lys Asp Pro Asp Val
180 185 190
Arg Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala Pro Glu Thr
195 200 205
Ile Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp Ser Phe Gly
210 215 220
Val Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro Tyr Pro Gly
225 230 235 240
Val Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu Gly Thr Arg
245 250 255
Met Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln Thr Met Leu
260 265 270
Asp Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe Ser Glu Leu
275 280 285
Val Glu His Leu Gly Asn Leu Leu Gln Ala Asn Ala Gln Gln Asp
290 295 300
<210> 2
<211> 291
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 2
Glu Val Pro Leu Asp Glu Gln Cys Glu Arg Leu Pro Tyr Asp Ala Ser
1 5 10 15
Lys Trp Glu Phe Ala Arg Glu Arg Leu Lys Leu Gly Lys Ser Leu Gly
20 25 30
Arg Gly Ala Phe Gly Lys Val Val Gln Ala Ser Ala Phe Gly Ile Lys
35 40 45
Lys Ser Pro Thr Cys Arg Thr Val Ala Val Lys Met Leu Lys Glu Gly
50 55 60
Ala Thr Ala Ser Glu Tyr Lys Ala Leu Met Thr Glu Leu Lys Ile Leu
65 70 75 80
Thr His Ile Gly His His Leu Asn Val Val Asn Leu Leu Gly Ala Cys
85 90 95
Thr Lys Gln Gly Gly Pro Leu Met Val Ile Val Glu Tyr Cys Lys Tyr
100 105 110
Gly Asn Leu Ser Asn Tyr Leu Lys Ser Lys Arg Lys Glu Pro Ile Thr
115 120 125
Met Glu Asp Leu Ile Ser Tyr Ser Phe Gln Val Ala Arg Gly Met Glu
130 135 140
Phe Leu Ser Ser Arg Lys Cys Ile His Arg Asp Leu Ala Ala Arg Asn
145 150 155 160
Ile Leu Leu Ser Glu Asn Asn Val Val Lys Ile Cys Asp Phe Gly Leu
165 170 175
Ala Arg Asp Ile Tyr Lys Asn Pro Asp Tyr Val Arg Lys Gly Asp Thr
180 185 190
Arg Leu Pro Leu Lys Trp Met Ala Pro Glu Ser Ile Phe Asp Lys Ile
195 200 205
Tyr Ser Thr Lys Ser Asp Val Trp Ser Tyr Gly Val Leu Leu Trp Glu
210 215 220
Ile Phe Ser Leu Gly Gly Ser Pro Tyr Pro Gly Val Gln Met Asp Glu
225 230 235 240
Asp Phe Cys Ser Arg Leu Arg Glu Gly Met Arg Met Arg Ala Pro Glu
245 250 255
Tyr Ser Thr Pro Glu Ile Tyr Gln Ile Met Leu Asp Cys Trp His Arg
260 265 270
Asp Pro Lys Glu Arg Pro Arg Phe Ala Glu Leu Val Glu Lys Leu Gly
275 280 285
Asp Leu Leu
290
<210> 3
<211> 298
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Leu Pro Glu Asp Pro Lys Trp Glu Phe Pro Arg Asp Lys Leu Thr Leu
1 5 10 15
Gly Lys Pro Leu Gly Glu Gly Cys Phe Gly Gln Val Val Met Ala Glu
20 25 30
Ala Val Gly Ile Asp Lys Asp Lys Pro Lys Glu Ala Val Thr Val Ala
35 40 45
Val Lys Met Leu Lys Asp Asp Ala Thr Glu Lys Asp Leu Ser Asp Leu
50 55 60
Val Ser Glu Met Glu Met Met Lys Met Ile Gly Lys His Lys Asn Ile
65 70 75 80
Ile Asn Leu Leu Gly Ala Cys Thr Gln Asp Gly Pro Leu Tyr Val Ile
85 90 95
Val Glu Tyr Ala Ser Lys Gly Asn Leu Arg Glu Tyr Leu Arg Ala Arg
100 105 110
Arg Pro Pro Gly Met Glu Tyr Ser Tyr Asp Ile Asn Arg Val Pro Glu
115 120 125
Glu Gln Met Thr Phe Lys Asp Leu Val Ser Cys Thr Tyr Gln Leu Ala
130 135 140
Arg Gly Met Glu Tyr Leu Ala Ser Gln Lys Cys Ile His Arg Asp Leu
145 150 155 160
Ala Ala Arg Asn Val Leu Val Thr Glu Asn Asn Val Met Lys Ile Ala
165 170 175
Asp Phe Gly Leu Ala Arg Asp Ile Asn Asn Ile Asp Tyr Tyr Lys Lys
180 185 190
Thr Thr Asn Gly Arg Leu Pro Val Lys Trp Met Ala Pro Glu Ala Leu
195 200 205
Phe Asp Arg Val Tyr Thr His Gln Ser Asp Val Trp Ser Phe Gly Val
210 215 220
Leu Met Trp Glu Ile Phe Thr Leu Gly Gly Ser Pro Tyr Pro Gly Ile
225 230 235 240
Pro Val Glu Glu Leu Phe Lys Leu Leu Lys Glu Gly His Arg Met Asp
245 250 255
Lys Pro Ala Asn Cys Thr Asn Glu Leu Tyr Met Met Met Arg Asp Cys
260 265 270
Trp His Ala Val Pro Ser Gln Arg Pro Thr Phe Lys Gln Leu Val Glu
275 280 285
Asp Leu Asp Arg Ile Leu Thr Leu Thr Thr
290 295
<210> 4
<211> 297
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 4
Thr Ile Ala Arg Thr Ile Val Leu Gln Glu Ser Ile Gly Lys Gly Arg
1 5 10 15
Phe Gly Glu Val Trp Arg Gly Lys Trp Arg Gly Glu Glu Val Ala Val
20 25 30
Lys Ile Phe Ser Ser Arg Glu Glu Arg Ser Trp Phe Arg Glu Ala Glu
35 40 45
Ile Tyr Gln Thr Val Met Leu Arg His Glu Asn Ile Leu Gly Phe Ile
50 55 60
Ala Ala Asp Asn Lys Asp Asn Gly Thr Trp Thr Gln Leu Trp Leu Val
65 70 75 80
Ser Asp Tyr His Glu His Gly Ser Leu Phe Asp Tyr Leu Asn Arg Tyr
85 90 95
Thr Val Thr Val Glu Gly Met Ile Lys Leu Ala Leu Ser Thr Ala Ser
100 105 110
Gly Leu Ala His Leu His Met Glu Ile Val Gly Thr Gln Gly Lys Pro
115 120 125
Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile Leu Val Lys Lys
130 135 140
Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly Leu Ala Val Arg His Asp
145 150 155 160
Ser Ala Thr Asp Thr Ile Asp Ile Ala Pro Asn His Arg Val Gly Thr
165 170 175
Lys Arg Tyr Met Ala Pro Glu Val Leu Asp Asp Ser Ile Asn Met Lys
180 185 190
His Phe Glu Ser Phe Lys Arg Ala Asp Ile Tyr Ala Met Gly Leu Val
195 200 205
Phe Trp Glu Ile Ala Arg Arg Cys Ser Ile Gly Gly Ile His Glu Asp
210 215 220
Tyr Gln Leu Pro Tyr Tyr Asp Leu Val Pro Ser Asp Pro Ser Val Glu
225 230 235 240
Glu Met Arg Lys Val Val Cys Glu Gln Lys Leu Arg Pro Asn Ile Pro
245 250 255
Asn Arg Trp Gln Ser Cys Glu Ala Leu Arg Val Met Ala Lys Ile Met
260 265 270
Arg Glu Cys Trp Tyr Ala Asn Gly Ala Ala Arg Leu Thr Ala Leu Arg
275 280 285
Ile Lys Lys Thr Leu Ser Gln Leu Ser
290 295
<210> 5
<211> 297
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 5
Thr Ile Ala Arg Thr Ile Val Leu Gln Glu Ser Ile Gly Lys Gly Arg
1 5 10 15
Phe Gly Glu Val Trp Arg Gly Lys Trp Arg Gly Glu Glu Val Ala Val
20 25 30
Lys Ile Phe Ser Ser Arg Glu Glu Arg Ser Trp Phe Arg Glu Ala Glu
35 40 45
Ile Tyr Gln Thr Val Met Leu Arg His Glu Asn Ile Leu Gly Phe Ile
50 55 60
Ala Ala Asp Asn Lys Asp Asn Gly Thr Trp Thr Gln Leu Trp Leu Val
65 70 75 80
Ser Asp Tyr His Glu His Gly Ser Leu Phe Asp Tyr Leu Asn Arg Tyr
85 90 95
Thr Val Thr Val Glu Gly Met Ile Lys Leu Ala Leu Ser Thr Ala Ser
100 105 110
Gly Leu Ala His Leu His Met Glu Ile Val Gly Thr Gln Gly Lys Pro
115 120 125
Ala Ile Ala His Arg Asp Leu Lys Ser Lys Asn Ile Leu Val Lys Lys
130 135 140
Asn Gly Thr Cys Cys Ile Ala Asp Leu Gly Leu Ala Val Arg His Asp
145 150 155 160
Ser Ala Thr Asp Thr Ile Asp Ile Ala Pro Asn His Arg Val Gly Thr
165 170 175
Lys Arg Tyr Met Ala Pro Glu Val Leu Asp Asp Ser Ile Asn Met Lys
180 185 190
His Phe Glu Ser Phe Lys Arg Ala Asp Ile Tyr Ala Met Gly Leu Val
195 200 205
Phe Trp Glu Ile Ala Arg Arg Cys Ser Ile Gly Gly Ile His Glu Asp
210 215 220
Tyr Gln Leu Pro Tyr Tyr Asp Leu Val Pro Ser Asp Pro Ser Val Glu
225 230 235 240
Glu Met Arg Lys Val Val Cys Glu Gln Lys Leu Arg Pro Asn Ile Pro
245 250 255
Asn Arg Trp Gln Ser Cys Glu Ala Leu Arg Val Met Ala Lys Ile Met
260 265 270
Arg Glu Cys Trp Tyr Ala Asn Gly Ala Ala Arg Leu Thr Ala Leu Arg
275 280 285
Ile Lys Lys Thr Leu Ser Gln Leu Ser
290 295
<210> 6
<211> 297
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Leu Pro Ala Asp Pro Lys Trp Glu Leu Ser Arg Ala Arg Leu Thr Leu
1 5 10 15
Gly Lys Pro Leu Gly Glu Gly Cys Phe Gly Gln Val Val Met Ala Glu
20 25 30
Ala Ile Gly Ile Asp Lys Asp Arg Ala Ala Lys Pro Val Thr Val Ala
35 40 45
Val Lys Met Leu Lys Asp Asp Ala Thr Asp Lys Asp Leu Ser Asp Leu
50 55 60
Val Ser Glu Met Glu Met Met Lys Met Ile Gly Lys His Lys Asn Ile
65 70 75 80
Ile Asn Leu Leu Gly Ala Cys Thr Gln Gly Gly Pro Leu Tyr Val Leu
85 90 95
Val Glu Tyr Ala Ala Lys Gly Asn Leu Arg Glu Phe Leu Arg Ala Arg
100 105 110
Arg Pro Pro Gly Leu Asp Tyr Ser Phe Asp Thr Cys Lys Pro Pro Glu
115 120 125
Glu Gln Leu Thr Phe Lys Asp Leu Val Ser Cys Ala Tyr Gln Val Ala
130 135 140
Arg Gly Met Glu Tyr Leu Ala Ser Gln Lys Cys Ile His Arg Asp Leu
145 150 155 160
Ala Ala Arg Asn Val Leu Val Thr Glu Asp Asn Val Met Lys Ile Ala
165 170 175
Asp Phe Gly Leu Ala Arg Asp Val His Asn Leu Asp Tyr Tyr Lys Lys
180 185 190
Thr Thr Asn Gly Arg Leu Pro Val Lys Trp Met Ala Pro Glu Ala Leu
195 200 205
Phe Asp Arg Val Tyr Thr His Gln Ser Asp Val Trp Ser Phe Gly Val
210 215 220
Leu Leu Trp Glu Ile Phe Thr Leu Gly Gly Ser Pro Tyr Pro Gly Ile
225 230 235 240
Pro Val Glu Glu Leu Phe Lys Leu Leu Lys Glu Gly His Arg Met Asp
245 250 255
Lys Pro Ala Asn Cys Thr His Asp Leu Tyr Met Ile Met Arg Glu Cys
260 265 270
Trp His Ala Ala Pro Ser Gln Arg Pro Thr Phe Lys Gln Leu Val Glu
275 280 285
Asp Leu Asp Arg Val Leu Thr Val Thr
290 295
<210> 7
<211> 304
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 7
Asp Ser Arg Trp Glu Phe Pro Arg Asp Gly Leu Val Leu Gly Arg Val
1 5 10 15
Leu Gly Ser Gly Ala Phe Gly Lys Val Val Glu Gly Thr Ala Tyr Gly
20 25 30
Leu Ser Arg Ser Gln Pro Val Met Lys Val Ala Val Lys Met Leu Lys
35 40 45
Pro Thr Ala Arg Ser Ser Glu Lys Gln Ala Leu Met Ser Glu Leu Lys
50 55 60
Ile Met Thr His Leu Gly Pro His Leu Asn Ile Val Asn Leu Leu Gly
65 70 75 80
Ala Cys Thr Lys Ser Gly Pro Ile Tyr Ile Ile Thr Glu Tyr Cys Phe
85 90 95
Tyr Gly Asp Leu Val Asn Tyr Leu His Lys Asn Arg Asp Ser Phe Leu
100 105 110
Ser His Lys Lys Lys Ser Met Leu Asp Ser Glu Val Lys Asn Leu Leu
115 120 125
Ser Asp Asp Asn Ser Glu Gly Leu Thr Leu Leu Asp Leu Leu Ser Phe
130 135 140
Thr Tyr Gln Val Ala Arg Gly Met Glu Phe Leu Ala Ser Lys Asn Cys
145 150 155 160
Val His Arg Asp Leu Ala Ala Arg Asn Val Leu Leu Ala Gln Gly Lys
165 170 175
Ile Val Lys Ile Cys Asp Phe Gly Leu Ala Arg Asp Ile Met His Asp
180 185 190
Ser Asn Tyr Val Ser Lys Gly Ser Thr Phe Leu Pro Val Lys Trp Met
195 200 205
Ala Pro Glu Ser Ile Phe Asp Asn Leu Tyr Thr Thr Leu Ser Asp Val
210 215 220
Trp Ser Tyr Gly Ile Leu Leu Trp Glu Ile Phe Ser Leu Gly Gly Thr
225 230 235 240
Pro Tyr Pro Gly Met Met Val Asp Ser Thr Phe Tyr Asn Lys Ile Lys
245 250 255
Ser Gly Tyr Arg Met Ala Lys Pro Asp His Ala Thr Ser Glu Val Tyr
260 265 270
Glu Ile Met Val Lys Cys Trp Asn Ser Glu Pro Glu Lys Arg Pro Ser
275 280 285
Phe Tyr His Leu Ser Glu Ile Val Glu Asn Leu Leu Pro Gly Gln Tyr
290 295 300
<210> 8
<211> 276
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Tyr Asp Ser Thr Trp Glu Leu Pro Arg Asp Gln Leu Val Leu Gly Arg
1 5 10 15
Thr Leu Gly Ser Gly Ala Phe Gly Gln Val Val Glu Ala Thr Ala His
20 25 30
Gly Leu Ser His Ser Gln Ala Thr Met Lys Val Ala Val Lys Met Leu
35 40 45
Lys Ser Thr Ala Arg Ser Ser Glu Lys Gln Ala Leu Met Ser Glu Leu
50 55 60
Lys Ile Met Ser His Leu Gly Pro His Leu Asn Val Val Asn Leu Leu
65 70 75 80
Gly Ala Cys Thr Lys Gly Gly Pro Ile Tyr Ile Ile Thr Glu Tyr Cys
85 90 95
Arg Tyr Gly Asp Leu Val Asp Tyr Leu His Arg Asn Ser Asp Lys Arg
100 105 110
Arg Leu Ile Asn Glu Ser Pro Val Leu Ser Tyr Met Asp Leu Val Gly
115 120 125
Phe Ser Tyr Gln Val Ala Asn Gly Met Glu Phe Leu Ala Ser Lys Asn
130 135 140
Cys Val His Arg Asp Leu Ala Ala Arg Asn Val Leu Ile Cys Glu Gly
145 150 155 160
Lys Leu Val Lys Ile Cys Asp Phe Gly Leu Ala Arg Asp Ile Met Arg
165 170 175
Asp Ser Asn Tyr Ile Ser Lys Gly Ser Thr Phe Leu Pro Leu Lys Trp
180 185 190
Met Ala Pro Glu Ser Ile Phe Asn Ser Leu Tyr Thr Thr Leu Ser Asp
195 200 205
Val Trp Ser Phe Gly Ile Leu Leu Trp Glu Ile Phe Thr Leu Gly Gly
210 215 220
Thr Pro Tyr Pro Glu Leu Pro Met Asn Glu Gln Phe Tyr Asn Ala Ile
225 230 235 240
Lys Arg Gly Tyr Arg Met Ala Gln Pro Ala His Ala Ser Asp Glu Ile
245 250 255
Tyr Glu Ile Met Gln Lys Cys Trp Glu Glu Lys Phe Glu Ile Arg Pro
260 265 270
Pro Phe Ser Gln
275
<210> 9
<211> 310
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Tyr Leu Ser Ile Ile Met Asp Pro Gly Glu Val Pro Leu Tyr Leu Ser
1 5 10 15
Tyr Asp Ala Ser Gln Trp Glu Phe Pro Arg Glu Arg Leu His Leu Gly
20 25 30
Arg Val Leu Gly Tyr Gly Ala Phe Gly Lys Val Val Glu Ala Ser Ala
35 40 45
Phe Gly Ile His Lys Gly Ser Ser Cys Asp Thr Val Ala Val Lys Met
50 55 60
Leu Lys Glu Gly Ala Thr Ala Ser Glu His Arg Ala Leu Met Ser Glu
65 70 75 80
Leu Lys Ile Leu Ile His Ile Gly Asn His Leu Asn Val Val Asn Leu
85 90 95
Leu Gly Ala Cys Thr Lys Pro Gln Gly Pro Leu Met Val Ile Val Glu
100 105 110
Phe Cys Lys Tyr Gly Asn Leu Ser Asn Phe Leu Arg Ala Lys Arg Asp
115 120 125
Ala Phe Ser Pro Cys Ala Glu Lys Ser Pro Ser Pro Leu Thr Met Glu
130 135 140
Asp Leu Val Cys Tyr Ser Phe Gln Val Ala Arg Gly Met Glu Phe Leu
145 150 155 160
Ala Ser Arg Lys Cys Ile His Arg Asp Leu Ala Ala Arg Asn Ile Leu
165 170 175
Leu Ser Glu Ser Asp Val Val Lys Ile Cys Asp Phe Gly Leu Ala Arg
180 185 190
Asp Ile Tyr Lys Asp Pro Asp Tyr Val Arg Lys Gly Ser Ala Arg Leu
195 200 205
Pro Leu Lys Trp Met Ala Pro Glu Ser Ile Phe Asp Lys Val Tyr Thr
210 215 220
Thr Gln Ser Asp Val Trp Ser Phe Gly Val Leu Leu Trp Glu Ile Phe
225 230 235 240
Ser Leu Gly Ala Ser Pro Tyr Pro Gly Val Gln Ile Asn Glu Glu Phe
245 250 255
Cys Gln Arg Leu Arg Asp Gly Thr Arg Met Arg Ala Pro Glu Leu Ala
260 265 270
Thr Pro Ala Ile Arg Arg Ile Met Leu Asn Cys Trp Ser Gly Asp Pro
275 280 285
Lys Ala Arg Pro Ala Phe Ser Glu Leu Val Glu Ile Leu Gly Asp Leu
290 295 300
Leu Gln Gly Arg Gly Leu
305 310
<210> 10
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
cctcgtcccg tagacaaaat g 21
<210> 11
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tgaggtcaat gaaggggtcg t 21
<210> 12
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
cagcaggtgc ttgaaaccgt ag 22
<210> 13
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
ctcagtcgca ggtaacccat ct 22
<210> 14
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
accccttgag tccaatcaca ca 22
<210> 15
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
cttcctccaa ctgccaatac ca 22
<210> 16
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
caagatgttt gcccagcgta g 21
<210> 17
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tccctccaca aactcggtcc 20
<210> 18
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gaggctacaa ggtccgttat gc 22
<210> 19
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
ccaatcttgc tcccattcac ct 22
<210> 20
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aagcaggagc atcgcattg 19
<210> 21
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gctgggcatc actgtaaacc t 21
<210> 22
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tggagcctgg tcatggaaag 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ccttgtcggt ggtgttagcg 20
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
ccttcaatgg acttaccctg gag 23
<210> 25
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gcccgcacct ctacaacaaa 20
<210> 26
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
tgactgactt cctcttggat atgc 24
<210> 27
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
aaattgtagt gtgcccacct ctc 23
<210> 28
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
atccttcaaa cgtgctgaca tc 22
<210> 29
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
tgccttcctg ttgactgagt tg 22
<210> 30
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
atctgtgtct ctgatgctgt tgct 24
<210> 31
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
cgtggaacgg ttgaggtagt ct 22
<210> 32
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
agcaaggcga aaaaggatgc 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
tcattgaatg cttggcgctg 20

Claims (2)

1.具有式II结构特征的化合物或其药用盐在制备用于治疗和/或预防特发性肺纤维化的药物中的用途:
2.一种用于抗特发性肺纤维化的药物组合物,其特征在于,包括权利要求1所述的化合物或其药学上可接受的盐,以及药学上可接受的辅料。
CN202111359694.4A 2021-11-17 2021-11-17 抗特发性肺纤维化化合物及其计算机预测筛选方法 Active CN114432311B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111359694.4A CN114432311B (zh) 2021-11-17 2021-11-17 抗特发性肺纤维化化合物及其计算机预测筛选方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111359694.4A CN114432311B (zh) 2021-11-17 2021-11-17 抗特发性肺纤维化化合物及其计算机预测筛选方法

Publications (2)

Publication Number Publication Date
CN114432311A CN114432311A (zh) 2022-05-06
CN114432311B true CN114432311B (zh) 2023-08-11

Family

ID=81363017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111359694.4A Active CN114432311B (zh) 2021-11-17 2021-11-17 抗特发性肺纤维化化合物及其计算机预测筛选方法

Country Status (1)

Country Link
CN (1) CN114432311B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116798513B (zh) * 2023-02-21 2023-12-15 苏州赛赋新药技术服务有限责任公司 筛选siRNA序列以降低脱靶效应的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180066395A (ko) * 2016-12-08 2018-06-19 재단법인 아산사회복지재단 유리 지방산을 포함하는 특발성 폐섬유증 예후예측용 바이오마커
WO2020067333A1 (ja) * 2018-09-27 2020-04-02 株式会社Lttバイオファーマ 線維症治療用医薬組成物
CN112143720A (zh) * 2020-11-04 2020-12-29 河南师范大学 特发性肺纤维化疾病血液诊断标志物cbr1及其在制备诊断或预后工具中的应用
CN113066525A (zh) * 2021-03-30 2021-07-02 中山大学 一种基于集成学习与混合神经网络的多靶标药物筛选方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9416151B2 (en) * 2010-08-25 2016-08-16 Lurong ZHANG Use of glycyrrhetinic acid, glycyrrhizic acid and related compounds for prevention and/or treatment of pulmonary fibrosis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180066395A (ko) * 2016-12-08 2018-06-19 재단법인 아산사회복지재단 유리 지방산을 포함하는 특발성 폐섬유증 예후예측용 바이오마커
WO2020067333A1 (ja) * 2018-09-27 2020-04-02 株式会社Lttバイオファーマ 線維症治療用医薬組成物
CN112143720A (zh) * 2020-11-04 2020-12-29 河南师范大学 特发性肺纤维化疾病血液诊断标志物cbr1及其在制备诊断或预后工具中的应用
CN113066525A (zh) * 2021-03-30 2021-07-02 中山大学 一种基于集成学习与混合神经网络的多靶标药物筛选方法

Also Published As

Publication number Publication date
CN114432311A (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
JP4933607B2 (ja) 創薬標的タンパク質及び標的遺伝子、並びにスクリーニング方法
CN107582550B (zh) 茚达特罗在治疗结直肠癌中的应用
CN107206009A (zh) 用于治疗视觉障碍的组合物和方法
CN114432311B (zh) 抗特发性肺纤维化化合物及其计算机预测筛选方法
WO2018133635A1 (zh) 一种肿瘤细胞异种移植斑马鱼模型、其构建方法及应用
JP2021119187A (ja) 近視又は遠視の治療的処置又は予防的処置において使用する作用物質
Lindsey et al. Differential protection of injured retinal ganglion cell dendrites by brimonidine
CN107115344B (zh) 酪氨酸激酶抑制剂在制备用于预防和/或治疗纤维化疾病的药物中的用途
CN104107429A (zh) Sh2b衔接蛋白3(sh2b3)在治疗心肌肥厚中的功能及应用
CN110237257A (zh) Ube3a泛素化PP2A激活因子PTPA在治疗天使综合症和孤独症中的应用
CN105079785A (zh) 三结构域蛋白32(trim32)在治疗心肌肥厚中的功能及应用
CN107828789A (zh) 肺癌靶向治疗的抑制剂及其应用和kap1作为药物靶标在筛选抗肺癌的药物中的应用
CN110003342B (zh) 一种多肽及其在改善低社会等级对机体不良影响中的应用
CN103751257A (zh) 氨基酸口服液及其制备方法
CN109985049A (zh) 5α-雄甾-3β,5,6β-三醇在制备治疗脑小血管病的药物中的应用
CN111956643B (zh) 维替泊芬用于制备肥胖症药物的应用
CN108969539A (zh) 宫内膜干细胞在制备用于预防或治疗肺纤维化药物的应用
CN118121614A (zh) 豯莶苷在制备防治遗传性肥厚型心肌病的药物中的应用
CN106389416A (zh) 一种防治脑卒中的药物及应用
US12024557B2 (en) EGFR blocking agents for the therapeutic treatment of myopia
CN116549640A (zh) 一种miR-29b-3p的应用
CN102440995B (zh) 一种天然化合物的化学活性及其用途
CN112472790B (zh) 小白蛋白的抑制剂在制备预防治疗肥胖以及肥胖导致的疾病产品中的用途
CN111264469B (zh) 一种基因免疫诱导的甲状腺相关性眼病动物模型的构建方法及雷帕霉素类药物的应用
CN114075600B (zh) Orm2基因及蛋白在作为肿瘤治疗靶点中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant