CN112667922B - 基于协同过滤的新型冠状病毒中药组方推荐方法及系统 - Google Patents

基于协同过滤的新型冠状病毒中药组方推荐方法及系统 Download PDF

Info

Publication number
CN112667922B
CN112667922B CN202110037705.0A CN202110037705A CN112667922B CN 112667922 B CN112667922 B CN 112667922B CN 202110037705 A CN202110037705 A CN 202110037705A CN 112667922 B CN112667922 B CN 112667922B
Authority
CN
China
Prior art keywords
traditional chinese
chinese medicine
compound
medicines
protein
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110037705.0A
Other languages
English (en)
Other versions
CN112667922A (zh
Inventor
杨帆
薛付忠
张琪
李江冰
薛浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN202110037705.0A priority Critical patent/CN112667922B/zh
Publication of CN112667922A publication Critical patent/CN112667922A/zh
Application granted granted Critical
Publication of CN112667922B publication Critical patent/CN112667922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Heterocyclic Carbon Compounds Containing A Hetero Ring Having Oxygen Or Sulfur (AREA)

Abstract

本发明公开一种基于协同过滤的新型冠状病毒中药组方推荐方法及系统,包括:获取三药三方中药的化合物,将化合物与新冠蛋白质进行分子对接,得到化合物与蛋白质的结合亲和力;基于ADME筛选、结合亲和力和化合物自由能对接阈值对化合物进行筛选,得到有效化合物;根据中药所包含的有效化合物的分子指纹得到中药分子指纹,根据中药分子指纹和中药功效性状特征构建中药‑中药相似度矩阵;基于中药‑中药相似度矩阵和协同过滤算法对候选中药进行筛选,得到中药组方推荐方案。将三药三方中药化合物和新冠蛋白质进行分子对接,衡量中药及中药组方与新冠蛋白质的结合能力,同时基于协同过滤算法进行中药组方的推荐,验证中药组方对新冠病毒治疗的有效性。

Description

基于协同过滤的新型冠状病毒中药组方推荐方法及系统
技术领域
本发明涉及药物推荐技术领域,特别是涉及一种基于协同过滤的新型冠状病毒中药组方推荐方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
目前,在新冠肺炎的治疗药物方面仍然没有特效药物能够实现有效的疗效。虽然有些研究表明氯喹、瑞德西韦等具有一定疗效,如钟南山等发表的有关氯喹的文章表明其可以有效减少感染时间;关于瑞德西韦治疗新冠感染恒河猴实验表明,经瑞德西韦治疗的动物肺部病毒载毒量显著降低,对肺组织的损害明显减少。但是实质上还是存在争议的,如柳叶刀文章表明氯喹无效,甚至有副作用,关于瑞德西韦认为服用瑞德西韦的患者症状改善及死亡率与对照组差别无统计学差异。
Covid-19在中医上属于瘟疫范畴,数千年来,中医对瘟疫的防治积累了丰富的经验,形成较为系统的理论与方法。中国最早的文字殷墟甲骨文已经有了“虫”“蛊”“疟疾”这些文字的记载,东汉时期《伤寒论》有关于瘟疫流行的详细记载:“自建安纪年以来,犹未十稔,其死亡者三分之二,伤寒十居其七”。最早一部传染病专著为清代吴有性所著《温疫论》,详细描述了其病因病机和治疗方法,提出“戾气”一说,并提出“达原饮”等治疗方法,在后续瘟疫的救治过程中起了重要作用。在治疗covid-19中,中医药同样发挥了不可替代的作用,新型冠状病毒感染的肺炎诊疗方案中明确要求有关医疗机构要在救治工作中积极发挥中医药的作用,加强中西医结合。
目前有关三药三方(金花清感颗粒、连花清瘟胶囊、血必净、清肺败毒汤、化湿败毒方、宣肺败毒方)治疗新冠肺炎的相关RCT实验表示,实验组患者发烧、咳嗽、疲乏等症状与对照组相比明显减轻,住院时间缩短,不良反应无明显差别,证明上述方剂对新冠的作用。
中医把人体看作一个整体,认为构成人体的各个部分,在结构上不可分割,在功能上相互协调制约。同样,在治疗方面,方剂也以整体的形式存在,按照中医对病症、药物配伍关系等特有的认识及思维模式,进行合理组方,整体调节,在辨证施治的过程中,始终强调方剂,而非单个药物,各个药物根据方剂中君臣佐使的配伍关系,达到最佳的治疗效果。但是目前仍无法得知治疗效果是由于方剂中的主要药物,或者是主要药物的主要成分起到治疗作用还是方剂的整体作用,又鉴于西药目前没有特异性的治疗药物,对新冠治疗和抑制具有局限性,对于中药处方通过虚拟筛选方式衡量药物和新冠蛋白的作用能力,以验证三药三方对新冠的作用,明确中医药在治疗此次新冠肺炎治疗中发挥的中药作用。
发明内容
为了解决上述问题,本发明提出了一种基于协同过滤的新型冠状病毒中药组方推荐方法及系统,将三药三方中药化合物和新冠蛋白质进行分子对接,衡量中药及中药组方与新冠蛋白质的结合能力,同时基于协同过滤算法进行中药组方的推荐,验证中药组方对新冠病毒治疗的有效性。
为了实现上述目的,本发明采用如下技术方案:
第一方面,本发明提供一种基于协同过滤的新型冠状病毒中药组方推荐方法,包括:
获取三药三方中药的化合物,将化合物与新冠蛋白质进行分子对接,得到化合物与蛋白质的结合亲和力;
基于ADME筛选、结合亲和力和化合物自由能对接阈值对化合物进行筛选,得到有效化合物;
根据中药所包含的有效化合物的分子指纹得到中药分子指纹,根据中药分子指纹和中药功效性状特征构建中药-中药相似度矩阵;
基于中药-中药相似度矩阵以及采用协同过滤算法对候选中药进行筛选,得到中药组方推荐方案。
第二方面,本发明提供一种基于协同过滤的新型冠状病毒中药组方推荐系统,包括:
分子对接模块,被配置为获取三药三方中药的化合物,将化合物与新冠蛋白质进行分子对接,得到化合物与蛋白质的结合亲和力;
筛选模块,被配置为基于ADME筛选、结合亲和力和化合物自由能对接阈值对化合物进行筛选,得到有效化合物;
相似计算模块,被配置为根据中药所包含的有效化合物的分子指纹得到中药分子指纹,根据中药分子指纹和中药功效性状特征构建中药-中药相似度矩阵;
推荐模块,被配置为基于中药-中药相似度矩阵以及采用协同过滤算法对候选中药进行筛选,得到中药组方推荐方案。
第三方面,本发明提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述的方法。
第四方面,本发明提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
与现有技术相比,本发明的有益效果为:
由于西药,尤其是单药对新冠治疗和抑制存在局限性,所以本发明将三药三方的中药化合物成分与新冠病毒的24种蛋白进行分子对接,并将对接结果整合到中药及方剂上,验证中药处方对新冠病毒治疗的有效性,结果显示三药三方中六个方剂共3289种化合物成分,与24种新冠蛋白共产生39468个自由能值,其中化合物neo-przewaquinone a对新冠蛋白具有最低的自由能,对于中药,甘草对新冠蛋白具有最低的自由能,三药三方对于新冠病毒的结合力优于非抗病毒方药,且三药三方对于新冠病毒的治疗作用为方剂的整体作用,而非方剂中具体成分,同时基于此策略通过协同过滤算法以及所提出的拉普拉斯矩阵运算,进行中药组方的推荐。
在药物虚拟筛选上,虽然目前文献显示多种西药可能阻断新冠病毒感染,但仍没有特异性的治疗药物,所以采用基于配体的药物预测可能会导致较大的偏差,故本实施例的分子对接采用基于受体结构的预测方法进行药物筛选。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例1提供的基于协同过滤算法的新型冠状病毒中药组方推荐方法流程图。
具体实施方式:
下面结合附图与实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例1
如图1所示,本实施例提供一种基于协同过滤算法的新型冠状病毒中药组方推荐方法,包括:
S1:获取三药三方中药的化合物,将化合物与新冠蛋白质进行分子对接,得到化合物与蛋白质的结合亲和力;
S2:基于ADME筛选、结合亲和力和化合物自由能对接阈值对化合物进行筛选,得到有效化合物;
S3:根据中药所包含的有效化合物的分子指纹得到中药分子指纹,根据中药分子指纹和中药功效性状特征构建中药-中药相似度矩阵;
S4:基于中药-中药相似度矩阵以及采用协同过滤算法对候选中药进行筛选,得到中药组方推荐方案。
本实施例首先基于分子对接衡量中药及中药组方与新冠病毒蛋白质的结合能力,进而基于协同过滤算法进行中药组方的推荐;其中:
中药虚拟筛选的方法主要包括:基于结构的预测方法、基于机器学习及深度学习的预测方法和基于组合的预测方法;其中,基于结构的预测方法主要包括基于配体结构的预测和基于受体结构的预测。基于配体结构的预测方法主要为已知对受体有作用的配体,在此基础上寻找与该配体具有相似性的化合物,是一种间接的预测方法。基于受体结构的预测是从靶蛋白的三维结构出发,研究靶蛋白结合位点的特征性质以及它与小分子化合物之间的相互作用模式,根据与结合能相关的亲合性打分函数对蛋白和小分子化合物的结合能力进行评价,来寻找可能作用于该配体的受体。目前有文献显示多种西药可能阻断新冠病毒感染,但目前为止仍没有特异性的治疗中药,故采用基于配体的中药预测可能会导致较大的偏差,所以本实施例采用基于受体结构的预测方法进行中药筛选。
随着分子对接在中药研发中重要性的不断提升,分子对接软件也不断普及化,并在此过程中不断更新,常用的分子对接软件有:Autodock、Autodock Vina、GOLD、Ligandfit、Glide等;基于Autodock改良的Autodock Vina,和基于Vina改良的Quick-Vina都使用打分函数,后者使用迭代的局部搜索全局优化器进行全局优化,从而显着提高了速度和准确性。由于此前并没有研究表明新冠病毒蛋白的结合口袋,所以需要对整个蛋白搜索后进行“盲对接”,盲对接是指在不知道目标口袋的情况下,将配体对接到蛋白质的整个表面,在找到一个有利的蛋白质配体复杂位姿之前,盲对接需要进行几次试验和能量计算。Q-Vina-W适用于“盲对接”,不受搜索空间大小和残差数的限制,可以自动搜索,能够更好的实现分子对接。
协同过滤技术是推荐系统中效率最高的算法,主要功能是预测和推荐,算法通过对用户历史行为数据的挖掘发现用户的偏好,基于不同的偏好对群组划分并推荐相似的用品;主要分为基于用户、基于项目、基于模型的三种协同过滤方法。基于模型的协同过滤主要方法有关联算法、聚类算法、分类算法、回归算法、矩阵分解、神经网络、图模型及隐语义模型等,本实施例在基于矩阵计算的基础上进行协同过滤来预测可能有效的中药组合推荐及中药组合。
为了验证中药对新冠病毒的作用,本实施例选取三药三方的中药化合物成分,将其与新冠病毒的24种蛋白进行分子对接,并将对接结果整合到中药及方剂上。
新冠病毒为单股正链RNA病毒,编码4种结构蛋白(S、E、M、N)、16种非结构蛋白(解旋酶、蛋白酶(3CLpro,PLpro)、RNA聚合酶等)和8种辅助蛋白,既往有关新冠及SARS的研究表明各个组成蛋白在其中均发挥重要作用。结构蛋白主要起支撑骨架的作用,S蛋白的RBD区域与ACEII受体结合,从而使病毒进入细胞内。SARS中E蛋白参与宿主细胞凋亡、细胞膜通透性改变和病毒组装等。N蛋白是将基因组RNA整合到子代病毒颗粒中的关键。非结构蛋白参与调解病毒基因组RNA的复制和转录,并参与病毒感染宿主的过程,是冠状病毒的重要功能蛋白。多种非结构蛋白在病毒感染中起重要作用,如nap3将多聚蛋白5’端水解成nsp1~nsp4 4个非结构蛋白,nsp5水解剩下的12个非结构蛋白,nsp10为转录调节蛋白,nsp13具有核酸解旋酶/NTP酶的活性等。同样,辅助蛋白在冠状病毒的感染中同样起到了重要的作用。因此,本实施例对新冠的每个能获取到结构的新冠蛋白都进行了对接和分析。
三药三方包括金花清感颗粒、连花清瘟胶囊、血必净、清肺败毒汤、化湿败毒方和宣肺败毒方;其中:
金花清感颗粒是为甲型H1N1流感研制的中成药,是由麻杏石甘汤和银翘散两个方剂加减而成,其组成成分包括金银花、石膏、麻黄(蜜炙)、苦杏仁、黄芩、连翘、浙贝母、知母、牛蒡子、青蒿、薄荷、甘草,用于外感时邪引起的发热、咽红、鼻塞流涕等。既往关于金花清感颗粒对流行性感冒疗效的研究表明金花清感颗粒能够明显降低患者血清各细胞因子的水平;对于新型冠状病毒肺炎的RCT研究表明其能显著减轻轻型患者的发热、咳嗽、乏力、咳痰等症状;在新型冠状病毒肺炎诊疗方案中推荐在医学观察期,临床表现为发热伴乏力时使用。本实施例中验证发现,金花清感颗粒中的中药及化合物能对新冠蛋白起到较好的结合效果。
连花清瘟胶囊由连翘、金银花、麻黄、苦杏仁、石膏、板蓝根、贯众、鱼腥草、广藿香、大黄、红景天、薄荷、甘草等中药组成,用于治疗流行性感冒证见发热恶寒、肌肉酸痛、鼻塞流涕等者,尤适用于轻度发热、大便不畅患者。有关新冠肺炎的多项临床研究表明其可以该换患者发热、咳嗽、乏力等症状,降低普通转重症比例;在新型冠状病毒肺炎诊疗方案中推荐使用连花清瘟胶囊的适应症同金花清感颗粒相同。
血必净注射液以血府逐瘀汤为基础,在菌毒并治的理论下研制出的方剂,临床以注射剂的形式使用,以红花、赤芍、川芎、丹参、当归等中药组成,主治温热类疾病症见发热、喘促、心悸烦躁等瘀毒互结证。一项有关新冠肺炎的RCT研究表明,与对照组相比,治疗组WBC升高,CRP和ESR显著降低,APACHE II评分显著降低;在新型冠状病毒肺炎诊疗方案中推荐重型患者气营两燔证或者危重型患者内闭外脱证者使用。
宣肺败毒方由四个方剂加减而成,包括麻杏石甘汤、麻杏薏甘汤、千金苇茎汤和葶苈大枣泄肺汤,由麻黄、苦杏仁、石膏、薏苡仁、苍术、活性、青蒿、虎杖、马鞭草、芦根、葶苈子、橘红、甘草等中药组成。中药组分库数据显示虎杖和马鞭草对新冠病毒可能具有活性,在新型冠状病毒肺炎诊疗方案中推荐普通型湿毒郁肺证患者使用。
化湿败毒方由多种方剂加减而成,包括麻黄、藿香、生石膏、杏仁、半夏、厚朴、苍术、草果、茯苓、黄芪、赤芍、葶苈子、生大黄、甘草等中药。在新型冠状病毒肺炎诊疗方案中推荐重型患者疫毒闭肺证患者使用。
清肺排毒汤根据麻杏石甘汤、射干麻黄汤、小柴胡汤、五苓散等方剂加减而成,由麻黄、炙甘草、杏仁、生石膏、桂枝、泽泻、猪苓、白术、茯苓、柴胡、黄芩、姜半夏、生姜、紫菀、冬花、射干、细辛、山药、枳实、陈皮、藿香等中药组成。一项有关治疗新冠病毒肺炎的回顾性研究表明与对照组相比,联合用药组退热时间、咳嗽好转时间及肺部CT好转时间显著缩短;在新型冠状病毒肺炎诊疗方案中推荐重型患者疫毒闭肺证患者使用;在新型冠状病毒肺炎诊疗方案中推荐各个时期确诊患者均可根据实际情况使用。
基于此,本实施例将三药三方中的中药化合物与新冠蛋白质进行分子对接,采用打分函数评价化合物与蛋白质的结合能力,使用分子对接综合分析结合亲和力得分及空间构象情况;
打分函数结合知识潜力和经验评分函数的某些优势,从受体-配体配合物的构象偏好和实验亲和度测量中提取经验信息,通过综合评定利用效率较高的算法得出打分函数,即得到配体和受体分子之间的结合能力,一般采用能量匹配来评价。本实施例定义打分函数c如下:
Figure BDA0002893929150000101
每个原子i被分配一个类型ti,定义原子间距离rij的对称相互作用函数
Figure BDA0002893929150000102
其中:
Figure BDA0002893929150000103
其中,Rt为t型原子的范德瓦尔斯半径;
Figure BDA0002893929150000104
是空间相互作用的加权和,包括不同权重的所有的原子对、疏水原子之间的疏水相互作用以及氢键作用力等;
Figure BDA0002893929150000105
Figure BDA0002893929150000106
Figure BDA0002893929150000107
Figure BDA0002893929150000111
Figure BDA0002893929150000112
Figure BDA0002893929150000113
Rt:w1=-0.035579,w2=-0.005156,w3=0.840245,w4=-0.035069,w5=-0.587439。
在本实施例中,蛋白结构小者直接框定全部范围进行对接,结构较大者将蛋白分成多个区域分别进行对接,然后手动合并结果;在完成对接之后,采用上述函数计算化合物-蛋白质的结合亲和力,即打分函数,继而利用打分函数对对接结果进行分析。
从热力学的观点来看,配体-受体相互作用是一个综合平衡的过程,生物分子的稳定构象是自由能最低的构象;因此本实施例使用结合亲和力判断蛋白与中药化合物的结合情况,当结合亲和力小于-7kcal/mol时,判断该化合物与蛋白有效结合,反之则无效;将化合物及蛋白质分别对接10次,并取10次平均值为对接的结果,构建化合物-蛋白质矩阵。
本实施例引入ADME筛选方法以及化合物自由能对接阈值,基于ADME筛选、结合亲和力和化合物自由能对接阈值对化合物进行筛选,筛选得到与新冠蛋白质有效结合的有效化合物,生成中药-化合物二分类矩阵及化合物-蛋白矩阵。
本实施例选取480种候选中药,480种候选中药在tcmsp中共包含13441种化合物,其中3243种化合物出现在多个中药中,beta-sitosterol出现次数最多,分别出现在237种中药中,其次是palmitic acid和Sitogluside,分别出现在227种和180种中药中;经ADME筛选后,剩余1665种化合物,其中342种化合物出现在多个中药中,beta-sitosterol出现次数最多,分别出现在237种中药中,其次是quercetin和sitosterol,分别出现在178种和156种中药中。
三药三方共有中药49种,其中17种中药出现在多个方剂中,麻黄、苦杏仁及甘草出现次数最多,共出现5次,其次是藿香出现4次。49种中药共包含3289种化合物,其中760种化合物出现在多个中药中,palmitic acid出现次数最多,共出现在29种中药中,其次是beta-sitosterol和CAM,分别出现在21种和20种中药中;经ADME筛选后,49种中药共包含409种化合物,其中62种化合物出现在多个中药中,beta-sitosterol出现次数最多,出现在21种中药种,其次是Stigmasterol和kaempferol,分别出现在18种中药中。
分子对接后的对接结果如下:
全部化合物的对接结果;化合物与中药对接结果不经ADME筛选时,对24个蛋白自由能值求均数,在-7以下的化合物有3151个,其中chelidimerine结果最低,为-10.73,同时在12个蛋白(S、M、N、nsp2、nsp3、nsp6、nsp9、nsp10、nsp12、nsp13、nsp14、orf6)取得最低自由能值,在其他12个蛋白中同样较低,存在于中药白屈菜中,该中药具有清肺止咳,行气止痛,利水解毒作用;其次是neo-przewaquinone a,自由能均数为-10.21,存在于中药丹参中,丹参具有活血祛瘀、通经止痛的作用;未经ADME筛选前10的化合物如表1所示。
经ADME筛选后,在-7以下的化合物有388个,其中(2aR,2'R,4R,6aR,6bS,8aS,8bR,11aS,12aR,12bR)-4-((S)-2-(2,6-dimethylphenyl)propo xy)-5',5',6a,8a-tetramethyl-8-methylenedocosahydro-1H-spiro[pentaleno[2,1-a]phena nthrene-10,2'-pyran]具有最低的自由能值,为-9.29,存在于中药蒺藜中;其次为bisindigotin,自由能为-9.24,存在于中药蓼大青叶、青黛中。
表1未经ADME筛选前10的化合物
Figure BDA0002893929150000131
Figure BDA0002893929150000141
三药三方中化合物与中药对接结果中,不经ADME筛选时,对24个蛋白自由能值求均数,在-7以下的化合物有548个,其中neo-przewaquinone a结果最低,为-10.21,同时在7个蛋白(E、nsp4、nsp7、nsp8、orf7a、orf8、orf10)取得最低自由能值,存在于中药丹参中;其次是Xambioona,自由能均数为-8.89,存在于中药甘草中。
经ADME筛选后,在-7以下的化合物有90个,其中Xambioona具有最低的自由能值;其次为6-(3-oxoindolin-2-ylidene)indolo[2,1-b]quinazolin-12-one,自由能均数为-8.51,存在于中药板蓝根、大青叶及青黛中。
中药的对接结果以六种方式分别进行统计,前十种汇总如表2所示:
表2中药对接结果
Figure BDA0002893929150000151
三药三方中,根据中药的向量值及方剂中不同中药的君臣佐使情况,分别对三药三方求加权平均数;未根据君臣佐使加权时,金花清感颗粒无论按哪种方式进行排序,都具有最高的对接值,其次为连花清感胶囊和血必净;根据君臣佐使加权时,金花清感颗粒在按照三种方式进行排序时具有最高的对接值。具体排序结果如表3所示:
表3三药三方对接结果
Figure BDA0002893929150000152
Figure BDA0002893929150000161
最后,以距离6作为受体蛋白与化合物结合的标准,以此判断化合物与蛋白质结合的位置,并划分化合物与蛋白质的对接位点。
在本实施例中,分子对接结果显示,三药三方六个方剂共3289种化合物成分,与24种新冠蛋白共产生39468个自由能值,其中化合物neo-przewaquinonea对新冠蛋白具有最低的自由能,对于中药,甘草对新冠蛋白具有最低的自由能,三药三方对于新冠病毒的结合力要优于非抗病毒方药,三药三方对于新冠病毒的治疗作用为方剂的整体作用,而非方剂中具体成分。
本实施例基于此策略通过协同过滤算法以及所提出的拉普拉斯矩阵运算,进行中药组方的推荐;具体包括:
S3-1:分子指纹计算:本实施例通过协同过滤算法进行中药组合的推荐,在对接值的基础上添加化合物本身的结构信息作为协同过滤的辅助信息。本实施例选用MACCS和RDK方法提取分子指纹,以此表征化合物的结构特征;
其中,MACCS算法生成长度为167的向量,共检查166个子结构,若具有子结构,赋值为1,否则为0;
RDK it算法检查介于minpath到maxpath之间的子图,并对子图进行哈希运算,该方法考虑原子类型、芳香性、键的类型等3种特征,其生成分子指纹的长度默认为2048;
根据化合物的分子指纹,以中药为单位,累加中药包含化合物的分子指纹,得到中药分子指纹。
S3-2:在herbnet数据库中筛选上述中药所包含的功效、药性、归经等信息,并将上述信息进行标准化后转化为特定长度的向量,构建中药功效性状特征;
该向量长度为739维,其中药性共40维,主要包括寒热、毒性、五味等;归经共14维,功效共685维,如中药包含词特征则赋值为1,否则为0。
S3-3:根据中药分子指纹和中药功效性状特征计算中药之间的相似度,具体为,将中药分子指纹转化为01向量,与中药功效性状特征向量进行拼接后,进行Tanimoto相似度计算,得到中药-中药相似度矩阵。
S4-1:基于中药-中药相似度矩阵,计算482个候选中药和三药三方的相似度,分别得到候选中药和三药三方方剂中每个中药的相似度,即中药-中药相似度矩阵中对应的值,并按照方剂中包含的中药君臣佐使位置加权相加,得到中药和该方剂的相似度值,以此得到候选中药中的中药推荐组方;
同时,还可以根据中药推荐组方,筛选指南中药的潜在中药。
如,中药-连花清瘟颗粒相似度计算:分别计算482个候选中药和连花清瘟胶囊中12味中中药的相似度,取每个连花清瘟胶囊中中药相似度最高的前20味中药,组成12*20的相似中药矩阵,并计算该矩阵中中药在指南推荐中药中所占的比例。
莲花清瘟胶囊中中药协同过滤结果如表4所示,新冠指南第八版共推荐中药90味,莲花清瘟胶囊中君药金银花相似度最高的中药为葎草,前20味药有8味在新冠推荐中药中,分别是连翘、败酱草、款冬花、紫苏、知母、黄连、牛蒡子、当归等;君药连翘相似度最高的中药为五味子,前20味药也有8味在新冠推荐中药中,分别是鱼腥草、黄连、柏芝、金银花、马鞭草、枳实、桂枝和佩兰;臣药苦杏仁、石膏、麻黄中相似度最高的中药分别是白前、五倍子、紫苏子,共有13味中药在指南中;臣药大黄、广藿香、薄荷、贯众、红景天、板蓝根、鱼腥草相似度最高的中药味苦楝皮、苏合香、野菊花、鸦胆子、夏枯草、蓼大青叶、黄药子,共有24味中药在新冠推荐中药中,使药甘草相似度最高的中药中有4味中药在指南中。具体结果如下,其中第一行为连花清瘟胶囊中中药,每一列中按相似度从高到低排列,下划线标记为在指南中出现的中药。
表4莲花清瘟胶囊中中药协同过滤结果
Figure BDA0002893929150000181
Figure BDA0002893929150000191
Figure BDA0002893929150000201
实施例2
本实施例提供一种基于协同过滤算法的新型冠状病毒中药组方推荐系统,包括:
分子对接模块,被配置为获取三药三方中药的化合物,将化合物与新冠蛋白质进行分子对接,得到化合物与蛋白质的结合亲和力;
筛选模块,被配置为基于ADME筛选、结合亲和力和化合物自由能对接阈值对化合物进行筛选,得到有效化合物;
相似计算模块,被配置为根据中药所包含的有效化合物的分子指纹得到中药分子指纹,根据中药分子指纹和中药功效性状特征构建中药-中药相似度矩阵;
推荐模块,被配置为基于中药-中药相似度矩阵以及采用协同过滤算法对候选中药进行筛选,得到中药组方推荐方案。
此处需要说明的是,上述模块对应于实施例1中所述的步骤,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在更多实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1中所述的方法。
实施例1中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (8)

1.一种基于协同过滤算法的新型冠状病毒中药组方推荐方法,其特征在于,包括:
获取三药三方中药的化合物,将化合物与新冠蛋白质进行分子对接,得到化合物与蛋白质的结合亲和力;
基于ADME筛选、结合亲和力和化合物自由能对接阈值对化合物进行筛选,得到有效化合物;
根据中药所包含的有效化合物的分子指纹得到中药分子指纹,根据中药分子指纹和中药功效性状特征构建中药-中药相似度矩阵;
基于中药-中药相似度矩阵以及采用协同过滤算法对候选中药进行筛选,得到中药组方推荐方案;
其中,采用打分函数计算化合物与蛋白质的结合亲和力,据结合亲和力和化合物自由能对接阈值判断化合物与蛋白质的结合状态;
基于中药-中药相似度矩阵,计算候选中药和三药三方中每个中药的相似度,并按照三药三方中包含的中药君臣佐使值进行加权得到中药和三药三方的最终相似度,以此得到候选中药中的中药推荐组方。
2.如权利要求1所述的基于协同过滤算法的新型冠状病毒中药组方推荐方法,其特征在于,采用MACCS和RDK方法提取有效化合物的分子指纹,以此表征有效化合物的结构特征,并将其分子指纹作为协同过滤的辅助信息。
3.如权利要求1所述的基于协同过滤算法的新型冠状病毒中药组方推荐方法,其特征在于,在herbnet数据库中筛选中药包含的功效、药性、归经信息,将上述信息进行标准化后转化为特定长度的向量,以此构建中药功效性状特征。
4.如权利要求1所述的基于协同过滤算法的新型冠状病毒中药组方推荐方法,其特征在于,将中药分子指纹转化为0-1向量,与中药功效性状特征拼接后,进行Tanimoto相似度计算,得到中药-中药相似度矩阵。
5.如权利要求1所述的基于协同过滤算法的新型冠状病毒中药组方推荐方法,其特征在于,还可以根据中药组方推荐方案筛选指南中药的潜在中药。
6.一种基于协同过滤算法的新型冠状病毒中药组方推荐系统,其特征在于,包括:
分子对接模块,被配置为获取三药三方中药的化合物,将化合物与新冠蛋白质进行分子对接,得到化合物与蛋白质的结合亲和力;具体为,采用打分函数计算化合物与蛋白质的结合亲和力;
筛选模块,被配置为基于ADME筛选、结合亲和力和化合物自由能对接阈值对化合物进行筛选,得到有效化合物;其中包括,根据结合亲和力和化合物自由能对接阈值判断化合物与蛋白质的结合状态;
相似计算模块,被配置为根据中药所包含的有效化合物的分子指纹得到中药分子指纹,根据中药分子指纹和中药功效性状特征构建中药-中药相似度矩阵;
推荐模块,被配置为基于中药-中药相似度矩阵以及采用协同过滤算法对候选中药进行筛选,得到中药组方推荐方案;具体为,基于中药-中药相似度矩阵,计算候选中药和三药三方中每个中药的相似度,并按照三药三方中包含的中药君臣佐使值进行加权得到中药和三药三方的最终相似度,以此得到候选中药中的中药推荐组方。
7.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-5任一项所述的方法。
CN202110037705.0A 2021-01-12 2021-01-12 基于协同过滤的新型冠状病毒中药组方推荐方法及系统 Active CN112667922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110037705.0A CN112667922B (zh) 2021-01-12 2021-01-12 基于协同过滤的新型冠状病毒中药组方推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110037705.0A CN112667922B (zh) 2021-01-12 2021-01-12 基于协同过滤的新型冠状病毒中药组方推荐方法及系统

Publications (2)

Publication Number Publication Date
CN112667922A CN112667922A (zh) 2021-04-16
CN112667922B true CN112667922B (zh) 2022-06-28

Family

ID=75414405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110037705.0A Active CN112667922B (zh) 2021-01-12 2021-01-12 基于协同过滤的新型冠状病毒中药组方推荐方法及系统

Country Status (1)

Country Link
CN (1) CN112667922B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114748603B (zh) * 2022-05-07 2024-03-08 河北雄安肽氏科技研发有限公司 一种防治新冠病毒肺炎变异或复阳的药物组合物和应用
CN115862768B (zh) * 2022-12-11 2023-09-01 南昌大学 一种用于大规模药物虚拟筛选的优化方法
CN117899064A (zh) * 2023-03-22 2024-04-19 广州宏康医药科技有限公司 一种能够抑制冠状病毒的大蒜素制剂制备方法和制备设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110996941A (zh) * 2017-05-04 2020-04-10 沃尔特·绍布 用于治疗病原体感染的组合物和治疗过程
CN111773275A (zh) * 2020-03-24 2020-10-16 贵州省中国科学院天然产物化学重点实验室(贵州医科大学天然产物化学重点实验室) 一清复方制剂在制备抗新型冠状病毒感染药物中的应用
CN111816319A (zh) * 2020-07-16 2020-10-23 山东大学 逐步筛选的泌尿系统重疾指标确定方法及风险预测系统
CN111986818A (zh) * 2020-08-21 2020-11-24 南通大学 一种基于tmprss2的新冠covid-19治疗药物筛选系统
CN112185479A (zh) * 2020-09-27 2021-01-05 张升校 一种槐蕾茶抗冠状病毒肺炎的靶点筛选方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150366946A1 (en) * 2013-01-29 2015-12-24 Oshadi Drug Administration Ltd. Pharmaceutical compositions for oral treatment of diabetes
CN104881579B (zh) * 2015-05-25 2018-02-16 长春康彼达科技有限公司 一种治疗气滞型胃脘痛中药组合物筛选方法
US20190259482A1 (en) * 2018-02-20 2019-08-22 Mediedu Oy System and method of determining a prescription for a patient
CN111081316A (zh) * 2020-03-25 2020-04-28 元码基因科技(北京)股份有限公司 用于筛选新冠肺炎候选药物的方法及装置
CN111462921A (zh) * 2020-04-20 2020-07-28 山东大学 一种癫痫用药推荐方法及系统
CN111816305A (zh) * 2020-08-05 2020-10-23 沈国忠 一种基于人工智能的感冒中成药推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110996941A (zh) * 2017-05-04 2020-04-10 沃尔特·绍布 用于治疗病原体感染的组合物和治疗过程
CN111773275A (zh) * 2020-03-24 2020-10-16 贵州省中国科学院天然产物化学重点实验室(贵州医科大学天然产物化学重点实验室) 一清复方制剂在制备抗新型冠状病毒感染药物中的应用
CN111816319A (zh) * 2020-07-16 2020-10-23 山东大学 逐步筛选的泌尿系统重疾指标确定方法及风险预测系统
CN111986818A (zh) * 2020-08-21 2020-11-24 南通大学 一种基于tmprss2的新冠covid-19治疗药物筛选系统
CN112185479A (zh) * 2020-09-27 2021-01-05 张升校 一种槐蕾茶抗冠状病毒肺炎的靶点筛选方法

Also Published As

Publication number Publication date
CN112667922A (zh) 2021-04-16

Similar Documents

Publication Publication Date Title
CN112667922B (zh) 基于协同过滤的新型冠状病毒中药组方推荐方法及系统
Ren et al. Research progress of traditional Chinese medicine against COVID-19
Liu et al. Chinese herbs combined with Western medicine for severe acute respiratory syndrome (SARS)
CN112185479B (zh) 一种槐蕾茶抗新型冠状病毒感染的靶点筛选方法
Yang et al. Network pharmacology studies on the effect of Chai-Ling decoction in coronavirus disease 2019
Zhuang et al. Efficacy and safety of integrated traditional Chinese and Western medicine against COVID‐19: A systematic review and meta‐analysis
CN112107662B (zh) 治疗慢性胃炎及胃癌前病变的中药组合物及其药剂和应用
CN105738519B (zh) 一种基于量效色卡的气滞胃痛颗粒抗溃疡质量控制方法
CN1957999B (zh) 一种中药组合物及其制备方法和检测方法
Xue et al. Network pharmacology combined with molecular docking and experimental verification reveals the bioactive components and potential targets of danlong dingchuan decoction against asthma
Yu et al. Analysis of herbal mechanisms and prescriptions for chronic cerebral circulatory insufficiency based on data mining and network pharmacology
Lu et al. Integrating network pharmacology, transcriptome and artificial intelligence for investigating into the effect and mechanism of Ning Fei Ping Xue decoction against the acute respiratory distress syndrome
CN112289378A (zh) 中药组合物的确定方法以及其药效的确定方法
Wenxiang et al. Traditional Chinese medicine Master XIONG Jibo’s medication experience in treating arthralgia syndrome through data mining
Yang et al. Signaling potential therapeutic herbal medicine prescription for treating COVID-19 by collaborative filtering
Qin et al. Exploring the bioactive compounds of Feiduqing formula for the prevention and management of COVID-19 through network pharmacology and molecular docking
CN101224241B (zh) 黑素再生滴丸
CN108159297A (zh) 一种疏风解毒胶囊及其制备方法与制药用途
CN113827669B (zh) 一种治疗急性肺损伤/急性呼吸窘迫综合征的中药组合物及其应用
Huang et al. Study on the feasibility of Danggui Longhui pill in the treatment of COVID-19 based on network pharmacology
Xu et al. Astragali Radix− Salviae Miltiorrhizae Radix Et Rhizoma” herb pair in the treatment of liver cirrhosis and its pharmacological mechanisms
CN103191371A (zh) 一种预防/治疗呼吸系统疾病的药物组合物及其用途
Wang et al. Uncovering the mechanisms of Yi Qi Tong Qiao Pill in the treatment of allergic rhinitis based on Network target analysis
Zhao et al. Study on molecular mechanism of Yiqing capsule in treating upper respiratory tract infection based on network pharmacology
Liu et al. Exploring the prescription in rules and mechanism for cerebral infarction based on data mining and network Pharmacology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant