CN116226197B - 一种快速匹配的侗医药数据库及数据检索方法 - Google Patents
一种快速匹配的侗医药数据库及数据检索方法 Download PDFInfo
- Publication number
- CN116226197B CN116226197B CN202310198026.0A CN202310198026A CN116226197B CN 116226197 B CN116226197 B CN 116226197B CN 202310198026 A CN202310198026 A CN 202310198026A CN 116226197 B CN116226197 B CN 116226197B
- Authority
- CN
- China
- Prior art keywords
- dong
- medicine
- dong medicine
- combination
- prescription
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003814 drug Substances 0.000 title claims abstract description 281
- 238000000034 method Methods 0.000 title claims abstract description 29
- 201000010099 disease Diseases 0.000 claims abstract description 117
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 117
- 229940079593 drug Drugs 0.000 claims abstract description 41
- 230000009471 action Effects 0.000 claims abstract description 31
- 238000013075 data extraction Methods 0.000 claims abstract description 11
- 238000013500 data storage Methods 0.000 claims abstract description 11
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 9
- 238000012216 screening Methods 0.000 claims abstract description 8
- 230000000875 corresponding effect Effects 0.000 claims description 26
- 238000013507 mapping Methods 0.000 claims description 10
- 230000000144 pharmacologic effect Effects 0.000 claims description 9
- 239000000890 drug combination Substances 0.000 claims description 3
- 239000000306 component Substances 0.000 description 18
- 239000000126 substance Substances 0.000 description 12
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 108091005942 ECFP Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000005426 pharmaceutical component Substances 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 229940127557 pharmaceutical product Drugs 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 229940126680 traditional chinese medicines Drugs 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Fuzzy Systems (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及用于信息检索的数据库结构技术领域,尤其涉及一种快速匹配的侗医药数据库及数据检索方法。该侗医药数据库包括:数据存储系统,存储有现有药物分子式及其作用靶点;前端数据提取系统,用于获取待检索分子式以及待检索分子式的来源侗药;后端数据提取系统,用于根据来源侗药确定待检索分子式的关联疾病,并根据关联疾病确定治疗关联疾病的作用靶点以组成检索靶点集合,从数据存储系统中筛选出具有检索靶点集合中的作用靶点的现有药物分子式组成中间数据集;数据比较系统,用于将待检索分子式与中间数据集中的现有药物分子式进行比较以获取最为接近的现有药物分子式。本发明提供的侗医药数据库及数据检索方法可以提高检索速度。
Description
技术领域
本发明涉及用于信息检索的数据库结构技术领域,尤其涉及一种快速匹配的侗医药数据库及数据检索方法。
背景技术
侗医药是传统中医药的一种,而侗药通常来自于野生植物。
在传统医学现代化发展的过程中,需要对使用到的侗药的成分进行研究,确定侗药真正的活性成分,并明确该活性成分的作用靶点。
为节约研究时间,现有技术是在研究人员从侗药中提取出新的化学成分后,将该化学成分与目前已公开的药物成分进行比较,通过比较得到现有最为接近的药物成分,进而根据该药物成分推测该新提取出的化学成分的作用靶点。
但是现有的药物成分繁多,从一种侗药中提取出的新化学成分也很多,并且化学成分的匹配也需要占用大量的计算资源,医药数据库在多请求和高并发的状态下,采用传统多线程遍历检索的方式,需要消耗大量的计算资源,检索的速度缓慢。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明提供了一种快速匹配的侗医药数据库及数据检索方法,可以节约计算资源,提高检索的速度。
第一方面,本发明提供了一种快速匹配的侗医药数据库,所述侗医药数据库包括:
数据存储系统,所述数据存储系统存储有现有药物分子式及其对应的作用靶点;
前端数据提取系统,所述前端数据提取系统用于获取用户提供的待检索分子式以及待检索分子式的来源侗药;
后端数据提取系统,所述后端数据提取系统用于根据所述来源侗药确定待检索分子式的关联疾病,并根据所述关联疾病确定治疗所述关联疾病的作用靶点以组成检索靶点集合,从数据存储系统中筛选出具有检索靶点集合中的作用靶点的现有药物分子式组成中间数据集;
数据比较系统,所述数据比较系统用于将待检索分子式与中间数据集中的现有药物分子式进行比较以获取最为接近的现有药物分子式。
可选的,根据所述来源侗药确定待检索分子式的关联疾病包括:
从侗药-关联疾病映射数据库中检索来源侗药对应的关联疾病;
所述侗药-关联疾病映射数据库在通过以下步骤获取侗药的关联疾病后,将侗药及侗药的关联疾病进行组合得到:
获取侗医药处方及其对应疾病;
从侗医药处方获取关联侗药组合;
根据关联侗药组合在不同的侗医药处方中出现的次数确定关联侗药组合的关联疾病;
侗药组合中的侗药的关联疾病被配置为侗药组合的关联疾病。
可选的,从侗医药处方获取关联侗药组合包括:
依次遍历侗医药处方中出现的所有侗药,并执行以下步骤:
获取具有当前遍历的侗药的侗医药处方,形成第一处方集合;
对所述第一处方集合中出现的药物进行频次统计,选取出现频次的排名在第一预设数值以上的药物作为当前遍历药物的配合药物以形成配合药物集合;
将当前遍历的侗药和配合药物集合中的配合药物以第二预设数值构成一组以获得关联侗药组合。
可选的,根据关联侗药组合在不同的侗医药处方中出现的次数确定关联侗药组合的关联疾病,包括以下步骤:
遍历关联侗药组合,并执行以下步骤:
获取具有当前遍历的关联侗药组合的处方,形成第二处方集合;
对所述第二处方集合中侗医药处方对应的疾病进行统计以得到侗药组合的关联疾病。
可选的,构成中间数据集的现有药物分子式具有第三预设数值以上的检索靶点集合中的作用靶点。
可选的,根据所述关联疾病确定治疗所述关联疾病的作用靶点以组成检索靶点集合包括:
从DisGeNet数据库中获得关联疾病的作用靶点。
第二方面,本发明提供了一种数据检索方法,所述数据检索方法包括以下步骤:
获取用户提供的待检索分子式以及待检索分子式的来源侗药;
根据所述来源侗药确定待检索分子式的关联疾病,并根据所述关联疾病确定治疗所述关联疾病的作用靶点以组成检索靶点集合,筛选出具有检索靶点集合中的作用靶点的现有药物分子式组成中间数据集;
将待检索分子式与中间数据集中的现有药物分子式进行比较以获取最为接近的现有药物分子式。
本发明提供的技术方案与现有技术相比具有如下优点:
本发明提供的一种快速匹配的侗医药数据库及数据检索方法通过待检索分子式的来源侗药以及现有的侗医药处方及侗医药处方对应的疾病,确定来源侗药的关联疾病,通过查询得到关联疾病的作用靶点作为检索靶点,将具有检索靶点的现有药物筛选出来形成与待检索分子式最相关的中间数据集,以此减少待检索分子式的检索域。
因此本发明提供的一种快速匹配的侗医药数据库及数据检索方法不需要对侗医药数据库存储的全部分子式进行一一比较,可以减少消耗的计算资源,增加检索的速度。
附图说明
图1为本发明实施例提供的侗医药数据库的应用场景示意图;
图2为本发明实施例提供的侗医药数据库的结构示意图;
图3为本发明实施例提供的数据检索方法的流程示意图。
实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面将对本发明的方案进行进一步描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但本发明还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本发明的一部分实施例,而不是全部的实施例。
图1为本发明实施例提供的侗医药数据库的应用场景示意图。
侗医药数据库一般被配置在远程服务器中,在前端数据提取系统接收到用户通过其个人终端向侗医药数据库发送的待检索分子式及待检索分子式的来源侗药后,通过本发明实施例在以下阐述的方法令后端数据提取系统生成与待检索分子式最为关联的检索域形成中间数据集,通过将待检索分子式与中间数据集进行比较和检索,进而避免对侗医药数据库的全部分子式进行全部的遍历比较,因此可以减少消耗的计算资源,增加检索的速度。
图2为本发明实施例提供的侗医药数据库的结构示意图。
在本发明实施例中,侗医药数据库包括以下部分:
数据存储系统,所述数据存储系统存储有现有药物分子式及其对应的作用靶点。
具体的,所述数据存储系统中的现有药物分子式及其对应的作用靶点是可以从公开渠道获得的药品的公开信息,例如可以从美国FDA药品数据库(U.S. FDA DrugsDatabase)或者是商业的DrugBank数据库中获得,在此不再列举。
前端数据提取系统,所述前端数据提取系统用于获取用户提供的待检索分子式以及待检索分子式的来源侗药。
后端数据提取系统,所述后端数据提取系统用于根据所述来源侗药确定待检索分子式的关联疾病,并根据所述关联疾病确定治疗所述关联疾病的作用靶点以组成检索靶点集合,从数据存储系统中筛选出具有检索靶点集合中的作用靶点的现有药物分子式组成中间数据集;
具体的,根据所述来源侗药确定待检索分子式的关联疾病包括:
从侗药-关联疾病映射数据库中检索来源侗药对应的关联疾病;
所述侗药-关联疾病映射数据库在通过以下步骤获取侗药的关联疾病后,将侗药及侗药的关联疾病进行组合得到:
获取侗医药处方及其对应疾病;
从侗医药处方获取关联侗药组合;
根据关联侗药组合在不同的侗医药处方中出现的次数确定关联侗药组合的关联疾病;
侗药组合中的侗药的关联疾病被配置为侗药组合的关联疾病。
在本发明实施例中,所述侗医药处方及其对应疾病是从医院的病历数据库中直接导出的所有的侗医药处方及侗医药处方对应的疾病。
在本发明实施例中,是通过关联侗药组合在不同的侗医药处方中出现的次数去确定侗药的关联疾病,而不是直接根据侗药在不同的侗医药处方中出现的次数去确定侗药的关联疾病。
由于从医院收集的处方数据并不规则,发病率高的疾病对应的侗医药处方数据会多一些,发病率低的疾病对应的侗医药处方数据会少一些,而侗药有可能是作为协调作用的辅药,与该侗医药处方对应的疾病治疗的作用靶点关联并不大。因此直接统计侗药在侗医药处方中出现的次数去确定侗药的关联疾病的方法准确率并不高。
为了提高得到的侗药的关联疾病的准确性,本发明实施例先通过确定侗药的关联侗药组合的关联疾病进而确定侗药的关联疾病。在实践中,侗药是需要联合使用去治疗某种疾病,这种联合使用是具有固定的搭配,即包含在固定搭配内的侗药可以确定是用于治疗该疾病而不是作为辅药使用的,因此通过先找到关联侗药组合的关联疾病进而去确定侗药的关联疾病的准确性会更高。
具体的,从侗医药处方获取关联侗药组合包括:
依次遍历侗医药处方中出现的所有侗药,并执行以下步骤:
从医院数据库中导出的侗医药处方有很多,依次遍历所有侗医药处方涉及的所有侗药,然后获取具有当前遍历的侗药的侗医药处方,形成第一处方集合;
对所述第一处方集合中出现的药物进行频次统计,选取出现频次的排名在第一预设数值以上的药物作为当前遍历药物的配合药物以形成配合药物集合;
将当前遍历的侗药和配合药物集合中的配合药物以第二预设数值构成一组以获得关联侗药组合。
在本发明实施例中,对所述第一处方集合中出现的药物分别进行在第一处方集合中重复次数的统计后,按由大到小排序即可得到第一处方集合中出现的药物的出现频次排名。
在本发明实施例中,所述第一预设数值为3。在其他实施例中,所述第一预设数值需要根据药物间频次的大小是否相近进行调节,一般是设置为2-5中的任一数值。
在本实施例中,所述第二预设数值为2。在其他实施例中,所述第二预设数值是可以进行调节的,第二预设数值越小中间数据集的数据就越多,一般是设置为2-5中的任一数值。
具体的,根据关联侗药组合在不同的侗医药处方中出现的次数确定关联侗药组合的关联疾病,包括:
遍历关联侗药组合,并执行以下步骤:
获取具有当前遍历的关联侗药组合的侗医药处方,形成第二处方集合;
对所述第二处方集合中侗医药处方对应的疾病进行统计以得到侗药组合的关联疾病。
具体的,将具有当前遍历的关联侗药组合的侗医药处方筛选出来,形成第二处方集合后,对第二处方集合中的处方对应的疾病进行统计即可得到侗药组合的关联疾病。应当注意的是关联疾病并不止限于一个疾病,其可以是第二处方集合涉及到的多个疾病或所有疾病。
具体的,在根据所述关联疾病确定治疗所述关联疾病的作用靶点以组成检索靶点集合中,可以从DisGeNet数据库中获得关联疾病的作用靶点以组成检索靶点集合。
具体的,在本实施例中,构成中间数据集的现有药物分子式具有第三预设数值以上的检索靶点集合中的作用靶点。
所述第三预设数值默认设置为3。在一些其他的实施例中,所述第三预设数值可以通过前端数据提取系统由用户进行设置。
在本实施例中,构成中间数据集的现有药物分子式至少具有第三预设数值以上的检索靶点,以确保中间数据集中的现有药物分子式是与待检索分子式的来源侗药是强相关的。
由于从侗药中提取的新化学成分很多,但真正具有治病效果的化学成分只有极少的部分。本发明实施例通过设置第三预设数值,能够使得中间数据集中的现有药物是与侗药的关联疾病是强相关的。
由于从该侗药中提取的化学物质也是与该侗药的关联疾病是强相关的,若该新提取的化学物质在中间数据集检索后,并没有发现相似的现有药物成分,即可以确定该提取的新化学成分极大概率是无用成分,可以快速试验下一个提取的新化学成分。
并且本发明实施例提供的第三预设数值是可以由用户提供的,用户可以根据自己意愿对第三预设数值进行调节,进而对中间数据集中的数据相关性进行调节,以此实现快速筛查从侗药中提取到的新化学成分。
数据比较系统,所述数据比较系统用于将待检索分子式与中间数据集中的现有药物分子式进行比较以获取最为接近的现有药物分子式。
具体的,数据存储系统中存储的现有药物分子式是以分子指纹的格式进行存储的,在进行数据比较时,先将待检索分子式进行分子指纹化,常用的有ECFP算法或者FCFP算法,采用何种算法需要根据数据存储系统中现有药物分子式的分子指纹的格式进行选择。
在分子指纹化后可以通过计算待检索分子式和现有药物分子式的Tanimoto距离来计算相似性。上述数据比较部分涉及到的技术为现有技术,非本发明实施例提供的技术贡献,在此不在赘述。
选取与待检索分子式相似性最高的现有药物分子式即可获得最为接近的现有药物分子。
需要说明的是,上述实施例提供的侗医药数据库,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将服务器或设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
图3为本发明实施例提供的数据检索方法的流程示意图。
S301:获取用户提供的待检索分子式以及待检索分子式的来源侗药;
S302:根据所述来源侗药确定待检索分子式的关联疾病,包括:
从侗药-关联疾病映射数据库中检索来源侗药对应的关联疾病;
所述侗药-关联疾病映射数据库在通过以下步骤获取侗药的关联疾病后,将侗药及侗药的关联疾病进行组合得到:
获取侗医药处方及其对应疾病;
从侗医药处方获取关联侗药组合;
根据关联侗药组合在不同的侗医药处方中出现的次数确定关联侗药组合的关联疾病,包括以下步骤:
遍历关联侗药组合,并执行以下步骤:
获取具有当前遍历的关联侗药组合的侗医药处方,形成第二处方集合;
对所述第二处方集合中侗医药处方对应的疾病进行统计以得到侗药组合的关联疾病。
侗药组合中的侗药的关联疾病被配置为侗药组合的关联疾病。
S303:根据所述关联疾病确定治疗所述关联疾病的作用靶点以组成检索靶点集合;
S304:筛选出具有检索靶点集合中的作用靶点的现有药物分子式组成中间数据集;
具体的,构成中间数据集的现有药物分子式具有第三预设数值以上的检索靶点集合中的作用靶点。
S305:将待检索分子式与中间数据集中的现有药物分子式进行比较以获取最为接近的现有药物分子式。
上述实施例提供的方法与侗医药数据库的实施例属于同一构思,其具体实现过程详见装置实施例,这里不再赘述。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.一种快速匹配的侗医药数据库,其特征在于,所述侗医药数据库包括:
数据存储系统,所述数据存储系统存储有现有药物分子式及其对应的作用靶点;
前端数据提取系统,所述前端数据提取系统用于获取用户提供的待检索分子式以及待检索分子式的来源侗药;
后端数据提取系统,所述后端数据提取系统用于根据所述来源侗药确定待检索分子式的关联疾病,并根据所述关联疾病确定治疗所述关联疾病的作用靶点以组成检索靶点集合,从数据存储系统中筛选出具有检索靶点集合中的作用靶点的现有药物分子式组成中间数据集;
数据比较系统,所述数据比较系统用于将待检索分子式与中间数据集中的现有药物分子式进行比较以获取最为接近的现有药物分子式;
根据所述来源侗药确定待检索分子式的关联疾病包括:
从侗药-关联疾病映射数据库中检索来源侗药对应的关联疾病;
所述侗药-关联疾病映射数据库在通过以下步骤获取侗药的关联疾病后,将侗药及侗药的关联疾病进行组合得到:
获取侗医药处方及其对应疾病;
从侗医药处方获取关联侗药组合;
根据关联侗药组合在不同的侗医药处方中出现的次数确定关联侗药组合的关联疾病;
侗药组合中的侗药的关联疾病被配置为侗药组合的关联疾病。
2.根据权利要求1所述的一种快速匹配的侗医药数据库,其特征在于,从侗医药处方获取关联侗药组合包括:
依次遍历侗医药处方中出现的所有侗药,并执行以下步骤:
获取具有当前遍历的侗药的侗医药处方,形成第一处方集合;
对所述第一处方集合中出现的药物进行频次统计,选取出现频次的排名在第一预设数值以上的药物作为当前遍历药物的配合药物以形成配合药物集合;
将当前遍历的侗药和配合药物集合中的配合药物以第二预设数值构成一组以获得关联侗药组合。
3.根据权利要求1所述的一种快速匹配的侗医药数据库,其特征在于,根据关联侗药组合在不同的侗医药处方中出现的次数确定关联侗药组合的关联疾病,包括以下步骤:
遍历关联侗药组合,并执行以下步骤:
获取具有当前遍历的关联侗药组合的侗医药处方,形成第二处方集合;
对所述第二处方集合中侗医药处方对应的疾病进行统计以得到侗药组合的关联疾病。
4.根据权利要求1所述的一种快速匹配的侗医药数据库,其特征在于,构成中间数据集的现有药物分子式具有第三预设数值以上的检索靶点集合中的作用靶点。
5.数据检索方法,其特征在于,所述数据检索方法包括以下步骤:
获取用户提供的待检索分子式以及待检索分子式的来源侗药;
根据所述来源侗药确定待检索分子式的关联疾病,并根据所述关联疾病确定治疗所述关联疾病的作用靶点以组成检索靶点集合,筛选出具有检索靶点集合中的作用靶点的现有药物分子式组成中间数据集;
将待检索分子式与中间数据集中的现有药物分子式进行比较以获取最为接近的现有药物分子式;
根据所述来源侗药确定待检索分子式的关联疾病包括:
从侗药-关联疾病映射数据库中检索来源侗药对应的关联疾病;
所述侗药-关联疾病映射数据库在通过以下步骤获取侗药的关联疾病后,将侗药及侗药的关联疾病进行组合得到:
获取侗医药处方及其对应疾病;
从侗医药处方获取关联侗药组合;
根据关联侗药组合在不同的侗医药处方中出现的次数确定关联侗药组合的关联疾病;
侗药组合中的侗药的关联疾病被配置为侗药组合的关联疾病。
6.根据权利要求5所述的数据检索方法,其特征在于,从侗医药处方获取关联侗药组合包括:
依次遍历侗医药处方中出现的所有侗药,并执行以下步骤:
获取具有当前遍历的侗药的侗医药处方,形成第一处方集合;
对所述第一处方集合中出现的药物进行频次统计,选取出现频次的排名在第一预设数值以上的药物作为当前遍历药物的配合药物以形成配合药物集合;
将当前遍历的侗药和配合药物集合中的配合药物以第二预设数值构成一组以获得关联侗药组合。
7.根据权利要求5所述的数据检索方法,其特征在于,根据关联侗药组合在不同的侗医药处方中出现的次数确定关联侗药组合的关联疾病,包括以下步骤:
遍历关联侗药组合,并执行以下步骤:
获取具有当前遍历的关联侗药组合的侗医药处方,形成第二处方集合;
对所述第二处方集合中侗医药处方对应的疾病进行统计以得到侗药组合的关联疾病。
8.根据权利要求5所述的数据检索方法,其特征在于,构成中间数据集的现有药物分子式具有第三预设数值以上的检索靶点集合中的作用靶点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310198026.0A CN116226197B (zh) | 2023-03-03 | 2023-03-03 | 一种快速匹配的侗医药数据库及数据检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310198026.0A CN116226197B (zh) | 2023-03-03 | 2023-03-03 | 一种快速匹配的侗医药数据库及数据检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116226197A CN116226197A (zh) | 2023-06-06 |
CN116226197B true CN116226197B (zh) | 2023-12-15 |
Family
ID=86572821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310198026.0A Active CN116226197B (zh) | 2023-03-03 | 2023-03-03 | 一种快速匹配的侗医药数据库及数据检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116226197B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110867256A (zh) * | 2019-10-17 | 2020-03-06 | 湖南中医药大学 | 一种优化肝复乐抗肝癌组方药理学分析方法和系统 |
CN110890136A (zh) * | 2019-11-13 | 2020-03-17 | 安徽中医药大学 | 一种中药药理分析方法 |
US20220382562A1 (en) * | 2021-05-27 | 2022-12-01 | Ovh | Systems and methods for generating a target dataset having a target data format on a user device |
-
2023
- 2023-03-03 CN CN202310198026.0A patent/CN116226197B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110867256A (zh) * | 2019-10-17 | 2020-03-06 | 湖南中医药大学 | 一种优化肝复乐抗肝癌组方药理学分析方法和系统 |
CN110890136A (zh) * | 2019-11-13 | 2020-03-17 | 安徽中医药大学 | 一种中药药理分析方法 |
US20220382562A1 (en) * | 2021-05-27 | 2022-12-01 | Ovh | Systems and methods for generating a target dataset having a target data format on a user device |
Also Published As
Publication number | Publication date |
---|---|
CN116226197A (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113707297B (zh) | 医疗数据的处理方法、装置、设备及存储介质 | |
Wang et al. | Efficient approximate entity extraction with edit distance constraints | |
CN109753516B (zh) | 一种病历搜索结果的排序方法和相关装置 | |
Ahmed | Implementing relevance feedback for content-based medical image retrieval | |
BR112015030417B1 (pt) | Sistema de computador, método implementado por computador e sistema para resultados de busca de linguagem natural para consultas de intenção | |
CN109284353B (zh) | 医案检索方法、装置、计算机设备和存储介质 | |
CN108899072B (zh) | 中药药方推荐方法、装置、计算机设备和存储介质 | |
CN104199855B (zh) | 一种针对中医药学信息的检索系统和方法 | |
US20070253624A1 (en) | Methods and apparatus for clustering templates in non-metric similarity spaces | |
US20220005564A1 (en) | Semantic search for a health information exchange | |
KR102521963B1 (ko) | 임상시험 검색을 위한 데이터 분류 장치, 시스템 및 방법 | |
Naasani | COMPARE analysis, a bioinformatic approach to accelerate drug repurposing against Covid-19 and other emerging epidemics | |
Alzyadat et al. | A Recruitment Big Data Approach to interplay of the Target Drugs. | |
CN116226197B (zh) | 一种快速匹配的侗医药数据库及数据检索方法 | |
CN111986771A (zh) | 医疗处方查询方法、装置、电子设备及存储介质 | |
Hassan et al. | Comparison of distance metrics for hierarchical data in medical databases | |
CN109190029B (zh) | 云端智能信息推送平台工作方法 | |
CN111477287A (zh) | 一种药物靶点预测方法、装置、设备及介质 | |
Nilakantan et al. | A ring-based chemical structural query system: use of a novel ring-complexity heuristic | |
Zhao et al. | A novel classification method for syndrome differentiation of patients with AIDS | |
Hasan et al. | A scalable framework to analyze data from heterogeneous sources at different levels of granularity | |
CN114691821A (zh) | 基于医疗术语构建知识图谱的智能检索方法、系统、终端以及介质 | |
Shang et al. | Adverse drug reaction early warning using user search data | |
US10289640B2 (en) | Method and system for retrieval of findings from report documents | |
Hao et al. | Addressing Imbalance for Class Incremental Learning in Medical Image Classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |