CN107220484B - 一种中医方药数据分析挖掘系统 - Google Patents

一种中医方药数据分析挖掘系统 Download PDF

Info

Publication number
CN107220484B
CN107220484B CN201710324135.7A CN201710324135A CN107220484B CN 107220484 B CN107220484 B CN 107220484B CN 201710324135 A CN201710324135 A CN 201710324135A CN 107220484 B CN107220484 B CN 107220484B
Authority
CN
China
Prior art keywords
module
chinese medicine
recipe
data
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710324135.7A
Other languages
English (en)
Other versions
CN107220484A (zh
Inventor
韩涛
黄海量
汤继芹
吕征
郭炜
刘西建
仇大伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Traditional Chinese Medicine
Original Assignee
Shandong University of Traditional Chinese Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Traditional Chinese Medicine filed Critical Shandong University of Traditional Chinese Medicine
Priority to CN201710324135.7A priority Critical patent/CN107220484B/zh
Publication of CN107220484A publication Critical patent/CN107220484A/zh
Application granted granted Critical
Publication of CN107220484B publication Critical patent/CN107220484B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

一种中医方药数据分析挖掘系统,包括方药数据库、数据输入模块、标准输出模块、数据分析挖掘模块;所述数据输入模块用于输入方药数据;所述方药数据库用于接收数据输入模块的方药数据,并为各个模块提供方药数据;所述标准输出模块用于从方药数据库中提取方药数据并按照指定格式输出格式数据;所述数据分析挖掘模块用于从方药数据库获取方药数据,并对方药数据进行数据分析挖掘处理。本系统设计合理,能够得到深层次的中医方药信息。

Description

一种中医方药数据分析挖掘系统
技术领域:
本发明涉及一种中医方药数据分析挖掘系统。
背景技术:
中医药是中华民族的瑰宝,是重要的社会资源。而中医药的最主要的载体就是中药方药。中医方药作为从历代中医先贤智慧的结晶,得到了越来越多的重视。正因如此,随着现在科学技术的发展,对原始的中医方药作进行分析挖掘以得到深层次的信息也愈加重要。但是现有的分析方法局限于利用一些现有的分析方法移植到中药领域进行分析,或者是虽然专用于中药,但是分析维度局限性较大,无法分析出各个方药之间的潜在信息。现有技术对此并没有解决之策。
发明内容:
本发明的目的就是针对现有技术存在的上述缺点,提供了一种中医方药数据分析挖掘系统,系统设计合理,能够得到深层次的中医方药信息,解决了现有技术中存在的问题。
本发明为解决上述技术问题所采用的技术方案是:
一种中医方药数据分析挖掘系统,包括方药数据库、数据输入模块、标准输出模块、数据分析挖掘模块;
所述数据输入模块用于输入方药数据;
所述方药数据库用于接收数据输入模块的方药数据,并为各个模块提供方药数据;
所述标准输出模块用于从方药数据库中提取方药数据并按照指定格式输出格式数据;
所述数据分析挖掘模块用于从方药数据库获取方药数据,并对方药数据进行数据分析挖掘处理。
优选的,所述方药数据包括如下五个维度:指定中药、中医证候、西医疾病、中医疾病、中医症状。
优选的,所述标准输出模块输出适于SAS、SPSS的格式数据。
优选的,所述数据分析挖掘模块包括分析模块,聚类模块、关联模块、组合模块;
所述分析模块用于对方药数据分别根据指定中药、中医证候、西医疾病、中医疾病、中医症状分别进行成组分析;
所述聚类模块根据设定聚类阈值,在指定中药、中医证候、西医疾病、中医疾病、中医症状中五个维度中综合判断,对药物进行成组分析;
所述关联模块根据分析模块得到的指定中药成组分析情况,对药物出现频次超过设定阈值的药物进行与其他药物的网络联系统计;
所述组合模块根据分析模块得到的药物分析情况,对药物出现频次超过设定值的药物分别分析与其他药物同时出现的频次。
优选的,所述关联模块给出各个药物后统计该药物出现频次和与该药物有网络联系的药物数量。
优选的,所述聚类阈值包括数值阈值模块和维度描述比较模块,所述维度描述比较模块用于分别将不同方药中的指定中药、中医证候、西医疾病、中医疾病、中医症状进行相似度对比,若相似度达到设定值,则将信息传递给数值阈值模块;所述数值阈值模块统计指定中药、中医证候、西医疾病、中医疾病、中医症状中经维度描述比较模块比较后,相似度高的维度的数目,并判断是否达到聚类阈值的要求。
与现有技术相比,本发明的优点是:优化系统本身功能,提供对外的接口,即标准输出模块可以输出适合SAS和SPSS的格式数据;提供不同的分析维度进行数据分析,分析模块提供原始的分析基础,聚类模块能够在指定中药、中医证候、西医疾病、中医疾病、中医症状五个维度内寻找相切和的点,并把这些点根据聚类阈值的限制,揭开方药数据之间的联系,而关联模块和组合模块用于对一些高频次出现的药物进行数据挖掘,并得到和其相关的其他药物的组合信息。
附图说明:
图1为本发明的示意图。
具体实施方式:
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。
如图1所示,一种中医方药数据分析挖掘系统,包括方药数据库、数据输入模块、标准输出模块、数据分析挖掘模块;
所述数据输入模块用于输入方药数据;
所述方药数据库用于接收数据输入模块的方药数据,并为各个模块提供方药数据;
所述标准输出模块用于从方药数据库中提取方药数据并按照指定格式输出格式数据;
所述数据分析挖掘模块用于从方药数据库获取方药数据,并对方药数据进行数据分析挖掘处理。实现方药数据的输入和输出。
所述方药数据包括方剂名称、指定中药、中医证候、西医疾病、中医疾病、中医症状。通过设定方药数据的范围,能够强化输入信息的有效性,也能便于后期进行数据分析挖掘时,基础数据的充足。
所述标准输出模块输出适于SAS、SPSS的格式数据。提供本系统与其他传统系统的一个输出口。
所述数据分析挖掘模块包括分析模块,聚类模块、关联模块、组合模块;
所述分析模块用于对方药数据分别根据指定中药、中医证候、西医疾病、中医疾病、中医症状分别进行成组分析;分析模块主要是根据指定中药、中医证候、西医疾病、中医疾病、中医症状对方药进行成组分析,根据药物进行成组分析能够解析出各个药物在所有方药中出现的频次;根据中医证候进行成组分析能够看出各个中医症候有哪些方药可以进行治疗;根据西医疾病进行成组分析则能够根据西医疾病的名称与对其有治疗效果的方药对应起来;根据中医疾病进行成组分析则能够根据中医疾病的名称与对其有治疗效果的方药对应起来;根据根据中医症状进行成组分析能够看出各个中医症状有哪些方药可以进行治疗。
所述聚类模块根据设定聚类阈值,在指定中药、中医证候、西医疾病、中医疾病、中医症状中五个维度中综合判断,对药物进行成组分析;所述聚类阈值包括数值阈值模块和维度描述比较模块,所述数值阈值模块为指定中药、中医证候、西医疾病、中医疾病、中医症状中相似度高的数目;所述维度描述比较模块用于分别将不同方药中的指定中药、中医证候、西医疾病、中医疾病、中医症状进行相似度对比。进行多个维度的判断能够识别出哪些药物与相应的中医证候、西医疾病、中医疾病、中医症状分别对应,从而挖掘出一个深层次的对应关系。由此可以得到,哪一味或者哪几味药对相应的中医证候、西医疾病、中医疾病、中医症状有最核心的作用。数值阈值模块规定了在如下五个维度:指定中药、中医证候、西医疾病、中医疾病、中医症候,相似度高的数目为多少时,对方药数据进行成组分析;维度描述比较模块用于对指定中药、中医证候、西医疾病、中医疾病、中医症候逐个进行对比,并确定是否近似,若近似度达到80%或者以上,则将此维度计入数值阈值模块。
所述关联模块根据分析模块得到的指定中药成组分析情况,对药物出现频次超过设定阈值的药物进行与其他药物的网络联系统计;
所述组合模块根据分析模块得到的药物分析情况,对药物出现频次超过设定值的药物分别分析与其他药物同时出现的频次。
所述关联模块给出各个药物后统计该药物出现频次和与该药物有网络联系的药物数量。关联模块和组合模块用于对一些高频次出现的药物进行数据挖掘,并得到和其相关的其他药物的组合信息。
本系统用于中医方药的数据处理以及分析挖掘工作,首先通过数据输入模块解决了数据输入的问题,并且在数据输入模块通过设置子目录解决了数据输入规范化的问题;而数据输出模块则解决了内部数据与其他分析软件数据交互的问题;数据分析挖掘模块则立足于方药的基础数据,通过其内部的分析模块提供基础的分析数据,在此基础上,聚类模块立足于系统的整体分析,在指定中药、中医证候、西医疾病、中医疾病、中医症状五个维度内寻找各个方药相切和的点,并把这些点根据聚类阈值的限制,给出最终的聚类结果,为研究人员发现其内在联系,提供底层的数据和思路;而关联模块和组合模块用于对一些高频次出现的药物进行数据挖掘,并得到和其相关的其他药物的组合信息,从而为某些疾病的治疗提供一基础性方药,并为各个药物之间存在的协同等作用提供数据基础和依据。
上述具体实施方式不能作为对本发明保护范围的限制,对于本技术领域的技术人员来说,对本发明实施方式所做出的任何替代改进或变换均落在本发明的保护范围内。
本发明未详述之处,均为本技术领域技术人员的公知技术。

Claims (5)

1.一种中医方药数据分析挖掘系统,其特征在于:包括方药数据库、数据输入模块、标准输出模块、数据分析挖掘模块;
所述数据输入模块用于输入方药数据;
所述方药数据库用于接收数据输入模块的方药数据,并为各个模块提供方药数据;
所述标准输出模块用于从方药数据库中提取方药数据并按照指定格式输出格式数据;
所述数据分析挖掘模块用于从方药数据库获取方药数据,并对方药数据进行数据分析挖掘处理;
所述数据分析挖掘模块包括分析模块,聚类模块、关联模块、组合模块;
所述分析模块用于对方药数据分别根据指定中药、中医证候、西医疾病、中医疾病、中医症状分别进行成组分析;
所述聚类模块根据设定聚类阈值,在指定中药、中医证候、西医疾病、中医疾病、中医症状中五个维度中综合判断,对药物进行成组分析;
所述关联模块根据分析模块得到的指定中药成组分析情况,对药物出现频次超过设定阈值的药物进行与其他药物的网络联系统计;
所述组合模块根据分析模块得到的药物分析情况,对药物出现频次超过设定值的药物分别分析与其他药物同时出现的频次。
2.根据权利要求1所述的一种中医方药数据分析挖掘系统,其特征在于:所述方药数据包括如下五个维度:指定中药、中医证候、西医疾病、中医疾病、中医症状。
3.根据权利要求1所述的一种中医方药数据分析挖掘系统,其特征在于:所述标准输出模块输出适于SAS、SPSS的格式数据。
4.根据权利要求1所述的一种中医方药数据分析挖掘系统,其特征在于:所述关联模块给出各个药物后统计该药物出现频次和与该药物有网络联系的药物数量。
5.根据权利要求1所述的一种中医方药数据分析挖掘系统,其特征在于:所述聚类阈值包括数值阈值模块和维度描述比较模块,所述维度描述比较模块用于分别将不同方药中的指定中药、中医证候、西医疾病、中医疾病、中医症状进行相似度对比,若相似度达到设定值,则将信息传递给数值阈值模块;所述数值阈值模块统计指定中药、中医证候、西医疾病、中医疾病、中医症状中经维度描述比较模块比较后,相似度高的维度的数目,并判断是否达到聚类阈值的要求。
CN201710324135.7A 2017-05-10 2017-05-10 一种中医方药数据分析挖掘系统 Active CN107220484B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710324135.7A CN107220484B (zh) 2017-05-10 2017-05-10 一种中医方药数据分析挖掘系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710324135.7A CN107220484B (zh) 2017-05-10 2017-05-10 一种中医方药数据分析挖掘系统

Publications (2)

Publication Number Publication Date
CN107220484A CN107220484A (zh) 2017-09-29
CN107220484B true CN107220484B (zh) 2019-11-05

Family

ID=59944007

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710324135.7A Active CN107220484B (zh) 2017-05-10 2017-05-10 一种中医方药数据分析挖掘系统

Country Status (1)

Country Link
CN (1) CN107220484B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107887024A (zh) * 2017-12-14 2018-04-06 华子昂 基于中医机器人的智能诊断系统及中医机器人
CN109903854B (zh) * 2019-01-25 2023-04-07 电子科技大学 一种基于中医药文献的核心药物识别方法
CN111241164A (zh) * 2020-01-18 2020-06-05 湖北理工学院 一种中药系统药理学分析平台及分析方法
CN111951971B (zh) * 2020-07-21 2024-04-19 中国传媒大学 一种中药和症状关系的数据挖掘方法
CN114528419A (zh) * 2022-04-25 2022-05-24 南京大经中医药信息技术有限公司 一种中医智能病案推荐方法及推荐系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989297A (zh) * 2009-07-30 2011-03-23 陈越 用于计算机上的疾病基因相关药物发掘系统
CN104765762A (zh) * 2015-01-23 2015-07-08 上海中医药大学 自动挖掘配伍关系系统及其方法
CN105528529A (zh) * 2016-02-20 2016-04-27 成都中医药大学 基于大数据分析的中医临床技能评价体系的数据处理方法
CN105868526A (zh) * 2016-02-24 2016-08-17 上海市儿童医院 基于鲁棒张量保持的儿童社区获得性肺炎数据处理系统及方法
CN106228000A (zh) * 2016-07-18 2016-12-14 北京千安哲信息技术有限公司 过度医疗检测系统及方法
CN106407650A (zh) * 2016-08-29 2017-02-15 首都医科大学附属北京中医医院 一种中医数据处理装置和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101989297A (zh) * 2009-07-30 2011-03-23 陈越 用于计算机上的疾病基因相关药物发掘系统
CN104765762A (zh) * 2015-01-23 2015-07-08 上海中医药大学 自动挖掘配伍关系系统及其方法
CN105528529A (zh) * 2016-02-20 2016-04-27 成都中医药大学 基于大数据分析的中医临床技能评价体系的数据处理方法
CN105868526A (zh) * 2016-02-24 2016-08-17 上海市儿童医院 基于鲁棒张量保持的儿童社区获得性肺炎数据处理系统及方法
CN106228000A (zh) * 2016-07-18 2016-12-14 北京千安哲信息技术有限公司 过度医疗检测系统及方法
CN106407650A (zh) * 2016-08-29 2017-02-15 首都医科大学附属北京中医医院 一种中医数据处理装置和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于复杂网络及关联规则的失眠用药中医临床数据挖掘研究;田瑾;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160515(第05期);I138-1010 *
基于数据挖掘的中医方剂分析技术研究;孟红梅;《万方数据知识服务平台》;20091218;1-62 *

Also Published As

Publication number Publication date
CN107220484A (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
CN107220484B (zh) 一种中医方药数据分析挖掘系统
CN110415831B (zh) 一种医疗大数据云服务分析平台
US10181012B2 (en) Extracting clinical care pathways correlated with outcomes
Parker et al. A framework for detecting public health trends with twitter
CN106650225A (zh) 基于fp增长算法模型的中药配方数据挖掘方法及系统
CN104765947B (zh) 一种面向大数据的潜在药物不良反应数据挖掘方法
CN105117587A (zh) 医保领域中基于医疗大数据的智能分析方法
CN106228023A (zh) 一种基于本体和主题模型的临床路径挖掘方法
CN113392227A (zh) 面向轨道交通领域的元数据知识图谱引擎系统
CN105335804A (zh) 一种社区卫生服务系统
CN106126649B (zh) 一种相似中药材挖掘方法及装置
US20180137177A1 (en) Domain specific language to query medical data
CN115497631A (zh) 一种临床科研大数据分析系统
CN106227820B (zh) 一种中医基础理论知识图库的构建方法
CN105706084B (zh) 元数据自动化系统
Pecoraro et al. Designing ETL tools to feed a data warehouse based on electronic healthcare record infrastructure
CN107038669A (zh) 异常结算数据预警提示系统及方法
CN112307216A (zh) 药品知识图谱的构建方法和装置
CN104765762B (zh) 自动挖掘配伍关系系统及其方法
CN113903423A (zh) 用药方案推荐方法、装置、设备及介质
CN106372201B (zh) 规则信息的分类处理方法
Chazard et al. Detection of adverse drug events: proposal of a data model
CN114093455A (zh) 基于人工智能的互联网医院合理用药引擎构建方法
Banek et al. Integrating different grain levels in a medical data warehouse federation
CN111028088A (zh) 一种基于频繁集挖掘的团伙骗保行为识别方法与系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant