CN114512228A - 一种中医疾病辅助诊断系统、设备及存储介质 - Google Patents

一种中医疾病辅助诊断系统、设备及存储介质 Download PDF

Info

Publication number
CN114512228A
CN114512228A CN202210117741.2A CN202210117741A CN114512228A CN 114512228 A CN114512228 A CN 114512228A CN 202210117741 A CN202210117741 A CN 202210117741A CN 114512228 A CN114512228 A CN 114512228A
Authority
CN
China
Prior art keywords
disease
chinese medicine
traditional chinese
diagnosis
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210117741.2A
Other languages
English (en)
Inventor
李宗博
李平
杜小军
陈伯怀
杜乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuzheng Intelligent Technology Beijing Co ltd
Original Assignee
Wuzheng Intelligent Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuzheng Intelligent Technology Beijing Co ltd filed Critical Wuzheng Intelligent Technology Beijing Co ltd
Priority to CN202210117741.2A priority Critical patent/CN114512228A/zh
Publication of CN114512228A publication Critical patent/CN114512228A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Animal Behavior & Ethology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明提出了一种中医疾病辅助诊断系统、设备及存储介质,数据获取模块获取用户相关中医病案关联文本信息;实体知识获取模块通过BiLSTM‑CRF模型自动获取关联文本信息中文本内的实体知识;知识图谱模块构建医诊疗知识图谱数据库;中医诊断计算模块计算实体知识和知识图谱中中医疾病症状节点的余弦相似度,得到最相关的中医疾病名称;检查图像识别模块识别同一个用户的生化检查图像单据,输出为标准统一的数据;辩证分型辅助模块将检查图像识别模块输出的数据进行辩证分型预测;疾病分析报告模块根据疾病辩证分型结果生成疾病风险报告与诊疗建议。本发明实现了将西医人体生物特征客观数据与中医疾病精准诊断进行有效结合,发挥西医客观指标数据的辅助作用。

Description

一种中医疾病辅助诊断系统、设备及存储介质
技术领域
本发明涉及中医辅助诊断技术领域,尤其涉及一种中医疾病辅助诊断系统、设备及存储介质。
背景技术
中医学是中华文明的灿烂瑰宝,有着几千年的历史和临床实践,在治病、防病和养生领域有着非常显著的成效,为人体健康提供了重要防护。中医的诊断方式讲究“辨证论治”,即根据临床表现得出证型分析,再根据不同证型进行遣方用药。中药成分复杂,不同中药药剂对同一疾病不同证型的疾病又有着疗效差别。由于中医理论体系复杂、人才培养周期较长,中医临床诊断应用时在很大程度上还依赖于古人经验,这使得疾病诊断甚至疾病分型存在较大主观判断。现代医学检测器械设备取得了巨大进步,实现人体生物特征数据,如血常规、尿常规、肝肾功、电解质、免疫、肿瘤标志物等,检测已经变得非常简单、方便。
如何将西医人体生物特征客观数据与中医疾病精准诊断进行有效结合,发挥西医客观指标数据的辅助作用,成为人们亟需思考解决的重要问题。
发明内容
有鉴于此,本发明提出了一种中医疾病辅助诊断系统,用于解决将西医人体生物特征客观数据与中医疾病精准诊断进行有效结合的问题。
本发明的技术方案是这样实现的:
本发明第一方面,公开一种中医疾病辅助诊断系统,所述系统包括以下模块:
数据获取模块:用于获取用户相关中医病案关联文本信息,所述关联文本信息包括用户就诊时,医生记录的望闻问切的病案信息,所述病案信息包括患者自身信息、舌象信息、面色信息、声音信息、脉搏信息以及详细症状描述;
实体知识获取模块:用于通过BiLSTM-CRF模型对所述关联文本信息实现文本内的实体知识的自动获取;
知识图谱模块:用于构建中医诊疗知识图谱数据库,所述中医诊疗知识图谱包括:中医疾病名称、中医疾病症状、中医疾病简介、药膳、中药方剂、西医疾病名称、中医疾病病案的节点,存储中西医疾病名称、中医疾病与中医症状、中医疾病与基本病案、中医疾病与疾病分型、分型疾病与药膳、分型疾病与方剂的关联关系;
中医诊断计算模块:用于对所述实体知识获取模块中的实体知识和所述知识图谱模块中的知识图谱,使用VSM编码表示,计算所述实体知识和知识图谱中中医疾病症状节点的余弦相似度,进而得出用户最相关的中医疾病名称;
检查图像识别模块:用于识别用户的生化检查图像单据,输出为标准格式、统一纬度的的文本型及数值型数据;
辩证分型辅助模块:用于通过基于卷积神经网络构建多分类模型,将检查图像识别模块输出的数据进行辩证分型预测;
疾病分析报告模块:用于根据辩证分型辅助模块计算出的疾病辩证分型结果生成疾病风险报告与诊疗建议。
本发明通过上述方法,构建中医疾病辅助诊断系统,将西医人体生物特征客观数据与中医疾病精准诊断进行有效结合,发挥西医客观指标数据的辅助作用,用以帮助实现精确中医疾病识别诊断。
在以上技术方案的基础上,优选的,实体知识具体包括:
患者身份信息:包括性别、年龄;
诊疗信息:包括疾病部位、面色、舌象、脉搏、声音、作息、饮食、中医疾病症状、疾病持续时间。
本发明通过上述方法,
在以上技术方案的基础上,优选的,所述实体知识获取模块获取所述关联文本信息中的中医疾病症状时,根据所述BiLSTM-CRF模型中的BiLSTM层输出每个标签即中医疾病症状的分数,并设置所述分数为权重,用以划分主症和辅症;
所述CRF层对于输入序列X对应的输出tag序列y,定义分数为score,其中每一个score对应一个完整的路径;利用维特比算法进行预测,求解最优路径,最优的路径即输出序列的最后预测结果,所述最后预测结果为每个词映射到标签的概率值。
本发明通过上述方法,使用BiLSTM-CRF模型对实体知识完成自动实时提取,不仅通过CRF层考虑到序列标注前后之间的关联性,而且拥有深度网络强悍的特征抽取及拟合能力。
在以上技术方案的基础上,优选的,所述知识图谱中的节点和关联关系存储于Neo4j图形数据库内。
本发明通过上述方法,构建以中医疾病信息为主的知识图谱,所述知识图谱涵盖中医药领域权威专业的关联知识,并存储于Neo4j图形数据库内。
在以上技术方案的基础上,优选的,
所述中医诊断计算模块将实体知识获取模块获取的实体知识词语转换为空间向量Vd=D(d1,d2,…dn),其中n表示向量维度,dn表示第n维特征词语;
所述中医诊断计算模块将所述知识图谱模块中的中医疾病与中医症状、中医疾病与基本病案关联关系转换为空间向量集合K={k1,k2,…km},km表示第m个中医疾病对应的空间向量即T(t1,t2,…tn),分别计算Vd与向量集合K内各向量的余弦相似度,其中相似度最大值对应的中医疾病视为根据实体知识获取模块获取的实体知识推理得到的最相关的中医疾病名称。
本发明通过上述方法,通过中医诊断计算模块对所述实体知识进行推理诊断,依据患者的中医疾病症状信息得到患者最有可能患有的中医疾病名称。
在以上技术方案的基础上,优选的,
所述检查图像识别模块将生化检查单据图像转化为灰度图,判断灰度图中文本区域中字符排列方向是否为横向,若为横向则对每个单行文本区域图像自动判断前景颜色,得到二值图像;对二值图像进行切分得到字符片段序列;对切分后的单行二值图像进行文本行识别;按检测项目名称,检测值以二元组格式分组,以json格式返回数据;
其中图像识别前对于检测值非数值化的异常情况需进行智能处理,如升高、降低等以符号箭头表示的检测值应进行遮挡变换,切换成“0”“1”表示。
本发明通过上述方法,提取生化检查单据中的数据,从而获得西医检查得到的人体生物特征客观数据。
在以上技术方案的基础上,优选的,
所述辩证分型辅助模块定向收集所述中医疾病下各个证型的生物体征数据,进行分型预测,在所述网络模型训练时输入中医疾病下各证型对应的生物体征指标数据,对所述指标数据进行线性函数归一化处理;
构建卷积神经网络模型,包括1个输入层、5个卷积层、5个池化层、1个全连接层和1个输出分类层;所述卷积神经网络模型中第一层卷积层卷积核尺寸为5*5,其它卷积层卷积核尺寸为3*3,激活函数采用不饱和非线性函数f(x)=max(0,x);池化层尺寸为1*2,采用最大降采样方法;全连接层的神经元个数为512;输出层使用Softmax分类器,输出得到所述中医疾病下各证型类型的全部概率;
随机初始化卷积神经网络模型参数,利用构建的多分类模型对训练样本集数据进行学习训练,样本标签为中医疾病辩证分型;
采用交叉熵代价函数
Figure BDA0003497169250000041
利用Adam方法更新参数优化所述卷积神经网络模型,其中j为输出向量数目;y为目标输出向量;x为实际输出向量;
使用优化好的卷积神经网络模型对所述检查图像识别模块返回的同一个用户的json格式数据进行辩证分型预测。
本发明通过上述方法,将西医人体生物特征客观数据与中医疾病精准诊断进行有效结合,发挥西医诊断检查相关数据辅助传统中医诊断的作用。
在以上技术方案的基础上,优选的,
所述疾病分析报告模块根据中医疾病下的辩证分型结果,检索图谱数据库疾病分型下的关联内容,得到该结果对应的关联药膳、中药方剂,生成中医疾病风险报告与诊疗建议并且推送。
本发明通过上述方法,得到用户可能患有的中医疾病,并依此选择合适的药膳、中药方剂等等,做到对症治疗。
本发明第二方面,公开一种电子设备,所述设备包括:至少一个处理器、至少一个存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的一种中医疾病辅助诊断系统工作程序,一种中医疾病辅助诊断系统工作程序配置为实现如本发明第一方面所述的一种中医疾病辅助诊断系统工作程序。
本发明第三方面,公开一种计算机可读存储介质,所述存储介质上存储有一种中医疾病辅助诊断系统工作程序,所述一种中医疾病辅助诊断系统工作程序被执行时实现如本发明第一方面所述的一种中医疾病辅助诊断系统工作程序。
本发明的一种中医疾病辅助诊断系统方法相对于现有技术具有以下有益效果:
(1)通过系统对用户的病案信息进行分析处理,结合相关的西医生化检查数据,自动完成病案下疾病的辩证分型,进而确保选择合适的药膳、中药方剂等,克服了由传统中医人工诊断所包含的个人主观性而造成的中医诊断结果可信度低,可重复性不好的缺陷;
(2)通过将西医人体生物特征客观数据与中医疾病精准诊断进行有效结合,充分运用了西医生化检查数据与中医疾病辩证分型间的相关性,发挥西医诊断检查相关数据辅助传统中医诊断的作用,有助于提高中医疾病诊断准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种中医疾病辅助诊断系统模块图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
实施例
本发明一种中医疾病辅助诊断系统工作流程见图1,处理步骤说明如下:
第一步,通过数据获取模块获取用户相关中医病案关联文本信息,所述关联文本信息包括用户就诊时,医生记录的望闻问切的病案信息,所述病案信息包括患者自身信息、舌象信息、面色信息、声音信息、脉搏信息以及详细症状描述。转第二步。
应当理解的是,中医病案通常为用户前往专业的中医院进行治疗时,由专业中医医师书写记录下的基本信息、舌象信息、面色信息、声音信息、脉搏信息以及详细症状描述等;对于中医疾病临床诊断而言,医师仅需关注病案文本内实体知识,如年龄、性别、饮食、睡眠、面色、舌象、脉搏、症状等。
第二步,通过实体知识获取模块中的BiLSTM-CRF模型对所述关联文本信息实现文本内的实体知识的自动获取。转第三步。
应当理解的是,所述实体知识获取模块获取所述关联文本信息中的中医疾病症状时,根据所述BiLSTM-CRF模型中的BiLSTM层输出每个标签即中医疾病症状的分数,并设置所述分数为权重,用以划分主症和辅症;
所述CRF层对于输入序列X对应的输出tag序列y,定义分数为score,其中每一个score对应一个完整的路径;利用维特比算法进行预测,求解最优路径,最优的路径即输出序列的最后预测结果,所述最后预测结果为每个词映射到标签的概率值。
本发明通过上述方案,利用BiLSTM-CRF模型中,可用于分词、词性标注、命名实体识别等任务的序列标注算法CRF,输出每个词的所有标签的各自得分,相当于每个词映射到标签的概率值;该BiLSTM-CRF模型对实体知识完成自动实时提取,基于测试数据,其准确率可达到96.3%,不仅通过CRF层考虑到序列标注前后之间的关联性,而且拥有深度网络强悍的特征抽取及拟合能力。
第三步,通过知识图谱模块构建中医诊疗知识图谱数据库,所述中医诊疗知识图谱包括:中医疾病名称、中医疾病症状、中医疾病简介、药膳、中药方剂、西医疾病名称、中医疾病病案的节点,存储中西医疾病名称、中医疾病与中医症状、中医疾病与基本病案、中医疾病与疾病分型、分型疾病与药膳、分型疾病与方剂的关联关系;所述知识图谱中的节点和关联关系存储于Neo4j图形数据库内。转第四步。
应当理解的是,知识图谱是以“语义网络”为骨架构建起来的网络化的知识系统,旨在描述客观世界的概念、实体、事件及其之间的关系。本发明收集并处理《中药新药临床研究指导原则》、《中药新药研究指导原则》、《中医临床诊疗术语证型部分》、《中医病症诊断疗效标准》、《中医临床诊疗指南》所涵盖的上述图谱节点、图谱关系等诊疗知识,并存储于Neo4j图形数据库内。
第四步,通过中医诊断计算模块对所述实体知识获取模块中的实体知识和所述知识图谱模块中的知识图谱,使用VSM编码表示,计算所述实体知识和知识图谱中中医疾病症状节点的余弦相似度,进而得出用户最相关的中医疾病名称。转第五步。
应当理解的是,自然语言领域内中文计算处理的首要任务即文本数值化,将计算文本在全局视角内统一转换、保持中文语义一致性显得非常重要。向量空间模型(vectorspace model,VSM)目前已经成为自然语言处理中常用的文本表示模型,最早用在SMART信息检索系统中。由于实体知识获取模块获取的实体知识和知识图谱模块中的图谱节点均为词语而非文本句子,且各部分内容既没有重复也不考虑词语间的关联性,因此符合向量空间模型使用的假设前提。
因此,所述中医诊断计算模块将实体知识获取模块获取的实体知识词语转换为空间向量Vd=D(d1,d2,…dn),其中n表示向量维度,dn表示第n维特征词语;
所述中医诊断计算模块将所述知识图谱模块中的中医疾病与中医症状、中医疾病与基本病案关联关系转换为空间向量集合K={k1,k2,…km},km表示第m个中医疾病对应的空间向量即T(t1,t2,…tn),分别计算Vd与向量集合K内各向量的余弦相似度,其中相似度最大值对应的中医疾病视为根据实体知识获取模块获取的实体知识推理得到的最相关的中医疾病,通过知识图谱中的关联关系得到对应的中医疾病名称。
第六步,通过检查图像识别模块识别用户的生化检查图像单据,输出为标准格式、统一纬度的的文本型及数值型数据。转第七步。
应当理解的是,所述生化检查图像单据包括血常规、尿常规、肝肾功等检查单;将上传的检查图像快速准确识别为文本数据是后续辩证分型模块使用的前提,因此,为了实现高效识别,检查图像识别模块将生化检查单据图像转化为灰度图,判断灰度图中文本区域中字符排列方向是否为横向,若为横向则对每个单行文本区域图像自动判断前景颜色,得到二值图像;对二值图像进行切分得到字符片段序列;对切分后的单行二值图像进行文本行识别;按检测项目名称,检测值以二元组格式分组,以json格式返回数据;
其中图像识别前对于检测值非数值化的异常情况需进行智能处理,如升高、降低等以符号箭头表示的检测值应进行遮挡变换,切换成“0”“1”表示。
第七步,辩证分型辅助模块通过基于卷积神经网络构建多分类模型,将检查图像识别模块输出的数据进行辩证分型预测。转第八步。
应当理解的是,辩证分型辅助模块定向收集所述中医疾病下各个证型的生物体征数据,进行分型预测,在所述网络模型训练时输入中医疾病下各证型对应的生物体征指标数据,对所述指标数据进行线性函数归一化处理;
所述证型包括:高血压之肝火亢盛型、痰湿壅盛型、阴虚阳亢型、阴阳两虚型;高血脂之痰浊阻遏型、脾肾阳虚型、肝肾阴虚型、阴虚阳亢型、气滞血瘀型;痛风之痰瘀互结型、湿热瘀阻型、脾虚湿困型、气血亏虚型等;
所述指标数据包括:血压(SBP、DBP)、血糖(Glu、HbA1c)、血脂(TC、TG、LDL-C、HDL-C、ApoA1、ApoB、apoA1/apoB、ApoE、LP-a、VLDL-C)、肝肾功(AST、ALT、GGT、ALP、CHE、TBilL、DB、TBA、TP、Cr、Alb、GLO、A/G、pa、BUN、GFR、MALB)、血常规(RBC、RDW、WBC、GR、LY、MO、PLT、Hb、NLR、MPV、EOS、Baso、neut、NEUT、LY、CRP)、尿常规(RBC_U、U-WBC、24h尿蛋白定量、β2-MG)、心肌酶(HBDH、LDH)、电解质(na、k、cl、Ca)等;
构建卷积神经网络模型,包括1个输入层、5个卷积层、5个池化层、1个全连接层和1个输出分类层;所述卷积神经网络模型中第一层卷积层卷积核尺寸为5*5,其它卷积层卷积核尺寸为3*3,激活函数采用不饱和非线性函数f(x)=max(0,x);池化层尺寸为1*2,采用最大降采样方法;全连接层的神经元个数为512;输出层使用Softmax分类器,输出得到所述中医疾病下各证型类型的全部概率;
随机初始化卷积神经网络模型参数,利用构建的多分类模型对训练样本集数据进行学习训练,样本标签为中医疾病辩证分型;
采用交叉熵代价函数
Figure BDA0003497169250000091
利用Adam方法更新参数优化所述卷积神经网络模型,其中j为输出向量数目;y为目标输出向量;x为实际输出向量;
使用优化好的卷积神经网络模型对所述检查图像识别模块返回的同一个用户的json格式数据进行辩证分型预测,发挥西医诊断检查相关数据辅助传统中医诊断的作用。
本发明通过上述步骤,将西医人体生物特征客观数据与中医疾病精准诊断进行有效结合,充分运用了西医生化检查数据与中医疾病辩证分型间的相关性,发挥西医诊断检查相关数据辅助传统中医诊断的作用。
第八步,通过疾病分析报告模块根据辩证分型辅助模块计算出的疾病辩证分型结果生成疾病风险报告与诊疗建议。
应当理解的是,所述疾病分析报告模块根据中医疾病下的辩证分型结果,检索图谱数据库疾病分型下的关联内容,得到该结果对应的关联药膳、中药方剂,生成中医疾病风险报告与诊疗建议并且推送。
本发明实施例中前七步实现了结合中医知识以及西医数据,自动完成基于用户病案的疾病辩证分型,第八步则通过知识图谱对应选择合适的药膳、中药方剂等,生成疾病风险报告与诊疗建议,做到对症治疗。
本发明还公开一种电子设备,所述设备包括:至少一个处理器、至少一个存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的一种中医疾病辅助诊断系统工作程序,一种中医疾病辅助诊断系统工作程序配置为实现如本发明实施例所述的一种中医疾病辅助诊断系统工作程序。
本发明还公开一种计算机可读存储介质,所述存储介质上存储有一种中医疾病辅助诊断系统工作程序,所述一种中医疾病辅助诊断系统工作程序被执行时实现如本发明实施例所述的一种中医疾病辅助诊断系统工作程序。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种中医疾病辅助诊断系统,其特征在于,所述一种中医疾病辅助诊断系统包括以下模块:
数据获取模块:用于获取用户相关中医病案关联文本信息,所述关联文本信息包括用户就诊时,医生记录的望闻问切的病案信息,所述病案信息包括患者自身信息、舌象信息、面色信息、声音信息、脉搏信息以及详细症状描述;
实体知识获取模块:用于通过BiLSTM-CRF模型对所述关联文本信息实现文本内的实体知识的自动获取;
知识图谱模块:用于构建中医诊疗知识图谱数据库,所述中医诊疗知识图谱包括:中医疾病名称、中医疾病症状、中医疾病简介、药膳、中药方剂、西医疾病名称、中医疾病病案的节点,存储中西医疾病名称、中医疾病与中医症状、中医疾病与基本病案、中医疾病与疾病分型、分型疾病与药膳、分型疾病与方剂的关联关系;
中医诊断计算模块:用于对所述实体知识获取模块中的实体知识和所述知识图谱模块中的知识图谱,使用VSM编码表示,计算所述实体知识和知识图谱中中医疾病症状节点的余弦相似度,进而得出用户最相关的中医疾病名称;
检查图像识别模块:用于识别用户的生化检查图像单据,输出为标准格式、统一纬度的的文本型及数值型数据;
辩证分型辅助模块:用于通过基于卷积神经网络构建多分类模型,将检查图像识别模块输出的数据进行辩证分型预测;
疾病分析报告模块:用于根据辩证分型辅助模块计算出的疾病辩证分型结果生成疾病风险报告与诊疗建议。
2.如权利要求1所述的一种中医疾病辅助诊断系统,其特征在于,所述实体知识具体包括:
患者身份信息:包括性别、年龄;
诊疗信息:包括疾病部位、面色、舌象、脉搏、声音、作息、饮食、中医疾病症状、疾病持续时间。
3.如权利要求2所述的一种中医疾病辅助诊断系统,其特征在于,
所述实体知识获取模块获取所述关联文本信息中的中医疾病症状时,根据所述BiLSTM-CRF模型中的BiLSTM层输出每个标签即中医疾病症状的分数,并设置所述分数为权重,用以划分主症和辅症;
所述CRF层对于输入序列X对应的输出tag序列y,定义分数为score,其中每一个score对应一个完整的路径;利用维特比算法进行预测,求解最优路径,最优的路径即输出序列的最后预测结果,所述最后预测结果为每个词映射到标签的概率值。
4.如权利要求1所述的一种中医疾病辅助诊断系统,其特征在于,
所述知识图谱中的节点和关联关系存储于Neo4j图形数据库内。
5.如权利要求1所述的一种中医疾病辅助诊断系统,其特征在于,
所述中医诊断计算模块将实体知识获取模块获取的实体知识词语转换为空间向量Vd=D(d1,d2,…dn),其中n表示向量维度,dn表示第n维特征词语;
所述中医诊断计算模块将所述知识图谱模块中的中医疾病与中医症状、中医疾病与基本病案关联关系转换为空间向量集合K={k1,k2,…km},km表示第m个中医疾病对应的空间向量即T(t1,t2,…tn),分别计算Vd与向量集合K内各向量的余弦相似度,其中相似度最大值对应的中医疾病视为根据实体知识获取模块获取的实体知识推理得到的最相关的中医疾病名称。
6.如权利要求1所述的一种中医疾病辅助诊断系统,其特征在于,
所述检查图像识别模块将生化检查单据图像转化为灰度图,判断灰度图中文本区域中字符排列方向是否为横向,若为横向则对每个单行文本区域图像自动判断前景颜色,得到二值图像;对二值图像进行切分得到字符片段序列;对切分后的单行二值图像进行文本行识别;按检测项目名称,检测值以二元组格式分组,以json格式返回数据;
其中图像识别前对于检测值非数值化的异常情况需进行智能处理,如升高、降低等以符号箭头表示的检测值应进行遮挡变换,切换成“0”“1”表示。
7.如权利要求6所述的一种中医疾病辅助诊断系统,其特征在于,
所述辩证分型辅助模块定向收集所述中医疾病下各个证型的生物体征数据,进行分型预测,在所述网络模型训练时输入中医疾病下各证型对应的生物体征指标数据,对所述指标数据进行线性函数归一化处理;
构建卷积神经网络模型,包括1个输入层、5个卷积层、5个池化层、1个全连接层和1个输出分类层;所述卷积神经网络模型中第一层卷积层卷积核尺寸为5*5,其它卷积层卷积核尺寸为3*3,激活函数采用不饱和非线性函数f(x)=max(0,x);池化层尺寸为1*2,采用最大降采样方法;全连接层的神经元个数为512;输出层使用Softmax分类器,输出得到所述中医疾病下各证型类型的全部概率;
随机初始化卷积神经网络模型参数,利用构建的多分类模型对训练样本集数据进行学习训练,样本标签为中医疾病辩证分型;
采用交叉熵代价函数
Figure FDA0003497169240000031
利用Adam方法更新参数优化所述卷积神经网络模型,其中j为输出向量数目;y为目标输出向量;x为实际输出向量;
使用优化好的卷积神经网络模型对所述检查图像识别模块返回的同一个用户的json格式数据进行辩证分型预测。
8.如权利要求6所述的一种中医疾病辅助诊断系统,其特征在于,
所述疾病分析报告模块根据中医疾病下的辩证分型结果,所检索图谱数据库疾病分型下的关联内容,得到该结果对应的关联药膳、中药方剂,生成中医疾病风险报告与诊疗建议并且推送。
9.一种电子设备,其特征在于,包括至少一个处理器、至少一个存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的一种中医疾病辅助诊断系统工作程序,一种中医疾病辅助诊断系统方法程序配置为实现如权利要求1至8任一项的一种中医疾病辅助诊断系统工作程序。
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有一种中医疾病辅助诊断系统工作程序,所述一种中医疾病辅助诊断系统工作程序被执行时实现如权利要求1至8中任一项的一种中医疾病辅助诊断系统工作程序。
CN202210117741.2A 2022-02-08 2022-02-08 一种中医疾病辅助诊断系统、设备及存储介质 Pending CN114512228A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210117741.2A CN114512228A (zh) 2022-02-08 2022-02-08 一种中医疾病辅助诊断系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210117741.2A CN114512228A (zh) 2022-02-08 2022-02-08 一种中医疾病辅助诊断系统、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114512228A true CN114512228A (zh) 2022-05-17

Family

ID=81551265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210117741.2A Pending CN114512228A (zh) 2022-02-08 2022-02-08 一种中医疾病辅助诊断系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114512228A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114724693A (zh) * 2022-06-07 2022-07-08 武汉金豆医疗数据科技有限公司 异常诊疗行为的检测方法及装置、电子设备和存储介质
CN115116576A (zh) * 2022-06-30 2022-09-27 上海国民集团健康科技有限公司 融合知识的中医诊断报告自动化生成方法、系统及终端
CN115579132A (zh) * 2022-12-09 2023-01-06 智慧中医科技(广东)有限公司 基于中医诊疗经验文件格式的验证方法、装置及系统
CN115631852A (zh) * 2022-11-02 2023-01-20 北京大学重庆大数据研究院 证型推荐方法、装置、电子设备及非易失性存储介质
CN116344041A (zh) * 2023-05-25 2023-06-27 大安健康科技(北京)有限公司 一种基于知识图谱的中医辅助决策系统
CN116821779A (zh) * 2023-08-31 2023-09-29 中南大学湘雅医院 一种针对胃肠健康的大数据识别方法
CN117708338A (zh) * 2024-02-05 2024-03-15 成都中医药大学 一种中文电子病历实体识别与四诊分类的抽取方法及模型

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114724693A (zh) * 2022-06-07 2022-07-08 武汉金豆医疗数据科技有限公司 异常诊疗行为的检测方法及装置、电子设备和存储介质
CN115116576A (zh) * 2022-06-30 2022-09-27 上海国民集团健康科技有限公司 融合知识的中医诊断报告自动化生成方法、系统及终端
CN115631852A (zh) * 2022-11-02 2023-01-20 北京大学重庆大数据研究院 证型推荐方法、装置、电子设备及非易失性存储介质
CN115631852B (zh) * 2022-11-02 2024-04-09 北京大学重庆大数据研究院 证型推荐方法、装置、电子设备及非易失性存储介质
CN115579132A (zh) * 2022-12-09 2023-01-06 智慧中医科技(广东)有限公司 基于中医诊疗经验文件格式的验证方法、装置及系统
CN115579132B (zh) * 2022-12-09 2023-08-22 智慧中医科技(广东)有限公司 基于中医诊疗经验文件格式的验证方法、装置及系统
CN116344041A (zh) * 2023-05-25 2023-06-27 大安健康科技(北京)有限公司 一种基于知识图谱的中医辅助决策系统
CN116344041B (zh) * 2023-05-25 2023-09-08 大安健康科技(北京)有限公司 一种基于知识图谱的中医辅助决策系统
CN116821779A (zh) * 2023-08-31 2023-09-29 中南大学湘雅医院 一种针对胃肠健康的大数据识别方法
CN116821779B (zh) * 2023-08-31 2023-11-14 中南大学湘雅医院 一种针对胃肠健康的大数据识别方法
CN117708338A (zh) * 2024-02-05 2024-03-15 成都中医药大学 一种中文电子病历实体识别与四诊分类的抽取方法及模型
CN117708338B (zh) * 2024-02-05 2024-04-26 成都中医药大学 一种中文电子病历实体识别与四诊分类的抽取方法及模型

Similar Documents

Publication Publication Date Title
CN114512228A (zh) 一种中医疾病辅助诊断系统、设备及存储介质
CN109697285B (zh) 增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法
CN109471895B (zh) 电子病历表型抽取、表型名称规范化方法及系统
CN107391906B (zh) 基于神经网络和图谱结构的健康饮食知识网络构建方法
Yu et al. Automatic ICD code assignment of Chinese clinical notes based on multilayer attention BiRNN
CN108628824A (zh) 一种基于中文电子病历的实体识别方法
CN110069779B (zh) 医疗文本的症状实体识别方法及相关装置
CN111538845A (zh) 一种构建肾病专科医学知识图谱的方法、模型及系统
CN109378066A (zh) 一种基于特征向量实现疾病预测的控制方法及控制装置
CN111709233A (zh) 基于多注意力卷积神经网络的智能导诊方法及系统
CN112712879A (zh) 医学影像报告的信息提取方法、装置、设备及存储介质
CN110444261B (zh) 序列标注网络训练方法、电子病历处理方法及相关装置
CN113436754B (zh) 一种智能终端问诊的医疗软件及其方法
CN116168804B (zh) 一种基于his系统的病患膳食推荐系统与方法
CN115171871A (zh) 一种基于知识图谱与注意力机制的心血管疾病预测方法
Hsu et al. Multi-label classification of ICD coding using deep learning
Fu et al. Deep‐Learning‐Based CT Imaging in the Quantitative Evaluation of Chronic Kidney Diseases
Kaya Feature fusion-based ensemble CNN learning optimization for automated detection of pediatric pneumonia
CN112216379A (zh) 一种基于智能联合学习的疾病诊断系统
CN110164519A (zh) 一种基于众智网络的用于处理电子病历混合数据的分类方法
Lin et al. Skin medical image captioning using multi-label classification and siamese network
CN112927797A (zh) 一种基于贝叶斯概率推断的急诊临床诊断分析系统
Lin et al. Contrastive pre-training and linear interaction attention-based transformer for universal medical reports generation
Chen et al. Automatically structuring on Chinese ultrasound report of cerebrovascular diseases via natural language processing
CN116403706A (zh) 一种融合知识扩展和卷积神经网络的糖尿病预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination