CN112259260A - 基于智能穿戴设备的智能医疗问答方法、系统及装置 - Google Patents
基于智能穿戴设备的智能医疗问答方法、系统及装置 Download PDFInfo
- Publication number
- CN112259260A CN112259260A CN202011298492.9A CN202011298492A CN112259260A CN 112259260 A CN112259260 A CN 112259260A CN 202011298492 A CN202011298492 A CN 202011298492A CN 112259260 A CN112259260 A CN 112259260A
- Authority
- CN
- China
- Prior art keywords
- user
- question
- medical
- intelligent
- physiological
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000036541 health Effects 0.000 claims abstract description 49
- 238000011156 evaluation Methods 0.000 claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 35
- 230000004044 response Effects 0.000 claims abstract description 14
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 24
- 201000010099 disease Diseases 0.000 claims description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 9
- 208000024891 symptom Diseases 0.000 claims description 9
- 239000008280 blood Substances 0.000 claims description 8
- 210000004369 blood Anatomy 0.000 claims description 8
- 230000036772 blood pressure Effects 0.000 claims description 8
- 230000036760 body temperature Effects 0.000 claims description 7
- 239000003814 drug Substances 0.000 claims description 7
- 229940079593 drug Drugs 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 6
- 238000011282 treatment Methods 0.000 claims description 5
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 3
- 230000037396 body weight Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 abstract description 9
- 238000010801 machine learning Methods 0.000 abstract 1
- 238000003745 diagnosis Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 208000017667 Chronic Disease Diseases 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000004092 self-diagnosis Methods 0.000 description 3
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 208000031226 Hyperlipidaemia Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 206010033307 Overweight Diseases 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 238000011369 optimal treatment Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明属于医疗健康领域,具体涉及了一种基于智能穿戴设备的智能医疗问答方法、系统及装置,旨在解决现有智能医疗问答方法主观性太强,缺乏客观生理指标数据做支撑,不能把问答和生理指标结合的问题。本发明包括:根据生理指标数据训练基于BiLSTM的联合深度模型、获取医疗知识构建智能医疗问答知识图谱、利用机器学习进行实体识别模型的训练以及用户问句的意图识别;对于当前用户,基于生理指标通过基于BiLSTM的联合深度模型获取用户的健康评价,通过实体识别模型对问句进行医疗实体提取以及意图识别,将两者结合起来通过智能医疗问答知识图谱获取问句的应答。本发明结合深度学习与用户生理指标和背景信息,进一步提高了医疗问句应答的准确性。
Description
技术领域
本发明属于医疗健康领域,具体涉及了一种基于智能穿戴设备的智能医疗问答方法、系统及装置。
背景技术
随着现代社会的发展,人们的生活水平获得了极大的提升,但是伴随而来的生活工作压力使很大部分人群长期处于亚健康状态。慢性病发病率10年增长10倍,慢性病患者已近3亿,超重和肥胖患者3.5亿,高血压患者超2亿,高血脂的有将1亿多人,糖尿病患者达到9240万人。同时,以糖尿病为例的慢性病已呈现年轻化发展趋势,严重影响到居民的生活质量和身体健康。随着互联网技术的发展,当人们身体感到不适的时候,常常会通过互联网搜索对病情进行简单的判断,在互联网上查询治疗疾病好的医院以及需要挂的科室。但是,在互联网上进行“自诊”,对自己的症状进行搜索如同大海捞针一般寻找自己不适的病因,对患者而言,一方面信息检索的效率低下;另一方面如果检索出来的结果不准确,很容易导致误诊错过最佳治疗时间。并且互联网上存在大量的商家广告,患者也很容易被广告误导,找错医生。即使患者在合适的医疗平台上问诊,也很容易由于对自己病情描述不清、缺少生理指标数据从而造成误诊。
现有的一些智能诊断的问答系统主要分为两个方向:一种是基于深度学习的智能诊断问答方法,例如基于深度学习的智能医疗自动问答方法[1],但是深度学习需要大量的带标签训练数据,而在实际应用中,数据标注往往需要领域内的专家辅助,数据标注成本昂贵、效率低、错误率高,很难获得深度学习所需的大量带标签训练数据,并且基于深度学习的问答系统不具有可解释性,泛化能力往往不是很好。另一种是将知识图谱与智能诊断问答结合起来,例如医疗领域知识图谱问答处理方法、装置、设备及存储介质[2],但是知识图谱是通过客观的实体关系构建的,采用实体识别技术获取实体,实体获取的效果直接影响了最后模型回答的准确性。另外只采用知识图谱一种方法更多的是回答一些事实性的东西,对一些主观性的问题回答不够准确,因此,在社区问答中往往效果不好。
总的来说,现有的结合知识图谱的智能医疗问答方法,受限于实体获取的效果,对于主观性的问题回答不够准确,而基于深度学习的智能医疗问答方法,由于很难获得大量的带标注的训练数据,因而很难获得性能良好的模型,并且模型的泛化能力差,并且这两类方法都缺乏客观生理指标数据做支撑,无法将智能医疗问答和生理指标相结合。
以下文献是与本发明相关的技术背景资料:
[1]王中方、老明瑞、张凯、张胜,一种基于深度学习的智能医疗自动问答方法,20170628,CN107368547A.
[2]朱威、梁欣、倪渊、谢国彤,医疗领域知识图谱问答处理方法、装置、设备及存储介质,20190719,CN110532360A.
发明内容
为了解决现有技术中的上述问题,即现有智能医疗问答方法主观性太强,缺乏客观生理指标数据做支撑,不能把问答和生理指标结合的问题,本发明提供了一种基于智能穿戴设备的智能医疗问答方法,该智能医疗问答方法包括:
步骤A10,通过训练好的实体识别模型提取用户提问的问句中的医疗实体;所述医疗实体包括疾病名称、症状名称和药物名称;
步骤A20,基于所述医疗实体进行用户意图识别,并基于所述医疗实体和用户意图进行词典槽位填充;
步骤A30,将词典槽位填充后的问句转换为SQL查询语句;
步骤A40,基于所述SQL查询语句,结合用户的健康评价,通过预先构建的智能医疗问答知识图谱获取问句的应答。
其中,所述用户的健康评价,其获取方法为:
步骤B10,通过穿戴设备获取用户生理指标和背景信息;所述生理指标包括用户体重指数、血压、脉搏、肺活量、体温、心率、血脂和心电图;所述背景信息包括用户身高、年龄、性别、职业和过往病史;
步骤B20,基于所述用户生理指标和背景信息,通过训练好的基于BiLSTM的联合深度模型获取用户的健康评价。
在一些优选的实施例中,所述智能医疗问答知识图谱,其构建方法为:
步骤C10,获取医疗平台的医疗文本数据,并将所述医疗文本数据转换为三元组结构化数据;
步骤C20,将所述三元组结构化数据导入Neo4j数据库,构建以疾病为中心的智能医疗问答知识图谱。
在一些优选的实施例中,所述实体识别模型,其训练方法为:
步骤D10,将获取的训练数据转换为分词,并通过BIOES标注法对训练数据中的句子进行命名实体标注;
步骤D20,在标注后的训练数据中加入<PAD>、<UNK>、<NUM>分别表示填充字符、未知字符、数字字符;
步骤D30,构建字典标签,将训练数据中的文字与标签分别转成数字,在生成batch后,对batch内句子padding到设定的统一长度,并计算每句的真实长度;
步骤D40,采用BiLSTM对每一个batch进行处理,并将输出结果进行拼接;
步骤D50,通过拼接后的数据进行实体识别模型的迭代训练,并向模型损失函数梯度下降方向更新模型的参数,直至模型损失函数值低于设定阈值或达到设定训练次数,获得训练好的实体识别模型。
在一些优选的实施例中,所述基于BiLSTM的联合深度模型,其训练方法为:
步骤E10,获取用户生理指标体检数据和背景信息以及对应的用户的真实体检健康评价;
步骤E20,对所述用户生理指标体检数据和背景信息进行异常值、缺失值处理,并对其中的文本数据进行词向量训练,获得预处理用户生理指标体检数据和背景信息;
步骤E30,通过联合深度模型中的LSTM机制获取预处理用户生理指标体检数据的输出状态序列,并通过联合深度模型中自我注意力模块提取生理指标向量;通过联合深度模型中的MLP对预处理用户背景信息进行建模,获得第一预测向量;
步骤E40,通过联合深度模型的全连接层合并所述生理指标向量和第一预测向量,获得用户的预测健康评价;
步骤E50,计算所述用户的真实体检健康评价和预测健康评价之间的二进制交叉熵损失,通过反向传播向模型损失函数梯度下降方向更新模型的参数,进行模型迭代训练直至模型损失函数值低于设定阈值或达到设定训练次数,获得训练好的基于BiLSTM的联合深度模型。
在一些优选的实施例中,步骤E30中“通过联合深度模型中的LSTM机制获取预处理用户生理指标体检数据的输出状态序列”,其方法为:
Hui=(x0,x1,…,xt,…,xn)
ht=LTSM(xt,ht-1)
H=(h0,h1,…,ht,…,hT)
其中,Hui为预处理用户生理指标体检数据的时序数据,xt,t=0,1,…,t,…,n为时序数据中第t时刻的数据,ht和ht-1分别代表t和t-1时刻的生理指标向量,H为0-T时刻的用户生理指标体检数据的输出状态序列。
在一些优选的实施例中,步骤E30中“通过联合深度模型中自我注意力模块提取生理指标向量”,其方法为:
a=softmax(W2tanh(W1H+b1)+b2)
其中,W1和W2分别为网络权重,b1和b2分别为网络偏置向量,tanh(·)代表和softmax(·)代表激活函数。
在一些优选的实施例中,所述二进制交叉熵损失,其计算方法为:
loss=-∑ylogyui+(1-y)log(1-yui)
其中,y为用户的真实体检健康评价,yui为用户的预测健康评价。
本发明的另一方面,提出了一种基于智能穿戴设备的智能医疗问答系统,该智能医疗问答系统包括用户生理指标和背景信息获取模块、用户健康评价获取模块、问句获取模块、实体提取模块、意图识别及词典槽位填充模块、SQL转换模块和应答模块;
所述用户生理指标和背景信息获取模块,配置为通过穿戴设备获取用户生理指标和用户背景信息;所述用户生理指标包括用户体重指数、血压、脉搏、肺活量、体温、心率、血脂和心电图;所述用户背景信息包括用户身高、年龄、性别和过往病史;
所述用户健康评价获取模块,配置为基于所述用户生理指标和背景信息,通过训练好的基于BiLSTM的联合深度模型获取用户的健康评价;
所述问句获取模块,配置为获取用户提问的问句并输入;
所述实体提取模块,配置为通过训练好的实体识别模型提取用户提问的问句中的医疗实体;所述医疗实体包括疾病名称、症状名称和药物名称;
所述意图识别及词典槽位填充模块,配置为基于所述医疗实体进行用户意图识别,并基于所述医疗实体和用户意图进行词典槽位填充;
所述SQL转换模块,配置为将词典槽位填充后的问句转换为SQL查询语句;
所述应答模块,配置为基于所述SQL查询语句,结合用户的健康评价,通过预先构建的智能医疗问答知识图谱获取问句的应答。
本发明的第三方面,提出了一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的基于智能穿戴设备的智能医疗问答方法。
本发明的第四方面,提出了一种处理装置,包括处理器、存储装置;所述处理器,适于执行各条程序;所述存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的基于智能穿戴设备的智能医疗问答方法。
本发明的有益效果:
(1)本发明基于智能穿戴设备的智能医疗问答方法,结合深度学习与用户生理指标信息,进一步挖掘人体生理指标所能反应的个人健康信息,同时也为智能医疗问答提供更多的背景资料。
(2)本发明基于智能穿戴设备的智能医疗问答方法,通过实体识别模型研究用户问句,识别出问句中实体、问句类型,有效缓解医疗领域的实体识别缺乏标注的问题。
(3)本发明基于智能穿戴设备的智能医疗问答方法,进行用户健康评价时结合了用户的基本信息,充分考虑了不同年龄、不同性别、不同职业用户之间的差异性,同时模型也关注短期的生理指标影响,进一步提升了模型的性能。
(4)本发明基于智能穿戴设备的智能医疗问答方法,有效的把生理指标数据和网络健康信息资源进行综合利用,对用户初步诊断、自诊、推动医学领域研究与应用有重大意义。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本发明基于智能穿戴设备的智能医疗问答方法的流程示意图;
图2是本发明基于智能穿戴设备的智能医疗问答方法一种实施例的问答流程示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明提供一种基于智能穿戴设备的智能医疗问答方法,可以实现用户使用自然语言进行提问,帮助有需求的人提供血压、血氧、心率、心电等生理指标的无创测量,结合生理指标和病人症状自述根据构建的医疗知识图谱,使患者能在网络这个虚拟的世界中规避虚假信息并迅速完成自诊。而支持此系统的数据库(包括疾病知识库,医疗问答数据等)的数据来源,是通过网络爬虫提取的大量医学资料和疾病百科等资料,这些资料是具有医学专业背景知识的医疗专家的专业活动痕迹,其问答诊疗记录中含有巨大的有待挖掘的医疗领域知识。患者在医院看病时,医生一般只给出诊断结论和治疗意见,而患者往往更想了解疾病相关的其他信息,例如疾病的起因,生活中应该注意的事情等。这些问题对医生来说是被经常问到的一些问题,通过本文的智能回答系统对这些问题进行自动回答,既可以节约医生的时间,从大量医生回答中总结出来的回答又可以切实的让患者对疾病有一个更深刻的了解。
本发明的一种基于智能穿戴设备的智能医疗问答方法,该智能医疗问答方法包括:
步骤A10,通过训练好的实体识别模型提取用户提问的问句中的医疗实体;所述医疗实体包括疾病名称、症状名称和药物名称;
步骤A20,基于所述医疗实体进行用户意图识别,并基于所述医疗实体和用户意图进行词典槽位填充;
步骤A30,将词典槽位填充后的问句转换为SQL查询语句;
步骤A40,基于所述SQL查询语句,结合用户的健康评价,通过预先构建的智能医疗问答知识图谱获取问句的应答。
其中,所述用户的健康评价,其获取方法为:
步骤B10,通过穿戴设备获取用户生理指标和背景信息;所述生理指标包括用户体重指数、血压、脉搏、肺活量、体温、心率、血脂和心电图;所述背景信息包括用户身高、年龄、性别、职业和过往病史;
步骤B20,基于所述用户生理指标和背景信息,通过训练好的基于BiLSTM的联合深度模型获取用户的健康评价。
为了更清晰地对本发明基于智能穿戴设备的智能医疗问答方法进行说明,下面结合图1对本发明实施例中各步骤展开详述。
本发明第一实施例的基于智能穿戴设备的智能医疗问答方法,各步骤详细描述如下:
步骤A10,通过训练好的实体识别模型BiLstm-CRF提取用户提问的问句中的医疗实体。
实体识别模型BiLstm-CRF的训练方法为:
步骤D10,将获取的训练数据转换为分词,并通过BIOES标注法对训练数据中的句子进行命名实体标注;
步骤D20,在标注后的训练数据中加入<PAD>、<UNK>、<NUM>分别表示填充字符、未知字符、数字字符;
步骤D30,构建字典标签,将训练数据中的文字与标签分别转成数字,在生成batch后,对batch内句子padding到设定的统一长度,并计算每句的真实长度;
步骤D40,采用BiLSTM对每一个batch进行处理,并将输出结果进行拼接;
输入shape[batch,seq_Length,hidden_dim],输出shape[batch,seq_length,2*hidden_dim]。
步骤D50,通过拼接后的数据进行实体识别模型的迭代训练,并向模型损失函数梯度下降方向更新模型的参数,直至模型损失函数值低于设定阈值或达到设定训练次数,获得训练好的实体识别模型。
将得到的结果保存存到checkpoints;loss的情况,保留到tensorboard中。
通过训练好的实体识别模型BiLstm-CRF可以提取用户问句中的医疗实体:疾病名称、症状名称和药物名称。
步骤A20,基于所述医疗实体进行用户意图识别,并基于所述医疗实体和用户意图进行词典槽位填充。
槽位填充,就是将用户输入的问句,根据既定的一些结构化字段,将其提取出来,可以对后续的处理流程更加准确的给与反馈。这样,就可以将提取的意图和槽位,用来进行查询服务,然后反馈给用户所需的信息。例子,“感冒应该怎么治疗”,这里可以提取出槽位是“感冒”,意图是治疗。根据意图和槽位查询用户需要的信息。
在进行问句的医疗实体提取之后,还需要理解用户问句的意图,即进行用户意图识别。
步骤A30,将词典槽位填充后的问句转换为SQL查询语句。
步骤A40,基于所述SQL查询语句(即生成的cpyder查询语句),结合用户健康评价,通过预先构建的智能医疗问答知识图谱获取问句的应答。
智能医疗问答知识图谱,其构建方法为:
步骤C10,获取医疗平台的医疗文本数据,并将所述医疗文本数据转换为三元组结构化数据。
医疗平台的医疗文本数据为通过网络爬虫提取的大量医学资料和疾病百科等资料,这些资料是具有医学专业背景知识的医疗专家的专业活动的痕迹,其问答诊疗记录中含有巨大的有待挖掘的医疗领域知识。
步骤C20,将所述三元组结构化数据导入Neo4j数据库,构建以疾病为中心的智能医疗问答知识图谱。
其中,所述用户的健康评价,其获取方法为:
步骤B10,通过穿戴设备获取用户生理指标和背景信息;所述生理指标包括用户体重指数、血压、脉搏、肺活量、体温、心率、血脂、心电图和过往病史;所述背景信息包括用户身高、年龄、性别和职业;
步骤B20,基于所述用户生理指标和背景信息,通过训练好的基于LSTM的联合深度模型获取用户的健康评价。
基于BiLSTM的联合深度模型,其训练方法为:
步骤E10,获取用户生理指标体检数据和背景信息以及对应的用户的真实体检健康评价;
步骤E20,对所述用户生理指标体检数据和背景信息进行异常值、缺失值处理,并对其中的文本数据进行词向量训练,获得预处理用户生理指标体检数据和背景信息;
步骤E30,通过联合深度模型中的LSTM机制获取预处理用户生理指标体检数据的输出状态序列,并通过联合深度模型中自我注意力模块提取生理指标向量;通过联合深度模型中的MLP对预处理用户背景信息进行建模,获得第一预测向量。
“通过联合深度模型中的LSTM机制获取预处理用户生理指标体检数据的输出状态序列”,其方法如式(1)、式(2)和式(3)所示:
Hui=(x0,x1,…,xt,…,xn) (1)
ht=LTSM(xt,ht-1) (2)
H=(h0,h1,…,ht,…,hT) (3)
其中,Hui为预处理用户生理指标体检数据的时序数据,xt,t=0,1,…,t,…,n为时序数据中第t时刻的数据,ht和ht-1分别代表t和t-1时刻的生理指标向量,H为0-T时刻的用户生理指标体检数据的输出状态序列。
“通过联合深度模型中自我注意力模块提取生理指标向量”,其方法如式(4)所示:
a=softmax(W2tanh(W1H+b1)+b2) (4)
其中,W1和W2分别为网络权重,b1和b2分别为网络偏置向量,tanh(·)代表和softmax(·)代表激活函数。
步骤E40,通过联合深度模型的全连接层合并所述生理指标向量和第一预测向量,获得用户的预测健康评价;
步骤E50,计算所述用户的真实体检健康评价和预测健康评价之间的二进制交叉熵损失,通过反向传播向模型损失函数梯度下降方向更新模型的参数,进行模型迭代训练直至模型损失函数值低于设定阈值或达到设定训练次数,获得训练好的基于BiLSTM的联合深度模型。
二进制交叉熵损失,其计算方法如式(5)所示:
loss=-∑ylogyui+(1-y)log(1-yui) (5)
其中,y为用户的真实体检健康评价,yui为用户的预测健康评价。
如图2所示,为本发明基于智能穿戴设备的智能医疗问答方法一种实施例的问答流程示意图,系统采集用户数据之后还设置有预警模块,在用户的生理指标数据中若有某一项生理指标超出正常范围,则预警模块进行预警(预警方法有多种,比如声音预警、图像预警、短信或信息预警等),最终从知识图谱中获取候选应答的词,并将词排序生成问句的应答。
本发明第二实施例的基于智能穿戴设备的智能医疗问答系统,该智能医疗问答系统包括用户生理指标和背景信息获取模块、用户健康评价获取模块、问句获取模块、实体提取模块、意图识别及词典槽位填充模块、SQL转换模块和应答模块;
所述用户生理指标和背景信息获取模块,配置为通过穿戴设备获取用户生理指标和用户背景信息;所述用户生理指标包括用户体重指数、血压、脉搏、肺活量、体温、心率、血脂和心电图;所述用户背景信息包括用户身高、年龄、性别和过往病史;
所述用户健康评价获取模块,配置为基于所述用户生理指标和背景信息,通过训练好的基于BiLSTM的联合深度模型获取用户的健康评价;
所述问句获取模块,配置为获取用户提问的问句并输入;
所述实体提取模块,配置为通过训练好的实体识别模型提取用户提问的问句中的医疗实体;所述医疗实体包括疾病名称、症状名称和药物名称;
所述意图识别及词典槽位填充模块,配置为基于所述医疗实体进行用户意图识别,并基于所述医疗实体和用户意图进行词典槽位填充;
所述SQL转换模块,配置为将词典槽位填充后的问句转换为SQL查询语句;
所述应答模块,配置为基于所述SQL查询语句,结合用户的健康评价,通过预先构建的智能医疗问答知识图谱获取问句的应答。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的基于智能穿戴设备的智能医疗问答系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
本发明第三实施例的一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的基于智能穿戴设备的智能医疗问答方法。
本发明第四实施例的一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的基于智能穿戴设备的智能医疗问答方法。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (10)
1.一种基于智能穿戴设备的智能医疗问答方法,其特征在于,该智能医疗问答方法包括:
步骤A10,通过训练好的实体识别模型提取用户提问的问句中的医疗实体;所述医疗实体包括疾病名称、症状名称和药物名称;
步骤A20,基于所述医疗实体进行用户意图识别,并基于所述医疗实体和用户意图进行词典槽位填充;
步骤A30,将词典槽位填充后的问句转换为SQL查询语句;
步骤A40,基于所述SQL查询语句,结合用户的健康评价,通过预先构建的智能医疗问答知识图谱获取问句的应答。
其中,所述用户的健康评价,其获取方法为:
步骤B10,通过穿戴设备获取用户生理指标和背景信息;所述生理指标包括用户体重指数、血压、脉搏、肺活量、体温、心率、血脂和心电图;所述背景信息包括用户身高、年龄、性别、职业和过往病史;
步骤B20,基于所述用户生理指标和背景信息,通过训练好的基于BiLSTM的联合深度模型获取用户的健康评价。
2.根据权利要求1所述的基于智能穿戴设备的智能医疗问答方法,其特征在于,所述智能医疗问答知识图谱,其构建方法为:
步骤C10,获取医疗平台的医疗文本数据,并将所述医疗文本数据转换为三元组结构化数据;
步骤C20,将所述三元组结构化数据导入Neo4j数据库,构建以疾病为中心的智能医疗问答知识图谱。
3.根据权利要求1所述的基于智能穿戴设备的智能医疗问答方法,其特征在于,所述实体识别模型,其训练方法为:
步骤D10,将获取的训练数据转换为分词,并通过BIOES标注法对训练数据中的句子进行命名实体标注;
步骤D20,在标注后的训练数据中加入<PAD>、<UNK>、<NUM>分别表示填充字符、未知字符、数字字符;
步骤D30,构建字典标签,将训练数据中的文字与标签分别转成数字,在生成batch后,对batch内句子padding到设定的统一长度,并计算每句的真实长度;
步骤D40,采用BiLSTM对每一个batch进行处理,并将输出结果进行拼接;
步骤D50,通过拼接后的数据进行实体识别模型的迭代训练,并向模型损失函数梯度下降方向更新模型的参数,直至模型损失函数值低于设定阈值或达到设定训练次数,获得训练好的实体识别模型。
4.根据权利要求1所述的基于智能穿戴设备的智能医疗问答方法,其特征在于,所述基于BiLSTM的联合深度模型,其训练方法为:
步骤E10,获取用户生理指标体检数据和背景信息以及对应的用户的真实体检健康评价;
步骤E20,对所述用户生理指标体检数据和背景信息进行异常值、缺失值处理,并对其中的文本数据进行词向量训练,获得预处理用户生理指标体检数据和背景信息;
步骤E30,通过联合深度模型中的LSTM机制获取预处理用户生理指标体检数据的输出状态序列,并通过联合深度模型中自我注意力模块提取生理指标向量;通过联合深度模型中的MLP对预处理用户背景信息进行建模,获得第一预测向量;
步骤E40,通过联合深度模型的全连接层合并所述生理指标向量和第一预测向量,获得用户的预测健康评价;
步骤E50,计算所述用户的真实体检健康评价和预测健康评价之间的二进制交叉熵损失,通过反向传播向模型损失函数梯度下降方向更新模型的参数,进行模型迭代训练直至模型损失函数值低于设定阈值或达到设定训练次数,获得训练好的基于BiLSTM的联合深度模型。
5.根据权利要求4所述的基于智能穿戴设备的智能医疗问答方法,其特征在于,步骤E30中“通过联合深度模型中的LSTM机制获取预处理用户生理指标体检数据的输出状态序列”,其方法为:
Hui=(x0,x1,…,xt,…,xn)
ht=LTSM(xt,ht-1)
H=(h0,h1,…,ht,…,hT)
其中,Hui为预处理用户生理指标体检数据的时序数据,xt,t=0,1,…,t,…,n为时序数据中第t时刻的数据,ht和ht-1分别代表t和t-1时刻的生理指标向量,H为0-T时刻的用户生理指标体检数据的输出状态序列。
6.根据权利要求5所述的基于智能穿戴设备的智能医疗问答方法,其特征在于,步骤E30中“通过联合深度模型中自我注意力模块提取生理指标向量”,其方法为:
a=softmax(W2tanh(W1H+b1)+b2)
其中,W1和W2分别为网络权重,b1和b2分别为网络偏置向量,tanh(·)代表和softmax(·)代表激活函数。
7.根据权利要求4所述的基于智能穿戴设备的智能医疗问答方法,其特征在于,所述二进制交叉熵损失,其计算方法为:
loss=-∑ylogyui+(1-y)log(1-yui)
其中,y为用户的真实体检健康评价,yui为用户的预测健康评价。
8.一种基于智能穿戴设备的智能医疗问答系统,其特征在于,该智能医疗问答系统包括用户生理指标和背景信息获取模块、用户健康评价获取模块、问句获取模块、实体提取模块、意图识别及词典槽位填充模块、SQL转换模块和应答模块;
所述用户生理指标和背景信息获取模块,配置为通过穿戴设备获取用户生理指标和用户背景信息;所述用户生理指标包括用户体重指数、血压、脉搏、肺活量、体温、心率、血脂和心电图;所述用户背景信息包括用户身高、年龄、性别和过往病史;
所述用户健康评价获取模块,配置为基于所述用户生理指标和背景信息,通过训练好的基于BiLSTM的联合深度模型获取用户的健康评价;
所述问句获取模块,配置为获取用户提问的问句并输入;
所述实体提取模块,配置为通过训练好的实体识别模型提取用户提问的问句中的医疗实体;所述医疗实体包括疾病名称、症状名称和药物名称;
所述意图识别及词典槽位填充模块,配置为基于所述医疗实体进行用户意图识别,并基于所述医疗实体和用户意图进行词典槽位填充;
所述SQL转换模块,配置为将词典槽位填充后的问句转换为SQL查询语句;
所述应答模块,配置为基于所述SQL查询语句,结合用户的健康评价,通过预先构建的智能医疗问答知识图谱获取问句的应答。
9.一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载并执行以实现权利要求1-7任一项所述的基于智能穿戴设备的智能医疗问答方法。
10.一种处理装置,包括
处理器,适于执行各条程序;以及
存储装置,适于存储多条程序;
其特征在于,所述程序适于由处理器加载并执行以实现:
权利要求1-7任一项所述的基于智能穿戴设备的智能医疗问答方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011298492.9A CN112259260B (zh) | 2020-11-18 | 2020-11-18 | 基于智能穿戴设备的智能医疗问答方法、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011298492.9A CN112259260B (zh) | 2020-11-18 | 2020-11-18 | 基于智能穿戴设备的智能医疗问答方法、系统及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112259260A true CN112259260A (zh) | 2021-01-22 |
CN112259260B CN112259260B (zh) | 2023-11-17 |
Family
ID=74266312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011298492.9A Active CN112259260B (zh) | 2020-11-18 | 2020-11-18 | 基于智能穿戴设备的智能医疗问答方法、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112259260B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114281153A (zh) * | 2021-12-22 | 2022-04-05 | 奥美医健(北京)科技有限公司 | 一种基于互联网的多指标体适能整合评价装置及方法 |
CN117520508A (zh) * | 2023-11-20 | 2024-02-06 | 广州方舟信息科技有限公司 | 医药对话答案生成方法、装置、电子设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108108449A (zh) * | 2017-12-27 | 2018-06-01 | 哈尔滨福满科技有限责任公司 | 一种面向医疗领域的基于多源异构数据问答系统及该系统的实现方法 |
CN108597609A (zh) * | 2018-05-04 | 2018-09-28 | 华东师范大学 | 一种基于lstm网络的医养结合健康监测方法 |
CN109697285A (zh) * | 2018-12-13 | 2019-04-30 | 中南大学 | 增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法 |
CN110147452A (zh) * | 2019-05-17 | 2019-08-20 | 北京理工大学 | 一种基于层级bert神经网络的粗粒度情感分析方法 |
US20190311807A1 (en) * | 2018-04-06 | 2019-10-10 | Curai, Inc. | Systems and methods for responding to healthcare inquiries |
CN110993093A (zh) * | 2019-11-15 | 2020-04-10 | 北京邮电大学 | 基于深度学习的眼科预问诊方法与装置 |
CN111125309A (zh) * | 2019-12-23 | 2020-05-08 | 中电云脑(天津)科技有限公司 | 自然语言处理方法、装置及计算设备、存储介质 |
CN111352977A (zh) * | 2020-03-10 | 2020-06-30 | 浙江大学 | 基于自注意力双向长短期记忆网络的时序数据监测方法 |
CN111540460A (zh) * | 2020-04-22 | 2020-08-14 | 山东凯鑫宏业生物科技有限公司 | 一种具有知识库的智能医疗系统及其诊断方法 |
-
2020
- 2020-11-18 CN CN202011298492.9A patent/CN112259260B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108108449A (zh) * | 2017-12-27 | 2018-06-01 | 哈尔滨福满科技有限责任公司 | 一种面向医疗领域的基于多源异构数据问答系统及该系统的实现方法 |
US20190311807A1 (en) * | 2018-04-06 | 2019-10-10 | Curai, Inc. | Systems and methods for responding to healthcare inquiries |
CN108597609A (zh) * | 2018-05-04 | 2018-09-28 | 华东师范大学 | 一种基于lstm网络的医养结合健康监测方法 |
CN109697285A (zh) * | 2018-12-13 | 2019-04-30 | 中南大学 | 增强语义表示的层次BiLSTM中文电子病历疾病编码标注方法 |
CN110147452A (zh) * | 2019-05-17 | 2019-08-20 | 北京理工大学 | 一种基于层级bert神经网络的粗粒度情感分析方法 |
CN110993093A (zh) * | 2019-11-15 | 2020-04-10 | 北京邮电大学 | 基于深度学习的眼科预问诊方法与装置 |
CN111125309A (zh) * | 2019-12-23 | 2020-05-08 | 中电云脑(天津)科技有限公司 | 自然语言处理方法、装置及计算设备、存储介质 |
CN111352977A (zh) * | 2020-03-10 | 2020-06-30 | 浙江大学 | 基于自注意力双向长短期记忆网络的时序数据监测方法 |
CN111540460A (zh) * | 2020-04-22 | 2020-08-14 | 山东凯鑫宏业生物科技有限公司 | 一种具有知识库的智能医疗系统及其诊断方法 |
Non-Patent Citations (3)
Title |
---|
刘秀玲;杨国杰;王洪瑞;杜欢平;郭磊;: "动态生理信息融合在人体健康评价系统的应用", 计算机工程与应用, no. 16 * |
卢严砖;孔祥勇;李星星;徐云舟;吴汶?;陈学武;朱睿琪;: ""医路同行"智能医疗服务平台设计与实现", 软件, no. 01 * |
帕尔哈提・吐尼牙孜;: "基于医学领域的知识图谱", 电脑知识与技术, no. 08 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114281153A (zh) * | 2021-12-22 | 2022-04-05 | 奥美医健(北京)科技有限公司 | 一种基于互联网的多指标体适能整合评价装置及方法 |
CN117520508A (zh) * | 2023-11-20 | 2024-02-06 | 广州方舟信息科技有限公司 | 医药对话答案生成方法、装置、电子设备和存储介质 |
CN117520508B (zh) * | 2023-11-20 | 2024-05-28 | 广州方舟信息科技有限公司 | 医药对话答案生成方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112259260B (zh) | 2023-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112863630A (zh) | 基于数据和知识的个性化精准医疗问答系统 | |
KR20170061222A (ko) | 건강데이터 패턴의 일반화를 통한 건강수치 예측 방법 및 그 장치 | |
US11640403B2 (en) | Methods and systems for automated analysis of behavior modification data | |
US11157822B2 (en) | Methods and systems for classification using expert data | |
CN112259260B (zh) | 基于智能穿戴设备的智能医疗问答方法、系统及装置 | |
US11915827B2 (en) | Methods and systems for classification to prognostic labels | |
Molla et al. | A predictive analysis framework of heart disease using machine learning approaches | |
CN110752027A (zh) | 电子病历数据推送方法、装置、计算机设备和存储介质 | |
Bisercic et al. | Interpretable medical diagnostics with structured data extraction by large language models | |
CN112349367B (zh) | 一种生成仿真病历的方法、装置、电子设备及存储介质 | |
Wang et al. | Research on named entity recognition of doctor-patient question answering community based on bilstm-crf model | |
Konnova et al. | Application of neural networks in cardiovascular decision support systems | |
Shen | A Multi-source Based Healthcare Method for Heart Disease Prediction by Machine Learning | |
Douibi et al. | An analysis of ambulatory blood pressure monitoring using multi-label classification | |
CN115862897A (zh) | 一种基于临床数据的症候群监测方法及系统 | |
CN113140315B (zh) | 一种健康自测系统、服务器及健康检测系统 | |
Suneetha et al. | Fine tuning bert based approach for cardiovascular disease diagnosis | |
CN114328864A (zh) | 基于人工智能和知识图谱的眼科问答系统 | |
CN113761899A (zh) | 一种医疗文本生成方法、装置、设备及存储介质 | |
JP2021189093A (ja) | 自己免疫性水疱症の診断装置 | |
Manivannan et al. | Health monitoring system for diabetic patients | |
Dou et al. | Electrocardiogram Signal Classification Algorithm Based on The Continuous Wavelet Transform and GoogleNet in an Internet of Things Context | |
CN116344009B (zh) | 一种线上就诊通知方法及装置 | |
Gupta et al. | Heart Disease Prediction using Machine learning algorithms | |
US20200380411A1 (en) | Methods and systems for causative chaining of prognostic label classifications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |