CN112016318B - 基于解释模型的分诊信息推荐方法、装置、设备及介质 - Google Patents

基于解释模型的分诊信息推荐方法、装置、设备及介质 Download PDF

Info

Publication number
CN112016318B
CN112016318B CN202010935273.0A CN202010935273A CN112016318B CN 112016318 B CN112016318 B CN 112016318B CN 202010935273 A CN202010935273 A CN 202010935273A CN 112016318 B CN112016318 B CN 112016318B
Authority
CN
China
Prior art keywords
triage
preset
text
characteristic information
interpretation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010935273.0A
Other languages
English (en)
Other versions
CN112016318A (zh
Inventor
朱昭苇
孙行智
胡岗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010935273.0A priority Critical patent/CN112016318B/zh
Publication of CN112016318A publication Critical patent/CN112016318A/zh
Priority to PCT/CN2020/135722 priority patent/WO2021151358A1/zh
Application granted granted Critical
Publication of CN112016318B publication Critical patent/CN112016318B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Abstract

本发明涉及人工智能技术领域,应用于智慧医疗领域中,以便推动智慧城市的建设,揭露了一种基于解释模型的分诊信息推荐方法、装置、设备及介质。该方法通过将获取待分诊对象录入的特征信息文本输入至预设解释模型,对特征信息文本进行解释处理,得到与特征信息文本对应的解释结果;比对特征信息文本的各词语对应的匹配值以及预设匹配阈值,确定特征信息文本中是否存在分诊解释词语;在特征信息文本中存在分诊解释词语时,将特征信息文本输入至预设分诊决策模型中,对特征信息文本进行分诊处理,得到分诊信息;将分诊信息以及分诊解释词语关联推送至待分诊对象。本发明提高了预设分诊决策模型的利用率以及效率,提高了分诊信息的准确率。

Description

基于解释模型的分诊信息推荐方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于解释模型的分诊信息推荐方法、装置、设备及介质。
背景技术
随着科学技术的发展,人工智能技术也随之发展。例如,在医疗行业中的分诊系统,分诊系统的应用可以替代分诊台的医护人员进行分诊推荐,有效缓解医护人员的压力。
现有技术中的分诊系统,需要患者录入分诊文本至分诊系统之后,分诊系统根据分诊文本推送分诊信息,该方案的不足之处在于:在患者在不小心甚至恶意输入错误文本(与病情和分诊无关的文本)时,分诊系统依旧会根据输入的错误文本输出分诊信息,在该情况下,分诊系统的利用率较低;并且,患者通常是通过口语化的描述录入分诊文本,因此,分诊系统对分诊文本的识别往往较为片面,如此会导致最终输出的分诊信息准确率较低。
发明内容
本发明实施例提供一种基于解释模型的分诊信息推荐方法、装置、设备及介质,以解决分诊系统利用率较低以及分诊信息准确率较低的问题。
一种基于解释模型的分诊信息推荐方法,包括:
获取待分诊对象录入的特征信息文本;
将所述特征信息文本输入至预设解释模型,对所述特征信息文本进行解释处理,得到与所述特征信息文本对应的解释结果;所述解释结果中包含预设分诊参考向量与所述特征信息文本中各词语对应的匹配值;
比对所述特征信息文本的各词语对应的匹配值以及预设匹配阈值,确定所述特征信息文本中是否存在分诊解释词语;所述分诊解释词语是指所述特征信息文本中与大于或等于所述预设匹配阈值的匹配值对应的词语;
在所述特征信息文本中存在分诊解释词语时,将所述特征信息文本输入至预设分诊决策模型中,对所述特征信息文本进行分诊处理,得到与所述特征信息文本对应的分诊信息;
将所述分诊信息以及所述分诊解释词语关联推送至所述待分诊对象。
一种基于解释模型的分诊信息推荐装置,包括:
文本获取模块,用于获取待分诊对象录入的特征信息文本;
解释处理模块,用于将所述特征信息文本输入至预设解释模型,对所述特征信息文本进行解释处理,得到与所述特征信息文本对应的解释结果;所述解释结果中包含预设分诊参考向量与所述特征信息文本中各词语对应的匹配值;
匹配比对模块,用于比对所述特征信息文本的各词语对应的匹配值以及预设匹配阈值,确定所述特征信息文本中是否存在分诊解释词语;所述分诊解释词语是指所述特征信息文本中与大于或等于所述预设匹配阈值的匹配值对应的词语;
文本分类模块,用于在所述特征信息文本中存在分诊解释词语时,将所述特征信息文本输入至预设分诊决策模型中,对所述特征信息文本进行分诊处理,得到与所述特征信息文本对应的分诊信息;
分诊信息推送模块,用于将所述分诊信息以及所述分诊解释词语关联推送至所述待分诊对象。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于解释模型的分诊信息推荐方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于解释模型的分诊信息推荐方法。
上述基于解释模型的分诊信息推荐方法、装置、设备及介质,通过获取待分诊对象录入的特征信息文本;将所述特征信息文本输入至预设解释模型,对所述特征信息文本进行解释处理,得到与所述特征信息文本对应的解释结果;所述解释结果中包含预设分诊参考向量与所述特征信息文本中各词语对应的匹配值;比对所述特征信息文本的各词语对应的匹配值以及预设匹配阈值,确定所述特征信息文本中是否存在分诊解释词语;所述分诊解释词语是指所述特征信息文本中与大于或等于所述预设匹配阈值的匹配值对应的词语;在所述特征信息文本中存在分诊解释词语时,将所述特征信息文本输入至预设分诊决策模型中,对所述特征信息文本进行分诊处理,得到与所述特征信息文本对应的分诊信息;将所述分诊信息以及所述分诊解释词语关联推送至所述待分诊对象。
本发明通过引入预设解释模型,在特征信息文本中存在分诊解释词语时,才将特征信息文本输入至预设分诊决策模型进行分诊,提高了预设分诊决策模型的利用率以及效率;并且,本发明中将得到的分诊信息与分诊解释词语关联推送至待分诊对象,令待分诊对象可以了解给出该分诊信息的依据,在保证分诊信息的准确率的同时,提升了用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中基于解释模型的分诊信息推荐方法的一应用环境示意图;
图2是本发明一实施例中基于解释模型的分诊信息推荐方法的一流程图;
图3是本发明一实施例中基于解释模型的分诊信息推荐方法中步骤S20的一流程图;
图4是本发明一实施例中基于解释模型的分诊信息推荐方法中步骤S40的一流程图;
图5是本发明一实施例中基于解释模型的分诊信息推荐装置的一原理框图;
图6是本发明一实施例中基于解释模型的分诊信息推荐装置中解释处理模块的一原理框图;
图7是本发明一实施例中基于解释模型的分诊信息推荐装置中文本分类模块的一原理框图;
图8是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于解释模型的分诊信息推荐方法,该基于解释模型的分诊信息推荐方法可应用如图1所示的应用环境中。具体地,该基于解释模型的分诊信息推荐方法应用在基于解释模型的分诊信息推荐系统中,该基于解释模型的分诊信息推荐系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于解决分诊系统利用率较低以及分诊信息准确率较低的问题。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种基于解释模型的分诊信息推荐方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S10:获取待分诊对象录入的特征信息文本。
示例性地,假设该方法应用于线下的医疗行业,则该待分诊对象可以为患者;假设该方法应用于线上的应用程序,则该待分诊对象可以为客户端的用户。特征信息文本包括但不限于待分诊对象的基本信息(如年龄、身高等)、症状信息(如病情信息等)等。
S20:将所述特征信息文本输入至预设解释模型,对所述特征信息文本进行解释处理,得到与所述特征信息文本对应的解释结果;所述解释结果中包含预设分诊参考向量与所述特征信息文本中各词语对应的匹配值。
其中,预设解释模型是基于循环神经网络模型以及注意力模型构建的模型。解释处理指的是获取特征信息文本中各词语的匹配值的过程。匹配值指的是特征信息文本中各词语对应的实体向量与预设分诊参考向量之间的匹配程度。
在一具体实施方式中,如图3所示,步骤S20包括如下步骤:
S201:根据预设词语实体库,对所述特征信息文本进行分词处理,得到与所述特征信息文本对应的各字词实体。
其中,预设词语实体库指的是采用历史数据(如历史药物信息、历史住院信息等)中统计的所有医学实体(如咳嗽、感冒等症状实体,亦或者具体的疾病实体,如白血病等)构建得到的数据库。
具体地,在获取待分诊对象的特征信息文本之后,将特征信息文本输入至预设解释模型中,根据该预设解释模型中的预设词语实体库,对特征信息文本进行分词处理,得到与特征信息文本对应的各字词实体。
示例性地,假设特征信息文本为“发现咳嗽三天”,在分词处理后得到的各字词实体为“发现”、“咳嗽”以及“三天”。
S202:将各字词实体输入至所述预设解释模型的循环神经网络模型中,得到与各所述字词实体对应的实体向量。
作为优选,循环神经网络模型选择LSTM(Long Short-Term Memory,长短期记忆网络)。
具体地,在根据预设词语实体库,对所述特征信息文本进行分词处理,得到与所述特征信息文本对应的各字词实体之后,将各字词实体输入至预设解释模型的循环神经网路模型中,对各字词实体进行正向词向量编码,得到与各字词实体对应的正向词向量;对各字词实体进行反向词向量编码,得到与各字词实体对应的反向词向量;对各词语的正向词向量和反向词向量进行融合表征,得到与各字词实体对应的实体向量,进而可以保证各实体向量均可以融入特征信息文本中的上下文信息。
S203:获取预设分诊参考向量,将各所述实体向量与所述预设分诊参考向量输入至所述预设解释模型中的注意力模型中,确定各所述实体向量与所述预设分诊参考向量之间的匹配值。
其中,预设分诊参考向量是基于历史医疗数据中的各医疗体系的字词得到的,该预设分诊参考向量用于判定特征信息文本中各实体向量是否符合医疗体系下的实体向量。注意力模型用于确定各实体向量与预设分诊参考向量之间的匹配值,该注意力模型是基于注意力机制构建的。
具体地,在将各字词实体输入至所述预设解释模型的循环神经网络模型中,得到与各所述字词实体对应的实体向量之后,获取预设分诊参考向量;将各实体向量以及预设分诊参考向量输入至预设解释模型中的注意力模型中,采用距离度量函数确定各实体向量与参考向量之间的参考距离;通过softmax(逻辑回归)网络对各参考距离进行归一化处理之后,得到各实体向量与预设分诊参考向量之间的匹配值。
在一具体实施方式中,在步骤S203之前,也即获取预设分诊参考向量之前,包括:
S205:获取样本数据集,所述样本数据集中包含至少一个样本信息;所述样本信息中包含至少一个样本决策词语。
其中,样本数据集指的是采集不同的历史医疗数据(如历史住院信息、历史药物信息等)得到的样本集合。样本信息可以为一个历史住院信息、一个历史药物信息等。样本决策词语指的是在历史住院信息中与医疗体系相关的词语(如感冒、咳嗽等各种病情词语)。
S206:将各所述样本决策词语输入至预设词向量模型中,对各所述样本决策词语进行向量表示,得到与各所述样本决策词语对应的决策词向量。
其中,预设词向量模型指的是用于将各词语表征为与其对应的向量编码的模型,示例性地,该预设词向量模型可以为word2vec模型。
具体地,在获取样本数据集之后,将各样本信息中的各样本决策词语输入至预设词向量模型中,对各样本决策词语进行向量表示,进而得到各样本信息中与各样本决策词语对应的决策词向量。
S207:获取与各决策词向量对应的样本权重,并根据各所述决策词向量对应的样本权重以及预设加权方法,确定所述预设分诊参考向量。
其中,样本权重指的是各决策词向量在与其对应的样本信息中出现的频率以及各决策向量在样本数据集中出现的频次的综合权重。预设加权方法指的是加权平均方法。
具体地,在将各所述样本决策词语输入至预设词向量模型中,对各所述样本决策词语进行向量表示,得到与各所述样本决策词语对应的决策词向量之后,通过TF-IDF(TermFrequency–Inverse Document Frequency,词频-逆文本频率指数)技术,计算各决策词向量在与其对应的样本信息中出现的频率以及各决策向量在样本数据集中出现的频次的综合权重,进而得到与各决策词向量对应的样本权重;通过对各决策词向量对应的样本权重进行加权平均的方法,进而将各决策词向量统一表示为预设分诊参考向量。
S204:根据各所述实体向量与所述预设分诊参考向量之间的匹配值,得到与所述特征信息文本对应的所述解释结果。
具体地,在获取预设分诊参考向量,将各所述实体向量与所述预设分诊参考向量输入至所述预设解释模型中的注意力模型中,确定各所述实体向量与所述预设分诊参考向量之间的匹配值之后,根据各所述实体向量与所述预设分诊参考向量之间的匹配值,得到与所述特征信息文本对应的所述解释结果。
S30:比对所述特征信息文本的各词语对应的匹配值以及预设匹配阈值,确定所述特征信息文本中是否存在分诊解释词语;所述分诊解释词语是指所述特征信息文本中与大于或等于所述预设匹配阈值的匹配值对应的词语。
示例性地,预设匹配阈值可以为0.9,0.95等数值。
具体地,在将所述特征信息文本输入至预设解释模型,对所述特征信息文本进行解释处理,得到与所述特征信息文本对应的解释结果;由于该解释结果中包含与特征信息文本中各词语对应的匹配值,进而比对各词语对应的匹配值以及预设匹配阈值,也即将各词语对应的匹配值与预设匹配阈值进行比较,以确定特征信息文本中是否存在分诊解释词语;
进一步地,在特征信息文本中,若存在大于或等于预设匹配阈值的匹配值对应的词语时,将该词语记录为分诊解释词语,该分诊解释词语用于对步骤S40中得到的分诊信息进行解释。
S40:在所述特征信息文本中存在分诊解释词语时,将所述特征信息文本输入至预设分诊决策模型中,对所述特征信息文本进行分诊处理,得到与所述特征信息文本对应的分诊信息。
其中,预设分诊决策模型用于输出与特征信息文本对应的分诊信息,作为优选,该预设分诊决策模型可以采用非结构化的CNN(Convolutional Neural Networks,卷积神经网络)模型构建得到。分诊信息可以是药物推荐信息、也可以是科室推荐信息。
具体地,在比对所述特征信息文本的各词语对应的匹配值以及预设匹配阈值,确定所述特征信息文本中是否存在分诊解释词语之后,在特征信息文本中存在分诊解释词语时,表征当前待分诊对象输入的特征信息文本中存在与医疗体系高度关联的词语,进而将特征信息文本输入至预设分诊决策模型中,对特征信息文本进行分类,得到与特征信息文本对应的分诊信息。由于特征信息文本中存在分诊解释词语,表明预设分诊决策模型可以识别其中与医疗体系相关的词语,进而提高了在对特征信息文本进行分诊处理后得到的分诊信息的准确率,并且该分诊解释词语可以对该分诊信息作出进一步解释。
在一具体实施方式中,在步骤S30之后,也即在比对所述特征信息文本的各词语对应的匹配值以及预设匹配阈值,确定所述特征信息文本中是否存在分诊解释词语之后,还包括:
在确定所述特征信息文本中并不存在分诊解释词语时,提示所述待分诊对象更新所述特征信息文本。
具体地,在特征信息文本中,若不存在大于或等于预设匹配阈值的匹配值对应的词语时(也即不存在分诊解释词语),表征当前待分诊对象输入的特征信息文本中没有与医疗体系关联的词语,也即在根据该特征信息文本进行确定分诊信息的准确率较低,因此不调用预设分诊决策模型对该特征信息文本进行分诊处理得到分诊信息,提示待分诊对象更新特征信息文本,以在更新后的特征信息文本中存在分诊解释词语时,将更新后的特征信息文版输入至预设分诊决策模型中。通过上述方法,可以在待分诊对象输入的特征信息文本中存在与医疗体系关联的词语时(如咳嗽、感冒等),才将特征信息文本输入至预设分诊决策模型给出具体的分诊信息,而不是在待分诊对象输入任何信息均调用预设分诊决策模型进行分诊处理,提高了预设分诊决策模型输出的分诊信息的准确率,并且每一分诊信息均有对应的分诊解释词语,可以让待分诊对象了解给出分诊信息的原因,提高了预设分诊决策模型的利用率以及效率。
在一具体实施例中,如图4所示,步骤S40中,也即将所述特征信息文本输入至预设分诊决策模型中,对所述特征信息文本进行分诊处理,得到与所述特征信息文本对应的分诊信息,包括如下步骤:
S401:获取所述特征信息文本中的结构化信息,通过所述预设分诊决策模型对所述结构化信息进行特征提取,得到与所述结构化信息对应的结构特征向量。
示例性地,结构化信息可以包括待分诊对象的基本信息(如年龄、性别等)或者统计学信息(如是否抽烟,是否饮酒等)。
具体地,在所述特征信息文本中存在分诊解释词语时,获取特征信息文本中的结构化信息,通过预设分诊决策模型对结构化信息进行特征提取,进一步地可以通过预设分诊决策模型中的编码器对结构化信息进行特征向量抽取,得到与结构化信息对应的结构特征向量。
S402:获取所述特征信息文本中的非结构化信息,确定所述特征信息文本中的非结构化信息的文本长度。
示例性地,非结构化信息可以为待分诊对象输入的病情信息(如发现咳嗽一周,并存在发烧现象等)。文本长度指的是非结构化信息中字符串总长度。
S403:根据所述文本长度以及预设历史文本长度,确定所述预设分诊决策模型中的卷积核类别。
其中,预设历史文本可以为历史医疗数据(如住院信息文本)对应的文本,作为优选,预设历史文本长度选取各预设历史文本长度的平均值。
具体地,在获取所述特征信息文本中的非结构化信息,确定所述特征信息文本中的非结构化信息的文本长度之后,根据文本长度以及预设历史文本长度,确定预设分诊决策模型中对非结构化信息进行特征识别的卷积核类别。
在一具体实施方式中,步骤S403包括如下步骤:
在所述文本长度小于或等于所述预设历史文本长度时,将所述卷积核类别确定为小尺寸卷积核。
在所述文本长度大于所述预设历史文本长度时,将所述卷积核类别确定为大尺寸卷积核。
其中,卷积核可以选取大小为2、3、4、5或者7等。假设本实施例中的预设分诊决策模型中包含四类大小的卷积核,具体为2、3、4和5。
进一步地,在获取所述特征信息文本中的非结构化信息,确定所述特征信息文本中的非结构化信息的文本长度之后,将文本长度与预设历史文本长度进行比对,在文本长度小于或等于预设历史文本长度时,将卷积核类别确定为小尺寸卷积核,也即上述卷积核中大小为2、3、4的卷积核。由于文本长度较短(相较于预设历史文本长度)时,若采用尺寸太大的卷积核进行特征识别,可能无法抽取非结构化信息中的有效信息,并且可能会因为边界处的padding(填充)机制引入其它无效信息,降低了特征识别的准确率。
进一步地,在文本长度大于预设历史文本长度时,将卷积核类别确定为大尺寸卷积核,也即上述卷积核中大小为3、4、5的卷积核。由于文本长度较长(相较于预设历史文本长度)时,若采用尺寸较小的卷积核进行特征识别,可能会造成过于关注非结构化信息中的局部信息,而忽略了全局信息,导致特征识别过程中关注点发生错位,导致特征识别的准确率较低。
S404:通过所述卷积核类别中的卷积核对所述非结构化信息进行卷积池化操作,得到非结构特征向量。
具体地,在根据所述文本长度以及预设历史文本长度,确定所述预设分诊决策模型中的卷积核类别之后,通过卷积核类别中的卷积核对非结构化信息进行卷积池化操作,以抽取非结构化信息中的特征,得到非结构特征向量。
S405:对所述结构特征向量与所述非结构特征向量进行拼接,得到融合向量,并将所述融合向量输入至全连接层后,得到所述分诊信息。
其中,拼接的方式可以采用横向拼接也可以采用纵向拼接,作为优选,本实施例采用纵向拼接方式。
具体地,在通过所述卷积核类别中的卷积核对所述非结构化信息进行卷积池化操作,得到非结构特征向量之后,对结构特征向量与非结构特征向量进行纵向拼接,得到融合向量;将该融合向量输入至全连接层和softmax层进行分类,得到分诊信息。通过在预设分诊决策模型的隐层级别融合了结构化信息和非结构信息的特征向量,提升了预设分诊决策模型的分类精度,提高了分诊信息的准确率。
S50:将所述分诊信息以及所述分诊解释词语关联推送至所述待分诊对象。
具体地,在将所述特征信息文本输入至预设分诊决策模型中,对所述特征信息文本进行分诊处理,得到与所述特征信息文本对应的分诊信息之后,将分诊信息以及分诊解释词语关联推送至待分诊对象。
在本实施例中,通过引入解释模型,在特征信息文本中存在分诊解释词语时,才将特征信息文本输入至预设分诊决策模型,提高了预设分诊决策模型的利用率以及效率;并且通过将得到的分诊信息与分诊解释词语关联推送至待分诊对象,令待分诊对象了解给出该分诊信息的依据,在保证分诊信息的准确率的同时,提升了用户体验。
在另一具体实施例中,为了保证上述实施例中的特征信息文本、预设解释模型以及预设分诊决策模型的私密以及安全性,可以将特征信息文本、预设解释模型以及预设分诊决策模型存储在区块链中。其中,区块链(Blockchain),是由区块(Block)形成的加密的、链式的交易的存储结构。
例如,每个区块的头部既可以包括区块中所有交易的哈希值,同时也包含前一个区块中所有交易的哈希值,从而基于哈希值实现区块中交易的防篡改和防伪造;新产生的交易被填充到区块并经过区块链网络中节点的共识后,会被追加到区块链的尾部从而形成链式的增长。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种基于解释模型的分诊信息推荐装置,该基于解释模型的分诊信息推荐装置与上述实施例中基于解释模型的分诊信息推荐方法一一对应。如图5所示,该基于解释模型的分诊信息推荐装置包括文本获取模块10、解释处理模块20、匹配比对模块30、文本分类模块40以及分诊信息推送模块50。各功能模块详细说明如下:
文本获取模块10,用于获取待分诊对象录入的特征信息文本;
解释处理模块20,用于将所述特征信息文本输入至预设解释模型,对所述特征信息文本进行解释处理,得到与所述特征信息文本对应的解释结果;所述解释结果中包含预设分诊参考向量与所述特征信息文本中各词语对应的匹配值;
匹配比对模块30,用于比对所述特征信息文本的各词语对应的匹配值以及预设匹配阈值,确定所述特征信息文本中是否存在分诊解释词语;所述分诊解释词语是指所述特征信息文本中与大于或等于所述预设匹配阈值的匹配值对应的词语。
文本分类模块40,用于在所述特征信息文本中存在分诊解释词语时,将所述特征信息文本输入至预设分诊决策模型中,对所述特征信息文本进行分诊处理,得到与所述特征信息文本对应的分诊信息。
分诊信息推送模块50,用于将所述分诊信息以及所述分诊解释词语关联推送至所述待分诊对象。
优选地,如图6所示,解释处理模块20包括如下单元:
分词处理单元201,用于根据预设词语实体库,对所述特征信息文本进行分词处理,得到与所述特征信息文本对应的各字词实体;
向量编码单元202,用于将各字词实体输入至所述预设解释模型的循环神经网络模型中,得到与各所述字词实体对应的实体向量;
匹配值确定单元203,用于获取预设分诊参考向量,将各所述实体向量与所述预设分诊参考向量输入至所述预设解释模型中的注意力模型中,确定各所述实体向量与所述预设分诊参考向量之间的匹配值;
解释结果确定单元204,用于根据各所述实体向量与所述预设分诊参考向量之间的匹配值,得到所述解释结果。
优选地,基于解释模型的分诊信息推荐装置还包括如下模块:
样本数据获取模块,用于获取样本数据集,所述样本数据集中包含至少一个样本信息;所述样本信息中包含至少一个样本决策词语;
向量表征模块,用于将各所述样本决策词语输入至预设词向量模型中,对各所述样本决策词语进行向量表示,得到与各所述样本决策词语对应的决策词向量;
样本权重获取模块,用于获取与各决策词向量对应的样本权重,并根据各所述决策词向量对应的样本权重以及预设加权方法,确定所述预设分诊参考向量。
优选地,如图7所示,文本分类模块40包括如下单元:
结构化信息获取单元401,用于获取所述特征信息文本中的结构化信息,通过所述预设分诊决策模型对所述结构化信息进行特征提取,得到与所述结构化信息对应的结构特征向量;
非结构化信息获取单元402,用于获取所述特征信息文本中的非结构化信息,确定所述特征信息文本中的非结构化信息的文本长度;
卷积核选取单元403,用于根据所述文本长度以及预设历史文本长度,确定所述预设分诊决策模型中的卷积核类别;
卷积池化单元404,用于通过所述卷积核类别中的卷积核对所述非结构化信息进行卷积池化操作,得到非结构特征向量;
向量拼接单元405,用于对所述结构特征向量与所述非结构特征向量进行拼接,得到融合向量,并将所述融合向量输入至全连接层后,得到所述分诊信息。
优选地,卷积核选取单元403包括如下子单元:
第一卷积核选取子单元,用于在所述文本长度小于或等于所述预设历史文本长度时,将所述卷积核类别确定为小尺寸卷积核;
第二卷积核选取子单元,用于在所述文本长度大于所述预设历史文本长度时,将所述卷积核类别确定为大尺寸卷积核。
优选地,基于解释模型的分诊信息推荐装置还包括:
信息提示模块,用于在确定所述特征信息文本中并不存在分诊解释词语时,提示所述待分诊对象更新所述特征信息文本。
关于基于解释模型的分诊信息推荐装置的具体限定可以参见上文中对于基于解释模型的分诊信息推荐方法的限定,在此不再赘述。上述基于解释模型的分诊信息推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述实施例中基于解释模型的分诊信息推荐方法所使用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于解释模型的分诊信息推荐方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中基于解释模型的分诊信息推荐方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中基于解释模型的分诊信息推荐方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于解释模型的分诊信息推荐方法,其特征在于,包括:
获取待分诊对象录入的特征信息文本;
将所述特征信息文本输入至预设解释模型,对所述特征信息文本进行解释处理,得到与所述特征信息文本对应的解释结果;所述解释结果中包含预设分诊参考向量与所述特征信息文本中各词语对应的匹配值;
比对所述特征信息文本的各词语对应的匹配值以及预设匹配阈值,确定所述特征信息文本中是否存在分诊解释词语;所述分诊解释词语是指所述特征信息文本中与大于或等于所述预设匹配阈值的匹配值对应的词语;
在所述特征信息文本中存在分诊解释词语时,将所述特征信息文本输入至预设分诊决策模型中,对所述特征信息文本进行分诊处理,得到与所述特征信息文本对应的分诊信息;
将所述分诊信息以及所述分诊解释词语关联推送至所述待分诊对象;
所述将所述特征信息文本输入至预设解释模型,对所述特征信息文本进行解释处理,得到与所述特征信息文本对应的解释结果,包括:
根据预设词语实体库,对所述特征信息文本进行分词处理,得到与所述特征信息文本对应的各字词实体;
将各字词实体输入至所述预设解释模型的循环神经网络模型中,得到与各所述字词实体对应的实体向量;
获取预设分诊参考向量,将各所述实体向量与所述预设分诊参考向量输入至所述预设解释模型中的注意力模型中,确定各所述实体向量与所述预设分诊参考向量之间的匹配值;
根据各所述实体向量与所述预设分诊参考向量之间的匹配值,得到与所述特征信息文本对应的所述解释结果;
所述将所述特征信息文本输入至预设分诊决策模型中,对所述特征信息文本进行分诊处理,得到与所述特征信息文本对应的分诊信息,包括:
获取所述特征信息文本中的结构化信息,通过所述预设分诊决策模型对所述结构化信息进行特征提取,得到与所述结构化信息对应的结构特征向量;
获取所述特征信息文本中的非结构化信息,确定所述特征信息文本中的非结构化信息的文本长度;
根据所述文本长度以及预设历史文本长度,确定所述预设分诊决策模型中的卷积核类别;
通过所述卷积核类别中的卷积核对所述非结构化信息进行卷积池化操作,得到非结构特征向量;
对所述结构特征向量与所述非结构特征向量进行拼接,得到融合向量,并将所述融合向量输入至全连接层后,得到所述分诊信息。
2.如权利要求1所述的基于解释模型的分诊信息推荐方法,其特征在于,所述获取预设分诊参考向量之前,还包括:
获取样本数据集,所述样本数据集中包含至少一个样本信息;所述样本信息中包含至少一个样本决策词语;
将各所述样本决策词语输入至预设词向量模型中,对各所述样本决策词语进行向量表示,得到与各所述样本决策词语对应的决策词向量;
获取与各决策词向量对应的样本权重,并根据各所述决策词向量对应的样本权重以及预设加权方法,确定所述预设分诊参考向量。
3.如权利要求1所述的基于解释模型的分诊信息推荐方法,其特征在于,所述根据所述文本长度以及预设历史文本长度,确定所述预设分诊决策模型中的卷积核类别,包括:
在所述文本长度小于或等于所述预设历史文本长度时,将所述卷积核类别确定为小尺寸卷积核;
在所述文本长度大于所述预设历史文本长度时,将所述卷积核类别确定为大尺寸卷积核。
4.如权利要求1所述的基于解释模型的分诊信息推荐方法,其特征在于:所述确定所述特征信息文本中是否存在分诊解释词语之后,还包括:
在确定所述特征信息文本中并不存在分诊解释词语时,提示所述待分诊对象更新所述特征信息文本。
5.一种基于解释模型的分诊信息推荐装置,其特征在于,包括:
文本获取模块,用于获取待分诊对象录入的特征信息文本;
解释处理模块,用于将所述特征信息文本输入至预设解释模型,对所述特征信息文本进行解释处理,得到与所述特征信息文本对应的解释结果;所述解释结果中包含预设分诊参考向量与所述特征信息文本中各词语对应的匹配值;
匹配比对模块,用于比对所述特征信息文本的各词语对应的匹配值以及预设匹配阈值,确定所述特征信息文本中是否存在分诊解释词语;所述分诊解释词语是指所述特征信息文本中与大于或等于所述预设匹配阈值的匹配值对应的词语;
文本分类模块,用于在所述特征信息文本中存在分诊解释词语时,将所述特征信息文本输入至预设分诊决策模型中,对所述特征信息文本进行分诊处理,得到与所述特征信息文本对应的分诊信息;
分诊信息推送模块,用于将所述分诊信息以及所述分诊解释词语关联推送至所述待分诊对象;
所述解释处理模块包括:
分词处理单元,用于根据预设词语实体库,对所述特征信息文本进行分词处理,得到与所述特征信息文本对应的各字词实体;
向量编码单元,用于将各字词实体输入至所述预设解释模型的循环神经网络模型中,得到与各所述字词实体对应的实体向量;
匹配值确定单元,用于获取预设分诊参考向量,将各所述实体向量与所述预设分诊参考向量输入至所述预设解释模型中的注意力模型中,确定各所述实体向量与所述预设分诊参考向量之间的匹配值;
解释结果确定单元,用于根据各所述实体向量与所述预设分诊参考向量之间的匹配值,得到所述解释结果;
文本分类模块包括如下单元:
结构化信息获取单元,用于获取所述特征信息文本中的结构化信息,通过所述预设分诊决策模型对所述结构化信息进行特征提取,得到与所述结构化信息对应的结构特征向量;
非结构化信息获取单元,用于获取所述特征信息文本中的非结构化信息,确定所述特征信息文本中的非结构化信息的文本长度;
卷积核选取单元,用于根据所述文本长度以及预设历史文本长度,确定所述预设分诊决策模型中的卷积核类别;
卷积池化单元,用于通过所述卷积核类别中的卷积核对所述非结构化信息进行卷积池化操作,得到非结构特征向量;
向量拼接单元,用于对所述结构特征向量与所述非结构特征向量进行拼接,得到融合向量,并将所述融合向量输入至全连接层后,得到所述分诊信息。
6.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述基于解释模型的分诊信息推荐方法。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述基于解释模型的分诊信息推荐方法。
CN202010935273.0A 2020-09-08 2020-09-08 基于解释模型的分诊信息推荐方法、装置、设备及介质 Active CN112016318B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010935273.0A CN112016318B (zh) 2020-09-08 2020-09-08 基于解释模型的分诊信息推荐方法、装置、设备及介质
PCT/CN2020/135722 WO2021151358A1 (zh) 2020-09-08 2020-12-11 基于解释模型的分诊信息推荐方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010935273.0A CN112016318B (zh) 2020-09-08 2020-09-08 基于解释模型的分诊信息推荐方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN112016318A CN112016318A (zh) 2020-12-01
CN112016318B true CN112016318B (zh) 2023-11-21

Family

ID=73516158

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010935273.0A Active CN112016318B (zh) 2020-09-08 2020-09-08 基于解释模型的分诊信息推荐方法、装置、设备及介质

Country Status (2)

Country Link
CN (1) CN112016318B (zh)
WO (1) WO2021151358A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112016318B (zh) * 2020-09-08 2023-11-21 平安科技(深圳)有限公司 基于解释模型的分诊信息推荐方法、装置、设备及介质
CN112700862B (zh) * 2020-12-25 2024-04-16 上海钛米机器人股份有限公司 目标科室的确定方法、装置、电子设备及存储介质
CN112652386A (zh) * 2020-12-25 2021-04-13 平安科技(深圳)有限公司 分诊数据处理方法、装置、计算机设备及存储介质
CN112820367B (zh) * 2021-01-11 2023-06-30 平安科技(深圳)有限公司 病历信息校验方法、装置、计算机设备及存储介质
CN113223698B (zh) * 2021-03-02 2024-03-12 联仁健康医疗大数据科技股份有限公司 急诊分级处理方法、装置、电子设备以及存储介质
CN113707326B (zh) * 2021-10-27 2022-03-22 深圳迈瑞软件技术有限公司 临床预警方法及预警系统、存储介质
CN116564538B (zh) * 2023-07-05 2023-12-19 肇庆市高要区人民医院 一种基于大数据的医院就医信息实时查询方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330889A (zh) * 2017-07-11 2017-11-07 北京工业大学 一种基于卷积神经网络的中医舌色苔色自动分析方法
CN109659013A (zh) * 2018-11-28 2019-04-19 平安科技(深圳)有限公司 病症分诊及路径优化方法、装置、设备及存储介质
CN110517767A (zh) * 2019-08-27 2019-11-29 北京百度网讯科技有限公司 辅助诊断方法、装置、电子设备及存储介质
EP3637431A1 (en) * 2018-10-12 2020-04-15 Fujitsu Limited Medical diagnostic aid and method
WO2020151536A1 (zh) * 2019-01-25 2020-07-30 腾讯科技(深圳)有限公司 一种脑部图像分割方法、装置、网络设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10825167B2 (en) * 2017-04-28 2020-11-03 Siemens Healthcare Gmbh Rapid assessment and outcome analysis for medical patients
CN108877921B (zh) * 2017-05-12 2021-10-19 京东方科技集团股份有限公司 医疗智能分诊方法和医疗智能分诊系统
CN109887587A (zh) * 2019-01-22 2019-06-14 平安科技(深圳)有限公司 智能分诊方法、系统、装置及存储介质
CN110085308B (zh) * 2019-04-23 2022-02-25 挂号网(杭州)科技有限公司 一种基于融合深度学习的诊疗科室分类方法
CN110838359B (zh) * 2019-10-16 2023-07-07 平安科技(深圳)有限公司 基于对话机器人的分诊方法、装置、存储介质及机器人
CN112016318B (zh) * 2020-09-08 2023-11-21 平安科技(深圳)有限公司 基于解释模型的分诊信息推荐方法、装置、设备及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330889A (zh) * 2017-07-11 2017-11-07 北京工业大学 一种基于卷积神经网络的中医舌色苔色自动分析方法
EP3637431A1 (en) * 2018-10-12 2020-04-15 Fujitsu Limited Medical diagnostic aid and method
CN109659013A (zh) * 2018-11-28 2019-04-19 平安科技(深圳)有限公司 病症分诊及路径优化方法、装置、设备及存储介质
WO2020151536A1 (zh) * 2019-01-25 2020-07-30 腾讯科技(深圳)有限公司 一种脑部图像分割方法、装置、网络设备和存储介质
CN110517767A (zh) * 2019-08-27 2019-11-29 北京百度网讯科技有限公司 辅助诊断方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
WO2021151358A1 (zh) 2021-08-05
CN112016318A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
CN112016318B (zh) 基于解释模型的分诊信息推荐方法、装置、设备及介质
CN110021439B (zh) 基于机器学习的医疗数据分类方法、装置和计算机设备
CN108986908B (zh) 问诊数据处理方法、装置、计算机设备和存储介质
CN111767707B (zh) 雷同病例检测方法、装置、设备及存储介质
CN112037912A (zh) 基于医疗知识图谱的分诊模型训练方法、装置及设备
CN109887562B (zh) 电子病历的相似度确定方法、装置、设备和存储介质
CN113593611B (zh) 语音分类网络训练方法、装置、计算设备及存储介质
CN112017789B (zh) 分诊数据处理方法、装置、设备及介质
CN113705685B (zh) 疾病特征识别模型训练、疾病特征识别方法、装置及设备
CN112035611B (zh) 目标用户推荐方法、装置、计算机设备和存储介质
CN114026556A (zh) 义素预测方法、计算机设备和存储介质背景
CN112132624A (zh) 医疗理赔数据预测系统
CN112017745B (zh) 决策信息推荐、药物信息推荐方法、装置、设备及介质
US20210200745A1 (en) Data validation using encode values
CN112580346A (zh) 事件抽取方法、装置、计算机设备和存储介质
CN110808095B (zh) 诊断结果识别、模型训练的方法、计算机设备及存储介质
CN114628001A (zh) 基于神经网络的处方推荐方法、系统、设备及存储介质
CN115603955B (zh) 异常访问对象识别方法、装置、设备和介质
CN113298160B (zh) 三元组的校验方法、装置、设备和介质
Theodorou et al. Synthesize extremely high-dimensional longitudinal electronic health records via hierarchical autoregressive language model
CN115409111A (zh) 命名实体识别模型的训练方法和命名实体识别方法
WO2021115269A1 (zh) 用户集群的预测方法、装置、计算机设备和存储介质
US20220027680A1 (en) Methods and systems for facilitating classification of labelled data
CN113782187A (zh) 指标数据处理方法、相关设备及介质
CN112182253A (zh) 一种数据处理方法、设备以及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40040595

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant