CN112259254B - 基于交互反馈的病例搜索方法、装置及可读存储介质 - Google Patents
基于交互反馈的病例搜索方法、装置及可读存储介质 Download PDFInfo
- Publication number
- CN112259254B CN112259254B CN202011118337.4A CN202011118337A CN112259254B CN 112259254 B CN112259254 B CN 112259254B CN 202011118337 A CN202011118337 A CN 202011118337A CN 112259254 B CN112259254 B CN 112259254B
- Authority
- CN
- China
- Prior art keywords
- case
- cases
- similar
- initial
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 32
- 239000013598 vector Substances 0.000 claims description 37
- 238000003745 diagnosis Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 238000007477 logistic regression Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 8
- 201000010099 disease Diseases 0.000 description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 6
- 230000003313 weakening effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000005728 strengthening Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 230000007170 pathology Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011369 optimal treatment Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种人工智能,提供一种基于交互反馈的病例搜索方法、装置及计算机可读存储介质,其中方法包括:根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例。本发明快速有效的从海量的病例中搜索出与病情最匹配的病例。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于交互反馈的病例搜索方法、装置、电子设备及计算机可读存储介质。
背景技术
目前,随着计算机技术的发展,检索已经成为日常生活中获取信息普遍使用的手段。在医疗领域,相似病例检索在科研、临床上具有重大意义。例如:有些疾病由于种种原因比较特殊,或是病征复杂,或是临床表现与其他疾病相似,又或是伴随发生的多个并发症反客为主掩盖住了疾病根源。这些病的诊断治疗往往比较复杂繁琐,导致病人不能及时诊断并得到相应的治疗最终导致错过了最佳治疗窗口期。在患者就诊时,如果医生通过快速查找与该患者相似的病例,并能及时通过相似病例的诊疗路径及效果做出有效的判断。
目前在对这些疾病进行诊治的过程中,将治愈先例作为参考依据是一种高效的方式,医生搜索与病人最贴合的病例进行辅助诊治。但目前的相似病例检索仍存在一些缺陷:
1)对于比较复杂的病情:如何准确搜索这类病例,主要是依靠医生的经验,但是,经验毕竟是有限的,不同医生搜索效率和结果都会不同;
2)病例数量大,搜索速度慢:从海量的病例中不能有效地搜索出最匹配的病例;
3)现有的病例这类搜索,并且都是单向反应,没有用户对搜索结果的反馈的搜索方式。
基于上次传统的病例检索方法存在的问题,本发明亟需提供基于交互反馈的病例搜索方法。
发明内容
本发明提供一种基于交互反馈的病例搜索方法、装置、电子设备及计算机可读存储介质,其主要目的在于快速有效的从海量的病例中搜索出与病情最匹配的病例。
为实现上述目的,本发明提供的基于交互反馈的病例搜索方法,所述方法包括:
根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;
将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;
根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;
根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例。
可选地,所述根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例,包括以下步骤:
根据所述初始病例中包括的患者的临床表现、诊断结果,设定所述预设的匹配规则;
通过所述预设的匹配规则,将所述病例数据库的病例与所述初始病例进行逐一匹配,从而确定与所述初始病例相匹配的一级相似病例。
可选地,所述将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户,利用k均值算法对所述病例数据库中的病例进行聚类划分,包括如下步骤:
第一步:对所述病例数据库中的病例序列化后进行编码得到{xi};
第二步:初始化类别中心向量{μ1,μ2,…,μk},其中,k根据所述病例的数量在最大迭代数进行选取;
第三步:将每个病例的编码根据所述中心向量计算L2范数进行划分类别;
第四步:根据划分结果,计算类别中心向量{μ′1,μ′2,…,μ′k};
第五步:迭代第三步和第四步骤,直至两次类别中心向量的对应中心值之差小于阈值或超过最大迭代数;
第六步:计算所述初始病例与各类别病例的中心向量计算L2范数距离,将距离最小的类别中所有病例按近似程度高低反馈给用户。
可选地,所述将每个病例的编码按所述中心向量计算L2范数进行划,采用的公式为:
dij=||xj-μi||2
其中,dij表示搜索病例与各类别病例的中心L2范数距离;
xj表示搜索病例,μi表示第i个分类中心向量。
可选地,根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习,包括如下步骤:
用户对所述相似病例的反馈信息分包括:近似程度高的相似病例和近似程度低的相似病例,其中,
通过学习模型对与所述初始病例的近似程度高的相似病例进行监督学习,其中,采用Logistic回归公式计算概率:
其中,x为参与方数据的特征,y为数据的标签。
可选地,所述用户对所述相似病例的反馈信息分包括:近似程度高的相似病例和近似程度低的相似病例:
分别提取与所述初始病例的近似程度高的相似病例的词频以及近似程度低的相似病例的词频;
根据提取的词频,修改所述预设的匹配规则;
根据修改后的预设的匹配规则以及所述学习模型的监督学习结果,进一步搜索所述病例数据库中与所述初始病例相近似的二级病例,并向用户反馈。
为了解决上述问题,本发明还提供一种基于交互反馈的病例搜索装置,所述装置包括:
病例搜索模块,用于根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;
病例排序模块,用于将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;
病例学习模块,用于根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;
病例再次反馈模块,用于根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例。
可选地,,所述将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户,利用k均值算法对所述病例数据库中的病例进行聚类划分,包括如下步骤:
第一步:对所述病例数据库中的病例序列化后进行编码得到{xi};
第二步:初始化类别中心向量{μ1,μ2,…,μk},其中,k根据所述病例的数量在最大迭代数进行选取;
第三步:将每个病例的编码根据所述中心向量计算L2范数进行划分类别;
第四步:根据划分结果,计算类别中心向量{μ′1,μ′2,…,μ′k};
第五步:迭代第三步和第四步骤,直至两次类别中心向量的对应中心值之差小于阈值或超过最大迭代数;
第六步:计算所述初始病例与各类别病例的中心向量计算L2范数距离,将距离最小的类别中所有病例按近似程度高低反馈给用户。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的基于交互反馈的病例搜索方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于交互反馈的病例搜索方法。
本发明实施例根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例。在本发明的实施例中,通过对搜索结果的反馈而不断更新搜索结果,其中,通过聚类划分病例的类别、通过学习模型对搜索结果进行有监督学习,而快速有效的从海量的病例中搜索出与病情最匹配的病例;本发明的搜索方法通过用户直接或间接的反馈进行不同的响应,不断更新搜索内容,实现引擎与用户的交互,提升用户的搜索效率。
附图说明
图1为本发明一实施例提供的基于交互反馈的病例搜索方法的流程示意图;
图2为本发明一实施例提供的基于交互反馈的病例搜索装置的模块示意图;
图3为本发明一实施例提供的实现基于交互反馈的病例搜索方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种基于交互反馈的病例搜索方法。参照图1所示,为本发明一实施例提供的基于交互反馈的病例搜索识别方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,基于交互反馈的病例搜索方法包括:
S1:根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;
S2:将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;
S3:根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;
S4:根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例。
上述为本发明人工智能的基于交互反馈的病例搜索方法,可以方便医生或临床研究人员(下称用户)获取到需要了解、参考的病例。该搜索方法通过从用户对搜索结果的反馈而不断更新搜索结果,从海量的病例中搜索出与病情最匹配的病例。
在病例数据库中,将病例以文本形式储存,病例包含但不限于患者信息、临床表现等病理数据以及最终诊断结果。
在步骤S1中,根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例,包括以下步骤:
根据所述初始病例中包括的患者的临床表现、诊断结果,设定所述预设的匹配规则;
通过所述预设的匹配规则,将所述病例数据库的病例与所述初始病例进行逐一匹配,从而确定与所述初始病例相匹配的一级相似病例。
当用户发起搜索,即输入初始病例后,系统解析初始病例生成搜索命令,在病例数据库的海量病例中进行搜索。
在步骤S2中,将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户。按照与所述初始病例的近似程度向用户反馈搜索到的相似病例。搜索引擎执行搜索命令按近似程度由高至低返回一批病例文本。
在计算近似程度时,可以由编码后计算与其它病例文本的L2范数来定义。
为了提高搜索效率,在用户执行搜索前,系统预先对病例数据库中的病例文本利用k均值算法对病例文件进行聚类划分,操作如下:
S21:对数据库中病例文本序列化后进行编码得到{xi};
S22:初始化类别中心向量{μ1,μ2,…,μk},k根据病例文本数量在条件允许的情况下(如系统内存、最大迭代数)选取,如数据库中含有1百万条病例文本,则k取1千;
S23:将每个文本编码按中心向量计算L2范数进行划分,即dij=||xj-μi||2;
S24:计算新的类别中心向量{μ′1,μ′2,…,μ′k};
S25:迭代S23和S24步骤,直至两次中心向量的对应中心值之差小于阈值或超过最大迭代数;
S26:计算所述初始病例与各类别病例的中心向量计算L2范数距离,将距离最小的类别中所有病例按近似程度高低反馈给用户。
当用户输入搜索文本后,只要分别计算与各类别文本的中心L2范数距离,例如搜索文本x与第i个分类中心μi的距离是:
di=‖x-μi‖2
其中,dij表示搜索病例与各类别病例的中心L2范数距离;
xj表示搜索病例,μi表示第i个分类中心向量;
找到距离最小的类别,再将此类别中所有病例按近似程度高低返回病例文本。
在步骤S3中,根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习,包括如下步骤:
用户对所述相似病例的反馈信息分包括:近似程度高的相似病例和近似程度低的相似病例,其中,
通过学习模型对与所述初始病例的近似程度高的相似病例进行监督学习,其中,采用Logistic回归公式计算概率:
其中,x为参与方数据的特征,y为数据的标签。
根据搜索结果可计算出该函数的损失值,在损失值区域最低的基础上达到模型的收敛。即:根据所述学习模型的监督学习结果,向用户反馈与所述初始病例更相似的病例,直至向用户反馈与所述初始病例最匹配的病例。
在步骤S4中,所述用户对所述相似病例的反馈信息分包括:近似程度高的相似病例和近似程度低的相似病例,
分别提取与所述初始病例的近似程度高的相似病例的词频以及近似程度低的相似病例的词频;
根据提取的词频,修改所述预设的匹配规则;
根据修改后的预设的匹配规则以及所述学习模型的监督学习结果,进一步搜索所述病例数据库中与所述初始病例相近似的二级病例,并向用户反馈
在本发明的实施例中,对近似程度高的相似病例和近似程度低的相似病例分别进行强化操作和弱化操作,用户查阅系统反馈的相似病例,并将查阅后的某病例文本后的返回搜索引擎。搜索引擎获得反馈,若用户认为刚才查阅的病例文本描述较接近,则进行强化操作。反之,若用户认为刚才查阅的病例文本没有用处,则进行弱化操作。
强化和弱化操作,即系统每次会记录用户认可的和不认可的病例文本,并分别以标签1和0更新两个集合。
其中,强化和弱化操作,还包括:
1、文本有效词提取:
强化操作提取标签1集合中的文档中所有词语及其出现次数,除以该词语在数据库中所有病例文本中出现的次数后得到词频。将词频前三的词语加入到搜索命令中的“文本包含”项。
同理,弱化操作是提取标签0集合中文档的词频,并将前三加入后台搜索命令中的“文本不包含”项。
2、修正搜索:
搜索命令更新后,也会重新计算与各类别文本的中心L_2范数距离,若发现存在距离小于目前搜索所在类别的,则会转换至新类别或合并类别进行搜索,这种修正一定程度上避免搜索结果收敛到非用户所需类。
对上述用户的反馈,搜索引擎也可以通过以下方式获得:
①直接询问是否所需病理;
②根据若干次的询问,学习用户使用习惯判断是否所需病理。
本发明实施例根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例。在本发明的实施例中,通过对搜索结果的反馈而不断更新搜索结果,其中,通过聚类划分病例的类别、通过学习模型对搜索结果进行有监督学习,而快速有效的从海量的病例中搜索出与病情最匹配的病例;本发明的搜索方法通过用户直接或间接的反馈进行不同的响应,不断更新搜索内容,实现引擎与用户的交互,提升用户的搜索效率。
如图2所示,是本发明基于交互反馈的病例搜索装置的功能模块图。
本发明所述基于交互反馈的病例搜索装置100可以安装于电子设备中。根据实现的功能,所述基于交互反馈的病例搜索装置可以包括:病例搜索模块101、病例排序模块102、病例学习模块103、病例再次反馈模块104。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
病例搜索模块101,用于根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;
病例排序模块102,用于将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;
病例学习模块103,用于根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;
病例再次反馈模块104,用于根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例
其中,所述根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例,包括以下步骤:
根据所述初始病例中包括的患者的临床表现、诊断结果,设定所述预设的匹配规则;
通过所述预设的匹配规则,将所述病例数据库的病例与所述初始病例进行逐一匹配,从而确定与所述初始病例相匹配的一级相似病例。
可选地,所述将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户,利用k均值算法对所述病例数据库中的病例进行聚类划分,包括如下步骤:
第一步:对所述病例数据库中的病例序列化后进行编码得到{xi};
第二步:初始化类别中心向量{μ1,μ2,…,μk},其中,k根据所述病例的数量在最大迭代数进行选取;
第三步:将每个病例的编码根据所述中心向量计算L2范数进行划分类别;
第四步:根据划分结果,计算类别中心向量{μ′1,μ′2,…,μ′k};
第五步:迭代第三步和第四步骤,直至两次类别中心向量的对应中心值之差小于阈值或超过最大迭代数;
第六步:计算所述初始病例与各类别病例的中心向量计算L2范数距离,将距离最小的类别中所有病例按近似程度高低反馈给用户。
其中,所述将每个病例的编码按所述中心向量计算L2范数进行划,采用的公式为:
dij=||xj-μi||2
其中,dij表示搜索病例与各类别病例的中心L2范数距离;
xj表示搜索病例,μi表示第i个分类中心向量。
其中,根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习,包括如下步骤:
用户对所述相似病例的反馈信息分包括:近似程度高的相似病例和近似程度低的相似病例,其中,
通过学习模型对与所述初始病例的近似程度高的相似病例进行监督学习,其中,采用Logistic回归公式计算概率:
其中,x为参与方数据的特征,y为数据的标签。
其中,所述用户对所述相似病例的反馈信息分包括:近似程度高的相似病例和近似程度低的相似病例:
分别提取与所述初始病例的近似程度高的相似病例的词频以及近似程度低的相似病例的词频;
根据提取的词频,修改所述预设的匹配规则;
根据修改后的预设的匹配规则以及所述学习模型的监督学习结果,进一步搜索所述病例数据库中与所述初始病例相近似的二级病例,并向用户反馈本发明实施例根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例。在本发明的实施例中,通过对搜索结果的反馈而不断更新搜索结果,其中,通过聚类划分病例的类别、通过学习模型对搜索结果进行有监督学习,而快速有效的从海量的病例中搜索出与病情最匹配的病例;本发明的搜索方法通过用户直接或间接的反馈进行不同的响应,不断更新搜索内容,实现引擎与用户的交互,提升用户的搜索效率。
如图3所示,是本发明实现基于交互反馈的病例搜索方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于交互反馈的病例搜索程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如数据稽核程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如数据稽核程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图2示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于交互反馈的病例搜索程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;
将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;
根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;
根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例。
具体地,所述处理器10对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
在本发明的实施例中,计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现基于交互反馈的病例搜索方法,具体方法如下:
根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;
将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;
根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;
根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (8)
1.一种基于交互反馈的病例搜索方法,其特征在于,所述方法包括:
根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;
将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;
根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;
根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例;
所述将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户,利用k均值算法对所述病例数据库中的病例进行聚类划分,包括如下步骤:
第一步:对所述病例数据库中的病例序列化后进行编码得到{xi};
第二步:初始化类别中心向量{μ1,μ2,…,μk},其中,k根据所述病例的数量在最大迭代数进行选取;
第三步:将每个病例的编码根据所述中心向量计算L2范数进行划分类别;
第四步:根据划分结果,计算类别中心向量{μ′1,μ′2,…,μ′k};
第五步:迭代第三步和第四步骤,直至两次类别中心向量的对应中心值之差小于阈值或超过最大迭代数;
第六步:计算所述初始病例与各类别病例的中心向量计算L2范数距离,将距离最小的类别中所有病例按近似程度高低反馈给用户。
2.如权利要求1所述的基于交互反馈的病例搜索方法,其特征在于,所述根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例,包括以下步骤:
根据所述初始病例中包括的患者的临床表现、诊断结果,设定所述预设的匹配规则;
通过所述预设的匹配规则,将所述病例数据库的病例与所述初始病例进行逐一匹配,从而确定与所述初始病例相匹配的一级相似病例。
3.如权利要求1所述的基于交互反馈的病例搜索方法,其特征在于,所述将每个病例的编码根据所述中心向量计算L2范数进行划分类别,采用的公式为:
dij=‖xj-μi‖2
其中,dij表示搜索病例与各类别病例的中心L2范数距离;
xj表示搜索病例,μi表示第i个分类中心向量。
4.如权利要求1所述的基于交互反馈的病例搜索方法,其特征在于,所述根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习,包括如下步骤:
用户对所述相似病例的反馈信息包括:近似程度高的相似病例和近似程度低的相似病例,其中,
通过学习模型对与所述初始病例的近似程度高的相似病例进行监督学习,其中,采用Logistic回归公式计算概率:
其中,x为参与方数据的特征,y为数据的标签。
5.如权利要求4所述的基于交互反馈的病例搜索方法,其特征在于,所述用户对所述相似病例的反馈信息包括:近似程度高的相似病例和近似程度低的相似病例:
分别提取与所述初始病例的近似程度高的相似病例的词频以及近似程度低的相似病例的词频;
根据提取的词频,修改所述预设的匹配规则;
根据修改后的预设的匹配规则以及所述学习模型的监督学习结果,进一步搜索所述病例数据库中与所述初始病例相近似的二级病例,并向用户反馈。
6.一种基于交互反馈的病例搜索装置,其特征在于,所述装置包括:
病例搜索模块,用于根据预设的匹配规则,从已有的病例数据库中搜索与初始病例相近似的一级相似病例;
病例排序模块,用于将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户;
病例学习模块,用于根据用户对所述相似病例的反馈信息,通过学习模型对所述相似病例进行监督学习;
病例再次反馈模块,用于根据所述学习模型的监督学习结果,确定并向用户反馈与所述初始病例的相近程度更高的二级相似病例,直至确定与所述初始病例的相近程度达到预设要求的最终相似病例;
所述将所述相似病例按照其与所述初始病例的近似程度进行排序,并按照排序将预设数量的相似病例反馈给用户,利用k均值算法对所述病例数据库中的病例进行聚类划分,包括如下步骤:
第一步:对所述病例数据库中的病例序列化后进行编码得到{xi};
第二步:初始化类别中心向量{μ1,μ2,…,μk},其中,k根据所述病例的数量在最大迭代数进行选取;
第三步:将每个病例的编码根据所述中心向量计算L2范数进行划分类别;
第四步:根据划分结果,计算类别中心向量{μ′1,μ′2,…,μ′k};
第五步:迭代第三步和第四步骤,直至两次类别中心向量的对应中心值之差小于阈值或超过最大迭代数;
第六步:计算所述初始病例与各类别病例的中心向量计算L2范数距离,将距离最小的类别中所有病例按近似程度高低反馈给用户。
7.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至5中任一所述的基于交互反馈的病例搜索方法。
8.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5中任一所述的基于交互反馈的病例搜索方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011118337.4A CN112259254B (zh) | 2020-10-19 | 2020-10-19 | 基于交互反馈的病例搜索方法、装置及可读存储介质 |
PCT/CN2020/136406 WO2021189983A1 (zh) | 2020-10-19 | 2020-12-15 | 基于交互反馈的病例搜索方法、装置及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011118337.4A CN112259254B (zh) | 2020-10-19 | 2020-10-19 | 基于交互反馈的病例搜索方法、装置及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112259254A CN112259254A (zh) | 2021-01-22 |
CN112259254B true CN112259254B (zh) | 2024-05-07 |
Family
ID=74244937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011118337.4A Active CN112259254B (zh) | 2020-10-19 | 2020-10-19 | 基于交互反馈的病例搜索方法、装置及可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112259254B (zh) |
WO (1) | WO2021189983A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116662489A (zh) * | 2023-07-27 | 2023-08-29 | 中航创世机器人(西安)有限公司 | 一种智能表单匹配优化方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007279942A (ja) * | 2006-04-05 | 2007-10-25 | Fujifilm Corp | 類似症例検索装置、類似症例検索方法およびそのプログラム |
CN101903883A (zh) * | 2007-12-20 | 2010-12-01 | 皇家飞利浦电子股份有限公司 | 用于基于病例的决策支持的方法和装置 |
CN101911077A (zh) * | 2007-12-27 | 2010-12-08 | 皇家飞利浦电子股份有限公司 | 用于细化相似病例搜索的方法和装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3430545A1 (en) * | 2016-03-16 | 2019-01-23 | Koninklijke Philips N.V. | Relevance feedback to improve the performance of clustering model that clusters patients with similar profiles together |
CN110111887A (zh) * | 2019-05-15 | 2019-08-09 | 清华大学 | 临床辅助决策方法及装置 |
CN110517785B (zh) * | 2019-08-28 | 2022-05-10 | 北京百度网讯科技有限公司 | 相似病例的查找方法、装置及设备 |
-
2020
- 2020-10-19 CN CN202011118337.4A patent/CN112259254B/zh active Active
- 2020-12-15 WO PCT/CN2020/136406 patent/WO2021189983A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007279942A (ja) * | 2006-04-05 | 2007-10-25 | Fujifilm Corp | 類似症例検索装置、類似症例検索方法およびそのプログラム |
CN101903883A (zh) * | 2007-12-20 | 2010-12-01 | 皇家飞利浦电子股份有限公司 | 用于基于病例的决策支持的方法和装置 |
CN101911077A (zh) * | 2007-12-27 | 2010-12-08 | 皇家飞利浦电子股份有限公司 | 用于细化相似病例搜索的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2021189983A1 (zh) | 2021-09-30 |
CN112259254A (zh) | 2021-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021147568A1 (zh) | 基于gbdt高阶特征组合的推荐方法、装置及存储介质 | |
US8103671B2 (en) | Text categorization with knowledge transfer from heterogeneous datasets | |
CN111639516B (zh) | 基于机器学习的分析平台 | |
CN112214995A (zh) | 用于同义词预测的分层多任务术语嵌入学习 | |
CN112115322B (zh) | 用户分群方法、装置、电子设备及存储介质 | |
CN113378970B (zh) | 语句相似性检测方法、装置、电子设备及存储介质 | |
WO2022222943A1 (zh) | 科室推荐方法、装置、电子设备及存储介质 | |
CN112559687B (zh) | 问题识别及查询方法、装置、电子设备及存储介质 | |
CN112380343A (zh) | 问题解析方法、装置、电子设备及存储介质 | |
CN111652278B (zh) | 用户行为检测方法、装置、电子设备及介质 | |
WO2022160454A1 (zh) | 医疗文献的检索方法、装置、电子设备及存储介质 | |
CN113157739B (zh) | 跨模态检索方法、装置、电子设备及存储介质 | |
Yepes et al. | Comparison and combination of several MeSH indexing approaches | |
CN114943017B (zh) | 一种基于相似性零样本哈希的跨模态检索方法 | |
Pham et al. | Dynamic programming for instance annotation in multi-instance multi-label learning | |
CN112948553A (zh) | 法律智能问答方法、装置、电子设备及存储介质 | |
CN112183104A (zh) | 编码推荐方法、系统及相应设备和存储介质 | |
CN116821373A (zh) | 基于图谱的prompt推荐方法、装置、设备及介质 | |
CN115995281A (zh) | 一种基于数据治理的专病数据库的数据检索方法及装置 | |
CN112259254B (zh) | 基于交互反馈的病例搜索方法、装置及可读存储介质 | |
CN113076432B (zh) | 文献知识脉络生成方法、装置及存储介质 | |
Yogarajan et al. | Seeing the whole patient: using multi-label medical text classification techniques to enhance predictions of medical codes | |
CN113065355B (zh) | 专业百科命名实体识别方法、系统及电子设备 | |
Bijari et al. | Assisted neuroscience knowledge extraction via machine learning applied to neural reconstruction metadata on NeuroMorpho. Org | |
He et al. | Multilabel classification by exploiting data‐driven pair‐wise label dependence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |