CN108986907A - 一种基于knn算法的远程医疗自动分诊方法 - Google Patents

一种基于knn算法的远程医疗自动分诊方法 Download PDF

Info

Publication number
CN108986907A
CN108986907A CN201810818355.XA CN201810818355A CN108986907A CN 108986907 A CN108986907 A CN 108986907A CN 201810818355 A CN201810818355 A CN 201810818355A CN 108986907 A CN108986907 A CN 108986907A
Authority
CN
China
Prior art keywords
main suit
text
department
vector
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810818355.XA
Other languages
English (en)
Inventor
翟运开
赵杰
石金铭
陈昊天
孙东旭
卢耀恩
陈保站
王振博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
First Affiliated Hospital of Zhengzhou University
Original Assignee
First Affiliated Hospital of Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by First Affiliated Hospital of Zhengzhou University filed Critical First Affiliated Hospital of Zhengzhou University
Priority to CN201810818355.XA priority Critical patent/CN108986907A/zh
Publication of CN108986907A publication Critical patent/CN108986907A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/60ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
    • G16H40/67ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for remote operation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于KNN算法的远程医疗自动分诊方法,属于大数据技术领域,包括建立文本预处理模块、相似度计算模块和科室匹配模块,采用Jaccard相似系数作为KNN算法中相似性度量算法,并采用KNN算法进行分诊,解决了远程医疗系统中多病症快速准确分诊的技术问题,本发明利用数据挖掘技术中的K最近邻(kNN,k‑Nearest Neighbor)算法,根据提交的患者主诉,计算患者主诉与数据库中其他主诉的语义相似度,实现自动分诊,针对远程医疗服务中的分诊需求,获取患者主诉与就诊科室数据,通过计算不同患者主诉之间的相似度,基于KNN分类算法实现了智能分诊,在用户提交远程医疗病历资料后,引导用户进行正确就诊,提高了分诊的速度和准确度,降低了维护难度。

Description

一种基于KNN算法的远程医疗自动分诊方法
技术领域
本发明属于大数据技术领域,特别涉及一种基于KNN算法的远程医疗自动分诊方法。
背景技术
随着互联网医疗的快速发展,远程医疗作为其中的重要应用,得到了快速发展,在远程医疗的诸多应用中,诸如远程会诊、远程门诊等应用,需要人工选择相应科室,对于远程医疗服务的申请方而言,由于不同医院间的科室设置不同,在提交远程电子病历后,通常需要根据经验手动选择相关科室,经常出现错选的状况。
自动分诊旨在根据患者情况为患者指引正确科室,国外发达国家对于该应用需求不大,因此相关研究较少,主要相关工作是针对自动导医进行研究,导医是指根据患者症状判断其病症并引导至相关科室。
目前,自动导医系统分为两种:
一种是基于专家系统的自动导医系统,专家系统(ExpertSystem,ES)是一种模拟一个领域内专家的思维进行推理判断以解决某些问题的计算机系统。INTERNIST1是由匹兹堡大学Miller等人在1982年开发的计算机辅助诊断工具,根据领域专业人员预先输入的规则与数据库,INTERNIST1可以根据患者症状判断患者疾病,从而达到对患者的诊断过程。斯坦福大学的Shortliffe等人开发了MYCIN系统,用于鉴别细菌感染及治疗。专家系统能够有效的解决大多数领域内人们所不能有效解决的问题,但将其应用在自动导诊领域内也有明显的缺点:由于推理规则的复杂性,推理时会有组合爆炸的问题;专家知识库如果过于庞大,会明显的降低时效性;专家知识库需要有专业人员定期进行维护,维护成本较高。
另外一种是基于相似度计算的导医系统,通过计算患者症状与疾病症状的相似度来计算可能患有某种疾病的概率。现有技术中提出了改进的TF-IDF算法,根据症状的用户关注度来计算症状的权重,使其更适用于医疗诊断,但是基于相似度计算的方法计算速度虽快,但是未考虑多病症同时出现的情况。
发明内容
本发明的目的是提供一种基于KNN算法的远程医疗自动分诊方法,解决了多病症快速准确分诊的技术问题。
为实现上述目的,本发明采用以下技术方案:
一种基于KNN算法的远程医疗自动分诊方法,包括如下步骤:
步骤1:建立分布式云服务器平台,建立若干远程医疗客户端,所有远程医疗客户端均通过互联网与分布式云服务器平台通信,在分布式云服务器平台中建立文本预处理模块、相似度计算模块和科室匹配模块;
步骤2:远程医疗客户端用于收集病人的主诉信息和电子病历,并将主诉信息和电子病历上传到云服务器平台;
步骤3:云服务器平台的文本预处理模块对病人的主诉信息和电子病历进行文本预处理,其步骤如下:
步骤A1:文本预处理模块设立主诉数据库和电子病历数据库,主诉数据库用于存储病人的主诉信息,电子病历数据库用于存储病人的电子病历;
步骤A2:文本预处理模块建立停用词表,在停用词表中预存停用词;
步骤A3;文本预处理模块将主诉信息和电子病历中的文本转化成为主诉文本向量:文本预处理模块根据停用词表将主诉信息和电子病历中的停用词删除,并利用正则表达式删除时间词,合并主诉信息和电子病历中的剩余文本,以字为单位构件文本向量,即,生成主诉文本向量;
步骤4:文本预处理模块将主诉文本向量上传给相似度计算模块,相似度计算模块对主诉文本向量进行相似度分析,其步骤如下:
步骤B1:在相似度计算模块中建立主诉数据集,主诉数据集中包含数个表达病症的字向量,以病症对应的科室为归类规则,对字向量进行归类,生成数个字向量集;
步骤B2:相似度计算模块获取文本预处理模块生成的主诉文本向量后,以字为最小单位,将主诉文本向量与主诉数据集中的字向量进行相似度对比;找出所有与主诉文本向量相似的字向量;
步骤5:根据KNN算法计算出候选科室列表,其步骤如下:
步骤C1:根据KNN算法,找出与主诉文本向量具有最多的相似度字向量的字向量集;
步骤C2:根据步骤C1得到的字向量集查找对应的科室,将该科室作为伪候选科室;
步骤C3:根据步骤C1和步骤C2的方法,选择出数个伪候选科室,并将所有伪候选科室按相似度字向量的数量进行顺序排序;
步骤C4:选择相似度字向量的数量最高的3个伪候选科室作为候选科室,并将这3个候选科室作为分诊结果输出;
步骤6:结束分诊。
在执行步骤B1时,每一个科室均提供一个科室背景资料,科室背景资料通过统计每个科室对应的病症主诉,由对应病症主诉集合关键词构建科室背景资料,在对主诉数据集中的表达病症的字向量进行归类时,采用相似度对比的方式,对所述表达病症的字向量与科室背景资料中的病症主诉集合关键词继续对比,将对比结果作为主诉数据集中的表达病症的字向量进行归类的依据。
在执行步骤A3是,所述时间词为主诉信息中表达时间的词汇。
所述远程医疗客户端为电脑、远程医疗终端或挂号终端。
本发明所述的一种基于KNN算法的远程医疗自动分诊方法,解决了多病症快速准确分诊的技术问题,本发明利用数据挖掘技术中的K最近邻(kNN,k-Nearest Neighbor)算法,根据患者主诉,计算患者主诉与数据库中其他主诉的语义相似度,实现自动分诊,针对智能导诊这一需求,从电子病历中抽取患者主诉与就诊科室数据,通过计算不同患者主诉之间的相似度,基于KNN分类算法实现了智能导诊,在用户提交远程医疗病历资料后,引导用户进行正确就诊,提高了分诊的速度和准确度,降低了维护难度。
附图说明
图1是本发明的流程图;
图2是本发明的KNN算法示意图。
具体实施方式
如图1和图2所示的一种基于KNN算法的远程医疗自动分诊方法,包括如下步骤:
步骤1:建立分布式云服务器平台,建立若干远程医疗客户端,所有远程医疗客户端均通过互联网与分布式云服务器平台通信,在分布式云服务器平台中建立文本预处理模块、相似度计算模块和科室匹配模块;
步骤2:远程医疗客户端用于收集病人的主诉信息和电子病历,并将主诉信息和电子病历上传到云服务器平台;
步骤3:云服务器平台的文本预处理模块对病人的主诉信息和电子病历进行文本预处理,其步骤如下:
步骤A1:文本预处理模块设立主诉数据库和电子病历数据库,主诉数据库用于存储病人的主诉信息,电子病历数据库用于存储病人的电子病历;
步骤A2:文本预处理模块建立停用词表,在停用词表中预存停用词;
步骤A3;文本预处理模块将主诉信息和电子病历中的文本转化成为主诉文本向量:文本预处理模块根据停用词表将主诉信息和电子病历中的停用词删除,并利用正则表达式删除时间词,提高文本向量的表现力,合并主诉信息和电子病历中的剩余文本,以字为单位构件文本向量,即,生成主诉文本向量;
所述时间词如主诉信息中表达时间的词汇:“头痛2天”中的“2天”,文本预处理模块首先建立时间词词库,预先收录相关时间词。
通常自然语言处理的第一步是分词,而针对主诉信息的分词效果较差,所以本发明以字代词,以字为单位构建文本向量;
步骤4:文本预处理模块将主诉文本向量上传给相似度计算模块,相似度计算模块对主诉文本向量进行相似度分析,其步骤如下:
步骤B1:在相似度计算模块中建立主诉数据集,主诉数据集中包含数个表达病症的字向量,以病症对应的科室为归类规则,对字向量进行归类,生成数个字向量集;
步骤B2:相似度计算模块获取文本预处理模块生成的主诉文本向量后,以字为最小单位,将主诉文本向量与主诉数据集中的字向量进行相似度对比;找出所有与主诉文本向量相似的字向量;
步骤5:根据KNN算法计算出候选科室列表,其步骤如下:
步骤C1:根据KNN算法,找出与主诉文本向量具有最多的相似度字向量的字向量集;
步骤C2:根据步骤C1得到的字向量集查找对应的科室,将该科室作为伪候选科室;
步骤C3:根据步骤C1和步骤C2的方法,选择出数个伪候选科室,并将所有伪候选科室按相似度字向量的数量进行顺序排序;
步骤C4:选择相似度字向量的数量最高的3个伪候选科室作为候选科室,并将这3个候选科室作为分诊结果输出;
步骤6:结束分诊。
本发明利用KNN算法计算出候选科室列表,对于候选科室列表中的候选科室,计算用户所输入主诉与候选科室集合中前n个科室背景资料的相似度,根据相似度进行排序,其中科室背景资料通过统计每个科室对应主诉,由对应主诉集合关键词构建科室背景资料。鉴于用户主诉通常较短,且同一病症可能对应不同的科室,只输出一个科室会导致准确率较低,故输出相似度最高的3个候选科室,完成导诊流程。
KNN算法具体为:K最近邻(k-Nearest Neighbor,KNN)分类算法是数据挖掘中最经典的算法之一,其基本思想是:如果一个样本在特征空间中的k个最相似(即,特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。算法示意图如图2所示,对于用户输入的样本点Xi,计算出与其最相近的k个样本点,统计这k个样本点所属类别,出现最多的类即为样本点的类别。在图2中,选取了6个与样本点Xi最为相近的样本,其中3个属于类别W1,2个属于类别W2,1个属于类别W3,因此判断样本点Xi属于类别W1;在本发明中,所述样本点Xi即为主诉文本向量中的任意一个字向量Xi,类别W1、类别W2和类别W3即为相似度计算模块中的3个字向量集:W1、W2和W3,这3个字向量集分别对应三个科室,字向量A经过相似度对比后,对应在W1中有3个相似的字向量,在W2中有2个相似的字向量,在W3中有1个相似的字向量,那么字向量Xi属于W1所对应的科室。
本发明采用KNN算法,无需训练,对于多分类问题表现较好。
在执行步骤4对主诉文本向量进行相似度分析时,采用考虑到主诉文本通常偏短且智能导诊对算法效率要求较高,采用Jaccard相似系数作为相似性度量算法:Jaccard相似系数主要用于计算符号度量或布尔值度量的个体间的相似度,其计算公式如下:
对于经过预处理的主诉文本,构建词表作为分母,用词袋模型生成文本向量X={x1,x2,x3,...,xn}与文本向量Y={y1,y2,y3,...,ym},统计文本向量X={x1,x2,x3,...,xn}与文本向量Y={y1,y2,y3,...,ym}的交集作为分子,然后利用上述公式计算Jaccard相似。
在执行步骤B1时,每一个科室均提供一个科室背景资料,科室背景资料通过统计每个科室对应的病症主诉,由对应病症主诉集合关键词构建科室背景资料,在对主诉数据集中的表达病症的字向量进行归类时,采用相似度对比的方式,对所述表达病症的字向量与科室背景资料中的病症主诉集合关键词继续对比,将对比结果作为主诉数据集中的表达病症的字向量进行归类的依据。
在执行步骤A3是,所述时间词为主诉信息中表达时间的词汇。
所述远程医疗客户端为电脑或远程医疗终端。
本发明所述的一种基于KNN算法的远程医疗自动分诊方法,解决了多病症快速准确分诊的技术问题,本发明利用数据挖掘技术中的K最近邻(kNN,k-Nearest Neighbor)算法,根据患者主诉,计算患者主诉与数据库中其他主诉的语义相似度,实现自动分诊,针对智能导诊这一需求,从电子病历中抽取患者主诉与就诊科室数据,通过计算不同患者主诉之间的相似度,基于KNN分类算法实现了智能导诊,在用户提交远程医疗病历资料后,引导用户进行正确就诊,提高了分诊的速度和准确度,降低了维护难度。

Claims (4)

1.一种基于KNN算法的远程医疗自动分诊方法,其特征在于:包括如下步骤:
步骤1:建立分布式云服务器平台,建立若干远程医疗客户端,所有远程医疗客户端均通过互联网与分布式云服务器平台通信,在分布式云服务器平台中建立文本预处理模块、相似度计算模块和科室匹配模块;
步骤2:远程医疗客户端用于收集病人的主诉信息和电子病历,并将主诉信息和电子病历上传到云服务器平台;
步骤3:云服务器平台的文本预处理模块对病人的主诉信息和电子病历进行文本预处理,其步骤如下:
步骤A1:文本预处理模块设立主诉数据库和电子病历数据库,主诉数据库用于存储病人的主诉信息,电子病历数据库用于存储病人的电子病历;
步骤A2:文本预处理模块建立停用词表,在停用词表中预存停用词;
步骤A3:文本预处理模块将主诉信息和电子病历中的文本转化成为主诉文本向量:文本预处理模块根据停用词表将主诉信息和电子病历中的停用词删除,并利用正则表达式删除时间词,合并主诉信息和电子病历中的剩余文本,以字为单位构件文本向量,即,生成主诉文本向量;
步骤4:文本预处理模块将主诉文本向量上传给相似度计算模块,相似度计算模块对主诉文本向量进行相似度分析,其步骤如下:
步骤B1:在相似度计算模块中建立主诉数据集,主诉数据集中包含数个表达病症的字向量,以病症对应的科室为归类规则,对字向量进行归类,生成数个字向量集;
步骤B2:相似度计算模块获取文本预处理模块生成的主诉文本向量后,以字为最小单位,将主诉文本向量与主诉数据集中的字向量进行相似度对比;找出所有与主诉文本向量相似的字向量;
步骤5:根据KNN算法计算出候选科室列表,其步骤如下:
步骤C1:根据KNN算法,找出与主诉文本向量具有最多的相似度字向量的字向量集;
步骤C2:根据步骤C1得到的字向量集查找对应的科室,将该科室作为伪候选科室;
步骤C3:根据步骤C1和步骤C2的方法,选择出数个伪候选科室,并将所有伪候选科室按相似度字向量的数量进行顺序排序;
步骤C4:选择相似度字向量的数量最高的3个伪候选科室作为候选科室,并将这3个候选科室作为分诊结果输出;
步骤6:结束分诊。
2.如权利要求1所述的一种基于KNN算法的远程医疗自动分诊方法,其特征在于:在执行步骤B1时,每一个科室均提供一个科室背景资料,科室背景资料通过统计每个科室对应的病症主诉,由对应病症主诉集合关键词构建科室背景资料,在对主诉数据集中的表达病症的字向量进行归类时,采用相似度对比的方式,对所述表达病症的字向量与科室背景资料中的病症主诉集合关键词继续对比,将对比结果作为主诉数据集中的表达病症的字向量进行归类的依据。
3.如权利要求1所述的一种基于KNN算法的远程医疗自动分诊方法,其特征在于:在执行步骤A3时,所述时间词为主诉信息中表达时间的词汇。
4.如权利要求1所述的一种基于KNN算法的远程医疗自动分诊方法,其特征在于:所述远程医疗客户端为电脑、远程医疗终端或挂号终端。
CN201810818355.XA 2018-07-24 2018-07-24 一种基于knn算法的远程医疗自动分诊方法 Pending CN108986907A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810818355.XA CN108986907A (zh) 2018-07-24 2018-07-24 一种基于knn算法的远程医疗自动分诊方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810818355.XA CN108986907A (zh) 2018-07-24 2018-07-24 一种基于knn算法的远程医疗自动分诊方法

Publications (1)

Publication Number Publication Date
CN108986907A true CN108986907A (zh) 2018-12-11

Family

ID=64549805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810818355.XA Pending CN108986907A (zh) 2018-07-24 2018-07-24 一种基于knn算法的远程医疗自动分诊方法

Country Status (1)

Country Link
CN (1) CN108986907A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109840280A (zh) * 2019-03-05 2019-06-04 百度在线网络技术(北京)有限公司 一种文本分类方法、装置及计算机可读存储介质
CN110085307A (zh) * 2019-04-04 2019-08-02 华东理工大学 一种基于多源知识图谱融合的智能导诊方法和系统
CN110246572A (zh) * 2019-05-05 2019-09-17 清华大学 一种基于词向量的医疗分诊方法及系统
CN110265104A (zh) * 2019-05-08 2019-09-20 长沙市中心医院 诊断报告符合度检测方法、装置、计算机设备和存储介质
CN110534185A (zh) * 2019-08-30 2019-12-03 腾讯科技(深圳)有限公司 标注数据获取方法、分诊方法、装置、存储介质及设备
CN111341437A (zh) * 2020-02-21 2020-06-26 山东大学齐鲁医院 基于舌图像的消化道疾病判断辅助系统
CN112233737A (zh) * 2020-11-19 2021-01-15 吾征智能技术(北京)有限公司 一种基于尿常规信息的疾病认知系统
US11170898B2 (en) 2019-09-30 2021-11-09 Kpn Innovations, Llc Methods and systems for prioritizing user symptom complaint inputs
CN113707285A (zh) * 2021-08-30 2021-11-26 康键信息技术(深圳)有限公司 科室分诊方法、系统、设备以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6786406B1 (en) * 2003-03-28 2004-09-07 Peter A. Maningas Medical pathways rapid triage system
CN102156812A (zh) * 2011-04-02 2011-08-17 中国医学科学院医学信息研究所 基于症状相似度分析的就医辅助决策方法
CN106778042A (zh) * 2017-01-26 2017-05-31 中电科软件信息服务有限公司 心脑血管患者相似性分析方法及系统
CN108231174A (zh) * 2017-12-11 2018-06-29 浪潮软件集团有限公司 一种确定科室的方法、装置及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6786406B1 (en) * 2003-03-28 2004-09-07 Peter A. Maningas Medical pathways rapid triage system
CN102156812A (zh) * 2011-04-02 2011-08-17 中国医学科学院医学信息研究所 基于症状相似度分析的就医辅助决策方法
CN106778042A (zh) * 2017-01-26 2017-05-31 中电科软件信息服务有限公司 心脑血管患者相似性分析方法及系统
CN108231174A (zh) * 2017-12-11 2018-06-29 浪潮软件集团有限公司 一种确定科室的方法、装置及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
宁建飞等: "基于词向量句子相似度量的医疗科室推荐", 《福建师范大学学报(自然科学版)》 *
苏玉龙等: "基于关键词的文本向量化与分类算法研究", 《贵州大学学报(自然科学版)》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109840280A (zh) * 2019-03-05 2019-06-04 百度在线网络技术(北京)有限公司 一种文本分类方法、装置及计算机可读存储介质
CN109840280B (zh) * 2019-03-05 2023-07-18 百度在线网络技术(北京)有限公司 一种文本分类方法、装置及计算机可读存储介质
CN110085307B (zh) * 2019-04-04 2023-02-03 华东理工大学 一种基于多源知识图谱融合的智能导诊方法和系统
CN110085307A (zh) * 2019-04-04 2019-08-02 华东理工大学 一种基于多源知识图谱融合的智能导诊方法和系统
CN110246572A (zh) * 2019-05-05 2019-09-17 清华大学 一种基于词向量的医疗分诊方法及系统
CN110246572B (zh) * 2019-05-05 2021-07-13 清华大学 一种基于词向量的医疗分诊方法及系统
CN110265104A (zh) * 2019-05-08 2019-09-20 长沙市中心医院 诊断报告符合度检测方法、装置、计算机设备和存储介质
CN110534185A (zh) * 2019-08-30 2019-12-03 腾讯科技(深圳)有限公司 标注数据获取方法、分诊方法、装置、存储介质及设备
US11170898B2 (en) 2019-09-30 2021-11-09 Kpn Innovations, Llc Methods and systems for prioritizing user symptom complaint inputs
CN111341437A (zh) * 2020-02-21 2020-06-26 山东大学齐鲁医院 基于舌图像的消化道疾病判断辅助系统
CN111341437B (zh) * 2020-02-21 2022-02-11 山东大学齐鲁医院 基于舌图像的消化道疾病判断辅助系统
CN112233737A (zh) * 2020-11-19 2021-01-15 吾征智能技术(北京)有限公司 一种基于尿常规信息的疾病认知系统
CN113707285A (zh) * 2021-08-30 2021-11-26 康键信息技术(深圳)有限公司 科室分诊方法、系统、设备以及存储介质

Similar Documents

Publication Publication Date Title
CN108986907A (zh) 一种基于knn算法的远程医疗自动分诊方法
Lehman et al. Inferring which medical treatments work from reports of clinical trials
Chen et al. Entity embedding-based anomaly detection for heterogeneous categorical events
Combarro et al. Introducing a family of linear measures for feature selection in text categorization
CN106021364A (zh) 图片搜索相关性预测模型的建立、图片搜索方法和装置
EP3539018A1 (en) Apparatus and method for semantic search
CN108519971B (zh) 一种基于平行语料库的跨语种新闻主题相似性对比方法
CN107688870B (zh) 一种基于文本流输入的深度神经网络的分层因素可视化分析方法及装置
JP2004005668A (ja) 膨大な異種ドキュメント集合内のドキュメントについて信頼度の等級付け、推定、分類を行うシステムおよび方法
JPH07295989A (ja) データを解析するためのインタプリタを形成する装置
CN108446741A (zh) 机器学习超参数重要性评估方法、系统及存储介质
CN111950840A (zh) 一种计量检定装置智能运维知识检索方法及系统
US20220058464A1 (en) Information processing apparatus and non-transitory computer readable medium
Amolochitis et al. A heuristic hierarchical scheme for academic search and retrieval
CN106960003A (zh) 抄袭检测中的基于机器学习的源检索的查询生成方法
Wertz et al. Investigating active learning sampling strategies for extreme multi label text classification
Zeng et al. Medical data mining in sentiment analysis based on optimized swarm search feature selection
CN113032573B (zh) 一种结合主题语义与tf*idf算法的大规模文本分类方法及系统
CN111767404B (zh) 一种事件挖掘方法和装置
Pinto et al. What Drives Research Efforts? Find Scientific Claims that Count!
CN111444414A (zh) 一种用于建模ad-hoc检索任务中多样相关特征的信息检索模型
Zheng et al. Rumor Detection Based on Improved Transformer
CN111651643A (zh) 候选内容的处理方法及相关设备
Lu et al. Zero-shot Hybrid Retrieval and Reranking Models for Biomedical Literature.
CN107818134A (zh) 一种职位相似度计算方法、客户端以及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181211