CN109036588A - 线上问诊的方法、装置、设备及计算机可读介质 - Google Patents
线上问诊的方法、装置、设备及计算机可读介质 Download PDFInfo
- Publication number
- CN109036588A CN109036588A CN201811053019.7A CN201811053019A CN109036588A CN 109036588 A CN109036588 A CN 109036588A CN 201811053019 A CN201811053019 A CN 201811053019A CN 109036588 A CN109036588 A CN 109036588A
- Authority
- CN
- China
- Prior art keywords
- questions
- interrogation
- line
- answer
- asked
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种线上问诊的方法、装置、设备及计算机可读介质,其中线上问诊的方法包括:接收线上咨询问题;根据所述线上咨询问题确定疾病种类;从问诊问题库中查找与所述疾病种类相匹配的至少一个问诊问题;推荐所述至少一个问诊问题。本发明的技术方案可以提高人工问诊的效率,提升用户的体验。
Description
技术领域
本发明涉及医疗信息技术领域,尤其涉及一种线上问诊的方法、装置、设备及计算机可读介质。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
据统计,在线上人工问诊会话阶段,90%以上的会话,医生无法在90秒之内回答患者的问题,使得患者失去耐心离开会话,影响用户体验,使即时人工问诊失去价值。现有技术只是通过医生或者医疗助理手动回答患者的问题,会增加人力成本。
发明内容
本发明实施例提供一种线上问诊的方法、装置、设备及计算机可读介质,以至少解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种线上问诊的方法,包括:
接收线上咨询问题;
根据所述线上咨询问题确定疾病种类;
从问诊问题库中查找与所述疾病种类相匹配的至少一个问诊问题;
推荐所述至少一个问诊问题。
结合第一方面,本发明实施例在第一方面的第一种实施方式中,线上问诊的方法还包括:
从咨询问题与答案库中查找与所述线上咨询问题相匹配的至少一个咨询问题,每个咨询问题具有对应的咨询答案;
推荐与所述至少一个咨询问题对应的咨询答案。
结合第一方面,本发明实施例在第一方面的第二种实施方式中,线上问诊的方法还包括:
获取所述线上咨询问题的句向量以及咨询问题与答案库中每个咨询问题的句向量,每个咨询问题具有对应的咨询答案;
分别计算每个咨询问题的句向量与所述线上咨询问题的句向量之间的相似度;
基于相似度的大小对各咨询问题进行倒序排列;以及
推荐与前N个咨询问题对应的咨询答案,其中,1≤N≤10,且N为整数。
结合第一方面的第二种实施方式,本发明实施例在第一方面的第三种实施方式中,所述分别计算每个咨询问题的句向量与所述线上咨询问题的句向量之间的相似度的步骤包括:
基于余弦相似度算法或欧氏距离算法或杰卡德系数算法分别计算每个咨询问题的句向量与所述线上咨询问题的句向量之间的相似度。
结合第一方面,本发明实施例在第一方面的第四种实施方式中,线上问诊的方法还包括:
获取与所述问诊问题相对应的线上反馈;
从所述线上反馈中提取关键信息;以及
将所述关键信息以及所述问诊问题作为摘要。
结合第一方面,本发明实施例在第一方面的第五种实施方式中,所述问诊问题库的构建方法包括:
从历史会话数据中,抽取用于问诊的开场问题;
基于疾病种类将所述开场问题进行分组;
对每个疾病种类下的开场问题进行聚类,并抽取高频开场问题作为所述问诊问题库中的问诊问题。
结合第一方面,本发明实施例在第一方面的第六种实施方式中,所述咨询问题与答案库的构建方法包括:
从历史会话数据中,抽取历史咨询问题;
对所述历史咨询问题进行聚类,并抽取高频历史咨询问题作为所述咨询问题与答案库中的咨询问题;以及
为每个咨询问题配置咨询答案。
结合第一方面的第六种实施方式,本发明实施例在第一方面的第七种实施方式中,所述为每个咨询问题配置咨询答案的步骤包括:
从历史会话数据中抽取与咨询问题相匹配的会话语句作为所述咨询问题的咨询答案。
第二方面,本发明实施例提供一种线上问诊的装置,包括:
接收模块,用于接收线上咨询问题;
疾病种类确定模块,用于根据所述线上咨询问题确定疾病种类;
问诊问题查找模块,用于从问诊问题库中查找与所述疾病种类相匹配的至少一个问诊问题;以及
问诊问题推荐模块,用于推荐所述至少一个问诊问题。
结合第二方面,本发明实施例在第二方面的第一种实施方式中,线上问诊的装置还包括:
咨询问题查找模块,用于从咨询问题与答案库中查找与所述线上咨询问题相匹配的至少一个咨询问题,每个咨询问题具有对应的咨询答案;
咨询答案推荐模块,用于推荐与所述至少一个咨询问题对应的咨询答案。
结合第二方面,本发明实施例在第二方面的第二种实施方式中,线上问诊的装置还包括:
句向量获取模块,用于获取所述线上咨询问题的句向量以及咨询问题与答案库中每个咨询问题的句向量,每个咨询问题具有对应的咨询答案;
相似度计算模块,用于分别计算每个咨询问题的句向量与所述线上咨询问题的句向量之间的相似度;
排序模块,用于基于相似度的大小对各咨询问题进行倒序排列;以及
咨询答案推荐模块,用于推荐与前N个咨询问题对应的咨询答案,其中,1≤N≤10,且N为整数。
结合第二方面,本发明实施例在第二方面的第三种实施方式中,线上问诊的装置还包括问诊问题库构建模块,所述问诊问题库构建模块用于:
从历史会话数据中,抽取用于问诊的开场问题;
基于疾病种类将所述开场问题进行分组;
对每个疾病种类下的开场问题进行聚类,并抽取高频开场问题作为所述问诊问题库中的问诊问题。
所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,线上问诊的装置的结构中包括处理器和存储器,所述存储器用于存储支持线上问诊的装置执行上述第一方面中线上问诊的方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述线上问诊的装置还可以包括通信接口,用于线上问诊的装置与其他设备或通信网络通信。
第三方面,本发明实施例提供了一种计算机可读存储介质,用于存储线上问诊的装置所用的计算机软件指令,其包括用于执行上述第一方面中线上问诊的方法为线上问诊的装置所涉及的程序。
本发明实施例可以提高人工问诊的效率,提升用户的体验。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为本发明实施例的线上问诊的方法的流程图。
图2为本发明实施例的线上问诊的方法所应用的医生端的界面示意图。
图3至图9分别为本发明实施例的线上问诊的方法的不同实施方式的流程图。
图10为本发明实施例的线上问诊的装置的结构示意图。
图11至图13分别为本发明实施例的线上问诊的装置的不同实施方式的结构示意图。
图14为本发明实施例的线上问诊的设备的组成结构示意图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
本发明实施例旨在提供一种线上问诊的方法和装置,旨在为医生端推荐针对患者端线上咨询问题的问诊问题和咨询答案,供医生选择直接发送或重新编辑其他的内容进行发送。医生通过点击推荐的问诊问题,就可以收集患者基本情况;通过点击推荐的咨询答案就可以回答患者的咨询问题,而不需要手动输入,从而节省医生文字输入时间,提高人工问诊的效率。
首先将给出本实施例所应用的相关名词的解释。
(1)余弦相似度,是指通过计算两个向量夹角的余弦值进行相似度计算。
(2)欧氏距离,基于对空间各点的绝对距离的衡量进行的相似度计算。
(3)杰卡德(Jaccard)系数,两个集合A和B交集元素的个数在A、B并集中所占的比例,称为这两个集合的Jaccard系数。Jaccard系数用于比较有限样本集之间的相似性与差异性。Jaccard系数值越大,样本相似度越高。
(4)k均值(k-means)算法,是一种聚类算法,将各个聚类子集内的所有数据样本的均值作为该聚类的代表点。k-means算法的计算过程包括:随机选择k个类簇的中心;计算每一个样本点到所有类簇中心的距离,选择最小距离作为该样本的类簇;重新计算所有类簇的中心坐标,直到达到某种停止条件(迭代次数/簇中心收敛/最小平方误差)。
(5)谱聚类(spectral clustering)算法,其原理是把所有的数据看做空间中的点,这些点之间可以用边连接起来,距离较远的两个点之间的边权重值较低,而距离较近的两个点之间的边权重值较高,通过对所有数据点组成的图进行切图,让切图后不同的子图间边权重和尽可能的低,而子图内的边权重和尽可能的高,从而达到聚类的目的。
(6)密度聚类算法,如基于密度的噪声应用空间聚类(Density-Based SpatialClustering of Applications with Noise,DBSCAN)算法,它是一种基于高密度连通区域的、基于密度的聚类算法,能够将具有足够高密度的区域划分为簇,并在具有噪声的数据中发现任意形状的簇。
(7)文档转向量(document to vector,doc2vec),一种用于长文本向量建模的工具。
(8)词语转向量(word to vector,word2vec),一种用于词向量建模的工具。
下面进行技术方案的展开描述。
如图1所示,本实施例提供一种线上问诊的方法,包括:
步骤S110,接收线上咨询问题。
具体地,在患者端与医生端建立连接后,患者可以通过患者端首先发送线上咨询问题,由服务器端接收来自该线上咨询问题,并推送给医生端。该线上咨询问题通常包括患者对病症的主诉(主要诉求)。例如,如图2所示的线上咨询问题“医生你好,得灰指甲很久了,请问该怎么治疗啊?着急!”,其中患者的主诉是如何治疗灰指甲。
在一种实施方式中,步骤S110还可以包括对患者端的线上咨询问题进行筛选,并为医生推荐相对应的操作。例如针对线上咨询问题为诸如“你好”等问候语或不涉及医疗咨询的开场白,服务器端可以向医生端推荐“请问你的年龄”、“请问哪里不舒服”等常规问诊问题,供医生选择。
步骤S120,根据所述线上咨询问题确定疾病种类。
具体地,服务器端根据线上咨询问题所涉及的病症或疾病名确定疾病种类。例如,如图2所示,基于患者端的线上咨询问题“医生你好,得灰指甲很久了,请问该怎么治疗啊?着急!”,服务器端确定患者的疾病所属种类为“灰指甲”。
步骤S130,从问诊问题库中查找与所述疾病种类相匹配的至少一个问诊问题。
具体地,在确定疾病种类后,服务器端从问诊问题库中查找与该疾病种类相对应的一个或多个问诊问题。如图2所示,在确定了疾病种类为“灰指甲”后,从问诊问题库中查找与“灰指甲”相对应的问诊问题,如“请问你多大年龄了”和“得灰指甲多长时间了”等。
步骤S140,推荐所述至少一个问诊问题。
具体地,服务器端在查找到与疾病种类相匹配的问诊问题后,推送给医生端,供医生选择。医生可以从推荐的问诊问题中选择合适的问诊问题发送给患者端。这样,医生不需要手动输入问诊问题,从而节省医生文字输入时间。当然,医生如果觉得推荐的问诊问题不适合,也可以自行输入其他的问诊问题并发送给患者端,从而使问诊更贴近患者需求。
在一种实施方式中,本实施例的线上问诊的方法还包括构建问诊问题库,如图3所示,在步骤S110之前还包括:
步骤S210,从历史会话数据中,抽取用于问诊的开场问题。
具体地,从医生端与患者端的历史会话数据中,抽取每次会话中医生端的开场问题,可以是每次会话中医生端最先提出的三个问题。
步骤S220,基于疾病种类将所述开场问题进行分组。
具体地,每个疾病种类下均有若干个开场问题。
步骤S230,对每个疾病种类下的开场问题进行聚类,并抽取高频开场问题作为所述问诊问题库中的问诊问题。
具体地,可以通过doc2vec技术获取每个开场问题的句向量。在一种实施方式中,也可以通过word2vec技术获取每个开场问题的句向量,具体包括将开场问题中所有词的向量在每一个维度上做平均处理,进而得到开场问题的句向量。
然后,可以使用k-means(多维度)聚类算法将开场问题聚类,从而将每个疾病种类下的相同开场问题进行合并。k-means算法可以将n个数据对象划分为k个聚类(k值可设定),所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。在一种实施方式中,对开场问题的聚类还可以采用谱聚类算法或密度聚类算法。
接着,将高频开场问题作为问诊问题库中的问诊问题。其中,高频开场问题可以包括出现次数最多的前两个或前三个开场问题。
基于步骤S210至步骤S230,可以构建问诊问题库,该问诊问题库包括多个疾病种类,每个疾病种类下具有至少一个对应的问诊问题。
在一种实施方式中,如图4所示,本实施例的线上问诊的方法包括:
步骤S110,接收线上咨询问题。
步骤S320,从咨询问题与答案库中查找与所述线上咨询问题相匹配的至少一个咨询问题,每个咨询问题具有对应的咨询答案。
具体地,咨询问题与答案库中具有多个咨询问题,并且每个咨询问题具有对应的一个或多个咨询答案。该咨询答案是对咨询问题的回答,如针对患者的医疗咨询所进行的诊疗建议。服务器端在接收到线上咨询问题以后,可以基于相似度从咨询问题与答案库中查找一个或多个与患者端的线上咨询问题相匹配的咨询问题。
步骤S330,推荐与所述至少一个咨询问题对应的咨询答案。
具体地,服务器端在查找到与线上咨询问题相匹配的咨询问题后,将该咨询问题相对的一个或多个咨询答案推送给医生端,供医生选择。医生可以选择将咨询答案发送给患者端,而不需要手动输入,从而节省医生文字输入时间。当然,医生如果觉得推荐的咨询答案不适合,也可以选择自行输入其他的咨询答案并发送给患者端,从而使诊疗建议更科学更准确。
如图2所示,服务器端推荐给医生端三个咨询答案“注意灰指甲会传染,注意隔离”、“可以使用金达克宁乳膏、酮康唑乳膏进行治疗”和“口服抗真菌药物,同时需要监测肝肾功能”。在医生端,医生可以直接点击其中的一个或多个咨询答案,医生端可以将将医生选择的咨询答案发送给患者端,作为给患者的诊疗建议。此外,医生也可以在医生端自行输入其他诊疗建议并通过医生端发送给患者端。
在一种实施方式中,可以基于相似度从咨询问题与答案库中查找与所述线上咨询问题相匹配的至少一个咨询问题,如图5所示,本实施方式中,线上问诊的方法包括:
步骤S110,接收线上咨询问题。
步骤S420,获取所述线上咨询问题的句向量以及咨询问题与答案库中每个咨询问题的句向量,每个咨询问题具有对应的咨询答案。
具体地,句向量的获取可以基于doc2vec技术,也可以基于word2vec技术获取词向量,然后对句子中所有词的向量在每一个维度上做平均处理,进而得到句向量,具体可参阅问诊问题库对开场问题的句向量的获取方法。
步骤S430,分别计算每个咨询问题的句向量与所述线上咨询问题的句向量之间的相似度。
具体地,可以基于余弦相似度算法或欧氏距离算法或杰卡德系数算法进行相似度的计算。
步骤S440,基于相似度的大小对各咨询问题进行倒序排列;以及
步骤S450,推荐与前N个咨询问题对应的咨询答案,其中,1≤N≤10,且N为整数。
即将相似度最高的N个咨询问题对应的咨询答案作为患者端的线上咨询问题的咨询答案,推荐给医生端,供医生选择。
在一种实施方式中,本实施例的线上问诊的方法还包括构建咨询问题与答案库,如图6所示,在步骤S110之前还包括:
步骤S510,从历史会话数据中,抽取历史咨询问题;
步骤S520,对所述历史咨询问题进行聚类,并抽取高频历史咨询问题作为所述咨询问题与答案库中的咨询问题。
具体地,可以通过doc2vec技术或word2vec技术获取每个历史咨询问题的句向量。然后,可以使用k-means方法或谱聚类算法或密度聚类算法将历史咨询问题聚类,从而合并相同或相近似的历史咨询问题。接着,将高频历史咨询问题作为咨询问题与答案库中的咨询问题。其中,高频开场问题可以是出现次数最多的若干个咨询问题。
步骤S530,为每个咨询问题配置咨询答案。
具体地,可以直接由医疗专家来人工回答咨询答案,也可以基于患者端的历史咨询问题与医生端的历史咨询答案之间的相似度从历史会话数据中自动抽取咨询答案,并由医疗专家进行审核。
在一种实施方式中,如图7所示,本实施例的线上问诊方法在步骤S140还包括:
步骤S150,获取与所述问诊问题相对应的线上反馈。
具体地,在服务器端为医生端推荐了问诊问题后,医生通过医生端向患者端发送问诊问题。患者端发送线上反馈。线上反馈可以是多个。服务器端在收到患者端的线上反馈后,分别获取每个线上反馈的句向量以及每个问诊问题的句向量,基于相似度计算,将线上反馈与问诊问题一一对应。
步骤S160,从所述线上反馈中提取关键信息。
具体地,可以利用条件随机场(conditional randomfield,CRF)等序列标注模型从线上反馈中提取关键信息。例如,获取的与问诊问题“请问你多大年龄了?”相对应的线上反馈是“我过了年就33岁了”,提取到的关键信息是“33岁”。
步骤S170,将所述关键信息以及所述问诊问题作为摘要。
具体地,将提取到的关键信息附在该关键信息相对应的问诊问题之后一起提供给医生端,供医生快速了解病情。如图2所示,提取的关键信息“33岁”附在问诊问题“请问你多大年龄了?”之后形成摘要。
在一种实施方式中,步骤S120~S140与步骤S320~S330可以并行,如图8所示。在另一种实施方式中,步骤S120~S140与步骤S420~S450可以并行,如图9所示。
本实施例还提供一种线上问诊的装置,与上述的线上问诊的方法相对应,如图10所示,本实施例的线上问诊装置包括:
接收模块110,用于接收线上咨询问题;
疾病种类确定模块120,用于根据所述线上咨询问题确定疾病种类;
问诊问题查找模块130,用于从问诊问题库中查找与所述疾病种类相匹配的至少一个问诊问题;以及
问诊问题推荐模块140,用于推荐所述至少一个问诊问题。
在一种实施方式中,如图11所示,本实施例的线上问诊装置还包括问诊问题库构建模块200,用于:
从历史会话数据中,抽取用于问诊的开场问题;
基于疾病种类将所述开场问题进行分组;
对每个疾病种类下的开场问题进行聚类,并抽取高频开场问题作为所述问诊问题库中的问诊问题。
在一种实施方式中,如图12所示,本实施例的线上问诊装置包括:
接收模块110,用于接收线上咨询问题;
咨询问题查找模块320,用于从咨询问题与答案库中查找与所述线上咨询问题相匹配的至少一个咨询问题,每个咨询问题具有对应的咨询答案;
咨询答案推荐模块330,用于推荐与所述至少一个咨询问题对应的咨询答案。
在一种实施方式中,如图13所示,本实施例的线上问诊装置包括:
接收模块110,用于接收线上咨询问题;
句向量获取模块420,用于获取所述线上咨询问题的句向量以及咨询问题与答案库中每个咨询问题的句向量,每个咨询问题具有对应的咨询答案;
相似度计算模块420,用于分别计算每个咨询问题的句向量与所述线上咨询问题的句向量之间的相似度;
排序模块440,用于基于相似度的大小对各咨询问题进行倒序排列;以及
咨询答案推荐模块450,用于推荐与前N个咨询问题对应的咨询答案,其中,1≤N≤10,且N为整数。
本实施例还提供一种线上问诊的设备,如图14所示,该设备包括:存储器21和处理器22,存储器21内存储有可在处理器22上运行的计算机程序。处理器22执行所述计算机程序时实现上述实施例中的线上问诊的方法。所述存储器21和处理器22的数量可以为一个或多个。
该设备还包括:
通信接口23,用于与外界设备进行通信,进行数据交互传输。
存储器21可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
如果存储器21、处理器22和通信接口23独立实现,则存储器21、处理器22和通信接口23可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图14中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器21、处理器22及通信接口23集成在一块芯片上,则存储器21、处理器22及通信接口23可以通过内部接口完成相互间的通信。
综上所示,本实施例的线上问诊的方法和装置可以为医生端推荐针对患者端线上咨询问题的问诊问题和咨询答案,供医生选择直接发送或重新编辑其他的内容进行发送。医生可以直接发送推荐的问诊问题,以收集患者基本情况;还可以直接发送推荐的咨询答案就可以回答患者的咨询问题,而不需要手动输入,从而节省医生文字输入时间,提高人工问诊的效率,还可以大大降低医生的回复成本;同时,患者的问题能够得到及时响应,进而提升用户的体验。另外,医生也可以重新编辑其他的内容进行发送,从而提高问诊的严谨性和准确性。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (14)
1.一种线上问诊的方法,其特征在于,包括:
接收线上咨询问题;
根据所述线上咨询问题确定疾病种类;
从问诊问题库中查找与所述疾病种类相匹配的至少一个问诊问题;
推荐所述至少一个问诊问题。
2.根据权利要求1所述的方法,其特征在于,还包括:
从咨询问题与答案库中查找与所述线上咨询问题相匹配的至少一个咨询问题,每个咨询问题具有对应的咨询答案;
推荐与所述至少一个咨询问题对应的咨询答案。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取所述线上咨询问题的句向量以及咨询问题与答案库中每个咨询问题的句向量,每个咨询问题具有对应的咨询答案;
分别计算每个咨询问题的句向量与所述线上咨询问题的句向量之间的相似度;
基于相似度的大小对各咨询问题进行倒序排列;以及
推荐与前N个咨询问题对应的咨询答案,其中,1≤N≤10,且N为整数。
4.根据权利要求3所述的方法,其特征在于,所述分别计算每个咨询问题的句向量与所述线上咨询问题的句向量之间的相似度的步骤包括:
基于余弦相似度算法或欧氏距离算法或杰卡德系数算法分别计算每个咨询问题的句向量与所述线上咨询问题的句向量之间的相似度。
5.根据权利要求1所述的方法,其特征在于,还包括:
获取与所述问诊问题相对应的线上反馈;
从所述线上反馈中提取关键信息;以及
将所述关键信息以及所述问诊问题作为摘要。
6.根据权利要求1所述的方法,其特征在于,所述问诊问题库的构建方法包括:
从历史会话数据中,抽取用于问诊的开场问题;
基于疾病种类将所述开场问题进行分组;
对每个疾病种类下的开场问题进行聚类,并抽取高频开场问题作为所述问诊问题库中的问诊问题。
7.根据权利要求1所述的方法,其特征在于,所述咨询问题与答案库的构建方法包括:
从历史会话数据中,抽取历史咨询问题;
对所述历史咨询问题进行聚类,并抽取高频历史咨询问题作为所述咨询问题与答案库中的咨询问题;以及
为每个咨询问题配置咨询答案。
8.根据权利要求7所述的方法,其特征在于,所述为每个咨询问题配置咨询答案的步骤包括:
从历史会话数据中抽取与咨询问题相匹配的会话语句作为所述咨询问题的咨询答案。
9.一种线上问诊的装置,其特征在于,包括:
接收模块,用于接收线上咨询问题;
疾病种类确定模块,用于根据所述线上咨询问题确定疾病种类;
问诊问题查找模块,用于从问诊问题库中查找与所述疾病种类相匹配的至少一个问诊问题;以及
问诊问题推荐模块,用于推荐所述至少一个问诊问题。
10.根据权利要求9所述的装置,其特征在于,还包括:
咨询问题查找模块,用于从咨询问题与答案库中查找与所述线上咨询问题相匹配的至少一个咨询问题,每个咨询问题具有对应的咨询答案;
咨询答案推荐模块,用于推荐与所述至少一个咨询问题对应的咨询答案。
11.根据权利要求9所述的装置,其特征在于,还包括:
句向量获取模块,用于获取所述线上咨询问题的句向量以及咨询问题与答案库中每个咨询问题的句向量,每个咨询问题具有对应的咨询答案;
相似度计算模块,用于分别计算每个咨询问题的句向量与所述线上咨询问题的句向量之间的相似度;
排序模块,用于基于相似度的大小对各咨询问题进行倒序排列;以及
咨询答案推荐模块,用于推荐与前N个咨询问题对应的咨询答案,其中,1≤N≤10,且N为整数。
12.根据权利要求9所述的装置,其特征在于,还包括问诊问题库构建模块,所述问诊问题库构建模块用于:
从历史会话数据中,抽取用于问诊的开场问题;
基于疾病种类将所述开场问题进行分组;
对每个疾病种类下的开场问题进行聚类,并抽取高频开场问题作为所述问诊问题库中的问诊问题。
13.一种线上问诊的设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至8中任一所述的方法。
14.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811053019.7A CN109036588A (zh) | 2018-09-10 | 2018-09-10 | 线上问诊的方法、装置、设备及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811053019.7A CN109036588A (zh) | 2018-09-10 | 2018-09-10 | 线上问诊的方法、装置、设备及计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109036588A true CN109036588A (zh) | 2018-12-18 |
Family
ID=64621219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811053019.7A Pending CN109036588A (zh) | 2018-09-10 | 2018-09-10 | 线上问诊的方法、装置、设备及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109036588A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766425A (zh) * | 2018-12-29 | 2019-05-17 | 重庆木舌科技有限公司 | 在线实时校园法律咨询系统 |
CN109816483A (zh) * | 2019-01-08 | 2019-05-28 | 上海上湖信息技术有限公司 | 信息推荐方法及装置、可读存储介质 |
CN110008331A (zh) * | 2019-04-15 | 2019-07-12 | 三角兽(北京)科技有限公司 | 信息展示方法、装置、电子设备及计算机可读存储介质 |
CN110060786A (zh) * | 2019-04-17 | 2019-07-26 | 深圳安泰创新科技股份有限公司 | 互联网问诊提示方法、装置、终端及存储介质 |
WO2020186458A1 (zh) * | 2019-03-19 | 2020-09-24 | 京东方科技集团股份有限公司 | 问题生成方法和装置、问诊系统、计算机可读存储介质 |
CN112837813A (zh) * | 2019-11-25 | 2021-05-25 | 北京搜狗科技发展有限公司 | 自动问诊方法及装置 |
CN113836275A (zh) * | 2020-06-08 | 2021-12-24 | 菜鸟智能物流控股有限公司 | 对话模型建立方法及装置 |
CN113836284A (zh) * | 2021-09-26 | 2021-12-24 | 北京京东拓先科技有限公司 | 知识库构建、生成应答语句的方法和装置 |
CN114300160A (zh) * | 2021-11-16 | 2022-04-08 | 北京左医科技有限公司 | 问诊对话方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653840A (zh) * | 2015-12-21 | 2016-06-08 | 青岛中科慧康科技有限公司 | 基于词句分布表示的相似病例推荐系统及相应的方法 |
CN106650253A (zh) * | 2016-12-16 | 2017-05-10 | 新绎健康科技有限公司 | 一种中医机器辨证系统 |
CN107358052A (zh) * | 2017-07-18 | 2017-11-17 | 广州有宠网络科技股份有限公司 | 一种对宠物疾病进行人工智能问诊的系统及方法 |
-
2018
- 2018-09-10 CN CN201811053019.7A patent/CN109036588A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105653840A (zh) * | 2015-12-21 | 2016-06-08 | 青岛中科慧康科技有限公司 | 基于词句分布表示的相似病例推荐系统及相应的方法 |
CN106650253A (zh) * | 2016-12-16 | 2017-05-10 | 新绎健康科技有限公司 | 一种中医机器辨证系统 |
CN107358052A (zh) * | 2017-07-18 | 2017-11-17 | 广州有宠网络科技股份有限公司 | 一种对宠物疾病进行人工智能问诊的系统及方法 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766425A (zh) * | 2018-12-29 | 2019-05-17 | 重庆木舌科技有限公司 | 在线实时校园法律咨询系统 |
CN109816483A (zh) * | 2019-01-08 | 2019-05-28 | 上海上湖信息技术有限公司 | 信息推荐方法及装置、可读存储介质 |
CN109816483B (zh) * | 2019-01-08 | 2021-02-09 | 上海上湖信息技术有限公司 | 信息推荐方法及装置、可读存储介质 |
US11600389B2 (en) | 2019-03-19 | 2023-03-07 | Boe Technology Group Co., Ltd. | Question generating method and apparatus, inquiring diagnosis system, and computer readable storage medium |
WO2020186458A1 (zh) * | 2019-03-19 | 2020-09-24 | 京东方科技集团股份有限公司 | 问题生成方法和装置、问诊系统、计算机可读存储介质 |
CN110008331A (zh) * | 2019-04-15 | 2019-07-12 | 三角兽(北京)科技有限公司 | 信息展示方法、装置、电子设备及计算机可读存储介质 |
CN110008331B (zh) * | 2019-04-15 | 2021-09-14 | 腾讯科技(深圳)有限公司 | 信息展示方法、装置、电子设备及计算机可读存储介质 |
CN110060786A (zh) * | 2019-04-17 | 2019-07-26 | 深圳安泰创新科技股份有限公司 | 互联网问诊提示方法、装置、终端及存储介质 |
CN112837813A (zh) * | 2019-11-25 | 2021-05-25 | 北京搜狗科技发展有限公司 | 自动问诊方法及装置 |
CN113836275A (zh) * | 2020-06-08 | 2021-12-24 | 菜鸟智能物流控股有限公司 | 对话模型建立方法及装置 |
CN113836275B (zh) * | 2020-06-08 | 2023-09-05 | 菜鸟智能物流控股有限公司 | 对话模型建立方法、装置、非易失性存储介质和电子装置 |
CN113836284A (zh) * | 2021-09-26 | 2021-12-24 | 北京京东拓先科技有限公司 | 知识库构建、生成应答语句的方法和装置 |
CN114300160A (zh) * | 2021-11-16 | 2022-04-08 | 北京左医科技有限公司 | 问诊对话方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109036588A (zh) | 线上问诊的方法、装置、设备及计算机可读介质 | |
Wosiak et al. | Integrating Correlation‐Based Feature Selection and Clustering for Improved Cardiovascular Disease Diagnosis | |
CN116756579B (zh) | 大语言模型的训练方法及基于大语言模型的文本处理方法 | |
CN105653840B (zh) | 基于词句分布表示的相似病例推荐系统及相应的方法 | |
CN110675944A (zh) | 分诊方法及装置、计算机设备及介质 | |
CN104636430B (zh) | 案例知识库表示及案例相似度获取方法及系统 | |
KR20190075067A (ko) | 의미 정보의 시각화 및 생명 과학 엔티티들 사이의 현저한 연관을 나타내는 임시 신호의 추론을 위한 시스템, 방법 및 컴퓨터 판독 가능 매체 | |
Ellen | From ethno-science to science, or'What the indigenous knowledge debate tells us about how scientists define their project' | |
CN110459321A (zh) | 一种基于证素的中医辅助诊断系统 | |
CN108416776A (zh) | 图像识别方法、图像识别装置、计算机产品和可读存储介质 | |
US20110078205A1 (en) | Method and system for finding appropriate semantic web ontology terms from words | |
CN105678057B (zh) | 一种医疗信息分享系统 | |
Peng et al. | A multicriteria decision making approach for estimating the number of clusters in a data set | |
CN109473169A (zh) | 一种疾病诊断方法、装置及终端设备 | |
CN110838359B (zh) | 基于对话机器人的分诊方法、装置、存储介质及机器人 | |
Lopes et al. | Estimating term domain relevance through term frequency, disjoint corpora frequency-tf-dcf | |
Bahamonde et al. | Power structure in Chilean news media | |
CN109145085A (zh) | 语义相似度的计算方法及系统 | |
CN114491072A (zh) | 一种中医数据处理系统、方法、存储介质及终端 | |
CN116910172B (zh) | 基于人工智能的随访量表生成方法及系统 | |
Inácio et al. | Nonparametric Bayesian estimation of the three‐way receiver operating characteristic surface | |
WO2023124837A1 (zh) | 问诊处理方法、装置、设备及存储介质 | |
CN110473636B (zh) | 基于深度学习的智能医嘱推荐方法及系统 | |
CN116805002A (zh) | 问答方法、问答装置、设备及存储介质 | |
EP3718116B1 (en) | Apparatus for patient data availability analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181218 |