CN113704428B - 智能问诊方法、装置、电子设备及存储介质 - Google Patents
智能问诊方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113704428B CN113704428B CN202111007751.2A CN202111007751A CN113704428B CN 113704428 B CN113704428 B CN 113704428B CN 202111007751 A CN202111007751 A CN 202111007751A CN 113704428 B CN113704428 B CN 113704428B
- Authority
- CN
- China
- Prior art keywords
- inquiry
- template
- target
- basic
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000001914 filtration Methods 0.000 claims abstract description 31
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 27
- 238000012216 screening Methods 0.000 claims abstract description 18
- 230000015654 memory Effects 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 13
- 230000003993 interaction Effects 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 19
- 238000005516 engineering process Methods 0.000 description 17
- 238000013473 artificial intelligence Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000003058 natural language processing Methods 0.000 description 9
- 238000003745 diagnosis Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000009469 supplementation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002565 electrocardiography Methods 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Human Computer Interaction (AREA)
- Epidemiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请实施例提供了一种智能问诊方法、装置、电子设备及存储介质,属于数字医疗技术领域。该方法包括:获取基本问诊文本;对基本问诊文本中的实体特征进行特征提取,得到基本问诊参数;根据基本问诊参数对预设的问诊模板进行筛选,得到候选问诊模板集合;根据预设的过滤算法对候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板;根据基本问诊参数确定目标问诊模板上的目标节点及目标节点的有向边;根据目标节点和有向边构建问诊顺序题目集;根据问诊顺序题目集进行问诊。本申请实施例能够实现智能化地与用户对话问诊,提高问诊效率。
Description
技术领域
本申请涉及数字医疗技术领域,尤其涉及一种智能问诊方法、装置、电子设备及存储介质。
背景技术
目前,在用户问诊流程中,医生往往需要对每个用户重复询问类似问题,影响问诊时间和问诊效率。相关技术中,常常采用机器导诊的方式对用户进行简单的问询,并不能有效地缩短问诊时间,影响问诊效率,因此,如何提供一种智能问诊方法,实现智能化地与用户对话问诊,提高问诊效率,成为了亟待解决的技术问题。
发明内容
本申请实施例的主要目的在于提出一种智能问诊方法、装置、电子设备及存储介质,旨在实现智能化地与用户对话问诊,提高问诊效率。
为实现上述目的,本申请实施例的第一方面提出了一种智能问诊方法,所述方法包括:
获取基本问诊文本;
对所述基本问诊文本中的实体特征进行特征提取,得到基本问诊参数;
根据所述基本问诊参数对预设的问诊模板进行筛选,得到候选问诊模板集合;
根据预设的过滤算法对所述候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板;
根据所述基本问诊参数确定所述目标问诊模板上的目标节点及所述目标节点的有向边;
根据所述目标节点和所述有向边构建问诊顺序题目集;
根据所述问诊顺序题目集进行问诊。
在一些实施例,所述对所述基本问诊文本中的实体特征进行特征提取,得到基本问诊参数的步骤,包括:
识别所述基本问诊文本中的实体特征;
利用预先训练的序列分类器对所述实体特征进行分类处理;
对分类处理之后的实体特征进行特征提取,得到基本问诊参数。
在一些实施例,所述基本问诊参数包括主诉信息,所述根据预设的过滤算法对所述候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板的步骤,包括:
利用预先训练的文本自动生成模型对所述主诉信息以及所述候选问诊模板集合中的问诊模板进行处理,生成主诉文本串和问诊模板文本串;
分别对所述主诉文本串和所述问诊模板文本串进行编码处理,得到编码形式的主诉文本串和编码形式的问诊模板文本串;
计算所述编码形式的主诉文本串与每一所述编码形式的问诊模板文本串的相似度;
根据所有所述相似度之间的大小关系以及所述相似度与预设的相似度阈值的大小关系,得到目标问诊模板。
在一些实施例,所述根据所有所述相似度之间的大小关系以及所述相似度与预设的相似度阈值的大小关系,得到目标问诊模板的步骤,包括:
根据所有所述相似度之间的大小关系,确定相似度最高的问诊模板;
若所述相似度最高的问诊模板的相似度大于等于预设的相似度阈值,则将所述相似度最高的问诊模板作为目标问诊模板。
在一些实施例,所述根据所有所述相似度之间的大小关系以及所述相似度与预设的相似度阈值的大小关系,得到目标问诊模板的步骤,还包括:
根据所有所述相似度之间的大小关系,确定相似度最高的问诊模板;
若所述相似度最高的问诊模板的相似度小于预设的相似度阈值,则获取预设的参考问诊模板,并将所述预设的参考问诊模板作为目标问诊模板。
在一些实施例,所述基本问诊参数确定所述目标问诊模板上的目标节点及所述目标节点的有向边的步骤,包括:
根据所述基本问诊参数,确定所述目标问诊模板上的目标节点;
获取所述目标节点的每一有向边的脚本数据;
根据所述脚本数据,计算每一有向边的权重;
根据每一有向边的权重大小,确定所述目标节点的有向边。
在一些实施例,所述根据所述问诊顺序题目集进行问诊的步骤,包括:
抽取所述目标节点的属性信息;
根据所述属性信息对用户端在所述目标节点反馈的问答数据进行格式组装,得到文本数据;所述文本数据用于用户进行问答交互。
为实现上述目的,本申请实施例的第二方面提出了一种智能问诊装置,所述装置包括:
基本问诊文本获取模块,用于获取基本问诊文本;
实体特征提取模块,用于对所述基本问诊文本中的实体特征进行特征提取,得到基本问诊参数;
筛选模块,用于根据所述基本问诊参数对预设的问诊模板进行筛选,得到候选问诊模板集合;
目标问诊模板确定模块,用于根据预设的过滤算法对所述候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板;
目标节点及有向边确定模块,用于根据所述基本问诊参数确定所述目标问诊模板上的目标节点及所述目标节点的有向边;
问诊顺序题目集构建模块,用于根据所述目标节点和所述有向边构建问诊顺序题目集;
问诊模块,用于根据所述问诊顺序题目集进行问诊。
为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现上述第一方面所述的方法。
为实现上述目的,本申请实施例的第四方面提出了一种计算机可读存储介质,用于计算机可读存储,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面所述的方法。
本申请提出的智能问诊方法、装置、电子设备及存储介质,其通过获取基本问诊文本,对基本问诊文本中的实体特征进行特征提取,得到基本问诊参数,这一方式能够实现对基本问诊文本的特征抽取,缩小基本问诊文本的数据空间,使得更为方便提取到所需要的基本问诊参数;进而根据基本问诊参数对预设的问诊模板进行筛选,得到候选问诊模板集合,剔除了与当前问诊需求的相关性较低的问诊模板。这样一来,便可进一步地根据预设的过滤算法对候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板,这一方式缩短了问诊模板的筛选时间,也提高了选定的问诊模板与当前问诊需求的匹配性。在得到目标问诊模板后,根据基本问诊参数确定目标问诊模板上的目标节点及目标节点的有向边,再根据目标节点和有向边构建问诊顺序题目集,最后根据问诊顺序题目集进行问诊。通过对目标问诊模板的目标节点和有向边的识别与确定,能够进一步地优化问诊过程,使得问诊过程中的问诊题目更加贴合当前的问诊需求,实现了智能化地与用户对话问诊,提高了问诊效率。
附图说明
图1是本申请实施例提供的智能问诊方法的流程图;
图2是图1中的步骤S102的流程图;
图3是图1中的步骤S104的流程图;
图4是图3中的步骤S304的流程图;
图5是图3中的步骤S304的另一流程图;
图6是图1中的步骤S105的流程图;
图7是图1中的步骤S107的流程图;
图8是本申请实施例提供的智能问诊装置的结构示意图;
图9是本申请实施例提供的电子设备的硬件结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
首先,对本申请中涉及的若干名词进行解析:
人工智能(artificial intelligence,AI):是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;人工智能是计算机科学的一个分支,人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
自然语言处理(natural language processing,NLP):NLP用计算机来处理、理解以及运用人类语言(如中文、英文等),NLP属于人工智能的一个分支,是计算机科学与语言学的交叉学科,又常被称为计算语言学。自然语言处理包括语法分析、语义分析、篇章理解等。自然语言处理常用于机器翻译、手写体和印刷体字符识别、语音识别及文语转换、信息检索、信息抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等技术领域,它涉及与语言处理相关的数据挖掘、机器学习、知识获取、知识工程、人工智能研究和与语言计算相关的语言学研究等。
有向图:一个有向图D是指一个有序三元组(V(D),A(D),ψD),其中ψD)为关联函数,它使A(D)中的每一个元素(称为有向边或弧)对应于V(D)中的一个有序元素(称为顶点或点)对。
信息抽取(Information Extraction,NER):从自然语言文本中抽取指定类型的实体、关系、事件等事实信息,并形成结构化数据输出的文本处理技术。信息抽取是从文本数据中抽取特定信息的一种技术。文本数据是由一些具体的单位构成的,例如句子、段落、篇章,文本信息正是由一些小的具体的单位构成的,例如字、词、词组、句子、段落或是这些具体的单位的组合。抽取文本数据中的名词短语、人名、地名等都是文本信息抽取,当然,文本信息抽取技术所抽取的信息可以是各种类型的信息。
协同过滤算法:是一种较为著名和常用的推荐算法,它基于对用户历史行为数据的挖掘发现用户的喜好偏向,并预测用户可能喜好的产品进行推荐,或者找到相似的用户(基于用户)或物品(基于物品)。基于用户的协同过滤算法的实现主要需要解决两个问题,一是如何找到和你有相似爱好的人,也就是要计算数据的相似度。
BERT(Bidirectional Encoder Representations from Transformers):是一个语言表示模型(language representation model)。BERT采用了Transformer Encoderblock进行连接,是一个典型的双向编码模型。
最大熵马尔科夫模型(Maximum Entropy Markov Model,MEMM):用于对给定的观测序列X,计算出各隐藏状态序列Y的条件概率分布,是对转移概率和表现概率建立联合概率,统计时统计的是条件概率,而非共现概率。由于MEMM只在局部做归一化,MEMM容易陷入局部最优。
条件随机场算法(conditional random field algorithm,CRF):是一种数学算法;结合了最大熵模型和隐马尔可夫模型的特点,是一种无向图模型,近年来在分词、词性标注和命名实体识别等序列标注任务中取得了很好的效果。条件随机场是一个典型的判别式模型,其联合概率可以写成若干势函数联乘的形式,其中最常用的是线性链条件随机场。若让x=(x1,x2,…xn)表示被观察的输入数据序列,y=(y1,y2,…yn)表示一个状态序列,在给定一个输入序列的情况下,线性链的CRF模型定义状态序列的联合条件概率为p(y|x)=exp{}(2-14);Z(x)={}(2-15);其中:Z是以观察序列x为条件的概率归一化因子;fj(yi-1,yi,x,i)是一个任意的特征函数。
长短期记忆网络(Long Short-Term Memory,LSTM):是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中,这个重复的结构模块只有一个非常简单的结构,例如一个tanh层。LSTM是一种含有LSTM区块(blocks)或其他的一种类神经网络,文献或其他资料中LSTM区块可能被描述成智能网络单元,因为它可以记忆不定时间长度的数值,区块中有一个gate能够决定input是否重要到能被记住及能不能被输出output。
双向长短时记忆(Bi-directional Long Short-Term Memory,Bi-LSTM):是由前向LSTM与后向LSTM组合而成。在自然语言处理任务中都常被用来建模上下文信息。Bi-LSTM在LSTM的基础上,结合了输入序列在前向和后向两个方向上的信息。对于t时刻的输出,前向LSTM层具有输入序列中t时刻以及之前时刻的信息,而后向LSTM层中具有输入序列中t时刻以及之后时刻的信息。前向LSTM层t时刻的输出记作,后向LSTM层t时刻的输出结果记作,两个LSTM层输出的向量可以使用相加、平均值或连接等方式进行处理。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例可以基于医疗云技术进行与患者之间的智能问诊。其中,医疗云(Medical cloud),是指在云计算、移动技术、多媒体、4G通信、大数据、以及物联网等新技术基础上,结合医疗技术,使用“云计算”来创建医疗健康服务云平台,实现了医疗资源的共享和医疗范围的扩大。因为云计算技术的运用于结合,医疗云提高医疗机构的效率,方便居民就医。像现在医院的预约挂号、电子病历、医保等都是云计算与医疗领域结合的产物,医疗云还具有数据安全、信息共享、动态扩展、布局全局的优势。
基于此,本申请实施例提供一种智能问诊方法、装置、电子设备及存储介质,可以实现智能化地与用户对话问诊,提高了问诊效率。本申请实施例提供的问诊方法可应用于智能诊疗、远程会诊。
本申请实施例提供的问诊方法、装置、电子设备及存储介质,具体通过如下实施例进行说明,首先描述本申请实施例中的智能问诊方法。
本申请实施例提供的智能问诊方法,涉及数字医疗技术领域。本申请实施例提供的智能问诊方法可应用于终端中,也可应用于服务器端中,还可以是运行于终端或服务器端中的软件。在一些实施例中,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等;服务器端可以配置成独立的物理服务器,也可以配置成多个物理服务器构成的服务器集群或者分布式系统,还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN以及大数据和人工智能平台等基础云计算服务的云服务器;软件可以是实现问诊方法的应用等,但并不局限于以上形式。
图1是本申请实施例提供的智能问诊方法的一个可选的流程图,图1中的方法可以包括但不限于包括步骤S101至步骤S107。
步骤S101,获取基本问诊文本;
步骤S102,对基本问诊文本中的实体特征进行特征提取,得到基本问诊参数;
步骤S103,根据基本问诊参数对预设的问诊模板进行筛选,得到候选问诊模板集合;
步骤S104,根据预设的过滤算法对候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板;
步骤S105,根据基本问诊参数确定目标问诊模板上的目标节点及目标节点的有向边;
步骤S106,根据目标节点和有向边构建问诊顺序题目集;
步骤S107,根据问诊顺序题目集进行问诊。
经过以上步骤S101至步骤S107,首先获取患者的基本问诊文本,其中,基本问诊文本可以通过预先设置的前置导诊系统与患者进行基本问答得到,该基本问诊文本为自然语言文本。对基本问诊文本中的实体特征进行特征提取,得到基本问诊参数,其中基本问诊参数包括年龄信息、性别信息及主诉信息等等,需要说明的是,主诉信息主要为患者的当前身体状况、自我不适状况的描述等等。通过对基本问诊文本的特征抽取,缩小了基本问诊文本的数据空间,使得更为方便提取到所需要的基本问诊参数。根据基本问诊参数包括的年龄信息、性别信息以及主诉信息等对预设的问诊模板进行筛选,剔除问诊模板库中与当前问诊需求的相关性较低的问诊模板,得到候选问诊模板集合。具体地,可以根据问诊模板对应的年龄区间、性别要求以及诊断科室等等来确定筛选条件,根据预设的筛选条件与当前患者的年龄信息、性别信息以及主诉信息的匹配关系,剔除掉不相关的问诊模板,将保留下来的问诊模板作为候选问诊模板集合,以便根据候选问诊模板集合进一步对问诊模板进行筛选。例如,根据预设的性别要求对问诊模板进行分类,根据当前患者的性别,选取相同性别的问诊模板;或者,根据主诉信息中包括的关键词(如心脏、胃部、皮肤、脑等等)确定对应的诊断科室,将不属于该诊断科室的问诊模板进行剔除。进而,根据预设的过滤算法对候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板,在这一过程中,可以是通过计算问诊模板与当前患者诉求的相似度或者相关度来确定目标问诊模板,并将目标问诊模板使用在后续的问诊流程中。为了进一步地优化问诊过程,在得到目标问诊模板后,根据基本问诊参数确定目标问诊模板上的目标节点及目标节点的有向边,再根据目标节点和有向边构建问诊顺序题目集,将目标节点对应的问题以及经过目标节点的有向边到达的下一目标节点所对应的问题进行整合,形成问题顺序题目集,最后根据问诊顺序题目集进行问诊,例如,患者可以对问诊顺序题目集中的问题选择答案进行回答,同时,问诊模板系统也能够确定问诊流程中当前停留的目标节点,通过对该目标节点后续的有向边进行计算,确定最优有向边,进而跳转到下一个目标节点,进而,患者对下一目标节点的问题选择答案进行回答,重复这一跳转问答的过程,最终通过和患者的多轮交互能够完成问诊过程中的智能问诊应答。通过对目标问诊模板的目标节点和有向边的识别与确定,能够进一步地优化问诊过程,使得问诊过程中的问诊题目更加贴合当前的问诊需求,实现了智能化地与用户对话问诊,提高了问诊效率。
在一些医学应用场景中,在一种可能的实现方式中,上述数据是医疗数据,如个人健康档案、处方、检查报告等数据。
在一种可能的实现方式中,上述基本问诊文本为医疗文本,医疗文本可以是医疗电子记录(E lectron ic Hea lthcare Record),电子化的个人健康记录,包括病历、心电图、医学影像等一系列具备保存备查价值的电子化记录。
请参阅图2,在一些实施例中,步骤S102可以包括但不限于包括步骤S201至步骤S203:
步骤S201,识别基本问诊文本中的实体特征;
步骤S202,利用预先训练的序列分类器对实体特征进行分类处理;
步骤S203,对分类处理之后的实体特征进行特征提取,得到基本问诊参数。
具体地,在对基本问诊文本中的实体特征进行特征提取时,首先识别基本问诊文本中的实体特征,然后查找构成医学专有名称的文本范围,利用预先训练的序列分类器对该文本范围内的实体特征进行分类处理。在对实体特征进行分类处理时,需要利用预先训练的序列分类器对实体特征进行标记,使得这些实体参数都能够带上预设的标签,以便提高分类效率。需要说明的是,在一些具体实施例中,预先训练的序列分类器可以是最大熵马尔科夫模型(MEMM模型)或者基于条件随机场算法(CRF)的模型或者是基于双向长短时记忆算法(bi-LSTM)的模型。例如,在基于bi-LSTM算法构建序列分类器时,在基于bi-LSTM算法的模型中,输入单词wi和字符嵌入,通过左到右的长短记忆和右向左的长短时记忆,使得在输出被连接的位置生成单一的输出层。序列分类器通过这一输出层可以将输入的实体特征直接传递到softmax分类器上,通过softmax分类器在预设的标签上创建一个概率分布,从而根据概率分布对实体参数进行标记分类,最后对分类处理之后的实体特征进行特征提取,得到基本问诊参数,对基本问诊文本的特征抽取,缩小了基本问诊文本的数据空间,使得更为方便提取到所需要的基本问诊参数,以提高匹配效率。
请参阅图3,在一些实施例中,基本问诊参数包括主诉信息,步骤S104可以包括但不限于包括步骤S301至步骤S304:
步骤S301,利用预先训练的文本自动生成模型对主诉信息以及候选问诊模板集合中的问诊模板进行处理,生成主诉文本串和问诊模板文本串;
步骤S302,分别对主诉文本串和问诊模板文本串进行编码处理,得到编码形式的主诉文本串和编码形式的问诊模板文本串;
步骤S303,计算编码形式的主诉文本串与每一编码形式的问诊模板文本串的相似度;
步骤S304,根据所有相似度之间的大小关系以及相似度与预设的相似度阈值的大小关系,得到目标问诊模板。
具体地,该预先训练的文本自动生成模型可以是基于关键词的文本自动生成模型,该文本自动生成模型可以根据输入数据的类型,进行不同的数据处理。将主诉信息、问诊模板中的关键词或者文本语句或者字段等等输入至预先训练的文本自动生成模型,若输入的关键词、文本语句或者字段与预设的参考文本能够进行匹配,表明当前输入符合要求,若当前输入的是关键词,则在基础语料库中选择和输入关键词相同的语句集合,根据这一语句集合生成对应的文本串。若当前输入的是文本语句或字段,则需要在基础语料库中选取候选语句,并确定选取的候选语句是否符合要求;其中,候选语句为基础语料库中与输入的文本语句或字段相似度大于预设阈值的语句,若选取的候选语句符合要求,则根据候选语句直接生成文本串;若选取的候选语句不符合要求,则对候选语句进行语句补充,例如,填充同义词、或者根据对应的输入信息对候选语句进行复写补充等等,并根据补充之后的候选语句生成文本串。通过这一方式能够较为方便地对主诉信息以及候选问诊模板集合中的问诊模板进行处理,生成主诉文本串和问诊模板文本串。进一步地,通过预设的编码器分别对主诉文本串和问诊模板文本串进行编码处理,该预设的编码器可以是基于BERT的编码器,即通过获取主诉信息和问诊模板,并对主诉信息和问诊模板进行令牌化处理,构建出BERT令牌生成器,对BERT令牌生成器进行预训练,形成符合需求的BERT编码器,使得BERT编码器能够通过预设的编码函数将主诉文本串和问诊模板文本串由文本形式转化为编码形式,得到编码形式的主诉文本串和编码形式的问诊模板文本串。进而,通过协同过滤算法计算编码形式的主诉文本串与每一编码形式的问诊模板文本串的相似度大小。需要说明的是,该协同过滤算法可以是杰卡德相似系数法、夹角余弦法或者欧式距离、曼哈顿距离等相似性度量方法,不做限制。最后通过比较所有相似度之间的大小以及每一相似度与预设相似度阈值的大小,得到目标问诊模板。这一方式缩短了问诊模板的筛选时间,也提高了选定的问诊模板与当前问诊需求的匹配性。
请参阅图4,在一些实施例中,步骤S304可以包括但不限于包括步骤S401至步骤S402:
步骤S401,根据所有相似度之间的大小关系,确定相似度最高的问诊模板;
步骤S402,若相似度最高的问诊模板的相似度大于等于预设的相似度阈值,则将相似度最高的问诊模板作为目标问诊模板
具体地,为了提高问诊模板与当前问诊需求的匹配度,通过协同过滤算法计算编码形式的主诉文本串与每一编码形式的问诊模板文本串的相似度,比较编码形式的主诉文本串与每一编码形式的问诊模板文本串的相似度之间的大小关系,确定相似度最高的问诊模板;进一步地,为了使得配置的问诊模板与当前问诊需求更为准确地匹配,还可以通过比较相似度最高的问诊模板的相似度与预设的相似度阈值的大小,确定是否将相似度最高的问诊模板用于问诊,例如,若相似度最高的问诊模板的相似度大于等于预设的相似度阈值,表明该相似度最高的问诊模板与当前问诊需要较为匹配,能够符合问诊要求,则将相似度最高的问诊模板作为目标问诊模板。这一方式缩短了问诊模板的筛选时间,也提高了选定的问诊模板与当前问诊需求的匹配性。
请参阅图5,在一些实施例中,步骤S304还可以包括但不限于包括步骤S501至步骤S502:
步骤S501,根据所有相似度之间的大小关系,确定相似度最高的问诊模板;
步骤S502,若相似度最高的问诊模板的相似度小于预设的相似度阈值,则获取预设的参考问诊模板,并将预设的参考问诊模板作为目标问诊模板。
为了使得问诊流程能够顺利进行,通过协同过滤算法计算编码形式的主诉文本串与每一编码形式的问诊模板文本串的相似度,比较编码形式的主诉文本串与每一编码形式的问诊模板文本串的相似度之间的大小关系,确定相似度最高的问诊模板之后,比较相似度最高的问诊模板的相似度与预设的相似度阈值的大小,若相似度最高的问诊模板的相似度小于预设的相似度阈值,表明该相似度最高的问诊模板与当前问诊的匹配性较差,不能够符合问诊要求,则获取参考问诊模板,并将预设的参考问诊模板作为目标问诊模板。具体地,当根据性别信息、年龄信息以及主诉信息等确定没有能够匹配的问诊模板(即候选问诊模板集合为空)或者相似度最高的问诊模板与当前问诊需求的匹配度较低,则需要采取其他方式实现问诊,例如,可以是获取预先设定的参考问诊模板,将参考问诊模板作为目标问诊模板,即根据参考问诊模板构建对应的参考问诊顺序题目集,从而根据参考问诊顺序题目集进行问诊;也可以是在确定没有能够匹配的问诊模板或者相似度最高的问诊模板与当前问诊需求的匹配度较低时,提示转入人工问诊模式,通过医生与患者进行面对面问诊,使得问诊流程顺利进行,提高问诊质量。
请参阅图6,在一些实施例的步骤S105可以包括但不限于包括步骤S601至步骤S604:
步骤S601,根据基本问诊参数,确定目标问诊模板上的目标节点;
步骤S602,获取目标节点的每一有向边的脚本数据;
步骤S603,根据脚本数据,计算每一有向边的权重;
步骤S604,根据每一有向边的权重大小,确定目标节点的有向边。
在一些实施例中,由于已经获取到主诉信息、年龄信息以及性别信息,对于目标问诊模板上收集相同信息的节点可以跳过,将节点中未收集到问答信息的节点作为目标节点,进而根据有向图的节点先后顺序,可以确定每一目标节点对应的有向边。进而,获取目标节点的每一有向边的脚本数据(如groovy脚本等等)以及该目标节点的上下文信息,其中,该上下文信息包含患者历史选择的选项答案。根据脚本数据和上下文信息对目标节点的每一有向边进行解析计算,得到每一有向边的权重。具体地,利用预设的赋值函数(如add_weighted_edges_from函数)给每一有向边赋予初始权重,根据脚本数据和上下文信息对初始权重进行修改调整,利用get_edge_data函数读取每一有向边的修改后的权重,比较目标节点上的每一有向边的修改后的权重大小,将权重最高的有向边作为目标节点的最优有向边,通过该最优有向边确定下一目标节点的位置,进而通过权重计算确定下一目标节点的最优有向边。在当前的问诊模板对应的有向图内重复这一操作,通过这些目标节点和最优有向边能够得到目标节点的先后顺序,根据目标节点先后顺序以及每一目标节点的节点信息,构建出符合当前问诊需求的问诊顺序题目集,通过该问诊顺序题目集进行问诊,这一方式通过对目标问诊模板的目标节点和有向边的识别与确定,能够进一步地优化问诊过程,使得问诊过程中的问诊题目更加贴合当前的问诊需求,实现了智能化地与用户对话问诊,提高了问诊效率。
请参阅图7,在一些实施例中,步骤S107可以包括但不限于包括步骤S701至步骤S702:
步骤S701,抽取目标节点的属性信息;
步骤S702,根据属性信息对用户端在目标节点反馈的问答数据进行格式组装,得到文本数据;文本数据用于用户进行问答交互。
在一些实施例中,为了及时反馈问诊数据,还需要根据实际需求,抽取目标节点的属性信息。根据目标节点的属性信息,对用户端在目标节点反馈的问答数据进行格式组装,得到文本数据。将文本数据反馈显示给用户以便用户进行问答交互。例如,对外部动态调用节点获取到的数据进行问题和选项信息后包装成文本节点的格式展示给用户,等待用户进行下一轮交互。用户通过问诊模板上一步返回的问答信息,可以对问诊顺序题目集中的问题选择答案进行回答,同时,问诊模板系统也能够确定问诊流程中当前停留的目标节点,通过对该目标节点后续的有向边进行计算,确定最优有向边,进而跳转到下一个目标节点,并对下一目标节点的问题选择答案进行回答,重复这一跳转问答的过程。最终通过和用户的多轮交互最终能够完成问诊过程中的问答交互。
本申请实施例通过获取基本问诊文本,对基本问诊文本中的实体特征进行特征提取,得到基本问诊参数,这一方式能够实现对基本问诊文本的特征抽取,缩小基本问诊文本的数据空间,使得更为方便提取到所需要的基本问诊参数;进而根据基本问诊参数包括的年龄信息、性别信息以及主诉信息等对预设的问诊模板进行筛选,得到候选问诊模板集合,剔除了与当前问诊需求的相关性较低的问诊模板。这样一来,便可进一步地根据预设的过滤算法对候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板,这一方式缩短了问诊模板的筛选时间,也提高了选定的问诊模板与当前问诊需求的匹配性。在得到目标问诊模板后,根据基本问诊参数确定目标问诊模板上的目标节点及目标节点的有向边,再根据目标节点和有向边构建问诊顺序题目集,最后根据问诊顺序题目集进行问诊。通过对目标问诊模板的目标节点和有向边的识别与确定,能够进一步地优化问诊过程,使得问诊过程中的问诊题目更加贴合当前的问诊需求,实现了智能化地与用户对话问诊,提高了问诊效率。
请参阅图8,本申请实施例还提供一种智能问诊装置,可以实现上述智能问诊方法,该装置包括:
基本问诊文本获取模块801,用于获取基本问诊文本;
实体特征提取模块802,用于对基本问诊文本中的实体特征进行特征提取,得到基本问诊参数;
筛选模块803,用于根据基本问诊参数对预设的问诊模板进行筛选,得到候选问诊模板集合;
目标问诊模板确定模块804,用于根据预设的过滤算法对候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板;
目标节点及有向边确定模块805,用于根据基本问诊参数确定目标问诊模板上的目标节点及目标节点的有向边;
问诊顺序题目集构建模块806,用于根据目标节点和有向边构建问诊顺序题目集;
问诊模块807,用于根据问诊顺序题目集进行问诊。
在一些具体实施例中,实体特征提取模块802在对基本问诊文本中的实体特征进行特征提取,得到基本问诊参数时,主要用于识别基本问诊文本中的实体特征;利用预先训练的序列分类器对实体特征进行分类处理;对分类处理之后的实体特征进行特征提取,得到基本问诊参数。
在一些具体实施例中,目标问诊模板确定模块804在对基本问诊文本中的实体特征进行特征提取,得到基本问诊参数时,主要用于利用预先训练的文本自动生成模型对主诉信息以及候选问诊模板集合中的问诊模板进行处理,生成主诉文本串和问诊模板文本串;分别对主诉文本串和问诊模板文本串进行编码处理,得到编码形式的主诉文本串和编码形式的问诊模板文本串;计算编码形式的主诉文本串与每一编码形式的问诊模板文本串的相似度;根据所有相似度之间的大小关系以及相似度与预设的相似度阈值的大小关系,得到目标问诊模板。。其中,在根据所有相似度之间的大小关系以及相似度与预设的相似度阈值的大小关系,得到目标问诊模板。时,可以根据所有相似度之间的大小关系,确定相似度最高的问诊模板;若相似度最高的问诊模板的相似度大于等于预设的相似度阈值,则将相似度最高的问诊模板作为目标问诊模板。若相似度最高的问诊模板的相似度小于预设的相似度阈值,则获取预设的参考问诊模板,并将预设的参考问诊模板作为目标问诊模板。
在另一具体实施例中,目标节点及有向边确定模块805在根据基本问诊参数确定目标问诊模板上的目标节点及目标节点的有向边时,主要用于根据基本问诊参数,确定目标问诊模板上的目标节点;获取目标节点的每一有向边的脚本数据;根据脚本数据,计算每一有向边的权重;根据每一有向边的权重大小,确定目标节点的有向边。
在另一具体实施例中,问诊模块807在根据问诊顺序题目集进行问诊时,主要用于抽取目标节点的属性信息;根据属性信息对用户端在目标节点反馈的问答数据进行格式组装,得到文本数据;文本数据用于用户进行问答交互。
本申请实施例还提供了一种电子设备,电子设备包括:存储器、处理器、存储在存储器上并可在处理器上运行的程序以及用于实现处理器和存储器之间的连接通信的数据总线,程序被处理器执行时实现上述智能问诊方法。该电子设备可以为包括平板电脑、车载电脑等任意智能终端。
请参阅图9,图9示意了另一实施例的电子设备的硬件结构,电子设备包括:
处理器901,可以采用通用的CPU(CentralProcessingUnit,中央处理器)、微处理器、应用专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请实施例所提供的技术方案;
存储器902,可以采用只读存储器(ReadOnlyMemory,ROM)、静态存储设备、动态存储设备或者随机存取存储器(RandomAccessMemory,RAM)等形式实现。存储器902可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器902中,并由处理器901来调用执行本申请实施例的问诊方法;
输入/输出接口903,用于实现信息输入及输出;
通信接口904,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信;和
总线905,在设备的各个组件(例如处理器901、存储器902、输入/输出接口903和通信接口904)之间传输信息;
其中处理器901、存储器902、输入/输出接口903和通信接口904通过总线905实现彼此之间在设备内部的通信连接。
本申请实施例还提供了一种计算机可读存储介质,用于计算机可读存储,计算机可读存储介质存储有一个或者多个程序,一个或者多个程序可被一个或者多个处理器执行,以实现上述智能问诊方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本领域技术人员可以理解的是,图1-7中示出的技术方案并不构成对本申请实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例的方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-On ly Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序的介质。
以上参照附图说明了本申请实施例的优选实施例,并非因此局限本申请实施例的权利范围。本领域技术人员不脱离本申请实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本申请实施例的权利范围之内。
Claims (8)
1.一种智能问诊方法,其特征在于,所述方法包括:
获取基本问诊文本;
对所述基本问诊文本中的实体特征进行特征提取,得到基本问诊参数;
根据所述基本问诊参数对预设的问诊模板进行筛选,得到候选问诊模板集合;
根据预设的过滤算法对所述候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板;
根据所述基本问诊参数确定所述目标问诊模板上的目标节点及所述目标节点的有向边;
根据所述目标节点和所述有向边构建问诊顺序题目集;
根据所述问诊顺序题目集进行问诊;
所述基本问诊参数包括主诉信息,所述根据预设的过滤算法对所述候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板的步骤,包括:
利用预先训练的文本自动生成模型对所述主诉信息以及所述候选问诊模板集合中的问诊模板进行处理,生成主诉文本串和问诊模板文本串;
分别对所述主诉文本串和所述问诊模板文本串进行编码处理,得到编码形式的主诉文本串和编码形式的问诊模板文本串;
计算所述编码形式的主诉文本串与每一所述编码形式的问诊模板文本串的相似度;
根据所有所述相似度之间的大小关系以及所述相似度与预设的相似度阈值的大小关系,得到目标问诊模板;
所述根据基本问诊参数确定所述目标问诊模板上的目标节点及所述目标节点的有向边的步骤,包括:
根据所述基本问诊参数,确定所述目标问诊模板上的目标节点;
获取所述目标节点的每一有向边的脚本数据;
根据所述脚本数据,计算每一有向边的权重;
根据每一有向边的权重大小,确定所述目标节点的有向边。
2.根据权利要求1所述的智能问诊方法,其特征在于,所述对所述基本问诊文本中的实体特征进行特征提取,得到基本问诊参数的步骤,包括:
识别所述基本问诊文本中的实体特征;
利用预先训练的序列分类器对所述实体特征进行分类处理;
对分类处理之后的实体特征进行特征提取,得到基本问诊参数。
3.根据权利要求1所述的智能问诊方法,其特征在于,所述根据所有所述相似度之间的大小关系以及所述相似度与预设的相似度阈值的大小关系,得到目标问诊模板的步骤,包括:
根据所有所述相似度之间的大小关系,确定相似度最高的问诊模板;
若所述相似度最高的问诊模板的相似度大于等于预设的相似度阈值,则将所述相似度最高的问诊模板作为目标问诊模板。
4.根据权利要求1所述的智能问诊方法,其特征在于,所述根据所有所述相似度之间的大小关系以及所述相似度与预设的相似度阈值的大小关系,得到目标问诊模板的步骤,还包括:
根据所有所述相似度之间的大小关系,确定相似度最高的问诊模板;
若所述相似度最高的问诊模板的相似度小于预设的相似度阈值,则获取预设的参考问诊模板,并将所述预设的参考问诊模板作为目标问诊模板。
5.根据权利要求1至4任一项所述的智能问诊方法,其特征在于,所述根据所述问诊顺序题目集进行问诊的步骤,包括:
抽取所述目标节点的属性信息;
根据所述属性信息对用户端在所述目标节点反馈的问答数据进行格式组装,得到文本数据;所述文本数据用于用户进行问答交互。
6.一种智能问诊装置,其特征在于,所述装置包括:
基本问诊文本获取模块,用于获取基本问诊文本;
实体特征提取模块,用于对所述基本问诊文本中的实体特征进行特征提取,得到基本问诊参数;
筛选模块,用于根据所述基本问诊参数对预设的问诊模板进行筛选,得到候选问诊模板集合;
目标问诊模板确定模块,用于根据预设的过滤算法对所述候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板;
目标节点及有向边确定模块,用于根据所述基本问诊参数确定所述目标问诊模板上的目标节点及所述目标节点的有向边;
问诊顺序题目集构建模块,用于根据所述目标节点和所述有向边构建问诊顺序题目集;
问诊模块,用于根据所述问诊顺序题目集进行问诊;
所述基本问诊参数包括主诉信息,所述根据预设的过滤算法对所述候选问诊模板集合中的问诊模板进行过滤处理,得到目标问诊模板,包括:
利用预先训练的文本自动生成模型对所述主诉信息以及所述候选问诊模板集合中的问诊模板进行处理,生成主诉文本串和问诊模板文本串;
分别对所述主诉文本串和所述问诊模板文本串进行编码处理,得到编码形式的主诉文本串和编码形式的问诊模板文本串;
计算所述编码形式的主诉文本串与每一所述编码形式的问诊模板文本串的相似度;
根据所有所述相似度之间的大小关系以及所述相似度与预设的相似度阈值的大小关系,得到目标问诊模板;
所述根据基本问诊参数确定所述目标问诊模板上的目标节点及所述目标节点的有向边,包括:
根据所述基本问诊参数,确定所述目标问诊模板上的目标节点;
获取所述目标节点的每一有向边的脚本数据;
根据所述脚本数据,计算每一有向边的权重;
根据每一有向边的权重大小,确定所述目标节点的有向边。
7.一种电子设备,其特征在于,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现如权利要求1至5任一项所述的智能问诊方法的步骤。
8.一种计算机可读存储介质,用于计算机可读存储,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1至5中任一项所述的智能问诊方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111007751.2A CN113704428B (zh) | 2021-08-30 | 2021-08-30 | 智能问诊方法、装置、电子设备及存储介质 |
PCT/CN2022/087527 WO2023029501A1 (zh) | 2021-08-30 | 2022-04-19 | 智能问诊方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111007751.2A CN113704428B (zh) | 2021-08-30 | 2021-08-30 | 智能问诊方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113704428A CN113704428A (zh) | 2021-11-26 |
CN113704428B true CN113704428B (zh) | 2023-10-24 |
Family
ID=78657086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111007751.2A Active CN113704428B (zh) | 2021-08-30 | 2021-08-30 | 智能问诊方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113704428B (zh) |
WO (1) | WO2023029501A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704428B (zh) * | 2021-08-30 | 2023-10-24 | 康键信息技术(深圳)有限公司 | 智能问诊方法、装置、电子设备及存储介质 |
CN114579723A (zh) * | 2022-03-02 | 2022-06-03 | 平安科技(深圳)有限公司 | 问诊方法和装置、电子设备及存储介质 |
CN114566295A (zh) * | 2022-03-04 | 2022-05-31 | 康键信息技术(深圳)有限公司 | 线上问诊方法、装置、设备及存储介质 |
CN116052907A (zh) * | 2022-12-16 | 2023-05-02 | 北京邮电大学 | 问诊方法、装置及电子设备 |
CN116779087B (zh) * | 2023-08-18 | 2023-11-07 | 江苏臻云技术有限公司 | 一种基于ai引擎的自动化数据管理系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN110019820A (zh) * | 2019-03-28 | 2019-07-16 | 云知声(上海)智能科技有限公司 | 一种病历中主诉与现病史症状时间一致性检测方法 |
CN112287080A (zh) * | 2020-10-23 | 2021-01-29 | 平安科技(深圳)有限公司 | 问题语句的改写方法、装置、计算机设备和存储介质 |
CN112445903A (zh) * | 2020-11-26 | 2021-03-05 | 北京沃东天骏信息技术有限公司 | 确定输出内容的方法、设备及存储介质 |
CN113127621A (zh) * | 2021-04-28 | 2021-07-16 | 平安国际智慧城市科技股份有限公司 | 对话模块的推送方法、装置、设备及存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10699215B2 (en) * | 2016-11-16 | 2020-06-30 | International Business Machines Corporation | Self-training of question answering system using question profiles |
CN106650261A (zh) * | 2016-12-22 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 智能问诊方法、装置和系统 |
CN109065183B (zh) * | 2018-07-04 | 2024-03-15 | 平安科技(深圳)有限公司 | 问诊对话模板生成及问诊数据获取方法、装置 |
CN109192300A (zh) * | 2018-08-17 | 2019-01-11 | 百度在线网络技术(北京)有限公司 | 智能问诊方法、系统、计算机设备和存储介质 |
US20200152338A1 (en) * | 2018-11-14 | 2020-05-14 | International Business Machines Corporation | Dynamically optimized inquiry process for intelligent health pre-diagnosis |
CN111159369B (zh) * | 2019-12-18 | 2023-12-05 | 平安健康互联网股份有限公司 | 多轮智能问诊方法、装置及计算机可读存储介质 |
CN112309587A (zh) * | 2020-11-26 | 2021-02-02 | 微医云(杭州)控股有限公司 | 线上问诊方法、系统、服务器及存储介质 |
CN112509682A (zh) * | 2020-12-15 | 2021-03-16 | 康键信息技术(深圳)有限公司 | 基于文本识别的问诊方法、装置、设备及存储介质 |
CN113704428B (zh) * | 2021-08-30 | 2023-10-24 | 康键信息技术(深圳)有限公司 | 智能问诊方法、装置、电子设备及存储介质 |
-
2021
- 2021-08-30 CN CN202111007751.2A patent/CN113704428B/zh active Active
-
2022
- 2022-04-19 WO PCT/CN2022/087527 patent/WO2023029501A1/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492077A (zh) * | 2018-09-29 | 2019-03-19 | 北明智通(北京)科技有限公司 | 基于知识图谱的石化领域问答方法及系统 |
CN110019820A (zh) * | 2019-03-28 | 2019-07-16 | 云知声(上海)智能科技有限公司 | 一种病历中主诉与现病史症状时间一致性检测方法 |
CN112287080A (zh) * | 2020-10-23 | 2021-01-29 | 平安科技(深圳)有限公司 | 问题语句的改写方法、装置、计算机设备和存储介质 |
CN112445903A (zh) * | 2020-11-26 | 2021-03-05 | 北京沃东天骏信息技术有限公司 | 确定输出内容的方法、设备及存储介质 |
CN113127621A (zh) * | 2021-04-28 | 2021-07-16 | 平安国际智慧城市科技股份有限公司 | 对话模块的推送方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113704428A (zh) | 2021-11-26 |
WO2023029501A1 (zh) | 2023-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113704428B (zh) | 智能问诊方法、装置、电子设备及存储介质 | |
CN112131350B (zh) | 文本标签确定方法、装置、终端及可读存储介质 | |
CN111680159B (zh) | 数据处理方法、装置及电子设备 | |
Moens | Argumentation mining: How can a machine acquire common sense and world knowledge? | |
CN111897939B (zh) | 视觉对话方法、视觉对话模型的训练方法、装置及设备 | |
WO2023029506A1 (zh) | 病情分析方法、装置、电子设备及存储介质 | |
WO2023029502A1 (zh) | 基于问诊会话构建用户画像的方法、装置、设备和介质 | |
WO2023165012A1 (zh) | 问诊方法和装置、电子设备及存储介质 | |
CN113823412B (zh) | 健康管理计划生成方法、装置、电子设备及存储介质 | |
CN114358007A (zh) | 多标签识别方法、装置、电子设备及存储介质 | |
CN113392179A (zh) | 文本标注方法及装置、电子设备、存储介质 | |
CN114240552A (zh) | 基于深度聚类算法的产品推荐方法、装置、设备及介质 | |
CN116541493A (zh) | 基于意图识别的交互应答方法、装置、设备、存储介质 | |
CN115394393A (zh) | 智能诊疗数据处理方法、装置、电子设备及存储介质 | |
CN110889505B (zh) | 一种图文序列匹配的跨媒体综合推理方法和系统 | |
CN114613462A (zh) | 医疗数据处理方法和装置、电子设备及存储介质 | |
CN114360715A (zh) | 体质辨识方法、装置、电子设备及存储介质 | |
EP3901875A1 (en) | Topic modelling of short medical inquiries | |
CN116702743A (zh) | 文本相似度检测方法和装置、电子设备及存储介质 | |
CN116956925A (zh) | 电子病历命名实体识别方法和装置、电子设备及存储介质 | |
CN117373591A (zh) | 电子病历的疾病识别方法和装置、电子设备及存储介质 | |
CN116844731A (zh) | 疾病分类方法、疾病分类装置、电子设备及存储介质 | |
CN116628207A (zh) | 文本分类模型的训练方法和装置、电子设备及存储介质 | |
CN116741396A (zh) | 文章归类方法和装置、电子设备和存储介质 | |
CN115795007A (zh) | 智能问答方法、智能问答装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |