CN116721770A - 基于多轮对话的高血压风险等级评估方法及系统 - Google Patents
基于多轮对话的高血压风险等级评估方法及系统 Download PDFInfo
- Publication number
- CN116721770A CN116721770A CN202310999837.0A CN202310999837A CN116721770A CN 116721770 A CN116721770 A CN 116721770A CN 202310999837 A CN202310999837 A CN 202310999837A CN 116721770 A CN116721770 A CN 116721770A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- text
- model
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 206010020772 Hypertension Diseases 0.000 title claims abstract description 17
- 239000013598 vector Substances 0.000 claims abstract description 140
- 238000012502 risk assessment Methods 0.000 claims abstract description 63
- 230000006870 function Effects 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 12
- 230000015654 memory Effects 0.000 claims description 10
- 238000013459 approach Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 6
- 230000007787 long-term memory Effects 0.000 claims description 6
- 238000003062 neural network model Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 description 7
- 238000013210 evaluation model Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Pathology (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明提供一种基于多轮对话的高血压风险等级评估方法及系统,包括获取用户与智能问答终端的对话信息,将所述对话信息转换为文本信息,并将所述文本信息转换为文本向量;将所述文本向量以及预先获取的用户信息输入预先构建的意图识别模型,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息;将所述意图信息与预先获取的用户信息进行结合,通过预先构建的风险评估模型,确定所述用户对应的风险评估值。
Description
技术领域
本发明涉及人机对话技术,尤其涉及一种基于多轮对话的高血压风险等级评估方法及系统。
背景技术
在传统医疗问答系统中,很少有进行人机交互的。通常是用户在咨询完相关信息后系统就不会再进行对话,并且在传统的人机交互中用户通常是直接就开始与机器进行交互,这样一来用户通常是通过键盘或鼠标等外设来将自己的命令传递给机器人,而这种人机方式操作复杂,效率低下,对于没有使用经验的用户来说,这种传统的人机交互方式成为了用户与机器人进行沟通的障碍。
对话管理控制着人机对话的过程,其根据对话历史信息,决定此刻对用户的反应。最常见的应用是任务驱动的多轮对话,用户需求比较复杂,有很多限制条件,可能需要分多轮进行陈述,一方面,用户在对话过程中可以不断修改或完善自己的需求,另一方面,当用户的陈述的需求不够具体或明确的时候,机器也可以通过询问、澄清或确认来帮助用户找到满意的结果。对话管理器是协调人机交互的中心模块,大致可分为以下几种:
1.基于统计模型的对话管理技:如贝叶斯网络、图模型、基于对话的增强学习技术、部分可观测的马尔科夫决策过程等,使得计算机能够灵活地处理人机对话过程中用户的输入错误。相对于传统的基于规则的对话模型,基于统计模型的对话管理给予了用户较大的自由度,但使得计算复杂度高。
2.采用填槽法实现对话管理。该方法将对话建模成一个填槽的过程。槽是多轮对话过程中将初步用户意图转化为明确用户指令所需要补全的信息。一个槽与一件事情的处理中所需要获取的一种信息相对应。该方法支持混合主导型系统,用户和系统都可以获取对话的主导权。输入相对灵活,用户回答可以包含一个或多个槽位信息。对槽位提取准确度的要求比较高,适用于相对复杂的多轮对话。
3.有限状态机。这种方法通常将对话建模成一棵树或者有限状态机。系统根据用户的输入在有限的状态集合内进行状态跳转并选择下一步输出,如果从开始节点走到了终止节点则任务就完成了。该方法可提前设定好对话流程并由系统主导,建模简单,适用于简单任务。能将用户的回答限定在有限的集合内,但表达能力有限,灵活性不高。
发明内容
本发明实施例提供一种基于多轮对话的高血压风险等级评估方法及系统,至少能够解决现有技术中的部分问题,也即解决现有技术中问答局限性较多,且问答复杂的问题。
本发明实施例的第一方面,
提供一种基于多轮对话的高血压风险等级评估方法,包括:
获取用户与智能问答终端的对话信息,将所述对话信息转换为文本信息,并将所述文本信息转换为文本向量;
将所述文本向量以及预先获取的用户信息输入预先构建的意图识别模型,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息,其中,所述意图识别模型基于双向神经网络构建,用于输出所述意图识别模型的输入信息对应的意图概率;
将所述意图信息与预先获取的用户信息进行结合,通过预先构建的风险评估模型,确定所述用户对应的风险评估值,其中,所述风险评估模型基于神经网络模型构建,用于输出所述风险评估模型的输入信息对应的风险评估值。
在一种可选的实施方式中,
所述将所述文本向量以及预先获取的用户信息输入预先构建的意图识别模型,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息包括:
根据所述文本向量和所述用户信息,通过所述意图识别模型分别按照正向顺序确定所述文本向量对应的文本前向隐藏信息、所述用户信息对应的用户前向隐藏信息,以及按照反向顺序确定所述文本向量对应的文本反向隐藏信息、所述用户信息对应的用户反向隐藏信息,将所述文本前向隐藏信息、所述用户前向隐藏信息、所述文本反向隐藏信息以及所述用户反向隐藏信息作为语义向量组;
根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值;
根据所述语义向量组以及所述语义向量组中每个元素对应的权重值,预测与所述对话信息对应的意图信息。
在一种可选的实施方式中,
所述根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值如下公式所示:
;
其中,Aij表示权重值,N表示语义向量组的数量,hi、hj分别表示语义向量组中第i个元素和第j个元素,similarity()表示相似度函数。
在一种可选的实施方式中,
所述将所述意图信息与预先获取的用户信息进行结合,通过预先构建的风险评估模型,确定所述用户对应的风险评估值包括:
将所述意图信息与预先获取的用户信息进行向量拼接,确定综合向量信息;
将综合向量信息输入训练好的风险评估模型中,得到用户对应的风险评估值;
所述方法还包括训练所述风险评估模型:
将综合向量信息和相应的风险评估值作为目标标签;
定义损失函数,用于衡量模型预测结果与真实风险评估值之间的差距;对于回归问题,使用均方差损失函数;对于分类问题,使用交叉熵损失函数;
定义优化器,用于更新模型的权重参数,以减小损失函数的值;
使用训练数据集对模型进行训练,通过反向传播算法更新模型的参数,使模型输出值趋近于拟合训练数据。
在一种可选的实施方式中,
通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息包括:
基于所述对话信息以及所述意图识别模型的特征提取模块中每一卷积层的卷积输出信息,以及所述对话信息经过所述特征提取模块中每一隐藏层的隐藏向量得分;
根据所述隐藏向量得分确定所述对话信息对应的注意力权重值,基于所述注意力权重值以及所述卷积输出信息确定所述对话信息对应的特征信息;
所述确定所述对话信息对应的特征信息如下公式所示:
;
其中,Ht表示t时刻的特征信息,T表示总时长,表示t时刻卷积模块中第s层对应的卷积输出信息,WCS、WlS分别表示卷积模块和长短期记忆模块对应的权重,/>、/>分别表示t-1时刻长短期记忆模块和卷积模块对应的输出。
本发明实施例的第二方面,
提供一种基于多轮对话的高血压风险等级评估系统,包括:
第一单元,用于获取用户与智能问答终端的对话信息,将所述对话信息转换为文本信息,并将所述文本信息转换为文本向量;
第二单元,用于将所述文本向量以及预先获取的用户信息输入预先构建的意图识别模型,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息,其中,所述意图识别模型基于双向神经网络构建,用于输出所述意图识别模型的输入信息对应的意图概率;
第三单元,用于将所述意图信息与预先获取的用户信息进行结合,通过预先构建的风险评估模型,确定所述用户对应的风险评估值,其中,所述风险评估模型基于神经网络模型构建,用于输出所述风险评估模型的输入信息对应的风险评估值。
在一种可选的实施方式中,
所述第二单元还用于:
根据所述文本向量和所述用户信息,通过所述意图识别模型分别按照正向顺序确定所述文本向量对应的文本前向隐藏信息、所述用户信息对应的用户前向隐藏信息,以及按照反向顺序确定所述文本向量对应的文本反向隐藏信息、所述用户信息对应的用户反向隐藏信息,将所述文本前向隐藏信息、所述用户前向隐藏信息、所述文本反向隐藏信息以及所述用户反向隐藏信息作为语义向量组;
根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值;
根据所述语义向量组以及所述语义向量组中每个元素对应的权重值,预测与所述对话信息对应的意图信息。
在一种可选的实施方式中,
所述第二单元还用于:
根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值如下公式所示:
;
其中,Aij表示权重值,N表示语义向量组的数量,hi、hj分别表示语义向量组中第i个元素和第j个元素,similarity()表示相似度函数。
在一种可选的实施方式中,
所述第三单元还用于:
将所述意图信息与预先获取的用户信息进行向量拼接,确定综合向量信息;
将综合向量信息输入训练好的风险评估模型中,得到用户对应的风险评估值;
所述方法还包括训练所述风险评估模型:
将综合向量信息和相应的风险评估值作为目标标签;
定义损失函数,用于衡量模型预测结果与真实风险评估值之间的差距;对于回归问题,使用均方差损失函数;对于分类问题,使用交叉熵损失函数;
定义优化器,用于更新模型的权重参数,以减小损失函数的值;
使用训练数据集对模型进行训练,通过反向传播算法更新模型的参数,使模型输出值趋近于拟合训练数据。
在一种可选的实施方式中,
所述第二单元还用于:
基于所述对话信息以及所述意图识别模型的特征提取模块中每一卷积层的卷积输出信息,以及所述对话信息经过所述特征提取模块中每一隐藏层的隐藏向量得分;
根据所述隐藏向量得分确定所述对话信息对应的注意力权重值,基于所述注意力权重值以及所述卷积输出信息确定所述对话信息对应的特征信息;
所述确定所述对话信息对应的特征信息如下公式所示:
;
其中,Ht表示t时刻的特征信息,T表示总时长,表示t时刻卷积模块中第s层对应的卷积输出信息,WCS、WlS分别表示卷积模块和长短期记忆模块对应的权重,/>、/>分别表示t-1时刻长短期记忆模块和卷积模块对应的输出。
本发明实施例的第三方面,
提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
本发明实施例的第四方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明将多轮对话与专业的高血压风险评价模型进行结合,通过系统与用户进行友好、亲切的交互,鉴定用户风险等级,并提供专业的指导建议,帮助用户进行健康管理,改善了以往通过量表进行风险测评,信息传递通道单一,对屏幕依赖性强的问题,提升了填槽法交互的自然度。
本申请的系统依据专业的评价模型进行提问,用户根据自身真实的情况进行回答,系统将用户的语音转换为文本,调用相关算法接口,进行分词、词性标注、句法分析等一系列自然语言处理,对文本信息进行语义表示,并通过对话管理来完成所需实体信息的存储,最后将用户信息与模型进行比对,鉴定高血压风险等级,包括量化结果的分数表示和专业的指导建议。
附图说明
图1为本发明实施例基于多轮对话的高血压风险等级评估方法的流程示意图;
图2为本发明实施例基于多轮对话的高血压风险等级评估系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1为本发明实施例基于多轮对话的高血压风险等级评估方法的流程示意图,如图1所示,所述方法包括:
S101. 获取用户与智能问答终端的对话信息,将所述对话信息转换为文本信息,并将所述文本信息转换为文本向量;
示例性地,本申请可以通过Word2Vec和平均池化将对话信息转换为文本向量,
用gensim库中的Word2Vec.load()函数加载预训练的Word2Vec模型,确保将模型文件的路径作为参数传递给load()函数;定义文本向量转换函数,创建一个函数,接受对话信息作为输入,并返回对应的文本向量。在函数中,将对话文本转换为小写并拆分为单词;初始化一个空的向量作为累积器,并设置一个计数器来跟踪有效单词的数量。遍历每个单词:检查单词是否在Word2Vec模型的词汇表中,如果单词存在,将其对应的词向量累加到累积器中,并增加计数器的值;如果计数器不为零,将累积器中的向量除以计数器的值,以获得平均向量,返回平均向量作为文本向量的表示。
加载对话信息并应用文本向量转换函数:从文本文件或其他来源中加载对话信息,逐行读取对话信息并将其传递给文本向量转换函数;将函数返回的文本向量存储在一个列表或其他数据结构中。
可使用文本向量进行进一步的分析或任务:将文本向量用于聚类、分类、相似度计算或其他机器学习任务;可根据需要调整文本向量的形状或规模,或应用其他技术来增强表示能力。
S102. 将所述文本向量以及预先获取的用户信息输入预先构建的意图识别模型,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息,其中,所述意图识别模型基于双向神经网络构建,用于输出所述意图识别模型的输入信息对应的意图概率;
示例性地,本申请的意图识别模型可以基于双向LSTM(Long short-term memory,长短期记忆)模型构建,能够确定输入信息的隐藏状态信息。
在一种可选的实施方式中,
所述将所述文本向量以及预先获取的用户信息输入预先构建的意图识别模型,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息包括:
根据所述文本向量和所述用户信息,通过所述意图识别模型分别按照正向顺序确定所述文本向量对应的文本前向隐藏信息、所述用户信息对应的用户前向隐藏信息,以及按照反向顺序确定所述文本向量对应的文本反向隐藏信息、所述用户信息对应的用户反向隐藏信息,将所述文本前向隐藏信息、所述用户前向隐藏信息、所述文本反向隐藏信息以及所述用户反向隐藏信息作为语义向量组;
根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值;
根据所述语义向量组以及所述语义向量组中每个元素对应的权重值,预测与所述对话信息对应的意图信息。
在一种可选的实施方式中,
所述根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值如下公式所示:
;
其中,Aij表示权重值,N表示语义向量组的数量,hi、hj分别表示语义向量组中第i个元素和第j个元素,similarity()表示相似度函数。
在一种可选的实施方式中,
通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息包括:
基于所述对话信息以及所述意图识别模型的特征提取模块中每一卷积层的卷积输出信息,以及所述对话信息经过所述特征提取模块中每一隐藏层的隐藏向量得分;
根据所述隐藏向量得分确定所述对话信息对应的注意力权重值,基于所述注意力权重值以及所述卷积输出信息确定所述对话信息对应的特征信息;
所述确定所述对话信息对应的特征信息如下公式所示:
;
其中,Ht表示t时刻的特征信息,T表示总时长,表示t时刻卷积模块中第s层对应的卷积输出信息,WCS、WlS分别表示卷积模块和长短期记忆模块对应的权重,/>、/>分别表示t-1时刻长短期记忆模块和卷积模块对应的输出。
S103. 将所述意图信息与预先获取的用户信息进行结合,通过预先构建的风险评估模型,确定所述用户对应的风险评估值,其中,所述风险评估模型基于神经网络模型构建,用于输出所述风险评估模型的输入信息对应的风险评估值。
在一种可选的实施方式中,
所述将所述意图信息与预先获取的用户信息进行结合,通过预先构建的风险评估模型,确定所述用户对应的风险评估值包括:
将所述意图信息与预先获取的用户信息进行向量拼接,确定综合向量信息;
将综合向量信息输入训练好的风险评估模型中,得到用户对应的风险评估值;
所述方法还包括训练所述风险评估模型:
将综合向量信息和相应的风险评估值作为目标标签;
定义损失函数,用于衡量模型预测结果与真实风险评估值之间的差距;对于回归问题,使用均方差损失函数;对于分类问题,使用交叉熵损失函数;
定义优化器,用于更新模型的权重参数,以减小损失函数的值;
使用训练数据集对模型进行训练,通过反向传播算法更新模型的参数,使模型输出值趋近于拟合训练数据。
本发明实施例的第二方面,
提供一种基于多轮对话的高血压风险等级评估系统,图2为本发明实施例基于多轮对话的高血压风险等级评估系统的结构示意图,包括:
第一单元,用于获取用户与智能问答终端的对话信息,将所述对话信息转换为文本信息,并将所述文本信息转换为文本向量;
第二单元,用于将所述文本向量以及预先获取的用户信息输入预先构建的意图识别模型,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息,其中,所述意图识别模型基于双向神经网络构建,用于输出所述意图识别模型的输入信息对应的意图概率;
第三单元,用于将所述意图信息与预先获取的用户信息进行结合,通过预先构建的风险评估模型,确定所述用户对应的风险评估值,其中,所述风险评估模型基于神经网络模型构建,用于输出所述风险评估模型的输入信息对应的风险评估值。
在一种可选的实施方式中,
所述第二单元还用于:
根据所述文本向量和所述用户信息,通过所述意图识别模型分别按照正向顺序确定所述文本向量对应的文本前向隐藏信息、所述用户信息对应的用户前向隐藏信息,以及按照反向顺序确定所述文本向量对应的文本反向隐藏信息、所述用户信息对应的用户反向隐藏信息,将所述文本前向隐藏信息、所述用户前向隐藏信息、所述文本反向隐藏信息以及所述用户反向隐藏信息作为语义向量组;
根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值;
根据所述语义向量组以及所述语义向量组中每个元素对应的权重值,预测与所述对话信息对应的意图信息。
在一种可选的实施方式中,
所述第二单元还用于:
根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值如下公式所示:
;
其中,Aij表示权重值,N表示语义向量组的数量,hi、hj分别表示语义向量组中第i个元素和第j个元素,similarity()表示相似度函数。
在一种可选的实施方式中,
所述第三单元还用于:
将所述意图信息与预先获取的用户信息进行向量拼接,确定综合向量信息;
将综合向量信息输入训练好的风险评估模型中,得到用户对应的风险评估值;
所述方法还包括训练所述风险评估模型:
将综合向量信息和相应的风险评估值作为目标标签;
定义损失函数,用于衡量模型预测结果与真实风险评估值之间的差距;对于回归问题,使用均方差损失函数;对于分类问题,使用交叉熵损失函数;
定义优化器,用于更新模型的权重参数,以减小损失函数的值;
使用训练数据集对模型进行训练,通过反向传播算法更新模型的参数,使模型输出值趋近于拟合训练数据。
在一种可选的实施方式中,
所述第二单元还用于:
基于所述对话信息以及所述意图识别模型的特征提取模块中每一卷积层的卷积输出信息,以及所述对话信息经过所述特征提取模块中每一隐藏层的隐藏向量得分;
根据所述隐藏向量得分确定所述对话信息对应的注意力权重值,基于所述注意力权重值以及所述卷积输出信息确定所述对话信息对应的特征信息;
所述确定所述对话信息对应的特征信息如下公式所示:
;
其中,Ht表示t时刻的特征信息,T表示总时长,表示t时刻卷积模块中第s层对应的卷积输出信息,WCS、WlS分别表示卷积模块和长短期记忆模块对应的权重,/>、/>分别表示t-1时刻长短期记忆模块和卷积模块对应的输出。
本发明实施例的第三方面,
提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
本发明实施例的第四方面,
提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
本发明可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本发明的各个方面的计算机可读程序指令。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于多轮对话的高血压风险等级评估方法,其特征在于,包括:
获取用户与智能问答终端的对话信息,将所述对话信息转换为文本信息,并将所述文本信息转换为文本向量;
将所述文本向量以及预先获取的用户信息输入预先构建的意图识别模型,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息,其中,所述意图识别模型基于双向神经网络构建,用于输出所述意图识别模型的输入信息对应的意图概率;
将所述意图信息与预先获取的用户信息进行结合,通过预先构建的风险评估模型,确定所述用户对应的风险评估值,其中,所述风险评估模型基于神经网络模型构建,用于输出所述风险评估模型的输入信息对应的风险评估值。
2.根据权利要求1所述的方法,其特征在于,所述将所述文本向量以及预先获取的用户信息输入预先构建的意图识别模型,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息包括:
根据所述文本向量和所述用户信息,通过所述意图识别模型分别按照正向顺序确定所述文本向量对应的文本前向隐藏信息、所述用户信息对应的用户前向隐藏信息,以及按照反向顺序确定所述文本向量对应的文本反向隐藏信息、所述用户信息对应的用户反向隐藏信息,将所述文本前向隐藏信息、所述用户前向隐藏信息、所述文本反向隐藏信息以及所述用户反向隐藏信息作为语义向量组;
根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值;
根据所述语义向量组以及所述语义向量组中每个元素对应的权重值,预测与所述对话信息对应的意图信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值如下公式所示:
;
其中,Aij表示权重值,N表示语义向量组的数量,hi、hj分别表示语义向量组中第i个元素和第j个元素,similarity()表示相似度函数。
4.根据权利要求1所述的方法,其特征在于,所述将所述意图信息与预先获取的用户信息进行结合,通过预先构建的风险评估模型,确定所述用户对应的风险评估值包括:
将所述意图信息与预先获取的用户信息进行向量拼接,确定综合向量信息;
将综合向量信息输入训练好的风险评估模型中,得到用户对应的风险评估值;
所述方法还包括训练所述风险评估模型:
将综合向量信息和相应的风险评估值作为目标标签;
定义损失函数,用于衡量模型预测结果与真实风险评估值之间的差距;对于回归问题,使用均方差损失函数;对于分类问题,使用交叉熵损失函数;
定义优化器,用于更新模型的权重参数,以减小损失函数的值;
使用训练数据集对模型进行训练,通过反向传播算法更新模型的参数,使模型输出值趋近于拟合训练数据。
5.根据权利要求1所述的方法,其特征在于,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息包括:
基于所述对话信息以及所述意图识别模型的特征提取模块中每一卷积层的卷积输出信息,以及所述对话信息经过所述特征提取模块中每一隐藏层的隐藏向量得分;
根据所述隐藏向量得分确定所述对话信息对应的注意力权重值,基于所述注意力权重值以及所述卷积输出信息确定所述对话信息对应的特征信息;
所述确定所述对话信息对应的特征信息如下公式所示:
;
其中,Ht表示t时刻的特征信息,T表示总时长,表示t时刻卷积模块中第s层对应的卷积输出信息,WCS、WlS分别表示卷积模块和长短期记忆模块对应的权重,/>、/>分别表示t-1时刻长短期记忆模块和卷积模块对应的输出。
6.一种基于多轮对话的高血压风险等级评估系统,其特征在于,包括:
第一单元,用于获取用户与智能问答终端的对话信息,将所述对话信息转换为文本信息,并将所述文本信息转换为文本向量;
第二单元,用于将所述文本向量以及预先获取的用户信息输入预先构建的意图识别模型,通过所述意图识别模型对所述文本向量和所述用户信息分配对应的权重值,输出与所述对话信息对应的意图信息,其中,所述意图识别模型基于双向神经网络构建,用于输出所述意图识别模型的输入信息对应的意图概率;
第三单元,用于将所述意图信息与预先获取的用户信息进行结合,通过预先构建的风险评估模型,确定所述用户对应的风险评估值,其中,所述风险评估模型基于神经网络模型构建,用于输出所述风险评估模型的输入信息对应的风险评估值。
7.根据权利要求6所述的系统,其特征在于,所述第二单元还用于:
根据所述文本向量和所述用户信息,通过所述意图识别模型分别按照正向顺序确定所述文本向量对应的文本前向隐藏信息、所述用户信息对应的用户前向隐藏信息,以及按照反向顺序确定所述文本向量对应的文本反向隐藏信息、所述用户信息对应的用户反向隐藏信息,将所述文本前向隐藏信息、所述用户前向隐藏信息、所述文本反向隐藏信息以及所述用户反向隐藏信息作为语义向量组;
根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值;
根据所述语义向量组以及所述语义向量组中每个元素对应的权重值,预测与所述对话信息对应的意图信息。
8.根据权利要求7所述的系统,其特征在于,所述第二单元还用于:
根据所述意图识别模型的注意力机制,为所述语义向量组中每个元素分配对应的权重值如下公式所示:
;
其中,Aij表示权重值,N表示语义向量组的数量,hi、hj分别表示语义向量组中第i个元素和第j个元素,similarity()表示相似度函数。
9.根据权利要求6所述的系统,其特征在于,所述第三单元还用于:
将所述意图信息与预先获取的用户信息进行向量拼接,确定综合向量信息;
将综合向量信息输入训练好的风险评估模型中,得到用户对应的风险评估值;
所述方法还包括训练所述风险评估模型:
将综合向量信息和相应的风险评估值作为目标标签;
定义损失函数,用于衡量模型预测结果与真实风险评估值之间的差距;对于回归问题,使用均方差损失函数;对于分类问题,使用交叉熵损失函数;
定义优化器,用于更新模型的权重参数,以减小损失函数的值;
使用训练数据集对模型进行训练,通过反向传播算法更新模型的参数,使模型输出值趋近于拟合训练数据。
10.根据权利要求6所述的系统,其特征在于,所述第二单元还用于:
基于所述对话信息以及所述意图识别模型的特征提取模块中每一卷积层的卷积输出信息,以及所述对话信息经过所述特征提取模块中每一隐藏层的隐藏向量得分;
根据所述隐藏向量得分确定所述对话信息对应的注意力权重值,基于所述注意力权重值以及所述卷积输出信息确定所述对话信息对应的特征信息;
所述确定所述对话信息对应的特征信息如下公式所示:
;
其中,Ht表示t时刻的特征信息,T表示总时长,表示t时刻卷积模块中第s层对应的卷积输出信息,WCS、WlS分别表示卷积模块和长短期记忆模块对应的权重,/>、/>分别表示t-1时刻长短期记忆模块和卷积模块对应的输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310999837.0A CN116721770A (zh) | 2023-08-10 | 2023-08-10 | 基于多轮对话的高血压风险等级评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310999837.0A CN116721770A (zh) | 2023-08-10 | 2023-08-10 | 基于多轮对话的高血压风险等级评估方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116721770A true CN116721770A (zh) | 2023-09-08 |
Family
ID=87866482
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310999837.0A Pending CN116721770A (zh) | 2023-08-10 | 2023-08-10 | 基于多轮对话的高血压风险等级评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116721770A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117743538A (zh) * | 2023-12-19 | 2024-03-22 | 中国人寿保险股份有限公司山东省分公司 | 实时客服云端数据的管理方法、装置及计算机设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108829667A (zh) * | 2018-05-28 | 2018-11-16 | 南京柯基数据科技有限公司 | 一种基于记忆网络的多轮对话下的意图识别方法 |
CN109635079A (zh) * | 2018-10-25 | 2019-04-16 | 北京中关村科金技术有限公司 | 一种用户意图的确定方法、装置、计算机设备和存储介质 |
CN112489801A (zh) * | 2020-12-04 | 2021-03-12 | 北京睿思昆宁科技有限公司 | 一种确定疾病风险的方法、装置和设备 |
CN114461776A (zh) * | 2022-02-10 | 2022-05-10 | 元保数科(北京)科技有限公司 | 自适应单轮对话和任务型多轮对话的决策方法 |
US11341339B1 (en) * | 2020-05-14 | 2022-05-24 | Amazon Technologies, Inc. | Confidence calibration for natural-language understanding models that provides optimal interpretability |
CN114596962A (zh) * | 2022-03-08 | 2022-06-07 | 浙江禾连健康管理有限公司 | 一种基于问答式问卷的疾病风险评估方法及存储介质 |
US20220199079A1 (en) * | 2020-12-22 | 2022-06-23 | Meta Platforms, Inc. | Systems and Methods for Providing User Experiences on Smart Assistant Systems |
CN114781402A (zh) * | 2022-05-12 | 2022-07-22 | 平安科技(深圳)有限公司 | 问诊意图识别方法、装置、电子设备及可读存储介质 |
-
2023
- 2023-08-10 CN CN202310999837.0A patent/CN116721770A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108829667A (zh) * | 2018-05-28 | 2018-11-16 | 南京柯基数据科技有限公司 | 一种基于记忆网络的多轮对话下的意图识别方法 |
CN109635079A (zh) * | 2018-10-25 | 2019-04-16 | 北京中关村科金技术有限公司 | 一种用户意图的确定方法、装置、计算机设备和存储介质 |
US11341339B1 (en) * | 2020-05-14 | 2022-05-24 | Amazon Technologies, Inc. | Confidence calibration for natural-language understanding models that provides optimal interpretability |
CN112489801A (zh) * | 2020-12-04 | 2021-03-12 | 北京睿思昆宁科技有限公司 | 一种确定疾病风险的方法、装置和设备 |
US20220199079A1 (en) * | 2020-12-22 | 2022-06-23 | Meta Platforms, Inc. | Systems and Methods for Providing User Experiences on Smart Assistant Systems |
CN114461776A (zh) * | 2022-02-10 | 2022-05-10 | 元保数科(北京)科技有限公司 | 自适应单轮对话和任务型多轮对话的决策方法 |
CN114596962A (zh) * | 2022-03-08 | 2022-06-07 | 浙江禾连健康管理有限公司 | 一种基于问答式问卷的疾病风险评估方法及存储介质 |
CN114781402A (zh) * | 2022-05-12 | 2022-07-22 | 平安科技(深圳)有限公司 | 问诊意图识别方法、装置、电子设备及可读存储介质 |
Non-Patent Citations (3)
Title |
---|
WANG TONG 等: "Assistant diagnosis with Chinese electronic medical records based on CNN and BiLSTM with phrase-level and word-level attentions", BMC BIOINFORMATICS, vol. 21, pages 1 - 16, XP021277518, DOI: 10.1186/s12859-020-03554-x * |
朱庆元: "基于深度增强学习的多轮对话系统研究", 万方数据, pages 1 - 70 * |
靳婷: "任务型对话系统中语义理解的应用研究", 中国优秀硕士学位论文全文数据库信息科技辑, pages 35 - 36 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117743538A (zh) * | 2023-12-19 | 2024-03-22 | 中国人寿保险股份有限公司山东省分公司 | 实时客服云端数据的管理方法、装置及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3568852B1 (en) | Training and/or using an encoder model to determine responsive action(s) for natural language input | |
US11315560B2 (en) | Method for conducting dialog between human and computer | |
CN110377916B (zh) | 词预测方法、装置、计算机设备及存储介质 | |
CN110741364A (zh) | 确定自动化助理对话的状态 | |
CN107357775A (zh) | 基于人工智能的循环神经网络的文本纠错方法及装置 | |
US20180232435A1 (en) | Dialogue system, a dialogue method and a method of adapting a dialogue system | |
JP2020537777A (ja) | 発言のユーザ意図を識別するための方法および装置 | |
CN108334496A (zh) | 用于特定领域的人机对话理解方法与系统及相关设备 | |
CN114596844B (zh) | 声学模型的训练方法、语音识别方法及相关设备 | |
CN111026840B (zh) | 文本处理方法、装置、服务器和存储介质 | |
CN109344242B (zh) | 一种对话问答方法、装置、设备及存储介质 | |
WO2022160969A1 (zh) | 基于多轮对话改进的智能客服辅助系统系统和方法 | |
CN110825849A (zh) | 文本信息情感分析方法、装置、介质及电子设备 | |
CN111767384A (zh) | 人机对话的处理方法、装置、设备及存储介质 | |
CN115497465B (zh) | 语音交互方法、装置、电子设备和存储介质 | |
CN116721770A (zh) | 基于多轮对话的高血压风险等级评估方法及系统 | |
CN117453885A (zh) | 提问信息处理方法、装置、设备、存储介质及产品 | |
CN111832699A (zh) | 用于神经网络的计算高效富于表达的输出层 | |
CN111400479A (zh) | 针对多轮对话的问题识别方法和装置 | |
Debatin et al. | Offline Speech Recognition Development | |
CN115689603A (zh) | 用户反馈信息收集方法、装置及用户反馈系统 | |
CN112328774B (zh) | 基于多文档的任务型人机对话任务的实现方法 | |
CN115879958A (zh) | 一种基于大数据的涉外销售话术决策方法及系统 | |
JP7400040B2 (ja) | 多次元対話行為選択のための強化学習エージェント | |
CN117787668B (zh) | 一种基于大语言模型的目标分配方法、装置、电子设备、存储介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230908 |