CN111506723A - 问答响应方法、装置、设备及存储介质 - Google Patents
问答响应方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111506723A CN111506723A CN202010618140.0A CN202010618140A CN111506723A CN 111506723 A CN111506723 A CN 111506723A CN 202010618140 A CN202010618140 A CN 202010618140A CN 111506723 A CN111506723 A CN 111506723A
- Authority
- CN
- China
- Prior art keywords
- question
- model
- information
- training
- sample data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 title claims abstract description 159
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 194
- 238000004458 analytical method Methods 0.000 claims description 28
- 235000019580 granularity Nutrition 0.000 claims description 28
- 230000001364 causal effect Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 14
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 239000000523 sample Substances 0.000 description 126
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 238000007689 inspection Methods 0.000 description 9
- 238000007726 management method Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000007637 random forest analysis Methods 0.000 description 6
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000012706 support-vector machine Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000012417 linear regression Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000013145 classification model Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 241000233805 Phoenix Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及大数据、区块链和人工智能技术领域,提供一种问答响应方法、装置、设备及存储介质,该方法包括:获取用户输入的问题信息,对所述问题信息进行命名实体识别,以获取所述问题信息中的多个关键实体;基于预设的意图识别模型确定所述问题信息所属的意图类型,并根据所述意图类型选取模型训练策略;根据所述多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型;通过所述问答响应模型响应所述问题信息,得到所述问题信息的答案信息。本申请可应用于智慧医疗领域,极大提高了问答响应的准确性。
Description
技术领域
本申请涉及大数据、区块链和人工智能中的自然语言处理的技术领域,尤其涉及一种问答响应方法、装置、设备及存储介质。
背景技术
在大数据及人工智能时代,随着企业在运营等各种环节中的数据爆发性增长,如何科学地从海量的数据中挖掘出关键信息至关重要。例如医疗领域,医院会产生大量的门诊人次数、平均住院日等指标数据,通过合理分析这些指标数据,有利于辅助医院的管理者更高效地进行管理决策。
目前的医院大都拥有数据中心及配套的管理决策支持系统,但现有的管理决策支持系统较为简单,主要是通过BI报表对指标数据进行简单分析或预测,或者由数据挖掘专家预置训练好的决策分析模型,以对指标数据进行简单分析或预测。但是,医院管理领域的多个指标数据,不易于直观观察,且影响因素多,通过静态的BI报表或者决策分析模型所能处理的指标数据特征单一、结构固定,作出的分析结果误差较大,也无法就用户提出的各种类型的问题自动作出准确回答和响应。
发明内容
本申请的主要目的在于提供一种问答响应方法、装置、设备及存储介质,旨在通过大数据和人工智能相关技术手段实现提高自动问答的准确性的功能,可应用于智慧城市的智慧医疗领域,从而推动智慧城市的建设。
第一方面,本申请提供一种问答响应方法,所述问答响应方法包括以下步骤:
获取用户输入的问题信息,对所述问题信息进行命名实体识别,以获取所述问题信息中的多个关键实体;
基于预设的意图识别模型确定所述问题信息所属的意图类型,并根据所述意图类型选取模型训练策略;
根据所述多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型;
通过所述问答响应模型响应所述问题信息,得到所述问题信息的答案信息。
第二方面,本申请还提供一种问答响应装置,所述问答响应装置包括:
实体识别模块,用于获取用户输入的问题信息,对所述问题信息进行命名实体识别,以获取所述问题信息中的多个关键实体;
意图识别模块,用于基于预设的意图识别模型确定所述问题信息所属的意图类型,并根据所述意图类型选取模型训练策略;
模型训练模块,用于根据所述多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型;
答案响应模块,用于通过所述问答响应模型响应所述问题信息,得到所述问题信息的答案信息。
第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上所述的问答响应方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上所述的问答响应方法的步骤。
本申请提供一种问答响应方法、装置、设备及存储介质,本申请通过获取用户输入的问题信息,对问题信息进行命名实体识别,以获取问题信息中的多个关键实体,然后基于预设的意图识别模型确定问题信息所属的意图类型,并根据意图类型选取模型训练策略,再根据多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型,最后通过问答响应模型响应问题信息,从而得到问题信息的答案信息。本申请可以有效克服原有的预先设定训练模型、静态决策的多种弊端,通过灵活选取模型训练策略,使训练好的问答响应模型更贴合问题信息,同时响应得到的答案信息是实时生成的,时效性更强,结果更加准确。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种问答响应方法的流程示意图;
图2为图1中的问答响应方法的子步骤流程示意图;
图3为本申请实施例提供的问答响应结果的示意图;
图4为实施本实施例提供的问答响应方法的一场景示意图;
图5为本申请实施例提供的一种问答响应装置的示意性框图;
图6为图5中的问答响应装置的子装置示意性框图;
图7为本申请实施例提供的一种计算机设备的结构示意性框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,虽然在装置示意图中进行了功能模块的划分,但是在某些情况下,可以以不同于装置示意图中的模块划分。
本申请实施例提供一种问答响应方法、装置、设备及存储介质。其中,该问答响应方法可应用于终端设备或服务器中,该终端设备可以为手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备;该服务器可以为单台的服务器,也可以为由多台服务器组成的服务器集群。以下以该问答响应方法应用于服务器为例进行解释说明。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1,图1为本申请的实施例提供的一种问答响应方法的流程示意图。如图1所示,该问答响应方法包括步骤S101至步骤S104。
步骤S101、获取用户输入的问题信息,对所述问题信息进行命名实体识别,以获取所述问题信息中的多个关键实体。
在一实施例中,终端设备显示一输入界面,用户可以通过该问题输入界面输入问题信息。具体地,该问题输入界面包括有输入框和确定按钮,当用户在输入框中输入文字信息,并点击确定按钮时,终端设备获取用户输入的问题信息,并将用户输入的问题信息发送至服务器,以供服务器基于接收的问题信息执行后续操作。
其中,该问题输入界面还可以包括有一录音控件,当用户触发该录音控件之后,终端设备采集外界环境的音频信息,并通过语音识别技术将该音频信息转化为文字信息,然后将该文字信息作为问题信息发送至服务器,并由服务器将该问题信息存储至存储器或者云端数据库。
可以理解是的,服务器可以直接从存储器或者云端数据库中获取问题信息。示例性地,用户通过控制设备发出问题信息获取指令,服务器在接收到该问题信息获取指令之后,从存储器或者云端数据库中获取问题信息。或者,用户通过控制设备发出问题信息响应请求,该问题信息响应请求携带有问题信息,服务器在接收到该问题信息响应请求之后,直接通过问题信息响应请求获取问题信息,本申请对此不做具体限制。
在一实施例中,获取问题信息之后,服务器查询问答历史记录,该问答历史记录登记有历史响应过的问题信息,历史响应过的问题信息存储于本地或者云端数据库。确定问答历史记录中是否存在与该问题信息相同的历史响应过的问题信息,若存在,则直接调取该历史响应过的问题信息的响应结果,并输出该响应结果,从而无需对模型进行重新训练,提高对问题信息的响应速度。
需要说明的是,为进一步保证上述问题信息的存储私密和安全性,上述问题信息等相关信息还可以存储于一区块链的节点中,本申请的技术方案还可适用于添加其他存储于区块链上的数据文件,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
获取用户输入的问题信息之后,对该问题信息进行命名实体识别,以获取问题信息中的多个关键实体。其中,关键实体包括时间实体、指标名称实体、机构实体、部门实体、地名实体、人名实体等。
例如,用户输入的问题信息为“深圳市第一人民医院心内科近2个月床位数变化的原因是什么”,对该问题信息进行命名实体识别之后,得到多个关键实体。其中,“深圳市第一人民医院”为机构实体、“心内科”为部门实体、“床位数”为指标名称实体、“近2个月”为时间实体。
在一实施例中,通过规则字典和条件随机场(Conditional Random Field-algorithm,CRF)模型对问题信息进行命名实体识别,得到多个关键实体。需要说明的是,规则字典可以由用户自行定义,每个规则字典中记录有多个关键实体。通过规则字典和CRF模型相结合的方式可以更加准确地查找到关键实体。
进一步地,用户可以设置多个规则字典,或者根据规则字典所应用的场景对规则字典进行定义,本申请对此不做具体限制。例如,用户设置的规则字典包括有规则字典A和规则字典B,将医疗领域中专有的关键实体收制于规则字典A,将非医疗领域的生活中常用的关键实体收制于规则字典B。
可以理解的是,也可以采用规则字典和其他类型的命名实体识别(NER)模型,如长短期记忆网络(Long Short-Term Memory,LSTM)模型、通用预训练语言表示(Bidirectional Encoder Representations from Transformers,BERT)模型,或者LSTM模型与CRF模型、BERT模型与CRF模型等模型相结合的方式,来抽取关键实体。在一些实施方式中,也可以仅利用命名实体识别算法,或者命名实体识别模型来识别关键实体,本申请对此不做具体限定。
在一实施例中,对时间实体进行映射更新。具体地,基于正则表达式和CRF模型识别得到问题信息中的时间实体;对识别得到的时间实体进行映射,以获取时间实体对应的日历信息;将该日历信息作为更新后的时间实体。示例性地,时间实体为“近2个月”,假设当前月份为2020年4月,将该时间实体进行映射,则可确定对应的日历信息为“2020年3月-2020年4月”,将该日历信息“2020年3月-2020年4月”作为更新后的时间实体,可以提高关键实体的准确性,并提高后续响应问题信息的准确性。
步骤S102、基于预设的意图识别模型确定所述问题信息所属的意图类型,并根据所述意图类型选取模型训练策略。
服务器基于预先训练好的意图识别模型,对接收到的问题信息进行分类处理,以确定该问题信息所属的意图类型,然后根据问题信息所属的意图类型选取对应的模型训练策略,从而使后续根据模型训练策略得到的问答响应模型更贴合问题信息,提高问答响应模型响应问题信息的准确度。
其中,意图类型包括但不限于描述类意图、预测类意图、原因类意图。需要说明的是,描述类意图包括涉及到描述过去和现在的已知事物的意图,例如,问题信息“深圳市第一人民医院的门诊量现状”的意图类型为描述类意图,或者,“深圳市第一人民医院过去20天的出院人数的情况”的意图类型为描述类意图;预测类意图包括涉及到预测未来趋势和变化的意图,例如,问题信息“深圳市第一人民医院肿瘤科的平均住院日指标未来3个月的变化趋势”的意图类型为预测类意图,或者,“深圳市第一人民医院的门诊量走势情况”的意图类型为预测类意图;原因类意图为涉及问题信息的因果关系的意图,例如,问题信息“深圳市第一人民医院心内科去年收入下降的关键因素是什么”的意图类型为原因类意图,或者,“深圳市第一人民医院的近半年平均住院日主要和哪些因素有关”的意图类型为原因类意图。
在一实施例中,意图类型包括描述类意图、预测类意图和原因类意图中的至少一种,即每个问题信息所属的意图类型可以为一种或多种。例如,问题信息为“深圳市第一人民医院心内科去年的住院人数,以及患者人数下降的关键因素是什么”,该问题信息包括描述类意图和原因类意图。又例如,问题信息为“深圳市第一人民医院的出院人数未来7天的变化趋势是什么,为什么会出现这种变化趋势”,该问题信息包括预测类意图和原因类意图。
在一实施例中,意图识别模型包括SVM支持向量机分类模型;基于预设的意图识别模型确定问题信息所属的意图类型的具体方式包括:将问题信息转化为词向量;将词向量输入SVM支持向量机分类模型,以确定词向量与超平面之间的距离信息;根据该距离信息对问题信息进行意图分类,得到问题信息所属的意图类型。有利地,将问题信息转化为词向量,便于SVM支持向量机分类子模型基于少量的训练语料就可以确定问题信息所属的意图类型,便于该意图识别模型的快速迭代。
具体地,在距离信息位于第一距离范围内时,确定问题信息所属的意图类型为描述类意图;在距离信息位于第二距离范围内时,确定问题信息所属的意图类型为预测类意图;在距离信息位于第三距离范围内时,确定问题信息所属的意图类型为原因类意图。需要说明的是,该第一距离范围、第二距离范围和第三距离范围可根据实际情况进行设置,本申请对此不做具体限定。
可以理解的是,意图识别模型还可以为其他类型的分类模型,例如基于规则的Phoenix Parser模型、基于深度学习算法的LSTM模型、Bi-RNN模型、Bi-LSTM-CRF模型等,本申请对此不做具体限定。
在一实施例中,根据意图类型选取模型训练策略的具体方式包括:当意图类型为预测类意图时,选取第一模型训练策略,第一模型训练策略用于训练对问题信息进行预测分析的问答响应模型;当意图类型为原因类意图时,选取第二模型训练策略,第二模型训练策略用于训练对问题信息进行因果分析的问答响应模型。有利地,根据选取的第一模型训练策略和第二模型训练策略,可以更加贴合地对问题信息进行处理,从而能够更加准确地生成答案信息,有利于更好地辅助决策。
在一实施例中,根据意图类型选取模型训练策略的具体方式包括:确定意图类型是否为预测类意图,当意图类型为预测类意图,选取第一模型训练策略,其中,第一模型训练策略用于训练对问题信息进行预测分析的问答响应模型;若确定意图类型不为预测类意图,则确定意图类型是否为原因类意图,当意图类型为原因类意图时,选取第二模型训练策略,其中,第二模型训练策略用于训练对问题信息进行因果分析的问答响应模型;若确定意图类型不为原因类意图,则确定意图类型是否为描述类意图,当意图类型为描述类意图时,确定预设查询模板,其中,预设查询模板用于在数据库中对描述类意图的问题信息进行查询。可以更加贴合地对问题信息进行处理,从而能够更加准确地生成答案信息。
在一实施例中,预设查询模板包括SQL语句查询模板,通过该SQL语句查询模板和多个关键实体,生成所述问题信息的答案信息。具体地,将多个关键实体输入预先设置好的SQL语句查询模板,得到封装成动态的SQL语句;基于该SQL语句,从数据库中进行查询,得到问题信息的答案信息。其中,SQL语句查询模板中预留有多个槽位,每个槽位与关键实体一一对应。例如,SQL语句查询模板为“Select sum(指标名称) from (指标主题表) wherehosptitalname=(医疗机构) and (时间段)”,()内的值就是需要进一步填充的槽位。
示例性地,问题信息为“深圳市第一人民医院过去20天的出院人数的情况”,确定该问题信息为描述类意图,关键实体包括:出院人数(指标名称)、出院人数表(对应指标主题表)、深圳市第一人民医院(医疗机构)、过去20天(时间段)(如当前时间为4月20号,则映射的时间实体为4月1日-4月20日),将多个关键实体放置入SQL语句查询模板中预留有的多个槽位,生成动态的SQL语句,该SQL语句为“Select sum(出院人数) from(出院人数表)where hosptitalname=(深圳市第一人民医院)and(时间段 in [4月1日-4月20日])”。
步骤S103、根据所述多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型。
选取模型训练策略之后,若该模型训练策略用于确定待训练的问答响应模型,则基于该模型训练策略和多个关键实体,选取问答响应模型,其中,该问答响应模型包括线性回归模型、时间序列模型、灰色系统模型和随机森林模型等;对问答响应模型进行训练操作,以得到训练好的问答响应模型,该训练好的问答响应模型更贴合问题信息,通过该训练好的问答响应模型可以响应得到的答案信息结果更加准确。
在一实施例中,模型训练策略用于确定待训练的问答响应模型和训练样本;如图2所示,步骤S103包括:子步骤S1031至子步骤S1033。
子步骤S1031、根据所述多个关键实体确定待训练的问答响应模型。
其中,获取预先存储的映射关系表,该映射关系表中预存有关键实体与待训练的问答响应模型之间的对应关系;根据预先存储的映射关系表和多个关键实体,确定待训练的问答响应模型。需要说明的是,当存在多个与关键实体存在对应关系的问答响应模型时,随机选取一个问答响应模型作为待训练的问答响应模型,或者根据多个问答响应模型的优先级确定待训练的问答响应模型,本申请对此不做具体限定。
在一实施例中,根据多个关键实体中的指标名称实体,确定待响应的问答主体;根据该问答主体选取待训练的问答响应模型。其中,问答主体可以为指标名称实体中的主体,问答主体与问答响应模型之间的对应关系可事先根据专家经验进行定义,从而提高选取的问答响应模型的准确性,使问答响应模型更贴合关键实体。
示例性地,对于指标名称实体为“平均住院日”,可以确定平均住院日的问答主体为住院日,当问答主体为住院日时,对应的待训练的问答响应模型包括灰色系统模型和随机森林模型,可以随机选取其中的一种问答响应模型,或者选取优先级较高的灰色系统模型作为待训练的问答响应模型。
可以理解的是,设置问答主体与问答响应模型之间的对应关系时,遵循性能优先、简单模型优先的原则。同时,在问答响应模型选择时,也必须使所选择的模型能够满足基本的约束条件,否则就直接舍弃该问答响应模型。例如时间序列模型对的数据的平稳性分布有较高的要求,如果不满足该要求就要舍弃对该时间序列模型的选择。
子步骤S1032、获取样本数据集,并从所述样本数据集中选取训练样本。
通过从数据库中获取多个样本数据,得到样本数据集,并从样本数据集中抽取样本数据作为训练样本。在一些实施例中,从样本数据集中选取训练样本的具体方法可以为:获取历史样本数据,该历史样本数据是根据历史模型训练使用的样本数据得到的;根据历史样本数据,从样本数据集中选取样本数据,得到训练样本。能够收缩搜索空间,减少训练样本搜索的耗时。
在一实施例中,从所述样本数据集中选取训练样本,包括:根据多个关键实体中的时间实体,确定待响应的问题信息的时间长度;根据问题信息的时间长度,确定样本数据集中的样本数据的时间区间;选取所述时间区间中的不同颗粒度的样本数据作为训练样本。其中,时间区间通过时间长度乘以设定系数来确定,例如时间区间为[n*4,n*40],其中n代表时间长度,[4,10]为设定系数。当时间长度为3个月,那么样本数据的选择区间为近1年到近10年的范围。需要说明的是,时间颗粒度包括天、周和月,在选择样本数据时,确定时间颗粒度的优先级,时间颗粒度越细的样本数据对应的优先级越高,时间颗粒度越粗的样本数据对应的优先级越低。
在一实施例中,从所述样本数据集中选取训练样本,包括:确定样本数据集中的样本数据的时间颗粒度和/或时间区间;根据样本数据集中的样本数据的时间颗粒度和/或时间区间,从样本数据集中选取训练样本。其中,样本数据的时间颗粒度包括天、周和月,样本数据的时间区间可根据样本数据的最早生成时间和最晚生成时间确定。
在一些实施例中,获取多个关键实体中的时间实体,并根据时间实体确定待选取的样本数据的时间区间,选取样本数据集中位于时间区间内的样本数据作为训练样本。可选的,时间区间通过时间实体乘以设定系数来确定,待选取的样本数据的时间区间=要分析的时间实体*n。例如取n=2,要分析的时间区间为“近1个月”,则待选取的样本数据的时间区间取“近2个月”,并选取样本数据集中位于“近2个月”内的样本数据作为训练样本。
在一些实施例中,确定样本数据的不同时间颗粒度各自对应的优先级,根据不同时间颗粒度各自对应的优先级,从样本数据集中选取训练样本。可选的,时间颗粒度的优先级可由问答响应模型或者样本数据的数量确定。选取时间颗粒度的优先级较高的样本数据,例如选择按天的数据,有利于捕捉指标变化的原因。
通过结合专家知识,或者通过模型训练的历史经验在保证训练样本数量的前提下控制样本数据的时间颗粒度,能够避免大量的数据集进入问答响应模型训练,也能提高本申请实施例的响应速度。
在一实施例中,从样本数据集中选取训练样本之后,还包括:获取训练样本的多个特征变量,并获取每个特征变量的权重值;按照每个特征变量的权重值的大小进行排序,并保留权重值大于或等于第一预设阈值的特征变量,得到第一特征集合;计算第一特征集合中的每个特征变量的方差膨胀系数,并保留方差膨胀系数大于或等于第二预设阈值的特征变量,得到第二特征集合;确定第二特征集合中的每两个特征变量之间的相关性,并保留相关性大于或等于第三预设阈值的每两个特征变量,得到至少一组包含有两个特征变量的第三特征集合,将第三特征集合作为训练样本。
需要说明的是,特征变量的权重值可由专家事先预设,利用专业的统计学工具包(例如python里面的statsmodels.stats模块的variance inflation factor包)可以完成方差膨胀系数计算,方差膨胀系数大于或等于第二预设阈值(例如大于或等于10)就说明特征变量存在多重共线性。第二特征集合中的每两个特征变量之间的相关性可以通过相关性矩阵进行计算,例如得到以下2组特征变量集合:B1={平均手术时长,是否采用新手术设备}、B2={平均检查检验时长,检查检验设备数量}。有利地,通过提取训练样本的特征,包括对训练样本进行特征初筛、特征变量共线性检测和特征变量归并,能够有效精简训练样本,极大提高问答响应模型的训练速度和响应速度。
在一实施例中,对训练样本进行特征变量归并之后,还进行特征过滤。示例性地,对于因果类意图的问题信息,若第一特征集合中存在共线性特征,则从多个特征中只保留一个特征变量,例如保留权重值最大的一个特征变量,同时将其余的相关的共线性特征变量作为待选的潜在原因,潜在原因也可以有一个或者多个。例如第一特征集合经过特征过滤后,得到目标第一特征集合={平均检查检验时长,平均手术时长,手术患者疾病等级},其中,平均检查检验时长为主要原因,平均手术时长和手术患者疾病等级为潜在原因。
子步骤S1033、根据所述训练样本对所述待训练的问答响应模型进行迭代训练,以获取训练好的问答响应模型。
将训练样本输入待训练的问答响应模型,以对待训练的问答响应模型进行迭代训练,直至该问答响应模型收敛,得到训练好的问答响应模型。
在一实施例中,对所述待训练的问答响应模型进行迭代训练之前,确定问答响应模型的参数。其中,问答响应模型的参数可以基于网格搜索、梯度下降搜索等不同的算法技术进行确定。
例如,经过参数自动搜索,最终选择深圳市第一人民医院肿瘤科最近5年(n=20)的平均住院日指标的月颗粒度的数据(共60条数据)形成模型训练样本,最佳的预测模型为ARIMA(1,2,2),形成问答响应模型,来对未来3个月的趋势进行预测。ARIMA(p,d,q)模型的参数p、d、q分别代表自回归阶数、差分次数、移动平均阶数。
在一实施例中,模型训练策略为第一模型训练策略,其中,第一模型训练策略用于训练对问题信息进行预测分析的问答响应模型。需要说明的是,该问答响应模型为预测模型,可选的,预测模型有包括有:时间序列模型ARIMA、灰色系统预测模型、线性回归模型、随机森林预测模型、LSTM预测模型等,本申请不作具体限定。
示例性地,根据多个关键实体选取对应的预测模型;获取训练样本,基于该训练样本对预测模型进行迭代训练,直至预测模型收敛,得到训练好的预测模型;基于训练好的预测模型和多个关键实体,对问题信息做出预测,得到答案信息。需要说明的是,将多个关键实体输入训练好的预测模型,即可对问题信息做出预测,从而得到结果较为准确的答案信息。
其中,根据多个关键实体选取对应的预测模型的具体步骤为:根据多个关键实体中的指标名称实体确定预测对象;根据该预测对象选取对应的预测模型。需要说明的是,预测对象与预测模型之间的对应关系可事先根据专家经验进行定义。例如,对于指标名称实体为“平均住院日”,可以确定预测对象为平均值,与平均值对应的预测模型为灰色系统预测模型和随机森林预测模型,可以随机选取其中的一种预测模型,或者选取此两者预测模型,然后将该两者预测模型得到的预测结果的平均值作为最终的预测结果。
在一些实施例中,选取预测模型之后,根据该预测对象确定该预测模型的特征空间。需要说明的是,预测对象与预测模型的特征空间之间的对应关系可事先根据专家经验进行定义。以预测对象为“平均住院日”为例,假设采取随机森林预测模型,预测模型的特征空间较大,影响因素(相关变量)可能多达数十个,这些特征维度都可能对要预测的变量造成影响,在建立预测模型时,就需要将这数十个特征维度都纳入模型,以保证预测模型进行预测的准确率。又例如,预测对象为“平均住院日”,假设采用时间序列模型,由于时间序列主要通过自身的历史数据进行回归,因此样本的特征空间主要是预测对象本身。
在一实施例中,模型训练策略为第二模型训练策略,其中,第二模型训练策略用于训练对问题信息进行因果分析的问答响应模型。需要说明的是,该问答响应模型为因果分析模型,可选的,因果分析模型包括选取决策树、随机森林等树类回归模型,以及线性回归模型等,本申请不作具体限定。
示例性地,根据多个关键实体选取对应的因果分析模型;获取训练样本,对训练样本进行分组,得到至少两组训练样本;基于至少两组训练样本,对因果分析模型进行迭代训练,以获取至少两个训练好的因果分析模型;基于至少两个训练好的因果分析模型和多个关键实体,对问题信息做出因果分析,得到至少两个相互对照的答案信息。需要说明的是,根据多个关键实体选取对应的因果分析模型的具体过程可参考与上述实施例中选取预测模型的具体过程,本申请不再赘述。将多个关键实体输入训练好的因果分析模型,即可对问题信息做出因果分析,从而得到结果较为准确的答案信息。
在一些实施例中,对训练样本进行分组,得到至少两组训练样本的具体步骤为:获取训练样本中的每个样本数据的生成时间;确定样本数据的最早生成时间和最晚生成时间,并基于样本数据的最早生成时间和最晚生成时间确定训练样本的生成时间区间;按照训练样本的生成时间区间,将训练样本中的每个样本数据进行分组,得到至少两组训练样本。其中,每组训练样本对应的生成时间区间的长度可以相同或者不同。
在一些实施例中,对训练样本进行分组,得到至少两组训练样本的具体步骤为:获取训练样本中的多个样本数据的总数量;根据训练样本中的多个样本数据的数量,将训练样本中的每个样本数据进行分组,得到至少两组训练样本。其中,每组训练样本的数量小可以相同或者不同。
示例性地,将训练样本分为两组,训练样本A为分析组,训练样本A的时间区间与待分析的问题信息的时间实体相对应。训练样本B 为对照组,对应与训练样本A相同时间长度的参照样本数据,形成对照组。如问题信息的时间实体为2019年4月,训练样本A对应的时间区间为2019年4月,训练样本B对应的时间区间为2019年3月。通过训练样本A和训练样本B的对照分析,即对因果分析模型进行建模和对照解释,便于捕捉到影响指标(因果因子)的短期和中长期变化因素,使答案信息更加准确。
在一些实施例中,选取训练样本之后,确定训练样本的特征空间并提取该训练样本中的特征。需要说明的是,待分析的问题信息可选的特征变量集合可由专家事先定义,可选的,特征变量集合包括平均手术时长、平均检查检验时长、是否采用新手术设备、检查检验设备数量、手术患者疾病等级和天气温度等。
步骤S104、通过所述问答响应模型响应所述问题信息,得到所述问题信息的答案信息。
得到训练好的问答响应模型之后,基于训练好的问答响应模型,对问题信息进行响应,得到问题信息的答案信息。即将问题信息输出训练好的问答响应模型,便可输出问题信息的答案信息。可以有效克服原有的预先设定训练模型、固定模型参数、静态决策的多种弊端,利用自动机器学习生成的问答响应将整个从问答响应过程自动化,也节省了依靠专家维护机器学习模型的成本,同时问答响应输出的结果更加准确。可应用于智慧城市的智慧医疗领域,便于管理人员进行管理决策,从而推动智慧城市的建设。
在一实施例中,对于因果类意图,模型训练策略为第二模型训练策略。确定第三特征集合之后,基于问答响应模型和至少一个第三特征集合,对问题信息的因果关系做出分析,得到答案信息。例如,问题信息为:“深圳市第一人民医院心内科近1个月出院人数变化的原因”,通过决策树模型和两个第三特征集合B1={平均手术时长,是否采用新手术设备}、B2={平均检查检验时长,检查检验设备数量},可以得出样本指标变动背后的原因有3项,按照特征变量的权重值的大小排序分别为:原因1:平均检查检验时长。(潜在原因:检查检验设备数量)。原因2:平均手术时长。(潜在原因:采用新手术设备)。原因3:手术患者疾病等级。需要说明的是,特征变量的权重值可以参考回归系数的绝对值,如果通过线性回归建模,还要进行回归系数的统计检验显著性检验。
示例性地,参照上述步骤,通过对照组的样本数据可以分析得到的答案信息为:原因1:手术患者疾病等级。原因2:平均手术时长。(潜在原因:采用新手术设备)。原因3:平均检查检验时长。(潜在原因:检查检验设备数量)。通过对照组和分析组的输出结果,就很显然可以对“深圳市第一人民医院心内科近1个月出院人数变化的原因”这个问题信息做出解释:“平均检查检验时长”的变化是近1个月“出院人数”指标数据变动背后的首要因素,这可能和“检查检验设备数量”的变化有关,例如在近一个月新增了一批检查检验设备。同时,“平均手术时长”的变化是背后影响“出院人数”指标的中长期影响因素,可能是采用新手术设备所导致的。
在一实施例中,通过构建实时大数据内存计算及流计算平台(如spark、flink等),并充分利用云平台架构的弹性计算能力等来实施本申请中的各实施例,可以极大增强服务器的计算能力,从而提高本申请实施例的响应速度。
在一实施例中,服务器输出问题信息的答案信息。或者,服务器将生成的答案信息发送至终端设备,以供终端设备输出该答案信息。其中,输出该答案信息的方式包括但不限于语音输出、文字输出、动画输出和图表输出等。
在一些实施例中,终端设备预置有输出模板,答案信息通过输出模板将问答响应结果传达至用户,该输出模板至少包括文字输出模板、图表输出模板和语音输出模板中的一种模板。
示例性地,如图3所示,图3为本申请实施例提供的问答响应结果的示意图。假设问题信息所属的意图类型为预测类意图,当输出问题信息的答案信息时,该输出模板包括文字和图表,同时,该输出模板还包括有管理提示。服务器将生成的答案信息发送至终端设备,以使终端设备基于输出模板将答案信息输出为问答响应结果,以更好地辅助管理者。
请参照图4,图4为实施本实施例提供的问答响应方法的一场景示意图。
如图4所示,用户通过终端设备的问题输入界面输入问题信息,并通过终端设备,将携带有该问题信息的响应请求发送至服务器,服务器在接收到响应请求之后,基于该问题信息进行响应,得到问题信息的答案信息。之后,服务器将该答案信息输入预置好的输出模板,并将该输出模板回传至终端设备,以便终端设备基于该输出模板向用户显示问答响应结果。
上述实施例提供的问答响应方法,通过获取用户输入的问题信息,对问题信息进行命名实体识别,以获取问题信息中的多个关键实体,然后基于预设的意图识别模型确定问题信息所属的意图类型,并根据意图类型选取模型训练策略,再根据多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型,最后通过问答响应模型响应问题信息,从而得到问题信息的答案信息。本申请可以有效克服原有的预先设定训练模型、静态决策的多种弊端,通过灵活选取模型训练策略,使训练好的问答响应模型更贴合问题信息,同时响应得到的答案信息是实时生成的,时效性更强,结果更加准确。
请参照图5,图5为本申请实施例提供的一种问答响应装置的示意性框图。
如图5所示,该问答响应装置200,包括:实体识别模块201、意图识别模块202、模型训练模块203和答案响应模块204。
实体识别模块201,用于获取用户输入的问题信息,对所述问题信息进行命名实体识别,以获取所述问题信息中的多个关键实体;
意图识别模块202,用于基于预设的意图识别模型确定所述问题信息所属的意图类型,并根据所述意图类型选取模型训练策略;
模型训练模块203,用于根据所述多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型;
答案响应模块204,用于通过所述问答响应模型响应所述问题信息,得到所述问题信息的答案信息。
在一实施例中,所述意图类型包括描述类意图、预测类意图和原因类意图中的至少一种。
在一实施例中,意图识别模块202,还用于:
当所述意图类型为预测类意图时,选取第一模型训练策略,所述第一模型训练策略用于训练对所述问题信息进行预测分析的问答响应模型;
当所述意图类型为原因类意图时,选取第二模型训练策略,所述第二模型训练策略用于训练对所述问题信息进行因果分析的问答响应模型。
在一个实施例中,如图6所示,所述模型训练模块203包括:
模型确定子模块2031,用于根据所述多个关键实体确定待训练的问答响应模型;
样本选取子模块2032,用于获取样本数据集,并从所述样本数据集中选取训练样本;
模型训练子模块2033,用于根据所述训练样本对所述待训练的问答响应模型进行迭代训练,以获取训练好的问答响应模型。
在一个实施例中,所述样本选取子模块2032还用于:
确定所述样本数据集中的样本数据的时间颗粒度和/或时间区间;
根据所述样本数据集中的样本数据的时间颗粒度和/或时间区间,从所述样本数据集中选取训练样本。
在一个实施例中,所述样本选取子模块2032还用于:
获取所述训练样本的多个特征变量,并获取每个所述特征变量的权重值;
按照每个所述特征变量的权重值的大小进行排序,并保留所述权重值大于或等于第一预设阈值的特征变量,得到第一特征集合;
计算所述第一特征集合中的每个所述特征变量的方差膨胀系数,并保留所述方差膨胀系数大于或等于第二预设阈值的特征变量,得到第二特征集合;
确定所述第二特征集合中的每两个特征变量之间的相关性,并保留所述相关性大于或等于第三预设阈值的每两个特征变量,得到至少一组包含有两个特征变量的第三特征集合,将所述第三特征集合作为训练样本。
在一个实施例中,所述样本选取子模块2032还用于:
获取所述多个关键实体中的时间实体,并根据所述时间实体确定待选取的样本数据的时间区间,选取样本数据集中位于所述时间区间内的样本数据作为训练样本;和/或
确定所述样本数据的不同时间颗粒度各自对应的优先级,根据不同时间颗粒度各自对应的优先级,从所述样本数据集中选取训练样本。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述问答响应方法实施例中的对应过程,在此不再赘述。
上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图7所示的计算机设备上运行。
请参阅图7,图7为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为服务器或终端设备。
如图7所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种问答响应方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种问答响应方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元 (Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取用户输入的问题信息,对所述问题信息进行命名实体识别,以获取所述问题信息中的多个关键实体;
基于预设的意图识别模型确定所述问题信息所属的意图类型,并根据所述意图类型选取模型训练策略;
根据所述多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型;
通过所述问答响应模型响应所述问题信息,得到所述问题信息的答案信息。
在一个实施例中,所述处理器用于实现:所述意图类型包括描述类意图、预测类意图和原因类意图中的至少一种。
在一个实施例中,所述处理器在实现所述根据所述意图类型选取模型训练策略时,用于实现:
当所述意图类型为预测类意图时,选取第一模型训练策略,所述第一模型训练策略用于训练对所述问题信息进行预测分析的问答响应模型;
当所述意图类型为原因类意图时,选取第二模型训练策略,所述第二模型训练策略用于训练对所述问题信息进行因果分析的问答响应模型。
在一个实施例中,所述模型训练策略用于确定待训练的问答响应模型和训练样本;所述处理器在实现所述根据所述多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型时,用于实现:
根据所述多个关键实体确定待训练的问答响应模型;
获取样本数据集,并从所述样本数据集中选取训练样本;
根据所述训练样本对所述待训练的问答响应模型进行迭代训练,以获取训练好的问答响应模型。
在一个实施例中,所述处理器在实现所述从所述样本数据集中选取训练样本时,用于实现:
确定所述样本数据集中的样本数据的时间颗粒度和/或时间区间;
根据所述样本数据集中的样本数据的时间颗粒度和/或时间区间,从所述样本数据集中选取训练样本。
在一个实施例中,所述处理器在实现所述从所述样本数据集中选取训练样本之后,还用于实现:
获取所述训练样本的多个特征变量,并获取每个所述特征变量的权重值;
按照每个所述特征变量的权重值的大小进行排序,并保留所述权重值大于或等于第一预设阈值的特征变量,得到第一特征集合;
计算所述第一特征集合中的每个所述特征变量的方差膨胀系数,并保留所述方差膨胀系数大于或等于第二预设阈值的特征变量,得到第二特征集合;
确定所述第二特征集合中的每两个特征变量之间的相关性,并保留所述相关性大于或等于第三预设阈值的每两个特征变量,得到至少一组包含有两个特征变量的第三特征集合,将所述第三特征集合作为训练样本。
在一个实施例中,所述处理器在实现所述根据所述样本数据集中的样本数据的时间颗粒度和/或时间区间,从所述样本数据集中选取训练样本时,用于实现:
获取所述多个关键实体中的时间实体,并根据所述时间实体确定待选取的样本数据的时间区间,选取样本数据集中位于所述时间区间内的样本数据作为训练样本;和/或
确定所述样本数据的不同时间颗粒度各自对应的优先级,根据不同时间颗粒度各自对应的优先级,从所述样本数据集中选取训练样本。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述计算机设备的具体工作过程,可以参考前述问答响应方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请问答响应方法的各个实施例。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中”。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种问答响应方法,其特征在于,包括:
获取用户输入的问题信息,对所述问题信息进行命名实体识别,以获取所述问题信息中的多个关键实体;
基于预设的意图识别模型确定所述问题信息所属的意图类型,并根据所述意图类型选取模型训练策略;
根据所述多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型;
通过所述问答响应模型响应所述问题信息,得到所述问题信息的答案信息。
2.如利要求1所述的问答响应方法,其特征在于,所述意图类型包括描述类意图、预测类意图和原因类意图中的至少一种。
3.如权利要求2所述的问答响应方法,其特征在于,所述根据所述意图类型选取模型训练策略,包括:
当所述意图类型为预测类意图时,选取第一模型训练策略,所述第一模型训练策略用于训练对所述问题信息进行预测分析的问答响应模型;
当所述意图类型为原因类意图时,选取第二模型训练策略,所述第二模型训练策略用于训练对所述问题信息进行因果分析的问答响应模型。
4.如权利要求1-3中任一项所述的问答响应方法,其特征在于,所述模型训练策略用于确定待训练的问答响应模型和训练样本;所述根据所述多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型,包括:
根据所述多个关键实体确定待训练的问答响应模型;
获取样本数据集,并从所述样本数据集中选取训练样本;
根据所述训练样本对所述待训练的问答响应模型进行迭代训练,以获取训练好的问答响应模型。
5.如权利要求4所述的问答响应方法,其特征在于,所述从所述样本数据集中选取训练样本,包括:
确定所述样本数据集中的样本数据的时间颗粒度和/或时间区间;
根据所述样本数据集中的样本数据的时间颗粒度和/或时间区间,从所述样本数据集中选取训练样本。
6.如权利要求4所述的问答响应方法,其特征在于,所述从所述样本数据集中选取训练样本之后,还包括:
获取所述训练样本的多个特征变量,并获取每个所述特征变量的权重值;
按照每个所述特征变量的权重值的大小进行排序,并保留所述权重值大于或等于第一预设阈值的特征变量,得到第一特征集合;
计算所述第一特征集合中的每个所述特征变量的方差膨胀系数,并保留所述方差膨胀系数大于或等于第二预设阈值的特征变量,得到第二特征集合;
确定所述第二特征集合中的每两个特征变量之间的相关性,并保留所述相关性大于或等于第三预设阈值的每两个特征变量,得到至少一组包含有两个特征变量的第三特征集合,将所述第三特征集合作为训练样本。
7.如权利要求5所述的问答响应方法,其特征在于,所述根据所述样本数据集中的样本数据的时间颗粒度和/或时间区间,从所述样本数据集中选取训练样本,包括:
获取所述多个关键实体中的时间实体,并根据所述时间实体确定待选取的样本数据的时间区间,选取样本数据集中位于所述时间区间内的样本数据作为训练样本;和/或
确定所述样本数据的不同时间颗粒度各自对应的优先级,根据不同时间颗粒度各自对应的优先级,从所述样本数据集中选取训练样本。
8.一种问答响应装置,其特征在于,所述问答响应装置包括:
实体识别模块,用于获取用户输入的问题信息,对所述问题信息进行命名实体识别,以获取所述问题信息中的多个关键实体;
意图识别模块,用于基于预设的意图识别模型确定所述问题信息所属的意图类型,并根据所述意图类型选取模型训练策略;
模型训练模块,用于根据所述多个关键实体和模型训练策略,执行模型训练操作,得到训练好的问答响应模型;
答案响应模块,用于通过所述问答响应模型响应所述问题信息,得到所述问题信息的答案信息。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的问答响应方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的问答响应方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010618140.0A CN111506723B (zh) | 2020-07-01 | 2020-07-01 | 问答响应方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010618140.0A CN111506723B (zh) | 2020-07-01 | 2020-07-01 | 问答响应方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111506723A true CN111506723A (zh) | 2020-08-07 |
CN111506723B CN111506723B (zh) | 2020-11-13 |
Family
ID=71865103
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010618140.0A Active CN111506723B (zh) | 2020-07-01 | 2020-07-01 | 问答响应方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111506723B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111930950A (zh) * | 2020-09-18 | 2020-11-13 | 深圳追一科技有限公司 | 多意图响应方法、装置、计算机设备和存储介质 |
CN112015876A (zh) * | 2020-08-27 | 2020-12-01 | 北京智通云联科技有限公司 | 时间解析方法、装置、电子设备及存储介质 |
CN112052310A (zh) * | 2020-09-28 | 2020-12-08 | 平安普惠企业管理有限公司 | 基于大数据的信息获取方法、装置、设备及存储介质 |
CN112328771A (zh) * | 2020-11-19 | 2021-02-05 | 广州极飞科技有限公司 | 服务信息输出方法、装置、服务器及存储介质 |
CN112417886A (zh) * | 2020-11-20 | 2021-02-26 | 平安普惠企业管理有限公司 | 意图实体信息抽取方法、装置、计算机设备及存储介质 |
CN114610856A (zh) * | 2022-03-16 | 2022-06-10 | 零犀(北京)科技有限公司 | 一种基于因果图的对话交互智能决策方法及装置 |
CN117708306A (zh) * | 2024-02-06 | 2024-03-15 | 神州医疗科技股份有限公司 | 基于层进式问答结构的医学问答架构生成方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446286A (zh) * | 2017-02-16 | 2018-08-24 | 阿里巴巴集团控股有限公司 | 一种自然语言问句答案的生成方法、装置及服务器 |
US20180358001A1 (en) * | 2017-06-12 | 2018-12-13 | International Business Machines Corporation | Method, Apparatus, and System for Conflict Detection and Resolution for Competing Intent Classifiers in Modular Conversation System |
US20190325023A1 (en) * | 2018-04-18 | 2019-10-24 | Microsoft Technology Licensing, Llc | Multi-scale model for semantic matching |
CN110427467A (zh) * | 2019-06-26 | 2019-11-08 | 深圳追一科技有限公司 | 问答处理方法、装置、计算机设备和存储介质 |
CN111159346A (zh) * | 2019-12-27 | 2020-05-15 | 深圳物控智联科技有限公司 | 基于意图识别的智能答疑方法、服务器及存储介质 |
CN111310995A (zh) * | 2020-02-12 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 基于卷积神经网络的业务预测方法以及装置 |
-
2020
- 2020-07-01 CN CN202010618140.0A patent/CN111506723B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108446286A (zh) * | 2017-02-16 | 2018-08-24 | 阿里巴巴集团控股有限公司 | 一种自然语言问句答案的生成方法、装置及服务器 |
US20180358001A1 (en) * | 2017-06-12 | 2018-12-13 | International Business Machines Corporation | Method, Apparatus, and System for Conflict Detection and Resolution for Competing Intent Classifiers in Modular Conversation System |
US20180358000A1 (en) * | 2017-06-12 | 2018-12-13 | International Business Machines Corporation | Method, Apparatus, and System for Conflict Detection and Resolution for Competing Intent Classifiers in Modular Conversation System |
US20190325023A1 (en) * | 2018-04-18 | 2019-10-24 | Microsoft Technology Licensing, Llc | Multi-scale model for semantic matching |
CN110427467A (zh) * | 2019-06-26 | 2019-11-08 | 深圳追一科技有限公司 | 问答处理方法、装置、计算机设备和存储介质 |
CN111159346A (zh) * | 2019-12-27 | 2020-05-15 | 深圳物控智联科技有限公司 | 基于意图识别的智能答疑方法、服务器及存储介质 |
CN111310995A (zh) * | 2020-02-12 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 基于卷积神经网络的业务预测方法以及装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112015876A (zh) * | 2020-08-27 | 2020-12-01 | 北京智通云联科技有限公司 | 时间解析方法、装置、电子设备及存储介质 |
CN111930950A (zh) * | 2020-09-18 | 2020-11-13 | 深圳追一科技有限公司 | 多意图响应方法、装置、计算机设备和存储介质 |
CN112052310A (zh) * | 2020-09-28 | 2020-12-08 | 平安普惠企业管理有限公司 | 基于大数据的信息获取方法、装置、设备及存储介质 |
CN112328771A (zh) * | 2020-11-19 | 2021-02-05 | 广州极飞科技有限公司 | 服务信息输出方法、装置、服务器及存储介质 |
CN112417886A (zh) * | 2020-11-20 | 2021-02-26 | 平安普惠企业管理有限公司 | 意图实体信息抽取方法、装置、计算机设备及存储介质 |
CN114610856A (zh) * | 2022-03-16 | 2022-06-10 | 零犀(北京)科技有限公司 | 一种基于因果图的对话交互智能决策方法及装置 |
CN117708306A (zh) * | 2024-02-06 | 2024-03-15 | 神州医疗科技股份有限公司 | 基于层进式问答结构的医学问答架构生成方法及系统 |
CN117708306B (zh) * | 2024-02-06 | 2024-05-03 | 神州医疗科技股份有限公司 | 基于层进式问答结构的医学问答架构生成方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111506723B (zh) | 2020-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111506723B (zh) | 问答响应方法、装置、设备及存储介质 | |
CN109326353B (zh) | 预测疾病终点事件的方法、装置及电子设备 | |
CN107368521B (zh) | 一种基于大数据和深度学习的知识推介方法及系统 | |
CN112256886B (zh) | 图谱中的概率计算方法、装置、计算机设备及存储介质 | |
CN111738778B (zh) | 用户画像生成方法、装置、计算机设备及存储介质 | |
CN113807728A (zh) | 基于神经网络的绩效考核方法、装置、设备及存储介质 | |
CN116843395A (zh) | 一种业务系统的告警分级方法、装置、设备及存储介质 | |
Sumangali et al. | Determination of interesting rules in FCA using information gain | |
Foote et al. | A computational analysis of social media scholarship | |
CN115938600A (zh) | 一种基于关联分析的心理健康状态预测方法与系统 | |
Siebra et al. | Behavioral data categorization for transformers-based models in digital health | |
CN117172632B (zh) | 一种企业异常行为检测方法、装置、设备及存储介质 | |
CN114549078B (zh) | 基于时序的客户行为处理方法、装置及相关设备 | |
CN117709801A (zh) | 客户数据处理方法、装置、计算机设备及存储介质 | |
CN117252362A (zh) | 基于人工智能的调度方法、装置、计算机设备及存储介质 | |
CN116993218A (zh) | 基于人工智能的指标分析方法、装置、设备及存储介质 | |
CN117291693A (zh) | 基于人工智能的策略生成方法、装置、设备及存储介质 | |
Zulu | Forecasting COVID-19 New Cases in South Africa using ARIMA and LSTM Time-Series Analysis Methods | |
CN118035560A (zh) | 基于人工智能的数据推荐方法、装置、设备及存储介质 | |
CN115049511A (zh) | 基于人工智能的标签生成方法、装置、设备及存储介质 | |
CN117876021A (zh) | 基于人工智能的数据预测方法、装置、设备及存储介质 | |
CN116777639A (zh) | 案件风险评级方法、装置、计算机设备及存储介质 | |
CN117078406A (zh) | 一种客户流失预警方法、装置、计算机设备及存储介质 | |
Burkett | A Bibliographic Guide to Methods for Causal Inference: Theory, Software, and Applications | |
CN116934506A (zh) | 一种用户行为预测方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231030 Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000 Patentee after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd. Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000 Patentee before: Ping An International Smart City Technology Co.,Ltd. |