WO2020186458A1

WO2020186458A1 - 问题生成方法和装置、问诊系统、计算机可读存储介质

Info

Publication number: WO2020186458A1
Application number: PCT/CN2019/078734
Authority: WO
Inventors: 张振中; 陈雪
Original assignee: 京东方科技集团股份有限公司
Priority date: 2019-03-19
Filing date: 2019-03-19
Publication date: 2020-09-24
Also published as: CN110088748A; US20210034305A1; US11600389B2; CN110088748B

Abstract

本公开涉及一种问题生成方法和装置、问诊系统、计算机可读存储介质。问题生成方法装置包括至少一个处理器，所述至少一个处理器被配置为：获取候选问题集合Q；计算所述候选问题集合Q中每个候选问题的信息价值；根据各候选问题的信息价值，生成至少一个问题。

Description

问题生成方法和装置、问诊系统、计算机可读存储介质

技术领域

本公开涉及计算机技术领域，特别涉及一种问题生成方法和装置、问诊系统、计算机可读存储介质。

背景技术

随着人机交互技术的快速发展，智能问诊成为人工智能的重要研究领域之一。智能问诊系统通过同患者进行人机交互，收集患者的症状和体征信息。

相关技术中，需要很多次与患者交互，才能收集全面的症状和体征信息，以便做出准确的诊断。

发明内容

根据本公开的一些实施例，提供了一种问题生成装置，包括至少一个处理器，所述至少一个处理器被配置为：获取候选问题集合Q；计算所述候选问题集合Q中每个候选问题的信息价值；根据各候选问题的信息价值，生成至少一个问题。

在一些实施例中，生成至少一个问题包括：从所述候选问题集合Q中选择信息价值最大的候选问题，作为生成的问题。

在一些实施例中，所述至少一个处理器被配置为：根据对话上下文获取所述候选问题集合Q；所述候选问题集合Q包括与所述对话上下文的相关程度满足阈值的、第一所选数目的候选问题q _i，i为小于或等于所述第一所选数目的正整数；生成的至少一个问题包括待向对话目标提出的对话问题。

在一些实施例中，每个候选问题的信息价值与该候选问题带来的信息量的期望值正相关。

在一些实施例中，所述至少一个处理器还被配置为：获取与所述候选问题集合Q中各候选问题对应的答案a _j，得到答案集合A，其中，j为小于或等于所述第一所选数目的正整数，且j＝i表示答案a _j为候选问题q _i对应的答案。

在一些实施例中，所述至少一个处理器被配置为通过

获得每个候选问题的信息价值，其中：context表示对话上下文；f(context,q _i,a _j)表示对于对话上下文context，每个候选问题q _i带来的信息量；P(a _j|context,q _i)表示对于对话上下文context和候选问题q _i，产生答案a _j的概率。

在一些实施例中，每个候选问题q _i带来的信息量f(context,q _i,a _j)与候选问题q _i和对应的对话上下文context的相关程度正相关，且所述答案集合A中答案a _j的准确程度正相关；概率P(a _j|context,q _i)与候选问题q _i和每一个其他候选问题的相似度正相关，且与该候选问题q _i的预测答案和所述答案集合A中的答案a _j的相似度正相关。

在一些实施例中，概率P(a _j|context,q _i)表示为P(a _j|context,q _i)∝exp(cos(G(context,q _i),a _j))×cos(q _i,q _j)，其中，cos(q _i,q _j)表示候选问题q _i和q _j的相似度，G(context,q _i)表示候选问题q _i的预测答案，cos(G(context,q _i),a _j)表示候选问题q _i的预测答案和所述答案集合A中的答案a _j的相似度。

在一些实施例中，利用第一循环神经网络来获得所述候选问题q _i的预测答案；利用第二循环神经网络来计算每个候选问题q _i带来的信息量f(context,q _i,a _j)。

在一些实施例中，第一循环神经网络是门控循环单元网络；第二循环神经网络是长短期记忆网络。

在一些实施例中，所述至少一个处理器还被配置为：基于语料库和损失函数，使用随机梯度下降方法，训练以形成所述第一循环神经网络和所述第二循环神经网络，其中，所述语料库包括训练用对话上下文Tcontext、训练用候选问题集合TQ和训练用答案集合TA，所述训练用候选问题集合TQ包括第二所选数目的训练用候选问题q _l，所述训练用答案集合TA包括与所述训练用候选问题集合TQ中各候选问题对应的答案a _m，l为小于或等于所述第二所选数目的正整数，m为小于或等于所述第二所选数目的正整数；所述损失函数与每个候选问题q _l和每一个其他候选问题的相似度负相关，与该候选问题q _l的预测答案和所述训练用答案集合TA中的答案a _m的相似度负相关，与该候选问题q _l和对应的训练用对话上下文Tcontext的相关程度负相关，且与答案a _m的准确程度负相关。

在一些实施例中，所述损失函数表示为Loss＝∑ _l,m(L(Tcontext,q _l,a _m),+L(y _l,Tcontext,q _l,a _m))，其中，

L(y _l,Tcontext,q _l,a _m)＝-y _llog(σ(LSTM(Tcontext,q _l,a _m)))，

cos(q _l,q _n)表示候选问题q _l和q _n的相似度，G(Tcontext,q _l)表示候选问题q _l的预测答案，cos(G(Tcontext,q _l),a _m)表示候选问题q _l的预测答案和答案a _m的相似度，cos(G(Tcontext,q _l),a _n)表示候选问题q _l的预测答案和所述训练用答案集合中的答案a _n的相似度，n为小于或等于所述第二所选数目的正整数；在l等于m的情况下y _l＝1，在l不等于m的情况下y _l＝0；σ是sigmoid函数；LSTM(Tcontext,q _l,a _m)表示对于训练用对话上下文Tcontext，候选问题q _l带来的信息量。

根据本公开的另一些实施例，提供了一种问诊系统，包括前述任一实施例所述的问题生成装置，所述对话为医疗问诊中的对话交互，所述对话目标为患者；所述问题生成装置配置成根据所述问诊上下文，生成待向患者提出的问诊问题。

在一些实施例中，所述问诊系统还包括:输入设备，配置成获取问诊上下文；输出设备，配置成输出所述问诊问题。

在一些实施例中，所述问诊上下文包括所述患者的描述。

在一些实施例中，所述问诊上下文包括已向所述患者提出的问诊问题。

根据本公开的又一些实施例，提供了一种问题生成方法，包括：获取候选问题集合Q；计算所述候选问题集合Q中每个候选问题的信息价值；根据各候选问题的信息价值，生成至少一个问题。

在一些实施例中，根据对话上下文获取所述候选问题集合Q；所述候选问题集合Q包括与所述对话上下文的相关程度满足阈值的、第一所选数目的候选问题q _i，i为小于或等于所述第一所选数目的正整数；生成的至少一个问题包括待向对话目标提出的对话问题。

在一些实施例中，根据每个候选问题带来的信息量的期望值，计算所述候选问题集合Q中每个候选问题的信息价值。

在一些实施例中，所述问题生成方法还包括：获取与所述候选问题集合Q中各候选问题对应的答案a _j，得到答案集合A，其中，j为小于或等于所述第一所选数目的正整数，且j＝i表示答案a _j为候选问题q _i对应的答案。

在一些实施例中，每个候选问题的信息价值表示为

其中：每个候选问题带来的信息量为f(context,q _i,a _j)，表示对于对话上下文context，候选问题q _i带来的信息量；P(a _j|context,q _i)表示对于对话上下文context和候选问题q _i，产生答案a _j的概率。

在一些实施例中，每个候选问题带来的信息量f(context,q _i,a _j)与候选问题q _i和对应的对话上下文context的相关程度正相关，且所述答案集合A中答案a _j的准确程度正相关；概率P(a _j|context,q _i)与候选问题q _i和每一个其他候选问题的相似度正相关，且与该候选问题q _i的预测答案和所述答案集合A中的答案a _j的相似度正相关。

在一些实施例中，所述问题生成方法还包括：基于语料库和损失函数，使用随机梯度下降方法，训练以形成所述第一循环神经网络和所述第二循环神经网络，其中，所述语料库包括训练用对话上下文Tcontext、训练用候选问题集合TQ和训练用答案集合TA，所述训练用候选问题集合TQ包括第二所选数目的训练用候选问题q _l，所述训练用答案集合TA包括与所述训练用候选问题集合TQ中各候选问题对应的答案a _m，l为小于或等于所述第二所选数目的正整数，m为小于或等于所述第二所选数目的正整数；所述损失函数与每个候选问题q _l和每一个其他候选问题的相似度负相关，与该候选问题q _l的预测答案和所述训练用答案集合TA中的答案a _m的相似度负相关，与该候选问题q _l和对应的训练用对话上下文Tcontext的相关程度负相关，且与答案a _m的准确程度负相关。

根据本公开的再一些实施例，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现前述任一实施例所述的问题生成方法。

通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得清楚。

附图说明

构成说明书的一部分的附图描述了本公开的实施例，并且连同说明书一起用于解释本公开的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本公开，其中：

图1是示出根据本公开一些实施例的问题生成方法的流程图；

图2是示出根据本公开另一些实施例的问题生成方法的流程图；

图3是示出根据本公开一些实施例的问题生成装置的框图；

图4是示出根据本公开一些实施例的电子设备的框图；

图5是示出根据本公开一些实施例的问诊系统的框图；

图6是示出用于实现本公开一些实施例的计算机系统的框图。

应当明白，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。此外，相同或类似的参考标号表示相同或类似的构件。

具体实施方式

现在将参照附图来详细描述本公开的各种示例性实施例。对示例性实施例的描述仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。本公开可以以许多不同的形式实现，不限于这里所述的实施例。提供这些实施例是为了使本公开透彻且完整，并且向本领域技术人员充分表达本公开的范围。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置应被解释为仅仅是示例性的，而不是作为限制。

本公开使用的所有术语(包括技术术语或者科学术语)与本公开所属领域的普通技术人员理解的含义相同，除非另外特别定义。还应当理解，在诸如通用字典中定义的术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义，而不应用理想化或极度形式化的意义来解释，除非这里明确地这样定义。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

基于问题-答案的对话在各种领域是非常普遍的。例如，在酒店住宿等行业，住客可能会向前台服务人员提出多个或多轮问题；在电视综艺节目的词语回答、诗歌接龙比赛中，嘉宾会向选手持续的提出问题；在电信、有线电视等行业，服务提供商也会向服务订阅用户提供电话客服等服务。

可能需要大量的对话过程，消耗较长的时间，才得以定位用户所提出的问题的准确答案，这将会导致人力、时间等的成本。

示例而言，在医疗领域，上述问题是明显地。需要很多次与患者交互，花费较长的时间，才能做出准确的疾病、病情、用药等的诊断。这可能会耽误患者的就诊时间和浪费医疗资源。

本公开提出一种问题生成方法，能够用尽可能少的问题获得尽可能多的信息，从而能够花费较短的时间做出准确的诊断。

在如下实施例中，以医疗领域的问诊对话为例，说明本公开问题生成方法的实施过程。本领域技术人员可以理解，在其它的问题-答案的对话过程中同样是可以适用的。

图1是示出根据本公开一些实施例的问题生成方法的流程图。如图1所示，问题生成方法包括步骤S2-S6。

在步骤S2，获取候选问题集合Q。

在一些实施例中，根据问诊上下文获取候选问题集合Q。问诊上下文可以包括患者的描述。候选问题集合Q包括与问诊上下文的相关程度满足阈值的、第一所选数目的候选问题q _i，i为小于或等于第一所选数目的正整数。

例如，可以将问诊上下文作为查询语句，通过whoosh、lucene等文本检索工具，在语料库中检索与问诊上下文最相近的第一所选数目(例如，选择前10个)问诊上下文，得到与检索到的每个问诊上下文对应的问题q _i，构成候选问题集合Q。

在一些实施例中，在步骤S2，还获取与候选问题集合Q中各候选问题对应的答案a _j，得到答案集合A，其中，j为小于或等于所述第一所选数目的正整数。j＝i表示答案a _j为候选问题q _i对应的答案。

在步骤S4，计算候选问题集合Q中每个候选问题的信息价值。

在一些实施例中，根据每个候选问题q _i带来的信息量的期望值，计算候选问题集合Q中每个候选问题q _i的信息价值。

例如，每个候选问题q _i的信息价值可以表示为

其中，每个候选问题带来的信息量为f(context,q _i,a _j)，表示对于问诊上下文context，候选问题q _i带来的信息量；P(a _j|context,q _i)表示对于问诊上下文context和候选问题q _i，产生答案a _j的概率。

在一些实施例中，每个候选问题q _i带来的信息量f(context,q _i,a _j)与候选问题q _i和对应的问诊上下文context的相关程度正相关，且所述答案集合A中答案a _j的准确程度正相关。

f(context,q _i,a _j)反映了综合考虑候选问题q _i和答案a _j的信息量。在候选问题q _i和问诊上下文context相关程度较高，且答案a _j准确回答候选问题q _i的情况下，f(context,q _i,a _j)较大。

例如，对于问诊上下文为“小腿疼”，候选问题“下肢是否痉挛？”和“小腿抽筋吗？”与问诊上下文的相关程度都较高。但是，由于候选问题“下肢是否痉挛？”使用的是标准医学用语，可能会出现因缺少医学知识不理解问题而导致得到例如“痉挛是什么意思？”的答案，即得到的答案的准确程度可能较低。

与之相对地，候选问题“小腿抽筋吗？”，由于使用相对容易理解的日常用语，就会得到例如“小腿抽筋过一次”的准确答案，即得到的答案的准确程度较高。

因此，对于问诊上下文“小腿疼”，候选问题“小腿抽筋吗？”带来的信息量大于候选问题“下肢是否痉挛？”带来的信息量。

在另一些实施例中，概率P(a _j|context,q _i)与候选问题q _i和每一个其他候选问题的相似度正相关，且与该候选问题q _i的预测答案和所述答案集合A中的答案a _j的相似度正相关。

例如，概率P(a _j|context,q _i)可以表示为

P(a _j|context,q _i)∝exp(cos(G(context,q _i),a _j))×cos(q _i,q _j)，

其中，cos(q _i,q _j)表示候选问题q _i和q _j的相似度，G(context,q _i)表示候选问题q _i的预测答案，cos(G(context,q _i),a _j)表示候选问题q _i的预测答案和所述答案集合A中的答案a _j的相似度，cos表示余弦相似度，exp表示以自然常数e为底的指数函数。

问诊上下文context，候选问题q _i和答案a _j可以通过词向量来表示。问诊上下文context，候选问题q _i和答案a _j的词向量表示可以利用如word2vector等技术来实现。

在一些实施例中，利用第一循环神经网络来获得所述候选问题q _i的预测答案。利用第二循环神经网络来计算每个候选问题q _i带来的信息量f(context,q _i,a _j)。

第一循环神经网络和第二循环神经网络都可以是门控循环单元(GRU)网络或长短期记忆(LSTM)网络。在一些实施例中，第一循环神经网络是GRU网络，第二循环神经网络是LSTM网络。

在步骤S6，根据各候选问题的信息价值，生成至少一个问题。

生成的至少一个问题可以包括待向患者提出的问诊问题。

在一些实施例中，从所述候选问题集合Q中选择信息价值最大的候选问题，作为生成的问题。

例如，每次向患者提出问诊问题，都选择信息价值最大的一个候选问题。对于下一个问诊问题，可将当前信息价值最大的候选问题(即已向患者提出的问诊问题)加入到问诊上下文context中，然后重复前述问题生成方法的流程。这样，可以用较少的计算量生成一系列问题。

在另一些实施例中，也可综合考虑生成的多个问题的信息量之和来选择候选问题。例如，假设要生成3个问诊问题，可以根据各个候选问题的信息价值，选择带来的信息量之和最大的3个问诊问题作为生成的问题。这样，可以提高信息收集的整体效率。

图2是示出根据本公开另一些实施例的问题生成方法的流程图。图2与图1的不同之处在于，图2中的问题生成方法还包括步骤S1。下面将仅描述图2与图1的不同之处，相同之处不再赘述。

在步骤S1，基于语料库和损失函数，使用随机梯度下降方法，来训练以形成第一循环神经网络和第二循环神经网络。

可以采用与步骤S2中获取候选问题集合Q类似的方式，从语料库中获取训练样本(训练用问诊上下文Tcontext、训练用候选问题集合TQ和训练用答案集合TA)，以构建训练数据集。

训练用候选问题集合TQ包括第二所选数目的训练用候选问题q _l，l为小于或等于第二所选数目的正整数。训练用答案集合TA包括与训练用候选问题集合TQ中各候选问题对应的答案a _m，m为小于或等于第二所选数目的正整数。第二所选数目可以根据训练需要来设置。

可以基于爬虫从互联网爬取的相关信息来构建语料库，相关信息包括患者最初的描述、医护人员的提问、患者对提问的回答。这些信息在语料库中可以存储为(C,q,a)，其中：患者最初的描述对应问诊上下文，可以用C来表示；针对该问诊上下文，医护人员的提问用q来表示；患者对提问q的回答用a来表示。

例如，某医疗网站上患者询问“嗓子非常疼，感冒的时候以为就是感冒引起的，可是感冒好了还是没好转……”，可以用C表示；医生提问“你今年多大岁数？以前有过类似的病史吗？已经吃过什么药……”，可以用q ₁表示；患者回答“今年23了，没有类似的病史，就吃的感冒药，具体哪些记不清了，好像有罗红霉素、清热解毒冲剂”，可以用a ₁表示；医生接着又做了追问，“这次嗓子疼有多长时间啦？”可以用q ₂表示；患者也针对医生的追问做了回答，“八九天吧”，可以用a ₂表示。即，上述信息可以存储为(C,q ₁,a ₁,q ₂,a ₂)。

尽管上述示意了利用互联网的信息构建语料库的方法，其它的来源，例如基于医院、诊所等医疗场所的病历等也可以构建所需的语料库。

在一些实施例中，损失函数被构建为：与每个候选问题q _l和每一个其他候选问题的相似度负相关，与该候选问题q _l的预测答案和所述训练用答案集合TA中的答案a _m的相似度负相关，与该候选问题q _l和对应的训练用问诊上下文Tcontext的相关程度负相关，且与答案a _m的准确程度负相关。

例如，损失函数表示为

Loss＝∑ _l,m(L(Tcontext,q _l,a _m),+L(y _l,Tcontext,q _l,a _m))，其中，

L(y _l,Tcontext,q _l,a _m)＝-y _llog(σ(LSTM(Tcontext,q _l,a _m)))。

cos(q _l,q _n)表示候选问题q _l和q _n的相似度，G(Tcontext,q _l)表示候选问题q _l的预测答案，cos(G(Tcontext,q _l),a _m)表示候选问题q _l的预测答案和答案a _m的相似度，cos(G(Tcontext,q _l),a _n)表示候选问题q _l的预测答案和所述训练用答案集合中的答案a _n的相似度，n为小于或等于所述第二所选数目的正整数；在l等于m的情况下y _l＝1，在l不等于m的情况下y _l＝0；σ是sigmoid函数；LSTM(Tcontext,q _l,a _m)表示对于训练用问诊上下文Tcontext，候选问题q _l带来的信息量。

随机梯度下降方法在计算下降最快的方向随机选一个训练数据进行计算，而不是扫描全部训练数据集，这样可加快迭代速度。

如前所述，在计算概率P(a _j|context,q _i)时，利用GRU网络，可以提高训练效率；而在计算信息量f(context,q _i,a _j)时，利用LSTM网络，可以在数据量较大时实现更好的表达性能。

图3是示出根据本公开一些实施例的问题生成装置的框图。如图3所示，问题生成装置30包括至少一个处理器320。

处理器320被配置为：获取候选问题集合Q；计算所述候选问题集合Q中每个候选问题的信息价值；根据各候选问题的信息价值，生成至少一个问题。处理器320例如可以执行如图1或图2所示的问题生成方法。

本领域技术人员容易理解，上述问题生成装置30还可以包括存储器，以用来至少存储候选问题集合。

图4是示出根据本公开一些实施例的电子设备的框图。

如图4所示，电子设备40包括：存储器410以及耦接至该存储器410的处理器420。存储器410配置成存储执行问题生成方法对应实施例的指令。处理器420被配置为基于存储在存储器410中的指令，执行本公开中任意一些实施例中的问题生成方法中的一个或多个步骤。

应当理解，前述问题生成方法中的各个步骤都可以通过处理器来实现，并且可以软件、硬件、固件或其结合的任一种方式实现。

除了问题生成方法、装置之外，本公开实施例还可采用在一个或多个包含有计算机程序指令的非易失性存储介质上实施的计算机程序产品的形式。因此，本公开实施例还提供一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现前述任意实施例中的问题生成方法。

本公开实施例还提供一种问诊系统，包括前述任一实施例所述的问题生成装置或电子设备。

图5是示出根据本公开一些实施例的问诊系统的框图。

如图5所示，问诊系统5包括问题生成装置50。问题生成装置50被配置为执行前述任一实施例所述的问题生成方法。问题生成装置50的结构可以类似与前述的问题生成装置30，用于根据问诊上下文，生成待向患者提出的问诊问题。

在一些实施例中，问诊系统5还包括：输入设备51和输出设备52。输入设备51用于获取问诊上下文。例如，可以根据文字、声音或图像等多媒体数据获取问诊上下文。输出设备52用于输出问诊问题。例如，可以利用显示器、播放器中的至少一种输出问诊问题。

其中，输入设备51、输出设备52可以通过网络连接到问题生成装置50，例如无线网络、有线网络、和/或无线网络和有线网络的任意组合。网络可以包括局域网、互联网、电信网、基于互联网和/或电信网的物联网(Internet of Things)、和/或以上网络的任意组合等。有线网络例如可以采用双绞线、同轴电缆或光纤传输等方式进行通信，无线网络例如可以采用3G/4G/5G移动通信网络、蓝牙、Zigbee或者Wi-Fi等通信方式。

其中，问诊系统5可以实现为本地服务的方式，即输入设备、问题生成装置、输出设备均位于用户端；问诊系统5还可以实现为云服务的方式，即输入设备、输出设备位于用户端，问题生成装置位于云端，云端的问题生成装置可以同时或分时为多个用户提供服务。

图6是示出用于实现本公开一些实施例的计算机系统的框图。

如图6所示，计算机系统可以通用计算设备的形式表现，该计算机系统可以用来实现上述实施例的问题生成装置。计算机系统包括存储器610、处理器620和连接不同系统组件的总线600。

存储器610例如可以包括系统存储器、非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。系统存储器可以包括易失性存储介质，例如随机存取存储器(RAM)和/或高速缓存存储器。非易失性存储介质例如存储有执行显示方法的对应实施例的指令。非易失性存储介质包括但不限于磁盘存储器、光学存储器、闪存等。

处理器620可以用通用处理器、数字信号处理器(DSP)、应用专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑设备、分立门或晶体管等分立硬件组件方式来实现。相应地，诸如判断模块和确定模块的每个模块，可以通过中央处理器(CPU)运行存储器中执行相应步骤的指令来实现，也可以通过执行相应步骤的专用电路来实现。

总线600可以使用多种总线结构中的任意总线结构。例如，总线结构包括但不限于工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、外围组件互连(PCI)总线。

计算机系统还可以包括输入输出接口630、网络接口640、存储接口650等。这些接口630、640、650以及存储器610和处理器620之间可以通过总线600连接。输入输出接口630可以为显示器、鼠标、键盘等输入输出设备提供连接接口。网络接口640为各种联网设备提供连接接口。存储接口640为软盘、U盘、SD卡等外部存储设备提供连接接口。

至此，已经详细描述了本公开的各种实施例。为了避免遮蔽本公开的构思，没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述，完全可以明白如何实施这里公开的技术方案。

虽然已经通过示例对本公开的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本公开的范围。本领域的技术人员应该理解，可在不脱离本公开的范围和精神的情况下，对以上实施例进行修改或者对部分技术特征进行等同替换。本公开的范围由所附权利要求来限定。

Claims

一种问题生成装置，包括至少一个处理器，所述至少一个处理器被配置为：

获取候选问题集合Q；

计算所述候选问题集合Q中每个候选问题的信息价值；

根据各候选问题的信息价值，生成至少一个问题。
根据权利要求1所述的问题生成装置，其中，生成至少一个问题包括：

从所述候选问题集合Q中选择信息价值最大的候选问题，作为生成的问题。
根据权利要求1或2所述的问题生成装置，其中，所述至少一个处理器被配置为：

根据对话上下文获取所述候选问题集合Q；

所述候选问题集合Q包括与所述对话上下文的相关程度满足阈值的、第一所选数目的候选问题q _i，i为小于或等于所述第一所选数目的正整数；

生成的至少一个问题包括待向对话目标提出的对话问题。
根据权利要求1-3任一项所述的问题生成装置，其中，每个候选问题的信息价值与该候选问题带来的信息量的期望值正相关。
根据权利要求1-4任一项所述的问题生成装置，其中，所述至少一个处理器还被配置为：

获取与所述候选问题集合Q中各候选问题对应的答案a _j，得到答案集合A，其中，j为小于或等于所述第一所选数目的正整数，且j＝i表示答案a _j为候选问题q _i对应的答案。
根据权利要求1-5任一项所述的问题生成装置，其中，所述至少一个处理器被配置为通过
获得每个候选问题的信息价值，其中：

context表示对话上下文；

f(context,q _i,a _j)表示对于对话上下文context，每个候选问题q _i带来的信息量；

P(a _j|context,q _i)表示对于对话上下文context和候选问题q _i，产生答案a _j的概率。
根据权利要求1-6任一项所述的问题生成装置，其中：

每个候选问题q _i带来的信息量f(context,q _i,a _j)与候选问题q _i和对应的对话上下文context的相关程度正相关，且所述答案集合A中答案a _j的准确程度正相关；

概率P(a _j|context,q _i)与候选问题q _i和每一个其他候选问题的相似度正相关，且与该候选问题q _i的预测答案和所述答案集合A中的答案a _j的相似度正相关。
根据权利要求1-7任一项所述的问题生成装置，其中，概率P(a _j|context,q _i)表示为P(a _j|context,q _i)∝exp(cos(G(context,q _i),a _j))×cos(q _i,q _j)，其中，

cos(q _i,q _j)表示候选问题q _i和q _j的相似度，

G(context,q _i)表示候选问题q _i的预测答案，

cos(G(context,q _i),a _j)表示候选问题q _i的预测答案和所述答案集合A中的答案a _j的相似度。
根据权利要求1-8任一项所述的问题生成装置，其中：

利用第一循环神经网络来获得所述候选问题q _i的预测答案；

利用第二循环神经网络来计算每个候选问题q _i带来的信息量f(context,q _i,a _j)。
根据权利要求1-9任一项所述的问题生成装置，其中：

第一循环神经网络是门控循环单元网络；

第二循环神经网络是长短期记忆网络。
根据权利要求1-10任一项所述的问题生成装置，其中，所述至少一个处理器还被配置为：基于语料库和损失函数，使用随机梯度下降方法，训练以形成所述第一循环神经网络和所述第二循环神经网络，其中，

所述语料库包括训练用对话上下文Tcontext、训练用候选问题集合TQ和训练用答案集合TA，所述训练用候选问题集合TQ包括第二所选数目的训练用候选问题q _l，所述训练用答案集合TA包括与所述训练用候选问题集合TQ中各候选问题对应的答案a _m，l为小于或等于所述第二所选数目的正整数，m为小于或等于所述第二所选数目的正整数；

所述损失函数与每个候选问题q _l和每一个其他候选问题的相似度负相关，与该候选问题q _l的预测答案和所述训练用答案集合TA中的答案a _m的相似度负相关，与该候选问题q _l和对应的训练用对话上下文Tcontext的相关程度负相关，且与答案a _m的准确程度负相关。
根据权利要求1-11任一项所述的问题生成装置，其中，所述损失函数表示为

Loss＝∑ _l,m(L(Tcontext,q _l,a _m),+L(y _l,Tcontext,q _l,a _m))，其中，

L(y _l,Tcontext,q _l,a _m)＝-y _llog(σ(LSTM(Tcontext,q _l,a _m)))，

cos(q _l,q _n)表示候选问题q _l和q _n的相似度，G(Tcontext,q _l)表示候选问题q _l的预测答案，cos(G(Tcontext,q _l),a _m)表示候选问题q _l的预测答案和答案a _m的相似度，cos(G(Tcontext,q _l),a _n)表示候选问题q _l的预测答案和所述训练用答案集合中的答案a _n的相似度，n为小于或等于所述第二所选数目的正整数；

在l等于m的情况下y _l＝1，在l不等于m的情况下y _l＝0；

σ是sigmoid函数；

LSTM(Tcontext,q _l,a _m)表示对于训练用对话上下文Tcontext，候选问题q _l带来的信息量。
一种问诊系统，包括权利要求3-12任一项所述的问题生成装置，所述对话为医疗问诊中的对话交互，所述对话目标为患者；所述问题生成装置配置成根据所述问诊上下文，生成待向患者提出的问诊问题。
根据权利要求13所述的问诊系统，还包括:

输入设备，配置成获取问诊上下文；

输出设备，配置成输出所述问诊问题。
根据权利要求13-14任一项所述的问题生成装置，其中，所述问诊上下文包括所述患者的描述。
根据权利要求13-15任一项所述的问题生成装置，其中，所述问诊上下文包括已向所述患者提出的问诊问题。
一种问题生成方法，包括：

获取候选问题集合Q；

计算所述候选问题集合Q中每个候选问题的信息价值；

根据各候选问题的信息价值，生成至少一个问题。
根据权利要求17所述的问题生成方法，其中，生成至少一个问题包括：

从所述候选问题集合Q中选择信息价值最大的候选问题，作为生成的问题。
根据权利要求17或18所述的问题生成方法，其中：

根据对话上下文获取所述候选问题集合Q；

所述候选问题集合Q包括与所述对话上下文的相关程度满足阈值的、第一所选数目的候选问题q _i，i为小于或等于所述第一所选数目的正整数；

生成的至少一个问题包括待向对话目标提出的对话问题。
根据权利要求17-19任一项所述的问题生成方法，其中，根据每个候选问题带来的信息量的期望值，计算所述候选问题集合Q中每个候选问题的信息价值。
根据权利要求17-20任一项所述的问题生成方法，还包括：

获取与所述候选问题集合Q中各候选问题对应的答案a _j，得到答案集合A，其中，j为小于或等于所述第一所选数目的正整数，且j＝i表示答案a _j为候选问题q _i对应的答案。
根据权利要求17-21任一项所述的问题生成方法，其中，每个候选问题的信息价值表示为
其中：

每个候选问题带来的信息量为f(context,q _i,a _j)，表示对于对话上下文context，候选问题q _i带来的信息量；

P(a _j|context,q _i)表示对于对话上下文context和候选问题q _i，产生答案a _j的概率。
根据权利要求17-22任一项所述的问题生成方法，其中：

每个候选问题带来的信息量f(context,q _i,a _j)与候选问题q _i和对应的对话上下文context的相关程度正相关，且所述答案集合A中答案a _j的准确程度正相关；

概率P(a _j|context,q _i)与候选问题q _i和每一个其他候选问题的相似度正相关，且与该候选问题q _i的预测答案和所述答案集合A中的答案a _j的相似度正相关。
根据权利要求17-23任一项所述的问题生成方法，其中：

利用第一循环神经网络来获得所述候选问题q _i的预测答案；

利用第二循环神经网络来计算每个候选问题q _i带来的信息量f(context,q _i,a _j)。
根据权利要求17-24任一项所述的问题生成方法，还包括：

基于语料库和损失函数，使用随机梯度下降方法，训练以形成所述第一循环神经网络和所述第二循环神经网络，其中，

所述语料库包括训练用对话上下文Tcontext、训练用候选问题集合TQ和训练用答案集合TA，所述训练用候选问题集合TQ包括第二所选数目的训练用候选问题q _l，所述训练用答案集合TA包括与所述训练用候选问题集合TQ中各候选问题对应的答案a _m，l为小于或等于所述第二所选数目的正整数，m为小于或等于所述第二所选数目的正整数；

所述损失函数与每个候选问题q _l和每一个其他候选问题的相似度负相关，与该候选问题q _l的预测答案和所述训练用答案集合TA中的答案a _m的相似度负相关，与该候选问题q _l和对应的训练用对话上下文Tcontext的相关程度负相关，且与答案a _m的准确程度负相关。
一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如权利要求17至25中任一项所述的问题生成方法。