CN113988070B - 调研问题生成方法、装置、计算机设备和存储介质 - Google Patents
调研问题生成方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113988070B CN113988070B CN202111179836.9A CN202111179836A CN113988070B CN 113988070 B CN113988070 B CN 113988070B CN 202111179836 A CN202111179836 A CN 202111179836A CN 113988070 B CN113988070 B CN 113988070B
- Authority
- CN
- China
- Prior art keywords
- information
- question
- portrait
- user
- outline
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种调研问题生成方法、装置、计算机设备和存储介质。该方法包括:在线问卷答复过程中,实时获取问题大纲信息,以及用户答题信息;根据所述问题大纲信息生成问题画像,以及根据所述用户答题信息生成用户画像;将所述问题画像以及所述用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取所述问题画像和所述用户画像中的关键信息;根据所述目标问题模板以及提取的关键信息生成追问问题。本申请能够提高在线问卷答复中追问问题的准确性。
Description
技术领域
本申请涉及计算机技术领域,具体而言,涉及一种调研问题生成方法、装置、计算机设备和存储介质。
背景技术
在实时线上问卷系统中进行在线问卷答复时,当受访者的答案内容、统计数据出乎组织者意料时,组织者将会根据受访者答案,对某些特定受访者,提出追问问题。传统方式中,追问问题一般是由组织者手动输入,是否需要追问,取决于组织者对数据的敏感度以及反应时间,受主观因素影响较多,往往不能准确追问,影响问卷效果。因此,如何提高在线问卷答复中追问问题的准确性,成为目前需要解决的一个技术问题。
发明内容
本申请的主要目的在于提供一种能够提高在线问卷答复中追问问题的准确性的调研问题生成方法、装置、计算机设备和存储介质。
为了实现上述目的,根据本申请的一个方面,提供了一种调研问题生成方法。
根据本申请的调研问题生成方法包括:
在线问卷答复过程中,实时获取问题大纲信息,以及用户答题信息;
根据所述问题大纲信息生成问题画像,以及根据所述用户答题信息生成用户画像;
将所述问题画像以及所述用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取所述问题画像和所述用户画像中的关键信息;
根据所述目标问题模板以及提取的关键信息生成追问问题。
在其中一个实施例中,所述根据所述问题大纲信息生成问题画像包括:
通过第一深度神经网络模型对所述问题大纲信息进行向量化处理,得到问题大纲向量;
获取问卷调研背景信息,将所述问卷调研背景信息输入至所述第一深度神经网络模型,输出调研背景向量;
将所述问题大纲向量与所述调研背景向量进行连接处理,得到问题画像。
在其中一个实施例中,所述根据所述用户答题信息生成用户画像包括:
通过第二深度神经网络模型对所述用户答题信息进行向量化处理,得到答题向量;
根据所述答题向量生成用户画像。
在其中一个实施例中,所述将所述问题画像以及所述用户画像与问卷知识库进行匹配,确定目标问题模板包括:
对所述问题画像以及所述用户画像进行向量化处理,得到目标问题向量;
计算所述目标问题向量与问卷知识库中问题模板之间的相似度;
选取相似度最大的问模板,确定为目标问题模板。
在其中一个实施例中,所述分别提取所述问题画像和所述用户画像中的关键信息包括:
将所述问题画像和所述用户画像输入至信息提取模型中,通过所述信息提取模型输出所述问题画像和所述用户画像中的关键信息。
在其中一个实施例中,所述根据所述目标问题模板以及提取的关键信息生成追问问题包括:
将提取的关键信息输入至目标问题模板的相应模板项中,得到追问问题。
在其中一个实施例中,所述方法还包括:
通过自然语言模型对所述问题画像、所述用户画像以及提取的关键信息进行预算处理,输出追问问题。
为了实现上述目的,根据本申请的另一方面,提供了一种调研问题生成装置。
根据本申请的调研问题生成装置包括:
信息获取模块,用于在线问卷答复过程中,实时获取问题大纲信息,以及用户答题信息;
画像生成模块,用于根据所述问题大纲信息生成问题画像,以及根据所述用户答题信息生成用户画像;
信息提取模块,用于将所述问题画像以及所述用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取所述问题画像和所述用户画像中的关键信息;
问题生成模块,用于根据所述目标问题模板以及提取的关键信息生成追问问题。
一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述各个方法实施例中的步骤。
上述调研问题生成方法、装置、计算机设备和存储介质,通过在线问卷答复过程中,实时获取问题大纲信息以及用户答题信息,从而根据问题大纲信息生成问题画像以及根据用户答题信息生成用户画像,为后续生成适合用户的追问问题提供数据支持。进而将问题画像以及用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取问题画像和用户画像中的关键信息,根据目标问题模板以及提取的关键信息生成追问问题。能够根据用户答题信息,利用数据分析、人工智能、自然语言处理等技术,自动发掘此次问卷潜藏的有价值的问题,并自动生成符合中文表达习惯的问题,能够提高追问问题的准确性,保证问卷效果,提高用户留存率。本实施例实现了自动追问,可以大大减少用户等待时间,解决了人工生成问句过程中,让受访者等待时间过长,导致受访者体验不好,影响答题质量的问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是一个实施例中调研问题生成方法的流程示意图;
图2为一个实施例中预先设置的问题大纲的部分结构示意图;
图3为一个实施例中预先设置的问题大纲的部分序号示意图;
图4为一个实施例中根据问题大纲信息生成问题画像步骤的流程示意图;
图5为一个实施例中调研问题生成装置的结构示意图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
现有的追问问题一般由组织者手动输入,是否需要追问,取决于组织者对数据的敏感度以及反应时间,受主观因素影响较多,往往不能准确追问,影响问卷效果。而且手动输入追问问题,使得受访者等待时间过长,影响受访者的答题质量。
本申请提供的调研问题生成方法,可以应用于实时线上问卷系统。具体的,用户可以通过终端登录实时线上问卷系统,在实时线上问卷系统中进行在线问卷答复,终端会实时获取用户的问题大纲信息,以及用户答题信息,从而根据问题大纲信息生成问题画像,以及根据用户答题信息生成用户画像,将问题画像以及用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取问题画像和用户画像中的关键信息,进而根据目标问题模板以及提取的关键信息生成追问问题。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。
在一个实施例中,如图1所示,提供了一种调研问题生成方法,包括如下的步骤102至步骤108:
步骤102,在线问卷答复过程中,实时获取问题大纲信息,以及用户答题信息。
用户答题信息包括用户已经答复过的问题以及对应的问题答复。
实时线上问卷系统中可以离线设置问题大纲,并将预先设置的问题大纲进行存储。在处于在线问卷答复时,将预先设置的问题大纲梳理为对应的问题大纲序列,将问题大纲序列确定为问题大纲信息。
预先设置的问题大纲为有向图结构。如图2所示,为一个实施例中,预先设置的问题大纲的部分结构示意图。其中,预先设置的问题大纲的数据格式为json格式。
{
“from”:“是否采取过措施”,
“answer”:“是”,
“to”:“采取过哪些措施”
}
下面为方便描述,将文本数据替换为序号进行描述。
例如,预先设置的问题大纲的部分序号示意图可以如图3所示,其中,Q1-Q6为用户已答复过的问题。从而将预先设置的问题大纲梳理为对应的问题大纲序列,即问题大纲信息表示为:
[Q1,Q2,Q3,Q5]
[Q1,Q2,Q6]
[Q1,Q2,Q4,Q6]
在线问卷答复过程中,获取问题大纲信息的同时,会获取用户答题信息。具体的,实时获取用户已经答复过的问题,以及对应的问题答复。将用户已经答复过的问题以及对应的问题答复,梳理为答题序列,将该答题序列确定为用户答题信息。多个用户针对相同问题时,问题答复不同,会产生不同的答题序列。因此,对于当前用户,其用户答题信息为问题大纲序列中的其中一个问题序列。例如,当前用户针对问题Q1的问题答复为A1时,用户答题信息可以表示为[Q1,A1,Q2,A2,Q3,A3,Q5,A4],而当前用户针对问题Q1的问题答复为A5时,用户答题信息可以表示为[Q1,A5,Q2,A6,Q6,A7]。此处,将问题答复(answer)的回答序号A1与文本数据的映射同样以键值对的形式存储在终端的内存或者磁盘上。
步骤104,根据问题大纲信息生成问题画像,以及根据用户答题信息生成用户画像。
根据问题大纲信息生成问题大纲向量。上述的问题大纲信息中包括三条问题向量序列[Q1,Q2,Q3,Q5]、[Q1,Q2,Q6]和[Q1,Q2,Q4,Q6],分别生成对应的问题大纲向量VQ1、VQ2和VQ3。从而构造调研背景序列。调研背景序列可以包括调研方向、调研范围、业务类型等。对该调研背景序列进行向量化处理,得到调研背景向量VC,将各问题大纲向量分别与调研背景向量进行连接,得到问题画像。问题画像中包括多个连接向量,其中,第一个问题大纲向量的连接向量可以表示为V1=concat(VQ1,VC),第二个问题大纲向量的连接向量可以表示为V2=concat(VQ2,VC),第三个问题大纲向量的连接向量可以表示为V3=concat(VQ3,VC)。
用户画像的生成方式与问题画像的生成方式是相同的,具体的,将用户答题信息进行向量化处理,得到对应的答题向量。进而根据答题向量生成用户画像。
步骤106,将问题画像以及用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取问题画像和用户画像中的关键信息。
实时线上问卷系统中还预先存储有问卷知识库,问卷知识库中包括多个问题模板。
在本实施例的一种可选的实现方式中,将问题画像以及用户画像与问卷知识库进行匹配,确定目标问题模板包括:对问题画像以及用户画像进行向量化处理,得到目标问题向量;计算目标问题向量与问卷知识库中问题模板之间的相似度;选取相似度最大的问模板,确定为目标问题模板。
在该实现方式中,可以采用深度神经网络模型进行向量化处理,例如,深度神经网络模型可以是:transformer、RNN(Recurrent Neural Network,循环神经网络)及其变种或者CNN(Convolutional Neural Network,卷积神经网络)中的至少一种。通过深度神经网络模型对问题画像以及用户画像进行向量化处理,输出目标问题向量G1。从而根据相似度算法,计算目标问题向量G1与问卷知识库中的每个问题模板之间的相似度,将计算的相似度进行排序,选取相似度最高的问题模型作为目标问题模板。能够准确。快速选取目标问题模板。
示例性的,目标问题模板可以是针对问题题型设置的,具体可以通过人工规则配置题型得到。当问题类型type为why时,则定义目标问题模板(简单的示例)为:
在本实施例的一种可选的实现方式中,分别提取问题画像和用户画像中的关键信息包括:将问题画像和用户画像输入至信息提取模型中,通过信息提取模型输出问题画像和用户画像中的关键信息。
在确定目标问题模板的同时,可以通过信息提取模型提取问题画像和用户画像中的关键信息。例如,信息提取模型可以是bert模型或LSTM+CRF等命名实体识别模型(NER:命名实体识别-Named-entity recognition)。关键信息可以包括上述目标问题模板中的action、description、object等信息。在该实现方式中,还可以将用户答题信息输入至信息提取模型中,提取关键信息。
步骤108,根据目标问题模板以及提取的关键信息生成追问问题。
在确定目标问题模板以及提取关键信息后,可以利用人工智能的方式,生成符合中文表达习惯的问题。
具体的,将提取的关键信息输入至目标问题模板的相应模板项中,得到追问问题。追问问题即调研问题。例如,将提取的关键信息,套用目标问题模板,生成问题“请问你为什么喜欢这个产品?”
在本实施例中,在线问卷答复过程中,实时获取问题大纲信息以及用户答题信息,从而根据问题大纲信息生成问题画像以及根据用户答题信息生成用户画像,为后续生成适合用户的追问问题提供数据支持。进而将问题画像以及用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取问题画像和用户画像中的关键信息,根据目标问题模板以及提取的关键信息生成追问问题。能够根据用户答题信息,利用数据分析、人工智能、自然语言处理等技术,自动发掘此次问卷潜藏的有价值的问题,并自动生成符合中文表达习惯的问题,能够提高追问问题的准确性,保证问卷效果,提高用户留存率。本实施例实现了自动追问,可以大大减少用户等待时间,解决了人工生成问句过程中,让受访者等待时间过长,导致受访者体验不好,影响答题质量的问题。
在一个实施例中,上述方法还包括:通过自然语言模型对问题画像、用户画像以及提取的关键信息进行预算处理,输出追问问题。
在一种实施例中,在生成追问问题的过程中,还可以利用自然语言生成技术(Natural Language Generation,简称NLG)的方式来生成追问问题。具体的,通过深度神经网络模型对问题画像以及用户画像进行向量化处理,输出目标问题向量G1,同时还需要通过深度神经网络模型对提取的关键信息进行向量化处理,得到关键向量。调用预先训练的自然语言模型,所述自然语言模型是基于Seq2seq框架的模型,例如BART等,将目标问题向量G1、关键向量输入至自然语言模型中,生成追问问题。
在本实施例中,通过自然语言模型生成追问问题,能够准确、快速生成追问问题。
在一个实施例中,如图4所示,根据问题大纲信息生成问题画像包括:
步骤402,通过第一深度神经网络模型对问题大纲信息进行向量化处理,得到问题大纲向量。
步骤404,获取问卷调研背景信息,将问卷调研背景信息输入至第一深度神经网络模型,输出调研背景向量。
步骤406,将问题大纲向量与调研背景向量进行连接处理,得到问题画像。
本实施例中可以采用第一深度神经网络模型进行向量化处理,例如,第一深度神经网络模型可以是:transformer、RNN(Recurrent Neural Network,循环神经网络)及其变种或者CNN(Convolutional Neural Network,卷积神经网络)中的至少一种。通过第一深度神经网络模型对问题大纲信息进行向量化处理,输出多个问题大纲向量。
还需要获取问卷调研背景信息,将问卷调研背景信息转换为调研背景序列。调研背景序列可以包括调研方向、调研范围、业务类型等。例如,调研背景序列可以包括问卷是定量调研还是定性调研,该品牌是国际品牌还是国内品牌,该产品所属的品类等信息。进而将各问题大纲向量分别与调研背景向量进行连接,得到问题画像。
进一步的,根据用户答题信息生成用户画像包括:通过第二深度神经网络模型对用户答题信息进行向量化处理,得到答题向量。根据答题向量生成用户画像。用户画像生成过程中采用的第二深度神经网络与第二深度神经网络可以是同一类型的深度神经网络,也可以是不同类型的深度神经网络。
在本实施例中,通过深度神经网络模型进行向量化处理,能够提高问题画像和用户画像的生成效率。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在一个实施例中,如图5所示,提供了一种调研问题生成装置,包括:信息获取模块502、画像生成模块504、信息提取模块506和问题生成模块508,其中:
信息获取模块502,用于在线问卷答复过程中,实时获取问题大纲信息,以及用户答题信息。
画像生成模块504,用于根据问题大纲信息生成问题画像,以及根据用户答题信息生成用户画像。
信息提取模块506,用于将问题画像以及用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取问题画像和用户画像中的关键信息。
问题生成模块508,用于根据目标问题模板以及提取的关键信息生成追问问题。
在一个实施例中,画像生成模块504包括:
问题画像生成模块,用于用于通过第一深度神经网络模型对问题大纲信息进行向量化处理,得到问题大纲向量;获取问卷调研背景信息,将问卷调研背景信息输入至第一深度神经网络模型,输出调研背景向量;将问题大纲向量与调研背景向量进行连接处理,得到问题画像。
在一个实施例中,画像生成模块504包括:
用户画像生成模块,用于通过第二深度神经网络模型对用户答题信息进行向量化处理,得到答题向量;根据答题向量生成用户画像。
在一个实施例中,信息提取模块506包括:
问题模板确定模块,用于用于对问题画像以及用户画像进行向量化处理,得到目标问题向量;计算目标问题向量与问卷知识库中问题模板之间的相似度;选取相似度最大的问模板,确定为目标问题模板。
在一个实施例中,信息提取模块506包括:
关键信息提取模块,用于将问题画像和用户画像输入至信息提取模型中,通过信息提取模型输出问题画像和用户画像中的关键信息。
在一个实施例中,问题生成模块508还用于将提取的关键信息输入至目标问题模板的相应模板项中,得到追问问题。
在一个实施例中,上述装置还包括:
自然语言模块,用于通过自然语言模型对问题画像、用户画像以及提取的关键信息进行预算处理,输出追问问题。
关于调研问题生成装置的具体限定可以参见上文中对于调研问题生成方法的限定,在此不再赘述。上述调研问题生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种调研问题生成方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
在线问卷答复过程中,实时获取问题大纲信息,以及用户答题信息;
根据问题大纲信息生成问题画像,以及根据用户答题信息生成用户画像;
将问题画像以及用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取问题画像和用户画像中的关键信息;
根据目标问题模板以及提取的关键信息生成追问问题。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
通过第一深度神经网络模型对问题大纲信息进行向量化处理,得到问题大纲向量;
获取问卷调研背景信息,将问卷调研背景信息输入至第一深度神经网络模型,输出调研背景向量;
将问题大纲向量与调研背景向量进行连接处理,得到问题画像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
通过第二深度神经网络模型对用户答题信息进行向量化处理,得到答题向量;
根据答题向量生成用户画像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对问题画像以及用户画像进行向量化处理,得到目标问题向量;
计算目标问题向量与问卷知识库中问题模板之间的相似度;
选取相似度最大的问模板,确定为目标问题模板。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将问题画像和用户画像输入至信息提取模型中,通过信息提取模型输出问题画像和用户画像中的关键信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将提取的关键信息输入至目标问题模板的相应模板项中,得到追问问题。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
通过自然语言模型对问题画像、用户画像以及提取的关键信息进行预算处理,输出追问问题。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
在线问卷答复过程中,实时获取问题大纲信息,以及用户答题信息;
根据问题大纲信息生成问题画像,以及根据用户答题信息生成用户画像;
将问题画像以及用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取问题画像和用户画像中的关键信息;
根据目标问题模板以及提取的关键信息生成追问问题。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
通过第一深度神经网络模型对问题大纲信息进行向量化处理,得到问题大纲向量;
获取问卷调研背景信息,将问卷调研背景信息输入至第一深度神经网络模型,输出调研背景向量;
将问题大纲向量与调研背景向量进行连接处理,得到问题画像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
通过第二深度神经网络模型对用户答题信息进行向量化处理,得到答题向量;
根据答题向量生成用户画像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对问题画像以及用户画像进行向量化处理,得到目标问题向量;
计算目标问题向量与问卷知识库中问题模板之间的相似度;
选取相似度最大的问模板,确定为目标问题模板。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将问题画像和用户画像输入至信息提取模型中,通过信息提取模型输出问题画像和用户画像中的关键信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将提取的关键信息输入至目标问题模板的相应模板项中,得到追问问题。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
通过自然语言模型对问题画像、用户画像以及提取的关键信息进行预算处理,输出追问问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (9)
1.一种调研问题生成方法,其特征在于,包括:
在线问卷答复过程中,实时获取问题大纲信息,以及用户答题信息;
所述获取问题大纲信息,以及用户答题信息,包括:
将预先设置的问题大纲梳理为对应的问题大纲序列,将问题大纲序列确定为问题大纲信息;所述问题大纲为有向图结构;
将用户已经答复过的问题以及对应的问题答复,梳理为答题序列,将该答题序列确定为用户答题信息;
根据所述问题大纲信息生成问题画像,以及根据所述用户答题信息生成用户画像;
将所述问题画像以及所述用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取所述问题画像和所述用户画像中的关键信息;
根据所述目标问题模板以及提取的关键信息生成追问问题;
所述根据所述问题大纲信息生成问题画像包括:
通过第一深度神经网络模型对所述问题大纲信息进行向量化处理,得到问题大纲向量;
获取问卷调研背景信息,将所述问卷调研背景信息输入至所述第一深度神经网络模型,输出调研背景向量;
将所述问题大纲向量与所述调研背景向量进行连接处理,得到问题画像;
所述方法还包括将问卷调研背景信息转换为调研背景序列,所述调研背景序列包括调研方向、调研范围和业务类型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户答题信息生成用户画像包括:
通过第二深度神经网络模型对所述用户答题信息进行向量化处理,得到答题向量;
根据所述答题向量生成用户画像。
3.根据权利要求1所述的方法,其特征在于,所述将所述问题画像以及所述用户画像与问卷知识库进行匹配,确定目标问题模板包括:
对所述问题画像以及所述用户画像进行向量化处理,得到目标问题向量;
计算所述目标问题向量与问卷知识库中问题模板之间的相似度;
选取相似度最大的问模板,确定为目标问题模板。
4.根据权利要求1所述的方法,其特征在于,所述分别提取所述问题画像和所述用户画像中的关键信息包括:
将所述问题画像和所述用户画像输入至信息提取模型中,通过所述信息提取模型输出所述问题画像和所述用户画像中的关键信息。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标问题模板以及提取的关键信息生成追问问题包括:
将提取的关键信息输入至目标问题模板的相应模板项中,得到追问问题。
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述方法还包括:
通过自然语言模型对所述问题画像、所述用户画像以及提取的关键信息进行预算处理,输出追问问题。
7.一种调研问题生成装置,其特征在于,所述装置包括:
信息获取模块,用于在线问卷答复过程中,实时获取问题大纲信息,以及用户答题信息;
所述获取问题大纲信息,以及用户答题信息,包括:
将预先设置的问题大纲梳理为对应的问题大纲序列,将问题大纲序列确定为问题大纲信息;所述问题大纲为有向图结构;
将用户已经答复过的问题以及对应的问题答复,梳理为答题序列,将该答题序列确定为用户答题信息;
画像生成模块,用于根据所述问题大纲信息生成问题画像,以及根据所述用户答题信息生成用户画像;
信息提取模块,用于将所述问题画像以及所述用户画像与问卷知识库进行匹配,确定目标问题模板,以及分别提取所述问题画像和所述用户画像中的关键信息;
问题生成模块,用于根据所述目标问题模板以及提取的关键信息生成追问问题;
所述根据所述问题大纲信息生成问题画像包括:
通过第一深度神经网络模型对所述问题大纲信息进行向量化处理,得到问题大纲向量;
获取问卷调研背景信息,将所述问卷调研背景信息输入至所述第一深度神经网络模型,输出调研背景向量;
将所述问题大纲向量与所述调研背景向量进行连接处理,得到问题画像;
还包括将问卷调研背景信息转换为调研背景序列,所述调研背景序列包括调研方向、调研范围和业务类型。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111179836.9A CN113988070B (zh) | 2021-10-09 | 2021-10-09 | 调研问题生成方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111179836.9A CN113988070B (zh) | 2021-10-09 | 2021-10-09 | 调研问题生成方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113988070A CN113988070A (zh) | 2022-01-28 |
CN113988070B true CN113988070B (zh) | 2023-05-05 |
Family
ID=79738041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111179836.9A Active CN113988070B (zh) | 2021-10-09 | 2021-10-09 | 调研问题生成方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113988070B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245213A (zh) * | 2019-05-08 | 2019-09-17 | 平安科技(深圳)有限公司 | 调查问卷生成方法、装置、设备和存储介质 |
CN112700271A (zh) * | 2020-12-29 | 2021-04-23 | 长威信息科技发展股份有限公司 | 一种基于标签模型的大数据画像方法及系统 |
WO2021174812A1 (zh) * | 2020-03-02 | 2021-09-10 | 平安科技(深圳)有限公司 | 用于画像的数据的清洗方法、装置、介质及电子设备 |
WO2021189922A1 (zh) * | 2020-10-19 | 2021-09-30 | 平安科技(深圳)有限公司 | 用户画像生成方法、装置、设备及介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109918650B (zh) * | 2019-02-03 | 2020-10-23 | 北京大学 | 自动生成采访稿的采访智能机器人装置及智能采访方法 |
CN110837551B (zh) * | 2019-11-27 | 2022-06-28 | 广州快决测信息科技有限公司 | 一种在线数据采集的方法及系统 |
CN113051375B (zh) * | 2019-12-27 | 2024-06-14 | 阿里巴巴集团控股有限公司 | 基于问答设备的问答数据的处理方法和装置 |
CN113110767B (zh) * | 2020-01-10 | 2024-07-23 | 阿里巴巴集团控股有限公司 | 一种交互方法和装置 |
CN111797202B (zh) * | 2020-06-28 | 2021-07-16 | 国义招标股份有限公司 | 一种基于人工智能的客服对话方法 |
-
2021
- 2021-10-09 CN CN202111179836.9A patent/CN113988070B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245213A (zh) * | 2019-05-08 | 2019-09-17 | 平安科技(深圳)有限公司 | 调查问卷生成方法、装置、设备和存储介质 |
WO2021174812A1 (zh) * | 2020-03-02 | 2021-09-10 | 平安科技(深圳)有限公司 | 用于画像的数据的清洗方法、装置、介质及电子设备 |
WO2021189922A1 (zh) * | 2020-10-19 | 2021-09-30 | 平安科技(深圳)有限公司 | 用户画像生成方法、装置、设备及介质 |
CN112700271A (zh) * | 2020-12-29 | 2021-04-23 | 长威信息科技发展股份有限公司 | 一种基于标签模型的大数据画像方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113988070A (zh) | 2022-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108427707B (zh) | 人机问答方法、装置、计算机设备和存储介质 | |
CN110457431B (zh) | 基于知识图谱的问答方法、装置、计算机设备和存储介质 | |
CN109960725B (zh) | 基于情感的文本分类处理方法、装置和计算机设备 | |
CN108256591B (zh) | 用于输出信息的方法和装置 | |
CN110334179B (zh) | 问答处理方法、装置、计算机设备和存储介质 | |
CN111079056A (zh) | 提取用户画像的方法、装置、计算机设备和存储介质 | |
CN110442697B (zh) | 一种人机交互方法、系统、计算机设备和存储介质 | |
CN108491511A (zh) | 基于图数据的数据挖掘方法和装置、模型训练方法和装置 | |
CN109977394B (zh) | 文本模型训练方法、文本分析方法、装置、设备及介质 | |
CN110750523A (zh) | 数据标注方法、系统、计算机设备和存储介质 | |
CN110931012A (zh) | 答复消息生成方法、装置、计算机设备和存储介质 | |
CN115017288A (zh) | 模型训练方法、模型训练装置、设备及存储介质 | |
CN114647713A (zh) | 基于虚拟对抗的知识图谱问答方法、设备及存储介质 | |
CN111242840A (zh) | 手写体字符生成方法、装置、计算机设备和存储介质 | |
CN111475628B (zh) | 会话数据处理方法、装置、计算机设备和存储介质 | |
CN111400340A (zh) | 一种自然语言处理方法、装置、计算机设备和存储介质 | |
CN112397197A (zh) | 基于人工智能的问诊数据处理方法及装置 | |
CN114253990A (zh) | 数据库查询方法、装置、计算机设备和存储介质 | |
CN111124898A (zh) | 问答系统测试方法、装置、计算机设备和存储介质 | |
CN111144407A (zh) | 一种目标检测方法、系统、装置及可读存储介质 | |
CN114357195A (zh) | 基于知识图谱的问答对生成方法、装置、设备及介质 | |
CN111079894B (zh) | Bp神经网络模型构建、商家评价方法与装置 | |
CN113988070B (zh) | 调研问题生成方法、装置、计算机设备和存储介质 | |
CN111309882B (zh) | 用于实现智能客服问答的方法和装置 | |
CN117155892A (zh) | 交互处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |