CN114547242A - 一种问卷调研的方法、装置、电子设备及可读存储介质 - Google Patents

一种问卷调研的方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN114547242A
CN114547242A CN202210135859.8A CN202210135859A CN114547242A CN 114547242 A CN114547242 A CN 114547242A CN 202210135859 A CN202210135859 A CN 202210135859A CN 114547242 A CN114547242 A CN 114547242A
Authority
CN
China
Prior art keywords
questionnaire
target
unanswered
question
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210135859.8A
Other languages
English (en)
Inventor
刘欢欢
李育辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Strontium Technology Co ltd
Original Assignee
Beijing Strontium Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Strontium Technology Co ltd filed Critical Beijing Strontium Technology Co ltd
Priority to CN202210135859.8A priority Critical patent/CN114547242A/zh
Publication of CN114547242A publication Critical patent/CN114547242A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请属于数据处理领域,公开了一种问卷调研的方法、装置、电子设备及可读存储介质,该方法包括,获取目标用户针对待处理的目标问卷的问卷答复信息,目标问卷中包含至少一个未答复题目;分别预测目标问卷中每一未答复题目的预测答案;根据问卷答复信息以及每一未答复题目的预测答案,生成目标问卷的问卷调研结果。这样,在进行问卷调查时,可以减少数据的浪费。

Description

一种问卷调研的方法、装置、电子设备及可读存储介质
技术领域
本申请涉及数据处理领域,具体而言,涉及一种问卷调研的方法、装置、电子设备及可读存储介质。
背景技术
随着互联网的快速发展,在进行广泛的信息采集时,通常可以采用问卷调查的方式。
现有技术下,在进行问卷调查时,通常采用线上的问卷调查的形式,传统的纸质问卷的比例大幅度减少。
但是,目前的线上问卷调查,问卷题目较多,篇幅较长,很多受访者通常在完成部分题目后中途退出,导致该问卷调查完不成,只能将该问卷调查的数据进行丢弃,造成了数据浪费。
由此,在进行问卷调查时,如何减少数据的浪费,是一个需要解决的技术问题。
发明内容
本申请实施例的目的在于提供一种问卷调研的方法、装置、电子设备及可读存储介质,用以在进行问卷调查时,减少数据的浪费。
一方面,提供一种问卷调研的方法,包括:获取目标用户针对待处理的目标问卷的问卷答复信息,目标问卷中包含至少一个未答复题目;分别预测目标问卷中每一未答复题目的预测答案;根据问卷答复信息以及每一未答复题目的预测答案,生成目标问卷的问卷调研结果。
在上述实现过程中,通过对目标问卷的未答复题目进行预测答案,并对未答复题目进行补全答案,使得存在未答复题目的无效问卷,转变为不存在未答复题目的有效问卷,避免了将该目标问卷丢弃的现象,减少了数据的浪费。
一种实施方式中,分别预测目标问卷中每一未答复题目的预测答案,包括:从目标问卷中的已答复题目中,分别确定每一未答复题目的关联题目;根据问卷答复信息,获取每一未答复题目的关联题目的问卷答案;根据至少一个未答复题目的关联题目的问卷答案,分别确定目标问卷中每一未答复题目的预测答案。
在上述实现过程中,通过确定未答复题目的关联题目,并根据关联题目的问卷答案,确定未答复题目的预测答案,提高了预测答案的准确率。
一种实施方式中,从目标问卷中的已答复题目中,分别确定每一未答复题目的关联题目,包括:分别针对目标用户的每一未答复题目,执行以下步骤:提取目标用户的一个未答复题目的至少一个关键词;从目标问卷中的已答复题目中,筛选出与一个未答复题目的至少一个关键词匹配的关联题目。
在上述实现过程中,通过关键词确定未答复题目对应的关联题目,使得未答复题目和筛选出来的关联题目两者之间的关联性更强,提高了筛选的关联题目的精准度。
一种实施方式中,根据至少一个未答复题目的关联题目的问卷答案,分别确定目标问卷中每一未答复题目的预测答案,包括:分别针对目标用户的每一关联题目,执行以下步骤:获取多个历史答题用户针对一个关联题目的历史答案,并从多个历史答题用户中,筛选出一个关联题目的历史答案为一个关联题目的问卷答案的历史答题用户;分别获取筛选出的每一历史答题用户分别针对每一未答复题目的历史答案;分别根据每一未答复题目的历史答案,分别确定每一未答复题目的预测答案。
在上述实现过程中,目标问卷中未答复题目与关联题目的关联性很强,若筛选针对关联题目与目标问卷相同答案的历史答题用户,则针对未答复题目,筛选出的历史答题用户的历史答案为预测答案的可能性极大,将筛选出的历史答题用户针对未答复题目的历史答案,确定每一未答复题目的预测答案,提高了预测答案的准确度。
一种实施方式中,分别预测目标问卷中每一未答复题目的预测答案,包括:从多个历史答题用户中,筛选出目标用户的至少一个关联用户;分别获取筛选出的目标用户的至少一个关联用户分别针对每一未答复题目的历史答案;根据至少一个未答复题目的历史答案,分别确定每一未答复题目的预测答案。
在上述实现过程中,筛选目标用户的关联用户,目标用户和筛选出的关联用户的关联性很强,基于关联用户针对未答复题目的历史答案,确定目标问卷的未答复题目的预测答案,大大提高了预测答案的准确度。
一方面,提供一种问卷调研的装置,包括:获取单元,用于获取目标用户针对待处理的目标问卷的问卷答复信息,目标问卷中包含至少一个未答复题目;预测单元,用于分别预测目标问卷中每一未答复题目的预测答案;生成单元,用于根据问卷答复信息以及每一未答复题目的预测答案,生成目标问卷的问卷调研结果。
一种实施方式中,预测单元具体用于:从目标问卷中的已答复题目中,分别确定每一未答复题目的关联题目;根据问卷答复信息,获取每一未答复题目的关联题目的问卷答案;根据至少一个未答复题目的关联题目的问卷答案,分别确定目标问卷中每一未答复题目的预测答案。
一种实施方式中,预测单元具体用于:分别针对目标用户的每一未答复题目,执行以下步骤:提取目标用户的一个未答复题目的至少一个关键词;从目标问卷中的已答复题目中,筛选出与一个未答复题目的至少一个关键词匹配的关联题目。
一种实施方式中,预测单元具体用于:分别针对目标用户的每一关联题目,执行以下步骤:获取多个历史答题用户针对一个关联题目的历史答案,并从多个历史答题用户中,筛选出一个关联题目的历史答案为一个关联题目的问卷答案的历史答题用户;分别获取筛选出的每一历史答题用户分别针对每一未答复题目的历史答案;分别根据每一未答复题目的历史答案,分别确定每一未答复题目的预测答案。
一种实施方式中,预测单元具体用于:从多个历史答题用户中,筛选出目标用户的至少一个关联用户;分别获取筛选出的目标用户的至少一个关联用户分别针对每一未答复题目的历史答案;根据至少一个未答复题目的历史答案,分别确定每一未答复题目的预测答案。
一方面,提供了一种电子设备,包括处理器以及存储器,存储器存储有计算机可读取指令,当计算机可读取指令由处理器执行时,运行如上述任一种问卷调研的各种可选实现方式中提供的方法的步骤。
一方面,提供了一种可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时运行如上述任一种问卷调研的各种可选实现方式中提供的方法的步骤。
一方面,提供了一种计算机程序产品,计算机程序产品在计算机上运行时,使得计算机执行如上述任一种问卷调研的各种可选实现方式中提供的方法的步骤。
本申请实施例提供的一种问卷调研的方法、装置、电子设备及可读存储介质中,获取目标用户针对待处理的目标问卷的问卷答复信息,目标问卷中包含至少一个未答复题目;分别预测目标问卷中每一未答复题目的预测答案;根据问卷答复信息以及每一未答复题目的预测答案,生成目标问卷的问卷调研结果。这样,通过对目标问卷的未答复题目进行预测答案,并对未答复题目进行补全答案,使得存在未答复题目的无效问卷,转变为不存在未答复题目的有效问卷,避免了将该目标问卷丢弃的现象,减少了数据的浪费。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种问卷调研的系统架构示意图;
图2为本申请实施例提供的一种问卷调研的方法的实施流程图;
图3为本申请实施例提供的一种问卷调研的方法的详细实施流程图;
图4为本申请实施例提供的一种问卷调研的装置的结构框图;
图5为本申请实施方式中一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
首先对本申请实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。
终端设备:可以是移动终端、固定终端或便携式终端,例如移动手机、站点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信系统设备、个人导航设备、个人数字助理、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合,包括这些设备的配件和外设或者其任意组合。还可预见到的是,终端设备能够支持任意类型的针对用户的接口(例如可穿戴设备)等。
服务器:可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务以及大数据和人工智能平台等基础云计算服务的云服务器。
为了在进行问卷调查时,可以减少数据的浪费,本申请实施例提供了一种问卷调研的方法、装置、电子设备及可读存储介质。
参阅图1所示,为本申请实施例提供的一种问卷调研的系统架构示意图。该系统架构示意图中包含设置有问卷调研模块的服务器,以及用户终端。其中,用户终端可以为服务器,也可以为终端设置,在此不作限制。
其中,用户终端用于:接收针对目标用户填写目标问卷的问卷答复信息,并将目标问卷的问卷答复信息发送给服务器。
服务器用于:接收用户终端发送的目标用户针对待处理的目标问卷的问卷答复信息,并分别预测目标问卷中每一个未答复题目的预测答案,以及根据问卷答复信息以及每一个未答复题目的预测答案,生成目标问卷的问卷调研结果。
一种实施方式中,用户终端接收针对目标用户填写目标问卷的问卷答复信息,并将目标问卷的问卷答复信息发送给服务器。服务器接收用户终端发送的目标用户针对待处理的目标问卷的问卷答复信息,并分别预测目标问卷中每一个未答复题目的预测答案,以及根据问卷答复信息以及每一个未答复题目的预测答案,生成目标问卷的问卷调研结果。
这样,就可以针对存在未答复题目的目标问卷,将未答复题目补充完整,避免因为存在未答复题目只能将该目标问卷的数据丢弃的现象,减少了数据的浪费。
本申请实施例中,仅以执行主体为服务器为例进行说明,实际应用中,执行主体也可以为终端设备等其他电子设备,在此不作限制。
参阅图2所示,为本申请实施例提供的一种问卷调研的方法的实施流程图,结合图1问卷调研的系统中的服务器,该方法的具体实施流程如下:
步骤200:获取目标用户针对待处理的目标问卷的问卷答复信息。
具体的,获取目标用户针对存在未答复题目的目标问卷,并获取目标问卷的问卷调查信息。
其中,问卷调查信息包含目标问卷中的每一题目和目标用户选择的对应的答案。
其中,目标问卷中包含至少一个未答复题目。
步骤201:分别预测目标问卷中每一未答复题目的预测答案。
具体的,执行步骤201,可以执行以下步骤:
S2011:从目标问卷中的已答复题目中,分别确定每一未答复题目的关联题目。
具体的,执行步骤S2011,可以分别针对目标用户的每一未答复题目,执行以下步骤:
步骤一:提取目标用户的一个未答复题目的至少一个关键词。
具体的,采用文本识别算法,识别目标用户针对目标问卷中的一个未答复题目的至少一个关键词,并提取上述未答复题目的识别出的至少一个关键词。
可选的,文本识别算法可以为光学字符识别(Optical Character Recognition,OCR)算法。
一种实施方式中,采用OCR算法识别目标用户针对目标问卷中的一个未答复题目的至少一个关键词,并提取上述未答复题目的识别出的至少一个关键词。
实际应用中,也可以根据实际应用情况,采用其它算法进行文本识别,在此不作限制。
这样,就可以提取目标用户的一个未答复题目的至少一个关键词。
步骤二:从目标问卷中的已答复题目中,筛选出与一个未答复题目的至少一个关键词匹配的关联题目。
具体的,将提取出的至少一个关键词,分别与目标问卷中的每一已答复题目进行匹配,并筛选出与一个未答复题目的至少一个关键词匹配的已答复题目,以及将筛选出的已答复题目称为该未答复题目的关联题目。
其中,匹配到的关联题目包含关键词。
进一步的,匹配到的关联题目不一定包含关键词,关联题目可以包含与关键词相近的词语。
一种实施方式中,将一个未答复题目的至少一个关键词,分别与目标问卷中的每一已答复题目进行匹配,分别获得该一个未答复题目与目标问卷中的每一已答复题目的匹配度,将获取的匹配度超过预设阈值匹配度的已答复题目,确定为该一个未答复题目的关联题目。
其中,匹配度的取值范围可以为0-1。
进一步的,还可以按照匹配度降序的方式将各已答复题目进行排序,取前3的已答复题目,确定为该一个未答复题目的关联题目。
实际应用中,也可以根据实际应用情况采用其他方式进行排序,在此不作限制。
这样,就可以从目标问卷中的已答复题目中,筛选出与一个未答复题目的至少一个关键词匹配的关联题目。
S2012:根据问卷答复信息,获取每一未答复题目的关联题目的问卷答案。
具体的,根据目标问卷的问卷答复信息,获取每一个未答复题目的关联题目对应的答案。
S2013:根据至少一个未答复题目的关联题目的问卷答案,分别确定目标问卷中每一未答复题目的预测答案。
具体的,执行步骤S2013,可以执行以下步骤:
步骤A:分别针对目标用户的每一关联题目,执行以下步骤:获取多个历史答题用户针对一个关联题目的历史答案,并从多个历史答题用户中,筛选出一个关联题目的历史答案为一个关联题目的问卷答案的历史答题用户。
具体的,获取多个历史答题用户针对一个关联题目的历史答案,并根据历史答案,从多个历史答题用户中,筛选出一个关联题目的历史答案为一个关联题目的问卷答案的历史答题用户。
需要说明的是,分别针对目标用户的每一未答复题目的每一关联题目,执行上述步骤A。
这样,就可以筛选出一个关联题目的历史答案为一个关联题目的问卷答案的历史答题用户。
步骤B:分别获取筛选出的每一历史答题用户分别针对每一未答复题目的历史答案。
具体的,分别获取筛选出的每一历史答题用户分别针对每一未答复题目做出的历史答案。
步骤C:分别根据每一未答复题目的历史答案,分别确定每一未答复题目的预测答案。
具体的,分别根据每一未答复题目的历史答案,确定每一未答复题目的历史答案中占比最高的历史答案,并将每一占比最高的历史答案分别确定为每一未答复题目的预测答案。
进一步,还可以设置答案阈值,并分别根据至少一个未答复题目的历史答案,确定每一未答复题目的历史答案中的占比,以及将每一未答复题目的历史答案的占比中超过答案阈值的历史答案,分别确定为每一未答复题目的预测答案。
其中,答案阈值的取值范围可以为0-1或0-100%,例如,答案阈值为0.6或60%。
实际应用中,答案阈值可以根据实际应用情况进行设置,在此不作限制。
进一步的,若各历史答案的各占比中,没有超过答案阈值的,则该未答复题目补全答案失败。
这样,就可以分别根据每一未答复题目的历史答案,分别确定每一未答复题目的预测答案。
进一步,执行步骤201,还可以采用以下步骤:
步骤a:从多个历史答题用户中,筛选出目标用户的至少一个关联用户。
具体的,获取目标用户的目标用户标签,并获取多个历史答题用户的历史用户标签,以及筛选出至少一个与目标用户标签相同的历史用户标签对应的历史答题用户,并将上述至少一个历史答题用户确定为目标用户的至少一个关联用户。
可选的,目标用户标签和历史用户标签可以为职业、性别、年龄,以及居住城市等。
实际应用中,目标用户标签和历史用户标签可以根据实际应用情况进行设置,在此不作限制。
进一步,筛选出的历史答题用户的历史用户标签不一定与目标用户标签相同,也可以为语义相近的标签。
进一步的,在获取目标用户标签之前,先获取目标用户的特性数据。
其中,目标用户标签和历史用户标签是基于用户的特性数据获得的。
可选的,特性数据可以为用户的职业、年龄、性别,以及居住城市等。
实际应用中,特性数据还可以根据实际应用情况进行确定,在此不作限制。
一种实施方式中,前置目标问卷题目“请问您的所属行业是?”,若目标用户回答信息技术(Information Technology,IT)行业,则为目标用户贴上“IT从业者”的目标用户标签。
可选的,为目标用户贴标签可以采用人群分类模型的方法。
实际应用中,为目标用户贴标签的方法可以根据实际应用情况进行设置,在此不作限制。
进一步的,目标用户的关联用户的确定可以不止根据用户标签,还可以根据其它条件进行确定。
实际应用中,目标用户确定关联用户的条件还可以根据实际应用情况进行设置,在此不作限制。
这样,就可以从多个历史答题用户中,筛选出目标用户的至少一个关联用户。
步骤b:分别获取筛选出的目标用户的至少一个关联用户分别针对每一未答复题目的历史答案。
具体的,分别获取筛选出的目标用户的至少一个关联用户分别针对每一未答复题目的历史答案。
一种实施方式中,目标用户的一个未答复题目为“请问贵公司的考勤制度是?A:9:00-17:00,B:9:00-18:00,C:弹性工作制,D:10:00-19:00”,若目标用户的关联用户的历史用户标签为“IT从业者”,则获取关联用户的针对该未答复题目的历史答案“C:弹性工作制”。
步骤c:根据至少一个未答复题目的历史答案,分别确定每一未答复题目的预测答案。
具体的,分别根据至少一个未答复题目的历史答案,确定每一未答复题目的历史答案中占比最高的历史答案,并将每一占比最高的历史答案分别确定为每一未答复题目的预测答案。
一种实施方式中,目标用户的一个未答复题目为“请问贵公司的考勤制度是?A:9:00-17:00,B:9:00-18:00,C:弹性工作制,D:10:00-19:00”,若目标用户的关联用户的历史用户标签为“IT从业者”,则获取关联用户的针对该未答复题目的各历史答案的占比,若关联用户选择“A:9:00-17:00”的占比为5%,关联用户选择“B:9:00-18:00”的占比为5%,关联用户选择“C:弹性工作制”的占比为70%,关联用户选择“D:10:00-19:00”的占比为20%,历史答案中占比最高的历史答案为“C:弹性工作制”,则将占比最高的历史答案“C:弹性工作制”确定为该未答复题目的预测答案。
进一步,还可以设置答案阈值,并分别根据至少一个未答复题目的历史答案,确定每一未答复题目的历史答案中的占比,以及将每一未答复题目的历史答案的占比中超过答案阈值的历史答案,分别确定为每一未答复题目的预测答案。
一种实施方式中,目标用户的一个未答复题目为“请问贵公司的考勤制度是?A:9:00-17:00,B:9:00-18:00,C:弹性工作制,D:10:00-19:00”,若目标用户的关联用户的历史用户标签为“IT从业者”,则获取关联用户的针对该未答复题目的各历史答案的占比,若关联用户选择“A:9:00-17:00”的占比为5%,关联用户选择“B:9:00-18:00”的占比为5%,关联用户选择“C:弹性工作制”的占比为70%,关联用户选择“D:10:00-19:00”的占比为20%,预设的答案阈值为60%,则关联用户的针对该未答复题目的各历史答案的占比,“C:弹性工作制”的占比为70%超过了答案阈值,则将C:弹性工作制”确定为该未答复题目的预测答案。
其中,答案阈值的取值范围可以为0-1或0-100%,例如答案阈值为0.6或60%。
实际应用中,答案阈值可以根据实际应用情况进行设置,在此不作限制。
进一步的,若各历史答案的各占比中,没有超过答案阈值的,则该未答复题目补全答案失败。
进一步,还可以通过获取目标用户的关联用户,并从关联用户中筛选出针对关联题目的历史答案与关联题目的问卷答案相同的关联用户,基于筛选出的关联用户针对未答复题目的历史答案,确定预测答案。
这样,就可以根据至少一个未答复题目的历史答案,分别确定每一未答复题目的预测答案。
步骤202:根据问卷答复信息以及每一未答复题目的预测答案,生成目标问卷的问卷调研结果。
具体的,根据问卷答复信息以及每一未答复题目的预测答案,生成目标问卷的问卷调研结果。
这样,就可以根据问卷答复信息以及每一未答复题目的预测答案,生成目标问卷的问卷调研结果,避免对已答复题目的答案数据的丢弃,从而减少了数据浪费。
参阅图3所示,其为本申请实施例提供的一种问卷调研的方法的详细实施流程图,该方法的具体实施流程如下:
步骤300:获取目标用户针对待处理的目标问卷的问卷答复信息。
步骤301:判断目标问卷中是否存在未答复题目,若是,则执行步骤302,否则,执行步骤309。
步骤302:提取目标用户的每一未答复题目的至少一个关键词。
步骤303:从目标问卷中的已答复题目中,筛选出与每一未答复题目的至少一个关键词匹配的关联题目。
步骤304:根据问卷答复信息,获取每一未答复题目的关联题目的问卷答案。
步骤305:获取多个历史答题用户针对每一关联题目的历史答案,并从多个历史答题用户中,筛选出每一关联题目的历史答案为每一关联题目的问卷答案的历史答题用户。
步骤306:分别获取筛选出的每一历史答题用户分别针对每一未答复题目的历史答案。
步骤307:分别根据每一未答复题目的历史答案,分别确定每一未答复题目的预测答案。
步骤308:根据问卷答复信息以及每一未答复题目的预测答案,生成目标问卷的问卷调研结果。
步骤309:结束问卷调研流程。
具体的,执行步骤300-步骤309时,具体步骤参见上述步骤200-步骤202,在此不做赘述。
本申请实施例中,通过关键词获取未答复题目的关联题目,使得关联题目与未答复题目的关联性增强,并筛选出针对关联题目的历史答案与目标问卷的问卷答案相同的历史答题用户,并将筛选出的历史答题用户的历史答案为预测答案的可能性极大,将筛选出的历史答题用户针对未答复题目的历史答案,确定每一未答复题目的预测答案,提高了预测答案的准确度和精准度。或通过确定目标用户的关联用户,基于关联用户的历史答案,确定预测答案,大大提高了预测答案的准确度。
通过已答复题目和对应的答案的数据,确定未答复题目的预测答案的数据,也提高了已答复题目和对应的答案的数据的利用率。
通过对目标问卷的未答复题目进行预测答案,并对未答复题目进行补全答案,使得存在未答复题目的无效问卷,转变为不存在未答复题目的有效问卷,避免了因为存在未答复题目而将该目标问卷的数据丢弃的现象,减少了数据的浪费。
基于同一发明构思,本申请实施例中还提供了一种问卷调研的装置,如图4所示,其为本申请实施例提供的一种问卷调研的装置的结构示意图,包括:
获取单元401,用于获取目标用户针对待处理的目标问卷的问卷答复信息,目标问卷中包含至少一个未答复题目;预测单元402,用于分别预测目标问卷中每一未答复题目的预测答案;生成单元403,用于根据问卷答复信息以及每一未答复题目的预测答案,生成目标问卷的问卷调研结果。
一种实施方式中,预测单元402具体用于:从目标问卷中的已答复题目中,分别确定每一未答复题目的关联题目;根据问卷答复信息,获取每一未答复题目的关联题目的问卷答案;根据至少一个未答复题目的关联题目的问卷答案,分别确定目标问卷中每一未答复题目的预测答案。
一种实施方式中,预测单元402具体用于:分别针对目标用户的每一未答复题目,执行以下步骤:提取目标用户的一个未答复题目的至少一个关键词;从目标问卷中的已答复题目中,筛选出与一个未答复题目的至少一个关键词匹配的关联题目。
一种实施方式中,预测单元402具体用于:分别针对目标用户的每一关联题目,执行以下步骤:获取多个历史答题用户针对一个关联题目的历史答案,并从多个历史答题用户中,筛选出一个关联题目的历史答案为一个关联题目的问卷答案的历史答题用户;分别获取筛选出的每一历史答题用户分别针对每一未答复题目的历史答案;分别根据每一未答复题目的历史答案,分别确定每一未答复题目的预测答案。
一种实施方式中,预测单元402具体用于:从多个历史答题用户中,筛选出目标用户的至少一个关联用户;分别获取筛选出的目标用户的至少一个关联用户分别针对每一未答复题目的历史答案;根据至少一个未答复题目的历史答案,分别确定每一未答复题目的预测答案。
本申请实施例提供的一种问卷调研的方法、装置、电子设备及可读存储介质中,获取目标用户针对待处理的目标问卷的问卷答复信息,目标问卷中包含至少一个未答复题目;分别预测目标问卷中每一未答复题目的预测答案;根据问卷答复信息以及每一未答复题目的预测答案,生成目标问卷的问卷调研结果。这样,通过对目标问卷的未答复题目进行预测答案,并对未答复题目进行补全答案,使得存在未答复题目的无效问卷,转变为不存在未答复题目的有效问卷,避免了将该目标问卷丢弃的现象,减少了数据的浪费。
由于上述装置及设备解决问题的原理与一种问卷调研的方法相似,因此,上述装置的实施可以参见方法的实施,重复之处不再赘述。
图5示出了一种电子设备5000的结构示意图。参阅图5所示,电子设备5000包括:处理器5010以及存储器5020,可选的,还可以包括电源5030、显示单元5040、输入单元5050。
处理器5010是电子设备5000的控制中心,利用各种接口和线路连接各个部件,通过运行或执行存储在存储器5020内的软件程序和/或数据,执行电子设备5000的各种功能,从而对电子设备5000进行整体监控。
本申请实施例中,处理器5010调用存储器5020中存储的计算机程序时执行如图2中所示的实施例提供的问卷调研的方法。
可选的,处理器5010可包括一个或多个处理单元;优选的,处理器5010可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器5010中。在一些实施例中,处理器、存储器、可以在单一芯片上实现,在一些实施例中,它们也可以在独立的芯片上分别实现。
存储器5020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、各种应用等;存储数据区可存储根据电子设备5000的使用所创建的数据等。此外,存储器5020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件等。
电子设备5000还包括给各个部件供电的电源5030(比如电池),电源可以通过电源管理系统与处理器5010逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗等功能。
显示单元5040可用于显示由用户输入的信息或提供给用户的信息以及电子设备5000的各种菜单等,本发明实施例中主要用于显示电子设备5000中各应用的显示界面以及显示界面中显示的文本、图片等对象。显示单元5040可以包括显示面板5041。显示面板5041可以采用液晶显示屏(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置。
输入单元5050可用于接收用户输入的数字或字符等信息。输入单元5050可包括触控面板5051以及其他输入设备5052。其中,触控面板5051,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触摸笔等任何适合的物体或附件在触控面板5051上或在触控面板5051附近的操作)。
具体的,触控面板5051可以检测用户的触摸操作,并检测触摸操作带来的信号,将这些信号转换成触点坐标,发送给处理器5010,并接收处理器5010发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5051。其他输入设备5052可以包括但不限于物理键盘、功能键(比如音量控制按键、开关机按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
当然,触控面板5051可覆盖显示面板5041,当触控面板5051检测到在其上或附近的触摸操作后,传送给处理器5010以确定触摸事件的类型,随后处理器5010根据触摸事件的类型在显示面板5041上提供相应的视觉输出。虽然在图5中,触控面板5051与显示面板5041是作为两个独立的部件来实现电子设备5000的输入和输出功能,但是在某些实施例中,可以将触控面板5051与显示面板5041集成而实现电子设备5000的输入和输出功能。
电子设备5000还可包括一个或多个传感器,例如压力传感器、重力加速度传感器、接近光传感器等。当然,根据具体应用中的需要,上述电子设备5000还可以包括摄像头等其它部件,由于这些部件不是本申请实施例中重点使用的部件,因此,在图5中没有示出,且不再详述。
本领域技术人员可以理解,图5仅仅是电子设备的举例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
本申请实施例中,一种可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,使得通信设备可以执行上述实施例中的各个步骤。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种问卷调研的方法,其特征在于,包括:
获取目标用户针对待处理的目标问卷的问卷答复信息,所述目标问卷中包含至少一个未答复题目;
分别预测所述目标问卷中每一未答复题目的预测答案;
根据所述问卷答复信息以及所述每一未答复题目的预测答案,生成所述目标问卷的问卷调研结果。
2.如权利要求1所述的方法,其特征在于,所述分别预测所述目标问卷中每一未答复题目的预测答案,包括:
从所述目标问卷中的已答复题目中,分别确定每一未答复题目的关联题目;
根据所述问卷答复信息,获取每一未答复题目的关联题目的问卷答案;
根据所述至少一个未答复题目的关联题目的问卷答案,分别确定所述目标问卷中每一未答复题目的预测答案。
3.如权利要求2所述的方法,其特征在于,所述从所述目标问卷中的已答复题目中,分别确定每一未答复题目的关联题目,包括:
分别针对所述目标用户的每一未答复题目,执行以下步骤:
提取所述目标用户的一个未答复题目的至少一个关键词;
从所述目标问卷中的已答复题目中,筛选出与所述一个未答复题目的至少一个关键词匹配的关联题目。
4.如权利要求3所述的方法,其特征在于,所述根据所述至少一个未答复题目的关联题目的问卷答案,分别确定所述目标问卷中每一未答复题目的预测答案,包括:
分别针对所述目标用户的每一关联题目,执行以下步骤:获取多个历史答题用户针对一个关联题目的历史答案,并从所述多个历史答题用户中,筛选出所述一个关联题目的历史答案为所述一个关联题目的问卷答案的历史答题用户;
分别获取筛选出的每一历史答题用户分别针对每一未答复题目的历史答案;
分别根据每一未答复题目的历史答案,分别确定每一未答复题目的预测答案。
5.如权利要求1-4任一项所述的方法,其特征在于,所述分别预测所述目标问卷中每一未答复题目的预测答案,包括:
从多个历史答题用户中,筛选出所述目标用户的至少一个关联用户;
分别获取筛选出的所述目标用户的至少一个关联用户分别针对每一未答复题目的历史答案;
根据所述至少一个未答复题目的历史答案,分别确定每一未答复题目的预测答案。
6.一种问卷调研的装置,其特征在于,包括:
获取单元,用于获取目标用户针对待处理的目标问卷的问卷答复信息,所述目标问卷中包含至少一个未答复题目;
预测单元,用于分别预测所述目标问卷中每一未答复题目的预测答案;
生成单元,用于根据所述问卷答复信息以及所述每一未答复题目的预测答案,生成所述目标问卷的问卷调研结果。
7.如权利要求6所述的装置,其特征在于,所述预测单元具体用于:
从所述目标问卷中的已答复题目中,分别确定每一未答复题目的关联题目;
根据所述问卷答复信息,获取每一未答复题目的关联题目的问卷答案;
根据所述至少一个未答复题目的关联题目的问卷答案,分别确定所述目标问卷中每一未答复题目的预测答案。
8.如权利要求7所述的装置,其特征在于,所述预测单元具体用于:
分别针对所述目标用户的每一未答复题目,执行以下步骤:
提取所述目标用户的一个未答复题目的至少一个关键词;
从所述目标问卷中的已答复题目中,筛选出与所述一个未答复题目的至少一个关键词匹配的关联题目。
9.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-5任一所述方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-5任一所述方法。
CN202210135859.8A 2022-02-15 2022-02-15 一种问卷调研的方法、装置、电子设备及可读存储介质 Pending CN114547242A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210135859.8A CN114547242A (zh) 2022-02-15 2022-02-15 一种问卷调研的方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210135859.8A CN114547242A (zh) 2022-02-15 2022-02-15 一种问卷调研的方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN114547242A true CN114547242A (zh) 2022-05-27

Family

ID=81674825

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210135859.8A Pending CN114547242A (zh) 2022-02-15 2022-02-15 一种问卷调研的方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN114547242A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860823A (zh) * 2023-03-03 2023-03-28 深圳市人马互动科技有限公司 人机互动问卷答题场景中的数据处理方法及相关产品

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860823A (zh) * 2023-03-03 2023-03-28 深圳市人马互动科技有限公司 人机互动问卷答题场景中的数据处理方法及相关产品

Similar Documents

Publication Publication Date Title
CN112632385A (zh) 课程推荐方法、装置、计算机设备及介质
CN111461553A (zh) 景区舆情监测分析系统和方法
CN107004212B (zh) 根据社交媒体和其它数字轨迹对动作、结果和目标实现进行建模
CN113870083A (zh) 政策匹配的方法、装置、系统、电子设备及可读存储介质
CN110209810A (zh) 相似文本识别方法以及装置
CN115022098B (zh) 人工智能安全靶场内容推荐方法、装置及存储介质
CN111475632A (zh) 问句处理方法、装置、电子设备及存储介质
CN111026967A (zh) 一种获得用户兴趣标签的方法、装置、设备和介质
CN114357278A (zh) 一种话题推荐方法、装置及设备
CN112685578A (zh) 一种多媒体信息内容提供方法及装置
CN114428842A (zh) 一种扩充问答库的方法、装置、电子设备及可读存储介质
CN113407738B (zh) 一种相似文本检索方法、装置、电子设备和存储介质
CN114547242A (zh) 一种问卷调研的方法、装置、电子设备及可读存储介质
CN110866114B (zh) 对象行为的识别方法、装置及终端设备
CN111506718A (zh) 会话消息确定方法、装置、计算机设备和存储介质
CN115328303A (zh) 用户交互的方法、装置、电子设备及计算机可读存储介质
CN113505293B (zh) 信息推送方法、装置、电子设备及存储介质
CN112084780B (zh) 自然语言处理中共指消解方法、装置、设备及介质
CN115525761A (zh) 一种文章关键词筛选类别的方法、装置、设备及存储介质
CN111078972B (zh) 提问行为数据的获取方法、装置和服务器
CN110807330B (zh) 语义理解模型评估方法、装置及存储介质
CN116205686A (zh) 一种多媒体资源推荐的方法、装置、设备和存储介质
CN113743721A (zh) 营销策略生成方法、装置、计算机设备及存储介质
CN112748828A (zh) 一种信息处理方法、装置、终端设备及介质
US11956385B2 (en) Systems and methods for utilizing a machine learning model to determine an intent of a voice customer in real time

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Li Yuhui

Inventor after: Liu Huanhuan

Inventor before: Liu Huanhuan

Inventor before: Li Yuhui

CB03 Change of inventor or designer information