CN108021998A - 网络问卷的答题时长预测方法及装置 - Google Patents
网络问卷的答题时长预测方法及装置 Download PDFInfo
- Publication number
- CN108021998A CN108021998A CN201610934069.0A CN201610934069A CN108021998A CN 108021998 A CN108021998 A CN 108021998A CN 201610934069 A CN201610934069 A CN 201610934069A CN 108021998 A CN108021998 A CN 108021998A
- Authority
- CN
- China
- Prior art keywords
- questionnaire
- answer
- duration
- network
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明是关于一种网络问卷的答题时长预测方法及装置。该方法包括:根据网络问卷中包含的各个题目类型、各个题目类型对应的题目数量,以及预先设置的预测公式计算用于区分所述网络问卷的答题结果是否有效的时长阈值。该方法不需要网络问卷的发布者用户自行设置该时长阈值,降低人工设置带来的时长误差,提高对有效答题结果进行判断的准确性,进一步提高网络问卷的调查结果的准确性。
Description
技术领域
本发明涉及网络应用技术领域,特别涉及一种网络问卷的答题时长预测方法及装置。
背景技术
网络问卷是一种通过互联网将传统的问卷调查在线化和智能化的问卷形式。
现有技术中,网络问卷应用对应的服务器在接收到针对一个网络问卷的答题结果时,可以根据答题者的答题时间来判断该答题结果是否有效。比如,网络问卷的发布者用户在请求发布网络问卷时,可以设置该网络问卷的时长阈值,服务器将该网络问卷推送给答题者用户后,在接收到答题者用户返回的答题结果时,获取该答题结果对应的答题时长,并将该答题时长与上述时长阈值进行比较,若该答题时长大于时长阈值,则认为该答题结果有效,否则认为该答题结果无效。
网络问卷的时长阈值由发布者用户自行设置,通常情况下,发布者用户设置的时长阈值与实际有效的答题结果对应的最小答题时长之间会存在较大的误差,影响对有效答题结果进行判断的准确性,进一步影响网络问卷的调查结果的准确性。
发明内容
为了解决现有技术中发布者用户设置的时长阈值与实际有效的答题结果对应的最小答题时长之间会存在较大的误差的问题,本发明实施例提供了一种网络问卷的答题时长预测方法及装置,技术方案如下:
第一方面,提供了一种网络问卷的答题时长预测方法,所述方法包括:
获取网络问卷的题量特征信息,所述题量特征信息用于指示所述网络问卷中包含的各个题目类型,以及所述各个题目类型各自对应的题目数量;
获取所述网络问卷对应的预测公式,所述预测公式是通过对已发布问卷的题量特征信息,以及所述已发布问卷的答题结果的实际答题时长进行分析得到的公式,所述已发布问卷是已经发布且接收到答题结果的问卷;
根据所述题量特征信息以及所述预测公式,计算所述网络问卷的预测答题时长,所述预测答题时长是用于区分所述网络问卷的答题结果是否有效的时长阈值。
第二方面,提供了一种网络问卷的预测公式生成方法,所述方法包括:
从已发布问卷中确定若干个训练问卷样本,所述已发布问卷是已经发布且接收到答题结果的问卷;
对于所述若干个训练问卷样本中的每一个训练问卷样本,根据所述训练问卷样本的各个答题结果对应的实际答题时长,确定所述训练问卷样本的最小有效答题时长;
获取所述若干个训练问卷样本各自对应的训练数据,所述训练数据包括所述若干个训练问卷样本各自对应的题量特征信息以及所述若干个训练问卷样本各自对应的最小有效答题时长;所述题量特征信息用于指示对应的问卷中包含的各个题目类型,以及所述各个题目类型各自对应的题目数量;
对所述若干个训练问卷样本各自对应的训练数据进行统计分析,获得所述预测公式的公式参数;
根据所述公式参数生成所述预测公式,所述预测公式用于根据网络问卷的题量特征信息计算所述网络问卷的预测答题时长,所述预测答题时长是用于区分所述网络问卷的答题结果是否有效的时长阈值。
第三方面,提供了一种网络问卷的答题时长预测装置,所述装置包括:
特征获取模块,用于获取网络问卷的题量特征信息,所述题量特征信息用于指示所述网络问卷中包含的各个题目类型,以及所述各个题目类型各自对应的题目数量;
公式获取模块,用于获取所述网络问卷对应的预测公式,所述预测公式是通过对已发布问卷题量特征信息,以及所述已发布问卷的的答题结果的实际答题时长进行分析得到的公式,所述已发布问卷是已经发布且接收到答题结果的问卷;
时长计算模块,用于根据所述题量特征信息以及所述预测公式,计算所述网络问卷的预测答题时长,所述预测答题时长是用于区分所述网络问卷的答题结果是否有效的时长阈值。
第四方面,提供了一种网络问卷的预测公式生成装置,所述装置包括:
训练样本确定模块,用于从已发布问卷中确定若干个训练问卷样本,所述已发布问卷是已经发布且接收到答题结果的网络问卷;
第一时长确定模块,用于对于所述若干个训练问卷样本中的每一个训练问卷样本,根据所述训练问卷样本的各个答题结果对应的实际答题时长,确定所述训练问卷样本的最小有效答题时长;
训练数据获取模块,用于获取所述若干个训练问卷样本各自对应的训练数据,所述训练数据包括所述若干个训练问卷样本各自对应的题量特征信息以及所述若干个训练问卷样本各自对应的最小有效答题时长;所述题量特征信息用于指示对应的训练问卷样本中包含的各个题目类型,以及所述各个题目类型各自对应的题目数量;
统计模块,用于对所述若干个训练问卷样本各自对应的训练数据进行统计分析,获得所述预测公式的公式参数;
公式生成模块,用于根据所述公式参数生成所述预测公式,所述预测公式用于根据网络问卷的题量特征信息计算所述网络问卷的预测答题时长,所述预测答题时长是用于区分所述网络问卷的答题结果是否有效的时长阈值。
本发明实施例提供的技术方案可以包括以下有益效果:
根据网络问卷中包含的各个题目类型、各个题目类型对应的题目数量,以及预先设置的预测公式计算用于区分所述网络问卷的答题结果是否有效的时长阈值,不需要网络问卷的发布者用户自行设置该时长阈值,降低人工设置带来的时长误差,提高对有效答题结果进行判断的准确性,进一步提高网络问卷的调查结果的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种网络问卷发布系统的结构示意图;
图2是根据一示例性实施例示出的一种网络问卷的答题时长预测方法的流程图;
图3是图2所示实施例涉及的一种网络问卷发布流程的示意图;
图4是根据另一示例性实施例示出的一种网络问卷的答题时长预测方法的流程图;
图5是图4所示实施例涉及的一种生成预测公式的方法的流程图;
图6是图4所示实施例涉及的一种答题时长分布曲线示意图;
图7是根据一示例性实施例示出的一种网络问卷的答题时长预测装置的结构方框图;
图8是根据一示例性实施例示出的一种网络问卷的预测公式生成装置的结构方框图;
图9是根据一示例性实施例示出的一种服务器的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
请参考图1,其示出了本发明一个实施例的一种网络问卷发布系统的结构示意图。该系统包括:若干个用户终端120和服务器集群140。
用户终端120可以是手机、平板电脑、电子书阅读器、MP3播放器(Moving PictureExperts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(MovingPicture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
用户终端120与服务器集群140之间通过通信网络相连。可选的,通信网络是有线网络或无线网络。
服务器集群140是一台服务器,或者由若干台服务器,或者是一个虚拟化平台,或者是一个云计算服务中心。
可选的,服务器集群140可以包括用于为网络问卷应用提供服务支持的网络问卷应用服务器142。其中,该网络问卷应用可以是一个独立的应用程序,也可以是其它第三方应用程序中内置的功能应用,比如,可以是社交网络应用中的一个功能应用;相应的,网络问卷应用服务器142可以是一个单独用于支持网络问卷应用的服务器,或者,网络问卷应用服务器142也可以是用于支持其它第三方应用的服务器,比如社交应用平台服务器。
发布者用户对应的用户终端120中可以安装网络问卷应用,并在网络问卷应用中设置网络问卷,并向网络问卷应用服务器142请求发布其设置的网络问卷,网络问卷应用服务器142向答题者用户对应的用户终端120发布该网络问卷,并接收答题者用户返回的针对该网络问卷的答题结果,对答题结果进行统计分析后,将统计分析结果返回给该网络问卷的发布者用户。
可选的,网络问卷应用服务器142在处理某个网络问卷时,可以通过预测公式预测该网络问卷的预测答题时长。一方面,该预测答题时长可以作为答题者用户正常答复问卷的最小时长,用来区分网络问卷的答题结果是否有效;另一方面,网络应用服务器142还可以通过该预测答题时长来确定网络问卷的答题时长是否过长,是否可能使答题者用户失去耐心或感到负担,以便及时向网络问卷的发布者用户发出提醒。
可选的,上述预测公式可以由网络问卷应用服务器142的管理人员预先进行设置,比如,该系统还可以包括管理设备(图1未示出),该管理设备与服务器集群140之间通过通信网络相连。可选的,通信网络是有线网络或无线网络。管理人员可以通过该管理设备在网络问卷应用服务器142中设置该预测公式
可选的,服务器集群140还可以包括用于存储数据的数据存储服务器144;可选的,服务器集群140还可以包括用于生成和管理预测公式的预测公式服务器146。可选的,网络问卷应用服务器142、数据存储服务器144与预测公式服务器146之间可以通过通信网络相连。
可选的,网络问卷应用服务器142可以将网络问卷的相关数据,比如网络问卷的内容、网络问卷的答题结果以及对网络问卷的答题结果的统计分析结果等数据,存储到数据存储服务器144中。
可选的,预测公式服务器146可以从数据存储服务器144中获取已发布问卷对应的相关数据,对获取到的数据进行分析并生成上述用于预测网络问卷的预测答题时长的预测公式。网络问卷应用服务器142可以通过预测公式服务器146生成的公式预测该网络问卷的预测答题时长。
可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合)。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible MarkupLanguage,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Trassport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet ProtocolSecurity,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
图2是根据一示例性实施例示出的一种网络问卷的答题时长预测方法的流程图,以应用于如图1所示的系统中的服务器集群140为例,该网络问卷的答题时长预测方法可以包括如下几个步骤:
步骤201,获取网络问卷的题量特征信息,该题量特征信息用于指示该网络问卷中包含的各个题目类型,以及上述各个题目类型各自对应的题目数量。
通常情况下,网络问卷应用可以允许发布者用户设置多种题目,例如选择题(分单选和多选)、填空题、矩阵题、文本题、量表题、排序题等等,以便发布者用户根据实际需求进行网络问卷的设置。答题者用户答复不同种类的题目所需要的时间通常也存在区别,比如,用户答复一道单选题的时间通常比回答一道多选题的时间短。
由于网络问卷应用允许设置的题目种类比较多,为了简化数据处理和计算的复杂度,本发明实施例所示的方案,可以将几种答题时间较为接近的题目设置为同一个题目类型,比如,请参考下面的表1,其示出了本发明实施例提供的一种题目类型划分方式。
类型 | 题目的种类 |
题目类型一 | 用户基本属性题 |
题目类型二 | 除了用户基本属性题之外的单选题 |
题目类型三 | 需要多步操作的题目(多选题、排序题以及量表题等) |
题目类型四 | 开放主观题(填空题或者文本题等) |
表1
在表1中,网络问卷应用允许的题目被划分为四种题目类型,其中,题目类型一为用户基本属性题,比如询问年龄、性别等用户基本属性的题目,此类题目不需要答题者用户太多的思考时间,平均答题时间最短;题目类型二为除了用户基本属性题之外的单选题,此类题目需要答题者用户付出一定的思考时间,但只需要答题者用户选择一个选项,平均答题时间较短;题目类型三对应的题目需要答题者用户进行多步操作,平均答题时间较长;题目类型四对应的题目通常需要答题者用户自己组织文字并填写,平均答题时间最长。
上述表1所示的题目类型划分方法仅仅是本发明实施例提供的一种示例性方法,本发明实施例不对题目类型的具体划分方法进行限定,网络问卷应用开发人员或服务器集群的管理人员可以根据实际的使用情况自行确定题目类型的划分。或者,在实际应用中,也可以不对题目类型进行划分,而直接将每一种题目作为一种题目类型。
服务器集群中的网络问卷应用服务器在接收到发布者用户设置并发送的网络问卷后,可以对该网络问卷中的各个题目类型进行统计,以确定该网络问卷中各个题目类型各自对应的题目数量,并将确定的各个题目类型各自对应的题目数量作为该网络问卷的题量特征信息。
可选的,上述题量特征信息也可以是在发布者用户在设置网络问卷时,由发布者用户对应的用户终端进行统计,并上报给网络问卷应用服务器。
步骤202,获取该网络问卷对应的预测公式。
在本发明实施例中,预测公式是通过对已发布问卷的答题结果的实际答题时长进行分析得到的公式,该已发布问卷是已经发布且接收到答题结果的问卷;预测公式可以预先存储在公式库中,需要计算网络问卷的预测答题时长,网络问卷应用服务器可以从公式库提取该预测公式。
可选的,当网络问卷对应有用户属性信息时,获取该网络问卷对应的用户属性信息,该用户属性信息包括年龄和性别中的至少一种,根据该用户属性信息,以及预设的该用户属性信息与该预测公式之间的对应关系查询该预测公式。
由于不同类型的用户对同一份网络问卷进行答题时,所用的答题时间通常也有所不同,比如,对于同一份网络问卷,从性别方面来说,男性用户的答题时长通常小于女性用户的答题时长,从年龄方面来说,19岁以下用户的答题时长通常小于20-39岁用户的答题时长,而20-39岁用户的答题时长通常又小于39岁以上用户的答题时长。而在实际应用中,很多网络问卷对应有答题者用户的年龄和/或性别等属性,比如,某些网络问卷可能指定由某一性别和/或某一年龄段的用户进行填写,或者,某些网络问卷中可能设置跳转逻辑,即不同性别和/或不同的年龄段的用户具有不同的答题路径(即不同性别和/或不同的年龄段的用户分别答复一份网络问卷中不同部分的题目)。因此,在本发明实施例中,可以为不同的用户属性信息分别设置预测公式,网络问卷应用服务器在获取预测公式时,若网络问卷对应有用户属性信息,则根据该用户属性信息查询对应的预测公式,以提高后续预测的准确性。
具体的,请参考表2,其示出了本发明实施例涉及的一种用户属性信息与预测公式的对应关系。
用户属性信息 | 预测公式 | 用户属性信息 | 预测公式 |
无 | 公式1 | 男、19岁以下 | 公式7 |
男 | 公式2 | 男、20-39岁 | 公式8 |
女 | 公式3 | 男、39岁以上 | 公式9 |
19岁以下 | 公式4 | 女、19岁以下 | 公式10 |
20-39岁 | 公式5 | 女、20-39岁 | 公式11 |
39岁以上 | 公式6 | 女、39岁以上 | 公式12 |
表2
如表2所示,网络问卷应用服务器获取到网络问卷后,可以获取该网络问卷的用户属性信息,若未获取到该网络问卷的用户属性信息,则获取公式1作为预测公式,若获取到的用户属性信息中只包含性别信息,则从公式2和公式3中选择对应的一个公式作为预测公式,若获取到的用户属性信息中只包含年龄信息,则从公式4至公式6中选择对应的一个公式作为预测公式,若获取到的用户属性信息中同时包含性别信息和年龄信息,则从公式7至公式12中选择对应的一个公式作为预测公式。
其中,上述表2所示的用户属性信息与预测公式的对应关系仅仅作为本发明实施例的方案中的一个举例,在实际应用中,开发人员也可以根据实际应用情况决定设置哪些用户属性信息的分类,比如,开发人员可以只按照性别进行用户属性信息的分类,也可以只按照年龄进行用户属性信息的分类,在按照年龄进行用户属性信息的分类时,具体的年龄段的设置也不局限于上述表2中的设置方式,比如,可以将年龄段划分为4段或者更多等等。
可选的,在实际应用中,也可以不按照用户属性信息来设置不同的预测公式,而是所有的网络问卷都使用同一个预测公式进行后续预测。
步骤203,根据该题量特征信息以及该预测公式,计算该网络问卷的预测答题时长,该预测答题时长是用于区分该网络问卷的答题结果是否有效的时长阈值。
在本发明实施例中,预测公式可以是一个以各个题目类型各自对应的题目数量作为输入参数的公式,即将网络问卷中各个题目类型对应的题目数量输入预测公式后,即可以输出该网络问卷的预测答题时长。
在实际应用中,对于具有多条答题路径的网络问卷,一个答题者用户通常只会选择其中一个答题路径进行答复,而不同的答题路径中的包含的题目类型以及题目类型的数量都有可能不同,答题者用户答复同一份网络问卷中不同的答题路径的答题时长可能存在较大的差别,因此,在本发明实施例中,当该网络问卷中包含至少两条答题路径时,对于该至少两条答题路径中的每一条答题路径,获取该答题路径中包含的各个题目类型,以及该答题路径中包含的各个题目类型各自对应的题目数量,并按照该答题路径中包含的各个题目类型,将该答题路径中的各个题目类型各自对应的题目数量输入该预测公式,计算获得该答题路径的预测答题时长。
可选的,对于包含至少两条答题路径的网络问卷,若该至少两条答题路径对应的用户属性信息不同,则在上述步骤202中获取预测公式时,可以根据该至少两条答题路径各自对应的用户属性信息,查询获取该至少两条答题路径各自对应的预测公式,在计算预测答题时长时,根据该至少两条答题路径各自对应的预测公式,分别计算该至少两条答题路径各自对应的预测答题时长。
步骤204,在发布该网络问卷之前,检测该预测答题时长是否大于预设时长。
步骤205,若该预测答题时长大于该预设时长,则向设置该网络问卷的终端发送提醒消息,该提醒消息用于提示该网络问卷的预测答题时长过长。
发布者用户设置网络问卷时,或者在网络问卷设置完成并请求发布时,网络问卷应用服务器可以检测该网络问卷的预测答题时长是否过长,具体的,网络问卷应用服务器可以将步骤203中计算获得的该网络问卷的预测答题时长与预设时长进行比较,若该预测答题时长大于该预测时长,则认为该网络问卷需要答题者用户花费较多的时间进行作答,可能会使答题者用户失去耐心或感到负担,此时,网络问卷应用服务器可以向发布者用户的用户终端(即设置该网络问卷的终端)发送提醒消息,以提醒该发布者用户,其设置的网络问卷预计的答题时长过长,以便发布者用户及时调整网络问卷。
此外,发布者用户的用户终端展示该提醒消息时,可以同时提示用户选择是否确定要发布该网络问卷,若发布者用户确认要发布该网络问卷,则网络问卷应用服务器向答题者用户的用户终端发布该网络问卷。
可选的,若该网络问卷中包含至少两条答题路径,则网络问卷应用服务器可以将该至少两条答题路径各自对应的预测答题时长中,最长的一个预测答题时长与上述预设时长进行比较,若该最长的一个预测答题时长大于该预设时长,则向发布者用户的用户终端发送提醒消息。
或者,若该网络问卷中包含至少两条答题路径,该网络问卷应用服务器也可以将该至少两条答题路径各自对应的预测答题时长分别与预设时长进行比较,当该至少两条答题路径中,有至少一条答题路径对应的预测答题时长大于预设时长时,向发布者用户的用户终端发送提醒消息,此时,该提醒消息中还包含路径指示信息,该路径指示信息可以用于指示该至少两条答题路径中有哪些答题路径的预测答题时长过长。
可选的,网络问卷应用服务器还可以将该网络问卷的预测答题时长发送给设置该网络问卷的终端,由设置该网络问卷的终端进行显示,以便网络问卷的发布者用户及时了解自己设置的网络问卷的预计答题时长。该发送网络问卷的预测答题时长的步骤可以在上述步骤203中计算出预测答题时长之后执行,也可以在步骤204中检测出预测答题时长大于预设时长后执行。
步骤206,在接收到该网络问卷对应的答题结果时,检测该答题结果对应的实际答题时长是否小于该网络问卷的预测答题时长。
步骤207,若答题结果对应的实际答题时长小于该网络问卷的预测答题时长,则确定该答题结果为无效的答题结果。
在本发明实施例中,网络问卷应用服务器可以根据答题者用户的答题时长对答题结果进行筛选,以提高网络问卷的问卷调查准确性。具体的,答题者用户在其用户终端中答复网络问卷时,该用户终端可以统计该答题者用户答复网络问卷的实际答题时长,答题者用户点击提交后,该用户终端将答题结果发送给网络问卷应用服务器,网络问卷应用服务器将该实际答题时长与该网络问卷的预测答题时长进行比较,若该实际答题时长小于预测答题时长,则可能是因为答题者用户草率敷衍的答复了网络问卷,甚至可能是答题者用户胡乱答复,该答题结果通常并不能反映答题者用户的真实情况,如果将该答题结果并入该网络问卷的统计结果,会影响该统计结果的准确性。此时,网络问卷应用服务器可以将实际答题时长小于预测答题时长的答题结果确定为无效的答题结果,不对其进行统计,以提高该网络问卷的统计结果的准确性。
可选的,若该网络问卷中包含有至少两条答题路径,则在接收到一条答题结果后,网络问卷应用服务器可以确定该答题结果对应的答题路径,并将该答题结果的实际答题时长与该答题结果对应的答题路径的预测答题时长进行比较,若答题结果的实际答题时长小于该答题结果对应的答题路径的预测答题时长,则确定该答题结果为无效的答题结果。
具体的,请参考图3,其示出了本发明实施例涉及的一种网络问卷发布流程的示意图。如图3所示,发布者用户在用户终端中设置网络问卷,并向网络问卷应用服务器请求发布,网络问卷应用服务器获取该网络问卷的题目类型以及每个题目类型对应的题目数量,同时从公式库获取预测公式,并计算该网络问卷的预测答题时长,若该预测答题时长小于预设的时长阈值时,则发布该网络问卷,否则向发布者用户发出提醒,以便发布者用户及时调整网络问卷。在发布该网络问卷后,网络问卷应用服务器接收答题者用户的答题结果,并获取各个答题结果对应的实际答题时长,对于一个答题结果,若该答题结果小于实际答题时长,则认为该答题结果无效,否则认为该答题结果有效。
综上所述,本发明实施例提供的网络问卷的答题时长预测方法,根据网络问卷中各个题目类型对应的题目数量,以及预先设置的预测公式计算用于区分所述网络问卷的答题结果是否有效的时长阈值,不需要网络问卷的发布者用户自行设置该时长阈值,降低人工设置带来的时长误差,提高对有效答题结果进行判断的准确性,进一步提高网络问卷的调查结果的准确性。
另外,本发明实施例提供的方法,可以通过网络问卷的用户属性信息确定相应的预测公式,并按照确定的预测公式来计算该网络问卷的预测答题时长,提高计算结果的准确性。
此外,本发明实施例提供的方法,在网络问卷发布之前,当预测答题时长大于预设时长时,可以向发布者用户的终端发送提醒消息,以提示该网络问卷的预测答题时长过长,提醒发布者用户及时调整网络问卷,避免答题者用户在答复该网络问卷时失去耐心或感到负担。
在上述图2对应的实施例中,预测公式可以由开发人员或管理人员在服务器集群中进行设置,也可以由服务器集群根据各个已发布的网络问卷的答题结果对应的实际答题时长进行自动分析生成并维护。本发明下面的实施例将以服务器集群自动生成预测公式为例进行说明。
图4是根据另一示例性实施例示出的一种网络问卷的答题时长预测方法的流程图,以应用于如图1所示的系统中的服务器集群140为例,该网络问卷的答题时长预测方法可以包括如下几个步骤:
步骤401,根据已发布的网络问卷的答题结果对应的实际答题时长生成预测公式。
在本发明实施例中,生成预测公式的步骤可以由服务器集群中的预测公式服务器来执行,请参考图5,其示出了本发明实施例涉及的一种生成预测公式的方法的流程图,如图5所示,该生成预测公式的方法可以包括如下步骤:
步骤401a,从已发布问卷中确定若干个训练问卷样本,该已发布问卷是已经发布且接收到答题结果的问卷。
可选的,在本发明实施例中,预测公式服务器可以从数据存储服务器中获取已发布问卷的相关数据,比如已发布问卷、已发布问卷的各个答题结果以及各个答题结果对应的实际答题时长等,预测公式服务器可以从已发布问卷中按照离散随机的方式抽取若干个训练问卷样本。其中,对于一个已发布问卷,若该已发布问卷只有一条答题路径,则该已发布问卷可以作为一个训练问卷样本,若该已发布问卷中包含多条答题路径,则其中每一条答题路径都可以作为一个独立的训练问卷样本。
可选的,从已发布问卷中确定若干个训练问卷样本时,可以从已发布问卷中确定出满足预设条件的若干个问卷作为该若干个训练问卷样本,其中,预设条件包括:包含的题目数量大于预设数量阈值,和/或,只包含一条答题路径。
具体的,在本发明实施例中,为了提高预测公式生成的准确性,在确定训练问卷样本时,可以将某些极端的已发布问卷排除,比如,可以将总的题目数量低于一定数量阈值(比如5)的已发布问卷排除。另外,为了降低数据处理的难度,避免对具有多条答题路径的已发布问卷进行处理,在确定训练问卷样本时,还可以将其中包含多条答题路径的已发布问卷排除。
步骤401b,对于该若干个训练问卷样本中的每一个训练问卷样本,根据该训练问卷样本的各个答题结果对应的实际答题时长,确定该训练问卷样本的最小有效答题时长。
具体的,可以根据该训练问卷样本的各个答题结果对应的实际答题时长绘制该训练问卷样本的答题时长分布曲线,根据该答题时长分布曲线以及预设的置信区间确定该最小有效答题时长。
比如,请参考图6,其示出了本发明实施例涉及的一种答题时长分布曲线示意图,如图6所示,其中横坐标为实际答题时长,纵坐标为答题结果的数量,对于某一个训练问卷样本,预测公式服务器按照该训练问卷样本的各个答题结果对应的实际答题时长绘制该训练问卷样本的答题时长分布曲线61,如图6所示,该答题时长分布曲线61可以是一个偏态分布曲线,即曲线两端存在着偏离正常范围的时长值。在本发明实施例中,开发人员或管理人员可以预先设置一个置信区间,该置信区间可以是偏态分布总面积中,可信面积所占的百分比;其中,上述偏态分布总面积是答题时长分布曲线、横坐标轴以及纵坐标轴所围成区域的面积;上述可信面积是最小有效答题时长对应的时间轴线(即处于最小有效答题时长处,且垂直于横坐标的轴线)、答题时长分布曲线以及横坐标轴所围成的面积。
比如,假设该置信区间设置为99%,在图6中,坐标轴原点为O点,答题时长分布曲线61与纵坐标轴的交点为A点,时长t对应的时间轴线62与答题时长分布曲线61的交点为B点,答题时长分布曲线61与横坐标轴的交点为C点,时间轴线62与横坐标轴的交点为D点;其中,线段AO、线段CO以及答题时长分布曲线61所围成的区域的面积就是偏态分布总面积,如果线段BD、线段CD以及答题时长分布曲线61中处于BC两点之间的曲线所围成的区域的面积占该偏态分布总面积的百分比为99%,则该时长t就是该答题时长分布曲线61对应的训练问卷样本的最小有效答题时长。
步骤401c,获取该若干个训练问卷样本各自对应的训练数据,该训练数据包括该若干个训练问卷样本各自对应的题量特征信息以及该若干个训练问卷样本各自对应的最小有效答题时长。
其中,一个问卷的题量特征信息用于指示对应的问卷中包含的各个题目类型,以及各个题目类型各自对应的题目数量。
对于每一个训练问卷样本,预测公式服务器可以将该训练问卷样本中的各个题目类型、各个题目类型对应的题目数量以及最小有效答题时长作为训练数据。
步骤401d,对该若干个训练问卷样本各自对应的训练数据进行统计分析,获得该预测公式的公式参数。
在本发明实施例中,预测公式服务器可以对该若干个训练问卷样本各自对应的训练数据进行线性回归分析,将分析得到的该各个题目类型各自对应的单题平均答题时长以及修正常量获取为该预测公式的公式参数,其中,对于该若干个训练问卷样本中的每一个训练样本,修正常量是用于对该训练问卷样本中包含的各个题目类型各自对应的题目数量与上述各个题目类型各自对应的单题平均答题长的乘积之和进行修正,以使得修正后的结果接近该训练问卷样本的最小有效答题时长的常量。
具体的,预测公式服务器可以将获取到的训练数据输入SPSS(英文:StatisticalProduct and Service Solutions,中文:统计产品与服务解决方案)软件中进行线性回归分析,获得答题者用户答复各个题目类型的单题平均答题时长以及修正常量。
步骤401e,根据该公式参数生成该预测公式。
预测公式服务器可以根据各个题目类型、各个题目类型各自对应的单题平均答题时长以及上述修正常量生成预测公式。
比如,以表1所示的题目类型的划分方式为例,请参考表3,其示出了本公开实施例涉及的一种线性回归分析结果。
参数表示 | 参数数值(单位:秒) |
N1 | 2.374 |
N2 | 4.146 |
N3 | 5.106 |
N4 | 8.255 |
M | -4.652 |
表3
在表3中,参数N1表示题目类型一对应的单题平均答题时长,参数N2表示题目类型二对应的单题平均答题时长,参数N3表示题目类型三对应的单题平均答题时长,参数N4表示题目类型四对应的单题平均答题时长,参数M表示修正常量。预测公式服务器生成的预测公式可以为:
T=2.374S1+4.146S2+5.106S3+8.255S4-4.652。
在上述公式中,S1为题目类型一的题目数量,S2为题目类型二的题目数量,S3为题目类型三的题目数量,S4为题目类型四的题目数量。
可选的,在本发明实施例中,预测公式服务器生成一个预测公式之后,可以对该预测公式进行验证,具体的,预测公式服务器可以从已发布问卷中选择一个或多个测试问卷样本,获取测试问卷样本的题量特征信息以及最小有效答题时长,根据该测试问卷样本的题量特征信息以及生成的预测公式计算测试问卷样本的预测答题时长,并检测该测试问卷样本的预测答题时长与该测试问卷样本的最小有效答题时长之间的差值是否处于预设的差值区间,若是,则确定该预测公式满足要求,为有效的预测公式,并将该预测公式存储入公式库。
可选的,本发明实施例所示的方案,可以针对所有的网络问卷生成统一的一个预测公式,或者,也可以对应不同的用户属性信息来生成不同的预测公式。具体的,当对应不同的用户属性信息来生成不同的预测公式时,对于每一种用户属性信息,预测公式服务器可以从已发布问卷中获取与该用户属性信息相对应的若干个训练问卷样本,并基于获取到的训练问卷样本获得该用户属性信息相对应的公式参数,并根据该公式参数生成与该用户属性信息相对应的预测公式,在对该预测公式进行验证时,获取与该用户属性信息相对应的测试问卷样本并进行验证,若验证该预测公式有效,则将该预测公式对应该用户属性信息存储入公式库。
可选的,在本发明实施例中,预测公式服务器可以按照上述方法定期生成预测公式,并更新公式库。
步骤402,获取网络问卷的题量特征信息。
步骤403,获取该网络问卷对应的预测公式。
步骤404,根据该题量特征信息以及该预测公式,计算该网络问卷的预测答题时长,该预测答题时长是用于区分该网络问卷的答题结果是否有效的时长阈值。
步骤405,在发布该网络问卷之前,检测该预测答题时长是否大于预设时长。
步骤406,若该预测答题时长大于该预设时长,则向设置该网络问卷的终端发送提醒消息,该提醒消息用于提示该网络问卷的预测答题时长过长。
步骤407,在接收到该网络问卷对应的答题结果时,检测该答题结果对应的实际答题时长是否小于该网络问卷的预测答题时长。
步骤408,若答题结果对应的实际答题时长小于该网络问卷的预测答题时长,则确定该答题结果为无效的答题结果。
其中,上述步骤402至步骤408所示的方案与上述图2所示方法中的步骤201至步骤207类似,此处不再赘述。
综上所述,本发明实施例提供的网络问卷的答题时长预测方法,根据网络问卷中各个题目类型对应的题目数量,以及预先设置的预测公式计算用于区分所述网络问卷的答题结果是否有效的时长阈值,不需要网络问卷的发布者用户自行设置该时长阈值,降低人工设置带来的时长误差,提高对有效答题结果进行判断的准确性,进一步提高网络问卷的调查结果的准确性。
另外,本发明实施例提供的方法,可以通过网络问卷的用户属性信息确定相应的预测公式,并按照确定的预测公式来计算该网络问卷的预测答题时长,提高计算结果的准确性。
此外,本发明实施例提供的方法,在网络问卷发布之前,当预测答题时长大于预设时长时,可以向发布者用户的终端发送提醒消息,以提示该网络问卷的预测答题时长过长,提醒发布者用户及时调整网络问卷,避免答题者用户在答复该网络问卷时失去耐心或感到负担。
图7是根据一示例性实施例示出的一种网络问卷的答题时长预测装置的结构方框图。该网络问卷的答题时长预测装置可以通过硬件或者软硬结合的方式实现为服务器集群中的部分或全部,以执行图2或图4所示实施例中的全部或者部分步骤。该网络问卷的答题时长预测装置可以包括:
特征获取模块701,用于获取网络问卷的题量特征信息,所述题量特征信息用于指示所述网络问卷中包含的各个题目类型,以及所述各个题目类型各自对应的题目数量;
公式获取模块702,用于获取所述网络问卷对应的预测公式,所述预测公式是通过对已发布问卷的答题结果的实际答题时长进行分析得到的公式,所述已发布问卷是已经发布且接收到答题结果的问卷;
时长计算模块703,用于根据所述题量特征信息以及所述预测公式,计算所述网络问卷的预测答题时长,所述预测答题时长是用于区分所述网络问卷的答题结果是否有效的时长阈值。
可选的,所述公式获取模块,包括:
属性获取单元,用于获取所述网络问卷对应的用户属性信息,所述用户属性信息包括年龄和性别中的至少一种;
公式查询单元,用于根据所述用户属性信息,以及预设的所述用户属性信息与所述预测公式之间的对应关系查询所述预测公式。
可选的,所述特征获取模块,具体用于当所述网络问卷中包含至少两条答题路径时,对于所述至少两条答题路径中的每一条答题路径,获取所述答题路径中包含的各个题目类型,以及所述答题路径中包含的各个题目类型各自对应的题目数量;
所述时长计算模块,具体用于按照所述答题路径中包含的各个题目类型,将所述答题路径中的各个题目类型各自对应的题目数量输入所述预测公式,计算获得所述答题路径的预测答题时长。
可选的,所述装置还包括:
检测模块,用于在发布所述网络问卷之前,检测所述预测答题时长是否大于预设时长;
提醒模块,用于若所述预测答题时长大于所述预设时长,则向设置所述网络问卷的终端发送提醒消息,所述提醒消息用于提示所述网络问卷的预测答题时长过长。
综上所述,本发明实施例提供的网络问卷的答题时长预测装置,根据网络问卷中各个题目类型对应的题目数量,以及预先设置的预测公式计算用于区分所述网络问卷的答题结果是否有效的时长阈值,不需要网络问卷的发布者用户自行设置该时长阈值,降低人工设置带来的时长误差,提高对有效答题结果进行判断的准确性,进一步提高网络问卷的调查结果的准确性。
另外,本发明实施例提供的装置,可以通过网络问卷的用户属性信息确定相应的预测公式,并按照确定的预测公式来计算该网络问卷的预测答题时长,提高计算结果的准确性。
此外,本发明实施例提供的装置,在网络问卷发布之前,当预测答题时长大于预设时长时,可以向发布者用户的终端发送提醒消息,以提示该网络问卷的预测答题时长过长,提醒发布者用户及时调整网络问卷,避免答题者用户在答复该网络问卷时失去耐心或感到负担。
图8是根据一示例性实施例示出的一种网络问卷的预测公式生成装置的结构方框图。该网络问卷的预测公式生成装置可以通过硬件或者软硬结合的方式实现为服务器集群中的部分或全部,以执行图5中的全部或者部分步骤。该网络问卷的预测公式生成装置可以包括:
训练样本确定模块801,用于在获取所述网络问卷对应的预测公式之前,从已发布问卷中确定若干个训练问卷样本,所述已发布问卷是已经发布且接收到答题结果的网络问卷;
第一时长确定模块802,用于对于所述若干个训练问卷样本中的每一个训练问卷样本,根据所述训练问卷样本的各个答题结果对应的实际答题时长,确定所述训练问卷样本的最小有效答题时长;
训练数据获取模块803,用于获取所述若干个训练问卷样本各自对应的训练数据,所述训练数据包括所述若干个训练问卷样本各自对应的题量特征信息以及所述若干个训练问卷样本各自对应的最小有效答题时长;所述题量特征信息用于指示对应的训练问卷样本中包含的各个题目类型,以及所述各个题目类型各自对应的题目数量;
统计模块804,用于对所述若干个训练问卷样本各自对应的训练数据进行统计分析,获得所述预测公式的公式参数;
公式生成模块805,用于根据所述公式参数生成所述预测公式,所述预测公式用于根据网络问卷的题量特征信息计算所述网络问卷的预测答题时长,所述预测答题时长是用于区分所述网络问卷的答题结果是否有效的时长阈值。
可选的,所述第一时长确定模块,包括:
曲线绘制单元,用于根据所述训练问卷样本的各个答题结果对应的实际答题时长绘制所述训练问卷样本的答题时长分布曲线;
时长确定单元,用于根据所述答题时长分布曲线以及预设的置信区间确定所述最小有效答题时长。
可选的,所述统计模块,包括:
分析单元,用于对所述若干个训练问卷样本各自对应的训练数据进行线性回归分析;
参数获取单元,用于将根据线性回归分析得到的所述各个题目类型各自对应的单题平均答题时长以及修正常量获取为所述预测公式的公式参数;
所述公式生成模块,具体用于根据所述各个题目类型、各个题目类型各自对应的单题平均答题时长以及所述修正常量生成所述预测公式;
其中,对于所述若干个训练问卷样本中的每一个训练样本,所述修正常量是用于对所述训练问卷样本中包含的各个题目类型各自对应的题目数量与所述各个题目类型各自对应的单题平均答题长的乘积之和进行修正,以使得修正后的结果接近所述训练问卷样本的最小有效答题时长的常量。
可选的,所述训练样本确定模块,具体用于从所述已发布问卷中,确定出满足预设条件的若干个问卷作为所述若干个训练问卷样本;
其中,所述预设条件包括:包含的题目数量大于预设数量阈值,和/或,只包含一条答题路径。
可选的,所述训练样本确定模块,具体用于对于每一种用户属性信息,从所述已发布问卷中获取与所述用户属性信息相对应的训练问卷样本;
所述公式生成模块,具体用于根据所述公式参数,生成与所述用户属性信息相对应的所述预测公式。
可选的,所述装置还包括:测试样本获取模块,用于从所述已发布问卷中确定测试问卷样本,所述测试问卷样本是所述已发布问卷中,所述若干个训练问卷样本之外的问卷;
第二时长获取模块,用于获取所述测试问卷样本的题量特征信息以及最小有效答题时长;
计算模块,用于根据所述测试问卷样本的题量特征信息以及生成的所述预测公式计算所述测试问卷样本的预测答题时长;
有效性确定模块,用于若所述测试问卷样本的预测答题时长与所述测试问卷样本的最小有效答题时长之间的差值处于预设的差值区间,则确定所述预测公式为有效的预测公式。
图9是根据一示例性实施例示出的一种服务器的结构示意图。所述服务器900包括中央处理单元(CPU)901、包括随机存取存储器(RAM)902和只读存储器(ROM)903的系统存储器904,以及连接系统存储器904和中央处理单元901的系统总线905。所述服务器900还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)906,和用于存储操作系统913、应用程序914和其他程序模块915的大容量存储设备907。
所述基本输入/输出系统906包括有用于显示信息的显示器908和用于用户输入信息的诸如鼠标、键盘之类的输入设备909。其中所述显示器908和输入设备909都通过连接到系统总线905的输入输出控制器910连接到中央处理单元901。所述基本输入/输出系统906还可以包括输入输出控制器910以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器910还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备907通过连接到系统总线905的大容量存储控制器(未示出)连接到中央处理单元901。所述大容量存储设备907及其相关联的计算机可读介质为服务器900提供非易失性存储。也就是说,所述大容量存储设备907可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器904和大容量存储设备907可以统称为存储器。
根据本发明的各种实施例,所述服务器900还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器900可以通过连接在所述系统总线905上的网络接口单元911连接到网络912,或者说,也可以使用网络接口单元911来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,中央处理器901通过执行该一个或一个以上程序来实现图2、图4或图5任一所示的方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器,上述指令可由服务器的处理器执行以完成本发明各个实施例所示的方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (16)
1.一种网络问卷的答题时长预测方法,其特征在于,所述方法包括:
获取网络问卷的题量特征信息,所述题量特征信息用于指示所述网络问卷中包含的各个题目类型,以及所述各个题目类型各自对应的题目数量;
获取所述网络问卷对应的预测公式,所述预测公式是通过对已发布问卷的题量特征信息,以及所述已发布问卷的答题结果的实际答题时长进行分析得到的公式,所述已发布问卷是已经发布且接收到答题结果的问卷;
根据所述题量特征信息以及所述预测公式,计算所述网络问卷的预测答题时长,所述预测答题时长是用于区分所述网络问卷的答题结果是否有效的时长阈值。
2.根据权利要求1所述的方法,其特征在于,所述获取所述网络问卷对应的预测公式,包括:
获取所述网络问卷对应的用户属性信息,所述用户属性信息包括年龄和性别中的至少一种;
根据所述用户属性信息,以及预设的所述用户属性信息与所述预测公式之间的对应关系查询所述预测公式。
3.根据权利要求1或2所述的方法,其特征在于,所述获取网络问卷的题量特征信息,包括:
当所述网络问卷中包含至少两条答题路径时,对于所述至少两条答题路径中的每一条答题路径,获取所述答题路径中包含的各个题目类型,以及所述答题路径中包含的各个题目类型各自对应的题目数量;
所述根据所述题量特征信息以及所述预测公式,计算所述网络问卷的预测答题时长,包括:
按照所述答题路径中包含的各个题目类型,将所述答题路径中的各个题目类型各自对应的题目数量输入所述预测公式,计算获得所述答题路径的预测答题时长。
4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
在发布所述网络问卷之前,检测所述预测答题时长是否大于预设时长;
若所述预测答题时长大于所述预设时长,则向设置所述网络问卷的终端发送提醒消息,所述提醒消息用于提示所述网络问卷的预测答题时长过长。
5.一种网络问卷的预测公式生成方法,其特征在于,所述方法包括:
从已发布问卷中确定若干个训练问卷样本,所述已发布问卷是已经发布且接收到答题结果的问卷;
对于所述若干个训练问卷样本中的每一个训练问卷样本,根据所述训练问卷样本的各个答题结果对应的实际答题时长,确定所述训练问卷样本的最小有效答题时长;
获取所述若干个训练问卷样本各自对应的训练数据,所述训练数据包括所述若干个训练问卷样本各自对应的题量特征信息以及所述若干个训练问卷样本各自对应的最小有效答题时长;所述题量特征信息用于指示对应的问卷中包含的各个题目类型,以及所述各个题目类型各自对应的题目数量;
对所述若干个训练问卷样本各自对应的训练数据进行统计分析,获得所述预测公式的公式参数;
根据所述公式参数生成所述预测公式,所述预测公式用于根据网络问卷的题量特征信息计算所述网络问卷的预测答题时长,所述预测答题时长是用于区分所述网络问卷的答题结果是否有效的时长阈值。
6.根据权利要求5所述的方法,其特征在于,所述对于所述若干个训练问卷样本中的每一个训练问卷样本,根据所述训练问卷样本的各个答题结果对应的实际答题时长,确定所述训练问卷样本的最小有效答题时长,包括:
根据所述训练问卷样本的各个答题结果对应的实际答题时长绘制所述训练问卷样本的答题时长分布曲线;
根据所述答题时长分布曲线以及预设的置信区间确定所述最小有效答题时长。
7.根据权利要求5所述的方法,其特征在于,所述对所述若干个训练问卷样本各自对应的训练数据进行统计分析,获得所述预测公式的公式参数,包括:
对所述若干个训练问卷样本各自对应的训练数据进行线性回归分析;
将根据线性回归分析得到的所述各个题目类型各自对应的单题平均答题时长以及修正常量获取为所述预测公式的公式参数;
所述根据所述公式参数生成所述预测公式,包括:
根据所述各个题目类型、各个题目类型各自对应的单题平均答题时长以及所述修正常量生成所述预测公式;
其中,对于所述若干个训练问卷样本中的每一个训练样本,所述修正常量用于对所述训练问卷样本中包含的各个题目类型各自对应的题目数量与所述各个题目类型各自对应的单题平均答题长的乘积之和进行修正,以使得修正后的结果接近所述训练问卷样本的最小有效答题时长。
8.根据权利要求5所述的方法,其特征在于,所述从已发布问卷中确定若干个训练问卷样本,包括:
从所述已发布问卷中,确定出满足预设条件的若干个问卷作为所述若干个训练问卷样本;
其中,所述预设条件包括:包含的题目数量大于预设数量阈值,和/或,只包含一条答题路径。
9.根据权利要求5至8任一所述的方法,其特征在于,所述从已发布问卷中确定若干个训练问卷样本,包括:
对于每一种用户属性信息,从所述已发布问卷中获取与所述用户属性信息相对应的若干个训练问卷样本;
所述根据所述公式参数生成所述预测公式,包括:
根据所述公式参数,生成与所述用户属性信息相对应的所述预测公式。
10.根据权利要求5至8任一所述的方法,其特征在于,所述方法还包括:
从所述已发布问卷中确定测试问卷样本,所述测试问卷样本是所述已发布问卷中,所述若干个训练问卷样本之外的问卷;
获取所述测试问卷样本的题量特征信息以及最小有效答题时长;
根据所述测试问卷样本的题量特征信息以及生成的所述预测公式计算所述测试问卷样本的预测答题时长;
若所述测试问卷样本的预测答题时长与所述测试问卷样本的最小有效答题时长之间的差值处于预设的差值区间,则确定所述预测公式为有效的预测公式。
11.一种网络问卷的答题时长预测装置,其特征在于,所述装置包括:
特征获取模块,用于获取网络问卷的题量特征信息,所述题量特征信息用于指示所述网络问卷中包含的各个题目类型,以及所述各个题目类型各自对应的题目数量;
公式获取模块,用于获取所述网络问卷对应的预测公式,所述预测公式是通过对已发布问卷的题量特征信息,以及所述已发布问卷的答题结果的实际答题时长进行分析得到的公式,所述已发布问卷是已经发布且接收到答题结果的问卷;
时长计算模块,用于根据所述题量特征信息以及所述预测公式,计算所述网络问卷的预测答题时长,所述预测答题时长是用于区分所述网络问卷的答题结果是否有效的时长阈值。
12.根据权利要求11所述的装置,其特征在于,
所述特征获取模块,具体用于当所述网络问卷中包含至少两条答题路径时,对于所述至少两条答题路径中的每一条答题路径,获取所述答题路径中包含的各个题目类型,以及所述答题路径中包含的各个题目类型各自对应的题目数量;
所述时长计算模块,具体用于按照所述答题路径中包含的各个题目类型,将所述答题路径中的各个题目类型各自对应的题目数量输入所述预测公式,计算获得所述答题路径的预测答题时长。
13.根据权利要求11所述的装置,其特征在于,所述装置还包括:
检测模块,用于在发布所述网络问卷之前,检测所述预测答题时长是否大于预设时长;
提醒模块,用于若所述预测答题时长大于所述预设时长,则向设置所述网络问卷的终端发送提醒消息,所述提醒消息用于提示所述网络问卷的预测答题时长过长。
14.一种网络问卷的预测公式生成装置,其特征在于,所述装置包括:
训练样本确定模块,用于从已发布问卷中确定若干个训练问卷样本,所述已发布问卷是已经发布且接收到答题结果的网络问卷;
第一时长确定模块,用于对于所述若干个训练问卷样本中的每一个训练问卷样本,根据所述训练问卷样本的各个答题结果对应的实际答题时长,确定所述训练问卷样本的最小有效答题时长;
训练数据获取模块,用于获取所述若干个训练问卷样本各自对应的训练数据,所述训练数据包括所述若干个训练问卷样本各自对应的题量特征信息以及所述若干个训练问卷样本各自对应的最小有效答题时长;所述题量特征信息用于指示对应的训练问卷样本中包含的各个题目类型,以及所述各个题目类型各自对应的题目数量;
统计模块,用于对所述若干个训练问卷样本各自对应的训练数据进行统计分析,获得所述预测公式的公式参数;
公式生成模块,用于根据所述公式参数生成所述预测公式,所述预测公式用于根据网络问卷的题量特征信息计算所述网络问卷的预测答题时长,所述预测答题时长是用于区分所述网络问卷的答题结果是否有效的时长阈值。
15.根据权利要求14所述的装置,其特征在于,所述统计模块,包括:
分析单元,用于对所述若干个训练问卷样本各自对应的训练数据进行线性回归分析;
参数获取单元,用于将根据线性回归分析得到的所述各个题目类型各自对应的单题平均答题时长以及修正常量获取为所述预测公式的公式参数;
所述公式生成模块,具体用于根据所述各个题目类型、各个题目类型各自对应的单题平均答题时长以及所述修正常量生成所述预测公式;
其中,对于所述若干个训练问卷样本中的每一个训练样本,所述修正常量用于对所述训练问卷样本中包含的各个题目类型各自对应的题目数量与所述各个题目类型各自对应的单题平均答题长的乘积之和进行修正,以使得修正后的结果接近所述训练问卷样本的最小有效答题时长。
16.根据权利要求14或15所述的装置,其特征在于,所述装置还包括:
测试样本获取模块,用于从所述已发布问卷中确定测试问卷样本,所述测试问卷样本是所述已发布问卷中,所述若干个训练问卷样本之外的问卷;
第二时长获取模块,用于获取所述测试问卷样本的题量特征信息以及最小有效答题时长;
计算模块,用于根据所述测试问卷样本的题量特征信息以及生成的所述预测公式计算所述测试问卷样本的预测答题时长;
有效性确定模块,用于若所述测试问卷样本的预测答题时长与所述测试问卷样本的最小有效答题时长之间的差值处于预设的差值区间,则确定所述预测公式为有效的预测公式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610934069.0A CN108021998B (zh) | 2016-10-31 | 2016-10-31 | 网络问卷的答题时长预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610934069.0A CN108021998B (zh) | 2016-10-31 | 2016-10-31 | 网络问卷的答题时长预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108021998A true CN108021998A (zh) | 2018-05-11 |
CN108021998B CN108021998B (zh) | 2020-10-16 |
Family
ID=62070488
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610934069.0A Active CN108021998B (zh) | 2016-10-31 | 2016-10-31 | 网络问卷的答题时长预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108021998B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920677A (zh) * | 2018-07-09 | 2018-11-30 | 华中师范大学 | 问卷调查方法、调查系统及电子设备 |
CN109086939A (zh) * | 2018-08-14 | 2018-12-25 | 合肥知多少教育科技有限公司 | 一种做题结果的录入方法及装置 |
CN113254487A (zh) * | 2020-02-07 | 2021-08-13 | 北京字节跳动网络技术有限公司 | 信息推送方法和装置 |
CN113378044A (zh) * | 2021-06-04 | 2021-09-10 | 苏州众言网络科技股份有限公司 | 题目匹配方法及平台 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013134746A (ja) * | 2011-12-27 | 2013-07-08 | Canon Marketing Japan Inc | 情報処理装置、情報処理方法、及びコンピュータプログラム |
CN104537252A (zh) * | 2015-01-05 | 2015-04-22 | 深圳市腾讯计算机系统有限公司 | 用户状态单分类模型训练方法和装置 |
CN104699798A (zh) * | 2015-03-18 | 2015-06-10 | 腾讯科技(深圳)有限公司 | 样本数据的处理方法和装置 |
CN105115164A (zh) * | 2015-09-02 | 2015-12-02 | 芜湖美的厨卫电器制造有限公司 | 用户用水洗浴行为习惯的分析方法、装置和系统 |
-
2016
- 2016-10-31 CN CN201610934069.0A patent/CN108021998B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013134746A (ja) * | 2011-12-27 | 2013-07-08 | Canon Marketing Japan Inc | 情報処理装置、情報処理方法、及びコンピュータプログラム |
CN104537252A (zh) * | 2015-01-05 | 2015-04-22 | 深圳市腾讯计算机系统有限公司 | 用户状态单分类模型训练方法和装置 |
CN104699798A (zh) * | 2015-03-18 | 2015-06-10 | 腾讯科技(深圳)有限公司 | 样本数据的处理方法和装置 |
CN105115164A (zh) * | 2015-09-02 | 2015-12-02 | 芜湖美的厨卫电器制造有限公司 | 用户用水洗浴行为习惯的分析方法、装置和系统 |
Non-Patent Citations (1)
Title |
---|
刘荣光: "存量房消费者的购买意愿影响因素研究", 《中国优秀硕士论文全文数据库 经济与管理科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920677A (zh) * | 2018-07-09 | 2018-11-30 | 华中师范大学 | 问卷调查方法、调查系统及电子设备 |
CN109086939A (zh) * | 2018-08-14 | 2018-12-25 | 合肥知多少教育科技有限公司 | 一种做题结果的录入方法及装置 |
CN113254487A (zh) * | 2020-02-07 | 2021-08-13 | 北京字节跳动网络技术有限公司 | 信息推送方法和装置 |
CN113254487B (zh) * | 2020-02-07 | 2024-09-20 | 北京字节跳动网络技术有限公司 | 信息推送方法和装置 |
CN113378044A (zh) * | 2021-06-04 | 2021-09-10 | 苏州众言网络科技股份有限公司 | 题目匹配方法及平台 |
Also Published As
Publication number | Publication date |
---|---|
CN108021998B (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wilcox et al. | Comparing two independent groups via the lower and upper quantiles | |
US11651702B2 (en) | Systems and methods for prediction of student outcomes and proactive intervention | |
Schiller et al. | Temperature models for pricing weather derivatives | |
US10963830B2 (en) | Systems and methods for determining an optimal strategy | |
US20150161686A1 (en) | Managing Reviews | |
CN108021998A (zh) | 网络问卷的答题时长预测方法及装置 | |
Marzi et al. | K-Alpha Calculator–Krippendorff's Alpha Calculator: A user-friendly tool for computing Krippendorff's Alpha inter-rater reliability coefficient | |
US11676503B2 (en) | Systems and methods for predictive modelling of digital assessment performance | |
US11960493B2 (en) | Scoring system for digital assessment quality with harmonic averaging | |
WO2021104387A1 (zh) | 一种自动识别有效数据采集模块的方法和系统 | |
Lai et al. | A simple test procedure in standardizing the power of Hosmer–Lemeshow test in large data sets | |
Gorard | Do we really need confidence intervals in the new statistics? | |
KR102194683B1 (ko) | 법률 상담 스케쥴 관리 방법 및 장치 | |
US9043289B2 (en) | Estimation of errors in attribute values of aggregated databases | |
CN104331405B (zh) | 数据报表的处理方法及装置 | |
US20160253290A1 (en) | Post experiment power | |
CN109241435A (zh) | 一种用于数字货币交易的数据推送方法、装置及系统 | |
US8257091B2 (en) | Matching learning objects with a user profile using top-level concept complexity | |
US11854433B2 (en) | Systems and methods for item response modelling of digital assessments | |
CN113781084A (zh) | 一种调查问卷展示方法和装置 | |
US20150112694A1 (en) | User friendly computer assisted behavioral health assessment system using proprietary algorithms to interpret and score user generated input to produce a substantially real-time preliminary evaluation of a subjectâ#s behavioral health vital signs including recommendations for treatment | |
KR101730340B1 (ko) | 평가 대상에 대한 평가 결과를 정량화하는 방법 | |
WO2017105794A1 (en) | System and method for test data provisioning | |
US11422989B2 (en) | Scoring system for digital assessment quality | |
CN115171828A (zh) | 问卷调查方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |