CN109471935B - 一种问卷调查对象确定方法、装置、电子设备和存储介质 - Google Patents
一种问卷调查对象确定方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN109471935B CN109471935B CN201811179208.9A CN201811179208A CN109471935B CN 109471935 B CN109471935 B CN 109471935B CN 201811179208 A CN201811179208 A CN 201811179208A CN 109471935 B CN109471935 B CN 109471935B
- Authority
- CN
- China
- Prior art keywords
- samples
- sample set
- sample
- extracted
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 126
- 238000005070 sampling Methods 0.000 claims abstract description 214
- 238000004891 communication Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 abstract description 7
- 239000000463 material Substances 0.000 abstract description 4
- 238000000605 extraction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000009897 systematic effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种问卷调查对象确定方法、装置、电子设备和存储介质,可以在问卷调查系统中,确定本次问卷调查的样本集合;确定抽样方法;基于抽样方法,从样本集合中自动抽取样本;将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象,本发明实施例的样本集合包含两个以上样本,每个样本对应不同的待选调查对象,本发明将对问卷调查的待选调查对象的抽样过程,集成到了问卷调查系统中进行,实现了对待选调查对象的自动化抽样,避免了人工抽样带来耗时、易出错、人工和物资成本较高等问题,使得对待选调查对象的抽样更方便、快捷。
Description
技术领域
本发明涉及问卷调查技术领域,尤其涉及一种问卷调查对象确定方法、装置、电子设备和存储介质。
背景技术
目前,应用于教育评价领域的问卷调查系统一般都未考虑抽样设计,导入问卷系统的全部账号全部都需参与问卷调查,即,只满足全样本的调查。如果调查需要抽样,则需由人工进行抽样,人工抽样后再将抽样结果即需要进行调查的对象信息录入问卷系统。
而人工抽样,不仅非常耗费时间且极容易出错,尤其在样本总量很大的情况下还会耗费大量的物资成本。
发明内容
本发明实施例的主要目的在于提供一种问卷调查对象确定方法、装置、电子设备和存储介质,能够实现问卷调查对象的自动化抽取,提升问卷对象抽样的效率和便利性,降低抽取需要的时间和成本。
为实现上述目的,本发明实施例第一方面提供问卷调查对象确定方法,该方法包括:
在问卷调查系统中,确定本次问卷调查的样本集合,其中,所述样本集合包含两个以上样本,每个样本对应不同的待选调查对象;
确定抽样方法;
基于所述抽样方法,从所述样本集合中自动抽取至少一个样本;
将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象。
为实现上述目的,本发明实施例第二方面提供一种问卷调查对象确定装置,该装置包括:
待选对象确定模块,用于在问卷调查系统中,确定本次问卷调查的样本集合,其中,所述样本集合包含两个以上样本,每个样本对应不同的待选调查对象;
选择模块,用于确定抽样方法;
抽样模块,用于基于所述抽样方法,从所述样本集合中自动抽取至少一个样本;
目标对象确定模块,用于将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象。
为实现上述目的,本发明实施例第三方面提供一种电子设备,该电子设备包括:处理器、存储器及通信总线;
所述通信总线用于实现所述处理器和所述存储器之间的连接通信;
所述存储器用于存储一个或多个程序,所述处理器用于执行所述存储器中存储的一个或者多个程序,以实现如上所述的问卷调查对象确定方法的步骤。
为实现上述目的,本发明实施例第四方面提供一种存储介质,该存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上所述的问卷调查对象确定方法的步骤。
本发明实施例提出一种问卷调查对象确定方法、装置、电子设备和存储介质,可以在问卷调查系统中,确定本次问卷调查的样本集合;确定抽样方法;基于所述抽样方法,从所述样本集合中自动抽取样本;将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象,本发明实施例的样本集合包含两个以上样本,每个样本对应不同的待选调查对象,本发明将对问卷调查的待选调查对象的抽样过程,集成到了问卷调查系统中进行,实现了对待选调查对象的自动化抽样,避免了人工抽样带来耗时,易出错,人工和物资成本较高等问题,使得对待选调查对象的抽样更方便、快捷。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种问卷调查对象确定方法的流程示意图;
图2为本发明实施例提供的一种表格形式的样本集合的示意图;
图3为采用本实施例的问卷调查对象确定方法对图2的样本集合中的样本抽样得到的抽样结果的示意图;
图4为本实施例提供的一种问卷调查对象确定装置的结构示意图;
图5为本实施例提供的另一种问卷调查对象确定装置的结构示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
对于问卷调查,在调查对象很多的情况下,需要选择一些作为目标调查对象进行问卷调查。但目前,选择的过程一般由人工进行,不但费时费力,浪费成本,还可能出错。
为了解决现有技术中的问题,本发明实施例提出一种问卷调查对象确定方法,该方法使用于问卷调查活动,尤其适用于教育评价领域中的问卷调查活动。
参见图1,本实施例的问卷调查对象确定方法包括:
步骤101、在问卷调查系统中,确定本次问卷调查的样本集合,其中,所述样本集合包含两个以上样本,每个样本对应不同的待选调查对象;
本实施例中,问卷调查系统可以设置在服务器(包括虚拟服务器,物理服务器等)上,用户通过终端登录问卷调查系统提供的登录地址,然后在问卷调查系统提供的交互界面中输入信息。在其它示例中,问卷调查系统还可以以APP的形式安装在用户终端上,并基于用户终端接收用户的输入,该用户终端包括手机等移动终端和台式电脑等固定终端。
对于一个问卷调查系统而言,其支持的问卷调查可能不止一个,例如问卷调查系统支持不同学校的多个问卷调查。对于不同的问卷调查都可以按照本实施例的方法实现调查对象抽样的自动化。对于需要确定目标调查对象的本次问卷调查而言,其样本集合可以是本次问卷调查原始的全样本集合,例如,当本次问卷调查是针对整个学校,本次问卷调查的样本集合可由对应于整个学校的所有学生的样本组成。从样本集合中抽取样本的目的就是从全校的学生中自动地选择一部分学生作为目标调查对象。样本集合的样本中可以包含该样本对应的待选调查对象的信息,例如,若待调查对象为学校的学生,则样本中可以包含学生的名字、性别、班级、学号、年龄、家庭住址等等信息。
可选的,本次问卷调查的样本集合可以是预存在本地的,也可以是实时从其他服务器或设备上获取的,本实施例对此没有限制。预存样本集合时,可以由采用人工输入每个样本的信息生成样本集合,也可以从其他的存储介质中导入样本集合,本实施例对此没有限制。样本集合可以以类似图2中的表格的形式存在,也可以以其他可用的形式存在,本实施例对此没有限制。
步骤102、确定抽样方法;
本实施例中,可以预先在问卷调查系统中设置至少两种抽样方法,并向用户提供选择抽样方法的功能。
当问卷调查系统中可用抽样方法有至少两种时,确定抽样方法包括:从至少两种可用抽样方法中选择一种作为本次问卷调查使用的抽样方法。
可选的,从至少两种可用抽样方法中选择一种作为本次问卷调查使用的抽样方法包括:根据用户在至少两种可用抽样方法中的选择,确定本次问卷调查使用的抽样方法;或,根据本次问卷调查的抽样目的在至少两种可用抽样方法中自动选择一种作为本次问卷调查使用的抽样方法。当然在后一种方案中,系统自动选择后,还可以弹出询问窗口询问用户是否修改抽样方法,若用户修改,则根据用户的修改重新确定本次问卷调查使用的抽样方法。
本实施例中,问卷调查系统的可用抽样方法包括但不限于:随机抽样、分层随机抽样、矩阵抽样、整群抽样、系统抽样、多阶段抽样等等。
当然,本实施例中并不排除问卷调查系统中只设置一种可用抽样方法的方案,若问卷调查系统中只提供一种可用抽样方法,则步骤102中确定抽样方法为将问卷调查系统提供的可用抽样方法直接确定为本次问卷调查使用的抽样方法。
步骤103、基于抽样方法,从样本集合中自动抽取至少一个样本;
本次问卷调查的抽样方法确定后,可用开始进行抽样。在步骤103中,采用不同的抽样方法时,从样本集合中自动抽取至少一个样本的过程不同。可以理解的是,本实施例中从样本集合中抽取的样本是不重复的。
在一个实例中,从样本集合中抽取的样本的数量或从样本集合中抽取的样本占样本集合的样本总数的比例,可以由用户在步骤103之前通过服务器或终端、装置等输入问卷调查系统,或者由问卷调查系统根据一定规则自动设置。
可选的,在步骤103之前,还包括:获取用户输入的样本集合的抽样数量;或,获取用户输入的样本集合的抽样比例,根据该抽样比例计算样本集合的抽样数量;或根据预设的计算规则以及样本集合中样本的数量自动计算样本集合的抽样数量。步骤103中基于抽样方法,从样本集合中自动抽取至少一个样本包括:基于抽样方法,从样本集合中自动抽取数量等于该抽样数量的样本。
步骤104、将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象。
在抽取样本后,可以在问卷调查系统中为抽取的样本设置问卷账号。可选的,在将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象后,还包括:
将抽取的样本的信息存储到问卷调查系统中;
在问卷调查系统中为抽取的样本中的各样本分别设置问卷账号,其中不同样本的问卷账号不同。
可选的,在将抽取的样本的信息存储到问卷调查系统中时,可以为抽取的样本单独设置一个目标对象样本数据库,将抽取的样本的信息存储在该目标调查对象样本数据库中,需要启动本次问卷调查时,直接从目标调查对象样本数据库中提取样本获取目标调查对象的信息,其中,不同的问卷调查可以设置不同的目标对象样本数据库。
本实施例中,在问卷调查系统中为抽取的样本中的各样本分别设置问卷账号时,可以采用随机生成问卷账号的方式,也可以将样本中包含的具有唯一标识目标调查对象的信息作为问卷账号,即在问卷调查系统中为抽取的样本中的各样本分别设置问卷账号包括:在问卷调查系统中为抽取的样本中的各样本随机生成问卷账号,或,在抽取的样本包含的信息中选择具有唯一标识样本对应的目标抽样对象的信息作为样本的问卷账号。
下面以随机抽样和系统抽样为例,对如何基于抽样方法,从样本集合中自动抽取至少一个样本进行说明。但是,应当理解的是,本实施例中本次问卷调查使用的抽样方法并不局限于示例中的随机抽样和系统抽样。
一、假设在步骤102中选择的抽样方法为随机抽样。
在一个示例中,可以将样本集合作为一个整体进行随机抽样。基于抽样方法,从样本集合中自动抽取至少一个样本包括:基于随机抽样的方法从样本集合中抽取至少一个的样本。
例如,假设本次问卷调查的样本集合是由XX小学的全部学生对应的样本组成,全部学生的数量为N(即样本集合中样本的总数为N)。在确定样本集合后,问卷调查系统可根据样本的总数N对各样本进行编号(编号范围可以是1~N),假设本次问卷调查需要抽取的样本数量为n(n<N),系统可基于随机数生成方法每次随机生成1个不重复的编号直到生成n个编号为止(或系统基于随机数生成方法一次性生成n个不重复的编号),生成的编号对应的样本即为从样本集合中抽取的样本,然后将抽取的样本的信息存储到问卷调查系统中;进入在问卷调查系统中为已抽取的样本中的各样本分别设置问卷账号的步骤。
在实际中,问卷调查的待选调查对象可能需要按照一定的规则分类之后,对每类的待选调查对象进行抽样。例如,在教育评价领域,可能需要按照年级对学校的全部学生进行分类,每个年级分别选择学生进行问卷调查。
所以在另一个示例中,可以按照一定的划分规则先将样本集合分成多个可单独抽样的子样本集合,再对子样本集合分别抽样。可选的,基于抽样方法,从样本集合中自动抽取至少一个样本包括:
从样本集合的样本的各类属性中,选择至少一种类型的属性;
根据选择的属性将样本集合划分为至少两个子样本集合;
确定各子样本集合中需要抽取的样本的数量;
根据抽样方法以及各子样本集合中需要抽取的样本的数量,从各子样本集合中抽取样本。
可选的,根据抽样方法以及各子样本集合中需要抽取的样本的数量,从各子样本集合中抽取样本包括:
按照随机抽样的方法,根据各子样本集合中需要抽取的样本的数量,从各子样本集合中抽取样本。
在该方案中,样本的属性可以理解为样本中的待选调查对象具有的某种性质。例如待选调查对象是学生,属性可以是性别、年纪和年级等等。当从样本集合的样本的各类属性中选择的属性的类型为多个,例如选择学生的性别和年纪,则在根据选择的属性将样本集合划分为至少两个子样本集合时,可以根据选择的多个属性将样本集合中,在这选择的多个属性上表现相同的样本划分为一个子样本集合,从而得到多个子样本集合。例如对样本集合中的样本,按照性别和年级划分,同一年级同一性别的学生的样本被划分到一个样本集合中。
本实施例中,各个子样本集合需要抽取的样本的数量,可以根据样本集合需要抽取的样本的数量以及各个子样本集合中样本的数量确定,可选的,确定各个子样本集合中需要抽取的样本的数量包括:计算各个子样本集合中样本的数量与样本集合中样本的数量的比例,根据该比例以及样本集合需要抽取的样本的数量确定各个子样本集合需要抽取的样本的数量。在各个子样本集合中样本的数量都比较充足的情况下,各个子样本集合中抽取的样本的数量可以相同,可选的,确定各个子样本集合中需要抽取的样本的数量包括:获取样本集合需要抽取的样本的数量,将数量除以子样本集合的个数得到平均抽取数量,将平均抽取数量作为各个子样本集合需要抽取的样本的数量。
例如,如图2所示,假设本次问卷调查的样本集合是由某地区的所有小学(A学校、B学校和C学校)的全部学生对应的样本组成,全部学生的数量为N(即样本集合中样本的总数为N)。
假设以学校为单位对学生进行抽样,划分样本集合的属性为“学校”,需要将每个学校的样本划分到一个子样本集合中,即A学校的学生的样本属于子样本集合A,B学校的学生的样本属于子样本集合B,C学校的学生的样本属于子样本集合C。然后对每个学校内部的学生的样本进行随机抽样,不同学校之间的抽样互相独立、互不影响,问卷调查系统输出每个学校的抽样结果。根据实际需要,如图2所示,每个学生在样本中还具有性别、学籍号等属性。抽取样本后,还对这些从样本集合中抽取的样本按一定规则生成问卷账号,如图3所示,从图2中抽取的学生的学籍号作为问卷账号。
假设还需要对不同学校的不同层次的学生分别进行抽样,可以选择学生的多个属性划分样本集合。
例如,若除了学校,还选择了“性别”为划分样本集合的属性。在上述基于学校划分的子样本集合的基础上,还可以按学生的性别(男、女两类)来再对子样本集合进行划分得到新的子样本集合(各个子样本集合分别对应A学校男生、A学校女生、B学校男生、B学校女生、C学校男生和C学校女生),然后对新得到的各个子样本集合分别进行随机抽样,问卷调查系统输出不同学校的男生和女生的随机抽样结果,其中,各个子样本集合中抽取的样本的数量根据样本集合中需要抽取的样本的总数确定。
例如,若除了学校,还选择了“性别”和“成绩水平”为划分样本集合的属性。则在上述基于学校划分的子样本集合的基础上,还可以按学生的性别(男、女)和学生的成绩水平(高、中、低)交叉后的分层结果进行来再对子样本集合进行划分得到新的子样本集合,共有3*2*3=18层,即最终可得到18个子样本集合(A学校男生成绩高水平、A学校男生成绩中水平、A学校男生成绩低水平、A学校女生成绩高水平、A学校女生成绩中水平、A学校女生成绩低水平······),对每个子样本集合进行单独的随机抽样,互不影响,输出18个抽样结果。
在上述的例子中,可以将每个子样本集合都作为一个独立的整体分别进行编号,然后对各个子样本集合分别随机生成在该子样本集合的编号范围内的抽样编号,抽样编号对应的样本则为子样本集合中抽取的样本,也可以,可以想到的是,若生成的抽样编号的样本为已抽取样本,则该编号被舍弃,重新生成新的抽样编号。
二、假设在步骤102中选择的抽样方法为等距抽样。
在一个示例中,可以将样本集合作为一个整体进行等距抽样。步骤103中基于抽样方法,从样本集合中自动抽取至少一个样本包括:
获取样本集合的抽样间隔;
确定样本集合中抽样的起始位置;
根据起始位置以及抽样间隔从样本集合中抽取样本;
在已抽取样本的数量未达到样本集合需要抽取的样本的数量时,若当前抽取的样本为样本集合中已抽取的样本,则重新确定一个未被抽取的样本的位置作为起始位置,并返回执行根据起始编号以及抽样间隔从样本集合中抽取样本的步骤,直到样本集合中已抽取样本的数量达到样本集合需要抽取的样本的数量为止。
其中,抽样的起始位置可以理解为第一个抽取的样本在样本集合的顺序排列的样本中的位置。例如抽样的起始位置为样本集合中的第三个样本的位置。
抽样间隔可任意根据抽样间隔样本数确定,也可以根据抽样间隔样本比例确定。抽样间隔样本数和抽样间隔样本比例都可以由用户设置或由问卷调查系统默认设置,本实施例对此没有限制。可选的,获取样本集合的抽样间隔包括:获取预设的抽样间隔样本数作为样本集合的抽样间隔;或者,获取预设的抽样间隔比例,根据抽样间隔比例以及样本集合的样本数量计算样本集合的抽样间隔。例如,问卷调查系统设置抽样间隔样本比例为2%,若样本集合中的样本数为1000,则抽样间隔为1000*2%=20。
其中,样本集合需要抽取的样本的数量可由用户设置,也可以由问卷调查系统默认设置,本实施例对此没有限制。可选的,在根据起始位置以及抽样间隔从样本集合中抽取样本前,还包括:确定样本集合需要抽取的样本的数量。可选的,确定样本集合需要抽取的样本的数量包括:获取用户设置的抽样数量为样本集合需要抽取的样本的数量,或,获取系统默认的抽样数量为样本集合需要抽取的样本的数量。
假设本次问卷调查的样本集合是由XX小学的全部学生对应的样本组成,全部学生的数量为N(即样本集合中样本的总数为N)。在确定样本集合后,问卷调查系统可根据样本的总数N对各样本进行编号(编号范围可以是1~N),假设本次问卷调查需要抽取的样本数量为n(n<N)。问卷调查系统根据样本集合的样本总数N和需要抽取的样本数量n计算出建议的等距值(抽样间隔)b(b应大于N/n的值),然后问卷调查系统随机生成1-N编号范围内的一个起始编号a1,该编号a1即为样本集合的本次抽样的起始编号,从这个编号开始计算,第二个被抽取的编号即是a1+b,第三个则是a1+2*b……,第i个被抽到的编号是a1+(i-1)*b,按此规则生成的编号对应的样本则标记为已抽取,如果出现被推算出的编号j>N,但抽取的样本数量没有达到样本集合需要抽取的样本的数量,则需开始新一轮的循环计算。可以将新一轮的第一个被抽取到的编号设置为j-N,依然按照等距值b生成后续的抽取编号,在新一轮中,如果生成到的编号对应的样本是之前已经被标记为已抽取的样本,则需重新生成新的起始编号a2,然后继续生成后面的编号a2+(i-1)*b,原已标记为已抽取的样本不变,按此循环直到抽到n个样本为止。将全部标记为已抽取的样本的信息存储到问卷系统中,并对这些样本按一定规则生成问卷账号,例如样本对应的调查对象是学生,则将学生的学籍号作为问卷账号。
在实际中,问卷调查的待选调查对象可能需要按照一定的规则分类之后,对每类的待选调查对象进行抽样。例如,在教育评价领域,可能需要按照年级对学校的全部学生进行分类,每个年级分别选择学生进行问卷调查。
所以在另一个示例中,可以按照一定的划分规则先将样本集合分成多个可单独抽样的子样本集合,再对子样本集合分别抽样。可选的,基于抽样方法,从样本集合中自动抽取至少一个样本包括:
从样本集合的样本的各类属性中,选择至少一种类型的属性;
根据选择的属性将样本集合划分为至少两个子样本集合;
确定各子样本集合中需要抽取的样本的数量;
根据抽样方法以及各子样本集合中需要抽取的样本的数量,从各子样本集合中抽取样本。
在该方案中,样本的属性可以理解为样本中的待选调查对象具有的某种性质。例如待选调查对象是学生,属性可以是性别、年纪和年级等等。当从样本集合的样本的各类属性中选择的属性的类型为多个,例如选择学生的性别和年纪,则在根据选择的属性将样本集合划分为至少两个子样本集合时,可以根据选择的多个属性将样本集合中,在这选择的多个属性上表现相同的样本划分为一个子样本集合,从而得到多个子样本集合。例如对样本集合中的样本,按照性别和年级划分,同一年级同一性别的学生的样本被划分到一个样本集合中。
可选的,根据抽样方法以及各子样本集合中需要抽取的样本的数量,从各子样本集合中抽取样本包括:
按照以下的方式,对各子样本集合抽取样本:
获取子样本集合的抽样间隔;
确定子样本集合中抽样的起始位置;
根据起始位置以及抽样间隔从子样本集合中抽取样本;
在已抽取样本的数量未达到子样本集合需要抽取的样本的数量时,若当前抽取的样本为子样本集合中已抽取的样本,则重新确定一个未被抽取的样本的位置作为起始位置,并返回执行根据起始编号以及抽样间隔从子样本集合中抽取样本的步骤,直到子样本集合中已抽取的样本的数量达到子样本集合需要抽取的样本的数量为止。
本实施例中,获取子样本集合的抽样间隔包括:
获取抽样间隔样本数作为子样本集合的抽样间隔;
或者,获取抽样间隔比例,根据所述抽样间隔比例以及子样本集合的样本数量计算所述子样本集合的抽样间隔。
抽样间隔样本数和抽样间隔比例可以是用户实时输入的,也可以由问卷调查系统默认设置的,本实施例对此没有限制。
本实施例中,可选的,确定各个子样本集合中需要抽取的样本的数量包括:计算各个子样本集合中样本的数量与样本集合中样本的数量的比例,根据该比例以及样本集合需要抽取的样本的数量确定各个子样本集合需要抽取的样本的数量;或,获取样本集合需要抽取的样本的数量,将数量除以子样本集合的个数得到平均抽取数量,将平均抽取数量作为各个子样本集合需要抽取的样本的数量。
假设本次问卷调查的样本集合是由XX小学的全部学生对应的样本组成,样本集合中样本的属性包括:年级、性别、年龄。选择年级和性别作为划分样本集合的属性。则将样本集合划分为12个子样本集合(一年级男生、一年级女生、二年级男生、二年级女生、·······)。对每个子样本集合可以独立地利用等距抽样进行样本的抽取。假设一年级男生的样本数为N1、一年级女生的样本数为N2、二年级男生的样本数为N3、二年级女生的样本数为N4·······,问卷调查系统对每个子样本集合中的样本进行编号,一年级男生的样本的编号为1~N1、一年级女生的样本的编号为1~N2、二年级男生的样本的编号为1~N3、二年级女生的样本的编号为1~N4······以此类推。编号之后,可以设置每个子样本集合中需要抽取的样本的数量n1、n2·····,或者是抽取的比例p1、p2·····,抽取的样本的数量或比例可以逐个设置,也可以批量统一设置。对各个子样本集合的等距抽样可以参考前一个示例中对样本集合进行等距抽样的描述,本示例在此不再赘述。抽样结束后,可复用样本包含的信息中可唯一标识目标调查对象的信息作为问卷账号,也可以自动生成随机账号赋予每个已抽取样本,输出本次问卷调查的抽取的样本的问卷账号,此时即已完成对问卷调查对象的抽样过程。
为了解决现有技术中的问题,本发明实施例还提供一种问卷调查对象确定装置,参见图4,该卷调查对象确定装置包括:
待选对象确定模41,用于在问卷调查系统中,确定本次问卷调查的样本集合,其中,样本集合包含两个以上样本,每个样本对应不同的待选调查对象;
选择模块42,用于确定抽样方法;
抽样模块43,用于基于抽样方法,从样本集合中自动抽取至少一个样本;
目标对象确定模块44,用于将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象。
本实施例中卷调查对象确定装置可以是服务器(包括物理服务器)或终端如移动终端等。
可选的,参见图5,实施例的卷调查对象确定装置还包括抽样数量确定模块45,用于获取用户输入的样本集合的抽样数量;或获取用户输入的样本集合的抽样比例,根据该抽样比例计算样本集合的抽样数量;或根据预设的计算规则以及样本集合中样本的数量自动计算样本集合的抽样数量。
本实施例中问卷调查对象确定装置可以向用户提供至少两种抽样方法,并向用户提供选择抽样方法的功能。选择模块42,用于当问卷调查系统中可用抽样方法有至少两种时,从至少两种可用抽样方法中选择一种作为本次问卷调查使用的抽样方法。可选的,选择模块42,具体用于根据用户在至少两种可用抽样方法中的选择确定本次问卷调查使用的抽样方法;或,根据本次问卷调查的抽样目的在至少两种可用抽样方法中自动选择一种作为本次问卷调查使用的抽样方法。当然在后一种方案中,系统自动选择后,还可以通过问卷调查对象确定装置的显示模块弹出询问窗口询问用户是否修改抽样方法,若用户修改,则选择模块42根据用户的修改重新确定本次问卷调查使用的抽样方法。
本实施例中,问卷调查系统的可用抽样方法包括但不限于:随机抽样、分层随机抽样、矩阵抽样、整群抽样、系统抽样、多阶段抽样等等。
在一个示例中,可以先对样本集合进行划分,再分别对划分后得到的各个子样本集合进行样本的抽取。可选的,抽样模块43,用于从样本集合的样本的各类属性中,选择至少一种类型的属性;根据选择的属性将样本集合划分为至少两个子样本集合;确定各子样本集合中需要抽取的样本的数量;根据抽样方法以及各子样本集合中需要抽取的样本的数量,从各子样本集合中抽取样本。
可选的,抽样模块43,从各子样本集合中抽取样本的方法包括:按照随机抽样的方法,根据各子样本集合中需要抽取的样本的数量,从各子样本集合中抽取样本;
或,按照以下的方式,对各子样本集合抽取样本:
获取子样本集合的抽样间隔;确定子样本集合中抽样的起始位置;根据起始位置以及抽样间隔从子样本集合中抽取样本;在已抽取样本的数量未达到子样本集合需要抽取的样本的数量时,若当前抽取的样本为子样本集合中已抽取的样本,则重新确定一个未被抽取的样本的位置作为起始位置,并返回执行根据起始编号以及抽样间隔从子样本集合中抽取样本的步骤,直到子样本集合中已抽取的样本的数量达到子样本集合需要抽取的样本的数量为止。
可选的,抽样或模块43获取子样本集合的抽样间隔的方法包括:获取抽样间隔样本数作为子样本集合的抽样间隔;或者,获取抽样间隔比例,根据抽样间隔比例以及子样本集合的样本数量计算子样本集合的抽样间隔。
在另一个示例中,可以将样本集合作为一个整体进行样本的抽取。可选的,抽样模块43,用于基于随机抽样的方法从样本集合中抽取至少一个的样本;或,获取样本集合的抽样间隔,确定样本集合中抽样的起始位置;根据起始位置以及抽样间隔从样本集合中抽取样本;在已抽取样本的数量未达到样本集合需要抽取的样本的数量时,若当前抽取的样本为样本集合中已抽取的样本,则重新确定一个未被抽取的样本的位置作为起始位置,并返回执行根据起始编号以及抽样间隔从样本集合中抽取样本的步骤,直到样本集合中已抽取样本的数量达到样本集合需要抽取的样本的数量为止。
可选的,参见图5,本实施例问卷调查对象确定装置还包括问卷账号设置模块46,用于在将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象后,将抽取的样本的信息存储到问卷调查系统中;在问卷调查系统中为抽取的样本中的各样本分别设置问卷账号,其中不同样本的问卷账号不同。
为了解决现有技术中的问题,本发明实施例还提供一种电子设备,该电子设备包括:处理器、存储器及通信总线;
所述通信总线用于实现所述处理器和所述存储器之间的连接通信;
所述存储器用于存储一个或多个程序,所述处理器用于执行所述存储器中存储的一个或者多个程序,以实现如上述示例中描述的问卷调查对象确定方法的步骤。
为了解决现有技术中的问题,本发明实施例还提供一种存储介质,该存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上述示例中描述的问卷调查对象确定方法的步骤。
采用本实施例提供的方案,可以在问卷调查系统中,基于选择的抽样方法从本次问卷调查的样本集合中自动抽取满足问卷调查需要的样本;将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象,本发明实施例的样本集合包含两个以上样本,每个样本对应不同的待选调查对象,本发明将对问卷调查的待选调查对象的抽样过程,集成到了问卷调查系统中进行,实现了对待选调查对象的自动化抽样,避免了人工抽样带来耗时,易出错,人工和物资成本较高等问题,使得对待选调查对象的抽样更方便、快捷。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。
以上为对本发明所提供的一种问卷调查对象确定方法、装置、电子设备和存储介质的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种问卷调查对象确定方法,其特征在于,包括:
在问卷调查系统中,确定本次问卷调查的样本集合,其中,所述样本集合包含两个以上样本,每个样本对应不同的待选调查对象;
确定抽样方法;
基于所述抽样方法,从所述样本集合的样本的各类属性中,选择至少一种类型的属性;根据选择的属性将所述样本集合划分为至少两个子样本集合;
确定各子样本集合中需要抽取的样本的数量;
根据抽样方法以及所述各子样本集合中需要抽取的样本的数量,从所述各子样本集合中抽取样本;
将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象;
所述根据所述抽样方法以及所述各子样本集合中需要抽取的样本的数量,从所述各子样本集合中抽取样本包括:
按照以下的方式,对各子样本集合抽取样本:获取子样本集合的抽样间隔;
确定所述子样本集合中抽样的起始位置;
根据所述起始位置以及所述抽样间隔从所述子样本集合中抽取样本;
在所述子样本集合的已抽取样本的数量未达到所述子样本集合中需要抽取的样本的数量时,若当前抽取的样本为所述子样本集合中已抽取的样本,则重新确定一个未被抽取的样本的位置作为所述起始位置,并返回执行所述根据所述起始位置以及所述抽样间隔从所述子样本集合中抽取样本的步骤,直到所述子样本集合中已抽取的样本的数量达到所述子样本集合中需要抽取的样本的数量为止。
2.如权利要求1所述的问卷调查对象确定方法,其特征在于,所述根据所述抽样方法以及所述各子样本集合中需要抽取的样本的数量,从所述各子样本集合中抽取样本包括:
按照随机抽样的方法,根据所述各子样本集合中需要抽取的样本的数量,从所述各子样本集合中抽取样本。
3.如权利要求1所述的问卷调查对象确定方法,其特征在于,所述获取子样本集合的抽样间隔包括:
获取抽样间隔样本数作为子样本集合的抽样间隔;
或者,获取抽样间隔比例,根据所述抽样间隔比例以及子样本集合的样本数量计算所述子样本集合的抽样间隔。
4.如权利要求1所述的问卷调查对象确定方法,其特征在于,所述根据抽样方法,从所述样本集合中自动抽取至少一个样本包括:
基于随机抽样的方法从所述样本集合中抽取至少一个的样本;
或,获取所述样本集合的抽样间隔,确定所述样本集合中抽样的起始位置;根据所述起始位置以及所述抽样间隔从所述样本集合中抽取样本;在所述样本集合中已抽取样本的数量未达到所述样本集合需要抽取的样本的数量时,若当前抽取的样本为所述样本集合中已抽取的样本,则重新确定一个未被抽取的样本的位置作为起始位置,并返回执行所述根据所述起始位置以及所述抽样间隔从所述样本集合中抽取样本的步骤,直到所述样本集合中已抽取样本的数量达到所述样本集合需要抽取的样本的数量为止。
5.如权利要求1-4任一项所述的问卷调查对象确定方法,其特征在于,在所述将抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象后,还包括:
将所述抽取的样本的信息存储到所述问卷调查系统中;
在所述问卷调查系统中为所述抽取的样本中的各样本分别设置问卷账号,其中,不同样本的所述问卷账号不同。
6.一种问卷调查对象确定装置,其特征在于,包括:
待选对象确定模块,用于在问卷调查系统中,确定本次问卷调查的样本集合,其中,所述样本集合包含两个以上样本,每个样本对应不同的待选调查对象;
选择模块,用于确定抽样方法;
抽样模块,用于基于抽样方法,从所述样本集合的样本的各类属性中,选择至少一种类型的属性;根据选择的属性将所述样本集合划分为至少两个子样本集合;确定各子样本集合中需要抽取的样本的数量;获取子样本集合的抽样间隔;确定所述子样本集合中抽样的起始位置;根据所述起始位置以及所述抽样间隔从所述子样本集合中抽取样本;在所述子样本集合的已抽取样本的数量未达到所述子样本集合中需要抽取的样本的数量时,若当前抽取的样本为所述子样本集合中已抽取的样本,则重新确定一个未被抽取的样本的位置作为所述起始位置,并返回执行所述根据所述起始位置以及所述抽样间隔从所述子样本集合中抽取样本的步骤,直到所述子样本集合中已抽取的样本的数量达到所述子样本集合中需要抽取的样本的数量为止;
目标对象确定模块,用于抽取的样本所对应的待选调查对象确定为本次问卷调查的目标调查对象。
7.一种电子设备,其特征在于,包括:处理器、存储器及通信总线;所述通信总线用于实现所述处理器和所述存储器之间的连接通信;
所述存储器用于存储一个或多个程序,所述处理器用于执行所述存储器中存储的一个或者多个程序,以实现如权利要求1-5中任一项所述的问卷调查对象确定方法的步骤。
8.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1-5中任一项所述的问卷调查对象确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811179208.9A CN109471935B (zh) | 2018-10-10 | 2018-10-10 | 一种问卷调查对象确定方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811179208.9A CN109471935B (zh) | 2018-10-10 | 2018-10-10 | 一种问卷调查对象确定方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109471935A CN109471935A (zh) | 2019-03-15 |
CN109471935B true CN109471935B (zh) | 2021-02-12 |
Family
ID=65664812
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811179208.9A Active CN109471935B (zh) | 2018-10-10 | 2018-10-10 | 一种问卷调查对象确定方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109471935B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110223116B (zh) * | 2019-06-06 | 2021-07-06 | 武汉元光科技有限公司 | 公交线网信息问卷调查方法及装置 |
CN110704752A (zh) * | 2019-10-30 | 2020-01-17 | 武汉绿安健膳方科技有限公司 | 基于动态表单的问卷输入方法及其系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015123615A1 (en) * | 2014-02-13 | 2015-08-20 | Brewmetrix, Inc. | Analytical system with iterative method of analyzing data in web-based data processor with results display designed for non-experts |
CN107368892B (zh) * | 2017-06-07 | 2020-06-16 | 无锡小天鹅电器有限公司 | 基于机器学习的模型训练方法和装置 |
CN107729713A (zh) * | 2017-10-24 | 2018-02-23 | 广州视睿电子科技有限公司 | 样本处理方法、装置及设备、可读存储介质 |
CN107704436A (zh) * | 2017-10-30 | 2018-02-16 | 平安科技(深圳)有限公司 | 数据抽样方法、终端、设备以及计算机可读存储介质 |
-
2018
- 2018-10-10 CN CN201811179208.9A patent/CN109471935B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109471935A (zh) | 2019-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200311342A1 (en) | Populating values in a spreadsheet using semantic cues | |
US9299041B2 (en) | Obtaining data from unstructured data for a structured data collection | |
CN109508420B (zh) | 一种知识图谱属性的清洗方法及装置 | |
CN107918618B (zh) | 数据处理方法及装置 | |
CN110908891A (zh) | 一种测试数据生成方法、装置、电子设备及存储介质 | |
CN112131220B (zh) | 数据报表处理方法及装置 | |
CN109637238B (zh) | 一种练习题的生成方法、装置、设备和存储介质 | |
US20190272769A1 (en) | Information processing device, information processing method, and non-transitory computer readable medium storing information processing program | |
CN109471935B (zh) | 一种问卷调查对象确定方法、装置、电子设备和存储介质 | |
CN110209780B (zh) | 一种问题模板生成方法、装置、服务器及存储介质 | |
CN112231317B (zh) | 数据的查询方法、装置、电子装置和存储介质 | |
CN111967234A (zh) | 可视化报表的生成方法、装置、终端设备和存储介质 | |
CN110597789B (zh) | 架构图自动生成方法、装置、设备及计算机可读存储介质 | |
CN112286879A (zh) | 基于元数据的数据资产构建方法及装置 | |
CN110929519B (zh) | 实体属性抽取方法及装置 | |
US10489514B2 (en) | Text visualization system, text visualization method, and recording medium | |
CN114741144B (zh) | 一种web端复杂表格显示方法、装置及系统 | |
CN110674632A (zh) | 一种确定安全级别的方法及装置、存储介质和设备 | |
US20160321259A1 (en) | Network insights | |
CN111324820B (zh) | 邀请方法、装置、终端设备及计算机存储介质 | |
CN103049275A (zh) | 一种处理操作指令的方法、装置和设备 | |
CN110110280B (zh) | 对坐标的曲线积分计算方法、装置、设备及存储介质 | |
CN111125501B (zh) | 用于处理信息的方法和装置 | |
CN110781191A (zh) | 编排数据的处理方法及服务器 | |
CN112257450A (zh) | 数据处理方法、装置、可读存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |