CN113011734B - 一种基于capi和cati的调查数据质量控制方法 - Google Patents
一种基于capi和cati的调查数据质量控制方法 Download PDFInfo
- Publication number
- CN113011734B CN113011734B CN202110285724.5A CN202110285724A CN113011734B CN 113011734 B CN113011734 B CN 113011734B CN 202110285724 A CN202110285724 A CN 202110285724A CN 113011734 B CN113011734 B CN 113011734B
- Authority
- CN
- China
- Prior art keywords
- investigation
- data
- sample
- quality control
- capi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011835 investigation Methods 0.000 title claims abstract description 97
- 238000003908 quality control method Methods 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 claims abstract description 47
- 230000008569 process Effects 0.000 claims abstract description 40
- 230000002159 abnormal effect Effects 0.000 claims abstract description 33
- 238000005070 sampling Methods 0.000 claims description 30
- 230000007246 mechanism Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 18
- 230000009467 reduction Effects 0.000 claims description 11
- 238000012550 audit Methods 0.000 claims description 9
- 238000012795 verification Methods 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 7
- 238000013480 data collection Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 230000007613 environmental effect Effects 0.000 claims description 4
- 230000001960 triggered effect Effects 0.000 claims description 4
- 230000009471 action Effects 0.000 claims description 3
- 230000000149 penetrating effect Effects 0.000 claims description 2
- 238000011084 recovery Methods 0.000 claims description 2
- 238000007726 management method Methods 0.000 description 10
- 210000003781 tooth socket Anatomy 0.000 description 5
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/04—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Operations Research (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于CAPI和CATI的调查数据质量控制方法,包括如下步骤:S1.正式统计调查之前,采用CAPI或CATI系统协助进行正式调查规模3‰以上的小规模预调查;S2.在小规模预调查过程中,技术人员须根据调查员反馈的CAPI或CATI的系统故障、漏洞进行检修,以最大程度地降低系统故障造成的数据质量问题;S3.对于预调查的所有样本,系统须实时核对调查员开始调查时的GPS信息与样本位置对应的GPS信息是否一致,若不一致,修正系统的定位故障,同时设定GPS偏移阈值;S4.GPS偏移超过阈值的,系统自动认定为异常值,提示质控人员关注和处理;S5.系统须核对调查开始时间和录音开始时间是否一致。本发明解决了效率低下且容易出现无法追溯的误判漏判的数据判定方式的问题。
Description
技术领域
本发明涉及统计调查领域,更具体地涉及一种基于CAPI和CATI的调查数据质量控制方法。
背景技术
数据质量管理标准主要包括适用性、准确性、时效性、可比性、完整性、简便性、可获取性等方面,这些指标都相对抽样,难以量化形成指导性依据。现有技术中往往通过人工审核、经验判断的方式,来判定数据的质量问题,管理效率低下且容易出现无法追溯的误判漏判,从而影响调查数据质量,甚至进一步影响后续数据挖掘结果和研究成果。
发明内容
本发明提供了一种基于CAPI和CATI的调查数据质量控制方法,以解决通过人工审核、经验判断的方式,来判定数据的质量,其效率低下且容易出现无法追溯的误判漏判,从而影响调查数据质量,甚至进一步影响后续数据挖掘结果和研究成果的问题。
为解决上述技术问题,本发明所采用的技术方案是:一种基于CAPI和CATI的调查数据质量控制方法,包括如下步骤:
步骤S1.正式统计调查之前,采用CAPI或CATI系统协助进行正式调查规模3‰以上的小规模预调查;
步骤S2.在小规模预调查过程中,技术人员须根据调查员反馈的CAPI或CATI的系统故障、漏洞进行检修,尽力确保CAPI或CATI系统在正式调查时能顺畅运行,以最大程度地降低系统故障造成的数据质量问题;
步骤S3.对于预调查的所有样本,系统须实时核对调查员开始调查时的GPS信息与样本位置对应的GPS信息是否一致,若不一致,须实时与调查员及督导核对情况,修正系统的定位故障,同时设定GPS偏移阈值;
步骤S4.正式访问中,GPS偏移超过阈值的,系统自动认定为异常值,提示质控人员关注和处理;
步骤S5.预调查的所有样本均需记录调查录音,系统须核对调查开始时间和录音开始时间是否一致,若不一致,须及时修正系统的录音故障;
步骤S6.在录音开始时间与调查开始时间一致的情况下,质控人员须核对录音质量,噪音情况、声音辨识度等,评估系统的降噪处理效果,与技术人员联调修正,确保系统降噪处理标准适用于实际调查情景;
步骤S7.质控人员须检查所有调查录音,记录下录音中反映出来的调查过程中受访对象理解上存在困难的问题,以便优化问卷的问题表述方式,消除可能存在的歧义;质控人员还需核对录音中受访者的答案与调查员填写的答案是否一致,如不一致,须记录下受访者的真实答案以作订正。
步骤S8.对有订正的题目进行评估,优化答案有效性限制规则,减少填写错误,制定答案容许区间,辅助异常值识别;
步骤S9.须对所有预调查数据进行无回答比例、不知道比例、误填比例(订正比例)统计,以统计结果的95%的分位数为阈值设置问卷有效性规则,即调查中样本的无回答比例或不知道比例或误填比例大于相应阈值的,系统自动判定为无效问卷,调查员对判定结果可以提出申诉,经实地调查督导核实后可重新判定为有效问卷,否则该问卷作废,须重新访问。
其中,统计样本访问时长,以统计结果的5%的分位数为阈值设置异常值提示,即样本访问时长少于阈值的系统自动认定为异常值,提示质控人员关注。
在正式访问过程中,调查员采用CAPI和CATI系统辅助调查,样本访问结束后数据实时传输至质控后台,系统根据预先制定的异常值检测规则提示质控人员核实重要指标,如GPS偏移过大、某个问题的答案超过容许区间、访问录音未正常开启、环境噪声过大、访问时间过短、触发无效样本规则等,质控人员须对每一项异常值进行情况核实,并进行合理说明,无法核实或确认存在访问不规范的样本须判定为无效样本。
调查时,若调查员遭遇拒访、无人应答等无法调查的情况,可以申请更换样本,但必须遵守以下换样规则:1.遭遇拒访3次以上(并至少一次在基层协作人员陪同下调查)。2.无人应答6次以上(上一次调查结束与下一次调查开启的时间间隔至少3小时,并至少有一次调查开启的时间是晚上或周末)。质控人员须对每一份样本的录音数据进行核查,进行数据误填、漏填等订正。
数据收集完成后,需要对调查的全量数据逻辑平衡审核,这个过程通过问卷问题之间的固有关联设置审核规则,由计算机自动批量审核,完成后反馈一个错误数据的订正清单,质控人员按照清单对样本数据进行一一核实和订正。
数据审核完成后,须对全量样本数据进行批量清洗,规范数据结构,针对野值、极值、缺失值进行统一处理。
最后检查调查后的入样概率和抽样概率差异,计算样本所有样本的权重(入样概率的倒数),根据上述数据核查处理过程后,对关键指标相对总体的偏差仍超过10%的样本,统一采用权重调整的方式进行偏差修正。
在抽样调查中,每个样本被抽中的概率(入样概率)不同,因此每个样本所代表的总体也就不同。在推断总体的时候,需要通过权重的调整来真实准确地反映每个样本所代表的总体数量,以获得对总体的正确推断。抽样权重的计算方法如下,根据每阶段的抽样分别计算出初级抽样单元被抽中的概率P1、二级抽样单元被抽中的概率P2以及末端抽样单元被抽中的概率P3,分别计算出三阶段的抽样权重W1=1/P1、W2=1/P2、W3=1/P3,最后得到该样本的抽样权重为W=W1×W2×W3。在数据核查后,对于前述关键指标相对总体的偏差γ仍超过10%的样本,进行如下权重调整:W=W*γ。
如某样本在数据核查后发现无回答比例为30%,与总体无回答比例7%的偏差超过10%,则将其原权重W调整为W*30%。
与现有技术相比,本发明具有以下有益效果:本发明创新地为基于CAPI和CATI的统计调查制定了详细的数据质量管理方法,提供的标准化的数据质量控制流程,在最大程度提高样本数据精度的前提下,一定程度地提高了数据质量管理的效率。所有数据处理过程均在计算机辅助下完成,保留数据处理痕迹,确保数据可回溯。通过以上数据质量管理过程,可以极大地确保统计调查数据的精度,并通过计算机一定程度上提高数据质量管理效率,减少人工投入。
附图说明
图1为本发明的一种基于CAPI和CATI的调查数据质量控制方法的步骤示意图。
图2为本发明的扫描装置的结构示意图。
图3为本发明的导轨的结构示意图。
图4为本发明的升降机构和限位机构的示意图。
图5为本发明的升降机构剖视示意图。
图6为本发明的升降机构俯视示意图。
图7为本发明的限位机构剖视示意图。
附图标记:101为箱体,102为输送带,103为定限位板,104为动限位板,105为导轨,106为滑块,1为底座,2为扫描仪主体,3为转动轴承,4为升降机构,5为齿圈,6为限位机构,7为套管,8为活动管,9为弹簧柱塞,10为通孔,11为滑槽,12为滑块106,13为壳体,14为插销,15为弹簧,16为凸环。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
下面结合实施例对本发明作进一步的描述,所描述的实施例仅仅是本发明一部分实施例,并不是全部的实施例。基于本发明中的实施例,本领域的普通技术人员在没有做出创造性劳动前提下所获得的其他所用实施例,都属于本发明的保护范围。
请参阅图1至图7,图中所示者为本发明所选用的实施例结构,此仅供说明之用,在专利申请上并不受此种结构的限制。
实施例一
如图1所示,一种基于CAPI和CATI的调查数据质量控制方法,包括如下步骤:
步骤S1.正式统计调查之前,采用CAPI或CATI系统协助进行正式调查规模3‰以上的小规模预调查;
步骤S2.在小规模预调查过程中,技术人员须根据调查员反馈的CAPI或CATI的系统故障、漏洞进行检修,尽力确保CAPI或CATI系统在正式调查时能顺畅运行,以最大程度地降低系统故障造成的数据质量问题;
步骤S3.对于预调查的所有样本,系统须实时核对调查员开始调查时的GPS信息与样本位置对应的GPS信息是否一致,若不一致,须实时与调查员及督导核对情况,修正系统的定位故障,同时设定GPS偏移阈值;
步骤S4.正式访问中,GPS偏移超过阈值的,系统自动认定为异常值,提示质控人员关注和处理;
步骤S5.预调查的所有样本均需记录调查录音,系统须核对调查开始时间和录音开始时间是否一致,若不一致,须及时修正系统的录音故障;
步骤S6.在录音开始时间与调查开始时间一致的情况下,质控人员须核对录音质量,噪音情况、声音辨识度等,评估系统的降噪处理效果,与技术人员联调修正,确保系统降噪处理标准适用于实际调查情景;
步骤S7.质控人员须检查所有调查录音,记录下录音中反映出来的调查过程中受访对象理解上存在困难的问题,以便优化问卷的问题表述方式,消除可能存在的歧义;质控人员还需核对录音中受访者的答案与调查员填写的答案是否一致,如不一致,须记录下受访者的真实答案以作订正;
步骤S8.对有订正的题目进行评估,优化答案有效性限制规则,减少填写错误,制定答案容许区间,辅助异常值识别;
步骤S9.须对所有预调查数据进行无回答比例、不知道比例、误填比例(订正比例)统计,以统计结果的95%的分位数为阈值设置问卷有效性规则,即调查中样本的无回答比例或不知道比例或误填比例大于相应阈值的,系统自动判定为无效问卷,调查员对判定结果可以提出申诉,经实地调查督导核实后可重新判定为有效问卷,否则该问卷作废,须重新访问。
其中,统计样本访问时长,以统计结果的5%的分位数为阈值设置异常值提示,即样本访问时长少于阈值的系统自动认定为异常值,提示质控人员关注。
在正式访问过程中,调查员采用CAPI和CATI系统辅助调查,样本访问结束后数据实时传输至质控后台,系统根据预先制定的异常值检测规则提示质控人员核实重要指标,如GPS偏移过大、某个问题的答案超过容许区间、访问录音未正常开启、环境噪声过大、访问时间过短、触发无效样本规则等,质控人员须对每一项异常值进行情况核实,并进行合理说明,无法核实或确认存在访问不规范的样本须判定为无效样本。
调查时,若调查员遭遇拒访、无人应答等无法调查的情况,可以申请更换样本,但必须遵守以下换样规则:1.遭遇拒访3次以上(并至少一次在基层协作人员陪同下调查)。2.无人应答6次以上(上一次调查结束与下一次调查开启的时间间隔至少3小时,并至少有一次调查开启的时间是晚上或周末)。质控人员须对每一份样本的录音数据进行核查,进行数据误填、漏填等订正。
数据收集完成后,需要对调查的全量数据逻辑平衡审核,这个过程通过问卷问题之间的固有关联设置审核规则,由计算机自动批量审核,完成后反馈一个错误数据的订正清单,质控人员按照清单对样本数据进行一一核实和订正。
数据审核完成后,须对全量样本数据进行批量清洗,规范数据结构,针对野值、极值、缺失值进行统一处理。
最后检查调查后的入样概率和抽样概率差异,计算样本所有样本的权重(入样概率的倒数),根据上述数据核查处理过程后,对关键指标相对总体的偏差仍超过10%的样本,统一采用权重调整的方式进行偏差修正。
在抽样调查中,每个样本被抽中的概率(入样概率)不同,因此每个样本所代表的总体也就不同。在推断总体的时候,需要通过权重的调整来真实准确地反映每个样本所代表的总体数量,以获得对总体的正确推断。抽样权重的计算方法如下,根据每阶段的抽样分别计算出初级抽样单元被抽中的概率P1、二级抽样单元被抽中的概率P2以及末端抽样单元被抽中的概率P3,分别计算出三阶段的抽样权重W1=1/P1、W2=1/P2、W3=1/P3,最后得到该样本的抽样权重为W=W1×W2×W3。在数据核查后,对于前述关键指标相对总体的偏差γ仍超过10%的样本,进行如下权重调整:W=W*γ。
如某样本在数据核查后发现无回答比例为30%,与总体无回答比例7%的偏差超过10%,则将其原权重W调整为W*30%。
CAPI是计算机辅助面访,我们通过手机、pad等移动设备,安装好相应的系统,进行当面访问,记录问卷数据、地理位置、录音、照片等信息。
CAPI系统包含的模块:样本管理:管理受访户信息;问卷模块:填写问卷数据;拍照模块:拍摄照片;数据上传:将数据回传到云服务器;系统登录:录音和记录当前地理位置信息;
CATI是计算机辅助电话访问,我们的系统通过语音交换机,实现网络在线拨号。
CATI系统包含的模块:样本管理:管理受访户信息;样本分配:将受访户分配到对应的电访访员;电话拨打模块:电访访员通过系统对受访户进行电话拨打;问卷模块:填写问卷数据。
本发明的构思如下:
首先,在正式统计调查之前,采用CAPI或CATI系统协助进行于正式调查规模3‰以上的小规模预调查。在调查过程中,技术人员须根据调查员的反馈及时记录CAPI或CATI的系统故障、漏洞,尽力确保CAPI或CATI系统在正式调查时能顺畅运行,以最大程度地降低系统故障造成的数据质量问题;其次,对于预调查的所有样本,系统须实时核对调查员开始调查时的GPS信息与样本位置对应的GPS信息是否一致,若不一致,须实时与调查员及督导核对情况,修正系统的定位故障,同时设定GPS偏移阈值。正式访问中,GPS偏移超过阈值的,系统自动认定为异常值,提示质控人员关注和处理;预调查的所有样本均需记录调查录音,系统须核对调查开始时间和录音开始时间是否一致,若不一致,须及时修正系统的录音故障。在录音开始时间与调查开始时间一致的情况下,质控人员须核对录音质量,噪音情况、声音辨识度等,评估系统的降噪处理效果,与技术人员联调修正,确保系统降噪处理标准适用于实际调查情景;接下来,质控人员须检查所有调查录音,记录下录音中反映出来的调查过程中受访对象理解上存在困难的问题,以便优化问卷的问题表述方式,消除可能存在的歧义;质控人员还需核对录音中受访者的答案与调查员填写的答案是否一致,如不一致,须记录下受访者的真实答案以作订正。同时,对有订正的题目进行评估,优化答案有效性限制规则,减少填写错误,制定答案容许区间,辅助异常值识别;最后,须对所有预调查数据进行无回答比例、不知道比例、误填比例(订正比例)统计,以统计结果的95%的分位数为阈值设置问卷有效性规则,即调查中样本的无回答比例或不知道比例或误填比例大于相应阈值的,系统自动判定为无效问卷,调查员对判定结果可以提出申诉,经实地调查督导核实后可重新判定为有效问卷,否则该问卷作废,须重新访问。统计样本访问时长,以统计结果的5%的分位数为阈值设置异常值提示,即样本访问时长少于阈值的系统自动认定为异常值,提示质控人员关注。
在正式访问过程中,调查员采用CAPI和CATI系统辅助调查,样本访问结束后数据实时传输至质控后台,系统根据预先制定的异常值检测规则提示质控人员核实重要指标,如GPS偏移过大、某个问题的答案超过容许区间、访问录音未正常开启、环境噪声过大、访问时间过短、触发无效样本规则等,质控人员须对每一项异常值进行情况核实,并进行合理说明,无法核实或确认存在访问不规范的样本须判定为无效样本。调查时,若调查员遭遇拒访、无人应答等无法调查的情况,可以申请更换样本,但必须遵守以下换样规则:1.遭遇拒访3次以上(并至少一次在基层协作人员陪同下调查)。2.无人应答6次以上(上一次调查结束与下一次调查开启的时间间隔至少3小时,并至少有一次调查开启的时间是晚上或周末)。质控人员须对每一份样本的录音数据进行核查,进行数据误填、漏填等订正。
数据收集完成后,需要对调查的全量数据逻辑平衡审核,这个过程通过问卷问题之间的固有关联设置审核规则,由计算机自动批量审核,完成后反馈一个错误数据的订正清单,质控人员按照清单对样本数据进行一一核实和订正。
数据审核完成后,须对全量样本数据进行批量清洗,规范数据结构,针对野值、极值、缺失值进行统一处理。
最后检查调查后的入样概率和抽样概率差异,计算样本所有样本的权重(入样概率的倒数),根据上述数据核查处理过程后,对关键指标相对总体的偏差仍超过10%的样本,统一采用权重调整的方式进行偏差修正。
以上所有数据处理过程均在计算机辅助下完成,保留数据处理痕迹,确保数据可回溯。通过以上数据质量管理过程,可以极大地确保统计调查数据的精度,并通过计算机一定程度上提高数据质量管理效率,减少人工投入。
实施例二
实施例二为实施例一的进一步优化。
在实际调查过程中,因为各种各样的原因,如设备出现故障:电量不足、软件故障、无网络信号等等问题时,所以在实际中,往往会备用纸质调查表,而使用纸质调查表后,需要人工录入数据,这就非常容易造成人为的失误,因此为了保证调查数据的准确性和质量,本发明的应用过程中还使用扫描装置进行调查数据的录入。
扫描装置用于录入调查数据,并与CAPI系统的云服务器连接,以使将录入的调查数据上传到云服务器。
如图2、图3和图4所示,扫描装置包括箱体101、输送带102、定限位板103、动限位板104、导轨105、底座1和扫描仪主体2,箱体101贯穿式安装有输送带102,输送带102上部的两侧分别设置有定限位板103和动限位板104,箱体101内设置有导轨105,导轨105的滑块106与动限位板104连接,以驱动动限位板104在输送带102上移动,从而调节定限位板103和动限位板104之间的距离,箱体101底部设置有底座1,底座1上嵌装有转动轴承3,转动轴承3的内圈中固定插接有升降机构4,升降机构4上固定套接有齿圈5,底座1上安装有限位机构6,限位机构6的一端滑动插接在齿圈5的齿槽内,扫描仪主体2安装在升降机构4的上端,且位于输送带102的上方,以使扫描仪主体2对输送带102上的纸质调查表进行扫描。实际中,根据纸质调查表的宽度调节定限位板103和动限位板104之间的距离,从而限定纸质调查表的扫描位置,在配合使用限位机构6和升降机构4,将扫描仪主体2对准限定的纸质调查表的扫描位置,再将纸质调查表放在输送带102上,即可快速、准确对纸质调查表进行扫描。
如图5和图6所示,升降机构4包括套管7和活动管8,活动管8滑动插接在套管7内,活动管8内安装有弹簧柱塞9,套管7的侧壁上开设有通孔10,弹簧柱塞9的柱塞头滑动插接在通孔10内,套管7的下端固定插接在转动轴承3的内圈中,扫描仪主体2安装在活动管8的上端,齿圈5固定套接在套管7上;通孔10设置有不少于两组,可以调节活动管8的高度;套管7的内壁上开设有滑槽11,活动管8的侧壁上焊接固定有与滑槽11相匹配的滑块10612,可以对活动管8在套管7内垂直升降,防止活动管8在套管7内转动;滑块10612的侧壁与滑槽11的内壁间隙滑动配合,且间隙不大于0.2mm,可以使活动管8在套管7内稳定滑动,避免活动管8在套管7内垂直升降时晃动,影响弹簧柱塞9与通孔10配合使用。
如图7所示,限位机构6包括壳体13、插销14和弹簧15,插销14贯穿于壳体13,且插销14滑动插接在壳体13的内部,弹簧15滑动套接在插销14上,插销14上设置有凸环16,弹簧15的一端与凸环16的一侧焊接固定,弹簧15的另一端与壳体13的内壁焊接固定,壳体13通过螺栓安装在底座1上,插销14的一端滑动插接在齿圈5的齿槽内,通过限位机构6的使用,在对扫描仪主体2进行角度调节时,拉动插销14,使插销14脱离齿圈5的齿槽,旋转升降机构4,绕转动轴承3左右转动,当旋转到用户所需要的角度,松开插销14,在弹簧15的弹性恢复作用下,使插销14插入到齿圈5的齿槽内。
在需要调节扫描仪主体2的扫描位置时,通过拉动插销14,使插销14脱离齿圈5的齿槽,然后旋转升降机构4,使扫描仪主体2转动,当用户将扫描仪主体2调节到需要的位置后,松开插销14,通过弹簧15的作用,使插销14插入齿圈5的齿槽内,在需要对扫描仪主体2的高度进行调节,通过按压弹簧柱塞9,使活动管8可以在套管7内滑动,根据用户的使用需要,向上提升活动管8或者将活动管8降低,然后将弹簧柱塞9的柱塞头插入到通孔10内,对活动管8的位置进行固定,从而可以将扫描仪主体2的高度进行固定。
以上实施例是用以说明本发明,并非用以限制本发明,所以举例数值的变更或等效元件的置换仍应隶属本发明的范畴。
由以上详细说明,可使本领域普通技术人员明了本发明的确可达成前述目的,实已符合专利法的规定。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,应当指出的是,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种基于CAPI和CATI的调查数据质量控制方法,其特征在于,包括如下步骤:
步骤S1.正式统计调查之前,采用CAPI或CATI系统协助进行正式调查规模3‰以上的小规模预调查;
步骤S2.在小规模预调查过程中,技术人员须根据调查员反馈的CAPI或CATI的系统故障、漏洞进行检修,尽力确保CAPI或CATI系统在正式调查时能顺畅运行,以最大程度地降低系统故障造成的数据质量问题;
步骤S3.对于预调查的所有样本,系统须实时核对调查员开始调查时的GPS信息与样本位置对应的GPS信息是否一致,若不一致,须实时与调查员及督导核对情况,修正系统的定位故障,同时设定GPS偏移阈值;
步骤S4.正式访问中,GPS偏移超过阈值的,系统自动认定为异常值,提示质控人员关注和处理;
步骤S5.预调查的所有样本均需记录调查录音,系统须核对调查开始时间和录音开始时间是否一致,若不一致,须及时修正系统的录音故障;
还包括步骤S6,步骤S6.在录音开始时间与调查开始时间一致的情况下,质控人员须核对录音质量,噪音情况、声音辨识度等,评估系统的降噪处理效果,与技术人员联调修正,确保系统降噪处理标准适用于实际调查情景;
还包括步骤S7,步骤S7.质控人员须检查所有调查录音,记录下录音中反映出来的调查过程中受访对象理解上存在困难的问题,以便优化问卷的问题表述方式,消除可能存在的歧义;质控人员还需核对录音中受访者的答案与调查员填写的答案是否一致,如不一致,须记录下受访者的真实答案以作订正;
还包括步骤S8,步骤S8.对有订正的题目进行评估,优化答案有效性限制规则,减少填写错误,制定答案容许区间,辅助异常值识别;在正式访问过程中,调查员采用CAPI和CATI系统辅助调查,样本访问结束后数据实时传输至质控后台,系统根据预先制定的异常值检测规则提示质控人员核实重要指标,如GPS偏移过大、某个问题的答案超过容许区间、访问录音未正常开启、环境噪声过大、访问时间过短、触发无效样本规则等,质控人员须对每一项异常值进行情况核实,并进行合理说明,无法核实或确认存在访问不规范的样本须判定为无效样本;
还包括步骤S9,步骤S9.须对所有预调查数据进行无回答比例、不知道比例、误填比例统计,以统计结果的95%的分位数为阈值设置问卷有效性规则,即调查中样本的无回答比例或不知道比例或误填比例大于相应阈值的,系统自动判定为无效问卷,调查员对判定结果可以提出申诉,经实地调查督导核实后可重新判定为有效问卷,否则该问卷作废,须重新访问;
步骤S9中,统计样本访问时长,以统计结果的5%的分位数为阈值设置异常值提示,即样本访问时长少于阈值的系统自动认定为异常值,提示质控人员关注;
调查时,若调查员遭遇拒访、无人应答等无法调查的情况,可以申请更换样本,但必须遵守以下换样规则:1.遭遇拒访3次以上;2.无人应答6次以上;质控人员须对每一份样本的录音数据进行核查,进行数据误填、漏填等订正;
数据收集完成后,需要对调查的全量数据逻辑平衡审核,这个过程通过问卷问题之间的固有关联设置审核规则,由计算机自动批量审核,完成后反馈一个错误数据的订正清单,质控人员按照清单对样本数据进行一一核实和订正;
数据审核完成后,须对全量样本数据进行批量清洗,规范数据结构,针对野值、极值、缺失值进行统一处理;
最后检查调查后的入样概率和抽样概率差异,计算样本所有样本的权重,根据上述数据核查处理过程后,对关键指标相对总体的偏差仍超过10%的样本,统一采用权重调整的方式进行偏差修正;
在抽样调查中,每个样本被抽中的概率不同,因此每个样本所代表的总体也就不同;
在推断总体的时候,需要通过权重的调整来真实准确地反映每个样本所代表的总体数量,以获得对总体的正确推断;抽样权重的计算方法如下,根据每阶段的抽样分别计算出初级抽样单元被抽中的概率P1、二级抽样单元被抽中的概率P2以及末端抽样单元被抽中的概率P3,分别计算出三阶段的抽样权重W1=1/P1、W2=1/P2、W3=1/P3,最后得到该样本的抽样权重为W=W1×W2×W3;在数据核查后,对于前述关键指标相对总体的偏差γ仍超过10%的样本,进行如下权重调整:W=W*γ;
应用过程中还使用扫描装置进行调查数据的录入;
扫描装置用于录入调查数据,并与CAPI系统的云服务器连接,以使将录入的调查数据上传到云服务器;
扫描装置包括箱体、输送带、定限位板、动限位板、导轨、底座和扫描仪主体,箱体贯穿式安装有输送带,输送带上部的两侧分别设置有定限位板和动限位板,箱体内设置有导轨,导轨的滑块与动限位板连接,以驱动动限位板在输送带上移动,从而调节定限位板和动限位板之间的距离,箱体底部设置有底座,底座上嵌装有转动轴承,转动轴承的内圈中固定插接有升降机构,升降机构上固定套接有齿圈,底座上安装有限位机构,限位机构的一端滑动插接在齿圈的齿槽内,扫描仪主体安装在升降机构的上端,且位于输送带的上方,以使扫描仪主体对输送带上的纸质调查表进行扫描;
升降机构包括套管和活动管,活动管滑动插接在套管内,活动管内安装有弹簧柱塞,套管的侧壁上开设有通孔,弹簧柱塞的柱塞头滑动插接在通孔内,套管的下端固定插接在转动轴承的内圈中,扫描仪主体安装在活动管的上端,齿圈固定套接在套管上;通孔设置有不少于两组,可以调节活动管的高度;套管的内壁上开设有滑槽,活动管的侧壁上焊接固定有与滑槽相匹配的滑块,可以对活动管在套管内垂直升降,防止活动管在套管内转动;滑块的侧壁与滑槽的内壁间隙滑动配合,且间隙不大于0.2mm,可以使活动管在套管内稳定滑动,避免活动管在套管内垂直升降时晃动,影响弹簧柱塞与通孔配合使用;
限位机构包括壳体、插销和弹簧,插销贯穿于壳体,且插销滑动插接在壳体的内部,弹簧滑动套接在插销上,插销上设置有凸环,弹簧的一端与凸环的一侧焊接固定,弹簧的另一端与壳体的内壁焊接固定,壳体通过螺栓安装在底座上,插销的一端滑动插接在齿圈的齿槽内,通过限位机构的使用,在对扫描仪主体进行角度调节时,拉动插销,使插销脱离齿圈的齿槽,旋转升降机构,绕转动轴承左右转动,当旋转到用户所需要的角度,松开插销,在弹簧的弹性恢复作用下,使插销插入到齿圈的齿槽内。
2.如权利要求1所述的一种基于CAPI和CATI的调查数据质量控制方法,其特征在于,在正式访问过程中,调查员采用CAPI和CATI系统辅助调查,样本访问结束后数据实时传输至质控后台,系统根据预先制定的异常值检测规则提示质控人员核实重要指标。
3.如权利要求2所述的一种基于CAPI和CATI的调查数据质量控制方法,其特征在于,调查时,若调查员遭遇拒访、无人应答等无法调查的情况,申请更换样本。
4.如权利要求3所述的一种基于CAPI和CATI的调查数据质量控制方法,其特征在于,数据收集完成后,需要对调查的全量数据逻辑平衡审核,这个过程通过问卷问题之间的固有关联设置审核规则,由计算机自动批量审核,完成后反馈一个错误数据的订正清单,质控人员按照清单对样本数据进行一一核实和订正。
5.如权利要求4所述的一种基于CAPI和CATI的调查数据质量控制方法,其特征在于,检查调查后的入样概率和抽样概率差异,计算样本所有样本的权重(入样概率的倒数),根据上述数据核查处理过程后,对关键指标相对总体的偏差仍超过10%的样本,统一采用权重调整的方式进行偏差修正。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110285724.5A CN113011734B (zh) | 2021-03-17 | 2021-03-17 | 一种基于capi和cati的调查数据质量控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110285724.5A CN113011734B (zh) | 2021-03-17 | 2021-03-17 | 一种基于capi和cati的调查数据质量控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113011734A CN113011734A (zh) | 2021-06-22 |
CN113011734B true CN113011734B (zh) | 2023-07-07 |
Family
ID=76409171
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110285724.5A Active CN113011734B (zh) | 2021-03-17 | 2021-03-17 | 一种基于capi和cati的调查数据质量控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113011734B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704331B (zh) * | 2021-09-23 | 2024-02-02 | 浙江上元土地勘测规划设计有限公司 | 基于地籍测绘成图系统的土地评价方法、系统及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103959302A (zh) * | 2011-06-01 | 2014-07-30 | 安全第一公司 | 用于安全分布式存储的系统与方法 |
CN107169734A (zh) * | 2017-05-10 | 2017-09-15 | 美亚联创(北京)科技有限公司 | 一种社会调查管理系统 |
CN109416928A (zh) * | 2016-06-07 | 2019-03-01 | 伊路米纳有限公司 | 用于进行二级和/或三级处理的生物信息学系统、设备和方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102300006A (zh) * | 2010-06-22 | 2011-12-28 | 上海迈辉信息技术有限公司 | 一种计算机辅助电话访问系统 |
CN104699798B (zh) * | 2015-03-18 | 2021-09-21 | 腾讯科技(深圳)有限公司 | 样本数据的处理方法和装置 |
CN106227843A (zh) * | 2016-07-28 | 2016-12-14 | 云南大学 | 一种地质灾害野外调查信息采集系统及方法 |
CN111090983B (zh) * | 2018-10-23 | 2022-04-22 | 北京好啦科技有限公司 | 问卷优化方法、装置、计算机设备和存储介质 |
-
2021
- 2021-03-17 CN CN202110285724.5A patent/CN113011734B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103959302A (zh) * | 2011-06-01 | 2014-07-30 | 安全第一公司 | 用于安全分布式存储的系统与方法 |
CN109416928A (zh) * | 2016-06-07 | 2019-03-01 | 伊路米纳有限公司 | 用于进行二级和/或三级处理的生物信息学系统、设备和方法 |
CN107169734A (zh) * | 2017-05-10 | 2017-09-15 | 美亚联创(北京)科技有限公司 | 一种社会调查管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113011734A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107220648B (zh) | 理赔单据的字符识别方法及服务器 | |
CN113011734B (zh) | 一种基于capi和cati的调查数据质量控制方法 | |
CN107944811A (zh) | 一种加油机计量检定和校准原始记录处理方法及系统 | |
KR960702240A (ko) | 통신 네트워크용 데이터 처리시스템(data processing system for communications network) | |
CN107424105A (zh) | 医疗影像设备漏费智能管理系统及方法 | |
CN101692275A (zh) | 水泥混凝土强度检测管控一体化系统及方法 | |
CN109389316A (zh) | 一种来料质量管理系统及方法 | |
CN114449198A (zh) | 一种工程监理智能监控系统 | |
CN108335724B (zh) | 客服管理、实验室流程、质量控制与报告自动化生成系统 | |
CN109189803A (zh) | 问答对构建方法、装置及计算机可读存储介质 | |
CN116863122A (zh) | 一种电表抄表处理方法、装置、云端、系统及介质 | |
CN113051168A (zh) | 一种车载信息交互系统数据存储信息安全测试系统及方法 | |
CN114120462B (zh) | 基于监管平台的劳务实名制数据的自适应推送系统及方法 | |
CN115082661B (zh) | 一种传感器装配难度降低方法 | |
CN115775092A (zh) | 基于数字孪生技术的施工过程安全风险管控系统 | |
CN110087066B (zh) | 一种应用于网上巡查的一键自动巡检方法 | |
CN206961201U (zh) | 一种工地人员实名管理系统 | |
CN112995128A (zh) | 一种基于人工智能的界面信息自动验证组件和方法 | |
CN115293498A (zh) | 一种基于区块链的企业资产整理用数据收集系统 | |
US20080004827A1 (en) | Externalized metric calculation engine | |
CN114882650B (zh) | 一种设备管理智能存储方法及其系统 | |
CN116562829B (zh) | 一种人力资源数字化柔性管理系统及管理方法 | |
CN110826668A (zh) | 一种混凝土生产设备智能巡检记录系统及方法 | |
CN106597522A (zh) | 钚部件容器自动调节方法及装置 | |
CN116993140B (zh) | 一种智能仪表装配流程工位管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: No.60 Guohe Road, Yangpu District, Shanghai Patentee after: Shanghai Shuzhe Data Technology Co.,Ltd. Country or region after: China Address before: No.60 Guohe Road, Yangpu District, Shanghai Patentee before: Shanghai Digital Data Technology Co.,Ltd. Country or region before: China |