CN105825338A - 一种社会调查数据的空间抽样方法 - Google Patents
一种社会调查数据的空间抽样方法 Download PDFInfo
- Publication number
- CN105825338A CN105825338A CN201610152789.1A CN201610152789A CN105825338A CN 105825338 A CN105825338 A CN 105825338A CN 201610152789 A CN201610152789 A CN 201610152789A CN 105825338 A CN105825338 A CN 105825338A
- Authority
- CN
- China
- Prior art keywords
- sampling
- spatial
- social
- survey
- sampled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Operations Research (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Computational Mathematics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种社会调查数据的空间抽样方法,本发明首先通过分层空间抽样得到抽样样本,然后利用空间点模式分析方法根据参数计算结果判断抽样结果分布的均衡性;如果不符合空间均衡性要求,则重新抽样,直至得到满足空间均衡性的抽样结果。本发明将空间抽样和空间均衡性评价与社会调查有机结合,实现了非空间数据与空间化技术的有效衔接。改善了传统的抽样方法,为社会调查提供了较好的辅助支持。通过将抽样结果可视化,提供了更为直观的可视化结果,并通过空间均衡性评价可以得到更加准确的判断。
Description
技术领域
本发明属于空间人文社会学领域,涉及一种空间抽样方法,尤其涉及一种社会调查数据的空间抽样方法。
背景技术
地理信息系统(GIS)技术被广泛应用于现代测绘、国防军事、野外数据采集等自然科学领域,并逐步应用于社会调查、历史、文化等社会学领域。GIS具有数据综合、地理模拟和空间分析等能力。在社会调查及其数据分析过程中,利用GIS技术辅助传统的抽样方法,是空间社会学的一个重要研究课题。
抽样是社会调查的前期手段,通过科学的抽样方法,确定被调查的样本,使样本更加科学精确,更具有代表性,从而达到优化调查结果的目的。抽样是将总体集(连续)按某种规律划分为样本集(离散)且不损失总体主要信息的方法。空间抽样是针对地理空间对象的,是具有空间关联性的抽样。抽样调查是地理研究、资源评估、环境问题研究和社会经济问题研究的重要手段。社会调查数据往往具有空间相关性,传统的抽样调查方法无法满足日益增长的空间抽样需求。
发明内容
为了解决上述技术问题,本发明提供了一种社会调查数据的空间抽样方法。
本发明所采用的技术方案是:一种社会调查数据的空间抽样方法,其特征在于,包含以下步骤:
步骤1:根据已有的居委会名称,界定查询范围,利用逆地理编码查询到居委会的经纬度信息,国内的各种在线地图都根据国家测绘局标准统一对经纬度作了纠偏处理,而百度地图在这个基础上用自己的算法做了二次纠偏,基于此,通过百度提供的纠偏API对经纬度进行纠偏,匹配在OSM底图上;
步骤2:
第一层抽样;
以市辖区为单位,采用完全随机抽样方法抽样得到街道办事处;
第二层抽样;
在第一层抽样的基础上,以街道办事处为单位,采用完全随机抽样方法抽样得到居委会;
步骤3:空间均衡性评价;
以每个区为单位对最终的抽样结果使用最邻近距离法进行空间均衡性评价,如果抽样点的分布属于均匀模式,则表示抽样结果合理。如果不合理则重新抽样,直到合理为止;最后汇总最终的抽样结果。
作为优选,步骤2中的具体实现包括以下子步骤:
步骤2.1:输入居委会数据和抽样区域底图;
步骤2.2:选择一个市辖区;
步骤2.3:输入拟抽取街道办事处的个数;
步骤2.4:输入每个街道办事处中拟抽取的居委会个数;
步骤2.5:在底图上显示抽样结果;
步骤2.6:如果完成了所有市辖区的抽样,则表示抽样完成;
若是,则执行下述步骤2.7;
若否,则回转执行步骤2.2;
步骤2.7:存储抽样结果。
作为优选,步骤4中所述最邻近距离法,其具体实现包括以下子步骤:
步骤3.1:计算考虑研究区域的边缘效应的最邻近距离的期望,公式如下:
其中n是事件的数量,A为研究区的面积,p为研究区域的边长;计算平均距离的公式为其中Si为研究区域中的事件,dmin是任意一点到其最邻近点的距离;
步骤3.2:计算最邻近指数
步骤3.3:均衡性评价,若R=1,说明观测事件过程来自于完全随机模式,属于随机分布;若R<1,说明观测事件在空间上相互接近,属于空间聚集模式;若R>1,说明观测事件在空间商相互排斥地趋于均匀分布,属于空间均匀模式。
本发明基于社会调查数据,在社会调查与数据分析中引入本发明,将空间抽样和空间均衡性评价与社会调查有机结合,实现了非空间数据与空间化技术的有效衔接。所开发的空间抽样软件改善了传统的抽样方法,将抽样框内嵌在软件中,为社会调查提供了较好的辅助支持。通过将抽样结果在软件界面空间可视化,提供了更为直观的可视化结果,并通过空间均衡性评价可以得到更加准确的判断。
附图说明
图1是本发明实施例的整体流程图。
图2是本发明实施例的完全随机抽样方法流程图。
图3是本发明实施例的空间均衡性评价最邻近距离算法流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明提供的方法能够用计算机软件技术实现流程。参见图1、图2和图3,由于利用逆地理编码查询到居委会的经纬度信息属于数据准备阶段,实施例以一个抽样并评价结果的过程为例对本发明的流程进行具体的阐述。
步骤1:在软件界面依次导入实验数据jwhsampling.shp和area.shp,实现武汉市全部居委会在13个市辖区内的空间可视化。
步骤2:在页面上方选择抽样平台页面,点击随机抽样,弹出抽样对话框,下拉选择抽样的市辖区,默认为江岸区,选择洪山区(可按照任意顺序,最终13个区都抽到并最终结果的分布都均匀即可),输入需要抽取的街道办事处的个数(如4个);然后输入每个街道办事处需要抽取的居委会的数目(如2个);点击确定,在对话框中得到被抽取到的居委会的ID和名称,具体如下:
1141群联村委会
1150新村村委会
1171曙光居民委员会
1170关东社区居委会
1009建材社区居委会
1008张家湾社区居委会
1158新农村委会
1159新建村委会
此时可以在地图上看到被抽取的点高亮显示,至此洪山区的抽样完成。
步骤3,抽样点空间均衡性评价。继续点击测算空间均衡性按钮,得到最邻近距离法中判断空间分布模式的R值。
首先计算任意一点到其最邻近点的距离dmin。然后计算平均距离,计算公式为其中Si为研究区域中的事件,n是事件的数量。接着在CSR模式中计算期望其中A为研究区的面积。考虑研究区域的边缘效应,公式可以改写为其中p为研究区域的边长。最后计算最邻近指数根据以上步骤,得到R=0.710547822763475。由于R<1,判断分布模式为聚集模式,即:抽样结果点的空间分布不均衡,需返回重新抽样。
步骤4:点击清除按钮,清除上一次的抽样结果,重新点击确定,得到新的抽样结果。
1090春和村委会
1078白浒村委会
1153王店社区居委会
1159新建村委会
1170关东社区居委会
1173关南居委会
996华农东社区居委会
1000通惠社区居委会
同时测算空间均衡性,R=1.14008547051084,R>1,分布模式为均匀,故结果可以被采纳。
步骤5:不断重复,直到抽样结果空间分布均匀为止,保留最后的抽样结果。
步骤6:重复步骤2到步骤4,完成13个区的抽样,保留最后的抽样结果。
步骤7:抽样完成。
本发明基于空间人文社会学,研究GIS在社会科学中的应用,提出一种空间抽样并将抽样结果空间可视化,同时判断抽样结果的空间分布均衡性的方法。本方法充分考虑了抽样的科学性和抽样结果分布的空间均衡性,通过完全随机的方法抽取样本并通过均衡性评价判断抽样结果的代表性和合理性。通过本发明获得的抽样结果更加科学、精确,更具有实用性。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。
Claims (3)
1.一种社会调查数据的空间抽样方法,其特征在于,包含以下步骤:
步骤1:根据已有的居委会名称,界定查询范围,利用逆地理编码查询到居委会的经纬度信息,并对经纬度进行纠偏,匹配在OSM底图上;
步骤2:
第一层抽样;
以市辖区为单位,采用完全随机抽样方法抽样得到街道办事处;
第二层抽样;
在第一层抽样的基础上,以街道办事处为单位,采用完全随机抽样方法抽样得到居委会;
步骤3:空间均衡性评价;
以每个区为单位对最终的抽样结果使用最邻近距离法进行空间均衡性评价,如果抽样点的分布属于均匀模式,则表示抽样结果合理;如果不合理则重新抽样,直到合理为止;最后汇总最终的抽样结果。
2.根据权利要求1所述的社会调查数据的空间抽样方法,其特征在于:步骤2中的具体实现包括以下子步骤:
步骤2.1:输入居委会数据和抽样区域底图;
步骤2.2:选择一个市辖区;
步骤2.3:输入拟抽取街道办事处的个数;
步骤2.4:输入每个街道办事处中拟抽取的居委会个数;
步骤2.5:在底图上显示抽样结果;
步骤2.6:如果完成了所有市辖区的抽样,则表示抽样完成;
若是,则执行下述步骤2.7;
若否,则回转执行步骤2.2;
步骤2.7:存储抽样结果。
3.根据权利要求1所述的社会调查数据的空间抽样方法,其特征在于:步骤3中所述最邻近距离法,其具体实现包括以下子步骤:
步骤3.1:计算考虑研究区域的边缘效应的最邻近距离的期望,公式如下:
其中n是事件的数量,A为研究区的面积,p为研究区域的边长;计算平均距离的公式为其中Si为研究区域中的事件,dmin是任意一点到其最邻近点的距离;
步骤3.2:计算最邻近指数
步骤3.3:均衡性评价,若R=1,说明观测事件过程来自于完全随机模式,属于随机分布;若R<1,说明观测事件在空间上相互接近,属于空间聚集模式;若R>1,说明观测事件在空间商相互排斥地趋于均匀分布,属于空间均匀模式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610152789.1A CN105825338A (zh) | 2016-03-17 | 2016-03-17 | 一种社会调查数据的空间抽样方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610152789.1A CN105825338A (zh) | 2016-03-17 | 2016-03-17 | 一种社会调查数据的空间抽样方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105825338A true CN105825338A (zh) | 2016-08-03 |
Family
ID=56523911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610152789.1A Pending CN105825338A (zh) | 2016-03-17 | 2016-03-17 | 一种社会调查数据的空间抽样方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105825338A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315721A (zh) * | 2017-06-27 | 2017-11-03 | 郭亮 | 一种基于低差异度数列的社区住户的抽样方法及系统 |
WO2023055613A1 (en) * | 2021-09-28 | 2023-04-06 | Snap Inc. | Depletion modeling for estimating survey completeness by region |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271495A (zh) * | 2008-04-17 | 2008-09-24 | 中国科学院地理科学与资源研究所 | 高效能空间抽样调查三明治模型方法 |
CN101710331A (zh) * | 2008-10-23 | 2010-05-19 | 中国科学院地理科学与资源研究所 | 一种人口抽样调查样本分层系统及方法 |
CN103678883A (zh) * | 2013-11-21 | 2014-03-26 | 上海海洋大学 | 一种面向多源海洋环境监测数据的空间抽样方法 |
CN103853910A (zh) * | 2012-12-07 | 2014-06-11 | 中国科学院城市环境研究所 | 一种基于多目标多数据类型变异度模型的空间抽样方法 |
-
2016
- 2016-03-17 CN CN201610152789.1A patent/CN105825338A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271495A (zh) * | 2008-04-17 | 2008-09-24 | 中国科学院地理科学与资源研究所 | 高效能空间抽样调查三明治模型方法 |
CN101710331A (zh) * | 2008-10-23 | 2010-05-19 | 中国科学院地理科学与资源研究所 | 一种人口抽样调查样本分层系统及方法 |
CN103853910A (zh) * | 2012-12-07 | 2014-06-11 | 中国科学院城市环境研究所 | 一种基于多目标多数据类型变异度模型的空间抽样方法 |
CN103678883A (zh) * | 2013-11-21 | 2014-03-26 | 上海海洋大学 | 一种面向多源海洋环境监测数据的空间抽样方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315721A (zh) * | 2017-06-27 | 2017-11-03 | 郭亮 | 一种基于低差异度数列的社区住户的抽样方法及系统 |
WO2023055613A1 (en) * | 2021-09-28 | 2023-04-06 | Snap Inc. | Depletion modeling for estimating survey completeness by region |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111858820B (zh) | 用地性质识别方法、装置、电子设备及存储介质 | |
Wang et al. | An eco-city evaluation method based on spatial analysis technology: A case study of Jiangsu Province, China | |
Bartie et al. | Advancing visibility modelling algorithms for urban environments | |
CN103995837A (zh) | 一种基于群体足迹的个性化旅游路线规划方法 | |
CN110399445B (zh) | 一种兴趣点的处理方法、装置及设备 | |
CN110716935A (zh) | 基于网约车出行的轨迹数据分析与可视化方法及系统 | |
CN103699615B (zh) | 一种基于点矢量数据多层存储的快速地图表示方法及系统 | |
US9811539B2 (en) | Hierarchical spatial clustering of photographs | |
CN109146155A (zh) | 基于多源数据融合的城市交通出行需求确定方法及系统 | |
Liu et al. | Assessing suitability of rural settlements using an improved technique for order preference by similarity to ideal solution | |
CN108281012A (zh) | 交通流量数据的显示方法、装置、存储介质及电子装置 | |
Liang et al. | Assessing the validity of SafeGraph data for visitor monitoring in Yellowstone National Park | |
CN112236764A (zh) | 数字制图的视口外位置指示 | |
CN106326480A (zh) | 一种关联企业的地理信息挖掘和分析方法 | |
CN105825338A (zh) | 一种社会调查数据的空间抽样方法 | |
Chen et al. | quantitative analysis of urban spatial morphology Based on GIS regionalization and spatial syntax | |
Huang et al. | Recognition of Functional Areas in an Old City Based on POI: A Case Study in Fuzhou, China | |
CN104679765B (zh) | 区域范围确定方法及装置 | |
CN103218406B (zh) | 兴趣点的地址信息的处理方法及设备 | |
CN107844576B (zh) | 一种环保巡查轨迹生成方法及系统 | |
CN202720677U (zh) | 三维gis综合应用平台 | |
Man et al. | Application of Voronoi diagrams and multiangle measurable image in the urban POI location and site generation | |
Huang et al. | Assessment of heat exposure risk for urban populations and spatio-temporal patterns: A perspective of urban functional zones in Xi'an, China | |
CN112925862B (zh) | 基于地理网格化技术的兴趣点库更新方法及装置、设备 | |
CN107613034A (zh) | 一种将住宅ip定位到住宅小区的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160803 |
|
RJ01 | Rejection of invention patent application after publication |