CN107665239A - 一种职住空间信息提取方法及装置、计算机可读存储介质 - Google Patents

一种职住空间信息提取方法及装置、计算机可读存储介质 Download PDF

Info

Publication number
CN107665239A
CN107665239A CN201710754561.4A CN201710754561A CN107665239A CN 107665239 A CN107665239 A CN 107665239A CN 201710754561 A CN201710754561 A CN 201710754561A CN 107665239 A CN107665239 A CN 107665239A
Authority
CN
China
Prior art keywords
individual
resident
data
residence
working
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710754561.4A
Other languages
English (en)
Inventor
龚咏喜
赵羚含
林姚宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN201710754561.4A priority Critical patent/CN107665239A/zh
Publication of CN107665239A publication Critical patent/CN107665239A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Fuzzy Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明适用于数据提取技术领域,提供了一种职住空间信息提取方法及装置、计算机可读存储介质,通过全样本人口数据获取每个居民个体的居住地位置,通过社保缴纳数据和商事主体数据获取每个居民个体的工作地位置,并将居住地位置和工作地位置落位于空间基础网格中,通过加密的关键字将每个居民个体的居住地位置和工作地位置进行连接,根据连接后的居住地位置和工作地位置计算出每个居民个体的实际通勤距离,信息覆盖全面,能够准确的提取出每个居民个体的工作地和居住地信息,提高职住空间信息提取的准确性。

Description

一种职住空间信息提取方法及装置、计算机可读存储介质
技术领域
本发明属于数据提取技术领域,尤其涉及一种职住空间信息提取方法及装置、计算机可读存储介质。
背景技术
城市居民的工作地和居住地是城市空间的重要组成部分,城市居民的工作地与居住地的空间布局和匹配程度对城市通勤交通、空气质量以及居民个体的生活质量具有不同程度影响,居民的工作地和居住地的确定是计算居民通勤距离和职住平衡指标的前提。现有的职住空间的信息提取,主要是通过利用居民的出行数据,直接确定居民的工作地与居住地,或者通过手机信令数据进行居民职住地的识别,通过抽样的方式调查个体的居住地和工作地,从而获取城市居民的职住信息,其数据量最多为城市居民总量的1%-5%,然而由于居民的出行数据量有限,提取到的居民的职住信息准确度不高且不全面。
综上所述,现有的职住空间信息提取方法存在信息准确度不高且不全面的问题。
发明内容
有鉴于此,本发明提供了一种居民职住空间信息提取方法及装置、计算机可读存储介质,旨在解决现有的职住空间信息提取方法存在信息准确度不高且不全面的问题。
本发明实施例的第一方面提供了一种居民职住空间信息提取方法,所述居民职住空间信息提取方法包括:
根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,其中,所述居住地数据包括全样本人口数据、房屋基础数据、建筑普查数据以及空间基础网格数据;
根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,其中,所述工作地数据包括社保数据和商事主体数据;
根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;
根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。
本发明实施例的第二方面提供了一种居民职住空间信息提取装置,所述居民职住空间信息提取装置包括:
居住地获取模块,用于根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置;
工作地获取模块,用于根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置;
匹配模块,用于根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;
计算模块,用于根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。
本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,其中,所述居住地数据包括全样本人口数据、房屋基础数据、建筑普查数据以及空间基础网格数据;
根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,其中,所述工作地数据包括社保数据和商事主体数据;
根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;
根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,其中,所述居住地数据包括全样本人口数据、房屋基础数据、建筑普查数据以及空间基础网格数据;
根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,其中,所述工作地数据包括社保数据和商事主体数据;
根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;
根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。
本发明提供的一种居民职住空间信息提取方法及装置、计算机可读存储介质,通过全样本人口数据获取每个居民个体的居住地位置,通过社保缴纳数据和商事主体数据获取每个居民个体的工作地位置,并将居住地位置和工作地位置落位于空间基础网格中,通过加密的关键字将每个居民个体的居住地位置和工作地位置进行连接,根据连接后的居住地位置和工作地位置计算出每个居民个体的实际通勤距离,信息覆盖全面,能够准确的提取出每个居民个体的工作地和居住地信息,有效地提高职住空间信息提取的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种职住空间信息提取方法的实现流程图;
图2是本发明实施例二提供的一种职住空间信息提取装置的结构框图;
图3是本发明实施例三提供的一种终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了解决现有的职住空间信息提取方法存在信息准确度不高且不全面的问题,本发明实施例提供的一种居民职住空间信息提取方法及装置、计算机可读存储介质,能够通过全样本人口数据获取每个居民个体的居住地位置,通过社保缴纳数据和商事主体数据获取每个居民个体的工作地位置,并将居住地位置和工作地位置落位于空间基础网格中,通过加密的关键字将每个居民个体的居住地位置和工作地位置进行连接,根据连接后的居住地位置和工作地位置计算出每个居民个体的实际通勤距离,信息覆盖全面,能够准确的提取出每个居民个体的工作地和居住地信息,有效地提高职住空间信息提取的准确性。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
实施例一:
图1示出了本发明实施例一提供的一种职住空间信息提取方法的流程图,详述如下:
如图1所示,在步骤S101中,根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,居住地数据包括全样本人口数据。
需要说明的是,上述居住地数据除了包括全样本人口数据之外,还可以包括房屋基础数据、建筑普查数据和空间基础网格数据等信息,全样本人口数据包括城市每个居民个体的居住个体编号、姓名、年龄、性别、行业、房屋编码等信息,房屋基础数据包括房屋编码和所处建筑的建筑编码、建筑编码等信息,建筑普查数据包括每栋建筑的建筑编码和建筑用途等信息,空间基础网格数据是通过空间基础网格将城市划分为最小的空间基础单元。
根据居住地数据获取每个居民个体的居住地网格编码,首先通过关键字将上述全样本人口数据、房屋基础数据以及建筑普查数据进行匹配连接,然后通过空间关系叠加将每个居民个体的居住地落位于空间基础网格之中,从而获取每个居民个体的居住地网格编码,进而确定每个居民个体的居住地位置,具体的,根据全样本人口数据的房屋编码与房屋基础数据的房屋编码进行关键字匹配,使得全样本人口数据与房屋基础数据进行匹配连接,能够得到每个居民个体的居住房屋信息,根据房屋基础数据的建筑编码和建筑普查信息的建筑编码进行关键字匹配,使得房屋基础数据与建筑普查信息进行匹配连接,由于全样本人口数据与房屋基础数据已经匹配,因此,能够得到每个居民个体的居住建筑信息,再通过空间关系叠加的方式,将建筑普查数据中的每栋建筑落位于空间基础网格之中,进而可以得到每栋建筑的空间网格编码,由于已经获得了每个居民个体的居住建筑信息,因而能够进一步地得到每个居民个体的居住地网格编码,确定每个居民个体的居住地位置。需要说明的是,上述空间关系叠加是指将建筑普查数据与空间基础网格根据空间位置进行连接,以使每栋建筑确定对应一个空间网格编码。
示例性的,以深圳市为例,深圳市空间基础网格是深圳市目前划分最细的空间基础单元,目前深圳市的空间基础网格共有9459个,上述全样本人口数据为深圳市2014年的人口数据,上述房屋基础数据为2014年深圳市的房屋数据,上述建筑普查数据为深圳市2014年的建筑普查数据。
优选地,作为本实施例的一种实现方式,上述步骤S101包括以下步骤S1011至S1014:
S1011,将全样本人口数据和房屋基础数据通过房屋编码进行匹配连接,以获取每个居民个体的居住房屋信息;
S1012,将房屋基础数据和建筑普查数据通过建筑编码进行匹配连接,以获取每个居民个体的居住建筑信息;
S1013,将建筑普查数据和空间基础网格数据进行空间关系叠加,以获取居住建筑的空间基础网格编码;
S1014,根据居住建筑的空间基础网格编码获取每个居民个体的居住地网格编码。
在步骤S102中,根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,工作地数据包括社保数据。
需要说明的是,上述工作地数据除了包括社保数据之外,还可以包括商事主体数据,社保数据包括社保缴纳人的工作个体编码和工作单位数据(组织机构代码、地址、名称等),商事主体数据包括工作单位数据(组织机构代码、地址、名称等)。还需要说明的是,上述工作地数据也包括空间基础网格数据,空间基础网格数据是通过空间基础网格将城市划分为最小的空间基础单元。
根据工作地数据获取每个具名个体的工作地网格编码,首先通过空间关系叠加将商事主体中工作单位数据的地址与空间基础网格进行对应,然后通过关键字匹配将上述社保数据和商事主体数据进行匹配连接,进而使得每个具名个体工作地落位与空间基础网格之中,从而获取每个居民个体的工作地网格编码,进而确定每个居民个体的工作地位置,具体的,通过空间关系叠加,将具有空间位置信息的商事主体数据与空间基础网格数据建立连接,使得商事主体数据中的工作单位落位在空间基础网格之中,然后根据社保数据的工作单位数据和商事主体数据的工作单位数据进行关键字匹配,使得社保数据与商事主体数据进行匹配连接,由于商事主体数据已经与空间网络数据建立了连接,因而能够得到每个居民个体的工作地网格编码,确定每个居民个体的工作地位置。需要说明的是,上述空间关系叠加是指将建筑普查数据与空间基础网格根据空间位置进行连接,以使每栋建筑确定对应一个空间网格编码。
优选地,作为本实施例的一种实现方式,上述步骤S102包括以下步骤S1021至S1023:
S1021,将商事主体数据与空间基础网格数据进行空间关系叠加,以获取工作单位的空间基础网格编码;
S1022,将社保数据和商事主体数据进行匹配连接,以获取每个居民个体的工作单位信息;
S1023,根据工作单位信息以及工作单位的空间基础网格编码获取每个居民个体的工作地网格编码。
在步骤S103中,根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配。
由于全样本人口数据中的居住个体编号和社保数据中的工作个体编号是每个具名个体的唯一编码,由于涉及数据隐私保护,居住个体编号和工作个体编号均经过加密处理,需要通过加密映射文件将两者进行匹配。通过确定每个居民个体的居住地网格编码和每个居民个体的工作地网格编码,由于居住个体编码和工作个体编码已经进行匹配,因此能够将每个居民个体的居住地网格编码和工作地网格编码一一对应。
优选地,作为本实施例的一种实现方式,上述步骤S103包括以下步骤S1031至S1033:
S1031,根据全样本人口数据获取每个居民个体的居住个体编号;
S1032,根据社保数据获取每个居民个体的工作个体编号;
S1033,将居住个体编号和工作个体编号一一进行匹配,以使每个居民个体的居住地网格编码和工作地网格编码一一匹配。
在步骤S104中,根据匹配后的每个居民个体的居住地网格编码和每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。
需要说明的是,计算每个居民个体的实际通勤距离需要基于实际路网进行计算,基于路网数据,再提取空间基础网格数据的质心作为起讫点,具体的,通过提取每个居民个体的居住地空间基础网格的质心作为起点,再通每个居民个体的工作地空间基础网格的质心作为讫点,再根据路网数据构建交通网络计算每个居民个体的实际通勤距离。
优选地,作为本实施例的一种实现方式,上述步骤S104包括以下步骤S1041至S1044:
S1041,根据路网数据构建交通网络;
S1042,提取每个居民个体的居住地空间基础网格的质心作为起点;
S1043,提取每个居民个体的工作地空间基础网格的质心作为讫点;
S1044,根据起点、讫点和交通网络计算每个居民个体的实际通勤距离。
本实施例提供的职住空间信息提取方法,通过全样本人口数据获取每个居民个体的居住地位置,通过社保缴纳数据和商事主体数据获取每个居民个体的工作地位置,并将居住地位置和工作地位置落位于空间基础网格中,通过加密的关键字将每个居民个体的居住地位置和工作地位置进行连接,根据连接后的居住地位置和工作地位置计算出每个居民个体的实际通勤距离,信息覆盖全面,能够准确的提取出每个居民个体的工作地和居住地信息,有效地提高职住空间信息提取的准确性。
实施例二:
对应于图1所示的实施例一提供的一种职住空间信息提取方法,图2示出了本发明实施例二提供的职住空间信息提取装置的结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。
参照图2,上述一种职住空间信息提取装置20,包括居住地获取模块21、工作地获取模块22、匹配模块23以及计算模块24。
居住地获取模块21用于根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,居住地数据包括全样本人口数据。
工作地获取模块22用于根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,工作地数据包括社保数据。
匹配模块23用于根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配。
计算模块24用于根据匹配后的每个居民个体的居住地网格编码和每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。
优选地,作为本实施例的一种实现方式,上述居住地获取模块21包括房屋信息获取单元、建筑信息获取单元、第一空间关系叠加单元以及第一网格编码获取单元。
房屋信息获取单元,用于将全样本人口数据和房屋基础数据通过房屋编码进行匹配连接,以获取每个居民个体的居住房屋信息。
建筑信息获取单元,用于将房屋基础数据和建筑普查数据通过建筑编码进行匹配连接,以获取每个居民个体的居住建筑信息。
第一空间关系叠加单元,用于将建筑普查数据和空间基础网格数据进行空间关系叠加,以获取居住建筑的空间基础网格编码。
第一网格编码获取单元,用于根据居住建筑的空间基础网格编码获取每个居民个体的居住地网格编码。
优选地,作为本实施例的一种实现方式,上述工作地获取模块22包括第二空间关系叠加单元、工作单元信息获取单元以及第二网格编码获取单元。
第二空间关系叠加单元,用于将商事主体数据与空间基础网格数据进行空间关系叠加,以获取工作单位的空间基础网格编码。
工作单元信息获取单元,用于将社保数据和商事主体数据进行匹配连接,以获取每个居民个体的工作单位信息。
第二网格编码获取单元,用于根据工作单位信息以及工作单位的空间基础网格编码获取每个居民个体的工作地网格编码。
优选地,作为本实施例的一种实现方式,上述匹配模块23包括第一编号获取单元、第二编号获取单元以及匹配单元。
第一编号获取单元,用于根据全样本人口数据获取每个居民个体的居住个体编号。
第二编号获取单元,用于根据社保数据获取每个居民个体的工作个体编号。
匹配单元,用于将居住个体编号和工作个体编号一一进行匹配,以使每个居民个体的居住地网格编码和工作地网格编码一一匹配。
优选地,作为本实施例的一种实现方式,上述计算模块24包括交通网络构建单元、起点提取单元、讫点提取单元以及计算单元。
交通网络构建单元,用于根据路网数据构建交通网络。
起点提取单元,用于提取每个居民个体的居住地空间基础网格的质心作为起点。
讫点提取单元,用于提取每个居民个体的工作地空间基础网格的质心作为讫点。
计算单元,用于根据起点、讫点和交通网络计算每个居民个体的实际通勤距离。
本领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将应用程序的安装方法的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。
需要说明的是,本发明实施例提供的职住空间信息提取装置,由于与本发明图1所示方法实施例基于同一构思,其带来的技术效果与本发明图1所示方法实施例相同,具体内容可参见本发明图1所示方法实施例中的叙述,此处不再赘述。
因此,本实施例提供的一种职住空间信息提取装置,同样能够通过全样本人口数据获取每个居民个体的居住地位置,通过社保缴纳数据和商事主体数据获取每个居民个体的工作地位置,并将居住地位置和工作地位置落位于空间基础网格中,通过加密的关键字将每个居民个体的居住地位置和工作地位置进行连接,根据连接后的居住地位置和工作地位置计算出每个居民个体的实际通勤距离,信息覆盖全面,能够准确的提取出每个居民个体的工作地和居住地信息,有效地提高职住空间信息提取的准确性。
实施例三:
图3是本发明一实施例提供的终端设备的示意图。如图3所示,该实施例的终端设备3包括:处理器30、存储器31以及存储在所述存储器31中并可在所述处理器30上运行的计算机程序32,例如上述卸载应用程序的方法的程序。所述处理器30执行所述计算机程序32时实现上述各个卸载应用程序的方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器30执行所述计算机程序32时实现上述各装置实施例中各模块/单元的功能,例如图2所示模块21至24的功能。
示例性的,所述计算机程序32可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序32在所述终端设备3中的执行过程。例如,所述计算机程序32可以被分割成居住地获取模块、工作地获取模块、匹配模块以及计算模块,各模块具体功能如下:
居住地获取模块,用于根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,所述居住地数据包括全样本人口数据;
工作地获取模块,用于根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,所述工作地数据包括社保数据;
匹配模块,用于根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;
计算模块,用于根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。
所述终端设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图3仅仅是终端设备3的示例,并不构成对终端设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器31可以是所述终端设备3的内部存储单元,例如终端设备3的硬盘或内存。所述存储器31也可以是所述终端设备3的外部存储设备,例如所述终端设备3上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器31还可以既包括所述终端设备3的内部存储单元也包括外部存储设备。所述存储器31用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器31还可以用于暂时地存储已经输出或者将要输出的数据。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用程序和设计约束条件。专业技术人员可以对每个特定的应用程序来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种职住空间信息提取方法,其特征在于,所述职住空间信息提取方法包括:
根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,所述居住地数据包括全样本人口数据;
根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,所述工作地数据包括社保数据;
根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;
根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。
2.根据权利要求1所述的职住空间信息提取方法,其特征在于,所述居住地数据还包括房屋基础数据、建筑普查数据和空间基础网格数据,所述根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置包括:
将所述全样本人口数据和所述房屋基础数据通过房屋编码进行匹配连接,以获取每个居民个体的居住房屋信息;
将所述房屋基础数据和所述建筑普查数据通过建筑编码进行匹配连接,以获取每个居民个体的居住建筑信息;
将所述建筑普查数据和所述空间基础网格数据进行空间关系叠加,以获取居住建筑的空间基础网格编码;
根据所述居住建筑的空间基础网格编码获取每个居民个体的居住地网格编码。
3.根据权利要求1所述的职住空间信息提取方法,其特征在于,所述工作地数据还包括商事主体数据,所述根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置包括:
将所述商事主体数据与所述空间基础网格数据进行空间关系叠加,以获取工作单位的空间基础网格编码;
将所述社保数据和所述商事主体数据进行匹配连接,以获取每个居民个体的工作单位信息;
根据所述工作单位信息以及所述工作单位的空间基础网格编码获取每个居民个体的工作地网格编码。
4.根据权利要求1所述的职住空间信息提取方法,其特征在于,所述根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配包括:
根据所述全样本人口数据获取每个居民个体的居住个体编号;
根据所述社保数据获取每个居民个体的工作个体编号;
将所述居住个体编号和所述工作个体编号一一进行匹配,以使所述每个居民个体的居住地网格编码和工作地网格编码一一匹配。
5.根据权利要求1所述的职住空间信息提取方法,其特征在于,所述根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离包括:
根据路网数据构建交通网络;
提取每个居民个体的居住地空间基础网格的质心作为起点;
提取每个居民个体的工作地空间基础网格的质心作为讫点;
根据所述起点、所述讫点和交通网络计算每个居民个体的实际通勤距离。
6.一种职住空间信息提取装置,其特征在于,所述职住空间信息提取装置包括:
居住地获取模块,用于根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,所述居住地数据包括全样本人口数据;
工作地获取模块,用于根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,所述工作地数据包括社保数据;
匹配模块,用于根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;
计算模块,用于根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。
7.根据权利要求6所述的职住空间信息提取装置,其特征在于,所述居住地数据还包括房屋基础数据、建筑普查数据和空间基础网格数据,所述居住地获取模块包括:
房屋信息获取单元,用于将所述全样本人口数据和所述房屋基础数据通过房屋编码进行匹配连接,以获取每个居民个体的居住房屋信息;
建筑信息获取单元,用于将所述房屋基础数据和所述建筑普查数据通过建筑编码进行匹配连接,以获取每个居民个体的居住建筑信息;
第一空间关系叠加单元,用于将所述建筑普查数据和所述空间基础网格数据进行空间关系叠加,以获取居住建筑的空间基础网格编码;
第一网格编码获取单元,用于根据所述居住建筑的空间基础网格编码获取每个居民个体的居住地网格编码。
8.根据权利要求6所述的职住空间信息提取装置,其特征在于,所述工作地数据还包括商事主体数据,所述工作地获取模块包括:
第二空间关系叠加单元,用于将所述商事主体数据与所述空间基础网格数据进行空间关系叠加,以获取工作单位的空间基础网格编码;
工作单元信息获取单元,用于将所述社保数据和所述商事主体数据进行匹配连接,以获取每个居民个体的工作单位信息;
第二网格编码获取单元,用于根据所述工作单位信息以及所述工作单位的空间基础网格编码获取每个居民个体的工作地网格编码。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任意一项所述的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任意一项所述的方法的步骤。
CN201710754561.4A 2017-08-29 2017-08-29 一种职住空间信息提取方法及装置、计算机可读存储介质 Pending CN107665239A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710754561.4A CN107665239A (zh) 2017-08-29 2017-08-29 一种职住空间信息提取方法及装置、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710754561.4A CN107665239A (zh) 2017-08-29 2017-08-29 一种职住空间信息提取方法及装置、计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN107665239A true CN107665239A (zh) 2018-02-06

Family

ID=61097366

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710754561.4A Pending CN107665239A (zh) 2017-08-29 2017-08-29 一种职住空间信息提取方法及装置、计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN107665239A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256125A (zh) * 2018-02-26 2018-07-06 杭州数梦工场科技有限公司 基于行政区划的智能搜索方法、装置和搜索引擎
CN108717676A (zh) * 2018-04-23 2018-10-30 深圳市数字城市工程研究中心 基于多数据融合的不同尺度下的职住空间评价方法及系统
CN109947876A (zh) * 2018-07-19 2019-06-28 北京大学 基于地理网格的倒损房屋编码标识方法和统计方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104240163A (zh) * 2014-09-28 2014-12-24 百度在线网络技术(北京)有限公司 一种小区智能推荐方法及装置
CN106777017A (zh) * 2016-12-08 2017-05-31 国信优易数据有限公司 一种基于电子地图的时限内通勤范围查询系统及方法
CN106931974A (zh) * 2017-03-29 2017-07-07 清华大学 基于移动终端gps定位数据记录计算个人通勤距离的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104240163A (zh) * 2014-09-28 2014-12-24 百度在线网络技术(北京)有限公司 一种小区智能推荐方法及装置
CN106777017A (zh) * 2016-12-08 2017-05-31 国信优易数据有限公司 一种基于电子地图的时限内通勤范围查询系统及方法
CN106931974A (zh) * 2017-03-29 2017-07-07 清华大学 基于移动终端gps定位数据记录计算个人通勤距离的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
史新宇: "基于多源轨迹数据挖掘的城市居民职住平衡和分离研究", 《城市发展研究》 *
毛峰: "基于多源轨迹数据挖掘的居民通勤行为与城市职住空间特征研究", 《中国博士学位论文全文数据库 基础科学辑》 *
韩会然 等: "公共交通与私家车出行的通勤效率差异及影响因素_以北京都市区为例", 《地理研究》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256125A (zh) * 2018-02-26 2018-07-06 杭州数梦工场科技有限公司 基于行政区划的智能搜索方法、装置和搜索引擎
CN108717676A (zh) * 2018-04-23 2018-10-30 深圳市数字城市工程研究中心 基于多数据融合的不同尺度下的职住空间评价方法及系统
CN108717676B (zh) * 2018-04-23 2021-07-06 深圳市数字城市工程研究中心 基于多数据融合的不同尺度下的职住空间评价方法及系统
CN109947876A (zh) * 2018-07-19 2019-06-28 北京大学 基于地理网格的倒损房屋编码标识方法和统计方法
CN109947876B (zh) * 2018-07-19 2021-05-11 北京大学 基于地理网格的倒损房屋统计方法

Similar Documents

Publication Publication Date Title
WO2021179720A1 (zh) 基于联邦学习的用户数据分类方法、装置、设备及介质
CN108009915A (zh) 一种欺诈用户社区的标记方法及相关装置
CN108388675A (zh) 一种身份标识拉通方法及终端设备
CN112541745B (zh) 用户行为数据分析方法、装置、电子设备及可读存储介质
CN107451476A (zh) 基于云平台的网页后门检测方法、系统、设备及存储介质
CN107665239A (zh) 一种职住空间信息提取方法及装置、计算机可读存储介质
CN106875110A (zh) 业务指标分层计算方法及装置、分布式计算方法及系统
CN110111110A (zh) 基于知识图谱检测欺诈的方法和装置、存储介质
CN110097068A (zh) 相似车辆的识别方法和装置
CN110263145A (zh) 一种电子合同签署方法及电子合同签署设备
CN108804323A (zh) 代码质量监控方法、设备及存储介质
CN107908796A (zh) 电子政务查重方法、装置以及计算机可读存储介质
CN110443120A (zh) 一种人脸识别方法及设备
CN107368856A (zh) 恶意软件的聚类方法及装置、计算机装置及可读存储介质
CN107767070A (zh) 用于信息推广的方法及装置
CN109690571A (zh) 基于学习的组标记系统和方法
CN109981322A (zh) 基于标签的云资源管理的方法和装置
CN111209931A (zh) 数据处理方法、平台、终端设备及存储介质
CN109634833A (zh) 一种软件缺陷预测方法和装置
CN109087138A (zh) 数据处理方法及系统、计算机系统和可读存储介质
CN107463767A (zh) 云his医保数据处理方法及系统
CN109272402A (zh) 评分卡的建模方法、装置、计算机设备及存储介质
CN109472847A (zh) 一种图片处理方法、系统及终端设备
CN110322582A (zh) 光缆线路巡检方法、装置及终端设备
CN110019849A (zh) 一种基于注意力机制的视频关注时刻检索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180206

RJ01 Rejection of invention patent application after publication