CN107590289A - 一种人口数据分析方法以及装置 - Google Patents
一种人口数据分析方法以及装置 Download PDFInfo
- Publication number
- CN107590289A CN107590289A CN201710958934.XA CN201710958934A CN107590289A CN 107590289 A CN107590289 A CN 107590289A CN 201710958934 A CN201710958934 A CN 201710958934A CN 107590289 A CN107590289 A CN 107590289A
- Authority
- CN
- China
- Prior art keywords
- data analysis
- demographic data
- data
- information
- demographic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种人口数据分析方法以及装置,该方法包括:获取至少一个待分析人口数据,其中,每一个所述待分析人口数据分别对应一个地区,且所述至少一个待分析人口数据具有标准数据结构;根据所述至少一个待分析人口数据,生成至少一个数据集;接收外部输入的至少一个人口数据分析需求;利用所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果。因此,本发明提供的方案可以提高人口数据分析的全面性。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种人口数据分析方法以及装置。
背景技术
人口数据分析是各个政府部门进行城市规划、方针政策制定的依据,因此,人口数据分析在政府部门的工作中占有最要的地位。
目前,各个地区政府部门之间业务比较独立,每一个地区的政府部门均掌握着自己的人口数据,且各自对应的人口数据具有不同的数据结构。由于各个地区政府部门对应的人口数据具有不同的数据结构,因此不能对各个地区的人口数据进行统一分析,且人口数据分析需求也只能限定在各自对应的人口数据中。因此,现有的方式对人口数据进行分析的全面性较低。
发明内容
本发明实施例提供了一种人口数据分析方法以及装置,可以提高人口数据分析的全面性。
第一方面,本发明实施例提供了一种人口数据分析方法,该方法包括:
获取至少一个待分析人口数据,其中,每一个所述待分析人口数据分别对应一个地区,且所述至少一个待分析人口数据具有标准数据结构;
根据所述至少一个待分析人口数据,生成至少一个数据集;
接收外部输入的至少一个人口数据分析需求;
利用所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果。
优选地,
进一步包括:
设置至少一个数据集模型,其中,每一个所述数据集模型分别对应至少一个人口数据分析项;
所述根据所述至少一个待分析人口数据,生成至少一个数据集,包括:在所述至少一个数据集模型中,选择至少一个数据集模型;
针对所选择的数据集模型中包括的每一个人口数据分析项,在所述至少一个待分析人口数据中提取对应的数据值,并导入到所述数据集模型中。
优选地,
所述利用所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果,包括:
针对每一个所述人口数据分析需求均执行,
在预先设置的至少一个分析图表类型中,选择当前所述人口数据分析需求对应的分析图表类型;
在所述至少一个数据集中选择当前所述人口数据分析需求对应的至少一个数据集;
确定当前所述人口数据分析需求对应的至少一个数据分析指标;
对所选择的数据集包括的数据值进行聚合和排序;
确定所述至少一个数据分析指标与所述数据值之间的关联关系,生成所选择的分析图表类型的图表。
优选地,
所述确定当前所述人口数据分析需求对应的至少一个数据分析指标,包括:
在所选择的数据集中提取字段信息;
根据所提取的字段信息,确定当前所述人口数据分析需求对应至少一个数据分析指标。
优选地,
所述确定当前所述人口数据分析需求对应的至少一个数据分析指标,包括:
根据当前所述人口数据分析需求,编辑结构化查询语言SQL语句;
利用所述SQL语句从所选择的数据集中获取当前所述人口数据分析需求对应的数据分析指标。
优选地,
在所述利用所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果之后,进一步包括:
以预先设定的排列方式,排列各个所述人口数据分析结果,并以分析仪表盘的型式展示。
优选地,
所述标准数据结构包括人口信息、字段说明、字段名称、数据类型、字段长度、关联信息;其中,所述人口信息包括人口基本信息、人口户籍信息、人口身份证信息、流动人口信息、结婚登记信息、离婚登记信息、机动车驾驶人信息、机动车基本信息、社保信息、全员人口基本信息、出生登记信息、死亡登记信息、房产登记信息、教育信息、个人公积金信息、个人公积金贷款信息中的至少一种或多种。
优选地,
所述人口数据分析需求包括:人口性别信息统计、人口年龄信息统计、人口户籍信息统计、人口身份证信息统计、流动人口信息统计、结婚登记信息统计、离婚登记信息统计、机动车驾驶人信息统计、机动车基本信息统计、社保信息统计、全员人口基本信息统计、出生登记信息统计、死亡登记信息统计、房产登记信息统计、教育信息统计、个人公积金信息统计、个人公积金贷款信息统计中的至少一种或多种。
第二方面,本发明实施例提供了一种人口数据分析装置,该装置包括:
获取单元,用于获取至少一个待分析人口数据,其中,每一个所述待分析人口数据分别对应一个地区,且所述至少一个待分析人口数据具有标准数据结构;
数据集生成单元,用于根据所述至少一个待分析人口数据,生成至少一个数据集;
接收单元,用于接收外部输入的至少一个人口数据分析需求;
分析结果生成单元,用于利用所述数据集生成单元的所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果。
优选地,
进一步包括:设置单元;
所述设置单元,用于设置至少一个数据集模型,其中,每一个所述数据集模型分别对应至少一个人口数据分析项;
所述数据集生成单元,包括:模型选择子单元以及生成子单元;
所述模型选择子单元,用于在所述至少一个数据集模型中,选择至少一个数据集模型;
所述生成子单元,用于针对所选择的数据集模型中包括的每一个人口数据分析项,在所述至少一个待分析人口数据中提取对应的数据值,并导入到所述数据集模型中。
优选地,
所述分析结果生成单元,包括:选择子单元以及确定子单元;
所述选择子单元,用于针对每一个所述人口数据分析需求均执行,在预先设置的至少一个分析图表类型中,选择当前所述人口数据分析需求对应的分析图表类型;在所述至少一个数据集中选择当前所述人口数据分析需求对应的至少一个数据集;
所述确定子单元,用于确定当前所述人口数据分析需求对应的至少一个数据分析指标;对所选择的数据集包括的数据值进行聚合和排序;确定所述至少一个数据分析指标与所述数据值之间的关联关系,生成所选择的分析图表类型的图表。
优选地,
所述确定子单元,用于在所选择的数据集中提取字段信息;根据所提取的字段信息,确定当前所述人口数据分析需求对应至少一个数据分析指标;
或,
所述确定子单元,用于根据当前所述人口数据分析需求,编辑SQL语句;利用所述SQL语句从所选择的数据集中获取当前所述人口数据分析需求对应的数据分析指标。
优选地,
进一步包括:展示单元;
所述展示单元,用于以预先设定的排列方式,排列各个所述人口数据分析结果,并以分析仪表盘的型式展示。
本发明实施例提供了一种人口数据分析方法以及装置,在该方法中,获取各个不同地区的具有标准数据结构的待分析人口数据。然后根据获取的各个待分析人口数据生成设定数量个数据集。在接收到外部输入的人口数据分析需求时,利用生成的各个数据集,生成每一个人口数据分析需求对应的人口数据分析结果。通过上述可知,本方案可以根据不同地区的待分析人口数据,生成设定数量个包括不同地区待分析人口数据的数据集。并利用各个数据集生成各个人口数据分析需求对应的人口数据分析结果,以得到不同地区以及不同人口数据分析需求对应的人口数据分析结果。因此,本发明实施例提供的方案可以提高人口数据分析的全面性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的一种人口数据分析方法的流程图;
图2是本发明另一个实施例提供的一种人口数据分析方法的流程图;
图3是本发明一个实施例提供的一种人口数据分析装置所在设备的一种硬件结构图;
图4是本发明一个实施例提供的一种人口数据分析装置的结构示意图;
图5是本发明另一个实施例提供的一种人口数据分析装置的结构示意图;
图6是本发明又一个实施例提供的一种人口数据分析装置的结构示意图;
图7是本发明一个实施例提供的一种包括展示单元的人口数据分析装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种人口数据分析方法,该方法可以包括以下步骤:
步骤101:获取至少一个待分析人口数据,其中,每一个所述待分析人口数据分别对应一个地区,且所述至少一个待分析人口数据具有标准数据结构;
步骤102:根据所述至少一个待分析人口数据,生成至少一个数据集;
步骤103:接收外部输入的至少一个人口数据分析需求;
步骤104:利用所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果。
根据图1所示的实施例,获取各个不同地区的具有标准数据结构的待分析人口数据。然后根据获取的各个待分析人口数据生成设定数量个数据集。在接收到外部输入的人口数据分析需求时,利用生成的各个数据集,生成每一个人口数据分析需求对应的人口数据分析结果。通过上述可知,本方案可以根据不同地区的待分析人口数据,生成设定数量个包括不同地区待分析人口数据的数据集。并利用各个数据集生成各个人口数据分析需求对应的人口数据分析结果,以得到不同地区以及不同人口数据分析需求对应的人口数据分析结果。因此,本发明实施例提供的方案可以提高人口数据分析的全面性。
在本发明一个实施例中,上述图1所示流程图中所涉及的标准数据结构可以包括:人口信息、字段说明、字段名称、数据类型、字段长度、关联信息;其中,所述人口信息包括人口基本信息、人口户籍信息、人口身份证信息、流动人口信息、结婚登记信息、离婚登记信息、机动车驾驶人信息、机动车基本信息、社保信息、全员人口基本信息、出生登记信息、死亡登记信息、房产登记信息、教育信息、个人公积金信息、个人公积金贷款信息中的至少一种或多种。
在本实施例中,标准数据结构中包括但不限于本实施例中所阐述的内容。
其中,字段名称可以为待分析人口数据对应的数据名称。比如待分析人口数据为地区A的数据,则字段名称可以为地区A。数据类型可以包括但不限于文本型、备注型、数字型、日期/时间型、货币型、自动编号型、是/否型、超级链接型、附件型、计算机型中的至少一种或多种。字段长度可以根据业务要求进行设置,比如设置字段长度为6。关联信息可以包括是否为主键,利用该关联信息可以将各个待分析人口数据建立连接。字段说明中可以包括字段对应的内容定义。
人口信息中包括的具体内容可以根据业务要求确定。其中,人口基本信息可以包括姓名、性别、年龄、出生日期。人口户籍信息可以包括出生地点以及户口所在地。人口身份证信息可以包括身份证号、发证单位、发证日期、身份证版本。流动人口信息可以包括租住地点、常住地点、租住时间。结婚登记信息可以包括结婚登记日期、配偶信息、结婚登记地点。离婚登记信息可以包括离婚登记日期、配偶信息、离婚登记地点。机动车驾驶人信息可以包括取证日期、取证地点、是否持有机动车。机动车基本信息可以包括持有日期、机动车牌照、机动车发动机编号。社保信息可以包括社保号、社保医院、单位名称、单位社保信息。出生登记信息可以包括出生日期、接生医生信息、出生医院信息。死亡登记信息可以包括死亡时间、地点、死因。房产登记信息包括持有日期、房产所在地、房产编号。教育信息可以包括毕业院校、毕业时间、毕业专业。个人公积金信息可以包括登记日期、所在单位信息、缴费基数。个人公积金贷款信息可以包括贷款金额、贷款还款期限。
根据上述实施例,标准数据结构中包括人口信息、字段说明、字段名称、数据类型、字段长度、关联信息以及备注。其中,人口信息可以根据业务要求选择人口基本信息、人口户籍信息、人口身份证信息、流动人口信息、结婚登记信息、离婚登记信息、机动车驾驶人信息、机动车基本信息、社保信息、全员人口基本信息、出生登记信息、死亡登记信息、房产登记信息、教育信息、个人公积金信息、个人公积金贷款信息中的至少一种或多种。因此业务适用性较强。
在本发明一个实施例中,上述图1所示流程图中所涉及的人口数据分析需求可以包括人口性别信息统计、人口年龄信息统计、人口户籍信息统计、人口身份证信息统计、流动人口信息统计、结婚登记信息统计、离婚登记信息统计、机动车驾驶人信息统计、机动车基本信息统计、社保信息统计、全员人口基本信息统计、出生登记信息统计、死亡登记信息统计、房产登记信息统计、教育信息统计、个人公积金信息统计、个人公积金贷款信息统计中的至少一种或多种。
在本实施例中,人口数据分析需求可以根据业务要求确定。不同职能部门可以确定出满足自己需求的人口数据分析需求。比如公安局输入的人口数据分析需求可以为流动人口信息统计或人口户籍信息统计。卫计委输入的人口数据分析需求可以为出生登记信息统计或死亡登记信息统计。
根据上述实施例,人口数据分析需求可以根据业务要求选择人口性别信息统计、人口年龄信息统计、人口户籍信息统计、人口身份证信息统计、流动人口信息统计、结婚登记信息统计、离婚登记信息统计、机动车驾驶人信息统计、机动车基本信息统计、社保信息统计、全员人口基本信息统计、出生登记信息统计、死亡登记信息统计、房产登记信息统计、教育信息统计、个人公积金信息统计、个人公积金贷款信息统计中的至少一种或多种。因此,业务适用性较强。
在本发明一个实施例中,人口数据分析方法可以进一步包括设置至少一个数据集模型,其中,每一个所述数据集模型分别对应至少一个人口数据分析项时,
则上述图1所示流程图中的步骤102根据所述至少一个待分析人口数据,生成至少一个数据集可以包括:
在所述至少一个数据集模型中,选择至少一个数据集模型;
针对所选择的数据集模型中包括的每一个人口数据分析项,在所述至少一个待分析人口数据中提取对应的数据值,并导入到所述数据集模型中。
在本实施例中,数据集的数量以及每一个数据集对应的人口数据分析项均可以根据业务要求确定。比如人口数据分析项可以选择人口基本信息、人口户籍信息、人口身份证信息、流动人口信息、结婚登记信息、离婚登记信息、机动车驾驶人信息、机动车基本信息、社保信息、全员人口基本信息、出生登记信息、死亡登记信息、房产登记信息、教育信息、个人公积金信息、个人公积金贷款信息中的至少一种或多种。
在本实施例中,比如确定数据集模型1对应的人口数据分析项包括姓名、年龄、身份证号、结婚登记日期、配偶信息、结婚登记地点时,则在各个待分析人口数据中提取姓名、年龄、身份证号、婚登记日期、配偶信息、结婚登记地点对应的数据值。将提取的各个数据值导入到对应的导入到所述数据集模型中。
根据上述实施例,可以根据业务要求设置数据集模型,将各个待分析人口数据,整合成各个具有特定人口数据分析项的数据集。从而使各个待分析人口数据更具有分析价值。
在本发明一个实施例中,上述图1所示流程图中的步骤104利用所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果可以包括:
针对每一个所述人口数据分析需求均执行,
在预先设置的至少一个分析图表类型中,选择当前所述人口数据分析需求对应的分析图表类型;
在所述至少一个数据集中选择当前所述人口数据分析需求对应的至少一个数据集;
确定当前所述人口数据分析需求对应的至少一个数据分析指标;
对所选择的数据集包括的数据值进行聚合和排序;
确定所述至少一个数据分析指标与所述数据值之间的关联关系,生成所选择的分析图表类型的图表。
在本实施例中,所述至少一个分析图表类型包括但不限于饼型图、直方图、柱型图、扇形图、折线图、堆积柱形图中的至少一种或多种。
在本实施例中,可以根据业务需求选择人口数据分析需求对应的分析图表类型。然后再根据人口数据分析需求,通过各个数据集中包括的人口数据分析项,在各个数据集中选择出与人口数据分析需求对应的各个数据集,并确定出数据分析指标。之后对所选择的数据集包括的数据值进行聚合和排序。聚合和排序均可以根据数据集对应的不同级别进行。其中,级别可以为时间单位、也可以是行政地域单位。
在对所选择的数据集包括的数据值进行聚合和排序之后,根据数据分析指标对应的字段信息确定出与各个数据值之间的关联关系,并针对关联关系生成所选择的分析图表类型的图表。以更为直观的查看分析结果。
根据上述实施例,每一个人口数据分析需求对应的图表,均是通过该人口数据分析需求对应的数据集、分析图表类型、数据分析指标生成的,因此每一个人口数据分析需求与其对应的图表的匹配度较高。
在本发明一个实施例中,确定当前所述人口数据分析需求对应的至少一个数据分析指标的方法至少存在以下两种方式:
方式一:
在本发明一个实施例中,所述确定当前所述人口数据分析需求对应的至少一个数据分析指标可以包括:
在所选择的数据集中提取字段信息;
根据所提取的字段信息,确定当前所述人口数据分析需求对应至少一个数据分析指标。
在本实施例中,可以根据所选择的数据集中包括的人口数据分析项,提取字段信息。然后将人口数据分析需求对应的字段信息与所提取的各个字段信息进行匹配,将匹配的字段信息确定为数据分析指标。
根据上述实施例,由于数据分析指标是根据所选择数据集中提取字段信息以及人口数据分析需求确定的,因此数据分析指标确定的准确性较高。
方式二:
在本发明一个实施例中,所述确定当前所述人口数据分析需求对应的至少一个数据分析指标,包括:
根据当前所述人口数据分析需求,编辑结构化查询语言SQL语句;
利用所述SQL语句从所选择的数据集中获取当前所述人口数据分析需求对应的数据分析指标。
在本实施例中,SQL语句中可以包括操作类型、返回参数、查询目标位置以及处理函数。其中处理函数可以根据业务要求确定。比如分组、排序、计算等。利用SQL语句中的返回参数从所选择的数据集中获取返回字段,在所返回的字段中获取当前所述人口数据分析需求对应的数据分析指标。
根据上述实施例,利用SQL语句从所选择的数据集中获取人口数据分析需求对应的数据分析指标。由于SQL语句可以根据业务要求自定义编辑,因此使用SQL语句确定数据分析指标可以满足不同业务场景。
在本发明一个实施例中,在上述图1所示流程图中的步骤104利用所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果之后,可以进一步包括:
以预先设定的排列方式,排列各个所述人口数据分析结果,并以分析仪表盘的型式展示。
在本实施例中,排列方式可以根据业务要求确定。比如排列方式可以为以优先级顺序排列、以人口数据分析项排列、以时间粒度排列等。在排列方式确定之后,排列各个人口数据分析结果,并以分析仪表盘的型式展示。
根据上述实施例,利用设定的排列方式排列各个所述人口数据分析结果,并以分析仪表盘的型式展示。由于采用分析仪表盘的型式展示各个所述人口数据分析结果,因此可以更为直观的查看人口数据分析结果。
下面以获取地区A和地区B对应的待分析人口数据为例。展开说明人口数据分析方法,如图2所示,该人口数据分析方法可以包括如下步骤:
步骤201:获取至少一个待分析人口数据,其中,每一个待分析人口数据分别对应一个地区,且至少一个待分析人口数据具有标准数据结构。
在本步骤中,获取地区A对应的待分析人口数据A以及地区B对应的待分析人口数据B。其中,待分析人口数据A以及待分析人口数据B均具有标准数据结构。
标准数据结构包括姓名、性别、年龄、出生日期、身份证号、户口所在地、常住地点、结婚登记日期、离婚登记日期、房产编号、字段名称、数据类型、字段长度、关联信息以及字段说明。
步骤202:设置至少一个数据集模型,其中,每一个数据集模型分别对应至少一个人口数据分析项。
在本步骤中,设置了数据集模型1、数据集模型2以及数据集模型3。其中,数据集模型1对应的人口数据分析项为姓名、性别、年龄、出生日期、身份证号、户口所在地、常住地点。数据集模型2对应的人口数据分析项为姓名、性别、年龄、出生日期、身份证号、结婚登记日期、离婚登记日期。数据集模型3对应的人口数据分析项为姓名、性别、年龄、出生日期、身份证号、房产编号。
步骤203:在至少一个数据集模型中,选择至少一个数据集模型。
在本步骤中,选择了数据集模型1、数据集模型2以及数据集模型3。
步骤204:针对所选择的数据集模型中包括的每一个人口数据分析项,在至少一个待分析人口数据中提取对应的数据值,并导入到数据集模型中。
在本步骤中,以数据集模型1为例进行说明:在待分析人口数据A以及待分析人口数据B中提取姓名、性别、年龄、出生日期、身份证号、户口所在地、常住地点对应的数据值,将所提取的数据值导入到数据集模型中,形成数据集。
步骤205:接收外部输入的至少一个人口数据分析需求。
在本步骤中,接收到人口数据分析需求1以及人口数据分析需求2。其中,人口数据分析需求1为结婚登记信息统计、人口数据分析需求2为离婚登记信息统计。
步骤206:依次在至少一个人口数据分析需求中,选择一个人口数据分析需求作为当前人口数据分析需求。
步骤207:在预先设置的至少一个分析图表类型中,选择当前人口数据分析需求分析对应的分析图表类型。
在本步骤中,分析图表类型包括直方图、柱型图、扇形图、折线图。在当前人口数据分析需求为人口数据分析需求1时,选取的分析图表类型为柱型图。在当前人口数据分析需求为人口数据分析需求2时,选取的分析图表类型也为柱型图。
步骤208:在至少一个数据集中选择当前人口数据分析需求对应的至少一个数据集。
在本步骤中,在当前人口数据分析需求为人口数据分析需求1时,选择的数据集为数据集2。在当前人口数据分析需求为人口数据分析需求2时,选择的数据集为数据集2。
步骤209:在所选择的数据集中提取字段信息。
在本步骤中,以当前人口数据分析需求为人口数据分析需求1为例进行说明:根据所选择的数据集2中包括的人口数据分析项,提取字段信息。
步骤210:根据所提取的字段信息,确定当前人口数据分析需求对应至少一个数据分析指标。
在本步骤中,以当前人口数据分析需求为人口数据分析需求1为例进行说明:确定人口数据分析需求1对应的数据分析指标为结婚登记年限2016年和2017年。
步骤211:对所选择的数据集包括的数据值进行聚合和排序。
在本步骤中,以当前人口数据分析需求为人口数据分析需求1为例进行说明:根据时间单位对数据值进行聚合和排序。比如在数据集中聚合结婚登记年限为2016年和2017年的数据值,并根据年限由远及近的顺序进行排序。
步骤212:确定至少一个数据分析指标与数据值之间的关联关系,生成所选择的分析图表类型的图表。
在本步骤中,以当前人口数据分析需求为人口数据分析需求1为例进行说明:确定数据分析指标“2016年和2017年”与数据值之间的关联关系,待确定关联关系之后,生成柱型图。
步骤213:判断当前人口数据分析需求是否为最后一个人口数据分析需求,如果是,执行步骤214;否则,执行步骤206。
步骤214:以预先设定的排列方式,排列各个人口数据分析结果,并以分析仪表盘的型式展示。
在本步骤中,确定人口数据分析需求1对应的人口数据分析结果1的优先级高于人口数据分析需求2对应的人口数据分析结果2。则以优先级顺序从高到低的顺序对各个人口数据分析结果进行排列,并以分析仪表盘的型式展示,以更为直观的查看人口数据分析结果。
如图3、图4所示,本发明实施例提供了一种人口数据分析装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言,如图3所示,为本发明实施例提供的人口数据分析装置所在设备的一种硬件结构图,除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等等。以软件实现为例,如图4所示,作为一个逻辑意义上的装置,是通过其所在设备的CPU将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。本实施例提供的人口数据分析装置,包括:
获取单元401,用于获取至少一个待分析人口数据,其中,每一个所述待分析人口数据分别对应一个地区,且所述至少一个待分析人口数据具有标准数据结构;
数据集生成单元402,用于根据所述至少一个待分析人口数据,生成至少一个数据集;
接收单元403,用于接收外部输入的至少一个人口数据分析需求;
分析结果生成单元404,用于利用所述数据集生成单元402生成的所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果。
根据图4所示的实施例,本方案中数据集生成单元可以根据不同地区的待分析人口数据,生成设定数量个包括不同地区待分析人口数据的数据集。并利用分析结果生成单元根据各个数据集生成各个人口数据分析需求对应的人口数据分析结果,以得到不同地区以及不同人口数据分析需求对应的人口数据分析结果。因此,本发明实施例提供的方案可以提高人口数据分析的全面性。
在本发明一个实施例中,如图5所示,人口数据分析装置中可以进一步包括设置单元501;
所述设置单元501,用于设置至少一个数据集模型,其中,每一个所述数据集模型分别对应至少一个人口数据分析项;
则,所述数据集生成单元402可以包括:模型选择子单元502以及生成子单元503;
所述模型选择子单元502,用于在所述至少一个数据集模型中,选择至少一个数据集模型;
所述生成子单元503,用于针对所选择的数据集模型中包括的每一个人口数据分析项,在所述至少一个待分析人口数据中提取对应的数据值,并导入到所述数据集模型中。
在本发明一个实施例中,如图6所示,所述分析结果生成单元404可以包括:选择子单元601以及确定子单元602;
所述选择子单元601,用于针对每一个所述人口数据分析需求均执行,在预先设置的至少一个分析图表类型中,选择当前所述人口数据分析需求对应的分析图表类型;在所述至少一个数据集中选择当前所述人口数据分析需求对应的至少一个数据集;
所述确定子单元602,用于确定当前所述人口数据分析需求对应的至少一个数据分析指标;对所选择的数据集包括的数据值进行聚合和排序;确定所述至少一个数据分析指标与所述数据值之间的关联关系,生成所选择的分析图表类型的图表。
在本发明一个实施例中,所述确定子单元602,用于在所选择的数据集中提取字段信息;根据所提取的字段信息,确定当前所述人口数据分析需求对应至少一个数据分析指标。
在本发明一个实施例中,所述确定子单元602,用于根据当前所述人口数据分析需求,编辑SQL语句;利用所述SQL语句从所选择的数据集中获取当前所述人口数据分析需求对应的数据分析指标。
在本发明一个实施例中,如图7所示,人口数据分析装置中可以进一步包括展示单元701;
所述展示单元701,用于以预先设定的排列方式,排列各个所述人口数据分析结果,并以分析仪表盘的型式展示。
在本发明一个实施例提供了一种可读介质,该可读介质包括:执行指令,当存储控制器的处理器执行所述执行指令时,所述存储控制器执行上述任一项所述人口数据分析方法。
在本发明一个实施例提供了一种存储控制器,该存储控制器包括:处理器、存储器和总线;所述存储器用于存储执行指令;所述处理器与所述存储器通过所述总线连接;当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行上述任一项所述人口数据分析方法。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
综上所述,本发明各个实施例至少可以实现如下有益效果:
1、在本发明实施例中,获取各个不同地区的具有标准数据结构的待分析人口数据。然后根据获取的各个待分析人口数据生成设定数量个数据集。在接收到外部输入的人口数据分析需求时,利用生成的各个数据集,生成每一个人口数据分析需求对应的人口数据分析结果。通过上述可知,本方案可以根据不同地区的待分析人口数据,生成设定数量个包括不同地区待分析人口数据的数据集。并利用各个数据集生成各个人口数据分析需求对应的人口数据分析结果,以得到不同地区以及不同人口数据分析需求对应的人口数据分析结果。因此,本发明实施例提供的方案可以提高人口数据分析的全面性。
2、在本发明实施例中,标准数据结构中包括人口信息、字段说明、字段名称、数据类型、字段长度、关联信息以及备注。其中,人口信息可以根据业务要求选择人口基本信息、人口户籍信息、人口身份证信息、流动人口信息、结婚登记信息、离婚登记信息、机动车驾驶人信息、机动车基本信息、社保信息、全员人口基本信息、出生登记信息、死亡登记信息、房产登记信息、教育信息、个人公积金信息、个人公积金贷款信息中的至少一种或多种。因此业务适用性较强。
3、在本发明实施例中,人口数据分析需求可以根据业务要求选择人口性别信息统计、人口年龄信息统计、人口户籍信息统计、人口身份证信息统计、流动人口信息统计、结婚登记信息统计、离婚登记信息统计、机动车驾驶人信息统计、机动车基本信息统计、社保信息统计、全员人口基本信息统计、出生登记信息统计、死亡登记信息统计、房产登记信息统计、教育信息统计、个人公积金信息统计、个人公积金贷款信息统计中的至少一种或多种。因此,业务适用性较强。
4、在本发明实施例中,可以根据业务要求设置数据集模型,将各个待分析人口数据,整合成各个具有特定人口数据分析项的数据集。从而使各个待分析人口数据更具有分析价值。
5、在本发明实施例中,每一个人口数据分析需求对应的图表,均是通过该人口数据分析需求对应的数据集、分析图表类型、数据分析指标生成的,因此每一个人口数据分析需求与其对应的图表的匹配度较高。
6、在本发明实施例中,由于数据分析指标是根据所选择数据集中提取字段信息以及人口数据分析需求确定的,因此数据分析指标确定的准确性较高。
7、在本发明实施例中,利用SQL语句从所选择的数据集中获取人口数据分析需求对应的数据分析指标。由于SQL语句可以根据业务要求自定义编辑,因此使用SQL语句确定数据分析指标可以满足不同业务场景。
8、在本发明实施例中,利用设定的排列方式排列各个所述人口数据分析结果,并以分析仪表盘的型式展示。由于采用分析仪表盘的型式展示各个所述人口数据分析结果,因此可以更为直观的查看人口数据分析结果。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种人口数据分析方法,其特征在于,包括:
获取至少一个待分析人口数据,其中,每一个所述待分析人口数据分别对应一个地区,且所述至少一个待分析人口数据具有标准数据结构;
根据所述至少一个待分析人口数据,生成至少一个数据集;
接收外部输入的至少一个人口数据分析需求;
利用所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果。
2.根据权利要求1所述的方法,其特征在于,
进一步包括:
设置至少一个数据集模型,其中,每一个所述数据集模型分别对应至少一个人口数据分析项;
所述根据所述至少一个待分析人口数据,生成至少一个数据集,包括:在所述至少一个数据集模型中,选择至少一个数据集模型;
针对所选择的数据集模型中包括的每一个人口数据分析项,在所述至少一个待分析人口数据中提取对应的数据值,并导入到所述数据集模型中。
3.根据权利要求2所述的方法,其特征在于,
所述利用所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果,包括:
针对每一个所述人口数据分析需求均执行,
在预先设置的至少一个分析图表类型中,选择当前所述人口数据分析需求对应的分析图表类型;
在所述至少一个数据集中选择当前所述人口数据分析需求对应的至少一个数据集;
确定当前所述人口数据分析需求对应的至少一个数据分析指标;
对所选择的数据集包括的数据值进行聚合和排序;
确定所述至少一个数据分析指标与所述数据值之间的关联关系,生成所选择的分析图表类型的图表。
4.根据权利要求3所述的方法,其特征在于,
所述确定当前所述人口数据分析需求对应的至少一个数据分析指标,包括:
在所选择的数据集中提取字段信息;
根据所提取的字段信息,确定当前所述人口数据分析需求对应至少一个数据分析指标;
或,
所述确定当前所述人口数据分析需求对应的至少一个数据分析指标,包括:
根据当前所述人口数据分析需求,编辑结构化查询语言SQL语句;
利用所述SQL语句从所选择的数据集中获取当前所述人口数据分析需求对应的数据分析指标。
5.根据权利要求1至4任一所述的方法,其特征在于,
在所述利用所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果之后,进一步包括:
以预先设定的排列方式,排列各个所述人口数据分析结果,并以分析仪表盘的型式展示;
和/或,
所述标准数据结构包括人口信息、字段说明、字段名称、数据类型、字段长度、关联信息;其中,所述人口信息包括人口基本信息、人口户籍信息、人口身份证信息、流动人口信息、结婚登记信息、离婚登记信息、机动车驾驶人信息、机动车基本信息、社保信息、全员人口基本信息、出生登记信息、死亡登记信息、房产登记信息、教育信息、个人公积金信息、个人公积金贷款信息中的至少一种或多种;
和/或,
所述人口数据分析需求包括:人口性别信息统计、人口年龄信息统计、人口户籍信息统计、人口身份证信息统计、流动人口信息统计、结婚登记信息统计、离婚登记信息统计、机动车驾驶人信息统计、机动车基本信息统计、社保信息统计、全员人口基本信息统计、出生登记信息统计、死亡登记信息统计、房产登记信息统计、教育信息统计、个人公积金信息统计、个人公积金贷款信息统计中的至少一种或多种。
6.一种人口数据分析装置,其特征在于,包括:
获取单元,用于获取至少一个待分析人口数据,其中,每一个所述待分析人口数据分别对应一个地区,且所述至少一个待分析人口数据具有标准数据结构;
数据集生成单元,用于根据所述至少一个待分析人口数据,生成至少一个数据集;
接收单元,用于接收外部输入的至少一个人口数据分析需求;
分析结果生成单元,用于利用所述数据集生成单元生成的所述至少一个数据集,生成每一个所述人口数据分析需求对应的人口数据分析结果。
7.根据权利要求6所述的装置,其特征在于,
进一步包括:设置单元;
所述设置单元,用于设置至少一个数据集模型,其中,每一个所述数据集模型分别对应至少一个人口数据分析项;
所述数据集生成单元,包括:模型选择子单元以及生成子单元;
所述模型选择子单元,用于在所述至少一个数据集模型中,选择至少一个数据集模型;
所述生成子单元,用于针对所选择的数据集模型中包括的每一个人口数据分析项,在所述至少一个待分析人口数据中提取对应的数据值,并导入到所述数据集模型中。
8.根据权利要求7所述的装置,其特征在于,
所述分析结果生成单元,包括:选择子单元以及确定子单元;
所述选择子单元,用于针对每一个所述人口数据分析需求均执行,在预先设置的至少一个分析图表类型中,选择当前所述人口数据分析需求对应的分析图表类型;在所述至少一个数据集中选择当前所述人口数据分析需求对应的至少一个数据集;
所述确定子单元,用于确定当前所述人口数据分析需求对应的至少一个数据分析指标;对所选择的数据集包括的数据值进行聚合和排序;确定所述至少一个数据分析指标与所述数据值之间的关联关系,生成所选择的分析图表类型的图表。
9.根据权利要求8所述的装置,其特征在于,
所述确定子单元,用于在所选择的数据集中提取字段信息;根据所提取的字段信息,确定当前所述人口数据分析需求对应至少一个数据分析指标;
或,
所述确定子单元,用于根据当前所述人口数据分析需求,编辑SQL语句;利用所述SQL语句从所选择的数据集中获取当前所述人口数据分析需求对应的数据分析指标。
10.根据权利要求6至9任一所述的装置,其特征在于,
进一步包括:展示单元;
所述展示单元,用于以预先设定的排列方式,排列各个所述人口数据分析结果,并以分析仪表盘的型式展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710958934.XA CN107590289A (zh) | 2017-10-16 | 2017-10-16 | 一种人口数据分析方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710958934.XA CN107590289A (zh) | 2017-10-16 | 2017-10-16 | 一种人口数据分析方法以及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107590289A true CN107590289A (zh) | 2018-01-16 |
Family
ID=61053269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710958934.XA Pending CN107590289A (zh) | 2017-10-16 | 2017-10-16 | 一种人口数据分析方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107590289A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046185A (zh) * | 2019-04-12 | 2019-07-23 | 成都四方伟业软件股份有限公司 | 图表推送方法及装置 |
CN111476030A (zh) * | 2020-05-08 | 2020-07-31 | 中国科学院计算机网络信息中心 | 一种基于深度学习的前瞻因子筛选方法 |
CN111598441A (zh) * | 2020-05-14 | 2020-08-28 | 北京软通智城科技有限公司 | 人口数据分析方法、系统、设备和存储介质 |
CN114328654A (zh) * | 2021-12-10 | 2022-04-12 | 北京融信数联科技有限公司 | 一种基于大数据的人口统计方法、系统和可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101083785A (zh) * | 2007-07-04 | 2007-12-05 | 贾林 | 获得人口信息的方法及系统 |
TW201348983A (zh) * | 2012-05-16 | 2013-12-01 | Univ Nat Taiwan | 人類地域活動統計分析系統及方法 |
CN105426434A (zh) * | 2015-11-04 | 2016-03-23 | 北京航天金盾科技有限公司 | 基于多维度的人口信息统计分析系统 |
WO2016177066A1 (zh) * | 2015-08-06 | 2016-11-10 | 中兴通讯股份有限公司 | 一种人员潜在关系分析方法和装置 |
CN106980930A (zh) * | 2017-03-20 | 2017-07-25 | 山东浪潮云服务信息科技有限公司 | 一种运用大数据多点碰撞技术进行人口迁徙分析的方法 |
-
2017
- 2017-10-16 CN CN201710958934.XA patent/CN107590289A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101083785A (zh) * | 2007-07-04 | 2007-12-05 | 贾林 | 获得人口信息的方法及系统 |
TW201348983A (zh) * | 2012-05-16 | 2013-12-01 | Univ Nat Taiwan | 人類地域活動統計分析系統及方法 |
WO2016177066A1 (zh) * | 2015-08-06 | 2016-11-10 | 中兴通讯股份有限公司 | 一种人员潜在关系分析方法和装置 |
CN105426434A (zh) * | 2015-11-04 | 2016-03-23 | 北京航天金盾科技有限公司 | 基于多维度的人口信息统计分析系统 |
CN106980930A (zh) * | 2017-03-20 | 2017-07-25 | 山东浪潮云服务信息科技有限公司 | 一种运用大数据多点碰撞技术进行人口迁徙分析的方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046185A (zh) * | 2019-04-12 | 2019-07-23 | 成都四方伟业软件股份有限公司 | 图表推送方法及装置 |
CN111476030A (zh) * | 2020-05-08 | 2020-07-31 | 中国科学院计算机网络信息中心 | 一种基于深度学习的前瞻因子筛选方法 |
CN111476030B (zh) * | 2020-05-08 | 2022-03-15 | 中国科学院计算机网络信息中心 | 一种基于深度学习的前瞻因子筛选方法 |
CN111598441A (zh) * | 2020-05-14 | 2020-08-28 | 北京软通智城科技有限公司 | 人口数据分析方法、系统、设备和存储介质 |
CN114328654A (zh) * | 2021-12-10 | 2022-04-12 | 北京融信数联科技有限公司 | 一种基于大数据的人口统计方法、系统和可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107590289A (zh) | 一种人口数据分析方法以及装置 | |
WO2019200752A1 (zh) | 基于语义理解的兴趣点查询方法、装置和计算机设备 | |
US9639898B2 (en) | Tax analysis tool | |
CN110069609B (zh) | 裁判文书分析方法、装置、计算机设备及存储介质 | |
CN107679082A (zh) | 问答搜索方法、装置以及电子设备 | |
US11294960B1 (en) | Entity mapping | |
CN108460100A (zh) | 一种用户画像构建方法及装置 | |
WO2006036972A2 (en) | Method for searching data elements on the web using a conceptual metadata and contextual metadata search engine | |
CN112084269B (zh) | 数据质量计算方法、装置、存储介质及服务器 | |
CN107273519A (zh) | 数据分析方法、装置、终端及存储介质 | |
CN109615172A (zh) | 一种处理考核数据的方法及终端 | |
CN113989019A (zh) | 识别风险的方法、装置、设备及存储介质 | |
CN109509085A (zh) | 贷前信息处理方法、装置、计算机设备及存储介质 | |
CN109255703A (zh) | 交易数据处理方法及装置 | |
CN109739992A (zh) | 一种获取关联信息的方法及终端 | |
Wanner et al. | Integrated visual analysis of patterns in time series and text data-workflow and application to financial data analysis | |
Li et al. | Impacts of changing from permissive/protected left-turn to protected-only phasing: Case study in the city of Tucson, Arizona | |
CN108428138A (zh) | 一种基于客户分群的客户生存率分析装置及分析方法 | |
CN115858822B (zh) | 一种时序知识图谱构建方法及系统 | |
CN116862434A (zh) | 一种基于大数据的材料数据管理系统及方法 | |
Al-Halabi et al. | The impact of designing accounting information systems on the level of accounting conservatism-a field study | |
CN117273429A (zh) | 事件监测方法、系统、电子设备及存储介质 | |
CN105786929A (zh) | 一种信息监测方法及装置 | |
CN112365248B (zh) | 一种分析数字货币交易路径的方法及系统 | |
Cabanban-Casem | Analytical visualization of higher education institutions' big data for decision making |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180116 |
|
RJ01 | Rejection of invention patent application after publication |