CN110275922A - 一种基于图数据库实现的家族图谱分析技术 - Google Patents

一种基于图数据库实现的家族图谱分析技术 Download PDF

Info

Publication number
CN110275922A
CN110275922A CN201910079203.7A CN201910079203A CN110275922A CN 110275922 A CN110275922 A CN 110275922A CN 201910079203 A CN201910079203 A CN 201910079203A CN 110275922 A CN110275922 A CN 110275922A
Authority
CN
China
Prior art keywords
family
householder
data
analysis
chart database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910079203.7A
Other languages
English (en)
Other versions
CN110275922B (zh
Inventor
张天际
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Kingyea Software Technology Co Ltd
Original Assignee
Guangzhou Kingyea Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Kingyea Software Technology Co Ltd filed Critical Guangzhou Kingyea Software Technology Co Ltd
Priority to CN201910079203.7A priority Critical patent/CN110275922B/zh
Publication of CN110275922A publication Critical patent/CN110275922A/zh
Application granted granted Critical
Publication of CN110275922B publication Critical patent/CN110275922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于图数据库实现的可视化人员家族关系网图谱分析技术,主要解决当前公安机关难以分析指定人员的家族关系问题。其特征在于:基于图数据库构建,能够根据不同业务需要,对基础数据使用不同的图论算法进行转换;提供多种家族图谱分析算法,包括遗留算法、多父节点分析法、子女关系逆向分析法、多户主分析法;实现一套对原始人口数据进行校验的算法,支持与主流大数据平台和既有业务系统相整合。本发明的优势是能够整合各类人口相关数据,以可视化的形式加以呈现,快速展现人员的家族关系图谱。

Description

一种基于图数据库实现的家族图谱分析技术
技术领域
本发明涉及大数据分析技术,特别是涉及一种基于图数据库实现的家族图谱分析技术。
背景技术
目前大数据分析领域已有部分人员关系分析应用,但主要展现的是不同模型的一级关系,即横向拓展较多,不存在嵌套层次。对于家谱分析,更多的是需要进行纵向拓展,即展现同一模型的多个层次。查遍国内外的相关资料,没有发现基于图数据库实现的家族图谱分析技术。
发明内容
本发明主要目的是提供一种可视化的人员家族关系网图谱分析技术,解决当前公安机关难以分析指定人员的家族关系的问题。
为解决上述问题,本发明采用的技术方案是提供一种基于图数据库实现的家族图谱分析技术,其特征在于:
基于图数据库构建,能够根据不同业务需要,对基础数据使用不同的图论算法进行转换生成各种业务数据;
提供多种家族图谱分析算法,包括遗留算法、多父节点分析法、子女关系逆向分析法、多户主分析法;
与主流大数据平台相整合,充分利用分布式计算能力实现对图数据的分析;
实现一套对原始人口数据进行校验的算法,比如身份证号变更、错误过户人员修正等,可用来对数据进行清洗;
提供REST API接口,能够与既有业务系统进行整合。
本发明的优势是能够整合各类人口相关数据,以可视化的形式加以呈现,快速展现人员的家族关系图谱。
附图说明
图1是本发明一种基于图数据库的人员家庭关系分析流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施方式进行一个完整清晰的描述。需要注意的是这里所描述的实施例仅是本发明一部分实施例,而非全部。
如图1所示,本发明在分析人员家庭关系时,采用家族图谱分析算法,首先分析常住人口表,按照户号进行分组,生成一组互相关联的图形,表示一户家庭(图中按照不同颜色标识),每个节点使用身份证号标识,包含必要的属性比如姓名、性别等,节点关系通过配偶、父母、监护人以及与户主关系等字段生成;
然后进一步分析婚姻登记表,对图中的每一个节点,查找其婚姻登记记录,根据查询结果修改节点关系,或者有必要的话增加新节点;
最后分析变动信息表,根据每个人员的变动记录中不同的户号将对应节点关联到既有户号中。
在整个分析过程中,如果发现明确的关系,一是可以继续对图进行转换,二是可以在查询时再进行计算,只需要找到对应[查找的节点->关系->节点]这样的结构,再对这个子图参照原有逻辑计算。
本发明采用的家族图谱分析算法包括:
·遗留算法
使用本算法的一个典型模式是根据关系人的户主关系,从当前户号家庭中选取对应户主关系的人员,据此设计数据字典如下所示:
master=1,2
master.father=M50,51,57,M59
其中首行为该算法的执行条件,只有在被分析对象的户主关系满足时才会按照后面的算法执行,m50中的m表示需要考虑对应人员的性别。
注意每一类关系人的分析条件都不能相同,如果相同则说明二者分析可以合并。
另外,也会出现分析条件和后续户主关系值相同的情况,这时需要避免重复,因而引入分析标签的概念。
在与户主关系后增加标签名实现。
master.brothers=50[rd],51[rd]
·多父节点分析法
当且仅当户主只有一个儿子/女儿时,通过分析标签集成到遗留算法中,为此需要额外增加分析标签和字典表:
同一户号下孙子辈的父母监护人字段;
同一户号下儿媳/女婿的配偶字典。
如果兄弟姐妹都结婚,则他们的配偶也无法判断,只有在嫂子或弟媳只有一人的情况下检查其配偶是否只有一个兄弟姐妹(还要加上户主)加以判断,即一户中的兄弟姐妹组合只有两人,比如:
户主是同辈
只有一个嫂子(但可以有其他多个弟媳/姐夫/妹夫),选择唯一的是户主哥哥的人,即该家庭只有一个户主的哥哥;
只有一个弟媳(但可以有多个嫂子/姐夫/妹夫),选择唯一一个是户主弟弟的人,即该家庭只有一个户主的弟弟;
只有一个姐夫(但可以有多个嫂子/弟媳/妹夫),选择唯一一个是户主姐姐的人,即该家庭只有一个户主的姐姐;
只有一个妹夫(但可以有多个嫂子/弟媳/姐夫),选择唯一一个是户主妹妹的人,即该家庭只有一个户主的妹妹;
户主是父辈
只有一个女儿=>女婿
只有一个儿子=>儿媳
·子女关系逆向分析法
针对遗留算法中无法处理多个儿子的儿子的问题,使用子女父母以及监护人信息逆向进行分析,通过子女数据中的父母信息来确定子女关系。
·多户主分析法
在合并常口和变动数据之后,可能出现多个户主的情况,一般是户家庭内部户主变更或者前户主死亡导致。
此类数据的分析方法如下:
1)拆分成多个仅包含一个户主的家庭分组,拆分原则如下:
仅对包含多个户主的分组进行拆分;
户主选择时间序列号更大的数据;
户主状态应有效(即没有死亡);
即便变更为户主的记录在前,也应该选为户主;
若户主选定,则同一身份证号下的其他记录将被拆分出去形成新的分组;
原分组中其他户主也将被拆分到上面新的分组中;
原分组中根据身份证号保留其他户主非户主关系的记录;
保留原分组中非户主记录;
拆分后的记录时间应在当前时间之前(即在当前分组下方)以便后续合并;
若拆分后出现没有户主的情况,则说明当前户号下的成员极有可能不是亲属关系。
2)对每一个分组,首先根据与户主关系、身份证号去重(取最新的那一条),同时删除去重后只有一条记录的分组,但也有例外,如果时间最新的那个分组只剩一条记录,需要保留,一般意味着新成员的加入(比如出生申报),另外若该单一记录在整个变动历史中只出现过一次,也应保留。
只有一条记录的分组实际上只是其他属性的变更,其与户主关系没有变化,且即便是其他属性变更,也很少涉及到双亲和监护人,因此可以直接删除。
3)合并分组,首先合并无户主分组,一直向上合并,直到加入到包含户主的分组,若仍然存在不含户主的分组,则开始对包含户主的分组进行合并,一直向上吸收不含户主的分组,直到遇到包含户主的分组。
4)利用集合论的包含运算对每一个分组根据与户主关系和身份证号进行去重。

Claims (1)

1.一种基于图数据库实现的家族图谱分析技术,其特征在于:
基于图数据库构建,能够根据不同业务需要,对基础数据使用不同的图论算法进行转换生成各种业务数据;
提供多种家族图谱分析算法,包括遗留算法、多父节点分析法、子女关系逆向分析法、多户主分析法;
与主流大数据平台相整合,充分利用分布式计算能力实现对图数据的分析;
实现一套对原始人口数据进行校验的算法,比如身份证号变更、错误过户人员修正等,可用来对数据进行清洗;
提供REST API接口,能够与既有业务系统进行整合。
CN201910079203.7A 2019-03-01 2019-03-01 一种基于图数据库实现的家族图谱分析技术 Active CN110275922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910079203.7A CN110275922B (zh) 2019-03-01 2019-03-01 一种基于图数据库实现的家族图谱分析技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910079203.7A CN110275922B (zh) 2019-03-01 2019-03-01 一种基于图数据库实现的家族图谱分析技术

Publications (2)

Publication Number Publication Date
CN110275922A true CN110275922A (zh) 2019-09-24
CN110275922B CN110275922B (zh) 2023-06-23

Family

ID=67958097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910079203.7A Active CN110275922B (zh) 2019-03-01 2019-03-01 一种基于图数据库实现的家族图谱分析技术

Country Status (1)

Country Link
CN (1) CN110275922B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581304A (zh) * 2020-05-18 2020-08-25 北京博安智联科技有限公司 一种基于社会人口家族关系自动绘制家系图谱的算法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880652A (zh) * 2012-08-27 2013-01-16 广州多益网络科技有限公司 一种家谱创建及管理方法
KR101332411B1 (ko) * 2013-01-03 2013-11-22 온디자인 주식회사 네트워크서비스를 기반으로 하는 혈연관계정보 서비스 시스템과 그 제어방법
CN103853828A (zh) * 2014-03-05 2014-06-11 陈又正 一种展示家谱数据与宗亲关系的方法
US20160048517A1 (en) * 2014-08-12 2016-02-18 Ancestry.Com Operations Inc. System and method for identifying relationships in a data graph
CN108153840A (zh) * 2017-12-15 2018-06-12 杭州数梦工场科技有限公司 一种家族关系图谱的生成方法、装置以及电子设备
CN108334572A (zh) * 2018-01-19 2018-07-27 全球能源互联网研究院有限公司 一种基于图数据库的电网拓扑分析引擎系统及方法
CN108549795A (zh) * 2018-03-13 2018-09-18 刘吟 基于家系图框架的遗传咨询信息系统
CN109255034A (zh) * 2018-08-08 2019-01-22 数据地平线(广州)科技有限公司 一种基于产业链的行业知识图谱构建方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880652A (zh) * 2012-08-27 2013-01-16 广州多益网络科技有限公司 一种家谱创建及管理方法
KR101332411B1 (ko) * 2013-01-03 2013-11-22 온디자인 주식회사 네트워크서비스를 기반으로 하는 혈연관계정보 서비스 시스템과 그 제어방법
CN103853828A (zh) * 2014-03-05 2014-06-11 陈又正 一种展示家谱数据与宗亲关系的方法
US20160048517A1 (en) * 2014-08-12 2016-02-18 Ancestry.Com Operations Inc. System and method for identifying relationships in a data graph
CN108153840A (zh) * 2017-12-15 2018-06-12 杭州数梦工场科技有限公司 一种家族关系图谱的生成方法、装置以及电子设备
CN108334572A (zh) * 2018-01-19 2018-07-27 全球能源互联网研究院有限公司 一种基于图数据库的电网拓扑分析引擎系统及方法
CN108549795A (zh) * 2018-03-13 2018-09-18 刘吟 基于家系图框架的遗传咨询信息系统
CN109255034A (zh) * 2018-08-08 2019-01-22 数据地平线(广州)科技有限公司 一种基于产业链的行业知识图谱构建方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHRISTOPHER MILES 等: "Rapid DNA Performance Results on Family Relationship Verification", ACM, pages 3 *
姜洋;彭智勇;彭煜玮;: "基于图数据库的在线族谱编录系统", 计算机应用, no. 01, pages 125 - 130 *
朱芸芸;朱振华;: "基于公安大数据的云家谱系统设计与实现", 电子测试, no. 18, pages 73 - 74 *
陈国军;蔺想红;段淑凤;: "家谱成员关系的元图可视化", 计算机工程与科学, no. 07, pages 1454 - 1461 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111581304A (zh) * 2020-05-18 2020-08-25 北京博安智联科技有限公司 一种基于社会人口家族关系自动绘制家系图谱的算法

Also Published As

Publication number Publication date
CN110275922B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
Taymouri et al. Business process variant analysis: Survey and classification
US10853387B2 (en) Data retrieval apparatus, program and recording medium
CN104346377B (zh) 一种基于唯一标识的数据集成和交换方法
US8700658B2 (en) Relational meta model and associated domain context-based knowledge inference engine for knowledge discovery and organization
JP6045706B2 (ja) データ処理システム、データ処理方法およびデータ処理装置
CN104750496B (zh) 一种模型变更影响度自动检查方法
US10565597B2 (en) Real-time pattern matching of database transactions and unstructured text
US20030023591A1 (en) Systems and methods for discovering mutual dependence patterns
Sim et al. Logic-based pattern discovery
US20160070751A1 (en) Database management system
Alatrista Salas et al. The pattern next door: Towards spatio-sequential pattern discovery
Andersen et al. The effects of unemployment on fertility
Zhou et al. Ontology reshaping for knowledge graph construction: applied on Bosch welding case
CN104933621A (zh) 一种担保圈的大数据分析系统和方法
CN110275922A (zh) 一种基于图数据库实现的家族图谱分析技术
CN105224629A (zh) 一种xbrl应用平台业务流程一体化的实现方法
Balasubramani et al. Ontology-based urban data exploration
Mezzanzanica et al. Data quality sensitivity analysis on aggregate indicators
CN106033447B (zh) 项集挖掘方法及装置
CN116561345A (zh) 一种基于多模态数据公司情报知识图谱构建方法
US20170330055A1 (en) Sequential data analysis apparatus and program
WO2014114761A1 (en) Data management system
Schuh et al. Ontology-guided knowledge discovery of event sequences in maintenance data
CN114862233A (zh) 智能决策方法和智能决策系统
Nguyen Representation choice methods as the tool for solving uncertainty in distributed temporal database systems with indeterminate valid time

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 510630 no.1202, 246, 248 and 250, Wushan Road, Tianhe District, Guangzhou, Guangdong Province

Applicant after: Guangzhou Kingyea Software Technology Co.,Ltd.

Address before: 510630 South Tower 1201-1204, Jinshan Building, 248 Wushan Road, Tianhe District, Guangzhou City, Guangdong Province

Applicant before: Guangzhou Kingyea Software Technology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant