CN112084293B - 用于公安领域的数据鉴真系统及数据鉴真方法 - Google Patents
用于公安领域的数据鉴真系统及数据鉴真方法 Download PDFInfo
- Publication number
- CN112084293B CN112084293B CN202010928192.8A CN202010928192A CN112084293B CN 112084293 B CN112084293 B CN 112084293B CN 202010928192 A CN202010928192 A CN 202010928192A CN 112084293 B CN112084293 B CN 112084293B
- Authority
- CN
- China
- Prior art keywords
- data
- resource
- module
- library
- discrete
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 28
- 238000011156 evaluation Methods 0.000 claims abstract description 9
- 238000013507 mapping Methods 0.000 claims description 24
- 238000013523 data management Methods 0.000 claims description 23
- 238000004140 cleaning Methods 0.000 claims description 14
- 238000007726 management method Methods 0.000 claims description 8
- 238000013506 data mapping Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 3
- 230000008676 import Effects 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 230000004927 fusion Effects 0.000 abstract description 7
- 230000008520 organization Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 241001622623 Coeliadinae Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Storage Device Security (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用于公安领域的数据鉴真系统,并且基于数据鉴真系统进行数据的录入、映射、清洗和关联,从而实现对数据的评估鉴真。本发明提供了数据来源可信度、时效性、支持度三个维度对数据的真实性、有效性、融合关联的正确性自动进行评估,可以根据数据项的特点,灵活选择和评估维度进行数据评估。
Description
技术领域
本发明属于数据处理领域,具体涉及用于公安领域的数据鉴真系统及数据 鉴真方法。
背景技术
推动互联网、大数据、人工智能和实体经济深度融合,掌握丰富的高价值 数据资源日益成为抢占未来发展主动权的前提和保障。如何从海量分散数据中 提炼数据价值,加大数据利用与管理,以实现数据有效管理和价值应用,成为 当前趋势中亟待解决的问题。
尤其是在公安领域,随着前端感知类设备的增多和社会资源数据的大规模 采集,对数据进行处理、分析、深度挖掘,发现数据的内在规律,为预防、打 击犯罪将提供强有力的支撑,以数据驱动警务变革正逐渐成为警务发展的重要 趋势,对数据进行智能化治理是有效开展数据研判及服务实战的重要保障,在 实际应用过程中仍然面临着以下问题:
数据分散,在进行情报研判时,需要多位民警同时在不同系统中进行协作 式查询;门户式查询如海底捞针,上级公安机关对数据进行了门户式集成,解 决了一部分数据分散问题,但是其本质还是分库式的检索,没有在底层将数据 进行关联整合,还是需要民警不断的尝试遍历同一个人的各种特征值信息才能 获取其全量信息。数据由于底层没有有效治理,查询出来的结果存在不一致的情况,错误的情况,需要民警自己甄别真假并进行关联融合。
发明内容
针对现有技术中的上述不足,本发明提供的用于公安领域的数据鉴真系统 及数据鉴真方法解决了现有技术中存在的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种用于公安领域的 数据鉴真系统,包括资源目录模块、标准库模块、数据采集模块、数据管理模 块和数据鉴真模块;
所述资源目录模块用于建立统一的资源目录,并为数据管理模块和数据鉴 真模块提供数据支持;
所述标准库模块用于对系统数据元进行统一标准建设以及数据映射管理, 并为数据采集模块提供支持;
所述数据采集模块用于将离散数据的采集且导入资源目录模块,将导入的 离散数据进行数据映射并为数据管理模块提供数据支持;
所述数据管理模块用于数据的检索、修改和清洗,并提供知识图谱分析功 能,其并为数据鉴真模块提供数据支持;
所述数据鉴真模块用于数据管理模块传递的数据进行鉴真。
进一步地,所述资源目录包括资源所属类别、资源代码、资源名称、资源 摘要、资源所含字段以及资源信息源。
本发明的有益效果为:构建了一个数据管理的综合系统,实现了数据的统 一管理、清洗以及鉴真。
一种基于用于公安领域的数据鉴真系统的数据鉴真方法,包括以下步骤:
S1、使用资源目录模块创建资源所属类别,并依次录入资源代码、资源名 称、资源摘要、资源所含字段以及资源信息源,完成资源录入;
S2、对录入资源进行必填项验证,将验证通过的资源进行存储,完成资源 入库;
S3、通过标准库模块设置入库资源的映射字段,建立入库资源与国家标准 规范数据库中数据元的映射关系,得到第一资源库;
S4、通过数据采集模块录入离散数据,选择离散数据的资源目录,且建立 离散数据与国家标准规范数据库中数据元的映射关系,得到第二资源库;
S5、通过数据管理模块对第二资源库中的数据进行清洗,并以个人身份证 信息作为数据节点关联对应的所有数据;
S6、将待检索关键词输入数据管理模块,对关联数据后的第二资源库中的 数据进行检索,得到待检索关键词对应的检索数据;
S7、将检索数据传输至数据鉴真模块,选择评估维度,获取检索数据的综 合可信度,完成数据鉴真。
进一步地,所述步骤S2中必填项验证包括身份证号、手机号、车牌、银行 卡、车牌、社保号码、姓名、地名、行政单位、邮箱和邮编。
进一步地,所述步骤S3包括以下分步骤:
S31、通过标准库模块选择待映射字段的所属数据元集,设置入库资源的映 射字段;
S32、在国家标准规范数据库依次选择与映射字段对应的字段,形成对应关 系,建立入库资源与国家标准规范数据库中数据元的映射关系,得到第一资源 库。
进一步地,所述步骤S4中若选择离散数据导入方式为新增数据,则步骤S4 包括以下分步骤:
S41、构建新增离散数据的模板,并将离散数据录入模板,得到新增离散数 据;
S42、通过数据采集模块输入新增离散数据的数据表名称以及数据来源,得 到离散数据表;
S43、在离散数据表中选取待入库的字段,并匹配选择字段所属的资源类别, 得到新增入库字段;
S44、建立新增入库字段与国家标准规范数据库中数据元的映射关系,将新 增入库字段入库至第一资源库,得到第二资源库;
所述步骤S4中若选择离散数据导入方式为补充数据,则步骤S4具体为: 选择待补充数据的离散数据表,将补充数据录入离散数据表,在离散数据表中 选取待入库的字段,并匹配选择字段所属的资源类别,得到新增入库字段,建 立新增入库字段与国家标准规范数据库中数据元的映射关系,将新增入库字段 入库至第一资源库,得到第二资源库。
进一步地,所述步骤S5包括以下分步骤:
S51、随机提取一项第二资源库中的个人信息,在国家标准规范数据库提取 对其单项身份信息,得到若干单项身份信息;
S52、将若干单项身份信息进行字段对齐,消除单项身份信息的隐藏字段;
S53、遍历提取的个人信息中的所有身份信息,得到个人信息清洗结果;
S54、遍历第二资源库中所有的个人信息,得到第二资源库的数据清洗结果;
S55、以个人身份证信息作为数据节点,并以三元组的方式,将其相关信息 进行组合,得到若干组合信息;
S56、将组合信息进行关联,得到个人信息的知识图谱,遍历第二资源库中 所有的个人信息,得到第二资源库中所有个人信息的知识图谱,完成数据关联。
进一步地,所述步骤S7中评估维度包括数据来源可信度、数据时效性和数据支持度。
进一步地,所述数据来源可信度的获取方法为:设置数据可信度参考值为a 和参考值出现范围为[b,c],获取参考值在所有数据来源中出现的次数为d,得到 数据来源可信度C为:
所述数据时效性的获取方法为:设置数据更新周期叠加值为e,根据更新周 期叠加值获取数据时效性S为:
S=C×e×p
其中,p为周期值;
所述数据支持度的获取方法为:设置若干数据出现次数范围,并且每个范 围设置一个对应的叠加基数,采集数据出现次数为f,获取数据支持度H为:
H=gfC×100%
其中,gf表示数据出现次数f所在数据出现次数范围对应的叠加基数。
进一步地,所述步骤S7中选择评估维度,获取检索数据的综合可信度的具 体方法为:若选择数据维度为数据来源可信度,则综合可信度为数据来源可信 度值;若选择数据维度为数据来源可信度和数据时效性,则综合可信度为数据 时效性值;若选择数据维度为数据来源可信度和数据支持度,则综合可信度为数据支持度;若选择数据维度为数据来源可信度、数据时效性和数据支持度, 则综合可信度为gf*S。
本发明的有益效果为:
(1)本发明采用自织网模型对实战业务关注的人、事、地、物、组织进行 智能化关联,形成知识网,改变传统的底层数据组织方式,打破传统门户式的 分库检索模式,提供多路径关联检索模式,高效服务实战。
(2)本发明提供了数据来源可信度、时效性、支持度三个维度对数据的真 实性、有效性、融合关联的正确性自动进行评估,可以根据数据项的特点,灵 活选择和评估维度进行数据评估。
(3)本发明在数据关联融合的基础上,可根据业务需求实现了数据的深度 应用。
附图说明
图1为本发明提出的用于公安领域的数据鉴真系统框图;
图2为本发明提出的数据鉴真方法流程图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理 解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的 普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精 神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保 护之列。
下面结合附图详细说明本发明的实施例。
如图1所示,一种用于公安领域的数据鉴真系统,包括资源目录模块、标 准库模块、数据采集模块、数据管理模块和数据鉴真模块;
所述资源目录模块用于建立统一的资源目录,并为数据管理模块和数据鉴 真模块提供数据支持;所述标准库模块用于对系统数据元进行统一标准建设以 及数据映射管理,并为数据采集模块提供支持;所述数据采集模块用于将离散 数据的采集且导入资源目录模块,将导入的离散数据进行数据映射并为数据管 理模块提供数据支持;所述数据管理模块用于数据的检索、修改和清洗,并提供知识图谱分析功能,其并为数据鉴真模块提供数据支持;所述数据鉴真模块 用于数据管理模块传递的数据进行鉴真。
所述资源目录包括资源所属类别、资源代码、资源名称、资源摘要、资源 所含字段以及资源信息源。
本发明构建了一个数据管理的综合系统,实现了数据的统一管理、清洗以 及鉴真。
如图2所示,一种基于用于公安领域的数据鉴真系统的数据鉴真方法,包 括以下步骤:
S1、使用资源目录模块创建资源所属类别,并依次录入资源代码、资源名 称、资源摘要、资源所含字段以及资源信息源,完成资源录入;
S2、对录入资源进行必填项验证,将验证通过的资源进行存储,完成资源 入库;
S3、通过标准库模块设置入库资源的映射字段,建立入库资源与国家标准 规范数据库中数据元的映射关系,得到第一资源库;
S4、通过数据采集模块录入离散数据,选择离散数据的资源目录,且建立 离散数据与国家标准规范数据库中数据元的映射关系,得到第二资源库;
S5、通过数据管理模块对第二资源库中的数据进行清洗,并以个人身份证 信息作为数据节点关联对应的所有数据;
S6、将待检索关键词输入数据管理模块,对关联数据后的第二资源库中的 数据进行检索,得到待检索关键词对应的检索数据;
S7、将检索数据传输至数据鉴真模块,选择评估维度,获取检索数据的综 合可信度,完成数据鉴真。
在本实施例中,国家标准规范数据库包括人口库DB33/T 2234-2019、实有 人口基础信息数据项GA/T 1218-2015、法人库DB37/T 1435-2009、法人和其他 组织统一社会信用代码数据交换接口GB/T 36107-2018、自然资源以及空间地舆 基础信息库和宏观经济数据库。
所述步骤S2中必填项验证包括身份证号、手机号、车牌、银行卡、车牌、 社保号码、姓名、地名、行政单位、邮箱和邮编。
所述步骤S3包括以下分步骤:
S31、通过标准库模块选择待映射字段的所属数据元集,设置入库资源的映 射字段;
S32、在国家标准规范数据库依次选择与映射字段对应的字段,形成对应关 系,建立入库资源与国家标准规范数据库中数据元的映射关系,得到第一资源 库。
所述步骤S4中若选择离散数据导入方式为新增数据,则步骤S4包括以下 分步骤:
S41、构建新增离散数据的模板,并将离散数据录入模板,得到新增离散数 据;
S42、通过数据采集模块输入新增离散数据的数据表名称以及数据来源,得 到离散数据表;
S43、在离散数据表中选取待入库的字段,并匹配选择字段所属的资源类别, 得到新增入库字段;
S44、建立新增入库字段与国家标准规范数据库中数据元的映射关系,将新 增入库字段入库至第一资源库,得到第二资源库;
所述步骤S4中若选择离散数据导入方式为补充数据,则步骤S4具体为: 选择待补充数据的离散数据表,将补充数据录入离散数据表,在离散数据表中 选取待入库的字段,并匹配选择字段所属的资源类别,得到新增入库字段,建 立新增入库字段与国家标准规范数据库中数据元的映射关系,将新增入库字段 入库至第一资源库,得到第二资源库。
所述步骤S5包括以下分步骤:
S51、随机提取一项第二资源库中的个人信息,在国家标准规范数据库提取 对其单项身份信息,得到若干单项身份信息;
S52、将若干单项身份信息进行字段对齐,消除单项身份信息的隐藏字段;
S53、遍历提取的个人信息中的所有身份信息,得到个人信息清洗结果;
S54、遍历第二资源库中所有的个人信息,得到第二资源库的数据清洗结果;
S55、以个人身份证信息作为数据节点,并以三元组的方式,将其相关信息 进行组合,得到若干组合信息;
S56、将组合信息进行关联,得到个人信息的知识图谱,遍历第二资源库中 所有的个人信息,得到第二资源库中所有个人信息的知识图谱,完成数据关联。
所述步骤S7中评估维度包括数据来源可信度、数据时效性和数据支持度。
所述数据来源可信度的获取方法为:设置数据可信度参考值为a和参考值 出现范围为[b,c],获取参考值在所有数据来源中出现的次数为d,得到数据来源 可信度C为:
所述数据时效性的获取方法为:设置数据更新周期叠加值为e,根据更新周 期叠加值获取数据时效性S为:
S=C×e×p
其中,p为周期值;
所述数据支持度的获取方法为:设置若干数据出现次数范围,并且每个范 围设置一个对应的叠加基数,采集数据出现次数为f,获取数据支持度H为:
H=gfC×100%
其中,gf表示数据出现次数f所在数据出现次数范围对应的叠加基数。
在本实施例中,C为负数时,则数据来源不可信,其数据不具备时效性和支 持度。
所述步骤S7中选择评估维度,获取检索数据的综合可信度的具体方法为: 若选择数据维度为数据来源可信度,则综合可信度为数据来源可信度值;若选 择数据维度为数据来源可信度和数据时效性,则综合可信度为数据时效性值; 若选择数据维度为数据来源可信度和数据支持度,则综合可信度为数据支持度;若选择数据维度为数据来源可信度、数据时效性和数据支持度,则综合可信度 为gf*S。
本发明的有益效果为:
(1)本发明采用自织网模型对实战业务关注的人、事、地、物、组织进行 智能化关联,形成知识网,改变传统的底层数据组织方式,打破传统门户式的 分库检索模式,提供多路径关联检索模式,高效服务实战。
(2)本发明提供了数据来源可信度、时效性、支持度三个维度对数据的真 实性、有效性、融合关联的正确性自动进行评估,可以根据数据项的特点,灵 活选择和评估维度进行数据评估。
(3)本发明在数据关联融合的基础上,可根据业务需求实现了数据的深度 应用。
Claims (7)
1.一种用于公安领域数据鉴真系统的数据鉴真方法,其中,数据鉴真系统包括资源目录模块、标准库模块、数据采集模块、数据管理模块和数据鉴真模块;
所述资源目录模块用于建立统一的资源目录,并为数据管理模块和数据鉴真模块提供数据支持;
所述标准库模块用于对系统数据元进行统一标准建设以及数据映射管理,并为数据采集模块提供支持;
所述数据采集模块用于将离散数据的采集且导入资源目录模块,将导入的离散数据进行数据映射并为数据管理模块提供数据支持;
所述数据管理模块用于数据的检索、修改和清洗,并提供知识图谱分析功能,其并为数据鉴真模块提供数据支持;
所述数据鉴真模块用于数据管理模块传递的数据进行鉴真;
所述资源目录包括资源所属类别、资源代码、资源名称、资源摘要、资源所含字段以及资源信息源;
其特征在于,所述数据鉴真方法包括以下步骤:
S1、使用资源目录模块创建资源所属类别,并依次录入资源代码、资源名称、资源摘要、资源所含字段以及资源信息源,完成资源录入;
S2、对录入资源进行必填项验证,将验证通过的资源进行存储,完成资源入库;
S3、通过标准库模块设置入库资源的映射字段,建立入库资源与国家标准规范数据库中数据元的映射关系,得到第一资源库;
S4、通过数据采集模块录入离散数据,选择离散数据的资源目录,且建立离散数据与国家标准规范数据库中数据元的映射关系,得到第二资源库;
S5、通过数据管理模块对第二资源库中的数据进行清洗,并以个人身份证信息作为数据节点关联对应的所有数据;
S6、将待检索关键词输入数据管理模块,对关联数据后的第二资源库中的数据进行检索,得到待检索关键词对应的检索数据;
S7、将检索数据传输至数据鉴真模块,选择评估维度,获取检索数据的综合可信度,完成数据鉴真;
所述步骤S4中若选择离散数据导入方式为新增数据,则步骤S4包括以下分步骤:
S41、构建新增离散数据的模板,并将离散数据录入模板,得到新增离散数据;
S42、通过数据采集模块输入新增离散数据的数据表名称以及数据来源,得到离散数据表;
S43、在离散数据表中选取待入库的字段,并匹配选择字段所属的资源类别,得到新增入库字段;
S44、建立新增入库字段与国家标准规范数据库中数据元的映射关系,将新增入库字段入库至第一资源库,得到第二资源库;
所述步骤S4中若选择离散数据导入方式为补充数据,则步骤S4具体为:选择待补充数据的离散数据表,将补充数据录入离散数据表,在离散数据表中选取待入库的字段,并匹配选择字段所属的资源类别,得到新增入库字段,建立新增入库字段与国家标准规范数据库中数据元的映射关系,将新增入库字段入库至第一资源库,得到第二资源库。
2.根据权利要求1所述的数据鉴真方法,其特征在于,所述步骤S2中必填项验证包括身份证号、手机号、车牌、银行卡、车牌、社保号码、姓名、地名、行政单位、邮箱和邮编。
3.根据权利要求1所述的数据鉴真方法,其特征在于,所述步骤S3包括以下分步骤:
S31、通过标准库模块选择待映射字段的所属数据元集,设置入库资源的映射字段;
S32、在国家标准规范数据库依次选择与映射字段对应的字段,形成对应关系,建立入库资源与国家标准规范数据库中数据元的映射关系,得到第一资源库。
4.根据权利要求1所述的数据鉴真方法,其特征在于,所述步骤S5包括以下分步骤:
S51、随机提取一项第二资源库中的个人信息,在国家标准规范数据库提取对其单项身份信息,得到若干单项身份信息;
S52、将若干单项身份信息进行字段对齐,消除单项身份信息的隐藏字段;
S53、遍历提取的个人信息中的所有身份信息,得到个人信息清洗结果;
S54、遍历第二资源库中所有的个人信息,得到第二资源库的数据清洗结果;
S55、以个人身份证信息作为数据节点,并以三元组的方式,将其相关信息进行组合,得到若干组合信息;
S56、将组合信息进行关联,得到个人信息的知识图谱,遍历第二资源库中所有的个人信息,得到第二资源库中所有个人信息的知识图谱,完成数据关联。
5.根据权利要求1所述的数据鉴真方法,其特征在于,所述步骤S7中评估维度包括数据来源可信度、数据时效性和数据支持度。
6.根据权利要求5所述的数据鉴真方法,其特征在于,所述数据来源可信度的获取方法为:设置数据可信度参考值为a和参考值出现范围为[b,c],获取参考值在所有数据来源中出现的次数为d,得到数据来源可信度C为:
;
所述数据时效性的获取方法为:设置数据更新周期叠加值为e,根据更新周期叠加值获取数据时效性S为:
其中,p为周期值;
所述数据支持度的获取方法为:设置若干数据出现次数范围,并且每个范围设置一个对应的叠加基数,采集数据出现次数为f,获取数据支持度H为:
其中,表示数据出现次数f所在数据出现次数范围对应的叠加基数。
7.根据权利要求6所述的数据鉴真方法,其特征在于,所述步骤S7中选择评估维度,获取检索数据的综合可信度的具体方法为:若选择数据维度为数据来源可信度,则综合可信度为数据来源可信度值;若选择数据维度为数据来源可信度和数据时效性,则综合可信度为数据时效性值;若选择数据维度为数据来源可信度和数据支持度,则综合可信度为数据支持度;若选择数据维度为数据来源可信度、数据时效性和数据支持度,则综合可信度为*/>。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010928192.8A CN112084293B (zh) | 2020-09-07 | 2020-09-07 | 用于公安领域的数据鉴真系统及数据鉴真方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010928192.8A CN112084293B (zh) | 2020-09-07 | 2020-09-07 | 用于公安领域的数据鉴真系统及数据鉴真方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112084293A CN112084293A (zh) | 2020-12-15 |
CN112084293B true CN112084293B (zh) | 2023-12-08 |
Family
ID=73731532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010928192.8A Active CN112084293B (zh) | 2020-09-07 | 2020-09-07 | 用于公安领域的数据鉴真系统及数据鉴真方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112084293B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113472761B (zh) * | 2021-06-22 | 2023-04-18 | 杭州默安科技有限公司 | 一种网站欺骗方法和系统 |
CN117235200B (zh) * | 2023-09-12 | 2024-05-10 | 杭州湘云信息技术有限公司 | 基于ai技术的数据集成方法、装置、计算机设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103100A (zh) * | 2017-06-10 | 2017-08-29 | 海南大学 | 一种投入驱动的容错的基于数据图谱、信息图谱和知识图谱架构的智能语义搜索方法 |
CN108766509A (zh) * | 2018-05-16 | 2018-11-06 | 中国联合网络通信集团有限公司 | 基于区块链技术的鉴真方法、装置、终端及存储介质 |
JP2019003421A (ja) * | 2017-06-15 | 2019-01-10 | テンソル・コンサルティング株式会社 | 本人確認書類の真偽判定システム、方法およびプログラム |
CN110781236A (zh) * | 2019-10-29 | 2020-02-11 | 山西云时代技术有限公司 | 一种构建政务大数据治理体系的方法 |
CN111143653A (zh) * | 2019-12-27 | 2020-05-12 | 上海汽笛生网络科技有限公司 | 海量科普资源的可信度验证方法 |
CN111190881A (zh) * | 2019-11-13 | 2020-05-22 | 深圳市华傲数据技术有限公司 | 一种数据治理方法和系统 |
CN111192176A (zh) * | 2019-12-30 | 2020-05-22 | 华中师范大学 | 一种支持教育信息化评估的在线数据采集方法及装置 |
CN111680153A (zh) * | 2019-12-17 | 2020-09-18 | 北京嘉遁数据科技有限公司 | 一种基于知识图谱的大数据鉴真方法与系统 |
-
2020
- 2020-09-07 CN CN202010928192.8A patent/CN112084293B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103100A (zh) * | 2017-06-10 | 2017-08-29 | 海南大学 | 一种投入驱动的容错的基于数据图谱、信息图谱和知识图谱架构的智能语义搜索方法 |
JP2019003421A (ja) * | 2017-06-15 | 2019-01-10 | テンソル・コンサルティング株式会社 | 本人確認書類の真偽判定システム、方法およびプログラム |
CN108766509A (zh) * | 2018-05-16 | 2018-11-06 | 中国联合网络通信集团有限公司 | 基于区块链技术的鉴真方法、装置、终端及存储介质 |
CN110781236A (zh) * | 2019-10-29 | 2020-02-11 | 山西云时代技术有限公司 | 一种构建政务大数据治理体系的方法 |
CN111190881A (zh) * | 2019-11-13 | 2020-05-22 | 深圳市华傲数据技术有限公司 | 一种数据治理方法和系统 |
CN111680153A (zh) * | 2019-12-17 | 2020-09-18 | 北京嘉遁数据科技有限公司 | 一种基于知识图谱的大数据鉴真方法与系统 |
CN111143653A (zh) * | 2019-12-27 | 2020-05-12 | 上海汽笛生网络科技有限公司 | 海量科普资源的可信度验证方法 |
CN111192176A (zh) * | 2019-12-30 | 2020-05-22 | 华中师范大学 | 一种支持教育信息化评估的在线数据采集方法及装置 |
Non-Patent Citations (2)
Title |
---|
刑事诉讼中电子数据的应用;罗璇;;信息系统工程(第08期);全文 * |
电子数据的鉴真问题;谢登科;《国家检查官学院学报》;第25卷(第5期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112084293A (zh) | 2020-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110688495B (zh) | 一种事件信息的知识图谱模型构建方法、装置、存储介质 | |
CN110414987B (zh) | 账户集合的识别方法、装置和计算机系统 | |
CN109189782A (zh) | 一种区块链商品交易查询中的索引方法 | |
CN102110170B (zh) | 一种具有信息发布和搜索功能的系统及信息发布方法 | |
CN106651603A (zh) | 基于位置服务的风险评估方法及装置 | |
CN112084293B (zh) | 用于公安领域的数据鉴真系统及数据鉴真方法 | |
CN106897285B (zh) | 数据要素抽取分析系统及数据要素抽取分析方法 | |
CN111930868A (zh) | 一种基于多维数据采集的大数据行为轨迹分析方法 | |
CN111198969A (zh) | 一种基于网络大数据的经济信息咨询系统和方法 | |
CN111966866A (zh) | 一种数据资产管理的方法和装置 | |
CN112632405A (zh) | 一种推荐方法、装置、设备及存储介质 | |
CN111259167B (zh) | 用户请求风险识别方法及装置 | |
CN113641827A (zh) | 一种基于知识图谱的网络诈骗识别方法及系统 | |
Manley et al. | New forms of data for understanding urban activity in developing countries | |
Ramkumar et al. | A survey on mining multiple data sources | |
CN113268649A (zh) | 基于多元化数据融合的线索监测方法及系统 | |
CN112925899B (zh) | 排序模型建立方法、案件线索推荐方法、装置及介质 | |
CN109284978A (zh) | 一种精准识别贫困户的系统及识别方法 | |
CN110704698B (zh) | 一种非结构化海量网络安全数据的关联及查询方法 | |
CN108804672A (zh) | 一种不动产信息管理方法及装置 | |
CN116028467A (zh) | 智能服务大数据建模方法、系统、存储介质及计算机设备 | |
CN112069392B (zh) | 涉网犯罪防控方法、装置、计算机设备及存储介质 | |
CN111414364B (zh) | 用户信息生成方法、装置、电子设备 | |
CN110019237A (zh) | 一种基于地图分析罪犯行踪的系统及方法 | |
CN113568888A (zh) | 索引推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |