CN107633085B - 基于数据驱动的研判分析方法、装置、终端和存储介质 - Google Patents

基于数据驱动的研判分析方法、装置、终端和存储介质 Download PDF

Info

Publication number
CN107633085B
CN107633085B CN201710894179.3A CN201710894179A CN107633085B CN 107633085 B CN107633085 B CN 107633085B CN 201710894179 A CN201710894179 A CN 201710894179A CN 107633085 B CN107633085 B CN 107633085B
Authority
CN
China
Prior art keywords
data
analysis
data object
generating
clue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710894179.3A
Other languages
English (en)
Other versions
CN107633085A (zh
Inventor
江汉祥
林文楷
陈云
曾超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meiya Pico Information Co Ltd
Original Assignee
Xiamen Meiya Pico Information Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meiya Pico Information Co Ltd filed Critical Xiamen Meiya Pico Information Co Ltd
Priority to CN201710894179.3A priority Critical patent/CN107633085B/zh
Publication of CN107633085A publication Critical patent/CN107633085A/zh
Application granted granted Critical
Publication of CN107633085B publication Critical patent/CN107633085B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于数据驱动的研判分析方法和装置,所述方法可包括以下步骤:S1.输入数据源,生成数据对象,具体过程为:选择需要输入的数据源,以人员线索数据、身份线索数据和行为线索数据三个类别来进行数据输入,生成包含数据类别、数据量、归属人和生成时间属性的数据对象,并赋予数据对象对应的分析方法;S2.调用数据对象对应的分析方法,产生分析结果;S3.判断分析结果是否表明研判成功,若是,则转至步骤S6,否则转至S4;S4.判断是否需要进一步利用该分析结果,若是,则生成新的数据对象,转至步骤S5;否则表明分析失败,转至步骤S6;S5.重复S2‑S4,直到整个分析过程结束;S6.记录步骤S2‑S5的整个分析过程,形成分析树。

Description

基于数据驱动的研判分析方法、装置、终端和存储介质
技术领域
本发明涉及一种基于数据驱动的研判分析方法、装置、终端设备和存储介质。
背景技术
随着数据的爆发,特别是电子取证数据、通讯数据、网络日志数据、视频数据等等已经不再是原先的行业固守数据,当前已经可以通过很多渠道来获取。面对一个案发现场或一个特定对象时,会有大量不同类型的数据。如何有效、便捷、一站式地分析这些数据,得到有价值的线索,是一个急需解决的问题。当前各种应用系统中都有数据分析功能,但是都存在数据源单一,功能独立,功能间数据隔离,分析过程无法重现等等无法满足实战需求的问题。
目前,市场上现有的同类分析工具,主要包括基于关系人的共同联系人分析,互相联系人分析,团伙分析;基于轨迹的同行人员分析,伴随分析;以及基于个人生活行为规律的频率分析、常住地分析等,这些技术无法满足现实斗争中复杂的分析需求,因为其包含以下不足:
1、现有分析方法都是功能驱动式的分析应用,都是为某个功能点而设计,现实中分析方法一般是很复杂的,不会仅仅使用一个分析方法就能解决问题,而是往往会使用到多个分析方法,方法之间数据结果互通互用。
2、现有分析方法一般是针对单一应用数据,不适用于当前多维度数据的全面综合分析。
3、现在的分析方法没有完整、有效、科学地记录分析过程,无法再现分析过程,更无法为人工智能提供训练样本。
发明内容
针对以上问题,本发明提出了一种基于数据驱动的研判分析方法和装置,主要针对司法数据分析中经常面对的数据,开展以数据源为驱动,功能为数据源服务的分析理念,致力于满足用户一站式分析数据需求。为此,本发明采用的具体技术方案如下:
一种基于数据驱动的研判分析方法,其特征在于,包括以下步骤:
S1.输入数据源,生成数据对象,具体过程为:选择需要输入的数据源,以人员线索数据、身份线索数据和行为线索数据三个类别来进行数据输入,生成包含数据类别、数据量、归属人和生成时间属性的数据对象,并赋予数据对象对应的分析方法;
S2.调用数据对象对应的分析方法,产生分析结果;
S3.判断分析结果是否表明研判成功,若是,则转至步骤S6,否则转至S4;
S4.判断是否需要进一步利用该分析结果,若是,则生成新的数据对象,转至步骤S5;否则表明分析失败,转至步骤S6;
S5.重复S2-S4,直到整个分析过程结束;
S6.记录步骤S2-S5的整个分析过程,形成分析树。
进一步的,所述分析方法包括逻辑运算方法、深度优先遍历算法、广度优先遍历算法、Girvan-Newman算法和PeopleRank算法。
进一步的,所述逻辑运算方法包括交集运算、并集运算和补集运算。
此外,本发明还提供了一种基于数据驱动的研判分析装置,可包括:
数据源输入及数据对象生成模块,用于执行输入数据源和生成数据对象,具体过程为:选择需要输入的数据源,以人员线索数据、身份线索数据和行为线索数据三个类别来进行数据输入,生成包含数据类别、数据量、归属人和生成时间属性的数据对象,并赋予数据对象对应的分析方法;
分析模块,用于调用数据对象对应的分析方法,产生分析结果;
分析结果研判模块,用于判断分析结果是否成功并根据判断结果进行相应处理;
分析结果生成数据对象模块,用于将失败的分析结果生成新的数据对象,以进行进一步分析;
分析树生成模块,用于记录整个分析过程,形成分析树。
此外,本发明还提供了一种基于数据驱动的研判分析终端设备,可包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上所述的方法的步骤S1-S6。
此外,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上所述的方法的步骤S1-S6。
本发明采用上述技术方案,具有的有益效果是,本发明以数据源为驱动,只有用户选择数据源时才展现出对应的分析方法。本发明不仅可以使用来自系统本身收集的各种数据,以及这些数据的分类查询结果,同时也接纳各种导入数据,而且分析结果也能生成新的数据对象,以便循环使用数据。本发明展现在用户面前的是一系列的数据对象,而不是常规的分析功能。这十分有利改善用户体验,因为数据是用户自己导入的,很清楚数据的属性;而功能是软件设计的,用户有时会不理解功能的用途、设计目的以及其所接纳的数据。本发明还会记录用户的整个分析过程,形成分析树,同时会记录下分析过程的各种条件、参数以及分析结果,以便后继进行分析过程的人工智能训练,为下一步的机器学习和智能分析打好铺垫。
附图说明
图1是本发明实施例的基于数据驱动的研判分析方法的流程图;
图2是本发明实施例的基于数据驱动的研判分析装置的原理图;
图3示出了本发明实施例的基于数据驱动的研判分析方法形成的分析树的示意图;
图4示出了本发明实施例的基于数据驱动的研判分析方法的分析界面。
具体实施方式
为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
现结合附图和具体实施方式对本发明进一步说明。
如图1所示,一种基于数据驱动的研判分析方法,可包括以下步骤:
S1.输入数据源,生成数据对象,具体过程为:选择需要输入的数据源,以人员线索数据、身份线索数据和行为线索数据三个类别来进行数据输入,生成包含数据类别、数据量、归属人和生成时间属性的数据对象,并赋予数据对象对应的分析方法;
S2.调用数据对象对应的分析方法,产生分析结果;
S3.判断分析结果是否表明研判成功,若是,则转至步骤S6,否则转至S4;
S4.判断是否需要进一步利用该分析结果,若是,则生成新的数据对象,转至步骤S5;否则表明分析失败,转至步骤S6;
S5.重复S2-S4,直到整个分析过程结束;
S6.记录步骤S2-S5的整个分析过程,形成分析树。
对于不同的数据有不同的分析方法,但有也一些共性的分析方法,比如:
(1)交集运算(∩);
(2)并集运算(∪);
(3)补集运算(
Figure BDA0001421816390000051
u,u为全集);
(4)互相通联关系;
(5)好友关系。
对于单个外部数据源,能够与系统本身拥有的数据进行关联运算,比如:
(1)与系统中特定数据集交集的数据集;
(2)与系统中特定数据集互通的数据集;
(3)与系统中特定数据集好友的数据集;
(4)与系统中特定数据集账户交易的数据集。
在分析过程,涉及使用到以下分析算法:
(1)图的遍历:对于关系的分析,比如涉案好友、中间人分析等,采用图的遍历算法,包括深度优先遍历和广度优先遍历。
(2)社群发现:人员之间通过手机、虚拟账号等相互通联,构成一个庞大的关系网,可以通过基于标签传播、K-MEANS聚类、通联密度的Girvan-Newman算法识别出其中的社群,进一步挖掘潜在的团伙。
(3)人员权重:在社交关系网络中,通过PeopleRank的算法结合人员之间的通联次数,计算出指定圈子中每个人员的权重,识别出关键人物。
数据对象拥有相应的属性,并能根据主要的属性来排序对象,类同于重新布局棋盘。
属性名称 属性描述 备注
Object_Type 数据类型 可排序
Object_Owner 归属人 可排序
Object_CreatTime 创建时间 可排序
Object_UpdateTime 更新时间 可排序
Data_BeginTime 数据开始时间 只针对包含时间属性的数据
Data_EndTime 数据结束时间 只针对包含时间属性的数据
Data_Count 数据量
IsResultData 是否为结果数据
InputFilename 原始文件名称 只针对外部输入数据
Relate_Method 关联的分析方法
TableName 对应表名
当一个数据对象时,对应的分析方法就是Relate_Method中所关联的所有分析方法。当多个数据对象时,对应的分析方法就是多个对象的Relate_Method可分析方法的交集。
如图3所示,分析树的主要节点就是数据对象,包含外部数据对象和分析结果数据对象。节点之间的连线就是分析方法。分析结果可以来自多个数据对象,也可以来自一个数据对象。当一个分析结果经过研判都不是目标线索时,分析支线失败。此时需要进一步对数据对象进行分析,一般还会导入新的数据对象以开展新的分析支线。直到分析结果经过研判为分析线索时,分析成功,整个分析过程也就结束。
整个分析过程在一个窗口完成,窗口如同一个棋盘,展现的是棋子(数据),选择棋子(数据)会出现分析方法,右侧会记录分析过程,并展现分析树,如图4所示。
如图2所示,本发明还提供了一种基于数据驱动的研判分析装置100,可包括:
数据源输入及数据对象生成模块110,用于执行输入数据源和生成数据对象,具体过程为:选择需要输入的数据源,以人员线索数据、身份线索数据和行为线索数据三个类别来进行数据输入,生成包含数据类别、数据量、归属人和生成时间属性的数据对象,并赋予数据对象对应的分析方法;
分析模块120,用于调用数据对象对应的分析方法,产生分析结果;
分析结果研判模块130,用于判断分析结果是否成功并根据判断结果进行相应处理;
分析结果生成数据对象模块140,用于将失败的分析结果生成新的数据对象,以进行进一步分析;
分析树生成模块150,用于记录整个分析过程,形成分析树。
此外,本发明还提供了一种基于数据驱动的研判分析终端设备,可包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述方法实施例中的步骤,例如图1所示的步骤S1-S6等方法步骤。或者,所述处理器执行所述计算机程序时实现上述装置实施例中各模块/单元的功能,例如实现上述数据源输入及数据对象生成模块110、分析模块120、分析结果研判模块130、分析结果生成数据对象模块140和分析树生成模块150等模块的功能。
示例性地,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述研判分析终端设备中的执行过程。例如,所述计算机程序可以被分割成数据源输入及数据对象生成模块110、分析模块120、分析结果研判模块130、分析结果生成数据对象模块140和分析树生成模块150等模块。
基于数据驱动的研判分析终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。基于数据驱动的研判分析终端设备可包括但不仅限于,处理器、存储器。例如其还可以包括输入输出设备、网络接入设备、总线等。
处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于数据驱动的研判分析终端设备的控制中心,利用各种接口和线路连接整个基于数据驱动的研判分析装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于数据驱动的研判分析装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
所述基于数据驱动的研判分析装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本发明对比现有技术,具有以下特点:
1)分析的驱动方式不同,本发明以数据源为驱动,区别于其它分析方法以功能为驱动的方式;
2)分析方法的展现方式不同,本发明只有用户选择数据源时才展现出对应的分析方法。其它方法都是事先展现给用户很多具体的分析方法,用户得选择某个分析方法后再进行数据应用。
3)分析的数据范围不同,本发明不仅可以使用来自系统本身收集的各种数据,以及这些数据的分类查询结果,同时也接纳各种导入数据,而且分析结果能形成新的数据源,以便循环使用数据;
4)分析的过程不同,本发明会记录用户的整个分析过程,形成分析树,同时会记录下分析过程的各种条件、参数以及分析结果,以便后继进行分析过程的人工智能训练,为下一步的机器学习和智能分析打好铺垫。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。

Claims (6)

1.一种基于数据驱动的研判分析方法,其特征在于,包括以下步骤:
S1.输入数据源,生成数据对象,具体过程为:选择需要输入的数据源,以人员线索数据、身份线索数据和行为线索数据三个类别来进行数据输入,生成包含数据类别、数据量、归属人和生成时间属性的数据对象,并赋予数据对象对应的分析方法;
S2.调用数据对象对应的分析方法,产生分析结果;
S3.判断分析结果是否表明研判成功,若是,则转至步骤S6,否则转至S4;
S4.判断是否需要进一步利用该分析结果,若是,则生成新的数据对象,转至步骤S5;否则表明分析失败,转至步骤S6;
S5.重复S2-S4,直到整个分析过程结束;
S6.记录步骤S2-S5的整个分析过程,形成分析树。
2.如权利要求1所述的基于数据驱动的研判分析方法,其特征在于,所述分析方法包括逻辑运算方法、深度优先遍历算法、广度优先遍历算法、Girvan-Newman算法和PeopleRank算法。
3.如权利要求2所述的基于数据驱动的研判分析方法,其特征在于,所述逻辑运算方法包括交集运算、并集运算和补集运算。
4.一种基于数据驱动的研判分析装置,其特征在于,包括:
数据源输入及数据对象生成模块,用于执行输入数据源和生成数据对象,具体过程为:选择需要输入的数据源,以人员线索数据、身份线索数据和行为线索数据三个类别来进行数据输入,生成包含数据类别、数据量、归属人和生成时间属性的数据对象,并赋予数据对象对应的分析方法;
分析模块,用于调用数据对象对应的分析方法,产生分析结果;
分析结果研判模块,用于判断分析结果是否成功并根据判断结果进行相应处理;
分析结果生成数据对象模块,用于将失败的分析结果生成新的数据对象,以进行进一步分析;
分析树生成模块,用于记录整个分析过程,形成分析树。
5.一种基于数据驱动的研判分析终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1所述的方法的步骤。
6.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1所述的方法的步骤。
CN201710894179.3A 2017-09-28 2017-09-28 基于数据驱动的研判分析方法、装置、终端和存储介质 Active CN107633085B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710894179.3A CN107633085B (zh) 2017-09-28 2017-09-28 基于数据驱动的研判分析方法、装置、终端和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710894179.3A CN107633085B (zh) 2017-09-28 2017-09-28 基于数据驱动的研判分析方法、装置、终端和存储介质

Publications (2)

Publication Number Publication Date
CN107633085A CN107633085A (zh) 2018-01-26
CN107633085B true CN107633085B (zh) 2020-06-19

Family

ID=61102737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710894179.3A Active CN107633085B (zh) 2017-09-28 2017-09-28 基于数据驱动的研判分析方法、装置、终端和存储介质

Country Status (1)

Country Link
CN (1) CN107633085B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366228A (zh) * 2012-03-26 2013-10-23 英顺源(重庆)科技有限公司 用于网络数据管理的数据分析系统及其方法
CN104516954A (zh) * 2014-12-15 2015-04-15 公安部第一研究所 一种可视化取证分析系统
CN106254525A (zh) * 2016-09-12 2016-12-21 中国银联股份有限公司 一种信息推送方法和系统
CN107016044A (zh) * 2017-02-17 2017-08-04 阿里巴巴集团控股有限公司 一种数据可视化处理的方法及装置
CN107169228A (zh) * 2017-06-09 2017-09-15 深圳市斯维尔科技股份有限公司 Bim模型数据交换方法、装置、终端及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366228A (zh) * 2012-03-26 2013-10-23 英顺源(重庆)科技有限公司 用于网络数据管理的数据分析系统及其方法
CN104516954A (zh) * 2014-12-15 2015-04-15 公安部第一研究所 一种可视化取证分析系统
CN106254525A (zh) * 2016-09-12 2016-12-21 中国银联股份有限公司 一种信息推送方法和系统
CN107016044A (zh) * 2017-02-17 2017-08-04 阿里巴巴集团控股有限公司 一种数据可视化处理的方法及装置
CN107169228A (zh) * 2017-06-09 2017-09-15 深圳市斯维尔科技股份有限公司 Bim模型数据交换方法、装置、终端及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
案件管理和案件线索分析系统研究;高志雄;《https://www.docin.com/p-1332842998.html》;20151024;第1-14页 *

Also Published As

Publication number Publication date
CN107633085A (zh) 2018-01-26

Similar Documents

Publication Publication Date Title
CN103428165B (zh) 社交网络节点分组方法和装置
CN110569377A (zh) 一种媒体文件的处理方法和装置
CN108519998B (zh) 基于知识图谱的问题引导方法及装置
WO2015030214A1 (ja) 情報処理装置、情報処理方法およびプログラム
CN107729492A (zh) 一种习题的推送方法、系统及终端设备
CN107644106B (zh) 自动挖掘业务中间人的方法、终端设备及存储介质
CN116522403B (zh) 聚焦大数据隐私安全的互动信息脱敏方法及服务器
CN109784365A (zh) 一种特征选择方法、终端、可读介质及计算机程序
Huang Discovery of time-inconsecutive co-movement patterns of foreign currencies using an evolutionary biclustering method
CN109191167A (zh) 一种目标用户的挖掘方法和装置
CN113254491A (zh) 一种信息推荐的方法、装置、计算机设备及存储介质
CN109885651A (zh) 一种问题推送方法和装置
CN108629047A (zh) 一种歌曲清单生成方法及终端设备
CN108711031B (zh) 一种智能终端电子证据库管理训练系统及方法
CN113573128B (zh) 一种音频处理方法、装置、终端以及存储介质
CN114461705A (zh) 数据可视化生成方法、装置、电子设备及存储介质
CN111275683B (zh) 图像质量评分处理方法、系统、设备及介质
CN107633085B (zh) 基于数据驱动的研判分析方法、装置、终端和存储介质
CN111429200B (zh) 一种内容关联方法及装置、存储介质、计算机设备
CN110874609B (zh) 基于用户行为的用户聚类方法、存储介质、设备及系统
CN114398883B (zh) 演示文稿生成方法、装置、计算机可读存储介质及服务器
Oliver et al. Scalable hypergraph visualization
CN114861029A (zh) 舆情塑造过程分析方法、装置、电子设备以及存储介质
CN116484067A (zh) 目标对象匹配方法、装置及计算机设备
WO2021072776A1 (zh) 数据合并方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant