CN110457533A - 一种情报数据模型分析方法 - Google Patents

一种情报数据模型分析方法 Download PDF

Info

Publication number
CN110457533A
CN110457533A CN201910674273.7A CN201910674273A CN110457533A CN 110457533 A CN110457533 A CN 110457533A CN 201910674273 A CN201910674273 A CN 201910674273A CN 110457533 A CN110457533 A CN 110457533A
Authority
CN
China
Prior art keywords
analysis
data
model
memory
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910674273.7A
Other languages
English (en)
Inventor
王广峰
王国俊
吴东贤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan Kaihe Software Technology Co Ltd
Original Assignee
Henan Kaihe Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan Kaihe Software Technology Co Ltd filed Critical Henan Kaihe Software Technology Co Ltd
Priority to CN201910674273.7A priority Critical patent/CN110457533A/zh
Publication of CN110457533A publication Critical patent/CN110457533A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种情报数据模型分析方法,属于数据处理技术领域,包括以下步骤:根据案件相关基本信息生成对应的分析场景和分析结果,选择目标分析结果,生成目标分析任务列表后;使用数据库查询器获取待分析数据,对获取到的数据进行预处理生成中间数据和建立查询模型,并保存到内存中;再根据分析任务列表逐个从算法库中读取对应的分析模型,调用分析执行模块依据分析模型的策略树对已引用的内存中的数据进行分析生成数据特征,保存并展示在图形界面上。本发明解决了现有办案过程中对银行账单、话单、行踪、税票等情报数据的信息分析存在多轮分析、数据偏差、工作重复,导致办案人员的时间消耗较大和工作量较大的问题。

Description

一种情报数据模型分析方法
技术领域
本发明属于数据处理技术领域,涉及一种情报数据模型分析方法。
背景技术
目前,公安机关、检察机关、纪委等部门调取的银行账单、话单、行踪、税票等信息数据量巨大,往往可达到千万条数据量级。在分析过程中办案人员将数据分割为多组,人工分配,借助各类文件编辑器,如Excel,逐一比对,依据数据特征寻找目标数据,形成分组分析结论后再对各类数据特征进行汇总,因此需要对原始数据进行多轮分析;且在分组分析时,经常发生数据不当分割导致关键特征数据分析出现偏差,合并多组分析数据量过大不得不进行二次分组的现象,多轮人工分析消耗办案人员大量时间精力,如进行话单分析时,对嫌疑人话单的通话时间、时长、特征位置进行逐个分析,与多人话单关系综合分析的工作存在大量重复,与此同时由于话单中的坐标信息无法直观表示,办案人员不得不手工绘制各类分析报表,给办案人员的信息特征分析工作造成了很大困难。
因此,针对上述问题,本发明提出了一种情报数据模型分析方法。
发明内容
本发明的目的在于:提供了一种情报数据模型分析方法,解决了现有办案过程中对银行账单、话单、行踪、税票等情报数据的信息分析存在多轮分析、数据偏差、工作重复,导致办案人员的时间消耗较大和工作量较大的问题。
本发明采用的技术方案如下:
一种情报数据模型分析方法,包括以下步骤:
输入案件相关基本信息;
依据输入的信息生成对应的分析场景,并根据分析场景获取对应的分析结果,选择目标分析结果,生成目标分析任务列表后,逐条传递给任务列表持久化数据库;
根据分析任务列表中的数据范围,使用数据库查询器获取待分析数据,对获取到的数据进行预处理生成中间数据和建立查询模型,并保存到内存中;
根据分析任务列表逐个从算法库中读取对应的分析模型,并引用内存中的数据,调用分析执行模块依据分析模型的策略树对已引用数据进行分析生成数据特征,并保存在内存中;
读取内存中的数据特征,并展示在图形界面上。
进一步地,还包括:
分析结束后,初始化分析过程中的计数值,并提示用户继续下一阶段的分析。
更进一步地,所述计数值包括:在执行数据从数据库调取时,记录的调取数据条数值;在执行分析时记录的已分析数据条数值;分析任务算力,即计算机执行指令数乘以本次任务耗时;分析得到的涉及团伙和集群人员数值;其中,当已分析数据条数值与调取数据条数值对应时,表示分析结束。
进一步地,所述输入案件相关基本信息还包括:在分析窗口输入案件相关基本信息后,使用语义识别技术对输入信息进行解析,若解析结果存在信息遗漏或错误,则弹出警告提示用户重新输入,若正确,进行下一步骤,所述案件相关基本信息包括案件所属犯罪类型、涉案人数、是否专案和是否涉众犯罪。
进一步地,所述依据输入的信息生成对应的分析场景中所述的分析场景包括:甘特图模式的单事件分析场景、轮序图模式的关联事件分析场景、一般关系模式的综合分析场景;
所述根据分析场景获取对应的分析结果,选择目标分析结果中所述的分析结果以列表的形式展示在图形化界面上,手动选择目标分析结果,所述分析结果包括人员性质信息、资金用途和来源、人员间亲密度、职务犯罪涉案人员重点家属;所述人员性质信息包括重点人员和胁从人员。
进一步地,所述对获取到的数据进行预处理生成中间数据和建立查询模型中所述的预处理包括去重、去离群数据、关联异常数据、合并关联表;所述的中间数据为进一步分析查询中需要频繁调用的数据。
更进一步地,所述对获取到的数据进行预处理生成中间数据和建立查询模型中所述的查询模型用于加速原始数据的读写,包括多叉树查询模型和哈希表查询模型,所述多叉树查询模型以索引列的值,依据平衡多叉树生成算法进行建立和维护;所述哈希表查询模型通过对图数据库中关联节点的序号和发生额,以及通话时间来建立。
进一步地,所述逐个从算法库中读取对应的分析模型中所述的算法库记录了对账单、话单、行踪、税票情报分析的各项参数值和拟合公式的表达式,目标分析任务列表传递给算法库后,从算法库中选择对应的分析模型;所述的分析模型是算法的载体,通过加载算法实现分析,是数据建模的表结构和分析结构,所述分析结构即策略树。
更进一步地,所述调用分析执行模块依据分析模型的策略树对已引用数据进行分析生成数据特征中所述的策略树是执行分析时算法库中调取的分析模型的核心部分,即各类拟合公式;所述的分析执行模块加载分析模型中的算法并执行,并根据当前数据特征进行动态调参;所述数据特征包括单笔特征、关联特征、群集特征和综合特征。
进一步地,所述读取内存中的数据特征,并展示在图形界面上中所述的图形界面上还包括导出按钮,点击导出按钮后,引导选择导出磁盘路径,在导出磁盘路径下以表格或数据库查询文件形式写入目标分析结果,然后清空内存中已开辟的存储空间,在更新界面弹出提醒,提示用户已完成数据特征分析任务。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.一种情报数据模型分析方法,通过简化的分析场景与目标结果选择界面,优化了办案过程中任务传达流程,避免了在数据分割过程中产生的数据遗漏,同时也避免了重要特征数据被分割引起的二次分组;在分析过程中使用基于算法库的分析模型,优化了多个数据特征进行多次分析的流程,极大地加速了信息特征分析的工作流程,给案件研判,可视化展示工作提供了快速、便捷的技术支持;对于已保存的案件,当数据更新时无需再次调参,可直接调用拟合模型,就能实时生成目标分析结果,办案人员无需从头开始分析。
2.本发明可根据办案人员的意图,引导其选择分析场景与目标结果,使用基于分析模型的策略树自动对账单,话单,行踪,税票数据进行特征分析,使用基于数据拟合算法和动态调参技术情报的分析模型,在分析过程中利用专题分析结果和进行专题分析的中间数据,进行综合分析,一次分析就能形成结果。
3.本发明对获取到的数据进行预处理生成中间数据和建立查询模型,所述的预处理包括去重、去离群数据、关联异常数据、合并关联表,所述的中间数据为进一步分析查询中需要频繁调用的数据,所述的查询模型用于加速原始数据的读写,本发明对标记的特殊团伙,特殊用途,特殊时间地点,重复时间地点等条件下的信息条目结合查询模型的检索算法,避免了人工筛查的数据偏差和遗漏。
4.本发明可用于执行如今愈演愈烈的跨国洗钱,地下钱庄,金融诈骗等大额高频资金流分析,基于情报数据模型的分析对可疑金融交易的识别率已经超过了一般的审计人员,可完成传统的由审计人员和金融监管人员共同组成的分析组无法完成的数据量,且能在短时间内完成分析任务。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图,其中:
图1是一种情报数据模型分析方法的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处描述和附图中示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
一种情报数据模型分析方法,解决了现有办案过程中对银行账单、话单、行踪、税票等情报数据的信息分析存在多轮分析、数据偏差、工作重复,导致办案人员的时间消耗较大和工作量较大的问题。
一种情报数据模型分析方法,包括以下步骤:
输入案件相关基本信息;
依据输入的信息生成对应的分析场景,并根据分析场景获取对应的分析结果,选择目标分析结果,生成目标分析任务列表后,逐条传递给任务列表持久化数据库;
根据分析任务列表中的数据范围,使用数据库查询器获取待分析数据,对获取到的数据进行预处理生成中间数据和建立查询模型,并保存到内存中;
根据分析任务列表逐个从算法库中读取对应的分析模型,并引用内存中的数据,调用分析执行模块依据分析模型的策略树对已引用数据进行分析生成数据特征,并保存在内存中;
读取内存中的数据特征,并展示在图形界面上。
本发明通过简化的分析场景与目标结果选择界面,优化了办案过程中任务传达流程,避免了在数据分割过程中产生的数据遗漏,同时也避免了重要特征数据被分割引起的二次分组;在分析过程中使用基于算法库的分析模型,优化了多个数据特征进行多次分析的流程,极大地加速了信息特征分析的工作流程,给案件研判,可视化展示工作提供了快速、便捷的技术支持;对于已保存的案件,当数据更新时无需再次调参,可直接调用拟合模型,就能实时生成目标分析结果,办案人员无需从头开始分析。
下面结合实施例对本发明的特征和性能作进一步的详细描述。
实施例一
本发明的较佳实施例,提供了一种情报数据模型分析终端设备,该实施例的情报数据模型分析终端设备包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如一种情报数据模型分析方法的程序,所述方法包括以下步骤:
步骤1:在分析窗口输入案件相关基本信息后,使用语义识别技术对输入信息进行解析,若解析结果存在信息遗漏或错误,则弹出警告提示用户重新输入,若正确,进行下一步骤,所述案件相关基本信息包括案件所属犯罪类型、涉案人数、是否专案和是否涉众犯罪;可根据办案人员的意图,引导其选择分析场景与目标结果,使用基于分析模型的策略树自动对账单,话单,行踪,税票数据进行特征分析,使用基于数据拟合算法和动态调参技术情报的分析模型,在分析过程中利用专题分析结果和进行专题分析的中间数据,进行综合分析,一次分析就能形成结果。
步骤2:依据输入的信息生成对应的分析场景,并根据分析场景获取对应的分析结果,选择目标分析结果,生成目标分析任务列表后,逐条传递给任务列表持久化数据库;
所述分析场景包括甘特图模式的单事件分析场景、轮序图模式的关联事件分析场景、一般关系模式的综合分析场景;所述分析结果以列表的形式展示在图形化界面上,手动选择目标分析结果,所述分析结果包括人员性质信息、资金用途和来源、人员间亲密度、职务犯罪涉案人员重点家属;所述人员性质信息包括重点人员和胁从人员。
步骤3:根据分析任务列表中的数据范围,使用数据库查询器获取待分析数据,对获取到的数据进行预处理生成中间数据和建立查询模型,并保存到内存中;
所述预处理包括去重、去离群数据、关联异常数据、合并关联表;所述中间数据为进一步分析查询中需要频繁调用的数据;比如,涉案重点人员每月互相转账累计值,标记为工资、买房、买车等大额消费的值,地理信息中多次出现的出境信息等数据;
所述查询模型用于加速原始数据读写,包括多叉树查询模型和哈希表查询模型,所述多叉树查询模型以索引列的值,依据平衡多叉树生成算法进行建立和维护;所述哈希表查询模型通过对图数据库中关联节点的序号和发生额,以及通话时间来建立,对标记的特殊团伙,特殊用途,特殊时间地点,重复时间地点等条件下的信息条目结合查询模型的检索算法,避免了人工筛查的数据偏差和遗漏。
步骤4:根据分析任务列表逐个从算法库中读取对应的分析模型,并引用内存中的数据,调用分析执行模块依据分析模型的策略树对已引用数据进行分析生成数据特征,并保存在内存中;
所述算法库记录了对账单、话单、行踪、税票情报分析的各项参数值和拟合公式的表达式,目标分析任务列表逐个传递给算法库后,从算法库中选择对应的分析模型;比如,对资金上下游追查算法中的大额金融诈骗算法,忽略流水参数为5%,同向资金不计入,不适用平账算法,资金追查最大值为发生额的10倍或20倍;所述的分析模型是算法的载体,通过加载算法实现分析,是数据建模的表结构和分析结构,所述分析结构即策略树;
所述策略树是执行分析时算法库中调取的分析模型的核心部分,即各类拟合公式;所述分析执行模块加载分析模型中的算法并执行,并根据当前数据特征进行动态调参;所述数据特征包括单笔特征、关联特征、群集特征和综合特征。
步骤5:读取内存中的数据特征,并展示在图形界面上;所述图形界面上还包括导出按钮,点击导出按钮后,引导选择导出磁盘路径,在导出磁盘路径下以表格或数据库查询文件形式写入目标分析结果,然后清空内存中已开辟的存储空间,在更新界面弹出提醒,提示用户已完成数据特征分析任务。
步骤6:分析结束后,初始化分析过程中的计数值,并提示用户继续下一阶段的分析;所述计数值包括:在执行数据从数据库调取时,记录的调取数据条数值;在执行分析时记录的已分析数据条数值;分析任务算力,即计算机执行指令数乘以本次任务耗时;分析得到的涉及团伙和集群人员数值;其中,当已分析数据条数值与调取数据条数值对应时,表示分析结束。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述情报数据模型分析终端设备中的执行过程。
所述情报数据模型分析终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述情报数据模型分析终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述情报数据模型分析终端设备可以包括更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备、总线等。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述情报数据模型分析终端设备的控制中心,利用各种接口和线路连接整个情报数据模型分析终端设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述情报数据模型分析终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明通过简化的分析场景与目标结果选择界面,优化了办案过程中任务传达流程,避免了在数据分割过程中产生的数据遗漏,同时也避免了重要特征数据被分割引起的二次分组;在分析过程中使用基于算法库的分析模型,优化了多个数据特征进行多次分析的流程,极大地加速了信息特征分析的工作流程,给案件研判,可视化展示工作提供了快速、便捷的技术支持;对于已保存的案件,当数据更新时无需再次调参,可直接调用拟合模型,就能实时生成目标分析结果,办案人员无需从头开始分析;本发明可用于执行如今愈演愈烈的跨国洗钱,地下钱庄,金融诈骗等大额高频资金流分析,基于情报数据模型的分析对可疑金融交易的识别率已经超过了一般的审计人员,可完成传统的由审计人员和金融监管人员共同组成的分析组无法完成的数据量,且能在短时间内完成分析任务。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明的保护范围,任何熟悉本领域的技术人员在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种情报数据模型分析方法,其特征在于,包括以下步骤:
输入案件相关基本信息;
依据输入的信息生成对应的分析场景,并根据分析场景获取对应的分析结果,选择目标分析结果,生成目标分析任务列表后,逐条传递给任务列表持久化数据库;
根据分析任务列表中的数据范围,使用数据库查询器获取待分析数据,对获取到的数据进行预处理生成中间数据和建立查询模型,并保存到内存中;
根据分析任务列表逐个从算法库中读取对应的分析模型,并引用内存中的数据,调用分析执行模块依据分析模型的策略树对已引用数据进行分析生成数据特征,并保存在内存中;
读取内存中的数据特征,并展示在图形界面上。
2.根据权利要求1所述的一种情报数据模型分析方法,其特征在于,还包括:
分析结束后,初始化分析过程中的计数值,并提示用户继续下一阶段的分析。
3.根据权利要求2所述的一种情报数据模型分析方法,其特征在于,所述计数值包括:在执行数据从数据库调取时,记录的调取数据条数值;在执行分析时记录的已分析数据条数值;分析任务算力,即计算机执行指令数乘以本次任务耗时;分析得到的涉及团伙和集群人员数值;其中,当已分析数据条数值与调取数据条数值对应时,表示分析结束。
4.根据权利要求1所述的一种情报数据模型分析方法,其特征在于,所述输入案件相关基本信息还包括:在分析窗口输入案件相关基本信息后,使用语义识别技术对输入信息进行解析,若解析结果存在信息遗漏或错误,则弹出警告提示用户重新输入,若正确,进行下一步骤,所述案件相关基本信息包括案件所属犯罪类型、涉案人数、是否专案和是否涉众犯罪。
5.根据权利要求1所述的一种情报数据模型分析方法,其特征在于,所述依据输入的信息生成对应的分析场景中所述的分析场景包括:甘特图模式的单事件分析场景、轮序图模式的关联事件分析场景、一般关系模式的综合分析场景;
所述根据分析场景获取对应的分析结果,选择目标分析结果中所述的分析结果以列表的形式展示在图形化界面上,手动选择目标分析结果,所述分析结果包括人员性质信息、资金用途和来源、人员间亲密度、职务犯罪涉案人员重点家属;所述人员性质信息包括重点人员和胁从人员。
6.根据权利要求1所述的一种情报数据模型分析方法,其特征在于,所述对获取到的数据进行预处理生成中间数据和建立查询模型中所述的预处理包括去重、去离群数据、关联异常数据、合并关联表;所述的中间数据为进一步分析查询中需要频繁调用的数据。
7.根据权利要求6所述的一种情报数据模型分析方法,其特征在于,所述对获取到的数据进行预处理生成中间数据和建立查询模型中所述的查询模型用于加速原始数据的读写,包括多叉树查询模型和哈希表查询模型,所述多叉树查询模型以索引列的值,依据平衡多叉树生成算法进行建立和维护;所述哈希表查询模型通过对图数据库中关联节点的序号和发生额,以及通话时间来建立。
8.根据权利要求1所述的一种情报数据模型分析方法,其特征在于,所述逐个从算法库中读取对应的分析模型中所述的算法库记录了对账单、话单、行踪、税票情报分析的各项参数值和拟合公式的表达式,目标分析任务列表传递给算法库后,从算法库中选择对应的分析模型;所述的分析模型是算法的载体,通过加载算法实现分析,是数据建模的表结构和分析结构,所述分析结构即策略树。
9.根据权利要求8所述的一种情报数据模型分析方法,其特征在于,所述调用分析执行模块依据分析模型的策略树对已引用数据进行分析生成数据特征中所述的策略树是执行分析时算法库中调取的分析模型的核心部分,即各类拟合公式;所述的分析执行模块加载分析模型中的算法并执行,并根据当前数据特征进行动态调参;所述数据特征包括单笔特征、关联特征、群集特征和综合特征。
10.根据权利要求1所述的一种情报数据模型分析方法,其特征在于,所述读取内存中的数据特征,并展示在图形界面上中所述的图形界面上还包括导出按钮,点击导出按钮后,引导选择导出磁盘路径,在导出磁盘路径下以表格或数据库查询文件形式写入目标分析结果,然后清空内存中已开辟的存储空间,在更新界面弹出提醒,提示用户已完成数据特征分析任务。
CN201910674273.7A 2019-07-25 2019-07-25 一种情报数据模型分析方法 Pending CN110457533A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910674273.7A CN110457533A (zh) 2019-07-25 2019-07-25 一种情报数据模型分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910674273.7A CN110457533A (zh) 2019-07-25 2019-07-25 一种情报数据模型分析方法

Publications (1)

Publication Number Publication Date
CN110457533A true CN110457533A (zh) 2019-11-15

Family

ID=68483382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910674273.7A Pending CN110457533A (zh) 2019-07-25 2019-07-25 一种情报数据模型分析方法

Country Status (1)

Country Link
CN (1) CN110457533A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111538733A (zh) * 2020-06-04 2020-08-14 南京金鼎嘉崎信息科技有限公司 一种多维数据综合分析系统及其分析方法
CN112632923A (zh) * 2021-01-06 2021-04-09 上海约拿计算机信息科技有限公司 一种基于多叉树的公式模型求解编辑器
CN112800127A (zh) * 2021-01-30 2021-05-14 河南信安通信技术股份有限公司 基于交易账单的数据挖掘分析方法及装置
CN112800284A (zh) * 2021-02-01 2021-05-14 北京机电工程研究所 一种基于环境模型数据库的快速查询方法
CN113610427A (zh) * 2021-08-19 2021-11-05 深圳市德信软件有限公司 事件预警指标获得方法、装置、终端设备以及存储介质
CN117714484A (zh) * 2023-11-15 2024-03-15 杭州中汇通航航空科技有限公司 一种无人机飞行报告管理平台

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923549A (zh) * 2009-07-29 2010-12-22 北京航天理想科技有限公司 自定义可视化智能轨迹线索分析系统及建立方法
US20120290940A1 (en) * 2011-05-12 2012-11-15 Google Inc. Data Model Generation Based on User Interface Specification
CN106227863A (zh) * 2016-07-29 2016-12-14 浪潮软件集团有限公司 在案件串并和嫌疑人排查中的数据挖掘方法
CN106649809A (zh) * 2016-12-29 2017-05-10 苏碧云 一种物联网分析方法
CN208477524U (zh) * 2017-12-29 2019-02-05 杭州世平信息科技有限公司 一种图形化的案件梳理系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923549A (zh) * 2009-07-29 2010-12-22 北京航天理想科技有限公司 自定义可视化智能轨迹线索分析系统及建立方法
US20120290940A1 (en) * 2011-05-12 2012-11-15 Google Inc. Data Model Generation Based on User Interface Specification
CN106227863A (zh) * 2016-07-29 2016-12-14 浪潮软件集团有限公司 在案件串并和嫌疑人排查中的数据挖掘方法
CN106649809A (zh) * 2016-12-29 2017-05-10 苏碧云 一种物联网分析方法
CN208477524U (zh) * 2017-12-29 2019-02-05 杭州世平信息科技有限公司 一种图形化的案件梳理系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111538733A (zh) * 2020-06-04 2020-08-14 南京金鼎嘉崎信息科技有限公司 一种多维数据综合分析系统及其分析方法
CN112632923A (zh) * 2021-01-06 2021-04-09 上海约拿计算机信息科技有限公司 一种基于多叉树的公式模型求解编辑器
CN112800127A (zh) * 2021-01-30 2021-05-14 河南信安通信技术股份有限公司 基于交易账单的数据挖掘分析方法及装置
CN112800127B (zh) * 2021-01-30 2024-05-28 河南信安通信技术股份有限公司 基于交易账单的数据挖掘分析方法及装置
CN112800284A (zh) * 2021-02-01 2021-05-14 北京机电工程研究所 一种基于环境模型数据库的快速查询方法
CN113610427A (zh) * 2021-08-19 2021-11-05 深圳市德信软件有限公司 事件预警指标获得方法、装置、终端设备以及存储介质
CN113610427B (zh) * 2021-08-19 2023-08-18 深圳市德信软件有限公司 事件预警指标获得方法、装置、终端设备以及存储介质
CN117714484A (zh) * 2023-11-15 2024-03-15 杭州中汇通航航空科技有限公司 一种无人机飞行报告管理平台

Similar Documents

Publication Publication Date Title
CN110457533A (zh) 一种情报数据模型分析方法
Shen et al. Web service discovery based on behavior signatures
US7266537B2 (en) Predictive selection of content transformation in predictive modeling systems
JP2022508106A (ja) マネーロンダリング防止分析のためのシステムおよび方法
CN110088749A (zh) 自动本体生成
CN111177214A (zh) 事件联动处理方法、装置、系统、电子设备及存储介质
CN110059923A (zh) 岗位画像和简历信息的匹配方法、装置、设备及存储介质
CN110008343A (zh) 文本分类方法、装置、设备及计算机可读存储介质
CN113093958B (zh) 数据处理方法、装置和服务器
CN109992588A (zh) 一种基于数据处理的分单方法及相关设备
CN111124917A (zh) 公共测试用例的管控方法、装置、设备及存储介质
CN108667678A (zh) 一种基于大数据的运维日志安全检测方法及装置
US20220229854A1 (en) Constructing ground truth when classifying data
CN110197426A (zh) 一种信用评分模型的建立方法、装置及可读存储介质
CN110222129B (zh) 一种基于关系型数据库的信用评价算法
Ruppert et al. Visual interactive creation and validation of text clustering workflows to explore document collections
CN105787004A (zh) 一种文本分类方法及装置
CN110972086A (zh) 短信息处理方法、装置、电子设备及计算机可读存储介质
CN109947797A (zh) 一种数据检查装置及方法
Zhu et al. Making smart contract classification easier and more effective
CN116228402A (zh) 一种金融征信特征仓库技术支持系统
CN107402886B (zh) 堆栈分析方法及相关装置
CN110941719B (zh) 数据分类方法、测试方法、装置及存储介质
US11803565B2 (en) System and method for verifying software data lineage
Canbaz et al. Hydra: detecting fraud in financial transactions via graph based representation and visual analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191115