CN111680077B - 一种通过关联度评分和模型比对确定相互关系的方法 - Google Patents
一种通过关联度评分和模型比对确定相互关系的方法 Download PDFInfo
- Publication number
- CN111680077B CN111680077B CN202010552979.9A CN202010552979A CN111680077B CN 111680077 B CN111680077 B CN 111680077B CN 202010552979 A CN202010552979 A CN 202010552979A CN 111680077 B CN111680077 B CN 111680077B
- Authority
- CN
- China
- Prior art keywords
- score
- model
- analysis
- determining
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000004458 analytical method Methods 0.000 claims abstract description 61
- 238000007405 data analysis Methods 0.000 claims abstract description 12
- 238000004891 communication Methods 0.000 claims description 13
- 230000002688 persistence Effects 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 4
- 239000002131 composite material Substances 0.000 claims 1
- 238000007689 inspection Methods 0.000 abstract description 4
- 238000011156 evaluation Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 210000000056 organ Anatomy 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 231100000749 chronicity Toxicity 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Fuzzy Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种通过关联度评分和模型比对确定相互关系的方法,包括:获取数据分析字段,根据数据分析字段确定具有价值的分析字段;根据具有价值的分析字段,生成辅助分析字段;计算综合关联度分值;根据综合关联度分值生成分析均线;建立通用关系判断分析模型;建立个体差异比对模型。本发明提供的通过关联度评分和模型比对确定相互关系的方法主要用于纪检监察、公安机关、检察机关、安全机关、海关、税务机关查办案件,能够解决通过对被调取对象产生的不同类型的数据进行数据分析,最终确定他的对手和其之间的相互关系。
Description
技术领域
本发明涉及一种通过关联度评分和模型比对确定相互关系的方法。
背景技术
办案部门在进行案件办理过程中,需要调取大量的涉案人的数据,这些数据少的有几千条,多的可能几千万条。这些数据格式也是五花八门,不同的数据来源数据格式都不同,其数据字段也各不相同,但这些数据里中却隐藏着大量的信息,反映的是涉案人员的具体行为,对于办案人员来说是比黄金还要宝贵的数据情报。
办案人在进行数据调查的时候,需要查阅每一条记录,要对这些数据进行统计分组打标签,目的是要分析出这些数据背后的人和被调取人之间的相互关系,通过这些关系来判断其行为是否符合正常逻辑。很多时候更倾向于去看一类数据,例如找人找关系就看电子计费话单数据,如果要查钱查资金去向就看银行流水数据,通过房产、订票、住宿信息来确定行动轨迹等。但是要知道,银行流水里也隐藏着交易对手,电子计费话单数据里也包含银行电话等信息,大量的数据里都包含有地理位置和对手信息。综合的所有的数据来判断关系当然是最科学的,因此需要一套科学高效的分析方法,来对大量的数据进行智能分析,最终确定其数据对端人和数据被调取人之间的相互关系。
发明内容
本发明的目的在于提供一种通过关联度评分和模型比对确定相互关系的方法,用于解决通过对被调取对象产生的不同类型的数据进行数据分析,最终确定对手和其之间的相互关系的问题。
为了解决上述问题,本发明采用以下技术方案:
一种通过关联度评分和模型比对确定相互关系的方法,包括:
获取数据分析字段,根据所述数据分析字段确定具有价值的分析字段;
根据所述具有价值的分析字段,生成辅助分析字段;
计算综合关联度分值;
根据所述综合关联度分值生成分析均线;
建立通用关系判断分析模型;
建立个体差异比对模型。
优选地,所述计算综合关联度分值,包括:根据积分法计算综合关联度分值。
优选地,所述综合关联度分值包括六个分析项,分别为持久性分值、私密性分值、沟通性分值、默契性分值、职业性分值和事件性分值。
优选地,所述综合关联度分值等于所有的分析项的评分标准之和。
优选地,所述建立通用关系判断分析模型,包括:
根据各类社会关系的沟通联系获取曲线图,根据曲线图生成通用关系判断分析模型;
建立自动学习算法,根据所述自动学习算法修正所述通用关系判断分析模型。
优选地,所述建立个体差异比对模型,包括:
掌握已知联系人的对手关系;
生成对手24小时关联度曲线;
将对手关联度曲线作为该类关系模型进行比对,符合模型特点判定为该关系。
本发明的有益效果为:本发明提供的通过关联度评分和模型比对确定相互关系的方法能够解决通过对被调取对象产生的不同类型的数据进行数据分析,最终确定他的对手和其之间的相互关系。
附图说明
图1是通过关联度评分和模型比对确定相互关系的方法的流程示意图;
图2是持久性分值、私密性分值、沟通性分值、默契性分值、职业性分值和事件性分值的分值示意图;
图3是正双峰型——同时关系波形图;
图4是左侧峰型——司机关系波形图;
图5是右侧峰型——情人关系波形图;
图6是普多峰型——老板秘书关系波形图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本实施例提供一种通过关联度评分和模型比对确定相互关系的方法,该通过关联度评分和模型比对确定相互关系的方法主要用于纪检监察、公安机关、检察机关、安全机关、海关、税务机关查办案件。该通过关联度评分和模型比对确定相互关系的方法的执行主体可以为智能移动终端,也可以是笔记本电脑或者台式电脑,还可以是服务器,本实施例不对其执行主体做限定。
如图1所示,该通过关联度评分和模型比对确定相互关系的方法包括如下步骤:
获取数据分析字段,根据所述数据分析字段确定具有价值的分析字段:
要评价一个人和另外一个人之间的关系如何,首先要确定都有哪些数据,这些数据对于评价相互关系是否具有很强的意义。
举例来说,例如办案人拿到的是一个人年度缴纳水费的电子缴费记录,缴费人和收费人之间对判定关系比较有意义的是缴费人信息,谁缴纳的费用这个用来评价相互关系就具有很大的价值,谁收了水费对于评价相互关系基本没有太大的意义。
因此在进行数据关联度评价的过程中,首先要做的就是要进行分析数据关联字段的确定,即用哪一个字段来进行分析判断。
依托系统自动的去分析判断确定有价值的字段,在当前字义分析并不成熟的情况下,基本是不现实的。那么要考虑如何用尽量少的用户介入,人工确认来实现有价值分析字段的确定。这个工作在每一个数据类型进行数据清洗格式设置的时候,就要优先的确定,然后绑定分析项。
根据所述具有价值的分析字段,生成辅助分析字段:
为确保数据分析的准确度,要在源数据的基础上,生成一些辅助分析字段。这些新字段的设定,是关联度评价的重要基石,也是整个关联度评价机制的核心。
拿电子计费话单数据举例来说,在通用的电子计费话单数据里大多包含:类型、主被叫标识、时长、日期、lac、ci、对方号码、号码归属地、漫游地、对方归属地、对方漫游地等信息。这些数据项可以统计出:短信数、主叫次数、被叫次数、主叫时长、被叫时长、ci数、漫游通话次数、漫游主叫次数、漫游被叫次数、漫游短信次数等信息,这些数据的统计结果可以大体勾画出联系人同被调取人之间的关系。但如果仅仅依靠这些还是远远不够的,要将这些数据再次统计归类,生成新的分析字段,这样才能真正全面的勾画出被调查人和联系人之间的相互关系。为此新增加了10类分析字段:
(1)联系天数,反映联系人同被调查人之间的联系的持久度;(2)工作日联系次数,反映联系人的工作关系;(3)节假日联系次数,反映联系人非工作关系;(4)特定日期联系次数,反映和特定事件有关的联系次数;(5)私密联系次数,反映联系人和被调查人之间的亲密度;(6)3分钟以上联系次数,反映被调取人之间的沟通度;(7)15秒以内联系次数,反映被调取人之间的默契度;(8)饭时联系次数,反映被调取人之间的亲属性;(9)爱情节日联系次数,反映联系人与被调查人之间的亲密性;(10)特定位置联系次数,反映和特定事件有关的联系次数。
增加的字段主要用于关联度评分的评分项,在进行其他数据类型文件关联度分析时,同样需要增加分析字段,这些字段需要根据具体数据情况分析确认。分析字段的确定需要在配置分析方法的时候进行人工脚本注入,特别复杂的字段取值由程序员编写固化代码注入。
计算综合关联度分值:
积分法是最常用的数据价值分析方法,本实施例中,根据积分法计算综合关联度分值。分值标准的设定是此类分析方法的核心。
在进行综合关联度分值计算时,需要对分值模块标准化,评分模块分为6个方向:持久性分值、私密性分值、沟通性分值、默契性分值、职业性分值、事件性分值。即综合关联度分值包括六个分析项,分别为持久性分值、私密性分值、沟通性分值、默契性分值、职业性分值和事件性分值。其中,
持久性评分:联系的持续时间和长期性,这是亲属性的重要特征;
私密性评分:联系时段的私密属性,这是亲密性的重要特征,用作特定关系人分析;
沟通性评分:表现在沟通的时长及沟通强度,这是职业判断的重要特征;
默契性评分:表现在联系次数和短时联系,这是司机及配偶的重要特征;
职业性评分:表现在特定的职业的工作时段联系,存在有多重职业判断的可能性,可设置双属性评价;
事件性评分:用来针对已知事件的分析评价,表现在时间和地点上。
然后,设定模块分值,即评分标准,其中,如图2所示,持久性评分:2.2分;私密性评分:3.8分;沟通性评分:1.65分;默契性评分:1.84分;职业性评分:1.82分;事件性评分:5.8分。
上述评分标准是通过5323份数据样本进行数据测算得出的最佳评分标准,可以根据需要进行适当调整。
设置均衡性评分方法,计算公式是:
关联度评分=分析项1*对应评分标准+分析项2*评分标准2对应评分标准+……分析项n*对应评分标准。也即:综合关联度分值等于所有的分析项的评分标准之和。
通过上述计算方法,可以将不同的类型数据进行归类后,套用公式得出最终得分作为关联度均衡的参考。
根据所述综合关联度分值生成分析均线:
根据调查,一个人半年平均要有300左右的联系对象,可能通话、微信、QQ、交易、同行等,在分析时针对这些要确定一个均线,反映被调取人的整体通话规律,这一均线可以反映被调取对象的整体通话规律。
常用的均线包括:24小时均线、日均线、月均线、年均线、分钟均线、节假日均线等。这些均线对于不同的分析项目具有不同的意义,对于关系分析来说,在通话数据方面主要选用24小时均线、法定节假日均线作为比对参数;对于银行数据来说,更多的考虑日均线、月均线等;对于流量数据,就要考虑分钟均线。
关于均线的生成方法,可以选择每一种参数的平均值来生成,可以用单频的字段来生成,也可以使用复核字段来生成,也可以直接使用根据关联度评价方法生成的关联度来直接呈现。作为一个具体实施方式,本实施例使用关联度评分来计算。
建立通用关系判断分析模型:
根据社会心理学的研究成果,各类社会关系的沟通联系都会普遍遵循一定规律,将这些规律整理总结为曲线图(24小时关联度折线图),作为关系模型,用来辅助确定关系,如图3-图6所示。
这些关系图谱一方面是通过社会调查统计得来,另一方面需要用户根据各自的需要,整理总结行业特点,做成关系模型。
建立自动学习算法,通过大量已知案例关系分析,来自动修复通用模型曲线,最终实现机器自我学习。
通过通话来判定关系,可以参考社会心理学的相关案例,但是通过关联度来判断关系,其实是需要大量的实践来建立新的关系模型。
建立个体差异比对模型:
在实践中,虽然可以通过已经建好的关系模型规律来进行分析判断相应关系,但不得不承认在具体案件办理中还是存在个体差异。为了避免个体差异导致的分析误差,要建立个体差异比对模型,用来针对特殊个案进行分析。
这种方法是对通用关系分析模型的补充,具体操作如下:(1)准确掌握已知联系人的对手关系;(2)生成对手24小时关联度曲线;(3)将对手关联度曲线作为该类关系模型进行比对,符合模型特点判定为该关系。举例说明一下:在分析A关系是确定A的联系人B是A的同事关系,那么就讲B的24小时关联度曲线作为针对个案A的同事关系模型X,在进行A的关系分析的时,只要符合X模型的曲线特点就判定为同事关系。
上述实施例仅以一种具体的实施方式说明本发明的技术方案,任何对本发明进行的等同替换及不脱离本发明精神和范围的修改或局部替换,其均应涵盖在本发明权利要求保护的范围之内。
Claims (4)
1.一种通过关联度评分和模型比对确定相互关系的方法,其特征在于,包括:
获取数据分析字段,根据所述数据分析字段确定具有价值的分析字段;
根据所述具有价值的分析字段,生成辅助分析字段;
计算综合关联度分值;
根据所述综合关联度分值生成分析均线;
建立通用关系判断分析模型;
建立个体差异比对模型;
所述建立通用关系判断分析模型,包括:
根据各类社会关系的沟通联系获取曲线图,根据曲线图生成通用关系判断分析模型;
建立自动学习算法,根据所述自动学习算法修正所述通用关系判断分析模型;
所述建立个体差异比对模型,包括:
掌握已知联系人的对手关系;
生成对手24小时关联度曲线;
将对手关联度曲线作为所述对手关系对应的关系模型进行比对,符合模型特点判定为所述对手关系。
2.根据权利要求1所述的通过关联度评分和模型比对确定相互关系的方法,其特征在于,所述计算综合关联度分值,包括:根据积分法计算综合关联度分值。
3.根据权利要求1所述的通过关联度评分和模型比对确定相互关系的方法,其特征在于,所述综合关联度分值包括六个分析项,分别为持久性分值、私密性分值、沟通性分值、默契性分值、职业性分值和事件性分值。
4.根据权利要求3所述的通过关联度评分和模型比对确定相互关系的方法,其特征在于,所述综合关联度分值等于所有的分析项的评分标准之和。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010552979.9A CN111680077B (zh) | 2020-06-17 | 2020-06-17 | 一种通过关联度评分和模型比对确定相互关系的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010552979.9A CN111680077B (zh) | 2020-06-17 | 2020-06-17 | 一种通过关联度评分和模型比对确定相互关系的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111680077A CN111680077A (zh) | 2020-09-18 |
CN111680077B true CN111680077B (zh) | 2023-10-27 |
Family
ID=72455292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010552979.9A Active CN111680077B (zh) | 2020-06-17 | 2020-06-17 | 一种通过关联度评分和模型比对确定相互关系的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111680077B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636382A (zh) * | 2013-11-13 | 2015-05-20 | 华为技术有限公司 | 推理社会关系的方法及装置 |
CN106570764A (zh) * | 2016-11-09 | 2017-04-19 | 广州杰赛科技股份有限公司 | 一种用户关系预测方法及装置 |
CN106844673A (zh) * | 2017-01-24 | 2017-06-13 | 山东亿海兰特通信科技有限公司 | 一种基于公安数据获取多维人员关系亲密度的方法及系统 |
CN107705135A (zh) * | 2017-10-20 | 2018-02-16 | 厦门笨鸟电子商务有限公司 | 一种基于公司存量联系人数据评价潜在商业价值的方法 |
CN108897780A (zh) * | 2018-06-06 | 2018-11-27 | 山东合天智汇信息技术有限公司 | 一种分析计算人员亲密度的方法及系统 |
CN110109908A (zh) * | 2017-12-29 | 2019-08-09 | 成都蜀信信用服务有限公司 | 基于社会基础信息挖掘人物潜在关系的分析系统及方法 |
CN110647561A (zh) * | 2019-09-26 | 2020-01-03 | 四川科瑞软件有限责任公司 | 用于涉毒人员的通信轨迹分析方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2464677A (en) * | 2008-10-20 | 2010-04-28 | Univ Nottingham Trent | A method of analysing data by using an artificial neural network to identify relationships between the data and one or more conditions. |
-
2020
- 2020-06-17 CN CN202010552979.9A patent/CN111680077B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636382A (zh) * | 2013-11-13 | 2015-05-20 | 华为技术有限公司 | 推理社会关系的方法及装置 |
CN106570764A (zh) * | 2016-11-09 | 2017-04-19 | 广州杰赛科技股份有限公司 | 一种用户关系预测方法及装置 |
CN106844673A (zh) * | 2017-01-24 | 2017-06-13 | 山东亿海兰特通信科技有限公司 | 一种基于公安数据获取多维人员关系亲密度的方法及系统 |
CN107705135A (zh) * | 2017-10-20 | 2018-02-16 | 厦门笨鸟电子商务有限公司 | 一种基于公司存量联系人数据评价潜在商业价值的方法 |
CN110109908A (zh) * | 2017-12-29 | 2019-08-09 | 成都蜀信信用服务有限公司 | 基于社会基础信息挖掘人物潜在关系的分析系统及方法 |
CN108897780A (zh) * | 2018-06-06 | 2018-11-27 | 山东合天智汇信息技术有限公司 | 一种分析计算人员亲密度的方法及系统 |
CN110647561A (zh) * | 2019-09-26 | 2020-01-03 | 四川科瑞软件有限责任公司 | 用于涉毒人员的通信轨迹分析方法 |
Non-Patent Citations (1)
Title |
---|
基于社交网络大规模行为数据的用户关系研究;刘晶;李琳;李石君;;计算机应用与软件(第07期);第44-47页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111680077A (zh) | 2020-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6912508B1 (en) | Method and apparatus for promoting taxpayer compliance | |
Vajgel et al. | Development of intelligent robotic process automation: A utility case study in Brazil | |
CN109767322A (zh) | 基于大数据的可疑交易分析方法、装置和计算机设备 | |
CN112561598A (zh) | 基于客户画像的客户流失预测及挽回方法和系统 | |
JP2004528657A5 (zh) | ||
CN113989019A (zh) | 识别风险的方法、装置、设备及存储介质 | |
CN110633316A (zh) | 一种多场景融合双随机市场监管方法 | |
CN113408627A (zh) | 目标对象的确定方法、装置和服务器 | |
CN109783731A (zh) | 一种定制信息推送方法及系统 | |
CN112950347A (zh) | 资源数据处理的优化方法及装置、存储介质、终端 | |
CN113609011B (zh) | 一种保险产品工厂的测试方法、装置、介质和设备 | |
CN101295388A (zh) | 一种信用评估方法及系统 | |
CN116578499B (zh) | 公共组件功能变更影响的智能化分析测试方法及其系统 | |
CN111680077B (zh) | 一种通过关联度评分和模型比对确定相互关系的方法 | |
CN112667911A (zh) | 一种利用社交软件大数据找寻潜在客户的方法 | |
CN111639916A (zh) | 一种基于区块链技术及深度学习的在线审计方法、系统和可读存储介质 | |
CN116308416A (zh) | 一种空壳企业识别方法及系统 | |
CN114722789B (zh) | 数据报表集成方法、装置、电子设备及存储介质 | |
CN114529402A (zh) | 一种基于大数据风控的信贷管理方法、设备及介质 | |
CN114372867A (zh) | 用户信用度的验证评估方法、装置和计算机设备 | |
CN113436023A (zh) | 基于区块链的理财产品推荐方法及装置 | |
Daka et al. | Smart Mobile Telecommunication Network Fraud Detection System Using Call Traffic Pattern Analysis and Artificial Neural Network | |
Karan et al. | Estimation of credit risk of retail stores by using their payment history: A combined logistic regression and multi-dea | |
Zhang et al. | Financial forecasting and analysis for low-wage workers | |
CN116010509A (zh) | 一种基于信用卡系统描绘用户画像产生标签的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |