CN111611530A - 案件与人员关系分析方法、装置及电子设备 - Google Patents

案件与人员关系分析方法、装置及电子设备 Download PDF

Info

Publication number
CN111611530A
CN111611530A CN202010429723.9A CN202010429723A CN111611530A CN 111611530 A CN111611530 A CN 111611530A CN 202010429723 A CN202010429723 A CN 202010429723A CN 111611530 A CN111611530 A CN 111611530A
Authority
CN
China
Prior art keywords
node
personnel
vector
window
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010429723.9A
Other languages
English (en)
Other versions
CN111611530B (zh
Inventor
陆韵
李冰
郑申俊
陆克贤
王魁
储宇晗
翁漂洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Chinaoly Technology Co ltd
Original Assignee
Hangzhou Chinaoly Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Chinaoly Technology Co ltd filed Critical Hangzhou Chinaoly Technology Co ltd
Priority to CN202010429723.9A priority Critical patent/CN111611530B/zh
Publication of CN111611530A publication Critical patent/CN111611530A/zh
Application granted granted Critical
Publication of CN111611530B publication Critical patent/CN111611530B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本发明提供了一种案件与人员关系分析方法、装置及电子设备,涉及关系分析技术领域,包括获取人员关系信息,并根据人员关系信息建立人员节点序列;基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;对概率公式进行训练得到人员嵌入向量;基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;根据均值漂移向量得到社区节点信息;基于社区节点信息进行案件归类。本发明可以有效降低工作量,提高破案效率。

Description

案件与人员关系分析方法、装置及电子设备
技术领域
本发明涉及关系分析技术领域,尤其是涉及一种案件与人员关系分析方法、装置及电子设备。
背景技术
当前,在警务领域,为了锁定案件的犯罪嫌疑人,通常需要警员依靠经验去做大量的调查和推理来确定嫌疑人员,当同一人员或作案同伙多次作案时,虽然案件存在相似相似性,但是警员依旧需要做大量的调查和推理来确定嫌疑人员,造成工作量大,破案时间长的问题。
发明内容
本发明的目的在于提供了一种案件与人员关系分析方法、装置及电子设备,可以有效降低工作量,提高破案效率。
第一方面,本发明提供了一种案件与人员关系分析方法,其中,包括:
获取人员关系信息,并根据所述人员关系信息建立人员节点序列;
基于所述人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;
对概率公式进行训练得到人员嵌入向量;
基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;
根据所述均值漂移向量得到社区节点信息;
基于所述社区节点信息进行案件归类。
进一步的,所述根据所述人员关系信息建立人员节点序列的步骤,包括:
根据所述边权重建立人员关系图,将所述人员关系图定义为G(V,E),其中,V为节点集合,节点vi∈V在该图中代表第i个人员,E为边集合,e(vi,vj)∈E在该图中表示节点vi和vj之间的边,其实际意义为第i人和第j之间的关系;
根据以下算式计算所述边权重:
Figure BDA0002500084840000021
其中,
Figure BDA0002500084840000022
为两个人员之间的行为频次,kr为行为权重,r为行为种类。
根据所述节点集合中的一个节点s1为起点,基于上述边权重计算采用概率,进行随机游走,生成一条节点序列,记为S={s1,s2,...,sn},si∈V,采用概率公式为:
Figure BDA0002500084840000023
其中,st和st-1分别代表当前时刻和上一时刻的节点,其物理意义为上一时刻节点为v的情况下,当前节点选择u的概率。
进一步的,对序列进行滑动得到一个固定长度的窗口,并构建该窗口的条件概率函数,包括:
对序列S以2w+1为窗口长度进行遍历,每次迭代过程中可以得到一个以节点si为中心的窗口W(i),其中中心节点si∈S,窗口W(i)=S[i-w:i+w];
基于所述窗口W(i)建立概率公式,其中,所述概率公式的计算算式为:
Figure BDA0002500084840000024
其中,si是窗口中心节点,sk是窗口W(i)内除si外的任意节点,P(sk|si)为一个softmax函数,代表si和sk同时出现在一个窗口内的概率,具体计算式为:
Figure BDA0002500084840000031
其中,vj表示V中的任一节点,f(si)表示输入节点si的嵌入向量。
进一步的,对所述概率公式进行训练得到向量模型的步骤,包括:
对所述概率公式使用对数似然函数作为目标函数,并进行求和得到序列中所有窗口的总目标函数值,以最大化节点序列出现的概率,所述总目标函数值的计算算式为:
Figure BDA0002500084840000032
其中,P(W(i)丨si)为单个窗口内部的概率函数,S为窗口节点序列;
将所述总目标函数值的映射节点转化为映射向量;
对所述映射向量进行学习得到所述向量模型。
进一步的,所述基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量的步骤,包括:
在所述人员嵌入向量中选择一个初始质心,并建立核函数和核函数带宽,其中,所述核函数的计算算式为:
Figure BDA0002500084840000033
其中,h为核函数带宽,x和x1分别代表质心的位置坐标和另一输入节点的向量坐标,
Figure BDA0002500084840000034
为根据质心坐标和输入节点计算得到的核函数;
根据所述核函数建立均值漂移向量计算算式,其中,所述均值漂移向量计算算式为:
Figure BDA0002500084840000041
其中,a(x)为均值漂移向量,其物理意义为当前位置下质心的移动方向和距离,f(v)为人员嵌入向量,
Figure BDA0002500084840000042
为核函数,h为核函数带宽,x为当前质心的坐标向量;
经过多次迭代收敛后,所有人员向量将被聚类为多个簇,每个簇代表一个社区节点,簇的质心即社区节点的中心向量。
进一步的,所述基于所述社区节点信息进行案件归类的步骤,还包括:
从人员与社区关系、人员与案件关系中,跳过人员构建案件与社区的异构图;
基于二阶关系查找,将所有连接相同社区节点的案件进行归类汇总。
第二方面,本发明提供了一种案件与人员关系分析装置,其中,包括:
获取单元,用于获取人员关系信息,并根据所述人员关系信息建立人员节点序列;
概率函数单元,用于基于所述人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;
训练单元,用于对概率公式进行训练得到人员嵌入向量;
聚类单元,用于基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;
社区节点信息单元,用于根据所述均值漂移向量得到社区节点信息;
案件归类单元,用于基于所述社区节点信息进行案件归类。
第三方面,本发明提供了一种电子设备,其中,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现第一方面所述的案件与人员关系分析方法的步骤。
第四方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中,所述计算机程序被处理器运行时执行第一方面所述的案件与人员关系分析方法的步骤。
本发明实施例带来了以下有益效果:
本发明提供了一种案件与人员关系分析方法、装置及电子设备,通过获取人员关系信息,并根据人员关系信息建立人员节点序列;基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;对概率公式进行训练得到人员嵌入向量;基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;根据均值漂移向量得到社区节点信息;基于社区节点信息进行案件归类。在本实施例提供的上述方式中,通过获取人员关系信息,并根据人员关系信息建立人员节点序列;基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;对概率公式进行训练得到人员嵌入向量;基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;根据均值漂移向量得到社区节点信息;基于社区节点信息进行案件归类,实现了自动分析案件与人员之间的关系,避免了当同一人员或作案同伙多次作案时,虽然案件存在相似相似性,但是警员依旧需要做大量的调查和推理来确定嫌疑人员,造成工作量大,破案时间长的问题,可以有效降低工作量,提高破案效率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的案件与人员关系分析方法流程图;
图2为本发明实施例一提供的人员节点序列计算方法流程图;
图3为本发明实施例二提供的案件与人员关系分析装置示意图;
图4为本发明实施例供的电子设备的结构示意图。
图标:301-获取单元;302-概率函数单元;303-训练单元;304-聚类单元;305-社区节点信息单元;306-案件归类单元;400-处理器;401-存储器;402-总线;403-通信接口。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到现有技术中当同一人员或作案同伙多次作案时,虽然案件存在相似相似性,但警员依旧需要做大量的调查和推理来确定嫌疑人员,造成工作量大,破案时间长的问题。本发明提供了一种案件与人员关系分析方法、装置及电子设备,该方法通过获取人员关系信息,并根据人员关系信息建立人员节点序列;基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;对概率公式进行训练得到人员嵌入向量;基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;根据均值漂移向量得到社区节点信息;基于社区节点信息进行案件归类,实现了自动分析案件与人员之间的关系,可以有效降低工作量,提高破案效率。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种案件与人员关系分析方法进行详细介绍。
实施例一:
参照图1所示的一种案件与人员关系分析方法流程图,可以由诸如计算机、处理器等电子设备执行,该方法主要包括步骤S101至步骤S106:
步骤S101,获取人员关系信息,并根据人员关系信息建立人员节点序列。
步骤S102,基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数。
在一种具体的实施方式中,在社区-人员网络中,再添加案件信息,建立人-案关系,设计元路径:案件-人员-社区-人员-案件基于该元路径做随机游走得到多重节点序列。
步骤S103,对概率公式进行训练得到人员嵌入向量。
步骤S104,基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量。
步骤S105,根据均值漂移向量得到社区节点信息。
步骤S106,基于社区节点信息进行案件归类。
在一种具体的实施方式中,将均值漂移向量按照预设次数进行迭代,得到的簇作为虚拟社区节点,并将该节点与所有簇从属的人员节点建立关系,进而得到社区节点信息。
在本实施例提供的上述方式中,通过获取人员关系信息,并根据人员关系信息建立人员节点序列;基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;对概率公式进行训练得到人员嵌入向量;基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;根据均值漂移向量得到社区节点信息;基于社区节点信息进行案件归类,实现了自动分析案件与人员之间的关系,避免了当同一人员或作案同伙多次作案时,虽然案件存在相似相似性,但是警员依旧需要做大量的调查和推理来确定嫌疑人员,造成工作量大,破案时间长的问题,可以有效降低工作量,提高破案效率。
在具体实施时,参照图2的人员节点序列计算方法流程图,根据人员关系信息建立人员节点序列的步骤,包括以下步骤S201~S203:
步骤S201,根据边权重建立人员关系图,将人员关系图定义为G(V,E),其中,V为节点集合,节点vi∈V在该图中代表第i个人员,E为边集合,e(vi,vj)∈E在该图中表示节点vi和vj之间的边,其实际意义为第i人和第j之间的关系。
步骤S202,根据算式(1)计算所述边权重:
Figure BDA0002500084840000081
其中,
Figure BDA0002500084840000082
为两个人员之间的行为频次,kr为行为权重,r为行为种类。
步骤S203,根据节点集合中的一个节点s1为起点,基于上述边权重计算采用概率,进行随机游走,生成一条节点序列,记为S={s1,s2,...,sn},si∈V,采用概率公式(2)为:
Figure BDA0002500084840000083
其中,st和st-1分别代表当前时刻和上一时刻的节点,其物理意义为上一时刻节点为v的情况下,当前节点选择u的概率。
在具体实施时,对序列进行滑动得到一个固定长度的窗口,并构建该窗口的条件概率函数,包括:
对序列S以2w+1为窗口长度进行遍历,每次迭代过程中可以得到一个以节点si为中心的窗口W(i),其中中心节点si∈S,窗口W(i)=S[i-w:i+w];
基于窗口W(i)建立概率公式,其中,所述概率公式的计算算式(3)为:
Figure BDA0002500084840000084
其中,si是窗口中心节点,sk是窗口W(i)内除si外的任意节点,P(sk|si)为一个softmax函数,代表si和sk同时出现在一个窗口内的概率,具体计算式(4)为:
Figure BDA0002500084840000091
其中,vj表示V中的任一节点,f(si)表示输入节点si的嵌入向量。
在具体实施时,对所述概率公式进行训练得到向量模型的步骤,包括:
对所述概率公式使用对数似然函数作为目标函数,并进行求和得到序列中所有窗口的总目标函数值,以最大化节点序列出现的概率,所述总目标函数值的计算算式(5)为:
Figure BDA0002500084840000092
其中,P(W(i)丨si)为单个窗口内部的概率函数,S为窗口节点序列;
将所述总目标函数值的映射节点转化为映射向量;
对所述映射向量进行学习得到所述向量模型。
在一种具体的实施方式中,首先在节点集合V中选择一个节点vi,以vi为起点随机游走,生成一条长度l节点序列S,令i=1,选取序列中的某个节点Si,以Si为中心节点生成长度为W的窗口W(i),进而得到损失函数,然后判断i是否大于等于1,如果小于1则重新选取序列中的某个节点Si;如果大于等于1则对损失函数进行训练得到向量模型。
在具体实施时,基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量的步骤,包括:
在人员嵌入向量中选择一个初始质心,并建立核函数和核函数带宽,其中,核函数的计算算式(6)为:
Figure BDA0002500084840000093
其中,h为核函数带宽,x和x1分别代表质心的位置坐标和另一输入节点的向量坐标,
Figure BDA0002500084840000101
为根据质心坐标和输入节点计算得到的核函数;
根据核函数建立均值漂移向量计算算式,其中,均值漂移向量计算算式(7)为:
Figure BDA0002500084840000102
其中,a(x)为均值漂移向量,其物理意义为当前位置下质心的移动方向和距离,f(v)为人员嵌入向量,
Figure BDA0002500084840000103
为核函数,h为核函数带宽,x为当前质心的坐标向量;
经过多次迭代收敛后,所有人员向量将被聚类为多个簇,每个簇代表一个社区节点,簇的质心即社区节点的中心向量。
在一种具体的实施方式中,对均值漂移向量进行判断,如果小于预设值,将均值漂移向量累加到初始质心中,即使xi=xi+a(x)。直至均值漂移向量大于等于预设值。
在具体实施时,基于社区节点信息进行案件归类的步骤,还包括:
从人员与社区关系、人员与案件关系中,跳过人员构建案件与社区的异构图;
基于二阶关系查找,将所有连接相同社区节点的案件进行归类汇总。
实施例二:
参照图3所示的一种案件与人员关系分析装置示意图,包括:
获取单元301,用于获取人员关系信息,并根据人员关系信息建立人员节点序列。
概率函数单元302,用于基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数。
训练单元303,用于对概率公式进行训练得到人员嵌入向量。
聚类单元304,用于基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量。
社区节点信息单元305,用于根据均值漂移向量得到社区节点信息。
案件归类单元306,用于基于社区节点信息进行案件归类。
在本实施例提供的上述装置中,通过获取人员关系信息,并根据人员关系信息建立人员节点序列;基于人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;对概率公式进行训练得到人员嵌入向量;基于人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;根据均值漂移向量得到社区节点信息;基于社区节点信息进行案件归类,实现了自动分析案件与人员之间的关系,避免了当同一人员或作案同伙多次作案时,虽然案件存在相似相似性,但是警员依旧需要做大量的调查和推理来确定嫌疑人员,造成工作量大,破案时间长的问题,可以有效降低工作量,提高破案效率。
在具体实施时,获取单元301还用于:
根据边权重建立人员关系图,将人员关系图定义为G(V,E),其中,V为节点集合,节点vi∈V在该图中代表第i个人员,E为边集合,e(vi,vj)∈E在该图中表示节点vi和vj之间的边,其实际意义为第i人和第j之间的关系;
根据以下算式(8)计算边权重:
Figure BDA0002500084840000111
其中,
Figure BDA0002500084840000112
为两个人员之间的行为频次,kr为行为权重,r为行为种类;
根据节点集合中的一个节点s1为起点,基于上述边权重计算采用概率,进行随机游走,生成一条节点序列,记为S={s1,s2,...,sn},si∈V,采用概率公式(9)为:
Figure BDA0002500084840000121
其中,st和st-1分别代表当前时刻和上一时刻的节点,其物理意义为上一时刻节点为v的情况下,当前节点选择u的概率。
在具体实施时,对序列进行滑动得到一个固定长度的窗口,并构建该窗口的条件概率函数,包括:
对序列S以2w+1为窗口长度进行遍历,每次迭代过程中可以得到一个以节点si为中心的窗口W(i),其中中心节点si∈S,窗口W(i)=S[i-w:i+w];
基于窗口W(i)建立概率公式,其中,所述概率公式的计算算式(10)为:
Figure BDA0002500084840000122
其中,si是窗口中心节点,sk是窗口W(i)内除si外的任意节点,P(sk|si)为一个softmax函数,代表si和sk同时出现在一个窗口内的概率,具体计算式(11)为:
Figure BDA0002500084840000123
其中,vj表示V中的任一节点,f(si)表示输入节点si的嵌入向量。
在具体实施时,对概率公式进行训练得到向量模型还用于:
对概率公式使用对数似然函数作为目标函数,并进行求和得到序列中所有窗口的总目标函数值,以最大化节点序列出现的概率,总目标函数值的计算算式(12)为:
Figure BDA0002500084840000131
其中,P(W(i)丨si)为单个窗口内部的概率函数,S为窗口节点序列;
将总目标函数值的映射节点转化为映射向量;
对映射向量进行学习得到所述向量模型。
在具体实施时,聚类单元304还用于:
在人员嵌入向量中选择一个初始质心,并建立核函数和核函数带宽,其中,核函数的计算算式(13)为:
Figure BDA0002500084840000132
其中,h为核函数带宽,x和x1分别代表质心的位置坐标和另一输入节点的向量坐标,
Figure BDA0002500084840000133
为根据质心坐标和输入节点计算得到的核函数;
根据核函数建立均值漂移向量计算算式,其中,均值漂移向量计算算式(14)为:
Figure BDA0002500084840000134
其中,a(x)为均值漂移向量,其物理意义为当前位置下质心的移动方向和距离,f(v)为人员嵌入向量,
Figure BDA0002500084840000135
为核函数,h为核函数带宽,x为当前质心的坐标向量;
经过多次迭代收敛后,所有人员向量将被聚类为多个簇,每个簇代表一个社区节点,簇的质心即社区节点的中心向量。
在具体实施时,案件归类单元306还用于:
从人员与社区关系、人员与案件关系中,跳过人员构建案件与社区的异构图;
基于二阶关系查找,将所有连接相同社区节点的案件进行归类汇总。
本发明实施例还提供一种电子设备,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现实施例一案件与人员关系分析方法的步骤。
图4为本发明实施例提供的一种电子设备的结构示意图,该电子设备包括:处理器400,存储器401,总线402和通信接口403,处理器400、通信接口403和存储器401通过总线402连接;处理器400用于执行存储器401中存储的可执行模块,例如计算机程序。
其中,存储器401可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口403(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线402可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器401用于存储程序,所述处理器400在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器400中,或者由处理器400实现。
处理器400可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器400中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器400可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器401,处理器400读取存储器401中的信息,结合其硬件完成上述方法的步骤。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其中,计算机程序被处理器400运行时执行实施例一案件与人员关系分析方法的步骤。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (9)

1.一种案件与人员关系分析方法,其特征在于,包括:
获取人员关系信息,并根据所述人员关系信息建立人员节点序列;
基于所述人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;
对概率公式进行训练得到人员嵌入向量;
基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;
根据所述均值漂移向量得到社区节点信息;
基于所述社区节点信息进行案件归类。
2.根据权利要求1所述的方法,其特征在于,所述根据所述人员关系信息建立人员节点序列的步骤,包括:
根据边权重建立人员关系图,将所述人员关系图定义为G(V,E),其中,V为节点集合,节点vi∈V在所述人员关系图中代表第i个人员,E为边集合,e(vi,vj)∈E在所述人员关系图中表示节点vi和vj之间的边,其实际意义为第i人和第j之间的关系;
根据以下算式计算所述边权重:
Figure FDA0002500084830000011
其中,
Figure FDA0002500084830000012
为两个人员之间的行为频次,kr为行为权重,r为行为种类;
根据所述节点集合中的一个节点s1为起点,基于上述边权重计算采用概率,进行随机游走,生成一条节点序列,记为S={s1,s2,...,sn},si∈V,采用概率公式为:
Figure FDA0002500084830000013
其中,st和st-1分别代表当前时刻和上一时刻的节点,其物理意义为上一时刻节点为v的情况下,当前节点选择u的概率。
3.根据权利要求1所述的方法,其特征在于,对序列进行滑动得到一个固定长度的窗口,并构建该窗口的条件概率函数,包括:
对序列S以2w+1为窗口长度进行遍历,每次迭代过程中可以得到一个以节点si为中心的窗口W(i),其中中心节点si∈S,窗口W(i)=S[i-w:i+w];
基于所述窗口W(i)建立概率公式,其中,所述概率公式的计算算式为:
Figure FDA0002500084830000021
其中,si是窗口中心节点,sk是窗口W(i)内除si外的任意节点,P(sk|si)为一个softmax函数,代表si和sk同时出现在一个窗口内的概率,具体计算式为:
Figure FDA0002500084830000022
其中,vj表示V中的任一节点,f(si)表示输入节点si的嵌入向量。
4.根据权利要求3所述的方法,其特征在于,对所述概率公式进行训练得到向量模型的步骤,包括:
对所述概率公式使用对数似然函数作为目标函数,并进行求和得到序列中所有窗口的总目标函数值,以最大化节点序列出现的概率,所述总目标函数值的计算算式为:
Figure FDA0002500084830000023
其中,P(W(i)丨si)为单个窗口内部的概率函数,S为窗口节点序列;
将所述总目标函数值的映射节点转化为映射向量;
对所述映射向量进行学习得到所述向量模型。
5.根据权利要求1所述的方法,其特征在于,所述基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量的步骤,包括:
在所述人员嵌入向量中选择一个初始质心,并建立核函数和核函数带宽,其中,所述核函数的计算算式为:
Figure FDA0002500084830000031
其中,h为核函数带宽,x和x1分别代表质心的位置坐标和另一输入节点的向量坐标,
Figure FDA0002500084830000032
为根据质心坐标和输入节点计算得到的核函数;根据所述核函数建立均值漂移向量计算算式,其中,所述均值漂移向量计算算式为:
Figure FDA0002500084830000033
其中,a(x)为均值漂移向量,其物理意义为当前位置下质心的移动方向和距离,f(v)为人员嵌入向量,
Figure FDA0002500084830000034
为核函数,h为核函数带宽,x为当前质心的坐标向量;
经过多次迭代收敛后,所有人员向量将被聚类为多个簇,每个簇代表一个社区节点,簇的质心即社区节点的中心向量。
6.根据权利要求1所述的方法,其特征在于,所述基于所述社区节点信息进行案件归类的步骤,还包括:
从人员与社区关系、人员与案件关系中,跳过人员构建案件与社区的异构图;
基于二阶关系查找,将所有连接相同社区节点的案件进行归类汇总。
7.一种案件与人员关系分析装置,其特征在于,包括:
获取单元,用于获取人员关系信息,并根据所述人员关系信息建立人员节点序列;
概率函数单元,用于基于所述人员节点序列生成节点序列窗口,并构建该窗口的条件概率函数;
训练单元,用于对概率公式进行训练得到人员嵌入向量;
聚类单元,用于基于所述人员嵌入向量使用均值漂移算法进行聚类得到均值漂移向量;
社区节点信息单元,用于根据所述均值漂移向量得到社区节点信息;
案件归类单元,用于基于所述社区节点信息进行案件归类。
8.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至6任一项所述的案件与人员关系分析方法的步骤。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至6任一项所述的案件与人员关系分析方法的步骤。
CN202010429723.9A 2020-05-20 2020-05-20 案件与人员关系分析方法、装置及电子设备 Active CN111611530B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010429723.9A CN111611530B (zh) 2020-05-20 2020-05-20 案件与人员关系分析方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010429723.9A CN111611530B (zh) 2020-05-20 2020-05-20 案件与人员关系分析方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111611530A true CN111611530A (zh) 2020-09-01
CN111611530B CN111611530B (zh) 2023-11-17

Family

ID=72197035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010429723.9A Active CN111611530B (zh) 2020-05-20 2020-05-20 案件与人员关系分析方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111611530B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017193685A1 (zh) * 2016-05-11 2017-11-16 华为技术有限公司 社交网络中数据的处理方法和装置
US20190114362A1 (en) * 2017-10-12 2019-04-18 Facebook, Inc. Searching Online Social Networks Using Entity-based Embeddings
WO2019114412A1 (zh) * 2017-12-15 2019-06-20 阿里巴巴集团控股有限公司 一种基于图结构模型的信用风险控制方法、装置以及设备
CN110555052A (zh) * 2018-05-31 2019-12-10 杭州海康威视数字技术股份有限公司 一种关系网络建立方法、装置及设备
CN110909225A (zh) * 2019-11-29 2020-03-24 广州市百果园信息技术有限公司 社交群组确定方法、装置、设备及计算机存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017193685A1 (zh) * 2016-05-11 2017-11-16 华为技术有限公司 社交网络中数据的处理方法和装置
US20190114362A1 (en) * 2017-10-12 2019-04-18 Facebook, Inc. Searching Online Social Networks Using Entity-based Embeddings
WO2019114412A1 (zh) * 2017-12-15 2019-06-20 阿里巴巴集团控股有限公司 一种基于图结构模型的信用风险控制方法、装置以及设备
CN110555052A (zh) * 2018-05-31 2019-12-10 杭州海康威视数字技术股份有限公司 一种关系网络建立方法、装置及设备
CN110909225A (zh) * 2019-11-29 2020-03-24 广州市百果园信息技术有限公司 社交群组确定方法、装置、设备及计算机存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
REN Y F,ZHANG Y,ZHANG M S,ET AL: "Improving Twitter sentiment classification using topicenriched multi-prototype word embeddings" *
宋晓勇;吕品;陈年生;: "PORSC:融合用户个性化特征的在线评论情感分类模型" *

Also Published As

Publication number Publication date
CN111611530B (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
CN110309874B (zh) 负样本筛选模型训练方法、数据筛选方法和数据匹配方法
CN110874550A (zh) 数据处理方法、装置、设备和系统
WO2021089013A1 (zh) 空间图卷积网络的训练方法、电子设备及存储介质
CN111047563B (zh) 一种应用于医学超声图像的神经网络构建方法
CN111553215A (zh) 人员关联方法及其装置、图卷积网络训练方法及其装置
CN112566093B (zh) 一种终端关系识别方法、装置、计算机设备及存储介质
Yang et al. A probabilistic model for truth discovery with object correlations
WO2020024444A1 (zh) 人群绩效等级识别方法、装置、存储介质及计算机设备
CN111062431A (zh) 图像聚类方法、图像聚类装置、电子设备及存储介质
CN114898416A (zh) 一种人脸识别方法、装置、电子设备及可读存储介质
CN113516501A (zh) 一种基于图神经网络的用户通信行为预测方法和装置
CN112560731B (zh) 特征聚类方法、数据库更新方法、电子设备及存储介质
CN114398350A (zh) 训练数据集的清洗方法、装置及服务器
CN113207101B (zh) 基于5g城市部件传感器的信息处理方法及物联网云平台
CN111611532B (zh) 人物关系补全方法、装置及电子设备
CN113127730A (zh) 一种基于重叠社区的社区检测方法、终端设备及存储介质
CN108680897A (zh) 一种室内定位方法、装置、电子设备及存储介质
CN111611530A (zh) 案件与人员关系分析方法、装置及电子设备
Luo et al. On the universality of the Jordan center for estimating the rumor source in a social network
CN110889467A (zh) 一种公司名称匹配方法、装置、终端设备及存储介质
CN108830302B (zh) 一种图像分类方法、训练方法、分类预测方法及相关装置
CN111611531B (zh) 人员关系分析方法、装置及电子设备
CN115830342A (zh) 检测框的确定方法、装置、存储介质及电子装置
CN115359541A (zh) 人脸图像聚类方法、装置、电子设备及存储介质
US11676050B2 (en) Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees using leaf nodes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 310000 room 1408, building 2, Caizhi Shunfeng innovation center, No. 99, housheng street, Gongshu District, Hangzhou City, Zhejiang Province

Applicant after: HANGZHOU CHINAOLY TECHNOLOGY CO.,LTD.

Address before: 2 / F, building A04, 9 Jiusheng Road, Jianggan District, Hangzhou City, Zhejiang Province 310000

Applicant before: HANGZHOU CHINAOLY TECHNOLOGY CO.,LTD.

GR01 Patent grant
GR01 Patent grant