CN112311719B - 数据处理方法、设备、系统及存储介质 - Google Patents

数据处理方法、设备、系统及存储介质 Download PDF

Info

Publication number
CN112311719B
CN112311719B CN201910673446.3A CN201910673446A CN112311719B CN 112311719 B CN112311719 B CN 112311719B CN 201910673446 A CN201910673446 A CN 201910673446A CN 112311719 B CN112311719 B CN 112311719B
Authority
CN
China
Prior art keywords
user
communication
behavior data
users
communication behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910673446.3A
Other languages
English (en)
Other versions
CN112311719A (zh
Inventor
唐晓瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910673446.3A priority Critical patent/CN112311719B/zh
Publication of CN112311719A publication Critical patent/CN112311719A/zh
Application granted granted Critical
Publication of CN112311719B publication Critical patent/CN112311719B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/22Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Abstract

本申请实施例提供一种数据处理方法、设备、系统及存储介质。在本申请实施例中,以已知具有指定行为的用户的通信行为数据为基础,结合待识别时段内存在通信关系的用户之间的通信行为数据,将用户作为节点构建交互关系图;进一步,对交互关系图中的节点进行向量化处理,并利用交互关系图中的节点的向量表示,识别出在待识别时段内存在通信关系的用户中具有指定行为的目标用户,提高对具有指定行为的用户的检测效率和检出率。

Description

数据处理方法、设备、系统及存储介质
技术领域
本申请涉及通信技术领域,尤其涉及一种数据处理方法、设备、系统及存储介质。
背景技术
伴随信息时代的来临,计算机网络技术已经融入到我国人民的日常工作和日常生活中,尤其是在信息管理和处理方面更是依赖于计算机网络技术的科学性和便捷性。但是计算机网络环境相对来说比较复杂,常常在技术应用过程中出现一些安全问题,例如文件丢失、文件损坏及信息泄露等等。
目前,没有一种有效地对通信异常行为进行检测的方法。
发明内容
本申请的多个方面提供一种数据处理方法、设备、系统及存储介质,用以检测网络通信中存在指定行为的用户,提高检测效率和检出率。
本申请实施例提供一种数据处理方法,包括:
获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并获取已知具有指定行为的第二用户关联的第二通信行为数据;
根据所述第一通信行为数据和所述第二通信行为数据,构建交互关系图,所述第一用户和所述第二用户是所述交互关系图中的节点;
对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示;
根据所述交互关系图中的节点的向量表示,识别出所述第一用户中存在指定行为的目标用户。
本申请实施例还提供一种数据处理方法,包括:
响应于界面展示操作,展示人机交互界面;
响应于在所述人机交互界面上的数据配置操作,获取第一通信行为数据和第二通信行为数据,其中,第一通信行为数据为待识别时段内存在通信关系的第一用户之间的通信数据,第二通信行为数据为已知具有指定行为的第二用户关联的通信数据;
响应于在所述人机交互界面上的交互关系图构建操作,获取交互关系图;
响应于在所述人机交互界面上的目标用户识别操作,识别出第一用户中存在指定行为的目标用户。
本申请实施例还提供一种服务器,包括:存储器和处理器;
所述存储器,用于存储一条或多条计算机指令;
所述处理器,用于执行所述一条或多条计算机指令,以用于:
获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并获取已知具有指定行为的第二用户关联的第二通信行为数据;
根据所述第一通信行为数据和所述第二通信行为数据,构建交互关系图,所述第一用户和所述第二用户是所述交互关系图中的节点;
对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示;
根据所述交互关系图中的节点的向量表示,识别出所述第一用户中存在指定行为的目标用户。
本申请实施例还提供一种通信系统,包括:多个通信终端和通信服务器;
每个通信终端,用于通过所述通信服务器与其它通信终端进行通信;
所述通信服务器,用于负责所述多个通信终端之间的通信,以及获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并获取已知具有指定行为的第二用户关联的第二通信行为数据;根据所述第一通信行为数据和所述第二通信行为数据,构建交互关系图,所述第一用户和所述第二用户是所述交互关系图中的节点;对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示;根据所述交互关系图中的节点的向量表示,识别出所述第一用户中存在指定行为的目标用户。
本申请实施例还提供一种通信系统,包括:多个通信终端、通信服务器以及监控服务器;
每个通信终端,用于通过所述通信服务器与其它通信终端进行通信
所述通信服务器,用于负责多个通信终端之间的通信,并向所述监控服务器提供待识别时段内存在通信关系的第一用户之间的第一通信行为数据,以及已知具有指定行为的第二用户关联的第二通信行为数据;
所述监控服务器,用于接收通信服务器发送的待识别时段第一通信行为数据和第二通信行为数据;根据所述第一通信行为数据和所述第二通信行为数据,构建交互关系图,所述第一用户和所述第二用户是所述交互关系图中的节点;对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示;根据所述交互关系图中的节点的向量表示,识别出所述第一用户中存在指定行为的目标用户。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,当所述计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器执行包括以下的动作:
获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并获取已知具有指定行为的第二用户关联的第二通信行为数据;
根据所述第一通信行为数据和所述第二通信行为数据,构建交互关系图,所述第一用户和所述第二用户是所述交互关系图中的节点;
对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示;
根据所述交互关系图中的节点的向量表示,识别出所述第一用户中存在指定行为的目标用户。
本申请实施例还提供一种服务器,包括:存储器和处理器;
所述存储器,用于存储一条或多条计算机指令;
所述处理器,用于执行所述一条或多条计算机指令,以用于:
响应于界面展示操作,展示人机交互界面;
响应于在所述人机交互界面上的数据配置操作,获取第一通信行为数据和第二通信行为数据,其中,第一通信行为数据为待识别时段内存在通信关系的第一用户之间的通信数据,第二通信行为数据为已知具有指定行为的第二用户关联的通信数据;
响应于在所述人机交互界面上的交互关系图构建操作,获取交互关系图;
响应于在所述人机交互界面上的目标用户识别操作,识别出第一用户中存在指定行为的目标用户。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,当所述计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器执行包括以下的动作:
响应于界面展示操作,展示人机交互界面;
响应于在所述人机交互界面上的数据配置操作,获取第一通信行为数据和第二通信行为数据,其中,第一通信行为数据为待识别时段内存在通信关系的第一用户之间的通信数据,第二通信行为数据为已知具有指定行为的第二用户关联的通信数据;
响应于在所述人机交互界面上的交互关系图构建操作,获取交互关系图;
响应于在所述人机交互界面上的目标用户识别操作,识别出第一用户中存在指定行为的目标用户。
在本申请实施例中,以已知具有指定行为的用户的通信行为数据为基础,结合待识别时段内存在通信关系的用户之间的通信行为数据,将用户作为节点构建交互关系图;进一步,对交互关系图中的节点进行向量化处理,并利用交互关系图中的节点的向量表示,识别出在待识别时段内存在通信关系的用户中具有指定行为的目标用户,提高对具有指定行为的用户的检测效率和检出率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1a为本申请一示例性实施例提供的一种通信系统的结构示意图;
图1b为本申请另一示例性实施例提供的一种通信系统的结构示意图;
图2a为本申请示例性给出的构建交互关系图的示意图;
图2b为本申请示例性给出的构建交互关系图的示意图;
图2c为本申请示例性给出的构建交互关系图的示意图;
图3为本申请示例性实施例通信系统的工作原理图;
图4为本申请示例性实施例提供的一种数据处理方法的流程示意图;
图5为本申请又一示例性实施例提供的一种数据处理方法的流程示意图;
图6为本申请示例性实施例提供的一种服务器的结构示意图;
图7为本申请又一示例性实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,针对用户在网络通信过程中产生的通信数据进行用户异常行为检测,需要依靠人为经验去进行特征抽取,召回率和准确率都不高,异常用户的检出率低。
针对上述存在的技术问题,在本申请实施例中,以已知具有指定行为的用户的通信行为数据为基础,结合待识别时段内存在通信关系的用户之间的通信行为数据,将用户作为节点构建交互关系图;进一步,对交互关系图中的节点进行向量化处理,并利用交互关系图中的节点的向量表示,识别出在待识别时段内存在通信关系的用户中具有指定行为的目标用户,提高对具有指定行为的用户的检测效率和检出率。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1a为本申请一示例性实施例提供的一种通信系统的结构示意图。如图1a所示,该通信系统包括:多个通信终端10和通信服务器11。其中,多个通信终端10与通信服务器11之间建立通信连接,多个通信终端10通过通信服务器11进行通信,通信服务器11用于负责所述多个通信终端之间的通信。
在本实施例中,多个通信终端10与通信服务器11通过无线或有线建立通信连接。可选地,多个通信终端10可以采用WIFI、蓝牙、红外等通信方式与通信服务器11建立通信连接,或者,多个通信终端10也可以通过移动网络与通信服务器11建立通信连接。其中,移动网络的网络制式可以为2G(GSM)、2.5G(GPRS)、3G(WCDMA、TD-SCDMA、CDMA2000、UTMS)、4G(LTE)、4G+(LTE+)、WiMax等中的任意一种。
在本实施例中,通信终端10是指位于用户侧,可与用户交互,且具有用户所需的计算、上网、通信等功能的计算机设备,其实现形式可以有多种,例如可以是智能手机、个人电脑、穿戴设备、平板电脑等。
在本实施例中,通信服务器11可以为多个通信终端10提供数据支持、计算服务以及一些管理服务,以保证多个通信终端10相互之间能够进行通信。通信服务器11会管理与通信终端10对应的用户信息,例如用户账号、登录密码以及其它一些注册信息,另外还会存储和管理多个通信终端10之间的通信数据,以及各通信终端10的状态、当前所属的群组、当前等级等信息。在本实施例中,并不限定通信服务器11的实现形态,例如通信服务器11可以是常规服务器、云服务器、云主机、虚拟中心等服务器设备。其中,服务器设备的构成主要包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类型。通信服务器11可以包含一台网站服务器,也可以包含多台网站服务器。用户可以通过通信终端10访问通信服务器11的网络数据。
在一些应用场景中,通信终端10可以为企业内部员工所使用的安装有通信软件或通信类APP的终端设备,通信服务器11为企业内部的服务器。例如,企业内部员工的终端设备可以是安装有即时通信客户端(如软件或APP)的智能手机、个人电脑或平板电脑等,则企业内部的服务器可以是安装有即时通信服务端的服务器。又例如,企业内部员工的终端设备也可以是安装有邮箱客户端(如软件或APP)的智能手机、个人电脑或平板电脑等,则企业内部的服务器可以是安装有邮箱服务端的服务器。考虑到公司内部员工可能拥有公司的多种权限,能够接触到大量的机密数据或敏感数据,从数据安全角度考虑,有必要针对企业内部员工之间的通信行为进行检测。值得说明的是,企业内部员工使用的通信终端10可以包括企业内部员工在企业内使用的终端设备,也包括企业内部员工在企业外部使用的终端设备。当然,企业应用场景中对企业内部员工之间的通信行为进行检测,仅为一种示例。例如,对于一些像论坛、知识问答等网站等也有必要根据网站运行需求针对其网络用户之间的通信行为进行检测。以论坛通信系统为例,网络用户的终端设备可以是安装有论坛客户端(如软件或APP)或浏览器的智能手机、个人电脑或平板电脑等,相应通信服务器可以是论坛的网站服务器。
无论是何种应用场景,在本实施例的通信系统中,都可以对通信用户之间的通信行为进行检测。根据应用场景的不同,对通信用户之间的通信行为进行检测的目的以及需要检测的通信行为都会有所不同。为了便于统一描述,将各应用场景中需要检测的通信行为统称为指定行为。例如,在企业场景中,指定行为可以是一些泄密行为,或者符合企业通信要求的良好通信行为。又例如,在一些问答类的网站中,指定行为可以是提问的行为、回答问题的行为或者发布指定内容的行为等。
无论是何种应用场景,在需要检测是否存在指定行为的用户时,通信服务器11可从所管理的多个通信终端10之间的通信数据中,获取在待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并可获取已知具有指定行为的第二用户关联的第二通信行为数据。其中,第一用户是指在待识别时段内需要识别是否存在指定行为的通信用户,相应地,第二用户是指已经识别出具有指定行为的通信用户。其中,第一通信行为数据是指在待识别时段内存在通信关系的第一用户之间产生的通信行为数据;而第二通信行为数据是指第二用户与第三用户之间产生的通信行为数据,第三用户是指在某个时段内与第二用户存在通信关系的用户,尤其是指在识别出第二用户的时段内与第二用户存在通信关系的用户。另外,本申请实施例并不限定第一用户的数量,优选地为多个。
同理,在本申请实施例中,不限定第二用户的数量,第二用户可以是一个,也可以是多个。第二用户可以为人为判断的具有指定行为的用户,也可以为采用本申请实施例提供的方法检测出的具有指定行为的用户,还可以为通过其他检测方法检测出的用户,对此不做限定。另外,第二用户可以是在待识别时段之前识别出的具有指定行为的通信用户,也可以是在待识别时段之后识别出的具有指定行为的通信用户。
在本申请实施例中,第二通信行为数据可以为识别出第二用户具有指定行为的特定时段内与第二用户相关的所有通信行为数据,或部分通信行为数据,但并不限于此。例如,在识别出第二用户具有指定行为之后,也可以收包含特定时段在内的更长时段内与第二用户相关的通信行为数据,作为第二通信行为数据。例如,第二用户在6月5日被确定为具有可疑行为的用户,可以将第二用户在6月5日当天的通信行为数据作为该第二通信行为数据,也可以将第二用户在6月4日至6月6日三天内的通信行为数据作为该第二通信行为数据。本申请实施例对第一用户的数量、第二用户的数量以及待识别时段的时长均不作限定,可以根据实际情况作出调整。
进一步,通信服务器11基于第一通信行为数据和第二通信行为数据,将第一用户和第二用户作为图中的节点,构建交互关系图;再进一步,通信服务器11对交互关系图中的节点进行向量化处理,得到交互关系图中的节点的向量表示;最后,通信服务器11根据交互关系图中的节点的向量表示,识别出第一用户中存在指定行为的目标用户。
可选地,可以在待识别时段内存在通信关系的第一用户之间产生的通信日志数据中获取第一通信行为数据,相应地,可以从已知具有指定行为的第二用户产生的通信日志数据中获取第二通信行为数据。
待识别时段在本申请的一些实施例中,根据第一通信行为数据和第二通信行为数据,构建交互关系图。其中,构建交互关系图的一种可选实施例为,将第一用户、第二用户、第二通信行为数据中与第二用户存在通信行为的第三用户、以及第一通信行为数据和第二通信行为数据中被传输的信息对象分别作为节点;根据第一通信行为数据和第二通信行为数据中被传输的信息对象的传输方向,在节点之间添加有向边,以得到交互关系图。
可选地,根据第一通信行为数据和第二通信行为数据中被传输的信息对象的传输方向,在节点之间添加有向边,以得到交互关系图。一种可选实施例为,针对第一通信行为数据和第二通信行为数据中被传输的每个信息对象,根据信息对象的传输方向,在信息对象的发端用户和收端用户对应的节点之间添加一条有向边,并在信息对象与信息对象的收端用户对应的节点之间添加一条有向边并在信息对象与信息对象的收端用户对应的节点之间添加一条有向边,得到交互关系图。
在本申请上述及下述实施例中,对被传输的信息对象的格式不作限定,可以为文件、语音、视频、动图、文字片段或者图片,通信服务器11的日志数据中记录被传输的信息对象的标识。信息对象的标识可以为信息对象ID等。
下面结合图2a、图2b和图2c对交互关系图的构建方式作出进一步说明。
图2a、图2b和图2c为本申请示例性给出的构建交互关系图的三种示意图。
如图2a所示,用户a传输文件f1给用户b,在此次用户a上传文件的行为中,构建交互关系图的方式如下:将用户a、用户b和文件f1分别作为节点,在用户a节点和用户b节点之间添加一条由用户a节点指向用户b节点的有向边,在用户a节点和文件f1节点之间,添加一条由用户a节点指向文件f1节点的有向边,因此,在用户a上传文件的行为中,用户a节点有两个出度,用户b节点和文件f1节点分别有一个入度。
如图2b所示,用户b下载用户a向其传输的文件f1,在此次用户b下载文件的行为中,构建交互关系图的方式如下:将用户a、用户b和文件f1分别作为节点,在用户a节点和用户b节点之间添加一条由用户a节点指向用户b节点的有向边,在用户b节点和文件f1节点之间,添加一条由文件f1节点指向用户b节点的有向边,因此,用户b下载文件的行为中,用户b节点有两个入度,用户a节点和文件f1节点分别有一个入度。
如图2c所示,用户a传输文件f1给用户b,且用户b下载用户a向其传输的文件f1,在用户a上传文件f1以及用户b下载文件f1的完整的文件传输的行为中,构建交互关系图的方式如下:在用户a节点和用户b节点之间添加一条由用户a节点指向用户b节点的有向边,在文件f1节点和用户b添加一条由文件f1节点指向用户b节点的有向边,在用户a节点和文件f1节点之间添加一条由用户a节点指向文件f1节点的有向边,因此,在用户a上传文件f1以及用户b下载文件f1的完整的文件传输的行为中,用户a节点有两个出度,文件f1节点有一个出度和一个入度,用户b节点有两个入度。
在本申请实施例中,通信服务器11在得到构建完成的交互关系图后,对交互关系图中的节点进行向量化处理,得到交互关系图中的节点的向量表示。一种可选实施例为,随机游走交互关系图中的每个节点进行序列采样,得到节点序列;将节点序列输入预设的网络嵌入学习模型,得到每个节点的向量表示。
在上述实施例中,交互关系图中的节点进行向量化处理可以采用DeepWalk算法、Node2Vec算法或Struct2Vec算法。下面以Node2Vec算法为例说明对构建完成的交互关系图中的节点进行向量化处理,得到交互关系图中的节点的向量表示的步骤:随机游走交互关系图中的每个节点进行序列采样,引入两个超参数p和q,实现参数控制跳转概率的随机游走,得到采样的节点序列;在进一步的基于SkipGram学习模型,对采样的节点序列进行概率学习和推断,最终获得交互关系图中的每个节点的向量化表示。
在本实施例中,通信服务器11在对交互关系图中的节点的向量表示后,通信服务器11根据交互关系图中的节点的向量表示,识别出第一用户中存在指定行为的目标用户。一种可选实施例为,从交互关系图中的节点中,识别出第一用户和第二用户对应的节点;根据第一用户和第二用户对应的节点的向量表示,计算第一用户与第二用户之间的相似度;根据第一用户与第二用户之间的相似度,从第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
在一可选实施例中,根据第一用户和第二用户对应的节点的向量表示,计算第一用户与第二用户之间的相似度,根据第一用户与第二用户之间的相似度,从第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户,包括下列几种情况:
情况一:第一用户中包括第二用户;分别计算第一用户中除去第二用户后每个剩余用户与每个第二用户之间的相似度,从剩余用户中选取相似度大于第一相似度阈值的用户,作为具有指定行为的目标用户。
情况二:第一用户中不包括第二用户;分别计算每个第一用户和第二用户的相似度,从第一用户中选取相似度大于第二相似度阈值的用户,作为具有指定行为的目标用户。
在上述实施例中,可以采用欧式距离,或者皮尔逊相关系数或者余弦相似性计算第一用户与第二用户之间的相似度。本申请实施例对第一相似度阈值和第二相似度阈值不作限定,第一相似度阈值和第二相似度阈值可以根据实际情况作出调整。
在本申请实施例中,通信服务器11在识别出第一用户中存在指定行为的目标用户之后,可以针对目标用户采取一系列的安全防护措施,安全防护措施包括但不限于以下几种:
情形一,通信服务器11向目标用户的终端设备发送通知消息,以通知目标用户其具有指定行为。其中,本申请实施例对通知目标用户具有指定行为的方式不作限定,例如,在目标用户的终端设备进行弹窗警示、短信提醒等。
情形二,通信服务器11向管理人员的终端设备输出目标用户的信息,以供管理人员针对目标用户进行监控。例如,通信服务器11向审计人员所使用的终端设备,以供审计人员根据目标用户的信息,采取进一步的措施。
图1b为本申请另一示例性实施例提供的一种通信系统的结构示意图。如图1b所示,该通信系统包括:多个通信终端20、通信服务器21和监控服务器22。其中,多个通信终端20与通信服务器21之间建立通信连接,多个通信终端20通过通信服务器21进行通信,通信服务器21用于负责所述多个通信终端之间的通信。在存在检测指定行为用户的需求时,监控服务器22从通信服务器21中获取检测指定行为用户所需的通信数据,由监控服务器22进行指定行为用户的检测。
在本申请实施例中,通信终端20指位于用户侧,可与用户交互,且具有用户所需的计算、上网、通信等功能的计算机设备,其实现形式可以有多种,例如可以是智能手机、个人电脑、穿戴设备、平板电脑等。
在本实施例中,多个通信终端20与通信服务器11通过无线或有线建立通信连接。可选地,多个通信终端20之间可以采用WIFI、蓝牙、红外等通信方式建立彼此的通信连接,或者,多个通信终端20之间也可以通过移动网络建立彼此的通信连接。其中,移动网络的网络制式可以为2G(GSM)、2.5G(GPRS)、3G(WCDMA、TD-SCDMA、CDMA2000、UTMS)、4G(LTE)、4G+(LTE+)、WiMax等中的任意一种。
在本实施例中,通信服务器21与监控服务器22通过无线或有线建立通信连接。可选地,通信服务器21可以采用WIFI、蓝牙、红外等通信方式与监控服务器22建立通信连接,或者,通信服务器21也可以通过移动网络与通监控服务器22建立通信连接。其中,移动网络的网络制式可以为2G(GSM)、2.5G(GPRS)、3G(WCDMA、TD-SCDMA、CDMA2000、UTMS)、4G(LTE)、4G+(LTE+)、WiMax等中的任意一种。
通信服务器21可以为多个通信终端20提供数据支持、计算服务以及一些管理服务,以保证多个通信终端20相互之间能够进行通信。通信服务器21会管理与通信终端20对应的用户信息,例如用户账号、登录密码以及其它一些注册信息,另外还会存储和管理多个通信终端20之间的通信数据,以及各通信终端20的状态、当前所属的群组、当前等级等信息。在本实施例中,并不限定通信服务器21的实现形态,例如通信服务器21可以是常规服务器、云服务器、云主机、虚拟中心等服务器设备。其中,服务器设备的构成主要包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类型。通信服务器21可以包含一台网站服务器,也可以包含多台网站服务器。用户可以通过通信终端20访问通信服务器21的网络数据。
在本实施例中,并不限定监控服务器22的实现形态,例如监控服务器22可以是常规服务器、云服务器、云主机、虚拟中心等服务器设备。其中,服务器设备的构成主要包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类型。监控服务器22可以包含一台网站服务器,也可以包含多台网站服务器。
在一些应用场景中,通信终端10可以为企业内部员工所使用的安装有通信软件或通信类APP的终端设备,通信服务器11为企业内部的服务器。例如,企业内部员工的终端设备可以是安装有即时通信客户端(如软件或APP)的智能手机、个人电脑或平板电脑等,则企业内部的服务器可以是安装有即时通信服务端的服务器。又例如,企业内部员工的终端设备也可以是安装有邮箱客户端(如软件或APP)的智能手机、个人电脑或平板电脑等,则企业内部的服务器可以是安装有邮箱服务端的服务器。考虑到公司内部员工可能拥有公司的多种权限,能够接触到大量的机密数据或敏感数据,从数据安全角度考虑,有必要针对企业内部员工之间的通信行为进行检测。值得说明的是,企业内部员工使用的通信终端10可以包括企业内部员工在企业内使用的终端设备,也包括企业内部员工在企业外部使用的终端设备。当然,企业应用场景中对企业内部员工之间的通信行为进行检测,仅为一种示例。例如,对于一些像论坛、知识问答等网站等也有必要根据网站运行需求针对其网络用户之间的通信行为进行检测。以论坛通信系统为例,网络用户的终端设备可以是安装有论坛客户端(如软件或APP)或浏览器的智能手机、个人电脑或平板电脑等,相应通信服务器可以是论坛的网站服务器。
在本申请实施例中,监控服务器22从通信服务器21获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,一种可选实施例为,监控服务器22,向通信服务器21发送数据获取请求,数据获取请求携带有待识别时段的信息;通信服务器21在对数据获取请求验证通过后,向监控服务器22返回的待识别时段内存在通信关系的第一用户之间的第一通信行为数据;监控服务器22接收通信服务器根据数据获取请求返回的待识别时段内存在通信关系的第一用户之间的第一通信行为数据。
在本申请实施例中,监控服务器22获取已知具有指定行为的第二用户关联的第二通信行为数据。当第二用户为监控服务器22采用申请下述数据处理方法检测出的具有指定行为的用户时,具有指定行为的第二用户关联的第二通信行为数据可能存储在监控服务器22本地,监控服务器22可以从本地直接调取第二通信行为数据,也可以从通信服务器21获取第二通信行为数据。
在本申请实施中,监控服务器22检测具有指定行为用户的方式可以参照前述实施例中的描述,本申请实施例不再对相关内容作出赘述。
在本申请实施例中,监控服务器22在识别出第一用户中存在指定行为的目标用户之后,可以针对目标用户采取一系列的安全防护措施,安全防护措施包括但不限于以下几种:
情形一,将目标用户的信息发送给通信服务器21,以供通信服务器21对目标用户的通信行为进行监控。
情形二,通信服务器11向目标用户的终端设备发送通知消息,以通知目标用户其具有指定行为。其中,本申请实施例对通知目标用户具有指定行为的方式不作限定,例如,在目标用户的终端设备进行弹窗警示、短信提醒等。
情形三,通信服务器21向管理人员的终端设备输出目标用户的信息,以供管理人员针对目标用户进行监控。例如,通信服务器21向审计人员所使用的终端设备,以供审计人员根据目标用户的信息,采取进一步的措施。
图3为本申请示例性实施例通信系统的工作原理图。在存在检测指定行为用户的需求时,通信服务器11从本地获取在待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并获取已知具有指定行为的第二用户关联的第二通信行为数据,第一通信行为数据和第二通信行为数据均为日志数据;进一步,通信服务器11基于第一通信行为数据和第二通信行为数据,构建交互关系图;再进一步,通信服务器11对交互关系图作为Node2Vec算法的输入对交互关系图中的节点进行向量化处理,得到交互关系图中的节点的向量表示;最后,通信服务器11根据交互关系图中的节点的向量表示,基于欧式距离计算第一用户与第二用户之间的相似度;根据第一用户与第二用户之间的相似度,识别出第一用户中存在指定行为的目标用户。
除上述提供的通信系统之外,本申请一些实施例还提供一种数据处理方法,本申请所提供的数据处理方法可应用于上述通信系统中的通信服务器或监控服务器,但并不限于上述实施例提供的通信系统。图4为本申请示例性实施例提供的一种数据处理方法的流程示意图。如图4所示,该方法包括:
S401:获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据;
S402:获取已知具有指定行为的第二用户关联的第二通信行为数据;
S403:根据第一通信行为数据和第二通信行为数据,构建交互关系图,第一用户和第二用户是交互关系图中的节点;
S404:对交互关系图中的节点进行向量化处理,得到交互关系图中的节点的向量表示;
S405:根据交互关系图中的节点的向量表示,识别出第一用户中存在指定行为的目标用户。
在本申请实施例中,本申请的执行主体可以为多个通信终端提供数据支持、计算服务以及一些管理服务的服务器,在本实施例中,并不限定服务器的实现形态,例如,服务器可以是常规服务器、云服务器、云主机、虚拟中心等服务器设备。其中,服务器设备的构成主要包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类型。服务器包含一台网站服务器,也可以包含多台网站服务器。
在上述实施例及下述实施例中,指定行为包括但不限于下列几种方式:可疑数据泄漏行为和良好通信行为。
在本申请实施例中,第一用户是指在待识别时段内需要识别是否存在指定行为的通信用户,相应地,第二用户是指已经识别出具有指定行为的通信用户。其中,第一通信行为数据是指在待识别时段内存在通信关系的第一用户之间产生的通信行为数据;而第二通信行为数据是指第二用户与第三用户之间产生的通信行为数据,第三用户是指在某个时段内与第二用户存在通信关系的用户,尤其是指在识别出第二用户的时段内与第二用户存在通信关系的用户。另外,本申请实施例并不限定第一用户的数量,优选地为多个。
同理,在本申请实施例中,不限定第二用户的数量,第二用户可以是一个,也可以是多个。第二用户可以为人为判断的具有指定行为的用户,也可以为采用本申请实施例提供的方法检测出的具有指定行为的用户,还可以为通过其他检测方法检测出的用户,对此不做限定。另外,第二用户可以是在待识别时段之前识别出的具有指定行为的通信用户,也可以是在待识别时段之后识别出的具有指定行为的通信用户。
在本申请实施例中,第二通信行为数据可以为识别出第二用户具有指定行为的特定时段内与第二用户相关的所有通信行为数据,或部分通信行为数据,但并不限于此。例如,在识别出第二用户具有指定行为之后,也可以收包含特定时段在内的更长时段内与第二用户相关的通信行为数据,作为第二通信行为数据。例如,第二用户在6月5日被确定为具有可疑行为的用户,可以将第二用户在6月5日当天的通信行为数据作为该第二通信行为数据,也可以将第二用户在6月4日至6月6日三天内的通信行为数据作为该第二通信行为数据。本申请实施例对第一用户的数量、第二用户的数量以及待识别时段的时长均不作限定,可以根据实际情况作出调整。
进一步,通信服务器11基于第一通信行为数据和第二通信行为数据,将第一用户和第二用户作为图中的节点,构建交互关系图;再进一步,通信服务器11对交互关系图中的节点进行向量化处理,得到交互关系图中的节点的向量表示;最后,通信服务器11根据交互关系图中的节点的向量表示,识别出第一用户中存在指定行为的目标用户。
可选地,可以在待识别时段内存在通信关系的第一用户之间产生的通信日志数据中获取第一通信行为数据,相应地,可以从已知具有指定行为的第二用户产生的通信日志数据中获取第二通信行为数据。
在本申请的一些实施例中,根据第一通信行为数据和第二通信行为数据,构建交互关系图。其中,构建交互关系图的一种可选实施例为,将第一用户、第二用户、第二通信行为数据中与第二用户存在通信行为的第三用户、以及第一通信行为数据和第二通信行为数据中被传输的信息对象分别作为节点;根据第一通信行为数据和第二通信行为数据中被传输的信息对象的传输方向,在节点之间添加有向边,以得到交互关系图。
可选地,根据第一通信行为数据和第二通信行为数据中被传输的信息对象的传输方向,在节点之间添加有向边,以得到交互关系图。一种可选实施例为,针对第一通信行为数据和第二通信行为数据中被传输的每个信息对象,根据信息对象的传输方向,在信息对象的发端用户和收端用户对应的节点之间添加一条有向边,并在信息对象与信息对象的收端用户对应的节点之间添加一条有向边并在信息对象与信息对象的收端用户对应的节点之间添加一条有向边,得到交互关系图。
在本申请上述及下述实施例中,对被传输的信息对象的格式不作限定,可以为文件、语音、视频、动图、文字片段或者图片,通信服务器11的日志数据中记录被传输的信息对象的标识。信息对象的标识可以为信息对象ID等。
下面结合图2a、图2b和图2c对交互关系图的构建方式作出进一步说明。
图2a、图2b和图2c为本申请示例性给出的构建交互关系图的三种示意图。
如图2a所示,用户a传输文件f1给用户b,在此次用户a上传文件的行为中,构建交互关系图的方式如下:将用户a、用户b和文件f1分别作为节点,在用户a节点和用户b节点之间添加一条由用户a节点指向用户b节点的有向边,在用户a节点和文件f1节点之间,添加一条由用户a节点指向文件f1节点的有向边,因此,在用户a上传文件的行为中,用户a节点有两个出度,用户b节点和文件f1节点分别有一个入度。
如图2b所示,用户b下载用户a向其传输的文件f1,在此次用户b下载文件的行为中,构建交互关系图的方式如下:将用户a、用户b和文件f1分别作为节点,在用户a节点和用户b节点之间添加一条由用户a节点指向用户b节点的有向边,在用户b节点和文件f1节点之间,添加一条由文件f1节点指向用户b节点的有向边,因此,用户b下载文件的行为中,用户b节点有两个入度,用户a节点和文件f1节点分别有一个入度。
如图2c所示,用户a传输文件f1给用户b,且用户b下载用户a向其传输的文件f1,在用户a上传文件f1以及用户b下载文件f1的完整的文件传输的行为中,构建交互关系图的方式如下:在用户a节点和用户b节点之间添加一条由用户a节点指向用户b节点的有向边,在文件f1节点和用户b添加一条由文件f1节点指向用户b节点的有向边,在用户a节点和文件f1节点之间添加一条由用户a节点指向文件f1节点的有向边,因此,在用户a上传文件f1以及用户b下载文件f1的完整的文件传输的行为中,用户a节点有两个出度,文件f1节点有一个出度和一个入度,用户b节点有两个入度。
在本申请实施例中,在得到构建完成的交互关系图后,对交互关系图中的节点进行向量化处理,得到交互关系图中的节点的向量表示。一种可选实施例为,随机游走交互关系图中的每个节点进行序列采样,得到节点序列;将节点序列输入预设的网络嵌入学习模型,得到每个节点的向量表示。
在上述实施例中,交互关系图中的节点进行向量化处理可以采用DeepWalk算法、Node2Vec算法和Struct2Vec算法。下面以Node2Vec算法为例说明对构建完成的交互关系图中的节点进行向量化处理,得到交互关系图中的节点的向量表示的步骤:随机游走交互关系图中的每个节点进行序列采样,引入两个超参数p和q,实现参数控制跳转概率的随机游走,得到采样的节点序列;在进一步的基于SkipGram学习模型,对采样的节点序列进行概率学习和推断,最终获得交互关系图中的每个节点的向量化表示。
在本实施例中,在对交互关系图中的节点的向量表示后,根据交互关系图中的节点的向量表示,识别出第一用户中存在指定行为的目标用户。一种可选实施例为,从交互关系图中的节点中,识别出第一用户和第二用户对应的节点;根据第一用户和第二用户对应的节点的向量表示,计算第一用户与第二用户之间的相似度;根据第一用户与第二用户之间的相似度,从第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
在一可选实施例中,根据第一用户和第二用户对应的节点的向量表示,计算第一用户与第二用户之间的相似度,根据第一用户与第二用户之间的相似度,从第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户,包括下列几种情况:
情况一:第一用户中包括第二用户;分别计算第一用户中除去第二用户后每个剩余用户与每个第二用户之间的相似度,从剩余用户中选取相似度大于第一相似度阈值的用户,作为具有指定行为的目标用户。
情况二:第一用户中不包括第二用户;分别计算每个第一用户和第二用户的相似度,从第一用户中选取相似度大于第二相似度阈值的用户,作为具有指定行为的目标用户。
在上述实施例中,可以采用欧式距离,或者皮尔逊相关系数或者余弦相似性计算第一用户与第二用户之间的相似度。本申请实施例对第一相似度阈值和第二相似度阈值不作限定,第一相似度阈值和第二相似度阈值可以根据实际情况作出调整。
在本申请实施例中,通信服务器11在识别出第一用户中存在指定行为的目标用户之后,可以针对目标用户采取一系列的安全防护措施,安全防护措施包括但不限于以下几种:
情形一,将目标用户的信息发送给通信服务器21,以供通信服务器21对目标用户的通信行为进行监控。
情形二,通信服务器11向目标用户的终端设备发送通知消息,以通知目标用户其具有指定行为。其中,本申请实施例对通知目标用户具有指定行为的方式不作限定,例如,在目标用户的终端设备进行弹窗警示、短信提醒等。
情形三,通信服务器21向管理人员的终端设备输出目标用户的信息,以供管理人员针对目标用户进行监控。例如,通信服务器21向审计人员所使用的终端设备,以供审计人员根据目标用户的信息,采取进一步的措施。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤S401至步骤S405的执行主体可以为设备A;又比如,步骤S401和步骤S402的执行主体可以为设备A,步骤S401至步骤S404的执行主体可以为设备B;等等。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如S401、S402等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。
除上述提供的通信系统之外,本申请一些实施例还提供一种数据处理方法,本申请所提供的数据处理方法可应用于上述通信系统中的通信服务器或监控服务器,但并不限于上述实施例提供的通信系统。图5为本申请示例性实施例提供的一种数据处理方法的流程示意图。如图5所示,该方法包括:
S501:响应于界面展示操作,展示人机交互界面;
S502:响应于在人机交互界面上的数据配置操作,获取第一通信行为数据和第二通信行为数据,其中,第一通信行为数据为待识别时段内存在通信关系的第一用户之间的通信数据,第二通信行为数据为已知具有指定行为的第二用户关联的通信数据;
S503:响应于在人机交互界面上的交互关系图构建操作,获取交互关系图;
S504:响应于在人机交互界面上的目标用户识别操作,识别出第一用户中存在指定行为的目标用户。
在本申请实施例中,本申请的执行主体可以为多个通信终端提供数据支持、计算服务以及一些管理服务的服务器,在本实施例中,并不限定服务器的实现形态,例如,服务器可以是常规服务器、云服务器、云主机、虚拟中心等服务器设备。其中,服务器设备的构成主要包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类型。服务器包含一台网站服务器,也可以包含多台网站服务器。
在本实施例中,响应于界面展示操作,展示人机交互界面。其中,界面展示操作包括但不限于以下几种:单击、双击、长按和鼠标悬停。人机交互界面中可以包括各种类型的输入项以及功能控件,以供用户配置参数和执行相应操作。
在上述实施例中,响应于在人机交互界面上的数据配置操作,获取第一通信行为数据。一种可实现的方式为,响应于在人机交互界面上输入待识别时间段的操作,获取待识别时间段;根据待识别时间段,从通信服务器获取待识别时间段内的第一通信行为数据。其中,响应于在人机交互界面上输入待识别时间段的操作,获取待识别时间段,包括但不限于下列几种方式:
方式一,响应于在人机交互界面上的时间段输入项中手动输入待识别时间段的操作,获取待识别时间段。
方式二,人机交互界面上展示有多个第一候选时间段;响应于对多个第一候选时间段的选择操作,确定被选择的第一候选时间段作为待识别时间段。
在上述实施例中,响应于在人机交互界面上的数据配置操作,获取第二通信行为数据。一种可实现的方式为,响应于在人机交互界面上输入第二用户的操作,获取第二用户;响应于在人机交互界面上输入特定时段的操作,获取特定时段;根据特定时段和第二用户,从通信服务器获取第二用户在特定时段内的第二通信行为数据。其中,响应于在人机交互界面上输入第二用户的操作,获取第二用户,包括但不限于下列几种方式:
方式一,响应于在人机交互界面上的用户信息输入项中手动输入第二用户的操作,获取第二用户。
方式二,响应于对多个候选用户的选择操作,确定被选择的候选用户作为第二用户。
响应于在人机交互界面上输入特定时段的操作,获取特定时段,包括但不限于以下几种方式:
方式一:响应于在人机交互界面上的时间段输入项中手动输入特定时段的操作,获取待识别时间段。
方式二:响应于对多个第二候选时间段的选择操作,确定被选择的第二候选时间段作为特定时段。
在本实施例中,关于识别出第一用户中存在指定行为的目标用户的方法,可参照前述各实施例的描述,本实施例不再赘述。
图6为本申请一示例性实施例提供的一种服务器的结构示意图。如图6所示,该服务器包括:存储器601和处理器602,还包括通信组件603和电源组件604等必须组件。
存储器601,用于存储计算机程序,并可被配置为存储其它各种数据以支持在数据处理设备上的操作。这些数据的示例包括用于在服务器上操作的任何应用程序或方法的指令。
存储器601,可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
通信组件603,用于与其他设备建立通信连接。
处理器602,可执行存储器601中存储的计算机指令,以用于:获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并获取已知具有指定行为的第二用户关联的第二通信行为数据;根据第一通信行为数据和第二通信行为数据,构建交互关系图,第一用户和第二用户是交互关系图中的节点;对交互关系图中的节点进行向量化处理,得到交互关系图中的节点的向量表示;根据交互关系图中的节点的向量表示,识别出第一用户中存在指定行为的目标用户。
可选地,处理器602,在根据第一通信行为数据和第二通信行为数据,构建交互关系图时,具体用于:将第一用户、第二用户、第二通信行为数据中与第二用户存在通信行为的第三用户、以及第一通信行为数据和第二通信行为数据中被传输的信息对象分别作为节点;根据第一通信行为数据和第二通信行为数据中被传输的信息对象的传输方向,在节点之间添加有向边,以得到交互关系图。
可选地,处理器602,在根据第一通信行为数据和第二通信行为数据中被传输的信息对象的传输方向,在节点之间添加有向边,以得到交互关系图时,具体用于:针对第一通信行为数据和第二通信行为数据中被传输的每个信息对象,根据信息对象的传输方向,在信息对象的发端用户和收端用户对应的节点之间添加一条有向边,并在信息对象与信息对象的收端用户对应的节点之间添加一条有向边并在信息对象与信息对象的收端用户对应的节点之间添加一条有向边,得到交互关系图。
可选地,处理器602,在对交互关系图中的节点进行向量化处理,得到交互关系图中的节点的向量表示时,具体用于:随机游走交互关系图中的每个节点进行序列采样,得到节点序列;将节点序列输入预设的网络嵌入学习模型,得到每个节点的向量表示。
可选地,处理器602,在根据交互关系图中的节点的向量表示,识别出第一用户中存在指定行为的目标用户时,具体用于:从交互关系图中的节点中,识别出第一用户和第二用户对应的节点;根据第一用户和第二用户对应的节点的向量表示,计算第一用户与第二用户之间的相似度;根据第一用户与第二用户之间的相似度,从第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
可选地,处理器602,在获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据时,具体用于:向通信服务器发送数据获取请求,数据获取请求携带有待识别时段的信息;接收通信服务器根据数据获取请求返回的待识别时段内存在通信关系的第一用户之间的第一通信行为数据。
可选地,处理器602,在识别出第一用户中存在指定行为的目标用户之后,还包括以下至少一种操作:向目标用户的终端设备发送通知消息,以通知目标用户其具有指定行为;将目标用户的信息发送给通信服务器,以供通信服务器对目标用户的通信行为进行监控;向管理人员的终端设备输出目标用户的信息,以供管理人员针对目标用户进行监控。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质。当计算机可读存储介质存储计算机程序,且计算机程序被一个或多个处理器执行时,致使一个或多个处理器执行图4方法实施例中的各步骤。
图7为本申请一示例性实施例提供的一种服务器的结构示意图。如图7所示,该服务器包括:存储器701和处理器702,还包括通信组件703和电源组件704等必须组件。
存储器701,用于存储计算机程序,并可被配置为存储其它各种数据以支持在数据处理设备上的操作。这些数据的示例包括用于在服务器上操作的任何应用程序或方法的指令。
存储器701,可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
通信组件703,用于与其他设备建立通信连接。
处理器702,可执行存储器701中存储的计算机指令,以用于:响应于在人机交互界面上的数据配置操作,获取第一通信行为数据,包括:响应于在人机交互界面上输入待识别时间段的操作,获取待识别时间段;根据待识别时间段,从通信服务器获取待识别时间段内的第一通信行为数据。
可选地,处理器702在人机交互界面上展示有多个第一候选时间段;响应于在人机交互界面上输入待识别时间段的操作,获取待识别时间段时,具体用于:响应于对多个第一候选时间段的选择操作,确定被选择的第一候选时间段作为待识别时间段。
可选地,处理器702在响应于在人机交互界面上的数据配置操作,获取第二通信行为数据时,具体用于:响应于在人机交互界面上输入第二用户的操作,获取第二用户;响应于在人机交互界面上输入特定时段的操作,获取特定时段;根据特定时段和第二用户,从通信服务器获取第二用户在特定时段内的第二通信行为数据。
可选地,人机交互界面上展示有多个候选用户,处理器702在响应于在人机交互界面上输入第二用户的操作,获取第二用户时,具体用于:响应于对多个候选用户的选择操作,确定被选择的候选用户作为第二用户。
可选地,人机交互界面上展示有多个第二候选时间段;处理器702在响应于在人机交互界面上输入特定时段的操作,获取特定时段时,具体用于:响应于对多个第二候选时间段的选择操作,确定被选择的第二候选时间段作为特定时段。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质。当计算机可读存储介质存储计算机程序,且计算机程序被一个或多个处理器执行时,致使一个或多个处理器执行图5方法实施例中的各步骤。
上述图6和图7中的通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件还包括近场通信(NFC)技术、射频识别(RFID)技术、红外数据协会(IrDA)技术、超宽带(UWB)技术和蓝牙(BT)技术等,以促进短程通信。
上述图6和图7中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
在本申请实施例中,以已知具有指定行为的用户的通信行为数据为基础,结合待识别时段内存在通信关系的用户之间的通信行为数据,将用户作为节点构建交互关系图;进一步,对交互关系图中的节点进行向量化处理,并利用交互关系图中的节点的向量表示,识别出在待识别时段内存在通信关系的用户中具有指定行为的目标用户,提高对具有指定行为的用户的检测效率和检出率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (18)

1.一种数据处理方法,其特征在于,包括:
获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并获取已知具有指定行为的第二用户关联的第二通信行为数据;
将所述第一用户、所述第二用户、所述第二通信行为数据中与所述第二用户存在通信行为的第三用户、以及所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象分别作为节点;
根据所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象的传输方向,在所述节点之间添加有向边,以得到交互关系图;
对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示;
从所述交互关系图中的节点中,识别出所述第一用户和所述第二用户对应的节点;
根据所述第一用户和所述第二用户对应的节点的向量表示,计算所述第一用户与所述第二用户之间的相似度;
根据所述第一用户与所述第二用户之间的相似度,从所述第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
2.根据权利要求1所述的方法,其特征在于,根据所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象的传输方向,在所述节点之间添加有向边,以得到所述交互关系图,包括:
针对所述第一通信行为数据和所述第二通信行为数据中被传输的每个信息对象,根据所述信息对象的传输方向,在所述信息对象的发端用户和收端用户对应的节点之间添加一条有向边,并在所述信息对象与所述信息对象的收端用户对应的节点之间添加一条有向边或者在发端用户与信息对象对应的节点之间添加一条有向边,得到所述交互关系图。
3.根据权利要求1所述的方法,其特征在于,对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示,包括:
随机游走交互关系图中的每个节点进行序列采样,得到节点序列;
将所述节点序列输入预设的网络嵌入学习模型,得到每个节点的向量表示。
4.根据权利要求1-3任一项所述的方法,其特征在于,获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,包括:
向通信服务器发送数据获取请求,所述数据获取请求携带有所述待识别时段的信息;
接收所述通信服务器根据所述数据获取请求返回的所述待识别时段内存在通信关系的第一用户之间的第一通信行为数据。
5.根据权利要求4所述的方法,其特征在于,在识别出所述第一用户中存在指定行为的目标用户之后,还包括以下至少一种操作:
向所述目标用户的终端设备发送通知消息,以通知所述目标用户其具有指定行为;
将所述目标用户的信息发送给所述通信服务器,以供所述通信服务器对所述目标用户的通信行为进行监控;
向管理人员的终端设备输出所述目标用户的信息,以供所述管理人员针对所述目标用户进行监控。
6.一种数据处理方法,其特征在于,包括:
响应于界面展示操作,展示人机交互界面;
响应于在所述人机交互界面上的数据配置操作,获取第一通信行为数据和第二通信行为数据,其中,第一通信行为数据为待识别时段内存在通信关系的第一用户之间的通信数据,第二通信行为数据为已知具有指定行为的第二用户关联的通信数据;
响应于在所述人机交互界面上的交互关系图构建操作,将所述第一用户、所述第二用户、所述第二通信行为数据中与所述第二用户存在通信行为的第三用户、以及所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象分别作为节点;以及根据所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象的传输方向,在所述节点之间添加有向边,以得到所述交互关系图;
响应于在所述人机交互界面上的目标用户识别操作,从所述交互关系图中的节点中,识别出所述第一用户和所述第二用户对应的节点;根据所述第一用户和所述第二用户对应的节点的向量表示,计算所述第一用户与所述第二用户之间的相似度;根据所述第一用户与所述第二用户之间的相似度,从所述第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
7.根据权利要求6所述的方法,其特征在于,响应于在所述人机交互界面上的数据配置操作,获取第一通信行为数据,包括:响应于在所述人机交互界面上输入待识别时间段的操作,获取待识别时间段;
根据所述待识别时间段,从通信服务器获取待识别时间段内的第一通信行为数据。
8.根据权利要求7所述的方法,其特征在于,所述人机交互界面上展示有多个第一候选时间段;响应于在所述人机交互界面上输入待识别时间段的操作,获取待识别时间段,包括:
响应于对所述多个第一候选时间段的选择操作,确定被选择的第一候选时间段作为所述待识别时间段。
9.根据权利要求6所述的方法,其特征在于,响应于在所述人机交互界面上的数据配置操作,获取第二通信行为数据,包括:
响应于在所述人机交互界面上输入第二用户的操作,获取第二用户;
响应于在所述人机交互界面上输入特定时段的操作,获取特定时段;
根据所述特定时段和第二用户,从通信服务器获取第二用户在特定时段内的第二通信行为数据。
10.根据权利要求9所述的方法,其特征在于,所述人机交互界面上展示有多个候选用户,响应于在所述人机交互界面上输入第二用户的操作,获取第二用户,包括:
响应于对所述多个候选用户的选择操作,确定被选择的候选用户作为所述第二用户。
11.根据权利要求9所述的方法,其特征在于,所述人机交互界面上展示有多个第二候选时间段;响应于在所述人机交互界面上输入特定时段的操作,获取特定时段,包括:
响应于对所述多个第二候选时间段的选择操作,确定被选择的第二候选时间段作为所述特定时段。
12.一种服务器,其特征在于,包括:存储器和处理器;
所述存储器,用于存储一条或多条计算机指令;
所述处理器,用于执行所述一条或多条计算机指令,以用于:
获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并获取已知具有指定行为的第二用户关联的第二通信行为数据;
将所述第一用户、所述第二用户、所述第二通信行为数据中与所述第二用户存在通信行为的第三用户、以及所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象分别作为节点;
根据所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象的传输方向,在所述节点之间添加有向边,以得到交互关系图;
对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示;
从所述交互关系图中的节点中,识别出所述第一用户和所述第二用户对应的节点;
根据所述第一用户和所述第二用户对应的节点的向量表示,计算所述第一用户与所述第二用户之间的相似度;
根据所述第一用户与所述第二用户之间的相似度,从所述第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
13.一种通信系统,其特征在于,包括:多个通信终端和通信服务器;
每个通信终端,用于通过所述通信服务器与其它通信终端进行通信;
所述通信服务器,用于负责所述多个通信终端之间的通信,以及获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并获取已知具有指定行为的第二用户关联的第二通信行为数据;将所述第一用户、所述第二用户、所述第二通信行为数据中与所述第二用户存在通信行为的第三用户、以及所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象分别作为节点;根据所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象的传输方向,在所述节点之间添加有向边,以得到交互关系图;对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示;从所述交互关系图中的节点中,识别出所述第一用户和所述第二用户对应的节点;根据所述第一用户和所述第二用户对应的节点的向量表示,计算所述第一用户与所述第二用户之间的相似度;根据所述第一用户与所述第二用户之间的相似度,从所述第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
14.一种通信系统,其特征在于,包括:多个通信终端、通信服务器以及监控服务器;
每个通信终端,用于通过所述通信服务器与其它通信终端进行通信
所述通信服务器,用于负责多个通信终端之间的通信,并向所述监控服务器提供待识别时段内存在通信关系的第一用户之间的第一通信行为数据,以及已知具有指定行为的第二用户关联的第二通信行为数据;
所述监控服务器,用于接收通信服务器发送的待识别时段第一通信行为数据和第二通信行为数据;将所述第一用户、所述第二用户、所述第二通信行为数据中与所述第二用户存在通信行为的第三用户、以及所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象分别作为节点;根据所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象的传输方向,在所述节点之间添加有向边,以得到交互关系图;对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示;从所述交互关系图中的节点中,识别出所述第一用户和所述第二用户对应的节点;根据所述第一用户和所述第二用户对应的节点的向量表示,计算所述第一用户与所述第二用户之间的相似度;根据所述第一用户与所述第二用户之间的相似度,从所述第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
15.根据权利要求14所述的通信系统,其特征在于,所述通信系统为即时通信系统,或者邮件通信系统,或者论坛通信系统。
16.一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器执行包括以下的动作:
获取待识别时段内存在通信关系的第一用户之间的第一通信行为数据,并获取已知具有指定行为的第二用户关联的第二通信行为数据;
将所述第一用户、所述第二用户、所述第二通信行为数据中与所述第二用户存在通信行为的第三用户、以及所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象分别作为节点;
根据所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象的传输方向,在所述节点之间添加有向边,以得到交互关系图;
对所述交互关系图中的节点进行向量化处理,得到所述交互关系图中的节点的向量表示;
从所述交互关系图中的节点中,识别出所述第一用户和所述第二用户对应的节点;
根据所述第一用户和所述第二用户对应的节点的向量表示,计算所述第一用户与所述第二用户之间的相似度;
根据所述第一用户与所述第二用户之间的相似度,从所述第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
17.一种服务器,其特征在于,包括:存储器和处理器;
所述存储器,用于存储一条或多条计算机指令;
所述处理器,用于执行所述一条或多条计算机指令,以用于:
响应于界面展示操作,展示人机交互界面;
响应于在所述人机交互界面上的数据配置操作,获取第一通信行为数据和第二通信行为数据,其中,第一通信行为数据为待识别时段内存在通信关系的第一用户之间的通信数据,第二通信行为数据为已知具有指定行为的第二用户关联的通信数据;
响应于在所述人机交互界面上的交互关系图构建操作,将所述第一用户、所述第二用户、所述第二通信行为数据中与所述第二用户存在通信行为的第三用户、以及所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象分别作为节点;以及根据所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象的传输方向,在所述节点之间添加有向边,以得到所述交互关系图;
响应于在所述人机交互界面上的目标用户识别操作,从所述交互关系图中的节点中,识别出所述第一用户和所述第二用户对应的节点;根据所述第一用户和所述第二用户对应的节点的向量表示,计算所述第一用户与所述第二用户之间的相似度;根据所述第一用户与所述第二用户之间的相似度,从所述第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
18.一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器执行包括以下的动作:
响应于界面展示操作,展示人机交互界面;
响应于在所述人机交互界面上的数据配置操作,获取第一通信行为数据和第二通信行为数据,其中,第一通信行为数据为待识别时段内存在通信关系的第一用户之间的通信数据,第二通信行为数据为已知具有指定行为的第二用户关联的通信数据;
响应于在所述人机交互界面上的交互关系图构建操作,将所述第一用户、所述第二用户、所述第二通信行为数据中与所述第二用户存在通信行为的第三用户、以及所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象分别作为节点;以及根据所述第一通信行为数据和所述第二通信行为数据中被传输的信息对象的传输方向,在所述节点之间添加有向边,以得到所述交互关系图;
响应于在所述人机交互界面上的目标用户识别操作,从所述交互关系图中的节点中,识别出所述第一用户和所述第二用户对应的节点;根据所述第一用户和所述第二用户对应的节点的向量表示,计算所述第一用户与所述第二用户之间的相似度;根据所述第一用户与所述第二用户之间的相似度,从所述第一用户中选择相似度满足设定要求的用户作为具有指定行为的目标用户。
CN201910673446.3A 2019-07-24 2019-07-24 数据处理方法、设备、系统及存储介质 Active CN112311719B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910673446.3A CN112311719B (zh) 2019-07-24 2019-07-24 数据处理方法、设备、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910673446.3A CN112311719B (zh) 2019-07-24 2019-07-24 数据处理方法、设备、系统及存储介质

Publications (2)

Publication Number Publication Date
CN112311719A CN112311719A (zh) 2021-02-02
CN112311719B true CN112311719B (zh) 2023-04-18

Family

ID=74329314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910673446.3A Active CN112311719B (zh) 2019-07-24 2019-07-24 数据处理方法、设备、系统及存储介质

Country Status (1)

Country Link
CN (1) CN112311719B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587248A (zh) * 2018-12-06 2019-04-05 腾讯科技(深圳)有限公司 用户识别方法、装置、服务器及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107133811A (zh) * 2016-02-29 2017-09-05 阿里巴巴集团控股有限公司 一种目标用户的识别方法和装置
CN107239533B (zh) * 2017-05-31 2021-12-07 北京知道创宇信息技术股份有限公司 生成异常模式、确定用户是否存在恶意行为的方法和计算设备
CN109446171B (zh) * 2017-08-30 2022-03-15 腾讯科技(深圳)有限公司 一种数据处理方法和装置
CN108536776A (zh) * 2018-03-28 2018-09-14 广州厚云信息科技有限公司 一种社交网络中的统一用户恶意行为检测方法和系统
CN109359236A (zh) * 2018-08-22 2019-02-19 中国平安人寿保险股份有限公司 基于大数据分析的目标用户挖掘方法及装置
CN109829089B (zh) * 2018-12-12 2021-03-05 中国科学院计算技术研究所 基于关联图谱的社交网络用户异常检测方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109587248A (zh) * 2018-12-06 2019-04-05 腾讯科技(深圳)有限公司 用户识别方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
CN112311719A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
US20220229525A1 (en) Dynamic user interface customization
US10111059B2 (en) Systems and methods for utilizing wireless communications to suggest connections for a user
EP3622394B1 (en) Intelligent cloud management based on profile
US10282384B2 (en) Systems and methods for throttling click bait
US20200028810A1 (en) Cognitive recognition and filtering of cyberbullying messages
US8380794B2 (en) Generating context aware data and conversation's mood level to determine the best method of communication
US10176025B2 (en) Recommendation for an individual based on a mood of the individual
US11871150B2 (en) Apparatuses, computer-implemented methods, and computer program products for generating a collaborative contextual summary interface in association with an audio-video conferencing interface service
CN110781408A (zh) 信息显示方法和装置
CN112819574A (zh) 家政订单生成方法、设备及存储介质
US11226835B2 (en) Determination and initiation of a computing interface for computer-initiated task response
Sung et al. Internet of Things–based smart home system using a virtualized cloud server and mobile phone app
CN112489236B (zh) 一种考勤数据处理方法、装置、服务器及存储介质
CN112311719B (zh) 数据处理方法、设备、系统及存储介质
US11694139B2 (en) Dynamic assignment of tasks to internet connected devices
CN106161188B (zh) 消息发送方法、消息展示方法及装置
US9754233B1 (en) Centralized employee data analytics
US11606272B1 (en) Techniques for cross platform communication process flow anomaly detection and display
US20160092481A1 (en) Information integration and assessment
Shinde et al. Design and Development of Geofencing Based Attendance System for Mobile Application
CN113783828A (zh) 一种业务系统监控方法和装置
US20230179952A1 (en) Initiating communication on mobile device responsive to event
US20230090607A1 (en) Techniques for cross platform communication process flow metric generation and display
CN110166505B (zh) 一种会话记录存储方法、装置、设备及存储介质
US10650627B1 (en) Cognitive vetting system for unsolicited residential visitors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant