CN112887923A - 基于动态通信网络的无监督异常短文本监测方法及系统 - Google Patents
基于动态通信网络的无监督异常短文本监测方法及系统 Download PDFInfo
- Publication number
- CN112887923A CN112887923A CN202110088906.3A CN202110088906A CN112887923A CN 112887923 A CN112887923 A CN 112887923A CN 202110088906 A CN202110088906 A CN 202110088906A CN 112887923 A CN112887923 A CN 112887923A
- Authority
- CN
- China
- Prior art keywords
- short text
- text communication
- node
- network
- account
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 386
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 168
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012544 monitoring process Methods 0.000 title claims abstract description 34
- 238000004140 cleaning Methods 0.000 claims abstract description 23
- 238000012216 screening Methods 0.000 claims abstract description 23
- 239000013589 supplement Substances 0.000 claims abstract description 15
- 230000001502 supplementing effect Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 230000002547 anomalous effect Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 10
- 230000006399 behavior Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 206010000117 Abnormal behaviour Diseases 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
- H04W4/14—Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/56—Computer malware detection or handling, e.g. anti-virus arrangements
- G06F21/562—Static detection
- G06F21/565—Static detection by checking file integrity
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Virology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明涉及一种基于动态通信网络的无监督异常短文本监测方法及系统,所述监测方法包括:获取初始短文本通信信息集合;基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;根据有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;基于图网络表示学习的方法,以短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;根据特征表示,筛选出各初始异常账号;根据各初始异常账号对应的短文本内容,判断初始异常账号是否为异常账号,可提高账号异常检测的鲁棒性。
Description
技术领域
本发明涉及通信网络信息监测技术领域,特别涉及一种基于动态通信网络的无监督异常短文本监测方法及系统。
背景技术
智能手机用户量的不断增长,使得异常短文本的问题愈发暴露在人们面前,这些异常短文本的泛滥不仅污染了健康的网络环境,还对网络安全造成了威胁。一直以来,更广泛地拦截异常短文本,更精准地打击异常短文本发送账号,是公共安全领域研究人员追求的目标。据调查,异常短文本可以分为以下几大类别:涉黄涉黑类、病毒诱导类、商业广告类、中奖诈骗类和政治违法类。近年来,随着大众对公共安全领域的重视程度不断提高,异常短文本检测方法也层出不穷。
其中,大多数异常短文本检测方法可以分为两种方式:一种是基于短文本内容挖掘的方式,通过对大量已标注的异常短文本内容的学习,提取出异常短文本的内容特征,从而实现对异常短文本的实时检测;另一种是基于异常短文本发送账号的通信网络,充分挖掘发送异常短文本账号通信行为特征,检测出实时通信网络中符合该特征的账号,进而追踪到其发送的短文本内容,从而实现对异常短文本的广泛打击。
近年来,随着短文本异常行为受打击力度越来越大,短文本异常犯罪分子也采取了一系列逃避打击的行为,具体表现为:在异常短文本中采用生僻字词替换常用字词、伪装成广告、银行或者电信运营商的通知信息、使用多个不同账号交替发送异常短文本信息等。由于短文本异常犯罪分子不断变换短文本异常的行为模式,针对原有行为模式提出的异常短文本检测方法效果不再显著,对新的行为模式下产生的异常短文本进行标注也耗费了大量的人力,故而迫切需要一种鲁棒性更强、能适应不断变化的短文本异常行为模式的异常短文本检测方法。
由于基于短文本的内容的异常短文本检测方法需要对大量有标注的异常短文本进行特征提取,所以大部分该类方法的更新需要依靠新的手工标注的异常短文本样本。除此之外,短文本异常犯罪分子为逃避该类方法的检测变更行为模式时所需的成本也较低,通常只需要变更异常短文本的范本将其伪装成正常短文本即可。而基于短文本通信网络的方法所需的有标注的数据较少,逃避该类检测方法变更行为模式所需的成本较高。
然而,基于通信网络的异常短文本检测方法依然存在一些弊端,如无法彻底区分异常短文本和广告类短文本,以及当一个账号短文本通信关系信息不足时,无法准确判断该账号是否为发送异常短文本发送账号等。
发明内容
为了解决现有技术中的上述问题,即为了有效识别异常账号及异常短本文内容,本发明的目的在于提供一种基于动态通信网络的无监督异常短文本监测方法及系统。
为解决上述技术问题,本发明提供了如下方案:
一种基于动态通信网络的无监督异常短文本监测方法,所述监测方法包括:
通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
可选地,所述基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合,具体包括:
从所述初始短文本通信信息集合中提取内容完整的短文本通信信息,构成第一短文本通信信息集合;内容完整的短文本通信信息为该短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容;
从第一短文本通信信息集合去除内容重复的短文本通信信息,得到第二短文本通信信息集合;
从第二短文本通信信息集合中删除内容有错误的短文本通信信息,得到有效短文本通信信息集合;其中,内容有误的短文本通信信息为该短文本通信信息的内容中的短文本发送账号和/或短文本接收账号不符合实际账号规格,和/或短文本内容为乱码。
可选地,所述根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到更新后的短文本通信关系网络,具体包括:
针对所述有效短文本通信信息集合中的每一短文本通信信息,以短文本发送账号的节点为头结点、短文本接收账号的节点为尾节点,以实际通信关系为有向边,以短文本发送时间和短文本内容为边的属性建立实时短文本通信关系网络;
将所述实时短文本通信关系网络整合到当前的短文本通信关系网络中,得到整合后的短文本通信关系网络;
以有向边中短文本发送账号的节点为头节点,短文本接收账号的节点为尾节点,在整合后的短文本通信关系网络中含有相同短文本内容属性并且短文本内容属性和设定内容属性匹配的一组有向边中,在其所有头节点和所有尾节点之间补充有向边,并且以实际通信关系中短文本接收账号接收的该短文本内容及短文本接收时间作为属性;
对于有相互通信关系的一对节点,如果其中一个节点和另一个不同的节点也有相互通信关系,则补充有向边使这三个点两两之间互相有相互通信关系,补充的内容和时间属性为空,得到补边后的短文本通信关系网络。
可选地,所述将所述实时短文本通信关系网络整合到当前的短文本通信关系网络中,得到整合后的短文本通信关系网络,具体包括:
对于所述实时短文本通信关系网络中的每一条有向边,
如果在当前的短文本通信关系网络中已经存在完全相同的一条有向边,则将实时短文本通信关系网络中该有向边的属性添加到当前的短文本通信关系网络中对应有向边中,并删除所述实时短文本通信关系网络中的该有向边;
如果在当前的短文本通信关系网络中不存在完全相同的一条有向边,但是存在与该有向边对应的头节点和尾节点,则在当前的短文本通信关系网络中对应的头节点和尾节点之间添加该有向边,头节点与尾节点对应关系不变,将实时短文本通信关系网络中该有向边的属性添加到当前的短文本通信关系网络中最新添加的有向边中,并且删除所述实时短文本通信关系网络中的该有向边;
如果在当前的短文本通信关系网络中不存在完全相同的一条有向边,并且不存在与该有向边对应的头节点和/或尾节点,则在当前的短文本通信关系网络中添加对应的尾节点和/或头节点,并在对应的头节点和尾节点之间添加该有向边,头节点与尾节点对应关系不变,将实时短文本通信关系网络中该有向边的属性添加到当前的短文本通信关系网络中最新添加的有向边中,并且删除实时短文本通信关系网络中的该有向边;
重复以上操作,直至实时短文本通信关系网络中不存在有向边。
可选地,所述基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示,具体包括:
预先设定嵌入空间,对每个节点在嵌入空间的特征表示进行初始化;
基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,提取所述短文本通信关系网络中每一短文本发送账号作为节点时在嵌入空间的特征表示,得到各节点在嵌入空间的特征表示。
可选地,所述根据各节点在嵌入空间的特征表示,筛选出初始异常账号,具体包括:
针对每一节点,其中,所述节点作为头节点时所连有向边的所有尾节点为所述节点的邻居节点,根据所有邻居节点在嵌入空间中的特征表示确定所述节点在嵌入空间的密度特征;
根据节点v在嵌入空间的特征表示,确定节点v的密度特征d(v):
d(v)=||σ(v)||1
其中,σ(v)表示节点v所有邻居节点的向量方差,||.||1表示L1范数;
根据节点v在嵌入空间的特征表示,确定节点v的出度与入度比g(v);其中,节点v的出度为以节点v为尾的有向边的数目,节点v的入度表示以节点v为头的有向边的数目;
根据所述节点v的密度特征d(v)及出度与入度比g(v)确定节点v的分值Score(v):
Score(v)=wd(v)+λg(v);
其中,w、λ为参数;
根据所述节点v的分值Score(v)与预设的分数阈值的差值大小,判断所述节点v是否为初始异常账号:
如果差值大于0,则所述节点v为初始异常账号;否则所述节点v为正常账号。
可选地,所述监测方法还包括:
从所述有效短文本通信信息集合中按照设定比例筛选一组初始正常账号和一组初始异常账号;其中,有相互通信关系的一组账号,判定分别为初始正常账号;短文本内容且符合预设异常短文本模板的一组账号,判定分别为初始异常账号;
根据该组初始正常账号中的账号作为节点时的特征表示、该组初始异常账号的账号作为节点时的特征表示,采用梯度下降方法更新参数λ。
为解决上述技术问题,本发明还提供了如下方案:
一种基于动态通信网络的无监督异常短文本监测系统,所述监测系统包括:
获取单元,用于通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
清洗单元,用于基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
补边单元,用于根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
确定单元,用于基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
筛选单元,用于根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
判断单元,用于根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
为解决上述技术问题,本发明还提供了如下方案:
一种基于动态通信网络的无监督异常短文本监测系统,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
为解决上述技术问题,本发明还提供了如下方案:
一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
根据本发明的实施例,本发明公开了以下技术效果:
本发明基于动态通信网络的无监督异常短文本监测方法通过动态通信网络,获取多条短文本通信信息,综合考虑账号实体之间交互关系,充分挖掘账号实体之间的潜在关系,确定短文本通信关系网络及节点在嵌入空间的特征表示,从而可有效识别出异常账号,提高账号异常检测的鲁棒性。
附图说明
图1是本发明基于动态通信网络的无监督异常短文本监测方法的流程图;
图2是实时通信关系网络整合流程示意图;
图3是补边前通信关系网络示意图;
图4是补边后通信关系网络示意图;
图5是本发明基于动态通信网络的无监督异常短文本监测系统的模块结构示意图。
符号说明:
获取单元—1,清洗单元—2,补边单元—3,确定单元—4,筛选单元—5,判断单元—6。
具体实施方式
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
本发明的目的是提供一种基于动态通信网络的无监督异常短文本监测方法,通过动态通信网络,获取多条短文本通信信息,综合考虑账号实体之间交互关系,充分挖掘账号实体之间的潜在关系,确定短文本通信关系网络及节点在嵌入空间的特征表示,从而可有效识别出异常账号,提高账号异常检测的鲁棒性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明基于动态通信网络的无监督异常短文本监测方法包括:
步骤100:通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合。
所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者。
在本实施例中,短文本通信信息如下:
<723382;198328;1558327162;“力口我信薇;24018674下棋6点给你明天3号1萧,有你想要的答案。”>
其中发送方账号、接收方账号、短文本接收时间和短文本内容依次列出,并以分号“;”隔开,短文本内容用双引号标出。
步骤200:基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合。
步骤300:根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成。
步骤400:基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示。
步骤500:根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号。
步骤600:根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
在步骤200中,所述基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合,具体包括:
步骤210:从所述初始短文本通信信息集合中提取内容完整的短文本通信信息,构成第一短文本通信信息集合;内容完整的短文本通信信息为该短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容。
短文本发送账号、短文本接收账号、短文本接收时间和短文本内容四项中缺失一项或多项的数据。
例如,在本实施例中,存在这样一条数据:
<176243;;1558292465;“忙吗?上其跟我们预测一样的35(牛)你握住机会了么?+V:13030871607晚上给你三个号。”>。
显然,该数据缺失接收方账号,则在数据清洗时删除该数据。
步骤220:从第一短文本通信信息集合去除内容重复的短文本通信信息,得到第二短文本通信信息集合。
上述去重处理指,删除由于特殊的数据采集方式造成的对同一条短文本通信信息的重复采集,使每条短文本通信信息只保留一份。
其中,同一条短文本通信信息的重复采集是指,具有相同发送账号、接收账号、接收时间和短文本内容的数据在上述实际短文本通信信息集合中出现超过一次。
例如,在本实施例中,存在这样一组数据:
<341739;500687;1558292497;“您有三笔额度审核通过,领取点击h5ip.cn/DQxY领取二h5ip.cn/jdIS领取三h5ip.cn/tsZx”>。
<341739;500687;1558292497;“您有三笔额度审核通过,领取点击h5ip.cn/DQxY领取二h5ip.cn/jdIS领取三h5ip.cn/tsZx”>。
显然,这是一组重复采集的数据,则在数据清洗时删除第二条数据,只保留第一条。
步骤230:从第二短文本通信信息集合中删除内容有错误的短文本通信信息,得到有效短文本通信信息集合;其中,内容有误的短文本通信信息为该短文本通信信息的内容中的短文本发送账号和/或短文本接收账号不符合实际账号规格,和/或短文本内容为乱码。
例如,在本实施例中,存在这样一条数据:
<341739;500687;1558292497;“REG-REQ?v=3;t=0C51EE06E22E2C248B187E1DD6124C8DC5597BF8AC7CE97F0AB5927D9FAEC428;r”>。
显然,该条短文本通信信息的短文本内容为乱码,则在数据清洗时删除该数据。
在步骤300中,所述根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到更新后的短文本通信关系网络,具体包括:
步骤310:针对所述有效短文本通信信息集合中的每一短文本通信信息,以短文本发送账号的节点为头结点、短文本接收账号的节点为尾节点,以实际通信关系为有向边,以短文本发送时间和短文本内容为边的属性建立实时短文本通信关系网络。
步骤320:将所述实时短文本通信关系网络整合到当前的短文本通信关系网络中,得到整合后的短文本通信关系网络。
步骤330:以有向边中短文本发送账号的节点为头节点,短文本接收账号的节点为尾节点,在整合后的短文本通信关系网络中含有相同短文本内容属性并且短文本内容属性和设定内容属性匹配的一组有向边中,在其所有头节点和所有尾节点之间补充有向边,并且以实际通信关系中短文本接收账号接收的该短文本内容及短文本接收时间作为属性。
步骤340:对于有相互通信关系的一对节点,如果其中一个节点和另一个不同的节点也有相互通信关系,则补充有向边使这三个点两两之间互相有相互通信关系,补充的内容和时间属性为空,得到补边后的短文本通信关系网络。
如图2所示,在步骤320中,所述将所述实时短文本通信关系网络整合到当前的短文本通信关系网络中,得到整合后的短文本通信关系网络,具体包括:
对于所述实时短文本通信关系网络中的每一条有向边,
如果在当前的短文本通信关系网络中已经存在完全相同的一条有向边,则将实时短文本通信关系网络中该有向边的属性添加到当前的短文本通信关系网络中对应有向边中,并删除所述实时短文本通信关系网络中的该有向边;
如果在当前的短文本通信关系网络中不存在完全相同的一条有向边,但是存在与该有向边对应的头节点和尾节点,则在当前的短文本通信关系网络中对应的头节点和尾节点之间添加该有向边,头节点与尾节点对应关系不变,将实时短文本通信关系网络中该有向边的属性添加到当前的短文本通信关系网络中最新添加的有向边中,并且删除所述实时短文本通信关系网络中的该有向边;
如果在当前的短文本通信关系网络中不存在完全相同的一条有向边,并且不存在与该有向边对应的头节点和/或尾节点,则在当前的短文本通信关系网络中添加对应的尾节点和/或头节点,并在对应的头节点和尾节点之间添加该有向边,头节点与尾节点对应关系不变,将实时短文本通信关系网络中该有向边的属性添加到当前的短文本通信关系网络中最新添加的有向边中,并且删除实时短文本通信关系网络中的该有向边;
重复以上操作,直至实时短文本通信关系网络中不存在有向边。
例如,历史短文本通信关系网络的有向边的情况为:
<S1,R1,<c1,t1>>,<S2,R2,<c2,t2>>,<S2,R3,<c3,t3>>;
实时短文本通信关系网络的有向边的情况为:
<S1,R1,<c1,t1>>,<S1,R2,<c4,t4>>,<S3,R5,<c5,t5>>,<S2,R3,<c3,t4>>;
则整合后的短文本通信关系网络的有向边的情况为:
<S1,R1,<c1,t1>>,<S1,R2,<c4,t4>>,<S2,R2,<c2,t2>>,<S2,R3,<c3,t3>,<c3,t4>>,<S3,R5,<c5,t5>>。
其中,S表示短文本发送账号,R表示短文本接收账号,c表示短文本内容,t表示短文本发送时间。
例如,存在这样一条有向边:<a,b,<c1,t1>,<c2,t2>>,表示账号b在t1时刻接收到了账号a发出的内容为c1的短文本,在t2时刻接收到了账号a发出的内容为c2的短文本。
根据图3和图4所示详细介绍步骤330:
S1、S2分别为发送了相同短文本内容属性的短文本的两个账号,R1、R2、R3分别为该短文本的接收账号,c为各发送账号所发送的短文本内容,t1、t2、t3分别为短文本接收时间。
补边时,在S1和R2、R3之间、S2和R1之间分别补充一条有向边,其短文本内容属性与S1和R1之间有向边的内容属性相同。S1到R2的有向边时间属性为t2,与R2接收S2发送该内容的时间相同。以此可以类推出其他补充的有向边的时间属性。图3补边后的短文本通信关系网络如图4所示。
补边前该短文本通信关系网络有向边的情况为:
<S1,R1,<c,t1>>,<S2,R2,<c,t2>>,<S2,R3,<c,t3>>;
补边后该短文本通信关系网络有向边的情况为:
<S1,R1,<c,t1>>,<S1,R2,<c,t2>>,<S1,R3,<c,t3>>,<S2,R2,<c,t2>>,<S2,R2,<c,t2>>,<S2,R3,<c,t3>>。
在步骤400中,所述基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示,具体包括:
步骤410:预先设定嵌入空间,对每个节点在嵌入空间的特征表示进行初始化。
步骤410:基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,提取所述短文本通信关系网络中每一短文本发送账号作为节点时在嵌入空间的特征表示,得到各节点在嵌入空间的特征表示。
具体地,可采用公开的算法,如TransE、DeepWalk等提取节点时在嵌入空间的特征表示。
在步骤500中,所述根据各节点在嵌入空间的特征表示,筛选出初始异常账号,具体包括:
针对每一节点,其中,所述节点作为头节点时所连有向边的所有尾节点为所述节点的邻居节点,根据所有邻居节点在嵌入空间中的特征表示确定所述节点在嵌入空间的密度特征;
步骤510:根据节点v在嵌入空间的特征表示,确定节点v的密度特征d(v):
d(v)=||σ(v)||1;
其中,σ(v)表示节点v所有邻居节点的向量方差,||.||1表示L1范数;其中,特征表示包括向量方差。
步骤520:根据节点v在嵌入空间的特征表示,确定节点v的出度与入度比g(v);
其中,节点v的出度为以节点v为尾的有向边的数目,节点v的入度表示以节点v为头的有向边的数目。
步骤530:根据所述节点v的密度特征d(v)及出度与入度比g(v)确定节点v的分值Score(v):
Score(v)=wd(v)+λg(v);
其中,w、λ为参数;
步骤540:根据所述节点v的分值Score(v)与预设的分数阈值的差值大小,判断所述节点v是否为初始异常账号:
如果差值大于0,则所述节点v为初始异常账号;否则所述节点v为正常账号。
优选地,发明基于动态通信网络的无监督异常短文本监测方法还包括:
步骤S1:从所述有效短文本通信信息集合中按照设定比例筛选一组初始正常账号和一组初始异常账号;其中,有相互通信关系的一组账号,判定分别为初始正常账号;短文本内容且符合预设异常短文本模板的一组账号,判定分别为初始异常账号。
在本实施例中,所述异常短文本模板中含有'[\w,-]{7,20}'或者'[a-zA-Z0-9][\w]*[.][\w]+'的字符串。
例如,存在边<a,b,<t1,c1>>和<b,a,<t2,c2>>,则认为a,b均为普通账号;存在边<c,d,<t3,c3>>和<e,f,<t4,c3>>,且c3中含有与
'[\w,-]{7,20}'或者'[a-zA-Z0-9][\w]*[.][\w]+'相匹配的字符串,则认为c和e为异常账号。
其中,设定比例指的是该组初始正常账号的数量与该组初始异常账号的数量的比,例如1:1。
步骤S2:根据该组初始正常账号中的账号作为节点时的特征表示、该组初始异常账号的账号作为节点时的特征表示,采用梯度下降方法更新参数λ。
进一步地,在步骤600中,对于筛选出的各初始异常账号发送的短文本内容,判断各短文本内容是否与预设的普通短文本正则化模板匹配:如果匹配,则判断该短文本为普通短文本,否则判断该短文本为异常短文本,则对应的初始异常账号是否为异常账号。或则判断各短文本内容是否与预设异常短文本模板匹配:如果匹配,则判断该短文本为异常短文本,则对应的初始异常账号是否为异常账号;否则判断该短文本为普通短文本,则对应的初始异常账号是否为正常账号。
在本实施例中,对于上述筛选出的账号发送的文本,判断其文本内容是否含有与'[\w,-]{7,20}'或者'[a-zA-Z0-9][\w]*[.][\w]+'相匹配的字符串,是则判断该短文本为异常短文本,否则判断该短文本为正常短文本。
相对于现有技术,本发明具有以下优点:
(1)本发明基于动态通信网络的无监督异常短文本监测方法,利用实际短文本通信关系网络,综合考虑账号实体之间交互关系,充分挖掘账号实体之间的潜在关系,形成具有良好泛化能力的预测模型,可以有效识别最新的异常短文本模式,避免了采用基于短文本内容的检测方法鲁棒性差的问题,模型计算复杂度低、精度高、鲁棒性好。
(2)本发明实现了异常短文本的自动检测,以便对异常犯罪行为进行进一步的侦察和打击。并且本发明针对异常犯罪人员使用多个账号分散发送异常短文本的行为模式制定了一些策略,使得对异常犯罪人员的打击同时具有精准性和广泛性。
此外,本发明还提供一种基于动态通信网络的无监督异常短文本监测系统,可有效识别异常账号及异常短本文内容
如图5所示,本发明基于动态通信网络的无监督异常短文本监测系统包括:获取单元1、清洗单元2、补边单元3、确定单元4、筛选单元5及判断单元6。
所述获取单元1用于通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
所述清洗单元2用于基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
所述补边单元3用于根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
所述确定单元4用于基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
所述筛选单元5用于根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
所述判断单元6用于根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
此外,本发明还提供了如下方案:
一种基于动态通信网络的无监督异常短文本监测系统,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
进一步地,本发明还提供了如下方案:
一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
相对于现有技术,本发明基于动态通信网络的无监督异常短文本监测系统、计算机可读存储介质与上述基于动态通信网络的无监督异常短文本监测方法的有益效果相同,在此不再赘述。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (10)
1.一种基于动态通信网络的无监督异常短文本监测方法,其特征在于,所述监测方法包括:
通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
2.根据权利要求1所述的基于动态通信网络的无监督异常短文本监测方法,其特征在于,所述基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合,具体包括:
从所述初始短文本通信信息集合中提取内容完整的短文本通信信息,构成第一短文本通信信息集合;内容完整的短文本通信信息为该短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容;
从第一短文本通信信息集合去除内容重复的短文本通信信息,得到第二短文本通信信息集合;
从第二短文本通信信息集合中删除内容有错误的短文本通信信息,得到有效短文本通信信息集合;其中,内容有误的短文本通信信息为该短文本通信信息的内容中的短文本发送账号和/或短文本接收账号不符合实际账号规格,和/或短文本内容为乱码。
3.根据权利要求1所述的基于动态通信网络的无监督异常短文本监测方法,其特征在于,所述根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到更新后的短文本通信关系网络,具体包括:
针对所述有效短文本通信信息集合中的每一短文本通信信息,以短文本发送账号的节点为头结点、短文本接收账号的节点为尾节点,以实际通信关系为有向边,以短文本发送时间和短文本内容为边的属性建立实时短文本通信关系网络;
将所述实时短文本通信关系网络整合到当前的短文本通信关系网络中,得到整合后的短文本通信关系网络;
以有向边中短文本发送账号的节点为头节点,短文本接收账号的节点为尾节点,在整合后的短文本通信关系网络中含有相同短文本内容属性并且短文本内容属性和设定内容属性匹配的一组有向边中,在其所有头节点和所有尾节点之间补充有向边,并且以实际通信关系中短文本接收账号接收的该短文本内容及短文本接收时间作为属性;
对于有相互通信关系的一对节点,如果其中一个节点和另一个不同的节点也有相互通信关系,则补充有向边使这三个点两两之间互相有相互通信关系,补充的内容和时间属性为空,得到补边后的短文本通信关系网络。
4.根据权利要求3所述的基于动态通信网络的无监督异常短文本监测方法,其特征在于,所述将所述实时短文本通信关系网络整合到当前的短文本通信关系网络中,得到整合后的短文本通信关系网络,具体包括:
对于所述实时短文本通信关系网络中的每一条有向边,
如果在当前的短文本通信关系网络中已经存在完全相同的一条有向边,则将实时短文本通信关系网络中该有向边的属性添加到当前的短文本通信关系网络中对应有向边中,并删除所述实时短文本通信关系网络中的该有向边;
如果在当前的短文本通信关系网络中不存在完全相同的一条有向边,但是存在与该有向边对应的头节点和尾节点,则在当前的短文本通信关系网络中对应的头节点和尾节点之间添加该有向边,头节点与尾节点对应关系不变,将实时短文本通信关系网络中该有向边的属性添加到当前的短文本通信关系网络中最新添加的有向边中,并且删除所述实时短文本通信关系网络中的该有向边;
如果在当前的短文本通信关系网络中不存在完全相同的一条有向边,并且不存在与该有向边对应的头节点和/或尾节点,则在当前的短文本通信关系网络中添加对应的尾节点和/或头节点,并在对应的头节点和尾节点之间添加该有向边,头节点与尾节点对应关系不变,将实时短文本通信关系网络中该有向边的属性添加到当前的短文本通信关系网络中最新添加的有向边中,并且删除实时短文本通信关系网络中的该有向边;
重复以上操作,直至实时短文本通信关系网络中不存在有向边。
5.根据权利要求1所述的基于动态通信网络的无监督异常短文本监测方法,其特征在于,所述基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示,具体包括:
预先设定嵌入空间,对每个节点在嵌入空间的特征表示进行初始化;
基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,提取所述短文本通信关系网络中每一短文本发送账号作为节点时在嵌入空间的特征表示,得到各节点在嵌入空间的特征表示。
6.根据权利要求1所述的基于动态通信网络的无监督异常短文本监测方法,其特征在于,所述根据各节点在嵌入空间的特征表示,筛选出初始异常账号,具体包括:
针对每一节点,其中,所述节点作为头节点时所连有向边的所有尾节点为所述节点的邻居节点,根据所有邻居节点在嵌入空间中的特征表示确定所述节点在嵌入空间的密度特征;
根据节点v在嵌入空间的特征表示,确定节点v的密度特征d(v):d(v)=||σ(v)||1;
其中,σ(v)表示节点v所有邻居节点的向量方差,||.||1表示L1范数;
根据节点v在嵌入空间的特征表示,确定节点v的出度与入度比g(v);其中,节点v的出度为以节点v为尾的有向边的数目,节点v的入度表示以节点v为头的有向边的数目;
根据所述节点v的密度特征d(v)及出度与入度比g(v)确定节点v的分值Score(v):
Score(v)=wd(v)+λg(v);
其中,w、λ为参数;
根据所述节点v的分值Scote(v)与预设的分数阈值的差值大小,判断所述节点v是否为初始异常账号:
如果差值大于0,则所述节点v为初始异常账号;否则所述节点v为正常账号。
7.根据权利要求6所述的基于动态通信网络的无监督异常短文本监测方法,其特征在于,所述监测方法还包括:
从所述有效短文本通信信息集合中按照设定比例筛选一组初始正常账号和一组初始异常账号;其中,有相互通信关系的一组账号,判定分别为初始正常账号;短文本内容且符合预设异常短文本模板的一组账号,判定分别为初始异常账号;
根据该组初始正常账号中的账号作为节点时的特征表示、该组初始异常账号的账号作为节点时的特征表示,采用梯度下降方法更新参数λ。
8.一种基于动态通信网络的无监督异常短文本监测系统,其特征在于,所述监测系统包括:
获取单元,用于通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
清洗单元,用于基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
补边单元,用于根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
确定单元,用于基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
筛选单元,用于根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
判断单元,用于根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
9.一种基于动态通信网络的无监督异常短文本监测系统,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
10.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
通过动态通信网络,获取设定时间段内、设定地域范围内的初始短文本通信信息集合,所述初始短文本通信信息集合包括多条短文本通信信息;其中,每一短文本通信信息的内容包括短文本发送账号、短文本接收账号、短文本接收时间及短文本内容中至少一者;
基于短文本通信信息的内容,对初始短文本通信信息集合进行数据清洗,得到有效短文本通信信息集合;
根据所述有效短文本通信信息集合,对当前的短文本通信关系网络进行补边,得到补边后的短文本通信关系网络;所述短文本通信关系网络由多个节点、节点与节点之间的有向边及属性信息构成;
基于图网络表示学习的方法,以所述短文本通信关系网络中的有向边为依据,确定各节点在嵌入空间的特征表示;
根据各节点在嵌入空间的特征表示,筛选出各初始异常账号,各初始异常账号为短文本发送账号;
根据各初始异常账号对应的短文本内容,判断所述初始异常账号是否为异常账号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110088906.3A CN112887923B (zh) | 2021-01-22 | 2021-01-22 | 基于动态通信网络的无监督异常短文本监测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110088906.3A CN112887923B (zh) | 2021-01-22 | 2021-01-22 | 基于动态通信网络的无监督异常短文本监测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112887923A true CN112887923A (zh) | 2021-06-01 |
CN112887923B CN112887923B (zh) | 2022-02-15 |
Family
ID=76050300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110088906.3A Active CN112887923B (zh) | 2021-01-22 | 2021-01-22 | 基于动态通信网络的无监督异常短文本监测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112887923B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114786184A (zh) * | 2022-06-21 | 2022-07-22 | 中国信息通信研究院 | 涉诈短信拦截模板生成方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1859224A (zh) * | 2005-12-31 | 2006-11-08 | 华为技术有限公司 | 一种业务行为异常处理方法及系统 |
CN101247279A (zh) * | 2007-10-23 | 2008-08-20 | 北京邮电大学 | 一种互联网内容安全检测系统 |
US20090131049A1 (en) * | 2007-06-21 | 2009-05-21 | Airwalk Communications, Inc. | System, method, and computer-readable medium for user equipment handoff within an ip-femtocell network |
CN102195899A (zh) * | 2011-05-30 | 2011-09-21 | 中国人民解放军总参谋部第五十四研究所 | 通信网络的信息挖掘方法与系统 |
CN106372938A (zh) * | 2015-07-21 | 2017-02-01 | 华为技术有限公司 | 异常账号识别方法及系统 |
CN107040494A (zh) * | 2015-07-29 | 2017-08-11 | 深圳市腾讯计算机系统有限公司 | 用户账号异常防范方法和系统 |
CN110909811A (zh) * | 2019-11-28 | 2020-03-24 | 国网湖南省电力有限公司 | 一种基于ocsvm的电网异常行为检测、分析方法与系统 |
CN111918293A (zh) * | 2020-07-29 | 2020-11-10 | 北京宏达隆和科技有限公司 | 一种通讯信息诈骗的多维度关联检测方法 |
-
2021
- 2021-01-22 CN CN202110088906.3A patent/CN112887923B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1859224A (zh) * | 2005-12-31 | 2006-11-08 | 华为技术有限公司 | 一种业务行为异常处理方法及系统 |
US20090131049A1 (en) * | 2007-06-21 | 2009-05-21 | Airwalk Communications, Inc. | System, method, and computer-readable medium for user equipment handoff within an ip-femtocell network |
CN101247279A (zh) * | 2007-10-23 | 2008-08-20 | 北京邮电大学 | 一种互联网内容安全检测系统 |
CN102195899A (zh) * | 2011-05-30 | 2011-09-21 | 中国人民解放军总参谋部第五十四研究所 | 通信网络的信息挖掘方法与系统 |
CN106372938A (zh) * | 2015-07-21 | 2017-02-01 | 华为技术有限公司 | 异常账号识别方法及系统 |
CN107040494A (zh) * | 2015-07-29 | 2017-08-11 | 深圳市腾讯计算机系统有限公司 | 用户账号异常防范方法和系统 |
CN110909811A (zh) * | 2019-11-28 | 2020-03-24 | 国网湖南省电力有限公司 | 一种基于ocsvm的电网异常行为检测、分析方法与系统 |
CN111918293A (zh) * | 2020-07-29 | 2020-11-10 | 北京宏达隆和科技有限公司 | 一种通讯信息诈骗的多维度关联检测方法 |
Non-Patent Citations (1)
Title |
---|
赵红梅等: "网络在线检测中手机短信认证安全方法仿真", 《计算机仿真》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114786184A (zh) * | 2022-06-21 | 2022-07-22 | 中国信息通信研究院 | 涉诈短信拦截模板生成方法及装置 |
CN114786184B (zh) * | 2022-06-21 | 2022-09-16 | 中国信息通信研究院 | 涉诈短信拦截模板生成方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112887923B (zh) | 2022-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110460594B (zh) | 威胁情报数据采集处理方法、装置及存储介质 | |
CN110781317B (zh) | 事件图谱的构建方法、装置及电子设备 | |
CN110519150B (zh) | 邮件检测方法、装置、设备、系统及计算机可读存储介质 | |
CN104660594A (zh) | 一种面向社交网络的虚拟恶意节点及其网络识别方法 | |
CN112417477A (zh) | 一种数据安全监测方法、装置、设备及存储介质 | |
CN109413109A (zh) | 基于有限状态机的面向天地一体化网络安全状态分析方法 | |
CN112615888B (zh) | 一种网络攻击行为的威胁评估方法及装置 | |
WO2019136850A1 (zh) | 风险行为识别方法、存储介质、设备及系统 | |
CN111143175A (zh) | 一种风险行为检测方法、装置、设备以及计算机存储介质 | |
CN113378899B (zh) | 非正常账号识别方法、装置、设备和存储介质 | |
CN110046297B (zh) | 运维违规操作的识别方法、装置和存储介质 | |
CN113792691B (zh) | 一种视频识别方法、系统、设备及介质 | |
CN111209317A (zh) | 一种知识图谱异常社区检测方法及装置 | |
CN113407886A (zh) | 网络犯罪平台识别方法、系统、设备和计算机存储介质 | |
CN115643035A (zh) | 基于多源日志的网络安全态势评估方法 | |
CN112333185B (zh) | 一种基于dns解析的域名阴影检测方法和装置 | |
CN112887923B (zh) | 基于动态通信网络的无监督异常短文本监测方法及系统 | |
Connolly et al. | Classification of peatland disturbance | |
CN113269228A (zh) | 一种图网络分类模型的训练方法、装置、系统及电子设备 | |
CN116248362A (zh) | 一种基于双层隐马尔可夫链的用户异常网络访问行为识别方法 | |
CN113240139B (zh) | 告警因果评估方法、故障根因定位方法及电子设备 | |
CN114021698A (zh) | 基于胶囊生成对抗网络的恶意域名训练样本扩充方法及装置 | |
US9332031B1 (en) | Categorizing accounts based on associated images | |
CN115115369A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN112508630A (zh) | 异常会话群的检测方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |