CN108280459A - 图片的处理方法、装置及系统 - Google Patents

图片的处理方法、装置及系统 Download PDF

Info

Publication number
CN108280459A
CN108280459A CN201710012643.1A CN201710012643A CN108280459A CN 108280459 A CN108280459 A CN 108280459A CN 201710012643 A CN201710012643 A CN 201710012643A CN 108280459 A CN108280459 A CN 108280459A
Authority
CN
China
Prior art keywords
picture
account
communication message
predefined type
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710012643.1A
Other languages
English (en)
Inventor
许涵斌
靳玉康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201710012643.1A priority Critical patent/CN108280459A/zh
Publication of CN108280459A publication Critical patent/CN108280459A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种图片的处理方法、装置及系统。其中,该方法包括:接收通讯消息,其中,通讯消息包含图片;获取所述通讯消息的第一账号;获取所述第一账号的行为特征;至少基于所述第一账号的行为特征,检测所述通讯消息包含的图片是否为预定类型的图片。本申请解决了识别图片类型的效率低的技术问题。

Description

图片的处理方法、装置及系统
技术领域
本申请涉及信息处理领域,具体而言,涉及一种图片的处理方法、装置及系统。
背景技术
现有技术中,在即时通讯软件上发送的海量消息中,包含大量的记录有欺诈信息的图片,现有技术中通过阻断这类图片的传播来阻断相应的欺诈行为的发生,具体地,现有技术中为了阻断这类图片的传播采用的主要处理为:对图片本身进行分析,如针对图片进行色彩分析、纹理分析和结构分析,这些分析方法通过图片本身的性质(如色彩,纹理和结构等)来判断未知图片与已知的携带有欺诈信息的图片的相似性。
然而,通过分析图片本身的性质(色彩,纹理,结构等)来判断未知图片与现有图片的相似性存在两个比较严重的问题,一是对图片进行色彩分析,纹理分析和结构分析的速度非常非常的慢,无法满足线上实时性的要求;二是如果对图片进行细微的改变,如将图片进行几何变形扭曲处理,那么图片的相似性识别将会失效,因此,现有技术中对图片类型(如携带有欺诈信息的图片的类型)的识别效率低。
针对上述识别图片类型的效率低的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种图片的处理方法、装置及系统,以至少解决识别图片类型的效率低的技术问题。
根据本申请实施例的一个方面,提供了一种图片的处理系统,包括:第一终端,第一账号登录在所述第一终端上,所述第一终端通过所述第一账号发送通讯消息;服务器,用于接收所述通讯消息,获取所述通讯消息的第一账号,获取所述第一账号的行为特征,以及至少基于所述第一账号的行为特征,检测所述通讯消息包含的图片是否为预定类型的图片。
根据本申请实施例的一个方面,提供了一种图片的处理方法,包括:接收通讯消息,其中,该通讯消息包括图片;获取所述通讯消息的第一账号,其中,所述第一账号为发送所述通讯消息的账号;获取所述第一账号的行为特征;至少基于所述第一账 号的行为特征,检测所述通讯消息包含的图片是否为预定类型的图片。
根据本申请实施例的另一方面,还提供了一种图片的处理装置,包括:接收单元,用于接收通讯消息,其中,该通讯消息包括图片;第一获取单元,用于获取所述通讯消息的第一账号,其中,所述第一账号为发送所述通讯消息的账号;第二获取单元,用于获取所述第一账号的行为特征;检测单元,用于至少基于所述第一账号的行为特征,检测所述通讯消息包含的图片是否为预定类型的图片。
在本申请实施例中,服务器接收到第一账号发送的通讯消息之后,基于该第一账号的行为特征检测该图片是否为预定类型的图片,在该方案中,不是单单基于图片的属性特征进行图片类型的检测,即便是改变了该图片的属性(如对图片进行扭曲变形处理),也可以基于第一账号的行为特征检测图片的类型,提高了检测图片的类型的准确率;并且获取第一账号的行为特征的速度远远高于对图片的属性进行识别的速度,提高了检测图片的类型的速度。通过上述实施例,解决了现有技术中识别图片类型的效率低的问题,实现了可以准确、快速识别图片的类型的效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种图片的处理方法的终端结构示意图;
图2是根据本申请实施例的一种可选的图片的处理系统的示意图;
图3是根据本申请实施例的一种可选的图片的处理方法的流程图一;
图4是根据本申请实施例的一种可选的图片的处理方法的流程图二;
图5是根据本申请实施例的一种可选的图片的处理方法的流程图三;
图6是根据本申请实施例的一种可选的图片的处理方法调用服务模块的示意图;
图7是根据本申请实施例的一种可选的图片的处理装置的示意图;
图8是根据本申请实施例的一种可选的终端的内部结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
MD5:即Message-Digest Algorithm 5(信息-摘要算法5)是一种在计算机领域内被广泛使用的哈希算法,可以为文件生成一个唯一的md5码,通过这个md5码可以快速高效的识别相应的文件。
分类器,是指分类函数或分类模型,通过该分类函数或分类模型可以将数据映射到一个或多个预定类别中,其中,分类函数或分类模型可以使用决策树、逻辑回归、朴素贝叶斯以及神经网络中的至少之一实现数据的分类。
SVM:支持向量机SVM(Support Vector Machine)是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。
色彩分析:通过数组来描述图片中每一个像素位的色彩,一种可选地,在数组中记录颜色的多个属性,该属性包括:色相、纯度(或称之为彩度和饱和度)和明度,也即,可以通过色相、纯度(或称之为彩度和饱和度)和明度来表示对应的像素为的色彩;另一种可选地,在数组中记录多个颜色通道的信息,颜色通道可以包括红颜色通道、蓝颜色通道以及绿颜色通道。通过对图片中多个像素位的属性或颜色通道的信息进行分析,得到图片中的色彩分布。
实施例1
根据本申请实施例,还提供了一种图片的处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现图片的处理方法的计算机终端(如服务器)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的图片的处理方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图片的处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备 相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
图1示出的硬件结构框图,不仅可以作为上述计算机终端10(或移动设备)的示例性框图,还可以作为上述服务器的示例性框图。
一种可选实施例中,图2以框图示出了使用上述图1所示的计算机终端(如服务器)作为接收端的一种实施例。
如图2所示,服务器202可以经由数据网络连接或电子连接到一个或多个终端201。一种可选实施例中,上述服务器可以是用于提供安全监控的服务器,终端可以是任意移动计算设备等。数据网络连接可以是局域网连接、广域网连接、因特网连接,或其他类型的数据网络连接。服务器可以执行以连接到由一个或多个终端请求执行的网络服务。网络服务器是基于网络的用户服务,诸如即时通讯、社交网络、云资源、电子邮件、在线支付或其他在线应用。
根据本申请一个实施例,提供一种图片信息的处理系统,该处理系统包括如图2所示的第一终端和服务器。
该实施例中的服务器可以为用于提供安全监控的服务器或者用于处理即时通讯消息的服务器,该第一终端上可以安装即时通讯软件(或技术通讯应用程序),用户可以在第一终端上安装的即时通讯客户端上登录第一账号。该服务器可以为用于处理即时通讯消息的服务器。
具体地,如图2所示,该第一终端通过第一账号发送通讯消息;服务器,用于接收通讯消息,并在接收到的通讯消息中包含图片的情况下,获取通讯消息的第一账号,根据第一账号获取第一账号的行为特征,以及至少基于第一账号的行为特征,检测通讯消息包含的图片是否为预定类型的图片。
在上述实施例中,服务器接收到第一账号发送的通讯消息之后,基于该第一账号的行为特征检测该图片是否为预定类型的图片,在该方案中,不是单单基于图片的属性特征进行图片类型的检测,即便是改变了该图片的属性(如对图片进行扭曲变形处理),也可以基于第一账号的行为特征检测图片的类型,提高了检测图片的类型的准确率;并且获取第一账号的行为特征的速度远远高于对图片的属性进行识别的速度,提高了检测图片的类型的速度。通过上述实施例,解决了现有技术中识别图片类型的效率低的问题,实现了可以准确、快速识别图片的类型的效果。
上述实施例中的通讯消息可以为即时通讯消息,用户可以在登录了即时通讯账号的客户端生成通讯消息,并将通讯消息发送给服务器,服务器向通讯消息指定的第二账号发送消息通知,第二账号接收到通知之后,生成确认查看的请求,服务器响应于该查看请求,将通讯消息发送给第二账号。
在一个可选的实施例中,服务器接收到通讯消息之后,直接将该通讯消息发送至第二账号。
可选地,该第二账号可以登录在第二终端上,该第二终端上也运行有即时通讯应用程序,该第二账号通过该即时通讯应用程序登录在第二终端上。
在一个可选的实施例中,该通讯消息中携带有消息主体、第一账号和第二账号,服务器接收到该通讯消息、并在检测出该通讯消息中包含图片的情况下,服务器从通讯消息中读取第一账号,从数据库中读取该第一账号的行为特征,该行为特征用于记录第一账号发送通讯消息的一个或多个维度的行为信息,例如,该行为特征可以包括该第一账号发送消息的频率的、该账号是否执行过非法操作等。
可选地,该行为特征包括下述至少之一的维度的信息:账号等级、I P从属地、注册地点、非法操作记录、给预定类型的账号发送消息的数量、在预定时间内发送消息的数量、消息接收人回复比例、以及包含图片的消息占发送消息总量的比例。
其中,账号等级可以基于该第一账号的发送消息的数量来确定,可以基于该第一账号的登录时长来确定,还可以基于该第一账号的信用度来确定。可选地,处理不同业务的通讯消息的账号等级的确定方式可以相同或者不同。
在一个可选的实施例中,处理虚拟资源业务的通讯消息的账号等级可以基于其处理的虚拟资源的操作次数和/或资源数量来确定,具体地,处理电商业务的通讯消息的账号等级可以基于其转入和/或转出虚拟资源的次数来确定,例如,可以基于该第一账号购买电商上的物品的次数来确定其买家等级,基于该第一账号卖出电商上的物品的次数来确定其卖家等级;又如,可以基于该第一账号购买电商上的物品花费资源总量(如消费总量)来确定其买家等级,基于该第一账号卖出电商上的物品的资源总量(如卖出商品总收入)来确定其卖家等级。
在另一个可选的实施例中,处理社交业务的通讯消息的账号等级可以基于其发送和/或查看的社交信息的数量、或在线时长来确定,例如,可以基于该第一账号的在线时长确定该信息的等级,可选地,时长越长,等级越高。
上述实施例中的非法操作可以为发送预定类型的图片的操作。
上述实施例中的给预定类型的账号发送消息的数量可以为给低于第一账号的等级的账号发送消息的数量,如给等级卖家发送消息的数量。
上述实施例中的预定时间可以为当天。
可选地,上述实施例中的消息接收人回复比例可以基于第一账号发送通讯消息的数量M和接收到响应于发送消息的回复消息的数量N来确定,如,将M和N的比值作为上述消息接收人的回复比例。
根据本申请的上述实施例,可以在确定至少基于第一账号的行为特征,检测通讯消息包含的图片是否为预定类型的图片。其中,若检测出通讯消息包含的图片为预定类型的图片,则获取预定类型的图片的审核结果;若审核结果用于指示预定类型的图片审核通过,则将通讯消息发送至第二账号;若审核结果用于指示预定类型的图片审核未通过,则将预定类型的图片存入图片库,和/或,将第一账号存入账号库,并禁止该图片在网络中传播,例如,记录有欺诈信息的图片。
可选地,在检测出通讯消息包含的图片为预定类型的图片的情况下,将该预定类型的图片提交至审核系统,以审核该预定类型的图片是否允许在网络中传播,进一步地,该审核系统可以通过接收对于该预定类型的图片的审核结果来确定是否允许在网络中传播该图片,审核结果可以通过审核系统的结果输入接口而输入。
其中,若审核结果指示该预定类型的图片审核通过,则确定该预定类型的图片可以在网络中传播,若审核结果指示该预定类型的图片审核未通过,则确定该预定类型的图片不允许在网络中传播,并将该预定类型的图片存储到数据库中,以丰富预定类型的图片的特征信息。
本申请还提供了一种图片的处理方法实施例,该处理方法可以通过图3所示的步骤实现,如图3所示,该方法可以包括:
步骤S301:在接收到的通讯消息中包含图片的情况下,服务器获取通讯消息的第一账号。其中,通讯消息中可以携带消息主体、第一账号和第二账号,服务器接收到该通讯消息,并检测该通讯消息中是否包含图片,其中,第一账号为发送通讯消息的账号第二账号为接收该通讯消息的账号,消息主体中包括传输的消息内容。
可选地,服务器接收到第一账号发送的通讯消息,检测该通讯消息中是否包含图片,在该通讯消息中包含图片的情况下,从通讯消息中获取第一账号。
上述实施例中的通讯消息可以为用于实现服务器与终端(包括第一终端和第二终端)的通讯、和/或终端之间通讯的消息,可选地,通讯消息可以为即时通讯消息,用 户可以通过终端上安装的客户端软件登录即时通讯账号(如第一账号),在登录即时通讯账号之后,客户端软件获取用户选取的通讯对象(一个通讯对象对应一个第二账号),并创建第一账号与选取的第二账号的对话框,该对话框可以接收输入的信息,在对话框中记录的确定按键被点击之后,生成通讯消息。终端将该生成的通讯消息发送给服务器,服务器获取该通讯消息中携带的第二账号,并向该第二账号发送消息通知,该消息通知用于通知第一账号向第二账号发送了通讯消息,第二账号接收到该消息通知之后,生成确认查看的请求,服务器响应于该查看请求,将通讯消息的内容发送给第二账号。
在一个可选的实施例中,第一账号和第二账号可以为用户预先在即时通讯客户端申请的账号,账号可以使用字符串来表示,该字符串中可以包括文字或数字,进一步地,每个账号可以唯一标识一个用户。
可选的,检测该通讯消息中是否包含图片可以通过检测通讯消息中是否包含预定特征,该预定特征为预先设置的、与图片相对应的特征,例如,该预定特征可以为预定字符串,如,bmp、jpg、以及gif等字符串。
步骤S303:服务器获取第一账号的行为特征。
可选地,服务器可以记录第一账号执行的操作,这里的操作被称之为账户的行为,进一步地,执行的操作包括与通讯消息相关联的操作,例如,该操作可以包括:发送通讯消息、接收通讯消息的操作。在服务器记录第一账号的操作之后,服务器对记录的操作信息进行特征分析,以确定账号的行为特征。
其中,行为特征用于记录第一账号发送通讯消息的一个或多个维度的行为信息,例如,该行为特征可以包括该第一账号发送消息的频率、该账号是否执行过非法操作等维度的信息。其中,非法操作可以为发送预定类型的图片的操作,该预定类型的图片为不允许在网络中传输的图片。
可选地,该行为特征包括下述至少之一的维度的信息:账号等级、I P从属地、注册地点、非法操作记录、给预定类型的账号发送消息的数量、在预定时间内发送消息的数量、消息接收人回复比例、以及包含图片的消息占发送消息总量的比例。
其中,账号等级可以基于该第一账号的发送消息的数量来确定,可以基于该第一账号的登录时长来确定,还可以基于该第一账号的信用度来确定。可选地,处理不同业务的通讯消息的账号等级的确定方式可以相同或者不同。
在一个可选的实施例中,处理虚拟资源业务的通讯消息的账号等级可以基于其处理的虚拟资源的操作次数和/或资源数量来确定,具体地,处理电商业务的通讯消息的 账号等级可以基于其转入和/或转出虚拟资源的次数来确定,例如,可以基于该第一账号购买电商上的物品的次数来确定其买家等级,基于该第一账号卖出电商上的物品的次数来确定其卖家等级;又如,可以基于该第一账号购买电商上的物品花费资源总量(如消费总量)来确定其买家等级,基于该第一账号卖出电商上的物品的资源总量(如卖出商品总收入)来确定其卖家等级。
在另一个可选的实施例中,处理社交业务的通讯消息的账号等级可以基于其发送和/或查看的社交信息的数量、或在线时长来确定,例如,可以基于该第一账号的在线时长确定该信息的等级,可选地,时长越长,等级越高。
上述实施例中的给预定类型的账号发送消息的数量可以为给低于第一账号的等级的账号发送消息的数量,如给等级卖家发送消息的数量。
上述实施例中的预定时间可以为当天。
可选地,上述实施例中的消息接收人回复比例可以基于第一账号发送通讯消息的数量M和接收到响应于发送消息的回复消息的数量N来确定,如,将M和N的比值作为上述消息接收人的回复比例。
在服务器确定第一账号的行为特征之后,将各个第一账号的行为特征记录在如图1所示数据存储装置的数据库中,可选地,每个账号的ID对应一个存储区域,该存储区域中记录有用于表示所有该ID的行为特征的数据。在另一个可选的实施例中,可以在行为数据库中按照账号ID记录每个行为,在服务器获取到第一账号之后,从数据库中读取具有该第一账号的ID的记录,得到该第一账号的行为特征。
步骤S305:至少基于第一账号的行为特征,检测通讯消息包含的图片是否为预定类型的图片。
在一个可选的实施例中,可以基于该第一账号的行为特征检测该账号是否为不允许发送包含图片的通讯消息的账号,如果该账号为允许发送包含图片的通讯消息的账号,则确定该通讯消息包含的图片为预定类型的图片;如果该账号为不允许发送包含图片的通讯消息的账号,则确定该通讯消息包含的图片可能为预定类型的图片。
进一步地可选地,基于该第一账号的行为特征检测该账号是否为不允许发送包含图片的通讯消息的账号,可以通过执行下述至少之一的操作来实现:
检测行为特征中的账号等级是否符合预定等级,若检测出该账号等级符合预定等级,则检测出该第一账号为允许发送包含图片的通讯消息的账号;若检测出该账号等级不符合预定等级,则检测出该第一账号为不允许发送包含图片的通讯消息的账号, 该预定等级可以为预先设置的白名单等级,例如,符合该等级的账号均被确定为从未执行非法操作的账号。
检测行为特征的IP从属地是否属于预先确定的非法IP从属地,若检测出该账号的IP从属地属于预先确定的非法IP从属地,则检测出该第一账号为不允许发送包含图片的通讯消息的账号;若检测出该账号的IP从属地不属于预先确定的非法IP从属地,则检测出该第一账号为允许发送包含图片的通讯消息的账号。
检测行为特征的注册地点是否属于预先确定的非法注册地点,若检测出该账号的注册地点属于预先确定的非法注册地点,则检测出该第一账号为不允许发送包含图片的通讯消息的账号;若检测出该账号的注册地点不属于预先确定的非法注册地点,则检测出该第一账号为允许发送包含图片的通讯消息的账号。
检测行为特征中是否存在非法操作记录,若检测出该行为特征中存在非法操作记录,则检测出该第一账号为不允许发送包含图片的通讯消息的账号;若检测出该行为特征中不存在非法操作记录,则检测出该第一账号为允许发送包含图片的通讯消息的账号。
检测行为特征中记录的给预定类型的账号发送消息的数量是否大于第一预定阈值,若检测出该行为特征中记录的给预定类型的账号发送消息的数量大于第一预定阈值,则检测出该第一账号为不允许发送包含图片的通讯消息的账号;若检测出行为特征中记录的给预定类型的账号发送消息的数量不大于第一预定阈值,则检测出该第一账号为允许发送包含图片的通讯消息的账号。
检测行为特征中记录的在预定时间内发送消息的数量是否大于第二预定阈值,若检测出该行为特征中记录的在预定时间内发送消息的数量大于第二预定阈值,则检测出该第一账号为不允许发送包含图片的通讯消息的账号;若检测出行为特征中记录的在预定时间内发送消息的数量不大于第二预定阈值,则检测出该第一账号为允许发送包含图片的通讯消息的账号。
检测行为特征中记录的消息接收人回复比例是否小于第一预定比例,若检测出行为特征中记录的消息接收人回复比例小于第一预定比例,则检测出该第一账号为不允许发送包含图片的通讯消息的账号;若检测出行为特征中记录的消息接收人回复比例不小于第一预定比例,则检测出该第一账号为允许发送包含图片的通讯消息的账号。
检测行为特征中记录的包含图片的消息占发送消息总量的比例是否大于第二预定比例,若检测出行为特征中记录的包含图片的消息占发送消息总量的比例大于第二预定比例,则检测出该第一账号为不允许发送包含图片的通讯消息的账号;若检测出行 为特征中记录的包含图片的消息占发送消息总量的比例不大于第二预定比例,则检测出该第一账号为允许发送包含图片的通讯消息的账号。
可选地,从账号库中查找是否存在该账号,如果存在该账号,则确定该账号为不允许发送包含图片的通讯消息的账号;如果不存在该账号,则确定该账号为允许发送包含图片的通讯消息的账号。
为了进一步地提高图片类型识别的准确度,至少基于第一账号的行为特征,检测通讯消息包含的图片是否为预定类型的图片可以通过检测通讯消息包含的图片的属性特征和第一账号的行为特征来实现。
在另一个可选的实施例中,该基于该第一账号的行为特征检测该账号是否为不允许发送包含图片的通讯消息的账号可以通过如图4所示的步骤来实现:
步骤S401:获取通讯消息包含的图片的属性特征。
在获取到通讯消息之后,可以对通讯消息包含的图片进行识别,该识别可以包括图片色彩、图片结构和图片纹理的识别,以获取图片的一个或多个维度的属性特征。
在一个可选的实施例中,属性特征可以包括下述至少之一:图片长度、图片高度、图片长与高的比、图片尺寸、图片主色彩数目、图片的各个主色彩、以及图片的各个主色彩占所有色彩的比例。
其中,图片长度可以通过检测图片中横向像素的个数来实现,图片高度可以通过检测图片中纵向像素的个数来实现,图片长与高的比可以通过计算图片中横向像素与纵向像素的个数比来实现,图片尺寸也可以通过检测图片中横向像素和纵向像素的个数来实现
上述实施例中的图片主色彩数目表示图片中主要色彩的数量,该主要色彩可以为在整个图片中出现比例高于预定阈值的色彩,例如,整个图片中红色像素的出现比例为90%,则红色为主色彩;又如,整个图片中红色像素和蓝色的出现比例均为45%,则红色和蓝色均为主色彩。
可选地,该图片主色彩的数目可以为预定值,如10,该图片主色彩的数目还可以基于图片来确定,本申请对此不做限定。
步骤S403:基于图片的属性特征和第一账号的行为特征,检测通讯消息包含的图片是否为预定类型的图片。
基于属性特征和行为特征检测图片是否为预定类型的图片,在检测图片的类型的过程中,不仅参考了图片的基础属性特征(如,主色彩数目,主色彩的种类,图片大小,图片分辨率等),也参考了发送账号的行为特征(如发信人ip地区、发信人7天是否有处罚记录、发信人发信对象的等级分布等),通过这些特征,可以更准确的区分问题图片(即上述实施例中的预定类型的图片)与普通图片的差别,并且第一账号的行为特征的检测比图片特征的检测更加的高效快捷,可以满足线上实时性的需要。
这里的每个发信人对应一个第一账号,每个发信对象(如收信人、接收方)对应一个第二账号。
可选地,基于属性特征和行为特征,检测通讯消息包含的图片特征是否为预定类型的图片包括:获取属性特征对应的属性向量和行为特征对应的行为向量;组合属性向量和行为向量,得到通讯消息包含的图片的特征向量;基于特征向量,检测通讯消息包含的图片是否为预定类型的图片。其中,向量是指具有大小和方向的量。
上述实施例中,获取到的属性特征和行为特征均可以为多维的特征,为了更加清楚简洁地查看获取到的特征,可以以向量的形式表示属性特征和行为特征;进一步地,在将属性特征和行为特征合并时,采用向量的形式,将两组向量简单地相加即可实现,操作简单、处理速度快。在该实施例中,每维特征可以用一个特征向量来表示,也即,多维特征对应的向量为一组特征向量:f1=(x1),f2=(x2),f3=(x3),……,fn=(xn);另一种可选地,将多维特征串联起来作为一个向量,如f=(x1,x2,x3,……,xn)。其中,x1,x2,x3,……,xn分别表示一维特征(可以为行为特征或属性特征),f表示向量。
在上述实施例中,获取到属性向量和行为向量之后,将该行为向量和属性向量的集合组合在一起,得到图片的特征向量,利用该特征向量确定该图片是否为预定类型的图片。
在一个可选的实施例中,基于特征向量,检测通讯消息包含的图片是否为预定类型的图片可以包括:从数据库中查找与该特征向量的相似度大于预定阈值的预存向量,检测预存向量的类型,若检测出预存向量的类型为预定类型,则确定通讯消息包含的图片为预定类型的图片。
其中,检测预存向量的类型可以通过从数据库中查找该与预存向量对应的类型来实现。
若查找到一个预存向量,则从数据库中读取该预存向量对应的类型。
若查找到多个预存向量,则获取与特征向量的相似度最高的预存向量,获取该相似度最高的预存向量对应的类型,得到特征向量对应的类型。其中,向量之间的相似 度可以通过两个向量之间的余弦夹角来确定,可选地,余弦夹角越大,表示两个向量的相似度越小;余弦夹角越小,表示两个向量的相似度越大。
可选地,可以对多个预存向量与特征向量的相似度进行排序,得到队列,若按照相似度从高到低的顺序,则可以取队列中的第一个预存向量,作为相似度最高的预存向量;若按照相似度从低到高的顺序,则可以取队列中的最后一个预存向量,作为相似度最高的预存向量。
在另一个可选的实施例中,基于特征向量,检测通讯消息包含的图片是否为预定类型的图片可以包括:通过分类器,将特征向量判定至预存类别中的一个类别,得到判定结果,其中,预存类别包括预定类型的图片对应的类别;若判定结果指示特征向量属于预定类型的图片对应的类别,则确定通讯消息包含的图片为预定类型的图片。
可选地,分类器可以为预先建立的分类器,建立分类器可以通过如下方式实现:获取历史时间段内的包含图片的通讯消息,确定获取到的图片的类型,其中,该类型包括预定类型和非预定类型;分别获取预定类型的图片的第一账号的特征向量(包括行为向量和属性向量),和非预定类型的图片的第一账号的特征向量(包括行为向量和属性向量);将预定类型的图片的特征向量作为负样本向量,将非预定类型的图片的特征向量作为正样本向量,利用正样本向量和负样本向量进行分类训练,得到分类器。
在一个可选的实施例中,在获取图片的特征向量之后,调用分类器,将特征向量输入分类器,该分类器获取到特征向量之后,利用分类算法(如分类函数或者分类模型)将该特征向量映射至预存的多个类别中的一个类别,并得到判定结果,该判定结果用于指示特征向量所属的类别,若该判定结果指示特征向量属于预定类型的图片对应的类别,则确定通讯消息包含的图片为预定类型的图片;若该判定结果指示特征向量属于非预定类型的图片对应的类别,则确定通讯消息包含的图片不为预定类型的图片。
可选地,分类算法可以为SVM算法、朴素贝叶斯、决策树和KNN算法。
图2所示的系统中还可以包括第二终端,服务器还用于在检测出通讯消息包含的图片不是预定类型的图片的情况下,获取通讯消息的第二账号,将通讯消息发送给第二账号;系统还包括:第二终端35,第二账号登录在该第二终端上,用于接收通讯消息。
在一个可选的实施例中,在检测出通讯消息包含的图片不为预定类型的图片的情况下,将通讯消息发送至第二账号,可选地,第二账号可以利用第二终端接收通讯消息;在检测出通讯消息包含的图片为预定类型的图片的情况下,将图片存入图片库, 和/或,将第一账号存入账号库,从而在下次在接收到该图片或者该第一账号发送的图片,可以快速准确地从图片库或账号库中查找到,从而可以快速完成对图片类型的识别,提高处理速度。
通过上述实施例,在即时通讯软件上发送的海量消息图片中,实时筛选出特定类型的图片,若该图片中携带有欺诈信息,则阻断该消息的发送,以阻断相应的欺诈行为的发生,或是确定目标嫌疑账号,对这些账号进行快速的限权。
在一个可选的实施例中,在接收到的通讯消息中包含图片的情况下,服务器可以预先检测图片库中是否存储有通讯消息包含的图片,在图片库中存储有通讯消息包含的图片的情况下,确定图片为预定类型的图片,则阻断该通讯消息的传递;若在图片库中未存储通讯消息包含的图片,再执行图3所示的步骤S301。通过该实施例可以快速识别图片的类型。
在另一个可选的实施例中,在获取通讯消息的第一账号之后,服务器可以预先检测账号库中是否存储有第一账号;在账号库中存储有第一账号的情况下,确定图片为预定类型的图片,则阻断该通讯消息的传递;在账号库中未存储第一账号的情况下,确定图片不为预定类型的图片,则执行图3所示的步骤S301。
本申请还提供了一种可选的实施例,下面结合图4和图6对该可选的实施例进行详细说明。
在启动对图片的类别进行识别(或检测)之前,可以获取图片库和账号库,其中,图片库中存储有问题图片(即为预定类型的图片),账号库中存储有第一账号,该账号库中的第一账号不允许在网络中发送包含图片的通讯消息,该账号库中的账号和图片库中的数据可以基于历史数据来确定,例如,获取历史时间段内已经确定为传播预定类型的图片的账号,将该账号存入账号库中;又如,获取历史时间段内已经确定为预定类型的图片,将该图片存入图片库中。
下面以预定类型的图片为包含欺诈信息的图片为例,对本申请的实施例进行说明,可选地,获取过去48小时的欺诈消息,从欺诈消息中获取欺诈图片和欺诈消息的发送人信息;在获取到欺诈消息之后,分析该欺诈消息中的图片,以获取欺诈消息的图片的一个或多个属性特征,如表1示出了几个维度的属性信息。
表1
表1中示出的主色彩数目可以根据实际需要选取,可选地,可以选取10种,有的图片中无法提取到包含10种色彩,则将记录该图片的主色彩的信息中无法提取到信息的部分用0来填充。
为了加快分析速度,本申请提供了一个实施例,该实施例中可以将相似的色彩进行合并,视为同一种颜色,例如,将全彩颜色投影到512中色域中。
可选地,可以将红绿蓝的三个值每32种颜色作为一个色域,那么红绿蓝三种颜色组合而成的色域共有512种,任何颜色都可以投影到这512种色域中,在对图片进行色彩识别时,可以计算每个像素点颜色投影到的色域,计算公式如下:r/32+(g/32)*8+(b/32)*64,其中,r表示红色、g表示绿色、b表示蓝色,每个颜色都可以由红绿蓝三种颜色组合而成,因此,通过上述计算公式可以计算每个像素点颜色所属的色域,在另一个可选的实施例中,可以预先计算各个颜色投影到的色域,在识别图片的色彩时,利用预先确定的颜色所属的色域可以直接确定各个像素点对应的色域;计算每一个色域在整个图片中占得比例,得到主色彩占所有色彩的比例,以完善图片的色彩矩阵。
在获取欺诈信息之后,可以基于欺诈消息发送人的信息获取发送人的一维或多维行为特征,可选地,可以获取表2示出的行为特征。
表2
在获取到行为特征和属性特征之后,将行为特征和属性特征表示为向量的形式,并将图片属性向量和用户行为向量相组合得到每一张图片的特征向量。
根据本申请的实施例,还可以获取正常用户的聊天图片,并生成正常图片的特征向量,该生成向量的方式与上述实施例中的生成方式一致,在此不再赘述。
可选地,将所有的欺诈图片的特征向量作为负样本(或称之为负样本向量),将获取的正常用户的聊天图片生成的正常图片特征向量作为正样本(或称之为正样本向量),得到一个用于机器学习分类的训练集。
可选的,该训练集中的样本可以实时更新,以使得训练得到的分类器可以及时地更新,从而可以更加准确地对图片类型进行分类。
利用该训练集训练SVM分类器,生成用来基于图片的特征向量对图片进行分类,以确定该图片是否为问题图片的SVM分类器。
如图5所示,在训练好分类器之后,可以通过下述方案实现该实施例:
步骤S601:获取包含图片的通讯消息。
可选地,对于服务器来说,每发送一条消息服务器都可以获取到,服务器可以接收第一终端发送的通讯消息,该通讯消息可以为微信消息。
可选地,可以利用图6所示的获取模块获取通讯消息,该获取模块中可以运行消息订阅进程,以获取服务器接收到的通讯消息。
在获取到消息之后,服务器检测该消息中是否包含图片,若包含图片,则进入下述流程。
步骤S602:检测发信人是否存在账号库中。
若是,则执行步骤S603;若否,则执行步骤S604。
可选地,该账号库也是实时更新的,如,记录距离当前时刻最近的预定时长的信息,该预定时长可以为48小时。例如,当一条新的旺旺包含图片的消息传入时,服务器获取旺旺图片消息的发信人(即第一账号),检查发信人是否在48小时嫌疑人名单中。
可选地,可以通过图6所示的账号检测模块实现该步骤。
步骤S603:对该图片进行审核。
如果该发信人在账号库的名单中不需要经过任何其他检查,直接推送到图6所示的审核平台,以进行相应的审核。其中,这里的审核可以通过审查平台接收审核结果来实现,审核结果用于指示该图片是否通过审核。
步骤S604:获取图片的MD5值。
步骤S605:利用MD5值检测图片库中是否存在与该图片一样的图片。
若是,则执行步骤S603;若否,执行步骤S606。
如果该发信人在账号库的名单中,则通过图6所示的图片检测模块提取图片的MD5值,将MD5值提交到图片库(如问题图片库)中进行检查,检查在图片库中是否存在完全与该图片一样的图片,如果存在,则执行直接推送到审核平台,以进行相应的审核。
步骤S606:生成图片的特征向量。
特征向量生成模块通过用户行为分析模块实时计算获取相应的用户行为信息(如行为特征),并通过图片特征提取模块提取图片的属性特征(如进行图片主色彩和尺寸大小方面的分析),然后将这两个服务的返回向量进行拼接,得到相应的特征向量。
步骤S607:调用分类器,检测图片是否为预定类型的图片。
若是,则执行步骤S603;若否,则结束。
可选地,通过图6所示的图片类型预测模块将特征向量传入到训练好的SVM分类器中,分析是否是问题图片,如果是问题图片那么提交审核,如果不是问题图片直接 结束检查,消息放行。
在步骤S603之后,若审核未通过进入步骤S608;若审核通过,则结束。
步骤S608:提取发信人和MD5值。
步骤S609:存储发信人和MD5值。
在审查后如果是问题图片,将嫌疑人和图片都加入到相应的缓存中,即嫌疑人缓存和问题图片缓存,从而形成闭环,可以源源不断的抓取新的嫌疑人和问题图片。如果不是问题图片直接结束检查,消息放行。
可选地,为了提高整个系统的运行效率,图6所示的账号检测模块(如嫌疑人检测服务),图片检测模块(如嫌疑图片检测服务)均使用一致性哈希算法将其映射到某台服务器上提高其检查效率,用户行为分析模块可以使用LRU来缓存最近的被查找的用户行为数据,以避免对同一个用户的多次行为分析,提高系统整体的运行效率。
通过上述实施例,使用发送图片的用户行为和图片属性的方式来区分图片,并使用机器学习的方法为图片分类;将图片转换成用户行为和图片属性的向量用于进行图片相似度的计算用于提高图片分类效率。通过上述实施例,利用用户行为和图片属性为图片生成一个唯一的特征向量,使用多级缓存机制加快线上欺诈垃圾账号的识别。
在一个可选的实施例中,可以通过增加一个或多个向量维度,如添加几维不同的属性,增加处理的准确性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例2
根据本申请实施例,还提供了一种用于实施上述图片的处理方法的处理装置,如图7所示,该装置包括:
接收单元81,用于接收通讯消息,其中,通讯消息中包含图片。
第一获取单元82,用于获取通讯消息的第一账号。
第二获取单元83,用于获取第一账号的行为特征。
检测单元85,用于至少基于第一账号的行为特征,检测通讯消息包含的图片是否为预定类型的图片。
在上述实施例中,服务器接收到第一账号发送的通讯消息之后,检测该通讯消息中是否包含图片,在该通讯消息中包含图片的情况下,基于该第一账号的行为特征检测该图片是否为预定类型的图片,在该方案中,不是单单基于图片的属性特征进行图片类型的检测,即便是改变了该图片的属性(如对图片进行扭曲变形处理),也可以基于第一账号的行为特征检测图片的类型,提高了检测图片的类型的准确率;并且获取第一账号的行为特征的速度远远高于对图片的属性进行识别的速度,提高了检测图片的类型的速度。通过上述实施例,解决了现有技术中识别图片类型的效率低的问题,实现了可以准确、快速识别图片的类型的效果。
上述实施例中的通讯消息可以为即时通讯消息,用户可以在登录了即时通讯账号的客户端生成通讯消息,并将通讯消息发送给服务器,服务器向通讯消息指定的第二账号发送消息通知,第二账号接收到通知之后,生成确认查看的请求,服务器响应于该查看请求,将通讯消息发送给第二账号。
在上述实施例中,装置还包括:第一获取单元还用于若检测出通讯消息包含的图片为预定类型的图片,则获取预定类型的图片的审核结果;发送单元,用于若审核结果用于指示预定类型的图片审核通过,则将通讯消息发送至第二账号;处理单元,用于若审核结果用于指示预定类型的图片审核未通过,则将预定类型的图片存入图片库,和/或,将第一账号存入账号库。
可选地,检测单元包括:获取模块,用于获取通讯消息包含的图片的属性特征;检测模块,用于基于属性特征和行为特征,检测通讯消息包含的图片特征是否为预定类型的图片。
可选地,检测模块具体用于:获取属性特征对应的属性向量和行为特征对应的行为向量;组合属性向量和行为向量,得到通讯消息包含的图片的特征向量;基于特征向量,检测通讯消息包含的图片是否为预定类型的图片。
可选地,检测模块进一步用于:通过分类器,将特征向量判定至预存类别中的一个类别,得到判定结果,其中,预存类别包括预定类型的图片对应的类别;若判定结果指示特征向量属于预定类型的图片对应的类别,则确定通讯消息包含的图片为预定类型的图片。
可选地,检测模块进一步用于:基于所述特征向量,检测所述通讯消息包含的图片是否为预定类型的图片包括:从数据库中查找与该特征向量的相似度大于预定阈值的预存向量;检测所述预存向量的类型;若检测出预存向量的类型为预定类型,则确定所述通讯消息包含的图片为预定类型的图片。
其中,属性特征至少包括下述至少之一:图片长度、图片高度、图片长与高的比、图片尺寸、图片主色彩数目、图片的各个主色彩、以及图片的各个主色彩占所有色彩的比例。
可选地,检测单元还用于在接收到的通讯消息中包含图片的情况下,检测图片库中是否存储有通讯消息包含的图片;装置还包括:第一确定单元,用于在图片库中存储有通讯消息包含的图片的情况下,确定图片不为预定类型的图片。
可选地,检测单元还用于在获取通讯消息的第一账号之后,检测账号库中是否存储有第一账号;装置还包括:第二确定单元,用于在账号库中存储有第一账号的情况下,确定图片不为预定类型的图片。
上述实施例中的行为特征包括下述至少之一:账号等级、IP从属地、注册地点、非法操作记录、给预定类型的账号发送消息的数量、在预定时间内发送消息的数量、消息接收人回复比例、以及包含图片的消息占发送消息总量的比例。
本实施例中所提供的各个模块与方法实施例对应步骤所提供的使用方法相同、应用场景也可以相同。当然,需要注意的是,上述模块涉及的方案可以不限于上述实施例中的内容和场景,且上述模块可以运行在计算机终端或移动终端,可以通过软件或硬件实现。
实施例3
本申请的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,图8是根据本申请实施例的一种计算机终端的结构框图。如图8所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器902、存储器904。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的图片处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图片的处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:接收通讯消息,其中,该通讯消息包括图片;获取通讯消息的第一账号,其中,第一账号为发送通讯消息的账号;获取第一账号的行为特征;至少基于第一账号的行为特征,检测通讯消息包含的图片是否为预定类型的图片。
可选的,上述处理器还可以执行如下步骤的程序代码:在检测通讯消息包含的图片是否为预定类型的图片之后,若检测出通讯消息包含的图片为预定类型的图片,则获取预定类型的图片的审核结果;若审核结果用于指示预定类型的图片审核通过,则将通讯消息发送至第二账号;若审核结果用于指示预定类型的图片审核未通过,则将预定类型的图片存入图片库,和/或,将第一账号存入账号库。
可选的,上述处理器还可以执行如下步骤的程序代码:获取通讯消息包含的图片的属性特征;基于属性特征和行为特征,检测通讯消息包含的图片是否为预定类型的图片,以至少基于第一账号的行为特征,检测通讯消息包含的图片是否为预定类型的图片。
可选的,上述处理器还可以执行如下步骤的程序代码:获取属性特征对应的属性向量和行为特征对应的行为向量;组合属性向量和行为向量,得到通讯消息包含的图片的特征向量;基于特征向量,检测通讯消息包含的图片是否为预定类型的图片,以基于属性特征和行为特征,检测通讯消息包含的图片是否为预定类型的图片。
可选的,上述处理器还可以执行如下步骤的程序代码:通过分类器,将特征向量判定至预存类别中的一个类别,得到判定结果,其中,预存类别包括预定类型的图片对应的类别;若判定结果指示特征向量属于预定类型的图片对应的类别,则确定通讯消息包含的图片为预定类型的图片,以基于特征向量,检测通讯消息包含的图片是否为预定类型的图片。
可选的,上述处理器还可以执行如下步骤的程序代码:从数据库中查找与该特征向量的相似度大于预定阈值的预存向量;检测预存向量的类型;若检测出预存向量的类型为预定类型,则确定通讯消息包含的图片为预定类型的图片,以基于特征向量,检测通讯消息包含的图片是否为预定类型的图片。
可选的,上述处理器还可以执行如下步骤的程序代码:在接收到的通讯消息中包含图片的情况下,检测图片库中是否存储有通讯消息包含的图片;在图片库中存储有通讯消息包含的图片的情况下,确定图片不为预定类型的图片。
可选的,上述处理器还可以执行如下步骤的程序代码:在获取通讯消息的第一账号之后,检测账号库中是否存储有第一账号;在账号库中存储有第一账号的情况下,确定图片不为预定类型的图片。
采用本申请实施例,服务器接收到第一账号发送的通讯消息之后,基于该第一账号的行为特征检测该图片是否为预定类型的图片,在该方案中,不是单单基于图片的属性特征进行图片类型的检测,即便是改变了该图片的属性(如对图片进行扭曲变形处理),也可以基于第一账号的行为特征检测图片的类型,提高了检测图片的类型的准确率;并且获取第一账号的行为特征的速度远远高于对图片的属性进行识别的速度,提高了检测图片的类型的速度。通过上述实施例,解决了现有技术中识别图片类型的效率低的问题,实现了可以准确、快速识别图片的类型的效果。
本领域普通技术人员可以理解,图8所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图8其并不对上述电子装置的结构造成限定。例如,计算机终端1还可包括比图8中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图8所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的图片的处理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:接收通讯消息,其中,该通讯消息包括图片;获取通讯消息的第一账号,其中,第一账号为发送通讯消息的账号;获取第一账号的行为特征;至少基于第一账号的行为特征,检测通讯消息包含的图片是否为预定类型的图片。
在上述实施例中,服务器接收到第一账号发送的通讯消息之后,基于该第一账号的行为特征检测该图片是否为预定类型的图片,在该方案中,不是单单基于图片的属性特征进行图片类型的检测,即便是改变了该图片的属性(如对图片进行扭曲变形处理),也可以基于第一账号的行为特征检测图片的类型,提高了检测图片的类型的准确率;并且获取第一账号的行为特征的速度远远高于对图片的属性进行识别的速度,提高了检测图片的类型的速度。通过上述实施例,解决了现有技术中识别图片类型的效率低的问题,实现了可以准确、快速识别图片的类型的效果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:在检测通讯消息包含的图片是否为预定类型的图片之后,若检测出通讯消息包含的图片为预定类型的图片,则获取预定类型的图片的审核结果;若审核结果用于指示预定类型的图片审核通过,则将通讯消息发送至第二账号;若审核结果用于指示预定类型的图片审核未通过,则将预定类型的图片存入图片库,和/或,将第一账号存入账号库。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取通讯消息包含的图片的属性特征;基于属性特征和行为特征,检测通讯消息包含的图片是否为预定类型的图片,以至少基于第一账号的行为特征,检测通讯消息包含的图片是否为预定类型的图片。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取属性特征对应的属性向量和行为特征对应的行为向量;组合属性向量和行为向量,得到通讯消息包含的图片的特征向量;基于特征向量,检测通讯消息包含的图片是否为预定类型的图片,以基于属性特征和行为特征,检测通讯消息包含的图片是否为预定类型的图片。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过分类器,将特征向量判定至预存类别中的一个类别,得到判定结果,其中,预存类别包括预定类型的图片对应的类别;若判定结果指示特征向量属于预定类型的图片对应的类别,则确定通讯消息包含的图片为预定类型的图片,以基于特征向量,检测通讯消息包含的图片是否为预定类型的图片。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:从数据库中查找与该特征向量的相似度大于预定阈值的预存向量;检测预存向量的类型;若检测出预存向量的类型为预定类型,则确定通讯消息包含的图片为预定类型的图片,以基于特征向量,检测通讯消息包含的图片是否为预定类型的图片。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:在接收到的通讯消息中包含图片的情况下,检测图片库中是否存储有通讯消息包含的图片;在图片库中存储有通讯消息包含的图片的情况下,确定图片不为预定类型的图片。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:在获取通讯消息的第一账号之后,检测账号库中是否存储有第一账号;在账号库中存储有第一账号的情况下,确定图片不为预定类型的图片。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所 述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (14)

1.一种图片的处理系统,其特征在于,包括:
第一终端,其中,第一账号登录在所述第一终端上,所述第一终端通过所述第一账号发送通讯消息;
服务器,用于接收所述通讯消息,获取所述通讯消息的第一账号,根据所述第一账号获取所述第一账号的行为特征,以及至少基于所述第一账号的行为特征,检测所述通讯消息包含的图片是否为预定类型的图片。
2.根据权利要求1所述的系统,其特征在于,
所述服务器还用于若检测出所述通讯消息包含的图片为所述预定类型的图片,则获取所述预定类型的图片的审核结果;若所述审核结果用于指示所述预定类型的图片审核通过,则将所述通讯消息发送至第二账号;
所述系统还包括:第二终端,所述第二账号登录在所述第二终端上,用于接收所述通讯消息。
3.根据权利要求2所述的系统,其特征在于,
所述服务器还用于若所述审核结果用于指示所述预定类型的图片审核未通过,则将所述预定类型的图片存入图片库,和/或,将所述第一账号存入账号库;
所述系统还包括:第二终端,所述第二账号登录在所述第二终端上,用于接收所述通讯消息。
4.一种图片的处理方法,其特征在于,包括:
接收通讯消息,其中,该通讯消息包括图片;
获取所述通讯消息的第一账号,其中,所述第一账号为发送所述通讯消息的账号;
获取所述第一账号的行为特征;
至少基于所述第一账号的行为特征,检测所述通讯消息包含的图片是否为预定类型的图片。
5.根据权利要求4所述的方法,其特征在于,在检测所述通讯消息包含的图片是否为预定类型的图片之后,所述方法还包括:
若检测出所述通讯消息包含的图片为所述预定类型的图片,则获取所述预定类型的图片的审核结果;
若所述审核结果用于指示所述预定类型的图片审核通过,则将所述通讯消息发送至第二账号;
若所述审核结果用于指示所述预定类型的图片审核未通过,则将所述预定类型的图片存入图片库,和/或,将所述第一账号存入账号库。
6.根据权利要求4所述的方法,其特征在于,至少基于所述第一账号的行为特征,检测所述通讯消息包含的图片是否为预定类型的图片包括:
获取所述通讯消息包含的图片的属性特征;
基于所述属性特征和所述行为特征,检测所述通讯消息包含的图片是否为预定类型的图片。
7.根据权利要求6所述的方法,其特征在于,基于所述属性特征和所述行为特征,检测通讯消息包含的图片是否为预定类型的图片包括:
获取所述属性特征对应的属性向量和所述行为特征对应的行为向量;
组合所述属性向量和所述行为向量,得到所述通讯消息包含的图片的特征向量;
基于所述特征向量,检测所述通讯消息包含的图片是否为预定类型的图片。
8.根据权利要求7所述的方法,其特征在于,基于所述特征向量,检测所述通讯消息包含的图片是否为预定类型的图片包括:
通过分类器,将所述特征向量判定至预存类别中的一个类别,得到判定结果,其中,所述预存类别包括所述预定类型的图片对应的类别;
若所述判定结果指示所述特征向量属于所述预定类型的图片对应的类别,则确定所述通讯消息包含的图片为预定类型的图片。
9.根据权利要求7所述的方法,其特征在于,基于所述特征向量,检测所述通讯消息包含的图片是否为预定类型的图片包括:
从数据库中查找与该特征向量的相似度大于预定阈值的预存向量;
检测所述预存向量的类型;
若检测出预存向量的类型为预定类型,则确定所述通讯消息包含的图片为预定类型的图片。
10.根据权利要求7所述的方法,其特征在于,所述属性特征至少包括下述至少之一:图片长度、图片高度、图片长与高的比、图片尺寸、图片主色彩数目、图片的各个主色彩、以及图片的各个主色彩占所有色彩的比例。
11.根据权利要求4所述的方法,其特征在于,所述方法还包括:
在接收到的通讯消息中包含图片的情况下,检测图片库中是否存储有所述通讯消息包含的图片;
在所述图片库中存储有所述通讯消息包含的图片的情况下,确定所述图片不为所述预定类型的图片。
12.根据权利要求4所述的方法,其特征在于,所述方法还包括:
在获取所述通讯消息的第一账号之后,检测账号库中是否存储有所述第一账号;
在所述账号库中存储有所述第一账号的情况下,确定所述图片不为所述预定类型的图片。
13.根据权利要求4所述的方法,其特征在于,所述行为特征包括下述至少之一:账号等级、IP从属地、注册地点、非法操作记录、给预定类型的账号发送消息的数量、在预定时间内发送消息的数量、消息接收人回复比例、以及包含图片的消息占发送消息总量的比例。
14.一种图片的处理装置,其特征在于,包括:
接收单元,用于接收通讯消息,其中,该通讯消息包括图片;
第一获取单元,用于获取所述通讯消息的第一账号,其中,所述第一账号为发送所述通讯消息的账号;
第二获取单元,用于获取所述第一账号的行为特征;
检测单元,用于至少基于所述第一账号的行为特征,检测所述通讯消息包含的图片是否为预定类型的图片。
CN201710012643.1A 2017-01-06 2017-01-06 图片的处理方法、装置及系统 Pending CN108280459A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710012643.1A CN108280459A (zh) 2017-01-06 2017-01-06 图片的处理方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710012643.1A CN108280459A (zh) 2017-01-06 2017-01-06 图片的处理方法、装置及系统

Publications (1)

Publication Number Publication Date
CN108280459A true CN108280459A (zh) 2018-07-13

Family

ID=62801019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710012643.1A Pending CN108280459A (zh) 2017-01-06 2017-01-06 图片的处理方法、装置及系统

Country Status (1)

Country Link
CN (1) CN108280459A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109409412A (zh) * 2018-09-28 2019-03-01 新华三大数据技术有限公司 图片处理方法及装置
CN109523591A (zh) * 2018-11-21 2019-03-26 北京锐安科技有限公司 图片的处理方法、装置、设备和存储介质
CN110875875A (zh) * 2018-09-03 2020-03-10 Oppo广东移动通信有限公司 电子红包消息检测方法、检测装置及终端设备
CN110875869A (zh) * 2018-08-31 2020-03-10 Oppo广东移动通信有限公司 一种红包识别方法、系统及终端设备
CN111651981A (zh) * 2019-02-19 2020-09-11 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413076A (zh) * 2011-12-22 2012-04-11 网易(杭州)网络有限公司 基于行为分析的垃圾邮件判定系统
CN103020645A (zh) * 2013-01-06 2013-04-03 深圳市彩讯科技有限公司 一种垃圾图片识别方法和系统
CN103020646A (zh) * 2013-01-06 2013-04-03 深圳市彩讯科技有限公司 一种支持增量训练的垃圾图片识别方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413076A (zh) * 2011-12-22 2012-04-11 网易(杭州)网络有限公司 基于行为分析的垃圾邮件判定系统
CN103020645A (zh) * 2013-01-06 2013-04-03 深圳市彩讯科技有限公司 一种垃圾图片识别方法和系统
CN103020646A (zh) * 2013-01-06 2013-04-03 深圳市彩讯科技有限公司 一种支持增量训练的垃圾图片识别方法和系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110875869A (zh) * 2018-08-31 2020-03-10 Oppo广东移动通信有限公司 一种红包识别方法、系统及终端设备
CN110875869B (zh) * 2018-08-31 2022-05-31 Oppo广东移动通信有限公司 一种红包识别方法、系统及终端设备
CN110875875A (zh) * 2018-09-03 2020-03-10 Oppo广东移动通信有限公司 电子红包消息检测方法、检测装置及终端设备
CN110875875B (zh) * 2018-09-03 2022-04-22 Oppo广东移动通信有限公司 电子红包消息检测方法、检测装置及终端设备
CN109409412A (zh) * 2018-09-28 2019-03-01 新华三大数据技术有限公司 图片处理方法及装置
CN109523591A (zh) * 2018-11-21 2019-03-26 北京锐安科技有限公司 图片的处理方法、装置、设备和存储介质
CN111651981A (zh) * 2019-02-19 2020-09-11 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN111651981B (zh) * 2019-02-19 2023-04-21 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备

Similar Documents

Publication Publication Date Title
CN108280459A (zh) 图片的处理方法、装置及系统
CN106228386B (zh) 一种信息推送方法及装置
CN106549974A (zh) 预测社交网络账户是否恶意的设备、方法及系统
CN108540431A (zh) 账号类型的识别方法、装置和系统
CN103020541B (zh) 个人空间(数据)对比于公司空间(数据)
CN108805137A (zh) 牲畜特征向量的提取方法、装置、计算机设备和存储介质
CN110399925A (zh) 账号的风险识别方法、装置及存储介质
CN110348519A (zh) 金融产品欺诈团伙的识别方法和装置
CN108667854A (zh) 网络漏洞检测方法及装置、网络漏洞自动发布系统
CN113762900B (zh) 一种基于区块链预言机的供应链管理系统及方法
CN105426307B (zh) 一种局域网产品测试资源共享方法及系统
CN110276406A (zh) 表情分类方法、装置、计算机设备及存储介质
CN110069706A (zh) 数据处理的方法、端侧设备、云侧设备和端云协同系统
CN111382291A (zh) 机器审核方法、装置及机器审核服务器
CN109508825A (zh) 员工行为风险预警方法及相关装置
US20190197011A1 (en) Network-based machine learning model discovery and benchmarking
CN108197444A (zh) 一种分布式环境下的权限管理方法、装置及服务器
CN109063736A (zh) 数据分类方法、装置、电子设备及计算机可读存储介质
CN115049070A (zh) 联邦特征工程数据的筛选方法及装置、设备及存储介质
CN112085078A (zh) 图像分类模型生成系统、方法、装置和计算机设备
CN109784352A (zh) 一种评估分类模型的方法和装置
CN107729924A (zh) 图片复审概率区间生成方法及图片复审判定方法
US11126898B2 (en) Computer vision classifier using item micromodels
CN112396504A (zh) 一种电商订单拦截方法、装置和电子设备
CN109670963A (zh) 资产信息筛选方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180713