CN117482532A - 一种数据处理方法、装置、设备及存储介质 - Google Patents
一种数据处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117482532A CN117482532A CN202311282668.5A CN202311282668A CN117482532A CN 117482532 A CN117482532 A CN 117482532A CN 202311282668 A CN202311282668 A CN 202311282668A CN 117482532 A CN117482532 A CN 117482532A
- Authority
- CN
- China
- Prior art keywords
- suspicious
- sample
- image set
- model
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 33
- 238000003672 processing method Methods 0.000 title abstract description 19
- 238000013145 classification model Methods 0.000 claims abstract description 200
- 238000000034 method Methods 0.000 claims abstract description 76
- 238000012549 training Methods 0.000 claims description 191
- 238000012545 processing Methods 0.000 claims description 111
- 238000001514 detection method Methods 0.000 claims description 36
- 238000012360 testing method Methods 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 23
- 238000012015 optical character recognition Methods 0.000 claims description 14
- 238000002372 labelling Methods 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 239000007787 solid Substances 0.000 claims description 11
- 238000003709 image segmentation Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 41
- 206010000117 Abnormal behaviour Diseases 0.000 abstract description 16
- 239000010410 layer Substances 0.000 description 34
- 230000006870 function Effects 0.000 description 24
- 210000000988 bone and bone Anatomy 0.000 description 22
- 238000010586 diagram Methods 0.000 description 18
- 238000013473 artificial intelligence Methods 0.000 description 15
- 238000013528 artificial neural network Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000013461 design Methods 0.000 description 12
- 230000002087 whitening effect Effects 0.000 description 10
- 230000006399 behavior Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 238000007726 management method Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F13/00—Video games, i.e. games using an electronically generated display having two or more dimensions
- A63F13/70—Game security or game management aspects
- A63F13/75—Enforcing rules, e.g. detecting foul play or generating lists of cheating players
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- A—HUMAN NECESSITIES
- A63—SPORTS; GAMES; AMUSEMENTS
- A63F—CARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
- A63F2300/00—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
- A63F2300/50—Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game characterized by details of game servers
- A63F2300/55—Details of game data or player data management
- A63F2300/5586—Details of game data or player data management for enforcing rights or rules, e.g. to prevent foul play
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Computer Security & Cryptography (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种数据处理方法、装置、设备以及存储介质,用于识别异常行为。包括:基于截图中心点对当前界面进行截图得到待识别图像集合;调用第一分类模型对待识别图像集合进行分类得到包括分类标签为可疑的图像的第一图像集合;调用第二分类模型对待识别图像集合进行分类得到包括标签为第一类可疑标签的图像的第二图像集合;调用第三分类模型对待识别图像集合进行识别得到包括标签为第二类可疑标签的图像的第三图像集合;调用多个第四分类模型分别对第一图像集合、第二图像集合及第三图像集合进行识别以得到多个识别结果;基于多个识别结果确定待识别图像集合的可疑判定结果。本申请可应用于计算机、云技术、游戏、车载等领域。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种数据处理方法、装置、设备及存储介质。
背景技术
随着互联网的普及和发展,网络游戏越来越受到广大网民的喜爱,其丰富了人们的休闲娱乐生活。然而,近年来,作弊行为在各种游戏中不断涌现,作弊用户通过使用外挂程序获得游戏收益。这种作弊行为对于正常玩家来说极为不公平,严重破坏了游戏的玩法生态。
因此目前急需一种可以识别游戏黑产的方法,进而保证游戏的正常运行。
发明内容
本申请实施例提供了一种数据处理方法、装置、设备以及存储介质,用于识别异常行为。
有鉴于此,本申请一方面提供一种数据处理方法,包括:获取当前界面的截图中心点;
基于该截图中心点对该当前界面进行截图,以得到待识别图像集合;
调用第一分类模型对该待识别图像集合进行可疑分类处理,以得到第一图像集合,其中,该第一图像集合包括至少一个分类标签为可疑的图像;
调用第二分类模型对该待识别图像集合进行分类处理,以得到第二图像集合,该第二图像集合包括至少一个分类标签为第一类可疑标签的图像;
调用第三分类模型对该待识别图像集合进行分类处理,以得到第三图像集合,其中,该第三图像集合包括至少一个分类标签为第二类可疑标签的图像;
调用多个第四分类模型分别对该第一图像集合、该第二图像集合以及该第三图像集合进行识别处理,以得到多个识别结果;
基于该多个识别结果确定该当前界面的可疑判定结果。
本申请另一方面提供一种数据处理装置,包括:获取模块,用于获取当前界面的截图中心点;
处理模块,用于基于该截图中心点对该当前界面进行截图,以得到待识别图像集合;
调用第一分类模型对该待识别图像集合进行可疑分类处理,以得到第一图像集合,其中,该第一图像集合包括至少一个分类标签为可疑的图像;
调用第二分类模型对该待识别图像集合进行分类处理,以得到第二图像集合,该第二图像集合包括至少一个分类标签为第一类可疑标签的图像;
调用第三分类模型对该待识别图像集合进行分类处理,以得到第三图像集合,其中,该第三图像集合包括至少一个分类标签为第二类可疑标签的图像;
调用多个第四分类模型分别对该第一图像集合、该第二图像集合以及该第三图像集合进行识别处理,以得到多个识别结果;
确定模块,用于基于该多个识别结果确定该当前界面的可疑判定结果。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,在该当前界面为游戏界面时,该获取模块可以执行如下方案中的至少一项,具体如下:该获取模块,用于检测该游戏界面中虚拟操作对象的对战操作对象的位置信息;
将该对战操作对象的位置信息作为该截图中心;
或;
该获取模块,用于检测该游戏界面中文字控件所处的位置信息;
将该文字控件所处的位置信息作为该截图中心。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,该获取模块,用于获取第一训练样本和第一初始分类模型,该第一训练样合包括第一样本图像以及该第一样本图像对应的第一样本标注,该第一样本标注为可疑或者正常;
该装置还包括训练模块,该训练模块,用于基于该第一训练样本集合训练该第一初始分类模型得到该第一分类模型;
该获取模块,用于获取第二训练样本和第二初始分类模型,该第二训练样合包括第二样本图像以及该第二样本图像对应的第二样本标注,该第二样本标注为第一类可疑标签或者正常;
该训练模块,用于基于该第二训练样本集合训练该第二初始分类模型得到该第二分类模型;
该获取模块,用于获取第三训练样本和第三初始分类模型,该第三训练样合包括第三样本图像以及该第三样本图像对应的第三样本标注,该第三样本标注为第二类可疑标签或者正常;
该训练模块,用于基于该第三训练样本集合训练该第三初始分类模型得到该第三分类模型。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,在该当前界面为游戏界面时,可疑标签包括虚线方框可疑、实线方框可疑、人物骨骼可疑、人物透视可疑和文字可疑;该获取模块可以执行方案中的至少一项获取第一样本,具体如下:该获取模块,用于基于测试账号获取测试历史样本,并为该测试历史样本标注第一样本标签,该第一样本标签用于指示该测试历史样本的可疑类型或者指示该测试历史样本为正常样本;
获取真实历史样本,基于异常检测模型为该真实历史样本标注第二样本标签,该第二样本标签用于指示该真实历史样本为可疑样本或者指示该真实历史样本为正常样本;
对真实历史样本构建虚线方框得到虚线方框样本,和/或,对该真实历史样本构建实线方框得到实线方框样本,该虚线方框样本的样本标签为虚线方框可疑,该实线方框样本的样本标签为实线方框可疑;
基于目标检测模型对真实游戏界面进行图像分割,以得到该真实游戏界面中的异常区域,对该异常区域进行裁剪得到可疑样本,该目标检测模型是基于真实游戏界面样本训练得到;
其中,该测试历史样本、该真实历史样本、该虚线方框样本、该实线方框样本以及该可疑样本作为该第一训练样本。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,在该当前界面为游戏界面时,可疑标签包括虚线方框可疑、实线方框可疑、人物骨骼可疑、人物透视可疑和文字可疑;该处理模块,用于调用虚线方框识别模型对该第一图像集合进行虚线方框识别处理,以得到第一识别结果,该虚线方框识别模型是基于白样本以及样本标签为虚线方框可疑的可疑样本训练得到;
调用实线方框识别模型对该第一图像集合进行实线方框识别处理,以得到第二识别结果,该实线方框识别模型是基于白样本以及样本标签为实线方框可疑的可疑样本训练得到;
调用人物骨骼识别模型对该第一图像集合进行人物骨骼识别处理,以得到第三识别结果,该人物骨骼方框识别模型是基于白样本以及样本标签为人物骨骼可疑的可疑样本训练得到;
调用透视分类模型对该第二图像集合进行人物透视识别处理,以得到第四识别结果,该透视分类模型是基于白样本以及样本标签为样本标签为人物透视可疑的可疑样本训练得到;
调用文字识别模型对该第三图像集合进行识别处理,以得到第五识别结果,该文字识别模型为光学字符识别模型;
其中,该虚线方框识别模型、该实线方框识别模型、该人物骨骼识别模型、该透视分类模型以及该文字识别模型作为该第四分类模型。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,该确定模块,用于在该第一识别结果、该第二识别结果、该第三识别结果、该第四识别结果和该第五识别结果中的至少一项指示为作弊,则确定该待识别图像集合对应的可疑判断结果为作弊。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,该处理模块,用于调用虚线方框识别模型对该第一图像集合进行虚线方框识别处理,以得到第四图像集合,该第四图像集合包括至少一个分类标签为虚线方框可疑的图像;
调用第五分类模型对该第四图像集进行识别处理,以得到该第一识别结果,该第五分类模型是基于正常样本和可疑样本训练得到,该正常样本的数量大于该可疑样本的数量,该可疑样本包括多种可疑标签。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,该处理模块,用于调用实线方框识别模型对该第一图像集合进行实线方框识别处理,以得到第五图像集合,该第五图像集合包括至少一个分类标签为实线方框可疑的图像;
调用该第五分类模型对该第五图像集进行识别处理,以得到该第二识别结果,该第五分类模型是基于正常样本和可疑样本训练得到,该正常样本的数量大于该可疑样本的数量,该可疑样本包括多种可疑标签。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,该处理模块,用于调用人物骨骼识别模型对该第一图像集合进行人物骨骼识别处理,以得到第六图像集合,该第六图像集合包括至少一个分类标签为人物骨骼可疑的图像;
调用该第五分类模型对该第六图像集进行识别处理,以得到该第三识别结果,该第五分类模型是基于正常样本和可疑样本训练得到,该正常样本的数量大于该可疑样本的数量,该可疑样本包括多种可疑标签。
在一种可能的设计中,在本申请实施例的另一方面的另一种实现方式中,该第二分类模型与该第三分类模型融合为一个多分类模型,该多分类模型用于对待识别图像集合中的多个待识别图像进行分类得到正常图像、含有文字的图像以及具有人物透视可疑图像。
本申请另一方面提供一种计算机设备,包括:存储器、处理器以及总线系统;
其中,存储器用于存储程序;
处理器用于执行存储器中的程序,处理器用于根据程序代码中的指令执行上述各方面的方法;
总线系统用于连接存储器以及处理器,以使存储器以及处理器进行通信。
本申请的另一方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面的方法。
本申请的另一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方面所提供的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:对于游戏界面进行小图像的截图,从而获取到多个小图像,可以实现对各个作弊行为进行分割,而小图像可以减少对传输资源的占用;同时在进行图像识别的过程中首先通过多个分类模型对于各个作弊类型进行分别处理,可以提升对于不同作弊类型的识别准确度;而对于不同的作弊类型采用多段式分类识别处理,可以减少后续图像识别的处理量,同时减少人工审核的工作量。
附图说明
图1为本申请实施例中数据处理方法的一个应用场景示意图;
图2为本申请实施例中分类模型的一个网络架构示意图;
图3为本申请实施例中游戏应用场景下作弊类型检测的一个流程示意图;
图4为本申请实施例中训练样本的一个获取流程示意图;
图5为本申请实施例中数据处理方法的一个实施例示意图;
图6a为本申请实施例中截图中心点的一个示意图;
图6b为本申请实施例中截图中心点的一个示意图;
图6c为本申请实施例中虚线方框可疑图像的一个示意图;
图6d为本申请实施例中实线方框可疑图像的一个示意图;
图6e为本申请实施例中人物透视可疑图像的一个示意图;
图6f为本申请实施例中数字人名透视可疑图像的一个示意图;
图6g为本申请实施例中文字透视可疑图像的一个示意图;
图6h为本申请实施例中骨骼透视可疑图像的一个示意图;
图6i为本申请实施例中各模型在训练过程中的指标值的对比示意图;
图7为本申请实施例中数据处理装置的一个实施例示意图;
图8为本申请实施例中数据处理装置的另一个实施例示意图;
图9为本申请实施例中数据处理装置的另一个实施例示意图;
图10为本申请实施例中数据处理装置的另一个实施例示意图。
具体实施方式
本申请实施例提供了一种数据处理方法、装置、设备以及存储介质,用于识别游戏中的异常行为。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
随着互联网的普及和发展,网络游戏越来越受到广大网民的喜爱,其丰富了人们的休闲娱乐生活。然而,近年来,作弊行为在各种游戏中不断涌现,作弊用户通过使用外挂程序获得游戏收益。这种作弊行为对于正常玩家来说极为不公平,严重破坏了游戏的玩法生态。因此目前急需一种可以识别游戏黑产的方法,进而保证游戏的正常运行。
为了解决上述技术问题,本申请提供如下技术方案:获取当前界面的截图中心点;基于该截图中心点对该当前界面进行截图,以得到待识别图像集合;调用第一分类模型对该待识别图像集合进行可疑分类处理,以得到第一图像集合,其中,该第一图像集合包括至少一个分类标签为可疑的图像;调用第二分类模型对该待识别图像集合进行分类处理,以得到第二图像集合,该第二图像集合包括至少一个分类标签为第一类可疑标签的图像;调用第三分类模型对该待识别图像集合进行分类处理,以得到第三图像集合,其中,该第三图像集合包括至少一个分类标签为第二类可疑标签的图像;调用多个第四分类模型分别对该第一图像集合、该第二图像集合以及该第三图像集合进行识别处理,以得到多个识别结果;基于该多个识别结果确定该当前的可疑判定结果。这样对于游戏界面进行小图像的截图,从而获取到多个小图像,可以实现对各个作弊行为进行分割,而小图像可以减少对传输资源的占用;同时在进行图像识别的过程中首先通过多个分类模型对于各个作弊类型进行分别处理,可以提升对于不同作弊类型的识别准确度;而对于不同的作弊类型采用多段式分类识别处理,可以减少后续图像识别的处理量,同时减少人工审核的工作量。
本申请各可选实施例的数据处理方法可以基于人工智能技术实现的。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
计算机视觉(Computer Vision,CV)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、光学字符识别(Optical Character Recognition,OCR)、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、三维(Three Dimensional,3D)技术、虚拟现实、增强现实、同步定位与地图构建、自动驾驶、智慧交通等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
本申请还涉及到云技术。其中,云技术(cloud technoolgy)是指在广域网或局域网内将硬件、软件、网络等系统资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行为的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。本申请中所涉及到的云技术主要指终端设备或者服务器之间可能通过“云”进行游戏界面的传输等等。
本申请还涉及到智慧交通、辅助驾驶等技术场景。智慧交通也可以称为智能交通系统(Intelligent Traffic System,ITS),是将先进的科学技术(信息技术、计算机技术、数据通信技术、传感器技术、电子控制技术、自动控制理论、运筹学、人工智能等)有效地综合运用于交通运输、服务控制和车辆制造,加强车辆、道路、使用者三者之间的联系,从而形成一种保障安全、提高效率、改善环境、节约能源的综合运输系统。
智能车路协同系统(Intelligent Vehicle Infrastructure CooperativeSystems,IVICS),简称车路协同系统,是智能交通系统(ITS)的一个发展方向。车路协同系统是采用先进的无线通信和新一代互联网等技术,全方位实施车车、车路动态实时信息交互,并在全时空动态交通信息采集与融合的基础上开展车辆主动安全控制和道路协同管理,充分实现人车路的有效协同,保证交通安全,提高通行效率,从而形成的安全、高效和环保的道路交通系统。本申请中所涉及到的智慧交通或者辅助驾驶主要指终端设备或者服务器可能通过图像识别等操作识别道路异常情况,从而实现人车路的有效协同。
为了方便理解,下面对本申请中的部分名词进行说明。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如,常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
神经网络:人工神经网络(Artificial Neural Networks,ANN),是由众多的神经元可调的连接权值连接而成,具有大规模并行处理、分布式信息存储、良好的自组织自学习能力等特点。
卷积层(Convolutional layer,Conv)是指卷积神经网络层中由若干卷积单元组成的层状结构,卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,卷积神经网络中包括至少两个神经网络层,其中,每一个神经网络层包含若干个神经元,各个神经元分层排列,同一层的神经元之间没有互相连接,层间信息的传送只沿一个方向进行。
全连接层(Fully Connected layer,FC)是指该层状结构中的每一个结点均与上一层的所有结点相连,可用于将上一层的神经网络层提取的特征进行综合处理,在神经网络模型中起到“分类器”的作用。
反向传播:前向传播是指模型的前馈处理过程,反向传播与前向传播相反,指根据模型输出的结果对模型各个层的权重参数进行更新。例如,模型包括输入层、隐藏层和输出层,则前向传播是指按照输入层-隐藏层-输出层的顺序进行处理,反向传播是指按照输出层-隐藏层-输入层的顺序,依次更新各个层的权重参数。
ResNet网络:其网络结构通常是进行一个大尺度的卷积,再接一个池化层;随后接上连续几个子模块(DenseBlock和TransitinLayer);最后接上一个池化和全连接。以ResNet101为例,对其网络结构进行说明:ResNet101的层数为3+4+23+3=33个buildingblock,每个block为3层,所以有33x3=99层,再加上第一层的卷积conv1,以及最后的全连接层(用于分类),一共是99+1+1=101层。
Mobilenet网络:是基于深度可分离卷积构建的非常轻量且延迟小的模型。在计算过程中,通过深度可分离卷积优进行计算量优化,将标准卷积转化为深度卷积和1×1pointwise卷积,每层后面都会接BN和ReLU。深度卷积的每个输入维度对应一个卷积核。基于上述结构可知,其可以通过两个超参数来进一步控制模型的大小,该模型能够应用到终端设备中,具有很重要的实践意义。
虚拟操作对象:是指虚拟环境中的可活动对象。该可活动对象可以是虚拟人物、虚拟动物、动漫人物等,比如:在三维虚拟环境中显示的人物、动物。可选地,虚拟操作对象是基于动画骨骼技术创建的三维立体模型。每个虚拟操作对象在三维虚拟环境中具有自身的形状和体积,占据三维虚拟环境中的一部分空间。
本申请实施例提供的一种数据处理方法、装置、设备及存储介质,能够提高对异常行为的识别效果。下面说明本申请实施例提供的电子设备的示例性应用,本申请实施例提供的电子设备可以实施为各种类型的用户终端,也可以实施为服务器。
电子设备通过运行本申请实施例提供的数据处理方案,能够提高对异常行为的识别效果。即提高电子设备自身对视频或者图像中异常行为的识别效果。上述方案可以应用于诸多计算机视觉领域,包括图像识别(例如人脸识别),目标检测(object detection)和语义分割(semantic segmentation),所以本申请实施例能够广泛加速多种应用场景的计算。
1、辅助医生进行疾病预测和治疗
当利用本申请实施例提供的数据处理方法帮助用户进行疾病预测时,该方法可以实现成为独立的线上诊断类应用程序或健康类应用程序,安装在用户使用的计算机设备或者提供医学文本搜索服务的后台服务器中,方便用户使用该程序对疾病进行查询。
在该场景下,医生在应用程序界面输入患者的医疗图像,例如B超、彩超等,计算机设备将医疗图像输入上述多个分类模型,得到图像识别结果,并将该结果返回对应的应用程序界面,提示用户可能患有的疾病。
2、辅助驾驶员/自动驾驶车辆进行道路安全预警
当利用本申请实施例提供的数据处理方法帮助驾驶员/自动驾驶车辆进行异常预测时,该方法可以实现成为独立的导航类应用程序或自动驾驶类应用程序,并安装在用户使用的车载终端设备或者提供导航服务/自动驾驶服务的后台服务器中,帮助车辆安全行驶。
在该场景下,车载摄像头采集车辆前方的道路图像,将道路图像传输至车载终端或后台服务器,车载终端或后台服务器将道路图像输入上述多个分类模型根据道路图像识别出路上的行人等影响车辆正常行驶的对象,车载终端或后台服务器推送提示信息,提示驾驶员或控制车辆避让。
3、为游戏服务商提供游戏作弊检测
当利用本申请实施例提供的数据处理方法帮助游戏服务商进行游戏作弊检测时,该方法可以实现成为独立的检测应用程序,并安装在游戏的后台服务器中,帮助游戏服务商检测游戏中的黑产对象。
在该场景下,对游戏玩家的游戏界面进行截图得到透视小图,将透视小图传输至后台服务器,后台服务器将透视小图输入上述多个分类模型根据透视小图识别出游戏中的作弊行为以及作弊对象后台服务器推送提示信息,提示对该作弊对象进行处理。
当然,除了应用于上述场景外,本申请实施例提供方法还可以应用于其他需要图像识别的场景,本申请实施例并不对具体的应用场景进行限定。
参见图1,图1是本申请实施例提供的数据处理方案的一个应用场景下的一个可选的架构示意图,为实现支撑一个数据处理方案,终端设备100通过网络200连接服务器300,服务器300连接数据库400,网络200可以是广域网或者局域网,又或者是二者的组合。其中用于实现数据处理方案的客户端部署于终端设备100上,其中,客户端可以通过浏览器的形式运行于终端设备100上,也可以通过独立的应用程序(application,APP)的形式运行于终端设备100上等,对于客户端的具体展现形式,此处不做限定。本申请涉及的服务器300可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备100可以是智能手机、平板电脑、笔记本电脑、掌上电脑、个人电脑、智能电视、智能手表、车载设备、可穿戴设备、智能语音交互设备、智能家电、飞行器等等,但并不局限于此。终端设备100以及服务器300可以通过有线或无线通信方式通过网络200进行直接或间接地连接,本申请在此不做限制。服务器300和终端设备100的数量也不做限制。本申请提供的方案可以由终端设备100独立完成,也可以由服务器300独立完成,还可以由终端设备100与服务器300配合完成,对此,本申请并不做具体限定。其中,数据库400,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。数据库管理系统(Database Management System,DBMS)是为管理数据库而设计的电脑软件系统,一般具有存储、截取、安全保障、备份等基础功能。数据库管理系统可以依据它所支持的数据库模型来作分类,例如关系式、可扩展标记语言(Extensible Markup Language,XML);或依据所支持的计算机类型来作分类,例如服务器群集、移动电话;或依据所用查询语言来作分类,例如结构化查询语言(Structured Query Language,SQL)、XQuery;或依据性能冲量重点来作分类,例如最大规模、最高运行速度;亦或其他的分类方式。不论使用哪种分类方式,一些DBMS能够跨类别,例如,同时支持多种查询语言。在本申请中,数据库400可以用于存储训练样本,当然,训练样本的存储位置并不限于数据库,例如还可以存储于终端设备100、区块链或者服务器300的分布式文件系统中等。
在一些实施例中,服务器300和该终端设备100均可以执行本申请实施例提供的数据处理方法以及数据处理方法中分类模型的训练方法。本实施例中,该分类模型可以具有不同的网络结构或者相同的网络结构,而为了使得不同的分类模型具有不同的分类功能,其训练样本以及训练目标可以设置为不相同。
一个示例性方案中,该第一分类模型、第二分类模型以及第三分类模型可以包括多层神经网络,其中,上述分类模型可以包括如图2所示的输入层、嵌入层、多头自注意力机制层以及多个全连接层。比如,上述分类模型可以采用mobilenet网络结构,这样可以进一步的减少本申请中分类模型的大小,方便实现应用。
本实施例中,上述分类模型的训练流程可以如下:从终端设备100和/或数据库400中获取获取训练样本并建立初始模型;通过初始模型对该训练样本进行预测处理得到预测标注,并根据包括预先设计损失因素的损失函数,确定该预测标注与真实标注对应的损失值,进而根据该损失值反向传播调整该分类模型的参数,从而实现对该初始模型的训练得到该分类模型。
本实施例中,在训练该分类模型时,该服务器300计算该损失值可以采用交叉熵损失函数。一个示例性文字如,该交叉熵损失函数的表达式可以如公式1所示,其中,该公式1如下:其中,该M用于指示该分类模型的全连接分类层的分类类别的数量,该N用于指示输入的样本的数量,该yic用于指示该训练样本的真实标注,该pic用于指示预测标注。
本实施例中,在根据该损失值训练该初始模型时,可以采用优化器根据该损失值反向调整该初始模型的参数。可以理解的是,该优化器可以选择ADAM优化器,它基于动量计算神经网络的每个参数地自适应学习率,仅需要少量调参,从而加快模型训练效率。
基于上述介绍,下面以游戏应用场景为例,结合图3对本申请中的数据处理方法进行说明:
该待识别图像集合为FPS游戏中的游戏截图集合,其在对游戏中的异常行为进行检测时,主要可以分为三个部分。其中,第一部分是对于常规作弊类型的检测;第二部分是对人物透视作弊类型的检测;第三部分是对功能列表作弊类型的检测。
在FPS游戏中该常规作弊类型通常是用于透视发现对战虚拟对象的位置,从而实现作弊击杀对战虚拟对象的操作。而标明对战虚拟对象的方式中,通常可以采用如下方案:使用虚线方框将对战虚拟对象的位置标识或者使用实线方框将对战虚拟对象的位置进行标识或者使用人物骨骼将对战虚拟对象的位置进行标识。因此对于第一部分,在采用分段式分类的过程中,其主要包括多类作弊二分类模型(作为第一部分的第一段可疑分类模型)、虚线方框识别模型、实线方框识别模型以及人物骨骼识别模型(这三个模型作为第一部分的第二段可疑分类模型)。其中,该多类作弊二分类模型用于对该待识别图像集合中的图像进行可疑与正常的分类,得到高可疑图像集合(即本申请中的第一图像集合,此时该第一图像集合中的各个图像均有一个预测分类标签,即“可疑”),这样可以先一步排除掉大量容易识别的正常图像。然后再将该高可疑图像集合输入该虚线方框识别模型得到一个识别结果(此时该识别结果用于指示该图像是否为虚线方框可疑);同时,将该高可疑图像集合输入该实线方框识别模型得到一个识别结果(此时该识别结果用于指示该图像是否为实线方框可疑);同时,将该高可疑图像集合输入该人物骨骼识别模型得到一个识别结果(此时该识别结果用于指示该图像是否为人物骨骼可疑)。最后将上述三个识别结果进行合并,确定该常用作弊类型的识别结果,并根据该识别结果与预设判定策略进行比较,若满足直接处罚的条件,则直接进行处罚;若不满足,则转入人工审核。比如,上述三个识别结果如下:高可疑图像集合中图像1的虚线方框可疑的概率为0.5,高可疑图像集合中图像1的实线方框可疑的概率为0.8,高可疑图像集合中图像1的人物骨骼可疑的概率为0.2;而该判定策略为:可疑判定结果的概率值大于0.5,直接处罚;可疑判定结果的概率值大于0.3且小于等于0.5,转人工审核;可疑判定结果的概率值小于等于0.3,确定为正常。此时,可以直接处罚该高可疑图像集合中图像1对应的终端设备或者用户账号。
在该第一部分,在通过虚线方框识别模型、实线方框识别模型以及人物骨骼识别模型进行识别之后,还可以添加一个排白精细化模型对上述三个模型的识别结果进行再次识别,这样可以避免出现误判。其中,该排白精细化模型的训练样本中正常样本的数量要大于可疑样本,同时可疑样本可以具有多种可疑标签,具体此处不做限定。在训练过程中,同样是采用构建初始模型和训练样本,然后利用训练样本对该初始模型进行训练,得到该排白精细化模型。在本申请中该排白精细化模型的网络结构可以为resnet结构,从而提供更精确的排白效果。而该排白精细化模型的训练目标是提高对正常样本的识别率,因此该排白精细化模型可以将上述三个模型识别出的标有可疑识别标签的图像,进行再次识别。若识别出的结果不一致,则将可疑识别标签修改为正常标签。比如,图像1通过前述三个识别模型之后得到的标签为虚线方框可疑,而在通过该排白精细化模型之后,确定该图像1为正常图像,此时将该图像1的标签由虚线方框可疑修改为正常。
应理解的是,在该多作弊二分类模型之后,还可以添加新的常用作弊分类模型,比如热能作弊等等,只要根据具体的应用场景增加相应的分类模型即可,具体此处不做限定。
对于第二部分,主要包括人物透视粗分模型和人物透视精细化分类模型。其中,人物透视粗分模型用于对该待识别图像集合中的图像进行人物透视可疑与正常的分类,得到高可疑图像集合(即本申请中的第二图像集合,此时该第二图像集合中的各个图像均有一个预测分类标签,即“人物透视可疑”)。应理解的是,该人物透视粗分模型应满足排除较少部分的正常图像,将存在一点可疑概率的图像均分类为人物透视可疑图像。再将该第一图像集合输入该人物透视精细化分类模型,使得该人物透视精细化分类模型对该第二图像集合进行更进一步的精确识别得到识别结果。最后根据该识别结果与预设判定策略进行比较,若满足直接处罚的条件,则直接进行处罚;若不满足,则转入人工审核。比如,上述识别结果如下:第二图像集合中图像2的人物透视可疑的概率为0.6,该判定策略为:可疑判定结果的概率值大于0.5,直接处罚;可疑判定结果的概率值大于0.3且小于等于0.5,转人工审核;可疑判定结果的概率值小于等于0.3,确定为正常。此时,可以直接处罚该第二图像集合中图像2对应的终端设备或者用户账号。
第三部分,主要包括文字分类模型和OCR外挂文字识别模型。其中,文字分类模型用于对该待识别图像集合中的图像进行文字分类,得到具有文字的图像集合(即本申请中的第三图像集合,此时该第三图像集合中的各个图像均有一个预测分类标签,即“具有文字”)。应理解的是,该文字分类模型可有效的过滤掉不包含文字的图像,从而减少该OCR外挂文字识别模型的识别量,进而提升该OCR外挂文字识别模型的识别效率,并减少人工审核的工作量。再将该第三图像集合输入该OCR外挂文字识别模型,得到图像中对应的文字信息,并将该文字信息与设定的敏感词进行匹配,从而得到识别结果。最后根据该识别结果与预设判定策略进行比较,若满足直接处罚的条件,则直接进行处罚;若不满足,则转入人工审核。比如,上述识别结果如下:第三图像集合中图像3中识别出的文字信息包括“显示骨线、启用、显示血量、启用、显示名字、禁用、狙击瞄准、启用”,设定的敏感词包括“骨线、血量、瞄准”;该判定策略为:文字信息命中两个及两个以上敏感词,直接处罚;文字信息命中一个敏感词,转人工审核;文字信息未命中敏感词,确定为正常。此时,可以直接处罚该第三图像集合中图像3对应的终端设备或者用户账号。
在上述异常行为检测过程中,在第一阶段,使用三个二分类模型,而不是一个多分类模型的好处是,部分类型之间存在少量的相似性,常用作弊类型是含有多种作弊情况的,可能会存在少量和人物透视类似的情况,两个类别冲突,导致概率过低,无法覆盖。同时,多个原子操作的模型应用,后续出现新作弊类型容易操作,可插拔,对已有模块不影响。
下面基于上述通用训练流程以及图3所示的应用场景,对每个分类模型的训练过程进行说明:
1、第一分类模型(即多作弊二分类模型)
在训练之前,获取该多作弊二分类模型的第一训练样本,此时该第一训练样本中的样本标注为可疑或者正常。然后将该第一训练样本输入该多作弊二分类模型进行分类预测,得到该第一训练样本的预测标签;最后根据该预测标签与样本标注计算损失值,并根据该损失值计算得到该多作弊二分类模型。
应理解的是,此时,该第一分类模型的第一训练样本的获取方式可以如图4所示,具体包括如下方式中的至少一种:
一个示例性方案中,基于测试账号获取测试历史样本,并为该测试历史样本标注第一样本标签,该第一样本标签用于指示该测试历史样本的可疑类型或者指示该测试历史样本为正常样本。即在游戏测试过程中,使用测试账号进行作弊操作,然后对游戏界面进行截图得到多个测试历史样本。在此操作中,由于已知作弊操作,则该测试历史样本的样本标注为真实固定的。比如测试虚线方框操作,则相应的测试历史样本的标注可以如下“可疑、虚线方框可疑”。同理,在测试实线方框操作时,相应的测试历史样本的标注可以如下“可疑、实线方框可疑”;在测试人物透视操作时,相应的测试历史样本的标注可以如下“可疑、人物透视可疑”等等。
另一个示例性方案中,获取真实历史样本,然后基于异常检测模型为该真实历史样本标注第二样本标签,该第二样本标签用于指示该真实历史样本为可疑样本或者指示该真实历史样本为正常样本。在此方案中,由于该异常检测模型仅可以进行可疑与正常的分类,因此,该真实历史样本的标注仅为“可疑”或者“正常”。本方案中的异常检测模型可以是基于正常图像训练得到的。
另一个示例性方案中,对真实历史样本构建虚线方框得到虚线方框样本,和/或,对该真实历史样本构建实线方框得到实线方框样本,该虚线方框样本的样本标签为虚线方框可疑,该实线方框样本的样本标签为实线方框可疑。即对于真实历史样本中的正常样本可以通过后期处理,为其添加上虚线方框或者实线方框。在此方案中,由于该虚线方框与该实线方框为人为添加,因此该样本的置信度不太高,但是样本的标注可以如下:“可疑、虚线方框可疑”或者,“可疑、实线方框可疑”或者“可疑、虚线方框可疑、实线方框可疑”。
另一个示例性方案中,基于目标检测模型对真实游戏界面进行图像分割,以得到该真实游戏界面中的异常区域,对该异常区域进行裁剪得到可疑样本,该目标检测模型是基于真实游戏界面样本训练得到。在此方案中,该真实游戏界面样本为整个界面截图(也可以理解为大图),而在此方案中,该对该目标检测模型的训练过程可以为通用训练过程,此处不再赘述。同时,该目标检测模型是该真实游戏界面进行图像识别,然后再根据识别出来的异常区域进行裁剪,从而得到可疑样本,此过程中,该可疑样本的标注并不一定真实,仅为预测结果。
结合上述四个方案可以得到上述该第一分类模型的初始样本,由于初始样本中可能存在误判的标注或者出现新的真实历史样本,因此可以对该初始样本进行扩充和提纯。其中,该扩充可以理解为利用该初始样本训练得到多个模型之后,利用多个模型对真实历史样本进行预测得到多个预测标签,在多个预测标签相同时,自动标注该真实历史样本;若多个预测标签不相同,进行人工标注,最后将标注之后的真实历史样本归于该第一训练样本。比如,利用初始样本训练得到两个分类模型,然后对于新获取的真实历史样本得到两个预测标签,其中一个是“虚线方框可疑”,另一个是“实线方框可疑”,则此时需要进行人工判断,给出最终标注。若对于新获取的真实历史样本得到两个预测标签,其中一个是“虚线方框可疑”,另一个也是“虚线方框可疑”,则此时自动标注该真实历史样本的样本标签为“虚线方框可疑”。
提纯可以理解为对该初始样本进行交叉验证,尽量保证初始样本标注正确。其具体操作可以如下:将初始样本进行分组,然后选择其中一组作为验证集,剩下的为训练集;利用训练集训练得到一个或者多个模型;然后利用该验证集对该一个或者多个模型进行验证,然后对验证集中的预测标签与已标注标签一致,则确定该验证集中样本继续保持已标注标签,若预测标签与已标注标签不一致,则进行人工标注修正。循环上述操作,直到完成样本的全部修正,将最终的样本作为该第一训练样本。
应理解的是,该第一训练样本的样本标签可以是“可疑”与“正常”,也可以是多种可疑标签与正常标签,具体此处不做限定。
2、第二分类模型(即上述图3中的人物透视粗分模型)
在训练之前,获取该人物透视粗分模型的第二训练样本,此时该第二训练样本中的样本标注为人物透视可疑或者正常。然后将该第二训练样本输入该人物透视粗分模型进行分类预测,得到该第二训练样本的预测标签;最后根据该预测标签与样本标注计算损失值,并根据该损失值计算得到该人物透视粗分模型。
应理解的是,该第二训练样本的获取方法与上述第一训练样本的获取方法类似,具体此处不再赘述。该第二训练样本与该第一训练样本的区别在于,该第二训练样本中将基于异常检测模型预测得到的可疑样本、后续通过人工标注无法确定是否为人物透视可疑的高可疑样本以及基于目标检测模型预测得到的可疑样本均作为该人物透视可疑样本。这样可以尽量保证该人物透视粗分模型减少牺牲,提升后续人物透视精细化分类模型的识别准确度。比如,真实历史样本通过异常检测模型预测得到的标注为“可疑”的样本,而该样本在第二训练样本中的标注为“人物透视可疑”。
3、第三分类模型(即上述图3中的文字分类模型)
在训练之前,获取该文字分类模型的第三训练样本,此时该第三训练样本中的样本标注为具有文字或者不具有文字。然后将该第三训练样本输入该文字分类模型进行分类预测,得到该第三训练样本的预测标签;最后根据该预测标签与样本标注计算损失值,并根据该损失值计算得到该文字分类模型。
应理解的是,该第三训练样本的获取方法与上述第一训练样本的获取方法类似,具体此处不再赘述。该第三训练样本与该第一训练样本的区别在于,该第三训练样本的标注需要重新进行识别和标注。
本申请中,该第二分类模型与该第三分类模型可以融合为一个多分类模型,只要可以避免降低识别效果即可,具体此处不做限定。
4、第四分类模型(可以理解为上述图3中的虚线方框识别模型、实线方框识别模型、人物骨骼识别模型、人物透视精细化分类模型或者OCR外挂文字识别模型)
A、虚线方框识别模型
在训练之前,获取该虚线方框识别模型的训练样本,此时虚线方框识别模型的训练样本中的样本标注为虚线方框可疑或者正常。然后将该虚线方框识别模型的训练样本输入该虚线方框识别模型进行分类预测,得到该虚线方框识别模型的训练样本的预测标签;最后根据该预测标签与样本标注计算损失值,并根据该损失值计算得到该虚线方框识别模型。
应理解的是,该虚线方框识别模型的训练样本的获取方法与上述第一训练样本的获取方法类似,具体此处不再赘述。而为了增加该虚线方框识别模型的训练样本,可以对上述第一训练样本中已标注“虚线方框可疑”的样本训练得到一个中间虚线方框识别模型;然后利用该中间虚线方框识别模型对该第一训练样本中未标注“虚线方框可疑”的样本进行预测得到标注,并将预测标签为“虚线方框可疑”的样本归于该虚线方框识别模型的训练样本。比如,该第一训练样本包括如下几种样本:已标注“虚线方框可疑”的样本100个,已标注“实线方框可疑”的样本100个,已标注“可疑”的样本100个;则利用已标注“虚线方框可疑”的100个样本训练得到一个虚线方框识别模型A;然后将已标注“实线方框可疑”的100个样本,已标注“可疑”的100个样本输入该虚线方框识别模型A,预测得到预测标签为“虚线方框可疑”样本40个,则此时该虚线方框识别模型的训练样本可以如下:140个标签为“虚线方框可疑”样本,50个正常样本。
B、实线方框识别模型
在训练之前,获取该实线方框识别模型的训练样本,此时实线方框识别模型的训练样本中的样本标注为实线方框可疑或者正常。然后将该实线方框识别模型的训练样本输入该实线方框识别模型进行分类预测,得到该实线方框识别模型的训练样本的预测标签;最后根据该预测标签与样本标注计算损失值,并根据该损失值计算得到该实线方框识别模型
应理解的是,该实线方框识别模型的训练样本的获取方法与上述第一训练样本的获取方法类似,具体此处不再赘述。而为了增加该实线方框识别模型的训练样本,可以对上述第一训练样本中已标注“实线方框可疑”的样本训练得到一个中间实线方框识别模型;然后利用该中间实线方框识别模型对该第一训练样本中未标注“实线方框可疑”的样本进行预测得到标注,并将预测标签为“实线方框可疑”的样本归于该实线方框识别模型的训练样本。比如,该第一训练样本包括如下几种样本:已标注“虚线方框可疑”的样本100个,已标注“实线方框可疑”的样本100个,已标注“可疑”的样本100个;则利用已标注“实线方框可疑”的100个样本训练得到一个实线方框识别模型A;然后将已标注“虚线方框可疑”的100个样本,已标注“可疑”的100个样本输入该实线方框识别模型A,预测得到预测标签为“实线方框可疑”样本40个,则此时该实线方框识别模型的训练样本可以如下:140个标签为“实线方框可疑”样本,50个正常样本。
C、人物骨骼识别模型
在训练之前,获取该人物骨骼识别模型的训练样本,此时人物骨骼识别模型的训练样本中的样本标注为人物骨骼可疑或者正常。然后将该人物骨骼识别模型的训练样本输入该人物骨骼识别模型进行分类预测,得到该人物骨骼识别模型的训练样本的预测标签;最后根据该预测标签与样本标注计算损失值,并根据该损失值计算得到该人物骨骼识别模型
应理解的是,该人物骨骼识别模型的训练样本的获取方法与上述第一训练样本的获取方法类似,具体此处不再赘述。而为了增加该人物骨骼识别模型的训练样本,可以对上述第一训练样本中已标注“人物骨骼可疑”的样本训练得到一个中间人物骨骼识别模型;然后利用该中间人物骨骼识别模型对该第一训练样本中未标注“人物骨骼可疑”的样本进行预测得到标注,并将预测标签为“人物骨骼可疑”的样本归于该人物骨骼识别模型的训练样本。比如,该第一训练样本包括如下几种样本:已标注“人物骨骼可疑”的样本100个,已标注“实线方框可疑”的样本100个,已标注“可疑”的样本100个;则利用已标注“人物骨骼可疑”的100个样本训练得到一个人物骨骼识别模型A;然后将已标注“实线方框可疑”的100个样本,已标注“可疑”的100个样本输入该实线方框识别模型A,预测得到预测标签为“人物骨骼可疑”样本40个,则此时该人物骨骼识别模型的训练样本可以如下:140个标签为“人物骨骼可疑”样本,50个正常样本。
D、人物透视精细化分类模型
在训练之前,获取该人物透视精细化分类模型的训练样本,此时该人物透视精细化分类模型的训练样本中的样本标注为人物透视可疑或者正常。然后将该人物透视精细化分类模型的训练样本输入该人物透视精细化分类模型进行分类预测,得到该人物透视精细化分类模型的训练样本的预测标签;最后根据该预测标签与样本标注计算损失值,并根据该损失值计算得到该人物透视精细化分类模型。
应理解的是,该人物透视精细化分类模型的训练样本的获取方法与上述第一训练样本的获取方法类似,具体此处不再赘述。该人物透视精细化分类模型的训练样本与该第一训练样本的区别在于,该人物透视精细化分类模型的训练样本中将基于异常检测模型预测得到的可疑样本、后续通过人工标注无法确定是否为人物透视可疑的高可疑样本以及基于目标检测模型预测得到的可疑样本均作为正常样本。这样可以尽量保证人物透视精细化分类模型可以针对特定领域进行精细化识别,从而提高该人物透视精细化分类模型的识别准确度。比如,真实历史样本通过异常检测模型预测得到的标注为“可疑”的样本,而该样本在该人物透视精细化分类模型的训练样本的标注为“正常”。
应理解的是,该人物透视精细化分类模型与该人物透视组分模型在网络结构上还存在一定的差异,即该人物透视精细化分类模型的网络层比该人物透视组分模型的网络层更多,可以提供到更多的特征信息。
同时,为了保证该人物透视精细化分类模型的分类精确度,需要平衡容易识别样本、难以识别样本以及模糊样本的训练梯度,可以采取GHMC损失函数来优化人物透视精细化分类模型。其中,该GHMC(Gradient Harmonizing Mechanism-C)损失函数定义了梯度模长,该梯度模长正比于分类的难易程度,目的是让人物透视精细化分类模型不要关注那些容易学的样本,也不要关注那些特别难分的样本。
E、OCR外挂文字识别模型
将具有文字的图像集合作为训练样本,输入该OCR外挂文字识别模型进行文字信息提取,并将提取的文字信息与真实文字进行比较,得到损失值;并基于该损失值训练该OCR外挂文字识别模型。
在对分类模型训练完毕后,服务器300可以将上述多个分类模型保存至本地,从而为终端设备100提供远程的异常行为识别功能。例如,服务器300可以接收终端设备100发送的待识别图像集合,并调用第一分类模型对该待识别图像集合进行可疑分类处理,以得到第一图像集合,其中,该第一图像集合包括至少一个分类标签为可疑的图像;调用第二分类模型对该待识别图像集合进行分类处理,以得到第二图像集合,该第二图像集合包括至少一个分类标签为第一类可疑标签的图像;调用第三分类模型对该待识别图像集合进行分类处理,以得到第三图像集合,其中,该第三图像集合包括至少一个分类标签为第二类可疑标签的图像;调用多个第四分类模型分别对该第一图像集合、该第二图像集合以及该第三图像集合进行识别处理,以得到多个识别结果;基于该多个识别结果确定该当前界面的可疑判定结果。最后将可疑判定结果发送至游戏服务商,以使得该服务商针对该目标用户或者游戏进行相应的操作。比如在该目标用户使用的终端设备100中显示封号或者收益惩罚等等提示信息,或者优化游戏设计。或者,是将可疑判定结果发送至车载服务商的后台服务器,以使得该车载服务商的后台服务器向该目标用户发送预警告示。
服务器300也可以将训练完毕的多个分类模型发送(部署)至终端设备100,从而在终端设备100本地实现对异常行为的识别功能。例如,终端设备100获取自身截图得到的待识别图像集合,并调用第一分类模型对该待识别图像集合进行可疑分类处理,以得到第一图像集合,其中,该第一图像集合包括至少一个分类标签为可疑的图像;调用第二分类模型对该待识别图像集合进行分类处理,以得到第二图像集合,该第二图像集合包括至少一个分类标签为第一类可疑标签的图像;调用第三分类模型对该待识别图像集合进行分类处理,以得到第三图像集合,其中,该第三图像集合包括至少一个分类标签为第二类可疑标签的图像;调用多个第四分类模型分别对该第一图像集合、该第二图像集合以及该第三图像集合进行识别处理,以得到多个识别结果;基于该多个识别结果确定该当前界面的可疑判定结果。最后将可疑判定结果发送至游戏服务商,以使得该服务商针对该目标用户或者游戏进行相应的操作。比如在该目标用户使用的终端设备100中显示封号或者收益惩罚等等提示信息,或者优化游戏设计。或者,是将可疑判定结果发送至车载服务商的后台服务器,以使得该车载服务商的后台服务器向该目标用户发送预警告示。
可以理解的是,在本申请的具体实施方式中,涉及到待识别图像集合和训练样本等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
结合上述介绍,下面以终端设备为执行主体,对本申请中数据处理方法进行介绍,请参阅图5,本申请实施例中数据处理方法的一个实施例包括:
501、获取当前界面的截图中心点。
该终端设备接收像素捕获逻辑,并根据该像素捕获逻辑确定该当前界面的截图中心点。
一个示例性方案中,在该当前界面为游戏界面时,该终端设备根据该像素捕获逻辑检测该游戏界面中虚拟操作对象的对战操作对象的位置信息;将该对战操作对象的位置信息作为该截图中心。如图6a所示,在当前游戏界面中,该终端设备检测到该虚拟操作对象A的对战操作对象B的所处位置信息,并将该位置信息作为该截图中心点。
另一个示例性方案中,该终端设备根据该像素捕获逻辑检测该游戏界面中文字控件所处的位置信息;将该文字控件所处的位置信息作为该截图中心。如图6b所示,在当前游戏界面中,该终端设备对该当前游戏界面中的文字控件进行检测,并获取到该文字控件的位置信息,将该文字控件的位置信息作为该截图中心点。
502、基于该截图中心点对该当前界面进行截图,以得到待识别图像集合。
该终端设备在获取到该截图中心点之后,按照预定截图规则对该当前界面进行截图,以得到该待识别图像集合。
可理解的是,该截图规则可以如下,以该截图中心点为基点,在预设范围内进行截图,同时设定该截图的大小为预设大小。比如如图6a所示,对战操作对象所处位置为截图中心点中基点,该虚线模式内为截图范围(假设为(500*400)),在此区域内进行截图,其中截出来的图像大小为100*100。
一个示例性方案中,该待识别图像集合中的各个图像可如下:
其中,图6c展示的为具有虚线方框透视的待识别图像;
图6d展示的为具有实线方框透视的待识别图像;
图6e展示的为具有人物透视的待识别图像;
图6f展示的为具有数字类的人名透视的待识别图像;
图6g展示的为具有外挂功能目录的待识别图像;
图6h展示的为具有人物骨骼透视的待识别图像。
503、调用第一分类模型对该待识别图像集合进行可疑分类处理,以得到第一图像集合,其中,该第一图像集合包括至少一个分类标签为可疑的图像。
该终端设备调用第一分类模型对该待识别图像集合进行第一阶段的分类处理,得到第一图像集合。
具体可以参阅上述图3所述,具体此处不再赘述。
504、调用第二分类模型对该待识别图像集合进行分类处理,以得到第二图像集合,该第二图像集合包括至少一个分类标签为第一类可疑标签的图像。
该终端设备调用第二分类模型对该待识别图像集合进行第一阶段的分类处理,得到第二图像集合。
具体可以参阅上述图3所述,具体此处不再赘述。
505、调用第三分类模型对该待识别图像集合进行分类处理,以得到第三图像集合,其中,该第三图像集合包括至少一个分类标签为第二类可疑标签的图像。
该终端设备调用第三分类模型对该待识别图像集合进行第一阶段的分类处理,得到第三图像集合。
具体可以参阅上述图3所述,具体此处不再赘述。
应理解的是,上述步骤503至步骤505并未限定时序先后问题,其可以同时执行,也可以按照预定的顺序执行,具体此处不做限定。
506、调用多个第四分类模型分别对该第一图像集合、该第二图像集合以及该第三图像集合进行识别处理,以得到多个识别结果。
该终端设备调用多个第四分类模型对该第一图像集合、该第二图像集合以及该第三图像集合进行识别处理,以得到多个识别结果。
具体可以参阅上述图3所述,具体此处不再赘述。
应理解的是,本实施例中的多个第四分类模型在执行识别处理时,并未限定时序先后,其可以同时执行,也可以按照预定的顺序执行,具体此处不做限定。
507、基于该多个识别结果确定该当前界面的可疑判定结果。
该终端设备将多个识别结果进行合并,以得到该当前界面的可疑判定结果,并根据该可疑判定结果进行相应的操作。
具体可以参阅上述图3所述,具体此处不再赘述。
下面以一个具体的实验数据对本申请方案的有益效果进行说明:在实验中,仅采用图3所示的第一部分的技术方案时,有超50%的作弊截图可自动处罚,其中人工审核部分准确率有80%+。同时第一部分的第二阶段的常用作弊分类模型可直接迁移至其他游戏中,对各类型的识别准确率范围在百分之九十至百分之九十九。在实验中,将本申请的分类模型与其他不同模型做了效果对比,如表1,其中模型的大小是tensorflow模型文件ckpt的存储大小。从表1中可以看出,对于小图透视的识别,mobileNet结构比shufflenet结构模型的覆盖效果要更好,能够召回更多的可疑图像。
表1
游戏(黑白比) | 用户准确率(%) | 覆盖作弊人数 |
Shufflenet_loss(48M) | 85.23 | 1482 |
Shufflenet_ghmc(48M) | 86.68 | 1512 |
mobileNet_small(30M) | 90.96 | 1500 |
mobileNet_ghmc(30M) | 88.36 | 1524 |
而通过图6i所示的F1指数值曲线图可知,mobileNet配合GHMC损失函数可以达到更好的效果。
对于如图3所示的第三部分的文字检测和关键词过滤,人工审核部分准确率在95%以上,同时针对文字类外挂的识别,通用性强。
下面对本申请中的数据处理装置进行详细描述,请参阅图7,图7为本申请实施例中数据处理装置的一个实施例示意图,数据处理装置20包括:
获取模块201,用于获取游戏界面的截图中心点;
处理模块202,用于基于该截图中心点对该当前界面进行截图,以得到待识别图像集合;调用第一分类模型对该待识别图像集合进行可疑分类处理,以得到第一图像集合,其中,该第一图像集合包括至少一个分类标签为可疑的图像;调用第二分类模型对该待识别图像集合进行分类处理,以得到第二图像集合,该第二图像集合包括至少一个分类标签为第一类可疑标签的图像;调用第三分类模型对该待识别图像集合进行分类处理,以得到第三图像集合,其中,该第三图像集合包括至少一个分类标签为第二类可疑标签的图像;调用多个第四分类模型分别对该第一图像集合、该第二图像集合以及该第三图像集合进行识别处理,以得到多个识别结果;
确定模块203,用于基于该多个识别结果确定该当前的可疑判定结果。
本申请实施例中,提供了一种数据处理装置。采用上述装置,对于游戏界面进行小图像的截图,从而获取到多个小图像,可以实现对各个作弊行为进行分割,而小图像可以减少对传输资源的占用;同时在进行图像识别的过程中首先通过多个分类模型对于各个作弊类型进行分别处理,可以提升对于不同作弊类型的识别准确度;而对于不同的作弊类型采用多段式分类识别处理,可以减少后续图像识别的处理量,同时减少人工审核的工作量。
可选地,在上述图7所对应的实施例的基础上,本申请实施例提供的数据处理装置20的另一实施例中,在该当前界面为游戏界面时,该获取模块201可以执行如下方案中的至少一项,具体如下:
该获取模块201,用于检测该游戏界面中虚拟操作对象的对战操作对象的位置信息;
将该对战操作对象的位置信息作为该截图中心;
和;
该获取模块201,用于检测该游戏界面中文字控件所处的位置信息;
将该文字控件所处的位置信息作为该截图中心。
本申请实施例中,提供了一种数据处理装置。采用上述装置,以虚拟操作对象的对战操作对象所处的位置作为该截图中心,可以更有效的截到具有作弊特征的图像;同时基于经验值设置文字控件所处的位置也作为该截图中心,这样也可以更有效的截到具有作弊特征的图像。采用上述两种方案进行截图,可以在减少图像上传量的同时,增加作弊检测的准确度。
可选地,在上述图7所对应的实施例的基础上,如图8所示,本申请实施例提供的数据处理装置20的另一实施例中,该获取模块201,用于获取第一训练样本和第一初始分类模型,该第一训练样合包括第一样本图像以及该第一样本图像对应的第一样本标注,该第一样本标注为可疑或者正常;
该装置还包括训练模块204,该训练模块204,用于基于该第一训练样本集合训练该第一初始分类模型得到该第一分类模型;
该获取模块201,用于获取第二训练样本和第二初始分类模型,该第二训练样合包括第二样本图像以及该第二样本图像对应的第二样本标注,该第二样本标注为第一类可疑标签或者正常;
该训练模块204,用于基于该第二训练样本集合训练该第二初始分类模型得到该第二分类模型;
该获取模块201,用于获取第三训练样本和第三初始分类模型,该第三训练样合包括第三样本图像以及该第三样本图像对应的第三样本标注,该第三样本标注为第二类可疑标签或者正常;
该训练模块204,用于基于该第三训练样本集合训练该第三初始分类模型得到该第三分类模型。
本申请实施例中,提供了一种数据处理装置。采用上述装置,对于不同的分类模型采用不同的模型架构以及训练样本进行训练,这样可以方便不同模型的可插拔性,同时提高对不同作弊类型的分类准确度。
可选地,在上述图8所对应的实施例的基础上,本申请实施例提供的数据处理装置20的另一实施例中,在该当前界面为游戏界面时,可疑标签包括虚线方框可疑、实线方框可疑、人物骨骼可疑、人物透视可疑和文字可疑;该获取模块201可以执行如下方案中的至少一项,具体如下:
该获取模块201,用于基于测试账号获取测试历史样本,并为该测试历史样本标注第一样本标签,该第一样本标签用于指示该测试历史样本的可疑类型或者指示该测试历史样本为正常样本;
和;
获取真实历史样本,基于异常检测模型为该真实历史样本标注第二样本标签,该第二样本标签用于指示该真实历史样本为可疑样本或者指示该真实历史样本为正常样本;
和;
对真实历史样本构建虚线方框得到虚线方框样本,和/或,对该真实历史样本构建实线方框得到实线方框样本,该虚线方框样本的样本标签为虚线方框可疑,该实线方框样本的样本标签为实线方框可疑;
和;
基于目标检测模型对真实游戏界面进行图像分割,以得到该真实游戏界面中的异常区域,对该异常区域进行裁剪得到可疑样本,该目标检测模型是基于真实游戏界面样本训练得到;
其中,该测试历史样本、该真实历史样本、该虚线方框样本、该实线方框样本以及该可疑样本作为该第一训练样本。
本申请实施例中,提供了一种数据处理装置。采用上述装置,通过不同的方式构建训练样本,这样可以提升方案的可实行性,同时,针对不同的作弊类型均可以构建可用的训练样本,这样方便实现对不同分类模型的训练。
可选地,在上述图8所对应的实施例的基础上,本申请实施例提供的数据处理装置20的另一实施例中,在该当前界面为游戏界面时,可疑标签包括虚线方框可疑、实线方框可疑、人物骨骼可疑、人物透视可疑和文字可疑;
该处理模块202,用于调用虚线方框识别模型对该第一图像集合进行虚线方框识别处理,以得到第一识别结果,该虚线方框识别模型是基于白样本以及样本标签为虚线方框可疑的可疑样本训练得到;
调用实线方框识别模型对该第一图像集合进行实线方框识别处理,以得到第二识别结果,该实线方框识别模型是基于白样本以及样本标签为实线方框可疑的可疑样本训练得到;
调用人物骨骼识别模型对该第一图像集合进行人物骨骼识别处理,以得到第三识别结果,该人物骨骼方框识别模型是基于白样本以及样本标签为人物骨骼可疑的可疑样本训练得到;
调用透视分类模型对该第二图像集合进行人物透视识别处理,以得到第四识别结果,该透视分类模型是基于白样本以及样本标签为样本标签为人物透视可疑的可疑样本训练得到;
调用文字识别模型对该第三图像集合进行识别处理,以得到第五识别结果,该文字识别模型为光学字符识别模型;
其中,该虚线方框识别模型、该实线方框识别模型、该人物骨骼识别模型、该透视分类模型以及该文字识别模型作为该第四分类模型。
本申请实施例中,提供了一种数据处理装置。采用上述装置,对于不同的作弊类型采用专用的分类模型进行识别处理,这样可以提高对作弊类型的识别准确度,从而提高对游戏中的异常行为的识别准确度。
可选地,在上述图8所对应的实施例的基础上,本申请实施例提供的数据处理装置20的另一实施例中,该确定模块203,用于在该第一识别结果、该第二识别结果、该第三识别结果、该第四识别结果和该第五识别结果中的至少一项指示为作弊,则确定该待识别图像集合对应的可疑判断结果为作弊。
本申请实施例中,提供了一种数据处理装置。采用上述装置,对于多个作弊类型,只要检测出一个作弊类型,则确定该游戏界面中的存在异常行为,这样可以提高对游戏中异常行为的识别准确度。
可选地,在上述图8所对应的实施例的基础上,本申请实施例提供的数据处理装置20的另一实施例中,该处理模块202,用于调用虚线方框识别模型对该第一图像集合进行虚线方框识别处理,以得到第四图像集合,该第四图像集合包括至少一个分类标签为虚线方框可疑的图像;
调用第五分类模型对该第四图像集进行识别处理,以得到该第一识别结果,该第五分类模型是基于正常样本和可疑样本训练得到,该正常样本的数量大于该可疑样本的数量,该可疑样本包括多种可疑标签。
本申请实施例中,提供了一种数据处理装置。采用上述装置,增加一个排白过滤模型,从而避免对某些特殊情况的误报,进而提高对游戏中异常行为的识别准确度。
可选地,在上述图8所对应的实施例的基础上,本申请实施例提供的数据处理装置20的另一实施例中,
该处理模块202,用于调用实线方框识别模型对该第一图像集合进行实线方框识别处理,以得到第五图像集合,该第五图像集合包括至少一个分类标签为实线方框可疑的图像;
调用该第五分类模型对该第五图像集进行识别处理,以得到该第二识别结果,该第五分类模型是基于正常样本和可疑样本训练得到,该正常样本的数量大于该可疑样本的数量,该可疑样本包括多种可疑标签。
本申请实施例中,提供了一种数据处理装置。采用上述装置,增加一个排白过滤模型,从而避免对某些特殊情况的误报,进而提高对游戏中异常行为的识别准确度。
可选地,在上述图8所对应的实施例的基础上,本申请实施例提供的数据处理装置20的另一实施例中,
该处理模块202,用于调用人物骨骼识别模型对该第一图像集合进行人物骨骼识别处理,以得到第六图像集合,该第六图像集合包括至少一个分类标签为人物骨骼可疑的图像;
调用该第五分类模型对该第六图像集进行识别处理,以得到该第三识别结果,该第五分类模型是基于正常样本和可疑样本训练得到,该正常样本的数量大于该可疑样本的数量,该可疑样本包括多种可疑标签。
本申请实施例中,提供了一种数据处理装置。采用上述装置,增加一个排白过滤模型,从而避免对某些特殊情况的误报,进而提高对游戏中异常行为的识别准确度。
可选地,在上述图8所对应的实施例的基础上,本申请实施例提供的数据处理装置20的另一实施例中,
该第二分类模型与该第三分类模型融合为一个多分类模型,该多分类模型用于对待识别图像集合中的多个待识别图像进行分类得到正常图像、含有文字的图像以及具有人物透视可疑图像。
本申请实施例中,提供了一种数据处理装置。采用上述装置,将两个二分类模型融合成一个三分类的模型,这样可以减少模型的训练,同时精简整个模型的网络结构。
本申请提供的数据处理装置可用于服务器,请参阅图9,图9是本申请实施例提供的一种服务器结构示意图,该服务器300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)322(例如,一个或一个以上处理器)和存储器332,一个或一个以上存储应用程序342或数据344的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器332和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器322可以设置为与存储介质330通信,在服务器300上执行存储介质330中的一系列指令操作。
服务器300还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,和/或,一个或一个以上操作系统341,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图9所示的服务器结构。
本申请提供的数据处理装置可用于终端设备,请参阅图10,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。在本申请实施例中,以终端设备为智能手机为例进行说明:
图10示出的是与本申请实施例提供的终端设备相关的智能手机的部分结构的框图。参考图10,智能手机包括:射频(radio frequency,RF)电路410、存储器420、输入单元430、显示单元440、传感器450、音频电路460、无线保真(wireless fidelity,WiFi)模块470、处理器480、以及电源490等部件。本领域技术人员可以理解,图10中示出的智能手机结构并不构成对智能手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图10对智能手机的各个构成部件进行具体的介绍:
RF电路410可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器480处理;另外,将设计上行的数据发送给基站。通常,RF电路410包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier,LNA)、双工器等。此外,RF电路410还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystem of mobile communication,GSM)、通用分组无线服务(general packet radioservice,GPRS)、码分多址(code division multiple access,CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution,LTE)、电子邮件、短消息服务(short messaging service,SMS)等。
存储器420可用于存储软件程序以及模块,处理器480通过运行存储在存储器420的软件程序以及模块,从而执行智能手机的各种功能应用以及数据处理。存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据智能手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元430可用于接收输入的数字或字符信息,以及产生与智能手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元430可包括触控面板431以及其他输入设备432。触控面板431,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板431上或在触控面板431附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板431可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器480,并能接收处理器480发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板431。除了触控面板431,输入单元430还可以包括其他输入设备432。具体地,其他输入设备432可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元440可用于显示由用户输入的信息或提供给用户的信息以及智能手机的各种菜单。显示单元440可包括显示面板441,可选的,可以采用液晶显示器(liquidcrystal display,LCD)、有机发光二极管(organic light-emitting diode,OLED)等形式来配置显示面板441。进一步的,触控面板431可覆盖显示面板441,当触控面板431检测到在其上或附近的触摸操作后,传送给处理器480以确定触摸事件的类型,随后处理器480根据触摸事件的类型在显示面板441上提供相应的视觉输出。虽然在图10中,触控面板431与显示面板441是作为两个独立的部件来实现智能手机的输入和输入功能,但是在某些实施例中,可以将触控面板431与显示面板441集成而实现智能手机的输入和输出功能。
智能手机还可包括至少一种传感器450,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板441的亮度,接近传感器可在智能手机移动到耳边时,关闭显示面板441和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别智能手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于智能手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路460、扬声器461,传声器462可提供用户与智能手机之间的音频接口。音频电路460可将接收到的音频数据转换后的电信号,传输到扬声器461,由扬声器461转换为声音信号输出;另一方面,传声器462将收集的声音信号转换为电信号,由音频电路460接收后转换为音频数据,再将音频数据输出处理器480处理后,经RF电路410以发送给比如另一智能手机,或者将音频数据输出至存储器420以便进一步处理。
WiFi属于短距离无线传输技术,智能手机通过WiFi模块470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图10示出了WiFi模块470,但是可以理解的是,其并不属于智能手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器480是智能手机的控制中心,利用各种接口和线路连接整个智能手机的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器420内的数据,执行智能手机的各种功能和处理数据,从而对智能手机进行整体监测。可选的,处理器480可包括一个或多个处理单元;可选的,处理器480可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器480中。
智能手机还包括给各个部件供电的电源490(比如电池),可选的,电源可以通过电源管理系统与处理器480逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,智能手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
上述实施例中由终端设备所执行的步骤可以基于该图10所示的终端设备结构。
本申请实施例中还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行如前述各个实施例描述的方法。
本申请实施例中还提供一种包括程序的计算机程序产品,当其在计算机上运行时,使得计算机执行前述各个实施例描述的方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
该作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
获取当前界面的截图中心点;
基于所述截图中心点对所述当前界面进行截图,以得到待识别图像集合;
调用第一分类模型对所述待识别图像集合进行可疑分类处理,以得到第一图像集合,其中,所述第一图像集合包括至少一个分类标签为可疑的图像;
调用第二分类模型对所述待识别图像集合进行分类处理,以得到第二图像集合,所述第二图像集合包括至少一个分类标签为第一类可疑标签的图像;
调用第三分类模型对所述待识别图像集合进行分类处理,以得到第三图像集合,其中,所述第三图像集合包括至少一个分类标签为第二类可疑标签的图像;
调用多个第四分类模型分别对所述第一图像集合、所述第二图像集合以及所述第三图像集合进行识别处理,以得到多个识别结果;
基于所述多个识别结果确定所述当前界面的可疑判定结果。
2.根据权利要求1所述的方法,其特征在于,在所述当前界面为游戏界面时,所述获取当前界面的截图中心点包括如下至少一项:
检测所述游戏界面中虚拟操作对象的对战操作对象的位置信息;
将所述对战操作对象的位置信息作为所述截图中心;
或,
检测所述游戏界面中文字控件所处的位置信息;
将所述文字控件所处的位置信息作为所述截图中心。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第一训练样本和第一初始分类模型,所述第一训练样合包括第一样本图像以及所述第一样本图像对应的第一样本标注,所述第一样本标注为可疑或者正常;
基于所述第一训练样本集合训练所述第一初始分类模型得到所述第一分类模型;
获取第二训练样本和第二初始分类模型,所述第二训练样合包括第二样本图像以及所述第二样本图像对应的第二样本标注,所述第二样本标注为第一类可疑标签或者正常;
基于所述第二训练样本集合训练所述第二初始分类模型得到所述第二分类模型;
获取第三训练样本和第三初始分类模型,所述第三训练样合包括第三样本图像以及所述第三样本图像对应的第三样本标注,所述第三样本标注为第二类可疑标签或者正常;
基于所述第三训练样本集合训练所述第三初始分类模型得到所述第三分类模型。
4.根据权利要求3所述的方法,其特征在于,在所述当前界面为游戏界面时,可疑标签包括虚线方框可疑、实线方框可疑、人物骨骼可疑、人物透视可疑和文字可疑;所述获取第一训练样本包括如下至少一项:
基于测试账号获取测试历史样本,并为所述测试历史样本标注第一样本标签,所述第一样本标签用于指示所述测试历史样本的可疑类型或者指示所述测试历史样本为正常样本;
或;
获取真实历史样本,基于异常检测模型为所述真实历史样本标注第二样本标签,所述第二样本标签用于指示所述真实历史样本为可疑样本或者指示所述真实历史样本为正常样本;
或;
对真实历史样本构建虚线方框得到虚线方框样本,和/或,对所述真实历史样本构建实线方框得到实线方框样本,所述虚线方框样本的样本标签为虚线方框可疑,所述实线方框样本的样本标签为实线方框可疑;
或;
基于目标检测模型对真实游戏界面进行图像分割,以得到所述真实游戏界面中的异常区域,对所述异常区域进行裁剪得到可疑样本,所述目标检测模型是基于真实游戏界面样本训练得到;
其中,所述测试历史样本、所述真实历史样本、所述虚线方框样本、所述实线方框样本以及所述可疑样本作为所述第一训练样本。
5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述当前界面为游戏界面时,可疑标签包括虚线方框可疑、实线方框可疑、人物骨骼可疑、人物透视可疑和文字可疑;
所述调用多个第四分类模型分别对所述第一图像集合、所述第二图像集合以及所述第三图像集合进行识别处理,以得到多个识别结果包括:
调用虚线方框识别模型对所述第一图像集合进行虚线方框识别处理,以得到第一识别结果,所述虚线方框识别模型是基于白样本以及样本标签为虚线方框可疑的可疑样本训练得到;
调用实线方框识别模型对所述第一图像集合进行实线方框识别处理,以得到第二识别结果,所述实线方框识别模型是基于白样本以及样本标签为实线方框可疑的可疑样本训练得到;
调用人物骨骼识别模型对所述第一图像集合进行人物骨骼识别处理,以得到第三识别结果,所述人物骨骼方框识别模型是基于白样本以及样本标签为人物骨骼可疑的可疑样本训练得到;
调用透视分类模型对所述第二图像集合进行人物透视识别处理,以得到第四识别结果,所述透视分类模型是基于白样本以及样本标签为样本标签为人物透视可疑的可疑样本训练得到;
调用文字识别模型对所述第三图像集合进行识别处理,以得到第五识别结果,所述文字识别模型为光学字符识别模型;
其中,所述虚线方框识别模型、所述实线方框识别模型、所述人物骨骼识别模型、所述透视分类模型以及所述文字识别模型作为所述第四分类模型。
6.根据权利要求5所述的方法,其特征在于,所述基于所述多个识别结果确定所述当前界面的可疑判定结果包括:
在所述第一识别结果、所述第二识别结果、所述第三识别结果、所述第四识别结果和所述第五识别结果中的至少一项指示为作弊,则确定所述当前界面对应的可疑判定结果为作弊。
7.根据权利要求5所述的方法,其特征在于,所述调用虚线方框识别模型对所述第一图像集合进行虚线方框识别处理,以得到第一识别结果包括:
调用虚线方框识别模型对所述第一图像集合进行虚线方框识别处理,以得到第四图像集合,所述第四图像集合包括至少一个分类标签为虚线方框可疑的图像;
调用第五分类模型对所述第四图像集进行识别处理,以得到所述第一识别结果,所述第五分类模型是基于正常样本和可疑样本训练得到,所述正常样本的数量大于所述可疑样本的数量,所述可疑样本包括多种可疑标签;
调用实线方框识别模型对所述第一图像集合进行实线方框识别处理,以得到第二识别结果包括:
调用实线方框识别模型对所述第一图像集合进行实线方框识别处理,以得到第五图像集合,所述第五图像集合包括至少一个分类标签为实线方框可疑的图像;
调用所述第五分类模型对所述第五图像集进行识别处理,以得到所述第二识别结果;
调用人物骨骼识别模型对所述第一图像集合进行人物骨骼识别处理,以得到第三识别结果包括:
调用人物骨骼识别模型对所述第一图像集合进行人物骨骼识别处理,以得到第六图像集合,所述第六图像集合包括至少一个分类标签为人物骨骼可疑的图像;
调用所述第五分类模型对所述第六图像集进行识别处理,以得到所述第三识别结果。
8.一种数据处理装置,其特征在于,包括:
获取模块,用于获取当前界面的截图中心点;
处理模块,用于基于所述截图中心点对所述当前界面进行截图,以得到待识别图像集合;
调用第一分类模型对所述待识别图像集合进行可疑分类处理,以得到第一图像集合,其中,所述第一图像集合包括至少一个分类标签为可疑的图像;
调用第二分类模型对所述待识别图像集合进行进行分类处理,以得到第二图像集合,所述第二图像集合包括至少一个分类标签为第一类可疑标签的图像;
调用第三分类模型对所述待识别图像集合进行分类处理,以得到第三图像集合,其中,所述第三图像集合包括至少一个分类标签为第二类可疑标签的图像;
调用多个第四分类模型分别对所述第一图像集合、所述第二图像集合以及所述第三图像集合进行识别处理,以得到多个识别结果;
确定模块,用于基于所述多个识别结果确定所述当前界面的可疑判定结果。
9.一种计算机设备,其特征在于,包括:存储器、处理器以及总线系统;
其中,所述存储器用于存储程序;
所述处理器用于执行所述存储器中的程序,所述处理器用于根据程序代码中的指令执行权利要求1至7中任一项所述的方法;
所述总线系统用于连接所述存储器以及所述处理器,以使所述存储器以及所述处理器进行通信。
10.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311282668.5A CN117482532A (zh) | 2023-09-27 | 2023-09-27 | 一种数据处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311282668.5A CN117482532A (zh) | 2023-09-27 | 2023-09-27 | 一种数据处理方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117482532A true CN117482532A (zh) | 2024-02-02 |
Family
ID=89671590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311282668.5A Pending CN117482532A (zh) | 2023-09-27 | 2023-09-27 | 一种数据处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117482532A (zh) |
-
2023
- 2023-09-27 CN CN202311282668.5A patent/CN117482532A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110704661B (zh) | 一种图像分类方法和装置 | |
CN112101329B (zh) | 一种基于视频的文本识别方法、模型训练的方法及装置 | |
CN110766081B (zh) | 一种界面图像检测的方法、模型训练的方法以及相关装置 | |
CN111914113A (zh) | 一种图像检索的方法以及相关装置 | |
CN111709398A (zh) | 一种图像识别的方法、图像识别模型的训练方法及装置 | |
CN110516113B (zh) | 一种视频分类的方法、视频分类模型训练的方法及装置 | |
CN114092920B (zh) | 一种模型训练的方法、图像分类的方法、装置及存储介质 | |
CN113723378B (zh) | 一种模型训练的方法、装置、计算机设备和存储介质 | |
CN114722937A (zh) | 一种异常数据检测方法、装置、电子设备和存储介质 | |
CN111428522B (zh) | 翻译语料生成方法、装置、计算机设备及存储介质 | |
CN113822427A (zh) | 一种模型训练的方法、图像匹配的方法、装置及存储介质 | |
CN116935188B (zh) | 模型训练方法、图像识别方法、装置、设备及介质 | |
CN117576535A (zh) | 一种图像识别方法、装置、设备以及存储介质 | |
CN113569889A (zh) | 一种基于人工智能的图像识别的方法以及相关装置 | |
CN117011929A (zh) | 一种头部姿态估计方法、装置、设备以及存储介质 | |
CN116943229A (zh) | 一种数据处理方法、装置、设备以及存储介质 | |
CN112995757B (zh) | 视频剪裁方法及装置 | |
CN117482532A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN116453005A (zh) | 一种视频封面的提取方法以及相关装置 | |
CN113569043A (zh) | 一种文本类别确定方法和相关装置 | |
CN111859240A (zh) | 一种图片导出的方法、相关装置及存储介质 | |
CN111475732B (zh) | 一种信息处理方法和装置 | |
CN117011649B (zh) | 一种模型训练方法和相关装置 | |
CN117115596B (zh) | 对象动作分类模型的训练方法、装置、设备及介质 | |
CN117373093A (zh) | 基于人工智能的图像识别方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |