CN110020351B - 点击热力图异常检测方法及装置 - Google Patents

点击热力图异常检测方法及装置 Download PDF

Info

Publication number
CN110020351B
CN110020351B CN201710904819.4A CN201710904819A CN110020351B CN 110020351 B CN110020351 B CN 110020351B CN 201710904819 A CN201710904819 A CN 201710904819A CN 110020351 B CN110020351 B CN 110020351B
Authority
CN
China
Prior art keywords
click
region
detected
thermodynamic diagram
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710904819.4A
Other languages
English (en)
Other versions
CN110020351A (zh
Inventor
刘振华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201710904819.4A priority Critical patent/CN110020351B/zh
Priority to US16/642,276 priority patent/US20210079866A1/en
Priority to PCT/CN2018/108160 priority patent/WO2019062824A1/zh
Publication of CN110020351A publication Critical patent/CN110020351A/zh
Application granted granted Critical
Publication of CN110020351B publication Critical patent/CN110020351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/22Safety or indicating devices for abnormal conditions
    • F02D41/222Safety or indicating devices for abnormal conditions relating to the failure of sensors or parameter detection devices
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02DCONTROLLING COMBUSTION ENGINES
    • F02D41/00Electrical control of supply of combustible mixture or its constituents
    • F02D41/22Safety or indicating devices for abnormal conditions
    • F02D41/221Safety or indicating devices for abnormal conditions relating to the failure of actuators or electrically driven elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0248Avoiding fraud
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B29/00Maps; Plans; Charts; Diagrams, e.g. route diagram
    • G09B29/003Maps
    • G09B29/006Representation of non-cartographic information on maps, e.g. population distribution, wind direction, radiation levels, air and sea routes
    • G09B29/007Representation of non-cartographic information on maps, e.g. population distribution, wind direction, radiation levels, air and sea routes using computer methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Chemical & Material Sciences (AREA)
  • Mechanical Engineering (AREA)
  • Combustion & Propulsion (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Mathematical Physics (AREA)
  • Ecology (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种点击热力图异常检测方法及装置,可以确定第一点击热力图中的待检测区域,将待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果,根据第一比对结果确定待检测区域是否为异常点击区域。发明人经过研究发现,异常点击区域的点击来源数据相对于正常点击区域的点击来源数据有较大差别,因此可以根据二者的比对结果确定待检测区域是否为异常点击区域,从而实现异常点击区域的自动识别,并提高了准确性和识别效率。

Description

点击热力图异常检测方法及装置
技术领域
本发明涉及流量作弊检测领域,尤其涉及点击热力图异常检测方法及装置。
背景技术
随着互联网的发展,用户更多的通过电子设备浏览各种网站的网页或应用程序的界面。通过购买广告可以为广告购买方带来更多的互联网流量,从而使得更多的用户浏览和点击广告购买方网站的网页或应用程序的界面。但流量作弊行为长期损害着广告购买方的正当权益,例如一些刷流量的软件会自动且大量的访问广告购买方的网站并进行大量点击操作,这些点击操作没有为广告购买方带来收益,但广告购买方却需要为之付费。
由于点击热力图可以很好的体现网站的网页或应用程序的界面中的点击情况,因此可以根据点击热力图确定异常点击行为从而识别异常流量。现有技术通过人工对点击热力图中的异常点击行为进行识别,准确性和识别效率较低。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的点击热力图异常检测方法及装置,方案如下:
一种点击热力图异常检测方法,包括:
获得第一点击热力图,确定所述第一点击热力图中的待检测区域;
将所述待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果;
根据所述第一比对结果确定所述待检测区域是否为异常点击区域。
可选的,所述确定所述第一点击热力图中的待检测区域,包括:
将所述第一点击热力图划分为多个面积相等的子区域,其中,各子区域的形状相同;
使用图像分割算法对划分为多个子区域的所述第一点击热力图进行分割,获得由多个完整的子区域构成的待检测区域,其中,所述待检测区域中的各子区域内的点击量均大于第一预设阈值;
所述方法还包括:将所述第一点击热力图中除所述待检测区域外的区域确定为正常点击区域。
可选的,还包括:
获得第二点击热力图,确定所述第二点击热力图中的待检测区域,其中,所述第一点击热力图为第一页面在第一时间段内的点击热力图;所述第二点击热力图为所述第一页面在第二时间段内的点击热力图,所述第一时间段和所述第二时间段不同;
将所述第二点击热力图中的待检测区域的点击来源数据与所述第一点击热力图中确定为不是异常点击区域的待检测区域的点击来源数据进行比对,获得第二比对结果;
根据所述第二比对结果确定所述第二点击热力图中的待检测区域是否为异常点击区域。
可选的,所述将所述待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果,包括:
通过计算所述待检测区域的点击来源数据与正常点击区域的点击来源数据的相关系数来进行点击来源数据的比对,将计算得到的相关系数作为第一比对结果。
可选的,所述根据所述第一比对结果确定所述待检测区域是否为异常点击区域,包括:
确定作为所述第一比对结果的相关系数是否小于第二预设阈值,如果是,则确定所述待检测区域为异常点击区域。
可选的,还包括:
为确定为异常点击区域的待检测区域添加预设标识。
一种点击热力图异常检测装置,包括:待检测区域确定单元、第一对比单元和异常确定单元,
所述待检测区域确定单元,用于获得第一点击热力图,确定所述第一点击热力图中的待检测区域;
所述第一对比单元,用于将所述待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果;
所述异常确定单元,用于根据所述第一比对结果确定所述待检测区域是否为异常点击区域。
可选的,所述待检测区域确定单元,包括:划分子单元和分割子单元,
所述划分子单元,用于将所述第一点击热力图划分为多个面积相等的子区域,其中,各子区域的形状相同;
所述分割子单元,用于使用图像分割算法对划分为多个子区域的所述第一点击热力图进行分割,获得由多个完整的子区域构成的待检测区域,其中,所述待检测区域中的各子区域内的点击量均大于第一预设阈值;
所述装置还包括:正常区域确定单元,用于将所述第一点击热力图中除所述待检测区域外的区域确定为正常点击区域。
一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述的点击热力图异常检测方法。
一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的点击热力图异常检测方法。
借由上述技术方案,本发明提供的一种点击热力图异常检测方法及装置,可以确定第一点击热力图中的待检测区域,将待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果,根据第一比对结果确定待检测区域是否为异常点击区域。发明人经过研究发现,异常点击区域的点击来源数据相对于正常点击区域的点击来源数据有较大差别,因此可以根据二者的比对结果确定待检测区域是否为异常点击区域,从而实现异常点击区域的自动识别,并提高了准确性和识别效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种点击热力图异常检测方法的流程图;
图2示出了本发明实施例提供的点击数据示意图;
图3示出了本发明实施例提供的点击热力图示意图;
图4示出了本发明实施例提供的待检测区域示意图;
图5示出了本发明实施例提供正常点击区域示意图;
图6示出了本发明实施例提供的各待检测区域与正常点击区域的点击来源占比的相关系数示意图;
图7示出了本发明实施例提供的点击热力图覆盖到界面上的效果示意图;
图8示出了本发明实施例提供的另一种点击热力图异常检测方法的流程图;
图9示出了本发明实施例提供的一种点击热力图异常检测装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明实施例提供的一种点击热力图异常检测方法,可以包括:
S100、获得第一点击热力图,确定所述第一点击热力图中的待检测区域;
其中,本发明可以直接从其他电子设备中获得第一点击热力图,也可以根据从其他电子设备中获得的点击数据生成该第一点击热力图。
具体的,本发明在获得点击数据后可以首先对点击数据进行归一化处理,然后进行转置、数据区间化与滤波处理,然后根据滤波处理后的点击数据生成点击热力图即可。
其中,第一点击热力图中的待检测区域可以为该第一点击热力图中点击量较高的区域。
可选的,确定所述第一点击热力图中的待检测区域的过程可以包括:
将所述第一点击热力图划分为多个面积相等的子区域,其中,各子区域的形状相同;
使用图像分割算法对划分为多个子区域的所述第一点击热力图进行分割,获得由多个完整的子区域构成的待检测区域,其中,所述待检测区域中的各子区域内的点击量均大于第一预设阈值。
在此基础上,图1所示方法还可以包括:将所述第一点击热力图中除所述待检测区域外的区域确定为正常点击区域。
其中,每个子区域可以由一个或多个像素点构成。
其中,本发明使用的图像分割算法可以为基于阈值的分割算法、基于区域的分割算法或基于边缘的分割算法等。下面以基于阈值的分割算法为例对图像分割过程进行说明:
首先根据第一点击热力图中各子区域的点击量确定所述第一预设阈值(例如第一预设阈值为各子区域的点击量的平均值);
然后遍历各子区域的点击量,获得点击量高于该第一预设阈值的各子区域;
从点击量高于该第一预设阈值的各子区域中选取一个子区域作为当前区域;
确定可与当前区域融合为一个区域的其他点击量高于第一预设阈值的子区域,将确定的子区域与当前区域融合;
确定点击量高于第一预设阈值的各子区域中是否存在未融合的子区域,如果是,则从未融合的子区域中选择一个子区域作为当前区域,返回执行所述确定可与当前区域融合为一个区域的其他点击量高于第一预设阈值的子区域,将确定的子区域与当前区域融合的步骤。
本申请发明人在实现本发明的过程中研究发现:作弊流量产生的点击数据一般均集中在某些区域,并导致这些区域的点击量较高,因此本发明可以将点击量较高的区域确定为待检测区域。相应的,点击量较低的区域一般为正常点击区域。本申请发明人研究发现,当点击数据均由真实用户产生时,不同的两个区域内的点击数据的来源分布相似。例如:某网页中包括第一区域和第二区域,该网页的点击数据有B、C和D三个来源,这三个来源的点击数据在第一区域的全部点击数据中的占比分别为:10%、20%和70%。这三个来源的点击数据在第二区域的全部点击数据中的占比分别为:8%、23%和69%。
S200、将所述待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果;
可选的,步骤S200可以包括:
通过计算所述待检测区域的点击来源数据与正常点击区域的点击来源数据的相关系数来进行点击来源数据的比对,将计算得到的相关系数作为第一比对结果。
步骤S200也可以通过其他方式,如计算协方差等来进行点击来源数据的比对,本发明在此不做限定。
S300、根据所述第一比对结果确定所述待检测区域是否为异常点击区域。
具体的,步骤S300可以包括:确定作为所述第一比对结果的相关系数是否小于第二预设阈值,如果是,则确定所述待检测区域为异常点击区域。
可选的,在作为所述第一比对结果的相关系数不小于第二预设阈值时,本发明还可以确定所述待检测区域为正常点击区域。
可选的,图1所示方法还可以包括:
为确定为异常点击区域的待检测区域添加预设标识。
通过该预设标识的添加就可以使得广告购买方方便的找到本发明确定的异常点击区域。
进一步,本发明还可以将添加了预设标识的异常点击区域所在的第一点击热力图覆盖该第一点击热力图对应的界面图上。其中,该界面图可以为网页界面图、应用程序界面图等。通过覆盖到界面图上,可以进一步方便用户找到异常点击区域对应的界面图中的位置,从而对其进行分析和使用。
为方便理解,下面举例说明:
设获得的进行归一化处理后的点击数据如图2所示,则对图2所示的点击数据进行转置、数据区间化与滤波处理后,可以根据滤波处理后的点击数据生成如图3所示的点击热力图。通过图像分割算法获得图4所示的九个待检测区域001至009和图5所示的正常点击区域。
其中,各待检测区域和正常点击区域的点击来源占比如表1所示:
表1、各待检测区域和正常点击区域的点击来源占比表
Figure GDA0002950185340000071
分别计算各待检测区域与正常点击区域的点击来源占比的相关系数,可以获得如图6所示的相关系数。
通过图6所示的相关系数可知,待检测区域003、待检测区域004和待检测区域005的相关系数很低,可以确定这三个待检测区域为异常点击区域。而其他六个待检测区域的相关系数很好,可以确定这六个待检测区域不是异常点击区域。
如图7所示,本发明将确定的异常点击区域(待检测区域003、待检测区域004和待检测区域005)圈起来以进行标识,同时将该点击热力图覆盖到对应的界面上(本发明对界面进行了模糊处理)。
可选的,本发明可以将步骤S300确定的不是异常点击区域的待检测区域与其他点击热力图中的待检测区域进行点击来源数据的比对。
本发明实施例提供的一种点击热力图异常检测方法,可以确定第一点击热力图中的待检测区域,将待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果,根据第一比对结果确定待检测区域是否为异常点击区域。发明人经过研究发现,异常点击区域的点击来源数据相对于正常点击区域的点击来源数据有较大差别,因此可以根据二者的比对结果确定待检测区域是否为异常点击区域,从而实现异常点击区域的自动识别,并提高了准确性和识别效率。
如图8所示,在图1所示实施例基础上,本发明实施例提供的另一种点击热力图异常检测方法,还可以包括:
S400、获得第二点击热力图,确定所述第二点击热力图中的待检测区域,其中,所述第一点击热力图为第一页面在第一时间段内的点击热力图;所述第二点击热力图为所述第一页面在第二时间段内的点击热力图,所述第一时间段和所述第二时间段不同;
对于同一页面而言,不同时间段内(例如相邻的两天)的点击来源可能并未发生变化,这种情况下,前一时间段内通过图1所示方法中的第一比对结果确定的不是异常点击区域的待检测区域的点击来源数据可以用于与后一时间段内的点击热力图中的待检测区域的点击来源数据进行比对。
S500、将所述第二点击热力图中的待检测区域的点击来源数据与所述第一点击热力图中确定为不是异常点击区域的待检测区域的点击来源数据进行比对,获得第二比对结果;
S600、根据所述第二比对结果确定所述第二点击热力图中的待检测区域是否为异常点击区域。
图8所示方法中的步骤S400至S600可以使用前一时间段内通过图1所示方法中的第一比对结果确定的不是异常点击区域的待检测区域与后一时间段内的点击热力图中的待检测区域进行点击来源数据的比对,简化了异常点击区域的确定过程。
与上述方法实施例相对应,本发明实施例还提供了一种点击热力图异常检测装置。
如图9所示,本发明实施例提供的一种点击热力图异常检测装置,可以包括:待检测区域确定单元100、第一对比单元200和异常确定单元300,
所述待检测区域确定单元100,用于获得第一点击热力图,确定所述第一点击热力图中的待检测区域;
其中,本发明可以直接从其他电子设备中获得第一点击热力图,也可以根据从其他电子设备中获得的点击数据生成该第一点击热力图。
具体的,本发明在获得点击数据后可以首先对点击数据进行归一化处理,然后进行转置、数据区间化与滤波处理,然后根据滤波处理后的点击数据生成点击热力图即可。
可选的,待检测区域确定单元100可以包括:划分子单元和分割子单元,
所述划分子单元,用于将所述第一点击热力图划分为多个面积相等的子区域,其中,各子区域的形状相同;
所述分割子单元,用于使用图像分割算法对划分为多个子区域的所述第一点击热力图进行分割,获得由多个完整的子区域构成的待检测区域,其中,所述待检测区域中的各子区域内的点击量均大于第一预设阈值;
图9所示装置还可以包括:正常区域确定单元,用于将所述第一点击热力图中除所述待检测区域外的区域确定为正常点击区域。
其中,第一点击热力图中的待检测区域可以为该第一点击热力图中点击量较高的区域。
本申请发明人在实现本发明的过程中研究发现:作弊流量产生的点击数据一般均集中在某些区域,并导致这些区域的点击量较高,因此本发明可以将点击量较高的区域确定为待检测区域。相应的,点击量较低的区域一般为正常点击区域。本申请发明人研究发现,当点击数据均由真实用户产生时,不同的两个区域内的点击数据的来源分布相似。例如:某网页中包括第一区域和第二区域,该网页的点击数据有B、C和D三个来源,这三个来源的点击数据在第一区域的全部点击数据中的占比分别为:10%、20%和70%。这三个来源的点击数据在第二区域的全部点击数据中的占比分别为:8%、23%和69%。
所述第一对比单元200,用于将所述待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果;
可选的,第一对比单元200,可以具体用于通过计算所述待检测区域的点击来源数据与正常点击区域的点击来源数据的相关系数来进行点击来源数据的比对,将计算得到的相关系数作为第一比对结果。
所述异常确定单元300,用于根据所述第一比对结果确定所述待检测区域是否为异常点击区域。
具体的,异常确定单元300,可以具体用于确定作为所述第一比对结果的相关系数是否小于第二预设阈值,如果是,则确定所述待检测区域为异常点击区域。
可选的,在作为所述第一比对结果的相关系数不小于第二预设阈值时,异常确定单元300还可以确定所述待检测区域为正常点击区域。
在本发明另一实施例中,图9所示装置还可以包括:热力图获得单元、第二对比单元和异常区域确定单元,
所述热力图获得单元,用于获得第二点击热力图,确定所述第二点击热力图中的待检测区域,其中,所述第一点击热力图为第一页面在第一时间段内的点击热力图;所述第二点击热力图为所述第一页面在第二时间段内的点击热力图,所述第一时间段和所述第二时间段不同;
对于同一页面而言,不同时间段内(例如相邻的两天)的点击来源可能并未发生变化,这种情况下,前一时间段内通过第一比对结果确定的不是异常点击区域的待检测区域的点击来源数据可以用于与后一时间段内的点击热力图中的待检测区域的点击来源数据进行比对。
所述第二对比单元,用于将所述第二点击热力图中的待检测区域的点击来源数据与所述第一点击热力图中确定为不是异常点击区域的待检测区域的点击来源数据进行比对,获得第二比对结果;
所述异常区域确定单元,用于根据所述第二比对结果确定所述第二点击热力图中的待检测区域是否为异常点击区域。
该实施例可以使用前一时间段内通过图9所示装置中的第一比对结果确定的不是异常点击区域的待检测区域与后一时间段内的点击热力图中的待检测区域进行点击来源数据的比对,简化了异常点击区域的确定过程。
在本发明另一实施例中,图9所示装置还可以包括:标识添加单元,用于为确定为异常点击区域的待检测区域添加预设标识。
通过该预设标识的添加就可以使得广告购买方方便的找到本发明确定的异常点击区域。
进一步,本发明还可以将添加了预设标识的异常点击区域所在的第一点击热力图覆盖该第一点击热力图对应的界面图上。其中,该界面图可以为网页界面图、应用程序界面图等。通过覆盖到界面图上,可以进一步方便用户找到异常点击区域对应的界面图中的位置,从而对其进行分析和使用。
本发明实施例提供的一种点击热力图异常检测装置,可以确定第一点击热力图中的待检测区域,将待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果,根据第一比对结果确定待检测区域是否为异常点击区域。发明人经过研究发现,异常点击区域的点击来源数据相对于正常点击区域的点击来源数据有较大差别,因此可以根据二者的比对结果确定待检测区域是否为异常点击区域,从而实现异常点击区域的自动识别,并提高了准确性和识别效率。
所述点击热力图异常检测装置包括处理器和存储器,上述待检测区域确定单元、第一对比单元和异常确定单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来确定异常点击区域。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述点击热力图异常检测方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述点击热力图异常检测方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获得第一点击热力图,确定所述第一点击热力图中的待检测区域;
将所述待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果;
根据所述第一比对结果确定所述待检测区域是否为异常点击区域。
可选的,所述确定所述第一点击热力图中的待检测区域,包括:
将所述第一点击热力图划分为多个面积相等的子区域,其中,各子区域的形状相同;
使用图像分割算法对划分为多个子区域的所述第一点击热力图进行分割,获得由多个完整的子区域构成的待检测区域,其中,所述待检测区域中的各子区域内的点击量均大于第一预设阈值;
处理器执行程序时还可以实现以下步骤:
将所述第一点击热力图中除所述待检测区域外的区域确定为正常点击区域。
可选的,处理器执行程序时还可以实现以下步骤:
获得第二点击热力图,确定所述第二点击热力图中的待检测区域,其中,所述第一点击热力图为第一页面在第一时间段内的点击热力图;所述第二点击热力图为所述第一页面在第二时间段内的点击热力图,所述第一时间段和所述第二时间段不同;
将所述第二点击热力图中的待检测区域的点击来源数据与所述第一点击热力图中确定为不是异常点击区域的待检测区域的点击来源数据进行比对,获得第二比对结果;
根据所述第二比对结果确定所述第二点击热力图中的待检测区域是否为异常点击区域。
可选的,所述将所述待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果,包括:
通过计算所述待检测区域的点击来源数据与正常点击区域的点击来源数据的相关系数来进行点击来源数据的比对,将计算得到的相关系数作为第一比对结果。
可选的,所述根据所述第一比对结果确定所述待检测区域是否为异常点击区域,包括:
确定作为所述第一比对结果的相关系数是否小于第二预设阈值,如果是,则确定所述待检测区域为异常点击区域。
可选的,处理器执行程序时还可以实现以下步骤:
为确定为异常点击区域的待检测区域添加预设标识。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获得第一点击热力图,确定所述第一点击热力图中的待检测区域;
将所述待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果;
根据所述第一比对结果确定所述待检测区域是否为异常点击区域。
可选的,所述确定所述第一点击热力图中的待检测区域,包括:
将所述第一点击热力图划分为多个面积相等的子区域,其中,各子区域的形状相同;
使用图像分割算法对划分为多个子区域的所述第一点击热力图进行分割,获得由多个完整的子区域构成的待检测区域,其中,所述待检测区域中的各子区域内的点击量均大于第一预设阈值;
上述计算机程序产品,当在数据处理设备上执行时,还可以适于执行初始化有如下方法步骤的程序:
将所述第一点击热力图中除所述待检测区域外的区域确定为正常点击区域。
可选的,上述计算机程序产品,当在数据处理设备上执行时,还可以适于执行初始化有如下方法步骤的程序:
获得第二点击热力图,确定所述第二点击热力图中的待检测区域,其中,所述第一点击热力图为第一页面在第一时间段内的点击热力图;所述第二点击热力图为所述第一页面在第二时间段内的点击热力图,所述第一时间段和所述第二时间段不同;
将所述第二点击热力图中的待检测区域的点击来源数据与所述第一点击热力图中确定为不是异常点击区域的待检测区域的点击来源数据进行比对,获得第二比对结果;
根据所述第二比对结果确定所述第二点击热力图中的待检测区域是否为异常点击区域。
可选的,所述将所述待检测区域的点击来源数据与正常点击区域的点击来源数据进行比对,获得第一比对结果,包括:
通过计算所述待检测区域的点击来源数据与正常点击区域的点击来源数据的相关系数来进行点击来源数据的比对,将计算得到的相关系数作为第一比对结果。
可选的,所述根据所述第一比对结果确定所述待检测区域是否为异常点击区域,包括:
确定作为所述第一比对结果的相关系数是否小于第二预设阈值,如果是,则确定所述待检测区域为异常点击区域。
可选的,上述计算机程序产品,当在数据处理设备上执行时,还可以适于执行初始化有如下方法步骤的程序:
为确定为异常点击区域的待检测区域添加预设标识。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (8)

1.一种点击热力图异常检测方法,其特征在于,包括:
获得第一点击热力图,将所述第一点击热力图划分为多个面积相等的子区域,其中,各子区域的形状相同;
使用图像分割算法对划分为多个子区域的所述第一点击热力图进行分割,获得由多个完整的子区域构成的待检测区域,其中,所述待检测区域中的各子区域内的点击量均大于第一预设阈值;
将所述第一点击热力图中除所述待检测区域外的区域确定为正常点击区域;
通过计算所述待检测区域的点击来源数据与正常点击区域的点击来源数据的相关系数来进行点击来源数据的比对,将计算得到的相关系数作为第一比对结果;
根据所述第一比对结果确定所述待检测区域是否为异常点击区域。
2.根据权利要求1所述的方法,其特征在于,还包括:
获得第二点击热力图,确定所述第二点击热力图中的待检测区域,其中,所述第一点击热力图为第一页面在第一时间段内的点击热力图;所述第二点击热力图为所述第一页面在第二时间段内的点击热力图,所述第一时间段和所述第二时间段不同;
将所述第二点击热力图中的待检测区域的点击来源数据与所述第一点击热力图中确定为不是异常点击区域的待检测区域的点击来源数据进行比对,获得第二比对结果;
根据所述第二比对结果确定所述第二点击热力图中的待检测区域是否为异常点击区域。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一比对结果确定所述待检测区域是否为异常点击区域,包括:
确定作为所述第一比对结果的相关系数是否小于第二预设阈值,如果是,则确定所述待检测区域为异常点击区域。
4.根据权利要求1所述的方法,其特征在于,还包括:
为确定为异常点击区域的待检测区域添加预设标识。
5.根据权利要求2中所述的方法,其特征在于,还包括:
为确定为异常点击区域的待检测区域添加预设标识。
6.一种点击热力图异常检测装置,其特征在于,包括:待检测区域确定单元、第一对比单元和异常确定单元,
所述待检测区域确定单元,用于获得第一点击热力图,确定所述第一点击热力图中的待检测区域;
所述第一对比单元,用于通过计算所述待检测区域的点击来源数据与正常点击区域的点击来源数据的相关系数来进行点击来源数据的比对,将计算得到的相关系数作为第一比对结果;
所述异常确定单元,用于根据所述第一比对结果确定所述待检测区域是否为异常点击区域;
所述待检测区域确定单元,包括:划分子单元和分割子单元,
所述划分子单元,用于将所述第一点击热力图划分为多个面积相等的子区域,其中,各子区域的形状相同;
所述分割子单元,用于使用图像分割算法对划分为多个子区域的所述第一点击热力图进行分割,获得由多个完整的子区域构成的待检测区域,其中,所述待检测区域中的各子区域内的点击量均大于第一预设阈值;
所述装置还包括:正常区域确定单元,用于将所述第一点击热力图中除所述待检测区域外的区域确定为正常点击区域。
7.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1-5中任一项所述的点击热力图异常检测方法。
8.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行如权利要求1-5中任一项所述的点击热力图异常检测方法。
CN201710904819.4A 2017-09-29 2017-09-29 点击热力图异常检测方法及装置 Active CN110020351B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201710904819.4A CN110020351B (zh) 2017-09-29 2017-09-29 点击热力图异常检测方法及装置
US16/642,276 US20210079866A1 (en) 2017-09-29 2018-09-28 Click heatmap abnormality detection method and apparatus
PCT/CN2018/108160 WO2019062824A1 (zh) 2017-09-29 2018-09-28 点击热力图异常检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710904819.4A CN110020351B (zh) 2017-09-29 2017-09-29 点击热力图异常检测方法及装置

Publications (2)

Publication Number Publication Date
CN110020351A CN110020351A (zh) 2019-07-16
CN110020351B true CN110020351B (zh) 2021-08-13

Family

ID=65900704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710904819.4A Active CN110020351B (zh) 2017-09-29 2017-09-29 点击热力图异常检测方法及装置

Country Status (3)

Country Link
US (1) US20210079866A1 (zh)
CN (1) CN110020351B (zh)
WO (1) WO2019062824A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777080A (zh) * 2010-03-19 2010-07-14 北京国双科技有限公司 基于用户点击数据的网页分析方法
CN103684885A (zh) * 2013-12-31 2014-03-26 新浪网技术(中国)有限公司 一种网站服务器访问异常确定方法及装置
CN105357216A (zh) * 2015-11-30 2016-02-24 上海斐讯数据通信技术有限公司 一种安全访问方法及系统
CN105653724A (zh) * 2016-01-20 2016-06-08 北京京东尚科信息技术有限公司 一种页面曝光量的监控方法和装置
CN107168854A (zh) * 2017-06-01 2017-09-15 北京京东尚科信息技术有限公司 互联网广告异常点击检测方法、装置、设备及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530431B (zh) * 2013-11-06 2016-08-17 北京国双科技有限公司 用于网页页面点击量统计的数据处理方法和装置
KR20150061102A (ko) * 2013-11-25 2015-06-04 주식회사 케이티 관제 시스템 및 이를 이용한 관제 방법
CN104199939B (zh) * 2014-09-09 2018-02-02 北京国双科技有限公司 网页热力图生成方法及装置
CN104731894B (zh) * 2015-03-18 2018-10-16 百度在线网络技术(北京)有限公司 热力图的展现方法及装置
US10419460B2 (en) * 2017-07-21 2019-09-17 Oath, Inc. Method and system for detecting abnormal online user activity

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101777080A (zh) * 2010-03-19 2010-07-14 北京国双科技有限公司 基于用户点击数据的网页分析方法
CN103684885A (zh) * 2013-12-31 2014-03-26 新浪网技术(中国)有限公司 一种网站服务器访问异常确定方法及装置
CN105357216A (zh) * 2015-11-30 2016-02-24 上海斐讯数据通信技术有限公司 一种安全访问方法及系统
CN105653724A (zh) * 2016-01-20 2016-06-08 北京京东尚科信息技术有限公司 一种页面曝光量的监控方法和装置
CN107168854A (zh) * 2017-06-01 2017-09-15 北京京东尚科信息技术有限公司 互联网广告异常点击检测方法、装置、设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Memory heat map: anomaly detection in real-time embedded systems using memory behavior;Man-Ki Yoon等;《Proceedings of the 52nd Annual Design Automation Conference》;20150630;第1-6页 *
一种基于用户行为特征选择的点击欺诈检测方法;曹亚楠等;《计算机科学》;20161015;第145-149页 *

Also Published As

Publication number Publication date
US20210079866A1 (en) 2021-03-18
CN110020351A (zh) 2019-07-16
WO2019062824A1 (zh) 2019-04-04

Similar Documents

Publication Publication Date Title
CN108510311B (zh) 一种确定营销方案的方法、装置及电子设备
CN109561052B (zh) 网站异常流量的检测方法及装置
CN106919611B (zh) 产品信息推送方法和装置
EP3293642A1 (en) Method and apparatus for recording and restoring click position in page
CN107766467B (zh) 一种信息检测方法、装置、电子设备及存储介质
CN109428776B (zh) 一种网站流量的监控方法及装置
CN111125376A (zh) 知识图谱生成方法、装置、数据处理设备及存储介质
CN109582883B (zh) 栏目页的确定方法和装置
CN109598526B (zh) 媒体贡献的分析方法及装置
CN108874379B (zh) 页面的处理方法及装置
CN109857964B (zh) 一种页面操作的热力图绘制方法、装置、存储介质及处理器
CN106933905B (zh) 网页访问数据的监测方法和装置
CN111179136A (zh) 一种动态管控方法、装置、电子设备
CN110020351B (zh) 点击热力图异常检测方法及装置
CN117520645A (zh) 基于金融产品的用户确定方法、装置以及电子设备
CN110865785B (zh) 像素尺寸的获取方法、装置及电子设备
CN110147183B (zh) 一种数据的筛选方法及装置
CN109597743B (zh) 页面圈选方法、点击量统计方法及相关设备
CN108984572B (zh) 网站信息推送方法及装置
CN115659045A (zh) 用户操作的识别方法、装置、存储介质以及电子设备
CN109426540B (zh) 元素的点击情况检测方法和装置、存储介质、处理器
Jang et al. Robust detection of mosaic regions in visual image data
CN113205079A (zh) 一种人脸检测方法、装置、电子设备及存储介质
CN106997353B (zh) 网页改版的监控方法及装置
CN112579880A (zh) 数据分析方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100080 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant