CN103226583A - 一种广告插件识别的方法和装置 - Google Patents

一种广告插件识别的方法和装置 Download PDF

Info

Publication number
CN103226583A
CN103226583A CN2013101198123A CN201310119812A CN103226583A CN 103226583 A CN103226583 A CN 103226583A CN 2013101198123 A CN2013101198123 A CN 2013101198123A CN 201310119812 A CN201310119812 A CN 201310119812A CN 103226583 A CN103226583 A CN 103226583A
Authority
CN
China
Prior art keywords
advertisement
characteristic
proper vector
plug
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013101198123A
Other languages
English (en)
Other versions
CN103226583B (zh
Inventor
张迪
唐淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201310119812.3A priority Critical patent/CN103226583B/zh
Publication of CN103226583A publication Critical patent/CN103226583A/zh
Priority to PCT/CN2014/071596 priority patent/WO2014166312A1/zh
Priority to US14/783,042 priority patent/US9824212B2/en
Application granted granted Critical
Publication of CN103226583B publication Critical patent/CN103226583B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/552Detecting local intrusion or implementing counter-measures involving long-term monitoring or reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/4424Monitoring of the internal components or processes of the client device, e.g. CPU or memory load, processing speed, timer, counter or percentage of the hard disk space used
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/443OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB
    • H04N21/4431OS processes, e.g. booting an STB, implementing a Java virtual machine in an STB or power management in an STB characterized by the use of Application Program Interface [API] libraries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/812Monomedia components thereof involving advertisement data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8166Monomedia components thereof involving executable data, e.g. software
    • H04N21/8193Monomedia components thereof involving executable data, e.g. software dedicated tools, e.g. video decoder software or IPMP tool
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/03Indexing scheme relating to G06F21/50, monitoring users, programs or devices to maintain the integrity of platforms
    • G06F2221/034Test or assess a computer or a system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Virology (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开了一种广告插件识别的方法和装置,涉及计算机技术领域。所述方法包括:查找应用插件相关的各文件;基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。本发明取得了有完善的特征识别规则,并可结合云端数据进行特征识别,实现了广告软件的精、准识别,对混淆后的广告软件代码具有较高的特征匹配识别能力的有益效果。

Description

一种广告插件识别的方法和装置
技术领域
本发明涉及计算机技术领域,具体涉及一种广告插件识别的方法和装置。
背景技术
随着技术的发展,智能移动终端也越来越普及,比如采用Android(安卓,一种基于Linux的自由及开放源代码的操作系统)的智能手机,iphone手机等。而随着智能移动终端(比如智能手机)的普及,各种移动应用也如雨后春笋般出现在智能移动终端上上,同时应用中也越来越多的嵌入广告插件,而恶意的广告软件轻则会骚扰用户,更严重的则会造成用户隐私泄露、特别对于用户手机来说,更可能耗费大量流量,甚至会偷偷发送扣费短信,给用户造成各种损失。
而要保护用户免受恶意广告损害的第一步就是要识别哪些应用是广告软件,以及其危害,这样用户可以知晓广告软件是否为恶意广告以及危害程序,可以选择卸载该软件。同时也为进一步的广告拦截提供数据支持。
目前,对于智能移动终端的广告插件识别,大都只是简单的固定的检测广告组件名来判断应用是否为广告插件,而由于很多广告方都把广告组件嵌入应用,而这种混淆后的软件代码,可能没有明显的组件名以进行区分,因此现有技术无法精确的识别广告插件,广告插件识别率低。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种广告插件识别系统和相应的一种广告插件识别方法。
依据本发明的一个方面,提供了一种广告插件识别方法,包括:
查找应用插件相关的各文件;
基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;
根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;
将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。
可选的,还包括:
通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。
可选的,还包括:
根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。
可选的,还包括:
在云端服务器将所述各特征向量维度下的特征数据构建的广告的特征向量集预编译为二进制的XML格式。
可选的,所述基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度包括:
根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据;
将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。
可选的,所述根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据包括:
扫描所述应用插件的安装包,从所述安装包获取所述广告的特征向量集中安装包维度下的各特征信息作为第一特征向量;
和/或,扫描所述配置文件,从所述配置文件中获取所述广告的特征向量集中配置信息维度下的各声明信息作为第一特征向量;
和/或,扫描所述可执行文件中的常量池,从所述常量池获取所述广告的特征向量集中常量池维度下的各字符串作为第一特征向量;
和/或,扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中包名和类名维度下的各包名和类名作为第一特征向量;
和/或,扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中类继承关系序列维度下的各类继承关系作为第一特征向量;
和/或,扫描所述可执行文件中的方法描述符,从所述方法描述符中获取所述广告的特征向量集中函数调用序列维度下的各函数调用序列作为第一特征向量。
可选的,所述将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度包括:
将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量对应的各种特征匹配条件进行匹配,根据匹配结果计算该特征维度下的特征向量相似度。
可选的,还包括:
记录对各应用插件扫描判断结果;当再次扫描时,根据对对各应用插件扫描判断结果的记录,跳过对已判断的应用插件的扫描。
可选的,所述的查找应用插件相关的各文件包括:
查找智能移动终端的应用平台中的应用插件相关的各文件。
可选的,判定所述应用插件是否为广告插件之后还包括:
检测所述广告插件对智能移动终端系统的操作行为。
依据本发明的另一个方面,还提供了一种广告插件识别系统,包括:
查找模块,适于查找应用插件相关的各文件;
特征扫描模块,适于基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;
广告相似度计算模块,适于根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;
判断模块,适于将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。
可选的,还包括:
云端服务器,所述云端服务器包括:
特征向量集构建模块,适于通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。
可选的,所述云端服务器还包括:
反馈补充模块,适于根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。
可选的,还包括:
特征向量集转换模块,适于在云端服务器将所述各特征向量维度下的特征数据构建的广告的特征向量集预编译为二进制的XML格式。
可选的,所述特征扫描模块包括:
特征数据提取模块,用于根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据;
特征数据分析模块,用于将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。
可选的,所述特征数据提取模块包括:
应用插件扫描模块,适于扫描所述应用插件的安装包,从所述安装包获取所述广告的特征向量集中安装包维度下的各特征信息作为第一特征向量;
和/或配置信息维度获取模块,适于扫描所述配置文件,从所述配置文件中获取与预置的广告的特征向量集中配置信息维度下的特征值相匹配的特征值;
和/或,常量池维度获取模块,适于扫描所述可执行文件中的常量池,从所述常量池获取与预置的广告的特征向量集中常量池维度下的各字符串相匹配的字符串;
和/或,包名和类名获取模块,适于扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中包名和类名维度下的各包名和类名作为第一特征向量;
和/或,类继承关系维度获取模块,适于扫描所述可执行文件中的类结构,从所述类结构中获取与预置的广告的特征向量集中类继承关系序列维度下的各类继承关系相匹配的类继承关系;
和/或,函数调用序列维度获取模块,适于扫描所述可执行文件中的方法描述符,从所述方法描述符中获取与预置的广告的特征向量集中函数调用序列维度下的各函数调用序列相匹配的函数调用序列。
可选的,所述特征数据分析模块包括:第一分析模块,食欲将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量对应的各种特征匹配条件进行匹配,根据匹配结果计算该特征维度下的特征向量相似度。
可选的,还包括:
记录模块,适于记录对各应用插件扫描判断结果;
进一步的,还包括快速扫描模块,适于当再次扫描时,根据对对各应用插件扫描判断结果的记录,跳过对已判断的应用插件的扫描。
可选的,所述查找模块包括:
第一查找模块,用于查找智能移动终端的应用平台中的应用插件相关的各文件。
可选的,还包括:行为检测模块,适于判定所述应用插件是否为广告插件之后,检测所述广告插件对智能移动终端系统的操作行为。
根据本发明的一种广告插件识别方法可以针对智能终端的应用插件分析各种特征维度下的特征数据,结合各种特征维度下的特征数据综合判断应用插件是否包括广告插件,由此解决了现有技术无法精确的识别广告插件,无法对混淆后的应用进行广告插件识别,广告插件识别率低的等问题,取得了有完善的特征识别规则,并可结合云端数据进行特征识别,实现了广告软件的精、准识别,对混淆后的广告软件代码具有较高的特征匹配识别能力,并且能够对识别出来的广告插件进行有效的行为检测的有益效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅适于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一的一种广告插件识别方法的流程示意图;
图2示出了根据本发明一个实施例的二的一种广告插件识别方法的流程示意图;
图3示出了根据本发明一个实施例的三的一种广告插件识别方法的结构示意图;
图4示出了根据本发明一个实施例四的一种广告插件识别系统的结构示意图;
图5示出了根据本发明一个实施例五的一种广告插件识别系统的结构示意图;以及
图6示出了根据本发明一个实施例六的一种广告插件识别系统的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
参照图1,其示出了本发明实施例一的一种广告插件识别方法的流程示意图,具体可以包括:
步骤110,查找应用插件相关的各文件;
在本发明实施例中,在识别时,对于新安装的应用插件,查找应用插件的安装包及安装包的释放位置的相关文件,比如一个应用的应用插件在手机存储于手机SD卡(Secure Digital Memory Card,安全数码卡),比如在的根目录下,为SD:\A文件,该应用插件安装后其释放的文件在手机SD卡的SD:\program\m1文件中,文件包括配置文件,可执行文件(比如.Dex文件,.Dex文件一般为Android安卓系统的执行文件。)
另外对于安装完毕被删除安装包的文件,可扫描应用插件安装释放位置的文件,比如配置文件,可执行文件等。
优选的,步骤110可以为:查找智能移动终端的中的应用插件相关的各文件中的应用插件相关的各文件。
即本申请针对智能移动终端中的应用插件。比如智能手机中的APP等插件。
步骤120,基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;
在本发明中,优选的,还包括:
步骤S100,通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。
在本发明实施例中,可预先由构建广告的特征向量集D(d1,d2,d3.....dn),其中n为特征向量个数,其中每个特征向量对应特征匹配条件,,比如:
1)常量池维度特征向量
通过字符串常量池识别插件特定的广告特征,比如说很多插件版本号的字符串、广告插件联网域名字符串都会保存在常量池。
那么该维度中,比如统计广告软件的常量池得到100个字符串,其中存在各种字符条件组合,比如字符串A且字符串B,字符串C或字符串D或字符串E,非字符串F,等字符串条件才能判断属于广告插件的常量值维度的特征向量。那么“字符串A且字符串B,字符串C或字符串D或字符串E,非字符串F”及为该特征向量的特征匹配条件。
2)包名和类名维度特征向量
广告插件都会包含特定包名和类名,通过该信息可以判定是否含有特定的广告插件。然而很多广告插件会随着广告应用宿主的混淆而混淆,所以包名与类型特征值的选取应该是不会混淆的类名,比如说插件中包含的服务等组件的类名,还有广告View的类名。
3)配置信息维度特征向量
清单文件及配置中声明的信息,有些广告插件会在该文件中声明需要的信息,根据该特征可以提高识别率。很多广告插件会在例如AndroidMenifest.xml或者自定义的配置文件中存放广告插件的AppKey等信息。其中AppKey是广告提供商提供给开发者的唯一性Id。
4)类继承关系序列维度特征向量
广告插件识别在特定应用场景下,可能需要精确识别程序安装包里面的广告组件,而不是是否包含广告。这时候有些组件可以继承自某个已知的广告组件,这时候根据继承关系序列可以判定是否为广告组件。
那么该维度中,比如统计用于识别广告软件的类继承关系为类a->类b->类c,或者类a->类b->类d,那么“类a->类b->类c,或者类a->类b->类d”即为该维度下的特征匹配条件。
5)函数调用序列维度特征向量
根据对程序代码进行扫描,可以确定函数调用序列,通过分析函数调用序列,确定是否包含可疑的广告发送行为。
那么该维度中,比如统计用于识别广告软件的函数调用序列为函数a->函数b->函数c+函数d,或者类f->类b>函数c+函数d,那么“函数a->函数b->函数c+函数d,或者类f->类b>函数c+函数d”即为该维度下的特征匹配条件。
6)安装包维度特征向量
比如例如对于已经确定为广告的插件,可以通过下发其安装包的md5来判定该特征。
上述特征向量可由云端对的广告插件样本库中的各应用插件样本进行分析和统计获得,比如对1)至5),可对每个应用插件进行如下分析:
扫描所述配置文件,从所述配置文件中获取所述广告的特征向量集中配置信息维度下的各声明信息作为第一特征向量;
扫描所述可执行文件中的常量池,从所述常量池获取所述广告的特征向量集中常量池维度下的各字符串作为第一特征向量;
扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中包名和类名维度下的各包名和类名作为第一特征向量;
扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中类继承关系序列维度下的各类继承关系作为第一特征向量;
扫描所述可执行文件中的方法描述符,从所述方法描述符中获取所述广告的特征向量集中函数调用序列维度下的各函数调用序列作为第一特征向量。
可执行文件,以.Dex文件为例,通过.Dex文件头部索引以及偏移值可以查找到类结构的位置,从而可在该结构中提取到包名和类名,以及根据每个类的父子继承关系可以查找到类继承关系,还可根据通过.Dex文件头部索引以及偏移值查找到方法描述符位置,方法描述符记录了该插件执行过程中各种方法的函数之间的调用关系,那么即可查找函数调用关系。
对于6),可以对用户量较多的广告软件运用云端数据实现特征语义分析,达到快速、准确识别的目的,1)至5)的几个特征识别方案可以适用于大部分情况。对于安装包特定的特征更多的是要结合云端数据,例如通过云端和用户的反馈,已经确定为广告的插件,可以通过下发其安装包的md5来判定是否为广告插件。
另外,还包括:
步骤S121,根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。
即可持续不断的接收用户对各种软件的反馈,根据反馈结果可将反馈为广告插件达到一定值的插件加入广告样本库,不断完善数据源,提高广告的特征向量集的准确度。
可选的,还包括:在云端服务器将所述各特征向量维度下的特征数据构建广告的特征向量集预编译为二进制的XML格式。
特征数据会预编译成二进制xml格式,首先会有较快的解析速度,适合于手机设备这样的低内存、低CPU的设备解析,再次因为会把xml文件中冗余的属性名、元素等字符串放在公共的字符串池中通过索引进行引用,可以大大减少数据文件的体积,适合于网络,特别是移动网络传输。在本发明实施例中,在构建了广告的特征向量集后,及可进行步骤120。
可选的,所述基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度包括:
步骤A11,根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据;
由于每种特征向量需要扫描指定文件或者指定位置才能获得,那么需要扫描预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据。
可选的,所述根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据包括:
步骤b11,扫描所述应用插件的安装包,从所述安装包获取所述广告的特征向量集中安装包维度下的各特征信息作为第一特征向量;
比如扫描应用插件对应的安装包,计算其md5值,将该md5值作为安装包维度下特征向量的特征值。
和/或,步骤b12,扫描所述配置文件,从所述配置文件中获取所述广告的特征向量集中配置信息维度下的各声明信息作为第一特征向量;
比如从扫描文件的安装包的释放位置,扫描该安装包释放得到的配置文件,比如AndroidMenifest.xml等配置文件,从中提取声明信息,比如AppKey,作为该维度下特征向量的特征值。
和/或,步骤b13,扫描所述可执行文件中的常量池,从所述常量池获取所述广告的特征向量集中常量池维度下的各字符串作为第一特征向量;
通过字符串常量池识别插件特定的广告特征,比如说很多插件版本号的字符串、广告插件联网域名字符串都会保存在常量池。那么本步骤获取插件版本号的字符串、广告插件联网域名字符串等字符串,作为该维度下特征向量的特征值。
和/或,步骤b14,扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中包名和类名维度下的各包名和类名作为第一特征向量;
比如扫描由应用插件安装包释放得到的.Dex文件,查找其中的类结构,从所述类结构中获取包名和类名,作为包名和类名维度下的特征向量的特征值。
和/或,步骤b15,扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中类继承关系序列维度下的各类继承关系作为第一特征向量;
比如扫描由应用插件安装包释放得到的.Dex文件,查找其中的类结构,从所述类结构中类的指向关系和继承关系,提取类继承关系序列,作为类继承关系序列维度的特征值。
和/或,步骤b16,扫描所述可执行文件中的方法描述符,从所述方法描述符中获取所述广告的特征向量集中函数调用序列维度下的各函数调用序列作为第一特征向量。
比如扫描由应用插件安装包释放得到的.Dex文件,查找其中的方法描述符,从所述方法描述符的记录函数调用关系,提取函数调用关系序列,作为函数调用关系序列维度的特征值。
步骤A12,将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。
在扫描得到各特征维度下的特征数据后,与广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。
可选的,所述将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度包括:
步骤b17,将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量对应的各种特征匹配条件进行匹配,根据匹配结果计算该特征维度下的特征向量相似度。
比如前述的对于广告的特征向量集中,常量池特征维度下的“符串A且字符串B,字符串C或字符串D或字符串E,非字符串F”匹配条件,扫描当前的应用插件的常量池得到字符串A、、C、N,那么完全符合匹配条件“”符串C或字符串D或字符串E,非字符串F,可计算相似度为2/3。
对于前述各种特征维度,计算得到每个特征维度i的特征向量相似度后,可得到该插件的特征向量相似度集S(s1,s2,si,...sn)(i=1,2...n),si取值范围为0到1,其中0为完全不相似,1为完全匹配。
步骤130,根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;
在本发明中,对于每个特征维度,可设置相应的特征识别权重,然后将特征向量相似度和相应的特征识别权重带入特征向量相似度计算函数f计算当前应用插件的广告相似度V。比如对于前述预置的广告的特征向量集D(d1,d2,d3.....dn),其中n为特征向量个数,可预置广告的特征向量集对应的权重W(w1,w2,w3....wn)。
特别的,实际测试扫描准确度,大部分条件下相似度计算函数f退化为使用加权平均数即可满足条件,也考虑到了加权平均数计算简单,快速,较少的浮点运算,适合于手机等智能移动终端设备,即:v=s1*w1+s2*w2+...+sn*wn。步骤140,将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。
本发明实施例中还可设置广告相似度阈值t,当v>t时,即可判断所述应用插件是否为广告插件。
可选的,还包括:
步骤C11,记录对各应用插件扫描判断结果;当再次扫描时,根据对对各应用插件扫描判断结果的记录,跳过对已判断的应用插件的扫描。
在本发明实施例中,可能存在智能移动终端重新安装本发明的系统的情况,或者存在重新安装已经安装过的应用插件的情况,那么上述情况中,则可对已经进行扫描判断的应用插件,利用记录的扫描判断结果进行快速扫描和判断。
本发明的应用的场景包括:
1)在最终用户在智能机上可以进行扫描,用户可以看到广告软件有哪些,有哪些行为,用户可以选择卸载该软件。也可以向广告拦截模块提供拦截数据。
2)在智能移动终端的平台上(比如应用市场)上可以对软件进行扫描,这样用户在下载安装前就可以了解到该软件是否为广告软件及其行为。
本发明实施例有完善的特征识别规则,并可结合云端数据进行特征识别,实现了广告软件的精、准识别,对混淆后的广告软件代码具有较高的特征匹配识别能力,提高了广告插件的识别率。
本发明实施例可以针对智能终端的应用插件分析各种特征维度下的特征数据,结合各种特征维度下的特征数据综合判断应用插件是否包括广告插件,由此解决了现有技术无法精确的识别广告插件,无法对混淆后的应用进行广告插件识别,广告插件识别率低的等问题,取得了有完善的特征识别规则,并可结合云端数据进行特征识别,实现了广告软件的精、准识别,对混淆后的广告软件代码具有较高的特征匹配识别能力,并且能够对识别出来的广告插件进行有效的行为检测的有益效果。
实施例二
参照图2,示出了根据本发明一个实施例的二的一种广告插件识别方法的流程示意图,具体可以包括:
步骤210,查找应用插件相关的各文件;
步骤220,基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;所述建广告的特征向量集由云端服务器构建并发送;
步骤230,根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;
步骤240,将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件;
步骤250,如果所述应用插件是广告插件,则检测所述广告插件对智能移动终端系统的操作行为。
在本发明实施例中步骤210至步骤240与实施例一的类似步骤基本类似,在此不再加以详述。
对于步骤250,本发明实施例中可设置广告行为分析引擎对广告插件进行行为检测。比如检测广告插件运行时是否请求从网络获取广告内容,是否提取用户的隐私信息,其传输隐私信息的目标是否为外部网络等。又比如,通过主动防御引擎实时监测广告软件的敏感API(Application ProgrammingInterface,应用程序编程接口)调用,比如调用读取短信内容的API;或者来自广告特征中对该插件行为的描述,比如函数调用序列的描述;或者通过对插件代码进行静态分析,是否调用敏感API,比如调用读取联系人的API。该行为检测可在智能移动终端中实时检测以通知给用户,也可在应用插件所在平台中预先检测,再通知给用户。
本发明实施例,在能有效识别广告插件的情况下,可针对性的对广告插件进行行为检测,可提示用户当前广告插件的广告行为。
当然,本发明也可拦截广告插件后续的操作行为,比如检测到调用读取短信内容的API后,本发明则拦截该广告插件对具体广告内容的调用,其他行为的处理方法类似。
本发明实施例有完善的特征识别规则,并可结合云端数据进行特征识别,实现了广告软件的精、准识别,对混淆后的广告软件代码具有较高的特征匹配识别能力,提高了广告插件的识别率,并且可进一步对广告插件的行为进行检测。
实施例三
参照图3,其示出了本发明实施例三的一种广告插件识别方法的流程示意图,具体可以包括:
步骤S200,构建广告的特征向量集;
步骤S210,查找智能移动终端的应用平台中的应用插件相关的各文件;
即本申请可针对在智能移动终端的应用平台中查找应用插件。比如智能手机的应用平台中的各种APP等。
步骤S220,基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;步骤S230,根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;
步骤S240,将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件;
步骤S250,如果所述应用插件是广告插件,则检测所述广告插件对智能移动终端系统的操作行为。
在用户的手机终端等智能移动终端下载被识别为广告插件的应用插件时,对用户进行提示,比如提示该应用插件为广告插件,其广告行为包括:调用短信、调用联系人等。
在本实施例中主要是在手机平台上对应用插件进行广告识别和处理,因此,如果对广告插件进行行为检测需要手机的实时信息时,可暂不检测该行为,其他检测方式与实施例二类似。
本实施例中的与实施例而类似的步骤原理也类似,在此不再详述。
本发明实施例有完善的特征识别规则,并可结合云端数据进行特征识别,实现了广告软件的精、准识别,对混淆后的广告软件代码具有较高的特征匹配识别能力,提高了广告插件的识别率,并且可再应用平台中预先对广告插件的行为进行检测。
实施例四
参照图4,示出了本发明实施例的四的一种广告插件识别系统的结构示意图,具体可以包括:
查找模块310,适于查找应用插件相关的各文件;
特征扫描模块320,适于基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;
广告相似度计算模块330,适于根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;
判断模块340,适于将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。
其中,所述查找模块包括:
第一查找模块,用于查找智能移动终端的应用平台中的应用插件相关的各文件。
可选的,还包括:
云端服务器,所述云端服务器包括:
特征向量集构建模块,适于通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。
可选的,所述云端服务器还包括:
反馈补充模块,适于根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。
可选的,还包括:
特征向量集转换模块,适于在云端服务器将所述各特征向量维度下的特征数据构建广告的特征向量集预编译为二进制的XML格式。
可选的,所述特征扫描模块包括:
特征数据提取模块,用于根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据;
特征数据分析模块,用于将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。
可选的,所述特征数据提取模块包括:
应用插件扫描模块,适于扫描所述应用插件的安装包,从所述安装包获取所述广告的特征向量集中安装包维度下的各特征信息作为第一特征向量;
和/或配置信息维度获取模块,适于扫描所述配置文件,从所述配置文件中获取与预置的广告的特征向量集中配置信息维度下的特征值相匹配的特征值;
和/或,常量池维度获取模块,适于扫描所述可执行文件中的常量池,从所述常量池获取与预置的广告的特征向量集中常量池维度下的各字符串相匹配的字符串;
和/或,包名和类名获取模块,适于扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中包名和类名维度下的各包名和类名作为第一特征向量;
和/或,类继承关系维度获取模块,适于扫描所述可执行文件中的类结构,从所述类结构中获取与预置的广告的特征向量集中类继承关系序列维度下的各类继承关系相匹配的类继承关系;
和/或,函数调用序列维度获取模块,适于扫描所述可执行文件中的方法描述符,从所述方法描述符中获取与预置的广告的特征向量集中函数调用序列维度下的各函数调用序列相匹配的函数调用序列。
可选的,所述特征数据分析模块包括:第一分析模块,食欲将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量对应的各种特征匹配条件进行匹配,根据匹配结果计算该特征维度下的特征向量相似度。
可选的,还包括:
记录模块,适于记录对各应用插件扫描判断结果;
进一步的,还包括快速扫描模块,适于当再次扫描时,根据对对各应用插件扫描判断结果的记录,跳过对已判断的应用插件的扫描。
实施例五
参照图5,示出了本发明实施例五的一种广告插件识别系统的结构示意图,具体可以包括:
智能移动终端410和云端服务器420;
所述智能移动终端包括:
查找模块411,适于查找应用插件相关的各文件;
特征扫描模块412,适于基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;
广告相似度计算模块413,适于根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;
判断模块414,适于将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件:
行为检测模块415,适于判定所述应用插件是否为广告插件之后,检测所述广告插件对智能移动终端系统的操作行为。
本实施例与实施例四类似,在此不再详述。
实施例六,示出了本发明实施例五的一种广告插件识别系统的结构示意图,具体可以包括:
智能移动终端S410和云端服务器S420;
所述云端服务器S420包括:
向量集构建模块S421,适于构建广告的特征向量集。
查找模块S422,适于查找应用插件相关的各文件;
特征扫描模块S423,适于基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;
广告相似度计算模块S424,适于根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;
判断模块S425,适于将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件:
行为检测模块S426,适于判定所述应用插件是否为广告插件之后,检测所述广告插件对智能移动终端系统的操作行为。
在智能移动终端中,在智能移动终端下载被识别为广告插件的应用插件时,对用户进行提示。
本实施例与实施例五类似,在此不再详述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一种广告插件识别设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为适于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明还公开了A1、一种广告插件识别方法,包括:查找应用插件相关的各文件;基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。
A2、如A1所述的方法,还包括:通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。
A3、如A2所述的方法,还包括:根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。
A4、如A2所述的方法,还包括:在云端服务器将所述各特征向量维度下的特征数据构建的广告的特征向量集预编译为二进制的XML格式。
A5、如A1所述的方法,所述基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度包括:根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据;将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。
A6、如A5所述的方法,所述根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据包括:扫描所述应用插件的安装包,从所述安装包获取所述广告的特征向量集中安装包维度下的各特征信息作为第一特征向量;和/或,扫描所述配置文件,从所述配置文件中获取所述广告的特征向量集中配置信息维度下的各声明信息作为第一特征向量;和/或,扫描所述可执行文件中的常量池,从所述常量池获取所述广告的特征向量集中常量池维度下的各字符串作为第一特征向量;和/或,扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中包名和类名维度下的各包名和类名作为第一特征向量;和/或,扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中类继承关系序列维度下的各类继承关系作为第一特征向量;和/或,扫描所述可执行文件中的方法描述符,从所述方法描述符中获取所述广告的特征向量集中函数调用序列维度下的各函数调用序列作为第一特征向量。
A7、如A6所述的方法,所述将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度包括:将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量对应的各种特征匹配条件进行匹配,根据匹配结果计算该特征维度下的特征向量相似度。
A8、如A1所述的方法,还包括:记录对各应用插件扫描判断结果;当再次扫描时,根据对对各应用插件扫描判断结果的记录,跳过对已判断的应用插件的扫描。
A9、如A1所述的方法,所述的查找应用插件相关的各文件包括:查找智能移动终端的应用平台中的应用插件相关的各文件。
A10、如A1所述的方法,判定所述应用插件是否为广告插件之后还包括:检测所述广告插件对智能移动终端系统的操作行为。
本发明还公开了B11、一种广告插件识别系统,包括:查找模块,适于查找应用插件相关的各文件;特征扫描模块,适于基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;广告相似度计算模块,适于根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;判断模块,适于将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。
B12、如B11所述的系统,还包括:云端服务器,所述云端服务器包括:特征向量集构建模块,适于通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。
B13、如B12所述的系统,所述云端服务器还包括:反馈补充模块,适于根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。
B14、如B12所述的系统,还包括:特征向量集转换模块,适于在云端服务器将所述各特征向量维度下的特征数据构建的广告的特征向量集预编译为二进制的XML格式。
B15、如B11所述的系统,所述特征扫描模块包括:特征数据提取模块,用于根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据;特征数据分析模块,用于将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。
B16、如B15所述的系统,所述特征数据提取模块包括:应用插件扫描模块,适于扫描所述应用插件的安装包,从所述安装包获取所述广告的特征向量集中安装包维度下的各特征信息作为第一特征向量;和/或配置信息维度获取模块,适于扫描所述配置文件,从所述配置文件中获取与预置的广告的特征向量集中配置信息维度下的特征值相匹配的特征值;和/或,常量池维度获取模块,适于扫描所述可执行文件中的常量池,从所述常量池获取与预置的广告的特征向量集中常量池维度下的各字符串相匹配的字符串;和/或,包名和类名获取模块,适于扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中包名和类名维度下的各包名和类名作为第一特征向量;和/或,类继承关系维度获取模块,适于扫描所述可执行文件中的类结构,从所述类结构中获取与预置的广告的特征向量集中类继承关系序列维度下的各类继承关系相匹配的类继承关系;和/或,函数调用序列维度获取模块,适于扫描所述可执行文件中的方法描述符,从所述方法描述符中获取与预置的广告的特征向量集中函数调用序列维度下的各函数调用序列相匹配的函数调用序列。
B17、如B15所述的系统,所述特征数据分析模块包括:第一分析模块,食欲将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量对应的各种特征匹配条件进行匹配,根据匹配结果计算该特征维度下的特征向量相似度。
B18、如B11所述的系统,还包括:记录模块,适于记录对各应用插件扫描判断结果;进一步的,还包括快速扫描模块,适于当再次扫描时,根据对对各应用插件扫描判断结果的记录,跳过对已判断的应用插件的扫描。
B19、如B11所述的系统,所述查找模块包括:第一查找模块,用于查找智能移动终端的应用平台中的应用插件相关的各文件。
B20、如B11所述的系统,还包括行为检测模块,适于判定所述应用插件是否为广告插件之后,检测所述广告插件对智能移动终端系统的操作行为。

Claims (10)

1.一种广告插件识别方法,包括:
查找应用插件相关的各文件;
基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;
根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;
将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。
2.如权利要求1所述的方法,还包括:
通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。
3.如权利要求2所述的方法,还包括:
根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。
4.如权利要求2所述的方法,还包括:
在云端服务器将所述各特征向量维度下的特征数据构建的广告的特征向量集预编译为二进制的XML格式。
5.如权利要求1所述的方法,所述基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度包括:
根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据;
将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。
6.一种广告插件识别系统,包括:
查找模块,适于查找应用插件相关的各文件;
特征扫描模块,适于基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;
广告相似度计算模块,适于根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;
判断模块,适于将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。
7.如权利要求6所述的系统,还包括:
云端服务器,所述云端服务器包括:
特征向量集构建模块,适于通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。
8.如权利要求7所述的系统,所述云端服务器还包括:
反馈补充模块,适于根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。
9.如权利要求7所述的系统,还包括:
特征向量集转换模块,适于在云端服务器将所述各特征向量维度下的特征数据构建的广告的特征向量集预编译为二进制的XML格式。
10.如权利要求6所述的系统,所述特征扫描模块包括:
特征数据提取模块,用于根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据;
特征数据分析模块,用于将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。
CN201310119812.3A 2013-04-08 2013-04-08 一种广告插件识别的方法和装置 Expired - Fee Related CN103226583B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310119812.3A CN103226583B (zh) 2013-04-08 2013-04-08 一种广告插件识别的方法和装置
PCT/CN2014/071596 WO2014166312A1 (zh) 2013-04-08 2014-01-27 一种广告插件识别的方法和系统
US14/783,042 US9824212B2 (en) 2013-04-08 2014-01-27 Method and system for recognizing advertisement plug-ins

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310119812.3A CN103226583B (zh) 2013-04-08 2013-04-08 一种广告插件识别的方法和装置

Publications (2)

Publication Number Publication Date
CN103226583A true CN103226583A (zh) 2013-07-31
CN103226583B CN103226583B (zh) 2017-07-28

Family

ID=48837029

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310119812.3A Expired - Fee Related CN103226583B (zh) 2013-04-08 2013-04-08 一种广告插件识别的方法和装置

Country Status (3)

Country Link
US (1) US9824212B2 (zh)
CN (1) CN103226583B (zh)
WO (1) WO2014166312A1 (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942487A (zh) * 2014-04-11 2014-07-23 珠海市君天电子科技有限公司 积分墙信息的获取方法及装置
WO2014166312A1 (zh) * 2013-04-08 2014-10-16 北京奇虎科技有限公司 一种广告插件识别的方法和系统
CN104281473A (zh) * 2014-09-22 2015-01-14 深圳市金立通信设备有限公司 一种插件的处理方法
CN104424200A (zh) * 2013-08-21 2015-03-18 贝壳网际(北京)安全技术有限公司 广告信息处理方法和装置
CN104598815A (zh) * 2013-10-30 2015-05-06 贝壳网际(北京)安全技术有限公司 恶意广告程序的识别方法、装置及客户端
CN105117643A (zh) * 2015-09-23 2015-12-02 北京金山安全软件有限公司 一种处理弹窗的方法及装置
CN105373728A (zh) * 2014-09-01 2016-03-02 深圳富泰宏精密工业有限公司 广告提示系统及方法
CN105488406A (zh) * 2014-12-29 2016-04-13 哈尔滨安天科技股份有限公司 一种基于特征向量的相似恶意样本匹配方法及系统
CN105512558A (zh) * 2016-01-07 2016-04-20 北京邮电大学 一种基于反编译模块特征的android广告插件检测方法
CN105528212A (zh) * 2015-12-05 2016-04-27 中国航空工业集团公司洛阳电光设备研究所 检测仪接口板卡驱动接口的通用化处理方法
CN105912935A (zh) * 2016-05-03 2016-08-31 腾讯科技(深圳)有限公司 广告检测方法及广告检测装置
CN106096394A (zh) * 2016-06-16 2016-11-09 北京奇虎科技有限公司 一种安卓应用的广告拦截方法和装置
CN106845787A (zh) * 2016-12-26 2017-06-13 大唐软件技术股份有限公司 一种数据自动交换方法及装置
CN107111433A (zh) * 2014-12-30 2017-08-29 三星电子株式会社 具有访问管理机制的电子系统及操作该电子系统的方法
CN107273142A (zh) * 2017-07-12 2017-10-20 北京潘达互娱科技有限公司 程序更新方法、程序运行方法及装置
CN108334775A (zh) * 2018-01-23 2018-07-27 阿里巴巴集团控股有限公司 一种越狱插件检测方法及装置
CN109034781A (zh) * 2018-06-27 2018-12-18 美味不用等(上海)信息科技股份有限公司 一种收银系统识别方法、识别装置及计算机可读存储介质
CN110399729A (zh) * 2019-04-11 2019-11-01 国家计算机网络与信息安全管理中心 一种基于组件特征权重的二进制软件分析方法
CN111159493A (zh) * 2019-12-25 2020-05-15 乐山师范学院 一种基于特征权重的网络数据相似度计算方法与系统
CN111177545A (zh) * 2019-12-24 2020-05-19 百度国际科技(深圳)有限公司 广告投放方法、平台、电子设备及存储介质
CN112527302A (zh) * 2019-09-19 2021-03-19 北京字节跳动网络技术有限公司 错误检测的方法及装置、终端和存储介质

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9336539B2 (en) * 2014-04-03 2016-05-10 Vungle, Inc. Systems and methods for providing advertising services in a predictive manner to devices with an advertising exchange
US9336538B2 (en) * 2014-04-03 2016-05-10 Vungle, Inc. Systems and methods for providing advertising services to devices with an advertising exchange
KR102431266B1 (ko) * 2015-09-24 2022-08-11 삼성전자주식회사 통신 시스템에서 정보 보호 장치 및 방법
CN106991323A (zh) * 2017-03-10 2017-07-28 中时瑞安(北京)网络科技有限责任公司 一种检测Android应用程序广告插件的模型和方法
US10089467B1 (en) * 2017-05-23 2018-10-02 Malwarebytes Inc. Static anomaly-based detection of malware files
CN110213220B (zh) * 2018-12-26 2022-03-04 腾讯科技(深圳)有限公司 检测流量数据的方法、装置、电子设备及计算机存储介质
CN111930277B (zh) * 2020-07-02 2022-07-12 上海连尚网络科技有限公司 一种用于提供呈现信息的方法与设备
CN115828227B (zh) * 2023-01-05 2023-07-07 荣耀终端有限公司 识别广告弹窗的方法、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102025636A (zh) * 2010-12-09 2011-04-20 北京星网锐捷网络技术有限公司 报文特征处理方法、装置及网络设备
CN102708320A (zh) * 2012-05-04 2012-10-03 奇智软件(北京)有限公司 一种病毒apk的识别方法及装置
WO2012167056A2 (en) * 2011-06-01 2012-12-06 Mcafee, Inc. System and method for non-signature based detection of malicious processes
CN102831338A (zh) * 2012-06-28 2012-12-19 北京奇虎科技有限公司 一种Android应用程序的安全检测方法及系统
CN102833347A (zh) * 2012-09-10 2012-12-19 辜进荣 基于云平台的移动终端广告
KR101214893B1 (ko) * 2011-12-16 2013-01-09 주식회사 안랩 어플리케이션의 유사성 검출 장치 및 방법

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8019700B2 (en) * 2007-10-05 2011-09-13 Google Inc. Detecting an intrusive landing page
US8428367B2 (en) * 2007-10-26 2013-04-23 International Business Machines Corporation System and method for electronic document classification
US8516590B1 (en) * 2009-04-25 2013-08-20 Dasient, Inc. Malicious advertisement detection and remediation
CN102222199B (zh) * 2011-06-03 2013-05-08 奇智软件(北京)有限公司 应用程序身份识别方法及系统
US8688309B2 (en) * 2011-12-12 2014-04-01 International Business Machines Corporation Active and stateful hyperspectral vehicle evaluation
CN102799605B (zh) * 2012-05-02 2016-03-23 天脉聚源(北京)传媒科技有限公司 一种广告监播方法和系统
US9407443B2 (en) * 2012-06-05 2016-08-02 Lookout, Inc. Component analysis of software applications on computing devices
CN103226583B (zh) * 2013-04-08 2017-07-28 北京奇虎科技有限公司 一种广告插件识别的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102025636A (zh) * 2010-12-09 2011-04-20 北京星网锐捷网络技术有限公司 报文特征处理方法、装置及网络设备
WO2012167056A2 (en) * 2011-06-01 2012-12-06 Mcafee, Inc. System and method for non-signature based detection of malicious processes
KR101214893B1 (ko) * 2011-12-16 2013-01-09 주식회사 안랩 어플리케이션의 유사성 검출 장치 및 방법
CN102708320A (zh) * 2012-05-04 2012-10-03 奇智软件(北京)有限公司 一种病毒apk的识别方法及装置
CN102831338A (zh) * 2012-06-28 2012-12-19 北京奇虎科技有限公司 一种Android应用程序的安全检测方法及系统
CN102833347A (zh) * 2012-09-10 2012-12-19 辜进荣 基于云平台的移动终端广告

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DO2JIANG: "Android系统扫描带广告应用的方法", 《HTTP://BLOG.CSDN.NET/DO2JIANG/ARTICLE/DETAILS/8492329》 *
李焕洲 等: "基于行为特征库的木马检测模型设计", 《四川师范大学学报(自然科学版)》 *
红黑联盟: "Android系统扫描带广告应用的方法", 《HTTP://WWW.2CTO.COM/KF/201301/182717.HTML》 *

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014166312A1 (zh) * 2013-04-08 2014-10-16 北京奇虎科技有限公司 一种广告插件识别的方法和系统
CN104424200A (zh) * 2013-08-21 2015-03-18 贝壳网际(北京)安全技术有限公司 广告信息处理方法和装置
CN104598815B (zh) * 2013-10-30 2018-09-11 北京猎豹移动科技有限公司 恶意广告程序的识别方法、装置及客户端
CN104598815A (zh) * 2013-10-30 2015-05-06 贝壳网际(北京)安全技术有限公司 恶意广告程序的识别方法、装置及客户端
CN103942487A (zh) * 2014-04-11 2014-07-23 珠海市君天电子科技有限公司 积分墙信息的获取方法及装置
CN103942487B (zh) * 2014-04-11 2017-06-27 珠海市君天电子科技有限公司 积分墙信息的获取方法及装置
CN105373728A (zh) * 2014-09-01 2016-03-02 深圳富泰宏精密工业有限公司 广告提示系统及方法
CN104281473A (zh) * 2014-09-22 2015-01-14 深圳市金立通信设备有限公司 一种插件的处理方法
CN105488406A (zh) * 2014-12-29 2016-04-13 哈尔滨安天科技股份有限公司 一种基于特征向量的相似恶意样本匹配方法及系统
CN105488406B (zh) * 2014-12-29 2019-02-26 哈尔滨安天科技股份有限公司 一种基于特征向量的相似恶意样本匹配方法及系统
CN107111433A (zh) * 2014-12-30 2017-08-29 三星电子株式会社 具有访问管理机制的电子系统及操作该电子系统的方法
CN105117643A (zh) * 2015-09-23 2015-12-02 北京金山安全软件有限公司 一种处理弹窗的方法及装置
CN105117643B (zh) * 2015-09-23 2018-02-23 北京金山安全软件有限公司 一种处理弹窗的方法及装置
CN105528212A (zh) * 2015-12-05 2016-04-27 中国航空工业集团公司洛阳电光设备研究所 检测仪接口板卡驱动接口的通用化处理方法
CN105528212B (zh) * 2015-12-05 2019-08-09 中国航空工业集团公司洛阳电光设备研究所 检测仪接口板卡驱动接口的通用化处理方法
CN105512558A (zh) * 2016-01-07 2016-04-20 北京邮电大学 一种基于反编译模块特征的android广告插件检测方法
WO2017190617A1 (zh) * 2016-05-03 2017-11-09 腾讯科技(深圳)有限公司 广告检测方法及广告检测装置、存储介质
US11334908B2 (en) 2016-05-03 2022-05-17 Tencent Technology (Shenzhen) Company Limited Advertisement detection method, advertisement detection apparatus, and storage medium
CN105912935B (zh) * 2016-05-03 2019-06-14 腾讯科技(深圳)有限公司 广告检测方法及广告检测装置
CN105912935A (zh) * 2016-05-03 2016-08-31 腾讯科技(深圳)有限公司 广告检测方法及广告检测装置
CN106096394A (zh) * 2016-06-16 2016-11-09 北京奇虎科技有限公司 一种安卓应用的广告拦截方法和装置
CN106845787A (zh) * 2016-12-26 2017-06-13 大唐软件技术股份有限公司 一种数据自动交换方法及装置
CN107273142A (zh) * 2017-07-12 2017-10-20 北京潘达互娱科技有限公司 程序更新方法、程序运行方法及装置
CN108334775A (zh) * 2018-01-23 2018-07-27 阿里巴巴集团控股有限公司 一种越狱插件检测方法及装置
CN109034781B (zh) * 2018-06-27 2022-02-22 美味不用等(上海)信息科技股份有限公司 一种收银系统识别方法、识别装置及计算机可读存储介质
CN109034781A (zh) * 2018-06-27 2018-12-18 美味不用等(上海)信息科技股份有限公司 一种收银系统识别方法、识别装置及计算机可读存储介质
CN110399729B (zh) * 2019-04-11 2021-04-27 国家计算机网络与信息安全管理中心 一种基于组件特征权重的二进制软件分析方法
CN110399729A (zh) * 2019-04-11 2019-11-01 国家计算机网络与信息安全管理中心 一种基于组件特征权重的二进制软件分析方法
CN112527302A (zh) * 2019-09-19 2021-03-19 北京字节跳动网络技术有限公司 错误检测的方法及装置、终端和存储介质
CN112527302B (zh) * 2019-09-19 2024-03-01 北京字节跳动网络技术有限公司 错误检测的方法及装置、终端和存储介质
CN111177545A (zh) * 2019-12-24 2020-05-19 百度国际科技(深圳)有限公司 广告投放方法、平台、电子设备及存储介质
CN111177545B (zh) * 2019-12-24 2023-06-09 百度国际科技(深圳)有限公司 广告投放方法、平台、电子设备及存储介质
CN111159493A (zh) * 2019-12-25 2020-05-15 乐山师范学院 一种基于特征权重的网络数据相似度计算方法与系统

Also Published As

Publication number Publication date
US20160063244A1 (en) 2016-03-03
WO2014166312A1 (zh) 2014-10-16
CN103226583B (zh) 2017-07-28
US9824212B2 (en) 2017-11-21

Similar Documents

Publication Publication Date Title
CN103226583A (zh) 一种广告插件识别的方法和装置
CN108763928B (zh) 一种开源软件漏洞分析方法、装置和存储介质
US9619650B2 (en) Method and device for identifying virus APK
CN102708320B (zh) 一种病毒apk的识别方法及装置
US20150052611A1 (en) Method and device for extracting characteristic code of apk virus
CN103473506A (zh) 用于识别恶意apk文件的方法和装置
US20170214704A1 (en) Method and device for feature extraction
KR20160109870A (ko) 안드로이드 멀웨어의 고속 검색 시스템 및 방법
CN104143008A (zh) 基于图片匹配检测钓鱼网页的方法及装置
CN103685307A (zh) 基于特征库检测钓鱼欺诈网页的方法及系统、客户端、服务器
CN104021339A (zh) 移动终端的安全支付方法及装置
CN105357204B (zh) 生成终端识别信息的方法及装置
CN103986731A (zh) 通过图片匹配来检测钓鱼网页的方法及装置
KR20120078018A (ko) 파일 유전자 지도를 이용하여 파일의 악성코드 포함 여부를 판단하는 방법 및 시스템
CN104317599A (zh) 检测安装包是否被二次打包的方法和装置
CN104517054A (zh) 一种检测恶意apk的方法、装置、客户端和服务器
CN103559447B (zh) 一种基于病毒样本特征的检测方法、检测装置及检测系统
CN115221516B (zh) 恶意应用程序识别方法及装置、存储介质、电子设备
KR102095853B1 (ko) 바이러스 데이터베이스 획득 방법 및 기기, 장비, 서버 그리고 시스템
CN104462985A (zh) bat漏洞的检测方法以及装置
CN104836896A (zh) 对电话号码进行纠错提示的方法及装置
CN111339531B (zh) 恶意代码的检测方法、装置、存储介质及电子设备
CN109815697A (zh) 误报行为处理方法及装置
CN110858247A (zh) 安卓恶意应用检测方法、系统、设备及存储介质
CN106874762B (zh) 基于api依赖关系图的安卓恶意代码检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220718

Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170728