CN105468975B

CN105468975B - 恶意代码误报的追踪方法、装置及系统

Info

Publication number: CN105468975B
Application number: CN201510860629.8A
Authority: CN
Inventors: 华元彬; 卞松山; 张彦功; 陈宇龙; 刘福新
Original assignee: Beijing Qihoo Technology Co Ltd; Qizhi Software Beijing Co Ltd
Current assignee: Beijing Qihoo Technology Co Ltd
Priority date: 2015-11-30
Filing date: 2015-11-30
Publication date: 2018-02-23
Anticipated expiration: 2035-11-30
Also published as: CN105468975A

Abstract

本发明实施例公开了一种恶意代码误报的追踪方法、装置及系统，其中，恶意代码误报的追踪方法包括：获取恶意代码误报样本；将所述恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本；根据所述相似误报样本确定导致恶意代码误报的样本特征。本发明通过将获取的恶意代码误报样本与误报样本库中的样本进行相似度匹配，确定恶意代码误报样本的相似误报样本，进而确定导致恶意代码误报的样本特征，查明了导致恶意代码误报的原因。

Description

恶意代码误报的追踪方法、装置及系统

技术领域

本发明涉及互联网技术，尤其是一种恶意代码误报的追踪方法、装置及系统。

背景技术

恶意代码(Malicious code)也称为恶意软件(Malware)。恶意代码为“运行在计算机上，使系统按照攻击者意愿执行任务的一组指令”。恶意代码通过将指令在隐蔽自身的条件下嵌入到其他代码中，从而达到破坏被感染计算机上的数据信息的完整性、运行具有入侵性的程序的目的。恶意代码的类型包括计算机病毒(Virus)、蠕虫(Worm)、特洛伊木马(Trojan horse)、僵尸网络(Botnet)、间谍网络(spyware)、后门(Backdoor)、Rootkitsd等。

当前计算机恶意代码正以惊人的速度蔓延开来，对计算机系统的安全构成了严重的威胁。早期的反病毒软件利用恶意代码的特征码这一静态特征来识别和检测隐藏在系统中的恶意代码，起到了一定的效果，但需要实时更新恶意代码的特征码数据库，严重占用系统资源。对于新出现的未知恶意代码更是无能为力。原因一方面是新恶意代码层出不穷；另一方面，许多恶意代码还在不停衍生出新的变种。

为了识别恶意代码，360研发了QVM引擎(Qihoo Support Vector Machine，人工智能引擎)，其为一种比较新颖的恶意代码的提醒与查杀机制，具体为：先准备病毒样本和正常程序样本，然后利用人工智能的方法，通过学习病毒样本和正常代码样本，产生一个模型，然后利用模型去判断未知代码是否为恶意代码，从而实现对用户端中恶意代码的提醒与查杀。

然而，任何恶意代码的判断机制都不可能达到100％的准确率，无法绝对准确的对恶意代码进行判断，而恶意代码的误报易对用户造成不必要的困扰。

因此，如何快速、准确的确定恶意代码误报的原因，以及降低恶意代码的误报率成为当前亟待解决的问题之一。

发明内容

本申请实施例提供了一种恶意代码误报的追踪方法、装置及系统，以解决现有恶意代码的判断机制无法绝对准确的对恶意代码进行判断，恶意代码误报的原因不明，易对用户造成不必要的困扰的技术问题。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

根据本申请实施例的一个方面，提供了恶意代码误报的追踪方法，该恶意代码误报的追踪方法包括：

获取恶意代码误报样本；

将所述恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本；

根据所述相似误报样本确定导致恶意代码误报的样本特征。

在基于上述方法的另一个实施例中，形成所述误报样本库包括：

获取恶意代码误报的统计样本；

根据所述恶意代码误报的统计样本，获取恶意代码误报样本及其对应的样本特征；

将所述恶意代码误报样本及其对应的样本特征关联存储，形成误报样本库。

在基于上述方法的另一个实施例中，根据所述恶意代码误报的统计样本，获取恶意代码误报样本及其对应的样本特征包括：

对所述恶意代码误报的统计样本进行样本筛选，确定恶意代码误报的学习样本；

获取所述恶意代码误报的学习样本的样本特征；

根据所获取的样本特征进行样本推演，获取与所述样本特征对应的恶意代码误报样本。

在基于上述方法的另一个实施例中，将所述恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本包括：

将所述恶意代码误报样本分别与误报样本库中每个样本进行比较，获取所述恶意代码误报样本与误报样本库中的每个样本的相似度值；

判断每个所述相似度值是否大于相似度阈值；

若大于，则将该相似度值对应的误报样本库中样本确定为相似误报样本。

在基于上述方法的另一个实施例中，将所述恶意代码误报样本分别与误报样本库中每个样本进行比较，获取所述恶意代码误报样本与误报样本库中每个样本的相似度值包括：

将所述恶意代码误报样本的源代码分别与误报样本库中每个样本的源代码进行比较，获取所述恶意代码误报样本与误报样本库中每个样本的相似度值；或者

将所述恶意代码误报样本中的核心代码分别与误报样本库中每个样本中的核心代码进行比较，获取所述恶意代码误报样本与误报样本库中每个样本的相似度值；或者

将所述恶意代码误报样本的源代码进行切片，以及将误报样本库中每个样本的源代码进行切片，通过消息摘要算法第五版MD5分别对所述恶意代码误报样本的切片与误报样本库中每个样本的对应切片进行计算，获取两个对应切片的MD5值，比较两个对应切片的MD5值之间的相似度，获取所述恶意代码误报样本与误报样本库中每个样本的相似度值。

在基于上述方法的另一个实施例中，所述恶意代码误报的追踪方法还包括：根据新获取的恶意代码误报样本，对所述误报样本库进行更新。

在基于上述方法的另一个实施例中，在根据所述相似误报样本确定导致恶意代码误报的样本特征之后，所述恶意代码误报的追踪方法还包括：

将导致恶意代码误报的所述样本特征发送至QVM引擎；

所述QVM引擎根据导致恶意代码误报的所述样本特征，修改QVM引擎的黑名单中恶意代码样本的黑白属性，以及在QVM引擎的白名单中添加非恶意代码样本。

在基于上述方法的另一个实施例中，所述恶意代码误报样本由移动终端在发生恶意代码误报时提交；

在获取恶意代码误报样本之后，所述恶意代码误报的追踪方法还包括：

查找所述移动终端中与其提交恶意代码误报样本对应的其他版本样本；

对移动终端中所述恶意代码误报样本及其对应的其他版本样本进行筛选，确定提交恶意代码误报的第一样本集合；

将所述第一样本集合中每个样本与误报样本库中的样本进行相似度匹配，获取所述第一样本集合中每个样本的相似误报样本。

在基于上述方法的另一个实施例中，在反查周期内，查找所述移动终端中与其提交恶意代码误报样本对应的其他版本样本。

在基于上述方法的另一个实施例中，所述恶意代码误报样本由个人电脑在发生恶意代码误报时提交；

根据本发明实施例的另一个方面，提供一种恶意代码误报的追踪装置，包括：

获取单元，用于获取恶意代码误报样本；

匹配单元，用于将所述恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本；

追踪单元，用于根据所述相似误报样本确定导致恶意代码误报的样本特征。

根据本发明实施例的一个方面，提供一种恶意代码误报的追踪系统，包括任一上述的恶意代码误报的追踪装置。

在本申请实施例中，先获取恶意代码误报样本；接着将恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本；再接着根据相似误报样本确定导致恶意代码误报的样本特征。通过将获取的恶意代码误报样本与误报样本库中的样本进行相似度匹配，确定恶意代码误报样本的相似误报样本，进而确定导致恶意代码误报的样本特征，查明了导致恶意代码误报的原因。

另外，在确定导致恶意代码误报的样本特征之后，还将导致恶意代码误报的样本特征发送至QVM引擎；方便QVM引擎根据导致恶意代码误报的样本特征，修改QVM引擎的黑名单中恶意代码样本的黑白属性，以及在QVM引擎的白名单中添加非恶意代码样本，进而提高QVM引擎在后续恶意代码判断过程的效率和准确率，有效减少恶意代码误报对用户造成的困扰。

附图说明

构成说明书的一部分的附图描述了本发明的实施例，并且连同描述一起用于解释本发明的原理。

参照附图，根据下面的详细描述，可以更加清楚地理解本发明，其中：

图1为本发明一实施例中的恶意代码误报的追踪方法的流程图；

图2为图1实施例中形成误报样本库的流程图；

图3为本发明另一实施例中的恶意代码误报的追踪方法的流程图；

图4为本发明一实施例中的恶意代码误报的追踪装置的示意图；

图5为本发明另一实施例中的恶意代码误报的追踪装置的示意图；

图6为本发明又一实施例中的恶意代码误报的追踪装置的示意图；

图7为本发明一实施例中的恶意代码误报的追踪系统的示意图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

同时，应当明白，为了便于描述，附图中所示出的每个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

图1为本发明一实施例中的恶意代码误报的追踪方法的流程图。图1中恶意代码误报的追踪方法包括：

S102，获取恶意代码误报样本；

S104，将恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本；

S106，根据相似误报样本确定导致恶意代码误报的样本特征。

恶意代码是指存放恶意代码的文件实体形态，其可以是独立的恶意代码载体文件，被感染型恶意代码感染后的文件对象，也可以是非文件载体恶意代码的文件镜像(包括但不限于引导性病毒的文件镜像、内存恶意代码的文件镜像、以及网络恶意代码的数据包文件)。本实施例中，恶意代码误报样本为客户端(计算机或移动终端)在接收到杀毒引擎(如360提供的QVM引擎)发送的恶意代码提醒之后，又获知该恶意代码提醒对应的文件实质上并非恶意代码时，客户端提供的与恶意代码提醒对应的文件。

本实施例中，可以通过客户端-服务器(Client-Server)架构来获取恶意代码误报样本。

本发明实施例中误报样本库中的样本都是根据已获取的恶意代码误报样本而形成的，因此，可将恶意代码误报样本与误报样本库中的样本进行相似度匹配。

在一个实施例中，图1中S104将所述恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本可进一步包括：将所述恶意代码误报样本分别与误报样本库中每个样本进行比较，获取所述恶意代码误报样本与误报样本库中的每个样本的相似度值；判断每个所述相似度值是否大于相似度阈值；若大于，则将该相似度值对应的误报样本库中样本确定为相似误报样本。

本实施例中，将所述恶意代码误报样本分别与误报样本库中每个样本进行比较，获取所述恶意代码误报样本与误报样本库中每个样本的相似度值可进一步包括：

本实施例中，通过先获取恶意代码误报样本；接着将恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本；再接着根据相似误报样本确定导致恶意代码误报的样本特征。通过将获取的恶意代码误报样本与误报样本库中的样本进行相似度匹配，确定恶意代码误报样本的相似误报样本，进而确定导致恶意代码误报的样本特征，查明导致恶意代码误报的原因。

图2为图1实施例中形成误报样本库的流程图。图1实施例中S104的误报样本库可通过如下步骤形成：

S202，获取恶意代码误报的统计样本；

S204，根据恶意代码误报的统计样本，获取恶意代码误报样本及其对应的样本特征；

S206，将恶意代码误报样本及其对应的样本特征关联存储，形成误报样本库。

本实施例中，恶意代码误报的统计样本为从客户端收集的多个恶意代码误报样本。

为了提高误报样本库中样本的分散度，本实施例中S204可进一步包括：对恶意代码误报的统计样本进行样本筛选，确定恶意代码误报的学习样本；获取恶意代码误报的学习样本的样本特征；根据所获取的样本特征进行样本推演，获取与样本特征对应的恶意代码误报样本。

具体的，在获取恶意代码误报的学习样本的样本特征过程中，可以采用对PE(Portable Execute)结构分块或者采用N-gram算法统计特征，计算特征的信息增益，选择前N项作为样本特征。

由于近年来对软件加壳或保护日益盛行，获取基本的PE内部信息日益困难，为了有效还原恶意代码误报的学习样本的信息，在采用对PE结构分块获取样本特征时，对常见的壳可采用静态脱壳技术，对非常见的壳可采用虚拟机脱壳。

由于本发明实施例相似误报样本获取过程中，需将恶意代码误报样本与误报样本库中的样本进行相似度匹配，因此，这种方式下的误报样本库非常关键，需根据新的恶意代码误报样本的出现，不断地进行更新以及补充误报样本库中样本。为此，本实施例中恶意代码误报的追踪方法还包括：根据新获取的恶意代码误报样本，对误报样本库进行更新。即对新获取的恶意代码误报样本进行样本特征提取，并将新的恶意代码误报样本及其对应的样本特征关联存储于误报样本库中。

本实施例中误报样本库的更新及时，利于导致恶意代码误报的样本特征的快速确定，提高了查明导致恶意代码误报的原因的效率。

图3为本发明另一实施例中的恶意代码误报的追踪方法的流程图。图3中恶意代码误报的追踪方法包括：

S302，获取恶意代码误报样本；

S304，将恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本；

S306，根据相似误报样本确定导致恶意代码误报的样本特征；

S308，将导致恶意代码误报的样本特征发送至QVM引擎。

与图1中恶意代码误报的追踪方法相比，图3中恶意代码误报的追踪方法将导致恶意代码误报的样本特征发送至QVM引擎，从而方便QVM引擎根据导致恶意代码误报的样本特征，修改QVM引擎的黑名单中恶意代码样本的黑白属性，以及在QVM引擎的白名单中添加非恶意代码样本。在确定导致恶意代码误报的样本特征之后，QVM引擎根据所获取的恶意代码误报的样本特征，修改QVM引擎的黑名单中恶意代码样本的黑白属性，更新其黑名单和白名单中的样本，进而提高QVM引擎在后续恶意代码判断过程的效率和准确率，提高QVM引擎的鲁棒性，有效减少恶意代码误报对用户造成的困扰。

在本发明恶意代码误报的追踪方法另一个实施例中，所述恶意代码误报样本由移动终端在发生恶意代码误报时提交。

此时，为了获知移动终端中恶意代码误报样本对应的其他样本是否出现恶意代码误报，以及出现恶意代码误报的版本，本实施例中恶意代码误报的追踪方法在获取恶意代码误报样本之后，还可包括：

进一步的，为了获知预定时间范围内，移动终端中提交的与恶意代码误报样本对应的其他样本是否出现恶意代码误报，以及出现恶意代码误报的版本，设定反查周期。本实施例中恶意代码误报的追踪方法仅仅在反查周期内，查找所述移动终端中与其提交恶意代码误报样本对应的其他版本样本。

在本发明恶意代码误报的追踪方法另一个实施例中，所述恶意代码误报样本由个人电脑在发生恶意代码误报时提交。

此时，为了获知个人电脑中恶意代码误报样本对应的其他样本是否出现恶意代码误报，以及出现恶意代码误报的版本，本实施例中恶意代码误报的追踪方法在获取恶意代码误报样本之后，还可包括：

查找所述个人电脑中与所述恶意代码误报样本对应的其他版本样本；

对个人电脑中所述恶意代码误报样本及其对应的其他版本样本进行筛选，确定提交恶意代码误报的第二样本集合；

将所述第二样本集合中每个样本与误报样本库中的样本进行相似度匹配，获取所述第二样本集合中每个样本相似误报样本。

由于个人电脑中包括的代码量很大，为了在大量代码中快速查找到个人电脑中与所述恶意代码误报样本对应的其他版本样本，在一个实施例中，通过DUP(duplicate缩写)语言查找所述个人电脑中与所述恶意代码误报样本对应的其他版本样本。其具体可通过个人电脑中已有的DUP架构实现。

下面根据本申请实施例，提供了一种恶意代码误报的追踪装置。

需要说明的是，本申请实施例的恶意代码误报的追踪装置可以用于执行本申请实施例的恶意代码误报的追踪方法，根据本申请实施例的恶意代码误报的追踪方法也可以通过本申请实施例的恶意代码误报的追踪装置来执行。

图4为本发明一实施例中的恶意代码误报的追踪装置的示意图。图4中恶意代码误报的追踪装置包括：

获取单元202，用于获取恶意代码误报样本；

匹配单元204，用于将恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本；

追踪单元206，用于根据相似误报样本确定导致恶意代码误报的样本特征。

本实施例中，恶意代码误报样本为客户端(计算机或移动终端)在接收到杀毒引擎(如360提供的QVM引擎)发送的恶意代码提醒之后，又获知该恶意代码提醒对应的文件实质上并非恶意代码时，客户端提供的与恶意代码提醒对应的文件。

本实施例中，获取单元202可以通过客户端-服务器(Client-Server)架构来获取恶意代码误报样本。

由于误报样本库中的样本都是根据已获取的恶意代码误报样本而形成的，因此，可将恶意代码误报样本与误报样本库中的样本进行相似度匹配。

本实施例中，先通过获取单元202获取恶意代码误报样本；接着匹配单元204将恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本；最后追踪单元206根据相似误报样本确定导致恶意代码误报的样本特征，查明导致恶意代码误报的原因。

图5为本发明另一实施例中的恶意代码误报的追踪装置的示意图。与图4相比，图5中恶意代码误报的追踪装置还包括：

误报样本库建立单元208，用于获取恶意代码误报的统计样本，并根据恶意代码误报的统计样本，获取恶意代码误报样本及其对应的样本特征，以及将恶意代码误报样本及其对应的样本特征关联存储，形成误报样本库；

误报样本库更新单元210，用于根据新获取的恶意代码误报样本，对误报样本库进行更新。

由于本发明实施例相似误报样本获取过程中，需将恶意代码误报样本与误报样本库中的样本进行相似度匹配，因此，这种方式下的误报样本库非常关键，需根据新的恶意代码误报样本的出现，不断地进行更新以及补充误报样本库中样本。本实施例通过在恶意代码误报的追踪中设置误报样本库更新单元210，以根据新获取的恶意代码误报样本对误报样本库进行更新。提高了更新误报样本库的及时性，利于导致恶意代码误报的样本特征的快速确定，提高了查明导致恶意代码误报的原因的效率。

为了提高误报样本库中样本的分散度，在基于上述装置的另一个实施例中，所述误报样本库建立单元包括：

样本获取单元，用于获取恶意代码误报的统计样本；

样本训练单元，与所述样本获取单元连接，用于根据所述恶意代码误报的统计样本，获取恶意代码误报样本及其对应的样本特征；

关联存储单元，用于将所述恶意代码误报样本及其对应的样本特征关联存储，形成误报样本库。

本实施例中，所述样本训练单元还可进一步包括：

样本筛选单元，用于对所述恶意代码误报的统计样本进行样本筛选，确定恶意代码误报的学习样本；

特征获取单元，用于获取所述恶意代码误报的学习样本的样本特征；

样本推演单元，用于根据所获取的样本特征进行样本推演，获取与所述样本特征对应的恶意代码误报样本。

本实施例中，先通过样本筛选单元对样本获取单元获取的恶意代码误报的统计样本进行样本筛选，确定恶意代码误报的学习样本；然后通过特征获取单元获取恶意代码误报的学习样本的样本特征；再通过样本推演单元根据所获取的样本特征进行样本推演，获取与样本特征对应的恶意代码误报样本，并存储于关联存储单元。从而提高误报样本库中样本的分散度，利于导致恶意代码误报的样本特征的快速确定，提高了查明导致恶意代码误报的原因的效率。

在本发明恶意代码误报的追踪装置的另一个实施例中，所述匹配单元还可进一步包括：

相似度值获取单元，用于将所述恶意代码误报样本分别与误报样本库中每个样本进行比较，获取所述恶意代码误报样本与误报样本库中的每个样本的相似度值；

相似度值判断单元，用于判断每个所述相似度值是否大于相似度阈值；

相似误报样本确定单元，用于在所述相似度值大于相似度阈值时，则将该相似度值对应的误报样本库中样本确定为相似误报样本。

本实施例中，所述相似度值获取单元在将所述恶意代码误报样本分别与误报样本库中每个样本进行比较，获取所述恶意代码误报样本与误报样本库中的每个样本的相似度值时，具体用于：

图6为本发明又一实施例中的恶意代码误报的追踪装置的示意图。与图4相比，图6中恶意代码误报的追踪装置还包括：

发送单元212，用于将导致恶意代码误报的样本特征发送至QVM引擎。

在确定导致恶意代码误报的样本特征之后，QVM引擎根据所获取的恶意代码误报的样本特征，修改QVM引擎的黑名单中恶意代码样本的黑白属性，更新其黑名单和白名单中的样本，进而提高QVM引擎在后续恶意代码判断过程的效率和准确率，提高QVM引擎的鲁棒性，有效减少恶意代码误报对用户造成的困扰。

图7为本发明一实施例中的恶意代码误报的追踪系统的示意图。图7中恶意代码误报的追踪系统除包括任一上述实施例中的恶意代码误报的追踪装置10外，还包括：

客户端20，用于在发生恶意代码误报时，向所述恶意代码误报的追踪装置提交所述恶意代码误报样本；

QVM引擎30，用于查找客户端中的恶意代码，并在查找到恶意代码时向所述客户端发送恶意代码提醒。

在本发明恶意代码误报的追踪系统的一个实施例中，所述QVM引擎进一步包括：

白名单数据库，用于存储非恶意代码样本；

黑名单数据库，用于存储恶意代码样本；

恶意代码查找单元，用于依据白名单数据库和所述黑名单数据库查找客户端中的恶意代码，并在查找到恶意代码时向所述客户端发送恶意代码提醒；

属性修改单元，用于根据根据导致恶意代码误报的所述样本特征，修改黑名单数据库中恶意代码样本的黑白属性，以及在白名单数据库中添加非恶意代码样本。

在本发明恶意代码误报的追踪系统的一个实施例中，所述客户端为移动终端。为了获知移动终端中恶意代码误报样本对应的其他样本是否出现恶意代码误报，以及出现恶意代码误报的版本，所述恶意代码误报的追踪装置还可进一步包括：

第一样本反查单元，用于查找所述移动终端中与其提交恶意代码误报样本对应的其他版本样本；

第一误报筛选单元，用于对移动终端中所述恶意代码误报样本及其对应的其他版本样本进行筛选，确定提交恶意代码误报的第一样本集合；

所述匹配单元还用于将所述第一样本集合中每个样本与误报样本库中的样本进行相似度匹配，获取所述第一样本集合中每个样本的相似误报样本。

在基于上述系统的另一个实施例中，所述恶意代码误报的追踪装置还包括：反查周期设定单元，用于设定所述第一样本反查单元查找所述移动终端中与其提交恶意代码误报样本对应的其他版本样本的反查周期。从而获知预定时间范围内，移动终端中提交的与恶意代码误报样本对应的其他样本是否出现恶意代码误报，以及出现恶意代码误报的版本。

在本发明恶意代码误报的追踪系统的一个实施例中，所述客户端为个人电脑。

为了获知个人电脑中恶意代码误报样本对应的其他样本是否出现恶意代码误报，以及出现恶意代码误报的版本，本实施例中所述个人电脑包括：第二样本反查单元，用于查找所述个人电脑中与所述恶意代码误报样本对应的其他版本样本。

本实施例中，所述恶意代码误报的追踪装置还包括：第二误报筛选单元，用于对个人电脑中所述恶意代码误报样本及其对应的其他版本样本进行筛选，确定提交恶意代码误报的第二样本集合。所述恶意代码误报的追踪装置中匹配单元还用于将所述第二样本集合中每个样本与误报样本库中的样本进行相似度匹配，获取所述第二样本集合中每个样本相似误报样本。

在基于上述系统的另一个实施例中，所述第二样本反查单元通过所述个人电脑中的DUP架构查找所述个人电脑中与所述恶意代码误报样本对应的其他版本样本。由于个人电脑中包括的代码量很大，而个人电脑中的DUP架构能够在大量代码中快速查找到个人电脑中与所述恶意代码误报样本对应的其他版本样本，提高了于个人电脑中查找与所述恶意代码误报样本对应的其他版本样本的效率，节约查找时间。

本发明实施例提供了如下技术方案：

1、一种恶意代码误报的追踪方法，包括：

获取恶意代码误报样本；

根据所述相似误报样本确定导致恶意代码误报的样本特征。

2、根据1所述的恶意代码误报的追踪方法，形成所述误报样本库包括：

获取恶意代码误报的统计样本；

3、根据2所述的恶意代码误报的追踪方法，根据所述恶意代码误报的统计样本，获取恶意代码误报样本及其对应的样本特征包括：

获取所述恶意代码误报的学习样本的样本特征；

4、根据1至3任一所述的恶意代码误报的追踪方法，将所述恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本包括:

判断每个所述相似度值是否大于相似度阈值；

5、根据4所述的恶意代码误报的追踪方法，将所述恶意代码误报样本分别与误报样本库中每个样本进行比较，获取所述恶意代码误报样本与误报样本库中每个样本的相似度值包括：

6根据1至3任一所述的恶意代码误报的追踪方法，所述恶意代码误报的追踪方法还包括：

根据新获取的恶意代码误报样本，对所述误报样本库进行更新。

7、根据1所述的恶意代码误报的追踪方法，在根据所述相似误报样本确定导致恶意代码误报的样本特征之后，所述恶意代码误报的追踪方法还包括：

将导致恶意代码误报的所述样本特征发送至QVM引擎；

8、根据1所述的恶意代码误报的追踪方法，所述恶意代码误报样本由移动终端在发生恶意代码误报时提交；

9、根据8所述的恶意代码误报的追踪方法，

在反查周期内，查找所述移动终端中与其提交恶意代码误报样本对应的其他版本样本。

10、根据1所述的恶意代码误报的追踪方法，所述恶意代码误报样本由个人电脑在发生恶意代码误报时提交；

11、根据10所述的恶意代码误报的追踪方法，通过DUP语言查找所述个人电脑中与所述恶意代码误报样本对应的其他版本样本。

12、一种恶意代码误报的追踪装置，包括：

获取单元，用于获取恶意代码误报样本；

13、根据12所述的恶意代码误报的追踪装置，所述恶意代码误报的追踪装置还包括：

误报样本库建立单元，用于获取恶意代码误报的统计样本，并根据所述恶意代码误报的统计样本，获取恶意代码误报样本及其对应的样本特征，以及将所述恶意代码误报样本及其对应的样本特征关联存储，形成误报样本库。

14、根据13所述的恶意代码误报的追踪装置，所述误报样本库建立单元包括：

样本获取单元，用于获取恶意代码误报的统计样本；

15、根据14所述的恶意代码误报的追踪装置，所述样本训练单元包括：

16、根据12至15任一所述的恶意代码误报的追踪装置，所述匹配单元包括：

17、根据16所述的恶意代码误报的追踪装置，所述相似度值获取单元在将所述恶意代码误报样本分别与误报样本库中每个样本进行比较，获取所述恶意代码误报样本与误报样本库中的每个样本的相似度值时，具体用于：

18、根据12至15任一所述的恶意代码误报的追踪装置，所述恶意代码误报的追踪装置还包括：

误报样本库更新单元，用于根据新获取的恶意代码误报样本，对所述误报样本库进行更新。

19、根据12所述的恶意代码误报的追踪装置，所述恶意代码误报的追踪装置还包括：

发送单元，用于将导致恶意代码误报的所述样本特征发送至QVM引擎；

20、一种恶意代码误报的追踪系统，包括8至15任一所述的恶意代码误报的追踪装置。

21、根据20所述的恶意代码误报的追踪系统，所述恶意代码误报的追踪系统还包括：

客户端，用于在发生恶意代码误报时，向所述恶意代码误报的追踪装置提交所述恶意代码误报样本；

QVM引擎，用于查找客户端中的恶意代码，并在查找到恶意代码时向所述客户端发送恶意代码提醒。

22、根据21所述的恶意代码误报的追踪系统，所述QVM引擎包括：

白名单数据库，用于存储非恶意代码样本；

黑名单数据库，用于存储恶意代码样本；

23、根据20至22任一所述的恶意代码误报的追踪系统，所述客户端为移动终端。

24、根据23所述的恶意代码误报的追踪系统，所述恶意代码误报的追踪装置还包括：

25、根据24所述的恶意代码误报的追踪系统，所述恶意代码误报的追踪装置还包括：

反查周期设定单元，用于设定所述第一样本反查单元查找所述移动终端中与其提交恶意代码误报样本对应的其他版本样本的反查周期。

26、根据20至22任一所述的恶意代码误报的追踪系统，所述客户端为个人电脑。

27、根据26所述的恶意代码误报的追踪系统，所述个人电脑包括：第二样本反查单元，用于查找所述个人电脑中与所述恶意代码误报样本对应的其他版本样本；

所述恶意代码误报的追踪装置还包括：第二误报筛选单元，用于对个人电脑中所述恶意代码误报样本及其对应的其他版本样本进行筛选，确定提交恶意代码误报的第二样本集合；

所述匹配单元还用于将所述第二样本集合中每个样本与误报样本库中的样本进行相似度匹配，获取所述第二样本集合中每个样本相似误报样本。

28、根据27所述的恶意代码误报的追踪系统，所述第二样本反查单元通过所述个人电脑中的DUP架构查找所述个人电脑中与所述恶意代码误报样本对应的其他版本样本。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

本发明的描述是为了示例和描述起见而给出的，而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用，并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims

1.一种恶意代码误报的追踪方法，其特征在于，包括：

获取恶意代码误报样本；

根据所述相似误报样本确定导致恶意代码误报的样本特征；

形成所述误报样本库包括：

获取恶意代码误报的统计样本；根据所述恶意代码误报的统计样本，获取恶意代码误报样本及其对应的样本特征；将所述恶意代码误报样本及其对应的样本特征关联存储，形成误报样本库。

2.根据权利要求1所述的恶意代码误报的追踪方法，其特征在于，根据所述恶意代码误报的统计样本，获取恶意代码误报样本及其对应的样本特征包括：

获取所述恶意代码误报的学习样本的样本特征；

3.根据权利要求1或2所述的恶意代码误报的追踪方法，其特征在于，将所述恶意代码误报样本与误报样本库中的样本进行相似度匹配，获取相似误报样本包括:

判断每个所述相似度值是否大于相似度阈值；

4.根据权利要求3所述的恶意代码误报的追踪方法，其特征在于，将所述恶意代码误报样本分别与误报样本库中每个样本进行比较，获取所述恶意代码误报样本与误报样本库中每个样本的相似度值包括：

5.根据权利要求1或2所述的恶意代码误报的追踪方法，其特征在于，所述恶意代码误报的追踪方法还包括：

6.根据权利要求1所述的恶意代码误报的追踪方法，其特征在于，在根据所述相似误报样本确定导致恶意代码误报的样本特征之后，所述恶意代码误报的追踪方法还包括：

将导致恶意代码误报的所述样本特征发送至QVM引擎；

7.根据权利要求1所述的恶意代码误报的追踪方法，其特征在于，所述恶意代码误报样本由移动终端在发生恶意代码误报时提交；

8.根据权利要求7所述的恶意代码误报的追踪方法，其特征在于，

9.根据权利要求1所述的恶意代码误报的追踪方法，其特征在于，所述恶意代码误报样本由个人电脑在发生恶意代码误报时提交；

10.根据权利要求9所述的恶意代码误报的追踪方法，其特征在于，通过DUP语言查找所述个人电脑中与所述恶意代码误报样本对应的其他版本样本。

11.一种恶意代码误报的追踪装置，其特征在于，包括：

获取单元，用于获取恶意代码误报样本；

追踪单元，用于根据所述相似误报样本确定导致恶意代码误报的样本特征；

所述恶意代码误报的追踪装置还包括：

12.根据权利要求11所述的恶意代码误报的追踪装置，其特征在于，所述误报样本库建立单元包括：

样本获取单元，用于获取恶意代码误报的统计样本；

13.根据权利要求12所述的恶意代码误报的追踪装置，其特征在于，所述样本训练单元包括：

14.根据权利要求11至13任一所述的恶意代码误报的追踪装置，其特征在于，所述匹配单元包括：

15.根据权利要求14所述的恶意代码误报的追踪装置，其特征在于，所述相似度值获取单元在将所述恶意代码误报样本分别与误报样本库中每个样本进行比较，获取所述恶意代码误报样本与误报样本库中的每个样本的相似度值时，具体用于：

16.根据权利要求11至13任一所述的恶意代码误报的追踪装置，其特征在于，所述恶意代码误报的追踪装置还包括：

17.根据权利要求11所述的恶意代码误报的追踪装置，其特征在于，所述恶意代码误报的追踪装置还包括：

18.一种恶意代码误报的追踪系统，其特征在于，包括权利要求11至17任一所述的恶意代码误报的追踪装置。

19.根据权利要求18所述的恶意代码误报的追踪系统，其特征在于，所述恶意代码误报的追踪系统还包括：

20.根据权利要求19所述的恶意代码误报的追踪系统，其特征在于，所述QVM引擎包括：

白名单数据库，用于存储非恶意代码样本；

黑名单数据库，用于存储恶意代码样本；

属性修改单元，用于根据导致恶意代码误报的所述样本特征，修改黑名单数据库中恶意代码样本的黑白属性，以及在白名单数据库中添加非恶意代码样本。

21.根据权利要求18至20任一所述的恶意代码误报的追踪系统，其特征在于，所述客户端为移动终端。

22.根据权利要求21所述的恶意代码误报的追踪系统，其特征在于，所述恶意代码误报的追踪装置还包括：

23.根据权利要求22所述的恶意代码误报的追踪系统，其特征在于，所述恶意代码误报的追踪装置还包括：

24.根据权利要求18至20任一所述的恶意代码误报的追踪系统，其特征在于，所述客户端为个人电脑。

25.根据权利要求24所述的恶意代码误报的追踪系统，其特征在于，所述个人电脑包括：第二样本反查单元，用于查找所述个人电脑中与所述恶意代码误报样本对应的其他版本样本；

26.根据权利要求25所述的恶意代码误报的追踪系统，其特征在于，所述第二样本反查单元通过所述个人电脑中的DUP架构查找所述个人电脑中与所述恶意代码误报样本对应的其他版本样本。