CN107220262B

CN107220262B - 信息处理方法和装置

Info

Publication number: CN107220262B
Application number: CN201610166423.XA
Authority: CN
Inventors: 张利海
Original assignee: Alibaba Group Holding Ltd
Current assignee: Alibaba Group Holding Ltd
Priority date: 2016-03-22
Filing date: 2016-03-22
Publication date: 2021-01-26
Anticipated expiration: 2036-03-22
Also published as: CN107220262A

Abstract

本申请公开了一种信息处理方法和装置。其中，该方法包括：根据信息获取请求，从目标网站的服务器中，获取目标对象的对象信息，其中，信息获取请求用于请求获取目标对象的信息泄露状态，信息泄露状态用于表示目标对象的信息是否处于能够被非法对象获取的状态；在指纹库中查找与对象信息相匹配的目标信息指纹；在查找到目标信息指纹的情况下，获取指纹库中记录的目标信息指纹的信息泄露状态，将目标信息指纹的信息泄露状态作为目标对象的信息泄露状态。采用本申请实施例，解决了现有技术中进行人工分析信息泄露状态时效率低的问题。

Description

信息处理方法和装置

技术领域

本申请涉及互联网领域，具体而言，涉及一种信息处理方法和装置。

背景技术

随着互联网应用的普及和人们对互联网的依赖，互联网的安全问题也日益凸显。恶意程序、各类钓鱼和欺诈继续保持高速增长，同时黑客攻击和大规模的个人信息泄露事件频发，与各种网络攻击大幅增长相伴的，是大量网民个人信息的泄露与财产损失的不断增加。如果泄露的个人信息中包含公司相关的信息，黑客可能通过包含的公司信息对公司的资源记性窃取，导致更大的损失。

然而，对于个人或者公司来讲，是否存在信息泄露，在很多情况下，个人或公司是不知情的。

现有技术中为了防止信息泄露，采用人工分析的方法，如人工打开浏览器，通过浏览器访问对应的页面并搜索待分析对象A的信息，在得到访问结果之后，人工对该对比结果进行对比分析，判断待分析对象A是否发生信息泄露。

但是人不可能像机器那样24小时去工作，在应对网站上的大量信息或者多个待分析对象时，现有技术中人工分析的方式的效率会很低，并且成本很高。

针对上述人工分析信息泄露状态时效率低的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种信息处理方法和装置，以至少解决人工分析信息泄露状态时效率低的技术问题。

根据本申请实施例的一个方面，提供了一种信息处理方法，包括：根据信息获取请求，从目标网站的服务器中，获取目标对象的对象信息，其中，信息获取请求用于请求获取目标对象的信息泄露状态；在指纹库中查找与对象信息相匹配的目标信息指纹；在查找到目标信息指纹的情况下，获取指纹库中记录的目标信息指纹的信息泄露状态，将目标信息指纹的信息泄露状态作为目标对象的信息泄露状态。

根据本申请实施例的另一方面，还提供了一种信息处理装置，该装置：接收单元，用于接收；第一获取单元，用于根据信息获取请求，从目标网站的服务器中，获取目标对象的对象信息；查找单元，用于在指纹库中查找与对象信息相匹配的目标信息指纹，其中，信息获取请求用于请求获取目标对象的信息泄露状态；第二获取单元，用于在查找到目标信息指纹的情况下，获取指纹库中记录的目标信息指纹的信息泄露状态，将目标信息指纹的信息泄露状态作为目标对象的信息泄露状态。

可选地，所述查找单元包括：查找子单元，用于按照所述对象信息的指定属性字段，在所述指纹库中查找与所述对象信息相匹配的目标信息指纹。

可选地，所述指定属性字段为多个，所述查找子单元包括：获取模块，用于获取对象信息中各个指定属性字段的第一属性参数；对比模块，用于使用所述各个指定属性字段的第一属性参数与所述指纹库中的信息指纹进行对比操作；确定模块，用于若当前比对的信息指纹中各个指定属性字段的第二属性参数与对应的所述第一属性参数一致，则确定当前比对的信息指纹为所述目标信息指纹。

可选地，所述装置还包括：第三获取单元，用于在查找到所述目标信息指纹的情况下，获取所述目标信息指纹中不存在于所述对象信息中的第一信息，和所述对象信息中不存在于所述目标信息指纹中的第二信息；添加单元，用于将所述第一信息添加到所述对象信息中，以及将所述第二信息添加到所述目标信息指纹中。

可选地，所述第一获取单元包括：提取子单元，用于提取所述信息获取请求中的任务关键词；搜索子单元，用于在所述目标网站中搜索与所述任务关键词对应的所述对象信息。

可选地，所述搜索子单元包括：循环执行模块，用于将所述任务关键词作为当前关键词，循环执行下述搜索操作，直至达到结束条件，将每次执行搜索操作的结果进行汇总，得到所述对象信息，所述循环执行模块包括：搜索子模块，用于在所述目标网站中搜索与所述当前关键词有关联关系的第一关联信息；处理子模块，用于将所述第一关联信息作为当前执行搜索操作的结果，并将所述第一关联信息作为下一次执行搜索操作时的当前关键词。

可选地，所述装置还包括：处理单元，用于在将所述第一关联信息作为下一次执行搜索操作时的当前关键词之前，对所述第一关联信息进行预处理，得到处理后的第一关联信息；所述处理子模块具体用于：将所述处理后的第一关联信息作为所述下一次执行搜索操作时的当前关键词。

可选地，所述处理单元包括：信息处理模块，用于在对所述第一关联信息进行格式解析之后，从所述第一关联信息中提取预设字段对应的信息，得到所述处理后的第一关联信息。

可选地，循环执行模块包括：汇总模块，用于在将每次执行搜索操作的结果进行汇总之后，得到汇总信息；去重模块，用于对所述汇总信息进行去重操作，得到所述对象信息。

在本申请实施例中，在接收到信息获取请求之后，直接从目标网站的服务器中获取目标对象的对象信息，在指纹库中查找到与对象信息相匹配的目标信息指纹之后，将指纹库中记录的目标信息指纹的信息泄露状态作为目标对象的信息泄露状态。在上述实施例中，响应信息获取请求自动在目标网站的服务器中查询对象信息，提高了处理速度；并且在该方案中，在指纹库中预存多个信息指纹，并对每个信息指纹标记信息泄露状态，在确定与目标对象的对象信息相匹配的目标信息指纹之后，即可准确确定目标对象的信息泄露状态，准确率高。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本申请实施例的一种信息处理方法的计算机终端的硬件结构框；

图2是根据本申请实施例的一种可选的信息处理方法的流程图；

图3是根据本申请实施例的一种可选的信息处理方法的原理示意图；

图4是根据本申请实施例的一种可选的信息处理方法的网络拓扑图；

图5是根据本申请实施例的一种可选的信息处理方法的数据流程图；

图6(a)是根据本申请实施例的一种可选的对象信息的表现形式示意图；

图6(b)是根据本申请实施例的另一种可选的信息处理方法的流程图；

图7是根据本申请实施例的一种可选的信息处理装置的示意图一；

图8是根据本申请实施例的一种可选的信息处理装置的示意图二；

图9是根据本申请实施例的一种可选的信息处理装置的示意图三；

图10是根据本申请实施例的一种可选的计算机终端的内部结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先将本申请涉及的术语解释如下：

信息指纹：就是提取的一个信息的特征而生成的信息，在本申请中的信息指纹可以包括多个属性字段，每个属性字段对应一个属性参数。

UI界面(人机交互界面)：是指用户和系统进行交互方法的集合。

实施例1

根据本申请实施例，还提供了一种信息处理方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例，图1是本申请实施例的一种信息处理方法的计算机终端的硬件结构框图。如图1所示，计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块，如本申请实施例中的信息处理方法对应的程序指令/模块，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的信息处理方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输装置106包括一个网络适配器(Network Interface Control ler，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置106可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

在上述运行环境下，本申请提供了如图2所示的信息处理方法。图2是根据本申请实施例的信息处理方法的流程图。

如图2所示，该实施例可以通过如下步骤实现：

步骤S202：接收信息获取请求，其中，信息获取请求用于请求获取目标对象的信息泄露状态，信息泄露状态用于表示目标对象的信息是否处于能够被非法对象获取的状态；

步骤S204：根据信息获取请求，从目标网站的服务器中，获取目标对象的对象信息；

步骤S206：在指纹库中查找与对象信息相匹配的目标信息指纹；

步骤S208：在查找到目标信息指纹的情况下，获取指纹库中记录的目标信息指纹的信息泄露状态，将目标信息指纹的信息泄露状态作为目标对象的信息泄露状态。

采用本申请的上述实施例，在接收到信息获取请求之后，直接从目标网站的服务器中获取目标对象的对象信息，在指纹库中查找到与对象信息相匹配的目标信息指纹之后，将指纹库中记录的目标信息指纹的信息泄露状态作为目标对象的信息泄露状态。在上述实施例中，响应信息获取请求自动在目标网站的服务器中查询对象信息，提高了处理速度；并且在该方案中，在指纹库中预存多个信息指纹，并对每个信息指纹标记信息泄露状态，在确定与目标对象的对象信息相匹配的目标信息指纹之后，即可准确确定目标对象的信息泄露状态，该方案准确率高。

上述实施例中信息泄露状态用于表示目标对象的对象信息可被非法对象获取的状态。用户可以通过UI界面(人机交互界面)输入信息获取请求，该信息获取请求用于获取某个目标对象的信息泄露状态，该目标对象可以为一个公司或者个人，本申请对此不做限定。该非法对象可以为没有获取该信息的获取权限或未经目标对象授权的对象，如某目标对象的邮箱密码，原本不应被除目标对象之外的其他对象获知，该除目标对象之外的其他对象为非法对象，则该目标对象的邮箱密码被其他对象获知了，该信息则发生了信息泄露。

在本申请上述实施例中，在接收到信息获取请求之后，任务处理服务器直接从目标网站的服务器中获取目标对象的对象信息，将获取到的对象信息发送至数据处理服务器。数据处理服务器在指纹库中查找与对象信息相匹配的目标信息指纹，并在查找到目标信息指纹的情况下，获取目标信息指纹的信息泄露状态，将目标信息指纹的信息泄露状态作为目标对象的信息泄露状态，生成泄露报告。

上述的指纹库中存储有预先收集的信息指纹，信息指纹可以包括：账户、姓名、性别、所在地、生日、邮箱以及工作信息中的至少两项的对应关系，该指纹库中还记录有信息指纹的信息泄露状态，具体地，可以在接收到信息发生泄露的信息时，获取所有发生泄露的信息，在指纹库中找到与该发生泄露的信息相匹配的信息指纹，并对该信息指纹进行信息泄露标记，如信息泄露标记可以为：于2015年12月31日发生泄露，或者是，未发生过泄露。需要说明的是，一旦该信息指纹被标记为：发生过信息泄露，该标记不可被变更为：未发生泄露。

上述的目标网站可以为社交网站。社交网站主要是进行人与人之间的沟通与交流，该社交网站上存在大量的目标对象(如公司或者个人)的信息，如目标对象注册或登录这些社交网站会使用到一些个人信息(如上述实施例中的对象信息)，如姓名、手机号、性别、生日、邮箱以及工作信息等。因此，社交网站是信息泄露的重要源头，例如，如果某目标对象注册或登录的密码处于可以被非法人员获取的状态(处于信息被泄露的状态)，同时，若该目标对象在邮箱中使用的密码与该社交网站的密码相同，则非法对象可以通过该密码进入目标对象的邮箱，获取该目标对象的邮件内容。在这种情况下，如果该邮箱为私人邮箱，那么目标对象泄露的为私人信息；若该邮箱为公司邮箱，那么目标对象泄露的就为公司信息，不论是私人信息或者公司信息的泄露，对于该目标对象来讲，都是很大的损失。

以目标对象为公司为例，采用上述实施例，可以在接收到确定目标公司A的信息泄露状态的信息获取请求时，在目标网站上获取该目标公司A和工作信息指示属于该目标公司A的员工的信息，得到该目标公司A的对象信息。

由于在指纹库中预存了大量预先收集的信息指纹和各个信息指纹对应的信息泄露状态，在得到对象信息之后，在指纹库中查找相匹配的目标信息指纹，将该目标信息指纹的信息泄露状态作为该目标对象的信息泄露状态。

其中，获取对象信息可以使用该目标对象的任务关键词获取。

通过上述实施例，使用目标对象的任务关键词(如公司信息、员工信息)，在互联网上搜索是否存在敏感信息的泄露，如果有可以提示目标对象及时修改，以避免对公司或个人造成更大的损失。

具体地，在指纹库中查找与对象信息相匹配的目标信息指纹包括：按照对象信息的指定属性字段，在指纹库中查找与对象信息相匹配的目标信息指纹。

信息指纹可以是基于某个对象的属性特征而生成的信息，在本申请中的信息指纹可以包括多个属性字段，每个属性字段对应一个属性参数。上述的对象可以包括本申请的目标对象，如公司对象或员工对象等。

本申请中的指纹库中可以包括上述的多条信息指纹。

该指定属性字段一般为多个，按照对象信息的指定属性字段，在指纹库中查找与对象信息相匹配的目标信息指纹可以包括：获取对象信息中各个指定属性字段的第一属性参数；使用各个指定属性字段的第一属性参数与指纹库中的信息指纹进行对比操作；若当前比对的信息指纹中各个指定属性字段的第二属性参数与对应的第一属性参数一致，则确定当前比对的信息指纹为目标信息指纹。

具体地，目标对象的属性字段可以包括下述至少之一：姓名、性别、所在地、生日、邮箱、工作信息以及应用账户(如新浪微博的账号)等。由于采用一个指定属性字段进行比对处理，可以获取大量的信息，但是该大量的信息中有很多无用的信息。为了提高匹配的精确度，可以使用多个指定属性字段进行比对，如使用：姓名、性别、所在地和邮箱四个属性字段的属性参数与指纹库中的信息指纹进行比对。

在使用各个指定属性字段的第一属性参数与指纹库中的信息指纹进行对比操作的过程中，可以依次使用一个指定属性字段的第一属性参数与指纹库中的信息指纹进行对比操作，具体地，将多个指定属性字段中的第一个指定属性设置为第一次循环操作时的当前字段，将指纹库设置为第一次循环操作时的当前信息集，循环执行比对操作，直至该多个指定属性字段中的最后信息指纹进行对比操作一个指定属性字段：使用当前字段的第一属性参数在指纹库中的，得到对比结果，将对比结果作为下一次循环操作时的当前信息集。

如，在指纹库中查找，与对象信息中第一个指定属性字段的属性参数相同的第一信息指纹；然后在第一信息指纹中查找，与对象信息中第二个指定属性字段的属性参数相同的第二信息指纹，依次执行步骤，直至最后一个指定属性字段，得到对比结果。

需要说明的是，本申请实施例中，在确定与对象信息相匹配的目标信息指纹之后，读取指纹库中记录的目标信息指纹的信息泄露状态，基于该目标信息指纹和该目标信息指纹的信息泄露状态，生成泄露报告，并展示该泄露报告。

作为一个可选的实施例，在查找到所述目标信息指纹的情况下，还可以将对象信息和目标信息指纹融合起来，以使对象信息和目标信息指纹更加完整，具体地，获取所述目标信息指纹中不存在于所述对象信息中的第一信息，和所述对象信息中不存在于所述目标信息指纹中的第二信息；将所述第一信息添加到所述对象信息中，以及将所述第二信息添加到所述目标信息指纹中。

例如，对象信息中包含了姓名、性别、工作信息、注册新浪微博的时间、新浪微博的账号；目标信息指纹包括：姓名、工作信息、生日、注册新浪微博的时间、新浪微博的账号，则可以在对象信息中增加生日字段，在目标信息指纹中增加性别字段。

通过本申请的上述实施例，可以使用预先设定的信息获取请求中的关键词到国内外的社交网站上收集对象信息，将收集到的内容进行提取分析计算，并在特定的指纹库中寻找是否存在敏感信息的泄露。具体地，获取目标对象的对象信息包括：提取信息获取请求中的任务关键词；在目标网站中搜索与任务关键词对应的对象信息。

下面结合图3和图4对本申请的上述实施例，进行详细说明：

通过控制台的UI界面(即人机交互界面)输入目标对象的任务关键词，并基于该任务关键词生成上述的信息获取请求，在接收到该信息获取请求之后，信息收集模块利用该任务关键词从一个或多个目标网站的服务器中获取该目标对象的对象信息，在获取到目标对象的对象信息之后，将目标对象的对象信息发送至数据中心进行处理，得到处理结果，对处理结果进行分析计算，生成泄露报告。

以目标对象为公司A为例，如图3所示，在输入公司的关键词(如公司名称)之后，信息收集模块从网站1、网站2和网站3中收集公司的员工信息(如上述的对象信息)，在收集到该员工的信息之后，数据中心和数据分析计算模块对其进行处理，得到泄露报告。

如图4所示，任务调度服务器在接收到信息获取请求(如信息获取任务)之后，响应该信息获取请求，触发信息抓取服务器从目标网站的服务器上获取目标对象的对象信息，信息抓取服务器将收集到的对象信息发送至数据分析服务器，数据分析服务器在指纹库中查找与对象信息匹配的目标信息指纹，并在查找到目标信息指纹之后，确定目标对象的信息泄露状态，更新数据库，并生成泄露报告。可选地，任务调度服务器和数据分析服务器将分析结果(如泄露报告)和信息获取请求都保存在数据库中。

具体地，在目标网站中搜索与任务关键词对应的对象信息包括：将任务关键词作为当前关键词，循环执行下述搜索操作，直至达到结束条件，将每次执行搜索操作的结果进行汇总，得到对象信息：在目标网站中搜索与当前关键词有关联关系的第一关联信息；将第一关联信息作为当前执行搜索操作的结果，并将第一关联信息作为下一次执行搜索操作时的当前关键词。

在该实施例中，可以使用通过UI输入的任务关键词在目标网站中搜索第一关联信息，该与任务关键词有关联关系的第一关联信息，可以为包含任务关键词的信息。

可选地，上述的结束条件为循环执行次数达到预设次数；或循环执行总时长达到预设时长；或当前循环执行的结果与上一次循环执行的结果相似度大于预设阈值。

以结束条件为循环执行次数达到预设次数(如2次)为例，详述上述实施例：

在目标网站中搜索与任务关键词对应的对象信息包括：在目标网站中搜索与任务关键词有关联关系的第一关联信息；将第一关联信息作为新的关键词，在目标网站中搜索与该新的关键词有关联关系的新的第一关联信息，将第一关联信息和新的第一关联信息的并集作为对象信息。

需要说明的是，在将第一关联信息作为下一次执行搜索操作时的当前关键词之前，方法还包括：对第一关联信息进行预处理，得到处理后的第一关联信息；将第一关联信息作为下一次执行搜索操作时的当前关键词包括：将处理后的第一关联信息作为下一次执行搜索操作时的当前关键词。

具体地，对第一关联信息进行预处理，得到处理后的第一关联信息包括：在对第一关联信息进行格式解析之后，从第一关联信息中提取预设字段对应的信息，得到处理后的第一关联信息。

上述将每次执行搜索操作的结果进行汇总，得到对象信息包括：在将每次执行搜索操作的结果进行汇总之后，得到汇总信息；对汇总信息进行去重操作，得到对象信息。

在上述实施例中，可以将每次操作的结果的并集作为汇总信息，并将该汇总信息中进行过滤，以去除一些重复的信息，如属于公司同一个员工的多条信息属于重复信息，保留该多条信息中的信息量最大的信息，将其余的信息删除。

下面结合图5和图6(a)进行详细说明。如图5所示，该方法可以通过如下步骤实现：

步骤S501:接收输入的目标对象的任务关键词，生成信息处理任务。

该信息获取任务即上述的信息获取请求，例如，可以提交一个任务关键词xxx到任务中心。该任务关键词与目标公司相关联，如将目标对象的名称xxx作为任务关键词。

步骤S502：任务调度中心调度执行该信息处理任务。

可选地，可以按照信息处理任务的优先级确定当前执行的信息处理任务，可以按照接收到信息处理任务的时间顺序确定当前执行的信息处理任务。

步骤S503：通过该任务关键词抓取目标对象的汇总信息。

例如，在某个社区网站的服务器中搜索关键词：xxx，可以搜索到很多包含该xxx的用户信息，可选地，一个用户(可以为该公司xxx的一个员工的信息)信息的表现形式可以如图6(a)所示。

具体地，如图6(a)所示，该用户信息可以包括该用户的基本信息、联系信息、工作信息等，该基本信息可以包括如图6(a)所示的，昵称：ABC；真实姓名：大鹏；所在地：广东广州；性别：男；性取向：异性恋；感情状况：单身；生日：1990年1月1日；注册时间：2011-2-1。联系信息可以包括：手机号码：1100312341234。工作信息，工作单位：广东省广州市第一信息公司。在该实施例中，xxx可以为第一信息(公司)。

需要说明的是，在利用xxx搜索到一些关联信息之后，经过解析数据格式，提取有意义的信息字段(如上述的预设字段)，如，姓名、性别、所在地、生日、手机，工作信息等。将提取到的有意义的字段作为新的关键词，再次利用该新的关键词到互联网上检索相关信息，得到更多的信息，汇总得到汇总信息。

步骤S504：对该汇总信息进行数据处理加工，得到处理结果。

对该汇总信息进行再加工分析，得到符合系统模型的模型数据(即上述的对象信息)，如得到符合预期的数据，如该符合预期的数据包括没有重复的数据，该模型数据包含指定属性字段的信息。

步骤S505：从指纹库中心获取与该处理结果对应的目标信息指纹。

步骤S506：基于目标信息指纹确定目标对象的信息泄露状态。

对上述步骤中获取的模型数据与指纹库进行对比计算，得到目标信息指纹，并确定该目标信息指纹的信息泄露状态，以确定目标对象的信息泄露状态。

步骤S507：生成泄露报告。

基于上述的对比计算结果生成泄露报告，并将该泄露报告展示给用户，该分析报告中可以包括：人员姓名、生日、邮箱、在什么网站注册过账号以及信息泄露状态。

本申请上述实施例提供的一种可选方案中，如图6(b)所示，本申请实施例的信息处理方法可以包括以下步骤：

步骤a，用户通过UI界面输入信息获取请求。

其中，信息获取请求用于请求获取目标对象的信息泄露状态，信息泄露状态用于表示目标对象的信息是否处于能够被非法对象获取的状态

步骤b，信息处理装置根据信息获取请求，从目标网站的服务器中，获取目标对象的对象信息。

步骤c，信息处理装置在指纹库中查找与对象信息相匹配的目标信息指纹。

步骤d，信息处理装置在查找到目标信息指纹的情况下，获取指纹库中记录的目标信息指纹的信息泄露状态，将目标信息指纹的信息泄露状态作为目标对象的信息泄露状态。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

实施例2

根据本申请实施例，还提供了一种用于实施上述信息处理方法的信息处理装置，如图7所示，该装置包括：接收单元71、第一获取单元73、查找单元75以及第二获取单元77。

其中，接收单元用于接收信息获取请求，其中，信息获取请求用于请求获取目标对象的信息泄露状态，信息泄露状态用于表示目标对象的信息是否处于能够被非法对象获取的状态；

第一获取单元用于根据信息获取请求，从目标网站的服务器中，获取目标对象的对象信息；

查找单元用于在指纹库中查找与对象信息相匹配的目标信息指纹；

第二获取单元用于在查找到目标信息指纹的情况下，获取指纹库中记录的目标信息指纹的信息泄露状态，将目标信息指纹的信息泄露状态作为目标对象的信息泄露状态。

上述实施例中信息泄露状态用于表示目标对象的对象信息可被非法对象获取的状态。用户可以通过UI界面(人机交互界面)输入信息获取请求，该信息获取请求用于获取某个目标对象的信息泄露状态，该目标对象可以为一个公司或者个人，本申请对此不做限定。

上述的目标网站可以为社交网站。社交网站主要是进行人与人之间的沟通与交流，该社交网站上存在大量的目标对象(如公司或者个人)的信息，如目标对象注册或登录这些社交网站会使用到一些个人信息(如上述实施例中的对象信息)，如姓名、手机号、性别、生日、邮箱以及工作信息等。因此，社交网站是信息泄露的重要源头，例如，如果某目标对象注册或登录的密码处于可以被非法人员获取的状态(处于信息被泄露的状态)，同时，若该目标对象在邮箱中使用的密码与该社交网站的密码相同，则非法对象可以通过该密码进行目标对象的邮箱，获取该目标对象的邮件内容。在这种情况下，如果该邮箱为私人邮箱，那么目标对象泄露的为私人信息；若该邮箱为公司邮箱，那么目标对象泄露的就为公司信息，不论是私人信息或者公司信息的泄露，对于该目标对象来讲，都是很大的损失。

通过上述实施例，使用目标对象的任务关键词(如公司信息、员工信息)，在互联网上搜索是否存在敏感信息的泄露，如果有可以提示目标对象技术修改，以避免对公司或个人造成更大的损失。

根据本申请的上述实施例，查找单元可以包括：查找子单元，用于按照对象信息的指定属性字段，在指纹库中查找与对象信息相匹配的目标信息指纹。

可选地，指定属性字段为多个，查找子单元可以包括：获取模块，用于获取对象信息中各个指定属性字段的第一属性参数；对比模块，用于使用各个指定属性字段的第一属性参数与指纹库中的信息指纹进行对比操作；确定模块，用于若当前比对的信息指纹中各个指定属性字段的第二属性参数与对应的第一属性参数一致，则确定当前比对的信息指纹为目标信息指纹。

可选地，在查找到所述目标信息指纹的情况下，还可以将对象信息和目标信息指纹融合起来，以使对象信息和目标信息指纹更加完整，上述实施例中的装置还可以包括如图8示出的：第三获取单元81，用于在查找到目标信息指纹的情况下，获取目标信息指纹中不存在于对象信息中的第一信息，和对象信息中不存在于目标信息指纹中的第二信息；添加单元83，用于将第一信息添加到对象信息中，以及将第二信息添加到目标信息指纹中。

通过本申请的上述实施例，可以使用预先设定的信息获取请求中的关键词到国内外的社交网站上收集对象信息，将收集到的内容进行提取分析计算，并在特定的指纹库中寻找是否存在敏感信息的泄露。具体地，如图9所示，第一获取单元73包括：提取子单元901，用于提取信息获取请求中的任务关键词；搜索子单元903，用于在目标网站中搜索与任务关键词对应的对象信息。

可选地，搜索子单元可以包括：循环执行模块，用于将任务关键词作为当前关键词，循环执行下述搜索操作，直至达到结束条件，将每次执行搜索操作的结果进行汇总，得到对象信息。其中，循环执行模块包括：搜索子模块，用于在目标网站中搜索与当前关键词有关联关系的第一关联信息；处理子模块，用于将第一关联信息作为当前执行搜索操作的结果，并将第一关联信息作为下一次执行搜索操作时的当前关键词。

进一步地，装置还可以包括：处理单元，用于在将第一关联信息作为下一次执行搜索操作时的当前关键词之前，对第一关联信息进行预处理，得到处理后的第一关联信息；处理子模块具体用于：将处理后的第一关联信息作为下一次执行搜索操作时的当前关键词。

具体地，处理单元可以包括：信息处理模块，用于在对第一关联信息进行格式解析之后，从第一关联信息中提取预设字段对应的信息，得到处理后的第一关联信息。

根据本申请的上述实施例，循环执行模块可以包括：汇总模块，用于在将每次执行搜索操作的结果进行汇总之后，得到汇总信息；去重模块，用于对汇总信息进行去重操作，得到对象信息。

本实施例中所提供的各个模块与方法实施例对应步骤所提供的使用方法相同、应用场景也可以相同。当然，需要注意的是，上述模块涉及的方案可以不限于上述实施例中的内容和场景，且上述模块可以运行在计算机终端或移动终端，可以通过软件或硬件实现。

实施例3

本申请的实施例可以提供一种计算机终端，该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地，在本实施例中，上述计算机终端也可以替换为移动终端等终端设备。

可选地，在本实施例中，上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地，图10是根据本申请实施例的一种计算机终端的结构框图。如图10所示，该计算机终端A可以包括：一个或多个(图中仅示出一个)处理器1001、存储器1003、以及传输装置1005。

其中，存储器1003可用于存储软件程序以及模块，如本申请实施例中的信息处理和装置对应的程序指令/模块，处理器1001通过运行存储在存储器1003内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的信息处理方法。存储器1003可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器1003可进一步包括相对于处理器1001远程设置的存储器，这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

上述的传输装置1005用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置1005包括一个网络适配器(NetworkInterface Control ler，NIC)，其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置1005为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

其中，具体地，存储器1003用于存储预设动作条件和预设权限用户的信息、以及应用程序。

处理器1001可以通过传输装置调用存储器1003存储的信息及应用程序，以执行下述步骤：

步骤S2：接收信息获取请求，其中，信息获取请求用于请求获取目标对象的信息泄露状态，信息泄露状态用于表示目标对象的信息是否处于能够被非法对象获取的状态；

步骤S4：根据信息获取请求，从目标网站的服务器中，获取目标对象的对象信息；

步骤S6：在指纹库中查找与对象信息相匹配的目标信息指纹；

步骤S8：在查找到目标信息指纹的情况下，获取指纹库中记录的目标信息指纹的信息泄露状态，将目标信息指纹的信息泄露状态作为目标对象的信息泄露状态。

本领域普通技术人员可以理解，图10所示的结构仅为示意，计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobi leInternet Devices，MID)、PAD等终端设备。图10其并不对上述电子装置的结构造成限定。例如，计算机终端10还可包括比图10中所示更多或者更少的组件(如网络接口、显示装置等)，或者具有与图10所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(RandomAccess Memory，RAM)、磁盘或光盘等。

实施例4

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例一所提供的信息处理方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：

此处需要说明的是，上述计算机终端群中的任意一个可以与网站服务器建立通信关系。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端、终端或者服务器，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种信息处理方法，其特征在于，包括：

根据信息获取请求，从目标网站的服务器中，获取目标对象的对象信息，其中，所述信息获取请求用于请求获取所述目标对象的信息泄露状态；

在指纹库中查找与所述对象信息相匹配的目标信息指纹；

在查找到所述目标信息指纹的情况下，获取所述指纹库中记录的目标信息指纹的信息泄露状态，并将所述目标信息指纹的信息泄露状态作为所述目标对象的信息泄露状态；

其中，所述信息泄露状态用于表示所述目标对象的对象信息可被非法对象获取的状态；

所述指纹库中存储有预先收集的信息指纹，所述指纹库中还记录有所述信息指纹的信息泄露状态。

2.根据权利要求1所述的方法，其特征在于，在指纹库中查找与所述对象信息相匹配的目标信息指纹包括：

按照所述对象信息的指定属性字段，在所述指纹库中查找与所述对象信息相匹配的目标信息指纹。

3.根据权利要求2所述的方法，其特征在于，所述指定属性字段为多个，按照所述对象信息的指定属性字段，在所述指纹库中查找与所述对象信息相匹配的目标信息指纹包括：

获取对象信息中各个指定属性字段的第一属性参数；

使用所述各个指定属性字段的第一属性参数与所述指纹库中的信息指纹进行对比操作；

若当前比对的信息指纹中各个指定属性字段的第二属性参数与对应的所述第一属性参数一致，则确定当前比对的信息指纹为所述目标信息指纹。

4.根据权利要求1所述的方法，其特征在于，获取所述指纹库中记录的所述目标信息指纹的信息泄露状态包括：

读取所述指纹库中记录的所述目标信息指纹的信息泄露状态。

5.根据权利要求1所述的方法，其特征在于，在查找到所述目标信息指纹的情况下，所述方法还包括：

获取所述目标信息指纹中不存在于所述对象信息中的第一信息，和所述对象信息中不存在于所述目标信息指纹中的第二信息；

将所述第一信息添加到所述对象信息中，以及将所述第二信息添加到所述目标信息指纹中。

6.根据权利要求1所述的方法，其特征在于，获取目标对象的对象信息包括：

提取所述信息获取请求中的任务关键词；

在所述目标网站中搜索与所述任务关键词对应的所述对象信息。

7.根据权利要求6所述的方法，其特征在于，在所述目标网站中搜索与所述任务关键词对应的所述对象信息包括：

将所述任务关键词作为当前关键词，循环执行下述搜索操作，直至达到结束条件，将每次执行搜索操作的结果进行汇总，得到所述对象信息：

在所述目标网站中搜索与所述当前关键词有关联关系的第一关联信息；

将所述第一关联信息作为当前执行搜索操作的结果，并将所述第一关联信息作为下一次执行搜索操作时的当前关键词。

8.根据权利要求7所述的方法，其特征在于，

在将所述第一关联信息作为下一次执行搜索操作时的当前关键词之前，所述方法还包括：对所述第一关联信息进行预处理，得到处理后的第一关联信息；

将所述第一关联信息作为下一次执行搜索操作时的当前关键词包括：将所述处理后的第一关联信息作为所述下一次执行搜索操作时的当前关键词。

9.根据权利要求8所述的方法，其特征在于，对所述第一关联信息进行预处理，得到处理后的第一关联信息包括：

在对所述第一关联信息进行格式解析之后，从所述第一关联信息中提取预设字段对应的信息，得到所述处理后的第一关联信息。

10.根据权利要求7所述的方法，其特征在于，将每次执行搜索操作的结果进行汇总，得到所述对象信息包括：

在将每次执行搜索操作的结果进行汇总之后，得到汇总信息；

对所述汇总信息进行去重操作，得到所述对象信息。

11.根据权利要求7所述的方法，其特征在于，达到结束条件包括下述之一：

循环执行次数达到预设次数；

循环执行总时长达到预设时长；

当前循环执行的结果与上一次循环执行的结果相似度大于预设阈值。

12.一种信息处理装置，其特征在于，包括：

第一获取单元，用于根据信息获取请求，从目标网站的服务器中，获取目标对象的对象信息，其中，所述信息获取请求用于请求获取所述目标对象的信息泄露状态；

查找单元，用于在指纹库中查找与所述对象信息相匹配的目标信息指纹；

第二获取单元，用于在查找到所述目标信息指纹的情况下，获取所述指纹库中记录的所述目标信息指纹的信息泄露状态，将所述目标信息指纹的信息泄露状态作为所述目标对象的信息泄露状态；