具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
目前,以即时通讯作为诱骗手段的网络钓鱼行为正越来越多的被诈骗者们实施。比较常见的手法是在网站上显示客服账号,并利用客服账号发送消息将用户导向陷阱以骗取用户的敏感信息等等;这里的网站可以是仿造的网站、租赁的网站或者自建的网站等等;为方便与用户的沟通交流,这里的客服账号通常包括各种即时通讯(IM,InstantMessenger)账号,如QQ账号、MSN账号、旺旺账号、微信账号等等。
由于现有检测钓鱼网站的方法能检测出已知的钓鱼网站并进行拦截,故不法分子在被拦截后会改变网站继续钓鱼,但由于钓鱼所使用的即时通讯账号本身不会被拦截,故改变后的网站仍会使用原有的客服账号。
本发明实施例利用钓鱼网站所使用客服账号不变的特性检测钓鱼网站,即使改变后的钓鱼网站未被及时收录到钓鱼网站黑名单中,但由于改变后的钓鱼网站所使用的客服账号是不变的,本发明能够通过黑名单数据库检测出不变的客服账号中的即时通讯对象,并将该即时通讯对象对应网站确定为钓鱼网站,因此,能够扩展钓鱼网站的检测范围。
参照图1,示出了根据本发明一个实施例的检测钓鱼网站的方法的流程图,具体可以包括:
步骤101、从目标网站的页面信息中提取出客服数据特征,并从所述客服数据特征中提取出即时通讯对象;
所述目标网站即是需要检测的可疑网站。通常,从客户端浏览器发出的目标网站的访问请求中可以获取到目标网站的网址统一资源定位符(URL,Uniform ResourceLocato),依据该网址可以从服务端获取到相应的页面信息。
由于网页通常用超文本标记语言(HTML,HyperText Mark-up Language)描述,故在实际应用中,可以采用直接解析HTML文档、分析HTML层次结构等方法来从目标网站的页面信息中提取出客服数据特征。由于网站通常会在特定区域显示客户头像及相应的即时通讯对象,故在提取时,可以首先查找页面信息中的客户头像,然后提取该客户头像周围区域(如下方、右下方等)的数据信息,得到相应的客服数据特征。
对于每一种即时通讯软件,其均具有对应的特征标识,如QQ软件的特征标识就是字母QQ或企鹅,MSN软件、旺旺软件和微信账号均具有对应的图标等等;在具体实施中,可以首先识别所述客服数据特征中即时通讯软件的标识,然后提取出对应的即时通讯对象,如QQ号码等。
步骤102、查询所述即时通讯对象是否在黑名单数据库中;所述黑名单数据库中存储有涉及已证实的不法行为的即时通讯对象;
黑名单数据库存储的即时通讯对象涉及已证实的不法行为,且已经产生了真实受害者(个人、团体或公司)。在实际应用中,可以采用收集方式进行涉及已证实的不法行为的即时通讯对象的收集。
在本发明的一种应用示例中,可以采用用户举报的收集方式。例如,某即时通讯对象被其他用户举报以发送电子邮件的方式传播虚假中奖信息,以领奖保证金的名义被骗取若干元,并提供相关证据确认其欺诈行为,故可以将该即时通讯对象收录在黑名单数据库中。
在本发明的另一种应用示例中,可以采用网购先赔的收集方式;具体地,安全平台可与用户事前协议,用户在进行网络购物时,如果安全平台提供的服务未能及时拦截钓鱼网站而导致用户遭受财产损失,则安全平台会为预先为用户提供赔付,其中要求用户在申请赔付时提交相应的证据信息,根据该方式,可以从用户提交的证据信息中提取出相应的即时通讯对象,并收录至黑名单数据库中。
当然,上述只是作为示例,本领域技术人员可以根据实际情况采用各种收集方式进行涉及已证实的不法行为的即时通讯对象的收集,本发明实施例对涉及已证实的不法行为的即时通讯对象的收集方式不加以限制。
步骤103、若所述即时通讯对象在黑名单数据库中,则确定所述即时通讯对象对应目标网站为钓鱼网站。
在实际应用中,在确定所述即时通讯对象对应目标网站为钓鱼网站后,可以直接拦截该钓鱼网站,或者发出相应的提示信息。
总之,本发明实施例针对钓鱼网站所使用的客服账号是不变的特性进行钓鱼网站的检测,具体而言,从目标网站的页面信息中提取出即时通讯对象,并查询所述即时通讯对象是否在黑名单数据库中,若所述即时通讯对象在黑名单数据库中,则确定所述即时通讯对象对应目标网站为钓鱼网站;其中,所述黑名单数据库中存储有涉及已证实的不法行为的即时通讯对象;使用本发明实施例,即使改变后的钓鱼网站未被及时收录到钓鱼网站黑名单中,但由于改变后的钓鱼网站所使用的客服账号是不变的,本发明能够通过黑名单数据库检测出不变的客服账号中的即时通讯对象,并将该即时通讯对象对应网站确定为钓鱼网站,因此,相对于现有技术无法检测出未能及时收集的钓鱼网站,本发明实施例能够扩展钓鱼网站的检测范围。
参照图2,示出了根据本发明一个实施例的检测钓鱼网站的方法的流程图,具体可以包括:
步骤201、从目标网站的页面信息中提取出客服数据特征,并从所述客服数据特征中提取出即时通讯对象;
步骤202、查询所述即时通讯对象是否在黑名单数据库中;所述黑名单数据库中存储有涉及已证实的不法行为的即时通讯对象;
步骤203、若所述即时通讯对象在黑名单数据库中,则确定所述即时通讯对象对应目标网站为钓鱼网站;
步骤204、查询所述即时通讯对象是否在高危名单数据库中;所述高危名单数据库中存储有涉及预置高危行为的即时通讯对象;
步骤205、若所述即时通讯对象在高危名单数据库中,则确定所述即时通讯对象对应目标网站为高危钓鱼网站。
本实施例的检测钓鱼网站的方法在上述图1所示实施例的基础上,进一步还可以包括步骤204和步骤205,其中,步骤204和步骤205与步骤202和步骤203可以同时执行,也可以具有先后顺序,例如,可以首先执行步骤203,若所述即时通讯对象不在黑名单数据库中,然后再执行步骤204,本申请对步骤204和步骤205与步骤202和步骤203的先后顺序不加以限制。
所述高危名单数据库中存储有涉及预置高危行为的即时通讯对象,其中的即时通讯对象目前还没发生实质的非法行为产生受害者或者还没收到受害者的受害举报,但已经产生了预置高危行为,这里的预置高危行为可以用于表示具有高危险性的行为,这些高危险性的行为尚未被证实违法且尚未被证实产生真实受害者。例如,所述预置高危行为具体可以包括某即时通讯对象对应用户在信息发布平台上发布的异常交易价格信息的行为等等,又如,所述预置高危行为具体可以包括被用户举报的某即时通讯对象向好友发送兼职、充值等涉及钱财的敏感信息的行为等等,这些行为具有高危险性,但尚未被证实产生真实受害者。
在发明的一种优选实施例中,可以通过如下步骤建立所述高危名单数据库:
步骤S100、依据自定义关键词,抓取在网络平台之上发布的信息及该信息对应的即时通讯对象;
在具体实现中,所述自定义关键词可以包括各种涉及不安全信息的关键词,可以为各种涉及钱财的敏感信息的关键词,例如兼职、金币、低价等,也可以为涉及色情或者暴力信息的关键词等等。
这里的网络平台可以包括信息发布平台、游戏平台、即时通讯群平台等,其中,在即时通讯群平台中即时通讯对象使用自身账号发布相应的信息,在信息发布平台和游戏平台上发布的信息中带有的联系对象为即时通讯对象。
例如,某即时通讯对象为在网络游戏平台的公共聊天频道中经常出现异常低价买卖装备、游戏币(如正常的游戏币交易价为1:1,但该即时通讯对象发布的交易价是1:100)、代为提升角色等级等异常交易信息的联系对象。此类此异常交易信息不仅违反网络游戏平台的相关管理规定,而且容易造成玩家的虚拟财产和现实财产的损失。又例如,某即时通讯对象在某网络平台以低价发售机票、火车票等,或者是低价出租房屋(如某小区的两房一厅的出租均价为2500元,但该即时通讯对象发布的两房一厅的出租价1200元),等等。
步骤S101、按照预设的过滤规则对所抓取的即时通讯对象进行过滤;
所抓取的即时通讯对象只是在网络平台之上发布了一些涉及自定义关键词的信息,但这些所抓取的即时通讯对象是否具有高危险性,还需要按照过滤规则进行过滤。
在本发明的一种优选实施例中,所述过滤规则具体可以包括依据如下信息中的一项或多项制定的安全规则:
即时通讯对象的年限、即时通讯对象在预设时间段内被请求安全检测的次数、即时通讯对象被请求检测的用户的地理分布、即时通讯对象所对应发布信息的指标和即时通讯对象的行为。
其中,即时通讯对象的年限用于表示该即时通讯对象的注册年限。假设即时通讯对象为QQ账号,那么从申请成功QQ账号的那天开始,一直到第二年的该天,QQ账号的年限就是一年;由于不法分子为避免被识别,会频繁申请新的QQ账号来行骗,故通常即时通讯对象的年限越短,对应即时通讯对象的危险性程度越高,在实际中,可以设置即时通讯对象的年限与安全性的对应关系,以制定相应的过滤规则。
其他用户对即时通讯对象的安全检测请求在一定程度上分辩出该即时通讯对象的危险性程度。通常,即时通讯对象在越短时间段内被请求安全检测的次数越多,则说明其危险性程度越高,并且,即时通讯对象被请求检测的用户的地理分布广或者分布集中,则说明其危险性程度较高。例如,当在预设时间段(时间比较短)请求安全检测的用户在预设数量(数量大)以上,并且分布广(全国各地)或者分布集中(集中某个城市),此类异常情况有可能为该即时通讯对象在某个全国性的信息发布平台(例如论坛、交易平台)或者地域性的信息发布平台(例如某城市的论坛)发布了异常交易等非法信息,故可以认为该即时通讯对象涉嫌欺诈等行为,其危险性程度较高,不符合过滤规则。又例如,当通讯对象为学生时,请求对其进行安全检测的其他用户大多为其同学朋友,请求的数量少,时间跨度大、不集中,属于安全范围内,故符合过滤规则。
即时通讯对象所对应发布信息的指标可被用于对发布信息进行过滤,例如,某即时通讯对象在某网络平台发布了低价出租房屋(某小区的两房一厅)的信息,该信息涉及的价格是否具有危险性,可以依据该小区的两房一厅的出租均价制定相应信息的危险等级,假设出租均价为2500元,那么危险等级0(表示在安全范围内)对应的价格区间可以包括[2000,2500],那么危险等级1(表示轻度危险)对应的价格区间可以包括[1500,2000],那么危险等级2(表示重度危险)对应的价格区间可以包括[1000,1500],那么对应的过滤规则可以为:如果信息的危险等级小于1则符合过滤规则将其滤除,如果信息的危险等级大于等于1,则不符合过滤规则将其保留。
即时通讯对象的行为可用于表示即时通讯对象自身产生的行为,具体可以包括即时通讯对象向好友发送的消息、即时通讯对象的登录行为或者操作行为等等,例如,某即时通讯对象大量地对其好友发送兼职、充值等涉及钱财的敏感信息,同时存在短时间内更换登录地点或者批量删除好友、退出通讯群等异常情况,此类情况可能存在被盗号的可能,危险等级较高。
可以理解,本领域技术人员可以依据上述信息中的一项或多项制定的过滤规则,如果符合过滤规则则说明即时通讯对象的危险性程度较低将其滤除,如果不符合过滤规则则说明即时通讯对象的危险性程度较高将其保留。
步骤S102、将不符合过滤规则的即时通讯对象收录在高危名单数据库中。
可以理解,上述只是作为建立所述高危名单数据库的优选实施例,本领域技术人员可以根据需求,采用其它方法建立所述高危名单数据库,例如,将用户举报的大量地对其好友发送兼职、充值等涉及钱财的敏感信息的即时通讯对象收录在高危名单数据库中,又如,将某网络平台上发布的低价出租房屋(如某小区的两房一厅的出租均价为2500元,但该即时通讯对象发布的两房一厅的出租价1200元)的信息中带有的即时通讯对象收录在高危名单数据库中等等。
在实际应用中,在确定所述即时通讯对象对应目标网站为高危钓鱼网站后,可以发出相应的提示信息,以使用户提高警惕。
需要说明的是,对于高危名单数据库中的即时通讯对象,可以定期获取其最新行为,并根据最新行为对高危名单数据库进行维护,例如,在该即时通讯对象被证实由于被盗号或者收录的信息错误等原因而涉及欺诈等不法行为时,将其转入黑名单数据库中,当其被证实不涉及欺诈等不法行为时,也可将其从高危名单数据库中消除。
综上,本实施例除了通过黑名单数据库查询涉及已证实的不法行为的即时通讯对象以检测钓鱼网站外,还可以通过高危名单数据库查询涉及预置高危行为的即时通讯对象以检测高危钓鱼网站;由于钓鱼网站从利用即时通讯对象开始钓鱼到钓鱼成功往往需要一定的时间,而在钓鱼成功时才会产生真实受害者,真实受害者才会通过举报、申请理赔等方式证实即时通讯对象涉及不法行为,故本实施例查询涉及预置高危行为的即时通讯对象,能够在高危钓鱼网站利用该即时通讯对象产生真实受害者之前将其检测出来,因此能够提高钓鱼网站检测的及时性。
参照图3,示出了根据本发明一个实施例的检测钓鱼网站的方法的流程图,具体可以包括:
步骤301、从目标网站的页面信息中提取出客服数据特征,并从所述客服数据特征中提取出即时通讯对象;
步骤302、查询所述即时通讯对象是否在黑名单数据库中;所述黑名单数据库中存储有涉及已证实的不法行为的即时通讯对象;
步骤303、若所述即时通讯对象在黑名单数据库中,则确定所述即时通讯对象对应目标网站为钓鱼网站;
步骤304、查询所述即时通讯对象是否在疑似名单数据库中;所述疑似名单数据库中存储有涉及预置中危行为的即时通讯对象;
步骤305、若所述即时通讯对象在疑似名单数据库中,则确定所述即时通讯对象对应目标网站为疑似钓鱼网站。
本实施例的检测钓鱼网站的方法在上述图1所示实施例的基础上,进一步还可以包括步骤304和步骤305,其中,步骤304和步骤305与步骤302和步骤303可以同时执行,也可以具有先后顺序,例如,可以首先执行步骤303,若所述即时通讯对象不在黑名单数据库中,然后再执行步骤304,本申请对步骤304和步骤305与步骤302和步骤303的先后顺序不加以限制。
所述疑似名单数据库中存储有涉及预置中危行为的即时通讯对象,其中的即时通讯对象目前还没发生实质的非法行为产生受害者或者还没收到受害者的受害举报,但已经产生了预置中危行为,这里的预置中危行为的危险性比上述预置高危行为的危险性稍低,可以用于表示具有中危险性的行为,这些中危险性的行为尚未被证实违法且尚未被证实产生真实受害者。例如,某即时通讯对象在短时间内(例如1个星期)被全国各地大量的用户提交安全检测请求,此类异常情况中该即时通讯对象涉嫌进行欺诈等中危险性的行为。又例如,某即时通讯对象大量地对其好友发送兼职、充值等涉及钱财的敏感信息,同时存在短时间内更换登录地点或者批量删除好友、退出通讯群等异常情况,此类情况可能存在被盗号的可能。又例如,某即时通讯对象使用年限低(例如1个月内),但是大量发布兼职、租房等信息,此类情况可能存在欺诈等中危险性的行为的风险。
本发明实施例可以提供如下建立所述疑似名单数据库的技术方案:
方案一、
方案一依据自定义关键词,抓取在网络平台之上发布的信息及该信息对应的即时通讯对象;按照预设的过滤规则对所抓取的即时通讯对象进行过滤;将通过过滤规则的即时通讯对象收录在疑似名单数据库中。方案一与前述建立所述高危名单数据库的技术方案的原理类似,不同的是,相对于不符合过滤规则的即时通讯对象,符合过滤规则的即时通讯对象的危险性程度较低,故将其收录在疑似名单数据库中。
方案二、
方案二针对被请求安全检测的即时通讯对象,依据其在预设时间段内被请求安全检测的次数和其被请求检测的用户的地理分布,判断其是否符合预置的中危条件,若是,则将其收录在疑似名单数据库中。
其他用户对即时通讯对象的安全检测请求在一定程度上分辩出该即时通讯对象的危险性程度。通常,即时通讯对象在越短时间段内被请求安全检测的次数越多,则说明其危险性程度越高,并且,即时通讯对象被请求检测的用户的地理分布广或者分布集中,则说明其危险性程度较高。
在具体实现中,本领域技术人员根据根据需要灵活地预置上述中危条件。例如,当在预设时间段(时间比较短)请求安全检测的用户在预设数量(数量大)以上,并且分布广(全国各地)或者分布集中(集中某个城市),此类异常情况有可能为该即时通讯对象在某个全国性的信息发布平台(例如论坛、交易平台)或者地域性的信息发布平台(例如某城市的论坛)发布了异常交易等非法信息,故可以认为该即时通讯对象涉嫌欺诈等行为,其危险性程度较高,故可以相应预置相应的中危条件。又例如,当通讯对象为学生时,请求对其进行安全检测的其他用户大多为其同学朋友,请求的数量少,时间跨度大、不集中,属于安全范围内,故,故可以相应预置相应的中危条件。
在实际应用中,在确定所述即时通讯对象对应目标网站为疑似钓鱼网站后,可以发出相应的提示信息,以使用户提高警惕。
需要说明的是,对于疑似名单数据库中的即时通讯对象,可以定期获取其最新行为,并根据最新行为对疑似名单数据库进行维护,例如,在该即时通讯对象被证实由于被盗号或者收录的信息错误等原因而涉及欺诈等不法行为时,将其转入黑名单数据库中;又如,可以在该即时通讯对象的最新行为的危险性增高时,将其转入高危名单数据中;再如,当其被证实不涉及欺诈等不法行为时,也可将其从疑似名单数据库中消除。
综上,本实施例除了通过黑名单数据库查询涉及已证实的不法行为的即时通讯对象以检测钓鱼网站外,还可以通过疑似名单数据库查询涉及预置中危行为的即时通讯对象以检测疑似钓鱼网站;由于钓鱼网站从利用即时通讯对象开始钓鱼到钓鱼成功往往需要一定的时间,而在钓鱼成功时才会产生真实受害者,真实受害者才会通过举报、申请理赔等方式证实即时通讯对象涉及不法行为,故本实施例查询涉及预置中危行为的即时通讯对象,能够在疑似钓鱼网站利用该即时通讯对象产生真实受害者之前将其检测出来,而由于预置中危行比较预置高危行为的危险性较低,因此相对于疑似名单数据库,本实施例能够进一步提高钓鱼网站检测的及时性。
参照图4,示出了根据本发明一个实施例的检测钓鱼网站的方法的流程图,具体可以包括:
步骤401、从目标网站的页面信息中提取出客服数据特征,并从所述客服数据特征中提取出即时通讯对象;
步骤402、查询所述即时通讯对象是否在黑名单数据库中;所述黑名单数据库中存储有涉及已证实的不法行为的即时通讯对象;
步骤403、若所述即时通讯对象在黑名单数据库中,则确定所述即时通讯对象对应目标网站为钓鱼网站;
步骤404、查询所述即时通讯对象是否在白名单数据库中;所述白名单数据库中存储有符合安全规则的即时通讯对象;
步骤405、若所述即时通讯对象在白名单数据库中,则确定所述即时通讯对象对应目标网站为安全网站。
本实施例的检测钓鱼网站的方法在上述图1所示实施例的基础上,进一步还可以包括步骤404和步骤405,其中,步骤404和步骤405与步骤402和步骤403可以同时执行,也可以具有先后顺序,例如,可以首先执行步骤403,若所述即时通讯对象不在黑名单数据库中,然后再执行步骤404,本申请对步骤404和步骤405与步骤402和步骤403的先后顺序不加以限制。
所述白名单数据库中存储的符合安全规则的即时通讯对象的安全性程度较高,在网站使用所述白名单数据库中即时通讯对象时,通常可以认为该网站为安全网站,用户则可以放心使用该网站。
在本发明的一种优选实施例中,所述安全规则具体可以包括如下规则中的一项或多项:
即时通讯对象与合法通讯对象保持预置时间段的好友关系;
经过身份认证的即时通讯对象。
其中,所述合法通讯对象具体可以包括:不存在于上述黑名单数据库、高危名单数据库和疑似名单数据库中的即时通讯对象,或者,即时通讯对象的年限较长(如超过10年)的即时通讯对象等,所述预置时间段具体可以包括一年以上等等;所述身份认证具体可以包括:个人、团体或公司的认证等等。
在实际应用中,在确定所述即时通讯对象对应目标网站为安全网站后,可以发出相应的提示信息,以使用户放心使用。
综上,本实施例除了通过黑名单数据库查询涉及已证实的不法行为的即时通讯对象以检测钓鱼网站外,还可以通过白名单数据库查询符合安全规则的即时通讯对象以检测安全网站;所述白名单数据库中存储的符合安全规则的即时通讯对象的安全性程度较高,在网站使用所述白名单数据库中即时通讯对象时,通常可以认为该网站为安全网站,用户则可以放心使用该网站,因此,本实施例能够提高用户上网浏览的便利性。
图1-图4所示实施例分别通过黑名单数据库、高危名单数据库、疑似名单数据库和白名单数据库进行钓鱼网站的检测,可以理解,本领域技术人员可以根据实际需求使用所述多个数据库中的一种或多种,也即,图1-图4所示实施例的相互结合也是可行的。
参照图5,示出了根据本发明一个实施例的检测钓鱼网站的装置的结构图,具体可以包括:
提取模块501,用于从目标网站的页面信息中提取出客服数据特征,并从所述客服数据特征中提取出即时通讯对象;
第一查询模块502,用于查询所述即时通讯对象是否在黑名单数据库中;所述黑名单数据库中存储有涉及已证实的不法行为的即时通讯对象;及
第一确定模块503,用于当所述即时通讯对象在黑名单数据库中时,确定所述即时通讯对象对应目标网站为钓鱼网站。
在本发明的一种优选实施例中,所述装置还可以包括:
第二查询模块,用于查询所述即时通讯对象是否在高危名单数据库中;所述高危名单数据库中存储有涉及预置高危行为的即时通讯对象;
第二确定模块,用于当所述即时通讯对象在高危名单数据库中时,确定所述即时通讯对象对应目标网站为高危钓鱼网站。
在本发明的另一种优选实施例中,所述装置还可以包括:
第三查询模块,用于查询所述即时通讯对象是否在疑似名单数据库中;所述疑似名单数据库中存储有涉及预置中危行为的即时通讯对象;
第三确定模块,用于当所述即时通讯对象在疑似名单数据库中,则确定所述即时通讯对象对应目标网站为疑似钓鱼网站。
在本发明的再一种优选实施例中,所述装置还可以包括:
第四查询模块,用于查询所述即时通讯对象是否在白名单数据库中;所述白名单数据库中存储有符合安全规则的即时通讯对象;
第四确定模块,用于当所述即时通讯对象在白名单数据库中,则确定所述即时通讯对象对应目标网站为安全网站。
在本发明的一种优选实施例中,所述装置还可以包括:用于建立所述高危名单数据库的第一建立模块;
所述第一建立模块具体可以包括:
第一抓取子模块,用于依据自定义关键词,抓取在网络平台之上发布的信息及该信息对应的即时通讯对象;
第一过滤子模块,用于按照预设的过滤规则对所抓取的即时通讯对象进行过滤;及
第一收录子模块,用于将不符合过滤规则的即时通讯对象收录在高危名单数据库中。
在本发明的另一种优选实施例中,所述装置还可以包括:用于建立所述疑似名单数据库的第二建立模块;
所述第二建立模块具体可以包括:
第二抓取子模块,用于依据自定义关键词,抓取在网络平台之上发布的信息及该信息对应的即时通讯对象;
第二过滤子模块,用于按照预设的过滤规则对所抓取的即时通讯对象进行过滤;及
第二收录子模块,用于不符合过滤规则的即时通讯对象收录在高危名单数据库中;
第三收录子模块,用于针对被请求安全检测的即时通讯对象,依据其在预设时间段内被请求安全检测的次数和其被请求检测的用户的地理分布,判断其是否符合预置的中危条件,若是,则将其收录在疑似名单数据库中。
在本发明实施例中,优选的是,所述过滤规则具体可以包括依据如下信息中的一项或多项制定的安全规则:
即时通讯对象的年限、即时通讯对象在预设时间段内被请求安全检测的次数、即时通讯对象被请求检测的用户的地理分布、即时通讯对象所对应发布信息的指标和即时通讯对象的行为。
在本发明实施例中,优选的是,所述安全规则具体可以包括如下规则中一项或多项:
即时通讯对象与合法通讯对象保持预置时间段的好友关系;
经过身份认证的即时通讯对象。
在本发明实施例中,优选的是,所述装置还可以包括:用于针对所确定的钓鱼网站、高危钓鱼网站、疑似钓鱼网站或者安全网站,发出相应的提示信息的提示模块。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个发明内容中所明确记载的特征更多的特征。更确切地说,如下面的说明书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的发明内容由此明确地并入该具体实施方式。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的说明书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附说明书的范围的情况下可设计出替换实施例。在说明书中,不应将位于括号之间的任何参考符号构造成对本发明的限制。单词“包含”不排除存在未列在说明书中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元说明书中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种检测钓鱼网站的方法,包括:
从目标网站的页面信息中提取出客服数据特征,并从所述客服数据特征中提取出即时通讯对象;
查询所述即时通讯对象是否在黑名单数据库中;所述黑名单数据库中存储有涉及已证实的不法行为的即时通讯对象;
若所述即时通讯对象在黑名单数据库中,则确定所述即时通讯对象对应目标网站为钓鱼网站。
A2、如A1所述的方法,所述方法还包括:
查询所述即时通讯对象是否在高危名单数据库中;所述高危名单数据库中存储有涉及预置高危行为的即时通讯对象;
若所述即时通讯对象在高危名单数据库中,则确定所述即时通讯对象对应目标网站为高危钓鱼网站。
A3、如A1所述的方法,所述方法还包括:
查询所述即时通讯对象是否在疑似名单数据库中;所述疑似名单数据库中存储有涉及预置中危行为的即时通讯对象;
若所述即时通讯对象在疑似名单数据库中,则确定所述即时通讯对象对应目标网站为疑似钓鱼网站。
A4、如A1所述的方法,所述方法还包括:
查询所述即时通讯对象是否在白名单数据库中;所述白名单数据库中存储有符合安全规则的即时通讯对象;
若所述即时通讯对象在白名单数据库中,则确定所述即时通讯对象对应目标网站为安全网站。
A5、如A2所述的方法,通过如下步骤建立所述高危名单数据库:
依据自定义关键词,抓取在网络平台之上发布的信息及该信息对应的即时通讯对象;
按照预设的过滤规则对所抓取的即时通讯对象进行过滤;
将不符合过滤规则的即时通讯对象收录在高危名单数据库中。
A6、如A3所述的方法,通过如下步骤建立所述疑似名单数据库:
依据自定义关键词,抓取在网络平台之上发布的信息及该信息对应的即时通讯对象;按照预设的过滤规则对所抓取的即时通讯对象进行过滤;将通过过滤规则的即时通讯对象收录在疑似名单数据库中;或者
针对被请求安全检测的即时通讯对象,依据其在预设时间段内被请求安全检测的次数和其被请求检测的用户的地理分布,判断其是否符合预置的中危条件,若是,则将其收录在疑似名单数据库中。
A7、如A5或A6所述的方法,所述过滤规则包括依据如下信息中的一项或多项制定的安全规则:
即时通讯对象的年限、即时通讯对象在预设时间段内被请求安全检测的次数、即时通讯对象被请求检测的用户的地理分布、即时通讯对象所对应发布信息的指标和即时通讯对象的行为。
A8、如A4所述的方法,所述安全规则包括如下规则中一项或多项:
即时通讯对象与合法通讯对象保持预置时间段的好友关系;
经过身份认证的即时通讯对象。
A9、如A1至A6中任一所述的方法,其特征在于,所述方法还包括:针对所确定的钓鱼网站、高危钓鱼网站、疑似钓鱼网站或者安全网站,发出相应的提示信息。
本发明还公开了B10、一种检测钓鱼网站的装置,包括:
提取模块,用于从目标网站的页面信息中提取出客服数据特征,并从所述客服数据特征中提取出即时通讯对象;
第一查询模块,用于查询所述即时通讯对象是否在黑名单数据库中;所述黑名单数据库中存储有涉及已证实的不法行为的即时通讯对象;及
第一确定模块,用于当所述即时通讯对象在黑名单数据库中时,确定所述即时通讯对象对应目标网站为钓鱼网站。
B11、如B10所述的装置,所述装置还包括:
第二查询模块,用于查询所述即时通讯对象是否在高危名单数据库中;所述高危名单数据库中存储有涉及预置高危行为的即时通讯对象;
第二确定模块,用于当所述即时通讯对象在高危名单数据库中时,确定所述即时通讯对象对应目标网站为高危钓鱼网站。
B12、如B10所述的装置,所述装置还包括:
第三查询模块,用于查询所述即时通讯对象是否在疑似名单数据库中;所述疑似名单数据库中存储有涉及预置中危行为的即时通讯对象;
第三确定模块,用于当所述即时通讯对象在疑似名单数据库中,则确定所述即时通讯对象对应目标网站为疑似钓鱼网站。
B13、如B10所述的装置,所述装置还包括:
第四查询模块,用于查询所述即时通讯对象是否在白名单数据库中;所述白名单数据库中存储有符合安全规则的即时通讯对象;
第四确定模块,用于当所述即时通讯对象在白名单数据库中,则确定所述即时通讯对象对应目标网站为安全网站。
B14、如B11所述的装置,所述装置还包括:用于建立所述高危名单数据库的第一建立模块;
所述第一建立模块包括:
第一抓取子模块,用于依据自定义关键词,抓取在网络平台之上发布的信息及该信息对应的即时通讯对象;
第一过滤子模块,用于按照预设的过滤规则对所抓取的即时通讯对象进行过滤;及
第一收录子模块,用于将不符合过滤规则的即时通讯对象收录在高危名单数据库中。
B15、如B12所述的装置,其特征在于,所述装置还包括:用于建立所述疑似名单数据库的第二建立模块;
所述第二建立模块包括:
第二抓取子模块,用于依据自定义关键词,抓取在网络平台之上发布的信息及该信息对应的即时通讯对象;
第二过滤子模块,用于按照预设的过滤规则对所抓取的即时通讯对象进行过滤;及
第二收录子模块,用于不符合过滤规则的即时通讯对象收录在高危名单数据库中;
第三收录子模块,用于针对被请求安全检测的即时通讯对象,依据其在预设时间段内被请求安全检测的次数和其被请求检测的用户的地理分布,判断其是否符合预置的中危条件,若是,则将其收录在疑似名单数据库中。
B16、如B14所述的装置,所述过滤规则包括依据如下信息中的一项或多项制定的安全规则:
即时通讯对象的年限、即时通讯对象在预设时间段内被请求安全检测的次数、即时通讯对象被请求检测的用户的地理分布、即时通讯对象所对应发布信息的指标和即时通讯对象的行为。
B17、如B13所述的装置,其特征在于,所述安全规则包括如下规则中一项或多项:
即时通讯对象与合法通讯对象保持预置时间段的好友关系;
经过身份认证的即时通讯对象。
B18、如B11至B15中任一所述的装置,其特征在于,还包括:用于针对所确定的钓鱼网站、高危钓鱼网站、疑似钓鱼网站或者安全网站,发出相应的提示信息的提示模块。