发明内容
针对现有技术中的缺陷,本发明提供了一种信息模糊处理方法及装置,该方法能够自动模糊处理内容信息中的关键信息,提高信息处理效率,降低成本。
第一方面,本发明提供一种信息模糊处理装置,该信息模糊处理装置应用于信息发布平台,所述装置包括:
获取单元,用于获取所述信息发布平台中需要进行发布的内容信息,所述内容信息包括图像数据和/或文字数据;
关键信息确定单元,用于根据预设识别规则确定所述内容信息中的关键信息,所述关键信息为所述内容信息发布前需要进行模糊处理的信息;
处理单元,用于根据预设模糊规则对所述内容信息中的所述关键信息进行模糊处理。
可选地,在所述内容信息为图像数据时,关键信息确定单元,具体用于
根据预设识别规则确定所述图像数据中关键信息的类别,以及该关键信息在所述图像数据中的区域。
可选地,所述处理单元,具体用于
根据预设模糊规则对所述内容信息中的所述关键信息的区域打马赛克。
可选地,所述关键信息包括:网站关键信息和/或个人关键信息;
所述网站关键信息包括:网址、IP地址字段、特殊图像和/或预设敏感信息;
所述个人关键信息包括:用户名、邮箱或电话。
可选地,所述识别规则和所述模糊规则为从服务器中下载的与所述信息发布平台相匹配的规则。
第二方面,本发明还提供一种信息模糊处理方法,应用于信息发布平台,包括:
获取所述信息发布平台中需进行发布的内容信息,所述内容信息包括图像数据和/或文字数据;
根据预设识别规则确定所述内容信息中的关键信息,所述关键信息为所述内容信息发布前需要进行模糊处理的信息;
根据预设模糊规则对所述内容信息中的所述关键信息进行模糊处理。
可选地,在所述内容信息为图像数据时,
根据预设识别规则确定所述内容信息中的关键信息,包括:
根据预设识别规则确定所述图像数据中关键信息的类别,以及该关键信息在所述图像数据中的区域。
可选地,根据预设模糊规则对所述内容信息中的所述关键信息进行模糊处理,包括:
根据预设模糊规则对所述内容信息中的所述关键信息的区域打马赛克。
可选地,所述关键信息包括:网站关键信息和/或个人关键信息;
所述网站关键信息包括:网址、IP地址字段、特殊图像和/或预设敏感信息;
所述个人关键信息包括:用户名、邮箱或电话。
可选地,所述识别规则和所述模糊规则为从服务器中下载的与所述信息发布平台相匹配的规则。
由上述技术方案可知,本发明提供的信息模糊处理方法及装置,该方法能够采用预设识别规则识别内容信息中的关键信息,并采用模糊规则对关键信息进行模糊处理,进而可提高现有技术中信息模糊处理的效率,同时降低信息处理的成本,保证信息安全。
具体实施方式
下面结合附图,对发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
图1示出了本发明一实施例提供的信息模糊处理方法的流程示意图,如图1所示,本实施例的信息模糊处理方法如下所述。
本实施例中的信息模糊处理方法可应用于信息发布平台,如社交类平台和网站信息运营类平台。进一步地,本实施例的信息模糊处理方法还可应用于各种网站服务器中,本实施例不对其进行限定。
101、获取所述信息发布平台中需进行发布的内容信息,所述内容信息包括图像数据和/或文字数据。
在实际应用中,如果信息发布平台为网站运营类平台,如漏洞检测平台、信息交易平台等,此时,该些平台将要发布的内容信息中可能包括网站的漏洞信息、交易信息、敏感信息等。这些信息可能位于一张或多张图片中,也可能位于一个或多个文档中。
另外,针对社交类平台,如果用户通过某一即时通信软件上传图像或文档时,该些图像或文档中可能涉及该用户的隐私信息,如联系方式、电话等。
102、根据预设识别规则确定所述内容信息中的关键信息,所述关键信息为所述内容信息发布前需要进行模糊处理的信息。
在本实施例中,如果内容信息中涉及图像数据,可将该图像数据发送服务器(如云服务器),以使服务器识别图像数据中的特征字符及该特征字符的位置信息,进而将识别后的特征字符发送信息模糊处理装置,以使该信息模糊处理装置根据预设识别规则确定内容信息(即特征字符和文字数据)中的关键信息。
通常,服务器中预设有识别各类图像数据的分类器,可根据各类图像数据进行识别,获得该图像数据的所有特征字符(如文字、数据、特殊字符等)。
如果内容信息中全部都是文字数据,则可直接根据预设识别规则确定所述内容信息(即文字数据)中的关键信息。
举例来说,前述的关键信息可包括:网站关键信息和/或个人关键信息;
例如,网站关键信息可包括:网址、互联网协议(Internet Protocol,简称IP)地址字段、特殊图像和/或预设敏感信息等;个人关键信息可包括:用户名、邮箱或电话等。
针对网站来说,如果网站收集到某一漏洞信息,需要将该漏洞信息进行发布时,该漏洞信息中涉及的网站的网址或相关变量/参数属于网站关键信息,为此,需要将该些网站关键信息进行模糊处理,进而保证发送/发布的信息不会对存在漏洞的网站造成数据泄露,保证信息的安全。
103、根据预设模糊规则对所述内容信息中的所述关键信息进行模糊处理。
举例来说,可将所述内容信息中的所述关键信息的区域打马赛克/全部消除/全部覆盖/全部替换等,本实施例不对其进行限定,可根据实际需要设置。
在具体应用中,如果内容信息为图像数据,可将图像数据中的关键信息的区域全部采用其他非透明颜色覆盖,或打马赛克等。当然还可采用其他模糊处理方式处理图像数据中的关键信息,本实施例不对其进行限定。
如果内容信息为文字数据,可将文字数据中的关键信息采用其他字符替换,如采用“¥%&#”替换文字数据中的关键信息,或者采用“…~~”替换文字数据中的关键信息。
进一步地,如果所述内容信息中的关键信息为IP地址字段,则根据预设模糊规则将所述IP地址字段的最后N位数字进行模糊处理;其中,N为大于等于2的自然数;
如果所述内容信息中的关键信息为网址,则根据预设模糊规则将所述网址中www.后面的全部字段或部分字段进行模糊处理。
本实施例的信息模糊处理方法,可采用预设识别规则识别内容信息中的关键信息,并采用模糊规则对关键信息进行模糊处理,进而可提高现有技术中信息模糊处理的效率,同时降低信息处理的成本,保证信息安全。
特别地,所述模糊处理可以将载有内容信息进行图像截取,并针对截取的图像进行区域性模糊,或者针对文字信息,复制至内存中进行修改后形成模糊后的信息并显示,在显示后再进行截图,形成模糊后的图像。
图2示出了本发明一实施例提供的信息模糊处理方法的流程示意图,如图2所示,本实施例的信息模糊处理方法如下所述。
201、获取所述信息发布平台中需进行发布的内容信息,所述内容信息为图片。
202、识别所述图片中包含的所有特征字符和每一特征字符的位置信息;所述特征字符包括:文字、数字、英文字母、各种符号等。
在本实施例中,一种实现的方式是:信息模糊处理装置可采用各种识别模型/分类器识别所述图片中的所有特征字符,以及每一特征字符的位置信息。
或者,信息模糊处理装置可确定图片的分类(如风景图片、网站图片、人物图片等),然后采用该分类中的识别模型/分类器对图片中的所有特征字符进行识别。
另一可能的实现方式可为:将图片压缩发送到服务器(如云服务器),该服务器可在接收图片之后,确定图片所述的分类,进而采用识别模型/识别分类器识别所述图片中的所有特征字符,以及每一特征字符的位置信息。
该步骤中的位置信息可为图片中的坐标点的信息。例如,可以图片的某一点为原点,确定每一特征字符的坐标信息。
通常,在服务器侧设有多个对应不同图片分类的识别模型/分类器。
图像/图片中的特征字符识别属于可根据现有的方式实现,本实施例仅为举例说明,不限定如何识别图片中的特征字符的方式。
203、根据预设识别规则确定所有特征字符中的关键信息;
204、确定所述关键信息的类别,以及该关键信息在所述图片中的区域。
举例来说,关键信息的类别可包括:网址类别、IP地址类别、手机号码类别、邮件信息类别、敏感信息类别、肖像类别等;
针对不同类别的关键信息可采用与该类别相适应的模糊规则进行模糊处理,为此,在本实施例中,需要在确定关键信息之后,确定该关键信息的类别。
关键信息在图片中的区域可为该关键信息在图片中的坐标区域。针对同一张图片,坐标信息时一致的。
205、根据所述关键信息的类别和所述关键信息在所述图片中的区域,采用预设模糊规则对所述关键信息进行模糊处理。
例如,关键信息为IP地址字段,则根据IP地址类别和该IP地址字段的区域,采用模糊规则将该区域内的IP地址字段的最后两位模糊处理。
如果关键信息为电话号码,则根据手机号码类别和该电话号码的区域,采用模糊规则将该区域内的电话号码的后四位模糊处理。
另外,需要说明的是,前述的识别规则和模糊规则可为从服务器中下载的与所述信息发布平台相匹配的规则。
也就是说,在信息模糊处理装置可实时向服务器下载各种识别规则和模糊规则,以便较好的对将要发布的内容信息进行准确的模糊处理,保证发布信息的安全。
该处的服务器可为云服务器。服务器中的规则可为根据各种信息统计的规则。或者,服务器中的规则还可为人工增加或修改的规则。
本实施例的信息模糊处理方法,可采用预设识别规则识别内容信息中的关键信息,并采用模糊规则对关键信息进行模糊处理,进而可提高现有技术中信息模糊处理的效率,同时降低信息处理的成本,保证信息不被泄露。
图3示出了本发明一实施例提供的信息模糊处理装置的结构示意图,如图3所示,本实施例的信息模糊处理装置包括:获取单元31、关键信息确定单元32和处理单元33;
其中,获取单元31用于获取所述信息发布平台中需要进行发布的内容信息,所述内容信息包括图像数据和/或文字数据;
关键信息确定单元32用于根据预设识别规则确定所述内容信息中的关键信息,所述关键信息为所述内容信息发布前需要进行模糊处理的信息;
处理单元33用于根据预设模糊规则对所述内容信息中的所述关键信息进行模糊处理。
举例来说,所述关键信息包括:网站关键信息和/或个人关键信息;所述网站关键信息包括:网址、IP地址字段、特殊图像和/或预设敏感信息等;所述个人关键信息包括:用户名、邮箱或电话等等。
一种具体的例子中,在所述内容信息为图像数据时,关键信息确定单元32可具体用于根据预设识别规则确定所述图像数据中关键信息的类别,以及该关键信息在所述图像数据中的区域。
举例来说,内容信息为图像数据时,所述处理单元33可具体用于,根据预设模糊规则对所述内容信息中的所述关键信息的区域打马赛克。
另外,本实施例中的识别规则和所述模糊规则可为从服务器中下载的与所述信息发布平台相匹配的规则。
此外,本实施例的信息模糊处理装置可执行前述的图1至图2所示的方法实施例中的流程,本实施例不在此进行详述。
本实施例中的信息模糊处理装置通过关键信息确定单元识别内容信息中的关键信息,并采用处理单元对关键信息进行模糊处理,进而可提高现有技术中信息模糊处理的效率,同时降低信息处理的成本,保证信息不被泄露。
本发明的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在于该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是互相排斥之处,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一种浏览器终端的设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。