CN117235749A - 信息处理方法及相关设备 - Google Patents

信息处理方法及相关设备 Download PDF

Info

Publication number
CN117235749A
CN117235749A CN202210637767.XA CN202210637767A CN117235749A CN 117235749 A CN117235749 A CN 117235749A CN 202210637767 A CN202210637767 A CN 202210637767A CN 117235749 A CN117235749 A CN 117235749A
Authority
CN
China
Prior art keywords
target sentence
information
page text
library
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210637767.XA
Other languages
English (en)
Inventor
程翔龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Priority to CN202210637767.XA priority Critical patent/CN117235749A/zh
Publication of CN117235749A publication Critical patent/CN117235749A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本公开提供一种信息处理方法及相关设备。所述方法包括:接收服务器发送的目标语句密文库;所述目标语句密文库包括至少一个目标语句的密文,所述目标语句的密文基于加密算法对目标语句加密获得,所述加密算法为不可逆加密算法;获取显示页面的显示内容,基于所述显示内容获得页面文本信息;采用所述加密算法对所述页面文本信息进行加密,获得页面文本信息密文;基于所述页面文本信息密文与所述目标语句密文库,确定所述显示页面的目标语句检测结果。本公开所述信息处理方法及相关设备,能够在客户端上实现目标语句检测,且不会泄露目标语句库。

Description

信息处理方法及相关设备
技术领域
本公开涉及互联网技术领域,尤其涉及一种信息处理方法及相关设备。
背景技术
随着网络技术的发展,用户会在手机设备端上的应用程序(APP,Application)上产生大量的用户原创内容(UGC,User Generated Content)。在一些应用场景中,需要关注用户原创内容的文本内容中的一些特定的词汇、句子等信息,因此需要对这些信息进行检测。
现有的文本内容信息检测方法,一般将文本内容传送至服务器进行检测,或者经由用户反馈后进行检测。而现有技术中部分文本内容并不能传送至服务器,也就不能通过服务器进行识别,而用户反馈往往存在时延。因此,现有的文本信息检测方法,不能满足对文本信息的检测要求。
发明内容
有鉴于此,本公开的目的在于提出一种信息处理方法及相关设备。
基于上述目的,本公开提供了一种信息处理方法,应用于客户端,所述客户端包括显示页面;所述方法包括:
接收服务器发送的目标语句密文库;所述目标语句密文库包括至少一个目标语句的密文,所述目标语句的密文基于加密算法对目标语句加密获得,所述加密算法为不可逆加密算法;
获取显示页面的显示内容,基于所述显示内容获得页面文本信息;
采用所述加密算法对所述页面文本信息进行加密,获得页面文本信息密文;
基于所述页面文本信息密文与所述目标语句密文库,确定所述显示页面的目标语句检测结果。
可选的,所述采用所述加密算法对所述页面文本信息进行加密,获得页面文本信息密文,包括:
基于预设的分组长度对所述页面文本信息进行分组,获得至少一个页面文本信息组;
对每个所述页面文本信息组,分别采用所述加密算法进行加密,获得页面文本加密信息组;
基于每个所述页面文本加密信息组获得所述页面文本加密信息。
可选的,所述基于每个所述页面文本加密信息组获得所述页面文本加密信息,包括:
对每个页面文本加密信息组进行截断,获得具有预设字节长度的页面文本加密信息子组,基于每个所述页面文本加密信息子组获得所述页面文本加密信息。
可选的,所述基于所述页面文本信息密文与所述目标语句密文库,确定所述显示页面的目标语句检测结果,包括:
响应于所述页面文本加密信息子组为所述目标语句密文库中任一所述目标语句的密文的子串,所述显示页面包括目标语句。
可选的,所述客户端显示页面包括目标语句之后,还包括:
响应于所述显示页面包括目标语句,基于所述目标语句生成提示信息,并发送至所述服务器。
可选的,还包括:
响应于所述分组长度大于等于2,相邻两个所述页面文本信息组中至少部分文本信息重叠。
本公开还提供了另一种信息处理方法,应用于服务器;所述方法包括:
获取目标语句库,所述目标语句库包括至少一个目标语句;
采用加密算法对所述目标语句库加密,获得目标语句密文库;
将所述目标语句密文库发送至客户端以使得到客户端确定显示页面的目标语句检测结果。
可选的,所述采用加密算法对所述目标语句库加密,获得目标语句密文库,包括:
基于预设的分组长度对所述目标语句库中的每个所述目标语句进行分组,获得至少一个目标语句组;
对每个所述目标语句组分别采用所述加密算法进行加密,获得目标语句加密信息组;
基于每个所述目标语句加密信息组生成目标语句的密文。
可选的,所述基于每个所述目标语句加密信息组生成目标语句加密信息,还包括:
对每个所述目标语句加密信息组进行截断,获得具有预设字节长度的目标语句加密信息子组;
将每个所述目标语句加密信息子组拼接生成目标语句的密文。
可选的,还包括:
响应于所述分组长度大于等于2,相邻两个所述目标语句组中至少部分文本信息重叠。
本公开还提供了一种客户端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任意一项所述的方法。
本公开还提供了一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任意一项所述的方法。
本公开还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使所述计算机执行上述任一所述的方法。
本公开还提供了一种计算机程序产品,所述计算机程序产品包括存储有指令的计算机可读存储介质,其特征在于,所述指令在被执行时使得计算设备的至少一个中央处理器单元执行根据上述任一项所述的方法。
从上面所述可以看出,本公开提供的信息处理方法及相关设备,通过将目标语句密文库发送至客户端,并基于客户端显示页面的页面文本信息进行目标语句检测,从而可以在客户端进行目标语句检测;由于目标语句密文库在发送至客户端之前,采用了不可逆加密算法进行加密,这样即使目标语句密文库被发送至了客户端,用户也无法通过解密算法对目标语句密文库进行解密以获得目标语句的明文,保证目标语句库不会泄露;同时,由于对页面文本信息和目标语句库采用了同样的加密算法,而同样的明文采用相同加密算法后的密文相同,因此即使目标语句库是加密后的,也可基于目标语句密文库判断显示页面中是否有目标语句以实现对目标语句的检测。
附图说明
为了更清楚地说明本公开或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例信息处理系统的结构示意图;
图2为本公开实施例所述信息处理方法的流程示意图;
图3为本公开实施例对页面文本信息进行加密的流程示意图;
图4为本公开实施例所述信息处理方法的另一流程示意图;
图5为本公开实施例电子设备的结构示意图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细说明。
需要说明的是,除非另外定义,本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
图1示出了本公开实施例所提供的可应用于信息处理方法的装置的实施例的示例性系统100的示意图。
如图1所示,系统100包括服务器140以及至少一个安装有客户端120的终端设备,服务器140和终端设备上的客户端120通过无线网络或有线网络连接。
终端设备可以是智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面)播放器或MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面)播放器、膝上型便携计算机中的至少一种。
客户端120可以为安装在终端设备上且为用户910提供各种服务的应用程序,例如社交交互应用程序、直播应用程序、视频播放应用程序、短视频播放应用程序等。用户910可基于客户端120向服务器140发送文字、语音、图像等信息,也可接收服务器发送的文字、语音、图像等信息。
服务器140包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。服务器140用于为客户端120提供后台服务。可选地,服务器140承担主要计算工作,终端设备承担次要计算工作;或者,服务器140承担次要计算工作,终端设备承担主要计算工作;或者,服务器140和终端设备之间采用分布式计算架构进行协同计算。
在一些实施例中,系统100可实现客户端120与服务器140之间的数据交互。具体的,用户910可通过客户端120创建用户原创内容,并基于客户端120将文字、语音、图像等用户原创内容信息发送至服务器140;用户910也可通过客户端120接收服务器发送的文字、语音、图像等信息。
在一些实施例中,系统100还可以包括控制设备,该控制设备可以是与信息处理的开发人员或运维人员对应的设备。开发人员或运维人员可以通过该控制设备对目标语句库所需的数据进行编辑,进而生成相应的目标语句库的数据文件并存储在服务器140中。
在本实施例中,用户910在客户端120上创建的用户原创内容,这些原创内容中可能存在一些用户、服务平台等持续关注或者在一定时间范围内关注的一些特定的词汇、句子等目标语句。若能够检测到这些目标语句,则能够采用一些处理手段从而为用户提供更好的服务。
例如,在一些平台中,大量用户在某一段时间内发布大量视频、短视频、文字、音乐等原创内容,且这些原创内容均与同一目标语句(例如某节日)相关,在这种情况下,服务平台若能够检测出这个目标语句,判断出与该目标语句相关的原创内容受欢迎,则可获取与该目标语句相关的内容推送给用户,以使得用户获得更好的体验。
例如,在直播场景中,大量买方用户关注“价格”“发货时间”等信息,即大量买方用户在直播间留言中涉及“价格”“发货时间”等信息,在这种情况下,服务平台若能够检测出“价格”“发货时间”这些目标语句,则可将目标语句进行高亮显示,以提醒卖方用户关注这些信息,从而为买方用户和卖方用户提供更好的直播购物体验。或者,也可以为其他任意场景,本实施例对此不作限制。
现有技术中,可在服务器140上构建一个庞大的目标语句库,终端设备将用户910在客户端120内输入的内容发送至服务器140,服务器140通过比对用户输入的内容与目标语句库,来判断是否存在目标语句库中的目标语句。或者,服务器140接收到其他用户的反馈信息后,对用户910在客户端120内输入的内容进行检测。
然而,随着互联网技术的发展,即时交互应用程序、直播应用程序、视频播放应用程序、短视频播放应用程序等应用程序可嵌入开放形态的小程序,例如游戏小程序、购物小程序等。这些小程序由第三方服务平台的服务器160提供服务,并可通过安装于终端设备上的客户端120展示给用户910。用户910在使用客户端120时,可进入小程序页面并在小程序上输入UGC内容,该UGC内容直接发送至第三方服务平台的服务器160。
在上述场景中,服务器140难以直接获得用户910在小程序上输入的UGC内容,对目标语句的检测仅能依赖第三方服务平台。而若基于用户的反馈来进行检测,则由于反馈存在时延,无法及时获得相关信息。
有鉴于此,本公开实施例提供一种信息处理方法,以解决上述问题。其中,所述信息处理方法应用于客户端,且所述客户端包括显示页面;所述方法包括:接收服务器发送的目标语句密文库;所述目标语句密文库包括至少一个目标语句的密文,所述目标语句的密文基于加密算法加密获得,所述加密算法为不可逆加密算法;获取显示页面的显示内容,基于所述显示内容获得页面文本信息;采用所述加密算法对所述页面文本信息进行加密,获得页面文本信息密文;基于所述页面文本信息密文与所述目标语句密文库,确定所述显示页面的目标语句检测结果。
本公开实施例所述信息处理方法,通过将目标语句密文库发送至客户端,并基于客户端显示页面的页面文本信息进行目标语句检测,从而可以在客户端进行目标语句检测;由于目标语句密文库在发送至客户端之前,采用了不可逆加密算法进行加密,这样即使目标语句密文库被发送至了客户端,用户也无法通过解密算法对目标语句密文库进行解密以获得目标语句的明文,保证目标语句库不会泄露;同时,由于对页面文本信息和目标语句库采用了同样的加密算法,而同样的明文采用相同加密算法后的密文相同,因此即使目标语句库是加密后的,也可基于目标语句密文库判断显示页面中是否有目标语句以实现对目标语句的检测。
下面结合图1所示的系统100,进一步说明本公开实施例所提供的系统100的实现方式。
首先,服务器140获取目标语句库。其中,所述目标语句库包括至少一个目标语句,开发人员或运维人员可以通过控制设备对服务器140中的目标语句库进行维护,例如对目标语句库中的目标语句进行增改。目标语句可以为中文,也可以为英文,或者也可以为任意可选的语言。当目标语句为中文时,每个目标语句可以为一个汉字或者为多个文字组成的词语、短句等;当目标语句为英文时,每个目标语句可以为一个单词或者为多个单词组成的词组、短句等,本实施例对此不作限制。
服务器140获取目标语句库之后,采用加密算法对所述目标语句库进行加密,从而获得目标语句密文库。
具体的,本实施例中,服务器140首先基于预设的分组长度对所述目标语句库中的每个所述目标语句进行分组,获得至少一个目标语句组。其中,预设的分组长度可以为1或2,在有需要的情况下也可以大于等于3,本实施例对此不作限制。
可选的,本实施例中,响应于所述分组长度大于等于2,相邻两个所述目标语句组中至少部分文本信息重叠。即在本实施例中,当分组长度大于等于2时,为保证任一目标语句组的密文均在目标语句密文库中,在对目标语句的明文进行分组时,相邻两个目标语句组具有重叠的信息。
例如,假设某一个目标语句A为“这是一只小猫咪”,以分组长度(group_size)等于2为例,对目标语句A进行分组,得到六个目标语句组,包括{“这是”,“是一”,“一只”,“只小”,“小猫”,“猫咪”},从而可以保证任一目标语句组的密文均在目标语句密文库中,保证目标语句检测的准确。其中,在上述分组过程中,若目标语句的字符长度小于分组长度时,可以通过预设的字符(例如)进行字符填充,且填充的位数与缺失的位数相同。
服务器140获得目标语句组之后,对每个所述目标语句组分别采用预设的加密算法进行加密,从而获得目标语句加密信息组。
本实施例中,加密算法为不可逆加密算法,例如可以为哈希(hash)加密算法,包括MD5、SHA-1、SHA-224、SHA-256、SHA-384、SHA-512和SHA-3等算法中的任意一种,例如可以为SHA-256算法,本实施例对此不作限制。以H(a)表示对明文a进行哈希加密为例,假设:
H(这是)=Gcqsa……T,
H(是一)=RGW+C……q,
H(一只)=gHPH3……U,
H(只小)=iVhEj……M,
H(小猫)=51jpo……L,
H(猫咪)=2+GcP……6;
从而得到目标语句组{“这是”,“是一”,“一只”,“只小”,“小猫”,“猫咪”}的目标语句加密信息组{Gcqsa……T,RGW+C……q,gHPH3……U,iVhEj……M,51jpo……L,2+GcP……6}。可选的,在上述加密过程中,为保证目标语句库的安全性,可以在加密的过程中加盐。
服务器140获得目标语句加密信息组之后,可以对每个所述目标语句加密信息组进行截断,从而获得具有预设字节长度的目标语句加密信息子组。其中,对每个目标语句加密信息组进行截断时,可以基于预设位置截断,例如保留一端预设字节长度的加密信息,或者中间某些字节长度的加密信息,本实施例对此不作限制;同时,预设字节长度可以大于等于3,例如当预设字节长度为3时,目标语句加密信息子组可以为{Gcqs,RGW+,gHPH,iVhE,51jp,2+Gc}。其中,上述获取的目标语句加密信息子组{Gcqs,RGW+,gHPH,iVhE,51jp,2+Gc}为经过base64编码后的信息。通过对目标语句加密信息组进行截断,从而仅保留部分加密后的信息,在保证密文碰撞概率较低的情况下,减少目标语句密文库的信息存储数量,降低客户端的计算开销。
在本实施例中,当采用SHA-256对目标语句组进行加密并对加密后的目标语句加密信息组进行3个字节的截断时,由于经过SHA-256加密的hash输出空间大小是256*256*256,能够支持的词表数量是千万量级的,所以几乎不会发生碰撞,即发生两个不同的词表加密后的密文一样。从而,在保证目标语句密文库的存储信息尽量少的情况下,降低词表碰撞概率。
获得目标语句加密信息子组之后,服务器140将每个所述目标语句加密信息子组拼接生成目标语句的密文。本实施例中,将每个目标语句加密信息子组按照其原本的顺序进行拼接,从而获得该目标语句的密文,例如目标语句“这是一只小猫咪”的密文为GcqsRGW+gHPHiVhE51jp2+Gc。
服务器140对目标语句库中的每一个目标语句进行加密获得各个目标语句的密文,进而获得目标语句密文库。
服务器140获得目标语句密文库之后,将所述目标语句密文库发送至客户端120以使得到客户端120确定其显示页面的目标语句检测结果。
具体的,客户端120接收服务器140发送的目标语句密文库并存储在客户端120中。其中,所述目标语句密文库包括至少一个目标语句的密文,所述目标语句的密文基于加密算法加密获得,所述加密算法用于对文本信息进行加密且为不可逆加密算法。而由于目标语句密文库中的目标语句是采用不可逆加密算法进行加密的,即该加密算法是不具有对应的解密算法的,这样用户、第三方等其他人员均无法通过客户端存储的目标语句密文库来反向编译获得目标语句库的明文,从而避免了目标语句库的泄露,也可以进一步避免用户、第三方等人员在破解了目标语句库进行针对性的处理。
当用户910通过客户端120打开小程序输入内容,或者第三方服务平台通过小程序进行显示时,客户端120可获取当前客户端显示页面的显示内容,基于所述显示内容获得页面文本信息。本实施例中,在获取到客户端显示页面后,可采用图像识别算法、深度学习算法等文本识别算法对显示页面上的显示内容进行文本识别,从而获得页面文本信息。
客户端120获得页面文本信息之后,采用所述加密算法对所述页面文本信息进行加密,获得页面文本信息密文;
具体的,本实施例中,客户端120首先基于预设的分组长度对所述页面文本信息进行分组,获得至少一个页面文本信息组。其中,预设的分组长度可以为1或2,在有需要的情况下也可以大于等于3,本实施例对此不作限制。且本实施例中,对页面文本信息进行分组的分组长度与对目标语句进行分组的分组长度相同,从而保证同一明文采用同样加密算法加密后的密文相同。
可选的,本实施例中,响应于所述分组长度大于等于2,相邻两个所述页面文本信息组中至少部分文本信息重叠。即在本实施例中,当分组长度大于等于2时,为保证页面文本信息组的密文能够与目标语句密文库进行匹配,在对页面文本信息组的明文进行分组时,相邻两个页面文本信息组组具有重叠的信息。
例如,假设页面文本信息为“白色小猫咪”,以分组长度(group_size)等于2为例,对改页面文本信息组进行分组,得到四个目标语句组,包括{“白色”,“色小”,“小猫”,“猫咪”},从而避免因分组的不准确导致目标语句检测的漏判,保证目标语句检测的准确。其中,在上述分组过程中,若目标语句的字符长度小于分组长度时,可以通过预设的字符(例如'\0')进行字符填充,且填充的位数与缺失的位数相同。
客户端120获得目标语句组之后,对每个所述页面文本信息组分别采用预设的加密算法进行加密,从而获得页面文本加密信息组。
本实施例中,预设的加密算法为不可逆加密算法,例如可以为哈希(hash)加密算法,包括MD5、SHA-1、SHA-224、SHA-256、SHA-384、SHA-512和SHA-3等算法中的任意一种,例如可以为SHA-256算法,本实施例对此不作限制。以H(a)表示对明文a进行哈希加密为例,假设:
H(白色)=WqcTs……M,
H(色小)=qW+Ga……l,
H(小猫)=51jpo……L,
H(猫咪)=2+GcP……6;
从而获得页面文本加密信息组{“白色”,“色小”,“小猫”,“猫咪”}的页面文本加密信息组{WqcTs……M,qW+Ga……l,51jpo……L,2+GcP……6}基于上述每个所述页面文本加密信息组即可获得所述页面文本加密信息。可选的,在上述加密过程中,可以在加密的过程中加盐。
具体的,客户端120获得页面文本加密信息组之后,可以对每个所述页面文本加密信息组进行截断,从而获得具有预设字节长度的页面文本加密信息子组。其中,对每个目标语句加密信息组进行截断时,可以基于预设位置截断,例如保留一端预设字节长度的加密信息,或者中间某些字节长度的加密信息,本实施例对此不作限制;同时,预设字节长度可以大于等于3,例如当预设字节长度为3时,页面文本加密信息子组可以为{WqcT,qW+G,51jp,2+Gc},即获得了页面文本加密信息。其中,上述获取的页面文本加密信息子组{WqcT,qW+G,51jp,2+Gc}为经过base64编码后的信息。
本实施例中,通过对面文本加密信息组进行截断,从而仅保留部分加密后的信息,在保证密文碰撞概率较低的情况下,减少目标语句密文库的信息存储数量以及目标语句检测时客户端的运算量,降低客户端的计算开销。
在本实施例中,当采用SHA-256对页面文本信息组进行加密并对加密后的页面文本加密信息组进行3个字节的截断时,由于经过SHA-256加密的hash输出空间大小是256*256*256,能够支持的词表数量是千万量级的,所以几乎不会发生碰撞,即发生两个不同的词表加密后的密文一样。从而,在保证目标语句密文库的存储信息尽量少的情况下,降低词表碰撞概率。
同时,经过SHA-256加密的密文为256个比特位32字节的信息,其密文的膨胀大小如下所示:
从上述表格可以看出,加密后的密文的膨胀较少,不会影响客户端的数据处理速度。
可选的,在上述实施例中,当采用SHA-256算法对目标语句、页面文本信息获得了目标语句加密信息子组、页面文本加密信息子组之后,由于所获得信息在显示时为一长串的乱码,为了便于维护以及代码的美观,可分别对目标语句加密信息子组以及页面文本加密信息子组进行编码,例如对目标语句加密信息子组以及页面文本加密信息子组进行base64编码,从而获得较为美观的四字节密文编码。
客户端120获得页面文本信息密文之后,基于所述页面文本信息密文与所述目标语句密文库,确定所述显示页面的目标语句检测结果。具体的,客户端120可以判断所述页面文本加密信息子组是否为所述目标语句密文库中任一所述目标语句的密文的子串,若是,则所述显示页面包括目标语句。例如,页面文本加密信息子组包括51jp和2+Gc,而目标语句密文库中GcqsRGW+gHPHiVhE51jp2+Gc的子集也包括51jp和2+Gc,从而可以判定当前客户端显示页面上具有预设的目标语句;反之,若页面文本加密信息子组不为所述目标语句密文库中任一所述目标语句的密文的子串,则当前客户端显示页面上不具有预设的目标语句。
或者,也可将页面文本加密信息子组拼接为完整的页面文本加密信息WqcTqW+G51jp2+Gc,当页面文本加密信息与目标语句密文库中任一目标语句的密文中包括截断长度倍数(例如4、8、12等)的连续相同字符时,可判定当前客户端显示页面上具有目标语句。或者,也可采用其他方式,本实施例对此不作限制。
当客户端120判断当前显示页面包括目标语句时,客户端120可基于所述目标语句生成提示信息,并将该提示信息发送至所述服务器140。其中,该提示信息可以仅为该目标语句,或者可以为包括该目标语句的段落,或者可以为包括该目标语句的显示页面,本实施例对此不作限制。
服务器140获得该提示信息后,即可根据实际应用的不同场景实现不同的操作处理。例如,基于该提示信息进行视频、短视频、文字、音乐等信息的推荐,或者在直播场景中基于该提示信息对重点信息进行标记,以便于为用户提供更好的服务。
为避免对目标语句的误判,服务器140接收该提示信息后,可以对该提示信息中的目标语句进行复检,该复核可以由服务器140实现,也可通过服务器转发至其他设备进行复检,本实施例对此不作限制。
在另一些实施例中,服务器140接收到该目标语句判断结果后,可以向客户端120发送目标语句处理信息,客户端120基于该目标语句处理信息,对当前显示页面上的目标语句进行处理。例如,可以基于该处理信息对目标语句或者目标语句所属句子、段落进行高亮标记;可以采用预设符号(例如‘*’)或文字对目标语句或者目标语句所属句子、段落等进行替换;或者,采用预设图像代替目标语句、目标语句所属句子、目标语句所属段落、目标语句所属显示页面进行替换;或者,关闭当前显示页面所对应的小程序等,本实施例对此不作限制。
基于同一发明构思,本公开实施例还通过了信息处理方法。如图2所示,所述信息处理方法应用于客户端,所述客户端包括显示页面;所述方法包括:
步骤S101,接收服务器发送的目标语句密文库;所述目标语句密文库包括至少一个目标语句的密文,所述目标语句的密文基于加密算法对目标语句加密获得,所述加密算法为不可逆加密算法。
步骤S102,获取显示页面的显示内容,基于所述显示内容获得页面文本信息。
步骤S103,采用所述加密算法对所述页面文本信息进行加密,获得页面文本信息密文。
步骤S104,基于所述页面文本信息密文与所述目标语句密文库,确定所述显示页面的目标语句检测结果。
本实施例中,通过将目标语句密文库发送至客户端,并基于客户端显示页面的页面文本信息进行目标语句检测,从而可以在客户端进行目标语句检测;由于目标语句密文库在发送至客户端之前,采用了不可逆加密算法进行加密,这样即使目标语句密文库被发送至了客户端,用户也无法通过解密算法对目标语句密文库进行解密以获得目标语句的明文,保证目标语句库不会泄露;同时,由于对页面文本信息和目标语句库采用了同样的加密算法,而同样的明文采用相同加密算法后的密文相同,因此即使目标语句库是加密后的,也可基于目标语句密文库判断显示页面中是否有目标语句以实现对目标语句的检测。
可选的,如图3所示,所述采用所述加密算法对所述页面文本信息进行加密,获得页面文本信息密文,包括:
步骤S201,基于预设的分组长度对所述页面文本信息进行分组,获得至少一个页面文本信息组。
步骤S202,对每个所述页面文本信息组,分别采用所述加密算法进行加密,获得页面文本加密信息组。
步骤S203,基于每个所述页面文本加密信息组获得所述页面文本加密信息。
可选的,所述基于每个所述页面文本加密信息组获得所述页面文本加密信息,包括:对每个页面文本加密信息组进行截断,获得具有预设字节长度的页面文本加密信息子组,基于每个所述页面文本加密信息子组获得所述页面文本加密信息。本实施例中,通过对面文本加密信息组进行截断,从而仅保留部分加密后的信息,在保证密文碰撞概率较低的情况下,减少目标语句密文库的信息存储数量以及目标语句检测时客户端的运算量,降低客户端的计算开销。
可选的,所述基于所述页面文本信息密文与所述目标语句密文库,确定所述显示页面的目标语句检测结果,包括:响应于所述页面文本加密信息子组为所述目标语句密文库中任一所述目标语句的密文的子串,所述显示页面包括目标语句。
可选的,所述客户端显示页面包括目标语句之后,还包括:响应于所述显示页面包括目标语句,基于所述目标语句生成提示信息,并发送至所述服务器。
可选的,还包括:响应于所述分组长度大于等于2,相邻两个所述页面文本信息组中至少部分文本信息重叠。
基于同一发明构思,本公开实施例还通过了信息处理方法。如图4所示,所述信息处理方法应用于服务器;所述方法包括:
步骤S301,获取目标语句库,所述目标语句库包括至少一个目标语句。
步骤S302,采用加密算法对所述目标语句库加密,获得目标语句密文库。
步骤S303,将所述目标语句密文库发送至客户端以使得到客户端确定显示页面的目标语句检测结果。
可选的,所述采用加密算法对所述目标语句库加密,获得目标语句密文库,包括:
步骤S401,基于预设的分组长度对所述目标语句库中的每个所述目标语句进行分组,获得至少一个目标语句组。
步骤S402,对每个所述目标语句组分别采用所述加密算法进行加密,获得目标语句加密信息组。
步骤S403,基于每个所述目标语句加密信息组生成目标语句的密文。
本实施例中,可以保证任一目标语句组的密文均在目标语句密文库中,保证目标语句检测的准确。
可选的,所述基于每个所述目标语句加密信息组生成目标语句加密信息,还包括:
步骤S501,对每个所述目标语句加密信息组进行截断,获得具有预设字节长度的目标语句加密信息子组。
步骤S502,将每个所述目标语句加密信息子组拼接生成目标语句的密文。
本实施例中,通过对目标语句加密信息组进行截断,从而仅保留部分加密后的信息,在保证密文碰撞概率较低的情况下,减少目标语句密文库的信息存储数量,降低客户端的计算开销。
可选的,还包括:响应于所述分组长度大于等于2,相邻两个所述目标语句组中至少部分文本信息重叠。
需要说明的是,本公开实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本公开实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本公开的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的方法。
图5示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本公开还提供了一种计算机程序产品,其包括计算机程序。在一些实施例中,所述计算机程序由一个或多个处理器可执行以使得所述处理器执行所述的方法。对应于方法各实施例中各步骤对应的执行主体,执行相应步骤的处理器可以是属于相应执行主体的。
上述实施例的计算机程序产品用于使处理器执行如上任一实施例所述的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本公开实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本公开实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本公开实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本公开实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本公开的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本公开实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本公开的具体实施例对本公开进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本公开实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本公开实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

Claims (14)

1.一种信息处理方法,其特征在于,应用于客户端,所述客户端包括显示页面;所述方法包括:
接收服务器发送的目标语句密文库;所述目标语句密文库包括至少一个目标语句的密文,所述目标语句的密文基于加密算法对目标语句加密获得,所述加密算法为不可逆加密算法;
获取显示页面的显示内容,基于所述显示内容获得页面文本信息;
采用所述加密算法对所述页面文本信息进行加密,获得页面文本信息密文;
基于所述页面文本信息密文与所述目标语句密文库,确定所述显示页面的目标语句检测结果。
2.根据权利要求1所述的方法,其特征在于,所述采用所述加密算法对所述页面文本信息进行加密,获得页面文本信息密文,包括:
基于预设的分组长度对所述页面文本信息进行分组,获得至少一个页面文本信息组;
对每个所述页面文本信息组,分别采用所述加密算法进行加密,获得页面文本加密信息组;
基于每个所述页面文本加密信息组获得所述页面文本加密信息。
3.根据权利要求2所述的方法,其特征在于,所述基于每个所述页面文本加密信息组获得所述页面文本加密信息,包括:
对每个页面文本加密信息组进行截断,获得具有预设字节长度的页面文本加密信息子组,基于每个所述页面文本加密信息子组获得所述页面文本加密信息。
4.根据权利要求3所述的方法,其特征在于,所述基于所述页面文本信息密文与所述目标语句密文库,确定所述显示页面的目标语句检测结果,包括:
响应于所述页面文本加密信息子组为所述目标语句密文库中任一所述目标语句的密文的子串,所述显示页面包括目标语句。
5.根据权利要求4所述的方法,其特征在于,所述客户端显示页面包括目标语句之后,还包括:
响应于所述显示页面包括目标语句,基于所述目标语句生成提示信息,并发送至所述服务器。
6.根据权利要求2所述的方法,其特征在于,还包括:
响应于所述分组长度大于等于2,相邻两个所述页面文本信息组中至少部分文本信息重叠。
7.一种信息处理方法,其特征在于,应用于服务器;所述方法包括:
获取目标语句库,所述目标语句库包括至少一个目标语句;
采用加密算法对所述目标语句库加密,获得目标语句密文库;
将所述目标语句密文库发送至客户端以使得到客户端确定显示页面的目标语句检测结果。
8.根据权利要求7所述的方法,其特征在于,所述采用加密算法对所述目标语句库加密,获得目标语句密文库,包括:
基于预设的分组长度对所述目标语句库中的每个所述目标语句进行分组,获得至少一个目标语句组;
对每个所述目标语句组分别采用所述加密算法进行加密,获得目标语句加密信息组;
基于每个所述目标语句加密信息组生成目标语句的密文。
9.根据权利要求8所述的方法,其特征在于,所述基于每个所述目标语句加密信息组生成目标语句加密信息,还包括:
对每个所述目标语句加密信息组进行截断,获得具有预设字节长度的目标语句加密信息子组;
将每个所述目标语句加密信息子组拼接生成目标语句的密文。
10.根据权利要求8所述的方法,其特征在于,还包括:
响应于所述分组长度大于等于2,相邻两个所述目标语句组中至少部分文本信息重叠。
11.一种客户端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任意一项所述的方法。
12.一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求7至10任意一项所述的方法。
13.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使所述计算机执行权利要求1至6或者权利要求7-10任一所述的方法。
14.一种计算机程序产品,所述计算机程序产品包括存储有指令的计算机可读存储介质,其特征在于,所述指令在被执行时使得计算设备的至少一个中央处理器单元执行根据权利要求1至6或者权利要求7-10中任一项所述的方法。
CN202210637767.XA 2022-06-06 2022-06-06 信息处理方法及相关设备 Pending CN117235749A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210637767.XA CN117235749A (zh) 2022-06-06 2022-06-06 信息处理方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210637767.XA CN117235749A (zh) 2022-06-06 2022-06-06 信息处理方法及相关设备

Publications (1)

Publication Number Publication Date
CN117235749A true CN117235749A (zh) 2023-12-15

Family

ID=89088574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210637767.XA Pending CN117235749A (zh) 2022-06-06 2022-06-06 信息处理方法及相关设备

Country Status (1)

Country Link
CN (1) CN117235749A (zh)

Similar Documents

Publication Publication Date Title
US10552238B2 (en) Secure inter-process communications for mobile devices
CN113364760A (zh) 一种数据加密处理方法、装置、计算机设备及存储介质
US10608815B2 (en) Content encryption and decryption using a custom key
CN111177801B (zh) 电子文档的签章方法、装置、存储介质和电子设备
US20130226979A1 (en) Systems and methods for multi-device rendering of multimedia presentations
WO2018000636A1 (zh) 一种弹幕信息处理方法及装置
WO2016045641A2 (zh) 数据块储存方法、数据查询方法和数据修改方法
CN104284213A (zh) 一种防盗链方法、客户端以及系统
US20170171166A1 (en) Anti-hotlinking method and electronic device
CN110545542A (zh) 基于非对称加密算法的主控密钥下载方法、装置和计算机设备
JP2020004380A (ja) ウェアラブルデバイス、情報処理方法、装置及びシステム
CN110719499B (zh) 视频下载方法、系统、介质和电子设备
US20150082043A1 (en) Terminal, server and digital content authorization method
CN108985109B (zh) 一种数据存储方法及装置
CN117235749A (zh) 信息处理方法及相关设备
CN107026841B (zh) 在网络中发布作品的方法和装置
CN110781523B (zh) 用于处理信息的方法和装置
US8904019B2 (en) Systems and methods for computing device communications
CN112631482A (zh) 页面处理方法及装置
JP2022511580A (ja) データを保護するためのシステムおよび方法
CN110995690A (zh) 一种基于云存储的安全存储方法和设备
WO2017071541A1 (zh) 一种数字验证码的生成方法及装置
CN118264482B (zh) 融合文件语义信息的一文一密安全加密方法及装置
CN116702218B (zh) 小程序中三维模型的渲染方法、装置、终端及存储介质
CN116132159B (zh) 数据加密方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination