CN116996840B - 短信审核方法、装置、设备和存储介质 - Google Patents

短信审核方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN116996840B
CN116996840B CN202311253260.5A CN202311253260A CN116996840B CN 116996840 B CN116996840 B CN 116996840B CN 202311253260 A CN202311253260 A CN 202311253260A CN 116996840 B CN116996840 B CN 116996840B
Authority
CN
China
Prior art keywords
short message
characters
character
contained
network node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311253260.5A
Other languages
English (en)
Other versions
CN116996840A (zh
Inventor
丁伟
孙振江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baiwu Tech Co ltd
Original Assignee
Beijing Baiwu Tech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baiwu Tech Co ltd filed Critical Beijing Baiwu Tech Co ltd
Priority to CN202311253260.5A priority Critical patent/CN116996840B/zh
Publication of CN116996840A publication Critical patent/CN116996840A/zh
Application granted granted Critical
Publication of CN116996840B publication Critical patent/CN116996840B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • H04W4/14Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/18Commands or executable codes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W12/00Security arrangements; Authentication; Protecting privacy or anonymity
    • H04W12/12Detection or prevention of fraud
    • H04W12/128Anti-malware arrangements, e.g. protection against SMS fraud or mobile malware

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供一种短信审核方法、装置、设备和存储介质,该方法包括:接收短信发送请求;识别短信中包含的不同类型的数据内容,数据内容中包括非地址链接类型的字符内容;将字符内容中包含的各字符分别与预先建立的常规字库中包含的多个常规字符进行匹配,以确定短信中与常规字库不匹配的非常规字符的数量;若非常规字符的数量不满足预设条件,则禁止发送短信。采用本发明,通过设置常规字库,将短信的字符内容中的各字符与常规字库进行比较匹配,可以反向识别出字符内容中的非常规字符。采用反向识别的方式,可以有效识别短信的字符内容中的非常规字符,且还能极大降低数据库的维护成本。

Description

短信审核方法、装置、设备和存储介质
技术领域
本发明涉及数据安全技术领域,尤其涉及一种短信审核方法、装置、设备和存储介质。
背景技术
实际应用中,一些商家可以在短信群发平台购买向受众群发短信的账号权限。在这些商家在短信群发平台购买了上述账号权限之后,商家可以在短信群发平台中登录私有账号,然后通过已登录的私有账号向短信群发平台提交需要群发的短信,由短信群发平台向受众群发商家提交的短信。
有些恶意商家,也通过上述那样的途径群发违规短信。在某些场景中,在违规短信中会携带有恶意商家的即时通信账号,并在违规短信中引导接收到短信的用户通过该即时通信账号与恶意商家取得联系,恶意商家会在该即时通信账号中进一步引导用户进行转账等操作,这样会对用户的个人钱财或者个人信息等等造成威胁。由此可见,在相关技术中缺乏保证向受众群发短信的安全机制。
发明内容
本发明实施例提供一种短信审核方法、装置、设备和存储介质,用以实现保证向受众群发短信的安全性。
第一方面,本发明实施例提供一种短信审核方法,该方法包括:
接收短信发送请求,其中,所述短信发送请求中携带有待审核的短信;
识别所述短信中包含的不同类型的数据内容,所述数据内容中包括非地址链接类型的字符内容;
将所述字符内容中包含的各字符分别与预先建立的常规字库中包含的多个常规字符进行匹配,以确定所述短信中与所述常规字库不匹配的非常规字符的数量;
若所述非常规字符的数量不满足预设条件,则禁止发送所述短信。
第二方面,本发明实施例提供一种短信审核装置,包括:
接收模块,用于接收短信发送请求,其中,所述短信发送请求中携带有待审核的短信;
识别模块,用于识别所述短信中包含的不同类型的数据内容,所述数据内容中包括非地址链接类型的字符内容;
匹配模块,用于将所述字符内容中包含的各字符分别与预先建立的常规字库中包含的多个常规字符进行匹配,以确定所述短信中与所述常规字库不匹配的非常规字符的数量;
审核模块,用于若所述非常规字符的数量不满足预设条件,则禁止发送所述短信。
第三方面,本发明实施例提供一种电子设备,其中包括处理器和存储器,其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器至少可以实现第一方面中的短信审核方法。
第四方面,本发明实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现第一方面中的短信审核方法。
采用本发明,通过设置常规字库,将短信的字符内容中的各字符与常规字库进行比较匹配,可以反向识别出字符内容中的非常规字符。采用反向识别的方式,可以无需频繁地更新数据库,可以实现“以不变应万变”的效果。即使恶意商家为了躲避审核,故意变换出新的替换原来的文字或者词语的方式,但只要用做替换的字符不在常规字库内,就会被识别为非常规字符,进而采用本发明无需跟随恶意商家的替换手段的变换而频繁地更新升级数据库。
另外,采用本发明也无需不断地收集繁体字、生僻字、用做替换的表情符号等来充实数据库,因为只要是不在常规字库中的常规字符即可被判定为是非常规字符。由此可见,采用本发明,可以有效识别短信的字符内容中的非常规字符,且还能极大降低数据库的维护成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种短信审核方法的流程示意图;
图2为本发明实施例提供的另一种短信审核方法的流程示意图;
图3为本发明实施例提供的另一种短信审核方法的流程示意图;
图4为本发明实施例提供的一种短信审核装置的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
另外,下述各方法实施例中的步骤时序仅为一种举例,而非严格限定。
图1为本发明实施例提供的一种短信审核方法的流程图,该方法可以应用于电子设备。如图1所示,该方法包括如下步骤:
101、接收短信发送请求,其中,短信发送请求中携带有待审核的短信。
102、识别短信中包含的不同类型的数据内容,数据内容中包括非地址链接类型的字符内容。
103、将字符内容中包含的各字符分别与预先建立的常规字库中包含的多个常规字符进行匹配,以确定短信中与常规字库不匹配的非常规字符的数量。
104、若非常规字符的数量不满足预设条件,则禁止发送短信。
实际应用中,商家可以在短信群发平台购买向受众群发短信的账号权限。具体来说,商家可以先登录短信群发平台的私有账号,然后找到相关页面,在相关页面中选择购买向受众群发短信的账号权限。在购买了该账号权限之后,商家就可以打开短信群发配置页面,然后在该页面中相应的对话框中输入需要群发的短信、发送时间、受众通信号码等等信息。在商家输入好上述信息之后,可以点击提交按键,进而客户端可以自动生成短信发送请求,在短信发送请求中携带有商家输入的需要群发短信的具体内容。
在客户端提交了短信发送请求之后,相应地,短信群发平台可以接收到短信发送请求。可以理解的是,待审核的短信中可以包括多元化的数据内容,比如说可以包括文本、图像、音频、视频、地址链接等等不同类型的数据内容。在审核短信的过程中,需要对不同类型的数据内容加以区分,针对不同类型的数据内容使用的审核方式有所区别,这样才会避免误识别。
在实际审核之前,可以预先识别短信中包含的不同类型的数据内容,以从短信中提取出非地址链接类型的字符内容。其中,非地址链接类型的字符内容可以理解为是不构成地址链接的数字、字母、中英文标点符号、文字等等。值得注意的是,在下文中将“非地址链接类型的字符内容”简化描述为“字符内容”,下文中出现的“字符内容”即为不构成地址链接的字符内容。
需要说明的是,可以预先建立常规字库,在常规字库中存储有多个常规字符/常规文字。其中,经过申请人的研究发现,常用的常规文字有2千多个,可以将这些常规文字收入到常规字库中。当然,在实施本发明实施例提供的方法时,可以根据实际需求采集常规文字并收入于常规字库,并不限定为上述2千多个常规文字,上述常规文字的统计数量只是一种举例。
在建立好常规字库后,当获取到待审核的短信时,可以将短信中的字符内容中包含的各字符一一与常规字库中的多个常规字符进行比较匹配。具体来说,可以按顺序从头至尾依次获取字符内容中包含的各字符,每当获取一个字符i时,将当前获取的字符i与常规字库中的多个常规字符进行比较匹配。
在进行比较匹配的过程中,可以从常规字库中的第一个常规字符开始依次往后进行比较匹配。如果前面的常规字符不能与当前获取的字符i相匹配,则继续将后面的常规字符与当前获取的字符i进行比较匹配,直到找到第一个与当前获取的字符i相匹配的常规字符为止,或者直到遍历常规字库中的所有常规字符之后未发现与当前获取的字符i相匹配的常规字符。
对于字符内容中的任一字符x来说,如果在遍历常规字库之后发现不存在与该字符x相匹配的常规字符,则表示该字符x是非常规字符。需要说明的是,在将字符内容中包含的第一个字符与常规字库进行比较匹配之前,可以先设置一个计数器,并对计数器进行清零操作。在将字符内容中包含的各字符与常规字库进行比较匹配的过程中,每当检测到一个非常规字符,就可以将计数器当前的计数值增加1。在将字符内容中包含的所有需要进行比较匹配的字符都与常规字库进行比较匹配完毕之后,可以读取计数器最终的计数值,该计数值表示字符内容中包含的所有非常规字符的数量。
如果统计出的字符内容中包含的所有非常规字符的数量不满足预设条件,则禁止向受众发送商家提交的短信。相应地,如果统计出的字符内容中包含的所有非常规字符的数量满足上述预设条件,则确认短信审核通过,可以立即向受众发送商家提交的短信,或者在商家在短信发送请求中指定的发送时间上向受众发送短信。再或者,如果统计出的字符内容中包含的所有非常规字符的数量满足上述预设条件,同时如果还存在其他的审核条件,则会继续审核商家提交的短信,只有当商家提交的短信满足所有审核条件时,才能确认短信审核通过。
可选地,若非常规字符的数量不满足预设条件,则禁止发送短信的过程可以实现为:若非常规字符的数量超过第一预设阈值,则禁止发送短信;或,若非常规字符的数量与字符内容中包含的所有字符的总数量之间的占比超过第二预设阈值,则禁止发送短信。
例如,可以设置一个短信中至多包含5个非常规字符,当检测到短信中的非常规字符的数量超过该设定值时,可以禁止发送短信。或者,假设识别出短信中包含10个非常规字符,而该短信的字符内容中共包括25个字符,非常规字符的占比为0.4,该占比大于设定的0.2,因此禁止发送短信。
实际应用中,一些恶意商家为了抵抗一般的审核,会将短信中的某些简体字替换为繁体字、生僻字,受众在读到替换后的短信中的内容时,依然能很轻松地明白短信的含义,恶意商家想要传达给受众的意思能准确进行传达,而由于这些繁体字、生僻字的存在,会给审核短信的过程造成干扰,在某些情况下有可能会让这些违规短信通过审核。而采用本发明实施例提供的方法,可以识别出短信中的字符内容,然后将字符内容中的各字符一一和常规字库进行比对匹配,接着会统计出字符内容中的非常规字符的数量。如果字符内容中携带有繁体字、生僻字,则会被统计为非常规字符,进而会增加非常规字符的数量。当字符内容中的非常规字符的数量不满足预设条件时,会禁止发送上述短信。
由上述示例可见,采用本发明实施例提供的方法,可以采用反向识别的方式,即与常规字库进行比对以查找短信的字符内容中的非常规字符,可以有效避免恶意商家采用替换简体字的方式躲避审核。
再例如,另外一些恶意商家不再用繁体字、生僻字躲避审核,而是用一些与文字外观形象比较像的表情符号,或者象形的表情符号来替换原来的文字或者词语,这些表情符号是由一些字母和标点符号构成的。在将这样的短信的字符内容和常规字库进行比较匹配时,由于一般来说表情符号不在常规字库内,因为这样的表情符号会被识别为非常规字符,进而会增加短信的字符内容中的非常规字符的数量。当字符内容中的非常规字符的数量不满足预设条件时,会禁止发送上述短信。
同样地,由上述示例可见,也是采用反向识别的方式,确定短信的字符内容中的非常规字符,进而有效避免恶意商家通过一些表情符号替换原来的文字或者词语的方式躲避审核。
采用本发明实施例提供的方法,通过设置常规字库,将短信的字符内容中的各字符与常规字库进行比较匹配,可以反向识别出字符内容中的非常规字符。采用反向识别的方式,可以无需频繁地更新数据库,可以实现“以不变应万变”的效果,因为只要是不在常规字库中的常规字符可以被判定为是非常规字符。即使恶意商家为了躲避审核,故意变换出新的替换原来的文字或者词语的方式,但只要用做替换的字符不在常规字库内,就会被识别为非常规字符,进而采用本发明实施例无需跟随恶意商家的替换手段的变换而频繁地更新升级数据库。另外,采用本发明实施例也无需不断地收集繁体字、生僻字、用做替换的表情符号等来充实数据库,因为只要是不在常规字库中的常规字符即可被判定为是非常规字符。由此可见,采用本发明,可以有效识别短信的字符内容中的非常规字符,且还能极大降低数据库的维护成本。
在某些可选实施例中,根据实际经验来说,一些生僻字常会出现在人名、地名中,在这类词语中出现生僻字是正常的,因此为了提高审核的准确度,可选地,在本发明实施例中,还可以对短信进行命名体识别,以确定短信中包含的预设类别的词语,其中,预设类别的词语包括人名和/或地名;将字符内容中除预设类别的词语之外的各字符与常规字库进行匹配。
实际应用中,可以预先对短信进行命名体识别,以确定出短信中包含的人名、地名等,然后去除短信中的人名、地名,接着再统计去除人名、地名的短信的字符内容中的非常规字符的数量,这样统计出的非常规字符的数量会更加准确。另外,在判定字符内容中的非常规字符的数量是否满足预设条件时,可以确定字符内容中的非常规字符的数量是否超过了第一预设阈值,或者确定字符内容中的非常规字符在字符内容中除人名、地名以外的所有字符中的占比是否超过了第二预设阈值。
图2为本发明实施例提供的另一种短信审核方法的流程示意图,如图2所示,该方法可以包括:
201、接收短信发送请求,其中,短信发送请求中携带有待审核的短信。
202、识别短信中包含的不同类型的数据内容,数据内容中包括非地址链接类型的字符内容以及地址链接。
203、将字符内容中包含的各字符分别与预先建立的常规字库中包含的多个常规字符进行匹配,以确定短信中与常规字库不匹配的非常规字符的数量。
204、将地址链接分发给多个位于不同地理区域的第一网络节点设备,以使得各第一网络节点设备对地址链接对应的网页内容进行审核。
205、接收多个第一网络节点设备返回的审核反馈信息。
206、若非常规字符的数量不满足预设条件,或者任一第一网络节点设备返回的审核反馈信息指示地址链接对应的网页内容中包含有违规信息,则禁止发送短信。
本发明实施例中的上述步骤201-203与上一实施例的步骤101-103的具体实施方式相似,可以参考上一实施例的描述来实施本实施例中的步骤201-203,在此不再过多展开赘述。
实际应用中,短信中的数据内容除了可以是字符内容以外,还可以是地址链接。某些商家会将地址链接携带在短信中群发给受众群体,而受众群体中的某些用户可能会点击该地址链接打开相应的网站。对于这些地址链接,有些地址链接是常规的地址链接,用户点击地址链接后会相应查看到商家的售卖、展示商品、服务等的网站,而有些地址链接则是违规的地址链接,如果用户点击了这样的地址链接后会跳转到如涉黄、诈骗等非法网站。为了打击恶意商家,保护受众群体,需要识别出短信中的违规的地址链接,禁止这样的地址链接携带在短信中群发给受众群体。
在本发明实施例中,短信审核平台在接收到短信发送请求之后,如果检测到待审核的短信中携带有地址链接,则会将地址链接分发给多个位于不同地理区域的第一网络节点设备。多个第一网络节点设备分别设置在不同的地理区域,如第一网络节点设备A设置在a城市、第一网络节点设备B设置在b城市,第一网络节点设备C设置在c城市、第一网络节点设备D设置在d乡村、第一网络节点设备设置在e乡村等。
在多个第一网络节点设备接收到地址链接之后,各第一网络节点设备会基于接收到的地址链接获取相应的网站内容,该网站内容可以包括网站中的字符、图像等。第一网络节点设备可以对字符内容进行分析,如将网站中包含的字符与预先建立的违规关键词库进行比较匹配,如果网站中包含的字符内容中包含与违规关键词库相匹配的字符,则判定该网站中包含违规信息。其中,违规关键词库中可以包括与涉黄、诈骗等有关的含义的文字或者词语,如“下注”、“向XXX转账”等等。
此外,第一网络节点设备还可以对网站中的图像进行分析,如对图像中的字符内容进行提取识别,然后如审核网站中的字符内容相似,可以将图像中的字符内容与违规关键词库进行比较匹配,以检测图像中的违规信息。
在另一方面,第一网络节点设备还可以将网站中抓取到的图像输入到预先训练的图像分类器中,图像分类器可以对网站中的图像进行分类,如图像分类器可以对网站中的图像分类为人物衣着暴露等等敏感类别。基于网站中的图像的分类结果,可以确定网站是否包含违规信息。
采用上述方式,第一网络节点设备可以分别从字符角度、图像角度检测网站中是否包含违规信息,如果网站包括了违规信息,则相应的第一网络节点设备可以向短信审核平台返回指示地址链接对应的网页内容中包含有违规信息的审核反馈信息。
需要说明的是,在本发明实施例中将地址链接分发给了设置在不同地理区域的第一网络节点设备,对于这些网络节点设备来说,有些设备可能检测出的网站内容是正常的,而有些设备可能检测出的网站包含违规信息。这是由于,有些恶意商家会针对不同地理区域中的用户设置通过同一地址链接跳转到不同网站中。例如,恶意商家可以设置当检测到用户点击了地址链接后,先获取用户的IP地址,基于IP地址可以定位用户所在的地理区域,如果定位出的地理区域为A类区域,则跳转到正常网站,如果定位出的地理区域为B类区域,则跳转到违规的网站。如假设发现用户位于城市,则给位于城市的用户打开正常的网站,如果发现用户位于乡村,则给位于乡村的用户打开违规的网站。
为了避免上述问题的发生,在本发明实施例中,可以在不同的地理区域设置第一网络节点设备,然后将地址链接分发给位于不同地理区域的第一网络节点设备,这样第一网络节点设备可以模拟真实用户在不同地理区域点击地址链接的场景,然后第一网络节点设备还可以对拉取到的网站内容进行分析,以确定网站中是否包含违规信息。采用这样的方式,可以避免由于设备的地理区域的局限性导致漏发现包含违规信息的网站的地址链接,进而采用本发明可以进一步提高和保证受众群体的浏览网站的安全性。
值得注意的是,短信审核平台将地址链接分发给了多个第一网络节点设备,只要有一个第一网络节点设备返回的审核反馈信息指示地址链接对应的网页内容中包含有违规信息,则禁止发送包含上述地址链接的短信。另外,结合上一实施例,如果短信的字符内容中包含的非常规字符的数量不满足预设条件,则也禁止发送短信。总之,只要短信中包含的内容不符合要求,就可以禁止发送短信,相应地,只有在短信中包含的内容都符合要求时,才允许发送短信。
图3为本发明实施例提供的另一种短信审核方法的流程示意图,如图3所示,该方法可以包括:
301、接收短信发送请求,其中,短信发送请求中携带有待审核的短信。
302、识别短信中包含的不同类型的数据内容,数据内容中包括非地址链接类型的字符内容以及地址链接。
303、将字符内容中包含的各字符分别与预先建立的常规字库中包含的多个常规字符进行匹配,以确定短信中与常规字库不匹配的非常规字符的数量。
304、若非常规字符的数量满足预设条件,且短信中的其他内容也符合要求,则向受众群体发送短信。
305、在不同时间节点将地址链接发送至第二网络节点设备,以使得第二网络节点设备在不同的时间节点对地址链接对应的网页内容进行审核。
306、接收第二网络节点设备返回的不同的时间节点对应的审核反馈信息。
307、若任一时间节点对应的审核反馈信息指示地址链接对应的网页内容中包含有违规信息,则向提交短信发送请求的账户发出警告信息,其中,警告信息用于指示网页内容中包含的与预先建立的违规关键词库相匹配的字符和/或属于预设的敏感类别的图像。
本发明实施例中的上述步骤301-304与前述实施例的步骤101-104的具体实施方式相似,可以参考前述实施例的描述来实施本实施例中的步骤301-304,在此不再过多展开赘述。
实际应用中,在短信审核通过之后,会向受众群体群发短信。然而即使短信被发送至受众处,依然可以持续监测短信是否包含违规信息。
在本发明实施例中,可以设定多个时间节点,如一天24小时每整点小时为一个时间节点。在各时间节点到达时,可以依次向第二网络节点设备发送短信中包含的地址链接。
在第二网络节点设备中,如第一网络节点设备那样,可以对地址链接对应的网站中包含的字符内容、图像等进行抓取和分析,根据分析结果确定该网站中是否包含违规信息。具体分析过程可以参加第一网络节点设备审核网站内容的过程,在此不再展开赘述。
第二网络节点设备可以根据分析结果,向短信审核平台返回审核反馈信息。如果第二网络节点设备返回的任一时间节点对应的审核反馈信息指示地址链接对应的网站中包含违规信息,则由于短信已发给受众群体,因此短信无法被收回,但是可以对发起短信发送请求的账户,即恶意商家,进行警告。例如,可以提示恶意商家如果再发现类似行为,就进行封停账号处理,甚至进行报警。
另外,在对恶意商家进行警告的过程中,可以将恶意商家具体违规的内容告知恶意商家,比如说,可以在警告信息中携带网站中包含的违规的字符、涉及到敏感类别的图像等。
需要说明的是,在某些场景中,当用户在不同的时间段打开同一地址链接指向的网站所看到的网站内容可能会不同。例如,当用户在白天时段打开地址链接A对应的网站时,看到的是商家的售卖、展示商品、服务等的网站,而当用户在夜晚时段打开同一地址链接A对应的网站时,看到的可能就变为涉及诈骗的网站。
为了避免上述问题的产生,对于短信审核平台来说,即使已经对某个短信审核通过并将其群发给受众群体,但是可以依然持续对发出的短信进行监测。一旦发现已经发出的短信中的地址链接指向的网站包含违规信息,可以对相应的恶意商家进行警告。采取这样的手段,可以对恶意商家起到一定的威慑作用,防止恶意商家钻平台的漏洞向广大受众发送带有违规信息的网站的地址链接,进而可以保证受众群体的信息安全性,规范商家的行为。
采用本发明,通过设置常规字库,将短信的字符内容中的各字符与常规字库进行比较匹配,可以反向识别出字符内容中的非常规字符。采用反向识别的方式,可以无需频繁地更新数据库,可以实现“以不变应万变”的效果。即使恶意商家为了躲避审核,故意变换出新的替换原来的文字或者词语的方式,但只要用做替换的字符不在常规字库内,就会被识别为非常规字符,进而采用本发明无需跟随恶意商家的替换手段的变换而频繁地更新升级数据库。
另外,采用本发明也无需不断地收集繁体字、生僻字、用做替换的表情符号等来充实数据库,因为只要是不在常规字库中的常规字符即可被判定为是非常规字符。由此可见,采用本发明,可以有效识别短信的字符内容中的非常规字符,且还能极大降低数据库的维护成本。
以下将详细描述本发明的一个或多个实施例的短信审核装置。本领域技术人员可以理解,这些短信审核装置均可使用市售的硬件组件通过本方案所教导的步骤进行配置来构成。
图4为本发明实施例提供的一种短信审核装置的结构示意图,如图4所示,该装置包括:
接收模块41,用于接收短信发送请求,其中,所述短信发送请求中携带有待审核的短信;
识别模块42,用于识别所述短信中包含的不同类型的数据内容,所述数据内容中包括非地址链接类型的字符内容;
匹配模块43,用于将所述字符内容中包含的各字符分别与预先建立的常规字库中包含的多个常规字符进行匹配,以确定所述短信中与所述常规字库不匹配的非常规字符的数量;
审核模块44,用于若所述非常规字符的数量不满足预设条件,则禁止发送所述短信。
可选地,所述匹配模块43,用于:
对所述短信进行命名体识别,以确定所述短信中包含的预设类别的词语,其中,所述预设类别的词语包括人名和/或地名;
将所述字符内容中除所述预设类别的词语之外的各字符与所述常规字库进行匹配。
可选地,所述审核模块44,用于:
若所述非常规字符的数量超过第一预设阈值,则禁止发送所述短信;或,
若所述非常规字符的数量与所述字符内容中包含的所有字符的总数量之间的占比超过第二预设阈值,则禁止发送所述短信。
可选地,所述数据内容中包含地址链接;
所述审核模块44,还用于:
将所述地址链接分发给多个位于不同地理区域的第一网络节点设备,以使得各第一网络节点设备对所述地址链接对应的网页内容进行审核;
接收所述多个第一网络节点设备返回的审核反馈信息;
若任一第一网络节点设备返回的审核反馈信息指示所述地址链接对应的网页内容中包含有违规信息,则禁止发送所述短信。
可选地,所述数据内容中包含地址链接;
所述审核模块44,还用于:
在发送所述短信之后,在不同时间节点将所述地址链接发送至第二网络节点设备,以使得所述第二网络节点设备在所述不同的时间节点对所述地址链接对应的网页内容进行审核;
接收所述第二网络节点设备返回的所述不同的时间节点对应的审核反馈信息;
若任一时间节点对应的审核反馈信息指示所述地址链接对应的网页内容中包含有违规信息,则向提交所述短信发送请求的账户发出警告信息,其中,所述警告信息用于指示所述网页内容中包含的与预先建立的违规关键词库相匹配的字符和/或属于预设的敏感类别的图像。
图4所示装置可以执行前述图1至图3所示实施例中提供的短信审核方法,详细的执行过程和技术效果参见前述实施例中的描述,在此不再赘述。
在一个可能的设计中,上述图4所示短信审核装置的结构可实现为一电子设备,如图5所示,该电子设备可以包括:处理器91、存储器92。其中,所述存储器92上存储有可执行代码,当所述可执行代码被所述处理器91执行时,使所述处理器91至少可以实现如前述图1至图3所示实施例中提供的短信审核方法。
可选地,该电子设备中还可以包括通信接口93,用于与其他设备进行通信。
另外,本发明实施例提供了一种非暂时性机器可读存储介质,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器至少可以实现如前述图1至图3所示实施例中提供的短信审核方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助加必需的通用硬件平台的方式来实现,当然也可以通过硬件和软件结合的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以计算机产品的形式体现出来,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例提供的短信审核方法可以由某种程序/软件来执行,该程序/软件可以由网络侧提供,前述实施例中提及的电子设备可以将该程序/软件下载到本地的非易失性存储介质中,并在其需要执行前述短信审核方法时,通过CPU将该程序/软件读取到内存中,进而由CPU执行该程序/软件以实现前述实施例中所提供的短信审核方法,执行过程可以参见前述图1至图3中的示意。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种短信审核方法,其特征在于,包括:
接收短信发送请求,其中,所述短信发送请求中携带有待审核的短信;
识别所述短信中包含的不同类型的数据内容,所述数据内容中包括非地址链接类型的字符内容,所述数据内容中包含地址链接;
将所述字符内容中包含的各字符分别与预先建立的常规字库中包含的多个常规字符进行匹配,以确定所述短信中与所述常规字库不匹配的非常规字符的数量;
若所述非常规字符的数量不满足预设条件,则禁止发送所述短信;
将所述地址链接分发给多个位于不同地理区域的第一网络节点设备,以使得各第一网络节点设备对所述地址链接对应的网页内容进行审核;
接收所述多个第一网络节点设备返回的审核反馈信息;
若任一第一网络节点设备返回的审核反馈信息指示所述地址链接对应的网页内容中包含有违规信息,则禁止发送所述短信;
在发送所述短信之后,在不同时间节点将所述地址链接发送至第二网络节点设备,以使得所述第二网络节点设备在所述不同的时间节点对所述地址链接对应的网页内容进行审核;
接收所述第二网络节点设备返回的所述不同的时间节点对应的审核反馈信息;
若任一时间节点对应的审核反馈信息指示所述地址链接对应的网页内容中包含有违规信息,则向提交所述短信发送请求的账户发出警告信息,其中,所述警告信息用于指示所述网页内容中包含的与预先建立的违规关键词库相匹配的字符和/或属于预设的敏感类别的图像。
2.根据权利要求1所述的方法,其特征在于,所述将所述字符内容中包含的各字符分别与预先建立的常规字库中包含的多个常规字符进行匹配,包括:
对所述短信进行命名体识别,以确定所述短信中包含的预设类别的词语,其中,所述预设类别的词语包括人名和/或地名;
将所述字符内容中除所述预设类别的词语之外的各字符与所述常规字库进行匹配。
3.根据权利要求1所述的方法,其特征在于,所述若所述非常规字符的数量不满足预设条件,则禁止发送所述短信,包括:
若所述非常规字符的数量超过第一预设阈值,则禁止发送所述短信;或,
若所述非常规字符的数量与所述字符内容中包含的所有字符的总数量之间的占比超过第二预设阈值,则禁止发送所述短信。
4.一种短信审核装置,其特征在于,包括:
接收模块,用于接收短信发送请求,其中,所述短信发送请求中携带有待审核的短信;
识别模块,用于识别所述短信中包含的不同类型的数据内容,所述数据内容中包括非地址链接类型的字符内容,所述数据内容中包含地址链接;
匹配模块,用于将所述字符内容中包含的各字符分别与预先建立的常规字库中包含的多个常规字符进行匹配,以确定所述短信中与所述常规字库不匹配的非常规字符的数量;
审核模块,用于若所述非常规字符的数量不满足预设条件,则禁止发送所述短信;将所述地址链接分发给多个位于不同地理区域的第一网络节点设备,以使得各第一网络节点设备对所述地址链接对应的网页内容进行审核;接收所述多个第一网络节点设备返回的审核反馈信息;若任一第一网络节点设备返回的审核反馈信息指示所述地址链接对应的网页内容中包含有违规信息,则禁止发送所述短信;在发送所述短信之后,在不同时间节点将所述地址链接发送至第二网络节点设备,以使得所述第二网络节点设备在所述不同的时间节点对所述地址链接对应的网页内容进行审核;接收所述第二网络节点设备返回的所述不同的时间节点对应的审核反馈信息;若任一时间节点对应的审核反馈信息指示所述地址链接对应的网页内容中包含有违规信息,则向提交所述短信发送请求的账户发出警告信息,其中,所述警告信息用于指示所述网页内容中包含的与预先建立的违规关键词库相匹配的字符和/或属于预设的敏感类别的图像。
5.根据权利要求4所述的装置,其特征在于,所述匹配模块,用于:
对所述短信进行命名体识别,以确定所述短信中包含的预设类别的词语,其中,所述预设类别的词语包括人名和/或地名;
将所述字符内容中除所述预设类别的词语之外的各字符与所述常规字库进行匹配。
6.根据权利要求4所述的装置,其特征在于,所述审核模块,用于:
若所述非常规字符的数量超过第一预设阈值,则禁止发送所述短信;或,
若所述非常规字符的数量与所述字符内容中包含的所有字符的总数量之间的占比超过第二预设阈值,则禁止发送所述短信。
7.一种电子设备,其特征在于,包括:存储器、处理器;其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-3中任一项所述的短信审核方法。
8.一种非暂时性机器可读存储介质,其特征在于,所述非暂时性机器可读存储介质上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-3中任一项所述的短信审核方法。
CN202311253260.5A 2023-09-26 2023-09-26 短信审核方法、装置、设备和存储介质 Active CN116996840B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311253260.5A CN116996840B (zh) 2023-09-26 2023-09-26 短信审核方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311253260.5A CN116996840B (zh) 2023-09-26 2023-09-26 短信审核方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN116996840A CN116996840A (zh) 2023-11-03
CN116996840B true CN116996840B (zh) 2023-12-29

Family

ID=88534162

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311253260.5A Active CN116996840B (zh) 2023-09-26 2023-09-26 短信审核方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN116996840B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102368842A (zh) * 2011-10-12 2012-03-07 中国联合网络通信集团有限公司 移动终端异常行为的检测方法和检测系统
CN104714938A (zh) * 2013-12-12 2015-06-17 联想(北京)有限公司 一种信息处理的方法及电子设备
WO2017215553A1 (zh) * 2016-06-14 2017-12-21 中兴通讯股份有限公司 一种短消息监控方法、装置和监控中心
CN107612893A (zh) * 2017-09-01 2018-01-19 北京百悟科技有限公司 短信的审核系统和方法以及构建短信审核模型方法
CN108062303A (zh) * 2017-12-06 2018-05-22 北京奇虎科技有限公司 垃圾短信的识别方法及装置
WO2019144756A1 (zh) * 2018-01-29 2019-08-01 深圳壹账通智能科技有限公司 验证短信的处理方法及系统
WO2019169769A1 (zh) * 2018-03-06 2019-09-12 平安科技(深圳)有限公司 广告图片鉴定方法、电子装置及可读存储介质
CN110875959A (zh) * 2018-08-13 2020-03-10 阿里巴巴集团控股有限公司 识别数据的方法、识别垃圾邮箱的方法及文件识别的方法
CN111586695A (zh) * 2020-05-28 2020-08-25 腾讯科技(深圳)有限公司 短信识别方法及相关设备
CN111597805A (zh) * 2020-05-21 2020-08-28 上海创蓝文化传播有限公司 一种基于深度学习审核短信文本链接的方法及装置
CN113095858A (zh) * 2021-05-07 2021-07-09 广州市刑事科学技术研究所 一种涉诈短文本识别方法
CN116431884A (zh) * 2023-04-18 2023-07-14 北京鸿联九五信息产业有限公司 一种链接短信的审核方法、系统、计算设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102368842A (zh) * 2011-10-12 2012-03-07 中国联合网络通信集团有限公司 移动终端异常行为的检测方法和检测系统
CN104714938A (zh) * 2013-12-12 2015-06-17 联想(北京)有限公司 一种信息处理的方法及电子设备
WO2017215553A1 (zh) * 2016-06-14 2017-12-21 中兴通讯股份有限公司 一种短消息监控方法、装置和监控中心
CN107612893A (zh) * 2017-09-01 2018-01-19 北京百悟科技有限公司 短信的审核系统和方法以及构建短信审核模型方法
CN108062303A (zh) * 2017-12-06 2018-05-22 北京奇虎科技有限公司 垃圾短信的识别方法及装置
WO2019144756A1 (zh) * 2018-01-29 2019-08-01 深圳壹账通智能科技有限公司 验证短信的处理方法及系统
WO2019169769A1 (zh) * 2018-03-06 2019-09-12 平安科技(深圳)有限公司 广告图片鉴定方法、电子装置及可读存储介质
CN110875959A (zh) * 2018-08-13 2020-03-10 阿里巴巴集团控股有限公司 识别数据的方法、识别垃圾邮箱的方法及文件识别的方法
CN111597805A (zh) * 2020-05-21 2020-08-28 上海创蓝文化传播有限公司 一种基于深度学习审核短信文本链接的方法及装置
CN111586695A (zh) * 2020-05-28 2020-08-25 腾讯科技(深圳)有限公司 短信识别方法及相关设备
CN113095858A (zh) * 2021-05-07 2021-07-09 广州市刑事科学技术研究所 一种涉诈短文本识别方法
CN116431884A (zh) * 2023-04-18 2023-07-14 北京鸿联九五信息产业有限公司 一种链接短信的审核方法、系统、计算设备及存储介质

Also Published As

Publication number Publication date
CN116996840A (zh) 2023-11-03

Similar Documents

Publication Publication Date Title
CN110399925B (zh) 账号的风险识别方法、装置及存储介质
Kharraz et al. Surveylance: Automatically detecting online survey scams
Rubin et al. Towards news verification: Deception detection methods for news discourse
CN105956180B (zh) 一种敏感词过滤方法
CN102946331B (zh) 一种社交网络僵尸用户检测方法及装置
CN105516113A (zh) 用于自动网络钓鱼检测规则演进的系统和方法
US10956522B1 (en) Regular expression generation and screening of textual items
CN104158828B (zh) 基于云端内容规则库识别可疑钓鱼网页的方法及系统
US10454954B2 (en) Automated detection of phishing campaigns via social media
EP3888335A1 (en) Phishing protection methods and systems
CN110443031A (zh) 一种二维码风险识别方法和系统
Perez et al. I Call BS: Fraud detection in crowdfunding campaigns
CN109462582B (zh) 文本识别方法、装置、服务器及存储介质
CN111988327B (zh) 威胁行为检测和模型建立方法、装置、电子设备及存储介质
CN107018152A (zh) 消息拦截方法、装置和电子设备
Gallo et al. Identifying threats in a large company's inbox
CN116996840B (zh) 短信审核方法、装置、设备和存储介质
CN110321423B (zh) 一种文本数据的风险识别方法及服务器
US9904662B2 (en) Real-time agreement analysis
CN114006776B (zh) 一种敏感信息泄露检测方法及装置
CN112468444B (zh) 互联网域名滥用识别方法和装置,电子设备,存储介质
Cybenko et al. Cognitive Hacking.
Chen et al. Towards news verification: deception detection methods for news discourse
Ikram et al. Combating fraud in online social networks: Detecting stealthy facebook like farms
KR102594382B1 (ko) 인공지능을 기반으로 콘텐츠의 저작권을 탐지하고 저작권이 존재하는 콘텐츠의 부정 사용을 방지하기 위한 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant