CN108966158B - 短信发送方法、系统、计算机设备和存储介质 - Google Patents
短信发送方法、系统、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN108966158B CN108966158B CN201810953735.4A CN201810953735A CN108966158B CN 108966158 B CN108966158 B CN 108966158B CN 201810953735 A CN201810953735 A CN 201810953735A CN 108966158 B CN108966158 B CN 108966158B
- Authority
- CN
- China
- Prior art keywords
- short messages
- short message
- short
- messages
- node server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/12—Messaging; Mailboxes; Announcements
- H04W4/14—Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer And Data Communications (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请涉及海量数据领域,提供一种短信发送方法、系统、计算机设备和存储介质。所述方法包括:主节点服务器接收海量短信发送指令,根据发送指令得到需要发送的海量短信;将海量短信按照预设分配规则分配到多个从节点服务器;从节点服务器将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;从节点服务器将通知类短信和验证码类短信发送运营商服务器;从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器。采用本方法能够提高海量短信发送效率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种短信发送方法、系统、计算机设备和存储介质。
背景技术
短信是指用户通过手机或其他具有电信通讯功能的终端设备发送或接收的文字或数字信息,以便用户之间进行沟通。其中,垃圾短信是指用户不愿意接收的包含有广告推销的信息或者违法信息的短信息。消息云作为一个短信发送服务平台,每日经平台发送的短信高峰期能达上亿条,为了防止客户接收到垃圾短信,需要对平台发送的短信进行审核,目前,由于每日需要发送海量的短信,依次对短信审核通过后进行发送,会使得平台发送短信的效率降低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高海量短信发送效率的短信发送方法、系统、计算机设备和存储介质。
一种短信发送方法,所述方法包括:
主节点服务器接收海量短信发送指令,根据发送指令得到需要发送的海量短信;
主节点服务器将海量短信按照预设分配规则分配到多个从节点服务器;
从节点服务器将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;
从节点服务器将通知类短信和验证码类短信发送运营商服务器;
从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器。
在其中一个实施例中,从节点服务器将营销类短信和其他类短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器,包括:
从节点服务器使用关键词提取算法提取营销类短信和其他类短信的目标关键词;且
当目标关键词与预设关键词不一致时,将目标关键词对应的短信发送运营商服务器。
在其中一个实施例中,从节点服务器将营销类短信和其他类短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器,包括:
从节点服务器将营销类短信和其他类短信进行汉语拼音转化,得到对应的目标拼音短信;并
在目标拼音短信中匹配预设关键词拼音,当在目标拼音短信中没有匹配到预设关键词拼音时,将目标拼音短信对应的短信发送运营商服务器。
在其中一个实施例中,将海量短信按照预设分配规则分配到多个从节点服务器,包括:
主节点服务器获取当前时间,当当前时间在预设时间段之外时,识别通过,将海量短信按照预设分配规则分配到多个从节点服务器。
在其中一个实施例中,所述方法,还包括:
当识别失败时,从节点服务器拦截对应的垃圾短信,生成对应的拦截日志,并向发送方返回拦截提示;并
获取垃圾短信对应的客户标识,根据拦截日志统计客户标识对应的拦截次数,当拦截次数超过预设阈值时,将客户标识加入黑名单数据库;
主节点服务器接收海量短信发送指令,根据发送指令得到需要发送的海量短信之后,还包括:
主节点服务器获取海量短信对应的目标客户标识,在黑名单数据库中查找目标客户标识,当能够查找到目标客户标识时,将目标客户标识对应的短信进行拦截。
在其中一个实施例中,从节点服务器将营销类短信和其他类短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器,包括:
从节点服务器将营销类短信和其他类短信进行分词处理,根据分词处理结果得到词向量;并
将词向量输入到已训练的垃圾短信识别模型中,得到输出结果,并根据输出结果得到短信识别结果,根据识别结果将短信发送运营商服务器,其中,垃圾短信识别模型根据使用历史短信和对应识别结果使用神经网络算法进行训练得到。
在其中一个实施例中,垃圾短信识别模型的生成步骤包括:
获取历史短信和对应识别结果,根据历史短信进行分词得到词向量;
将词向量作为神经网络模型的输入,将对应的识别结果作为神经网络模型的标签进行训练,当训练完成时,得到垃圾短信识别模型。
一种短信发送系统,所述系统包括:
主节点服务器,用于接收海量短信发送指令,根据发送指令得到需要发送的海量短信;将海量短信按照预设分配规则分配到多个从节点服务器;
从节点服务器,用于将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;从节点服务器将通知类短信和验证码类短信发送运营商服务器;从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项方法中的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
主节点服务器接收海量短信发送指令,根据发送指令得到需要发送的海量短信;
将海量短信按照预设分配规则分配到多个从节点服务器;
从节点服务器将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;
从节点服务器将通知类短信和验证码类短信发送运营商服务器;
从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器。
上述短信发送方法、系统、计算机设备和存储介质,通过主节点服务器接收海量短信发送指令,根据发送指令得到需要发送的海量短信;将海量短信按照预设分配规则分配到多个从节点服务器;从节点服务器将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;从节点服务器将通知类短信和验证码类短信发送运营商服务器;从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器,能够并行对垃圾短信识别,并将非垃圾短信并行发送,能够提高海量短信发送效率。
附图说明
图1为一个实施例中短信发送方法的应用场景图;
图2为一个实施例中短信发送方法的流程示意图;
图3为一个实施例中非垃圾短信发送的流程示意图;
图4为另一个实施例中非垃圾短信发送的流程示意图;
图5为一个实施例中拦截垃圾短信的流程示意图;
图6为另一个实施例中短信发送方法的流程示意图;
图7为一个实施例中生成垃圾短信识别模型的流程示意图;
图8为一个实施例中短信发送系统的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的短信发送方法,可以应用于如图1所示的应用环境中。其中,多个终端通过网络与主节点服务器104进行通信,主节点服务器104通过网络与多个从节点服务器106进行通信。主节点服务器104接收海量短信发送指令,根据发送指令得到需要发送的海量短信。将海量短信按照预设分配规则分配到多个从节点服务器106。从节点服务器106将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信。从节点服务器106将通知类短信和验证码类短信发送运营商服务器。从节点服务器106将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种短信发送方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
S202主节点服务器接收海量短信发送指令,根据发送指令得到需要发送的海量短信。
具体地,主节点服务器接收到多个终端同时进行短信发送的指令,该指令携带有客户标识,根据发送指令得到终端需要发送的海量短信的具体内容。在一个实施例中,终端在发送短信时使用加密算法对短信进行加密,主角点服务器接收到加密的海量短信。
S204,主节点服务器将海量短信按照预设分配规则分配到多个从节点服务器。
具体地,主节点服务器将海量短信按照预设分配规则分配到多个从节点服务器,其中,预设分配规则用来将海量短信分配到从节点服务器,可以是根据从节点服务器的负载能力进行分配,还可以是随机进行分配,还可以是根据海量短信对应的客户标识进行分配等等,其中,客户标识可以是手机号。
S206,从节点服务器将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信。
其中,营销类短信是指企业用户向客户发送的经营销售短信,通常该类短信为垃圾短信的概率较高。通知类短信是指无需回复,用来通知用户信息的短信,通常使用短信模板进行发送,比如订单通知、开会通知和天气预警通知等。验证码类短信是指进行登录或者其它活动时用来验证用户正确性的短信。其他类短信是指除过上述几种类别短信以外的短信,比如企业问候短信、企业广告短信等。
具体地,从节点服务器得到主节点服务器分配的短信后,按照预设的垃圾短信规则进行分类,将得到的短信分配为营销类短信、通知类短信、验证码类短信和其他类短信。其中,预设的垃圾短信规则可以是根据关键字识别之后进行分类,可以是根据短信的模板类型进行分类。比如:当短信中有“验证码”等关键字,则该短信为验证码类短信。比如,当短信中有“促销”等关键字,则该短信为营销类短信。当短信使用的短信模板,则该短信为通知类短信。在一个实施例中,当从节点服务器得到的短信是加密短信时,使用预先约定好的密钥进行解密之后再进行分类。
S208,从节点服务器将通知类短信和验证码类短信发送运营商服务器。
具体地,在进行分类之后,从节点服务器直接将通知类短信和验证码类短信发送运营商服务器,运营商服务器将得到的短信进行发送。在一个实施例中,将通知类短信和验证码类短信使用约定的密钥加密之后再发送到运营商服务器。
S210,从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器。
其中,预设规则用于识别接收到的短信是垃圾短信还是非垃圾短信。
具体地,从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,当识别通过时,说明对应的短信为非垃圾短信们可以将该短信发送到运营商服务器,当识别未通过时,说明对应的短信为垃圾短信,则该不对该短信进行发送。在一个实施例中,将识别通过的短信使用约定的密钥加密之后再发送到运营商服务器,可以保证短信传输过程中的安全。
上述短信发送方法中,通过主节点服务器接收海量短信发送指令,根据发送指令得到需要发送的海量短信;将海量短信按照预设分配规则分配到多个从节点服务器;从节点服务器将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;从节点服务器将通知类短信和验证码类短信发送运营商服务器;从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器,能够并行对垃圾短信识别,并将非垃圾短信并行发送,能够提高海量短信发送效率。
在一个实施例中,如图3所示,步骤S210,即从节点服务器将营销类短信和其他类短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器,包括步骤:
S302,从节点服务器使用关键词提取算法提取营销类短信和其他类短信的目标关键词。
其中,关键词提取算法是用来提取出短信中的关键词语,关键词提取算法包括TextRank算法、LDA(Latent Dirichlet Allocation,文档主题生成模型)算法和TPR(Topical-PageRank)算法等。
具体地,从节点服务器使用关键词提取算法提取营销类短信和其他类短信中的目标关键词,每个营销类短信和其他类短信对应的目标关键词可以有多个。
S304,当目标关键词与预设关键词不一致时,将目标关键词对应的短信发送运营商服务器。
预设关键词是指预先设置好能反映短信为垃圾短信的词语,这些预设关键词可以是根据专家意见得到的,也可以是根据人为经验得到的。
具体地,判断每一个营销类短信和其他类短信对应的目标关键词是否与预设关键词一致,当目标关键词中有一个与预设关键词一致时,则判断出该目标关键词对应的短信为垃圾短信,当该短信的所有目标关键词都不与预设关键词一致,则识别该短信为非垃圾短信,则将该短信发送运营商服务器。
在上述实施例中,通过从节点服务器使用关键词提取算法提取营销类短信和其他类短信的目标关键词,当目标关键词与预设关键词不一致时,将目标关键词对应的短信发送运营商服务器,能够识别出海量短信中的垃圾短信,提高短信发送效率,防止垃圾短信被发送,影响客户体验。
在一个实施例中,如图4所示,步骤S210,即从节点服务器将营销类短信和其他类短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器,包括步骤:
S402,从节点服务器将营销类短信和其他类短信进行汉语拼音转化,得到对应的目标拼音短信。
S404,在目标拼音短信中匹配预设关键词拼音,当在目标拼音短信中没有匹配到预设关键词拼音时,将目标拼音短信对应的短信发送运营商服务器。
其中,预设关键词拼音是指将预先设置好的用于反映短信为垃圾短信的词语进行拼音转化。
具体地,从节点服务器先将得到的营销类短信和其他类短信进行汉语拼音转化,得到了短信文本对应的目标拼音短信,然后在目标拼音短信中匹配预设关键词拼音,当能够匹配到一致的拼音时,说明该短信为垃圾短信,当没有匹配到一致的拼音时,说明该短信为非垃圾短信。将识别结果为非垃圾短信的营销类短信和其他类短信发送到运营商服务器。
在上述实施例中,从节点服务器将营销类短信和其他类短信进行汉语拼音转化,得到对应的目标拼音短信,在目标拼音短信中匹配预设关键词拼音,当在目标拼音短信中没有匹配到预设关键词拼音时,将目标拼音短信对应的短信发送运营商服务器,通过拼音进行垃圾短信的识别,可以识别出同音字,提高垃圾短信识别的准确性。
在一个实施例中,步骤S204,即将海量短信按照预设分配规则分配到多个从节点服务器,包括步骤:
主节点服务器获取当前时间,当当前时间在预设时间段之外时,识别通过,将海量短信按照预设分配规则分配到多个从节点服务器。
其中,预设时间段是指预先设置好的用于判断短信是否为垃圾短信的时间段。
具体地,主节点服务器接收到海量短信时,获取到系统当前时间,判断当前时间是否在预设时间段之外,当系统当前时间在预设时间段之外,主节点服务器将海量短信按照预设分配规则分配到多个从节点服务器,当系统当前时间在预设时间段之内时,说明此时接收到的短信为垃圾短信,则将垃圾短信进行拦截,生成拦截日志并发送拦截提示给发送方。比如预设时间段可以设置为半夜24点到早上5点,该时间段接收到的短信都为垃圾短信,都进行拦截。
在上述实施例中,通过主节点服务器获取当前时间,当当前时间在预设时间段之外时,识别通过,将海量短信按照预设分配规则分配到多个从节点服务器,主节点服务器可以对垃圾短信进行拦截,提高发送效率,保证用户体验。
在一个实施例中,如图5所示,短信发送方法,还包括步骤:
S502,当识别失败时,从节点服务器拦截对应的垃圾短信,生成对应的拦截日志,并向发送方返回拦截提示。
具体地,当从节点服务器识别短信为垃圾短信时,拦截对应的垃圾短信,生成对应的拦截日志,该日志记录了拦截短信的客户标识、时间、次数和拦截原因等。并向发送方返回拦截提示,包括拦截原因等。
S804,获取垃圾短信对应的客户标识,根据拦截日志统计客户标识对应的拦截次数,当拦截次数超过预设阈值时,将客户标识加入黑名单数据库。
具体地,从节点服务器还会获取到垃圾短信对应的客户标识,判断拦截日志中记录的该客户标识对应的拦截次数,当拦截次数超过预设阈值时,将客户标识加入黑名单数据库。比如,当一客户的短信被拦截超过300次时,将该客户标识加入黑名单数据库。
则在步骤S202之后,即主节点服务器接收海量短信发送指令,根据发送指令得到需要发送的海量短信之后,还包括步骤:
主节点服务器获取海量短信对应的目标客户标识,在黑名单数据库中查找目标客户标识,当能够查找到目标客户标识时,将目标客户标识对应的短信进行拦截。
具体地,主节点服务器接收到海量短信对应的目标客户标识时,在黑名单数据库中查找目标客户标识,当能够找到目标客户标识时,直接将该客户目标客户标识对应的短信进行拦截,并向发送方发送已拉黑提示,并返回拉黑原因。此时,客户可以通过申诉取消拉黑,将将黑名单数据库中的客户标识删除。
在该实施例中,通过建立黑名单数据库,主节点服务器可以预先初步识别出已在黑名单数据库中客户标识的短信为垃圾短信,并进行拦截,减少了要进行垃圾识别的短信的数量,提高了的短信发送的效率。
在一个实施例中,如图6所示,步骤S210,即从节点服务器将营销类短信和其他类短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器,包括步骤:
S602,从节点服务器将营销类短信和其他类短信进行分词处理,根据分词处理结果得到词向量。
S604,将词向量输入到已训练的垃圾短信识别模型中,得到输出结果,并根据输出结果得到短信识别结果,根据识别结果将短信发送运营商服务器,其中,垃圾短信识别模型根据使用历史短信和对应识别结果使用神经网络算法进行训练得到。
其中,神经网络算法是指卷积神经网络算法,其包括输入层、卷积层、池化层和全连接层四个部分构成,使用Relu作为激活函数,其计算公式为f(x)=max(0,x)。词向量是指将所有单词排序,排序之后每个单词就会有一个位置,然后用一个与单词数量等长的数组表示某单词,该单词所在的位置数组值就为1,而其他所有位置值都为0,得到词向量,即使用离散表示(one-hot representation)来进行词向量表示,比如:苹果的词向量为[0,0,0,1,0,0,0,0,......]。
具体地,从节点服务器将得到的营销类短信和其他类短信进行分词处理,根据分词处理结果得到每个词的词向量,根据每个词的词向量得到短信的词向量,将短信的词向量输入到已训练的垃圾短信识别模型中,得到输出结果,其输出结果对应垃圾短信识别结果。根据输出结果与短信识别结果之间的对应关系得到该输出结果对应的短信识别结果,当短信识别结果为非垃圾短信时,将短信发送运营商服务器。当短信识别结果为垃圾短信时,对该拦截短信进行拦截。垃圾短信识别模型根据使用历史短信和对应识别结果使用卷积神经网络算法进行训练得到。
在上述实施例中,通过使用已训练的垃圾短信识别模型进行垃圾短信识别,可以提高垃圾识别的效率和准确性。
在一个实施例中如图7所示,垃圾短信识别模型的生成步骤包括:
S702,获取历史短信和对应识别结果,根据历史短信进行分词得到词向量;
S704,将词向量作为神经网络模型的输入,将对应的识别结果作为神经网络模型的标签进行训练,当训练完成时,得到垃圾短信识别模型。
具体地,获取到历史营销类短信和其他类短信,并得到短信的识别结果。对得到的历史营销类短信和其他类短信进行分词处理,得到分词结果,根据分词结果得到词向量矩阵,将得到词向量矩阵输入到卷积神经网络的输入层中,根据短信的识别结果得到对应的模型输出结果向量,将模型输出结果向量作为卷积神经网络的标签进行训练,当达到预设的训练次数或者达到预设的训练准确度时,训练完成,得到垃圾短信识别模型,通过预先训练好垃圾短信识别模型并加载到从节点服务器中,使得从节点服务器在进行垃圾短信识别时,可以直接进行使用,提高了垃圾短信的识别效率。
应该理解的是,虽然图2-7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-7中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种短信发送系统800,包括:主节点服务器802和从节点服务器804,其中:
主节点服务器802,用于接收海量短信发送指令,根据发送指令得到需要发送的海量短信;并将海量短信按照预设分配规则分配到多个从节点服务器;
从节点服务器804,用于将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;从节点服务器将通知类短信和验证码类短信发送运营商服务器;从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器。
在一个实施例中,从节点服务器804,用于使用关键词提取算法提取营销类短信和其他类短信的目标关键词;当目标关键词与预设关键词不一致时,将目标关键词对应的短信发送运营商服务器。
在一个实施例中,从节点服务器804,用于将营销类短信和其他类短信进行汉语拼音转化,得到对应的目标拼音短信;并在目标拼音短信中匹配预设关键词拼音,当在目标拼音短信中没有匹配到预设关键词拼音时,将目标拼音短信对应的短信发送运营商服务器。
在一个实施例中,主节点服务器802,用于获取当前时间,当当前时间在预设时间段之外时,识别通过,将海量短信按照预设分配规则分配到多个从节点服务器。
在一个实施例中,从节点服务器804,用于当识别失败时,拦截对应的垃圾短信,生成对应的拦截日志,并向发送方返回拦截提示;并获取垃圾短信对应的客户标识,根据拦截日志统计客户标识对应的拦截次数,当拦截次数超过预设阈值时,将客户标识加入黑名单数据库;
则主节点服务器802,用于获取海量短信对应的目标客户标识,在黑名单数据库中查找目标客户标识,当能够查找到目标客户标识时,将目标客户标识对应的短信进行拦截。
在一个实施例中,从节点服务器804,用于将营销类短信和其他类短信进行分词处理,根据分词处理结果得到词向量;并将词向量输入到已训练的垃圾短信识别模型中,得到输出结果,垃圾短信识别模型根据使用历史短信和对应识别结果使用神经网络算法进行训练得到;并根据输出结果得到短信识别结果,根据识别结果将短信发送运营商服务器。
在一个实施例中,主节点服务器802,用于获取历史短信和对应识别结果,根据历史短信进行分词得到词向量;并将词向量作为神经网络模型的输入,将对应的识别结果作为神经网络模型的标签进行训练,当训练完成时,得到垃圾短信识别模型。
关于短信发送系统的具体限定可以参见上文中对于短信发送方法的限定,在此不再赘述。上述短信发送系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储拦截日志数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种短信发送方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现主节点服务器中执行的步骤:主节点服务器接收海量短信发送指令,根据发送指令得到需要发送的海量短信;将海量短信按照预设分配规则分配到多个从节点服务器;或者,该处理器执行计算机程序时实现从节点服务器中执行的步骤:从节点服务器将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;从节点服务器将通知类短信和验证码类短信发送运营商服务器;从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器。
在一个实施例中,处理器执行计算机程序时还实现从节点服务器中执行的步骤:从节点服务器使用关键词提取算法提取营销类短信和其他类短信的目标关键词;当目标关键词与预设关键词不一致时,将目标关键词对应的短信发送运营商服务器。
在一个实施例中,处理器执行计算机程序时还实现从节点服务器中执行的步骤:从节点服务器将营销类短信和其他类短信进行汉语拼音转化,得到对应的目标拼音短信;在目标拼音短信中匹配预设关键词拼音,当在目标拼音短信中没有匹配到预设关键词拼音时,将目标拼音短信对应的短信发送运营商服务器。
在一个实施例中,处理器执行计算机程序时还实现主节点服务器中执行的步骤:主节点服务器获取当前时间,当当前时间在预设时间段之外时,识别通过,将海量短信按照预设分配规则分配到多个从节点服务器。
在一个实施例中,处理器执行计算机程序时还实现从节点服务器中执行的步骤:当识别失败时,从节点服务器拦截对应的垃圾短信,生成对应的拦截日志,并向发送方返回拦截提示;获取垃圾短信对应的客户标识,根据拦截日志统计客户标识对应的拦截次数,当拦截次数超过预设阈值时,将客户标识加入黑名单数据库;则处理器执行计算机程序时还实现以下步骤:主节点服务器获取海量短信对应的目标客户标识,在黑名单数据库中查找目标客户标识,当能够查找到目标客户标识时,将目标客户标识对应的短信进行拦截。
在一个实施例中,处理器执行计算机程序时还实现从节点服务器中执行的步骤:从节点服务器将营销类短信和其他类短信进行分词处理,根据分词处理结果得到词向量;将词向量输入到已训练的垃圾短信识别模型中,得到输出结果,垃圾短信识别模型根据使用历史短信和对应识别结果使用神经网络算法进行训练得到;根据输出结果得到短信识别结果,根据识别结果将短信发送运营商服务器。
在一个实施例中,处理器执行计算机程序时还实现从节点服务器中执行的步骤:获取历史短信和对应识别结果,根据历史短信进行分词得到词向量;将词向量作为神经网络模型的输入,将对应的识别结果作为神经网络模型的标签进行训练,当训练完成时,得到垃圾短信识别模型。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:主节点服务器接收海量短信发送指令,根据发送指令得到需要发送的海量短信;将海量短信按照预设分配规则分配到多个从节点服务器;从节点服务器将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;从节点服务器将通知类短信和验证码类短信发送运营商服务器;从节点服务器将营销类短信和其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送运营商服务器。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从节点服务器使用关键词提取算法提取营销类短信和其他类短信的目标关键词;当目标关键词与预设关键词不一致时,将目标关键词对应的短信发送运营商服务器。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从节点服务器将营销类短信和其他类短信进行汉语拼音转化,得到对应的目标拼音短信;在目标拼音短信中匹配预设关键词拼音,当在目标拼音短信中没有匹配到预设关键词拼音时,将目标拼音短信对应的短信发送运营商服务器。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:主节点服务器获取当前时间,当当前时间在预设时间段之外时,识别通过,将海量短信按照预设分配规则分配到多个从节点服务器。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当识别失败时,从节点服务器拦截对应的垃圾短信,生成对应的拦截日志,并向发送方返回拦截提示;获取垃圾短信对应的客户标识,根据拦截日志统计客户标识对应的拦截次数,当拦截次数超过预设阈值时,将客户标识加入黑名单数据库;则计算机程序被处理器执行时还实现以下步骤:主节点服务器获取海量短信对应的目标客户标识,在黑名单数据库中查找目标客户标识,当能够查找到目标客户标识时,将目标客户标识对应的短信进行拦截。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:从节点服务器将营销类短信和其他类短信进行分词处理,根据分词处理结果得到词向量;将词向量输入到已训练的垃圾短信识别模型中,得到输出结果,垃圾短信识别模型根据使用历史短信和对应识别结果使用神经网络算法进行训练得到;根据输出结果得到短信识别结果,根据识别结果将短信发送运营商服务器。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取历史短信和对应识别结果,根据历史短信进行分词得到词向量;将词向量作为神经网络模型的输入,将对应的识别结果作为神经网络模型的标签进行训练,当训练完成时,得到垃圾短信识别模型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种短信发送方法,所述方法包括:
主节点服务器接收海量短信发送指令,根据所述发送指令得到需要发送的海量短信;
所述主节点服务器将所述海量短信按照预设分配规则分配到多个从节点服务器,包括:所述主节点服务器获取当前时间,当所述当前时间在预设时间段之外时,识别通过,将所述海量短信按照预设分配规则分配到多个从节点服务器,当所述当前时间在预设时间段之内时,将所述海量短信进行拦截;
所述从节点服务器将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;
所述从节点服务器将所述通知类短信和所述验证码类短信发送运营商服务器;
所述从节点服务器将所述营销类短信和所述其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送所述运营商服务器,包括:所述从节点服务器将所述营销类短信和所述其他类短信进行汉语拼音转化,得到对应的目标拼音短信;并在所述目标拼音短信中匹配预设关键词拼音,当在所述目标拼音短信中没有匹配到预设关键词拼音时,将所述目标拼音短信对应的短信发送所述运营商服务器,当在所述目标拼音短信中匹配到一致的预设关键词拼音时,所述目标拼音短信对应的短信为垃圾短信,将所述垃圾短信进行拦截。
2.根据权利要求1所述的方法,其特征在于,所述从节点服务器将所述营销类短信和所述其他类短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送所述运营商服务器,包括:
所述从节点服务器使用关键词提取算法提取所述营销类短信和所述其他类短信的目标关键词;且
当所述目标关键词与预设关键词不一致时,将所述目标关键词对应的短信发送所述运营商服务器。
3.根据权利要求1所述的方法,其特征在于,所述从节点服务器将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信,包括:
所述从节点服务器得到加密短信,使用预先预定好的密钥对所述加密短信进行解密,得到解密后的短信,将解密后的短信进行分类,得到所述营销类短信、所述通知类短信、所述验证码类短信和所述其他类短信。
4.根据权利要求1所述的方法,其特征在于,将所述海量短信按照预设分配规则分配到多个从节点服务器,包括:
所述主节点服务器获取当前时间,当所述当前时间在预设时间段之外时,识别通过,将所述海量短信按照预设分配规则分配到多个从节点服务器。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法,还包括:
当识别失败时,所述从节点服务器拦截对应的垃圾短信,生成对应的拦截日志,并向所述发送方返回拦截提示;并
获取所述垃圾短信对应的客户标识,根据所述拦截日志统计所述客户标识对应的拦截次数,当所述拦截次数超过预设阈值时,将所述客户标识加入黑名单数据库;
所述主节点服务器接收海量短信发送指令,根据所述发送指令得到需要发送的海量短信之后,还包括:
所述主节点服务器获取海量短信对应的目标客户标识,在所述黑名单数据库中查找所述目标客户标识,当能够查找到所述目标客户标识时,将所述目标客户标识对应的短信进行拦截。
6.根据权利要求1所述的方法,其特征在于,所述从节点服务器将所述营销类短信和所述其他类短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送所述运营商服务器,包括:
所述从节点服务器将所述营销类短信和所述其他类短信进行分词处理,根据分词处理结果得到词向量;并
将所述词向量输入到已训练的垃圾短信识别模型中,得到输出结果,并根据输出结果得到短信识别结果,根据识别结果将短信发送所述运营商服务器,其中,所述垃圾短信识别模型根据使用历史短信和对应识别结果使用神经网络算法进行训练得到。
7.根据权利要求6所述的方法,其特征在于,所述垃圾短信识别模型的生成步骤包括:
获取历史短信和对应识别结果,根据所述历史短信进行分词得到词向量;
将所述词向量作为神经网络模型的输入,将所述对应的识别结果作为神经网络模型的标签进行训练,当训练完成时,得到所述垃圾短信识别模型。
8.一种短信发送系统,其特征在于,所述系统包括:
主节点服务器,用于接收海量短信发送指令,根据所述发送指令得到需要发送的海量短信;将所述海量短信按照预设分配规则分配到多个从节点服务器,包括:所述主节点服务器获取当前时间,当所述当前时间在预设时间段之外时,识别通过,将所述海量短信按照预设分配规则分配到多个从节点服务器,当所述当前时间在预设时间段之内时,将所述海量短信进行拦截;
所述从节点服务器,用于将得到的短信进行分类,得到营销类短信、通知类短信、验证码类短信和其他类短信;将所述通知类短信和所述验证码类短信发送运营商服务器;将所述营销类短信和所述其他短信按照预设规则进行垃圾短信识别,将识别通过的非垃圾短信发送所述运营商服务器,包括:所述从节点服务器将所述营销类短信和所述其他类短信进行汉语拼音转化,得到对应的目标拼音短信;并在所述目标拼音短信中匹配预设关键词拼音,当在所述目标拼音短信中没有匹配到预设关键词拼音时,将所述目标拼音短信对应的短信发送所述运营商服务器,当在所述目标拼音短信中匹配到一致的预设关键词拼音时,所述目标拼音短信对应的短信为垃圾短信,将所述垃圾短信进行拦截。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法中主节点服务器执行的步骤,或者
所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法中从节点服务器执行的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810953735.4A CN108966158B (zh) | 2018-08-21 | 2018-08-21 | 短信发送方法、系统、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810953735.4A CN108966158B (zh) | 2018-08-21 | 2018-08-21 | 短信发送方法、系统、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108966158A CN108966158A (zh) | 2018-12-07 |
CN108966158B true CN108966158B (zh) | 2022-04-12 |
Family
ID=64472961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810953735.4A Active CN108966158B (zh) | 2018-08-21 | 2018-08-21 | 短信发送方法、系统、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108966158B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110175221B (zh) * | 2019-05-17 | 2021-04-20 | 国家计算机网络与信息安全管理中心 | 利用词向量结合机器学习的垃圾短信识别方法 |
CN110515923B (zh) * | 2019-08-15 | 2022-12-06 | 福建中信网安信息科技有限公司 | 一种分布式数据库之间的数据迁移方法和系统 |
CN110753316B (zh) * | 2019-09-26 | 2022-04-26 | 贝壳技术有限公司 | 信息发送方法和装置、计算机可读存储介质、电子设备 |
CN111431791B (zh) * | 2020-02-07 | 2021-06-18 | 贝壳找房(北京)科技有限公司 | 即时通讯消息识别方法及系统 |
CN112004201A (zh) * | 2020-08-14 | 2020-11-27 | 苏宁云计算有限公司 | 一种短信的发送方法、装置及计算机系统 |
CN114245323B (zh) * | 2021-12-15 | 2023-03-28 | 平安科技(深圳)有限公司 | 消息处理方法及其装置、计算机设备、存储介质 |
CN114900804B (zh) * | 2022-04-11 | 2023-11-03 | 珠海高凌信息科技股份有限公司 | 一种短信管控系统、方法、装置及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101098502A (zh) * | 2006-06-29 | 2008-01-02 | 卢森特技术有限公司 | Sms垃圾过滤的map消息处理 |
CN104112026A (zh) * | 2014-08-01 | 2014-10-22 | 中国联合网络通信集团有限公司 | 一种短信文本分类方法及系统 |
CN105828306A (zh) * | 2016-03-15 | 2016-08-03 | 中国联合网络通信集团有限公司 | 一种垃圾短信检测方法及装置 |
CN105915647A (zh) * | 2016-06-17 | 2016-08-31 | 浙江万朋教育科技股份有限公司 | 一种提升短信发送性能的系统及方法 |
CN106411704A (zh) * | 2016-09-19 | 2017-02-15 | 南京邮电大学 | 一种分布式垃圾短信识别方法 |
EP3214861A1 (en) * | 2014-10-29 | 2017-09-06 | ZTE Corporation | Method, device and system for detecting fraudulent user |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100576940C (zh) * | 2007-08-01 | 2009-12-30 | 浙江大学 | 短信息监控中心及监控方法 |
-
2018
- 2018-08-21 CN CN201810953735.4A patent/CN108966158B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101098502A (zh) * | 2006-06-29 | 2008-01-02 | 卢森特技术有限公司 | Sms垃圾过滤的map消息处理 |
CN104112026A (zh) * | 2014-08-01 | 2014-10-22 | 中国联合网络通信集团有限公司 | 一种短信文本分类方法及系统 |
EP3214861A1 (en) * | 2014-10-29 | 2017-09-06 | ZTE Corporation | Method, device and system for detecting fraudulent user |
CN105828306A (zh) * | 2016-03-15 | 2016-08-03 | 中国联合网络通信集团有限公司 | 一种垃圾短信检测方法及装置 |
CN105915647A (zh) * | 2016-06-17 | 2016-08-31 | 浙江万朋教育科技股份有限公司 | 一种提升短信发送性能的系统及方法 |
CN106411704A (zh) * | 2016-09-19 | 2017-02-15 | 南京邮电大学 | 一种分布式垃圾短信识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108966158A (zh) | 2018-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108966158B (zh) | 短信发送方法、系统、计算机设备和存储介质 | |
CN111428881B (zh) | 识别模型的训练方法、装置、设备及可读存储介质 | |
CN110365670B (zh) | 黑名单共享方法、装置、计算机设备和存储介质 | |
CN109325870B (zh) | 共享隐私数据的方法和系统 | |
CN108769026B (zh) | 用户账号检测系统和方法 | |
CN110535971B (zh) | 基于区块链的接口配置处理方法、装置、设备及存储介质 | |
CN108833265B (zh) | 消息处理方法、装置、服务器和存储介质 | |
CN110633963A (zh) | 电子票据处理方法、装置、计算机可读存储介质和设备 | |
CN110636106B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN109547426B (zh) | 业务响应方法及服务器 | |
CN111127205B (zh) | 智能合约生成方法、装置、计算机设备和存储介质 | |
CN111275448A (zh) | 人脸数据处理方法、装置和计算机设备 | |
CN112367164B (zh) | 业务请求处理方法、装置、计算机设备和存储介质 | |
CN110336786B (zh) | 消息发送方法、装置、计算机设备和存储介质 | |
CN114218322B (zh) | 基于密文传输的数据展示方法、装置、设备及介质 | |
CN110908778A (zh) | 任务部署方法、系统和存储介质 | |
CN114245323B (zh) | 消息处理方法及其装置、计算机设备、存储介质 | |
CN107038540B (zh) | 基于智能条形码的物流派件方法及装置 | |
CN106921557B (zh) | 一种邮件发送方法和设备 | |
CN114116637A (zh) | 一种数据共享方法、装置、设备及存储介质 | |
CN113609147A (zh) | 数据共享方法、装置及电子设备 | |
US20200396248A1 (en) | Executing Real-Time Message Monitoring to Identify Potentially Malicious Messages and Generate Instream Alerts | |
CN110930193A (zh) | 广告转化率评估方法、装置、计算机设备和存储介质 | |
US10546300B2 (en) | Method for activating a new service or account | |
CN115499120A (zh) | 一种基于云计算的数据保存方法及数据保存平台 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |