CN113505277A

CN113505277A - 基于安卓平台的垃圾短信检测装置

Info

Publication number: CN113505277A
Application number: CN202110700580.5A
Authority: CN
Inventors: 张元元; 王家良; 徐赟; 龚徐建; 吴剑锋
Original assignee: Hangzhou Tiankuan Technology Co ltd
Current assignee: Hangzhou Tiankuan Technology Co ltd
Priority date: 2021-06-23
Filing date: 2021-06-23
Publication date: 2021-10-15
Anticipated expiration: 2041-06-23
Also published as: CN113505277B

Abstract

本发明公开了一种基于安卓平台的垃圾短信检测装置，通过强项探寻单元与本机连通，获取本机内的消息，之后由二级门槛单元将待测信息传输到强力滤出单元，之后强力滤出单元结合强项探寻单元进行终审分析，得到可显信息、存疑信息和废弃信息；借助强力滤出单元将可显信息和存疑信息传输到处理器，并借助处理器将可显信息传输到显示单元和存储单元，显示单元用于显示可显信息；通过本发明能够对信息进行三级筛除，并结合大数据筛除掉基础的垃圾信息之后，通过强力滤出单元对不符合用户习惯的骚扰信息全部筛选，用户习惯通过用户平时的购物记录和相关检索记录分析，结合分析情况判定用户习惯，并据此确定哪些可能属于用户的有价值的垃圾信息。

Description

基于安卓平台的垃圾短信检测装置

技术领域

本发明属于短信检测领域，涉及垃圾短信判定技术，具体是基于安卓平台的垃圾短信检测装置。

背景技术

公开号为CN110019773A的专利公开了一种垃圾短信检测方法、终端及计算机可读存储介质，其中，垃圾短信检测方法包括：对接收到的短信进行预处理，得到数字编码串；根据所述数字编码串，得到目标矩阵；根据所述目标矩阵，确认接收到的短信是否为垃圾短信。本方案通过对接收到的短信进行预处理，得到数字编码串；根据所述数字编码串，得到目标矩阵；根据所述目标矩阵，确认接收到的短信是否为垃圾短信；自动提取特征，无需人工干预，大大提升了检测精度，很好的解决了现有技术中中文垃圾短信检测精度低的问题。

但是该垃圾短信的检测，不能做到结合用户的个人习惯和需求，剔除真正既不属于垃圾短信，又不属于对客户无用的消息；基于此，现提供一种解决方案。

发明内容

本发明的目的在于提供基于安卓平台的垃圾短信检测装置。

本发明的目的可以通过以下技术方案实现：

基于安卓平台的垃圾短信检测装置，包括二级门槛单元、强力滤出单元、强项探寻单元、常规单元、处理器、存储单元和显示单元；

其中，所述强项探寻单元与本机连通，用于获取本机内的消息；所述强力滤出单元接收到由二级门槛单元传输的待测信息，所述强力滤出单元用于结合强项探寻单元进行终审分析，得到可显信息、存疑信息和废弃信息；

所述强力滤出单元用于将可显信息和存疑信息传输到处理器，所述处理器接收强力滤出单元传输的可显信息和存疑信息；

所述处理器用于将可显信息传输到显示单元和存储单元，所述显示单元接收处理器传输的可显信息并进行实时显示；所述存储单元接收处理器传输的可显信息并进行实时存储；

所述处理器用于将存疑信息传输到存储单元进行实时存储。

进一步地，终审分析具体步骤如下：

S1：获取到待测信息；

S2：之后借助强项探寻单元进行惯性总结，根据总结结果产生合购信号和合搜信号；

S3：当同时产生合搜信号和合购信号时，产生显示信号，将对应的待测信息标记为可显信息；

当产生合搜信号和合购信号中任一信号时，产生存疑信号，将对应的待测信息标记为存疑信息；

若不符合上述两种情况，则自动将对应的待测信息标记为废弃信息，并进行删除。

进一步地，步骤S2中的惯性总结具体步骤为：

S201：获取到用户近期的购物记录，近期指代从当下开始往前推三个月；

S202：之后将购物记录内的所有商品名称组合，形成综合记录；

S203：之后将待测信息与综合记录内的商品名称进行比较，当比对到待测信息内存在与商品名称一致的词语时，自动定义增值的具体数值加一，得到具体的增值；

S204：当增值超过X4时，产生合购信号；

S205：之后获取到用户的搜索记录，获取到全部的搜索词条；

S206：同样将搜索词条与待测信息进行比较，当比对到待测信息内存在与搜索词条一致的词语时，自动定义合值的具体数值加一，得到具体的合值；

S207：当合值超过X5时，产生合搜信号。

进一步地，X4为预设数值；X5为预设数值。

进一步地，还包括信息截取单元、信息同步库和一级门槛单元；

其中，所述信息同步库内同步存储有通讯录内的所有联系人；所述信息截取单元用于获取所有接收到的短信息，并将短信息传输到一级门槛单元，所述一级门槛单元接收信息截取单元传输的短信息，并结合信息同步库对短信息进行初步滤出，初步滤出的具体步骤为：

获取到信息同步库内的所有联系人；

获取到短信息的发送方，当其为对应通讯录内的联系人时，自动将对应的短信息标记为合理信息，剩余的标记为非检信息；

所述一级门槛单元用于将合理信息传输到常规单元，所述常规单元接收到一级门槛单元传输的合理信息，所述常规单元用于将合理信息传输到处理器，所述处理器用于将合理信息传输到显示单元，所述显示单元接收处理器传输的合理信息，并进行实时显示。

进一步地，还包括二级门槛单元、骚扰探寻单元和强力滤出单元；

所述骚扰探寻单元与互联网实时连接，且用于实时探寻网络所有信息；所述一级门槛单元用于将非检信息传输到二级门槛单元，所述二级门槛单元接收一级门槛单元传输的非检信息，并对非检信息进行二验处理，得到二常信息和待测信息；

所述二级门槛单元用于将二常信息传输到常规单元，所述常规单元用于借助处理器将二常信息传输到显示单元，所述显示单元接收处理器传输二常信息，并进行实时显示；

所述二级门槛单元用于将待测信息传输到强力滤出单元。

进一步地，二验处理具体步骤为：

步骤一：首先获取到非检信息的信息内容和发送人；

步骤二：利用骚扰探寻单元获取到发送人，借助互联网获取到对应该发送人的号码被标注为骚扰电话的次数，将该次数标记为受举次数；

步骤三：获取到最近一次对应该发送人的号码被标注为骚扰电话的时间，之后获取到该时间距离当下的时间值，将该时间值标记为离末时间；

步骤四：之后借助骚扰探寻单元获取到任意不同号码收到的X1件短信息，将该类型的短信息标记为受分信息；X1为预设数值，具体可选取为300或者其他；

步骤五：获取到所有的受分信息，任选一受分信息；

步骤六：对受分信息进行分词处理，得到若干个构成字词，去除掉指定字词，指定字词为预设的语气词，具体可举例为的、地、你好等管理人员预先设定的词语；将剩余的标记为核心字词；

步骤七：任选下一受分信息，重复步骤六-步骤七，对所有的受分信息进行处理，得到所有的核心字词，将其标记为构成组；

步骤八：获取到所有的核心字词的出现次数，将该出现次数除以X1，将得到的数值标记为分占比，将分占比超过X2的对应构成字词标记为涉非字词；

步骤九：重新获取到非检信息的信息内容内出现的涉非字词的个数，将该个数标记为涉非数，按照非检信息内的核心字词的个数，将该个数标记为总非数；

步骤十：将涉非数除以总非数，得到的值标记为涉嫌值；

步骤十一：借助公式计算核嫌值，具体计算方式为：

核嫌值＝0.634*涉嫌值+0.221*受举次数+0.145*离末时间；

步骤十二：当核嫌值低于X3时，将其标记为二常信息，剩余的标记为待测信息，X3的具体取值方式为：

获取到对应用户收取到的所有骚扰信息，将该骚扰信息按照步骤一到步骤十二的相同原理计算得到的核嫌值之后，求取均值之后加上纠偏值得到X3，纠偏值为管理人员预设数值。

进一步地，还包括管理单元；

所述管理单元与处理器通信连接，所述管理单元用于录入所有的预设数值。

本发明的有益效果：

本发明通过强项探寻单元与本机连通，获取本机内的消息，之后由二级门槛单元将待测信息传输到强力滤出单元，之后强力滤出单元结合强项探寻单元进行终审分析，得到可显信息、存疑信息和废弃信息；

最后借助强力滤出单元将可显信息和存疑信息传输到处理器，并借助处理器将可显信息传输到显示单元和存储单元，显示单元用于显示可显信息；之后利用存储单元接收处理器传输的可显信息和存疑信息并进行实时存储；

通过本发明能够对信息进行三级筛除，并结合大数据筛除掉基础的垃圾信息之后，通过强力滤出单元对不符合用户习惯的骚扰信息全部筛选，用户习惯通过用户平时的购物记录和相关检索记录分析，结合分析情况判定用户习惯，并据此确定哪些可能属于用户的有价值的垃圾信息。

附图说明

为了便于本领域技术人员理解，下面结合附图对本发明作进一步的说明。

图1为本发明的系统框图。

具体实施方式

如图1所示，基于安卓平台的垃圾短信检测装置，包括信息截取单元、信息同步库、一级门槛单元、常规单元、处理器和显示单元；

获取到信息同步库内的所有联系人；

所述一级门槛单元用于将合理信息传输到常规单元，所述常规单元接收到一级门槛单元传输的合理信息，所述常规单元用于将合理信息传输到处理器，所述处理器用于将合理信息传输到显示单元，所述显示单元接收处理器传输的合理信息，并进行实时显示；

作为本发明的又一实施例；

还包括二级门槛单元、骚扰探寻单元和强力滤出单元；

所述骚扰探寻单元与互联网实时连接，且用于实时探寻网络所有信息；所述一级门槛单元用于将非检信息传输到二级门槛单元，所述二级门槛单元接收一级门槛单元传输的非检信息，并对非检信息进行二验处理，二验处理具体步骤为：

步骤一：首先获取到非检信息的信息内容和发送人；

步骤五：获取到所有的受分信息，任选一受分信息；

步骤六：对受分信息进行分词处理，分词处理采用现有技术，非本申请重点，故此处不再赘述；得到若干个构成字词，去除掉指定字词，指定字词为预设的语气词，具体可举例为的、地、你好等管理人员预先设定的词语；将剩余的标记为核心字词；

步骤十：将涉非数除以总非数，得到的值标记为涉嫌值；

步骤十一：借助公式计算核嫌值，具体计算方式为：

核嫌值＝0.634*涉嫌值+0.221*受举次数+0.145*离末时间；

获取到对应用户收取到的所有骚扰信息，将该骚扰信息按照步骤一到步骤十二的相同原理计算得到的核嫌值之后，求取均值之后加上纠偏值得到X3，纠偏值为管理人员预设数值；

所述二级门槛单元用于将待测信息传输到强力滤出单元；

作为本发明的另一实施例；本发明还包括：

强力滤出单元、强项探寻单元、常规单元、处理器、存储单元和管理单元；

其中，所述强项探寻单元与本机连通，用于获取本机内的消息；所述强力滤出单元接收到由二级门槛单元传输的待测信息，所述强力滤出单元用于结合强项探寻单元进行终审分析，终审分析具体步骤如下：

S1：获取到待测信息；

S2：之后借助强项探寻单元进行惯性总结，惯性总结具体步骤为：

S204：当增值超过X4时，产生合购信号，X4为预设数值，具体可取3或者更大；

S205：之后获取到用户的搜索记录，获取到全部的搜索词条；

S207：当合值超过X5时，产生合搜信号，X5为预设数值，具体可取2或者更大；

若不符合上述两种情况，则自动将对应的待测信息标记为废弃信息，并进行删除；

所述处理器用于将存疑信息传输到存储单元进行实时存储。

作为本发明的另一实施例：

基于安卓平台的垃圾短信检测装置，包括信息截取单元、信息同步库、一级门槛单元、常规单元、处理器、显示单元、二级门槛单元、骚扰探寻单元、强力滤出单元、强项探寻单元、存储单元和管理单元；

获取到信息同步库内的所有联系人；

步骤一：首先获取到非检信息的信息内容和发送人；

步骤五：获取到所有的受分信息，任选一受分信息；

步骤十：将涉非数除以总非数，得到的值标记为涉嫌值；

步骤十一：借助公式计算核嫌值，具体计算方式为：

核嫌值＝0.634*涉嫌值+0.221*受举次数+0.145*离末时间；

所述二级门槛单元用于将待测信息传输到强力滤出单元；

S1：获取到待测信息；

S205：之后获取到用户的搜索记录，获取到全部的搜索词条；

所述处理器用于将存疑信息传输到存储单元进行实时存储。

基于安卓平台的垃圾短信检测装置，在工作时，通过强项探寻单元与本机连通，获取本机内的消息，之后由二级门槛单元将待测信息传输到强力滤出单元，之后强力滤出单元结合强项探寻单元进行终审分析，得到可显信息、存疑信息和废弃信息；

最后借助强力滤出单元将可显信息和存疑信息传输到处理器，并借助处理器将可显信息传输到显示单元和存储单元，显示单元用于显示可显信息；之后利用存储单元接收处理器传输的可显信息和存疑信息并进行实时存储。

以上内容仅仅是对本发明结构所作的举例和说明，所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代，只要不偏离发明的结构或者超越本权利要求书所定义的范围，均应属于本发明的保护范围。

Claims

1.基于安卓平台的垃圾短信检测装置，其特征在于，包括二级门槛单元、强力滤出单元、强项探寻单元、常规单元、处理器、存储单元和显示单元；

所述处理器用于将存疑信息传输到存储单元进行实时存储。

2.根据权利要求1所述的基于安卓平台的垃圾短信检测装置，其特征在于，终审分析具体步骤如下：

S1：获取到待测信息；

3.根据权利要求2所述的基于安卓平台的垃圾短信检测装置，其特征在于，步骤S2中的惯性总结具体步骤为：

S204：当增值超过X4时，产生合购信号；

S205：之后获取到用户的搜索记录，获取到全部的搜索词条；

S207：当合值超过X5时，产生合搜信号。

4.根据权利要求3所述的基于安卓平台的垃圾短信检测装置，其特征在于，X4为预设数值；X5为预设数值。

5.根据权利要求1所述的基于安卓平台的垃圾短信检测装置，其特征在于，还包括信息截取单元、信息同步库和一级门槛单元；

获取到信息同步库内的所有联系人；

6.根据权利要求5所述的基于安卓平台的垃圾短信检测装置，其特征在于，还包括二级门槛单元、骚扰探寻单元和强力滤出单元；

所述二级门槛单元用于将待测信息传输到强力滤出单元。

7.根据权利要求6所述的基于安卓平台的垃圾短信检测装置，其特征在于，二验处理具体步骤为：

步骤一：首先获取到非检信息的信息内容和发送人；

步骤四：之后借助骚扰探寻单元获取到任意不同号码收到的X1件短信息，将该类型的短信息标记为受分信息；X1为预设数值；

步骤五：获取到所有的受分信息，任选一受分信息；

步骤六：对受分信息进行分词处理，得到若干个构成字词，去除掉指定字词，指定字词为管理人员预先设定的词语；将剩余的标记为核心字词；

步骤十：将涉非数除以总非数，得到的值标记为涉嫌值；

步骤十一：借助公式计算核嫌值，具体计算方式为：

核嫌值＝0.634*涉嫌值+0.221*受举次数+0.145*离末时间；

8.根据权利要求1-7任意一项所述的基于安卓平台的垃圾短信检测装置，其特征在于，还包括管理单元；