CN113505277A - 基于安卓平台的垃圾短信检测装置 - Google Patents
基于安卓平台的垃圾短信检测装置 Download PDFInfo
- Publication number
- CN113505277A CN113505277A CN202110700580.5A CN202110700580A CN113505277A CN 113505277 A CN113505277 A CN 113505277A CN 202110700580 A CN202110700580 A CN 202110700580A CN 113505277 A CN113505277 A CN 113505277A
- Authority
- CN
- China
- Prior art keywords
- information
- unit
- value
- acquiring
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 48
- 238000001914 filtration Methods 0.000 claims abstract description 39
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 239000002699 waste material Substances 0.000 claims abstract description 9
- 238000012550 audit Methods 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims description 17
- 238000012937 correction Methods 0.000 claims description 8
- 238000007726 management method Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 4
- 239000000470 constituent Substances 0.000 claims description 4
- 238000007689 inspection Methods 0.000 claims description 4
- 238000012552 review Methods 0.000 claims description 2
- 238000012360 testing method Methods 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9038—Presentation of query results
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42382—Text-based messaging services in telephone networks such as PSTN/ISDN, e.g. User-to-User Signalling or Short Message Service for fixed networks
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种基于安卓平台的垃圾短信检测装置,通过强项探寻单元与本机连通,获取本机内的消息,之后由二级门槛单元将待测信息传输到强力滤出单元,之后强力滤出单元结合强项探寻单元进行终审分析,得到可显信息、存疑信息和废弃信息;借助强力滤出单元将可显信息和存疑信息传输到处理器,并借助处理器将可显信息传输到显示单元和存储单元,显示单元用于显示可显信息;通过本发明能够对信息进行三级筛除,并结合大数据筛除掉基础的垃圾信息之后,通过强力滤出单元对不符合用户习惯的骚扰信息全部筛选,用户习惯通过用户平时的购物记录和相关检索记录分析,结合分析情况判定用户习惯,并据此确定哪些可能属于用户的有价值的垃圾信息。
Description
技术领域
本发明属于短信检测领域,涉及垃圾短信判定技术,具体是基于安卓平台的垃圾短信检测装置。
背景技术
公开号为CN110019773A的专利公开了一种垃圾短信检测方法、终端及计算机可读存储介质,其中,垃圾短信检测方法包括:对接收到的短信进行预处理,得到数字编码串;根据所述数字编码串,得到目标矩阵;根据所述目标矩阵,确认接收到的短信是否为垃圾短信。本方案通过对接收到的短信进行预处理,得到数字编码串;根据所述数字编码串,得到目标矩阵;根据所述目标矩阵,确认接收到的短信是否为垃圾短信;自动提取特征,无需人工干预,大大提升了检测精度,很好的解决了现有技术中中文垃圾短信检测精度低的问题。
但是该垃圾短信的检测,不能做到结合用户的个人习惯和需求,剔除真正既不属于垃圾短信,又不属于对客户无用的消息;基于此,现提供一种解决方案。
发明内容
本发明的目的在于提供基于安卓平台的垃圾短信检测装置。
本发明的目的可以通过以下技术方案实现:
基于安卓平台的垃圾短信检测装置,包括二级门槛单元、强力滤出单元、强项探寻单元、常规单元、处理器、存储单元和显示单元;
其中,所述强项探寻单元与本机连通,用于获取本机内的消息;所述强力滤出单元接收到由二级门槛单元传输的待测信息,所述强力滤出单元用于结合强项探寻单元进行终审分析,得到可显信息、存疑信息和废弃信息;
所述强力滤出单元用于将可显信息和存疑信息传输到处理器,所述处理器接收强力滤出单元传输的可显信息和存疑信息;
所述处理器用于将可显信息传输到显示单元和存储单元,所述显示单元接收处理器传输的可显信息并进行实时显示;所述存储单元接收处理器传输的可显信息并进行实时存储;
所述处理器用于将存疑信息传输到存储单元进行实时存储。
进一步地,终审分析具体步骤如下:
S1:获取到待测信息;
S2:之后借助强项探寻单元进行惯性总结,根据总结结果产生合购信号和合搜信号;
S3:当同时产生合搜信号和合购信号时,产生显示信号,将对应的待测信息标记为可显信息;
当产生合搜信号和合购信号中任一信号时,产生存疑信号,将对应的待测信息标记为存疑信息;
若不符合上述两种情况,则自动将对应的待测信息标记为废弃信息,并进行删除。
进一步地,步骤S2中的惯性总结具体步骤为:
S201:获取到用户近期的购物记录,近期指代从当下开始往前推三个月;
S202:之后将购物记录内的所有商品名称组合,形成综合记录;
S203:之后将待测信息与综合记录内的商品名称进行比较,当比对到待测信息内存在与商品名称一致的词语时,自动定义增值的具体数值加一,得到具体的增值;
S204:当增值超过X4时,产生合购信号;
S205:之后获取到用户的搜索记录,获取到全部的搜索词条;
S206:同样将搜索词条与待测信息进行比较,当比对到待测信息内存在与搜索词条一致的词语时,自动定义合值的具体数值加一,得到具体的合值;
S207:当合值超过X5时,产生合搜信号。
进一步地,X4为预设数值;X5为预设数值。
进一步地,还包括信息截取单元、信息同步库和一级门槛单元;
其中,所述信息同步库内同步存储有通讯录内的所有联系人;所述信息截取单元用于获取所有接收到的短信息,并将短信息传输到一级门槛单元,所述一级门槛单元接收信息截取单元传输的短信息,并结合信息同步库对短信息进行初步滤出,初步滤出的具体步骤为:
获取到信息同步库内的所有联系人;
获取到短信息的发送方,当其为对应通讯录内的联系人时,自动将对应的短信息标记为合理信息,剩余的标记为非检信息;
所述一级门槛单元用于将合理信息传输到常规单元,所述常规单元接收到一级门槛单元传输的合理信息,所述常规单元用于将合理信息传输到处理器,所述处理器用于将合理信息传输到显示单元,所述显示单元接收处理器传输的合理信息,并进行实时显示。
进一步地,还包括二级门槛单元、骚扰探寻单元和强力滤出单元;
所述骚扰探寻单元与互联网实时连接,且用于实时探寻网络所有信息;所述一级门槛单元用于将非检信息传输到二级门槛单元,所述二级门槛单元接收一级门槛单元传输的非检信息,并对非检信息进行二验处理,得到二常信息和待测信息;
所述二级门槛单元用于将二常信息传输到常规单元,所述常规单元用于借助处理器将二常信息传输到显示单元,所述显示单元接收处理器传输二常信息,并进行实时显示;
所述二级门槛单元用于将待测信息传输到强力滤出单元。
进一步地,二验处理具体步骤为:
步骤一:首先获取到非检信息的信息内容和发送人;
步骤二:利用骚扰探寻单元获取到发送人,借助互联网获取到对应该发送人的号码被标注为骚扰电话的次数,将该次数标记为受举次数;
步骤三:获取到最近一次对应该发送人的号码被标注为骚扰电话的时间,之后获取到该时间距离当下的时间值,将该时间值标记为离末时间;
步骤四:之后借助骚扰探寻单元获取到任意不同号码收到的X1件短信息,将该类型的短信息标记为受分信息;X1为预设数值,具体可选取为300或者其他;
步骤五:获取到所有的受分信息,任选一受分信息;
步骤六:对受分信息进行分词处理,得到若干个构成字词,去除掉指定字词,指定字词为预设的语气词,具体可举例为的、地、你好等管理人员预先设定的词语;将剩余的标记为核心字词;
步骤七:任选下一受分信息,重复步骤六-步骤七,对所有的受分信息进行处理,得到所有的核心字词,将其标记为构成组;
步骤八:获取到所有的核心字词的出现次数,将该出现次数除以X1,将得到的数值标记为分占比,将分占比超过X2的对应构成字词标记为涉非字词;
步骤九:重新获取到非检信息的信息内容内出现的涉非字词的个数,将该个数标记为涉非数,按照非检信息内的核心字词的个数,将该个数标记为总非数;
步骤十:将涉非数除以总非数,得到的值标记为涉嫌值;
步骤十一:借助公式计算核嫌值,具体计算方式为:
核嫌值=0.634*涉嫌值+0.221*受举次数+0.145*离末时间;
步骤十二:当核嫌值低于X3时,将其标记为二常信息,剩余的标记为待测信息,X3的具体取值方式为:
获取到对应用户收取到的所有骚扰信息,将该骚扰信息按照步骤一到步骤十二的相同原理计算得到的核嫌值之后,求取均值之后加上纠偏值得到X3,纠偏值为管理人员预设数值。
进一步地,还包括管理单元;
所述管理单元与处理器通信连接,所述管理单元用于录入所有的预设数值。
本发明的有益效果:
本发明通过强项探寻单元与本机连通,获取本机内的消息,之后由二级门槛单元将待测信息传输到强力滤出单元,之后强力滤出单元结合强项探寻单元进行终审分析,得到可显信息、存疑信息和废弃信息;
最后借助强力滤出单元将可显信息和存疑信息传输到处理器,并借助处理器将可显信息传输到显示单元和存储单元,显示单元用于显示可显信息;之后利用存储单元接收处理器传输的可显信息和存疑信息并进行实时存储;
通过本发明能够对信息进行三级筛除,并结合大数据筛除掉基础的垃圾信息之后,通过强力滤出单元对不符合用户习惯的骚扰信息全部筛选,用户习惯通过用户平时的购物记录和相关检索记录分析,结合分析情况判定用户习惯,并据此确定哪些可能属于用户的有价值的垃圾信息。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的系统框图。
具体实施方式
如图1所示,基于安卓平台的垃圾短信检测装置,包括信息截取单元、信息同步库、一级门槛单元、常规单元、处理器和显示单元;
其中,所述信息同步库内同步存储有通讯录内的所有联系人;所述信息截取单元用于获取所有接收到的短信息,并将短信息传输到一级门槛单元,所述一级门槛单元接收信息截取单元传输的短信息,并结合信息同步库对短信息进行初步滤出,初步滤出的具体步骤为:
获取到信息同步库内的所有联系人;
获取到短信息的发送方,当其为对应通讯录内的联系人时,自动将对应的短信息标记为合理信息,剩余的标记为非检信息;
所述一级门槛单元用于将合理信息传输到常规单元,所述常规单元接收到一级门槛单元传输的合理信息,所述常规单元用于将合理信息传输到处理器,所述处理器用于将合理信息传输到显示单元,所述显示单元接收处理器传输的合理信息,并进行实时显示;
作为本发明的又一实施例;
还包括二级门槛单元、骚扰探寻单元和强力滤出单元;
所述骚扰探寻单元与互联网实时连接,且用于实时探寻网络所有信息;所述一级门槛单元用于将非检信息传输到二级门槛单元,所述二级门槛单元接收一级门槛单元传输的非检信息,并对非检信息进行二验处理,二验处理具体步骤为:
步骤一:首先获取到非检信息的信息内容和发送人;
步骤二:利用骚扰探寻单元获取到发送人,借助互联网获取到对应该发送人的号码被标注为骚扰电话的次数,将该次数标记为受举次数;
步骤三:获取到最近一次对应该发送人的号码被标注为骚扰电话的时间,之后获取到该时间距离当下的时间值,将该时间值标记为离末时间;
步骤四:之后借助骚扰探寻单元获取到任意不同号码收到的X1件短信息,将该类型的短信息标记为受分信息;X1为预设数值,具体可选取为300或者其他;
步骤五:获取到所有的受分信息,任选一受分信息;
步骤六:对受分信息进行分词处理,分词处理采用现有技术,非本申请重点,故此处不再赘述;得到若干个构成字词,去除掉指定字词,指定字词为预设的语气词,具体可举例为的、地、你好等管理人员预先设定的词语;将剩余的标记为核心字词;
步骤七:任选下一受分信息,重复步骤六-步骤七,对所有的受分信息进行处理,得到所有的核心字词,将其标记为构成组;
步骤八:获取到所有的核心字词的出现次数,将该出现次数除以X1,将得到的数值标记为分占比,将分占比超过X2的对应构成字词标记为涉非字词;
步骤九:重新获取到非检信息的信息内容内出现的涉非字词的个数,将该个数标记为涉非数,按照非检信息内的核心字词的个数,将该个数标记为总非数;
步骤十:将涉非数除以总非数,得到的值标记为涉嫌值;
步骤十一:借助公式计算核嫌值,具体计算方式为:
核嫌值=0.634*涉嫌值+0.221*受举次数+0.145*离末时间;
步骤十二:当核嫌值低于X3时,将其标记为二常信息,剩余的标记为待测信息,X3的具体取值方式为:
获取到对应用户收取到的所有骚扰信息,将该骚扰信息按照步骤一到步骤十二的相同原理计算得到的核嫌值之后,求取均值之后加上纠偏值得到X3,纠偏值为管理人员预设数值;
所述二级门槛单元用于将二常信息传输到常规单元,所述常规单元用于借助处理器将二常信息传输到显示单元,所述显示单元接收处理器传输二常信息,并进行实时显示;
所述二级门槛单元用于将待测信息传输到强力滤出单元;
作为本发明的另一实施例;本发明还包括:
强力滤出单元、强项探寻单元、常规单元、处理器、存储单元和管理单元;
其中,所述强项探寻单元与本机连通,用于获取本机内的消息;所述强力滤出单元接收到由二级门槛单元传输的待测信息,所述强力滤出单元用于结合强项探寻单元进行终审分析,终审分析具体步骤如下:
S1:获取到待测信息;
S2:之后借助强项探寻单元进行惯性总结,惯性总结具体步骤为:
S201:获取到用户近期的购物记录,近期指代从当下开始往前推三个月;
S202:之后将购物记录内的所有商品名称组合,形成综合记录;
S203:之后将待测信息与综合记录内的商品名称进行比较,当比对到待测信息内存在与商品名称一致的词语时,自动定义增值的具体数值加一,得到具体的增值;
S204:当增值超过X4时,产生合购信号,X4为预设数值,具体可取3或者更大;
S205:之后获取到用户的搜索记录,获取到全部的搜索词条;
S206:同样将搜索词条与待测信息进行比较,当比对到待测信息内存在与搜索词条一致的词语时,自动定义合值的具体数值加一,得到具体的合值;
S207:当合值超过X5时,产生合搜信号,X5为预设数值,具体可取2或者更大;
S3:当同时产生合搜信号和合购信号时,产生显示信号,将对应的待测信息标记为可显信息;
当产生合搜信号和合购信号中任一信号时,产生存疑信号,将对应的待测信息标记为存疑信息;
若不符合上述两种情况,则自动将对应的待测信息标记为废弃信息,并进行删除;
所述强力滤出单元用于将可显信息和存疑信息传输到处理器,所述处理器接收强力滤出单元传输的可显信息和存疑信息;
所述处理器用于将可显信息传输到显示单元和存储单元,所述显示单元接收处理器传输的可显信息并进行实时显示;所述存储单元接收处理器传输的可显信息并进行实时存储;
所述处理器用于将存疑信息传输到存储单元进行实时存储。
所述管理单元与处理器通信连接,所述管理单元用于录入所有的预设数值。
作为本发明的另一实施例:
基于安卓平台的垃圾短信检测装置,包括信息截取单元、信息同步库、一级门槛单元、常规单元、处理器、显示单元、二级门槛单元、骚扰探寻单元、强力滤出单元、强项探寻单元、存储单元和管理单元;
其中,所述信息同步库内同步存储有通讯录内的所有联系人;所述信息截取单元用于获取所有接收到的短信息,并将短信息传输到一级门槛单元,所述一级门槛单元接收信息截取单元传输的短信息,并结合信息同步库对短信息进行初步滤出,初步滤出的具体步骤为:
获取到信息同步库内的所有联系人;
获取到短信息的发送方,当其为对应通讯录内的联系人时,自动将对应的短信息标记为合理信息,剩余的标记为非检信息;
所述一级门槛单元用于将合理信息传输到常规单元,所述常规单元接收到一级门槛单元传输的合理信息,所述常规单元用于将合理信息传输到处理器,所述处理器用于将合理信息传输到显示单元,所述显示单元接收处理器传输的合理信息,并进行实时显示;
所述骚扰探寻单元与互联网实时连接,且用于实时探寻网络所有信息;所述一级门槛单元用于将非检信息传输到二级门槛单元,所述二级门槛单元接收一级门槛单元传输的非检信息,并对非检信息进行二验处理,二验处理具体步骤为:
步骤一:首先获取到非检信息的信息内容和发送人;
步骤二:利用骚扰探寻单元获取到发送人,借助互联网获取到对应该发送人的号码被标注为骚扰电话的次数,将该次数标记为受举次数;
步骤三:获取到最近一次对应该发送人的号码被标注为骚扰电话的时间,之后获取到该时间距离当下的时间值,将该时间值标记为离末时间;
步骤四:之后借助骚扰探寻单元获取到任意不同号码收到的X1件短信息,将该类型的短信息标记为受分信息;X1为预设数值,具体可选取为300或者其他;
步骤五:获取到所有的受分信息,任选一受分信息;
步骤六:对受分信息进行分词处理,分词处理采用现有技术,非本申请重点,故此处不再赘述;得到若干个构成字词,去除掉指定字词,指定字词为预设的语气词,具体可举例为的、地、你好等管理人员预先设定的词语;将剩余的标记为核心字词;
步骤七:任选下一受分信息,重复步骤六-步骤七,对所有的受分信息进行处理,得到所有的核心字词,将其标记为构成组;
步骤八:获取到所有的核心字词的出现次数,将该出现次数除以X1,将得到的数值标记为分占比,将分占比超过X2的对应构成字词标记为涉非字词;
步骤九:重新获取到非检信息的信息内容内出现的涉非字词的个数,将该个数标记为涉非数,按照非检信息内的核心字词的个数,将该个数标记为总非数;
步骤十:将涉非数除以总非数,得到的值标记为涉嫌值;
步骤十一:借助公式计算核嫌值,具体计算方式为:
核嫌值=0.634*涉嫌值+0.221*受举次数+0.145*离末时间;
步骤十二:当核嫌值低于X3时,将其标记为二常信息,剩余的标记为待测信息,X3的具体取值方式为:
获取到对应用户收取到的所有骚扰信息,将该骚扰信息按照步骤一到步骤十二的相同原理计算得到的核嫌值之后,求取均值之后加上纠偏值得到X3,纠偏值为管理人员预设数值;
所述二级门槛单元用于将二常信息传输到常规单元,所述常规单元用于借助处理器将二常信息传输到显示单元,所述显示单元接收处理器传输二常信息,并进行实时显示;
所述二级门槛单元用于将待测信息传输到强力滤出单元;
其中,所述强项探寻单元与本机连通,用于获取本机内的消息;所述强力滤出单元接收到由二级门槛单元传输的待测信息,所述强力滤出单元用于结合强项探寻单元进行终审分析,终审分析具体步骤如下:
S1:获取到待测信息;
S2:之后借助强项探寻单元进行惯性总结,惯性总结具体步骤为:
S201:获取到用户近期的购物记录,近期指代从当下开始往前推三个月;
S202:之后将购物记录内的所有商品名称组合,形成综合记录;
S203:之后将待测信息与综合记录内的商品名称进行比较,当比对到待测信息内存在与商品名称一致的词语时,自动定义增值的具体数值加一,得到具体的增值;
S204:当增值超过X4时,产生合购信号,X4为预设数值,具体可取3或者更大;
S205:之后获取到用户的搜索记录,获取到全部的搜索词条;
S206:同样将搜索词条与待测信息进行比较,当比对到待测信息内存在与搜索词条一致的词语时,自动定义合值的具体数值加一,得到具体的合值;
S207:当合值超过X5时,产生合搜信号,X5为预设数值,具体可取2或者更大;
S3:当同时产生合搜信号和合购信号时,产生显示信号,将对应的待测信息标记为可显信息;
当产生合搜信号和合购信号中任一信号时,产生存疑信号,将对应的待测信息标记为存疑信息;
若不符合上述两种情况,则自动将对应的待测信息标记为废弃信息,并进行删除;
所述强力滤出单元用于将可显信息和存疑信息传输到处理器,所述处理器接收强力滤出单元传输的可显信息和存疑信息;
所述处理器用于将可显信息传输到显示单元和存储单元,所述显示单元接收处理器传输的可显信息并进行实时显示;所述存储单元接收处理器传输的可显信息并进行实时存储;
所述处理器用于将存疑信息传输到存储单元进行实时存储。
所述管理单元与处理器通信连接,所述管理单元用于录入所有的预设数值。
基于安卓平台的垃圾短信检测装置,在工作时,通过强项探寻单元与本机连通,获取本机内的消息,之后由二级门槛单元将待测信息传输到强力滤出单元,之后强力滤出单元结合强项探寻单元进行终审分析,得到可显信息、存疑信息和废弃信息;
最后借助强力滤出单元将可显信息和存疑信息传输到处理器,并借助处理器将可显信息传输到显示单元和存储单元,显示单元用于显示可显信息;之后利用存储单元接收处理器传输的可显信息和存疑信息并进行实时存储。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (8)
1.基于安卓平台的垃圾短信检测装置,其特征在于,包括二级门槛单元、强力滤出单元、强项探寻单元、常规单元、处理器、存储单元和显示单元;
其中,所述强项探寻单元与本机连通,用于获取本机内的消息;所述强力滤出单元接收到由二级门槛单元传输的待测信息,所述强力滤出单元用于结合强项探寻单元进行终审分析,得到可显信息、存疑信息和废弃信息;
所述强力滤出单元用于将可显信息和存疑信息传输到处理器,所述处理器接收强力滤出单元传输的可显信息和存疑信息;
所述处理器用于将可显信息传输到显示单元和存储单元,所述显示单元接收处理器传输的可显信息并进行实时显示;所述存储单元接收处理器传输的可显信息并进行实时存储;
所述处理器用于将存疑信息传输到存储单元进行实时存储。
2.根据权利要求1所述的基于安卓平台的垃圾短信检测装置,其特征在于,终审分析具体步骤如下:
S1:获取到待测信息;
S2:之后借助强项探寻单元进行惯性总结,根据总结结果产生合购信号和合搜信号;
S3:当同时产生合搜信号和合购信号时,产生显示信号,将对应的待测信息标记为可显信息;
当产生合搜信号和合购信号中任一信号时,产生存疑信号,将对应的待测信息标记为存疑信息;
若不符合上述两种情况,则自动将对应的待测信息标记为废弃信息,并进行删除。
3.根据权利要求2所述的基于安卓平台的垃圾短信检测装置,其特征在于,步骤S2中的惯性总结具体步骤为:
S201:获取到用户近期的购物记录,近期指代从当下开始往前推三个月;
S202:之后将购物记录内的所有商品名称组合,形成综合记录;
S203:之后将待测信息与综合记录内的商品名称进行比较,当比对到待测信息内存在与商品名称一致的词语时,自动定义增值的具体数值加一,得到具体的增值;
S204:当增值超过X4时,产生合购信号;
S205:之后获取到用户的搜索记录,获取到全部的搜索词条;
S206:同样将搜索词条与待测信息进行比较,当比对到待测信息内存在与搜索词条一致的词语时,自动定义合值的具体数值加一,得到具体的合值;
S207:当合值超过X5时,产生合搜信号。
4.根据权利要求3所述的基于安卓平台的垃圾短信检测装置,其特征在于,X4为预设数值;X5为预设数值。
5.根据权利要求1所述的基于安卓平台的垃圾短信检测装置,其特征在于,还包括信息截取单元、信息同步库和一级门槛单元;
其中,所述信息同步库内同步存储有通讯录内的所有联系人;所述信息截取单元用于获取所有接收到的短信息,并将短信息传输到一级门槛单元,所述一级门槛单元接收信息截取单元传输的短信息,并结合信息同步库对短信息进行初步滤出,初步滤出的具体步骤为:
获取到信息同步库内的所有联系人;
获取到短信息的发送方,当其为对应通讯录内的联系人时,自动将对应的短信息标记为合理信息,剩余的标记为非检信息;
所述一级门槛单元用于将合理信息传输到常规单元,所述常规单元接收到一级门槛单元传输的合理信息,所述常规单元用于将合理信息传输到处理器,所述处理器用于将合理信息传输到显示单元,所述显示单元接收处理器传输的合理信息,并进行实时显示。
6.根据权利要求5所述的基于安卓平台的垃圾短信检测装置,其特征在于,还包括二级门槛单元、骚扰探寻单元和强力滤出单元;
所述骚扰探寻单元与互联网实时连接,且用于实时探寻网络所有信息;所述一级门槛单元用于将非检信息传输到二级门槛单元,所述二级门槛单元接收一级门槛单元传输的非检信息,并对非检信息进行二验处理,得到二常信息和待测信息;
所述二级门槛单元用于将二常信息传输到常规单元,所述常规单元用于借助处理器将二常信息传输到显示单元,所述显示单元接收处理器传输二常信息,并进行实时显示;
所述二级门槛单元用于将待测信息传输到强力滤出单元。
7.根据权利要求6所述的基于安卓平台的垃圾短信检测装置,其特征在于,二验处理具体步骤为:
步骤一:首先获取到非检信息的信息内容和发送人;
步骤二:利用骚扰探寻单元获取到发送人,借助互联网获取到对应该发送人的号码被标注为骚扰电话的次数,将该次数标记为受举次数;
步骤三:获取到最近一次对应该发送人的号码被标注为骚扰电话的时间,之后获取到该时间距离当下的时间值,将该时间值标记为离末时间;
步骤四:之后借助骚扰探寻单元获取到任意不同号码收到的X1件短信息,将该类型的短信息标记为受分信息;X1为预设数值;
步骤五:获取到所有的受分信息,任选一受分信息;
步骤六:对受分信息进行分词处理,得到若干个构成字词,去除掉指定字词,指定字词为管理人员预先设定的词语;将剩余的标记为核心字词;
步骤七:任选下一受分信息,重复步骤六-步骤七,对所有的受分信息进行处理,得到所有的核心字词,将其标记为构成组;
步骤八:获取到所有的核心字词的出现次数,将该出现次数除以X1,将得到的数值标记为分占比,将分占比超过X2的对应构成字词标记为涉非字词;
步骤九:重新获取到非检信息的信息内容内出现的涉非字词的个数,将该个数标记为涉非数,按照非检信息内的核心字词的个数,将该个数标记为总非数;
步骤十:将涉非数除以总非数,得到的值标记为涉嫌值;
步骤十一:借助公式计算核嫌值,具体计算方式为:
核嫌值=0.634*涉嫌值+0.221*受举次数+0.145*离末时间;
步骤十二:当核嫌值低于X3时,将其标记为二常信息,剩余的标记为待测信息,X3的具体取值方式为:
获取到对应用户收取到的所有骚扰信息,将该骚扰信息按照步骤一到步骤十二的相同原理计算得到的核嫌值之后,求取均值之后加上纠偏值得到X3,纠偏值为管理人员预设数值。
8.根据权利要求1-7任意一项所述的基于安卓平台的垃圾短信检测装置,其特征在于,还包括管理单元;
所述管理单元与处理器通信连接,所述管理单元用于录入所有的预设数值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110700580.5A CN113505277B (zh) | 2021-06-23 | 2021-06-23 | 基于安卓平台的垃圾短信检测装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110700580.5A CN113505277B (zh) | 2021-06-23 | 2021-06-23 | 基于安卓平台的垃圾短信检测装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113505277A true CN113505277A (zh) | 2021-10-15 |
CN113505277B CN113505277B (zh) | 2024-07-09 |
Family
ID=78010570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110700580.5A Active CN113505277B (zh) | 2021-06-23 | 2021-06-23 | 基于安卓平台的垃圾短信检测装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113505277B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050005853A (ko) * | 2003-07-07 | 2005-01-15 | 엘지전자 주식회사 | 휴대단말기의 스팸 메시지 관리장치 및 방법 |
US20050204005A1 (en) * | 2004-03-12 | 2005-09-15 | Purcell Sean E. | Selective treatment of messages based on junk rating |
CN101431731A (zh) * | 2008-10-28 | 2009-05-13 | 中国移动通信集团福建有限公司 | 基于用户手机对非法语音电话及短信号码自动捕捉装置 |
KR20130082953A (ko) * | 2011-12-23 | 2013-07-22 | 김용성 | 보이스피싱, 원링, 스팸 전화 및 문자 발신정보 수집 및 광고를 이용한 보상과 활용 방법 및 장치 |
US20150156300A1 (en) * | 2013-11-29 | 2015-06-04 | Samsung Electronics Co., Ltd. | Method for filtering spam in electronic device and the electronic device |
US20180081991A1 (en) * | 2016-09-20 | 2018-03-22 | International Business Machines Corporation | Similar email spam detection |
US20190155851A1 (en) * | 2016-09-09 | 2019-05-23 | Tencent Technology (Shenzhen) Company Limited | Information filtering |
CN110134778A (zh) * | 2019-04-26 | 2019-08-16 | 珍岛信息技术(上海)股份有限公司 | 一种无效数据过滤系统 |
CN111918293A (zh) * | 2020-07-29 | 2020-11-10 | 北京宏达隆和科技有限公司 | 一种通讯信息诈骗的多维度关联检测方法 |
US20200380032A1 (en) * | 2019-05-28 | 2020-12-03 | Slack Technologies, Inc. | Method, apparatus and computer program product for generating tiered search index fields in a group-based communication platform |
CN112311933A (zh) * | 2020-10-27 | 2021-02-02 | 杭州天宽科技有限公司 | 敏感信息屏蔽方法及系统 |
-
2021
- 2021-06-23 CN CN202110700580.5A patent/CN113505277B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050005853A (ko) * | 2003-07-07 | 2005-01-15 | 엘지전자 주식회사 | 휴대단말기의 스팸 메시지 관리장치 및 방법 |
US20050204005A1 (en) * | 2004-03-12 | 2005-09-15 | Purcell Sean E. | Selective treatment of messages based on junk rating |
CN101431731A (zh) * | 2008-10-28 | 2009-05-13 | 中国移动通信集团福建有限公司 | 基于用户手机对非法语音电话及短信号码自动捕捉装置 |
KR20130082953A (ko) * | 2011-12-23 | 2013-07-22 | 김용성 | 보이스피싱, 원링, 스팸 전화 및 문자 발신정보 수집 및 광고를 이용한 보상과 활용 방법 및 장치 |
US20150156300A1 (en) * | 2013-11-29 | 2015-06-04 | Samsung Electronics Co., Ltd. | Method for filtering spam in electronic device and the electronic device |
US20190155851A1 (en) * | 2016-09-09 | 2019-05-23 | Tencent Technology (Shenzhen) Company Limited | Information filtering |
US20180081991A1 (en) * | 2016-09-20 | 2018-03-22 | International Business Machines Corporation | Similar email spam detection |
CN110134778A (zh) * | 2019-04-26 | 2019-08-16 | 珍岛信息技术(上海)股份有限公司 | 一种无效数据过滤系统 |
US20200380032A1 (en) * | 2019-05-28 | 2020-12-03 | Slack Technologies, Inc. | Method, apparatus and computer program product for generating tiered search index fields in a group-based communication platform |
CN111918293A (zh) * | 2020-07-29 | 2020-11-10 | 北京宏达隆和科技有限公司 | 一种通讯信息诈骗的多维度关联检测方法 |
CN112311933A (zh) * | 2020-10-27 | 2021-02-02 | 杭州天宽科技有限公司 | 敏感信息屏蔽方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113505277B (zh) | 2024-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104731976B (zh) | 数据表中隐私数据的发现与分类方法 | |
CN107169355B (zh) | 一种蠕虫同源性分析方法和装置 | |
CN111045847A (zh) | 事件审计方法、装置、终端设备以及存储介质 | |
CN111104521B (zh) | 一种基于图分析的反欺诈检测方法及检测系统 | |
CN113360566A (zh) | 一种信息内容监测方法及系统 | |
CN114722199A (zh) | 基于通话录音的风险识别方法、装置、计算机设备及介质 | |
CN114172744A (zh) | 一种用于多个服务器间的数据传输系统及数据传输方法 | |
CN112039874B (zh) | 一种恶意邮件的识别方法及装置 | |
CN113240297A (zh) | 一种钓鱼邮件检测方法及系统 | |
CN110929085B (zh) | 基于元语义分解的电力客服留言生成模型样本处理系统及方法 | |
CN114676231A (zh) | 一种目标信息检测方法、设备和介质 | |
CN113505277A (zh) | 基于安卓平台的垃圾短信检测装置 | |
CN109510904B (zh) | 呼叫中心外呼录音的检测方法及系统 | |
CN110807702A (zh) | 贷后信息的管理方法、装置、设备及存储介质 | |
CN112003884A (zh) | 一种网络资产的采集和自然语言检索方法 | |
CN113115107B (zh) | 一种基于5g网络的手持视频采集终端系统 | |
CN111291376B (zh) | 一种基于众包和机器学习的web漏洞验证方法 | |
CN110489568B (zh) | 生成事件图的方法、装置、存储介质和电子设备 | |
CN112380323A (zh) | 一种基于中文分词识别技术的垃圾信息剔除系统及方法 | |
CN112417007A (zh) | 一种数据分析方法、装置、电子设备及存储介质 | |
CN116701614B (zh) | 一种用于文本智能采集的敏感数据模型建立方法 | |
CN108848020B (zh) | 一种消息处理方法、装置以及相关设备 | |
CN117811835B (zh) | 一种基于人工智能的涉诈网址检测系统 | |
CN116881504B (zh) | 一种基于人工智能的图像信息数字化管理系统及方法 | |
CN112989838B (zh) | 文本联系实体提取方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |