CN106899947A - 短消息清理方法和装置 - Google Patents

短消息清理方法和装置 Download PDF

Info

Publication number
CN106899947A
CN106899947A CN201510965368.6A CN201510965368A CN106899947A CN 106899947 A CN106899947 A CN 106899947A CN 201510965368 A CN201510965368 A CN 201510965368A CN 106899947 A CN106899947 A CN 106899947A
Authority
CN
China
Prior art keywords
short message
keyword
ignored
message
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510965368.6A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510965368.6A priority Critical patent/CN106899947A/zh
Publication of CN106899947A publication Critical patent/CN106899947A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • H04W4/14Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明是关于一种短消息清理方法和装置,其中方法通过监控目标程序,根据目标程序获取已忽略短消息;对已忽略短消息的内容进行解析,从解析后的已忽略短消息的内容中提取出关键词;统计关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词;根据目标关键词,将包含有目标关键词的短消息确定为待清理短消息。从而实现了针对用户个性化的删除需求,即通过分析常常被用户忽略(包括删除)的短消息,预估用户期望删除的短消息,该方法有效提高了短消息的清理效率。

Description

短消息清理方法和装置
技术领域
本发明涉及通信技术领域,尤其涉及一种短消息清理方法和装置。
背景技术
随着通信技术的飞速发展,终端用户的社交范围日益增大,终端中存储的短消息的数量也随之增多,不但造成对终端有限存储空间的占用,还增加了用户从历史短消息中查找所需信息的时间。
现有短消息的清理方法主要是根据短消息接收到的时间顺序,顺序或倒序将短消息逐条呈现给用户,用户对短消息逐条浏览后,手动点击删除标识,完成短消息的清除,这种方式费时费力,且效率不高。
发明内容
为了解决现有技术中,短消息清理效率低的问题,本发明提供一种短消息清理方法和装置,通过对已被用户忽略(包括删除)的短消息进行分析,从已被忽略的短消息中提取关键词,并根据关键词预估用户预删除的短消息,以实现针对用户个性化的删除需求,确定待删除短消息,该方法有效提高了短消息的清理效率。
本发明提供一种短消息清理方法和装置,所述技术方案如下:
根据本发明实施例的第一方面,提供一种短消息清理方法,包括:
监控目标程序,根据所述目标程序获取已忽略短消息;
对所述已忽略短消息的内容进行解析,从解析后的所述已忽略短消息的内容中提取出关键词;
统计所述关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词;
根据所述目标关键词,将包含有所述目标关键词的短消息确定为待清理短消息。
可选的,所述对所述已忽略短消息的内容进行解析,从解析后的所述已忽略短消息的内容中提取出关键词包括:
对所述已忽略短消息的内容进行分词处理,得到词语片断;
在所述词语片断中确定低相关度词语片断,去除所述低相关度词语片断,获得关键词;所述低相关度词语片断包括以下至少一种:连接词语、单字词语、称谓词语、金额数字。
可选的,所述对所述已忽略短消息的内容进行分词处理包括:
基于自然语言处理NLP技术,对所述已忽略短消息的内容进行分词处理。
可选的,所述根据所述目标程序获取已忽略短消息之后,还包括:
获取所述已忽略短消息的消息标识;
相应的,所述对所述已忽略短消息的内容进行解析,从解析后的所述已忽略短消息的内容中提取出关键词之后,还包括:
建立所述消息标识与所述关键词的对应关系数据包,以使每个所述对应关系数据包内包含与所述消息标识对应的关键词;
相应的,所述统计所述关键词重复出现的次数包括:
对每个所述对应关系数据包内的关键词的重复出现次数进行统计;
相应的,所述根据所述目标关键词,将包含有所述目标关键词的短消息确定为待清理短消息包括:
根据所述目标关键词,将包含有所述目标关键词的、与所述消息标识对应的短消息确定为待清理短消息。
可选的,所述将包含有所述目标关键词的短消息确定为待清理短消息之后,还包括:
根据预设清理周期,显示所述待清理短消息;
接收用户输入的选择指令,以对被选择的所述待清理短消息进行删除操作。
可选的,所述目标程序包括以下一项或多项:短消息接收箱、通知栏应用程序、第三方短消息拦截应用。
可选的,在所述目标程序为所述短消息接收箱的情况下,所述监控目标程序,根据所述目标程序获取已忽略短消息包括:监控所述短消息接收箱的删除短消息函数接口,当所述删除短消息函数接口被调用时,从所述删除短消息函数接口处获取被删除的短消息;
在所述目标程序为所述通知栏应用程序的情况下,所述监控目标程序,根据所述目标程序获取已忽略短消息包括:监控所述通知栏应用程序的清除通知消息函数接口,当所述清除通知消息函数接口被调用时,获取被清除的通知消息列表;判断所述被清除的通知消息列表中是否包含文本短消息,若包含,获取所述文本短消息;
在所述目标程序为所述第三方短消息拦截应用的情况下,所述监控目标程序,根据所述目标程序获取已忽略短消息包括:监控所述第三方短消息拦截应用的短消息拦截函数接口,当所述短消息拦截函数接口被调用时,从所述短消息拦截函数接口处获取被拦截的短消息。
可选的,所述接收用户输入的选择指令,以对被选择的所述待清理短消息进行删除操作之后,还包括:
对被选择的所述待清理短消息所对应的目标关键词增加权重值;当所述目标关键词的权重值达到预设正权重值阈值时,对包含有所述达到预设正权重值阈值的目标关键词的短消息直接删除。
可选的,所述接收用户输入的选择指令,以对被选择的所述待清理短消息进行删除操作之后,还包括:
对未被选择的所述待清理短消息所对应的目标关键词减少权重值;当所述目标关键词的权重值达到预设负权重值阈值,将所述达到预设负权重值阈值的目标关键词的重复出现的次数清零。
根据本发明实施例的第二方面,提供一种短消息清理装置,包括:
获取模块,用于监控目标程序,根据所述目标程序获取已忽略短消息;
解析模块,用于对所述已忽略短消息的内容进行解析,从解析后的所述已忽略短消息的内容中提取出关键词;
统计模块,用于统计所述关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词;
过滤模块,用于根据所述目标关键词,将包含有所述目标关键词的短消息确定为待清理短消息。
可选的,所述解析模块包括:
分词子模块,用于对所述已忽略短消息的内容进行分词处理,得到词语片断;
过滤子模块,用于在所述词语片断中确定低相关度词语片断,去除所述低相关度词语片断,获得关键词;所述低相关度词语片断包括以下至少一种:连接词语、单字词语、称谓词语、金额数字。
可选的,所述分词子模块,具体用于基于自然语言处理NLP技术,对所述已忽略短消息的内容进行分词处理。
可选的,所述获取模块,还用于获取所述已忽略短消息的消息标识;
相应的,所述装置还包括:
建立模块,用于建立所述消息标识与所述关键词的对应关系数据包,以使每个所述对应关系数据包内包含与所述消息标识对应的关键词;
相应的,所述统计模块,具体用于对每个所述对应关系数据包内的关键词的重复出现次数进行统计;
相应的,所述过滤模块,具体用于根据所述目标关键词,将包含有所述目标关键词的、与所述消息标识对应的短消息确定为待清理短消息。
可选的,所述装置还包括:
显示模块,用于根据预设清理周期,显示所述待清理短消息;
接收模块,用于接收用户输入的选择指令,以对被选择的所述待清理短消息进行删除操作。
可选的,所述目标程序包括以下一项或多项:短消息接收箱、通知栏应用程序、第三方短消息拦截应用。
可选的,在所述目标程序为所述短消息接收箱的情况下,所述获取模块包括:
第一监控子模块,用于监控所述短消息接收箱的删除短消息函数接口;
第一获取子模块,用于当所述删除短消息函数接口被调用时,从所述删除短消息函数接口处获取被删除的短消息;
在所述目标程序为所述通知栏应用程序的情况下,所述获取模块包括:
第二监控子模块,用于监控所述通知栏应用程序的清除通知消息函数接口;
第二获取子模块,用于当所述清除通知消息函数接口被调用时,获取被清除的通知消息列表;
判断子模块,用于判断所述被清除的通知消息列表中是否包含文本短消息;
所述第二获取子模块,还用于当所述判断子模块判断所述被清除的通知消息列表中包含文本短消息时,获取所述文本短消息;
在所述目标程序为所述第三方短消息拦截应用的情况下,所述获取模块包括:
第三监控子模块,用于监控所述第三方短消息拦截应用的短消息拦截函数接口;
第三获取子模块,用于当所述短消息拦截函数接口被调用时,从所述短消息拦截函数接口处获取被拦截的短消息。
可选的,所述装置还包括:
权重值增加模块,用于对被选择的所述待清理短消息所对应的目标关键词增加权重值;
删除模块,用于当所述目标关键词的权重值达到预设正权重值阈值时,对包含有所述达到预设正权重值阈值的目标关键词的短消息直接删除。
可选的,所述装置还包括:
权重值减少模块,用于对未被选择的所述待清理短消息所对应的目标关键词减少权重值;
清零模块,用于当所述目标关键词的权重值达到预设负权重值阈值,将所述达到预设负权重值阈值的目标关键词的重复出现的次数清零。
本发明的实施例提供的方法及装置可以包括以下有益效果:通过监控目标程序,根据目标程序获取已忽略短消息;对已忽略短消息的内容进行解析,从解析后的已忽略短消息的内容中提取出关键词;统计关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词;根据目标关键词,将包含有目标关键词的短消息确定为待清理短消息。从而实现了针对用户个性化的删除需求,即通过分析常常被用户忽略(包括删除)的短消息,预估用户期望删除的短消息,该方法有效提高了短消息的清理效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种短消息清理方法的流程图;
图2是根据另一示例性实施例示出的一种短消息清理方法的流程图;
图3是图2所示实施例的一种短消息清理方法的界面图;
图4是根据一示例性实施例示出的一种短消息清理装置的流程图;
图5是根据另一示例性实施例示出的一种短消息清理装置的流程图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种短消息清理方法的流程图,如图1所示,本实施例的短消息清理方法可以应用于提供短消息清理的云端服务器中也可以应用于用户的终端(客户端)设备中,以下以应用于用户的终端(客户端)设备中来举例说明,本实施例的方法包括以下步骤:
在步骤101中,监控目标程序,根据目标程序获取已忽略短消息。
具体的,终端设备可以为手机、平板电脑等电子设备,目标程序可以为操作系统默认的系统应用程序或终端装载的第三方应用程序,目标程序为与短消息的接收、存储或处理具有关联关系的应用程序,通过该目标程序可以直接或间接对短消息进行访问。其中,已忽略短消息可以包括:用户浏览短消息简要后或获知短消息发送方名称后没有打开查看短消息具体内容的、用户关注度不高的短消息;还可以包括:用户触发删除操作删除的短消息;还可以包括:通过大数据统计得到的与恶意特征库匹配的短消息,或用户输入的黑名单短消息等。以上各类短消息都可以被认为是已忽略短消息。
在步骤102中,对已忽略短消息的内容进行解析,从解析后的已忽略短消息的内容中提取出关键词。
具体的,通过对已忽略短消息的内容进行分析,得到能够表征已忽略短消息特征的词语,该特征词语可以通过对短消息内容进行拆分并筛选后得到,即提取出的关键词。
在步骤103中,统计关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词。
具体的,若用户对某类短消息删除的概率较高,则获取到与该类短消息相关联的关键词的数量也会相应增多,通过对同一关键词重复出现的频度进行统计,可以得到具有代表性的关键词,该达到预设次数阈值的具有代表性的关键词可以被作为目标关键词,以根据该目标关键词对终端接收到的历史短消息进行筛选。
在步骤104中,根据目标关键词,将包含有目标关键词的短消息确定为待清理短消息。
具体的,可以根据预设的清理周期,对终端内所有短消息进行扫描,若短消息的内容中包含有该目标关键词,则将该短消息确定为待清理短消息,直接进行删除或待用户确认后删除。
本实施例中,通过监控目标程序,根据目标程序获取已忽略短消息;对已忽略短消息的内容进行解析,从解析后的已忽略短消息的内容中提取出关键词;统计关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词;根据目标关键词,将包含有目标关键词的短消息确定为待清理短消息。从而实现了针对用户个性化的删除需求,即通过分析常常被用户忽略(包括删除)的短消息,预估用户期望删除的短消息,该方法有效提高了短消息的清理效率。
图2是根据另一示例性实施例示出的一种短消息清理方法的流程图,如图2所示,本实施例的短消息清理方法可以应用于提供短消息清理的云端服务器中也可以应用于用户的终端(客户端)设备中,以下以应用于用户的终端(客户端)设备中来举例说明,在上述实施例的基础上,本实施例的方法包括以下步骤:
在步骤201中,监控目标程序,根据目标程序获取已忽略短消息。
具体的,目标程序可以包括以下一项或多项:短消息接收箱、通知栏应用程序、第三方短消息拦截应用。短消息接收箱为终端设备的操作系统自带的具备短消息接收功能的应用程序,终端设备所接收到的文本信息或彩信等信息都存储在该短消息接收箱内。通知栏应用程序也是操作系统自带的对推送消息进行显示的应用程序,其显示形式有弹窗或下拉菜单等形式,若推送消息中包含终端接收到的短消息,该短消息除了会存储在上面提到的短消息接收箱内,同时还可以在通知栏中进行快速浏览,但是介于通知栏显示空间的限制,通常短消息的完整内容不能被显示完整,若用户对推送的短消息内容感兴趣,其可以通过在通知栏中点中该条短消息进入短消息接收箱进行完整内容的查看;当然如果用户对通知栏中的推送内容不感兴趣,也可以点击通知栏应用程序中的清除按钮,将当前所有推送消息清除,也就是说被清除的短消息暗示了其可能是用户不感兴趣的,被忽略的短消息。第三方短消息拦截应用如360安全卫士等其具有拦截垃圾短消息,或根据用户输入的黑名单进行短消息拦截的功能,这些被拦截的短消息也属于用户忽略、不关注的短消息。
根据上述描述的三种目标程序,步骤201、监控目标程序,根据目标程序获取已忽略短消息,具体可以包括以下三种实施方式:
方式一、在目标程序为短消息接收箱的情况下,监控短消息接收箱的删除短消息函数接口,当删除短消息函数接口被调用时,从删除短消息函数接口处获取被删除的短消息。
方式二、在目标程序为通知栏应用程序的情况下,监控通知栏应用程序的清除通知消息函数接口,当清除通知消息函数接口被调用时,获取被清除的通知消息列表;判断被清除的通知消息列表中是否包含文本短消息,若包含,获取文本短消息。
方式三、在目标程序为第三方短消息拦截应用的情况下,监控第三方短消息拦截应用的短消息拦截函数接口,当短消息拦截函数接口被调用时,从短消息拦截函数接口处获取被拦截的短消息。
在步骤202中,对已忽略短消息的内容进行解析,从解析后的已忽略短消息的内容中提取出关键词。
该步骤的实现具体可以通过对已忽略短消息的内容进行分词处理,得到词语片断;在词语片断中确定低相关度词语片断,去除低相关度词语片断,获得关键词;低相关度词语片断包括以下至少一种:连接词语、单字词语、称谓词语、金额数字。
其中,分词处理的算法可以基于自然语言处理NLP(Natural LanguageProcessing,简称“NLP”)技术,对已忽略短消息的内容进行分词处理。
在步骤203中,统计关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词。
具体的,该步骤的实现可以仅根据对每条被删除、忽略的短消息进行关键词统计,也可以针对不同短消息发送方单独进行关键词重复出现次数的统计。例如,对于发送方A:大众点评网,发送方B:美团网,发送的短消息,假设A与B均推送团购促销短消息,某一相同关键词在A和B两个发送方的短信中出现的概率可能是相当的,但是假设用户对大众点评网的信任度较高,通常会点击查看具体短消息内容,然而对美团网的短消息不太关注,通常会忽略或删除,则同一个关键词对不同的发送方A、B而言其权重值不同(即在美团网短信中被统计的次数大于在大众点评网短信中被统计的次数)。例如“折扣”一词在美团网被忽略的短消息中出现了10次,在大众点评网被忽略的短消息中出现2次,则可以根据不同的发送方标识分别对其对应的关键词重复出现的频度进行统计,以更加精准地定位用户预删除的短消息。
上述过程的具体实现可以通过在步骤201、监控目标程序,根据目标程序获取已忽略短消息之后,进行以下操作:获取已忽略短消息的消息标识;建立消息标识与关键词的对应关系数据包,以使每个对应关系数据包内包含与消息标识对应的关键词。相应的,步骤203、统计关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词具体包括:对每个对应关系数据包内的关键词的重复出现次数进行统计,将达到预设次数阈值的关键词作为目标关键词。其中,消息标识可以为短消息的发送号码,还可以为根据标识符识别得到的发送方名称。例如:很多短消息是通过网关设备发出,其网关设备号码为固定或随机配置的网络号码,则可以根据如“[]”或“【】”或双引号、单引号、书名号等标识符,识别该标识符内的发送方名称,如[淘宝网]、[滴滴打车]等。
在步骤204中,根据目标关键词,将包含有目标关键词的短消息确定为待清理短消息。
具体的,该步骤的实现既可以根据目标关键词对所有历史短消息进行筛选,也可以根据目标关键词,将包含有目标关键词的、与消息标识对应的短消息确定为待清理短消息,即根据消息标识所对应的目标关键词,对消息标识对应的历史短消息进行筛选。
在步骤205中,根据预设清理周期,显示待清理短消息。
在步骤206中,接收用户输入的选择指令,以对被选择的待清理短消息进行删除操作。
具体的,根据用户对待清理短消息的勾选,彻底从终端中删除被选择的待清理短消息,通过用户选择并确认,确保待清理短消息不会被误删或错删;同时,还可以根据用户对待清理短消息的选择,对待清理短消息的判定规则(即目标关键词的确定)进行更正、更新。
该更正、更新方法可以包括:对被选择的待清理短消息所对应的目标关键词增加权重值;当目标关键词的权重值达到预设正权重值阈值时,对包含有达到预设正权重值阈值的目标关键词的短消息直接删除。
该更正、更新的方法还可以包括:对未被选择的待清理短消息所对应的目标关键词减少权重值;当目标关键词的权重值达到预设负权重值阈值,将达到预设负权重值阈值的目标关键词的重复出现的次数清零。
上述两种更正、更新方法,通过根据用户的确认,进一步确定哪些目标关键词是正确的,哪些是错误的;同时,由于用户在不同时期其关注点可能发生变化,通过该过程可以及时调整各个目标关键词的权重值,以为用户准确筛选出符合其个性习惯的待清理短消息。
下面举例说明该短消息清理方法的具体实施过程:请参照图3,在界面中,显示有短消息接收箱内的8条短信的信息,若用户选择将这8条短信删除,则通过监控该短消息接收箱的删除操作拦截到该8条短信,提取短消息的消息标识,提取出的消息标识依次为:大麦网、10001、95559、95555、天猫、网银在线、大麦网、国家知识产权局;其中,大麦网、天猫、网银在线、国家知识产权局的提取是根据标识符“[]”和“【】”进行识别并提取的,其它是根据固定的发送方号码10001、95559、95555进行识别并提取的。接下来分析短信内容,从中提取关键词,例如,在消息标识为10001中国电信发送的短信中可能会重复出现的关键词如:“语音”、“流量”、“套餐详情”等;主题为95559交通银行的短信中可能会重复出现的关键词如:“余额”、“转入金额”、“个人网银”等;通常来说若发送方性质为公司,其通常会依据短信模板发送具有一定规律性的短信,则短信中重复出现相同词语片断的几率会比较高,通过对短信中的关键词进行统计分析,可以将同一发送方发送的相近内容的短信筛选出来。从而方便用户对具有一定规律性的短信进行删除。同理,对于发送方的类别为个人用户,其所发送的各条短信的内容若是针对同一话题展开,则其中也会包含对应该话题的、重复出现率较高的关键词,本发明同样可以对个人号码发送的短信进行筛选。若在10001中国电信发送的短信中,关键词“语音”、“流量”、“套餐详情”等重复出现的次数达到预设次数阈值,则将上述各个关键词确定为目标关键词,并对发送方为10001的所有短消息进行过滤,将包含有上述目标关键词的10001发送的短消息确定为待清理短消息,找到待清理短消息的存储地址,将这些待清理短消息进行标记或者移动到待清理短消息列表中等待用户确认删除。
下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。
图4是根据一示例性实施例示出的一种短消息清理装置的流程图,如图4所示,该短消息清理装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。该短消息清理装置可以包括:
获取模块41,用于监控目标程序,根据目标程序获取已忽略短消息。
解析模块42,用于对已忽略短消息的内容进行解析,从解析后的已忽略短消息的内容中提取出关键词。
统计模块43,用于统计关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词。
过滤模块44,用于根据目标关键词,将包含有目标关键词的短消息确定为待清理短消息。
本实施例中,通过监控目标程序,根据目标程序获取已忽略短消息;对已忽略短消息的内容进行解析,从解析后的已忽略短消息的内容中提取出关键词;统计关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词;根据目标关键词,将包含有目标关键词的短消息确定为待清理短消息。从而实现了针对用户个性化的删除需求,即通过分析常常被用户忽略(包括删除)的短消息,预估用户期望删除的短消息,该方法有效提高了短消息的清理效率。
图5是根据另一示例性实施例示出的一种短消息清理装置的流程图,该短消息清理装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。基于上述装置实施例,解析模块42包括:
分词子模块421,用于对已忽略短消息的内容进行分词处理,得到词语片断。
过滤子模块422,用于在词语片断中确定低相关度词语片断,去除低相关度词语片断,获得关键词;低相关度词语片断包括以下至少一种:连接词语、单字词语、称谓词语、金额数字。
可选的,分词子模块421,具体用于基于自然语言处理NLP技术,对已忽略短消息的内容进行分词处理。
可选的,获取模块41,还用于获取已忽略短消息的消息标识。
相应的,该装置还包括:
建立模块45,用于建立消息标识与关键词的对应关系数据包,以使每个对应关系数据包内包含与消息标识对应的关键词。
相应的,统计模块43,具体用于对每个对应关系数据包内的关键词的重复出现次数进行统计。
过滤模块44,具体用于根据目标关键词,将包含有目标关键词的、与消息标识对应的短消息确定为待清理短消息。
可选的,该装置还包括:
显示模块46,用于根据预设清理周期,显示待清理短消息。
接收模块47,用于接收用户输入的选择指令,以对被选择的待清理短消息进行删除操作。
可选的,目标程序包括以下一项或多项:短消息接收箱、通知栏应用程序、第三方短消息拦截应用。
可选的,在目标程序为短消息接收箱的情况下,获取模块41包括:
第一监控子模块411,用于监控短消息接收箱的删除短消息函数接口。
第一获取子模块412,用于当删除短消息函数接口被调用时,从删除短消息函数接口处获取被删除的短消息。
在目标程序为通知栏应用程序的情况下,获取模块41包括:
第二监控子模块413,用于监控通知栏应用程序的清除通知消息函数接口。
第二获取子模块414,用于当清除通知消息函数接口被调用时,获取被清除的通知消息列表。
判断子模块415,用于判断被清除的通知消息列表中是否包含文本短消息。
第二获取子模块414,还用于当判断子模块判断被清除的通知消息列表中包含文本短消息时,获取文本短消息。
在目标程序为第三方短消息拦截应用的情况下,获取模块41包括:
第三监控子模块416,用于监控第三方短消息拦截应用的短消息拦截函数接口。
第三获取子模块417,用于当短消息拦截函数接口被调用时,从短消息拦截函数接口处获取被拦截的短消息。
可选的,该装置还包括:
权重值增加模块48,用于对被选择的待清理短消息所对应的目标关键词增加权重值。
删除模块49,用于当目标关键词的权重值达到预设正权重值阈值时,对包含有达到预设正权重值阈值的目标关键词的短消息直接删除。
可选的,该装置还包括:
权重值减少模块50,用于对未被选择的待清理短消息所对应的目标关键词减少权重值。
清零模块51,用于当目标关键词的权重值达到预设负权重值阈值,将达到预设负权重值阈值的目标关键词的重复出现的次数清零。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本领域技术人员在考虑说明书及实践这里发明的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种短消息清理方法,其特征在于,所述方法包括:
监控目标程序,根据所述目标程序获取已忽略短消息;
对所述已忽略短消息的内容进行解析,从解析后的所述已忽略短消息的内容中提取出关键词;
统计所述关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词;
根据所述目标关键词,将包含有所述目标关键词的短消息确定为待清理短消息。
2.根据权利要求1所述的方法,其特征在于,所述对所述已忽略短消息的内容进行解析,从解析后的所述已忽略短消息的内容中提取出关键词包括:
对所述已忽略短消息的内容进行分词处理,得到词语片断;
在所述词语片断中确定低相关度词语片断,去除所述低相关度词语片断,获得关键词;所述低相关度词语片断包括以下至少一种:连接词语、单字词语、称谓词语、金额数字。
3.根据权利要求2所述的方法,其特征在于,所述对所述已忽略短消息的内容进行分词处理包括:
基于自然语言处理NLP技术,对所述已忽略短消息的内容进行分词处理。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标程序获取已忽略短消息之后,还包括:
获取所述已忽略短消息的消息标识;
相应的,所述对所述已忽略短消息的内容进行解析,从解析后的所述已忽略短消息的内容中提取出关键词之后,还包括:
建立所述消息标识与所述关键词的对应关系数据包,以使每个所述对应关系数据包内包含与所述消息标识对应的关键词;
相应的,所述统计所述关键词重复出现的次数包括:
对每个所述对应关系数据包内的关键词的重复出现次数进行统计;
相应的,所述根据所述目标关键词,将包含有所述目标关键词的短消息确定为待清理短消息包括:
根据所述目标关键词,将包含有所述目标关键词的、与所述消息标识对应的短消息确定为待清理短消息。
5.根据权利要求1所述的方法,其特征在于,所述将包含有所述目标关键词的短消息确定为待清理短消息之后,还包括:
根据预设清理周期,显示所述待清理短消息;
接收用户输入的选择指令,以对被选择的所述待清理短消息进行删除操作。
6.一种短消息清理装置,其特征在于,所述装置包括:
获取模块,用于监控目标程序,根据所述目标程序获取已忽略短消息;
解析模块,用于对所述已忽略短消息的内容进行解析,从解析后的所述已忽略短消息的内容中提取出关键词;
统计模块,用于统计所述关键词重复出现的次数,将达到预设次数阈值的关键词作为目标关键词;
过滤模块,用于根据所述目标关键词,将包含有所述目标关键词的短消息确定为待清理短消息。
7.根据权利要求6所述的装置,其特征在于,所述解析模块包括:
分词子模块,用于对所述已忽略短消息的内容进行分词处理,得到词语片断;
过滤子模块,用于在所述词语片断中确定低相关度词语片断,去除所述低相关度词语片断,获得关键词;所述低相关度词语片断包括以下至少一种:连接词语、单字词语、称谓词语、金额数字。
8.根据权利要求7所述的装置,其特征在于,
所述分词子模块,具体用于基于自然语言处理NLP技术,对所述已忽略短消息的内容进行分词处理。
9.根据权利要求6所述的装置,其特征在于,
所述获取模块,还用于获取所述已忽略短消息的消息标识;
相应的,所述装置还包括:
建立模块,用于建立所述消息标识与所述关键词的对应关系数据包,以使每个所述对应关系数据包内包含与所述消息标识对应的关键词;
相应的,所述统计模块,具体用于对每个所述对应关系数据包内的关键词的重复出现次数进行统计;
相应的,所述过滤模块,具体用于根据所述目标关键词,将包含有所述目标关键词的、与所述消息标识对应的短消息确定为待清理短消息。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
显示模块,用于根据预设清理周期,显示所述待清理短消息;
接收模块,用于接收用户输入的选择指令,以对被选择的所述待清理短消息进行删除操作。
CN201510965368.6A 2015-12-21 2015-12-21 短消息清理方法和装置 Pending CN106899947A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510965368.6A CN106899947A (zh) 2015-12-21 2015-12-21 短消息清理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510965368.6A CN106899947A (zh) 2015-12-21 2015-12-21 短消息清理方法和装置

Publications (1)

Publication Number Publication Date
CN106899947A true CN106899947A (zh) 2017-06-27

Family

ID=59190661

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510965368.6A Pending CN106899947A (zh) 2015-12-21 2015-12-21 短消息清理方法和装置

Country Status (1)

Country Link
CN (1) CN106899947A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107329945A (zh) * 2017-07-21 2017-11-07 北京奇虎科技有限公司 短消息的展示处理方法、展示处理装置以及移动终端
CN110086935A (zh) * 2019-04-26 2019-08-02 维沃移动通信有限公司 消息处理方法和移动终端
CN110110195A (zh) * 2019-05-07 2019-08-09 宜人恒业科技发展(北京)有限公司 一种杂质清除方法及装置
CN117290315A (zh) * 2023-10-11 2023-12-26 河南师范大学 一种数据分类清理方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060019684A1 (en) * 2004-07-22 2006-01-26 Xiao-Qin Yu Short message filter mechanism and communication device
CN101938565A (zh) * 2010-09-10 2011-01-05 中兴通讯股份有限公司 短信处理方法及移动终端
CN102761848A (zh) * 2012-08-01 2012-10-31 成都四方信息技术有限公司 一种确定短信拦截关键词的方法
CN103813279A (zh) * 2012-11-14 2014-05-21 中国移动通信集团设计院有限公司 一种垃圾短信检测方法及装置
CN104794125A (zh) * 2014-01-20 2015-07-22 中国科学院深圳先进技术研究院 一种垃圾短信的识别方法及装置
CN105101182A (zh) * 2014-04-18 2015-11-25 可牛网络技术(北京)有限公司 一种短信的处理方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060019684A1 (en) * 2004-07-22 2006-01-26 Xiao-Qin Yu Short message filter mechanism and communication device
CN101938565A (zh) * 2010-09-10 2011-01-05 中兴通讯股份有限公司 短信处理方法及移动终端
CN102761848A (zh) * 2012-08-01 2012-10-31 成都四方信息技术有限公司 一种确定短信拦截关键词的方法
CN103813279A (zh) * 2012-11-14 2014-05-21 中国移动通信集团设计院有限公司 一种垃圾短信检测方法及装置
CN104794125A (zh) * 2014-01-20 2015-07-22 中国科学院深圳先进技术研究院 一种垃圾短信的识别方法及装置
CN105101182A (zh) * 2014-04-18 2015-11-25 可牛网络技术(北京)有限公司 一种短信的处理方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107329945A (zh) * 2017-07-21 2017-11-07 北京奇虎科技有限公司 短消息的展示处理方法、展示处理装置以及移动终端
CN110086935A (zh) * 2019-04-26 2019-08-02 维沃移动通信有限公司 消息处理方法和移动终端
CN110110195A (zh) * 2019-05-07 2019-08-09 宜人恒业科技发展(北京)有限公司 一种杂质清除方法及装置
CN110110195B (zh) * 2019-05-07 2022-05-17 宜人恒业科技发展(北京)有限公司 一种杂质清除方法及装置
CN117290315A (zh) * 2023-10-11 2023-12-26 河南师范大学 一种数据分类清理方法

Similar Documents

Publication Publication Date Title
CN107566358B (zh) 一种风险预警提示方法、装置、介质及设备
Gupta et al. A framework for real-time spam detection in Twitter
CN106503584B (zh) 一种会话内容展示方法及系统
CN104883671B (zh) 一种垃圾短信的判断方法及系统
CN104462509A (zh) 垃圾评论检测方法及装置
US20100145900A1 (en) Spam filtering based on statistics and token frequency modeling
Hidalgo et al. On the validity of a new SMS spam collection
CN104640092B (zh) 识别垃圾短信的方法、客户端、云端服务器和系统
CN104753760A (zh) 即时通讯群消息的控制方法和控制装置
KR100628623B1 (ko) 실시간 스팸 메일 인식 및 차단이 가능한 스팸 메일 차단시스템 및 방법
CN106899947A (zh) 短消息清理方法和装置
CN103516908B (zh) 辅助回复通讯消息的方法及装置
CN104253741A (zh) 一种信息发送方法、相关装置及系统
CN105335354A (zh) 欺诈信息识别方法和装置
CN111147489B (zh) 一种面向链接伪装的鱼叉攻击邮件发现方法及装置
CN105812554A (zh) 一种智能管理手机短信的方法和系统
CN103391547A (zh) 一种信息处理的方法和终端
CN106779803B (zh) 一种将金融机构流水与运营商数据匹配的方法
CN102315952A (zh) 一种用于社区网络中检测垃圾帖子的方法与设备
CN105979101A (zh) 一种未读消息选择性推送的系统
CN103793838A (zh) 拦截广告的方法及其装置
CN105101124A (zh) 标注短信类别的方法及装置
US20060036728A1 (en) Systems and methods for categorizing network traffic content
CN108734186B (zh) 自动退出即时通信会话群的方法、装置和系统
WO2016037489A1 (zh) Rcs垃圾消息的监控方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170627