CN105812554A - 一种智能管理手机短信的方法和系统 - Google Patents

一种智能管理手机短信的方法和系统 Download PDF

Info

Publication number
CN105812554A
CN105812554A CN201610118717.5A CN201610118717A CN105812554A CN 105812554 A CN105812554 A CN 105812554A CN 201610118717 A CN201610118717 A CN 201610118717A CN 105812554 A CN105812554 A CN 105812554A
Authority
CN
China
Prior art keywords
note
short message
text
classification
different
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610118717.5A
Other languages
English (en)
Inventor
苏航
曾宪祥
刘海亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Research Institute of Sun Yat Sen University
Original Assignee
Shenzhen Research Institute of Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Research Institute of Sun Yat Sen University filed Critical Shenzhen Research Institute of Sun Yat Sen University
Priority to CN201610118717.5A priority Critical patent/CN105812554A/zh
Publication of CN105812554A publication Critical patent/CN105812554A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. SMS or e-mail
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • H04M1/27453Directories allowing storage of additional subscriber data, e.g. metadata
    • H04M1/2746Sorting, e.g. according to history or frequency of use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72469User interfaces specially adapted for cordless or mobile telephones for operating the device by selecting functions from two or more displayed items, e.g. menus or icons
    • H04M1/72472User interfaces specially adapted for cordless or mobile telephones for operating the device by selecting functions from two or more displayed items, e.g. menus or icons wherein the items are sorted according to specific criteria, e.g. frequency of use

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Library & Information Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明针对短信息功能和类型迁移变化而提出的一种新的短信管理方法,可以根据现在短信息特征很好满足用户分类需求的分类目标,更好地处理好互联网短信的分类,同时对分类后的短信根据各类型短信功能而做出不同处理,实现智能化管理短信息,免除用户对短信管理的繁琐操作。如按不同策略清理删除不同类型的短信息,对验证性质的信息自动拷贝到系统粘贴板,减除用户的记忆负担和重复输入的繁琐操作。同时本发明实现一整套的短信智能管理系统,在尽可能地降低移动终端计算和存储压力,进行短信有效分类、智能删除、信息提取和云备份,大大改善现有短信息系统的体验。

Description

一种智能管理手机短信的方法和系统
技术领域
本发明涉及手机短信管理技术领域,特别是智能管理手机短信的方法和系统。
背景技术
在移动智能设备和互联网应用普及的大背景下,需要接收的信息无论是在数量上还是种类上都已经上升了一个数量级,比如手机号码作为注册账号需要短信验证,金融交易的安全性保证也需要手机短信的安全验证,快递信息的到达和签收成功都经常会以短信的形式通知,更有政务信息、灾讯信息等,当然越来越多的广告、骚扰、诈骗等垃圾短信等让用户倍感烦恼。这些互联网相关产生的短信息发生频繁,更具分类需求,同时由于其特征相比传统信息有很大区别不同,已有的一些分类方法已经不能很好地适应分类需要和达到满意的分类效果,需要新方法更好地进行分类并对信息做适当处理。
传统短信管理仅仅具备简单的短信分类功能,更多的方法关注于是否骚扰短信或者陌生短信的二元分类,而少量的分类方法试图解决个人对个人的社交短信分类,由于该类短信口语化严重、表达随意的特征,并不能达到很好的分类效果,而且也不存在具备概括性的典型类别集。
同时,现有的短信管理方法没有很好地利用分类后的结果。实际上,对于不同类型短信息有必要做进一步的处理,完成更为完善和智能的短信管理操作,极大改善用户体验。比如对没有存储价值或者一定时间后失去时效性不再具备储存价值的短信进行删除,对需要进行转移的关键信息自动复制,便于回溯对短信息进行云备份。
发明内容
在分析现有方法的不足的情况下,提供一种智能管理手机短信的方法和系统。
一种智能管理手机短信的方法的步骤如下:
通过已知类型短信进行分类器训练,获取对于不同类型短息的分类器A,B。
获取需要分类的短信以及相应的短信信息,判断短信的发送号码是否为手机号。
如果发现发送号码为手机号,判断该手机号是否为通讯录中的号码。
如果是将短信归类为C1,即人际关系上通信,一般为认识的双方,且手机中已经存有联系方式的发送方。
如果不是通讯录中的号码,对短信内容进行处理,获取短信文本的特征。
分类器A通过获取的短信文本的特征对短信归类为C2,C3或C7,其中C2为通知快递取件的信息,C3为其他发送方为手机号码,但是为陌生号码,而不是快递信息等服务性质的短信,C7为暂时不能判断类别的信息。
如果发现发送号码不是手机号,对短信内容进行处理,获取短信文本的特征。
分类器B通过获取的短信文本的特征对短信归类为C4,C5,C6或C7,其中C4为发送方一般为非正常手机号码,使用互联网服务过程中需要获取的验证码,C5为发送方一般为非正常手机号码,一般是为了反馈事情结果的,如在互联网中发生信息更改操作,银行账号发生交易等,C6为发送方一般为非正常手机号码,是企业推广营销活动的信息,查看优先级比较低。
对收到的短信进行备份并根据判断的短信类型获取对应的清理策略,对其进行清理操作。
一种智能管理手机短信的系统,包括:
短信分类单元,主要完成短信分类器的生成,短信文本特征的选取以及短信的分类。
短信备份单元,根据实际情况对接收到的短信进行相应的备份。
短信清理单元,通过判断的短信类型分别获取对应的清理策略完成相应的清理。
短信关键信息处理单元,在分类后得到标签的基础上,提取出其中的关键信息并提供给用户使用。
附图说明
图1为本发明一种智能管理手机短信的方法其中一个实施例的流程示意图。
图2为本发明一种智能管理手机短信的系统其中一个实施例的结构示意图。
图3为本发明一种智能管理手机短信的系统短信分类单元功能模块示意图。
具体实施方式
一种智能管理手机短信的方法和系统在实施前需要做的一个预备工作,就是首先确定短信目标分类集合,将个人对个人的信息和互联网信息细分为C1到C7七个大类。
C1为个人社交行为产生的信息,发送方为认识的双方,且通讯录中已经存有联系方式;
C2为通知快递取件的信息;
C3为发送方为手机号码,但为陌生号码,同时不是快递等服务性质的短信;
C4为验证码信息,发送方一般为非正常手机号码,使用互联网服务过程中需要获取的验证码;
C5为通知信息,发送方一般为非正常手机号码,是为了反馈事情结果而产生的一种单向通知行为,如在互联网中发生信息更改操作,银行账号发生交易等;
C6为广告信息,发送方一般为非正常手机号码,是企业推广营销活动的信息,查看优先级比较低;
C7为前面信息类别中暂时未能包含的信息,一般为骚扰短信、垃圾短信等。
如图1所示,一种智能管理手机短信的方法,包括如下步骤:
步骤S101通过神经网络算法获取分类器A、B。其中A、B两个分类器是使用不同的特征和样本进行训练获得的,将分别使用于传统个人对个人类型的手机短信分类和对互联网短信的分类。该两类分类器将用于后面步骤对短信的归类。
步骤S102获取短信的发送号码,判断该号码是否为手机号码,如155开头的十一位联系方式即为联通运营商的联系方式。
步骤S103当发送号码为手机号时执行,获取用户的通讯录并与其中给的用户号码进行匹配,进而判断该号码是否为通讯录中的用户。
步骤S104当S103判断结果为是时,判断该号码为通讯录中的号码后直接保存为C1类别,即人际关系上通信,一般为认识的双方,且手机中已经存有联系方式的发送方。
步骤S105在步骤S103判断结果为否时,获取该短信的文本内容,通过分词后计算相应的,排序后选取前N个词。
步骤S106通过判断步骤S105选取的N个词是否存在于分类器A的输入词中,存在的词作为分类器A的输入,从而确定该短信的类型为C2、C3或C7。
步骤S107在步骤S102判断结果为否时,获取该短信的文本内容,通过分词后计算相应的,排序后选取前N个词。
步骤S108通过判断步骤S107选取的N个词是否存在于分类器B的输入词中,存在的词作为分类器B的输入,从而确定该短信的类型为C4、C5、C6或C7。
步骤S109是对相应的短信进行清理,由于短信类别的不同设定相应的清理时机和备份方法可以对相应类型的短信进行备份和及时删除。备份是采用增量备份的方法,在服务器中及时更新相应短息类型的时间戳。
如图2所示,为一种智能管理手机短信的系统。该系统包括如下单元:
系统结构图中的单元100是短信分类单元,主要完成两种短信分类器的生成,将分类器用于对短信进行分类。其中一个分类器是根据个人对个人的传统短信息样本和其对应的特征进行训练得到,将用于该大类别的短信息分类。而还有一个分类器则是根据互联网短信样本和其对应的特征训练得到,将用于互联网短信的分类。
系统结构图中的单元200是短信备份单元,根据实际情况对接收到的短信进行相应的备份。在每次有信息的短消息到达的时候,在网络情况允许的条件下对短信息进行增量备份,如果网络不符合备份条件则备份行为将延迟发生。短信云备份单元将保证在人为或者是系统发生误删除的操作情况下仍然可以将短信息恢复。
系统结构图中的单元300是短信清理单元,短信清理模块将对不同类型的短信息采用不同的清理策略。
系统结构图中的单元400是短信关键信息处理单元,在分类后得到标签的基础上,提取出其中的关键信息并提供给用户使用。
如图3,其中短信分类单元100包含以下几个子模块:
训练模块101用于生成分类器A,B,对各类别的短信的内容进行分词,去除不必要的词,然后统计同类别短信的分词结果,根据特征选择模块得到的特征将文本转换为特征向量的表达方式,最后将两大类的文本特征向量分别代入训练得到各自的分类器。例如:互联网短信的特征为{准时,单号,联系电话,客服},则将样本中所有的互联网短信表示为该向量形式,具体分词结果为{您好,开心,单号,客服}关键字的文本表示为wi=(0,1,0,1)的向量形式,而该文本被标记为C2,则该样本输入形式为(wi,C2)。所有已经表示为该向量形式的数据作为训练输入就可以得到一个分类器,该分类器可以对未作标记的文本进行分类。
特征选择模块102用于获取可以表示该短信的文本特征词。对短信的内容进行分词,对短信的分词结果进行过滤,即剔除分词结果中一些常见的功能词,如“地”、“的”、“得”、“而且”等,同时去除其中的数字和英文符号串等词汇;对经过上述步骤的结果进行词频统计,统计在不同类别中每个词出现的频次MIF,可以计算得到各类别中的计算公式如下:
M I F - M I D F = M I F M I D F
其中MIDF为该词在其它类别中出现的频次
对计算后的相同类别中的词使用进行从小到大的排序,选取前N个词作为该类别短信的特征。
分类模块103将通过文本提取模块提取的短信文本特征作为分类器的输入进行判断该短信的类别。
短信清理单元300涉及到的清理策略具体如下:
类别为C1、C3的短信息将由人工设定定时清理时间,默认不清理;
快递信息、验证码信息将设置不同的有效时间,超过有效时间的该类信息将被直接删除;
广告信息将在查阅后删除,同时也设定有效时间,超过有效时间的该类信息即使没有被查阅也将被直接删除;
而骚扰信息将在接受云服务器备份后直接删除。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims (10)

1.一种智能管理手机短信的方法,其特征在于,包括如下步骤:
1)通过已知类型短信进行分类器训练,获取对于不同类型短息的分类器A,B。
2)获取需要分类的短信以及相应的短信信息,判断短信的发送号码是否为手机号。
3)如果发现发送号码为手机号,判断该手机号是否为通讯录中的号码
4)如果是将短信归类为C1,即人际关系上通信,一般为认识的双方,且手机中已经存有联系方式的发送方。
5)如果不是通讯录中的号码,对短信内容进行处理,获取短信文本的特征。
6)分类器A通过获取的短信文本的特征对短信归类为C2,C3或C7
7)如果发现发送号码不是手机号,对短信内容进行处理,获取短信文本的特征。
8)分类器B通过获取的短信文本的特征对短信归类为C4,C5,C6或C7
9)通过设定不同类别短信的清理时机清理相应的短信。
2.根据权利要求1所述的智能管理手机短信的方法,其特征在于,在获取短信文本特征时采用计算方式,计算公式如下:
其中MIF为词在自身类别中出现频次,而MIDF为该词在其它类别中出现的频次。
3.根据权利要求1所述的智能管理手机短信的方法,其特征在于,在分类时充分考虑传统短信和互联网短信的不同特征,对两大种类短信息进行不同的类型训练和使用不同的分类器,提高计算的并行性,还提高了对短信判断的准确性。
4.根据权利要求1所述的智能管理手机短信的方法,其特征在于,在确定短信分类时放弃传统的统计直接选取,采用神经网络通过短信的文本特征进一步去挖掘文本与不同短信之间的关系,减少了人为选择的不确定性。
5.根据权利要求1所述的智能管理手机短信的方法,其特征在于,对不同类别的短信设定不同清理时机,同时对新接收的短信进行增量备份。
6.一种智能管理手机短信的系统,其特征在于,包括:
1)短信分类单元,主要完成两种短信分类器的生成,将分类器用于对短信进行分类。其中一个分类器是根据个人对个人的传统短信息样本和其对应的特征进行训练得到,将用于该大类别的短信息分类。而还有一个分类器则是根据互联网短信样本和其对应的特征训练得到,将用于互联网短信的分类。
2)短信备份单元,根据实际情况对接收到的短信进行相应的备份。在每次有信息的短消息到达的时候,在网络情况允许的条件下对短信息进行增量备份,如果网络不符合备份条件则备份行为将延迟发生。短信云备份单元将保证在人为或者是系统发生误删除的操作情况下仍然可以将短信息恢复。
3)短信清理单元,短信清理模块将对不同类型的短信息采用不同的清理策略。
4)短信关键信息处理单元,在分类后得到标签的基础上,提取出其中的关键信息并提供给用户使用。
7.根据权利要求6所述的智能管理手机短信的系统,其特征在于,短信分类单元的训练模块采用文本提取模块的文本提取方法对样本短信进行文本特征提取,并计算每一个词对应值后选取指定数量的不同类别的特征词,统计每个分类器的特征词作为神经网络的输入。
8.根据权利要求6所述的智能管理手机短信的系统,其特征在于,针对不同的判断结果采用不同的分类器,然后分类器进行分类时采用分词模块的短信分词结果作为输入,得到短信类型。
9.根据权利要求6所述的智能管理手机短信的系统,其特征在于,短信清理模块根据不同类型短信设置不同的清理时机,及时而恰当地清理短信息。
10.根据权利要求6所述的智能管理手机短信的系统,其特征在于,在得到短信具体类比而后,系统会对一些类别短信的关键信息进行抽取并提供给用户使用。
CN201610118717.5A 2016-03-01 2016-03-01 一种智能管理手机短信的方法和系统 Pending CN105812554A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610118717.5A CN105812554A (zh) 2016-03-01 2016-03-01 一种智能管理手机短信的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610118717.5A CN105812554A (zh) 2016-03-01 2016-03-01 一种智能管理手机短信的方法和系统

Publications (1)

Publication Number Publication Date
CN105812554A true CN105812554A (zh) 2016-07-27

Family

ID=56466605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610118717.5A Pending CN105812554A (zh) 2016-03-01 2016-03-01 一种智能管理手机短信的方法和系统

Country Status (1)

Country Link
CN (1) CN105812554A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106332020A (zh) * 2016-08-19 2017-01-11 北京奇虎科技有限公司 短信合并方法、装置及终端设备
CN107171939A (zh) * 2017-05-26 2017-09-15 北京小米移动软件有限公司 短信分类方法及装置
CN107295179A (zh) * 2017-06-29 2017-10-24 青岛海信移动通信技术股份有限公司 一种短信息显示的方法和装置
CN107682537A (zh) * 2017-09-26 2018-02-09 维沃移动通信有限公司 一种信息管理方法、移动终端
CN107729434A (zh) * 2017-09-29 2018-02-23 努比亚技术有限公司 一种短信清理的方法、终端及计算机可读存储介质
WO2018120237A1 (zh) * 2016-12-30 2018-07-05 华为技术有限公司 一种短信验证码的处理方法、装置和终端
CN109388713A (zh) * 2018-10-15 2019-02-26 珠海格力电器股份有限公司 一种未读短信的智能处理方法及装置
WO2019076375A1 (zh) * 2017-10-20 2019-04-25 维沃移动通信有限公司 短信界面的显示方法、移动终端及可读存储介质
CN112533155A (zh) * 2019-08-30 2021-03-19 腾讯科技(深圳)有限公司 一种短信清理方法、装置、服务器及存储介质
CN114531290A (zh) * 2022-02-21 2022-05-24 维沃移动通信有限公司 登录信息管理方法、登录信息管理装置和电子设备
WO2022105858A1 (zh) * 2020-11-20 2022-05-27 深圳市万普拉斯科技有限公司 一种清理短信的方法、装置、移动终端及存储介质

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106332020A (zh) * 2016-08-19 2017-01-11 北京奇虎科技有限公司 短信合并方法、装置及终端设备
CN106332020B (zh) * 2016-08-19 2019-08-27 北京安云世纪科技有限公司 短信合并方法、装置及终端设备
CN109565463A (zh) * 2016-12-30 2019-04-02 华为技术有限公司 一种短信验证码的处理方法、装置和终端
WO2018120237A1 (zh) * 2016-12-30 2018-07-05 华为技术有限公司 一种短信验证码的处理方法、装置和终端
CN107171939A (zh) * 2017-05-26 2017-09-15 北京小米移动软件有限公司 短信分类方法及装置
CN107295179A (zh) * 2017-06-29 2017-10-24 青岛海信移动通信技术股份有限公司 一种短信息显示的方法和装置
CN107682537A (zh) * 2017-09-26 2018-02-09 维沃移动通信有限公司 一种信息管理方法、移动终端
CN107729434A (zh) * 2017-09-29 2018-02-23 努比亚技术有限公司 一种短信清理的方法、终端及计算机可读存储介质
WO2019076375A1 (zh) * 2017-10-20 2019-04-25 维沃移动通信有限公司 短信界面的显示方法、移动终端及可读存储介质
CN109388713A (zh) * 2018-10-15 2019-02-26 珠海格力电器股份有限公司 一种未读短信的智能处理方法及装置
CN112533155A (zh) * 2019-08-30 2021-03-19 腾讯科技(深圳)有限公司 一种短信清理方法、装置、服务器及存储介质
CN112533155B (zh) * 2019-08-30 2022-06-07 腾讯科技(深圳)有限公司 一种短信清理方法、装置、服务器及存储介质
WO2022105858A1 (zh) * 2020-11-20 2022-05-27 深圳市万普拉斯科技有限公司 一种清理短信的方法、装置、移动终端及存储介质
CN114531290A (zh) * 2022-02-21 2022-05-24 维沃移动通信有限公司 登录信息管理方法、登录信息管理装置和电子设备

Similar Documents

Publication Publication Date Title
CN105812554A (zh) 一种智能管理手机短信的方法和系统
CN102831248B (zh) 网络热点挖掘方法及装置
CN101784022A (zh) 短信过滤、分类方法及系统
CN101295381B (zh) 一种垃圾邮件检测方法
CN101197793B (zh) 一种垃圾信息检测方法和装置
CN103186845A (zh) 一种垃圾邮件过滤方法
CN106202126B (zh) 一种用于物流监控的数据分析方法和装置
CN103778226A (zh) 构建语言信息识别模型的方法及语言信息识别装置
CN105979101A (zh) 一种未读消息选择性推送的系统
CN104883671A (zh) 一种垃圾短信的判断方法及系统
CN105843851A (zh) 欺诈邮件分析与提取方法和装置
CN102761848A (zh) 一种确定短信拦截关键词的方法
CN105550253A (zh) 一种类型关系的获取方法及装置
CN105101124A (zh) 标注短信类别的方法及装置
CN103678373A (zh) 一种垃圾模板文章识别方法和设备
CN111221970B (zh) 基于行为结构和语义内容联合分析的邮件分类方法及装置
CN106231068B (zh) 一种未读消息分类显示的方法
JP2001331422A (ja) メール評価装置
CN107766737B (zh) 一种数据库审计方法
CN101719924A (zh) 基于群件理解的不良彩信过滤方法
CN110972086A (zh) 短信息处理方法、装置、电子设备及计算机可读存储介质
CN101329668A (zh) 一种信息规则生成方法及装置、信息类型判断方法及系统
CN104766221A (zh) 流量精细化营销参数的选取方法
CN106296249A (zh) 一种基于lbs与兴趣的用户分类方法及系统
CN107506407A (zh) 一种文件分类、调用的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160727