CN115942322B - 一种骚扰短信拦截方法及系统 - Google Patents

一种骚扰短信拦截方法及系统 Download PDF

Info

Publication number
CN115942322B
CN115942322B CN202310113140.9A CN202310113140A CN115942322B CN 115942322 B CN115942322 B CN 115942322B CN 202310113140 A CN202310113140 A CN 202310113140A CN 115942322 B CN115942322 B CN 115942322B
Authority
CN
China
Prior art keywords
harassment
short message
calibration
calibration value
disturbance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310113140.9A
Other languages
English (en)
Other versions
CN115942322A (zh
Inventor
郑亚珂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Miaoxin Technology Co ltd
Original Assignee
Beijing Miaoxin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Miaoxin Technology Co ltd filed Critical Beijing Miaoxin Technology Co ltd
Priority to CN202310113140.9A priority Critical patent/CN115942322B/zh
Publication of CN115942322A publication Critical patent/CN115942322A/zh
Application granted granted Critical
Publication of CN115942322B publication Critical patent/CN115942322B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种骚扰短信拦截方法及系统,其方法包括:S1:对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行分析,获得参考骚扰特征判定表;S2:基于用户的骚扰短信历史标定记录分析出对应用户对每个标定值组的标定偏好系数;S3:基于标定偏好系数和参考骚扰特征判定表,生成对应用户的个性化骚扰特征判定表;S4:基于个性化骚扰特征判定表获得待识别短信的骚扰判定结果,基于骚扰判定结果进行相应拦截操作;用以实现基于用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据和每个用户的骚扰短信标记行为习惯生成针对用户的骚扰短信的个性化拦截机制,提高了短信拦截的智能化程度和拦截精度。

Description

一种骚扰短信拦截方法及系统
技术领域
本发明涉及通信技术领域,特别涉及一种骚扰短信拦截方法及系统。
背景技术
近年来,骚扰短信数量爆增,由于利用短信群发进行广告宣传的产业链的成熟,导致很多产业领域利用短信实现广告宣传和营销;因此,用户深受骚扰短信的困扰,各大运营商或手机厂商都出台了不同的骚扰短信拦截功能。
但是,现存的骚扰短信拦截功能,大多由以下核心思想实现:设置骚扰短信的号段特征、对骚扰短信进行内容识别、或者根据用户的标定行为对单个用户的短信进行拦截,无论是采用上述方式的一种还是多种结合实现的骚扰短信拦截方式,都因为拦截判定(或者骚扰短信识别)的方式过于单一固定,导致不能根据不同用户的通讯习惯进行智能拦截,用户还是能接收到一部分骚扰短信。
因此,本发明提出了一种骚扰短信拦截方法及系统。
发明内容
本发明提供一种骚扰短信拦截方法及系统,用以结合基于用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据分析出的骚扰特征判定表以及基于用户的骚扰短信历史标定记录分析出的标定偏好系数,生成用户的个性化骚扰特征判定表,进而实现基于每个用户的骚扰短信标记行为习惯生成针对用户的骚扰短信的个性化拦截机制,提高了短信拦截的智能化程度和拦截精度。
本发明提供一种骚扰短信拦截方法,包括:
S1:对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行特征分析,获得参考骚扰特征判定表;
S2:基于用户的骚扰短信历史标定记录分析出对应用户对每个标定值组的标定偏好系数;
S3:基于标定偏好系数和参考骚扰特征判定表,生成对应用户的个性化骚扰特征判定表;
S4:基于个性化骚扰特征判定表获得待识别短信的骚扰判定结果,基于骚扰判定结果进行相应拦截操作。
优选的,所述的一种骚扰短信拦截方法,S1:对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行特征分析,获得参考骚扰特征判定表,包括:
基于所有预设的特征属性的所有标定值生成多个标定值组,其中,每个标定值组中包含所有特征属性的一个标定值,其中,特征属性包括:骚扰号码的号段属性、发出时间、短信意图、短信语气;
确定出用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信的每个特征属性的详细值;
基于预设的特征属性的多个标定值和所有详细值,对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合;
将每个标定值组中包含的所有标定值在对应所属地区的骚扰短信集合中的共有短信总数和对应所属地区的所有骚扰短信总数的比值,作为对应标定值组在对应所属地区的骚扰判定值;
基于每个标定值组在所有所属地区的骚扰判定值,生成参考骚扰特征判定表。
优选的,所述的一种骚扰短信拦截方法,基于预设的特征属性的多个标定值和所有详细值,对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合,包括:
将用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信按照参考用户划分,获得每个参考用户的待过滤短信集;
确定出待过滤短信集中每个待过滤骚扰短信的每个特征属性的详细值,基于详细值确定出待过滤骚扰短信的标定值组;
按照标定值组对待过滤短信集进行划分,获得每个标定值组对应的待过滤短信子集;
将待过滤短信子集中的短信总数和待过滤短信集中的短信总数的比值当作对应标定值组的占比值;
将待过滤短信集中占比值小于占比阈值的标定值组的待过滤短信子集删除,获得对应参考用户的过滤短信集;
将所有参考用户的过滤短信集汇总获得参考骚扰短信集,基于预设的特征属性的多个标定值和所有详细值,对参考骚扰短信集进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合。
优选的,所述的一种骚扰短信拦截方法,基于每个标定值组在所有所属地区的骚扰判定值,生成参考骚扰特征判定表,包括:
基于每个所属地区的级别的预设权重和标定值组在对应所属地区的骚扰判定值,计算出对应标定值组的参考骚扰判定值;
将所有标定值组的参考骚扰判定值汇总获得参考骚扰特征判定表。
优选的,所述的一种骚扰短信拦截方法,S2:基于用户的骚扰短信历史标定记录分析出对应用户对每个标定值组的标定偏好系数,包括:
获取用户的短信接收记录中的短信总数,并基于基于预设特征识别方式识别出历史短信的每个特征属性的历史标定值,获得历史短信的历史标定值组;
将参考骚扰特征判定表中与历史标定值组一致的标定值组的参考骚扰判定值作为对应历史短信的历史参考骚扰判定值;
当历史参考骚扰判定值超过骚扰判定阈值时,则将对应历史短信标定为对应标定值组的第一标定骚扰短信;
将标定值组的第一标定骚扰短信总数和短信接收记录中的短信总数的比值,作为对应标定值组的第一偏好因子;
将基于用户的骚扰短信历史标定记录确定出的用户标定的所有骚扰短信作为第二标定骚扰短信;
确定出所有第二标定骚扰短信中每个标定值组的第二标定骚扰短信总数;
将标定值组的第二标定骚扰短信总数和第一标定骚扰短信总数的比值作为对应标定值组的第二偏好因子;
将标定值组的第一偏好因子和第二偏好因子的平均值作为对应标定值组的标定偏好系数。
优选的,所述的一种骚扰短信拦截方法,S3:基于标定偏好系数和参考骚扰特征判定表,生成对应用户的个性化骚扰特征判定表,包括:
S301:将参考骚扰特征判定表中每个标定值组的参考骚扰判定值与对应的标定偏好系数的乘积,作为对应标定值组的个性化骚扰判定值;
S302:基于所有标定值组的个性化骚扰判定值生成对应用户的个性化骚扰特征判定表。
优选的,所述的一种骚扰短信拦截方法,S4:基于个性化骚扰特征判定表获得待识别短信的骚扰判定结果,基于骚扰判定结果进行相应拦截操作,包括:
基于预设特征识别方式识别出待识别短信的每个特征属性的目标标定值;
基于目标标定值和个性化骚扰特征判定表,确定出待识别短信的目标骚扰判定值;
当目标骚扰判定值超过骚扰判定阈值时,则将待识别短信是骚扰短信作为骚扰判定结果,并对待识别短信进行拦截,否则,将待识别短信不是骚扰短信作为骚扰判定结果,并保留骚扰判定结果。
优选的,所述的一种骚扰短信拦截方法,还包括:
当骚扰判定结果为待识别短信是骚扰短信时,则跟踪用户对待识别短信的短信标定行为,基于短信标定行为实时更新个性化骚扰特征判定表。
优选的,所述的一种骚扰短信拦截方法,基于短信标定行为实时更新个性化骚扰特征判定表,包括:
当短信标定行为为用户将待识别短信标定为骚扰短信时,则将对应待识别短信更新至用户的骚扰短信历史标定记录;
基于新的骚扰短信历史标定记录更新对应用户对每个标定值组的标定偏好系数,并基于新的标定偏好系数更新个性化骚扰特征判定表。
本发明提供一种骚扰短信拦截系统,包括:
特征分析模块,用于分析对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行分析,获得参考骚扰特征判定表;
偏好分析模块,用于基于用户的骚扰短信历史标定记录分析出对应用户对每个标定值组的标定偏好系数;
判定表生成模块,用于基于标定偏好系数和参考骚扰特征判定表,生成对应用户的个性化骚扰特征判定表;
拦截判断模块,用于基于个性化骚扰特征判定表,判断出待识别短信的骚扰判定结果,基于骚扰判定结果进行相应拦截操作。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种骚扰短信拦截方法流程图;
图2为本发明实施例中又一种骚扰短信拦截方法流程图;
图3为本发明实施例中一种骚扰短信拦截系统示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1
本发明提供了一种骚扰短信拦截方法,参考图1,包括:
S1:对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行特征分析,获得参考骚扰特征判定表;
S2:基于用户的骚扰短信历史标定记录分析出对应用户对每个标定值组的标定偏好系数;
S3:基于标定偏好系数和参考骚扰特征判定表,生成对应用户的个性化骚扰特征判定表;
S4:基于个性化骚扰特征判定表获得待识别短信的骚扰判定结果,基于骚扰判定结果进行相应拦截操作。
该实施例中,不同级别下的所属地区即为用户的电话号码在不同行政级别下的归属地,例如:用户的电话号码的归属地为山东省青岛市,则用户的省级归属地为山东省,市级归属地为青岛市。
该实施例中,预设量即为分析出参考骚扰特征判定表时需要的不同级别下的所属地区的预设的打扰短信标记数据量,例如:需要1万条被用户标定为骚扰短信的短信。
该实施例中,参考骚扰特征判定表即为对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行特征分析后获得的用于与用户对每个标定值组的标定偏好系数结合生成用户的个性化骚扰特征判定表的数据,其中包含了不同标定值组的参考骚扰判定值,参考骚扰判定值是用于与用户对每个标定值组的标定偏好系数结合生成用户的个性化骚扰特征判定表的数值。
该实施例中,骚扰短信标记数据即为包含被用户标定为骚扰短信的短信的相关数据,例如发出骚扰短信的号码、发出骚扰短信的时间、发出的骚扰短信的内容。
该实施例中,骚扰短信历史标定记录即为用于记录用户在接收到的所有短信中对骚扰短信的标定行为以及被标定为骚扰短信的相关数据。
该实施例中,标定值组即为包含骚扰短信的每个特征属性中的一个预设的标定值的组合,例如:特征属性包含骚扰号码的号段属性、发出时间、短信意图、短信语气;则号段属性的标定值即为预设的多个不同号段范围,发出时间的标定值即为预设的不同发出时间范围,短信意图的标定值例如有:广告推销、引导进入第三方网站、垃圾信息、恶意攻击等;短信语气的标定值例如有非友善、友善等。
该实施例中,标定偏好系数即为基于用户的骚扰短信历史标定记录分析出的表征用户对每个标定值组的骚扰短信标定时的偏好程度的数值。
该实施例中,骚扰判定结果即为基于个性化骚扰特征判定表确定出的包含待识别短信是否为骚扰短信的判断结果。
该实施例中,个性化骚扰特征判定表即为基于基于标定偏好系数和参考骚扰特征判定表生成的可以实现针对用户的个性化骚扰短信拦截机制的表格。
该实施例中,基于骚扰判定结果进行相应拦截操作即为:
当骚扰判定结果为待识别短信为骚扰短信时,则对待识别短信进行拦截操作。
以上技术的有益效果为:结合基于用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据分析出的骚扰特征判定表以及基于用户的骚扰短信历史标定记录分析出的标定偏好系数,生成用户的个性化骚扰特征判定表,进而实现基于每个用户的骚扰短信标记行为习惯生成针对用户的骚扰短信的个性化拦截机制,提高了短信拦截的智能化程度和拦截精度。
实施例2
在实施例1的基础上,所述的一种骚扰短信拦截方法,S1:对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行特征分析,获得参考骚扰特征判定表,包括:
基于所有预设的特征属性的所有标定值生成多个标定值组,其中,每个标定值组中包含所有特征属性的一个标定值,其中,特征属性包括:骚扰号码的号段属性、发出时间、短信意图、短信语气;
确定出用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信的每个特征属性的详细值;
基于预设的特征属性的多个标定值和所有详细值,对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合;
将每个标定值组中包含的所有标定值在对应所属地区的骚扰短信集合中的共有短信总数和对应所属地区的所有骚扰短信总数的比值,作为对应标定值组在对应所属地区的骚扰判定值;
基于每个标定值组在所有所属地区的骚扰判定值,生成参考骚扰特征判定表。
该实施例中,预设的特征属性即为骚扰短信预设的特征属性。
该实施例中,例如:特征属性包含骚扰号码的号段属性、发出时间、短信意图、短信语气;则号段属性的标定值即为预设的多个不同号段范围,骚扰短信的标定值即为预设的不同发出时间范围,短信意图的标定值例如有:广告推销、引导进入第三方网站、垃圾信息、恶意攻击等;短信语气的标定值例如有非友善、友善等。
该实施例中,详细值即为每个骚扰短信的特征属性的具体数值,例如:骚扰短信的号码、骚扰短信的实际发出时间、骚扰短信中的短信意图、骚扰短信中的短信语气。
该实施例中,短信意图和短信语气都是基于经过深度学习训练获得的模型对骚扰短信进行识别获得的。
该实施例中,基于预设的特征属性的多个标定值和所有详细值,对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合,即为:
确定出详细值对应的标定值,进而基于骚扰短信的每个特征属性的详细值对所有骚扰短信进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合。
该实施例中,骚扰短信集合即为包含对应特征属性的对应标定值在对应所属地区的所有骚扰短信构成的集合。
该实施例中,共有短信总数即为标定值组中所有标定值(在对应所属地区的)的骚扰短信集合中共同拥有的短信的总数。
该实施例中,骚扰判定值即为基于标定值组中包含的所有标定值在对应所属地区的骚扰短信集合中的共有短信总数和对应所属地区的所有骚扰短信总数的比值初步生成的用于表征对应标定值组的短信为骚扰短信的可能性的数值。
以上技术的有益效果为:基于预设的特征属性的所有标定值以及对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信的每个特征属性的详细值,对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信进行划分,并基于划分后确定出的标定值组中包含的所有标定值在对应所属地区的骚扰短信集合中的共有短信总数和对应所属地区的所有骚扰短信总数的比值获得的标定值组在对应所属地区的骚扰判定值,实现基于用户号码归属地的区域特征和海量骚扰短信标记数据初步分析出表征骚扰短信的特征属性的标定值组的骚扰判定值,实现了对骚扰短信的特征的初步深度学习。
实施例3
在实施例2的基础上,所述的一种骚扰短信拦截方法,基于预设的特征属性的多个标定值和所有详细值,对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合,包括:
将用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信按照参考用户划分,获得每个参考用户的待过滤短信集;
确定出待过滤短信集中每个待过滤骚扰短信的每个特征属性的详细值,基于详细值确定出待过滤骚扰短信的标定值组;
按照标定值组对待过滤短信集进行划分,获得每个标定值组对应的待过滤短信子集;
将待过滤短信子集中的短信总数和待过滤短信集中的短信总数的比值当作对应标定值组的占比值;
将待过滤短信集中占比值小于占比阈值的标定值组的待过滤短信子集删除,获得对应参考用户的过滤短信集;
将所有参考用户的过滤短信集汇总获得参考骚扰短信集,基于预设的特征属性的多个标定值和所有详细值,对参考骚扰短信集进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合。
该实施例中,参考用户即为接收到骚扰短信标记数据中包含的骚扰短信的用户。
该实施例中,待过滤短信集即为预设量的骚扰短信标记数据中包含的对应参考用户接收到的骚扰短信的集合。
该实施例中,基于详细值确定出待过滤骚扰短信的标定值组,即为:
基于详细值确定出对应的标定值,将待过滤骚扰短信的每个特征属性的详细值对应的标定值汇总获得对应的标定值组。
该实施例中,待过滤骚扰短信即为待过滤短信集中包含的短信。
该实施例中,待过滤短信子集即为待过滤短信集中包含的标定值组对应的所有骚扰短信的集合。
该实施例中,占比值即为表征待过滤短信集中对应标定值组的骚扰短信的总数在对应用户的所有骚扰短信的总数中的占比。
该实施例中,占比阈值即为预设的用于过滤掉待过滤短信集中需要过滤的骚扰短信的占比值阈值。
该实施例中,由于每个人的通讯习惯和社会关系的不同,每个人都会接收到只有该用户可能接收到的骚扰短信,这些骚扰短信不能代表骚扰短信的普遍特征,因此,在确定参考骚扰特征判定表之前需要将骚扰短信标记数据中的这些短信过滤,才能保证生成的参考骚扰特征判定表的准确性。
该实施例中,过滤短信集即为对待过滤短信集进行过滤后获得的短信集合。
该实施例中,基于预设的特征属性的多个标定值和所有详细值,对参考骚扰短信集进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合,即为:
确定出详细值对应的标定值,进而基于骚扰短信的每个特征属性的详细值对参考骚扰短信集中的所有骚扰短信进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合。
以上技术的有益效果为:基于参考用户的待过滤短信集中标定值组对应的骚扰短信总数的占比,对占比值较小的标定值组的骚扰短信进行过滤删除,进而实现对骚扰短信标记数据的过滤,保证了后续生成的参考骚扰特征判定表的准确性。
实施例4
在实施例2的基础上,所述的一种骚扰短信拦截方法,基于每个标定值组在所有所属地区的骚扰判定值,生成参考骚扰特征判定表,包括:
基于每个所属地区的级别的预设权重和标定值组在对应所属地区的骚扰判定值,计算出对应标定值组的参考骚扰判定值;
将所有标定值组的参考骚扰判定值汇总获得参考骚扰特征判定表。
该实施例中,基于每个所属地区的级别的预设权重和标定值组在对应所属地区的骚扰判定值,计算出对应标定值组的参考骚扰判定值,包括:
Figure SMS_1
式中,
Figure SMS_2
为当前计算的标定值组的参考骚扰判定值,/>
Figure SMS_3
为所属地区的总数,/>
Figure SMS_4
为第/>
Figure SMS_5
个所属地区的级别的预设权重,/>
Figure SMS_6
为当前计算的标定值组在第/>
Figure SMS_7
个所属地区的的骚扰判定值;
基于上述公式计算标定值组的参考骚扰判定值时不仅考虑到分析出参考骚扰特征判定表的来源数据中的用户归属地特征,也结合了所属地区的地区级别的预设权重,使得计算出的标定值组的参考骚扰判定值准确性更高。
以上技术的有益效果为:实现了不仅考虑到分析出参考骚扰特征判定表的来源数据中的用户归属地特征,也结合了所属地区的地区级别的预设权重,使得计算出的标定值组的参考骚扰判定值准确性更高,更能准确表征标定值组的短信的为骚扰短信的可能性。
实施例5
在实施例4的基础上,所述的一种骚扰短信拦截方法,S2:基于用户的骚扰短信历史标定记录分析出对应用户对每个标定值组的标定偏好系数,包括:
获取用户的短信接收记录中的短信总数,并基于基于预设特征识别方式识别出历史短信的每个特征属性的历史标定值,获得历史短信的历史标定值组;
将参考骚扰特征判定表中与历史标定值组一致的标定值组的参考骚扰判定值作为对应历史短信的历史参考骚扰判定值;
当历史参考骚扰判定值超过骚扰判定阈值时,则将对应历史短信标定为对应标定值组的第一标定骚扰短信;
将标定值组的第一标定骚扰短信总数和短信接收记录中的短信总数的比值,作为对应标定值组的第一偏好因子;
将基于用户的骚扰短信历史标定记录确定出的用户标定的所有骚扰短信作为第二标定骚扰短信;
确定出所有第二标定骚扰短信中每个标定值组的第二标定骚扰短信总数;
将标定值组的第二标定骚扰短信总数和第一标定骚扰短信总数的比值作为对应标定值组的第二偏好因子;
将标定值组的第一偏好因子和第二偏好因子的平均值作为对应标定值组的标定偏好系数。
该实施例中,短信接收记录即为包含对应用户接收到的所有短信的记录。
该实施例中,预设特征识别方式即为预设的用于识别出历史短信的对应特征属性的历史标定值的特征识别方法,识别出短信的号段属性的历史标定值的特征识别方法为判断发出短信的号码属于对应特征属性的标定值中的哪个号段;识别出短信的发出时间特征属性的历史标定值的特征识别方法即为直接读取对应短信的发出时间;识别出短信的短信意图和短信语气的历史标定值的特征识别方法即为采用预先训练好的模型。
该实施例中,历史短信即为短信接收记录中包含的短信。
该实施例中,历史标定值即为历史短信的特征属性的详细值对应的标定值。
该实施例中,历史标定值组即为包含历史短信的所有特征属性的详细值对应的标定值的组合。
该实施例中,历史参考骚扰判定值即为参考骚扰特征判定表中与历史标定值组一致的标定值组的参考骚扰判定值。
该实施例中,骚扰判定阈值即为预设的用于判断识别出骚扰短信的阈值。
该实施例中,第一标定骚扰短信即为超过骚扰判定阈值的历史参考骚扰判定值对应的历史短信。
该实施例中,短信接收记录中的短信总数即为短信接收记录中所有短信的总数。
该实施例中,第一偏好因子即为标定值组的第一标定骚扰短信总数和短信接收记录中的短信总数的比值,也是用于计算出用户对标定值组的标定偏好系数的来源数据之一。
该实施例中,第二标定骚扰短信即为用户的骚扰短信历史标定记录中包含的用户标定为骚扰短信的短信。
该实施例中,第二标定骚扰短信总数即为所有第二标定骚扰短信的总数。
该实施例中,第二偏好因子即为对应标定值组的第二标定骚扰短信总数和第一标定骚扰短信总数的比值,也是用于计算出用户对标定值组的标定偏好系数的来源数据之一。
以上技术的有益效果为:通过将基于参考骚扰判定值和骚扰判定阈值判定出的第一标定骚扰短信的占比以及基于用户标定的第二标定骚扰短信总数与基于参考骚扰判定值和骚扰判定阈值判定出的第一标定骚扰短信总数的比值结合,实现对用户对骚扰短信的标定值组的标定偏好程度的分析。
实施例6
在实施例1的基础上,所述的一种骚扰短信拦截方法,S3:基于标定偏好系数和参考骚扰特征判定表,生成对应用户的个性化骚扰特征判定表,包括:
S301:将参考骚扰特征判定表中每个标定值组的参考骚扰判定值与对应的标定偏好系数的乘积,作为对应标定值组的个性化骚扰判定值;
S302:基于所有标定值组的个性化骚扰判定值生成对应用户的个性化骚扰特征判定表。
该实施例中,个性化骚扰判定值即为基于参考骚扰特征判定表中每个标定值组的参考骚扰判定值与对应的标定偏好系数生成的表征对应用户对对应标定值组的短信标定为骚扰短信的可能性的数值。
该实施例中,个性化骚扰特征判定表即为将所有标定值组的个性化骚扰判定值汇总后获得的表格,基于个性化骚扰特征判定表可以实现针对用户的个性化骚扰短信拦截机制。
以上技术的有益效果为:将参考骚扰特征判定表中每个标定值组的参考骚扰判定值与对应的标定偏好系数集合,生成可用于实现针对用户的个性化骚扰短信拦截机制的个性化骚扰特征判定表。
实施例7
在实施例1的基础上,所述的一种骚扰短信拦截方法,S4:基于个性化骚扰特征判定表获得待识别短信的骚扰判定结果,基于骚扰判定结果进行相应拦截操作,包括:
基于预设特征识别方式识别出待识别短信的每个特征属性的目标标定值;
基于目标标定值和个性化骚扰特征判定表,确定出待识别短信的目标骚扰判定值;
当目标骚扰判定值超过骚扰判定阈值时,则将待识别短信是骚扰短信作为骚扰判定结果,并对待识别短信进行拦截,否则,将待识别短信不是骚扰短信作为骚扰判定结果,并保留骚扰判定结果。
该实施例中,目标标定值即为基于预设特征识别方式识别出的待识别短信的特征属性的详细值对应的标定值。
该实施例中,待识别短信即为需要被识别是否为骚扰短信的短信。
该实施例中,目标骚扰判定值即为个性化骚扰特征判定表中与由待识别短信的所有目标标定值组成的目标标定值组一致的标定值组对应的个性化骚扰判定值。
以上技术的有益效果为:实现了基于个性化骚扰特征判定表完成对发给用户的待识别短信的个性化骚扰短信判别(拦截)的机制,进而使得骚扰短信拦截更加合理智能。
实施例8
在实施例1的基础上,所述的一种骚扰短信拦截方法,还包括:
当骚扰判定结果为待识别短信是骚扰短信时,则跟踪用户对待识别短信的短信标定行为,基于短信标定行为实时更新个性化骚扰特征判定表。
该实施例中,短信标定行为即为用户对待识别短信的标定行为,即包含标定为骚扰短信或者标定为非骚扰短信。
以上技术的有益效果为:实现对用户对接收到的待识别短信的后续标定行为的跟踪,也实现了个性化骚扰特征判断表的不断学习和更新,进一步保证了拦截效果。
实施例9
在实施例8的基础上,所述的一种骚扰短信拦截方法,基于短信标定行为实时更新个性化骚扰特征判定表,包括:
当短信标定行为为用户将待识别短信标定为骚扰短信时,则将对应待识别短信更新至用户的骚扰短信历史标定记录;
基于新的骚扰短信历史标定记录更新对应用户对每个标定值组的标定偏好系数,并基于新的标定偏好系数更新个性化骚扰特征判定表。
以上技术的有益效果为:实现基于短信标定行为对用户的骚扰短信历史标定记录的不断更新,进而实现对用户对每个标定值组的标定偏好系数的不断更新,也实现了对个性化骚扰特征判定表的不断更新。
实施例10
本发明提供了一种骚扰短信拦截系统,参考图3,包括:
特征分析模块,用于分析对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行分析,获得参考骚扰特征判定表;
偏好分析模块,用于基于用户的骚扰短信历史标定记录分析出对应用户对每个标定值组的标定偏好系数;
判定表生成模块,用于基于标定偏好系数和参考骚扰特征判定表,生成对应用户的个性化骚扰特征判定表;
拦截判断模块,用于基于个性化骚扰特征判定表,判断出待识别短信的骚扰判定结果,基于骚扰判定结果进行相应拦截操作。
以上技术的有益效果为:结合基于用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据分析出的骚扰特征判定表以及基于用户的骚扰短信历史标定记录分析出的标定偏好系数,生成用户的个性化骚扰特征判定表,进而实现基于每个用户的骚扰短信标记行为习惯生成针对用户的骚扰短信的个性化拦截机制,提高了短信拦截的智能化程度和拦截精度。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种骚扰短信拦截方法,其特征在于,包括:
S1:对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行特征分析,获得参考骚扰特征判定表;
S2:基于用户的骚扰短信历史标定记录分析出对应用户对每个标定值组的标定偏好系数;
S3:基于标定偏好系数和参考骚扰特征判定表,生成对应用户的个性化骚扰特征判定表;
S4:基于个性化骚扰特征判定表获得待识别短信的骚扰判定结果,基于骚扰判定结果进行相应拦截操作;
S1:对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行特征分析,获得参考骚扰特征判定表,包括:
基于所有预设的特征属性的所有标定值生成多个标定值组,其中,每个标定值组中包含所有特征属性的一个标定值,其中,特征属性包括:骚扰号码的号段属性、发出时间、短信意图、短信语气;
确定出用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信的每个特征属性的详细值;
基于预设的特征属性的多个标定值和所有详细值,对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合;
将每个标定值组中包含的所有标定值在对应所属地区的骚扰短信集合中的共有短信总数和对应所属地区的所有骚扰短信总数的比值,作为对应标定值组在对应所属地区的骚扰判定值;
基于每个标定值组在所有所属地区的骚扰判定值,生成参考骚扰特征判定表。
2.根据权利要求1所述的一种骚扰短信拦截方法,其特征在于,基于预设的特征属性的多个标定值和所有详细值,对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合,包括:
将用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信按照参考用户划分,获得每个参考用户的待过滤短信集;
确定出待过滤短信集中每个待过滤骚扰短信的每个特征属性的详细值,基于详细值确定出待过滤骚扰短信的标定值组;
按照标定值组对待过滤短信集进行划分,获得每个标定值组对应的待过滤短信子集;
将待过滤短信子集中的短信总数和待过滤短信集中的短信总数的比值当作对应标定值组的占比值;
将待过滤短信集中占比值小于占比阈值的标定值组的待过滤短信子集删除,获得对应参考用户的过滤短信集;
将所有参考用户的过滤短信集汇总获得参考骚扰短信集,基于预设的特征属性的多个标定值和所有详细值,对参考骚扰短信集进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合。
3.根据权利要求1所述的一种骚扰短信拦截方法,其特征在于,基于每个标定值组在所有所属地区的骚扰判定值,生成参考骚扰特征判定表,包括:
基于每个所属地区的级别的预设权重和标定值组在对应所属地区的骚扰判定值,计算出对应标定值组的参考骚扰判定值;
将所有标定值组的参考骚扰判定值汇总获得参考骚扰特征判定表。
4.根据权利要求3所述的一种骚扰短信拦截方法,其特征在于,S2:基于用户的骚扰短信历史标定记录分析出对应用户对每个标定值组的标定偏好系数,包括:
获取用户的短信接收记录中的短信总数,并基于预设特征识别方式识别出历史短信的每个特征属性的历史标定值,获得历史短信的历史标定值组;
将参考骚扰特征判定表中与历史标定值组一致的标定值组的参考骚扰判定值作为对应历史短信的历史参考骚扰判定值;
当历史参考骚扰判定值超过骚扰判定阈值时,则将对应历史短信标定为对应标定值组的第一标定骚扰短信;
将标定值组的第一标定骚扰短信总数和短信接收记录中的短信总数的比值,作为对应标定值组的第一偏好因子;
将基于用户的骚扰短信历史标定记录确定出的用户标定的所有骚扰短信作为第二标定骚扰短信;
确定出所有第二标定骚扰短信中每个标定值组的第二标定骚扰短信总数;
将标定值组的第二标定骚扰短信总数和第一标定骚扰短信总数的比值作为对应标定值组的第二偏好因子;
将标定值组的第一偏好因子和第二偏好因子的平均值作为对应标定值组的标定偏好系数。
5.根据权利要求1所述的一种骚扰短信拦截方法,其特征在于,S3:基于标定偏好系数和参考骚扰特征判定表,生成对应用户的个性化骚扰特征判定表,包括:
S301:将参考骚扰特征判定表中每个标定值组的参考骚扰判定值与对应的标定偏好系数的乘积,作为对应标定值组的个性化骚扰判定值;
S302:基于所有标定值组的个性化骚扰判定值生成对应用户的个性化骚扰特征判定表。
6.根据权利要求1所述的一种骚扰短信拦截方法,其特征在于,S4:基于个性化骚扰特征判定表获得待识别短信的骚扰判定结果,基于骚扰判定结果进行相应拦截操作,包括:
基于预设特征识别方式识别出待识别短信的每个特征属性的目标标定值;
基于目标标定值和个性化骚扰特征判定表,确定出待识别短信的目标骚扰判定值;
当目标骚扰判定值超过骚扰判定阈值时,则将待识别短信是骚扰短信作为骚扰判定结果,并对待识别短信进行拦截,否则,将待识别短信不是骚扰短信作为骚扰判定结果,并保留骚扰判定结果。
7.根据权利要求1所述的一种骚扰短信拦截方法,其特征在于,还包括:
当骚扰判定结果为待识别短信是骚扰短信时,则跟踪用户对待识别短信的短信标定行为,基于短信标定行为实时更新个性化骚扰特征判定表。
8.根据权利要求7所述的一种骚扰短信拦截方法,其特征在于,基于短信标定行为实时更新个性化骚扰特征判定表,包括:
当短信标定行为为用户将待识别短信标定为骚扰短信时,则将对应待识别短信更新至用户的骚扰短信历史标定记录;
基于新的骚扰短信历史标定记录更新对应用户对每个标定值组的标定偏好系数,并基于新的标定偏好系数更新个性化骚扰特征判定表。
9.一种骚扰短信拦截系统,其特征在于,包括:
特征分析模块,用于分析对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行分析,获得参考骚扰特征判定表;
偏好分析模块,用于基于用户的骚扰短信历史标定记录分析出对应用户对每个标定值组的标定偏好系数;
判定表生成模块,用于基于标定偏好系数和参考骚扰特征判定表,生成对应用户的个性化骚扰特征判定表;
拦截判断模块,用于基于个性化骚扰特征判定表,判断出待识别短信的骚扰判定结果,基于骚扰判定结果进行相应拦截操作;
对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据进行特征分析,获得参考骚扰特征判定表,包括:
基于所有预设的特征属性的所有标定值生成多个标定值组,其中,每个标定值组中包含所有特征属性的一个标定值,其中,特征属性包括:骚扰号码的号段属性、发出时间、短信意图、短信语气;
确定出用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信的每个特征属性的详细值;
基于预设的特征属性的多个标定值和所有详细值,对用户在不同级别下对应的所属地区的预设量的骚扰短信标记数据中的所有骚扰短信进行划分,获得每个特征属性的每个标定值在对应所属地区的骚扰短信集合;
将每个标定值组中包含的所有标定值在对应所属地区的骚扰短信集合中的共有短信总数和对应所属地区的所有骚扰短信总数的比值,作为对应标定值组在对应所属地区的骚扰判定值;
基于每个标定值组在所有所属地区的骚扰判定值,生成参考骚扰特征判定表。
CN202310113140.9A 2023-02-15 2023-02-15 一种骚扰短信拦截方法及系统 Active CN115942322B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310113140.9A CN115942322B (zh) 2023-02-15 2023-02-15 一种骚扰短信拦截方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310113140.9A CN115942322B (zh) 2023-02-15 2023-02-15 一种骚扰短信拦截方法及系统

Publications (2)

Publication Number Publication Date
CN115942322A CN115942322A (zh) 2023-04-07
CN115942322B true CN115942322B (zh) 2023-06-06

Family

ID=86556195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310113140.9A Active CN115942322B (zh) 2023-02-15 2023-02-15 一种骚扰短信拦截方法及系统

Country Status (1)

Country Link
CN (1) CN115942322B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105307134A (zh) * 2014-06-12 2016-02-03 中兴通讯股份有限公司 一种短信监控方法及装置
CN105992176A (zh) * 2015-01-29 2016-10-05 腾讯科技(深圳)有限公司 一种垃圾短信拦截方法及装置
CN110267272A (zh) * 2019-06-28 2019-09-20 国家计算机网络与信息安全管理中心 一种诈骗短信识别方法及识别系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101861380B1 (ko) * 2012-07-16 2018-05-28 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 헤드 마운트 디스플레이를 이용한 컨텐츠 출력 방법 및 이를 위한 헤드 마운트 디스플레이
CN105516941A (zh) * 2014-10-13 2016-04-20 中兴通讯股份有限公司 一种垃圾短信的拦截方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105307134A (zh) * 2014-06-12 2016-02-03 中兴通讯股份有限公司 一种短信监控方法及装置
CN105992176A (zh) * 2015-01-29 2016-10-05 腾讯科技(深圳)有限公司 一种垃圾短信拦截方法及装置
CN110267272A (zh) * 2019-06-28 2019-09-20 国家计算机网络与信息安全管理中心 一种诈骗短信识别方法及识别系统

Also Published As

Publication number Publication date
CN115942322A (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN106022834B (zh) 广告反作弊方法及装置
US10557712B2 (en) Determination of a route of a mobile device in a mobile network
CN110401779B (zh) 一种识别电话号码的方法、装置和计算机可读存储介质
CN105808988B (zh) 一种识别异常账户的方法及装置
CN103714067B (zh) 一种信息推送方法和装置
CN107248082B (zh) 养卡识别方法及装置
EP2793495A1 (en) Mobile terminal and user identification method
US20040122686A1 (en) Software predictive model of technology acceptance
CN107527240B (zh) 一种运营商行业产品口碑营销效果鉴定系统及方法
CN104023109A (zh) 来电提示方法和装置及分类方法和装置
CN106843941A (zh) 信息处理方法、装置和计算机设备
CN106569691A (zh) 移动终端应用图标排列方法和系统
CN107133689B (zh) 一种位置标记方法
CN105354721A (zh) 一种识别机器操作行为的方法及装置
CN111104468B (zh) 一种基于语义轨迹推断用户活动的方法
CN111143689A (zh) 根据用户需求和用户画像构建推荐引擎的方法
CN106919692B (zh) 一种推送消息的方法和装置
CN115942322B (zh) 一种骚扰短信拦截方法及系统
CN106301979A (zh) 检测异常渠道的方法和系统
CN105677813A (zh) 一种信息展示方法及装置
CN113822596B (zh) 基于大数据的客户筛选方法
CN112230984B (zh) 区块链智能合约模板的处理方法及装置
CN109784993B (zh) 一种基于大数据的用户轨迹智能精准预测系统
CN113515771A (zh) 数据敏感度判定方法、电子设备及计算机可读存储介质
CN108664497B (zh) 数据匹配的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant