CN113099057A - 用户提醒方法、装置和计算机可读存储介质 - Google Patents

用户提醒方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN113099057A
CN113099057A CN201911334423.6A CN201911334423A CN113099057A CN 113099057 A CN113099057 A CN 113099057A CN 201911334423 A CN201911334423 A CN 201911334423A CN 113099057 A CN113099057 A CN 113099057A
Authority
CN
China
Prior art keywords
user
reminding
cluster
clustering
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911334423.6A
Other languages
English (en)
Inventor
张永琼
严中会
何涛
邓伯英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201911334423.6A priority Critical patent/CN113099057A/zh
Publication of CN113099057A publication Critical patent/CN113099057A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M15/00Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
    • H04M15/83Notification aspects
    • H04M15/84Types of notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M15/00Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
    • H04M15/83Notification aspects
    • H04M15/84Types of notifications
    • H04M15/844Message, e.g. SMS
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M15/00Arrangements for metering, time-control or time indication ; Metering, charging or billing arrangements for voice wireline or wireless communications, e.g. VoIP
    • H04M15/83Notification aspects
    • H04M15/85Notification aspects characterised by the type of condition triggering a notification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/12Messaging; Mailboxes; Announcements
    • H04W4/14Short messaging services, e.g. short message services [SMS] or unstructured supplementary service data [USSD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/24Accounting or billing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种用户提醒方法、装置和计算机可读存储介质,涉及数据处理领域。用户提醒方法包括:对用户特征向量进行聚类,获得多个类簇,每个用户特征向量是根据用户的业务使用数据和账单数据确定的;计算每个类簇中用户的历史拖延信息的平均值;根据获取的历史拖延信息的第一取值范围确定一个或多个第一类簇、作为弱提醒用户,以及根据获取的历史拖延信息的第二取值范围确定一个或多个第二类簇、作为中度提醒用户;将用户特征向量输入到预先训练的分类器中,以确定强提醒用户;向用户发起用户的类型对应的提醒。从而,可以更合理地分配提醒资源,提高了提醒效率。

Description

用户提醒方法、装置和计算机可读存储介质
技术领域
本发明涉及数据处理领域,特别涉及一种用户提醒方法、装置和计算机可读存储介质。
背景技术
随着通信行业的快速发展,用户基数不断增长。且用户欠费现象日益严重,需要反复对用户进行提醒。这使得通信业务的运营成本增加。在相关技术中,当用户出现拖延行为后,采用人工的方式对用户进行提醒。
发明内容
发明人经过分析后发现,相关技术的方式属于事后管控,并且,人工的提醒方式不仅可靠性和实时性差,因此提醒效率较差。
本发明实施例所要解决的一个技术问题是:如何提高用户提醒效率。
根据本发明一些实施例的第一个方面,提供一种用户提醒方法,包括:对用户特征向量进行聚类,获得多个类簇,每个用户特征向量是根据用户的业务使用数据和账单数据确定的;计算每个类簇中用户的历史拖延信息的平均值;根据获取的历史拖延信息的第一取值范围确定一个或多个第一类簇、作为弱提醒用户,以及根据获取的历史拖延信息的第二取值范围确定一个或多个第二类簇、作为中度提醒用户;将用户特征向量输入到预先训练的分类器中,以确定强提醒用户;向用户发起用户的类型对应的提醒。
在一些实施例中,用户提醒方法还包括:对用于测试的用户特征向量进行聚类,获得多个测试类簇;计算每个测试类簇中用户的历史拖延信息的平均值;将历史拖延信息的平均值最低的、总用户数在第一预设数量范围以内的测试类簇作为第一测试类簇,并根据第一测试类簇确定第一取值范围;将第一测试类簇以外的、历史拖延信息的平均值最低的、总用户数在第二预设数量范围以内的测试类簇作为第二测试类簇,并根据第二测试类簇确定第二取值范围。
在一些实施例中,用户提醒方法还包括:采用多个聚类数量对用于测试的用户特征向量进行多次聚类,并确定每次聚类对应的聚类效果指标,聚类效果指标是根据簇的质点与簇内样本的距离确定的;根据平均畸变程度的变化趋势,确定实际聚类数,以便采用实际聚类数对用户特征向量进行聚类。
在一些实施例中,用户提醒方法还包括:对用于训练的用户特征向量进行标记,具有强提醒用户的标记的用户的历史拖延信息在第三取值范围以内,具有非强提醒用户的标记的用户的历史拖延信息不在第三取值范围以内;采用标记的用于训练的用户特征向量对分类器进行训练,分类器为决策树、随机森林、极端梯度提升算法、神经网络算法中的任意一种。
在一些实施例中,在分类器为随机森林的情况下,随机森林的最大深度为15,训练过程中的迭代次数为40。
在一些实施例中,向用户发起用户的类型对应的提醒至少包括以下一种:向弱提醒用户发送短信提醒或线上提醒;向中度提醒用户发起呼叫提醒;向强提醒用户发起短信提醒、线上提醒、呼叫提醒以及线下提醒。
在一些实施例中,采用混合属性聚类算法k-prototypes算法对用户特征向量进行聚类,获得多个类簇。
在一些实施例中,用户特征向量中的特征包括通话次数、通过时长、上网流量、点对点通信的跳数、宽带流量、ITV使用次数、出账费用、上一周期拖延时长、账单是否结清中的多个特征。
在一些实施例中,用户提醒方法还包括:对于用户特征向量中缺失特征值的特征,如果特征为预设特征,则删除缺失特征值所在的用户特征向量;否则对缺失特征值的特征进行填充。
在一些实施例中,用户提醒方法还包括:对于用户特征向量中具有异常值的特征,采用在预设范围内随机生成的值替换异常值。
根据本发明一些实施例的第二个方面,提供一种用户提醒装置,包括:聚类模块,被配置为对用户特征向量进行聚类,获得多个类簇,每个用户特征向量是根据用户的业务使用数据和账单数据确定的;计算模块,被配置为计算每个类簇中用户的历史拖延信息的平均值;第一分类模块,被配置为根据获取的历史拖延信息的第一取值范围确定一个或多个第一类簇、作为弱提醒用户,以及根据获取的历史拖延信息的第二取值范围确定一个或多个第二类簇、作为中度提醒用户;第二分类模块,被配置为将用户特征向量输入到预先训练的分类器中,以确定强提醒用户;提醒模块,被配置为向用户发起用户的类型对应的提醒。
根据本发明一些实施例的第三个方面,提供一种用户提醒装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器中的指令,执行前述任意一种用户提醒方法。
根据本发明一些实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现前述任意一种用户提醒方法。
上述发明中的一些实施例具有如下优点或有益效果:通过结合聚类和分类器分类两种方式,确定三种需要提醒的用户,并向这些用户发起相应类型的提醒,可以实现需提醒用户的自动化识别、以及自动化提醒,并且可以更合理地分配提醒资源,也提高了提醒效率。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明一些实施例的用户提醒方法的流程示意图。
图2示例性地示出了对同一个数据集合进行采用不同的聚类数进行聚类的结果。
图3示出了根据本发明一些实施例的用户提醒装置的结构示意图。
图4示出了根据本发明另一些实施例的用户提醒装置的结构示意图。
图5示出了根据本发明又一些实施例的用户提醒装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
图1示出了根据本发明一些实施例的用户提醒方法的流程示意图。如图1所示,该实施例的用户提醒方法包括步骤S102~S110。
在步骤S102中,对用户特征向量进行聚类,获得多个类簇,其中,每个用户特征向量是根据用户的业务使用数据和账单数据确定的。
在一些实施例中,用户特征向量中的特征包括通话次数、通过时长、上网流量、点对点通信的跳数、宽带流量、ITV(Interactive Television,互动电视)使用次数、出账费用、上一周期拖延时长、账单是否结清中的多个特征。
在一些实施例中,采用混合属性聚类算法k-prototypes算法对用户特征向量进行聚类。在这种情况下,用户特征向量中可以包括离散型特征值和连续型特征值。k-prototypes算法中,每个簇具有原型,对应K-means(K均值)等聚类算法的质心。原型包括簇中连续型特征值的均值,以及离散型特征值中出现频率最高的值。从而,可以支持对包含混合类型数值的用户特征向量进行聚类。
在聚类之前,可以先对数据进行预处理,以获得更好的聚类效果。
在一些实施例中,对于用户特征向量中缺失特征值的特征,如果该特征为预设特征,则删除缺失特征值所在的用户特征向量;否则对缺失特征值的特征进行填充。
在填充缺失值时,可以根据特征的类型选择相应的值。例如,对于在网时长为空、但出账费用不为零的用户数据,可以将历史数据中的月在网时长作为向量中的在网时长的值进行填充;通话次数、通话时长、上网流量、短信条数、宽带流量、ITV使用次数、出账费用为空时,可以向相应的特征中填充0。
在一些实施例中,对于用户特征向量中具有异常值的特征,采用在预设范围内随机生成的值替换异常值。
例如,在网时长高于最大年限20年的为异常值,则在10到120之间随机生成数字填充;ITV使用次数大于或等于3000的为异常值,则在100到1000内随机生成数字填充。
在一些实施例中,还可以对特征值进行标准化处理。例如,将连续型的特征值进行归一化,处理为0到1之间的数值,以通过统一量纲的形式提高分类的准确性。
通过进行预处理,可以确保后续聚类和分类流程的正常运行,提高了效率。
在步骤S104中,计算每个类簇中用户的历史拖延信息的平均值。历史拖延信息例如可以是历史欠费时长、历史欠费次数等信息。
在步骤S106中,根据获取的历史拖延信息的第一取值范围确定一个或多个第一类簇、作为弱提醒用户,以及根据获取的历史拖延信息的第二取值范围确定一个或多个第二类簇、作为中度提醒用户。
第一取值范围的最大值小于第二取值范围的最小值,即,第一类簇的用户的拖延情况要少于第二类簇的用户。例如,将历史10个账期的欠费时长≤1、且欠费次数≤3次的类簇中的用户视为欠费稳定回收用户;将历史10个账期的中,1<欠费时长≤2、欠费次数≥5的用户视为习惯性欠费且稳定回收用户。
在步骤S108中,将用户特征向量输入到预先训练的分类器中,以确定强提醒用户。在步骤S110中,向用户发起用户的类型对应的提醒。
由于聚类的用户特征向量和采用分类器分类的用户特征向量均为全量的数据,因此可能出现某一用户既为弱提醒用户、又为强提醒用户的情况,或者既为中度提醒用户、又为强提醒用户的情况。对于此类用户,可以采用强提醒用户对应的提醒方式进行提醒。
在一些实施例中,可以采用以下提醒方式中的一种或多种:向弱提醒用户发送短信提醒或线上提醒,该提醒可以周期性、常态化地发送;向中度提醒用户发起呼叫提醒,该提醒可以周期性、常态化地发送;向强提醒用户发起短信提醒、线上提醒、呼叫提醒以及线下提醒。从而,对弱提醒用户、中度提醒用户、强提醒用户的提醒力度是由弱到强的。
在一些实施例中,上述方法可以周期性地执行,例如在每月月初对用户进行分类,并在分类后自动产生提醒。
通过上述实施例,可以结合聚类和分类器分类两种方式,确定三种需要提醒的用户,并向这些用户发起相应类型的提醒。从而,可以实现需提醒用户的自动化识别、以及自动化提醒,以更合理地分配提醒资源,也提高了提醒效率。
第一取值范围和第二取值范围可以通过聚类手段预先确定。在一些实施例中,对用于测试的用户特征向量进行聚类,获得多个测试类簇;计算每个测试类簇中用户的历史拖延信息的平均值;将历史拖延信息的平均值最低的、总用户数在第一预设数量范围以内的测试类簇作为第一测试类簇,并根据第一测试类簇确定第一取值范围;将第一测试类簇以外的、历史拖延信息的平均值最低的、总用户数在第二预设数量范围以内的测试类簇作为第二测试类簇,并根据第二测试类簇确定第二取值范围。
例如,预先设定属于第一类簇的用户占比在60%左右,属于第二类簇的用户占比在30%左右,则按照历史拖延信息的平均值由低到高的顺序,依次提取测试类簇,直到提取的各个测试类簇的用户特征向量数的和为用于测试的用户特征向量总数的60%左右,将本次提取的测试类簇确定为第一测试类簇;然后,依次提取剩余的类簇,直到提取的各个测试类簇的用户特征向量数的和为用于测试的用户特征向量总数的30%左右,将本次提取的测试类簇确定为第二测试类簇。一个示例性的聚类结果如表1所示。在表1中,识别类型①表示第一测试类簇,识别类型②表示第二测试类簇。
表1
Figure BDA0002330565060000071
Figure BDA0002330565060000081
在聚类时,部分聚类算法需要设定聚类数。可以通过预先测试的方式来确定合适的聚类数。在一些实施例中,采用多个聚类数量对用于测试的用户特征向量进行多次聚类,并确定每次聚类对应的聚类效果指标,其中,聚类效果指标是根据簇的质点与簇内样本的距离确定的;根据聚类效果指标的变化趋势,确定实际聚类数,以便采用实际聚类数对用户特征向量进行聚类。
在一些实施例中个,聚类效果指标可以是平均畸变程度,这种确定方法也可以称为肘部法则(Elbow)。
对同一个数据集合进行采用不同的聚类数进行聚类的结果如图2所示。在聚类数为5、7、8处产生了较为明显的拐点,即聚类效果的变化程度大于预设程度,则可以选择其中一个聚类数作为实际聚类的个数。
从而,可以选择聚类效果更好的聚类数,使得分类结果更准确,提高了提醒效果和效率。
下面示例性地描述训练分类器的方法。
在一些实施例中,对用于训练的用户特征向量进行标记,其中,具有强提醒用户的标记的用户的历史拖延信息在第三取值范围以内,具有非强提醒用户的标记的用户的历史拖延信息不在第三取值范围以内;采用标记的用于训练的用户特征向量对分类器进行训练,其中,分类器为决策树、随机森林、极端梯度提升算法、神经网络算法中的任意一种。
例如,可以将欠费时长≥3个月的数据添加标识1、作为强提醒用户的标记,其它数据添加标识0、作为非强提醒用户的标记。
经过发明人对一些数据集的测试,基于召回率指标,随机森林算法的效果优于决策树。通过对随机森林的参数进行调优,调优范围为最大深度5~20、迭代次数20~80,最后得到的最优参数如下:最大深度为15,训练过程中的迭代次数为40。通过测试,预测准确率可以达到0.89%。
当然,本领域技术人员也可以采用其他的模型或参数,这里不再赘述。
下面参考图3描述本发明用户提醒装置的实施例。
图3示出了根据本发明一些实施例的用户提醒装置的结构示意图。如图3所示,该实施例的用户提醒装置30包括:聚类模块310,被配置为对用户特征向量进行聚类,获得多个类簇,每个用户特征向量是根据用户的业务使用数据和账单数据确定的;计算模块320,被配置为计算每个类簇中用户的历史拖延信息的平均值;第一分类模块330,被配置为根据获取的历史拖延信息的第一取值范围确定一个或多个第一类簇、作为弱提醒用户,以及根据获取的历史拖延信息的第二取值范围确定一个或多个第二类簇、作为中度提醒用户;第二分类模块340,被配置为将用户特征向量输入到预先训练的分类器中,以确定强提醒用户;提醒模块350,被配置为向用户发起用户的类型对应的提醒。
在一些实施例中,聚类模块310进一步被配置为对用于测试的用户特征向量进行聚类,获得多个测试类簇;计算每个测试类簇中用户的历史拖延信息的平均值;将历史拖延信息的平均值最低的、总用户数在第一预设数量范围以内的测试类簇作为第一测试类簇,并根据第一测试类簇确定第一取值范围;将第一测试类簇以外的、历史拖延信息的平均值最低的、总用户数在第二预设数量范围以内的测试类簇作为第二测试类簇,并根据第二测试类簇确定第二取值范围。
在一些实施例中,聚类模块310进一步被配置为采用多个聚类数量对用于测试的用户特征向量进行多次聚类,并确定每次聚类对应的聚类效果指标,聚类效果指标是根据簇的质点与簇内样本的距离确定的;根据平均畸变程度的变化趋势,确定实际聚类数,以便采用实际聚类数对用户特征向量进行聚类。
在一些实施例中,用户提醒装置30还包括:训练模块360,被配置为对用于训练的用户特征向量进行标记,具有强提醒用户的标记的用户的历史拖延信息在第三取值范围以内,具有非强提醒用户的标记的用户的历史拖延信息不在第三取值范围以内;采用标记的用于训练的用户特征向量对分类器进行训练,分类器为决策树、随机森林、极端梯度提升算法、神经网络算法中的任意一种。
在一些实施例中,在分类器为随机森林的情况下,随机森林的最大深度为15,训练过程中的迭代次数为40。
在一些实施例中,提醒模块350进一步被配置为向用户发起用户的类型对应的提醒至少包括以下一种:向弱提醒用户发送短信提醒或线上提醒;向中度提醒用户发起呼叫提醒;向强提醒用户发起短信提醒、线上提醒、呼叫提醒以及线下提醒。
在一些实施例中,聚类模块310进一步被配置为采用混合属性聚类算法k-prototypes算法对用户特征向量进行聚类,获得多个类簇。
在一些实施例中,用户特征向量中的特征包括通话次数、通过时长、上网流量、点对点通信的跳数、宽带流量、互动电视使用次数、出账费用、上一周期拖延时长、账单是否结清中的多个特征。
在一些实施例中,用户提醒装置30还包括:预处理模块370,被配置为对于用户特征向量中缺失特征值的特征,如果特征为预设特征,则删除缺失特征值所在的用户特征向量;否则对缺失特征值的特征进行填充。
在一些实施例中,用户提醒装置30还包括:预处理模块370,被配置为对于用户特征向量中具有异常值的特征,采用在预设范围内随机生成的值替换异常值。
图4示出了根据本发明另一些实施例的用户提醒装置的结构示意图。如图4所示,该实施例的用户提醒装置40包括:存储器410以及耦接至该存储器410的处理器420,处理器420被配置为基于存储在存储器410中的指令,执行前述任意一个实施例中的用户提醒方法。
其中,存储器410例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)以及其他程序等。
图5示出了根据本发明又一些实施例的用户提醒装置的结构示意图。如图5所示,该实施例的用户提醒装置50包括:存储器510以及处理器520,还可以包括输入输出接口530、网络接口540、存储接口550等。这些接口530,540,550以及存储器510和处理器520之间例如可以通过总线560连接。其中,输入输出接口530为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口540为各种联网设备提供连接接口。存储接口550为SD卡、U盘等外置存储设备提供连接接口。
本发明的实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任意一种用户提醒方法。
本领域内的技术人员应当明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种用户提醒方法,包括:
对用户特征向量进行聚类,获得多个类簇,其中,每个用户特征向量是根据用户的业务使用数据和账单数据确定的;
计算每个类簇中用户的历史拖延信息的平均值;
根据获取的历史拖延信息的第一取值范围确定一个或多个第一类簇、作为弱提醒用户,以及根据获取的历史拖延信息的第二取值范围确定一个或多个第二类簇、作为中度提醒用户;
将所述用户特征向量输入到预先训练的分类器中,以确定强提醒用户;
向用户发起用户的类型对应的提醒。
2.根据权利要求1所述的用户提醒方法,还包括:
对用于测试的用户特征向量进行聚类,获得多个测试类簇;
计算每个测试类簇中用户的历史拖延信息的平均值;
将历史拖延信息的平均值最低的、总用户数在第一预设数量范围以内的测试类簇作为第一测试类簇,并根据所述第一测试类簇确定第一取值范围;
将第一测试类簇以外的、历史拖延信息的平均值最低的、总用户数在第二预设数量范围以内的测试类簇作为第二测试类簇,并根据所述第二测试类簇确定第二取值范围。
3.根据权利要求2所述的用户提醒方法,还包括:
采用多个聚类数量对用于测试的用户特征向量进行多次聚类,并确定每次聚类对应的聚类效果指标,其中,所述聚类效果指标是根据簇的质点与簇内样本的距离确定的;
根据平均畸变程度的变化趋势,确定实际聚类数,以便采用所述实际聚类数对用户特征向量进行聚类。
4.根据权利要求2所述的用户提醒方法,还包括:
对用于训练的用户特征向量进行标记,其中,具有强提醒用户的标记的用户的历史拖延信息在第三取值范围以内,具有非强提醒用户的标记的用户的历史拖延信息不在第三取值范围以内;
采用标记的用于训练的用户特征向量对分类器进行训练,其中,所述分类器为决策树、随机森林、极端梯度提升算法、神经网络算法中的任意一种。
5.根据权利要求4所述的用户提醒方法,其中,在所述分类器为随机森林的情况下,所述随机森林的最大深度为15,训练过程中的迭代次数为40。
6.根据权利要求1所述的用户提醒方法,其中,所述向用户发起用户的类型对应的提醒至少包括以下一种:
向弱提醒用户发送短信提醒或线上提醒;
向中度提醒用户发起呼叫提醒;
向强提醒用户发起短信提醒、线上提醒、呼叫提醒以及线下提醒。
7.根据权利要求1所述的用户提醒方法,其中,采用混合属性聚类算法k-prototypes算法对用户特征向量进行聚类,获得多个类簇。
8.根据权利要求1或7所述的用户提醒方法,其中,所述用户特征向量中的特征包括通话次数、通过时长、上网流量、点对点通信的跳数、宽带流量、互动电视使用次数、出账费用、上一周期拖延时长、账单是否结清中的多个特征。
9.根据权利要求1所述的用户提醒方法,还包括:
对于用户特征向量中缺失特征值的特征,如果所述特征为预设特征,则删除所述缺失特征值所在的用户特征向量;否则对所述缺失特征值的特征进行填充。
10.根据权利要求1所述的用户提醒方法,还包括:
对于用户特征向量中具有异常值的特征,采用在预设范围内随机生成的值替换所述异常值。
11.一种用户提醒装置,包括:
聚类模块,被配置为对用户特征向量进行聚类,获得多个类簇,其中,每个用户特征向量是根据用户的业务使用数据和账单数据确定的;
计算模块,被配置为计算每个类簇中用户的历史拖延信息的平均值;
第一分类模块,被配置为根据获取的历史拖延信息的第一取值范围确定一个或多个第一类簇、作为弱提醒用户,以及根据获取的历史拖延信息的第二取值范围确定一个或多个第二类簇、作为中度提醒用户;
第二分类模块,被配置为将所述用户特征向量输入到预先训练的分类器中,以确定强提醒用户;
提醒模块,被配置为向用户发起用户的类型对应的提醒。
12.一种用户提醒装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如权利要求1~10中任一项所述的用户提醒方法。
13.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1~10中任一项所述的用户提醒方法。
CN201911334423.6A 2019-12-23 2019-12-23 用户提醒方法、装置和计算机可读存储介质 Pending CN113099057A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911334423.6A CN113099057A (zh) 2019-12-23 2019-12-23 用户提醒方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911334423.6A CN113099057A (zh) 2019-12-23 2019-12-23 用户提醒方法、装置和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN113099057A true CN113099057A (zh) 2021-07-09

Family

ID=76662941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911334423.6A Pending CN113099057A (zh) 2019-12-23 2019-12-23 用户提醒方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113099057A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114066421A (zh) * 2021-11-23 2022-02-18 深圳壹账通科技服务有限公司 基于人工智能的任务催办方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106557956A (zh) * 2016-11-29 2017-04-05 国网山东省电力公司电力科学研究院 一种关于配置客户缴费服务信息推送策略的方法
CN106776879A (zh) * 2016-11-29 2017-05-31 国网山东省电力公司电力科学研究院 一种客户缴费服务信息推送方法
WO2017101506A1 (zh) * 2015-12-14 2017-06-22 乐视控股(北京)有限公司 信息处理方法及装置
CN108712586A (zh) * 2018-04-12 2018-10-26 合肥天源迪科信息技术有限公司 一种信控提醒方法及装置
CN108830653A (zh) * 2018-06-13 2018-11-16 国网福建省电力有限公司 一种基于ai的智能催收电费方法
CN109299265A (zh) * 2018-10-15 2019-02-01 广州虎牙信息科技有限公司 潜在回流用户筛选方法、装置以及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017101506A1 (zh) * 2015-12-14 2017-06-22 乐视控股(北京)有限公司 信息处理方法及装置
CN106557956A (zh) * 2016-11-29 2017-04-05 国网山东省电力公司电力科学研究院 一种关于配置客户缴费服务信息推送策略的方法
CN106776879A (zh) * 2016-11-29 2017-05-31 国网山东省电力公司电力科学研究院 一种客户缴费服务信息推送方法
CN108712586A (zh) * 2018-04-12 2018-10-26 合肥天源迪科信息技术有限公司 一种信控提醒方法及装置
CN108830653A (zh) * 2018-06-13 2018-11-16 国网福建省电力有限公司 一种基于ai的智能催收电费方法
CN109299265A (zh) * 2018-10-15 2019-02-01 广州虎牙信息科技有限公司 潜在回流用户筛选方法、装置以及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114066421A (zh) * 2021-11-23 2022-02-18 深圳壹账通科技服务有限公司 基于人工智能的任务催办方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN106156791B (zh) 业务数据分类方法和装置
CN106649831B (zh) 一种数据过滤方法及装置
CN106294508B (zh) 一种刷量工具检测方法及装置
CN111178380B (zh) 数据分类方法、装置及电子设备
CN106951925A (zh) 数据处理方法、装置、服务器及系统
CN111144957B (zh) 信息投放方法、装置、服务器及存储介质
CN110417607A (zh) 一种流量预测方法、装置及设备
CN106919957A (zh) 处理数据的方法及装置
CN106648557A (zh) 一种应用程序编程接口api的分享方法和装置
CN108073707B (zh) 金融业务数据更新方法、装置及计算机可读取存储介质
CN111010387B (zh) 一种物联网设备非法替换检测方法、装置、设备及介质
CN110378739B (zh) 一种数据流量匹配方法及装置
CN109783381B (zh) 一种测试数据生成方法、装置及系统
CN113037510A (zh) 计费方法、装置和计算机可读存储介质
CN110807050A (zh) 性能分析方法、装置、计算机设备及存储介质
CN113099057A (zh) 用户提醒方法、装置和计算机可读存储介质
CN110414591A (zh) 一种数据处理方法以及设备
CN113111139A (zh) 一种基于物联传感器的告警检测方法和装置
CN111193631B (zh) 信息处理方法、系统和计算机可读存储介质
CN114697127B (zh) 一种基于云计算的业务会话风险处理方法及服务器
CN109697224B (zh) 一种账单消息处理方法、装置和存储介质
CN114390015A (zh) 一种基于物模型的数据推送系统、方法、设备及存储介质
CN111258874A (zh) 一种基于web数据的用户操作轨迹分析方法及装置
CN115496501A (zh) 交易金额核验方法及装置
CN108280224A (zh) 万级维度数据生成方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210709