CN113538025A - 终端设备的更换预测方法及装置 - Google Patents
终端设备的更换预测方法及装置 Download PDFInfo
- Publication number
- CN113538025A CN113538025A CN202010292162.2A CN202010292162A CN113538025A CN 113538025 A CN113538025 A CN 113538025A CN 202010292162 A CN202010292162 A CN 202010292162A CN 113538025 A CN113538025 A CN 113538025A
- Authority
- CN
- China
- Prior art keywords
- replacement
- event
- dimension
- terminal
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000008859 change Effects 0.000 claims description 44
- 238000004891 communication Methods 0.000 claims description 27
- 230000006399 behavior Effects 0.000 claims description 22
- 238000013145 classification model Methods 0.000 claims description 17
- 238000012216 screening Methods 0.000 claims description 14
- 238000012423 maintenance Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims 1
- 238000012549 training Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 6
- 238000007637 random forest analysis Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- DWDGSKGGUZPXMQ-UHFFFAOYSA-N OPPO Chemical compound OPPO DWDGSKGGUZPXMQ-UHFFFAOYSA-N 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 230000002155 anti-virotic effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000011022 operating instruction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
Abstract
本发明公开了一种终端设备的更换预测方法及装置,方法包括:获取终端设备对应于设备使用维度的第一特征数据、对应于换机时段维度的第二特征数据、以及对应于换机事件维度的第三特征数据;将所述第一特征数据、第二特征数据以及第三特征数据输入预先训练的更换预测模型;获取所述更换预测模型的输出结果,根据所述输出结果预测与所述终端设备相对应的更换事件;其中,所述更换预测模型根据样本设备对应于设备使用维度的第一样本特征数据、对应于换机时段维度的第二样本特征数据、以及对应于换机事件维度的第三样本特征数据训练得到。该方式从三个维度进行综合判断,进而准确预测换机事件,提升了预测结果的准确性。
Description
技术领域
本发明涉及互联网技术领域,具体涉及一种终端设备的更换预测方法及装置。
背景技术
终端设备包括手机终端、平板终端以及电脑终端等各种类型。通过终端设备能够联网并享受各类网络服务。因此,终端设备已成为多数用户不可或缺的网络设备。由于终端设备的使用寿命有限,因此,终端用户时常会执行终端更换操作,以便将旧的终端设备更换为新的终端设备。为了便于确定终端设备的产量,需要对终端设备的更换事件进行预测。
然而,发明人在实现本发明的过程中发现,目前的预测方式仅仅是根据用户上一次执行购机操作的时间点进行预测,从而将购机时长超出预设时长的用户确定为潜在的购机用户。然而,上述预测方式仅仅考虑了购机时长这一单一维度的信息,由于用户换机事件受到设备损耗情况、用户偏好等多种因素的影响,因此,导致现有的预测方式不够准确。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的终端设备的更换预测方法及装置。
根据本发明的一个方面,提供了一种终端设备的更换预测方法,包括:
获取终端设备对应于设备使用维度的第一特征数据、对应于换机时段维度的第二特征数据、以及对应于换机事件维度的第三特征数据;
将所述第一特征数据、第二特征数据以及第三特征数据输入预先训练的更换预测模型;
获取所述更换预测模型的输出结果,根据所述输出结果预测与所述终端设备相对应的更换事件;
其中,所述更换预测模型根据样本设备对应于设备使用维度的第一样本特征数据、对应于换机时段维度的第二样本特征数据、以及对应于换机事件维度的第三样本特征数据训练得到。
可选地,获取终端设备对应于换机时段维度的第二特征数据具体包括:
筛选与预设换机时段相对应的目标用户,获取与所述目标用户相关联的历史浏览数据;
将所述历史浏览数据与预设的换机关键词进行匹配,根据匹配结果获取终端设备对应于换机时段维度的第二特征数据。
可选地,所述筛选与预设换机时段相对应的目标用户,获取与所述目标用户相关联的历史浏览数据包括:
根据所述目标用户的用户属性数据和/或设备属性数据,判断所述目标用户是否为独立目标用户;
若是,获取所述目标用户的历史浏览数据;若否,获取与所述目标用户相对应的关联用户的历史浏览数据。
可选地,获取终端设备对应于换机事件维度的第三特征数据包括:
获取与终端设备相对应的终端用户的通信行为数据;
将所述通信行为数据与预设的维修关键词进行匹配,根据匹配结果获取终端设备对应于换机事件维度的第三特征数据。
可选地,所述获取终端设备对应于设备使用维度的第一特征数据具体包括:
获取终端设备的用户属性信息、流量信息、消费记录信息、通话记录信息、以及终端属性信息;
根据所述用户属性信息、流量信息、消费记录信息、通话记录信息、以及终端属性信息得到所述终端设备对应于设备使用维度的第一特征数据。
可选地,所述根据所述输出结果预测与所述终端设备相对应的更换事件包括:
将所述输出结果输入预设的事件预测模型,根据所述事件预测模型的输出结果预测与所述终端设备相对应的更换事件;
其中,所述更换事件包括:事件类型、事件时间;其中,所述事件类型进一步包括:换机品牌类型、和/或换机价位类型。
可选地,所述事件预测模型进一步包括:品牌预测二分类模型、以及价位预测二分类模型。
根据本发明的又一个方面,提供了一种终端设备的更换预测装置,包括:
获取模块,适于获取终端设备对应于设备使用维度的第一特征数据、对应于换机时段维度的第二特征数据、以及对应于换机事件维度的第三特征数据;
输入模块,适于将所述第一特征数据、第二特征数据以及第三特征数据输入预先训练的更换预测模型;
预测模块,适于获取所述更换预测模型的输出结果,根据所述输出结果预测与所述终端设备相对应的更换事件;
其中,所述更换预测模型根据样本设备对应于设备使用维度的第一样本特征数据、对应于换机时段维度的第二样本特征数据、以及对应于换机事件维度的第三样本特征数据训练得到。
可选地,所述获取模块具体适于:
筛选与预设换机时段相对应的目标用户,获取与所述目标用户相关联的历史浏览数据;
将所述历史浏览数据与预设的换机关键词进行匹配,根据匹配结果获取终端设备对应于换机时段维度的第二特征数据。
可选地,所述获取模块具体适于:
根据所述目标用户的用户属性数据和/或设备属性数据,判断所述目标用户是否为独立目标用户;
若是,获取所述目标用户的历史浏览数据;若否,获取与所述目标用户相对应的关联用户的历史浏览数据。
可选地,所述获取模块具体适于:
获取与终端设备相对应的终端用户的通信行为数据;
将所述通信行为数据与预设的维修关键词进行匹配,根据匹配结果获取终端设备对应于换机事件维度的第三特征数据。
可选地,所述获取模块具体适于:
获取终端设备的用户属性信息、流量信息、消费记录信息、通话记录信息、以及终端属性信息;
根据所述用户属性信息、流量信息、消费记录信息、通话记录信息、以及终端属性信息得到所述终端设备对应于设备使用维度的第一特征数据。
可选地,所述预测模块具体适于:
将所述输出结果输入预设的事件预测模型,根据所述事件预测模型的输出结果预测与所述终端设备相对应的更换事件;
其中,所述更换事件包括:事件类型、事件时间;其中,所述事件类型进一步包括:换机品牌类型、和/或换机价位类型。
可选地,所述事件预测模型进一步包括:品牌预测二分类模型、以及价位预测二分类模型。
根据本发明的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述终端设备的更换预测方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述终端设备的更换预测方法对应的操作。
在本发明所提供的终端设备的更换预测方法及装置中,能够获取终端设备对应于设备使用维度的第一特征数据、对应于换机时段维度的第二特征数据、以及对应于换机事件维度的第三特征数据,从而从三个维度进行综合判断,进而准确预测换机事件,提升了预测结果的准确性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的终端设备的更换预测方法的流程示意图;
图2示出了根据本发明另一个实施例的终端设备的更换预测方法的流程示意图;
图3示出了根据本发明又一个实施例的终端设备的更换预测装置的结构示意图;
图4示出了根据本发明的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的终端设备的更换预测方法的流程示意图,如图1所示,该方法包括:
步骤S110:获取终端设备对应于设备使用维度的第一特征数据、对应于换机时段维度的第二特征数据、以及对应于换机事件维度的第三特征数据。
其中,对应于设备使用维度的第一特征数据用于描述与终端设备的正常使用情况相关的信息,与正常换机人群相对应;对应于换机时段维度的第二特征数据用于描述与预设的换机时段相对应的信息,与固定时刻购机的人群相对应;对应于换机事件维度的第三特征数据用于描述与预设的换机事件相对应的信息,与特定的换机相关事件(如手机丢失)关联的人群相对应。
步骤S120:将第一特征数据、第二特征数据以及第三特征数据输入预先训练的更换预测模型。
其中,更换预测模型根据样本设备对应于设备使用维度的第一样本特征数据、对应于换机时段维度的第二样本特征数据、以及对应于换机事件维度的第三样本特征数据训练得到。其中,第一样本特征数据对应于第一特征数据,用于描述与样本终端设备的正常使用情况相关的信息;第二样本特征数据对应于第二特征数据,用于描述与预设的换机时段相对应的信息;第三样本特征数据对应于第三特征数据,用于描述与预设的换机事件相对应的信息。
具体地,更换预测模型根据上述三类数据训练得到,具体的模型类型以及训练方式可由本领域技术人员灵活设置,本发明对此不做限定。
步骤S130:获取更换预测模型的输出结果,根据输出结果预测与终端设备相对应的更换事件。
具体地,根据更换预测模型的输出结果,即可预测与终端设备相对应的更换事件。其中,更换事件用于指示用户更换终端的时间点、更换终端的品牌以及价位等信息。
由此可见,在本发明所提供的终端设备的更换预测方法及装置中,能够获取终端设备对应于设备使用维度的第一特征数据、对应于换机时段维度的第二特征数据、以及对应于换机事件维度的第三特征数据,从而从三个维度进行综合判断,进而准确预测换机事件,提升了预测结果的准确性。
图2示出了根据本发明另一个实施例的终端设备的更换预测方法的流程示意图。如图2所示,该方法包括:
步骤S200:根据样本设备对应于设备使用维度的第一样本特征数据、对应于换机时段维度的第二样本特征数据、以及对应于换机事件维度的第三样本特征数据训练得到更换预测模型。
步骤S210:获取终端设备对应于设备使用维度的第一特征数据、对应于换机时段维度的第二特征数据、以及对应于换机事件维度的第三特征数据。
其中,对应于设备使用维度的第一特征数据用于描述与终端设备的正常使用情况相关的信息,与正常换机人群相对应;对应于换机时段维度的第二特征数据用于描述与预设的换机时段相对应的信息,与固定时刻购机的人群相对应;对应于换机事件维度的第三特征数据用于描述与预设的换机事件相对应的信息,与特定的换机相关事件(如手机丢失)关联的人群相对应。
具体实施时,通过以下方式获取上述的特征数据:
首先,在获取终端设备对应于换机时段维度的第二特征数据时,通过以下方式实现:筛选与预设换机时段相对应的目标用户,获取与目标用户相关联的历史浏览数据;将历史浏览数据与预设的换机关键词进行匹配,根据匹配结果获取终端设备对应于换机时段维度的第二特征数据。其中,预设换机时段包括:毕业生所对应的毕业时段、各个节假日所对应的节日时段、用户生日所对应的生日时段等。由于特殊时段的换机需求量较大,因此,预先设置多个换机时段,以挖掘预设换机时段的换机需求。相应的,与预设换机时段相对应的目标用户是指处于毕业时段、节日时段或生日时段的特定用户,如毕业生、过生日的寿星等。与目标用户相关联的历史浏览数据包括用户通过各类网站或搜索引擎输入的搜索词、浏览的内容等。预设的换机关键词包括:与换机行为相关联的词汇,如包含手机品牌的搜索词等。其中,在筛选与预设换机时段相对应的目标用户,获取与目标用户相关联的历史浏览数据时,进一步通过以下方式实现:根据目标用户的用户属性数据和/或设备属性数据,判断目标用户是否为独立目标用户;若是,获取目标用户的历史浏览数据;若否,获取与目标用户相对应的关联用户的历史浏览数据。
其次,在获取终端设备对应于换机事件维度的第三特征数据时,通过以下方式实现:获取与终端设备相对应的终端用户的通信行为数据;将通信行为数据与预设的维修关键词进行匹配,根据匹配结果获取终端设备对应于换机事件维度的第三特征数据。其中,通信行为数据泛指用户通过电话、微信、短信、网页等各种方式产生的数据,如拨打维修电话产生的通话数据、浏览维修网站产生的浏览数据等。预设的维修关键词包括:维修、更换等各类词汇,用以指示终端设备需要维修。
再次,在获取终端设备对应于设备使用维度的第一特征数据时,具体通过以下方式实现:获取终端设备的用户属性信息、流量信息、消费记录信息、通话记录信息、以及终端属性信息;根据用户属性信息、流量信息、消费记录信息、通话记录信息、以及终端属性信息得到终端设备对应于设备使用维度的第一特征数据。总之,第一特征数据泛指各类与终端设备的正常使用行为相关的数据。
步骤S220:将第一特征数据、第二特征数据以及第三特征数据输入预先训练的更换预测模型。
其中,更换预测模型根据样本设备对应于设备使用维度的第一样本特征数据、对应于换机时段维度的第二样本特征数据、以及对应于换机事件维度的第三样本特征数据训练得到。其中,第一样本特征数据对应于第一特征数据,用于描述与样本终端设备的正常使用情况相关的信息;第二样本特征数据对应于第二特征数据,用于描述与预设的换机时段相对应的信息;第三样本特征数据对应于第三特征数据,用于描述与预设的换机事件相对应的信息。
具体地,更换预测模型根据上述三类数据训练得到,具体的模型类型以及训练方式可由本领域技术人员灵活设置,本发明对此不做限定。
步骤S230:获取更换预测模型的输出结果,根据输出结果预测与终端设备相对应的更换事件。
具体地,根据更换预测模型的输出结果,即可预测与终端设备相对应的更换事件。其中,更换事件用于指示用户更换终端的时间点、更换终端的品牌以及价位等信息。
具体实施时,将输出结果进一步输入预设的事件预测模型,根据事件预测模型的输出结果预测与终端设备相对应的更换事件;其中,更换事件包括:事件类型、事件时间;其中,事件类型进一步包括:换机品牌类型、和/或换机价位类型。其中,事件预测模型进一步包括:品牌预测二分类模型、以及价位预测二分类模型。通过事件预测模型能够进一步预测换机的品牌或价位等信息。
为了便于理解,下面以一个具体示例为例详细阐述本实施例的具体实现细节:
在一种可选的潜在换机用户的识别方式中,通过以下方式实现潜在的换机用户:首先,获取待预测用户的特征信息,包括基本信息、用机信息、行为信息、消费信息和流量信息,将特征信息分别输入到T个预测模型中,预测得到T个预测结果,根据T个预测结果,获取待预测用户的终端更换周期。然后,将用户数据样本的各个特征维度进行预处理,主要特征包括年龄、性别、收入、流量、城市和IMEI。根据处理后的用户数据样本以及机器学习分类模型的评价指标,从至少一个机器学习分类模型中选取一个机器学习分类模型作为预测模型;根据用户数据和预测模型,得到用户数据对应的用户的换机频率。发明人在实现本发明的过程中,发现上述方式至少存在如下缺陷:首先,仅预测当前有手机且正常使用用户的换机周期,未考虑到因手机丢失或损坏等情况而产生临时换机需求的用户,以及初高中毕业生或职场新人在暑假等特定时期有新增购机需求的用户,潜在用户覆盖不全,影响识别及后续推送效果。其次,仅根据用户基本信息、用机信息、行为信息、消费信息和流量信息等指标进行预测,缺少用户主动访问行为数据,例如上网信息、关键字搜索等,影响对潜在换机用户识别的准确率。再次,只使用用户方面数据,缺乏终端品牌、机型、价位等终端信息,因此仅能预测用户可能更换终端的时间窗口,不能对用户的潜在换机品牌、机型以及价位等作出预测,不利于向用户推荐合适的终端产品,推送准确率不高。
为了解决上述问题,在本实施例中,基于运营商大数据技术,融合用户基础信息、流量使用情况、消费情况、通话情况、终端使用信息、上网行为等运营商内部数据与通过数据获取技术获取的终端基础信息等外部数据,将潜在换机或购机人群进行细分,建立终端换机用户预测模型、潜在换机品牌以及价位预测模型,以便全面准确定位目标人群,为潜在目标客户推送合适的终端产品,提升推送准确率。具体地,本实施例提出一种潜在终端换机用户与换机品牌、价位的识别方法,首先建立终端换机用户预测模型(即上述的更换预测模型),洞察换机用户的终端特征、行为特征等,识别潜在终端换机的用户,然后基于换机用户的基础信息、终端信息、上网行为以及品牌偏好、终端价位偏好、换机迁移路径等多维度数据,分别建立终端换机品牌预测模型(即上述的品牌预测二分类模型)与终端换机价位预测模型(即上述的价位预测二分类模型)。
具体实现细节如下:
(一)潜在终端换机用户识别:
总体思路:首先将潜在换机人群划分为3类人群,分别为正常换机需求人群、固定时刻购机重点人群、换机相关事件响应人群,具体定义如下:
针对正常换机需求人群采用挖掘模型进行识别,总体思路为:首先确定基础目标用户群,即正常在网用户剔除非手机用户。从用户基础信息、流量信息、消费信息、通话信息、终端信息、上网信息等多维度数据,绝对值与相对值两个角度进行特征设计和筛选,最终运用多个挖掘模型进行预测并对比结果准确性,进而识别潜在换机人群。具体识别思路如下:针对正常换机需求人群,重点考虑接近平均终端使用时长或接近终端使用寿命等正常换机行为用户;针对固定时刻换机人群,重点考虑初高中毕业生或职场新人在暑假期间有换机倾向用户;针对换机相关事件响应人群,重点考虑手机临时坏了或者丢失的用户。正常换机需求人群的相应特征对应于上述的第一特征数据。
具体地,针对正常换机需求人群的识别方式具体包括以下步骤:
步骤一,正负样本标注:根据近期是否换新机标注正负样本;
步骤二,变量设计:具体需要收集以下信息:基础信息、流量信息、消费信息、通话信息、终端信息、上网信息;并且,需要进一步收集绝对指标以及绝对指标与相对指标的结合;
步骤三,变量筛选:通过随机森林确定各个变量的重要性,从而筛选重要变量;
步骤四,特征输入:将基本信息特征、流量信息特征、消费信息特征、通话信息特征、终端信息特征、上网信息特征输入;
步骤五,构建模型:根据Random Forest(随机森林)、LightGBM、和/或Stacking进行模型训练,并根据命中率、覆盖率和/或Lift等指标进行模型评估;
步骤六,模型输出:确定模型输出结果,即用户正常换机概率。
其中,针对固定时刻购机重点人群,识别方式为:首先校讯通或校园虚拟网等确认目标用户为初高中以及大学毕业生,针对毕业生是否有手机分为两种识别模式,第一种为当前无手机但潜在购机毕业生,主要通过家长(即目标用户的关联用户)是否存在购机相关关键词、URL等访问行为,判断是否为学生购买手机;第二种为当前有手机但潜在换机毕业生,主要通过学生本人是否存在购机相关关键词、URL等访问行为,判断是否要换新机。具体实施时,先从用户中筛选出属于毕业生的预设用户,然后判断预设用户是否具有手机,若有,则获取学生本人的搜索手机相关关键词或网站,并根据搜索内容判断是否将该学生确定为固定时刻购机的重点人群;若没有,则获取学生家长的搜索手机相关关键词或网站并在判断家长本人的正常换机偏好较低时,将该学生确定为固定时刻购机的重点人群。固定时刻购机重点人群的相应特征对应于上述的第二特征数据。
另外,针对换机相关事件响应人群进行识别,主要是识别用户手机是否临时坏掉或者丢失,具体识别方法如下:通过用户上网搜索手机维修相关关键词或拨打手机维修相关电话的行为来识别手机坏掉的用户,另外,将更换手机为旧版手机、常用手机一段时间内处于关机状态,和/或新手机对应号码以及对应交往圈均不在用户交往圈中的用户确定为手机丢失用户。换机相关事件响应人群的相应特征对应于上述的第三特征数据。
最后,在识别出换机相关事件响应人群之后,需要进一步识别终端换机品牌和/或换机价位。具体识别时,首先根据用户换机前后的终端品牌和/或价位分析热点品牌和/或价位以及更换路径,并以此作为依据将品牌和/或价位多分类模型转换为多个二分类模型,其中用户换机品牌构建6个二分类模型,用户换机价位构建3个二分类模型。二分类模型的构建构成为:根据用户的基础信息、消费信息、终端历史使用信息、上网信息等移动内部数据与外部获取的终端基础信息结合,运用二分类挖掘模型分别预测用户更换各个品牌与价位的概率。
具体实施时,可通过如下方式实现:
首先,根据用户终端使用情况筛选热门终端品牌并划分为苹果、华为、步步高、OPPO、小米以及其他,将终端价位划分为低(0-2000)、中(2000-5000)、高(5000以上),以此为依据构建9个二分类模型,如预测用户换机品牌构建的模型有:用户换机品牌细分_是否换苹果机、用户换机品牌细分_是否换华为机、用户换机品牌细分_是否换步步高、用户换机品牌细分_是否换OPPO、用户换机品牌细分_是否换小米、用户换机品牌细分_是否换其他品牌;预测用户换机价位构建的模型有:用户换机价格细分_是否换低端机、用户换机价格细分_是否换中端机、用户换机价格细分_是否换高端机等。
然后,确定正负样本:根据换机用户更换的终端品牌或终端价位确定各二分类模型的正样本,负样本则为换机用户中未更换指定终端品牌或终端价位的用户,以用户换机品牌细分_是否换苹果机为例,其正样本为换机用户中换机后终端品牌为苹果机的用户,负样本为换机用户中换机后终端品牌为非苹果机的用户
接下来,进行变量设计:主要融合外部数据以及内部数据,外部数据主要为用户使用终端的基础信息(如终端厂家名字、具体型号、主屏大小、上市价格、电池容量、是否为智能机、ROM容量、上市时间等),内部数据主要为用户的基础信息(如年龄、性别、在网时长、收入水平等)、消费信息(近三月的话费情况与话费变动情况、以及用户近三月通话情况与通话变动情况)、流量信息(近三月的上网流量以及流量使用变动情况)、上网信息(关键词搜索情况、各类型APP使用情况如杀毒类、游戏类等)、终端使用信息(当前终端使用品牌、当前终端使用时长、历史使用终端平均价格、历史使用终端平均时长、当前终端使用时长率、历史偏好品牌、历史换机次数、历史使用品牌个数、用户历史偏好品牌换终端率等。
当变量设计完成后,执行变量筛选操作,经筛选后,得到终端换机品牌细分的显著性特征,并作为模型的输入参数。同理,经筛选后,得到终端换机价格细分的显著性特征,并作为模型的输入参数。其中,终端换机品牌细分的显著性特征以及终端换机价格细分的显著性特征的具体数量和名称可根据实际业务场景灵活设定,本发明对此不做限定。
最后,进行模型构建与预测:使用上述变量,作为模型输入特征,并使用随机森林与Light GBM模型作为基分类器,构建Stacking,完成模型训练,并针对全量用户进行预测。
例如,在一个具体示例中,针对用户更换品牌和/或价位的预测方式具体包括以下步骤:
步骤一,正负样本标注:根据近期换机用户更换终端品牌和/或价位来标注正负样本;
步骤二,变量设计:具体需要收集以下信息:终端基础信息、用户基础信息、消费信息、终端使用信息、流量信息、上网信息;其中,终端基础信息作为外部数据、其余信息作为内部数据,总之,需要同时收集外部数据以及内部数据,用以反映终端以及用户的双重信息;
步骤三,变量筛选:通过随机森林确定各个变量的重要性,从而筛选重要变量;
步骤四,特征输入:将终端基础信息特征、用户基础信息特征、流量信息特征、消费信息特征、终端使用信息特征、上网信息特征输入;
步骤五,构建模型:根据Random Forest(随机森林)、LightGBM、和/或Stacking进行模型训练,并根据命中率、覆盖率和/或Lift等指标进行模型评估;
步骤六,模型输出:确定模型输出结果,即用户终端更换为某品牌和/或价位的概率。
综上可知,本实施例能够针对购机或者换机人群进行细分,并利用用户基础信息、流量情况、消费情况、通话情况、终端使用信息、上网信息等内部数据与通过外部数据库获取的终端基础信息等外部数据(包括搜索数据库获取的搜索记录等),借助大数据挖掘技术准确识别潜在终端换机用户,覆盖目标客户人群范围更全面,识别准确率更高。并且,在识别潜在终端换机用户基础上,基于热门品牌和价位以及用户换机品牌和价位的更换路径等,建立用户换机品牌以及价位预测模型,识别用户倾向品牌和价位,以准确推送终端产品,提升推送准确率。
图3示出了根据本发明又一个实施例的终端设备的更换预测装置的结构示意图,如图3所示,该系统包括:
获取模块31,适于获取终端设备对应于设备使用维度的第一特征数据、对应于换机时段维度的第二特征数据、以及对应于换机事件维度的第三特征数据;
输入模块32,适于将所述第一特征数据、第二特征数据以及第三特征数据输入预先训练的更换预测模型;
预测模块33,适于获取所述更换预测模型的输出结果,根据所述输出结果预测与所述终端设备相对应的更换事件;
其中,所述更换预测模型根据样本设备对应于设备使用维度的第一样本特征数据、对应于换机时段维度的第二样本特征数据、以及对应于换机事件维度的第三样本特征数据训练得到。
可选地,所述获取模块具体适于:
筛选与预设换机时段相对应的目标用户,获取与所述目标用户相关联的历史浏览数据;
将所述历史浏览数据与预设的换机关键词进行匹配,根据匹配结果获取终端设备对应于换机时段维度的第二特征数据。
可选地,所述获取模块具体适于:
根据所述目标用户的用户属性数据和/或设备属性数据,判断所述目标用户是否为独立目标用户;
若是,获取所述目标用户的历史浏览数据;若否,获取与所述目标用户相对应的关联用户的历史浏览数据。
可选地,所述获取模块具体适于:
获取与终端设备相对应的终端用户的通信行为数据;
将所述通信行为数据与预设的维修关键词进行匹配,根据匹配结果获取终端设备对应于换机事件维度的第三特征数据。
可选地,所述获取模块具体适于:
获取终端设备的用户属性信息、流量信息、消费记录信息、通话记录信息、以及终端属性信息;
根据所述用户属性信息、流量信息、消费记录信息、通话记录信息、以及终端属性信息得到所述终端设备对应于设备使用维度的第一特征数据。
可选地,所述预测模块具体适于:
将所述输出结果输入预设的事件预测模型,根据所述事件预测模型的输出结果预测与所述终端设备相对应的更换事件;
其中,所述更换事件包括:事件类型、事件时间;其中,所述事件类型进一步包括:换机品牌类型、和/或换机价位类型。
可选地,所述事件预测模型进一步包括:品牌预测二分类模型、以及价位预测二分类模型。
上述各个模块的具体结构和工作原理可参照方法实施例中相应步骤的描述,此处不再赘述。
本申请实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的终端设备的更换预测方法。
图4示出了根据本发明实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图4所示,该电子设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:
处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器402,用于执行程序410,具体可以执行上述域名解析方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行上述方法实施例中的各项操作。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的电子设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种终端设备的更换预测方法,包括:
获取终端设备对应于设备使用维度的第一特征数据、对应于换机时段维度的第二特征数据、以及对应于换机事件维度的第三特征数据;
将所述第一特征数据、第二特征数据以及第三特征数据输入预先训练的更换预测模型;
获取所述更换预测模型的输出结果,根据所述输出结果预测与所述终端设备相对应的更换事件;
其中,所述更换预测模型根据样本设备对应于设备使用维度的第一样本特征数据、对应于换机时段维度的第二样本特征数据、以及对应于换机事件维度的第三样本特征数据训练得到。
2.根据权利要求1所述的方法,其中,获取终端设备对应于换机时段维度的第二特征数据具体包括:
筛选与预设换机时段相对应的目标用户,获取与所述目标用户相关联的历史浏览数据;
将所述历史浏览数据与预设的换机关键词进行匹配,根据匹配结果获取终端设备对应于换机时段维度的第二特征数据。
3.根据权利要求2所述的方法,其中,所述筛选与预设换机时段相对应的目标用户,获取与所述目标用户相关联的历史浏览数据包括:
根据所述目标用户的用户属性数据和/或设备属性数据,判断所述目标用户是否为独立目标用户;
若是,获取所述目标用户的历史浏览数据;若否,获取与所述目标用户相对应的关联用户的历史浏览数据。
4.根据权利要求1-3任一所述的方法,其中,获取终端设备对应于换机事件维度的第三特征数据包括:
获取与终端设备相对应的终端用户的通信行为数据;
将所述通信行为数据与预设的维修关键词进行匹配,根据匹配结果获取终端设备对应于换机事件维度的第三特征数据。
5.根据权利要求1所述的方法,其中,所述获取终端设备对应于设备使用维度的第一特征数据具体包括:
获取终端设备的用户属性信息、流量信息、消费记录信息、通话记录信息、以及终端属性信息;
根据所述用户属性信息、流量信息、消费记录信息、通话记录信息、以及终端属性信息得到所述终端设备对应于设备使用维度的第一特征数据。
6.根据权利要求1所述的方法,其中,所述根据所述输出结果预测与所述终端设备相对应的更换事件包括:
将所述输出结果输入预设的事件预测模型,根据所述事件预测模型的输出结果预测与所述终端设备相对应的更换事件;
其中,所述更换事件包括:事件类型、事件时间;其中,所述事件类型进一步包括:换机品牌类型、和/或换机价位类型。
7.根据权利要求6所述的方法,其中,所述事件预测模型进一步包括:品牌预测二分类模型、以及价位预测二分类模型。
8.一种终端设备的更换预测装置,包括:
获取模块,适于获取终端设备对应于设备使用维度的第一特征数据、对应于换机时段维度的第二特征数据、以及对应于换机事件维度的第三特征数据;
输入模块,适于将所述第一特征数据、第二特征数据以及第三特征数据输入预先训练的更换预测模型;
预测模块,适于获取所述更换预测模型的输出结果,根据所述输出结果预测与所述终端设备相对应的更换事件;
其中,所述更换预测模型根据样本设备对应于设备使用维度的第一样本特征数据、对应于换机时段维度的第二样本特征数据、以及对应于换机事件维度的第三样本特征数据训练得到。
9.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的终端设备的更换预测方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的终端设备的更换预测方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010292162.2A CN113538025B (zh) | 2020-04-14 | 2020-04-14 | 终端设备的更换预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010292162.2A CN113538025B (zh) | 2020-04-14 | 2020-04-14 | 终端设备的更换预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113538025A true CN113538025A (zh) | 2021-10-22 |
CN113538025B CN113538025B (zh) | 2024-03-22 |
Family
ID=78088100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010292162.2A Active CN113538025B (zh) | 2020-04-14 | 2020-04-14 | 终端设备的更换预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113538025B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010032109A1 (en) * | 2000-04-13 | 2001-10-18 | Gonyea Richard Jeremiah | System and method for predicting a maintenance schedule and costs for performing future service events of a product |
CN105488697A (zh) * | 2015-12-09 | 2016-04-13 | 焦点科技股份有限公司 | 一种基于客户行为特征的潜在客户挖掘方法 |
CN106845731A (zh) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | 一种基于多模型融合的潜在换机用户发现方法 |
US20180089737A1 (en) * | 2016-09-23 | 2018-03-29 | Wal-Mart Stores, Inc. | Systems and methods for predicting user segments in real-time |
CN108846695A (zh) * | 2018-06-07 | 2018-11-20 | 中国联合网络通信集团有限公司 | 终端更换周期的预测方法及装置 |
CN108960922A (zh) * | 2018-07-09 | 2018-12-07 | 中国联合网络通信集团有限公司 | 终端的更换预测方法及装置 |
CN109583949A (zh) * | 2018-11-22 | 2019-04-05 | 中国联合网络通信集团有限公司 | 一种用户换机预测方法及系统 |
-
2020
- 2020-04-14 CN CN202010292162.2A patent/CN113538025B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010032109A1 (en) * | 2000-04-13 | 2001-10-18 | Gonyea Richard Jeremiah | System and method for predicting a maintenance schedule and costs for performing future service events of a product |
CN105488697A (zh) * | 2015-12-09 | 2016-04-13 | 焦点科技股份有限公司 | 一种基于客户行为特征的潜在客户挖掘方法 |
US20180089737A1 (en) * | 2016-09-23 | 2018-03-29 | Wal-Mart Stores, Inc. | Systems and methods for predicting user segments in real-time |
CN106845731A (zh) * | 2017-02-20 | 2017-06-13 | 重庆邮电大学 | 一种基于多模型融合的潜在换机用户发现方法 |
CN108846695A (zh) * | 2018-06-07 | 2018-11-20 | 中国联合网络通信集团有限公司 | 终端更换周期的预测方法及装置 |
CN108960922A (zh) * | 2018-07-09 | 2018-12-07 | 中国联合网络通信集团有限公司 | 终端的更换预测方法及装置 |
CN109583949A (zh) * | 2018-11-22 | 2019-04-05 | 中国联合网络通信集团有限公司 | 一种用户换机预测方法及系统 |
Non-Patent Citations (2)
Title |
---|
赵文 等: ""数据挖掘技术在高校网络运维管理中的应用研究"", 《电脑与电信》, no. 07, pages 68 - 71 * |
陆伟 等: ""设备预测维修管理模型及其关键技术研究"", 《装备制造技术》, no. 12, pages 138 - 140 * |
Also Published As
Publication number | Publication date |
---|---|
CN113538025B (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10915706B2 (en) | Sorting text report categories | |
CN111538907B (zh) | 一种对象推荐方法、系统及装置 | |
CN110516173B (zh) | 一种非法网站识别方法、装置、设备及介质 | |
CN108230113A (zh) | 用户画像生成方法、装置、设备及可读存储介质 | |
CN111738785A (zh) | 选品方法、系统及存储介质 | |
CN105306495A (zh) | 用户识别方法和装置 | |
CN111090822A (zh) | 业务对象的推送方法及装置 | |
CN111191133A (zh) | 业务搜索处理方法、装置及设备 | |
CN108121741B (zh) | 网站质量评估方法及装置 | |
CN112508638A (zh) | 数据处理的方法、装置及计算机设备 | |
CN112464106B (zh) | 对象推荐方法及装置 | |
CN113434746A (zh) | 基于用户标签的数据处理方法、终端设备及存储介质 | |
CN111383072A (zh) | 一种用户信用评分方法、存储介质及服务器 | |
CN113538025B (zh) | 终端设备的更换预测方法及装置 | |
CN114258662A (zh) | 用户行为数据处理方法、装置、服务器及存储介质 | |
CN108460475A (zh) | 基于学生上网行为的贫困生预测方法和装置 | |
CN111859154B (zh) | 一种应用推荐方法及装置 | |
CN111522747B (zh) | 一种应用程序的处理方法、装置、设备及介质 | |
KR102286661B1 (ko) | 채팅을 기반으로 한 주문형 쇼핑 큐레이션 장치 | |
CN113868481A (zh) | 组件获取方法、装置及电子设备和存储介质 | |
CN112487277B (zh) | 数据分配方法、装置、可读存储介质和电子设备 | |
CN114492584A (zh) | 一种针对安卓中文应用市场的自动内容分级方法 | |
CN115146148A (zh) | 一种推荐内容数据的方法及装置 | |
CN113297358A (zh) | 数据处理方法、装置、服务器和计算机可读存储介质 | |
CN110648222A (zh) | 一种基于运营商数据识别大学生网贷风险的分析方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |