CN114339859B - 识别全屋无线网络WiFi潜在用户的方法、装置及电子设备 - Google Patents

识别全屋无线网络WiFi潜在用户的方法、装置及电子设备 Download PDF

Info

Publication number
CN114339859B
CN114339859B CN202011032976.9A CN202011032976A CN114339859B CN 114339859 B CN114339859 B CN 114339859B CN 202011032976 A CN202011032976 A CN 202011032976A CN 114339859 B CN114339859 B CN 114339859B
Authority
CN
China
Prior art keywords
sub
index
user
sample
full
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011032976.9A
Other languages
English (en)
Other versions
CN114339859A (zh
Inventor
戴莹莹
谭丽丽
张晓川
邓逸斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Guangdong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Guangdong Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202011032976.9A priority Critical patent/CN114339859B/zh
Publication of CN114339859A publication Critical patent/CN114339859A/zh
Application granted granted Critical
Publication of CN114339859B publication Critical patent/CN114339859B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种识别全屋无线网络WiFi潜在用户的方法、装置及电子设备,以提高对全屋WiFi潜在用户的识别结果的稳定性和准确率。所述方法包括:获取目标用户对应于多个指定指标的指标数据,所述多个指定指标至少包括网络使用行为参数、组网硬件参数及居住环境参数;基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户,其中,所述分类模型是基于样本用户对应于所述多个指定指标的指标数据以及指示所述样本用户是否为全屋WiFi用户的标签所训练得到的。

Description

识别全屋无线网络WiFi潜在用户的方法、装置及电子设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种识别全屋无线网络WiFi潜在用户的方法、装置及电子设备。
背景技术
随着经济的不断增长,家庭宽带用户不断增多,家庭带宽业务及其配套的配套的全屋WiFi(Wireless Fidelity,无线网络)服务等全产业链的数字家庭市场具有广阔的增长空间。
基于数字家庭市场的开拓需要,对全屋WiFi潜在用户的识别是重点之一。现有技术中对全屋WiFi用户的识别方案,主要是通过对用户的通信行为数据进行分析,来识别用户是否为全屋WiFi潜在用户。然而,这种方法的识别依据较为单一,因而得到的识别结果的稳定性和准确率不高。
发明内容
本申请实施例提供一种识别全屋无线网络WiFi潜在用户的方法、装置及电子设备,以提高对全屋WiFi潜在用户的识别结果的稳定性和准确率。
为了解决上述技术问题,本申请实施例采用下述技术方案:
第一方面,本申请实施例提供一种识别全屋无线WiFi潜在用户的方法,包括:
获取目标用户对应于多个指定指标的指标数据,所述多个指定指标至少包括网络使用行为参数、组网硬件参数及居住环境参数;
基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户,其中,所述分类模型是基于样本用户对应于所述多个指定指标的指标数据以及指示所述样本用户是否为全屋WiFi用户的标签所训练得到的。
可选地,所述分类模型包括多个分类子模型,所述多个分类子模型是基于多个不同的分类算法对所述样本用户对应于所述多个指定指标的指标数据及对应的标签训练所得到的;
基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户,包括:
将所述目标用户对应于多个指定指标的指标数据分别输入各个分类子模型,以得到各个所述分类子模型输出的识别结果,所述识别结果用于指示所述目标用户是否为全屋WiFi潜在用户;
基于各个分类子模型输出的识别结果,确定所述目标用户是否为全屋WiFi潜在用户。
可选地,在基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户之前,所述方法还包括:
获取样本用户集内各个样本用户对应于所述多个指定指标的指标数据,其中,所述样本用户集包括已确认为全屋WiFi用户的样本用户和已确认为非全屋WiFi用户的样本用户;
对所述样本用户对应于所述多个指定指标的指标数据进行筛选;
将筛选后的所述样本用户对应于所述多个指定指标的指标数据作为分类模型的输入,将指示所述样本用户是否为全屋WiFi用户的标签作为所述分类模型的输出,基于设定的分类算法进行训练,得到所述分类模型。
可选地,对所述样本用户对应于所述多个指定指标的指标数据进行筛选,包括:
对于每一指定指标,基于所述样本用户集内各个样本用户对应于所述指定指标下各个子指标的指标数据,确定各个所述子指标的信息值IV及任意两个子指标组成的子指标对的相关系数;
从所述指定指标中选取相关系数超过第一设定值的子指标对;
从筛选出的子指标对中选取IV较高的子指标,作为所述目标子指标;
从所述样本用户对应于所述指定指标的指标数据中,筛选出所述样本用户对应于所述目标子指标的指标数据。
可选地,对于每一指定指标,基于所述样本用户集内各个样本用户对应于所述指定指标下各个子指标的指标数据,确定各个所述子指标的信息值IV,包括:
对于每一子指标,基于所述样本用户集中各个样本用户对应于所述子指标的指标数据,对所述子指标进行分箱处理,得到多个分箱;
将已确认为全屋WiFi用户的样本用户作为正样本、将已确认为非全屋WiFi用户的样本用户作为负样本,对于每一分箱,基于所述分箱对应的正样本的数量和负样本的数量,确定所述分箱的证据重量WOE以及正负样本占比的差值;
基于所述分箱的WOE及正负样本占比的差值,确定所述分箱的IV;
基于所述子指标中各分箱的IV,确定所述子指标的IV。
可选地,所述分类算法包括以下算法中的一个或多个的组合:随机森林算法、逻辑回归算法、梯度提升树算法。
第二方面,本申请实施例提供一种识别全屋无线WiFi潜在用户的装置,包括:
第一获取模块,用于获取目标用户对应于多个指定指标的指标数据,所述多个指定指标至少包括网络使用行为参数、组网硬件参数及居住环境参数;
识别模块,用于基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户,其中,所述分类模型是基于样本用户对应于所述多个指定指标的指标数据以及指示所述样本用户是否为全屋WiFi用户的标签所训练得到的。
可选地,所述分类模型包括多个分类子模型,所述多个分类子模型是基于多个不同的分类算法对所述样本用户对应于所述多个指定指标的指标数据及对应的标签训练所得到的;
所述识别模块具体用于:
将所述目标用户对应于多个指定指标的指标数据分别输入各个分类子模型,以得到各个所述分类子模型输出的识别结果,所述识别结果用于指示所述目标用户是否为全屋WiFi潜在用户;
基于各个分类子模型输出的识别结果,确定所述目标用户是否为全屋WiFi潜在用户。
可选地,所述装置还包括:
第二获取模块,用于在所述识别模块基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户之前,获取样本用户集内各个样本用户对应于所述多个指定指标的指标数据,其中,所述样本用户集包括已确认为全屋WiFi用户的样本用户和已确认为非全屋WiFi用户的样本用户;
筛选模块,用于对所述样本用户对应于所述多个指定指标的指标数据进行筛选;
模型训练模块,用于将筛选后的所述样本用户对应于所述多个指定指标的指标数据作为分类模型的输入,将指示所述样本用户是否为全屋WiFi用户的标签作为所述分类模型的输出,基于设定的分类算法进行训练,得到所述分类模型。
可选地,所述筛选模块具体用于:
对于每一指定指标,基于所述样本用户集内各个样本用户对应于所述指定指标下各个子指标的指标数据,确定各个所述子指标的信息值IV及任意两个子指标组成的子指标对的相关系数;
从所述指定指标中选取相关系数超过第一设定值的子指标对;
从筛选出的子指标对中选取IV较高的子指标,作为所述目标子指标;
从所述样本用户对应于所述指定指标的指标数据中,筛选出所述样本用户对应于所述目标子指标的指标数据。
可选地,所述筛选模块具体用于:
对于每一子指标,基于所述样本用户集中各个样本用户对应于所述子指标的指标数据,对所述子指标进行分箱处理,得到多个分箱;
将已确认为全屋WiFi用户的样本用户作为正样本、将已确认为非全屋WiFi用户的样本用户作为负样本,对于每一分箱,基于所述分箱对应的正样本的数量和负样本的数量,确定所述分箱的证据重量WOE以及正负样本占比的差值;
基于所述分箱的WOE及正负样本占比的差值,确定所述分箱的IV;
基于所述子指标中各分箱的IV,确定所述子指标的IV。
可选地,所述分类算法包括以下算法中的一个或多个的组合:随机森林算法、逻辑回归算法、梯度提升树算法。
第三方面,本申请实施例提供一种电子设备,其特征在于,包括:处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现第一方面所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行第一方面所述的方法。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过本申请实施例提供的识别全屋WiFi潜在用户的方法,在识别全屋WiFi潜在用户时,同时考虑了包括用户的网络使用行为参数、组网硬件参数及居住环境参数在内的多个指定指标,这些指标能够客观、准确地反映用户对于现有家庭宽带网络的使用情况,影响用户对全屋WiFi的使用需求,因此基于用户对应于这些指标的指标数据和设定的分类模型进行识别,相较于依据单一的用户通信行为数据进行识别的方式,得到的识别结果的准确率和稳定性更高。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种识别全屋无线网络WiFi潜在用户的方法的流程图;
图2为本申请实施例提供的一种识别全屋无线网络WiFi潜在用户的方法的流程示意图;
图3为本申请实施例提供的一种对分类模型的训练方法的流程图;
图4为本申请实施例提供的另一种对分类模型的训练方法的流程图;
图5为本申请实施例提供的一种电子设备的结构示意图;
图6为本申请实施例提供的一种识别全屋无线网络WiFi潜在用户的装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
请参见图1,本申请实施例提供一种识别全屋无线网络WiFi潜在用户的方法,如图1所示,该方法包括以下步骤:
S12,获取目标用户对应于多个指定指标的指标数据。
其中,目标用户是指待识别任意用户。多个指定指标至少包括网络使用行为参数、组网硬件参数及居住环境参数。
其中,网络使用行为参数是指表征用户对网络使用行为的参数,具体包括但不限于流量带宽参数和投诉类型参数。流量带宽参数具体可以包括但不限于宽带生效时间、宽带速率、宽带续费周期、宽带流量、宽带在网时长、宽带登录次数、游戏流量、视频流量等,其反映了用户的网络需求,具体来说,若用户对网络的需求越高,则用户成为全屋WiFi潜在用户的概率越大。投诉类型参数反映了其可以包括但不限于宽带类投诉次数、宽带网络质量类投诉次数、网络质量类投诉次数等,其反映了用户对现有网络的满意程度,具体来说,用户对现有网络的满意程度越低,则用户成为全屋WiFi潜在用户的概率越大。
组网硬件参数是指用于表征用户所使用网络的组网硬件特征的参数,具体包括但不限于用户使用的路由器的相关信息(如包括路由器的品牌型号、速率、价格、上市时间等)、用户使用的移动终端的相关信息(如移动终端的品牌、价格、上市时间等),其反映了用户在科技产品上进行投入的接受程度与用户价值,具体来说,用户在科技产品上进行投入的接受程度与用户价值越高,则用户成为全屋WiFi潜在用户的概率越大。
居住环境参数是指用于表征用户的居住环境特征的参数,具体包括但不限于:用户住所的住宅面积、住宅楼层、住宅楼龄、住宅小区均价、住宅小区中使用家庭宽带的用户数量、住宅小区中使用全屋WiFi的用户数量等,其对用户是否需要使用全屋WiFi有重要影响,具体来说,户型复杂、住宅面积大的用户成为全屋WiFi潜在用户的概率较大。
具体实施时,目标用户的流量带宽参数和投诉类型参数可通过对目标用户的上网数据记录及历史投诉记录进行分类整合得到,而对于目标用户的居住环境参数和组网硬件参数的获取,可首先通过目标用户的家庭带宽安装及维修信息,进而可基于该家庭带宽安装及维修信息进行网络爬虫收集得到。
S14,基于目标用户对应于多个指定指标的指标数据及设定的分类模型,识别目标用户是否为全屋WiFi潜在用户。
其中,分类模型是基于样本用户对应于多个指定指标的指标数据以及指示样本用户是否为全屋WiFi用户的标签所训练得到的。
需要说明的是,训练得到上述分类模型的过程将在下文图3和图4所示的实施例中进行详细说明,此处不再展开。
通过本申请实施例提供的识别全屋WiFi潜在用户的方法,在识别全屋WiFi潜在用户时,同时考虑了包括用户的网络使用行为参数、组网硬件参数及居住环境参数在内的多个指定指标,这些指标能够客观、准确地反映用户对于现有家庭宽带网络的使用情况,影响用户对全屋WiFi的使用需求,因此基于用户对应于这些指标的指标数据和设定的分类模型进行识别,相较于依据单一的用户通信行为数据进行识别的方式,得到的识别结果的准确率和稳定性更高。
为了使本领域技术人员更加理解本申请实施例提供的技术方案,下面对本申请实施例提供的技术方案进行详细说明。
对于上述步骤S14,在一种可选的方案中,设定的分类模型可以是一个模型,进而将目标用户对应于多个指定指标的指标数据输入到该分类模型中,即可获得指示该目标用户是否为全屋WIFi潜在用户的识别结果。
为了进一步提高识别结果的准确率和稳定性,在另一种更为优选的方案中,设定的分类模型可以包括多个子模型,这些子模型是基于多个不同的分类算法对样本用户对应于多个指定指标的指标数据及对应的标签训练所得到的。相应地,在上述步骤S14中,可以将目标用户对应于多个指定指标的指标数据分别输入各个分类子模型,以得到各个分类子模型输出的、用于指示目标用户是否为全屋WiFi潜在用户的识别结果,进一步基于各个分类子模型输出的识别结果,确定目标用户是否为全屋WiFi潜在用户。
具体来说,可以将所有分类子模型输出的识别结果中,占比较高的识别结果作为最终的识别结果。
例如,如图2所示,以分类模型包括分类子模型1、分类子模型2以及分类子模型3为例,可分别将目标用户对应于多个指定指标的指标数据分别输入到这三个分类子模型中,分别得到三个识别结果,即识别结果1、识别结果2以及识别结果3。若其中两个分类子模型的识别结果指示目标用户为全屋WiFi潜在用户,则可确定最终的识别结果是目标用户为全屋WiFi潜在用户。
可以理解,通过将目标用户对应于多个指定指标的指标数据输入到不同的分类子模型中,基于不同的分类子模型输出的识别结果来识别目标用户是否为全屋WiFi潜在用户,相较于通过单一模型进行识别的方式,得到的识别结果的准确率和可信度更高。
对于上述步骤S14中的分类模型,本申请实施例还包括对该分类模型的训练方法。
值得说明的是,对该分类模型的训练是基于从移动网络平台采集到的大量样本用户对应于上述多个指定指标的指标数据预先进行的,后续在进行全屋WiFi潜在用户识别的过程中,无需每次对该分类模型进行训练,或者,可以周期性地基于从移动网络平台新采集的大量样本用户对应于上述多个指定指标的指标数据对该分类模型进行更新,以提升该分类模型的识别准确率和可信度。其中,上述大量样本用户可以包括已确认为全屋WiFi用户的样本用户和已确认为非全屋WiFi用户的样本用户。
具体地,在可选的方案中,对上述分类模型的训练方法,可以包括:第一,获取样本用户集内各个样本用户对应于上述多个指定指标的指标数据;第二,将样本用户对应于上述多个指定指标的指标数据作为分类模型的输入,将指示样本用户是否为全屋WiFi用户的标签作为分类模型的输出,基于设定的分类算法进行训练,得到分类模型。其中,样本用户集可以包括已确认为全屋WiFi用户的样本用户和已确认为非全屋WiFi用户的样本用户。
考虑到随着用户对于多个指定指标的指标数据会不断增加,其中不乏有无关和干扰的指标数据,这些指标数据会影响整个分类模型的训练进度和效率,因此,在更为优选的方案中,可以在对分类模型进行筛选之前,对样本用户对应于上述多个指定指标的指标数据进行筛选。
具体来说,如图3所示,对上述分类模型的训练方法,可以包括:
S32,获取样本用户集内各个样本用户对应于多个指定指标的指标数据。
S34,对样本用户对应于多个指定指标的指标数据进行筛选。
由于每一指定指标下可能存在多种子指标,这些子指标中有一些是无关指标或干扰指标,因而可以对于每一指定指标,从该指定指标中提取相关度和预测能力较强的子指标,作为目标子指标,进而从样本用户对应于该指定指标的指标数据中,筛选出样本用户对应于目标子指标的指标数据,进一步基于样本用户对应于不同指定指标下的目标子指标的指标数据进行分类模型的训练。
S36,将筛选后的样本用户对应于多个指定指标的指标数据作为分类模型的输入,将指示样本用户是否为全屋WiFi用户的标签作为分类模型的输出,基于设定的分类算法进行训练,得到分类模型。
需要说明的是,在基于该方案训练得到分类模型后,在利用该分类模型对目标用户进行识别时,为了进一步提高对目标用户的识别效率,也可以将目标用户对应于多个指定指标下的目标子指标的指标数据输入到该分类模型中,以识别目标用户是否为全屋WiFi潜在用户。
对于上述步骤S34,由于子指标的信息值(Information Value,IV)可以表征子指标的预测能力,子指标间的相关系数可以表征子指标间的关联程度,因此,在一种较为优选的实施方式中,对于每一指定指标,可以基于该指定指标下各子指标的IV及子指标间的相关系数,从该指定指标中提取出目标子指标。
具体来说,如图4所示,上述步骤S34可以包括:
S341,对于每一指定指标,基于样本用户集内各个样本用户对应于所述指定指标下各个子指标的指标数据,确定各个子指标的IV及任意两个子指标组成的子指标对的相关系数。
对于子指标对的相关系数,可以采用斯皮尔曼等级相关系数。具体来说,可以将各个子指标的指标数据,按照设定顺序(如升序或降序)进行排序,进而根据排序结果,按照下述公式(1)确定子指标对的相关系数。
其中,ρ表示子指标X和子指标Y之间的相关系数;di表示子指标X中的第i个指标数据xi和子指标Y中的第i个指标数据yi之间的排行差分,di=xi-yi,表示子指标X中的第i个指标数据xi;表示子指标Y中的第i个指标数据yi
对于每一子指标的IV,可以基于样本用户集中各个样本用户对应于该子指标的指标数据,对该子指标进行分箱处理,得到多个分箱,进一步将已确认为全屋WiFi用户的样本用户作为正样本、将已确认为非全屋WiFi用户的样本用户作为负样本,对于每一分箱,基于该分箱对应的正样本的数量和负样本的数量,确定该分箱的证据重量(Weight ofEvidence,WOE)以及正负样本占比的差值,如下述公式(2)和公式(3)所示;接着,基于该分箱的WOE及正负样本占比的差值,确定该分箱的IV,如下述公式(4)所示;最终基于子指标中各分箱的IV,确定子指标的IV,如下述公公式(5)所示。
PCTi=py1-py0 (3)
IVi=WOEi×PCTi (4)
其中,WOEi表示第i个分箱的WOE,Bi表示该分箱对应的正样本的数量,Gi表示该分箱对应的负样本的数量,B表示样本用户集中负样本的总数,G表示样本用户集中正样本的总数,PCTi表示该分箱中正负样本占比的差值,py1表示该分箱对应的正样本占样本用户集中正样本的比例,py0表示该分箱对应的负样本占样本用户集中负样本的比例,IVi表示该分箱的IV,IV表示该分箱所属的子指标的IV,n表示该分箱的数量。
S342,从指定指标中选取相关系数超过第一设定值的子指标对。
其中,第一设定值可以根据实际需要自定义设置,例如,第一设定值可以设置为0.5,本申请实施例对第一设定值的数值不做具体限定。
S343,从筛选出的子指标对中选取IV较高的子指标,作为目标子指标。
S344,从样本用户对应于指定指标的指标数据中,筛选出样本用户对应于目标子指标的指标数据。
可以理解,通过上述方案,使得从每个指定指标中筛选出的目标子指标都是高度相关且预测能力较强的子指标,进而基于样本用户对应于这些子指标的指标数据进行模型训练,不仅可以提高模型训练的效率,还可以提高训练所得的分类模型的准确率和可信度。
对于上述步骤S36,本申请实施例中的分类算法可以包括以下算法中的一个或多个的组合:随机森林算法(Random Foreset)、逻辑回归算法、梯度提升树算法。
下面分别对各个分类算法进行说明。
首先,对于随机森林算法,随机森林是一个包含多棵决策树的分类器,其最终输出的类别是由众多独立决策树输出结果的众数决定的。随机森林的优点在于避免了单棵决策树可能产生的过拟合现象。
决策树一般是自上而下生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。决策树的每个节点子节点的个数与决策树用的算法有关。如CART(Classification AndRegression Tree,)算法得到的决策树每个节点有两个分支,这种树称为二叉树。允许节点含有多于两个子节点的树称为多叉树。常用的二叉树算法包括CART和ID3,多叉树算法包括C5.0和CHAID。
目前较为流行的二叉树算法有ID3与CART,分支方式由超参数criterion决定。但是,考虑到ID3采用的信息增益度量存在2个缺点:一是优先选择有较多属性值的Feature,不一定合理,容易过拟合;二是ID3中根据属性值分割数据,之后该特征不会再起作用,这种快速切割的方式会影响算法的准确率。因此,在较为优选的方案中,可以采用CART算法,相比ID3,CART算法应用范围更广,既可以用于分类也可以用于回归,且CART对于特征的利用是可重复的。
CART算法包括决策树生成和决策树剪枝。具体来说,可以将筛序后的各个样本用户对应于多个指定指标的指标数据划分为两部分,一部分作为训练数据集,另一部分作为验证数据集。首先,基于训练数据集生成决策树,且生成的决策树要尽量大;接着,用验证数据集对已生成的树进行剪枝并选择最优子树,这时选用损失函数最小作为剪枝的标准。CART分类时,根据基尼系数(Gini)最小化准则来选择最好的数据分割的特征,Gini描述的是纯度,与信息熵的含义相似。CART中每一次迭代都会降低Gini系数。
CART生成算法停止计算的条件是结点中的样本个数小于预定阈值,或样本集的Gini系数小于预定阈值(样本基本属于同一类),或者没有更多特征。
CART决策树生成算法流程如下:①根据训练数据集,从根结点开始,递归地对每个结点进行以下操作,构建二叉决策树;②设结点的训练数据集为D,计算现有特征对该数据集的Gini系数。此时,对每一个特征A,对其可能取的每个值a,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,计算A=a时的Gini系数;③在所有可能的特征A以及它们所有可能的切分点a中,选择Gini系数最小的特征及其对应的切分点作为最优特征与最优切分点。依最优特征与最优切分点,从现结点生成两个子结点,将训练数据集依特征分配到两个子结点中去;④对两个子结点递归地调用步骤②~③,直至满足停止条件;⑤生成CART决策树。
随机森林是用有放回抽样的方法,最大可抽取m-1个随机子集(m为训练样本容量),由每个子集训练出一颗独立的决策树,再将目标用户对应于多个指定指标的指标数据输入这些决策树,将识别结果的众数作为最终结果输出。
接着,对于逻辑回归算法,具体可采用偏最小二乘逻辑回归(PLS-logistic)算法。在主成分(PCA)分析中,只考虑了对自变量矩阵进行分解,消除包含的无用信息。但是不同的分类目标,其特征信息和干扰信息是不一样的,因此对自变量矩阵分解过程中应该考虑自变量与因变量之间的关系。
偏最小二乘逻辑回归(PLS-logistic)算法就是基于上述思想提出的一种分类算法。该方法综合了逻辑回归(logistic),主成分分析(PCA)和典型相关分析(OCC)的思想,在建立普通逻辑回归模型之前,它采用对自变量X和因变量Y都进行分解的方法,从变量X和Y中同时提取成分(通常称为因子),使从X和Y提取出的成分相关性最大化。
PLS-logistic算法计算过程如下:记V=(vij)n×p为自变量矩阵,其中有p个自变量Vj(j=1,2,…,p),n为样本个数。
(1)数据的标准化处理。
(2)提取偏最小二乘成分。
(3)以t1,t2,…,th为自变量,以Y为因变量,建立普通h元logistic回归模型。
最后,对于梯度提升树算法,梯度提升树是一种集成提升算法,可以分成提升和决策树两个部分。提升方法就是从弱学习算法出发,反复迭代,得到一系列弱分类器,最终构成一个强分类器。
梯度提升树中用到的弱学习器是决策树,一般是自上而下生成的。每个决策或事件都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。CART(Classification And Regression Tree)算法得到的决策树每个节点有两个分支,这种树称为二叉树。
本次梯度提升树算法中使用的是CART回归树,因为梯度提升树每次迭代要拟合的梯度值是连续值。对于回归树算法来说最重要的是寻找最佳的划分点,那么回归树中的可划分点包含了所有特征的所有可取的值。由于在回归树中的样本标签是连续数值,使用平方误差来评判拟合程度。
需要说明的是,利用梯度提升树算法训练分类模型的方法可以采用本领域常用的任意方式,此处不再赘述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
图5是本申请的一个实施例电子设备的结构示意图。请参考图5,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成识别全屋无线网络WiFi潜在用户的装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取目标用户对应于多个指定指标的指标数据,所述多个指定指标至少包括网络使用行为参数、组网硬件参数及居住环境参数;
基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户,其中,所述分类模型是基于样本用户对应于所述多个指定指标的指标数据以及指示所述样本用户是否为全屋WiFi用户的标签所训练得到的。
上述如本申请图1所示实施例揭示的识别全屋无线网络WiFi潜在用户的装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1的方法,并实现识别全屋无线网络WiFi潜在用户的装置在图1至图4所示实施例的功能,本申请实施例在此不再赘述。
当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本申请实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
获取目标用户对应于多个指定指标的指标数据,所述多个指定指标至少包括网络使用行为参数、组网硬件参数及居住环境参数;
基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户,其中,所述分类模型是基于样本用户对应于所述多个指定指标的指标数据以及指示所述样本用户是否为全屋WiFi用户的标签所训练得到的。
图6是本申请的一个实施例识别全屋无线网络WiFi潜在用户的装置的结构示意图。请参考图6,在一种软件实施方式中,识别全屋无线网络WiFi潜在用户的装置600可包括:
第一获取模块610,用于获取目标用户对应于多个指定指标的指标数据,所述多个指定指标至少包括网络使用行为参数、组网硬件参数及居住环境参数;
识别模块620,用于基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户,其中,所述分类模型是基于样本用户对应于所述多个指定指标的指标数据以及指示所述样本用户是否为全屋WiFi用户的标签所训练得到的。
可选地,所述分类模型包括多个分类子模型,所述多个分类子模型是基于多个不同的分类算法对所述样本用户对应于所述多个指定指标的指标数据及对应的标签训练所得到的;
所述识别模块具体用于:
将所述目标用户对应于多个指定指标的指标数据分别输入各个分类子模型,以得到各个所述分类子模型输出的识别结果,所述识别结果用于指示所述目标用户是否为全屋WiFi潜在用户;
基于各个分类子模型输出的识别结果,确定所述目标用户是否为全屋WiFi潜在用户。
可选地,所述装置还包括:
第二获取模块,用于在所述识别模块基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户之前,获取样本用户集内各个样本用户对应于所述多个指定指标的指标数据,其中,所述样本用户集包括已确认为全屋WiFi用户的样本用户和已确认为非全屋WiFi用户的样本用户;
筛选模块,用于对所述样本用户对应于所述多个指定指标的指标数据进行筛选;
模型训练模块,用于将筛选后的所述样本用户对应于所述多个指定指标的指标数据作为分类模型的输入,将指示所述样本用户是否为全屋WiFi用户的标签作为所述分类模型的输出,基于设定的分类算法进行训练,得到所述分类模型。
可选地,所述筛选模块具体用于:
对于每一指定指标,基于所述样本用户集内各个样本用户对应于所述指定指标下各个子指标的指标数据,确定各个所述子指标的信息值IV及任意两个子指标组成的子指标对的相关系数;
从所述指定指标中选取相关系数超过第一设定值的子指标对;
从筛选出的子指标对中选取IV较高的子指标,作为所述目标子指标;
从所述样本用户对应于所述指定指标的指标数据中,筛选出所述样本用户对应于所述目标子指标的指标数据。
可选地,所述筛选模块具体用于:
对于每一子指标,基于所述样本用户集中各个样本用户对应于所述子指标的指标数据,对所述子指标进行分箱处理,得到多个分箱;
将已确认为全屋WiFi用户的样本用户作为正样本、将已确认为非全屋WiFi用户的样本用户作为负样本,对于每一分箱,基于所述分箱对应的正样本的数量和负样本的数量,确定所述分箱的证据重量WOE以及正负样本占比的差值;
基于所述分箱的WOE及正负样本占比的差值,确定所述分箱的IV;
基于所述子指标中各分箱的IV,确定所述子指标的IV。
可选地,所述分类算法包括以下算法中的一个或多个的组合:随机森林算法、逻辑回归算法、梯度提升树算法。
总之,以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (8)

1.一种识别全屋无线网络WiFi潜在用户的方法,其特征在于,包括:
获取样本用户集内各个样本用户对应于多个指定指标的指标数据,其中,所述样本用户集包括已确认为全屋WiFi用户的样本用户和已确认为非全屋WiFi用户的样本用户;
对于每一指定指标,基于所述样本用户集内各个样本用户对应于所述指定指标下各个子指标的指标数据,确定各个所述子指标的信息值IV及任意两个子指标组成的子指标对的相关系数;从所述指定指标中选取相关系数超过第一设定值的子指标对;从筛选出的子指标对中选取IV较高的子指标,作为目标子指标;从所述样本用户对应于所述指定指标的指标数据中,筛选出所述样本用户对应于所述目标子指标的指标数据;
将筛选后的所述样本用户对应于所述多个指定指标的指标数据作为分类模型的输入,将指示所述样本用户是否为全屋WiFi用户的标签作为所述分类模型的输出,基于设定的分类算法进行训练,得到所述分类模型;
获取目标用户对应于多个指定指标的指标数据,所述多个指定指标至少包括网络使用行为参数、组网硬件参数及居住环境参数;
基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户,其中,所述分类模型是基于样本用户对应于所述多个指定指标的指标数据以及指示所述样本用户是否为全屋WiFi用户的标签所训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述分类模型包括多个分类子模型,所述多个分类子模型是基于多个不同的分类算法对所述样本用户对应于所述多个指定指标的指标数据及对应的标签训练所得到的;
基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户,包括:
将所述目标用户对应于多个指定指标的指标数据分别输入各个分类子模型,以得到各个所述分类子模型输出的识别结果,所述识别结果用于指示所述目标用户是否为全屋WiFi潜在用户;
基于各个分类子模型输出的识别结果,确定所述目标用户是否为全屋WiFi潜在用户。
3.根据权利要求1所述的方法,其特征在于,对于每一指定指标,基于所述样本用户集内各个样本用户对应于所述指定指标下各个子指标的指标数据,确定各个所述子指标的信息值IV,包括:
对于每一子指标,基于所述样本用户集中各个样本用户对应于所述子指标的指标数据,对所述子指标进行分箱处理,得到多个分箱;
将已确认为全屋WiFi用户的样本用户作为正样本、将已确认为非全屋WiFi用户的样本用户作为负样本,对于每一分箱,基于所述分箱对应的正样本的数量和负样本的数量,确定所述分箱的证据重量WOE以及正负样本占比的差值;
基于所述分箱的WOE及正负样本占比的差值,确定所述分箱的IV;
基于所述子指标中各分箱的IV,确定所述子指标的IV。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述分类算法包括以下算法中的一个或多个的组合:随机森林算法、逻辑回归算法、梯度提升树算法。
5.一种识别全屋无线网络WiFi潜在用户的装置,其特征在于,包括:
第一获取模块,用于获取目标用户对应于多个指定指标的指标数据,所述多个指定指标至少包括网络使用行为参数、组网硬件参数及居住环境参数;
第二获取模块,用于在识别模块基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户之前,获取样本用户集内各个样本用户对应于所述多个指定指标的指标数据,其中,所述样本用户集包括已确认为全屋WiFi用户的样本用户和已确认为非全屋WiFi用户的样本用户;
筛选模块,用于对于每一指定指标,基于所述样本用户集内各个样本用户对应于所述指定指标下各个子指标的指标数据,确定各个所述子指标的信息值IV及任意两个子指标组成的子指标对的相关系数;从所述指定指标中选取相关系数超过第一设定值的子指标对;从筛选出的子指标对中选取IV较高的子指标,作为目标子指标;从所述样本用户对应于所述指定指标的指标数据中,筛选出所述样本用户对应于所述目标子指标的指标数据;
模型训练模块,用于将筛选后的所述样本用户对应于所述多个指定指标的指标数据作为分类模型的输入,将指示所述样本用户是否为全屋WiFi用户的标签作为所述分类模型的输出,基于设定的分类算法进行训练,得到所述分类模型;
识别模块,用于基于所述目标用户对应于多个指定指标的指标数据及设定的分类模型,识别所述目标用户是否为全屋WiFi潜在用户,其中,所述分类模型是基于样本用户对应于所述多个指定指标的指标数据以及指示所述样本用户是否为全屋WiFi用户的标签所训练得到的。
6.根据权利要求5所述的装置,其特征在于,所述分类模型包括多个分类子模型,所述多个分类子模型是基于多个不同的分类算法对所述样本用户对应于所述多个指定指标的指标数据及对应的标签训练所得到的;
所述识别模块具体用于:
将所述目标用户对应于多个指定指标的指标数据分别输入各个分类子模型,以得到各个所述分类子模型输出的识别结果,所述识别结果用于指示所述目标用户是否为全屋WiFi潜在用户;
基于各个分类子模型输出的识别结果,确定所述目标用户是否为全屋WiFi潜在用户。
7.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至4中任一项所述的方法。
8.一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至4中任一项所述的方法。
CN202011032976.9A 2020-09-27 2020-09-27 识别全屋无线网络WiFi潜在用户的方法、装置及电子设备 Active CN114339859B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011032976.9A CN114339859B (zh) 2020-09-27 2020-09-27 识别全屋无线网络WiFi潜在用户的方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011032976.9A CN114339859B (zh) 2020-09-27 2020-09-27 识别全屋无线网络WiFi潜在用户的方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN114339859A CN114339859A (zh) 2022-04-12
CN114339859B true CN114339859B (zh) 2023-08-15

Family

ID=81010584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011032976.9A Active CN114339859B (zh) 2020-09-27 2020-09-27 识别全屋无线网络WiFi潜在用户的方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114339859B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107172590A (zh) * 2017-06-30 2017-09-15 北京奇虎科技有限公司 基于移动终端的活动状态信息处理方法、装置及移动终端
GB201717321D0 (en) * 2017-10-20 2017-12-06 Sensewhere Ltd Identifying sites visited by a user device
CN108985347A (zh) * 2018-06-25 2018-12-11 阿里巴巴集团控股有限公司 分类模型的训练方法、店铺分类的方法及装置
CN109635117A (zh) * 2018-12-26 2019-04-16 零犀(北京)科技有限公司 一种基于知识图谱识别用户意图方法及装置
CN110400160A (zh) * 2018-04-24 2019-11-01 中国移动通信集团广东有限公司 识别竞品用户的方法、装置、电子设备和存储介质
CN110621038A (zh) * 2019-09-30 2019-12-27 武汉大学 一种基于WiFi信号检测步态实现多用户身份识别的方法及装置
CN110930198A (zh) * 2019-12-05 2020-03-27 佰聆数据股份有限公司 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备
CN111447630A (zh) * 2020-02-13 2020-07-24 中国电信股份有限公司成都分公司 基于路由器性能差异的评级方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107172590A (zh) * 2017-06-30 2017-09-15 北京奇虎科技有限公司 基于移动终端的活动状态信息处理方法、装置及移动终端
GB201717321D0 (en) * 2017-10-20 2017-12-06 Sensewhere Ltd Identifying sites visited by a user device
CN110400160A (zh) * 2018-04-24 2019-11-01 中国移动通信集团广东有限公司 识别竞品用户的方法、装置、电子设备和存储介质
CN108985347A (zh) * 2018-06-25 2018-12-11 阿里巴巴集团控股有限公司 分类模型的训练方法、店铺分类的方法及装置
CN109635117A (zh) * 2018-12-26 2019-04-16 零犀(北京)科技有限公司 一种基于知识图谱识别用户意图方法及装置
CN110621038A (zh) * 2019-09-30 2019-12-27 武汉大学 一种基于WiFi信号检测步态实现多用户身份识别的方法及装置
CN110930198A (zh) * 2019-12-05 2020-03-27 佰聆数据股份有限公司 基于随机森林的电能替代潜力预测方法、系统、存储介质及计算机设备
CN111447630A (zh) * 2020-02-13 2020-07-24 中国电信股份有限公司成都分公司 基于路由器性能差异的评级方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
标识网络中基于多维特征的用户监管机制的研究与实现;王潇;《中国优秀硕士学位论文全文数据库》;全文 *

Also Published As

Publication number Publication date
CN114339859A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
US10827981B2 (en) System and method for evaluating a cognitive load on a user corresponding to a stimulus
CN110570111A (zh) 企业风险预测方法、模型训练方法、装置及设备
CN111652661B (zh) 一种手机客户端用户流失预警处理方法
CN113139570A (zh) 一种基于最优混合估值的大坝安全监测数据补全方法
CN110472659B (zh) 数据处理方法、装置、计算机可读存储介质和计算机设备
CN113144624B (zh) 一种数据处理方法、装置、设备及存储介质
US20190044821A1 (en) Systems and methods for extracting structure from large, dense, and noisy networks
CN113704389A (zh) 一种数据评估方法、装置、计算机设备及存储介质
CN114339859B (zh) 识别全屋无线网络WiFi潜在用户的方法、装置及电子设备
CN116932735A (zh) 一种文本比对方法、装置、介质和设备
CN117523218A (zh) 标签生成、图像分类模型的训练、图像分类方法及装置
CN115730248A (zh) 一种机器账号检测方法、系统、设备及存储介质
Ma The Research of Stock Predictive Model based on the Combination of CART and DBSCAN
Singh et al. Audio tagging using linear noise modelling layer
CN112115996B (zh) 图像数据的处理方法、装置、设备及存储介质
CN116823069B (zh) 基于文本分析的智能客服服务质检方法及相关设备
Sayed-Mouchaweh Learning from Data Streams in Evolving Environments: Methods and Applications
CN115618921B (zh) 知识蒸馏方法、装置、电子设备和存储介质
CN111242235B (zh) 一种相似特征测试数据集生成方法
CN117952411A (zh) 基于知识图谱的风险预测方法、装置、设备及存储介质
CN113284027A (zh) 团伙识别模型的训练方法、异常团伙识别方法及装置
CN117649236A (zh) 交易的风险预测方法、装置及存储介质
CN116244652A (zh) 用户的识别方法及装置、存储介质和电子设备
CN113946720A (zh) 一种识别群组中用户的方法、装置及电子设备
CN117763364A (zh) 天然气需求量预测模型训练方法及天然气需求量预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant