CN115578132A - 年龄校准方法、装置、电子设备及可读存储介质 - Google Patents
年龄校准方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN115578132A CN115578132A CN202211568346.2A CN202211568346A CN115578132A CN 115578132 A CN115578132 A CN 115578132A CN 202211568346 A CN202211568346 A CN 202211568346A CN 115578132 A CN115578132 A CN 115578132A
- Authority
- CN
- China
- Prior art keywords
- user
- age
- calibrated
- determining
- card
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 230000006399 behavior Effects 0.000 claims description 32
- 238000005070 sampling Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 4
- 230000011664 signaling Effects 0.000 claims description 4
- 230000003542 behavioural effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 230000004308 accommodation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000035606 childbirth Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0224—Discounts or incentives, e.g. coupons or rebates based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供的年龄校准方法、装置、电子设备及可读存储介质,基于客户关系数据,确定每张主卡以及主卡对应的副卡,并将副卡对应的用户确定为待校准用户;提取待校准用户对应的与年龄匹配的行为状态特征以及待校准用户的常住地;将行为状态特征输入到与常住地的户籍类型匹配的年龄段预测模型中,得到待校准用户对应的预测年龄段;基于预测年龄段、以及主卡所属用户的真实年龄,确定待校准用户与主卡所属用户之间的辈分关系类型,并基于辈分关系类型对应的年龄校准规则,确定待校准用户的年龄,本发明可以基于预测的年龄段更细粒度的推断待校准用户的年龄,提高了年龄校准的准确性。
Description
技术领域
本发明涉及数据分析技术领域,具体而言,涉及一种年龄校准方法、装置、电子设备及可读存储介质。
背景技术
在电信大数据分析过程中,常常需要基于特定年龄段的人群聚合分析指标,但是电信数据中的年龄存在是真的情况,即多个用户共享同一个年龄,因此,有必要对用户进行年龄校准,以满足数据分析的技术需求。
发明内容
本发明的目的之一在于提供一种年龄校准方法、装置、电子设备及可读存储介质,用以提高年龄校准的准确性,本发明的实施例可以这样实现:
第一方面,本发明提供一种年龄校准方法,所述方法包括:基于客户关系数据,确定每张主卡以及所述主卡对应的副卡,并将所述副卡对应的用户确定为待校准用户;提取所述待校准用户对应的与年龄匹配的行为状态特征以及所述待校准用户的常住地;将所述行为状态特征输入到与所述常住地的户籍类型匹配的年龄段预测模型中,得到所述待校准用户对应的预测年龄段;基于所述预测年龄段、以及所述主卡所属用户的真实年龄,确定所述待校准用户与所述主卡所属用户之间的辈分关系类型,并基于所述辈分关系类型对应的年龄校准规则,确定所述待校准用户的年龄。
第二方面,本发明提供一种年龄校准装置,包括:确定模块、提取模块、预测模块和校准模块;确定模块,用于;基于客户关系数据,确定主卡以及所述主卡对应的副卡,并将所述副卡对应的用户确定为待校准用户;提取模块,用于提取所述待校准用户对应的与年龄匹配的行为状态特征以及所述待校准用户的常住地;预测模块,用于将所述行为状态特征输入与所述常住地的户籍类型匹配的年龄段预测模型中,得到所述待校准用户对应的预测年龄段;校准模块,用于基于所述预测年龄段、以及所述主卡所属用户的真实年龄,确定所述待校准用户与所述主卡所属用户之间的辈分关系类型,并基于所述辈分关系类型对应的年龄校准规则,确定待校准用户的年龄。
第三方面,本发明提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序以实现第一方面所述的方法。
第四方面,本发明提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法。
本发明提供的年龄校准方法、装置、电子设备及可读存储介质,首先粗粒度的预测了待校准用户的年龄段,然后基于这个预测的年龄段去推断待校准用户与主卡所属用户之间的辈分关系类型,然后基于不同辈分关系类型对应的年龄校准阈值以及年龄校准规则,最终细粒度的推断出待校准用户的年龄,从而完成年龄校准,提高了年龄校准的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的年龄校准方法的示意性流程图;
图2为本发明实施例提供的步骤S101的示意性流程图;
图3为本发明实施例提供的年龄段预测模型的训练方式的示意性流程图;
图4为本发明实施例提供的步骤S104的示意性流程图;
图5为本发明实施例提供的年龄校准装置的功能模块图;
图6为本发明实施例还提供一种电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本发明的实施例中的特征可以相互结合。
为了对共享证件关系中副卡所对应的用户的年龄进行校准,本发明实施例提供了一种年龄校准方法,请参考图1,图1为本发明实施例提供的年龄校准方法的示意性流程图,该年龄校准方法的执行主体可以是电子设备,该电子设备可以但不限于是:终端、服务器等等。
本发明实施例提供的年龄校准方法可以包括如下步骤:
步骤S101、基于客户关系数据,确定每张主卡以及主卡对应的副卡,并将副卡对应的用户确定为待校准用户;
步骤S102、提取待校准用户对应的与年龄匹配的行为状态特征以及待校准用户的常住地;
步骤S103、将行为状态特征输入到与常住地的户籍类型匹配的年龄段预测模型中,得到待校准用户对应的预测年龄段;
步骤S104、基于预测年龄段、以及主卡所属用户的真实年龄,确定待校准用户与主卡所属用户之间的辈分关系类型,并基于辈分关系类型对应的年龄校准规则,确定待校准用户的年龄。
在上述年龄校准方法中,本发明实施例首先基于客户关系数据,确定出主卡和副卡,并将副卡对应的用户确定为待校准用户,然后确定待校准用户的行为状态特征以及常住地,并选择常住地所属户籍类型所对应的年龄段预测模型基于待校准用户的行为状态特征进行预测,得到待校准用户的预测年龄段,最后基于预测年龄段、以及主卡所属用户的真实年龄,确定待校准用户与主卡所属用户之间的辈分关系类型,并基于辈分关系类型对应的年龄校准规则,确定待校准用户的年龄,可以看出本发明实施例首先粗粒度的预测了待校准用户的年龄段,然后基于这个预测的年龄段去推断待校准用户与主卡所属用户之间的辈分关系类型,然后基于不同辈分关系类型对应的年龄校准阈值以及年龄校准规则,基于预测的年龄段更细粒度的推断待校准用户的年龄,提高了年龄校准的准确性。
下面本发明实施例将结合相关附图,对上述步骤S101至步骤S104进行详细介绍。
在步骤S101中,基于客户关系数据,确定每张主卡以及主卡对应的副卡,并将副卡对应的用户确定为待校准用户。
本发明实施例中,客户关系数据可以直接从客户管理系统中去获取。
需要说明的是,本申请上述实施例中,电子设备在根据从客户管理系统中获取客户关系数据的过程中,均应该以公开或者明示的形式向相关用户提供收集、使用及存储的说明,并获得用户授权,上述客户关系数据,不包含与本实施例提供的年龄校准服务无关的其他客户信息。
还需要说明的是,上述用于存储客户关系数据的服务器的设置位置需符合与上述相关行为的发生地所在地区的法律法规要求,相关行为包括但不限于:授权、产生、使用、存储等。
通过客户关系数据中卡的共享证件关系、入网时长和消费金额,可以确定主副卡关系,然后将副卡作为待校准用户,因此,本发明实施例针对上述步骤S101,给出了一种实施方式,请参见图2,图2为本发明实施例提供的步骤S101的示意性流程图,即步骤S101可以包括如下步骤:
步骤S101-1:从客户关系数据中,确定具有共享证件关系的待确认卡;
步骤S101-2:基于每张待确认卡的入网时间和消费金额,从待确认卡中确定出主卡以及副卡。
本发明实施例中,上述证件指得是身份证件,在目前的电信服务领域,推出了副卡业务,这就出现了一张身份可以对应多张卡 ,每张卡的实际使用者可能不是同一个人的现象,那么这些实际使用者却共享一个年龄,因此有必要进行年龄的校准。
因此,本发明实施例首先从客户关系数据中,确定出具有共享证件关系的待确认卡,也就是说,待确认卡对应同一张身份证,然后再基于每张待确认卡的入网时间和消费金额,来确定出主卡和副卡,通常而言,主卡的入网时间要早于副卡的入网时间,但是仅凭借入网时间这个指标,不足以准确区分出主卡和副卡,因为也有主卡和副卡同时办理的情况,因此,本发明实施例还结合可消费金额这一因素,通常来说,主卡的消费金额要大于副卡的消费金额,这是由主卡业务和副卡业务本身的属性所决定的,因此本发明实施例结合入网时间和消费金额,可以准确识别出主卡以及副卡。
在步骤S102、确定待校准用户对应的与年龄匹配的行为状态特征以及待校准用户的常住地。
本发明实施例中,与年龄匹配的行为状态特征是由与年龄有关的时间特征、通话特征、空间位置特征和应用程序使用特征等特征组合,选择这些特征原因在于:不同年龄段的用户行为表现存在一些差异,根据这些差异化特征可以综合得出一个用户可能属于哪个年龄段。
例如,以空间位置特征为例,青年用户可能经常出现在公司、工地或者其他可以办公的位置,老年用户可能经常在公园、广场或者小区逗留,还有一些学生用户可能经常出现在学校等,这些空间位置上的差异可以从侧面反映出用户大概率是哪种年龄段的用户。
再例如,以应用程序使用特征,部分用户的主卡以及副卡上有对应的儿童手表通话APP,还有和学校比较强的活动关联,手机也安装了儿童教育、中小学学习辅导等对应的APP,这些综合反应出主卡用户具有非常高的概率拥有未成年子女,因此可以推断其可能在二十多岁到四十多岁之间。还有的用户经常使用一些理财类软件,通过分析这些用户的应用程序使用特征,可以推断出用户可能的年龄段。
因此,针对上述步骤S102,本发明实施例给出了可能的实施方式,即步骤S102可以包括如下步骤:
a1: 从待校准用户对应的副卡的通话记录数据中,提取通话特征;
a2: 从待校准用户对应的副卡的信令数据中,提取待校准用户的空间位置特征,并基于空间位置特征确定常住地;
a3:从副卡对应的应用程序上网数据中,提取待校准用户对应的应用程序使用特征;
a4:将通话特征、空间位置特征、应用程序使用特征以及通话特征、空间位置特征、应用程序使用特征各自对应的时间特征,组成行为状态特征。
综合上述各种具有差异的特征进行年龄校准,预测准确度相对较高。
本发明实施例中,由于农村用户和城市用户的行为模式存在差异,因此,本发明实施例针对农村用户和城市用户,采用了不同的年龄段预测模型,因此,通过识别待校准用户的常住地,可以确定待校准用户是城市用户还是农村用户,以选择对应的年龄段预测模型来进行预测,可以提高预测结果的准确性。
在步骤S103中、将行为状态特征输入到与常住地的户籍类型匹配的年龄段预测模型中,得到待校准用户对应的预测年龄段。
本发明实施例中,年龄段预测模型是预先训练好可以直接使用的模型,还可以是实时训练得到的模型,年龄段预测模型可以是一个多分类器,最终可以输出不同年龄段或者不同年龄段对应的概率。
本发明实施例给出了一种年龄段预测模型的训练方式,请参见图3,图3为本发明实施例提供的年龄段预测模型的训练方式的示意性流程图,包括如下步骤:
S21:从客户关系数据中,确定年龄正确的目标用户;目标用户表征只存在一张卡且用户信息完整的活跃用户。
本发明实施例中,目标用户是单卡用户,而且信息完整,这里的信息包括但不限于姓名、联系方式、住址、行踪轨迹等,“活跃”指得是该用户时不时上网、行踪正常等具有一系列日常活动的用户,这样可以防止“僵尸用户”对模型训练结果造成不利。
S22:从目标用户中进行抽样,得到多个抽样样本。
本发明实施例中,可以基于这些目标用户所在区域、以及年龄,进行分区域、分年龄段进行抽样,以保证样本的均匀性,提升模型在预测方面的可信度。
S23:确定每个抽样样本对应的行为状态特征以及常住地。
本发明实施例中,针对每个抽样样本,可以基于上述步骤a1至步骤a4来提取行为状态特征以及常住地。
S24:利用具有相同户籍类型的抽样样本的行为状态特征对多分类器进行模型训练,并将训练后的多分类器作为与户籍类型对应的年龄段预测模型。
本发明实施例中,首先可以基于常住地的户籍类型,将抽样样本分成城市用户和农村用户两类,然后分别用城市用户和农村用户各自对应的抽样样本来进行模型训练,以此得到城市用户对应的年龄段预测模型和农村用户对应的年龄段预测模型。
通过模型训练,得到城市用户和农村用户各自适用的年龄段预测模型之后,即可执行步骤S103,即将待校准用户的行为状态特征输入到年龄段预测模型中,得到关于该待校准用户的预测年龄段,然后可以执行步骤S104。
在步骤S104中、基于预测年龄段、以及主卡所属用户的真实年龄,确定待校准用户与主卡所属用户之间的辈分关系类型,并基于辈分关系类型对应的年龄校准规则,确定待校准用户的年龄。
本发明实施例中,由于年龄段非常多,直接预测准确的概率相对不高,又考虑到共享证件关系的主卡和副卡的使用者通常具有亲属关系,因此,本发明实施例可以根据预测年龄段以及主卡所属用户的真实年龄,来推断待校准用户与主卡用户之间的辈分关系类型,包括爷奶辈关系、父母辈关系、平辈关系、子女辈关系还是孙辈关系。
因此,针对上述步骤S104,本发明实施例给出了一种实施方式,请参见图4,图4为本发明实施例提供的步骤S104的示意性流程图,步骤S104可以包括:
步骤S104-1,基于户籍类型,确定辈分关系类型对应的年龄校准阈值。
本发明实施例中,由于城市用户和农村用户在婚育规律、子女入学时间规律等实际情况均存在差异,因此,针对农村户籍和城镇户籍,可以分别基于婚育规律、子女入学时间规律等综合因素,设置不同辈分关系类型各自对应的年龄校准阈值,例如,针对城市用户,年龄校准阈值为28,针对农村用户,年龄校准阈值为25。
步骤S104-2,基于年龄校准阈值以及主卡所属用户的真实年龄,确定年龄校准规则;
本发明实施例中,年龄校准规则可以基于年龄校准阈值与主卡所属用户的真实年龄制定,可以表示为主卡所属年龄与年龄校准阈值之间的数学关系,即不同辈分关系类型对应的年龄校准规则不同,例如,假设是平辈,那么年龄校准阈值为零,年龄校准规则为:将主卡所属用户的年龄确定为待校准用户的年龄;又例如,如果是子女辈分,那么年龄校准阈值为25(仅仅作为一种示例),年龄校准规则:将主卡所属用户的年龄减去年龄校准阈值,那么差值为待校准用户的年龄;再例如,如果是父母辈分,那么年龄校准阈值为25(仅仅作为一种示例),年龄校准规则:将主卡所属用户的年龄加上年龄校准阈值,那么和值则为待校准用户的年龄。
步骤S104-3,基于年龄校准规则,确定待校准用户的年龄。
通过上述实施方式可以看出,本发明实施例为了提升准确校准年龄,首先粗粒度的预测了待校准用户的年龄段,然后基于这个预测的年龄段去推断待校准用户与主卡所属用户之间的辈分关系类型,然后基于不同辈分关系类型对应的年龄校准阈值以及年龄校准规则,最终细粒度的推断出待校准用户的年龄,从而完成年龄校准,相比较直接进行年龄段的预测这种准确度相对不高的方式,本发明实施例提供的年龄校准方法的相对准确度会大幅度提高。
基于相同的发明构思,本发明实施例还提供了一种年龄校准装置,请参见图5,图5为本发明实施例提供的年龄校准装置的功能模块图,本发明实施例提供的年龄校准装置300可以包括:确定模块310,提取模块320、预测模块330和校准模块340。
确定模块310,用于基于客户关系数据,确定每张主卡以及主卡对应的副卡,并将副卡对应的用户确定为待校准用户;
提取模块320,用于确定待校准用户对应的与年龄匹配的行为状态特征以及待校准用户的常住地;
预测模块330,用于将行为状态特征输入到与常住地的户籍类型匹配的年龄段预测模型中,得到待校准用户对应的预测年龄段;
校准模块340,用于基于预测年龄段、以及主卡所属用户的真实年龄,确定待校准用户与主卡所属用户之间的辈分关系类型,并基于辈分关系类型对应的年龄校准规则,确定待校准用户的年龄。
可以理解的是,确定模块310,提取模块320、预测模块330和校准模块340可以协同的执行图1中的各个步骤以实现相应的技术效果。
在可选地的实施方式中,与常住地的户籍类型匹配的年龄段预测模型是通过如下方式训练的:从客户关系数据中,确定年龄正确的目标用户;目标用户表征只存在一张卡且用户信息完整的活跃用户;从目标用户中进行抽样,得到多个抽样样本;确定每个抽样样本对应的行为状态特征以及常住地;利用具有相同户籍类型的抽样样本的行为状态特征对多分类器进行模型训练,并将训练后的多分类器作为与户籍类型对应的年龄段预测模型。
在可选地的实施方式中,确定模块310,用于从客户关系数据中,确定具有共享证件关系的待确认卡;基于每张待确认卡的入网时间和消费金额,从待确认卡中确定出主卡以及副卡。
在可选地的实施方式中,提取模块320,用于从待校准用户对应的副卡的通话记录数据中,提取通话特征;从待校准用户对应的副卡的信令数据中,提取待校准用户的空间位置特征,并基于空间位置特征确定常住地;从副卡对应的应用程序上网数据中,提取待校准用户对应的应用程序使用特征;将通话特征、空间位置特征、应用程序使用特征以及通话特征、空间位置特征、应用程序使用特征各自对应的时间特征,组成行为状态特征。
在可选地的实施方式中,校准模块340,用于基于户籍类型,确定辈分关系类型对应的年龄校准阈值;基于年龄校准阈值以及主卡所属用户的真实年龄,确定年龄校准规则;基于年龄校准规则,确定待校准用户的年龄。
本发明实施例中的年龄校准装置300可以以软件或固件(firmware)的形式存储于电子设备400的操作系统(operating system,OS)中。
请参见图6,图6为本发明实施例还提供一种电子设备的示意图,该电子设备用于实现上述实施例中的年龄校准方法。参阅图6所示,电子设备400包括:存储器401、处理器402、通信接口403、和总线404,该存储器401、处理器402和通信接口403相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
可选的,总线404可以是外设部件互连标准(peripheral componentinterconnect,PCI)总线或扩展工业标准结构(extended industry standardarchitecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
在本发明实施例中,处理器402可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储器401中,处理器402读取存储器401中的程序指令,结合其硬件完成上述方法的步骤。
在本发明实施例中,存储器401可以是非易失性存储器,比如硬盘(harddiskdrive,HDD)或固态硬盘(solid-state drive,SSD)等,还可以是易失性存储器(volatilememory),例如RAM。存储器还可以是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本发明实施例中的存储器还可以是电路或者其它任意能够实现存储功能的装置,用于存储指令和/或数据。
存储器401可用于存储软件程序及模块,如本发明实施例提供的年龄校准装置300的指令/模块,可以软件或固件(firmware)的形式存储于存储器401中或固化在电子设备400 的操作系统(operating system,OS)中,处理器402通过执行存储在存储器401内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口403可用于与其他节点设备进行信令或数据的通信。
基于以上实施例,本申请还提供了一种存储介质,存储介质中存储有计算机程序,计算机程序被计算机执行时,使得计算机执行以上实施例提供的年龄校准方法。
基于以上实施例,本申请实施例还提供了一种计算机程序,当计算机程序在计算机上运行时,使得计算机执行以上实施例提供的年龄校准方法。
基于以上实施例,本申请实施例还提供了一种芯片,芯片用于读取存储器中存储的计算机程序,用于执行以上实施例提供的年龄校准方法。
本申请实施例中还提供一种计算机程序产品,包括指令,当其在计算机上运行时,使得计算机执行以上实施例提供的年龄校准方法。
本申请实施例是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种年龄校准方法,其特征在于,所述方法包括:
基于客户关系数据,确定每张主卡以及所述主卡对应的副卡,并将所述副卡对应的用户确定为待校准用户;
提取所述待校准用户对应的与年龄匹配的行为状态特征以及所述待校准用户的常住地;
将所述行为状态特征输入到与所述常住地的户籍类型匹配的年龄段预测模型中,得到所述待校准用户对应的预测年龄段;
基于所述预测年龄段、以及所述主卡所属用户的真实年龄,确定所述待校准用户与所述主卡所属用户之间的辈分关系类型,并基于所述辈分关系类型对应的年龄校准规则,确定所述待校准用户的年龄。
2.根据权利要求1所述的年龄校准方法,其特征在于,与所述常住地的户籍类型匹配的年龄段预测模型是通过如下方式训练的:
从所述客户关系数据中,确定年龄正确的目标用户;所述目标用户表征只存在一张卡且用户信息完整的活跃用户;
从所述目标用户中进行抽样,得到多个抽样样本;
确定每个所述抽样样本对应的所述行为状态特征以及所述常住地;
利用具有相同所述户籍类型的所述抽样样本的所述行为状态特征对多分类器进行模型训练,并将训练后的所述多分类器作为与所述户籍类型对应的所述年龄段预测模型。
3.根据权利要求1所述的年龄校准方法,其特征在于,基于客户关系数据,确定每张主卡以及所述主卡对应的副卡,并将所述副卡对应的用户确定为待校准用户,包括:
从所述客户关系数据中,确定具有共享证件关系的待确认卡;
基于每张所述待确认卡的入网时间和消费金额,从所述待确认卡中确定出所述主卡以及所述副卡。
4.根据权利要求1所述的年龄校准方法,其特征在于,提取所述待校准用户对应的与年龄匹配的行为状态特征以及所述待校准用户的常住地,包括:
从所述待校准用户对应的所述副卡的通话记录数据中,提取通话特征;
从所述待校准用户对应的所述副卡的信令数据中,提取所述待校准用户的空间位置特征,并基于所述空间位置特征确定所述常住地;
从所述副卡对应的应用程序上网数据中,提取所述待校准用户对应的应用程序使用特征;
将所述通话特征、所述空间位置特征、所述应用程序使用特征以及所述通话特征、所述空间位置特征、所述应用程序使用特征各自对应的时间特征,组成所述行为状态特征。
5.根据权利要求1所述的年龄校准方法,其特征在于,基于所述预测年龄段、以及所述主卡所属用户的真实年龄,确定所述待校准用户与所述主卡所属用户之间的辈分关系类型,并基于所述辈分关系类型对应的年龄校准规则,确定所述待校准用户的年龄,包括:
基于所述户籍类型,确定所述辈分关系类型对应的所述年龄校准阈值;
基于所述年龄校准阈值以及所述主卡所属用户的真实年龄,确定所述年龄校准规则;
基于所述年龄校准规则,确定所述待校准用户的年龄。
6.一种年龄校准装置,其特征在于,包括:确定模块、提取模块、预测模块和校准模块;
所述确定模块,用于;基于客户关系数据,确定主卡以及所述主卡对应的副卡,并将所述副卡对应的用户确定为待校准用户;
所述提取模块,用于提取所述待校准用户对应的与年龄匹配的行为状态特征以及所述待校准用户的常住地;
所述预测模块,用于将所述行为状态特征输入与所述常住地的户籍类型匹配的年龄段预测模型中,得到所述待校准用户对应的预测年龄段;
所述校准模块,用于基于所述预测年龄段、以及所述主卡所属用户的真实年龄,确定所述待校准用户与所述主卡所属用户之间的辈分关系类型,并基于所述辈分关系类型对应的年龄校准规则,确定待校准用户的年龄。
7.根据权利要求6所述的年龄校准装置,其特征在于, 所述年龄校准装置还包括:训练模块,所述训练模块,用于:
从所述客户关系数据中,确定年龄正确的目标用户;所述目标用户表征只存在一张卡且用户信息完整的活跃用户;
从所述目标用户中进行抽样,得到多个抽样样本;
确定每个所述抽样样本对应的所述行为状态特征以及所述常住地;
利用具有相同所述户籍类型的所述抽样样本的所述行为状态特征对多分类器进行模型训练,并将训练后的所述多分类器作为与所述户籍类型对应的所述年龄段预测模型。
8.根据权利要求6所述的年龄校准装置,其特征在于,所述确定模块,具体用于:
从所述客户关系数据中,确定具有共享证件关系的待确认卡;
基于每张所述待确认卡的入网时间和消费金额,从所述待确认卡中确定出所述主卡以及所述副卡。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机程序,所述处理器可执行所述计算机程序以实现权利要求1至5任一项所述的方法。
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211568346.2A CN115578132A (zh) | 2022-12-08 | 2022-12-08 | 年龄校准方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211568346.2A CN115578132A (zh) | 2022-12-08 | 2022-12-08 | 年龄校准方法、装置、电子设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115578132A true CN115578132A (zh) | 2023-01-06 |
Family
ID=84590183
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211568346.2A Pending CN115578132A (zh) | 2022-12-08 | 2022-12-08 | 年龄校准方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115578132A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281634A (zh) * | 2014-03-13 | 2015-01-14 | 电子科技大学 | 一种基于邻居关系的移动用户基础属性预测方法 |
CN109376932A (zh) * | 2018-10-30 | 2019-02-22 | 平安医疗健康管理股份有限公司 | 基于预测模型的年龄预测方法、装置、服务器及存储介质 |
CN110196945A (zh) * | 2019-05-27 | 2019-09-03 | 北京理工大学 | 一种基于LSTM与LeNet融合的微博用户年龄预测方法 |
CN111325372A (zh) * | 2018-12-13 | 2020-06-23 | 北京京东尚科信息技术有限公司 | 预测模型的建立方法、预测方法、装置、介质及设备 |
-
2022
- 2022-12-08 CN CN202211568346.2A patent/CN115578132A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104281634A (zh) * | 2014-03-13 | 2015-01-14 | 电子科技大学 | 一种基于邻居关系的移动用户基础属性预测方法 |
CN109376932A (zh) * | 2018-10-30 | 2019-02-22 | 平安医疗健康管理股份有限公司 | 基于预测模型的年龄预测方法、装置、服务器及存储介质 |
CN111325372A (zh) * | 2018-12-13 | 2020-06-23 | 北京京东尚科信息技术有限公司 | 预测模型的建立方法、预测方法、装置、介质及设备 |
CN110196945A (zh) * | 2019-05-27 | 2019-09-03 | 北京理工大学 | 一种基于LSTM与LeNet融合的微博用户年龄预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107040397B (zh) | 一种业务参数获取方法及装置 | |
CN108563548B (zh) | 异常检测方法及装置 | |
CN109948641B (zh) | 异常群体识别方法及装置 | |
Fernández‐Fontelo et al. | Untangling serially dependent underreported count data for gender‐based violence | |
CN108416624A (zh) | 一种优惠券推送方法、装置、存储介质及智能终端 | |
CN110275965B (zh) | 假新闻检测方法、电子装置及计算机可读存储介质 | |
CN109345417B (zh) | 基于身份认证的业务人员的在线考核方法及终端设备 | |
Gupta et al. | Exchange rate returns and volatility: the role of time-varying rare disaster risks | |
CN111737246A (zh) | 一种数据融合方法、装置、电子设备及存储介质 | |
CN110348717B (zh) | 基于栅格粒度的基站价值评分方法和装置 | |
CN111475494A (zh) | 一种海量数据处理方法、系统、终端及存储介质 | |
CN113010785B (zh) | 用户推荐方法及设备 | |
CN113850669A (zh) | 用户分群方法、装置、计算机设备及计算机可读存储介质 | |
CN110334936B (zh) | 一种信贷资质评分模型的构建方法、装置和设备 | |
CN115578132A (zh) | 年龄校准方法、装置、电子设备及可读存储介质 | |
CN111275071A (zh) | 预测模型训练、预测方法、装置及电子设备 | |
CN113609271B (zh) | 基于知识图谱的业务处理方法、装置、设备及存储介质 | |
CN115033456A (zh) | 一种内网前端性能监控方法、装置、计算机设备及存储介质 | |
CN112329424A (zh) | 业务数据的处理方法和装置、存储介质和电子设备 | |
CN108510071B (zh) | 数据的特征提取方法、装置及计算机可读存储介质 | |
CN113157677A (zh) | 基于信托行为的数据过滤方法及装置 | |
CN111859985A (zh) | Ai客服模型测试方法、装置、电子设备及存储介质 | |
CN111161042A (zh) | 个人风险评估方法、装置、终端及存储介质 | |
CN113905400B (zh) | 网络优化处理方法、装置、电子设备及存储介质 | |
CN111652304B (zh) | 人员亲密度分析方法、终端及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230106 |