CN117113307A - 用户年龄的预测方法、装置、设备及介质 - Google Patents
用户年龄的预测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117113307A CN117113307A CN202311051882.XA CN202311051882A CN117113307A CN 117113307 A CN117113307 A CN 117113307A CN 202311051882 A CN202311051882 A CN 202311051882A CN 117113307 A CN117113307 A CN 117113307A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- age
- target
- confidence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000006399 behavior Effects 0.000 claims description 48
- 230000015654 memory Effects 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 14
- 230000014509 gene expression Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 3
- 238000010801 machine learning Methods 0.000 description 16
- 238000004422 calculation algorithm Methods 0.000 description 12
- 238000007637 random forest analysis Methods 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000013136 deep learning model Methods 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000036578 sleeping time Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书提供一种用户年龄的预测方法、装置、设备及介质。通过获取待进行年龄预测的目标用户的用户信息,用户信息至少包括目标用户的注册信息和目标用户所使用的登录设备的设备信息,以基于用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息,从而基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到目标用户的目标年龄信息。由于用户的注册信息和登录设备的设备信息都是在首次登录时就可以采集到的信息,不会涉及到用户隐私且采集难度较小,无论用户实名与否均可以获取到上述信息,从而可以在保护用户个人信息的前提下基于所获取到的信息实现用户年龄的智能计算。
Description
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种用户年龄的预测方法、装置、设备及介质。
背景技术
科技的迅猛发展推动了互联网应用产品的多样化,而对于很多互联网应用产品而言,不同年龄段的用户会有不同的使用需求、用户偏好和行为模式,因此,年龄是进行精准化用户推荐所必不可少的。
相关技术中,互联网应用产品一般都需要在用户完成实名制认证之后才能获取到实名用户的年龄,而对于未进行实名制的用户,互联网应用产品无法获取到其年龄。因此,亟需一种用户年龄的预测方法,以实现未实名用户的年龄的获取。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种用户年龄的预测方法、装置、设备及介质。
为实现上述目的,本说明书一个或多个实施例提供技术方案如下:
根据本说明书一个或多个实施例的第一方面,提出了一种用户年龄的预测方法,包括:
获取待进行年龄预测的目标用户的用户信息,用户信息至少包括目标用户的注册信息和目标用户所使用的登录设备的设备信息;
基于用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息;
基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到目标用户的目标年龄信息。
根据本说明书一个或多个实施例的第二方面,提出了一种用户年龄的预测装置,包括:
获取模块,用于获取待进行年龄预测的目标用户的用户信息,用户信息至少包括目标用户的注册信息和目标用户所使用的登录设备的设备信息;
第一预测模块,用于基于用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息;
第二预测模块,用于基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到目标用户的目标年龄信息。
根据本说明书一个或多个实施例的第三方面,提出了一种计算设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器通过运行可执行指令以实现如上述第一方面所描述的方法。
根据本说明书一个或多个实施例的第四方面,提出了一种计算机可读存储介质,其上存储有计算机指令,指令被处理器执行时实现如上述第一方面所描述的方法。
本说明书通过获取待进行年龄预测的目标用户的用户信息,其中,用户信息至少包括目标用户的注册信息和目标用户所使用的登录设备的设备信息,以基于用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息,从而基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到目标用户的目标年龄信息。由于用户的注册信息和登录设备的设备信息都是在首次登录时就可以采集到的信息,不会涉及到用户隐私且采集难度较小,无论用户实名与否均可以获取到上述信息,从而可以在保护用户个人信息的前提下基于所获取到的信息实现用户年龄的智能计算,另外,年龄预测采用两阶段联合预测的方式实现,使得年龄预测准确性可以更高。
附图说明
图1是一示例性实施例提供的一种用户年龄的预测方法的流程图。
图2是一示例性实施例提供的一种用户年龄的预测方法的流程示意图。
图3是一示例性实施例提供的另一种用户年龄的预测方法的流程图。
图4是一示例性实施例提供的一种第二年龄信息的预测过程的流程示意图。
图5是一示例性实施例提供的一种计算设备的示意结构图。
图6是一示例性实施例提供的一种用户年龄的预测装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
本说明书所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
一般而言,应用程序产品仅能直接获取到已实名用户的年龄信息,而无法直接获取到未实名用户的年龄信息,从而使得难以为未实名用户进行精准推荐。相关技术中,对于未实名用户,一般可以采用基于生物特征(如用户面容、用户声音等)预测用户年龄的方式实现未实名用户的年龄信息的获取,或者,可以采用基于用户的通讯录列表实现未实名用户的年龄信息的获取,但是生物特征和通讯录列表这类信息涉及到用户隐私,需要用户授权才能采集到这类信息,采集难度较大,从而使得年龄预测过程的顺利实现无法得到保障。
有鉴于此,本说明书期望提供一种用户年龄的预测方法,以在不获取用户生物特征等涉嫌用户隐私的信息的情况下,实现对用户年龄的预测。
上述用户年龄的预测方法可以由计算设备执行,计算设备可以为终端设备,如台式计算机、便携式计算机、平板电脑、笔记本电脑、智能手机等,或者,计算设备可以为服务器,如一台服务器、多台服务器、服务器集群、云计算平台等,本说明书对计算设备的设备类型不加以限定。
需要说明的是,计算设备可以在用户通过终端设备(也即是登录设备)登录应用程序产品时,通过本说明书所提供的用户年龄的预测方法,获取用户的注册信息和登录设备的设备信息这类容易采集的用户信息,并且,这类信息不会涉及到用户隐私,以便基于所获取到的用户信息实现用户年龄的预测,以达到在不获取涉及用户隐私的信息前提下,实现未实名用户的年龄预测。
可选地,应用程序产品可以为多种类型的产品,例如,应用程序产品可以为支付类应用程序产品、即时通讯类应用程序产品、多媒体播放类应用程序产品、生活服务类应用程序产品,等等,本说明书对应用程序产品的产品类型不加以限定。
上述仅为有关本说明书的应用场景的示例性说明,并不构成对本说明书的应用场景的限定,在更多可能的实现方式中,本说明书所提供的方案可以应用于更多需要进行年龄预测的场景中,本说明书对具体的应用场景不加以限定。
在介绍了本说明书的应用场景之后,接下来对本说明书的具体实现过程进行介绍。
参见图1,图1是一示例性实施例提供的一种用户年龄的预测方法的流程图,如图1所示,该方法包括:
步骤101、获取待进行年龄预测的目标用户的用户信息,用户信息至少包括目标用户的注册信息和目标用户所使用的登录设备的设备信息。
其中,目标用户可以为首次登录的用户,或者,目标用户可以为再次登录的用户,本说明书对此不加以限定。
需要说明的是,目标用户的注册信息和目标用户所使用的登录设备的设备信息是在用户首次登录的情况下就可以获取到的信息,也即是,当用户首次登录时,即可基于注册信息和登录设备的设备信息实现对首次登录的用户的年龄预测,不需要长时间的信息采集过程,而且无需获取涉及到用户隐私的信息(如人脸信息、通讯录列表等),即可达到较好的预测效果。
步骤102、基于用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息。
需要说明的是,用户信息中至少可以包括目标用户的注册信息和目标用户所使用的登录设备的设备信息,并且,注册信息和设备信息还可以进一步划分为多种信息类型不同或数据表现形式不同的信息,从而使得用户信息可以包括多种类型的信息。
可选地,可以基于用户信息中不同类型的信息分别进行预测,基于一种类型的信息即可获取到一个第一年龄信息以及该第一年龄信息的置信度信息,从而可以得到多个第一年龄信息以及每个第一年龄信息的置信度信息。
步骤103、基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到目标用户的目标年龄信息。
通过基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,相比一次预测而言,可以提高预测准确率,以获取到更为准确的目标年龄信息。
本说明书通过获取待进行年龄预测的目标用户的用户信息,其中,用户信息至少包括目标用户的注册信息和目标用户所使用的登录设备的设备信息,以基于用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息,从而基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到目标用户的目标年龄信息。由于用户的注册信息和登录设备的设备信息都是在首次登录时就可以采集到的信息,不会涉及到用户隐私且采集难度较小,无论用户实名与否均可以获取到上述信息,从而可以在保护用户个人信息的前提下基于所获取到的信息实现用户年龄的智能计算,另外,年龄预测采用两阶段联合预测的方式实现,使得年龄预测准确性可以更高。
在介绍了本说明书的基本实现过程之后,下面对本说明书的各个可选实施例进行详细介绍。
在一些实施例中,目标用户的用户信息可以包括目标用户的注册信息和目标用户所使用的登录设备的设备信息。其中,注册信息可以包括用户头像、用户名称(如用户昵称)和用户偏好信息中的至少一项,设备信息可以包括设备型号信息、操作系统信息和屏幕尺寸信息中的至少一项。
需要说明的是,注册信息中所提到的用户偏好信息可以是在用户注册时基于用户的设置获取到的。例如,在用户注册时,应用程序产品可以为用户提供多个可选的内容对象类型,用户可以从中选择自己感兴趣的内容对象类型,以便计算设备可以基于用户的选择实现用户偏好信息的获取。
例如,若应用程序产品为多媒体播放类应用程序产品,具体地,以应用程序产品为视频播放类应用程序产品为例,视频播放类应用程序产品可以在用户注册时提供多个可选的视频类型,包括但不限于歌舞类视频、动物类视频、模仿类视频、旅游类视频、搞笑类视频、美妆类视频、美食类视频等,用户可以根据自己的喜好从中选择自己感兴趣的视频类型,计算设备即可根据用户所选择的视频类型,获取到用户偏好信息。
需要说明的是,上述提及的用户信息均为在用户注册时即可获取到的信息,而且这些信息不会涉及到用户隐私、不需要长时间采集,从而可以在用户首次登录时即实现对用户年龄的预测。
此外,用户在应用程序产品中完成注册后,即可通过所注册的用户账号来对应用程序产品进行使用。在用户使用目标应用程序的过程中,应用程序产品可以对已采集的用户信息进行更新或采集新的用户信息。
可选地,应用程序产品可以对已采集的用户信息进行更新。例如,应用程序产品可以对在用户注册时所采集到的用户偏好信息进行更新。在一种可能的实现方式中,应用程序产品可以采集用户在其中的浏览行为、搜索行为、正反馈行为(如点赞、评论、加关注等)等多种类型的操作行为,从而根据用户在应用程序产品中的操作行为对用户注册时所获取到的用户偏好信息进行更新,以进一步提高所获取到的用户偏好信息的准确性。
或者,应用程序产品可以采集新的用户信息。例如,应用程序产品可以在用户使用应用程序产品的过程中采集用户行为信息,用户行为信息可以包括历史搜索行为、常用应用序列和用户端上行为中的至少一项。在一种可能的实现方式中,计算设备可以采集用户对各种应用程序产品的访问行为、搜索行为、正反馈行为(如点赞、评论、加关注等)、负反馈行为(如举报、拉黑等)等多种类型的操作行为,并且,可以采集用户访问各个应用程序产品的时间和频率、用户访问每个应用程序产品的时长、用户在每个应用程序产品中进行各种操作行为的时间以及各种操作行为的发生频率,从而根据所采集的数据获取用户行为信息。
其中,历史搜索行为可以包括用户历史搜索过程中所使用的搜索词;常用应用序列可以为按照用户对各个应用程序的访问频率和访问时长排序得到的应用序列,在常用应用序列中,访问频率越高、访问时长越长的应用程序产品的排序更加靠前;用户端上行为可以为用户访问各个应用程序产品的时间以及用户在不同应用程序产品中进行各种操作行为的时间。
通过在用户使用应用程序产品的过程中采集用户的多种操作行为,从而可以基于用户对应用程序产品的使用行为获取更多的用户信息,以辅助后续基于用户信息预测年龄的过程,进一步提高年龄预测的准确性。
在获取到如上所述的用户信息后,即可基于所获取到的用户信息来进行用户年龄的预测。
在一些实施例中,对于步骤102,在基于用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息时,可以通过如下方式实现:
在一种可能的实现方式中,可以将用户信息中信息表现形式相同的信息划分为一组,得到多组待处理信息,基于每组待处理信息确定一个第一年龄信息以及第一年龄信息的置信度信息,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息。
其中,信息表现形式可以为图像形式(或称图像型数据)、文本形式(或称文本型数据)和特征形式(或称特征型数据),信息表现形式相同的用户信息可以被划分为一组,从而可以得到多组用户信息。需要说明的是,特征型数据用于表示数据的特征或属性,特征数据可以包括数值型数据、分类型数据和顺序型数据。其中。数值型特征是具有连续值的特征,如身高、体重、温度等;分类型特征是具有固定类别的特征,如性别、颜色、地区等;顺序型特征是具有一定顺序关系的特征,如访问应用序列、教育程度的高低、产品评分的好坏等。
以用户信息包括注册信息、设备信息和用户行为信息为例,若注册信息包括用户头像、用户名称和用户偏好信息,设备信息包括设备型号信息、操作系统信息和屏幕尺寸信息,用户行为信息包括历史搜索行为(也即是搜索词)、常用应用序列和用户端上行为,其中,图像型数据的用户信息仅有用户头像,则可以将用户头像单独划分为一组用户信息,文本型数据的用户信息包括用户名称和历史搜索行为,则可以将用户名称和历史搜索行为划分为一组用户信息,特征型数据的用户信息包括用户偏好信息、设备型号信息、操作系统信息、屏幕尺寸信息、常用应用序列和用户端上行为,则可以将用户偏好信息、设备型号信息、操作系统信息、屏幕尺寸信息、常用应用序列和用户端上行为划分为一组用户信息。对于上述特征型数据,屏幕尺寸信息为数值型数据,用户偏好信息、设备型号信息、操作系统信息和用户端上行为为分类型数据,常用应用序列为顺序型数据。
在按照上述方式实现用户信息分组之后,即可分别对每组用户信息进行处理,以实现用户年龄的初步预测。
可选地,可以通过多种机器学习模型来实现多个第一年龄信息以及每个第一年龄信息的置信度信息的获取。例如,可以提供随机森林、决策树、逻辑回归、支持向量机或神经网络模型等机器学习模型,来对数据表现形式不同的用户信息进行预测。
需要说明的是,由于机器学习模型处理的都是满足其格式要求的特征数据,因而,在更多可能的实现方式中,在获取到用户信息之后,需要对用户信息进行预处理,以将用户信息转换为进行年龄预测所需的信息格式,也即是,将用户信息转换为模型可以识别的特征数据。
可选地,在对用户信息进行预处理时,不同信息表现形式的用户信息可以有不同的预处理方式,可以根据用户信息的信息表现形式来采用相应的预处理方式。
例如,对于图像型数据,可以采用将图像调整为机器学习模型所需的输入大小、对图像进行标准化处理之类的方式实现预处理;对于文本型数据,可以采用将文本转换为特征向量的方式实现预处理;对于特征型数据,若特征型数据为数值型数据,则可以采用最大值最小值归一化、数据标准化之类的方式实现预处理,若特征型数据为分类型数据,则可以采用将分类型特征进行编码(例如使用独热编码或标签编码)的方式实现预处理,若特征型数据为顺序型数据,则可以通过使用整数编码或者自定义映射函数来表示顺序关系的方式实现预处理。
以用户信息包括注册信息、设备信息和用户行为信息为例,若注册信息包括用户头像、用户名称和用户偏好信息,设备信息包括设备型号信息、操作系统信息和屏幕尺寸信息,用户行为信息包括历史搜索行为、常用应用序列和用户端上行为,则可以按照上述用户信息中的每种信息的信息类型,分别对每种用户信息进行预处理,以将上述各种用户信息转换为机器学习模型可以识别的特征数据。
在通过上述方式实现对各种用户信息的预处理之后,即可将同种类型的信息对应的特征数据输入至同一机器学习模型,以便可以通过相应模型实现第一年龄信息及其置信度信息的预测。
可选地,基于图像型数据的年龄预测可以通过基于目标检测算法(如YOLO算法)的深度学习模型实现,基于文本型数据的年龄预测可以通过基于长短期记忆网络(LongShort-Term Memory,LSTM)的回归网络模型实现,基于特征型数据的年龄预测可以通过基于随机森林算法的机器学习模型实现。
也即是,可以将用户头像输入基于目标检测算法的深度学习模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息;可以将用户名称和历史搜索行为输入基于LSTM的回归网络模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息;可以将用户偏好信息、设备型号信息、操作系统信息、屏幕尺寸信息、常用应用序列和用户端上行为输入基于随机森林算法的机器学习模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息。
需要说明的是,上述实施例是以将信息表现形式相同的用户信息作为一组,以基于每组用户信息预测一个第一年龄信息及其置信度信息为例来进行说明的,在另一种可能的实现方式中,还可以基于注册信息和设备信息中的每个信息分别确定一个第一年龄信息以及第一年龄信息的置信度信息,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息。
仍以用户信息包括注册信息、设备信息和用户行为信息为例,若注册信息包括用户头像、用户名称和用户偏好信息,设备信息包括设备型号信息、操作系统信息和屏幕尺寸信息,用户行为信息包括历史搜索行为、常用应用序列和用户端上行为,则可以将用户头像输入基于目标检测算法的深度学习模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息;可以将用户名称输入基于LSTM的回归网络模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息;可以将历史搜索行为输入基于LSTM的回归网络模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息;可以将用户偏好信息输入基于随机森林算法的机器学习模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息;可以将设备型号信息基于随机森林算法的机器学习模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息;可以将操作系统信息基于随机森林算法的机器学习模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息;可以将屏幕尺寸信息基于随机森林算法的机器学习模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息;可以将常用应用序列基于随机森林算法的机器学习模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息;可以将用户端上行为输入基于随机森林算法的机器学习模型,以输出一个第一年龄信息以及该第一年龄信息的置信度信息。
上述仅为几种示例性的机器学习模型,在更多可能的实现方式中,还可以采用其他类型的机器模型来实现第一年龄信息及其置信度信息的获取,本说明书对具体采用哪种机器学习模型不加以限定。
需要说明的是,置信度信息可以用于表示所预测出的第一年龄信息的准确程度,置信度信息可以以概率或得分的形式表示,其取值范围可以在0到1之间。
在通过上述实施例获取到多个第一年龄信息以及每个第一年龄信息的置信度信息之后,即可通过步骤103,基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到目标用户的目标年龄信息。
在一些实施例中,对于步骤103,在基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到目标用户的目标年龄信息时,可以通过如下步骤实现:
步骤1031、基于多个第一年龄信息的置信度信息对多个第一年龄信息进行负反馈处理,以得到每个第一年龄信息对应的权重信息。
在一种可能的实现方式中,对于任一第一年龄信息,可以基于该第一年龄信息的置信度信息,结合预先设置好的映射关系,确定该第一年龄信息对应的权重关系。
需要说明的是,预先设置好的映射关系可以采用线性回归模型,在预先设置好的映射关系中,每个置信度信息会对应于一个权重信息,置信度信息和权重信息之间可以呈正相关关系,也即是,若置信度信息指示结果置信度越高,则其对应的权重信息也会越高。
步骤1032、基于多个第一年龄信息各自对应的权重信息,对多个第一年龄信息进行加权平均,得到目标年龄信息。
需要说明的是,上述步骤1031至步骤1032可以通过梯度提升模型(如梯度提升树XGBoost模型)实现,也即是,可以将多个第一年龄信息以及每个第一年龄信息的置信度信息输入至梯度提升模型,以通过梯度提升模型执行上述步骤1031至步骤1032,以实现目标年龄信息的获取。可选地,还可以采用除XGBoost模型之外的其他机器模型实现用户年龄的二阶段预测,本说明书对此不加以限定。
上述实施例通过多模型的二阶段联合预测实现最终的目标年龄信息的获取,相比于基于单一特征的预测过程,准确性更高。
上述实施例所提供的用户年龄的预测方法的流程示意图可以参见图2,图2是一示例性实施例提供的一种用户年龄的预测方法的流程示意图,如图2所示,在用户通过终端设备登录应用程序产品(也即是用户登端)后,可以通过数据采集的方式采集该用户的用户信息,并对采集到的信息进行数据预处理,从而根据数据预处理后得到的结果进行分模型预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息,进而基于多个第一年龄信息以及每个第一年龄信息的置信度信息,通过二阶段模型预测来获取最终预测得到的目标年龄信息,以实现用户年龄的预测。
上述实施例主要介绍了基于包括注册信息、设备信息和用户行为信息的用户信息实现用户年龄预测的过程,在更多可能的实现方式中,还可以基于目标用户所连接的无线局域网(Wireless Fidelity,WiFi)信息预测一个第二年龄信息以及该第二年龄信息的置信度信息,从而将第二年龄信息以及该第二年龄信息的置信度信息也作为二阶段预测的数据来源。
参见图3,图3是一示例性实施例提供的另一种用户年龄的预测方法的流程图,如图3所示,该方法包括:
步骤301、获取待进行年龄预测的目标用户的用户信息,用户信息至少包括目标用户的注册信息和目标用户所使用的登录设备的设备信息。
步骤302、基于用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息;
需要说明的是,上述步骤301和步骤302的实现过程可以参见图1所对应的实施例,此处不再赘述。
步骤303、基于登录设备所连接的无线局域网信息,获取第二年龄信息以及第二年龄信息的置信度信息。
在一种可能的实现方式中,上述步骤303可以通过如下步骤实现:
步骤3031、基于登录设备所连接的无线局域网信息,获取在设定时间段内连接过无线局域网信息的关联用户。
其中,设定时间段可以为30天内。也即是,可以基于登录设备所连接的无线局域网信息(也即是WiFi信息),获取在最近30天内连接过该无线局域网的用户,作为关联用户。
需要说明的是,若登录设备未连接无线局域网或者其所连接的无线局域网在设定时间段内未被其他用户连接过,则无需进行连接用户的获取,而仅按照步骤103的指示,基于多个第一年龄信息以及每个第一年龄信息的置信度信息实现目标年龄信息的获取即可。
步骤3032、为关联用户和目标用户构建用户关系图谱,用户关系图谱用于指示各个关联用户与目标用户之间的预测关联关系以及预测关联关系的置信度信息。
其中,关联用户中可以包括已实名用户和未实名用户。基于此,在为关联用户和目标用户构建用户关系图谱时,可以通过如下方式实现:
获取已实名用户的年龄信息;以已实名用户和目标用户作为图谱节点,基于已实名用户的年龄信息在各个图谱节点之间生成边,并将未实名用户作为图谱标注信息,以构建用户关系图谱。
需要说明的是,在基于已实名用户的年龄信息在各个图谱节点之间生成边时,可以基于已实名用户的年龄信息预测各个已实名用户之间、以及每个已实名用户和目标用户之间的关联关系,以按照所预测出的关联关系在各个图谱节点之间生成边。
其中,关联关系可以为用户在社交属性上的关系,如亲属关系、社交关系等。另外,需要说明的是,由于用户关系图谱中各个用户之间的关联关系也是预测出来的,因此,用户关系图谱中的每个关联关系都会对应于一个置信度信息。
需要说明的是,上述实施例是以获取到关联用户即基于所获取到的关联用户来构建用户关系图谱为例来进行说明的,在更多可能的实现方式中,在获取设定时间段内连接过无线局域网信息的关联用户时,还可以获取该无线局域网信息所指示的无线局域网的连接信息,以便基于连接信息对该无线局域网进行检测,从而根据检测结果确定是否可以构建用户关系图谱。
其中,连接信息可以为连接时间、连接时长、连接用户等。可选地,在基于连接信息对该无线局域网进行检测时,可以确定连接时间、连接时长、连接频率等连接信息是否满足第一设定条件,若满足,则可以确定该无线局域网为无效WiFi,从而无需为关联用户和目标用户构建用户关系图谱。
例如,若某个无线局域网中各个连接用户的连接时间一般为午饭时间或晚饭时间,连接时长一般为一个小时,且连接用户的数量大于设定数量阈值,则可以确定该无线局域网为餐厅WiFi。又例如,若某个无线局域网中各个连接用户的连接时间一般为晚上睡觉时间,连接时长一般为睡眠时间,且连接用户的数量大于设定数量阈值,则可以确定该无线局域网为酒店WiFi。餐厅WiFi、酒店WiFi都属于公共性WiFi,这种公共性WiFi连接的用户之间在社交上一般没有交集,即使基于这类WiFi构建了用户关系图谱,其结果也是没有指导性的,因而可以将这类WiFi作为无效WiFi,从而使得无需基于这类WiFi所指示的关联用户和目标用户来进行用户关系图谱的构建。
通过基于无线局域网的连接信息对用户所连接的无线局域网是否为有效WiFi进行检测,以及时过滤掉无效WiFi,从而使得基于无效WiFi的连接用户构建用户关系图谱并进行第二年龄信息的预测,避免影响目标年龄信息的预测。
步骤3033、基于用户关系图谱,获取第二年龄信息以及第二年龄信息的置信度信息。
可选地,可以基于用户关系图谱中置信度信息满足第二设定条件的目标关联用户、目标关联用户的年龄信息以及目标关联用户与目标用户之间的预测关联关系,确定第二年龄信息以及第二年龄信息的置信度信息。
例如,可以按照置信度信息从高到低的顺序对用户关系图谱中的关联关系进行排序,从而可以将排序位于前5的置信度信息所指示的关联关系对应的关联用户作为目标关联用户,以基于目标关联用户与目标用户之间的预测关联关系,预测目标用户的第二年龄信息以及第二年龄信息的置信度信息。
上述确定第二年龄信息的过程可以参见图4,图4是一示例性实施例提供的一种第二年龄信息的预测过程的流程示意图,如图4所示,可以获取目标用户所使用的登录设备所连接的WiFi的WiFi信息,从而获取当前WiFi近30天内的连接用户,并获取各个连接用户的连接信息,以基于所获取到的连接信息过滤无效WiFi。然后,基于有效WiFi的连接用户预测目标用户的已有社会关系,以实现用户关系图谱的构建,从而基于所构建的用户关系图谱实现用户年龄的预测,以获取到第二年龄信息和第二年龄信息的置信度,最后可以将第二年龄信息和第二年龄信息作为二阶段预测的输入,来进行最终的目标年龄信息的预测。
需要说明的是,上述步骤301至步骤303的标号并不构成对其执行顺序的限定,可选地,可以先执行步骤301和步骤302,再执行步骤303,或者,可以先执行步骤303,再执行步骤301和步骤302,本说明书对此不加以限定。
步骤304、基于多个第一年龄信息、每个第一年龄信息的置信度信息、第二年龄信息以及第二年龄信息的置信度信息进行二阶段预测,以得到目标年龄信息。
需要说明的是,该步骤304的实现过程与步骤103及其对应的实现过程同理,此处不再赘述。
另外,需要说明的是,上述内容中提及的第一年龄信息、第二年龄信息和目标年龄信息可以为一个具体的年龄值或一个年龄段(或称年龄区间),本说明书对此不加以限定,但是,需要注意的是,第一年龄信息、第二年龄信息和目标年龄信息的类型需保持一致,也即是,第一年龄信息、第二年龄信息和目标年龄信息均为可具体的年龄值,或者,第一年龄信息、第二年龄信息和目标年龄信息均为年龄区间。
上述实施例通过基于目标用户所使用的登录设备所连接的无线局域网,预测目标用户与在设定时间段内连接过同一无线局域网的关联用户之间的关联关系,以基于预测出的关联关系实现目标用户年龄的初步预测,可以扩展年龄预测渠道。而且,上述基于WiFi信息初步预测目标用户年龄的过程仅需获取用户所连接的WiFi,而不会涉及到用户隐私,从而可以在保证用户隐私安全的前提下实现用户年龄的预测。
另外,需要说明的是,无论用户实名与否,均可以获取到其所连接的WiFi,从而可以基于WiFi信息预测出第二年龄信息,所预测出的第二年龄信息可以作为二阶段预测用户年龄的输入,以扩展二阶段预测的输入数据来源,从而可以提高最终确定出的目标年龄信息的准确程度。
而且,尤其是对于未实名的新注册用户,其用户信息本身就比较少,从而使得年龄预测难度较大,而本说明书通过提供一种基于WiFi信息预测用户年龄的方式,无论用户是否是新注册用户,均能基于其所连接的WiFi实现年龄预测,并将基于WiFi信息预测出的用户年龄作为二阶段预测过程的输入,以提高最终预测出的目标年龄信息的准确程度。
对于未实名用户(尤其是未实名的新注册用户)而言,以提高最终预测得到的目标年龄信息的准确程度。
与前述方法的实施例相对应,本说明书还提供了对应的设备实施例。
参见图5,图5是一示例性实施例提供的一种计算设备的示意结构图。请参考图5,在硬件层面,该设备包括处理器502、内部总线504、网络接口506、内存508以及非易失性存储器510,当然还可能包括其他任务所需要的硬件。本说明书一个或多个实施例可以基于软件方式来实现,比如由处理器502从非易失性存储器510中读取对应的计算机程序到内存508中然后运行。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本说明书还提供了一种用户年龄的预测装置,请参考图6,图6是一示例性实施例提供的一种用户年龄的预测装置的框图,该用户年龄的预测装置可以应用于如图5所示的计算设备中,以实现本说明书的技术方案。其中,该用户年龄的预测装置可以包括:
获取模块601,用于获取待进行年龄预测的目标用户的用户信息,用户信息至少包括目标用户的注册信息和目标用户所使用的登录设备的设备信息;
第一预测模块602,用于基于用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息;
第二预测模块603,用于基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到目标用户的目标年龄信息。
在一些实施例中,第二预测模块603,在用于基于多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到目标用户的目标年龄信息时,用于:
基于多个第一年龄信息的置信度信息对多个第一年龄信息进行负反馈处理,以得到每个第一年龄信息对应的权重信息;
基于多个第一年龄信息各自对应的权重信息,对多个第一年龄信息进行加权平均,得到目标年龄信息。
在一些实施例中,注册信包括用户头像、用户名称和用户偏好信息中的至少一项,设备信息包括设备型号信息、操作系统信息和屏幕尺寸信息中的至少一项。
在一些实施例中,第一预测模块602,在用于基于用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息时,用于下述任一项:
将用户信息中信息表现形式相同的信息划分为一组,得到多组待处理信息,基于每组待处理信息确定一个第一年龄信息以及第一年龄信息的置信度信息,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息;
基于注册信息和设备信息中的每个信息分别确定一个第一年龄信息以及第一年龄信息的置信度信息,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息。
在一些实施例中,用户信息还包括用户行为信息,用户行为信息包括历史搜索行为、常用应用序列和用户端上行为中的至少一项。
在一些实施例中,该装置还包括:
预处理模块,用于对用户信息进行预处理,以将用户信息转换为进行年龄预测所需的信息格式。
在一些实施例中,获取模块601,还用于基于登录设备所连接的无线局域网信息,获取第二年龄信息以及第二年龄信息的置信度信息;
第二预测模块603,还用于基于多个第一年龄信息、每个第一年龄信息的置信度信息、第二年龄信息以及第二年龄信息的置信度信息进行二阶段预测,以得到目标年龄信息。
在一些实施例中,获取模块601,在用于基于登录设备所连接的无线局域网信息,获取第二年龄信息以及第二年龄信息的置信度信息时,用于:
基于登录设备所连接的无线局域网信息,获取在设定时间段内连接过无线局域网信息的关联用户;
为关联用户和目标用户构建用户关系图谱,用户关系图谱用于指示各个关联用户与目标用户之间的预测关联关系以及预测关联关系的置信度信息;
基于用户关系图谱,获取第二年龄信息以及第二年龄信息的置信度信息。
在一些实施例中,获取模块601,还用于:
获取无线局域网信息所指示的无线局域网的连接信息;
若连接信息满足第一设定条件,则将无需为关联用户和目标用户构建用户关系图谱。
在一些实施例中,关联用户包括已实名用户和未实名用户;
获取模块601,在用于为关联用户和目标用户构建用户关系图谱时,用于:
获取已实名用户的年龄信息;
以已实名用户和目标用户作为图谱节点,基于已实名用户的年龄信息在各个图谱节点之间生成边,并将未实名用户作为图谱标注信息,以构建用户关系图谱。
在一些实施例中,获取模块601,在用于基于用户关系图谱,获取第二年龄信息以及第二年龄信息的置信度信息时,用于:
基于用户关系图谱中置信度信息满足第二设定条件的目标关联用户、目标关联用户的年龄信息以及目标关联用户与目标用户之间的预测关联关系,确定第二年龄信息以及第二年龄信息的置信度信息。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
在一个典型的配置中,计算机包括一个或多个处理器(Central ProcessingUnit,CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RandomAccess Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read-Only Memory,ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase Change Random AccessMemory,PRAM)、静态随机存取存储器(Static Random Access Memory,SRAM)、动态随机存取存储器(Dynamic Random Access Memory,DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(Electrically Erasable ProgrammableRead-Only Memory,EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CompactDisc Read-Only Memory,CD-ROM)、数字多功能光盘(Digital Video Disc,DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(Transitory Media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。
Claims (14)
1.一种用户年龄的预测方法,包括:
获取待进行年龄预测的目标用户的用户信息,所述用户信息至少包括所述目标用户的注册信息和所述目标用户所使用的登录设备的设备信息;
基于所述用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息;
基于所述多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到所述目标用户的目标年龄信息。
2.根据权利要求1所述的方法,所述基于所述多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到所述目标用户的目标年龄信息,包括:
基于所述多个第一年龄信息的置信度信息对所述多个第一年龄信息进行负反馈处理,以得到每个第一年龄信息对应的权重信息;
基于所述多个第一年龄信息各自对应的权重信息,对所述多个第一年龄信息进行加权平均,得到所述目标年龄信息。
3.根据权利要求1所述的方法,所述注册信息包括用户头像、用户名称和用户偏好信息中的至少一项,所述设备信息包括设备型号信息、操作系统信息和屏幕尺寸信息中的至少一项。
4.根据权利要求3所述的方法,所述基于所述用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息,包括下述任一项:
将所述用户信息中信息表现形式相同的信息划分为一组,得到多组待处理信息,基于每组待处理信息确定一个第一年龄信息以及所述第一年龄信息的置信度信息,以得到所述多个第一年龄信息以及每个第一年龄信息的置信度信息;
基于所述注册信息和所述设备信息中的每个信息分别确定一个第一年龄信息以及所述第一年龄信息的置信度信息,以得到所述多个第一年龄信息以及每个第一年龄信息的置信度信息。
5.根据权利要求3所述的方法,所述用户信息还包括用户行为信息,所述用户行为信息包括历史搜索行为、常用应用序列和用户端上行为中的至少一项。
6.根据权利要求1所述的方法,所述基于所述用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息之前,所述方法还包括:
对所述用户信息进行预处理,以将所述用户信息转换为进行年龄预测所需的信息格式。
7.根据权利要求1所述的方法,所述方法还包括:
基于所述登录设备所连接的无线局域网信息,获取第二年龄信息以及所述第二年龄信息的置信度信息;
基于所述多个第一年龄信息、每个第一年龄信息的置信度信息、所述第二年龄信息以及所述第二年龄信息的置信度信息进行二阶段预测,以得到所述目标年龄信息。
8.根据权利要求7所述的方法,所述基于所述登录设备所连接的无线局域网信息,获取第二年龄信息以及所述第二年龄信息的置信度信息,包括:
基于所述登录设备所连接的无线局域网信息,获取在设定时间段内连接过所述无线局域网信息的关联用户;
为所述关联用户和所述目标用户构建用户关系图谱,所述用户关系图谱用于指示各个关联用户与所述目标用户之间的预测关联关系以及所述预测关联关系的置信度信息;
基于所述用户关系图谱,获取所述第二年龄信息以及所述第二年龄信息的置信度信息。
9.根据权利要求8所述的方法,所述为所述关联用户和所述目标用户构建用户关系图谱之前,所述方法还包括:
获取所述无线局域网信息所指示的无线局域网的连接信息;
若所述连接信息满足第一设定条件,则将无需为所述关联用户和所述目标用户构建用户关系图谱。
10.根据权利要求8所述的方法,所述关联用户包括已实名用户和未实名用户;
所述为所述关联用户和所述目标用户构建用户关系图谱,包括:
获取所述已实名用户的年龄信息;
以所述已实名用户和所述目标用户作为图谱节点,基于所述已实名用户的年龄信息在各个图谱节点之间生成边,并将所述未实名用户作为图谱标注信息,以构建所述用户关系图谱。
11.根据权利要求8所述的方法,所述基于所述用户关系图谱,获取所述第二年龄信息以及所述第二年龄信息的置信度信息,包括:
基于所述用户关系图谱中置信度信息满足第二设定条件的目标关联用户、所述目标关联用户的年龄信息以及所述目标关联用户与所述目标用户之间的预测关联关系,确定所述第二年龄信息以及所述第二年龄信息的置信度信息。
12.一种用户年龄的预测装置,包括:
获取模块,用于获取待进行年龄预测的目标用户的用户信息,所述用户信息至少包括所述目标用户的注册信息和所述目标用户所使用的登录设备的设备信息;
第一预测模块,用于基于所述用户信息中不同类型的信息分别进行预测,以得到多个第一年龄信息以及每个第一年龄信息的置信度信息;
第二预测模块,用于基于所述多个第一年龄信息以及每个第一年龄信息的置信度信息进行二阶段预测,以得到所述目标用户的目标年龄信息。
13.一种计算设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1-11中任一项所述的方法。
14.一种计算机可读存储介质,其上存储有计算机指令,所述指令被处理器执行时实现如权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311051882.XA CN117113307A (zh) | 2023-08-18 | 2023-08-18 | 用户年龄的预测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311051882.XA CN117113307A (zh) | 2023-08-18 | 2023-08-18 | 用户年龄的预测方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117113307A true CN117113307A (zh) | 2023-11-24 |
Family
ID=88806909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311051882.XA Pending CN117113307A (zh) | 2023-08-18 | 2023-08-18 | 用户年龄的预测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117113307A (zh) |
-
2023
- 2023-08-18 CN CN202311051882.XA patent/CN117113307A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6862579B2 (ja) | 画像特徴の取得 | |
CN108304429B (zh) | 信息推荐方法、装置和计算机设备 | |
US8422747B1 (en) | Finding untagged images of a social network member | |
CN108717408B (zh) | 一种敏感词实时监控方法、电子设备、存储介质及系统 | |
KR102288249B1 (ko) | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 | |
US11704500B2 (en) | Techniques to add smart device information to machine learning for increased context | |
CN106845644B (zh) | 一种通过相互关系学习用户及移动应用的联系的异构网络 | |
US9286379B2 (en) | Document quality measurement | |
CN105574067A (zh) | 项目推荐装置以及项目推荐方法 | |
CN108520046B (zh) | 搜索聊天记录的方法及设备 | |
CN112182230B (zh) | 一种基于深度学习的文本数据分类方法和装置 | |
US12008039B2 (en) | Method and apparatus for performing categorised matching of videos, and selection engine | |
CN111435369B (zh) | 音乐推荐方法、装置、终端及存储介质 | |
CN110110218B (zh) | 一种身份关联方法及终端 | |
CN112069326A (zh) | 知识图谱的构建方法、装置、电子设备及存储介质 | |
CN110737811A (zh) | 应用分类方法、装置以及相关设备 | |
CN117409419A (zh) | 图像检测方法、设备及存储介质 | |
CN115879508A (zh) | 一种数据处理方法及相关装置 | |
CN113656699B (zh) | 用户特征向量确定方法、相关设备及介质 | |
CN114223012A (zh) | 推送对象确定方法、装置、终端设备及存储介质 | |
CN112818114B (zh) | 信息的分类方法、检测方法、计算设备及存储介质 | |
CN117392714A (zh) | 基于半监督学习的人脸美丽预测方法、设备及介质 | |
CN109241249B (zh) | 一种确定突发问题的方法及装置 | |
CN115391489A (zh) | 基于知识图谱的话题推荐方法 | |
CN115422346A (zh) | 基于知识图谱的多轮话题推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |