CN113505308B - 一种用户年龄的预测方法及装置、可读存储介质 - Google Patents

一种用户年龄的预测方法及装置、可读存储介质 Download PDF

Info

Publication number
CN113505308B
CN113505308B CN202111053004.2A CN202111053004A CN113505308B CN 113505308 B CN113505308 B CN 113505308B CN 202111053004 A CN202111053004 A CN 202111053004A CN 113505308 B CN113505308 B CN 113505308B
Authority
CN
China
Prior art keywords
user
predicted
age
similarity
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111053004.2A
Other languages
English (en)
Other versions
CN113505308A (zh
Inventor
张猛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Easy Yikang Information Technology Co ltd
Original Assignee
Beijing Qingsongchou Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qingsongchou Information Technology Co ltd filed Critical Beijing Qingsongchou Information Technology Co ltd
Priority to CN202111053004.2A priority Critical patent/CN113505308B/zh
Publication of CN113505308A publication Critical patent/CN113505308A/zh
Application granted granted Critical
Publication of CN113505308B publication Critical patent/CN113505308B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种用户年龄的预测方法及装置、可读存储介质。用户年龄的预测方法,包括:获取预设的用户关系链;所述预设的用户关系链中包括:不同维度的用户关系信息;根据所述预设的用户关系链确定待预测用户与所述待预测用户的各个一度好友之间的相似度;所述待预测用户为所述预设的用户关系链中的任意一个用户,所述相似度用于表征所述待预测用户与各个所述一度好友之间的关系亲密度;从各个所述一度好友中确定出满足预设的相似度条件且具有年龄信息的多个目标一度好友;根据所述多个目标一度好友的年龄信息确定所述待预测用户的预测年龄。该方法用以实现用户年龄的有效且准确的预测。

Description

一种用户年龄的预测方法及装置、可读存储介质
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种用户年龄的预测方法及装置、可读存储介质。
背景技术
目前,在社交网络中,年龄信息是一项重要的用户信息,年龄信息在很多应用场景下具有应用性。在注册社交平台时,一些用户会主动的提供年龄信息;而有一些用户不会主动的提供年龄信息。在没有年龄信息的情况下,便需要对用户的年龄进行预测。
现有技术中,缺少有效且准确的对用户年龄进行预测的方法。
发明内容
本申请实施例的目的在于提供一种用户年龄的预测方法及装置、可读存储介质,用以实现用户年龄的有效且准确的预测。
第一方面,本申请实施例提供一种用户年龄的预测方法,包括:获取预设的用户关系链;所述预设的用户关系链中包括:不同维度的用户关系信息;根据所述预设的用户关系链确定待预测用户与所述待预测用户的各个一度好友之间的相似度;所述待预测用户为所述预设的用户关系链中的任意一个用户,所述相似度用于表征所述待预测用户与各个所述一度好友之间的关系亲密度;从各个所述一度好友中确定出满足预设的相似度条件且具有年龄信息的多个目标一度好友;根据所述多个目标一度好友的年龄信息确定所述待预测用户的预测年龄。
在本申请实施例中,与现有技术相比,基于预设的用户关系链对用户年龄进行预测。在预设的用户关系链中,包括:不同维度的用户关系信息。基于该用户关系信息,可以确定预设的用户关系链中的任意一个用户(即待预测用户)与其各个一度好友之间的相似度,该相似度表征待预测用户与其各个一度好友之间的关系亲密度;基于该相似度,进一步确定出目标一度好友,最终再通过目标一度好友的年龄信息确定待预测用户的预测年龄,实现用户年龄的有效预测。并且,由于目标一度好友与待预测用户的相似度满足预设的相似度条件,则目标一度好友其与待预测用户之间的关系亲密度也满足一定的条件,进而,最终所确定的预测年龄的准确性也更高,实现用户年龄的准确预测。
作为一种可能的实现方式,所述不同维度的用户关系信息包括:分享维度的用户关系信息、浏览维度的用户关系信息和捐款维度的用户关系信息;所述根据所述预设的用户关系链确定待预测用户与所述待预测用户的各个一度好友之间的相似度,包括:根据所述分享维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第一相似度;根据所述浏览维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第二相似度;根据所述捐款维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第三相似度;根据所述第一相似度、所述第二相似度和所述第三相似度确定最终的相似度。
在本申请实施例中,不同维度的用户信息包括:分享维度的用户关系信息、浏览维度的用户关系信息和捐款维度的用户关系信息;通过这三个维度的关系信息,分别确定不同维度下待预测用户与各个一度好友之间的相似度,然后再结合不同维度下待预测用户与各个一度好友之间的相似度确定最终的相似度,实现相似度的有效且准确的确定。
作为一种可能的实现方式,所述分享维度的用户关系信息中包括:用户之间的分享次数;所述根据所述分享维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第一相似度,包括:确定所述待预测用户和各个所述一度好友之间的分享次数中的最多分享次数和最少分享次数;根据所述待预测用户和各个所述一度好友之间的分享次数、所述最多分享次数和所述最少分享次数确定所述第一相似度。
在本申请实施例中,针对分享维度,先确定最多分享次数和最少分享次数,然后再结合待预测用户和各个一度好友之间的分享次数确定第一相似度,实现第一相似度的有效且准确的确定。
作为一种可能的实现方式,所述浏览维度的用户关系信息包括:用户之间的浏览次数;所述根据所述浏览维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第二相似度,包括:确定所述待预测用户和各个所述一度好友之间的浏览次数中的最多浏览次数和最少浏览次数;根据所述待预测用户和各个所述一度好友之间的浏览次数、所述最多浏览次数和所述最少浏览次数确定所述第二相似度。
在本申请实施例中,针对浏览维度,先确定最多浏览次数和最少浏览次数,然后再结合待预测用户和各个一度好友之间的浏览次数确定第二相似度,实现第二相似度的有效且准确的确定。
作为一种可能的实现方式,所述捐款维度的用户关系信息包括:用户之间的捐款总金额;所述根据所述捐款维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第三相似度,包括:确定所述待预测用户和各个所述一度好友之间的捐款总金额中的最多捐款总金额和最少捐款总金额;根据所述待预测用户和各个所述一度好友之间的捐款总金额、所述最多捐款总金额和所述最少捐款总金额确定所述第三相似度。
在本申请实施例中,针对捐款维度,先确定最多捐款总金额和最少捐款总金额,然后再结合待预测用户和各个一度好友之间的捐款总金额确定第三相似度,实现第三相似度的有效且准确的确定。
作为一种可能的实现方式,所述根据所述多个目标一度好友的年龄信息确定所述待预测用户的预测年龄,包括:根据所述多个目标一度好友的年龄信息确定出所述待预测用户的预测年龄区间;根据所述预测年龄区间和预设的对应关系确定所述待预测用户的预测年龄;所述预设的对应关系为预测年龄区间与预测年龄之间的对应关系。
在本申请实施例中,先根据多个目标一度好友的年龄信息确定出待预测用户的预测年龄区间,再结合预设的对应关系确定出待预测用户的预测年龄,实现预测年龄的有效且准确的确定。
作为一种可能的实现方式,所述预测年龄区间为所述多个目标一度好友分别对应的年龄区间中频次最高的年龄区间。
在本申请实施例中,通过将多个目标一度好友分别对应的年龄区间中频次最高的年龄区间确定为预测年龄区间,提高预测年龄区间的准确性。
作为一种可能的实现方式,所述待预测用户的预测年龄用于判断是否向所述待预测用户推送业务推荐信息。
在本申请实施例中,最终确定的预测年龄可以用于判断是否向待预测用户推送业务推荐信息,基于更准确的预测年龄,可以实现更准确且有效的推送。
第二方面,本申请实施例提供一种用户年龄的预测装置,包括用于实现第一方面以及第一方面的任意一种可能的实现方式中所述的用户年龄的预测方法的各个功能模块。
第三方面,本申请实施例提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被计算机运行时,执行如第一方面以及第一方面的任意一种可能的实现方式中所述的用户年龄的预测方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的用户年龄的预测方法的流程图;
图2为本申请实施例提供的用户年龄的预测装置的结构示意图。
图标:200-用户年龄的预测装置;210-获取模块;220-处理模块。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请实施例所提供的用户年龄的预测方法可以应用于各类需要进行年龄预测的应用场景,例如:应用程序的推荐、公司业务的推荐等应用场景中。举例来说,假设当前需要进行应用程序的推荐,而该应用程序可能只有年轻人有需求,则,此时便可以根据用户的年龄进行针对性的推荐,避免无效和不准确的推荐。
进而,该用户年龄的预测方法可以应用于涉及对应的应用场景的推荐平台,例如:应用程序的推荐平台、公司业务的推荐平台等。这些推荐平台通常具有本地的用户数据库,基于本地的用户数据库,可进行用户年龄的预测。
结合推荐平台,该用户年龄的预测方法可以应用于推荐平台的数据处理端,该数据处理端可以是:服务器或者前端。即,该用户年龄的预测方法对应的硬件运行环境可以是服务器、前端等,在本申请实施例中不作限定。
基于上述应用场景的介绍,接下来请参照图1,为本申请实施例提供的用户年龄的预测方法的流程图,该预测方法包括:
步骤110:获取预设的用户关系链。预设的用户关系链中包括:不同维度的用户关系信息。
步骤120:根据预设的用户关系链确定待预测用户与待预测用户的各个一度好友之间的相似度。待预测用户为预设的用户关系链中的任意一个用户,相似度用于表征待预测用户与各个一度好友之间的关系亲密度。
步骤130:从各个一度好友中确定出满足预设的相似度条件且具有年龄信息的多个目标一度好友。
步骤140:根据多个目标一度好友的年龄信息确定待预测用户的预测年龄。
在本申请实施例中,与现有技术相比,基于预设的用户关系链对用户年龄进行预测。在预设的用户关系链中,包括:不同维度的用户关系信息。基于该用户关系信息,可以确定预设的用户关系链中的任意一个用户(即待预测用户)与其各个一度好友之间的相似度,该相似度表征待预测用户与其各个一度好友之间的关系亲密度;基于该相似度,进一步确定出目标一度好友,最终再通过目标一度好友的年龄信息确定待预测用户的预测年龄,实现用户年龄的有效预测。并且,由于目标一度好友与待预测用户的相似度满足预设的相似度条件,则目标一度好友其与待预测用户之间的关系亲密度也满足一定的条件,进而,最终所确定的预测年龄的准确性也更高,实现用户年龄的准确预测。
接下来对该预测方法的详细实施方式进行介绍。
在步骤110中,预设的用户关系链中包括不同维度的用户关系信息。作为一种可选的实施方式,不同维度的用户关系信息包括:分享维度的用户关系信息、浏览维度的用户关系信息和捐款维度的用户关系信息。
该不同维度的用户关系信息的构建方式可以采用本领域的现有技术实现,具体的,可以采用专利申请号为:202110377207.0的该专利申请中记载的用户关系链的构建方法。
结合该专利申请的记载可以理解,分享维度的用户关系信息可以表征不同的用户之间的分享关系,例如:用户A对用户B分享过一次链接,则用户A与用户B之间便具有分享关系。通过对分享维度的用户关系信息进行进一步分析,还可以确定对应的分享次数,例如:用户A与用户B的分享关系下,对应的分享次数为1。
浏览维度的用户关系信息可以表征用户是否对其他用户分享的链接进行浏览(点击),例如:用户A给用户B分享了一个链接,用户B点击该链接进行浏览,则用户A与用户B之间便具有浏览关系。通过对浏览维度的用户关系信息进行进一步分析,还可以确定对应的浏览次数,例如:用户B总共点击了用户A分享的链接2次,则,用户A与用户B的浏览关系下,对应的浏览次数为2。
捐款维度的用户关系信息可以表征用户是否基于其他用户分享的链接进行捐款,例如:用户A给用户B分享了一个链接,用户B点击该链接进行浏览,并且还对该链接对应的捐款项目进行了捐款,则用户A与用户B之间便具有捐款关系。基于捐款维度的用户关系信息,还可以确定用户之间的捐款总金额。例如:用户B对链接对应的捐款项目进行了两次捐款,一次捐款10元,一次捐款20元,则捐款总金额为30元。
在该预设的用户关系链中,涉及到的用户可以是构建平台所能获取到的全部用户数据对应的用户。对于本申请实施例来说,利用该构建好的用户关系链进行用户年龄的预测即可。因此,在进行用户年龄的预测时,所针对的用户可以是该预设的用户关系链中的任意一个用户。
作为一种可选的实施方式,基于该预设的用户关系链,针对每个用户,都采用本申请实施例提供的预测方法对其进行年龄预测,每个用户的年龄预测方式相同。
作为另一种可选的实施方式,基于该预设的用户关系链,可以从中确定出需要进行年龄预测的用户,比如:不具备年龄信息的用户,然后采用本申请实施例所提供的预测方法对其进行年龄预测,每个需要进行年龄预测的用户的年龄预测方式相同。
进而,在步骤120中,待预测用户为预设的用户关系链中的任意一个用户,即每个用户的年龄都可以采用该年龄预测方式进行预测。
在步骤120中,根据预设的用户关系链,确定待预测用户与待预测用户的各个一度好友之间的相似度。
一度好友,可以理解为,社交网络中,待预测用户的直接好友。比如:待预测用户的微信好友列表中的全部好友,均为待预测用户的一度好友。
待预测用户的一度好友,通常来说,为存储在数据库中的信息,因此,可以直接通过相应的数据库获取待预测用户的全部一度好友。
在步骤120中,需要确定待预测用户与各个一度好友之间的相似度,例如:假设待预测用户有10个一度好友,则需要分别确定待预测用户与这10个一度好友中的每个一度好友的相似度。
在本申请实施例中,相似度可以用于表征待预测用户与其一度好友之间的关系亲密度,或者说紧密程度。
结合前述用户关系链的实施方式的介绍,作为一种可选的实施方式,步骤120包括:根据分享维度的用户关系信息确定待预测用户和各个一度好友之间的第一相似度;根据浏览维度的用户关系信息确定待预测用户和各个一度好友之间的第二相似度;根据捐款维度的用户关系信息确定待预测用户和各个一度好友之间的第三相似度;根据第一相似度、第二相似度和第三相似度确定最终的相似度。
在这种实施方式中,不同维度的用户信息包括:分享维度的用户关系信息、浏览维度的用户关系信息和捐款维度的用户关系信息;通过这三个维度的关系信息,分别确定不同维度下待预测用户与各个一度好友之间的相似度,然后再结合不同维度下待预测用户与各个一度好友之间的相似度确定最终的相似度,实现相似度的有效且准确的确定。
结合前述实施例的介绍,基于各个维度的用户关系信息,还可以进一步分析出更多的信息,例如:分享次数、浏览次数和捐款总金额。
因此,作为一种可选的实施方式,根据分享维度的用户关系信息确定待预测用户和各个一度好友之间的第一相似度,包括:确定待预测用户和各个一度好友之间的分享次数中的最多分享次数和最少分享次数;根据待预测用户和各个一度好友之间的分享次数、最多分享次数和最少分享次数确定第一相似度。
在这种实施方式中,针对分享维度,先确定最多分享次数和最少分享次数,然后再结合待预测用户和各个一度好友之间的分享次数确定第一相似度,实现第一相似度的有效且准确的确定。
在确定最多分享次数和最少分享次数时,将待预测用户与各个一度好友之间的分享次数进行比较,便可以确定出最多分享次数和最少分享次数。
进一步地,假设最多分享次数为share_max,最少分享次数为share_min,待预测用户与一度好友之间的分享次数为share_b,作为一种可选的实施方式,第一相似度表示为:share_score =(share_b–share_min)/(share_max–share_min+K1)。其中,K1为预设的值,为了避免最多分享次数与最少分享次数相等时,该计算式中的分母为0,其取值可以为0.1,0.01等,在本申请实施例中不作限定。
作为一种可选的实施方式,根据浏览维度的用户关系信息确定待预测用户和各个一度好友之间的第二相似度,包括:确定待预测用户和各个一度好友之间的浏览次数中的最多浏览次数和最少浏览次数;根据待预测用户和各个一度好友之间的浏览次数、最多浏览次数和最少浏览次数确定第二相似度。
在这种实施方式中,针对浏览维度,先确定最多浏览次数和最少浏览次数,然后再结合待预测用户和各个一度好友之间的浏览次数确定第二相似度,实现第二相似度的有效且准确的确定。
在确定最多浏览次数和最少浏览次数时,将待预测用户与各个一度好友之间的浏览次数进行比较,便可以确定出最多浏览次数和最少浏览次数。
进一步地,假设最多浏览次数为pv_max,最少浏览次数为pv_min,待预测用户与一度好友之间的浏览次数为pv_b,则,第二相似度表示为:pv_score =(pv_b–pv_min)/(pv_max–pv_min+K2),其中,K2的实施方式参照K1的实施方式,在此不再重复介绍。
作为一种可选的实施方式,根据捐款维度的用户关系信息确定待预测用户和各个一度好友之间的第三相似度,包括:确定待预测用户和各个一度好友之间的捐款总金额中的最多捐款总金额和最少捐款总金额;根据待预测用户和各个一度好友之间的捐款总金额、最多捐款总金额和最少捐款总金额确定第三相似度。
在这种实施方式中,针对捐款维度,先确定最多捐款总金额和最少捐款总金额,然后再结合待预测用户和各个一度好友之间的捐款总金额确定第三相似度,实现第三相似度的有效且准确的确定。
在确定最多捐款总金额和最少捐款总金额时,将待预测用户与各个一度好友之间的捐款总金额进行比较,便可以确定出最多捐款总金额和最少捐款总金额。
进一步地,假设最多捐款总金额为amount_max,最少捐款总金额为amount_min,待预测用户与一度好友之间的捐款总金额为amount_b,则第三相似度表示为:amount_score=(amount_b–amount_min)/(amount_max–amount_min+K3),其中,K3的实施方式与参照K1和K2的实施方式,在此不再重复介绍。
此外,在本申请实施例中,K1,K2和K3可以相同,也可以不相同。
在确定出第一相似度、第二相似度以及第三相似度之后,在确定最终的相似度时,可以结合预设的维度权重值确定。作为一种可选的实施方式,假设分享维度对应第一权重值X,浏览维度对应第二权重值Y,捐款维度对应第三权重值Z,则最终的相似度表示为:score=(exp(pv_score)-1)*X+(exp(share_score)-1)*Y+(exp(amount_score)-1)*Z。
其中,第一权重值、第二权重值和第三权重值的取值可以结合实际的应用场景进行预设,例如:第一权重值最小,第二权重值大于第一权重值,第三权重值大于第二权重值,但不限于此。
作为一种可选的实施方式:X为1,Y为1.4,Z为1.5。
在步骤120中确定出待预测用户与各个一度好友之间的相似度之后,在步骤130中,从各个一度好友中确定出满足预设的相似度条件且具有年龄信息的多个目标一度好友。
结合前述实施例的介绍,一度好友在已有的用户数据库中,有的一度好友可能已经具备年龄信息,而有的一度好友并没有具备年龄信息。因此,在确定目标一度好友时,可以先从各个一度好友中筛选出具有年龄信息的一度好友;然后再根据预设的相似度条件确定出目标一度好友。
作为一种可选的实施方式,预设的相似度条件为:相似度大于预设相似度。其中,预设的相似度可以结合实际应用场景进行设置,在本申请实施例不对其值作具体的限定。
作为另一种可选的实施方式,预设的相似度条件为:将相似度按照从高到低的顺序进行排序,位于指定的序号前的相似度。
举例来说,假设用户A一共有60个一度好友,可以将其中相似度排名前15的一度好友作为目标一度好友。
在步骤130中确定出多个目标一度好友之后,在步骤140中,根据多个目标一度好友的年龄信息确定待预测用户的预测年龄。
作为一种可选的实施方式,步骤140包括:根据多个目标一度好友的年龄信息确定出待预测用户的预测年龄区间;根据预测年龄区间和预设的对应关系确定待预测用户的预测年龄;预设的对应关系为预测年龄区间与预测年龄之间的对应关系。
在这种实施方式中,先根据多个目标一度好友的年龄信息确定出待预测用户的预测年龄区间,再结合的预设的对应关系确定出待预测用户的预测年龄,实现预测年龄的有效且准确的确定。
其中,在确定预测年龄区间时,可以对多个目标一度好友的年龄信息进行统计,然后将多个目标一度好友分别对应的年龄区间中频次最高的年龄区间作为预测年龄区间。
举例来说,假设目标一度好友总共有15位,在统计时,可以先生成对应年龄区间组别。例如:年龄大于等于70组别为10;年龄大于等于60小于70组别为9;年龄大于等于50小于60组别为8;年龄大于等于45小于50组别为7;年龄大于等于40小于45组别为6;年龄大于等于35小于40组别为5;年龄大于等于30小于35组别为4;年龄大于等于25小于30组别为3;年龄大于等于20小于25组别为2;年龄大于等于10小于20组别为1;年龄大于等于0小于10组别为0。
基于这些年龄区间组别,将目标一度好友划分到对应的年龄区间组别下,然后将年龄区间组别中人数最多的年龄区间组别对应的年龄区间作为预测年龄区间。例如:假设最终组别4对应的目标一度好友人数最多,则年龄大于等于30小于35便为预测年龄区间。
在本申请实施例中,通过将多个目标一度好友分别对应的年龄区间中频次最高的年龄区间确定为预测年龄区间,提高预测年龄区间的准确性。
可以理解,频次最高的年龄区间可能仅有一个,可能有多个。如果有多个,根据不同的应用场景,可以从中确定出其中的一个为最终的预测年龄区间。
举例来说,在保险业务推荐的应用场景下,可以将多个年龄区间中对应的年龄更大的年龄区间作为最终的预测年龄区间。进而,可以规避年龄大的用户,避免为他们推送保险信息,规避风险。即,针对业务需求,选择对最终的预测结果影响更大的年龄区间。
进一步地,在本申请实施例中,还预设预测年龄区间与预测年龄之间的对应关系,进而,基于确定出的年龄区间,可以直接确定出对应的预测年龄。
作为一种可选的实施方式,预设的对应关系如表1所示,在表1中,将各个预测年龄区间的中间年龄值作为预测年龄区间对应的预测年龄值。
Figure P_210908105726791_791378001
表1只是预设的对应关系的一种实施方式,在实际应用时,也可以结合具体的应用场景采用其他实施方式,在本申请实施例中不作限定。
在本申请实施例,用已有年龄信息的用户对预测效果进行验证,在实际有年龄信息的用户的一度好友的个数大于等于4的情况下,最终的预测年龄的准确率可以达到92%以上。
在步骤140中确定出待预测用户的预测年龄之后,可以对其进行应用。作为一种可选的实施方式,待预测用户的预测年龄用于判断是否向待预测用户推送业务推荐信息。
其中,结合不同的应用场景,业务推荐信息也可以对应不同,例如:在保险业务场景中,业务推荐信息为保险信息;在教育业务场景中,业务推荐信息为教育培训信息等。
举例来说,需要推送保险信息的用户对应有一个年龄阈值,在该年龄阈值以下的用户,可以为其推送保险信息;在该年龄阈值以上的用户,不为其推送保险信息,以规避由于推送保险信息可能带来的风险。因此,在应用时,判断预测年龄是否在该年龄阈值以下,如果在,则为其推送保险信息;如果不在,则不为其推送保险信息。
除了保险信息的推送这种应用方式,预测年龄还可以具有更多的应用方式,例如:作为待预测用户的年龄信息,实现其他用户(待预测用户的一度好友)的年龄预测;以及其他行业的推荐信息的推送等,在本申请实施例中不进行一一举例。
基于同一发明构思,请参照图2,本申请实施例中还提供一种用户年龄的预测装置200,包括:获取模块210和处理模块220。
获取模块210用于:获取预设的用户关系链;所述预设的用户关系链中包括:不同维度的用户关系信息。处理模块220用于:根据所述预设的用户关系链确定待预测用户与所述待预测用户的各个一度好友之间的相似度;所述待预测用户为所述预设的用户关系链中的任意一个用户,所述相似度用于表征所述待预测用户与各个所述一度好友之间的关系亲密度;从各个所述一度好友中确定出满足预设的相似度条件且具有年龄信息的多个目标一度好友;根据所述多个目标一度好友的年龄信息确定所述待预测用户的预测年龄。
在本申请实施例中,处理模块220具体用于:根据所述分享维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第一相似度;根据所述浏览维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第二相似度;根据所述捐款维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第三相似度;根据所述第一相似度、所述第二相似度和所述第三相似度确定最终的相似度。
在本申请实施例中,处理模块220具体还用于:确定所述待预测用户和各个所述一度好友之间的分享次数中的最多分享次数和最少分享次数;根据所述待预测用户和各个所述一度好友之间的分享次数、所述最多分享次数和所述最少分享次数确定所述第一相似度。
在本申请实施例中,处理模块220具体还用于:确定所述待预测用户和各个所述一度好友之间的浏览次数中的最多浏览次数和最少浏览次数;根据所述待预测用户和各个所述一度好友之间的浏览次数、所述最多浏览次数和所述最少浏览次数确定所述第二相似度。
在本申请实施例中,处理模块220具体还用于:确定所述待预测用户和各个所述一度好友之间的捐款总金额中的最多捐款总金额和最少捐款总金额;根据所述待预测用户和各个所述一度好友之间的捐款总金额、所述最多捐款总金额和所述最少捐款总金额确定所述第三相似度。
在本申请实施例中,处理模块220具体还用于:根据所述多个目标一度好友的年龄信息确定出所述待预测用户的预测年龄区间;根据所述预测年龄区间和预设的对应关系确定所述待预测用户的预测年龄;所述预设的对应关系为预测年龄区间与预测年龄之间的对应关系。
用户年龄的预测装置200与用户年龄的预测方法对应,各个功能模块与用户年龄的预测方法的各个步骤对应,因此,各个功能模块的实施方式参照前述实施例中各个步骤的实施方式,在此不再重复介绍。
基于同一发明构思,本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被计算机运行时,执行前述实施例中所述的用户年龄的预测方法。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种用户年龄的预测方法,其特征在于,包括:
获取预设的用户关系链;所述预设的用户关系链中包括:不同维度的用户关系信息;所述不同维度的用户关系信息包括:分享维度的用户关系信息、浏览维度的用户关系信息和捐款维度的用户关系信息;
根据所述预设的用户关系链确定待预测用户与所述待预测用户的各个一度好友之间的相似度;所述待预测用户为所述预设的用户关系链中的任意一个用户,所述相似度用于表征所述待预测用户与各个所述一度好友之间的关系亲密度;
从各个所述一度好友中确定出满足预设的相似度条件且具有年龄信息的多个目标一度好友;
根据所述多个目标一度好友的年龄信息确定所述待预测用户的预测年龄;
所述根据所述预设的用户关系链确定待预测用户与所述待预测用户的各个一度好友之间的相似度,包括:
根据所述分享维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第一相似度;
根据所述浏览维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第二相似度;
根据所述捐款维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第三相似度;
根据所述第一相似度、所述第二相似度和所述第三相似度确定最终的相似度;
所述捐款维度的用户关系信息包括:用户之间的捐款总金额;所述根据所述捐款维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第三相似度,包括:
确定所述待预测用户和各个所述一度好友之间的捐款总金额中的最多捐款总金额和最少捐款总金额;
根据所述待预测用户和各个所述一度好友之间的捐款总金额、所述最多捐款总金额和所述最少捐款总金额确定所述第三相似度。
2.根据权利要求1所述的预测方法,其特征在于,所述分享维度的用户关系信息中包括:用户之间的分享次数;所述根据所述分享维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第一相似度,包括:
确定所述待预测用户和各个所述一度好友之间的分享次数中的最多分享次数和最少分享次数;
根据所述待预测用户和各个所述一度好友之间的分享次数、所述最多分享次数和所述最少分享次数确定所述第一相似度。
3.根据权利要求1所述的预测方法,其特征在于,所述浏览维度的用户关系信息包括:用户之间的浏览次数;所述根据所述浏览维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第二相似度,包括:
确定所述待预测用户和各个所述一度好友之间的浏览次数中的最多浏览次数和最少浏览次数;
根据所述待预测用户和各个所述一度好友之间的浏览次数、所述最多浏览次数和所述最少浏览次数确定所述第二相似度。
4.根据权利要求1所述的预测方法,其特征在于,所述根据所述多个目标一度好友的年龄信息确定所述待预测用户的预测年龄,包括:
根据所述多个目标一度好友的年龄信息确定出所述待预测用户的预测年龄区间;
根据所述预测年龄区间和预设的对应关系确定所述待预测用户的预测年龄;所述预设的对应关系为预测年龄区间与预测年龄之间的对应关系。
5.根据权利要求4所述的预测方法,其特征在于,所述预测年龄区间为所述多个目标一度好友分别对应的年龄区间中频次最高的年龄区间。
6.根据权利要求1所述的预测方法,其特征在于,所述待预测用户的预测年龄用于判断是否向所述待预测用户推送业务推荐信息。
7.一种用户年龄的预测装置,其特征在于,包括:
获取模块,用于:获取预设的用户关系链;所述预设的用户关系链中包括:不同维度的用户关系信息;所述不同维度的用户关系信息包括:分享维度的用户关系信息、浏览维度的用户关系信息和捐款维度的用户关系信息;
处理模块,用于:根据所述预设的用户关系链确定待预测用户与所述待预测用户的各个一度好友之间的相似度;所述待预测用户为所述预设的用户关系链中的任意一个用户,所述相似度用于表征所述待预测用户与各个所述一度好友之间的关系亲密度;从所述一度好友中确定出满足预设的相似度条件且具有年龄信息的多个目标一度好友;根据所述多个目标一度好友的年龄信息确定所述待预测用户的预测年龄;
所述处理模块具体用于:根据所述分享维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第一相似度;根据所述浏览维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第二相似度;根据所述捐款维度的用户关系信息确定所述待预测用户和各个所述一度好友之间的第三相似度;根据所述第一相似度、所述第二相似度和所述第三相似度确定最终的相似度;
所述捐款维度的用户关系信息包括:用户之间的捐款总金额;所述处理模块具体还用于:确定所述待预测用户和各个所述一度好友之间的捐款总金额中的最多捐款总金额和最少捐款总金额;根据所述待预测用户和各个所述一度好友之间的捐款总金额、所述最多捐款总金额和所述最少捐款总金额确定所述第三相似度。
8.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被计算机运行时,执行如权利要求1-6任一项所述的用户年龄的预测方法。
CN202111053004.2A 2021-09-09 2021-09-09 一种用户年龄的预测方法及装置、可读存储介质 Active CN113505308B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111053004.2A CN113505308B (zh) 2021-09-09 2021-09-09 一种用户年龄的预测方法及装置、可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111053004.2A CN113505308B (zh) 2021-09-09 2021-09-09 一种用户年龄的预测方法及装置、可读存储介质

Publications (2)

Publication Number Publication Date
CN113505308A CN113505308A (zh) 2021-10-15
CN113505308B true CN113505308B (zh) 2022-02-18

Family

ID=78016787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111053004.2A Active CN113505308B (zh) 2021-09-09 2021-09-09 一种用户年龄的预测方法及装置、可读存储介质

Country Status (1)

Country Link
CN (1) CN113505308B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103309990A (zh) * 2013-06-18 2013-09-18 上海晶樵网络信息技术有限公司 基于互联网用户公开信息的用户多维度分析与监测方法
CN104657369A (zh) * 2013-11-19 2015-05-27 深圳市腾讯计算机系统有限公司 用户属性信息的生成方法及系统
CN107437189B (zh) * 2016-05-25 2021-01-08 腾讯科技(深圳)有限公司 一种推广信息的投放方法、装置及系统
CN109376927A (zh) * 2018-10-24 2019-02-22 阿里巴巴集团控股有限公司 一种用户年龄预测方法、装置及设备
CN112347147A (zh) * 2020-10-28 2021-02-09 北京奇保信安科技有限公司 基于用户关联关系的信息推送方法、装置及电子设备

Also Published As

Publication number Publication date
CN113505308A (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
US11659050B2 (en) Discovering signature of electronic social networks
CN109388674B (zh) 数据处理方法、装置、设备及可读存储介质
CN111401700B (zh) 一种数据分析方法、装置、计算机系统及可读存储介质
Huguenin et al. A predictive model for user motivation and utility implications of privacy-protection mechanisms in location check-ins
US7761441B2 (en) Community search system through network and method thereof
CN109299356B (zh) 基于大数据的活动推荐方法、装置、电子设备及存储介质
US11373189B2 (en) Self-learning online multi-layer method for unsupervised risk assessment
CN109345417B (zh) 基于身份认证的业务人员的在线考核方法及终端设备
CN107545451B (zh) 一种广告推送方法及装置
CN111078880B (zh) 子应用的风险识别方法以及装置
CN110782286A (zh) 广告推送方法、装置、服务器及计算机可读存储介质
CN110322295B (zh) 关系强度确定方法及系统、服务器、计算机可读介质
CN107104875B (zh) 信息推送的方法和装置
US8805853B2 (en) Text mining system for analysis target data, a text mining method for analysis target data and a recording medium for recording analysis target data
CN110929172A (zh) 信息选择方法、装置、电子设备及可读存储介质
CN113791837A (zh) 页面处理方法、装置、设备和存储介质
CN113505308B (zh) 一种用户年龄的预测方法及装置、可读存储介质
CN113344660A (zh) 房源信息的处理方法、装置、电子设备及存储介质
CN110457387B (zh) 一种应用于网络中用户标签确定的方法及相关装置
JP2020135673A (ja) 投稿評価システム及び方法
US20090288142A1 (en) Authentication detection
CN115186759A (zh) 模型训练方法及用户分类方法
CN113434560A (zh) 排序方法、电子设备及相关产品
CN110458707B (zh) 基于分类模型的行为评估方法、装置及终端设备
CN110062023B (zh) 一种安全教育信息推送方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Room 716, floor 7, building 2, No. 28 Andingmen East Street, Dongcheng District, Beijing 100010

Patentee after: Beijing Easy Yikang Information Technology Co.,Ltd.

Address before: Room 716, floor 7, building 2, No. 28 Andingmen East Street, Dongcheng District, Beijing 100010

Patentee before: BEIJING QINGSONGCHOU INFORMATION TECHNOLOGY Co.,Ltd.