CN108230114B - 选取用户特征标签的方法、装置、设备及可读存储介质 - Google Patents

选取用户特征标签的方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN108230114B
CN108230114B CN201810038644.8A CN201810038644A CN108230114B CN 108230114 B CN108230114 B CN 108230114B CN 201810038644 A CN201810038644 A CN 201810038644A CN 108230114 B CN108230114 B CN 108230114B
Authority
CN
China
Prior art keywords
user
house source
label
credibility
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810038644.8A
Other languages
English (en)
Other versions
CN108230114A (zh
Inventor
王韬
孙朋伟
韦柏松
徐蓓
侯斯靓
胡海亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pingan Haofang Shanghai eCommerce Co Ltd
Original Assignee
Pingan Haofang Shanghai eCommerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pingan Haofang Shanghai eCommerce Co Ltd filed Critical Pingan Haofang Shanghai eCommerce Co Ltd
Priority to CN201810038644.8A priority Critical patent/CN108230114B/zh
Publication of CN108230114A publication Critical patent/CN108230114A/zh
Application granted granted Critical
Publication of CN108230114B publication Critical patent/CN108230114B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0645Rental transactions; Leasing transactions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/16Real estate

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种选取用户特征标签的方法,所述方法包括以下步骤:获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;根据预设算法计算所述用户房源特征标签的可信度;判断计算得到的用户房源特征标签的可信度是否大于预设可信度;若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源。本发明还公开了一种选取用户特征标签的装置、设备及计算机可读存储介质。本发明能够减少用户无意识浏览对推送房源的影响,减少广告房源、营销活动对推送房源产生的不利影响,使推送结果更加准确。

Description

选取用户特征标签的方法、装置、设备及可读存储介质
技术领域
本发明涉及数据分析与处理领域,尤其涉及一种选取用户特征标签的方法、装置、设备及计算机可读存储介质。
背景技术
随着互联网的进步,人们在需要购买房子或者租赁房子时,越来越倾向于在网上进行查找房源,从而缩短查找房源的时间,提高查找房源的效率。
但目前市面上的房产信息平台通常采用的是以用户行为作为判断用户偏好的依据,然后进行推送房源,而以用户行为作为判断用户偏好的依据一直存在着如何识别用户真实意愿的问题。用户的浏览行为存在着随机性和不确定性,平台也存在刻意引导用户的营销行为,例如,平台推出1000-2000元区间的租房营销活动,用户仅仅是被活动的红包吸引而浏览了该房源,实际用户需求可能是3000元左右的租房房源。
因此,仅仅以用户行为作为判断用户偏好的依据,然后进行推送房源,存在推送不精准的问题。
发明内容
本发明的主要目的在于提出一种选取用户特征标签的方法、装置、设备及计算机可读存储介质,旨在解决以用户行为作为判断用户偏好的依据,进行推送房源,存在推送不精准的技术问题。
为实现上述目的,本发明提供一种选取用户特征标签的方法,所述方法包括:
获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;
根据预设算法计算所述用户房源特征标签的可信度;
判断计算得到的用户房源特征标签的可信度是否大于预设可信度;
若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源。
可选地,所述根据预设算法计算所述用户房源特征标签的可信度的步骤包括:
提取预设值及各个用户房源特征标签对应的特征标签得分值;
将各个用户房源特征标签对应的特征标签得分值进行排序,获得得分值最高的用户房源特征标签;
根据预设值、当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值计算当前用户房源特征标签的可信度。
可选地,所述提取各个用户房源特征标签对应的特征标签得分值的步骤包括:
提取所述用户房源特征标签对应的浏览记录或用户填写资料记录;
根据触发所述浏览记录、或用户填写资料记录的时间及次数计算用户房源特征标签对应的特征标签得分值。
可选地,所述根据预设值、当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值计算当前用户房源特征标签的可信度的步骤包括:
将当前用户房源特征标签的得分值除以得分值最高的用户房源特征标签的得分值,获得得分值之间的商;
将所述得分值之间的商与预设值相减,获得当前用户房源特征标签的可信度。
可选地,所述根据大于预设可信度的用户房源特征标签向用户进行推送房源的步骤包括:
根据所述大于预设可信度的用户房源特征标签在房源系统中查找向用户推送的房源;
将查找到的房源向用户进行推送。
可选地,所述判断计算得到的用户房源特征标签的可信度是否大于预设可信度的步骤之后,还包括:
若所述用户房源特征标签的可信度小于或等于预设可信度,则将小于或等于预设可信度的用户房源特征标签进行记录之后舍弃。
可选地,所述获取用户的房源画像的步骤之前,还包括:
获取用户在房源系统中填写资料记录以及浏览记录;
通过所述填写资料记录获取用户填写的资料,通过所述浏览记录获取用户浏览的房源数据;
根据所述用户填写的数据以及房源数据提取用户房源特征标签;
提取用户房源特征标签对应的标签分值,并根据所述用户房源特征标签及记录的分值生成用户的房源画像。
此外,为实现上述目的,本发明还提供一种选取用户特征标签的装置,所述装置包括:
获取模块,用于获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;
计算模块,用于根据预设算法计算所述用户房源特征标签的可信度;
判断模块,用于判断计算得到的用户房源特征标签的可信度是否大于预设可信度;若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源。
本发明提出的选取用户特征标签的方法、装置、设备及计算机可读存储介质,通过获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;然后根据预设算法计算所述用户房源特征标签的可信度;即可判断计算得到的用户房源特征标签的可信度是否大于预设可信度;若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源,从而减少用户无意识浏览对推送房源的影响,减少广告房源、营销活动对推送房源产生的不利影响,使推送结果更加准确。
附图说明
图1为本发明选取用户特征标签的方法第一实施例的流程示意图;
图2为本发明选取用户特征标签的方法第二实施例中根据预设算法计算所述用户房源特征标签的可信度的步骤的细化流程示意图;
图3为本发明选取用户特征标签的方法第三实施例中提取各个用户房源特征标签对应的特征标签得分值的步骤的细化流程示意图;
图4为本发明选取用户特征标签的方法第四实施例中根据预设值、当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值计算当前用户房源特征标签的可信度的步骤的细化流程示意图;
图5为本发明选取用户特征标签的方法第五实施例中根据大于预设可信度的用户房源特征标签向用户进行推送房源的步骤的细化流程示意图;
图6为本发明选取用户特征标签的方法第六实施例的流程示意图;
图7为本发明选取用户特征标签的方法第七实施例的流程示意图;
图8为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:通过获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;然后根据预设算法计算所述用户房源特征标签的可信度;即可判断计算得到的用户房源特征标签的可信度是否大于预设可信度;若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源,从而减少用户无意识浏览对推送房源的影响,减少广告房源、营销活动对推送房源产生的不利影响,使推送结果更加准确。
本发明实施例考虑到,但目前市面上的房产信息平台通常采用的是以用户行为作为判断用户偏好的依据,然后进行推送房源,而以用户行为作为判断用户偏好的依据一直存在着如何识别用户真实意愿的问题。用户的浏览行为存在着随机性和不确定性,平台也存在刻意引导用户的营销行为,例如,平台推出1000-2000元区间的租房营销活动,用户仅仅是被活动的红包吸引而浏览了该房源,实际用户需求可能是3000元左右的租房房源。
因此,仅仅以用户行为作为判断用户偏好的依据,然后进行推送房源,存在推送不精准的问题。
为此,本发明实施例提出一种选取用户特征标签的方法,通过获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;然后根据预设算法计算所述用户房源特征标签的可信度;即可判断计算得到的用户房源特征标签的可信度是否大于预设可信度;若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源,从而减少用户无意识浏览对推送房源的影响,减少广告房源、营销活动对推送房源产生的不利影响,使推送结果更加准确。
本发明提供一种选取用户特征标签的方法。
参照图1,图1为本发明选取用户特征标签的方法第一实施例的流程示意图。
在本实施例中,该方法包括:
步骤S100,获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;
在本实施例中,首先需要获取用户的房源画像,其中,用户的房源画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户的房源画像在各领域得到了广泛的应用。我们在实际操作的过程中往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来。作为实际用户的虚拟代表,用户的房源画像所形成的用户角色并不是脱离产品和市场之外所构建出来的,形成的用户角色需要有代表性能代表产品的主要受众和目标群体。因此,用户的房源画像是指勾画目标用户、联系用户房源诉求与设计方向的有效工具,是根据用户的房源需求进行构建的,因此,可以通过所述用户的房源画像提取用户的房源特征标签,其中,所述房源特征标签即为用户的房源需求,比如若提取到的房源特征标签为300万,80m2,即说明用户的房源需求为总价300万,大小为80m2
步骤S200,根据预设算法计算所述用户房源特征标签的可信度;
在提取得到用户房源特征标签之后,即可根据预设计算所述用户房源特征标签的可信度,具体地,所述预设算法为H(Xi)=G(Xi)-k;G(Xi)=Value(Xi)/maxValue(Xi),其中,H(Xi)为用户房源特征标签的可信度,Value(Xi)为当前用户房源特征标签得分,maxValue(Xi)为用户所有房源特征标签得分中的最大值,k为预设值,K值可以为0.2-0.3之间任意值,当前用户房源特征标签得分计算方法为:首先需要获取包含当前用户房源特征标签的浏览记录,然后根据浏览次数、浏览发生的时间等综合获得该房源特征标签的得分;比如假设用户浏览总次数为100次,其中浏览了房源总价为300万的次数为99次,浏览了房源总价为200万的次数为一次,则房源总价为200万的用户房源特征标签的得分为1/100=0.01分。
步骤S300,判断计算得到的用户房源特征标签的可信度是否大于预设可信度;
在计算得到用户房源特征标签的可信度之后,将所述用户房源特征标签的可信度与预设的可信度进行对比,以判断计算得到的用户房源特征标签的可信度是否大于预设可信度;在本实施例中,所述预设可以为0或0.1等值。
步骤S400,若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源。
若所述用户房源特征标签的可信度大于预设可信度,则说明当前用户房源特征偏好Xi在用户浏览的结果集中有很高的可信度,如果该偏好为用户新出现的偏好,则将所述当前用户房源特征偏好添加至房源推荐的房源特征偏好列表中,从而根据所述房源特征标签向用户进行推送房源。若所述用户房源特征标签的可信度小于或等于预设可信度,则说明所述用户房源特征标签偏好Xi在用户浏览的结果集中并没有很高的可信度,对此类用户房源特征标签偏好推荐系统可以采取忽略的策略,将不将所述用户房源特征标签作为向用户推送房源的依据。
本实施例提出的选取用户特征标签的方法,通过获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;然后根据预设算法计算所述用户房源特征标签的可信度;即可判断计算得到的用户房源特征标签的可信度是否大于预设可信度;若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源,从而减少用户无意识浏览对推送房源的影响,减少广告房源、营销活动对推送房源产生的不利影响,使推送结果更加准确。
进一步地,参照图2,基于本发明选取用户特征标签的方法第一实施例提出本发明选取用户特征标签的方法第二实施例。
在本实施例中,所述步骤S200包括:
步骤S210,提取预设值及各个用户房源特征标签对应的特征标签得分值;
在本实施例中,由于计算用户房源特征标签的可信度需要通过用户房源特征标签对应的特征标签得分值进行计算,因此,首先需要提取各个用户房源特征标签对应的特征标签得分值,也通过获取用户的浏览记录,然后提取用户浏览记录中的各个房源特征标签,再通过具体的房源特征标签以及具体的浏览次数,计算各个房源特征标签的得分值,比如假设用户浏览总次数为100次,其中浏览了房源总价为300万的次数为90次,浏览了房源总价为250万的次数为9次,浏览了房源总价为200万的次数为1次,则房源总价为300万的用户房源特征标签的得分为90/100=0.9分。房源总价为250万的用户房源特征标签的得分为1/100=0.09分。房源总价为200万的用户房源特征标签的得分为1/100=0.01分。其中,预设值可以为0.2-0.3之间任意值。
步骤S220,将各个用户房源特征标签对应的特征标签得分值进行排序,获得得分值最高的用户房源特征标签;
在计算得到各个用户房源特征标签对应的特征标签得分值之后,可以将所述各个用户房源特征标签对应的特征标签得分值进行排序,具体排序方法可以为降序排序或升序排序,从而获得得分值最高的用户房源特征标签。
步骤S230,根据预设值、当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值计算当前用户房源特征标签的可信度。
在获得当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值之后,即可根据预设值、当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值计算当前用户房源特征标签的可信度,具体地,具体计算公式为H(Xi)=G(Xi)-k;G(Xi)=Value(Xi)/maxValue(Xi),其中,H(Xi)为用户房源特征标签的可信度,Value(Xi)为当前用户房源特征标签得分,maxValue(Xi)为用户所有房源特征标签得分中的最大值,k为预设值。
本实施例提出的选取用户特征标签的方法,通过提取预设值及各个用户房源特征标签对应的特征标签得分值;然后将各个用户房源特征标签对应的特征标签得分值进行排序,即可获得得分值最高的用户房源特征标签;再根据预设值、当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值即可计算当前用户房源特征标签的可信度,从而获得当前用户房源特征标签的可信度,同时提高了计算当前用户房源特征标签的可信度的准确率。
进一步地,参照图3,基于本发明选取用户特征标签的方法第二实施例提出本发明选取用户特征标签的方法第三实施例。
在本实施例中,所述步骤S210包括:
步骤S211,提取所述用户房源特征标签对应的浏览记录或用户填写资料记录;
在本实施例中,用户房源特征标签对应的特征标签得分值具体可以通过触发所述浏览记录、或用户填写资料记录的时间及次数进行计算,因此在计算计算之前,可以首先提取用户房源特征标签对应的浏览记录或用户填写资料记录;也用户通提取用户的浏览记录,然后通过浏览记录提取用户房源特征标签,再对提取到的用户房源特征标签进行分类统计,并通过所述浏览记录提取进行浏览的时间。
步骤S212,根据触发所述浏览记录、或用户填写资料记录的时间及次数计算用户房源特征标签对应的特征标签得分值。
获得触发所述浏览记录、或用户填写资料记录的时间及次数之后,即可根据触发所述浏览记录、或用户填写资料记录的时间及次数计算用户房源特征标签对应的特征标签得分值,具体地,可以首先根据触发所述浏览记录、或用户填写资料记录的时间对用户房源特征标签进行筛选,比如,将不在预设时间段内的用户房源特征标签进行删除或者忽略,然后根据剩下的用户房源特征标签的浏览次数计算用户房源特征标签对应的特征标签得分值,具体地,假设用户浏览总次数为100次,其中浏览了房源总价为300万的次数为90次,浏览了房源总价为250万的次数为9次,浏览了房源总价为200万的次数为1次,则房源总价为300万的用户房源特征标签的得分为90/100=0.9分。房源总价为250万的用户房源特征标签的得分为1/100=0.09分。房源总价为200万的用户房源特征标签的得分为1/100=0.01分。
进一步地,参照图4,基于本发明选取用户特征标签的方法第二实施例提出本发明选取用户特征标签的方法第四实施例。
在本实施例中,所述步骤S230包括:
步骤S231,将当前用户房源特征标签的得分值除以得分值最高的用户房源特征标签的得分值,获得得分值之间的商;
在本实施例中,在获得当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值之后,即可根据预设值、当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值计算当前用户房源特征标签的可信度,具体地,具体计算公式为H(Xi)=G(Xi)-k;G(Xi)=Value(Xi)/maxValue(Xi),其中,H(Xi)为用户房源特征标签的可信度,Value(Xi)为当前用户房源特征标签得分,maxValue(Xi)为用户所有房源特征标签得分中的最大值,k为预设值。首先,将当前用户房源特征标签的得分值除以得分值最高的用户房源特征标签的得分值,获得得分值之间的商。
步骤S232,将所述得分值之间的商与预设值相减,获得当前用户房源特征标签的可信度。
然后将所述得分值之间的商与预设值相减,即G(Xi)-k,即可获得当前用户房源特征标签的可信度。
进一步地,参照图5,基于本发明选取用户特征标签的方法第一实施例提出本发明选取用户特征标签的方法第五实施例。
在本实施例中,所述步骤S400包括:
步骤S410,根据所述大于预设可信度的用户房源特征标签在房源系统中查找向用户推送的房源;
在本实施例中,在确定当前房源特征标签的可信度大于预设可信度之后,则说明当前用户房源特征偏好Xi在用户浏览的结果集中有很高的可信度,如果该偏好为用户新出现的偏好,则将所述当前用户房源特征偏好添加至房源推荐的房源特征偏好列表中,从而根据所述房源特征标签在房源系统中查找向用户推送的房源;
步骤S420,将查找到的房源向用户进行推送。
并在查找到房源之后,将查找到的房源向用户进行推送,从而提高推送房源的准确性。
本实施例提出的选取用户特征标签的方法,通过根据所述大于预设可信度的用户房源特征标签在房源系统中查找向用户推送的房源;然后将查找到的房源向用户进行推送,从而提高推送房源的准确性。
进一步地,参照图6,基于本发明选取用户特征标签的方法第一实施例提出本发明选取用户特征标签的方法第六实施例。
在本实施例中,所述步骤S300之后的步骤,还包括:
步骤S500,若所述用户房源特征标签的可信度小于或等于预设可信度,则将小于或等于预设可信度的用户房源特征标签进行记录之后舍弃。
在本实施例中,若所述用户房源特征标签的可信度小于或等于预设可信度,则说明所述用户房源特征标签偏好Xi在用户浏览的结果集中并没有很高的可信度,对此类用户房源特征标签偏好推荐系统可以采取忽略的策略,或者在进行记录之后进行舍弃,不将所述用户房源特征标签作为向用户推送房源的依据。在后续对用户的浏览记录进行监测的过程中,当再次监测到可信度小于或等于预设可信度的用户房源特征标签时,可以再次计算所述用户房源特征标签的可信度。
进一步地,参照图7,基于本发明选取用户特征标签的方法第一至第六任一实施例提出本发明选取用户特征标签的方法第七实施例。
在本实施例中,所述步骤S100之前的步骤,还包括:
步骤S600,获取用户在房源系统中填写资料记录以及浏览记录;
在本实施例中,首先获取用户在房源系统中的填写资料记录以及浏览记录,比如由用户主动填写找房需求的记录及资料,或者用户触发的浏览行为,关注行为,电话咨询行为等;然后可以进一步将用户的记录进行分类,具体地,将用户的历史行为区分为显性行为和隐性行为。显性行为即由用户主动填写找房需求的记录,其中,房源系统中会预设好房需求并在用户访问首页时引导用户填写。隐性行为则为系统日志记录的用户浏览行为,关注行为,电话咨询行为等。在隐性行为中不同的行为会有不同的权重得分,其中,具体的得分大小比为:电话咨询>关注>浏览。
步骤S700,通过所述填写资料记录获取用户填写的资料,通过所述浏览记录获取用户浏览的房源数据;
在获取到用户在房源系统中填写资料记录以及浏览记录之后,即可通过所述填写资料记录获取用户填写的资料,比如,用户填写的房源总价,房源户型,房源所在区域等资料,通过所述浏览记录获取用户浏览的房源数据,比如用户浏览的房源的面积,房源总价等,其中,通过所述填写资料记录获取用户填写的资料可以通过用户填写的资料直接获得,而通过所述浏览记录获取用户浏览的房源数据,需要提取用户浏览的房源记录,找到相应的房源页面,然后提取对应的页面数据,然后从所述页面数据中分析用户的房源数据,比如当页面中显示用户浏览的房源的总价为300万,区域为南山区时,即可获知用户的房源数据为总价为300万,区域为南山区。
步骤S800,根据所述用户填写的数据以及房源数据提取用户房源特征标签;
在获得用户填写的数据以及房源数据之后,即可根据所述用户填写的数据以及房源数据提取用户房源特征标签,比如用户填写的数据为房源的总价为300万,房源面积为80m2,则用户房源特征标签为300万,80m2
步骤S900,提取用户房源特征标签对应的标签分值,并根据所述用户房源特征标签及记录的分值生成用户的房源画像。
在获得房源特征标签之后,即可根据所述房源特征标签提取对应的标签分值,比如用户填写的数据为房源的总价为300万,房源面积为80m2,则总价为300万的房源得分为1分,房源面积为80m2的房源得分也是1分,总价为300万且房源面积为80m2的房源得分为2分。同理,用户浏览的房源数据的标签分值与用户填写的数据的标签分值划分原理一样,在此不再赘述。然后根据用户房源特征标签及标签分值即可生成用户的房源画像,即建立用户账户或用户ID,然后将用户房源特征标签以及所述房源特征标签对应的标签分值与用户账户或用户ID进行关联,以便直观地获知用户的房源需求,从而提高向用户推送房源的精准度。进一步地,为了便于直观地获知用户的房源需求,可以对用户的最终标签得分进行归一化处理,比如若用户在总价为300万且房源面积为80m2的房源得分为2分,在总价为200万且房源面积为80m2的房源得分为1分,可以将用户的得分进行归一化,比如,假设用户所有的得分为1,则通过归一化处理,用户在总价为300万且房源面积为80m2的房源得分为2/(2+1)=0.67分,用户在总价为200万且房源面积为80m2的房源得分为1/(2+1)=0.33分,从而更加直观地获知用户的房源需求。
本实施例提出的选取用户特征标签的方法,通过获取用户在房源系统中填写资料记录以及浏览记录;然后通过所述填写资料记录获取用户填写的资料,通过所述浏览记录获取用户浏览的房源数据;再根据所述用户填写的数据以及房源数据提取用户房源特征标签;提取用户房源特征标签对应的标签分值,并根据所述用户房源特征标签及记录的分值生成用户的房源画像,从而获得清晰可分析的用户画像,为推荐房源提供更加精准的数据。
本发明进一步提供一种选取用户特征标签的装置,所述装置包括:
获取模块,用于获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;
计算模块,用于根据预设算法计算所述用户房源特征标签的可信度;
判断模块,用于判断计算得到的用户房源特征标签的可信度是否大于预设可信度;若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源。
本发明选取用户特征标签的装置的具体实施例与上述选取用户特征标签的方法各实施例基本相同,在此不作赘述。
本发明实施例进一步提供一种选取用户特征标签的设备。
参照图8,图8为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
如图8所示,该选取用户特征标签的设备可以包括:处理器1001,例如CPU,网络接口1002,用户接口1003,存储器1004。这些组件之间的连接通信可以通过通信总线实现。网络接口1002可选的可以包括标准的有线接口(用于连接有线网络)、无线接口(如WI-FI接口、蓝牙接口、红外线接口等,用于连接无线网络)。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口(例如用于连接有线键盘、有线鼠标等)和/或无线接口(例如用于连接无线键盘、无线鼠标)。存储器1004可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1004可选的还可以是独立于前述处理器1001的存储装置。
可选地,该选取用户特征标签的设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。
本领域技术人员可以理解,图中示出的选取用户特征标签的设备结构并不构成对选取用户特征标签的设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图8所示,作为一种计算机存储介质的存储器1004中可以包括操作系统、网络通信模块、用户接口模块以及选取用户特征标签的程序。其中,操作系统是管理和控制选取用户特征标签的设备硬件与软件资源的程序,支持网络通信模块、用户接口模块、选取用户特征标签的程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1002;用户接口模块用于管理和控制用户接口1003。
在图8所示的选取用户特征标签的设备中,网络接口1002主要用于连接数据库,与数据库进行数据通信;用户接口1003主要用于连接客户端(可以理解为用户端),与客户端进行数据通信,如通过窗口展示信息给客户端,或者接收客户端发送的操作信息;而处理器1001可以用于执行存储器1004中存储的选取用户特征标签的程序,以实现上述选取用户特征标签的方法各实施例中的步骤,在此不作赘述。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述选取用户特征标签的方法各实施例中的步骤。
还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种选取用户特征标签的方法,其特征在于,所述方法包括以下步骤:
获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;
根据预设算法计算所述用户房源特征标签的可信度;
判断计算得到的用户房源特征标签的可信度是否大于预设可信度;
若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源;
其中,所述根据预设算法计算所述用户房源特征标签的可信度的步骤包括:
提取预设值及各个用户房源特征标签对应的特征标签得分值;
将各个用户房源特征标签对应的特征标签得分值进行排序,获得得分值最高的用户房源特征标签;
根据预设值、当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值,通过预设算法计算当前用户房源特征标签的可信度;
所述预设算法为:
H(Xi)=G(Xi)-k,
G(Xi)=Value(Xi)/maxValue(Xi);
其中,H(Xi)为用户房源特征标签的可信度,Value(Xi)为当前用户房源特征标签得分值,maxValue(Xi)为用户所有房源特征标签得分中的最大值,k为预设值。
2.如权利要求1所述的选取用户特征标签的方法,其特征在于,所述提取各个用户房源特征标签对应的特征标签得分值的步骤包括:
提取所述用户房源特征标签对应的浏览记录或用户填写资料记录;
根据触发所述浏览记录、或用户填写资料记录的时间及次数计算用户房源特征标签对应的特征标签得分值。
3.如权利要求1所述的选取用户特征标签的方法,其特征在于,所述根据预设值、当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值计算当前用户房源特征标签的可信度的步骤包括:
将当前用户房源特征标签的得分值除以得分值最高的用户房源特征标签的得分值,获得得分值之间的商;
将所述得分值之间的商与预设值相减,获得当前用户房源特征标签的可信度。
4.如权利要求1所述的选取用户特征标签的方法,其特征在于,所述根据大于预设可信度的用户房源特征标签向用户进行推送房源的步骤包括:
根据所述大于预设可信度的用户房源特征标签在房源系统中查找向用户推送的房源;
将查找到的房源向用户进行推送。
5.如权利要求1所述的选取用户特征标签的方法,其特征在于,所述判断计算得到的用户房源特征标签的可信度是否大于预设可信度的步骤之后,还包括:
若所述用户房源特征标签的可信度小于或等于预设可信度,则将小于或等于预设可信度的用户房源特征标签进行记录之后舍弃。
6.如权利要求1-5任一项所述的选取用户特征标签的方法,其特征在于,所述获取用户的房源画像的步骤之前,还包括:
获取用户在房源系统中填写资料记录以及浏览记录;
通过所述填写资料记录获取用户填写的资料,通过所述浏览记录获取用户浏览的房源数据;
根据所述用户填写的数据以及房源数据提取用户房源特征标签;
提取用户房源特征标签对应的标签分值,并根据所述用户房源特征标签及记录的分值生成用户的房源画像。
7.一种选取用户特征标签的装置,其特征在于,所述装置包括:
获取模块,用于获取用户的房源画像,并提取所述房源画像中的用户房源特征标签;
计算模块,用于根据预设算法计算所述用户房源特征标签的可信度;
判断模块,用于判断计算得到的用户房源特征标签的可信度是否大于预设可信度;若所述用户房源特征标签的可信度大于预设可信度,则根据大于预设可信度的用户房源特征标签向用户进行推送房源;
其中,所述计算模块,还用于提取预设值及各个用户房源特征标签对应的特征标签得分值;
将各个用户房源特征标签对应的特征标签得分值进行排序,获得得分值最高的用户房源特征标签;
根据预设值、当前用户房源特征标签对应分值与所述得分值最高的用户房源特征标签对应分值,通过预设算法计算当前用户房源特征标签的可信度;
所述预设算法为:
H(Xi)=G(Xi)-k,
G(Xi)=Value(Xi)/maxValue(Xi);
其中,H(Xi)为用户房源特征标签的可信度,Value(Xi)为当前用户房源特征标签得分值,maxValue(Xi)为用户所有房源特征标签得分中的最大值,k为预设值。
8.一种选取用户特征标签的设备,其特征在于,所述选取用户特征标签的设备包括选取用户特征标签的程序,所述选取用户特征标签的程序被所述选取用户特征标签的设备执行时实现如权利要求1至6中任一项所述的选取用户特征标签的方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有选取用户特征标签的程序,所述选取用户特征标签的程序被处理器执行时实现如权利要求1至6中任一项所述的选取用户特征标签的方法的步骤。
CN201810038644.8A 2018-01-16 2018-01-16 选取用户特征标签的方法、装置、设备及可读存储介质 Active CN108230114B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810038644.8A CN108230114B (zh) 2018-01-16 2018-01-16 选取用户特征标签的方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810038644.8A CN108230114B (zh) 2018-01-16 2018-01-16 选取用户特征标签的方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN108230114A CN108230114A (zh) 2018-06-29
CN108230114B true CN108230114B (zh) 2021-04-23

Family

ID=62641384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810038644.8A Active CN108230114B (zh) 2018-01-16 2018-01-16 选取用户特征标签的方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN108230114B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636474A (zh) * 2018-12-14 2019-04-16 平安城市建设科技(深圳)有限公司 房源排序展示方法、装置、设备及存储介质
CN110069619A (zh) * 2019-03-16 2019-07-30 平安城市建设科技(深圳)有限公司 房源展示方法、装置、设备及计算机可读存储介质
CN111274476B (zh) * 2020-01-16 2023-07-28 长春每房科技有限公司 基于人脸识别的房源匹配方法、装置、设备和存储介质
CN113641895A (zh) * 2021-07-22 2021-11-12 深圳宝家乡墅科技有限公司 一种用于别墅销售的用户信息管理方法、系统及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021337A (zh) * 2016-05-09 2016-10-12 房加科技(北京)有限公司 一种基于大数据分析的智能推荐方法及系统
CN106940705A (zh) * 2016-12-20 2017-07-11 上海掌门科技有限公司 一种用于构建用户画像的方法与设备
CN107203530A (zh) * 2016-03-16 2017-09-26 北大方正集团有限公司 信息推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203530A (zh) * 2016-03-16 2017-09-26 北大方正集团有限公司 信息推荐方法
CN106021337A (zh) * 2016-05-09 2016-10-12 房加科技(北京)有限公司 一种基于大数据分析的智能推荐方法及系统
CN106940705A (zh) * 2016-12-20 2017-07-11 上海掌门科技有限公司 一种用于构建用户画像的方法与设备

Also Published As

Publication number Publication date
CN108230114A (zh) 2018-06-29

Similar Documents

Publication Publication Date Title
CN109684047B (zh) 事件处理方法、装置、设备和计算机存储介质
CN108230114B (zh) 选取用户特征标签的方法、装置、设备及可读存储介质
CN108256067B (zh) 计算房源相似度的方法、装置、设备及存储介质
CN108021691B (zh) 答案查找方法、客服机器人以及计算机可读存储介质
CN108280115B (zh) 识别用户关系的方法及装置
TWI436292B (zh) Information processing devices, information processing methods and information processing products
KR101190395B1 (ko) 모바일 디바이스에 의해 기록된 이미지 콘텐츠에 기초한 데이터 액세스
JP6185186B2 (ja) コードスキャン結果情報を提供するための方法及びシステム
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
CN108334568B (zh) 房源推送方法、装置、设备及计算机可读存储介质
CN110020002B (zh) 事件处理方案的查询方法、装置、设备和计算机存储介质
WO2019037195A1 (zh) 用户兴趣识别方法、装置及计算机可读存储介质
WO2007071143A1 (fr) Procédé et appareil destinés à émettre des informations réseau
US11483408B2 (en) Feature-based network embedding
US20110117537A1 (en) Usage estimation device
CN111143555B (zh) 基于大数据的客户画像生成方法、装置、设备及存储介质
US9569465B2 (en) Image processing
CN111209325B (zh) 业务系统接口识别方法、装置及存储介质
WO2022247666A1 (zh) 一种内容的处理方法、装置、计算机设备和存储介质
CN108401005B (zh) 一种表情推荐方法和装置
CA2850883A1 (en) Image processing
CN111415183A (zh) 用于处理访问请求的方法和装置
CN111400289B (zh) 智能用户分类方法、服务器及存储介质
JP7307607B2 (ja) メディアベースのコンテンツシェアを容易にする方法、コンピュータプログラム及びコンピューティングデバイス
CN106570003B (zh) 数据推送方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant