CN107730038A - 用户偏好性别的预测方法、装置及其设备 - Google Patents

用户偏好性别的预测方法、装置及其设备 Download PDF

Info

Publication number
CN107730038A
CN107730038A CN201710931597.5A CN201710931597A CN107730038A CN 107730038 A CN107730038 A CN 107730038A CN 201710931597 A CN201710931597 A CN 201710931597A CN 107730038 A CN107730038 A CN 107730038A
Authority
CN
China
Prior art keywords
user
sex
displayings
feature
behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201710931597.5A
Other languages
English (en)
Inventor
李海峰
秦锋剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Green Bay Network Technology Co., Ltd.
Original Assignee
Grass Count Language (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Grass Count Language (beijing) Technology Co Ltd filed Critical Grass Count Language (beijing) Technology Co Ltd
Priority to CN201710931597.5A priority Critical patent/CN107730038A/zh
Publication of CN107730038A publication Critical patent/CN107730038A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种用户偏好性别的预测方法、装置及其设备,其中,方法包括:获取预设时间内用户的网上行为日志,从网上行为日志中提取与用户行为关联的页面信息;对页面信息进行数据处理,提取一个或多个场景化的用户行为特征;根据预设的特征权重规则确定与用户行为特征对应的权重;应用预先训练的性别预测模型对用户行为特征以及对应的权重进行计算,确定与一个或多个场景化对应的用户偏好性别;根据一个或多个场景化对应的用户偏好性别进行对应的应用处理。由此,能够快速准确预测用户长期、短期多个场景下的偏好性别,以便更好地为用户提供个性化服务,满足用户需求,提升用户使用体验。

Description

用户偏好性别的预测方法、装置及其设备
技术领域
本发明涉及互联网技术领域,尤其涉及一种用户偏好性别的预测方法、装置及其设备。
背景技术
目前,在互联网服务中,为用户提供个性化的服务能极大提升用户的使用体验,同时也能为企业带来极大的收益,如用户活跃度、广告收入等。在个性化服务中,用户的偏好性别至关重要,相关技术中,通过直接使用用户的生物学性别的效果往往不太好,原因主要是用户的生物学性别与偏好性别往往偏差很大。
举例而言,一个妻子很可能经常给自己丈夫、儿子买东西,她的生物学性别是女,但是偏好性别是男,在商品的个性化推荐中推荐女性的商品效果就很不好,由此可见用户的偏好性别和生物学性别是有差异的。因此,需要一种算法进行用户的场景化偏好性别预测,而不是单一的一个性别,是多个场景下性别。一个用户会有多个场景化性别,比如服装下是男性,化妆品下是女性,运动鞋上是男性等等,有了场景化性别我们才能为用户提供更好的服务。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种用户偏好性别的预测方法,能够解决现有技术中没有考虑到用户的偏好性别是变的、是场景化的,是多个场景化性别的问题,能够快速准确预测用户长期、短期多个场景下的偏好性别,以便更好地为用户提供个性化服务,满足用户需求,提升用户使用体验。
本发明的第二个目的在于提出一种用户偏好性别的预测装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种用户偏好性别的预测方法,包括:获取预设时间内用户的网上行为日志,从所述网上行为日志中提取与用户行为关联的页面信息;对所述页面信息进行数据处理,提取一个或多个场景化的用户行为特征;根据预设的特征权重规则确定与所述用户行为特征对应的权重;应用预先训练的性别预测模型对所述用户行为特征以及对应的权重进行计算,确定与所述一个或多个场景化对应的用户偏好性别;根据所述一个或多个场景化对应的用户偏好性别进行对应的应用处理。
本发明实施例的用户偏好性别的预测方法,通过获取预设时间内用户的网上行为日志,从网上行为日志中提取与用户行为关联的页面信息,接着对页面信息进行数据处理,提取一个或多个场景化的用户行为特征,并根据预设的特征权重规则确定与用户行为特征对应的权重,然后应用预先训练的性别预测模型对用户行为特征以及对应的权重进行计算,确定与一个或多个场景化对应的用户偏好性别,最后根据一个或多个场景化对应的用户偏好性别进行对应的应用处理。由此,能够快速准确预测用户长期、短期多个场景下的偏好性别,以便更好地为用户提供个性化服务,满足用户需求,提升用户使用体验。
另外,根据本发明上述实施例的用户偏好性别的预测方法还可以具有如下附加的技术特征:
可选地,所述根据预设的特征权重规则确定与所述用户行为特征对应的权重,包括:根据用户行为的时间特征和预设的时间权重标准进行比较,确定与所述用户行为的时间特征对应的权重;和/或,根据用户行为的次数特征和预设的次数权重标准进行比较,确定与所述用户行为的次数特征对应的权重;和/或,根据用户行为的成本特征和预设的成本权重标准进行比较,确定与所述用户行为的成本特征对应的权重。
可选地,所述的方法,还包括:获取预设渠道的用户历史行为日志,从所述用户历史行为日志中提取与用户行为关联的历史页面信息;对所述历史页面信息进行数据处理,提取一个或多个场景化的用户历史行为特征和对应的场景性别特征;应用预设模型对所述一个或多个场景化的用户历史行为特征和对应的场景性别特征进行训练,确定满足预设预期阈值时对应的模型参数,生成所述性别预测模型。
可选地,在所述根据所述一个或多个场景化对应的用户偏好性别进行对应的应用处理之后,还包括:获取所述应用处理的应用反馈信息;应用预设算法对所述应用反馈信息进行分析,检测是否满足预设的应用阈值;若检测获知不满足所述应用阈值,则对所述性别预测模型进行优化处理。
可选地,所述对所述性别预测模型进行优化处理,包括:在所述性别预测模型中加入预设的商品性别分类规则;和/或,对用于进行性别预测模型训练的数据进行清洗与筛选处理。
为达上述目的,本发明第二方面实施例提出了一种用户偏好性别的预测装置,包括:第一获取模块,用于获取预设时间内用户的网上行为日志,从所述网上行为日志中提取与用户行为关联的页面信息;第一提取模块,用于对所述页面信息进行数据处理,提取一个或多个场景化的用户行为特征;确定模块,用于根据预设的特征权重规则确定与所述用户行为特征对应的权重;计算模块,用于应用预先训练的性别预测模型对所述用户行为特征以及对应的权重进行计算,确定与所述一个或多个场景化对应的用户偏好性别;处理模块,用于根据所述一个或多个场景化对应的用户偏好性别进行对应的应用处理。
本发明实施例的用户偏好性别的预测装置,通过获取预设时间内用户的网上行为日志,从网上行为日志中提取与用户行为关联的页面信息,接着对页面信息进行数据处理,提取一个或多个场景化的用户行为特征,并根据预设的特征权重规则确定与用户行为特征对应的权重,然后应用预先训练的性别预测模型对用户行为特征以及对应的权重进行计算,确定与一个或多个场景化对应的用户偏好性别,最后根据一个或多个场景化对应的用户偏好性别进行对应的应用处理。由此,能够快速准确预测用户长期、短期多个场景下的偏好性别,以便更好地为用户提供个性化服务,满足用户需求,提升用户使用体验。
另外,根据本发明上述实施例的用户偏好性别的预测装置还可以具有如下附加的技术特征:
可选地,所述确定模块具体用于:根据用户行为的时间特征和预设的时间权重标准进行比较,确定与所述用户行为的时间特征对应的权重;和/或,根据用户行为的次数特征和预设的次数权重标准进行比较,确定与所述用户行为的次数特征对应的权重;和/或,根据用户行为的成本特征和预设的成本权重标准进行比较,确定与所述用户行为的成本特征对应的权重。
可选地,所述的装置,还包括:第二获取模块,用于获取预设渠道的用户历史行为日志,从所述用户历史行为日志中提取与用户行为关联的历史页面信息;第二提取模块,用于对所述历史页面信息进行数据处理,提取一个或多个场景化的用户历史行为特征和对应的场景性别特征;生成模块,用于应用预设模型对所述一个或多个场景化的用户历史行为特征和对应的场景性别特征进行训练,确定满足预设预期阈值时对应的模型参数,生成所述性别预测模型。
可选地,所述的装置,还包括:第三获取模块,用于获取所述应用处理的应用反馈信息;检测模块,用于应用预设算法对所述应用反馈信息进行分析,检测是否满足预设的应用阈值;优化模块,用于若检测获知不满足所述应用阈值,则对所述性别预测模型进行优化处理。
可选地,所述优化模块具体用于:在所述性别预测模型中加入预设的商品性别分类规则;和/或,对用于进行性别预测模型训练的数据进行清洗与筛选处理。
为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如第一方面实施例所述的用户偏好性别的预测方法。
为达上述目的,本发明第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面实施例所述的用户偏好性别的预测方法。
为达上述目的,本发明第五方面实施例提出了一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由处理器执行时,执行如第一方面实施例所述的用户偏好性别的预测方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的用户偏好性别的预测方法的流程示意图;
图2是根据本发明一个实施例的训练性别预测模型的流程示意图;
图3是根据本发明另一个实施例的用户偏好性别的预测方法的流程示意图;
图4是根据本发明一个实施例的用户偏好性别的预测装置的结构示意图;
图5是根据本发明另一个实施例的用户偏好性别的预测装置的结构示意图;
图6是根据本发明又一个实施例的用户偏好性别的预测装置的结构示意图
图7是根据本发明一个实施例的计算机设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的用户偏好性别的预测方法和装置。
具体地,现有的个性化服务中,用户的偏好性别至关重要,直接使用用户的生物学性别的效果往往不太好,原因主要是用户的生物学性别与偏好性别往往偏差很大。最主要是没有考虑到用户的偏好性别是变的、是场景化的,是多个场景化性别。并不是用户安装的都是男性应用程序,就表示用户不购买女性的商品,用户依然在某些场景会为女性友人购买商品,这个时候如果为其推荐男性商品的话,反而对用户形成一种干扰,损害用户体验。
为了解决上述问题,本发明提出一种用户偏好性别的预测方法,能够快速准确预测用户长期、短期多个场景下的偏好性别,以便更好地为用户提供个性化服务,满足用户需求,提升用户使用体验。具体如下:
图1是根据本发明一个实施例的用户偏好性别的预测方法的流程示意图。如图1所示,该用户偏好性别的预测方法包括:
步骤101,获取预设时间内用户的网上行为日志,从网上行为日志中提取与用户行为关联的页面信息。
步骤102,对页面信息进行数据处理,提取一个或多个场景化的用户行为特征。
具体地,预设时间可以根据实际应用需要(比如根据用户行为数量及业务需要等)进行选择设置,比如需要获取用户长期场景化偏好性别,预设时间可以是一个月、两个月;再比如需要获取用户的短期场景化偏好性别,预设时间可以是20分钟、或者10分钟等等。
具体地,在确定好预设时间后,可以通过相关算法或者模型等方式获取预设时间内用户的网上行为日志,并从网上行为日志中提取与用户行为关联的页面信息,比如得到title/content/category/brand等信息。
进一步地,可以通过对页面信息进行数据处理,比如分词,去除停用词,同义词、中英词归一化等等数据处理,进而通过GBDT算法等方式提取一个或多个场景化的用户行为特征。
步骤103,根据预设的特征权重规则确定与用户行为特征对应的权重。
具体地,在提取一个或多个场景化的用户行为特征后,可以根据不同的场景以及规则确定用户行为特征对应的权重。举例说明如下:
第一种示例,根据用户行为的时间特征和预设的时间权重标准进行比较,确定与用户行为的时间特征对应的权重。
举例而言,比如在长期场景化下,时间越近的行为权重越高,比如今天的行为带来的影响要比一个月前的大,衰减函数可采用半衰期方式;再比如在短期场景化下,时间越近的行为权重越高,比如当次的行为要比上个行为更重要,可以设置一个衰减因子(高斯函数)。
第二种示例,根据用户行为的次数特征和预设的次数权重标准进行比较,确定与用户行为的次数特征对应的权重。比如,行为次数越多权重越高。
第三种示例,根据用户行为的成本特征和预设的成本权重标准进行比较,确定与用户行为的成本特征对应的权重。
举例而言,用户行为成本越高的行为权重越高,比如下单行为>添加购物车行为>搜索行为>浏览行为等。
步骤104,应用预先训练的性别预测模型对用户行为特征以及对应的权重进行计算,确定与一个或多个场景化对应的用户偏好性别。
步骤105,根据一个或多个场景化对应的用户偏好性别进行对应的应用处理。
具体地,需要预先训练好性别预测模型,可以理解的是,可以采用很多种方式训练性别预测模型,举例说明如下:
图2是根据本发明一个实施例的训练性别预测模型的流程示意图。如图2所示,该训练性别预测模型包括:
步骤201,获取预设渠道的用户历史行为日志,从用户历史行为日志中提取与用户行为关联的历史页面信息。
步骤202,对历史页面信息进行数据处理,提取一个或多个场景化的用户历史行为特征和对应的场景性别特征。
步骤203,应用预设模型对所述一个或多个场景化的用户历史行为特征和对应的场景性别特征进行训练,确定满足预设预期阈值时对应的模型参数,生成性别预测模型。
具体地,可以通过抓取互联网公开数据、有质量的网页来构造训练集,比如预设渠道天猫、京东上的已经区分好性别的商品页面,接着对网页信息进行抽取服务,获取抓取下来的页面的title、category、brand、content、label等信息作为用户行为关联的历史页面信息,然后对历史页面信息进行数据处理,比如分词,去除停用词,同义词、中英词归一化等,并基于GBDT算法等方式特征筛选提取一个或多个场景化的用户历史行为特征和对应的场景性别特征,使用朴素贝叶斯或者逻辑回归进行数据训练,构造模型,模型应用于训练集、测试集,评测训练集、测试集上的召回率和准确率等指标。
进一步地,可以应用预先训练的性别预测模型对用户行为特征以及对应的权重进行计算,确定与一个或多个场景化对应的用户偏好性别,根据一个或多个场景化对应的用户偏好性别进行对应的应用处理。比如长期场景化偏好性别输出到缓存数据库,key是用户id,所有的数据应用根据需要自行查取、使用等;再比如短期场景化偏好性别输出到缓存数据库,key是用户id,所有的数据应用根据需要自行查取、使用。
综上所述,本发明实施例的用户偏好性别的预测方法,通过获取预设时间内用户的网上行为日志,从网上行为日志中提取与用户行为关联的页面信息,接着对页面信息进行数据处理,提取一个或多个场景化的用户行为特征,并根据预设的特征权重规则确定与用户行为特征对应的权重,然后应用预先训练的性别预测模型对用户行为特征以及对应的权重进行计算,确定与一个或多个场景化对应的用户偏好性别,最后根据一个或多个场景化对应的用户偏好性别进行对应的应用处理。由此,能够快速准确预测用户长期、短期多个场景下的偏好性别,以便更好地为用户提供个性化服务,满足用户需求,提升用户使用体验。
基于上述实施例,图3是根据本发明另一个实施例的用户偏好性别的预测方法的流程示意图。如图3所示,在步骤105之后,该用户偏好性别的预测方法包括:
步骤301,获取应用处理的应用反馈信息。
步骤302,应用预设算法对应用反馈信息进行分析,检测是否满足预设的应用阈值。
步骤303,若检测获知不满足应用阈值,则对性别预测模型进行优化处理。
具体地,可以通过人工分析数据库或者ABTest效果分析等预设算法对应用反馈信息进行分析,检测是否满足预设的应用阈值,检测获知不满足应用阈值,则对性别预测模型进行优化处理,举例说明如下:
作为一种示例,在性别预测模型中加入预设的商品性别分类规则。
具体地,预测结果会有很多错误,并且覆盖度与准确度差强人意,主要是训练集数据覆盖不够全、分布不均衡导致。通过加入规则可以改善这两个问题。规则一般有两种形式:
比如,一种类似于“如果商品属于玛萨玛索这个网站,则其性别标签为男”,根据网站类别来区分,有些网站是垂直型网站,比如聚美优品就属于女性网站。
再比如,一种类似于“如果商品属于服装类,且含男不含女,则性别标签归为男”,根据训练集数据抽象而得。
因此,通过加入规则,目前的商覆盖度提高到78.1%(不是所有页面都具有性别偏好,比如冰箱、洗衣机这种),准确度提高到96.2%。规则的一般形式是:如果商品属于某一品类,含有某些词且不含哪些词,则归为女。目前的规则有17条,具体举例如下:
1、女{母婴 婴幼 瑜伽 美甲 美体 美容 写真 文胸 卫生巾 卫生护垫 长筒袜裙 高跟鞋 女童 婴儿 幼儿 孕妇 家纺 手镯 护发 丝袜 眼线 唇膏 香奈儿孕婴 妇科比基尼 月经 胸花 面膜 面霜}不包含{男}。
2、男{服装 服饰 衣服 内衣 睡衣 男装 男袜}包含{男}不包含{女}。
3、女{服装 服饰 衣服 内衣 睡衣 女装 孕妇装 童装 女袜}包含{女 童 婚纱旗袍 抹胸 蕾丝 紧身 打底 塑身 防辐射 妈妈 性感 花边}。
4、女{包 箱 表 户外 鞋 帽}包含{女 童}不包含{男}。
5、男{包 箱 表 户外 鞋 帽}包含{男}不包含{女 童}。
6、男{保健 成人 男科}包含{男用 男士 男性 补肾 壮阳 玛咖 玛卡 解酒 避孕套 鞭前列腺}。
7、女{保健 成人 女科}包含{女性 女用 女士 振动棒 震动棒 排毒养颜 左旋肉碱 补气养血 美白 祛斑}。
8、男{化妆 美容 美妆 彩妆 护肤 护理 洗护}包含{男}。
9、女{化妆 美容 美妆 彩妆 护肤 护理 洗护}不包含{男 汽车美容 器械 口腔身体 个人 保健}。
10、女{饰品 项链 耳饰}不包含{男}。
11、男{电脑 配件 耗材 线材}不包含{装机 攒机 组装 DIY CPU 主板 显卡 内存 机箱 显示器 声卡 电源 光驱 刻录机 ADSL 网卡 单片机 IDE SATA}
12、男{美食 食品 白酒 白干}包含{酒 茶}不包含{酒店 酒吧 柚子茶 奶茶}。
13、女{美食 食品 冲调}包含{美容 养颜 减肥 瘦身}。
14、女{图书}包含{孕产 育儿 美食 烹饪 幼儿 婴儿 美妆 童书}。
15、女{百货}包含{餐具 收纳}。
16、男{汽车用品}包含{改装 组装}。
17、女{本地生活}包含{丽人}。
作为另一种示例,对用于进行性别预测模型训练的数据进行清洗与筛选处理。
具体地,对训练数据进行清洗可以提高训练数据的准确性,去掉训练数据中很大一批异常数据,并简单数据预处理,重新训练模型。比如在品类的测试集验证准确率为92%,能标记的数据比例为22%(并修正一些标注错误数据,比如男童装等标记为女等)。关于品类预测的新方法,考虑类目次序,对一级品类二级品类分别预测,如果一级品类可以区分则不继续区分二级品类,在上述的测试集中验证的准确率同为92%,这种方法同时可以作为异常值检测,如果某一级别的品类可以预测性别,那么下一级品类结果只能为相同的类别或者中性,否则视为异常值,也可以灵活把握阈值。
由此,进一步提高用户偏好性别的预测的准确性,更好地为用户提供个性化服务,满足用户需求,进一步提升用户使用体验。
与上述几种实施例提供的用户偏好性别的预测方法相对应,本发明的一种实施例还提供一种用户偏好性别的预测装置,由于本发明实施例提供的用户偏好性别的预测装置与上述几种实施例提供的用户偏好性别的预测方法相对应,因此在前述用户偏好性别的预测方法的实施方式也适用于本实施例提供的用户偏好性别的预测装置,在本实施例中不再详细描述。
图4是根据本发明一个实施例的用户偏好性别的预测装置的结构示意图。如图4所示,该用户偏好性别的预测装置包括:其中,第一获取模块11、第一提取模块12、确定模块13、计算模块14和处理模块15。
其中,第一获取模块11,用于获取预设时间内用户的网上行为日志,从网上行为日志中提取与用户行为关联的页面信息。
第一提取模块12,用于对页面信息进行数据处理,提取一个或多个场景化的用户行为特征。
确定模块13,用于根据预设的特征权重规则确定与用户行为特征对应的权重。
计算模块14,用于应用预先训练的性别预测模型对用户行为特征以及对应的权重进行计算,确定与一个或多个场景化对应的用户偏好性别。
处理模块15,用于根据一个或多个场景化对应的用户偏好性别进行对应的应用处理。
其中,在本发明的一个实施例中,确定模块13具体用于:根据用户行为的时间特征和预设的时间权重标准进行比较,确定与用户行为的时间特征对应的权重;和/或,根据用户行为的次数特征和预设的次数权重标准进行比较,确定与用户行为的次数特征对应的权重;和/或,根据用户行为的成本特征和预设的成本权重标准进行比较,确定与用户行为的成本特征对应的权重。
其中,在本发明的一个实施例中,如图5所示,在图4的基础上,还包括:第二获取模块16、第二提取模块17和生成模块18。
其中,第二获取模块16,用于获取预设渠道的用户历史行为日志,从用户历史行为日志中提取与用户行为关联的历史页面信息。
第二提取模块17,用于对历史页面信息进行数据处理,提取一个或多个场景化的用户历史行为特征和对应的场景性别特征。
生成模块18,用于应用预设模型对一个或多个场景化的用户历史行为特征和对应的场景性别特征进行训练,确定满足预设预期阈值时对应的模型参数,生成性别预测模型。
其中,在本发明的一个实施例中,如图6所示,在图4的基础上,还包括:第三获取模块19、检测模块110和优化模块111。
其中,第三获取模块19,用于获取应用处理的应用反馈信息。
检测模块110,用于应用预设算法对应用反馈信息进行分析,检测是否满足预设的应用阈值。
优化模块111,用于若检测获知不满足所述应用阈值,则对性别预测模型进行优化处理。
其中,在本发明的一个实施例中,优化模块111具体用于:在所述性别预测模型中加入预设的商品性别分类规则;和/或,对用于进行性别预测模型训练的数据进行清洗与筛选处理。
综上所述,本发明实施例的用户偏好性别的预测装置,通过获取预设时间内用户的网上行为日志,从网上行为日志中提取与用户行为关联的页面信息,接着对页面信息进行数据处理,提取一个或多个场景化的用户行为特征,并根据预设的特征权重规则确定与用户行为特征对应的权重,然后应用预先训练的性别预测模型对用户行为特征以及对应的权重进行计算,确定与一个或多个场景化对应的用户偏好性别,最后根据一个或多个场景化对应的用户偏好性别进行对应的应用处理。由此,能够快速准确预测用户长期、短期多个场景下的偏好性别,以便更好地为用户提供个性化服务,满足用户需求,提升用户使用体验。
本发明提出一种计算机设备,图7是根据本发明一个实施例的计算机设备的结构示意图。如图7所示,存储器21、处理器22及存储在存储器21上并可在处理器22上运行的计算机程序。
处理器22执行所述程序时实现上述实施例中提供的用户偏好性别的预测方法。
进一步地,计算机设备还包括:
通信接口23,用于存储器21和处理器22之间的通信。
存储器21,用于存放可在处理器22上运行的计算机程序。
存储器21可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
处理器22,用于执行所述程序时实现上述实施例所述的用户偏好性别的预测方法。
如果存储器21、处理器22和通信接口23独立实现,则通信接口21、存储器21和处理器22可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(PeripheralComponent,简称为PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture,简称为EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器21、处理器22及通信接口23,集成在一块芯片上实现,则存储器21、处理器22及通信接口23可以通过内部接口完成相互间的通信。
处理器22可能是一个中央处理器(Central Processing Unit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路。
综上所述,本发明实施例的计算机设备,通过获取预设时间内用户的网上行为日志,从网上行为日志中提取与用户行为关联的页面信息,接着对页面信息进行数据处理,提取一个或多个场景化的用户行为特征,并根据预设的特征权重规则确定与用户行为特征对应的权重,然后应用预先训练的性别预测模型对用户行为特征以及对应的权重进行计算,确定与一个或多个场景化对应的用户偏好性别,最后根据一个或多个场景化对应的用户偏好性别进行对应的应用处理。由此,能够快速准确预测用户长期、短期多个场景下的偏好性别,以便更好地为用户提供个性化服务,满足用户需求,提升用户使用体验。
本发明提出一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述实施例所述的用户偏好性别的预测方法。
本发明提出一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由处理器执行时,执行如上述实施例所述的用户偏好性别的预测方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种用户偏好性别的预测方法,其特征在于,包括以下步骤:
获取预设时间内用户的网上行为日志,从所述网上行为日志中提取与用户行为关联的页面信息;
对所述页面信息进行数据处理,提取一个或多个场景化的用户行为特征;
根据预设的特征权重规则确定与所述用户行为特征对应的权重;
应用预先训练的性别预测模型对所述用户行为特征以及对应的权重进行计算,确定与所述一个或多个场景化对应的用户偏好性别;
根据所述一个或多个场景化对应的用户偏好性别进行对应的应用处理。
2.如权利要求1所述的方法,其特征在于,所述根据预设的特征权重规则确定与所述用户行为特征对应的权重,包括:
根据用户行为的时间特征和预设的时间权重标准进行比较,确定与所述用户行为的时间特征对应的权重;和/或,
根据用户行为的次数特征和预设的次数权重标准进行比较,确定与所述用户行为的次数特征对应的权重;和/或,
根据用户行为的成本特征和预设的成本权重标准进行比较,确定与所述用户行为的成本特征对应的权重。
3.如权利要求1所述的方法,其特征在于,还包括:
获取预设渠道的用户历史行为日志,从所述用户历史行为日志中提取与用户行为关联的历史页面信息;
对所述历史页面信息进行数据处理,提取一个或多个场景化的用户历史行为特征和对应的场景性别特征;
应用预设模型对所述一个或多个场景化的用户历史行为特征和对应的场景性别特征进行训练,确定满足预设预期阈值时对应的模型参数,生成所述性别预测模型。
4.如权利要求1所述的方法,其特征在于,在所述根据所述一个或多个场景化对应的用户偏好性别进行对应的应用处理之后,还包括:
获取所述应用处理的应用反馈信息;
应用预设算法对所述应用反馈信息进行分析,检测是否满足预设的应用阈值;
若检测获知不满足所述应用阈值,则对所述性别预测模型进行优化处理。
5.如权利要求4所述的方法,其特征在于,所述对所述性别预测模型进行优化处理,包括:
在所述性别预测模型中加入预设的商品性别分类规则;和/或,
对用于进行性别预测模型训练的数据进行清洗与筛选处理。
6.一种用户偏好性别的预测装置,其特征在于,包括:
第一获取模块,用于获取预设时间内用户的网上行为日志,从所述网上行为日志中提取与用户行为关联的页面信息;
第一提取模块,用于对所述页面信息进行数据处理,提取一个或多个场景化的用户行为特征;
确定模块,用于根据预设的特征权重规则确定与所述用户行为特征对应的权重;
计算模块,用于应用预先训练的性别预测模型对所述用户行为特征以及对应的权重进行计算,确定与所述一个或多个场景化对应的用户偏好性别;
处理模块,用于根据所述一个或多个场景化对应的用户偏好性别进行对应的应用处理。
7.如权利要求6所述的装置,其特征在于,还包括:
第二获取模块,用于获取预设渠道的用户历史行为日志,从所述用户历史行为日志中提取与用户行为关联的历史页面信息;
第二提取模块,用于对所述历史页面信息进行数据处理,提取一个或多个场景化的用户历史行为特征和对应的场景性别特征;
生成模块,用于应用预设模型对所述一个或多个场景化的用户历史行为特征和对应的场景性别特征进行训练,确定满足预设预期阈值时对应的模型参数,生成所述性别预测模型。
8.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-5中任一所述的用户偏好性别的预测方法。
9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的用户偏好性别的预测方法。
10.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由处理器执行时,执行如权利要求1-5中任一所述的用户偏好性别的预测方法。
CN201710931597.5A 2017-10-09 2017-10-09 用户偏好性别的预测方法、装置及其设备 Withdrawn CN107730038A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710931597.5A CN107730038A (zh) 2017-10-09 2017-10-09 用户偏好性别的预测方法、装置及其设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710931597.5A CN107730038A (zh) 2017-10-09 2017-10-09 用户偏好性别的预测方法、装置及其设备

Publications (1)

Publication Number Publication Date
CN107730038A true CN107730038A (zh) 2018-02-23

Family

ID=61208748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710931597.5A Withdrawn CN107730038A (zh) 2017-10-09 2017-10-09 用户偏好性别的预测方法、装置及其设备

Country Status (1)

Country Link
CN (1) CN107730038A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108694625A (zh) * 2018-07-02 2018-10-23 阿里巴巴集团控股有限公司 权益偏好预估方法、装置及服务器
CN109034868A (zh) * 2018-06-21 2018-12-18 上海二三四五网络科技有限公司 一种基于用户浏览信息确定用户性别的控制方法及控制装置
CN109961327A (zh) * 2019-04-11 2019-07-02 上海拉扎斯信息科技有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN110766507A (zh) * 2019-02-25 2020-02-07 北京嘀嘀无限科技发展有限公司 一种资源配置方法及装置
CN110992096A (zh) * 2019-12-03 2020-04-10 秒针信息技术有限公司 预测模型训练方法、装置以及媒体标识预测方法及装置
CN111105117A (zh) * 2018-10-29 2020-05-05 微梦创科网络科技(中国)有限公司 一种用户信息的确定方法和装置
CN111143424A (zh) * 2018-11-05 2020-05-12 百度在线网络技术(北京)有限公司 特征场景数据挖掘方法、装置和终端
CN112241327A (zh) * 2019-07-17 2021-01-19 腾讯科技(深圳)有限公司 分享信息处理方法、装置、存储介质与电子设备
CN112597745A (zh) * 2020-12-23 2021-04-02 深圳赛安特技术服务有限公司 一种智能图表的生成方法、装置、计算机系统及可读存储介质
CN112825178A (zh) * 2019-11-21 2021-05-21 北京沃东天骏信息技术有限公司 一种预测用户性别画像的方法和装置
CN113761352A (zh) * 2021-03-25 2021-12-07 北京沃东天骏信息技术有限公司 信息推送方法、装置、设备和存储介质
CN113971136A (zh) * 2021-12-03 2022-01-25 杭银消费金融股份有限公司 基于图像识别的页面测试方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104423945A (zh) * 2013-08-30 2015-03-18 联想(北京)有限公司 一种信息处理方法及电子设备
CN106126597A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 用户属性预测方法及装置
CN106503226A (zh) * 2016-10-28 2017-03-15 努比亚技术有限公司 信息推送方法与装置
US20170200211A1 (en) * 2014-07-11 2017-07-13 Alibaba Group Holding Limited Knowledge processing methods and apparatuses for applying reasoning techniques based on browsing data integrated as a collection of facts and relationships

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104423945A (zh) * 2013-08-30 2015-03-18 联想(北京)有限公司 一种信息处理方法及电子设备
US20170200211A1 (en) * 2014-07-11 2017-07-13 Alibaba Group Holding Limited Knowledge processing methods and apparatuses for applying reasoning techniques based on browsing data integrated as a collection of facts and relationships
CN106126597A (zh) * 2016-06-20 2016-11-16 乐视控股(北京)有限公司 用户属性预测方法及装置
CN106503226A (zh) * 2016-10-28 2017-03-15 努比亚技术有限公司 信息推送方法与装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
夏勇: "基于手机应用日志的用户基础属性预测", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034868A (zh) * 2018-06-21 2018-12-18 上海二三四五网络科技有限公司 一种基于用户浏览信息确定用户性别的控制方法及控制装置
CN108694625A (zh) * 2018-07-02 2018-10-23 阿里巴巴集团控股有限公司 权益偏好预估方法、装置及服务器
CN111105117A (zh) * 2018-10-29 2020-05-05 微梦创科网络科技(中国)有限公司 一种用户信息的确定方法和装置
CN111143424A (zh) * 2018-11-05 2020-05-12 百度在线网络技术(北京)有限公司 特征场景数据挖掘方法、装置和终端
CN111143424B (zh) * 2018-11-05 2024-05-28 阿波罗智能技术(北京)有限公司 特征场景数据挖掘方法、装置和终端
CN110766507A (zh) * 2019-02-25 2020-02-07 北京嘀嘀无限科技发展有限公司 一种资源配置方法及装置
CN109961327A (zh) * 2019-04-11 2019-07-02 上海拉扎斯信息科技有限公司 数据处理方法、装置、电子设备及计算机可读存储介质
CN112241327A (zh) * 2019-07-17 2021-01-19 腾讯科技(深圳)有限公司 分享信息处理方法、装置、存储介质与电子设备
CN112825178A (zh) * 2019-11-21 2021-05-21 北京沃东天骏信息技术有限公司 一种预测用户性别画像的方法和装置
CN112825178B (zh) * 2019-11-21 2024-06-18 北京沃东天骏信息技术有限公司 一种预测用户性别画像的方法和装置
CN110992096B (zh) * 2019-12-03 2023-08-29 秒针信息技术有限公司 预测模型训练方法、装置以及媒体标识预测方法及装置
CN110992096A (zh) * 2019-12-03 2020-04-10 秒针信息技术有限公司 预测模型训练方法、装置以及媒体标识预测方法及装置
CN112597745A (zh) * 2020-12-23 2021-04-02 深圳赛安特技术服务有限公司 一种智能图表的生成方法、装置、计算机系统及可读存储介质
CN113761352A (zh) * 2021-03-25 2021-12-07 北京沃东天骏信息技术有限公司 信息推送方法、装置、设备和存储介质
CN113971136B (zh) * 2021-12-03 2022-09-09 杭银消费金融股份有限公司 基于图像识别的页面测试方法及系统
CN113971136A (zh) * 2021-12-03 2022-01-25 杭银消费金融股份有限公司 基于图像识别的页面测试方法及系统

Similar Documents

Publication Publication Date Title
CN107730038A (zh) 用户偏好性别的预测方法、装置及其设备
LaBat et al. Body cathexis and satisfaction with fit of apparel
CN106779977B (zh) 一种基于智能移动终端的服装搭配方法及其系统
Lamb et al. A conceptual framework for apparel design
Easey Fashion marketing
Rahman et al. A study of Canadian female baby boomers: Physiological and psychological needs, clothing choice and shopping motives
Hwang et al. Muslim women’s purchasing behaviors toward modest activewear in the United States
Sohn et al. An exploratory study of fit and size issues with mass customized men's jackets using 3D body scan and virtual try-on technology
Morris et al. Development of a nursing sports bra for physically active breastfeeding women through user-centered design
Chung et al. Interactive design recommendation using sensor based smart wear and weather WebBot
Yip et al. Influence of appearance orientation, BI and purchase intention on customer expectations of service quality in Hong Kong intimate apparel retailing
Zhou et al. Conjoint analysis of consumer preferences for dress design
Hernández et al. Can virtually trying on apparel help in selecting the correct size?
Liu et al. Enhancing pressure comfort of a bra’s under-band
Zhang et al. An intelligent garment recommendation system based on fuzzy techniques
CN107657480A (zh) 基于售卖设备用户信息进行信息采集和/或推送的系统
Brown et al. Sports bra use, preferences and fit issues among exercising females in the US, the UK and China
Keist et al. “The New Costumes of Odd Sizes” Plus-Sized Women’s Fashions, 1920–1929
Shin et al. Exploration of fit reviews and its impact on ratings of rental dresses
Green et al. Men, masculinity and style in 2008: A study of men’s clothing considerations in the latter aughts
Franz Economics of vanity sizing
Czerniawski Beauty beyond a size 16
Li Research on the Consumer Psychology and Marketing Strategies of Lululemon in the Asian Market
Gonsoulin Liberated and inclusive? An analysis of self-representation in a popular lesbian magazine
Juffer A Pornographic Femininity? Telling and Selling Victoria's (Dirty) Secrets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190903

Address after: 100192 Dongsheng Science Park, Zhongguancun, 66 Xixiaokou Road, Haidian District, Beijing

Applicant after: Green Bay Network Technology Co., Ltd.

Address before: 100089 Beijing Haidian District Xixiaokou Road 66 Zhongguancun Dongsheng Science Park B-6 Building B 5 floors

Applicant before: Grass count language (Beijing) Technology Co., Ltd.

WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180223