CN110795465A - 用户规模预估方法、装置、服务器及存储介质 - Google Patents

用户规模预估方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN110795465A
CN110795465A CN201910871680.7A CN201910871680A CN110795465A CN 110795465 A CN110795465 A CN 110795465A CN 201910871680 A CN201910871680 A CN 201910871680A CN 110795465 A CN110795465 A CN 110795465A
Authority
CN
China
Prior art keywords
user
application
label
target
target application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910871680.7A
Other languages
English (en)
Other versions
CN110795465B (zh
Inventor
成昊
谢思发
程序
张涵宇
刘文强
江小琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910871680.7A priority Critical patent/CN110795465B/zh
Publication of CN110795465A publication Critical patent/CN110795465A/zh
Application granted granted Critical
Publication of CN110795465B publication Critical patent/CN110795465B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种用户规模预估方法、装置、服务器及存储介质,属于计算机技术领域。所述方法包括:对于第一目标应用程序的每个应用标签,获取应用标签对应的多个标签数据,根据多个标签数据,生成第一目标应用程序的第一应用特征向量;获取已上线的多个第二目标应用程序的第二应用特征向量和多个第一用户分别对于每个第二目标应用程序的第一用户权重;根据第二应用特征向量和第一用户权重,确定每个第一用户的第一用户特征向量;将第一应用特征向量和第一用户特征向量输入规模预估模型,得到第一用户规模。由于引入了第一应用特征向量和第一用户特征向量,能够全面刻画第一目标应用程序的属性,体现用户的偏好,预估的第一用户规模更加准确。

Description

用户规模预估方法、装置、服务器及存储介质
技术领域
本发明涉及计算机技术领域,特别涉及一种用户规模预估方法、装置、服务器及存储介质。
背景技术
为了为用户提供更好的用户体验,对于即将上线或上线初期的新游戏,需要对该新游戏的用户规模进行预估,根据用户规模的预估结果,确定需要对该新游戏投入的资源。
相关技术中,对新游戏的用户规模进行预估之前,需要获取游戏大盘中游戏上线初期的用户规模数据,以及游戏上线后指定时间的用户规模数据,根据游戏上线初期的用户规模数据和游戏上线后指定时间的用户规模数据,训练得到深度时序模型。当对新游戏的用户规模进行预估时,获取需要进行用户规模预估的新游戏上线初期的用户规模数据,将新游戏上线初期的用户规模数据输入到深度时序模型中,得到该新游戏上线后的指定时间的用户规模数据。
相关技术中,仅根据用户的规模数据进行预估,预估结果不够准确。
发明内容
本发明实施例提供了一种用户规模预估方法、装置、服务器及存储介质,能够解决用户规模预估准确率低的问题。所述技术方案如下:
根据本发明实施例的一方面,提供了一种用户规模预估方法,所述方法包括:
获取第一目标应用程序的多个应用标签,每个应用标签对应多个选项;
对于每个应用标签,获取所述应用标签对应的多个标签数据,每个标签数据中包括所述应用标签对应的多个选项中被选中的目标选项;
根据所述多个应用标签和所述每个应用标签对应的标签数据,生成所述第一目标应用程序的第一应用特征向量;
获取已上线的多个第二目标应用程序的第二应用特征向量和多个第一用户分别对于每个第二目标应用程序的第一用户权重;
根据所述每个第二目标应用程序的第二应用特征向量和每个第一用户对于所述每个第二目标应用程序的第一用户权重,确定所述每个第一用户的第一用户特征向量;
将所述第一应用特征向量和所述每个第一用户的第一用户特征向量输入规模预估模型,得到所述第一目标应用程序的第一用户规模。
在一种可能的实现方式中,所述将所述第一应用特征向量和所述每个第一用户的第一用户特征向量输入规模预估模型,得到所述第一目标应用程序的第一用户规模,包括:
获取所述每个第一用户的属性信息;
根据所述每个第一用户的属性信息,确定所述每个第一用户的第二用户特征向量;
将所述第一应用特征向量、所述每个第一用户的第一用户特征向量、第二用户特征向量输入所述规模预估模型,得到所述第一目标应用程序的第一用户规模。
在另一种可能的实现方式中,每个标签数据中还包括选中目标选项的第二用户的用户标识;
所述根据所述多个应用标签和所述每个应用标签对应的标签数据,生成所述第一目标应用程序的第一应用特征向量,包括:
对于每个第二用户,根据所述第二用户的用户标识,确定所述第二用户从多个应用标签对应的多个选项中选中的目标选项,得到多个目标选项;
根据所述多个目标选项,生成所述第二用户对应的第三应用特征向量;
对每个第二用户对应的第三应用特征向量进行加权求和,得到所述第一应用特征向量。
在另一种可能的实现方式中,所述获取所述应用标签对应的多个标签数据之前,所述方法还包括:
对于每个应用标签,根据所述应用标签,建立问卷系统;
接收第二用户在所述问卷系统上对所述应用标签进行打分的数值;
根据所述数值,从所述应用标签对应的多个选项中选择与所述数值对应的目标选项;
将所述第一目标应用程序的应用标识、所述应用标签、所述目标选项组成标签数据,保存到标签数据库中;
所述获取所述应用标签对应的多个标签数据,包括:
根据所述第一目标应用程序的应用标识和所述应用标签,从所述标签数据库中获取所述应用标签对应的多个标签数据。
在另一种可能的实现方式中,所述将所述第一应用特征向量和所述每个第一用户的第一用户特征向量输入规模预估模型,得到所述第一目标应用程序的第一用户规模之后,所述方法还包括:
获取所述第一目标应用程序的统计数据;
根据所述统计数据,确定所述第一目标应用程序的统计特征向量;
将所述统计特征向量和所述第一用户规模输入到后期纠正模型中,得到所述第一目标应用程序的第二用户规模。
在另一种可能的实现方式中,所述将所述第一应用特征向量和所述每个第一用户的第一用户特征向量输入规模预估模型,得到所述第一目标应用程序的第一用户规模之前,所述方法还包括:
获取已上线的多个第三目标应用程序的第四应用特征向量;
对于每个第三目标应用程序,获取多个第三用户对于所述第三目标应用程序的第三用户特征向量和学习标签,每个第三用户对于所述第三目标应用程序的学习标签用于表示所述第三用户的终端是否运行所述第三目标应用程序;
根据每个第三目标应用程序的第四应用特征向量、所述每个第三用户的第三用户特征向量以及所述每个第三用户的学习标签,进行模型训练,得到所述规模预估模型。
在另一种可能的实现方式中,所述根据每个第三目标应用程序的第四应用特征向量、所述每个第三用户的第三用户特征向量以及所述每个第三用户的学习标签,进行模型训练,得到所述规模预估模型,包括:
获取所述每个第三用户的属性信息;
根据所述每个第三用户的属性信息,确定所述每个第三用户的第四用户特征向量;
根据所述每个第三目标应用程序的第四应用特征向量、所述每个第三用户的第三用户特征向量、第四用户特征向量以及所述每个第三用户的学习标签,进行模型训练,得到所述规模预估模型。
根据本发明实施例的另一方面,提供了一种用户规模预估装置,所述装置包括:
获取模块,用于获取第一目标应用程序的多个应用标签,每个应用标签对应多个选项;对于每个应用标签,获取所述应用标签对应的多个标签数据,每个标签数据中包括所述应用标签对应的多个选项中被选中的目标选项;
生成模块,用于根据所述多个应用标签和所述每个应用标签对应的标签数据,生成所述第一目标应用程序的第一应用特征向量;
所述获取模块,还用于获取已上线的多个第二目标应用程序的第二应用特征向量和多个第一用户分别对于每个第二目标应用程序的第一用户权重;
确定模块,用于根据所述每个第二目标应用程序的第二应用特征向量和每个第一用户对于所述每个第二目标应用程序的第一用户权重,确定所述每个第一用户的第一用户特征向量;
预估模块,用于将所述第一应用特征向量和所述每个第一用户的第一用户特征向量输入规模预估模型,得到所述第一目标应用程序的第一用户规模。
在一种可能的实现方式中,所述预估模块,还用于获取所述每个第一用户的属性信息;根据所述每个第一用户的属性信息,确定所述每个第一用户的第二用户特征向量;将所述第一应用特征向量、所述每个第一用户的第一用户特征向量、第二用户特征向量输入所述规模预估模型,得到所述第一目标应用程序的第一用户规模。
在另一种可能的实现方式中,每个标签数据中还包括选中目标选项的第二用户的用户标识;所述生成模块,还用于对于每个第二用户,根据所述第二用户的用户标识,确定所述第二用户从多个应用标签对应的多个选项中选中的目标选项,得到多个目标选项;根据所述多个目标选项,生成所述第二用户对应的第三应用特征向量;对每个第二用户对应的第三应用特征向量进行加权求和,得到所述第一应用特征向量。
在另一种可能的实现方式中,建立模块,用于对于每个应用标签,根据所述应用标签,建立问卷系统;
接收模块,用于接收第二用户在所述问卷系统上对所述应用标签进行打分的数值;
选择模块,用于根据所述数值,从所述应用标签对应的多个选项中选择与所述数值对应的目标选项;
保存模块,用于将所述第一目标应用程序的应用标识、所述应用标签、所述目标选项组成标签数据,保存到标签数据库中;
所述获取模块,还用于根据所述第一目标应用程序的应用标识和所述应用标签,从所述标签数据库中获取所述应用标签对应的多个标签数据。
在另一种可能的实现方式中,所述获取模块,还用于获取所述第一目标应用程序的统计数据;
所述确定模块,还用于根据所述统计数据,确定所述第一目标应用程序的统计特征向量;
所述预估模块,还用于将所述统计特征向量和所述第一用户规模输入到后期纠正模型中,得到所述第一目标应用程序的第二用户规模。
在另一种可能的实现方式中,所述获取模块,还用于获取已上线的多个第三目标应用程序的第四应用特征向量;对于每个第三目标应用程序,获取多个第三用户对于所述第三目标应用程序的第三用户特征向量和学习标签,每个第三用户对于所述第三目标应用程序的学习标签用于表示所述第三用户的终端是否运行所述第三目标应用程序;
模型训练模块,用于根据每个第三目标应用程序的第四应用特征向量、所述每个第三用户的第三用户特征向量以及所述每个第三用户的学习标签,进行模型训练,得到所述规模预估模型。
在另一种可能的实现方式中,所述模型训练模块,还用于获取所述每个第三用户的属性信息;根据所述每个第三用户的属性信息,确定所述每个第三用户的第四用户特征向量;根据所述每个第三目标应用程序的第四应用特征向量、所述每个第三用户的第三用户特征向量、第四用户特征向量以及所述每个第三用户的学习标签,进行模型训练,得到所述规模预估模型。
根据本发明实施例的另一方面,提供了一种服务器,所述服务器包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现上述任一可能实现方式所述的用户规模预估方法中的操作。
根据本发明实施例的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并具有以实现如所述用户规模预估方法中所执行的操作。
在本发明实施例中,获取第一目标应用程序的多个应用标签,每个应用标签对应多个选项;对于每个应用标签,获取该应用标签对应的多个标签数据,每个标签数据中包括应用标签对应的多个选项中被选中的目标选项;根据多个应用标签和每个应用标签对应的标签数据,生成第一目标应用程序的第一应用特征向量;获取已上线的多个第二目标应用程序的第二应用特征向量和多个第一用户分别对于每个第二目标应用程序的第一用户权重;根据每个第二目标应用程序的第二应用特征向量和每个第一用户对于每个第二目标应用程序的第一用户权重,确定每个第一用户的第一用户特征向量;将第一应用特征向量和每个第一用户的第一用户特征向量输入规模预估模型,得到第一目标应用程序的第一用户规模。本发明实施例中,引入了第一应用特征向量和第一用户特征向量,能够更全面的刻画第一目标应用程序本身的属性,且能够体现用户的偏好,从而使通过规模预估模型得到的第一用户规模更加准确。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种实施环境的示意图;
图2是本发明实施例提供的一种用户规模预估方法的流程图;
图3是本发明实施例提供的一种应用标签的选项的示意图;
图4是本发明实施例提供的一种数据库模式划分的示意图;
图5是本发明实施例提供的一种问卷系统的示意图;
图6是本发明实施例提供的一种标签数据转换为应用特征向量的示意图;
图7是本发明实施例提供的一种目标应用程序应用标签的示意图;
图8是本发明实施例提供的一种用户与目标应用程序关联的示意图;
图9是本发明实施例提供的一种用户规模预估装置的结构示意图;
图10是本发明实施例提供的一种终端的结构示意图;
图11是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
随着计算机技术的发展,应用程序应用在人们生活的方方面面,一个应用程序的用户规模常常体现着这个应用程序的价值。因此,对应用程序的用户规模进行预估,根据该应用程序的用户规模确定需要对该应用程序投入的资源有着重要的意义。需要进行规模预估的应用程序可以为游戏应用、社交应用、视频应用等。
本发明实施例应用于对游戏应用进行用户规模预估的场景中,以目标应用程序为游戏应用为例,根据游戏应用具体的游戏特征、游戏用户的特征训练得到规模预估模型。当需要对游戏应用进行规模预估时,根据需要进行规模预估的游戏应用的上线时间,获取与该上线时间相近的指定时间段内用户在游戏大盘中其他游戏的游戏时长,根据用户在游戏大盘中其他游戏的游戏时长和对应游戏的游戏特征,确定游戏大盘中其他游戏用户的特征;将需要进行规模预估的游戏应用具体的游戏特征,游戏大盘中其他游戏用户的特征输入规模预估模型,得到需要进行规模预估的游戏应用的用户规模。从而能够根据得到的用户规模,确定需要对该游戏应用投入的宣传资源、推广资源等,还可以根据得到的用户规模中的用户特征,确定对该游戏来说较为有效的宣传、推广渠道等。
图1是本发明实施例提供的一种实施环境的示意图。参见图1,该实施环境中包括终端101和服务器102。
终端101可以为电脑、手机、平板电脑或者其他电子设备。服务器102可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。
终端101和服务器102之间通过无线或者有线网络连接。并且,终端101上可以安装有服务器102提供服务的客户端,终端101对应的用户可以通过该客户端实现例如数据传输、消息交互等功能。客户端可以为终端101上安装的包括问卷系统的客户端。例如,该客户端可以为问卷应用、游戏应用或者浏览器等。
问卷系统包括游戏应用标识、应用标签、选项,每个应用标签对应多个选项。例如,应用标签为“游戏难度选择”,该应用标签对应的选项可以为“简单”、“一般”、“困难”。终端101上运行问卷系统时,用户可以根据游戏应用的特征,选择与应用标签对应的目标选项。其中,用户可以为游戏策划或游戏开发人员,也可以为一般用户,也即游戏的一般玩家。
服务器102可以接收问卷系统发送的标签数据,根据该标签数据,确定游戏应用标识对应的游戏应用的应用特征向量。再根据游戏应用的应用特征向量和用户的游戏时长,确定用户特征向量;根据游戏应用的应用特征向量和对应的用户特征向量,确定规模预估模型;根据需要进行规模预估的游戏应用的应用特征向量和对应的用户特征向量以及规模预估模型,得到预估的该游戏应用的用户规模。
图2是本发明实施例提供的一种用户规模预估方法的流程图。参见图2,该用户规模预估方法包括以下步骤:
201、服务器获取第一目标应用程序的多个应用标签,每个应用标签对应多个选项。
第一目标应用程序可以为即将上线或上线初期、需要进行规模预估的游戏应用。
在一种可能的实现方式中,服务器获取第一目标应用程序的多个应用标签,应用标签体现游戏应用的特征,例如,参见图3,应用标签为“主品类”、“次品类”、“画风”等。每个应用标签对应多个选项,例如,当应用标签为“主品类”时,该应用标签对应的多个选项可以为“动作Action”、“角色扮演RPG”、“竞技Competitive”等;当应用标签为“次品类”时,该应用标签对应的多个选项可以为“一般动作Action”、“动作冒险Action Adventure”、“街机Arcade”等;当应用标签为“画风”时,该应用标签对应的多个选项可以为“写实”、“卡通”、“可爱”等。
在另一种可能的实现方式中,服务器获取第一目标应用程序的多个应用标签之前,还可以通过以下步骤设置第一目标应用程序的应用标签:构建游戏知识图谱,游戏知识图谱中包括多个游戏应用;构建游戏知识图谱的数据库模式,例如,数据库模式包括23个子系统,参见图4,该数据库模式包括“PVP系统”、“战斗系统”、“社交系统”、“玩法系统”等23个子系统。每个子系统中包括多个应用标签,例如,“玩法系统”中包括“主品类”、“次品类”、“玩法耗时”、“注意力消耗程度”、“上手难度”、“游戏内容数量”等。服务器可以根据游戏知识图谱的数据库模式,获取第一目标应用程序的多个应用标签。
202、对于每个应用标签,服务器获取应用标签对应的多个标签数据,每个标签数据中包括应用标签对应的多个选项中被选中的目标选项。
在一种可能的实现方式中,服务器可以直接获取应用标签对应的标签数据,每个标签数据中包括应用标签对应的多个选项中被选中的目标选项。
在另一种可能的实现方式中,服务器获取应用标签对应的多个标签数据之前,还可以执行以下步骤:对于每个应用标签,服务器根据应用标签,建立问卷系统;接收第二用户在问卷系统上对应用标签进行打分的数值;根据该数值,从应用标签对应的多个选项中选择与该数值对应的目标选项;将第一目标应用程序的应用标识、应用标签、目标选项组成标签数据,保存到标签数据库中。
服务器根据应用标签,建立问卷系统,问卷系统中包括应用标签和每个应用标签对应的多个数值,其中不同的数值用来标识不同的选项。
问卷系统的应用标签和数值的选择示例,参见图5,其中,应用标签可以为“游戏难度选择”、“游戏视角是否可以调整”等,不同的数值标识不同的选项,例如,当应用标签为“游戏难度选择”时,数值“1”可以表示“简单”,数值“2”可以表示“一般”,数值“3”可以表示困难;当应用标签为“游戏视角是否可以调整”时,数值“1”可以表示“是”,数值“0”可以表示“否”。
第二用户可以根据每个应用标签的特征,对该应用标签进行打分。第二用户可以根据该应用标签的特征,在问卷系统中选择该应用标签的对应的数值;第二用户也可以根据每个应用标签的特征,在问卷系统中输入该应用标签对应的数值。服务器根据问卷系统返回的数值,从应用标签对应的多个选项中选择与该数值对应的目标选项;将第一目标应用程序的应用标识、应用标签、目标选项组成标签数据,保存到标签数据库中。相应的,服务器获取应用标签对应的多个标签数据的步骤还可以为:根据第一目标应用程序的应用标识和应用标签,从标签数据库中获取应用标签对应的多个标签数据。
在另一种可能的实现方式中,每一个应用标签对应的目标选项是根据第一目标应用程序的特征设定的。例如,应用标签为“出品公司”、“发行时间”等事实类应用标签,服务器可以通过爬虫系统获取该事实类应用标签的目标选项。
在本发明实施例中,服务器通过爬虫系统直接确定事实类应用标签的目标选项,能够减少人为参与,降低获取应用标签的目标选项的复杂程度。
203、服务器根据多个应用标签和每个应用标签对应的标签数据,生成第一目标应用程序的第一应用特征向量。
在一种可能的实现方式中,第一目标应用程序包括多个用来描述第一目标应用程序特征的多个应用标签,每个应用标签对应目标选项,每个应用标签和该应用标签的目标选项组成一个标签数据,也就是说,第一目标应用程序对应多个标签数据。相应的,服务器生成第一目标应用程序的第一应用特征向量的步骤可以为:对于第一目标应用程序的每个应用标签,确定该应用标签对应的多个选项的数量,将该应用标签对应的选项的数量作为该应用标签对应的第一向量的维度;将该第一向量中代表目标选项的位置1,其他位置0;将每个应用标签对应的第一向量拼接起来,生成第二向量;对于第一目标应用程序对应的多个第二向量,将多个第二向量的每一位相加求和后再求平均,得到第一目标应用程序的第一应用特征向量。
例如,应用标签为“玩家数量”,该应用标签对应“单人单机”、“多人单机”、“单人在线”、“多人在线”、“其他”5个选项,该应用标签对应的目标选项为“多人单机”,则该应用标签对应的第一向量为5维的向量,该第一向量可以表示为“0|1|0|0|0”。
在另一种可能的实现方式中,每个标签数据除了包括应用标签对应的多个选项中被选中的目标选项外,每个标签数据中还包括选中目标选项的第二用户的用户标识;相应的,服务器根据多个应用标签和每个应用标签对应的标签数据,生成第一目标应用程序的第一应用特征向量的步骤还可以为:对于每个第二用户,服务器根据第二用户的用户标识,确定第二用户从多个应用标签对应的多个选项中选中的目标选项,得到多个目标选项;根据多个目标选项,生成第二用户对应的第三应用特征向量;对每个第二用户对应的第三应用特征向量进行加权求和后求平均,得到第一应用特征向量。
服务器可以从标签数据库中获取标签数据,每个标签数据包括应用标识、用户标识、应用标签以及目标选项。应用标识为第一目标应用程序的应用标识,应用标签为第一目标应用程序的应用标签,目标选项为每个应用标签对应的多个选项中被选中的目标选项,用户标识为选择目标选项的第二用户的用户标识。第二用户可以在问卷系统中,根据第一目标应用程序的特征,从第一目标应用程序的应用标签对应的多个选项中选择与该第一目标应用程序的应用标签匹配的目标选项,服务器可以根据第二用户的用户标识,确定第二用户从每个应用标签对应的多个选项中选中的目标选项,将第一目标应用程序的应用标识、第二用户的用户标识、应用标签、第二用户选中的目标选项组成标签数据;对于第一目标应用程序的每个应用标签,确定该应用标签对应的多个选项的数量,将该应用标签对应的选项的数量作为该应用标签对应的第一向量的维度;将该第一向量中代表目标选项的位置1,其他位置0;对于每个第二用户,将每个应用标签对应的第一向量拼接起来,生成每个第二用户对应的第三应用特征向量;根据第二用户的用户标识,确定每个第二用户的权重,根据每个第二用户的权重和每个第二用户对应的第三应用特征向量,将每个第二用户的权重与每个第二用户对应的第三应用特征向量的每一位相乘,得到第三向量;将多个第三向量相加求和后再求平均,得到第一目标应用程序的第一应用特征向量。
其中,第二用户可以为第一目标应用程序的策划或开发人员,也可以为一般用户,第一目标应用程序的策划或开发人员可以对应的较高的权重,一般用户可以对应的较低的权重。
参见图6,服务器可以从标签数据库中获取标签数据,将标签数据转换为第一向量。例如,标签数据中的应用标识“Ga”、用户标识为“Us”,应用标签为“字体清晰”,目标选项为“是”,相应的,标签数据为“Ga,Us,字体清晰,是”,该标签数据对应的第一向量为“字体清晰:0|1”;标签数据中的应用标识“Ga”、用户标识为“Ud”,应用标签为“字体清晰”,目标选项为“是”,相应的,标签数据为“Ga,Ud,字体清晰,是”,该标签数据对应的第一向量为“字体清晰:0|1”;标签数据中的应用标识“Ga”、用户标识为“Us”,应用标签为“主品类”,目标选项为“射击|生存”,相应的,标签数据为“Ga,Us,主品类,射击|生存”,该标签数据对应的第一向量为“主品类:0|0|1…0|1”;标签数据中的应用标识“Ga”、用户标识为“Ud”,应用标签为“主品类”,目标选项为“射击|动作”,相应的,标签数据为“Ga,Ud,主品类,射击|动作”,该标签数据对应的第一向量为“主品类:0|1|0…0|1”。
服务器对于每个第二用户,将每个应用标签对应的第一向量拼接起来,得到每个第二用户对应的第三应用特征向量。相应的,继续参见图6,第二用户“Us”对应的第三用户特征向量为“0|1…0|0|1…0|1”,第二用户“Ud”对应的第三用户特征向量为“0|1…0|1|0…0|1”。
服务器将每个第二用户的权重与每个第二用户对应的第三应用特征向量的每一位相乘,得到第三向量;将多个第三向量相加求和后再求平均,得到第一目标应用程序的第一应用特征向量。继续参见图6,例如,第二用户“Us”和第二用户“Ud”的权重都为0.5,相应的,应用标识为“Ga”的第一目标应用程序的第一应用特征向量为“0|1…0|0.5|0.5…0|1”。
在本发明实施例中,服务器根据多个第二用户在问卷系统上选择的目标选项获取应用标签对应的多个标签数据,赋予不同的第二用户不同的权重,根据不同的第二用户对应的第三用户特征向量和每个第二用户对应的权重确定第一应用特征向量,能够增强标签数据的置信度。
204、服务器获取已上线的多个第二目标应用程序的第二应用特征向量;服务器获取多个第一用户分别对于每个第二目标应用程序的第一用户权重。
第一用户为第一目标应用程序的潜在用户,第三目标应用程序可以为已上线的目标应用程序,也可以为游戏知识图谱中的游戏应用。服务器获取已上线的多个第二目标应用程序的第二应用特征向量的步骤与步骤201至步骤203相似,在此不再赘述。
在一种可能的实现方式中,服务器可以根据第一目标应用程序的上线时间确定多个第一用户,相应的,服务器确定多个第一用户的步骤可以为:服务器确定与第一目标应用程序上线时间相近的指定时间段,将指定时间段内活跃在已上线的第二目标应用程序的用户确定为多个第一用户。
在另一种可能的实现方式中,服务器还可以对获取到的多个第一用户进行抽样,相应的,服务器确定多个第一用户的步骤可以为:服务器确定与第一目标应用程序上线时间相近的指定时间段,对指定时间段内活跃在已上线的第二目标应用程序的用户进行抽样,确定多个第一用户。
服务器确定多个第一用户后,还要确定对于每个第二目标应用程序的第一用户权重,相应的,服务器确定对于每个第二目标应用程序的第一用户权重的步骤可以为:对于每个第一用户,服务器获取该第一用户对于每个第二目标应用程序的运行时长,根据第一用户对于每个第二应用程序的运行时长,确定每个第一用户分别对于每个第二目标应用程序的第一用户权重。
例如,指定时间段为第一目标应用程序上线前的30天,服务器获取的第一用户对于第二目标应用程序“Ga”的运行时长为3小时,第一用户对于第二目标应用程序“Gb”的运行时长为7小时;则服务器可以确定第一用户对于第二目标应用程序“Ga”的第一用户权重为0.3,第一用户对于第二目标应用程序“Gb”的第一用户权重为0.7。
205、服务器根据每个第二目标应用程序的第二应用特征向量和每个第一用户对于每个第二目标应用程序的第一用户权重,确定每个第一用户的第一用户特征向量。
服务器将第二应用特征向量映射到第一用户身上,得到第一用户的第一用户特征向量,例如,参见图7,第二目标应用程序为游戏应用,多个第二目标应用程序分别为“游戏A”,“游戏B”,“游戏C”,“游戏A”对应“标签1”,游戏B对应“标签2”,“游戏C”对应“标签3”;参见图8,第一用户分别为“玩家1”、“玩家2”、“玩家3”,其中“玩家1”在与第一目标应用程序上线时间相近的指定时间段内运行过“游戏A”和“游戏B”,则“玩家1”对应“标签1”和“标签2”;“玩家2”在与第一目标应用程序上线时间相近的指定时间段内运行过“游戏B”和“游戏C”,则“玩家2”对应“标签2”和“标签3”;“玩家3”在与第一目标应用程序上线时间相近的指定时间段内运行过“游戏A”和“游戏C”,则“玩家3”对应“标签1”和“标签3”。
服务器根据每个第二目标应用程序的第二应用特征向量和每个第一用户对于每个第二目标应用程序的第一用户权重,确定每个第一用户的第一用户特征向量。例如,本步骤可以为:服务器根据步骤(1)确定第二目标应用程序“Ga”的第二应用特征向量为
Figure BDA0002203009640000131
第二目标应用程序“Gb”的第二应用特征向量为
Figure BDA0002203009640000132
服务器根据步骤(2)确定第一用户对于第二目标应用程序“Ga”的第一用户权重为0.3,第一用户对于第二目标应用程序“Gb”的第一用户权重为0.7,则服务器可以根据以下公式一确定每个第一用户的第一用户特征向量:
公式一:
Figure BDA0002203009640000133
其中,Ua表示第一用户,
Figure BDA0002203009640000141
表示第一用户的第一用户特征向量,Ga表示第二应用程序“Ga”,
Figure BDA0002203009640000142
表示第二目标应用程序“Ga”的第二应用特征向量;Gb表示第二应用程序“Gb”,
Figure BDA0002203009640000143
表示第二目标应用程序“Gb”的第二应用特征向量。
在本发明实施例中,服务器根据与第一目标应用程序上线时间相近的指定时间段内第一用户对于每个第二目标应用程序的运行时长确定每个第二目标应用程序的权重,将第一应用特征向量映射到第一用户特征向量上,能够更加实时、准确的反映用户对目标应用程序的应用趋势。
206、服务器将第一应用特征向量和每个第一用户的第一用户特征向量输入规模预估模型,得到第一目标应用程序的第一用户规模。
当需要对第一目标应用程序进行规模预估时,服务器可以将第一应用特征向量和每个第一用户的第一用户特征向量输入规模预估模型,得到第一目标应用程序的第一用户规模。规模预估模型对第一用户是否会运行第一目标应用程序进行预测,第一用户规模为会运行第一目标应用程序的第一用户的数量。
在一种可能的实现方式中,服务器将第一应用特征向量和每个第一用户的第一用户特征向量拼接起来,输入规模预估模型,得到第一目标应用程序的第一用户规模。
在另一种可能的实现方式中,若多个第一用户为对活跃在已上线的第二目标应用程序的用户中抽样得到的,服务器确定已上线的第二目标应用程序的用户数量与多个第一用户的数量的比值为抽样率;将第一应用特征向量和每个第一用户的第一用户特征向量拼接起来,输入规模预估模型,得到第三用户规模,第三用户规模为规模预估模型预测的会运行第一目标应用程序的第一用户的数量;将第三用户规模与抽样率相乘,得到第一目标应用程序的第一用户规模。
其中,游戏大盘中的用户数量会上下浮动,因此,抽样率允许存在一定的误差,可以根据设置的误差范围将抽样率表示为一个数值范围,相应的,得到的第一目标应用程序的第一用户规模也为对应的数值范围。
在另一种可能的实现方式中,服务器将第一应用特征向量和每个第一用户的第一用户特征向量拼接起来,输入规模预估模型,得到每个第一用户运行第一目标应用程序的概率;对于每个第一用户,当第一用户的运行第一目标应用程序的概率大于指定阈值时,确定该第一用户会运行第一目标应用程序,当第一用户的运行第一目标应用程序的概率不大于指定阈值时,确定该第一用户不会运行第一目标应用程序。确定会运行第一目标应用程序的第一用户的数量为第一用户规模。其中,指定阈值可以为设定的阈值,也可以为通过机器学习方法得到的阈值。
在本发明实施例中,进行用户规模预估时,综合考虑了第一目标应用程序的特征、用户的偏好等因素,将用户规模预估转化为确定转化率的问题,从而使用户规模预估的结果更加准确;且进行用户规模预估时不需要获取第一目标应用程序的前期用户规模数据,用户规模预估不依赖第一目标应用程序的发行进度,时效性较好。
在另一种可能的实现方式中,服务器还可以获取每个第一用户的属性信息;根据每个第一用户的属性信息,确定每个第一用户的第二用户特征向量;将第一应用特征向量、每个第一用户的第一用户特征向量、第二用户特征向量输入规模预估模型,得到第一目标应用程序的第一用户规模。
第一用户的属性信息可以为第一用户的性别、年龄等属性信息。服务器根据每个第一用户的属性信息,确定每个第一用户的第二用户特征向量;将第一应用特征向量、每个第一用户的第一用户特征向量、第二用户特征向量输入规模预估模型,得到第一目标应用程序的第一用户规模。
在本发明实施例中,将第一用户的性别、年龄等属性信息输入到规模预估模型中进行用户规模预估,更加全面的体现了用户的特征,从而能够更加准确的预估用户规模。
在另一种可能的实现方式中,服务器将第一应用特征向量和每个第一用户的第一用户特征向量输入规模预估模型,得到第一目标应用程序的第一用户规模之后,还可以获取第一目标应用程序的统计数据;根据统计数据,确定第一目标应用程序的统计特征向量;将统计特征向量和第一用户规模输入到后期纠正模型中,得到第一目标应用程序的第二用户规模。
其中,第一目标应用程序的统计数据可以为市场调研数据、玩家问卷数据、第三方统计数据等;后期纠正模型为机器学习模型。服务器将统计数据抽象成对应的统计特征向量,将统计特征向量和通过规模输入模型得到的第一用户规模拼接起来,输入到后期纠正模型中,得到第一目标应用程序的第二用户规模。
在本发明实施例中,有效的利用了传统的统计数据,将模型与传统数据结合起来,从而使用户规模预估的结果更加准确。
需要说明的一点是,服务器可以直接获取训练好的规模预估模型进行用户规模预估;也可以提前通过模型训练得到规模预估模型,当需要通过规模预估模型进行用户规模预估时,获取提前通过模型训练得到的规模预估模型,进行用户规模预估;还可以在进行用户规模预估的步骤之前,通过模型训练得到规模预估模型,再根据该规模预估模型进行用户规模预估。相应的,服务器通过模型训练,得到规模预估模型可以通过以下步骤(1)至(4)实现:
(1)服务器获取已上线的多个第三目标应用程序的第四应用特征向量。
第三目标应用程序可以为已上线的目标应用程序,也可以为游戏知识图谱中的游戏应用。服务器获取已上线的多个第三目标应用程序的第四应用特征向量的步骤与步骤201至步骤203相似,在此不再赘述。
(2)对于每个第三目标应用程序,服务器获取多个第三用户对于第三目标应用程序的第三用户特征向量。
对于每个第三目标应用程序,服务器获取多个第三用户对于第三目标应用程序的第三用户特征向量的步骤与步骤204至步骤205相似,在此不再赘述。
(3)服务器获取多个第三用户对于第三目标应用程序的学习标签,每个第三用户对于第三目标应用程序的学习标签用于表示第三用户的终端是否运行第三目标应用程序。
服务器获取多个第三用户对于第三目标应用程序的学习标签,每个第三用户对于第三目标应用程序的学习标签用于表示第三用户的终端是否运行第三目标应用程序,将学习标签为第三用户的终端运行了第三目标应用程序的第三用户作为正样本,将学习标签为第三用户的终端未运行第三目标应用程序的第三用户作为负样本。
(4)服务器根据每个第三目标应用程序的第四应用特征向量、每个第三用户的第三用户特征向量以及每个第三用户的学习标签,进行模型训练,得到规模预估模型。
在一种可能的实现方式中,服务器根据每个第三用户的学习标签,调整正负样本的比例。将每个第三目标应用程序的第四应用特征向量、每个第三用户的第三用户特征向量以及每个第三用户的学习标签组成训练集,将训练集中数据的存储格式转换为TFRecord格式,调用GPU(Graphics Processing Unit,图形处理器)资源进行模型训练,得到规模预估模型。其中,GPU资源还可以为线上GPU资源。
在另一种可能的实现方式中,服务器还可以获取每个第三用户的属性信息;根据每个第三用户的属性信息,确定每个第三用户的第四用户特征向量;根据每个第三目标应用程序的第四应用特征向量、每个第三用户的第三用户特征向量、第四用户特征向量以及每个第三用户的学习标签,进行模型训练,得到规模预估模型。
第三用户的属性信息可以为第三用户的性别、年龄等属性信息。服务器根据每个第三用户的属性信息,确定每个第三用户的第四用户特征向量;服务器根据每个第三用户的学习标签,调整正负样本的比例。将每个第三目标应用程序的第四应用特征向量、每个第三用户的第三用户特征向量、第四用户特征向量以及每个第三用户的学习标签组成训练集,将训练集中数据的存储格式转换为TFRecord格式,调用GPU(Graphics ProcessingUnit,图形处理器)资源进行模型训练,得到规模预估模型。
在本发明实施例中,当第三目标应用程序的版本更新或有新的第三目标应用程序加入到训练集中时,服务器能够根据问卷系统反馈的标签数据快速更新规模预估模型。
在本发明实施例中,获取第一目标应用程序的多个应用标签,每个应用标签对应多个选项;对于每个应用标签,获取该应用标签对应的多个标签数据,每个标签数据中包括应用标签对应的多个选项中被选中的目标选项;根据多个应用标签和每个应用标签对应的标签数据,生成第一目标应用程序的第一应用特征向量;获取已上线的多个第二目标应用程序的第二应用特征向量和多个第一用户分别对于每个第二目标应用程序的第一用户权重;根据每个第二目标应用程序的第二应用特征向量和每个第一用户对于每个第二目标应用程序的第一用户权重,确定每个第一用户的第一用户特征向量;将第一应用特征向量和每个第一用户的第一用户特征向量输入规模预估模型,得到第一目标应用程序的第一用户规模。本发明实施例中,引入了第一应用特征向量和第一用户特征向量,能够更全面的刻画第一目标应用程序本身的属性,且能够体现用户的偏好,从而使通过规模预估模型得到的第一用户规模更加准确。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
图9是本发明实施例提供的一种用户规模预估装置的结构示意图。参见图9,该装置包括:
获取模块901,用于获取第一目标应用程序的多个应用标签,每个应用标签对应多个选项;对于每个应用标签,获取应用标签对应的多个标签数据,每个标签数据中包括应用标签对应的多个选项中被选中的目标选项;
生成模块902,用于根据多个应用标签和每个应用标签对应的标签数据,生成第一目标应用程序的第一应用特征向量;
获取模块901,还用于获取已上线的多个第二目标应用程序的第二应用特征向量和多个第一用户分别对于每个第二目标应用程序的第一用户权重;
确定模块903,用于根据每个第二目标应用程序的第二应用特征向量和每个第一用户对于每个第二目标应用程序的第一用户权重,确定每个第一用户的第一用户特征向量;
预估模块904,用于将第一应用特征向量和每个第一用户的第一用户特征向量输入规模预估模型,得到第一目标应用程序的第一用户规模。
在一种可能的实现方式中,预估模块904,还用于获取每个第一用户的属性信息;根据每个第一用户的属性信息,确定每个第一用户的第二用户特征向量;将第一应用特征向量、每个第一用户的第一用户特征向量、第二用户特征向量输入规模预估模型,得到第一目标应用程序的第一用户规模。
在另一种可能的实现方式中,每个标签数据中还包括选中目标选项的第二用户的用户标识;生成模块902,还用于对于每个第二用户,根据第二用户的用户标识,确定第二用户从多个应用标签对应的多个选项中选中的目标选项,得到多个目标选项;根据多个目标选项,生成第二用户对应的第三应用特征向量;对每个第二用户对应的第三应用特征向量进行加权求和,得到第一应用特征向量。
在另一种可能的实现方式中,建立模块,用于对于每个应用标签,根据应用标签和应用标签对应的多个选项,建立问卷系统;
接收模块,用于接收第二用户在问卷系统上对应用标签进行打分的数值;
选择模块,用于根据该数值,从应用标签对应的多个选项中选择与该数值对应的目标选项;
保存模块,用于将第一目标应用程序的应用标识、应用标签、目标选项组成标签数据,保存到标签数据库中;
获取模块901,还用于根据第一目标应用程序的应用标识和应用标签,从标签数据库中获取应用标签对应的多个标签数据。
在另一种可能的实现方式中,获取模块901,还用于获取第一目标应用程序的统计数据;
确定模块903,还用于根据统计数据,确定第一目标应用程序的统计特征向量;
预估模块904,还用于将统计特征向量和第一用户规模输入到后期纠正模型中,得到第一目标应用程序的第二用户规模。
在另一种可能的实现方式中,获取模块901,还用于获取已上线的多个第三目标应用程序的第四应用特征向量;对于每个第三目标应用程序,获取多个第三用户对于第三目标应用程序的第三用户特征向量和学习标签,每个第三用户对于第三目标应用程序的学习标签用于表示第三用户的终端是否运行第三目标应用程序;
模型训练模块,用于根据每个第三目标应用程序的第四应用特征向量、每个第三用户的第三用户特征向量以及每个第三用户的学习标签,进行模型训练,得到规模预估模型。
在另一种可能的实现方式中,模型训练模块,还用于获取每个第三用户的属性信息;根据每个第三用户的属性信息,确定每个第三用户的第四用户特征向量;根据每个第三目标应用程序的第四应用特征向量、每个第三用户的第三用户特征向量、第四用户特征向量以及每个第三用户的学习标签,进行模型训练,得到规模预估模型。
需要说明的是:上述实施例提供的用户规模预估装置在进行用户规模预估时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的用户规模预估装置与用户规模预估方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图10示出了本发明一个示例性实施例提供的终端1000的结构框图。该终端1000可以是:智能手机、平板电脑、MP3播放器(Moving Picture Experts Group Audio LayerIII,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group AudioLayer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1000还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,终端1000包括有:处理器1001和存储器1002。
处理器1001可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1001可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1001也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1001可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1001还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1002可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1002还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1002中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器1001所执行以实现本申请中方法实施例提供的用户规模预估方法。
在一些实施例中,终端1000还可选包括有:外围设备接口1003和至少一个外围设备。处理器1001、存储器1002和外围设备接口1003之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1003相连。具体地,外围设备包括:射频电路1004、触摸显示屏1005、摄像头组件1006、音频电路1007、定位组件1008和电源1009中的至少一种。
外围设备接口1003可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1001和存储器1002。在一些实施例中,处理器1001、存储器1002和外围设备接口1003被集成在同一芯片或电路板上;在一些其他实施例中,处理器1001、存储器1002和外围设备接口1003中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1004用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1004通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1004将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1004包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1004可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1004还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1005用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1005是触摸显示屏时,显示屏1005还具有采集在显示屏1005的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1001进行处理。此时,显示屏1005还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1005可以为一个,设置终端1000的前面板;在另一些实施例中,显示屏1005可以为至少两个,分别设置在终端1000的不同表面或呈折叠设计;在再一些实施例中,显示屏1005可以是柔性显示屏,设置在终端1000的弯曲表面上或折叠面上。甚至,显示屏1005还可以设置成非矩形的不规则图形,也即异形屏。显示屏1005可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件1006用于采集图像或视频。可选地,摄像头组件1006包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1006还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1007可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1001进行处理,或者输入至射频电路1004以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1000的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1001或射频电路1004的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1007还可以包括耳机插孔。
定位组件1008用于定位终端1000的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件1008可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源1009用于为终端1000中的各个组件进行供电。电源1009可以是交流电、直流电、一次性电池或可充电电池。当电源1009包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1000还包括有一个或多个传感器1010。该一个或多个传感器1010包括但不限于:加速度传感器1011、陀螺仪传感器1012、压力传感器1013、指纹传感器1014、光学传感器1015以及接近传感器1016。
加速度传感器1011可以检测以终端1000建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1011可以用于检测重力加速度在三个坐标轴上的分量。处理器1001可以根据加速度传感器1011采集的重力加速度信号,控制触摸显示屏1005以横向视图或纵向视图进行用户界面的显示。加速度传感器1011还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1012可以检测终端1000的机体方向及转动角度,陀螺仪传感器1012可以与加速度传感器1011协同采集用户对终端1000的3D动作。处理器1001根据陀螺仪传感器1012采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1013可以设置在终端1000的侧边框和/或触摸显示屏1005的下层。当压力传感器1013设置在终端1000的侧边框时,可以检测用户对终端1000的握持信号,由处理器1001根据压力传感器1013采集的握持信号进行左右手识别或快捷操作。当压力传感器1013设置在触摸显示屏1005的下层时,由处理器1001根据用户对触摸显示屏1005的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器1014用于采集用户的指纹,由处理器1001根据指纹传感器1014采集到的指纹识别用户的身份,或者,由指纹传感器1014根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器1001授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1014可以被设置终端1000的正面、背面或侧面。当终端1000上设置有物理按键或厂商Logo时,指纹传感器1014可以与物理按键或厂商Logo集成在一起。
光学传感器1015用于采集环境光强度。在一个实施例中,处理器1001可以根据光学传感器1015采集的环境光强度,控制触摸显示屏1005的显示亮度。具体地,当环境光强度较高时,调高触摸显示屏1005的显示亮度;当环境光强度较低时,调低触摸显示屏1005的显示亮度。在另一个实施例中,处理器1001还可以根据光学传感器1015采集的环境光强度,动态调整摄像头组件1006的拍摄参数。
接近传感器1016,也称距离传感器,通常设置在终端1000的前面板。接近传感器1016用于采集用户与终端1000的正面之间的距离。在一个实施例中,当接近传感器1016检测到用户与终端1000的正面之间的距离逐渐变小时,由处理器1001控制触摸显示屏1005从亮屏状态切换为息屏状态;当接近传感器1016检测到用户与终端1000的正面之间的距离逐渐变大时,由处理器1001控制触摸显示屏1005从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图10中示出的结构并不构成对终端1000的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图11是本发明实施例提供的一种服务器的结构示意图,该服务器1100可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)1101和一个或一个以上的存储器1102,其中,所述存储器1102中存储有至少一条指令,所述至少一条指令由所述处理器1101加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该指令、该程序、该代码集或该指令集由处理器加载并具有以实现上述实施例的用户规模预估方法中所具有的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明实施例的较佳实施例,并不用以限制本发明实施例,凡在本发明实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用户规模预估方法,其特征在于,所述方法包括:
获取第一目标应用程序的多个应用标签,每个应用标签对应多个选项;
对于每个应用标签,获取所述应用标签对应的多个标签数据,每个标签数据中包括所述应用标签对应的多个选项中被选中的目标选项;
根据所述多个应用标签和所述每个应用标签对应的标签数据,生成所述第一目标应用程序的第一应用特征向量;
获取已上线的多个第二目标应用程序的第二应用特征向量和多个第一用户分别对于每个第二目标应用程序的第一用户权重;
根据所述每个第二目标应用程序的第二应用特征向量和每个第一用户对于所述每个第二目标应用程序的第一用户权重,确定所述每个第一用户的第一用户特征向量;
将所述第一应用特征向量和所述每个第一用户的第一用户特征向量输入规模预估模型,得到所述第一目标应用程序的第一用户规模。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一应用特征向量和所述每个第一用户的第一用户特征向量输入规模预估模型,得到所述第一目标应用程序的第一用户规模,包括:
获取所述每个第一用户的属性信息;
根据所述每个第一用户的属性信息,确定所述每个第一用户的第二用户特征向量;
将所述第一应用特征向量、所述每个第一用户的第一用户特征向量、第二用户特征向量输入所述规模预估模型,得到所述第一目标应用程序的第一用户规模。
3.根据权利要求1所述的方法,其特征在于,每个标签数据中还包括选中目标选项的第二用户的用户标识;
所述根据所述多个应用标签和所述每个应用标签对应的标签数据,生成所述第一目标应用程序的第一应用特征向量,包括:
对于每个第二用户,根据所述第二用户的用户标识,确定所述第二用户从多个应用标签对应的多个选项中选中的目标选项,得到多个目标选项;
根据所述多个目标选项,生成所述第二用户对应的第三应用特征向量;
对每个第二用户对应的第三应用特征向量进行加权求和,得到所述第一应用特征向量。
4.根据权利要求1所述的方法,其特征在于,所述获取所述应用标签对应的多个标签数据之前,所述方法还包括:
对于每个应用标签,根据所述应用标签,建立问卷系统;
接收第二用户在所述问卷系统上对所述应用标签进行打分的数值;
根据所述数值,从所述应用标签对应的多个选项中选择与所述数值对应的目标选项;
将所述第一目标应用程序的应用标识、所述应用标签、所述目标选项组成标签数据,保存到标签数据库中;
所述获取所述应用标签对应的多个标签数据,包括:
根据所述第一目标应用程序的应用标识和所述应用标签,从所述标签数据库中获取所述应用标签对应的多个标签数据。
5.根据权利要求1所述的方法,其特征在于,所述将所述第一应用特征向量和所述每个第一用户的第一用户特征向量输入规模预估模型,得到所述第一目标应用程序的第一用户规模之后,所述方法还包括:
获取所述第一目标应用程序的统计数据;
根据所述统计数据,确定所述第一目标应用程序的统计特征向量;
将所述统计特征向量和所述第一用户规模输入到后期纠正模型中,得到所述第一目标应用程序的第二用户规模。
6.根据权利要求1所述的方法,其特征在于,所述将所述第一应用特征向量和所述每个第一用户的第一用户特征向量输入规模预估模型,得到所述第一目标应用程序的第一用户规模之前,所述方法还包括:
获取已上线的多个第三目标应用程序的第四应用特征向量;
对于每个第三目标应用程序,获取多个第三用户对于所述第三目标应用程序的第三用户特征向量和学习标签,每个第三用户对于所述第三目标应用程序的学习标签用于表示所述第三用户的终端是否运行所述第三目标应用程序;
根据每个第三目标应用程序的第四应用特征向量、所述每个第三用户的第三用户特征向量以及所述每个第三用户的学习标签,进行模型训练,得到所述规模预估模型。
7.根据权利要求6所述的方法,其特征在于,所述根据每个第三目标应用程序的第四应用特征向量、所述每个第三用户的第三用户特征向量以及所述每个第三用户的学习标签,进行模型训练,得到所述规模预估模型,包括:
获取所述每个第三用户的属性信息;
根据所述每个第三用户的属性信息,确定所述每个第三用户的第四用户特征向量;
根据所述每个第三目标应用程序的第四应用特征向量、所述每个第三用户的第三用户特征向量、第四用户特征向量以及所述每个第三用户的学习标签,进行模型训练,得到所述规模预估模型。
8.一种用户规模预估装置,其特征在于,所述装置包括:
获取模块,用于获取第一目标应用程序的多个应用标签,每个应用标签对应多个选项;对于每个应用标签,获取所述应用标签对应的多个标签数据,每个标签数据中包括所述应用标签对应的多个选项中被选中的目标选项;
生成模块,用于根据所述多个应用标签和所述每个应用标签对应的标签数据,生成所述第一目标应用程序的第一应用特征向量;
所述获取模块,还用于获取已上线的多个第二目标应用程序的第二应用特征向量和多个第一用户分别对于每个第二目标应用程序的第一用户权重;
确定模块,用于根据所述每个第二目标应用程序的第二应用特征向量和每个第一用户对于所述每个第二目标应用程序的第一用户权重,确定所述每个第一用户的第一用户特征向量;
预估模块,用于将所述第一应用特征向量和所述每个第一用户的第一用户特征向量输入规模预估模型,得到所述第一目标应用程序的第一用户规模。
9.一种服务器,其特征在于,所述服务器包括:
处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现权利要求1至7任一项所述的用户规模预估方法中的操作。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如权利要求1至7任一权利要求所述的用户规模预估方法中所执行的操作。
CN201910871680.7A 2019-09-16 2019-09-16 用户规模预估方法、装置、服务器及存储介质 Active CN110795465B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910871680.7A CN110795465B (zh) 2019-09-16 2019-09-16 用户规模预估方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910871680.7A CN110795465B (zh) 2019-09-16 2019-09-16 用户规模预估方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN110795465A true CN110795465A (zh) 2020-02-14
CN110795465B CN110795465B (zh) 2023-07-07

Family

ID=69427497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910871680.7A Active CN110795465B (zh) 2019-09-16 2019-09-16 用户规模预估方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN110795465B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160292148A1 (en) * 2012-12-27 2016-10-06 Touchtype Limited System and method for inputting images or labels into electronic devices
CN107741986A (zh) * 2017-10-25 2018-02-27 广州优视网络科技有限公司 用户行为预测及相应信息推荐方法和装置
US20190122144A1 (en) * 2017-10-25 2019-04-25 International Business Machines Corporation Regression for metric dataset
US10360220B1 (en) * 2015-12-14 2019-07-23 Airbnb, Inc. Classification for asymmetric error costs
CN110046740A (zh) * 2019-02-21 2019-07-23 国网福建省电力有限公司 基于大数据的供应商投标行为分析预测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160292148A1 (en) * 2012-12-27 2016-10-06 Touchtype Limited System and method for inputting images or labels into electronic devices
US10360220B1 (en) * 2015-12-14 2019-07-23 Airbnb, Inc. Classification for asymmetric error costs
CN107741986A (zh) * 2017-10-25 2018-02-27 广州优视网络科技有限公司 用户行为预测及相应信息推荐方法和装置
US20190122144A1 (en) * 2017-10-25 2019-04-25 International Business Machines Corporation Regression for metric dataset
CN110046740A (zh) * 2019-02-21 2019-07-23 国网福建省电力有限公司 基于大数据的供应商投标行为分析预测方法

Also Published As

Publication number Publication date
CN110795465B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN110278464B (zh) 显示榜单的方法和装置
CN111083516B (zh) 直播处理的方法和装置
CN111104980B (zh) 确定分类结果的方法、装置、设备及存储介质
CN111291200B (zh) 多媒体资源展示方法、装置、计算机设备及存储介质
CN111897996A (zh) 话题标签推荐方法、装置、设备及存储介质
CN112581358B (zh) 图像处理模型的训练方法、图像处理方法及装置
CN110933468A (zh) 播放方法、装置、电子设备及介质
CN111739517A (zh) 语音识别方法、装置、计算机设备及介质
CN112052354A (zh) 视频推荐方法、视频展示方法、装置及计算机设备
CN113918767A (zh) 视频片段定位方法、装置、设备及存储介质
CN114154068A (zh) 媒体内容推荐方法、装置、电子设备及存储介质
CN113886609A (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN112699268A (zh) 训练评分模型的方法、设备及存储介质
CN114547429A (zh) 数据推荐方法、装置、服务器及存储介质
CN111563201A (zh) 内容推送方法、装置、服务器及存储介质
CN110837557A (zh) 摘要生成方法、装置、设备及介质
CN114817709A (zh) 排序方法、装置、设备及计算机可读存储介质
CN114385854A (zh) 资源推荐方法、装置、电子设备及存储介质
CN109388732B (zh) 音乐地图的生成和显示方法、装置及存储介质
CN110795465B (zh) 用户规模预估方法、装置、服务器及存储介质
CN115221888A (zh) 实体提及的识别方法、装置、设备及存储介质
CN111539794A (zh) 凭证信息的获取方法、装置、电子设备及存储介质
CN112132472A (zh) 资源管理方法、装置、电子设备及计算机可读存储介质
CN111652432A (zh) 用户属性信息的确定方法、装置、电子设备及存储介质
CN111523876A (zh) 支付方式的显示方法、装置、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40021050

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant