CN113741742A - 一种确定拍摄图标的方法及装置 - Google Patents
一种确定拍摄图标的方法及装置 Download PDFInfo
- Publication number
- CN113741742A CN113741742A CN202010479763.4A CN202010479763A CN113741742A CN 113741742 A CN113741742 A CN 113741742A CN 202010479763 A CN202010479763 A CN 202010479763A CN 113741742 A CN113741742 A CN 113741742A
- Authority
- CN
- China
- Prior art keywords
- account
- shooting icon
- trigger
- icon
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000003993 interaction Effects 0.000 claims abstract description 51
- 230000002452 interceptive effect Effects 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims description 104
- 238000013210 evaluation model Methods 0.000 claims description 83
- 230000008859 change Effects 0.000 claims description 47
- 238000011156 evaluation Methods 0.000 claims description 33
- 238000012216 screening Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 11
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/04817—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance using icons
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请涉及计算机技术领域,公开了一种确定拍摄图标的方法及装置,该方法包括:接收客户端发送的触发操作,触发操作携带触发账户的账户信息;基于账户信息,确定触发账户的当前属性和账户信息的历史推荐的拍摄图标,其中,触发账户通过点击拍摄图标拍摄多媒体内容;基于触发账户的当前属性、触发账户对历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从候选拍摄图标中确定出目标拍摄图标;将包含目标拍摄图标的信息发送给客户端。由触发账户的当前属性、第一交互信息和第二交互信息,确定触发账户与各个候选拍摄图标之间的关联关系,根据关联关系选择目标拍摄图标。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种确定拍摄图标的方法及装置。
背景技术
用户通过点击应用程序(Application,APP)主页面上的拍摄图标,将实时拍摄或者已拍摄的多媒体内容上传到APP上,记录和分享自己的生活点滴。通常,APP会根据用户的性别,从对应的素材库中任意选取一款样式的拍摄图标展示在主页面上;或者,在特定的时间段内,将特殊样式的拍摄图标展示在主页面上,例如,在中秋节时呈现月亮样式的拍摄图标。
但是,采用上述方式可能会展示出与触发账户不存在关联关系的拍摄图标,导致用户对拍摄图标的关注度低,减少点击拍摄图标的次数。
有鉴于此,需要设计一种新的确定拍摄图标的方法,以克服上述缺陷。
发明内容
本申请实施例提供一种确定拍摄图标的方法及装置,用以解决无法选择与触发账户存在关联关系的拍摄图标的问题。
本申请实施例提供的具体技术方案如下:
第一方面,本申请实施例提供一种确定拍摄图标的方法,应用于服务器,包括:
接收客户端发送的触发操作,所述触发操作携带触发账户的账户信息;
基于所述账户信息,确定触发账户的当前属性和所述账户信息的历史推荐的拍摄图标,其中,所述触发账户通过点击所述拍摄图标拍摄多媒体内容;
基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从所述候选拍摄图标中确定出目标拍摄图标;
将包含所述目标拍摄图标的信息发送给所述客户端。
可选的,基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从所述候选拍摄图标中选择目标拍摄图标,包括:
基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,判断在将各个候选拍摄图标发送给所述触发账户后,所述触发账户的状态变化;
将符合预设筛选规则的所述状态变化对应的候选拍摄图标,作为所述目标拍摄图标。
可选的,判断在将各个候选拍摄图标发送给所述触发账户后,所述触发账户的状态变化,包括:
将所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,输入到训练完毕的策略模型中,预测在将各个候选拍摄图标发送给所述触发账户后,所述触发账户的状态变化。
可选的,将符合预设筛选规则的所述状态变化对应的候选拍摄图标,作为所述目标拍摄图标,包括:
将状态变化最大值对应的候选拍摄图标,作为所述目标拍摄图标;或者,
选取状态变化超过设定阈值的候选拍摄图标,作为所述目标拍摄图标。
可选的,对所述策略模型进行训练,进一步包括:
确定多个训练样本组;
对所述策略模型进行多轮训练,直到达到设定轮次时,输出训练完毕的策略模型,其中,每一轮训练均执行以下操作:
将多个中的一个训练样本组输入到当前一轮的初始策略模型中,判断在将所述各个训练样本中的训练样本拍摄图标发送给对应的样本账户后,所述样本账户的状态变化,以及将所述各个训练样本输入到当前一轮更新后的评估模型中,得到所述各个训练样本对应的评估参数,所述一个训练样本的评估参数表征对所述当前一轮的初始策略模型将一个训练样本拍摄图标发送给对应的一个样本账户的策略进行评估时得到的参数;
将各个评估参数、各个状态变化,以及所述各个训练样本拍摄图标对应的各个实际状态变化作为输入,对所述当前一轮的初始策略模型进行更新,得到当前一轮更新后的策略模型,并将所述当前一轮更新后的策略模型确定为下一轮的初始策略模型。
可选的,通过下列方式得到当前一轮更新后的评估模型,进一步包括:
基于所述当前一轮的初始策略模型,得到对应的所述各个状态变化,以及将所述各个训练样本输入到当前一轮的初始目标评估模型,得到对应的评估参数调整量;
将所述各个状态变化,以及各个评估参数调整量作为输入,对当前一轮的初始评估模型进行更新,得到所述当前一轮更新后的评估模型,并将所述当前一轮更新后的评估模型确定为下一轮的初始评估模型。
可选的,进一步包括:
基于所述当前一轮的初始目标评估模型的权重参数,和所述当前一轮更新后的评估模型的权重参数,对所述当前一轮的初始目标评估模型进行更新,得到当前一轮更新后的目标评估模型,并将所述当前一轮更新后的目标评估模型确定为下一轮的初始目标评估模型。
第二方面,本申请实施例还提供了一种确定拍摄图标的方法,应用于客户端,包括:
接收到触发操作,其中,触发操作中携带触发账户的账户信息,所述触发操作为触发账户对应用程序执行的交互操作;
将触发操作发送至服务器,以使所述服务器根据所述账户信息,确定出目标拍摄图标;
接收所述服务器返回的信息,所述信息中携带目标拍摄图标,并将所述目标拍摄图标展示在页面上。
第三方面,本申请实施例还提供了一种确定拍摄图标的装置,应用于服务器,包括:
接收单元,用于接收客户端发送的触发操作,所述触发操作携带触发账户的账户信息;
确定单元,用于基于所述账户信息,确定触发账户的当前属性和所述账户信息的历史推荐的拍摄图标,其中,所述触发账户通过点击所述拍摄图标拍摄多媒体内容;
基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从所述候选拍摄图标中确定出目标拍摄图标;
发送单元,用于将包含所述目标拍摄图标的信息发送给所述客户端。
可选的,所述确定单元用于:
基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,判断在将各个候选拍摄图标发送给所述触发账户后,所述触发账户的状态变化;
将符合预设筛选规则的所述状态变化对应的候选拍摄图标,作为所述目标拍摄图标。
可选的,所述确定单元用于:
将所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,输入到训练完毕的策略模型中,预测在将各个候选拍摄图标发送给所述触发账户后,所述触发账户的状态变化。
可选的,所述确定单元用于:
将状态变化最大值对应的候选拍摄图标,作为所述目标拍摄图标;或者,
选取状态变化超过设定阈值的候选拍摄图标,作为所述目标拍摄图标。
可选的,对所述策略模型进行训练,所述确定单元进一步用于:
确定多个训练样本组;
对所述策略模型进行多轮训练,直到达到设定轮次时,输出训练完毕的策略模型,其中,每一轮训练均执行以下操作:
将多个中的一个训练样本组输入到当前一轮的初始策略模型中,判断在将所述各个训练样本中的训练样本拍摄图标发送给对应的样本账户后,所述样本账户的状态变化,以及将所述各个训练样本输入到当前一轮更新后的评估模型中,得到所述各个训练样本对应的评估参数,所述一个训练样本的评估参数表征对所述当前一轮的初始策略模型将一个训练样本拍摄图标发送给对应的一个样本账户的策略进行评估时得到的参数;
将各个评估参数、各个状态变化,以及所述各个训练样本拍摄图标对应的各个实际状态变化作为输入,对所述当前一轮的初始策略模型进行更新,得到当前一轮更新后的策略模型,并将所述当前一轮更新后的策略模型确定为下一轮的初始策略模型。
可选的,通过下列方式得到当前一轮更新后的评估模型,所述确定单元进一步用于:
基于所述当前一轮的初始策略模型,得到对应的所述各个状态变化,以及将所述各个训练样本输入到当前一轮的初始目标评估模型,得到对应的评估参数调整量;
将所述各个状态变化,以及各个评估参数调整量作为输入,对当前一轮的初始评估模型进行更新,得到所述当前一轮更新后的评估模型,并将所述当前一轮更新后的评估模型确定为下一轮的初始评估模型。
可选的,所述确定单元进一步用于:
基于所述当前一轮的初始目标评估模型的权重参数,和所述当前一轮更新后的评估模型的权重参数,对所述当前一轮的初始目标评估模型进行更新,得到当前一轮更新后的目标评估模型,并将所述当前一轮更新后的目标评估模型确定为下一轮的初始目标评估模型。
第四方面,本申请实施例还提供了一种确定拍摄图标的装置,应用于客户端,包括:
接收单元,用于接收到触发操作,其中,触发操作中携带触发账户的账户信息,所述触发操作为触发账户对应用程序执行的交互操作;
发送单元,用于将触发操作发送至服务器,以使所述服务器根据所述账户信息,确定出目标拍摄图标;
展示单元,用于接收所述服务器返回的信息,所述信息中携带目标拍摄图标,并将所述目标拍摄图标展示在页面上。
第五方面,本申请实施例还提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述任一项确定拍摄图标的方法。
第六方面,本申请实施例还提供了一种存储介质,包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行上述任一项确定拍摄图标的方法。
本申请有益效果如下:
本申请实施例中,接收客户端发送的触发操作,触发操作携带触发账户的账户信息;基于账户信息,确定触发账户的当前属性和账户信息的历史推荐的拍摄图标,其中,触发账户通过点击拍摄图标拍摄多媒体内容;基于触发账户的当前属性、触发账户对历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从候选拍摄图标中确定出目标拍摄图标;将包含目标拍摄图标的信息发送给客户端。由触发账户的当前属性、第一交互信息和第二交互信息,确定触发账户与各个候选拍摄图标之间的关联关系,根据关联关系选择目标拍摄图标。
附图说明
图1为本申请实施例提供的训练策略模型的流程示意图;
图2为本申请实施例提供的确定多个训练样本组的流程示意图;
图3为本申请实施例提供的生成样本账户K的一条历史数据的流程示意图;
图4为本申请实施例提供的训练策略模型的完整流程示意图;
图5为本申请实施例提供的确定拍摄图标的系统的架构示意图;
图6为本申请实施例提供的在客户端上确定拍摄图标的流程示意图;
图7为本申请实施例提供的在服务器上确定拍摄图标的流程示意图;
图8为本申请实施例提供的应用于服务器的确定拍摄图标的装置结构示意图;
图9为本申请实施例提供的应用于客户端的确定拍摄图标的装置结构示意图;
图10为本申请实施例提供的一种计算设备的结构示意图。
具体实施方式
为了解决无法选择与触发账户存在关联关系的拍摄图标的问题,本申请实施例中,提出了一种新的确定拍摄图标的方案。该方案包括:接收客户端发送的触发操作,触发操作携带触发账户的账户信息;基于账户信息,确定触发账户的当前属性和账户信息的历史推荐的拍摄图标,其中,触发账户通过点击拍摄图标拍摄多媒体内容;基于触发账户的当前属性、触发账户对历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从候选拍摄图标中确定出目标拍摄图标;将包含目标拍摄图标的信息发送给客户端。
下面结合附图对本发明优选的实施方式作出详细说明。
参阅图1所示,本申请实施例中训练策略模型的过程具体如下:
S101:确定多个训练样本组。
具体地,确定多个训练样本组的过程如图2所示:
S201:服务器基于同一样本账户的连续两条历史数据,生成对应的一个训练样本。
本申请实施例中,一个训练样本中包括,一个样本账户K的当前信息、为样本账户K选取的实际拍摄图标、实际拍摄图标对应的实际状态变化、实际拍摄图标的反馈参数,以及样本账户K的下一个信息。
具体地,样本账户K的当前信息中具体包含三类信息,分别是样本账户K的当前属性、样本账户K对历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息。在将实际拍摄图标发送给样本账户K后,样本账户K根据实际拍摄图标,对自身的当前信息进行更新,也就是说,样本账户K的下一个信息指的是,更新后的样本账户K的当前信息。
实际拍摄图标对应的实际状态变化指的是,从所有候选拍摄图标中选取该实际拍摄图标的概率,即实际拍摄图标的实际匹配概率。
实际拍摄图标的反馈参数表征,实际拍摄图标与样本账户K间的关联关系程度大小。样本账户K对实际拍摄图标执行设定操作,得到设定操作对应的反馈参数。所述设定操作可为以下任意一种操作:不点击、点击但不上传多媒体内容、点击且上传多媒体内容;若样本账户K没有点击实际拍摄图标,表征实际拍摄图标与样本账户K之间不存在关联关系,为其配置的反馈参数最小;若样本账户K点击且上传多媒体内容,表征实际拍摄图标与样本账户K间的关联关系高,为其配置的反馈参数最大。
例如,从样本账户1的第一条历史数据中,获取样本账户1的当前状态信息S1,为样本账户1选取的实际拍摄图标a,以及该实际拍摄图标a的实际匹配概率P,该实际拍摄图标a的反馈参数r;再将第二条历史数据中的当前状态信息,确定为样本账户1的下一个状态信息S2;最后,结合上述获取到的信息,生成对应的一个训练样本(S1,a,P,r,S2)。
在执行步骤201之前,生成样本账户K的一条历史数据的过程如图3所示:
S301:服务器接收客户端发送的触发操作,触发操作携带样本账户K的账户信息。
账户信息可为样本账户K的标识信息,或者其他用于标识样本账户K的身份信息。
S302:基于该账户信息,确定样本账户K的当前信息。
其中,在本申请实施例中,样本账户K的当前信息包括以下三类:
(一)样本账户K的当前属性。
在样本账户K的当前属性中具体包括,样本账户K的属性信息和样本账户K的历史行为信息。
(1)样本账户K的属性信息。
属性信息具体包括:样本账户K的年龄、性别、居住地所在的城市,以及样本账户K的账号注册天数。
(2)样本账户K的历史行为信息。
样本账户K的历史行为信息具体包括:样本账户K在第一设定时长内上传多媒体内容的数量,以及样本账户K在第二设定时长内访问服务器的次数。其中,第一设定时长包括一个月、三个月和六个月,第二设定时长包括一天、三天和八天,因此,第一设定时长大于第二设定时长。
例如,样本账户1在1个月内上传了3支视频,在3个月内上传了4支视频和2张图片,以及在6个月内上传了5支视频和2张图片;样本账户1在1天内通过安装在终端设备上的APP访问服务器5次,在3天内访问服务器12次,在8天内访问服务器20次。
(二)样本账户K对历史推荐的拍摄图标的第一交互信息。
第一交互信息具体包括:在第一设定时长内,服务器向样本账户K展示各个候选拍摄图标对应的次数、样本账户K点击各个候选拍摄图标对应的次数,以及样本账户K通过点击各个候选拍摄图标上传多媒体内容对应的次数。
例如,在3个月内向样本账户1展示月亮样式的候选拍摄图标3次,点击该候选拍摄图标1次,通过点击该候选拍摄图标上传视频1次;
向样本账户1展示汽车样式的候选拍摄图标8次,点击该候选拍摄图标3次,通过点击该候选拍摄图标上传视频1次,上传图片1次。
(三)每个账户对候选拍摄图标的第二交互信息。
一个候选拍摄图标的第二交互信息包括:该候选拍摄图标的标识信息,该候选拍摄图标在第三设定时长内向所有样本账户展示的次数总和,该候选拍摄图标在第三设定时长内被所有样本账户点击的次数总和,在第四设定时长内所有样本账户通过点击该候选拍摄图标上传多媒体内容的数量总和。其中,第三设定时长包括一天、三天和七天,第四设定时长包括一天、三天和五天,因此,第三设定时长大于第四设定时长。
例如,月亮样式的候选拍摄图标的ID为月亮Moon,该候选拍摄图标在1天内被展示了17次,在3天内被展示了23次,在7天内展示了38次;以及,在1天内有7个样本账户通过点击该候选拍摄图标共上传9支视频,在3天内有10个样本账户通过点击该候选拍摄图标共上传11支视频,在5天内有11个样本账户通过点击该候选拍摄图标共上传12支视频。
S303:服务器从素材库中随机选取一个候选拍摄图标,作为实际拍摄图标展示在页面上,并计算实际拍摄图标的实际匹配概率。
例如,素材库中共有300个不同样式的候选拍摄图标,服务器随机选取一个候选拍摄图标作为实际拍摄图标a展示在页面上,则实际拍摄图标a的实际匹配概率为1/300。
S304:服务器根据终端设备发送的样本账户K对实际拍摄图标执行的反馈操作,确定实际拍摄图标的反馈参数。
例如,服务器在接收到智能手机发送的样本账户1点击候选拍摄图标a时,确定候选拍摄图标a的奖励值为1;
又例如,服务器在接收到智能手机发送的样本账户1通过点击候选拍摄图标a上传视频时,确定候选拍摄图标a的奖励值为9。
S202:判断已生成的训练样本的数量是否达到预设数量阈值,若是,执行步骤203;否则,返回步骤201。
S203:将全部的训练样本随机划分为多组,得到多组训练样本。
因此,位于同一组的多个训练样本可能归属于同一样本账户,也可能归属于不同的样本账户。
S102:读取一组训练样本X。
S103:将训练样本组X输入到当前一轮的初始策略模型中,判断在将各个训练样本中的训练样本拍摄图标发送给对应的样本账户K后,样本账户K的状态变化,以及将各个训练样本输入到当前一轮更新后的评估模型中,得到各个训练样本对应的评估参数。
将各个训练样本输入到当前一轮的初始策略模型中,判断样本账户K是否会对训练样本拍摄图标执行设定操作,若样本账户K对训练样本拍摄图标执行点击且上传多媒体内容,表征样本账户K与训练样本拍摄图标间的关联关系高,对应的状态变化大;相反地,若样本账户K不点击训练样本拍摄图标,表征样本账户K与训练样本拍摄图标间的关联关系低,对应的状态变化小。
在执行步骤103之前,需要先得到当前一轮更新后的评估模型,具体过程如下:
首先,基于当前一轮的初始策略模型,得到训练样本组X中的各个训练样本对应的状态变化,以及将各个训练样本输入到当前一轮的初始目标评估模型,得到对应的评估参数调整量。
具体地,当前一轮的初始策略模型每读取一个训练样本,计算该训练样本的实际拍摄图标的状态变化;当前一轮的初始目标评估模型每读取一个训练样本,计算该训练样本中样本账户K的当前信息的评估参数调整量,以及样本账户K的下一个信息的评估参数调整量。
其次,将各个状态变化,以及各个评估参数调整量作为输入,对当前一轮的初始评估模型进行更新,得到当前一轮更新后的评估模型,并将当前一轮更新后的评估模型确定为下一轮的初始评估模型。
本申请实施例中,采用均方损失函数的目标值更新当前一轮的初始评估模型。其中,公式(1)为均方损失函数的目标值,M表征训练样本组X的总样本量,Pθ(a)表征第i个训练样本的实际拍摄图标a的状态变化,P表征第i个训练样本的实际拍摄图标a的实际匹配概率,ri表征第i个训练样本的实际拍摄图标a的反馈参数,Vw′(s)表征第i个训练样本中样本账户K的当前信息的评估参数调整量,Vw′(s′)表征第i个训练样本中样本账户K的下一个信息的评估参数调整量,γ表征衰减系数。
S104:将各个评估参数、各个状态变化,以及各个训练样本拍摄图标对应的各个实际状态变化作为输入,对当前一轮的初始策略模型进行更新,得到当前一轮更新后的策略模型,并将所述当前一轮更新后的策略模型确定为下一轮的初始策略模型。
本申请实施例中,采用如公式(2)所示的目标函数更新对当前一轮的初始策略模型。其中,公式(2)中的M表征训练样本组X的总样本量,Pθ(a)表征第i个训练样本的实际拍摄图标a的状态变化,P表征第i个训练样本的实际拍摄图标a的实际匹配概率,ri表征第i个训练样本的实际拍摄图标a的反馈参数,表征第i个训练样本中样本账户K的当前信息的评估参数,表征第i个训练样本中样本账户K的下一个信息的评估参数,γ表征衰减系数。
在执行完步骤104之后,进一步包括,更新当前一轮的初始目标评估模型,具体更新过程如下:
基于当前一轮的初始目标评估模型的权重参数,和当前一轮更新后的评估模型的权重参数,对当前一轮的初始目标评估模型进行更新,得到当前一轮更新后的目标评估模型,并将当前一轮更新后的目标评估模型确定为下一轮的初始目标评估模型。
本申请实施例中,采用如公式(3)更新当前一轮的初始目标评估模型。其中,w'表征当前一轮的初始目标评估模型,w表征当前一轮更新后的评估模型,w'新表征下一轮的初始目标评估模型,α是取值范围为(0,1)的随机数,用于控制模型的更新速度。
w'新=(1-α)w'+αw 公式(3);
S105:判断是否达到设定轮次,若是,执行步骤106;否则,返回步骤102。
S106:输出训练完毕的策略模型。
可选的,每隔设定周期,获取多个新的训练样本组,并采用上述步骤101~106,重新训练策略模型。
为了便于理解,参阅图4所示,以一具体实施例描述策略模型的训练过程:
S401:确定多个训练样本组;
S402:读取一个训练样本组X;
S403:基于当前一轮的初始策略模型,得到训练样本组X中的各个训练样本对应的状态变化,以及基于当前一轮的初始目标评估模型,得到对应的评估参数调整量;
S404:将各个状态变化,以及各个评估参数调整量作为输入,对当前一轮的初始评估模型进行更新,得到当前一轮更新后的评估模型,并将当前一轮更新后的评估模型确定为下一轮的初始评估模型;
S405:基于当前一轮的初始策略模型,得到训练样本组X中的各个训练样本对应的状态变化,以及基于当前一轮更新后的评估模型中,得到各个训练样本对应的评估参数;
S406:将各个评估参数、各个状态变化,以及各个训练样本拍摄图标对应的各个实际状态变化作为输入,对当前一轮的初始策略模型进行更新,得到当前一轮更新后的策略模型,并将所述当前一轮更新后的策略模型确定为下一轮的初始策略模型;
S407:基于当前一轮的初始目标评估模型的权重参数,和当前一轮更新后的评估模型的权重参数,对当前一轮的初始目标评估模型进行更新,得到当前一轮更新后的目标评估模型,并将当前一轮更新后的目标评估模型确定为下一轮的初始目标评估模型;
S408:判断是否达到设定轮次,若是,执行步骤409;否则,返回步骤402;
S409:输出训练完毕的策略模型。
参阅图5所示,本申请实施例提供了一种确定拍摄图标的系统。该系统中包括服务器,与服务器连接的客户端,以及置于服务器内部的策略模型。
参阅图6所示,在客户端上确定拍摄图标的过程如下:
S601:客户端接收到触发操作,其中,触发操作中携带触发账户的账户信息,触发操作为触发账户对应用程序执行的交互操作。
所述交互操作包括触发账户以点击屏幕的方式触发客户端,触发账户通过鼠标点击APP,触发客户端。
S602:将触发操作发送至服务器,以使服务器根据账户信息,确定出目标拍摄图标。
S603:接收服务器返回的信息,信息中携带目标拍摄图标,并将目标拍摄图标展示在页面上。
参阅图7所示,在服务器上确定拍摄图标的过程如下:
S701:接收客户端发送的触发操作,触发操作携带触发账户的账户信息。
S702:基于账户信息,确定触发账户的当前属性和账户信息的历史推荐的拍摄图标,其中,触发账户通过点击所述拍摄图标拍摄多媒体内容。
S703:基于触发账户的当前属性、触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从候选拍摄图标中确定出目标拍摄图标。
在执行步骤703时,具体分为以下两个步骤:
首先,基于触发账户的当前属性、触发账户对历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,判断在将各个候选拍摄图标发送给所述触发账户后,触发账户的状态变化。
其中,将触发账户的当前属性、触发账户对历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,输入到训练完毕的策略模型中,预测在将各个候选拍摄图标发送给触发账户后,触发账户的状态变化。
其次,将符合预设筛选规则的状态变化对应的候选拍摄图标,作为目标拍摄图标。
本申请实施例提供了以下两种确定目标拍摄图标的方式:
方式一:将状态变化最大值对应的候选拍摄图标,确定为目标拍摄图标;
方式二:选取状态变化超过设定阈值的候选拍摄图标,确定为目标拍摄图标。
S704:将包含所述目标拍摄图标的信息发送给所述客户端。
基于同一发明构思,本申请实施例中还提供了一种应用于服务器的确定拍摄图标的装置,参阅图8所示,至少包括接收单元801、确定单元802和发送单元803,其中,
接收单元801,用于接收客户端发送的触发操作,所述触发操作携带触发账户的账户信息;
确定单元802,用于基于所述账户信息,确定触发账户的当前属性和所述账户信息的历史推荐的拍摄图标,其中,所述触发账户通过点击所述拍摄图标拍摄多媒体内容;
基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从所述候选拍摄图标中确定出目标拍摄图标;
发送单元803,用于将包含所述目标拍摄图标的信息发送给所述客户端。
可选的,所述确定单元802用于:
基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,判断在将各个候选拍摄图标发送给所述触发账户后,所述触发账户的状态变化;
将符合预设筛选规则的所述状态变化对应的候选拍摄图标,作为所述目标拍摄图标。
可选的,所述确定单元802用于:
将所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,输入到训练完毕的策略模型中,预测在将各个候选拍摄图标发送给所述触发账户后,所述触发账户的状态变化。
可选的,所述确定单元802用于:
将状态变化最大值对应的候选拍摄图标,作为所述目标拍摄图标;或者,
选取状态变化超过设定阈值的候选拍摄图标,作为所述目标拍摄图标。
可选的,对所述策略模型进行训练,所述确定单元802进一步用于:
确定多个训练样本组;
对所述策略模型进行多轮训练,直到达到设定轮次时,输出训练完毕的策略模型,其中,每一轮训练均执行以下操作:
将多个中的一个训练样本组输入到当前一轮的初始策略模型中,判断在将所述各个训练样本中的训练样本拍摄图标发送给对应的样本账户后,所述样本账户的状态变化,以及将所述各个训练样本输入到当前一轮更新后的评估模型中,得到所述各个训练样本对应的评估参数,所述一个训练样本的评估参数表征对所述当前一轮的初始策略模型将一个训练样本拍摄图标发送给对应的一个样本账户的策略进行评估时得到的参数;
将各个评估参数、各个状态变化,以及所述各个训练样本拍摄图标对应的各个实际状态变化作为输入,对所述当前一轮的初始策略模型进行更新,得到当前一轮更新后的策略模型,并将所述当前一轮更新后的策略模型确定为下一轮的初始策略模型。
可选的,通过下列方式得到当前一轮更新后的评估模型,所述确定单元802进一步用于:
基于所述当前一轮的初始策略模型,得到对应的所述各个状态变化,以及将所述各个训练样本输入到当前一轮的初始目标评估模型,得到对应的评估参数调整量;
将所述各个状态变化,以及各个评估参数调整量作为输入,对当前一轮的初始评估模型进行更新,得到所述当前一轮更新后的评估模型,并将所述当前一轮更新后的评估模型确定为下一轮的初始评估模型。
可选的,所述确定单元802进一步用于:
基于所述当前一轮的初始目标评估模型的权重参数,和所述当前一轮更新后的评估模型的权重参数,对所述当前一轮的初始目标评估模型进行更新,得到当前一轮更新后的目标评估模型,并将所述当前一轮更新后的目标评估模型确定为下一轮的初始目标评估模型。
基于同一发明构思,本申请实施例中还提供了一种应用于客户端的确定拍摄图标的装置,参阅图9所示,至少包括接收单元901、发送单元902和展示单元903,其中,
接收单元901,用于接收到触发操作,其中,触发操作中携带触发账户的账户信息,所述触发操作为触发账户对应用程序执行的交互操作;
发送单元902,用于将触发操作发送至服务器,以使所述服务器根据所述账户信息,确定出目标拍摄图标;
展示单元903,用于接收所述服务器返回的信息,所述信息中携带目标拍摄图标,并将所述目标拍摄图标展示在页面上。
基于同一发明构思,本申请实施例中,提供一种计算设备,参阅图10所示,至少包括存储器1001和至少一个处理器1002,其中,存储器801和处理器1002通过通信总线完成相互间的通信;
存储器1001用于存储程序指令;
处理器1002用于调用存储器1001中存储的程序指令,按照获得的程序执行前述确定拍摄图标的方法。
基于同一发明构思,本申请实施例中,提供一种存储介质,至少包括计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行前述确定拍摄图标的方法。
综上所述,接收客户端发送的触发操作,触发操作携带触发账户的账户信息;基于账户信息,确定触发账户的当前属性和账户信息的历史推荐的拍摄图标,其中,触发账户通过点击拍摄图标拍摄多媒体内容;基于触发账户的当前属性、触发账户对历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从候选拍摄图标中确定出目标拍摄图标;将包含目标拍摄图标的信息发送给客户端。
本申请实施例是由触发账户的当前属性、第一交互信息和第二交互信息,确定触发账户与各个候选拍摄图标之间的关联关系,根据关联关系选择目标拍摄图标,选取出与触发账户存在关联关系的拍摄图标,可以提高用户对拍摄图标的关注度,进而提高用户点击拍摄图标的次数。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请实施例的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种确定拍摄图标的方法,其特征在于,应用于服务器,包括:
接收客户端发送的触发操作,所述触发操作携带触发账户的账户信息;
基于所述账户信息,确定触发账户的当前属性和所述账户信息的历史推荐的拍摄图标,其中,所述触发账户通过点击所述拍摄图标拍摄多媒体内容;
基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从所述候选拍摄图标中确定出目标拍摄图标;
将包含所述目标拍摄图标的信息发送给所述客户端。
2.如权利要求1所述的方法,其特征在于,基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从所述候选拍摄图标中选择目标拍摄图标,包括:
基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,判断在将各个候选拍摄图标发送给所述触发账户后,所述触发账户的状态变化;
将符合预设筛选规则的所述状态变化对应的候选拍摄图标,作为所述目标拍摄图标。
3.如权利要求2所述的方法,其特征在于,判断在将各个候选拍摄图标发送给所述触发账户后,所述触发账户的状态变化,包括:
将所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,输入到训练完毕的策略模型中,预测在将各个候选拍摄图标发送给所述触发账户后,所述触发账户的状态变化。
4.如权利要求2所述的方法,其特征在于,将符合预设筛选规则的所述状态变化对应的候选拍摄图标,作为所述目标拍摄图标,包括:
将状态变化最大值对应的候选拍摄图标,作为所述目标拍摄图标;或者,选取状态变化超过设定阈值的候选拍摄图标,作为所述目标拍摄图标。
5.如权利要求3所述的方法,其特征在于,对所述策略模型进行训练,进一步包括:
确定多个训练样本组;
对所述策略模型进行多轮训练,直到达到设定轮次时,输出训练完毕的策略模型,其中,每一轮训练均执行以下操作:
将多个中的一个训练样本组输入到当前一轮的初始策略模型中,判断在将所述各个训练样本中的训练样本拍摄图标发送给对应的样本账户后,所述样本账户的状态变化,以及将所述各个训练样本输入到当前一轮更新后的评估模型中,得到所述各个训练样本对应的评估参数,所述一个训练样本的评估参数表征对所述当前一轮的初始策略模型将一个训练样本拍摄图标发送给对应的一个样本账户的策略进行评估时得到的参数;
将各个评估参数、各个状态变化,以及所述各个训练样本拍摄图标对应的各个实际状态变化作为输入,对所述当前一轮的初始策略模型进行更新,得到当前一轮更新后的策略模型,并将所述当前一轮更新后的策略模型确定为下一轮的初始策略模型。
6.如权利要求5所述的方法,其特征在于,通过下列方式得到当前一轮更新后的评估模型,进一步包括:
基于所述当前一轮的初始策略模型,得到对应的所述各个状态变化,以及将所述各个训练样本输入到当前一轮的初始目标评估模型,得到对应的评估参数调整量;
将所述各个状态变化,以及各个评估参数调整量作为输入,对当前一轮的初始评估模型进行更新,得到所述当前一轮更新后的评估模型,并将所述当前一轮更新后的评估模型确定为下一轮的初始评估模型。
7.如权利要求6所述的方法,其特征在于,进一步包括:
基于所述当前一轮的初始目标评估模型的权重参数,和所述当前一轮更新后的评估模型的权重参数,对所述当前一轮的初始目标评估模型进行更新,得到当前一轮更新后的目标评估模型,并将所述当前一轮更新后的目标评估模型确定为下一轮的初始目标评估模型。
8.一种确定拍摄图标的方法,其特征在于,应用于客户端,包括:
接收到触发操作,其中,触发操作中携带触发账户的账户信息,所述触发操作为触发账户对应用程序执行的交互操作;
将触发操作发送至服务器,以使所述服务器根据所述账户信息,确定出目标拍摄图标;
接收所述服务器返回的信息,所述信息中携带目标拍摄图标,并将所述目标拍摄图标展示在页面上。
9.一种确定拍摄图标的装置,其特征在于,应用于服务器,包括:
接收单元,用于接收客户端发送的触发操作,所述触发操作携带触发账户的账户信息;
确定单元,用于基于所述账户信息,确定触发账户的当前属性和所述账户信息的历史推荐的拍摄图标,其中,所述触发账户通过点击所述拍摄图标拍摄多媒体内容;
基于所述触发账户的当前属性、所述触发账户对所述历史推荐的拍摄图标的第一交互信息,以及每个账户对候选拍摄图标的第二交互信息,从所述候选拍摄图标中确定出目标拍摄图标;
发送单元,用于将包含所述目标拍摄图标的信息发送给所述客户端。
10.一种确定拍摄图标的装置,其特征在于,应用于客户端,包括:
接收单元,用于接收到触发操作,其中,触发操作中携带触发账户的账户信息,所述触发操作为触发账户对应用程序执行的交互操作;
发送单元,用于将触发操作发送至服务器,以使所述服务器根据所述账户信息,确定出目标拍摄图标;
展示单元,用于接收所述服务器返回的信息,所述信息中携带目标拍摄图标,并将所述目标拍摄图标展示在页面上。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010479763.4A CN113741742B (zh) | 2020-05-29 | 2020-05-29 | 一种确定拍摄图标的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010479763.4A CN113741742B (zh) | 2020-05-29 | 2020-05-29 | 一种确定拍摄图标的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113741742A true CN113741742A (zh) | 2021-12-03 |
CN113741742B CN113741742B (zh) | 2024-05-14 |
Family
ID=78725158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010479763.4A Active CN113741742B (zh) | 2020-05-29 | 2020-05-29 | 一种确定拍摄图标的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113741742B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975563A (zh) * | 2016-04-29 | 2016-09-28 | 腾讯科技(深圳)有限公司 | 表情推荐方法及装置 |
CN107992530A (zh) * | 2017-11-14 | 2018-05-04 | 北京三快在线科技有限公司 | 信息推荐方法及电子设备 |
CN110139021A (zh) * | 2018-02-09 | 2019-08-16 | 北京三星通信技术研究有限公司 | 辅助拍摄方法及终端设备 |
CN110913135A (zh) * | 2019-11-26 | 2020-03-24 | 北京达佳互联信息技术有限公司 | 一种视频拍摄方法、装置、电子设备和存储介质 |
CN111143543A (zh) * | 2019-12-04 | 2020-05-12 | 北京达佳互联信息技术有限公司 | 一种对象推荐方法、装置、设备及介质 |
-
2020
- 2020-05-29 CN CN202010479763.4A patent/CN113741742B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105975563A (zh) * | 2016-04-29 | 2016-09-28 | 腾讯科技(深圳)有限公司 | 表情推荐方法及装置 |
CN107992530A (zh) * | 2017-11-14 | 2018-05-04 | 北京三快在线科技有限公司 | 信息推荐方法及电子设备 |
CN110139021A (zh) * | 2018-02-09 | 2019-08-16 | 北京三星通信技术研究有限公司 | 辅助拍摄方法及终端设备 |
CN110913135A (zh) * | 2019-11-26 | 2020-03-24 | 北京达佳互联信息技术有限公司 | 一种视频拍摄方法、装置、电子设备和存储介质 |
CN111143543A (zh) * | 2019-12-04 | 2020-05-12 | 北京达佳互联信息技术有限公司 | 一种对象推荐方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113741742B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108833458B (zh) | 一种应用推荐方法、装置、介质及设备 | |
CN107391538B (zh) | 点击数据采集、处理和展示方法、装置、设备及存储介质 | |
CN107885796B (zh) | 信息推荐方法及装置、设备 | |
CN108259939B (zh) | 新视频推送控制方法、装置及服务器 | |
WO2019051701A1 (zh) | 拍照终端及其基于长短期记忆神经网络的拍照参数设置方法 | |
CN109117980A (zh) | 数据预填方法、装置及设备 | |
CN115455280A (zh) | 一种推荐列表确定方法和服务器 | |
CN114201626B (zh) | 多媒体推荐方法、装置、电子设备及存储介质 | |
CN113132803B (zh) | 视频观看时长预测方法、装置、存储介质以及终端 | |
CN113297486B (zh) | 一种点击率预测方法及相关装置 | |
CN111813307B (zh) | 应用程序显示方法、装置及电子设备 | |
CN113741742B (zh) | 一种确定拍摄图标的方法及装置 | |
US11175807B1 (en) | Intelligent contextual video thumbnail display | |
CN113038242B (zh) | 直播卡片展示位置的确定方法、装置、设备及存储介质 | |
CN111988642A (zh) | 推荐视频的方法、装置、服务器和存储介质 | |
CN107341172B (zh) | 视频收益计算建模装置与方法及视频推荐装置与方法 | |
CN115687691A (zh) | 视频推荐方法及装置 | |
CN110929163B (zh) | 课程推荐方法、装置、计算机设备及存储介质 | |
CN110020129A (zh) | 点击率校正方法、预估方法、装置、计算设备及存储介质 | |
CN111275473B (zh) | 内容项投放方法、装置、服务器及存储介质 | |
CN108305097B (zh) | 一种数据处理方法、设备及客户端 | |
CN114547434B (zh) | 对象推荐方法、装置、电子设备及存储介质 | |
CN113742531B (zh) | 一种图推荐方法、装置及电子设备 | |
CN113256034B (zh) | 信息投放方法、装置、电子设备及存储介质 | |
CN113065066B (zh) | 预测方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |