WO2019001185A1 - 信息处理和模型训练方法、装置、电子设备、存储介质 - Google Patents

信息处理和模型训练方法、装置、电子设备、存储介质 Download PDF

Info

Publication number
WO2019001185A1
WO2019001185A1 PCT/CN2018/088249 CN2018088249W WO2019001185A1 WO 2019001185 A1 WO2019001185 A1 WO 2019001185A1 CN 2018088249 W CN2018088249 W CN 2018088249W WO 2019001185 A1 WO2019001185 A1 WO 2019001185A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
pop
popup
user
training set
Prior art date
Application number
PCT/CN2018/088249
Other languages
English (en)
French (fr)
Inventor
黄献德
Original Assignee
北京金山安全软件有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN201710525652.0 external-priority
Application filed by 北京金山安全软件有限公司 filed Critical 北京金山安全软件有限公司
Priority to US16/480,925 priority Critical patent/US20200167645A1/en
Publication of WO2019001185A1 publication Critical patent/WO2019001185A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/542Event management; Broadcasting; Multicasting; Notifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/75Indicating network or usage conditions on the user display

Abstract

本申请实施例提供了一种信息处理和模型训练方法、装置、电子设备、存储介质,方法包括:获取发送给电子设备的待处理弹窗信息;将待处理弹窗信息输入弹窗管理模型;弹窗管理模型为:基于深度神经网络构建的、用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息的模型,用户感兴趣的弹窗信息为关注度大于阈值的信息;若弹窗管理模型的输出结果为待处理弹窗信息为用户感兴趣的弹窗信息,将待处理弹窗信息发送给电子设备,以使电子设备通过弹窗功能显示待处理弹窗信息。应用本申请实施例,解决了电子设备显示大量用户不感兴趣的弹窗信息的问题,提高了用户体验。

Description

信息处理和模型训练方法、装置、电子设备、存储介质
本申请要求于2017年6月30日提交中国专利局、申请号为201710525652.0发明名称为“信息处理和模型训练方法、装置、电子设备、存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及互联网技术领域,特别是涉及一种信息处理和模型训练方法、装置、电子设备、存储介质。
背景技术
目前,为了便于用户及时获取并查看感兴趣的信息,在电子设备,如智能手机、平板电脑、笔记本等上设置了弹窗功能。当电子设备接收到信息后,通过弹窗功能显示该信息,此时,可以将需要通过弹窗功能显示的信息称为弹窗信息。
随着科技的发展,网络中的弹窗信息越来越丰富,这些弹窗信息中加杂着大量的用户不感兴趣的弹窗信息,若将这些弹窗信息都发送给电子设备,这直接导致的结果为:电子设备通过弹窗功能显示大量用户不感兴趣的弹窗信息,影响用户对电子设备的正常使用,用户体验不佳。
发明内容
本申请实施例的目的在于提供一种信息处理和模型训练方法、装置、电子设备、存储介质,以解决电子设备显示大量用户不感兴趣的弹窗信息的问题。具体技术方案如下:
第一方面,本申请实施例公开了一种信息处理方法,所述方法包括:
获取待处理弹窗信息;
将所述待处理弹窗信息输入弹窗管理模型;所述弹窗管理模型为:基于深度神经网络构建的、用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息的模型;所述用户感兴趣的弹窗信息为关注度大于阈值的信息;
若所述弹窗管理模型的输出结果为指示所述待处理弹窗信息为用户感兴趣的弹窗信息的信息,将所述待处理弹窗信息发送给目标电子设备,以使所 述目标电子设备通过弹窗功能显示所述待处理弹窗信息。
可选的,所述方法还包括:
若所述弹窗管理模型的输出结果为指示所述待处理弹窗信息为用户不感兴趣的弹窗信息的信息,拒绝将所述待处理弹窗信息发送给所述目标电子设备。
可选的,所述弹窗管理模型通过以下方式训练获得:
基于深度神经网络,构建弹窗管理模型;所述弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;
获取训练集,将所述训练集中的弹窗信息转换为特征向量,为所述训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
使用所述特征向量和所述标签,训练所述弹窗管理模型。
可选的,所述弹窗管理模型通过以下方式训练获得:
获取训练集,所述训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,所述标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
将所述训练集中的弹窗信息转换为特征向量,并为所述训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
获取预设的深度神经网络,初始化所述深度神经网络的参数作为目标参数;
将所述训练集包括的每个弹窗信息的特征向量输入所述深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
根据每个弹窗信息的输出结果和所述训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
根据所述弹窗信息损失值,判断采用所述目标参数的深度神经网络是否收敛;
若不收敛,则调整所述深度神经网络的参数,将调整后的参数作为目标参数,返回执行所述将所述训练集包括的每个弹窗信息输入所述深度神经网络,得到每个弹窗信息的输出结果的步骤;
若收敛,则将采用所述目标参数的深度神经网络作为弹窗管理模型。
可选的,所述将所述训练集中的弹窗信息转换为特征向量的步骤,包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,所述深度神经网络包括输入层、抽象层和输出层;
其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的维数相同;所述抽象层的激活函数为ReLu(Rectified Linear Units,修正线性单元)函数;所述输出层的激活函数为sigmoid(S型)函数。
可选的,在所述将所述待处理弹窗信息输入弹窗管理模型的步骤之后,所述方法还包括:
将所述弹窗管理模型的输出结果与所述待处理弹窗信息的对应关系加入所述训练集。
可选的,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,所述训练集通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
第二方面,本申请实施例公开了一种模型训练方法,所述方法包括:
基于深度神经网络,构建弹窗管理模型;所述弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;所述用户感兴趣的弹窗信息为关注度大于阈值的信息;
获取训练集,将所述训练集中的弹窗信息转换为特征向量,为所述训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
使用所述特征向量和所述标签,训练所述弹窗管理模型。
可选的,所述将所述训练集中的弹窗信息转换为特征向量的步骤,包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,所述深度神经网络包括输入层、抽象层和输出层;
其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的维数相同;所述抽象层的激活函数为ReLu函数;所述输出层的激活函数为sigmoid函数。
可选的,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,所述训练集通过以下方式确定:
将获取的多个弹窗信息发送多个给电子设备,以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收所述多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
第三方面,本申请实施例公开了一种模型训练方法,所述方法包括:
获取训练集,所述训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,所述标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
将所述训练集中的弹窗信息转换为特征向量,并为所述训练集中的弹窗 信息标记该弹窗信息对应的标签信息的标签;
获取预设的深度神经网络,初始化所述深度神经网络的参数作为目标参数;
将所述训练集包括的每个弹窗信息的特征向量输入所述深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
根据每个弹窗信息的输出结果和所述训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
根据所述弹窗信息损失值,判断采用所述目标参数的深度神经网络是否收敛;
若不收敛,则调整所述深度神经网络的参数,将调整后的参数作为目标参数,返回执行所述将所述训练集包括的每个弹窗信息输入所述深度神经网络,得到每个弹窗信息的输出结果的步骤;
若收敛,则将采用所述目标参数的深度神经网络作为弹窗管理模型。
可选的,所述将所述训练集中的弹窗信息转换为特征向量的步骤,包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,所述深度神经网络包括输入层、抽象层和输出层;
其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的维数相同;所述抽象层的激活函数为ReLu函数;所述输出层的激活函数为sigmoid函数。
可选的,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,所述训练集通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备,以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
第四方面,本申请实施例公开了一种信息处理装置,所述装置包括:
获取模块,用于获取待处理弹窗信息;
输入模块,用于将所述待处理弹窗信息输入弹窗管理模型;所述弹窗管理模型为:基于深度神经网络构建的、用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息的模型;所述用户感兴趣的弹窗信息为关注度大于阈值的信息;
发送模块,用于若所述弹窗管理模型的输出结果为指示所述待处理弹窗信息为用户感兴趣的弹窗信息的信息,将所述待处理弹窗信息发送给目标电子设备,以使所述目标电子设备通过弹窗功能显示所述待处理弹窗信息。
可选的,所述装置还包括:
拒绝模块,用于若所述弹窗管理模型的输出结果为指示所述待处理弹窗信息为用户不感兴趣的弹窗信息的信息,拒绝将所述待处理弹窗信息发送给所述目标电子设备。
可选的,所述装置还包括:训练模块,用于训练获得所述弹窗管理模型;所述训练模块包括:
构建子模块,用于基于深度神经网络,构建弹窗管理模型;所述弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;
转换子模块,用于获取训练集,将所述训练集中的弹窗信息转换为特征向量,为所述训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
训练子模块,用于使用所述特征向量和所述标签,训练所述弹窗管理模型。
可选的,所述装置还包括:训练模块,用于训练获得所述弹窗管理模型; 所述训练模块包括:
第一获取子模块,用于获取训练集,所述训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,所述标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
转换子模块,用于将所述训练集中的弹窗信息转换为特征向量,并为所述训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
第二获取子模块,用于获取预设的深度神经网络,初始化所述深度神经网络的参数作为目标参数;
输入子模块,用于将所述训练集包括的每个弹窗信息的特征向量输入所述深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
计算子模块,用于根据每个弹窗信息的输出结果和所述训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
判断子模块,用于根据所述弹窗信息损失值,判断采用所述目标参数的深度神经网络是否收敛;
处理子模块,用于若所述判断子模块的判断结果为否,则调整所述深度神经网络的参数,将调整后的参数作为目标参数;若所述判断子模块的判断结果为是,则将采用所述目标参数的深度神经网络作为弹窗管理模型。
可选的,所述转换子模块,具体用于:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,所述深度神经网络包括输入层、抽象层和输出层;
其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的维数相同;所述抽象层的激活函数为ReLu函数;所述输出层的激活函数为sigmoid函数。
可选的,所述装置还包括:
加入模块,用于在将所述待处理弹窗信息输入弹窗管理模型之后,将所述弹窗管理模型的输出结果与所述待处理弹窗信息的对应关系加入所述训练集。
可选的,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,所述装置还包括:确定模块,用于确定训练集;所述确定模块包括:
发送子模块,用于将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收子模块,用于接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
加入子模块,用于根据接收的对应关系确定训练集。
第五方面,本申请实施例公开了一种模型训练装置,所述装置包括:
构建模块,用于基于深度神经网络,构建弹窗管理模型;所述弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;所述用户感兴趣的弹窗信息为关注度大于阈值的信息;
转换模块,用于获取训练集,将所述训练集中的弹窗信息转换为特征向量,为所述训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
训练模块,用于使用所述特征向量和所述标签,训练所述弹窗管理模型。
可选的,所述转换模块,具体用于:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,所述深度神经网络包括输入层、抽象层和输出层;
其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的 维数相同;所述抽象层的激活函数为ReLu函数;所述输出层的激活函数为sigmoid函数。
可选的,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,所述装置还包括:确定模块,用于确定训练集;所述确定模块包括:
发送子模块,用于将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收子模块,用于接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
加入子模块,用于根据接收的对应关系确定训练集。
第六方面,本申请实施例公开了一种模型训练装置,所述装置包括:
第一获取模块,用于获取训练集,所述训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,所述标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
转换模块,用于将所述训练集中的弹窗信息转换为特征向量,并为所述训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
第二获取模块,用于获取预设的深度神经网络,初始化所述深度神经网络的参数作为目标参数;
输入模块,用于将所述训练集包括的每个弹窗信息的特征向量输入所述深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
计算模块,用于根据每个弹窗信息的输出结果和所述训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
判断模块,用于根据所述弹窗信息损失值,判断采用所述目标参数的深 度神经网络是否收敛;
处理模块,用于若所述判断模块的判断结果为否,则调整所述深度神经网络的参数,将调整后的参数作为目标参数;若所述判断模块的判断结果为是,则将采用所述目标参数的深度神经网络作为弹窗管理模型。
可选的,所述转换模块,具体用于:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,所述深度神经网络包括输入层、抽象层和输出层;
其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的维数相同;所述抽象层的激活函数为ReLu函数;所述输出层的激活函数为sigmoid函数。
可选的,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,所述装置还包括:确定模块,用于确定训练集;所述确定模块包括:
发送子模块,用于将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收子模块,用于接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
加入子模块,用于根据接收的对应关系确定训练集。
第七方面,本申请实施例公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序,实现上述第一方面公开的任一信息处理方法步骤。
第八方面,本申请实施例公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序,实现上述第二方面公开的任一模型训练方法步骤。
第九方面,本申请实施例公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
所述存储器,用于存放计算机程序;
所述处理器,用于执行所述存储器上所存放的程序,实现上述第三方面公开的任一模型训练方法步骤。
第十方面,本申请实施例公开了一种存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面公开的任一信息处理方法步骤。
第十一方面,本申请实施例公开了一种存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第二方面公开的任一模型训练方法步骤。
第十二方面,本申请实施例公开了一种存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第三方面公开的任一模型训练方法步骤。
第十三方面,本申请实施例公开了一种计算机程序,所述计算机程序被处理器执行时实现上述上述第一方面公开的任一信息处理方法步骤。
第十四方面,本申请实施例公开了一种计算机程序,所述计算机程序被处理器执行时实现上述上述第二方面公开的任一模型训练方法步骤。
第十五方面,本申请实施例公开了一种计算机程序,所述计算机程序被处理器执行时实现上述上述第三方面公开的任一模型训练方法步骤。
本申请实施例中,基于深度神经网络构建弹窗管理模型,该弹窗管理模型用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息;这种情况下,将获取到的待处理弹窗信息输入弹窗管理模型中,若该弹窗管理模型的输出结果显示为:待处理弹窗信息为用户感兴趣的弹窗信息,再将待处理弹窗信息发送给电子设备,电子设备通过弹窗功能显示待处理弹窗信息。这样,有效地减少了电子设备接收到的用户不感兴趣的弹窗信息的数量,解决了电子设备显示大量用户不感兴趣的弹窗信息的问题,提高了用户体验。当然,实施本申请的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的模型训练方法的一种流程示意图;
图2为本申请实施例中使用的弹窗管理模型的一种示意图;
图3为本申请实施例提供的训练集确定方法的一种流程示意图;
图4为本申请实施例提供的信息处理方法的第一种流程示意图;
图5为本申请实施例提供的信息处理方法的第二种流程示意图;
图6为本申请实施例提供的模型训练装置的一种结构示意图;
图7为本申请实施例提供的信息处理装置的第一种结构示意图;
图8为本申请实施例提供的信息处理装置的第二种结构示意图;
图9为本申请实施例提供的信息处理装置的第三种结构示意图;
图10为本申请实施例提供的电子设备的第一种结构示意图;
图11为本申请实施例提供的电子设备的第二种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为便于理解,下面对本申请实施例中出现的词语进行解释。
弹窗信息:电子设备通过弹窗功能显示的信息。例如,运行该应用程序的服务器发送的推送信息、其他电子设备向一个电子设备的来电、或其他电子设备向一个电子设备发送的短信消息等。
用户感兴趣的弹窗信息:与用户的行为习惯相关的弹窗信息,为关注度大于阈值的信息。在本申请实施例中,关注度可以用点击频率来确定。例如,用户经常点击浏览购物的网页,点击频率大于了阈值,则可以将购物相关的弹窗信息确定为用户感兴趣的弹窗信息;再例如,用户点击查看某一应用程序的推送信息的频率大于了阈值,则可以将该应用程序的推送信息确定为用户感兴趣的弹窗信息;再例如,用户接听了某一陌生来电的频率大于了阈值,则可以将该来电确定为用户感兴趣的弹窗信息等。
目前,网络中的存在了大量用户感兴趣或不感兴趣的弹窗信息,若将这些弹窗信息都发送给电子设备,这直接导致的结果为:电子设备通过弹窗功能显示大量用户不感兴趣的弹窗信息,影响用户对电子设备的正常使用,用户体验不佳。
为了解决电子设备显示大量用户不感兴趣的弹窗信息的问题,提高用户体验,本申请实施例提供了一种信息处理和模型训练方法、装置、电子设备、存储介质。该信息处理和模型训练方法、装置可以应用于云端服务器。
参考图1,图1为本申请实施例提供的模型训练方法的一种流程示意图,该方法包括如下步骤。
S101:基于深度神经网络,构建弹窗管理模型。
其中,弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息,即,指示用户感兴趣的弹窗信息的信息和指示用户不感兴趣的弹窗信息的信息;这里,用户感兴趣的弹窗信息为关注度大于阈值的信息。例如,阈值为0.8,若一个弹窗信息的关注度为0.9,0.9>0.8,则确定该弹窗信息为 用户感兴趣的弹窗信息。
建模单元为弹窗管理模型对输入的弹窗信息进行处理后,得到的输出结果的类型信息。基于深度神经网络构建初始的弹窗管理模型。
在本申请的一个实施例中,用户感兴趣的弹窗信息为关注度为1的信息,对于用户感兴趣的弹窗信息,电子设备在通过弹窗功能显示后,用户会查看该弹窗信息,即用户感兴趣的弹窗信息为用户查看的弹窗信息;用户不感兴趣的弹窗信息为关注度为0的信息,对于用户不感兴趣的弹窗信息,电子设备在通过弹窗功能显示后,用户不会查看该弹窗信息,即用户不感兴趣的弹窗信息为用户未查看的弹窗信息。
在本申请的一个实施例中,电子设备在通过弹窗功能显示弹窗信息后,用户可以通过点击弹窗信息的方式查看该弹窗信息,即用户感兴趣的弹窗信息为用户点击的弹窗信息。另外,用户还可以通过其他方式查看弹窗信息,本申请实施例对此进行限定。
深度神经网络是由多个神经元组成的,属于前向式神经网络的一种。
构建弹窗管理模型的深度神经网络由输入层、抽象层和输出层组成,如图2所示,每一层都有神经元的输入和输出,其中,神经元的输入为前一层神经元的输出。其中,抽象层用于对输入的信息的特征向量进行解析处理。
在本申请的一个实施例中,构建弹窗管理模型的深度神经网络的输入层、抽象层和输出层部署的神经元的个数可以为:输入层包括90个神经元;抽象层包括5层,其中,第一层包括45个神经元,第二层包括30个神经元,第三层包括20个神经元,第四层包括10个神经元,第五层包括5个神经元。
在本申请的一个实施例中,抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数,即输出层采用sigmoid二元分类器,输出结果为指示用户感兴趣的弹窗信息的信息或指示用户不感兴趣的弹窗信息的信息。
在本申请的一个实施例中,为了保证弹窗管理模型输出结果的准确性,深度神经网络采用不同类型的神经网络进行构建,例如,神经网络包括:CNN(Convolutional Neural Network卷积神经网络)、LSTM(LSTM(Long Short-Term Memory,长短时记忆网络)、RNN(Simple Recurrent Neural Network, 循环神经网络)等,可以采用其中的一种或多种构建深度神经网络。
S102:获取训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签。
其中,训练集中包括大量的弹窗信息与指示弹窗信息是否为用户感兴趣的弹窗信息的信息的对应关系。训练集中指示弹窗信息是否为用户感兴趣的弹窗信息的信息作为弹窗信息对应的标签信息。
本申请实施例中,弹窗管理模型的输入层包括的神经元个数与特征向量的维数相同,例如输入层包括90个神经元,则特征向量的维数为90。
上述弹窗管理模型的输入层包括的神经元个数与特征向量的维数相同。同理,针对构建弹窗管理模型的深度神经网络,输入层包括的神经元个数与特征向量的维数相同。
在本申请的一个实施例中,训练集中包括的弹窗信息可以为用户预先配置的,也可以为从具有弹窗功能的电子设备中获取的。
参考图3,图3为本申请实施例提供的训练集确定方法的一种流程示意图,该方法包括:
S301:将获取的弹窗信息发送给电子设备。
步骤S301即为将获取的多个弹窗信息发送给多个电子设备,以保证获取到足够多的弹窗信息和弹窗信息对应的标签信息。
其中,一个电子设备可以接收一个弹窗信息,也可以接收多个弹窗信息。本申请实施例对此不进行限定。
各个电子设备分别通过弹窗功能显示接收的窗信息。另外,若用户查看了该弹窗信息,则电子设备记录下用户查看弹窗信息;若用户未查看该弹窗信息,则电子设备记录下用户未查看弹窗信息。这里,用户查看的弹窗信息可以理解为用户感兴趣的弹窗信息。
S302:接收电子设备反馈的弹窗信息与用户是否查看弹窗信息的对应关系。
步骤S302即为接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系。
电子设备在记录用户是否查看弹窗信息后,将弹窗信息与用户是否查看该弹窗信息的记录发送给构建训练集的设备。
S303:将接收的对应关系加入训练集。
步骤S303即为根据接收的对应关系确定训练集。
网络中存在着大量的弹窗信息,基于这些弹窗信息,可以很快的获取到大量的弹窗信息与用户是否查看该弹窗信息的对应关系,基于包括了大量的弹窗信息与用户是否查看该弹窗信息的对应关系,构成训练集,以用于后续弹窗管理模型的训练。
本申请的一个实施例中,在确定训练集时,可以确定出针对不同国家的训练集,例如,根据获取到针对中国的弹窗信息确定针对中国的训练集,根据获取到针对英国的弹窗信息确定针对英国的训练集。这样基于针对不同国家的训练集,分别训练获得针对不同国家的弹窗管理模型,能够更为准确的识别出接收到的弹窗信息是否为用户感兴趣的弹窗信息。
这里,针对某一国家的弹窗信息可以通过显示弹窗信息的电子设备的所在地确定,例如显示弹窗信息的电子设备的所在地在中国,则确定该弹窗信息为针对中国的弹窗信息。针对某一国家的弹窗信息还可以通过弹窗信息的显示语种确定,例如弹窗信息是以汉语显示的,则确定该弹窗信息为针对中国的弹窗信息。根据实际需要,还可以通过其他方式确定针对某一国家的弹窗信息,本申请实施例中对此不进行限定。
在进行模型训练时,获取到训练集后,对训练集中的弹窗信息进行时间、电子设备的规格等方面的数据挖掘,获取到多维的特征向量。
在本申请的一个实施例中,可以根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为多维特征向量;其中,显示时间为显示弹窗信息的时间时长,可以分为工作时间或休息时间,或分为上午时间或下午时间或晚上时间等;显示延迟时长为显示弹窗信息后延迟查看的时长,这里显示延迟时长可以为一个电子设备显示各个 弹窗信息的延迟平均时长。
在本申请的一个实施例中,弹窗信息是针对某一应用程序的弹窗信息。这种情况下,还可以基于用户使用应用程序的频率获得弹窗信息的一维的特征向量,再结合根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格获得的特征向量,构成一个多维的特征向量。
另外,在进行模型训练时,获取到训练集后,根据训练集中包括的弹窗信息和指示该弹窗信息是否为用户感兴趣的弹窗信息的信息,可以为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签。例如,若训练集中记录一弹窗信息为用户查看的弹窗信息,则将该弹窗信息标记为1,若训练集中记录一弹窗信息为用户未查看的弹窗信息,则将该弹窗信息标记为0。其中,标签1表示该弹窗信息为用户感兴趣的弹窗信息,标签0表示该弹窗信息为用户不感兴趣的弹窗信息。
S103:使用特征向量和标签,训练弹窗管理模型。
使用获得的多维特征向量和标签,通过反向传播算法训练弹窗管理模型,反复调整弹窗管理模型的参数,直至弹窗管理模型输出结果的正确率达到阈值为止。
在本申请的一个实施例,为了加快训练弹窗管理模型的速度,在对弹窗管理模型进行训练前,可以随机初始化弹窗管理模的参数,或根据经验设置弹窗管理模的初始参数。另外,还可以通过其他方式初始弹窗管理模的初始参数,本申请对此不进行限定。
应用上述实施例,获取包括大量弹窗信息的训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签,依据获得的特征向量和标签,训练弹窗管理模型,进而依据训练获得的弹窗管理模型,能够较为准确的识别出弹窗信息是否为用户感兴趣的弹窗信息。
基于相同的发明构思,根据上述模型训练方法,本申请实施例还提供了一种模型训练方法。该模型训练方法可包括如下步骤。
步骤01,获取训练集。训练集包括多个弹窗信息和多个弹窗信息对应的 标签信息,标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息。
为了保证训练获得的弹窗管理模型准确可靠,训练集中包括的弹窗信息和弹窗信息对应的标签信息越多越好。
步骤02,将训练集中的弹窗信息转换为特征向量,并为训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签。
例如,根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
步骤03,获取预设的深度神经网络,初始化深度神经网络的参数作为目标参数。
其中,深度神经网络的结构可参考步骤S101中的描述。深度神经网络的参数构成一个参数集,可以由θ i表示。为了加快深度神经网络的训练,初始化的参数可以根据实际需要和经验进行设置。
本步骤中,还可以对训练相关的高层参数如学习率、梯度下降算法、反向传播算法等进行合理的设置,具体可以采用相关技术中的各种方式,在此不再进行详细描述。
本申请实施例中不限定步骤01与步骤03的执行顺序。
步骤04,将训练集包括的每个弹窗信息的特征向量输入深度神经网络,得到每个弹窗信息的输出结果。每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息。
例如,将一弹窗信息的特征向量输入预设的深度神经网络进行处理的过程中,得到第一概率和第二概率。其中,第一概率为指示输入的弹窗信息为用户感兴趣的弹窗信息的信息的概率,第二概率为指示输入的弹窗信息不是用户感兴趣的弹窗信息的信息的概率。
若第一概率大于第二概率,则确定该弹窗信息对应的输出结果为指示输入的弹窗信息为用户感兴趣的弹窗信息的信息;否则,确定该弹窗信息对应 的输出结果为指示输入的弹窗信息不是用户感兴趣的弹窗信息的信息。
第一次进入本步骤处理时,当前参数集为θ 1,后续再次进入本步骤处理时,当前参数集θ i为对上一次使用的参数集θ i-1进行调整后得到的,详见后续描述。
步骤05,根据每个弹窗信息的输出结果和训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值。
一个例子中,可以使用均方误差(Mean Squared Error,MSE)公式作为损失函数,得到损失值L(θ i),详见如下公式:
Figure PCTCN2018088249-appb-000001
其中,H表示单次训练中从预设训练集中选取的弹窗信息个数,I j表示第j个弹窗信息的特征向量,F(I ji)表示针对第j个弹窗信息,深度神经网络在参数集θ i下步骤04得到的输出结果,X j表示第j个弹窗信息的标签,i为当前已执行步骤04的次数计数。
步骤06,根据弹窗信息损失值,判断采用目标参数的深度神经网络是否收敛;若不收敛,则执行步骤07;若收敛,则执行步骤08。
例如,可以当损失值小于预设损失值阈值时,确定收敛;也可以当本次计算得到损失值与上一次计算得到的损失值之差小于预设变化阈值时,确定收敛,本申请实施例在此不做限定。
步骤07,调整深度神经网络的参数,将调整后的参数作为目标参数,返回执行步骤04。
具体可以利用反向传播算法对当前参数集θ i中的参数进行调整,得到调整后的参数集。
步骤08,将采用目标参数的深度神经网络作为弹窗管理模型。
具体的,将当前参数集θ i作为输出的最终参数集θ final,并将采用最终参数集θ final的深度神经网络,作为训练完成的弹窗管理模型。
应用上述实施例,获取包括大量弹窗信息的训练集,将训练集中的弹窗 信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签,依据获得的特征向量和标签,训练弹窗管理模型,进而依据训练获得的弹窗管理模型,能够较为准确的识别出弹窗信息是否为用户感兴趣的弹窗信息。
基于相同的发明构思,依据上述训练获得的弹窗管理模型,本申请实施例提供了一种信息处理方法。
参考图4,图4为本申请实施例提供的信息处理方法的第一种流程示意图,该方法包括如下步骤。
S401:获取发送给电子设备的待处理弹窗信息。
步骤S401即为获取待处理弹窗信息。上述发送给电子设备的待处理弹窗信息即为,待发送给目标电子设备的待处理弹窗信息。
在本申请的一个实施例中,可以通过截获其他设备向电子设备发送的弹性信息确定待处理弹窗信息。
例如,在电子设备运行应用程序时,可以获取到该应用程序的服务器向该电子设备发送针对该应用程序的弹窗信息,将获取到的弹窗信息作为待处理弹窗信息。
再例如,电子设备为手机,其他手机向一个手机拨打电话,此时可以获取陌生的来电,将获取到的陌生的来电作为待处理弹窗信息。
另外,若电子设备为手机,其他手机向一个手机发送短信消息,此时可以获取该短信消息,将获取到的短信消息作为待处理弹窗信息。
S402:将待处理弹窗信息输入弹窗管理模型。
其中,弹窗管理模型为:基于深度神经网络构建的、用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息的模型,用户感兴趣的弹窗信息为关注度大于阈值的信息。
在本申请的一个实施例中,上述弹窗管理模型可以通过以下方式训练获得:
基于深度神经网络,构建弹窗管理模型;弹窗管理模型的建模单元为:是否为用户感兴趣的弹窗信息;
获取训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
使用获得的特征向量和标签,训练弹窗管理模型。
在本申请的另一个实施例中,弹窗管理模型可以通过以下方式训练获得:
获取训练集,训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
将训练集中的弹窗信息转换为特征向量,并为训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
获取预设的深度神经网络,初始化深度神经网络的参数作为目标参数;
将训练集包括的每个弹窗信息的特征向量输入深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
根据每个弹窗信息的输出结果和训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
根据弹窗信息损失值,判断采用目标参数的深度神经网络是否收敛;
若不收敛,则调整深度神经网络的参数,将调整后的参数作为目标参数,返回执行将训练集包括的每个弹窗信息输入深度神经网络,得到每个弹窗信息的输出结果的步骤;
若收敛,则将采用目标参数的深度神经网络作为弹窗管理模型。
在本申请的一个实施例中,将训练集中的弹窗信息转换为特征向量的步骤,包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
在本申请的一个实施例中,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
在本申请的一个实施例中,用户感兴趣的弹窗信息为用户查看的弹窗信息。
在本申请的一个实施例中,训练集通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
上述弹窗管理模型的训练可参考图1所示的实施例。
S403:若弹窗管理模型的输出结果为待处理弹窗信息为用户感兴趣的弹窗信息,将待处理弹窗信息发送给电子设备。
步骤S403即为若弹窗管理模型的输出结果为指示待处理弹窗信息为用户感兴趣的弹窗信息的信息,将待处理弹窗信息发送给目标电子设备。
目标电子设备通过弹窗功能显示待处理弹窗信息,该待处理弹窗信息为用户感兴趣的弹窗信息,显示该待处理弹窗信息,便于用户查看,提高了用户的体验。
在本申请的一个实施例中,参考图5,图5为本申请实施例提供的信息处理方法的第二种流程示意图,基于图4,该方法还可以包括:
S404:若弹窗管理模型的输出结果为待处理弹窗信息为用户不感兴趣的弹窗信息,拒绝将待处理弹窗信息发送给电子设备。
步骤S404即为若弹窗管理模型的输出结果为指示待处理弹窗信息为用户不感兴趣的弹窗信息的信息,拒绝将待处理弹窗信息发送给目标电子设备。
在本申请的一个实施例中,拒绝将待处理弹窗信息发送给目标电子设备 可以为:丢弃该待处理弹窗信息,以避免占用过多的存储空间。
在本申请的一个实施例中,拒绝将待处理弹窗信息发送给目标电子设备可以为:拦截下待处理弹窗信息,不将该待处理信息发送给目标电子设备,并记录下该待处理弹窗信息。之后,可以周期的向目标电子设备发送提示信息,告知拦截了多少的弹窗信息,以便于用户及时处理记录下的弹窗信息。
在本申请的一个实施例中,记录下待处理弹窗信息时,还可以记录下该待处理弹窗信息的特征信息,如某一号码的来电、针对某一应用程序的弹窗信息、针对天气的短信消息等。这种情况下,可以周期的向电子设备发送提示信息,该提示信息中携带有记录下的待处理弹窗信息的特征信息,基于该特征信息,用户可以及时确定拦截下待处理弹窗信息是否为用户感兴趣的弹窗信息;若是用户感兴趣的弹窗信息,则及时获取到该待处理弹窗信息。
在本申请的一个实施例中,在将待处理弹窗信息输入到弹窗管理模型之后,获得弹窗管理模型的输出结果,此时,可以将该输出结果与待处理弹窗信息的对应关系加入训练集,丰富训练集中包括的弹窗信息,以便再次训练弹窗管理模型。
应用上述实施例,基于深度神经网络构建了弹窗管理模型,该弹窗管理模型用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息;这种情况下,将获取到的待处理弹窗信息输入弹窗管理模型中,若该弹窗管理模型的输出结果显示为:待处理弹窗信息为用户感兴趣的弹窗信息,再将待处理弹窗信息发送给电子设备,电子设备通过弹窗功能显示待处理弹窗信息。这样,有效地减少了电子设备接收到的不感兴趣的弹窗信息的数量,解决了电子设备显示大量用户不感兴趣的弹窗信息的问题,提高了用户体验。
与方法实施例对应,本申请实施例还提供了一种信息处理装置和模型训练装置。
参考图6,图6为本申请实施例提供的模型训练装置的一种结构示意图,该装置包括:
构建单元601,用于基于深度神经网络,构建弹窗管理模型;弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;用户感兴趣的 弹窗信息为关注度大于阈值的信息;
转换单元602,用于获取训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
训练单元603,用于使用特征向量和标签,训练弹窗管理模型。
上述构建单元601即为构建模块,转换单元即为转换模块,训练单元即为训练模块。
可选的,转换单元602,具体可以用于:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,上述模型训练装置还可以包括:确定单元,用于确定训练集;
这种情况下,确定单元可以包括:
发送子单元,用于将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收子单元,用于接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
加入子单元,用于根据接收的对应关系确定训练集。
上述确定单元即为确定模块,发送子单元即为发送子模块,接收子单元即为接收子模块,加入子单元即为加入子模块。
应用上述实施例,获取包括大量弹窗信息的训练集,将训练集中的弹窗 信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签,依据获得的特征向量和标签,训练弹窗管理模型,进而依据训练获得的弹窗管理模型,能够较为准确的识别出弹窗信息是否为用户感兴趣的弹窗信息。
基于相同的发明构思,根据上述模型训练方法实施例,本申请实施例还提供了一种模型训练装置。该装置包括:
第一获取模块,用于获取训练集,训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
转换模块,用于将训练集中的弹窗信息转换为特征向量,并为训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
第二获取模块,用于获取预设的深度神经网络,初始化深度神经网络的参数作为目标参数;
输入模块,用于将训练集包括的每个弹窗信息的特征向量输入深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
计算模块,用于根据每个弹窗信息的输出结果和训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
判断模块,用于根据弹窗信息损失值,判断采用目标参数的深度神经网络是否收敛;
处理模块,用于若判断模块的判断结果为否,则调整深度神经网络的参数,将调整后的参数作为目标参数;若判断模块的判断结果为是,则将采用目标参数的深度神经网络作为弹窗管理模型。
可选的,转换模块,具体可以用于:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,上述模型训练装置还可以包括:确定模块,用于确定训练集;确定模块可包括:
发送子模块,用于将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收子模块,用于接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
加入子模块,用于根据接收的对应关系确定训练集。
应用上述实施例,获取包括大量弹窗信息的训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签,依据获得的特征向量和标签,训练弹窗管理模型,进而依据训练获得的弹窗管理模型,能够较为准确的识别出弹窗信息是否为用户感兴趣的弹窗信息。
基于相同的发明构思,根据上述信息处理方法实施例,本申请实施例还提供了一种信息处理装置。参考图7,图7为本申请实施例提供的信息处理装置的第一种结构示意图,该装置包括:
获取单元701,用于获取待处理弹窗信息;
输入单元702,用于将待处理弹窗信息输入弹窗管理模型;弹窗管理模型为:基于深度神经网络构建的、用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息的模型;用户感兴趣的弹窗信息为关注度大于阈值的信息;
发送单元703,用于若弹窗管理模型的输出结果为指示待处理弹窗信息为用户感兴趣的弹窗信息的信息,将待处理弹窗信息发送给目标电子设备,以使目标电子设备通过弹窗功能显示待处理弹窗信息。
上述获取单元701即为获取模块,输入单元702即为输入模块,发送单元703即为发送模块。
可选的,参考图8所示的信息处理装置的第二种结构示意图,基于图7,该装置还可以包括:
拒绝单元704,用于若弹窗管理模型的输出结果为指示待处理弹窗信息为用户不感兴趣的弹窗信息的信息,拒绝将待处理弹窗信息发送给目标电子设备。
上述拒绝单元704即为拒绝模块。
可选的,上述信息处理装置还可以包括:训练单元,用于训练获得弹窗管理模型;这种情况下,训练单元可以包括:
构建子单元,用于基于深度神经网络,构建弹窗管理模型;弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;
转换子单元,用于获取训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
训练子单元,用于使用特征向量和标签,训练弹窗管理模型。
上述训练单元即为训练模块,构建子单元即为构建子模块,转换子单元即为转换子模块,训练子单元即为训练子模块。
可选的,上述信息处理装置还可以包括:训练模块,用于训练获得弹窗管理模型;这种情况下,训练模块可以包括:
第一获取子模块,用于获取训练集,训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
转换子模块,用于将训练集中的弹窗信息转换为特征向量,并为训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
第二获取子模块,用于获取预设的深度神经网络,初始化深度神经网络 的参数作为目标参数;
输入子模块,用于将训练集包括的每个弹窗信息的特征向量输入深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
计算子模块,用于根据每个弹窗信息的输出结果和训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
判断子模块,用于根据弹窗信息损失值,判断采用目标参数的深度神经网络是否收敛;
处理子模块,用于若判断子模块的判断结果为否,则调整深度神经网络的参数,将调整后的参数作为目标参数;若判断子模块的判断结果为是,则将采用目标参数的深度神经网络作为弹窗管理模型。
可选的,转换子单元,具体可以用于:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,参考图9所示的信息处理装置的第三种结构示意图,基于图7,该装置还可以包括:
加入单元905,用于在将待处理弹窗信息输入弹窗管理模型之后,将弹窗管理模型的输出结果与待处理弹窗信息的对应关系加入训练集。
上述加入单元即为加入模块。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,上述信息处理装置还可以包括:确定单元,用于确定训练集;确定单元可以包括:
发送子单元,用于将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收子单元,用于接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
加入子单元,用于根据接收的对应关系确定训练集。
上述确定单元即为确定模块,发送子单元即为发送子模块,接收子单元即为接收子模块,加入子单元即为加入子模块。
应用上述实施例,基于深度神经网络构建了弹窗管理模型,该弹窗管理模型用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息;这种情况下,将获取到的待处理弹窗信息输入弹窗管理模型中,若该弹窗管理模型的输出结果显示为:待处理弹窗信息为用户感兴趣的弹窗信息,再将待处理弹窗信息发送给电子设备,电子设备通过弹窗功能显示待处理弹窗信息。这样,有效地减少了电子设备接收到的不感兴趣的弹窗信息的数量,解决了电子设备显示大量用户不感兴趣的弹窗信息的问题,提高了用户体验。
与模型训练方法实施例对应,本申请实施例还提供了一种电子设备,如图10所示,包括处理器1001、通信接口1002、存储器1003和通信总线1004,其中,处理器1001、通信接口1002、存储器1003通过通信总线1004完成相互间的通信;
存储器1003,用于存放计算机程序;
处理器1001,用于执行存储器1003上所存放的程序时,实现模型训练方法。其中,模型训练方法包括:
基于深度神经网络,构建弹窗管理模型;弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;用户感兴趣的弹窗信息为关注度大于阈值的信息;
获取训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
使用特征向量和标签,训练弹窗管理模型。
可选的,将训练集中的弹窗信息转换为特征向量的步骤,可以包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,训练集可以通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备,以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
应用上述实施例,获取包括大量弹窗信息的训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签,依据获得的特征向量和标签,训练弹窗管理模型,进而依据训练获得的弹窗管理模型,能够较为准确的识别出弹窗信息是否为用户感兴趣的弹窗信息。
与模型训练方法实施例对应,本申请实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器、通信接口、存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现模型训练方法。其中,模型训练方法包括:
获取训练集,训练集包括多个弹窗信息和多个弹窗信息对应的标签信息, 标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
将训练集中的弹窗信息转换为特征向量,并为训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
获取预设的深度神经网络,初始化深度神经网络的参数作为目标参数;
将训练集包括的每个弹窗信息的特征向量输入深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
根据每个弹窗信息的输出结果和训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
根据弹窗信息损失值,判断采用目标参数的深度神经网络是否收敛;
若不收敛,则调整深度神经网络的参数,将调整后的参数作为目标参数,返回执行将训练集包括的每个弹窗信息输入深度神经网络,得到每个弹窗信息的输出结果的步骤;
若收敛,则将采用目标参数的深度神经网络作为弹窗管理模型。
可选的,将训练集中的弹窗信息转换为特征向量的步骤,可以包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,训练集可以通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备,以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
应用上述实施例,获取包括大量弹窗信息的训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签,依据获得的特征向量和标签,训练弹窗管理模型,进而依据训练获得的弹窗管理模型,能够较为准确的识别出弹窗信息是否为用户感兴趣的弹窗信息。
与信息处理方法实施例对应,本申请实施例还提供了一种电子设备,如图11所示,包括处理器1101、通信接口1102、存储器1103和通信总线1104,其中,处理器1101、通信接口1102、存储器1103通过通信总线1104完成相互间的通信;
存储器1103,用于存放计算机程序;
处理器1101,用于执行存储器1103上所存放的程序时,实现信息处理方法。信息处理方法包括:
获取待处理弹窗信息;
将待处理弹窗信息输入弹窗管理模型;弹窗管理模型为:基于深度神经网络构建的、用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息的模型;用户感兴趣的弹窗信息为关注度大于阈值的信息;
若弹窗管理模型的输出结果为指示待处理弹窗信息为用户感兴趣的弹窗信息的信息,将待处理弹窗信息发送给目标电子设备,以使目标电子设备通过弹窗功能显示待处理弹窗信息。
可选的,信息处理方法还可以包括:
若弹窗管理模型的输出结果为指示待处理弹窗信息为用户不感兴趣的弹窗信息的信息,拒绝将待处理弹窗信息发送给目标电子设备。
可选的,弹窗管理模型可以通过以下方式训练获得:
基于深度神经网络,构建弹窗管理模型;弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;
获取训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
使用特征向量和标签,训练弹窗管理模型。
可选的,弹窗管理模型可以通过以下方式训练获得:
获取训练集,训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
将训练集中的弹窗信息转换为特征向量,并为训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
获取预设的深度神经网络,初始化深度神经网络的参数作为目标参数;
将训练集包括的每个弹窗信息的特征向量输入深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
根据每个弹窗信息的输出结果和训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
根据弹窗信息损失值,判断采用目标参数的深度神经网络是否收敛;
若不收敛,则调整深度神经网络的参数,将调整后的参数作为目标参数,返回执行将训练集包括的每个弹窗信息输入深度神经网络,得到每个弹窗信息的输出结果的步骤;
若收敛,则将采用目标参数的深度神经网络作为弹窗管理模型。
可选的,将训练集中的弹窗信息转换为特征向量的步骤,可以包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,在将待处理弹窗信息输入弹窗管理模型的步骤之后,还可以包括:
将弹窗管理模型的输出结果与待处理弹窗信息的对应关系加入训练集。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,训练集可以通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
应用上述实施例,基于深度神经网络构建了弹窗管理模型,该弹窗管理模型用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息;这种情况下,将获取到的待处理弹窗信息输入弹窗管理模型中,若该弹窗管理模型的输出结果显示为:待处理弹窗信息为用户感兴趣的弹窗信息,在将待处理弹窗信息发送给电子设备,电子设备通过弹窗功能显示待处理弹窗信息。这样,有效地减少了电子设备接收到的不感兴趣的弹窗信息的数量,解决了电子设备显示大量用户不感兴趣的弹窗信息的问题,提高了用户体验。
上述通信总线可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
上述通信接口用于上述电子设备与其他设备之间的通信。
上述存储器可以包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-Volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processing,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
与模型训练方法实施例对应,本申请实施例还提供了一种存储介质,存储介质内存储有计算机程序,计算机程序被处理器执行时,实现模型训练方法。模型训练方法包括:
基于深度神经网络,构建弹窗管理模型;弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;用户感兴趣的弹窗信息为关注度大于阈值的信息;
获取训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
使用特征向量和标签,训练弹窗管理模型。
可选的,将训练集中的弹窗信息转换为特征向量的步骤,可以包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,训练集可以通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备,以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
应用上述实施例,获取包括大量弹窗信息的训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签,依据获得的特征向量和标签,训练弹窗管理模型,进而依据训练获得的弹窗管理模型,能够较为准确的识别出弹窗信息是否为用户感兴趣的弹窗信息。
与模型训练方法实施例对应,本申请实施例还提供了一种存储介质,存储介质内存储有计算机程序,计算机程序被处理器执行时,实现模型训练方法。模型训练方法包括:
获取训练集,训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
将训练集中的弹窗信息转换为特征向量,并为训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
获取预设的深度神经网络,初始化深度神经网络的参数作为目标参数;
将训练集包括的每个弹窗信息的特征向量输入深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
根据每个弹窗信息的输出结果和训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
根据弹窗信息损失值,判断采用目标参数的深度神经网络是否收敛;
若不收敛,则调整深度神经网络的参数,将调整后的参数作为目标参数,返回执行将训练集包括的每个弹窗信息输入深度神经网络,得到每个弹窗信息的输出结果的步骤;
若收敛,则将采用目标参数的深度神经网络作为弹窗管理模型。
可选的,将训练集中的弹窗信息转换为特征向量的步骤,可以包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,训练集可以通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备,以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
应用上述实施例,获取包括大量弹窗信息的训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签,依据获得的特征向量和标签,训练弹窗管理模型,进而依据训练获得的弹窗管理模型,能够较为准确的识别出弹窗信息是否为用户感兴趣的弹窗信息。
与信息处理方法实施例对应,本申请实施例还提供了一种存储介质,存储介质内存储有计算机程序,计算机程序被处理器执行时,实现信息处理方法。信息处理方法包括:
获取待处理弹窗信息;
将待处理弹窗信息输入弹窗管理模型;弹窗管理模型为:基于深度神经网络构建的、用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息的模型;用户感兴趣的弹窗信息为关注度大于阈值的信息;
若弹窗管理模型的输出结果为指示待处理弹窗信息为用户感兴趣的弹窗信息的信息,将待处理弹窗信息发送给目标电子设备,以使目标电子设备通 过弹窗功能显示待处理弹窗信息。
可选的,上述信息处理方法还可以包括:
若弹窗管理模型的输出结果为指示待处理弹窗信息为用户不感兴趣的弹窗信息的信息,拒绝将待处理弹窗信息发送给目标电子设备。
可选的,弹窗管理模型可以通过以下方式训练获得:
基于深度神经网络,构建弹窗管理模型;弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;
获取训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
使用特征向量和标签,训练弹窗管理模型。
可选的,弹窗管理模型可以通过以下方式训练获得:
获取训练集,训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
将训练集中的弹窗信息转换为特征向量,并为训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
获取预设的深度神经网络,初始化深度神经网络的参数作为目标参数;
将训练集包括的每个弹窗信息的特征向量输入深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
根据每个弹窗信息的输出结果和训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
根据弹窗信息损失值,判断采用目标参数的深度神经网络是否收敛;
若不收敛,则调整深度神经网络的参数,将调整后的参数作为目标参数,返回执行将训练集包括的每个弹窗信息输入深度神经网络,得到每个弹窗信息的输出结果的步骤;
若收敛,则将采用目标参数的深度神经网络作为弹窗管理模型。
可选的,将训练集中的弹窗信息转换为特征向量的步骤,可以包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,在将待处理弹窗信息输入弹窗管理模型的步骤之后,还可以包括:
将弹窗管理模型的输出结果与待处理弹窗信息的对应关系加入训练集。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,训练集可以通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
应用上述实施例,基于深度神经网络构建了弹窗管理模型,该弹窗管理模型用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息;这种情况下,将获取到的待处理弹窗信息输入弹窗管理模型中,若该弹窗管理模型的输出结果显示为:待处理弹窗信息为用户感兴趣的弹窗信息,再将待处理弹窗信息发送给电子设备,电子设备通过弹窗功能显示待处理弹窗信息。这样,有效地减少了电子设备接收到的不感兴趣的弹窗信息的数量,解决了电子设备显示大量用户不感兴趣的弹窗信息的问题,提高了用户体验。
与模型训练方法实施例对应,本申请实施例还提供了一种计算机程序,计算机程序被处理器执行时实现模型训练方法。模型训练方法包括:
基于深度神经网络,构建弹窗管理模型;弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;用户感兴趣的弹窗信息为关注度大于阈值的信息;
获取训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
使用特征向量和标签,训练弹窗管理模型。
可选的,将训练集中的弹窗信息转换为特征向量的步骤,可以包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,训练集可以通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备,以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
应用上述实施例,获取包括大量弹窗信息的训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签,依据获得的特征向量和标签,训练弹窗管理模型,进而依据训练获得的弹窗管理模型,能够较为准确的识别出弹窗信息是否为用户感兴趣的弹窗信息。
与模型训练方法实施例对应,本申请实施例还提供了一种计算机程序,计算机程序被处理器执行时实现模型训练方法。模型训练方法包括:
获取训练集,训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
将训练集中的弹窗信息转换为特征向量,并为训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
获取预设的深度神经网络,初始化深度神经网络的参数作为目标参数;
将训练集包括的每个弹窗信息的特征向量输入深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
根据每个弹窗信息的输出结果和训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
根据弹窗信息损失值,判断采用目标参数的深度神经网络是否收敛;
若不收敛,则调整深度神经网络的参数,将调整后的参数作为目标参数,返回执行将训练集包括的每个弹窗信息输入深度神经网络,得到每个弹窗信息的输出结果的步骤;
若收敛,则将采用目标参数的深度神经网络作为弹窗管理模型。
可选的,将训练集中的弹窗信息转换为特征向量的步骤,可以包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,训练集可以通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备,以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
应用上述实施例,获取包括大量弹窗信息的训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签,依据获得的特征向量和标签,训练弹窗管理模型,进而依据训练获得的弹窗管理模型,能够较为准确的识别出弹窗信息是否为用户感兴趣的弹窗信息。
与信息处理方法实施例对应,本申请实施例还提供了一种计算机程序,计算机程序被处理器执行时实现信息处理方法。信息处理方法包括:
获取待处理弹窗信息;
将待处理弹窗信息输入弹窗管理模型;弹窗管理模型为:基于深度神经网络构建的、用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息的模型;用户感兴趣的弹窗信息为关注度大于阈值的信息;
若弹窗管理模型的输出结果为指示待处理弹窗信息为用户感兴趣的弹窗信息的信息,将待处理弹窗信息发送给目标电子设备,以使目标电子设备通过弹窗功能显示待处理弹窗信息。
可选的,上述信息处理方法还可以包括:
若弹窗管理模型的输出结果为指示待处理弹窗信息为用户不感兴趣的弹窗信息的信息,拒绝将待处理弹窗信息发送给目标电子设备。
可选的,弹窗管理模型可以通过以下方式训练获得:
基于深度神经网络,构建弹窗管理模型;弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;
获取训练集,将训练集中的弹窗信息转换为特征向量,为训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
使用特征向量和标签,训练弹窗管理模型。
可选的,弹窗管理模型可以通过以下方式训练获得:
获取训练集,训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
将训练集中的弹窗信息转换为特征向量,并为训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
获取预设的深度神经网络,初始化深度神经网络的参数作为目标参数;
将训练集包括的每个弹窗信息的特征向量输入深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
根据每个弹窗信息的输出结果和训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
根据弹窗信息损失值,判断采用目标参数的深度神经网络是否收敛;
若不收敛,则调整深度神经网络的参数,将调整后的参数作为目标参数,返回执行将训练集包括的每个弹窗信息输入深度神经网络,得到每个弹窗信息的输出结果的步骤;
若收敛,则将采用目标参数的深度神经网络作为弹窗管理模型。
可选的,将训练集中的弹窗信息转换为特征向量的步骤,可以包括:
根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
可选的,深度神经网络包括输入层、抽象层和输出层;
其中,深度神经网络的输入层包括的神经元个数与特征向量的维数相同;抽象层的激活函数为ReLu函数;输出层的激活函数为sigmoid函数。
可选的,在将待处理弹窗信息输入弹窗管理模型的步骤之后,还可以包括:
将弹窗管理模型的输出结果与待处理弹窗信息的对应关系加入训练集。
可选的,用户感兴趣的弹窗信息为用户查看的弹窗信息。
可选的,训练集可以通过以下方式确定:
将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
根据接收的对应关系确定训练集。
应用上述实施例,基于深度神经网络构建了弹窗管理模型,该弹窗管理模型用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息;这种情况下,将获取到的待处理弹窗信息输入弹窗管理模型中,若该弹窗管理模型的输出结果显示为:待处理弹窗信息为用户感兴趣的弹窗信息,再将待处理弹窗信息发送给电子设备,电子设备通过弹窗功能显示待处理弹窗信息。这样,有效地减少了电子设备接收到的不感兴趣的弹窗信息的数量,解决了电子设备显示大量用户不感兴趣的弹窗信息的问题,提高了用户体验。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于模型训练装置、信息处理装置、电子设备、存储介质、计算机程序实施例而言,由于其基本相似于模型训练方法、信息处理方法实施例,所以描述的比较简单,相关之处参见模型训练方法、信息处理方法实施例的部分说明即可。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory;以下简称:ROM)、随机存取存储器(Random Access Memory;以下简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (47)

  1. 一种信息处理方法,其特征在于,所述方法包括:
    获取待处理弹窗信息;
    将所述待处理弹窗信息输入弹窗管理模型;所述弹窗管理模型为:基于深度神经网络构建的、用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息的模型;所述用户感兴趣的弹窗信息为关注度大于阈值的信息;
    若所述弹窗管理模型的输出结果为指示所述待处理弹窗信息为用户感兴趣的弹窗信息的信息,将所述待处理弹窗信息发送给目标电子设备,以使所述目标电子设备通过弹窗功能显示所述待处理弹窗信息。
  2. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    若所述弹窗管理模型的输出结果为指示所述待处理弹窗信息为用户不感兴趣的弹窗信息的信息,拒绝将所述待处理弹窗信息发送给所述目标电子设备。
  3. 根据权利要求1所述的方法,其特征在于,所述弹窗管理模型通过以下方式训练获得:
    基于深度神经网络,构建弹窗管理模型;所述弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;
    获取训练集,将所述训练集中的弹窗信息转换为特征向量,为所述训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
    使用所述特征向量和所述标签,训练所述弹窗管理模型。
  4. 根据权利要求1所述的方法,其特征在于,所述弹窗管理模型通过以下方式训练获得:
    获取训练集,所述训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,所述标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
    将所述训练集中的弹窗信息转换为特征向量,并为所述训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
    获取预设的深度神经网络,初始化所述深度神经网络的参数作为目标参数;
    将所述训练集包括的每个弹窗信息的特征向量输入所述深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
    根据每个弹窗信息的输出结果和所述训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
    根据所述弹窗信息损失值,判断采用所述目标参数的深度神经网络是否收敛;
    若不收敛,则调整所述深度神经网络的参数,将调整后的参数作为目标参数,返回执行所述将所述训练集包括的每个弹窗信息输入所述深度神经网络,得到每个弹窗信息的输出结果的步骤;
    若收敛,则将采用所述目标参数的深度神经网络作为弹窗管理模型。
  5. 根据权利要求3或4所述的方法,其特征在于,所述将所述训练集中的弹窗信息转换为特征向量的步骤,包括:
    根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
  6. 根据权利要求3或4所述的方法,其特征在于,所述深度神经网络包括输入层、抽象层和输出层;
    其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的维数相同;所述抽象层的激活函数为修正线性单元ReLu函数;所述输出层的激活函数为S型sigmoid函数。
  7. 根据权利要求3或4所述的方法,其特征在于,在所述将所述待处理弹窗信息输入弹窗管理模型的步骤之后,所述方法还包括:
    将所述弹窗管理模型的输出结果与所述待处理弹窗信息的对应关系加入所述训练集。
  8. 根据权利要求3或4所述的方法,其特征在于,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
  9. 根据权利要求8所述的方法,其特征在于,所述训练集通过以下方式确定:
    将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
    接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
    根据接收的对应关系确定训练集。
  10. 一种模型训练方法,其特征在于,所述方法包括:
    基于深度神经网络,构建弹窗管理模型;所述弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;所述用户感兴趣的弹窗信息为关注度大于阈值的信息;
    获取训练集,将所述训练集中的弹窗信息转换为特征向量,为所述训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
    使用所述特征向量和所述标签,训练所述弹窗管理模型。
  11. 根据权利要求10所述的方法,其特征在于,所述将所述训练集中的弹窗信息转换为特征向量的步骤,包括:
    根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
  12. 根据权利要求10所述的方法,其特征在于,所述深度神经网络包括输入层、抽象层和输出层;
    其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的 维数相同;所述抽象层的激活函数为修正线性单元ReLu函数;所述输出层的激活函数为S型sigmoid函数。
  13. 根据权利要求10-12任一项所述的方法,其特征在于,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
  14. 根据权利要求13所述的方法,其特征在于,所述训练集通过以下方式确定:
    将获取的多个弹窗信息发送给多个电子设备,以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
    接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
    根据接收的对应关系确定训练集。
  15. 一种模型训练方法,其特征在于,所述方法包括:
    获取训练集,所述训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,所述标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
    将所述训练集中的弹窗信息转换为特征向量,并为所述训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
    获取预设的深度神经网络,初始化所述深度神经网络的参数作为目标参数;
    将所述训练集包括的每个弹窗信息的特征向量输入所述深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
    根据每个弹窗信息的输出结果和所述训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
    根据所述弹窗信息损失值,判断采用所述目标参数的深度神经网络是否 收敛;
    若不收敛,则调整所述深度神经网络的参数,将调整后的参数作为目标参数,返回执行所述将所述训练集包括的每个弹窗信息输入所述深度神经网络,得到每个弹窗信息的输出结果的步骤;
    若收敛,则将采用所述目标参数的深度神经网络作为弹窗管理模型。
  16. 根据权利要求15所述的方法,其特征在于,所述将所述训练集中的弹窗信息转换为特征向量的步骤,包括:
    根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
  17. 根据权利要求15所述的方法,其特征在于,所述深度神经网络包括输入层、抽象层和输出层;
    其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的维数相同;所述抽象层的激活函数为修正线性单元ReLu函数;所述输出层的激活函数为S型sigmoid函数。
  18. 根据权利要求15-17任一项所述的方法,其特征在于,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
  19. 根据权利要求18所述的方法,其特征在于,所述训练集通过以下方式确定:
    将获取的多个弹窗信息发送给多个电子设备,以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
    接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
    根据接收的对应关系确定训练集。
  20. 一种信息处理装置,其特征在于,所述装置包括:
    获取模块,用于获取待处理弹窗信息;
    输入模块,用于将所述待处理弹窗信息输入弹窗管理模型;所述弹窗管 理模型为:基于深度神经网络构建的、用于确定输入的弹窗信息是否为用户感兴趣的弹窗信息的模型;所述用户感兴趣的弹窗信息为关注度大于阈值的信息;
    发送模块,用于若所述弹窗管理模型的输出结果为指示所述待处理弹窗信息为用户感兴趣的弹窗信息的信息,将所述待处理弹窗信息发送给目标电子设备,以使所述目标电子设备通过弹窗功能显示所述待处理弹窗信息。
  21. 根据权利要求20所述的装置,其特征在于,所述装置还包括:
    拒绝模块,用于若所述弹窗管理模型的输出结果为指示所述待处理弹窗信息为用户不感兴趣的弹窗信息的信息,拒绝将所述待处理弹窗信息发送给所述目标电子设备。
  22. 根据权利要求20所述的装置,其特征在于,所述装置还包括:训练模块,用于训练获得所述弹窗管理模型;所述训练模块包括:
    构建子模块,用于基于深度神经网络,构建弹窗管理模型;所述弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;
    转换子模块,用于获取训练集,将所述训练集中的弹窗信息转换为特征向量,为所述训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
    训练子模块,用于使用所述特征向量和所述标签,训练所述弹窗管理模型。
  23. 根据权利要求20所述的装置,其特征在于,所述装置还包括:训练模块,用于训练获得所述弹窗管理模型;所述训练模块包括:
    第一获取子模块,用于获取训练集,所述训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,所述标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
    转换子模块,用于将所述训练集中的弹窗信息转换为特征向量,并为所述训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
    第二获取子模块,用于获取预设的深度神经网络,初始化所述深度神经 网络的参数作为目标参数;
    输入子模块,用于将所述训练集包括的每个弹窗信息的特征向量输入所述深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
    计算子模块,用于根据每个弹窗信息的输出结果和所述训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
    判断子模块,用于根据所述弹窗信息损失值,判断采用所述目标参数的深度神经网络是否收敛;
    处理子模块,用于若所述判断子模块的判断结果为否,则调整所述深度神经网络的参数,将调整后的参数作为目标参数;若所述判断子模块的判断结果为是,则将采用所述目标参数的深度神经网络作为弹窗管理模型。
  24. 根据权利要求22或23所述的装置,其特征在于,所述转换子模块,具体用于:
    根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
  25. 根据权利要求22或23所述的装置,其特征在于,所述深度神经网络包括输入层、抽象层和输出层;
    其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的维数相同;所述抽象层的激活函数为修正线性单元ReLu函数;所述输出层的激活函数为S型sigmoid函数。
  26. 根据权利要求22或23所述的装置,其特征在于,所述装置还包括:
    加入模块,用于在将所述待处理弹窗信息输入弹窗管理模型之后,将所述弹窗管理模型的输出结果与所述待处理弹窗信息的对应关系加入所述训练集。
  27. 根据权利要求22或23所述的装置,其特征在于,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
  28. 根据权利要求22或23所述的装置,其特征在于,所述装置还包括:确定模块,用于确定训练集;所述确定模块包括:
    发送子模块,用于将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备分别通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
    接收子模块,用于接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
    加入子模块,用于根据接收的对应关系确定训练集。
  29. 一种模型训练装置,其特征在于,所述装置包括:
    构建模块,用于基于深度神经网络,构建弹窗管理模型;所述弹窗管理模型的建模单元为:指示是否为用户感兴趣的弹窗信息的信息;所述用户感兴趣的弹窗信息为关注度大于阈值的信息;
    转换模块,用于获取训练集,将所述训练集中的弹窗信息转换为特征向量,为所述训练集中的弹窗信息标记用户感兴趣的弹窗信息或用户不感兴趣的弹窗信息的标签;
    训练模块,用于使用所述特征向量和所述标签,训练所述弹窗管理模型。
  30. 根据权利要求29所述的装置,其特征在于,所述转换模块,具体用于:
    根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
  31. 根据权利要求29所述的装置,其特征在于,所述深度神经网络包括输入层、抽象层和输出层;
    其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的维数相同;所述抽象层的激活函数为修正线性单元ReLu函数;所述输出层的激活函数为S型sigmoid函数。
  32. 根据权利要求29-31任一项所述的装置,其特征在于,所述用户感兴 趣的弹窗信息为用户查看的弹窗信息。
  33. 根据权利要求32所述的装置,其特征在于,所述装置还包括:确定模块,用于确定训练集;所述确定模块包括:
    发送子模块,用于将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
    接收子模块,用于接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
    加入子模块,用于根据接收的对应关系确定训练集。
  34. 一种模型训练装置,其特征在于,所述装置包括:
    第一获取模块,用于获取训练集,所述训练集包括多个弹窗信息和多个弹窗信息对应的标签信息,所述标签信息为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
    转换模块,用于将所述训练集中的弹窗信息转换为特征向量,并为所述训练集中的弹窗信息标记该弹窗信息对应的标签信息的标签;
    第二获取模块,用于获取预设的深度神经网络,初始化所述深度神经网络的参数作为目标参数;
    输入模块,用于将所述训练集包括的每个弹窗信息的特征向量输入所述深度神经网络,得到每个弹窗信息的输出结果;每个弹窗信息的输出结果为指示弹窗信息为用户感兴趣的弹窗信息的信息或指示弹窗信息不是用户感兴趣的弹窗信息的信息;
    计算模块,用于根据每个弹窗信息的输出结果和所述训练集包括的该弹窗信息对应的标签信息,计算弹窗信息损失值;
    判断模块,用于根据所述弹窗信息损失值,判断采用所述目标参数的深度神经网络是否收敛;
    处理模块,用于若所述判断模块的判断结果为否,则调整所述深度神经 网络的参数,将调整后的参数作为目标参数;若所述判断模块的判断结果为是,则将采用所述目标参数的深度神经网络作为弹窗管理模型。
  35. 根据权利要求34所述的装置,其特征在于,所述转换模块,具体用于:
    根据显示时间、显示延迟时长、显示地点、用户所使用的电子设备的规格,将训练集中的弹窗信息转换为特征向量。
  36. 根据权利要求34所述的装置,其特征在于,所述深度神经网络包括输入层、抽象层和输出层;
    其中,所述深度神经网络的输入层包括的神经元个数与所述特征向量的维数相同;所述抽象层的激活函数为修正线性单元ReLu函数;所述输出层的激活函数为S型sigmoid函数。
  37. 根据权利要求34-36任一项所述的装置,其特征在于,所述用户感兴趣的弹窗信息为用户查看的弹窗信息。
  38. 根据权利要求37所述的装置,其特征在于,所述装置还包括:确定模块,用于确定训练集;所述确定模块包括:
    发送子模块,用于将获取的多个弹窗信息发送给多个电子设备;以使多个电子设备通过弹窗功能显示接收的弹窗信息,并记录用户是否查看接收的弹窗信息;
    接收子模块,用于接收多个电子设备返回的弹窗信息与用户是否查看该弹窗信息的对应关系;
    加入子模块,用于根据接收的对应关系确定训练集。
  39. 一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
    所述存储器,用于存放计算机程序;
    所述处理器,用于执行所述存储器上所存放的程序,实现权利要求1-9 任一所述的方法步骤。
  40. 一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
    所述存储器,用于存放计算机程序;
    所述处理器,用于执行所述存储器上所存放的程序,实现权利要求10-14任一所述的方法步骤。
  41. 一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;
    所述存储器,用于存放计算机程序;
    所述处理器,用于执行所述存储器上所存放的程序,实现权利要求15-19任一所述的方法步骤。
  42. 一种存储介质,其特征在于,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-9任一所述的方法步骤。
  43. 一种存储介质,其特征在于,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求10-14任一所述的方法步骤。
  44. 一种存储介质,其特征在于,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求15-19任一所述的方法步骤。
  45. 一种计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-9任一所述的方法步骤。
  46. 一种计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求10-14任一所述的方法步骤。
  47. 一种计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求15-19任一所述的方法步骤。
PCT/CN2018/088249 2017-06-30 2018-05-24 信息处理和模型训练方法、装置、电子设备、存储介质 WO2019001185A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/480,925 US20200167645A1 (en) 2017-06-30 2018-05-24 Information processing and model training methods, apparatuses, electronic devices, and storage mediums

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201710525652.0 2017-06-30
CN201710525652.0A CN107402754A (zh) 2017-06-30 2017-06-30 信息处理和模型训练方法、装置、电子设备、存储介质

Publications (1)

Publication Number Publication Date
WO2019001185A1 true WO2019001185A1 (zh) 2019-01-03

Family

ID=60405158

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/088249 WO2019001185A1 (zh) 2017-06-30 2018-05-24 信息处理和模型训练方法、装置、电子设备、存储介质

Country Status (3)

Country Link
US (1) US20200167645A1 (zh)
CN (1) CN107402754A (zh)
WO (1) WO2019001185A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107402754A (zh) * 2017-06-30 2017-11-28 北京金山安全软件有限公司 信息处理和模型训练方法、装置、电子设备、存储介质
CN108763159A (zh) * 2018-05-22 2018-11-06 中国科学技术大学苏州研究院 一种基于fpga的lstm前向运算加速器
CN108898015B (zh) * 2018-06-26 2021-07-27 暨南大学 基于人工智能的应用层动态入侵检测系统及检测方法
CN109189528B (zh) * 2018-08-14 2021-11-30 上海尚往网络科技有限公司 弹窗展示的控制方法、弹窗展示方法
CN109508218A (zh) * 2018-10-25 2019-03-22 平安科技(深圳)有限公司 App消息推送展示控制方法、装置、设备及存储介质
CN113538225A (zh) * 2020-04-14 2021-10-22 阿里巴巴集团控股有限公司 模型训练方法及图像转换方法、装置、设备和存储介质
CN111700718A (zh) * 2020-07-13 2020-09-25 北京海益同展信息科技有限公司 一种识别握姿的方法、装置、假肢及可读存储介质
CN113687890B (zh) * 2021-07-13 2022-12-06 荣耀终端有限公司 弹窗管理方法、装置及存储介质
CN113868542B (zh) * 2021-11-25 2022-03-11 平安科技(深圳)有限公司 基于注意力模型的推送数据获取方法、装置、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303105A (zh) * 2015-10-20 2016-02-03 珠海市君天电子科技有限公司 窗口消息拦截方法、装置和终端设备
CN106027633A (zh) * 2016-05-16 2016-10-12 百度在线网络技术(北京)有限公司 应用推送方法、应用推送系统及终端设备
CN106126562A (zh) * 2016-06-15 2016-11-16 广东欧珀移动通信有限公司 一种弹窗拦截方法及终端
CN107402754A (zh) * 2017-06-30 2017-11-28 北京金山安全软件有限公司 信息处理和模型训练方法、装置、电子设备、存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102752730B (zh) * 2012-07-19 2014-04-16 腾讯科技(深圳)有限公司 消息处理的方法及装置
CN104484390A (zh) * 2014-12-11 2015-04-01 哈尔滨工程大学 一种面向微博的僵尸粉丝检测方法
CN106020814A (zh) * 2016-05-16 2016-10-12 北京奇虎科技有限公司 通知栏消息的处理方法、装置及移动终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105303105A (zh) * 2015-10-20 2016-02-03 珠海市君天电子科技有限公司 窗口消息拦截方法、装置和终端设备
CN106027633A (zh) * 2016-05-16 2016-10-12 百度在线网络技术(北京)有限公司 应用推送方法、应用推送系统及终端设备
CN106126562A (zh) * 2016-06-15 2016-11-16 广东欧珀移动通信有限公司 一种弹窗拦截方法及终端
CN107402754A (zh) * 2017-06-30 2017-11-28 北京金山安全软件有限公司 信息处理和模型训练方法、装置、电子设备、存储介质

Also Published As

Publication number Publication date
US20200167645A1 (en) 2020-05-28
CN107402754A (zh) 2017-11-28

Similar Documents

Publication Publication Date Title
WO2019001185A1 (zh) 信息处理和模型训练方法、装置、电子设备、存储介质
US10650311B2 (en) Suggesting resources using context hashing
US20190364123A1 (en) Resource push method and apparatus
US10645055B1 (en) Trend detection for content targeting using an information distribution system
US9356901B1 (en) Determining message prominence
US11238310B2 (en) Training data acquisition method and device, server and storage medium
WO2021088510A1 (zh) 视频分类方法、装置、计算机以及可读存储介质
JP5960274B2 (ja) 特徴抽出に基づいた画像の得点付け
CN108139951A (zh) 针对在通知数据之间的亲和度的通知捆集
CN110046299B (zh) 用于自动地执行隐式消息搜索的计算机化系统和方法
US9218568B2 (en) Disambiguating data using contextual and historical information
EP3093780A1 (en) State-dependent query response
CN111492383A (zh) 使用意图分类器的自动化通信
WO2017117509A1 (en) Universal interaction platform for people, services, and devices
US10621641B2 (en) Method and device for pushing information
US9262550B2 (en) Processing semi-structured data
CN110321845B (zh) 一种从视频中提取表情包的方法、装置及电子设备
CN107634897B (zh) 群推荐方法和装置
EP3420473A1 (en) Expert detection in social networks
CN105302877B (zh) 用于短信领域分类的方法、短信领域识别方法及装置
CN104462051A (zh) 分词方法及装置
CN112368693A (zh) 使用同义词谱系生成多样化的智能回复
US20150227208A1 (en) Gesture Based Rating System and Method
CN110321546B (zh) 账号识别、显示方法、装置、服务器、终端及存储介质
CN108965951B (zh) 广告的播放方法及装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18824147

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18824147

Country of ref document: EP

Kind code of ref document: A1