CN110569461B - 网页点击量预测方法、装置、计算机设备及存储介质 - Google Patents

网页点击量预测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110569461B
CN110569461B CN201810479080.1A CN201810479080A CN110569461B CN 110569461 B CN110569461 B CN 110569461B CN 201810479080 A CN201810479080 A CN 201810479080A CN 110569461 B CN110569461 B CN 110569461B
Authority
CN
China
Prior art keywords
click rate
webpage click
time period
webpage
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810479080.1A
Other languages
English (en)
Other versions
CN110569461A (zh
Inventor
范玉顺
林浩哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201810479080.1A priority Critical patent/CN110569461B/zh
Publication of CN110569461A publication Critical patent/CN110569461A/zh
Application granted granted Critical
Publication of CN110569461B publication Critical patent/CN110569461B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种网页点击量预测方法、装置、计算机设备及存储介质。包括:获取上一时间周期网页点击量;将所述上一时间周期网页点击量输入网页点击量预测模型,获得待预测的当前时间周期网页点击量的多维度空间向量;对所述上一时间周期网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;将所述待预测的当前时间周期网页点击量的多维度空间向量输入多个回归器,得到所述当前时间周期网页点击量的多个中间预测值;根据所述当前时间周期网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述当前时间周期网页点击量的最终预测值。上述方法可以实现网页点击量有针对性的精准预测。

Description

网页点击量预测方法、装置、计算机设备及存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及一种网页点击量预测方法、装置、计算机设备及存储介质。
背景技术
随着互联网的快速发展,各种各样的公司、个人开发了成千上万的网页供人们浏览,从而使网页点击量的预测机制变得格外重要。一方面,网页的开发者可以根据预测到的网页点击量进行后端服务器资源的灵活调配,在保证服务质量的同时,降低运营成本;另一方面,政府等相关监管部门也可以有针对性地对重点网页进行内容上的人工监督。
传统的网页点击量预测机制是通过获取网页页面的坐标系,通过监测坐标系中的热点区域分布情况实现对未来点击量的预测。然而,基于网页点击量的非线性、周期性、长期依赖关系等复杂特性,传统的网页点击量预测机制无法实现有针对性的精准预测。
发明内容
基于此,有必要针对上述问题,提供一种网页点击量预测方法、装置、计算机设备及存储介质,从而实现针对不同类型的网页点击量对未来网页点击趋势进行有针对性的精准预测。
一种网页点击量预测方法,其中,所述方法包括:
获取上一时间周期的网页点击量;
将所述上一时间周期的网页点击量输入网页点击量预测模型,获得待预测的当前时间周期的网页点击量的多维度空间向量;
对所述上一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;
将所述待预测的当前时间周期的网页点击量的多维度空间向量输入多个回归器,得到所述当前时间周期的网页点击量的多个中间预测值;
根据所述当前时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述当前时间周期的网页点击量的最终预测值。
在其中一个实施例中,所述网页点击量预测模型通过以下步骤建立:
将第一时间周期的网页点击量映射到多维空间,获得所述第一时间周期的网页点击量的多维度空间向量;
对所述第一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;
将所述第一时间周期的网页点击量的多维度空间向量输入所述多个回归器,得到第二时间周期的网页点击量的多个中间预测值;
根据所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述第二时间周期的网页点击量的最终预测值;
对比所述第二时间周期的网页点击量的最终预测值和第二时间周期的实际网页点击量是否满足预设误差;
若所述第二时间周期的网页点击量的最终预测值和所述第二时间周期的实际网页点击量满足预设误差,得到所述网页点击量预测模型。
在其中一个实施例中,所述将第一时间周期的网页点击量映射到多维空间,获得所述第一时间周期的网页点击量的多维度空间向量,包括:
对所述第一时间周期中不同网页的网页点击量进行整理,得到整理后的不同网页的网页点击量;
将所述整理后的不同网页的网页点击量映射到所述多维空间,得到所述第一时间周期的网页点击量的多维度空间向量。
在其中一个实施例中,所述将第一时间周期的网页点击量映射到多维空间,获得所述第一时间周期的网页点击量的多维度空间向量之后还包括:
将所述第一时间周期中的不同网页的网页点击量打乱顺序,并将每次打乱顺序后的不同网页的网页点击量映射到所述多维空间,得到更新后的多维度空间向量;
对比所述更新后的多维度空间向量以及所述第一时间周期的网页点击量的多维度空间向量,对网页点击量预测模型的模型参数进行校准,得到更新后的网页点击量预测模型。
在其中一个实施例中,所述模型参数包括:所述网页点击量预测模型的参数矩阵和所述网页点击量预测模型的偏移值。
在其中一个实施例中,所述对所述第一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率,包括:
使用自相关函数对所述第一时间周期的网页点击量进行计算,得到自相关系数;
将所述第一时间周期的网页点击量划分为多个类型,并使用分类器对所述自相关系数进行概率计算,得出所述每个类型的网页点击量所对应的类型概率。
在其中一个实施例中,所述分类器包括Softmax函数。
在其中一个实施例中,所述根据所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述第二时间周期的网页点击量的最终预测值,包括:
将所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率进行融合计算,得到所述每个类型的网页点击量所对应的最终预测值;
将所述每个类型的网页点击量所对应的最终预测值求和,得到所述第二时间周期的网页点击量的最终预测值。
在其中一个实施例中,所述将所述第一时间周期的网页点击量的多维度空间向量输入所述多个回归器的步骤包括:
将所述第一时间周期的网页点击量的多维度空间向量并行输入所述多个回归器。
一种网页点击量预测装置,其中,所述装置包括:
网页点击量获取模块:用于获取上一时间周期的网页点击量;
多维度空间向量生成模块,用于将所述上一时间周期的网页点击量输入网页点击量预测模型,获得待预测的当前时间周期的网页点击量的多维度空间向量;
分类模块,用于得到每个类型的网页点击量所对应的类型概率;
中间预测值生成模块,用于将所述待预测的当前时间周期的网页点击量的多维度空间向量输入多个回归器,得到所述当前时间周期的网页点击量的多个中间预测值;
最终预测值生成模块,用于根据所述当前时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述当前时间周期的网页点击量的最终预测值。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其中,所述处理器执行所述计算机程序时实现上述网页点击量预测方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述网页点击量预测方法的步骤。
本发明提供的网页点击量预测方法、装置、计算机设备及存储介质,通过将上一时间周期的网页点击量输入网页点击量预测模型,获得待预测的当前时间周期的网页点击量的多维度空间向量;并对上一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;通过将待预测的当前时间周期的网页点击量的多维度空间向量输入多个回归器,得到当前时间周期的网页点击量的多个中间预测值;最后根据当前时间周期的网页点击量的多个中间预测值和每个类型的网页点击量所对应的类型概率,通过融合计算得到当前时间周期的网页点击量的最终预测值。进一步将预测模型输出的最终预测值和所述多维度空间向量作为下一个时间周期内所述预测模型的输入值,可以得到多个时间周期的网页点击量的预测值。通过上述方法,可以实现网页点击量有针对性的精准预测。
附图说明
图1为本发明网页点击量预测方法的整体框架图;
图2为本发明一个实施例中网页点击量预测方法的流程示意图;
图3为本发明一个实施例中获取网页点击量预测模型的流程示意图;
图4为本发明一个实施例中获取多维度空间向量的流程示意图;
图5为本发明长短期记忆单元的结构示意图;
图6为本发明一个实施例中校准模型参数的流程示意图;
图7为本发明一个实施例中对网页点击量进行分类的流程示意图;
图8为本发明一个实施例中得到最终预测值的流程示意图;
图9为本发明一个实施例中得到最终预测值的示意图;
图10为本发明一个实施例中网页点击量预测装置的结构框架图;
图11为本发明一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本发明将循环神经网络(Recurrent Neural Network,RNN)应用于网页点击量的预测。在本发明中,如图1所示,使用训练好的网页点击量预测模型进行网页点击量预测时,可以将上一时间周期的网页点击量作为网页点击量预测模型的输入,其中,S0-St表示某一网页第0天到第t天的网页点击量,通过预测模型中的长短期记忆单元(Long Short-TermMemory,LSTM)将所述上一时间周期的网页点击量映射到多维空间,得到待预测的当前时间周期的网页点击量的多维度空间向量H;同时将所述上一时间周期的网页点击量划分为多个类型,并将所述上一时间周期的网页点击量的自相关系数通过Softmax函数进行概率计算,得出每个类型的网页点击量所对应的类型概率;其中,W1-Wn表示第1个回归器至第n个回归器的参数矩阵,通过所述多维度空间向量H与所述回归器的参数矩阵进行乘法计算,即W*H,从而得到所述当前时间周期的网页点击量的多个中间预测值;进一步,根据所述当前时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述当前时间周期的网页点击量的最终预测值,即O0-Ot
在一个实施例中,如图2所示,提供了一种网页点击量预测方法,以该方法为例进行说明,包括以下步骤:
步骤S201,获取上一时间周期的网页点击量。
其中,一个时间周期可以为一年、一月、一周、一天、一小时、一分钟等不同的时间段,可以根据预测的实际需要进行选择。
进一步,获取上一时间周期的网页点击量,包括获取上一时间周期的多个不同网页的网页点击量数据,所述数据用于预测当前时间周期的多个不同网页的网页点击量。
步骤S202,将所述上一时间周期的网页点击量输入网页点击量预测模型,获得待预测的当前时间周期的网页点击量的多维度空间向量。
其中,将上一时间周期的网页点击量输入网页点击量预测模型后,网页点击量预测模型可以对每一网页多次点击之间的关系进行分析,得到多个向量。每一个向量用于标识网页点击动作之间的关联关系,从而形成多维度空间向量。作为一个具体的实施例,网页点击量预测模型可以使用LSTM将上一时间周期的网页点击量映射到多维空间,得到待预测的当前时间周期的网页点击量的多维度空间向量。LSTM是RNN的一种,根据时间量或字符量自我调用的特殊神经网络,LSTM能够持续保留信息,根据之前网页点击量的状态推出未来网页点击量的状态,一个RNN中包括多个LSTM,LSTM在RNN的一层中随时间迭代。
进一步,多维度空间向量包括多个维度的向量,每一个向量用于表示同一网页进行多次点击之间存在的周期性或非线性依赖关系。例如:同一网页两次点击之间的依赖关系、多次点击之间的依赖关系、点击频率之间的依赖关系等等。
步骤S203,对所述上一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率。
其中,网页点击量预测模型对上一时间周期的网页点击量进行分类,是以时间为单位进行类型划分。例如,所述上一时间周期的网页点击量30天内自相关程度高的为第一类,所述上一时间周期的网页点击量60天内自相关程度高的为第二类等。但是,所划分的每个类型的时间单位并没有规律性,是网页点击量预测模型根据每次输入的网页点击量的特点自动选取时间单位进行分类。其中,自相关程度用于表示同一网页当前时间周期的网页点击量与其多个时间周期的网页点击量之间的关系。
其中,每个类型的网页点击量所对应的类型概率,指的是同一网页的网页点击量分别属于不同类型的概率。
进一步,可对上一时间周期的网页点击量划分为1-20个类型,可以划分为14个类型,当划分的类型较少时,对于网页点击量类型的覆盖不够全面,从而影响预测的精准性;当划分的类型较多时,会影响RNN进行数据处理的效率,因此,将所述上一时间周期的网页点击量划分为14类时,可以在不影响RNN进行数据处理效率的前提下,实现网页点击量的精准预测。
步骤S204,将所述待预测的当前时间周期的网页点击量的多维度空间向量输入多个回归器,得到所述当前时间周期的网页点击量的多个中间预测值。
其中,回归器指的是对统计关系进行定量描述的一种数学模型。本实施例中,可采用14个回归器对网页点击量进行概率计算,且所述待预测的当前时间周期的网页点击量的多维度空间向量并行输入多个回归器,每一个回归器用于回归一种类型的网页点击量,并对这一类型的网页点击量进行预测。例如,一号回归器用于回归四年一次的周期数据,二号回归器用于预测噪声分贝等。
进一步,将所述待预测的当前时间周期的网页点击量的多维度空间向量分别输入14个回归器,通过计算得到14个中间预测值。计算公式如下:
zk=wk Th
其中,zk表示第k个回归器输出的中间预测值;wk表示第k个回归器的参数向量;h表示步骤S202中得到的多维度空间向量。
步骤S205,根据所述当前时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述当前时间周期的网页点击量的最终预测值。
其中,融合计算指的是,先将所述当前时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率进行一一对应的乘法计算,得到所述每个类型的网页点击量所对应的最终预测值;再将所述每个类型的网页点击量所对应的最终预测值求和,得到所述当前时间周期的网页点击量的最终预测值。
上述网页点击量预测方法中,通过将上一时间周期的网页点击量输入网页点击量预测模型,获得待预测的当前时间周期的网页点击量的多维度空间向量;并对上一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;通过将待预测的当前时间周期的网页点击量的多维度空间向量输入多个回归器,得到当前时间周期的网页点击量的多个中间预测值;最后根据当前时间周期的网页点击量的多个中间预测值和每个类型的网页点击量所对应的类型概率,通过融合计算得到当前时间周期的网页点击量的最终预测值。进一步将预测模型输出的最终预测值和所述多维度空间向量作为下一个时间周期内所述预测模型的输入值,可以得到多个时间周期的网页点击量的预测值。通过上述方法,可以实现网页点击量有针对性的精准预测。
在一个实施例中,如图3所示,所述网页点击量预测模型通过以下步骤建立:
步骤S301,将第一时间周期的网页点击量映射到多维空间,获得所述第一时间周期的网页点击量的多维度空间向量。
其中,网页点击预测模型建立的过程中,可以将网页历史点击量中的第一时间周期中的网页点击量,映射到多维空间,以得到多维度空间向量。类似的,网页点击量预测模型可以使用LSTM将上一时间周期的网页点击量映射到多维空间,得到待预测的当前时间周期的网页点击量的多维度空间向量。
步骤S302,对所述第一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率。
其中,可对上一时间周期的网页点击量划分为1-20个类型,可以划分为14个类型,当划分的类型较少时,对于网页点击量类型的覆盖不够全面,从而影响预测的精准性;当划分的类型较多时,会影响RNN进行数据处理的效率,因此,将所述上一时间周期的网页点击量划分为14类时,可以在不影响RNN进行数据处理效率的前提下,实现网页点击量的精准预测。
步骤S303,将所述第一时间周期的网页点击量的多维度空间向量输入所述多个回归器,得到第二时间周期的网页点击量的多个中间预测值。
本实施例中,14个类型的网页点击量对应14个回归器,且所述第一时间周期的网页点击量的多维度空间向量并行输入多个回归器,每一个回归器用于回归一种类型的网页点击量,并对这一类型的网页点击量进行预测。
进一步,将所述第一时间周期的网页点击量的多维度空间向量分别输入14个回归器,通过计算得到14个中间预测值。计算公式如下:
zk=wk Th
其中,zk表示第k个回归器输出的中间预测值;wk表示第k个回归器的参数向量;h表示步骤S301中得到的多维度空间向量。
步骤S304,根据所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述第二时间周期的网页点击量的最终预测值。
其中,融合计算指的是,先将所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率进行一一对应的乘法计算,得到所述每个类型的网页点击量所对应的最终预测值;再将所述每个类型的网页点击量所对应的最终预测值求和,得到所述第二时间周期的网页点击量的最终预测值。
步骤S305,对比所述第二时间周期的网页点击量的最终预测值和第二时间周期的实际网页点击量是否满足预设误差。
其中,将通过所述网页点击量预测模型进行预测得到的所述第二时间周期的网页点击量的最终预测值和第二时间周期的实际网页点击量进行对比,当二者的误差在可以接受的误差范围内时,称之为二者满足预设误差。
步骤S306,若所述第二时间周期的网页点击量的最终预测值和所述第二时间周期的实际网页点击量满足预设误差,得到所述网页点击量预测模型。
其中,所述模型参数包括:所述网页点击量预测模型的参数矩阵和所述网页点击量预测模型的偏移值。
进一步,若所述第二时间周期的网页点击量的最终预测值和所述第二时间周期的实际网页点击量满足预设误差,此时的网页点击量预测模型称之为训练好的网页点击量预测模型。
下面对各个步骤进行详细说明。
其中一个实施例中,可以通过对不同顺序的网页点击量进行排序后映射到多维空间,如图4所示,对步骤S301进行详细说明。步骤S301可包括:
步骤S3012,对所述第一时间周期中不同网页的网页点击量进行整理,得到整理后的不同网页的网页点击量。
其中,将所述第一时间周期中不同网页的网页点击量按时间进行整理,即同一时间周期的多个网页点击量排列在一起。
进一步,在预测模型训练过程中,为了避免数量级差异给模型训练带来的困难,需要对网页点击量中的数据进行预处理。考虑到网页点击量可能为0,故采用公式:
xi←log(xi+1),
其中xi表示第i个网页的点击量。
步骤S3014,将所述整理后的不同网页的网页点击量映射到所述多维空间,得到所述第一时间周期的网页点击量的多维度空间向量。
其中,使用LSTM读取所述整理后的不同网页的网页点击量,并对所述整理后的不同网页的网页点击量映射到多维空间,得到多维度的空间向量。同样也是基于网络吞吐量的考虑,多维度空间向量的维度可以为100~300。将所述整理后的不同网页的网页点击量映射到256维的空间时,既可以保证网络资源不被浪费,又不会影响网页点击量预测模型进行数据处理的效率。
下面详细说明LSTM进行数据处理的过程。如图5所示:
其中,正向传递的上一步为遗忘门限层,从t-1状态到t状态代表单元状态,遗忘层门限是进行筛选的过程,决定输入的网页点击量中哪些信息从单元状态中抛弃,如公式:
ft=σ(Wf[ht-1,xt]+bf
其中,ft表示第t个时刻的遗忘门输出,即单元状态中经过筛选后的信息;Wf表示LSTM中遗忘门的参数矩阵;ht-1表示第t-1个时刻LSTM的状态输出;xt表示第t个时刻输入层的输出;bf表示遗忘门的偏移值。
其中,正向传递的当前步为输入门限层,决定单元状态中保存网页点击量的哪些新信息,输入门限层包括两个步骤:生成临时新状态和更新旧状态,如公式:
it=σ(Wi[ht-1,xt]+bi)
其中,it表示第t个时刻的输入门输出,用于决定哪些值需要更新;Wi表示LSTM中输入门的参数矩阵;ht-1表示第t-1个时刻LSTM的状态输出;xt表示第t个时刻输入层的输出;bi表示输入门的偏移值。
Figure BDA0001665282790000111
其中,
Figure BDA0001665282790000112
表示临时状态,包含新的候选值;Wc表示LSTM中记忆细胞的参数矩阵;ht-1表示第t-1个时刻LSTM的状态输出;xt表示第t个时刻输入层的输出;bc表示输入门的偏移值。
Figure BDA0001665282790000113
其中,ct表示第t个时刻记忆细胞的输出;ct-1表示第t-1个时刻记忆细胞的输出;ft表示第t个时刻的遗忘门输出,即单元状态中经过筛选后的信息;it表示第t个时刻的输入门输出,用于决定哪些值需要更新;
Figure BDA0001665282790000114
表示临时状态,包含新的候选值。旧状态ct-1乘以ft,用于表示单元状态中经过筛选后的信息,再加上新的候选值it乘以
Figure BDA0001665282790000115
用于表示得到的新状态。
进一步,正向传递的第三步为输出门限层,决定LSTM中单元状态的输出值,如公式:
ot=σ(Wo[ht-1,xt]+bo
其中,ot表示第t个时刻的输出门输出;Wo表示LSTM中输出门的参数矩阵;ht-1表示第t-1个时刻LSTM的状态输出;xt表示第t个时刻输入层的输出;bo表示输出门的偏移值。通过sigmoid函数决定哪些状态需要输出。
ht=ot⊙tanh(ct)
其中,ht表示第t个时刻单元状态的输出值;ot表示第t个时刻的输出门输出;ct表示第t个时刻记忆细胞的输出。将单元状态输入到tanh函数(将值转化为-1到1之间),再乘以sigmoid门限值,得到LSTM中单元状态的输出值,即所述多维度空间向量。
其中一个实施例中,如图6所示,将第一时间周期的网页点击量映射到多维空间,获得所述第一时间周期的网页点击量的多维度空间向量之后还包括如下步骤:
步骤S301a,将所述第一时间周期中的不同网页的网页点击量打乱顺序,并将每次打乱顺序后的不同网页的网页点击量映射到所述多维空间,得到更新后的多维度空间向量。
其中,将所述排序后的不同网页的网页点击量打乱顺序,并将每次打乱顺序后的不同网页的网页点击量映射到多维空间,得到所述更新后的多维度空间向量。同样也是基于网络吞吐量的考虑,所述更新后的多维度空间向量的维度可以为100~300。当所述更新后的的多维度空间向量为256维时,既可以保证网络资源不被浪费,又不会影响网页点击量预测模型进行数据处理的效率。
步骤S301b,对比所述更新后的多维度空间向量以及所述第一时间周期的网页点击量的多维度空间向量,对网页点击量预测模型的模型参数进行校准,得到更新后的网页点击量预测模型。
其中,对比所述更新后的多维度空间向量以及所述第一时间周期的网页点击量的多维度空间向量,可以采用梯度下降法对网页点击量预测模型的模型参数进行校准,其中,所述模型参数包括步骤S3014中的参数矩阵Wf、Wi和Wc以及偏移值bf、bi和bc
进一步,反复执行步骤S301a和步骤S301b,即反复校准网页点击量预测模型的模型参数,多次校准后得到的模型参数可以用于训练好的网页点击量预测模型进行预测。
其中一个实施例中,可以对所述第一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率,如图7所示,对步骤S302进行详细说明。步骤S302可包括:
步骤S3022,使用自相关函数对所述第一时间周期的网页点击量进行计算,得到自相关系数。
其中,计算第一时间周期的网页点击量的自相关系数通常以年为单位,可以为一年,即365天,如果选取的时间太短,不具备一定的参考性,如果选取的时间太长,本发明用于实验的数据量不够。当网页的点击量增加时,改变选取的时间参数可以进一步提高网页点击量预测的精准性。
进一步,网页点击量的自相关系数用于表示某个网页在不同时间周期中的点击量的相关程度,例如某个网页的当天点击量与其多天前的网页点击量的相关程度。本实施例中的自相关系数,指的是上一时间周期的网页点击量365个时间单位的自相关系数,是一个365维的向量。计算公式如下:
Figure BDA0001665282790000131
其中,ρ(τ)表示所述网页点击量τ个时间单位的自相关系数;xt表示所述网页第t个时刻的网页点击量;xt+τ表示所述网页第t+τ个时刻的网页点击量;μ表示所述网页已知网页点击量的平均值;σ表示所述网页已知网页点击量的标准差。
步骤S3024,将所述第一时间周期的网页点击量划分为多个类型,并使用分类器对所述自相关系数进行概率计算,得出所述每个类型的网页点击量所对应的类型概率。
其中,所述分类器为Softmax函数,第一时间周期的网页点击量的自相关系数经过Softmax函数计算,得到所述第一时间周期的网页点击量对应的14个类型概率,即所述第一时间周期的网页点击量分别属于14个不同类型的概率。计算公式如下:
Figure BDA0001665282790000132
其中,αk表示所述第一时间周期的网页点击量属于第k类的概率;ρ表示所述第一时间周期的网页点击量的自相关系数;ωi表示Softmax函数的参数向量。有效的ωi可以用于将所述第一时间周期的网页点击量划分为14个类型。
其中一个实施例中,可以通过融合计算得到所述第二时间周期的网页点击量的最终预测值,如图8所示,对步骤S304进行详细说明。步骤S304可包括:
步骤S3042,将所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率进行融合计算,得到所述每个类型的网页点击量所对应的最终预测值。
其中,将所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率进行一一对应的乘法计算,计算公式如下:
Figure BDA0001665282790000141
其中,
Figure BDA0001665282790000142
表示所述每个类型的网页点击量所对应的最终预测值;αk表示所述第一时间周期的网页点击量属于第k个类型的概率;zk表示第k个回归器输出的中间预测值。
步骤S3044,将所述每个类型的网页点击量所对应的最终预测值求和,得到所述当前时间周期的网页点击量的最终预测值。
其中,如图9所示,计算公式如下:
Figure BDA0001665282790000143
其中,
Figure BDA0001665282790000144
表示所述第二时间周期的网页点击量的最终预测值;αk表示所述第一时间周期的网页点击量属于第k个类型的概率;zk表示第k个回归器输出的中间预测值。
应该理解的是,虽然图2-4、6-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4、6-8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图10所示,提供了一种网页点击量预测装置,包括:网页点击量获取模块401、多维度空间向量生成模块402、分类模块403、中间预测值生成模块404、最终预测值生成模块405,其中:
网页点击量获取模块401,用于获取上一时间周期的网页点击量。
多维度空间向量生成模块402,用于将所述上一时间周期的网页点击量输入网页点击量预测模型,获得待预测的当前时间周期的网页点击量的多维度空间向量。
分类模块403,用于得到每个类型的网页点击量所对应的类型概率。
中间预测值生成模块404,用于将所述待预测的当前时间周期的网页点击量的多维度空间向量输入多个回归器,得到所述当前时间周期的网页点击量的多个中间预测值。
最终预测值生成模块405,用于根据所述当前时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述当前时间周期的网页点击量的最终预测值。
其中一个实施例中,多维度空间向量生成模块402具体用于对所述第一时间周期中不同网页的网页点击量进行排序,得到排序后的不同网页的网页点击量;将所述排序后的不同网页的网页点击量映射到所述多维空间,得到所述第一时间周期的网页点击量的多维度空间向量。
其中一个实施例中,分类模块403具体用于使用自相关函数对所述第一时间周期的网页点击量进行计算,得到自相关系数;将所述第一时间周期的网页点击量划分为多个类型,并使用分类器对所述自相关系数进行概率计算,得出所述每个类型的网页点击量所对应的类型概率。
其中一个实施例中,最终预测值生成模块405具体用于将所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率进行融合计算,得到所述每个类型的网页点击量所对应的最终预测值;将所述每个类型的网页点击量所对应的最终预测值求和,得到所述第二时间周期的网页点击量的最终预测值。
其中一个实施例中,还包括模型参数校准模块,用于将所述第一时间周期中的不同网页的网页点击量打乱顺序,并将每次打乱顺序后的不同网页的网页点击量映射到所述多维空间,得到更新后的多维度空间向量;对比所述更新后的多维度空间向量以及所述第一时间周期的网页点击量的多维度空间向量,对网页点击量预测模型的模型参数进行校准,得到更新后的网页点击量预测模型。
关于网页点击量预测装置的具体限定可以参见上文中对于网页点击量预测方法的限定,在此不再赘述。上述网页点击量预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储针对图像定位的计算机程序执行过程中所需的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种网页点击量预测方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取上一时间周期的网页点击量;
将所述上一时间周期的网页点击量输入网页点击量预测模型,获得待预测的当前时间周期的网页点击量的多维度空间向量;
对所述上一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;
将所述待预测的当前时间周期的网页点击量的多维度空间向量输入多个回归器,得到所述当前时间周期的网页点击量的多个中间预测值;
根据所述当前时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述当前时间周期的网页点击量的最终预测值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:所述网页点击量预测模型通过以下步骤建立:将第一时间周期的网页点击量映射到多维空间,获得所述第一时间周期的网页点击量的多维度空间向量;对所述第一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;将所述第一时间周期的网页点击量的多维度空间向量输入所述多个回归器,得到第二时间周期的网页点击量的多个中间预测值;根据所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述第二时间周期的网页点击量的最终预测值;对比所述第二时间周期的网页点击量的最终预测值和第二时间周期的实际网页点击量是否满足预设误差;若所述第二时间周期的网页点击量的最终预测值和所述第二时间周期的实际网页点击量满足预设误差,得到所述网页点击量预测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对所述第一时间周期中不同网页的网页点击量进行整理,得到整理后的不同网页的网页点击量;将所述整理后的不同网页的网页点击量映射到所述多维空间,得到所述第一时间周期的网页点击量的多维度空间向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将所述第一时间周期中的不同网页的网页点击量打乱顺序,并将每次打乱顺序后的不同网页的网页点击量映射到所述多维空间,得到更新后的多维度空间向量;对比所述更新后的多维度空间向量以及所述第一时间周期的网页点击量的多维度空间向量,对网页点击量预测模型的模型参数进行校准,得到更新后的网页点击量预测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:使用自相关函数对所述第一时间周期的网页点击量进行计算,得到自相关系数;将所述第一时间周期的网页点击量划分为多个类型,并使用分类器对所述自相关系数进行概率计算,得出所述每个类型的网页点击量所对应的类型概率。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率进行融合计算,得到所述每个类型的网页点击量所对应的最终预测值;将所述每个类型的网页点击量所对应的最终预测值求和,得到所述第二时间周期的网页点击量的最终预测值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将所述第一时间周期的网页点击量的多维度空间向量并行输入所述多个回归器。
在建立所述网页点击量预测模型的过程中,需要考虑所述网页点击量预测模型的训练速度,特别是在反复迭代地训练过程中所产生的大量的模型参数,以及模型参数进行矩阵运算的过程会消耗很多的时间,因此,可以利用GPU处理矩阵运算高效性的特点来加速所述网页点击量预测模型的训练过程。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取上一时间周期的网页点击量;
将所述上一时间周期的网页点击量输入网页点击量预测模型,获得待预测的当前时间周期的网页点击量的多维度空间向量;
对所述上一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;
将所述待预测的当前时间周期的网页点击量的多维度空间向量输入多个回归器,得到所述当前时间周期的网页点击量的多个中间预测值;
根据所述当前时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述当前时间周期的网页点击量的最终预测值。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:所述网页点击量预测模型通过以下步骤建立:将第一时间周期的网页点击量映射到多维空间,获得所述第一时间周期的网页点击量的多维度空间向量;对所述第一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;将所述第一时间周期的网页点击量的多维度空间向量输入所述多个回归器,得到第二时间周期的网页点击量的多个中间预测值;根据所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述第二时间周期的网页点击量的最终预测值;对比所述第二时间周期的网页点击量的最终预测值和第二时间周期的实际网页点击量是否满足预设误差;若所述第二时间周期的网页点击量的最终预测值和所述第二时间周期的实际网页点击量满足预设误差,得到所述网页点击量预测模型。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:对所述第一时间周期中不同网页的网页点击量进行整理,得到整理后的不同网页的网页点击量;将所述整理后的不同网页的网页点击量映射到所述多维空间,得到所述第一时间周期的网页点击量的多维度空间向量。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:将所述第一时间周期中的不同网页的网页点击量打乱顺序,并将每次打乱顺序后的不同网页的网页点击量映射到所述多维空间,得到更新后的多维度空间向量;对比所述更新后的多维度空间向量以及所述第一时间周期的网页点击量的多维度空间向量,对网页点击量预测模型的模型参数进行校准,得到更新后的网页点击量预测模型。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:使用自相关函数对所述第一时间周期的网页点击量进行计算,得到自相关系数;将所述第一时间周期的网页点击量划分为多个类型,并使用分类器对所述自相关系数进行概率计算,得出所述每个类型的网页点击量所对应的类型概率。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:将所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率进行融合计算,得到所述每个类型的网页点击量所对应的最终预测值;将所述每个类型的网页点击量所对应的最终预测值求和,得到所述第二时间周期的网页点击量的最终预测值。
在一个实施例中,计算机程序被处理器执行时实现以下步骤:将所述第一时间周期的网页点击量的多维度空间向量并行输入所述多个回归器。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种网页点击量预测方法,其特征在于,所述方法包括:
获取上一时间周期的网页点击量;
将所述上一时间周期的网页点击量输入网页点击量预测模型,获得待预测的当前时间周期的网页点击量的多维度空间向量;所述网页点击量预测模型包括循环神经网络RNN;
对所述上一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;
将所述待预测的当前时间周期的网页点击量的多维度空间向量输入多个回归器,得到所述当前时间周期的网页点击量的多个中间预测值;
根据所述当前时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述当前时间周期的网页点击量的最终预测值。
2.根据权利要求1所述的方法,其特征在于,所述网页点击量预测模型通过以下步骤建立:
将第一时间周期的网页点击量映射到多维空间,获得所述第一时间周期的网页点击量的多维度空间向量;
对所述第一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率;
将所述第一时间周期的网页点击量的多维度空间向量输入所述多个回归器,得到第二时间周期的网页点击量的多个中间预测值;
根据所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述第二时间周期的网页点击量的最终预测值;
对比所述第二时间周期的网页点击量的最终预测值和第二时间周期的实际网页点击量是否满足预设误差;
若所述第二时间周期的网页点击量的最终预测值和所述第二时间周期的实际网页点击量满足预设误差,得到所述网页点击量预测模型。
3.根据权利要求2所述的方法,其特征在于,所述将第一时间周期的网页点击量映射到多维空间,获得所述第一时间周期的网页点击量的多维度空间向量,包括:
对所述第一时间周期中不同网页的网页点击量进行整理,得到整理后的不同网页的网页点击量;
将所述整理后的不同网页的网页点击量映射到所述多维空间,得到所述第一时间周期的网页点击量的多维度空间向量。
4.根据权利要求2所述的方法,其特征在于,所述将第一时间周期的网页点击量映射到多维空间,获得所述第一时间周期的网页点击量的多维度空间向量之后还包括:
将所述第一时间周期中的不同网页的网页点击量打乱顺序,并将每次打乱顺序后的不同网页的网页点击量映射到所述多维空间,得到更新后的多维度空间向量;
对比所述更新后的多维度空间向量以及所述第一时间周期的网页点击量的多维度空间向量,对网页点击量预测模型的模型参数进行校准,得到更新后的网页点击量预测模型。
5.根据权利要求4所述的方法,其特征在于,所述模型参数包括:所述网页点击量预测模型的参数矩阵和所述网页点击量预测模型的偏移值。
6.根据权利要求2所述的方法,其特征在于,所述对所述第一时间周期的网页点击量进行分类,得到每个类型的网页点击量所对应的类型概率,包括:
使用自相关函数对所述第一时间周期的网页点击量进行计算,得到自相关系数;
将所述第一时间周期的网页点击量划分为多个类型,并使用分类器对所述自相关系数进行概率计算,得出所述每个类型的网页点击量所对应的类型概率。
7.根据权利要求6所述的方法,其特征在于,所述分类器包括Softmax函数。
8.根据权利要求2所述的方法,其特征在于,所述根据所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述第二时间周期的网页点击量的最终预测值,包括:
将所述第二时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率进行融合计算,得到所述每个类型的网页点击量所对应的最终预测值;
将所述每个类型的网页点击量所对应的最终预测值求和,得到所述第二时间周期的网页点击量的最终预测值。
9.根据权利要求2所述的方法,其特征在于,所述将所述第一时间周期的网页点击量的多维度空间向量输入所述多个回归器的步骤包括:
将所述第一时间周期的网页点击量的多维度空间向量并行输入所述多个回归器。
10.一种网页点击量预测装置,其特征在于,所述装置包括:
网页点击量获取模块:用于获取上一时间周期的网页点击量;
多维度空间向量生成模块,用于将所述上一时间周期的网页点击量输入网页点击量预测模型,获得待预测的当前时间周期的网页点击量的多维度空间向量;所述网页点击量预测模型包括循环神经网络RNN;
分类模块,用于得到每个类型的网页点击量所对应的类型概率;
中间预测值生成模块,用于将所述待预测的当前时间周期的网页点击量的多维度空间向量输入多个回归器,得到所述当前时间周期的网页点击量的多个中间预测值;
最终预测值生成模块,用于根据所述当前时间周期的网页点击量的多个中间预测值和所述每个类型的网页点击量所对应的类型概率,通过融合计算得到所述当前时间周期的网页点击量的最终预测值。
11.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~9中任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~9中任一项所述的方法的步骤。
CN201810479080.1A 2018-05-18 2018-05-18 网页点击量预测方法、装置、计算机设备及存储介质 Active CN110569461B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810479080.1A CN110569461B (zh) 2018-05-18 2018-05-18 网页点击量预测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810479080.1A CN110569461B (zh) 2018-05-18 2018-05-18 网页点击量预测方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110569461A CN110569461A (zh) 2019-12-13
CN110569461B true CN110569461B (zh) 2022-05-06

Family

ID=68772583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810479080.1A Active CN110569461B (zh) 2018-05-18 2018-05-18 网页点击量预测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110569461B (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559278A (zh) * 2013-11-06 2014-02-05 北京国双科技有限公司 用于网页页面点击量统计的数据处理方法和装置
CN105654200A (zh) * 2015-12-30 2016-06-08 上海珍岛信息技术有限公司 一种基于深度学习的广告点击率预测方法及装置
US20180012251A1 (en) * 2016-07-11 2018-01-11 Baidu Usa Llc Systems and methods for an attention-based framework for click through rate (ctr) estimation between query and bidwords

Also Published As

Publication number Publication date
CN110569461A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
TWI788529B (zh) 基於lstm模型的信用風險預測方法及裝置
CN110598845B (zh) 数据处理方法、装置、计算机设备和存储介质
Agosto et al. Modeling corporate defaults: Poisson autoregressions with exogenous covariates (PARX)
CN108536800B (zh) 文本分类方法、系统、计算机设备和存储介质
CN111130839A (zh) 一种流量需求矩阵预测方法及其系统
CN108520041B (zh) 文本的行业分类方法、系统、计算机设备和存储介质
US10565525B2 (en) Collaborative filtering method, apparatus, server and storage medium in combination with time factor
CN108182633B (zh) 贷款数据处理方法、装置、计算机设备和存储介质
WO2021035412A1 (zh) 一种自动机器学习AutoML系统、方法及设备
CN109272142A (zh) 基于事件的数据预测方法、装置、计算机设备和存储介质
CN109242539A (zh) 基于流失用户的潜在用户预测方法、装置和计算机设备
US20200265303A1 (en) Behavior prediction with dynamic adaptation to environmental conditions
CN111160600A (zh) 行为预测方法、装置、计算机设备和存储介质
Kassaymeh et al. Software effort estimation modeling and fully connected artificial neural network optimization using soft computing techniques
CN114881343B (zh) 基于特征选择的电力系统短期负荷预测方法及装置
CN108764553B (zh) 用户规模预测方法、装置及计算机设备
CN114781532A (zh) 机器学习模型的评估方法、装置、计算机设备及介质
CN110990135A (zh) 基于深度迁移学习的Spark作业时间预测方法和装置
CN114169460A (zh) 样本筛选方法、装置、计算机设备和存储介质
CN114118570A (zh) 业务数据预测方法及装置、电子设备和存储介质
Tejaswi et al. Investigation of Ethereum Price Trends using Machine learning and Deep Learning Algorithms
CN110569461B (zh) 网页点击量预测方法、装置、计算机设备及存储介质
CN111753992A (zh) 筛选方法和筛选系统
CN114139934A (zh) 基于人工智能的活动评价方法、装置、设备及介质
CN114784795A (zh) 风电功率预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant