CN113542046B - 一种流量预估方法、装置、设备及存储介质 - Google Patents
一种流量预估方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113542046B CN113542046B CN202010317723.XA CN202010317723A CN113542046B CN 113542046 B CN113542046 B CN 113542046B CN 202010317723 A CN202010317723 A CN 202010317723A CN 113542046 B CN113542046 B CN 113542046B
- Authority
- CN
- China
- Prior art keywords
- training
- flow
- data
- statistical
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012549 training Methods 0.000 claims abstract description 339
- 238000010801 machine learning Methods 0.000 claims abstract description 23
- 230000006870 function Effects 0.000 claims description 45
- 230000015654 memory Effects 0.000 claims description 19
- 238000010276 construction Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 10
- 238000012417 linear regression Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 11
- 239000013598 vector Substances 0.000 description 9
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0876—Network utilisation, e.g. volume of load or congestion level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Environmental & Geological Engineering (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种流量预估方法、装置、设备及存储介质,涉及人工智能技术领域。具体实现方式为:根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据;根据所述训练输入流量数据关联的输入统计数据和/或所述训练输出流量数据关联的输出统计数据,以及所述训练输入流量数据和所述训练输出流量数据,构建训练样本;采用所述训练样本,对机器学习模型进行训练,得到流量预估模型。本申请实施例提高了所训练的流量预估模型的准确度,从而在使用该流量预估模型对非稳定流量进行预测时,提高预测精度。
Description
技术领域
本申请涉及数据处理领域,尤其涉及人工智能技术,特别涉及一种流量预估方法、装置、设备及存储介质。
背景技术
目前线下广告系统中,由于媒体设备和媒体接入方式等因素的影响,使得不同类型的流量之间差异较大。其中,流量可以包括稳定流量和非稳定流量。稳定流量接入设备固定,但是接入设备数量较少;非稳定流量数据量丰富,但流量值容易受外界因素的干扰。
为了合理利用非稳定流量,对非稳定流量进行预测,从而实现非稳定流量向稳定流量的转化,成为亟待解决的问题。
发明内容
本申请实施例提供了一种流量预估方法、装置、设备及存储介质,以实现对非稳定流量的精准预测。
根据第一方面,提供了一种流量预估方法,包括:
根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据;
根据所述训练输入流量数据关联的输入统计数据和/或所述训练输出流量数据关联的输出统计数据,以及所述训练输入流量数据和所述训练输出流量数据,构建训练样本;
采用所述训练样本,对机器学习模型进行训练,得到流量预估模型。
根据第二方面,还提供了一种流量预估装置,包括:
训练流量数据确定模块,用于根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据;
训练样本构建模块,用于根据所述训练输入流量数据关联的输入统计数据和/或所述训练输出流量数据关联的输出统计数据,以及所述训练输入流量数据和所述训练输出流量数据,构建训练样本;
模型训练模块,用于采用所述训练样本,对机器学习模型进行训练,得到流量预估模型。
根据第三方面,还提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所提供的一种流量预估方法。
第四方面,还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面所提供的一种流量预估方法。
本申请实施例根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据;根据训练输入流量数据关联的输入统计数据和/或训练输出流量数据关联的输出统计数据,以及训练输入流量数据和训练输出流量数据,构建训练样本;采用训练样本,对及其学习模型进行训练,得到流量预估模型。本申请实施例采用上述技术方案提高了所训练的流量预估模型的准确度,从而在使用该流量预估模型对非稳定流量进行预测时,提高预测精度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例提供的一种流量预估方法的流程图;
图2是本申请实施例提供的另一种流量预估方法的流程图;
图3是本申请实施例提供的另一种流量预估方法的流程图;
图4是本申请实施例提供的另一种流量预估方法的流程图;
图5是本申请实施例提供的一种流量预估装置的结构图;
图6是用来实现本申请实施例的流量预估方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是本申请实施例提供一种流量预估方法的流程图。本申请实施例适用于对线下广告系统中的非稳定流量进行流量预测的情况,该方法由流量预估装置执行,该装置采用软件和/或硬件实现,并具体配置于电子设备中,该电子设备可以内置与线下广告系统中,或者,该电子设备还可以是为线下广告系统提供相应服务的服务器。
如图1所示的一种流量预估方法,包括:
S101、根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据。
其中,历史流量时间序列可以理解为,将历史流量数据根据流量数据产生的时间顺序排列后得到的序列。其中,流量数据为非稳定流量,例如,RTB(Real Time Bidding,实时竞价)流量。
示例性地,根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据,可以是:根据预先确定的时间偏移量和时间长度,对历史流量时间序列进行划分,得到多个时间偏移向量。其中,时间偏移向量中包括训练输入流量数据,用于作为训练样本的输入参数输入至待训练模型中,得到下一时刻的流量数据的预测值;时间偏移向量中还包括训练输出流量数据,用于作为该训练样本的标签值,并结合该训练样本的预测值,对待训练模型的模型参数进行优化调整。
其中,时间偏移量和/或时间长度,可以由技术人员根据需要或经验值进行设定,还可以通过大量试验加以确定,还可以根据历史流量时间序列的数据量进行确定等。
举例说明,当历史流量时间序列为[s1,s2,…,s720],其中,si为第i个时间点对应的流量数据。若时间偏移量为1,时间长度为72,则最终得到的时间偏移向量可包括:[s1,s2,…,s72,s73],[s2,s3,…,s73,s74],…,[s648,s649,…,s719,s720]。每个时间偏移向量中包括73个流量数据,其中,最后一个流量数据为训练输出流量数据;除最后一个流量数据外的其他数据为训练输入流量数据。
S102、根据所述训练输入流量数据关联的输入统计数据和/或所述训练输出流量数据关联的输出统计数据,以及所述训练输入流量数据和所述训练输出流量数据,构建训练样本。
S103、采用所述训练样本,对机器学习模型进行训练,得到流量预估模型。
其中,机器学习模型可以是XGBoost(eXtreme Gradient Boosting,极端梯度提升)模型、线性回归或决策树模型。
一般的,通过训练输入流量数据和训练输出流量数据所构建的训练样本,对机器学习模型进行模型训练时,能够通过提取训练输入流量数据中各流量数据的流量特征数据,从而根据该流量特征数据,对训练输出流量数据对应时刻的流量进行预测,从而根据预测值和训练流量数据之间的差异情况,对机器学习模型,也即前述待训练模型的模型参数,进行优化调整,直至满足训练截止条件;将训练好的机器学习模型作为流量预估模型。其中,训练截止条件可以是表征预测值和训练流量数据之间的差异情况的函数值收敛,或者小于设定阈值。当然,训练截止条件还可以是训练样本量达到设定样本量阈值,或训练次数达到设定次数阈值。
然而,单独采用训练输入流量数据和训练输出流量数据所构建的训练样本所包含的信息量有限,因此在模型训练过程中,所提取的流量特征数据全面性较差,使得所训练模型的模型精度较差,进而在使用训练好的模型进行流量预估时,影响预估结果准确度。为了避免上述情况的发生,本申请在构建训练样本时,引入与训练输入流量数据和/或训练输出流量数据相关联的统计数据,以扩充训练样本中的信息量,从而提高所提取的流量特征数据的特征丰富度和全面性,进而能够提高所训练模型的模型精度。
本申请实施例根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据;根据训练输入流量数据关联的输入统计数据和/或训练输出流量数据关联的输出统计数据,以及训练输入流量数据和训练输出流量数据,构建训练样本;采用训练样本,对及其学习模型进行训练,得到流量预估模型。采用上述技术方案,通过在训练样本中引入与训练输入流量数据关联的输入统计数据,和/或训练输出流量数据关联的输出统计数据,扩充了训练样本中的信息量,从而在模型训练过程中,提高了所提取训练样本中的流量特征数据的特征丰富度和全面性,进而提高了训练好的流量预估模型的模型精度。
在本申请实施例的一种可选实施方式中,在训练样本中还可以引入训练输出流量数据关联的时间属性信息,也即训练输出流量数据对应的待预测时刻所在时间单位的时间属性信息。例如,输出流量数据为X月X日Y点的流量,那么时间属性信息可以是X月X日、X月X日为星期几、X月X日是否为节假日、以及X月X日所属节假日名称等中的至少一种。
可以理解的是,由于流量的变化会受时间因素的影响,例如节假日的流量较非节假日流量要高,因此,通过在训练样本中引入训练输出流量数据对应的待预测时刻所在时间单位的时间属性信息,能够进一步扩充训练样本中的信息量,从而提高所提取的流量特征数据的特征丰富度和全面性,进而能够提高所训练模型的模型精度。
在本申请实施例的一种可选实施方式中,在得到流量预估模型之后,还可以使用流量预估模型对未来时刻流量数据进行预测。示例性地,确定待预测时刻的预测输入流量数据;根据所述预测输入流量数据关联的输入统计数据和/或待预测时刻关联的输出统计数据,以及所述预测输入流量数据,构建预测数据;将所述预测数据输入至所述流量预估模型,得到所述待预测时刻的流量预测结果。
示例性地,确定待预测时刻的预测输入流量数据,可以是根据时间长度和当前最新流量数据,确定与待预测时刻关联的预测输入流量数据。具体的,确定与当前最新流量数据间隔时间长度的历史流量数据,将该历史流量数据与当前最新流量数据之间的所有流量数据顺序组合,得到预测输入流量数据。
可选的,在构建预测数据时,预测数据中包含的统计数据可以是与预测输入流量数据关联的输入统计数据,还可以是待预测时刻关联的输出统计数据,还可以同时包括预测输入流量数据关联的输入统计数据和待预测时刻关联的输出统计数据,仅需保证所包含统计数据的类型与模型训练时训练样本中的统计数据的类型相匹配即可。其中,统计数据的类型包括输入统计数据和输出统计数据。
可以理解的是,由于本申请训练得到的流量预估模型,在模型训练阶段,训练样本中引入了与训练输入流量数据关联的输入统计数据和/或训练输出流量数据关联的输出统计数据,通过统计数据的引入提高了流量预估模型的模型精度。因此,在模型使用阶段,采用该流量预估模型得到的待预测时刻的流量预测结果与实际流量的匹配度更高,也即,提高了流量预测结果的准确度。
在本申请实施例的另一可选实施方式中,若在模型训练阶段中,训练样本中还包括训练输出流量数据关联的时间属性信息,那么相应的,在模型使用阶段,在构建预测数据时,还需要在预测数据中添加待预测时刻所在时间单位的时间属性信息。
需要说明的是,由于不同广告位所在地点不同、所投放的广告类型或广告时段等信息也存在差异,因此在进行模型训练时,需要针对每个广告位分别训练流量预估模型。相应的,分别采用各广告位对应的流量预估模型,进行流量预测。
在本申请实施例的一种可选实施方式中,为了在模型使用过程中,实现对模型的预测结果准确度的有效监控,以便在遇到意外情况时,及时止损,还可以通过将流量预测结果与实际结果进行比较,根据比较结果进行误差预警。可选的,针对每个广告位,确定待预测时刻的流量预测结果与实际流量值的流量差值;若该流量差值大于第一设定误差阈值,则生成误差预警提示。或者可选的,针对每个广告位,确定当天各时刻的流量预测结果的总和,与当天实际流量值的流量差值;若该流量差值大于第二设定误差阈值,则生成误差预警提示。或者可选的,确定各广告位在相同待预测时刻的流量预测结果的总和,与该时刻各广告位实际流量总和的流量差值;若该流量差值大于第三设定误差阈值,则生成误差预警提示。或者可选的,确定各广告位当天各时刻的流量预测结果的总和,与各广告位当天实际流量值的总和的流量差值;若该流量差值大于第四设定误差阈值,则生成误差预警提示。其中,各设定误差阈值可以由技术人员根据需要或经验值进行确定。
在本申请实施例的另一可选实施方式中,还可以针对每一广告位,确定该广告位在待预测时刻的流量预测结果,与历史流量数据中相同时刻的历史流量数据均值之间的流量差值;若该流量差值大于第五设定误差阈值,则生成误差预警提示。或者可选的,还可以针对每一广告位,确定该广告位在当天的流量预测结果总和,与历史流量数据中全天流量均值之间的流量差值;若该流量差值大于第六设定误差阈值,则生成误差预警提示。其中,第五设定误差阈值和第六设定误差阈值可以由技术人员根据需要或经验值进行确定。
进一步地,在执行流量预估过程中,追加“确定所述训练输入流量数据的统计结果,并将该统计结果作为所述输入统计数据;和/或,确定与所述训练输出流量数据的同期数据的统计结果,并将该统计结果作为所述输出统计数据”,以完善输入统计数据和/或输出统计数据的确定机制。
如图2所示的一种流量预估方法,包括:
S201、根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据。
S202、确定所述训练输入流量数据的统计结果,并将该统计结果作为所述输入统计数据;和/或,确定所述训练输出流量数据的同期数据的统计结果,并将该统计结果作为所述输出统计数据。
其中,统计结果包括均值、标准差、最大值和最小值等中的至少一种。
其中,与训练输出流量数据的同期数据可以是与训练输出流量数据产生日期不同,但产生时刻相同的历史流量数据;其中,同期数据的数量可以由训练输入流量数据所涵盖的时间单位数量确定。
举例说明,当训练输入流量数据为72个,包含有4月1日至4月3日三天的历史流量数据;训练输出流量数据为4月4日8时的历史流量数据。那么,相应的,与训练输出流量数据的同期数据为4月1日至4月3日中,每天8时对应的历史流量数据。
S203、根据所述训练输入流量数据关联的输入统计数据和/或所述训练输出流量数据关联的输出统计数据,以及所述训练输入流量数据和所述训练输出流量数据,构建训练样本。
需要说明的是,由于统计结果所包含的种类较多,并不是每一种统计结果都能在模型训练阶段引入新的特征数据,部分统计结果可能会带来一定的数据冗余,造成计算资源的浪费。为了避免上述情况的发生,在构建训练样本之后,还可以通过训练样本中的统计结果进行筛选。
可选的,在构建训练样本之后,根据线性回归模型,确定训练样本中各训练输入流量数据的统计结果的特征权重;根据特征权重,对输入统计数据和/或输出统计数据进行筛选;根据筛选后的输入统计数据和/后输出统计数据,更新训练样本。
其中,特征权重数值越大,表征该种类别的统计结果在模型训练过程中引入的特征数据越好,能够一定程度上扩充模型训练过程所提取特征的维度,进而提高所训练模型的模型精度。
具体的,训练样本中包含有训练输入流量数据关联的至少一种统计结果,以及训练输出流量数据关联的至少一种统计结果;根据线性回归模型,确定训练样本中各训练输入流量数据的统计结果的特征权重;筛选特征权重最高的设定数量的统计结果对应的统计类型;保留训练样本中与该统计类型对应的输入统计数据和/或输出统计数据,从而更新训练样本。
其中,设定数量可以由技术人员根据需要或经验值确定为固定值,例如可以是1。可选的,设定数量还可以根据统计结果的特征权重的数值确定,例如将特征权重大于最高特征权重设定百分比的统计结果的数量作为设定数量;其中,设定百分比可以由技术人员根据需要或经验值确定,例如可以是80%。
S204、采用所述训练样本,对机器学习模型进行训练,得到流量预估模型。
本申请实施例通过在进行流量预估过程中,确定训练输入流量数据的统计结果,并将该统计结果作为输入统计数据;和/或确定训练输出流量数据的同期数据的统计结果,并将该统计结果作为输出统计数据,完善了输入统计数据和/或输出统计数据的确定方式,为后续进行训练样本的构建提供了数据支撑,进而为提高流量预估模型的准确度奠定了基础。
需要说明的是,在模型使用阶段,预测数据中预测输入流量数据关联的输入统计数据的确定方式,与模型训练阶段训练样本中训练输入流量数据关联的输入统计数据的确定方式相同;预测数据中待预测时刻关联的输出统计数据的确定方式,与模型训练阶段训练样本中训练输出流量数据关联的输出统计数据的确定方式相同。
进一步地,将操作“采用所述训练样本,对机器学习模型进行训练”细化为“根据所述训练样本的流量预测结果和所述训练输出流量数据,构建损失函数;采用所述损失函数,对预先构建的机器学习模型进行训练;其中,所述损失函数中包括边界限制项,用于限制所述训练样本的流量预测结果不大于所述训练输出流量数据。”,以完善模型训练机制。
如图3所示的一种流量预估方法,包括:
S301、根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据。
S302、根据所述训练输入流量数据关联的输入统计数据和/或所述训练输出流量数据关联的输出统计数据,以及所述训练输入流量数据和所述训练输出流量数据,构建训练样本。
S303、根据所述训练样本的流量预测结果和所述训练输出流量数据,构建损失函数。其中,所述损失函数中包括边界限制项,用于限制所述训练流量数据的流量预测结果不大于所述训练输出流量数据。
需要说明的是,通过确定边界限制项限制预测流量值不超过实际值,避免了预测结果溢出情况的发生,使所训练模型能够实现流量的保守估计,避免了用户根据流量预测结果购买流量时,预备流量无法满足用户购买需求给用户带来较差的体验。
在本申请实施例的一种可选实施方式中,根据所述训练样本的流量预测结果和所述训练输出流量数据,构建损失函数,可以是:将所述训练样本的流量预测结果与所述训练输出流量数据的差值作为流量边界差值;根据所述流量边界差值与所述训练输出流量数据的乘积,确定所述边界限制项;根据所述边界限制项,构建所述损失函数。
可以理解的是,通过训练输出流量数据对流量边界差值进行加权,能够在流量差值较大的情况下,对较大的流量预测结果加大惩罚,从而减少模型训练时间,提高模型训练效率。
为了进一步提高模型预测结果准确度,还可以在损失函数中引入距离限制项,从而使流量预测结果能够尽可能靠近训练输出流量数据,进而在保守估计的情况下,提高流量预测结果准确度。示例性地,根据边界限制项,构建损失函数,可以是:确定所述流量预测结果与所述训练输出流量数据之间的距离差值;根据所述距离差值与所述训练输出流量数据,确定距离限制项;根据所述边界限制项和所述距离限制项,构建所述损失函数。其中,距离差值可以是欧式距离或马氏距离等。
可以理解的是,通过训练输出流量数据对距离差值的平方值进行加权,同样能够在流量差值较大的情况下,进一步对较大的流量预测结果加大惩罚,从而减少模型训练时间,提高模型训练效率。
具体的,根据以下公式构建损失函数:
loss=(pred-y)*y+(y-pred)2*y;
其中,loss为损失函数的函数值;pred为流量预测结果;y为训练输出流量数据。其中,该目标函数中的第一项为边界限制项,第二项为距离限制项。
S304、采用所述损失函数,对预先构建的机器学习模型进行训练,得到流量预估模型。
本申请实施例通过将采用训练样本对机器学习模型进行训练的过程中,在损失函数中引入边界限制项,用于限制训练流量数据的流量预测结果不大于训练输出流量数据,从而提高避免了模型的流量预测结果超出实际流量结果,实现了对流量的保守估计,避免了用户根据流量预测结果购买流量时,预备流量无法满足用户购买需求给用户带来较差的体验。
图4是本申请实施例提供的另一种流量预估方法的流程图,本申请实施例在上述各实施例的技术方案的基础上,提供了一种优选实施方式。
如图4所示的一种流量预估方法,包括:
S410、模型训练阶段;
S420、模型使用阶段;以及,
S430、误差预警阶段。
其中,模型训练阶段,具体包括:
S411、将历史流量数据根据流量产生时间顺序排序,得到历史流量时间序列;
S412、根据设定时间长度和设定时间偏移量,对历史流量时间序列进行划分,得到多个时间偏移向量;其中,时间偏移向量包括训练输入流量数据和训练输出流量数据。
其中,设定时间长度和设定时间偏移量由技术人员根据需要或经验值进行确定。
其中,设定时间长度可以是2天或3天所产生的流量数据长度;设定时间偏移量可以是1个流量数据长度。
S413、确定训练输入流量数据的统计结果,并将该统计结果作为输入统计数据;
其中,统计结果至少包括均值、标准差、方差、最大值和最小值等。
S414、确定训练输出流量数据的同期数据的统计结果,并将该统计结果作为输出统计数据;
其中,同期数据是指与训练输出流量数据生成日期不同,但生成时刻相同的历史流量数据。
S415、将时间偏移向量,以及时间偏移向量对应的输入统计数据和输出统计数据组合生成训练样本;
S416、根据线性回归模型,确定训练样本中各输入统计数据的特征权重;
S417、确定特征权重较高的设定数量个统计结果的统计类型;
其中,设定数量可以由技术人员根据需要或经验值进行确定,还可以根据统计结果中所包含统计类型的总量确定,例如可以是统计类型总量的50%。
S418、在训练样本的输入统计数据和输出统计数据中,剔除与所确定的统计类型不同的统计结果,以更新训练样本;
S419、采用更新后的训练样本对XGBoost模型进行训练,并根据预先构建的损失函数调整模型参数,得到流量预估模型。
其中,预先构建的损失函数为:
loss=(pred-y)*y+(y-pred)2*y;
其中,loss为损失函数的函数值;pred为流量预测结果;y为训练输出流量数据。其中,该目标函数中的第一项为边界限制项,第二项为距离限制项。
其中,边界限制项用于限制流量预测值不超过实际值,并对较大的流量预测值加大惩罚;距离限制项为了提高准确度,并对较大的流量预测值加大惩罚。
其中,模型使用阶段,具体包括:
S421、根据当前最新流量数据和设定时间长度,从历史流量数据中获取待预测时刻的预测输入流量数据。其中,预测输入流量数据与训练输入流量数据长度相同。
S422、根据统计类型,确定预测输入流量数据的统计结果,并将该统计结果作为预测输入统计数据;
S423、根据统计类型,确定待预测时刻的同期数据的统计结果,并将该统计结果作为预测输出统计数据;
S424、将预测输入流量数据、预测输入统计数据和预测输出统计数据组合,生成预测数据;
S425、将预测数据输入至流量预估模型,得到待预测时刻的流量预测结果。
其中,误差预警阶段,具体包括:
S431、将各广告位当天各时刻的流量预测结果与相应的实际流量值进行比较,若误差超出第一设定误差阈值,则进行误差预警;
S432、将各广告位当天的流量预测结果和值与相应的实际流量和值进行比较,若超出第二设定误差阈值,则进行误差预警;
S433、将各广告位当天的流量预测结果和值,与历史流量数据的每日平均流量值进行比较,若超出第三设定误差阈值,则进行误差预警。
其中,第一设定误差阈值、第二设定误差阈值和第三设定误差阈值可以由技术人员根据需要或经验值进行确定。
图5是本申请实施例提供的一种流量预估装置的结构图,该装置采用软件和/或硬件实现,并具体配置于电子设备中。
如图5所示的一种流量预估装置500,包括:训练流量数据确定模块501、训练样本构建模块502和模型训练模块503。其中,
训练流量数据确定模块501,用于根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据;
训练样本构建模块502,用于根据所述训练输入流量数据关联的输入统计数据和/或所述训练输出流量数据关联的输出统计数据,以及所述训练输入流量数据和所述训练输出流量数据,构建训练样本;
模型训练模块503,用于采用所述训练样本,对机器学习模型进行训练,得到流量预估模型。
本申请实施例通过训练流量数据确定模块根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据;通过训练样本构建模块根据训练输入流量数据关联的输入统计数据和/或训练输出流量数据关联的输出统计数据,以及训练输入流量数据和训练输出流量数据,构建训练样本;通过模型训练模块采用训练样本,对及其学习模型进行训练,得到流量预估模型。采用上述技术方案,通过在训练样本中引入与训练输入流量数据关联的输入统计数据,和/或训练输出流量数据关联的输出统计数据,扩充了训练样本中的信息量,从而在模型训练过程中,提高了所提取训练样本中的流量特征数据的特征丰富度和全面性,进而提高了训练好的流量预估模型的模型精度。
进一步地,所述装置还包括,统计数据确定模块,用于:
确定所述训练输入流量数据的统计结果,并将该统计结果作为所述输入统计数据;和/或,
确定所述训练输出流量数据的同期数据的统计结果,并将该统计结果作为所述输出统计数据。
进一步地,所述统计结果包括均值、标准差、最大值和最小值中的至少一种。
进一步地,所述装置还包括:训练样本更新模块,具体包括:
特征权重确定单元,用于在构建训练样本之后,根据线性回归模型,确定所述训练样本中各训练输入流量数据的统计结果的特征权重;
统计数据筛选单元,用于根据所述特征权重,对所述输入统计数据和/或所述输出统计数据进行筛选;
训练样本更新单元,用于根据筛选后的所述输入统计数据和/或所述输出统计数据,更新所述训练样本。
进一步地,所述训练样本还包括训练输出流量数据关联的时间属性信息。
进一步地,所述模型训练模块503,包括:
损失函数构建单元,用于根据所述训练样本的流量预测结果和所述训练输出流量数据,构建损失函数;
模型训练单元,用于采用所述损失函数,对预先构建的机器学习模型进行训练;
其中,所述损失函数中包括边界限制项,用于限制所述训练样本的流量预测结果不大于所述训练输出流量数据。
进一步地,所述损失函数构建单元,包括:
流量边界差值确定子单元,用于将所述训练样本的流量预测结果与所述训练输出流量数据的差值作为流量边界差值;
边界限制项确定子单元,用于根据所述流量边界差值与所述训练输出流量数据的乘积,确定所述边界限制项;
损失函数构建子单元,用于根据所述边界限制项,构建所述损失函数。
进一步地,所述机器学习模型为极端梯度提升XGBoost模型。
进一步地,所述流量数据为实时竞价RTB流量。
进一步地,所述装置还包括:
预测流量数据确定模块,用于确定待预测时刻的预测输入流量数据;
预测数据构建模块,用于根据所述预测输入流量数据关联的输入统计数据和/或待预测时刻关联的输出统计数据,以及所述预测输入流量数据,构建预测数据;
预测模块,用于将所述预测数据输入至所述流量预估模型,得到所述待预测时刻的流量预测结果。
上述流量预估装置可执行本申请任意实施例所提供的流量预估方法,具备执行流量预估方法相应的功能模块和有益效果。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是实现本申请实施例的流量预估方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的流量预估方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的流量预估方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的流量预估方法对应的程序指令/模块(例如,附图5所示的训练流量数据确定模块501、训练样本构建模块502和模型训练模块503)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的流量预估方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储实现流量预估方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至实现流量预估方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现流量预估方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与实现流量预估方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据;根据训练输入流量数据关联的输入统计数据和/或训练输出流量数据关联的输出统计数据,以及训练输入流量数据和训练输出流量数据,构建训练样本;采用训练样本,对及其学习模型进行训练,得到流量预估模型。采用上述技术方案,通过在训练样本中引入与训练输入流量数据关联的输入统计数据,和/或训练输出流量数据关联的输出统计数据,扩充了训练样本中的信息量,从而在模型训练过程中,提高了所提取训练样本中的流量特征数据的特征丰富度和全面性,进而提高了训练好的流量预估模型的模型精度。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (16)
1.一种流量预估方法,其特征在于,包括:
根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据;其中,所述历史流量时间序列为将历史流量数据根据流量数据产生的时间顺序排列后得到的序列;所述流量数据为非稳定流量;
根据所述训练输入流量数据关联的输入统计数据和/或所述训练输出流量数据关联的输出统计数据,以及所述训练输入流量数据和所述训练输出流量数据,构建训练样本;
采用所述训练样本,对机器学习模型进行训练,得到流量预估模型;
其中,所述采用所述训练样本,对机器学习模型进行训练,包括:
根据所述训练样本的流量预测结果和所述训练输出流量数据,构建损失函数;
采用所述损失函数,对预先构建的机器学习模型进行训练;
其中,所述损失函数中包括边界限制项,用于限制所述训练样本的流量预测结果不大于所述训练输出流量数据;
其中,所述根据所述训练样本的流量预测结果和所述训练输出流量数据,构建损失函数,包括:
将所述训练样本的流量预测结果与所述训练输出流量数据的差值作为流量边界差值;
根据所述流量边界差值与所述训练输出流量数据的乘积,确定所述边界限制项;
根据所述边界限制项,构建所述损失函数。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述训练输入流量数据的统计结果,并将该统计结果作为所述输入统计数据;和/或,
确定所述训练输出流量数据的同期数据的统计结果,并将该统计结果作为所述输出统计数据。
3.根据权利要求2所述的方法,其特征在于,所述统计结果包括均值、标准差、最大值和最小值中的至少一种。
4.根据权利要求2所述的方法,其特征在于,在构建训练样本之后,所述方法还包括:
根据线性回归模型,确定所述训练样本中各训练输入流量数据的统计结果的特征权重;
根据所述特征权重,对所述输入统计数据和/或所述输出统计数据进行筛选;
根据筛选后的所述输入统计数据和/或所述输出统计数据,更新所述训练样本。
5.根据权利要求1所述的方法,其特征在于,所述训练样本还包括训练输出流量数据关联的时间属性信息。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述机器学习模型为极端梯度提升XGBoost模型。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述流量数据为实时竞价RTB流量。
8.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
确定待预测时刻的预测输入流量数据;
根据所述预测输入流量数据关联的输入统计数据和/或待预测时刻关联的输出统计数据,以及所述预测输入流量数据,构建预测数据;
将所述预测数据输入至所述流量预估模型,得到所述待预测时刻的流量预测结果。
9.一种流量预估装置,其特征在于,包括:
训练流量数据确定模块,用于根据历史流量时间序列,确定训练输入流量数据和训练输出流量数据;其中,所述历史流量时间序列为将历史流量数据根据流量数据产生的时间顺序排列后得到的序列;所述流量数据为非稳定流量;
训练样本构建模块,用于根据所述训练输入流量数据关联的输入统计数据和/或所述训练输出流量数据关联的输出统计数据,以及所述训练输入流量数据和所述训练输出流量数据,构建训练样本;
模型训练模块,用于采用所述训练样本,对机器学习模型进行训练,得到流量预估模型;
所述模型训练模块,包括:
损失函数构建单元,用于根据所述训练样本的流量预测结果和所述训练输出流量数据,构建损失函数;
模型训练单元,用于采用所述损失函数,对预先构建的机器学习模型进行训练;
其中,所述损失函数中包括边界限制项,用于限制所述训练样本的流量预测结果不大于所述训练输出流量数据;
所述损失函数构建单元,包括:
流量边界差值确定子单元,用于将所述训练样本的流量预测结果与所述训练输出流量数据的差值作为流量边界差值;
边界限制项确定子单元,用于根据所述流量边界差值与所述训练输出流量数据的乘积,确定所述边界限制项;
损失函数构建子单元,用于根据所述边界限制项,构建所述损失函数。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括,统计数据确定模块,用于:
确定所述训练输入流量数据的统计结果,并将该统计结果作为所述输入统计数据;和/或,
确定所述训练输出流量数据的同期数据的统计结果,并将该统计结果作为所述输出统计数据。
11.根据权利要求10所述的装置,其特征在于,所述统计结果包括均值、标准差、最大值和最小值中的至少一种。
12.根据权利要求10所述的装置,其特征在于,所述装置还包括:训练样本更新模块,具体包括:
特征权重确定单元,用于在构建训练样本之后,根据线性回归模型,确定所述训练样本中各训练输入流量数据的统计结果的特征权重;
统计数据筛选单元,用于根据所述特征权重,对所述输入统计数据和/或所述输出统计数据进行筛选;
训练样本更新单元,用于根据筛选后的所述输入统计数据和/或所述输出统计数据,更新所述训练样本。
13.根据权利要求9所述的装置,其特征在于,所述训练样本还包括训练输出流量数据关联的时间属性信息。
14.根据权利要求9-13任一项所述的装置,其特征在于,所述机器学习模型为极端梯度提升XGBoost模型。
15.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的一种流量预估方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使计算机执行权利要求1-8中任一项所述的一种流量预估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010317723.XA CN113542046B (zh) | 2020-04-21 | 2020-04-21 | 一种流量预估方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010317723.XA CN113542046B (zh) | 2020-04-21 | 2020-04-21 | 一种流量预估方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113542046A CN113542046A (zh) | 2021-10-22 |
CN113542046B true CN113542046B (zh) | 2023-01-10 |
Family
ID=78093920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010317723.XA Active CN113542046B (zh) | 2020-04-21 | 2020-04-21 | 一种流量预估方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113542046B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115348179B (zh) * | 2022-08-10 | 2024-02-02 | 中国电信股份有限公司 | 网络流量边界预测方法、装置、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102957579A (zh) * | 2012-09-29 | 2013-03-06 | 北京邮电大学 | 一种网络异常流量监测方法及装置 |
CN107135230A (zh) * | 2017-06-13 | 2017-09-05 | 北京溢思得瑞智能科技研究院有限公司 | 一种基于infigarch模型的网络流量异常检测方法及设备 |
CN107135183A (zh) * | 2016-02-26 | 2017-09-05 | 中国移动通信集团河北有限公司 | 一种流量数据监测方法和装置 |
CN109495318A (zh) * | 2018-12-17 | 2019-03-19 | 广东宜通世纪科技股份有限公司 | 一种移动通信网络流量预测方法、装置及可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2990991A1 (en) * | 2014-08-29 | 2016-03-02 | Honda Research Institute Europe GmbH | Method and system for using global scene context for adaptive prediction and corresponding program, and vehicle equipped with such system |
CN109345302B (zh) * | 2018-09-27 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 机器学习模型训练方法、装置、存储介质和计算机设备 |
-
2020
- 2020-04-21 CN CN202010317723.XA patent/CN113542046B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102957579A (zh) * | 2012-09-29 | 2013-03-06 | 北京邮电大学 | 一种网络异常流量监测方法及装置 |
CN107135183A (zh) * | 2016-02-26 | 2017-09-05 | 中国移动通信集团河北有限公司 | 一种流量数据监测方法和装置 |
CN107135230A (zh) * | 2017-06-13 | 2017-09-05 | 北京溢思得瑞智能科技研究院有限公司 | 一种基于infigarch模型的网络流量异常检测方法及设备 |
CN109495318A (zh) * | 2018-12-17 | 2019-03-19 | 广东宜通世纪科技股份有限公司 | 一种移动通信网络流量预测方法、装置及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113542046A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110473516B (zh) | 语音合成方法、装置以及电子设备 | |
CN112102448B (zh) | 虚拟对象图像显示方法、装置、电子设备和存储介质 | |
KR20210118360A (ko) | 라벨링 모델을 구축하는 방법, 장치, 전자 기기, 프로그램 및 판독 가능 저장 매체 | |
EP3896595A1 (en) | Text key information extracting method, apparatus, electronic device, storage medium, and computer program product | |
CN110717340B (zh) | 推荐方法、装置、电子设备及存储介质 | |
CN112466288A (zh) | 语音识别方法、装置、电子设备及存储介质 | |
CN112001366A (zh) | 模型训练方法、人脸识别方法、装置、设备和介质 | |
CN110532487B (zh) | 标签的生成方法及装置 | |
CN111681647A (zh) | 用于识别词槽的方法、装置、设备以及存储介质 | |
CN111832701A (zh) | 模型的蒸馏方法、装置、电子设备及存储介质 | |
CN114841274B (zh) | 语言模型的训练方法、装置、电子设备和存储介质 | |
CN110543558A (zh) | 问题匹配方法、装置、设备和介质 | |
CN111858506A (zh) | 测试数据的处理方法、装置、电子设备及存储介质 | |
CN113723278A (zh) | 表格信息提取模型的训练方法及装置 | |
CN113542046B (zh) | 一种流量预估方法、装置、设备及存储介质 | |
CN112561332A (zh) | 模型管理方法、装置、电子设备、存储介质和程序产品 | |
CN112560499A (zh) | 语义表示模型的预训练方法、装置、电子设备及存储介质 | |
CN111311309A (zh) | 用户满意度确定方法、装置、设备和介质 | |
CN110750419A (zh) | 离线任务的处理方法、装置、电子设备及存储介质 | |
CN112541513A (zh) | 一种模型训练方法、装置、设备及存储介质 | |
CN112580723A (zh) | 多模型融合方法、装置、电子设备和存储介质 | |
CN111767832A (zh) | 模型生成方法、装置、电子设备及存储介质 | |
JP2019059348A (ja) | 運行情報処理装置およびその処理方法 | |
CN111160552A (zh) | 负采样处理方法、装置、设备和计算机存储介质 | |
CN112819497A (zh) | 转化率预测方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |