CN117425020B - 一种直播间自然流指标优化提升策略计算方法 - Google Patents

一种直播间自然流指标优化提升策略计算方法 Download PDF

Info

Publication number
CN117425020B
CN117425020B CN202311447972.0A CN202311447972A CN117425020B CN 117425020 B CN117425020 B CN 117425020B CN 202311447972 A CN202311447972 A CN 202311447972A CN 117425020 B CN117425020 B CN 117425020B
Authority
CN
China
Prior art keywords
data
index
optimization
live
flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311447972.0A
Other languages
English (en)
Other versions
CN117425020A (zh
Inventor
林瑞敏
杨渊策
贾宁
林琴萍
陈燎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Yingzhi Technology Co ltd
Original Assignee
Tianjin Yingzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Yingzhi Technology Co ltd filed Critical Tianjin Yingzhi Technology Co ltd
Priority to CN202311447972.0A priority Critical patent/CN117425020B/zh
Publication of CN117425020A publication Critical patent/CN117425020A/zh
Application granted granted Critical
Publication of CN117425020B publication Critical patent/CN117425020B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26208Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/47815Electronic shopping

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种直播间自然流指标优化提升策略计算方法,所述方法包括:获取直播间的历史数据,筛选出自然流直播间;基于所述历史数据和直播间是否推流训练一维卷积神经网络模型;计算各指标优化比例范围;基于所述自然流数据指标、训练完成的一维卷积神经网络模型和各指标可优化比例范围训练生成对抗网络;基于训练完成的一维卷积神经网络模型和训练完成的生成对抗网络模型,输出为了当前直播间获得推流的自然流指标提升策略。本发明方法能克服传统直播运营技术不能准确判断需要提升哪些具体指标能够带来直播间自然流增长的难题,将生成对抗网络与卷积神经网络模型应用到直播运营场控和决策当中,实时准确地为每个直播间设计可行的优化和提升的策略。

Description

一种直播间自然流指标优化提升策略计算方法
技术领域
本发明属于直播电商运营技术领域,具体涉及一种直播间自然流指标优化提升策略计算方法。
背景技术
直播电商是指通过网络直播平台进行产品销售和推广的商业模式,它结合了电子商务和直播技术,使消费者可以通过实时视频直播购买商品,并与主播进行互动交流。直播电商是一种新兴的行业,截至2020年底,中国直播电商相关企业累计注册有8862家,行业内主播的从业人数已经达到123.4万人。虽然已有较为庞大的行业规模,积累了大量直播间数据,但是直播运营技术在推流的识别和预测上,还处在以经验为主的阶段。针对怎样提升直播间各项数据指标,哪些数据指标值得重点关注,哪些数据指标的提升能够导致直播效果得到迅速提升,怎样制定直播间指标的优化提升策略等等,缺乏相关研究和新技术的应用。有经验的直播运营管理人员能够敏锐地捕捉到直播间数据指标的变动,从而对直播间进行及时优化,提升直播效果,但对于大多数直播运营管理人员来说,很难对直播数据进行准确的把握。
发明内容
本发明直接目的在于提出一种提升直播间互动数据和电商数据的指标数值的可行方法,根本目的在于提高直播间流量,从而提高直播电商的营销额,促进直播间各项指标的良性循环。
本发明的技术方案如下:
一种直播间自然流指标优化提升策略计算方法,所述方法包括:获取直播间的历史数据,筛选出自然流直播间;所述历史数据包括:自然流数据和商品信息;所述自然流数据指标包括:电商指标、互动指标、流量指标,所述电商指标包括成交金额、成交数量、成交人数、UV价值、千次观看成交金额和成交率;所述互动指标包括关注人数、加粉丝团人数、评论次数、关注率、互动率和用户停留时间;所述流量指标包括进入人数、离开人数、在线人数和曝光次数;所述商品信息包括直播间在售卖的商品名称、商品价格、商品类目;
定义直播间推流并对历史数据进行数据预处理;
基于预处理后的数据和直播间是否推流训练一维卷积神经网络模型;
计算各指标优化比例范围;
基于预处理后的数据、训练完成的一维卷积神经网络模型和各指标可优化比例范围训练生成对抗网络;
基于训练完成的一维卷积神经网络模型和训练完成的生成对抗网络模型,输出为了当前直播间获得推流的自然流指标可行提升策略。
进一步地,所述直播间推流的定义方法为:在连续的三个5分钟内直播间进入人数的均值持续提高,设当前时间为t,即:
mean(ENTER_UCNTi,i∈(t-5,t])<mean(ENTER_UCNTi,i∈(t,t+5])<mean(ENTER_UCNTi,i∈(t+5,t+10]);
所述ENTER_UCNT为直播间进入人数。
进一步地,所述对历史数据进行数据预处理具体为:
获取得到电商指标、互动指标和流量指标在各时刻近5分钟内时间序列数据以及词向量嵌入后的直播间商品信息;
将直播间的商品信息中的文字进行词向量嵌入,采用Skip-Gram模式进行Word2Vec训练,词向量的维度为100,直播间有多个商品的,对嵌入结果进行平均池化;
将商品信息嵌入结果与所述指标5分钟时间序列数据进行拼接,作为卷积神经网络模型的输入数据。
进一步地,基于预处理后的数据和直播间是否推流训练一维卷积神经网络具体为:
将输入数据分成训练集和测试集;在训练集上通过5折交叉验证进行训练和调参;设置每个batch的大小为64;采用Adam算法对网络参数进行迭代调整,使得损失函数值最小,初始学习率设置为0.01;模型在测试集上预测的整体auc=0.71。进一步地,所述一维卷积神经网络模型的网络结构如下:一维卷积神经网络隐藏层由3个卷积层、3个最大池化层和2个全连接层组成;第一卷积层,卷积核个数为128,每个卷积核的大小为3,步长为1,激活函数采用ReLU函数,采用全零填充;第一池化层,池化窗口大小为2,步长为2,第二卷积层,卷积核个数为256,每个卷积核的大小为3,步长为1,激活函数采用ReLU函数,采用全零填充;第二池化层,池化窗口大小为2,步长为2,第三卷积层,卷积核个数为512,每个卷积核的大小为3,步长为1,激活函数采用ReLU函数,采用全零填充;第三池化层,池化窗口大小为2,步长为2;第一全连接层,神经元个数为128,应用ReLU激活函数;第二全连接层,神经元个数为128,应用ReLU激活函数;输出层将长度为64的向量映射到标量,表示该数据迎来推流的概率。
进一步地,使用训练好的一维卷积神经网络模型预测直播间推流的方法为:
取不同直播间roc曲线离(0,1)坐标最近点的阈值为该直播间推流概率值的阈值,若预测出的推流概率值大于等于该阈值,则预测结果为该时刻有推流,反之,则没有推流。
进一步地,所述计算各指标优化比例范围具体为:
通过向中控、主播、助播发问卷,得到评分者对各指标的评分矩阵;
采用变异系数法计算各指标的提升难易度权重w;
根据每个指标的提升难易度权重w,确定各指标的优化比例范围。
进一步地,所述生成对抗网络包括:生成器G和判别器D;训练所述生成对抗网络,需要计算网络本身的损失函数LGAN、限制优化范围的损失函数LB和生成器G生成的优化提升数据是否被预测为推流的损失函数LA
进一步地,训练所述生成对抗网络具体为:
将标签为未获得推流的数据t输入到生成器Gi中,生成第i个指标5分钟序列数据优化提升后的数据Gi(t),将真实数据t和所述生成数据Gi(t)输入到判别器D中,由D判断生成数据的真实性,计算损失函数L1;计算Gi(t)每分钟数据的最大指标优化比例ri,基于指标优化比例范围ci计算损失函数L2;将Gi(t)输入到所述卷积神经网络,卷积神经网络模型预测Gi(t)是否已经被优化到可能产生推流的状态,计算损失函数L3;计算总的损失函数为L=L1+M*L2+L3,M为一个较大的超参数,在计算总的损失函数后,采用误差反向传播算法来沿着总的损失函数的梯度方向更新判别器和生成器的参数。
进一步地,所述损失函数L1,L2,L3的公式为:
L1=E(t)[log(D(t))]+E(t)[log(1-D(G(t)))]
上述公式中,E(t)[log(D(t))]表示判别器D对真实数据t生成的判断结果,将真实数据越多地分类为1,判别器D的判断能力就越强,E(t)[log(1-D(G(t)))]中,D(G(t))表示对生成器生成的假数据G(t)通过判别器的判断结果,生成数据越多被分类为0,判别器的判断能力越强;生成器生成的数据越容易被判别器判断为1,生成器生成的数据就越真实;
L2=max(0,ri-ci,-ri)
上述公式表示,若优化比例ri不大于优化比例范围ci,且优化比例不为负,那么L2为0,否则为ri-ci和-ri中的最大值;
上述公式中,表示该批N个训练数据中的第i个数据生成结果通过一维卷积神经网络后的推流预测值,/>表示真实值1与/>的交叉熵在N个训练数据上的均值;进一步地,基于训练完成的一维卷积神经网络模型和训练完成的生成对抗网络模型,输出当前直播间可行的获得推流的自然流指标提升方案包括:
对开播的每一个直播间数据进行以下操作步骤:
获取正在开播的每一个直播间近5分钟内序列数据,并进行与训练数据相同的数据预处理;采用所述一维卷积神经网络模型进行预测,若当前不加以优化就被预测为有推流,则输出当前无需优化即可有推流;
将直播间近5分钟内序列数据输入到所述生成器G中,生成当前时刻各个指标的优化结果,若经过优化也没有出现推流,则输出没有可行的优化策略;若有可行的优化后推流的方案,则输出可行的优化策略集合,系统进行提示。
本发明的技术效果:
本发明具有以下几个方面的优点:
1.本发明能够实时发现直播间哪些自然流指标不足,为直播间提供即时的提升策略,具有实时性;
2.本发明将机器学习、深度学习算法应用到直播间,通过科学的计算给出具体的优化数值,为主播提出了具体的目标,具有科学性;
3.若按照本发明提出的策略去提升直播间指标,有超过70%的时刻能够在指标提升后,平台为直播间带来更多的自然流,具有准确性;
4.直播复盘能发现提出策略的时刻确实为前一段时间部分电商指标和互动指标比较低迷的时刻,为直播复盘提供了及时的策略帮助,具有有效性。
附图说明
附图大体上通过举例而不是限制的方式示出各种实施例,并且与说明书以及权利要求书一起用于对所发明的实施例进行说明。在适当的时候,在所有附图中使用相同的附图标记指代同一或相似的部分。这样的实施例是例证性的,而并非旨在作为本装置或方法的穷尽或排他实施例。
图1示出了本发明的技术方案示意图;
图2示出了本发明的生成对抗网络结构图;
图3示出了本发明的生成对抗网络训练流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图1-图3所示,本发明实施例提供一种直播间自然流指标优化提升策略计算方法,操作步骤为:
S1:该步骤获取系统所有直播间的历史数据。
本步骤从数据库中获取直播间的历史数据,筛选出自然流直播间;所述历史数据包括:自然流数据和商品信息;所述自然流数据指标包括:电商指标、互动指标、流量指标,所述电商指标包括成交金额、成交数量、成交人数、UV价值、千次观看成交金额和成交率;所述互动指标包括关注人数、加粉丝团人数、评论次数、关注率、互动率和用户停留时间;所述流量指标包括进入人数、离开人数、在线人数和曝光次数;所述商品信息包括:直播间在售卖的商品名称、商品价格、商品类目;
本发明适用于自然流优化,本步骤需要筛选出所有自然流直播间,排除付费广告投放的影响,去除错误数据,筛选后有529场可用直播数据,进入S2。
S2:该步骤处理上述数据,使之成为一维卷积神经网络(1DCNN)模型的训练输入
S21:本步骤需要对直播间获得系统自然推流(提高进入人数ENTER_UCNT,推流)进行定义,从而自动判断某时刻直播间是否迎来推流,为某时刻直播间打上0(推流)或1(未推流)的分类标签。本发明定义直播间推流的方法为:在连续的三个5分钟WATCH_UCNT的均值持续提高,设当前时间为t,即:
mean(ENTER_UCNTi,i∈(t-5,t])<mean(ENTER_UCNTi,i∈(t,t+5])<mean(ENTER_UCNTi,i∈(t+5,t+10]),自动打标签后,被分类为推流的数据约占总数据的10%。
S22:本步骤处理出上述电商指标、互动指标和流量指标在各时刻5分钟内的时间序列数据。
S23:本步骤将直播间的商品信息中的文字进行词向量嵌入,采用Skip-Gram模式进行Word2Vec训练,词向量的维度为100,直播间有多个商品的,对嵌入结果进行平均池化。商品信息嵌入结果与S22步骤中的指标5分钟时间序列数据进行拼接,作为卷积神经网络模型的输入。
S3:该步骤用一维卷积神经网络模型识别直播间指标与推流之间的关系。
本步骤训练一维卷积神经网络模型,该模型是一个二分类机器学习模型,训练该模型需要S2中的是否推流的标签(1代表推流,0代表非推流)和嵌入商品信息的5分钟序列数据,训练后的模型可以预测当前指标下直播间获得推流概率值([0,1]区间)。卷积神经网络隐藏层由3个卷积层、3个最大池化层和2个全连接层组成;第一卷积层,卷积核个数为128,每个卷积核的大小为3,步长为1,激活函数采用ReLU函数,采用全零填充;第一池化层,池化窗口大小为2,步长为2,第二卷积层,卷积核个数为256,每个卷积核的大小为3,步长为1,激活函数采用ReLU函数,采用全零填充;第二池化层,池化窗口大小为2,步长为2,第三卷积层,卷积核个数为512,每个卷积核的大小为3,步长为1,激活函数采用ReLU函数,采用全零填充;第三池化层,池化窗口大小为2,步长为2;第一全连接层,神经元个数为128,应用ReLU激活函数;第二全连接层,神经元个数为128,应用ReLU激活函数;输出层将长度为64的向量映射到标量,表示该数据迎来推流的概率;
训练开始前,需要将时间序列数据进行Min-Max归一化后,作为训练卷积神经网络模型的特征输入。将训练数据按照直播间分成训练集和测试集;在训练集上通过5折交叉验证进行训练和调参,设置每个batch的大小为64;采用Adam算法对网络参数进行迭代调整,使得损失函数值最小,初始学习率设置为0.01;模型在测试集上预测的整体auc=0.71。
取不同直播间roc曲线离(0,1)坐标最近点的阈值为该直播间推流概率值的阈值,若预测出的推流概率值大于等于该阈值,则预测结果为该时刻有推流,反之,则没有推流。本步骤最后将训练好的模型保存为本地模型文件,将各直播间阈值上传数据库,方便后续步骤调用。
S4:该步骤产生各指标化范围,即各指标提升的区间探索范围。
S41:本步骤通过向中控、主播、助播发问卷,调查在相同的提升比例条件下,哪些指标更容易提升,哪些指标更难提升,答卷者需要对指标进行打1-100分,容易提升的指标打分高。例如:分别将不同指标提升20%,如新增关注人数从100人提升至120人,平均观看时长从50秒提高至60秒,这两项目标难度各为多少?若认为新增关注人数从100人提升至120人较难,平均观看时长从50秒提高至60秒较容易,可以分别选择出60,40分。收到问卷结果后,得到第i个评分者对第j项指标的评分矩阵;
S42:采用变异系数法计算各指标的提升难易度权重w,具体步骤如下:计算第i个指标的评分均值和标准差si;计算第i个指标的变异系数/>对变异系数进行归一化处理,得到各指标的提升难易度权重/>发明内容在根据每个指标的提升难易度权重wi,确定所述指标的优化比例范围,优化比例的计算方式为:/>式中v′i表示提升值,vi表示原始值,当原始值为0时,vi表示该指标均值按照Min-Max归一化后的值;根据直播经验,每个指标平均提升10%是直播间可能实现的优化比例,在共有8个指标的情况下,假设权重为12.5%的指标优化范围为[0,10%],具体到每个指标,其优化比例范围为[0,ci],其中ci=10%+10%*(wi-12.5%)。
S5:该步骤用于训练生成对抗网络,以生成符合直播间需要的指标优化提升结果。
生成对抗网络训练过程具体为:将标签为未获得推流的数据t输入到生成器Gi中,生成第i个指标5分钟数据优化提升后的数据Gi(t),该数据中,第i个指标和与第i个指标相关的指标由模型生成,其余指标为原始数据,指标间相关关系见表1;将真实数据t和所述生成数据Gi(t)输入到判别器D中,由D判断生成数据的真实性,计算损失函数L1=E(t)[log(D(t))]+E(t)[log(1-D(G(t)))];计算Gi(t)的各指标5分钟数据最大的优化比例ri,基于指标优化比例范围ci计算损失函数L2=max(0,ri-ci),该损失函数表示,希望优化比例尽可能不大于指标i的扰动比例范围;将Gi(t)输入到所述卷积神经网络模型,卷积神经网络模型预测Gi(t)是否已经被优化到可能产生推流的状态,计算损失函数该公式是实际预测结果/>与真实标签1求交叉熵,/>被预测为1时,交叉熵为0,希望生成器生成数据尽可能多地被预测为有推流;总的损失函数为L=L1+M*L2+L3,M为一个较大的超参数,目的是保证生成数据尽可能满足不超过超参数ci确定的界限的要求;在计算损失函数后,采用误差反向传播算法来沿着损失函数的梯度方向更新判别器和生成器的参数;对抗训练的生成的数据能够尽可能满足两个方面,一是真实性,即与真实数据具有相同的分布,二是有效性,即在一个合理的比例范围内提高指标的值;
表1直播间优化指标与相关指标关系表
每个所述优化指标i各自有一个生成器Gi,负责生成当前时刻第i个指标和与第i个指标相关的指标;负责判断生成结果是否真实的判别器D由多个生成器Gi共用;所述生成器G的网络结构为:输入是一个真实数据t,所述生成器D包含输入层、4个隐藏层和输出层,每个隐藏层都包含一个线性变换和一个LeakyReLU激活函数;输入层输入是真实数据t;第1个隐藏层是一个128个神经元的线性层;第2个隐藏层是一个256个神经元的线性层;第3个隐藏层是一个512个神经元的线性层;第4个隐藏层是一个1024个神经元的线性层;最后,输出层通过一个线性变换被映射到输出维度向量,输出生成结果G(t);所述判别器接受真实数据t或生成数据G(t)的输入,包含2个隐藏层,每个隐藏层都包含一个线性变换和一个LeakyReLU激活函数;第1个隐藏层是一个512个神经元的线性层;第2个隐藏层是一个256个神经元的线性层;输出层通过一个线性变换和Sigmoid激活函数被映射到一个大小为1的标量值,这个标量值表示输入数据是真实数据的概率;
S6:本步骤用于判断当前直播间是否可以产生自然流指标优化提升策略,并向直播间反馈结果。该步骤是整个流程的实时步骤,每5分钟实时运行一次,输出到系统。
S61:该步骤获取正在开播的所有直播间近5分钟数据;嵌入直播间商品信息,与该直播间5分钟自然流指标进行拼接后,再进行Min-Max归一化,作为卷积神经网络推流预测模型的特征输入。
S62:本步骤用于判断在不进行优化的条件下是否迎来推流,需要获取训练好的模型和直播间推流概率阈值,预测该时刻的推流情况。如果是则不需要进行优化,输出该直播间当前将会迎来推流;如果否,则进入S63,对直播间数据进行优化。
S63:该步骤用于对正在开播的直播间近5分钟数据进行优化,预测优化后是否带来推流,输出到系统。该步骤以预测为不会迎来推流的数据t作为输入,通过S5训练得到的生成器Gi分别生成基于数据t的8个指标的优化数据Gi(t),通过卷积神经网络模型分别判断Gi(t)是否获得推流,输出可能产生推流的优化策略集合,反馈到系统进行提示。若经过优化也没有带来可行的推流策略,则输出该直播间暂无可行的优化策略。
实施例
本发明现已应用到400多个抖音直播间,以下描述以某美妆品牌直播间为例,该直播间4月26日下午15:30-17:00时间段在播,本发明应用于直播间的实时直播,实时记录本技术方案输出的可行优化提升策略如表2所示。
表2优化提升结果示例
该结果表示,在某个时刻过去的5分钟内的某项指标的均值如果得到一定的提升,未来会迎来推流,为直播间运营接下来的策略提供决策支持。例如15:38时提示过去5分钟平均观看时长需要从30提高到44,那么直播间就会采取一些措施留住用户,提高用户的平均观看时长,可以采取的措施有增加话术的循环周期,逼单、发福袋以提高用户停留时长等。
该结果在直播间实际应用中具有较强可行性:1.每分钟迭代一次,可以即时捕捉直播间潜在的推流;2.虽然每分钟都会迭代一次,但优化提升给出具体建议的频率大约为3-5分钟一次,频次适中,能够给直播间足够的调整优化时间;3.优化的比例合理,直播间可以在有限的能力范围内将这些指标进行提升;4.大多数有提供策略的时刻都不止提出一种策略,可以有多种策略供技术方案的使用者根据直播间实际情况进行选择。
以上所述,仅为本发明优选的具体实施方式,但本发明的保护范围不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种直播间自然流指标优化提升策略计算方法,其特征在于,所述方法包括:获取直播间的历史数据,筛选出自然流直播间;所述历史数据包括:自然流数据和商品信息;所述自然流数据指标包括电商指标、互动指标、流量指标,所述电商指标包括成交金额、成交数量、成交人数、UV价值、千次观看成交金额和成交率;所述互动指标包括关注人数、加粉丝团人数、评论次数、关注率、互动率和用户停留时间;所述流量指标包括进入人数、离开人数、在线人数和曝光次数;所述商品信息包括:直播间在售卖的商品名称、商品价格、商品类目;
定义直播间推流并对历史数据进行数据预处理;
基于预处理后的数据和直播间是否推流训练一维卷积神经网络模型;
计算各指标优化比例范围;
基于预处理后的数据、训练完成的一维卷积神经网络模型和各指标可优化比例范围训练生成对抗网络;
基于训练完成的一维卷积神经网络模型和训练完成的生成对抗网络模型,输出当前直播间可行的获得推流的自然流指标提升方案;
所述直播间推流的定义方法为:在连续的三个5分钟内直播间进入人数的均值持续提高,设当前时间为t,即:
mean(ENTER_UCNTi,i∈(t-5,t])<mean(ENTER_UCNTi,i∈(t,t+5])<mean(ENTER_UCNTi,i∈(t+5,t+10]);所述ENTER_UCNT为直播间进入人数。
2.根据权利要求1所述的直播间自然流指标优化提升策略计算方法,其特征在于,所述对历史数据进行数据预处理具体为:
获取得到电商指标、互动指标和流量指标在各时刻近5分钟内时间序列数据以及词向量嵌入后的直播间商品信息;
将直播间的商品信息中的文字进行词向量嵌入,采用Skip-Gram模式进行Word2Vec训练,词向量的维度为100,直播间有多个商品的,对嵌入结果进行平均池化;
将商品信息嵌入结果与所述指标5分钟时间序列数据进行拼接,作为卷积神经网络模型的输入数据。
3.根据权利要求1所述的直播间自然流指标优化提升策略计算方法,其特征在于,基于预处理后的数据和直播间是否推流训练一维卷积神经网络具体为:
将输入数据分成训练集和测试集;通过5折交叉验证进行训练和调参;设置每个batch的大小为64;采用Adam算法对网络参数进行迭代调整,使得损失函数值最小,初始学习率设置为0.01;模型在测试集上预测的整体auc=0.71。
4.根据权利要求1所述的直播间自然流指标优化提升策略计算方法,其特征在于,所述一维卷积神经网络模型的网络结构如下:卷积神经网络隐藏层由3个卷积层、3个最大池化层和2个全连接层组成;第一卷积层,卷积核个数为128,每个卷积核的大小为3,步长为1,激活函数采用ReLU函数,采用全零填充;第一池化层,池化窗口大小为2,步长为2,第二卷积层,卷积核个数为256,每个卷积核的大小为3,步长为1,激活函数采用ReLU函数,采用全零填充;第二池化层,池化窗口大小为2,步长为2,第三卷积层,卷积核个数为512,每个卷积核的大小为3,步长为1,激活函数采用ReLU函数,采用全零填充;第三池化层,池化窗口大小为2,步长为2;第一全连接层,神经元个数为128,应用ReLU激活函数;第二全连接层,神经元个数为128,应用ReLU激活函数;输出层将长度为64的向量映射到标量,表示该数据迎来推流的概率。
5.根据权利要求1所述的直播间自然流指标优化提升策略计算方法,其特征在于,所述计算各指标优化比例范围具体为:
通过向中控、主播、助播发问卷,得到评分者对各指标的评分矩阵;
采用变异系数法计算各指标的提升难易度权重w;
根据每个指标的提升难易度权重w,确定各指标的优化比例范围。
6.根据权利要求1所述的直播间自然流指标优化提升策略计算方法,其特征在于,所述生成对抗网络包括:生成器G和判别器D;训练所述生成对抗网络,需要计算网络本身的损失函数LGAN、限制优化范围的损失函数LB和生成器G生成的优化提升数据是否被预测为推流的损失函数LA
7.根据权利要求6所述的直播间自然流指标优化提升策略计算方法,其特征在于,训练所述生成对抗网络具体为:
将标签为未获得推流的数据t输入到生成器Gi中,生成第i个指标5分钟序列数据优化提升后的数据Gi(t),将真实数据t和所述生成数据Gi(t)输入到判别器D中,由D判断生成数据的真实性,计算损失函数L1;计算Gi(t)每分钟数据的最大指标优化比例ri,基于指标优化比例范围ci计算损失函数L2;将Gi(t)输入到所述一维卷积神经网络,卷积神经网络模型预测Gi(t)是否已经被优化到可能产生推流的状态,计算损失函数L3;计算总的损失函数为L=L1+M*L2+L3,M为一个较大的超参数,在计算总的损失函数后,采用误差反向传播算法来沿着总的损失函数的梯度方向更新判别器和生成器的参数。
8.根据权利要求7所述的直播间自然流指标优化提升策略计算方法,其特征在于,
所述损失函数L1,L2,L3的公式为:
L1=E(t)[log(D(t))]+E(t)[log(1-D(G(t)))]
上述公式中,E(t)[log(D(t))]表示判别器D对真实数据t生成的判断结果,将真实数据越多地分类为1,判别器D的判断能力就越强,E(t)[log(1-D(G(t)))]中,D(G(t))表示对生成器生成的假数据G(t)通过判别器的判断结果,生成数据越多被分类为0,判别器的判断能力越强,反之,生成器生成的数据就越真实;
L2=max(0,ri-ci,-ri)
上述公式表示,若优化比例ri不大于优化比例范围ci,且优化比例不为负,那么L2为0,否则为ri-ci和-ri中的最大值;
上述公式中,表示N个训练数据中的第i个数据生成结果通过一维卷积神经网络后的预测值,/>表示真实值1与/>的交叉熵在N个训练数据上的均值。
9.根据权利要求1所述的直播间自然流指标优化提升策略计算方法,其特征在于,基于训练完成的一维卷积神经网络模型和训练完成的生成对抗网络模型,输出当前直播间可行的获得推流的自然流指标提升方案包括:
获取正在开播的每一个直播间当前5分钟内数据,做与训练数据相同的数据预处理;采用所述一维卷积神经网络模型进行预测,若当前不加以优化就被预测为有推流,则输出当前无需优化即可有推流;
将当前直播间数据输入到所述生成器G中,生成当前时刻各个指标的优化结果,若经过优化也没有出现推流,则输出没有可行的优化策略;若有可行的优化后推流的方案,则输出可行的优化策略集合,系统进行提示。
CN202311447972.0A 2023-11-01 2023-11-01 一种直播间自然流指标优化提升策略计算方法 Active CN117425020B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311447972.0A CN117425020B (zh) 2023-11-01 2023-11-01 一种直播间自然流指标优化提升策略计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311447972.0A CN117425020B (zh) 2023-11-01 2023-11-01 一种直播间自然流指标优化提升策略计算方法

Publications (2)

Publication Number Publication Date
CN117425020A CN117425020A (zh) 2024-01-19
CN117425020B true CN117425020B (zh) 2024-05-17

Family

ID=89532367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311447972.0A Active CN117425020B (zh) 2023-11-01 2023-11-01 一种直播间自然流指标优化提升策略计算方法

Country Status (1)

Country Link
CN (1) CN117425020B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458360A (zh) * 2019-08-13 2019-11-15 腾讯科技(深圳)有限公司 热门资源的预测方法、装置、设备及存储介质
CN111882358A (zh) * 2020-07-30 2020-11-03 杭州翔毅科技有限公司 基于直播平台的数据管控方法、设备、存储介质及装置
CN113256038A (zh) * 2021-07-15 2021-08-13 腾讯科技(深圳)有限公司 一种数据处理方法、设备以及计算机可读存储介质
CN115879972A (zh) * 2022-03-14 2023-03-31 杭州鸭梨互动网络科技有限公司 一种用于电商平台定向分析与预测的数据处理方法
CN116777555A (zh) * 2023-06-19 2023-09-19 浙江青眼传媒有限公司 基于卷积神经网络搭建推荐模型的数据营销方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10803111B2 (en) * 2017-11-27 2020-10-13 Facebook, Inc. Live video recommendation by an online system
US20230267734A1 (en) * 2022-02-23 2023-08-24 Dell Products L.P. Information Extraction from Live Online Sessions

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458360A (zh) * 2019-08-13 2019-11-15 腾讯科技(深圳)有限公司 热门资源的预测方法、装置、设备及存储介质
CN111882358A (zh) * 2020-07-30 2020-11-03 杭州翔毅科技有限公司 基于直播平台的数据管控方法、设备、存储介质及装置
CN113256038A (zh) * 2021-07-15 2021-08-13 腾讯科技(深圳)有限公司 一种数据处理方法、设备以及计算机可读存储介质
CN115879972A (zh) * 2022-03-14 2023-03-31 杭州鸭梨互动网络科技有限公司 一种用于电商平台定向分析与预测的数据处理方法
CN116777555A (zh) * 2023-06-19 2023-09-19 浙江青眼传媒有限公司 基于卷积神经网络搭建推荐模型的数据营销方法及系统

Also Published As

Publication number Publication date
CN117425020A (zh) 2024-01-19

Similar Documents

Publication Publication Date Title
CN110888857B (zh) 基于神经网络的数据标签生成方法、装置、终端及介质
WO2021143396A1 (zh) 利用文本分类模型进行分类预测的方法及装置
Kim et al. The cluster-indexing method for case-based reasoning using self-organizing maps and learning vector quantization for bond rating cases
CN111369016B (zh) 一种基于图像识别的现场运维方法及系统
TWI242724B (en) Methods and systems for optimizing return and present value
US8706670B2 (en) Relative variable selection system and selection method thereof
CN113011895B (zh) 关联账户样本筛选方法、装置和设备及计算机存储介质
Majumder et al. Forecasting of Indian stock market index using artificial neural network
CN116595328B (zh) 一种基于知识图谱的数据评分卡模型智能构建装置及方法
CN110222149A (zh) 一种基于新闻舆情的时间序列预测方法
Saha et al. Demand forecasting of a multinational retail company using deep learning frameworks
AU2019101160A4 (en) Application of decision tree and random forest in cash loan
CN117425020B (zh) 一种直播间自然流指标优化提升策略计算方法
Yinka-Banjo et al. Stock Market Prediction Using a Hybrid of Deep Learning Models
CN116843483A (zh) 一种车险理赔方法、装置、计算机设备及存储介质
Desai et al. Forecasting of Indian stock market index S&P CNX Nifty 50 using artificial intelligence
KR20230109070A (ko) 이커머스 데이터 기반 신용 평가 스코어 카드 결정 방법 및 이러한 방법을 수행하는 장치
CN112200215B (zh) 标签特征提取方法、装置、存储介质与电子设备
Honjo et al. CNN-GRU Based Deep Learning Model for Demand Forecast in Retail Industry
CN114529063A (zh) 一种基于机器学习的金融领域数据预测方法、设备及介质
KR101982636B1 (ko) 기업실적 예측모델 생성 방법 및 장치
CN112329917A (zh) 面向限价委托单趋势预测的多层神经网络集成系统及方法
Khanarsa et al. Self-identification deep learning ARIMA
Kousalya et al. Terrain identification and land price estimation using deep learning
SARAÇLAR et al. Text2Price: Deep Learning for Price Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant