CN116962750A - 基于全景视频的广告推送方法、装置、设备及存储介质 - Google Patents
基于全景视频的广告推送方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116962750A CN116962750A CN202211413970.5A CN202211413970A CN116962750A CN 116962750 A CN116962750 A CN 116962750A CN 202211413970 A CN202211413970 A CN 202211413970A CN 116962750 A CN116962750 A CN 116962750A
- Authority
- CN
- China
- Prior art keywords
- advertisement
- information
- panoramic video
- item
- article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 113
- 238000001514 detection method Methods 0.000 claims description 61
- 230000015654 memory Effects 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 230000006399 behavior Effects 0.000 claims description 14
- 238000010276 construction Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000002123 temporal effect Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 description 17
- 238000003062 neural network model Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 10
- 230000008901 benefit Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 230000005291 magnetic effect Effects 0.000 description 5
- 238000009877 rendering Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 230000008034 disappearance Effects 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000035807 sensation Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000005294 ferromagnetic effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000011551 log transformation method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/21805—Source of audio or video content, e.g. local disk arrays enabling multiple viewpoints, e.g. using a plurality of cameras
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/2343—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
- H04N21/25891—Management of end-user data being end-user preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/812—Monomedia components thereof involving advertisement data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/816—Monomedia components thereof involving special video data, e.g 3D video
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Multimedia (AREA)
- Finance (AREA)
- Signal Processing (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Graphics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种基于全景视频的广告推送方法、装置、设备及存储介质,其中,所述方法包括:解析全景视频,得到至少一个二维图像序列;对每一所述二维图像序列进行物品检测,得到所述全景视频中至少一个第一物品中每一所述第一物品的物品数据;所述物品数据包括所述第一物品的物品信息和所述第一物品在所述全景视频中的时空信息;针对每一所述第一物品,基于所述第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息,确定每一所述候选广告的点击率;基于每一所述第一物品在所述全景视频中的时空信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告和所述待推送广告的推送信息。
Description
技术领域
本申请涉及但不限于数据处理技术领域,尤其涉及一种基于全景视频的广告推送方法、装置、设备及存储介质。
背景技术
VR全景视频是视频点播与VR技术的结合,是VR内容的主要表现形式。当用户通过VR头盔观看时,可选择任意角度自由观看,体验身临其境的沉浸感。VR全景视频依赖于专业设备进行拍摄,在同时捕获多角度影像之后,还需经过拼接等后期处理,才能确保每一帧都是360度全景画面。相关技术中未出现VR全景视频场景下的智能广告推荐方案,相应的广告推送只能依靠人工推送或随机推送。
发明内容
有鉴于此,本申请实施例至少提供一种基于全景视频的广告推送方法、装置、设备及存储介质。
本申请实施例的技术方案是这样实现的:
一方面,本申请实施例提供一种基于全景视频的广告推送方法,所述方法包括:
解析全景视频,得到至少一个二维图像序列;
对每一所述二维图像序列进行物品检测,得到所述全景视频中至少一个第一物品中每一所述第一物品的物品数据;所述物品数据包括所述第一物品的物品信息和所述第一物品在所述全景视频中的时空信息;
针对每一所述第一物品,基于所述第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息,确定每一所述候选广告的点击率;
基于每一所述第一物品在所述全景视频中的时空信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告和所述待推送广告的推送信息。
在一些实施例中,所述二维图像序列包括具有时序的多个二维图像;所述对每一所述二维图像序列进行物品检测,得到所述全景视频中至少一个第一物品中每一所述第一物品的物品数据,包括:
针对每一所述二维图像序列,基于流模型的视频目标检测算法对所述二维图像序列进行物品检测,得到所述二维图像序列中多个第二物品中每一所述第二物品的物品检测结果;所述物品检测结果包括所述第二物品所在二维图像对应的时序编号和物品类别;
基于所述第二物品所在的二维图像的时序编号,对所述多个第二物品进行筛选,得到所述全景视频中的所述第一物品;
基于所述第一物品的物品检测结果确定所述第一物品的物品数据。
在一些实施例中,所述基于所述第二物品所在的二维图像的时序编号,对所述多个第二物品进行筛选,得到所述全景视频中的所述第一物品,包括:
基于每一所述第二物品所在的二维图像的时序编号,确定每一所述第二物品的持续出现时间;
基于每一所述第二物品的持续出现时间和预设的时间阈值,在所述多个第二物品确定所述第一物品。
在一些实施例中,所述基于所述第一物品的物品检测结果确定所述第一物品的物品数据,包括:
基于所述第一物品所在二维图像对应的物品类别,确定所述第一物品的物品信息;
基于所述第一物品所在二维图像序列对应的视角和所述第一物品所在二维图像对应的时序编号,确定所述第一物品的时空信息。
在一些实施例中,所述时空信息包括时间信息和方位信息;所述基于所述第一物品所在二维图像序列对应的视角和所述第一物品所在二维图像对应的时序编号,确定所述第一物品的时空信息,包括:
基于所述第一物品所在二维图像序列对应的视角确定所述第一物品的方位信息;
基于所述第一物品所在二维图像对应的时序编号确定所述第一物品的时间信息。
在一些实施例中,所述基于所述第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息,确定每一所述候选广告的点击率,包括:
通过特征工程分别对所述物品信息、所述用户信息和每一所述广告信息进行特征构建,得到所述第一物品的物品特征、所述用户的用户特征和每一所述候选广告的广告特征;
基于至少一个预测模型对所述第一物品的物品特征、所述用户的用户特征和每一所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的点击率。
在一些实施例中,所述基于至少一个预测模型对所述第一物品的物品特征、所述用户的用户特征和每一所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的点击率,包括:
通过神经网络模型对所述第一物品的物品特征、所述用户的用户特征和所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的第一预测结果;
通过线性回归模型对所述第一物品的物品特征、所述用户的用户特征和所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的第二预测结果;
融合每一所述候选广告的所述第一预测结果和所述第二预测结果,得到每一所述候选广告的点击率。
在一些实施例中,所述时空信息包括时间信息和方位信息,所述基于每一所述第一物品在所述全景视频中的时空信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告和所述待推送广告的推送信息,包括:
基于每一所述第一物品在所述全景视频中的时间信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告;
基于所述待推送广告对应的第一物品的时间信息和方位信息,确定所述待推送广告的推送信息。
在一些实施例中,所述基于每一所述第一物品在所述全景视频中的时间信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告,包括:
基于每一所述第一物品在所述全景视频中的时间信息确定至少一个推送时间点;
针对每一所述推送时间点,基于所述推送时间点中每一所述第一物品对应的各所述候选广告的点击率,确定每一所述推送时间点对应的最大点击率广告;
基于每一所述推送时间点对应的最大点击率广告,确定所述全景视频对应的待推送广告。
在一些实施例中,所述基于每一所述推送时间点对应的最大点击率广告,确定所述全景视频对应的待推送广告,包括:
基于每一所述推送时间点对应的最大点击率广告,确定所述全景视频对应的广告数量;
在所述广告数量超过所述全景视频对应的广告数量阈值的情况下,将点击率最大的预设数量个最大点击率广告作为所述全景视频对应的待推送广告。
在一些实施例中,所述推送信息包括推送时间和推送位置;所述基于所述待推送广告对应的第一物品的时间信息和方位信息,确定所述待推送广告的推送信息,包括:
基于所述待推送广告对应的第一物品的时间信息,确定所述待推送广告的推送时间;
基于所述待推送广告对应的第一物品的方位信息,确定所述待推送广告的推送位置。
在一些实施例中,所述方法还包括:
在展示所述全景视频给所述当前用户的过程中,基于所述当前用户的行为信息和待推送广告的推送信息,在所述待推送广告中确定需要推送的目标广告;
按照所述目标广告的推送信息,展示所述目标广告。
在一些实施例中,所述行为信息包括所述全景视频的展示时间和所述当前用户的停留视角,所述基于所述当前用户的行为信息和待推送广告的推送信息,在所述待推送广告中确定需要推送的目标广告,包括:
获取所述待推送广告的推送信息;所述推送信息包括所述推送时间、推送位置;
基于所述全景视频的展示时间和所述当前用户的停留视角,和所述待推送广告的推送信息,在所述待推送广告中确定所述目标广告;所述目标广告的推送时间与所述全景视频的展示时间相同,且所述目标广告的推送位置和所述当前用户的停留视角匹配。
在一些实施例中,所述按照所述目标广告的推送信息,展示所述目标广告,包括:
在所述全景视频的展示时间对应多个目标广告的情况下,展示点击率最大的目标广告。
在一些实施例中,所述按照所述目标广告的推送信息,展示所述目标广告,包括:
在不存在其他广告正在展示的情况下,按照所述目标广告的推送信息,展示所述目标广告。
在一些实施例中,所述全景视频包括具有时序的多个三维全景图像;所述解析全景视频,得到至少一个二维图像序列,包括:
针对所述全景视频中的每一帧三维全景图像,将所述三维全景图像渲染于球形模型上,通过滑窗法调整截图相机视角,并获取至少一个视角对应的二维图像;所述截图相机位于所述球形模型的球心;
针对每一所述视角,基于每一所述三维全景图像的时序编号,和每一所述三维全景图像中所述视角对应的二维图像,构建所述视角对应的二维图像序列。
在一些实施例中,所述通过预设的截图相机获取每一所述视角对应的二维图像,包括:
获取每一所述视角对应的水平视场角和垂直视场角;
基于每一所述视角对应的水平视场角和垂直视场角,调整所述截图相机与所述球形模型的相对方向,并获取每一所述视角对应的二维图像。
另一方面,本申请实施例提供一种基于全景视频的广告推送装置,所述装置包括:
解析模块,用于解析全景视频,得到至少一个二维图像序列;
检测模块,用于对每一所述二维图像序列进行物品检测,得到所述全景视频中至少一个第一物品中每一所述第一物品的物品数据;所述物品数据包括所述第一物品的物品信息和所述第一物品在所述全景视频中的时空信息;
第一确定模块,用于针对每一所述第一物品,基于所述第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息,确定每一所述候选广告的点击率;
第二确定模块,用于基于每一所述第一物品在所述全景视频中的时空信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告和所述待推送广告的推送信息。
再一方面,本申请实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的部分或全部步骤。
又一方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的部分或全部步骤。
本申请实施例中,通过将全景视频转换为至少一个视角的二维图像序列,相比于直接基于全景视频的广告推送方法,由于将三维信息转换为二维信息,降低了系统计算量的同时,还可以一定程度的提升预测准确率;同时,由于基于检测到的物品信息、用户信息和广告信息,确定各个候选广告的点击率,可以更加精准的预测不同用户的广告偏好;同时,结合第一物品的时空信息和每一所述第一物品对应的各所述候选广告的点击率,可以更加准确的预测广告的最佳推送时机,提升了广告推送效率,避免了因广告无效推送而造成的服务器负担,也减少了用户终端解码不需要观看的广告时的计算资源占用量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本申请的技术方案。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。
图1A为本申请实施例提供的一种全景视频观看原理示意图;
图1B为本申请实施例提供的一种全景画面在平铺状态下的示意图;
图1C为本申请实施例提供的一种基于全景视频的广告推送方法的实现流程示意图;
图2为本申请实施例提供的一种基于全景视频的广告推送方法的实现流程示意图;
图3为本申请实施例提供的一种基于全景视频的广告推送方法的实现流程示意图;
图4为本申请实施例提供的一种基于全景视频的广告推送方法的实现流程示意图;
图5为本申请实施例提供的一种基于全景视频的广告推送方法的实现流程示意图;
图6为本申请实施例提供的一种基于全景视频的广告推送方法的实现流程示意图;
图7为本申请实施例提供的一种基于全景视频的广告推送方法的实现流程示意图;
图8为本申请实施例提供的一种点击率预测方案示意图;
图9为本申请实施例提供的一种基于全景视频的广告推送装置的组成结构示意图;
图10为本申请实施例提供的一种计算机设备的硬件实体示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图和实施例对本申请的技术方案进一步详细阐述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。所涉及的术语“第一/第二/第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一/第二/第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请的目的,不是旨在限制本申请。
随着5G时代的到来,VR迎来高速发展机遇。5G具备高速度、大流量、低延迟、多连接等诸多革新,在5G时代,高速率和低延时的传输特性有望显著提升VR产品的用户体验;5G+云渲染大幅提升应用显示效果,降低硬件成本,助力VR普及。技术创新持续取得突破,不断推动产品升级,为VR的普及进一步扫清障碍。国际巨头加速布局,产业生态正逐步建设完善,VR在科技、视频、游戏等众多领域具备广阔的应用前景,中国在VR领域占据全球重要席位。同时,VR内容生态趋于完善,广阔应用市场打开。随着VR应用的逐步落地VR/AR作为工具的实用性逐渐凸显,并在视频、营销、音乐和游戏市场展现出相当大应用潜力,有望推动下一代互动娱乐产业的革命性变革。
VR全景视频是视频点播与VR技术的结合,是VR内容的主要表现形式。当用户通过VR头盔观看时,可选择任意角度自由观看,体验身临其境的沉浸感。VR全景视频依赖于专业设备进行拍摄,在同时捕获多角度影像之后,还需经过拼接等后期处理,才能确保每一帧都是360度全景画面。请参阅图1A,其示出了一种全景视频观看原理示意图。其中,用户在观看时,置于球形区域110中央,可以任意在拍摄角度周围360度地观看动态视频,而不受时间、空间和地域的限制,有一种身临其境的感受。如图1A所示,用户当前的视角可以观看的动态视频为阴影区域120。同时,全景视频具有景深、动态图像、声音等因子,具备声画对位、声画同步的特性,有着良好的沉浸感。全景视频需要通过专门的全景播放器来播放,这种播放器需要结合姿态传感器的数据动态调整,然后贴在一个球体的表面。若用传统视频播放器播放全景视频,将会出现扭曲状,如图1B所示,不能正常观看全景内容。
相关技术中未出现VR全景视频场景下的智能广告推荐方案,相应的广告推送只能依靠人工推送或随机推送。可以看出,相关技术中存在以下问题:(1)人工推送工作量较大,且专业度低,人为随机性大,且无法做到个性化差异化推荐;(2)随机推送无法与全景视频内容相结合,推送时间、推送广告选择随意,用户体验差,且广告点击率低。
本申请实施例提供一种基于全景视频的广告推送方法,该方法可以由计算机设备的处理器执行。其中,计算机设备指的可以是服务器、笔记本电脑、平板电脑、台式计算机、智能电视、机顶盒、移动设备(例如移动电话、便携式视频播放器、个人数字助理、专用消息设备、便携式游戏设备)等具备数据处理能力的设备。图1C为本申请实施例提供的一种基于全景视频的广告推送方法的实现流程示意图,如图1C所示,该方法包括如下步骤S101至步骤S104:
步骤S101、解析全景视频,得到至少一个二维图像序列。
在一些实施例中,该全景视频是一种用3D摄像机进行全方位360度进行拍摄的视频,用户在观看视频的时候,可以随意调节视频上下左右进行观看。其中,该全景视频可以包括具有时序的多个全景图像,该全景图像展示于平面播放器的情况下,展示效果如图1B所示。
在一些实施例中,可以通过模拟全景视频的实际播放过程,并通过截图相机对播放中的全景视频进行录制,得到二维视频,该二维视频对应该二维图像序列。其中,可以为截图相机设置不同视角,针对每一个视角,可以得到一个二维图像序列,进而可以得到上述至少一个二维图像序列。
步骤S102、对每一所述二维图像序列进行物品检测,得到所述全景视频中至少一个第一物品中每一所述第一物品的物品数据;所述物品数据包括所述第一物品的物品信息和所述第一物品在所述全景视频中的时空信息。
在一些实施例中,可以通过预设的对象检测算法对每一二维图像序列进行检测,得到二维图像序列中存在的每一第一物品对应的物品数据。由于被检测的是二维图像序列,即视频数据,因此该对象检测算法可以为视频对象检测算法,该视频对象检测算法可以但不限于是后处理方法、基于追踪方法、循环神经网络方法,特征传播方法,基于光流的多帧特征聚合方法,不基于光流的特征聚合方法。示例性的,该视频对象检测算法为flow-based视频对象检测算法。
其中,上述第一物品的物品数据可以包括第一物品的物品信息,该物品信息用于表征该第一物品的属性信息;该物品数据还包括该第一物品在全景视频中的时空信息,该时空信息可以包括时间信息和方位信息,该时间信息表征该第一物品在该全景视频中出现的时间,该方位信息表征该第一物品在所述全景视频中的相对方向。
步骤S103、针对每一所述第一物品,基于所述第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息,确定每一所述候选广告的点击率。
其中,所述候选广告对应的点击率用于表征所述全景视频中存在所述第一物品时推送所述候选广告,所述当前用户点击所述候选广告的概率。
在一些实施例中,可以将第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息输入至经过预训练的神经网络模型,得到神经网络模型输出的每一所述候选广告的点击率。
在一些实施例中,还可以将第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息输入至已配置线性参数的线性回归模型,得到线性回归模型输出的每一所述候选广告的点击率。
步骤S104、基于每一所述第一物品在所述全景视频中的时空信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告和所述待推送广告的推送信息。
在一些实施例中,为了在最合适的时机推送更符合用户喜好的广告,可以基于上述步骤S102和步骤S103中得到的信息,在每一第一物品对应的各所述候选广告中确定需要推送的待推送广告。
其中,考虑到各候选广告的点击率可以表征全景视频中存在所述第一物品时推送所述候选广告,所述当前用户点击所述候选广告的概率。在一些实施例中,可以统计全景视频中每一候选广告对应的点击率,将点击率最高的至少一个候选广告作为该待推送广告。在另一些实施例中,由于每一第一物品对应多个候选广告,针对每一所述第一物品,可以基于该第一物品对应的每一候选广告的点击率,将点击率最高的候选广告作为该第一物品对应的待推送广告,进而可以得到每一第一物品对应的待推送广告。
其中,考虑到每一第一物品在该全景视频中的时空信息也会影响用户点击该第一物品对应的广告的概率,以时间信息为例,基于当前用户的用户习惯(或统计得到的经验信息),若第一物品出现在该全景视频的开始或结尾,当前用户点击该第一物品对应的广告的概率较高;若第一物品出现在该全景视频的中间,当前用户点击该第一物品对应的广告的概率较低。以方位信息为例,若第一物品出现在该全景视频的顶部或底部(如图1A中的球形区域的顶部或底部),当前用户点击该第一物品对应的广告的概率较低;若第一物品出现在该全景视频的中部(如图1A中的阴影区域),当前用户点击该第一物品对应的广告的概率较高。
在一些实施例中,针对每一第一物品,可以基于所述第一物品在所述全景视频中的时空信息,将时间信息位于目标时间区间的候选广告作为所述第一物品的待推送广告;还可以基于第一物品在所述全景视频中的方位信息,将方位信息位于目标方位区间的候选广告作为所述第一物品的待推送广告。
在一些实施例中,可以同时基于每一所述第一物品在所述全景视频中的时空信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告。
在一些实施例中,在确定待推送广告之后,可以确定该待推送广告对应的第一物品,进而基于该第一物品在所述全景视频中的时空信息,确定待推送广告的推送信息。
本申请实施例中,通过将全景视频转换为至少一个二维图像序列,相比于直接基于全景视频的广告推送方法,由于将三维信息转换为二维信息,降低了系统计算量的同时,还可以一定程度的提升预测准确率;同时,由于基于检测到的物品信息、用户信息和广告信息,确定各个候选广告的点击率,可以更加精准的预测不同用户的广告偏好;同时,结合第一物品的时空信息和每一所述第一物品对应的各所述候选广告的点击率,可以更加准确的预测广告的最佳推送时机,提升了广告推送效率,避免了因广告无效推送而造成的服务器负担,也减少了用户终端解码不需要观看的广告时的计算资源占用量。
图2是本申请实施例提供的基于全景视频的广告推送方法的一个可选的流程示意图,该方法可以由计算机设备的处理器执行。基于图1C,所述二维图像序列包括具有时序的多个二维图像;图1C中的S102可以更新为S201至S203,将结合图2示出的步骤进行说明。
步骤S201、针对每一所述二维图像序列,基于流模型的视频目标检测算法对所述二维图像序列进行物品检测,得到所述二维图像序列中多个第二物品中每一所述第二物品的物品检测结果;所述物品检测结果包括所述第二物品所在二维图像对应的时序编号和物品类别。
在一些实施例中,相比于图片,视频多了一个时间维度,大多数帧的信息都是冗余的,并且目标外观特征信息不充分,因此大大增加了目标检测的计算量,并且降低了目标检测的精度。而通过Flow-based的方法,可以很自然的减少视频目标检测的冗余计算并且缓解目标外观特征退化的问题。该基于流模型(flow-based)的视频目标检测算法可以但不限于是:DFF(Deep Feature Flow for Video Recognition)、FGFA(Flow-Guided FeatureAggregation for Video Object Detection)、THP(Towards High Performance VideoObject Detection)和THPM(Towards High Performance Video Object Detection forMobiles)。
在一些实施例中,针对每一个二维图像序列,该二维图像序列包括具有时序的多个二维图像。其中,该二维图像序列中的每一二维图像均对应一个时序编号。经过上述基于流模型的视频目标检测算法的物品检测之后,可以得到该二维图像序列中出现的每一第二物品的二维图像的时序编号,和每一第二物品的物品类别。
示例性的,若存在第二物品A,该第二物品A出现在第56帧至第98帧中,则该第二物品对应的时序编号为[56,98]的集合。
步骤S202、基于所述第二物品所在的二维图像的时序编号,对所述多个第二物品进行筛选,得到所述全景视频中的所述第一物品。
在一些实施例中,可以将时序编号位于目标时序区间的第二物品作为该第一物品。其中,该目标时序区间和上述目标时间区间存在映射关系,即,可以通过该二维图像序列的帧率,将该目标时序区间转换为上述目标时间区间。
在另一些实施例中,可以通过步骤S2021至步骤S2022实现上述基于所述第二物品所在的二维图像的时序编号,对所述多个第二物品进行筛选,得到所述全景视频中的所述第一物品。
步骤S2021、基于每一所述第二物品所在的二维图像的时序编号,确定每一所述第二物品的持续出现时间。
其中,可以基于该二维图像序列的帧率,将该第二物品所在的二维图像的时序编号,转换为该第二物品的持续出现时间。
步骤S2022、基于每一所述第二物品的持续出现时间和预设的时间阈值,在所述多个第二物品确定所述第一物品。
其中,该时间阈值可以设置为5秒。将持续出现时间超过5秒的第二物品作为该第一物品。
步骤S203、基于所述第一物品的物品检测结果确定所述第一物品的物品数据。
在一些实施例中,可以通过步骤S2031至步骤S2032实现上述基于所述第一物品的物品检测结果确定所述第一物品的物品数据。
步骤S2031、基于所述第一物品所在二维图像对应的物品类别,确定所述第一物品的物品信息。
步骤S2032、基于所述第一物品所在二维图像序列对应的视角和所述第一物品所在二维图像对应的时序编号,确定所述第一物品的时空信息。
其中,所述时空信息包括时间信息和方位信息。可以基于所述第一物品所在二维图像序列对应的视角确定所述第一物品的方位信息;基于所述第一物品所在二维图像对应的时序编号确定所述第一物品的时间信息。其中,二维图像序列对应的视角为在全景视频中采集该二维图像序列过程中截图相机的视角。
本申请实施例中,通过基于二维图像序列进行检测,不同于现有的方案(拆解为单张图像分别检测),一方面能解决视频中由于物体运动、摄像头失焦产生的图像模糊,还有目标物体被遮挡、姿势转变引起的外观变化、远近引起的尺寸大小变化等情况,提升检测精度;另一方面,通过Flow-based的视频目标检测算法无需每帧检测,利用前后帧的相似信息进行简化,大幅度减少计算量。
图3是本申请实施例提供的基于全景视频的广告推送方法的一个可选的流程示意图,该方法可以由计算机设备的处理器执行。基于图1C,图1C中的S103可以更新为S301至S302,将结合图3示出的步骤进行说明。
步骤S301、通过特征工程分别对所述物品信息、所述用户信息和每一所述广告信息进行特征构建,得到所述第一物品的物品特征、所述用户的用户特征和每一所述候选广告的广告特征。
其中,特征工程(Feature Engineering)是将原始数据转化成更好的表达问题本质的特征的过程,使得将这些特征运用到预测模型中能提高对不可见数据的模型预测精度。简言之,将对因变量y有明显影响作用的特征称自变量x,自变量x为特征,特征工程的目的是发现这些特征。由于好的特征具有更强的灵活性,可以用简单的模型做训练,更可以得到优秀的结果。“工欲善其事,必先利其器”,特征工程可以理解为“利其器”的过程。特征工程的目的是筛选出更好的特征,获取更好的训练数据。特征工程是一个看起来不值得被探讨的一个主题。但是,却对机器学习的成功与否起着至关重要的作用。机器学习算法很多都是由于建立一个学习器能够理解的工程化特征而获得成功的。特征工程可包括特征提取、特征构建、特征选择等模块。特征构建:是原始数据中人工的构建新的特征。特征提取:自动地构建新的特征,将原始数据转换为一组具有明显物理意义或者统计意义或核的特征。特征选择:从特征集合中挑选一组最具统计意义的特征子集,从而达到降维的效果。
需要说明的是,本申请实施例对特征工程涉及的具体流程不作限定。作为示例,特征工程涉及的流程包括但不限于:分箱(Binning)、独热编码(One-Hot Encoding)、特征哈希(Hashing Trick)、嵌套法(Embedding)、取对数(Log Transformation)、特征缩放(Scaling)、标准化(Normalization)或特征交互(Feature Interaction)。当然,也可以包括其他流程,本申请实施例对此不作限定。
这里仅以one-hot编码为例进行说明,若某一个具有离散特征的信息共有n种不同取值,则使用n维向量表示该信息的不同取值,该n维向量只有1维取值为1,代表特征取该维度上的值,其他n-1维取值为0。例如对于物品信息这一信息,存在“生活用品”和“学习用品”两种取值,则可使用向量(1,0)代表“生活用品”,使用向量(0,1)代表“学习用品”。当然上述用户信息和每一所述广告信息中具有离散特征的信息还可以为用户信息和广告信息的标识、用户信息和广告信息所属词类等,其处理方式与物品信息相同。
步骤S302、基于至少一个预测模型对所述第一物品的物品特征、所述用户的用户特征和每一所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的点击率。
在一些实施例中,可以对所述物品特征、用户特征和广告特征进行特征融合,将融合后的特征作为点击率预测模型的输入特征。其中,该点击率预测模型可以为神经网络模型、也可以是线性回归模型、还可以是神经网络模型和线性回归模型的融合模型。
在一些实施例中,可以通过步骤S3021至步骤S3023实现上述基于至少一个预测模型对所述第一物品的物品特征、所述用户的用户特征和每一所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的点击率。
步骤S3021、通过神经网络模型对所述第一物品的物品特征、所述用户的用户特征和所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的第一预测结果。
步骤S3022、通过线性回归模型对所述第一物品的物品特征、所述用户的用户特征和所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的第二预测结果。
步骤S3023、融合每一所述候选广告的所述第一预测结果和所述第二预测结果,得到每一所述候选广告的点击率。
在一些实施例中,可以将该第一预测结果和第二预测结果进行相加融合,之后通过sigmoid函数转化为(0,1)区间的概率预测值,作为该候选广告的点击率。
本申请实施例中,通过融合神经网络模型和线性回归模型两者的优势,提升了预测精度。线性回归模型主要依赖人工特征,充分发挥历史经验优势;神经网络模型有更强的特征推理和泛化能力,充分补充人工经验特征的不足;两融合进一步提高了预测的准确率。
图4是本申请实施例提供的基于全景视频的广告推送方法的一个可选的流程示意图,该方法可以由计算机设备的处理器执行。基于图1C,所述时空信息包括时间信息和方位信息,图1C中的S104可以更新为S401至S402,将结合图4示出的步骤进行说明。
步骤S401、基于每一所述第一物品在所述全景视频中的时间信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告。
在一些实施例中,可以通过步骤S4011至步骤S4013实现上述基于每一所述第一物品在所述全景视频中的时间信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告。
步骤S4011、基于每一所述第一物品在所述全景视频中的时间信息确定至少一个推送时间点。
在一些实施例中,由于该第一物品在该全景视频中是持续存在一段时间的,可以根据该第一物品在该全景视频中出现时间和消失时间确定该第一物品对应的一个推送时间点。示例性的,该推送时间点可以为该出现时间、也可以是该出现时间和该消失时间的中间点,还可以是基于该出现时间和消失时间确定的其他时间点。
需要说明的是,在确定每一第一物品对应的推送时间点之后,由于不同的第一物品可以同时存在于该全景视频中,因此,各第一物品对应的推送时间点可以出现重合,这里得到的至少一个推送时间点是去重后的时间点。也就是说,针对一个推送时间点,可以对应多个第一物品。
步骤S4012、针对每一所述推送时间点,基于所述推送时间点中每一所述第一物品对应的各所述候选广告的点击率,确定每一所述推送时间点对应的最大点击率广告。
在一些实施例中,每一个推送时间点可以对应一个或多个第一物品,统计每一第一物品对应的各所述候选广告的点击率,将点击率最大的候选广告作为该推送时间点对应的最大点击率广告。
示例性的,以该推送时间点对应第一物品B和第一物品C为例,其中,第一物品B对应的候选广告B1的点击率为0.5、B2的点击率为0.7;第一物品C对应的候选广告C1的点击率为0.6、C2的点击率为0.8。此时,可以保留每一第一物品对应的最大点击率广告,即,将候选广告B2作为第一物品B对应的最大点击率广告,并将候选广告C2作为第一物品C对应的最大点击率广告;还可以针对一个推送时间点仅保留一个最大点击率广告,即,并将候选广告C2作为该推送时间点对应的最大点击率广告。
步骤S4013、基于每一所述推送时间点对应的最大点击率广告,确定所述全景视频对应的待推送广告。
在一些实施例中,基于每一所述推送时间点对应的最大点击率广告,确定所述全景视频对应的广告数量;在所述广告数量超过所述全景视频对应的广告数量阈值的情况下,将点击率最大的预设数量个最大点击率广告作为所述全景视频对应的待推送广告。
在另一些实施例中,还可以先统计全景视频中候选广告的广告数量,在所述广告数量超过所述全景视频对应的广告数量阈值的情况下,确定点击率最大的预设数量个候选广告;在该预设数量个候选广告中去除推送时间点重合的候选广告,得到该全景视频对应的待推送广告。
步骤S402、基于所述待推送广告对应的第一物品的时间信息和方位信息,确定所述待推送广告的推送信息。
在一些实施例中,所述推送信息包括推送时间和推送位置;可以通过步骤S4021、步骤S4022实现上述基于所述待推送广告对应的第一物品的时间信息和方位信息,确定所述待推送广告的推送信息。
步骤S4021、基于所述待推送广告对应的第一物品的时间信息,确定所述待推送广告的推送时间。
其中,可以将该第一物品的时间信息作为该待推送广告的推送时间,也可以将该第一物品的时间信息延迟预设的间隔时间,作为该待推送广告的推送时间。
步骤S4022、基于所述待推送广告对应的第一物品的方位信息,确定所述待推送广告的推送位置。
其中,可以将第一物品的方位信息作为该待推送广告的推送位置。
本申请实施例中,可以针对全景视频用户的智能化广告推荐,在最合适的时机向用户推荐最感兴趣的广告。即可提升用户体验,也可提升广告点击量。
图5是本申请实施例提供的基于全景视频的广告推送方法的一个可选的流程示意图,该方法可以由计算机设备的处理器执行。基于上述任一实施例,以基于图1C为例,所述方法还包括S501至S502,将结合图5示出的步骤进行说明。
步骤S501、在展示所述全景视频给所述当前用户的过程中,基于所述当前用户的行为信息和待推送广告的推送信息,在所述待推送广告中确定需要推送的目标广告。
在一些实施例中,上述实施例中确定的待推送广告和待推送广告的推送信息可以存储于数据库中,并与该当前用户和全景视频存在关联关系。在该当前用户观看该全景视频的过程中,可以基于该当前用户的用户标识,在数据库中获取与该当前用户和全景视频存在关联关系的待推送广告和待推送广告的推送信息;并基于当前用户的行为信息和待推送广告的推送信息,在所述待推送广告中确定需要推送的目标广告。
在一些实施例中,所述行为信息包括所述全景视频的展示时间和所述当前用户的停留视角。可以通过步骤S5011至步骤S5012实现上述基于所述当前用户的行为信息和待推送广告的推送信息,在所述待推送广告中确定需要推送的目标广告。
步骤S5011、获取所述待推送广告的推送信息;所述推送信息包括所述推送时间、推送位置。
步骤S5012、基于所述全景视频的展示时间和所述当前用户的停留视角,和所述待推送广告的推送信息,在所述待推送广告中确定所述目标广告。
其中,所述目标广告的推送时间与所述全景视频的展示时间相同,且所述目标广告的推送位置和所述当前用户的停留视角匹配。
步骤S502、按照所述目标广告的推送信息,展示所述目标广告。
在一些实施例中,在不存在其他广告正在展示的情况下,按照所述目标广告的推送信息,展示所述目标广告。
其中,在基于当前用户的行为信息和待推送广告的推送信息,在所述待推送广告中确定需要推送的目标广告的步骤中,可以基于人工配置,确定是否可以同时展示多个广告,在该人工配置表征可以同时展示多个广告的情况下,按照固定频率,基于当前用户的行为信息和待推送广告的推送信息,在所述待推送广告中确定需要推送的目标广告;在该人工配置表征不能同时展示多个广告的情况下,响应于上一个目标广告展示完毕,按照固定频率,基于当前用户的行为信息和待推送广告的推送信息,在所述待推送广告中确定需要推送的目标广告。
在一些实施例中,在所述全景视频的展示时间对应多个目标广告的情况下,展示点击率最大的目标广告。
其中,若针对一个展示时间,存在多个符合要求的目标广告的情况下(即上述实施例中,针对同一个推送时间点,存在多个第一物品对应的最大点击率广告),展示点击率最大的目标广告。
图6是本申请实施例提供的基于全景视频的广告推送方法的一个可选的流程示意图,该方法可以由计算机设备的处理器执行。基于上述任一实施例,以基于图1C为例,所述全景视频包括具有时序的多个三维全景图像,所述步骤S101可以更新为S601至S602,将结合图6示出的步骤进行说明。
步骤S601、针对所述全景视频中的每一帧三维全景图像,将所述三维全景图像渲染于球形模型上,通过滑窗法调整截图相机视角,并获取至少一个视角对应的二维图像;所述截图相机位于所述球形模型的球心。
其中,针对每一帧三维全景图像,可以将所述三维全景图像渲染于图1A中所示的球形模型110上,该截图相机可以设置于图1A中所示的“眼睛”处。图中的阴影方向为一个视角下,该截图相机获取的该视角对应的二维图像。
在一些实施例中,可以通过步骤S6011至步骤S6012实现上述通过滑窗法调整截图相机视角,并获取至少一个视角对应的二维图像。
步骤S6011、获取每一所述视角对应的水平视场角和垂直视场角。
其中,每一视角可以通过垂直方向的垂直视场角和水平方向的水平视场角确定。
步骤S6012、基于每一所述视角对应的水平视场角和垂直视场角,通过滑窗法调整所述截图相机与所述球形模型的相对方向,并获取每一所述视角对应的二维图像。
步骤S602、针对每一所述视角,基于每一所述三维全景图像的时序编号,和每一所述三维全景图像中所述视角对应的二维图像,构建所述视角对应的二维图像序列。
示例性的,可以设置截图相机的水平视场角和垂直视场角为80°;进行水平截图过程:截图保存获取的二维图像,标记为[i,0,0],将截图相机视角沿水平方向滑动10°,水平和垂直方向视场角保持不变,截图标记为[i,0,10°];继续水平滑动10°,直至环绕360°,回到最初的位置,每次截图获取的图片标记为[i,0,h],其中h为水平滑动的总度数。然后进行垂直截图过程:将截图相机视角沿垂直方向滑动10°,重复上述水平截图过程后,再沿垂直方向滑动10°,直至环绕360°,回到最初的位置。每次截图获取的图像标记为[i,v,h],v代表垂直方向上视角位置,h表示水平方向上视角位置。将v和h相同的二维图像按照i排序整合可得到多个二维图像序列,标记为[v,h]。
本申请实施例中,可以通过滑窗法调整截图相机视角,获取每一所述视角对应的二维图像,进而可以将全景视频转换为多个二维图像序列,由于将三维信息转换为二维信息,降低了系统计算量的同时,还可以一定程度的提升预测准确率。
下面说明本申请实施例提供的基于全景视频的广告推送方法在实际场景中的应用。
图7是本申请实施例提供的基于全景视频的广告推送方法的一个可选的流程示意图,将结合图7示出的步骤进行说明。
步骤S701,对目标VR全景视频内容进行解析,采用FOV滑窗法将应用于3D空间的VR全景视频信息转化为多个2D视频。
在一些实施例中,所述步骤S701主要包括:获取VR全景视频的图像帧序列,按照时间顺序对每一帧三维全景图像进行编号(i={0,1,2,3,…})。采用FOV滑窗法从三维全景图像中提取2D图像信息,对截取的图片用三维数组[i,v,h]标记,i表示2D图片来自的三维全景图像编号,v代表2D图片在三维全景图像的垂直方向上视角位置,h表示2D图片在三维全景图像的水平方向上视角位置。
其中,步骤S701包括:
第一步:将第i帧三维全景图像附着于球体模型上进行渲染呈现;
第二步:在球体模型的球心位置设置三维全景图像的观景点;
其中,该观景点用于设置截图相机,即用户是处于球心观看球面图像,因此将截图相机放置于球体中心,模拟用户观看视角;
第三步:设置截图相机的水平视场角和垂直视场角为80°;
第四步:截图保存获取的2D图片,标记为[i,0,0];将截图相机视角沿水平方向滑动10°,水平和垂直方向视场角保持不变,截图标记为[i,0,10°];继续水平滑动10°,直至环绕360°,回到最初的位置,每次截图获取的图片标记为[i,0,h],其中h为水平滑动的总度数;
第五步:将截图相机视角沿垂直方向滑动10°,重复上述第四步后,再沿垂直方向滑动10°,直至环绕360°,回到最初的位置。每次截图获取的图像标记为[i,v,h],v代表垂直方向上视角位置,h表示水平方向上视角位置。
第六步:将v和h相同的2D图片按照i排序整合可得到多个2D视频帧序列,标记为[v,h]。
步骤S702,采用视频目标识别算法,基于多个2D视频中的前后帧时序信息识别全景视频中物体类别和位置。
其中,步骤S702包括:
第一步:将每一个2D视频帧序列输入到flow-based视频目标识别算法中,识别出视频中出现的物品类别及时间,记录格式如表1所示:
表1
属性名称 | 含义 |
[v,h] | 2D视频中心视角位置编号 |
i | 图像帧 |
object-id | 物体标识 |
第二步:基于视频帧率根据帧数计算出每条记录的时间戳t;
第三步:根据同一个物体出现在连续帧中的情况,对上述记录进行筛选过滤,仅保留连续出现时间在5S以上的识别记录,且仅保留物体出现的第一帧的记录;
第四步:按时间轴进行汇总,得到时间点上出现的物体信息和视角信息,输出格式如表2:
表2
属性名称 | 含义 |
t | 时间戳(唯一性) |
object-id | 出现的物体id[id1,id2,id3......] |
v | 水平方向位置 |
h | 垂直方式位置 |
步骤S703,基于全景视频出现的物体类别、观看用户的个人信息和候选广告信息,通过构建神经网络模型,对候选广告的点击率进行预测,得到针对观看用户的广告推荐排序。
请参阅图8,其示出了一种点击率预测方案示意图。如图8所示,该点击率预测方案包括输入模块810、特征模块820、神经网络模型830、线性回归模型840、激活模块850和输出模块860。
其中,该输入模块810用于获取输入数据,输入数据包括物体信息、广告信息和个人信息,物体信息包含全景视频中出现物体的类别、标签等;广告信息包含广告的标签、类别、价格等,个人信息包含年龄、性别、兴趣、位置等。
特征模块820用于通过特征工程,将物体信息、广告信息和个人信息进行处理,得到特征向量。
其中,特征工程包括:离散特征one-hot独热编码、连续特征离散化、特征平滑化、向量化,以及基于经验构建的组合特征。示例性的,该特征向量可以表示为(X1,X2,X3,…)。
神经网络模型830用于基于特征向量得到第一预测结果。
其中,神经网络模型830有更强的特征推理和泛化能力,充分补充人工经验特征的不足。
线性回归模型840用于基于特征向量得到第二预测结果。
其中,该线性回归模型840可以通过线性函数实现:(a0+a1X1+a2X2+a3X3+…)。线性回归模型840主要依赖人工特征,充分发挥历史经验优势。
在输入至激活模块850之前,需要对神经网络模型830输出的第一预测结果和线性回归模型840输出的第二预测结果进行融合,将融合后的预测结果输入至该激活模块850。在本实施例中,由于融合了神经网络模型和线性回归模型,进一步提高了预测的准确率。
激活模块850用于通过sigmoid函数将融合后的预测结果转化为(0,1)区间的概率预测值。
其中,sigmoid函数定义如公式:
输出模块860用于输出在全景视频中出现特定物体时投放特定广告,特定用户点击率预测值CTR。
其中,预测结果记录如下表3。
表3
属性名称 | 含义 |
user-id | 用户ID |
object-id | 物体ID |
ad-id | 广告ID |
CTR | 点击量预测值 |
在一些实施例中,仅保留CTR预测值>预设阈值的记录,该预设阈值可基于实际业务情况看调整。示例性的,该预设阈值可以设置为0.5。
步骤S704,结合全景视频中物体类别、位置和广告推荐排序,实现针对观看用户的智能化广告推荐,在最合适的时机向观看用户推荐最感兴趣的广告。
第一步:基于步骤S703的输出结果和步骤S704的输出,可以得到每个用户在观看全景视频的特定时间点和视角下可推荐的广告。
在一些实施例中,在同一时间点若有多个广告,则推送CTR最大的广告。
在一些实施例中,若在单个全景视频中可推荐的总广告较多,优选CTR值较大的前指定个数的广告。
其中,输出的记录信息如表4。
表4
属性名称 | 含义 |
user-id | 用户ID |
t | 全景视频时间戳 |
v | 水平方向位置 |
h | 垂直方式位置 |
ad-id | 广告ID |
CTR | 点击量预测值 |
第二步:监测用户行为,进行个性化广告实时推送。
当用户(标识为A)观看到全景视频的时间T、停留视角中心点为(V,H)时,在候选广告推荐记录(第一步输出的结果)中搜索,是否存同时满足以下条件的记录:(1)user-id=A;(2)t=T;(3)V-10°<v<V+10°;(4)H-10°<h<H+10°。
若有,则推送ad-id对应广告。若有多个符合条件的ad-id,则推送CTR值最高的;若目前尚有推荐中的广告,则不推送。
基于上述实施例,本申请实施例可以达到以下技术效果:
(1)由于提出了一种基于全景视频目标识别的智能化广告推荐方法,实现针对全景视频用户的个性化广告推荐和广告推送时机的智能化预测。相比现有的人工操作,可减少人工投入、提升用体验,提高广告点击率。
(2)本申请实施例提出的基于FOV滑窗法的全景视频解析方法,相比现有方案,无需嵌入物体检测算法,计算量较小,且能保留图像原始视角信息。
(3)本申请实施例提出的全景视频物体检测方法是基于视频帧序列信息进行检测,不同于现有的方案(拆解为单张图像分别检测),一方面能解决视频中由于物体运动、摄像头失焦产生的图像模糊,还有目标物体被遮挡、姿势转变引起的外观变化、远近引起的尺寸大小变化等情况,提升检测精度;另一方面无需每帧检测,利用前后帧的相似信息进行简化,大幅度减少计算量。
(4)本申请实施例提出了一种创新的CTR预测模型,融合神经网络模型和线性回归模型两者的优势,提升了预测精度。线性回归模型主要依赖人工特征,充分发挥历史经验优势;神经网络模型有更强的特征推理和泛化能力,充分补充人工经验特征的不足;两融合进一步提高了预测的准确率。
(5)本申请提案提出的智能化广告推荐方法,不仅考虑到个人信息、广告信息,同时考虑了全景视频内容信息、用户观看所处视角,能更加精准的预测不同用户的广告偏好和广告的最佳推送时机,提升用户体验和广告点击率。
基于前述的实施例,本申请实施例提供一种基于全景视频的广告推送装置,该装置包括所包括的各单元、以及各单元所包括的各模块,可以通过计算机设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(Central Processing Unit,CPU)、微处理器(Microprocessor Unit,MPU)、数字信号处理器(Digital Signal Processor,DSP)或现场可编程门阵列(Field Programmable GateArray,FPGA)等。
图9为本申请实施例提供的一种基于全景视频的广告推送装置的组成结构示意图,如图9所示,基于全景视频的广告推送装置900包括:解析模块910、检测模块920、第一确定模块930和第二确定模块940,其中:
解析模块910,用于解析全景视频,得到至少一个二维图像序列;
检测模块920,用于对每一所述二维图像序列进行物品检测,得到所述全景视频中至少一个第一物品中每一所述第一物品的物品数据;所述物品数据包括所述第一物品的物品信息和所述第一物品在所述全景视频中的时空信息;
第一确定模块930,用于针对每一所述第一物品,基于所述第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息,确定每一所述候选广告的点击率;
第二确定模块940,用于基于每一所述第一物品在所述全景视频中的时空信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告和所述待推送广告的推送信息。
在一些实施例中,所述二维图像序列包括具有时序的多个二维图像;所述检测模块920,还用于:
针对每一所述二维图像序列,基于流模型的视频目标检测算法对所述二维图像序列进行物品检测,得到所述二维图像序列中多个第二物品中每一所述第二物品的物品检测结果;所述物品检测结果包括所述第二物品所在二维图像对应的时序编号和物品类别;
基于所述第二物品所在的二维图像的时序编号,对所述多个第二物品进行筛选,得到所述全景视频中的所述第一物品;
基于所述第一物品的物品检测结果确定所述第一物品的物品数据。
在一些实施例中,所述检测模块920,还用于:
基于每一所述第二物品所在的二维图像的时序编号,确定每一所述第二物品的持续出现时间;
基于每一所述第二物品的持续出现时间和预设的时间阈值,在所述多个第二物品确定所述第一物品。
在一些实施例中,所述检测模块920,还用于:
基于所述第一物品所在二维图像对应的物品类别,确定所述第一物品的物品信息;
基于所述第一物品所在二维图像序列对应的视角和所述第一物品所在二维图像对应的时序编号,确定所述第一物品的时空信息。
在一些实施例中,所述时空信息包括时间信息和方位信息;所述检测模块920,还用于:
基于所述第一物品所在二维图像序列对应的视角确定所述第一物品的方位信息;
基于所述第一物品所在二维图像对应的时序编号确定所述第一物品的时间信息。
在一些实施例中,所述第一确定模块930,还用于:
通过特征工程分别对所述物品信息、所述用户信息和每一所述广告信息进行特征构建,得到所述第一物品的物品特征、所述用户的用户特征和每一所述候选广告的广告特征;
基于至少一个预测模型对所述第一物品的物品特征、所述用户的用户特征和每一所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的点击率。
在一些实施例中,所述第一确定模块930,还用于:
通过神经网络模型对所述第一物品的物品特征、所述用户的用户特征和所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的第一预测结果;
通过线性回归模型对所述第一物品的物品特征、所述用户的用户特征和所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的第二预测结果;
融合每一所述候选广告的所述第一预测结果和所述第二预测结果,得到每一所述候选广告的点击率。
在一些实施例中,所述时空信息包括时间信息和方位信息,所述第二确定模块940,还用于:
基于每一所述第一物品在所述全景视频中的时间信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告;
基于所述待推送广告对应的第一物品的时间信息和方位信息,确定所述待推送广告的推送信息。
在一些实施例中,所述第二确定模块940,还用于:
基于每一所述第一物品在所述全景视频中的时间信息确定至少一个推送时间点;
针对每一所述推送时间点,基于所述推送时间点中每一所述第一物品对应的各所述候选广告的点击率,确定每一所述推送时间点对应的最大点击率广告;
基于每一所述推送时间点对应的最大点击率广告,确定所述全景视频对应的待推送广告。
在一些实施例中,所述第二确定模块940,还用于:
基于每一所述推送时间点对应的最大点击率广告,确定所述全景视频对应的广告数量;
在所述广告数量超过所述全景视频对应的广告数量阈值的情况下,将点击率最大的预设数量个最大点击率广告作为所述全景视频对应的待推送广告。
在一些实施例中,所述推送信息包括推送时间和推送位置;所述第二确定模块940,还用于:
基于所述待推送广告对应的第一物品的时间信息,确定所述待推送广告的推送时间;
基于所述待推送广告对应的第一物品的方位信息,确定所述待推送广告的推送位置。
在一些实施例中,基于全景视频的广告推送装置900还包括:展示模块。
所述展示模块,用于在展示所述全景视频给所述当前用户的过程中,基于所述当前用户的行为信息和待推送广告的推送信息,在所述待推送广告中确定需要推送的目标广告;按照所述目标广告的推送信息,展示所述目标广告。
在一些实施例中,所述行为信息包括所述全景视频的展示时间和所述当前用户的停留视角,所述展示模块,还用于:
获取所述待推送广告的推送信息;所述推送信息包括所述推送时间、推送位置;
基于所述全景视频的展示时间和所述当前用户的停留视角,和所述待推送广告的推送信息,在所述待推送广告中确定所述目标广告;所述目标广告的推送时间与所述全景视频的展示时间相同,且所述目标广告的推送位置和所述当前用户的停留视角匹配。
在一些实施例中,所述展示模块,还用于:在所述全景视频的展示时间对应多个目标广告的情况下,展示点击率最大的目标广告。
在一些实施例中,所述展示模块,还用于:
在不存在其他广告正在展示的情况下,按照所述目标广告的推送信息,展示所述目标广告。
在一些实施例中,所述全景视频包括具有时序的多个三维全景图像;所述解析模块910,还用于:
针对所述全景视频中的每一帧三维全景图像,将所述三维全景图像渲染于球形模型上,通过滑窗法调整截图相机视角,并获取至少一个视角对应的二维图像;所述截图相机位于所述球形模型的球心;
针对每一所述视角,基于每一所述三维全景图像的时序编号,和每一所述三维全景图像中所述视角对应的二维图像,构建所述视角对应的二维图像序列。
在一些实施例中,所述解析模块910,还用于:
获取每一所述视角对应的水平视场角和垂直视场角;
基于每一所述视角对应的水平视场角和垂直视场角,调整所述截图相机与所述球形模型的相对方向,并获取每一所述视角对应的二维图像。
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。在一些实施例中,本申请实施例提供的装置具有的功能或包含的模块可以用于执行上述方法实施例描述的方法,对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的基于全景视频的广告推送方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件、软件或固件,或者硬件、软件、固件三者之间的任意结合。
本申请实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的部分或全部步骤。
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的部分或全部步骤。所述计算机可读存储介质可以是瞬时性的,也可以是非瞬时性的。
本申请实施例提供一种计算机程序,包括计算机可读代码,在所述计算机可读代码在计算机设备中运行的情况下,所述计算机设备中的处理器执行用于实现上述方法中的部分或全部步骤。
本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序被计算机读取并执行时,实现上述方法中的部分或全部步骤。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一些实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一些实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
这里需要指出的是:上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考。以上设备、存储介质、计算机程序及计算机程序产品实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请设备、存储介质、计算机程序及计算机程序产品实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
图10为本申请实施例提供的一种基于全景视频的广告推送设备的硬件实体示意图,如图10所示,该基于全景视频的广告推送设备1000的硬件实体包括:处理器1001和存储器1002,其中,存储器1002存储有可在处理器1001上运行的计算机程序,处理器1001执行程序时实现上述任一实施例的方法中的步骤。
存储器1002存储有可在处理器上运行的计算机程序,存储器1002配置为存储由处理器1001可执行的指令和应用,还可以缓存待处理器1001以及基于全景视频的广告推送设备1000中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(Random Access Memory,RAM)实现。
处理器1001执行程序时实现上述任一项的基于全景视频的广告推送方法的步骤。处理器1001通常控制基于全景视频的广告推送设备1000的总体操作。
本申请实施例提供一种计算机存储介质,计算机存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如上任一实施例的基于全景视频的广告推送方法的步骤。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
上述处理器可以为目标用途集成电路(Application Specific IntegratedCircuit,ASIC)、数字信号处理器(Digital Signal Processor,DSP)、数字信号处理装置(Digital Signal Processing Device,DSPD)、可编程逻辑装置(Programmable LogicDevice,PLD)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器中的至少一种。可以理解地,实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
上述计算机存储介质/存储器可以是只读存储器(Read Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各步骤/过程的序号的大小并不意味着执行顺序的先后,各步骤/过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。
Claims (10)
1.一种基于全景视频的广告推送方法,其特征在于,包括:
解析全景视频,得到至少一个二维图像序列;
对每一所述二维图像序列进行物品检测,得到所述全景视频中至少一个第一物品中每一所述第一物品的物品数据;所述物品数据包括所述第一物品的物品信息和所述第一物品在所述全景视频中的时空信息;
针对每一所述第一物品,基于所述第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息,确定每一所述候选广告的点击率;
基于每一所述第一物品在所述全景视频中的时空信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告和所述待推送广告的推送信息。
2.根据权利要求1所述的方法,其特征在于,所述二维图像序列包括具有时序的多个二维图像;所述对每一所述二维图像序列进行物品检测,得到所述全景视频中至少一个第一物品中每一所述第一物品的物品数据,包括:
针对每一所述二维图像序列,基于流模型的视频目标检测算法对所述二维图像序列进行物品检测,得到所述二维图像序列中多个第二物品中每一所述第二物品的物品检测结果;所述物品检测结果包括所述第二物品所在二维图像对应的时序编号和物品类别;
基于所述第二物品所在的二维图像的时序编号,对所述多个第二物品进行筛选,得到所述全景视频中的所述第一物品;
基于所述第一物品的物品检测结果确定所述第一物品的物品数据。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第二物品所在的二维图像的时序编号,对所述多个第二物品进行筛选,得到所述全景视频中的所述第一物品,包括:
基于每一所述第二物品所在的二维图像的时序编号,确定每一所述第二物品的持续出现时间;
基于每一所述第二物品的持续出现时间和预设的时间阈值,在所述多个第二物品确定所述第一物品。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息,确定每一所述候选广告的点击率,包括:
通过特征工程分别对所述物品信息、所述用户信息和每一所述广告信息进行特征构建,得到所述第一物品的物品特征、所述用户的用户特征和每一所述候选广告的广告特征;
基于至少一个预测模型对所述第一物品的物品特征、所述用户的用户特征和每一所述候选广告的广告特征进行点击率预测,得到每一所述候选广告的点击率。
5.根据权利要求1所述的方法,其特征在于,所述时空信息包括时间信息和方位信息,所述基于每一所述第一物品在所述全景视频中的时空信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告和所述待推送广告的推送信息,包括:
基于每一所述第一物品在所述全景视频中的时间信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告;
基于所述待推送广告对应的第一物品的时间信息和方位信息,确定所述待推送广告的推送信息。
6.根据权利要求5所述的方法,其特征在于,所述基于每一所述第一物品在所述全景视频中的时间信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告,包括:
基于每一所述第一物品在所述全景视频中的时间信息确定至少一个推送时间点;
针对每一所述推送时间点,基于所述推送时间点中每一所述第一物品对应的各所述候选广告的点击率,确定每一所述推送时间点对应的最大点击率广告;
基于每一所述推送时间点对应的最大点击率广告,确定所述全景视频对应的待推送广告。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在展示所述全景视频给所述当前用户的过程中,基于所述当前用户的行为信息和待推送广告的推送信息,在所述待推送广告中确定需要推送的目标广告;
按照所述目标广告的推送信息,展示所述目标广告。
8.一种基于全景视频的广告推送装置,其特征在于,包括:
解析模块,用于解析全景视频,得到至少一个二维图像序列;
检测模块,用于对每一所述二维图像序列进行物品检测,得到所述全景视频中至少一个第一物品中每一所述第一物品的物品数据;所述物品数据包括所述第一物品的物品信息和所述第一物品在所述全景视频中的时空信息;
第一确定模块,用于针对每一所述第一物品,基于所述第一物品的物品信息、当前用户的用户信息和至少一个候选广告的广告信息,确定每一所述候选广告的点击率;
第二确定模块,用于基于每一所述第一物品在所述全景视频中的时空信息和每一所述第一物品对应的各所述候选广告的点击率,确定所述全景视频对应的待推送广告和所述待推送广告的推送信息。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7任一项所述方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7任一项所述方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211413970.5A CN116962750A (zh) | 2022-11-11 | 2022-11-11 | 基于全景视频的广告推送方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211413970.5A CN116962750A (zh) | 2022-11-11 | 2022-11-11 | 基于全景视频的广告推送方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116962750A true CN116962750A (zh) | 2023-10-27 |
Family
ID=88444982
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211413970.5A Pending CN116962750A (zh) | 2022-11-11 | 2022-11-11 | 基于全景视频的广告推送方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116962750A (zh) |
-
2022
- 2022-11-11 CN CN202211413970.5A patent/CN116962750A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7207836B2 (ja) | 視聴者エンゲージメントを評価するためのシステム | |
CN111143610B (zh) | 一种内容推荐方法、装置、电子设备和存储介质 | |
US20230012732A1 (en) | Video data processing method and apparatus, device, and medium | |
CN110189378A (zh) | 一种视频处理方法、装置及电子设备 | |
US10115433B2 (en) | Section identification in video content | |
US9176987B1 (en) | Automatic face annotation method and system | |
Ejaz et al. | Efficient visual attention based framework for extracting key frames from videos | |
US9208227B2 (en) | Electronic apparatus, reproduction control system, reproduction control method, and program therefor | |
US8804999B2 (en) | Video recommendation system and method thereof | |
WO2022184117A1 (zh) | 基于深度学习的视频剪辑方法、相关设备及存储介质 | |
CN110598048B (zh) | 视频检索方法及视频检索映射关系生成方法、装置 | |
CN116484318B (zh) | 一种演讲训练反馈方法、装置及存储介质 | |
KR20200008059A (ko) | 컴퓨터 실행 방법, 시스템 및 컴퓨터 판독 가능 매체 | |
CN111491187B (zh) | 视频的推荐方法、装置、设备及存储介质 | |
CN113766299B (zh) | 一种视频数据播放方法、装置、设备以及介质 | |
CN114339360B (zh) | 一种视频处理的方法、相关装置及设备 | |
CN113766330A (zh) | 基于视频生成推荐信息的方法和装置 | |
CN112685596B (zh) | 视频推荐方法及装置、终端、存储介质 | |
CN111797850A (zh) | 视频分类方法、装置、存储介质及电子设备 | |
CN113923504B (zh) | 视频预览动图生成方法和装置 | |
CN114372172A (zh) | 生成视频封面图像的方法、装置、计算机设备及存储介质 | |
CN111277904B (zh) | 一种视频的播放控制方法、装置及计算设备 | |
Miniakhmetova et al. | An approach to personalized video summarization based on user preferences analysis | |
CN116962750A (zh) | 基于全景视频的广告推送方法、装置、设备及存储介质 | |
CN112188116B (zh) | 基于对象的视频合成方法、客户端及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |