CN106469202A - 一种影视大数据平台的数据分析方法 - Google Patents

一种影视大数据平台的数据分析方法 Download PDF

Info

Publication number
CN106469202A
CN106469202A CN201610796573.9A CN201610796573A CN106469202A CN 106469202 A CN106469202 A CN 106469202A CN 201610796573 A CN201610796573 A CN 201610796573A CN 106469202 A CN106469202 A CN 106469202A
Authority
CN
China
Prior art keywords
data
video display
user
analysis
big data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610796573.9A
Other languages
English (en)
Inventor
董大伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Discovery Culture Media Co Ltd</en>
Original Assignee
Hangzhou Discovery Culture Media Co Ltd</en>
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Discovery Culture Media Co Ltd</en> filed Critical Hangzhou Discovery Culture Media Co Ltd</en>
Priority to CN201610796573.9A priority Critical patent/CN106469202A/zh
Publication of CN106469202A publication Critical patent/CN106469202A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明公开了一种影视大数据平台的数据分析方法:通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。本发明与现有技术相比,能够实时提供收视率统计结果;能够提供多种基于大量数据统计的分析结果,包括影视用户画像,艺人综合评估、收视率、影视作品点播量;通过分析结果为影视作品提供商提供数据情报。

Description

一种影视大数据平台的数据分析方法
技术领域
本发明涉及计算机大数据分析领域,具体涉及一种影视大数据平台的数据分析方法。
背景技术
随着数据分析技术的发展,影视作品提供商对于影视作品数据分析的要求越来越高。但是现有的影视数据分析方法都没有采用计算机大数据技术,且无法实时的提供收视率统计,无法提供多种基于大量数据统计的分析结果,无法通过分析结果为影视作品提供商提供数据情报。
发明内容
本发明的目的在于提供一种影视大数据平台的数据分析方法,该方法采用计算机大数据技术,能够实时提供收视率统计结果,能够提供多种基于大量数据统计的分析结果,通过分析结果为影视作品提供商提供数据情报。
为实现上述目的本发明提供了一种影视大数据平台的数据分析方法:通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。
所述的影视大数据包括用户数据和影视数据;用户数据包括影视用户画像,影视数据包括艺人综合评估、收视率、影视作品点播量。
所述的离线数据分析服务器用于分析影视用户画像和艺人综合评估;所述的实时数据分析服务器用于分析收视率多维度监测和影视作品点播量在线监测。
所述的影视用户画像的分析包括数据建模,具体为:首先对用户在智能电视端的观看行为数据,互联网和移动互联网上的影视点播行为数据建立特征值,每一个维度对应一个特征值,然后采用聚类和关联分析等算法对这些数据构建数据模型,并不断对这些数据模型进行迭代计算,当计算结果收敛于某个设定的阀值后,模型构建成功。
所述的影视用户画像分析方法为:
首先分析用户在智能电视端、互联网端的操作和观看行为,将这些终端的IP地址、PC的cookie、终端的唯一标识进行关联,确定终端的用户是否为同一人;
然后,基于用户在电视和互联网上的影视观看行为,精确分析用户属性,勾勒用户画像,划分7000个多维度属性标签,包括用户的性别、年龄、地域、学历、职业、收入、兴趣爱好等标签,精细勾勒出最具价值的核心用户领袖;
最后,将用户的属性标签和广告属性进行精准匹配,准确圈定目标受众。
所述的艺人综合评估分析方法为:结合艺人出演节目的收视率、在线点播量、评论等数据,对艺人进行打分,对其演技、公众口碑等进行综合评估。
所述的影视作品点播量分析为,描绘出节目在不同终端中目标用户所占比例、所在地域、在线时长等多维度的指标。
所述的收视率分析为,对收视率进行分钟级统计,对地区、电视台、节目、用户属性等多维度实时绘制收视率曲线。
本发明与现有技术相比,能够实时提供收视率统计结果;能够提供多种基于大量数据统计的分析结果,包括影视用户画像,艺人综合评估、收视率、影视作品点播量;通过分析结果为影视作品提供商提供数据情报。
附图说明
图1是本发明实施例1的影视大数据平台的数据分析方法的结构图。
具体实施方式
以下是本发明的具体实施例,对本发明的技术方案做进一步的描述,但是本发明的保护范围并不限于这些实施例。凡是不背离本发明构思的改变或等同替代均包括在本发明的保护范围之内。
实施例1
一种影视大数据平台的数据分析方法,通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。如图1所示,数据源会将数据逐条录入至一个数据的消息队列中,消息队列使用topic来标识不同类型或不同格式的数据源,默认采用FIFO的算法,并使用一个offset变量记录每个队列当前的访问位置,消息队列默认会将数据保存2天。离线数据分析服务器和实时数据分析服务器各自启动一个进程读取消息队列中的数据,消息队列会为这两个进程各自维护一个offset来记录读取进程所读取到的一行,离线数据分析服务器和实时数据分析服务器会按需到消息队列中取得所需要的数据,离线数据分析服务器会将数据写入到分布式文件系统中并进行离线计算,计算的最终结果会录入至数据库中,实时数据分析服务器则直接读取并进行计算,计算的最终结果会录入至数据库中;这一方案将离线计算和实时在线计算隔离开,两种计算场景互不干扰,满足了业务中实时和离线的两种需求。
影视大数据包括用户数据和影视数据;用户数据包括影视用户画像,影视数据包括艺人综合评估、收视率、影视作品点播量。
所述的离线数据分析服务器用于分析影视用户画像和艺人综合评估;所述的实时数据分析服务器用于分析收视率多维度监测和影视作品点播量在线监测。
所述的影视用户画像的分析包括数据建模,具体为:首先对用户在智能电视端的观看行为数据,互联网和移动互联网上的影视点播行为数据建立特征值,每一个维度对应一个特征值,然后采用聚类和关联分析等算法对这些数据构建数据模型,并不断对这些数据模型进行迭代计算,当计算结果收敛于某个设定的阀值后,模型构建成功。
所述的影视用户画像分析方法为:
首先分析用户在智能电视端、互联网端的操作和观看行为,将这些终端的IP地址、PC的cookie、终端的唯一标识进行关联,确定终端的用户是否为同一人;
然后,基于用户在电视和互联网上的影视观看行为,精确分析用户属性,勾勒用户画像,划分7000个多维度属性标签,包括用户的性别、年龄、地域、学历、职业、收入、兴趣爱好等标签数据,精细勾勒出最具价值的核心用户领袖;
最后,将用户的属性标签和广告属性进行精准匹配,准确圈定目标受众。
所述的艺人综合评估分析方法为:结合艺人出演节目的收视率、在线点播量、评论等数据,对艺人进行打分,对其演技、公众口碑等进行综合评估。
所述的影视作品点播量分析为,描绘出节目在不同终端中目标用户所占比例、所在地域、在线时长等多维度的指标。
所述的收视率分析为,对收视率进行分钟级统计,对地区、电视台、节目、用户属性等多维度实时绘制收视率曲线。
本发明与现有技术相比,能够实时提供收视率统计结果;能够提供多种基于大量数据统计的分析结果,包括影视用户画像,艺人综合评估、收视率、影视作品点播量;通过分析结果为影视作品提供商提供数据情报。根据客户的需求定制化构建数据可视化页面,并以API的方式对用户提供门户网站和数据接口服务,API支持php、java、python等开发语言,客户可直接通过程序调用接口实时获取所需数据。

Claims (8)

1.一种影视大数据平台的数据分析方法,其特征在于:通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。
2.根据权利要求1所述的一种影视大数据平台的数据分析方法,其特征在于,所述的影视大数据包括用户数据和影视数据;用户数据包括影视用户画像,影视数据包括艺人综合评估、收视率、影视作品点播量。
3.根据权利要求2所述的一种影视大数据平台的数据分析方法,其特征在于,所述的离线数据分析服务器用于分析影视用户画像和艺人综合评估;所述的实时数据分析服务器用于分析收视率多维度监测和影视作品点播量在线监测。
4.根据权利要求3所述的一种影视大数据平台的数据分析方法,其特征在于,所述的影视用户画像的分析包括数据建模,具体为:首先对用户在智能电视端的观看行为数据,互联网和移动互联网上的影视点播行为数据建立特征值,每一个维度对应一个特征值,然后采用聚类和关联分析等算法对这些数据构建数据模型,并不断对这些数据模型进行迭代计算,当计算结果收敛于某个设定的阀值后,模型构建成功。
5.根据权利要求4所述的一种影视大数据平台的数据分析方法,其特征在于,所述的影视用户画像分析方法为:
首先分析用户在智能电视端、互联网端的操作和观看行为,将这些终端的IP地址、PC的cookie、终端的唯一标识进行关联,确定终端的用户是否为同一人;
然后,基于用户在电视和互联网上的影视观看行为,精确分析用户属性,勾勒用户画像,划分用户的性别、年龄、地域、学历、职业、收入、兴趣爱好等标签,精细勾勒出最具价值的核心用户领袖;
最后,将用户的属性标签和广告属性进行精准匹配,准确圈定目标受众。
6.根据权利要求3所述的一种影视大数据平台的数据分析方法,其特征在于,所述的艺人综合评估分析方法为:结合艺人出演节目的收视率、在线点播量、评论等数据,对艺人进行打分,对其演技、公众口碑等进行综合评估。
7.根据权利要求3所述的一种影视大数据平台的数据分析方法,其特征在于,所述的影视作品点播量分析为,描绘出节目在不同终端中目标用户所占比例、所在地域、在线时长等多维度的指标。
8.根据权利要求3所述的一种影视大数据平台的数据分析方法,其特征在于,所述的收视率分析为,对收视率进行分钟级统计,对地区、电视台、节目、用户属性等多维度实时绘制收视率曲线。
CN201610796573.9A 2016-08-31 2016-08-31 一种影视大数据平台的数据分析方法 Pending CN106469202A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610796573.9A CN106469202A (zh) 2016-08-31 2016-08-31 一种影视大数据平台的数据分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610796573.9A CN106469202A (zh) 2016-08-31 2016-08-31 一种影视大数据平台的数据分析方法

Publications (1)

Publication Number Publication Date
CN106469202A true CN106469202A (zh) 2017-03-01

Family

ID=58230626

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610796573.9A Pending CN106469202A (zh) 2016-08-31 2016-08-31 一种影视大数据平台的数据分析方法

Country Status (1)

Country Link
CN (1) CN106469202A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106934034A (zh) * 2017-03-14 2017-07-07 杭州火剧科技有限公司 分析影视作品发行特征的方法和服务器
CN106980663A (zh) * 2017-03-21 2017-07-25 上海星红桉数据科技有限公司 基于海量跨屏行为数据的用户画像方法
CN107454346A (zh) * 2017-07-03 2017-12-08 李洪海 影视数据解析方法、视频制作模板推荐方法、装置及设备
CN107609487A (zh) * 2017-08-17 2018-01-19 北京三快在线科技有限公司 一种用户头像的生成方法和装置
CN107911721A (zh) * 2017-12-01 2018-04-13 北京蓝水科技文化有限公司 一种互联网影视作品的量化评价指标确定方法及系统
CN108885628A (zh) * 2016-03-28 2018-11-23 三菱电机株式会社 数据分析方法候选决定装置
CN109451335A (zh) * 2018-12-26 2019-03-08 山东浪潮商用系统有限公司 一种Java实现存储视频收视率的方法
CN109685579A (zh) * 2018-12-29 2019-04-26 深圳市酷开网络科技有限公司 一种基于用户标签的数据处理方法、智能电视及存储介质
CN109697214A (zh) * 2018-11-30 2019-04-30 武汉烽火众智数字技术有限责任公司 一种旅游数据分析系统及方法
CN110087104A (zh) * 2019-04-29 2019-08-02 秒针信息技术有限公司 信息推送的装置、方法、电子设备和计算机可读存储介质
CN110312149A (zh) * 2018-03-20 2019-10-08 国家新闻出版广电总局广播电视规划院 一种用于收视数据处理的方法、装置及系统以及数据处理设备
CN110502579A (zh) * 2019-08-26 2019-11-26 第四范式(北京)技术有限公司 用于批量和实时特征计算的系统和方法
CN112765237A (zh) * 2021-01-25 2021-05-07 上海盛奕数字科技有限公司 一种区块链数据分析获取方法
WO2022111071A1 (zh) * 2020-11-25 2022-06-02 Oppo广东移动通信有限公司 用户画像生成方法、装置、服务器及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101527812A (zh) * 2008-03-07 2009-09-09 上海贝尔阿尔卡特股份有限公司 网络电视系统中用户事件信息和收视信息的自动统计方法
CN102541435A (zh) * 2010-12-13 2012-07-04 索尼公司 用于对媒体内容区分优先级的用户界面
CN104902293A (zh) * 2015-06-08 2015-09-09 福州大学 数字电视收视率统计管理系统及其实现方法
CN105224576A (zh) * 2014-07-01 2016-01-06 上海视畅信息科技有限公司 一种影视智能推荐方法
CN105577431A (zh) * 2015-12-11 2016-05-11 青岛云成互动网络有限公司 一种基于互联网应用的用户信息识别分类方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101527812A (zh) * 2008-03-07 2009-09-09 上海贝尔阿尔卡特股份有限公司 网络电视系统中用户事件信息和收视信息的自动统计方法
CN102541435A (zh) * 2010-12-13 2012-07-04 索尼公司 用于对媒体内容区分优先级的用户界面
CN105224576A (zh) * 2014-07-01 2016-01-06 上海视畅信息科技有限公司 一种影视智能推荐方法
CN104902293A (zh) * 2015-06-08 2015-09-09 福州大学 数字电视收视率统计管理系统及其实现方法
CN105577431A (zh) * 2015-12-11 2016-05-11 青岛云成互动网络有限公司 一种基于互联网应用的用户信息识别分类方法和系统

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108885628A (zh) * 2016-03-28 2018-11-23 三菱电机株式会社 数据分析方法候选决定装置
CN106934034A (zh) * 2017-03-14 2017-07-07 杭州火剧科技有限公司 分析影视作品发行特征的方法和服务器
CN106934034B (zh) * 2017-03-14 2019-11-12 杭州火剧科技有限公司 分析影视作品发行特征的方法和服务器
CN106980663A (zh) * 2017-03-21 2017-07-25 上海星红桉数据科技有限公司 基于海量跨屏行为数据的用户画像方法
CN107454346A (zh) * 2017-07-03 2017-12-08 李洪海 影视数据解析方法、视频制作模板推荐方法、装置及设备
CN107609487A (zh) * 2017-08-17 2018-01-19 北京三快在线科技有限公司 一种用户头像的生成方法和装置
CN107609487B (zh) * 2017-08-17 2021-01-22 北京三快在线科技有限公司 一种用户头像的生成方法和装置
CN107911721A (zh) * 2017-12-01 2018-04-13 北京蓝水科技文化有限公司 一种互联网影视作品的量化评价指标确定方法及系统
CN110312149A (zh) * 2018-03-20 2019-10-08 国家新闻出版广电总局广播电视规划院 一种用于收视数据处理的方法、装置及系统以及数据处理设备
CN110312149B (zh) * 2018-03-20 2021-08-17 国家广播电视总局广播电视规划院 一种用于收视数据处理的方法、装置及系统以及数据处理设备
CN109697214A (zh) * 2018-11-30 2019-04-30 武汉烽火众智数字技术有限责任公司 一种旅游数据分析系统及方法
CN109697214B (zh) * 2018-11-30 2022-07-08 武汉烽火众智数字技术有限责任公司 一种旅游数据分析系统及方法
CN109451335A (zh) * 2018-12-26 2019-03-08 山东浪潮商用系统有限公司 一种Java实现存储视频收视率的方法
CN109685579A (zh) * 2018-12-29 2019-04-26 深圳市酷开网络科技有限公司 一种基于用户标签的数据处理方法、智能电视及存储介质
CN110087104A (zh) * 2019-04-29 2019-08-02 秒针信息技术有限公司 信息推送的装置、方法、电子设备和计算机可读存储介质
CN110502579A (zh) * 2019-08-26 2019-11-26 第四范式(北京)技术有限公司 用于批量和实时特征计算的系统和方法
US11971882B2 (en) 2019-08-26 2024-04-30 The Fourth Paradigm (Beijing) Tech Co Ltd System and method for batch and real-time feature computation
WO2022111071A1 (zh) * 2020-11-25 2022-06-02 Oppo广东移动通信有限公司 用户画像生成方法、装置、服务器及存储介质
CN112765237A (zh) * 2021-01-25 2021-05-07 上海盛奕数字科技有限公司 一种区块链数据分析获取方法

Similar Documents

Publication Publication Date Title
CN106469202A (zh) 一种影视大数据平台的数据分析方法
US20170142482A1 (en) Video platform monitoring and analyzing system
CN109714610B (zh) 自动式视频营销管理系统及方法
WO2020005968A1 (en) Machine-learning based systems and methods for analyzing and distributing multimedia content
CN107203897A (zh) 一种产品推荐度的评价方法、装置及系统
CN112287238B (zh) 用户特征的确定方法和装置、存储介质及电子设备
US11468479B2 (en) Methods and apparatus for generating information about portable device advertising
US20150019324A1 (en) System and method for centralized advertisements serving and verification
CN107633257B (zh) 数据质量评估方法及装置、计算机可读存储介质、终端
CN105302880A (zh) 内容关联推荐方法及装置
CN112995690B (zh) 直播内容品类识别方法、装置、电子设备和可读存储介质
CN113761253A (zh) 视频标签确定方法、装置、设备及存储介质
CN106202393A (zh) 媒体信息推送方法及装置
CN112818224A (zh) 信息推荐方法、装置、电子设备及可读存储介质
Ungerman et al. Model of communication usable for small and medium-sized companies for the consumer communication in social media
CN104967690A (zh) 一种信息推送方法及装置
WO2022247666A1 (zh) 一种内容的处理方法、装置、计算机设备和存储介质
CN106919692B (zh) 一种推送消息的方法和装置
CN113763027B (zh) 推荐信息处理方法、推荐信息生成方法及装置
CN113821574A (zh) 用户行为分类方法和装置及存储介质
CN110727885A (zh) 一种互联网全局统一标识符生成系统及其生成方法
US20230316106A1 (en) Method and apparatus for training content recommendation model, device, and storage medium
CN111523068A (zh) 页面配置方法、装置、服务器及存储介质
JP2014002683A (ja) コンテンツ配信装置
CN111436213A (zh) 基于情感分析选择视觉元素的系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170301

RJ01 Rejection of invention patent application after publication