发明内容
有鉴于此,本发明提供的一种网络电视数据的差异分析方法及装置,主要目的在于解决人工将统计后的业务营收数据与核对信息表进行逐一核对费时费力,导致IPTV运营商核对及获取业务营收数据时的效率较低的问题。
为了解决上述问题,本发明主要提供如下技术方案:
一方面,本发明提供了一种网络电视数据的差异分析方法,该方法包括:
数据分析设备获取日志数据、网络电视IPTV运营商的用户ID以及核对信息表,所述日志数据由第三方运营商提供且其以用户行为方式记录了IPTV运营商的业务营收数据,所述用户ID为所述IPTV运营商中用户的唯一标识信息,所述核对信息表中包含所述第三方运营商提供的所述IPTV运营商的第一汇总业务营收数据;
根据所述用户ID从所述日志数据中获取所述IPTV运营商的第一明细业务营收数据以及第二汇总业务营收数据;
确定所述第一汇总业务营收数据与所述第二汇总业务营收数据之间的误差是否超过预定误差阈值;
若确定超过预定误差阈值,则从所述第三方运营商获取所述IPTV运营商的第二明细业务营收数据;
将所述第一明细业务营收数据与所述第二明细业务营收数据进行比对,并输出显示所述第一明细业务营收数据与所述第二明细业务营收数据之间的差异数据
另一方面,本发明还提供一种网络电视数据的差异分析装置,该装置包括:
第一获取单元,用于获取日志数据、网络电视IPTV运营商的用户ID以及核对信息表,所述日志数据由第三方运营商提供且其以用户行为方式记录了IPTV运营商的业务营收数据,所述用户ID为所述IPTV运营商中用户的唯一标识信息,所述核对信息表中包含所述第三方运营商提供的所述IPTV运营商的第一汇总业务营收数据;
第二获取单元,用于在第一获取单元获取所述日志数据、所述用户ID以及所述核对信息表后,根据所述用户ID从所述日志数据中获取所述IPTV运营商的第一明细业务营收数据以及第二汇总业务营收数据;
确定单元,用于确定所述第一获取单元获取的所述第一汇总业务营收数据与所述第二获取单元获取的所述第二汇总业务营收数据之间的误差是否超过预定误差阈值;
第三获取单元,用于当所述确定单元确定超过预定误差阈值时,从所述第三方运营商获取所述IPTV运营商的第二明细业务营收数据;
比对单元,用于将所述第二获取单元获取的所述第一明细业务营收数据与所述第三获取单元获取的所述第二明细业务营收数据进行比对;
显示单元,输出显示所述比对单元比对的所述第一明细业务营收数据与所述第二明细业务营收数据之间的差异数据。
借由上述技术方案,本发明提供的技术方案至少具有下列优点:
本发明提供的网络电视数据的差异分析方法及装置,数据分析装置获取日志数据、网络电视IPTV运营商的用户ID以及包含IPTV运营商的第一汇总业务营收数据的核对信息表之后,根据该用户ID从该日志数据中获取IPTV运营商的第一明细业务营收数据以及第二汇总业务营收数据,确定该第一汇总业务营收数据与该第二汇总业务营收数据之间的误差是否超过预定误差阈值,当确定超过预定误差阈值时,从第三方运营商获取IPTV运营商的第二明细业务营收数据;将所述第一明细业务营收数据与所述第二明细业务营收数据进行比对,并输出显示所述第一明细业务营收数据与所述第二明细业务营收数据之间的差异数据。与现有技术相比,本发明在获取日志数据与核对信息表中的差异数据时无需人工操作,通过比较第一汇总业务营收数据与第二汇总业务营收数据确定两者之间的误差超过预定误差阈值时,比较第一明细业务营收数据与第二明细业务营收数据,并输出显示日志数据与核对信息表中的差异数据,提高了IPTV运营商核对及获取业务营收数据的效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种网络电视数据的差异分析方法,如图1所示,该方法包括:
101、数据分析设备获取日志数据、网络电视IPTV运营商的用户ID以及核对信息表。
本发明实施例中,该日志数据由第三方运营商提供且其以用户行为方式记录了IPTV运营商的业务营收数据;该用户ID为IPTV运营商中用户的唯一标识信息;该核对信息表中包含第三方运营商提供的IPTV运营商的第一汇总业务营收数据,其中,第一汇总业务营收数据为第三方运营商汇总后的IPTV运营商的业务营收数据;本发明实施例中,用户行为包括但不局限于以下内容:直播、点播、回看以及对增值服务(产品包)的购买信息等,用户需要对上述用户行为进行购买,IPTV运营商通过获取该些用户行为来统计业务营收数据。
需要说明的是,日志数据中包含了多个运营商的业务营收数据,例如,该日志数据中包含IPTV运营商的数据、电信运营商的数据、联通运营商的数据等等;在日志数据中通过不同的用户ID信息来区别不同的运营商。本发明实施例对日志数据中具体包含的内容不进行限定。
在本发明实施例的一种实现方式中,在获取日志数据、用户ID、核对信息表之前,手动将日志数据、用户ID、核对信息表导入到数据分析设备中的数据库中,当IPTV运营商需要获取其业务营收数据时,数据分析设备从该数据库中获取日志数据、用户ID、核对信息表。
102、根据所述用户ID从所述日志数据中获取所述IPTV运营商的第一明细业务营收数据以及第二汇总业务营收数据。
基于步骤101中获取的用户ID与日志数据,数据分析设备根据用户ID从日志数据中获取IPTV运营商的第一明细业务数据以及第二汇总业务营收数据。需要说明的是,数据分析设备在基于用户ID从日志数据中获取数据时,首先获取到IPTV运营商中每个用户的第一明细业务营收数据,在对获取到的第一明细业务营收数据进行汇总得到第二汇总业务营收数据。
为了能够更清楚的说明数据分析设备如何根据用户ID从日志数据中获取第一明细业务营收数据,以下将以示例的形式进行详尽说明。示例性的,如表1所示,表1为本发明实施例提供的日志数据内容的示意图;假设,日志数据中包含IPTV运营商的数据、联通运营商的数据,其中,用户IDUser-001、User-002、User-004…表示IPTV运营商中的用户;用户ID User-003表示联通运营商中的用户,在IPTV运营商获取到其用户的用户IDUser-001、User-002、User-004之后,基于ID User-001、User-002、User-004遍历该日志数据,获取该些用户ID对应的明细业务营收数据;获取到用户ID对应的明细业务营收数据之后,对该些明细业务营收数据进行汇总,得到该些用户ID对应的汇总业务营收数据。以上仅为示例性的举例,本发明实施例对日志数据内容、用户ID及用户ID对应的明细业务营收数据等内容不进行限定。
表1
用户ID |
用户行为 |
金额 |
User-001 |
直播、产品包 |
1000 |
User-002 |
直播 |
800 |
User-003 |
点播、回看 |
560 |
User-004 |
点播、直播、产品包 |
1400 |
…… |
…… |
…… |
103、确定所述第一汇总业务营收数据与所述第二汇总业务营收数据之间的误差是否超过预定误差阈值。
将步骤101获取的第一汇总业务营收数据与步骤102中获取的第二汇总业务营收数据进行比对,确认两者的误差是否超过预定误差阈值,若两者的误差超过预定误差阈值,则执行步骤104;若两者的误差未超过预定误差阈值,则数据分析设备将包含第一汇总业务营收数据的核对信息表与第二汇总业务营收数据进行保存。
其中,所述预定误差阈值为人为预设的参数,在设置该预定误差阈值时,预定误差阈值设置的越小,说明第一汇总业务营收数据与第二汇总业务营收数据之间的误差越小,极端情况下,可以设置预定误差阈值为0,说明第一汇总业务营收数据与所述第二汇总业务营收数据完全相同;预定误差阈值设置的越大,说明第一汇总业务营收数据与所述第二汇总业务营收数据之间的误差越大;具体在设置预定误差阈值时,需要根据本发明在具体实施时的实际需求,本发明实施例对预定误差阈值的具体值不进行限定。
示例性的,数据分析设备获取的第一汇总业务营收数据为10万,获取的第二汇总业务营收数据为10.6万,确定第一汇总业务营收数据与第二汇总业务营收数据之间的误差为0.6万;若预定误差阈值为5%,误差值0.6万超过预定误差阈值5%,则执行步骤104;若预定误差阈值为10%,误差值0.6万未超过预定误差阈值10%,则将第一汇总业务营收数据10万与第二汇总业务营收数据10.6万进行保存。
104、若确定超过预定误差阈值,则从所述第三方运营商获取所述IPTV运营商的第二明细业务营收数据。
当确定第一汇总业务营收数据与第二汇总业务营收数据之间的误差超过预定误差阈值时,数据分析设备从第三方运营商获取IPTV运营商的第二明细业务营收数据,该第二明细业务营收数据中包含第三方运营商统计的IPTV运营商中每个用户的用户行为对应的业务营收数据。
105、将所述第一明细业务营收数据与所述第二明细业务营收数据进行比对,并输出显示所述第一明细业务营收数据与所述第二明细业务营收数据之间的差异数据。
数据分析设备将第一明细业务营收数据与第二明细业务营收数据进行逐一比对,输出显示第一明细业务营收数据与第二明细业务营收数据之间的差异数据,该差异数据可以包括不同用户行为对应的业务营收数据,也可以包括同一用户中的不同业务营收数据,具体的本发明实施例对差异数据的内容不进行限定。
本发明实施例提供的网络电视数据的差异分析方法,数据分析装置获取日志数据、网络电视IPTV运营商的用户ID以及包含IPTV运营商的第一汇总业务营收数据的核对信息表之后,根据该用户ID从该日志数据中获取IPTV运营商的第一明细业务营收数据以及第二汇总业务营收数据,确定该第一汇总业务营收数据与该第二汇总业务营收数据之间的误差是否超过预定误差阈值,当确定超过预定误差阈值时,从第三方运营商获取IPTV运营商的第二明细业务营收数据;将所述第一明细业务营收数据与所述第二明细业务营收数据进行比对,并输出显示所述第一明细业务营收数据与所述第二明细业务营收数据之间的差异数据。与现有技术相比,本发明实施例在获取日志数据与核对信息表中的差异数据时无需人工操作,通过比较第一汇总业务营收数据与第二汇总业务营收数据确定两者之间的误差超过预定误差阈值时,比较第一明细业务营收数据与第二明细业务营收数据,并输出显示日志数据与核对信息表中的差异数据,提高了IPTV运营商核对及获取业务营收数据的效率。
进一步的,作为对上述方法的细化和扩展,在上述步骤102所述用户ID从日志数据中获取第一明细业务营收数据以及第二汇总业务营收数据时,数据分析设备对日志数据进行解析,基于用户ID对解析后的日志数据进行遍历,获取第一明细业务营收数据;对获取的第一明细业务营收数据进行加和汇总,获得第二汇总业务营收数据。
在本发明实施例的一种实现方式中,请继续参考表1,并同时参考表2,表2示出了本发明实施例提供的第一明细业务营收数据以及第二汇总业务营收数据的示意图,当数据分析设备遍历表1所示的日志数据时,根据用户ID User-001、User-002、User-004…获取第一明细业务营收数据,并对获取的第一明细业务营收数据汇总,得到第二汇总业务营收数据。其中表2仅为示例性的举例,本发明实施例对第一明细业务营收数据以及第二汇总业务营收数据的具体形式及具体内容不进行具体限定。
表2
进一步的,当确定第一汇总业务营收数据与第二汇总业务营收数据之间的误差超过预定误差阈值时,向第三方运营商发送获取第二明细业务营收数据的请求信息,在第三方运营商对该请求信息进行响应之后,向数据分析设备下发第二明细业务营收数据,数据分析设备接收第三方运营商发送的第二明细业务营收数据。需要说明的是,向第三方运营商发送获取第二明细业务营收数据的请求信息,第三方运营商确定本地是否存储有第二明细业务营收数据,若存在,则将第二明细业务营收数据发送给数据分析设备;若不存在,则第三方运营商向第三方运营商服务器请求获取第二明细业务营收数据,第三方运营商获取第二明细业务营收数据之后,将该第二明细业务营收数据发送给数据分析设备。
进一步的,在数据分析设备获取日志数据、IPTV运营商的用户ID以及核对信息表之前,获取日志数据、用户ID以及核对信息表的数据格式,检测日志数据、用户ID以及核对信息表的数据格式与数据分析设备其自身的数据格式是否匹配;若不匹配,则配置数据分析设备其自身的数据格式。示例性的,若数据分析设备检测到核对信息表的数据格式为2行3列,但数据分析设备核对信息表对应的数据格式为5行2列,数据分析设备需要将其自身的数据格式配置为5行3列,或者2行3列。本发明实施例对日志数据、IPTV运营商的用户ID以及核对信息表的数据格式不进行限定。
进一步的,以下将对数据分析设备执行数据差异分析的方法进行一个汇总描述,本发明实施例还提供另一种网络电视数据的差异分析方法,如图2所示,该方法包括:
201、检测日志数据、用户ID以及核对信息表的数据格式与数据分析设备其自身的数据格式是否匹配。
若不匹配,则执行步骤202;若匹配,则执行步骤203。
202、配置数据分析设备其自身的数据格式。
在配置完数据分析设备其自身的数据格式之后,继续执行步骤203。
203、获取日志数据、IPTV运营商的用户ID以及核对信息表。
204、根据用户ID从日志数据中获取IPTV运营商的第一明细业务营收数据以及第二汇总业务营收数据。
205、确定第一汇总业务营收数据与第二汇总业务营收数据之间的误差是否超过预定误差阈值。
若确定超过预定误差阈值,则执行步骤206;若确定未超过预定误差阈值,则执行步骤207。
206、从第三方运营商获取IPTV运营商的第二明细业务营收数据。
207、保存第一汇总业务营收数据与第二汇总业务营收数据。
208、将所述第一明细业务营收数据与所述第二明细业务营收数据进行比对,并输出显示所述第一明细业务营收数据与所述第二明细业务营收数据之间的差异数据。
进一步的,作为对上述方法的实现,本发明实施例还提供一种网络电视数据的差异分析装置,如图3所示,所述装置包括:
第一获取单元31,用于获取日志数据、IPTV运营商的用户ID以及核对信息表,所述日志数据由第三方运营商提供且其以用户行为方式记录了IPTV运营商的业务营收数据,所述用户ID为所述IPTV运营商中用户的唯一标识信息,所述核对信息表中包含所述第三方运营商提供的所述IPTV运营商的第一汇总业务营收数据;
第二获取单元32,用于在第一获取单元31获取所述日志数据、所述用户ID以及所述核对信息表后,根据所述用户ID从所述日志数据中获取所述IPTV运营商的第一明细业务营收数据以及第二汇总业务营收数据;
确定单元33,用于确定所述第一获取单元31获取的所述第一汇总业务营收数据与所述第二获取单元32获取的所述第二汇总业务营收数据之间的误差是否超过预定误差阈值;
第三获取单元34,用于当所述确定单元33确定超过预定误差阈值时,从所述第三方运营商获取所述IPTV运营商的第二明细业务营收数据;
比对单元35,用于将所述第二获取单元32获取的所述第一明细业务营收数据与所述第三获取单元34获取的所述第二明细业务营收数据进行比对;
显示单元36,输出显示所述比对单元比对的所述第一明细业务营收数据与所述第二明细业务营收数据之间的差异数据。
进一步的,如图4所示,所述第二获取单元32包括:
解析模块321,用于解析所述日志数据;
第一获取模块322,用于在解析模块321解析所述日志数据后,根据所述用户ID获取所述第一明细业务营收数据;
汇总模块323,用于将所述第一获取模块322获取的所述第一明细业务营收数据进行汇总;
第二获取模块324,用于在所述汇总模块323将所述第一明细业务营收数据进行汇总后,获取所述第二汇总业务营收数据。
进一步的,如图4所示,所述第三获取单元34包括:
发送模块341,用于向所述第三方运营商发送获取所述第二明细业务营收数据请求信息;
接收模块342,用于接收所述第三方运营商发送的所述第二明细业务营收数据;
获取模块,用于获取所述接收模块342接收的所述第二明细业务营收数据。
进一步的,如图4所示,所述装置还包括:
第四获取单元37,用于在所述第一获取单元31获取日志数据、IPTV运营商的用户ID以及核对信息表之前,获取所述日志数据、所述用户ID以及所述核对信息表的数据格式;
检测单元38,用于检测所述日志数据、所述用户ID以及所述核对信息表的数据格式与所述第四获取单元37获取的所述数据分析设备其自身的数据格式是否匹配;
配置单元39,当所述检测单元38检测所述日志数据、所述用户ID以及所述核对信息表的数据格式与数据分析设备其自身的数据格式不匹配时,配置数据分析设备其自身的数据格式。
进一步的,如图4所示,所述装置还包括:
保存单元310,用于当所述确定单元33确定所述第一汇总业务营收数据与所述第二汇总业务营收数据之间的误差未超过预定误差阈值时,保存所述第一汇总业务营收数据与所述第二汇总业务营收数据。
本发明实施例提供的网络电视数据的差异分析装置,数据分析装置获取日志数据、网络电视IPTV运营商的用户ID以及包含IPTV运营商的第一汇总业务营收数据的核对信息表之后,根据该用户ID从该日志数据中获取IPTV运营商的第一明细业务营收数据以及第二汇总业务营收数据,确定该第一汇总业务营收数据与该第二汇总业务营收数据之间的误差是否超过预定误差阈值,当确定超过预定误差阈值时,从第三方运营商获取IPTV运营商的第二明细业务营收数据;将所述第一明细业务营收数据与所述第二明细业务营收数据进行比对,并输出显示所述第一明细业务营收数据与所述第二明细业务营收数据之间的差异数据。与现有技术相比,本发明实施例在获取日志数据与核对信息表中的差异数据时无需人工操作,通过比较第一汇总业务营收数据与第二汇总业务营收数据确定两者之间的误差超过预定误差阈值时,比较第一明细业务营收数据与第二明细业务营收数据,并输出显示日志数据与核对信息表中的差异数据,提高了IPTV运营商核对及获取业务营收数据的效率。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
可以理解的是,上述方法及装置中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的发明名称(如确定网站内链接等级的装置)中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。