CN108449609A - 直播间事件的识别方法及装置、电子设备、机器可读介质 - Google Patents

直播间事件的识别方法及装置、电子设备、机器可读介质 Download PDF

Info

Publication number
CN108449609A
CN108449609A CN201810136116.6A CN201810136116A CN108449609A CN 108449609 A CN108449609 A CN 108449609A CN 201810136116 A CN201810136116 A CN 201810136116A CN 108449609 A CN108449609 A CN 108449609A
Authority
CN
China
Prior art keywords
direct broadcasting
broadcasting room
character information
interactive data
affair character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810136116.6A
Other languages
English (en)
Other versions
CN108449609B (zh
Inventor
郭酉晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Information Technology Co Ltd
Original Assignee
Guangzhou Huya Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Information Technology Co Ltd filed Critical Guangzhou Huya Information Technology Co Ltd
Priority to CN201810136116.6A priority Critical patent/CN108449609B/zh
Publication of CN108449609A publication Critical patent/CN108449609A/zh
Application granted granted Critical
Publication of CN108449609B publication Critical patent/CN108449609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25833Management of client data involving client hardware characteristics, e.g. manufacturer, processing or storage capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25841Management of client data involving the geographical location of the client
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本申请提供一种直播间事件的识别方法及装置、电子设备、机器可读介质,该方法可以包括:获取直播间内的互动数据;当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件;其中,所述事件特征信息与所述目标监控事件相关联。通过本申请的技术方案,一方面可提高识别直播间内目标监控事件的准确率;另一方面可以使得对目标监控事件的识别具有及时性和实时性。

Description

直播间事件的识别方法及装置、电子设备、机器可读介质
技术领域
本申请涉及互联网技术,尤其涉及直播技术。
背景技术
网络直播作为新兴的社交方式,越来越受人们的欢迎。观看网络直播已经成为人们日常的一种娱乐方式。为了保证直播间的直播正常进行,需要对直播间进行监控以及时识别出该直播间出现的影响观众观看体验(比如,卡顿、中断、声音画面不同步等)的问题,从而提醒后台技术人员采取相应的措施来解决这些问题。
在相关技术中,根据与直播相关联的技术层面的数据来识别直播间可能发生的各种问题。例如,识别的依据可以是CDN(Content Delivery Network,内容分发网络)推流反馈时长、服务器的稳定性、服务器的核心数据等。
然而,相关技术中技术层面的数据并不能够直观、准确、及时地反映出直播间的实际状况,导致识别操作的准确性和及时性较差,从而影响直播的正常进行。
发明内容
有鉴于此,本申请提供一种直播间事件的识别方法及装置、电子设备、机器可读介质,可以准确、及时地识别出直播间发生的事件。
为实现上述目的,本申请提供技术方案如下:
根据本申请的第一方面,提出了一种直播间事件的识别方法,包括:
获取直播间内的互动数据;
当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件;其中,所述事件特征信息与所述目标监控事件相关联。
可选的,所述事件特征信息基于历史互动数据获得,具体步骤包括:
根据对所述历史互动数据的语义分析,筛选与所述目标监控事件相关联的历史互动数据;
对筛选结果进行分词,并根据词频率确定候选词;
根据对所述候选词的词义分析,筛选与所述目标监控事件相关联的候选词,所述事件特征信息与所筛选出的候选词对应。
可选的,
所述互动数据包含以下至少之一:弹幕消息、语音消息;
所述目标监控事件包含以下至少之一:直播间卡顿、直播间故障。
可选的,所述预设策略基于统计参量确定;其中,所述统计参量为所述互动数据中出现所述事件特征信息的频率阈值,或者所述统计参量包括所述频率阈值和超过所述频率阈值的持续时长阈值。
可选的,还包括:
按照预设维度统计直播间内互动数据中所述事件特征信息的出现次数,并确定所述出现次数的变化趋势。
可选的,
所述预设维度包含以下至少之一:时间段、地区、线路、网络通信运营商、客户端版本、客户端类型;
所述出现次数包含以下至少之一:人均出现次数、出现次数总量。
根据本申请的第二方面,提出了一种直播间事件的识别装置,包括:
获取单元,获取直播间内的互动数据;
判定单元,当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件;其中,所述事件特征信息与所述目标监控事件相关联。
可选的,所述事件特征信息基于历史互动数据获得,具体步骤包括:
根据对所述历史互动数据的语义分析,筛选与所述目标监控事件相关联的历史互动数据;
对筛选结果进行分词,并根据词频率确定候选词;
根据对所述候选词的词义分析,筛选与所述目标监控事件相关联的候选词,所述事件特征信息与所筛选出的候选词对应。
可选的,
所述互动数据包含以下至少之一:弹幕消息、语音消息;
所述目标监控事件包含以下至少之一:直播间卡顿、直播间故障。
可选的,所述预设策略基于统计参量确定;其中,所述统计参量为所述互动数据中出现所述事件特征信息的频率阈值,或者所述统计参量包括所述频率阈值和超过所述频率阈值的持续时长阈值。
可选的,还包括:
统计单元,按照预设维度统计直播间内互动数据中所述事件特征信息的出现次数,并确定所述出现次数的变化趋势。
可选的,
所述预设维度包含以下至少之一:时间段、地区、线路、网络通信运营商、客户端版本、客户端类型;
所述出现次数包含以下至少之一:人均出现次数、出现次数总量。
根据本申请的第三方面,提出了一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器耦合于所述存储器,用于读取所述存储器存储的程序指令,并作为响应,执行如下操作:
获取直播间内的互动数据;
当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件;其中,所述事件特征信息与所述目标监控事件相关联。
根据本申请的第四方面,提出了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如上述技术方案中任一项所述方法的步骤。
由以上技术方案可见,一方面,本申请基于直播间用户发送的互动数据可准确反映出用户了解到的直播状况的特点,通过从所有的互动数据中识别出部分互动数据中包含的事件特征信息,并根据事件特征信息和预设策略来判定直播间是否发生了目标监控事件,可提高识别直播间内目标监控事件的准确率。另一方面,本申请基于互动数据由用户在直播间内进行实时互动时产生的特点,以互动数据为依据可及时地识别出直播间发生的目标监控事件,从而使得对目标监控事件的识别具有及时性和实时性。
附图说明
图1是本申请一示例性实施例示出的一种直播间事件的识别方法的流程图。
图2是本申请一示例性实施例示出的另一种直播间事件的识别方法的流程图。
图3是观众侧客户端发送弹幕消息的流程图。
图4是本申请一示例性实施例示出的一种电子设备的结构示意图。
图5是本申请一示例性实施例示出的一种直播间事件的识别装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
一方面,在直播间进行直播的过程中,若出现直播间卡顿、故障等事件,则会极大影响直播间观众的观看体验;因此,需要对直播间的直播状况进行监控,以准确及时地识别出直播间发生的上述事件,从而可据此提醒后台技术人员采取相应的措施来应对这些事件。另一方面,直播间的观众可通过在直播间发送互动数据来与其他观众或主播进行实时互动,而直播间的观众又可在观众侧的直播客户端了解到直播间的实时直播状况;申请人经过分析后发现,当出现直播间卡顿、故障等问题时,互动数据中往往包含与这些事件相关的内容。因此,申请人提出可基于直播间内的互动数据来准确快速地识别出该直播间发生的事件。
本申请提供一种直播间事件的识别方法,基于直播间内的互动数据来判定直播间是否发生了目标监控事件。为对本申请进行进一步说明,提供下列实施例。
图1是本申请一示例性实施例示出的一种直播间事件的识别方法的流程图。如图1所示,作为示例,该识别方法可应用于服务端,可以包括以下步骤:
步骤102,获取直播间内的互动数据。
在本实施例中,直播间的观众与观众之间以及观众与主播之间,可通过互动数据进行实时互动。具体的,所述互动数据可以包含以下至少之一:弹幕消息、语音消息。以互动数据为弹幕消息为例,当直播间出现卡顿(体现于观众侧的直播客户端)时,观众从观众侧的直播客户端感知到该卡顿事件后,便可通过发送弹幕消息来与主播或其他观众来讨论该卡顿事件;比如,观众可发送弹幕消息“我这边好卡呀!你们卡不卡?”。可见,用于讨论与直播间发生的事件相关的互动数据可直观准确地体现出观众和主播对于该事件的了解情况;同时,互动数据为在直播的过程中实时产生的,可实时反映出直播过程中发生的各种事件。因此,根据互动数据来识别目标监控事件(可以理解为需要监控的事件,可由用户自定义),有利于提高识别直播间内目标监控事件的准确率和效率。
步骤104,当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件。
在本实施例中,并不是所有的互动数据均可反映出直播间是否发生了目标监控事件;以弹幕消息为例,即便直播间发生了卡顿事件,弹幕消息“主播操作666”也并不能够反映出该卡顿事件。因此,可通过事件特征信息来确定出获取到的互动数据中与目标监控事件相关的互动数据(以下简称为目标互动数据)。其中,所述事件特征信息与目标监控事件相关联,所述目标监控事件包含以下至少之一:直播间卡顿、直播间故障。当然,直播间卡顿和直播间故障的具体表现形式可由用户自定义,比如直播间故障可以是黑屏、无限缓存、声音画面不同步等,本申请并不对此进行限制。
作为一实施例,所述事件特征信息可基于历史互动数据获得,从历史互动数据中筛选出与目标监控事件相关联的词汇,再根据所筛选出的词汇来生成相应的事件特征信息。而为了提高筛选与目标监控事件相关联的词汇的准确率,可结合语义分析和词义分析进行筛选,具体步骤可以包括:根据对所述历史互动数据的语义分析,筛选与所述目标监控事件相关联的历史互动数据;对筛选结果进行分词,并根据词频率确定候选词;根据对所述候选词的词义分析,筛选与所述目标监控事件相关联的候选词,所述事件特征信息与所筛选出的候选词对应。其中,针对语义分析、分词和词义分析,可由相应的分析工具(比如,用于语义分析的机器学习模型)和分词工具来执行,也可由人工来执行。以识别直播卡顿事件为例,可先筛选出包含“卡”的历史互动数据作为与目标监控事件相关联的历史互动数据,并对筛选结果进行分词;再从分词结果中选取出现频率最高的前5000名作为候选词,并根据对这些候选词的词义分析(例如,可先筛选出包含“卡”的候选词,再人工筛选出其中表达“卡顿”含义的词汇),筛选与目标监控事件相关联的候选词作为事件特征信息。
基于上述对事件特征信息的筛选,当互动数据中包含事件特征信息时,确定该互动数据属于目标互动数据。进一步的,可按照目标监控事件的类型,筛选出相应类型的事件特征信息。那么,当互动数据中包含任一类型的事件特征信息时,确定该互动数据属于该任一类型的目标监控事件的目标互动数据。例如,分别按照直播间卡顿和直播间故障筛选出相应的事件特征信息(比如,属于直播间卡顿的事件特征信息为“卡顿”、“卡帧”、“卡屏”等;属于直播间故障的事件特征信息为“黑屏”、“服务器爆炸”、“直播中断”等),假定获取到的互动数据中的某一互动数据包含“卡顿”,则确定该互动数据属于直播间卡顿事件的目标互动数据,即该互动数据反映出直播间发生了卡顿事件。
在本实施例中,对于同一直播间,由于每个观众观看到的该直播间的实际直播状况可能存在差异(例如,虽然直播间的直播正常进行,但是由于少部分观众因自身的网络问题,导致观看的直播间出现卡顿事件),需要制定预设策略并据此来判断直播间是否发生了目标监控事件。
作为一实施例,所述预设策略可基于统计参量确定;所述统计参量为所述互动数据中出现所述事件特征信息的频率阈值,或者所述统计参量可包括所述频率阈值和超过所述频率阈值的持续时长阈值。其中,互动数据中出现事件特征信息,即该互动数据为目标互动数据;那么上述频率阈值可理解为获取到的互动数据中出现目标互动数据的频率阈值,也就是目标互动数据的发送频率阈值。当然,频率阈值和持续时长阈值的具体取值可根据实际情况灵活设定,本申请并不对此进行限制。
例如,在一种情况下,预设策略可以是互动数据中出现事件特征信息的频率(即互动数据中出现目标互动数据的频率)超过频率阈值;在另一种情况下,预设策略可以是互动数据中出现事件特征信息的频率超过频率阈值,且该频率超过频率阈值的持续时长超过持续时长阈值。
需要说明的是,当判定直播间发生了目标监控事件时,可生成对应于该目标监控事件的提醒消息以提示后台技术人员。
在本申请的技术方案中,还可以按照预设维度统计直播间内互动数据中所述事件特征信息的出现次数(可理解为目标互动数据的发送量),并确定所述出现次数的变化趋势。其中,所述预设维度包含以下至少之一:时间段、地区、线路、网络通信运营商、客户端版本、客户端类型(比如电脑版、手机版);所述出现次数包含以下至少之一:人均出现次数(可理解为目标互动数据的人均发送量)、出现次数总量(可理解为目标互动数据的发送总量)。基于对目标互动数据在预设维度上的变化趋势的统计,可衡量直播间的直播质量在预设维度上的变化趋势,那么后台技术人员可以据此在预设维度上对直播质量进行定向优化,从而改善直播质量。以目标互动数据为反映卡顿事件的弹幕消息、预设维度为时间段,出现次数为人均出现次数(即反映卡顿事件的弹幕消息的人均发送量)为例,当时间段19:00-22:00内反映卡顿事件的弹幕消息的发送量长期处于较高水平时,说明该时间段内的直播质量较差;那么技术人员可针对该时间段内的直播服务进行定向优化,比如在该时间段内增加服务器的数量以提高数据处理能力。
由以上技术方案可见,一方面,本申请基于直播间用户发送的互动数据可准确反映出用户了解到的直播状况的特点,通过从所有的互动数据中识别出部分互动数据中包含的事件特征信息,并根据事件特征信息和预设策略来判定直播间是否发生了目标监控事件,可提高识别直播间内目标监控事件的准确率。另一方面,本申请基于互动数据由用户在直播间内进行实时互动时产生的特点,以互动数据为依据可及时地识别出直播间发生的目标监控事件,从而使得对目标监控事件的识别具有及时性和实时性。
为了便于理解,下面结合具体场景和附图,以互动数据为弹幕消息为例,对本申请的技术方案进行详细说明。
请参见图2,图2是本申请一示例性实施例示出的另一种直播间事件的识别方法的流程图。如图2所示,作为示例,该识别方法可应用于服务端,可以包括以下步骤:
步骤202,获取历史弹幕消息。
在本实施例中,下面结合图3(以观众A发送弹幕消息为例)对获取历史弹幕消息的操作进行说明。如图3所示,观众A在直播间发送弹幕消息的过程可包括以下步骤:
在步骤302中,观众A客户端生成弹幕消息。
在步骤304中,观众A客户端向服务器发送生成的弹幕消息。
在步骤306中,服务器接收弹幕消息。
在步骤308A中,服务器向其他客户端转发弹幕消息。
在步骤308B中,服务器向观众A客户端转发弹幕消息。
可见,弹幕消息需先发送至服务器,再由服务器进行转发。因此,服务器可对接收到的弹幕消息进行保存,从而可用于本步骤中对于历史弹幕消息的获取。
步骤204,生成事件特征信息。
在本实施例中,直播间的观众与观众之间以及观众与主播之间,可通过发送弹幕消息进行实时互动。比如,当直播间出现卡顿(体现于观众侧的直播客户端)时,在观众从观众侧的直播客户端感知到该卡顿事件后,可通过发送弹幕消息来与主播或其他观众来讨论该卡顿事件。例如,观众可发送弹幕消息“啊!卡爆了!”。可见,该类弹幕消息可直观准确地反映出直播间发生的卡顿事件。同时,弹幕消息为在直播的过程中实时产生的,可实时反映出直播过程中发生的各种事件。因此,根据弹幕消息来识别目标监控事件(可以理解为需要监控的事件,可由用户自定义),有利于提高识别直播间内目标监控事件的准确率和效率。同时,基于弹幕消息的上述特点,可在直播间鼓励观众通过发送弹幕消息来反映各种目标监控事件。例如,可在直播公告中标明“欢迎大家通过发送弹幕来反映直播间出现卡顿、故障等问题”。
但是,并非所有的互动数据均可反映出直播间是否发生了目标监控事件(包括直播间卡顿、直播间故障等)。比如,即便直播间发生了卡顿事件,诸如“主播一般几点开播呀?”这类的弹幕消息也并不能够反映出该卡顿事件。因此,可通过事件特征信息(与目标监控事件相关联)来确定出与目标监控事件相关联的弹幕消息。而事件特征信息可基于上述步骤202获取到的历史弹幕消息来生成,从历史弹幕消息中筛选出与目标监控事件相关联的词汇,再根据所筛选出的词汇来生成相应的事件特征信息。
进一步的,为了提高筛选与目标监控事件相关联的词汇的准确率,可结合语义分析和词义分析进行筛选。具体的,可先根据对历史弹幕消息的语义分析,筛选与目标监控事件相关联的历史弹幕消息(即其语义为可体现出发生目标监控事件的历史弹幕消息),再对筛选结果进行分词,并根据词频率确定出候选词;然后再根据对候选词的词义分析,筛选出与目标监控事件相关联的候选词(即其词义为可体现出目标监控事件的词汇);最后将筛选出的候选词作为事件特征信息即可。其中,针对语义分析、分词和词义分析,可由相应的分析工具(比如,用于语义分析的机器学习模型)和分词工具来执行,也可由人工来执行。同时,考虑到目标监控事件可能存在不止一种类型,那么可按照目标监控事件的类型,从历史弹幕消息中筛选出相应类型的事件特征信息。当后续实时获取的弹幕消息中包含某一类型的事件特征信息时,可确定该弹幕消息属于反映出该类型目标监控事件的弹幕消息。
举例而言,可先筛选出包含“卡”的历史弹幕消息作为与卡顿事件相关联的历史弹幕消息,并利用分词工具对筛选结果进行分词;再从分词结果中选取出现频率最高的前5000名作为候选词,并根据对这些候选词的词义分析(例如,可先筛选出包含“卡”的候选词,再人工筛选出其中表达“卡顿”含义的词汇),筛选出卡顿事件的事件特征信息。同理,可按照上述过程筛选出故障事件的事件特征信息。比如,属于直播间卡顿的事件特征信息为“卡顿”、“卡帧”、“卡屏”等;属于直播间故障的事件特征信息为“黑屏”、“服务器爆炸”、“直播中断”等。而针对不同类型的事件特征信息,如表1所示,可配置不同类型的数据库用于存储各自所属类型的事件特征信息:
数据库 所存储事件特征信息的类型
卡顿数据库 反映直播间卡顿事件
故障数据库 反映直播间故障事件
表1
步骤206,实时获取弹幕消息。
在本实施例中,对于直播间内弹幕消息的实时获取,可通过上述步骤306中对弹幕消息的接收操作来完成。当然,也可以通过其他方式实时获取弹幕消息,本申请并不对此进行限制。
步骤208,识别事件特征信息。
在本实施例中,基于上述对事件特征信息的筛选以及数据库的配置,即可查找弹幕消息中是否携带数据库中存储的事件特征信息。当弹幕消息中包含数据库中存储的事件特征信息时,该事件特征信息则为识别出的事件特征信息。同时,针对上述步骤204中按照目标监控事件的类型分别配置不同类型的事件特征信息(存储于各自所属类型的数据库中)的情况,可在各个数据库中分别执行本步骤中的识别操作。
步骤210,判断实时获取的弹幕消息中出现事件特征信息的频率是否超过统计参量;若超过,则转入步骤212,否则转入步骤214。
步骤212,判定直播间发生了目标监控事件。
在本实施例中,对于同一直播间,可能存在以下情况:虽然直播间的直播正常进行,但是由于少部分观众因自身的网络问题,导致观看的直播间出现卡顿事件。在该情况下,即便实际直播间是正常进行的,也可能出现少部分反映直播间出现卡顿事件的弹幕消息。因此,需要制定预设策略来过滤掉此类易导致误判的情况。具体的,预设策略可基于统计参量确定;统计参量为弹幕消息中出现事件特征信息的频率阈值,或者统计参量可包括该频率阈值和超过该频率阈值的持续时长阈值。其中,上述“弹幕消息中出现事件特征信息”可理解为实时获取到的弹幕消息中出现目标弹幕消息(即反映出目标监控事件的弹幕消息),那么频率阈值也就是目标弹幕的发送频率阈值。
举例而言,在一种情况下,可设定预设策略的统计参量为频率阈值500/min,当实时获取到的弹幕消息中出现事件特征信息的频率超过500/min时(比如当直播间内每分钟出现的目标弹幕消息超过500条),可判定直播间发生了目标监控事件。在另一种情况下,可设定预设策略的统计参量包括频率阈值500/min和持续时长阈值5min,当实时获取到的弹幕消息中出现事件特征信息(即出现目标弹幕消息)的频率连续5min超过500/min时,可判定直播间发生了目标监控事件。当然,频率阈值和持续时长阈值的具体取值可根据实际情况灵活设定,本申请并不对此进行限制。同时,对于存在若干不同类型事件特征信息的情况,可分别针对各个类型的事件特征信息执行本步骤的判定操作。例如,承接于表1中的举例,当直播间内出现卡顿数据库中所存储事件特征信息的频率满足预设策略中的条件时,可判定该直播间发生了卡顿事件。而针对故障数据库的判定操作的执行逻辑与上述类似,在此不再赘述。
在本实施例中,当判定出直播间发生了目标监控事件时,可生成对应于该目标监控事件的提醒消息以提示后台技术人员。
步骤214,判定直播间未发生目标监控事件。
由以上技术方案可见,一方面,本申请基于直播间用户发送的互动数据可准确反映出用户了解到的直播状况的特点,通过从所有的互动数据中识别出部分互动数据中包含的事件特征信息,并根据事件特征信息和预设策略来判定直播间是否发生了目标监控事件,可提高识别直播间内目标监控事件的准确率。另一方面,本申请基于互动数据由用户在直播间内进行实时互动时产生的特点,以互动数据为依据可及时地识别出直播间发生的目标监控事件,从而使得对目标监控事件的识别具有及时性和实时性。
在本申请的技术方案中,还可以按照预设维度统计直播间内互动数据中事件特征信息的出现次数(可理解为目标互动数据的发送量),并确定出现次数的变化趋势。其中,预设维度可以包含以下至少之一:时间段、地区、线路、网络通信运营商、客户端版本、客户端类型(比如电脑版、手机版);出现次数包含以下至少之一:人均出现次数(可理解为目标互动数据的人均发送量)、出现次数总量(可理解为目标互动数据的发送总量)。基于对目标互动数据在预设维度上的变化趋势的统计,可衡量直播间的直播质量在预设维度上的变化趋势,那么后台技术人员可以据此在预设维度上对直播质量进行定向优化,从而改善直播质量。下面分别针对各个维度进行详细说明,以下说明均以目标互动数据为反映卡顿事件的弹幕消息(以下简称为卡顿弹幕),以及出现次数为人均出现次数(即卡顿弹幕的人均发送量)为例。
1、时间段
假定当时间段19:00-22:00内直播间卡顿弹幕的人均发送量长期处于较高水平时,说明该时间段内的直播质量较差;那么技术人员可针对该时间段内的直播服务进行优化,比如在该时间段内增加服务器的数量以提高数据处理能力。
2、地区
当某一地区的直播间卡顿弹幕的人均发送量长期处于较高水平,甚至该人均发送量越来越大时,说明该地区内的直播质量较差;那么技术人员可针对该地区内的直播服务进行优化,比如在该地区内增加服务器的数量以提高数据处理能力。
3、线路
当直播间某一条或多条线路上卡顿弹幕的人均发送量长期处于较高水平(比如明显高于其他线路上卡顿弹幕的人均发送量),说明该线路上的直播质量较差;那么技术人员可针对线路进行优化,比如更换线路供应商,拉专线等。
4、网络通信运营商
当直播间内某个网络通信运营商(比如,观众通过手机客户端观看直播,且该观众的手机使用LTE-TDD进行网络通信,此时网络通信运营商为“中国移动”)上卡顿弹幕的人均发送量长期处于较高水平(比如明显高于其他网络通信运营商上卡顿弹幕的人均发送量),说明该网络通信运营商上的直播质量较差;那么技术人员可针对该网络通信运营商进行优化,比如提高该网络通信运营商的信号强度。
5、客户端版本、客户端类型
当直播间内来自某一版本(类型)客户端的卡顿弹幕的人均发送量长期处于较高水平(比如明显高于其他版本或类型的客户端),说明该版本(类型)的客户端上的直播质量较差;那么技术人员可针对该版本(类型)的客户端的直播服务进行优化。
需要说明的是,变化趋势并不局限于上述的“长期处于较高水平”,也可以为其他任意形式,本申请并不对此进行限制。
图4示出了根据本申请的一示例性实施例的电子设备的结构示意图。请参考图4,在硬件层面,该电子设备包括处理器402、内部总线404、网络接口406、内存408以及非易失性存储器410,当然还可能包括其他业务所需要的硬件。处理器402从非易失性存储器410中读取对应的计算机程序到内存408中然后运行,在逻辑层面上形成直播间事件的识别装置。当然,除了软件实现方式之外,本申请并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参考图5,在软件实施方式中,该直播间事件的识别装置可以包括获取单元502和判定单元504。其中:
获取单元502,获取直播间内的互动数据;
判定单元504,当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件;其中,所述事件特征信息与所述目标监控事件相关联。
可选的,所述事件特征信息基于历史互动数据获得,具体步骤包括:
根据对所述历史互动数据的语义分析,筛选与所述目标监控事件相关联的历史互动数据;
对筛选结果进行分词,并根据词频率确定候选词;
根据对所述候选词的词义分析,筛选与所述目标监控事件相关联的候选词,所述事件特征信息与所筛选出的候选词对应。
可选的,
所述互动数据包含以下至少之一:弹幕消息、语音消息;
所述目标监控事件包含以下至少之一:直播间卡顿、直播间故障。
可选的,所述预设策略基于统计参量确定;其中,所述统计参量为所述互动数据中出现所述事件特征信息的频率阈值,或者所述统计参量包括所述频率阈值和超过所述频率阈值的持续时长阈值。
可选的,还包括:
统计单元506,按照预设维度统计直播间内互动数据中所述事件特征信息的出现次数,并确定所述出现次数的变化趋势。
可选的,
所述预设维度包含以下至少之一:时间段、地区、线路、网络通信运营商、客户端版本、客户端类型;
所述出现次数包含以下至少之一:人均出现次数、出现次数总量。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
相应的,本申请还提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器耦合于所述存储器,用于读取所述存储器存储的程序指令,并作为响应,至少执行如下操作:
获取直播间内的互动数据;
当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件;其中,所述事件特征信息与所述目标监控事件相关联。
当然,还可以执行上述方法实施例中任一方法的步骤,相关之处参见方法实施例的部分说明即可。
在示例性实施例中,还提供了一个或多个包括指令的机器可读介质,例如包括指令的存储器,上述指令可由上述电子设备的处理器执行以完成上述方法,该方法至少可以包括:
获取直播间内的互动数据;
当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件;其中,所述事件特征信息与所述目标监控事件相关联。
当然,该方法还可以包括上述方法实施例中任一方法的步骤,相关之处参见方法实施例的部分说明即可。
其中,所述机器可读介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等,本申请并不对此进行限制。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (14)

1.一种直播间事件的识别方法,其特征在于,包括:
获取直播间内的互动数据;
当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件;其中,所述事件特征信息与所述目标监控事件相关联。
2.根据权利要求1所述的方法,其特征在于,所述事件特征信息基于历史互动数据获得,具体步骤包括:
根据对所述历史互动数据的语义分析,筛选与所述目标监控事件相关联的历史互动数据;
对筛选结果进行分词,并根据词频率确定候选词;
根据对所述候选词的词义分析,筛选与所述目标监控事件相关联的候选词,所述事件特征信息与所筛选出的候选词对应。
3.根据权利要求1所述的方法,其特征在于,
所述互动数据包含以下至少之一:弹幕消息、语音消息;
所述目标监控事件包含以下至少之一:直播间卡顿、直播间故障。
4.根据权利要求1所述的方法,其特征在于,所述预设策略基于统计参量确定;其中,所述统计参量为所述互动数据中出现所述事件特征信息的频率阈值,或者所述统计参量包括所述频率阈值和超过所述频率阈值的持续时长阈值。
5.根据权利要求1所述的方法,其特征在于,还包括:
按照预设维度统计直播间内互动数据中所述事件特征信息的出现次数,并确定所述出现次数的变化趋势。
6.根据权利要求5所述的方法,其特征在于,
所述预设维度包含以下至少之一:时间段、地区、线路、网络通信运营商、客户端版本、客户端类型;
所述出现次数包含以下至少之一:人均出现次数、出现次数总量。
7.一种直播间事件的识别装置,其特征在于,包括:
获取单元,获取直播间内的互动数据;
判定单元,当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件;其中,所述事件特征信息与所述目标监控事件相关联。
8.根据权利要求7所述的装置,其特征在于,所述事件特征信息基于历史互动数据获得,具体步骤包括:
根据对所述历史互动数据的语义分析,筛选与所述目标监控事件相关联的历史互动数据;
对筛选结果进行分词,并根据词频率确定候选词;
根据对所述候选词的词义分析,筛选与所述目标监控事件相关联的候选词,所述事件特征信息与所筛选出的候选词对应。
9.根据权利要求7所述的装置,其特征在于,
所述互动数据包含以下至少之一:弹幕消息、语音消息;
所述目标监控事件包含以下至少之一:直播间卡顿、直播间故障。
10.根据权利要求7所述的装置,其特征在于,所述预设策略基于统计参量确定;其中,所述统计参量为所述互动数据中出现所述事件特征信息的频率阈值,或者所述统计参量包括所述频率阈值和超过所述频率阈值的持续时长阈值。
11.根据权利要求7所述的装置,其特征在于,还包括:
统计单元,按照预设维度统计直播间内互动数据中所述事件特征信息的出现次数,并确定所述出现次数的变化趋势。
12.根据权利要求11所述的装置,其特征在于,
所述预设维度包含以下至少之一:时间段、地区、线路、网络通信运营商、客户端版本、客户端类型;
所述出现次数包含以下至少之一:人均出现次数、出现次数总量。
13.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器耦合于所述存储器,用于读取所述存储器存储的程序指令,并作为响应,执行如下操作:
获取直播间内的互动数据;
当所述互动数据中携带事件特征信息时,基于所述事件特征信息以及预设策略,判定所述直播间是否发生了目标监控事件;其中,所述事件特征信息与所述目标监控事件相关联。
14.一个或多个机器可读介质,其特征在于,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如权利要求1-6中任一项所述方法的步骤。
CN201810136116.6A 2018-02-09 2018-02-09 直播间事件的识别方法及装置、电子设备、机器可读介质 Active CN108449609B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810136116.6A CN108449609B (zh) 2018-02-09 2018-02-09 直播间事件的识别方法及装置、电子设备、机器可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810136116.6A CN108449609B (zh) 2018-02-09 2018-02-09 直播间事件的识别方法及装置、电子设备、机器可读介质

Publications (2)

Publication Number Publication Date
CN108449609A true CN108449609A (zh) 2018-08-24
CN108449609B CN108449609B (zh) 2020-03-06

Family

ID=63192164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810136116.6A Active CN108449609B (zh) 2018-02-09 2018-02-09 直播间事件的识别方法及装置、电子设备、机器可读介质

Country Status (1)

Country Link
CN (1) CN108449609B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109547807A (zh) * 2018-11-15 2019-03-29 腾讯科技(深圳)有限公司 一种基于直播的信息处理方法、装置及服务器
CN111277846A (zh) * 2020-01-15 2020-06-12 广州虎牙科技有限公司 一种直播的异常定位方法、装置、计算机设备和存储介质
CN111818331A (zh) * 2020-08-14 2020-10-23 广州虎牙科技有限公司 弹幕显示流畅性的检测方法、装置、设备和介质
CN112423096A (zh) * 2020-11-03 2021-02-26 上海哔哩哔哩科技有限公司 播放优化方法及系统
CN112565741A (zh) * 2020-11-26 2021-03-26 北京达佳互联信息技术有限公司 视频故障的处理方法及装置、设备、存储介质
CN114189716A (zh) * 2021-11-17 2022-03-15 北京量子之歌科技有限公司 一种视频直播平台监控系统、方法、设备及存储介质
CN114302159A (zh) * 2021-12-29 2022-04-08 北京百度网讯科技有限公司 一种直播间异常的监控方法、装置、设备以及存储介质
CN114760489A (zh) * 2022-04-15 2022-07-15 上海哔哩哔哩科技有限公司 直播流调度方法及装置
CN115134666A (zh) * 2022-08-30 2022-09-30 广州市千钧网络科技有限公司 一种直播卡顿检测方法、系统、设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971170A (zh) * 2014-04-17 2014-08-06 北京百度网讯科技有限公司 一种用于对特征信息的变化进行预测的方法和装置
CN107038253A (zh) * 2017-05-04 2017-08-11 浙江路港互通信息技术有限公司 评论内容显示方法及装置
CN107277160A (zh) * 2017-07-12 2017-10-20 北京潘达互娱科技有限公司 一种内容分发网络节点切换方法与装置
US20170339081A1 (en) * 2016-05-23 2017-11-23 Yahoo!, Inc. Virtual chat rooms
CN107526783A (zh) * 2017-07-27 2017-12-29 温州市鹿城区中津先进科技研究院 基于用户评论关键词频度变化的消费热点分析方法
CN107580233A (zh) * 2017-08-21 2018-01-12 武汉斗鱼网络科技有限公司 一种传输数据的方法、装置及计算机设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971170A (zh) * 2014-04-17 2014-08-06 北京百度网讯科技有限公司 一种用于对特征信息的变化进行预测的方法和装置
US20170339081A1 (en) * 2016-05-23 2017-11-23 Yahoo!, Inc. Virtual chat rooms
CN107038253A (zh) * 2017-05-04 2017-08-11 浙江路港互通信息技术有限公司 评论内容显示方法及装置
CN107277160A (zh) * 2017-07-12 2017-10-20 北京潘达互娱科技有限公司 一种内容分发网络节点切换方法与装置
CN107526783A (zh) * 2017-07-27 2017-12-29 温州市鹿城区中津先进科技研究院 基于用户评论关键词频度变化的消费热点分析方法
CN107580233A (zh) * 2017-08-21 2018-01-12 武汉斗鱼网络科技有限公司 一种传输数据的方法、装置及计算机设备

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109547807B (zh) * 2018-11-15 2021-02-12 腾讯科技(深圳)有限公司 一种基于直播的信息处理方法、装置及服务器
CN109547807A (zh) * 2018-11-15 2019-03-29 腾讯科技(深圳)有限公司 一种基于直播的信息处理方法、装置及服务器
CN111277846A (zh) * 2020-01-15 2020-06-12 广州虎牙科技有限公司 一种直播的异常定位方法、装置、计算机设备和存储介质
CN111818331A (zh) * 2020-08-14 2020-10-23 广州虎牙科技有限公司 弹幕显示流畅性的检测方法、装置、设备和介质
CN112423096B (zh) * 2020-11-03 2022-10-04 上海哔哩哔哩科技有限公司 播放优化方法及系统
CN112423096A (zh) * 2020-11-03 2021-02-26 上海哔哩哔哩科技有限公司 播放优化方法及系统
CN112565741A (zh) * 2020-11-26 2021-03-26 北京达佳互联信息技术有限公司 视频故障的处理方法及装置、设备、存储介质
CN112565741B (zh) * 2020-11-26 2023-04-28 北京达佳互联信息技术有限公司 视频故障的处理方法及装置、设备、存储介质
CN114189716A (zh) * 2021-11-17 2022-03-15 北京量子之歌科技有限公司 一种视频直播平台监控系统、方法、设备及存储介质
CN114189716B (zh) * 2021-11-17 2024-02-13 北京量子之歌科技有限公司 一种视频直播平台监控系统、方法、设备及存储介质
CN114302159A (zh) * 2021-12-29 2022-04-08 北京百度网讯科技有限公司 一种直播间异常的监控方法、装置、设备以及存储介质
CN114760489A (zh) * 2022-04-15 2022-07-15 上海哔哩哔哩科技有限公司 直播流调度方法及装置
CN115134666A (zh) * 2022-08-30 2022-09-30 广州市千钧网络科技有限公司 一种直播卡顿检测方法、系统、设备和存储介质
CN115134666B (zh) * 2022-08-30 2023-01-06 广州市千钧网络科技有限公司 一种直播卡顿检测方法、系统、设备和存储介质

Also Published As

Publication number Publication date
CN108449609B (zh) 2020-03-06

Similar Documents

Publication Publication Date Title
CN108449609A (zh) 直播间事件的识别方法及装置、电子设备、机器可读介质
US20220414600A1 (en) System and methods for improved meeting engagement
CN109726312B (zh) 一种正则表达式检测方法、装置、设备和存储介质
CN107040816A (zh) 一种客户端应用运行异常分析方法与装置
CN107105309A (zh) 直播调度方法及装置
EP2680633A1 (en) Data processing method and device for essential factor lost score
CN111368089A (zh) 一种基于知识图谱的业务处理方法及装置
CN110856016A (zh) 视频直播的监控方法、装置、电子设备及存储介质
CN103945219A (zh) 一种网络侧视频质量监测系统
CN109669835A (zh) MySQL数据库监控方法、装置、设备及可读存储介质
CN111178778A (zh) 基于机器学习的安保活动方案生成方法、系统及安保活动管理系统
CN113766256A (zh) 一种直播风控方法和装置
CN113422975A (zh) 一种后台直播视频审核方法
CN107168844B (zh) 一种性能监控的方法及装置
CN111611140A (zh) 埋点数据的上报验证方法、装置、电子设备及存储介质
CN102857798A (zh) 一种基于机顶盒的系统软件运行状况的监控系统
CN109788306A (zh) 信息处理方法、装置、服务器及存储介质
CN114189716B (zh) 一种视频直播平台监控系统、方法、设备及存储介质
CN104333584B (zh) Cdn文件分发系统及方法
US8543066B2 (en) User experienced remote monitoring of a communications network
CN109284221A (zh) 一种预警系统及方法
CN113473086A (zh) 视频播放的方法、装置、电子设备、智慧高速大屏
CN109639456A (zh) 一种自动化告警的改进方法及告警数据的自动化处理平台
CN105871802A (zh) 一种监控流媒体文件传输的方法、装置及系统
CN107832925A (zh) 互联网内容风险评价方法、装置及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant