CN110569391B - 播报事件识别方法、电子设备及计算机可读存储介质 - Google Patents
播报事件识别方法、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110569391B CN110569391B CN201910859946.6A CN201910859946A CN110569391B CN 110569391 B CN110569391 B CN 110569391B CN 201910859946 A CN201910859946 A CN 201910859946A CN 110569391 B CN110569391 B CN 110569391B
- Authority
- CN
- China
- Prior art keywords
- broadcast
- game
- video
- information
- video frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000005070 sampling Methods 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000012545 processing Methods 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000005034 decoration Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002147 killing effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 210000003746 feather Anatomy 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种播报事件识别方法、电子设备及计算机可读存储介质,涉及多媒体处理领域。该方法包括:获取待处理的游戏视频,然后识别待处理的游戏视频中包含的文字内容以及游戏角色信息,并基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息。本申请实施例实现了识别游戏对战视频中包含的精彩事件的复杂度,进而可以提升用户体验。
Description
技术领域
本申请涉及多媒体处理技术领域,具体而言,本申请涉及一种播报事件识别方法、电子设备及计算机可读存储介质。
背景技术
随着信息技术的发展,游戏领域随着发展,各种游戏应运而生,游戏玩家在玩游戏时,可能需要预先获取包含一些精彩游戏事件的游戏对战视频,当然游戏厂商也可以为游戏玩家推送包含精彩游戏事件的游戏对战视频。但是在为游戏玩家发送之前,如何确定游戏对战视频中所包含的精彩游戏事件成为一个关键问题。
目前可以基于深度学习的方法训练深度网络端到端的检测游戏对战视频中的精彩游戏事件类别,以确定游戏对战视频中所包含的精彩游戏事件,但是目前针对视频中包含的事件进行检测的数据集主要是包含自然场景事件的视频,因此通过上述深度学习的方法得到游戏对战视频中包含的精彩游戏事件的类别的准确度较低;若重新训练基于游戏场景确定游戏对战视频中所包含的精彩游戏事件,需要人工确定游戏对战视频中包含的精彩事件,以得到游戏场景下的训练样本,从而导致识别游戏对战视频中包含的精彩事件的复杂度较高,用户体验较差。
发明内容
本申请提供了一种播报事件识别方法、电子设备及计算机可读存储介质,可以解决上述至少一项技术问题。技术方案如下:
第一方面,提供了一种播报事件识别方法,该方法包括:
获取待处理的游戏视频;
识别待处理的游戏视频中包含的文字内容以及游戏角色信息;
基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息。
在一种可能的实现方式中,识别待处理的游戏视频中包含的文字信息,包括以下任一项:
确定游戏视频的每个视频帧中的播报文字区域分别与各个播报文字模板之间的相似度,并基于各个相似度,确定每个视频帧中的播报文字区域包含的文字信息;
对游戏视频进行视频帧采样,并确定采样的每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,并基于各个相似度,确定采样的每个视频帧中的播报文字区域包含的文字信息。
在另一种可能的实现方式中,确定每个视频帧中的播报文字区域分别与各个播报文字模板之间的相似度,包括:
提取每个视频帧的第一局部特征信息,以及,
分别提取各个播报文字模板的第二局部特征信息;
基于第一局部特征信息以及各个第二局部特征信息,确定各个匹配特征数,任一匹配特征数为第一局部特征信息与任一第二局部特征信息之间的匹配特征数;
基于各个匹配特征数、各个匹配字数以及惩罚因子,确定每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,各个匹配字数为各个播报文字模板中分别包含文字数。
在另一种可能的实现方式中,基于各个相似度,确定每个视频帧的播报文字区域包含的文字信息,包括:
当各个相似度中的最大相似度大于预设阈值,将最大相似度对应的播报文字模板确定为每个视频帧的播报文字区域包含的文字信息。
在另一种可能的实现方式中,识别待处理的游戏视频中包含的游戏角色信息,包括以下任一项:
分别确定游戏视频中每个视频帧中的播报游戏角色区域与各游戏角色模板图像的相似度,并基于各个相似度,确定每个视频帧中的播报所包含的游戏角色信息;
对待处理游戏视频进行视频帧采样,并分别确定采样的每个视频帧中的播报游戏角色区域与各游戏角色模板图像的相似度,并基于各个相似度,确定采样的每个视频帧中的播报所包含的游戏角色信息。
在另一种可能的实现方式中,确定每个视频帧的播报游戏角色区域与各个游戏角色模板图像的相似度,包括:
确定各个视频帧分别对应的像素点矩阵以及各个游戏角色模板图像分别对应的像素点矩阵,任一视频帧对应的像素点矩阵包含任一视频帧的播报游戏角色区域的像素点值;
基于各个视频帧分别对应的像素点矩阵确定第一张量,以及能基于各个游戏角色图像模板分别对应的像素点矩阵,确定第二张量;
基于第一张量以及第二张量,计算得到输出张量,输出张量中任一值用于表征任一视频帧的播报游戏角色区域与任一游戏角色模板图像的相似度。
在另一种可能的实现方式中,基于第一张量以及第二张量,计算得到输出张量,包括:
基于第一张量以及第二张量并通过卷积计算,得到归一化相关系数张量。
在另一种可能的实现方式中,基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息,包括:
基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的起始视频帧以及终止视频帧,其中,包含每个播报事件的起始视频帧与包含每个播报事件的终止视频帧之间的各个视频帧均为包含每个播报事件的视频帧;
基于每个播报事件的视频帧中各个视频帧的播报中包含的文字信息以及游戏角色信息,确定每个播报事件信息,以得到待处理的游戏视频中包含的播报事件信息。
在另一种可能的实现方式中,基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的起始视频帧,包括:
将在待处理的游戏视频中首次检测到包含文字信息以及游戏角色信息的视频帧确定为待处理的游戏中包含每个播报事件的起始视频帧;
其中,基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的终止视频帧,包括:
将待处理的游戏视频中预设视频帧的前一帧确定为待处理的游戏视频中包含每个播报事件的终止视频帧;
其中,预设视频帧满足以下条件:
首次未检测到包含文字信息以及游戏角色信息;
在预设视频帧之后连续预设帧均未检测到包含文字信息以及游戏角色信息。
在另一种可能的实现方式中,确定每个播报事件信息,之后还包括:
基于每个播报事件信息,确定每个游戏角色的被击败次数和获胜次数中的至少一项。
第二方面,提供了一种播报事件识别装置,该装置包括:
获取模块,用于获取待处理的游戏视频;
识别模块,用于识别待处理的游戏视频中包含的文字内容以及游戏角色信息;
第一确定模块,用于基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息。
在一种可能的实现方式中,识别模块在识别待处理的游戏视频中包含的文字信息时,具体用于:
确定游戏视频的每个视频帧中的播报文字区域分别与各个播报文字模板之间的相似度,并基于各个相似度,确定每个视频帧中的播报文字区域包含的文字信息;或者,
对游戏视频进行视频帧采样,并确定采样的每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,并基于各个相似度,确定采样的每个视频帧中的播报文字区域包含的文字信息。
在另一种可能的实现方式中,识别模块在确定每个视频帧中的播报文字区域分别与各个播报文字模板之间的相似度时,具体用于:
提取每个视频帧的第一局部特征信息,以及,
分别提取各个播报文字模板的第二局部特征信息;
基于第一局部特征信息以及各个第二局部特征信息,确定各个匹配特征数,任一匹配特征数为第一局部特征信息与任一第二局部特征信息之间的匹配特征数;
基于各个匹配特征数、各个匹配字数以及惩罚因子,确定每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,各个匹配字数为各个播报文字模板中分别包含文字数。
在另一种可能的实现方式中,识别模块在基于各个相似度,确定每个视频帧的播报文字区域包含的文字信息时,具体用于:
当各个相似度中的最大相似度大于预设阈值,将最大相似度对应的播报文字模板确定为每个视频帧的播报文字区域包含的文字信息。
在另一种可能的实现方式中,识别模块在识别待处理的游戏视频中包含的游戏角色信息时,具体用于:
分别确定游戏视频中每个视频帧中的播报游戏角色区域与各游戏角色模板图像的相似度,并基于各个相似度,确定每个视频帧中的播报所包含的游戏角色信息;
对待处理游戏视频进行视频帧采样,并分别确定采样的每个视频帧中的播报游戏角色区域与各游戏角色模板图像的相似度,并基于各个相似度,确定采样的每个视频帧中的播报所包含的游戏角色信息。
在另一种可能的实现方式中,识别模块在确定每个视频帧的播报游戏角色区域与各个游戏角色模板图像的相似度时,具体还用于:
确定各个视频帧分别对应的像素点矩阵以及各个游戏角色模板图像分别对应的像素点矩阵,任一视频帧对应的像素点矩阵包含任一视频帧的播报游戏角色区域的像素点值;
基于各个视频帧分别对应的像素点矩阵确定第一张量,以及能基于各个游戏角色图像模板分别对应的像素点矩阵,确定第二张量;
基于第一张量以及第二张量,计算得到输出张量,输出张量中任一值用于表征任一视频帧的播报游戏角色区域与任一游戏角色模板图像的相似度。
在另一种可能的实现方式中,识别模块在基于第一张量以及第二张量,计算得到输出张量时,具体用于基于第一张量以及第二张量并通过卷积计算,得到归一化相关系数张量。
在另一种可能的实现方式中,第一确定模块,具体用于:
基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的起始视频帧以及终止视频帧,其中,包含每个播报事件的起始视频帧与包含每个播报事件的终止视频帧之间的各个视频帧均为包含每个播报事件的视频帧;
基于每个播报事件的视频帧中各个视频帧的播报中包含的文字信息以及游戏角色信息,确定每个播报事件信息,以得到待处理的游戏视频中包含的播报事件信息。
在另一种可能的实现方式中,第一确定模块在基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的起始视频帧时,具体用于:将在待处理的游戏视频中首次检测到包含文字信息以及游戏角色信息的视频帧确定为待处理的游戏中包含每个播报事件的起始视频帧;
第一确定模块在基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的终止视频帧时,具体用于:将待处理的游戏视频中预设视频帧的前一帧确定为待处理的游戏视频中包含每个播报事件的终止视频帧;
其中,预设视频帧满足以下条件:
首次未检测到包含文字信息以及游戏角色信息;
在预设视频帧之后连续预设帧均未检测到包含文字信息以及游戏角色信息。
在另一种可能的实现方式中,该装置还包括:第二确定模块,其中,
第二确定模块,用于基于每个播报事件信息,确定每个游戏角色的被击败次数和获胜次数中的至少一项。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行根据第一方面或者第一方面任一可能的实现方式所示的播报事件识别方法对应的操作。
第四方面,提供了一种计算机可读存储介质,存储介质存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现如第一方面或者第一方面任一可能的实现方式所示的播报事件识别方法。
本申请提供的技术方案带来的有益效果是:
本申请提供了一种播报事件识别方法、装置、电子设备及计算机可读存储介质,与现有技术相比,本申请获取待处理的游戏视频,然后识别待处理的游戏视频中包含的文字内容以及游戏角色信息,然后基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息。即本申请可以通过识别出游戏视频中播报的文字内容以及游戏角色信息,能够确定出该待处理的游戏视频中包含的播报事件信息,也即确定出待处理的游戏视频中包含的精彩游戏事件,而不需要人工确定游戏对战视频中包含的精彩游戏事件,从而可以降低识别游戏对战视频中包含的精彩事件的复杂度,进而可以提升用户体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种播报事件识别方法的流程示意图;
图2为本申请实施例提供的一种播报事件识别装置的结构示意图;
图3为本申请实施例提供的一种播报事件识别的电子设备的结构示意图;
图4a为本申请实施例中局部特征和播报文字模板匹配的一种示意图;
图4b为本申请实施例中局部特征和播报文字模板匹配的另一种示意图;
图5a为本申请实施例中播报文字和播报游戏角色信息识别效果的一种示意图;
图5b为本申请实施例中播报文字和播报游戏角色信息识别效果的另一种示意图;
图6为本申请实施例中针对播报事件识别应用在一种具体场景中的示例图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先对本申请涉及的几个名词进行介绍和解释:
英雄:XXX游戏中玩家可以操控的游戏角色;
播报:XXX游戏中发生关键事件时,游戏画面中出现的提示信息;
玩家对战玩家(Player VS Player,PVP):为游戏术语,指玩家对战玩家,即玩家互相利用游戏资源攻击而形成的互动竞技;
玩家对战环境(Player VS Environment,PVE),为游戏术语,指的是在游戏中玩家挑战游戏程序所控制的NPC怪物和BOSS。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
本申请实施例提供了一种播报事件识别方法,所述方法可应用于智能终端,具体如图1所示,该方法包括:
步骤S101、获取待处理的游戏视频。
对于本申请实施例,待处理的游戏视频可以为用户上传的游戏对战视频。
步骤S102、识别待处理的游戏视频中包含的文字内容以及游戏角色信息。
对于本申请实施例,识别待处理的游戏视频的播报中包含的文字内容以及游戏角色信息,具体可以包括:识别待处理的游戏视频中各个视频帧包含播报文字内容以及游戏角色信息;或者从待处理的游戏视频中采样视频帧,并识别采样得到的各个视频帧中包含的播报文字内容以及游戏角色信息。
对于本申请实施例,游戏视频的播报中包含播报文字以及胜出的英雄和/或失败的英雄。
例如,游戏视频中某一帧播报中包含的播报文字为“击败”,识别出的播报中包含的游戏角色信息为“关羽”以及头像以及“公孙离”以及头像,具体的识别效果如图5a所示。
又例如,游戏视频中某一帧播报中包含的播报文字为“黑暗暴君已被击败”,识别出的播报中包含的游戏角色信息为“马可波罗”以及头像,具体的识别效果如图5b所示。
需要说明的是:图5a和图5b仅是一个具体场景示意图,并不作为本申请实施例的限定,其中与本申请实施例相关的部分详见图中标注区域以及文字。
步骤S103、基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息。
本申请实施例中可以将待处理的游戏视频的播报中包含的文字信息以及游戏角色信息确定为待处理的游戏视频中包含的播报事件信息,当然,也可以根据待处理的游戏视频的播报中包含的文字信息以及游戏角色信息确定待处理的游戏视频中包含的播报事件为预设播报事件,例如,双杀事件、三杀事件PVP对战以及PVE对战等。
本申请实施例提供了一种播报事件识别方法,与现有技术相比,本申请实施例获取待处理的游戏视频,然后识别待处理的游戏视频中包含的文字内容以及游戏角色信息,然后基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息。即本申请实施例可以通过识别出游戏视频中播报的文字内容以及游戏角色信息,能够确定出该待处理的游戏视频中包含的播报事件信息,也即确定出待处理的游戏视频中包含的精彩游戏事件,而不需要人工确定游戏对战视频中包含的精彩游戏事件,从而可以降低识别游戏对战视频中包含的精彩事件的复杂度,进而可以提升用户体验。
本申请实施例的一种可能的实现方式,步骤S102中识别待处理的游戏视频中包含的文字信息,包括:步骤S1021(图中未示出)或者步骤S1022(图中未示出),其中,
步骤S1021、确定游戏视频的每个视频帧中的播报文字区域分别与各个播报文字模板之间的相似度,并基于各个相似度,确定每个视频帧中的播报文字区域包含的文字信息。
对于本申请实施例,游戏视频中包含多个视频帧,并且播报文字区域一般位于视频帧中的预设区域,因此可以将每个视频帧的预设区域分别与各个播报文字模板进行相似度计算,然后基于各个视频帧的预设区域分别与各个播报文字模板之间的相似度,确定每个视频帧中播报文字区域包含文字信息。
具体地,由于播报文字区域一般处于视频帧的预设区域,因此预先可以根据预设区域的位置信息,截取游戏视频的每个视频帧中的播报文字区域,也可以根据预设区域的位置信息对每个视频帧的预设区域分别与各个播报文字模板进行相似度计算。在本申请实施例中并不做限定。
对于本申请实施例,各个播报文字模板为预设配置的播报文字模板图像,例如,图4a中右侧图像所示的“击败”以及图4b中右侧图像所示的“黑暗暴君已被击败”。
对于本申请实施例,通过确定待处理的游戏视频中每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,并基于游戏视频中每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,确定每个视频帧中的播报文字区域包含的文字信息,以识别到游戏视频中包含的播报文字信息,即根据对待处理的游戏视频中每个视频帧均进行相似度检测,从而可以提高识别游戏视频中包含的播报文字信息的准确度。
步骤S1022、对游戏视频进行视频帧采样,并确定采样的每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,并基于各个相似度,确定采样的每个视频帧中的播报文字区域包含的文字信息。
对于本申请实施例,在对视频帧的播报文字区域分别与各个播报文字模板进行相似度计算之前,还可以对待处理的游戏视频进行视频帧采样,然后在对采样后的每个视频帧的播报文字区域分别与各个播报文字模板进行相似度计算。
对于本申请实施例,对采样后的每个视频帧的播报文字区域分别与各个播报文字模板进行相似度计算的方式与上述实施例中对待处理视频中每个视频帧的播报文字区域分别与各个播报文字模板进行相似度计算的方式相同,在此不再赘述。
对于本申请实施例,通过对游戏视频进行视频帧采样,并对采样后的每个视频帧的播报文字区域分别与各个播报文字模板之间进行相似度计算,然后基于各个相似度,确定采样的每个视频帧中的播报文字区域包含的文字信息,即仅对游戏视频中采样后的每个视频帧的播报文字区域分别与各个播报文字模板进行相似度计算,以确定游戏视频中包含的播报文字信息,从而可以提高识别游戏视频中包含的播报文字信息的速度。
本申请实施例的另一种可能的实现方式,确定每个视频帧中的播报文字区域分别与各个播报文字模板之间的相似度,包括:提取每个视频帧的第一局部特征信息,以及,分别提取各个播报文字模板的第二局部特征信息;基于第一局部特征信息以及各个第二局部特征信息,确定各个匹配特征数,任一匹配特征数为第一局部特征信息与任一第二局部特征信息之间的匹配特征数;基于各个匹配特征数、各个匹配字数以及惩罚因子,确定每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,各个匹配字数为各个播报文字模板中分别包含文字数。
本申请实施例中可以通过ORB、BRISK或者神经网络提取每个视频帧的第一局部特征信息,以及提取各个播报文字模板中分别对应的第二局部特征信息,但是并不限定于上述特征提取方式。
对于本申请实施例,ORB为快速提取特征点和特征描述的算法;BRISK为特征点提取和描述的算法。
对于本申请实施例,局部特征表征了像素点与其周围像素之间存在的某种模式,局部特征点为图像中一些能够稳定出现并且具有良好可区分性的点。在本申请实施例中,局部特征信息可以包括:角点、斑点以及它们的特征描述,其中,角点通常表示图像中物体的拐角和线条的交叉部分,斑点通常表示与周围有着颜色和灰度差别的区域。
对于本申请实施例,在对每个视频帧提取第一局部特征信息以及对各个播报文字模板中分别提取第二特征信息之后,可以对每个视频帧提取的第一局部特征信息以及各个播报文字模板中分别提取的第二特征信息进行特征点匹配,得到各个匹配特征数。其中,局部特征匹配如图4a所示,即将播报中包含的文字区域“击败”(图4a左侧区域)与播报文字模板“击败”(图4a右侧区域)进行特征匹配。
对于本申请实施例,若播报文字模板中的文字存在重复和包含,若仅选取特征匹配数最多的播报文字模板作为每个视频帧中的播报文字信息可能导致匹配错误,如图4b所示,可能将视频帧的播报文字区域中的“击败”匹配成“黑暗暴君已被击败”,出现匹配错误。
因此为了避免上述匹配错误的情况,本申请实施例中加入针对字数的惩罚因子,以确定每个视频帧的播报文字区域与任一播报文字模板之间的相似度,如公式(1)所示:
其中,N0表示匹配特征数,W表示匹配字数,α表示惩罚因子且α∈(0,1),N为每个视频帧的播报文字区域与任一播报文字模板之间的匹配分数,用于表征每个视频帧的播报文字区域与任一播报文字模板之间的相似度。
对于本申请实施例,基于各个相似度,确定每个视频帧的播报文字区域包含的文字信息,包括:当各个相似度中的最大相似度大于预设阈值,将最大相似度对应的播报文字模板确定为每个视频帧的播报文字区域包含的文字信息。
对于本申请实施例中,从通过公式(1)计算的某一视频帧的播报文字区域与各个播报文字模板之间的各个相似度中选取最大的相似度,若选取的最大相似度大于预设阈值,则将该最大相似度大于预设阈值,则将该最大相似度对应的播报文字模板为该某一视频帧的播报文字区域中包含的文字信息。在本申请实施例中,若该最大相似度不大于预设阈值,则确定播报文字模板中并未包含该某一视频帧的播报文字区域包含的文字信息,即确定并未识别出该某一视频帧的播报文字区域包含的文字信息。
例如,预设阈值为80,播报文字模板为3个,分别为播报文字模板1、播报文字模板2以及播报文字模板3,某一视频帧的播报文字区域与播报文字模板之间的匹配分数(N)为55、76、81,其中,某一视频帧的播报文字区域与播报文字模板之间的匹配分数(相似度)为81,且大于预设阈值,则确定播报文字模板3为该某个视频帧的播报文字区域中包含的文字信息。
本申请实施例的另一种可能的实现方式,步骤S102中识别待处理的游戏视频中包含的游戏角色信息,包括:分别确定游戏视频中每个视频帧中的播报游戏角色区域与各游戏角色模板图像的相似度,并基于各个相似度,确定每个视频帧中的播报所包含的游戏角色信息;或者,对待处理游戏视频进行视频帧采样,并分别确定采样的每个视频帧中的播报游戏角色区域与各游戏角色模板图像的相似度,并基于各个相似度,确定采样的每个视频帧中的播报所包含的游戏角色信息。
本申请实施例中的每个视频帧的播报文字区域和播报游戏角色区域可以为同一区域,即可以统称为播报区域,也可以为不同的区域,即可以指每个视频帧的播报区域中的文字区域以及播报区域中的播报游戏角色区域。在本申请实施例中不做限定。
本申请实施例中可以对游戏视频中每个视频帧中的播报游戏角色区域与各游戏角色模板图像均进行相似度计算,也可以先对游戏视频进行采样,然后对采样后的每视频帧中的播报游戏角色区域与各游戏角色模板图像均进行相似度计算。在本申请实施例中并不限定。
本申请实施例中对游戏视频中的每个视频帧中的播报游戏角色区域与各游戏角色模板图像均进行相似度计算,以识别该游戏视频中包含的播报事件的准确度较高;对游戏视频中先进行视频帧采样,然后对采样后的视频帧中的播报游戏角色区域与各游戏角色模板图像进行相似度,以识别该游戏视频中包含的播报事件的速度较快,效率较高。
对于本申请实施例,播报游戏角色区域在每个视频帧所处位置一般是固定的(位于每个视频帧的特定区域),因此本申请实施例中可以基于特定区域的位置信息,分别确定每个视频帧播报游戏角色区域与各游戏角色模板图像之间的相似度;也可以基于特定区域的位置信息,从每个视频帧中截取该特定区域,并分别确定每个截取的特定区域与各游戏角色模板图像之间的相似度。
进一步地,由于每个视频帧的播报获胜角色区域和播报被击败角色区域的位置也是固定,也可以基于每个视频帧中播报获胜角色区域与各游戏角色模板图像之间的相似度以及基于每个视频帧中播报的被击败角色区域,确定出每个视频帧中所包含的获胜角色信息以及被击败角色信息。例如,获胜角色区域一般位于播报区域的左方区域,被击败角色区域一般位于播报区域的右方区域。
本申请实施例中的各游戏角色模板图像可以为各游戏角色的头像。
本申请实施例的另一种可能的实现方式,确定每个视频帧的播报游戏角色区域与各个游戏角色模板图像的相似度,包括:确定各个视频帧分别对应的像素点矩阵以及各个游戏角色模板图像分别对应的像素点矩阵,任一视频帧对应的像素点矩阵包含任一视频帧的播报游戏角色区域的像素点值;基于各个视频帧分别对应的像素点矩阵确定第一张量,以及能基于各个游戏角色图像模板分别对应的像素点矩阵,确定第二张量;基于第一张量以及第二张量,计算得到输出张量。
其中,输出张量中任一值用于表征任一视频帧的播报游戏角色区域与任一游戏角色模板图像的相似度。
本申请实施例的另一种可能的实现方式,基于第一张量以及第二张量,计算得到输出张量,包括:基于第一张量以及第二张量并通过卷积计算,得到归一化相关系数张量。
本申请实施例中可以通过公式(2)得到任一视频帧中播报游戏角色区域与任一游戏角色模板图像的相似度。
假设I为尺寸W×H的图像(任一视频帧的包含播报游戏角色区域图像),T为尺寸w×h的图像(各游戏角色图像模板中任一游戏角色图像模板,w≤W,h≤H),R为匹配值矩阵,尺寸为(W-w+1)×(H-h+1),归一化相关系数的计算公式为:
其中,
其中,(x,y)、(x′,y′)以及(x″,y″)均为像素坐标。T’、I’分别表示对T、I进行均值平滑滤波后的矩阵,均值平滑滤波是为了消除亮度对匹配值的影响。取矩阵R中的最大值,表示I与T的相似度。
上述实施例中可以计算任一视频帧中播报游戏角色区域与任一游戏角色模板图像的相似度,但是每次仅可以算一个视频帧中播报游戏角色区域与一个游戏角色模板图像的相似度,为了提升计算速度,本申请实施例提出了一种并行化的模板匹配方法,能够对尺寸相同的多个图像和多个模板计算相似度,即可以计算多个视频帧中播报游戏区域与多个游戏角色模板图像之间的相似度,具体如下所示:
记二维卷积操作为conv(I,T),得到:
M=conv(I,T),其中,M为卷积特征图;
M(x,y)=∑x′,y′(T(x′,y′)·I(x+x′,y+y′))
然后引入辅助卷积核K,尺寸与游戏角色模板T尺寸相同,为w×h,所有的元素值均为1,则公式(2)转换为公式(4):
将I,T由矩阵转换为张量,将多张包含游戏角色区域作为I的多个通道(如有N张图像,则I转换为N×W×H的张量,N也可以为1,表示单张图像),以及将多个游戏角色图像模板作为T的多个通道(如有n个模板,则T转换为n×w×h的张量),并通过图形处理器(GraphicsProcessing Unit,GPU)实现并行化计算,得到输出张量(归一化相关系数张量)(N×n×(W-w+1)×(H-h+1))。其中在该输出张量中每个值表征任一视频帧中播报游戏角色区域与任一游戏角色模板图像在对应位置处的相似度。
对于本申请实施例,对输出张量的后2维取最大值,得到N×n的矩阵,矩阵中的每个值表征任一视频帧中播报游戏角色区域与任一游戏角色模板图像的相似度。
对于本申请实施例,从输出张量中可以得到每视频帧中的播报游戏角色区域与各游戏角色图像模板之间的相似度,将相似度最大值对应游戏角色图像模板作为每视频帧中包含的游戏角色信息。
本申请实施例的另一种可能的实现方式,步骤S103具体可以包括:步骤S1031(图中未示出)以及步骤S1032(图中未示出),其中,
步骤S1031、基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的起始视频帧以及终止视频帧。
其中,包含每个播报事件的起始视频帧与包含每个播报事件的终止视频帧之间的各个视频帧均为包含每个播报事件的视频帧。
对于本申请实施例,若由上述实施例确定出待处理的游戏视频中包含一个播报事件,则基于该播报事件中包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含该播报事件的起始视频帧以及终止视频帧。
对于本申请实施例,若由上述实施例确定出待处理的游戏视频中包含至少两个播报事件,则确定每个播报事件中包含的文字信息以及游戏角色信息,并基于每个播报事件中包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的起始视频帧以及终止视频帧。
本申请实施例的另一种可能的实现方式,基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的起始视频帧,包括:将在待处理的游戏视频中首次检测到包含文字信息以及游戏角色信息的视频帧确定为待处理的游戏中包含每个播报事件的起始视频帧。
例如,若在待处理的游戏视频中首次检测到包含某个播报事件的播报文字信息以及游戏角色信息为该待处理的游戏视频中的第2帧,则确定该第2帧为待处理的游戏视频中包含该播报事件的起始视频帧。
本申请实施例的另一种可能的实现方式,基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的终止视频帧,包括:将待处理的游戏视频中预设视频帧的前一帧确定为待处理的游戏视频中包含每个播报事件的终止视频帧。
其中,预设视频帧满足以下条件:
首次未检测到包含文字信息以及游戏角色信息;
在预设视频帧之后连续预设帧均未检测到包含文字信息以及游戏角色信息。
对于本申请实施例,若在待处理的游戏视频中的某一帧检测到播报文字信息以及游戏角色信息,但是再其之后预设帧均未检测到播报文字信息和游戏角色信息,则确定该帧为待处理的游戏视频中包含该播报事件的终止视频帧。
例如,在待处理的游戏视频中的第6帧检测到某一播报事件的播报文字信息以及游戏角色信息,但是在其之后的5帧内均未检测到包含该某一播报事件的播报文字信息以及游戏角色信息,则确定第6帧为该播报事件的终止视频帧。
对于本申请实施例,在检测包含某一播报事件的视频帧时,当检测到包含某一播报事件的播报文字信息以及游戏角色信息的视频帧时,将该视频帧对应的播报状态记录为第一预设值(例如记录为1),并且记录该播报事件的起始帧(例如起始帧为2),在检测到某一播报事件的终止视频帧之后,将该终止帧之后的视频帧的播报状态记录为第二预设值(例如记录为0),并该终止帧之后的视频帧的起始帧重置为0。
例如,如表一所示,当待处理的视频帧的第2帧为某一播报事件的起始帧,第6帧为某一播报事件的终止帧,则将第2-6帧的播报状态记录为1,起点(起始帧)记录为2。
表一
帧数 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
播报状态 | 0 | 0 | 1 | 1 | 1 | 1 | 1 | 0 | 0 |
起点(起始帧) | 0 | 0 | 2 | 2 | 2 | 2 | 2 | 0 | 0 |
步骤S1032、基于每个播报事件的视频帧中各个视频帧的播报中包含的文字信息以及游戏角色信息,确定每个播报事件信息,以得到待处理的游戏视频中包含的播报事件信息。
对于本申请实施例,将包含某一播报事件的各个视频帧中包含的播报文字信息以及播报游戏角色信息通过取众数的方式,确定该播报事件信息。
例如,包含某一播报事件的视频帧为2-6帧,则基于第2-6中各帧中包含的播报文字信息以及播报游戏角色信息,通过取众数的方式确定该视频帧2-6包含的播报事件信息(播报文字信息以及播报游戏角色信息)。
对于本申请实施例,在确定每个播报事件信息的同时,可以确定待处理的游戏视频中包含的播报事件。
本申请实施例的另一种可能的实现方式,确定每个播报事件信息,之后还包括:基于每个播报事件信息,确定每个游戏角色的被击败次数和获胜次数中的至少一项。
由上述实施例可以得到:每个播报事件中被击败的游戏角色信息、获胜角色信息中至少一项,基于每个播报事件中被击败的游戏角色信息以及获胜角色信息中的至少一项,以及每个游戏角色的初始被击败次数和初始获胜次数可以确定出每个游戏角色的被击败次数和获胜次数中的至少一项。
例如,XX游戏角色之前被击败1次,在当前播报事件中确定出被击败的游戏角色为XX游戏角色,则确定出XX游戏角色被击败次数为2。
对于本申请实施例,基于检测出的播报事件确定出每个游戏角色的被击败次数和获胜次数,在后续可以根据确定出的每个游戏角色的被击败次数和获胜次数为游戏玩家推荐相匹配的游戏角色,从而可以提升游戏玩家的体验。
本申请实施例中可以通过下述算法计算待处理的游戏视频中包含的播报事件信息以及游戏角色获胜次数,当然被击败数序列也可以按照下述方式计算得到,具体如下所示:
其中,算法输入为播报信息序列,表示第t帧的播报信息,T为待处理的游戏视频的总帧数或者采样的总帧数;算法输出包括事件集合,εk表示第k个播报事件,K为总事件数以及游戏角色的获胜数序列,hjt表示第j个游戏角色在第t帧时刻的总计获胜数。
算法第3行:初始化事件数k为0;
算法第4行:从第1帧到第T帧进行遍历;
算法第5行:如果当前帧t不是第1帧;
算法第7行:第5行的判断条件结束;
算法第8-13行:如果动态矩阵在上一帧的播报状态state为0,且当前帧检测到播报文字(第8行),则表示当前帧是一段播报的起始,将动态矩阵当前帧的播报状态设置为1(第9行),起点设置为当前帧t(第10行);如果动态矩阵在上一帧的播报状态为1,且在当前帧及之后的连续t0帧内都检测到没有播报信息(第11行),则表示上一帧为一段播报的终点,将动态矩阵当前帧的播报状态设置为0(第12行),起点设置为0(第13行);
算法第17行:第k个事件的播报文字为从播报起始到播报结束的所有帧检测到的播报文字中出现最多的;其中,MODE表示取众数操作;
算法第18行:第k个事件的胜方角色为播报起始到结束的所有帧检测到的胜方角色中出现最多的;
算法第19行:第k个事件的败方角色为播报起始到结束的所有帧检测到的败方角色中出现最多的;
算法第20行:将第k个事件加入事件集合;
其中算法第21行:如果当前事件εk的播报内容属于击败游戏角色事件;
算法第22行:记事件的胜方角色为j;
算法第26行:从第23行开始的条件判断的结束;
算法第27行:将胜方角色从播报起始到结束的帧的击杀数增加1(第27行);
算法第28行:从第21行开始的条件判断的结束;
算法第29行:如果当前帧既不是播报的起点,也不是播报的终点;
算法第30行:表明当前帧处于播报或非播报的中间帧,动态矩阵在当前帧记录的播报状态和起点与上一帧相同;
算法第31行:从第8行开始的条件语句的结束,第32行表示从第4行开始的循环语句的结束。
上述实施例中可以获取的待处理的游戏视频,然后识别该待处理的游戏视频中的播报文字信息和播报游戏角色信息,并基于识别到的待处理的游戏视频中的播报文字信息和播报游戏角色信息,确定该待处理的游戏视频中包含的精彩事件信息。在本申请实施例中,在得到该处理的游戏视频中包含的精彩事件信息之后,可以将该待处理的游戏视频标注其对应的精彩事件信息,即该待处理的视频标注有播报文字标签和游戏角色标签,并将标注后的游戏视频存储在数据库中,具体如图6所示,从而当游戏玩家请求系统(服务器)推荐某精彩事件的游戏对战视频时,可以基于数据库中存储的标注后的游戏视频为游戏玩家进行推荐,当然数据库中标注的游戏视频可以作为样本,对神经网络进行训练,以通过训练后的神经网络进行精彩事件识别。但是两种可能的方式并不构成对本申请实施例的限定。
上述实施例从方法流程的角度介绍了播报事件识别方法,下述从虚拟模块或者虚拟单元的角度介绍了播报事件识别装置,具体详见下述实施例。
本申请实施例提供了一种播报事件识别装置,如图2所示,该播报事件识别装置20可以包括:获取模块21、识别模块22以及第一确定模块23,其中,
获取模块21,用于获取待处理的游戏视频。
识别模块22,用于识别待处理的游戏视频中包含的文字内容以及游戏角色信息。
第一确定模块23,用于基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息。
本申请实施例的一种可能的实现方式,识别模块22在识别待处理的游戏视频中包含的文字信息时,具体用于:
确定游戏视频的每个视频帧中的播报文字区域分别与各个播报文字模板之间的相似度,并基于各个相似度,确定每个视频帧中的播报文字区域包含的文字信息;或者,
对游戏视频进行视频帧采样,并确定采样的每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,并基于各个相似度,确定采样的每个视频帧中的播报文字区域包含的文字信息。
本申请实施例的另一种可能的实现方式,识别模块22在确定每个视频帧中的播报文字区域分别与各个播报文字模板之间的相似度时,具体用于:
提取每个视频帧的第一局部特征信息,以及,
分别提取各个播报文字模板的第二局部特征信息;
基于第一局部特征信息以及各个第二局部特征信息,确定各个匹配特征数,任一匹配特征数为第一局部特征信息与任一第二局部特征信息之间的匹配特征数;
基于各个匹配特征数、各个匹配字数以及惩罚因子,确定每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,各个匹配字数为各个播报文字模板中分别包含文字数。
本申请实施例的一种可能的实现方式,识别模块22在基于各个相似度,确定每个视频帧的播报文字区域包含的文字信息时,具体用于:
当各个相似度中的最大相似度大于预设阈值,将最大相似度对应的播报文字模板确定为每个视频帧的播报文字区域包含的文字信息。
本申请实施例的一种可能的实现方式,识别模块22在识别待处理的游戏视频中包含游戏角色信息时,具体用于:
分别确定游戏视频中每个视频帧中的播报游戏角色区域与各游戏角色模板图像的相似度,并基于各个相似度,确定每个视频帧中的播报所包含的游戏角色信息;
对待处理游戏视频进行视频帧采样,并分别确定采样的每个视频帧中的播报游戏角色区域与各游戏角色模板图像的相似度,并基于各个相似度,确定采样的每个视频帧中的播报所包含的游戏角色信息。
本申请实施例的一种可能的实现方式,识别模块22在确定每个视频帧的播报游戏角色区域与各个游戏角色模板图像的相似度时,具体还用于:
确定各个视频帧分别对应的像素点矩阵以及各个游戏角色模板图像分别对应的像素点矩阵,任一视频帧对应的像素点矩阵包含任一视频帧的播报游戏角色区域的像素点值;
基于各个视频帧分别对应的像素点矩阵确定第一张量,以及能基于各个游戏角色图像模板分别对应的像素点矩阵,确定第二张量;
基于第一张量以及第二张量,计算得到输出张量,输出张量中任一值用于表征任一视频帧的播报游戏角色区域与任一游戏角色模板图像的相似度。
本申请实施例的一种可能的实现方式,识别模块22在基于第一张量以及第二张量,计算得到输出张量时,具体用于基于第一张量以及第二张量并通过卷积计算,得到归一化相关系数张量。
本申请实施例的一种可能的实现方式,第一确定模块23,具体用于:
基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的起始视频帧以及终止视频帧,其中,包含每个播报事件的起始视频帧与包含每个播报事件的终止视频帧之间的各个视频帧均为包含每个播报事件的视频帧;
基于每个播报事件的视频帧中各个视频帧的播报中包含的文字信息以及游戏角色信息,确定每个播报事件信息,以得到待处理的游戏视频中包含的播报事件信息。
本申请实施例的一种可能的实现方式,第一确定模块23在基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的起始视频帧时,具体用于:将在待处理的游戏视频中首次检测到包含文字信息以及游戏角色信息的视频帧确定为待处理的游戏中包含每个播报事件的起始视频帧;
第一确定模块23在基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含每个播报事件的终止视频帧时,具体用于:将待处理的游戏视频中预设视频帧的前一帧确定为待处理的游戏视频中包含每个播报事件的终止视频帧;
其中,预设视频帧满足以下条件:
首次未检测到包含文字信息以及游戏角色信息;
在预设视频帧之后连续预设帧均未检测到包含文字信息以及游戏角色信息。
本申请实施例的一种可能的实现方式,装置20还包括:第二确定模块,其中,
第二确定模块,用于基于每个播报事件信息,确定每个游戏角色的被击败次数和获胜次数中的至少一项。
本申请实施例提供了一种播报事件识别装置,与现有技术相比,本申请实施例获取待处理的游戏视频,然后识别待处理的游戏视频中包含的文字内容以及游戏角色信息,然后基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息。即本申请实施例可以通过识别出游戏视频中播报的文字内容以及游戏角色信息,能够确定出该待处理的游戏视频中包含的播报事件信息,也即确定出待处理的游戏视频中包含的精彩游戏事件,而不需要人工确定游戏对战视频中包含的精彩游戏事件,从而可以降低识别游戏对战视频中包含的精彩事件的复杂度,进而可以提升用户体验。
上述实施例从方法流程角度介绍了播报事件识别方法,以及从虚拟模块或者虚拟单元的角度介绍了播报事件识别装置,下述介绍了一种电子设备,可以执行上述方法实施例所示的播报事件识别方法对应的操作,具体如下所示:
本申请实施例提供了一种电子设备,如图3所示,图3所示的电子设备3000包括:处理器3001和存储器3003。其中,处理器3001和存储器3003相连,如通过总线3002相连。可选地,电子设备3000还可以包括收发器3004。需要说明的是,实际应用中收发器3004不限于一个,该电子设备3000的结构并不构成对本申请实施例的限定。
处理器3001可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器3001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线3002可包括一通路,在上述组件之间传送信息。总线3002可以是PCI总线或EISA总线等。总线3002可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器3003可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器3003用于存储执行本申请方案的应用程序代码,并由处理器3001来控制执行。处理器3001用于执行存储器3003中存储的应用程序代码,以实现前述任一方法实施例所示的内容。
本申请实施例提供了一种电子设备,本申请实施例中的电子设备包括:存储器和处理器;至少一个程序,存储于所述存储器中,用于被所述处理器执行时,与现有技术相比可实现:本申请实施例获取待处理的游戏视频,然后识别待处理的游戏视频中包含的文字内容以及游戏角色信息,然后基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息。即本申请实施例可以通过识别出游戏视频中播报的文字内容以及游戏角色信息,能够确定出该待处理的游戏视频中包含的播报事件信息,也即确定出待处理的游戏视频中包含的精彩游戏事件,而不需要人工确定游戏对战视频中包含的精彩游戏事件,从而可以降低识别游戏对战视频中包含的精彩事件的复杂度,进而可以提升用户体验。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。与现有技术相比,本申请实施例获取待处理的游戏视频,然后识别待处理的游戏视频中包含的文字内容以及游戏角色信息,然后基于包含的文字信息以及游戏角色信息,确定待处理的游戏视频中包含的播报事件信息。即本申请实施例可以通过识别出游戏视频中播报的文字内容以及游戏角色信息,能够确定出该待处理的游戏视频中包含的播报事件信息,也即确定出待处理的游戏视频中包含的精彩游戏事件,而不需要人工确定游戏对战视频中包含的精彩游戏事件,从而可以降低识别游戏对战视频中包含的精彩事件的复杂度,进而可以提升用户体验。
在一些实施例中,上述终端或服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(P2P,Peer To Peer)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (12)
1.一种播报事件识别方法,其特征在于,包括:
获取待处理的游戏视频;
识别所述待处理的游戏视频中包含的文字信息以及游戏角色信息;
基于所述包含的文字信息以及游戏角色信息,确定所述待处理的游戏视频中包含的播报事件信息;
其中,识别所述待处理的游戏视频中包含的文字信息,包括:
提取所述游戏视频的每个视频帧的第一局部特征信息,以及分别提取各个播报文字模板的第二局部特征信息,所述第一局部特征信息为从每个视频帧的播报文字区域中提取;
基于所述第一局部特征信息以及各个第二局部特征信息,确定各个匹配特征数,任一匹配特征数为所述第一局部特征信息与任一第二局部特征信息之间的匹配特征数;
基于各个匹配特征数、各个匹配字数以及惩罚因子,确定每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,基于各个相似度,确定每个视频帧中的播报文字区域包含的文字信息,其中,所述各个匹配字数为各个播报文字模板中分别包含的文字数,所述惩罚因子为针对所述匹配字数的惩罚因子,所述相似度与所述匹配特征数成正比,与所述匹配字数的所述惩罚因子次方成反比。
2.根据权利要求1所述的方法,其特征在于,识别所述待处理的游戏视频中包含的文字信息,包括:
对所述游戏视频进行视频帧采样,并确定采样的每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,并基于各个相似度,确定采样的每个视频帧中的播报文字区域包含的文字信息。
3.根据权利要求1或2所述的方法,其特征在于,基于各个相似度,确定每个视频帧的播报文字区域包含的文字信息,包括:
当所述各个相似度中的最大相似度大于预设阈值,将所述最大相似度对应的播报文字模板确定为所述每个视频帧的播报文字区域包含的文字信息。
4.根据权利要求1所述的方法,其特征在于,识别所述待处理的游戏视频中包含的游戏角色信息,包括以下任一项:
分别确定所述游戏视频中每个视频帧中的播报游戏角色区域与各游戏角色模板图像的相似度,并基于各个相似度,确定每个视频帧中的播报所包含的游戏角色信息;
对所述待处理游戏视频进行视频帧采样,并分别确定采样的每个视频帧中的播报游戏角色区域与各游戏角色模板图像的相似度,并基于各个相似度,确定采样的每个视频帧中的播报所包含的游戏角色信息。
5.根据权利要求4所述的方法,其特征在于,确定每个视频帧的播报游戏角色区域与各个游戏角色模板图像的相似度,包括:
确定各个视频帧分别对应的像素点矩阵以及各个游戏角色模板图像分别对应的像素点矩阵,任一视频帧对应的像素点矩阵包含所述任一视频帧的播报游戏角色区域的像素点值;
基于所述各个视频帧分别对应的像素点矩阵确定第一张量,以及基于所述各个游戏角色模板图像分别对应的像素点矩阵,确定第二张量;
基于所述第一张量以及所述第二张量,计算得到输出张量,所述输出张量中任一值用于表征任一视频帧的播报游戏角色区域与任一游戏角色模板图像的相似度。
6.根据权利要求5所述的方法,其特征在于,基于所述第一张量以及所述第二张量,计算得到输出张量,包括:
基于所述第一张量以及所述第二张量并通过卷积计算,得到归一化相关系数张量。
7.根据权利要求1所述的方法,其特征在于,基于所述包含的文字信息以及游戏角色信息,确定所述待处理的游戏视频中包含的播报事件信息,包括:
基于所述包含的文字信息以及游戏角色信息,确定所述待处理的游戏视频中包含每个播报事件的起始视频帧以及终止视频帧,其中,包含每个播报事件的起始视频帧与包含每个播报事件的终止视频帧之间的各个视频帧均为包含所述每个播报事件的视频帧;
基于每个播报事件的视频帧中各个视频帧的播报中包含的文字信息以及游戏角色信息,确定所述每个播报事件信息,以得到所述待处理的游戏视频中包含的播报事件信息。
8.根据权利要求7所述的方法,其特征在于,基于所述包含的文字信息以及游戏角色信息,确定所述待处理的游戏视频中包含每个播报事件的起始视频帧,包括:
将在所述待处理的游戏视频中首次检测到包含所述文字信息以及游戏角色信息的视频帧确定为所述待处理的游戏中包含每个播报事件的起始视频帧;
其中,基于所述包含的文字信息以及游戏角色信息,确定所述待处理的游戏视频中包含每个播报事件的终止视频帧,包括:
将所述待处理的游戏视频中预设视频帧的前一帧确定为所述待处理的游戏视频中包含每个播报事件的终止视频帧;
其中,所述预设视频帧满足以下条件:
首次未检测到包含所述文字信息以及所述游戏角色信息;
在所述预设视频帧之后连续预设帧均未检测到包含所述文字信息以及所述游戏角色信息。
9.根据权利要求7或8所述的方法,其特征在于,所述确定所述每个播报事件信息,之后还包括:
基于所述每个播报事件信息,确定每个游戏角色的被击败次数和获胜次数中的至少一项。
10.一种播报事件识别装置,其特征在于,包括:
获取模块,用于获取待处理的游戏视频;
识别模块,用于识别所述待处理的游戏视频中包含的文字信息以及游戏角色信息;
第一确定模块,用于基于所述包含的文字信息以及游戏角色信息,确定所述待处理的游戏视频中包含的播报事件信息;
识别模块,具体用于提取所述游戏视频的每个视频帧的第一局部特征信息,以及分别提取各个播报文字模板的第二局部特征信息,所述第一局部特征信息为从每个视频帧的播报文字区域中提取;
基于所述第一局部特征信息以及各个第二局部特征信息,确定各个匹配特征数,任一匹配特征数为所述第一局部特征信息与任一第二局部特征信息之间的匹配特征数;
基于各个匹配特征数、各个匹配字数以及惩罚因子,确定每个视频帧的播报文字区域分别与各个播报文字模板之间的相似度,基于各个相似度,确定每个视频帧中的播报文字区域包含的文字信息,其中,所述各个匹配字数为各个播报文字模板中分别包含的文字数,所述惩罚因子为针对所述匹配字数的惩罚因子,所述相似度与所述匹配特征数成正比,与所述匹配字数的所述惩罚因子次方成反比。
11.一种电子设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1~9任一项所述的播报事件识别方法。
12.一种计算机可读存储介质,其特征在于,所述存储介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1~9任一所述的播报事件识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910859946.6A CN110569391B (zh) | 2019-09-11 | 2019-09-11 | 播报事件识别方法、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910859946.6A CN110569391B (zh) | 2019-09-11 | 2019-09-11 | 播报事件识别方法、电子设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110569391A CN110569391A (zh) | 2019-12-13 |
CN110569391B true CN110569391B (zh) | 2021-10-15 |
Family
ID=68779316
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910859946.6A Active CN110569391B (zh) | 2019-09-11 | 2019-09-11 | 播报事件识别方法、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110569391B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021168619A1 (zh) * | 2020-02-24 | 2021-09-02 | 深圳市欢太科技有限公司 | 信息推送方法、装置、电子设备及计算机可读介质 |
CN114697741B (zh) * | 2020-12-30 | 2023-06-30 | 腾讯科技(深圳)有限公司 | 多媒体信息的播放控制方法及相关设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9992556B1 (en) * | 2011-12-29 | 2018-06-05 | Amazon Technologies, Inc. | Automated creation of storyboards from screenplays |
CN108513139A (zh) * | 2018-04-02 | 2018-09-07 | 腾讯科技(深圳)有限公司 | 视频直播中的虚拟对象识别方法、装置、存储介质和设备 |
CN108769821A (zh) * | 2018-05-25 | 2018-11-06 | 广州虎牙信息科技有限公司 | 游戏场景描述方法、装置、设备及存储介质 |
CN109784295A (zh) * | 2019-01-25 | 2019-05-21 | 佳都新太科技股份有限公司 | 视频流特征识别方法、装置、设备及存储介质 |
-
2019
- 2019-09-11 CN CN201910859946.6A patent/CN110569391B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9992556B1 (en) * | 2011-12-29 | 2018-06-05 | Amazon Technologies, Inc. | Automated creation of storyboards from screenplays |
CN108513139A (zh) * | 2018-04-02 | 2018-09-07 | 腾讯科技(深圳)有限公司 | 视频直播中的虚拟对象识别方法、装置、存储介质和设备 |
CN108769821A (zh) * | 2018-05-25 | 2018-11-06 | 广州虎牙信息科技有限公司 | 游戏场景描述方法、装置、设备及存储介质 |
CN109784295A (zh) * | 2019-01-25 | 2019-05-21 | 佳都新太科技股份有限公司 | 视频流特征识别方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110569391A (zh) | 2019-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108769821B (zh) | 游戏场景描述方法、装置、设备及存储介质 | |
CN110147711B (zh) | 视频场景识别方法、装置、存储介质和电子装置 | |
CN110971929B (zh) | 云游戏视频处理方法、电子设备及存储介质 | |
CN104680119B (zh) | 图像身份识别方法和相关装置及身份识别系统 | |
CN110569391B (zh) | 播报事件识别方法、电子设备及计算机可读存储介质 | |
JP2009526291A5 (zh) | ||
WO2018196718A1 (zh) | 图像消歧方法、装置、存储介质和电子设备 | |
CN110309784A (zh) | 动作识别处理方法、装置、设备和存储介质 | |
US20170171621A1 (en) | Method and Electronic Device for Information Processing | |
CN111667005B (zh) | 一种采用rgbd视觉传感的人体交互系统 | |
CN108881949B (zh) | 直播间信息推送方法、装置、设备及介质 | |
CN111709406A (zh) | 文本行识别方法及装置、可读存储介质、电子设备 | |
CN114222179B (zh) | 虚拟形象视频合成方法及设备 | |
CN115171199B (zh) | 图像处理方法、装置及计算机设备、存储介质 | |
CN111553838A (zh) | 模型参数的更新方法、装置、设备及存储介质 | |
CN114639096B (zh) | 文本识别方法、装置、电子设备和存储介质 | |
Cangea et al. | Videonavqa: Bridging the gap between visual and embodied question answering | |
CN111821693A (zh) | 游戏的透视外挂检测方法、装置、设备及存储介质 | |
CN109939439B (zh) | 虚拟角色的卡住检测方法、模型训练方法、装置及设备 | |
CN111354013A (zh) | 目标检测方法及装置、设备和存储介质 | |
CN109523613B (zh) | 数据处理方法、装置、计算机可读存储介质和计算机设备 | |
CN113610016A (zh) | 视频帧特征提取模型的训练方法、系统、设备及存储介质 | |
CN110598727B (zh) | 基于迁移学习的模型构建方法、图像识别方法及其装置 | |
CN112150464A (zh) | 一种图像检测方法、装置、电子设备及存储介质 | |
US20230353700A1 (en) | Processing method for board-writing display and related apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |