CN113015002B - 一种主播视频数据的处理方法和装置 - Google Patents
一种主播视频数据的处理方法和装置 Download PDFInfo
- Publication number
- CN113015002B CN113015002B CN202110241660.9A CN202110241660A CN113015002B CN 113015002 B CN113015002 B CN 113015002B CN 202110241660 A CN202110241660 A CN 202110241660A CN 113015002 B CN113015002 B CN 113015002B
- Authority
- CN
- China
- Prior art keywords
- data
- video
- anchor
- processing
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
Abstract
本发明涉及一种主播视频数据的处理方法和装置,所述方法包括:获取第一播报文字数据、第一视频配置数据组;采用异步模式生成第一主播视频数据并保存;进行第一视频内容审核处理;审核成功则进行第一视频编辑处理生成第二主播视频数据并保存;发布第二主播视频数据;发布之后获取第一用户的第一输入数据;生成第一文字数据;对第一文字数据进行分词得到多个第一文字分词数据;根据第一文字分词数据和第一关键字列表进行第一关键字引导处理生成第一关键字数据;根据第一关键字数据查询第一对应关系表,得到对应的第一定制主播视频数据并向第一用户推送。本发明可以提高视频制作效率、提升制作质量、提高互动反应效率及准确度。
Description
技术领域
本发明涉及数据处理技术领域,特别涉及一种主播视频数据的处理方法和装置。
背景技术
直播平台上提供的虚拟主播业务,是指在直播平台上,使用虚拟主播形象进行视频直播的业务模式。常规情况下,直播平台对于该业务的处理流程是这样的:在使用虚拟主播形象进行直播之前,对播报文字和主播性别、语言类型等特征进行设置;完成设置之后,调用虚拟主播视频处理接口,生成主播视频数据;生成视频之后,对其进行上线发布,也就是常说在线直播;在直播时,采用人工伺服的方式,对用户输入的文字或语音信息进行识别,并向用户推送与其输入有关的预先录制好的定制主播视频。
随着直播平台虚拟主播业务的大规模应用,我们逐渐发现,在上述常规处理流程中有许多问题需要改进:1)生成主播视频数据时,常采用同步视频处理方式,这样的处理方式受接口的并发处理能力和后台处理能力的限制,容易出现处理超时、视频制作失败的问题;2)生成视频后直接上线,没有视频审核过程,这样的处理方式无法对生成的视频质量进行判断,容易导致客户投诉;3)进行视频直播时,采用人工伺服的方式对用户的输入信息进行识别,这样的处理方式受人力因素的影响,容易产生对用户信息的疏漏问题,从而导致对用户的输入无反应、错误反应或反应滞后等不良体验。
发明内容
本发明的目的,就是针对现有技术的缺陷,提供一种主播视频数据的处理方法、装置、电子设备及计算机可读存储介质,使用异步视频生成模式生成主播视频数据,用以降低视频处理接口的并发压力,提高视频制作效率;增加视频内容审核处理过程,提升对视频制作质量的保障能力;视频直播时,增加对用户输入信息的主动识别及用户兴趣引导处理过程,弥补人工伺服的不足,提高与用户进行互动的反应效率,提升与用户进行互动的准确度。
为实现上述目的,本发明实施例第一方面提供了一种主播视频数据的处理方法,所述方法包括:
获取第一播报文字数据及对应的第一视频配置数据组;
采用异步视频生成模式,根据所述第一播报文字数据和所述第一视频配置数据组,进行第一主播视频生成处理,得到第一主播视频数据;并对所述第一主播视频数据进行保存;
按预设的视频审核规则,根据所述第一视频配置数据组和所述第一播报文字数据,对存储的所述第一主播视频数据,进行第一视频内容审核处理;
所述第一视频内容审核处理成功,则根据预设的视频编辑状态数据,对所述第一主播视频数据,进行第一视频编辑处理,生成第二主播视频数据;并对所述第二主播视频数据进行保存;
根据存储的所述第二主播视频数据,进行第一主播视频上线发布处理;
所述第一主播视频上线发布处理成功之后,在第一用户在线观看所述第二主播视频数据期间,获取所述第一用户输入的第一输入数据;
对所述第一输入数据的数据类型进行识别;当所述第一输入数据的数据类型为文字类型时,将所述第一输入数据,作为第一文字数据;当所述第一输入数据的数据类型为语音类型时,对所述第一语音数据,进行第一语音文字识别处理,将生成的文字数据作为第一文字数据;
对所述第一文字数据,进行第一文字分词处理,得到多个第一文字分词数据;
根据所有所述第一文字分词数据和预设的第一关键字列表,进行第一关键字引导处理,生成第一关键字数据;
根据所述第一关键字数据,查询预设的反映关键字与定制主播视频对应关系的第一对应关系表,得到对应的第一定制主播视频数据;
向所述第一用户推送所述第一定制主播视频数据。
优选的,所述采用异步视频生成模式,根据所述第一播报文字数据和所述第一视频配置数据组,进行第一主播视频生成处理,得到第一主播视频数据,具体包括:
根据所述第一播报文字数据和所述第一视频配置数据组,组装生成第一生成视频指令数据;
将所述第一生成视频指令数据,向预设的第一视频生成接口进行发送;并接收从所述第一视频生成接口发回的第一任务标识数据;
根据所述第一任务标识数据,组装生成第一视频进度查询指令数据;
按预设的查询指令发送频率,定时向预设的第一进度查询接口,发送所述第一视频进度查询指令数据;并接收从所述第一进度查询接口发回的第一进度数据;
对所述第一进度数据,进行第一进度显示处理;并在所述第一进度数据为已完成时,根据所述第一任务标识数据,组装生成第一视频下载指令数据;
将所述第一视频下载指令数据,向预设的第一视频下载接口进行发送;并接收从所述第一视频下载接口发回所述第一主播视频数据。
优选的,
所述第一视频配置数据组至少包括第一主播性别数据和第一主播语言类型数据;所述第一主播性别数据至少包括男主播和女主播;所述第一主播语言类型数据至少包括汉语类型和英语类型;
所述视频编辑状态数据包括直接引用状态和二次编辑状态;
所述第一关键字列表包括多个第一关键字信息;
所述第一对应关系表包括多个第一对应关系记录;所述第一对应关系记录包括第一关键字字段和第一定制主播视频字段。
优选的,所述按预设的视频审核规则,根据所述第一视频配置数据组和所述第一播报文字数据,对存储的所述第一主播视频数据,进行第一视频内容审核处理,具体包括:
根据所述第一视频配置数据组的所述第一主播性别数据,对存储的所述第一主播视频数据,进行第一性别核查处理;
根据所述第一视频配置数据组的所述第一主播语言类型数据,对存储的所述第一主播视频数据,进行第一语言类型核查处理;
根据所述第一播报文字数据,对存储的所述第一主播视频数据,进行第一播报内容核查处理;
根据预设的视频管理条例,对存储的所述第一主播视频数据,进行第一视频管理条例核查处理;
当所述第一性别核查处理成功、且所述第一语言类型核查处理成功、且所述第一播报内容核查处理成功、且所述第一视频管理条例核查处理成功时,所述第一视频内容审核处理成功,并将存储的所述第一主播视频数据,标记为第一通过审核视频;
当所述第一性别核查处理失败、或所述第一语言类型核查处理失败、或所述第一播报内容核查处理失败、或所述第一视频管理条例核查处理失败时,所述第一视频内容审核处理失败,并将存储的所述第一主播视频数据,标记为第一未通过审核视频。
优选的,所述根据预设的视频编辑状态数据,对所述第一主播视频数据,进行第一视频编辑处理,生成第二主播视频数据,具体包括:
对所述视频编辑状态数据进行识别;当所述视频编辑状态数据为所述直接引用状态时,直接复制所述第一主播视频数据,生成所述第二主播视频数据;当所述视频编辑状态数据为所述二次编辑状态时,根据预设的二次编辑方案,对所述第一主播视频数据进行二次视频编辑处理,生成所述第二主播视频数据。
优选的,所述根据所有所述第一文字分词数据和预设的第一关键字列表,进行第一关键字引导处理,生成第一关键字数据,具体包括:
根据每个所述第一文字分词数据,对所述第一关键字列表中的所有所述第一关键字信息进行最大匹配度轮询;对被轮询的所述第一关键字信息与所述第一文字分词数据,进行第一文字匹配度识别处理,生成第一匹配度数据;当所述第一匹配度数据超过预设的文字匹配度阈值时,提取被轮询的所述第一关键字信息,生成对应的第一提取数据;
统计所有所述第一提取数据,生成第一关键字确认列表;
向所述第一用户发送所述第一关键字确认列表;并根据所述第一用户对所有所述第一提取数据的选择结果,生成第一提取数据索引;
当所述第一提取数据索引不为空时,将所述第一提取数据索引对应的所述第一提取数据,作为所述第一关键字数据;当所述第一提取数据索引为空时,设置所述第一关键字数据为空。
优选的,所述根据所述第一关键字数据,查询预设的反映关键字与定制主播视频对应关系的第一对应关系表,得到对应的第一定制主播视频数据,具体包括:
当所述第一关键字数据不为空时,首先,对所述第一对应关系表的所有所述第一对应关系记录进行轮询;当被轮询的所述第一对应关系记录的所述第一关键字字段与所述第一关键字数据匹配时,提取被轮询的所述第一对应关系记录的所述第一定制主播视频字段,作为第一视频数据;然后,再对所述第一视频数据的数据类型进行判断;若所述第一视频数据的数据类型为视频文件类型,则复制所述第一视频数据,生成所述第一定制主播视频数据;若所述第一视频数据的数据类型为视频文件存储路径类型,则复制所述第一视频数据指定的存储位置处的视频文件,生成所述第一定制主播视频数据;
当所述第一关键字数据为空时,则复制预设的默认视频数据,作为所述第一定制主播视频数据。
本发明实施例第二方面提供了一种主播视频数据的处理装置,包括:
获取模块用于获取第一播报文字数据及对应的第一视频配置数据组;
视频生成模块用于采用异步视频生成模式,根据所述第一播报文字数据和所述第一视频配置数据组,进行第一主播视频生成处理,得到第一主播视频数据;并对所述第一主播视频数据进行保存;
视频审核模块用于按预设的视频审核规则,根据所述第一视频配置数据组和所述第一播报文字数据,对存储的所述第一主播视频数据,进行第一视频内容审核处理;
视频编辑模块用于所述第一视频内容审核处理成功,则根据预设的视频编辑状态数据,对所述第一主播视频数据,进行第一视频编辑处理,生成第二主播视频数据;并对所述第二主播视频数据进行保存;
视频发布模块用于根据存储的所述第二主播视频数据,进行第一主播视频上线发布处理;
互动获取模块用于所述第一主播视频上线发布处理成功之后,在第一用户在线观看所述第二主播视频数据期间,获取所述第一用户输入的第一输入数据;
互动识别模块用于对所述第一输入数据的数据类型进行识别;当所述第一输入数据的数据类型为文字类型时,将所述第一输入数据,作为第一文字数据;当所述第一输入数据的数据类型为语音类型时,对所述第一语音数据,进行第一语音文字识别处理,将生成的文字数据作为所述第一文字数据;
互动分词模块用于对所述第一文字数据,进行第一文字分词处理,得到多个第一文字分词数据;
互动引导模块用于根据所有所述第一文字分词数据和预设的第一关键字列表,进行第一关键字引导处理,生成第一关键字数据;
互动视频提取模块用于根据所述第一关键字数据,查询预设的反映关键字与定制主播视频对应关系的第一对应关系表,得到对应的第一定制主播视频数据;
互动视频推送模块用于向所述第一用户推送所述第一定制主播视频数据。
本发明实施例第三方面提供了一种电子设备,包括:存储器、处理器和收发器;
所述处理器用于与所述存储器耦合,读取并执行所述存储器中的指令,以实现上述第一方面所述的方法步骤;
所述收发器与所述处理器耦合,由所述处理器控制所述收发器进行消息收发。
本发明实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行上述第一方面所述的方法。
本发明实施例提供一种主播视频数据的处理方法、装置、电子设备及计算机可读存储介质,使用异步视频生成模式生成主播视频数据,降低了视频处理接口的并发压力,提高了视频制作效率;增加视频内容审核处理过程,提升了对视频制作质量的保障能力;视频直播时,增加对用户输入信息的主动识别及用户兴趣引导处理过程,弥补了人工伺服的不足,提高了与用户进行互动的反应效率,提升了与用户进行互动的准确度。
附图说明
图1为本发明实施例一提供的一种主播视频数据的处理方法示意图;
图2为本发明实施例二提供的一种主播视频数据的处理装置的模块结构图;
图3为本发明实施例三提供的一种电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
直播平台在处理虚拟主播业务时,根据业务方案,首先,应对需要进行播报的文字内容进行设置,生成对应的第一播报文字数据;并对进行播报的主播特征进行设置,生成对应的第一视频配置数据组,这里,第一视频配置数据组中至少应包括反映主播性别的第一主播性别数据和反映主播播报语言特征的第一主播语言类型数据。然后,直播平台通过本发明实施例一提供的一种主播视频数据的处理方法,进行后续与虚拟主播业务相关的主播视频数据生成、审核、发布等处理过程,并在主播视频发布过程中,对用户的输入信息进行主动识别处理。图1为本发明实施例一提供的一种主播视频数据的处理方法示意图,如图1所示,本方法主要包括如下步骤:
步骤1,获取第一播报文字数据及对应的第一视频配置数据组;
其中,第一视频配置数据组至少包括第一主播性别数据和第一主播语言类型数据;第一主播性别数据至少包括男主播和女主播;第一主播语言类型数据至少包括汉语类型和英语类型。
这里,第一播报文字数据为由需要进行播报的文字内容转换而成的数据;第一主播性别数据为由设定的虚拟主播性别转换而成的数据,其内容至少包含两种性别信息:男主播和女主播,另外,若还存在其他异型主播形象,例如动物、植物、漫画人物、机器人等,还可以在第一主播性别数据中增设其他内容与异型主播形象对应;第一主播语言类型数据为由设定的虚拟主播播报语言转换而成的数据,其内容至少包含两种语言类型:汉语类型和英语类型,另外,若还存在其他播报语言类型,例如法语、德语、意大利语、西班牙等传统的各国语言等语言类型,又例如四川话、河南话、粤语等各国各地方言等语言类型,还可以在第一主播语言类型数据中增设其他内容与其他播报语言对应。
步骤2,采用异步视频生成模式,根据第一播报文字数据和第一视频配置数据组,进行第一主播视频生成处理,得到第一主播视频数据;并对第一主播视频数据进行保存。
这里,常规的同步视频处理方式,是在向视频处理接口侧发送生成视频指令之后,会一直对发送接口的返回数据进行持续的返回数据侦听处理,这种处理方式在批量视频制作时,一方面会消耗大量的内存资源,另一方面还会对返回数据侦听进行超时限定;如此一来,若视频处理接口侧的处理时间过长,就容易产生因超时限定而无法获得返回数据的情况,从而导致视频制作失败;
本发明实施例为解决上述问题,采用与常规处理方式不同的异步视频生成模式来生成第一主播视频数据:
首先,在向视频处理接口侧的第一视频生成接口发送完第一生成视频指令数据之后,只需获得及时返回的第一任务标识数据即可,无需始终对第一视频生成接口保持侦听;
为了解视频处理接口侧的视频生成进度,可以定时向视频处理接口侧的第一进度查询接口发送第一视频进度查询指令数据,在获得及时返回的第一进度数据之后,也不必始终对第一进度查询接口保持侦听;
在识别出第一进度数据为已完成时,为下载制作好的主播视频数据,可向视频处理接口侧的第一视频下载接口发送第一视频下载指令数据进行一次性数据下载操作;因为此时在视频处理接口侧的视频制作过程已经结束,所以,在接收第一视频下载接口返回数据的过程中,也很难出现超时的情况;
这样一来,同步视频处理方式下常会出现的诸如资源过度占用、或因超时限定导致的视频制作失败等问题,都得到了很好的解决。
另外,本发明实施例的直播平台一般采用第三方提供的视频处理服务进行视频制作处理,上文中提到的视频处理接口侧,即为向直播平台提供视频处理服务的第三方视频处理软件产品、终端设备产品、服务器产品、或云平台产品;基于视频处理接口侧的不同产品形式,视频处理接口侧提供的第一视频生成接口、第一进度查询接口、第一视频下载接口也包括多种接口方式,可以为统一资源定位符(uniform resource locator,URL)接口方式、还可以为远程过程调用(Remote Procedure Call,RPC)接口方式、还可以为应用程序接口(Application Programming Interface,API)方式;无论使用哪种接口方式,在进行视频制作处理之前,第一视频生成接口、第一进度查询接口、第一视频下载接口的具体内容都应被预先设定完成。
为能对步骤2有更深入的了解,下文再对步骤2中第一主播视频生成处理的过程进行详细说明。
步骤2中,采用异步视频生成模式,根据第一播报文字数据和第一视频配置数据组,进行第一主播视频生成处理,得到第一主播视频数据,具体包括:
步骤21,根据第一播报文字数据和第一视频配置数据组,组装生成第一生成视频指令数据;
这里,第一生成视频指令数据为生成主播视频数据的指令,该指令内至少应包括第一播报文字数据和第一视频配置数据组;
步骤22,将第一生成视频指令数据,向预设的第一视频生成接口进行发送;并接收从第一视频生成接口发回的第一任务标识数据;
这里,第一视频生成接口为预先设定好的视频处理接口侧的处理接口之一,用于启动视频处理接口侧的生成主播视频数据的处理流程;向第一视频生成接口发送第一生成视频指令数据,表示调用第一视频生成接口生成主播视频数据;
视频处理接口侧在接收到第一生成视频指令数据之后,从中提取出第一播报文字数据、第一视频配置数据组,在根据第一播报文字数据、第一视频配置数据组启动主播视频数据制作的同时,为该主播视频数据分配一个唯一标识码也就是第一任务标识数据,并向接口调用方也就是直播平台回送第一任务标识数据;
步骤23,根据第一任务标识数据,组装生成第一视频进度查询指令数据;
这里,第一视频进度查询指令数据为查询主播视频数据制作进度的指令,该指令内至少应包括所查询主播视频数据的唯一标识码也就是第一任务标识数据;
步骤24,按预设的查询指令发送频率,定时向预设的第一进度查询接口,发送第一视频进度查询指令数据;并接收从第一进度查询接口发回的第一进度数据;
这里,查询指令发送频率为预先设定的指令发送频率,例如每隔0.5秒发送一次第一视频进度查询指令数据;第一进度查询接口为预先设定好的视频处理接口侧的处理接口之一,用于启动视频处理接口侧的查询主播视频数据制作进度的处理流程;向第一进度查询接口发送第一视频进度查询指令数据,表示调用第一进度查询接口查询主播视频数据制作进度;
视频处理接口侧在接收到第一视频进度查询指令数据之后,从中提取出第一任务标识数据,根据第一任务标识数据计算对应的主播视频数据的实时制作进度信息,并将得到的实时制作进度信息作为第一进度数据,向接口调用方也就是直播平台回送;
步骤25,对第一进度数据,进行第一进度显示处理;并在第一进度数据为已完成时,根据第一任务标识数据,组装生成第一视频下载指令数据;
这里,第一进度数据在常规情况下,均采用百分比数值的方式进行表示,例如,第一进度数据为80%,表示当前主播视频数据的实时制作进度为80%;为便于直播平台操作者能对当前主播视频数据的实时制作进度有直观感受,本发明实施例还在接收到第一进度数据之后,对其进行显示处理,例如,使用过程进度条的方式进行显示,每次获得最新的第一进度数据之后,都根据最新的第一进度数据对进度条的进度显示进行更新;在第一进度数据为100%时,第一进度数据被识别为已完成,表示当前主播视频数据已经制作完成,可以被下载了;第一视频下载指令数据即为下载主播视频数据的指令,该指令内至少应包括所下载主播视频数据的唯一标识码也就是第一任务标识数据;
步骤26,将第一视频下载指令数据,向预设的第一视频下载接口进行发送;并接收从第一视频下载接口发回第一主播视频数据。
这里,第一视频生成接口为预先设定好的视频处理接口侧的处理接口之一,用于启动视频处理接口侧的下载主播视频数据的处理流程;向第一视频生成接口发送第一视频下载指令数据,表示调用第一视频下载接口下载主播视频数据;
视频处理接口侧在接收到第一视频下载指令数据之后,从中提取出第一任务标识数据,并将制作完成的、与第一任务标识数据对应的主播视频数据,作为第一主播视频数据,向接口调用方也就是直播平台回送。
步骤3,按预设的视频审核规则,根据第一视频配置数据组和第一播报文字数据,对存储的第一主播视频数据,进行第一视频内容审核处理;
这里,视频审核规则包括性别核查规则、语言类型核查规则、播报内容核查规则、视频管理条例核查规则;只有在上述所有核查规则都得到满足之后,针对第一主播视频数据的第一视频内容审核处理才算成功,才可以对第一主播视频数据进行通过审查标记,否则,应对第一主播视频数据进行未通过审查标记;
具体包括:步骤31,根据第一视频配置数据组的第一主播性别数据,对存储的第一主播视频数据,进行第一性别核查处理;
这里,是根据性别核查规则的要求进行核查,核查方法是对第一主播视频数据内的主播性别进行识别,并根据识别结果与第一主播性别数据的比对结果判定是否通过核查,若识别结果与第一主播性别数据匹配则第一性别核查处理成功,反之,第一性别核查处理失败;
例如,第一主播性别数据为女主播,对第一主播视频数据内的主播性别进行识别的识别结果为女主播,则第一性别核查处理成功;
又例如,第一主播性别数据为男主播,对第一主播视频数据内的主播性别进行识别的识别结果为女主播,则第一性别核查处理失败;
步骤32,根据第一视频配置数据组的第一主播语言类型数据,对存储的第一主播视频数据,进行第一语言类型核查处理;
这里,是根据语言类型核查规则的要求进行核查,核查方法是对第一主播视频数据内的主播播报语言进行识别,并根据识别结果与第一主播语言类型数据的比对结果判定是否通过核查,若识别结果与第一主播语言类型数据匹配则第一语言类型核查处理成功,反之,第一语言类型核查处理失败;
例如,第一主播语言类型数据为汉语类型,对第一主播视频数据内的主播播报语言进行识别的识别结果为汉语播报,则第一语言类型核查处理成功;
又例如,第一主播语言类型数据为汉语类型,对第一主播视频数据内的主播播报语言进行识别的识别结果为英语播报,则第一语言类型核查处理失败;
步骤33,根据第一播报文字数据,对存储的第一主播视频数据,进行第一播报内容核查处理;
这里,是根据播报内容核查规则的要求进行核查,核查方法是对第一主播视频数据内的主播播报内容进行识别,并根据识别结果与第一播报文字数据的比对结果判定是否通过核查,若识别结果与第一播报文字数据匹配则第一播报内容核查处理成功,反之,第一播报内容核查处理失败;
例如,第一播报文字数据为“今天天气良好”,对第一主播视频数据内的主播播报内容进行识别的识别结果为“今天天气良好”,则第一播报内容核查处理成功;
又例如,第一播报文字数据为“今天天气良好”,对第一主播视频数据内的主播播报内容进行识别的识别结果为“今天天气娘啊”,则第一播报内容核查处理失败;
步骤34,根据预设的视频管理条例,对存储的第一主播视频数据,进行第一视频管理条例核查处理;
这里,是根据视频管理条例核查规则的要求进行核查,视频管理条例核查规则是基于相关司法机关、上级主管机构部门、和直播平台内部发布的所有与视频内容有关的法律、条例、规定以及规章制度的基础之上建立的核查规则,核查方法是对第一主播视频数据内的视频内容按,视频管理条例核查规则的内容进行逐条识别,并根据识别结果判定是否通过核查,若识别结果为全通过则第一视频管理条例核查处理成功,反之,第一视频管理条例核查处理失败;
例如,视频管理条例核查规则中要求视频内容不得包含虚假宣传信息,而在对第一主播视频数据的主播播报内容进行内容提取时发现其中包含了夸张产品效果的宣传内容,则第一视频管理条例核查处理失败;
步骤35,当第一性别核查处理成功、且第一语言类型核查处理成功、且第一播报内容核查处理成功、且第一视频管理条例核查处理成功时,第一视频内容审核处理成功,并将存储的第一主播视频数据,标记为第一通过审核视频;
这里,当根据性别核查规则进行的第一性别核查处理成功、根据语言类型核查规则进行的第一语言类型核查处理成功、根据播报内容核查规则进行的第一播报内容核查处理成功、根据视频管理条例核查规则进行的第一视频管理条例核查处理成功时,说明第一主播视频数据是符合视频审核规则要求的,也即是第一视频内容审核处理是成功的;继而,通过将第一主播视频数据标记为第一通过审核视频,来对第一主播视频数据进行通过审查标记处理;
步骤36,当第一性别核查处理失败、或第一语言类型核查处理失败、或第一播报内容核查处理失败、或第一视频管理条例核查处理失败时,第一视频内容审核处理失败,并将存储的第一主播视频数据,标记为第一未通过审核视频。
这里,当上述4个核查处理中,但凡有一个是不成功的,都说明第一主播视频数据是不符合视频审核规则要求的,也即是第一视频内容审核处理是失败的;继而,通过将第一主播视频数据标记为第一未通过审核视频,来对第一主播视频数据进行未通过审查标记处理。
步骤4,第一视频内容审核处理成功,则根据预设的视频编辑状态数据,对第一主播视频数据,进行第一视频编辑处理,生成第二主播视频数据;并对第二主播视频数据进行保存;
其中,视频编辑状态数据包括直接引用状态和二次编辑状态;
根据预设的视频编辑状态数据,对第一主播视频数据,进行第一视频编辑处理,生成第二主播视频数据,具体包括:对视频编辑状态数据进行识别;当视频编辑状态数据为直接引用状态时,直接复制第一主播视频数据,生成第二主播视频数据;当视频编辑状态数据为二次编辑状态时,根据预设的二次编辑方案,对第一主播视频数据进行二次视频编辑处理,生成第二主播视频数据。
这里,视频编辑状态数据包括两种具体状态:直接引用状态和二次编辑状态;当视频编辑状态数据为直接引用状态时,表示无需对第一主播视频数据进行后期修饰或编辑,那么第二主播视频数据就是第一主播视频数据的拷贝;当视频编辑状态数据为二次编辑状态时,表示还需对第一主播视频数据进行后期修饰或编辑,那么第二主播视频数据就是对第一主播视频数据完成后期编辑之后的视频数据。
步骤5,根据存储的第二主播视频数据,进行第一主播视频上线发布处理。
这里,在直播平台的后台,为每个直播室或直播播主都配置了一个当前直播地址数据,用户进入直播室或选择直播播主之后,直播平台会以当前直播地址数据指向的视频数据为源视频,向用户进行视频播放处理;在本发明实施例中,进行第一主播视频上线发布处理时,直播平台可以将当前直播地址数据直接指向存储的第二主播视频数据的地址,将存储的第二主播视频数据直接作为源视频;还可以为存储的第二主播视频数据建立数据镜像或临时备份,再将当前直播地址数据指向数据镜像或临时备份的地址,将数据镜像或临时备份作为源视频。
步骤6,第一主播视频上线发布处理成功之后,在第一用户在线观看第二主播视频数据期间,获取第一用户输入的第一输入数据。
这里,第一用户在直播平台上观看发布的第二主播视频数据时,如若需要与虚拟主播进行互动,可以通过信息输入设备,例如键盘、手写笔、触摸屏等录入文字信息发送至直播平台,还可以通过语音记录设备,例如麦克风等录入语音信息发送至直播平台;这里的第一输入数据就是第一用户录入的文字信息或语音信息。直播平台在接收到第一用户输入的第一输入数据之后,会对其进行自动识别处理,这样一来就解决了常规为人工伺服模式下,由人为因素导致的用户信息疏漏问题,提高了与用户进行互动的反应效率。
步骤7,对第一输入数据的数据类型进行识别;当第一输入数据的数据类型为文字类型时,将第一输入数据,作为第一文字数据;当第一输入数据的数据类型为语音类型时,对第一语音数据,进行第一语音文字识别处理,将生成的文字数据作为第一文字数据。
这里,直播平台首先根据第一输入数据的数据类型进行分类,若是文字类型,则直接将第一用户录入的文字信息也就是第一输入数据作为第一文字数据;若是语音类型,则需要先将第一用户录入的语音信息也就是第一输入数据进行语音文字转换,再将转换结果也就是转换得到的文字数据作为第一文字数据;这里的语音文字转换也就是第一语音文字识别处理的处理方式有多种,常规的都会使用通过大数据训练完成的人工智能语音文字识别模型进行处理,该人工智能语音文字识别模型至少具备语音特征识别功能和连续文字语义识别功能,通过与第一语音数据进行单字语音识别,得到与第一语音数据最大近似的文字数据串。这样一来,就解决了常规为人工伺服模式下,由人为因素导致的用户信息处理滞后的问题,提高了与用户进行互动的反应速度。
例如,第一用户是采用文字输入的方式,输入的第一输入数据为一段文本信息“看看促销”,那么直接将第一输入数据作为第一文字数据之后,第一文字数据的内容也为“看看促销”;
又例如,第一用户是采用语音输入的方式,输入的第一输入数据为一段语音数据“我想看促销内容”,那么直播平台会使用人工智能语音文字识别模型,首先对这段语音数据按时间先后顺序进行语音特识别,得到发音数据序列(wo,xiang,kan,cu,xiao,nei,rong);再通过查询预设的字典,对这个发音数据序列中每个发音数据进行单字识别,得到多个可能文句:文句1“窝向看促销内容”、文句2“我向看促销内容”、文句3“我想看促销内容”;再对多个可能文句进行语义识别得到多个语义识别概率:文句1的语义识别概率为70%、文句2的语义识别概率为85%、文句3的语义识别概率为92%;再从中选择语义识别概率最大的文句也就是语义最通顺的文句,作为最终识别结果也就是第一文字数据:文句3的语义识别概率最大,所以第一文字数据为文句3“我想看促销内容”。
步骤8,对第一文字数据,进行第一文字分词处理,得到多个第一文字分词数据。
这里,直播平台会使用通过大数据训练完成的人工智能分词识别模型进行处理,该人工智能分词识别模型会识别出第一文字数据中所有单词的词性,并根据设定的保留词性对其中部分单词进行保留。
例如,第一文字数据为“我想看促销内容”,那么直播平台会使用人工智能分词识别模型从中识别出多个单词:“我”、“想”、“看”、“促销”、“内容”,并对每个单词的词性进行识别:“我”-代词、“想”-动词、“看”-动词、“促销”-名词、“内容”-名词,若预设的保留词性中只包含名词,那么最终只会保留两个词性为名词的单词,也就是由此得到的第一文字分词数据有2个:“促销”、“内容”。
步骤9,根据所有第一文字分词数据和预设的第一关键字列表,进行第一关键字引导处理,生成第一关键字数据;
其中,第一关键字列表包括多个第一关键字信息;
具体包括:步骤91,根据每个第一文字分词数据,对第一关键字列表中的所有第一关键字信息进行最大匹配度轮询;对被轮询的第一关键字信息与第一文字分词数据,进行第一文字匹配度识别处理,生成第一匹配度数据;当第一匹配度数据超过预设的文字匹配度阈值时,提取被轮询的第一关键字信息,生成对应的第一提取数据;
这里,在进行第一文字匹配度识别处理时,直播平台可以使用常见的字符串比对算法,较为常见的有编辑距离(Edit Distance,EP)算法,对第一文字分词数据和第一关键字信息进行匹配度比对,二者近似度越高,第一匹配度数据越大;文字匹配度阈值为预先设定的匹配度阈值,超过该阈值说明第一文字分词数据与第一关键字信息高度近似,可以将该第一关键字信息提取出来作为第一提取数据;
例如,所有第一文字分词数据有2个:“促销”、“内容”,第一关键字列表如表一所示;根据“促销”对3个第一关键字信息的进行最大匹配度轮询之后,得到3个第一匹配度数据:35%,35%,0;根据“内容”对3个第一关键字信息的进行最大匹配度轮询之后,得到3个第一匹配度数据:0,0,0;又已知文字匹配度阈值被设定为30%,那么最终得到的第一提取数据有2个:与“促销”匹配度均为35%的“花促销”和“果促销”;
第一关键字信息索引 | 第一关键字信息 |
1 | 花促销 |
2 | 果促销 |
3 | 特价商品 |
表一
步骤92,统计所有第一提取数据,生成第一关键字确认列表;
这里,第一关键字确认列表如表二所示,包含2个第一提取数据:“花促销”和“果促销”;
第一提取数据索引 | 第一提取数据 |
1 | 花促销 |
2 | 果促销 |
表二
步骤93,向第一用户发送第一关键字确认列表;并根据第一用户对所有第一提取数据的选择结果,生成第一提取数据索引;
这里,在向第一用户发送第一关键字确认列表时,直播平台会根据第一关键字确认列表进行内容显示处理,在显示时会采用预先设定的好的显示列表模板对第一关键字确认列表的内容进行嵌套显示,第一用户从显示内容中选择与自己意愿最相近的选项进行确认,直播平台根据用户输入的选择结果生成第一提取数据索引;
例如,显示列表模板如下所示:
“您好,您是想了解以下具体哪种信息:
1、信息1
2、信息2
N、信息N
N+1、都不是”
其中,N为正整数,且N的值与第一关键字确认列表的第一提取数据总数相等;第1项的显示内容-信息1对应第一关键字确认列表中第一提取数据索引为1的第一提取数据,第2项的显示内容-信息2对应第一关键字确认列表中第一提取数据索引为2的第一提取数据,依次类推,第N项的显示内容-信息N对应第一关键字确认列表中第一提取数据索引为N的第一提取数据,另外,显示列表模板中还设有第N+1项,当用户未能在第1-N项中发现与自己意愿接近的内容时,可以选择第N+1项;在用户完成选择之后,根据用户选择的具体项的编号生成第一提取数据索引,若用户选择第1项则第一提取数据索引为1,若用户选择第2项则第一提取数据索引为2,依次类推,若用户选择第N项则第一提取数据索引为N,另外,若用户选择第N+1项则第一提取数据索引为空;
那么将表二的第一关键字确认列表的内容嵌入上述模板之后,则直播平台向第一用户显示的信息如下所示:
“您好,您是想了解以下具体哪种信息:
1、花促销
2、果促销
3、都不是”
第一用户若选择“花促销”,则第一提取数据索引为1;第一用户若选择“果促销”,则第一提取数据索引为2;第一用户若选择“都不是”,则第一提取数据索引为空;
步骤94,当第一提取数据索引不为空时,将第一提取数据索引对应的第一提取数据,作为第一关键字数据;当第一提取数据索引为空时,设置第一关键字数据为空。
这里,若第一提取数据索引为1,则第一关键字数据为“花促销”;若第一提取数据索引为2,则第一关键字数据为“果促销”;若第一提取数据索引为空,则第一关键字数据也为空。
步骤10,根据第一关键字数据,查询预设的反映关键字与定制主播视频对应关系的第一对应关系表,得到对应的第一定制主播视频数据;
其中,第一对应关系表包括多个第一对应关系记录;第一对应关系记录包括第一关键字字段和第一定制主播视频字段;
具体包括:步骤101,当第一关键字数据不为空时,首先,对第一对应关系表的所有第一对应关系记录进行轮询;当被轮询的第一对应关系记录的第一关键字字段与第一关键字数据匹配时,提取被轮询的第一对应关系记录的第一定制主播视频字段,作为第一视频数据;然后,再对第一视频数据的数据类型进行判断;若第一视频数据的数据类型为视频文件类型,则复制第一视频数据,生成第一定制主播视频数据;若第一视频数据的数据类型为视频文件存储路径类型,则复制第一视频数据指定的存储位置处的视频文件,生成第一定制主播视频数据;
这里,直播平台会在在处理虚拟主播业务时,根据业务方案,提前准备好一些固定的主播视频数据也就是定制主播视频,例如,针对某项固定促销内容的定制主播视频,并为这些固定的定制主播视频分配一一对应的关键字进行配对,并建立能够反映关键字与定制主播视频对应关系的第一对应关系表来标识这种配对关系;
在第一对应关系表中,每个关键字只与一个定制主播视频一一对应;第一对应关系表使用第一对应关系记录存储关键字与其对应的定制主播视频有关的信息;在一对应关系记录中,第一关键字字段用于存储关键字的具体信息,第一定制主播视频字段用于存储定制主播视频有关的信息;第一定制主播视频字段存储的信息内容与其数据类型有关,若第一定制主播视频字段的数据类型为视频文件类型,则说明第一定制主播视频字段存储的信息为一个具体的视频文件,若第一定制主播视频字段的数据类型为视频文件存储路径类型,则说明第一定制主播视频字段存储的信息为一个视频文件的存储路径信息;
例如,第一关键字数据为“花促销”,第一定制主播视频字段的数据类型为视频文件类型,第一对应关系表如表三所示,则直播平台查询表一,得到第一关键字字段与“花促销”匹配的第一对应关系记录为第1个第一对应关系记录,从第1个第一对应关系记录中提取出第一定制主播视频字段的内容,生成第一视频数据,因为第一定制主播视频字段的数据类型为视频文件类型,所以第一定制主播视频数据也就是第一视频数据,也就是从表三中提取出来的第一视频文件;
第一对应关系记录索引 | 第一关键字字段 | 第一定制主播视频字段 |
1 | 花促销 | 第一视频文件 |
2 | 果促销 | 第二视频文件 |
表三
又例如,第一关键字数据为“果促销”,第一定制主播视频字段的数据类型为视频文件存储路径类型,第一对应关系表如表四所示,则直播平台查询表一,得到第一关键字字段与“果促销”匹配的第一对应关系记录为第2个第一对应关系记录,从第2个第一对应关系记录中,提取出第一定制主播视频字段的内容,生成第一视频数据,因为第一定制主播视频字段的数据类型为视频文件存储路径类型,所以第一视频数据仅仅是一个文件存储路径,直播平台还需参照该文件存储路径的指引,将进一步获得的存储的视频文件作为第一定制主播视频数据;
第一对应关系记录索引 | 第一关键字字段 | 第一定制主播视频字段 |
1 | 花促销 | 第一视频文件存储路径 |
2 | 果促销 | 第二视频文件存储路径 |
表四
步骤102,当第一关键字数据为空时,则复制预设的默认视频数据,作为第一定制主播视频数据。
这里,第一关键字数据为空则说明第一用户并未选择任何关键字,所以不能向第一用户随意推送不够精准的视频内容,在本发明实施例中,直播平台会预先生成一个默认的视频数据也就是默认视频数据,例如带有平台徽标(logotype,LOGO)的动态视频,当第一关键字数据为空时将第一定制主播视频数据设为默认视频数据。
通过上述步骤9、10的处理过程,对用户进行有效的兴趣引导,并根据引导结果对定制主播视频数据进行精确定位,这样一来,不但提高了与用户进行互动的反应效率,还提升与用户进行互动的准确度。
步骤11,向第一用户推送第一定制主播视频数据。
图2为本发明实施例二提供的一种主播视频数据的处理装置的模块结构图,该装置可以为实现本发明实施例方法的终端设备或者服务器,也可以为与上述终端设备或者服务器连接的实现本发明实施例方法的装置,例如该装置可以是上述终端设备或者服务器的装置或芯片系统。如图2所示,该装置包括:获取模块201、视频生成模块202、视频审核模块203、视频编辑模块204、视频发布模块205、互动获取模块206、互动识别模块207、互动分词模块208、互动引导模块209、互动视频提取模块210和互动视频推送模块211。
获取模块201用于获取第一播报文字数据及对应的第一视频配置数据组。
视频生成模块202用于采用异步视频生成模式,根据第一播报文字数据和第一视频配置数据组,进行第一主播视频生成处理,得到第一主播视频数据;并对第一主播视频数据进行保存。
视频审核模块203用于按预设的视频审核规则,根据第一视频配置数据组和第一播报文字数据,对存储的第一主播视频数据,进行第一视频内容审核处理。
视频编辑模块204用于第一视频内容审核处理成功,则根据预设的视频编辑状态数据,对第一主播视频数据,进行第一视频编辑处理,生成第二主播视频数据;并对第二主播视频数据进行保存。
视频发布模块205用于根据存储的第二主播视频数据,进行第一主播视频上线发布处理。
互动获取模块206用于第一主播视频上线发布处理成功之后,在第一用户在线观看第二主播视频数据期间,获取第一用户输入的第一输入数据。
互动识别模块207用于对第一输入数据的数据类型进行识别;当第一输入数据的数据类型为文字类型时,将第一输入数据,作为第一文字数据;当第一输入数据的数据类型为语音类型时,对第一语音数据,进行第一语音文字识别处理,将生成的文字数据作为第一文字数据。
互动分词模块208用于对第一文字数据,进行第一文字分词处理,得到多个第一文字分词数据。
互动引导模块209用于根据所有第一文字分词数据和预设的第一关键字列表,进行第一关键字引导处理,生成第一关键字数据。
互动视频提取模块210用于根据第一关键字数据,查询预设的反映关键字与定制主播视频对应关系的第一对应关系表,得到对应的第一定制主播视频数据。
互动视频推送模块211用于向第一用户推送第一定制主播视频数据。
本发明实施例提供的一种主播视频数据的处理装置,可以执行上述方法实施例中的方法步骤,其实现原理和技术效果类似,在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,获取模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所描述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,ASIC),或,一个或多个数字信号处理器(Digital Signal Processor,DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(System-on-a-chip,SOC)的形式实现。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本发明实施例所描述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线路(Digital Subscriber Line,DSL))或无线(例如红外、无线、蓝牙、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
图3为本发明实施例三提供的一种电子设备的结构示意图。该电子设备可以为前述的终端设备或者服务器,也可以为与前述终端设备或者服务器连接的实现本发明实施例方法的终端设备或服务器。如图3所示,该电子设备可以包括:处理器31(例如CPU)、存储器32、收发器33;收发器33耦合至处理器31,处理器31控制收发器33的收发动作。存储器32中可以存储各种指令,以用于完成各种处理功能以及实现本发明上述实施例中提供的方法和处理过程。优选的,本发明实施例涉及的电子设备还包括:电源34、系统总线35以及通信端口36。系统总线35用于实现元件之间的通信连接。上述通信端口36用于电子设备与其他外设之间进行连接通信。
在图3中提到的系统总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(Random Access Memory,RAM),也可能还包括非易失性存储器(Non-Volatile Memory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器CPU、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器DSP、专用集成电路ASIC、现场可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
需要说明的是,本发明实施例还提供一种计算机可读存储介质,该存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中提供的方法和处理过程。
本发明实施例还提供一种运行指令的芯片,该芯片用于执行上述实施例中提供的方法和处理过程。
本发明实施例提供的一种主播视频数据的处理方法、装置、电子设备及计算机可读存储介质,使用异步视频生成模式生成主播视频数据,降低了视频处理接口的并发压力,提高了视频制作效率;增加视频内容审核处理过程,提升了对视频制作质量的保障能力;视频直播时,增加对用户输入信息的主动识别及用户兴趣引导处理过程,弥补了人工伺服的不足,提高了与用户进行互动的反应效率,提升了与用户进行互动的准确度。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种主播视频数据的处理方法,其特征在于,所述方法包括:
获取第一播报文字数据及对应的第一视频配置数据组;
采用异步视频生成模式,根据所述第一播报文字数据和所述第一视频配置数据组,进行第一主播视频生成处理,得到第一主播视频数据;并对所述第一主播视频数据进行保存;
按预设的视频审核规则,根据所述第一视频配置数据组和所述第一播报文字数据,对存储的所述第一主播视频数据,进行第一视频内容审核处理;
所述第一视频内容审核处理成功,则根据预设的视频编辑状态数据,对所述第一主播视频数据,进行第一视频编辑处理,生成第二主播视频数据;并对所述第二主播视频数据进行保存;
根据存储的所述第二主播视频数据,进行第一主播视频上线发布处理;
所述第一主播视频上线发布处理成功之后,在第一用户在线观看所述第二主播视频数据期间,获取所述第一用户输入的第一输入数据;
对所述第一输入数据的数据类型进行识别;当所述第一输入数据的数据类型为文字类型时,将所述第一输入数据,作为第一文字数据;当所述第一输入数据的数据类型为语音类型时,对所述第一输入数据,进行第一语音文字识别处理,将生成的文字数据作为第一文字数据;
对所述第一文字数据,进行第一文字分词处理,得到多个第一文字分词数据;
根据所有所述第一文字分词数据和预设的第一关键字列表,进行第一关键字引导处理,生成第一关键字数据;
根据所述第一关键字数据,查询预设的反映关键字与定制主播视频对应关系的第一对应关系表,得到对应的第一定制主播视频数据;
向所述第一用户推送所述第一定制主播视频数据;
其中,所述第一视频配置数据组至少包括第一主播性别数据和第一主播语言类型数据;所述第一主播性别数据至少包括男主播和女主播;所述第一主播语言类型数据至少包括汉语类型和英语类型;
所述视频编辑状态数据包括直接引用状态和二次编辑状态;
所述第一关键字列表包括多个第一关键字信息;
所述第一对应关系表包括多个第一对应关系记录;所述第一对应关系记录包括第一关键字字段和第一定制主播视频字段;
所述按预设的视频审核规则,根据所述第一视频配置数据组和所述第一播报文字数据,对存储的所述第一主播视频数据,进行第一视频内容审核处理,具体包括:
根据所述第一视频配置数据组的所述第一主播性别数据,对存储的所述第一主播视频数据,进行第一性别核查处理;
根据所述第一视频配置数据组的所述第一主播语言类型数据,对存储的所述第一主播视频数据,进行第一语言类型核查处理;
根据所述第一播报文字数据,对存储的所述第一主播视频数据,进行第一播报内容核查处理;
根据预设的视频管理条例,对存储的所述第一主播视频数据,进行第一视频管理条例核查处理;
当所述第一性别核查处理成功、且所述第一语言类型核查处理成功、且所述第一播报内容核查处理成功、且所述第一视频管理条例核查处理成功时,所述第一视频内容审核处理成功,并将存储的所述第一主播视频数据,标记为第一通过审核视频;
当所述第一性别核查处理失败、或所述第一语言类型核查处理失败、或所述第一播报内容核查处理失败、或所述第一视频管理条例核查处理失败时,所述第一视频内容审核处理失败,并将存储的所述第一主播视频数据,标记为第一未通过审核视频;
所述根据所有所述第一文字分词数据和预设的第一关键字列表,进行第一关键字引导处理,生成第一关键字数据,具体包括:
根据每个所述第一文字分词数据,对所述第一关键字列表中的所有所述第一关键字信息进行最大匹配度轮询;对被轮询的所述第一关键字信息与所述第一文字分词数据,进行第一文字匹配度识别处理,生成第一匹配度数据;当所述第一匹配度数据超过预设的文字匹配度阈值时,提取被轮询的所述第一关键字信息,生成对应的第一提取数据;
统计所有所述第一提取数据,生成第一关键字确认列表;
向所述第一用户发送所述第一关键字确认列表;并根据所述第一用户对所有所述第一提取数据的选择结果,生成第一提取数据索引;
当所述第一提取数据索引不为空时,将所述第一提取数据索引对应的所述第一提取数据,作为所述第一关键字数据;当所述第一提取数据索引为空时,设置所述第一关键字数据为空;
所述对所述第一文字数据,进行第一文字分词处理,得到多个第一文字分词数据,具体包括:
使用通过大数据训练完成的人工智能分词识别模型识别出所述第一文字数据中所有单词的词性,并根据设定的保留词性对其中部分单词进行保留生成对应的多个所述第一文字分词数据。
2.根据权利要求1所述的主播视频数据的处理方法,其特征在于,所述采用异步视频生成模式,根据所述第一播报文字数据和所述第一视频配置数据组,进行第一主播视频生成处理,得到第一主播视频数据,具体包括:
根据所述第一播报文字数据和所述第一视频配置数据组,组装生成第一生成视频指令数据;
将所述第一生成视频指令数据,向预设的第一视频生成接口进行发送;并接收从所述第一视频生成接口发回的第一任务标识数据;
根据所述第一任务标识数据,组装生成第一视频进度查询指令数据;
按预设的查询指令发送频率,定时向预设的第一进度查询接口,发送所述第一视频进度查询指令数据;并接收从所述第一进度查询接口发回的第一进度数据;
对所述第一进度数据,进行第一进度显示处理;并在所述第一进度数据为已完成时,根据所述第一任务标识数据,组装生成第一视频下载指令数据;
将所述第一视频下载指令数据,向预设的第一视频下载接口进行发送;并接收从所述第一视频下载接口发回所述第一主播视频数据。
3.根据权利要求1所述的主播视频数据的处理方法,其特征在于,所述根据预设的视频编辑状态数据,对所述第一主播视频数据,进行第一视频编辑处理,生成第二主播视频数据,具体包括:
对所述视频编辑状态数据进行识别;当所述视频编辑状态数据为所述直接引用状态时,直接复制所述第一主播视频数据,生成所述第二主播视频数据;当所述视频编辑状态数据为所述二次编辑状态时,根据预设的二次编辑方案,对所述第一主播视频数据进行二次视频编辑处理,生成所述第二主播视频数据。
4.根据权利要求1所述的主播视频数据的处理方法,其特征在于,所述根据所述第一关键字数据,查询预设的反映关键字与定制主播视频对应关系的第一对应关系表,得到对应的第一定制主播视频数据,具体包括:
当所述第一关键字数据不为空时,首先,对所述第一对应关系表的所有所述第一对应关系记录进行轮询;当被轮询的所述第一对应关系记录的所述第一关键字字段与所述第一关键字数据匹配时,提取被轮询的所述第一对应关系记录的所述第一定制主播视频字段,作为第一视频数据;然后,再对所述第一视频数据的数据类型进行判断;若所述第一视频数据的数据类型为视频文件类型,则复制所述第一视频数据,生成所述第一定制主播视频数据;若所述第一视频数据的数据类型为视频文件存储路径类型,则复制所述第一视频数据指定的存储位置处的视频文件,生成所述第一定制主播视频数据;
当所述第一关键字数据为空时,则复制预设的默认视频数据,作为所述第一定制主播视频数据。
5.一种用于实现权利要求1-4任一项所述的主播视频数据的处理方法的装置,其特征在于,包括:
获取模块用于获取第一播报文字数据及对应的第一视频配置数据组;
视频生成模块用于采用异步视频生成模式,根据所述第一播报文字数据和所述第一视频配置数据组,进行第一主播视频生成处理,得到第一主播视频数据;并对所述第一主播视频数据进行保存;
视频审核模块用于按预设的视频审核规则,根据所述第一视频配置数据组和所述第一播报文字数据,对存储的所述第一主播视频数据,进行第一视频内容审核处理;
视频编辑模块用于所述第一视频内容审核处理成功,则根据预设的视频编辑状态数据,对所述第一主播视频数据,进行第一视频编辑处理,生成第二主播视频数据;并对所述第二主播视频数据进行保存;
视频发布模块用于根据存储的所述第二主播视频数据,进行第一主播视频上线发布处理;
互动获取模块用于所述第一主播视频上线发布处理成功之后,在第一用户在线观看所述第二主播视频数据期间,获取所述第一用户输入的第一输入数据;
互动识别模块用于对所述第一输入数据的数据类型进行识别;当所述第一输入数据的数据类型为文字类型时,将所述第一输入数据,作为第一文字数据;当所述第一输入数据的数据类型为语音类型时,对所述第一输入 数据,进行第一语音文字识别处理,将生成的文字数据作为第一文字数据;
互动分词模块用于对所述第一文字数据,进行第一文字分词处理,得到多个第一文字分词数据;
互动引导模块用于根据所有所述第一文字分词数据和预设的第一关键字列表,进行第一关键字引导处理,生成第一关键字数据;
互动视频提取模块用于根据所述第一关键字数据,查询预设的反映关键字与定制主播视频对应关系的第一对应关系表,得到对应的第一定制主播视频数据;
互动视频推送模块用于向所述第一用户推送所述第一定制主播视频数据。
6.一种电子设备,其特征在于,包括:存储器、处理器和收发器;
所述处理器用于与所述存储器耦合,读取并执行所述存储器中的指令,以实现权利要求1-4任一项所述的方法步骤;
所述收发器与所述处理器耦合,由所述处理器控制所述收发器进行消息收发。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行权利要求1-4任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110241660.9A CN113015002B (zh) | 2021-03-04 | 2021-03-04 | 一种主播视频数据的处理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110241660.9A CN113015002B (zh) | 2021-03-04 | 2021-03-04 | 一种主播视频数据的处理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113015002A CN113015002A (zh) | 2021-06-22 |
CN113015002B true CN113015002B (zh) | 2022-11-22 |
Family
ID=76405694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110241660.9A Active CN113015002B (zh) | 2021-03-04 | 2021-03-04 | 一种主播视频数据的处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113015002B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113923515A (zh) * | 2021-09-29 | 2022-01-11 | 马上消费金融股份有限公司 | 视频制作方法、装置、电子设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160306811A1 (en) * | 2013-12-26 | 2016-10-20 | Le Holdings (Beijing) Co., Ltd. | Method and system for creating inverted index file of video resource |
CN107066477A (zh) * | 2016-12-13 | 2017-08-18 | 合网络技术(北京)有限公司 | 一种智能推荐视频的方法及装置 |
CN110275866A (zh) * | 2019-04-25 | 2019-09-24 | 武汉众邦银行股份有限公司 | 文件生成过程的交互方法、装置、服务器和用户终端 |
CN111050187B (zh) * | 2019-12-09 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 一种虚拟视频处理的方法、装置及存储介质 |
CN112381926A (zh) * | 2020-11-13 | 2021-02-19 | 北京有竹居网络技术有限公司 | 用于生成视频的方法和装置 |
-
2021
- 2021-03-04 CN CN202110241660.9A patent/CN113015002B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113015002A (zh) | 2021-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210027788A1 (en) | Conversation interaction method, apparatus and computer readable storage medium | |
US20200301954A1 (en) | Reply information obtaining method and apparatus | |
US9582757B1 (en) | Scalable curation system | |
US8165887B2 (en) | Data-driven voice user interface | |
CN109979450B (zh) | 信息处理方法、装置及电子设备 | |
US11586689B2 (en) | Electronic apparatus and controlling method thereof | |
CN106407393B (zh) | 一种用于智能设备的信息处理方法及装置 | |
CN104573099A (zh) | 题目的搜索方法及装置 | |
CN111210842A (zh) | 语音质检方法、装置、终端及计算机可读存储介质 | |
US11531821B2 (en) | Intent resolution for chatbot conversations with negation and coreferences | |
CN115099239B (zh) | 一种资源识别方法、装置、设备以及存储介质 | |
CN110825840B (zh) | 词库扩充方法、装置、设备及存储介质 | |
CN113015002B (zh) | 一种主播视频数据的处理方法和装置 | |
CN110750626B (zh) | 一种基于场景的任务驱动的多轮对话方法及系统 | |
CN111695360B (zh) | 语义分析方法、装置、电子设备及存储介质 | |
US20230244878A1 (en) | Extracting conversational relationships based on speaker prediction and trigger word prediction | |
CN110032626B (zh) | 语音播报方法和装置 | |
CN110047473B (zh) | 一种人机协作交互方法及系统 | |
CN115858776B (zh) | 一种变体文本分类识别方法、系统、存储介质和电子设备 | |
CN112528638A (zh) | 异常对象识别方法及装置、电子设备、存储介质 | |
CN115688769A (zh) | 一种基于长文本的意图识别方法、装置、设备及存储介质 | |
CN112562734B (zh) | 一种基于语音检测的语音交互方法及其装置 | |
CN111556096B (zh) | 信息推送方法、装置、介质及电子设备 | |
CN108877781B (zh) | 一种智能语音搜索影片的方法及系统 | |
CN112836057A (zh) | 知识图谱的生成方法、装置、终端以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |