CN108965737A - 媒体数据处理方法、装置及存储介质 - Google Patents

媒体数据处理方法、装置及存储介质 Download PDF

Info

Publication number
CN108965737A
CN108965737A CN201710363825.3A CN201710363825A CN108965737A CN 108965737 A CN108965737 A CN 108965737A CN 201710363825 A CN201710363825 A CN 201710363825A CN 108965737 A CN108965737 A CN 108965737A
Authority
CN
China
Prior art keywords
video
picture set
picture
text
sent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710363825.3A
Other languages
English (en)
Other versions
CN108965737B (zh
Inventor
董霙
张涛
辛永佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710363825.3A priority Critical patent/CN108965737B/zh
Priority to PCT/CN2018/086672 priority patent/WO2018214772A1/zh
Publication of CN108965737A publication Critical patent/CN108965737A/zh
Application granted granted Critical
Publication of CN108965737B publication Critical patent/CN108965737B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/265Mixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种媒体数据处理方法,包括:接收客户端发送的网页链接;根据该网页链接获取网页数据,并从所述网页数据中获取第一素材;其中,所述第一素材包括第一文本和第一图片集合;根据所述第一文本确定所述第一素材的关键词和第一文字脚本;根据所述关键词查找对应的第二图片集合;根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;将所述第一视频的链接发送至所述客户端,以使所述客户端根据所述第一视频的链接播放所述第一视频。本申请还提出了相应的媒体数据处理装置。

Description

媒体数据处理方法、装置及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及媒体数据处理方法、装置及存储介质。
背景技术
经过近几年的互联网技术的飞速发展,互联网的业务不断增加,人们基于互联网可以接触到各种各样的信息,网络也成为人们日常工作和生活中不可或缺的一部分。比如,用户可以利用互联网收发工作邮件、进行视频会议等;或者,利用互联网浏览新闻、听音乐、购物、订餐、观看视频等。随着互联网的不断发展进步,基于互联网所产生的媒体数据的数据量也越来越大。对于媒体数据的处理方法受到越来越多的关注。
发明内容
本申请实例提供了一种媒体数据处理方法,包括:
接收客户端发送的网页链接;
根据该网页链接获取网页数据,并从所述网页数据中获取第一素材;其中,所述第一素材包括第一文本和第一图片集合;
根据所述第一文本确定所述第一素材的关键词和第一文字脚本;
根据所述关键词查找对应的第二图片集合;
根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;
将所述第一视频的链接发送至所述客户端,以使所述客户端根据所述第一视频的链接播放所述第一视频。
在一些实例中,所述生成第一视频,包括:
将所述第一文字脚本、所述第一图片集合和所述第二图片集合发送给所述客户端;
接收所述客户端发送的第二文字脚本和第三图片集合;其中,所述第二文字脚本和所述第三图片集合由所述客户端响应于对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理而确定;
根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
在一些实例中,所述方法进一步包括:
建立图片数据库,所述图片数据库中的图片与关键词关联保存;
其中,所述根据所述关键词查找对应的第二图片集合包括:
从所述图片数据库中查找与所述关键词关联的一个或多个第二图片。
在一些实例中,所述根据所述关键词查找对应的第二图片集合包括:通过搜索引擎从互联网中搜索与所述关键词关联的一个或多个第二图片。
在一些实例中,所述方法进一步包括:
接收所述客户端上传的第二素材;其中,所述第二素材包括第二文字脚本和第三图片集合;
根据所述第二文字脚本及所述第二图片集合生成第二视频,并生成所述第二视频的链接;
将所述第二视频的链接发送至所述客户端,以使所述客户端根据所述第二视频的链接播放所述第二视频。
在一些实例中,所述生成第一视频包括:
根据所述第一文字脚本生成语音、字幕;
根据所述第一图片集合和所述第二图片集合生成图片帧序列
确定所述第一图片集合和所述第二图片集合的转场模板;
根据所述第一图片集合、第二图片集合及所述转场模板,生成转场图片帧序列;
根据所述图片帧序列、转场图片帧序列及所述语音、字幕,生成所述第一视频。
在一些实例中,所述根据所述第二文字脚本及所述第三图片集合生成所述第一视频包括:
将所述第三图片集合中的图片按照所述图片的序号进行排序,生成图片帧序列;
接收客户端发送的任意序号相邻的两个图片的转场模板的标识;
根据所述转场模板的标识确定转场模板;
利用所述转场模板对所述两个图片进行转场处理,生成转场图片帧序列;
根据所述第二文字脚本确定语音、字幕;
根据所述图片帧序列、转场图片帧序列及所述语音、字幕,生成所述第一视频。
在一些实例中,所述方法进一步包括:
接收客户端响应于对发布视频控件的操作发送的视频发布请求,生成所述第一视频的标识,将所述第一视频及所述第一视频的标识发送到视频服务器。
本申请实例还提供一种媒体数据处理方法,包括:
响应于对输入控件的操作,获取网页链接,将所述网页链接发送至网站服务器,以使网站服务器根据该网页链接获取页面数据,并从所述网页数据中获取第一素材;所述第一素材包括第一文本和第一图片集合;根据所述第一文本确定所述第一素材的关键词和第一文字脚本;根据所述关键词查找对应的第二图片集合;根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;
接收网站服务器发送的所述第一视频的链接,根据所述第一视频的链接播放所述第一视频。
在一些实例中,所述方法进一步包括:
接收网站服务器发送的所述第一文字脚本、所述第一图片集合和所述第二图片集合;
响应于对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理,确定第二文字脚本和第三图片集合;
将所述第二文字脚本和第三图片集合发送给网站服务器,以使网站服务器根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
在一些实例中,所述方法进一步包括:
响应于对添加控件的操作获取第二素材,将所述第二素材发送给网站服务器,其中,所述第二素材包括第二文字脚本和第三图片集合;以使网站服务器根据所述第二文字脚本及所述第三图片集合生成第二视频,并生成所述第二视频的链接;
接收网站服务器发送的所述第二视频的链接,根据所述第二视频的链接播放所述第二视频。
在一些实例中,所述方法进一步包括:
将所述预定展示顺序中任意相邻的两个图片的转场模板的标识发送给网站服务器,以使网站服务器根据所述转场模板的标识确定转场模板;
利用所述转场模板对所述两个图片进行转场处理,生成所述两个图片的转场图片帧序列。
在一些实例中,所述方法进一步包括:
响应于对发布视频控件的操作,向网站服务器发送视频发布请求,以使网站服务器生成所述第一视频的标识,将生成的所述第一视频及所述第一视频的标识发送给视频服务器。
本申请实例还提供一种媒体数据处理装置,包括:
第一接收单元,用于接收客户端发送的网页链接;
第一素材获取单元,用于根据该网页链接获取网页数据,并从所述网页数据中获取第一素材;其中,所述第一素材包括第一文本和第一图片集合;
关键词及文字脚本确定单元,用于根据所述第一文本确定所述第一素材的关键词和第一文字脚本;
查找单元,用于根据所述关键词查找对应的第二图片集合;
第一视频生成单元,用于根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;
第一链接发送单元,用于将所述第一视频的链接发送至所述客户端,以使所述客户端根据所述第一视频的链接播放所述第一视频。
在一些实例中,所述第一视频生成单元,用于:
将所述第一文字脚本、所述第一图片集合和所述第二图片集合发送给所述客户端;
接收所述客户端发送的第二文字脚本和第三图片集合;其中,所述第二文字脚本和所述第三图片集合由所述客户端响应于对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理而确定;
根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
在一些实例中,所述装置进一步包括:
发布单元,用于接收客户端响应于对发布视频控件的操作发送的视频发布请求,生成所述第一视频的标识,将所述第一视频及所述第一视频的标识发送到视频服务器。
本申请实例还提供一种媒体数据处理装置,包括:
第一发送单元,用于响应于对输入控件的操作,获取网页链接,将所述网页链接发送至网站服务器,以使网站服务器根据该网页链接获取页面数据,并从所述网页数据中获取第一素材;所述第一素材包括第一文本和第一图片集合;根据所述第一文本确定所述第一素材的关键词和第一文字脚本;根据所述关键词查找对应的第二图片集合;根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;
第一链接接收单元,用于接收网站服务器发送的所述第一视频的链接,根据所述第一视频的链接播放所述第一视频。
在一些实例中,所述装置进一步包括:
接收单元,用于接收网站服务器发送的所述第一文字脚本、所述第一图片集合和所述第二图片集合;
处理单元,用于响应于对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理,确定第二文字脚本和第三图片集合;
第二发送单元,用于将所述第二文字脚本和第三图片集合发送给网站服务器,以使网站服务器根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
本申请实例还提供一种计算机可读存储介质,存储有计算机可读指令,可以使至少一个处理器执行上述所述的方法。
采用本申请提供的上述方案,能够自动生成视频。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是是本申请实例涉及的系统构架图;
图2是本申请一实例媒体数据处理方法的流程图;
图3是本申请一实例用户筛选调整的素材的页面示意图;
图4是本申请一实例预览视频的弹窗示意图;
图5是本申请另一实例应用于客户端的媒体数据处理方法的流程图;
图6是本申请一实例媒体数据处理方法中客户端与网站服务器及视频服务器之间的交互图;
图7是本申请一实例媒体数据处理装置的结构示意图;
图8是本申请另一实例媒体数据处理装置的结构示意图;以及
图9为本申请实例中的计算设备组成结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提出了一种媒体数据处理方法,该方法可应用于图1所示的系统构架中。如图1所示,该系统架构包括:客户端101、WEB服务器102及视频服务器104,其中WEB服务器102包括媒体数据处理装置103,该WEB服务器为一个用于制作视频的网站服务器,该客户端101可以为浏览器客户端,也可以是用于制作视频的APP。
用户通过客户端101向WEB服务器102请求访问相关媒体的页面,访问相关媒体内容。当用户访问媒体内容时,准备将访问的媒体内容页面上的相关内容生成对应视频时,登录视频生成页面,在该页面中输入上述媒体内容页面的链接,浏览器向WEB服务器中的媒体数据处理装置103发送生成视频的请求。媒体数据处理装置103根据所述媒体内容页面的链接获取页面数据,并根据所述页面数据生成与所述媒体内容页面内容相关的视频。媒体数据处理装置103将生成的所述视频的链接发送给客户端101,用户根据该链接可以对生成的视频进行播放预览。并根据用户对于所述生成视频的发布请求,媒体数据处理装置103生成所述视频的标识,并将生成的所述视频及所述视频的标识发送到视频服务器104,所述视频的标识包括所述视频的封面图片及链接。所述发布请求中包括视频发布的网站及在该网站页面上的展示位置,视频服务器104记录所述生成视频的发布的网站及展示位置。视频服务器104响应于所述网站的访问用户对所述网站的访问,将所述生成视频的标识发送到所述访问用户的客户端,该客户端可以为浏览器客户端,并在网站页面上的所述展示位置处展示。访问用户通过点击所述生成视频的标识,能够实现对所述视频的观看。或者用户登录视频生成页面,在该页面中编辑文本、上传图片,向媒体数据处理装置103发送生成视频请求。媒体数据处理装置103获取用户编辑的文本及上传的图片,生成与所述文本及图片内容相关的视频,将生成的所述视频的链接发送给客户端101,用户根据该链接对生成的视频进行播放预览。媒体数据处理装置103并根据用户对于所述视频的发布请求,媒体数据处理装置103生成所述视频的标识,并将生成的所述视频及所述视频的标识发送到视频服务器104,所述视频的标识包括所述视频的封面图片及链接。所述发布请求中包括视频发布的网站及在该网站页面上的展示位置,视频服务器104记录所述生成视频的发布的网站及展示位置。视频服务器104响应于所述网站的访问用户对所述网站的访问,将所述生成视频的标识发送到所述访问用户的客户端,该客户端可以为浏览器客户端,并在网站页面上的所述展示位置处展示。访问用户通过点击所述生成视频的标识,能够实现对所述视频的观看。所述客户端101可以为Internet Explorer(IE)、火狐等。
例如,当所述媒体内容为新闻时,用户通过浏览器浏览新闻时,对于一篇其感兴趣的新闻,想获得对应的视频时,用户登录视频生成页面编辑获得所述视频。一方面用户可以通过编辑文本、上传图片进行上传新闻,用户同时可以选择将上传的图片及输入的文本生成视频,媒体数据处理装置103生成与上述文本、图片相对应的视频,将生成的所述视频的链接发送到视频生成页面,方便用户进行播放预览。当用户对于所述视频选择发布到新闻网站上时,媒体数据处理装置103生成所述视频的标识,将生成的视频及所述视频的链接发送到视频服务器104,视频服务器104响应于所述新闻网站的访问用户对所述新闻网站的访问,将所述生成视频的标识发送到所述访问用户的客户端,并在新闻网站页面上展示。访问用户通过点击所述生成视频的标识,能够实现对所述视频的观看。
基于上述技术问题,本申请提出一种媒体数据处理方法,该方法可用于媒体数据处理装置103。如图2所示,该方法包括以下步骤:
步骤201:接收客户端发送的网页链接;根据该网页链接获取网页数据,并从所述网页数据中获取第一素材;其中,所述第一素材包括第一文本和第一图片集合。
媒体数据处理装置103可以通过两种方式获得第一素材,一是用户在视频生成页面中编辑输入文本内容及上传图片,浏览器客户端将该文本内容及图片发送给媒体数据处理装置103。二是用户输入的网页链接,媒体数据处理装置103根据该网页链接获取对应页面的页面数据,从页面数据中获取第一素材,即从对应的网页上抓取网页的文本内容及图片。对于第二种方式,抓取网页上的网页数据,可以采用网络爬虫、蚂蚁、自动索引、模拟程序或者蠕虫获取网页上的网页数据。在获取网页中的第一素材时,获取网页源码,在获取的网页源码中提取网页上的文本内容及图片。从网页上抓取的第一素材包括第一文本和第一图片集合,该第一图片集合中包括1张或多张图片。
在网页上抓取第一素材时,网页上可能存在多张图片及多段文本内容,在抓取第一素材时需要确定抓取的图片对应哪段文本内容,本申请利用图文模块的常用组合序列构建Trie树,采用媒体数据进行训练,获得一类媒体内容对应的图文对应关系。例如对于新闻来说,根据多篇新闻报道的训练数据,得到新闻的模块序列为图-文-图-文方式。则在抓取网页上的第一素材时,确定一张图片下方的文本内容为与该张图片对应的文本内容。
步骤202:根据所述第一文本确定所述第一素材的关键词和第一文字脚本。
根据在上步骤中获得的第一素材中的第一文本提取所述第一素材的关键词及第一文字脚本,所述第一文字脚本包括标题及内容摘要等。其中,标题可以为步骤201中的网页的网页标题,该标题可以作为后续生成的视频的文本标题。提取的所述关键词包括主题如体育类、财经类、足球类及健康类等,同时也包括时间、人物、热度事件等,可以用于后续的搜索更加丰富的素材,提取的内容摘要可以用来生成视频的语音及字幕。
在一段文本内容中提取关键词及内容摘要,可以采用TF_IDF、TextRank、PageRank等常用算法并进行提取,对这些算法使用海量的中文文本进行训练,在训练的过程中采用seq2seq技术,同时配合attention model,从而改善对于长短文本的关键词和摘要的提取效果。
在一些实例中,采用TF_IDF算法提取第一素材的关键词及内容摘要。TF_IDF算法的思想是找到文本内容中出现次数最多的词,如果某个词很重要,它应该在文本内容中多次出现;如果某个词比较少见,但是它在这篇文章中多次出现,那么它很可能就反映了这篇文章的特性。
首先,需要进行进行"词频"(Term Frequency,TF)统计,在统计词频时需要过滤掉一些"的"、"是"、"在"这一类对结果毫无帮助的必须过滤掉的“停用词”。在过滤掉停用词,统计剩下的有实际意义的词的词频时,会出现不同的词出现次数一样多的情况,因而需要一个重要性调整系数,衡量一个词是不是常见词。如果某个词比较少见,但是它在这篇文章中多次出现,那么它很可能就反映了这篇文章的特性,正是所需要的关键词。即在词频的基础上,要对每个词分配一个"重要性"权重。最常见的词给予最小的权重,较常见的词("中国")给予较小的权重,较少见的词给予较大的权重。这个权重叫做"逆文档频率"(InverseDocument Frequency,缩写为IDF),它的大小与一个词的常见程度成反比。
知道了"词频"(TF)和"逆文档频率"(IDF)以后,将这两个值相乘,就得到了一个词的TF-IDF值。某个词对文章的重要性越高,它的TF-IDF值就越大。所以,排在最前面的几个词,就是这篇文章的关键词。同时根据提取出的多个关键词,确定内容摘要,内容摘要包括第一图片集合中每张图片对应的内容摘要。
步骤203:根据所述关键词查找对应的第二图片集合。
在网页上抓取的图片一般比较少,为了生成丰富内容的视频,根据所述关键词查找对应的第二图片集合。例如,第一素材为在一篇两会的新闻上获得的素材,该第一素材的关键词包括:两会,则网站服务器中的媒体数据处理装置103查找有关两会的更多的图片,使得后续生成的视频内容更加丰富。
步骤204:根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;将所述第一视频的链接发送至所述客户端,以使所述客户端根据所述第一视频的链接播放所述第一视频。
在生成所述第一视频时,根据所述第一文字脚本生成视频的语音及字幕。根据第一图片集合及第二图片集合中的图片生成视频的图片帧序列。同时对于要展示的图片,每两张图片之间可以进行转场处理,根据预设的转场效果将要展示的图片中相邻的两张图片进行转场处理,形成转场图片帧序列。根据上述生成的语音、字幕、图片帧序列、转场图片帧序列生成视频,同时生成该视频的链接,将该视频的链接发送到客户端进行展示。如图4所示,网站服务器生成第一视频后,在浏览器客户端展示如图4所示的弹窗,用户通过对弹窗中的控件41的操作,预览生成的视频。
采用本申请提供的媒体数据处理方法,在网页上快速抓取第一素材,该第一素材包括第一文本及第一图片集合,根据该第一文本提取关键词及第一文字脚本,根据该关键词查找更丰富的图片,根据在网页上抓取的第一图片集合、查找到的第二图片集合及第一文字脚本,快速生成质量较高的短视频,降低了制作视频的成本,提升了短视频的制作效率。
在一些实例中,在上述步骤204中,在执行所述生成第一视频时,包括以下步骤:
步骤S301:将所述第一文字脚本、所述第一图片集合和所述第二图片集合发送给所述客户端。
在该实例中,将在网页数据中获取的第一素材的第一文字脚本、第一图片集合,以及查找到的第二图片集合发送给客户端,供用户筛选及调整。客户端供用户筛选调整的页面图如图3所示,在该页面中展示第一图片集合中的图片及第二图片集合中的图片。第一文字脚本中包括标题及第一图片集合中每张图片的内容摘要,第一图片集合中的每张图片对应的内容摘要展示在对应图片后面的文本框305中。网站服务器查找到的第二图片集合中的图片没有对应的内容摘要,对应图片后方的文本框305中没有对应的文本内容,但后续用户可在第二图片集合中的图片后方的文本框305中编辑输入对应的内容摘要。第一文字脚本中的标题展示在文本框301中。网站服务器同时返回第一素材的关键字,展示在文本框302中。
步骤S302:接收所述客户端发送的第二文字脚本和第三图片集合;其中,所述第二文字脚本和所述第三图片集合由所述客户端响应于用户对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理而确定。
用户对第一文字脚本、第一图片集合、第二图片集合的处理包括:添加新的图片及对应内容摘要、删除第一图片集合中的图片及对应的内容摘要或删除第二图片;将第一图片的内容摘要进行修改、编辑第二图片的内容摘要、修改图片的展示顺序、选择相邻两图片的转场模板的标识。在图3所示的页面中,用户对添加条目控件308进行操作,可以添加新的图片及编辑该图片的内容摘要。用户对删除控件306进行操作,可以删除对应条目,该条目包括图片及图片对应的内容摘要。用户通过对图片控件303进行操作,可以更换图片。用户通过对文本框305进行操作,可以修改文本框305中的内容摘要或者编辑新的内容摘要。用户通过对顺序控件304进行操作,可以选择图片的展示顺序,其中,操作控件304中向上的箭头,对应的条目向上移动一个位置,如果该条目已经在最顶端,则该条目不移动。操作控件304中向下的箭头,对应的条目向下移动一个位置,如果该条目已经在最底端,则该条目不移动。操作模板控件307,出现一个下拉列表框,在该下拉列表框中选择一个转场模板标识,该转场模板的标识对应控件307上方的图片与下方的图片之间的转场处理方式。用户处理后形成第三图片集合及第二文字脚本,第三图片集合中包括1张或多张图片,第二文字脚本包括第三图片集合中的每张图片的内容摘要。
步骤S303:根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
网站服务器中的媒体数据处理装置103根据第三图片集合中的图片,第三图片集合中每张图片的序号,生成图片帧序列;根据用户预设的展示顺序中的任两张相邻图片的转场模板标识确定转场模板,并根据该转场模板做转场处理,形成转场图片帧序列,进而将图片帧序列、转场帧序列与语音、字幕进行匹配,形成第一视频。
在一些实例中,本申请提出的媒体数据处理方法,进一步包括以下步骤:
步骤S401:建立图片数据库,所述图片数据库中的图片与关键词关联保存。
网站服务器中的媒体数据处理装置103建立图片数据库,当在步骤204中,媒体数据处理装置103根据第一文字脚本、第一图片集合及第二图片集合生成第一视频时,同时将第一图片集合中的图片、第二图片集合中的图片保存在图片数据库中,所述第一文字脚本包括关键词,将该关键词与第一图片集合中的图片及第二图片集合中的图片关联保存在图片数据中。
步骤S402:在上述步骤203中,在执行所述根据所述关键词查找对应的第二图片集合包括:从所述图片数据库中查找与所述关键词关联的一个或多个第二图片。
根据第一素材的关键词,在检索与第一素材内容相关的第二图片时,根据所述关键词在图片数据库中查找第二图片。例如第一素材是从关于黄河的一篇文章中提取的,该第一素材的关键词包括:黄河,则在图片数据库中查找更多关于黄河的图片,从而使得素材内容更加丰富。
在一些实例中,在上述步骤203中,在执行所述根据所述关键词查找对应的第二图片集合包括:通过搜索引擎从互联网中搜索与所述关键词关联的一个或多个第二图片。并将搜索到的图片下载到本地。
在一些实例中,本申请提供的媒体数据处理方法,进一步包括以下步骤:
步骤S501:接收所述客户端上传的第二素材;其中,所述第二素材包括第二文字脚本和第三图片集合。
在上述实例中,通过抓取网页上的媒体内容获得第一素材,在本实例中,可以根据用户上传的图片及输入图片的内容摘要来获得素材,即获得第二素材,获得的素材中包括第二文字脚本及第三图片集合。第三图片集合中包括1张或多张图片,第二文字脚本中包括第三图片集合中每张图片的内容摘要。用户可以在图3所示的页面中上传图片及输入每张图片的内容摘要。用户通过对控件308进行操作,形成如条目309一样的条目,用户对条目中的图片控件303的操作,可以上传想要的图片。同时用户在文本框305中输入与图片对应的内容摘要。用户可以添加1条或多条条目,当添加多条条目时,用户通过对控件304的操作确定条目中的图片在视频中的展示顺序。同时用户通过对控件307的操作确定控件307上下两个条目中的图片的转场模式。用户同时可以在文本框301中输入待生成视频的标题,在文本框302中输入关键词。
步骤S502:根据所述第二文字脚本及所述第三图片集合生成第二视频,并生成所述第二视频的链接;将所述第二视频的链接发送至所述客户端,以使所述客户端根据所述第二视频的链接播放所述第二视频。
网站服务器中的媒体数据处理装置103根据第二图片集合中的图片,第二图片集合中图片的序号,生成图片帧序列;根据用户预设的展示顺序中的任两张相邻图片的转场模板标识确定转场模板,并根据该转场模板做转场处理,形成转场图片帧序列,进而将图片帧序列、转场帧序列与语音、字幕进行匹配,形成第二视频。
在一些实例中,在上述步骤203中,在执行所述生成视频时,包括以下步骤:
步骤S601:根据所述第一文字脚本生成语音、字幕。
第一文字脚本包括第一图片集合中的图片的内容摘要,根据第一文字脚本的内容摘要生成视频的语音,例如根据该第一文字脚本,通过讯飞离线语音合成生成视频的语音文件,再根据语音时长,生成标准格式字幕文件。
步骤S602:根据所述第一图片集合和所述第二图片集合生成图片帧序列。
将所述第一图片集合中的图片、第二图片集合中的图片进行预处理,形成大小相同的图片。将第一图片集合及第二图片集合中的图片按照预定展示顺序进行排序,形成图片帧序列。
步骤S603:确定所述第一图片集合和所述第二图片集合的转场模板;根据所述第一图片集合、第二图片集合及所述转场模板,生成转场图片帧序列。
该转场模板可以是默认的转场模板,将所述预定展示顺序中的任相邻的两张图片按照该默认转场模板进行转场处理,得到该两张图片之间的转场图片帧序列。
步骤S604:根据所述图片帧序列、转场图片帧序列及所述语音、字幕,生成所述第一视频。
根据语音时长、字幕的配置参数,将所述图片帧序列、转场图片帧序列及所述语音、字幕进行匹配合成,生成所述第一视频,具体地,可利用FFmpeg服务端软件自动合成字幕、语音和图片完整匹配的视频内容。
在一些实例中,在上述步骤S502中,在执行所述根据所述第二文字脚本及所述第三图片集合生成所述第一视频时,包括以下步骤:
步骤701:将所述第三图片集合中的图片按照所述图片的序号进行排序,生成图片帧序列。
在图3所示的页面中,客户端响应于用户对顺序控件的操作,获得第三图片集合中的图片的展示顺序。即获得第三图片集合中每张图片的序号,根据第三图片集合中每张图片的序号将第三图片集合中的图片进行排序,得到图片帧序列。例如第三图片集合中包括4张图片,这四张图片的展示顺序为A3、A4、A2、A1,则得到的图片帧序列为:A3、A4、A2、A1。
步骤S702:接收客户端发送的任意序号相邻的两个图片的转场模板的标识;根据所述转场模板的标识确定转场模板;利用所述转场模板对所述两个图片进行转场处理,生成转场图片帧序列。
在图3所示的页面中,客户端响应于用户对控件307的操作,确定控件307上下两张图片的转场模板的标识。网站服务器中的媒体数据处理装置103中保存了转场模板标识与转场模板之间的对应关系,根据上述转场模板的标识确定所述两张图片的转场模板。根据确定的转场模板将所述两张图片进行转场处理。例如,对于步骤S702中得到的图片帧序列A3、A4、A2、A1,图片A3、A4采用转场模板C1生成转场图片M1;相对应的图片A4、A2采用转场模板C2生成转场图片M2,图片A2、A1采用转场模板C3生成转场图片M3,则最后生成视频的播放图片帧序列为:A3、M1、A4、M2、A2、M3、A1。
步骤S703:根据所述第二文字脚本确定语音、字幕;根据所述图片帧序列、转场图片帧序列及所述语音、字幕,生成所述第一视频。
还如上例所示,根据步骤S703中得到的视频的播放图片帧序列A3、M1、A4、M2、A2、M3、A1,将该播放图片帧序列与生成的语音文件、字幕文件匹配生成所述第一视频。
在一些实例中,本申请提出的媒体数据处理方法,进一步包括以下步骤:接收客户端响应于用户对发布视频控件的操作发送的视频发布请求,生成所述第一视频的标识,将所述第一视频及所述第一视频的标识发送到视频服务器。
网站服务器中的媒体数据处理装置103生成视频,同时生成该视频的链接,将该链接发送给客户端,展示如图4所示的跳窗页面,用户通过对控件41的操作,对该视频的预览。客户端影响于用户对控件43的操作,向网站服务器发送视频发布请求,媒体数据处理装置103生成所述视频的标识,并将生成的所述视频及所述视频的标识发送到视频服务器104,所述视频的标识包括所述视频的封面图片及链接。所述发布请求中包括视频发布的网站及在该网站页面上的展示位置,视频服务器104记录所述生成视频的发布的网站及展示位置。视频服务器104响应于所述网站的访问用户对所述网站的访问,将所述生成视频的标识发送到所述访问用户的客户端,并在网站页面上的所述展示位置处展示。访问用户通过点击所述生成视频的标识,能够实现对所述视频的观看。例如该视频是一个关于两会的新闻视频,发布请求用于将该新闻视频发布到新闻网站,媒体数据处理装置103该视频及该视频的标识发送到视频服务器104,响应于新闻网站访问用户对新闻网站的访问,视频服务器104将所述新闻视频的标识发送所述访问用户的客户端,并在新闻网站页面上展示。访问用户通过点击该视频的标识,可以观看该新闻视频。
本申请还提出一种媒体数据处理方法,该方法可用于客户端101。如图5所示,该方法包括以下步骤:
步骤501:响应于对输入控件的操作,获取网页链接,将所述网页链接发送至网站服务器,以使网站服务器根据该网页链接获取页面数据,并从所述网页数据中获取第一素材;所述第一素材包括第一文本和第一图片集合;根据所述第一文本确定所述第一素材的关键词和第一文字脚本;根据所述关键词查找对应的第二图片集合;根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接。
抓取网页上的网页数据,可以采用网络爬虫、蚂蚁、自动索引、模拟程序或者蠕虫获取网页上的网页数据。在获取网页中的第一素材时,获取网页源码,在获取的网页源码中提取网页上的文本内容及图片。从网页上抓取的第一素材包括第一文本和第一图片集合,该第一图片集合中包括1张或多张图片。
根据在上步骤中获得的第一素材中的第一文本提取所述第一素材的关键词及第一文字脚本,所述第一文字脚本包括标题及内容摘要等。其中,标题可以为网页的网页标题,该标题可以作为后续生成的视频的文本标题。提取的所述关键词可以用于后续的搜索更加丰富的素材,提取的内容摘要可以用来生成视频的语音及字幕。提取文本的关键词可以采用长短文本语义分析获得第一文本的关键词,同时根据提取出的多个关键词,确定内容摘要。在网页上抓取的图片一般比较少,为了生成丰富内容的视频,根据所述关键词查找对应的第二图片集合。例如,第一素材为在一篇两会的新闻上获得的素材,该第一素材的关键词包括:两会,则网站服务器中的媒体数据处理装置103查找有关两会的更多的图片,使得后续生成的视频内容更加丰富。
根据所述第一文字脚本生成视频的语音及字幕。根据第一图片集合及第二图片集合中的图片生成视频的图片帧序列。同时对于要展示的图片,每两张图片之间可以进行转场处理,根据预设的转场效果将要展示的图片中相邻的两张图片进行转场处理,形成转场图片帧序列。将上述生成的语音、字幕、图片帧序列、转场图片帧序列进行匹配,生成视频,同时生成该视频的链接。
步骤502:接收网站服务器发送的所述第一视频的链接,根据所述第一视频的链接播放所述第一视频。
接收网站服务器发送的第一视频的链接并进行展示。如图4所示,网站服务器生成第一视频后,在浏览器客户端展示如图4所示的弹窗,用户通过对弹窗中的控件41的操作,进行预览生成的视频。用户通过对控件43的操作,进行后续的视频发布,用户通过对控件42的操作,取消对所述视频的发布。
采用本申请提供的媒体数据处理方法,在网页上快速抓取第一素材,该第一素材包括第一文本及第一图片集合,根据该第一文本提取关键词及第一文字脚本,根据该关键词查找更丰富的图片,根据在网页上抓取的第一图片集合、查找到的第二图片集合及第一文字脚本,快速生成质量较高的短视频,降低了制作视频的成本,提升了短视频的制作效率。
在一些实例中,本申请提供的媒体数据处理方法,进一步包括以下步骤:
步骤S801:接收网站服务器发送的所述第一文字脚本、所述第一图片集合和所述第二图片集合。
在该实例中,网站服务器将在网页数据中获取的第一素材的第一文字脚本、第一图片集合,以及查找到的第二图片集合发送给客户端,供用户筛选及调整。客户端供用户筛选调整的页面图如图3所示,在该页面中展示第一图片集合中的图片及第二图片集合中的图片。第一文字脚本中包括标题及第一图片集合中每张图片的内容摘要,第一图片集合中的每张图片对应的内容摘要展示在对应图片后面的文本框305中。网站服务器查找到的第二图片集合中的图片没有对应的内容摘要,对应图片后方的文本框305中没有对应的文本内容,但后续用户可在第二图片集合中的图片后方的文本框305中编辑输入对应的内容摘要。第一文字脚本中的标题展示在文本框301中。网站服务器同时返回第一素材的关键词,展示在文本框302中。
步骤S802:响应于对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理,确定第二文字脚本和第三图片集合。
用户对第一文字脚本、第一图片集合、第二图片集合的处理包括:添加新的图片及对应内容摘要、删除第一图片集合中的图片及对应的内容摘要或删除第二图片集合中的图片、将第一图片的内容摘要进行修改、编辑第二图片的内容摘要、修改图片的展示顺序、选择相邻两图片的转场模板的标识。在图3所示的页面中,用户对添加条目控件308进行操作,可以添加新的图片及编辑该图片的内容摘要。用户对删除控件306进行操作,可以删除对应条目,该条目包括图片及图片对应的内容摘要。用户通过对图片控件303进行操作,可以更换图片。用户通过对文本框305进行操作,可以修改文本框305中的内容摘要或者编辑新的内容摘要。用户通过对顺序控件304进行操作,可以选择图片的展示顺序,其中,操作控件304中向上的箭头,对应的条目向上移动一个位置,如果该条目已经在最顶端,则该条目不移动。操作控件304中向下的箭头,对应的条目向下移动一个位置,如果该条目已经在最底端,则该条目不移动,当一条条目移动时,该条目中的图片的序号自动改变,该图片的序号即为视频中该图片的展示顺序。操作模板控件307,出现一个下拉列表框,在该下拉列表框中选择一个转场模板标识,该转场模板的标识对应控件307上方的图片与下方的图片之间的转场处理方式。用户处理后形成第三图片集合及第二文字脚本,第三图片集合中包括1张或多张图片,第二文字脚本包括第三图片中的每张图片的内容摘要。
步骤S803:将所述第二文字脚本和第三图片集合发送给网站服务器,以使网站服务器根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
网站服务器中的媒体数据处理装置103根据第三图片集合中的图片,第三图片集合中每张图片的序号生成图片帧序列;根据任两张相邻图片的转场模板标识确定转场模板,并根据该转场模板做转场处理,形成转场图片帧序列,进而将图片帧序列、转场图片帧序列与语音、字幕进行匹配,形成第一视频。
在一些实例中,本申请提供的媒体数据处理方法,进一步包括以下步骤:
步骤S901:响应于对添加控件的操作获取第二素材,将所述第二素材发送给网站服务器,其中,所述第二素材包括第二文字脚本和第三图片集合;以使网站服务器根据所述第二文字脚本及所述第三图片集合生成第二视频,并生成所述第二视频的链接。
在上述实例中,通过抓取网页上的媒体内容获得第一素材,在本实例中,可以根据用户上传的图片及输入图片的内容摘要来获得素材,即获得第二素材,获得的素材中包括第二文字脚本及第三图片集合。第三图片集合中包括1张或多张图片,第二文字脚本中包括第三图片集合中每张图片的内容摘要。用户可以在图3所示的页面中上传图片及输入每张图片的内容摘要。用户通过对控件308进行操作,形成如条目309一样的条目,用户通过对条目中的图片控件303的操作,可以上传想要的图片。同时用户在文本框305中输入与图片对应的内容摘要。用户可以添加1条或多条条目,当添加多条条目时,用户通过对控件304的操作确定条目中的图片在视频中的展示顺序。同时用户通过对控件307的操作确定控件307上下两个条目中的图片的转场模式。用户同时可以在文本框301中输入待生成视频的标题,在文本框302中输入关键词。
步骤S902:接收网站服务器发送的所述第二视频的链接,根据所述第二视频的链接播放所述第二视频。
网站服务器中的媒体数据处理装置103根据第二图片集合中的图片,用户预设的图片的展示顺序,生成图片帧序列;根据任相邻两张图片的转场模板标识确定转场模板,并根据该转场模板做转场处理,形成转场图片帧序列,进而将图片帧序列、转场图片帧序列与语音、字幕进行匹配,生成第二视频。同时生成该第二视频的链接,将该链接发送到浏览器客户端进行展示,如图4所示,网站服务器生成第一视频后,在浏览器客户端展示如图4所示的弹窗,用户通过对弹窗中的控件41的操作,可以预览生成的视频。
在一些实例中,本申请提供的媒体数据处理方法,进一步包括以下步骤:
将所述预定展示顺序中任意相邻的两个图片的转场模板的标识发送给网站服务器,以使网站服务器根据所述转场模板的标识确定转场模板;利用所述转场模板对所述两个图片进行转场处理,生成所述两个图片的转场图片帧序列。
在图3所示的页面中,客户端响应于用户对控件307的操作,确定控件307上下两张图片的转场模板的标识。网站服务器中的媒体数据处理装置103中保存了转场模板标识与转场模板之间的对应关系,根据上述转场模板的标识确定所述两张图片的转场模板。根据确定的转场模板将所述两张图片进行转场处理。例如,对于步骤S702中得到的图片帧序列A3、A4、A2、A1,图片A3、A4采用转场模板C1生成转场图片M1;相对应的图片A4、A2采用转场模板C2生成转场图片M2,图片A2、A1采用转场模板C3生成转场图片M3,则最后生成视频的播放图片帧序列为:A3、M1、A4、M2、A2、M3、A1。
在一些实例中,本申请提供的媒体数据处理方法,进一步包括:
响应于对发布视频控件的操作,向网站服务器发送视频发布请求,以使网站服务器生成所述第一视频的标识,将生成的所述第一视频及所述第一视频的标识发送给视频服务器。
网站服务器中的媒体数据处理装置103生成视频,同时生成该视频的链接,将该链接发送给客户端,展示如图4所示的跳窗页面,用户通过对控件41的操作,对该视频进行预览。客户端响应于用户对控件43的操作,向服务器发送视频发布请求,媒体数据处理装置103生成所述视频的标识,并将生成的所述视频及所述视频的标识发送到视频服务器104,所述视频的标识包括所述视频的封面图片及链接。所述发布请求中包括视频发布的网站及在该网站页面上的展示位置,视频服务器104记录所述生成视频的发布的网站及展示位置。视频服务器104响应于所述网站的访问用户对所述网站的访问,将所述生成视频的标识发送到所述访问用户的客户端,并在网站页面上的所述展示位置处展示。访问用户通过点击所述生成视频的标识,能够实现对所述视频的观看。例如该视频是一个关于两会的新闻视频,发布请求用于将该新闻视频发布到新闻网站,媒体数据处理装置103该视频及该视频的标识发送到视频服务器104,响应于新闻网站访问用户对新闻网站的访问,视频服务器104将所述新闻视频的标识发送所述访问用户的客户端,并在新闻网站页面上展示。访问用户通过点击该视频的标识,可以观看该新闻视频。
本申请提供的媒体数据处理方法,客户端采用浏览器客户端,浏览器客户端与网站服务器及视频服务器之间的交互图如图6所示,对于从网页上抓取第一素材生成视频,主要包括以下步骤:
步骤601:接收用户输入的网页链接。用户在浏览器客户端的一页面中输入要提取素材的页面的网页链接。
步骤602:浏览器客户端将上述网页链接发送给网站服务器。
步骤603:网站服务器根据该网页链接获取网页链接对应的网页的网页数据,并在该网页数据中提取第一素材,该第一素材包括第一文本及第一图片集合。
步骤604:根据第一素材的文本,通过长短文本语义分析,获得关键词及第一文字脚本,第一文字脚本包括标题及内容摘要。
步骤605:根据上步骤提取的关键词,查找与该关键词对应的第二图片集合,第二图片集合中包括一张或多张图片。
步骤606:将上述第一文字脚本、第一图片集合中的图片、第二图片集合中的图片发送给浏览器客户端。
步骤607:用户通过浏览器客户端对第一图片集合中的图片、第二图片集合中的图片、第一文字脚本进行处理。主要包括:对第一图片集合中的图片、第二图片集合中的图片的选择、删除;对第一文字脚本中的内容摘要的删除或编辑调整;添加新的图片及对应的内容摘要;对第二图片集合中的图片编辑内容摘要;调整图片的展示顺序;选择相邻两图片之间的转场模板标识等。
步骤608:将处理后得到的第三图片集合、第二文字脚本相邻两图片的转场模板标识发送给网站服务器。
步骤609:网站服务器将第二文字脚本生成视频的语音和字幕,根据图片序号生成图片帧序列;根据任相邻的两张图片的转场模板标识对应的转场模板生成该两张图片的转场图片帧序列。
步骤610:网站服务器将图片帧序列、转场图片帧序列、视频的语音、字幕匹配,生成视频,并生成该视频的链接。
步骤611:网站服务器将生成的视频的链接发送给浏览器客户端。
步骤612:浏览器客户端通过上述链接预览生成的视频。
步骤613:浏览器客户端接收用户对发布控件的操作。
步骤614:浏览器客户端向网站服务器发送视频发布请求,该视频发布请求中包括所述视频发布的网站及该视频的标识在网站页面上的展示位置。
步骤615:网站服务器中的媒体数据处理装置103生成所述视频的标识。
步骤616:媒体数据处理装置103将生成的视频及所述低频的标识发送视频服务器,视频服务器记录该视频的发布网站及视频的标识在网站页面上的展示位置,当所述网站的访问用户对所述网站访问时,视频服务器将所述视频的标识发送给所述访问用户的浏览器客户端,并在网页页面上的所述位置处展示。
对于用户输入素材生成视频,没有图6中的步骤601-606,包括图6中的步骤607-616,其中步骤607为:用户通过浏览器客户端上传图片,编辑每张图片的内容摘要,调整每张图片的展示顺序,同时选择展示顺序中任相邻的两张图片的转场模板的标识。
本申请还提供一种媒体数据处理装置700,该装置可用于媒体数据处理装置103,如图7所示,包括:
第一接收单元701,用于接收客户端发送的网页链接;
第一素材获取单元702,用于根据该网页链接获取网页数据,并从所述网页数据中获取第一素材;其中,所述第一素材包括第一文本和第一图片集合;
确定单元703,用于根据所述第一文本确定所述第一素材的关键词和第一文字脚本;
查找单元704,用于根据所述关键词查找对应的第二图片集合;
第一视频生成单元705,用于根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;
第一链接发送单元706,用于将所述第一视频的链接发送至所述客户端,以使所述客户端根据所述第一视频的链接播放所述第一视频。
采用本申请提供的媒体数据处理装置,获取网页上快速抓取第一素材,该第一素材包括第一文本及第一图片集合,根据该第一文本提取关键词及第一文字脚本,根据该关键词查找更丰富的图片,根据在网页上抓取的第一图片集合、查找到的第二图片集合及第一文字脚本,快速生成质量较高的短视频,降低了制作视频的成本,提升了短视频的制作效率。
在一些实例中,其中,所述第一视频生成单元705,用于:
将所述第一文字脚本、所述第一图片集合和所述第二图片集合发送给所述客户端;
接收所述客户端发送的第二文字脚本和第三图片集合;其中,所述第二文字脚本和所述第三图片集合由所述客户端响应于用户对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理而确定;
根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
在一些实例中,所述装置进一步包括:
第二接收单元707,用于接收所述客户端上传的第二素材;其中,所述第二素材包括第二文字脚本和第三图片集合;
第二视频生成单元708,用于根据所述第二文字脚本及所述第二图片集合生成第二视频,并生成所述第二视频的链接;
第二链接发送单元709,用于将所述第二视频的链接发送至所述客户端,以使所述客户端根据所述第二视频的链接播放所述第二视频。
在一些实例中,所述装置进一步包括:
发布单元710,用于接收客户端响应于用户对发布视频控件的操作发送的视频发布请求,生成所述第一视频的标识,将所述第一视频及所述第一视频的标识发送到视频服务器。
本申请还提供一种媒体数据处理装置800,应用于客户端101,如图8所示,包括:
第一发送单元801,用于响应于对输入控件的操作,获取网页链接,将所述网页链接发送至网站服务器,以使网站服务器根据该网页链接获取页面数据,并从所述网页数据中获取第一素材;所述第一素材包括第一文本和第一图片集合;根据所述第一文本确定所述第一素材的关键词和第一文字脚本;根据所述关键词查找对应的第二图片集合;根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;
第一链接接收单元802,用于接收网站服务器发送的所述第一视频的链接,根据所述第一视频的链接播放所述第一视频。
采用本申请提供的媒体数据处理装置,获取网页上快速抓取第一素材,该第一素材包括第一文本及第一图片集合,根据该第一文本提取关键词及第一文字脚本,根据该关键词查找更丰富的图片,根据在网页上抓取的第一图片集合、查找到的第二图片集合及第一文字脚本,快速生成质量较高的短视频,降低了制作视频的成本,提升了短视频的制作效率。
在一些实例中,所述装置进一步包括:
接收单元803,用于接收网站服务器发送的所述第一文字脚本、所述第一图片集合和所述第二图片集合;
处理单元804,用于响应于对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理,确定第二文字脚本和第三图片集合;
第二发送单元805,用于将所述第二文字脚本和第三图片集合发送给网站服务器,以使网站服务器根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
本申请还提供了一种计算机可读存储介质,存储有计算机可读指令,可以使至少一个处理器执行上述所述的媒体数据处理方法。
图9示出了媒体数据处理装置700及媒体数据处理装置800所在的计算设备的组成结构图。如图9所示,该计算设备包括一个或者多个处理器(CPU)902、通信模块904、存储器906、用户接口910,以及用于互联这些组件的通信总线908。
处理器902可通过通信模块904接收和发送数据以实现网络通信和/或本地通信。
用户接口910包括一个或多个输出设备912,其包括一个或多个扬声器和/或一个或多个可视化显示器。用户接口910也包括一个或多个输入设备914,其包括诸如,键盘,鼠标,声音命令输入单元或扩音器,触屏显示器,触敏输入板,姿势捕获摄像机或其他输入按钮或控件等。
存储器906可以是高速随机存取存储器,诸如DRAM、SRAM、DDR RAM、或其他随机存取固态存储设备;或者非易失性存储器,诸如一个或多个磁盘存储设备、光盘存储设备、闪存设备,或其他非易失性固态存储设备。
存储器906存储处理器902可执行的指令集,包括:
操作系统916,包括用于处理各种基本系统服务和用于执行硬件相关任务的程序;
应用918,包括用于媒体数据处理的各种应用程序,这种应用程序能够实现上述各实例中的处理流程,比如可以包括媒体数据处理装置700或媒体数据处理装置800中的部分或全部单元或者模块。媒体数据处理装置700或媒体数据处理装置800中的各单元中的至少一个单元可以存储有机器可执行指令。处理器902通过执行存储器906中各单元中至少一个单元中的机器可执行指令,进而能够实现上述各单元或模块中的至少一个模块的功能。
需要说明的是,上述各流程和各结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。各模块的划分仅仅是为了便于描述采用的功能上的划分,实际实现时,一个模块可以分由多个模块实现,多个模块的功能也可以由同一个模块实现,这些模块可以位于同一个设备中,也可以位于不同的设备中。
各实施例中的硬件模块可以以硬件方式或硬件平台加软件的方式实现。上述软件包括机器可读指令,存储在非易失性存储介质中。因此,各实施例也可以体现为软件产品。
各例中,硬件可以由专门的硬件或执行机器可读指令的硬件实现。例如,硬件可以为专门设计的永久性电路或逻辑器件(如专用处理器,如FPGA或ASIC)用于完成特定的操作。硬件也可以包括由软件临时配置的可编程逻辑器件或电路(如包括通用处理器或其它可编程处理器)用于执行特定操作。
另外,本申请的每个实例可以通过由数据处理设备如计算机执行的数据处理程序来实现。显然,数据处理程序构成了本申请。此外,通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和或内存)中执行。因此,这样的存储介质也构成了本申请,本申请还提供了一种非易失性存储介质,其中存储有数据处理程序,这种数据处理程序可用于执行本申请上述方法实例中的任何一种实例。
图9模块对应的机器可读指令可以使计算机上操作的操作系统等来完成这里描述的部分或者全部操作。非易失性计算机可读存储介质可以是插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器。安装在扩展板或者扩展单元上的CPU等可以根据指令执行部分和全部实际操作。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (15)

1.一种媒体数据处理方法,其特征在于,包括:
接收客户端发送的网页链接;
根据该网页链接获取网页数据,并从所述网页数据中获取第一素材;其中,所述第一素材包括第一文本和第一图片集合;
根据所述第一文本确定所述第一素材的关键词和第一文字脚本;
根据所述关键词查找对应的第二图片集合;
根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;
将所述第一视频的链接发送至所述客户端,以使所述客户端根据所述第一视频的链接播放所述第一视频。
2.根据权利要求1所述的方法,其中,所述生成第一视频,包括:
将所述第一文字脚本、所述第一图片集合和所述第二图片集合发送给所述客户端;
接收所述客户端发送的第二文字脚本和第三图片集合;其中,所述第二文字脚本和所述第三图片集合由所述客户端响应于对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理而确定;
根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
3.根据权利要求1所述的方法,进一步包括:
接收所述客户端上传的第二素材;其中,所述第二素材包括第二文字脚本和第三图片集合;
根据所述第二文字脚本及所述第二图片集合生成第二视频,并生成所述第二视频的链接;
将所述第二视频的链接发送至所述客户端,以使所述客户端根据所述第二视频的链接播放所述第二视频。
4.根据权利要求1所述的方法,其中,所述生成第一视频包括:
根据所述第一文字脚本生成语音、字幕;
根据所述第一图片集合和所述第二图片集合生成图片帧序列
确定所述第一图片集合和所述第二图片集合的转场模板;
根据所述第一图片集合、第二图片集合及所述转场模板,生成转场图片帧序列;
根据所述图片帧序列、转场图片帧序列及所述语音、字幕,生成所述第一视频。
5.根据权利要求1所述的方法,进一步包括:
接收客户端响应于对发布视频控件的操作发送的视频发布请求,生成所述第一视频的标识,将所述第一视频及所述第一视频的标识发送到视频服务器。
6.一种媒体数据处理方法,其特征在于,包括:
响应于对输入控件的操作,获取网页链接,将所述网页链接发送至网站服务器,以使网站服务器根据该网页链接获取页面数据,并从所述网页数据中获取第一素材;所述第一素材包括第一文本和第一图片集合;根据所述第一文本确定所述第一素材的关键词和第一文字脚本;根据所述关键词查找对应的第二图片集合;根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;
接收网站服务器发送的所述第一视频的链接,根据所述第一视频的链接播放所述第一视频。
7.根据权利要求6所述的方法,进一步包括:
接收网站服务器发送的所述第一文字脚本、所述第一图片集合和所述第二图片集合;
响应于对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理,确定第二文字脚本和第三图片集合;
将所述第二文字脚本和第三图片集合发送给网站服务器,以使网站服务器根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
8.根据权利要求6所述的方法,进一步包括:
响应于对添加控件的操作获取第二素材,将所述第二素材发送给网站服务器,其中,所述第二素材包括第二文字脚本和第三图片集合;以使网站服务器根据所述第二文字脚本及所述第三图片集合生成第二视频,并生成所述第二视频的链接;
接收网站服务器发送的所述第二视频的链接,根据所述第二视频的链接播放所述第二视频。
9.根据权利要求6所述的方法,进一步包括:
响应于对发布视频控件的操作,向网站服务器发送视频发布请求,以使网站服务器生成所述第一视频的标识,将生成的所述第一视频及所述第一视频的标识发送给视频服务器。
10.一种媒体数据处理装置,其特征在于,包括:
第一接收单元,用于接收客户端发送的网页链接;
第一素材获取单元,用于根据该网页链接获取网页数据,并从所述网页数据中获取第一素材;其中,所述第一素材包括第一文本和第一图片集合;
关键词及文字脚本确定单元,用于根据所述第一文本确定所述第一素材的关键词和第一文字脚本;
查找单元,用于根据所述关键词查找对应的第二图片集合;
第一视频生成单元,用于根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;
第一链接发送单元,用于将所述第一视频的链接发送至所述客户端,以使所述客户端根据所述第一视频的链接播放所述第一视频。
11.根据权利要求10所述的装置,其中,所述第一视频生成单元,用于:
将所述第一文字脚本、所述第一图片集合和所述第二图片集合发送给所述客户端;
接收所述客户端发送的第二文字脚本和第三图片集合;其中,所述第二文字脚本和所述第三图片集合由所述客户端响应于对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理而确定;
根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
12.根据权利要求10所述的装置,进一步包括:
发布单元,用于接收客户端响应于对发布视频控件的操作发送的视频发布请求,生成所述第一视频的标识,将所述第一视频及所述第一视频的标识发送到视频服务器。
13.一种媒体数据处理装置,其特征在于,包括:
第一发送单元,用于响应于对输入控件的操作,获取网页链接,将所述网页链接发送至网站服务器,以使网站服务器根据该网页链接获取页面数据,并从所述网页数据中获取第一素材;所述第一素材包括第一文本和第一图片集合;根据所述第一文本确定所述第一素材的关键词和第一文字脚本;根据所述关键词查找对应的第二图片集合;根据所述第一文字脚本、所述第一图片集合及所述第二图片集合生成第一视频,并生成所述第一视频的链接;
第一链接接收单元,用于接收网站服务器发送的所述第一视频的链接,根据所述第一视频的链接播放所述第一视频。
14.根据权利要求13所述的装置,进一步包括:
接收单元,用于接收网站服务器发送的所述第一文字脚本、所述第一图片集合和所述第二图片集合;
处理单元,用于响应于对所述第一文字脚本、所述第一图片集合和/或所述第二图片集合的编辑处理,确定第二文字脚本和第三图片集合;
第二发送单元,用于将所述第二文字脚本和第三图片集合发送给网站服务器,以使网站服务器根据所述第二文字脚本及所述第三图片集合生成所述第一视频。
15.一种计算机可读存储介质,存储有计算机可读指令,可以使至少一个处理器执行如权利要求1-13任一项所述的方法。
CN201710363825.3A 2017-05-22 2017-05-22 媒体数据处理方法、装置及存储介质 Active CN108965737B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201710363825.3A CN108965737B (zh) 2017-05-22 2017-05-22 媒体数据处理方法、装置及存储介质
PCT/CN2018/086672 WO2018214772A1 (zh) 2017-05-22 2018-05-14 媒体数据处理方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710363825.3A CN108965737B (zh) 2017-05-22 2017-05-22 媒体数据处理方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN108965737A true CN108965737A (zh) 2018-12-07
CN108965737B CN108965737B (zh) 2022-03-29

Family

ID=64396211

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710363825.3A Active CN108965737B (zh) 2017-05-22 2017-05-22 媒体数据处理方法、装置及存储介质

Country Status (2)

Country Link
CN (1) CN108965737B (zh)
WO (1) WO2018214772A1 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798879A (zh) * 2019-04-08 2020-10-20 百度(美国)有限责任公司 用于生成视频的方法和装置
CN111935526A (zh) * 2019-05-13 2020-11-13 百度在线网络技术(北京)有限公司 视频的显示方法、系统及其存储介质
CN112040142A (zh) * 2020-07-08 2020-12-04 智者四海(北京)技术有限公司 用于移动终端上的视频创作的方法
CN112153418A (zh) * 2019-06-26 2020-12-29 阿里巴巴集团控股有限公司 流媒体生成方法、装置、终端及服务器
CN112291614A (zh) * 2019-07-25 2021-01-29 北京搜狗科技发展有限公司 一种视频生成方法及装置
CN112307366A (zh) * 2020-10-30 2021-02-02 北京字节跳动网络技术有限公司 一种信息展示的方法、装置及计算机存储介质
WO2021042234A1 (zh) * 2019-09-02 2021-03-11 深圳海付移通科技有限公司 应用程序的介绍方法、移动终端及服务器
CN112565268A (zh) * 2020-12-07 2021-03-26 深圳圣大奥维科技发展有限公司 多媒体信息的传输控制方法、装置设备及计算机存储介质
CN112579826A (zh) * 2020-12-07 2021-03-30 北京字节跳动网络技术有限公司 视频显示及处理方法、装置、系统、设备、介质
CN113423010A (zh) * 2021-06-22 2021-09-21 深圳市大头兄弟科技有限公司 基于文档的视频转换方法、装置、设备及存储介质
WO2021196281A1 (zh) * 2020-03-30 2021-10-07 北京金堤科技有限公司 多媒体文件生成方法和装置、存储介质、电子设备
CN113905254A (zh) * 2021-09-03 2022-01-07 前海人寿保险股份有限公司 视频合成方法、装置、系统与可读存储介质
WO2023025323A1 (zh) * 2021-08-27 2023-03-02 北京字跳网络技术有限公司 一种信息处理方法、装置、系统及存储介质
WO2023202361A1 (zh) * 2022-04-22 2023-10-26 北京有竹居网络技术有限公司 视频生成方法、装置、介质及电子设备

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110297980A (zh) * 2019-06-28 2019-10-01 广州华多网络科技有限公司 素材的展示方法、装置、服务器
CN111831945A (zh) * 2020-07-13 2020-10-27 泰康保险集团股份有限公司 图片获取方法及装置
CN112632326B (zh) * 2020-12-24 2022-02-18 北京风平科技有限公司 一种基于视频脚本语义识别的视频生产方法及装置
CN113627994B (zh) * 2021-08-27 2024-09-06 京东方科技集团股份有限公司 信息发布的素材处理方法、装置、电子设备及存储介质
CN114286169B (zh) * 2021-08-31 2023-06-20 腾讯科技(深圳)有限公司 视频生成方法、装置、终端、服务器及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120177345A1 (en) * 2011-01-09 2012-07-12 Matthew Joe Trainer Automated Video Creation Techniques
CN104731960A (zh) * 2015-04-03 2015-06-24 北京威扬科技有限公司 基于电子商务网页内容生成视频摘要的方法、装置及系统
CN104731959A (zh) * 2015-04-03 2015-06-24 北京威扬科技有限公司 基于文本的网页内容生成视频摘要的方法、装置及系统
CN105516618A (zh) * 2014-09-27 2016-04-20 北京金山安全软件有限公司 一种制作视频的方法、装置及通信终端
WO2017032336A1 (en) * 2015-08-26 2017-03-02 Holumino Limited System and method for capturing and displaying images
US20170116581A1 (en) * 2015-10-26 2017-04-27 Ajit S. Shah Systems and methods for implementing structured asynchronous and synchronous group interaction with automatic assistance over user selected media

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106028056A (zh) * 2016-06-27 2016-10-12 北京金山安全软件有限公司 视频制作方法、装置及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120177345A1 (en) * 2011-01-09 2012-07-12 Matthew Joe Trainer Automated Video Creation Techniques
CN105516618A (zh) * 2014-09-27 2016-04-20 北京金山安全软件有限公司 一种制作视频的方法、装置及通信终端
CN104731960A (zh) * 2015-04-03 2015-06-24 北京威扬科技有限公司 基于电子商务网页内容生成视频摘要的方法、装置及系统
CN104731959A (zh) * 2015-04-03 2015-06-24 北京威扬科技有限公司 基于文本的网页内容生成视频摘要的方法、装置及系统
WO2017032336A1 (en) * 2015-08-26 2017-03-02 Holumino Limited System and method for capturing and displaying images
US20170116581A1 (en) * 2015-10-26 2017-04-27 Ajit S. Shah Systems and methods for implementing structured asynchronous and synchronous group interaction with automatic assistance over user selected media

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111798879A (zh) * 2019-04-08 2020-10-20 百度(美国)有限责任公司 用于生成视频的方法和装置
CN111798879B (zh) * 2019-04-08 2022-05-03 百度(美国)有限责任公司 用于生成视频的方法和装置
CN111935526A (zh) * 2019-05-13 2020-11-13 百度在线网络技术(北京)有限公司 视频的显示方法、系统及其存储介质
CN112153418A (zh) * 2019-06-26 2020-12-29 阿里巴巴集团控股有限公司 流媒体生成方法、装置、终端及服务器
CN112291614A (zh) * 2019-07-25 2021-01-29 北京搜狗科技发展有限公司 一种视频生成方法及装置
WO2021042234A1 (zh) * 2019-09-02 2021-03-11 深圳海付移通科技有限公司 应用程序的介绍方法、移动终端及服务器
WO2021196281A1 (zh) * 2020-03-30 2021-10-07 北京金堤科技有限公司 多媒体文件生成方法和装置、存储介质、电子设备
CN112040142A (zh) * 2020-07-08 2020-12-04 智者四海(北京)技术有限公司 用于移动终端上的视频创作的方法
CN112040142B (zh) * 2020-07-08 2023-05-02 智者四海(北京)技术有限公司 用于移动终端上的视频创作的方法
CN112307366B (zh) * 2020-10-30 2023-09-19 抖音视界有限公司 一种信息展示的方法、装置及计算机存储介质
CN112307366A (zh) * 2020-10-30 2021-02-02 北京字节跳动网络技术有限公司 一种信息展示的方法、装置及计算机存储介质
CN112579826A (zh) * 2020-12-07 2021-03-30 北京字节跳动网络技术有限公司 视频显示及处理方法、装置、系统、设备、介质
CN112565268A (zh) * 2020-12-07 2021-03-26 深圳圣大奥维科技发展有限公司 多媒体信息的传输控制方法、装置设备及计算机存储介质
CN113423010A (zh) * 2021-06-22 2021-09-21 深圳市大头兄弟科技有限公司 基于文档的视频转换方法、装置、设备及存储介质
WO2023025323A1 (zh) * 2021-08-27 2023-03-02 北京字跳网络技术有限公司 一种信息处理方法、装置、系统及存储介质
CN113905254A (zh) * 2021-09-03 2022-01-07 前海人寿保险股份有限公司 视频合成方法、装置、系统与可读存储介质
CN113905254B (zh) * 2021-09-03 2024-03-29 前海人寿保险股份有限公司 视频合成方法、装置、系统与可读存储介质
WO2023202361A1 (zh) * 2022-04-22 2023-10-26 北京有竹居网络技术有限公司 视频生成方法、装置、介质及电子设备

Also Published As

Publication number Publication date
WO2018214772A1 (zh) 2018-11-29
CN108965737B (zh) 2022-03-29

Similar Documents

Publication Publication Date Title
CN108965737A (zh) 媒体数据处理方法、装置及存储介质
US10123068B1 (en) System, method, and program product for generating graphical video clip representations associated with video clips correlated to electronic audio files
US7739597B2 (en) Interactive media frame display
EP1762947B1 (en) Apparatus, method, and computer program for television program selection
KR101967036B1 (ko) 비디오 콘텐츠를 검색하는 방법들, 시스템들, 및 매체들
WO2019091416A1 (zh) 一种媒体内容搜索方法、装置及存储介质
EP1750210A1 (en) Apparatus, method and program for multimedia program selection
US20090043739A1 (en) Method of displaying customized data and browser agent
CN101398843B (zh) 用于浏览视频概要描述数据的设备及方法
US7895180B2 (en) Content filtering method, apparatus thereby, and recording medium having filtering program recorded thereon
KR20060052116A (ko) 콘텐츠 매니지먼트 시스템 및 콘텐츠 매니지먼트 방법과,컴퓨터 프로그램
CN103988519A (zh) 为媒体浏览器创建封面艺术
CN105025378A (zh) 字幕添加系统和方法
US20090083642A1 (en) Method for providing graphic user interface (gui) to display other contents related to content being currently generated, and a multimedia apparatus applying the same
JP2002108892A (ja) データ管理システム、データ管理方法、及び、記録媒体
CN106792222A (zh) 一种交互式视频点播方法及其系统
KR20090099439A (ko) 멀티미디어 콘텐츠 정보에 포함된 메타 정보 기반 키워드광고 서비스 방법 및 그 서비스를 위한 시스템
JP2004112379A (ja) 画像検索システム
US20120331385A1 (en) Asynchronistic platform for real time collaboration and connection
US20180367838A1 (en) Systems for and methods of browsing and viewing huge and heterogeneous media collections on tv with unified interface
JP2006139382A (ja) 情報処理装置及びその制御方法、プログラム
KR100844949B1 (ko) 동영상 검색 시스템
JP4096670B2 (ja) 画像再生システム
CN113542820B (zh) 一种视频编目方法、系统、电子设备及存储介质
JP2006085379A (ja) 情報処理装置及びその制御方法、プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant