CN113423010A - 基于文档的视频转换方法、装置、设备及存储介质 - Google Patents
基于文档的视频转换方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113423010A CN113423010A CN202110693222.6A CN202110693222A CN113423010A CN 113423010 A CN113423010 A CN 113423010A CN 202110693222 A CN202110693222 A CN 202110693222A CN 113423010 A CN113423010 A CN 113423010A
- Authority
- CN
- China
- Prior art keywords
- document
- picture
- ordered
- generate
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 75
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 39
- 230000011218 segmentation Effects 0.000 claims abstract description 28
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 13
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 4
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000000049 pigment Substances 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
- H04N21/440236—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4884—Data services, e.g. news ticker for displaying subtitles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/278—Subtitling
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Television Systems (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
本发明涉及视频生成领域,公开了一种基于文档的视频转换方法、装置、设备及存储介质。该方法包括:接收文档的转换指令;判断所述文档中是否存在图片数据;若不存在图片数据,则将文档数据错误的信息发送至预置显示端口;若存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,其中,N为正整数;提取所述文档中所有的图片数据,生成图片集,以及根据预置组合算法,将所述图片集和所述N段有序字幕进行组合转换处理,生成视频数据。
Description
技术领域
本发明涉及视频生成领域,尤其涉及一种基于文档的视频转换方法、装置、设备及存储介质。
背景技术
互联网技术的发展,大量的视频处理技术不断涌现,文字转换为视频文件的技术应运而生。人们在处理文件时,增加了选择,使得视频的制作过程更加简易和方便。
但是,在生成视频的过程中,文档转换视频过程中,并不能深度编辑视频效果,用户没有办法在文档中插入图片以提高视频生成的效率。导致用户在使用文档转换技术的过程中,视频生成具有一定局限性,导致在后期视频处理还需要人工手动加入图片背景以配合该文字生成的视频文件。因此,需要一种能在视频生成过程中能同时可以基于图片和文字进行转换的技术方法。
发明内容
本发明的主要目的在于解决现有技术不能对同时含有图片和字符的文档转换为视频的技术问题。
本发明第一方面提供了一种基于文档的视频转换方法,包括步骤:
接收文档的转换指令;
判断所述文档中是否存在图片数据;
若不存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,并对N段所述有序字幕进行转换处理,生成视频数据,其中,N为正整数;
若存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕;
提取所述文档中所有的图片数据,生成图片集,以及根据预置组合算法,将所述图片集和所述N段有序字幕进行组合转换处理,生成视频数据。
可选的,在本发明第一方面的第一种实现方式中,所述根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕包括:
根据所述文字字符段的标点符号,对所述文字字符段进行拆分,得到M个有序字段,其中,M为正整数;
读取预置文本框的字体大小设置和行间距设置,计算出所述文本框的容纳行数为X行,其中,X为正整数;
基于所述有序字段,对所述文本框的前X-1行填充处理,生成新的文本框,以及根据所述文本框第X-1行的最后字符,对所述有序字段进行切分,将所述有序字段中未填充被切分的字段确定为分析字段;
读取所述分析字段的总字数,根据所述总字数与所述字体大小设置,计算出所述总字数对应的总长度;
判断所述总长度是否小于所述文本框的宽度;
若小于所述文本框的宽度,则将所述分析字段填入所述文本框的第X行,得到有序字幕;
若大于所述文本框的宽度,则根据预置逼近拆分算法,将所述分析字段进行拆分填入至所述文本框的第X行,得到有序字幕。
可选的,在本发明第一方面的第二种实现方式中,所述根据预置逼近拆分算法,将所述分析字段进行拆分填入至所述文本框的第X行,得到有序字幕包括:
读取所述分析字段的前i行总字数,根据所述前i行总字数与所述字体大小设置,计算出所述前i行总字数对应的前i行总长度,其中,i为正整数;
判断所述前i行总长度是否小于所述文本框的宽度;
若小于,则对i的数值增加1,重新读取所述分析字段的前i段总字数;
若不小于,则在所述分析字段中前i-1段进行拆分,得到前i-1段分析字段和非前i-1段分析字段;
将所述前i-1段分析字段填入所述文本框的第X行,得到有序字幕;
将所述非前i-1段分析字段确定为新的有序字段,进行新的文本框填充。
可选的,在本发明第一方面的第三种实现方式中,所述根据预置组合算法,将所述图片集和所述N段有序字幕进行组合转换处理,生成视频数据包括:
根据预置图片展示单位时长,计算出所述图片集中图片的图片展示总时长,并根据预置字幕展示单位时长,计算出所述图片集中图片的字幕展示总时长;
判断所述图片展示时长是否大于所述字幕展示总时长;
若图片展示时长小于字幕展示总时长,则将所述字幕展示总时长除以所述图片集中图片的图片总数,得到图片平均时长,以及将所述图片平均时长设置为图片展示单位时长;
根据所述图片展示单位时长和所述字幕展示单位时长,对所述图片集和所述N段有序字幕进行组合处理,生成视频数据。
可选的,在本发明第一方面的第四种实现方式中,所述根据所述图片展示单位时长和所述字幕展示单位时长,对所述图片集和所述N段有序字幕进行组合处理,生成视频数据包括:
将所述图片集中每个图片的播放时长设置为所述图片展示单位时长,将所述N段有序字幕中每个字幕的播放时长设置为所述字幕展示单位时长;
将所述图片集中图片填充至预置图片显示框架中,生成第一层级播放视频;
将所述N段有序字幕中字幕输入至预置字幕显示框架中,生产第二层级播放视频;
对所述第一层级播放视频和所述第二层级播放视频并行组合处理,得到视频数据。
可选的,在本发明第一方面的第五种实现方式中,所述判断所述文档中是否存在图片数据包括:
扫描所述文档中的数据,分析所述数据的字符串中是否存在图片格式后缀。
可选的,在本发明第一方面的第六种实现方式中,所述在所述提取所述文档中所有的字符数据,生成文字字符段包括:
剔除所述文档中所有的图片数据,生成去图文档;
提取所述去图文档中的所有字符数据,按照排序生成文字字符段。
本发明第二方面提供了一种基于文档的视频转换装置,所述基于文档的视频转换装置包括:
接收模块,用于接收文档的转换指令;
判断模块,用于判断所述文档中是否存在图片数据;
提取转换模块,用于若不存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,并对N段所述有序字幕进行转换处理,生成视频数据,其中,N为正整数;
切分模块,用于若存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,其中,N为正整数;
生成模块,用于提取所述文档中所有的图片数据,生成图片集,以及根据预置组合算法,将所述图片集和所述N段有序字幕进行组合转换处理,生成视频数据。
本发明第三方面提供了一种基于文档的视频转换设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于文档的视频转换设备执行上述的基于文档的视频转换方法。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于文档的视频转换方法。
在本发明实施例中,基于文档内容的判断,在文档具备图片信息时,将图片和文字数据分别提取数据转换为视频数据,解决了现有技术中无法在文档具有图片和文字时转换为视频的技术问题,提高了现有视频转换技术的适用范围。
附图说明
图1为本发明实施例中基于文档的视频转换方法的一个实施例示意图;
图2为本发明实施例中基于文档的视频转换方法的第一个视频生成示意图;
图3为本发明实施例中基于文档的视频转换方法的第二个视频生成示意图;
图4为本发明实施例中基于文档的视频转换方法的第三个视频生成示意图;
图5为本发明实施例中基于文档的视频转换装置的一个实施例示意图;
图6为本发明实施例中基于文档的视频转换装置的另一个实施例示意图;
图7为本发明实施例中基于文档的视频转换设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种基于文档的视频转换方法、装置、设备及存储介质。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中基于文档的视频转换方法的一个实施例包括:
101、接收文档的转换指令;
在本实施例中,在将文档数据传输至中转内存后,接收转换指令则触发转换过程,转换指令可以通过有线传输,也可以通过无线网络进行传输,还可以定时设置,进行文档转换。
102、判断文档中是否存在图片数据;
在本实施例中,文档中是否存在图片可以先读取文档的种类,若是为word格式则会读取文档中是存在图片,基于函数ActiveDocument.Shapes.Count,判断shape的统计值大于0,则说明文档中是存在图片。
优选的,在102步骤,可以执行以下操作:
1021、扫描文档中的数据,分析数据的字符串中是否存在图片格式后缀。
在1021步骤中,读取文档中的数据内容,对判断是否具有BMP、JPG、JPEG、PNG、GIF的图片格式后缀,如果存在后缀格式匹配,则认为文档中存在图片。如果图片后缀格式不匹配,则认为文档中是不存在图片。
103、若不存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,并对N段所述有序字幕进行转换处理,生成视频数据,其中,N为正整数;
在本实施例中,不存在图片数据,则只能提取文字数据,需要将文档中没有图片数据的信息发送到管理端显示设备,用于提醒用户更换文档进行重新转换处理,切分和提取的算法是类似于104步骤,具体细节可以参考104步骤的切分过程,并根据切分结果对字幕数据转换,得到视频数据。
104、若存在图片数据,则提取文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对文字字符段进行切片处理,生成N段有序字幕,其中,N为正整数;
在本实施例中,提取文档的字符数据时,会同时对标点符合换行空格进行提取,而对图片格式的数据进行跳过,对字符进行提取,生成文字字符段。切分文字段时,先对整个文字段的标点符号进行拆分,例如“,”、“。”、“?”、“!”、“……”、“[space]”、“[\n]”、“,”则作为拆分最小单元,进行初步切片,然后将每个切分的文字字符段确定为第一个有序的字段,由于文本框有字体大小和行间距的限制,会导致不一定每个第一有序字段每个字段能不超出文本框的限制。而且在文本限制下,需要对第一有序字段中的字符数值进行识别处理,对超出文本每行限制的进行转换处理。例如文本框的一行只能显示8个字符,而一句有序字段有9个字符,可以对有序字段进行5个字符一行,4字符另一行进行拆分显示,还可以第一行显示8个字符,第二行显示1个字符,生成一个有序字幕。需要说明的是,有可能出现一个第一有序字幕拆分出2-3个有序字幕的情况。
进一步的,“提取文档中所有的字符数据,生成文字字符段”还可以执行以下步骤:
1041、剔除文档中所有的图片数据,生成去图文档;
1042、提取去图文档中的所有字符数据,按照排序生成文字字符段。
在1041、1042步骤中,可以保留原文档,复制原文档的数据,对复制文档中的图片数据进行删除处理,留下只有字符的文档数据,生成去图文档。将去图文档中的字符数据按照排序进行提取,根据顺序得到文字字符段。
优选的,“根据预置切分算法,对文字字符段进行切片处理,生成N段有序字幕”还可以执行以下操作:
1043、根据文字字符段的标点符号,对文字字符段进行拆分,得到M个有序字段,M为正整数;
1044、读取预置文本框的字体大小设置和行间距设置,计算出文本框的容纳行数为X行,其中,X为正整数;
1045、基于有序字段,对文本框的前X-1行填充处理,生成新的文本框,以及根据文本框第X-1行的最后字符,对有序字段进行切分,将有序字段中未填充被切分的字段确定为分析字段;
1046、读取分析字段的总字数,根据总字数与字体大小设置,计算出总字数对应的总长度;
1047、判断总长度是否小于文本框的宽度;
1048、若小于文本框的宽度,则将分析字段填入文本框的第X行,得到有序字幕;
1049、若大于文本框的宽度,则根据预置逼近拆分算法,将分析字段进行拆分填入至文本框的第X行,得到有序字幕。
在1043-1049步骤中,例如“梵高的一生,充满世俗意义上的“失败”:名利皆空,情爱亦无,贫病交加。在阳光明媚的法国南部小城,他疯狂地作画。倾泄的颜料里调和着他的血,而画布,不过是他包扎伤口的绷带。他像夸父一样地追逐着太阳,最后在阳光中燃烧、倒下。”先对标点进行拆分“梵高的一生”、“充满世俗意义上的”、“失败”、“名利皆空”、“情爱亦无”、“贫病交加”、“在阳光明媚的法国南部小城”、“他疯狂地作画”、“倾泄的颜料里调和着他的血”、“而画布”、“不过是他包扎伤口的绷带”、“他像夸父一样地追逐着太阳”、“最后在阳光中燃烧”、“倒下”。文本框只能容纳一行4个字,容纳2行。则每个有序字段都会对文本框进行第一行填充,留下拆分后的分析字段。“梵高的一生”进行拆分,“梵高的一”为第一行,然后“生”的总长度小于四个字符的长度,就将“生”填充后,得到一个有序字幕。“在阳光明媚的法国南部小城”的第一行为“在阳光明”,分析字段为“媚的法国南部小城”大于四个字段则“媚的法国”为第二字段填入,“南部小城”填入新的文本框中。
进一步的,在1049步骤,还可以执行以下步骤:
10491、读取分析字段的前i行总字数,根据前i行总字数与字体大小设置,计算出前i行总字数对应的前i行总长度,其中,i为正整数;
10492、判断前i行总长度是否小于文本框的宽度;
10493、若小于,则对i的数值增加1,重新读取分析字段的前i段总字数;
10494、若不小于,则在分析字段中前i-1段进行拆分,得到前i-1段分析字段和非前i-1段分析字段;
10495、将前i-1段分析字段填入文本框的第X行,得到有序字幕;
10496、将非前i-1段分析字段确定为新的有序字段,进行新的文本框填充。
在10491-10496实施例中,可以存在分析字段“美语录摘抄经典语录长句/事在人为是一种积极的人生态度”,而存在两行字,则先读取第一行字,“美语录摘抄经典语录长句”,第一行字超过了四个字的限制,则对0行字进行拆分,将零行填充到原先的文本框,即对原来的文本框不进行填充,对1、2行字“美语录摘抄经典语录长句事在人为是一种积极的人生态度”确定为新的有序字段,重新分析。而如果,设置的文本框为15个字的限制,则“美语录摘抄经典语录长句/事在人为是一种积极的人生态度”第一行的“美语录摘抄经典语录长句”小于15个字,则判断前两行“美语录摘抄经典语录长句/事在人为是一种积极的人生态度”是否超过15个字超过了,则将第一行“美语录摘抄经典语录长句”填充至文本框中,而将非第一行“事在人为是一种积极的人生态度”设置为新的有序字段。
105、提取文档中所有的图片数据,生成图片集,以及根据预置组合算法,将图片集和N段有序字幕进行组合转换处理,生成视频数据。
在本实施例中,根据文档图片从上至下且从左至右的排序,提取图片数据,生成按照文档读取顺序的图片集。图片集根据排序顺序生成展示视频,N段有序字幕根据字幕排序生成展示视频。图片集的排序展示视频和N段有序字幕展示视频进行组合,生成带有字幕数据的图片显示的视频数据。
优选的,“根据预置组合算法,将图片集和N段有序字幕进行组合转换处理,生成视频数据”可以执行以下步骤:
1051、根据预置图片展示单位时长,计算出图片集中图片的图片展示总时长,并根据预置字幕展示单位时长,计算出图片集中图片的字幕展示总时长;
1052、判断图片展示时长是否大于字幕展示总时长;
1053、若图片展示时长小于字幕展示总时长,则将字幕展示总时长除以图片集中图片的图片总数,得到图片平均时长,以及将图片平均时长设置为图片展示单位时长;
1054、根据图片展示单位时长和字幕展示单位时长,对图片集和N段有序字幕进行组合处理,生成视频数据。
在1051-1054步骤中,每个字幕展示的单位时长可以是3秒,而图片展示单位时长为2秒,如图2所示,3个图片的总时长为6秒,而5个字幕的总时长为15秒,则图片总时长小于字幕总时长,调整图片总时长至每个图片单位时长为5秒,并行播放生成视频数据。需要说明的是,如图4所示,当文档没有字符数据只有图形数据时,即基于图片展示单位时长进行播放显示。
进一步的,1054步骤可以执行以下操作:
10541、将图片集中每个图片的播放时长设置为图片展示单位时长,将N段有序字幕中每个字幕的播放时长设置为字幕展示单位时长;
10542、将图片集中图片填充至预置图片显示框架中,生成第一层级播放视频;
10543、将N段有序字幕中字幕输入至预置字幕显示框架中,生产第二层级播放视频;
10544、对第一层级播放视频和第二层级播放视频并行组合处理,得到视频数据。
在10541-10544步骤中,如图3所示,第一层播放视频是用来展示图片,第二层播放视频是用来显示字幕,将第一层播放视频和第二层播放视频组合在一起得到视频数据,图3展示的是字幕总时长小于图片总时长的显示情况。镜头1和镜头2是不同的文档组合为同一个视频,生成方式类似于单独一个视频展示情况,而镜头1和镜头2之间可以进行转场特效渲染或者是增加转场画面。
在本发明实施例中,基于文档内容的判断,在文档具备图片信息时,将图片和文字数据分别提取数据转换为视频数据,解决了现有技术中无法在文档具有图片和文字时转换为视频的技术问题,提高了现有视频转换技术的适用范围。
上面对本发明实施例中基于文档的视频转换方法进行了描述,下面对本发明实施例中基于文档的视频转换装置进行描述,请参阅图5,本发明实施例中基于文档的视频转换装置一个实施例包括:
接收模块501,用于接收文档的转换指令;
判断模块502,用于判断所述文档中是否存在图片数据;
提取转换模块503,用于若不存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,并对N段所述有序字幕进行转换处理,生成视频数据,其中,N为正整数;
切分模块504,用于若存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,其中,N为正整数;
生成模块505,用于提取所述文档中所有的图片数据,生成图片集,以及根据预置组合算法,将所述图片集和所述N段有序字幕进行组合转换处理,生成视频数据。
在本发明实施例中,基于文档内容的判断,在文档具备图片信息时,将图片和文字数据分别提取数据转换为视频数据,解决了现有技术中无法在文档具有图片和文字时转换为视频的技术问题,提高了现有视频转换技术的适用范围。
请参阅图6,本发明实施例中基于文档的视频转换装置的另一个实施例包括:
接收模块501,用于接收文档的转换指令;
判断模块502,用于判断所述文档中是否存在图片数据;
提取转换模块503,用于若不存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,并对N段所述有序字幕进行转换处理,生成视频数据,其中,N为正整数;
切分模块504,用于若存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,其中,N为正整数;
生成模块505,用于提取所述文档中所有的图片数据,生成图片集,以及根据预置组合算法,将所述图片集和所述N段有序字幕进行组合转换处理,生成视频数据。
其中,所述判断模块502具体用于:
扫描所述文档中的数据,分析所述数据的字符串中是否存在图片格式后缀。
其中,所述切分模块504包括:
拆分单元5041,用于根据所述文字字符段的标点符号,对所述文字字符段进行拆分,得到M个有序字段,M为正整数;
文本框计算单元5042,用于读取预置文本框的字体大小设置和行间距设置,计算出所述文本框的容纳行数为X行,其中,X为正整数;
填充切分单元5043,用于基于所述有序字段,对所述文本框的前X-1行填充处理,生成新的文本框,以及根据所述文本框第X-1行的最后字符,对所述有序字段进行切分,将所述有序字段中未填充被切分的字段确定为分析字段;
计算单元5044,用于读取所述分析字段的总字数,根据所述总字数与所述字体大小设置,计算出所述总字数对应的总长度;
判断单元5045,用于判断所述总长度是否小于所述文本框的宽度;
填入单元5046,用于若小于所述文本框的宽度,则将所述分析字段填入所述文本框的第X行,得到有序字幕;
拆分填入单元5047,用于若大于所述文本框的宽度,则根据预置逼近拆分算法,将所述分析字段进行拆分填入至所述文本框的第X行,得到有序字幕。
其中,所述拆分填入单元5047具体用于:
读取所述分析字段的前i行总字数,根据所述前i行总字数与所述字体大小设置,计算出所述前i行总字数对应的前i行总长度,其中,i为正整数;
判断所述前i行总长度是否小于所述文本框的宽度;
若小于,则对i的数值增加1,重新读取所述分析字段的前i段总字数;
若不小于,则在所述分析字段中前i-1段进行拆分,得到前i-1段分析字段和非前i-1段分析字段;
将所述前i-1段分析字段填入所述文本框的第X行,得到有序字幕;
将所述非前i-1段分析字段确定为新的有序字段,进行新的文本框填充。
其中,所述生成模块505包括:
时长分析单元5051,用于根据预置图片展示单位时长,计算出所述图片集中图片的图片展示总时长,并根据预置字幕展示单位时长,计算出所述图片集中图片的字幕展示总时长;
时长判断单元5052,用于判断所述图片展示时长是否大于所述字幕展示总时长;
时长设置单元5053,用于若图片展示时长小于字幕展示总时长,则将所述字幕展示总时长除以所述图片集中图片的图片总数,得到图片平均时长,以及将所述图片平均时长设置为图片展示单位时长;
视频生成单元5054,用于根据所述图片展示单位时长和所述字幕展示单位时长,对所述图片集和所述N段有序字幕进行组合处理,生成视频数据。
其中,所述视频生成单元5054具体用于:
将所述图片集中每个图片的播放时长设置为所述图片展示单位时长,将所述N段有序字幕中每个字幕的播放时长设置为所述字幕展示单位时长;
将所述图片集中图片填充至预置图片显示框架中,生成第一层级播放视频;
将所述N段有序字幕中字幕输入至预置字幕显示框架中,生产第二层级播放视频;
对所述第一层级播放视频和所述第二层级播放视频并行组合处理,得到视频数据。
其中,所述切分模块504还可以具体用于:
剔除所述文档中所有的图片数据,生成去图文档;
提取所述去图文档中的所有字符数据,按照排序生成文字字符段。
在本发明实施例中,基于文档内容的判断,在文档具备图片信息时,将图片和文字数据分别提取数据转换为视频数据,解决了现有技术中无法在文档具有图片和文字时转换为视频的技术问题,提高了现有视频转换技术的适用范围。
上面图5和图6从模块化功能实体的角度对本发明实施例中的基于文档的视频转换装置进行详细描述,下面从硬件处理的角度对本发明实施例中基于文档的视频转换设备进行详细描述。
图7是本发明实施例提供的一种基于文档的视频转换设备的结构示意图,该基于文档的视频转换设备700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)710(例如,一个或一个以上处理器)和存储器720,一个或一个以上存储应用程序733或数据732的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对基于文档的视频转换设备700中的一系列指令操作。更进一步地,处理器710可以设置为与存储介质730通信,在基于文档的视频转换设备700上执行存储介质730中的一系列指令操作。
基于文档的视频转换设备700还可以包括一个或一个以上电源740,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口760,和/或,一个或一个以上操作系统731,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图7示出的基于文档的视频转换设备结构并不构成对基于文档的视频转换设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述基于文档的视频转换方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统或装置、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于文档的视频转换方法,其特征在于,包括步骤:
接收文档的转换指令;
判断所述文档中是否存在图片数据;
若不存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,并对N段所述有序字幕进行转换处理,生成视频数据,其中,N为正整数;
若存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕;
提取所述文档中所有的图片数据,生成图片集,以及根据预置组合算法,将所述图片集和所述N段有序字幕进行组合转换处理,生成视频数据。
2.根据权利要求1所述的基于文档的视频转换方法,其特征在于,所述根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕包括:
根据所述文字字符段的标点符号,对所述文字字符段进行拆分,得到M个有序字段,其中,M为正整数;
读取预置文本框的字体大小设置和行间距设置,计算出所述文本框的容纳行数为X行,其中,X为正整数;
基于所述有序字段,对所述文本框的前X-1行填充处理,生成新的文本框,以及根据所述文本框第X-1行的最后字符,对所述有序字段进行切分,将所述有序字段中未填充被切分的字段确定为分析字段;
读取所述分析字段的总字数,根据所述总字数与所述字体大小设置,计算出所述总字数对应的总长度;
判断所述总长度是否小于所述文本框的宽度;
若小于所述文本框的宽度,则将所述分析字段填入所述文本框的第X行,得到有序字幕;
若大于所述文本框的宽度,则根据预置逼近拆分算法,将所述分析字段进行拆分填入至所述文本框的第X行,得到有序字幕。
3.根据权利要求2所述的文字与图片的匹配方法,其特征在于,所述根据预置逼近拆分算法,将所述分析字段进行拆分填入至所述文本框的第X行,得到有序字幕包括:
读取所述分析字段的前i行总字数,根据所述前i行总字数与所述字体大小设置,计算出所述前i行总字数对应的前i行总长度,其中,i为正整数;
判断所述前i行总长度是否小于所述文本框的宽度;
若小于,则对i的数值增加1,重新读取所述分析字段的前i段总字数;
若不小于,则在所述分析字段中前i-1段进行拆分,得到前i-1段分析字段和非前i-1段分析字段;
将所述前i-1段分析字段填入所述文本框的第X行,得到有序字幕;
将所述非前i-1段分析字段确定为新的有序字段,进行新的文本框填充。
4.根据权利要求1所述的基于文档的视频转换方法,其特征在于,所述根据预置组合算法,将所述图片集和所述N段有序字幕进行组合转换处理,生成视频数据包括:
根据预置图片展示单位时长,计算出所述图片集中图片的图片展示总时长,并根据预置字幕展示单位时长,计算出所述图片集中图片的字幕展示总时长;
判断所述图片展示时长是否大于所述字幕展示总时长;
若图片展示时长小于字幕展示总时长,则将所述字幕展示总时长除以所述图片集中图片的图片总数,得到图片平均时长,以及将所述图片平均时长设置为图片展示单位时长;
根据所述图片展示单位时长和所述字幕展示单位时长,对所述图片集和所述N段有序字幕进行组合处理,生成视频数据。
5.根据权利要求4所述的基于文档的视频转换方法,其特征在于,所述根据所述图片展示单位时长和所述字幕展示单位时长,对所述图片集和所述N段有序字幕进行组合处理,生成视频数据包括:
将所述图片集中每个图片的播放时长设置为所述图片展示单位时长,将所述N段有序字幕中每个字幕的播放时长设置为所述字幕展示单位时长;
将所述图片集中图片填充至预置图片显示框架中,生成第一层级播放视频;
将所述N段有序字幕中字幕输入至预置字幕显示框架中,生产第二层级播放视频;
对所述第一层级播放视频和所述第二层级播放视频并行组合处理,得到视频数据。
6.根据权利要求1所述的基于文档的视频转换方法,其特征在于,所述判断所述文档中是否存在图片数据包括:
扫描所述文档中的数据,分析所述数据的字符串中是否存在图片格式后缀。
7.根据权利要求1所述的基于文档的视频转换方法,其特征在于,所述在所述提取所述文档中所有的字符数据,生成文字字符段包括:
剔除所述文档中所有的图片数据,生成去图文档;
提取所述去图文档中的所有字符数据,按照排序生成文字字符段。
8.一种基于文档的视频转换装置,其特征在于,所述基于文档的视频转换装置包括:
接收模块,用于接收文档的转换指令;
判断模块,用于判断所述文档中是否存在图片数据;
提取转换模块,用于若不存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,并对N段所述有序字幕进行转换处理,生成视频数据,其中,N为正整数;
切分模块,用于若存在图片数据,则提取所述文档中所有的字符数据,生成文字字符段,以及根据预置切分算法,对所述文字字符段进行切片处理,生成N段有序字幕,其中,N为正整数;
生成模块,用于提取所述文档中所有的图片数据,生成图片集,以及根据预置组合算法,将所述图片集和所述N段有序字幕进行组合转换处理,生成视频数据。
9.一种基于文档的视频转换设备,其特征在于,所述基于文档的视频转换设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于文档的视频转换设备执行如权利要求1-7中任一项所述的基于文档的视频转换方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于文档的视频转换方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110693222.6A CN113423010B (zh) | 2021-06-22 | 2021-06-22 | 基于文档的视频转换方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110693222.6A CN113423010B (zh) | 2021-06-22 | 2021-06-22 | 基于文档的视频转换方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113423010A true CN113423010A (zh) | 2021-09-21 |
CN113423010B CN113423010B (zh) | 2022-08-16 |
Family
ID=77716134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110693222.6A Active CN113423010B (zh) | 2021-06-22 | 2021-06-22 | 基于文档的视频转换方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113423010B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114390220A (zh) * | 2022-01-19 | 2022-04-22 | 中国平安人寿保险股份有限公司 | 一种动画视频生成方法及相关装置 |
CN115150660A (zh) * | 2022-06-09 | 2022-10-04 | 深圳市大头兄弟科技有限公司 | 一种基于字幕的视频编辑方法和相关设备 |
CN117440116A (zh) * | 2023-12-11 | 2024-01-23 | 深圳麦风科技有限公司 | 视频的生成方法、装置、终端设备和可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001095631A2 (en) * | 2000-06-09 | 2001-12-13 | British Broadcasting Corporation | Generation subtitles or captions for moving pictures |
CN103324760A (zh) * | 2013-07-11 | 2013-09-25 | 中国农业大学 | 使用解说词文档自动生成营养健康教育视频的方法及系统 |
CN104994312A (zh) * | 2015-07-15 | 2015-10-21 | 北京金山安全软件有限公司 | 一种视频生成方法及装置 |
CN107943839A (zh) * | 2017-10-30 | 2018-04-20 | 百度在线网络技术(北京)有限公司 | 基于图片和文字生成视频的方法、装置、设备及存储介质 |
CN108965737A (zh) * | 2017-05-22 | 2018-12-07 | 腾讯科技(深圳)有限公司 | 媒体数据处理方法、装置及存储介质 |
CN109614537A (zh) * | 2018-12-06 | 2019-04-12 | 北京百度网讯科技有限公司 | 用于生成视频的方法、装置、设备和存储介质 |
CN111930289A (zh) * | 2020-09-09 | 2020-11-13 | 智者四海(北京)技术有限公司 | 一种处理图片和文本的方法和系统 |
CN112291614A (zh) * | 2019-07-25 | 2021-01-29 | 北京搜狗科技发展有限公司 | 一种视频生成方法及装置 |
-
2021
- 2021-06-22 CN CN202110693222.6A patent/CN113423010B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001095631A2 (en) * | 2000-06-09 | 2001-12-13 | British Broadcasting Corporation | Generation subtitles or captions for moving pictures |
CN103324760A (zh) * | 2013-07-11 | 2013-09-25 | 中国农业大学 | 使用解说词文档自动生成营养健康教育视频的方法及系统 |
CN104994312A (zh) * | 2015-07-15 | 2015-10-21 | 北京金山安全软件有限公司 | 一种视频生成方法及装置 |
CN108965737A (zh) * | 2017-05-22 | 2018-12-07 | 腾讯科技(深圳)有限公司 | 媒体数据处理方法、装置及存储介质 |
CN107943839A (zh) * | 2017-10-30 | 2018-04-20 | 百度在线网络技术(北京)有限公司 | 基于图片和文字生成视频的方法、装置、设备及存储介质 |
CN109614537A (zh) * | 2018-12-06 | 2019-04-12 | 北京百度网讯科技有限公司 | 用于生成视频的方法、装置、设备和存储介质 |
CN112291614A (zh) * | 2019-07-25 | 2021-01-29 | 北京搜狗科技发展有限公司 | 一种视频生成方法及装置 |
CN111930289A (zh) * | 2020-09-09 | 2020-11-13 | 智者四海(北京)技术有限公司 | 一种处理图片和文本的方法和系统 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114390220A (zh) * | 2022-01-19 | 2022-04-22 | 中国平安人寿保险股份有限公司 | 一种动画视频生成方法及相关装置 |
CN114390220B (zh) * | 2022-01-19 | 2023-12-08 | 中国平安人寿保险股份有限公司 | 一种动画视频生成方法及相关装置 |
CN115150660A (zh) * | 2022-06-09 | 2022-10-04 | 深圳市大头兄弟科技有限公司 | 一种基于字幕的视频编辑方法和相关设备 |
CN115150660B (zh) * | 2022-06-09 | 2024-05-10 | 深圳市闪剪智能科技有限公司 | 一种基于字幕的视频编辑方法和相关设备 |
CN117440116A (zh) * | 2023-12-11 | 2024-01-23 | 深圳麦风科技有限公司 | 视频的生成方法、装置、终端设备和可读存储介质 |
CN117440116B (zh) * | 2023-12-11 | 2024-03-22 | 深圳麦风科技有限公司 | 视频的生成方法、装置、终端设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113423010B (zh) | 2022-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113423010B (zh) | 基于文档的视频转换方法、装置、设备及存储介质 | |
US9875229B2 (en) | Template-based page layout for web content | |
CN110020437B (zh) | 一种视频和弹幕相结合的情感分析及可视化方法 | |
US20090080020A1 (en) | Image processing apparatus, method and recording medium | |
KR102137039B1 (ko) | 문서 파일의 압축 처리를 행하는 화상 처리 장치, 문서 파일의 압축 방법 및 저장 매체 | |
Sari et al. | A review of graph theoretic and weightage techniques in file carving | |
CN103177105B (zh) | 一种图像检索方法及装置 | |
CN115221856A (zh) | 一种同时基于图像、视频和文本内容对文档相似性进行判断的方法 | |
CN113438543B (zh) | 文档转视频的匹配方法、装置、设备及存储介质 | |
CN112188215B (zh) | 视频解码方法、装置、设备及存储介质 | |
CN112433995A (zh) | 文件格式转换方法、系统、计算机设备及存储介质 | |
CN117041459A (zh) | 基于文本的视频生成方法、系统及相关设备 | |
CN113497899A (zh) | 文字与图片的匹配方法、装置、设备及存储介质 | |
JP2017192080A (ja) | 画像圧縮装置、画像復号装置、画像圧縮方法及び画像圧縮プログラム | |
Lin et al. | Combining a segmentation-like approach and a density-based approach in content extraction | |
US8566366B2 (en) | Format conversion apparatus and file search apparatus capable of searching for a file as based on an attribute provided prior to conversion | |
JP2006100973A (ja) | データ圧縮装置、及びデータ伸長装置 | |
JP2022061934A (ja) | サーバおよびデータ割り当て方法 | |
WO2020224140A1 (zh) | 信息文件的处理方法、装置、电子设备和存储介质 | |
US8918714B2 (en) | Printing a document containing a video or animations | |
JP5346156B2 (ja) | プログラム、転置インデックスの格納方法及び検索方法 | |
JP3624013B2 (ja) | 画像処理方法及び装置 | |
JP5894852B2 (ja) | 代表静止画抽出装置、及びプログラム | |
CN116156246B (zh) | 一种视频字幕添加方法、装置、电子设备和可读存储介质 | |
CN114218895B (zh) | 对uof文档进行转换的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: 518000 Building 1901, 1902, 1903, Qianhai Kexing Science Park, Labor Community, Xixiang Street, Bao'an District, Shenzhen, Guangdong Province Patentee after: Shenzhen Flash Scissor Intelligent Technology Co.,Ltd. Address before: 518000 Unit 9ABCDE, Building 2, Haihong Industrial Plant Phase II, Haihong Industrial Plant, West Side of Xixiang Avenue, Labor Community, Xixiang Street, Bao'an District, Shenzhen, Guangdong Patentee before: Shenzhen big brother Technology Co.,Ltd. |