CN113438543B

CN113438543B - 文档转视频的匹配方法、装置、设备及存储介质

Info

Publication number: CN113438543B
Application number: CN202110691387.XA
Authority: CN
Inventors: 严华培; 王红星
Original assignee: Shenzhen Big Head Brothers Technology Co Ltd
Current assignee: Shenzhen Flash Scissor Intelligent Technology Co ltd
Priority date: 2021-06-22
Filing date: 2021-06-22
Publication date: 2023-02-03
Anticipated expiration: 2041-06-22
Also published as: CN113438543A

Abstract

本发明涉及数据转换领域，公开了一种文档转视频的匹配方法、装置、设备及存储介质。该方法包括：获取文档的转换指令，提取文档中的文字字符段；对文字字符段进行切片处理，生成N段有序字幕；读取文档中的背景素材数据，分析背景素材数据中视频数据和图片数据的存在情况；若存在视频数据和图片数据，则根据预置时长设置算法，生成第一层级播放视频；若只存在图片数据，调整图片数据的图片播放总时长，生成第一层级播放视频；若只存在视频数据，调整视频数据的视频播放总时长，生成第一层级播放视频；将N段有序字幕中字幕输入至字幕显示框架中，生产第二层级播放视频；对第一层级播放视频和第二层级播放视频并行组合处理，得到视频数据。

Description

文档转视频的匹配方法、装置、设备及存储介质

技术领域

本发明涉及数据转换领域，尤其涉及一种文档转视频的匹配方法、装置、设备及存储介质。

背景技术

在文档转视频的领域中，主要是将文字转换为视频数据或者是字幕数据，这对转换视频过程中，转换数据种类过于单一导致在视频转换中场景过于局限，不能实现多内容的文档转换为视频的过程。

因此，为了丰富视频转换的内容，必须有一种能将图文数据转换为视频的技术。现有的图文转换视频上，必须要将图文数据分别导入转换程序中，则会使得转换数据操作上十分繁琐耗费大量时间。由此，需要一种能根据文档内容灵活转换为视频的转换技术。

发明内容

本发明的主要目的在于解决现有的文档转换视频数据过于繁琐和转换数据过于局限的技术问题。

本发明第一方面提供了一种文档转视频的匹配方法，包括步骤：

获取文档的转换指令，提取所述文档中的文字字符段；

根据预置切分算法，对所述文字字符段进行切片处理，生成N段有序字幕，其中，N为正整数；

读取所述文档中的背景素材数据，分析所述背景素材数据中视频数据和图片数据的存在情况；

若存在视频数据和图片数据，则根据预置时长设置算法，设置所述视频数据的视频播放总时长，并设置所述图片数据的图片播放总时长，生成第一层级播放视频；

若只存在图片数据，则根据所述N段有序字幕的字幕播放总时长，调整所述图片数据的图片播放总时长，生成第一层级播放视频；

若只存在视频数据，则根据所述N段有序字幕的字幕播放总时长，调整所述视频数据的视频播放总时长，生成第一层级播放视频；

将所述N段有序字幕中字幕输入至预置字幕显示框架中，生产第二层级播放视频；

对所述第一层级播放视频和所述第二层级播放视频并行组合处理，得到视频数据。

可选的，在本发明第一方面的第一种实现方式中，所述根据预置切分算法，对所述文字字符段进行切片处理，生成N段有序字幕包括：

根据所述文字字符段的标点符号，对所述文字字符段进行拆分，得到M个有序字段，M为正整数；

读取预置文本框的字体大小设置和行间距设置，计算出所述文本框的容纳行数为X行，其中，X为正整数；

基于所述有序字段，对所述文本框的前X-1行填充处理，生成新的文本框，以及根据所述文本框第X-1行的最后字符，对所述有序字段进行切分，将所述有序字段中未填充被切分的字段确定为分析字段；

读取所述分析字段的总字数，根据所述总字数与所述字体大小设置，计算出所述总字数对应的总长度；

判断所述总长度是否小于所述文本框的宽度；

若小于所述文本框的宽度，则将所述分析字段填入所述文本框的第X行，得到有序字幕；

若大于所述文本框的宽度，则根据预置逼近拆分算法，将所述分析字段进行拆分填入至所述文本框的第X行，得到有序字幕。

可选的，在本发明第一方面的第二种实现方式中，所述根据预置逼近拆分算法，将所述分析字段进行拆分填入至所述文本框的第X行，得到有序字幕包括：

读取所述分析字段的前i行总字数，根据所述前i行总字数与所述字体大小设置，计算出所述前i行总字数对应的前i行总长度，其中，i为正整数；

判断所述前i行总长度是否小于所述文本框的宽度；

若小于，则对i的数值增加1，重新读取所述分析字段的前i段总字数；

若不小于，则在所述分析字段中前i-1段进行拆分，得到前i-1段分析字段和非前i-1段分析字段；

将所述前i-1段分析字段填入所述文本框的第X行，得到有序字幕；

将所述非前i-1段分析字段确定为新的有序字段，进行新的文本框填充。

可选的，在本发明第一方面的第三种实现方式中，所述读取所述文档中的背景素材数据，分析所述背景素材数据中视频数据和图片数据的存在情况包括：

读取所述文档中的背景素材数据，判断所述背景素材数据中是否存在图片数据；

若存在图片数据，则判断所述背景素材数据中是否存在视频数据；

若存在视频数据，则确定所述背景素材数据中存在视频数据和图片数据；

若不存在视频数据，则确定所述背景素材数据中只存在图片数据；

若不存在图片数据，则判断所述背景素材数据中是否存在视频数据；

若存在视频数据，则确定所述背景素材数据中只存在视频数据；

若不存在视频数据，则确定所述背景素材数据中不存在视频数据和图片数据。

可选的，在本发明第一方面的第四种实现方式中，述根据预置时长设置算法，设置所述视频数据的视频播放总时长，并设置所述图片数据的图片播放总时长，生成第一层级播放视频包括：

分析出所述视频数据的初始视频播放总时长，并根据预置图片单位展示时长，计算出所述图片数据的初始图片播放总时长；

判断所述初始视频播放总时长和所述初始图片播放总时长之和是否大于所述N段有序字幕的字幕播放总时长；

若大于，则将所述视频数据设置为优先播放，以及将所述字幕播放总时长与所述视频播放时长的差值设置为所述图片数据的图片播放总时长，生成第一层级播放视频；

若不大于，则基于所述字幕播放总时长，剪切所述视频数据，生成调整视频数据，以及基于所述调整视频数据，生成第一层级播放视频。

可选的，在本发明第一方面的第五种实现方式中，所述根据所述N段有序字幕的字幕播放总时长，调整所述图片数据的图片播放总时长，生成第一层级播放视频包括：

将所述N段有序字幕的字幕播放总时长除以所述图片数据中的图片总数，得到平均单位时长；

将所述平均单位时长设置为所述图片数据的图片播放单位时长，生成第一层级播放视频。

可选的，在本发明第一方面的第六种实现方式中，所述根据所述N段有序字幕的字幕播放总时长，调整所述视频数据的视频播放总时长，生成第一层级播放视频包括：

判断所述N段有序字幕的字幕播放总时长是否大于所述视频数据的初始视频播放总时长；

若大于，则将所述字幕播放总时长减去所述初始视频播放总时长，得到差值时长，以及基于所述差值时长，对所述视频数据进行循环播放处理，生成第一层级播放视频；

若小于，则基于所述字幕播放总时长，截取所述视频数据，生成第一层级播放视频。

本发明第二方面提供了一种文档转视频的匹配装置，所述文档转视频的匹配装置包括：

获取模块，用于获取文档的转换指令，提取所述文档中的文字字符段；

切分模块，用于根据预置切分算法，对所述文字字符段进行切片处理，生成N段有序字幕；

分析模块，用于读取所述文档中的背景素材数据，分析所述背景素材数据中视频数据和图片数据的存在情况；

第一时长设置模块，用于若存在视频数据和图片数据，则根据预置时长设置算法，设置所述视频数据的视频播放总时长，并设置所述图片数据的图片播放总时长，生成第一层级播放视频；

第二时长设置模块，用于若只存在图片数据，则根据所述N段有序字幕的字幕播放总时长，调整所述图片数据的图片播放总时长，生成第一层级播放视频；

第三时长设置模块，用于若只存在视频数据，则根据所述N段有序字幕的字幕播放总时长，调整所述视频数据的视频播放总时长，生成第一层级播放视频；

字幕输入模块，用于将所述N段有序字幕中字幕输入至预置字幕显示框架中，生产第二层级播放视频；

并行组合模块，用于对所述第一层级播放视频和所述第二层级播放视频并行组合处理，得到视频数据。

本发明第三方面提供了一种文档转视频的匹配设备，包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；所述至少一个处理器调用所述存储器中的所述指令，以使得所述文档转视频的匹配设备执行上述的文档转视频的匹配方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的文档转视频的匹配方法。

在本发明实施例中，通过对文档中的文字字符提取，对非文字字符数据进行分析判断图片数据和视频数据存在情况，通过对视频和图片播放时长设置，将文字字符转换为字幕数据，进行视频字幕组合处理后实现文档灵活转换为视频的效果。

附图说明

图1为本发明实施例中文档转视频的匹配方法的一个实施例示意图；

图2为本发明实施例中第一层级播放视频的第一个实施例示意图；

图3为本发明实施例中第一层级播放视频的第二个实施例示意图；

图4为本发明实施例中第一层级播放视频的第三个实施例示意图；

图5为本发明实施例中文档转视频的匹配装置的一个实施例示意图；

图6为本发明实施例中文档转视频的匹配装置的另一个实施例示意图；

图7为本发明实施例中文档转视频的匹配设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种文档转视频的匹配方法、装置、设备及存储介质。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中文档转视频的匹配方法的一个实施例包括：

101、获取文档的转换指令，提取文档中的文字字符段；

在本实施例中，文档转换指令激活对文档中字符提取的指令，将文档中的字符按照顺序提取，得到字符处理数据。

102、根据预置切分算法，对文字字符段进行切片处理，生成N段有序字幕，其中，N为正整数；

在本实施例中，切分文字段时，先对整个文字段的标点符号进行拆分，例如“，”、“。”、“？”、“！”、“……”、“[space]”、“[\n]”、“,”则作为拆分最小单元，进行初步切片，然后将每个切分的文字字符段确定为第一个有序的字段，由于文本框有字体大小和行间距的限制，会导致不一定每个第一有序字段每个字段能不超出文本框的限制。而且在文本限制下，需要对第一有序字段中的字符数值进行识别处理，对超出文本每行限制的进行转换处理。例如文本框的一行只能显示8个字符，而一句有序字段有9个字符，可以对有序字段进行5个字符一行，4字符另一行进行拆分显示，还可以第一行显示8个字符，第二行显示1个字符，生成一个有序字幕。需要说明的是，有可能出现一个第一有序字幕拆分出2-3个有序字幕。

优选的，102步骤可以执行以下步骤：

1021、根据文字字符段的标点符号，对文字字符段进行拆分，得到M个有序字段，M为正整数；

1022、读取预置文本框的字体大小设置和行间距设置，计算出文本框的容纳行数为X行，其中，X为正整数；

1023、基于有序字段，对文本框的前X-1行填充处理，生成新的文本框，以及根据文本框第X-1行的最后字符，对有序字段进行切分，将有序字段中未填充被切分的字段确定为分析字段；

1024、读取分析字段的总字数，根据总字数与字体大小设置，计算出总字数对应的总长度；

1025、判断总长度是否小于文本框的宽度；

1026、若小于文本框的宽度，则将分析字段填入文本框的第X行，得到有序字幕；

1027、若大于文本框的宽度，则根据预置逼近拆分算法，将分析字段进行拆分填入至文本框的第X行，得到有序字幕。

在1021-1027步骤中，例如“梵高的一生，充满世俗意义上的“失败”：名利皆空，情爱亦无，贫病交加。在阳光明媚的法国南部小城，他疯狂地作画。倾泄的颜料里调和着他的血，而画布，不过是他包扎伤口的绷带。他像夸父一样地追逐着太阳，最后在阳光中燃烧、倒下。”先对标点进行拆分“梵高的一生”、“充满世俗意义上的”、“失败”、“名利皆空”、“情爱亦无”、“贫病交加”、“在阳光明媚的法国南部小城”、“他疯狂地作画”、“倾泄的颜料里调和着他的血”、“而画布”、“不过是他包扎伤口的绷带”、“他像夸父一样地追逐着太阳”、“最后在阳光中燃烧”、“倒下”。文本框只能容纳一行4个字，容纳2行。则每个有序字段都会对文本框进行第一行填充，留下拆分后的分析字段。“梵高的一生”进行拆分，“梵高的一”为第一行，然后“生”的总长度小于四个字符的长度，就将“生”填充后，得到一个有序字幕。“在阳光明媚的法国南部小城”的第一行为“在阳光明”，分析字段为“媚的法国南部小城”大于四个字段则“媚的法国”为第二字段填入，“南部小城”填入新的文本框中。

进一步的，在1027步骤，还可以执行以下步骤：

10271、读取分析字段的前i行总字数，根据前i行总字数与字体大小设置，计算出前i行总字数对应的前i行总长度，其中，i为正整数；

10272、判断前i行总长度是否小于文本框的宽度；

10273、若小于，则对i的数值增加1，重新读取分析字段的前i段总字数；

10274、若不小于，则在分析字段中前i-1段进行拆分，得到前i-1段分析字段和非前i-1段分析字段；

10275、将前i-1段分析字段填入文本框的第X行，得到有序字幕；

10276、将非前i-1段分析字段确定为新的有序字段，进行新的文本框填充。

在10271-10276实施例中，可以存在分析字段“美语录摘抄经典语录长句/事在人为是一种积极的人生态度”，而存在两行字，则先读取第一行字，“美语录摘抄经典语录长句”，第一行字超过了四个字的限制，则对0行字进行拆分，将零行填充到原先的文本框，即对原来的文本框不进行填充，对1、2行字“美语录摘抄经典语录长句事在人为是一种积极的人生态度”确定为新的有序字段，重新分析。而如果，设置的文本框为15个字的限制，则“美语录摘抄经典语录长句/事在人为是一种积极的人生态度”第一行的“美语录摘抄经典语录长句”小于15个字，则判断前两行“美语录摘抄经典语录长句/事在人为是一种积极的人生态度”是否超过15个字超过了，则将第一行“美语录摘抄经典语录长句”填充至文本框中，而将非第一行“事在人为是一种积极的人生态度”设置为新的有序字段。

103、读取文档中的背景素材数据，分析背景素材数据中视频数据和图片数据的存在情况；

在本实施例中，背景素材数据主要是图片数据和视频数据，在分析视频数据和图片数据的存在情况时，可以是两个通道一个通道分析图片数据的存在，另一通道是分析视频数据的存在，由此得到的结果进行分析。例如，视频数据存在为1，视频数据不存在为0，图片数据存在为1，图片数据不存在为0，可以得到{1,0}、{0,0}、{0,1}、{1,1}四种结果数据，根据结果数据得出图片和视频数据存在结果。

优选的，在103步骤中，还可以执行以下步骤：

1031、读取文档中的背景素材数据，判断背景素材数据中是否存在图片数据；

1032、若存在图片数据，则判断背景素材数据中是否存在视频数据；

1033、若存在视频数据，则确定背景素材数据中存在视频数据和图片数据；

1034、若不存在视频数据，则确定背景素材数据中只存在图片数据；

1035、若不存在图片数据，则判断背景素材数据中是否存在视频数据；

1036、若存在视频数据，则确定背景素材数据中只存在视频数据；

1037、若不存在视频数据，则确定背景素材数据中不存在视频数据和图片数据。

在1031-1037步骤中，单线程进行判断，先进行图片数据判断，在图片数据判断时，可以根据图片分析名称后缀进行匹配。如果存在图片数据，则继续判断是否存在视频数据，如果视频数据存在则认定是图片数据和视频数据都存在，如果视频数据不存在则认定只存在图片数据。如果不存在图片数据，则判断是否存在视频数据，如果视频数据存在则可以认定只有视频数据。如果视频数据不存在则认定背景素材数据中没有图片数据和视频数据。

104、若存在视频数据和图片数据，则根据预置时长设置算法，设置视频数据的视频播放总时长，并设置图片数据的图片播放总时长，生成第一层级播放视频；

在本实施例中，通过视频时长与图片时长的大小进行比对，当视频时长小于字幕的总时长，则将视频时长先设置为播放视频中，多余的时长平均分配至剩下的图片播放中，生成第一层播放视频。

进一步的，在104步骤中可以执行以下操作：

1041、分析出视频数据的初始视频播放总时长，并根据预置图片单位展示时长，计算出图片数据的初始图片播放总时长；

1042、判断初始视频播放总时长和初始图片播放总时长之和是否大于N段有序字幕的字幕播放总时长；

1043、若大于，则将视频数据设置为优先播放，以及将字幕播放总时长与视频播放时长的差值设置为图片数据的图片播放总时长，生成第一层级播放视频；

1044、若不大于，则基于字幕播放总时长，剪切视频数据，生成调整视频数据，以及基于调整视频数据，生成第一层级播放视频。

在1041-1044步骤中，N段有序字幕的每个字幕播放时间为2秒，则字幕的总播放长度为2N，比较2N时长与视频的总时长。若字幕总时长大于视频总时长，则如图2所示，视频先进行优先播放，然后将剩余时间以图片数量进行平均分配生成第一层级播放视频，也就是素材播放层。如果字幕总时长小于视频的总播放长度，则根据字幕播放长度对视频播放时长剪切处理，得到第一层级播放视频。

105、若只存在图片数据，则根据N段有序字幕的字幕播放总时长，调整图片数据的图片播放总时长，生成第一层级播放视频；

在本实施例中，如果只存在图片数据，将N段有序字幕的总时长平均分配至图片数据中，使得每个图片数据的播放时长等于平均值，即生成第一层级播放视频。

优选的，在105步骤中可以执行以下操作：

1051、将N段有序字幕的字幕播放总时长除以图片数据中的图片总数，得到平均单位时长；

1052、将平均单位时长设置为图片数据的图片播放单位时长，生成第一层级播放视频。

在1051、1052步骤中，如图3所示，可以将N段有序字幕的总时长平均分配至所有图片数据中，得到平均单位时长。将平均单位时长作为图片播放的时长，得到第一层级播放视频。

106、若只存在视频数据，则根据N段有序字幕的字幕播放总时长，调整视频数据的视频播放总时长，生成第一层级播放视频；

在本实施例中，只存视频数据，则将视频数据进行循环补充，直至视频数据的总时长等于N段有序字幕的播放总时长，将视频播放的顺序和时长作为播放视频，根据播放视频生成第一层级播放视频。

优选的，在106步骤中，可以采用以下方式：

1061、判断N段有序字幕的字幕播放总时长是否大于视频数据的初始视频播放总时长；

1062、若大于，则将字幕播放总时长减去初始视频播放总时长，得到差值时长，以及基于差值时长，对视频数据进行循环播放处理，生成第一层级播放视频；

1063、若小于，则基于字幕播放总时长，截取视频数据，生成第一层级播放视频。

在1061-1063中，如图4所示，如果字幕播放总时长大于视频播放长度，则视频会进行循环播放直至差值时长被视频补充完整，得到第一层级播放视频。如果字幕播放总时长小于视频播放长度，则依据字幕播放总时长对视频数据进行截取，得到第一层级播放视频。

107、将N段有序字幕中字幕输入至预置字幕显示框架中，生产第二层级播放视频；

在本实施例中，字幕显示框架主要是对有序字幕进行排版，将有序字幕从字符转换为显示的图片，生成第二层级播放视频。

108、对第一层级播放视频和第二层级播放视频并行组合处理，得到视频数据。

在本实施例中，进行文字图片转换为视频，字幕滚动速度可以是每个文本框4秒一个字幕进行展示，先生成背景是空白的滚动字幕的视频。将图像和视频数据作为背景插入值每个视频中，生成带滚动字幕的视频。

上面对本发明实施例中文档转视频的匹配方法进行了描述，下面对本发明实施例中文档转视频的匹配装置进行描述，请参阅图5，本发明实施例中文档转视频的匹配装置一个实施例包括：

获取模块201，用于获取文档的转换指令，提取所述文档中的文字字符段；

切分模块202，用于根据预置切分算法，对所述文字字符段进行切片处理，生成N段有序字幕，其中，N为正整数；

分析模块203，用于读取所述文档中的背景素材数据，分析所述背景素材数据中视频数据和图片数据的存在情况；

第一时长设置模块204，用于若存在视频数据和图片数据，则根据预置时长设置算法，设置所述视频数据的视频播放总时长，并设置所述图片数据的图片播放总时长，生成第一层级播放视频；

第二时长设置模块205，用于若只存在图片数据，则根据所述N段有序字幕的字幕播放总时长，调整所述图片数据的图片播放总时长，生成第一层级播放视频；

第三时长设置模块206，用于若只存在视频数据，则根据所述N段有序字幕的字幕播放总时长，调整所述视频数据的视频播放总时长，生成第一层级播放视频；

字幕输入模块207，用于将所述N段有序字幕中字幕输入至预置字幕显示框架中，生产第二层级播放视频；

并行组合模块208，用于对所述第一层级播放视频和所述第二层级播放视频并行组合处理，得到视频数据。

请参阅图6，本发明实施例中文档转视频的匹配装置的另一个实施例包括：

其中，所述切分模块202包括：

拆分单元2021，用于根据所述文字字符段的标点符号，对所述文字字符段进行拆分，得到M个有序字段，M为正整数；

文本框计算单元2022，用于读取预置文本框的字体大小设置和行间距设置，计算出所述文本框的容纳行数为X行，其中，X为正整数；

填充切分单元2023，用于基于所述有序字段，对所述文本框的前X-1行填充处理，生成新的文本框，以及根据所述文本框第X-1行的最后字符，对所述有序字段进行切分，将所述有序字段中未填充被切分的字段确定为分析字段；

计算单元2024，用于读取所述分析字段的总字数，根据所述总字数与所述字体大小设置，计算出所述总字数对应的总长度；

判断单元2025，用于判断所述总长度是否小于所述文本框的宽度；

填入单元2026，用于若小于所述文本框的宽度，则将所述分析字段填入所述文本框的第X行，得到有序字幕；

拆分填入单元2027，用于若大于所述文本框的宽度，则根据预置逼近拆分算法，将所述分析字段进行拆分填入至所述文本框的第X行，得到有序字幕。

其中，所述拆分填入单元2027具体用于：

判断所述前i行总长度是否小于所述文本框的宽度；

其中，所述识别模块203具体用于：

将所述关键词集与预置图像库中的图像进行标签匹配，获取所述图像库中图像对应的标签匹配数；

抓取最大的标签匹配数对应图像，将所述图像确定为所述关键词集对应的匹配图片，生成所述N段有序字幕对应的匹配图片。

其中，所述分析模块203具体用于：

其中，所述第一时长设置模块204具体用于：

其中，所述第二时长设置模块205具体用于：

其中，所述第三时长设置模块206具体用于：

上面图5和图6从模块化功能实体的角度对本发明实施例中的文档转视频的匹配装置进行详细描述，下面从硬件处理的角度对本发明实施例中文档转视频的匹配设备进行详细描述。

图7是本发明实施例提供的一种文档转视频的匹配设备的结构示意图，该文档转视频的匹配设备700可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)710(例如，一个或一个以上处理器)和存储器720，一个或一个以上存储应用程序733或数据732的存储介质730(例如一个或一个以上海量存储设备)。其中，存储器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对文档转视频的匹配设备700中的一系列指令操作。更进一步地，处理器710可以设置为与存储介质730通信，在文档转视频的匹配设备700上执行存储介质730中的一系列指令操作。

基于文档转视频的匹配设备700还可以包括一个或一个以上电源740，一个或一个以上有线或无线网络接口750，一个或一个以上输入输出接口760，和/或，一个或一个以上操作系统731，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图7示出的文档转视频的匹配设备结构并不构成对基于文档转视频的匹配设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述文档转视频的匹配方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统或装置、单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种文档转视频的匹配方法，其特征在于，包括步骤：

获取文档的转换指令，提取所述文档中的文字字符段；

若存在视频数据和图片数据，分析出所述视频数据的初始视频播放总时长；

判断所述初始视频播放总时长是否大于所述N段有序字幕的字幕播放总时长；

若大于，则基于所述字幕播放总时长，剪切所述视频数据，生成调整视频数据，以及基于所述调整视频数据，生成第一层级播放视频；

若不大于，则将所述视频数据设置为优先播放，以及将所述字幕播放总时长与所述初始视频播放总时长的差值设置为所述图片数据的图片播放总时长，生成第一层级播放视频；

将所述N段有序字幕中字幕输入至预置字幕显示框架中，生成第二层级播放视频；

对所述第一层级播放视频和所述第二层级播放视频并行组合处理，得到视频数据，所述根据预置切分算法，对所述文字字符段进行切片处理，生成N段有序字幕的步骤包括：

基于所述有序字段，对所述文本框的前X-1行填充处理，根据所述文本框第X-1行的最后字符，对所述有序字段进行切分，将所述有序字段中未填充被切分的字段确定为分析字段；

判断所述总长度是否小于所述文本框的宽度；

若小于所述文本框的宽度，则将所述分析字段填入所述文本框的第X行，得到N段有序字幕；

若大于所述文本框的宽度，则读取所述分析字段的前i行总字数，根据所述前i行总字数与所述字体大小设置，计算出所述前i行总字数对应的前i行总长度，其中，i为正整数；

判断所述前i行总长度是否小于所述文本框的宽度；

若小于，则对i的数值增加1，重新读取所述分析字段的前i行总字数；

若不小于，则对所述分析字段中前i-1行进行拆分，得到前i-1行分析字段和非前i-1行分析字段；

将所述前i-1行分析字段填入所述文本框的第X行，得到所述N段有序字幕；

将所述非前i-1行分析字段确定为新的有序字段，进行新的文本框填充。

2.根据权利要求1所述的文档转视频的匹配方法，其特征在于，所述读取所述文档中的背景素材数据，分析所述背景素材数据中视频数据和图片数据的存在情况包括：

3.根据权利要求1所述的文档转视频的匹配方法，其特征在于，所述根据所述N段有序字幕的字幕播放总时长，调整所述图片数据的图片播放总时长，生成第一层级播放视频包括：

4.根据权利要求1所述的文档转视频的匹配方法，其特征在于，所述根据所述N段有序字幕的字幕播放总时长，调整所述视频数据的视频播放总时长，生成第一层级播放视频包括：

5.一种文档转视频的匹配装置，其特征在于，所述文档转视频的匹配装置包括：

切分模块，用于根据预置切分算法，对所述文字字符段进行切片处理，生成N段有序字幕，其中，N为正整数；

切分模块，包括：

拆分单元，用于根据所述文字字符段的标点符号，对所述文字字符段进行拆分，得到M个有序字段，M为正整数；

文本框计算单元，用于读取预置文本框的字体大小设置和行间距设置，计算出所述文本框的容纳行数为X行，其中，X为正整数；

填充切分单元，用于基于所述有序字段，对所述文本框的前X-1行填充处理，根据所述文本框第X-1行的最后字符，对所述有序字段进行切分，将所述有序字段中未填充被切分的字段确定为分析字段；

计算单元，用于读取所述分析字段的总字数，根据所述总字数与所述字体大小设置，计算出所述总字数对应的总长度；

判断单元，用于判断所述总长度是否小于所述文本框的宽度；

填入单元，用于若小于所述文本框的宽度，则将所述分析字段填入所述文本框的第X行，得到N段有序字幕，其中，N为正整数；

拆分填入单元，用于若大于所述文本框的宽度，则读取所述分析字段的前i行总字数，根据所述前i行总字数与所述字体大小设置，计算出所述前i行总字数对应的前i行总长度，其中，i为正整数；

判断所述前i行总长度是否小于所述文本框的宽度；

将所述非前i-1行分析字段确定为新的有序字段，进行新的文本框填充；

第一时长设置模块，用于若存在视频数据和图片数据，分析出所述视频数据的初始视频播放总时长；

字幕输入模块，用于将所述N段有序字幕中字幕输入至预置字幕显示框架中，生成第二层级播放视频；

6.一种文档转视频的匹配设备，其特征在于，所述文档转视频的匹配设备包括：存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互连；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述文档转视频的匹配设备执行如权利要求1-4中任一项所述的文档转视频的匹配方法。

7.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述的文档转视频的匹配方法。