CN105868176A

CN105868176A - 基于文字的视频合成方法及其系统

Info

Publication number: CN105868176A
Application number: CN201610116357.5A
Authority: CN
Inventors: 侯强
Original assignee: Beijing Tongchen Shiji Technology Co Ltd
Current assignee: Beijing Tongchen Shiji Technology Co Ltd
Priority date: 2016-03-02
Filing date: 2016-03-02
Publication date: 2016-08-17

Abstract

本发明提供一种基于文字的视频合成方法，其特征在于，所述方法基于输入的文字信息生成相对应的视频，并将相应的视频进行显示。本发明能够对生成视频进行再编辑处理，从而得到最优化的视频。

Description

基于文字的视频合成方法及其系统

技术领域

本发明涉及一种视频合成方法及其系统，尤其涉及一种基于输入的文字来自动生成视频的视频合成方法及其系统。

背景技术

随着电子技术的快速发展，人们对电子产品的视觉效果要求越来越高，人们已不再满足单一的文字信息，而演变为追求生动形象的图片或视频。图片或视频的最大特点是能直观地将需求者所需要的信息进行显示，增加趣味感和视觉冲击感。

目前，智能手机已被广泛的普及，人的大部分时间基本上都在与智能手机为伴，可以从手机中获取所需要的各种信息，如通过在手机中的APP就可以搜索到想要的各种信息。

然而，现有的手机APP不能基于输入的文字信息来获得相关的视频，以及将获得的相关视频进行合成并显示，这无疑弱化了用户的视觉体验和获取信息的趣味性。

因此，亟待出现一种能够基于用户输入的文字信息来自动生成视频的方法及其系统，以提高用户的视觉体验和趣味性。

发明内容

针对上述技术问题，本发明提供一种能够基于用户输入的文字信息来自动生成视频的方法及其系统。

本发明采用的技术方案包括：

本发明的一个实施方式提供一种基于文字的视频合成方法，所述方法基于输入的文字信息生成相对应的视频，所述文字信息至少包括一个句子，所述方法包括：

步骤1：智能分词

将句子进行拆分，生成若干个基本词，并分析每个基本词的词性；

步骤2：句法分析

根据步骤1的分词结果，分析所述若干个基本词之间的关系；

步骤3：关键词提取

根据上述步骤1和步骤2的分析结果，从所述句子中提取关键词；

步骤4：关键词的权重分析

根据上述步骤1和步骤3的分析结果，计算关键词在句子中的权重，并按照权重由高至低的顺序对关键词进行排序，确定关键词的级别；

步骤5：形成同义词库

对步骤4中的关键词进行扩展，形成同义词库，根据每个同义词与关键词的语义关系，赋予每个关键词的同义词的权重；

步骤6：视频匹配和显示

根据步骤4得到的关键词和步骤5得到的关键词的同义词，形成关键词库+关键词的同义词的搜索矩阵库，并计算该搜索矩阵库所形成的每个组合的权重，按照得到的组合权重从高到低的顺序，搜索视频，得到匹配的视频，并将获得的匹配视频进行显示。

优选地，，所述文字信息包括K个句子(2≦K≦n)，对每个句子K执行上述步骤1至步骤6，得到与所述K句子相匹配的视频，按照句子K在文字信息中出现的顺序，将所得到的个与所述K句子相匹配的视频进行连接，并将连接的视频进行显示。

优选地，所述步骤4具体包括：

根据上述步骤1和步骤3的分析结果，分别赋予所述关键词第一权重系数和第二权重系数，根据所述第一权重系数和第二权重系数来计算关键词在句子中的最终权重，并按照权重由高至低的顺序对关键词进行排序，确定关键词的级别。

优选地，还包括：对获得的视频进行自定义编辑。

优选地，所述自定义编辑包括：视频滤镜处理、视频剪辑处理、录音、添加音乐和再编辑处理。

优选地，所述再编辑处理包括同一个人对所形成的视频进行再编辑和其他人对所形成的视频进行再编辑。

优选地，再编辑处理得到的视频可根据影片热度值来获得最优视频。

优选地，每个句子形成一个视频。

优选地，所述文字信息可直接输入或者通过语音输入。

本发明的另一实施方式还提供一种基于文字的视频合成系统，所述系统包括服务端和至少一个客户端，所述服务端与所述客户端通信连接，所述服务端基于所述客户端输入的文字信息来生成相对应的视频，所述文字信息至少包括一个句子，所述客户端包括输入单元和显示单元，所述服务端包括控制单元以及与所述控制单元连接的数据库和处理单元，其中，用户通过所述输入单元输入所述文字信息，所述处理单元对所述文字信息进行处理，基于处理的结果，所述控制单元从所述数据库中搜寻相匹配的视频，并将搜索的视频进行合成，得到基于文字信息的合成视频，并将所述合成视频在所述显示单元上进行显示。

本发明的基于文字的视频合成方法能够基于用户输入的文字信息来自动从数据库中获取相对应的视频，并将获得视频形象生动的进行显示出来，增加用户获取信息的趣味性和视觉感。

附图说明

图1是本发明的基于文字的视频合成方法的流程图。

图2是本发明的基于文字的视频合成系统的结构框图

图3是根据本发明的基于文字的视频合成方法得到的句子中的基本词的关系图。

图4是根据本发明的基于文字的视频合成方法得到的匹配视频示意图。

具体实施方式

以下结合附图对本发明的具体实施方式进行描述。

首先，对本发明的基于文字的视频合成系统进行介绍。

如图1所示，本发明的基于文字的视频合成系统可包括服务端1和与服务端连接的至少一个客户端2。客户端可为智能手机、PAD等智能设备，可包括输入单元21和显示单元22。服务端可包括控制单元11、数据库12和处理单元13。服务端基于客户端输入的至少包括一个句子的文字信息来生成相对应的视频。

具体地，用户通过输入单元21输入文字信息，处理单元13对文字信息进行处理，基于处理的结果，控制单元11从数据库12中搜寻相匹配的视频，并将搜索的视频进行合成，得到基于文字信息的合成视频，并将合成视频在显示单元上进行显示。

在本发明中，数据库12中包括采集的影视作品的视频中的720p以上的高清影视视频文件，该视频文件被切分为一定时间长度的视频片段(素材)，每个素材表现一个主题或特定镜头，长度在5-15秒之间，每个素材有特定的文字标签(最少3个)，表明素材的主题和含义，并被消除了声音和原视频字幕，每个视频片段都被标注了标签，如片名、场景、人物、镜头性质等。此外，数据库中形成有视频数据库索引，包括视频来源、关键标签、视频内容描述文字等标引信息，这样，可知道每个视频片段的视频来源、标签信息和视频内容描述等信息。

接着，参考图2至图4，对本发明的基于文字的视频合成方法进行描述。

本发明的基于文字的视频合成方法能够基于输入的文字信息生成相对应的视频，改文字信息可至少包括一个句子。以下以一个句子为例进行介绍，如图2所示，本发明的方法可包括以下步骤：

S1：智能分词

将输入的句子进行拆分，生成若干个基本词，并对得到这些基本词的词性进行分析。

具体地，可采用已有的成熟的第三方工具的API来对句子进行拆分，根据第三方工具的数据库(如汉语词性标记集)来将句子拆分成若干个基本词。在句子拆分过程中，以句号为单位进行拆分。一般而言，为体现简要和精确性，一个句子仅对应一个视频。例如，可采用中科院计算所的NLPIR汉语分词系统来进行分词，但是并不局限于此，例如可为perminusminus、Stanford汉语分词工具、哈工大语言云(LTP-cloud)、Jcseg、Ansj、庖丁解牛分词、盘古分词、IKAnalyzer、imdict-chinese-analyzer、mmseg4j、FudanNLP(复旦大学)、Jcseg、SCWS、Friso、HTTPCWS、libmmseg、OpenCLAS和CRF++等。中科院计算所的NLPIR汉语分词系统的汉语词性标记集主要参考了以下词性标记集：

(1)北大《人民日报》语料库词性标记集；

(2)北大2002新版词性标记集(草稿)；

(3)清华大学汉语树库词性标记集；

(4)教育部语用所词性标记集(国家推荐标准草案2002版)；

(5)美国宾州大学中文树库(ChinesePennTreeBank)词性标记集。

对每个基本词的词性进行，主要从动词、名词、形容词、介词、助词等方面进行，即分析该基本词属于何种词性。在本发明中，词性的作用一方面是作为分词的依据，另一方面是作为关键词权重分析的依据。

在本发明的一具体实施方式中，采用中科院计算所的NLPIR汉语分词系统来进行分词，根据该分词系统，词性可包括22个一类，66个二类，11个三类，共计99个，具体如下表1所示：

表1词性分类表

S2：句法分析

根据S1的分词结果，分析若干个基本词彼此之间的关系，它们之间的关系可包括主谓关系、动宾关系、间宾关系、前置宾语、兼语、定中关系、状中结构、动补结构、并列关系、介宾关系、附加关系、独立结构、核心关系等。在本发明中，也可根据基本词之间的关系来获得句子的主干。

具体的，可采用已有的成熟的第三方工具的API进行句法分析，如玻森中文语义开放平台，但是并不局限于此，例如还可以采用腾讯文智中文语义平台、NiuParser中文句法语义分析系统、玻森数据中文语义分析、中科院ICTCLAS等。在利用玻森中文语义开放平台进行句法分析(依存文法分析)时，句子中词与词之间可包括如下表2所示出的23种关系：

表2：关系表

在本发明中，句法分析就是把一句话中的关系用上述23种关系标注出来。

S3：关键词提取

根据上述步骤S2的分析结果，从句子中提取关键词。

具体地，可采用已有的成熟的第三方工具的API进行分词，来自动提取关键词，如可采用中科院计算所的NLPIR汉语分词系统，但是并不局限于此，例如还可以采用腾讯文智中文语义平台、NiuParser中文句法语义分析系统、玻森数据中文语义分析、中科院ICTCLAS等。该NLPIR汉语分词系统的关键词提取能够在全面把握文章中心思想的基础上，提取出若干个代表文章语义内容的词汇或短语，NLPIR主要采用交叉信息熵计算每个候选词的上下文条件熵，所处理的文档不受行业领域限制，且能够识别出最新出现的新词语，以及可将所输出的词语自动配以权重，即可利用现有的分词工具来自动提取句子中的关键词，并赋予关键词在词库中的权重系数。

S4：关键词权重分析

根据上述步骤S1和S3的分析结果，计算步骤S3中的关键词在句子中的最终权重，并按照权重顺序对关键词进行排序，确定关键词的级别。

具体地，关键词的权重的确定包括以下步骤：

(1)根据步骤S1的词性分析，本发明的基于文字的视频合成系统会基于系统自定义的准则，赋予不同词性的关键词的权重系数(以下称第一权重系数)。系统设定名词、动词、形容词的权重系数要高于其他词性，具体如下：

名词权重系数＝2

动词权重系数＝1.7

形容词权重系数＝1.3

其他词性权重系数＝1

(2)根据步骤S3，在利用第三方工具自动提取关键词时，如中科院计算所的NLPIR汉语分词系统、腾讯文智中文语义平台、NiuParser中文句法语义分析系统、玻森数据中文语义分析、中科院ICTCLAS等，可根据该第三方工具的词库自动赋予所提取的句子中不同关键词的权重系数(以下称第二权重系数)，具体如下：

关键词A1(名词)的权重系数＝x1

关键词A2(动词)的权重系数＝x2

关键词A3的权重系数(形容词)＝x3

关键词A4(代词)的权重系数＝x4

……

关键词An的权重系数＝xn

(3)根据上述步骤(1)和(2)，可以得出关键词的最终权重系数，即关键词的最终权重系数＝第一权重系数X第二权重系数，如下所示：

关键词A1的权重系数＝x1＊2＝y1

关键词A2的权重系数＝x2＊1.7＝y2

关键词A3的权重系数＝x3＊1.3＝y3

关键词A4的权重系数＝x4＊1＝y4

关键词An的权重系数＝yn

S5：形成同义词库

对步骤S3中提取的关键词进行扩展，形成同义词list，生成相应的同义词库，根据每个同义词与关键词的语义关系，赋予每个关键词的同义词的权重。

具体地，可以采用已有的成熟的第三方工具，如腾讯文智中文语义平台、NiuParser中文句法语义分析系统、玻森数据中文语义分析、中科院ICTCLAS等，以及可采用已有的同义词库算法如word2vec来处理中文语料，但并不局限于此。word2vec是一个将单词转换成向量形式的方法。可以把对文本内容的处理简化为向量空间中的向量运算，计算出向量空间上的相似度，来表示文本语义上的相似度，并自动赋予每个关键词的同义词的权重。

关键词A1及其同义词按权重系数从高到低可定义为：

同义词A1-0(关键词A1)权重系数＝a1z0

同义词A1-1权重系数＝a1z1

同义词A1-2权重系数＝a1z2

同义词A1-3权重系数＝a1z3

……

同义词A1-n权重系数＝a1zn

关键词A2的同义词按权重系数从高到低可定义为：

同义词A2-0(关键词A2)权重系数＝a2z0

同义词A2-1权重系数＝a2z1

同义词A2-2权重系数＝a2z2

同义词A2-3权重系数＝a2z3

同义词A2-4权重系数＝a2z4

……

同义词A2-n权重系数＝a2zn

关键词A3的同义词按权重系数从高到低可定义为：

同义词A3-0(关键词A3)权重系数＝a3z0

同义词A3-1权重系数＝a3z1

同义词A3-2权重系数＝a3z2

同义词A3-3权重系数＝a3z3

……

同义词A3-n权重系数＝a3zn

关键词A4的同义词按权重系数从高到低可定义为：

同义词A4-0(关键词A4)权重系数＝a4z0

同义词A4-1权重系数＝a4z1

同义词A4-2权重系数＝a4z2

同义词A4-3权重系数＝a4z3

……

同义词A4-n权重系数＝a4zn

关键词An的同义词按权重系数从高到低可定义为：

同义词An-0(关键词An)权重系数＝anz0

同义词An-1权重系数＝anz1

同义词An-2权重系数＝anz2

同义词An-3权重系数＝anz3

……

同义词An-n权重系数＝anzn

S6：视频匹配

根据S4得到的关键词和S5得到的关键词的同义词，形成关键词+关键词的同义词库，这些关键词及其同义词共同形成新的关键词库(以下称新关键词库)，并按照关键词和同义词的权重从高到低的顺序，从视频数据库中搜索视频素材库索引，得到相匹配的视频。

具体地，基于S4和S5获得的关键词最终权重及其同义词权重，可获得如下表3所示的矩阵：

表3：关键词及其同义词矩阵

关键词A1	关键词A2	关键词A3	关键词A4	……	关键词An
						同义词A1-0	同义词A2-0	同义词A3-0	同义词A4-0	……	同义词An-0
同义词A1-1	同义词A2-1	同义词A3-1	同义词A4-1	……	同义词An-1
						同义词A1-2	同义词A2-2	同义词A3-2	同义词A4-2	……	同义词An-2
同义词A1-3	同义词A2-3	同义词A3-3	同义词A4-3	……	同义词An-3
						……	……	……	……	……	……
同义词A1-n	同义词A2-n	同义词A3-n	同义词A4-n	……	同义词An-n

相应的新关键词库中的每个关键词的权重分布如下表4所示：

表4：新关键词的权重分布

关键词A1	关键词A2	关键词A3	关键词A4	……	关键词An
						y1*a1z0	y2*a1z0	y3*a1z0	y4*a1z0	……	yn*a1z0
y1*a1z1	y2*a1z1	y3*a1z1	y4*a1z1	……	yn*a1z1
						y1*a1z2	y2*a1z2	y3*a1z2	y4*a1z2	……	yn*a1z2
y1*a1z3	y2*a1z3	y3*a1z3	y4*a1z3	……	yn*a1z3
						……	……	……	……	……	……
y1*a1zn	y2*a1zn	y3*a1zn	y4*a1zn	……	yn*a1zn

这样，可得到每个新关键词在句子中的权重，进而可得到每个新关键词所组成的句子的权重，新关键词库矩阵中的新关键词按照矩阵算法可形成若干个组合，即可形成若干个句子，形成的每个句子的的权重公式＝关键词A1权重值+关键词A2权重值+关键词A3权重值+关键词A4权重值+……+关键词An权重值＝z

根据计算的每个组合的权重结果，按权重值从大往小排列，可生成不同权重值的组合：z1>z2>z3>…..>zn

每个组合在视频数据库中对应相应的标签组合，标签匹配度最高的视频即为匹配视频。即，系统会按照组合形成的新句子的权重值，按照由高到低的顺序在视频数据库中搜索视频，一旦具有较高权重值的句子在视频数据库中被找到，将停止搜寻，否则，则继续搜寻，直到找到与组合中的权重值相匹配的视频为止。

以上描述的是对一个句子的视频匹配方法，当输入多个句子时，可对拆分的每个句子都执行上述方法，即当输入的文字信息包括K个句子(2≦K≦n)，可分别对每个句子K执行上述步骤S1-S6，得到与所述K句子相匹配的视频，按照句子K在文字信息中出现的顺序，将所得到的个与所述K句子相匹配的视频进行连接，并将连接的视频进行显示。本发明对输入的文字信息并没有特别的限制，可以输入任何类型的文字，可以输入1个文字，也可以输入过个文字，可以输入一个段落，也可以输入多个段落，输入多个段落的时候，需要每输入一段进行回车。

具体地，可基于文字段落出现的顺序，对视频进行排序连接，段落中的每个句子对应一个视频，一个文字段落可包括多个句子，因此，可根据句子出现的顺序来将对应的视频进行排序连接。视频可按照电影转场方式来进行连接，最基本的方式是直接连接，也可包括淡入淡出、定格、翻转等。一般，每个文字片段匹配一段影片，没有数量限制，一般来说，获得的视频可以是3-5分钟的影片，也可以是1分钟或1小时的影片。

此外，可对获得视频进行优化处理。

例如，如果对获取的视频(影片)不满足，可以手动在视频素材库中选择，替换原有视频，在视频素材库中可以选择时长、类型、来源、关键词搜索等，找到匹配度更高的视频。又例如，可以对影片进行滤镜、剪辑、录音和添加音乐等处理，主要包括：

(1)视频滤镜处理：设置有高亮、黑白、怀旧、漫画等视频特效，用户点击相应按钮，原始视频的风格即时生成相应的效果。

(2)视频剪辑处理：用户可以添加、删除、移动视频或照片素材；视频可以进行播放区域的裁切、播放时长的裁切，调整视频的播放范围和播放的起始、结束位置；对视频对应的字幕可以做编辑修改。

(3)录音功能：用户跟随画面，即时进行录音，与画面同步。

(4)添加音乐：根据视频，可以选择不同风格的音乐，即时成为视频的背景音乐。

(5)同一人可以对影片进行再编辑(独立作业)，其他人可以对影片进行再编辑(协同作业)。具体地，生成的每部影片都有编辑入口，本人或他人可以对影片进行再编辑。编辑者进入编辑界面后，可以看到影片的原始素材，包括视频片段、字幕、音乐等可编辑的内容对象。编辑者可以做如下的编辑：替换、删除、增加、调整视频片段和相应的字幕；更换或取消音乐；重新配音。编辑者编辑完成后可修改标题和基本信息，提交新的版本。后来的编辑者可以基于任一版本进行修改。也就是说，用户可以基于自己的需求来自定义所合成的视频。

此外，在选择视频上，可以自动选择，也可以自动推介并手动选择，以使得整个影片中的各个视频的风格相接近。可以从服务器侧对视频进行类似的处理。这样，对于同一句话或同一段话，可能会生成多个不同的视频影片，所有生成的视频影片都会被显示，这样会形成浏览量、分享量、点赞量等数据。用户可根据分享量和点赞量来判断所生成的影片的热度值，影片热度值＝分享量+点赞量，这样，可根据影片热度值，可以对所有影片、同一主题的影片、同一类别的影片等做热度排序，筛选出热度值最高的视频为最优视频。需要注意的是，不同用户可对同一个主题的视频进行再编辑，同一主题可能生成不止一个影片，用户可对同一主题的影片可以进行比较，点赞或分享最满意的版本。最满意的版本为同一主题影片中的最优视频。

在本发明中，文字信息可直接输入或者通过语音输入。

具体地，可直接在输入单元中通过相应的输入法输入所需文字信息。或者用户对着输入单元输入语音，处理单元会对输入的语音进行识别，并转化为文字。可采用现有技术中的语音识别技术来对输入的语音进行处理，例如可在处理单元中集成科大讯飞语义平台、百度语音开放平台等的语音识别技术来将用户输入的语音进行识别，并转化为文字，但是并不局限于此。

【实施例】

以下，通过一个示例对发明的基于文字的视频合成方法进行介绍。

本发明以例句“在夏天天热的时候，小公主常常来到这片森林，坐在清凉的水潭边上。”(以下简称例句1)进行说明。

当用户将上述例句1在客户端的输入单元中进行输入后，本发明的视频合成系统会对该例句1进行分析处理，然后生成对应的视频并呈现给用户，具体如下：

步骤1：采用NLPIR汉语分词系统对上述例句1进行拆分，结果如下：

词性拆分结果：

在/p夏天/t天/qt热/a的/ude1时候/n，/wd小/a公主/n常常/d来到/v这/rzv片/q森林/n，/wd坐/v在/p清凉/a的/ude1水潭/n边/k上/n。/wj

分词结果：

在/夏天/天/热/的/时候/，/小/公主/常常/来到/这/片/森林/，/坐/在/清凉/的/水潭/边/上/。/

步骤2：利用玻森中文语义开放平台对上述例句1进行句法分析，分析结果如图3所示。

步骤3：采用NLPIR汉语分词系统提取句子的关键词，关键词提取结果如下(括号中为关键词)：

在(夏天)天热的(时候)，小(公主)常常(来到)这片(森林)，坐在(清凉)的(水潭)边上。

步骤4：根据对例句1的基本词的词性和句法分析结果，利用中科院计算所的NLPIR汉语分词系统对关键词的权重进行分析，分析结果如下表5：

表5：权重分析结果

名称	权重
		水潭	62
清凉	39
		森林	35
公主	32
		常常	24
来到	22
		夏天	21
边上	21
		时候	15
热	8

步骤5：利用word2vec来形成关键词的同义词库，得到同义词库及权重如下表6所示：

表6：同义词库权重分析

步骤6：根据步骤4和步骤5，得到关键词和同义词所组成的若干句子的权重，并按照权重的高低顺序搜索匹配视频，根据计算，最终能与视频素材库匹配的权重系数为：62*0.5046(河)+35(森林)+32*0.4496(女孩)＝80.6724，在视频数据库中搜索到的匹配的视频如图4所示。

以上内容仅为本发明的较佳实施例，对于本领域的普通技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，本说明书内容不应理解为对本发明的限制。

Claims

1.一种基于文字的视频合成方法，其特征在于，所述方法基于输入的文字信息生成相对应的视频，所述文字信息至少包括一个句子，所述方法包括：

步骤1：智能分词

步骤2：句法分析

根据步骤1的分词结果，分析所述若干个基本词之间的关系；

步骤3：关键词提取

步骤4：关键词的权重分析

步骤5：形成同义词库

步骤6：视频匹配和显示

2.根据权利要求1所述的基于文字的视频合成方法，其特征在于，所述文字信息包括K个句子(2≦K≦n)，对每个句子K执行上述步骤1至步骤6，得到与所述K句子相匹配的视频，按照句子K在文字信息中出现的顺序，将所得到的个与所述K句子相匹配的视频进行连接，并将连接的视频进行显示。

3.根据权利要求1或2所述的基于文字的视频合成方法，其特征在于，所述步骤4具体包括：

4.根据权利要求1或2所述的基于文字的视频合成方法，其特征在于，还包括：对获得的视频进行自定义编辑。

5.根据权利要求4所述的基于文字的视频合成方法，其特征在于，所述自定义编辑包括：视频滤镜处理、视频剪辑处理、录音、添加音乐和再编辑处理。

6.根据权利要求5所述的基于文字的视频合成方法，其特征在于，所述再编辑处理包括同一个人对所形成的视频进行再编辑和其他人对所形成的视频进行再编辑。

7.根据权利要求6所述的基于文字的视频合成方法，其特征在于，再编辑处理得到的视频可根据影片热度值来获得最优视频。

8.根据权利要求1或2所述的基于文字的视频合成方法，其特征在于，每个句子形成一个视频。

9.根据权利要求1或2所述的基于文字的视频合成方法，其特征在于，所述文字信息可直接输入或者通过语音输入。

10.一种基于文字的视频合成系统，其特征在于，所述系统包括服务端和至少一个客户端，所述服务端与所述客户端通信连接，所述服务端基于所述客户端输入的文字信息来生成相对应的视频，所述文字信息至少包括一个句子，所述客户端包括输入单元和显示单元，所述服务端包括控制单元以及与所述控制单元连接的数据库和处理单元，

其中，用户通过所述输入单元输入所述文字信息，所述处理单元对所述文字信息进行处理，基于处理的结果，所述控制单元从所述数据库中搜寻相匹配的视频，并将搜索的视频进行合成，得到基于文字信息的合成视频，并将所述合成视频在所述显示单元上进行显示。