CN112291635B - 用于生成多媒体文件的方法、装置、电子设备及存储介质 - Google Patents

用于生成多媒体文件的方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112291635B
CN112291635B CN202011169065.0A CN202011169065A CN112291635B CN 112291635 B CN112291635 B CN 112291635B CN 202011169065 A CN202011169065 A CN 202011169065A CN 112291635 B CN112291635 B CN 112291635B
Authority
CN
China
Prior art keywords
dimension
information display
processed
content
commonality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011169065.0A
Other languages
English (en)
Other versions
CN112291635A (zh
Inventor
揭勇俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jindi Technology Co Ltd
Original Assignee
Beijing Jindi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jindi Technology Co Ltd filed Critical Beijing Jindi Technology Co Ltd
Priority to CN202011169065.0A priority Critical patent/CN112291635B/zh
Publication of CN112291635A publication Critical patent/CN112291635A/zh
Application granted granted Critical
Publication of CN112291635B publication Critical patent/CN112291635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/835Generation of protective data, e.g. certificates
    • H04N21/8352Generation of protective data, e.g. certificates involving content or source identification data, e.g. Unique Material Identifier [UMID]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开的实施例公开了一种用于生成多媒体文件的方法和装置、电子设备以及存储介质,其中的方法包括:获取多个待处理对象的所有信息展示维度;根据所述多个待处理对象的至少一信息展示维度的内容,至少一对信息展示维度分别进行维度共性检测,以确定至少一信息展示维度是否为具有维度共性的信息展示维度;利用一信息展示维度的共性标签更新该信息展示维度的内容;利用所有信息展示维度及其内容,生成多个多媒体单元;针对任一待处理对象,根据该待处理对象所包含的所有信息展示维度及其内容从多媒体单元中选取属于该待处理对象的多媒体单元,并将选取出的所有多媒体单元合成为该待处理对象的多媒体文件。本公开有利于提高多媒体文件的生成效率。

Description

用于生成多媒体文件的方法、装置、电子设备及存储介质
技术领域
本公开涉及多媒体技术,尤其是涉及一种用于生成多媒体文件的方法、用于生成多媒体文件的装置、电子设备以及存储介质。
背景技术
相对于文本的信息传达方式而言,多媒体(如视频)有利于使人们能够更轻松快捷的获取信息。例如,短短的几秒钟或者几十秒钟的多媒体就可以使人们了解一对象的大致情况,例如,一件商品的性能或者一则新闻的内容或者一个地方的历史趣闻等。
不同对象的介绍内容往往各不相同。对于内容提供方而言,如果需要介绍内容的对象的数量较为庞大,则高效的为每一个对象分别生成多媒体文件,是非常重要的。也就是说,如何高效的为每一个对象分别生成多媒体文件,是一个值得关注的技术问题。
发明内容
本公开实施例提供一种用于生成多媒体文件的技术方案,以高效的为每一个待处理对象生成多媒体文件,以提高多媒体文件生成效率。
本公开实施例的一方面,提供一种用于生成多媒体文件的方法,包括:获取多个待处理对象的所有信息展示维度;针对所述所有信息展示维度中的至少一信息展示维度,根据所述多个待处理对象的所述至少一信息展示维度的内容,对所述至少一信息展示维度分别进行维度共性检测,以确定所述至少一信息展示维度是否分别为具有维度共性的信息展示维度;对于任一具有维度共性的信息展示维度,利用该信息展示维度的共性标签更新该信息展示维度的内容,其中,任一具有维度共性的信息展示维度具有至少一个共性标签;利用所述所有信息展示维度及其内容,生成多个多媒体单元,其中,一个信息展示维度根据其不同共性标签对应不同的多媒体单元,所述所有信息展示维度及其内容包括:具有维度共性的信息展示维度及其更新后的内容;针对任一待处理对象,根据该待处理对象所包含的所有信息展示维度及其内容从所述多媒体单元中选取属于该待处理对象的多媒体单元,并将选取出的所有多媒体单元合成为该待处理对象的多媒体文件。
可选地,在本公开任一实施例的方法中,所述根据所述多个待处理对象的所述至少一信息展示维度的内容,对所述至少一信息展示维度分别进行维度共性检测,以确定所述至少一信息展示维度是否分别为具有维度共性的信息展示维度,包括:针对任一信息展示维度,获取所述多个待处理对象的该信息展示维度的内容中的有效内容;针对任一信息展示维度,对所述多个待处理对象的该信息展示维度的有效内容进行共性提取处理,根据所述共性提取处理的结果,确定该信息展示维度是否为具有维度共性的信息展示维度。
可选地,在本公开任一实施例的方法中,所述获取所述多个待处理对象的该信息展示维度的内容中的有效内容,包括:对所述多个待处理对象的所有信息展示维度的内容分别进行预处理;对所述预处理后的各内容分别进行分词处理,获得各信息展示维度的内容中的各内容单元;针对任一待处理对象的任一信息展示维度,从该待处理对象的该信息展示维度的各内容单元中,确定该待处理对象的该信息展示维度的有效内容单元;其中,所述有效内容单元被作为所述有效内容。
可选地,在本公开任一实施例的方法中,所述从该待处理对象的该信息展示维度的各内容单元中,确定该待处理对象的该信息展示维度的有效内容单元,包括:获取该待处理对象的该信息展示维度的所有内容单元各自对应的词频对及其权重;将权重最高的预定数量的词频对作为该待处理对象的该信息展示维度的内容中的有效内容单元。
可选地,在本公开任一实施例的方法中,所述从该待处理对象的该信息展示维度的各内容单元中,确定该待处理对象的该信息展示维度的有效内容单元,包括:根据该待处理对象的该信息展示维度的各内容单元,确定该待处理对象的该信息展示维度的内容的主题矩阵,其中,所述主体矩阵包括至少一个矩阵元素;其中,所述主题矩阵中的各矩阵元素被作为该待处理对象的该信息展示维度的有效内容单元。
可选地,在本公开任一实施例的方法中,所述对所述多个待处理对象的该信息展示维度的有效内容进行共性提取处理,根据所述共性提取处理的结果,确定该信息展示维度是否为具有维度共性的信息展示维度,包括:对所述多个待处理对象的该信息展示维度的有效内容进行聚类处理,获得多个类簇;若所述多个类簇的数量满足预定条件,则确定该信息展示维度为具有维度共性的信息展示维度,否则,确定该信息展示维度为不具有维度共性的信息展示维度。
可选地,在本公开任一实施例的方法中,所述利用所述所有信息展示维度及其内容,生成多个多媒体单元,包括:针对任一信息展示维度,利用该信息展示维度及其内容,生成多个音频数据,其中,一个信息展示维度根据其不同共性标签对应不同的音频数据;针对任一信息展示维度,根据该信息展示维度及其内容,利用该信息展示维度对应的画面帧模板,生成该信息展示维度的画面帧;针对任一信息展示维度,将该信息展示维度的音频数据与该信息展示维度的画面帧合并为该信息展示维度的多媒体单元。
可选地,在本公开任一实施例的方法中,所述将该信息展示维度的音频数据与该信息展示维度的画面帧合并为该信息展示维度的多媒体单元,包括:根据该信息展示维度及其内容形成该信息展示维度对应的字幕;将所述字幕设置于该信息展示维度的画面帧中的预定位置处;根据该信息展示维度的音频数据的播放时间长度以及预设帧率,调整该信息展示维度的画面帧的数量;将该信息展示维度的音频数据与该信息展示维度的数量调整后的画面帧合并为该信息展示维度的多媒体单元。
可选地,在本公开任一实施例的方法中,所述将选取出的所有多媒体单元合成为该待处理对象的多媒体文件,包括:根据多媒体单元预定排列顺序,对选取出的所有多媒体单元进行拼接处理,获得该待处理对象的中间多媒体文件;对该待处理对象的中间多媒体文件进行后处理,获得该待处理对象的多媒体文件;其中,所述后处理包括:播放速率调整处理,和/或,文件格式转换处理。
本公开实施例的另一方面,提供一种用于生成多媒体文件的装置,包括:获取展示维度模块,用于获取多个待处理对象的所有信息展示维度;确定维度共性模块,用于针对所述所有信息展示维度中的至少一信息展示维度,根据所述多个待处理对象的所述至少一信息展示维度的内容,对所述至少一信息展示维度分别进行维度共性检测,以确定所述至少一信息展示维度是否分别为具有维度共性的信息展示维度;更新维度内容模块,用于对于任一具有维度共性的信息展示维度,利用该信息展示维度的共性标签更新该信息展示维度的内容,其中,任一具有维度共性的信息展示维度具有至少一个共性标签;生成媒体单元模块,用于利用所述所有信息展示维度及其内容,生成多个多媒体单元,其中,一个信息展示维度根据其不同共性标签对应不同的多媒体单元,所述所有信息展示维度及其内容包括:具有维度共性的信息展示维度及其更新后的内容;合成媒体文件模块,用于针对任一待处理对象,根据该待处理对象所包含的所有信息展示维度及其内容从所述多媒体单元中选取属于该待处理对象的多媒体单元,并将选取出的所有多媒体单元合成为该待处理对象的多媒体文件。
可选地,在本公开任一实施例的装置中,确定维度共性模块包括:获取有效内容子模块,用于针对任一信息展示维度,获取所述多个待处理对象的该信息展示维度的内容中的有效内容;共性提取子模块,用于针对任一信息展示维度,对所述多个待处理对象的该信息展示维度的有效内容进行共性提取处理,根据该共性提取处理的结果,确定该信息展示维度是否为具有维度共性的信息展示维度。
可选地,在本公开任一实施例的装置中,所述生成媒体单元模块包括:生成音频子模块,用于针对任一信息展示维度,利用该信息展示维度及其内容,生成多个音频数据,其中,一个信息展示维度根据其不同共性标签对应不同的音频数据;生成画面帧子模块,用于针对任一信息展示维度,根据该信息展示维度及其内容,利用该信息展示维度对应的画面帧模板,生成该信息展示维度的画面帧;合并子模块,用于针对任一信息展示维度,将该信息展示维度的音频数据与该信息展示维度的画面帧合并为该信息展示维度的多媒体单元。
本公开实施例的又一个方面,提供一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现本公开上述任一实施例所述的用于生成多媒体文件的方法。
本公开实施例的再一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现本公开上述任一实施例所述的用于生成多媒体文件的方法。
基于本公开上述实施例提供的用于生成多媒体文件的方法和装置、电子设备和存储介质,通过对至少一信息展示维度分别进行维度共性检测,可以获得具有维度共性的信息展示维度;对于具有维度共性的信息展示维度,本公开通过利用该信息展示维度的各共性标签来更新该信息展示维度的内容,从而在利用所有信息展示维度及其内容生成多个多媒体单元时,不仅有利于在较大程度上减少多媒体单元的生成数量,而且有利于避免含义相同信息却采用了多种不同表达方式的现象;通过从生成的多媒体单元中选取属于一待处理对象的各多媒体单元,并利用选取出的所有多媒体单元合成该待处理对象的多媒体文件,不仅有利于便捷的形成所有待处理对象的多媒体文件,而且有利于避免不同多媒体文件使用不同的多媒体单元来表示含义相同信息,而给多媒体文件的浏览者带来困惑的现象。由此可知,本公开实施例有利于提高多媒体文件的生成效率,且有利于提高多媒体文件的规范性。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同描述一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1为本公开实施例的用于生成多媒体文件的方法一实施例的流程图。
图2为本公开实施例的维度共性检测过程一实施例的流程图。
图3为本公开实施例的获取信息展示维度的有效内容的一实施例的流程图。
图4为本公开实施例的生成多个多媒体单元的一实施例的流程图。
图5为本公开实施例的生成一信息展示维度的多媒体单元一实施例的流程图。
图6为本公开实施例的合成为一待处理对象的多媒体文件一实施例的流程图。
图7为本公开用于生成多媒体文件的装置另一个实施例的结构示意图。
图8为本公开电子设备一个应用实施例的结构示意图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
图1为本公开的用于生成多媒体文件的方法一个实施例的流程图。如图1所示,该实施例的用于生成多媒体文件的方法包括下述步骤:
S100、获取多个待处理对象的所有信息展示维度。
本公开中的待处理对象可以是指需要对其进行说明或者介绍的对象。待处理对象的具体表现形式通常与本公开的方法所适用的实际领域相关。例如,在本公开的方法适用于公司信息查询领域时,待处理对象可以为需要说明或者介绍的公司。再例如,在本公开的方法适用于产品销售领域时,待处理对象可以为需要说明或者介绍的产品。本公开对待处理对象的具体表现形式不作限定。
本公开中的信息展示维度可以认为是用于描述待处理对象的角度,也可以认为是用于描述待处理对象的信息项。在通常情况下,往往需要从多个不同的信息展示维度来描述一个待处理对象,即一个待处理对象通常包含多个信息展示维度。例如,假设待处理对象为一公司,则本公开可以从公司名称、公司法人、公司注册地址、公司注册时间、公司人员规模以及公司经营范围等多个信息展示维度来描述该待处理对象。
需要特别说明的是,一个待处理对象所包含的所有信息展示维度与另一个待处理对象所包含的所有信息展示维度可以不完全相同,一个待处理对象所包含的所有信息展示维度与另一个待处理对象所包含的所有信息展示维度也可以完全相同。每一个待处理对象所包含的所有信息展示维度可以由待处理对象的自身属性(如是否为子公司、是否属于特殊行业的公司)等决定。
本公开可以通过汇总多个待处理对象各自包含的所有信息展示维度,获得多个待处理对象的所有信息展示维度。多个待处理对象的所有信息展示维度可以形成信息展示维度集合。也就是说,所有待处理对象的信息展示维度均应属于该信息展示维度集合。本公开可以根据所有待处理对象各自的自身属性等因素,来确定信息展示维度集合所应包含的信息展示维度。本公开对信息展示维度集合所包含的信息展示维度的具体表现形式不作限定。
S101、针对上述所有信息展示维度中的至少一信息展示维度,根据多个待处理对象的该至少一信息展示维度的内容,对该至少一信息展示维度分别进行维度共性检测,以确定该至少一信息展示维度是否分别为具有维度共性的信息展示维度。
本公开可以对所有信息展示维度分别进行维度共性检测处理,也可以对所有信息展示维度中的部分信息展示维度(如其中一个或者两个信息展示维度)分别进行维度共性检测处理。对于任一信息展示维度而言,该信息展示维度是否具有维度共性通常是由所有待处理对象的该信息展示维度的内容决定的。
本公开中的信息展示维度的内容可以认为是信息展示维度的取值。这里的取值可以包括文本形式以及图片形式中的至少一种。其中的文本可以包括文字以及数字等。对于任一信息展示维度而言,两个不同的待处理对象的该信息展示维度的内容可以完全相同,也可以完全不相同,还可以部分相同。
本公开的维度共性检测可以是指用于确定多个待处理对象在一信息展示维度上的取值所存在的共同点是否合规的检测。针对一信息展示维度而言,本公开可以预先针对该信息展示维度设置条件,从而可以根据多个待处理对象的该信息展示维度的内容,判断内容的共同点是否符合该条件,以确定该信息展示维度是否为具有维度共性的信息展示维度。例如,对于一信息展示维度而言,如果多个待处理对象的该信息展示维度的内容的共同点符合该条件,则确定该信息展示维度为具有维度共性的信息展示维度,否则确定该信息展示维度不为具有维度共性的信息展示维度。
S102、对于任一具有维度共性的信息展示维度,利用该信息展示维度的共性标签更新该信息展示维度的内容。
本公开中的任一具有维度共性的信息展示维度具有至少一个共性标签。本公开中的共性标签可以是指能够概括两个或者更多待处理对象的同一信息展示维度的所有内容中的多个内容(如所有内容或者部分内容)的标签。具有维度共性的任一信息展示维度均可以具有多个共性标签,例如,假设第一信息展示维度是N(N为大于2的正整数)个待处理对象的所有信息展示维度中的一信息展示维度,假设第一信息展示维度具有两个共性标签,其中一个共性标签为:能够概括N个待处理对象中的前n(n为小于N的正整数)个待处理对象的第一信息展示维度的所有内容的第一标签,其中另一个共性标签为:能够概括N个待处理对象中的后N-n个待处理对象的第一信息展示维度的所有内容的第二标签。
对于任一具有维度共性的信息展示维度而言,本公开可以利用该信息展示维度的共性标签替换多个待处理对象中的该信息展示维度的内容。续前例,前n个待处理对象的第一信息展示维度的内容均被替换为第一标签,后N-n个待处理对象的第一信息展示维度的内容均被替换为第二标签。
本公开可以利用FastText(快速文本)模型等,为具有维度共性的信息展示维度的内容设置共性标签,例如,利用FastText模型为具有维度共性的公司人员规模这一信息展示维度的内容设置“0-10人”、“10-100人”、“100-500人”以及“大于500人”,这四个共性标签。再例如,利用FastText模型为具有维度共性的经营范围这一信息展示维度的内容设置的共性标签可以包括但不限于:技术服务、水污染治理、货物进出口、装卸搬运、服装批发、停车场经营、销售软件产品、商品零售贸易、技术进出口、教育咨询以及佣金代理等等。另外,本公开也可以将预置共性标签作为具有维度共性的信息展示维度的内容的共性标签,例如,可以预先设置共性标签集合,在一个信息展示维度具有维度共性时,可以根据该信息展示维度的内容,从共性标签集合中选取相应的共性标签,并将选取出的共性标签作为具有维度共性的信息展示维度的内容的共性标签。本公开不限制设置共性标签的具体实现方式。
S103、利用所有信息展示维度及其内容,生成多个多媒体单元。
在本申请中的所有信息展示维度均为具有维度共性的信息展示维度的情况下,本申请中的所有信息展示维度及其内容包括:具有维度共性的所有信息展示维度及其更新后的内容。在本申请中的所有信息展示维度包括:具有维度共性的信息展示维度和不具有维度共性的信息展示维度的情况下,本申请中的所有信息展示维度及其内容包括:具有维度共性的信息展示维度及其更新后的内容、以及不具有维度共性的信息展示维度及其初始内容。
对于任一信息展示维度而言,该信息展示维度根据其不同共性标签对应不同的多媒体单元,即该信息展示维度在具有不同共性标签时,对应不同的多媒体单元。续前例,第一信息展示维度和第一标签对应一个多媒体单元,第一信息展示维度和第二标签对应另一个多媒体单元。本公开中的多媒体单元可以被播放,且在播放多媒体单元时,通常会呈现相应的画面及声音。其中的画面通常是基于预先设置的面面背景、信息展示维度及其内容形成的。其中的声音通常是基于信息展示维度及其内容形成的,也可以是基于背景音、信息展示维度及其内容形成的。
本公开中的多媒体单元也可以称为富媒体单元。本公开的多媒体单元可以认为是多媒体文件的组成单元,且一个多媒体单元可以认为是一个视频段或者一个视频单元,即一个多媒体单元可以包括多个视频帧。
本公开中的一个信息展示维度通常对应有多个多媒体单元。一个信息展示维度所对应的多媒体单元的数量通常与该信息展示维度的内容(利用共性标签更新后的信息展示维度的内容)的数量相关。例如,假设一信息展示维度的内容的数量为a(a为大于0的整数),则该信息展会上维度可以对应有a个多媒体单元。
本公开生成的所有多媒体单元可以形成多媒体单元集合。各待处理对象的多媒体文件均由该多媒体单元集合中的多媒体单元形成。本公开可以利用现有的多种用于生成视频的工具形成多媒体单元。本公开对生成多媒体单元的具体过程不作限定。
S104、针对任一待处理对象,根据该待处理对象所包含的所有信息展示维度及其内容从多媒体单元中选取属于该待处理对象的多媒体单元,并将选取出的所有多媒体单元合成为该待处理对象的多媒体文件。
本公开在从多媒体单元集合中,选取出属于一待处理对象的所有多媒体单元之后,可以按照预定顺序(即预先设定的信息展示维度的排列顺序,例如,公司法人和公司高管信息应设置在公司名称之后等)对选取出的所有多媒体单元进行排序,并利用视频拼接等工具,对顺序排列的所有多媒体单元进行拼接处理,从而形成该待处理对象的多媒体文件。
本公开通过对至少一信息展示维度分别进行维度共性检测,可以获得具有维度共性的信息展示维度;对于具有维度共性的信息展示维度,本公开通过利用该信息展示维度的各共性标签来更新该信息展示维度的内容,从而在利用所有信息展示维度及其内容生成多个多媒体单元时,不仅有利于在较大程度上减少多媒体单元的生成数量,而且有利于避免含义相同信息却采用了多种不同表达方式的现象;通过从生成的多媒体单元中选取属于一待处理对象的各多媒体单元,并利用选取出的所有多媒体单元合成该待处理对象的多媒体文件,不仅有利于便捷的形成所有待处理对象的多媒体文件,而且有利于避免不同多媒体文件使用不同的多媒体单元来表示含义相同信息,而给多媒体文件的浏览者带来困惑的现象。由此可知,本公开实施例有利于提高多媒体文件的生成效率,且有利于提高多媒体文件的规范性。
本公开实施例提供的任一种用于生成多媒体文件的方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备、服务器、或者设置于终端设备和服务器之间的网络设备等。终端设备、服务器或者网络设备中的处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种用于生成多媒体文件的方法。下文不再赘述。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
在一个可选示例中,本公开的维度共性检测过程的一个例子如图2所示。
图2中,S200、针对任一信息展示维度,获取多个待处理对象的该信息展示维度的内容中的有效内容。
可选的,本公开可以从相应集合中,获取所有待处理对象的信息展示维度的内容。本公开的所有待处理对象的所有信息展示维度的内容可以存储于一数据集合中,也可以存储于多个数据集合中。例如,所有待处理对象的前m(m为大于1的整数)个信息展示维度的内容均存储在第一数据库中,所有待处理对象的中间m(m为大于1的整数)个信息展示维度的内容均存储在第二数据库中,所有待处理对象的后m(m为大于1的整数)个信息展示维度的内容均存储在第三数据库中。本公开不限制所有待处理对象的所有信息展示维度的内容的存储方式。
可选的,本公开中的有效内容可以是指用于表征信息展示维度的概要内容的信息。本公开中的有效内容也可以是指信息展示维度的内容中的重要信息。
可选的,本公开可以通过对信息展示维度的内容进行概要内容提取或者重要内容提取等处理,获得信息展示维度的有效内容。本公开获取信息展示维度的有效内容的一个例子可以参见下述针对图3的描述,在此不再详细说明。
S201、针对任一信息展示维度,对上述多个待处理对象的该信息展示维度的有效内容进行共性提取处理。
可选的,本公开中的共性提取处理可以是指对于任一信息展示维度而言,用于将所有待处理对象的该信息展示维度的所有内容划分为一个或者多个组的处理,其中任一组中的所有内容存在共同特点。
可选的,对于任一信息展示维度而言,可能会存在该信息展示维度的所有内容存在多个共同特点的现象,例如,该信息展示维度的前x1(x1为大于1的整数)个内容存在第一共同特点,该信息展示维度的中间x2(x2为大于1的整数)个内容存在第二共同特点,该信息展示维度的后x3(x3为大于1的整数)个内容存在第三共同特点。当然,也可能会存在该信息展示维度的一内容不与该信息展示维度的其他任何一内容存在共同特点的可能性。
S202、根据上述共性提取处理的结果,确定该信息展示维度是否为具有维度共性的信息展示维度。
可选的,本公开可以预先针对共性提取设置相应条件,如果针对一信息展示维度的共性提取处理的结果符合预先设置的相应条件,则可以确定该信息展示维度为具有维度共性的信息展示维度,如果针对一信息展示维度的共性提取处理的结果不符合预先设置的相应条件,则可以确定该信息展示维度不为具有维度共性的信息展示维度。
本公开通过获取所有待处理对象的信息展示维度的内容中的有效内容,有利于消除部分信息展示维度的内容对共性提取处理的影响,从而有利于提高共性提取处理的准确性。本公开通过对所有待处理对象的一信息展示维度的内容进行共性提取处理,有利于较为明确的区分出具有维度共性的信息展示维度以及不具有维度共性的信息展示维度。
在一个可选示例中,本公开的获取信息展示维度的内容的有效内容的一个例子如图3所示。
S300、对多个待处理对象的所有信息展示维度的内容分别进行预处理。
可选的,本公开的预处理可以是指用于将信息展示维度的内容处理为干净数据/规范化数据的过程。预处理可以为数据清洗处理等。例如,本公开可以对所有待处理对象的信息展示维度的内容分别进行数据一致性处理、无效值处理、缺失值处理以及去冗余处理等数据清洗处理,从而可以获得清洗干净的信息展示维度的内容。本公开对预处理的具体表现形式不作限定。
S301、对预处理后的各内容分别进行分词处理,获得各信息展示维度的内容中的各内容单元。
可选的,本公开中的信息展示维度的内容通常可以包括多个字符,例如,在信息展示维度为经营范围的情况下,信息展示维度可以包括50个字符或者更多数量的字符。本公开可以将预处理后的一信息展示维度的内容作为一个整体,并采用分词工具(如结巴分词工具)等方法,对该信息展示维度的内容进行基于词的切分处理,从而获得预处理后的该信息展示维度的内容所包括的一个或者多个内容单元,即根据分词处理的结果获得该信息展示维度的内容中的各内容单元。
可选的,本公开中的内容单元可以认为是信息展示维度的内容中的一项。例如,经营范围这一信息展示维度的内容至少包括:投资管理、投资咨询以及资产管理,这三项。投资管理、投资咨询以及资产管理均为内容单元。
S302、针对任一待处理对象的任一信息展示维度,从该待处理对象的该信息展示维度的各内容单元中,确定该待处理对象的该信息展示维度的有效内容单元。
可选的,本公开中的有效内容单元可以被作为有效内容,因此,本公开中的有效内容单元同样可以是指用于表征信息展示维度的概要内容的信息,本公开中的有效内容单元也可以是指信息展示维度的内容中的重要信息。
可选的,本公开可以采用多种方式确定有效内容单元。下面举两个具体的例子进行说明。
第一个例子,本公开可以利用权重获得信息展示维度的内容中的有效内容单元。具体的,对于任一待处理对象的任一信息展示维度而言,本公开可以先利用TF-IDF(TermFrequency–Inverse Document Frequency,词频-逆文本频率指数)等算法,获取该待处理对象的该信息展示维度的所有内容单元各自对应的词频对以及各词频对的权重,然后,本公开可以按照获得的各词频对的权重由大到小的顺序,对各词频对进行排序,并将排序在先的预定数量的词频对作为该待处理对象的该信息展示维度的内容中的有效内容单元,也就是说,将权重最高的预定数量的词频对作为该待处理对象的该信息展示维度的内容中的有效内容单元。
第二个例子,本公开可以利用主题矩阵获得信息展示维度的内容中的有效内容单元。具体的,对于任一待处理对象的任一信息展示维度而言,本公开可以先利用LDA(LatentDirichlet Allocation,隐含狄利克雷分布)等模型,获取该待处理对象的该信息展示维度的内容的主题矩阵,例如,将该待处理对象的该信息展示维度的各内容单元作为模型输入提供给LDA模型,从而根据LDA模型的输出获得该待处理对象的该信息展示维度的内容的主题矩阵;之后,本公开可以将获得的该主题矩阵中的各矩阵元素均作为该待处理对象的该信息展示维度的有效内容单元。
本公开通过对所有待处理对象的信息展示维度的内容进行预处理,有利于消除信息展示维度的一些内容(如不干净内容或者冗余内容等)对共性提取处理的不良影响,从而有利于提高共性提取处理的准确性。
在一个可选示例中,对于任一信息展示维度而言,本公开可以采用聚类的方式,来实现对所有待处理对象的预处理后的该信息展示维度的内容进行共性提取处理。具体的,对于任一信息展示维度而言,本公开可以对所有待处理对象的预处理后的该信息展示维度的内容进行聚类处理,从而可以获得多个类簇;每一个类簇所包含的所有该信息展示维度的内容可以认为是具有共性的内容。本公开可以使用多种聚类算法进行聚类处理,本公开对此不作限定。
可选的,在共性提取处理为聚类处理的情况下,本公开中的预先设置的相应条件可以为针对类簇的数量设置的预定条件,即如果针对一信息展示维度的聚类处理获得的所有类簇的数量满足预定条件(如小于等于预定数量等),则确定该信息展示维度为具有维度共性的信息展示维度,如果针对一信息展示维度的聚类处理获得的所有类簇的数量不满足预定条件(如大于预定数量等),则确定该信息展示维度为不具有维度共性的信息展示维度。
本公开通过对所有待处理对象的预处理后的一信息展示维度的内容进行聚类处理,有利于客观的衡量具有维度共性的信息展示维度以及不具有维度共性的信息展示维度,从而有利于提高确定具有维度共性的信息展示维度的准确性。
在一个可选示例中,本公开利用所有信息展示维度及其内容,生成多个多媒体单元的一个例子如图4所示。
图4中,S400、针对任一信息展示维度,利用该信息展示维度以及内容,生成多个音频数据。
可选的,本公开可以将一信息展示维度及其内容作为用于生成音频的接口的输入参数,从而根据该接口的返回,获得多个音频数据。一个音频数据可以认为是一个音频文件。
对于一信息展示维度而言,针对该信息展示维度及其内容所生成的音频文件的数量通常与该信息展示维度的内容的数量相关。例如,如果一信息展示维度具有i个不同的内容,则本公开针对该信息展示维度和每一个内容均生成一音频文件,从而获得i个音频文件。更具体的例子,如果一个信息展示维度具有j个共性标签,则本公开可以针对该信息展示维度和每一个共性标签分别生成一音频文件,从而获得j个音频文件。
需要特别说明的是,本公开可以在维度共性检测前,根据所有的信息展示维度及其内容,生成多个音频数据,并在维度共性检测后,根据具有维度共性的信息展示维度及其共性标签,生成多个音频数据。本公开也可以在利用共性标签更新相应的信息展示维度的内容之后,根据所有的信息展示维度及其内容,生成多个音频数据,该方式有利于避免执行一些音频数据的生成过程。
S401、针对任一信息展示维度,根据该信息展示维度及其内容,利用该信息展示维度对应的画面帧模板,生成该信息展示维度的画面帧。
可选的,本公开中的画面帧模板可以认为是背景模板。一个信息展示维度可以对应多个画面帧模板,不同画面帧模板可以对应类型信息展示维度的不同内容。也就是说,本公开可以对信息展示维度的内容进行分类,信息展示维度的一类内容对应一个画面帧模板。信息展示维度的不同类别的内容对应不同的画面帧模板。本公开可以根据实际需求对信息展示维度的内容进行分类。
可选的,对于任一信息展示维度的任一内容而言,本公开可以先确定该信息展示维度的该内容所属的类别,并根据该类别确定该信息展示维度及其内容所对应的画面帧模板;然后,利用该画面帧模板、该信息展示维度及其内容,生成该信息展示维度的画面帧。即本公开基于相应的画面帧模板的预定格式,将信息展示维度及其内容填充在该画面帧模板中,从而形成该信息展示维度的画面帧。
可选的,本公开中的信息展示维度的画面帧可以为视频帧或位图图像等。本公开可以预先针对每一个信息展示维度设置至少一画面帧模板。画面帧模板通常预先为信息展示维度及其内容设置了相应的画面风格以及信息/图片元素填充位置等。这里的图片元素可以包括名片以及装饰图案等。在一个例子中,上述名片可以为法人名片或者最终受益人名片等。
可选的,本公开可以先对信息展示维度的画面帧模板进行图片离散化,从而获得多个画面帧模板,并基于相应的画面帧模板的预定格式,将信息展示维度及其内容填充在多个画面帧模板中,从而形成该信息展示维度的画面帧。
S402、针对任一信息展示维度,将该信息展示维度的音频数据与该信息展示维度的画面帧合并为该信息展示维度的多媒体单元。
可选的,本公开可以利用用于匹配音轨与画面的工具,将一信息展示维度的音频数据与该信息展示维度的所有画面帧合并为声音与画面同步的多媒体单元。
本公开利用信息展示维度以及内容(包括更新后的内容),不仅可以便捷的生成相应的音频数据,而且有利于降低生成的音频数据的数量,从而有利于提高生成音频数据的效率,进而有利于提高多媒体单元的生成效率。
在一个可选示例中,本公开生成一信息展示维度的多媒体单元的一个例子如图5所示。
图5中,S500、对于任一信息展示维度,根据该信息展示维度及其内容形成该信息展示维度对应的字幕。
可选的,本公开可以采用将信息展示维度及其内容结合的方式,获得信息展示维度的字幕。在信息展示维度及其内容结合的过程中,可以在信息展示维度及其内容之间或者内容之后添加定语、连词、语气助词以及结构助词等,从而使字幕更符合多媒体文件浏览者的浏览习惯。例如,假定一信息展示维度为“经营范围”,且该信息展示维度的内容为“投资管理”和“资产管理”,则该信息展示维度对应的字幕可以为“公司经营范围包括:投资管理以及资产管理等”。
S501、将上述字幕设置于该信息展示维度的画面帧中的预定位置处。
可选的,本公开预先针对由信息展示维度及其内容所形成的字幕,在画面帧中的位置进行设置,且本公开可以对字幕的字体、字体大小以及字体颜色等均有相应的设置。本公开可以基于预先设置在画面帧中设置字幕。
S502、根据该信息展示维度的音频数据的播放时间长度以及预设帧率,调整该信息展示维度的画面帧的数量。
可选的,本公开调整信息展示维度的画面帧的数量的目的包括:使信息展示维度的音频数据的播放时间长度与该信息展示维度的画面帧的播放时间长度基本相同。本公开中的预设帧率可以是指画面帧在单位时间内连续出现的显示屏幕上的频率。预设帧率可以具体为画面帧在每一秒钟内连续出现在显示屏幕上的数量。本公开中的预设帧率的大小通常是根据播放多媒体文件的应用程序(如视频播放工具等应用程序)的实际情况设置的。
可选的,本公开可以通过增加画面帧或者减少画面帧的方式,调整信息展示维度的画面帧的数量。例如,假设一信息展示维度的音频数据的播放时间长度为a1秒,且预设帧率为a2帧/秒,则该信息展示维度所需的画面帧的数量为a1与a2的乘积a3,如果该信息展示维度所对应的画面帧的数量小于a3,则应通过增加画面帧的方式,使该信息展示维度所对应的画面帧的数量为a3;如果该信息展示维度所对应的画面帧的数量大于a3,则应通过减少画面帧的方式,使该信息展示维度所对应的画面帧的数量为a3。
S503、将该信息展示维度的音频数据与该信息展示维度的数量调整后的画面帧合并为该信息展示维度的多媒体单元。
可选的,本公开可以利用用于匹配音轨与画面的工具,将一信息展示维度的音频数据与该信息展示维度的所有画面帧合并为声音与画面同步的多媒体单元。
本公开通过为画面帧设置字幕,并基于音频数据的播放时间长度以及预设帧率调整画面帧的数量,有利于使信息展示维度的多媒体单元中的字幕和声音分别与画面同步,从而有利于提高多媒体单元的质量。
在一个可选示例中,本公开将选取出的所有多媒体单元合成为一待处理对象的多媒体文件的一个例子如图6所示。
图6中,S600、针对任一待处理对象,根据多媒体单元预定排列顺序,对基于该待处理对象选取出的所有多媒体单元进行拼接处理,获得该待处理对象的中间多媒体文件。
可选的,本公开中的多媒体单元预定排列顺序可以是根据信息展示维度的实际展示需求设置的。例如,在本公开的方法适用于公司信息查询领域,且待处理对象为需要说明或者介绍的公司的情况下,多媒体单元预定排列顺序可以为:首先是公司名称,其次是公司法人,再次为公司性质,再次为公司注册时间,再次为公司注册地址,再次为公司经营范围……等等。本公开不限制多媒体单元预定排列顺序。
可选的,本公开在按照多媒体单元预定排列顺序,对选取出的属于同一待处理对象的所有多媒体单元进行顺序排列后,可以利用视频拼接等工具对顺序排列的所有多媒体单元进行拼接处理,从而可以将视频拼接工具等的拼接处理结果作为该待处理对象的中间多媒体文件。本公开的中间多媒体文件可以认为是待处理多媒体文件,即中间多媒体文件是多媒体文件,且是需要进行进一步处理的多媒体文件。
S601、对该待处理对象的中间多媒体文件进行后处理,获得该待处理对象的多媒体文件。
可选的,本公开中的后处理可以包括:播放速率调整处理以及文件格式转换处理中的至少一个。其中的播放速率调整处理可以是指用于调整中间多媒体文件的播放倍速的处理,例如,播放速率调整处理可以为两倍速调整处理或者三倍速调整处理等M(M为小数或者整数)倍速调整处理。其中的文件格式转换处理可以是指用于改变中间多媒体文件的文件格式的处理。例如,文件格式转换处理可以为文件压缩处理等。
一个更具体的例子,假设本公开的中间多媒体文件的文件格式为MPEG(MovingPicture Experts Group,动态图像专家组),本公开先对中间多媒体文件进行M倍速调整处理,倍速调整处理后的多媒体文件的音频播放效果应接近人类说话的正常语速;之后,本公开可以对倍速调整处理后的多媒体文件进行文件格式转换处理,使倍速调整处理后的多媒体文件的文件格式由MPEG格式转换为rar等压缩格式,从而有利于降低待处理对象的多媒体文件所需的存储空间。本公开的后处理可以根据实际需求设置,本公开不限制后处理的具体表现形式。本公开最终形成的待处理对象的多媒体文件可以是待处理对象的秒懂视频。
本公开通过基于多媒体单元预定排列顺序,对一待处理对象的选取出的所有多媒体单元进行拼接处理以及后处理,有利于优化待处理对象的多媒体文件,从而有利于为多媒体文件的浏览者提供较好的用户体验。
图7为本公开的用于生成多媒体文件的装置一个实施例的结构示意图。该实施例的用于生成多媒体文件的装置可用于实现本公开上述各用于生成多媒体文件的方法实施例。
图7所示的实施例的装置包括:获取展示维度模块700、确定维度共性模块701、更新维度内容模块702、生成媒体单元模块703以及合成媒体文件模块704。
获取展示维度模块700用于获取多个待处理对象的所有信息展示维度。
确定维度共性模块701用于针对获取展示维度模块700获取到的所有信息展示维度中的至少一信息展示维度,根据多个待处理对象的至少一信息展示维度的内容,对至少一信息展示维度分别进行维度共性检测,以确定至少一信息展示维度是否分别为具有维度共性的信息展示维度。
更新维度内容模块702用于对于确定维度共性模块701确定出的任一具有维度共性的信息展示维度,利用该信息展示维度的共性标签更新该信息展示维度的内容,其中,任一具有维度共性的信息展示维度具有至少一个共性标签。
生成媒体单元模块703用于利用经过更新维度内容模块702更新处理后的所有信息展示维度及其内容,生成多个多媒体单元,其中,一个信息展示维度根据其不同共性标签对应不同的多媒体单元,其中的所有信息展示维度及其内容包括:具有维度共性的信息展示维度及其更新后的内容。
合成媒体文件模块704用于针对任一待处理对象,根据该待处理对象所包含的所有信息展示维度及其内容从生成媒体单元模块703生成的所有多媒体单元中选取属于该待处理对象的多媒体单元,并将选取出的所有多媒体单元合成为该待处理对象的多媒体文件。
在一个可选示例中,本公开的确定维度共性模块701可以包括:获取有效内容子模块7011和共性提取子模块7012。其中的获取有效内容子模块7011用于针对获取展示维度模块700获取到的任一信息展示维度,获取多个待处理对象的该信息展示维度的内容中的有效内容。其中的共性提取子模块7012,用于针对获取展示维度模块700获取到的任一信息展示维度,对获取有效内容子模块7011获取到的多个待处理对象的该信息展示维度的有效内容进行共性提取处理,根据共性提取处理的结果,确定该信息展示维度是否为具有维度共性的信息展示维度。
在一个可选示例中,获取有效内容子模块7011可以先对多个待处理对象的所有信息展示维度的内容分别进行预处理;之后,获取有效内容子模块7011可以对预处理后的各内容分别进行分词处理,获得各信息展示维度的内容中的各内容单元;最后,针对任一待处理对象的任一信息展示维度,获取有效内容子模块7011从该待处理对象的该信息展示维度的各内容单元中,确定该待处理对象的该信息展示维度的有效内容单元。其中的有效内容单元被作为有效内容。
在一个可选示例中,针对任一待处理对象的任一信息展示维度,获取有效内容子模块7011可以获取该待处理对象的该信息展示维度的所有内容单元各自对应的词频对及其权重,并将权重最高的预定数量的词频对作为该待处理对象的该信息展示维度的内容中的有效内容单元。
在一个可选示例中,针对任一待处理对象的任一信息展示维度,获取有效内容子模块7011可以根据该待处理对象的该信息展示维度的各内容单元,确定该待处理对象的该信息展示维度的内容的主题矩阵,其中的主体矩阵包括至少一个矩阵元素,且主题矩阵中的各矩阵元素被作为该待处理对象的该信息展示维度的有效内容单元。
在一个可选示例中,针对任一信息展示维度,共性提取子模块7012可以先对多个待处理对象的该信息展示维度的有效内容进行聚类处理,从而获得多个类簇;之后,共性提取子模块7012可以对多个类簇的数量是否满足预定条件进行判断,如果多个类簇的数量满足预定条件,则共性提取子模块7012可以确定该信息展示维度为具有维度共性的信息展示维度,否则,共性提取子模块7012可以确定该信息展示维度为不具有维度共性的信息展示维度。
在一个可选示例中,本公开的生成媒体单元模块703可以包括:生成音频子模块7031、生成画面帧子模块7032以及合并子模块7033。其中的生成音频子模块7031用于针对任一信息展示维度,利用该信息展示维度以及内容,生成多个音频数据,其中,一个信息展示维度根据其不同共性标签对应不同的音频数据。其中的生成画面帧子模块7032用于针对任一信息展示维度,根据该信息展示维度及其内容,利用该信息展示维度对应的画面帧模板,生成该信息展示维度的画面帧。其中的合并子模块7033用于针对任一信息展示维度,将该信息展示维度的音频数据与该信息展示维度的画面帧合并为该信息展示维度的多媒体单元。
在一个可选示例中,合并子模块7033可以根据该信息展示维度及其内容形成该信息展示维度对应的字幕,并将字幕设置于该信息展示维度的画面帧中的预定位置处,之后,合并子模块7033可以根据该信息展示维度的音频数据的播放时间长度以及预设帧率,调整该信息展示维度的画面帧的数量,并将该信息展示维度的音频数据与该信息展示维度的数量调整后的画面帧合并为该信息展示维度的多媒体单元。
在一个可选示例中,针对任一待处理对象,合成媒体文件模块704可以根据多媒体单元预定排列顺序,对其选取出的所有多媒体单元进行拼接处理,获得该待处理对象的中间多媒体文件;之后,合成媒体文件模块704对该待处理对象的中间多媒体文件进行后处理,从而获得该待处理对象的多媒体文件。其中的后处理可以包括:播放速率调整处理以及文件格式转换处理中的至少一个。
另外,本公开实施例还提供了一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现本公开上述任一实施例所述的用于生成多媒体文件的方法。
另外,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现本公开上述任一实施例所述的用于生成多媒体文件的方法。
图8为本公开电子设备一个应用实施例的结构示意图。下面,参考图8来描述根据本公开实施例的电子设备。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。
如图8所示,电子设备包括一个或多个处理器和存储器。
处理器可以是中央处理单元(CPU)或具有数据处理能力和/或指令执行能力的其他形式的处理单元,且可以控制电子设备中的其他组件以执行期望的功能。
存储器可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器可以运行所述程序指令,以实现上文所述的本公开的各个实施例的用于生成多媒体文件的方法以及/或者其他期望的功能。
在一个示例中,电子设备还可以包括:输入装置和输出装置,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。此外,该输入设备还可以包括例如键盘、鼠标等等。该输出装置可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出设备可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。当然,为了简化,图8中仅示出了该电子设备中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据应用情况,电子设备还可以包括任何其他适当的组件。
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述部分中描述的根据本公开各种实施例的用于生成多媒体文件的方法中的步骤。所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述部分中描述的根据本公开各种实施例的用于生成多媒体文件的方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (14)

1.一种用于生成多媒体文件的方法,其特征在于,包括:
获取多个待处理对象的所有信息展示维度;
针对所述所有信息展示维度中的至少一信息展示维度,根据所述多个待处理对象的所述至少一信息展示维度的内容,对所述至少一信息展示维度分别进行维度共性检测,以确定所述至少一信息展示维度是否分别为具有维度共性的信息展示维度,其中,所述维度共性表征所述多个待处理对象在所述至少一信息展示维度上的取值所存在的共同点;
对于任一具有维度共性的信息展示维度,利用该信息展示维度的共性标签更新该信息展示维度的内容,其中,任一具有维度共性的信息展示维度具有至少一个共性标签;
利用所述所有信息展示维度及其内容,生成多个多媒体单元,其中,一个信息展示维度根据其不同共性标签对应不同的多媒体单元,所述所有信息展示维度及其内容包括:具有维度共性的信息展示维度及其更新后的内容;
针对任一待处理对象,根据该待处理对象所包含的所有信息展示维度及其内容从所述多媒体单元中选取属于该待处理对象的多媒体单元,并将选取出的所有多媒体单元合成为该待处理对象的多媒体文件。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个待处理对象的所述至少一信息展示维度的内容,对所述至少一信息展示维度分别进行维度共性检测,以确定所述至少一信息展示维度是否分别为具有维度共性的信息展示维度,包括:
针对任一信息展示维度,获取所述多个待处理对象的该信息展示维度的内容中的有效内容;
针对任一信息展示维度,对所述多个待处理对象的该信息展示维度的有效内容进行共性提取处理,根据所述共性提取处理的结果,确定该信息展示维度是否为具有维度共性的信息展示维度。
3.根据权利要求2所述的方法,其特征在于,所述获取所述多个待处理对象的该信息展示维度的内容中的有效内容,包括:
对所述多个待处理对象的所有信息展示维度的内容分别进行预处理;
对所述预处理后的各内容分别进行分词处理,获得各信息展示维度的内容中的各内容单元;
针对任一待处理对象的任一信息展示维度,从该待处理对象的该信息展示维度的各内容单元中,确定该待处理对象的该信息展示维度的有效内容单元;
其中,所述有效内容单元被作为所述有效内容。
4.根据权利要求3所述的方法,其特征在于,所述从该待处理对象的该信息展示维度的各内容单元中,确定该待处理对象的该信息展示维度的有效内容单元,包括:
获取该待处理对象的该信息展示维度的所有内容单元各自对应的词频对及其权重;
将权重最高的预定数量的词频对作为该待处理对象的该信息展示维度的内容中的有效内容单元。
5.根据权利要求3所述的方法,其特征在于,所述从该待处理对象的该信息展示维度的各内容单元中,确定该待处理对象的该信息展示维度的有效内容单元,包括:
根据该待处理对象的该信息展示维度的各内容单元,确定该待处理对象的该信息展示维度的内容的主题矩阵,其中,所述主题矩阵包括至少一个矩阵元素;
其中,所述主题矩阵中的各矩阵元素被作为该待处理对象的该信息展示维度的有效内容单元。
6.根据权利要求2至5中任一项所述的方法,其特征在于,所述对所述多个待处理对象的该信息展示维度的有效内容进行共性提取处理,根据所述共性提取处理的结果,确定该信息展示维度是否为具有维度共性的信息展示维度,包括:
对所述多个待处理对象的该信息展示维度的有效内容进行聚类处理,获得多个类簇;
若所述多个类簇的数量满足预定条件,则确定该信息展示维度为具有维度共性的信息展示维度,否则,确定该信息展示维度为不具有维度共性的信息展示维度。
7.根据权利要求1所述的方法,其特征在于,所述利用所述所有信息展示维度及其内容,生成多个多媒体单元,包括:
针对任一信息展示维度,利用该信息展示维度及其内容,生成多个音频数据,其中,一个信息展示维度根据其不同共性标签对应不同的音频数据;
针对任一信息展示维度,根据该信息展示维度及其内容,利用该信息展示维度对应的画面帧模板,生成该信息展示维度的画面帧;
针对任一信息展示维度,将该信息展示维度的音频数据与该信息展示维度的画面帧合并为该信息展示维度的多媒体单元。
8.根据权利要求7所述的方法,其特征在于,所述将该信息展示维度的音频数据与该信息展示维度的画面帧合并为该信息展示维度的多媒体单元,包括:
根据该信息展示维度及其内容形成该信息展示维度对应的字幕;
将所述字幕设置于该信息展示维度的画面帧中的预定位置处;
根据该信息展示维度的音频数据的播放时间长度以及预设帧率,调整该信息展示维度的画面帧的数量;
将该信息展示维度的音频数据与该信息展示维度的数量调整后的画面帧合并为该信息展示维度的多媒体单元。
9.根据权利要求1所述的方法,其特征在于,所述将选取出的所有多媒体单元合成为该待处理对象的多媒体文件,包括:
根据多媒体单元预定排列顺序,对选取出的所有多媒体单元进行拼接处理,获得该待处理对象的中间多媒体文件;
对该待处理对象的中间多媒体文件进行后处理,获得该待处理对象的多媒体文件;
其中,所述后处理包括:播放速率调整处理,和/或,文件格式转换处理。
10.一种用于生成多媒体文件的装置,其特征在于,包括:
获取展示维度模块,用于获取多个待处理对象的所有信息展示维度;
确定维度共性模块,用于针对所述所有信息展示维度中的至少一信息展示维度,根据所述多个待处理对象的所述至少一信息展示维度的内容,对所述至少一信息展示维度分别进行维度共性检测,以确定所述至少一信息展示维度是否分别为具有维度共性的信息展示维度,其中,所述维度共性表征所述多个待处理对象在所述至少一信息展示维度上的取值所存在的共同点;
更新维度内容模块,用于对于任一具有维度共性的信息展示维度,利用该信息展示维度的共性标签更新该信息展示维度的内容,其中,任一具有维度共性的信息展示维度具有至少一个共性标签;
生成媒体单元模块,用于利用所述所有信息展示维度及其内容,生成多个多媒体单元,其中,一个信息展示维度根据其不同共性标签对应不同的多媒体单元,所述所有信息展示维度及其内容包括:具有维度共性的信息展示维度及其更新后的内容;
合成媒体文件模块,用于针对任一待处理对象,根据该待处理对象所包含的所有信息展示维度及其内容从所述多媒体单元中选取属于该待处理对象的多媒体单元,并将选取出的所有多媒体单元合成为该待处理对象的多媒体文件。
11.根据权利要求10所述的装置,其特征在于,所述确定维度共性模块包括:
获取有效内容子模块,用于针对任一信息展示维度,获取所述多个待处理对象的该信息展示维度的内容中的有效内容;
共性提取子模块,用于针对任一信息展示维度,对所述多个待处理对象的该信息展示维度的有效内容进行共性提取处理,根据所述共性提取处理的结果,确定该信息展示维度是否为具有维度共性的信息展示维度。
12.根据权利要求10或11所述的装置,其特征在于,所述生成媒体单元模块包括:
生成音频子模块,用于针对任一信息展示维度,利用该信息展示维度及其内容,生成多个音频数据,其中,一个信息展示维度根据其不同共性标签对应不同的音频数据;
生成画面帧子模块,用于针对任一信息展示维度,根据该信息展示维度及其内容,利用该信息展示维度对应的画面帧模板,生成该信息展示维度的画面帧;
合并子模块,用于针对任一信息展示维度,将该信息展示维度的音频数据与该信息展示维度的画面帧合并为该信息展示维度的多媒体单元。
13.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现上述权利要求1-9任一所述的方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时,实现上述权利要求1-9任一所述的方法。
CN202011169065.0A 2020-10-28 2020-10-28 用于生成多媒体文件的方法、装置、电子设备及存储介质 Active CN112291635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011169065.0A CN112291635B (zh) 2020-10-28 2020-10-28 用于生成多媒体文件的方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011169065.0A CN112291635B (zh) 2020-10-28 2020-10-28 用于生成多媒体文件的方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112291635A CN112291635A (zh) 2021-01-29
CN112291635B true CN112291635B (zh) 2022-07-15

Family

ID=74373966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011169065.0A Active CN112291635B (zh) 2020-10-28 2020-10-28 用于生成多媒体文件的方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112291635B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130095931A (ko) * 2012-02-21 2013-08-29 (주)케이디엠티 템플릿 기반 멀티 콘텐트 변환 장치 및 방법
CN110309351A (zh) * 2018-02-14 2019-10-08 阿里巴巴集团控股有限公司 数据对象的视频影像生成、装置及计算机系统
CN110347981A (zh) * 2018-04-03 2019-10-18 阿里巴巴集团控股有限公司 数据对象展示信息的生成方法、装置、设备及存储介质
CN111460183A (zh) * 2020-03-30 2020-07-28 北京金堤科技有限公司 多媒体文件生成方法和装置、存储介质、电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130095931A (ko) * 2012-02-21 2013-08-29 (주)케이디엠티 템플릿 기반 멀티 콘텐트 변환 장치 및 방법
CN110309351A (zh) * 2018-02-14 2019-10-08 阿里巴巴集团控股有限公司 数据对象的视频影像生成、装置及计算机系统
CN110347981A (zh) * 2018-04-03 2019-10-18 阿里巴巴集团控股有限公司 数据对象展示信息的生成方法、装置、设备及存储介质
CN111460183A (zh) * 2020-03-30 2020-07-28 北京金堤科技有限公司 多媒体文件生成方法和装置、存储介质、电子设备

Also Published As

Publication number Publication date
CN112291635A (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
US8380727B2 (en) Information processing device and method, program, and recording medium
US8359285B1 (en) Generating item recommendations
US9875222B2 (en) Capturing and storing elements from a video presentation for later retrieval in response to queries
US10025980B2 (en) Assisting people with understanding charts
US9972358B2 (en) Interactive video generation
US9613268B2 (en) Processing of images during assessment of suitability of books for conversion to audio format
US20070226207A1 (en) System and method for clustering content items from content feeds
WO2019133506A1 (en) Intelligent routing services and systems
WO2015008388A1 (ja) レコメンド情報提示装置、レコメンド情報提示方法及びレコメンド情報提示プログラム
CN111506794A (zh) 一种基于机器学习的谣言管理方法和装置
US10764613B2 (en) Video media content analysis
WO2014093587A1 (en) Flat book to rich book conversion in e-readers
WO2019245033A1 (ja) 動画編集サーバおよびプログラム
CN114625918A (zh) 视频推荐方法、装置、设备、存储介质及程序产品
US20120323702A1 (en) System and method for client-server cooperation in selecting content for display
CN112291635B (zh) 用于生成多媒体文件的方法、装置、电子设备及存储介质
US20200394649A1 (en) Transaction interaction analysis and summarization
WO2023022775A1 (en) System and method for use of text analytics to transform, analyze, and visualize data
US11995134B2 (en) Generating validity scores of content items
Chang et al. Using Machine Learning to Extract Insights from Consumer Data
CN112597308A (zh) 文本数据处理方法、装置、电子设备及存储介质
US20210295036A1 (en) Systematic language to enable natural language processing on technical diagrams
CN111866609B (zh) 用于生成视频的方法和装置
CN111783808A (zh) 用于生成信息的方法和装置
US20240046042A1 (en) Method and device for information processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant