CN114915841A

CN114915841A - 一种基于机器学习算法的视频制作方法及系统

Info

Publication number: CN114915841A
Application number: CN202210507198.7A
Authority: CN
Inventors: 余卫军
Original assignee: Nanjing Soufuju Information Technology Co ltd
Current assignee: Nanjing Soufuju Information Technology Co ltd
Priority date: 2022-05-10
Filing date: 2022-05-10
Publication date: 2022-08-16

Abstract

本发明提供一种基于机器学习算法的视频制作方法及系统。该基于机器学习算法的视频制作方法，其步骤为：A、接收客户端的当前短视频，B、通过视频分帧技术和识别技术获取所述当前短视频的特征信息，C、将识别准确的当前短视频打上若干个标签以及若干个视频碎片，形成模板录入数据库。本发明提供的基于机器学习算法的视频制作方法及系统，过系统标签提取，标签检索以及相似度查找，能找到合适的多套视频模板，最终能转换换帧合成技术，能生成各种类型的多个版本视频，用户可以选择后上传，通过这个技术，大大简单了视频制作的过程，满足了用户对视频制作的需求。

Description

一种基于机器学习算法的视频制作方法及系统

技术领域

本发明涉及视频制作领域，尤其涉及一种基于机器学习算法的视频制作方法及系统。

背景技术

网络属于社交网络，但是现在的网络属于短视频的网络，高清视频编辑制作系统是在当前融合媒体业务的大背景下，采用一系列最前沿的互联网技术，以视频技术为核心，以满足核心业务为主要目标，以数据价值呈现，以高可用、横向扩展、集中管理、开放兼容为设计理念实现超网络化编辑业务，以在线存储网络化共享编辑为主，同时辅以少量单机编辑，视频编辑制作系统需实现超高清视频的上载、收录、编辑、合成、转码、审查、播出等全流程生产环节目前短视频火爆，各大平台也都推出了自己的短视频平台，也涌出一大批会制作视频的人才，但是比起普通的大众，能够制作视频的用户也是寥寥无几，而制作视频，本身需要有一定的基础知识及操作能力，作为一个普通大众，首先可能没有时间来学习这种能力，其次可能也学不会这种能力，将视频制作成为自己想要的样子。

因此，有必要提供一种基于机器学习算法的视频制作方法及系统解决上述技术问题。

发明内容

本发明提供一种基于机器学习算法的视频制作方法及系统，解决了的问题。

为解决上述技术问题，本发明提供的一种基于机器学习算法的视频制作方法，其步骤为：

A、接收客户端的当前短视频；

B、通过视频分帧技术和识别技术获取所述当前短视频的特征信息；

C、将识别准确的当前短视频打上若干个标签以及若干个视频碎片，形成模板录入数据库；

D、用户输入视频素材并指定期望输出的类型，数据库通过系统数据匹对标签相似度较高的视频，替换帧位，输出若干视频，并且展示相似的案例，通过合成技术生成完整视频。

优选的，步骤B中，所述视频分帧技术通过KL散度为损失函数构造层次聚类模型，选取KL散度最小的层进行聚类，同属于一个类的向量所对应的帧即为同一场景。

优选的，步骤B中，所述识别技术具体为图片识别技术，且图片识别技术包括人物识别、表情识别、物体识别、动作识别、文字识别和特效识别。

优选的，步骤D中，所述合成技术包括音频合成和特效合成。

一种基于机器学习算法的视频制作系统，其特征在于，包括：

接收模块，用于接收客户端的当前短视频；

获取模块，用于获取所述当前短视频的特征信息；

数据库模块，用于数据存储分类、数据存储、数据获取和文件存储；

处理模块，通过运算加工匹配视频数据，这个主要是通过算法进行数据加工和视频加工；

终端，为用户提供终端数据服务。

优选的，所述接收模块包括收录模块和素材回传模块；

收录模块支持超高清和高清的SDI信号以及IP信号采集；

素材回传模块可将采编短视频的素材和稿件完整高效地回传到系统内。

优选的，所述获取模块包括图片获取子模块和特征识别子模块；

所述图片获取子模块用于获取所述当前短视频的至少一个图片信息；

所述特征识别子模块用于根据所述图片信息，生成所述当前短视频的特征信息。

优选的，所述数据库模块包括AI智能分析引擎和储存系统；

AI智能分析引擎增强AI能力，智能化检索资源形成标签体系和知识图谱，并进行语音识别、场景分类、人脸识别、OCR字幕识别以及涉黄涉暴智能分析；

储存系统，架构上采用IP分布式集群存储，通过增加节点线性扩展整个存储的带宽以及容量。

优选的，所述处理模块包括编辑系统、配音系统和字幕加持系统；

编辑系统，用于短视频的剪辑和特效合成；

配音系统，用于短视频的背景音乐加持、视频配音以及音效加持；

字幕加持系统，用于短视频的字幕加持。

与相关技术相比较，本发明提供的基于机器学习算法的视频制作系统具有如下有益效果：

1、本发明提供一种基于机器学习算法的视频制作系统，通过系统标签提取，标签检索以及相似度查找，能找到合适的多套视频模板，最终能转换换帧合成技术，能生成各种类型的多个版本视频，用户可以选择后上传，通过这个技术，大大简单了视频制作的过程，满足了用户对视频制作的需求。

2、本发明提供了一种基于机器学习算法的视频制作方法，能将一个普通的视频或者文本图片素材，通过碎片化切割，提纯，组合等操作，再根据用户的需求，快速加工成各式各样的视频作品，供用户选择，这样大家都能产出视频作品出来，上传到平台，给自己带来收益，这样的处理，对于用户来说，降低技术学习的成本，也降低了处理视频产生的时间消耗，以及增加了更多的创作可能性。

附图说明

图1为本发明提供的一种基于机器学习算法的视频制作方法图；

图2为本发明提供的一种基于机器学习算法的视频制作系统图.

具体实施方式

下面结合附图和实施方式对本发明作进一步说明。

请结合参阅图1-2所示，一种基于机器学习算法的视频制作方法，其步骤为，A、接收客户端的当前短视频；B、通过视频分帧技术和识别技术获取所述当前短视频的特征信息；C、将识别准确的当前短视频打上若干个标签以及若干个视频碎片，形成模板录入数据库；D、用户输入视频素材并指定期望输出的类型，数据库通过系统数据匹对标签相似度较高的视频，替换帧位，输出若干视频，并且展示相似的案例，通过合成技术生成完整视频。

本发明的步骤B中，所述视频分帧技术通过KL散度为损失函数构造层次聚类模型，选取KL散度最小的层进行聚类，同属于一个类的向量所对应的帧即为同一场景。

本发明的步骤B中，所述识别技术具体为图片识别技术，且图片识别技术包括人物识别、表情识别、物体识别、动作识别、文字识别和特效识别。

本发明的步骤D中，所述合成技术包括音频合成和特效合成。

一种基于机器学习算法的视频制作系统，包括接收模块，用于接收客户端的当前短视频，获取模块，用于获取当前短视频的特征信息，数据库模块，用于数据存储分类、数据存储、数据获取和文件存储，处理模块，通过运算加工匹配视频数据，这个主要是通过算法进行数据加工和视频加工，终端，为用户提供终端数据服务。

本发明的接收模块包括收录模块和素材回传模块，收录模块支持超高清和高清的SDI信号以及IP信号采集，素材回传模块可将采编短视频的素材和稿件完整高效地回传到系统内。

本发明的获取模块包括图片获取子模块和特征识别子模块，图片获取子模块用于获取当前短视频的至少一个图片信息，特征识别子模块用于根据图片信息，生成当前短视频的特征信息。

本发明的数据库模块包括AI智能分析引擎和储存系统，AI智能分析引擎增强AI能力，智能化检索资源形成标签体系和知识图谱，并进行语音识别、场景分类、人脸识别、OCR字幕识别以及涉黄涉暴智能分析储存系统，文件存储作为生产支撑平台的存储，在架构上采用IP分布式集群存储，通过增加节点可以线性扩展整个存储的带宽以及容量，保证高安全性，网络架构上采用维护更加简单的以太单网架构，超高清视频网存储设备不但需要保障生产素材和成品短视频对存储容量的需求，还需要满足非编工作站点编辑制作的读写访问、媒体处理转换对带宽的要求，能满足网络内其他业务进行短视频文件传输的需要，并根据安全性需求提供必要的备份和切换手段，在设计存储设备的容量和带宽指标时，需要考虑合理的冗余量，以保障系统运行的稳定性，同时，为降低维护成本，提高维护便捷性，考虑所有生产终端以太网接入访问，数据存储系统主要用于短视频编辑、大量素材文件、音视频文件读写等，特点是读写大文件、数据量大，读写较频繁，要求大带宽，针对超高清环境下的业务制作需求，要求支持灵活的网络架构，针对以上要求，本方案选用IP分布式节点式存储作为在线核心存储，资源池内划分不同逻辑存储区域，实现媒体文件统一存储，同时，还为其他业务系统提供存储空间，如果需要新增容量时，直接在资源池中划分，满足随需扩展需求；

本发明的视频资源的建设实现整个网络系统的管理，包括网络拓扑管理、IP地址段规划和设备远程配置等，从而保证网络业务的正常运行并具有可扩展性，考虑到超高清系统的规模及应用强度，本发明选用高性能全万兆交换机作为核心交换机和千兆以太网交换机作为接入交换机，用于整个网络的以太网连接通道，系统采用40G核心、万兆桌面的方式，核心交换机与接入交换机之间通过40G链路连接，系统中的工作站、存储、服务器通过万兆接入交换设备采用业内主流型号配置，并且使用双机堆叠方式，确保网络安全。

储存系统结构化查询采用MySQL数据库以及基于分布式文件存储的NoSQL数据库两类数据库，MySQL数据库体积小、速度快、开放源码，且使用的核心线程是完全多线程，支持多处理器，用于提高并发访问量，而基于分布式文件存储的MongoDB则具有可扩展性强、易于查询等优势，用于存储文档；

本发明的处理模块包括编辑系统、配音系统和字幕加持系统，编辑系统，用于短视频的剪辑和特效合成，配音系统，用于短视频的背景音乐加持，配音系统中配置了专业声卡，用于超高清视频制作的后期配音以及音效加持，字幕加持系统，用于短视频的字幕加持；

本发明的短视频内容呈现和传播最方便，网络化技术以丰富的协议、充沛的数据带宽、灵活的调度方式为视频制作提供了高效的制作方案，在本发明设计中，其满足了超高清内容的上载、收录、编辑、合成、转码、审查、播出等全流程生产环节，并充分考虑融合媒体制播能力，扩展了短视频业务领域。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其它相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于机器学习算法的视频制作方法，其步骤为：

A、接收客户端的当前短视频；

2.根据权利要求1所述的一种基于机器学习算法的视频制作方法，步骤B中，所述视频分帧技术通过KL散度为损失函数构造层次聚类模型，选取KL散度最小的层进行聚类，同属于一个类的向量所对应的帧即为同一场景。

3.根据权利要求1所述的一种基于机器学习算法的视频制作方法，步骤B中，所述识别技术具体为图片识别技术，且图片识别技术包括人物识别、表情识别、物体识别、动作识别、文字识别和特效识别。

4.根据权利要求1所述的一种基于机器学习算法的视频制作方法，步骤D中，所述合成技术包括音频合成和特效合成。

5.一种基于机器学习算法的视频制作系统，其特征在于，包括：

接收模块，用于接收客户端的当前短视频；

获取模块，用于获取所述当前短视频的特征信息；

终端，为用户提供终端数据服务。

6.根据权利要求5所述的一种基于机器学习算法的视频制作系统，其特征在于，所述接收模块包括收录模块和素材回传模块；

收录模块支持超高清和高清的SDI信号以及IP信号采集；

7.根据权利要求5所述的一种基于机器学习算法的视频制作系统，其特征在于，所述获取模块包括图片获取子模块和特征识别子模块；

8.根据权利要求5所述的一种基于机器学习算法的视频制作系统，其特征在于，所述数据库模块包括AI智能分析引擎和储存系统；

9.根据权利要求5所述的一种基于机器学习算法的视频制作系统，其特征在于，所述处理模块包括编辑系统、配音系统和字幕加持系统；

编辑系统，用于短视频的剪辑和特效合成；

字幕加持系统，用于短视频的字幕加持。