CN111310859A

CN111310859A - 一种用于多媒体展示中的快速人工智能数据训练系统

Info

Publication number: CN111310859A
Application number: CN202010224018.5A
Authority: CN
Inventors: 张力
Original assignee: Shanghai Jinghe International Exhibition Co ltd
Current assignee: Shanghai Jinghe International Exhibition Co ltd
Priority date: 2020-03-26
Filing date: 2020-03-26
Publication date: 2020-06-19

Abstract

本发明提供一种用于多媒体展示中的快速人工智能数据训练系统，其特征在于，包括：输入端、处理端和发布端，输入端包括：人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块，处理端包括:人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块，发布端包括：训练数据集、云端发布模块、后台管理系统。本发明训练快速成本低。

Description

一种用于多媒体展示中的快速人工智能数据训练系统

技术领域

本发明涉及一种用于多媒体展示中的快速人工智能数据训练系统，属于人工智能领域。

背景技术

现有的方法制作一个人工智能有效的识别模型需要不低于10万个有效样本与GPU集群进行深度学习，这种方法成本太高，样本需要大量人工标定，效率低，标错率高。

由于在训练过程中正样本数据标定与负样本数据有冲突时会导致训练失败，训练周期长，导致应用软件识别时间过长。

训练过程中出错率高，虽然最后识别概率能够达到99.99％行业要要求，但对于展览行业更多是演示型，对响应时间要求较高，合格率达到95％已经完全满足需求。

展示行业一般开发周期时间都比较短，属于定制类型。每个项目都要根据客户要求重新训练，由于客户不熟悉具体原理，提供的样本资料存在很多缺陷，往往最后导致项目结果不太理想，而人工智能开发人员只熟悉自己本专业的内的工作，在这种条件下开发的人工智能技术比较机械。

发明内容

本发明的目的在于提供一种用于多媒体展示中的快速人工智能数据训练系统，以快速和低成本的开发展示行业的人工智能动作识别模型。

本发明采用了如下技术方案：

一种用于多媒体展示中的快速人工智能数据训练系统，其特征在于，包括：

输入端、处理端和发布端，

输入端包括：

人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块

处理端包括:人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块，

发布端包括：训练数据集、云端发布模块、后台管理系统。

进一步，本发明的用于多媒体展示中的快速人工智能数据训练系统，还包括：

预置的三维人体模型骨骼参数。

进一步，本发明的用于多媒体展示中的快速人工智能数据训练系统，还具有这样的特征：

人体生成模块生成人体模型，人体模型包含人体样本标准模型和人体动作模型。

进一步，本发明的用于多媒体展示中的快速人工智能数据训练系统，其特征在于：

专家监督模块对训练过程中的参数进行调整。

归一化样本生成器模块用于快速目标标定、快速生成标准样本以及自动排序。

进一步，本发明的用于多媒体展示中的快速人工智能数据训练系统，还具有这样的特征：归一化生成模块的功能包括模型设置、动作设置、灯光设置、特写设置、遮挡设置、阴影设置以及场景模拟设置，

进一步，本发明的用于多媒体展示中的快速人工智能数据训练系统，还具有这样的特征：分类器模块预训练。

进一步，本发明的用于多媒体展示中的快速人工智能数据训练系统，还具有这样的特征：人体采集双目摄像机，用于模拟人类双眼定位与测距。

进一步，本发明的用于多媒体展示中的快速人工智能数据训练系统，还具有这样的特征：人体采集双目摄像机的捕捉时间设置为3S。

进一步，本发明的用于多媒体展示中的快速人工智能数据训练系统，还具有这样的特征：人体生成模块中提供对人体三维数字模型的精度进行调整的选项。

发明的有益效果：本发明的用于多媒体展示中的快速人工智能数据训练系统，具有如下优点：

1.解决了人工智能人体动作识别过程中缺乏足够有效的人体样本数量和有效样本质量的问题。

2.由于引入监督学习模块，提高了样本质量从而降低了样本数量的要求，同时保证了人体姿态识别的实时性和准确性。

3.本发明注重提高客户参与程度，客户是本行业的专家，而研发人员更熟悉技术，通过专家监督学习模块将专家经验结合到人工智能之中，识别速度比一般方法提高3-5倍。

4.由于多媒体项目开发周期比较短，预算有限，本发明实施成本较低，能够满足一些中小型企业节约成本的需求。

5.提供算法开源与部分训练数据共享，吸引更多的开发者。

附图说明

图1是用于多媒体展示中的快速人工智能数据训练系统的结构框图。

具体实施方式

以下结合附图来进一步说明本发明的技术方案。

如图1所示，用于多媒体展示中的快速人工智能数据训练系统，包括：输入端、处理端和发布端。

输入端包括：

人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块。

其中，人体采集双目摄像机，用于模拟人类双眼定位与测距。该相机模拟人类双眼定位与测距的功能，系统人体捕捉时间为3S，然后将生成人体的三维数字模型，其中模型精度可以调整，避免采集精度过高，模型过大的问题。从而提高扫描速度。

处理端包括：

人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块。

其中，人体生成模块生成人体模型，人体模型包含人体样本标准模型和人体动作模型。并且人体生成模块中提供对人体三维数字模型的精度进行调整的选项。

归一化样本生成器模块用于快速目标标定、快速生成标准样本以及自动排序。归一化生成模块的功能包括模型设置、动作设置、灯光设置、特写设置、遮挡设置、阴影设置以及场景模拟设置。

分类器模块对模型进行预训练。

模型训练模块中具有预置的三维人体模型骨骼参数。

专家监督模块对训练过程中的参数进行调整。深度前馈指导方式包括数据集增强和参数范数惩罚。系统有行业专家参与的接口，使得数据训练从单纯的依靠算法与GPU运算变成“行业专家智能模式”。

建模过程中可以根据客户要求将采集到模型绑定相应的人体基本模型骨骼，也可以绑定客户定制的动作模型。

发布端包括：

训练数据集、云端发布模块、后台管理系统。

专家还可以重新调整数据集。云端发布模块将训练数据集发布。后台管理系统对训练数据集进行后期管理。

本发明的方法应用于展览展示行业中的应用，而非工商业性质的用途。

将训练数据集可以开源，从而为其他开发者提供一套基准数据库。

本实施方式只需要准备活体人10位，即可快速训练出人体模型，相较于传统方式，相应速度识别时间都比一般方法提高3-5倍。也可以在5个工作日内提供4-5万个分辨率在60*60像素的正样本，对正样品即人体进行归一化处理。

Claims

1.一种用于多媒体展示中的快速人工智能数据训练系统，其特征在于，包括：

输入端、处理端和发布端，

输入端包括：

人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块，

处理端包括：人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块，

发布端包括：训练数据集、云端发布模块、后台管理系统。

2.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统，还包括：

预置的三维人体模型骨骼参数。

3.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统：

4.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统，其特征在于：

专家监督模块对训练过程中的参数进行调整。

5.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统，其特征在于：

6.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统，其特征在于：

归一化生成模块的功能包括模型设置、动作设置、灯光设置、特写设置、遮挡设置、阴影设置以及场景模拟设置。

7.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统，其特征在于：

分类器模块预训练。

8.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统，其特征在于：

人体采集双目摄像机，用于模拟人类双眼定位与测距。

9.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统，其特征在于：

人体采集双目摄像机的捕捉时间设置为3S。

10.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统，其特征在于：

人体生成模块中提供对人体三维数字模型的精度进行调整的选项。