CN111310859A - 一种用于多媒体展示中的快速人工智能数据训练系统 - Google Patents

一种用于多媒体展示中的快速人工智能数据训练系统 Download PDF

Info

Publication number
CN111310859A
CN111310859A CN202010224018.5A CN202010224018A CN111310859A CN 111310859 A CN111310859 A CN 111310859A CN 202010224018 A CN202010224018 A CN 202010224018A CN 111310859 A CN111310859 A CN 111310859A
Authority
CN
China
Prior art keywords
module
human body
artificial intelligence
intelligence data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010224018.5A
Other languages
English (en)
Inventor
张力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jinghe International Exhibition Co ltd
Original Assignee
Shanghai Jinghe International Exhibition Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jinghe International Exhibition Co ltd filed Critical Shanghai Jinghe International Exhibition Co ltd
Priority to CN202010224018.5A priority Critical patent/CN111310859A/zh
Publication of CN111310859A publication Critical patent/CN111310859A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Psychiatry (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种用于多媒体展示中的快速人工智能数据训练系统,其特征在于,包括:输入端、处理端和发布端,输入端包括:人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块,处理端包括:人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块,发布端包括:训练数据集、云端发布模块、后台管理系统。本发明训练快速成本低。

Description

一种用于多媒体展示中的快速人工智能数据训练系统
技术领域
本发明涉及一种用于多媒体展示中的快速人工智能数据训练系统,属于人工智能领域。
背景技术
现有的方法制作一个人工智能有效的识别模型需要不低于10万个有效样本与GPU集群进行深度学习,这种方法成本太高,样本需要大量人工标定,效率低,标错率高。
由于在训练过程中正样本数据标定与负样本数据有冲突时会导致训练失败,训练周期长,导致应用软件识别时间过长。
训练过程中出错率高,虽然最后识别概率能够达到99.99%行业要要求,但对于展览行业更多是演示型,对响应时间要求较高,合格率达到95%已经完全满足需求。
展示行业一般开发周期时间都比较短,属于定制类型。每个项目都要根据客户要求重新训练,由于客户不熟悉具体原理,提供的样本资料存在很多缺陷,往往最后导致项目结果不太理想,而人工智能开发人员只熟悉自己本专业的内的工作,在这种条件下开发的人工智能技术比较机械。
发明内容
本发明的目的在于提供一种用于多媒体展示中的快速人工智能数据训练系统,以快速和低成本的开发展示行业的人工智能动作识别模型。
本发明采用了如下技术方案:
一种用于多媒体展示中的快速人工智能数据训练系统,其特征在于,包括:
输入端、处理端和发布端,
输入端包括:
人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块
处理端包括:人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块,
发布端包括:训练数据集、云端发布模块、后台管理系统。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还包括:
预置的三维人体模型骨骼参数。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:
人体生成模块生成人体模型,人体模型包含人体样本标准模型和人体动作模型。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
专家监督模块对训练过程中的参数进行调整。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
归一化样本生成器模块用于快速目标标定、快速生成标准样本以及自动排序。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:归一化生成模块的功能包括模型设置、动作设置、灯光设置、特写设置、遮挡设置、阴影设置以及场景模拟设置,
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:分类器模块预训练。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:人体采集双目摄像机,用于模拟人类双眼定位与测距。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:人体采集双目摄像机的捕捉时间设置为3S。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:人体生成模块中提供对人体三维数字模型的精度进行调整的选项。
发明的有益效果:本发明的用于多媒体展示中的快速人工智能数据训练系统,具有如下优点:
1.解决了人工智能人体动作识别过程中缺乏足够有效的人体样本数量和有效样本质量的问题。
2.由于引入监督学习模块,提高了样本质量从而降低了样本数量的要求,同时保证了人体姿态识别的实时性和准确性。
3.本发明注重提高客户参与程度,客户是本行业的专家,而研发人员更熟悉技术,通过专家监督学习模块将专家经验结合到人工智能之中,识别速度比一般方法提高3-5倍。
4.由于多媒体项目开发周期比较短,预算有限,本发明实施成本较低,能够满足一些中小型企业节约成本的需求。
5.提供算法开源与部分训练数据共享,吸引更多的开发者。
附图说明
图1是用于多媒体展示中的快速人工智能数据训练系统的结构框图。
具体实施方式
以下结合附图来进一步说明本发明的技术方案。
如图1所示,用于多媒体展示中的快速人工智能数据训练系统,包括:输入端、处理端和发布端。
输入端包括:
人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块。
其中,人体采集双目摄像机,用于模拟人类双眼定位与测距。该相机模拟人类双眼定位与测距的功能,系统人体捕捉时间为3S,然后将生成人体的三维数字模型,其中模型精度可以调整,避免采集精度过高,模型过大的问题。从而提高扫描速度。
处理端包括:
人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块。
其中,人体生成模块生成人体模型,人体模型包含人体样本标准模型和人体动作模型。并且人体生成模块中提供对人体三维数字模型的精度进行调整的选项。
归一化样本生成器模块用于快速目标标定、快速生成标准样本以及自动排序。归一化生成模块的功能包括模型设置、动作设置、灯光设置、特写设置、遮挡设置、阴影设置以及场景模拟设置。
分类器模块对模型进行预训练。
模型训练模块中具有预置的三维人体模型骨骼参数。
专家监督模块对训练过程中的参数进行调整。深度前馈指导方式包括数据集增强和参数范数惩罚。系统有行业专家参与的接口,使得数据训练从单纯的依靠算法与GPU运算变成“行业专家智能模式”。
建模过程中可以根据客户要求将采集到模型绑定相应的人体基本模型骨骼,也可以绑定客户定制的动作模型。
发布端包括:
训练数据集、云端发布模块、后台管理系统。
专家还可以重新调整数据集。云端发布模块将训练数据集发布。后台管理系统对训练数据集进行后期管理。
本发明的方法应用于展览展示行业中的应用,而非工商业性质的用途。
将训练数据集可以开源,从而为其他开发者提供一套基准数据库。
本实施方式只需要准备活体人10位,即可快速训练出人体模型,相较于传统方式,相应速度识别时间都比一般方法提高3-5倍。也可以在5个工作日内提供4-5万个分辨率在60*60像素的正样本,对正样品即人体进行归一化处理。

Claims (10)

1.一种用于多媒体展示中的快速人工智能数据训练系统,其特征在于,包括:
输入端、处理端和发布端,
输入端包括:
人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块,
处理端包括:人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块,
发布端包括:训练数据集、云端发布模块、后台管理系统。
2.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,还包括:
预置的三维人体模型骨骼参数。
3.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统:
人体生成模块生成人体模型,人体模型包含人体样本标准模型和人体动作模型。
4.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
专家监督模块对训练过程中的参数进行调整。
5.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
归一化样本生成器模块用于快速目标标定、快速生成标准样本以及自动排序。
6.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
归一化生成模块的功能包括模型设置、动作设置、灯光设置、特写设置、遮挡设置、阴影设置以及场景模拟设置。
7.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
分类器模块预训练。
8.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
人体采集双目摄像机,用于模拟人类双眼定位与测距。
9.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
人体采集双目摄像机的捕捉时间设置为3S。
10.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
人体生成模块中提供对人体三维数字模型的精度进行调整的选项。
CN202010224018.5A 2020-03-26 2020-03-26 一种用于多媒体展示中的快速人工智能数据训练系统 Pending CN111310859A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010224018.5A CN111310859A (zh) 2020-03-26 2020-03-26 一种用于多媒体展示中的快速人工智能数据训练系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010224018.5A CN111310859A (zh) 2020-03-26 2020-03-26 一种用于多媒体展示中的快速人工智能数据训练系统

Publications (1)

Publication Number Publication Date
CN111310859A true CN111310859A (zh) 2020-06-19

Family

ID=71162524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010224018.5A Pending CN111310859A (zh) 2020-03-26 2020-03-26 一种用于多媒体展示中的快速人工智能数据训练系统

Country Status (1)

Country Link
CN (1) CN111310859A (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268495A (zh) * 2013-05-31 2013-08-28 公安部第三研究所 计算机系统中基于先验知识聚类的人体行为建模识别方法
CN105741356A (zh) * 2016-02-06 2016-07-06 鹤壁职业技术学院 一种人体解剖教学系统
CN106022929A (zh) * 2016-05-27 2016-10-12 大连楼兰科技股份有限公司 基于专家系统的碰撞事故定损方法及系统
CN106022211A (zh) * 2016-05-04 2016-10-12 北京航空航天大学 一种利用手势控制多媒体设备的方法
US20160342861A1 (en) * 2015-05-21 2016-11-24 Mitsubishi Electric Research Laboratories, Inc. Method for Training Classifiers to Detect Objects Represented in Images of Target Environments
US9760690B1 (en) * 2016-03-10 2017-09-12 Siemens Healthcare Gmbh Content-based medical image rendering based on machine learning
CN107595239A (zh) * 2015-06-02 2018-01-19 杭州镜之镜科技有限公司 个人用眼监控系统
CN108256975A (zh) * 2018-01-23 2018-07-06 喻强 基于人工智能为虚拟试衣者提供三维效果的穿搭系统及方法
CN108563742A (zh) * 2018-04-12 2018-09-21 王海军 自动创建人工智能图像识别训练素材与标注文件的方法
CN109767488A (zh) * 2019-01-23 2019-05-17 广东康云科技有限公司 基于人工智能的三维建模方法及系统
US20190295278A1 (en) * 2018-03-20 2019-09-26 Electronics And Telecommunications Research Institute Apparatus and method for generating synthetic training data for motion recognition
WO2019223382A1 (zh) * 2018-05-22 2019-11-28 深圳市商汤科技有限公司 单目深度估计方法及其装置、设备和存储介质
CN110544301A (zh) * 2019-09-06 2019-12-06 广东工业大学 一种三维人体动作重建系统、方法和动作训练系统
CN110567974A (zh) * 2019-09-30 2019-12-13 华中科技大学 一种基于云端人工智能表面缺陷检测系统

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268495A (zh) * 2013-05-31 2013-08-28 公安部第三研究所 计算机系统中基于先验知识聚类的人体行为建模识别方法
US20160342861A1 (en) * 2015-05-21 2016-11-24 Mitsubishi Electric Research Laboratories, Inc. Method for Training Classifiers to Detect Objects Represented in Images of Target Environments
CN107595239A (zh) * 2015-06-02 2018-01-19 杭州镜之镜科技有限公司 个人用眼监控系统
CN105741356A (zh) * 2016-02-06 2016-07-06 鹤壁职业技术学院 一种人体解剖教学系统
US9760690B1 (en) * 2016-03-10 2017-09-12 Siemens Healthcare Gmbh Content-based medical image rendering based on machine learning
CN106022211A (zh) * 2016-05-04 2016-10-12 北京航空航天大学 一种利用手势控制多媒体设备的方法
CN106022929A (zh) * 2016-05-27 2016-10-12 大连楼兰科技股份有限公司 基于专家系统的碰撞事故定损方法及系统
CN108256975A (zh) * 2018-01-23 2018-07-06 喻强 基于人工智能为虚拟试衣者提供三维效果的穿搭系统及方法
US20190295278A1 (en) * 2018-03-20 2019-09-26 Electronics And Telecommunications Research Institute Apparatus and method for generating synthetic training data for motion recognition
CN108563742A (zh) * 2018-04-12 2018-09-21 王海军 自动创建人工智能图像识别训练素材与标注文件的方法
WO2019223382A1 (zh) * 2018-05-22 2019-11-28 深圳市商汤科技有限公司 单目深度估计方法及其装置、设备和存储介质
CN109767488A (zh) * 2019-01-23 2019-05-17 广东康云科技有限公司 基于人工智能的三维建模方法及系统
CN110544301A (zh) * 2019-09-06 2019-12-06 广东工业大学 一种三维人体动作重建系统、方法和动作训练系统
CN110567974A (zh) * 2019-09-30 2019-12-13 华中科技大学 一种基于云端人工智能表面缺陷检测系统

Similar Documents

Publication Publication Date Title
Shan et al. Research on landscape design system based on 3D virtual reality and image processing technology
CN104766270A (zh) 一种基于鱼眼镜头的虚实光照融合方法
CN108810408A (zh) 一种摄像头控制方法及装置和系统
CN102096941A (zh) 虚实融合环境下的光照一致性方法
WO2020151426A1 (zh) 基于人工智能的三维建模方法及系统
CN111292408B (zh) 一种基于注意力机制的阴影生成方法
CN104574481B (zh) 一种三维角色动画非线性修改方法
CN113297701B (zh) 多种类工业零件堆叠场景的仿真数据集生成方法及装置
CN112669422B (zh) 仿真3d数字人生成方法、装置、电子设备及存储介质
CN108830216A (zh) 一种视场可调的连续变焦目标识别系统及方法
Gobron et al. Retina simulation using cellular automata and GPU programming
Li Film and TV animation production based on artificial intelligence AlphaGd
CN112634456B (zh) 基于深度学习的复杂三维模型的实时高真实感绘制方法
CN111310859A (zh) 一种用于多媒体展示中的快速人工智能数据训练系统
WO2020228348A1 (zh) 校园三维数字化建模方法、系统、装置及存储介质
CN101751654A (zh) 真实环境中采集的灯光信息在虚拟现实中的应用
CN205486164U (zh) 一种新型人脸3d表情动作识别系统
CA3171844A1 (en) Quantifying biotic damage on plant leaves, by convolutional neural networks
DE102022100517A1 (de) Verwenden von intrinsischen funktionen zum schattenentrauschen in raytracinganwendungen
Zhang et al. Face animation making method based on facial motion capture
Stereo et al. Human Factors and Wearable Technologies, Vol. 85, 2023, 30-35 AHFE
CN102542091B (zh) 一种光电成像过程软件仿真平台的实现方法
Li et al. Reconstruction of Film and TV Scenes Based on Computer-Aided Design and Machine Vision
XUHUI A Design Method of Group Animation Fusion Motion Capturing Data Based on Virtual Reality Technology
CN109784191B (zh) 一种基于商图像的多任务人脸光照编辑方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination