CN111310859A - 一种用于多媒体展示中的快速人工智能数据训练系统 - Google Patents
一种用于多媒体展示中的快速人工智能数据训练系统 Download PDFInfo
- Publication number
- CN111310859A CN111310859A CN202010224018.5A CN202010224018A CN111310859A CN 111310859 A CN111310859 A CN 111310859A CN 202010224018 A CN202010224018 A CN 202010224018A CN 111310859 A CN111310859 A CN 111310859A
- Authority
- CN
- China
- Prior art keywords
- module
- human body
- artificial intelligence
- intelligence data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Psychiatry (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种用于多媒体展示中的快速人工智能数据训练系统,其特征在于,包括:输入端、处理端和发布端,输入端包括:人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块,处理端包括:人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块,发布端包括:训练数据集、云端发布模块、后台管理系统。本发明训练快速成本低。
Description
技术领域
本发明涉及一种用于多媒体展示中的快速人工智能数据训练系统,属于人工智能领域。
背景技术
现有的方法制作一个人工智能有效的识别模型需要不低于10万个有效样本与GPU集群进行深度学习,这种方法成本太高,样本需要大量人工标定,效率低,标错率高。
由于在训练过程中正样本数据标定与负样本数据有冲突时会导致训练失败,训练周期长,导致应用软件识别时间过长。
训练过程中出错率高,虽然最后识别概率能够达到99.99%行业要要求,但对于展览行业更多是演示型,对响应时间要求较高,合格率达到95%已经完全满足需求。
展示行业一般开发周期时间都比较短,属于定制类型。每个项目都要根据客户要求重新训练,由于客户不熟悉具体原理,提供的样本资料存在很多缺陷,往往最后导致项目结果不太理想,而人工智能开发人员只熟悉自己本专业的内的工作,在这种条件下开发的人工智能技术比较机械。
发明内容
本发明的目的在于提供一种用于多媒体展示中的快速人工智能数据训练系统,以快速和低成本的开发展示行业的人工智能动作识别模型。
本发明采用了如下技术方案:
一种用于多媒体展示中的快速人工智能数据训练系统,其特征在于,包括:
输入端、处理端和发布端,
输入端包括:
人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块
处理端包括:人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块,
发布端包括:训练数据集、云端发布模块、后台管理系统。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还包括:
预置的三维人体模型骨骼参数。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:
人体生成模块生成人体模型,人体模型包含人体样本标准模型和人体动作模型。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
专家监督模块对训练过程中的参数进行调整。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
归一化样本生成器模块用于快速目标标定、快速生成标准样本以及自动排序。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:归一化生成模块的功能包括模型设置、动作设置、灯光设置、特写设置、遮挡设置、阴影设置以及场景模拟设置,
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:分类器模块预训练。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:人体采集双目摄像机,用于模拟人类双眼定位与测距。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:人体采集双目摄像机的捕捉时间设置为3S。
进一步,本发明的用于多媒体展示中的快速人工智能数据训练系统,还具有这样的特征:人体生成模块中提供对人体三维数字模型的精度进行调整的选项。
发明的有益效果:本发明的用于多媒体展示中的快速人工智能数据训练系统,具有如下优点:
1.解决了人工智能人体动作识别过程中缺乏足够有效的人体样本数量和有效样本质量的问题。
2.由于引入监督学习模块,提高了样本质量从而降低了样本数量的要求,同时保证了人体姿态识别的实时性和准确性。
3.本发明注重提高客户参与程度,客户是本行业的专家,而研发人员更熟悉技术,通过专家监督学习模块将专家经验结合到人工智能之中,识别速度比一般方法提高3-5倍。
4.由于多媒体项目开发周期比较短,预算有限,本发明实施成本较低,能够满足一些中小型企业节约成本的需求。
5.提供算法开源与部分训练数据共享,吸引更多的开发者。
附图说明
图1是用于多媒体展示中的快速人工智能数据训练系统的结构框图。
具体实施方式
以下结合附图来进一步说明本发明的技术方案。
如图1所示,用于多媒体展示中的快速人工智能数据训练系统,包括:输入端、处理端和发布端。
输入端包括:
人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块。
其中,人体采集双目摄像机,用于模拟人类双眼定位与测距。该相机模拟人类双眼定位与测距的功能,系统人体捕捉时间为3S,然后将生成人体的三维数字模型,其中模型精度可以调整,避免采集精度过高,模型过大的问题。从而提高扫描速度。
处理端包括:
人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块。
其中,人体生成模块生成人体模型,人体模型包含人体样本标准模型和人体动作模型。并且人体生成模块中提供对人体三维数字模型的精度进行调整的选项。
归一化样本生成器模块用于快速目标标定、快速生成标准样本以及自动排序。归一化生成模块的功能包括模型设置、动作设置、灯光设置、特写设置、遮挡设置、阴影设置以及场景模拟设置。
分类器模块对模型进行预训练。
模型训练模块中具有预置的三维人体模型骨骼参数。
专家监督模块对训练过程中的参数进行调整。深度前馈指导方式包括数据集增强和参数范数惩罚。系统有行业专家参与的接口,使得数据训练从单纯的依靠算法与GPU运算变成“行业专家智能模式”。
建模过程中可以根据客户要求将采集到模型绑定相应的人体基本模型骨骼,也可以绑定客户定制的动作模型。
发布端包括:
训练数据集、云端发布模块、后台管理系统。
专家还可以重新调整数据集。云端发布模块将训练数据集发布。后台管理系统对训练数据集进行后期管理。
本发明的方法应用于展览展示行业中的应用,而非工商业性质的用途。
将训练数据集可以开源,从而为其他开发者提供一套基准数据库。
本实施方式只需要准备活体人10位,即可快速训练出人体模型,相较于传统方式,相应速度识别时间都比一般方法提高3-5倍。也可以在5个工作日内提供4-5万个分辨率在60*60像素的正样本,对正样品即人体进行归一化处理。
Claims (10)
1.一种用于多媒体展示中的快速人工智能数据训练系统,其特征在于,包括:
输入端、处理端和发布端,
输入端包括:
人体采集双目摄像机、高清相机、绿幕、自动抠图软件以及专家交互模块,
处理端包括:人体生成模块、渲染器模块、归一化生成模块、分类器模块、模型训练模块、专家监督模块,
发布端包括:训练数据集、云端发布模块、后台管理系统。
2.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,还包括:
预置的三维人体模型骨骼参数。
3.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统:
人体生成模块生成人体模型,人体模型包含人体样本标准模型和人体动作模型。
4.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
专家监督模块对训练过程中的参数进行调整。
5.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
归一化样本生成器模块用于快速目标标定、快速生成标准样本以及自动排序。
6.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
归一化生成模块的功能包括模型设置、动作设置、灯光设置、特写设置、遮挡设置、阴影设置以及场景模拟设置。
7.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
分类器模块预训练。
8.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
人体采集双目摄像机,用于模拟人类双眼定位与测距。
9.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
人体采集双目摄像机的捕捉时间设置为3S。
10.如权利要求1所述的用于多媒体展示中的快速人工智能数据训练系统,其特征在于:
人体生成模块中提供对人体三维数字模型的精度进行调整的选项。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010224018.5A CN111310859A (zh) | 2020-03-26 | 2020-03-26 | 一种用于多媒体展示中的快速人工智能数据训练系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010224018.5A CN111310859A (zh) | 2020-03-26 | 2020-03-26 | 一种用于多媒体展示中的快速人工智能数据训练系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111310859A true CN111310859A (zh) | 2020-06-19 |
Family
ID=71162524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010224018.5A Pending CN111310859A (zh) | 2020-03-26 | 2020-03-26 | 一种用于多媒体展示中的快速人工智能数据训练系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310859A (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103268495A (zh) * | 2013-05-31 | 2013-08-28 | 公安部第三研究所 | 计算机系统中基于先验知识聚类的人体行为建模识别方法 |
CN105741356A (zh) * | 2016-02-06 | 2016-07-06 | 鹤壁职业技术学院 | 一种人体解剖教学系统 |
CN106022929A (zh) * | 2016-05-27 | 2016-10-12 | 大连楼兰科技股份有限公司 | 基于专家系统的碰撞事故定损方法及系统 |
CN106022211A (zh) * | 2016-05-04 | 2016-10-12 | 北京航空航天大学 | 一种利用手势控制多媒体设备的方法 |
US20160342861A1 (en) * | 2015-05-21 | 2016-11-24 | Mitsubishi Electric Research Laboratories, Inc. | Method for Training Classifiers to Detect Objects Represented in Images of Target Environments |
US9760690B1 (en) * | 2016-03-10 | 2017-09-12 | Siemens Healthcare Gmbh | Content-based medical image rendering based on machine learning |
CN107595239A (zh) * | 2015-06-02 | 2018-01-19 | 杭州镜之镜科技有限公司 | 个人用眼监控系统 |
CN108256975A (zh) * | 2018-01-23 | 2018-07-06 | 喻强 | 基于人工智能为虚拟试衣者提供三维效果的穿搭系统及方法 |
CN108563742A (zh) * | 2018-04-12 | 2018-09-21 | 王海军 | 自动创建人工智能图像识别训练素材与标注文件的方法 |
CN109767488A (zh) * | 2019-01-23 | 2019-05-17 | 广东康云科技有限公司 | 基于人工智能的三维建模方法及系统 |
US20190295278A1 (en) * | 2018-03-20 | 2019-09-26 | Electronics And Telecommunications Research Institute | Apparatus and method for generating synthetic training data for motion recognition |
WO2019223382A1 (zh) * | 2018-05-22 | 2019-11-28 | 深圳市商汤科技有限公司 | 单目深度估计方法及其装置、设备和存储介质 |
CN110544301A (zh) * | 2019-09-06 | 2019-12-06 | 广东工业大学 | 一种三维人体动作重建系统、方法和动作训练系统 |
CN110567974A (zh) * | 2019-09-30 | 2019-12-13 | 华中科技大学 | 一种基于云端人工智能表面缺陷检测系统 |
-
2020
- 2020-03-26 CN CN202010224018.5A patent/CN111310859A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103268495A (zh) * | 2013-05-31 | 2013-08-28 | 公安部第三研究所 | 计算机系统中基于先验知识聚类的人体行为建模识别方法 |
US20160342861A1 (en) * | 2015-05-21 | 2016-11-24 | Mitsubishi Electric Research Laboratories, Inc. | Method for Training Classifiers to Detect Objects Represented in Images of Target Environments |
CN107595239A (zh) * | 2015-06-02 | 2018-01-19 | 杭州镜之镜科技有限公司 | 个人用眼监控系统 |
CN105741356A (zh) * | 2016-02-06 | 2016-07-06 | 鹤壁职业技术学院 | 一种人体解剖教学系统 |
US9760690B1 (en) * | 2016-03-10 | 2017-09-12 | Siemens Healthcare Gmbh | Content-based medical image rendering based on machine learning |
CN106022211A (zh) * | 2016-05-04 | 2016-10-12 | 北京航空航天大学 | 一种利用手势控制多媒体设备的方法 |
CN106022929A (zh) * | 2016-05-27 | 2016-10-12 | 大连楼兰科技股份有限公司 | 基于专家系统的碰撞事故定损方法及系统 |
CN108256975A (zh) * | 2018-01-23 | 2018-07-06 | 喻强 | 基于人工智能为虚拟试衣者提供三维效果的穿搭系统及方法 |
US20190295278A1 (en) * | 2018-03-20 | 2019-09-26 | Electronics And Telecommunications Research Institute | Apparatus and method for generating synthetic training data for motion recognition |
CN108563742A (zh) * | 2018-04-12 | 2018-09-21 | 王海军 | 自动创建人工智能图像识别训练素材与标注文件的方法 |
WO2019223382A1 (zh) * | 2018-05-22 | 2019-11-28 | 深圳市商汤科技有限公司 | 单目深度估计方法及其装置、设备和存储介质 |
CN109767488A (zh) * | 2019-01-23 | 2019-05-17 | 广东康云科技有限公司 | 基于人工智能的三维建模方法及系统 |
CN110544301A (zh) * | 2019-09-06 | 2019-12-06 | 广东工业大学 | 一种三维人体动作重建系统、方法和动作训练系统 |
CN110567974A (zh) * | 2019-09-30 | 2019-12-13 | 华中科技大学 | 一种基于云端人工智能表面缺陷检测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shan et al. | Research on landscape design system based on 3D virtual reality and image processing technology | |
CN104766270A (zh) | 一种基于鱼眼镜头的虚实光照融合方法 | |
CN108810408A (zh) | 一种摄像头控制方法及装置和系统 | |
CN102096941A (zh) | 虚实融合环境下的光照一致性方法 | |
WO2020151426A1 (zh) | 基于人工智能的三维建模方法及系统 | |
CN111292408B (zh) | 一种基于注意力机制的阴影生成方法 | |
CN104574481B (zh) | 一种三维角色动画非线性修改方法 | |
CN113297701B (zh) | 多种类工业零件堆叠场景的仿真数据集生成方法及装置 | |
CN112669422B (zh) | 仿真3d数字人生成方法、装置、电子设备及存储介质 | |
CN108830216A (zh) | 一种视场可调的连续变焦目标识别系统及方法 | |
Gobron et al. | Retina simulation using cellular automata and GPU programming | |
Li | Film and TV animation production based on artificial intelligence AlphaGd | |
CN112634456B (zh) | 基于深度学习的复杂三维模型的实时高真实感绘制方法 | |
CN111310859A (zh) | 一种用于多媒体展示中的快速人工智能数据训练系统 | |
WO2020228348A1 (zh) | 校园三维数字化建模方法、系统、装置及存储介质 | |
CN101751654A (zh) | 真实环境中采集的灯光信息在虚拟现实中的应用 | |
CN205486164U (zh) | 一种新型人脸3d表情动作识别系统 | |
CA3171844A1 (en) | Quantifying biotic damage on plant leaves, by convolutional neural networks | |
DE102022100517A1 (de) | Verwenden von intrinsischen funktionen zum schattenentrauschen in raytracinganwendungen | |
Zhang et al. | Face animation making method based on facial motion capture | |
Stereo et al. | Human Factors and Wearable Technologies, Vol. 85, 2023, 30-35 AHFE | |
CN102542091B (zh) | 一种光电成像过程软件仿真平台的实现方法 | |
Li et al. | Reconstruction of Film and TV Scenes Based on Computer-Aided Design and Machine Vision | |
XUHUI | A Design Method of Group Animation Fusion Motion Capturing Data Based on Virtual Reality Technology | |
CN109784191B (zh) | 一种基于商图像的多任务人脸光照编辑方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |