CN109815922A - 基于人工智能神经网络的轨道交通地面目标视频识别方法 - Google Patents
基于人工智能神经网络的轨道交通地面目标视频识别方法 Download PDFInfo
- Publication number
- CN109815922A CN109815922A CN201910087942.0A CN201910087942A CN109815922A CN 109815922 A CN109815922 A CN 109815922A CN 201910087942 A CN201910087942 A CN 201910087942A CN 109815922 A CN109815922 A CN 109815922A
- Authority
- CN
- China
- Prior art keywords
- artificial intelligence
- neural networks
- gene
- intelligence neural
- ground target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及一种基于人工智能神经网络的轨道交通地面目标视频识别方法,该方法采用可自我进化的人工智能神经网络,所述的识别方法包括:(1)输入适配过程,该过程对输入数据进行归一化、基因旋变、适当的卷积和池化,使之与中枢处理过程适配;(2)中枢处理过程,该过程根据数据源特性进行并行PipeLine或不并行处理运算,其中运算包括多层的卷积和池化;(3)输出识别过程,根据目前训练的网络,动态插入基因旋转因子,生成不同的输出特征进行输出。与现有技术相比,本发明具有识别效率高、识别精度高等优点。
Description
技术领域
本发明涉及轨道交通地面目标视频识别方法,尤其是涉及一种基于人工智能神经网络的轨道交通地面目标视频识别方法。
背景技术
对卷积神经网络的研究始于二十世纪80至90年代,时间延迟网络和LeNet-5是最早被证实有效的卷积神经网络算法。在二十一世纪后,随着数值计算设备的改进,卷积神经网络得到了快速发展,并被大量应用于计算机视觉、自然语言处理等领域。
2006年后,随着深度学习理论的完善,尤其是逐层学习和参数微调(fine-tuning)技术的出现,卷积神经网络开始快速发展,在结构上不断加深,各类学习和优化理论得到引入。自2012年的AlexNet开始,各类卷积神经网络多次成为ImageNet大规模视觉识别竞赛(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)的优胜算法,包括2013年的ZFNet、2014年的VGGNet、GoogLeNet和2015年的ResNet。
随着全世界发达国家推进人工智能研究成果后(如无人驾驶、机器人),其余有计算机科研实力的发展中国家也纷纷介入,各种人工智能深度学习模型层出不穷,仅视频目标检测算法模型就有二十多种,而且还在不断增加中。目前人工智能深度学习模型已经被大量用到视觉感知、语音识别、云计算及大数据分析、基于传感网络的边缘计算和物联网中,针对不同领域,需要不同的模型进行分类识别分析,给从事人工智能应用的计算机工程人员带来不少的困惑。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于人工智能神经网络的轨道交通地面目标视频识别方法。
本发明的目的可以通过以下技术方案来实现:
一种基于人工智能神经网络的轨道交通地面目标视频识别方法,该方法采用可自我进化的人工智能神经网络,所述的识别方法包括:
(1)输入适配过程,该过程对输入数据进行归一化、基因旋变、初步的卷积和池化,使之与中枢处理过程适配;
(2)中枢处理过程,该过程根据数据源特性进行并行PipeLine或不并行处理运算,其中运算包括多层的卷积和池化;
(3)输出识别过程,根据目前训练的网络,动态插入基因旋转因子,生成不同的输出特征进行输出。
优选地,所述的基因旋转因子为αλθ+β,其中λ为N阶单位矩阵,α为乘积因子,β为偏移量,θ为单位矩阵旋转角度。
优选地,通过所述的基因旋变因子可将已识别对象中更细节部分提取出来进行运算。
优选地,通过改变基因旋变因子的旋变角度和参数,可以得到一种识别对象的多种属性,其中识别对象包括图像和声音,多种属性包括人性别、服装颜色、表情。
优选地,所述的人工智能神经网络前期可利用原先训练神经网络得出输入适配层至输出适配层间所有层的训练参数,包括卷积层和池化层,将这些层中的参数固化,然后将基因旋变因子中的θ旋转1/N*360度,进行训练,根据误差反馈,修整α和β参数,如果能达到误差最小化并收敛,则满足要求,反之,则继续将θ旋转1/N*360度,继续训练。
优选地,所述的交通地面目标包括汽车、行人、指示牌和信号灯。
与现有技术相比,本发明具有以下优点:
1)识别效率高,根据目前训练的网络,动态插入基因旋转因子,生成不同的输出特征,而不用再经后期大量训练获得该类数据的另一种特征或属性,大大降低了训练成本,从而大大提高了识别效果;
2)识别精度高,网络可实现自我迭代进化,自行识别目标数据的多项特征或属性,从而大大解决了轨道交通地面目标(汽车、行人、指示牌、信号灯)视频识别问题。
附图说明
图1为基于YOLO的基因旋转改进模型示意图;
图2为本发明的进化神经网络示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
GoogLeNet和YOLO模型均是为图像分类而设计的,GoogLeNet是通过多次层累卷积叠加及拼接后,通过池化层、全连接层和SoftMax层运算输出结果,而YOLO是将一幅图像进行分割,然后通过卷积、全连接、拼接运算后输出结果。
而人类在多年的进化后,只用一种神经网络就适应了外界不同的输入(语音、图像和感觉),有科学家做过类似试验,可以将盲人的部分视觉神经经过一定的训练后也可感知声音,这个过程很好理解,婴儿从一种单一生殖细胞分化成各种不同类型的细胞,其中基因就起了主导作用。那有没有一种网络,如人类神经元,通过神经末稍感知外部输入,通过中枢传输和处理,最终至脑干端变成可以处理的脑电波(结果)呢?
脑神经网络架构,只是将全身神经网络的传感信号送到大脑皮层的不同部分进行处理,处理后的结果通过脑内部(绿色)的神经网络进行传输综合,从而形成我们人类特有的意志、情感和思想。
本发明的目的就是为了克服上述现有人工智能网络种类繁杂以及需要针对城市地面轨道交通不同应用场景(比如在已识别人类图像中识别出所穿衣服、表情、肢体动作)需要设计新的模型,并进行大量的训练,耗费了设计人员的大量时间。并利用人类长时间神经网络进化的思想,将现有神经网络改造进化,形成一种可自我进化的人工智能神经网络。本发明提供了一种简易方法,只需要一套数据模型和一整套训练集和测试集,就能完成相应的模型训练和最终的目标识别分类。
本发明的目的可以通过以下技术方案来实现:在一种类型的训练好的网络中引入基因旋变因子(αλθ+β),λ为N阶单位矩阵(等同于人类基因最小片段),α为乘积因子,β为偏移量,θ为单位矩阵旋转角度。通过基因旋变因子我们可以将已识别对象中更细节部分提取出来进行运算。
该网络前期可利用原先训练神经网络得出输入适配层至输出适配层间所有层的训练参数(卷积层和池化层),将这些层中的大多数参数固化,然后将基因旋变因子中的θ旋转1/N*360度,进行训练,根据误差反馈,修整α和β参数,如果能达到误差最小化并收敛,则满足要求,反之,则继续将θ旋转1/N*360度,继续训练。
如图1所示,图像识别训练使用YOLO模型,经过大量训练后能识别出某几类我们在应用中需要感知的物体,保存并复制该模型,在复制模型中的第一个卷积层后加入基因旋变层,对区域中兴趣区域特征进行提取,在最后一个卷积层前加入基因旋变层,将兴趣区域相关特征进行特征分类运算。插入因子的过程如人类神经元一样,在前端进行分类(视觉、听觉或感知),后端进行归一成如脑电波一样的信号,方便后期处理。
基因旋变层的插入个数根据应用的复杂程度而定,上述举例只是简要说明。
如附图2所示,首先训练某简单网络,即所标示分类输出那一行(无输入输出适配层),然后将该网络模型各参数固化(FROZEN),然后将归一化后的中间输出复制N份(N为特征数),把此每一份接入至基因旋变层,为了加快并行运算速度,在内存或硬件中扩展出输入适配层,将原模型归一化输出、基因旋变运算后结果拼接至输入适配层,输入适配层后为中枢运算网络,该网络可根据用户需求复杂化(比如采用GoogLeNet或YOLO网络),中枢运算网络进行卷积、池化或RELU运算,然后把各输出拼接至输出适配层,进行分类和特征识别计算,特征识别计算的输入为输出适配层对应的输出,经基因旋变、全连接和SoftMAX计算,得出该识别物的具象特征。
基因旋变层(αλθ+β)的各参数需要通过特征训练后确定,等后期计算机运算功能发达后,计算机通过随机步进变化参数可进行基因旋变进化,逐步分类出识别物的具象特征(类似于无监督学习),然后由人工将参数固化和标识,用于后期物体特征识别。
以上架构在使用时建议与原模型同时使用,这样在出分类结果时可以获得该结果的更详细特征(如识别行人的同时可以获取该行人的其它特征,如着装、表情、肢体、肤色等等)。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (6)
1.一种基于人工智能神经网络的轨道交通地面目标视频识别方法,其特征在于,该方法采用可自我进化的人工智能神经网络,所述的识别方法包括:
(1)输入适配过程,该过程对输入数据进行归一化、基因旋变、适当的卷积和池化,使之与中枢处理过程适配;
(2)中枢处理过程,该过程根据数据源特性进行并行PipeLine或不并行处理运算,其中运算包括多层的卷积和池化;
(3)输出识别过程,根据目前训练的网络,动态插入基因旋转因子,生成不同的输出特征进行输出。
2.根据权利要求1所述的一种基于人工智能神经网络的轨道交通地面目标视频识别方法,其特征在于,所述的基因旋转因子为αλθ+β,其中λ为N阶单位矩阵,α为乘积因子,β为偏移量,θ为单位矩阵旋转角度。
3.根据权利要求2所述的一种基于人工智能神经网络的轨道交通地面目标视频识别方法,其特征在于,通过所述的基因旋变因子可将已识别对象中更细节部分提取出来进行运算。
4.根据权利要求2所述的一种基于人工智能神经网络的轨道交通地面目标视频识别方法,其特征在于,通过改变基因旋变因子的旋变角度和参数,可以得到一种识别对象的多种属性,其中识别对象包括图像和声音,多种属性包括人性别、服装颜色、表情。
5.根据权利要求2所述的一种基于人工智能神经网络的轨道交通地面目标视频识别方法,其特征在于,所述的人工智能神经网络前期可利用原先训练神经网络得出输入适配层至输出适配层间所有层的训练参数,包括卷积层和池化层,将这些层中的参数固化,然后将基因旋变因子中的θ旋转1/N*360度,进行训练,根据误差反馈,修整α和β参数,如果能达到误差最小化并收敛,则满足要求,反之,则继续将θ旋转1/N*360度,继续训练。
6.根据权利要求2所述的一种基于人工智能神经网络的轨道交通地面目标视频识别方法,其特征在于,所述的交通地面目标包括汽车、行人、指示牌和信号灯。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910087942.0A CN109815922B (zh) | 2019-01-29 | 2019-01-29 | 基于人工智能神经网络的轨道交通地面目标视频识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910087942.0A CN109815922B (zh) | 2019-01-29 | 2019-01-29 | 基于人工智能神经网络的轨道交通地面目标视频识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109815922A true CN109815922A (zh) | 2019-05-28 |
CN109815922B CN109815922B (zh) | 2022-09-30 |
Family
ID=66605754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910087942.0A Active CN109815922B (zh) | 2019-01-29 | 2019-01-29 | 基于人工智能神经网络的轨道交通地面目标视频识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109815922B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298262A (zh) * | 2019-06-06 | 2019-10-01 | 华为技术有限公司 | 物体识别方法及装置 |
CN111461298A (zh) * | 2020-03-26 | 2020-07-28 | 广西电网有限责任公司电力科学研究院 | 一种用于断路器故障识别的卷积神经网络及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018073385A (ja) * | 2016-10-22 | 2018-05-10 | 俊之 坂本 | 画像処理装置及びプログラム |
CN108596917A (zh) * | 2018-04-19 | 2018-09-28 | 湖北工业大学 | 一种目标主骨架线提取方法 |
CN109102001A (zh) * | 2018-07-16 | 2018-12-28 | 东南大学 | 一种遗传基因改进神经网络的转子在线故障诊断方法 |
-
2019
- 2019-01-29 CN CN201910087942.0A patent/CN109815922B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018073385A (ja) * | 2016-10-22 | 2018-05-10 | 俊之 坂本 | 画像処理装置及びプログラム |
CN108596917A (zh) * | 2018-04-19 | 2018-09-28 | 湖北工业大学 | 一种目标主骨架线提取方法 |
CN109102001A (zh) * | 2018-07-16 | 2018-12-28 | 东南大学 | 一种遗传基因改进神经网络的转子在线故障诊断方法 |
Non-Patent Citations (2)
Title |
---|
I. EL-FEGHI ET AL.: "Automatic identification and localization of craniofacial landmarks using multi layer neural network", 《 MEDICAL IMAGE COMPUTING AND COMPUTER-ASSISTED INTERVENTION - MICCAI 2003》 * |
张强: "基于双目视觉的原木楞堆径级检测系统研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298262A (zh) * | 2019-06-06 | 2019-10-01 | 华为技术有限公司 | 物体识别方法及装置 |
WO2020244653A1 (zh) * | 2019-06-06 | 2020-12-10 | 华为技术有限公司 | 物体识别方法及装置 |
CN110298262B (zh) * | 2019-06-06 | 2024-01-02 | 华为技术有限公司 | 物体识别方法及装置 |
CN111461298A (zh) * | 2020-03-26 | 2020-07-28 | 广西电网有限责任公司电力科学研究院 | 一种用于断路器故障识别的卷积神经网络及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109815922B (zh) | 2022-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cai et al. | PiiGAN: generative adversarial networks for pluralistic image inpainting | |
Cheng et al. | Facial expression recognition method based on improved VGG convolutional neural network | |
Rombach et al. | Text-guided synthesis of artistic images with retrieval-augmented diffusion models | |
CN107169974A (zh) | 一种基于多监督全卷积神经网络的图像分割方法 | |
CN110059593B (zh) | 一种基于反馈卷积神经网络的面部表情识别方法 | |
US11223782B2 (en) | Video processing using a spectral decomposition layer | |
CN110909680A (zh) | 人脸图像的表情识别方法、装置、电子设备及存储介质 | |
CN108416397A (zh) | 一种基于ResNet-GCN网络的图像情感分类方法 | |
CN109815922A (zh) | 基于人工智能神经网络的轨道交通地面目标视频识别方法 | |
Chen et al. | Research on deep learning in the field of mechanical equipment fault diagnosis image quality | |
CN111950430A (zh) | 基于颜色纹理的多尺度妆容风格差异度量及迁移方法、系统 | |
Wang et al. | Functional and anatomical image fusion based on gradient enhanced decomposition model | |
CN113724354A (zh) | 基于参考图颜色风格的灰度图像着色方法 | |
Xu et al. | Virtual try-on network with attribute transformation and local rendering | |
Guo et al. | Multifeature extracting CNN with concatenation for image denoising | |
CN116012255A (zh) | 一种基于循环一致性生成对抗网络的低光图像增强方法 | |
Zhai et al. | An improved full convolutional network combined with conditional random fields for brain MR image segmentation algorithm and its 3D visualization analysis | |
CN109376651A (zh) | 一种基于cuda架构的gpu加速锋电位分类的系统 | |
CN116823596A (zh) | 一种驾驶状态图像数据集的增广方法、增广装置 | |
CN111368734A (zh) | 一种基于正常表情辅助的微表情识别方法 | |
Liang et al. | Deep convolution neural networks for automatic eyeglasses removal | |
Xu et al. | Deep learning algorithm in ancient relics image colour restoration technology | |
Verma et al. | Hmm-based convolutional lstm for visual scanpath prediction | |
Sun et al. | A unified framework for biphasic facial age translation with noisy-semantic guided generative adversarial networks | |
Lian et al. | Anime style transfer with spatially-adaptive normalization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |