CN113158802A - 智慧场景分割技术 - Google Patents

智慧场景分割技术 Download PDF

Info

Publication number
CN113158802A
CN113158802A CN202110303480.9A CN202110303480A CN113158802A CN 113158802 A CN113158802 A CN 113158802A CN 202110303480 A CN202110303480 A CN 202110303480A CN 113158802 A CN113158802 A CN 113158802A
Authority
CN
China
Prior art keywords
scene
segmentation
semantic
module
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110303480.9A
Other languages
English (en)
Inventor
汤伟建
许光宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University of Science and Technology
Original Assignee
Anhui University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University of Science and Technology filed Critical Anhui University of Science and Technology
Priority to CN202110303480.9A priority Critical patent/CN113158802A/zh
Publication of CN113158802A publication Critical patent/CN113158802A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene
    • G06V20/36Indoor scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/35Categorising the entire scene, e.g. birthday party or wedding scene
    • G06V20/38Outdoor scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开智慧场景分割技术,涉及机器学习领域,由提取场景模块和场景分割设备组成。使用EFFNet语义分割模型作为智慧场景分割技术的核心技术,解决了传统语义分割方法实时性、效率低的问题,EFFNet语义分割模型嵌入到智慧场景分割技术当中,能够快速稳定地分割所给场景的语义分割图,避免效率低、实时性差、性能不稳定的问题。本发明的工艺简单、操作容易、可移植性好,能够降低保存和运输的成本。

Description

智慧场景分割技术
技术领域
本发明涉及机器学习领域,具体涉及是一种基于深度神经网络的智慧场景分割技术及其处理方法。
背景技术
机器学习是一门专注于研究计算机怎么样模拟或实现人类的学习能力,以获得新的知识或技能,重新组织已有的知识结构使其不断改善自身性能的学科。深度神经网络属于机器学习的一个分支,起初为了模仿人类的大脑结构所提出的方法,由于深度神经网络的强大特征表示能力,使其在许多高级计算机视觉任务中快速发展,例如图像分类、目标检测和语义分割。
智慧场景分割技术的核心是语义分割技术,能够依靠所给的大量数据训练出一个语义分割模型,该模型能够自动分割所给场景材料并且不需要人类的干预。在早期的语义分割方法中,不仅处理时间长,而且处理的效果也不好。在基于深度神经网络的语义分割方法出现之后,不仅分割场景的效果好、时间短,而且能够真正应用到现实生活当中。
智慧场景分割技术是一种耗时短、实时性、易嵌入、高效率的语义分割技术,且场景分割装置简单、操作简单、制造简单,易于与其它的高级计算机视觉任务相结合,因此能应用在很多领域,如汽车的无人驾驶系统、室内的场景分割、医疗影像系统和地理信息系统。
发明内容
本发明目的在于提供一种智慧场景分割技术及其处理方法,使用EFFNet语义分割模型代替传统的语义分割方法,能够保证场景分割的实时性和高效率。
本发明的目的可以通过以下技术方案实现:
一种智慧场景分割技术,其特征在于:所述智慧场景分割技术由提取场景模块和场景分割设备组合而成;所述提取场景模块为高清海康威视C6记录仪。
进一步的,所述场景分割设备由EFFNet语义分割模型和小型超级算力设备组成;所述的小型超级算力设备由英特尔Core i9-9900K@3.60GHz八核处理器、技嘉C246-WU4-CF(C246芯片组)主板、威刚DDR42666MHz(32GB)内存、智能高清显示器和Nvidia GeForce RTX3080显卡组成。
进一步的,所述EFFNet语义分割模型由ResNet编码器网络、特征重用模块、特征融合模块、全局池化模块和空间信息模块组成;所述ResNet编码器网络为ResNet50。
进一步的,所述特征重用模块由两个输入变量、一个特征图拼接操作、一个1×1卷积层、两个3×3卷积层、两个激活函数和一个逐元素相加操作组成,在上采样阶段为模型补充高层语义信息。
进一步的,所述特征融合模块由两个输入变量、二个1×1卷积层、一个特征图拼接操作、一个3×3卷积层组成、一个注意力机制模块、三个激活函数和一个逐元素相加操作组成,能够高效融合不同阶段的高层语义信息和空间信息;所述注意力机制模块由一个输入变量、一个全局池化层、两个全连接层、两个激化函数、一个尺度缩放操作和一个逐元素相乘操作组成,能使特征融合模块学习到带有区分力的特征图。
进一步的,所述全局池化模块由一个输入变量、一个自适应全局池化层、一个1×1卷积层和一个尺度缩放操作组成,为模型补充全局信息。
进一步的,所述空间信息模块由一个输入变量、一个3×3卷积层、一个平均池化层、一个激化函数和一个特征图拼接操作组成,在上采样阶段为模型补充语义类别信息。
一种智慧场景分割技术的处理方法,包括如下步骤:
1)提取场景模块实时录取所需场景分割的视频;
2)视频传送到场景分割设备中,通过处理器将视频分解成多张图像;
3)EFFNet语义分割模型实时处理多张图像,得到多张语义图像;
4)处理器将多张语义图像压缩并恢复视频格式,再传输到智能高清显示器;
5)智能高清显示器动态显示场景分割。
进一步的,所述EFFNet语义分割模型在语义分割数据集上训练模型参数,之后将训练所得到的参数载入到模型中。
本发明的有益效果:
1、本发明提供的一种智慧场景分割技术,采用EFFNet语义分割模型作为核心技术,解决了传统语义分割方法实时性、效率低的问题,EFFNet语义分割模型嵌入到智慧场景分割当中,能够快速稳定地分割所给场景的语义分割图,避免效率低、实时性差、性能不稳定的问题。
2、本发明基于EFFNet语义分割模型的智慧场景分割技术的制备工艺简单、易于操作、也可进行大规模生产;制备出的设备容易嵌入在多种高级计算机视觉任务当中,相比较传统的场景分割方法,本发明的可移植性更加好,同时能够降低保存和运输的成本。
附图说明
下面结合附图对本发明作进一步的说明:
图1是本发明实例1的智慧场景分割技术的处理流程图;
图2是本发明实例1的EFFNet语义分割模型的网络架构图;
图3是本发明实例1的EFFNet语义分割模型中的特征融合模块图;
图4是本发明实例1的EFFNet语义分割模型中的注意力机制模块图;
图5是本发明实例1的EFFNet语义分割模型中的特征融合模块图;
图6是本发明实例1的EFFNet语义分割模型中的空间信息模块图;
图7是本发明实例1的EFFNet语义分割模型中网络参数配置图;
图8是本发明实例1的智慧场景分割技术的效果图;
图9是本发明实例2的智慧场景分割技术的效果图;
图10是本发明实例4的智慧场景分割技术的效果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例1:
一种智慧场景分割技术的处理方法,操作步骤如下:
(1)、高清海康威视C6记录仪实时录取汽车道路场景的视频片段,通过数据线传输到场景分割设备当中;
(2)、场景设备中的英特尔Core i9-9900K@3.60GHz八核处理器将视频处理成一帧一帧的图像,通过接口将处理过后的图像传输到EFFNet语义分割模型中;
(3)、EFFNet语义分割模型接收处理过后的汽车道路场景图像,图像经过多种处理转变成向量形式,之后进入模型中提取特征,经过一系列的图像下采样、卷积、池化、逐元素相乘、逐元素相加、上采样等操作,得到一张张具有多种分类的语义分割图,分类数依据所训练的道路场景分割数据集而变化,此时的多张图像均已标注出不同的种类,比如有人、自行车、小汽车、公交车、汽车行驶车道、红绿灯、斑马线、树木、建筑、栏杆等其它类别;
(4)处理器实时处理将语义分割图,先恢复图像格式再对图像组合成视频格式,之后压缩视频,以减少内存的消耗;
(5)智能高清显示器实时显示汽车道路场景的语义分割视频,在汽车行驶,显示器一直显示EFFNet语义分割模型处理后视频,在视频中,人、小汽车、人行道、公交车、自行车等都有了不同颜色的标记。
测试结果:在晴天、通信良好的环境下,测试该智慧场景分割技术的处理准确度为73.13%,每秒处理帧数为25。
实施例2:
一种智慧场景分割技术的处理方法,操作步骤如下:
(1)、高清海康威视C6记录仪实时录取室外场景的视频片段,通过数据线传输到场景分割设备当中;
(2)、场景设备中的英特尔Core i9-9900K@3.60GHz八核处理器将视频处理成一帧一帧的图像,通过接口将处理过后的图像传输到EFFNet语义分割模型中;
(3)、EFFNet语义分割模型接收处理过后的室外场景图像,图像经过多种处理转变成向量形式,之后进入模型中提取特征,经过一系列的图像下采样、卷积、池化、逐元素相乘、逐元素相加、上采样等操作,得到一张张具有多种分类的语义分割图,分类数依据所训练的室外场景分割数据集而变化,此时的多张图像均已标注出不同的种类,比如有人、自行车、小汽车、公交车、鸟类、马、羊、熊、猫、狗、树木、建筑物等其它类别;
(4)处理器实时处理将语义分割图,先恢复图像格式再对图像组合成视频格式,之后压缩视频,以减少内存的消耗;
(5)智能高清显示器实时显示室外场景的语义分割视频,在整个过程中,显示器一直显示EFFNet语义分割模型处理后视频,在视频中,人、自行车、小汽车、公交车、鸟类、马、羊、熊、猫、狗、树木、建筑物等都有了不同颜色的标记。
测试结果:在晴天、通信良好的环境下,测试该智慧场景分割技术的处理准确度为75.22%,每秒处理帧数为31。
实施例3:
一种智慧场景分割技术的处理方法,操作步骤如下:
(1)、高清海康威视C6记录仪实时录取室内场景的视频片段,通过数据线传输到场景分割设备当中;
(2)、场景设备中的英特尔Core i9-9900K@3.60GHz八核处理器将视频处理成一帧一帧的图像,通过接口将处理过后的图像传输到EFFNet语义分割模型中;
(3)、EFFNet语义分割模型接收处理过后的室内场景图像,图像经过多种处理转变成向量形式,之后进入模型中提取特征,经过一系列的图像下采样、卷积、池化、逐元素相乘、逐元素相加、上采样等操作,得到一张张具有多种分类的语义分割图,分类数依据所训练的室内场景分割数据集而变化,此时的多张图像均已标注出不同的种类,比如有桌子、床、枕头、柜子、沙发、电脑等其它类别;
(4)处理器实时处理将语义分割图,先恢复图像格式再对图像组合成视频格式,之后压缩视频,以减少内存的消耗;
(5)智能高清显示器实时显示室内场景的语义分割视频,在整个过程中,显示器一直显示EFFNet语义分割模型处理后视频,在视频中,桌子、床、枕头、柜子、沙发、电脑等都有了不同颜色的标记。
测试结果:在光照良好的环境下,测试该智慧场景分割技术的处理准确度为65.46%,每秒处理帧数为18。
实施例4:
一种智慧场景分割技术的处理方法,操作步骤如下:
(1)、高清记录仪实时录取动物场景的视频片段,通过数据线传输到场景分割设备当中;
(2)、场景设备中的处理器将视频处理成一帧一帧的图像,通过接口将处理过后的图像传输到EFFNet语义分割模型中;
(3)、EFFNet语义分割模型接收处理过后的动物场景图像,图像经过多种处理转变成向量形式,之后进入模型中提取特征,经过一系列的图像下采样、卷积、池化、逐元素相乘、逐元素相加、上采样等操作,得到一张张具有多种分类的语义分割图,分类数依据所训练的动物场景分割数据集而变化,此时的多张图像均已标注出不同的种类,比如有猫、狗、羊、马等其它类别;
(4)处理器实时处理将语义分割图,先恢复图像格式再对图像组合成视频格式,之后压缩视频,以减少内存的消耗;
(5)高清显示器实时显示动物场景的语义分割视频,在整个过程中,显示器一直显示 EFFNet语义分割模型处理后视频,在视频中,猫、狗、羊、马等都有了不同颜色的标记。
测试结果:在晴天的环境下,测试该智慧场景分割技术的处理准确度为86.5%,每秒处理帧数为32。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神和基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (9)

1.智慧场景分割技术,其特征在于:所述智慧场景分割技术由提取场景模块和场景分割设备组合而成;所述提取场景模块为高清海康威视C6记录仪。
2.根据权利要求1所述的智慧场景分割技术,其特征在于:所述场景分割设备由EFFNet语义分割模型和小型超级算力设备组成;所述小型超级算力设备由英特尔Core i9-9900K@ 3.60GHz八核处理器、技嘉C246-WU4-CF(C246芯片组)主板、威刚DDR42666MHz(32GB)内存、智能高清显示器和Nvidia GeForce RTX 3080显卡组成。
3.根据权利要求1所述的智慧场景分割技术,其特征在于:所述EFFNet语义分割模型由ResNet编码器网络、特征重用模块、特征融合模块、全局池化模块和空间信息模块组成;所述ResNet编码器网络为ResNet50。
4.根据权利要求1所述的智慧场景分割技术,其特征在于:所述特征重用模块由两个输入变量、一个特征图拼接操作、一个1×1卷积层、两个3×3卷积层、两个激活函数和一个逐元素相加操作组成,在上采样阶段为模型补充高层语义信息。
5.根据权利要求1所述的智慧场景分割技术,其特征在于:所述特征融合模块由两个输入变量、二个1×1卷积层、一个特征图拼接操作、一个3×3卷积层组成、一个注意力机制模块、三个激活函数和一个逐元素相加操作组成,能够高效融合不同阶段的高层语义信息和空间信息;所述注意力机制模块由一个输入变量、一个全局池化层、两个全连接层、两个激化函数、一个尺度缩放操作和一个逐元素相乘操作组成,能使特征融合模块学习到带有区分力的特征图。
6.根据权利要求1所述的智慧场景分割技术,其特征在于:所述全局池化模块由一个输入变量、一个自适应全局池化层、一个1×1卷积层和一个尺度缩放操作组成,为模型补充全局信息。
7.根据权利要求1所述的智慧场景分割技术,其特征在于:空间信息模块由一个输入变量、一个3×3卷积层、一个平均池化层、一个激化函数和一个特征图拼接操作组成,在上采样阶段为模型补充语义类别信息。
8.根据权利要求1-7任一项所述的智慧场景分割技术的处理方法,其特征在于:包括如下步骤:
1)提取场景模块实时录取所需场景分割的视频;
2)视频传送到场景分割设备中,通过处理器将视频分解成多张图像;
3)EFFNet语义分割模型实时处理多张图像,得到多张语义图像;
4)处理器将多张语义图像压缩并恢复视频格式,再传输到智能高清显示器;
5)智能高清显示器动态显示场景分割。
9.根据权利要求8所述的智慧场景分割技术的处理方法,其特征在于:所述EFFNet语义分割模型在语义分割数据集上训练模型参数,之后将训练所得到的参数载入到模型中。
CN202110303480.9A 2021-03-22 2021-03-22 智慧场景分割技术 Pending CN113158802A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110303480.9A CN113158802A (zh) 2021-03-22 2021-03-22 智慧场景分割技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110303480.9A CN113158802A (zh) 2021-03-22 2021-03-22 智慧场景分割技术

Publications (1)

Publication Number Publication Date
CN113158802A true CN113158802A (zh) 2021-07-23

Family

ID=76887908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110303480.9A Pending CN113158802A (zh) 2021-03-22 2021-03-22 智慧场景分割技术

Country Status (1)

Country Link
CN (1) CN113158802A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107153670A (zh) * 2017-01-23 2017-09-12 合肥麟图信息科技有限公司 基于多幅图像融合的视频检索方法及系统
CN109740608A (zh) * 2018-12-28 2019-05-10 北京工业大学 一种基于深度学习的图像分割方法
CN111161279A (zh) * 2019-12-12 2020-05-15 中国科学院深圳先进技术研究院 医学图像分割方法、装置及服务器
CN111325751A (zh) * 2020-03-18 2020-06-23 重庆理工大学 基于注意力卷积神经网络的ct图像分割系统
CN112330681A (zh) * 2020-11-06 2021-02-05 北京工业大学 一种基于注意力机制的轻量级网络实时语义分割方法
CN112418027A (zh) * 2020-11-11 2021-02-26 青岛科技大学 一种改进U-Net网络的遥感影像道路提取方法
CN112464734A (zh) * 2020-11-04 2021-03-09 昆明理工大学 一种基于视觉的四足动物行走运动特征自动识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107153670A (zh) * 2017-01-23 2017-09-12 合肥麟图信息科技有限公司 基于多幅图像融合的视频检索方法及系统
CN109740608A (zh) * 2018-12-28 2019-05-10 北京工业大学 一种基于深度学习的图像分割方法
CN111161279A (zh) * 2019-12-12 2020-05-15 中国科学院深圳先进技术研究院 医学图像分割方法、装置及服务器
CN111325751A (zh) * 2020-03-18 2020-06-23 重庆理工大学 基于注意力卷积神经网络的ct图像分割系统
CN112464734A (zh) * 2020-11-04 2021-03-09 昆明理工大学 一种基于视觉的四足动物行走运动特征自动识别方法
CN112330681A (zh) * 2020-11-06 2021-02-05 北京工业大学 一种基于注意力机制的轻量级网络实时语义分割方法
CN112418027A (zh) * 2020-11-11 2021-02-26 青岛科技大学 一种改进U-Net网络的遥感影像道路提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIN ZHANG等: "Spatial–Spectral Feature Refinement for", 《SENSORS》 *
王雨: "面向自动驾驶场景的高效实时语义分割方法研究", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 *

Similar Documents

Publication Publication Date Title
CN103578119B (zh) 基于超像素的Codebook动态场景中目标检测方法
CN110147794A (zh) 一种基于深度学习的无人车室外场景实时分割方法
Zhou et al. Self-attention feature fusion network for semantic segmentation
CN112906617B (zh) 一种基于手部检测的驾驶员异常行为识别方法与系统
CN110378222A (zh) 一种输电线路防震锤目标检测与缺陷识别方法及装置
CN111784623A (zh) 图像处理方法、装置、计算机设备和存储介质
Gaihua et al. A serial-parallel self-attention network joint with multi-scale dilated convolution
CN114550053A (zh) 一种交通事故定责方法、装置、计算机设备及存储介质
CN116189180A (zh) 一种城市街景广告图像分割方法
CN113627402A (zh) 一种图像识别方法及相关装置
US20230186436A1 (en) Method for fine-grained detection of driver distraction based on unsupervised learning
CN113793341B (zh) 一种自动驾驶场景语义分割方法、电子设备及可读介质
Xu et al. Tiny FCOS: A lightweight anchor-free object detection algorithm for mobile scenarios
Guo et al. Scale region recognition network for object counting in intelligent transportation system
CN115760886B (zh) 基于无人机鸟瞰图的地块划分方法、装置及相关设备
CN111951260B (zh) 基于部分特征融合卷积神经网络实时目标计数系统及方法
CN113158802A (zh) 智慧场景分割技术
CN111783691A (zh) 基于畜类图像语义感知的养殖舍影像大数据采集分析方法
CN116824274A (zh) 小样本细粒度图像分类方法及系统
CN116612427A (zh) 一种基于改进的轻量型YOLOv7的密集行人检测系统
CN109635764A (zh) 一种基于多特征线性时序编码的人体行为识别方法及系统
CN115497140A (zh) 一种基于YOLOv5l和注意力机制的实时表情识别方法
Yin Albert et al. Identifying and Monitoring Students’ Classroom Learning Behavior Based on Multisource Information
CN112580696A (zh) 一种基于视频理解的广告标签分类方法、系统及设备
Li Convolutional Neural Network-Based Virtual Reality Real-Time Interactive System Design for Unity3D

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210723