CN114187549A - 场景分类模型的训练方法、装置、电子设备及存储介质 - Google Patents

场景分类模型的训练方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114187549A
CN114187549A CN202111496702.XA CN202111496702A CN114187549A CN 114187549 A CN114187549 A CN 114187549A CN 202111496702 A CN202111496702 A CN 202111496702A CN 114187549 A CN114187549 A CN 114187549A
Authority
CN
China
Prior art keywords
sample set
initial
classification model
target
scene classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111496702.XA
Other languages
English (en)
Inventor
吕铮
吕颖
韩佳琪
董小瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FAW Group Corp
Original Assignee
FAW Group Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FAW Group Corp filed Critical FAW Group Corp
Priority to CN202111496702.XA priority Critical patent/CN114187549A/zh
Publication of CN114187549A publication Critical patent/CN114187549A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了场景分类模型的训练方法、装置、电子设备及存储介质。其中,该方法包括:若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对训练样本集和测试样本集进行处理,得到目标训练样本集和目标测试样本集;根据目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型;根据目标测试样本集,对中间场景分类模型进行测试,得到目标场景分类模型。本申请实施例提供的技术方案,能够适用不同地区的场景的识别分类,并能够提高场景识别分类的精度。

Description

场景分类模型的训练方法、装置、电子设备及存储介质
技术领域
本申请实施例涉及智能驾驶技术领域,尤其涉及场景分类模型的训练方法、装置、电子设备及存储介质。
背景技术
智能驾驶是智能交通系统中汽车发展的新趋势,智能驾驶中的一个关键技术在于对道路场景的识别和分类。
在现有技术中,道路场景的识别分类技术在简单场景中能够实现高精度的识别分类,但是在复杂场景和稀有场景中还无法达到分类要求。此外,因不同地区的光照、遮挡、角度等自然因素的影响,难以将针对某一地区所训练得到的分类模型应用于对另一地区的道路场景的分类。因此,现有技术存在同一个分类模型在不同场景或不同地区下的识别分类精度差异甚大的缺点。因此,亟需设计一种场景分类模型,能够适用不同道路场景的识别分类,并提高场景识别分类的精度。
发明内容
本申请实施例提供了场景分类模型的训练方法、装置、电子设备及存储介质,能够适用不同地区的场景的识别分类,并能够提高场景识别分类的精度。
第一方面,本申请实施例提供了场景分类模型的训练方法,该方法包括:
若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对所述初始训练样本集和所述初始测试样本集进行处理,得到目标训练样本集和目标测试样本集;
根据所述目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型;
根据所述目标测试样本集,对所述中间场景分类模型进行测试,得到目标场景分类模型。
第二方面,本申请实施例提供了场景分类模型的训练装置,该装置包括:
样本处理模块,用于若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对所述初始训练样本集和所述初始测试样本集进行处理,得到目标训练样本集和目标测试样本集;
模型训练模块,用于根据所述目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型;
模型测试模块,用于根据所述目标测试样本集,对所述中间场景分类模型进行测试,得到目标场景分类模型。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请任意实施例所述的场景分类模型的训练方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现本申请任意实施例所述的场景分类模型的训练方法。
本申请实施例提供了场景分类模型的训练方法、装置、电子设备及存储介质,若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对训练样本集和测试样本集进行处理,得到目标训练样本集和目标测试样本集;根据目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型;根据目标测试样本集,对中间场景分类模型进行测试,得到目标场景分类模型。本申请方案能够适用不同地区的场景的识别分类,并能够提高场景识别分类的精度。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例提供的场景分类模型的训练方法的第一流程示意图;
图2为本申请实施例提供的场景分类模型的训练方法的第二流程示意图;
图3为本申请实施例提供的场景分类模型的训练装置的结构示意图;
图4是用来实现本申请实施例的场景分类模型的训练方法的电子设备的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
图1为本申请实施例提供的场景分类模型的训练方法的第一流程示意图,本实施例可适用于当初始训练样本集的特征分布和初始测试样本集的特征分布不一致时,对场景分类模型进行建模的情况。本实施例提供的场景分类模型的训练方法可以由本申请实施例提供的场景分类模型的训练装置来执行,该装置可以通过软件和/或硬件的方式实现,并集成在执行本方法的电子设备中。
参见图1,本实施例的方法包括但不限于如下步骤:
S110、若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对初始训练样本集和初始测试样本集进行处理,得到目标训练样本集和目标测试样本集。
其中,初始训练样本集中的场景数据和初始测试样本集中的场景数据属于不同地区。本申请对初始训练样本集和初始测试样本集具体什么地区的场景数据不做限定,可选的,初始训练样本集是东北地区的场景数据,初始测试样本集是南方地区的场景数据。
现有技术中,大部分对于场景分类模型的研究,通常假设训练样本集和测试样本集是服从同一特征分布。但是,若训练样本集与测试样本集的特征分布有明显差异,则会导致已训练完成的场景分类模型难以直接应用于对其他地区的场景数据的预测。为了解决这一问题,在本申请实施例中,当初始训练样本集中的场景数据和初始测试样本集中的场景数据属于不同地区时,那么初始训练样本集的特征分布和初始测试样本集的特征分布不一致,就可以采用迁移成分分析算法对训练样本集和测试样本集进行处理,以便缩小因地域等问题对不同地区的场景数据造成的特征分布的差异。将经处理的初始训练样本集和初始测试样本集分别作为目标训练样本集和目标测试样本集。
S120、根据目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型。
其中,初始场景分类模型可以是任意的具备分类识别功能的模型,可选的是支持向量机模型。
在本申请实施例中,首先,采用人工的方式对目标训练样本集进行场景分类,添加场景标签,以将目标训练样本集分为预设数量类别的场景样本,如四种类别的场景样本。然后,为初始场景分类模型构造多类分类器。最后,通过目标训练样本集对所构造的多类分类器进行训练,得到中间场景分类模型。
具体的,为初始场景分类模型构造多类分类器的方法可以是:直接将支持向量机模型中的二值分类器的目标函数进行修改,将多个分类的参数求解合并到一个最优化问题中,通过求解该最优化问题实现对多种场景的分类。这种方法看似简单,但其计算复杂度比较高,实现起来比较困难,只适合用于小型问题中;为初始场景分类模型构造多类分类器的方法还可以是:通过对支持向量机模型组合多个二值分类器,来实现多类分类器的构造,其中,可以使用现有技术中的构造方法进行构造。
可选的,根据目标训练样本集中样本类别,对初始场景分类模型中预设数量的多类分类器进行训练,得到每个多类分类器对应的模型参数,并得到中间场景分类模型。
在本申请实施例中,根据目标训练样本集中的多种类别的场景样本,通过采用多类分类器对多种类别的场景样本分别进行训练,得到每个多类分类器对应的模型参数;根据每个多类分类器对应的模型参数分别对每个多类分类器进行参数更新,得到中间场景分类模型
S130、根据目标测试样本集,对中间场景分类模型进行测试,得到目标场景分类模型。
在本申请实施例中,对根据目标训练样本集对初始场景分类模型进行训练之后,根据目标测试样本集对中间场景分类模型进行测试,得到目标场景分类模型。
可选的,通过目标测试样本集中的不同样本类别的样本,分别对中间场景分类模型中的每个多类分类器进行测试,得到每个多类分类器对应的测试结果;根据测试结果,对中间场景分类模型中的多类分类器进行优化,得到目标场景分类模型。
具体的,首先,采用人工的方式对目标测试样本集进行场景分类,添加场景标签,以将目标测试样本集分为预设数量类别的场景样本;然后,将不同类别的场景样本分别输入至经训练之后的不同的多类分类器中进行测试,得到每个多类分类器对应的不同类别的场景样本的测试结果;最后,根据该测试结果,挑选出满足预设标准的预设数量的多类分类器。
本实施例提供的技术方案,若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对训练样本集和测试样本集进行处理,得到目标训练样本集和目标测试样本集;根据目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型;根据目标测试样本集,对中间场景分类模型进行测试,得到目标场景分类模型。本申请在对初始场景分类模型进行训练之前,若判断出初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对训练样本集和测试样本集进行处理,以便缩小因地域等问题对不同地区的场景数据造成的特征分布的差异。本申请可以解决现有技术中的同一个场景分类模型在不同场景或不同地区下的识别分类精度差异甚大的缺点。本申请中的技术方案,能够适用不同地区的场景的识别分类,并能够提高场景识别分类的精度。
实施例二
图2为本申请实施例提供的场景分类模型的训练方法的第二流程示意图。本申请实施例是在上述实施例的基础上进行优化,具体优化为:增加了对初始训练样本集和初始测试样本集的处理过程进行详细的解释说明。
参见图2,本实施例的方法包括但不限于如下步骤:
S210、若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则分别计算初始训练样本集的特征矩阵和初始测试样本集的特征矩阵,并通过计算初始训练样本集的特征矩阵和初始测试样本集的特征矩阵的最大均值差异距离的最小值,得到目标训练样本集和目标测试样本集。
在本申请实施例中,若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对初始训练样本集和初始测试样本集进行处理,以得到目标训练样本集和目标测试样本集。
具体的,本步骤中采用迁移成分分析算法对初始训练样本集和初始测试样本集进行处理,得到目标训练样本集和目标测试样本集的具体过程可以通过以下四个子步骤实现:
S2101、分别计算初始训练样本集的特征矩阵和初始测试样本集的特征矩阵。
在本申请实施例中,分别提取初始训练样本集和初始测试样本集的特征,并将所提取出的初始训练样本集的特征变换为特征矩阵,将所提取出的初始测试样本集的特征为特征矩阵。
S2102、根据初始训练样本集的数量和初始测试样本集的数量,得到与样本集数量相关的中间矩阵。
在本申请实施例中,根据预设的计算规则,对初始训练样本集的数量和初始测试样本集的数量进行计算处理,得到与样本集数量相关的中间矩阵。
S2103、根据中间矩阵、初始训练样本集的特征矩阵、初始测试样本集的特征矩阵和预设核函数,求解初始训练样本集和初始测试样本集的最大均值差异距离,得到变换矩阵。
在本申请实施例中,根据中间矩阵、初始训练样本集的特征矩阵、初始测试样本集的特征矩阵和预设核函数,通过最大均值差异距离公式求解初始训练样本集和初始测试样本集的最大均值差异距离,将求解出的结果作为变换矩阵。其中,求解初始训练样本集和初始测试样本集的最大均值差异距离的具体过程是数学中的最优化问题,具体求解过程在此不做介绍。
S2104、分别对初始训练样本集和初始测试样本集乘以变换矩阵,得到目标训练样本集和目标测试样本集。
在本申请实施例中,经上述步骤,求解出变换矩阵之后,再依据该变换矩阵,对初始训练样本集的特征矩阵和初始测试样本集的特征矩阵进行变换,分别得到变换之后的初始训练样本集的特征矩阵和初始测试样本集的特征矩阵,进而得到目标训练样本集和目标测试样本集。
S220、根据目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型。
S230、根据目标测试样本集,对中间场景分类模型进行测试,得到目标场景分类模型。
本实施例提供的技术方案,若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则分别计算初始训练样本集的特征矩阵和初始测试样本集的特征矩阵,并通过计算训练样本集的特征矩阵和测试样本集的特征矩阵的最大均值差异距离的最小值,得到目标训练样本集和目标测试样本集;根据目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型;根据目标测试样本集,对中间场景分类模型进行测试,得到目标场景分类模型。本实施例具体介绍了对初始训练样本集和初始测试样本集的处理过程,通过对初始训练样本集和初始测试样本集的处理,可以缩小因地域等问题对不同地区的场景数据造成的特征分布的差异。本申请中的技术方案,能够适用不同地区的场景的识别分类,并能够提高场景识别分类的精度。
实施例三
图3为本申请实施例提供的一种场景分类模型的训练装置的结构示意图,如图3所示,该装置300可以包括:
样本处理模块310,用于若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对所述初始训练样本集和所述初始测试样本集进行处理,得到目标训练样本集和目标测试样本集。
模型训练模块320,用于根据所述目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型。
模型测试模块330,用于根据所述目标测试样本集,对所述中间场景分类模型进行测试,得到目标场景分类模型。
进一步的,所述样本处理模块310包括:特征矩阵确定单元和样本处理单元;
所述特征矩阵确定单元,用于分别计算初始训练样本集的特征矩阵和初始测试样本集的特征矩阵。
所述样本处理单元,用于通过计算所述初始训练样本集的特征矩阵和所述初始测试样本集的特征矩阵的最大均值差异距离的最小值,得到目标训练样本集和目标测试样本集。
进一步的,所述样本处理单元,还用于根据所述初始训练样本集的数量和所述初始测试样本集的数量,得到与样本集数量相关的中间矩阵;根据所述中间矩阵、所述初始训练样本集的特征矩阵、所述初始测试样本集的特征矩阵和预设核函数,求解所述初始训练样本集和所述初始测试样本集的最大均值差异距离,得到变换矩阵;分别对所述初始训练样本集和所述初始测试样本集乘以所述变换矩阵,得到目标训练样本集和目标测试样本集。
进一步的,模型训练模块320,具体用于根据所述目标训练样本集中样本类别,对初始场景分类模型中预设数量的多类分类器进行训练,得到每个多类分类器对应的模型参数,并得到中间场景分类模型。
进一步的,模型测试模块330,具体用于通过所述目标测试样本集中的不同样本类别的样本,分别对所述中间场景分类模型中的每个多类分类器进行测试,得到每个多类分类器对应的测试结果;根据所述测试结果,对所述中间场景分类模型中的多类分类器进行优化,得到目标场景分类模型。
可选的,所述初始训练样本集中的场景数据和所述初始测试样本集中的场景数据属于不同地区。
可选的,所述初始场景分类模型为支持向量机模型。
本实施例提供的场景分类模型的训练装置可适用于上述任意实施例提供的场景分类模型的训练方法,具备相应的功能和有益效果。
实施例四
图4是用来实现本申请实施例的场景分类模型的训练方法的电子设备的框图,图4示出了适于用来实现本申请实施例实施方式的示例性电子设备的框图。图4显示的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。该电子设备典型可以是智能手机、平板电脑、笔记本电脑、车载终端以及可穿戴设备等。
如图4所示,电子设备400以通用计算设备的形式表现。电子设备400的组件可以包括但不限于:一个或者多个处理器或者处理单元416,存储器428,连接不同系统组件(包括存储器428和处理单元416)的总线418。
总线418表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备400典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备400访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器428可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)430和/或高速缓存存储器432。电子设备400可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统434可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储器428可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请实施例各实施例的功能。
具有一组(至少一个)程序模块442的程序/实用工具440,可以存储在例如存储器428中,这样的程序模块442包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本申请实施例所描述的实施例中的功能和/或方法。
电子设备400也可以与一个或多个外部设备414(例如键盘、指向设备、显示器424等)通信,还可与一个或者多个使得用户能与该电子设备400交互的设备通信,和/或与使得该电子设备400能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口422进行。并且,电子设备400还可以通过网络适配器420与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图4所示,网络适配器420通过总线418与电子设备400的其它模块通信。应当明白,尽管图4中未示出,可以结合电子设备400使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元416通过运行存储在存储器428中的程序,从而执行各种功能应用以及数据处理,例如实现本申请任一实施例所提供的场景分类模型的训练方法。
实施例五
本申请实施例五还提供一种计算机可读存储介质,其上存储有计算机程序(或称为计算机可执行指令),该程序被处理器执行时可以用于执行本申请上述任一实施例所提供的场景分类模型的训练方法。
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请实施例进行了较为详细的说明,但是本申请实施例不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (10)

1.场景分类模型的训练方法,其特征在于,所述方法包括:
若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对所述初始训练样本集和所述初始测试样本集进行处理,得到目标训练样本集和目标测试样本集;
根据所述目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型;
根据所述目标测试样本集,对所述中间场景分类模型进行测试,得到目标场景分类模型。
2.根据权利要求1所述的方法,其特征在于,所述采用迁移成分分析算法对所述初始训练样本集和所述初始测试样本集进行处理,得到目标训练样本集和目标测试样本集,包括:
分别计算初始训练样本集的特征矩阵和初始测试样本集的特征矩阵;
通过计算所述初始训练样本集的特征矩阵和所述初始测试样本集的特征矩阵的最大均值差异距离的最小值,得到目标训练样本集和目标测试样本集。
3.根据权利要求2所述的方法,其特征在于,所述通过计算所述初始训练样本集的特征矩阵和所述初始测试样本集的特征矩阵的最大均值差异距离的最小值,得到目标训练样本集和目标测试样本集,包括:
根据所述初始训练样本集的数量和所述初始测试样本集的数量,得到与样本集数量相关的中间矩阵;
根据所述中间矩阵、所述初始训练样本集的特征矩阵、所述初始测试样本集的特征矩阵和预设核函数,求解所述初始训练样本集和所述初始测试样本集的最大均值差异距离,得到变换矩阵;
分别对所述初始训练样本集和所述初始测试样本集乘以所述变换矩阵,得到目标训练样本集和目标测试样本集。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型,包括:
根据所述目标训练样本集中样本类别,对初始场景分类模型中预设数量的多类分类器进行训练,得到每个多类分类器对应的模型参数,并得到中间场景分类模型。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标测试样本集,对所述中间场景分类模型进行测试,得到目标场景分类模型,包括:
通过所述目标测试样本集中的不同样本类别的样本,分别对所述中间场景分类模型中的每个多类分类器进行测试,得到每个多类分类器对应的测试结果;
根据所述测试结果,对所述中间场景分类模型中的多类分类器进行优化,得到目标场景分类模型。
6.根据权利要求1所述的方法,其特征在于,所述初始训练样本集中的场景数据和所述初始测试样本集中的场景数据属于不同地区。
7.根据权利要求1所述的方法,其特征在于,所述初始场景分类模型为支持向量机模型。
8.场景分类模型的训练装置,其特征在于,所述装置包括:
样本处理模块,用于若初始训练样本集的特征分布和初始测试样本集的特征分布不一致,则采用迁移成分分析算法对所述初始训练样本集和所述初始测试样本集进行处理,得到目标训练样本集和目标测试样本集;
模型训练模块,用于根据所述目标训练样本集,对初始场景分类模型进行训练,得到中间场景分类模型;
模型测试模块,用于根据所述目标测试样本集,对所述中间场景分类模型进行测试,得到目标场景分类模型。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的场景分类模型的训练方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的场景分类模型的训练方法。
CN202111496702.XA 2021-12-09 2021-12-09 场景分类模型的训练方法、装置、电子设备及存储介质 Pending CN114187549A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111496702.XA CN114187549A (zh) 2021-12-09 2021-12-09 场景分类模型的训练方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111496702.XA CN114187549A (zh) 2021-12-09 2021-12-09 场景分类模型的训练方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114187549A true CN114187549A (zh) 2022-03-15

Family

ID=80542871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111496702.XA Pending CN114187549A (zh) 2021-12-09 2021-12-09 场景分类模型的训练方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114187549A (zh)

Similar Documents

Publication Publication Date Title
CN112380981B (zh) 人脸关键点的检测方法、装置、存储介质及电子设备
CN111460250B (zh) 用于画像的数据的清洗方法、装置、介质及电子设备
CN112633419A (zh) 小样本学习方法、装置、电子设备和存储介质
CN111444807A (zh) 目标检测方法、装置、电子设备和计算机可读介质
CN111368878A (zh) 一种基于ssd目标检测的优化方法、计算机设备和介质
CN111291715B (zh) 基于多尺度卷积神经网络的车型识别方法、电子设备及存储介质
CN110135428B (zh) 图像分割处理方法和装置
CN114170575A (zh) 一种火焰识别方法、装置、电子设备及存储介质
CN107729944A (zh) 一种低俗图片的识别方法、装置、服务器及存储介质
CN113936232A (zh) 一种碎屏识别方法、装置、设备和存储介质
CN114299366A (zh) 一种图像检测方法、装置、电子设备及存储介质
CN111738290B (zh) 图像检测方法、模型构建和训练方法、装置、设备和介质
CN112989050A (zh) 一种表格分类方法、装置、设备及存储介质
CN112906652A (zh) 一种人脸图像的识别方法、装置、电子设备及存储介质
CN114741697B (zh) 恶意代码分类方法、装置、电子设备和介质
CN111400353A (zh) 一种规则计算方法、装置、设备及存储介质
CN116245630A (zh) 一种反欺诈检测方法、装置、电子设备及介质
CN113450764B (zh) 文本语音识别方法、装置、设备及存储介质
CN113139617B (zh) 一种输电线路自主定位方法、装置及终端设备
CN112801960B (zh) 图像处理方法及装置、存储介质、电子设备
CN113627611A (zh) 一种模型训练方法、装置、电子设备及存储介质
CN114821272A (zh) 图像识别方法、系统、介质、电子设备及目标检测模型
CN114187549A (zh) 场景分类模型的训练方法、装置、电子设备及存储介质
CN114972921A (zh) 染色体分析方法、设备和存储介质
CN114329978A (zh) 斜坡单元的融合方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination