CN109416748B - 基于svm的样本数据更新方法、分类系统和存储装置 - Google Patents
基于svm的样本数据更新方法、分类系统和存储装置 Download PDFInfo
- Publication number
- CN109416748B CN109416748B CN201780031865.6A CN201780031865A CN109416748B CN 109416748 B CN109416748 B CN 109416748B CN 201780031865 A CN201780031865 A CN 201780031865A CN 109416748 B CN109416748 B CN 109416748B
- Authority
- CN
- China
- Prior art keywords
- sample
- convex hull
- data
- space
- undetermined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于SVM的样本数据更新方法,该方法包括:获取样本数据以及在特征空间内将样本数据划分成至少两个分类集合的分类超平面(S101);分别确定每一分类集合中的最大凸包样本,其中最大凸包样本用于在特征空间内定义第一凸包空间,第一凸包空间能够容纳所述分类集合中除最大凸包样本以外的其他样本数据(S102);根据待增加或待删除的数据点与最大凸包样本的位置关系,对最大凸包样本进行选择性更新(S103);以及根据最大凸包样本的更新情况,对分类超平面进行选择性更新(S104)。通过根据待增加或待删除的数据点与最大凸包样本的位置关系对最大凸包样本进行选择性更新和对分类超平面进行选择性更新,可以提高样本数据分类的运算效率。
Description
技术领域
本发明主要涉及计算机技术领域,特别是涉及一种基于SVM的样本数据更新方法、分类系统和存储装置。
背景技术
SVM(Support Vector Machine)是指支持向量机,通常用来进行模式识别、分类以及回归分析。运用SVM算法对样本做分类时,若每个样本数据有n个特征,则可认为样本处于n维特征空间,从而利用n维超平面(hyperplane)将样本划分为两类。其中,n维超平面距离两类样本中最近的数据是等距的。当向一类样本中新增数据或者将一类样本中已有的部分数据删除,即当样本数据变更时,根据SVM算法,通常需要根据更新后的所有数据重新计算超平面。SVM通常用于图像识别和机器人深度学习等领域。
本发明的发明人在对现有技术的研究过程中发现,对于现有的SVM样本数据更新方法,每次样本更新时都需要基于更新后的所有数据重新计算超平面,导致计算效率低下,难以满足图像识别或者机器人深度学习对计算速度的要求。
发明内容
本发明的提供一种基于SVM的样本数据更新方法、系统和存储装置,用于解决现有技术中SVM样本数据分类计算效率低下的问题。
为解决上述技术问题,本发明采用的一技术方案是提供一种基于SVM的样本数据更新方法,该方法包括:获取样本数据以及在特征空间内将所述样本数据划分成至少两个分类集合的分类超平面;分别确定每一所述分类集合中的最大凸包样本,其中所述最大凸包样本用于在所述特征空间内定义第一凸包空间,所述第一凸包空间能够容纳所述分类集合中除所述最大凸包样本以外的其他样本数据;根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新;以及根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新。
为解决上述技术问题,本发明采用的另一技术方案是提供一种基于SVM的样本数据分类系统,该系统包括电耦合的处理器和存储器,其中所述存储器用于存储程序指令,所述处理器可加载所述程序指令并执行上述样本数据更新方法。
为解决上述技术问题,本发明采用的又一技术方案是提供一种具有存储功能的装置,用于存储程序指令,所述程序指令可被执行以实现上述样本数据更新方法。
本发明实施例的有益效果是:通过根据待增加或待删除的数据点与最大凸包样本的位置关系对最大凸包样本进行选择性更新,并根据最大凸包样本的更新情况对分类超平面进行选择性更新,可以提高样本数据分类的运算效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图:
图1是本发明基于SVM的样本数据更新方法一实施例的流程示意图。
图2是本发明基于SVM的样本数据更新方法另一实施例的流程示意图。
图3是本发明最大凸包更新方法一实施例的流程示意图。
图4示出了在二维特征空间上利用超平面对样本数据进行分类的示意图。
图5示出了对如图4所述的样本数据新增数据点的示意图。
图6示出了图5中的样本数据及分类超平面经过更新后的示意图。
图7示出了对如图4所述的样本数据删除数据点的示意图。
图8示出了图7中的样本数据及分类超平面经过更新后的示意图。
图9示出了对如图4所述的样本数据删除数据点的另一例子的示意图。
图10示出了图9中的样本数据及分类超平面经过更新后的示意图。
图11示出了本发明基于SVM的样本数据分类系统一实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1是本发明基于SVM的样本数据更新方法一实施例的流程示意图。如图1所示,本发明基于SVM的样本数据更新方法可包括以下步骤:
S101:获取样本数据以及在特征空间内将该样本数据划分成至少两个分类集合的分类超平面。
样本数据即待分类的数据的总和,在不同的应用场景中,样本数据对应不同类型的数据,例如,在图像识别技术中,摄像头摄取的图像数据化得到的样本数据,或者在自动驾驶技术中,外部车辆或者控制系统发来的数据信息等。在后续的处理中,需要将获取的样本数据分类(例如,前景和后景,人和车辆等),基于SVM算法,通常可以利用特征空间内的分类超平面对这些获取的样本数据进行处理。特征空间和分类超平面均为数学上的概念,而不是实际存在的空间和平面。例如,一个数据点如果可以用n个特征描述,则该数据点可以作为一个n维向量x=(x1,x2,……,xn),n维特征空间可以被定义以容纳这些数据点,而在数据可以分类的情况下,可以在n维特征空间中找到一个超平面(例如,在二维特征空间中,可以是一条直线、曲线、圆形等,在三维特征空间中,可以是平面、曲面等),使所有数据点在超平面两侧分为两类,且两类数据中离超平面最近的数据点到超平面的距离相同。可以理解,若可以同时定义多个分类超平面,则可以将样本数据划分为超过两个的分类集合。为方便解释说明,下文均以二维特征空间中存在一个超平面的情况为例进行说明。
在步骤S101中,获取样本数据,以及在对应维度的特征空间内将该样本数据划分为至少两个分类集合的分类超平面。例如,如图4所示,首先获取图4中所有的数据点(三角形或圆形),并获取将这些数据点划分为A类和B类集合的分类超平面HP。在一些实施例中,这些数据点以及分类超平面HP可以是已计算、待更新的,在另一些实施例中,这些数据点也可以是在获取数据的最初阶段获取的,而分类超平面HP可以根据现有的SVM算法计算得到。
S102:分别确定每一类集合中的最大凸包样本,其中最大凸包样本用于在特征空间内定义第一凸包空间,第一凸包空间能够容纳分类集合中除最大凸包样本以外的其他样本数据。
仍然以图4为例,在步骤S102中,对A类集合和B类集合分别确定最大凸包样本CA和CB,CA和CB分别在特征空间内定义第一凸包空间,可以从图中直观的看出,最大凸包样本即该类集合中“最外侧”的数据点的集合,将这些数据点相连后其内部的空间即为第一凸包空间。第一凸包空间能够容纳分类集合中除最大凸包样本(最大凸包的边界)以外的其他数据点。
S103:根据待增加或待删除的数据点与最大凸包样本的位置关系,对最大凸包样本进行选择性更新。
在步骤S103中,当需要向样本中新增数据点或者删除数据点时,判断待增加或待删除的数据点与最大凸包样本的位置关系。例如,若对A类集合(根据超平面HP判断)新增或删除数据点,则比较待增加或待删除的数据点与最大凸包样本CA进行比较。根据比较的结果,对最大凸包样本CA进行选择性更新。例如,若待增加或待删除的数据点在CA的内部,则不会对最大凸包样本CA产生影响,无需对最大凸包样本CA进行更新;反之,若待增加的数据点在CA的外侧,或待删除的数据点属于最大凸包样本CA,则需要对最大凸包样本CA进行更新。
S104:根据最大凸包样本的更新情况,对分类超平面进行选择性更新。
在步骤S104中,若步骤S103中未对最大凸包样本进行更新,则同样无需更新分类超平面。反之,若步骤S103中对最大凸包样本进行了更新,则可以重新根据更新后的最大凸包样本计算分类超平面。例如,若步骤S103中对最大凸包样本CA进行了更新,则可以根据A类集合更新后的最大凸包样本CA’(图未示)以及B类集合未变化的最大凸包样本CB重新计算分类超平面。
在一些实施例中,还可以进一步检测更新后的最大凸包样本中离分类超平面最接近的样本数据是否发生变化,若发生变化,则重新计算并更新分类超平面,否则,不对分类超平面进行更新。
本发明通过根据待增加或待删除的数据点与最大凸包样本的位置关系对最大凸包样本进行选择性更新,并根据最大凸包样本的更新情况对分类超平面进行选择性更新,避免了每次样本数据更新时均需要根据所有数据重新计算分类超平面,从而可以提高样本数据分类的运算效率。
请参阅图2,图2是本发明基于SVM的样本数据更新方法另一实施例的流程示意图。在本实施例中,基于SVM的样本数据更新方法可包括以下步骤:
S201:获取样本数据以及在特征空间将该样本数据划分成至少两个分类集合的分类超平面。
S202:分别确定每一分类集合中的最大凸包样本。
步骤S201和S202与步骤S101和步骤S102类似,在此不再赘述。
S203:判断待增加的数据点是否落在第一凸包空间内。
步骤S203中,当需要向样本中新增数据点时,判断待增加的数据点是否落在最大凸包样本所定义的第一凸包空间内。若待增加的数据点落在第一凸包空间内,则执行步骤S205;反之,若未落在第一凸包空间内,则执行步骤S204。以图5所示的例子为例,数据点P11和P12分别为两种情况下待增加的数据点。首先将P11或P12与分类超平面HP比较,可知其属于A类集合,进而与A类集合的最大凸包样本CA进行比较。可以发现,数据点P11落在第一凸包空间内,因此,新增数据点为P11时,执行步骤S205;而数据点P12未落在第一凸包空间内,因此,新增数据点为P12时,执行步骤S204。
S204:将待增加的数据点添加至最大凸包样本。
当待增加的数据点未落在第一凸包空间内时,需要更新最大凸包样本。这种情况下,将待增加的数据点添加至最大凸包样本。例如,在图5的例子中,需要将新增数据点P12添加至最大凸包样本CA,得到图6中所示更新后分类集合A1的最大凸包样本CA1。这样一来,就可以利用更新后的最大凸包样本CA1重新计算分类超平面,将原分类超平面HP更新为HP1。需要注意,待增加的数据点也有可能正好落在最大凸包样本所形成的边界线上,在这种情况下,同样可以对最大凸包样本进行更新,以免对后续计算造成影响。
S205:不对最大凸包样本进行更新。
当待增加或待删除的数据点落在第一凸包空间内时,无需对最大凸包样本进行更新,后续也不会对分类超平面进行更新。需要注意,在一些实施例中,为提高后续的计算效率,当待增加或待删除的数据点落在第一凸包空间内时,还可以进一步判断是否需要对次大凸包样本进行更新。有关如何利用次大凸包进行计算的详细信息将在下文中介绍。
S206:判断待删除的数据点是否落在第一凸包空间内。
步骤S206中,当需要从样本中删除数据点时,判断待删除的数据点是否落在最大凸包样本内侧的第一凸包空间内。若待删除的数据点落在第一凸包空间内,则执行步骤S205;反之,若未落在第一凸包空间内,则执行步骤S207。例如,在图7所示的例子中,数据点P21、P22和P23分别为三种情况下待删除的数据点。其中,数据点P21和P22均落在第一凸包空间内,因此,需要删除数据点P21或P22时,执行步骤S205。而数据点P23未落在第一凸包空间内,那么在需要删除数据点P23时,执行步骤S207。
S207:从最大凸包样本中删除待删除的数据点,以得到待定样本。
当待删除的数据点未落在第一凸包空间内时,需要更新最大凸包样本。可以理解的是,在需要删除数据点的情况下,未落在第一凸包空间内意味着该数据点属于最大凸包样本。这种情况下,将待删除的数据点从最大凸包样本中删除。例如,在图7的例子中,需要将待删除的数据点P23从最大凸包样本中删除,得到图8中所示待定样本CB2,待定样本内部为特征空间内的一个待定空间。待定样本是最大凸包样本更新过程中的一个中间量。
S208:判断除最大凸包样本以外的其他样本数据是否全部落入待定空间。
在步骤S208中,利用步骤S207中得到的待定样本和待定空间,帮助判断将待删除的数据点从最大凸包样本中删除后,得到的空间是否能够将其余数据点包括在内。若全部落入,则执行步骤S210,否则,则执行步骤S209。例如,在图8中,待定样本CB2形成的待定空间可以将除原最大凸包样本以外的其他样本数据包含在其中,因此,执行步骤S210。
S209:将除最大凸包样本以外的其他样本数据中至少部分未落入待定空间的样本数据添加到待定样本。
当除最大凸包样本以外的其他样本数据未全部落入待定空间时,意味着此时最大凸包样本的更新还不能结束。此时,可以通过待定样本以及除原最大凸包样本以外的其他样本数据重新计算待定样本。在一实施例中,可以根据除原最大凸包样本以外的其他样本数据以及待定样本直接重新计算最大凸包样本,计算结果作为更新后的待定样本(实际上,这种情况下得到的待定样本即为更新后的最大凸包样本)。在另一些实施例中,可以采用逐一或择一添加的方式,将一个或若干个数据点添加到待定样本中,对待定样本进行更新。在又一些实施例中,还可以使用次大凸包样本对待定样本进行辅助计算,详细信息将在下文介绍。
在执行步骤S209得到更新后的待定样本后,重新返回步骤S208,判断除最大凸包样本以外的其他样本数据是否全部落入待定空间,重复执行上述步骤,直到最后得到的待定样本所定义的待定空间可以将其余样本数据全部容纳其中。
S210:最大凸包样本更新为待定样本。
最后,将待定样本作为新的最大凸包样本,得到更新后的最大凸包样本。该更新后的最大凸包样本即可以用于更新分类超平面。例如,在图8的例子中,在步骤S208中得到的待定样本CB2已能容纳除原最大凸包样本以外的全部样本数据,因此,将更新后的分类集合B2的最大凸包即为CB2。
请参阅图3,图3是本发明最大凸包更新方法一实施例的流程示意图。如前述,在一些实施例中,可以通过定义并计算次大凸包来辅助最大凸包更新的计算。图3所示的实施例主要可紧跟图2中步骤S206使用,当需要删除数据点,且待删除的数据点未落入该分类集合的第一凸包空间内时,使用图3实施例所示的方法更新最大凸包,该方法包括:
S301:分别确定每一分类集合中的次大凸包样本。
在本实施例中,除了确定每一分类集合的最大凸包样本以外,还确定每一分类集合(或者有数据更新的集合)的次大凸包样本,次大凸包样本即位于除了最大凸包样本以外的其他数据点的最大凸包上的数据点。例如,如图9所示,对分类集合B,除了确定其最大凸包样本CB以外,还确定其次大凸包样本ICB。次大凸包样本在特征空间内定义第二凸包空间,第二凸包空间能够容纳除了最大凸包样本和次大凸包样本以外的其他数据点。应当理解,确定次大凸包样本的步骤可以与确定最大凸包样本的步骤同时执行,或者在有数据更新请求时执行,又或者在需要利用次大凸包进行计算的步骤之前执行。
S302:从最大凸包样本中删除待删除的数据点,以得到待定样本。
S303:将次大凸包样本中最接近待删除的数据点的样本数据作为待定数据点。
在步骤S303中,可以通过计算得到次大凸包样本中最接近待删除的数据点的样本数据作为待定数据点。例如,图9中,分类集合B的次大凸包样本ICB包括5个样本数据,通过计算(以图形表示时可通过直接观察或者测量)可知,次大凸包样本ICB中最接近待删除的数据点P31的样本数据P34,将其作为待定数据点,用于后续的比较和判断。
S304:判断待定数据点是否落入待定空间。
在步骤S304中,判断待定数据点是否落入待定空间,待定空间由步骤S302中得到的待定样本在特征空间内定义。若待定数据点落入待定空间,说明待定空间可以容纳除原最大凸包样本以外的所有样本数据,此时,执行步骤S307。否则,说明还需要对待定样本和待定空间进一步处理,执行步骤S305。例如,图9中,待定空间为原第一凸包空间除去待删除点P31及其邻近点P32、P33围成的三角形以外的区域。由图可知,待定数据点P34在待删除点P31及其邻近点P32、P33围成的三角形,而不在待定空间中,因此需要对待定样本和待定空间进一步处理。
S305:将待定数据点添加到待定样本。
在步骤S305中,对待定样本进行更新,将待定数据点添加到其中。
S306:将待定数据点更新为次大凸包样本中待定数据点的邻近数据点,并将原待定数据点从次大凸包样本中删除。
在步骤S306中,需要将次大凸包样本中的其他数据点作为下一步比较的参考,因此,将待定数据点的邻近数据点作为新的待定数据点,并将原待定数据点从次大凸包样本中删除。邻近数据点可以是原待定数据点两侧的数据点,也可以按照左-右-左或者右-左-右的顺序每次验证其单侧的邻近数据点。例如,在图9中,可以将原待定数据点P34添加到待定样本中,并将其从次大凸包样本ICB中删除,并将P34一侧的数据点P35作为新的待定数据点。
在执行步骤S306得到更新后的待定数据点和待定样本后,重新返回步骤S304,判断更新后的待定数据点是否落入更新后的待定空间内,重复执行上述步骤,直到最后得到的待定样本所定义的待定空间可以将待定数据点容纳其中。在图9的例子中,更新后的待定空间仍然无法将待定数据点容纳其中(P35位于P34和P33连线的右侧),因此,继续重复上述步骤,最终将P35添加至待定样本后,无论采用P36或者P38作为新的待定数据点,待定空间均能将其容纳其中,此时认为待定样本已更新结束。
S307:最大凸包样本更新为待定样本。
最后,将更新后的待定样本作为新的最大凸包样本,得到如图10所示的更新后的最大凸包样本CB3。该更新后的最大凸包样本CB3即可以用于更新分类超平面。同时,还得到更新后的次大凸包样本ICB3,可以用于下一次样本数据更新时的计算。
在此实施例中,通过使用次大凸包样本,可以进一步减少后续步骤中比较、计算的时间,提高样本数据分类的效率。
请参阅图11,本发明基于SVM的样本数据分类系统的一个实施例,其中基于SVM的样本数据分类系统400包括通信总线401、处理器402、存储器403。处理器402和存储器403通过通信总线401耦接。
其中,存储器403保存有程序数据,程序数据可被处理器402加载并执行上述任意实施例的基于SVM的样本数据更新方法。可以理解地,在其它一些实施例中,存储器403可以不同处理器402设置于同一实体装置中,而是通过将系统400结合网络来执行上述任一实施例的方法。
上述实施例所述功能如果以软件形式实现并作为独立的产品销售或使用时,可存储在一个具有存储功能的装置中,即,本发明还提供一种存储有程序的存储装置。存储装置中程序数据能够被执行以实现上述实施例中操作系统框架的翻译方法,该存储装置包括但不限于U盘、光盘、服务器或者硬盘等。
以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (11)
1.一种基于SVM的样本数据更新方法,其特征在于,包括:
获取样本数据,以及在特征空间内将所述样本数据划分成至少两个分类集合的分类超平面;
分别确定每一所述分类集合中的最大凸包样本以及分别确定每一所述分类集合中的次大凸包样本,其中所述最大凸包样本用于在所述特征空间内定义第一凸包空间,所述第一凸包空间能够容纳所述分类集合中除所述最大凸包样本以外的其他样本数据,所述次大凸包样本在所述特征空间内定义第二凸包空间,所述第二凸包空间能够容纳所述分类集合中除所述最大凸包样本和所述次大凸包样本以外的其他样本数据;
根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新;以及
根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新;
其中,所述根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新的步骤包括:
判断所述待删除的数据点是否落在所述第一凸包空间内部;
若未落在所述第一凸包空间内部,则从所述最大凸包样本中删除所述待删除的数据点,以得到待定样本,所述待定样本在所述特征空间定义待定空间;判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内;若未全部落入所述待定空间,则将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本,并返回所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤;若全部落入所述待定空间内,则所述最大凸包样本更新为所述待定样本;
若落在所述第一凸包空间的内部,则不对所述最大凸包样本进行更新;
其中,所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤,以及将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本中的步骤中,所述除所述最大凸包样本以外的其他样本数据是指所述次大凸包样本。
2.如权利要求1所述的样本数据更新方法,其特征在于,所述根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新的步骤包括:
判断所述待增加的数据点是否落在所述第一凸包空间内部;
若未落在所述第一凸包空间内部,则更新所述最大凸包样本;
若落在所述第一凸包空间的内部,则不对所述最大凸包样本进行更新。
3.如权利要求2所述的样本数据更新方法,其特征在于,所述更新所述最大凸包样本的步骤包括:
将所述待增加的数据点添加至所述最大凸包样本。
4.如权利要求1所述的样本数据更新方法,其特征在于,在所述更新所述最大凸包样本的步骤中:
所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤包括:
将所述次大凸包样本中最接近所述待删除的数据点的样本数据作为待定数据点;以及
判断所述待定数据点是否落入所述待定空间内;
若未落入所述待定空间内,则所述将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本,并返回所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤,包括:
将所述待定数据点添加到所述待定样本;
将所述待定数据点更新为所述次大凸包样本中所述待定数据点的邻近数据点,并将原所述待定数据点从所述次大凸包样本中删除;
返回判断所述待定数据点是否落入所述待定空间内的步骤。
5.如权利要求1-4任一项所述的样本数据更新方法,其特征在于,所述根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新的步骤包括:
若对所述最大凸包样本进行了更新,则检测更新后的所述最大凸包样本中离所述分类超平面最接近的样本数据是否发生变化,若发生变化,则重新计算并更新所述分类超平面,否则,不对所述分类超平面进行更新;
若未对所述最大凸包样本进行更新,则不对所述分类超平面进行更新。
6.一种基于SVM的样本数据分类系统,其特征在于,包括电耦合的处理器和存储器,其中所述存储器用于存储程序指令,所述处理器可加载所述程序指令并执行:
获取样本数据以及在特征空间内将所述样本数据划分成至少两个分类集合的分类超平面;
分别确定每一所述分类集合中的最大凸包样本以及分别确定每一所述分类集合中的次大凸包样本,其中所述最大凸包样本用于在所述特征空间内定义第一凸包空间,所述第一凸包空间能够容纳所述分类集合中除所述最大凸包样本以外的其他样本数据,所述次大凸包样本在所述特征空间内定义第二凸包空间,所述第二凸包空间能够容纳所述分类集合中除所述最大凸包样本和所述次大凸包样本以外的其他样本数据;
根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新;以及
根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新;
其中,所述根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新的步骤包括:
判断所述待删除的数据点是否落在所述第一凸包空间内部;
若未落在所述第一凸包空间内部,则从所述最大凸包样本中删除所述待删除的数据点,以得到待定样本,所述待定样本在所述特征空间定义待定空间;判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内;若未全部落入所述待定空间,则将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本,并返回所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤;若全部落入所述待定空间内,则所述最大凸包样本更新为所述待定样本;
若落在所述第一凸包空间的内部,则不对所述最大凸包样本进行更新;
其中,所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤,以及将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本中的步骤中,所述除所述最大凸包样本以外的其他样本数据是指所述次大凸包样本。
7.如权利要求6所述的基于SVM的样本数据分类系统,其特征在于,所述根据待增加或待删除的数据点与所述最大凸包样本的位置关系,对所述最大凸包样本进行选择性更新的步骤包括:
判断所述待增加的数据点是否落在所述第一凸包空间内部;
若未落在所述第一凸包空间内部,则更新所述最大凸包样本;
若落在所述第一凸包空间的内部,则不对所述最大凸包样本进行更新。
8.如权利要求7所述的基于SVM的样本数据分类系统,其特征在于,所述更新所述最大凸包样本的步骤包括:将所述待增加的数据点添加至所述最大凸包样本。
9.如权利要求6所述的基于SVM的样本数据分类系统,其特征在于,在所述更新所述最大凸包样本的步骤中:
所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤包括:
将所述次大凸包样本中最接近所述待删除的数据点的样本数据作为待定数据点;以及
判断所述待定数据点是否落入所述待定空间内;
若未落入所述待定空间内,则所述将所述除所述最大凸包样本以外的其他样本数据中至少部分未落入所述待定空间的样本数据添加到所述待定样本,并返回所述判断所述除所述最大凸包样本以外的其他样本数据是否全部落入所述待定空间内的步骤,包括:
将所述待定数据点添加到所述待定样本;
将所述待定数据点更新为所述次大凸包样本中所述待定数据点的邻近数据点,并将原所述待定数据点从所述次大凸包样本中删除;
返回判断所述待定数据点是否落入所述待定空间内的步骤。
10.如权利要求6-9任一项所述的基于SVM的样本数据分类系统,其特征在于,所述根据所述最大凸包样本的更新情况,对所述分类超平面进行选择性更新的步骤包括:
若对所述最大凸包样本进行了更新,则检测更新后的所述最大凸包样本中离所述分类超平面最接近的样本数据是否发生变化,若发生变化,则重新计算并更新所述分类超平面,否则,不对所述分类超平面进行更新;
若未对所述最大凸包样本进行更新,则不对所述分类超平面进行更新。
11.一种具有存储功能的装置,其特征在于,用于存储程序指令,所述程序指令可被执行以实现如权利要求1-5任一项所述的样本数据更新方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2017/113877 WO2019104618A1 (zh) | 2017-11-30 | 2017-11-30 | 基于svm的样本数据更新方法、分类系统和存储装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109416748A CN109416748A (zh) | 2019-03-01 |
CN109416748B true CN109416748B (zh) | 2022-04-15 |
Family
ID=65463146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780031865.6A Active CN109416748B (zh) | 2017-11-30 | 2017-11-30 | 基于svm的样本数据更新方法、分类系统和存储装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109416748B (zh) |
WO (1) | WO2019104618A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11048254B2 (en) * | 2019-04-10 | 2021-06-29 | Waymo Llc | Generating simplified object models to reduce computational resource requirements for autonomous vehicles |
EP3789910A1 (en) * | 2019-09-09 | 2021-03-10 | Robert Bosch GmbH | Device and method for training a polyhedral classifier |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010080663A1 (en) * | 2009-01-06 | 2010-07-15 | Qualcomm Incorporated | Method and apparatus for vector quantization codebook search |
CN103605631A (zh) * | 2013-11-20 | 2014-02-26 | 温州大学 | 一种基于支持向量几何意义的增量学习方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101571844A (zh) * | 2009-06-10 | 2009-11-04 | 北京工业大学 | 一种用于模式分类的支持向量机训练方法 |
-
2017
- 2017-11-30 CN CN201780031865.6A patent/CN109416748B/zh active Active
- 2017-11-30 WO PCT/CN2017/113877 patent/WO2019104618A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010080663A1 (en) * | 2009-01-06 | 2010-07-15 | Qualcomm Incorporated | Method and apparatus for vector quantization codebook search |
CN103605631A (zh) * | 2013-11-20 | 2014-02-26 | 温州大学 | 一种基于支持向量几何意义的增量学习方法 |
Non-Patent Citations (1)
Title |
---|
《基于中心凸包算法与增量学习的SVW算法研究》;白东颖等;《火力与指挥控制》;20150331;第40卷(第3期);第20-23页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109416748A (zh) | 2019-03-01 |
WO2019104618A1 (zh) | 2019-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8199977B2 (en) | System and method for extraction of features from a 3-D point cloud | |
US20210272306A1 (en) | Method for training image depth estimation model and method for processing image depth information | |
CN109416748B (zh) | 基于svm的样本数据更新方法、分类系统和存储装置 | |
CN112528995B (zh) | 用于训练目标检测模型的方法、目标检测方法及装置 | |
CN111144494A (zh) | 物体检测模型训练方法、检测方法、装置、设备及介质 | |
KR20220093187A (ko) | 포지셔닝 방법 및 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체 | |
CN113119115A (zh) | 一种机械臂运动规划方法、装置、可读存储介质及机械臂 | |
US9009015B2 (en) | Free energy difference estimation method and simulation apparatus | |
JP2018077547A (ja) | 並列処理装置、並列処理方法、および、並列化処理用プログラム | |
CN108961316A (zh) | 图像处理方法、装置及服务器 | |
CN108268503A (zh) | 一种数据库的存储、查询方法及装置 | |
JP6567381B2 (ja) | 演算装置、方法及びプログラム | |
CN116337072A (zh) | 一种工程机械的建图、方法、设备、及可读存储介质 | |
CN115014328A (zh) | 一种栅格地图的动态加载方法、装置、设备和介质 | |
CN110824496A (zh) | 运动估计方法、装置、计算机设备和存储介质 | |
US20240070979A1 (en) | Method and apparatus for generating 3d spatial information | |
CN116361567B (zh) | 应用于云办公的数据处理方法及系统 | |
CN115147442B (zh) | 栅格图案的矢量化方法、移动终端、电子设备和介质 | |
CN114511862B (zh) | 表格识别方法、装置及电子设备 | |
CN114882247A (zh) | 图像的处理方法、装置和电子设备 | |
CN114863300A (zh) | 一种最短路径生成方法及装置 | |
CN114022721A (zh) | 图像特征点选取方法及相关装置、设备和存储介质 | |
CN113808196A (zh) | 平面融合定位方法、装置、电子设备及存储介质 | |
KR20120043209A (ko) | 윈도우 기반 영상 처리에서 고속으로 윈도우 영역 내 화소 연산을 수행하기 위한 방법 및 장치 | |
CN113119114A (zh) | 一种机械臂运动规划方法、装置、可读存储介质及机械臂 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 518063 23 Floor (Room 2303-2306) of Desai Science and Technology Building, Yuehai Street High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province Applicant after: Shenzhen AANDE Intelligent Technology Research Institute Co., Ltd. Address before: 518063 Shajing Industrial Co., Ltd. No. 3 Industrial Zone, Hexiang Road, Shajing Street, Baoan District, Shenzhen City, Guangdong Province Applicant before: Shenzhen AANDE Intelligent Technology Research Institute Co., Ltd. |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |