CN114781555A - 改进knn方法的电子元器件数据分类方法 - Google Patents

改进knn方法的电子元器件数据分类方法 Download PDF

Info

Publication number
CN114781555A
CN114781555A CN202210704205.2A CN202210704205A CN114781555A CN 114781555 A CN114781555 A CN 114781555A CN 202210704205 A CN202210704205 A CN 202210704205A CN 114781555 A CN114781555 A CN 114781555A
Authority
CN
China
Prior art keywords
data
electronic component
data information
electronic components
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210704205.2A
Other languages
English (en)
Inventor
蒋楠楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Dinghefeng Technology Co ltd
Original Assignee
Shenzhen Dinghefeng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Dinghefeng Technology Co ltd filed Critical Shenzhen Dinghefeng Technology Co ltd
Priority to CN202210704205.2A priority Critical patent/CN114781555A/zh
Publication of CN114781555A publication Critical patent/CN114781555A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种改进KNN方法的电子元器件数据分类方法,涉及数据识别或者处理领域,解决的技术问题是电子元器件数据分类精度下,识别度低。该方法通过步骤一能够从电子元器件数据库中获取电子元器件数据信息,通过CNN算法模型实现电子元器件数据信息的预处理;通过步骤二对电子元器件数据信息中每个数据对象评估,通过kd树计算每个元器件和训练集数据集合内每个对象的距离;其中所述kd树中设置有数据更新模块;通过步骤三能够根据每个数据对象K个近邻归属的主要类别测量元器件数据信息;通过步骤四能够对K个点所属的类别进行比较,本发明数据数据评估精度高,分类准确。

Description

改进KNN方法的电子元器件数据分类方法
技术领域
本发明涉及数据识别或者处理领域,且更确切地涉及一种改进KNN方法的电子元器件数据分类方法。
背景技术
电子元器件是电子元件和小型的机器、仪器的组成部分,其本身常由若干零件构成,可以在同类产品中通用;常指电器、无线电、仪表等工业的某些零件,是电容、晶体管、游丝、发条等电子器件的总称。常见的有二极管等。在具体示例性实施例中,电子元器件包括:电阻、电容、电感、电位器、电子管、散热器、机电元件、连接器、半导体分立器件、电声器件、激光器件、电子显示器件、光电器件、传感器、电源、开关、微特电机、电子变压器、继电器、印制电路板、集成电路、各类电路、压电、晶体、石英、陶瓷磁性材料、印刷电路用基材基板、电子功能工艺专用材料、电子胶(带)制品、电子化学材料及部品等。
电子元器件在应用过程中,通常需要对电子元器件数据类型进行分类,以将电子元器件通过不同的属性进行数据信息分类。比如按元件进行分类或者按器件进行分类以及每种大类中不同数据信息或者故障数据分析等,常规技术通常采用人工统计学的方法,这种方法不仅技术落后,还容易出错。还有采用统计学分析的方法,这种方法也会导致电子元器件数据分类困难,难以实现电子元器件数据分类,导致数据分析困难。
发明内容
针对上述技术的不足,本发明公开一种改进KNN方法的电子元器件数据分类方法,通过改进型KNN方法,能够大大提高电子元器件数据分类能力。
为了实现上述技术效果,本发明采用以下技术方案:
一种改进KNN方法的电子元器件数据分类方法,其中包括以下步骤:
步骤一:从电子元器件数据库中获取电子元器件数据信息,并将获取的电子元器件数据信息按照数据属性分类和分解,通过CNN算法模型实现电子元器件数据信息的预处理;
步骤二:通过评估模块对电子元器件数据信息中每个数据对象评估,通过kd树计算每个元器件和训练集数据集合内每个对象的距离;其中所述kd树中设置有数据更新模块;
步骤三:根据每个数据对象K个近邻归属的主要类别测量元器件数据信息;对每个元器件数据信息距离进行排序,然后选择距离最小的K个点;
步骤四:对K个点所属的类别进行比较,根据少数服从多数的原则,将测试样本点归入在K个点中占比最高的那一类;进而输出电子元器件数据信息。
作为本发明进一步的技术方案,电子元器件数据信息通过在CNN算法模型中加入降维数据模型实现数据信息降维处理;降维函数为:
Figure 296479DEST_PATH_IMAGE001
(1)
公式(1)中,w0表示CNN算法模型当前权重值,w1表示算法模型的初始权重平衡值,w2表示算法模型的最终权重,γc表示权重因子的索引参数,c表示算法模型的次数。
作为本发明进一步的技术方案,CNN算法模型包括图像分割模块,通过欧式距离公 式
Figure 474650DEST_PATH_IMAGE002
公式实现电子元器件数据信息分割:
Figure 376354DEST_PATH_IMAGE003
(2)
公式(2)中,
Figure 727701DEST_PATH_IMAGE004
分别表示不同类型的电子元器件,
Figure 814605DEST_PATH_IMAGE005
Figure 678525DEST_PATH_IMAGE006
表示不同电子元 器件类型之间的距离;
Figure 850880DEST_PATH_IMAGE007
Figure 740339DEST_PATH_IMAGE008
中的i表示某一个电子元器件数据信息,n表示电子元器 件数据信息的总数,将
Figure 635745DEST_PATH_IMAGE009
的电子元器件数据信息化为一类,将
Figure 218036DEST_PATH_IMAGE010
的 电子元器件数据信息化为一类。
作为本发明进一步的技术方案,kd树包括k维点的二叉树和数据信息搜索模块,其中所述数据信息搜索模块为最邻近搜索方法,用于找出在树中与输入点最接近点。
作为本发明进一步的技术方案,最邻近搜索方法搜索数据信息的过程为包括以下步骤:
步骤(一)、从kd树根节点开始,依次递归往下移动,当移动到叶节点时,将该节点当作当前最佳点;
步骤(二)、当前所在点比当前最佳点更靠近输入点,则将其变为当前最佳点;检查另一边子树有没有更近的点,如果有,则从该节点往下找,如果没有,则将该节点当作当前最佳点;
步骤(三)、当根节点搜索完毕后完成最邻近搜索。
作为本发明进一步的技术方案,数据更新模块包括数据更新主控模块以及与所述更新主控模块连接的数据输入模块、数据存储模块和数据输出模块。
作为本发明进一步的技术方案,数据更新主控模块为XC7Z035FFGH676-2的Cortex-A9处理器和FPGA控制器。
作为本发明进一步的技术方案,数据更新模块实现数据更新的方法为:
通过数据输入模块接收电子元器件数据信息,通过数据存储模块实现电子元器件数据信息的存储,通过数据输出模块实现电子元器件数据信息的输出,更新数据时,通过四分位法实现不同类型电子元器件数据信息的更新分类,通过多路选择器实现数据更新选择。
作为本发明进一步的技术方案,四分位数的计算按以下方式进行:
步骤1、对于电子元器件数据信息,更新数据信息记作为
Figure 64638DEST_PATH_IMAGE011
;计 算电子元器件数据信息中第二四分位中位数的值P 2
Figure 23367DEST_PATH_IMAGE012
(3)
公式(3)中,n表述电子元器件数据信息;
Figure 819285DEST_PATH_IMAGE013
表示四分位数中分数值;
步骤2、同时算出第一四分位数P 1 、第三四分位数P 3
如果电子元器件数据量n为偶数的时候,将升序排列后的样本P V 以中位数P 2 为界限 拆分成两个数据集,对拆分后的两个数据集分别计算它们的中位数P’ 2 P’’ 2 ,那么① 由四 分位的定义可知第一四分位数
Figure 789121DEST_PATH_IMAGE014
,第三四分位数
Figure 873752DEST_PATH_IMAGE015
如果电子元器件数据量
Figure 370592DEST_PATH_IMAGE016
时,则有:
Figure 270284DEST_PATH_IMAGE017
(4)
如果电子元器件数据量
Figure 397640DEST_PATH_IMAGE018
时,则有:
Figure 31884DEST_PATH_IMAGE019
(5)
通过上述过程计算出P 1 P 3 ,就可以获得四分位间距,四分位间距表示为:
Figure 20831DEST_PATH_IMAGE020
(6)
依据四分位间距I QR 就确定数据样本P V 中的更新数据值內限的范围为:
Figure 791341DEST_PATH_IMAGE021
(7)
公式(7)中,F1代表序列的下限值,F2代表序列的上限值,处于下限到上限范围以外的数据就是最近的更新数据。
本发明有益的积极效果在于:
区别于常规技术,本发明的目的提供一种改进KNN方法的电子元器件数据分类方法,通过步骤一能够从电子元器件数据库中获取电子元器件数据信息,并将获取的电子元器件数据信息按照数据属性分类和分解,通过CNN算法模型实现电子元器件数据信息的预处理;通过步骤二对电子元器件数据信息中每个数据对象评估,通过kd树计算每个元器件和训练集数据集合内每个对象的距离;其中所述kd树中设置有数据更新模块;通过步骤三能够根据每个数据对象K个近邻归属的主要类别测量元器件数据信息;通过步骤四,能够对K个点所属的类别进行比较,根据少数服从多数的原则,将测试样本点归入在K个点中占比最高的那一类;进而输出电子元器件数据信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图,其中:
图1为本发明总体架构示意图;
图2为本发明中CNN算法模型降维方式示意图;
图3为本发明中四分位原理示意图;
图4为本发明中四分位流程示意图;
图5为本发明中多路选择器原理示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的实施例仅用于说明和解释本发明,并不用于限定本发明。
如图1所示,一种改进KNN方法的电子元器件数据分类方法,包括以下步骤:
步骤一:如图1所示,从电子元器件数据库中获取电子元器件数据信息,并将获取的电子元器件数据信息按照数据属性分类和分解,通过CNN算法模型实现电子元器件数据信息的预处理;
步骤二:通过评估模块对电子元器件数据信息中每个数据对象评估,通过kd树计算每个元器件和训练集数据集合内每个对象的距离;其中所述kd树中设置有数据更新模块;
步骤三:根据每个数据对象K个近邻归属的主要类别测量元器件数据信息;对每个元器件数据信息距离进行排序,然后选择距离最小的K个点;
步骤四:对K个点所属的类别进行比较,根据少数服从多数的原则,将测试样本点归入在K个点中占比最高的那一类;进而输出电子元器件数据信息。
在具体实施例中,通过找到k个最近的邻居来做预测,那么只需要计算预测样本和所有训练集中的样本的距离,然后计算出最小的k个距离即可,接着多数表决,很容易做出预测。这个方法的确简单直接,在样本量少,样本特征少的时候有效。在KNN算法模型中,如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。KNN方法在类别决策时,只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。
在上述步骤中,如图2所示,在步骤一中,电子元器件数据信息通过在CNN算法模型中加入降维数据模型实现数据信息降维处理;
原始数据信息包括图片、视频、WORD等多种不同形式的电子元器件数据信息,通过将获取的不同数据库信息进行初值化处理,并对数据信息进行加速收敛并减少拟合,实现数据信息的降维。降维函数为:
Figure 604445DEST_PATH_IMAGE022
(1)
公式(1)中,w0表示CNN算法模型当前权重值,w1表示算法模型的初始权重平衡值,w2表示算法模型的最终权重,γc表示权重因子的索引参数,c表示算法模型的次数。
在具体实施例中,通过降维数据模型实现数据信息降维处理,以提高电子元器件数据信息处理能力。
在步骤一中,CNN算法模型包括图像分割模块,通过欧式距离公式
Figure 663668DEST_PATH_IMAGE023
公式实 现电子元器件数据信息分割:
Figure 502311DEST_PATH_IMAGE024
(2)
公式(2)中,
Figure 101829DEST_PATH_IMAGE025
分别表示不同类型的电子元器件,
Figure 633305DEST_PATH_IMAGE026
Figure 710982DEST_PATH_IMAGE027
表示不同电子元 器件类型之间的距离;
Figure 71425DEST_PATH_IMAGE028
Figure 754211DEST_PATH_IMAGE029
中的i表示某一个电子元器件数据信息,n表示电子元器 件数据信息的总数,将
Figure 941741DEST_PATH_IMAGE030
的电子元器件数据信息化为一类,将
Figure 772293DEST_PATH_IMAGE031
的 电子元器件数据信息化为一类。
在上述步骤二中,kd树包括k维点的二叉树和数据信息搜索模块,其中所述数据信息搜索模块为最邻近搜索方法,用于找出在树中与输入点最接近点。
最邻近搜索方法搜索数据信息的过程为包括以下步骤:
步骤(一)、从kd树根节点开始,依次递归往下移动,当移动到叶节点时,将该节点当作当前最佳点;
步骤(二)、当前所在点比当前最佳点更靠近输入点,则将其变为当前最佳点;检查另一边子树有没有更近的点,如果有,则从该节点往下找,如果没有,则将该节点当作当前最佳点;
步骤(三)、当根节点搜索完毕后完成最邻近搜索。
在上述实施例中,数据更新模块包括数据更新主控模块以及与所述更新主控模块连接的数据输入模块、数据存储模块和数据输出模块。
在上述实施例中,数据更新主控模块为XC7Z035FFGH676-2的Cortex-A9处理器和FPGA控制器。
在具体实施例中,作为数据输入控制的核心,实现了实时数据处理和FLASH存储;还设计了半结构化实时数据的远程采集,采用REMOTE进程,实现了高速的进行数据采集。以FPGA处理系统为数据采集控制的核心,具有时钟频率高、内部延时小、开发频率小、计算高速、编程灵活、集成度高、低功耗、内部资源丰富等优点。核心模块采用的是i.MX6Q核心平台,并集成了Cortex-A9四核处理器,工作频率可达1GHz,搭载了2GB的DDR3内存以及8GB的eMMCFlash;同时支持以太网、CAN总线、UART等接口驱动;支持Linux操作系统。
在上述实施例中,最邻近搜索方法是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构。主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索)。KD树是二进制空间分割树的特殊的情况。
在上述实施例中,数据更新模块实现数据更新的方法为:
通过数据输入模块接收电子元器件数据信息,通过数据存储模块实现电子元器件数据信息的存储,通过数据输出模块实现电子元器件数据信息的输出,更新数据时,通过四分位法实现不同类型电子元器件数据信息的更新分类,通过多路选择器实现数据更新选择。
在具体实施例中,多路选择模块内部预设有数字选择引脚、外部信号接入引脚和内部信号输出引脚,该研究所采用的是74HC4051芯片,该芯片S0-S2是3个数字选择引脚连接三路LED信号导线,A0-A7是8个外部信号接入引脚,A是内部信号输出引脚,三路LED信号线经内部处理器处理后,把74HC4051微处理器的内部数据信号输注至引脚A,引脚A与电容检测模块的输入端相连。
四分位法是指将任意一个电子元器件数据组合按照其大小进行排序,将它们平均分成四个等份,当其中的某个电子元器件数据处于排序后电子元器件数据组的分界处时,称之为四分位数,这些位于分界点的电子元器件数据分别称为第一四分位数、中位数(第二四分位数)、第三四分位数。从下限到上限,电子元器件数据的大小越来越大,这些四分位数的间距就代表了它们数据大小的差值。
对于一个区间内的风速,对应着n个电子元器件数据,对这些电子元器件数据进行逐渐增涨的升序进行排列;
四分位数的计算按以下方式进行:
步骤1、对于电子元器件数据信息,更新数据信息记作为
Figure 890422DEST_PATH_IMAGE032
计算电子元器件数据信息中第二四分位中位数的值P 2
Figure 739298DEST_PATH_IMAGE033
(3)
公式(3)中,n表述电子元器件数据信息;
Figure 346997DEST_PATH_IMAGE034
表示四分位数中分数值;
步骤2、同时算出第一四分位数P 1 、第三四分位数P 3
② 如果电子元器件数据量n为偶数的时候,将升序排列后的样本P V 以中位数P 2 为 界限拆分成两个数据集,对拆分后的两个数据集分别计算它们的中位数P’ 2 P’’ 2 ,那么由 四分位的定义可知第一四分位数
Figure 664846DEST_PATH_IMAGE035
,第三四分位数
Figure 383403DEST_PATH_IMAGE036
③如果电子元器件数据量
Figure 585321DEST_PATH_IMAGE016
时,则有:
Figure 567184DEST_PATH_IMAGE037
(4)
④如果电子元器件数据量
Figure 106749DEST_PATH_IMAGE018
时,则有:
Figure 878265DEST_PATH_IMAGE038
(5)
通过上述过程计算出P 1 P 3 ,就可以获得四分位间距,在具体实施例中,四分位间距表示为interquartile range:
Figure 186887DEST_PATH_IMAGE039
(6)
依据四分位间距I QR 就确定数据样本P V 中的更新数据值內限的范围为:
Figure 401967DEST_PATH_IMAGE040
(7)
公式(7)中,F1代表序列的下限值,F2代表序列的上限值,处于下限到上限范围以外的数据就是最近的更新数据。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些具体实施方式仅是举例说明,本领域的技术人员在不脱离本发明的原理和实质的情况下,可以对上述方法和系统的细节进行各种省略、替换和改变。例如,合并上述方法步骤,从而按照实质相同的方法执行实质相同的功能以实现实质相同的结果则属于本发明的范围。因此,本发明的范围仅由所附权利要求书限定。

Claims (9)

1.一种改进KNN方法的电子元器件数据分类方法,其特征在于:包括以下步骤:
步骤一:从电子元器件数据库中获取电子元器件数据信息,并将获取的电子元器件数据信息按照数据属性分类和分解,通过CNN算法模型实现电子元器件数据信息的预处理;
步骤二:通过评估模块对电子元器件数据信息中每个数据对象评估,通过kd树计算每个元器件和训练集数据集合内每个对象的距离;其中所述kd树中设置有数据更新模块;
步骤三:根据每个数据对象K个近邻归属的主要类别测量元器件数据信息;对每个元器件数据信息距离进行排序,然后选择距离最小的K个点;
步骤四:对K个点所属的类别进行比较,根据少数服从多数的原则,将测试样本点归入在K个点中占比最高的那一类;进而输出电子元器件数据信息。
2.根据权利要求1所述的一种改进KNN方法的电子元器件数据分类方法,其特征在于:电子元器件数据信息通过在CNN算法模型中加入降维数据模型实现数据信息降维处理;降维函数为:
Figure 812138DEST_PATH_IMAGE001
(1)
公式(1)中,w0表示CNN算法模型当前权重值,w1表示算法模型的初始权重平衡值,w2表示算法模型的最终权重,γc表示权重因子的索引参数,c表示算法模型的次数。
3.根据权利要求2所述的一种改进KNN方法的电子元器件数据分类方法,其特征在于: CNN算法模型包括图像分割模块,通过欧式距离公式
Figure 522736DEST_PATH_IMAGE002
公式实现电子元器件数据信息 分割:
Figure 377559DEST_PATH_IMAGE003
(2)
公式(2)中,
Figure 954034DEST_PATH_IMAGE004
分别表示不同类型的电子元器件,
Figure 739456DEST_PATH_IMAGE005
Figure 819408DEST_PATH_IMAGE006
表示不同电子元器件类 型之间的距离;
Figure 110712DEST_PATH_IMAGE007
Figure 266493DEST_PATH_IMAGE008
中的i表示某一个电子元器件数据信息,n表示电子元器件数据 信息的总数,将
Figure 403077DEST_PATH_IMAGE009
的电子元器件数据信息化为一类,将
Figure 898387DEST_PATH_IMAGE010
的电子元器 件数据信息化为一类。
4.根据权利要求1所述的一种改进KNN方法的电子元器件数据分类方法,其特征在于:kd树包括k维点的二叉树和数据信息搜索模块,其中所述数据信息搜索模块为最邻近搜索方法,用于找出在树中与输入点最接近点。
5.根据权利要求4所述的一种改进KNN方法的电子元器件数据分类方法,其特征在于:最邻近搜索方法搜索数据信息的过程为包括以下步骤:
步骤(一)、从kd树根节点开始,依次递归往下移动,当移动到叶节点时,将该节点当作当前最佳点;
步骤(二)、当前所在点比当前最佳点更靠近输入点,则将其变为当前最佳点;检查另一边子树有没有更近的点,如果有,则从该节点往下找,如果没有,则将该节点当作当前最佳点;
步骤(三)、当根节点搜索完毕后完成最邻近搜索。
6.根据权利要求1所述的一种改进KNN方法的电子元器件数据分类方法,其特征在于:数据更新模块包括数据更新主控模块以及与所述更新主控模块连接的数据输入模块、数据存储模块和数据输出模块。
7.根据权利要求6所述的一种改进KNN方法的电子元器件数据分类方法,其特征在于:数据更新主控模块为XC7Z035FFGH676-2的Cortex-A9处理器和FPGA控制器。
8.根据权利要求6所述的一种改进KNN方法的电子元器件数据分类方法,其特征在于:数据更新模块实现数据更新的方法为:
通过数据输入模块接收电子元器件数据信息,通过数据存储模块实现电子元器件数据信息的存储,通过数据输出模块实现电子元器件数据信息的输出,更新数据时,通过四分位法实现不同类型电子元器件数据信息的更新分类,通过多路选择器实现数据更新选择。
9.根据权利要求8所述的一种改进KNN方法的电子元器件数据分类方法,其特征在于:四分位数的计算按以下方式进行:
步骤1、对于电子元器件数据信息,更新数据信息记作为
Figure 16384DEST_PATH_IMAGE011
;计算电子元器件 数据信息中第二四分位中位数的值P 2
Figure 534828DEST_PATH_IMAGE012
(3)
公式(3)中,n表述电子元器件数据信息;
Figure 475102DEST_PATH_IMAGE013
表示四分位数中分数值;
步骤2、同时算出第一四分位数P 1 、第三四分位数P 3
如果电子元器件数据量n为偶数的时候,将升序排列后的样本P V 以中位数P 2 为界限拆分 成两个数据集,对拆分后的两个数据集分别计算它们的中位数P’ 2 P’’ 2 ,那么①由四分位 的定义可知第一四分位数
Figure 890165DEST_PATH_IMAGE014
,第三四分位数
Figure 523272DEST_PATH_IMAGE015
如果电子元器件数据量
Figure 764897DEST_PATH_IMAGE016
时,则有:
Figure 961392DEST_PATH_IMAGE017
(4)
如果电子元器件数据量
Figure 808126DEST_PATH_IMAGE018
时,则有:
Figure 408871DEST_PATH_IMAGE019
(5)
通过上述过程计算出P 1 P 3 ,就可以获得四分位间距,四分位间距表示为:
Figure 292120DEST_PATH_IMAGE020
(6)
依据四分位间距I QR 就确定数据样本P V 中的更新数据值內限的范围为:
Figure 324929DEST_PATH_IMAGE021
(7)
公式(7)中,F1代表序列的下限值,F2代表序列的上限值,处于下限到上限范围以外的数据就是最近的更新数据。
CN202210704205.2A 2022-06-21 2022-06-21 改进knn方法的电子元器件数据分类方法 Pending CN114781555A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210704205.2A CN114781555A (zh) 2022-06-21 2022-06-21 改进knn方法的电子元器件数据分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210704205.2A CN114781555A (zh) 2022-06-21 2022-06-21 改进knn方法的电子元器件数据分类方法

Publications (1)

Publication Number Publication Date
CN114781555A true CN114781555A (zh) 2022-07-22

Family

ID=82421511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210704205.2A Pending CN114781555A (zh) 2022-06-21 2022-06-21 改进knn方法的电子元器件数据分类方法

Country Status (1)

Country Link
CN (1) CN114781555A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115017125A (zh) * 2022-08-09 2022-09-06 晨达(广州)网络科技有限公司 改进knn方法的数据处理方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110413791A (zh) * 2019-08-05 2019-11-05 哈尔滨工业大学 基于cnn-svm-knn组合模型的文本分类方法
US20190355113A1 (en) * 2018-05-21 2019-11-21 Corista, LLC Multi-sample Whole Slide Image Processing in Digital Pathology via Multi-resolution Registration and Machine Learning
CN110532441A (zh) * 2019-08-23 2019-12-03 广州医科大学 一种电子元器件智慧管理方法及其系统
US20210034840A1 (en) * 2019-07-31 2021-02-04 Guangxi University Method for Recognzing Face from Monitoring Video Data
CN113590818A (zh) * 2021-06-30 2021-11-02 中国电子科技集团公司第三十研究所 一种基于cnn与gru及knn融合的政务文本数据分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190355113A1 (en) * 2018-05-21 2019-11-21 Corista, LLC Multi-sample Whole Slide Image Processing in Digital Pathology via Multi-resolution Registration and Machine Learning
US20210034840A1 (en) * 2019-07-31 2021-02-04 Guangxi University Method for Recognzing Face from Monitoring Video Data
CN110413791A (zh) * 2019-08-05 2019-11-05 哈尔滨工业大学 基于cnn-svm-knn组合模型的文本分类方法
CN110532441A (zh) * 2019-08-23 2019-12-03 广州医科大学 一种电子元器件智慧管理方法及其系统
CN113590818A (zh) * 2021-06-30 2021-11-02 中国电子科技集团公司第三十研究所 一种基于cnn与gru及knn融合的政务文本数据分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
殷亚博等: "基于卷积神经网络和KNN的短文本分类算法研究", 《计算机工程》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115017125A (zh) * 2022-08-09 2022-09-06 晨达(广州)网络科技有限公司 改进knn方法的数据处理方法和装置
CN115017125B (zh) * 2022-08-09 2022-10-21 晨达(广州)网络科技有限公司 改进knn方法的数据处理方法和装置

Similar Documents

Publication Publication Date Title
CN109639739B (zh) 一种基于自动编码器网络的异常流量检测方法
US11087066B2 (en) Static voltage drop (SIR) violation prediction systems and methods
US5014327A (en) Parallel associative memory having improved selection and decision mechanisms for recognizing and sorting relevant patterns
US8872830B2 (en) Method for generating a graph lattice from a corpus of one or more data graphs
CN112101430A (zh) 用于图像目标检测处理的锚框生成方法及轻量级目标检测方法
CN108280236A (zh) 一种基于LargeVis的随机森林可视化数据分析方法
US8434037B2 (en) Sub-circuit pattern recognition in integrated circuit design
CN114239083B (zh) 一种基于图神经网络的高效状态寄存器识别方法
CN116822383A (zh) 设备寿命预测模型构建方法、装置、可读存储介质及设备
US20230316049A1 (en) Method for ai-based circuit design and implementation system thereof
CN114781555A (zh) 改进knn方法的电子元器件数据分类方法
US7561743B2 (en) Reference data recognition and learning method and pattern recognition system
CN114821299A (zh) 一种遥感图像变化检测方法
CN114092379A (zh) 晶圆缺陷数据的聚类方法及装置
CN114596302A (zh) 一种pcb板缺陷检测方法、系统、介质、设备及终端
CN112182140B (zh) 结合rpa和ai的信息录入方法、装置、计算机设备和介质
CN115878824B (zh) 图像检索系统、方法和装置
CN109271989A (zh) 一种基于cnn和rnn模型的手写试验数据自动识别方法
CN114626485A (zh) 一种基于改进knn算法的数据标签分类方法及装置
CN115617945A (zh) 跨模态数据检索模型的建立方法以及跨模态数据检索方法
CN115527152A (zh) 一种小样本视频动作分析方法、系统及装置
US11663816B2 (en) Apparatus and method for classifying attribute of image object
CN114897075A (zh) 一种基于元模板知识库的异构图像匹配方法
CN114925605A (zh) 一种用于集成电路设计中选取训练数据的方法
CN114638277A (zh) 一种基于判别决策树的工业部件分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220722

RJ01 Rejection of invention patent application after publication