CN111814406B - 一种多晶硅原料重要度分析方法及系统 - Google Patents
一种多晶硅原料重要度分析方法及系统 Download PDFInfo
- Publication number
- CN111814406B CN111814406B CN202010729912.8A CN202010729912A CN111814406B CN 111814406 B CN111814406 B CN 111814406B CN 202010729912 A CN202010729912 A CN 202010729912A CN 111814406 B CN111814406 B CN 111814406B
- Authority
- CN
- China
- Prior art keywords
- weight
- importance
- polysilicon
- polycrystalline silicon
- batching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 229910021420 polycrystalline silicon Inorganic materials 0.000 title claims abstract description 139
- 239000002994 raw material Substances 0.000 title claims abstract description 43
- 238000004458 analytical method Methods 0.000 title description 6
- 229920005591 polysilicon Polymers 0.000 claims abstract description 80
- 239000004615 ingredient Substances 0.000 claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000002068 genetic effect Effects 0.000 claims description 11
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000035772 mutation Effects 0.000 description 4
- 238000005266 casting Methods 0.000 description 3
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 229910052710 silicon Inorganic materials 0.000 description 2
- 239000010703 silicon Substances 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000003889 chemical engineering Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000002210 silicon-based material Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- ZDHXKXAHOVTTAH-UHFFFAOYSA-N trichlorosilane Chemical compound Cl[SiH](Cl)Cl ZDHXKXAHOVTTAH-UHFFFAOYSA-N 0.000 description 1
- 239000005052 trichlorosilane Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/04—Ageing analysis or optimisation against ageing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Testing Or Measuring Of Semiconductors Or The Like (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种多晶硅原料重要度分析方法及系统,该方法包括:获取多晶硅配料数据以及少子寿命值;设定多晶硅配料的重要度权重阈值,记为第一权重;采用邻域粗糙集‑遗传算法计算所述多晶硅配料数据的重要度;根据所述多晶硅配料数据的重要度计算多晶硅配料对少子寿命值的重要度所占权重,记为第二权重;判断所述第二权重是否大于第一权重;若是,则所述多晶硅配料为主要类;若否,则判断所述第二权重是否等于0;若是,则所述多晶硅配料为无影响类;若否,则所述多晶硅配料为次要类。本发明能够在数据层面按照重要度的不同实现对多晶硅原料的配料的分类。
Description
技术领域
本发明涉及多晶硅材料领域,特别是涉及一种多晶硅原料重要度分析方法及系统。
背景技术
随着光伏行业的迅猛发展,多晶硅电池凭借其较高的性价比一直占据着光伏市场的主导地位。铸造多晶硅是多晶硅太阳能电池制作过程中的一个重要环节。但多晶硅铸造过程会出现大量杂质和缺陷,造成多晶硅少子寿命降低。生产过程中的配料对高效多晶硅铸锭的电学性能有着至关重要的影响,同时有效合理的配料工艺对成本也起着关键性的作用。实际多晶硅铸造过程中,原料种类较多,如果对每一种配料数据都进行详细分析,很难找到对生产效率起关键性影响的配料种类。
而且现有专利中的多晶硅分析方法一般是从化工及反应装置层面对其进行分析。如专利“一种多晶硅生产原料及多晶硅生产方法”中,利用来自三氯氢硅和氢气还原制备多晶硅的生产工艺的生产的还原尾气为原料制备多晶硅;专利“多晶硅硅棒裂纹检测方法”中,根据硅棒出现裂纹时电流的波动特征进行硅棒裂纹检测;专利“高纯度多晶硅的制造方法”中,通过使用含碳杂质的浓度低的原料气体来实现多晶硅的进一步高纯度化的技术。但是这些专利都是在化工和反应装置层面,并没有在数据层面对多晶硅进行分析。
发明内容
本发明的目的是提供一种多晶硅原料重要度分析方法及系统,能够在数据层面按照重要度的不同实现对多晶硅原料的配料的分类。
为实现上述目的,本发明提供了如下方案:
一种多晶硅原料重要度分析方法,包括:
获取多晶硅配料数据以及少子寿命值;
设定多晶硅配料的重要度权重阈值,记为第一权重;
采用邻域粗糙集-遗传算法计算所述多晶硅配料数据的重要度;
根据所述多晶硅配料数据的重要度计算多晶硅配料对少子寿命值的重要度所占权重,记为第二权重;
判断所述第二权重是否大于第一权重;
若是,则所述多晶硅配料为主要类;
若否,则判断所述第二权重是否等于0;
若是,则所述多晶硅配料为无影响类;
若否,则所述多晶硅配料为次要类。
可选的,所述第一权重为0.5。
可选的,所述采用邻域粗糙集-遗传算法计算所述多晶硅配料数据的重要度,包括:
对所述多晶硅配料数据以及少子寿命值进行归一化,所述多晶硅配料数据包括多个多晶硅的配料样本,每个多晶硅配料样本包括多种配料类型;
分别计算每种配料类型的标准差以及少子寿命值的标准差;
获取待优化的邻域半径参数范围;
根据所述邻域半径参数范围采用遗传算法优化邻域半径参数,得到优化后的邻域半径参数;
将所述多晶硅配料数据以及少子寿命值的标准差除以优化后的邻域半径参数,得到所述多晶硅配料数据以及少子寿命值的邻域半径;
根据所述多晶硅配料数据以及少子寿命值的邻域半径得到所述多晶硅配料数据的重要度。
可选的,所述待优化的邻域半径参数范围为(1,4)。
一种多晶硅原料重要度分析系统,包括:
数据获取模块,用于获取多晶硅配料数据以及少子寿命值;
阈值设定模块,用于设定多晶硅配料的重要度权重阈值,记为第一权重;
邻域粗糙集-遗传算法模块,用于采用邻域粗糙集-遗传算法计算所述多晶硅配料数据的重要度;
权重计算模块,用于根据所述多晶硅配料数据的重要度计算多晶硅配料对少子寿命值的重要度所占权重,记为第二权重;
第一判断模块,用于判断所述第二权重是否大于第一权重;
第二判断模块,用于判断所述第二权重是否等于0;
第一输出模块,用于当所述第二权重大于第一权重时,输出所述多晶硅配料为主要类;
第二输出模块,用于当所述第二权重等于0时,输出所述多晶硅配料为无影响类;
第三输出模块,用于当所述第二权重小于或等于第一权重,且所述第二权重不等于0时,输出所述多晶硅配料为次要类。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明从数据层面对多晶硅配料数据和少子寿命值进行分析,并采用邻域粗糙集-遗传算法计算所述多晶硅配料数据对少子寿命值重要度所占权重,最后根据重要度权重阈值判断所述多晶硅配料的重要程度,实现了对多晶硅原料的配料按照重要度自动分类的过程,相较于传统的人工识别,精确度更高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明多晶硅原料重要度分析方法流程图;
图2为本发明遗传算法优化邻域半径参数流程图;
图3为本发明多晶硅原料重要度分析系统模块图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种多晶硅原料重要度分析方法及系统,能够在数据层面按照重要度的不同实现对多晶硅原料的配料的分类。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明多晶硅原料重要度分析方法流程图,如图1所示,一种多晶硅原料重要度分析方法,包括:
步骤101:获取多晶硅配料数据以及少子寿命值;
步骤102:设定多晶硅配料的重要度权重阈值,记为第一权重;
步骤103:采用邻域粗糙集-遗传算法计算所述多晶硅配料数据的重要度;
步骤104:根据所述多晶硅配料数据的重要度计算多晶硅配料对少子寿命值的重要度所占权重,记为第二权重;
步骤105:判断所述第二权重是否大于第一权重;
步骤106:若是,则所述多晶硅配料为主要类;
步骤107:若否,则判断所述第二权重是否等于0;
步骤108:若是,则所述多晶硅配料为无影响类;
步骤109:若否,则所述多晶硅配料为次要类。
具体的,步骤101需要从工厂获取配料单及少子寿命值。首先工厂提供每一个锭的配料单及该锭最终的的少子寿命值。单号PL-1配料单示例如表1所示:
表1单号PL-1配料单及少子寿命值
为了方便后续计算,对步骤101中获取的配料单中配料来源、配料总重量及少子寿命值进行统计,生成格式决策表,如表2所示:(决策表:用于重要度计算的数据格式)
表2多晶硅数据决策表(质量单位:kg)
步骤102中需要设置多晶硅配料的重要度权重阈值,本专利将阈值设置为0.5,其目的是将配料原料重要度权重高于0.5的多晶硅原料属性归为主要类原料,将原料重要度权重低于0.5得归为次要类原料,将原料重要度权重为0的归为无影响类原料。
步骤103中所称邻域粗糙集-遗传算法算法,也叫NRS-Ga算法(NRS为邻域粗糙集,Ga为遗传算法),因为计算重要度用的方法是邻域粗糙集,遗传算法是优化邻域粗糙集的方法,这里是将两种方法结合在一起计算重要度。所以综合为NRS-Ga算法,或者称为:邻域粗糙集-遗传算法。
对于重要度计算均用表3(部分数据)数据举例计算(表中为了方便将单号PL-1简化为x1,以此类推)。
表3多晶硅原料数据决策表
首先由于数据存在数量级和量纲的差异,为了得到精确的处理结果,在处理数据之前对原始数据进行归一化处理,采用最大最小值法进行归一化处理,其公式为:
式中,xmin和xmax分别为每列数据的最小值和最大值,xi为该列数据的第i个值,f(xi)为归一化处理后的值。归一化后的数据如表4所示:
表4归一化处理后数据
得到上述结果后,对归一化后的每一列数据求标准差;
然后利用遗传算法优化邻域半径参数λ;
然后计算每一列数据的邻域半径,方法就是将该列数据标准差除以λ值;
最后根据所述多晶硅配料数据以及少子寿命值的邻域半径得到所述多晶硅配料数据的重要度。
其中,关于遗传算法部分计算流程如图2所示,具体介绍如下:
(1)对λ进行染色体编码:
设置λ的取值范围为1-4之间,编码长度为10(意为二进制编码长度为10),种群大小为30(意为生成30个十位二进制数),总体意思为随机产生30个大小在1-4之间的十位二进制数λ。
(2)对这30个1-4之间的数进行重要度及总依赖度(依赖度也称邻域近似质量,其值越大代表条件属性(也就是配料类型)与决策属性(也就是少子寿命值)的关联性越强)计算。其目的是为了计算下一步的适应度值。
以λ=2.4为例,计算数据的重要度及总依赖度:
[1]每列数据的邻域半径分别如表5所示:
表5各个原料数据邻域半径取值
[2]对决策表进行邻域划分:
计算每一列属性值的邻域,即以某一样本具体属性值为中心,邻域半径为半径做空间内圆,则包含在该图形内的所有样本属性值的集合即为该属性值的邻域,例如表4中免洗原生多晶块料点x1(0.0625)的邻域为包含在区间[0.0625-0.1605,0.0625+0.1605]范围内这一列数据的所有点的集合即点x1(0.0625)、点x2(0),所以免洗生多晶块料点x1(0.0625)的邻域为{x1,x2},将所有点计算出邻域。邻域划分结果如表6所示,其中为了方便表示将表中括号内数字代替属性名称。
表6邻域划分结果
[3]求总邻域。
根据表6各个属性邻域求总邻域,其中总邻域等于除少子寿命值以外其余每行邻域的交集,例如求代号(1)(2)(3)(4)δ(x1)的总邻域为x1x2∩x1∩x1x2∩x1x2x6=x1;求(1)(3)(4)δ(x1)的总邻域为x1x2∩x1x2∩x1x2x6=x1x2。以此类推求出所有总邻域如表7所示:
表7总邻域计算结果
[4]根据总邻域求下近似和正域:
根据表7中的总邻域求下近似,下近似在数值上等于正域,正域的含义为样本被正确分类的个数。下近似计算公式为如下:
其中,NB Di为下近似,B为属性类别,意为我们计算哪些列的下近似那么B代表哪些列,比如计算(1)(2)(3)这三列的下近似B就代表这三列的总和。
Di为决策属性(决策属性是产生的结果,也就是少子寿命值)的邻域划分情况,比如δ(x1)的Di为x1。
δ(xi)就是表7中对应的邻域。xi∈U,意为xi属于这8个样本中,U代表样本数。
式中意为如果xi的邻域δ(xi)属于决策属性划分Di的真子集,那么xi这一点为该属性的下近似。举例说明:假如计算(1)(2)(3)(4)下近似,那么表中δ(x1)=x1,D1=x1,成立,那么x1是他的一个下近似;δ(x2)=x2,D2=x2,成立,那么x2是他的一个下近似,以此类推求出这一列所有的下近似,即为(1)(2)(3)(4)的总下近似。并分别求出(1)(2)(3),(1)(2)(4),(1)(3)(4),(2)(3)(4)的总下近似,总下近似在数值上等于正域,正域的含义为该列数据被正确分类的个数。即POSB(D)=NB D,POSB(D)为正域符号,如表8所示:
表8正域计算结果
属性 | (1)(2)(3)(4) | (1)(2)(3) | (1)(2)(4) | (1)(3)(4) | (2)(3)(4) |
正域 | x<sub>1</sub>x<sub>2</sub>x<sub>3</sub>x<sub>4</sub>x<sub>5</sub>x<sub>6</sub>x<sub>7</sub>x<sub>8</sub> | x<sub>1</sub>x<sub>2</sub>x<sub>3</sub>x<sub>5</sub>x<sub>6</sub>x<sub>7</sub> | x<sub>1</sub>x<sub>2</sub>x<sub>3</sub>x<sub>4</sub>x<sub>5</sub>x<sub>6</sub>x<sub>7</sub>x<sub>8</sub> | x<sub>3</sub>x<sub>4</sub>x<sub>5</sub>x<sub>6</sub>x<sub>7</sub>x<sub>8</sub> | x<sub>1</sub>x<sub>2</sub>x<sub>3</sub>x<sub>4</sub>x<sub>5</sub>x<sub>6</sub> |
[5]计算依赖度。
依赖度等于正域的个数比上论域U的个数(论域U就是所有样本的个数,本例中一共8个样本,则U=8)。公式为:
表9依赖度计算结果
属性 | (1)(2)(3)(4) | (1)(2)(3) | (1)(2)(4) | (1)(3)(4) | (2)(3)(4) |
依赖度 | 1 | 0.75 | 1 | 0.75 | 0.75 |
(1)(2)(3)(4)的总依赖度为下一步适应度函数中的γB(2.4)=1。
[6]计算重要度。
重要度等于总依赖度减去除该列以外的总依赖度,公式为:
Sig(a,B,D)=γB(D)-γB-{a}(D) (5)
式中a代表要求重要度的那一列(如果求(1)的重要度那么a就为(1)),B代表所有列数(也就是(1)(2)(3)(4)),D还是代表决策属性也就是少子寿命值的邻域划分。
例如求(1)的重要度,就用总依赖度也就是((1)(2)(3)(4)的依赖度)减去除去(1)以外的依赖度(也是就是(2)(3)(4)的依赖度),即1-0.75=0.25,重要度计算结果如表10所示:
表10重要度计算结果
属性 | (1) | (2) | (3) | (4) |
重要度 | 0.25 | 0.25 | 0 | 0.25 |
对于重要度为0的配料类型,将其约简掉,那么约简集合长度为length(2.4)=3.
(3)计算种群适应度:适应度函数为遗传算法的核心部分,一个好的适应度函数既可以满足我们所要达到的目的,同时也可以减少算法的复杂程度。遗传算法的目的是通过寻找最佳邻域半径参数λ值,来准确的刻画基本信息粒子,从而保证数据较高的邻域近似质量(近似质量为数据总的依赖度)且保留相对较小的约简集合。根据以上目的,提出适应度函数:
式中length(λ)为在λ取值下,对于重要度为0的配料类型,将其约简掉,计算出约简集合长度(本例中为length(2.4)=3),T为所有条件属性个数(也就是有多少种配料类型,在本例中T=4),γB(λ)为邻域近似质量(本例中为γB(2.4)=1),为了防止在某些λ取值下约简集合个数过少致使核属性被约简,适应度仍然很高的情况,提出(length(λ)-T/3)来保证最终约简集合长度不少于总长度的1/3,若小于1/3则适应度为负数,直接淘汰,且为了不影响最终适应度值大小,将其比上本身的绝对值,将该值控制为1和-1;a与b分别为邻域近似质量及约简集合长度所占权值,a+b+=1(本例a,b均取0.5),同时为了使遗传算法收敛更快,采用指数函数。则当λ=2.4时,适应度值为:
按照步骤(2)和(3)计算出30个1-4之间参数的适应度。
(4)选择、交叉、变异,产生新一代种群:
选择:假设3个个体的适应度值分别为2、3、4那么2被选择到的概率为2/(2+3+4),以此类推,得出每个个体被选择到的概率,进行选择操作。
交叉:假设一个个体的十位二进制编码为111010|1011,另一个编码为110011|1000,假设从画竖线的位置交叉,那么交叉后两个编码分别为1110101000和1100111011。交叉是以一定概率发生的,概率一般为0.01.
变异:假设一个个体的十位二进制编码为1110101011,假设变异发生在编码的最后一位那么变异后的编码为1110101010。变异也是在一定概率下发生的,概率一般为0.01。
对以上的30个十位二级制数进行选择、交叉、变异操作,产生新一代种群(也就通过对二级制数进行选择、交叉、变异产生了30个新的1-4之间的数字)。并再次计算适应度。挑选出适应度最大的适应度值。
(5)是否连续5次最大适应度不变或者循环次数超过100次。终止条件设为:当连续传代个体最佳适应度连续5次不变或者传代次数达到最大传代次数100次则算法终止(解释:每次选择、交叉、变异之后产生的30个1-4之间的参数中,计算出的适应度最大值连续5次不变,或者达到最大循环次数100次,则算法终止)。
(6)输出最终适应度最大所对应的λ值,及在该λ值下,数据各个属性的重要度。
步骤104根据步骤103得到的重要度计算重要度权重,即为用要求属性的重要度比上所有重要度相加。
例如求(1)重要度权重,即为0.25/(0.25+0+0.25+0.25)=0.3333。
步骤105-步骤109就是对输出原料重要度权重进行判别,将原料重要度权重高于0.5(设定阈值)的多晶硅原料属性归为主要类原料,将原料重要度权重低于0.5的归为次要类原料,将原料重要度权重为0的归为无影响类原料。
得到上述分类以后,我们能够对归为主要类的多晶硅原料进行重点监测,对其配比、用量以及最终产品质量进行综合分析,为日后此类原料的使用提供指导意见。
图3为本发明多晶硅原料重要度分析系统模块图,如图3所示,一种多晶硅原料重要度分析系统,包括:
数据获取模块301,用于获取多晶硅配料数据以及少子寿命值;
阈值设定模块302,用于设定多晶硅配料的重要度权重阈值,记为第一权重;
邻域粗糙集-遗传算法模块303,用于采用邻域粗糙集-遗传算法计算所述多晶硅配料数据的重要度的重要度;
权重计算模块304,用于根据所述多晶硅配料数据的重要度计算多晶硅配料对少子寿命值的重要度所占权重,记为第二权重;
第一判断模块305,用于判断所述第二权重是否大于第一权重;
第二判断模块306,用于判断所述第二权重是否等于0;
第一输出模块307,用于当所述第二权重大于第一权重时,输出所述多晶硅配料为主要类;
第二输出模块308,用于当所述第二权重等于0时,输出所述多晶硅配料为无影响类;
第三输出模块309,用于当所述第二权重小于或等于第一权重,且所述第二权重不等于0时,输出所述多晶硅配料为次要类。
本发明还公开了如下技术效果:
本发明利用大数据分析技术,对多晶硅原料数据进行分析,得出对少子寿命值影响程度较大的主要原料类型,为实际工业生产分析提供重要参考。
本发明采用邻域粗糙集对数据进行属性约简,邻域粗糙集是一种刻划不完整性和不确定性的数学工具,能有效地分析不精确,不一致、不完整等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。邻域粗糙集的主要功能是对数据进行属性约简,得出每个条件属性对决策属性影响程度所占权重,通过权重,可以找到对决策影响较大的属性,并对其进行重点监测。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (4)
1.一种多晶硅原料重要度分析方法,其特征在于,包括:
获取多晶硅配料数据以及少子寿命值;
设定多晶硅配料的重要度权重阈值,记为第一权重;
采用邻域粗糙集-遗传算法计算所述多晶硅配料数据的重要度;
所述采用邻域粗糙集-遗传算法计算所述多晶硅配料数据的重要度,包括:
对所述多晶硅配料数据以及少子寿命值进行归一化,所述多晶硅配料数据包括多个多晶硅的配料样本,每个多晶硅配料样本包括多种配料类型;
分别计算每种配料类型的标准差以及少子寿命值的标准差;
获取待优化的邻域半径参数范围;
根据所述邻域半径参数范围采用遗传算法优化邻域半径参数,得到优化后的邻域半径参数;
将所述多晶硅配料数据以及少子寿命值的标准差除以优化后的邻域半径参数,得到所述多晶硅配料数据以及少子寿命值的邻域半径;
根据所述多晶硅配料数据以及少子寿命值的邻域半径得到所述多晶硅配料数据的重要度;
根据所述多晶硅配料数据的重要度计算多晶硅配料对少子寿命值的重要度所占权重,记为第二权重;
判断所述第二权重是否大于第一权重;
若是,则所述多晶硅配料为主要类;
若否,则判断所述第二权重是否等于0;
若是,则所述多晶硅配料为无影响类;
若否,则所述多晶硅配料为次要类。
2.根据权利要求1所述的多晶硅原料重要度分析方法,其特征在于,所述第一权重为0.5。
3.根据权利要求1所述的多晶硅原料重要度分析方法,其特征在于,所述待优化的邻域半径参数范围为(1,4)。
4.一种多晶硅原料重要度分析系统,其特征在于,包括:
数据获取模块,用于获取多晶硅配料数据以及少子寿命值;
阈值设定模块,用于设定多晶硅配料的重要度权重阈值,记为第一权重;
邻域粗糙集-遗传算法模块,用于采用邻域粗糙集-遗传算法计算所述多晶硅配料数据的重要度;
所述采用邻域粗糙集-遗传算法计算所述多晶硅配料数据的重要度,包括:
对所述多晶硅配料数据以及少子寿命值进行归一化,所述多晶硅配料数据包括多个多晶硅的配料样本,每个多晶硅配料样本包括多种配料类型;
分别计算每种配料类型的标准差以及少子寿命值的标准差;
获取待优化的邻域半径参数范围;
根据所述邻域半径参数范围采用遗传算法优化邻域半径参数,得到优化后的邻域半径参数;
将所述多晶硅配料数据以及少子寿命值的标准差除以优化后的邻域半径参数,得到所述多晶硅配料数据以及少子寿命值的邻域半径;
根据所述多晶硅配料数据以及少子寿命值的邻域半径得到所述多晶硅配料数据的重要度;
权重计算模块,用于根据所述多晶硅配料数据的重要度计算多晶硅配料对少子寿命值的重要度所占权重,记为第二权重;
第一判断模块,用于判断所述第二权重是否大于第一权重;
第二判断模块,用于判断所述第二权重是否等于0;
第一输出模块,用于当所述第二权重大于第一权重时,输出所述多晶硅配料为主要类;
第二输出模块,用于当所述第二权重等于0时,输出所述多晶硅配料为无影响类;
第三输出模块,用于当所述第二权重小于或等于第一权重,且所述第二权重不等于0时,输出所述多晶硅配料为次要类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010729912.8A CN111814406B (zh) | 2020-07-27 | 2020-07-27 | 一种多晶硅原料重要度分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010729912.8A CN111814406B (zh) | 2020-07-27 | 2020-07-27 | 一种多晶硅原料重要度分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111814406A CN111814406A (zh) | 2020-10-23 |
CN111814406B true CN111814406B (zh) | 2022-08-09 |
Family
ID=72862620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010729912.8A Active CN111814406B (zh) | 2020-07-27 | 2020-07-27 | 一种多晶硅原料重要度分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111814406B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915447A (zh) * | 2012-09-20 | 2013-02-06 | 西安科技大学 | 一种基于二叉树支持向量机的分类方法 |
CN103229046A (zh) * | 2010-11-29 | 2013-07-31 | 大日本印刷株式会社 | 评价用基板、缺陷检查方法以及缺陷检测装置 |
CN105678411A (zh) * | 2015-12-30 | 2016-06-15 | 西南交通大学 | 一种旅客列车运行方案图编制方法 |
CN107679368A (zh) * | 2017-09-11 | 2018-02-09 | 宁夏医科大学 | 基于遗传算法和变精度粗糙集的pet/ct高维特征级选择方法 |
CN108872813A (zh) * | 2018-07-04 | 2018-11-23 | 太原理工大学 | 一种用于电缆局部放电检测的光纤拾音探头装置 |
CN108985462A (zh) * | 2018-07-12 | 2018-12-11 | 北京航空航天大学 | 基于互信息和分形维数的无监督特征选择方法 |
CN109145354A (zh) * | 2017-06-18 | 2019-01-04 | 科文托尔公司 | 关键参数识别、工艺模型校准和可变性分析的系统和方法 |
CN110968618A (zh) * | 2019-11-07 | 2020-04-07 | 华中科技大学 | 一种挖掘焊接参数量化关联规则的方法及应用 |
CN111221249A (zh) * | 2019-12-31 | 2020-06-02 | 中国电力科学研究院有限公司 | 一种用于数据中心系统群控的参数优化的方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6846734B2 (en) * | 2002-11-20 | 2005-01-25 | International Business Machines Corporation | Method and process to make multiple-threshold metal gates CMOS technology |
US11074495B2 (en) * | 2013-02-28 | 2021-07-27 | Z Advanced Computing, Inc. (Zac) | System and method for extremely efficient image and pattern recognition and artificial intelligence platform |
JP2015065270A (ja) * | 2013-09-25 | 2015-04-09 | ソニー株式会社 | 固体撮像装置およびその製造方法、並びに電子機器 |
-
2020
- 2020-07-27 CN CN202010729912.8A patent/CN111814406B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103229046A (zh) * | 2010-11-29 | 2013-07-31 | 大日本印刷株式会社 | 评价用基板、缺陷检查方法以及缺陷检测装置 |
CN102915447A (zh) * | 2012-09-20 | 2013-02-06 | 西安科技大学 | 一种基于二叉树支持向量机的分类方法 |
CN105678411A (zh) * | 2015-12-30 | 2016-06-15 | 西南交通大学 | 一种旅客列车运行方案图编制方法 |
CN109145354A (zh) * | 2017-06-18 | 2019-01-04 | 科文托尔公司 | 关键参数识别、工艺模型校准和可变性分析的系统和方法 |
CN107679368A (zh) * | 2017-09-11 | 2018-02-09 | 宁夏医科大学 | 基于遗传算法和变精度粗糙集的pet/ct高维特征级选择方法 |
CN108872813A (zh) * | 2018-07-04 | 2018-11-23 | 太原理工大学 | 一种用于电缆局部放电检测的光纤拾音探头装置 |
CN108985462A (zh) * | 2018-07-12 | 2018-12-11 | 北京航空航天大学 | 基于互信息和分形维数的无监督特征选择方法 |
CN110968618A (zh) * | 2019-11-07 | 2020-04-07 | 华中科技大学 | 一种挖掘焊接参数量化关联规则的方法及应用 |
CN111221249A (zh) * | 2019-12-31 | 2020-06-02 | 中国电力科学研究院有限公司 | 一种用于数据中心系统群控的参数优化的方法 |
Non-Patent Citations (3)
Title |
---|
Supervised, Unsupervised, and Semi-Supervised Feature Selection: A Review on Gene Selection;Jun Chin Ang等;《IEEE/ACM Transactions on Computational Biology and Bioinformatics IEEE/ACM Transactions on Computational Biology and Bioinformatics》;20150914;第13卷(第5期);第971-989页 * |
基于邻域粗糙集和支持向量机的固结系数预测;尹超等;《吉林大学学报(地球科学版)》;20190521;第49卷(第3期);第746-754页 * |
邻域粗糙集算法改进及在多晶硅数据的应用;徐静林;《中国优秀硕士学位论文全文数据库工程科技Ⅰ辑》;20220215(第2期);第B015-173页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111814406A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111832101B (zh) | 一种水泥强度预测模型的构建方法及水泥强度预测方法 | |
CN109063734B (zh) | 结合多级局部密度聚类的油浸式变压器故障状态评估方法 | |
US20100004882A1 (en) | Fault detection and classification method for wafer acceptance test parameters | |
CN108345284B (zh) | 一种基于两变量块的质量相关故障检测方法 | |
CN110569566B (zh) | 一种板带力学性能预测方法 | |
CN111027117B (zh) | 胶凝砂砾石配合比关键指标预测抗压强度的bp神经网络分析方法 | |
CN106897774A (zh) | 基于蒙特卡洛交叉验证的多个软测量算法集群建模方法 | |
CN101719195A (zh) | 一种逐步回归基因调控网络的推断方法 | |
CN110674865A (zh) | 面向软件缺陷类分布不平衡的规则学习分类器集成方法 | |
CN110472671A (zh) | 基于多阶段的油浸式变压器故障数据预处理方法 | |
CN116522263A (zh) | 一种异常电芯的检测方法和装置 | |
CN111814406B (zh) | 一种多晶硅原料重要度分析方法及系统 | |
CN115436342A (zh) | 降低多批次样本间libs检测不确定性的方法及装置 | |
Busababodhin et al. | Copula modelling for multivariate statistical process control: a review | |
CN116842439A (zh) | 一种基于模型的半导体质量预测方法 | |
CN116884536A (zh) | 一种工业废渣砖生产配方自动优化方法及系统 | |
CN115936079B (zh) | 一种适用于气体传感器阵列的标定浓度选取方法 | |
CN116629686A (zh) | 一种评估企业能耗数据的方法及装置 | |
CN110648023A (zh) | 基于二次指数平滑改进gm(1,1)的数据预测模型的建立方法 | |
CN113484400B (zh) | 基于机器学习的质谱图分子式计算方法 | |
CN115018007A (zh) | 一种基于改进id3决策树的敏感数据分类方法 | |
CN111178627B (zh) | 一种基于spca的神经网络混合优化预测方法 | |
CN113298148A (zh) | 一种面向生态环境评价的不平衡数据重采样方法 | |
CN112348275A (zh) | 一种基于在线增量学习的区域生态环境变化预测方法 | |
CN111755079B (zh) | 一种多晶硅最优原料配比方案确定方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |