CN111325359B - 一种基于互信息的卷烟配方维护的方法及系统 - Google Patents
一种基于互信息的卷烟配方维护的方法及系统 Download PDFInfo
- Publication number
- CN111325359B CN111325359B CN202010116383.4A CN202010116383A CN111325359B CN 111325359 B CN111325359 B CN 111325359B CN 202010116383 A CN202010116383 A CN 202010116383A CN 111325359 B CN111325359 B CN 111325359B
- Authority
- CN
- China
- Prior art keywords
- cig
- cigarettes
- sheet
- formula
- tablet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000019504 cigarettes Nutrition 0.000 title claims abstract description 229
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000009471 action Effects 0.000 claims abstract description 11
- 241000208125 Nicotiana Species 0.000 claims description 38
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 38
- 239000011159 matrix material Substances 0.000 claims description 27
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000009472 formulation Methods 0.000 claims description 22
- 239000000203 mixture Substances 0.000 claims description 22
- 239000000779 smoke Substances 0.000 claims description 22
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 description 40
- 230000008569 process Effects 0.000 description 22
- 238000004519 manufacturing process Methods 0.000 description 21
- 230000000694 effects Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 7
- 239000003086 colorant Substances 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012356 Product development Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 229910052729 chemical element Inorganic materials 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- A—HUMAN NECESSITIES
- A24—TOBACCO; CIGARS; CIGARETTES; SIMULATED SMOKING DEVICES; SMOKERS' REQUISITES
- A24B—MANUFACTURE OR PREPARATION OF TOBACCO FOR SMOKING OR CHEWING; TOBACCO; SNUFF
- A24B3/00—Preparing tobacco in the factory
- A24B3/08—Blending tobacco
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Operations Research (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Manufacturing & Machinery (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Wrapping Of Specific Fragile Articles (AREA)
Abstract
本发明公开了一种基于互信息的卷烟配方维护的方法及系统,本发明涉及的一种基于互信息的卷烟配方维护的方法,包括:S11.获取与单料片烟相关的数据信息;S12.根据获取到的数据信息及计算所述单料片烟之间的互信息;S13.对计算得到的单料片烟之间的互信息进行排序,得到推荐单料片烟有序列表;S14.从所述得到的单料片烟有序列表中选取所需替换的单料片烟,并进行替换。本发明使用互信息来表示单料片烟之间的配伍性,将配伍性显式地表示在算法中,并用替换单料片烟与被替换单料片烟在配方中作用的相似性来生成推荐列表,保证了新形成配方的整体配伍性。
Description
技术领域
本发明涉及信息技术及自动化技术领域,尤其涉及一种基于互信息的卷烟配方维护的方法及系统。
背景技术
为了维护烟草配方的稳定,烟草企业需要定期对配方进行维护,即对配方中的单料片烟进行补充或替换。卷烟配方是由产品设计人员对不同部位,档次,产地等的单料片烟配比而成。在企业的实际生产过程中,会因为一些不可抗拒因素(如干旱,洪水等)造成供应链中一种或几种单料片烟的产能下降,从而导致卷烟配方质量方面的波动,就需要通过评吸人员的评吸工作来寻找替代单料片烟。基于人工的评吸工作时间长,成本高,并且容易受到客观环境和主观因素的影响。因此,研究更加快速,低成本且能反映烟草企业实际生产过程的卷烟配方维护方法成为企业的迫切需求。
虽然已有工作对卷烟配方维护已经进行了一些研究和探索,但是现有方法中没有考虑单料片烟之间的配伍性问题,并且只能评估数量相等的单料片烟的替换过程,不能反映实际生产过程中大量数量不对等的维护情况。
基于此,提出了一种基于互信息的卷烟配方维护的方法及系统来解决上述存在的问题。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种基于互信息的卷烟配方维护的方法及系统,使用互信息来表示单料片烟之间的配伍性,将配伍性显式地表示在算法中,并用替换单料片烟与被替换单料片烟在配方中作用的相似性来生成推荐列表,保证了新形成配方的整体配伍性。并且发明提出的效果度量指标可以解决了实际生产过程中出现频率最高的数量不对等替换的度量问题,更能反映现实的生产过程,可以辅助专业人员进行配方维护工作,减少评吸专家的工作量,为配方维护人员提供合理可行的配方维护方案。
为了实现以上目的,本发明采用以下技术方案:
一种基于互信息的卷烟配方维护的方法,包括:
S1.获取与单料片烟相关的数据信息;
S2.根据获取到的数据信息及计算所述单料片烟之间的互信息;
S3.对计算得到的单料片烟之间的互信息进行排序,得到推荐单料片烟有序列表;
S4.从所述得到的单料片烟有序列表中选取所需替换的单料片烟,并进行替换。
进一步的,所述步骤S1中还包括:
将获取的数据转换为配方矩阵F(m×n);其中,配方矩阵F(m×n)的行表示数个配方(m),列表示数种单料片烟(n),矩阵中的值表示配方i包含单料片烟j的数量。
进一步的,所述步骤S2中根据配方矩阵F(m×n),计算得出相对频率Fq,再通过相对频率算得贡献关系信息CR,最后根据CR得到单料片烟之间的互信息Mutual。
进一步的,所述步骤S3中对所得到的单料片烟之间的互信息Mutual进行排序,从而得到推荐有序列表List。
进一步的,所述步骤S2具体为:
在数据集中,第j种单料片烟为Cigj,共现关系信息CR(Cigj)的计算公式为:
CR(Cigj)=(Fq(Cigj,Cig1),Fq(Cigj,Cig2),...,Fq(Cigj,Cign)) (1)
其中,n表示数据集中单料片烟的总种类个数;Fq(Cigj,Cigk)表示单料片烟j和单料片烟k在数据集中一起出现的相对频率,计算公式为:
Fq(Cigj,Cigk)=Q(Cigj,Cigk)/QAll (2)
Q(Cigj,Cigk)为Cigj和Cigk同时出现在一个配方中的次数;QAll表示配方总数;
所有单料片烟的共现关系集合CR可以表示为:
CR={CR(Cig1),CR(Cig2),...,CR(Cign)} (3)
第j个单料片烟和第k个单料片烟之间的互信息计算公式为:
进一步的,所述步骤S3具体为:
替换单料片烟的作用role(exi)表示为一个n维向量,由以下公式得到:
单料片烟Cigj,role(Cigj)可以将公式(4)中exi替换为Cigj来表示;
计算替换单料片烟作用role(exi)和被替换单料片烟作用role(Cigj)之间的汉明距离HD(exi,Cigj),根据HD(exi,Cigj)排序,得到推荐单料片烟有序列表List。
相应的,还提供一种基于互信息的卷烟配方维护的系统,包括:
获取模块,用于获取与单料片烟相关的数据信息;
计算模块,用于根据获取到的数据信息及计算所述单料片烟之间的互信息;
排序模块,用于对计算得到的单料片烟之间的互信息进行排序,得到推荐单料片烟有序列表;
替换模块,用于从所述得到的单料片烟有序列表中选取所需替换的单料片烟,并进行替换。
进一步的,所述获取模块中还包括:
转换模块,用于将获取的数据转换为配方矩阵F(m×n);其中,配方矩阵F(m×n)的行表示数个配方(m),列表示数种单料片烟(n),矩阵中的值表示配方i包含单料片烟j的数量。
进一步的,所述计算模块中根据配方矩阵F(m×n),计算得出相对频率Fq,再通过相对频率算得贡献关系信息CR,最后根据CR得到单料片烟之间的互信息Mutual。
进一步的,所述排序模块中对所得到的单料片烟之间的互信息Mutual进行排序,从而得到推荐有序列表List。
与现有技术相比,本发明通过计算单料片烟之间的共现频率,从而计算出单料片烟之间的互信息,通过某一配方中候选单料片烟与剩余单料片烟之间的互信息来评估候选单料片烟与该配方中剩余单料片烟之间的配伍性,从而完成配方维护过程。该方法可以很好地还原实际生产过程中配方维护的过程,并且以配伍性作为考虑因素,可以在配方维护过程中保证新配方具有良好的配伍性。根据实验结果,本算法达到了很好的效果,且与实际生产过程中的配方维护过程相吻合。
本发明提出的基于互信息的卷烟配方维护方法,可以辅助实际生产过程中的配方维护工作,减少维护过程中评吸专家的工作量,从传统的基于经验的配方维护转变为科学配方维护,对于企业保持卷烟质量的稳定、提高新产品开发能力、提升生产效率和提高企业综合竞争力具有重要意义。
附图说明
图1是实施例一提供的一种基于互信息的卷烟配方维护的方法流程图;
图2是实施例一提供的exi和Cigj的作用示意图;
图3是实施例一提供配方矩阵转化示意图;
图4是实施例一提供一次配方维护过程示意图;
图5是实施例一提供avg计算方法示意图
图6是实施例一提供实际替换单料片烟平均排名的分布示意图
图7是实施例一提供实际替换单料片烟平均排名等级百分比的分布示意图;
图8是实施例二提供一种基于互信息的卷烟配方维护的系统结构图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
本发明的目的是针对现有技术的缺陷,提供了一种基于互信息的卷烟配方维护的方法及系统。
实施例一
本实施例提供一种基于互信息的卷烟配方维护的方法,如图1所示,包括:
S11.获取与单料片烟相关的数据信息;
S12.根据获取到的数据信息及计算所述单料片烟之间的互信息;
S13.对计算得到的单料片烟之间的互信息进行排序,得到推荐单料片烟有序列表;
S14.从所述得到的单料片烟有序列表中选取所需替换的单料片烟,并进行替换。
本实施例使用的数据由H烟草公司提供,选择3年(即2010年1月到2012年12月)的数据进行研究。数据包括24种卷烟品牌,1534种配方,1220种单料烟,单料烟包括3个部位,6种颜色,3个档次,以及国内和国外2个地区。
在步骤S11中,获取与单料片烟相关的数据信息。
配方数据文件包含1534条配方信息以及其22个属性信息,其中1534条配方信息被重新编号为FBI0001~FBI1534,在配方信息中,根据配方生效时间将各品牌内的配方重新排序,即在同一个品牌配方数据中,编号靠后配方数据的生效时间一定比编号靠前数据的生效时间晚。单料烟被编号为AD0001~AD0716,DLC0001~DLC2072且数据不连续。单料烟的数据根据其物理属性(部位、颜色、档次、地区)被重新划分为36个类别,其中部位分为上部、中部、下部,颜色分为枯黄色和其他(因为除枯黄色外的其它颜色数量较少,故将除枯黄色的颜色合并为其它)、档次分为上等、中等、下等,地区分为国内和国外,组合共36类,称为36种单料片烟。部位为上部、颜色为枯黄色、档次为上等、地区为国内的单料烟分为单料片烟1,部位为上部、颜色为枯黄色、档次为上等、地区为国外的单料烟分为单料片烟2等依此类推。如单料烟AD0001的物理属性分别为:上部、枯黄色、上等、国内,则单料烟AD0001就属于单料片烟1。
将数据转换为配方矩阵F(m×n):
配方矩阵F(m×n)的行表示1534个配方(m),列表示36种单料片烟(n),矩阵中的值表示配方i包含单料片烟j的数量。
在步骤S12中,根据获取到的数据信息及计算所述单料片烟之间的互信息。
所述计算单料片烟之间的互信息Mutual,是根据配方矩阵F(m×n),计算得出相对频率Fq,再通过相对频率算得贡献关系信息CR,最后根据CR得到单料片烟之间的互信息Mutual。
在数据集中,第j种单料片烟被定义为Cigj,因此,共现关系信息CR(Cigj)的计算公式为:
CR(Cigj)=(Fq(Cigj,Cig1),Fq(Cigj,Cig2),...,Fq(Cigj,Cign)) (1)
其中,n为数据集中单料片烟的总种类个数,Fq(Cigj,Cigk)表示单料片烟j和单料片烟k在数据集中一起出现的相对频率,计算公式为:
Fq(Cigj,Cigk)=Q(Cigj,Cigk)/QAll (2)
Q(Cigj,Cigk)为Cigj和Cigk同时出现在一个配方中的次数,QAll为配方总数。Fq(Cigj,Cigk)的值越大,说明在卷烟配方中,单料片烟j和单料片烟k越经常同时出现。
所有单料片烟的共现关系集合CR可以表示为:
CR={CR(Cig1),CR(Cig2),...,CR(Cign)} (3)
第j个单料片烟和第k个单料片烟之间的互信息计算公式为:
在步骤S13中,对计算得到的单料片烟之间的互信息进行排序,得到推荐单料片烟有序列表。
所述计算得到推荐单料片烟有序列表List,是根据所得到的单料片烟之间的互信息Mutual进行排序,从而得到推荐有序列表List。
基于互信息的卷烟配方维护算法主要衡量替换单料片烟和被替换单料片烟在配方中作用的相似性。在一个配方中替换单料片烟的作用通过替换单料片烟和每一个剩余单料片烟的互信息进行计算。如图2所示,图2中展示了exi和Cigj的作用,线旁边的数值显示了线两端连接节点单料片烟之间的互信息值。其中exi∈Fi表示了在第i个配方中一个替换单料片烟,表示了在第i个配方中,除去被替换单料片烟之外剩余单料片烟的第p个单料片烟。
替换单料片烟的作用role(exi)表示为一个n维向量,由以下公式得到:
Fq(Cigj,Cigk)可根据CR得到,Mutual(Cigj,Cigk)的值越大,说明单料片烟Cigj和Cigk配伍性越好。
同样的,对于单料片烟Cigj,role(Cigj)可以将公式(4)中exi替换为Cigj来表示。例如,在图2中,n即为4,role(ex)可以表示为一个4维向量。相应地,单料片烟ex的作用role(ex)=(22.33,10.56,0.08,2.79),单料片烟Cigj的作用role(Cigj)=(24.75,9.98,0.12,3.17)。
计算替换单料片烟作用role(exi)和被替换单料片烟作用role(Cigj)之间的汉明距离HD(exi,Cigj),HD(exi,Cigj)是对于第i个配方来说的。例如,在图2中,HD(exi,Cigj)=|22.33-24.75|+|10.56-9.98|+|0.08-0.12|+|2.79-3.17|=3.42。
根据HD(exi,Cigj)排序,可以得到推荐单料片烟有序列表List,在本算法中,HD(exi,Cigj)的值越小,说明在第i个配方中,单料片烟exi和Cigj的作用越接近。作用越接近的单料片烟越可以做相互替换。
在步骤S14中,从所述得到的单料片烟有序列表中选取所需替换的单料片烟,并进行替换。
在实际的配方维护过程中,除了有一对一替换,大多数情况下是数量不相等的单料片烟替换过程,如:一换多、多换一、多换多、直接增加、直接删去等,在之前的研究工作中还没有对数量不相等的单料片烟替换过程的研究。另外使用支持向量机(SVM)建立配方化学元素与感官和烟气指标之间的映射关系,这样的方法准确度不高,并不能代表实际生产过程中的情况。同时使用未归一化的数据去衡量新配方与旧配方之间的偏差,并不能表示实际的偏差大小。在本算法中提出一种排名方式来评估数量不对等的单料片烟替换实验效果的好坏,但本算法不考虑直接增加和直接删去两种情况。
由于在实际维护过程中新配方都由上一个版本的配方调整得到,如版本3一定是由版本2调整得到的,而非版本1调整得到,因此在衡量算法效果时,只考虑能否预测成功配方与其下一个版本配方的替换结果。
故本算法中衡量算法效果的指标计算方法如图3-图5所示。
如图3首先将源数据转化为配方矩阵,由于AD0001、AD0002属于单料片烟1,AD0003属于单料片烟7等等,统计配方FBI001中各单料片烟的数量,可以得到配方矩阵F(m×n)。如图4可知在配方FBI001经维护后变为FBI002的过程中,FBI001是包括3个单料片烟1,5个单料片烟2等的配方,在本次维护过程中,单料片烟4和单料片烟6中有一个单料烟缺少,所以在FBI002中单料片烟4和单料片烟6相对FBI001各减少了一个,并且在本次维护中,使用了单料片烟1、单料片烟3和单料片烟7来替换了单料片烟4和单料片烟6,所以在FBI002中单料片烟1、单料片烟3和单料片烟7各增加了一个。单料片烟4和单料片烟6被单料片烟1、单料片烟3和单料片烟7替换,是典型的数量不相等的单料片烟替换过程。如图5,为了评估算法的效果,对于被替换的单料片烟4和单料片烟6都用算法计算一次后,排序得到推荐列表,在两个推荐列表中,分别找替换单料片烟的排名,然后取各自排名的最小值。因为单料片烟1和单料片烟7在单料片烟4推荐列表中的排名更靠前,单料片烟3在单料片烟6推荐列表中的排名更靠前,可认为单料片烟1和单料片烟7在作用上可以替换单料片烟4,而单料片烟3在作用上可以替换单料片烟6。在得到替换单料片烟的排名最小值,取各自排名最小值的平均值即可得到替换单料片烟在推荐列表List中的平均排名avg。
根据平均排名,计算如下3种模型性能度量指标:
(1)在推荐单料片烟的有序列表List中实际替换单料片烟平均排名avg的平均数等级。
(2)在推荐单料片烟的有序列表List中实际替换单料片烟平均排名avg的中位数等级。
(3)实际替换的单料片烟平均排名avg位于推荐单料片烟列表List的前5位的百分比。
因为使用的是实际生产中替换过程的数据,因此如果前两个指标越小,第三个指标越大,则说明算法推荐越接近实际生产,算法推荐效果越好。
实验使用全部的配方数据进行实验,包含24种品牌共1534个配方和36种单料片烟,对于所有品牌中非第一个版本的配方fi,与相应的上一个版本的配方f(i-1)进行对比,则可以看出此次配方维护对配方进行的改变为fchange=fi-f(i-1),若说明在此次维护中第j种单料片烟被添加了,若说明在此次维护中第j种单料片烟被去除,若说明在此次维护中第j种单料片烟没有发生变化。
对24种品牌共1534个配方和36种单料片烟进行实验,测试结果如表1所示。由表1中平均等级可知,在推荐单料片烟的有序列表List中实际替换单料片烟平均排名avg的平均数等级为6.585(共36种单料片烟)。由中位等级可知,有一半的推荐单料片烟的有序列表List中实际替换的单料片烟平均排名avg等级为1。第三个度量指标说明有85.66%的实际替换单料片烟平均排名avg在推荐单料片烟的有序列表List中排名小于等于5,排名小于等于15的比例达到90.16%,从上述度量指标可以看出算法表现良好,与实际生产中的替换过程相吻合。
表1
由上述实验数据绘制排名等级统计图像,如图6所示。由图6可以看到在实际替换过程中,大部分实际替换单料片烟的平均排名在推荐单料片烟的有序列表List中等级为1,并且大部分都集中在排名前6,之后数量呈现为下降趋势。但是在排名33至36名也集中了一部分数量,经过查找原始数据发现这些单料片烟出现次数极少,由于只在特定的配方中出现,并且出现次数极少,因此在算法计算过程中没办法很好地检测,就会被认为这些单料片烟与配方中剩余的单料片烟配伍性非常差,因此在单料片烟的有序列表List中等级会排名靠后。因此这个问题不是算法本身的问题,与单料片烟本身的使用频率,属性等有关,遇到只在特定的配方中出现的单料片烟时,再去考虑这些出现次数极少的单料片烟即可。
根据上述实验,可以绘制出排名等级百分比统计图像,如图7所示。由图7可以看出,有约76%的实际替换单料片烟排名在推荐列表List中的第1位,排名等级百分比趋势为先快速上升,达到约90%的时候上升开始缓慢,然后在平均排名33时又开始快速上升至100%,说明算法是可以很好地还原实际生产过程中单料片烟的替换过程,并且能得到配伍性良好的单料片烟。平均排名33时排名等级百分比快速上升的原因在上文中解释过,与单料片烟本身的使用频率,属性等有关,并不是算法本身的问题。因此本算法可以反映实际生产过程中的配方维护,与实际情况相吻合,可以辅助实际生产中的配方维护工作。
与现有技术相比,本实施例通过计算单料片烟之间的共现频率,从而计算出单料片烟之间的互信息,通过某一配方中候选单料片烟与剩余单料片烟之间的互信息来评估候选单料片烟与该配方中剩余单料片烟之间的配伍性,从而完成配方维护过程。该方法可以很好地还原实际生产过程中配方维护的过程,并且以配伍性作为考虑因素,可以在配方维护过程中保证新配方具有良好的配伍性。根据实验结果,本算法达到了很好的效果,且与实际生产过程中的配方维护过程相吻合。
实施例二
本实施例提供一种基于互信息的卷烟配方维护的系统,如图8所示,包括:
获取模块11,用于获取与单料片烟相关的数据信息;
计算模块12,用于根据获取到的数据信息及计算所述单料片烟之间的互信息;
排序模块13,用于对计算得到的单料片烟之间的互信息进行排序,得到推荐单料片烟有序列表;
替换模块14,用于从所述得到的单料片烟有序列表中选取所需替换的单料片烟,并进行替换。
进一步的,所述获取模块中还包括:
转换模块,用于将获取的数据转换为配方矩阵F(m×n);其中,配方矩阵F(m×n)的行表示数个配方(m),列表示数种单料片烟(n),矩阵中的值表示配方i包含单料片烟j的数量。
进一步的,所述计算模块中根据配方矩阵F(m×n),计算得出相对频率Fq,再通过相对频率算得贡献关系信息CR,最后根据CR得到单料片烟之间的互信息Mutual。
进一步的,所述排序模块中对所得到的单料片烟之间的互信息Mutual进行排序,从而得到推荐有序列表List。
与现有技术相比,本发明通过计算单料片烟之间的共现频率,从而计算出单料片烟之间的互信息,通过某一配方中候选单料片烟与剩余单料片烟之间的互信息来评估候选单料片烟与该配方中剩余单料片烟之间的配伍性,从而完成配方维护过程。该方法可以很好地还原实际生产过程中配方维护的过程,并且以配伍性作为考虑因素,可以在配方维护过程中保证新配方具有良好的配伍性。根据实验结果,本算法达到了很好的效果,且与实际生产过程中的配方维护过程相吻合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (3)
1.一种基于互信息的卷烟配方维护的方法,其特征在于,包括:
S1.获取与单料片烟相关的数据信息;
S2.根据获取到的数据信息及计算所述单料片烟之间的互信息;
S3.对计算得到的单料片烟之间的互信息进行排序,得到推荐单料片烟有序列表;
S4.从所述得到的单料片烟有序列表中选取所需替换的单料片烟,并进行替换;
步骤S1还包括:
将获取的数据转换为配方矩阵F(m×n);其中,配方矩阵F(m×n)的行表示数个个配方(m),列表示数种单料片烟(n),矩阵中的值表示配方i包含单料片烟j的数量;
步骤S2中根据配方矩阵F(m×n),计算得出相对频率Fq,再通过相对频率算得贡献关系信息CR,最后根据CR得到单料片烟之间的互信息Mutual;
步骤S3中对所得到的单料片烟之间的互信息Mutual进行排序,从而得到推荐有序列表List;
步骤S2具体为:
在数据集中,第j种单料片烟为Cigj,共现关系信息CR(Cigj)的计算公式为:
CR(Cigj)=(Fq(Cigj,Cig1),Fq(Cigj,Cig2),…,Fq(Cigj,Cign)) (1)
其中,n表示数据集中单料片烟的总种类个数;Fq(Cigj,Cigk)表示单料片烟j和单料片烟k在数据集中一起出现的相对频率,计算公式为:
Fq(Cigj,Cigk)=Q(Cigj,Cigk)/QAll (2)
Q(Cigj,Cigk)为Cigj和Cigk同时出现在一个配方中的次数;QAll表示配方总数;
所有单料片烟的共现关系集合CR表示为:
CR={CR(Cig1),CR(Cig2),…,CR(Cign)} (3)
第j个单料片烟和第k个单料片烟之间的互信息计算公式为:
3.一种基于互信息的卷烟配方维护的系统,其特征在于,包括:
获取模块,用于获取与单料片烟相关的数据信息;
计算模块,用于根据获取到的数据信息及计算所述单料片烟之间的互信息;
排序模块,用于对计算得到的单料片烟之间的互信息进行排序,得到推荐单料片烟有序列表;
替换模块,用于从所述得到的单料片烟有序列表中选取所需替换的单料片烟,并进行替换;
获取模块还包括:
转换模块,用于将获取的数据转换为配方矩阵F(m×n);其中,配方矩阵F(m×n)的行表示数个配方(m),列表示数种单料片烟(n),矩阵中的值表示配方i包含单料片烟j的数量;
计算模块中,根据配方矩阵F(m×n),计算得出相对频率Fq,再通过相对频率算得贡献关系信息CR,最后根据CR得到单料片烟之间的互信息Mutual;
排序模块中,对所得到的单料片烟之间的互信息Mutual进行排序,从而得到推荐有序列表List;
计算模块中,在数据集中,第j种单料片烟为Cigj,共现关系信息CR(Cigj)的计算公式为:
CR(Cigj)=(Fq(Cigj,Cig1),Fq(Cigj,Cig2),…,Fq(Cigj,Cign)) (1)
其中,n表示数据集中单料片烟的总种类个数;Fq(Cigj,Cigk)表示单料片烟j和单料片烟k在数据集中一起出现的相对频率,计算公式为:
Fq(Cigj,Cigk)=Q(Cigj,Cigk)/QAll (2)
Q(Cigj,Cigk)为Cigj和Cigk同时出现在一个配方中的次数;QAll表示配方总数;
所有单料片烟的共现关系集合CR表示为:
CR={CR(Cig1),CR(Cig2),…,CR(Cign)} (3)
第j个单料片烟和第k个单料片烟之间的互信息计算公式为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010116383.4A CN111325359B (zh) | 2020-02-25 | 2020-02-25 | 一种基于互信息的卷烟配方维护的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010116383.4A CN111325359B (zh) | 2020-02-25 | 2020-02-25 | 一种基于互信息的卷烟配方维护的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111325359A CN111325359A (zh) | 2020-06-23 |
CN111325359B true CN111325359B (zh) | 2023-06-02 |
Family
ID=71168963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010116383.4A Active CN111325359B (zh) | 2020-02-25 | 2020-02-25 | 一种基于互信息的卷烟配方维护的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111325359B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112712165B (zh) * | 2020-12-30 | 2024-04-12 | 杭州电子科技大学 | 一种基于图卷积神经网络的卷烟配方智能维护方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7079912B2 (en) * | 2002-11-25 | 2006-07-18 | Philip Morris Usa Inc. | System and method for high speed control and rejection |
CN102608268A (zh) * | 2012-03-12 | 2012-07-25 | 红云红河烟草(集团)有限责任公司 | 一种基于可视化风格图谱的烟叶替换方法 |
CN104317861A (zh) * | 2014-10-15 | 2015-01-28 | 同济大学 | 一种基于互信息的区间数据的属性选择方法 |
CN110085286B (zh) * | 2019-03-14 | 2021-11-05 | 杭州电子科技大学 | 一种基于两步核最小二乘的智能卷烟配方维护方法 |
CN109975238B (zh) * | 2019-03-29 | 2021-11-30 | 浙江中烟工业有限责任公司 | 一种基于近红外光谱的烟叶以及卷烟叶组配方的替代方法 |
-
2020
- 2020-02-25 CN CN202010116383.4A patent/CN111325359B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111325359A (zh) | 2020-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4098539B2 (ja) | プロファイル情報の推薦方法、プログラム及び装置 | |
CN112070109A (zh) | 一种基于改进密度峰值聚类的马蹄窑能耗异常检测方法 | |
US20150242409A1 (en) | Automated Data Shaping | |
CN107146035B (zh) | 针织服装大货生产中批量系数的计算方法 | |
WO2007143157A2 (en) | Automatic weight generation for probabilistic matching | |
CN111325359B (zh) | 一种基于互信息的卷烟配方维护的方法及系统 | |
CN102073720A (zh) | 一种对个性化推荐结果进行优化的fr方法 | |
CN109447167B (zh) | 一种基于非负矩阵分解的智能卷烟配方维护方法 | |
CN117008479B (zh) | 基于生物质气化炉的负碳排放优化控制方法及系统 | |
CN103823823A (zh) | 基于频繁项集挖掘算法的反规范化策略选择方法 | |
CN107341613B (zh) | 一种辅助叶组配方平衡替换的方法 | |
CN109064226A (zh) | 农副产品供需预测及监控方法、装置、设备、存储介质 | |
CN112712165B (zh) | 一种基于图卷积神经网络的卷烟配方智能维护方法 | |
WO2024036959A1 (zh) | 一种考虑电池全生命周期的碳排放控制方法和装置 | |
CN106919699A (zh) | 一种面向大规模用户的个性化信息推荐方法 | |
CN112965991A (zh) | 预计算结果生成方法、装置、电子设备及存储介质 | |
CN108305002A (zh) | 一种基于监控威布尔形状参数的早期失效率变点识别方法 | |
CN110085286B (zh) | 一种基于两步核最小二乘的智能卷烟配方维护方法 | |
CN114792220A (zh) | 基于上下游企业个性定制家具的多信息融合库存管理方法 | |
CN117291655B (zh) | 基于实体、网络协同映射的消费者生命周期运营分析方法 | |
CN114723535A (zh) | 一种基于供应链与知识图谱的物品推荐方法、设备及介质 | |
CN116316635B (zh) | 基于量测信息的电力协同控制方法及系统 | |
CN107967321A (zh) | 一种基于层级式支持向量机的作物育种评价方法 | |
CN113033984A (zh) | 基于流程化数据处理系统的可视化管控信息系统 | |
CN115034906A (zh) | 一种金融产品配置方案记忆与推荐方法、系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |