CN109344486A - 一种基于tf-idf思想的产品结构数值化处理方法 - Google Patents

一种基于tf-idf思想的产品结构数值化处理方法 Download PDF

Info

Publication number
CN109344486A
CN109344486A CN201811114623.6A CN201811114623A CN109344486A CN 109344486 A CN109344486 A CN 109344486A CN 201811114623 A CN201811114623 A CN 201811114623A CN 109344486 A CN109344486 A CN 109344486A
Authority
CN
China
Prior art keywords
product
calculated
processing method
product structure
quantizes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811114623.6A
Other languages
English (en)
Inventor
马佳
支含绪
邓森洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mdt Infotech Ltd Jiaxing
Original Assignee
Mdt Infotech Ltd Jiaxing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mdt Infotech Ltd Jiaxing filed Critical Mdt Infotech Ltd Jiaxing
Priority to CN201811114623.6A priority Critical patent/CN109344486A/zh
Publication of CN109344486A publication Critical patent/CN109344486A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于TF‑IDF思想的产品结构数值化处理方法,包含以下步骤:A、对于所有产品中的零件信息进行聚合处理;B、创建零件字典;C、计算零件频率;D、计算每个产品零件的逆产品频率。E、计算产品的PF‑IPF值。通过本发明的方法,能够有效的完成具有产品结构的产品的数值化处理。

Description

一种基于TF-IDF思想的产品结构数值化处理方法
技术领域
本发明涉及制造业信息化技术领域,具体是一种基于TF-IDF思想的产品结构数值化处理方法。
背景技术
目前,在制造企业中,由于技术条件的限制,很多方法对产品进行数值化处理的时候,往往采用向量化及稀疏矩阵等的方式来进行数值化处理。这种方式会使得在处理产品结构时不能很好的体现所需内容的特点。
比如在搜索某零件在某些产品中出现的结果时,只能给出其包含该零件的产品,以及其随机排序的结果呈现给用户,再比如在比较两个产品的相似性时,由于不能很好的对产品进行数值化处理,因此很难有效的比较两个产品之间的相似性等等诸如此类的问题。这一系列的问题,都是因为无法有效对产品进行数值化处理,使得结果大打折扣。
发明内容
本发明的目的在于提供一种基于TF-IDF思想的产品结构数值化处理方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于TF-IDF思想的产品结构数值化处理方法,包含以下步骤:
A、对于所有产品中的零件信息进行聚合处理;
B、创建零件字典;
C、计算零件频率;
D、计算每个产品零件的逆产品频率;
E、计算产品的PF-IPF值。
作为本发明的进一步技术方案:所述步骤A具体是:对于样本集中所有产品中的零部件进行聚合处理,获取当前产品所在的所有样本集,将样本集中所有产品中的零件进行聚合处理,以去除重复的零件。
作为本发明的进一步技术方案:所述步骤B具体是:根据步骤A中进行聚合处理后的零部件,将其归入零部件字典库。
作为本发明的进一步技术方案:所述步骤C具体是:获取零件在某产品结构中出现的次数,以及该零件所在产品中所有零件的总数量,利用其计算零件在产品中的零件频率PF。
作为本发明的进一步技术方案:所述步骤D具体是:根据某零件在整个样本集中出现的次数计算其权重,即IPF,其计算公式为(其中P为当前样本集中所有的产品数量;Pw为出现该零件的产品的数量)。
作为本发明的进一步技术方案:所述步骤E具体是:在零件字典中,利用步骤C计算得到PF值和步骤D计算得到的IPF值,计算出该产品中每一个零件的PF-IPF值,从而完成对于含有结构的产品数值化的处理。
与现有技术相比,本发明的有益效果是:通过本发明的方法,能够有效的完成具有产品结构的产品的数值化处理。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于TF-IDF思想的产品结构数值化处理方法,包含以下步骤:
一、对于所有产品中的零件信息进行聚合处理;二,创建零件字典;三、计算零件频率。四、计算每个产品零件的逆产品频率;五,计算产品的PF-IPF值;
A、对于所有产品中的零件信息进行聚合处理:获取当前产品所在的所有样本集,将样本集中所有产品中的零件进行聚合处理,以去除重复的零件;
B、创建零件字典:根据步骤1中,进行聚合处理后的零部件,将其归入零部件字典库(如表一所示);
C、计算零件频率:获取零件在某产品结构中出现的次数,以及该零件所在产品中所有零件的总数量,利用其计算零件在产品中的频率(即PF,Part Frequency,零件频率);如产品中总共包含1000个零件,其中某个零件出现的次数为10次,计算后得到该零件的频率为0.01;
D、获取待计算产品中每个零件的IPF:根据某零件在整个样本集中出现的次数计算其权重,即IPF(Inverse Product Frequency,逆产品频率),其计算公式为(其中P为当前样本集中所有的产品数量;Pw为出现该零件的产品的数量)。比如,整个样本集中的产品数量为10万,而某零件只在100个产品中出现,其IPF为log(100,000/100)=log(1000)=3;某个零件(如螺栓),在所有产品中都出现,其IPF为log(100,000/100,000)=log(1)=0;
E、计算产品的PF-IPF值:可在零件字典中,利用步骤3计算得到PF值,和步骤4计算得到的IPF值,计算出该产品中每一个零件的PF-IPF值(即PF1×IPF1),从而完成对于含有结构的产品数值化的处理(如表二所示)。
表一为零件字典表:
零件编号 零件
1 外六角螺栓M10×20
2 螺母M10
3 全螺纹螺柱M10×25
1000 四缸发动机机架
N 涡轮
表二为某产品的PF-IPF值数据表:
零件编号 PF-IPF值
1 0
2 0.001
3 0.00065
1000 1.889
N 0
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

Claims (6)

1.一种基于TF-IDF思想的产品结构数值化处理方法,其特征在于,包含以下步骤:
A、对于所有产品中的零件信息进行聚合处理;
B、创建零件字典;
C、计算零件频率;
D、计算每个产品零件的逆产品频率;
E、计算产品的PF-IPF值。
2.根据权利要求1所述的一种基于TF-IDF思想的产品结构数值化处理方法,其特征在于,所述步骤A具体是:对于样本集中所有产品中的零部件进行聚合处理,获取当前产品所在的所有样本集,将样本集中所有产品中的零件进行聚合处理,以去除重复的零件。
3.根据权利要求1所述的一种基于TF-IDF思想的产品结构数值化处理方法,其特征在于,所述步骤B具体是:根据步骤A中进行聚合处理后的零部件,将其归入零部件字典库。
4.根据权利要求1所述的一种基于TF-IDF思想的产品结构数值化处理方法,其特征在于,所述步骤C具体是:获取零件在某产品结构中出现的次数,以及该零件所在产品中所有零件的总数量,利用其计算零件在产品中的零件频率PF。
5.根据权利要求1所述的一种基于TF-IDF思想的产品结构数值化处理方法,其特征在 于,所述步骤D具体是:根据某零件在整个样本集中出现的次数计算其权重,即IPF,其计算 公式为,其中P为当前样本集中所有的产品数量;Pw为出现该零件的产品的数 量。
6.根据权利要求1所述的一种基于TF-IDF思想的产品结构数值化处理方法,其特征在于,所述步骤E具体是:在零件字典中,利用步骤C计算得到PF值和步骤D计算得到的IPF值,计算出该产品中每一个零件的PF-IPF值,从而完成对于含有结构的产品数值化的处理。
CN201811114623.6A 2018-09-25 2018-09-25 一种基于tf-idf思想的产品结构数值化处理方法 Pending CN109344486A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811114623.6A CN109344486A (zh) 2018-09-25 2018-09-25 一种基于tf-idf思想的产品结构数值化处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811114623.6A CN109344486A (zh) 2018-09-25 2018-09-25 一种基于tf-idf思想的产品结构数值化处理方法

Publications (1)

Publication Number Publication Date
CN109344486A true CN109344486A (zh) 2019-02-15

Family

ID=65306697

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811114623.6A Pending CN109344486A (zh) 2018-09-25 2018-09-25 一种基于tf-idf思想的产品结构数值化处理方法

Country Status (1)

Country Link
CN (1) CN109344486A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120066253A1 (en) * 2010-09-15 2012-03-15 Cbs Interactive, Inc. Mapping Product Identification Information To A Product
US20130054581A1 (en) * 2011-08-24 2013-02-28 Hisham Said Tawfick Part number search method and system
CN104778186A (zh) * 2014-01-15 2015-07-15 阿里巴巴集团控股有限公司 将商品对象挂载到标准产品单元的方法及系统
US20160342720A1 (en) * 2015-05-22 2016-11-24 Andreas Veneris Method, system, and computer program for identifying design revisions in hardware design debugging
KR20170120389A (ko) * 2016-04-21 2017-10-31 (주)원제로소프트 텍스트 마이닝을 기반으로 한 상품 자동 매핑 방법 및 장치
US20180039910A1 (en) * 2016-08-02 2018-02-08 Telefonaktiebolaget Lm Ericsson (Publ) System and method for recommending semantically similar items

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120066253A1 (en) * 2010-09-15 2012-03-15 Cbs Interactive, Inc. Mapping Product Identification Information To A Product
US20130054581A1 (en) * 2011-08-24 2013-02-28 Hisham Said Tawfick Part number search method and system
CN104778186A (zh) * 2014-01-15 2015-07-15 阿里巴巴集团控股有限公司 将商品对象挂载到标准产品单元的方法及系统
US20160342720A1 (en) * 2015-05-22 2016-11-24 Andreas Veneris Method, system, and computer program for identifying design revisions in hardware design debugging
KR20170120389A (ko) * 2016-04-21 2017-10-31 (주)원제로소프트 텍스트 마이닝을 기반으로 한 상품 자동 매핑 방법 및 장치
US20180039910A1 (en) * 2016-08-02 2018-02-08 Telefonaktiebolaget Lm Ericsson (Publ) System and method for recommending semantically similar items

Similar Documents

Publication Publication Date Title
CN105740440B (zh) 一种加快区块链查询的索引方法
CN107016019B (zh) 数据库索引创建方法及装置
Kittur Optimal generation evaluation using SAW, WP, AHP and PROMETHEE multi-Criteria decision making techniques
CN111967749A (zh) 一种船员舒适度评价方法、终端设备及存储介质
Ye et al. Big data processing framework for manufacturing
CN105335357B (zh) 翻译系统中语料推荐方法
CN116932321A (zh) 日志数据监控方法、装置、电子设备及存储介质
CN104376042B (zh) 一种试题数据库试题获取方法及系统
CN109344486A (zh) 一种基于tf-idf思想的产品结构数值化处理方法
Wang et al. Coal saving in China: from pareto-Koopmans to Kaldor-hicks criterion
CN111046224B (zh) 一种音频产品的实时召回方法
CN117252471A (zh) 一种农产品质量物联网监测方法、装置、设备及存储介质
Kittur et al. Evaluating optimal generation using different multi-criteria decision making methods
CN114722048B (zh) 一种数据处理方法、装置、电子设备及存储介质
JP2017520839A5 (zh)
CN109344405A (zh) 一种基于tf-idf思想及神经网络的相似性处理方法
CN110298545B (zh) 一种基于神经网络的专利评价方法、系统和介质
Li et al. Grey-incidence clustering decision-making method with three-parameter interval grey number based on regret theory
CN105335358B (zh) 翻译系统中使用语料等级评价方法
CN109242036A (zh) 一种基于tf-idf思想计算产品结构相似性的方法
CN110084419A (zh) 一种cfd中自动映像实现细网格解的初始化方法
US9915941B2 (en) Human-computer combination quality testing system for digital product testing and testing method thereof
Chen et al. Aquatic Product Processing Industry’s Total Factor Productivity and Influencing Factors in China
Castelló-Cogollos et al. Differences by gender and role in PhD theses on sociology in Spain
Didenko et al. Inspiration and Perspiration Factors in Economic Growth: The Former Soviet Union Area versus China (ca. 1920-2010)

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination