CN109344486A - 一种基于tf-idf思想的产品结构数值化处理方法 - Google Patents
一种基于tf-idf思想的产品结构数值化处理方法 Download PDFInfo
- Publication number
- CN109344486A CN109344486A CN201811114623.6A CN201811114623A CN109344486A CN 109344486 A CN109344486 A CN 109344486A CN 201811114623 A CN201811114623 A CN 201811114623A CN 109344486 A CN109344486 A CN 109344486A
- Authority
- CN
- China
- Prior art keywords
- product
- calculated
- processing method
- product structure
- quantizes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于TF‑IDF思想的产品结构数值化处理方法,包含以下步骤:A、对于所有产品中的零件信息进行聚合处理;B、创建零件字典;C、计算零件频率;D、计算每个产品零件的逆产品频率。E、计算产品的PF‑IPF值。通过本发明的方法,能够有效的完成具有产品结构的产品的数值化处理。
Description
技术领域
本发明涉及制造业信息化技术领域,具体是一种基于TF-IDF思想的产品结构数值化处理方法。
背景技术
目前,在制造企业中,由于技术条件的限制,很多方法对产品进行数值化处理的时候,往往采用向量化及稀疏矩阵等的方式来进行数值化处理。这种方式会使得在处理产品结构时不能很好的体现所需内容的特点。
比如在搜索某零件在某些产品中出现的结果时,只能给出其包含该零件的产品,以及其随机排序的结果呈现给用户,再比如在比较两个产品的相似性时,由于不能很好的对产品进行数值化处理,因此很难有效的比较两个产品之间的相似性等等诸如此类的问题。这一系列的问题,都是因为无法有效对产品进行数值化处理,使得结果大打折扣。
发明内容
本发明的目的在于提供一种基于TF-IDF思想的产品结构数值化处理方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于TF-IDF思想的产品结构数值化处理方法,包含以下步骤:
A、对于所有产品中的零件信息进行聚合处理;
B、创建零件字典;
C、计算零件频率;
D、计算每个产品零件的逆产品频率;
E、计算产品的PF-IPF值。
作为本发明的进一步技术方案:所述步骤A具体是:对于样本集中所有产品中的零部件进行聚合处理,获取当前产品所在的所有样本集,将样本集中所有产品中的零件进行聚合处理,以去除重复的零件。
作为本发明的进一步技术方案:所述步骤B具体是:根据步骤A中进行聚合处理后的零部件,将其归入零部件字典库。
作为本发明的进一步技术方案:所述步骤C具体是:获取零件在某产品结构中出现的次数,以及该零件所在产品中所有零件的总数量,利用其计算零件在产品中的零件频率PF。
作为本发明的进一步技术方案:所述步骤D具体是:根据某零件在整个样本集中出现的次数计算其权重,即IPF,其计算公式为(其中P为当前样本集中所有的产品数量;Pw为出现该零件的产品的数量)。
作为本发明的进一步技术方案:所述步骤E具体是:在零件字典中,利用步骤C计算得到PF值和步骤D计算得到的IPF值,计算出该产品中每一个零件的PF-IPF值,从而完成对于含有结构的产品数值化的处理。
与现有技术相比,本发明的有益效果是:通过本发明的方法,能够有效的完成具有产品结构的产品的数值化处理。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于TF-IDF思想的产品结构数值化处理方法,包含以下步骤:
一、对于所有产品中的零件信息进行聚合处理;二,创建零件字典;三、计算零件频率。四、计算每个产品零件的逆产品频率;五,计算产品的PF-IPF值;
A、对于所有产品中的零件信息进行聚合处理:获取当前产品所在的所有样本集,将样本集中所有产品中的零件进行聚合处理,以去除重复的零件;
B、创建零件字典:根据步骤1中,进行聚合处理后的零部件,将其归入零部件字典库(如表一所示);
C、计算零件频率:获取零件在某产品结构中出现的次数,以及该零件所在产品中所有零件的总数量,利用其计算零件在产品中的频率(即PF,Part Frequency,零件频率);如产品中总共包含1000个零件,其中某个零件出现的次数为10次,计算后得到该零件的频率为0.01;
D、获取待计算产品中每个零件的IPF:根据某零件在整个样本集中出现的次数计算其权重,即IPF(Inverse Product Frequency,逆产品频率),其计算公式为(其中P为当前样本集中所有的产品数量;Pw为出现该零件的产品的数量)。比如,整个样本集中的产品数量为10万,而某零件只在100个产品中出现,其IPF为log(100,000/100)=log(1000)=3;某个零件(如螺栓),在所有产品中都出现,其IPF为log(100,000/100,000)=log(1)=0;
E、计算产品的PF-IPF值:可在零件字典中,利用步骤3计算得到PF值,和步骤4计算得到的IPF值,计算出该产品中每一个零件的PF-IPF值(即PF1×IPF1),从而完成对于含有结构的产品数值化的处理(如表二所示)。
表一为零件字典表:
零件编号 | 零件 |
1 | 外六角螺栓M10×20 |
2 | 螺母M10 |
3 | 全螺纹螺柱M10×25 |
… | … |
1000 | 四缸发动机机架 |
… | … |
N | 涡轮 |
;
表二为某产品的PF-IPF值数据表:
零件编号 | PF-IPF值 |
1 | 0 |
2 | 0.001 |
3 | 0.00065 |
… | … |
1000 | 1.889 |
… | … |
N | 0 |
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (6)
1.一种基于TF-IDF思想的产品结构数值化处理方法,其特征在于,包含以下步骤:
A、对于所有产品中的零件信息进行聚合处理;
B、创建零件字典;
C、计算零件频率;
D、计算每个产品零件的逆产品频率;
E、计算产品的PF-IPF值。
2.根据权利要求1所述的一种基于TF-IDF思想的产品结构数值化处理方法,其特征在于,所述步骤A具体是:对于样本集中所有产品中的零部件进行聚合处理,获取当前产品所在的所有样本集,将样本集中所有产品中的零件进行聚合处理,以去除重复的零件。
3.根据权利要求1所述的一种基于TF-IDF思想的产品结构数值化处理方法,其特征在于,所述步骤B具体是:根据步骤A中进行聚合处理后的零部件,将其归入零部件字典库。
4.根据权利要求1所述的一种基于TF-IDF思想的产品结构数值化处理方法,其特征在于,所述步骤C具体是:获取零件在某产品结构中出现的次数,以及该零件所在产品中所有零件的总数量,利用其计算零件在产品中的零件频率PF。
5.根据权利要求1所述的一种基于TF-IDF思想的产品结构数值化处理方法,其特征在
于,所述步骤D具体是:根据某零件在整个样本集中出现的次数计算其权重,即IPF,其计算
公式为,其中P为当前样本集中所有的产品数量;Pw为出现该零件的产品的数
量。
6.根据权利要求1所述的一种基于TF-IDF思想的产品结构数值化处理方法,其特征在于,所述步骤E具体是:在零件字典中,利用步骤C计算得到PF值和步骤D计算得到的IPF值,计算出该产品中每一个零件的PF-IPF值,从而完成对于含有结构的产品数值化的处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811114623.6A CN109344486A (zh) | 2018-09-25 | 2018-09-25 | 一种基于tf-idf思想的产品结构数值化处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811114623.6A CN109344486A (zh) | 2018-09-25 | 2018-09-25 | 一种基于tf-idf思想的产品结构数值化处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109344486A true CN109344486A (zh) | 2019-02-15 |
Family
ID=65306697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811114623.6A Pending CN109344486A (zh) | 2018-09-25 | 2018-09-25 | 一种基于tf-idf思想的产品结构数值化处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109344486A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120066253A1 (en) * | 2010-09-15 | 2012-03-15 | Cbs Interactive, Inc. | Mapping Product Identification Information To A Product |
US20130054581A1 (en) * | 2011-08-24 | 2013-02-28 | Hisham Said Tawfick | Part number search method and system |
CN104778186A (zh) * | 2014-01-15 | 2015-07-15 | 阿里巴巴集团控股有限公司 | 将商品对象挂载到标准产品单元的方法及系统 |
US20160342720A1 (en) * | 2015-05-22 | 2016-11-24 | Andreas Veneris | Method, system, and computer program for identifying design revisions in hardware design debugging |
KR20170120389A (ko) * | 2016-04-21 | 2017-10-31 | (주)원제로소프트 | 텍스트 마이닝을 기반으로 한 상품 자동 매핑 방법 및 장치 |
US20180039910A1 (en) * | 2016-08-02 | 2018-02-08 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for recommending semantically similar items |
-
2018
- 2018-09-25 CN CN201811114623.6A patent/CN109344486A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120066253A1 (en) * | 2010-09-15 | 2012-03-15 | Cbs Interactive, Inc. | Mapping Product Identification Information To A Product |
US20130054581A1 (en) * | 2011-08-24 | 2013-02-28 | Hisham Said Tawfick | Part number search method and system |
CN104778186A (zh) * | 2014-01-15 | 2015-07-15 | 阿里巴巴集团控股有限公司 | 将商品对象挂载到标准产品单元的方法及系统 |
US20160342720A1 (en) * | 2015-05-22 | 2016-11-24 | Andreas Veneris | Method, system, and computer program for identifying design revisions in hardware design debugging |
KR20170120389A (ko) * | 2016-04-21 | 2017-10-31 | (주)원제로소프트 | 텍스트 마이닝을 기반으로 한 상품 자동 매핑 방법 및 장치 |
US20180039910A1 (en) * | 2016-08-02 | 2018-02-08 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for recommending semantically similar items |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105740440B (zh) | 一种加快区块链查询的索引方法 | |
CN107016019B (zh) | 数据库索引创建方法及装置 | |
Kittur | Optimal generation evaluation using SAW, WP, AHP and PROMETHEE multi-Criteria decision making techniques | |
CN111967749A (zh) | 一种船员舒适度评价方法、终端设备及存储介质 | |
Ye et al. | Big data processing framework for manufacturing | |
CN105335357B (zh) | 翻译系统中语料推荐方法 | |
CN116932321A (zh) | 日志数据监控方法、装置、电子设备及存储介质 | |
CN104376042B (zh) | 一种试题数据库试题获取方法及系统 | |
CN109344486A (zh) | 一种基于tf-idf思想的产品结构数值化处理方法 | |
Wang et al. | Coal saving in China: from pareto-Koopmans to Kaldor-hicks criterion | |
CN111046224B (zh) | 一种音频产品的实时召回方法 | |
CN117252471A (zh) | 一种农产品质量物联网监测方法、装置、设备及存储介质 | |
Kittur et al. | Evaluating optimal generation using different multi-criteria decision making methods | |
CN114722048B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
JP2017520839A5 (zh) | ||
CN109344405A (zh) | 一种基于tf-idf思想及神经网络的相似性处理方法 | |
CN110298545B (zh) | 一种基于神经网络的专利评价方法、系统和介质 | |
Li et al. | Grey-incidence clustering decision-making method with three-parameter interval grey number based on regret theory | |
CN105335358B (zh) | 翻译系统中使用语料等级评价方法 | |
CN109242036A (zh) | 一种基于tf-idf思想计算产品结构相似性的方法 | |
CN110084419A (zh) | 一种cfd中自动映像实现细网格解的初始化方法 | |
US9915941B2 (en) | Human-computer combination quality testing system for digital product testing and testing method thereof | |
Chen et al. | Aquatic Product Processing Industry’s Total Factor Productivity and Influencing Factors in China | |
Castelló-Cogollos et al. | Differences by gender and role in PhD theses on sociology in Spain | |
Didenko et al. | Inspiration and Perspiration Factors in Economic Growth: The Former Soviet Union Area versus China (ca. 1920-2010) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |