CN111489032B - 一种预测航天产品装配工时的处理方法及装置 - Google Patents

一种预测航天产品装配工时的处理方法及装置 Download PDF

Info

Publication number
CN111489032B
CN111489032B CN202010274284.9A CN202010274284A CN111489032B CN 111489032 B CN111489032 B CN 111489032B CN 202010274284 A CN202010274284 A CN 202010274284A CN 111489032 B CN111489032 B CN 111489032B
Authority
CN
China
Prior art keywords
text
procedure
working
preselected
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010274284.9A
Other languages
English (en)
Other versions
CN111489032A (zh
Inventor
刘检华
刘子文
赵文浩
王治
邢香园
万峰
熊辉
陈小弟
陈伟男
吴剑锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Shanghai Institute of Satellite Equipment
Original Assignee
Beijing Institute of Technology BIT
Shanghai Institute of Satellite Equipment
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT, Shanghai Institute of Satellite Equipment filed Critical Beijing Institute of Technology BIT
Priority to CN202010274284.9A priority Critical patent/CN111489032B/zh
Publication of CN111489032A publication Critical patent/CN111489032A/zh
Application granted granted Critical
Publication of CN111489032B publication Critical patent/CN111489032B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • General Factory Administration (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种预测航天产品装配工时的处理方法及装置,其中处理方法包括:构建工序分类库以及文本语料库;依次选择工艺卡数据库中的预选工序,并得到预选工序的预选工序文本以及预选文本语料库;根据预选文本语料库对预选工序文本进行文本挖掘,得到预选文本特征向量;当确定工艺卡数据库中的所有工序均已遍历时,训练出每种工序类型对应的工时计算模型,并存储至工时计算模型库中;根据待执行工序的描述文本以及工时计算模型库,得到待执行工序的工时预测值。本发明通过构建基于工序文本特征的工时计算模型进行工时预测,解决了当前的工时预测不适用于航天产品的问题,且有利于保证航天产品装配工时预测的准确性和实效性,进而提高生产效率。

Description

一种预测航天产品装配工时的处理方法及装置
技术领域
本发明涉及工时预测技术领域,特别涉及一种预测航天产品装配工时的处理方法及装置。
背景技术
航天产品(如卫星、导弹、火箭等)具有系统复杂、多学科综合、小批量生产、研制周期长的特点,装配是航天产品生产的最后环节,直接影响产品的最终性能。工时信息是企业控制成本、编制生产计划、衡量工人劳动量的重要计量单位,也是企业进行生产调度、计划排产的前提条件和重要依据。随着航天型号任务的增加,传统的、依赖人工经验的装配工时预测方法已不能满足航天企业对工时估算的准确性和时效性要求,严重影响着航天企业管理水平和生产效率。因此,研究在航天产品在装配过程中如何实现工时的快速、准确预测具有十分重要的意义。
在工时预测方面,很多学者立足于分析工艺和产品的特征,研究其与工时的内在关系,从而根据这些特征进行未知工时的估算。例如,黄青云研究了车削加工中零件尺寸与切削工时之间的线性回归关系,并以此制定车削定额工时。重庆大学的陈友玲等,提出了大规模定制生产中零件复杂度计算模型,通过matlab拟合出零件拓扑结构复杂度和工艺属性复杂度对加工工时的影响函数,用于计算新型零件的加工工时。南京航空航天大学的李露建立了机电产品装配过程的工时定额模型,分类讨论了各类型装配操作的工时计算公式,实现工时的快速计算。晁海涛等将线缆进行分类,并建立各类线缆的工时计算模型,实现机柜线缆装配工时的智能计算。此外,也有学者分析企业生产技术、员工素质等因素对工时的影响,分别从员工工作态度、员工知识水平、产品定制的方面提出了工时计算模型。
从当前国内外研究成果和实践经验可知,影响工时的因素虽然很多,但最关键的还是生产操作本身的特征,如零件复杂度、工艺复杂度、精度要求等,其他因素如员工水平等只是造成小范围的工时波动。但是,当前的工时预测方法研究以机械加工领域为主,主要是通过零件的尺寸、拓扑结构等特征作为工时计算参数,涉及到的工艺特征多是易于提取的结构化数据,如零件加工精度等。航天产品的装配工艺同机加工艺或大规模批量装配工艺相比,更注重于对零部件装配关系的描述,如图2所示,图2为某卫星载荷舱装配工艺卡,在该工艺卡的右上角为档当前工序的装配对象及代号,左侧列出了当前工序所涉及的零部件信息,包括零部件的名称、代号、所需数量,右侧是该工序用到的工装、工具和辅料。工序的具体操作内容在中间部分,这些描述性文字说明了装配的操作顺序、零件的连接次序、工装工具的使用方法、操作过程的注意事项以及现场工序检验的合格标准等。数据组成特点如下:1)以文字信息为主:航天产品的装配工艺同机加工艺相比,需要对零部件之间的装配关系进行详尽的描述,因此主要内容都以文本形式呈现。在实际装配中,二维的图纸和三维的模型主要进行装配示意,起指导作用的是工艺卡中的文字描述信息。2)信息组成复杂:一张工艺卡中包含了装配对象、零部件、工装夹具、辅料等各种关联对象的信息,同时,包含了大段文字描述形式的工艺说明。装配工序的完工情况、检验结果、操作人员和检验者的签署信息等,也汇集到同一张工艺卡中。而对单个零件几何信息的描述较少,工序内容包含大量文本信息,因而难以提取零件特征或工艺特征等信息用于工时计算。
发明内容
本发明实施例要达到的技术目的是提供一种预测航天产品装配工时的处理方法及装置,用以解决当前航天产品的装配工艺描述中对单个零件几何信息的描述较少,工序内容包含大量文本信息,因而难以提取零件特征或工艺特征等信息用于工时计算,使得航天产品在装配过程中难以实现工时的快速、准确预测。
为解决上述技术问题,本发明实施例提供了一种预测航天产品装配工时的处理方法,包括:
构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库;
依次选择工艺卡数据库中的预设工序作为预选工序,并根据工序分类库和文本语料库对预选工序进行预处理操作,得到预选工序的预选工序文本,以及与预选工序的工序类型所对应的预选文本语料库;
根据预选文本语料库对预选工序文本进行文本挖掘,得到预选工序文本的预选文本特征向量,并存储预选文本特征向量以及测试执行预选工序时的工时数值;
当确定工艺卡数据库中的所有工序均已遍历时,根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值,得到每种工序类型对应的工时计算模型,并存储至工时计算模型库中;
根据待执行工序的描述文本以及工时计算模型库,得到待执行工序的工时预测值。
优选地,如上所述的处理方法,构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库的步骤包括:
对工艺卡数据库中的每个预设工序进行工序特征提取,得到每个预设工序的文本内容以及工序基本属性;
根据工序基本属性以及预设工序分类规则,对每个预设工序进行分类,得到工序分类库;
对工序分类库中每种工序类型所包括的每一预设工序的文本内容进行文本预处理,得到每种工序类型所对应的文本语料库。
优选地,如上所述的处理方法,在得到每种工序类型所对应的文本语料库的步骤之后,处理方法还包括:
将每一工序类型所对应的文本语料库中的词组成一过渡文本;
获取过渡文本中每个词的词频-逆向文档频率(Term Frequency–InverseDocument Frequency,简称:TF-IDF)数值;
根据关于TF-IDF数值的预设阈值或预设保留比例更新文本语料库。
具体地,如上所述的处理方法,根据工序分类库和文本语料库对预选工序进行预处理操作,得到预选工序的预选工序文本,以及与预选工序的工序类型所对应的预选工序语料库的步骤包括:
对预选工序进行工序特征提取,得到预选工序的预选文本内容以及预选工序基本属性;
对预选文本内容进行文本预处理得到预选工序文本;并根据预选工序基本属性在工序分类库中进行属性匹配,确定预选工序所属的预选工序类型以及与预选工序类型对应的预选工序文本语料库。
优选地,如上所述的处理方法,根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值,得到每种工序类型对应的工时计算模型的步骤包括:
构建预设回归模型,其中,文本特征向量为自变量,工时数值为因变量;
将工艺卡数据库中每种工序类型所包括的工序根据预设比例划分为训练集和测试集;
根据训练集中的预选文本特征向量以及工时数值,得到预设回归模型的目标回归系数;
根据测试集中的预选工序对应的预选文本特征向量以及工时数值,对目标回归系数进行验证;
当验证通过时,将目标回归系数带入预设回归模型中,得到与预选工序的工序类型相对应的工时计算模型。
具体地,如上所述的处理方法,预设回归模型为:
Figure BDA0002444226710000041
其中,T由预选工序类型中每道工序的工时组成;
A为由预选工序类型中每道工序的预选文本特征向量构成的文本特征矩阵;
δ为回归系数;
ε为误差值;
α为岭回归系数;
I为单位矩阵。
优选地,如上所述的处理方法,根据待执行工序的描述文本以及工时计算模型库,得到待执行工序的工时预测值的步骤包括:
对待执行工序进行工序特征提取,得到待执行工序中的待执行工序文本内容和待执行工序基本属性;
对待执行工序文本内容进行文本预处理得到目标工序文本;并根据待执行工序基本属性在工序分类库中进行属性匹配,确定待执行工序所属的目标工序类型以及与目标工序类型对应的目标工序文本语料库;
根据目标工序文本语料库对目标工序文本进行文本挖掘,得到目标工序文本的目标文本特征向量;
从工时计算模型库中获取与目标工序类型对应的目标工时计算模型,并根据目标工时计算模型和目标文本特征向量,得到待执行工序的工时预测值。
具体地,如上所述的处理方法,文本预处理的步骤包括:
通过自然语言分词并结合预设的词典将工序文本内容分解为单独的词,并根据预设的停词库剔除工序文本内容中的停用词。
进一步的,如上所述的处理方法,根据文本语料库对工序文本进行文本挖掘,得到文本特征向量的步骤包括:
获取工序文本中每个目标词的TF-IDF数值,其中,目标词为工序文本中的任意一个词;
根据每个目标词的TF-IDF数值以及文本语料库对应的文本特征向量的维度,得到工序文本的文本特征向量。
具体地,如上所述的处理方法,工序分类库中的基本属性包括:产品尺寸、工序所属专业以及操作过程中的至少一个。
本发明的另一优选实施例还提供了一种预测航天产品装配工时的处理装置,包括:
第一处理模块,用于构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库;
第二处理模块,用于依次选择工艺卡数据库中的预设工序作为预选工序,并根据工序分类库和文本语料库对预选工序进行预处理操作,得到预选工序的预选工序文本,以及与预选工序的工序类型所对应的预选文本语料库;
第三处理模块,用于根据预选文本语料库对预选工序文本进行文本挖掘,得到预选工序文本的预选文本特征向量,并存储预选文本特征向量以及测试执行预选工序时的工时数值;
第四处理模块,用于当确定工艺卡数据库中的所有工序均已遍历时,根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值,得到每种工序类型对应的工时计算模型,并存储至工时计算模型库中;
第五处理模块,用于根据待执行工序的描述文本以及工时计算模型库,得到待执行工序的工时预测值。
优选地,如上所述的处理装置,第一处理模块包括:
第一处理单元,用于对工艺卡数据库中的每个预设工序进行工序特征提取,得到每个预设工序的文本内容以及工序基本属性;
第二处理单元,用于根据工序基本属性以及预设工序分类规则,对每个预设工序进行分类,得到工序分类库;
第三处理单元,用于对工序分类库中每种工序类型所包括的每一预设工序的文本内容进行文本预处理,得到每种工序类型所对应的文本语料库。
优选地,如上所述的处理装置,其特征在于,第一处理模块还包括:
第四处理单元,用于将每一工序类型所对应的文本语料库中的词组成一过渡文本;
第五处理单元,用于获取过渡文本中每个词的词频-逆向文档频率TF-IDF数值;
第六处理单元,用于根据关于TF-IDF数值的预设阈值或预设保留比例更新文本语料库。
具体地,如上所述的处理装置,第二处理模块,包括:
第七处理单元,用于对预选工序进行工序特征提取,得到预选工序的预选文本内容以及预选工序基本属性;
第八处理单元,用于对预选文本内容进行文本预处理得到预选工序文本;并根据预选工序基本属性在工序分类库中进行属性匹配,确定预选工序所属的预选工序类型以及与预选工序类型对应的预选工序文本语料库。
优选地,如上所述的处理装置,第四处理模块,包括:
第九处理单元,用于构建预设回归模型,其中,文本特征向量为自变量,工时数值为因变量;
第十处理单元,用于将工艺卡数据库中每种工序类型所包括的工序根据预设比例划分为训练集和测试集;
第十一处理单元,用于根据训练集中的预选文本特征向量以及工时数值,得到预设回归模型的目标回归系数;
第十二处理单元,用于根据测试集中的预选工序对应的预选文本特征向量以及工时数值,对目标回归系数进行验证;
第十三处理单元,用于当验证通过时,将目标回归系数带入预设回归模型中,得到与预选工序的工序类型相对应的工时计算模型。
具体地,如上所述的处理装置,预设回归模型为:
Figure BDA0002444226710000071
其中,T由预选工序类型中每道工序的工时组成;
A为由预选工序类型中每道工序的预选文本特征向量构成的文本特征矩阵;
δ为回归系数;
ε为误差值;
α为岭回归系数;
I为单位矩阵。
优选地,如上所述的处理装置,第五处理模块,包括:
第十四处理单元,用于对待执行工序进行工序特征提取,得到待执行工序中的待执行工序文本内容和待执行工序基本属性;
第十五处理单元,用于对待执行工序文本内容进行文本预处理得到目标工序文本;并根据待执行工序基本属性在工序分类库中进行属性匹配,确定待执行工序所属的目标工序类型以及与目标工序类型对应的目标工序文本语料库;
第十六处理单元,用于根据目标工序文本语料库对目标工序文本进行文本挖掘,得到目标工序文本的目标文本特征向量;
第十七处理单元,用于从工时计算模型库中获取与目标工序类型对应的目标工时计算模型,并根据目标工时计算模型和目标文本特征向量,得到待执行工序的工时预测值。
具体地,如上所述的处理装置,第三处理单元、第八处理单元或第十五处理单元还用于:
通过自然语言分词并结合预设的词典将工序文本内容分解为单独的词,并根据预设的停词库剔除工序文本内容中的停用词。
进一步的,如上所述的处理装置,第三处理模块或第十六处理单元还用于:
获取工序文本中每个目标词的TF-IDF数值,其中,目标词为工序文本中的任意一个词;
根据每个目标词的TF-IDF数值以及文本语料库对应的文本特征向量的维度,得到工序文本的文本特征向量。
具体地,如上所述的处理装置,工序分类库中的基本属性包括:产品尺寸、工序所属专业以及操作过程中的至少一个。
本发明的又一优选实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如上所述的预测航天产品装配工时的处理方法的步骤。
与现有技术相比,本发明实施例提供的一种预测航天产品装配工时的处理方法及装置,至少具有以下有益效果:
本发明的实施例通过历史数据构建工时基于工序文本特征的工时计算模型,用于对待执行工序的工时预测,解决了由于航天产品装配工序信息以文字信息为主,且信息组成复杂,导致当前基于生产操作本身的特征进行工时预测不适用于航天产品装配工时预测的问题,且有利于保证航天产品装配工时预测的准确性和实效性,进而提高生产效率。
附图说明
图1为本发明的预测航天产品装配工时的处理方法的流程示意图之一;
图2为某卫星载荷舱结构装配工艺卡;
图3为本发明的预测航天产品装配工时的处理方法的流程示意图之二;
图4为本发明的预测航天产品装配工时的处理方法的流程示意图之三;
图5为本发明的预测航天产品装配工时的处理方法的流程示意图之四;
图6为本发明的预测航天产品装配工时的处理方法的流程示意图之五;
图7为本发明的预测航天产品装配工时的处理方法的流程示意图之六;
图8为本发明的预测航天产品装配工时的处理方法的流程示意图之七;
图9为本发明的一具体实施例所提供的工序基本属性的构成示意图;
图10为本发明的一具体实施例所提供的分词效果对比示意图;
图11为本发明的一具体实施例所提供的文本预处理结果示意图;
图12为本发明的一具体实施例所提供的泛化精度变化曲线示意图;
图13为本发明的一具体实施例所提供的工时预测与实际工时的比较结果示意图;
图14为本发明的预测航天产品装配工时的处理装置的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。在下面的描述中,提供诸如具体的配置和组件的特定细节仅仅是为了帮助全面理解本发明的实施例。因此,本领域技术人员应该清楚,可以对这里描述的实施例进行各种改变和修改而不脱离本发明的范围和精神。另外,为了清楚和简洁,省略了对已知功能和构造的描述。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。
在本发明的各种实施例中,应理解,下述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
应理解,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
在本申请所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。
参见图1,本发明的一优选实施例提供了一种预测航天产品装配工时的处理方法,包括:
步骤S101,构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库;
步骤S102,依次选择工艺卡数据库中的预设工序作为预选工序,并根据工序分类库和文本语料库对预选工序进行预处理操作,得到预选工序的预选工序文本,以及与预选工序的工序类型所对应的预选文本语料库;
步骤S103,根据预选文本语料库对预选工序文本进行文本挖掘,得到预选工序文本的预选文本特征向量,并存储预选文本特征向量以及测试执行预选工序时的工时数值;
步骤S104,当确定工艺卡数据库中的所有工序均已遍历时,根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值,得到每种工序类型对应的工时计算模型,并存储至工时计算模型库中;
步骤S105,根据待执行工序的描述文本以及工时计算模型库,得到待执行工序的工时预测值。
在本发明的一具体实施例中,针对航天产品装配工艺中采用大量文本进行描述的特点,为便于对每一工序进行解析,通过历史数据构成一工艺卡数据库,进而根据工艺卡数据库中所有预设工序的描述文本,分别构建工序分类库以及与每种工序类型的一一对应的文本语料库,其中,构建工序分类库的使得将同类型的装配工艺进行整合,作为一个整体进行分析,有利于避免针对每一工序分别建立工时计算模型的繁杂操作,同时,可类比得到未收录的同类型的工序所对应的工时,减少计算量并拓宽工时计算模型的应用范围。语料库的构建为后续对每一工序的工序文本进行文本挖掘提供参考基础,其中,所述描述文本至少包括图2中所述的文字信息中的一部分。可选地,构建工序分类库和文本语料库时,可根据通过其他手段获得的工序分类库和文本语料库的数据进行构建。
为构建工时计算模型库,并保证每一工时计算模型的准确性,本发明的具体实施例中还公开了,依次选择工艺卡数据库中的预设工序作为预选工序,并根据上述构建的工序分类库和文本语料库对预选工序进行预处理操作,得到用于进行文本挖掘的预选工序文本,以及作为挖掘参考的预选文本语料库,进而根据该预选文本语料库对预选工序文本进行文本挖掘,得到预选工序文本的预选文本特征向量并存储,同时,将在专门用于测试或根据之前实际执行预设工序时的工时数值一并存储,为得到工时计算模型提供数据支持,并将下一预设工序作为预选工序重复上述内容。
当工艺卡数据库中的所有工序均已遍历时,根据每种工序类型所包括的预选工序的预选文本特征向量和工时数值,通过训练,得到对应每种工序类型的工时计算模型,并存储至工时计算模型库中,使得当预测待执行工序时,可根据待执行工序的所属工序类型直接从工时计算模型库中获取对应的工时计算模型,进而根据待执行工序的描述文本以及获取到的对应的工时计算模型进行计算即可得到待执行工序的工时预测值。
综上所述,本发明的实施例通过历史数据构建工时基于工序文本的工时计算模型,用于对待执行工序的工时预测,解决了由于航天产品装配工序信息以文字信息为主,且信息组成复杂,导致当前基于生产操作本身的特征进行工时预测不适用于航天产品装配工时预测的问题,且有利于保证航天产品装配工时预测的准确性和实效性,进而提高生产效率。
参见图3,优选地,如上所述的处理方法,构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库的步骤S101包括:
步骤S301,对工艺卡数据库中的每个预设工序进行工序特征提取,得到每个预设工序的文本内容以及工序基本属性;
步骤S302,根据工序基本属性以及预设工序分类规则,对每个预设工序进行分类,得到工序分类库;
步骤S303,对工序分类库中每种工序类型所包括的每一预设工序的文本内容进行文本预处理,得到每种工序类型所对应的文本语料库。
在本发明的具体实施例中,在上述的处理方法中,在构建工序分类库以及文本语料库时,会对工艺卡数据库中的每个预设工序进行工序特征提取,从将工艺卡中对工序的描述文本中提取出表征工序特性的工序基本属性以及用于描述执行该预设工序时的具体操作的文本内容。其中,基于工序基本属性可由企业根据实际情况进行定义,但对于工序基本属性的定义,应使得被定义的工序基本属性涵盖所有的工序,例如生产阶段、工种等,同时被定义的工序基本属性应能被结构化存储,进而便于进行直接提取和属性匹配。其中,预设工序分类规则可由企业基于定义的工序基本属性,将其中一个或多个的组合确定为一种工序类型。当确定工序类型之后,对预设工序中的文本内容进行文本预处理,使在保证主要文本的基础上对文本内容进行简化,得到对应工序类型的文本语料库,其中,进行文本预处理,有利于避免因文本内容为句、段或存在与主要文本无关的字或词,对文本挖掘的影响。
可选的,进行文本预处理的步骤可在确定某一预设工序的工序类型后即进行文本预处理,将预处理后的结果存储至对应的文本语料库中,对该文本语料库进行更新;或者,当所有预设工序均确定工序类型后,以工序类型为基本单位,一次性对该工序类型所包括的预设工序的文本内容进行文本预处理,得到该工序类型对应的文本语料库。
参见图4,优选地,如上所述的处理方法,在得到每种工序类型所对应的文本语料库的步骤之后,处理方法还包括:
步骤S401,将每一工序类型所对应的文本语料库中的词组成一过渡文本;
步骤S402,获取过渡文本中每个词的词频-逆向文档频率TF-IDF数值;
步骤S403,根据关于TF-IDF数值的预设阈值或预设保留比例更新文本语料库。
在本发明的另一优选实施例中,在得到每种工序类型所对应的文本语料库之后,将每一工序类型所对应的文本语料库中的词组成一过渡文本,获取过渡文本中每个词的TF-IDF数值,其中,此处的词频TF为某一个词在该过渡文本中的出现次数与过渡文本中总词数的比值;逆文档频率IDF为所述语料库所包括的文档总数除以包含该词的参考文档数,得到的比值的对数,其中,在计算时,过渡文本包含在所述文档总数中,参考文档数为实际包含该词的文档数加一;TF-IDF数值为词频TF和逆文档频率IDF的乘积,其具体表达式为:
Figure BDA0002444226710000121
其中,N为当前语料库中工序的总数;
ωdt为工序文本d中的词t的TF-IDF数值;
tfdt为词t在工序文本d中出现的频率;
nt为语料库中包含词t的工序文本总数。
从文本语料库中根据关于TF-IDF数值的预设阈值或预设保留比例,将TF-IDF数值小于预设阈值或处于预设保留比例之外的的词剔除,并对文本语料库进行更新,有利于减少文本语料库中的文本特征向量的维度,进而便于简化基于文本特征向量的计算。其中,预设保留比例为将每个词的TF-IDF数值进行排序,TF-IDF数值超出阈值的词的占比为所述预设保留比例。
需要说明的是,TF-IDF数值仅为本发明中所优选采用的文本挖掘方法,当本领域的技术人员采用其他文本挖掘方法时,并进行减少文本特征向量的维度的步骤也属于本发明的保护范围。
参见图5,具体地,如上所述的处理方法,根据工序分类库和文本语料库对预选工序进行预处理操作,得到预选工序的预选工序文本,以及与预选工序的工序类型所对应的预选工序语料库的步骤包括:
步骤S501,对预选工序进行工序特征提取,得到预选工序的预选文本内容以及预选工序基本属性;
步骤S502,对预选文本内容进行文本预处理得到预选工序文本;并根据预选工序基本属性在工序分类库中进行属性匹配,确定预选工序所属的预选工序类型以及与预选工序类型对应的预选工序文本语料库。
在本发明的一具体实施例中,根据工序分类库和文本语料库对预选工序进行预处理操作具体为:对预选工序再次进行工序特征提取,得到预选工序的预选文本内容以及预选工序基本属性;其中还对预选文本内容进行文本预处理得到简化后的预选工序文本;并根据预选工序基本属性在工序分类库中进行属性匹配,当确定预选工序基本属性与工序分类库中的一种工序类型的工序基本属性相匹配时,确定该工序类型为预选工序所属的预选工序类型,进而通过该预选工序类型即可确定并获取相对应的预选工序文本语料库。其中,对预选工序再次进行工序特征提取以及工序基本属性匹配等操作,有利于进一步保证预选工序与更新后的文本语料库之间的对应关系。
可选的,不对预选工序再次进行工序特征提取以及工序基本属性匹配等操作,直接根据之前构件工序分类库和文本语料库时的工序与工序类型以及文本语料库的对应关系,直接确定预选工序所属的预选工序类型以及与预选工序类型对应的预选工序文本语料库,也属于本发明的保护范围。
参见图6,优选地,如上所述的处理方法,根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值,得到每种工序类型对应的工时计算模型的步骤包括:
步骤S601,构建预设回归模型,其中,文本特征向量为自变量,工时数值为因变量;
步骤S602,将工艺卡数据库中每种工序类型所包括的工序根据预设比例划分为训练集和测试集;
步骤S603,根据训练集中的预选文本特征向量以及工时数值,得到预设回归模型的目标回归系数;
步骤S604,根据测试集中的预选工序对应的预选文本特征向量以及工时数值,对目标回归系数进行验证;
步骤S605,当验证通过时,将目标回归系数带入预设回归模型中,得到与预选工序的工序类型相对应的工时计算模型。
在本发明的一具体实施例中,在根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值,得到每种工序类型对应的工时计算模型时,首先构建一预设回归模型,其中,由于本发明的方案主要目的为对航天产品装配工时进行预测,因此,将工时数值作为因变量,将工序的文本特征向量作为自变量。
在构建完成预设回归模型后,将每种工序类型中的工序根据预设比例划分为训练集和测试集,其中,预设比例可根据技术人员基于不同的实际问题考虑进行灵活设定。将训练集中的预选文本特征向量以及工时数值,带入预设回归模型中进行模型训练和泛化能力测试,进而确定最适合当前工序类型的目标回归系数;并根据测试集中的预选文本特征向量以及工时数值,对目标回归系数进行验证,用于判断当前得到的目标回归系数是否满足当前工序类型中任一工序的计算需求。当确定验证通过时,将目标回归系数带入预设回归模型即可得到与预选工序的工序类型相对应的工时计算模型。当验证不通过时,可通过重新划分训练集和测试集的方式再次进行目标回归系数的确定。其中,训练集和测试集的设置提高了得到的工时计算模型的准确性。
具体地,如上所述的处理方法,预设回归模型为:
Figure BDA0002444226710000151
其中,T由预选工序类型中每道工序的工时组成;
A为由预选工序类型中每道工序的预选文本特征向量构成的文本特征矩阵;
δ为回归系数;
ε为误差值;
α为岭回归系数;
I为单位矩阵。
在本发明的一优选实施例中,预选回归模型采用线性回归中的岭回归的方法进行数据拟合,其中,α为岭回归系数,当自变量文本特征矩阵A存在多重共线时,则矩阵ATA为奇异矩阵,矩阵(ATA)-1对角线上的元素很大,造成参数估计极不稳定,数据发生微小变化就可能导致参数估计结构发生很大的变化,此时通过设置岭回归系数α为ATA增加一个对角阵,使矩阵的特征值变大,将奇异矩阵尽可能的转化为非奇异矩阵,提高参数估计的稳定性。其中,当岭回归系数α越大,共线性对预测结构的影响越小。若α为零,则变成为最小而乘法估计,此时为无偏差估计;若α不为零,则为有偏估计。
参见图7,优选地,如上所述的处理方法,根据待执行工序的描述文本以及工时计算模型库,得到待执行工序的工时预测值的步骤包括:
步骤S701,对待执行工序进行工序特征提取,得到待执行工序中的待执行工序文本内容和待执行工序基本属性;
步骤S702,对待执行工序文本内容进行文本预处理得到目标工序文本;并根据待执行工序基本属性在工序分类库中进行属性匹配,确定待执行工序所属的目标工序类型以及与目标工序类型对应的目标工序文本语料库;
步骤S703,根据目标工序文本语料库对目标工序文本进行文本挖掘,得到目标工序文本的目标文本特征向量;
步骤S704,从工时计算模型库中获取与目标工序类型对应的目标工时计算模型,并根据目标工时计算模型和目标文本特征向量,得到待执行工序的工时预测值。
在本发明的一具体实施例中,当得到工时计算模型库之后,在对当前待执行工序进行工时预测时,会首先对待执行工序进行工序特征提取,得到待执行工序中待执行工序文本内容以及待执行工序基本属性;其中,对待执行工序文本内容进行文本预处理即可得到简化后的目标工序文本;将待执行工序基本属性在工序分类库中进行属性匹配,即可确定待执行工序所属的目标工序类型,进而可得到对应的目标工序文本语料库。根据目标工序文本语料库对目标工序文本进行文本挖掘即可确定目标工序文本的目标文本特征向量。通过在工时计算模型库中获取与目标工序类型对应的目标工时计算模型,并将目标文本特征向量带入目标工时计算模型中,即可得到待执行工序的工时预测值。即本发明通过获取待执行工序的描述文本中的文本特征,结合基于历史数据确定的工时计算模型确定待执行工序的工时预测值,解决了由于航天产品装配工序信息以文字信息为主,且信息组成复杂,导致当前基于生产操作本身的特征进行工时预测不适用于航天产品装配工时预测的问题,且有利于保证航天产品装配工时预测的准确性和实效性,进而提高生产效率。
具体地,如上所述的处理方法,文本预处理的步骤包括:
通过自然语言分词并结合预设的词典将工序文本内容分解为单独的词,并根据预设的停词库剔除工序文本内容中的停用词。
在本发明的一具体实施例中,上述的文本预处理的步骤包括:通过自然语言分词并结合预设的词典进行分词,将工序文本内容分解为单独的词,有利于避免句、段等因无明显的分界符进行划分影响后续文本挖掘的准确性,其中,词典可为所使用的软件开发环境中的预设词典和用户自己构建的词典中的至少一个。进而,还会剔除停用词包括:功能词例如:“这”、“那”、“的”、“在”等,以及普遍词例如“获取”、“应该”、“其实”等,避免这些出现频率较高,却和文档的主体或核心思想没有实际关联的冗余词汇,对具体装配相关词汇的重要性的影响。可选地,停用词的设置可根据现有的停词库和用户自己构建的停词库中的至少一个。其中,此处所述的工序文本可以为预设工序文本、预选工序文本或待执行工序文本中。
参见图8,进一步的,如上所述的处理方法,根据文本语料库对工序文本进行文本挖掘,得到文本特征向量的步骤包括:
步骤S801,获取工序文本中每个目标词的TF-IDF数值,其中,目标词为工序文本中的任意一个词;
步骤S802,根据每个目标词的TF-IDF数值以及文本语料库对应的文本特征向量的维度,得到工序文本的文本特征向量。
在本发明的实施例中,在得到文本特征向量时,会获取每个目标词的TF-IDF数值,将每个目标词的TF-IDF数值组合为一向量,并根据文本语料库中的维度对向量进行补充即可得到工序文本的文本特征向量,其中,此处所述的工序文本可以为预选工序文本或待执行工序文本中。
具体地,如上所述的处理方法,工序分类库中的工序基本属性包括:产品尺寸、工序所属专业以及操作过程中的至少一个。
在本发明的实施例中,工序基本属性可以包括:工序所属专业、工种、过程、风险类型等,为适应本发明所针对的航天产品,在本发明的一优选实施例中将工序基本属性确定为产品尺寸、工序所属专业以及操作过程中的组合,结合图9可知,产品尺寸包括:大型、中型、小型等;工序所属专业包括:装配、测试等;操作过程包括:结构装配、单机装配、热控实施、线缆敷设、电测试、磁测试、质量特性测试等。
在本发明的一具体实施例中,以某大型卫星的单机安装工序为例进行说明,其中,选取150道人为确定的工序作为历史数据,并获取其对应的描述文本构成工艺卡数据库;在此省略对构建工序分类库以及确定工序类型的步骤,且由于存储时已根据工序名称、工种、工序内容等分字段存储,使得特征提取的步骤较为简单,在此不再过多描述。
通过在Python开发环境中导入文本内容进行文本预处理,通过Python开发环境中的分词工具包(优选jieba分词工具包)进行分词处理,其中,分词时可根据自然语言进行分词也可根据自然语言与用户自建词库相结合进行分词,其中,自建词库中包括企业特定声场环境和过程中的专业术语,例如:“安装单机”、“脱落插头”、“分离插头”、“接地线”、“搭接电阻”等,使用自建词库可以提升分词的精确度。其效果对比可参见图10;在分词完成后,通过下载通用的停用词库并导入Python开发环境的中分词工具包即可,经过剔除停用词后的文本预处理后结果如图11所示;
进而通过“corpora”工具包对图11中的150到工序内容组成的语料库构建词典即上述的过渡文本,其中词典中的次数决定了工序文本特征向量的元素数量即文本特征向量中的列数。由于现行回归对多变量数据的拟合效果较差,因此通过获取词典中每个词的TF-IDF数值,通过设置阈值或按比例保留TF-IDF数值较高的词,减少文本特征向量中的列数即维度;例如最终生成的词典为['侧装':1,'大单机':2,'拆保险':3,'点装等待':4,'硅脂':5,'装星车':6,'锁紧工具':7,'多紧固件':8,'接地线':9,'数量':10,'硅胶':11,'紧固件':12,'绝缘膜':13,'10mm':14,'与侧板间隙':15,'小于':16,'搭接电阻':17,'测':18,'涂胶':19,'3台单机':20,'侧板':21,'分离插头':22,'弹平垫':23,'点封':24,'倒装':25,'力矩':26,'铟箔':27,'除胶':28,'安装单机':29,'胶垫':30]。
根据词典对各工序的工序文本进行文本挖掘,并获取各工序中每个目标词TF-IDF数值,将其构成一个150×30的文本特征矩阵,其中150小时工序数量,30表示词典的总词数;当词典中的某一个词存在于目标工序中时,则目标工序中的对应位置的值为该词TF-IDF数值,当词典中的某一个词不存在于目标工序中时,则目标工序中的对应位置的值为零。
使用“Ridge”模型对工序文本特征和工时进行回归,为了验证回归模型的训练结果的精确度,按照75%和25%的比例从150到工序中随机划分训练集和测试集。在[0,1]区间设置步长0.001取岭回归系数的值,分别进行“Ridge”模型训练和泛化能力测试,得到泛化精度变化曲线,如图12所示。得到最适用于当前语料库的岭回归系数的值为0.242,用此岭回归系数的值进行回归模型训练,并对测试集的每道工序进行工时预测,预测结果如图13所示,可以看出,整体符合情况较好,工时预测偏差较小,因此将此岭回归系数带入回归模型中得到工时计算模型。
参见图14,本发明的另一优选实施例还提供了一种预测航天产品装配工时的处理装置,包括:
第一处理模块1401,用于构建工序分类库以及分别与工序分类库中每种工序类型对应的多个文本语料库;
第二处理模块1402,用于依次选择工艺卡数据库中的预设工序作为预选工序,并根据工序分类库和文本语料库对预选工序进行预处理操作,得到预选工序的预选工序文本,以及与预选工序的工序类型所对应的预选文本语料库;
第三处理模块1403,用于根据预选文本语料库对预选工序文本进行文本挖掘,得到预选工序文本的预选文本特征向量,并存储预选文本特征向量以及测试执行预选工序时的工时数值;
第四处理模块1404,用于当确定工艺卡数据库中的所有工序均已遍历时,根据已存储的每种工序类型所对应的预选文本特征向量以及工时数值,得到每种工序类型对应的工时计算模型,并存储至工时计算模型库中;
第五处理模块1405,用于根据待执行工序的描述文本以及工时计算模型库,得到待执行工序的工时预测值。
优选地,如上所述的处理装置,第一处理模块包括:
第一处理单元,用于对工艺卡数据库中的每个预设工序进行工序特征提取,得到每个预设工序的文本内容以及工序基本属性;
第二处理单元,用于根据工序基本属性以及预设工序分类规则,对每个预设工序进行分类,得到工序分类库;
第三处理单元,用于对工序分类库中每种工序类型所包括的每一预设工序的文本内容进行文本预处理,得到每种工序类型所对应的文本语料库。
优选地,如上所述的处理装置,其特征在于,第一处理模块还包括:
第四处理单元,用于将每一工序类型所对应的文本语料库中的词组成一过渡文本;
第五处理单元,用于获取过渡文本中每个词的词频-逆向文档频率TF-IDF数值;
第六处理单元,用于根据关于TF-IDF数值的预设阈值或预设保留比例更新文本语料库。
具体地,如上所述的处理装置,第二处理模块,包括:
第七处理单元,用于对预选工序进行工序特征提取,得到预选工序的预选文本内容以及预选工序基本属性;
第八处理单元,用于对预选文本内容进行文本预处理得到预选工序文本;并根据预选工序基本属性在工序分类库中进行属性匹配,确定预选工序所属的预选工序类型以及与预选工序类型对应的预选工序文本语料库。
优选地,如上所述的处理装置,第四处理模块,包括:
第九处理单元,用于构建预设回归模型,其中,文本特征向量为自变量,工时数值为因变量;
第十处理单元,用于将工艺卡数据库中每种工序类型所包括的工序根据预设比例划分为训练集和测试集;
第十一处理单元,用于根据训练集中的预选文本特征向量以及工时数值,得到预设回归模型的目标回归系数;
第十二处理单元,用于根据测试集中的预选工序对应的预选文本特征向量以及工时数值,对目标回归系数进行验证;
第十三处理单元,用于当验证通过时,将目标回归系数带入预设回归模型中,得到与预选工序的工序类型相对应的工时计算模型。
具体地,如上所述的处理装置,预设回归模型为:
Figure BDA0002444226710000201
其中,T由预选工序类型中每道工序的工时组成;
A为由预选工序类型中每道工序的预选文本特征向量构成的文本特征矩阵;
δ为回归系数;
ε为误差值;
α为岭回归系数;
I为单位矩阵。
优选地,如上所述的处理装置,第五处理模块,包括:
第十四处理单元,用于对待执行工序进行工序特征提取,得到待执行工序中的待执行工序文本内容和待执行工序基本属性;
第十五处理单元,用于对待执行工序文本内容进行文本预处理得到目标工序文本;并根据待执行工序基本属性在工序分类库中进行属性匹配,确定待执行工序所属的目标工序类型以及与目标工序类型对应的目标工序文本语料库;
第十六处理单元,用于根据目标工序文本语料库对目标工序文本进行文本挖掘,得到目标工序文本的目标文本特征向量;
第十七处理单元,用于从工时计算模型库中获取与目标工序类型对应的目标工时计算模型,并根据目标工时计算模型和目标文本特征向量,得到待执行工序的工时预测值。
具体地,如上所述的处理装置,第三处理单元、第八处理单元或第十五处理单元还用于:
通过自然语言分词并结合预设的词典将工序文本内容分解为单独的词,并根据预设的停词库剔除工序文本内容中的停用词。
进一步的,如上所述的处理装置,第三处理模块或第十六处理单元还用于:
获取工序文本中每个目标词的TF-IDF数值,其中,目标词为工序文本中的任意一个词;
根据每个目标词的TF-IDF数值以及文本语料库对应的文本特征向量的维度,得到工序文本的文本特征向量。
具体地,如上所述的处理装置,工序分类库中的基本属性包括:产品尺寸、工序所属专业以及操作过程中的至少一个。
本发明的处理装置实施例是与上述处理方法的实施例对应的处理装置,上述处理方法实施例中的所有实现手段均适用于该处理装置的实施例中,也能达到相同的技术效果。
本发明的又一优选实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如上所述的预测航天产品装配工时的处理方法的步骤。
需要说明的是,本文中所述的预设工序、预选工序以及待执行工序等仅为便于区分,其实质可以为同一工序。
此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种预测航天产品装配工时的处理方法,其特征在于,包括:
构建工序分类库以及分别与所述工序分类库中每种工序类型对应的多个文本语料库;
依次选择工艺卡数据库中的预设工序作为预选工序,并根据所述工序分类库和所述文本语料库对所述预选工序进行预处理操作,得到所述预选工序的预选工序文本,以及与所述预选工序的工序类型所对应的预选文本语料库;
根据所述预选文本语料库对所述预选工序文本进行文本挖掘,得到所述预选工序文本的预选文本特征向量,并存储所述预选文本特征向量以及测试执行所述预选工序时的工时数值;
当确定所述工艺卡数据库中的所有工序均已遍历时,根据已存储的每种工序类型所对应的所述预选文本特征向量以及所述工时数值,得到每种工序类型对应的工时计算模型,包括:构建预设回归模型,其中,文本特征向量为自变量,工时数值为因变量;将所述工艺卡数据库中每种工序类型所包括的工序根据预设比例划分为训练集和测试集;根据所述训练集中的所述预选文本特征向量以及所述工时数值,得到所述预设回归模型的目标回归系数;根据所述测试集中的所述预选工序对应的所述预选文本特征向量以及所述工时数值,对所述目标回归系数进行验证;当验证通过时,将所述目标回归系数带入所述预设回归模型中,得到与所述预选工序的工序类型相对应的所述工时计算模型;并存储至工时计算模型库中;
根据待执行工序的描述文本以及所述工时计算模型库,得到所述待执行工序的工时预测值;
所述预设回归模型为:
Figure FDA0003603334540000011
T由预选工序类型中每道工序的工时组成;
A为由预选工序类型中每道工序的预选文本特征向量构成的文本特征矩阵;
δ为回归系数;
ε为误差值;
α为岭回归系数;
I为单位矩阵。
2.根据权利要求1所述的处理方法,其特征在于,所述构建工序分类库以及分别与所述工序分类库中每种工序类型对应的多个文本语料库的步骤包括:
对所述工艺卡数据库中的每个所述预设工序进行工序特征提取,得到每个所述预设工序的文本内容以及工序基本属性;
根据所述工序基本属性以及预设工序分类规则,对每个所述预设工序进行分类,得到所述工序分类库;
对所述工序分类库中每种工序类型所包括的每一所述预设工序的文本内容进行文本预处理,得到每种工序类型所对应的文本语料库。
3.根据权利要求2所述的处理方法,其特征在于,在所述得到每种工序类型所对应的文本语料库的步骤之后,所述处理方法还包括:
将每一工序类型所对应的文本语料库中的词组成一过渡文本;
获取所述过渡文本中每个词的词频-逆向文档频率TF-IDF数值;
根据关于所述TF-IDF数值的预设阈值或预设保留比例更新所述文本语料库。
4.根据权利要求1所述的处理方法,其特征在于,所述根据所述工序分类库和所述文本语料库对所述预选工序进行预处理操作,得到所述预选工序的预选工序文本,以及与所述预选工序的工序类型所对应的预选工序语料库的步骤包括:
对所述预选工序进行工序特征提取,得到所述预选工序的预选文本内容以及预选工序基本属性;
对所述预选文本内容进行文本预处理得到所述预选工序文本;并根据所述预选工序基本属性在所述工序分类库中进行属性匹配,确定所述预选工序所属的预选工序类型以及与所述预选工序类型对应的预选工序文本语料库。
5.根据权利要求1所述的处理方法,其特征在于,所述根据待执行工序的描述文本以及所述工时计算模型库,得到所述待执行工序的工时预测值的步骤包括:
对所述待执行工序进行工序特征提取,得到所述待执行工序中的待执行工序文本内容和待执行工序基本属性;
对所述待执行工序文本内容进行文本预处理得到目标工序文本;并根据所述待执行工序基本属性在所述工序分类库中进行属性匹配,确定所述待执行工序所属的目标工序类型以及与所述目标工序类型对应的目标工序文本语料库;
根据所述目标工序文本语料库对所述目标工序文本进行文本挖掘,得到所述目标工序文本的目标文本特征向量;
从所述工时计算模型库中获取与所述目标工序类型对应的目标工时计算模型,并根据所述目标工时计算模型和所述目标文本特征向量,得到所述待执行工序的工时预测值。
6.根据权利要求2、权利要求4或权利要求5所述的处理方法,其特征在于,所述文本预处理的步骤包括:
通过自然语言分词并结合预设的词典将工序文本内容分解为单独的词,并根据预设的停词库剔除所述工序文本内容中的停用词。
7.根据权利要求1或权利要求5所述的处理方法,其特征在于,根据文本语料库对工序文本进行文本挖掘,得到文本特征向量的步骤包括:
获取所述工序文本中每个目标词的TF-IDF数值,其中,所述目标词为所述工序文本中的任意一个词;
根据每个目标词的TF-IDF数值以及所述文本语料库对应的文本特征向量的维度,得到所述工序文本的文本特征向量。
8.根据权利要求1所述的处理方法,其特征在于,所述工序的基本属性包括:产品尺寸、工序所属专业以及操作过程中的至少一个。
9.一种预测航天产品装配工时的处理装置,其特征在于,包括:
第一处理模块,用于构建工序分类库以及分别与所述工序分类库中每种工序类型对应的多个文本语料库;
第二处理模块,用于依次选择工艺卡数据库中的预设工序作为预选工序,并根据所述工序分类库和所述文本语料库对所述预选工序进行预处理操作,得到所述预选工序的预选工序文本,以及与所述预选工序的工序类型所对应的预选文本语料库;
第三处理模块,用于根据所述预选文本语料库对所述预选工序文本进行文本挖掘,得到所述预选工序文本的预选文本特征向量,并存储所述预选文本特征向量以及测试执行所述预选工序时的工时数值;
第四处理模块,用于当确定所述工艺卡数据库中的所有工序均已遍历时,根据已存储的每种工序类型所对应的所述预选文本特征向量以及所述工时数值,得到每种工序类型对应的工时计算模型,并存储至工时计算模型库中;其中,构建预设回归模型,其中,文本特征向量为自变量,工时数值为因变量;将所述工艺卡数据库中每种工序类型所包括的工序根据预设比例划分为训练集和测试集;根据所述训练集中的所述预选文本特征向量以及所述工时数值,得到所述预设回归模型的目标回归系数;根据所述测试集中的所述预选工序对应的所述预选文本特征向量以及所述工时数值,对所述目标回归系数进行验证;当验证通过时,将所述目标回归系数带入所述预设回归模型中,得到与所述预选工序的工序类型相对应的所述工时计算模型;
第五处理模块,用于根据待执行工序的描述文本以及所述工时计算模型库,得到所述待执行工序的工时预测值;
所述预设回归模型为:
Figure FDA0003603334540000041
T由预选工序类型中每道工序的工时组成;
A为由预选工序类型中每道工序的预选文本特征向量构成的文本特征矩阵;
δ为回归系数;
ε为误差值;
α为岭回归系数;
I为单位矩阵。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至权利要求8中任一项所述的预测航天产品装配工时的处理方法的步骤。
CN202010274284.9A 2020-04-09 2020-04-09 一种预测航天产品装配工时的处理方法及装置 Active CN111489032B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010274284.9A CN111489032B (zh) 2020-04-09 2020-04-09 一种预测航天产品装配工时的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010274284.9A CN111489032B (zh) 2020-04-09 2020-04-09 一种预测航天产品装配工时的处理方法及装置

Publications (2)

Publication Number Publication Date
CN111489032A CN111489032A (zh) 2020-08-04
CN111489032B true CN111489032B (zh) 2022-09-06

Family

ID=71798260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010274284.9A Active CN111489032B (zh) 2020-04-09 2020-04-09 一种预测航天产品装配工时的处理方法及装置

Country Status (1)

Country Link
CN (1) CN111489032B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985890B (zh) * 2020-08-05 2023-12-08 上海卫星装备研究所 卫星装配定额工时估算方法、系统及工时管理系统
CN112069317A (zh) * 2020-09-07 2020-12-11 北京理工大学 一种装配工时的获取方法及处理器
CN112529242A (zh) * 2020-10-16 2021-03-19 南京航空航天大学 一种端子排产品组装线工序总工时定额预测方法
CN112508414A (zh) * 2020-12-08 2021-03-16 北京无线电测量研究所 一种工时核算方法、系统及计算机设备
CN112819205B (zh) * 2021-01-18 2023-03-24 北京理工大学 工时预测方法、装置及系统
CN112801562B (zh) * 2021-04-14 2021-07-06 江苏金恒信息科技股份有限公司 一种基于钢材检验阶段的组批系统及方法
CN113191624A (zh) * 2021-04-28 2021-07-30 上海核工程研究设计院有限公司 一种用于核电设计研发的工作量预估方法
CN114139789A (zh) * 2021-11-23 2022-03-04 成都飞机工业(集团)有限责任公司 一种基于机器学习的飞机成本预测方法
CN116303356A (zh) * 2023-03-15 2023-06-23 三一(韶山)风电设备有限公司 生产工时数据库的构建方法、生产工时的确定方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682773B (zh) * 2016-12-15 2020-06-16 重庆川仪自动化股份有限公司 一种基于模拟退火算法的人机焊接工时预测方法
CN107122413B (zh) * 2017-03-31 2020-04-10 北京奇艺世纪科技有限公司 一种基于图模型的关键词提取方法及装置
CN108733003B (zh) * 2017-04-20 2020-11-13 南京理工大学 基于kmeans聚类算法的回转类零件工序工时预测方法及系统
CN107908716A (zh) * 2017-11-10 2018-04-13 国网山东省电力公司电力科学研究院 基于词向量模型的95598工单文本挖掘方法和装置
CN110674289A (zh) * 2019-07-04 2020-01-10 南瑞集团有限公司 基于分词权重判断文章所属分类的方法、装置和存储介质
CN110414727B (zh) * 2019-07-16 2023-05-12 中国航天系统科学与工程研究院 一种基于数据挖掘的生产进度预测方法及系统

Also Published As

Publication number Publication date
CN111489032A (zh) 2020-08-04

Similar Documents

Publication Publication Date Title
CN111489032B (zh) 一种预测航天产品装配工时的处理方法及装置
CN105989040A (zh) 智能问答的方法、装置及系统
CN104133855A (zh) 一种输入法智能联想的方法及装置
Picheny et al. Noisy expected improvement and on-line computation time allocation for the optimization of simulators with tunable fidelity
CN111127246A (zh) 一种输电线路工程造价的智能预测方法
CN112069317A (zh) 一种装配工时的获取方法及处理器
JP5316433B2 (ja) 最適化処理プログラム、方法及び装置
Sanyal et al. Simulation and big data challenges in tuning building energy models
CN112507073A (zh) 配电网作业文件的内容校验方法及相关设备
Emura et al. Left‐truncated and right‐censored field failure data: review of parametric analysis for reliability
WO2022228367A1 (en) Input method and apparatus based on sample-probability quantization, and electronic device
CN116049359A (zh) 一种基于文档内容分析的查重算法
Yang et al. Large language models for automated q&a involving legal documents: a survey on algorithms, frameworks and applications
Pelamatti et al. Coupling and selecting constraints in Bayesian optimization under uncertainties
CN112380844A (zh) 武器装备属性同义词扩展方法
CN113011156A (zh) 审核文本的质检方法、装置、介质以及电子设备
Hall et al. TSP 5.0 user's guide
CN116738214A (zh) 一种基于高阶张量的数据降维预处理方法
CN116450782A (zh) 一种知识驱动的航天产品装配工艺信息检索方法
Mendenhall et al. Best practices for reduction of uncertainty in CFD results
Vinai et al. A statistical methodology for quantification of uncertainty in best estimate code physical models
CN112906991A (zh) 一种预测rafm钢辐照硬化行为的方法及装置
Bao et al. Machine Learning in Nuclear Thermal Hydraulics, Part 2: Opportunities and Perspectives
CN116257218B (zh) 一种统计分析软件与核能程序的接口设计方法及集成系统
CN114997001B (zh) 一种基于替代模型和知识图谱的复杂机电装备性能评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant