CN116702712B - 一种Word任务书转换方法、装置、电子设备及介质 - Google Patents
一种Word任务书转换方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN116702712B CN116702712B CN202310997965.1A CN202310997965A CN116702712B CN 116702712 B CN116702712 B CN 116702712B CN 202310997965 A CN202310997965 A CN 202310997965A CN 116702712 B CN116702712 B CN 116702712B
- Authority
- CN
- China
- Prior art keywords
- converted
- data
- task book
- conversion
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 238
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000009877 rendering Methods 0.000 claims description 55
- 230000002159 abnormal effect Effects 0.000 claims description 45
- 239000004816 latex Substances 0.000 claims description 19
- 238000012356 Product development Methods 0.000 claims description 18
- 238000012937 correction Methods 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 15
- 238000005094 computer simulation Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 238000004519 manufacturing process Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
本申请涉及数据处理技术领域,尤其是涉及一种Word任务书转换方法、装置、电子设备及介质,方法包括获取待转换Word任务书;根据待转换Word任务书中包含的数据特征划分待转换Word任务书;基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换,得到待转换Word任务书对应的转换文档;获取预设SysML需求模型和至少一个待填充节点;根据每个待填充节点对应的所需数据和转换文档对预设SysML需求模型中进行数据填充,得到待转换Word任务书对应的目标SysML需求模型。本申请具有提高Word任务书转换为SysML需求模型时的工作效率和准确性的效果。
Description
技术领域
本申请涉及数据处理技术领域,尤其是涉及一种Word任务书转换方法、装置、电子设备及介质。
背景技术
Word任务书是一种用于记录和传达项目需求的文档,在产品生产过程中可通过Word任务书向生产下游发放研制生产任务,通过Word任务书能够使项目团队和其他相关方对项目需求有清晰一致的理解。由于SysML(Systems Modeling Language,图形化建模语言)模型能够以图形化的方式表示需求、功能、行为和其他系统方面的信息,因此为了能够提升项目团队中的生产人员对项目需求的认知清晰度,一般会将Word任务书录入至预设SysML模型中,以可视化的形式将Word任务书进行展示,从而能够使得项目需求更加清晰和易于理解。
预设SysML模型中包含有与产品生产信息对应的初始节点,相关技术中,一般采用人工录入的方式根据初始节点将Word文档转化为SysML模型,但是由于Word任务书中包含有大量不同类型的待录入数据,并且不同的数据类型对应的录入方式可能不同,因此,采用人工录入时可能会增加相关工作人员的工作负担,并且由于录入工作负担重,相关工作人员出现疲劳注意力不集中的情况概率较大,因此可能会导致人工录入时出错概率升高。
发明内容
为了提高Word任务书转换为SysML需求模型时的工作效率和准确性,本申请提供一种Word任务书转换方法、装置、电子设备及介质。
第一方面,本申请提供一种Word任务书转换方法,采用如下的技术方案:
一种Word任务书转换方法,包括:
获取待转换Word任务书;
识别所述待转换Word任务书中包含的数据特征,并根据数据特征划分所述待转换Word任务书得到至少一个待转换任务书区域;
基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,得到所述待转换Word任务书对应的转换文档;
获取预设SysML(Systems Modeling Language,图形化建模语言)需求模型和至少一个待填充节点,每个待填充节点对应有所需数据;
根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充,得到所述待转换Word任务书对应的目标SysML需求模型。
通过采用上述技术方案,通过先识别出待转换Word任务书中包含的所有数据特征,再根据数据特征对转换Word任务书进行划分后,基于每个区域对应的数据特征对每个区域进行精准数据转换,而不是采用同一种转换方式将整篇Word任务书进行数据转换,由于不同的数据特征对应的转换方式不同,因此数据特征精准转换便于提升转换结果的准确性,并且由于待转换Word任务书包含的数据量较大,通过自动识别数据特征,并自动按照数据特征对应的转换方式进行数据转换时可以降低相关工作人员的工作负担,同时便于降低因人工操作出现疲劳和注意力不集中而转换出错的概率,从而便于提升Word任务书转换为SysML需求模型时的准确性,根据预设SysML模型中初始节点的所需数据与转换文档的对应关系,便于提升填充数据时的效率和准确性,从而能够提升提高Word任务书转换为SysML需求模型时的工作效率和准确性。
在一种可能实现的方式中,所述识别所述待转换Word任务书中包含的数据特征,包括:
识别所述待转换Word任务书中是否存在MathML(Mathematical MarkupLanguage,数学标记语言)标识,得到第一识别结果,所述第一识别结果用于表征所述待转换Word任务书中是否包含第一数据特征,所述MathML标识为标准公式在任务书中的展示形式;
识别所述待转换Word任务书中是否存在嵌入对象标识和预设结构,得到第二识别结果,所述第二识别结果用于表征所述待转换Word任务书中是否包含第二数据特征,所述嵌入对象标识和预设结构为MathType公式在任务书中的展示形式;
识别所述待转换Word任务书中是否存在图形对象标识,得到第三识别结果,所述第三识别结果用于表征所述待转换Word任务书中是否包含第三数据特征,所述图形对象标识为Visio图在任务书中的展示形式;
识别所述待转换Word任务书中是否存在预设数据特征,得到第四识别结果,所述第四识别结果用于表征所述待转换Word任务书中是否包含第四数据特征,所述预设数据特征为文档正文在任务书中的展示形式;
基于所述第一识别结果、所述第二识别结果、所述第三识别结果以及所述第四识别结果,确定所述待转换word任务书中包含的数据特征。
通过采用上述技术方案,根据每个数据特征在任务书中的展示标识,识别待转换Word任务书中包含的数据特征,便于提升识别数据特征时的准确性,从而便于提升确定待转换Word任务书中包含的数据特征时的准确性。
在一种可能实现的方式中,所述数据特征包括第一数据特征,其中,所述基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,包括:
对所述第一数据特征的待转换任务书区域进行渲染,得到第一渲染画布,所述第一渲染画布为所述第一数据特征的待转换任务书区域反馈到显示设备上的虚拟绘制区域;
将所述第一渲染画布确定为所述第一数据特征的待转换任务书区域的数据转换结果。
通过采用上述技术方案,通过画布渲染的形式将第一数据特征对应的待转换任务书区域转换为建模工具可识别的图片文件,而不需进行手动截图录入转换,能够提高对第一数据特征的待转换任务书区域进行格式转换时的速率和准确性。
在一种可能实现的方式中,所述数据特征包括第二数据特征,其中,所述基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,包括:
根据预设封装标识,识别所述第二数据特征的待转换任务书区域对应的eps(encapsulated postscript,矢量图形)封装文件;
解析所述eps封装文件,得到所述eps封装文件对应的LaTex公式;
将所述LaTex公式转换为MathML语言;
将转换为MathML语言的所述第二数据特征的待转换任务书区域进行渲染,得到第二渲染画布,所述第二渲染画布为所述第二数据特征的待转换任务书区域反馈到显示设备上的虚拟绘制区域;
将所述第二渲染画布确定为数据特征为第二数据特征的待转换任务书区域的数据转换结果。
通过采用上述技术方案,通过预设封装标识从待转换任务书区域中识别eps封装文件,便于提升识别结果的准确性,通过将从eps封装文件中识别到的LaTex公式转换为MathML语言,再通过画布渲染的形式将第二数据特征对应的待转换任务书区域转换为建模工具可识别的图片文件,而不需进行手动截图录入转换,能够提高对第二数据特征的待转换任务书区域进行格式转换时的速率和准确性。
在一种可能实现的方式中,所述数据特征包括第三数据特征,其中,所述基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,包括:
根据所述第三数据特征和组件对应关系确定所述第三数据特征对应的目标调用组件入口和目标输出路径,所述组件对应关系为数据特征与调用组件入口的对应关系;
根据所述目标调用组件入口确定目标调用组件,并将所述目标输出路径确定为所述调用组件的输出路径,按照所述输出路径进行输出,得到输出结果;
将所述输出结果确定为所述第三数据特征的待转换任务书区域的数据转换结果。
通过采用上述技术方案,通过调用组件,并更改输出路径的形式将第三数据特征对应的待转换任务书区域转换为建模工具可识别的图片文件,而不需进行手动截图录入转换,能够提高对第三数据特征的待转换任务书区域进行格式转换时的速率和准确性。
在一种可能实现的方式中,所述数据特征包括第四数据特征,其中,所述基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,包括:
对所述第四数据特征的待转换任务书区域进行格式转换,得到转换正文,所述转换正文的格式为预设目标格式;
将所述转换正文确定为所述第四数据特征的待转换任务书区域的数据转换结果。
通过采用上述技术方案,通过调用文档转换工具将第四数据特征对应的待转换任务书区域转换为电子设备能够处理的结构化数据,而不需要相关工作人员进行逐个字段手动录入数据,由于Word任务书中一般包含的数据量较大,若采用人工对逐个字段手动录入出现录入错误的概率较高,采用自动调用文档转换工具的方式对每个字段进行转换,能够减少相关工作人员的工作量,并且采用文档转换工具进行录入时产生录入错误的概率较低,即,能够提高对第四数据特征的待转换任务书区域进行格式转换时的速率和准确性。
在一种可能实现的方式中,所述预设SysML需求模型中包括至少一个待填充节点,每个待填充节点对应一个生产流程,其中,所述根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充,包括:
识别所述预设SysML需求模型中每个待填充节点对应的节点关键词;
根据节点关键词和关键词对应关系确定每个待填充节点对应的目标转换文档区域,所述关键词对应关系为关键词与文档位置的对应关系;
将每个目标转换文档区域所对应的目标数据,填充至目标位置,所述目标位置为每个待填充节点在所述预设SysML需求模型的相应位置。
通过采用上述技术方案,通过建立转换文档与预设SysML需求模型中每个待填充节点的映射关系,再根据映射关系将转换文档以图形化的方式表示产品研制生产中的需求、功能、行为和其他系统方面的信息,能够提升相关工作人员对产品研制生产的认知清晰度,并且通过映射关系进行数据填充,而不是通过手动录入,能够减少数据录入过程中出错的概率。
在一种可能实现的方式中,所述根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充,包括:
判断所述转换文档中是否存在预设的异常特征;
若是,则获取所述异常特征的异常位置,并输出所述异常位置;
当接收到针对所述异常位置的修正信息时,根据所述修正信息对所述转换文档进行更新,得到更新后的转换文档;
根据每个待填充节点对应的所需数据和所述更新后的转换文档对所述预设SysML需求模型中进行数据填充。
通过采用上述技术方案,在进行数据填充之前对转换文档进行异常排查,并在发现异常后根据修正信息及时更新转换文档,以避免将转换文档中的异常特征数据填充至预设SysML需求模型,从而便以提升预设SysML需求模型中填充数据的准确性。
第二方面,本申请提供一种Word任务书转换装置,采用如下的技术方案:
一种Word任务书转换装置,包括:
获取任务书模块,用于获取待转换Word任务书;
识别数据特征模块,用于识别所述待转换Word任务书中包含的数据特征,并根据数据特征划分所述待转换Word任务书得到至少一个待转换任务书区域;
数据转换模块,用于基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,得到所述待转换Word任务书对应的转换文档;
获取预设模型模块,用于获取预设SysML(Systems Modeling Language,图形化建模语言)需求模型和至少一个待填充节点,每个待填充节点对应有所需数据;
数据填充模块,用于根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充,得到所述待转换Word任务书对应的目标SysML需求模型。
通过采用上述技术方案,通过先识别出待转换Word任务书中包含的所有数据特征,再根据数据特征对转换Word任务书进行划分后,基于每个区域对应的数据特征对每个区域进行精准数据转换,而不是采用同一种转换方式将整篇Word任务书进行数据转换,由于不同的数据特征对应的转换方式不同,因此数据特征精准转换便于提升转换结果的准确性,并且由于待转换Word任务书包含的数据量较大,通过自动识别数据特征,并自动按照数据特征对应的转换方式进行数据转换时可以降低相关工作人员的工作负担,同时便于降低因人工操作出现疲劳和注意力不集中而转换出错的概率,从而便于提升Word任务书转换为SysML需求模型时的准确性,根据预设SysML模型中初始节点的所需数据与转换文档的对应关系,便于提升填充数据时的效率和准确性,从而能够提升提高Word任务书转换为SysML需求模型时的工作效率和准确性。
在一种可能实现的方式中,识别数据特征模块在识别所述待转换Word任务书中包含的数据特征时,具体用于:
识别所述待转换Word任务书中是否存在MathML(Mathematical MarkupLanguage,数学标记语言)标识,得到第一识别结果,所述第一识别结果用于表征所述待转换Word任务书中是否包含第一数据特征,所述MathML标识为标准公式在任务书中的展示形式;
识别所述待转换Word任务书中是否存在嵌入对象标识和预设结构,得到第二识别结果,所述第二识别结果用于表征所述待转换Word任务书中是否包含第二数据特征,所述嵌入对象标识和预设结构为MathType公式在任务书中的展示形式;
识别所述待转换Word任务书中是否存在图形对象标识,得到第三识别结果,所述第三识别结果用于表征所述待转换Word任务书中是否包含第三数据特征,所述图形对象标识为Visio图在任务书中的展示形式;
识别所述待转换Word任务书中是否存在预设数据特征,得到第四识别结果,所述第四识别结果用于表征所述待转换Word任务书中是否包含第四数据特征,所述预设数据特征为文档正文在任务书中的展示形式;
基于所述第一识别结果、所述第二识别结果、所述第三识别结果以及所述第四识别结果,确定所述待转换word任务书中包含的数据特征。
在一种可能实现的方式中,所述数据特征包括第一数据特征,其中,数据转换模块在基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换时,具体用于:
对所述第一数据特征的待转换任务书区域进行渲染,得到第一渲染画布,所述第一渲染画布为所述第一数据特征的待转换任务书区域反馈到显示设备上的虚拟绘制区域;
将所述第一渲染画布确定为所述第一数据特征的待转换任务书区域的数据转换结果。
在一种可能实现的方式中,所述数据特征包括第二数据特征,其中,数据转换模块在基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换时,具体用于:
根据预设封装标识,识别所述第二数据特征的待转换任务书区域对应的eps(encapsulated postscript,矢量图形)封装文件;
解析所述eps封装文件,得到所述eps封装文件对应的LaTex公式;
将所述LaTex公式转换为MathML语言;
将转换为MathML语言的第二数据特征的待转换任务书区域进行渲染,得到第二渲染画布,所述第二渲染画布为所述第二数据特征的待转换任务书区域反馈到显示设备上的虚拟绘制区域;
将所述第二渲染画布确定为数据特征为第二数据特征的待转换任务书区域的数据转换结果。
在一种可能实现的方式中,所述数据特征包括第三数据特征,其中,数据转换模块在基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换时,具体用于:
根据所述第三数据特征和组件对应关系确定所述第三数据特征对应的目标调用组件入口和目标输出路径,所述组件对应关系为数据特征与调用组件入口的对应关系;
根据所述目标调用组件入口确定目标调用组件,并将所述目标输出路径确定为所述调用组件的输出路径,按照所述输出路径进行输出,得到输出结果;
将所述输出结果确定为所述第三数据特征的待转换任务书区域的数据转换结果。
在一种可能实现的方式中,所述数据特征包括第四数据特征,其中,数据转换模块在基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换时,具体用于:
对所述第四数据特征的待转换任务书区域进行格式转换,得到转换正文,所述转换正文的格式为预设目标格式;
将所述转换正文确定为所述第四数据特征的待转换任务书区域的数据转换结果。
在一种可能实现的方式中,所述预设SysML需求模型中包括至少一个待填充节点,每个待填充节点对应一个生产流程,所述数据填充模块在根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充时,具体用于:
识别所述预设SysML需求模型中每个待填充节点对应的节点关键词;
根据节点关键词和关键词对应关系确定每个待填充节点对应的目标转换文档区域,所述关键词对应关系为关键词与文档位置的对应关系;
将每个目标转换文档区域所对应的目标数据,填充至目标位置,所述目标位置为每个待填充节点在所述预设SysML需求模型的相应位置。
在一种时刻可能实现的方式中,所述数据填充模块在根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充时,具体用于:
判断所述转换文档中是否存在预设的异常特征;
若是,则获取所述异常特征的异常位置,并输出所述异常位置;
当接收到针对所述异常位置的修正信息时,根据所述修正信息对所述转换文档进行更新,得到更新后的转换文档;
根据每个待填充节点对应的所需数据和所述更新后的转换文档对所述预设SysML需求模型中进行数据填充。
第三方面,本申请提供一种电子设备,采用如下的技术方案:
一种电子设备,该电子设备包括:
至少一个处理器;
存储器;
至少一个应用程序,其中所述至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行上述Word任务书转换方法。
第四方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:
一种计算机可读存储介质,包括:存储有能够被处理器加载并执行上述Word任务书转换方法的计算机程序。
综上所述,本申请包括以下至少一种有益技术效果:
通过先识别出待转换Word任务书中包含的所有数据特征,再根据数据特征对转换Word任务书进行划分后,基于每个区域对应的数据特征对每个区域进行精准数据转换,而不是采用同一种转换方式将整篇Word任务书进行数据转换,由于不同的数据特征对应的转换方式不同,因此数据特征精准转换便于提升转换结果的准确性,并且由于待转换Word任务书包含的数据量较大,通过自动识别数据特征,并自动按照数据特征对应的转换方式进行数据转换时可以降低相关工作人员的工作负担,同时便于降低因人工操作出现疲劳和注意力不集中而转换出错的概率,从而便于提升Word任务书转换为SysML需求模型时的准确性,根据预设SysML模型中初始节点的所需数据与转换文档的对应关系,便于提升填充数据时的效率和准确性,从而能够提升提高Word任务书转换为SysML需求模型时的工作效率和准确性。
在进行数据填充之前对转换文档进行异常排查,并在发现异常后根据修正信息及时更新转换文档,以避免将转换文档中的异常特征数据填充至预设SysML需求模型,从而便以提升预设SysML需求模型中填充数据的准确性。
附图说明
图1是本申请实施例中一种Word任务书转换方法的流程示意图;
图2是本申请实施例中一种待转换Word任务书示例图;
图3是本申请实施例中一种目标SysML需求模型示例图;
图4是本申请实施例中一种识别数据特征的示例图;
图5是本申请实施例中一种Word任务书转换装置的结构示意图;
图6是本申请实施例中一种电子设备的结构示意图。
实施方式
以下结合附图1-6对本申请作进一步详细说明。
本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本申请的权利要求范围内都受到专利法的保护。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
具体的,本申请实施例提供了一种Word任务书转换方法,由电子设备执行,该电子设备可以为服务器也可以为终端设备,其中,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此,该终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例在此不做限制。
参考图1,图1是本申请实施例中一种Word任务书转换方法的流程示意图,该方法包括步骤S110-步骤S150,其中:
步骤S110:获取待转换Word任务书。
具体的,在产品研制过程中,Word任务书常用于组织和记录产品研制过程中的特定任务或项目的细节和要求,扮演着向生产下游发放研制生产任务的角色。Word任务书可提前预存至电子设备,也可由相关人员在需要对Word任务书进行转换时再上传至电子设备,具体的方式在本申请实施例中不作具体限定。
通常,Word任务书包含有任务标题、任务描述、任务要求、任务进度和里程碑以及任务评估和报告等因素,其中,任务标题,即任务的名称或标题,用于清晰地描述任务的主要目标;任务描述,用于对产品研制生产任务详细说明,包括产品研制生产任务的目的、理由、所需的工作内容和所涉及的资源等;任务要求,用于具体列出执行产品研制任务过程中所需的细节和规范,例如完成期限、所需的技能或知识、所需的工具或软件等;任务分工,用于指定不同人员在产品研制生产过程中的角色和职责,以及不同人员和合作方式和分工;任务进度和里程碑,用于跟踪任务进展和评估完成情况;任务评估和报告,用于指明任务的可衡量的标准和要求,以及评估任务完成情况的方式和频率。Word任务书中包含的因素在本申请实施例中不做具体限定。
步骤S120:识别待转换Word任务书中包含的数据特征,并根据数据特征划分待转换Word任务书得到至少一个待转换任务书区域。
具体的,由于Word任务书中包含有较多的因素,不同的因素所对应的任务书内容不同,一些产品研制生产过程可能需要进行数据运算,因此对应的Word任务书中可能会包含有定量要求、计算过程、数据分析等,用于说明产品研制任务的关键要求或指标,为了更好地传达产品研制任务要求和信息,Word任务书中可能会包含一些图示、流程图、组织结构图等,以更清晰地说明任务的工作流程、组织结构或相关的图形信息,因此Word任务书中可能会包含有多种数据特征。
识别待转换Word任务书中包含的数据特征时,可通过将待转换Word任务书导入预先训练好的特征识别模型中,以得到待转换Word任务书中包含的所有数据特征,其中,特征识别模型的训练过程可以为:获取大量样本数据,样本数据中包含有属于不同数据特征的数据内容,以及对应的人工标签,其中,每个样本数据中人工标签的内容与样本数据内容相对应,将大量样本数据导入待训练特征识别模型中进行迭代训练,直至待训练特征识别模型的输出结果与训练样本对应人工标签的匹配度高于预设匹配值,停止训练。
数据特征可以为标准公式、MathType公式、Visio图以及正文,具体的数据特征在本申请实施例中不做具体限定。由于不同的产品对应的研制生产过程不同,因此,不同的Word任务书中包含的数据特征种类和数量可能不同,例如,产品A的Word任务书中包含的数据特征为第一数据特征、第二数据特征以及第三数据特征;产品B的Word任务书中包含的数据特征可能为第一数据特征和第三数据特征。
识别出待转换Word任务书中包含的数据特征后,根据识别结果将待转换Word任务书进行区域划分,得到的每个待转换任务书区域均有对应的数据特征,不同的待转换任务书区域对应的数据特征可能相同。
步骤S130:基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换,得到待转换Word任务书对应的转换文档。
具体的,由于生产下游在对产品进行设计或研发过程中需采用基于 MBSE(Model-Based Systems Engineering)模式,因此,需要将Word任务书录入为 SysML(SystemsModeling Language)语言的结构化需求模型,以适应MBSE模型,不同的数据特征对应的数据转换方式不同,将待转换Word任务书转换为转换文档时,需要按照数据特征对每个待转换任务书区域进行转换,例如,将数据特征为标准公式、MathType公式以及Visio图的待转换任务书区域转换为建模工具可识别的图片文件,如格式为png的静态图片,将数据特征为正文的待转换任务书区域转换为计算机可处理的结构化数据。按照数据特征对每个待转换任务书区域进行转换后,将转换结果按照每个待转换任务书区域在待转换Word任务书中的位置,将转换后的内容进行拼接,以得到待转换Word任务书对应的转换文档。
步骤S140:获取预设SysML(Systems Modeling Language,图形化建模语言)需求模型和至少一个待填充节点,每个待填充节点对应有所需数据。
具体的,预设SysML需求模型中包含有至少一个初始节点,初始节点为产品研制过程中需要经过的操作节点,每个初始节点所需进行的操作内容不同,由于不同类型的产品对应的生产流程不同,因此不同产品类型对应的预设SysML需求模型也可能不同,例如,产品类型A对应预设SysML需求模型A,产品类型B对应预设SysML需求模型B。预设SysML需求模型可以提前录入至电子设备,预设SysML需求模型为包含有基础产品研发功能的需求模型。
待填充节点和对应的所需数据可由用户上传至电子设备,待填充节点的数量在本申请实施例中不做具体限定,可以为一个,也可以为多个。待填充节点的所需数据用于表征产品在研制生产过程中需要进行的操作和操作依据,例如节点A为验收节点,则节点A对应的所需数据为验收方式和验收标准。
步骤S150:根据每个待填充节点对应的所需数据和转换文档对预设SysML需求模型中进行数据填充,得到待转换Word任务书对应的目标SysML需求模型。
具体的,由于待转换Word任务书中包含有整个产品研制生产对应的数据,因此,待转换Word任务书与预设SysML需求模型中每个节点的所需数据相对应,即转换文档与预设SysML需求模型中每个待填充节点的所需数据相对应相对应,根据节点需求信息从转换文档中确定目标转换数据,将目标转换数据填充至对应待填充节点处即可得到目标SysML需求模型。确定转换文档与预设SysML需求模型中每个待填充节点的对应关系时,可通过提取节点需求信息中的需求关键字,再根据需求关键字从转换文档中进行遍历,确定对应关系的具体方式在本申请实施例中不做具体限定,只要能够将转换文档与待填充节点相对应即可。
例如,图2为待转换Word任务书,图3为经过数据填充后形成的目标SysML需求模型,通过目标SysML需求模型能够清晰的展示待转换Word任务书中的信息。
对于本申请实施例,通过先识别出待转换Word任务书中包含的所有数据特征,再根据数据特征对转换Word任务书进行划分后,基于每个区域对应的数据特征对每个区域进行精准数据转换,而不是采用同一种转换方式将整篇Word任务书进行数据转换,由于不同的数据特征对应的转换方式不同,因此数据特征精准转换便于提升转换结果的准确性,并且由于待转换Word任务书包含的数据量较大,通过自动识别数据特征,并自动按照数据特征对应的转换方式进行数据转换时可以降低相关工作人员的工作负担,同时便于降低因人工操作出现疲劳和注意力不集中而转换出错的概率,从而便于提升Word任务书转换为SysML需求模型时的准确性,根据预设SysML模型中初始节点的所需数据与转换文档的对应关系,便于提升填充数据时的效率和准确性,从而能够提升提高Word任务书转换为SysML需求模型时的工作效率和准确性。
进一步地,识别待转换Word任务书中包含的数据特征,具体包括步骤S1201-步骤S1205,如图4所示,包括:
步骤S1201:识别待转换Word任务书中是否存在MathML(Mathematical MarkupLanguage,数学标记语言)标识,得到第一识别结果,第一识别结果用于表征待转换Word任务书中是否包含第一数据特征,MathML标识为标准公式在任务书中的展示形式。
具体的,MathML标识用于描述数学表达式,识别待转换Word任务书中是否存在MathML时,可以通过识别待转换Word任务书中是否存在MathML标识的语法或结构,其中MathML标识具有以下基本语法和结构:<math> 元素,MathML标识通常从<math> 元素开始,用于表示整个数学表达式,可以将其视为MathML文档的根元素;<mrow> 元素,用于定义数学表达式中的一行或一组元素。在<mrow> 元素中,可以使用不同的MathML标识来表示具体的数学符号、运算符、标识符、分数等,一些常用的标记元素包括:<mi>用于表示标识符,如变量、函数名等;<mo>用于表示操作符或运算符,如加号、减号、乘号等;<mn>用于表示数字;<mfrac>用于表示分数;<msqrt>用于表示平方根。
当识别到待转换Word任务书中存在MathML标识时,确定待转换Word任务书中包含第一数据特征,即表征待转换Word任务书中包含标准公式,其中,判断待转换Word任务书中是否包含标准公式时,可通过判断待转换Word任务书中是否包含MathML标识,还可以通过判断待转换Word任务书中是否包含第一预设其他标识,其中,第一预设其他标识在本申请实施例中不作具体限定,只要能够用于表征任务书中的标准公式即可。
步骤S1202:识别待转换Word任务书中是否存在嵌入对象标识和预设结构,得到第二识别结果,第二识别结果用于表征待转换Word任务书中是否包含第二数据特征,嵌入对象标识和预设结构为MathType公式在任务书中的展示形式。
具体的,嵌入对象标识可以为Word任务书中表示嵌入对象位置或类型的标记或占位符,常见的嵌入对象标识包括:图像占位符,用于在文档中指示图像的位置和大小,图像占位符可以是具有特定格式和属性的标记,如HTML中的<img>标签或Markdown中的![ALT_TEXT](IMAGE_URL)格式;音频和视频控件标识,用于显示或播放嵌入的音频和视频,例如,HTML中使用<audio>和<video>标签。
预设结构为MathType公式的标识结构,通过公式中出现的预设结构能够确定该公式为MathType公式,具体的预设结构可以为MathType公式中常出现的一些结构,例如嵌套的括号、上下标、分数线、根号、矢量符号等,通过识别这些预设结构,可以确定MathType公式的边界和组成部分。
具体的嵌入对象标识和预设结构在本申请实施例中不做具体限定,只要能够通过识别到的嵌入对象标识和预设结构判断待转换Word任务书中是否存在MathType公式即可。
判断待转换Word任务书中是否包含MathType公式时,可通过判断待转换Word任务书中是否包含嵌入对象标识和预设结构,还可以通过判断待转换Word任务书中是否包含第二预设其他标识,其中,第二预设其他标识在本申请实施例中不作具体限定,只要能够用于表征任务书中的MathType公式即可。
步骤S1203:识别待转换Word任务书中是否存在图形对象标识,得到第三识别结果,第三识别结果用于表征待转换Word任务书中是否包含第三数据特征,图形对象标识为Visio图在任务书中的展示形式。
具体的,图形对象标识为Word任务书中的Visio图对应的特定标记,通过分析Word任务书中的特定标记可以定位和识别Visio图的位置和范围,图形对象标识可以是文本、图标、符号或其他特定的标记,具体的图形对象标识可以是人为添加或者由文档编辑工具自动生成,在本申请实施例中不做具体限定,只要能够通过图形标识别出Word任务书中包含的Visio图即可。
判断待转换Word任务书中是否包含Visio图时,可通过判断待转换Word任务书中是否包含图形对象标识,还可以通过判断待转换Word任务书中是否包含第三预设其他标识,其中,第三预设其他标识在本申请实施例中不作具体限定,只要能够用于表征任务书中的Visio图即可。
步骤S1204:识别待转换Word任务书中是否存在预设数据特征,得到第四识别结果,第四识别结果用于表征待转换Word任务书中是否包含第四数据特征,预设数据特征为文档正文在任务书中的展示形式。
具体的,预设数据特征为Word任务书中正文的展示形式,由于正文可以为段落文字,还可以为表格,因此,预设数据特征为段落文字和表格在任务书中的展示形式,例如,预设数据特征可以为标点符号、换行符、表头、表尾等元素,具体的预设数据特征在本申请实施例中不做具体限定,只要能够通过预设数据特征识别出Word任务书中包含的正文即可。
判断待转换Word任务书中是否包含正文时,可通过判断待转换Word任务书中是否包含预设数据特征,还可以通过判断待转换Word任务书中是否包含第四预设其他标识,其中,第四预设其他标识在本申请实施例中不作具体限定,只要能够用于表征任务书中的正文即可。
步骤S1205:基于第一识别结果、第二识别结果、第三识别结果以及第四识别结果,确定待转换word任务书中包含的数据特征。
具体的,待转换Word任务书的识别结果可以同时包含第一数据特征、第二数据特征、第三数据特征以及第四数据特征,也可以包含任意数量的数据特征,不同的待转换Word任务书中包含的数据特征可能不同。
进一步地,数据特征包括第一数据特征,其中,基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换,包括:
对第一数据特征的待转换任务书区域进行渲染,得到第一渲染画布,第一渲染画布为第一数据特征的待转换任务书区域反馈到显示设备上的虚拟绘制区域;将第一渲染画布确定为第一数据特征的待转换任务书区域的数据转换结果。
具体的,通过将待转换任务书区域反馈至显示设备的屏幕上,以实现对待转换任务书区域进行渲染,将待转换任务书区域反馈至显示设备的屏幕的具体步骤为:
步骤一,创建虚拟绘制区域,在显示设备上创建一个虚拟绘制区域,该虚拟绘制区域可以是一个矩形区域或者与待转换任务书区域形状相匹配的自定义区域,虚拟绘制区域的具体形状和大小在本申请实施例中不做具体限定,可由相关技术人员进行设定;
步骤二,内容渲染,将待转换任务书区域对应的数据内容渲染到步骤一中创建的虚拟绘制区域中,内容渲染的具体实现方式,可以通过CSS渲染或Markdown渲染,具体的渲染方式在本申请实施例中不做具体限定,可由相关技术人员进行设定;
步骤三,显示虚拟绘制区域,将虚拟绘制区域中的渲染内容反馈至显示设备的屏幕上。
将待转换任务书区域反馈至显示设备的屏幕的具体方式步骤在本申请实施例中不做具体限定,只要能够将转换任务书区域对应的渲染内容成功反馈至显示设备的屏幕上即可。
第一渲染画布的类型为静态图片类型,例如png格式图片、bmp格式图片、tiff格式图片,具体的类型在本申请实施例中不做具体限定,只要建模工具可以识别即可。
进一步地,数据特征包括第二数据特征,其中,基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换,包括:
根据预设封装标识,识别第二数据特征的待转换任务书区域对应的eps(encapsulated postscript,矢量图形)封装文件;解析eps封装文件,得到eps封装文件对应的LaTex公式;将LaTex公式转换为MathML语言;将转换为MathML语言的第二数据特征的待转换任务书区域进行渲染,得到第二渲染画布,第二渲染画布为第二数据特征的待转换任务书区域反馈到显示设备上的虚拟绘制区域;将第二渲染画布确定为数据特征为第二数据特征的待转换任务书区域的数据转换结果。
具体的,一般通过识别待转换任务书区域中是否存在预设封装标识,以判断待转换任务书区域中是否包含eps封装文件,其中,预设封装标识可以为文件扩展名,例如image.eps;可以为文件头标志,例如 “%!PS-Adobe-”,具体的预设封装标识在本申请实施例中不做具体限定,只要能够通过预设封装标识,识别出第二数据特征的待转换任务书区域中包含的eps封装文件即可。
由于eps封装文件支持将LaTex公式以PostScript语言的形式进行描述和绘制,当LaTex公式被转换为eps封装文件时,其中的公式编译结果会以PostScript语言的形式嵌入到eps封装文件中,因此当解析eps封装文件时,可以通过解析PostScript代码来识别和呈现eps封装文件中包含的LaTex公式。其中,PostScript语言是一种页面描述语言,用于描述二维矢量图形和文本布局。LaTex公式通常使用特定的语法和命令来表示,例如,2 over 3用于表征分数三分之二;sqrt{2}用于表征根号2;sum_{i=1}^{n}i用于表征从1到n求和,LaTex提供了丰富的数学符号、操作符、函数和结构,可以灵活地表达各种复杂的数学公式和方程。
通过将解析出来的公式标识进行拼接,以得到eps封装文件对应的LaTex公式,可使用MathML解析器将LaTex公式转换为MathML语言,具体的MathML解析器在本申请实施例中不做具体限定,只要能够将LaTex公式转换为MathML语言即可。将转换为MathML语言的数据特征为第二数据特征的待转换任务书区域进行渲染得到第二渲染画布的方式可参考上述得到第一渲染画布时对应的实施例,在此不做赘述。
第二渲染画布的类型为静态图片类型,例如png格式图片、bmp格式图片、tiff格式图片,具体的类型在本申请实施例中不做具体限定,只要建模工具可以识别即可。
进一步地,数据特征包括第三数据特征,其中,基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换,包括:
根据第三数据特征和组件对应关系确定第三数据特征对应的目标调用组件入口和目标输出路径,组件对应关系为数据特征与调用组件入口的对应关系;根据目标调用组件入口确定目标调用组件,并将目标输出路径确定为调用组件的输出路径,按照输出路径进行输出,得到输出结果;将输出结果确定为第三数据特征的待转换任务书区域的数据转换结果。
具体的,数据特征与调用组件入口的对应关系中包含有第三数据特征对应的多个调用组件入口,每个调用组件入口对应的调用组件不同,调用组件用于将Visio图转换为建模工具能够识别的图片文件,例如调用组件可以为Activex组件,具体的调用组件在本申请实施例中不做具体限定,只要能够将Visio图转换为建模工具能够识别的图片文件即可。
通过将Activex组件中的输出路径修改为第三数据特征对应的目标输出路径,即可将Visio图转换为建模工具能够识别的图片文件,例如目标输出路径可以为png格式图片对应的输出路径,其中第三数据特征对应的目标输出路径可以是提前预设好的,也可以在需要转换Visio图时由相关技术人员输入,获取第三数据特征对应的目标输出路径。
进一步地,数据特征包括第四数据特征,其中,基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换,包括:
对第四数据特征的待转换任务书区域进行格式转换,得到转换正文,转换正文的格式为预设目标格式;将转换正文确定为第四数据特征的待转换任务书区域的数据转换结果。
具体的,可通过调用文档转换工具的方式,将第四数据特征的待转换任务书区域转换为电子设备可处理的结构化数据,其中,文档转换工具可以为Pandoc工具或LibreOffice集成工具等,具体的转换工具在本申请实施例中不做具体限定,只要能够将第四数据特征的待转换任务书区域转换为预设目标格式即可,预设目标格式可以为XML(EXtensible Markup Language,可扩展的标记语言)格式、CSV(Comma-Separated Values,逗号分隔值)格式、YAML(YAML Aint Markup Language,yaml-aint标记语言)格式,具体的预设目标格式在本申请实施例中不做具体限定,只要能够被电子设备处理即可。
进一步地,预设SysML需求模型中包括至少一个待填充节点,每个待填充节点对应一个生产流程,其中,根据每个待填充节点对应的所需数据和转换文档对预设SysML需求模型中进行数据填充,包括:
识别预设SysML需求模型中每个待填充节点对应的节点关键词;根据节点关键词和关键词对应关系确定每个待填充节点对应的目标转换文档区域,关键词对应关系为关键词与文档位置的对应关系;将每个目标转换文档区域所对应的目标数据,填充至目标位置,目标位置为每个待填充节点在预设SysML需求模型的相应位置。
具体的,由于Word任务书一般用于组织和记录产品研制过程,因此Word任务书中至少包含有一个产品研制流程节点,并且预设SysML需求模型是与待转换Word任务书相对应的,因此预设SysML需求模型中至少包含有一个待填充节点,每个待填充节点均对应有一个节点关键词,通过待填充节点对应的节点关键词能够从转换文档中确定待填充数据,节点关键词可以为产品研制流程对应的标识,也可以为产品研制流程对应的主要操作,具体的节点关键词在本申请实施例中不做具体限定,只要能够通过节点关键词从转换文档中识别出该待填充节点对应的所需数据即可。
关键词与文档位置的对应关系中包含有不同的关键词在转换文档中的对应区域,例如,转换文档共有4个段落,先共有3个关键词,其中关键词1与转换文档中的段落1相对应,关键词2与转换文档中的段落2和3相对应,关键词3与转换文档中的段落4相对应,关键词与文档位置的对应关系在本申请实施例中不做具体限定,可由相关技术人员进行修改。
向预设SysML需求模型中进行数据填充时,只需要将每个待填充节点对应的目标数据写入预设SysML需求模型的相应位置即可,例如,预设SysML需求模型中包含有3个待填充节点,将3个待填充节点对应目标数据分别写入各自对应的区域即可,即,将待填充节点1的关键词1对应的段落1,填充至待填充节点1在预设SysML需求模型中的相应位置。
通过建立转换文档与预设SysML需求模型中每个待填充节点的映射关系,再根进行数据填充,而不是通过手动录入,能够减少数据录入过程中出错的概率。
进一步地,虽然采用自动识别并转换的方式能够提升识别和转换过程中的准确性,但是仍会出现一些识别失误的情况,例如Word任务书导入异常、Word任务书不完整等,因此在根据每个待填充节点对应的所需数据和转换文档对预设SysML需求模型中进行数据填充时,具体包括:
判断转换文档中是否存在预设的异常特征;若是,则获取异常特征的异常位置,并输出异常位置;当接收到针对异常位置的修正信息时,根据修正信息对转换文档进行更新,得到更新后的转换文档;根据每个待填充节点对应的所需数据和更新后的转换文档对预设SysML需求模型中进行数据填充。
具体的,根据待转换Word任务书得到转换文档后,需对转换文档是否存在识别异常进行判断,若待转换Word任务书不完整或存在缺失的部分,经过格式转换后的转换文档中可能会出现数据缺失、结构错误、数据格式异常等问题,其中,数据缺失在转换文档中的体现形式可以为空值、NULL值、占位符或空字符串等,具体的体现形式在本申请实施例中不做具体限定,只要能够识别出转换文档中存在数据缺失异常即可;结构错误在转换文档中的体现形式为出现结构不完整或缺失必要标记或嵌套关系,例如,缺少闭合标签、错误的嵌套层次或不匹配的格式;数据格式异常在转换文档中的体现形式可以为日期格式不正确、数值型数据包含非数值字符等。
异常特征的异常位置,即异常特征在转换文档中的位置,例如,异常位置为第3章第2节段落3中的第三行,异常位置的形式在本申请实施例中不做具体限定,只要能够便于相关人员根据异常位置快速从转换文档中定位异常特征即可。确定出异常特征对应的异常位置后,将异常位置反馈至相关工作人员的终端设备,以提醒相关工作人员进行人工录入,当相关工作人员对异常特征所在的异常位置进行修正时会生成修生信号,当电子设备检测到修生信号后,将修正内容进行记录和保存,将修正内容添加至异常位置处,并将原异常位置处的异常特征删除,已实现更新转换文档。
每个待填充节点对应的所需数据和更新后的转换文档对预设SysML需求模型中进行数据填充的方式可参考上述实施例中根据节点需求信息和转换文档对预设SysML需求模型中进行数据填充的方式,在此不做赘述。
当异常位置存在多个时,可根据异常位置与修正人员的对应关系,将不同的异常位置反馈至不同的修正人员,以便于提升修正过程中的效率,其中异常位置与修正人员的对应关系中,包含有不同异常位置对应的修正人员,对应关系的具体内容在本申请实施例中不做具体限定,可由相关技术人员进行设定。
上述实施例从方法流程的角度介绍一种Word任务书转换方法,下述实施例从虚拟模块或者虚拟单元的角度介绍了一种Word任务书转换装置,具体详见下述实施例。
本申请实施例提供一种Word任务书转换装置,如图5所示,该装置具体可以包括获取任务书模块510、识别数据特征模块520、数据转换模块530、获取预设模型模块540以及数据填充模块550,其中:
获取任务书模块510,用于获取待转换Word任务书;
识别数据特征模块520,用于识别待转换Word任务书中包含的数据特征,并根据数据特征划分待转换Word任务书得到至少一个待转换任务书区域;
数据转换模块530,用于基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换,得到待转换Word任务书对应的转换文档;
获取预设模型模块540,用于获取预设SysML(Systems Modeling Language,图形化建模语言)需求模型和至少一个待填充节点,每个待填充节点对应有所需数据;
数据填充模块550,用于根据每个待填充节点对应的所需数据和转换文档对预设SysML需求模型中进行数据填充,得到待转换Word任务书对应的目标SysML需求模型。
在一种可能实现的方式中,识别数据特征模块520在识别待转换Word任务书中包含的数据特征时,具体用于:
识别待转换Word任务书中是否存在MathML(Mathematical Markup Language,数学标记语言)标识,得到第一识别结果,第一识别结果用于表征待转换Word任务书中是否包含第一数据特征,MathML标识为标准公式在任务书中的展示形式;
识别待转换Word任务书中是否存在嵌入对象标识和预设结构,得到第二识别结果,第二识别结果用于表征待转换Word任务书中是否包含第二数据特征,嵌入对象标识和预设结构为MathType公式在任务书中的展示形式;
识别待转换Word任务书中是否存在图形对象标识,得到第三识别结果,第三识别结果用于表征待转换Word任务书中是否包含第三数据特征,图形对象标识为Visio图在任务书中的展示形式;
识别待转换Word任务书中是否存在预设数据特征,得到第四识别结果,第四识别结果用于表征待转换Word任务书中是否包含第四数据特征,预设数据特征为文档正文在任务书中的展示形式;
基于第一识别结果、第二识别结果、第三识别结果以及第四识别结果,确定待转换word任务书中包含的数据特征。
在一种可能实现的方式中,数据特征包括第一数据特征,其中,数据转换模块530在基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换时,具体用于:
对第一数据特征的待转换任务书区域进行渲染,得到第一渲染画布,第一渲染画布为第一数据特征的待转换任务书区域反馈到显示设备上的虚拟绘制区域;
将第一渲染画布确定为第一数据特征的待转换任务书区域的数据转换结果。
在一种可能实现的方式中,数据特征包括第二数据特征,其中,数据转换模块530在基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换时,具体用于:
根据预设封装标识,识别第二数据特征的待转换任务书区域对应的eps(encapsulated postscript,矢量图形)封装文件;
解析eps封装文件,得到eps封装文件对应的LaTex公式;
将LaTex公式转换为MathML语言;
将转换为MathML语言的第二数据特征的待转换任务书区域进行渲染,得到第二渲染画布,第二渲染画布为第二数据特征的待转换任务书区域反馈到显示设备上的虚拟绘制区域;
将第二渲染画布确定为数据特征为第二数据特征的待转换任务书区域的数据转换结果。
在一种可能实现的方式中,数据特征包括第三数据特征,其中,数据转换模块530在基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换时,具体用于:
根据第三数据特征和组件对应关系确定第三数据特征对应的目标调用组件入口和目标输出路径,组件对应关系为数据特征与调用组件入口的对应关系;
根据目标调用组件入口确定目标调用组件,并将目标输出路径确定为调用组件的输出路径,按照输出路径进行输出,得到输出结果;
将输出结果确定为第三数据特征的待转换任务书区域的数据转换结果。
在一种可能实现的方式中,数据特征包括第四数据特征,其中,数据转换模块530在基于每个待转换任务书区域对应的数据特征,对待转换Word任务书进行数据转换时,具体用于:
对第四数据特征的待转换任务书区域进行格式转换,得到转换正文,转换正文的格式为预设目标格式;
将转换正文确定为第四数据特征的待转换任务书区域的数据转换结果。
在一种可能实现的方式中,预设SysML需求模型中包括至少一个待填充节点,每个待填充节点对应一个生产流程,数据填充模块550在根据每个待填充节点对应的所需数据和转换文档对预设SysML需求模型中进行数据填充时,具体用于:
识别预设SysML需求模型中每个待填充节点对应的节点关键词;
根据节点关键词和关键词对应关系确定每个待填充节点对应的目标转换文档区域,关键词对应关系为关键词与文档位置的对应关系;
将每个目标转换文档区域所对应的目标数据,填充至目标位置,目标位置为每个待填充节点在预设SysML需求模型的相应位置。
在一种时刻可能实现的方式中,数据填充模块550在根据每个待填充节点对应的所需数据和转换文档对预设SysML需求模型中进行数据填充时,具体用于:
判断转换文档中是否存在预设的异常特征;
若是,则获取异常特征的异常位置,并输出异常位置;
当接收到针对异常位置的修正信息时,根据修正信息对转换文档进行更新,得到更新后的转换文档;
根据每个待填充节点对应的所需数据和转换文档对预设SysML需求模型中进行数据填充。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例中提供了一种电子设备,如图6所示,图6所示的电子设备600包括:处理器601和存储器303。其中,处理器601和存储器603相连,如通过总线602相连。可选地,电子设备600还可以包括收发器604。需要说明的是,实际应用中收发器604不限于一个,该电子设备600的结构并不构成对本申请实施例的限定。
处理器601可以是CPU(Central Processing Unit,中央处理器),通用处理器,DSP(Digital Signal Processor,数据信号处理器),ASIC(Application SpecificIntegrated Circuit,专用集成电路),FPGA(Field Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器601也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线602可包括一通路,在上述组件之间传送信息。总线602可以是PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture,扩展工业标准结构)总线等。总线602可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器603可以是ROM(Read Only Memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(Random Access Memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory,电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器603用于存储执行本申请方案的应用程序代码,并由处理器601来控制执行。处理器601用于执行存储器603中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备包括但不限于:移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。还可以为服务器等。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种Word任务书转换方法,其特征在于,包括:
获取待转换Word任务书;
识别所述待转换Word任务书中包含的数据特征,并根据数据特征划分所述待转换Word任务书得到至少一个待转换任务书区域;
基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,得到所述待转换Word任务书对应的转换文档;
获取预设SysML(Systems Modeling Language,图形化建模语言)需求模型和至少一个待填充节点,每个待填充节点对应有所需数据,预设SysML需求模型中包含有至少一个初始节点,初始节点为产品研制过程中需要经过的操作节点,每个初始节点所需进行的操作内容不同,不同产品类型对应的预设SysML需求模型不同;
根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充,得到所述待转换Word任务书对应的目标SysML需求模型;
其中,对所述待转换Word任务书进行数据转换,得到所述待转换Word任务书对应的转换文档,包括:根据每个待转换任务书区域在待转换Word任务书中的位置,将每个待转换任务书区域对应的转换结果进行拼接,得到待转换Word任务书对应的转换文档;
其中,所述根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充,包括:
识别所述预设SysML需求模型中每个待填充节点对应的节点关键词;根据节点关键词和关键词对应关系确定每个待填充节点对应的目标转换文档区域,所述关键词对应关系为关键词与文档位置的对应关系,关键词与文档位置的对应关系中包含有不同的关键词在转换文档中的对应区域;将每个目标转换文档区域所对应的目标数据,填充至目标位置,所述目标位置为每个待填充节点在所述预设SysML需求模型的相应位置。
2.根据权利要求1所述的一种Word任务书转换方法,其特征在于,所述识别所述待转换Word任务书中包含的数据特征,包括:
识别所述待转换Word任务书中是否存在MathML(Mathematical Markup Language,数学标记语言)标识,得到第一识别结果,所述第一识别结果用于表征所述待转换Word任务书中是否包含第一数据特征,所述MathML标识为标准公式在任务书中的展示形式;
识别所述待转换Word任务书中是否存在嵌入对象标识和预设结构,得到第二识别结果,所述第二识别结果用于表征所述待转换Word任务书中是否包含第二数据特征,所述嵌入对象标识和预设结构为MathType公式在任务书中的展示形式;
识别所述待转换Word任务书中是否存在图形对象标识,得到第三识别结果,所述第三识别结果用于表征所述待转换Word任务书中是否包含第三数据特征,所述图形对象标识为Visio图在任务书中的展示形式;
识别所述待转换Word任务书中是否存在预设数据特征,得到第四识别结果,所述第四识别结果用于表征所述待转换Word任务书中是否包含第四数据特征,所述预设数据特征为文档正文在任务书中的展示形式;
基于所述第一识别结果、所述第二识别结果、所述第三识别结果以及所述第四识别结果,确定所述待转换word任务书中包含的数据特征。
3.根据权利要求1所述的一种Word任务书转换方法,其特征在于,所述数据特征包括第一数据特征,其中,所述基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,包括:
对所述第一数据特征的待转换任务书区域进行渲染,得到第一渲染画布,所述第一渲染画布为所述第一数据特征的待转换任务书区域反馈到显示设备上的虚拟绘制区域;
将所述第一渲染画布确定为所述第一数据特征的待转换任务书区域的数据转换结果。
4.根据权利要求1所述的一种Word任务书转换方法,其特征在于,所述数据特征包括第二数据特征,其中,所述基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,包括:
根据预设封装标识 ,识别所述第二数据特征的 待转换任务书区域对应的 e p s(encapsulated postscript,矢量图形)封装文件;
解析所述eps封装文件,得到所述eps封装文件对应的LaTex公式;
将所述LaTex公式转换为MathML语言;
将转换为MathML语言的所述第二数据特征的待转换任务书区域进行渲染,得到第二渲染画布,所述第二渲染画布为所述第二数据特征的待转换任务书区域反馈到显示设备上的虚拟绘制区域;
将所述第二渲染画布确定为数据特征为第二数据特征的待转换任务书区域的数据转换结果。
5.根据权利要求1所述的一种Word任务书转换方法,其特征在于,所述数据特征包括第三数据特征,其中,所述基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,包括:
根据所述第三数据特征和组件对应关系确定所述第三数据特征对应的目标调用组件入口和目标输出路径,所述组件对应关系为数据特征与调用组件入口的对应关系;
根据所述目标调用组件入口确定目标调用组件,并将所述目标输出路径确定为所述调用组件的输出路径,按照所述输出路径进行输出,得到输出结果;
将所述输出结果确定为所述第三数据特征的待转换任务书区域的数据转换结果。
6.根据权利要求1所述的一种Word任务书转换方法,其特征在于,所述数据特征包括第四数据特征,其中,所述基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,包括:
对所述第四数据特征的待转换任务书区域进行格式转换,得到转换正文,所述转换正文的格式为预设目标格式;
将所述转换正文确定为所述第四数据特征的待转换任务书区域的数据转换结果。
7.根据权利要求1所述的一种Word任务书转换方法,其特征在于,所述根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充,包括:
判断所述转换文档中是否存在预设的异常特征;
若是,则获取所述异常特征的异常位置,并输出所述异常位置;
当接收到针对所述异常位置的修正信息时,根据所述修正信息对所述转换文档进行更新,得到更新后的转换文档;
根据每个待填充节点对应的所需数据和所述更新后的转换文档对所述预设SysML需求模型中进行数据填充。
8.一种Word任务书转换装置,其特征在于,包括:
获取任务书模块,用于获取待转换Word任务书;
识别数据特征模块,用于识别所述待转换Word任务书中包含的数据特征,并根据数据特征划分所述待转换Word任务书得到至少一个待转换任务书区域;
数据转换模块,用于基于每个待转换任务书区域对应的数据特征,对所述待转换Word任务书进行数据转换,得到所述待转换Word任务书对应的转换文档;
获取预设模型模块,用于获取预设SysML(Systems Modeling Language,图形化建模语言)需求模型和至少一个待填充节点,每个待填充节点对应有所需数据,预设SysML需求模型中包含有至少一个初始节点,初始节点为产品研制过程中需要经过的操作节点,每个初始节点所需进行的操作内容不同,不同产品类型对应的预设SysML需求模型不同;
数据填充模块,用于根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充,得到所述待转换Word任务书对应的目标SysML需求模型;
其中,所述数据转换模块在对所述待转换Word任务书进行数据转换,得到所述待转换Word任务书对应的转换文档时,具体用于:根据每个待转换任务书区域在待转换Word任务书中的位置,将每个待转换任务书区域对应的转换结果进行拼接,得到待转换Word任务书对应的转换文档;
数据填充模块在根据每个待填充节点对应的所需数据和所述转换文档对所述预设SysML需求模型中进行数据填充时,具体用于:识别所述预设SysML需求模型中每个待填充节点对应的节点关键词;根据节点关键词和关键词对应关系确定每个待填充节点对应的目标转换文档区域,所述关键词对应关系为关键词与文档位置的对应关系,关键词与文档位置的对应关系中包含有不同的关键词在转换文档中的对应区域;将每个目标转换文档区域所对应的目标数据,填充至目标位置,所述目标位置为每个待填充节点在所述预设SysML需求模型的相应位置。
9.一种电子设备,其特征在于,该电子设备包括:
至少一个处理器;
存储器;
至少一个应用程序,其中所述至少一个应用程序被存储在存储器中并被配置为由至少
一个处理器执行,所述至少一个应用程序配置用于:执行权利要求1-7中任一项所述的一种Word任务书转换方法。
10.一种计算机可读存储介质,其特征在于,包括:存储有能够被处理器加载并执行如
权利要求1-7中任一种所述的一种Word任务书转换方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310997965.1A CN116702712B (zh) | 2023-08-09 | 2023-08-09 | 一种Word任务书转换方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310997965.1A CN116702712B (zh) | 2023-08-09 | 2023-08-09 | 一种Word任务书转换方法、装置、电子设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116702712A CN116702712A (zh) | 2023-09-05 |
CN116702712B true CN116702712B (zh) | 2023-10-17 |
Family
ID=87843715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310997965.1A Active CN116702712B (zh) | 2023-08-09 | 2023-08-09 | 一种Word任务书转换方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116702712B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844307A (zh) * | 2017-01-05 | 2017-06-13 | 上海核工程研究设计院 | 一种基于标记实现Excel转Word的系统及方法 |
CN108153717A (zh) * | 2017-12-29 | 2018-06-12 | 北京仁和汇智信息技术有限公司 | 一种科技期刊论文word文档的结构化处理方法及装置 |
CN108664241A (zh) * | 2018-04-23 | 2018-10-16 | 华东师范大学 | 一种将SysML模型进行仿真验证的方法 |
CN110457031A (zh) * | 2019-08-21 | 2019-11-15 | 赛尔网络有限公司 | 一种软件开发方法、装置、设备及介质 |
CN111126006A (zh) * | 2019-12-25 | 2020-05-08 | 小船出海教育科技(北京)有限公司 | 导出带MathType公式的Word文档方法、装置、电子设备及存储介质 |
KR20210066470A (ko) * | 2019-11-28 | 2021-06-07 | 한국과학기술정보연구원 | 문서변환장치 및 그 동작 방법 |
CN113297425A (zh) * | 2021-06-22 | 2021-08-24 | 超凡知识产权服务股份有限公司 | 文档转换方法、装置、服务器及存储介质 |
CN115358200A (zh) * | 2022-07-27 | 2022-11-18 | 浙江大学 | 一种基于SysML元模型的模板化文档自动生成方法 |
CN116304192A (zh) * | 2023-04-10 | 2023-06-23 | 南京航空航天大学 | 基于ATL的SysML模型到SLIM模型的自动转换方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3046608A1 (en) * | 2019-06-14 | 2020-12-14 | Mathresources Incorporated | Systems and methods for document publishing |
-
2023
- 2023-08-09 CN CN202310997965.1A patent/CN116702712B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844307A (zh) * | 2017-01-05 | 2017-06-13 | 上海核工程研究设计院 | 一种基于标记实现Excel转Word的系统及方法 |
CN108153717A (zh) * | 2017-12-29 | 2018-06-12 | 北京仁和汇智信息技术有限公司 | 一种科技期刊论文word文档的结构化处理方法及装置 |
CN108664241A (zh) * | 2018-04-23 | 2018-10-16 | 华东师范大学 | 一种将SysML模型进行仿真验证的方法 |
CN110457031A (zh) * | 2019-08-21 | 2019-11-15 | 赛尔网络有限公司 | 一种软件开发方法、装置、设备及介质 |
KR20210066470A (ko) * | 2019-11-28 | 2021-06-07 | 한국과학기술정보연구원 | 문서변환장치 및 그 동작 방법 |
CN111126006A (zh) * | 2019-12-25 | 2020-05-08 | 小船出海教育科技(北京)有限公司 | 导出带MathType公式的Word文档方法、装置、电子设备及存储介质 |
CN113297425A (zh) * | 2021-06-22 | 2021-08-24 | 超凡知识产权服务股份有限公司 | 文档转换方法、装置、服务器及存储介质 |
CN115358200A (zh) * | 2022-07-27 | 2022-11-18 | 浙江大学 | 一种基于SysML元模型的模板化文档自动生成方法 |
CN116304192A (zh) * | 2023-04-10 | 2023-06-23 | 南京航空航天大学 | 基于ATL的SysML模型到SLIM模型的自动转换方法 |
Non-Patent Citations (1)
Title |
---|
一种在标文通文档中显现SVG和MathML对象的方法;梁琦等;《北京信息科技大学学报(自然科学版)》(第S2期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116702712A (zh) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111367976B (zh) | 基于java反射机制的excel文件数据的导出方法及装置 | |
CN108664471B (zh) | 文字识别纠错方法、装置、设备及计算机可读存储介质 | |
US20220121668A1 (en) | Method for recommending document, electronic device and storage medium | |
CN113641794A (zh) | 简历文本的评估方法、装置及服务器 | |
CN114116441A (zh) | 一种ui界面测试方法、装置、电子设备及存储介质 | |
CN112099801A (zh) | 一种基于元数据驱动的Excel解析方法及系统 | |
CN114359924A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN112163409A (zh) | 一种相似文档检测方法、系统、终端设备及计算机可读存储介质 | |
CN117851605B (zh) | 一种行业知识图谱构建方法、计算机设备及存储介质 | |
CN117095422B (zh) | 文档信息解析方法、装置、计算机设备、存储介质 | |
CN114385694A (zh) | 一种数据加工处理方法、装置、计算机设备及存储介质 | |
CN114330240A (zh) | Pdf文档解析方法、装置、计算机设备及存储介质 | |
CN116702712B (zh) | 一种Word任务书转换方法、装置、电子设备及介质 | |
CN116562247A (zh) | 电子表格内容生成方法、装置和计算机设备 | |
CN107977459B (zh) | 报表生成方法及装置 | |
CN110544467A (zh) | 语音数据的审核方法、装置、设备及存储介质 | |
US20220138399A1 (en) | Smart procedure parser | |
KR102467096B1 (ko) | 논문 메타데이터 영역 분류 모델을 학습하기 위한 데이터셋의 검수 방법 및 장치 | |
CN102799597A (zh) | 内容提取方法 | |
CN116049213A (zh) | 表格文档的关键词检索方法及电子设备 | |
CN115982272A (zh) | 一种城市大数据管理的数据标注方法、装置及计算机存储介质 | |
WO2021117483A1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN114067343A (zh) | 一种数据集的构建方法、模型训练方法和对应装置 | |
CN114169306A (zh) | 一种生成电子回执单的方法、装置、设备及可读存储介质 | |
US11113461B2 (en) | Generating edit suggestions for transforming digital documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |