CN113033149B - 用户故事文档质量检查方法、装置、设备及存储介质 - Google Patents
用户故事文档质量检查方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113033149B CN113033149B CN202110426477.6A CN202110426477A CN113033149B CN 113033149 B CN113033149 B CN 113033149B CN 202110426477 A CN202110426477 A CN 202110426477A CN 113033149 B CN113033149 B CN 113033149B
- Authority
- CN
- China
- Prior art keywords
- result
- document
- user story
- anchor point
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007689 inspection Methods 0.000 title claims abstract description 184
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000007619 statistical method Methods 0.000 claims abstract description 32
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000012896 Statistical algorithm Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/177—Editing, e.g. inserting or deleting of tables; using ruled lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及人工智能技术领域,揭示了一种用户故事文档质量检查方法、装置、设备及存储介质,其中方法包括:基于初始化的锚点数据容器对待检查的用户故事文档得到目标锚点数据容器,目标锚点数据容器中存储有目标锚点结果;采用目标锚点数据容器和内容检查器对待检查的用户故事文档进行内容检查得到目标内容检查结果,将目标内容检查结果存储到检查结果容器中;采用目标锚点数据容器和表格检查器对待检查的用户故事文档进行表格待填写项的检查得到目标表格检查结果,将目标表格检查结果存储到检查结果容器中;根据检查结果容器进行统计分析得到用户故事文档质量检查结果。实现了自动化进行文档质量检查,提升了检查速度、检查覆盖率、检查准确率。
Description
技术领域
本申请涉及到人工智能技术领域,特别是涉及到一种用户故事文档质量检查方法、装置、设备及存储介质。
背景技术
在整个软件开发流程和过程管理中,用户故事文档的质量对后续的研发和测试的质量起到保护和约束。产品经理在撰写用户故事文档时,主要精力花费在方案设计的合理性、全面性、流程性等核心部分,因产品经理经常面临多个需求下的多个用户故事文档的同时撰写,从而容易导致在文档规则和一些非功能性必填部分的遗漏和缺失,对用户故事文档的质量检查显得尤为重要。现有技术对软件开发流程中的用户故事文档采用人工抽检,存在检查速度慢、覆盖率低、容易出现误差、生成统计报告困难、成本较高的问题。
发明内容
本申请的主要目的为提供一种用户故事文档质量检查方法、装置、设备及存储介质,旨在解决现有技术对软件开发的用户故事文档采用人工抽检,存在检查速度慢、覆盖率低、容易出现误差、生成统计报告困难、成本较高的技术问题。
为了实现上述发明目的,本申请提出一种用户故事文档质量检查方法,所述方法包括:
获取用户故事文档质量检查请求,所述用户故事文档质量检查请求携带有文档标识;
根据所述文档标识读取Word格式文档,得到待检查的用户故事文档;
根据所述文档标识创建一个数据容器,得到所述文档标识对应的初始化的锚点数据容器;
基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果;
获取内容检查器,采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果,将所述目标内容检查结果存储到检查结果容器中;
获取表格检查器,采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将所述目标表格检查结果存储到所述检查结果容器中;
根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果。
进一步的,所述基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果的步骤,包括:
获取预设用户故事段落样式,采用遍历段落的方式和所述预设用户故事段落样式,根据所述待检查的用户故事文档进行用户故事锚点结果生成,得到所述目标锚点结果对应的待存储的用户故事锚点结果,根据所述待存储的用户故事锚点结果更新所述初始化的锚点数据容器的用户故事锚点数据;
获取关联系统段落样式,采用所述遍历段落的方式和所述关联系统段落样式,根据所述待检查的用户故事文档和所述待存储的用户故事锚点结果进行关联系统锚点结果生成,得到所述目标锚点结果对应的待存储的关联系统锚点结果,根据所述待存储的关联系统锚点结果更新所述初始化的锚点数据容器的关联系统锚点数据;
获取业务量变化关键字,采用所述遍历段落的方式和所述业务量变化关键字,根据所述待检查的用户故事文档、所述待存储的用户故事锚点结果和所述待存储的关联系统锚点结果进行业务量变化锚点结果生成,得到所述目标锚点结果对应的待存储的业务量变化锚点结果,根据所述待存储的业务量变化锚点结果更新所述初始化的锚点数据容器的业务量变化锚点数据;
获取表格标记,采用所述遍历段落的方式和所述表格标记,根据所述待检查的用户故事文档、所述待存储的用户故事锚点结果、所述待存储的关联系统锚点结果和所述待存储的业务量变化锚点结果进行表格锚点结果生成,得到所述目标锚点结果对应的待存储的表格锚点结果,根据所述待存储的表格锚点结果更新所述初始化的锚点数据容器;
获取图像标记,采用所述遍历段落的方式和所述图像标记,根据所述待检查的用户故事文档、所述待存储的用户故事锚点结果、所述待存储的关联系统锚点结果和所述待存储的业务量变化锚点结果进行图像锚点结果生成,得到所述目标锚点结果对应的待存储的图像锚点结果,根据所述待存储的图像锚点结果更新所述初始化的锚点数据容器;
将所述初始化的锚点数据容器作为所述目标锚点数据容器。
进一步的,所述采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果的步骤,包括:
调用所述内容检查器获取所述待检查的用户故事文档;
调用所述内容检查器从所述目标锚点数据容器中获取锚点数据,得到待分析的锚点数据;
调用所述内容检查器根据所述待分析的锚点数据,分别对所述待检查的用户故事文档进行每个段落的每行文本内容拼接,得到多个待分析的段落对象;
当所述待分析的段落对象为非空值和非空字符串时,当所述待分析的段落对象包含“无/不涉及”或不包含未写完标记时,调用所述内容检查器确定所述待分析的段落对象对应的内容检查结果为通过,否则,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为不通过;
当所述待分析的段落对象为空值或者空字符串时,当所述待分析的段落对象包含至少一张图像时,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为通过,否则,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为不通过;
调用所述内容检查器根据所有所述待分析的段落对象各自对应的所述内容检查结果,得到所述目标内容检查结果。
进一步的,所述采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果的步骤,包括:
调用所述表格检查器获取所述待检查的用户故事文档;
调用所述表格检查器从所述目标锚点数据容器获取表格锚点,得到待分析的表格锚点数据;
调用所述表格检查器根据所述待分析的表格锚点数据,从所述待检查的用户故事文档获取每行文本内容,得到多个待分析的表格行对象;
调用所述表格检查器分别对每个所述待分析的表格行对象进行待填写项获取,得到所述多个待分析的表格行对象中各个所述待分析的表格行对象各自对应的待检查的待填写项;
当所述待检查的待填写项为空值或者空字符串时,调用所述表格检查器确定所述待检查的待填写项对应的表格检查结果为不通过,否则,当所述待检查的待填写项为“是,无”字段或不包含未写完标记时,调用所述表格检查器确定所述待检查的待填写项对应的所述表格检查结果为通过,否则,调用所述表格检查器确定所述待检查的待填写项对应的所述表格检查结果为不通过;
调用所述表格检查器根据所有所述待检查的待填写项对应的所述表格检查结果,确定所述目标表格检查结果。
进一步的,所述根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果的步骤,包括:
采用逐项遍历的方式,根据所述检查结果容器创建用户故事表,得到多个待填充的用户故事工作表;
根据所述检查结果容器,对所述多个待填充的用户故事工作表进行检查结果填充,得到多个已填充的用户故事工作表;
分别对所述多个已填充的用户故事工作表中每个已填充的用户故事工作表进行汇总统计,得到多个待处理的统计结果工作表;
根据所述多个待处理的统计结果工作表,确定所述用户故事文档质量检查结果。
进一步的,所述根据所述多个待处理的统计结果工作表,确定所述用户故事文档质量检查结果的步骤,包括:
创建待处理的封面工作表;
在所述待处理的封面工作表中,对所述多个待处理的统计结果工作表进行用户故事粒度的统计分析,得到已统计的封面工作表;
根据所述多个待处理的统计结果工作表,在所述已统计的封面工作表中设置跳转链接,得到目标封面工作表;
分别在所述多个待处理的统计结果工作表的每个所述待处理的统计结果工作表中设置返回所述目标封面工作表的跳转链接,得到所述多个已填充的用户故事工作表中各个所述已填充的用户故事工作表各自对应的目标统计结果工作表;
将所述目标封面工作表和所有所述目标统计结果工作表放入同一个工作薄,得到所述用户故事文档质量检查结果。
进一步的,所述根据所述文档标识读取Word格式文档,得到待检查的用户故事文档的步骤,包括:
调用Python包的Win32com.client启动Word Application对象,根据所述文档标识从数据库中读取Word格式的文档,将读取的文档作为待检查的用户故事文档。
本申请还提出了一种用户故事文档质量检查装置,所述装置包括:
请求获取模块,用于获取用户故事文档质量检查请求,所述用户故事文档质量检查请求携带有文档标识;
文档读取模块,用于根据所述文档标识读取Word格式文档,得到待检查的用户故事文档;
数据容器创建模块,用于根据所述文档标识创建一个数据容器,得到所述文档标识对应的初始化的锚点数据容器;
文档结构动态解析模块,用于基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果;
内容检查模块,用于获取内容检查器,采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果,将所述目标内容检查结果存储到检查结果容器中;
表格待填写项检查模块,用于获取表格检查器,采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将所述目标表格检查结果存储到所述检查结果容器中;
统计分析模块,用于根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果。
本申请还提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的用户故事文档质量检查方法、装置、设备及存储介质,通过首先基于初始化的锚点数据容器,对待检查的用户故事文档进行文档结构的动态解析,得到文档标识对应的目标锚点数据容器,目标锚点数据容器中存储有文档标识对应的目标锚点结果,其次采用目标锚点数据容器和内容检查器,对待检查的用户故事文档进行内容检查,得到目标内容检查结果,将目标内容检查结果存储到检查结果容器中,然后采用目标锚点数据容器和表格检查器,对待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将目标表格检查结果存储到检查结果容器中,最后根据检查结果容器进行统计分析,得到用户故事文档质量检查结果,从而实现了自动化进行全文的文档质量检查,降低了文档质量检查的人工成本,提升了检查速度、检查覆盖率、检查准确率。
附图说明
图1为本申请一实施例的用户故事文档质量检查方法的流程示意图;
图2为本申请一实施例的用户故事文档质量检查装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
为了解决现有技术对软件开发的用户故事文档采用人工抽检,存在检查速度慢、覆盖率低、容易出现误差、生成统计报告困难、成本较高的技术问题,本申请提出了一种用户故事文档质量检查方法,所述方法适用于人工智能技术领域。所述用户故事文档质量检查方法,通过首先采用数据容器对用户故事文档进行文档结构的动态解析,然后基于数据容器进行内容检查、表格检查,并将内容检查结果和表格检查结果存储在检查结果容器中,最后根据检查结果容器进行统计分析,得到用户故事文档质量检查结果,从而实现了自动化进行全文的文档质量检查,降低了文档质量检查的人工成本,提升了检查速度、检查覆盖率、检查准确率。
参照图1,本申请实施例中提供一种用户故事文档质量检查方法,所述方法包括:
S1:获取用户故事文档质量检查请求,所述用户故事文档质量检查请求携带有文档标识;
S2:根据所述文档标识读取Word格式文档,得到待检查的用户故事文档;
S3:根据所述文档标识创建一个数据容器,得到所述文档标识对应的初始化的锚点数据容器;
S4:基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果;
S5:获取内容检查器,采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果,将所述目标内容检查结果存储到检查结果容器中;
S6:获取表格检查器,采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将所述目标表格检查结果存储到所述检查结果容器中;
S7:根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果。
本实施例通过首先基于初始化的锚点数据容器,对待检查的用户故事文档进行文档结构的动态解析,得到文档标识对应的目标锚点数据容器,目标锚点数据容器中存储有文档标识对应的目标锚点结果,其次采用目标锚点数据容器和内容检查器,对待检查的用户故事文档进行内容检查,得到目标内容检查结果,将目标内容检查结果存储到检查结果容器中,然后采用目标锚点数据容器和表格检查器,对待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将目标表格检查结果存储到检查结果容器中,最后根据检查结果容器进行统计分析,得到用户故事文档质量检查结果,从而实现了自动化进行全文的文档质量检查,降低了文档质量检查的人工成本,提升了检查速度、检查覆盖率、检查准确率。
对于S1,可以是用户输入的用户故事文档质量检查请求,也可以是第三方软件系统发送的用户故事文档质量检查请求。
用户故事文档质量检查请求,是指对用户故事文档进行质量检查的请求。
文档标识可以是文档名称、文档标识等唯一标识一份用户故事文档的标识。
用户故事文档,是描述用户故事的软件开发文档。用户故事,是在软件开发过程中被作为描述需求的一种表达形式。
对于S2,采用所述文档标识从数据库中读取Word格式的文档,将读取的文档作为待检查的用户故事文档。也就是说,待检查的用户故事文档的文档格式为Word格式。Word格式包括:.doc、.docx。
待检查的用户故事文档,也就是需要进行质量检查的用户故事文档。
对于S3,创建一个数据容器,将创建的数据容器作为所述文档标识对应的初始化的锚点数据容器。
初始化的锚点数据容器包括:用户故事锚点数据、关联系统锚点数据、业务量变化锚点数据、表格锚点数据、图像锚点数据。
对于S4,基于Pandas(基于NumPy的一种工具,该工具是为解决数据分析任务而创建的),对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点结果,并且在动态解析过程中将解析得到的目标锚点结果存储到所述初始化的锚点数据容器中;将所述初始化的锚点数据容器作为所述文档标识对应的目标锚点数据容器。
可以理解的是,在动态解析过程中将解析得到的目标锚点结果存储到所述初始化的锚点数据容器中采用的是边动态解析边存储的方式。
目标锚点结果,也就是锚点结果。每个锚点结果包括:一个锚点名称、一个开始位置数据和一个结束位置数据。
文档结构的动态解析包括但不限于:对用户故事锚点、关联系统锚点、业务量变化锚点、表格锚点和图像锚点进行解析。
对于S5,可以从数据库中获取内容检查器,可以获取用户输入的内容检查器,还可以获取第三方应用系统发送的内容检查器。
采用所述目标锚点数据容器中的目标锚点结果,对所述待检查的用户故事文档进行内容检查,得到所述待检查的用户故事文档对应的目标内容检查结果,在进行内容检查的过程中将所述目标内容检查结果存储到检查结果容器中。
可以理解的是,在进行内容检查的过程中将所述目标内容检查结果存储到检查结果容器中采用的是边内容检查边存储的方式。
内容检查器,是单层结构的数据检查器,用于按预设的内容检查规则进行数据检查,并输出内容检查结果。内容检查器的具体实现在此不做赘述。
内容检查包括但不限于:是否包含“无/不涉及”字段、是否包含未写完标记、是否包含空值、是否包含空字符串、是否包含图像。
对于S6,可以从数据库中获取表格检查器,可以获取用户输入的表格检查器,还可以获取第三方应用系统发送的表格检查器。表格检查器的具体实现在此不做赘述。
表格检查器,是单层结构的数据检查器,用于按预设的表格检查规则进行数据检查,并输出表格检查结果。表格检查器的具体实现在此不做赘述。
采用所述目标锚点数据容器中的目标锚点结果,对所述待检查的用户故事文档进行表格待填写项的检查,得到所述待检查的用户故事文档对应的目标表格检查结果,在进行表格待填写项的检查的过程中将所述目标表格检查结果存储到所述检查结果容器中。
可以理解的是,在进行表格待填写项的检查的过程中将所述目标表格检查结果存储到所述检查结果容器中采用的是边表格待填写项检查边存储的方式。
表格待填写项的检查,也就是待填写项的值是否包含“是,无”字段、是否包含未写完标记、是否包含空值、是否包含空字符串。
可以理解的是,步骤S5和步骤S6可以同步执行,也可以异步执行,在此不做限定。
对于S7,获取预设统计规则,采用Openpyxl(OpenPyXl是一个Python的模块,可以用来处理EXCEL文件)和所述预设统计规则,根据所述检查结果容器中的数据进行统计分析,将统计分析结果放入EXCEL(Microsoft Office EXCEL,也就是电子表格软件)文件中,将得到的EXCEL文件作为用户故事文档质量检查结果。
预设统计规则包括但不限于:统计项、统计算法,每个统计项对应一个统计算法。统计算法包括但不限于:计数、求和、求平均值。
可选的,所述根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果的步骤还包括:根据所述检查结果容器和所述目标锚点数据容器进行统计分析,得到所述用户故事文档质量检查结果。从而可以根据所述目标锚点数据容器中的用户故事锚点数据、关联系统锚点数据、业务量变化锚点数据、表格锚点数据和图像锚点数据确定用户故事文档质量检查结果中的锚点名称、锚点名称对应的开始位置数据和结束位置数据。从而有利于提高用户故事文档质量检查结果的可读性,提高了用户体验。
在一个实施例中,上述基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果的步骤,包括:
S41:获取预设用户故事段落样式,采用遍历段落的方式和所述预设用户故事段落样式,根据所述待检查的用户故事文档进行用户故事锚点结果生成,得到所述目标锚点结果对应的待存储的用户故事锚点结果,根据所述待存储的用户故事锚点结果更新所述初始化的锚点数据容器的用户故事锚点数据;
S42:获取关联系统段落样式,采用所述遍历段落的方式和所述关联系统段落样式,根据所述待检查的用户故事文档和所述待存储的用户故事锚点结果进行关联系统锚点结果生成,得到所述目标锚点结果对应的待存储的关联系统锚点结果,根据所述待存储的关联系统锚点结果更新所述初始化的锚点数据容器的关联系统锚点数据;
S43:获取业务量变化关键字,采用所述遍历段落的方式和所述业务量变化关键字,根据所述待检查的用户故事文档、所述待存储的用户故事锚点结果和所述待存储的关联系统锚点结果进行业务量变化锚点结果生成,得到所述目标锚点结果对应的待存储的业务量变化锚点结果,根据所述待存储的业务量变化锚点结果更新所述初始化的锚点数据容器的业务量变化锚点数据;
S44:获取表格标记,采用所述遍历段落的方式和所述表格标记,根据所述待检查的用户故事文档、所述待存储的用户故事锚点结果、所述待存储的关联系统锚点结果和所述待存储的业务量变化锚点结果进行表格锚点结果生成,得到所述目标锚点结果对应的待存储的表格锚点结果,根据所述待存储的表格锚点结果更新所述初始化的锚点数据容器;
S45:获取图像标记,采用所述遍历段落的方式和所述图像标记,根据所述待检查的用户故事文档、所述待存储的用户故事锚点结果、所述待存储的关联系统锚点结果和所述待存储的业务量变化锚点结果进行图像锚点结果生成,得到所述目标锚点结果对应的待存储的图像锚点结果,根据所述待存储的图像锚点结果更新所述初始化的锚点数据容器;
S46:将所述初始化的锚点数据容器作为所述目标锚点数据容器。
本实施例实现了基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,从而为后续的内容检查和表格待填写项的检查提供了快速定位的数据基础,有利于提升检查速度、检查覆盖率。
对于S41,可以从数据库中获取预设用户故事段落样式,可以获取用户输入的预设用户故事段落样式,还可以获取第三方应用系统发送的预设用户故事段落样式。
预设用户故事段落样式包括:一级段落的段落样式。
采用遍历段落的方式,从所述待检查的用户故事文档中获取每个段落的段落样式,当获取的段落样式是一级段落的段落样式时,将获取的段落的段落位置作为用户故事锚点结果的开始位置数据,将获取的段落的内容作为用户故事锚点结果的锚点名称,将生成的用户故事锚点结果作为所述目标锚点结果对应的待存储的用户故事锚点结果,在进行用户故事锚点结果生成的过程中根据所述待存储的用户故事锚点结果更新所述初始化的锚点数据容器的用户故事锚点数据。
当对所述待检查的用户故事文档遍历完成后,在所述初始化的锚点数据容器中,将用户故事锚点数据中开始位置数据相邻的两个锚点名称的后一个锚点名称对应的开始位置数据更新到前一个锚点名称对应的结束位置数据,获取所述待检查的用户故事文档的最后一段的位置数据,将获取的位置数据更新到用户故事锚点结果中开始位置数据在最后的锚点名称对应的结束位置数据。比如,锚点名称A、锚点名称B是用户故事锚点数据中开始位置数据相邻的两个锚点名称,锚点名称A的开始位置数据位于锚点名称B的开始位置数据前面,则将锚点名称B对应的开始位置数据更新到锚点名称A对应的结束位置数据,在此举例不做具体限定。又比如,锚点名称C的开始位置数据是所述待检查的用户故事文档中的最后一个开始位置数据,所述待检查的用户故事文档的最后一段的位置数据D1,则将最后一段的位置数据D1更新到锚点名称C对应的结束位置数据,在此举例不做具体限定。
可以理解的是,在进行用户故事锚点结果生成的过程中根据所述待存储的用户故事锚点结果更新所述初始化的锚点数据容器的用户故事锚点数据采用的是边生成用户故事锚点结果边存储的方式。
对于S42,可以从数据库中获取关联系统段落样式,可以获取用户输入的关联系统段落样式,还可以获取第三方应用系统发送的关联系统段落样式。
关联系统段落样式包括:二级段落的段落样式。
采用遍历段落的方式,从所述待检查的用户故事文档中,获取所述待存储的用户故事锚点结果对应的段落以外的每个段落的段落样式,当获取的段落样式是二级段落的段落样式时,将获取的段落的段落位置作为关联系统锚点结果的位置数据,将获取的段落的内容作为关联系统锚点结果的锚点名称,将生成的关联系统锚点结果作为所述目标锚点结果对应的待存储的关联系统锚点结果,在将生成关联系统锚点结果的过程中根据所述待存储的关联系统锚点结果更新所述初始化的锚点数据容器的关联系统锚点数据。
可以理解的是,在将生成关联系统锚点结果的过程中根据所述待存储的关联系统锚点结果更新所述初始化的锚点数据容器的关联系统锚点数据采用的是边生成关联系统锚点结果边存储的方式。
对于S43,可以从数据库中获取业务量变化关键字,可以获取用户输入的业务量变化关键字,还可以获取第三方应用系统发送的业务量变化关键字。
将所述待检查的用户故事文档中所述待存储的用户故事锚点结果和所述待存储的关联系统锚点结果对应的段落以外的段落,作为待识别业务量的段落集合;采用遍历段落的方式,从所述待检查的用户故事文档中获取待识别业务量的段落集合对应的各个段落的文本数据,将所述业务量变化关键字在获取的文本数据中进行查找,当查找成功时,将查找成功的文本数据对应的段落位置作为业务量变化锚点结果的开始位置数据,将查找成功的文本数据作为业务量变化锚点结果的锚点名称;将生成的业务量变化锚点结果作为所述目标锚点结果对应的待存储的业务量变化锚点结果;在生成业务量变化锚点结果的过程中根据所述待存储的业务量变化锚点结果更新所述初始化的锚点数据容器的业务量变化锚点数据。
可以理解的是,在生成业务量变化锚点结果的过程中根据所述待存储的业务量变化锚点结果更新所述初始化的锚点数据容器的业务量变化锚点数据采用的是边生成业务量变化锚点结果边存储的方式。
业务量变化关键字也就是用户故事文档中用于标识业务量的字段。
对于S44,可以从数据库中获取表格标记,可以获取用户输入的表格标记,还可以获取第三方应用系统发送的表格标记。
表格标记,也就是Word格式的文档中表格的标记。
将所述待检查的用户故事文档中所述待存储的用户故事锚点结果、所述待存储的关联系统锚点结果和所述待存储的业务量变化锚点结果对应的段落以外的段落,作为待识别表格的段落集合;采用遍历段落的方式,从所述待检查的用户故事文档中获取待识别表格的段落集合对应的各个段落中的标记,将所述表格标记在获取的标记中进行查找,当查找成功时,将查找成功的段落标记对应的段落位置作为表格锚点结果的开始位置数据;在生成表格锚点结果的过程中根据所述待存储的表格锚点结果更新所述初始化的锚点数据容器的表格锚点数据。
可以理解的是,在生成表格锚点结果的过程中根据所述待存储的表格锚点结果更新所述初始化的锚点数据容器的表格锚点数据采用的是边生成表格锚点结果边存储的方式。
对于S45,可以从数据库中获取图像标记,可以获取用户输入的图像标记,还可以获取第三方应用系统发送的图像标记。
图像标记,也就是Word格式的文档中图像的标记。
将所述待检查的用户故事文档中所述待存储的用户故事锚点结果、所述待存储的关联系统锚点结果和所述待存储的业务量变化锚点结果对应的段落以外的段落,作为待识别图像的段落集合;采用遍历段落的方式,从所述待检查的用户故事文档中获取待识别图像的段落集合对应的各个段落中的标记,将所述图像标记在获取的标记中进行查找,当查找成功时,将查找成功的标记对应的段落位置作为图像锚点结果的开始位置数据;在生成图像锚点结果的过程中根据所述待存储的图像锚点结果更新所述初始化的锚点数据容器的图像锚点数据。
可以理解的是,在生成图像锚点结果的过程中根据所述待存储的图像锚点结果更新所述初始化的锚点数据容器的图像锚点数据采用的是边生成图像锚点结果边存储的方式。
对于S46,将更新了用户故事锚点数据、关联系统锚点数据、业务量变化锚点数据、表格锚点数据、图像锚点数据的所述初始化的锚点数据容器作为所述目标锚点数据容器。
在一个实施例中,上述采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果的步骤,包括:
S51:调用所述内容检查器获取所述待检查的用户故事文档;
S52:调用所述内容检查器从所述目标锚点数据容器中获取锚点数据,得到待分析的锚点数据;
S53:调用所述内容检查器根据所述待分析的锚点数据,分别对所述待检查的用户故事文档进行每个段落的每行文本内容拼接,得到多个待分析的段落对象;
S54:当所述待分析的段落对象为非空值和非空字符串时,当所述待分析的段落对象包含“无/不涉及”或不包含未写完标记时,调用所述内容检查器确定所述待分析的段落对象对应的内容检查结果为通过,否则,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为不通过;
S55:当所述待分析的段落对象为空值或者空字符串时,当所述待分析的段落对象包含至少一张图像时,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为通过,否则,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为不通过;
S56:调用所述内容检查器根据所有所述待分析的段落对象各自对应的所述内容检查结果,得到所述目标内容检查结果。
本实施例实现了采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,从而可以快速进行数据定位,自动化实现了内容检查,提升了检查速度、检查覆盖率、检查准确率。
对于S51,调动所述内容检查器根据所述文档标识读取Word格式的文档,将读取的文档作为待检查的用户故事文档。
对于S52,调用所述内容检查器,从所述目标锚点数据容器获取锚点数据,将获取的锚点数据作为待分析的锚点数据。
对于S53,调用所述内容检查器,将所述待检查的用户故事文档中所述待存储的用户故事锚点结果和所述待存储的关联系统锚点结果对应的段落以外的段落,作为待检查的段落集合;分别对所述待检查的用户故事文档中待检查的段落集合中的每个段落的对应的各行文本内容进行拼接,得到待检查的段落集合中各个段落各自对应的待分析的段落对象。也就是说,待分析的段落对象是所述待检查的用户故事文档中一个段落的文本内容。
对于S54,当所述待分析的段落对象为非空值和非空字符串时,和,所述待分析的段落对象包含“无/不涉及”或不包含未写完标记时,调用所述内容检查器确定所述待分析的段落对象对应的内容检查结果为通过;当所述待分析的段落对象为非空值和非空字符串,和,所述待分析的段落对象不包含“无/不涉及”和包含未写完标记时,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为不通过。
未写完标记包括但不限于:TODO。
对于S55,当所述待分析的段落对象为空值或者空字符串,和,所述待分析的段落对象包含至少一张图像时,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为通过;当所述待分析的段落对象为空值或者空字符串,和,所述待分析的段落对象不包含图像时,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为不通过。
对于S56,调用所述内容检查器,将所有所述待分析的段落对象对应的所述内容检查结果作为所述目标内容检查结果。
在一个实施例中,上述采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果的步骤,包括:
S61:调用所述表格检查器获取所述待检查的用户故事文档;
S62:调用所述表格检查器从所述目标锚点数据容器获取表格锚点,得到待分析的表格锚点数据;
S63:调用所述表格检查器根据所述待分析的表格锚点数据,从所述待检查的用户故事文档获取每行文本内容,得到多个待分析的表格行对象;
S64:调用所述表格检查器分别对每个所述待分析的表格行对象进行待填写项获取,得到所述多个待分析的表格行对象中各个所述待分析的表格行对象各自对应的待检查的待填写项;
S65:当所述待检查的待填写项为空值或者空字符串时,调用所述表格检查器确定所述待检查的待填写项对应的表格检查结果为不通过,否则,当所述待检查的待填写项为“是,无”字段或不包含未写完标记时,调用所述表格检查器确定所述待检查的待填写项对应的所述表格检查结果为通过,否则,调用所述表格检查器确定所述待检查的待填写项对应的所述表格检查结果为不通过;
S66:调用所述表格检查器根据所有所述待检查的待填写项对应的所述表格检查结果,确定所述目标表格检查结果。
本实施例实现了采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,从而可以快速进行数据定位,自动化实现了表格待填写项的检查,提升了检查速度、检查覆盖率、检查准确率。
对于S61,调用所述表格检查器,根据所述文档标识读取Word格式的文档,将读取的文档作为待检查的用户故事文档。
对于S62,调用所述表格检查器,从所述目标锚点数据容器获取表格锚点,将获取的锚点作为所述待分析的表格锚点数据。
对于S63,调用所述表格检查器,根据所述待分析的表格锚点数据从所述待检查的用户故事文档中获取表格,得到多个表格对象;将每个表格对象的每行文本作为一个待分析的表格行对象。
对于S64,调用所述表格检查器,从每个待分析的表格行对象中获取待填写项,将获取的待填写项作为该待分析的表格行对象对应的待检查的待填写项。
对于S65,当所述待检查的待填写项为空值或者空字符串时,调用所述表格检查器确定所述待检查的待填写项对应的表格检查结果为不通过;当所述待检查的待填写项为非空值和非空字符串,和,所述待检查的待填写项为“是,无”字段或不包含未写完标记时,调用所述表格检查器确定所述待检查的待填写项对应的所述表格检查结果为通过;当所述待检查的待填写项为非空值和非空字符串,和,所述待检查的待填写项不为“是,无”字段和包含未写完标记时,调用所述表格检查器确定所述待检查的待填写项对应的所述表格检查结果为不通过。
对于S66,调用所述表格检查器将所有所述待检查的待填写项对应的所述表格检查结果作为所述目标表格检查结果。
在一个实施例中,上述根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果的步骤,包括:
S71:采用逐项遍历的方式,根据所述检查结果容器创建用户故事表,得到多个待填充的用户故事工作表;
S72:根据所述检查结果容器,对所述多个待填充的用户故事工作表进行检查结果填充,得到多个已填充的用户故事工作表;
S73:分别对所述多个已填充的用户故事工作表中每个已填充的用户故事工作表进行汇总统计,得到多个待处理的统计结果工作表;
S74:根据所述多个待处理的统计结果工作表,确定所述用户故事文档质量检查结果。
本实施例实现了根据所述检查结果容器进行统计分析,实现了自动化进行检查结果的统计分析。
对于S71,采用逐项遍历的方式,从所述检查结果容器中提取一个用户故事对应的锚点名称,作为待处理的用户故事锚点名称;判断所述待处理的用户故事锚点名称是否已有用户故事工作表;当所述待处理的用户故事锚点名称没有用户故事工作表时,根据所述待处理的用户故事锚点名称创建一个用户故事工作表,将创建的用户故事工作表作为待填充的用户故事工作表,将所述待处理的用户故事锚点名称作为待填充的用户故事工作表的表名。
待填充的用户故事工作表,也就是EXCEL的工作表。
对于S72,从所述检查结果容器中提取一个用户故事对应的锚点名称对应的目标内容检查结果和目标表格检查结果,作为待处理的用户故事检查结果;将待处理的用户故事检查结果的每项内容填入该用户故事对应的锚点名称对应的所述待填充的用户故事工作表中,填充完成得到所述已填充的用户故事工作表;重复执行所述从所述检查结果容器中提取一个用户故事对应的锚点名称对应的目标内容检查结果和目标表格检查结果,作为待处理的用户故事检查结果的步骤,直至完成所述检查结果容器的遍历。也就是说,每个待填充的用户故事工作表对应一个已填充的用户故事工作表。
对于S73,获取预设统计规则,采用预设统计规则分别对所述多个已填充的用户故事工作表中每个已填充的用户故事工作表进行汇总统计,得到多个待处理的统计结果工作表。也就是说,每个已填充的用户故事工作表对应一个待处理的统计结果工作表。
对于S74,将所述多个待处理的统计结果工作表中所有的待处理的统计结果工作表放在一个EXCEL工作薄中,将该工作薄作为所述用户故事文档质量检查结果。
在一个实施例中,上述根据所述多个待处理的统计结果工作表,确定所述用户故事文档质量检查结果的步骤,包括:
S741:创建待处理的封面工作表;
S742:在所述待处理的封面工作表中,对所述多个待处理的统计结果工作表进行用户故事粒度的统计分析,得到已统计的封面工作表;
S743:根据所述多个待处理的统计结果工作表,在所述已统计的封面工作表中设置跳转链接,得到目标封面工作表;
S744:分别在所述多个待处理的统计结果工作表的每个所述待处理的统计结果工作表中设置返回所述目标封面工作表的跳转链接,得到所述多个已填充的用户故事工作表中各个所述已填充的用户故事工作表各自对应的目标统计结果工作表;
S745:将所述目标封面工作表和所有所述目标统计结果工作表放入同一个工作薄,得到所述用户故事文档质量检查结果。
本实施例实现了将输出待封面和跳转链接的用户故事文档质量检查结果,从而有利于用户快速阅读用户故事文档质量检查结果,提高了用户体验。
对于S741,创建一个工作表,将创建的工作表命名为封面,将该工作表作为待处理的封面工作表。
对于S742,获取预设的汇总统计规则,在所述待处理的封面工作表中,采用预设的汇总统计规则,对所述多个待处理的统计结果工作表按用户故事粒度进行统计分析,将完成统计分析的待处理的封面工作表作为已统计的封面工作表。
预设的汇总统计规则包括但不限于:统计项、统计算法,每个统计项对应一个统计算法,统计算法包括但不限于:计数、求和、求平均值。
对于S743,在所述已统计的封面工作表中的每个用户故事的锚点名称(也就是用户故事名称)上设置EXCEL超级链接,当该EXCEL超级链接被点击时将跳转到表名与该EXCEL超级链接对应的用户故事的锚点名称相同的所述待处理的统计结果工作表中。
对于S744,分别在所述多个待处理的统计结果工作表的每个所述待处理的统计结果工作表中设置一个EXCEL超级链接,当该EXCEL超级链接被点击时将跳转到所述目标封面工作表中,将设置完EXCEL超级链接的所述待处理的统计结果工作表作为所述目标统计结果工作表。
对于S745,将所述目标封面工作表和所有所述目标统计结果工作表放入同一个EXCEL的工作薄中,将该工作薄作为所述用户故事文档质量检查结果。
在一个实施例中,上述根据所述文档标识读取Word格式文档,得到待检查的用户故事文档的步骤,包括:
调用Python包的Win32com.client启动Word Application对象,根据所述文档标识从数据库中读取Word格式的文档,将读取的文档作为待检查的用户故事文档。
本实施例实现了调用Python包的Win32com.client启动Word Application对象根据所述文档标识读取Word格式文档,为后续进行文档质量检查提供了基础。
Win32com.client是一个方法,用于启动一个windows程序。
Python包,是一个有层次的文件目录结构,它定义了由n个模块或n个子包组成的Python应用程序执行环境。
Word Application对象,也就是Microsoft Office Word应用程序。
参照图2,本申请提出了一种用户故事文档质量检查装置,所述装置包括:
请求获取模块100,用于获取用户故事文档质量检查请求,所述用户故事文档质量检查请求携带有文档标识;
文档读取模块200,用于根据所述文档标识读取Word格式文档,得到待检查的用户故事文档;
数据容器创建模块300,用于根据所述文档标识创建一个数据容器,得到所述文档标识对应的初始化的锚点数据容器;
文档结构动态解析模块400,用于基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果;
内容检查模块500,用于获取内容检查器,采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果,将所述目标内容检查结果存储到检查结果容器中;
表格待填写项检查模块600,用于获取表格检查器,采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将所述目标表格检查结果存储到所述检查结果容器中;
统计分析模块700,用于根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果。
本实施例通过首先基于初始化的锚点数据容器,对待检查的用户故事文档进行文档结构的动态解析,得到文档标识对应的目标锚点数据容器,目标锚点数据容器中存储有文档标识对应的目标锚点结果,其次采用目标锚点数据容器和内容检查器,对待检查的用户故事文档进行内容检查,得到目标内容检查结果,将目标内容检查结果存储到检查结果容器中,然后采用目标锚点数据容器和表格检查器,对待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将目标表格检查结果存储到检查结果容器中,最后根据检查结果容器进行统计分析,得到用户故事文档质量检查结果,从而实现了自动化进行全文的文档质量检查,降低了文档质量检查的人工成本,提升了检查速度、检查覆盖率、检查准确率。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于储存用户故事文档质量检查方法等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用户故事文档质量检查方法。所述用户故事文档质量检查方法,包括:获取用户故事文档质量检查请求,所述用户故事文档质量检查请求携带有文档标识;根据所述文档标识读取Word格式文档,得到待检查的用户故事文档;根据所述文档标识创建一个数据容器,得到所述文档标识对应的初始化的锚点数据容器;基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果;获取内容检查器,采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果,将所述目标内容检查结果存储到检查结果容器中;获取表格检查器,采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将所述目标表格检查结果存储到所述检查结果容器中;根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果。
本实施例通过首先基于初始化的锚点数据容器,对待检查的用户故事文档进行文档结构的动态解析,得到文档标识对应的目标锚点数据容器,目标锚点数据容器中存储有文档标识对应的目标锚点结果,其次采用目标锚点数据容器和内容检查器,对待检查的用户故事文档进行内容检查,得到目标内容检查结果,将目标内容检查结果存储到检查结果容器中,然后采用目标锚点数据容器和表格检查器,对待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将目标表格检查结果存储到检查结果容器中,最后根据检查结果容器进行统计分析,得到用户故事文档质量检查结果,从而实现了自动化进行全文的文档质量检查,降低了文档质量检查的人工成本,提升了检查速度、检查覆盖率、检查准确率。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种用户故事文档质量检查方法,包括步骤:获取用户故事文档质量检查请求,所述用户故事文档质量检查请求携带有文档标识;根据所述文档标识读取Word格式文档,得到待检查的用户故事文档;根据所述文档标识创建一个数据容器,得到所述文档标识对应的初始化的锚点数据容器;基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果;获取内容检查器,采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果,将所述目标内容检查结果存储到检查结果容器中;获取表格检查器,采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将所述目标表格检查结果存储到所述检查结果容器中;根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果。
上述执行的用户故事文档质量检查方法,通过首先基于初始化的锚点数据容器,对待检查的用户故事文档进行文档结构的动态解析,得到文档标识对应的目标锚点数据容器,目标锚点数据容器中存储有文档标识对应的目标锚点结果,其次采用目标锚点数据容器和内容检查器,对待检查的用户故事文档进行内容检查,得到目标内容检查结果,将目标内容检查结果存储到检查结果容器中,然后采用目标锚点数据容器和表格检查器,对待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将目标表格检查结果存储到检查结果容器中,最后根据检查结果容器进行统计分析,得到用户故事文档质量检查结果,从而实现了自动化进行全文的文档质量检查,降低了文档质量检查的人工成本,提升了检查速度、检查覆盖率、检查准确率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (9)
1.一种用户故事文档质量检查方法,其特征在于,所述方法包括:
获取用户故事文档质量检查请求,所述用户故事文档质量检查请求携带有文档标识;
根据所述文档标识读取Word格式文档,得到待检查的用户故事文档;
根据所述文档标识创建一个数据容器,得到所述文档标识对应的初始化的锚点数据容器;
基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果;
获取内容检查器,采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果,将所述目标内容检查结果存储到检查结果容器中;
获取表格检查器,采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将所述目标表格检查结果存储到所述检查结果容器中;
根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果;
所述基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果的步骤,包括:
获取预设用户故事段落样式,采用遍历段落的方式和所述预设用户故事段落样式,根据所述待检查的用户故事文档进行用户故事锚点结果生成,得到所述目标锚点结果对应的待存储的用户故事锚点结果,根据所述待存储的用户故事锚点结果更新所述初始化的锚点数据容器的用户故事锚点数据;
获取关联系统段落样式,采用所述遍历段落的方式和所述关联系统段落样式,根据所述待检查的用户故事文档和所述待存储的用户故事锚点结果进行关联系统锚点结果生成,得到所述目标锚点结果对应的待存储的关联系统锚点结果,根据所述待存储的关联系统锚点结果更新所述初始化的锚点数据容器的关联系统锚点数据;
获取业务量变化关键字,采用所述遍历段落的方式和所述业务量变化关键字,根据所述待检查的用户故事文档、所述待存储的用户故事锚点结果和所述待存储的关联系统锚点结果进行业务量变化锚点结果生成,得到所述目标锚点结果对应的待存储的业务量变化锚点结果,根据所述待存储的业务量变化锚点结果更新所述初始化的锚点数据容器的业务量变化锚点数据;
获取表格标记,采用所述遍历段落的方式和所述表格标记,根据所述待检查的用户故事文档、所述待存储的用户故事锚点结果、所述待存储的关联系统锚点结果和所述待存储的业务量变化锚点结果进行表格锚点结果生成,得到所述目标锚点结果对应的待存储的表格锚点结果,根据所述待存储的表格锚点结果更新所述初始化的锚点数据容器;
获取图像标记,采用所述遍历段落的方式和所述图像标记,根据所述待检查的用户故事文档、所述待存储的用户故事锚点结果、所述待存储的关联系统锚点结果和所述待存储的业务量变化锚点结果进行图像锚点结果生成,得到所述目标锚点结果对应的待存储的图像锚点结果,根据所述待存储的图像锚点结果更新所述初始化的锚点数据容器;
将所述初始化的锚点数据容器作为所述目标锚点数据容器。
2.根据权利要求1所述的用户故事文档质量检查方法,其特征在于,所述采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果的步骤,包括:
调用所述内容检查器获取所述待检查的用户故事文档;
调用所述内容检查器从所述目标锚点数据容器中获取锚点数据,得到待分析的锚点数据;
调用所述内容检查器根据所述待分析的锚点数据,分别对所述待检查的用户故事文档进行每个段落的每行文本内容拼接,得到多个待分析的段落对象;
当所述待分析的段落对象为非空值和非空字符串时,当所述待分析的段落对象包含“无/不涉及”或不包含未写完标记时,调用所述内容检查器确定所述待分析的段落对象对应的内容检查结果为通过,否则,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为不通过;
当所述待分析的段落对象为空值或者空字符串时,当所述待分析的段落对象包含至少一张图像时,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为通过,否则,调用所述内容检查器确定所述待分析的段落对象对应的所述内容检查结果为不通过;
调用所述内容检查器根据所有所述待分析的段落对象各自对应的所述内容检查结果,得到所述目标内容检查结果。
3.根据权利要求1所述的用户故事文档质量检查方法,其特征在于,所述采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果的步骤,包括:
调用所述表格检查器获取所述待检查的用户故事文档;
调用所述表格检查器从所述目标锚点数据容器获取表格锚点,得到待分析的表格锚点数据;
调用所述表格检查器根据所述待分析的表格锚点数据,从所述待检查的用户故事文档获取每行文本内容,得到多个待分析的表格行对象;
调用所述表格检查器分别对每个所述待分析的表格行对象进行待填写项获取,得到所述多个待分析的表格行对象中各个所述待分析的表格行对象各自对应的待检查的待填写项;
当所述待检查的待填写项为空值或者空字符串时,调用所述表格检查器确定所述待检查的待填写项对应的表格检查结果为不通过,否则,当所述待检查的待填写项为“是,无”字段或不包含未写完标记时,调用所述表格检查器确定所述待检查的待填写项对应的所述表格检查结果为通过,否则,调用所述表格检查器确定所述待检查的待填写项对应的所述表格检查结果为不通过;
调用所述表格检查器根据所有所述待检查的待填写项对应的所述表格检查结果,确定所述目标表格检查结果。
4.根据权利要求1所述的用户故事文档质量检查方法,其特征在于,所述根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果的步骤,包括:
采用逐项遍历的方式,根据所述检查结果容器创建用户故事表,得到多个待填充的用户故事工作表;
根据所述检查结果容器,对所述多个待填充的用户故事工作表进行检查结果填充,得到多个已填充的用户故事工作表;
分别对所述多个已填充的用户故事工作表中每个已填充的用户故事工作表进行汇总统计,得到多个待处理的统计结果工作表;
根据所述多个待处理的统计结果工作表,确定所述用户故事文档质量检查结果。
5.根据权利要求4所述的用户故事文档质量检查方法,其特征在于,所述根据所述多个待处理的统计结果工作表,确定所述用户故事文档质量检查结果的步骤,包括:
创建待处理的封面工作表;
在所述待处理的封面工作表中,对所述多个待处理的统计结果工作表进行用户故事粒度的统计分析,得到已统计的封面工作表;
根据所述多个待处理的统计结果工作表,在所述已统计的封面工作表中设置跳转链接,得到目标封面工作表;
分别在所述多个待处理的统计结果工作表的每个所述待处理的统计结果工作表中设置返回所述目标封面工作表的跳转链接,得到所述多个已填充的用户故事工作表中各个所述已填充的用户故事工作表各自对应的目标统计结果工作表;
将所述目标封面工作表和所有所述目标统计结果工作表放入同一个工作薄,得到所述用户故事文档质量检查结果。
6.根据权利要求1所述的用户故事文档质量检查方法,其特征在于,所述根据所述文档标识读取Word格式文档,得到待检查的用户故事文档的步骤,包括:
调用Python包的Win32com.client启动Word Application对象,根据所述文档标识从数据库中读取Word格式的文档,将读取的文档作为待检查的用户故事文档。
7.一种用户故事文档质量检查装置,其特征在于,所述用户故事文档质量检查装置用于执行权利要求1-6任一项所述用户故事文档质量检查方法,所述装置包括:
请求获取模块,用于获取用户故事文档质量检查请求,所述用户故事文档质量检查请求携带有文档标识;
文档读取模块,用于根据所述文档标识读取Word格式文档,得到待检查的用户故事文档;
数据容器创建模块,用于根据所述文档标识创建一个数据容器,得到所述文档标识对应的初始化的锚点数据容器;
文档结构动态解析模块,用于基于所述初始化的锚点数据容器,对所述待检查的用户故事文档进行文档结构的动态解析,得到所述文档标识对应的目标锚点数据容器,所述目标锚点数据容器中存储有所述文档标识对应的目标锚点结果;
内容检查模块,用于获取内容检查器,采用所述目标锚点数据容器和所述内容检查器,对所述待检查的用户故事文档进行内容检查,得到目标内容检查结果,将所述目标内容检查结果存储到检查结果容器中;
表格待填写项检查模块,用于获取表格检查器,采用所述目标锚点数据容器和所述表格检查器,对所述待检查的用户故事文档进行表格待填写项的检查,得到目标表格检查结果,将所述目标表格检查结果存储到所述检查结果容器中;
统计分析模块,用于根据所述检查结果容器进行统计分析,得到用户故事文档质量检查结果。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110426477.6A CN113033149B (zh) | 2021-04-20 | 2021-04-20 | 用户故事文档质量检查方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110426477.6A CN113033149B (zh) | 2021-04-20 | 2021-04-20 | 用户故事文档质量检查方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113033149A CN113033149A (zh) | 2021-06-25 |
CN113033149B true CN113033149B (zh) | 2023-12-19 |
Family
ID=76457089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110426477.6A Active CN113033149B (zh) | 2021-04-20 | 2021-04-20 | 用户故事文档质量检查方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113033149B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1607524A (zh) * | 2003-10-15 | 2005-04-20 | 佳能株式会社 | 包含可变数据的文档或版面的选择性预览和校对 |
CN101706771A (zh) * | 2009-11-06 | 2010-05-12 | 北京理工大学 | 一种基于模板的针对Word文档的智能格式检查方法 |
CN112559935A (zh) * | 2020-12-15 | 2021-03-26 | 北京三快在线科技有限公司 | 一种创建页面的方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7788253B2 (en) * | 2006-12-28 | 2010-08-31 | International Business Machines Corporation | Global anchor text processing |
US9817804B2 (en) * | 2013-09-12 | 2017-11-14 | Wix.Com Ltd. | System for comparison and merging of versions in edited websites and interactive applications |
-
2021
- 2021-04-20 CN CN202110426477.6A patent/CN113033149B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1607524A (zh) * | 2003-10-15 | 2005-04-20 | 佳能株式会社 | 包含可变数据的文档或版面的选择性预览和校对 |
CN101706771A (zh) * | 2009-11-06 | 2010-05-12 | 北京理工大学 | 一种基于模板的针对Word文档的智能格式检查方法 |
CN112559935A (zh) * | 2020-12-15 | 2021-03-26 | 北京三快在线科技有限公司 | 一种创建页面的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113033149A (zh) | 2021-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804159B (zh) | javascript模块加载方法及其预处理方法、装置和计算机设备 | |
CN108563768B (zh) | 不同数据模型的数据转换方法、装置、设备及存储介质 | |
CN111176996A (zh) | 测试用例生成方法、装置、计算机设备及存储介质 | |
CN111563051A (zh) | 基于爬虫的数据核验方法、装置、计算机设备及存储介质 | |
CN113282498B (zh) | 测试用例的生成方法、装置、设备及存储介质 | |
CN110955608A (zh) | 测试数据处理方法、装置、计算机设备和存储介质 | |
CN112363953A (zh) | 基于爬虫技术和规则引擎的接口测试用例生成方法及系统 | |
WO2022142635A1 (zh) | 业务信息录入方法、装置、服务器和存储介质 | |
CN112417338A (zh) | 一种页面适配方法、系统及设备 | |
CN111126058B (zh) | 文本信息自动抽取方法、装置、可读存储介质和电子设备 | |
CN114003692A (zh) | 合同文本信息的处理方法、装置、计算机设备及存储介质 | |
CN113987320B (zh) | 基于智能页面解析的实时资讯爬虫方法、装置及设备 | |
CN113505078B (zh) | 配置文件更新方法、装置、设备及存储介质 | |
CN111324375A (zh) | 代码管理方法、装置、计算机设备和存储介质 | |
US8656267B2 (en) | Method of approximate document generation | |
CN113033149B (zh) | 用户故事文档质量检查方法、装置、设备及存储介质 | |
CN113918460A (zh) | 页面测试方法、装置、设备和介质 | |
CN110321529B (zh) | 框架文字显示方法、装置、计算机设备及存储介质 | |
WO2023065638A1 (zh) | 一种数据检索方法、装置、电子设备以及存储介质 | |
CN113779218B (zh) | 问答对构建方法、装置、计算机设备和存储介质 | |
CN114968346A (zh) | Ddl脚本的字段注释检测方法、装置、设备及存储介质 | |
CN114417812A (zh) | 文本核对方法、装置、设备及存储介质 | |
CN114169331A (zh) | 地址解析方法、装置、计算机设备和存储介质 | |
CN113448982A (zh) | Ddl语句的解析方法、装置、计算机设备及存储介质 | |
CN113297837A (zh) | Pdf表单信息提取方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |