CN111880838B - 一种基于模板匹配技术的数据解析方法 - Google Patents

一种基于模板匹配技术的数据解析方法 Download PDF

Info

Publication number
CN111880838B
CN111880838B CN202010767177.XA CN202010767177A CN111880838B CN 111880838 B CN111880838 B CN 111880838B CN 202010767177 A CN202010767177 A CN 202010767177A CN 111880838 B CN111880838 B CN 111880838B
Authority
CN
China
Prior art keywords
data
parsing
template matching
type
software
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010767177.XA
Other languages
English (en)
Other versions
CN111880838A (zh
Inventor
程胜
王楠
万金晶
谢金龙
杜阳
韩冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Shenzhou Aerospace Software Technology Co ltd
Original Assignee
Beijing Shenzhou Aerospace Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Shenzhou Aerospace Software Technology Co ltd filed Critical Beijing Shenzhou Aerospace Software Technology Co ltd
Priority to CN202010767177.XA priority Critical patent/CN111880838B/zh
Publication of CN111880838A publication Critical patent/CN111880838A/zh
Application granted granted Critical
Publication of CN111880838B publication Critical patent/CN111880838B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Stored Programmes (AREA)

Abstract

本发明公开的本基于模板匹配技术的数据解析方法,涉及软件工程领域,通过实时检测软件配置管理库是否发生数据的出库操作或入库操作,若是,则利用模板匹配技术,获取数据的类型,根据数据的类型,解析该数据,其中,该数据包括软件研发阶段产生的过程数据和质量数据,提高了数据统计分析的自动化程度及适用性。

Description

一种基于模板匹配技术的数据解析方法
技术领域
本发明涉及软件工程领域,具体涉及一种基于模板匹配技术的数据解析方法。
背景技术
Microsoft Excel为微软公司为使用Windows和Apple Macintosh操作系统的编写的一款电子表格软件,常被归类到办公软件的类别中,作为办公室级别的数据分析处理软件,必然会包括一些基本的数据统计分析功能,但是随着数据分析要求的提高,在数据统计分析方面的缺陷也将逐步表现出来,因此,Microsoft Excel只适合于处理简单的数据分析问题。从2010版本的Microsoft Excel开始,增加了数据分析工具包,但该数据工具包不能直接使用,需要使用者手动加载后才能显示菜单栏中。
Minitab软件是专注于质量管理的统计分析软件,最初由美国宾夕法尼亚州立大学开发。Minitab软件的特点是简单易懂,很方便进行实验设计及质量控制,因此,被广泛应用于世界各国的制造企业。但该软件费用较高、升级频繁,数据统计分析功能不强。
发明内容
为解决现有技术的不足,本发明实施例提供了一种基于模板匹配技术的数据解析方法,该方法包括以下步骤:
实时检测软件配置管理库是否发生数据的出库操作或入库操作;
若是,则利用模板匹配技术,得到所述数据的类型;
根据所述数据的类型,解析所述数据,其中,所述数据包括软件研发阶段产生的过程数据和质量数据。
优选地,根据所述数据的类型,解析所述数据包括:
若所述数据的类型为文档,则根据所述数据的文档结构,得到所述数据对应的具体内容。
优选地,根据所述数据的类型,解析所述数据还包括:
若所述数据的类型为代码,则获取所述数据对应的源代码的行数及注释率,得到代码类数据。
优选地,根据所述数据的类型,解析所述数据还包括:
若所述数据为第三方工具生成的,则获取所述数据对应的目标码覆盖率及测试用例个数,得到第三方工具生成的数据,其中,目标码覆盖率为程序中目标代码被测试执行的比例。
优选地,在解析所述数据之后,所述方法还包括:
识别不能获取的数据。
优选地,在解析所述数据之后,所述方法还包括:
根据所述数据的类型,对数据进行分类并存储,方便后续以数据类型对数据进行检索。
优选地,在解析所述数据之后,所述方法还包括:
根据所述数据对应的项目名称,对数据进行分类并存储,方便后续以项目名称对数据进行检索。
优选地,在解析所述数据之后,所述方法还包括:
根据所述数据所在的研发阶段,对数据进行分类并存储,方便后续以研发阶段对数据进行检索。
本发明实施例提供的基于模板匹配技术的数据解析方法,具有以下有益效果:
(1)通过监控软件配置管理库中数据的变化,实时采集发生变化的数据,自动化程度高;
(2)能够解析不同类型的数据并自动分类存储,方便后续查看与处理,适用范围广,数据统计分析功能强。
具体实施方式
以下结合具体实施例对本发明作具体的介绍。
本发明提供的实施例提供的基于模板匹配技术的数据解析方法,包括以下步骤:
S101,实时检测软件配置管理库是否发生数据的出库操作或入库操作。
其中,软件配置管理库包括系列软件配置管理方法,软件配置管理方法是指通过技术或行政手段对软件产品及其开发过程和生命周期进行控制、规范的一系列措施。软件配置管理方法必须紧扣软件开发过程的各个环节:管理用户所提出的需求、监控其实施、确保用户需求最终落实到产品的各个版本中去、在产品发行和用户支持等方面提供帮助、响应用户新的需求、推动新的开发周期。
有些数据能够直接作为衡量软件过程合规性或软件研制质量的指标,有些数据需要经过处理后才能够使用,数据必须逐个分析处理,确保每个采集对象都有相应的来源以及转化为可用数据的途径。
S102,若是,则利用模板匹配技术,获取数据的类型。
作为本发明一个具体的实施例,模板匹配技术包括FreeMarker及Velocity。其中,Velocity是一个基于Java的模板引擎,通过特定的语法,Velocity可以获取在java语言中定义的对象,从而实现界面和java代码的真正分离,这意味着可以使用velocity替代jsp的开发模式,使得前端开发人员可以和Java程序开发人员同步开发一个遵循MVC架构的web站点;FreeMarker是一款基于Java语言编写的模板引擎,即一种基于模板和要改变的数据,并用来生成输出文本(HTML网页、电子邮件、配置文件、源代码等)的通用工具。它不是面向最终用户的,而是一个Java类库,是一款程序员可以嵌入他们所开发产品的组件。
S103,根据数据的类型,解析该数据,其中,该数据包括软件研发阶段产生的过程数据和质量数据。
其中,过程数据是指软件研发过程中的实时数据,达到质量评价标准的数据则称为质量数据。如在解析文档时,采集的实时文档类数据为过程数据,符合预期使用效果的文档类数据则称为质量数据。
可选地,根据数据的类型,解析该数据包括:
若数据的类型为文档,则根据该数据的文档结构,得到该数据对应的具体内容。
可选地,根据数据的类型,解析该数据还包括:
若数据的类型为代码,则获取该数据对应的源代码的行数及注释率,得到代码类数据。
可选地,根据数据的类型,解析该数据还包括:
若数据为第三方工具生成的,则获取该数据对应的目标码覆盖率及测试用例个数,得到第三方工具生成的数据,其中,目标码覆盖率为程序中目标代码被测试执行的比例。
可选地,在解析该数据之后,该方法还包括:
识别不能获取的数据。
作为一个具体的实施例,由于需求项个数在文档数据中没有明显的字段对应,需要再次统计需求项个数。
可选地,在解析该数据之后,该方法还包括:
根据数据的类型,对数据进行分类并存储。
可选地,在解析该数据之后,该方法还包括:
根据数据对应的项目名称,对数据进行分类并存储。
可选地,在解析该数据之后,该方法还包括:
根据数据所在的研发阶段,对数据进行分类并存储。
特别地,数据按照统一规范存储,同时将通过合规检查的数据及未通过合规检查的临时数据区分存储。
本发明实施例提供的基于模板匹配技术的数据解析方法,通过实时检测软件配置管理库是否发生数据的出库操作或入库操作,若是,则利用模板匹配技术,获取数据的类型,根据数据的类型,解析该数据,其中,该数据包括软件研发阶段产生的过程数据和质量数据,提高了数据统计分析的自动化程度及适用性。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
可以理解的是,上述方法及装置中的相关特征可以相互参考。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
此外,存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (7)

1.一种基于模板匹配技术的数据解析方法,其特征在于,包括:
实时检测软件配置管理库是否发生数据的出库操作或入库操作;
若是,则利用模板匹配技术,得到所述数据的类型;
根据所述数据的类型,解析所述数据,其中,所述数据包括软件研发阶段产生的过程数据和质量数据;
根据所述数据的类型,解析所述数据包括:
若所述数据的类型为文档,则根据所述数据的文档结构,得到所述数据对应的具体内容。
2.根据权利要求1所述的基于模板匹配技术的数据解析方法,其特征在于,根据所述数据的类型,解析所述数据还包括:
若所述数据的类型为代码,则获取所述数据对应的源代码的行数及注释率,得到代码类数据。
3.根据权利要求1所述的基于模板匹配技术的数据解析方法,其特征在于,根据所述数据的类型,解析所述数据还包括:
若所述数据为第三方工具生成的,则获取所述数据对应的目标码覆盖率及测试用例个数,得到第三方工具生成的数据,其中,目标码覆盖率为程序中目标代码被测试执行的比例。
4.根据权利要求1所述的基于模板匹配技术的数据解析方法,其特征在于,在解析所述数据之后,所述方法还包括:
识别不能获取的数据。
5.根据权利要求1所述的基于模板匹配技术的数据解析方法,其特征在于,在解析所述数据之后,所述方法还包括:
根据所述数据的类型,对数据进行分类并存储。
6.根据权利要求1所述的基于模板匹配技术的数据解析方法,其特征在于,在解析所述数据之后,所述方法还包括:
根据所述数据对应的项目名称,对数据进行分类并存储。
7.根据权利要求1所述的基于模板匹配技术的数据解析方法,其特征在于,在解析所述数据之后,所述方法还包括:
根据所述数据所在的研发阶段,对数据进行分类并存储。
CN202010767177.XA 2020-08-03 2020-08-03 一种基于模板匹配技术的数据解析方法 Active CN111880838B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010767177.XA CN111880838B (zh) 2020-08-03 2020-08-03 一种基于模板匹配技术的数据解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010767177.XA CN111880838B (zh) 2020-08-03 2020-08-03 一种基于模板匹配技术的数据解析方法

Publications (2)

Publication Number Publication Date
CN111880838A CN111880838A (zh) 2020-11-03
CN111880838B true CN111880838B (zh) 2024-04-12

Family

ID=73205186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010767177.XA Active CN111880838B (zh) 2020-08-03 2020-08-03 一种基于模板匹配技术的数据解析方法

Country Status (1)

Country Link
CN (1) CN111880838B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101151843A (zh) * 2005-06-22 2008-03-26 中兴通讯股份有限公司 一种文本数据挖掘方法
CN105868956A (zh) * 2015-12-18 2016-08-17 乐视致新电子科技(天津)有限公司 一种数据处理方法及装置
CN105912735A (zh) * 2016-06-28 2016-08-31 浪潮软件股份有限公司 一种文本文件的并行解析过滤方法
CN106201643A (zh) * 2016-07-14 2016-12-07 北京邮电大学 数据解析方法及装置
CN106227855A (zh) * 2016-07-28 2016-12-14 努比亚技术有限公司 一种数据收集装置、系统和方法
JP2019047188A (ja) * 2017-08-30 2019-03-22 株式会社日立製作所 分析管理システムおよび分析管理方法
CN110032369A (zh) * 2019-04-24 2019-07-19 成都市映潮科技股份有限公司 一种代码自动生成方法、装置及介质
CN110147411A (zh) * 2019-05-20 2019-08-20 平安科技(深圳)有限公司 数据同步方法、装置、计算机设备及存储介质
CN110413578A (zh) * 2019-06-28 2019-11-05 北京互金新融科技有限公司 数据解析的方法和装置
CN110717131A (zh) * 2018-06-27 2020-01-21 北京国双科技有限公司 页面改版的监控方法及相关系统
CN110765195A (zh) * 2019-10-23 2020-02-07 北京锐安科技有限公司 一种数据解析方法、装置、存储介质及电子设备
CN111061639A (zh) * 2019-12-18 2020-04-24 中信百信银行股份有限公司 一种高效多系统测试代码覆盖率的管理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8954940B2 (en) * 2012-10-12 2015-02-10 International Business Machines Corporation Integrating preprocessor behavior into parsing

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101151843A (zh) * 2005-06-22 2008-03-26 中兴通讯股份有限公司 一种文本数据挖掘方法
CN105868956A (zh) * 2015-12-18 2016-08-17 乐视致新电子科技(天津)有限公司 一种数据处理方法及装置
CN105912735A (zh) * 2016-06-28 2016-08-31 浪潮软件股份有限公司 一种文本文件的并行解析过滤方法
CN106201643A (zh) * 2016-07-14 2016-12-07 北京邮电大学 数据解析方法及装置
CN106227855A (zh) * 2016-07-28 2016-12-14 努比亚技术有限公司 一种数据收集装置、系统和方法
JP2019047188A (ja) * 2017-08-30 2019-03-22 株式会社日立製作所 分析管理システムおよび分析管理方法
CN110717131A (zh) * 2018-06-27 2020-01-21 北京国双科技有限公司 页面改版的监控方法及相关系统
CN110032369A (zh) * 2019-04-24 2019-07-19 成都市映潮科技股份有限公司 一种代码自动生成方法、装置及介质
CN110147411A (zh) * 2019-05-20 2019-08-20 平安科技(深圳)有限公司 数据同步方法、装置、计算机设备及存储介质
CN110413578A (zh) * 2019-06-28 2019-11-05 北京互金新融科技有限公司 数据解析的方法和装置
CN110765195A (zh) * 2019-10-23 2020-02-07 北京锐安科技有限公司 一种数据解析方法、装置、存储介质及电子设备
CN111061639A (zh) * 2019-12-18 2020-04-24 中信百信银行股份有限公司 一种高效多系统测试代码覆盖率的管理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于模型的代码一致性检测方法的研究;李函逾;《中国优秀硕士学位论文全文数据库》;20160615(第2016年06期);I138-462 *
基于模板的软件构建自动化技术的研究;谌志涛;《中国优秀硕士学位论文全文数据库》(第2016年3期);I138-2773 *

Also Published As

Publication number Publication date
CN111880838A (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
CN108156022B (zh) 一种服务调用方法、装置及电子设备
Bento et al. Automated analysis of distributed tracing: Challenges and research directions
CN108446190B (zh) 接口测试方法及装置
US20150378866A1 (en) System and method to classify automated code inspection services defect output for defect analysis
US9176840B2 (en) Tool for analyzing and resolving errors in a process server
US9582418B2 (en) Confirming the sensitivity of a data object in a managed object heap
CN111381825B (zh) 一种小程序的生成方法和装置
CN110648051A (zh) 企业信息分析处理方法和装置、电子设备和存储介质
CN105893052A (zh) 一种war包分析器
CN110908915A (zh) 一种测试覆盖率的展示方法、装置及计算机系统
CN111026080A (zh) 控制器的硬件在环测试方法及装置
CN114416458B (zh) 测试方法、装置、设备及存储介质
CN105573274A (zh) 基于plm系统的ts16949关联对象控制方法
CN115185797A (zh) 视觉算法模型的测试方法、系统、电子设备及存储介质
CN112231197A (zh) 一种页面测试的方法、装置和存储介质
CN111880838B (zh) 一种基于模板匹配技术的数据解析方法
US8359579B2 (en) Monitoring dynamic aspect oriented applications at execution time
CN102880926B (zh) 业务信息数据的审计方法和装置
CN112148590A (zh) 一种代码覆盖率的确定方法、装置及设备
Koutsopoulos et al. Advancing data race investigation and classification through visualization
Sadowski et al. The evolution of data races
CN114168408A (zh) 一种基于物联网的巡检方法、系统、电子设备及存储介质
CN113934595A (zh) 数据分析方法及系统、存储介质及电子终端
CN112015658A (zh) 一种用于软件集成测试用例的生成方法及装置
CN109697141B (zh) 用于可视化测试的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant