CN112416785A - 切词工具版本差异测试方法、装置、设备和存储介质 - Google Patents
切词工具版本差异测试方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN112416785A CN112416785A CN202011358290.9A CN202011358290A CN112416785A CN 112416785 A CN112416785 A CN 112416785A CN 202011358290 A CN202011358290 A CN 202011358290A CN 112416785 A CN112416785 A CN 112416785A
- Authority
- CN
- China
- Prior art keywords
- version
- target
- historical
- cutting tool
- test sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 426
- 230000011218 segmentation Effects 0.000 claims abstract description 241
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000004590 computer program Methods 0.000 claims description 28
- 238000010586 diagram Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 230000009193 crawling Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/368—Test management for test version control, e.g. updating test cases to a new software version
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3692—Test management for test results analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请涉及一种切词工具版本差异测试方法、装置、计算机设备和存储介质。该方法包括:获取测试样本数据集合;获取目标版本切词工具以及历史版本切词工具;通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合;通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合;根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。采用本方法能够无需人工进行切词工具版本差异比较,避免人工带来的漏查,提高版本差异准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种切词工具版本差异测试方法、装置、计算机设备和存储介质。
背景技术
目前,切词工具版本迭代频繁,需要快速验证不同版本下切词结果是否符合预期,具体可以通过当前版本的切词工具与历史版本的切词工具的版本差异来确定是否符合预期。然而,目前切词工具的版本差异通常是通过人工简单进行对比得到版本差异,这种人工操作容易出现漏查,版本差异准确性低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够无需人工进行切词工具版本差异比较,避免人工带来的漏查,提高版本差异准确性的切词工具版本差异测试方法、装置、计算机设备和存储介质。
一种切词工具版本差异测试方法,该方法包括:
获取测试样本数据集合;
获取目标版本切词工具以及历史版本切词工具;
通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合;
通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合;
根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
在其中一个实施例中,通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合,包括:通过目标版本切词工具获取预设切词规则;通过目标版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的目标测试数据结果集合。
在其中一个实施例中,通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合,包括:通过历史版本切词工具获取预设切词规则;通过历史版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的历史测试数据结果集合。
在其中一个实施例中,根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果,包括:比较目标测试数据集合和历史测试数据结果集合;将目标测试数据集合和历史测试数据结果集合中相同字段不同字段值对应的目标字段,确定为目标版本切词工具和历史版本切词工具之间的版本差异结果。
在其中一个实施例中,切词工具版本差异测试方法还包括:将版本差异结果转换成对应的版本差异结果表格数据;通过表格形式展示版本差异结果表格数据。
在其中一个实施例中,获取目标版本切词工具以及历史版本切词工具,包括:获取目标版本切词工具对应的目标版本切词工具标识;获取历史版本切词工具对应的历史版本切词工具标识;将目标版本切词工具标识修改为历史版本切词工具标识,将目标版本切词工具切换得到历史版本切词工具。
在其中一个实施例中,测试样本数据集合包括至少一个测试样本数据,测试样本数据包括对应的测试样本数据标识,切词工具版本差异测试方法还包括:根据测试样本数据标识划分测试样本数据集合,得到多个测试样本数据组;通过目标版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的目标测试数据结果,得到目标测试数据结果集合;通过历史版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的历史测试数据结果,得到历史测试数据结果集合。
一种切词工具版本差异测试装置,该装置包括:
测试样本数据集合获取模块,用于获取测试样本数据集合;
切词工具获取模块,用于获取目标版本切词工具以及历史版本切词工具;
目标版本切词工具运行模块,用于通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合;
历史版本切词工具运行模块,用于通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合;
版本差异结果确定模块,用于根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取测试样本数据集合;
获取目标版本切词工具以及历史版本切词工具;
通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合;
通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合;
根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取测试样本数据集合;
获取目标版本切词工具以及历史版本切词工具;
通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合;
通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合;
根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
上述切词工具版本差异测试方法、装置、计算机设备和存储介质,获取测试样本数据集合;获取目标版本切词工具以及历史版本切词工具;通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合;通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合;根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。因此,通过目标版本切词工具和历史版本切词工具分别对测试样本数据集合进行切词,得到对应的目标测试数据结果集合和历史测试数据结果集合,通过比较目标测试数据结果集合和历史测试数据结果集合确定切词工具的版本差异,不需要人工对切词版本进行版本差异比较,不仅提高版本差异的获取效率,而且能够避免人工带来的漏查,提高版本差异准确性。
附图说明
图1为一个实施例中切词工具版本差异测试方法的应用环境图;
图2为一个实施例中切词工具版本差异测试方法的流程示意图;
图3为一个实施例中切词工具版本差异测试装置的结构框图;
图4为一个实施例中计算机设备的内部结构图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的切词工具版本差异测试方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
具体地,终端102获取测试样本数据集合,并将测试样本数据集合发送至服务器104,服务器104接收到测试样本数据集合后,获取目标版本切词工具以及历史版本切词工具,通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合,通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合,根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。进一步地,服务器104可将版本差异结果返回至终端102。
在另一个实施例中,终端102获取测试样本数据集合,获取目标版本切词工具以及历史版本切词工具,通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合,通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合,根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
在一个实施例中,如图2所示,提供了一种切词工具版本差异测试方法,以该方法应用于图1中的终端或服务器为例进行说明,包括以下步骤:
步骤202,获取测试样本数据集合。
其中,测试样本数据集合是测试样本数据的集合,测试样本数据用来测试不同版本的切词工具的,可以是文本内容等。测试样本数据可以通过大量网络爬取得到的,或者还可以是根据实际业务需求、产品需求或实际应用场景进行收集得到的。测试样本数据可以预先进行爬取或者收集,并进行存储,当需要应用的时候,可以直接从存储区域获取测试样本数据集合。
步骤204,获取目标版本切词工具以及历史版本切词工具。
其中,切词工具是用来进行切词的,切词工具具有不同版本,不同版本的切词工具准确率可能不同,且不同版本的切词工具可能存在版本差异。其中,目标版本切词工具可以是当前版本切词工具,当前版本切词工具可以是最新版本的切词工具,也可以是根据实际业务需求、产品需求和应用场景从不同版本中确定一个版本为目标版本切词工具。而历史版本切词工具可以相对于目标版本切词工具的上一个版本切词工具,也可以是根据根据实际业务需求、产品需求和应用场景从不同版本中确定一个版本为目标版本切词工具。
具体地,在获取到测试样本数据集合后,可以获取目标版本切词工具,再根据目标版本切词工具获取历史版本切词工具。或者可以是同时获取目标版本切词工具和历史版本切词工具。
在一个实施例中,获取目标版本切词工具以及历史版本切词工具,包括:获取目标版本切词工具对应的目标版本切词工具标识,获取历史版本切词工具对应的历史版本切词工具标识,将目标版本切词工具标识修改为历史版本切词工具标识,将目标版本切词工具切换得到历史版本切词工具。
其中,目标版本切词工具与历史版本切词工具之间可以通过版本切词工具标识进行切换,也就是说,可以获取到目标版本切词工具后,通过修改目标版本切词工具对应的目标版本切词工具标识切换得到历史版本切词工具。其中,不同版本的切词工具对应不同的版本切词工具标识。具体地,在获取到目标版本切词工具后,获取目标版本切词工具对应的目标版本切词工具标识,再获取历史版本切词工具对应的历史版本切词工具标识,可以将目标版本切词工具标识修改为历史版本切词工具标识,则可以将目标版本切词工具切换得到历史版本切词工具,无需再额外去获取历史版本切词工具,通过修改目标版本切词工具对应的目标版本切词工具标识切换得到历史版本切词工具。
步骤206,通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合。
其中,在获取到目标版本切词工具和历史版本切词工具后,可以通过目标版本切词工具和历史版本切词工具分别运行测试样本数据集合,通过目标版本切词工具对测试样本数据集合中的测试样本数据进行切词,得到各个测试样本数据对应得目标测试数据结果,得到目标测试数据结果集合。具体地,通过目标版本切词工具运行测试样本数据集合具体可以是,目标版本切词工具获取预设切词规则,根据预设切词规则对测试样本数据集合中得测试样本数据进行切词,得到测试样本数据对应的目标测试数据结果。其中,预设切词规则可以自定义,自定义可以是根据句子语义进行切割,或者还可以是根据词语之间搭配习惯进行切割,或者还可以是根据业务需求、产品需求或实际应用场景进行切割等等。最后,由各个测试样本数据对应的目标测试数据结果组成目标测试数据结果集合。
在一个实施例中,通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合,包括:通过目标版本切词工具获取预设切词规则,通过目标版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的目标测试数据结果集合。
其中,通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合,具体可以是,目标版本切词工具获取预设切词规则,根据预设切词规则对测试样本数据集合中得测试样本数据进行切词,得到测试样本数据对应的目标测试数据结果。其中,预设切词规则可以自定义,自定义可以是根据句子语义进行切割,或者还可以是根据词语之间搭配习惯进行切割,或者还可以是根据业务需求、产品需求或实际应用场景进行切割等等。最后,得到测试样本数据对应的目标测试数据结果后,由各个测试样本数据对应的目标测试数据结果组成目标测试数据结果集合。
步骤208,通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合。
其中,在获取到目标版本切词工具和历史版本切词工具后,可以通过目标版本切词工具和历史版本切词工具分别运行测试样本数据集合,通过历史版本切词工具对测试样本数据集合中的测试样本数据进行切词,得到各个测试样本数据对应得历史测试数据结果,得到历史测试数据结果集合。具体地,通过历史版本切词工具运行测试样本数据集合具体可以是,历史版本切词工具获取预设切词规则,根据预设切词规则对测试样本数据集合中得测试样本数据进行切词,得到测试样本数据对应的历史测试数据结果。其中,预设切词规则可以自定义,自定义可以是根据句子语义进行切割,或者还可以是根据词语之间搭配习惯进行切割,或者还可以是根据业务需求、产品需求或实际应用场景进行切割等等。最后,由各个测试样本数据对应的历史测试数据结果组成历史测试数据结果集合。
在一个实施例中,通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合,包括:通过历史版本切词工具获取预设切词规则,通过历史版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的历史测试数据结果集合。
其中,通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合,具体可以是,历史版本切词工具获取预设切词规则,根据预设切词规则对测试样本数据集合中得测试样本数据进行切词,得到测试样本数据对应的历史测试数据结果。其中,预设切词规则可以自定义,自定义可以是根据句子语义进行切割,或者还可以是根据词语之间搭配习惯进行切割,或者还可以是根据业务需求、产品需求或实际应用场景进行切割等等。最后,得到测试样本数据对应的历史测试数据结果后,由各个测试样本数据对应的历史测试数据结果组成历史测试数据结果集合。
步骤210,根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
其中,在得到目标版本切词工具的目标测试数据结果集合和历史版本切词工具的历史测试数据结果集合后,通过比较目标测试数据结果集合和历史测试数据结果集合,可以确定目标版本切词工具和历史版本切词工具之间的版本差异结果。其中,比较目标测试数据结果集合和历史测试数据结果集合具体可以是,比较相同字段在目标测试数据结果集合中和历史测试数据结果集合中字段值是否相同,若相同,也就是说,相同字段在目标测试数据结果集合中和历史测试数据结果集合中字段值相同,则不存在版本差异,反之,若相同字段在目标测试数据结果集合中和历史测试数据结果集合中字段值不相同时,则可确定该字段为版本差异结果。也就是说,字段值不同的目标字段是目标版本切词工具和历史版本切词工具之间的版本差异结果。
在一个实施例中,根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果,包括:比较目标测试数据集合和历史测试数据结果集合,将目标测试数据集合和历史测试数据结果集合中相同字段不同字段值对应的目标字段,确定为目标版本切词工具和历史版本切词工具之间的版本差异结果。
其中,根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果,具体可以是,比较相同字段在目标测试数据结果集合中和历史测试数据结果集合中字段值是否相同,若相同,也就是说,相同字段在目标测试数据结果集合中和历史测试数据结果集合中字段值相同,则不存在版本差异,反之,若相同字段在目标测试数据结果集合中和历史测试数据结果集合中字段值不相同时,则可确定该字段为版本差异结果。也就是说,字段值不同的目标字段是目标版本切词工具和历史版本切词工具之间的版本差异结果。
上述切词工具版本差异测试方法中,获取测试样本数据集合;获取目标版本切词工具以及历史版本切词工具;通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合;通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合;根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
因此,通过目标版本切词工具和历史版本切词工具分别对测试样本数据集合进行切词,得到对应的目标测试数据结果集合和历史测试数据结果集合,通过比较目标测试数据结果集合和历史测试数据结果集合确定切词工具的版本差异,不需要人工对切词版本进行版本差异比较,不仅提高版本差异的获取效率,而且能够避免人工带来的漏查,提高版本差异准确性。
在一个实施例中,切词工具版本差异测试方法还包括:将版本差异结果转换成对应的版本差异结果表格数据,通过表格形式展示版本差异结果表格数据。
其中,在得到版本差异结果后,可以将版本差异结果展示出来,方便用户可直观查看,展示的方式可自定义,自定义可以是表格展示、推送展示等等,其中,表格展示更加方便用户直观查看,因此,可以通过表格的形式展示版本差异结果,具体可以是,将目标版本切词工具与历史版本切词工具之间的版本差异结果转换成版本差异结果表格数据,表格数据的转换可以根据目前的表格转换方式进行转换,在此不作任何限制。
进一步地,最后可通过表格形式展示版本差异结果表格数据,因此,版本差异结果表格数据可以通过表格的形式进行查看,能够直观的看出目标版本切词工具与历史版本切词工具之间的版本差异性。
在一个实施例中,测试样本数据集合包括至少一个测试样本数据,测试样本数据包括对应的测试样本数据标识,切词工具版本差异测试方法还包括:根据测试样本数据标识划分测试样本数据集合,得到多个测试样本数据组,通过目标版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的目标测试数据结果,得到目标测试数据结果集合,通过历史版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的历史测试数据结果,得到历史测试数据结果集合。
其中,测试样本数据集合包括至少一个测试样本数据,测试样本数据包括对应的测试样本数据标识,可以将测试样本数据集合分成多个组,具体的分组过程可以是根据测试样本数据对应的测试样本数据标识进行分组,例如,可以按照测试样本数据标识的降序排列各个测试样本数据,再进行分组。或者还可以是根据业务需求、实际应用场景或产品需求进行分组,在此不对分组的方式进行限制。
其中,在得到多个测试样本数据组后,分别通过目标版本切词工具与历史版本切词工具并行对各个测试样本数据组中的测试样本数据进行切词,具体可以是根据预设切词规则进行切词,通过切词工具并行运行能够提高切词效率,且互不影响。进一步地,得到目标版本切词工具运行的各个测试样本数据组对应的目标测试数据结果,从而组成目标测试数据结果集合,以及得到历史版本切词工具运行的各个测试样本数据组对应的历史测试数据结果,从而得到历史测试数据结果集合。最后,再根据目标测试数据结果集合和历史测试数据结果集合确定切词工具的版本差异。
在一个具体的实施例中,提供了一种切词工具版本差异测试方法,具体包括以下步骤:
1、获取测试样本数据集合。
2、获取目标版本切词工具以及历史版本切词工具。
2-1、获取目标版本切词工具对应的目标版本切词工具标识。
2-2、获取历史版本切词工具对应的历史版本切词工具标识。
2-3、将目标版本切词工具标识修改为历史版本切词工具标识,将目标版本切词工具切换得到历史版本切词工具。
3、通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合。
3-1、通过目标版本切词工具获取预设切词规则。
3-2、通过目标版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的目标测试数据结果集合。
4、通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合。
4-1、通过历史版本切词工具获取预设切词规则。
4-2、通过历史版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的历史测试数据结果集合。
5、根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
5-1、比较目标测试数据集合和历史测试数据结果集合。
5-2、将目标测试数据集合和历史测试数据结果集合中相同字段不同字段值对应的目标字段,确定为目标版本切词工具和历史版本切词工具之间的版本差异结果。
6、将版本差异结果转换成对应的版本差异结果表格数据。
7、通过表格形式展示版本差异结果表格数据。
8、根据测试样本数据标识划分测试样本数据集合,得到多个测试样本数据组。
9、通过目标版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的目标测试数据结果,得到目标测试数据结果集合。
10、通过历史版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的历史测试数据结果,得到历史测试数据结果集合。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种切词工具版本差异测试装置300,包括:测试样本数据集合获取模块302、切词工具获取模块304、目标版本切词工具运行模块306、历史版本切词工具运行模块308和版本差异结果确定模块310,其中:
测试样本数据集合获取模块302,用于获取测试样本数据集合。
切词工具获取模块304,用于获取目标版本切词工具以及历史版本切词工具。
目标版本切词工具运行模块306,用于通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合。
历史版本切词工具运行模块308,用于通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合。
版本差异结果确定模块310,用于根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
在一个实施例中,目标版本切词工具运行模块306还用于通过目标版本切词工具获取预设切词规则,通过目标版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的目标测试数据结果集合。
在一个实施例中,历史版本切词工具运行模块308还用于通过历史版本切词工具获取预设切词规则,通过历史版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的历史测试数据结果集合。
在一个实施例中,版本差异结果确定模块310还用于比较目标测试数据集合和历史测试数据结果集合,将目标测试数据集合和历史测试数据结果集合中相同字段不同字段值对应的目标字段,确定为目标版本切词工具和历史版本切词工具之间的版本差异结果。
在一个实施例中,切词工具版本差异测试装置300还用于将版本差异结果转换成对应的版本差异结果表格数据,通过表格形式展示版本差异结果表格数据。
在一个实施例中,切词工具获取模块304还用于获取目标版本切词工具对应的目标版本切词工具标识,获取历史版本切词工具对应的历史版本切词工具标识,将目标版本切词工具标识修改为历史版本切词工具标识,将目标版本切词工具切换得到历史版本切词工具。
在一个实施例中,测试样本数据集合包括至少一个测试样本数据,测试样本数据包括对应的测试样本数据标识,切词工具版本差异测试装置300还用于根据测试样本数据标识划分测试样本数据集合,得到多个测试样本数据组,通过目标版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的目标测试数据结果,得到目标测试数据结果集合,通过历史版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的历史测试数据结果,得到历史测试数据结果集合。
关于切词工具版本差异测试装置的具体限定可以参见上文中对于切词工具版本差异测试方法的限定,在此不再赘述。上述切词工具版本差异测试装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储版本差异结果。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种切词工具版本差异测试方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种切词工具版本差异测试方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图4或图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取测试样本数据集合;获取目标版本切词工具以及历史版本切词工具;通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合;通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合;根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过目标版本切词工具获取预设切词规则;通过目标版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的目标测试数据结果集合。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过历史版本切词工具获取预设切词规则;通过历史版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的历史测试数据结果集合。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:比较目标测试数据集合和历史测试数据结果集合;将目标测试数据集合和历史测试数据结果集合中相同字段不同字段值对应的目标字段,确定为目标版本切词工具和历史版本切词工具之间的版本差异结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将版本差异结果转换成对应的版本差异结果表格数据;通过表格形式展示版本差异结果表格数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取目标版本切词工具对应的目标版本切词工具标识;获取历史版本切词工具对应的历史版本切词工具标识;将目标版本切词工具标识修改为历史版本切词工具标识,将目标版本切词工具切换得到历史版本切词工具。
在一个实施例中,测试样本数据集合包括至少一个测试样本数据,测试样本数据包括对应的测试样本数据标识,处理器执行计算机程序时还实现以下步骤:根据测试样本数据标识划分测试样本数据集合,得到多个测试样本数据组;通过目标版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的目标测试数据结果,得到目标测试数据结果集合;通过历史版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的历史测试数据结果,得到历史测试数据结果集合。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取测试样本数据集合;获取目标版本切词工具以及历史版本切词工具;通过目标版本切词工具运行测试样本数据集合,得到对应的目标测试数据结果集合;通过历史版本切词工具运行测试样本数据集合,得到对应的历史测试数据结果集合;根据目标测试数据结果集合和历史测试数据结果集合确定目标版本切词工具和历史版本切词工具之间的版本差异结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过目标版本切词工具获取预设切词规则;通过目标版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的目标测试数据结果集合。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:通过历史版本切词工具获取预设切词规则;通过历史版本切词工具根据预设切词规则对测试样本数据集合进行切词,得到对应的历史测试数据结果集合。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:比较目标测试数据集合和历史测试数据结果集合;将目标测试数据集合和历史测试数据结果集合中相同字段不同字段值对应的目标字段,确定为目标版本切词工具和历史版本切词工具之间的版本差异结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:将版本差异结果转换成对应的版本差异结果表格数据;通过表格形式展示版本差异结果表格数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取目标版本切词工具对应的目标版本切词工具标识;获取历史版本切词工具对应的历史版本切词工具标识;将目标版本切词工具标识修改为历史版本切词工具标识,将目标版本切词工具切换得到历史版本切词工具。
在一个实施例中,测试样本数据集合包括至少一个测试样本数据,测试样本数据包括对应的测试样本数据标识,处理器执行计算机程序时还实现以下步骤:根据测试样本数据标识划分测试样本数据集合,得到多个测试样本数据组;通过目标版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的目标测试数据结果,得到目标测试数据结果集合;通过历史版本切词工具的多线程并行运行各个测试样本数据组,得到各个测试样本数据组对应的历史测试数据结果,得到历史测试数据结果集合。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种切词工具版本差异测试方法,所述方法包括:
获取测试样本数据集合;
获取目标版本切词工具以及历史版本切词工具;
通过所述目标版本切词工具运行所述测试样本数据集合,得到对应的目标测试数据结果集合;
通过所述历史版本切词工具运行所述测试样本数据集合,得到对应的历史测试数据结果集合;
根据所述目标测试数据结果集合和所述历史测试数据结果集合确定所述目标版本切词工具和所述历史版本切词工具之间的版本差异结果。
2.根据权利要求1所述的方法,其特征在于,所述通过所述目标版本切词工具运行所述测试样本数据集合,得到对应的目标测试数据结果集合,包括:
通过所述目标版本切词工具获取预设切词规则;
通过所述目标版本切词工具根据所述预设切词规则对所述测试样本数据集合进行切词,得到对应的目标测试数据结果集合。
3.根据权利要求1所述的方法,其特征在于,所述通过所述历史版本切词工具运行所述测试样本数据集合,得到对应的历史测试数据结果集合,包括:
通过所述历史版本切词工具获取预设切词规则;
通过所述历史版本切词工具根据所述预设切词规则对所述测试样本数据集合进行切词,得到对应的历史测试数据结果集合。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标测试数据结果集合和所述历史测试数据结果集合确定所述目标版本切词工具和所述历史版本切词工具之间的版本差异结果,包括:
比较所述目标测试数据集合和所述历史测试数据结果集合;
将所述目标测试数据集合和所述历史测试数据结果集合中相同字段不同字段值对应的目标字段,确定为所述目标版本切词工具和所述历史版本切词工具之间的版本差异结果。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述版本差异结果转换成对应的版本差异结果表格数据;
通过表格形式展示所述版本差异结果表格数据。
6.根据权利要求1所述的方法,其特征在于,所述获取目标版本切词工具以及历史版本切词工具,包括:
获取所述目标版本切词工具对应的目标版本切词工具标识;
获取所述历史版本切词工具对应的历史版本切词工具标识;
将所述目标版本切词工具标识修改为所述历史版本切词工具标识,将所述目标版本切词工具切换得到所述历史版本切词工具。
7.根据权利要求1所述的方法,其特征在于,所述测试样本数据集合包括至少一个测试样本数据,所述测试样本数据包括对应的测试样本数据标识,所述方法还包括:
根据所述测试样本数据标识划分所述测试样本数据集合,得到多个测试样本数据组;
通过所述目标版本切词工具的多线程并行运行各个所述测试样本数据组,得到各个所述测试样本数据组对应的目标测试数据结果,得到目标测试数据结果集合;
通过所述历史版本切词工具的多线程并行运行各个所述测试样本数据组,得到各个所述测试样本数据组对应的历史测试数据结果,得到历史测试数据结果集合。
8.一种切词工具版本差异测试装置,其特征在于,所述装置包括:
测试样本数据集合获取模块,用于获取测试样本数据集合;
切词工具获取模块,用于获取目标版本切词工具以及历史版本切词工具;
目标版本切词工具运行模块,用于通过所述目标版本切词工具运行所述测试样本数据集合,得到对应的目标测试数据结果集合;
历史版本切词工具运行模块,用于通过所述历史版本切词工具运行所述测试样本数据集合,得到对应的历史测试数据结果集合;
版本差异结果确定模块,用于根据所述目标测试数据结果集合和所述历史测试数据结果集合确定所述目标版本切词工具和所述历史版本切词工具之间的版本差异结果。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011358290.9A CN112416785A (zh) | 2020-11-27 | 2020-11-27 | 切词工具版本差异测试方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011358290.9A CN112416785A (zh) | 2020-11-27 | 2020-11-27 | 切词工具版本差异测试方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112416785A true CN112416785A (zh) | 2021-02-26 |
Family
ID=74843696
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011358290.9A Pending CN112416785A (zh) | 2020-11-27 | 2020-11-27 | 切词工具版本差异测试方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112416785A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113448862A (zh) * | 2021-07-12 | 2021-09-28 | 上海哔哩哔哩科技有限公司 | 软件版本测试方法、装置及计算机设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224955A (zh) * | 2015-10-16 | 2016-01-06 | 武汉邮电科学研究院 | 基于微博大数据获取网络服务状态的方法 |
CN106777250A (zh) * | 2016-12-27 | 2017-05-31 | 努比亚技术有限公司 | 一种分词结果选择方法和装置 |
CN110119353A (zh) * | 2019-04-18 | 2019-08-13 | 上海蔚来汽车有限公司 | 测试数据生成方法、装置以及控制器和介质 |
CN110750433A (zh) * | 2018-07-23 | 2020-02-04 | 北京奇虎科技有限公司 | 接口测试方法和装置 |
CN110990285A (zh) * | 2019-12-09 | 2020-04-10 | 广州品唯软件有限公司 | 一种ui自动化测试方法及装置 |
CN111475405A (zh) * | 2020-03-27 | 2020-07-31 | 深圳壹账通智能科技有限公司 | 回归测试的方法、装置、计算机设备及存储介质 |
CN111475651A (zh) * | 2020-04-08 | 2020-07-31 | 掌阅科技股份有限公司 | 文本分类方法、计算设备及计算机存储介质 |
CN111597807A (zh) * | 2020-04-30 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 分词数据集生成方法、装置、设备及其存储介质 |
-
2020
- 2020-11-27 CN CN202011358290.9A patent/CN112416785A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105224955A (zh) * | 2015-10-16 | 2016-01-06 | 武汉邮电科学研究院 | 基于微博大数据获取网络服务状态的方法 |
CN106777250A (zh) * | 2016-12-27 | 2017-05-31 | 努比亚技术有限公司 | 一种分词结果选择方法和装置 |
CN110750433A (zh) * | 2018-07-23 | 2020-02-04 | 北京奇虎科技有限公司 | 接口测试方法和装置 |
CN110119353A (zh) * | 2019-04-18 | 2019-08-13 | 上海蔚来汽车有限公司 | 测试数据生成方法、装置以及控制器和介质 |
CN110990285A (zh) * | 2019-12-09 | 2020-04-10 | 广州品唯软件有限公司 | 一种ui自动化测试方法及装置 |
CN111475405A (zh) * | 2020-03-27 | 2020-07-31 | 深圳壹账通智能科技有限公司 | 回归测试的方法、装置、计算机设备及存储介质 |
CN111475651A (zh) * | 2020-04-08 | 2020-07-31 | 掌阅科技股份有限公司 | 文本分类方法、计算设备及计算机存储介质 |
CN111597807A (zh) * | 2020-04-30 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 分词数据集生成方法、装置、设备及其存储介质 |
Non-Patent Citations (1)
Title |
---|
WEIXIN_39995351: "python文本分析的开源工具_百度的中文开源词法分析工具(LAC)", pages 1 - 8, Retrieved from the Internet <URL:CSDN:https://blog.csdn.net/weixin_39995351/article/details/110172098> * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113448862A (zh) * | 2021-07-12 | 2021-09-28 | 上海哔哩哔哩科技有限公司 | 软件版本测试方法、装置及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109672741B (zh) | 微服务监控方法、装置、计算机设备和存储介质 | |
CN109474578B (zh) | 报文消息校验方法、装置、计算机设备和存储介质 | |
WO2020186786A1 (zh) | 文件处理方法、装置、计算机设备和存储介质 | |
CN109189799B (zh) | 业务数据查询方法、装置、计算机设备及存储介质 | |
CN108804159B (zh) | javascript模块加载方法及其预处理方法、装置和计算机设备 | |
CN112380213B (zh) | 信息采集方法、装置、计算机设备和存储介质 | |
CN111192025A (zh) | 职业信息匹配方法、装置、计算机设备和存储介质 | |
CN110659298B (zh) | 财务数据处理方法、装置、计算机设备和存储介质 | |
CN109542962B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN112000903B (zh) | 数据查询方法、装置、计算机设备和存储介质 | |
CN110941555A (zh) | 测试用例推荐方法、装置、计算机设备和存储介质 | |
CN111898336B (zh) | 弹幕显示方法、装置、计算机设备及存储介质 | |
CN110704095A (zh) | 基于工作流的配置处理方法、装置、计算机设备和存储介质 | |
CN112380130A (zh) | 基于调用依赖关系的应用测试方法和装置 | |
CN109597979B (zh) | 清单表格生成方法、装置、计算机设备和存储介质 | |
CN112637008B (zh) | 链路模拟测试方法、装置、系统、计算机设备和存储介质 | |
CN111176767A (zh) | 表数据处理方法、装置、计算机设备和存储介质 | |
CN110717647A (zh) | 决策流构建方法、装置、计算机设备和存储介质 | |
CN111026647A (zh) | 代码覆盖率的获取方法、装置、计算机设备和存储介质 | |
CN110837956A (zh) | 地下电缆巡检任务分配方法和装置 | |
CN111190609A (zh) | 业务的处理方法、装置、设备和存储介质 | |
CN110555165B (zh) | 信息识别方法、装置、计算机设备和存储介质 | |
CN110457401B (zh) | 数据存储方法、装置、计算机设备和存储介质 | |
CN109656947B (zh) | 数据查询方法、装置、计算机设备和存储介质 | |
CN111309991A (zh) | 查询语句生成方法、装置和数据查询方法、系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |