CN117891713A - 一种测试数据构建方法、装置、电子设备和存储介质 - Google Patents
一种测试数据构建方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117891713A CN117891713A CN202311345333.3A CN202311345333A CN117891713A CN 117891713 A CN117891713 A CN 117891713A CN 202311345333 A CN202311345333 A CN 202311345333A CN 117891713 A CN117891713 A CN 117891713A
- Authority
- CN
- China
- Prior art keywords
- test data
- index
- data
- entity
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 153
- 238000010276 construction Methods 0.000 title claims abstract description 59
- 238000003860 storage Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000009795 derivation Methods 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 238000009826 distribution Methods 0.000 claims description 26
- 230000014509 gene expression Effects 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 12
- 238000007667 floating Methods 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000013507 mapping Methods 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明提供了一种测试数据构建方法、装置、电子设备和存储介质,测试数据构建方法包括:根据业务场景建立测试数据框架;根据业务场景定义测试数据的生成标准和衍生规则;根据业务场景中的数据配置生成器,其中,生成器用于根据生成标准和衍生规则生成测试数据;以及使用生成器生成测试数据。本发明的优点在于:使用了数字孪生的思想,将真实的金融业务场景映射到数字空间,从而自动形成测试数据;测试数据能够按照预设的标准与算法进行衍生;通过数据的衍生,搭建自动案例库,实现了测试数据的自动生成与复用;不需人工手动录入数据,大大缩短数据的准备周期,解决了数据准备周期长、人力成本高、数据复用性差的问题。
Description
技术领域
本发明涉及测试数据构件技术领域,具体而言,涉及一种测试数据构建方法、装置、电子设备和存储介质。
背景技术
风险模型的迭代速度影响了金融业务开展的快慢,模型上线需要经历开发、测试、发布等多个阶段。风控模型的测试结果直接影响后期模型上线后的风控表现。测试阶段的工作繁重,尤其在对公领域,智能化审批模型的规则多、维度高、勾稽强,对测试用例要求高、难度大。风控模型对于测试用力的要求包括:测试用例要求高内聚低耦合,每个测试用例应尽量独立,不依赖或影响其他测试用例;测试用例的上下文有一定的顺序性,需满足一定前置条件;测试用例的测试点需要全面覆盖所有测试分支;测试用例的个数与模型策略的复杂度正相关,呈几何指数增长;测试用例必须可回归。
而在实际操作中,传统的模型测试阶段需要业务人员编写大量的测试数据进行测试,很难满足以上要求。现有技术在编写测试用例时的问题在于:测试数据准备周期长、数据量大、人力成本高;测试数据覆盖面不全,很难覆盖所有条件分支;测试数据质量差,与真实金融场景差异大,指标间的逻辑关系经常被忽略;测试数据复用性较低,测试数据很难应用到新的风控模型;测试数据链路不完整,涉及多个业务系统集成测试时,需要在多个系统埋入统一构建的测试数据,往往会出现数据主体信息不一致的情况。
本领域需要提供一种测试数据构建方法、装置、电子设备和存储介质,其能够克服现有技术的缺陷。
发明内容
本发明提供了一种测试数据构建方法、装置、电子设备和存储介质。其能够解决现有技术存在的问题。本发明的目的通过以下技术方案得以实现。
第一方面,本发明的一个实施方式提供了一种测试数据构建方法,其用于生成风险模型的测试数据,测试数据构建方法包括多个步骤:
步骤1:根据业务场景建立测试数据框架;
步骤2:根据业务场景定义测试数据的生成标准和衍生规则;
步骤3:根据业务场景中的数据配置生成器,其中,生成器用于根据生成标准和衍生规则生成测试数据;以及
步骤4:使用生成器生成测试数据。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中测试数据框架包括指标、实体和案例,指标与业务场景中的具体数据相对应,实体与业务场景中的业务实体相对应且每个实体包括多个指标,案例与业务场景中的案例相对应且每个案例包括多个实体。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中指标根据指标生成标准生成,指标生成标准包括指标类型、数据类型和指标名称,每个指标数据还包括阈值、精度、步长、字典码和/或正则表达式。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中实体根据实体生成标准生成,实体生成标准包括实体类型、实体表达式列表和实体指标生成标准列表,实体表达式列表用于定义实体指标列表中包含的各个指标之间的关系,实体指标生成标准列表用于定义实体所包括的各个指标的生成标准。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中案例根据案例生成标准生成,案例生成标准包括案例表达式列表和案例指标生成标准列表,案例表达式列表用于定义案例指标列表中包含的各个指标之间的关系,案例指标生成标准列表用于定义实体所包括的各个指标的生成标准。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中步骤2:根据业务场景定义测试数据的生成标准和衍生规则包括下列步骤:
步骤21:根据业务场景涉及的数据确定指标生成标准;
步骤22:根据业务场景涉及的实体确定实体生成标准;
步骤23:根据业务场景确定案例生成标准;以及
步骤24:确定指标、实体和案例的衍生规则。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中指标类型包括一般指标、关注指标和关系指标。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中数据类型包括数值型、浮点型、字典型和字符型。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中衍生规则是生成测试数据的算法,衍生规则包括根据指标类型生成指标数据或者根据业务场景的业务数据的数据分布设定对应的概率分布或通过自学习概率分布生成指标数据。
第二方面,本发明的一个实施方式提供了一种测试数据构建装置,包括:
框架构筑单元,被配置成根据业务场景建立测试数据框架;
定义单元,被配置成根据业务场景定义测试数据的生成标准和衍生规则;
配置单元,被配置成根据业务场景中的数据配置数据生成器;
生成单元,被配置成根据测试数据的衍生规则并使用数据生成器生成测试数据。
第三方面,本发明的一个实施方式提供了一种电子设备,其包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现如前述的测试数据构建方法。
第四方面,本发明的一个实施方式提供了一种计算机可读存储介质,其上存储有计算机程序,其中,计算机程序被一个或多个处理器执行时实现前述的测试数据构建方法。
根据本发明实施方式的测试数据构建方法、装置、电子设备和存储介质的优点在于:使用了数字孪生的思想,将真实的金融业务场景映射到数字空间,建立对应的测试数据框架;通过定义数据分层、核定数据标准、实现数据算法,制定了一套“以实到虚”的全要素多层级映射方案,完成现实到虚拟的映射,进行可收敛的数据衍生,从而自动形成测试数据,构建用于风险模型测试的案例库;测试数据能够按照预设的数据标准与算法进行衍生,通过数据的衍生,自动搭建案例库,实现了测试数据的自动生成与复用;不需人工手动录入数据,大大缩短了数据的准备周期,解决了数据准备周期长、人力成本高、数据复用性差的问题;数据衍生能够基于标准或概率,数据由程序自动演算,解决了测试数据的数据质量差、覆盖面不全,数据链路不完整等问题。
附图说明
通过参照以下附图对本发明非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。
图1示出了根据本发明一个实施方式的测试数据构建方法的流程图;
图2示出了根据本发明一个实施方式的测试数据根据预先定义的概率分布进行衍生的分布曲线图;
图3示出了根据本发明一个实施方式的测试数据构建装置的结构示意图;
图4示出了用于实现本发明的实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例说明本发明的具体实施方式,通过本说明书记载的内容,本领域技术人员可以清楚完整地了解本发明的技术方案、解决的技术问题以及所产生的技术效果。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外,为了便于描述,附图中仅示出了与本发明相关的部分。
需要说明的是,说明书附图中所绘示的结构、比例、大小等,仅用于配合说明书所记载的内容,以供本领域技术人员了解与阅读,并非用以限定本发明可实施的条件,故不具有技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应落在本发明所揭示的技术内容涵盖的范围内。
所引用的如“第一”、“第二”、“该”等类似词语并不表示数量限制,可表示单数或复数。本发明所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排它的包含;例如包含了一系列步骤或模块的过程、方法、系统、产品或设备并不是限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备所固有的其它步骤或单元。本发明所涉及的“连接”、“相连”、“耦接”等类似的词语并非仅限定于物理的或者机械的连接,而是还可以包括直接或间接的电气连接。
在金融业务场景中,业务系统提交风控请求后,风控系统会进行数据整合与报文组装,供规则引擎进行模型策略计算,从而得出风控结论。基于数字孪生思想,将真实的金融业务场景映射到自动生成的测试数据,需要对风控业务中的数据及数据关系进行概念抽象与表示。通过定义数据分层、核定数据标准、实现数据算法,本发明采用“以实到虚”的全要素多层级映射方案,将业务场景下的数据从下向上依次分为指标、实体、案例三个层级的元数据,完成现实到虚拟的映射,进行可收敛的数据衍生,形成测试数据,构建用于风险模型测试的数据。
图1示出了根据本发明一个实施方式的测试数据构建方法的流程图。如图1所示,其用于生成风险模型的测试数据,测试数据构建方法包括多个步骤:
步骤1:根据业务场景建立测试数据框架,具体而言,是指将业务场景所涉及的具体业务内容、业务参与主体和业务中的具体信息抽象映射为分层的测试数据框架,其中,业务场景是指真实世界中的金融业务场景;
步骤2:根据业务场景定义测试数据的生成标准和衍生规则,其中,生成标准用于限定测试数据的类型和取值范围,衍生规则用于限定测试数据之间的逻辑关系并测试数据符合业务场景中的真实数据的分布规律;
步骤3:根据业务场景中的数据配置生成器,其中,生成器用于根据生成标准和衍生规则生成测试数据;以及
步骤4:使用生成器生成测试数据。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中测试数据框架包括指标、实体和案例,指标与业务场景中的具体数据相对应,实体与业务场景中的业务实体相对应且每个实体包括多个指标,案例与业务场景中的案例相对应且每个案例包括多个实体,业务场景中的案例可以是实际业务中的单项业务、项目或案件等。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中指标用于描述主体的最细力度的数据特征;例如:司法板块里的近N年被执行总额、被执行人等信息。基于指标衍生的数据,是构成实体与案例数据的基础。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中实体是用于描述主体,实体是指标的集合,可以划分为主体信息实体、板块信息实体、业务信息实体等。例如:由被执行人、近N年被执行总额、涉及刑事案件数量等指标组合形成申请主体的司法实体;以及由征信实体、税务实体、房地产业务实体等等。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中案例用于描述了金融业务风控场景所关注的所有信息,也是风控模型需要的数据集合,包含了相应的实体与指标。例如:在房地产开发贷款授信业务中,授信审批模型需要收集申请主体的机构、司法、工商、税务、房地产业务等各类信息,这些分别对应实体和指标,其集合就形成案例,基于案例衍生的案例数据,就是用于风控模型测试的测试数据。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中指标根据指标生成标准生成,指标生成标准包括指标类型、数据类型和指标名称,每个指标数据还包括阈值、精度、步长、字典码和/或正则表达式。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中指标类型根据指标的重要程度与指标之间的相互关系确定,包括但不限于一般指标、关注指标和关系指标,一般指标是指业务关注度不高的普通指标,关注指标是指业务高度关注的指标,一般在只占一个业务场景中指标集中很少的一部分;关系指标:于其他一个或者多个具有某种关系的指标,可以通过自定义二元关系、或者基于概率分布确定关系、或者笛卡尔积关系进行确定关系;数据类型包括但不限于字符型、整型、浮点型、字典,其中字符型和整型属于数值型;阈值用于指定数值型指标的取值范围;精度用于指定浮点型数据的小数位数;步长用于指定生成数据的线性分布间隔;字典码用于指定字典型数据的码值;正则表达式用于指定了字符型数据的分组与格式,例如:/^(\-?)(\d+)$/。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中实体根据实体生成标准生成,实体生成标准包括实体类型、实体表达式列表和实体指标生成标准列表,实体表达式列表用于定义实体指标列表中包含的各个指标之间的关系,实体指标生成标准列表用于定义实体所包括的各个指标的生成标准。当实体指标生成标准列表
根据本发明的上述一个实施方式提供的测试数据构建方法,其中实体类型用于指定实体的种类,例如:征信类、司法类、工商类、业务类等;实体表达式列表用于指定实体所包括的指标的之间的关系,包括断言表达式和条件表达式两种,表达式之间可以采用分号分割。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中断言表达式用于指定实体所包含指标之间的恒等规则,例如:assert(A=B+C),表示的是指标A是指标B与C之和;条件表达式用于指定实体所包含指标在条件选择下的规则,例如:if(A=‘xxx’)thenB=A,表示的是当A等于某个值的时候,B应当等于A。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中实体指标生成标准列表中列出的实体指标生成标准可以划分为新增指标和引用指标两类,新增指标是指仅在一个实体内生效的针对特定指标的生成标准,该实体内指标的生成标准可以覆盖指标生成标准所定义的针对该指标的生成标准;引用指标是指实体内指标直接引用指标生成标准生成。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中案例根据案例生成标准生成,案例生成标准包括案例表达式列表和案例指标生成标准列表,案例表达式列表用于定义案例指标列表中包含的各个指标之间的关系,案例指标生成标准列表用于定义实体所包括的各个指标的生成标准。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中案例表达式列表用于指定案例所包括的指标的之间的关系,包括断言表达式和条件表达式两种,表达式之间可以采用分号分割。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中案例指标生成标准列表中列出的案例指标生成标准可以划分为新增指标和引用指标两类,新增指标是指仅在一个案例内生效的针对特定指标的生成标准,该案例内指标的生成标准可以覆盖实体指标生成标准和指标生成标准所定义的针对该指标的生成标准;引用指标是指案例内指标直接引用指标生成标准生成。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中指标的生成标准是根据数据层级分层的,上层标准覆盖下层标准。即当案例生成标准、实体生成标准、指标生成标准同时定义了某一个指标的生成标准,则案例数据衍生时,以案例标准为准。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中步骤2:根据业务场景定义测试数据的生成标准和衍生规则包括下列步骤:
步骤21:根据业务场景涉及的数据确定指标生成标准;
步骤22:根据业务场景涉及的实体确定实体生成标准;
步骤23:根据业务场景确定案例生成标准;以及
步骤24:确定指标、实体和案例的衍生规则。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中衍生规则是生成测试数据的算法,衍生规则包括根据指标类型生成指标数据或者根据业务场景的业务数据的数据分布设定对应的概率分布或通过机器自学习概率分布生成指标数据。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中根据指标类型生成指标数据的一个实施例如下:
案例1包含三个实体A,B,C,每个实体有若干指标。案例1构成如下:
案例1={A,B,C},A={A1,A2,…,A50},B={B1,B2,…,B30},C={C1,C2,…,C20}。
根据案例1的上述构成,案例1共有100个指标,设每个指标有10个值,则案例1笛卡尔积的数据规模是10100,远大于实际测试需要的数据量。因此需要根据测试数据的生成标准通过衍生规则缩小测试数据的数据量。
案例1中的关注指标和关系指标及其指标生成标准如表1所示:
表1
指标 | 类型 | 值型 | 值域 | 步长 |
A1 | 关注指标 | 固定值 | 450,600,800 | |
A2 | 关系指标 | 固定值 | 男,女 | |
A3 | 关系指标 | 临界值 | 1000 | 10 |
B5 | 关注指标 | 临界值 | 10,50 | 1 |
以上,案例1的100个指标中,96个是一般指标,2个是关注指标,2个是关系指标。
96个一般指标,每个指标的值空间大小均为1,记为NB1=1。
关注指标A1的值空间为VA1={450,600,800},其值空间大小为3,记为NA1=3。关注指标B5的值空间为VB5={9,10,11,49,50,51},其值空间大小为6,记为NB5=6。
关系指标A2的值空间为VA2={男,女},NA2=2。关系指标A3的值空间为VA3={990,1000,1010},NA3=3。
关系指标集{A2,A3}的值空间为VA2,A3={(男,990),(男,1000),(男,1010),(女,990),(女,1000),(女,1010)},其值空间NA2,A3=NA2×NA3=2×3=6。
关系指标与关注指标的值空间进行拼接,得到如下值空间:
VA1:VB5:VA2,A3={(450,9,男,990),(600,10,男,1000),(800,11,男,1010),(450,49,女,990),(600,50,女,1000),(800,51,女,1010)}
NA1:A2,A3:B5=Max(NA1,NA2,A3,NB5)=max(3,6,6)=6
进一步的,对一般指标构成的值空间进行拼接,得到6条测试数据。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中根据预先定义的概率分布进行衍生的一个实施例如下:
针对业务关注指标,设定其概率分布,通过计算机模拟随机采样衍生指标数据。例如:连续型的正态分布X~N(μ,σ)、离散型的泊松分布xp(a)或二项分布Xb(n,p)等。以正态分布为例,指标个数为1时,其概率分布为:
当μ=0,σ=1时,服从标准正态分布,标准正态分布概率密度函数:
其分布曲线如图2所示,其中zσ为上偏差、-zσ为下偏差、2zσ为公差;当指标个数为2时,概率密度函数为:
当指标个数大于2时,又称高斯分布,概率密度函数为:
其中,X为随机变量的向量表示,而μ为各个随机变量期望的向量表示。在二元情况下,∑的表达式为:
可使用Python库numpy生成随机多维正态分布数据。
根据本发明的上述一个实施方式提供的测试数据构建方法,其中通过机器自学习概率分布生成指标数据的一个实施例可以采用例如基于元学习(Meta-Learning)的生成式对抗网络算法进行数据生成。
图2示出了根据本发明一个实施方式的测试数据构建装置的结构示意图,作为对上述各图所示方法的实现,该装置实施例与图1所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。如图2所示,测试数据构建装置包括:
框架构筑单元101,被配置成根据业务场景建立测试数据框架;
定义单元102,被配置成根据业务场景定义测试数据的生成标准和衍生规则;
配置单元103,被配置成根据业务场景中的数据配置数据生成器;
生成单元104,被配置成根据测试数据的衍生规则并使用数据生成器生成测试数据。
图3示出了用于实现本发明的实施例的电子设备的计算机系统的结构示意图。图3示出的计算机系统500仅仅是一个示例,不应对本发明的实施例的功能和使用范围带来任何限制。如图3所示,计算机系统500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有计算机系统500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许计算机系统500与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备的计算机系统500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行图1流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本发明的实施例的方法中限定的上述功能。
需要说明的是,本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备实现如图2所示的实施例及其可选实施方式示出的法律资源库检索方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Python、Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
根据本发明实施方式的测试数据构建方法、装置、电子设备和存储介质的优点在于:使用了数字孪生的思想,将真实的金融业务场景映射到数字空间,建立对应的测试数据框架;通过定义数据分层、核定数据标准、实现数据算法,制定了一套“以实到虚”的全要素多层级映射方案,完成现实到虚拟的映射,进行可收敛的数据衍生,从而自动形成测试数据,构建用于风险模型测试的案例库;测试数据能够按照预设的数据标准与算法进行衍生,通过数据的衍生,自动搭建案例库,实现了测试数据的自动生成与复用;不需人工手动录入数据,大大缩短了数据的准备周期,解决了数据准备周期长、人力成本高、数据复用性差的问题;数据衍生能够基于标准或概率,数据由程序自动演算,解决了测试数据的数据质量差、覆盖面不全,数据链路不完整等问题。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
尽管已参考本发明的特定实施例描述并说明了本发明,但这些描述和说明并不是用于限制本发明。所属领域的技术人员可清楚地理解,可进行各种改变,且可在实施例内替代等效元件而不脱离如由权利要求限定的本发明的保护范围。归因于制造过程中的变量等等,本发明中的技术再现与实际设备之间可能存在区别。可存在未特定说明的本发明的其它实施例。应将说明书和图示视为说明性的,而非限制性的,可根据本发明的目的和精神做出修改,所有这些修改都在权利要求的保护范围内。虽然已参考按特定次序执行的特定操作描述本文中所公开的方法,但应理解,在不脱离本发明的启示的情况下,可重新组合、细分或排列这些操作以形成等效方法。因此,除非本文中特别指示,否则操作的次序和分组并不限制本发明。
Claims (12)
1.一种测试数据构建方法,其特征在于,其包括多个步骤:
步骤1:根据业务场景建立测试数据框架;
步骤2:根据业务场景定义测试数据的生成标准和衍生规则;
步骤3:根据业务场景中的数据配置生成器,其中,生成器用于根据生成标准和衍生规则生成测试数据;以及
步骤4:使用生成器生成测试数据。
2.根据权利要求1所述的测试数据构建方法,其特征在于,测试数据框架包括指标、实体和案例,指标与业务场景中的具体数据相对应,实体与业务场景中的业务实体相对应且每个实体包括多个指标,案例与业务场景中的案例相对应且每个案例包括多个实体。
3.根据权利要求2所述的测试数据构建方法,其特征在于,指标根据指标生成标准生成,指标生成标准包括指标类型、数据类型和指标名称,每个指标数据还包括阈值、精度、步长、字典码和/或正则表达式。
4.根据权利要求3所述的测试数据构建方法,其特征在于,实体根据实体生成标准生成,实体生成标准包括实体类型、实体表达式列表和实体指标生成标准列表,实体表达式列表用于定义实体指标列表中包含的各个指标之间的关系,实体指标生成标准列表用于定义实体所包括的各个指标的生成标准。
5.根据权利要求4所述的测试数据构建方法,其特征在于,案例根据案例生成标准生成,案例生成标准包括案例表达式列表和案例指标生成标准列表,案例表达式列表用于定义案例指标列表中包含的各个指标之间的关系,案例指标生成标准列表用于定义实体所包括的各个指标的生成标准。
6.根据权利要求5所述的测试数据构建方法,其特征在于,步骤2:根据业务场景定义测试数据的生成标准和衍生规则包括下列步骤:
步骤21:根据业务场景涉及的数据确定指标生成标准;
步骤22:根据业务场景涉及的实体确定实体生成标准;
步骤23:根据业务场景确定案例生成标准;以及
步骤24:确定指标、实体和案例的衍生规则。
7.根据权利要求6所述的测试数据构建方法,其特征在于,指标类型包括一般指标、关注指标和关系指标。
8.根据权利要求6所述的测试数据构建方法,其特征在于,数据类型包括数值型、浮点型、字典型和字符型。
9.根据权利要求7所述的测试数据构建方法,其特征在于,衍生规则是生成测试数据的算法,衍生规则包括根据指标类型生成指标数据或者根据业务场景的业务数据的数据分布设定对应的概率分布或通过自学习概率分布生成指标数据。
10.一种测试数据构建装置,其特征在于,包括:
框架构筑单元,被配置成根据业务场景建立测试数据框架;
定义单元,被配置成根据业务场景定义测试数据的生成标准和衍生规则;
配置单元,被配置成根据业务场景中的数据配置数据生成器;
生成单元,被配置成根据测试数据的衍生规则并使用数据生成器生成测试数据。
11.一种电子设备,其特征在于,其包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被一个或多个处理器执行时实现如权利要求1-9中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311345333.3A CN117891713A (zh) | 2023-10-18 | 2023-10-18 | 一种测试数据构建方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311345333.3A CN117891713A (zh) | 2023-10-18 | 2023-10-18 | 一种测试数据构建方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117891713A true CN117891713A (zh) | 2024-04-16 |
Family
ID=90640022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311345333.3A Pending CN117891713A (zh) | 2023-10-18 | 2023-10-18 | 一种测试数据构建方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117891713A (zh) |
-
2023
- 2023-10-18 CN CN202311345333.3A patent/CN117891713A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021089012A1 (zh) | 图网络模型的节点分类方法、装置及终端设备 | |
CN110020427B (zh) | 策略确定方法和装置 | |
CN111159897B (zh) | 基于系统建模应用的目标优化方法和装置 | |
WO2020000689A1 (zh) | 基于迁移学习的智能投顾策略生成方法及装置、电子设备、存储介质 | |
CN113570030A (zh) | 数据处理方法、装置、设备以及存储介质 | |
CN113537370A (zh) | 一种基于云计算的财务数据处理方法及系统 | |
CN113408668A (zh) | 基于联邦学习系统的决策树构建方法、装置及电子设备 | |
CN112257959A (zh) | 用户风险预测方法、装置、电子设备及存储介质 | |
CN114861907A (zh) | 数据计算方法、装置、存储介质和设备 | |
CN113110843A (zh) | 合约生成模型训练方法、合约生成方法及电子设备 | |
CN111191050B (zh) | 知识图谱本体模型构建的方法和装置 | |
WO2023185125A1 (zh) | 产品资源的数据处理方法及装置、电子设备、存储介质 | |
CN117891713A (zh) | 一种测试数据构建方法、装置、电子设备和存储介质 | |
CN116501885A (zh) | 一种基于动力学传播模型的推演方法和系统 | |
CN113723712B (zh) | 风电功率预测方法、系统、设备及介质 | |
CN115640517A (zh) | 多方协同模型训练方法、装置、设备和介质 | |
CN114268625B (zh) | 特征选择方法、装置、设备及存储介质 | |
CN117973544B (zh) | 基于语义距离的文本单位推理方法装置、存储介质和终端 | |
CN116383883B (zh) | 一种基于大数据的数据管理权限处理方法及系统 | |
CN117573123B (zh) | 应用于网页应用的页面生成方法、装置和电子设备 | |
CN114610287A (zh) | 一种区块链智能合约生成方法、装置及电子设备 | |
CN116401243A (zh) | 引擎实现方法、装置、终端及存储介质 | |
CN117218474A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN116306985A (zh) | 预测模型训练方法、装置、计算机设备和存储介质 | |
CN118035423A (zh) | 信息查询方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |