CN116011439A - 一种算法引擎的优化方法、装置、设备和存储介质 - Google Patents

一种算法引擎的优化方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN116011439A
CN116011439A CN202211315947.2A CN202211315947A CN116011439A CN 116011439 A CN116011439 A CN 116011439A CN 202211315947 A CN202211315947 A CN 202211315947A CN 116011439 A CN116011439 A CN 116011439A
Authority
CN
China
Prior art keywords
test
algorithm engine
optimization
engine package
package
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211315947.2A
Other languages
English (en)
Inventor
李成文
谢姗姗
张晓燕
肖飞
赵景鹤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Xunfei Medical Co ltd Wuhan Branch
Iflytek Medical Technology Co ltd
Original Assignee
Anhui Xunfei Medical Co ltd Wuhan Branch
Iflytek Medical Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Xunfei Medical Co ltd Wuhan Branch, Iflytek Medical Technology Co ltd filed Critical Anhui Xunfei Medical Co ltd Wuhan Branch
Priority to CN202211315947.2A priority Critical patent/CN116011439A/zh
Publication of CN116011439A publication Critical patent/CN116011439A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种算法引擎的优化方法、装置、设备和存储介质,该方法包括:获取第一算法引擎数据;其中,第一算法引擎数据包括第一算法引擎包,第一算法引擎包为已利用测试集完成测试的算法引擎包;响应于用户的优化操作,获取与第一算法引擎包匹配的优化集,并利用优化集对第一算法引擎包进行优化,得到第二算法引擎包。通过上述方式,本申请能够提升对算法引擎的优化效率。

Description

一种算法引擎的优化方法、装置、设备和存储介质
技术领域
本申请涉及算法引擎测试技术领域,特别是涉及一种算法引擎的优化方法、装置、设备和存储介质。
背景技术
目前,通用的优化方法及过程,主要是通过比较在同一测试集的机器结果与人工结果之间的差异,然后线下进行算法引擎的优化。但是,人工线下进行算法引擎的优化耗时较长,且操作过程中容易引入错误导致优化不可靠。
发明内容
本申请主要解决的技术问题是提供一种算法引擎的优化方法、装置、设备和存储介质,能够提升对算法引擎的优化效率。
为解决上述技术问题,本申请采用的一个技术方案是:提供一种算法引擎的优化方法,该方法包括:获取第一算法引擎数据;其中,第一算法引擎数据包括第一算法引擎包,第一算法引擎包为已利用测试集完成测试的算法引擎包;响应于用户的优化操作,获取与第一算法引擎包匹配的优化集,并利用优化集对第一算法引擎包进行优化,得到第二算法引擎包。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种算法引擎的优化装置,该装置包括获取模块和优化模块;获取模块用于获取第一算法引擎数据;其中,第一算法引擎数据包括第一算法引擎包,第一算法引擎包为已利用测试集完成测试的算法引擎包;优化模块用于响应于用户的优化操作,获取与第一算法引擎包匹配的优化集,并利用优化集对第一算法引擎包进行优化,得到第二算法引擎包。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,该电子设备包括处理器和存储器,存储器存储有程序指令,处理器用于执行程序指令以实现上述的算法引擎的优化方法。
为解决上述技术问题,本申请采用的另一个技术方案是:提供一种计算机可读存储介质,该计算机可读存储介质用于存储程序指令,程序指令能够被执行以实现上述的算法引擎的优化方法。
上述技术方案,响应于用户的优化操作,获取与第一算法引擎包匹配的优化集,并利用优化集对第一算法引擎包进行优化,得到第二算法引擎包。故,用户可通过优化操作即可实现对第一算法引擎包的优化,实现了用户线上自主对第一算法引擎包的优化,提升对第一算法引擎包的优化效率。
附图说明
图1是本申请提供的算法引擎的优化方法一实施例的流程示意图;
图2是图1所示步骤S11一实施例的流程示意图;
图3是本申请提供的获取测试集一实施例的流程示意图;
图4是图1所示步骤S12一实施例的流程示意图;
图5是本申请提供的算法引擎的优化装置一实施例的结构示意图;
图6是本申请提供的电子设备一实施例的结构示意图;
图7是本申请提供的计算机可读存储介质一实施例的结构示意图。
具体实施方式
为使本申请的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本申请进一步详细说明。
需要说明的是,若本申请实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
请参阅图1,图1是本申请提供的算法引擎的优化方法一实施例的流程示意图。需注意的是,若有实质上相同的结果,本实施例并不以图1所示的流程顺序为限。如图1所示,本实施例包括:
步骤S11:获取第一算法引擎数据。
本实施例的方法用于实现用户对算法引擎的自主优化,以提升对算法引擎的优化效率,其中,本文所述的算法引擎包括但不限于医学文本实体抽取算法引擎、车辆识别算法引擎、语种识别算法引擎等,在此不做具体限定。
本实施方式中,获取第一算法引擎数据,其中,第一算法引擎数据包括第一算法引擎包,第一算法引擎包为已利用测试集完成测试的算法引擎包。其中,不对第一算法引擎包的类型进行具体限定;例如,第一算法引擎包为医学文本实体抽取算法引擎包、车辆识别算法引擎包、语种识别算法引擎包等。
在一实施方式中,具体可以从本地存储或者云端存储中获取得到第一算法引擎数据。可以理解地,在其他实施方式中,也可以实时利用测试集对未经测试的初始算法引擎包进行测试而得到已利用测试集完成测试的第一算法引擎包。
步骤S12:响应于用户的优化操作,获取与第一算法引擎包匹配的优化集,并利用优化集对第一算法引擎包进行优化,得到第二算法引擎包。
本实施方式中,响应于用户的优化操作,获取与第一算法引擎包匹配的优化集,并利用优化集对第一算法引擎包进行优化,得到第二算法引擎包;也就是说,将优化集中的优化数据融合至第一算法引擎包内部,以提升第一算法引擎包的效果。由于用户进行优化操作就可实现对第一算法引擎包的优化,即,实现用户线上自主对第一算法引擎包的优化,提升对第一算法引擎包的优化效率,加快了对第一算法引擎包的迭代更新。
在一实施方式中,响应于用户的优化操作,会自动基于测试分析结果确定对第一算法引擎包进行优化所需的优化集。当然,在其他实施方式中,也可用户自身基于测试分析结果确定对第一算法引擎包进行优化所需的优化集。
上述实施方式中,响应于用户的优化操作,获取与第一算法引擎包匹配的优化集,并利用优化集对第一算法引擎包进行优化,得到第二算法引擎包。故,用户可通过优化操作即可实现对第一算法引擎包的优化,实现了用户线上自主对第一算法引擎包的优化,提升对第一算法引擎包的优化效率。
请参阅图2,图2是图1所示步骤S11一实施例的流程示意图。需注意的是,若有实质上相同的结果,本实施例并不以图2所示的流程顺序为限。如图2所示,本实施例中,测试集包括若干测试子集以及第一算法引擎数据还包括第一算法引擎包对应的测试分析结果,实时利用测试集对未经测试的第一算法引擎包进行测试而得到已利用测试集完成测试的第一算法引擎包,具体包括:
步骤S21:获取初始算法引擎包以及确定测试配置参数。
本实施方式中,获取初始算法引擎包。在一实施方式中,具体可以从本地存储或者云端存储中获取得到初始算法引擎包。可以理解地,在其他实施方式中,也可以实施生成初始算法引擎包,在此不做具体限定;具体地,获取初始算法引擎包对应的代码,其中,可从代码管理仓库自动拉取相应Tag的版本源码文件;然后,对初始算法引擎包对应的代码进行编译和打包,得到初始算法引擎包,即,对代码进行编译和打包,得到可对外发布的引擎版本包。
另外,本实施方式中,还要确定测试配置参数,其中,测试配置参数包括测试集参数和测试分析参数。另外,需要说明的是,测试配置参数是由用户在显示界面的测试配区域进行参数配置后而确定得到的,以便于后续能够基于用户配置的相关测试配置参数即用户的需求进行初始算法引擎包的测试。
在一实施方式中,测试集参数包括测试子集的名称和测试子集的数量,即,用户在显示界面的测试配置区域配置测试子集的名称和测试子集的数量,以便于后续能够执行用户指定的测试子集以及执行用户指定数量的测试子集对初始算法引擎包进行测试。在一实施方式中,测试分析参数包括分析维度,即,用户在显示界面的测试配置区域配置分析维度,以便于后续能够执行用户指定的分析维度对测试结果和真实结果进行比对;举例来说,以初始算法引擎包为初始医学文本实体抽取算法引擎包为例:初始医学文本实体抽取算法引擎包对应的测试结果包括医学实体信息、实体间关系和标准词信息,此时若用户配置的分析维度为实体信息时,后续会执行测试结果中实体信息和真实结果中实体信息的比对,而若用户配置的分析维度为实体关系时,后续会执行比对测试结果中的实体信息之间的关系和真实结果中的实体信息之间的关系。
在一实施方式中,测试配置参数还包括测试参数和引擎执行参数,测试参数包括测试的执行环境、测试的执行路径、测试的执行并发数中的至少一者,引擎执行参数包括默认执行场景、是否启用redis缓存、模型参数中的至少一者。
步骤S22:从测试集中,抽取与测试集参数匹配的测试子集;并利用与测试集参数匹配的测试子集对初始算法引擎包进行测试,得到第一算法引擎包以及测试结果。
本实施方式中,从测试集中,抽取与测试集参数匹配的测试子集,并利用与测试集参数匹配的测试子集对初始算法引擎包进行测试,得到第一算法引擎包以及测试结果。也就是说,用户仅需配置相关参数,就会抽取与用户配置的参数匹配的测试子集对初始算法引擎包进行测试,实现了算法引擎测试的自动化,减少了人工手动执行、多流程串联等复杂重复工作,提高了对算法引擎测试的效率及准确度。
在一实施方式中,测试集参数包括测试子集的名称和测试子集的数量,此时会从测试集中抽取与用户指定的各测试子集名称对应的测试子集对初始算法引擎包进行测试。
在一实施方式中,如图3所示,图3是本申请提供的获取测试集一实施例的流程示意图,测试集的获取具体包括如下子步骤:
步骤S31:从测试数据存储池中,提取若干初始测试数据。
本实施方式中,从测试数据存储池中,提取若干初始测试数据。举例来说,以初始算法引擎包为初始医学文本实体抽取算法引擎包为例,此时测试数据存储池具体为病例数据库,提取的若干初始测试数据为若干医学病历,医学病历具体涉及口语化场景、门诊场景、住院场景以及检查报告单等多种形式的病历,且医学病历包括医生手写、电子病历、导医导诊小程序输入问句等多种格式;其中,以门诊病历为例,门诊病历通常包括主诉、现病史、既往史、体格检查、辅助检查等字段。
步骤S32:分别对若干初始测试数据进行数据清洗,对应得到若干经处理测试数据。
本实施方式中,分别对若干初始测试数据进行数据清洗,对应得到若干经处理测试数据。也就是说,会对若干初始测试数据进行数据清洗,以去除初始测试数据中的噪声数据、无用数据等,以提高后续对算法引擎测试的准确度。
其中,数据清洗包括正则、去除表情第三方库、文字识别中的至少一者,也就是说,通过正则、去除表情第三方库、文字识别中的至少一者对若干初始测试数据进行数据清洗。当然,在其他实施方式中,数据清洗还可包括其他技术手段,在此不做具体限定。
步骤S33:将各经处理测试数据的格式转换成目标格式,得到若干目标测试数据。
本实施方式中,将各经处理测试数据的格式转换成目标格式,得到若干目标测试数据。也就是说,将各经处理测试数据的格式转换成目标格式,便于后续直接利用测试数据对初始算法引擎包进行测试,提高了对算法引擎包的测试效率以及准确度。举例来说,以初始算法引擎包为初始医学文本实体抽取算法引擎包为例,将各经处理测试数据的格式转换成json入参格式,并命名为case_sample.json,单个经处理测试数据(示例)为{"mainSuit":"患儿2周前出现流涕患儿目前二便正常,饮食正常,睡眠不安。"}。
在一实施方式中,各经处理测试数据还标注有真实结果,此时也需要将各经处理测试数据的标准信息即真实结果转换成目标格式。举例来说,以对经处理测试数据-case_sample.json提供专业医生进行标注而得到case_sample.json对应的真实结果,并将真实结果转换为标准json格式,命名为label.txt,经处理测试数据-case_sample.json对应的真实结果为{"mainSuit_input":[{"content":"2周前","begin":2,"end":5,"tag":"发病时间","id":0,"pre_content":[],"token":{}]}。
在一实施方式中,会对若干目标测试数据进行划分,从而得到若干测试子集,若干测试子集构成测试集。在一具体实施方式中,会对若干测试子集进行存储,以便于后续在进行初始算法引擎包测试时可直接调用对应的测试子集,从而提高后续对初始算法引擎包的测试效率。
步骤S23:利用测试结果和真实结果,得到在目标分析维度下的测试分析结果。
本实施方式中,利用测试结果和真实结果,得到在目标分析维度下的测试分析结果,其中,目标分析维度与测试分析参数匹配。也就是说,用户仅需配置相关参数,就可基于与测试分析参数匹配的分析维度对测试结果和真实结果进行比对,实现了测试结果分析的全自动化,相比于人工进行测试结果分析,能够提高测试结果分析的效率。
在一实施方式中,测试分析参数包括分析维度,即,用户在显示界面的测试配置区域配置分析维度,以便于后续能够执行用户指定的分析维度对测试结果和真实结果进行比对;举例来说,以初始算法引擎包为初始医学文本实体抽取算法引擎包为例:初始医学文本实体抽取算法引擎包对应的测试结果包括医学实体信息、实体间关系和标准词信息,此时若用户配置的分析维度为实体信息时,即,目标分析维度为实体信息时,后续会执行测试结果中实体信息和真实结果中实体信息的比对。
在一实施方式中,测试分析结果包括准确率、召回率、F1值中的至少一者;也就是说,基于与测试分析参数匹配的分析维度对测试结果和真实结果进行比对,完成准确率、召回率、F1值中的至少一者的统计。其中,准确率、召回率和F1值对应的具体公式如下所示:
准确率=测试结果与真实结果一致数/测试结果总数
召回率=测试结果与真实结果一致数/真实结果总数
F1值=2*准确率*召回率/(准确率+召回率)
举例来说,以初始算法引擎包为初始医学文本实体抽取算法引擎包、测试子集均为门诊病历、测试分析结果包括准确率、召回率和F1值为例;输入的测试子集A中一测试数据为“主诉:患者头痛、发热、咳嗽三天”、人工标注结果即真实结果为【(头痛,症状),(发热,症状),(咳嗽,症状),(三天,发病时间)】、测试结果为【(头痛,症状),(发热,症状),(咳嗽三天,症状)】;经计算,该测试子集A实体抽取测试分析结果为:准确率=2/3、召回率=2/4、F1值=57.14%。
当然,在其他实施方式中,测试分析结果还可包括其他自定义指标,在此不做具体限定。
为了便于用户查看确认初始算法引擎包对应的测试分析结果以及进行效果分析,在一实施方式中,在利用测结果和真实结果,得到目标分析维度下的测试分析结果之后,会在显示界面显示测试分析结果。在一具体实施方式中,以excel表格格式在显示界面显示测试分析结果。
请参阅图4,图4是图1所示步骤S12一实施例的流程示意图。需注意的是,若有实质上相同的结果,本实施例并不以图4所示的流程顺序为限。如图4所示,第一算法引擎数据还包括第一算法引擎包对应的测试分析结果,本实施例包括:
步骤S41:响应于用户的优化操作,基于第一算法引擎包的测试分析结果,确定与第一算法引擎包匹配的优化集参数。
本实施方式中,响应于用户的优化操作,基于第一算法引擎包的测试分析结果,确定与第一算法引擎包匹配的优化集参数。举例来说,若基于第一算法引擎包的测试分析结果得到的优化方向为“针对资源未覆盖情况,增加异源场景对应的病历”,那么确定与第一算法引擎包匹配的优化集参数为A,以使得后续提取出与优化集参数A匹配的优化集,优化集中包括的均为异源场景下的病历数据;若基于第一算法引擎包的测试分析结果得到的优化方向为“针对标准词未覆盖情况,增加同源场景对应的病历”,那么确定与第一算法引擎包匹配的优化参数为B,以使得后续提取出与优化集参数B匹配的优化集,优化集中包括的均为同源场景下的病历数据。
在一实施方式中,响应于用户的优化操作,可自动基于第一算法引擎包的测试分析结果,确定与第一算法引擎包匹配的优化集参数。当然,在其他实施方式中,也可是用户基于第一算法引擎包的测试分析结果确定优化集参数并进行优化配置区域进行优化集参数的配置,以使得确定与第一算法引擎包匹配的优化集参数。
在一具体实施方式中,用户基于第一算法引擎包的测试分析结果确定优化集参数,那么确定与第一算法引擎包匹配的优化集参数的步骤具体包括:响应于用户的优化操作,在显示界面显示优化配置区域;响应于用户在优化配置区域中的优化集参数配置操作,确定与第一算法引擎包匹配的优化集参数。也就是说,用户可自主对优化集参数进行配置,实现对第一算法引擎包的自主优化。
步骤S42:从优化数据存储池中,提取与确定的优化集参数对应的数据,得到与第一算法引擎包匹配的优化集。
本实施方式中,从优化数据存储池中,提取与确定的优化集参数对应的数据,得到与第一算法引擎包匹配的优化集,其中,优化数据存储池中的数据与第一算法引擎包关联;也就是说,从优化数据存储池中提取第一算法引擎包优化所需的优化集,使得后续更有针对性地对第一算法引擎包进行优化。
举例来说,以第一算法引擎包为医学文本实体抽取算法引擎包、基于第一算法引擎包的测试分析结果得到的优化方向为“针对资源未覆盖情况,增加异源场景对应的病历”为例,从海量病历库、术语库和知识库中提取与确定的优化集参数对应的异源病历作为优化集,后续可将优化集增加至第一算法引擎包内部,完成对第一算法引擎包在异源场景下的效果优化,即,后续可利用优化集对第一算法引擎包进行更有针对性地优化。
请参阅图5,图5是本申请提供的算法引擎的优化装置一实施例的结构示意图。算法引擎的优化装置50包括获取模块51和优化模块52。获取模块51用于获取第一算法引擎数据;其中,第一算法引擎数据包括第一算法引擎包,第一算法引擎包为已利用测试集完成测试的算法引擎包;优化模块52用于响应于用户的优化操作,获取与第一算法引擎包匹配的优化集,并利用优化集对第一算法引擎包进行优化,得到第二算法引擎包。
其中,上述第一算法引擎数据还包括第一算法引擎包对应的测试分析结果;优化模块52用于响应于用户的优化操作,获取与第一算法引擎包匹配的优化集,具体包括:响应于用户的优化操作,基于第一算法引擎包的测试分析结果,确定与第一算法引擎包匹配的优化集参数;从优化数据存储池中,提取与确定的优化集参数对应的数据,得到与第一算法引擎包匹配的优化集;其中,优化数据存储池中的数据与第一算法引擎包关联。
其中,优化模块52用于响应于用户的优化操作,基于第一算法引擎包的测试分析结果,确定与第一算法引擎包匹配的优化集参数,具体包括:响应于用户的优化操作,在显示界面显示优化配置区域;响应于用户在优化配置区域中的优化集参数配置操作,确定与第一算法引擎包匹配的优化集参数。
其中,上述测试集包括若干测试子集,测试子集上标注有真实结果,第一算法引擎数据还包括第一算法引擎包对应的测试分析结果;获取模块51用于获取第一算法引擎数据,具体包括:获取初始算法引擎包以及确定测试配置参数;其中,测试配置参数包括测试集参数和测试分析参数;从测试集中,抽取与测试集参数匹配的测试子集;并利用与测试集参数匹配的测试子集对初始算法引擎包进行测试,得到第一算法引擎包以及测试结果;利用测试结果和真实结果,得到在目标分析维度下的测试分析结果;其中,目标分析维度与测试分析参数匹配。
其中,上述测试分析结果包括准确率、召回率、F1值中的至少一者;和/或,上述测试集参数包括测试子集的名称和测试子集的数量;和/或,上述测试分析参数包括分析维度;和/或,上述测试配置参数还包括测试参数和引擎执行参数,测试参数包括测试的执行环境、测试的执行路径、测试的执行并发数中的至少一者,引擎执行参数包括默认执行场景、是否启用redis缓存、模型参数中的至少一者。
其中,获取模块51用于获取初始算法引擎包,具体包括:获取初始算法引擎包对应的代码;对代码进行编译和打包,得到初始算法引擎包;和/或,算法引擎的优化装置50还包括显示模块53,显示模块53用于在利用测试结果和真实结果,得到在目标分析维度下的测试分析结果之后,算法引擎的优化方法还包括:在显示界面显示测试分析结果。
其中,上述测试集包括若干目标测试数据,获取模块51还用于测试集的获取,测试集的获取包括如下步骤:从测试数据存储池中,提取若干初始测试数据;分别对若干初始测试数据进行数据清洗,对应得到若干经处理测试数据;其中,数据清洗包括正则、去除表情第三方库、文字识别中的至少一者;将各经处理测试数据的格式转换成目标格式,得到若干目标测试数据。
请参阅图6,图6是本申请提供的电子设备一实施例的结构示意图。电子设备60包括相互耦接的存储器61和处理器62,处理器62用于执行存储器61中存储的程序指令,以实现上述任一算法引擎的优化方法实施例的步骤。在一个具体的实施场景中,电子设备60可以包括但不限于:微型计算机、服务器,此外,电子设备60还可以包括笔记本电脑、平板电脑等移动设备,在此不做限定。
具体而言,处理器62用于控制其自身以及存储器61以实现上述任一算法引擎的优化方法实施例的步骤。处理器62还可以称为CPU(Central Processing Unit,中央处理单元)。处理器62可能是一种集成电路芯片,具有信号的处理能力。处理器62还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器62可以由集成电路芯片共同实现。
请参阅图7,图7是本申请提供的计算机可读存储介质一实施例的结构示意图。本申请实施例的计算机可读存储介质70存储有程序指令71,该程序指令71被执行时实现本申请算法引擎的优化方法任一实施例以及任意不冲突的组合所提供的方法。其中,该程序指令71可以形成程序文件以软件产品的形式存储在上述计算机可读存储介质70中,以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式方法的全部或部分步骤。而前述的计算机可读存储介质70包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种算法引擎的优化方法,其特征在于,所述方法包括:
获取第一算法引擎数据;其中,所述第一算法引擎数据包括第一算法引擎包,所述第一算法引擎包为已利用测试集完成测试的算法引擎包;
响应于用户的优化操作,获取与所述第一算法引擎包匹配的优化集,并利用所述优化集对所述第一算法引擎包进行优化,得到第二算法引擎包。
2.根据权利要求1所述的方法,其特征在于,所述第一算法引擎数据还包括所述第一算法引擎包对应的测试分析结果;所述响应于用户的优化操作,获取与所述第一算法引擎包匹配的优化集,包括:
响应于用户的优化操作,基于所述第一算法引擎包的测试分析结果,确定与所述第一算法引擎包匹配的优化集参数;
从优化数据存储池中,提取与所述确定的优化集参数对应的数据,得到与所述第一算法引擎包匹配的优化集;其中,所述优化数据存储池中的数据与所述第一算法引擎包关联。
3.根据权利要求2所述的方法,其特征在于,所述响应于用户的优化操作,基于所述第一算法引擎包的测试分析结果,确定与所述第一算法引擎包匹配的优化集参数,包括:
响应于用户的优化操作,在显示界面显示优化配置区域;
响应于用户在所述优化配置区域中的优化集参数配置操作,确定与所述第一算法引擎包匹配的优化集参数。
4.根据权利要求1所述的方法,其特征在于,所述测试集包括若干测试子集,所述测试子集上标注有真实结果,所述第一算法引擎数据还包括所述第一算法引擎包对应的测试分析结果;所述获取第一算法引擎数据,包括:
获取初始算法引擎包以及确定测试配置参数;其中,所述测试配置参数包括测试集参数和测试分析参数;
从所述测试集中,抽取与所述测试集参数匹配的测试子集;并利用所述与测试集参数匹配的测试子集对所述初始算法引擎包进行测试,得到所述第一算法引擎包以及测试结果;
利用所述测试结果和所述真实结果,得到在目标分析维度下的所述测试分析结果;其中,所述目标分析维度与所述测试分析参数匹配。
5.根据权利要求4所述的方法,其特征在于,
所述测试分析结果包括准确率、召回率、F1值中的至少一者;
和/或,所述测试集参数包括所述测试子集的名称和所述测试子集的数量;
和/或,所述测试分析参数包括分析维度;
和/或,所述测试配置参数还包括测试参数和引擎执行参数,所述测试参数包括测试的执行环境、测试的执行路径、测试的执行并发数中的至少一者,所述引擎执行参数包括默认执行场景、是否启用redis缓存、模型参数中的至少一者。
6.根据权利要求4所述的方法,其特征在于,所述获取初始算法引擎包,包括:
获取所述初始算法引擎包对应的代码;
对所述代码进行编译和打包,得到所述初始算法引擎包;
和/或,在所述利用所述测试结果和所述真实结果,得到在目标分析维度下的所述测试分析结果之后,所述方法还包括:
在显示界面显示所述测试分析结果。
7.根据权利要求1所述的方法,其特征在于,所述测试集包括若干目标测试数据,所述测试集的获取包括如下步骤:
从测试数据存储池中,提取若干初始测试数据;
分别对所述若干初始测试数据进行数据清洗,对应得到若干经处理测试数据;其中,所述数据清洗包括正则、去除表情第三方库、文字识别中的至少一者;
将各所述经处理测试数据的格式转换成目标格式,得到所述若干目标测试数据。
8.一种算法引擎的优化装置,其特征在于,所述装置包括:
获取模块,用于获取第一算法引擎数据;其中,所述第一算法引擎数据包括第一算法引擎包,所述第一算法引擎包为已利用测试集完成测试的算法引擎包;
优化模块,用于响应于用户的优化操作,获取与所述第一算法引擎包匹配的优化集,并利用所述优化集对所述第一算法引擎包进行优化,得到第二算法引擎包。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器存储有程序指令,所述处理器用于执行所述程序指令以实现如权利要求1-7任一项所述的算法引擎的优化方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序指令,所述程序指令能够被执行以实现如权利要求1-7任一项所述的算法引擎的优化方法。
CN202211315947.2A 2022-10-25 2022-10-25 一种算法引擎的优化方法、装置、设备和存储介质 Pending CN116011439A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211315947.2A CN116011439A (zh) 2022-10-25 2022-10-25 一种算法引擎的优化方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211315947.2A CN116011439A (zh) 2022-10-25 2022-10-25 一种算法引擎的优化方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN116011439A true CN116011439A (zh) 2023-04-25

Family

ID=86018076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211315947.2A Pending CN116011439A (zh) 2022-10-25 2022-10-25 一种算法引擎的优化方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN116011439A (zh)

Similar Documents

Publication Publication Date Title
US11972201B2 (en) Facilitating auto-completion of electronic forms with hierarchical entity data models
EP3696746A1 (en) Method and apparatus for determining description information, electronic device and computer storage medium
US20200257860A1 (en) Semantic recognition method, electronic device, and computer-readable storage medium
CN111475694B (zh) 一种数据处理方法、装置、终端及存储介质
CN111144210B (zh) 图像的结构化处理方法及装置、存储介质及电子设备
CN112612664B (zh) 电子设备的测试方法、装置、电子设备和存储介质
CN110598008A (zh) 录制数据的数据质检方法及装置、存储介质
CN112989990B (zh) 医疗票据识别方法、装置、设备及存储介质
CN111444718A (zh) 一种保险产品需求文档处理方法、装置及电子设备
CN115935344A (zh) 一种异常设备的识别方法、装置及电子设备
CN110362476A (zh) 数据转换工具的验证方法、装置、计算机设备和存储介质
CN112989256B (zh) 识别响应信息中web指纹的方法和装置
CN111767213B (zh) 数据库检查点的测试方法、装置、电子设备及存储介质
CN117033309A (zh) 一种数据转换方法、装置、电子设备及可读存储介质
CN116340172A (zh) 基于测试场景的数据收集方法、装置及测试用例检测方法
CN116011439A (zh) 一种算法引擎的优化方法、装置、设备和存储介质
CN110471708B (zh) 基于可重用组件的配置项获取的方法及装置
CN113918593A (zh) 识别金融数据异常的方法及装置、存储介质、计算设备
CN113434653A (zh) 处理查询语句的方法、装置、设备及存储介质
CN112363944A (zh) 一种用于多环境接口返回值对比的方法及设备
CN114818645B (zh) 基于数据主体的自动化报告生成方法、装置、设备及介质
CN113505570B (zh) 参考文献参见落空的审校方法、装置、设备及存储介质
CN115309870B (zh) 一种知识获取方法及装置
CN118035384A (zh) 小票信息纠错的方法、装置及电子设备
CN117435189A (zh) 金融系统接口的测试用例分析方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination