CN114428677B - 任务处理方法、处理装置、电子设备及存储介质 - Google Patents
任务处理方法、处理装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114428677B CN114428677B CN202210110164.4A CN202210110164A CN114428677B CN 114428677 B CN114428677 B CN 114428677B CN 202210110164 A CN202210110164 A CN 202210110164A CN 114428677 B CN114428677 B CN 114428677B
- Authority
- CN
- China
- Prior art keywords
- task
- data
- model
- annotation
- marking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 120
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000011156 evaluation Methods 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 32
- 230000004044 response Effects 0.000 claims abstract description 28
- 238000002372 labelling Methods 0.000 claims description 51
- 238000000034 method Methods 0.000 claims description 33
- 238000001514 detection method Methods 0.000 claims description 21
- 230000005477 standard model Effects 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 claims description 15
- 230000001960 triggered effect Effects 0.000 claims description 11
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000013135 deep learning Methods 0.000 abstract description 4
- 238000012015 optical character recognition Methods 0.000 abstract description 4
- 238000004590 computer program Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000013519 translation Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003709 image segmentation Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000013136 deep learning model Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/1916—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本公开提供了一种任务处理方法、处理装置、电子设备及存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体实现方案为:响应于接收到任务处理请求,根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,其中,任务标注数据的标签信息与任务类型标识相匹配,任务标注数据包括第一任务标注数据和第二任务标注数据;利用第一任务标注数据训练待训练模型,得到多个候选模型,其中,待训练模型是根据任务类型标识确定的;根据利用第二任务标注数据对多个候选模型进行性能评估得到的性能评估结果,从多个候选模型中确定目标模型。
Description
技术领域
本公开涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于OCR光学字符识别等场景。具体地,涉及一种任务处理方法、处理装置、电子设备及存储介质。
背景技术
随着人工智能技术的发展,深度学习被广泛应用于各个业务场景。深度学习的业务场景具有多变性,针对不同的业务场景需要设计满足适用于该业务场景的深度学习模型。
为了获得适用于业务场景的深度学习模型,涉及数据采集、数据标注、模型训练、模型测试和模型选择等操作。
发明内容
本公开提供了一种任务处理方法、处理装置、电子设备以及存储介质。
根据本公开的一方面,提供了一种任务处理方法,包括:响应于接收到任务处理请求,根据上述任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,其中,上述任务标注数据的标签信息与上述任务类型标识相匹配,上述任务标注数据包括第一任务标注数据和第二任务标注数据;利用上述第一任务标注数据训练待训练模型,得到多个候选模型,其中,上述待训练模型是根据上述任务类型标识确定的;以及,根据利用上述第二任务标注数据对上述多个候选模型进行性能评估得到的性能评估结果,从上述多个候选模型中确定目标模型。。
根据本公开的另一方面,提供了一种任务处理装置,包括:解析模块,用于响应于接收到任务处理请求,根据上述任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,其中,上述任务标注数据的标签信息与上述任务类型标识相匹配,上述任务标注数据包括第一任务标注数据和第二任务标注数据;训练模块,用于利用上述第一任务标注数据训练待训练模型,得到多个候选模型,其中,上述待训练模型是根据上述任务类型标识确定的;以及,评估模块,用于根据利用上述第二任务标注数据对上述多个候选模型进行性能评估得到的性能评估结果,从上述多个候选模型中确定目标模型。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,上述存储器存储有可被上述至少一个处理器执行的指令,上述指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行如本公开所述的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,上述计算机指令用于使上述计算机执行如本公开所述的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现如本公开所述的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示意性示出了根据本公开实施例的可以应用任务处理方法及装置的示例性系统架构;
图2示意性示出了根据本公开实施例的任务处理方法的流程图;
图3示意性示出了根据本公开实施例的根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据的流程图;
图4示意性示出了根据本公开实施例的任务处理过程的示例示意图;
图5示意性示出了根据本公开实施例的将待添加模型结构添加至模型结构库的示例示意图;
图6示意性示出了根据本公开实施例的获得标注数据的示例示意图;
图7示意性示出了根据本公开实施例的任务处理装置的框图;以及
图8示意性示出了根据本公开实施例的适于实现任务处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
针对模型训练和模型测试,不同任务需要的模型结构不同,且训练模型和测试模型的方式也会不同。此外,由于模型测试和模型训练不同步,导致模型管理不统一,模型训练效率较低,时间成本和人力成本较高。
为此,本公开实施例提出了一种任务处理方案。响应于接收到任务处理请求,根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,任务标注数据的标签信息与任务类型标识相匹配,任务标注数据包括第一任务标注数据和第二任务标注数据。利用第一任务标注数据训练待训练模型,得到多个候选模型,待训练模型是根据任务类型标识确定的。根据利用第二任务标注数据对多个候选模型进行性能评估得到的性能评估结果,从多个候选模型中确定目标模型。
根据本公开实施例,待训练模型是根据任务类型标识确定的,即,每个待训练模型具有与该模型对应的任务类型标识,从而实现了模型的统一管理。通过利用第一任务标注数据训练待训练模型,得到多个候选模型,再利用第二任务标注数据对多个候选模型进行性能评估,实现了模型训练和模型测试同步进行,即,实现了边训边测,进而提高了模型训练效率,降低了时间成本和人力成本。
图1示意性示出了根据本公开实施例的可以应用任务处理方法及装置的示例性系统架构。
需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一实施例中,可以应用任务处理方法及装置的示例性系统架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的任务处理方法及装置。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等。
服务器105可以是提供各种服务的服务器。例如,对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
服务器105可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,解决了传统物理主机与VPS服务(Virtual Private Server,VPS)中,存在的管理难度大,业务扩展性弱的缺陷。服务器105也可以为分布式系统的服务器,或者是结合了区块链的服务器。需要说明的是,本公开实施例所提供的任务处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的任务处理装置一般可以设置于服务器105中。本公开实施例所提供的任务处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的任务处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
或者,本公开实施例所提供的任务处理方法一般也可以由终端设备101、102、或103执行。相应地,本公开实施例所提供的任务处理装置也可以设置于终端设备101、102、或103中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
应注意,以下方法中各个操作的序号仅作为该操作的表示以便描述,而不应被看作表示该各个操作的执行顺序。除非明确指出,否则该方法不需要完全按照所示顺序来执行。
图2示意性示出了根据本公开实施例的内容处理方法的流程图。
如图2所示,该方法200包括操作S210~S230。
在操作S210,响应于接收到任务处理请求,根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据。任务标注数据的标签信息与任务类型标识相匹配。任务标注数据包括第一任务标注数据和第二任务标注数据。
在操作S220,利用第一任务标注数据训练待训练模型,得到多个候选模型。待训练模型是根据任务类型标识确定的。
在操作S230,根据利用第二任务标注数据对多个候选模型进行性能评估得到的性能评估结果,从多个候选模型中确定目标模型。
根据本公开的实施例,任务处理请求可以指用于请求对与任务类型对应的任务进行处理的请求。任务类型可以用任务类型标识来表征。任务处理请求可以包括任务类型标识。任务可以包括针对待训练模型的训练任务和针对候选模型的测试任务。针对候选模型的测试任务可以指对候选模型进行性能评估的任务。
根据本公开的实施例,任务类型标识可以包括以下至少一项:图像处理任务标识、文本处理任务标识和音频处理任务标识。图像处理任务标识用于表征图像处理任务。文本处理任务标识用于表征文本处理任务。音频处理任务标识用于表征音频处理任务。图像识别任务标识用于表征图像识别任务。
根据本公开的实施例,图像处理任务标识可以包括以下至少一项:图像识别任务标识、图像分割任务标识和目标检测任务标识。图像分割任务标识用于表征图像分割任务。目标检测任务标识用于表征目标检测任务。文本识别任务标识用于表征文本识别任务。
根据本公开的实施例,文本处理任务标识可以包括以下至少一项:文本识别任务标识、文本检测任务标识和文本翻译任务标识。文本检测任务标识用于表征文本检测任务。文本翻译任务标识用于表征任务翻译任务。语音识别任务标识用于表征语音识别任务。文本检测任务标识可以包括以下至少一项:主体分类任务标识、方向判别任务标识、主体检测任务标识、字段级别检测任务标识和场景识别任务标识。主体分类任务标识用于表征主体分类任务。方向判别任务标识用于表征方向判别任务。主体检测任务标识用于表征主体检测任务。字段级别检测任务标识用于表征字段级别检测任务。场景识别任务标识用于表征场景识别任务。
根据本公开的实施例,音频处理任务标识可以包括以下至少一项:语音识别任务标识、语音翻译任务标识和语音合成任务标识。语音翻译任务标识用于表征语音翻译任务。语音合成任务标识用于表征语音合成任务。
根据本公开的实施例,候选模型可以指训练完成的待训练模型。待训练模型可以是与任务类型标识所表征的任务类型对应的模型。待训练模型可以包括以下至少一项:图像处理模型、文本处理模型和音频处理模型。图像处理模型可以包括以下至少一项:图像识别模型、图像分割模型和目标检测模型。文本处理模型可以包括以下至少一项:文本识别模型、文本检测模型和文本翻译模型。音频处理模型可以包括以下至少一项:语音识别模型、语音翻译模型和语音合成模型。文本检测模型可以包括以下至少一项:主体分类模块、方向判别模块、主体检测模块、字段级别检测模块和场景识别模块。
根据本公开的实施例,标注数据可以指包括有全量标签信息的任务数据。待处理的标注数据可以指与任务类型标识所表征的任务类型相对应的标注数据。任务标注数据可以指与任务类型标识所表征的任务类型相匹配的标注数据。任务标注数据可以包括任务数据和任务数据的标签信息。
根据本公开的实施例,任务标注数据可以包括第一任务标注数据和第二任务标注数据。第一任务标注数据可以用于执行待训练模型的模型训练任务。第二任务标注数据可以用于执行候选模型的测试任务,即,第二任务标注数据可以用于对候选模型进行进行性能评估。任务标注数据中第一任务标注数据与第二任务标注数据的数目比值可以根据实际业务需求进行配置,在此不作限定。例如,数目比值是7∶3。
根据本公开的实施例,可以响应于接收到任务处理请求,对任务处理请求进行解析,得到任务类型标识。可以根据任务处理请求指示的任务类型标识确定任务类型,根据任务类型确定待处理的标注数据。根据任务类型对待处理的标注数据进行解析,得到任务标注数据。
根据本公开的实施例,在获得任务标注数据之后,在针对同一待训练模型的情况下,针对多个超参数信息中的每个超参数信息,在该超参数信息的情况下,第一任务标注数据对待训练模型进行训练,得到与超参数信息对应的候选模型。由此可以得到与多个超参数信息各自对应的候选模型。超参数信息可以包括以下至少一项:训练次数、学习速率、神经网络模型的隐藏层的数目和神经网络模型的每层的神经元的数目。
根据本公开的实施例,在获得多个候选模型之后,可以基于性能评估指标,利用第二任务标注数据对多个候选模型中的每个候选模型进行性能评估,得到多个候选模型各自的性能评估结果。性能评估指标可以指用于评估候选模型的模型性能的指标。性能评估指标可以包括以下至少一项:准确率(即Accuracy)、精确率(即Precision)、召回率(即Recall)、调和精确率与召回率(即F1)、灵敏度(即Sensitivity)、混淆矩阵和ROC(ReceiverOperating Characteristic,受试者工作特征)曲线。
根据本公开的实施例,可以根据多个候选模型各自的性能评估结果,从多个候选模型中确定目标模型。目标模型可以指性能评估结果满足预定条件的模型。
根据本公开的实施例,待训练模型是根据任务类型标识确定的,即,每个待训练模型具有与该模型对应的任务类型标识,从而实现了模型的统一管理。通过利用第一任务标注数据训练待训练模型,得到多个候选模型,再利用第二任务标注数据对多个候选模型进行性能评估,实现了模型训练和模型测试同步进行,即,实现了边训边测,进而提高了模型训练效率,降低了时间成本和人力成本。
下面参考图3~图6,结合具体实施例对根据本公开实施例所述的任务处理方法做进一步说明。
图3示意性示出了根据本公开实施例的根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据的流程图。
如图3所示,该方法300包括操作S311~S313。
在操作S311,根据任务处理请求指示的任务类型标识,确定数据字段信息。
在操作S312,根据任务处理请求指示的标注数据标识,获取待处理的标注数据。
在操作S313,根据数据字段信息对待处理的标注数据进行解析,得到任务标注数据。
根据本公开的实施例,任务处理请求可以包括任务类型标识和标注数据标识。标注数据标识可以用于表征需要参与任务的包括有全量标签信息的标注数据。数据字段信息可以指与任务类型标识所表征的任务类型相对应的标签字段信息。
根据本公开的实施例,可以响应于接收到任务处理请求,对任务处理请求进行解析,得到任务类型标识和标注数据标识。再根据任务类型标识确定与任务类型标识所表征的任务类型相匹配的数据字段信息。根据标注数据标识,确定参与与任务类型所表征的任务相对应的待处理的标注数据。最后,根据数据字段信息对待处理的标注数据进行解析,从而得到与任务类型标识所表征的任务类型相匹配的任务标注数据。
例如,任务类型标识是主体分类任务标识。标注数据标识是与文本检测相关的标注数据标识。由此,数据字段信息是主体分类字段信息。基于主体分类字段信息对待处理的标注数据进行解析,得到与主体分类任务对应的任务标注数据。
根据本公开的实施例,操作S313可以包括如下操作。
调用解析工具。基于数据字段信息,利用解析工具对待处理的标注数据进行解析,得到任务标注数据。
根据本公开的实施例,解析工具可以指用于对待处理的标注数据进行解析的工具。解析工具可以包括与用于解析待处理的标注数据相关的例程。可以响应于接收到任务处理请求,调用解析工具。基于数据字段信息,利用解析工具,对待处理的标注数据进行解析,得到与任务标注数据。
根据本公开的实施例,上述任务处理方法还可以包括如下操作。
根据任务处理请求,确定模型配置信息。根据任务类型标识,确定标准任务模型。标准任务模型包括多个标准模型结构。根据模型配置信息从多个标准模型结构中确定至少一个目标模型结构,得到待训练模型。
根据本公开的实施例,模型配置信息可以指与用于获得参与任务的待训练模型相对应的配置信息。模型配置信息可以包括以下至少一项:标准模型结构的数目和模型结构功能信息。模型配置信息还可以包括与损失函数相关的配置信息。
根据本公开的实施例,标准任务模型可以指与任务相关的包括全量标准模型结构的模型。标准模型结构可以指能够实现基础功能的模型结构。标准模型结构可以包括至少一个模型子结构和不同模型子结构之间的连接关系。标准模型结构可以是基于不同模型子结构之间的连接关系,将至少一个模型子结构进行连接得到的结构。标准模型结构包括的至少一个模型子结构可以是来自至少一个操作层的结构,即,标准模型结构可以是基于不同模型子结构之间的连接关系,将来自至少一个操作层的至少一个模型子结构进行连接得到的结构。例如,至少一个操作层可以包括以下至少一项:输入层、卷积层、池化层、全连接层、批量归一化层和非线性层等。至少一个模型子结构可以包括以下至少一项:卷积结构(即卷积核)、池化结构(即池化核)、全连接结构和归一化结构等。不同模型子结构的超参数相同或不同。模型子结构的超参数可以包括以下至少一项:模型子结构的尺寸、模型子结构的数目和步长等。例如,卷积结构的超参数可以包括以下至少一项:卷积结构的尺寸、卷积结构的数目和卷积步长。连接关系可以包括相加和通道合并等。
根据本公开的实施例,可以响应于接收到任务处理请求,对任务处理请求进行解析,得到模型配置信息和任务类型标识。然后,根据任务类型标识,确定与任务类型标识对应的包括多个标准模型结构的标准任务模型。再从多个标准模型结构中确定与模型配置信息包括的标准模型结构的数目和模型结构功能信息相匹配的至少一个目标模型结构。最后,可以根据至少一个目标模型结构,得到待训练模型。例如,可以将至少一个目标模型结构确定为待训练模型。
根据本公开的实施例,通过基于模型配置信息从多个标准模型结构中确定至少一个目标模型结构,模型配置信息可以根据实际业务需求进行配置,实现了模型结构的灵活配置,提高了模型训练的灵活性。
根据本公开的实施例,上述任务处理方法还可以包括如下操作。
响应于接收到模型结构添加请求,确定待添加模型结构。将待添加模型结构添加至模型结构库,以便利用待添加模型结构进行模型训练。
根据本公开的实施例,模型结构添加请求可以指请求向模型结构库中添加模型结构的请求。模型结构添加请求可以是根据与待添加模型结构对应的待添加模型结构标识生成的。待添加模型结构可以是响应于检测到模型结构添加操作被触发得到的。例如,响应于检测到针对待添加模型结构的确定控件被触发,得到待添加模型结构。模型结构库可以包括针对不同任务的模型结构。
根据本公开的实施例,可以支持用户上传待添加模型至模型结构库中。基于模型配置信息,自动匹配和检索模型结构,提高了模型训练的灵活性。
根据本公开的实施例,上述任务处理方法还可以包括如下操作。
响应于接收到数据标注请求,确定待标注数据。基于预定数据格式,利用预标注模型对待标注数据进行标注,得到预标注数据。对预标注数据的标签信息进行调整,得到标注数据。
根据本公开的实施例,数据标注请求可以指用于对待标注数据进行标注的请求。待标注数据可以指需要进行数据标注的数据。预定数据格式可以指满足实际需求而设定的数据格式。例如,预定数据格式可以包括JOSN(JavaScript Object Notation,JS对象简谱)。预标注模型可以用于实现对待标注模型的预标注。
根据本公开的实施例,可以响应于接收到数据标注请求,对数据标注请求进行解析,得到待标注数据。然后,可以利用预标注模型按照预定数据格式对待标注数据进行标注的,得到预标注数据。预标注数据可以包括标签信息。最后,可以基于业务需求,对预标注数据的标签信息进行调整,得到标注数据。
根据本公开的实施例,对基于预定数据格式,利用预标注模型对待标注数据进行标注得到预标注数据的标签信息进行调整,得到标注数据,实现了标注数据的自动生成和数据格式的统一,降低了数据标注耗时和提高了模型训练效率。
根据本公开的实施例,上述任务处理方法还可以包括如下操作。
响应于检测到数据标注操作被触发,生成数据标注请求。
根据本公开的实施例,数据标注操作可以包括针对待标注数据的选择控件或输入控件的操作。
根据本公开的实施例,上述任务处理方法还可以包括如下操作。
将标注数据存储至数据仓库。
根据本公开的实施例,标注数据可以包括数据和与数据对应的标签信息。数据仓库不仅可以用于存储各种数据格式的数据,还可以用于存储与数据对应的标签信息。
根据本公开的实施例,可以从数据仓库中获取待标注数据,将待标注数据进行标注后,还可以将标注数据存储至数据仓库。
根据本公开的实施例,上述任务处理方法还可以包括如下操作。
响应于接收到任务处理请求,确定与任务类型标识对应的数据处理策略。利用数据处理策略对标注数据进行处理,得到与任务类型标识对应的标注数据。与任务类型标识对应的标注数据包括待处理的标注数据。
根据本公开的实施例,数据处理策略可以指对标注数据进行处理的策略。数据处理策略可以包括如何获得与任务类型标识对应的标注数据的内容。例如,数据处理策略可以包括以下至少一项:数据合并策略和数据拆分策略。数据合并策略可以指对不同标注数据进行数据合并的策略。数据拆分策略可以指对标注数据进行数据拆分的策略。
根据本公开的实施例,可以响应于接收到任务处理请求,对任务处理请求进行解析,得到任务类型标识。可以确定与任务类型标识对应的数据处理策略。再利用数据处理策略处理标注数据,得到与任务对应的标注数据。
例如,任务处理请求是针对图像识别任务的请求。获取与图像识别任务相关的多个标注数据。确定针对该多个标注数据的数据处理策略是数据合并策略。可以基于数据合并策略,对多个标注数据进行数据合并,得到与图像识别任务对应的标注数据。
图4示意性示出了根据本公开实施例的任务处理过程的示例示意图。
如图4所示,在400中,根据任务处理请求指示的任务类型标识401,确定数据字段信息402。根据任务处理请求指示的标注数据标识403,获取待处理的标注数据404。根据数据字段信息402对待处理的标注数据404进行解析,得到任务标注数据405。任务标注数据405可以包括第一任务标注数据405_1和第二任务标注数据405_2。
利用第一任务标注数据405_1训练待训练模型406,得到多个候选模型407。利用第二任务标注数据405_2对多个候选模型407进行性能评估,得到性能评估结果408。根据性能评估结果408,从多个候选模型407中确定目标模型409。
图5示意性示出了根据本公开实施例的将待添加模型结构添加至模型结构库的示例示意图。
如图5所示,在500中,在显示界面501中确定待添加模型结构502,通过点击模型添加控件503,触发模型结构添加操作。响应于检测到模型结构添加操作被触发,将待添加模型结构502添加至模型结构库504,以便利用待添加模型结构502进行模型训练。
图6示意性示出了根据本公开实施例的获得标注数据的示例示意图。
如图6所示,在600中,在显示界面601中确定待标注数据602,通过点击针对数据标注的确定控件603,触发数据标注操作。响应于检测到数据标注操作被触发,基于预定数据格式,利用预标注模型604对待标注数据进行标注,得到预标注数据605。对预标注数据605的标签信息进行调整,得到标注数据606。
以上仅是示例性实施例,但不限于此,还可以包括本领域已知的其他任务处理方法,只要能够实现任务处理即可。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
图7示意性示出了根据本公开实施例的任务处理装置的框图。
如图7所示,任务处理装置700可以包括解析模块710、训练模块720和评估模块730。
解析模块710,用于响应于接收到任务处理请求,根据任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据。任务标注数据的标签信息与任务类型标识相匹配,任务标注数据包括第一任务标注数据和第二任务标注数据。
训练模块720,用于利用第一任务标注数据训练待训练模型,得到多个候选模型。待训练模型是根据任务类型标识确定的。
评估模块730,用于根据利用第二任务标注数据对多个候选模型进行性能评估得到的性能评估结果,从多个候选模型中确定目标模型。
根据本公开的实施例,解析模块710可以包括确定子模块、获取子模块和解析子模块。
确定子模块,用于根据任务处理请求指示的任务类型标识,确定数据字段信息。
获取子模块,用于根据任务处理请求指示的标注数据标识,获取待处理的标注数据。
解析子模块,用于根据数据字段信息对待处理的标注数据进行解析,得到任务标注数据。
根据本公开的实施例,解析子模块可以包括调用单元和解析单元。
调用单元,用于调用解析工具。
解析单元,用于基于数据字段信息,利用解析工具对待处理的标注数据进行解析,得到任务标注数据。
根据本公开的实施例,上述任务处理装置700还可以包括第一确定模块、第二确定模块和第三确定模块。
第一确定模块,用于根据任务处理请求,确定模型配置信息。
第二确定模块,用于根据任务类型标识,确定标准任务模型。标准任务模型包括多个标准模型结构。
第三确定模块,用于根据模型配置信息从多个标准模型结构中确定至少一个目标模型结构,得到待训练模型。
根据本公开的实施例,上述任务处理装置700还可以包括第四确定模块和添加模块。
第四确定模块,用于响应于接收到模型结构添加请求,确定待添加模型结构。
添加模块,用于将待添加模型结构添加至模型结构库,以便利用待添加模型结构进行模型训练。
根据本公开的实施例,上述任务处理装置700还可以包括第五确定模块、标注模块和调整模块。
第五确定模块,用于响应于接收到数据标注请求,确定待标注数据。
标注模块,用于基于预定数据格式,利用预标注模型对待标注数据进行标注,得到预标注数据。
调整模块,用于对预标注数据的标签信息进行调整,得到标注数据。
根据本公开的实施例,上述任务处理装置700还可以包括生成模块。
生成模块,用于响应于检测到数据标注操作被触发,生成数据标注请求。
根据本公开的实施例,上述任务处理装置700还可以包括存储模块。
存储模块,用于将标注数据存储至数据仓库。
根据本公开的实施例,上述任务处理装置700还可以包括第六确定模块和获得模块。
第六确定模块,用于响应于接收到任务处理请求,确定与任务类型标识对应的数据处理策略。
获得模块,用于利用数据处理策略对标注数据进行处理,得到与任务类型标识对应的标注数据。与任务类型标识对应的标注数据包括待处理的标注数据。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
根据本公开的实施例,一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上所述的方法。
根据本公开的实施例,一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上所述的方法。
根据本公开的实施例,一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上所述的方法。
图8示意性示出了根据本公开实施例的适于实现任务处理方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,电子设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储电子设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
电子设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许电子设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如任务处理方法。例如,在一些实施例中,任务处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到电子设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的任务处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行任务处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以是分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (18)
1.一种任务处理方法,包括:
响应于接收到任务处理请求,根据所述任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,其中,所述任务标注数据的标签信息与所述任务类型标识相匹配,所述任务标注数据包括第一任务标注数据和第二任务标注数据;
利用所述第一任务标注数据训练待训练模型,得到多个候选模型,其中,所述待训练模型是根据所述任务类型标识确定的;以及
根据利用所述第二任务标注数据对所述多个候选模型进行性能评估得到的性能评估结果,从所述多个候选模型中确定目标模型;
其中,所述根据所述任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,包括:
根据所述任务处理请求指示的任务类型标识,确定数据字段信息,其中,所述数据字段信息指与所述任务类型标识表征的任务类型相对应的标签字段信息;
根据所述任务处理请求指示的标注数据标识,获取所述待处理的标注数据,其中,所述标注数据标识用于表征需要参与任务的包括有全量标签信息的标注数据;以及
根据所述数据字段信息对所述待处理的标注数据进行解析,得到所述任务标注数据。
2. 根据权利要求1所述的方法,其中,所述根据所述数据字段信息对所述待处理的标注数据进行解析,得到任务标注数据,包括:
调用解析工具;以及
基于所述数据字段信息,利用所述解析工具对所述待处理的标注数据进行解析,得到所述任务标注数据。
3.根据权利要求1或2所述的方法,还包括:
根据所述任务处理请求,确定模型配置信息;
根据所述任务类型标识,确定标准任务模型,其中,所述标准任务模型包括多个标准模型结构;以及
根据所述模型配置信息从所述多个标准模型结构中确定至少一个目标模型结构,得到所述待训练模型。
4. 根据权利要求1或2所述的方法,还包括:
响应于接收到模型结构添加请求,确定待添加模型结构;以及
将所述待添加模型结构添加至模型结构库,以便利用所述待添加模型结构进行模型训练。
5.根据权利要求1或2所述的方法,还包括:
响应于接收到数据标注请求,确定待标注数据;
基于预定数据格式,利用预标注模型对所述待标注数据进行标注,得到预标注数据;以及
对所述预标注数据的标签信息进行调整,得到标注数据。
6.根据权利要求5所述的方法,还包括:
响应于检测到数据标注操作被触发,生成所述数据标注请求。
7.根据权利要求5所述的方法,还包括:
将所述标注数据存储至数据仓库。
8. 根据权利要求5所述的方法,还包括:
响应于接收到所述任务处理请求,确定与所述任务类型标识对应的数据处理策略;以及
利用所述数据处理策略对所述标注数据进行处理,得到与所述任务类型标识对应的标注数据,其中,与所述任务类型标识对应的标注数据包括所述待处理的标注数据。
9.一种任务处理装置,包括:
解析模块,用于响应于接收到任务处理请求,根据所述任务处理请求指示的任务类型标识,对待处理的标注数据进行解析,得到任务标注数据,其中,所述任务标注数据的标签信息与所述任务类型标识相匹配,所述任务标注数据包括第一任务标注数据和第二任务标注数据;
训练模块,用于利用所述第一任务标注数据训练待训练模型,得到多个候选模型,其中,所述待训练模型是根据所述任务类型标识确定的;以及
评估模块,用于根据利用所述第二任务标注数据对所述多个候选模型进行性能评估得到的性能评估结果,从所述多个候选模型中确定目标模型;
其中,所述解析模块,包括:
确定子模块,用于根据所述任务处理请求指示的任务类型标识,确定数据字段信息,其中,所述数据字段信息指与所述任务类型标识表征的任务类型相对应的标签字段信息;
获取子模块,用于根据所述任务处理请求指示的标注数据标识,获取所述待处理的标注数据,其中,所述标注数据标识用于表征需要参与任务的包括有全量标签信息的标注数据;以及
解析子模块,用于根据所述数据字段信息对所述待处理的标注数据进行解析,得到所述任务标注数据。
10. 根据权利要求9所述的装置,其中,所述解析子模块,包括:
调用单元,用于调用解析工具;以及
解析单元,用于基于所述数据字段信息,利用所述解析工具对所述待处理的标注数据进行解析,得到任务标注数据。
11.根据权利要求9或10所述的装置,还包括:
第一确定模块,用于根据所述任务处理请求,确定模型配置信息;
第二确定模块,用于根据所述任务类型标识,确定标准任务模型,其中,所述标准任务模型包括多个标准模型结构;以及
第三确定模块,用于根据所述模型配置信息从所述多个标准模型结构中确定至少一个目标模型结构,得到所述待训练模型。
12. 根据权利要求9或10所述的装置,还包括:
第四确定模块,用于响应于接收到模型结构添加请求,确定待添加模型结构;以及
添加模块,用于将所述待添加模型结构添加至模型结构库,以便利用所述待添加模型结构进行模型训练。
13.根据权利要求9或10所述的装置,还包括:
第五确定模块,用于响应于接收到数据标注请求,确定待标注数据;
标注模块,用于基于预定数据格式,利用预标注模型对所述待标注数据进行标注,得到预标注数据;以及
调整模块,用于对所述预标注数据的标签信息进行调整,得到标注数据。
14.根据权利要求13所述的装置,还包括:
生成模块,用于响应于检测到数据标注操作被触发,生成所述数据标注请求。
15.根据权利要求13所述的装置,还包括:
存储模块,用于将所述标注数据存储至数据仓库。
16. 根据权利要求13所述的装置,还包括:
第六确定模块,用于响应于接收到所述任务处理请求,确定与所述任务类型标识对应的数据处理策略;以及
获得模块,用于利用所述数据处理策略对所述标注数据进行处理,得到与所述任务类型标识对应的标注数据,其中,与所述任务类型标识对应的标注数据包括所述待处理的标注数据。
17. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1~8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1~8中任一项所述的方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210110164.4A CN114428677B (zh) | 2022-01-28 | 2022-01-28 | 任务处理方法、处理装置、电子设备及存储介质 |
JP2022197613A JP2023036681A (ja) | 2022-01-28 | 2022-12-12 | タスク処理方法、処理装置、電子機器、記憶媒体及びコンピュータプログラム |
KR1020220174527A KR20230007268A (ko) | 2022-01-28 | 2022-12-14 | 임무 처리 방법, 임무 처리 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램 |
US18/146,839 US20230134615A1 (en) | 2022-01-28 | 2022-12-27 | Method of processing task, electronic device, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210110164.4A CN114428677B (zh) | 2022-01-28 | 2022-01-28 | 任务处理方法、处理装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114428677A CN114428677A (zh) | 2022-05-03 |
CN114428677B true CN114428677B (zh) | 2023-09-12 |
Family
ID=81312957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210110164.4A Active CN114428677B (zh) | 2022-01-28 | 2022-01-28 | 任务处理方法、处理装置、电子设备及存储介质 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230134615A1 (zh) |
JP (1) | JP2023036681A (zh) |
KR (1) | KR20230007268A (zh) |
CN (1) | CN114428677B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117076916A (zh) * | 2022-05-05 | 2023-11-17 | 维沃移动通信有限公司 | 模型选择方法、装置及网络侧设备 |
CN114860346B (zh) * | 2022-06-02 | 2024-06-04 | 北京百度网讯科技有限公司 | 建模任务的管理方法和建模任务的运行方法 |
CN114970741B (zh) * | 2022-06-15 | 2024-06-28 | 北京百度网讯科技有限公司 | 数据处理方法、装置及电子设备 |
CN114757630B (zh) * | 2022-06-16 | 2022-10-14 | 阿里健康科技(杭州)有限公司 | 仓储管理模型确定方法、装置及计算机设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210624A (zh) * | 2018-07-05 | 2019-09-06 | 第四范式(北京)技术有限公司 | 执行机器学习过程的方法、装置、设备以及存储介质 |
US10474713B1 (en) * | 2018-10-26 | 2019-11-12 | StradVision, Inc. | Learning method and learning device using multiple labeled databases with different label sets and testing method and testing device using the same |
CN111079175A (zh) * | 2019-11-26 | 2020-04-28 | 微民保险代理有限公司 | 数据处理方法、装置、计算机可读存储介质和计算机设备 |
CN111507104A (zh) * | 2020-03-19 | 2020-08-07 | 北京百度网讯科技有限公司 | 建立标签标注模型的方法、装置、电子设备和可读存储介质 |
CN112241452A (zh) * | 2020-10-16 | 2021-01-19 | 百度(中国)有限公司 | 一种模型训练方法、装置、电子设备及存储介质 |
CN112561077A (zh) * | 2020-12-14 | 2021-03-26 | 北京百度网讯科技有限公司 | 多任务模型的训练方法、装置及电子设备 |
CN112861512A (zh) * | 2021-02-05 | 2021-05-28 | 北京百度网讯科技有限公司 | 数据处理方法、装置、设备以及存储介质 |
WO2021139191A1 (zh) * | 2020-01-08 | 2021-07-15 | 华为技术有限公司 | 数据标注的方法以及数据标注的装置 |
CN113283500A (zh) * | 2021-05-24 | 2021-08-20 | 康键信息技术(深圳)有限公司 | 医疗问诊数据的处理方法、装置、设备及存储介质 |
CN113705554A (zh) * | 2021-08-13 | 2021-11-26 | 北京百度网讯科技有限公司 | 图像识别模型的训练方法、装置、设备及存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018269941A1 (en) * | 2017-05-14 | 2019-12-05 | Digital Reasoning Systems, Inc. | Systems and methods for rapidly building, managing, and sharing machine learning models |
US20210216910A1 (en) * | 2019-03-29 | 2021-07-15 | Rakuten, Inc. | Learning system, learning method, and program |
CN113837374A (zh) * | 2020-06-23 | 2021-12-24 | 中兴通讯股份有限公司 | 神经网络的生成方法、设备及计算机可读存储介质 |
-
2022
- 2022-01-28 CN CN202210110164.4A patent/CN114428677B/zh active Active
- 2022-12-12 JP JP2022197613A patent/JP2023036681A/ja active Pending
- 2022-12-14 KR KR1020220174527A patent/KR20230007268A/ko unknown
- 2022-12-27 US US18/146,839 patent/US20230134615A1/en not_active Abandoned
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210624A (zh) * | 2018-07-05 | 2019-09-06 | 第四范式(北京)技术有限公司 | 执行机器学习过程的方法、装置、设备以及存储介质 |
US10474713B1 (en) * | 2018-10-26 | 2019-11-12 | StradVision, Inc. | Learning method and learning device using multiple labeled databases with different label sets and testing method and testing device using the same |
CN111079175A (zh) * | 2019-11-26 | 2020-04-28 | 微民保险代理有限公司 | 数据处理方法、装置、计算机可读存储介质和计算机设备 |
WO2021139191A1 (zh) * | 2020-01-08 | 2021-07-15 | 华为技术有限公司 | 数据标注的方法以及数据标注的装置 |
CN111507104A (zh) * | 2020-03-19 | 2020-08-07 | 北京百度网讯科技有限公司 | 建立标签标注模型的方法、装置、电子设备和可读存储介质 |
CN112241452A (zh) * | 2020-10-16 | 2021-01-19 | 百度(中国)有限公司 | 一种模型训练方法、装置、电子设备及存储介质 |
CN112561077A (zh) * | 2020-12-14 | 2021-03-26 | 北京百度网讯科技有限公司 | 多任务模型的训练方法、装置及电子设备 |
CN112861512A (zh) * | 2021-02-05 | 2021-05-28 | 北京百度网讯科技有限公司 | 数据处理方法、装置、设备以及存储介质 |
CN113283500A (zh) * | 2021-05-24 | 2021-08-20 | 康键信息技术(深圳)有限公司 | 医疗问诊数据的处理方法、装置、设备及存储介质 |
CN113705554A (zh) * | 2021-08-13 | 2021-11-26 | 北京百度网讯科技有限公司 | 图像识别模型的训练方法、装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于Android的众包文本标注系统的设计与实现;孔敏;《中国优秀硕士学位论文全文数据库 信息科技辑》(第7期);I138-1512 * |
Also Published As
Publication number | Publication date |
---|---|
CN114428677A (zh) | 2022-05-03 |
JP2023036681A (ja) | 2023-03-14 |
KR20230007268A (ko) | 2023-01-12 |
US20230134615A1 (en) | 2023-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114428677B (zh) | 任务处理方法、处理装置、电子设备及存储介质 | |
CN113780098B (zh) | 文字识别方法、装置、电子设备以及存储介质 | |
US20230008696A1 (en) | Method for incrementing sample image | |
CN114429633B (zh) | 文本识别方法、模型的训练方法、装置、电子设备及介质 | |
CN112818111A (zh) | 文档推荐方法、装置、电子设备和介质 | |
CN114692778B (zh) | 用于智能巡检的多模态样本集生成方法、训练方法及装置 | |
CN111160410A (zh) | 一种物体检测方法和装置 | |
CN113204695B (zh) | 网站识别方法和装置 | |
CN116340172A (zh) | 基于测试场景的数据收集方法、装置及测试用例检测方法 | |
CN116468479A (zh) | 确定页面质量评估维度方法、页面质量的评估方法和装置 | |
CN115600607A (zh) | 一种日志检测方法、装置、电子设备及介质 | |
CN112818221B (zh) | 实体的热度确定方法、装置、电子设备及存储介质 | |
CN114120410A (zh) | 用于生成标签信息的方法、装置、设备、介质和产品 | |
CN113850072A (zh) | 文本情感分析方法、情感分析模型训练方法、装置、设备及介质 | |
CN113641933A (zh) | 异常网页识别方法、异常站点识别方法及装置 | |
CN113239273A (zh) | 用于生成文本的方法、装置、设备以及存储介质 | |
CN113032251A (zh) | 应用程序服务质量的确定方法、设备和存储介质 | |
CN114926447B (zh) | 用于训练模型的方法、用于检测目标的方法和装置 | |
CN113360602B (zh) | 用于输出信息的方法、装置、设备以及存储介质 | |
CN114461502B (zh) | 模型的监控方法和装置 | |
CN114998906A (zh) | 文本检测方法、模型的训练方法、装置、电子设备及介质 | |
CN116680198A (zh) | 一种接口返回数据异常检测方法及其相关设备 | |
CN117633226A (zh) | 一种分类方法、装置、存储介质及电子设备 | |
CN117851546A (zh) | 资源检索方法、训练方法、装置、电子设备、存储介质及程序产品 | |
CN114329219A (zh) | 数据处理方法、用于输出知识内容的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |