CN113821600B - 基于语义理解的加工委托信息提取方法和装置 - Google Patents
基于语义理解的加工委托信息提取方法和装置 Download PDFInfo
- Publication number
- CN113821600B CN113821600B CN202111128717.0A CN202111128717A CN113821600B CN 113821600 B CN113821600 B CN 113821600B CN 202111128717 A CN202111128717 A CN 202111128717A CN 113821600 B CN113821600 B CN 113821600B
- Authority
- CN
- China
- Prior art keywords
- processing
- answer
- training
- machining
- element information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 196
- 238000000605 extraction Methods 0.000 title claims abstract description 134
- 238000012549 training Methods 0.000 claims abstract description 137
- 238000003754 machining Methods 0.000 claims abstract description 117
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000007781 pre-processing Methods 0.000 claims description 40
- 238000012360 testing method Methods 0.000 claims description 35
- 238000012795 verification Methods 0.000 claims description 33
- 238000005520 cutting process Methods 0.000 claims description 30
- 238000012805 post-processing Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 20
- 238000013528 artificial neural network Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 12
- 238000005457 optimization Methods 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 21
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 8
- 229910000831 Steel Inorganic materials 0.000 description 7
- 238000010008 shearing Methods 0.000 description 7
- 239000010959 steel Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种基于语义理解的加工委托信息提取方法和装置,该方法包括:接收加工委托信息;根据加工类型识别模型识别所述加工委托信息中的加工类型;基于所述加工类型,确定对应的信息抽取问题模板;以及根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息。通过本申请提出的基于语义理解的加工委托信息提取方案,能够自适应加工委托信息中不同客户表示方式,并通过训练学习不断提升信息提取效果,降低人工成本并提升工作效率。
Description
技术领域
本申请涉及人工智能技术应用领域,尤其涉及一种基于语义理解的加工委托信息提取方法和装置。
背景技术
目前,电商平台客户有委托加工需求时,例如钢铁电商平台客户有钢卷剪切委托加工需求时,通常在平台上填写委托单,将成品信息和加工要求以一段话来描述说明,委托单下到加工厂,需要专业人员人工提取加工要素信息,才能进行下一步生产加工流程。
由于客户输入表述习惯各不相同,采用常规的规则和模板匹配方法经常会因词义表述的变化而失效,无法自适应,难以有效提取所需的加工要素信息,也就无法进一步做后续的自动排刀、自动算价等智能化运营。
从而,迫切希望实现加工委托信息的自动提取,以满足智能化运营和服务的发展需要。
发明内容
针对现有技术中存在的问题,本申请提供了一种基于语义理解的加工委托信息提取方案,能够自适应加工委托信息中不同客户表示方式,并通过训练学习不断提升信息提取效果,降低人工成本并提升工作效率。
根据本申请的第一个方面,提供一种基于语义理解的加工委托信息提取方法,其包括:
接收加工委托信息;
根据加工类型识别模型识别所述加工委托信息中的加工类型;
基于所述加工类型,确定对应的信息抽取问题模板;以及
根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息。
根据本申请的第二个方面,提供一种基于语义理解的加工委托信息提取装置,其包括:
接收单元,用于接收加工委托信息;
加工类型识别单元,用于根据加工类型识别模型识别所述加工委托信息中的加工类型;
信息抽取问题模板确定单元,用于基于所述加工类型,确定对应的信息抽取问题模板;以及
加工要素信息提取单元,用于根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息。
根据本发明的第三个方面,提供一种电子设备,包括:
处理器;以及
存储器,存储有计算机指令,当所述计算机指令被所述处理器执行时,使得所述处理器执行第一方面所述的方法。
根据本发明的第四个方面,提供一种非瞬时性计算机存储介质,存储有计算机程序,当所述计算机程序被多个处理器执行时,使得所述处理器执行第一方面所述的方法。
根据本申请提成的基于语义理解的加工委托信息提取方案,至少带来如下好处:
(1)采用机器语义理解方法提取加工要素信息,解决了规则和模板匹配方法无法适应不同客户表述方式、提取加工要素信息困难的问题。
(2)规则和模板匹配方法需要人工分析和维护规则、模板,效率低下,泛化能力弱,无法自适应;而本申请采用的方法,能够通过新增样本,重新训练学习,不断提升模型效果。
(3)通过机器识别和理解,并抽取所需的加工要素信息,实现自动化转换为符合加工厂要求的结构化信息,人工只需做审核,从而降低人工转换成本,提升工作效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图,而并不超出本申请要求保护的范围。
图1是基于语义理解的加工委托信息提取方案的流程示意图。
图2是基于语义理解的加工委托信息提取方法的流程图。
图3是基于语义理解的加工委托信息提取装置的示意图。
图4是本发明提供的一种电子设备的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1是基于语义理解的加工委托信息提取方案的流程示意图。如图1所示,在加工委托信息提取方案中,首先获取客户的加工委托信息说明,例如,加工委托信息说明为“加工要求:刀次1:61mm*14+100mm*2+47mm*2(61mm裸包15.171吨;100mm裸包3.553吨;47mm裸包1.670吨)=1148mm,排刀重量:20.43吨;备注:原边丝带走,内径610,负0.3以内,件重小于3吨,SPHC出库”。在获取加工委托信息后,应用加工类型识别模型,识别客户委托的加工类型。在该加工委托信息说明中,被模型识别的加工类型为“纵切”。
然后,根据识别出的加工类型,确定对应的信息抽取问题模板。针对不同加工类型,事先预置了需要抽取加工要素的问题模板。例如,针对纵切、横切和先纵切后横切的三种加工类型,分别预置了需要抽取加工要素的三种问题模板。由于在该实施例中识别到“纵切”加工类型,则会启用对应纵切类型的抽取加工要素的问题模板,比如纵切需要抽取分条宽度、分条数量,对应问题分别为“分条加工宽度是多少?”、“分条数量是多少?”,其他要素以此类推。
之后,根据问题模板,应用加工要素信息抽取模型,抽取加工委托信息种的加工要素信息。如果将“加工要求:刀次1:61mm*14+100mm*2+47mm*2(61mm裸包15.171吨;100mm裸包3.553吨;47mm裸包1.670吨)=1148mm,排刀重量:20.43吨;备注:原边丝带走,内径610,负0.3以内,件重小于3吨,SPHC出库”作为段落文档、“分条加工宽度是多少?”作为问题、答案数量=n(表示多个,不唯一)、答案边界阈值=0.9输入到加工要素信息抽取模型中,加工要素信息抽取模型输出答案为列表[61mm,100mm,47mm]。同理,当问题为“分条数量是多少?”时,加工要素信息抽取模型输出分条数量列表[14,2,2]。
最后,对模型抽取出的加工要素信息,进行后处理。通过上面的步骤,已经可以抽取加工要素信息。但是,因为抽取出的加工要素信息是一个个分立的,实际使用时需要配对,比如每个分条宽度和分条数量之间的配对,另外还可能存在出现单位不同等问题,所以需要做后处理;后处理的作用就是经过匹配和修正,使得输出符合实际使用要求。从而,针对模型输出得到的分条宽度列表、分条数量列表按顺序匹配原则匹配,并进行正则规则检验修正,得到匹配结果[(61mm,14),(100mm,2),(47mm,2)]。在后处理后,输出最终的结构化加工要素信息。将所有需要提取的加工要素提取并经后处理的结果,整理成结构化数据输出给下游任务。其他要素的提取方法类似,例如宽度公差、长度公差、对角线、单包件重等要素提取。
上面大致介绍了基于语义理解的加工委托信息提取方案的流程,基于该流程,根据本申请的一个方面,提供一种基于语义理解的加工委托信息提取方法,如图2所示,该方法包括如下步骤。
步骤S201,接收加工委托信息。
可以从平台(例如电商平台)获取加工委托历史样本数据,主要是客户通过平台输入的钢材剪切加工委托说明,通常是一段关于成品信息和质量要求的描述。例如,加工委托信息为“加工要求:刀次1:61mm*14+100mm*2+47mm*2(61mm裸包15.171吨;100mm裸包3.553吨;47mm裸包1.670吨)=1148mm,排刀重量:20.43吨;备注:原边丝带走,内径610,负0.3以内,件重小于3吨,SPHC出库”。
步骤S202,根据加工类型识别模型识别所述加工委托信息中的加工类型。
采用加工类型识别模型识别客户输入的加工委托信息中的加工类型,其中,加工类型包括纵切、横切和先纵切后横切。例如,加工类型识别模型识别上述加工委托信息,获得的加工类型是“纵切”。
步骤S203,基于所述加工类型,确定对应的信息抽取问题模板。
针对不同加工类型,事先预置了需要抽取加工要素的问题模板。例如,针对纵切、横切和先纵切后横切的三种加工类型,分别预置了需要抽取加工要素的三种问题模板。由于在该实施例中识别到“纵切”加工类型,则会启用对应纵切类型的抽取加工要素的问题模板,比如纵切需要抽取分条宽度、分条数量,对应问题分别为“分条加工宽度是多少?”、“分条数量是多少?”。
步骤S204,根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息。
将加工委托信息和问题模板输入加工要素信息抽取模型,提取得到各加工要素信息。
例如,如果将“加工要求:刀次1:61mm*14+100mm*2+47mm*2(61mm裸包15.171吨;100mm裸包3.553吨;47mm裸包1.670吨)=1148mm,排刀重量:20.43吨;备注:原边丝带走,内径610,负0.3以内,件重小于3吨,SPHC出库”作为段落文档、“分条加工宽度是多少?”作为问题、答案数量=n(表示多个,不唯一)、答案边界阈值=0.9输入到加工要素信息抽取模型中,加工要素信息抽取模型输出答案为列表[61mm,100mm,47mm]。同理,当问题为“分条数量是多少?”时,加工要素信息抽取模型输出分条数量列表[14,2,2]。
上述步骤S203和步骤S204中分别采用加工类型识别模型来识别加工委托信息中的加工类型以及加工要素信息抽取模型抽取加工委托信息中的加工要素信息,其中,加工类型识别模型和加工要素信息抽取模型都是经过神经网络训练的。这样,基于语义理解的加工委托信息提取方法还包括:步骤S205,对预加工类型识别模型进行神经网络训练,得到所述加工类型识别模型;以及步骤S206,对预加工要素信息抽取模型进行神经网络训练,得到所述加工要素信息抽取模型。
其中,步骤S205包括如下子步骤:
子步骤S2051,将标注好的分类样本集拆分为训练集、验证集和测试集。
从平台(例如电商平台)获取钢材剪切加工委托样本数据,将每一个客户输入的加工委托信息,标注上加工类型标签,例如共有纵切、横切、先纵切后横切三种类型,形成加工类型识别模型训练所需的分类样本标注集。然后,将标注好的分类样本集按照预定比例拆分为训练集、验证集和测试集,对于标注好的分类样本集,按一定的比例(例如6:2:2)拆分为训练集、验证集、测试集。其中,训练集用于对预加工类型识别模型进行训练,验证集用于验证训练后的预加工类型识别模型的准确性,而测试集用于测试验证后的预加工类型识别模型是否符合准确性的要求。
子步骤S2052,将所述训练集中的训练样本输入预加工类型识别模型进行神经网络训练,经所述预加工类型识别模型前向推理计算输出每个训练样本属于各个加工类型的概率分布以及预测类标签,并计算训练集上的损失。
在一个实施例中,加工类型识别模型采用BERT模块连接一个全连接层和softmax组成的分类网络结构,训练时设定训练批大小batchsize、训练次数epoch等训练超参数,加载BERT中文预训练模型,输入加工委托说明文字段落,模型最终预测输出对应的加工类型。
模型训练采用的损失函数为交叉熵损失函数,训练时可以采用Adam优化器,优化目标是使得损失函数最小。通过微调(finetune)方式训练得到加工委托类型识别的3分类模型。加工委托类型不同,决定后续所需提取加工要素信息。
子步骤S2053,通过所述验证集计算所述预加工类型识别模型的损失,若所述损失小于当前历史最小损失,则更新当前历史最小损失并保存所述预加工类型识别模型的参数。
验证集与训练集为分类样本集不同的部分,采用验证集对训练后的预加工类型识别模型进行验证,可以对训练后的预加工类型识别模型有一个相对准确的估计。
子步骤S2054,经反向传播优化调整所述预加工类型识别模型的网络参数。
在一个实施例中,经反向传播,采用Adam算法优化调整模型网络参数。
子步骤S2055,重复步骤S2052、步骤S2053和步骤S2054,响应于所述当前历史最小损失在连续第一设定次数没有更新或达到设定的训练次数,停止对所述预加工类型识别模型的训练。
其中,第一设定次数可以人为设定。
子步骤S2056,通过所述测试集测试所述预加工类型识别模型的加工类型分类准确率。
子步骤S2057,响应于所述加工类型分类准确率满足第一预设阈值,将所测试后的预加工类型识别模型确定为所述加工类型识别模型。
其中,第一预设阈值可以人为设定,例如可以为95%。
其中,步骤S206包括如下子步骤:
子步骤S2061,将标注好的加工要素信息抽取标注样本集拆分为训练集、验证集和测试集。
从平台(例如电商平台)获取钢材剪切加工委托样本数据,将每一个客户输入的加工委托信息,将由(段落、问题、答案)三元组组成的加工要素信息抽取标注样本集按比例拆分为得到训练集、验证集、测试集,对于标注好的加工要素信息抽取标注样本集,按一定的比例(例如6:2:2)拆分为训练集、验证集、测试集。其中,训练集用于对预加工要素信息抽取模型进行训练,验证集用于验证训练后的预加工要素信息抽取模型的准确性,而测试集用于测试验证后的预加工要素信息抽取模型是否符合准确性的要求。
子步骤S2062,通过所述训练集中的训练样本对所述预加工要素信息抽取模型进行神经网络训练,前向计算得到所述训练集的段落文档中每个词被分类为答案开始位置的概率和答案结束位置的概率。
模型网络结构采用BERT模块连接全连接层+sigmoid函数输出,分别预测段落文档中每一个词被分类为答案的开始位置start、结束位置end的概率,问题直接限定答案数量可以是多个或一个,由开始位置start、结束位置end可以得到文档中所包含的具体的答案片段span。
模型采用的损失函数:
其中,N为训练样本的数量,|Ai|为第i个问题的答案Ai的数量, 分别为第k个答案开始位置和结束位置,/>分别为/>的预测概率。
模型训练时可以采用Adam优化器,优化目标是使得损失函数最小。
具体来说,设定训练超参数,所述训练超参数包括训练批大小batchsize、训练次数epoch、答案边界阈值threshold等,将训练集批量输入加工要素信息抽取模型网络进行迭代训练。其中,答案边界阈值threshold用来控制模型输出候选答案片段span的数量,由人工在模型训练时调整确定。采用Adam优化器微调网络参数,每个训练结束时计算训练集上的损失函数值。训练时,输入训练样本中的问题、段落、答案数量类型(多个、唯一)、答案列表,首先在问题前面添加[CLS]标记,然后问题和段落连在一起,中间使用[SEP]标记分开,组成的序列通过token Embedding、segment embedding和positional embedding输入到BERT预训练模型,得到BERT深层编码表示的隐藏状态,再经全连接层和sigmoid函数得到段落文档中每个词被分类为答案开始、结束位置的概率。
子步骤S2063,根据答案数量类型以及所述答案开始位置的概率和所述答案结束位置的概率,生成所述训练样本对应的答案,并计算训练集上的损失。
具体来说,答案数量类型指示答案的数量为一个或多个,对于这两中不同的情形,子步骤S2063有如下处理过程。
对于答案数量类型指示答案数量为一个的情况下,子步骤S2063包括:将所述答案开始位置的概率和所述答案结束位置的概率之和最大的答案片段作为答案。
也就是说,如果答案数量唯一,则取答案开始位置start、答案结束位置end的概率值之和最大的作为答案片段span输出。
对于答案数量类型指示答案数量为多个的情况下,子步骤S2063包括:
(1)将所述答案开始位置的概率和所述答案结束位置的概率之和大于答案边界阈值的答案片段组成第一答案片段集合;
(2)将所述第一答案片段集合中当前概率最大的答案片段添加到第二答案片段集合中,将该当前概率最大的答案片段从所述第一答案片段集合中删除;
(3)从所述第一答案片段集合中删除与该当前概率最大的答案片段存在重叠的任何其他答案片段;以及
(4)重复步骤(2)和步骤(3),直到所述第一答案片段集合为空。
给定模型预测的答案开始位置概率Pstart、结束位置概率Pend以及答案边界阈值threshold。其中,答案边界阈值threshold为超参数,可以根据实际情况调整。首先根据Pstart、Pend、答案边界阈值threshold抽取概率和排在前面且大于答案边界阈值threshold的m个候选答案,并将它们按照概率值降序排列以得到一个集合A={a1,...,am}。然后,遍历集合A,将当前概率最大的答案ai添加到集合B中,并将其从A中删除,同时删除集合A中与ai重叠的任何剩余答案aj。对集合A中的剩余答案重复上述过程,直到集合A为空,得到的B集合即为不重叠的答案片段span集合。
子步骤S2064,通过所述验证集计算所述预加工要素信息抽取模型的损失,若所述损失小于当前历史最小损失,则更新当前历史最小损失并保存所述预加工要素信息抽取模型的参数。
验证集与训练集为加工要素信息抽取标注样本集不同的部分,采用验证集对训练后的预加工要素信息抽取模型进行验证,可以对训练后的预加工要素信息抽取模型有一个相对准确的估计。
子步骤S2065,经反向传播优化调整所述预加工要素信息抽取模型的网络参数。
子步骤S2066,重复子步骤S2062、子步骤S2063、子步骤S2064和子步骤S2065,响应于所述当前历史最小损失在连续第二设定次数没有更新或达到设定的训练次数,停止对所述预加工要素信息抽取模型的训练。
其中,第二设定次数可以人为设定。
子步骤S2067,通过所述测试集测试所述预加工要素信息抽取模型的加工要素信息的抽取准确率。
子步骤S2068,响应于所述加工要素信息的抽取准确率满足第二预设阈值,将所测试后的预加工要素信息抽取模型确定为所述加工要素信息抽取模型。
其中,第二预设阈值可以人为设定,例如可以为95%。
通过上述过程完成了抽取加工要素信息。但是,因为抽取出的加工要素信息是一个个分立的,实际使用时需要配对,比如每个分条宽度和分条数量之间的配对,另外还可能存在出现单位不同等问题,所以需要做后处理。
这样,基于语义理解的加工委托信息提取方法还包括:步骤S207,对所抽取的加工要素信息进行后处理。
后处理的作用就是经过匹配和修正等处理,使得输出符合实际使用要求。从而,后处理可以包括针对加工要素信息抽取模型输出得到的分条宽度列表、分条数量列表按顺序匹配原则匹配,将分条宽度列表和分条数量进行匹配。后处理还可以包括按照正则规则检验修正,例如,分条宽度应该只有数字和字母,而不应该包括其他字符(例如“)”),通过正则规则筛选,排除数字和字母之外的信息,最后得到匹配结果[(61mm,14),(100mm,2),(47mm,2)]。
在后处理后,输出最终的结构化加工要素信息。将所有需要提取的加工要素提取并经后处理的结果,整理成结构化数据输出给下游任务。其他要素的提取方法类似,例如宽度公差、长度公差、对角线、单包件重等要素提取。
通过本申请提出的基于语义理解的加工委托信息提取方法,能够自适应加工委托信息中不同客户表示方式,并通过训练学习不断提升信息提取效果,降低人工成本并提升工作效率。
根据本申请的另一个方面,提供一种基于语义理解的加工委托信息提取装置,如图3所示,该装置包括如下单元。
接收单元301,用于接收加工委托信息。
可以从平台(例如电商平台)获取加工委托历史样本数据,主要是客户通过平台输入的钢材剪切加工委托说明,通常是一段关于成品信息和质量要求的描述。例如,加工委托信息为“加工要求:刀次1:61mm*14+100mm*2+47mm*2(61mm裸包15.171吨;100mm裸包3.553吨;47mm裸包1.670吨)=1148mm,排刀重量:20.43吨;备注:原边丝带走,内径610,负0.3以内,件重小于3吨,SPHC出库”。
加工类型识别单元302,用于根据加工类型识别模型识别所述加工委托信息中的加工类型。
采用加工类型识别模型识别客户输入的加工委托信息中的加工类型,其中,加工类型包括纵切、横切和先纵切后横切。例如,加工类型识别模型识别上述加工委托信息,获得的加工类型是“纵切”。
信息抽取问题模板确定单元303,用于基于所述加工类型,确定对应的信息抽取问题模板。
针对不同加工类型,事先预置了需要抽取加工要素的问题模板。例如,针对纵切、横切和先纵切后横切的三种加工类型,分别预置了需要抽取加工要素的三种问题模板。由于在该实施例中识别到“纵切”加工类型,则会启用对应纵切类型的抽取加工要素的问题模板,比如纵切需要抽取分条宽度、分条数量,对应问题分别为“分条加工宽度是多少?”、“分条数量是多少?”。
加工要素信息提取单元304,用于根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息。
将加工委托信息和问题模板输入加工要素信息抽取模型,提取得到各加工要素信息。
例如,如果将“加工要求:刀次1:61mm*14+100mm*2+47mm*2(61mm裸包15.171吨;100mm裸包3.553吨;47mm裸包1.670吨)=1148mm,排刀重量:20.43吨;备注:原边丝带走,内径610,负0.3以内,件重小于3吨,SPHC出库”作为段落文档、“分条加工宽度是多少?”作为问题、答案数量=n(表示多个,不唯一)、答案边界阈值=0.9输入到加工要素信息抽取模型中,加工要素信息抽取模型输出答案为列表[61mm,100mm,47mm]。同理,当问题为“分条数量是多少?”时,加工要素信息抽取模型输出分条数量列表[14,2,2]。
上述加工类型识别单元302和加工要素信息提取单元304中分别采用加工类型识别模型来识别加工委托信息中的加工类型以及加工要素信息抽取模型抽取加工委托信息中的加工要素信息,其中,加工类型识别模型和加工要素信息抽取模型都是经过神经网络训练的。这样,基于语义理解的加工委托信息提取装置还包括:加工类型识别模型训练单元305,用于对预加工类型识别模型进行神经网络训练,得到所述加工类型识别模型;以及加工要素信息抽取模型训练单元306,用于对预加工要素信息抽取模型进行神经网络训练,得到所述加工要素信息抽取模型。
其中,加工类型识别模型训练单元305包括如下子单元:
第一拆分子单元3051,用于将标注好的分类样本集拆分为训练集、验证集和测试集。
从平台(例如电商平台)获取钢材剪切加工委托样本数据,将每一个客户输入的加工委托信息,标注上加工类型标签,例如共有纵切、横切、先纵切后横切三种类型,形成加工类型识别模型训练所需的分类样本标注集。然后,将标注好的分类样本集按照预定比例拆分为训练集、验证集和测试集,对于标注好的分类样本集,按一定的比例(例如6:2:2)拆分为训练集、验证集、测试集。其中,训练集用于对预加工类型识别模型进行训练,验证集用于验证训练后的预加工类型识别模型的准确性,而测试集用于测试验证后的预加工类型识别模型是否符合准确性的要求。
加工类型识别模型训练子单元3052,用于将所述训练集中的训练样本输入预加工类型识别模型进行神经网络训练,经所述预加工类型识别模型前向推理计算输出每个训练样本属于各个加工类型的概率分布以及预测类标签,并计算训练集上的损失。
在一个实施例中,加工类型识别模型采用BERT模块连接一个全连接层和softmax组成的分类网络结构,训练时设定训练批大小batchsize、训练次数epoch等训练超参数,加载BERT中文预训练模型,输入加工委托说明文字段落,模型最终预测输出对应的加工类型。
模型训练采用的损失函数为交叉熵损失函数,训练时可以采用Adam优化器,优化目标是使得损失函数最小。通过微调(finetune)方式训练得到加工委托类型识别的3分类模型。加工委托类型不同,决定后续所需提取加工要素信息。
第一计算子单元3053,用于通过所述验证集计算所述预加工类型识别模型的损失,若所述损失小于当前历史最小损失,则更新当前历史最小损失并保存所述预加工类型识别模型的参数。
验证集与训练集为分类样本集不同的部分,采用验证集对训练后的预加工类型识别模型进行验证,可以对训练后的预加工类型识别模型有一个相对准确的估计。
第一调整子单元3054,用于经反向传播优化调整所述预加工类型识别模型的网络参数。
在一个实施例中,经反向传播,采用Adam算法优化调整模型网络参数。
子单元3052、3053和3054重复各自的功能,响应于所述当前历史最小损失在连续第一设定次数没有更新或达到设定的训练次数,停止对所述预加工类型识别模型的训练。
其中,第一设定次数可以人为设定。
第一测试子单元3055,用于通过所述测试集测试所述预加工类型识别模型的加工类型分类准确率。
第一确定子单元3056,用于响应于所述加工类型分类准确率满足第一预设阈值,将所测试后的预加工类型识别模型确定为所述加工类型识别模型。
其中,第一预设阈值可以人为设定,例如可以为95%。
其中,加工要素信息抽取模型训练单元306包括如下子单元:
第二拆分子单元3061,用于将标注好的加工要素信息抽取标注样本集拆分为训练集、验证集和测试集。
从平台(例如电商平台)获取钢材剪切加工委托样本数据,将每一个客户输入的加工委托信息,将由(段落、问题、答案)三元组组成的加工要素信息抽取标注样本集按比例拆分为得到训练集、验证集、测试集,对于标注好的加工要素信息抽取标注样本集,按一定的比例(例如6:2:2)拆分为训练集、验证集、测试集。其中,训练集用于对预加工要素信息抽取模型进行训练,验证集用于验证训练后的预加工要素信息抽取模型的准确性,而测试集用于测试验证后的预加工要素信息抽取模型是否符合准确性的要求。
加工要素信息抽取模型训练子单元3062,用于通过所述训练集中的训练样本对所述预加工要素信息抽取模型进行神经网络训练,前向计算得到所述训练集的段落文档中每个词被分类为答案开始位置的概率和答案结束位置的概率。
模型网络结构采用BERT模块连接全连接层+sigmoid函数输出,分别预测段落文档中每一个词被分类为答案的开始位置start、结束位置end的概率,问题直接限定答案数量可以是多个或一个,由开始位置start、结束位置end可以得到文档中所包含的具体的答案片段span。
模型采用的损失函数:
其中,N为训练样本的数量,|Ai|为第i个问题的答案Ai的数量, 分别为第k个答案开始位置和结束位置,/>分别为/>的预测概率。
模型训练时可以采用Adam优化器,优化目标是使得损失函数最小。
具体来说,设定训练超参数,所述训练超参数包括训练批大小batchsize、训练次数epoch、答案边界阈值threshold等,将训练集批量输入加工要素信息抽取模型网络进行迭代训练。其中,答案边界阈值threshold用来控制模型输出候选答案片段span的数量,由人工在模型训练时调整确定。采用Adam优化器微调网络参数,每个训练结束时计算训练集上的损失函数值。训练时,输入训练样本中的问题、段落、答案数量类型(多个、唯一)、答案列表,首先在问题前面添加[CLS]标记,然后问题和段落连在一起,中间使用[SEP]标记分开,组成的序列通过token Embedding、segment embedding和positional embedding输入到BERT预训练模型,得到BERT深层编码表示的隐藏状态,再经全连接层和sigmoid函数得到段落文档中每个词被分类为答案开始、结束位置的概率。
答案生成子单元3063,用于根据答案数量类型以及所述答案开始位置的概率和所述答案结束位置的概率,生成所述训练样本对应的答案,并计算训练集上的损失。
具体来说,答案数量类型指示答案的数量为一个或多个,对于这两中不同的情形,答案生成子单元3063有如下处理过程。
对于答案数量类型指示答案数量为一个的情况下,答案生成子单元3063用于:将所述答案开始位置的概率和所述答案结束位置的概率之和最大的答案片段作为答案。
也就是说,如果答案数量唯一,则取答案开始位置start、答案结束位置end的概率值之和最大的作为答案片段span输出。
对于答案数量类型指示答案数量为多个的情况下,答案生成子单元3063用于:
(1)将所述答案开始位置的概率和所述答案结束位置的概率之和大于答案边界阈值的答案片段组成第一答案片段集合;
(2)将所述第一答案片段集合中当前概率最大的答案片段添加到第二答案片段集合中,将该当前概率最大的答案片段从所述第一答案片段集合中删除;
(3)从所述第一答案片段集合中删除与该当前概率最大的答案片段存在重叠的任何其他答案片段;以及
(4)重复步骤(2)和步骤(3),直到所述第一答案片段集合为空。
给定模型预测的答案开始位置概率Pstart、结束位置概率Pend以及答案边界阈值threshold。其中,答案边界阈值threshold为超参数,可以根据实际情况调整。首先根据Pstart、Pend、答案边界阈值threshold抽取概率和排在前面且大于答案边界阈值threshold的m个候选答案,并将它们按照概率值降序排列以得到一个集合A={a1,...,am}。然后,遍历集合A,将当前概率最大的答案ai添加到集合B中,并将其从A中删除,同时删除集合A中与ai重叠的任何剩余答案aj。对集合A中的剩余答案重复上述过程,直到集合A为空,得到的B集合即为不重叠的答案片段span集合。
第二计算子单元3064,用于通过所述验证集计算所述预加工要素信息抽取模型的损失,若所述损失小于当前历史最小损失,则更新当前历史最小损失并保存所述预加工要素信息抽取模型的参数。
验证集与训练集为加工要素信息抽取标注样本集不同的部分,采用验证集对训练后的预加工要素信息抽取模型进行验证,可以对训练后的预加工要素信息抽取模型有一个相对准确的估计。
第二调整子单元3065,用于经反向传播优化调整所述预加工要素信息抽取模型的网络参数。
子单元3062、3063、3064和3065重复各自的功能,响应于所述当前历史最小损失在连续第二设定次数没有更新或达到设定的训练次数,停止对所述预加工要素信息抽取模型的训练。
其中,第二设定次数可以人为设定。
第二测试子单元3066,用于通过所述测试集测试所述预加工要素信息抽取模型的加工要素信息的抽取准确率。
第二确定子单元3067,用于响应于所述加工要素信息的抽取准确率满足第二预设阈值,将所测试后的预加工要素信息抽取模型确定为所述加工要素信息抽取模型。
其中,第二预设阈值可以人为设定,例如可以为95%。
通过上述过程完成了抽取加工要素信息。但是,因为抽取出的加工要素信息是一个个分立的,实际使用时需要配对,比如每个分条宽度和分条数量之间的配对,另外还可能存在出现单位不同等问题,所以需要做后处理。
这样,基于语义理解的加工委托信息提取装置还包括:后处理单元307,用于对所抽取的加工要素信息进行后处理。
后处理的作用就是经过匹配和修正等处理,使得输出符合实际使用要求。从而,后处理可以包括针对加工要素信息抽取模型输出得到的分条宽度列表、分条数量列表按顺序匹配原则匹配,将分条宽度列表和分条数量进行匹配。后处理还可以包括按照正则规则检验修正,例如,分条宽度应该只有数字和字母,而不应该包括其他字符(例如“)”),通过正则规则筛选,排除数字和字母之外的信息,最后得到匹配结果[(61mm,14),(100mm,2),(47mm,2)]。
在后处理后,输出最终的结构化加工要素信息。将所有需要提取的加工要素提取并经后处理的结果,整理成结构化数据输出给下游任务。其他要素的提取方法类似,例如宽度公差、长度公差、对角线、单包件重等要素提取。
通过本申请提出的基于语义理解的加工委托信息提取装置,能够自适应加工委托信息中不同客户表示方式,并通过训练学习不断提升信息提取效果,降低人工成本并提升工作效率。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
参阅图4,图4提供一种电子设备,包括处理器;以及存储器,所述存储器存储有计算机指令,当所述计算机指令被所述处理器执行时,使得所述处理器执行所述计算机指令时实现如图2所示的方法以及细化方案。
应该理解,上述的装置实施例仅是示意性的,本发明披露的装置还可通过其它的方式实现。例如,上述实施例中所述单元/模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如,多个单元、模块或组件可以结合,或者可以集成到另一个系统,或一些特征可以忽略或不执行。
另外,若无特别说明,在本发明各个实施例中的各功能单元/模块可以集成在一个单元/模块中,也可以是各个单元/模块单独物理存在,也可以两个以上单元/模块集成在一起。上述集成的单元/模块既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元/模块如果以硬件的形式实现时,该硬件可以是数字电路,模拟电路等等。硬件结构的物理实现包括但不局限于晶体管,忆阻器等等。若无特别说明,所述处理器或芯片可以是任何适当的硬件处理器,比如CPU、GPU、FPGA、DSP和ASIC等等。若无特别说明,所述片上缓存、片外内存、存储器可以是任何适当的磁存储介质或者磁光存储介质,比如,阻变式存储器RRAM(Resistive Random Access Memory)、动态随机存取存储器DRAM(Dynamic Random Access Memory)、静态随机存取存储器SRAM(Static Random-AccessMemory)、增强动态随机存取存储器EDRAM(Enhanced Dynamic Random Access Memory)、高带宽内存HBM(High-Bandwidth Memory)、混合存储立方HMC(Hybrid Memory Cube)等等。
所述集成的单元/模块如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本披露各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例还提供一种非瞬时性计算机存储介质,存储有计算机程序,当所述计算机程序被多个处理器执行时,使得所述处理器执行如图2所示的方法以及细化方案。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明仅用于帮助理解本申请的方法及其核心思想。同时,本领域技术人员依据本申请的思想,基于本申请的具体实施方式及应用范围上做出的改变或变形之处,都属于本申请保护的范围。综上所述,本说明书内容不应理解为对本申请的限制。
Claims (9)
1.一种基于语义理解的加工委托信息提取方法,其包括:
接收加工委托信息;
根据加工类型识别模型识别所述加工委托信息中的加工类型,所述加工类型包括纵切、横切和先纵切后横切;
基于所述加工类型,分别确定对应的三种信息抽取问题模板;以及
根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息;以及
对所抽取的加工要素信息进行后处理,其中,所述后处理包括对所抽取的加工要素信息进行的配对处理,以及/或者对所抽取的加工要素信息进行的修正处理;
其中,所述加工类型识别模型采用BERT模块连接一个全连接层和softmax组成的分类网络结构。
2.如权利要求1所述的方法,还包括:
对预加工类型识别模型进行神经网络训练,得到所述加工类型识别模型,以及
对预加工要素信息抽取模型进行神经网络训练,得到所述加工要素信息抽取模型。
3.如权利要求2所述的方法,其中,所述对预加工类型识别模型进行神经网络训练包括:
(a1)将标注好的分类样本集拆分为训练集、验证集和测试集;
(b1)将所述训练集中的训练样本输入预加工类型识别模型进行神经网络训练,经所述预加工类型识别模型前向推理计算输出每个训练样本属于各个加工类型的概率分布以及预测类标签,并计算训练集上的损失;
(c1)通过所述验证集计算所述预加工类型识别模型的损失,若所述损失小于当前历史最小损失,则更新当前历史最小损失并保存所述预加工类型识别模型的参数;
(d1)经反向传播优化调整所述预加工类型识别模型的网络参数;
(e1)重复步骤(b1)、步骤(c1)和步骤(d1),响应于所述当前历史最小损失在连续第一设定次数没有更新或达到设定的训练次数,停止对所述预加工类型识别模型的训练;
(f1)通过所述测试集测试所述预加工类型识别模型的加工类型分类准确率;
(g1)响应于所述加工类型分类准确率满足第一预设阈值,将所测试后的预加工类型识别模型确定为所述加工类型识别模型。
4.如权利要求2所述的方法,其中,所述对预加工要素信息抽取模型进行神经网络训练包括:
(a2)将标注好的加工要素信息抽取标注样本集拆分为训练集、验证集和测试集;
(b2)通过所述训练集中的训练样本对所述预加工要素信息抽取模型进行神经网络训练,前向计算得到所述训练集的段落文档中每个词被分类为答案开始位置的概率和答案结束位置的概率;
(c2)根据答案数量类型以及所述答案开始位置的概率和所述答案结束位置的概率,生成所述训练样本对应的答案,并计算训练集上的损失;
(d2)通过所述验证集计算所述预加工要素信息抽取模型的损失,若所述损失小于当前历史最小损失,则更新当前历史最小损失并保存所述预加工要素信息抽取模型的参数;
(e2)经反向传播优化调整所述预加工要素信息抽取模型的网络参数;
(f2)重复步骤(b2)、步骤(c2)、步骤(d2)和步骤(e2),响应于所述当前历史最小损失在连续第二设定次数没有更新或达到设定的训练次数,停止对所述预加工要素信息抽取模型的训练;
(g2)通过所述测试集测试所述预加工要素信息抽取模型的加工要素信息的抽取准确率;
(h2)响应于所述加工要素信息的抽取准确率满足第二预设阈值,将所测试后的预加工要素信息抽取模型确定为所述加工要素信息抽取模型。
5.如权利要求4所述的方法,其中,在所述答案数量类型指示答案数量为一个的情况下,所述根据答案数量类型以及所述答案开始位置的概率和所述答案结束位置的概率,生成所述训练样本所对应的答案包括:
将所述答案开始位置的概率和所述答案结束位置的概率之和最大的答案片段作为答案。
6.如权利要求4所述的方法,其中,在所述答案数量类型指示答案数量为多个的情况下,所述根据答案数量类型以及所述答案开始位置的概率和所述答案结束位置的概率,生成所述训练样本所对应的答案还包括:
(c21)将所述答案开始位置的概率和所述答案结束位置的概率之和大于答案边界阈值的答案片段组成第一答案片段集合;
(c22)将所述第一答案片段集合中当前概率最大的答案片段添加到第二答案片段集合中,将该当前概率最大的答案片段从所述第一答案片段集合中删除;
(c23)从所述第一答案片段集合中删除与该当前概率最大的答案片段存在重叠的任何其他答案片段;以及
(c24)重复步骤(c22)和步骤(c23),直到所述第一答案片段集合为空。
7.一种基于语义理解的加工委托信息提取装置,其包括:
接收单元,用于接收加工委托信息;
加工类型识别单元,用于根据加工类型识别模型识别所述加工委托信息中的加工类型,所述加工类型包括纵切、横切和先纵切后横切;
信息抽取问题模板确定单元,用于基于所述加工类型,分别确定对应的三种信息抽取问题模板;
加工要素信息提取单元,用于根据所述问题模板,采用加工要素信息抽取模型抽取所述加工委托信息中的加工要素信息;
后处理单元,用于对所抽取的加工要素信息进行后处理,其中,所述后处理包括对所抽取的加工要素信息进行的配对处理,以及/或者对所抽取的加工要素信息进行的修正处理;
其中,所述加工类型识别模型采用BERT模块连接一个全连接层和softmax组成的分类网络结构。
8.一种电子设备,包括:
处理器;以及
存储器,存储有计算机指令,当所述计算机指令被所述处理器执行时,使得所述处理器执行权利要求1-6任一者所述的方法。
9.一种非瞬时性计算机存储介质,存储有计算机程序,当所述计算机程序被多个处理器执行时,使得所述处理器执行权利要求1-6任一者所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111128717.0A CN113821600B (zh) | 2021-09-26 | 2021-09-26 | 基于语义理解的加工委托信息提取方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111128717.0A CN113821600B (zh) | 2021-09-26 | 2021-09-26 | 基于语义理解的加工委托信息提取方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113821600A CN113821600A (zh) | 2021-12-21 |
CN113821600B true CN113821600B (zh) | 2023-12-19 |
Family
ID=78921366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111128717.0A Active CN113821600B (zh) | 2021-09-26 | 2021-09-26 | 基于语义理解的加工委托信息提取方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113821600B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020174826A1 (ja) * | 2019-02-25 | 2020-09-03 | 日本電信電話株式会社 | 回答生成装置、回答学習装置、回答生成方法、及び回答生成プログラム |
CN112131351A (zh) * | 2020-10-10 | 2020-12-25 | 华东理工大学 | 一种基于多答案损失函数的片段信息抽取模型训练方法 |
CN112612885A (zh) * | 2020-12-18 | 2021-04-06 | 成都三零凯天通信实业有限公司 | 一种基于bert类模型的阅读理解式新闻文本事件抽取方法 |
CN113204611A (zh) * | 2021-04-06 | 2021-08-03 | 北京百度网讯科技有限公司 | 建立阅读理解模型的方法、阅读理解方法及对应装置 |
-
2021
- 2021-09-26 CN CN202111128717.0A patent/CN113821600B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020174826A1 (ja) * | 2019-02-25 | 2020-09-03 | 日本電信電話株式会社 | 回答生成装置、回答学習装置、回答生成方法、及び回答生成プログラム |
CN112131351A (zh) * | 2020-10-10 | 2020-12-25 | 华东理工大学 | 一种基于多答案损失函数的片段信息抽取模型训练方法 |
CN112612885A (zh) * | 2020-12-18 | 2021-04-06 | 成都三零凯天通信实业有限公司 | 一种基于bert类模型的阅读理解式新闻文本事件抽取方法 |
CN113204611A (zh) * | 2021-04-06 | 2021-08-03 | 北京百度网讯科技有限公司 | 建立阅读理解模型的方法、阅读理解方法及对应装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113821600A (zh) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20190085098A (ko) | 키워드 추출 방법, 컴퓨터 장치, 및 저장 매체 | |
US11010554B2 (en) | Method and device for identifying specific text information | |
CN112016319B (zh) | 预训练模型获取、疾病实体标注方法、装置及存储介质 | |
CN108897754B (zh) | 基于大数据的工单类型的识别方法、系统和计算设备 | |
CN113706151A (zh) | 一种数据处理方法、装置、计算机设备及存储介质 | |
CN111859916B (zh) | 古诗关键词提取、诗句生成方法、装置、设备及介质 | |
CN113657098B (zh) | 文本纠错方法、装置、设备及存储介质 | |
CN111309887A (zh) | 一种训练文本关键内容提取模型的方法和系统 | |
CN109299263A (zh) | 文本分类方法、电子设备及计算机程序产品 | |
CN111709225A (zh) | 一种事件因果关系判别方法、装置和计算机可读存储介质 | |
CN116860529A (zh) | 故障定位方法及装置 | |
CN113821600B (zh) | 基于语义理解的加工委托信息提取方法和装置 | |
CN113609461A (zh) | 口令强度识别方法、装置、设备和计算机可读存储介质 | |
CN117314643A (zh) | 基于金融风洞数据的数据分析方法、装置及存储介质 | |
CN115856694B (zh) | 电池寿命预测方法、装置、计算机设备和存储介质 | |
CN111400484A (zh) | 一种关键词提取方法和系统 | |
CN114254622B (zh) | 一种意图识别方法和装置 | |
CN113239272B (zh) | 一种网络管控系统的意图预测方法和意图预测装置 | |
CN114153975A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN114385876A (zh) | 一种模型搜索空间生成方法、装置及系统 | |
CN109308565B (zh) | 人群绩效等级识别方法、装置、存储介质及计算机设备 | |
CN115204146B (zh) | 关键词抽取方法、装置、计算机设备及存储介质 | |
CN115049899B (zh) | 模型训练方法、指代表达式生成方法及相关设备 | |
CN111191447B (zh) | 一种设备缺陷的分类方法、装置及设备 | |
CN116484841B (zh) | 基于自动化审核的信息校验系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |