CN117454247A - 一种模型的训练方法、装置、存储介质及电子设备 - Google Patents

一种模型的训练方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN117454247A
CN117454247A CN202311412908.9A CN202311412908A CN117454247A CN 117454247 A CN117454247 A CN 117454247A CN 202311412908 A CN202311412908 A CN 202311412908A CN 117454247 A CN117454247 A CN 117454247A
Authority
CN
China
Prior art keywords
classification
coding
decoding
layer
layers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311412908.9A
Other languages
English (en)
Inventor
黄耀波
宋博文
张天翼
曾庆瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202311412908.9A priority Critical patent/CN117454247A/zh
Publication of CN117454247A publication Critical patent/CN117454247A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书公开了一种模型的训练方法、装置、存储介质及电子设备,获取第一样本以及第一样本对应的交易意图类别在预设的每个分类等级下所属的第一标注类别。将第一样本分别输入多个编码层,得到各第一编码结果。按照分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果,从而可基于各第一解码层的解码结果,得到模型输出的第一样本在预设的每个分类等级下所属的第一预测类别,并基于第一预测类别以及第一标注类别,训练模型。该方法提升了模型预测的交易意图类别的准确率。

Description

一种模型的训练方法、装置、存储介质及电子设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种模型的训练方法、装置、存储介质及电子设备。
背景技术
随着科技的发展,隐私数据日益受到大众的关注,人工智能技术飞速发展,其中,机器学习技术广泛应用。一般的,在风控领域,平台可通过机器学习模型(如交易意图分类模型)对用户的交易意图进行识别以及分类,确定用户的交易动机,以对有风险的用户进行风控,从而保证平台交易系统的健康性以及可持续性发展。
然而,对于用户的交易意图的分类而言,与通常的分类任务中类与类之间的正交关系不同,交易意图的类与类之间可存在包含关系,也即存在层次结构关系。例如:在基于专家经验构建的交易意图分类中,可包括一级分类(如商品交易、资本交易、服务交易等),二级分类(如办公用品、金融投资等)以及三级分类(如礼品、股票等)。其中,各一级分类下对应多个二级分类,各二级分类下对应多个三级分类,例如:一级分类的商品交易,对应的二级分类包括办公用品、化学加工品等,二级分类的办公用品对应的三级分类包括文具、纪念品等。因此如何使得模型学习到交易意图的各分类之间的层次结构关系是一个重点问题。
基于此,本申请说明书提供了一种模型的训练方法。
发明内容
本说明书提供一种模型的训练方法、装置、存储介质及电子设备,以至少部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种模型的训练方法,待训练的交易意图分类模型包括:分别与预设的每个分类等级一一对应的编码层,以及分别与每个编码层一一对应的第一解码层;所述方法包括:
获取用户的交易数据,将所述交易数据作为第一样本;并,获取所述第一样本对应的交易意图类别在所述预设的每个分类等级下所属的第一标注类别;
将所述第一样本分别输入多个编码层,得到所述多个编码层对应的第一编码结果;
按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的第一编码结果,以及该分类等级对应的编码层的第一编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;
根据得到的各第一解码层对应的解码结果,得到所述待训练的交易意图分类模型输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别;
根据所述第一预测类别以及所述第一标注类别,对所述待训练的交易意图分类模型进行训练。
可选地,所述待训练的交易意图分类模型还包括:预测层,所述第一解码层均与所述预测层相连接;
根据得到的各第一解码层对应的解码结果,得到所述待训练的交易意图分类模型输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别,具体包括:
将得到的各第一解码层对应的解码结果输入所述预测层,得到所述预测层输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别。
可选地,所述方法还包括:
获取待预测的用户交易数据;
将所述用户交易数据分别输入训练完成的交易意图分类模型中的各编码层,得到各编码结果;
按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;
根据得到的各第一解码层对应的解码结果,得到所述训练完成的交易意图分类模型输出的所述用户交易数据在每个分类等级下所属的预测类别。
可选地,所述待训练的交易意图分类模型还包括:第二解码层,所述第二解码层与指定编码层相连接,所述第二编码层用于输出指定分类等级的交易意图类别;
所述方法还包括:
获取第二样本,以及获取所述第二样本对应的交易意图类别在指定分类等级下所属的第二标注类别;
将所述第二样本分别输入所述多个编码层,得到所述多个编码层对应的第二编码结果;
将所述指定分类等级的所有上级分类等级对应的编码层的第二编码结果,以及所述指定编码层的第二编码结果,输入所述第二解码层,得到所述第二解码层输出的所述第二样本在指定分类等级下所属的第二预测类别;
根据所述第二标注类别以及所述第二预测类别,对所述第二解码层以及所述指定编码层进行训练。
可选地,所述指定分类等级包括预设的分类等级中最下级的分类等级。
可选地,所述方法还包括:
获取待预测的用户交易数据;
将所述用户交易数据分别输入训练完成的交易意图分类模型中的各编码层,得到各编码结果;
按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;
根据得到的各第一解码层对应的解码结果,得到所述训练完成的交易意图分类模型输出的所述用户交易数据在所述预设的每个分类等级下所属的第一预测类别;
将所述指定分类等级的所有上级分类等级对应的编码层的编码结果,以及所述指定编码层的编码结果,输入所述第二解码层,得到所述第二解码层输出的所述用户交易数据在所述指定分类等级下所属的第二预测类别。
可选地,得到该分类等级对应的第一解码层的解码结果,具体包括:
通过该分类等级对应的第一解码层,采用残差连接将该分类等级的所有上级分类等级对应的编码层的第一编码结果,以及该分类等级对应的编码层的第一编码结果进行融合,得到该分类等级对应的第一解码层的解码结果。
本说明书提供了一种模型的训练装置,待训练的交易意图分类模型包括:分别与预设的每个分类等级一一对应的编码层,以及分别与每个编码层一一对应的第一解码层;包括:
获取模块,用于获取用户的交易数据,将所述交易数据作为第一样本;并,获取所述第一样本对应的交易意图类别在所述预设的每个分类等级下所属的第一标注类别;
编码模块,用于将所述第一样本分别输入多个编码层,得到所述多个编码层对应的第一编码结果;
解码模块,用于按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的第一编码结果,以及该分类等级对应的编码层的第一编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;
预测模块,用于根据得到的各第一解码层对应的解码结果,得到所述待训练的交易意图分类模型输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别;
第一训练模块,用于根据所述第一预测类别以及所述第一标注类别,对所述待训练的交易意图分类模型进行训练。
可选地,所述待训练的交易意图分类模型还包括:预测层,所述第一解码层均与所述预测层相连接;
所述预测模块具体用于,将得到的各第一解码层对应的解码结果输入所述预测层,得到所述预测层输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别。
可选地,所述装置还包括第一处理模块;
所述第一处理模块具体用于,获取待预测的用户交易数据;将所述用户交易数据分别输入训练完成的交易意图分类模型中的各编码层,得到各编码结果;按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;根据得到的各第一解码层对应的解码结果,得到所述训练完成的交易意图分类模型输出的所述用户交易数据在每个分类等级下所属的预测类别。
可选地,所述待训练的交易意图分类模型还包括:第二解码层,所述第二解码层与指定编码层相连接,所述第二编码层用于输出指定分类等级的交易意图类别;
所述装置还包括第二训练模块;
所述第二训练模块具体用于,获取第二样本,以及获取所述第二样本对应的交易意图类别在指定分类等级下所属的第二标注类别;将所述第二样本分别输入所述多个编码层,得到所述多个编码层对应的第二编码结果;将所述指定分类等级的所有上级分类等级对应的编码层的第二编码结果,以及所述指定编码层的第二编码结果,输入所述第二解码层,得到所述第二解码层输出的所述第二样本在指定分类等级下所属的第二预测类别;根据所述第二标注类别以及所述第二预测类别,对所述第二解码层以及所述指定编码层进行训练。
可选地,所述指定分类等级包括预设的分类等级中最下级的分类等级。
可选地,所述装置还包括第二处理模块;
所述第二处理模块具体用于,获取待预测的用户交易数据;将所述用户交易数据分别输入训练完成的交易意图分类模型中的各编码层,得到各编码结果;按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;根据得到的各第一解码层对应的解码结果,得到所述训练完成的交易意图分类模型输出的所述用户交易数据在所述预设的每个分类等级下所属的第一预测类别;将所述指定分类等级的所有上级分类等级对应的编码层的编码结果,以及所述指定编码层的编码结果,输入所述第二解码层,得到所述第二解码层输出的所述用户交易数据在所述指定分类等级下所属的第二预测类别。
可选地,所述解码模块具体用于,通过该分类等级对应的第一解码层,采用残差连接将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果进行融合,得到该分类等级对应的第一解码层的解码结果。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型的训练方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型的训练方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
从本说明书提供的模型的训练方法中可以看出,通过获取用户的交易数据作为样本,并基于预设的分类等级确定用户的交易意图在每个分类等级下的标注类别,从而在对交易意图分类模型进行训练时,可基于分类等级,对交易意图分类模型进行训练,使得训练完成的交易意图分类模型可学习到交易意图的各分类之间的层次结构关系,提升了模型预测的交易意图类别的准确率。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附
图中:
图1为本说明书中一种模型的训练方法的流程示意图;
图2为本说明书提供的一种交易意图分类模型的结构示意图;
图3为本说明书提供的一种交易意图分类模型的结构示意图;
图4为本说明书提供的一种模型的训练装置示意图;
图5为本说明书提供的对应于图1的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本说明书提供的一种模型的训练方法的流程示意图,具体可包括以下步骤:
S100:获取用户的交易数据,将所述交易数据作为第一样本;并,获取所述第一样本对应的交易意图类别在所述预设的每个分类等级下所属的第一标注类别。
执行本说明书技术方案的执行主体可为任意具备计算能力的电子设备,如服务器、终端等。
在本说明书中,该交易意图分类模型包括分别与预设的每个分类等级一一对应的编码层,以及分别与每个编码层一一对应的第一解码层。该计算设备可获取用户的交易数据,并将该交易数据作为第一样本。其中,用户的交易数据可包括交易双方的个人信息、交易时间、交易金额、交易次数以及交易物品等等,交易双方的个人信息可包括年龄、性别等等。并且该计算设备可获取第一样本对应的交易意图类别在预设的每个分类等级下所属的第一标注类别。
需要说明的是,预设的分类等级可预先基于各交易意图类别之间的包含关系进行确定,或者可预先基于专家经验对各交易意图类别进行分级,从而得到预设的分类等级,具体预设的分类等级如何得到本说明书不做具体限制。
S102:将所述第一样本分别输入多个编码层,得到所述多个编码层对应的第一编码结果。
S104:按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的第一编码结果,以及该分类等级对应的编码层的第一编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果。
为了使得交易意图分类模型可学习到各交易意图类别之间的结构层次,也即学习到各交易意图类别之间的包含关系,该计算设备可将第一样本分别输入交易意图分类模型的多个编码层中,得到多个编码层对应的第一编码结果。然后按照预设的分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级所有上级分类等级对应的编码层的第一编码结果以及该分类等级对应的编码层的第一编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果。从而可在后续步骤中,使得该分类等级对应的第一解码层的解码结果得到第一预测类别时,不仅参考了该分类等级对应的特征,还继承了该分类等级所有上级分类等级对应的特征。
在本书明书的一个或多个实施例中,在按照预设的分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级所有上级分类等级对应的编码层的第一编码结果以及该分类等级对应的编码层的第一编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果时,将该分类等级所有上级分类等级对应的编码层的第一编码结果具体可为融合过的第一编码特征。如图2所示,对于第一解码层2而言,输入第一解码层2中的特征有,第一编码层1的第一编码结果与第一编码层2的第一编码结果。则假设图中存在第一解码层3,则输入第一解码层3中的特征有,第一编码层1的第一编码结果,以及第一编码层2将输入的第一编码层1的第一编码结果与第一编码层2的第一编码结果融合之后的融合编码结果。对于第一解码层n而言,输入第一解码层n中的特征有,第一编码层1的第一编码结果、第一编码层2将输入的第一编码层1的第一编码结果与第一编码层2的第一编码结果融合之后的融合编码结果1、第一编码层3将输入的第一编码层1的第一编码结果以及融合编码结果融合之后的融合编码结2。
也就是说,在本说明书的一个或多个实施例中,可按照预设的分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级所有上级分类等级对应的第一解码层的输入特征,以及该分类等级对应的编码层的第一编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果。
S106:根据得到的各第一解码层对应的解码结果,得到所述待训练的交易意图分类模型输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别。
S108:根据所述第一预测类别以及所述第一标注类别,对所述待训练的交易意图分类模型进行训练。
最后,该计算设备可根据得到的各第一解码层对应的解码结果,得到待训练的交易意图分类模型输出的第一样本在预设的每个分类等级下所属的第一预测类别,并根据第一预测类别以及第一标注类别,对待训练的交易意图分类模型进行训练。具体的,在本说明书中的一个或多个实施例中,在得到该分类等级对应的第一解码层的解码结果时,该计算设备可通过该分类等级对应的第一解码层,采用残差连接将该分类等级的所有上级分类等级对应的编码层的第一编码结果,以及该分类等级对应的编码层的第一编码结果进行融合,得到该分类等级对应的第一解码层的解码结果。或者,可基于知识图谱的经验表征(如Trans H算法),通过该第一解码层,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果进行融合,得到该分类等级对应的第一解码层的解码结果。具体如何将各第一编码结果进行融合本说明书不做具体限制。
基于图1所示的模型的训练方法,通过获取用户的交易数据作为样本,并基于预设的分类等级确定用户的交易意图在每个分类等级下的标注类别,从而在对交易意图分类模型进行训练时,可基于分类等级,对交易意图分类模型进行训练,使得训练完成的交易意图分类模型可学习到交易意图的各分类之间的层次结构关系,提升了模型预测的交易意图类别的准确率。
本说明书还提供了与图1所示的模型的训练方法所对应的训练完成的交易意图分类模型的使用方法。也即该计算设备可获取待预测的用户交易数据,该待预测的用户交易数据与上述步骤S100中的交易数据可相同,即包括交易双方的个人信息、交易时间、交易金额、交易次数以及交易物品等等。然后将用户交易数据分别输入训练完成的交易意图分类模型中的各编码层,得到各编码结果,并按照分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果,此处输入该分类等级对应的第一解码层中的特征可与上述步骤S102-S104中的特征一致,即可为将该分类等级的所有上级分类等级对应的第一解码层的输入特征,以及该分类等级对应的编码层的编码结果。该计算设备可根据得到的各第一解码层对应的解码结果,得到训练完成的交易意图分类模型输出的用户交易数据在每个分类等级下所属的预测类别,从而实现对用户的交易数据的交易意图分类的预测。
进一步的,在本说明书的一个或多个实施例中,该交易意图分类模型还包括第二解码层,第二解码层与指定编码层相连接,用于输出指定分类等级的交易意图类别。如图2所示,为本说明书提供的一种交易意图分类模型的结构示意图,在图2中可见,编码层1有对应的第一解码层1、编码层2有对应的第一解码层2……以及编码层n有对应的第一解码层n,每个第一解码层用于输出不同分类等级的交易意图类别,也即第一预测类别1、2……n。并且,第二解码层与指定编码层相连接,也即第二解码层n与编码层n相连接,第二解码层可输出指定分类等级的交易意图类别也即第二预测类别n。
具体的,在模型训练的过程中,该计算设备还可获取第二样本,以及获取第二样本对应的交易意图类别在指定分类等级下所属的第二标注类别,然后将第二样本分别输入多个编码层,得到所述多个编码层对应的第二编码结果,并将指定分类等级的所有上级分类等级对应的编码层的第二编码结果,以及指定编码层的第二编码结果,输入第二解码层,得到第二解码层输出的第二样本在指定分类等级下所属的第二预测类别。最后根据第二标注类别以及第二预测类别,对第二解码层以及指定编码层进行训练。该第二解码层可在训练过程中提升模型对指定分类等级的交易意图类别的关注度,以提高训练完成的模型输出的预测类别的准确度。在本说明书中的一个或多个实施例中,该指定分类等级包括预设的分类等级中最下级的分类等级。
在模型应用的过程中,该计算设备可获取待预测的用户交易数据,将用户交易数据分别输入训练完成的交易意图分类模型中的各编码层,得到各编码结果,然后按照分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果。最后根据得到的各第一解码层对应的解码结果,得到训练完成的交易意图分类模型输出的用户交易数据在所述预设的每个分类等级下所属的第一预测类别。以及将指定分类等级的所有上级分类等级对应的编码层的编码结果,以及指定编码层的编码结果,输入第二解码层,得到第二解码层输出的用户交易数据在指定分类等级下所属的第二预测类别。
也就是说,在本说明书的一个或多个实施例中,该交易意图分类模型的输出可为两部分,即用户交易数据在预设的每个分类等级下所属的第一预测类别,以及用户交易数据在所述指定分类等级下所属的第二预测类别。
进一步的,在本说明书的一个或多个实施例中,可基于预设的分类等级构建交易意图类别的树状结构,也即以交易意图类别为树的节点,以交易意图类别之间的包含关系为树的边,或者说以交易意图类别对应的分类等级为树的分层,进而实施对模型的训练。当然,也可根据预设的分类等级构建图等,实施对模型的训练,本说明书不做具体限制。
在本说明书中,用户交易数据在预设的每个分类等级下所属的第一预测类别时的损失,可基于树状结构的概率分类损失得到,用户交易数据在所述指定分类等级下所属的第二预测类别的损失,可基于树状结构中对指定层次施加多类交叉熵损失/>得到,以指定分类等级为所有分类等级中的最下级为例,对应于树状结构中的指定层次,也即树状结构中的叶级节点。
则对树状结构中的每个叶子节点,其联合概率可为:
整个树的联合概率可为:
对整个树的联合概率进行归一化:
树状结构的损失函数:
结合树状结构的损失和交叉熵损失函数:
其中,n为交易意图分类的总数量,也即树状结构中节点的总数量,x为样本,y为标注。为第i个标签节点的交易意图分类输出,/>为非归一化概率,Ψi,j(yi,yi)是树中定义的约束y中任意两个标签之间的层次结构,如果违反约束,Ψi,j(yi,yi)为0,否则,Ψi,j(yi,yi)为1。y(l)是在树状结构中的真实的标签路径,g(l)是在树状结构中预测得到的标签的路径,m为训练集/>中的训练样本的个数,l=1、2……m。
在本说明书的一个或多个实施例中,该交易意图分类模型还包括预测层,第一解码层均与该预测层相连接,和/或,该交易意图分类模型还包括特征提取层,编码层均与该特征提取层相连接。如图3所示,为本说明书提供的一种交易意图分类模型的结构示意图。其中,该特征提取层可为Tab Net,也可为DNN等,编码层可为多头注意力(Multi-HeadAttention,MHA)网络,也可为HMCN,还可为HMC-LMLP等等。则在根据得到的各第一解码层对应的解码结果,得到待训练的交易意图分类模型输出的第一样本在预设的每个分类等级下所属的第一预测类别时,该计算设备可将得到的各第一解码层对应的解码结果输入预测层,得到预测层输出的第一样本在预设的每个分类等级下所属的第一预测类别。则在将第一样本分别输入多个编码层,得到多个编码层对应的编码结果时,可将第一样本输入特征提取层,得到提取特征,进而再将该提取特征分别输入多个编码层,得到多个编码层对应的编码结果。
基于上述内容所述的模型的训练方法,本说明书实施例还对应的提供一种用于模型的训练装置示意图,如图4所示。
图4为本说明书实施例提供的一种模型的训练装置的示意图,所述装置包括:
获取模块400,用于获取用户的交易数据,将所述交易数据作为第一样本;并,获取所述第一样本对应的交易意图类别在所述预设的每个分类等级下所属的第一标注类别;
编码模块402,用于将所述第一样本分别输入多个编码层,得到所述多个编码层对应的第一编码结果;
解码模块404,用于按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的第一编码结果,以及该分类等级对应的编码层的第一编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;
预测模块406,用于根据得到的各第一解码层对应的解码结果,得到所述待训练的交易意图分类模型输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别;
第一训练模块408,用于根据所述第一预测类别以及所述第一标注类别,对所述待训练的交易意图分类模型进行训练。
可选地,所述待训练的交易意图分类模型还包括:预测层,所述第一解码层均与所述预测层相连接;
所述预测模块406具体用于,将得到的各第一解码层对应的解码结果输入所述预测层,得到所述预测层输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别。
可选地,所述装置还包括第一处理模块410;
所述第一处理模块410具体用于,获取待预测的用户交易数据;将所述用户交易数据分别输入训练完成的交易意图分类模型中的各编码层,得到各编码结果;按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;根据得到的各第一解码层对应的解码结果,得到所述训练完成的交易意图分类模型输出的所述用户交易数据在每个分类等级下所属的预测类别。
可选地,所述待训练的交易意图分类模型还包括:第二解码层,所述第二解码层与指定编码层相连接,所述第二编码层用于输出指定分类等级的交易意图类别;
所述装置还包括第二训练模块412;
所述第二训练模块412具体用于,获取第二样本,以及获取所述第二样本对应的交易意图类别在指定分类等级下所属的第二标注类别;将所述第二样本分别输入所述多个编码层,得到所述多个编码层对应的第二编码结果;将所述指定分类等级的所有上级分类等级对应的编码层的第二编码结果,以及所述指定编码层的第二编码结果,输入所述第二解码层,得到所述第二解码层输出的所述第二样本在指定分类等级下所属的第二预测类别;根据所述第二标注类别以及所述第二预测类别,对所述第二解码层以及所述指定编码层进行训练。
可选地,所述指定分类等级包括预设的分类等级中最下级的分类等级。
可选地,所述装置还包括第二处理模块414;
所述第二处理模块414具体用于,获取待预测的用户交易数据;将所述用户交易数据分别输入训练完成的交易意图分类模型中的各编码层,得到各编码结果;按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;根据得到的各第一解码层对应的解码结果,得到所述训练完成的交易意图分类模型输出的所述用户交易数据在所述预设的每个分类等级下所属的第一预测类别;将所述指定分类等级的所有上级分类等级对应的编码层的编码结果,以及所述指定编码层的编码结果,输入所述第二解码层,得到所述第二解码层输出的所述用户交易数据在所述指定分类等级下所属的第二预测类别。
可选地,所述解码模块404具体用于,通过该分类等级对应的第一解码层,采用残差连接将该分类等级的所有上级分类等级对应的编码层的第一编码结果,以及该分类等级对应的编码层的第一编码结果进行融合,得到该分类等级对应的第一解码层的解码结果。
本说明书实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述内容所述的模型的训练方法。
基于上述内容所述的模型的训练方法,本说明书实施例还提出了图5所示的电子设备的示意结构图。如图5,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述内容所述的模型的训练方法。
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (10)

1.一种模型的训练方法,待训练的交易意图分类模型包括:分别与预设的每个分类等级一一对应的编码层,以及分别与每个编码层一一对应的第一解码层;所述方法包括:
获取用户的交易数据,将所述交易数据作为第一样本;并,获取所述第一样本对应的交易意图类别在所述预设的每个分类等级下所属的第一标注类别;
将所述第一样本分别输入多个编码层,得到所述多个编码层对应的第一编码结果;
按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的第一编码结果,以及该分类等级对应的编码层的第一编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;
根据得到的各第一解码层对应的解码结果,得到所述待训练的交易意图分类模型输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别;
根据所述第一预测类别以及所述第一标注类别,对所述待训练的交易意图分类模型进行训练。
2.如权利要求1所述的方法,所述待训练的交易意图分类模型还包括:预测层,所述第一解码层均与所述预测层相连接;
根据得到的各第一解码层对应的解码结果,得到所述待训练的交易意图分类模型输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别,具体包括:
将得到的各第一解码层对应的解码结果输入所述预测层,得到所述预测层输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别。
3.如权利要求1所述的方法,所述方法还包括:
获取待预测的用户交易数据;
将所述用户交易数据分别输入训练完成的交易意图分类模型中的各编码层,得到各编码结果;
按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;
根据得到的各第一解码层对应的解码结果,得到所述训练完成的交易意图分类模型输出的所述用户交易数据在每个分类等级下所属的预测类别。
4.如权利要求1所述的方法,所述待训练的交易意图分类模型还包括:第二解码层,所述第二解码层与指定编码层相连接,所述第二编码层用于输出指定分类等级的交易意图类别;
所述方法还包括:
获取第二样本,以及获取所述第二样本对应的交易意图类别在指定分类等级下所属的第二标注类别;
将所述第二样本分别输入所述多个编码层,得到所述多个编码层对应的第二编码结果;
将所述指定分类等级的所有上级分类等级对应的编码层的第二编码结果,以及所述指定编码层的第二编码结果,输入所述第二解码层,得到所述第二解码层输出的所述第二样本在指定分类等级下所属的第二预测类别;
根据所述第二标注类别以及所述第二预测类别,对所述第二解码层以及所述指定编码层进行训练。
5.如权利要求4所述的方法,所述指定分类等级包括预设的分类等级中最下级的分类等级。
6.如权利要求4所述的方法,所述方法还包括:
获取待预测的用户交易数据;
将所述用户交易数据分别输入训练完成的交易意图分类模型中的各编码层,得到各编码结果;
按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的编码结果,以及该分类等级对应的编码层的编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;
根据得到的各第一解码层对应的解码结果,得到所述训练完成的交易意图分类模型输出的所述用户交易数据在所述预设的每个分类等级下所属的第一预测类别;
将所述指定分类等级的所有上级分类等级对应的编码层的编码结果,以及所述指定编码层的编码结果,输入所述第二解码层,得到所述第二解码层输出的所述用户交易数据在所述指定分类等级下所属的第二预测类别。
7.如权利要求1所述的方法,得到该分类等级对应的第一解码层的解码结果,具体包括:
通过该分类等级对应的第一解码层,采用残差连接将该分类等级的所有上级分类等级对应的编码层的第一编码结果,以及该分类等级对应的编码层的第一编码结果进行融合,得到该分类等级对应的第一解码层的解码结果。
8.一种模型训练的装置,待训练的交易意图分类模型包括:分别与预设的每个分类等级一一对应的编码层,以及分别与每个编码层一一对应的第一解码层;所述装置具体包括:
获取模块,用于获取用户的交易数据,将所述交易数据作为第一样本;并,获取所述第一样本对应的交易意图类别在所述预设的每个分类等级下所属的第一标注类别;
编码模块,用于将所述第一样本分别输入多个编码层,得到所述多个编码层对应的第一编码结果;
解码模块,用于按照所述分类等级从上到下的顺序,依次针对每个分类等级,将该分类等级的所有上级分类等级对应的编码层的第一编码结果,以及该分类等级对应的编码层的第一编码结果,输入该分类等级对应的第一解码层,得到该分类等级对应的第一解码层的解码结果;
预测模块,用于根据得到的各第一解码层对应的解码结果,得到所述待训练的交易意图分类模型输出的所述第一样本在所述预设的每个分类等级下所属的第一预测类别;
第一训练模块,用于根据所述第一预测类别以及所述第一标注类别,对所述待训练的交易意图分类模型进行训练。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-7任一所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1-7任一所述的方法。
CN202311412908.9A 2023-10-27 2023-10-27 一种模型的训练方法、装置、存储介质及电子设备 Pending CN117454247A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311412908.9A CN117454247A (zh) 2023-10-27 2023-10-27 一种模型的训练方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311412908.9A CN117454247A (zh) 2023-10-27 2023-10-27 一种模型的训练方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN117454247A true CN117454247A (zh) 2024-01-26

Family

ID=89594317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311412908.9A Pending CN117454247A (zh) 2023-10-27 2023-10-27 一种模型的训练方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN117454247A (zh)

Similar Documents

Publication Publication Date Title
CN113887227B (zh) 一种模型训练与实体识别方法及装置
CN115618964B (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN110516915B (zh) 业务节点训练、评估方法、装置及电子设备
CN117194992A (zh) 一种模型训练、任务执行方法、装置、存储介质及设备
CN117369783B (zh) 一种安全代码生成模型的训练方法及装置
CN116578877B (zh) 一种模型训练及二次优化打标的风险识别的方法及装置
CN116186330B (zh) 一种基于多模态学习的视频去重方法及装置
CN115017915B (zh) 一种模型训练、任务执行的方法及装置
CN116151355B (zh) 一种模型训练和业务执行的方法、装置、介质及设备
CN116824331A (zh) 一种模型训练、图像识别方法、装置、设备及存储介质
CN115689676A (zh) 一种行业识别的方法、装置、存储介质及电子设备
CN117454247A (zh) 一种模型的训练方法、装置、存储介质及电子设备
CN111461352B (zh) 模型训练、业务节点识别方法、装置及电子设备
CN117786061B (zh) 一种基于时空注意力机制的大语言模型预测方法及装置
CN116795972B (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN117593003A (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN117351946B (zh) 一种语音识别方法、装置、存储介质及电子设备
CN116501852B (zh) 一种可控对话模型训练方法、装置、存储介质及电子设备
CN118503856A (zh) 一种业务意图识别方法、装置、存储介质及设备
CN117743824A (zh) 一种模型训练、业务执行方法、装置、存储介质及设备
CN117575611A (zh) 一种风险识别的方法、装置、存储介质及电子设备
CN117592998A (zh) 一种风控的方法、装置、存储介质及电子设备
CN118569392A (zh) 用于解释模型的方法、装置、存储介质及电子设备
CN116150685A (zh) 一种数据分类方法、装置、设备及存储介质
CN116453615A (zh) 一种预测方法、装置、可读存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination