CN114780721A

CN114780721A - 一种基于深度学习的交易对手识别方法、装置及电子设备

Info

Publication number: CN114780721A
Application number: CN202210331712.6A
Authority: CN
Inventors: 林远平; 林丽敏; 邹鸿岳; 周靖宇
Original assignee: Beijing Kuaique Information Technology Co ltd
Current assignee: Beijing Kuaique Information Technology Co ltd
Priority date: 2022-03-30
Filing date: 2022-03-30
Publication date: 2022-07-22

Abstract

本发明公开了一种基于深度学习的交易对手识别方法、装置及电子设备，方法包括：获取债券信息文本，对所述债券信息文本进行要素提取，得到提取后的要素数据；根据预设的结构化规则索引、要素数据对所述债券信息文本进行切割，形成现券交易订单信息；构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型；获取待解析的债券信息文本，对待解析的债券信息文本进行预处理；将所述预处理后的债券信息文本，输入所述交易对手识别模型，得到交易对手的类型。本发明实施例能够有效提取现券交易中的各种要素；避免不同的硬编码规则存在冲突的问题；并且解决了规则维护成本高的问题。

Description

一种基于深度学习的交易对手识别方法、装置及电子设备

技术领域

本发明涉及数据处理技术领域，尤其涉及一种基于深度学习的交易对手识别方法、装置及电子设备。

背景技术

现券交易是金融固收领域中最常见的一种的交易。在现券交易的文本理解中，现券交易对手的识别是一个很重要的问题。针对现券交易的文本理解，一般需要综合一系列的智能算法和业务规则索引，才能完成对现券文本的综合理解。一段常见的现券交易语料，如下所示。“K债，0000123.IB 0.5Y 3.9AA机构出给BB机构\n Y债000673.IB 2+1Y 3.55CC机构出给DD机构请求HH机构”。要理解这段文本，并且为下游任务提供便捷的、智能化的操作，需要将这段文本结构化为如下表格所示的结构形式。

表1文本结构化后的结构

结构化文本需要进行交易对手识别，识别每笔订单中的买方机构、卖方机构和过桥机构。

现有的交易对手识别方法，主要采用两种方案，一种是基于深度学习的方法，基于信息抽取的思想，对文本中的交易对手进行提取和分类，判断是“本方、对手方、过桥机构”等等，这类方法主要有“Albert+CRF、LSTM+CRF、Bert+BiLSTM+CRF”等信息抽取模型。第二种是基于“业务规则”的方法，通过信息抽取模型提取出“机构名”信息，再结合“业务规则”制定专有的逻辑索引，进行对“机构名”进行判断，确定是“本方机构、对手机构”，还是“过桥机构”等等。

首先基于“信息抽取”的深度学习方法，由于在模型训练和预测中，只能利用“文本信息”，并不能包含场外的“金融专业逻辑”并不能很好的判断对手方向，准确率不高，而且同一实体在文本中出现多次，不同位置的实体类别并不相同，信息抽取模型学习难度较大，导致模型对于实体识别的准确率不高。

其次构建专门的交易对手识别算法，需要构建大量针对此领域的训练样本，同时很难进行冷启动。在样本缺少的情况下，模型的准确率并不能达到商用标准。

再次基于算法模型进行提取，在结合业务规则制定逻辑索引，能够解决纯算法模型方案的不足，但是当前的逻辑索引通常采用的是硬编码的计算方法。由此带来的两个问题：a)难于维护，针对每一种判断逻辑都需要增加相应的处理逻辑，维护成本很高。b)硬编码技术泛化能力不足，同时不同逻辑之间容易冲突，可拓展性不强。

现有技术中的交易对手识别方法，维护成本高，实体识别准确率较低。

因此，现有技术还有待于改进和发展。

发明内容

鉴于上述现有技术的不足，本发明提供了一种基于深度学习的交易对手识别方法、装置及电子设备，旨在解决现有技术中的交易对手识别方法，维护成本高，实体识别准确率较低的问题。

本发明的技术方案如下：

本发明第一实施例提供了一种基于深度学习的交易对手识别方法，方法包括：

获取债券信息文本，对所述债券信息文本进行要素提取，得到提取后的要素数据；

根据预设的结构化规则索引、要素数据对所述债券信息文本进行切割，形成现券交易订单信息；

构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型；

获取待解析的债券信息文本，对待解析的债券信息文本进行预处理；

将所述预处理后的债券信息文本，输入所述交易对手识别模型，得到交易对手的类型。

进一步地，所述获取债券信息文本，对所述债券信息文本进行要素提取，得到提取后的要素数据，包括：

获取债券信息文本，对债券信息文本进行编码生成序列文本；

基于深度神经网络对所述序列文本进行要素提取，得到提取后的要素数据。

进一步地，所述根据预设的结构化规则索引、要素数据对所述债券信息文本进行切割，形成现券交易订单信息，包括：

获取债券信息文本，对所述行要素切割，生成逐行的文本信息及每行文本信息包括的要素；

获取每行文本信息的信息类别；

根据信息类别对所述每行信息进行聚合，形成订单维度的现券交易订单信息。

进一步地，所述构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型前，包括：

对所述现券交易订单信息进行识别，获取所述现券交易订单信息中的机构名的位置信息。

进一步地，所述构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型，包括：

构建基于提示的分类模型；

基于金融先验知识及机构名的位置信息，对所述要素数据进行重新组合，生成重组语料；

基于提示的方法将待预测的机构名称与重组语料进行拼接，生成目标语料；

将目标语料输入分类模型，对分类模型进行训练，生成交易对手识别模型。

进一步地，所述获取待解析的债券信息文本，对待解析的债券信息文本进行预处理，包括：

获取待解析的债券信息文本，对所述待解析的债券信息文本进行要素提取，得到提取后的要素数据；

根据预设的结构化规则索引、要素数据对所述待解析的债券信息文本进行切割，形成待解析的现券交易订单信息。

进一步地，所述将所述预处理后的债券信息文本，输入所述交易对手识别模型，得到交易对手的类型，包括：

将所述预处理后的债券信息文本，输入所述交易对手识别模型，获取所述交易对手识别模型输出的机构名；

获取当前视觉方的类型，根据视觉方的类型及机构名确定交易对手类型。

本发明的另一实施例提供了一种基于深度学习的交易对手识别装置，装置包括：

要素提取模块，用于获取债券信息文本，对所述债券信息文本进行要素提取，得到提取后的要素数据；

文本切割模块，用于根据预设的结构化规则索引、要素数据对所述债券信息文本进行切割，形成现券交易订单信息；

模型训练模块，用于构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型；

文本预处理模块，用于获取待解析的债券信息文本，对待解析的债券信息文本进行预处理；

交易对手识别模块，用于将所述预处理后的债券信息文本，输入所述交易对手识别模型，得到交易对手的类型。

本发明的另一实施例提供了一种电子设备，所述电子设备包括至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的基于深度学习的交易对手识别方法。

本发明的另一实施例还提供了一种非易失性计算机可读存储介质，所述非易失性计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个处理器执行时，可使得所述一个或多个处理器执行上述的基于深度学习的交易对手识别方法。

有益效果：本发明实施例实施例能够有效提取现券交易中的各种要素；采用分类算法替换硬编码的方案比现有的硬编码方案有更强的泛化能力，能够解决更多不同类型的问题，避免不同的硬编码规则存在冲突的问题；并且解决了规则维护成本高的问题。

附图说明

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1为本发明一种基于深度学习的交易对手识别方法较佳实施例的流程图；

图2为本发明一种基于深度学习的交易对手识别方法较佳实施例的整体方案的流程示意图；

图3为本发明一种基于深度学习的交易对手识别方法较佳实施例的订单拆分的流程示意图；

图4为本发明一种基于深度学习的交易对手识别方法较佳实施例分类模型的示意图；

图5为本发明一种基于深度学习的交易对手识别装置的较佳实施例的功能模块示意图；

图6为本发明一种电子设备的较佳实施例的硬件结构示意图。

具体实施方式

为使本发明的目的、技术方案及效果更加清楚、明确，以下对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

以下结合附图对本发明实施例进行介绍。

针对上述问题，本发明实施例提供了一种基于深度学习的交易对手识别方法，请参阅图1，图1为本发明一种基于深度学习的交易对手识别方法较佳实施例的流程图。如图1所示，其包括：

步骤S100、获取债券信息文本，对所述债券信息文本进行要素提取，得到提取后的要素数据；

步骤S200、根据预设的结构化规则索引、要素数据对所述债券信息文本进行切割，形成现券交易订单信息；

步骤S300、构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型；

步骤S400、获取待解析的债券信息文本，对待解析的债券信息文本进行预处理；

步骤S500、将所述预处理后的债券信息文本，输入所述交易对手识别模型，得到交易对手的类型。

具体实施时，如图2所示为本发明实施例的整体框架示意图。采用基于深度算法模型，主要的创新点是不再使用NER模型，而是创新性的提出基于提示的分类模型，来识别交易对手。

针对非结构文本，首先采用信息抽取算法模型对分结构文本进行要素抽取，抽取中文本中的核心要素，如“债券名称、债券代码、期限、量、机构名”等各种核心要素。其次构建结构化规则索引，针对“多债券”的情况进行多条订单的切割，形成逐条的现券交易订单信息。再次构建基于提示的分类模型，并根据“金融行业的规则、机构信息出现的位置”来训练模型，判断机构的方向是“本方、对手方”还是“过桥”机构。

在一个实施例中，获取债券信息文本，对所述债券信息文本进行要素提取，得到提取后的要素数据，包括：

具体实施时，采用深度神经网络，对非结构的文本进行要素提取。具体采用基于Bert+LSTM+CRF、并针对现券进行定向优化的深度学习模型(包括但不限于此模型)，将序列文本中的“债券名、债券代码、量、机构名”等信息进行提取，获取到序列文本中的各种核心要素。

在一个实施例中，根据预设的结构化规则索引、要素数据对所述债券信息文本进行切割，形成现券交易订单信息，包括：

获取每行文本信息的信息类别；

具体实施时，如图3所示，针对现券交易文本，本方案构建了基于业务索引逻辑判断模块。结构化逻辑分成一下几个步骤：

按行进行要素切割，依据“\n”将每一行以及基于信息抽取提取的要素进行切割，形成逐行的文本以及每行信息包括的要素。

对每行信息进行类别判断。将每一行的信息判断为“订单信息、补充信息、共享信息、其它信息”。订单信息定义为：本行信息有“债券名或债券代码”等核心的现券交易主题的文本信息。补充信息定义为：本行信息无现券交易的核心信息的补充信息。共享信息为本行信息是共享到各个订单信息中的公共共享信息。其它信息是一些无效的文本信息，如没有任何有效实体的信息。

基于规则对每行信息进行聚合，规则逻辑为：以“订单为核心”将“补充信息”按“向上补充”逻辑拼接到“订单信息中”。“共享信息”直接复制补充到每个“订单信息”中。由此形成以“订单”为维度的一个或多个订单信息。

在一个实施例中，构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型前，包括：

具体实施时，获取到一个或多个订单信息，此信息中包含了核心的订单要素、补充要素信息以及共享的要素信息。在这些要素序列中，包含一个或多个“机构名”。对所述现券交易订单信息进行识别，获取所述现券交易订单信息中的机构名的位置信息。

依据这些“机构名”的位置信息，这个文本的发送人、接收人等信息，综合判断“机构名”是“买方机构”、“卖方机构”还是“过桥机构”。

在一个实施例中，构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型，包括：

构建基于提示的分类模型；

具体实施时，基于约定俗成的金融规则，如“A债00001 2000W收益率3.14，XX银行出给YY基金请求ZZ证券”；本方案对成交语料中的要素[债券名称、债券代码，机构名称，交易方向，请求方式，换行符“\n”]提取出来，根据这些要素依次出现的顺序重新组合成句子，如上述成交语料经过提取并组合后得到“A债00001XX银行出给YY基金请求ZZ证券”。

b).基于提示的语料。因为在分类模型中，一条语料只存在一个互斥的类别，因此无法从提取后的语料“A债00001XX银行出给YY基金请求ZZ证券”里判断出XX银行是卖方机构、YY基金是买方机构、ZZ证券是过桥机构。因此本方案采用了提示的方法，通过把要预测的机构名称与语料进行拼接，提示模型要预测哪个机构名称，从而实现对交易对手的识别。拼接后的语料为“XX银行#A债00001XX银行出给YY基金请求ZZ证券”，“YY基金#A债00001XX银行出给YY基金请求ZZ证券”。上述的语料则能起到提示模型要预测的对象是哪个机构，并且拼接后语料并不一致，不会出现同一个语料出现多个互斥的标签的结果，从而实现模型的准确性。

本发明实施例中使用到分类算法，当前采用Bert+[CLS]+dense；预训练模型包括但不限于BERT，但可以包含albert等预训练模型。以Bert+[CLS]+dense模型为例，网络结构图如图4所示。

output＝dense(BERT(h_cls；θ)) (公式2)

其中dense(x)＝W^Tx+b，W是转换矩阵，b是偏置参数，h是Transformer Encoder的隐向量，θ是模型的参数，h_cls是BERT中输出的[CLS]向量，x是模型的输入信息(上述b提及的抽取并拼接提示内容后的文本)。M是BERT模型中Transformer Encoder的个数。

本方案采用上述的模型结构，对拼接后的输入语料进行分类，判别语料及其对应的机构属于买方、卖方或过桥机构中的哪一个。

在一个实施例中，获取待解析的债券信息文本，对待解析的债券信息文本进行预处理，包括：

具体实施时，获取待解析的债券信息文本，对所述待解析的债券信息文本进行要素提取，提取的要素包括但不限于债券名、债券代码、量、机构名等数据，并根据结构化规则索引对待解析的债券信息文本进行切割，形成一个或多个订单信息，具体的结构化规则索引与上述的训练样本中的结构化规则索引相同，此处不再赘述。

在一个实施例中，将所述预处理后的债券信息文本，输入所述交易对手识别模型，得到交易对手的类型，包括：

具体实施时，当交易对手识别模型已经判断出卖方/买方/过桥后，本方/对手方/过桥机构还需要根据视觉方来确定，视觉方则是看到这条现券成交信息的机构。如果视觉方为买方机构，则交易对手则是卖方机构。如果视觉方为卖方机构，则交易对手是买方机构。如果视觉方为过桥机构，则买卖双方都是交易对手。

本发明实施例是针对现券交易中对手识别的方法，结合金融逻辑，再利用基于提示的分类算法进行对手的识别判断。可扩展到其他需要识别金融交易对手的场景。

本发明实施例提供了一种基于深度学习的交易对手识别方法，采用基于提示的分类算法搭建的交易对手识别方案，能够有效提取现券交易中的各种要素。

方案中采用分类算法替换硬编码的方案比现有的硬编码方案有更强的泛化能力，能够解决更多不同类型的问题，避免不同的硬编码规则存在冲突的问题；并且解决了规则维护成本高的问题。

需要说明的是，上述各步骤之间并不必然存在一定的先后顺序，本领域普通技术人员，根据本发明实施例的描述可以理解，不同实施例中，上述各步骤可以有不同的执行顺序，亦即，可以并行执行，亦可以交换执行等等。

本发明另一实施例提供一种基于深度学习的交易对手识别装置，如图5所示，装置1包括：

要素提取模块11，用于获取债券信息文本，对所述债券信息文本进行要素提取，得到提取后的要素数据；

文本切割模块12，用于根据预设的结构化规则索引、要素数据对所述债券信息文本进行切割，形成现券交易订单信息；

模型训练模块13，用于构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型；

文本预处理模块14，用于获取待解析的债券信息文本，对待解析的债券信息文本进行预处理；

交易对手识别模块15，用于将所述预处理后的债券信息文本，输入所述交易对手识别模型，得到交易对手的类型。

具体实施方式见方法实施例，此处不再赘述。

本发明另一实施例提供一种电子设备，如图6所示，电子设备10包括：

一个或多个处理器110以及存储器120，图6中以一个处理器110为例进行介绍，处理器110和存储器120可以通过总线或者其他方式连接，图6中以通过总线连接为例。

处理器110用于完成电子设备10的各种控件逻辑，其可以为通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、单片机、ARM(Acorn RISCMachine)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件控件或者这些部件的任何组合。还有，处理器110还可以是任何传统处理器、微处理器或状态机。处理器110也可以被实现为计算设备的组合，例如，DSP和微处理器的组合、多个微处理器、一个或多个微处理器结合DSP核、或任何其它这种配置。

存储器120作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块，如本发明实施例中的基于深度学习的交易对手识别方法对应的程序指令。处理器110通过运行存储在存储器120中的非易失性软件程序、指令以及单元，从而执行设备10的各种功能应用以及数据处理，即实现上述方法实施例中的基于深度学习的交易对手识别方法。

存储器120可以包括存储程序区和存储数据区，其中，存储程序区可存储操作装置、至少一个功能所需要的应用程序；存储数据区可存储根据设备10使用所创建的数据等。此外，存储器120可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中，存储器120可选包括相对于处理器110远程设置的存储器，这些远程存储器可以通过网络连接至设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

一个或者多个单元存储在存储器120中，当被一个或者多个处理器110执行时，执行上述任意方法实施例中的基于深度学习的交易对手识别方法，例如，执行以上描述的图1中的方法步骤S100至步骤S500。

本发明实施例提供了一种非易失性计算机可读存储介质，计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个处理器执行，例如，执行以上描述的图1中的方法步骤S100至步骤S500。

作为示例，非易失性存储介质能够包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦ROM(EEPROM)或闪速存储器。易失性存储器能够包括作为外部高速缓存存储器的随机存取存储器(RAM)。通过说明并非限制，RAM可以以诸如同步RAM(SRAM)、动态RAM、(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、Synchl ink DRAM(SLDRAM)以及直接Rambus(兰巴斯)RAM(DRRAM)之类的许多形式得到。本文中所描述的操作环境的所公开的存储器控件或存储器旨在包括这些和/或任何其他适合类型的存储器中的一个或多个。

本发明的另一种实施例提供了一种计算机程序产品，计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令被处理器执行时，使处理器执行上述方法实施例的基于深度学习的交易对手识别方法。例如，执行以上描述的图1中的方法步骤S100至步骤S500。

以上所描述的实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施例的描述，本领域的技术人员可以清楚地了解到各实施例可借助软件加通用硬件平台的方式来实现，当然也可以通过硬件实现。基于这样的理解，上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存在于计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机装置(可以是个人计算机，服务器，或者网络装置等)执行各个实施例或者实施例的某些部分的方法。

除了其他之外，诸如"能够'、"能"、"可能"或"可以"之类的条件语言除非另外具体地陈述或者在如所使用的上下文内以其他方式理解，否则一般地旨在传达特定实施方式能包括(然而其他实施方式不包括)特定特征、元件和/或操作。因此，这样的条件语言一般地还旨在暗示特征、元件和/或操作对于一个或多个实施方式无论如何都是需要的或者一个或多个实施方式必须包括用于在有或没有输入或提示的情况下判定这些特征、元件和/或操作是否被包括或者将在任何特定实施方式中被执行的逻辑。

已经在本文中在本说明书和附图中描述的内容包括能够提供基于深度学习的交易对手识别方法及装置的示例。当然，不能够出于描述本公开的各种特征的目的来描述元件和/或方法的每个可以想象的组合，但是可以认识到，所公开的特征的许多另外的组合和置换是可能的。因此，显而易见的是，在不脱离本公开的范围或精神的情况下能够对本公开做出各种修改。此外，或在替代方案中，本公开的其他实施例从对本说明书和附图的考虑以及如本文中所呈现的本公开的实践中可能是显而易见的。意图是，本说明书和附图中所提出的示例在所有方面被认为是说明性的而非限制性的。尽管在本文中采用了特定术语，但是它们在通用和描述性意义上被使用并且不用于限制的目的。

Claims

1.一种基于深度学习的交易对手识别方法,其特征在于,所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取债券信息文本，对所述债券信息文本进行要素提取，得到提取后的要素数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据预设的结构化规则索引、要素数据对所述债券信息文本进行切割，形成现券交易订单信息，包括：

获取每行文本信息的信息类别；

4.根据权利要求3所述的方法，其特征在于，所述构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型前，包括：

5.根据权利要求4所述的方法，其特征在于，所述构建基于提示的分类模型，根据金融先验知识及所述现券交易订单信息对所述分类模型进行训练，生成交易对手识别模型，包括：

构建基于提示的分类模型；

6.根据权利要求5所述的方法，其特征在于，所述获取待解析的债券信息文本，对待解析的债券信息文本进行预处理，包括：

7.根据权利要求6所述的方法，其特征在于，所述将所述预处理后的债券信息文本，输入所述交易对手识别模型，得到交易对手的类型，包括：

8.一种基于深度学习的交易对手识别装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，所述电子设备包括至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7任一项所述的基于深度学习的交易对手识别方法。

10.一种非易失性计算机可读存储介质，其特征在于，所述非易失性计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个或多个处理器执行时，可使得所述一个或多个处理器执行权利要求1-7任一项所述的基于深度学习的交易对手识别方法。