WO2023029353A1

WO2023029353A1 - 基于多模态混合模型的业务数据处理方法及装置

Info

Publication number: WO2023029353A1
Application number: PCT/CN2022/071442
Authority: WO
Inventors: 谯轶轩; 陈浩
Original assignee: 平安科技（深圳）有限公司
Priority date: 2021-08-30
Filing date: 2022-01-11
Publication date: 2023-03-09
Also published as: CN113723288B; CN113723288A

Abstract

本申请提供一种基于多模态混合模型的业务数据处理方法及装置，涉及人工智能技术领域，主要目的在于改善现有利用针对单一模态数据的单独模型进行多模态的数据处理导致的各个模态之间的处理无关联性，从而降低了保单数据处理的整体性准确率和业务数据处理效率的问题。包括：解析保单业务信息中的图像数据、以及文本数据；基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果；根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件；当检测到所述承保启动触发事件，则启动对所述保单业务信息的承保操作。

Description

基于多模态混合模型的业务数据处理方法及装置

本申请要求与2021年08月30日提交中国专利局、申请号为202111007560.6申请名称为“基于多模态混合模型的业务数据处理方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在申请中。

技术领域

本申请涉及一种人工智能技术领域，特别是涉及一种基于多模态混合模型的业务数据处理方法及装置。

背景技术

随着人工智能的快速发展，人工智能已经在医疗保险业务的大数据领域全面普及。其中，为了减少人为对保单的处理误差，可以通过人工智能对保单业务进行数据处理，以实现承保的准确性、高效性。

发明人意识到目前对保单、承保的数据处理过程仅仅是对单一模态数据进行单一地模型数据处理，从而得到对保单的数据处理结果，但是，由于保单中包含的是多模态的数据，仅仅针对单一模态数据的单独模型进行数据处理，会导致各个模态之间处理无关联性，影响保单的数据处理的整体性准确率，从而业务数据的处理效率。

发明内容

有鉴于此，本申请提供一种基于多模态混合模型的业务数据处理方法及装置。

依据本申请一个方面，提供了一种基于多模态混合模型的业务数据处理方法，包括：

解析保单业务信息中的图像数据、以及文本数据；

基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果，所述多模态混合模型为基于多模态输入参数的个数分别配置模态替换对象进行构建，并以混合模态方式确定损失函数完成模型训练得到的；

根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件；

当检测到所述承保启动触发事件，则启动对所述保单业务信息的承保操作。

依据本申请另一个方面，提供了一种基于多模态混合模型的业务数据处理装置，包括：

解析模块，用于解析保单业务信息中的图像数据、以及文本数据；

处理模块，用于基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果，所述多模态混合模型为基于多模态输入参数的个数分别配置模态替换对象进行构建，并以混合模态方式确定损失函数完成模型训练得到的；

分类模块，用于根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件；

启动模块，用于当检测到所述承保启动触发事件，则启动对所述保单业务信息的承保操作。

根据本申请的又一方面，提供了一种存计算机可读存储介质，其上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现基于多模态混合模型的业务数据处理方法，包括：

解析保单业务信息中的图像数据、以及文本数据；

根据本申请的再一方面，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，其中，所述计算机可读指令被处理器执行时实现基于多模态混合模型的业务数据处理方法，包括：

解析保单业务信息中的图像数据、以及文本数据；

借由上述技术方案，本申请实施例提供的技术方案至少具有下列优点：

本申请能够使各个模态之间处理具有关联性，提高了保单数据处理的整体性准确率，从而提高了业务数据的处理效率。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本申请实施例提供的一种基于多模态混合模型的业务数据处理方法流程图；

图2示出了本申请实施例提供双模态输入格式示意图；

图3示出了本申请实施例提供单模态数据输入格式H1’示意图；

图4示出了本申请实施例提供单模态数据输入格式H2’示意图；

图5示出了本申请实施例提供的一种基于多模态混合模型的业务数据处理装置组成框图；

图6示出了本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

目前，在保司对保单或承保业务进行数据处理时，普遍仅仅针对单一模态数据的单独模型进行数据处理，然而由于实际的保单中大多是包含多模态数据的，这样容易导致各个模态之间的处理无关联性，降低了保单的数据处理的整体性准确率和业务数据的处理效率。

为了改善上述问题，本申请实施例提供了一种基于多模态混合模型的业务数据处理方法，如图1所示，以该方法应用于服务器等计算机设备为例进行说明，其中，服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器，如智能医疗系统、数字医疗平台等。上述方法包括以下步骤：

101、解析保单业务信息中的图像数据、以及文本数据。

本申请实施例中，智能医疗系统中会嵌入保单数据处理模块，以在医疗诊断后直接调取保单业务进行处理，从而使医疗与保单承保建立完整业务链，因此，作为当前执行端的终端可以为单独的处理服务端，也可以为嵌入在智能医疗系统中的单独一个处理单元，本申请实施例不做具体限定。其中，在对保单中的业务信息进行识别处之前，首先针对保单业务信息中的图像数据以及文本数据进行解析。其中，保单业务信息中可以包括扫描的图像信息以及录入的文本数据。因此，在对保单业务信息进行处理时，需要对保单业务信息中的图像数据以及文本数据进行解析，分别得到需要进行多模态融合识别的图像数据以及文本数据。

需要说明的是，保单业务信息可以从保司的保单信息数据库中获取，其中，数据库中的数据可以由业务人员在为用户办理业务时进行录入，可以包括图像数据以及文本数据等。例如，业务人员将用户填写的订单经过扫描或拍照，并将图片存储在数据库中，也可以由业务人员将用户的基本信息和选择的业务信息，录入系统生成电子保单，并存储在数据库中。本申请实施例不做具体限定。由于数据库中的数据呈多样性，因此，在进行智能人工识别处理前，需要先解析得到需要进行多模态融合识别的图像数据以及文本数据。

102、基于完成训练的多模态混合模型对图像数据、文本数据进行多模态混合识别处理，得到多模态混合处理结果。

其中，多模态混合模型为基于多模态输入参数的个数分别配置模态替换对象并以混合模态方式确定损失函数完成模型训练的；

本申请实施例中，多模态混合模型可以是一种进行识别处理的人工智能数据处理模型，利用完成训练的多模态混合模型对图像数据、文本数据进行多模态混合识别处理，得到多模态混合处理结果。处理结果为对不同图像数据、不同文本数据进行多模态混合识别处理得到的业务分类内容，可作为对保单业务信息进行标签分类的内容，例如，保单产品，用户对象，签订时间，承保期限等，本申请实施例不做具体限定。其中，完成训练的多模态混合模型可以基于多模态输入参数的个数分别配置模态替换对象并以混合模态方式确定损失函数完成模型训练得到的，即利用模态替换对象以及单模态训练样本组多模态混合网络结构进行模型训练，得到的多模态混合模型。

需要说明的是，单模态模型负责将信息表示为计算机可以处理的数值向量或者进一步抽象为更高层的特征向量，而多模态模型是指通过利用多模态之间的互补性，剔除模态间的冗余性，从而学习到更好的特征表示。

103、根据多模态混合处理结果对保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件。

本申请实施例中，为了提高业务数据的效率，在得到多模态混合处理结果之后，根据处理结果对该保单业务信息进行标签分类，并解析保单业务需求与标签分类的保单业务信息相匹配，确定承保启动触发事件。其中，标签分类用于表征标记不同保单业务信息所对应的保单产品、时间、主体对象等。保单业务需求可以包括：核保需求、状态追踪需求、抽样评估需求等。承保启动触发事件用于表征基于保单信息，保司需要作出的处理操作，如调取承保业务流程，以承保业务有序进行等。

示例性的，经过对保单进行多模态混合识别处理得出该保单为2019年3月份签订的保单，保险期限为1年，经过解析后，该保单已完成承保，需要对其进行抽样评估。

104、当检测到承保启动触发事件，则启动对保单业务信息的承保操作。

本申请实施例中，通过步骤103中将保单的多模态混合处理结果与保单信息业务需求经过匹配后，如果匹配到需要进行的下一步操作，则执行下一步操作。

优选的，可以在检测到承保启动触发事件时，通过解析保单业务信息中各个承保阶段阶段的承保状态，使其按照承保流程执行承保业务。

在本申请实施例中，为了进一步说明及限定，基于完成训练的多模态混合模型对图像数据、文本数据进行多模态混合识别处理，得到多模态混合处理结果之前，本实施方法还包括：获取多模态训练样本集，该多模态训练样本集中包含至少两个单模态训练样本组；构建多模态混合网络结构，并获取多模态混合网络结构中替换至少一个单模态输入参数的模态替换对象；基于模态替换对象、单模态训练样本组对多模态混合网络结构进行模型训练，得到多模态混合模型。

其中，单模态输入参数的个数之和小于或等于多模态输入参数个数；多模态混合模型的损失函数为基于混合模态方式确定的。

其中，多模态训练样本集为经过解析的保单业务信息中的相关数据，至少包含两个单模态训练样本组，如图像数据训练样本组以及文本数据训练样本组。优选的，在构建多模态混合网络结构时，获取至少一个模态替换对象用于替换该多模态混合网络结构中的单模态输入参数，也可根据多模态训练样本集中的单模态训练样本组的个数获取多个，只需保证单模态输入参数的个数之和小于或等于多模态输入参数个数即可，本申请实施例不做具体限定。进一步的，基于获取的模态替换对象以及单模态训练样本组对多模态混合网络结构进行模型训练，得到多模态混合模型。

示例性的，以双模态混模型为例，模态1为文本数据，模态2为图像数据。首先构建双模态输入格式，如图2所示，分别在每个模态后面拼接[sep]字符进行区分，然后拼接起输入给模型，由于transformer的输入长度是固定的，一般设置为512，所以拼接起来长度大于512时，进行截断，少于512时，添加[pad]字符补全至512个。其次，分别构建单模态数据输入格式H1’，如图3所示，以及单模态数据输入格式H2’，图4所示。由于transformer的输入长度是固定的，一般设置为512，所以在只有单模态的情况下后单模态特征后首先添加[sep]，然后添加[pad]字符补全至512个。分别将两个单模态训练样本组的数据分别输入Transformer架构，取出最后一层网络[sep]位置对应的向量。H1表示双模态输入时模态1的特征向量表示，H2表示双模态输入时模态2的特征向量表示，H1’表示单模态输入时模态1的特征向量表示，H2’表示单模态输入时模态2的特征向量表示。进一步的，为了使H1和H1’、以及H2和H2’的向量表示尽可能相同，定义如下损失函数L1，L1＝|H1-H1’|2+|H2-H2’|2。其中||2表示向量见的二范数。优选的，对模态1和模态2是否来自于同一样本进行准确分类，即在构建训练样本时，会有一半的样本由同一样本的模态1和模态2构成，一半的样本由不同样本的模态1和模态2构成，需要模型预测前者类别为1，后者类别为0。具体步骤包括：b1)首先拼接通过transformer架构后H1，H2向量；b2)通过全连接层转换成2维，通过softmax操作得到对每个类别的预测概率，简记为S；b3)计算预测概率向量S和真实类别所对应的one-hot编码Y之间的交叉熵损失函数得到L2

其中，共有K个样本，(l)表示向量的第l维，one-hot编码指向量中真实单词所在的位置为1，其余位置均为0的表示方法。最终的损失函数为L＝L1+L2。

采用随机梯度下降算法(SGD)和pytorch框架进行模型的建模，参数的更新，完成模型训练。

为了更清晰的说明模态替换对象的获取过程，本申请实施例中，优选的，在基于模态替换对象、单模态训练样本组对多模态混合网络结构进行模型训练，得到多模态混合模型之前，本实施例方法还包括：对所述多模态训练样本集进行单模态训练样本组类别个数划分；根据划分的类别个数之间的比值配置各模态替换对象的替换权重值；获取所述多模态混合网络结构中替换至少一个单模态输入参数的模态替换对象包括：确定与单模态输入参数匹配的至少一个模态替换对象，按照替换权重值从模态替换对象中筛选唯一匹配该单模态输入参数的模态替换对象。

具体的，承接上述示例，对于模态1与模态2的原始训练数据进行预处理，提取相应的特征信息。其中，针对文本数据，首先进行jieba分词处理,采用预训练好的Word2vec或者GloVe将分词后的每个词转换成词向量，例如，分词后有m个字，那最终特征维度为[m,300]，其中300为词向量维度。针对图像数据，可选的，可以通过VGG等预训练好的模型，提取指定层(例如fc7)的特征，提取后的维度大小为[7,7,2048]，通过python的reshape操作将其转换成维度[49,2048]，即可以理解为一共提取出49个特征，每个特征2048维；也可以通过Faster RCNN等预训练好的模型提取图片中预定义类别的特征信息，最终维度大小是[n,2048],其中每张图片的n都是不一样的，本申请实施例不做具体限定。

进一步优选的，在对多模态训练样本集进行单模态训练样本组类别个数划分之前，本实施例方法还包括：按照预设时间间隔、保单业务更新状态对多模态训练样本集中单模态训练样本组进行更新，以更新各模态替换对象的替换权重值。

具体的，为了使训练样本的数据更准确，在对多模态训练样本集进行单模态训练样本组类别个数划分之前，还可以按照预设的规则对样本数据进行更新，进一步的，根据更新后的样本数据确定各模态替换对象的替换权重值，例如，预设更新时间间隔对样本数据进行更新，或者根据保单业务更新状态对样本数据进行更新。

示例性的，设置每隔30天对样本数据进行更新，相应的根据更新后样本数据对各模态的替换权重值进行更新，进一步得到更符合当前实际情况的多模态混合模型，以使得保单业务信息识别处理结果更准确。

本申请实施例中，进一步的，根据多模态混合处理结果对保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件包括：将对多模态混合处理结果标记的保单产品标识、时间标识、主体对象标识与保单业务需求中的核保需求、状态追踪需求、抽样评估需求进行匹配；若匹配，则将承保启动触发事件配置于保单业务信息执行核保操作、状态追踪操作、抽样评估操作完成后，以执行承保启动触发事件的触发操作。

具体的，通过多模态混合处理可以得到对保单业务进行分类的内容进行标签分类，可以包括保单产品标识、时间标识、主体对象标识等，将其与保单业务需求中的核保需求、状态追踪需求、抽样评估需求进行匹配，若匹配，则将承保启动触发事件配置于保单业务信息中，以指示执行对应的操作。其中，标签分类用于表征标记不同保单业务信息所对应的保单产品、时间、主体对象等。产品标识用于表征产品类别，例如车险，人身保险等。时间标识用于表征保单签订时间或保单生效时间等。主体对象用于表征用户群体。核保需求用于表征用户签订订单，保司审查阶段。状态追踪需求用于表征保单处于有效期内，保司承保过程中对保单业务状态的实时确认。抽样评估需求用于表征对保单完成质量的抽样评估调查。

本申请实施例中，进一步的，启动对保单业务信息的承保操作包括：调取承保线程，并解析保单业务信息中的承保参数；将承保参数引入承保线程中的承保操作执行指令中，以使按照承保操作执行指令执行承保业务。

其中，承保参数用于标识不同承保时间段、不同承保业务阶段的承保状态。

需要说明的是，根据保险产品类别的不同，保司会制定相应的承保线程，以指示保险业务有序的进行。在触发了承保启动操作后，首先调取承保线程，并将保单务信息中承保参数引入承保线程中的操作执行指令中，以使得承保业务按照指令有序进行。

另外，由于保单业务信息中的图像数据、以及文本数据可以从保司的保单信息数据库中获取，而数据库中的数据可以由业务人员在为用户办理业务时进行录入，包含业务人员将用户填写的订单经过扫描或拍照获得的图像数据以及文本数据，因此会存在图像不清晰，或录入误差等问题，从而影响多模态混合识别的准确度。

为了避免这一问题，本申请实施例中，可选的，解析保单业务信息中的图像数据、以及文本数据之后，本实施例方法还包括：按照图像清晰度、图像像素配比、图像大小对图像数据进行筛选，确定待进行多模态混合识别处理的图像数据；根据自然语言处理数据库对文本数据进行异常词语筛选，确定待进行多模态混合识别处理的文本数据。

具体的，在对保单业务信息数据进行多模态混合识别处理前，可以对数据进行筛选。针对图像数据，优选的，可以按照图像清晰度、图像像素配比、图像大小对其进行筛选，以确定待处理的图像数据；针对文本数据，优选的，可以根据自然语言处理数据库对文本数据进行异常词语筛选，以确定待处理的文本数据，例如，NLP自然语言处理模型，本申请实施例不做具体限定。

本申请提供了一种基于多模态混合模型的业务数据处理方法，与现有技术相比，本申请实施例通过解析保单业务信息中的图像数据、以及文本数据；基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果，所述多模态混合模型为基于多模态输入参数的个数分别配置模态替换对象进行构建，并以混合模态方式确定损失函数完成模型训练得到的；根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件；当检测到所述承保启动触发事件，则启动对所述保单业务信息的承保操作，使各个模态之间处理具有关联性，提高了保单数据处理的整体性准确率，从而提高了业务数据的处理效率。

进一步的，作为对上述图1所示方法的实现，本申请实施例提供了一种基于多模态混合模型的业务数据处理装置，如图5所示，该装置包括：

解析模块21，处理模块22，分类模块23，启动模块24。

解析模块21，用于解析保单业务信息中的图像数据、以及文本数据；

处理模块22，用于基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果，所述多模态混合模型为基于多模态输入参数的个数分别配置模态替换对象进行构建，并以混合模态方式确定损失函数完成模型训练得到的；

分类模块23，用于根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件；

启动模块24，用于当检测到所述承保启动触发事件，则启动对所述保单业务信息的承保操作。

在具体的应用场景中，所述处理模块22之前，所述装置还包括：

获取模块，用于获取多模态训练样本集，所述多模态训练样本集中包含至少两个单模态训练样本组；

构建模块，用于构建多模态混合网络结构，并获取所述多模态混合网络结构中替换至少一个单模态输入参数的模态替换对象，所述单模态输入参数的个数之和小于或等于多模态输入参数个数；

训练模块，用于基于所述模态替换对象、所述单模态训练样本组对多模态混合网络结构进行模型训练，得到多模态混合模型，所述多模态混合模型的损失函数为基于混合模态方式确定的。

在具体的应用场景中，所述训练模块之前，所述装置还包括：

划分模块，用于对所述多模态训练样本集进行单模态训练样本组类别个数划分；

配置模块，用于根据划分的类别个数之间的比值配置各模态替换对象的替换权重值；

在具体的应用场景中，所述构建模块包括：

确定单元，用于确定与所述单模态输入参数匹配的至少一个模态替换对象，按照所述替换权重值从所述模态替换对象中筛选唯一匹配所述单模态输入参数的模态替换对象。

在具体的应用场景中，所述划分模块之前，所述装置还包括：

更新模块，用于按照预设时间间隔、保单业务更新状态对所述多模态训练样本集中单模态训练样本组进行更新，以更新各模态替换对象的替换权重值。

在具体的应用场景中，所述所述标签分类用于表征标记不同保单业务信息所对应的保单产品、时间、主体对象，所述分类模块23包括：

匹配单元，用于将对所述多模态混合处理结果标记的保单产品标识、时间标识、主体对象标识与所述保单业务需求中的核保需求、状态追踪需求、抽样评估需求进行匹配；

触发单元，用于若匹配，则将承保启动触发事件配置于所述保单业务信息执行核保操作、状态追踪操作、抽样评估操作完成后，以执行所述承保启动触发事件的触发操作。

在具体的应用场景中，所述启动模块24包括：

调取单元，用于调取承保线程，并解析所述保单业务信息中的承保参数，所述承保参数用于标识不同承保时间段、不同承保业务阶段的承保状态；

执行单元，用于将所述承保参数引入所述承保线程中的承保操作执行指令中，以使按照所述承保操作执行指令执行承保业务。

在具体的应用场景中，所述解析模块21之后，所述装置还包括：

筛选模块，用于按照图像清晰度、图像像素配比、图像大小对所述图像数据进行筛选，确定待进行多模态混合识别处理的图像数据；

确定模块，用于根据自然语言处理数据库对所述文本数据进行异常词语筛选，确定待进行多模态混合识别处理的文本数据。

本申请提供了一种基于多模态混合模型的业务数据处理装置，与现有技术相比，本申请实施例通过解析保单业务信息中的图像数据、以及文本数据；基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果，所述多模态混合模型为基于多模态输入参数的个数分别配置模态替换对象进行构建，并以混合模态方式确定损失函数完成模型训练得到的；根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件；当检测到所述承保启动触发事件，则启动对所述保单业务信息的承保操作，使各个模态之间处理具有关联性，提高了保单数据处理的整体性准确率，从而提高了业务数据的处理效率。

根据本申请一个实施例提供了一种计算机可读存储介质，所述存储介质存储有至少一可执行指令，该计算机可执行指令可执行上述任意方法实施例中的基于多模态混合模型的业务数据处理方法，所述计算机可读存储介质可以是非易失性，也可以是易失性。

图6示出了根据本申请一个实施例提供的一种计算机设备的结构示意图，本申请具体实施例并不对计算机设备的具体实现做限定。

如图6所示，该计算机设备可以包括：处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线508。

其中：处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。

通信接口304，用于与其它设备比如客户端或其它服务器等的网元通信。

处理器302，用于执行程序310，具体可以执行上述基于多模态混合模型的业务数据处理方法实施例中的相关步骤。

具体地，程序310可以包括程序代码，该程序代码包括计算机操作指令。

处理器302可能是中央处理器CPU，或者是特定集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本申请实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器306，用于存放程序310。存储器306可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序310具体可以用于使得处理器302执行以下操作：

解析保单业务信息中的图像数据、以及文本数据；

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本申请的保护范围之内。

Claims

一种基于多模态混合模型的业务数据处理方法，其中，包括：

解析保单业务信息中的图像数据、以及文本数据；

基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果，所述多模态混合模型为基于多模态输入参数的个数分别配置模态替换对象进行构建，并以混合模态方式确定损失函数完成模型训练得到的；

根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件；

当检测到所述承保启动触发事件，则启动对所述保单业务信息的承保操作。
根据权利要求1所述的方法，其中，所述基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果之前，所述方法还包括：

获取多模态训练样本集，所述多模态训练样本集中包含至少两个单模态训练样本组；

构建多模态混合网络结构，并获取所述多模态混合网络结构中替换至少一个单模态输入参数的模态替换对象，所述单模态输入参数的个数之和小于或等于多模态输入参数个数；

基于所述模态替换对象、所述单模态训练样本组对多模态混合网络结构进行模型训练，得到多模态混合模型，所述多模态混合模型的损失函数为基于混合模态方式确定的。
根据权利要求2所述的方法，其中，所述基于所述模态替换对象、所述单模态训练样本组对多模态混合网络结构进行模型训练，得到多模态混合模型之前，所述方法还包括：

对所述多模态训练样本集进行单模态训练样本组类别个数划分；

根据划分的类别个数之间的比值配置各模态替换对象的替换权重值；

所述获取所述多模态混合网络结构中替换至少一个单模态输入参数的模态替换对象包括：

确定与所述单模态输入参数匹配的至少一个模态替换对象，按照所述替换权重值从所述模态替换对象中筛选唯一匹配所述单模态输入参数的模态替换对象。
根据权利要求3所述的方法，其中，所述对所述多模态训练样本集进行单模态训练样本组类别个数划分之前，所述方法还包括：

按照预设时间间隔、保单业务更新状态对所述多模态训练样本集中单模态训练样本组进行更新，以更新各模态替换对象的替换权重值。
根据权利要求1所述的方法，其中，所述所述标签分类用于表征标记不同保单业务信息所对应的保单产品、时间、主体对象，所述根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件包括：

将对所述多模态混合处理结果标记的保单产品标识、时间标识、主体对象标识与所述保单业务需求中的核保需求、状态追踪需求、抽样评估需求进行匹配；

若匹配，则将承保启动触发事件配置于所述保单业务信息执行核保操作、状态追踪操作、抽样评估操作完成后，以执行所述承保启动触发事件的触发操作。
根据权利要求5所述的方法，其中，所述启动对所述保单业务信息的承保操作包括：

调取承保线程，并解析所述保单业务信息中的承保参数，所述承保参数用于标识不同承保时间段、不同承保业务阶段的承保状态；

将所述承保参数引入所述承保线程中的承保操作执行指令中，以使按照所述承保操作执行指令执行承保业务。
根据权利要求1-6任一项所述的方法，其中，所述解析保单业务信息中的图像数据、以及文本数据之后，所述方法还包括：

按照图像清晰度、图像像素配比、图像大小对所述图像数据进行筛选，确定待进行多模态混合识别处理的图像数据；

根据自然语言处理数据库对所述文本数据进行异常词语筛选，确定待进行多模态混合识别处理的文本数据。
一种基于多模态混合模型的业务数据处理装置，其中，包括：

解析模块，用于解析保单业务信息中的图像数据、以及文本数据；

处理模块，用于基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果，所述多模态混合模型为基于多模态输入参数的个数分别配置模态替换对象进行构建，并以混合模态方式确定损失函数完成模型训练得到的；

分类模块，用于根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件；

启动模块，用于当检测到所述承保启动触发事件，则启动对所述保单业务信息的承保操作。
一种计算机可读存储介质，其上存储有计算机可读指令，其中，所述计算机可读指令被处理器执行时实现基于多模态混合模型的业务数据处理方法，包括：

解析保单业务信息中的图像数据、以及文本数据；

基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果，所述多模态混合模型为基于多模态输入参数的个数分别配置模态替换对象进行构建，并以混合模态方式确定损失函数完成模型训练得到的；

根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件；

当检测到所述承保启动触发事件，则启动对所述保单业务信息的承保操作。
根据权利要求9所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时实现对所述基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果之前，所述方法还包括：

获取多模态训练样本集，所述多模态训练样本集中包含至少两个单模态训练样本组；

构建多模态混合网络结构，并获取所述多模态混合网络结构中替换至少一个单模态输入参数的模态替换对象，所述单模态输入参数的个数之和小于或等于多模态输入参数个数；

基于所述模态替换对象、所述单模态训练样本组对多模态混合网络结构进行模型训练，得到多模态混合模型，所述多模态混合模型的损失函数为基于混合模态方式确定的。
根据权利要求10所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时实现所述模态替换对象、所述单模态训练样本组对多模态混合网络结构进行模型训练，得到多模态混合模型之前，所述方法还包括：

对所述多模态训练样本集进行单模态训练样本组类别个数划分；

根据划分的类别个数之间的比值配置各模态替换对象的替换权重值；

所述获取所述多模态混合网络结构中替换至少一个单模态输入参数的模态替换对象包括：

确定与所述单模态输入参数匹配的至少一个模态替换对象，按照所述替换权重值从所述模态替换对象中筛选唯一匹配所述单模态输入参数的模态替换对象。
根据权利要求11所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时实现所述对所述多模态训练样本集进行单模态训练样本组类别个数划分之前，所述方法还包括：

按照预设时间间隔、保单业务更新状态对所述多模态训练样本集中单模态训练样本组进行更新，以更新各模态替换对象的替换权重值。
根据权利要求9所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时实现所述标签分类用于表征标记不同保单业务信息所对应的保单产品、时间、主体对象，所述根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件包括：

将对所述多模态混合处理结果标记的保单产品标识、时间标识、主体对象标识与所述保单业务需求中的核保需求、状态追踪需求、抽样评估需求进行匹配；

若匹配，则将承保启动触发事件配置于所述保单业务信息执行核保操作、状态追踪操作、抽样评估操作完成后，以执行所述承保启动触发事件的触发操作。
根据权利要求13所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时实现所述启动对所述保单业务信息的承保操作包括：

调取承保线程，并解析所述保单业务信息中的承保参数，所述承保参数用于标识不同承保时间段、不同承保业务阶段的承保状态；

将所述承保参数引入所述承保线程中的承保操作执行指令中，以使按照所述承保操作执行指令执行承保业务。
根据权利要求9-14任一项所述的计算机可读存储介质，其中，所述计算机可读指令被处理器执行时实现所述解析保单业务信息中的图像数据、以及文本数据之后，所述方法还包括：

按照图像清晰度、图像像素配比、图像大小对所述图像数据进行筛选，确定待进行多模态混合识别处理的图像数据；

根据自然语言处理数据库对所述文本数据进行异常词语筛选，确定待进行多模态混合识别处理的文本数据。
一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令，其中，所述计算机可读指令被处理器执行时实现基于多模态混合模型的业务数据处理方法，包括：

解析保单业务信息中的图像数据、以及文本数据；

基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果，所述多模态混合模型为基于多模态输入参数的个数分别配置模态替换对象进行构建，并以混合模态方式确定损失函数完成模型训练得到的；

根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件；

当检测到所述承保启动触发事件，则启动对所述保单业务信息的承保操作。
根据权利要求16所述的计算机设备，其中，所述计算机可读指令被处理器执行时实现所述基于完成训练的多模态混合模型对所述图像数据、所述文本数据进行多模态混合识别处理，得到多模态混合处理结果之前，所述方法还包括：

获取多模态训练样本集，所述多模态训练样本集中包含至少两个单模态训练样本组；

构建多模态混合网络结构，并获取所述多模态混合网络结构中替换至少一个单模态输入参数的模态替换对象，所述单模态输入参数的个数之和小于或等于多模态输入参数个数；

基于所述模态替换对象、所述单模态训练样本组对多模态混合网络结构进行模型训练，得到多模态混合模型，所述多模态混合模型的损失函数为基于混合模态方式确定的。
根据权利要求17所述的计算机设备，其中，所述计算机可读指令被处理器执行时实现所述基于所述模态替换对象、所述单模态训练样本组对多模态混合网络结构进行模型训练，得到多模态混合模型之前，所述方法还包括：

对所述多模态训练样本集进行单模态训练样本组类别个数划分；

根据划分的类别个数之间的比值配置各模态替换对象的替换权重值；

所述获取所述多模态混合网络结构中替换至少一个单模态输入参数的模态替换对象包括：

确定与所述单模态输入参数匹配的至少一个模态替换对象，按照所述替换权重值从所述模态替换对象中筛选唯一匹配所述单模态输入参数的模态替换对象。
根据权利要求18所述的计算机设备，其中，所述计算机可读指令被处理器执行时实现所述对所述多模态训练样本集进行单模态训练样本组类别个数划分之前，所述方法还包括：

按照预设时间间隔、保单业务更新状态对所述多模态训练样本集中单模态训练样本组进行更新，以更新各模态替换对象的替换权重值。
根据权利要求16所述的计算机设备，其中，所述计算机可读指令被处理器执行时实现所述所述标签分类用于表征标记不同保单业务信息所对应的保单产品、时间、主体对象，所述根据所述多模态混合处理结果对所述保单业务信息进行标签分类，并解析标签分类后各标签分类的保单业务需求以及承保启动触发事件包括：

将对所述多模态混合处理结果标记的保单产品标识、时间标识、主体对象标识与所述保单业务需求中的核保需求、状态追踪需求、抽样评估需求进行匹配；

若匹配，则将承保启动触发事件配置于所述保单业务信息执行核保操作、状态追踪操作、抽样评估操作完成后，以执行所述承保启动触发事件的触发操作。
根据权利要求20所述的计算机设备，其中，所述计算机可读指令被处理器执行时实现所述启动对所述保单业务信息的承保操作包括：

调取承保线程，并解析所述保单业务信息中的承保参数，所述承保参数用于标识不同承保时间段、不同承保业务阶段的承保状态；

将所述承保参数引入所述承保线程中的承保操作执行指令中，以使按照所述承保操作执行指令执行承保业务。
根据权利要求16-21任一项所述的计算机设备，其中，所述计算机可读指令被处理器执行时实现所述解析保单业务信息中的图像数据、以及文本数据之后，所述方法还包括：

按照图像清晰度、图像像素配比、图像大小对所述图像数据进行筛选，确定待进行多模态混合识别处理的图像数据；

根据自然语言处理数据库对所述文本数据进行异常词语筛选，确定待进行多模态混合识别处理的文本数据。