CN117349676B

CN117349676B - 基于mq端口和redis数据库的模型训练方法及系统

Info

Publication number: CN117349676B
Application number: CN202311650060.3A
Authority: CN
Inventors: 刘硕; 杨雅婷; 白焜太; 宋佳祥; 许娟; 史文钊
Original assignee: Digital Health China Technologies Co Ltd
Current assignee: Digital Health China Technologies Co Ltd
Priority date: 2023-12-05
Filing date: 2023-12-05
Publication date: 2024-03-12
Anticipated expiration: 2043-12-05
Also published as: CN117349676A

Abstract

本发明提供了基于mq端口和redis数据库的模型训练方法及系统，该方法包括以下步骤：将现有医疗数据的数据格式进行统一，并作为训练集；利用训练集对预测模型进行训练；利用预测模型输出预测结果，将预测结果和审核结果存储于数据库并进行对比；若预测结果进行过修改，则将审核结果作为正例数据，预测结果作为负例数据，并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中；将积存数据库中的样本作为自训练集输入预测模型，对预测模型重新训练，并将积存数据量重置为零。本发明将预测模型的输出结果进行存储以及发送人工审核，同时利用审核结果以及预测结果的对比，生成新的训练集，并对原预测模型进行重新训练。

Description

基于mq端口和redis数据库的模型训练方法及系统

技术领域

本发明属于医疗数据处理技术领域，具体涉及基于mq端口和redis数据库的模型训练方法及系统。

背景技术

目前随着大模型技术的发展，越来越多的场景中应用到了大模型技术，但是大模型的特点是参数量巨大，训练耗时很久，在已经训练完毕并部署的任务中，需要考虑到数据积存和模型更新的问题，同时考虑到模型训练耗时的问题，需要在满足模型累加训练和模型训练耗时的两个问题点之间找到平衡，因此，如何在满足模型累加训练和模型训练耗时的两个问题点之间找到平衡是目前需要解决的技术问题。

发明内容

本发明提供的基于mq端口和redis数据库的模型训练方法及系统，能够利用mq端口以及异步消费队列，将预测模型的输出结果进行存储以及发送人工审核，同时利用审核结果以及预测结果的对比，生成新的训练集，并对原预测模型进行重新训练，从而克服上述现有技术中存在的问题。

本发明解决上述技术问题的技术方案如下：

第一方面，本发明提供了基于mq端口和redis数据库的模型训练方法，包括以下步骤：

S1：将现有医疗数据的数据格式进行统一，并作为训练集；

S2：构建预测模型，利用训练集对预测模型进行训练，所述预测模型包括：linear层、多头矩阵计算层以及softmax层；

S3：根据用户输入，利用预测模型输出预测结果，同时利用人工审核得到审核结果，并将预测结果和审核结果存储于redis数据库；

S4：判断审核结果是否进行过修改，若进行过修改，则将审核结果作为正例数据，预测结果作为负例数据，并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中，积存数据量+1；

S5：当积存数据量大于预设数据量阈值时，将积存数据库中的样本作为自训练集输入预测模型，对预测模型重新训练，并将积存数据量重置为零，重复S3-S5。

在一些实施例中，所述S1包括：

S11：采用问题和回答的形式，对现有医疗数据进行格式统一；

S12：将问题作为输入数据，回答作为输出数据，形成训练集。

在一些实施例中，所述S2包括：

S21：在linear层对输入数据进行多维向量转化，具体计算为：

；

其中，表示输入的字符Token的数字id表示，W代表linear层的权重矩阵，T代表进行矩阵转置，b代表linear层的偏置权重矩阵，/>为linear层的输出结果；

S22：将linear层的计算结果输入输入多头矩阵计算层，具体计算为：

；

其中，、/>、/>分别表示不同的权重矩阵，/>、/>、/>分别为不同的偏置矩阵，/>表示多头矩阵计算层的输出；

S23：通过softmax层进行归一化计算：

；

其中，表示softmax层的输出，/>代表/>以自然常数e为底的指数函数，i和j分别代表第i和第j个输入。

在一些实施例中，所述S3包括：

S31：通过mq端口将用户输入发送至redis数据库，通过异步消费队列将用户输入发送至预测模型并返回记录；

S32：预测模型根据用户输入预测用户输出，将预测结果存储于redis数据库，并返回前端进行人工审核；

S33：将人工审核的审核结果返回至redis数据库存储。

在一些实施例中，所述S4中包括：

S41：判断预测结果和审核结果中的中英文词汇单元数量以及中英文词汇内容是否一致；

S42：若不完全一致，则将审核结果作为正例数据，预测结果作为负例数据，并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中，积存数据量+1。

第二方面，本发明提供了基于mq端口和redis数据库的模型训练系统，包括：

数据处理模块，用于将现有医疗数据的数据格式进行统一，并作为训练集；

模型构建模块，用于构建预测模型，利用训练集对预测模型进行训练，所述预测模型包括：linear层、多头矩阵计算层以及softmax层；

预测模块，用于根据用户输入，利用预测模型输出预测结果，同时利用人工审核得到审核结果，并将预测结果和审核结果存储于redis数据库；

样本积存模块，用于判断审核结果是否进行过修改，若进行过修改，则将审核结果作为正例数据，预测结果作为负例数据，并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中，积存数据量+1；

自动训练模块，用于当积存数据量大于预设数据量阈值时，将积存数据库中的样本作为自训练集输入预测模型，对预测模型重新训练，并将积存数据量重置为零，重复预测模块、样本积存模块以及自动训练模块中的步骤。

在一些实施例中，所述数据处理模块包括：

格式统一子模块，用于采用问题和回答的形式，对现有医疗数据进行格式统一；

训练集构建子模块，用于将问题作为输入数据，回答作为输出数据，形成训练集。

在一些实施例中，所述模型构建模块包括：

向量转化子模块，用于在linear层对输入数据进行多维向量转化，具体计算为：

；

多头矩阵计算子模块，用于将linear层的计算结果输入输入多头矩阵计算层，具体计算为：

；

归一化计算子模块，用于通过softmax层进行归一化计算：

；

在一些实施例中，所述预测模块包括：

输入子模块，用于通过mq端口将用户输入发送至redis数据库，通过异步消费队列将用户输入发送至预测模型并返回记录；

输出预测子模块，用于预测模型根据用户输入预测用户输出，将预测结果存储于redis数据库，并返回前端进行人工审核；

人工审核子模块，用于将人工审核的审核结果返回至redis数据库存储。

在一些实施例中，所述样本积存模块包括：

结果判断子模块，用于判断预测结果和审核结果中的中英文词汇单元数量以及中英文词汇内容是否一致；

训练集积存子模块，用于在预测结果和审核结果不完全一致的情况下，将审核结果作为正例数据，预测结果作为负例数据，并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中，积存数据量+1。

第三方面，本发明提供了一种计算机，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述任意一项所述的计算方法。

第四方面，本发明提供了一种可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述任意一项所述的计算方法。

本申请的有益效果是：

本申请提供的基于mq端口和redis数据库的模型训练方法及系统，能够利用mq端口以及异步消费队列，将预测模型的输出结果进行存储以及发送人工审核，同时利用审核结果以及预测结果的对比，生成新的训练集，并对原预测模型进行重新训练，能够克服上述现有技术中存在的问题。

附图说明

图1为本申请模型训练方法程序框图；

图2为本申请模型训练方法的流程图；

图3为本申请步骤S1的子流程图；

图4为本申请步骤S2的子流程图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，所描述的实施例是本申请的一部分实施例，而不是全部的实施例。此处所描述的具体实施例仅仅用于解释本申请，而非对本申请的限定。基于所描述的本申请的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

基于mq端口和redis数据库的模型训练方法，结合图1以及图2，包括以下步骤：

S1：将现有医疗数据的数据格式进行统一，并作为训练集；

在一些实施例中，结合图3，即本申请步骤S1的子流程图，所述S1包括：

具体的，首先统一输入输出的数据的格式，统一输入为问句的格式，如：阿莫西林的适应症是什么，对应的回答结果为：阿莫西林的适应症为炎症。我们将输入训练的数据统一为这样的问句格式。我们使用这样的数据格式进行人工标注生成原始数据集训练模型。

在一些实施例中，结合图4即本申请步骤S2的子流程图，所述S2包括：

S21：在linear层对输入数据进行多维向量转化，具体计算为：

；

S23：通过softmax层进行归一化计算：

；

具体的，本方案的预测模型由linear层、多头矩阵计算层以及softmax层构成，将训练集输入预测模型，并根据上述具体计算过程即可完成预测模型的训练。

S3：根据用户输入，利用预测模型输出预测结果，同时利用人工审核得到审核结果，并将预测结果和审核结果存储于redis数据库

在一些实施例中，结合图4即步骤S3的子流程图，所述S3包括：

S33：将人工审核的审核结果返回至redis数据库存储。

具体的，用户在客户端发起提问，通过mq端口发送用户输入，并通过redis数据库接收，同时异步发送预测消息给模型，在模型接收到异步消息的同时，返回mq端一个确认收到消息的信息，同时把问题消息发送到算法模型中调用保存好的模型进行预测，模型预测的结果一份存储下来到本地，一份返回到前端用户端进行人工审核，在人工审核完毕后，将审核结果再次通过mq端口发送到redis数据库中。

S4：判断审核结果是否进行过修改，若进行过修改，则将审核结果作为正例数据，预测结果作为负例数据，并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中，积存数据量+1。

在一些实施例中，所述S4中包括：

具体的，redis数据库接收后，对返回的人工审核结果和之前存储的模型预测结果进行对比判断，查看是否有不同点，对比判断的逻辑是：

假设模型预测的结果为a，人工审核返回的结果为b，我们进行两步判断：

1）判断a和b中的中英文词汇单元数量是否一致，

2）判读a和b中的中英文词汇内容是否一致；

若1）和2）两个条件同时满足，则模型预测结果和人工审核反馈回来的结果完全一致，没有修改，反之，则模型预测结果和人工审核结果不一致，模型预测结果经过了人工修改，此时，把有修改的数据存储下来作为正例数据，同时保存对应的模型结果作为负例数据，一对正负例数据作为一条样本，同时将积存的样本数据量加1。

此时，对积存的总样本数据量进行判断，当积存样本总数据量大于3000条时，把积存样本总数据量条数重置为0，同时把这些积存的所有样本数据传入到预测模型中在原有预测模型的基础上重新继续训练模型。

本发明第二方面还提供了基于mq端口和redis数据库的模型训练系统，包括：

在一些实施例中，所述数据处理模块包括：

在一些实施例中，所述模型构建模块包括：

；

归一化计算子模块，用于通过softmax层进行归一化计算：

；

在一些实施例中，所述预测模块包括：

在一些实施例中，所述样本积存模块包括：

本发明第三方面还提供了一种计算机，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述任意一项所述的计算方法。

本发明第四方面还提供了一种可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如上述中任意一项所述的计算方法。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本公开的范围。

在本公开所提供的实施例中，应该理解到，所揭露的装置/计算机设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/计算机设备实施例仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本公开实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，计算机程序可以存储在计算机可读存储介质中，该计算机程序在被处理器执行时，可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random Access Memory，RAM）、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如，在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。

本领域的技术人员能够理解，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

虽然结合附图描述了本申请的实施方式，但是本领域技术人员可以在不脱离本申请的精神和范围的情况下做出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.基于mq端口和redis数据库的模型训练方法，其特征在于，包括以下步骤：

S1：将现有医疗数据的数据格式进行统一，并作为训练集；

S3：根据用户输入，利用预测模型输出预测结果，同时对预测结果进行人工审核得到审核结果，并将预测结果和审核结果存储于redis数据库；

S5：当积存数据量大于预设数据量阈值时，将积存数据库中的样本作为自训练集输入预测模型，对预测模型重新训练，并将积存数据量重置为零，重复S3-S5；

所述S2包括：

S21：在linear层对输入数据进行多维向量转化，具体计算为：

；

S22：将linear层的计算结果输入多头矩阵计算层，具体计算为：

；

S23：通过softmax层进行归一化计算：

；

2.根据权利要求1所述的基于mq端口和redis数据库的模型训练方法，其特征在于，所述S1包括：

3.根据权利要求1所述的基于mq端口和redis数据库的模型训练方法，其特征在于，所述S3包括：

S33：将人工审核的审核结果返回至redis数据库存储。

4.根据权利要求1所述的基于mq端口和redis数据库的模型训练方法，其特征在于，所述S4中包括：

5.基于mq端口和redis数据库的模型训练系统，其特征在于，包括：

预测模块，用于根据用户输入，利用预测模型输出预测结果，同时对预测结果进行人工审核得到审核结果，并将预测结果和审核结果存储于redis数据库；

自动训练模块，用于当积存数据量大于预设数据量阈值时，将积存数据库中的样本作为自训练集输入预测模型，对预测模型重新训练，并将积存数据量重置为零，重复预测模块、样本积存模块以及自动训练模块中的步骤；

所述模型构建模块包括：

；

多头矩阵计算子模块，用于将linear层的计算结果输入多头矩阵计算层，具体计算为：

；

归一化计算子模块，用于通过softmax层进行归一化计算：

；

6.根据权利要求5所述的基于mq端口和redis数据库的模型训练系统，其特征在于，所述数据处理模块包括：

7.根据权利要求5所述的基于mq端口和redis数据库的模型训练系统，其特征在于，所述预测模块包括：

8.根据权利要求5所述的基于mq端口和redis数据库的模型训练系统，其特征在于，所述样本积存模块包括：