CN117349676B - 基于mq端口和redis数据库的模型训练方法及系统 - Google Patents
基于mq端口和redis数据库的模型训练方法及系统 Download PDFInfo
- Publication number
- CN117349676B CN117349676B CN202311650060.3A CN202311650060A CN117349676B CN 117349676 B CN117349676 B CN 117349676B CN 202311650060 A CN202311650060 A CN 202311650060A CN 117349676 B CN117349676 B CN 117349676B
- Authority
- CN
- China
- Prior art keywords
- result
- data
- prediction
- auditing
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000009825 accumulation Methods 0.000 claims abstract description 35
- 239000011159 matrix material Substances 0.000 claims description 45
- 238000004364 calculation method Methods 0.000 claims description 42
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- LSQZJLSUYDQPKJ-NJBDSQKTSA-N amoxicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=C(O)C=C1 LSQZJLSUYDQPKJ-NJBDSQKTSA-N 0.000 description 2
- 229960003022 amoxicillin Drugs 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- LSQZJLSUYDQPKJ-UHFFFAOYSA-N p-Hydroxyampicillin Natural products O=C1N2C(C(O)=O)C(C)(C)SC2C1NC(=O)C(N)C1=CC=C(O)C=C1 LSQZJLSUYDQPKJ-UHFFFAOYSA-N 0.000 description 2
- 206010061218 Inflammation Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了基于mq端口和redis数据库的模型训练方法及系统,该方法包括以下步骤:将现有医疗数据的数据格式进行统一,并作为训练集;利用训练集对预测模型进行训练;利用预测模型输出预测结果,将预测结果和审核结果存储于数据库并进行对比;若预测结果进行过修改,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中;将积存数据库中的样本作为自训练集输入预测模型,对预测模型重新训练,并将积存数据量重置为零。本发明将预测模型的输出结果进行存储以及发送人工审核,同时利用审核结果以及预测结果的对比,生成新的训练集,并对原预测模型进行重新训练。
Description
技术领域
本发明属于医疗数据处理技术领域,具体涉及基于mq端口和redis数据库的模型训练方法及系统。
背景技术
目前随着大模型技术的发展,越来越多的场景中应用到了大模型技术,但是大模型的特点是参数量巨大,训练耗时很久,在已经训练完毕并部署的任务中,需要考虑到数据积存和模型更新的问题,同时考虑到模型训练耗时的问题,需要在满足模型累加训练和模型训练耗时的两个问题点之间找到平衡,因此,如何在满足模型累加训练和模型训练耗时的两个问题点之间找到平衡是目前需要解决的技术问题。
发明内容
本发明提供的基于mq端口和redis数据库的模型训练方法及系统,能够利用mq端口以及异步消费队列,将预测模型的输出结果进行存储以及发送人工审核,同时利用审核结果以及预测结果的对比,生成新的训练集,并对原预测模型进行重新训练,从而克服上述现有技术中存在的问题。
本发明解决上述技术问题的技术方案如下:
第一方面,本发明提供了基于mq端口和redis数据库的模型训练方法,包括以下步骤:
S1:将现有医疗数据的数据格式进行统一,并作为训练集;
S2:构建预测模型,利用训练集对预测模型进行训练,所述预测模型包括:linear层、多头矩阵计算层以及softmax层;
S3:根据用户输入,利用预测模型输出预测结果,同时利用人工审核得到审核结果,并将预测结果和审核结果存储于redis数据库;
S4:判断审核结果是否进行过修改,若进行过修改,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1;
S5:当积存数据量大于预设数据量阈值时,将积存数据库中的样本作为自训练集输入预测模型,对预测模型重新训练,并将积存数据量重置为零,重复S3-S5。
在一些实施例中,所述S1包括:
S11:采用问题和回答的形式,对现有医疗数据进行格式统一;
S12:将问题作为输入数据,回答作为输出数据,形成训练集。
在一些实施例中,所述S2包括:
S21:在linear层对输入数据进行多维向量转化,具体计算为:
;
其中,表示输入的字符Token的数字id表示,W代表linear层的权重矩阵,T代表进行矩阵转置,b代表linear层的偏置权重矩阵,/>为linear层的输出结果;
S22:将linear层的计算结果输入输入多头矩阵计算层,具体计算为:
;
其中,、/>、/>分别表示不同的权重矩阵,/>、/>、/>分别为不同的偏置矩阵,/>表示多头矩阵计算层的输出;
S23:通过softmax层进行归一化计算:
;
其中,表示softmax层的输出,/>代表/>以自然常数e为底的指数函数,i和j分别代表第i和第j个输入。
在一些实施例中,所述S3包括:
S31:通过mq端口将用户输入发送至redis数据库,通过异步消费队列将用户输入发送至预测模型并返回记录;
S32:预测模型根据用户输入预测用户输出,将预测结果存储于redis数据库,并返回前端进行人工审核;
S33:将人工审核的审核结果返回至redis数据库存储。
在一些实施例中,所述S4中包括:
S41:判断预测结果和审核结果中的中英文词汇单元数量以及中英文词汇内容是否一致;
S42:若不完全一致,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1。
第二方面,本发明提供了基于mq端口和redis数据库的模型训练系统,包括:
数据处理模块,用于将现有医疗数据的数据格式进行统一,并作为训练集;
模型构建模块,用于构建预测模型,利用训练集对预测模型进行训练,所述预测模型包括:linear层、多头矩阵计算层以及softmax层;
预测模块,用于根据用户输入,利用预测模型输出预测结果,同时利用人工审核得到审核结果,并将预测结果和审核结果存储于redis数据库;
样本积存模块,用于判断审核结果是否进行过修改,若进行过修改,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1;
自动训练模块,用于当积存数据量大于预设数据量阈值时,将积存数据库中的样本作为自训练集输入预测模型,对预测模型重新训练,并将积存数据量重置为零,重复预测模块、样本积存模块以及自动训练模块中的步骤。
在一些实施例中,所述数据处理模块包括:
格式统一子模块,用于采用问题和回答的形式,对现有医疗数据进行格式统一;
训练集构建子模块,用于将问题作为输入数据,回答作为输出数据,形成训练集。
在一些实施例中,所述模型构建模块包括:
向量转化子模块,用于在linear层对输入数据进行多维向量转化,具体计算为:
;
其中,表示输入的字符Token的数字id表示,W代表linear层的权重矩阵,T代表进行矩阵转置,b代表linear层的偏置权重矩阵,/>为linear层的输出结果;
多头矩阵计算子模块,用于将linear层的计算结果输入输入多头矩阵计算层,具体计算为:
;
其中,、/>、/>分别表示不同的权重矩阵,/>、/>、/>分别为不同的偏置矩阵,/>表示多头矩阵计算层的输出;
归一化计算子模块,用于通过softmax层进行归一化计算:
;
其中,表示softmax层的输出,/>代表/>以自然常数e为底的指数函数,i和j分别代表第i和第j个输入。
在一些实施例中,所述预测模块包括:
输入子模块,用于通过mq端口将用户输入发送至redis数据库,通过异步消费队列将用户输入发送至预测模型并返回记录;
输出预测子模块,用于预测模型根据用户输入预测用户输出,将预测结果存储于redis数据库,并返回前端进行人工审核;
人工审核子模块,用于将人工审核的审核结果返回至redis数据库存储。
在一些实施例中,所述样本积存模块包括:
结果判断子模块,用于判断预测结果和审核结果中的中英文词汇单元数量以及中英文词汇内容是否一致;
训练集积存子模块,用于在预测结果和审核结果不完全一致的情况下,将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1。
第三方面,本发明提供了一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的计算方法。
第四方面,本发明提供了一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任意一项所述的计算方法。
本申请的有益效果是:
本申请提供的基于mq端口和redis数据库的模型训练方法及系统,能够利用mq端口以及异步消费队列,将预测模型的输出结果进行存储以及发送人工审核,同时利用审核结果以及预测结果的对比,生成新的训练集,并对原预测模型进行重新训练,能够克服上述现有技术中存在的问题。
附图说明
图1为本申请模型训练方法程序框图;
图2为本申请模型训练方法的流程图;
图3为本申请步骤S1的子流程图;
图4为本申请步骤S2的子流程图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。基于所描述的本申请的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
基于mq端口和redis数据库的模型训练方法,结合图1以及图2,包括以下步骤:
S1:将现有医疗数据的数据格式进行统一,并作为训练集;
在一些实施例中,结合图3,即本申请步骤S1的子流程图,所述S1包括:
S11:采用问题和回答的形式,对现有医疗数据进行格式统一;
S12:将问题作为输入数据,回答作为输出数据,形成训练集。
具体的,首先统一输入输出的数据的格式,统一输入为问句的格式,如:阿莫西林的适应症是什么,对应的回答结果为:阿莫西林的适应症为炎症。我们将输入训练的数据统一为这样的问句格式。我们使用这样的数据格式进行人工标注生成原始数据集训练模型。
S2:构建预测模型,利用训练集对预测模型进行训练,所述预测模型包括:linear层、多头矩阵计算层以及softmax层;
在一些实施例中,结合图4即本申请步骤S2的子流程图,所述S2包括:
S21:在linear层对输入数据进行多维向量转化,具体计算为:
;
其中,表示输入的字符Token的数字id表示,W代表linear层的权重矩阵,T代表进行矩阵转置,b代表linear层的偏置权重矩阵,/>为linear层的输出结果;
S22:将linear层的计算结果输入输入多头矩阵计算层,具体计算为:
;
其中,、/>、/>分别表示不同的权重矩阵,/>、/>、/>分别为不同的偏置矩阵,/>表示多头矩阵计算层的输出;
S23:通过softmax层进行归一化计算:
;
其中,表示softmax层的输出,/>代表/>以自然常数e为底的指数函数,i和j分别代表第i和第j个输入。
具体的,本方案的预测模型由linear层、多头矩阵计算层以及softmax层构成,将训练集输入预测模型,并根据上述具体计算过程即可完成预测模型的训练。
S3:根据用户输入,利用预测模型输出预测结果,同时利用人工审核得到审核结果,并将预测结果和审核结果存储于redis数据库
在一些实施例中,结合图4即步骤S3的子流程图,所述S3包括:
S31:通过mq端口将用户输入发送至redis数据库,通过异步消费队列将用户输入发送至预测模型并返回记录;
S32:预测模型根据用户输入预测用户输出,将预测结果存储于redis数据库,并返回前端进行人工审核;
S33:将人工审核的审核结果返回至redis数据库存储。
具体的,用户在客户端发起提问,通过mq端口发送用户输入,并通过redis数据库接收,同时异步发送预测消息给模型,在模型接收到异步消息的同时,返回mq端一个确认收到消息的信息,同时把问题消息发送到算法模型中调用保存好的模型进行预测,模型预测的结果一份存储下来到本地,一份返回到前端用户端进行人工审核,在人工审核完毕后,将审核结果再次通过mq端口发送到redis数据库中。
S4:判断审核结果是否进行过修改,若进行过修改,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1。
在一些实施例中,所述S4中包括:
S41:判断预测结果和审核结果中的中英文词汇单元数量以及中英文词汇内容是否一致;
S42:若不完全一致,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1。
S5:当积存数据量大于预设数据量阈值时,将积存数据库中的样本作为自训练集输入预测模型,对预测模型重新训练,并将积存数据量重置为零,重复S3-S5。
具体的,redis数据库接收后,对返回的人工审核结果和之前存储的模型预测结果进行对比判断,查看是否有不同点,对比判断的逻辑是:
假设模型预测的结果为a,人工审核返回的结果为b,我们进行两步判断:
1)判断a和b中的中英文词汇单元数量是否一致,
2)判读a和b中的中英文词汇内容是否一致;
若1)和2)两个条件同时满足,则模型预测结果和人工审核反馈回来的结果完全一致,没有修改,反之,则模型预测结果和人工审核结果不一致,模型预测结果经过了人工修改,此时,把有修改的数据存储下来作为正例数据,同时保存对应的模型结果作为负例数据,一对正负例数据作为一条样本,同时将积存的样本数据量加1。
此时,对积存的总样本数据量进行判断,当积存样本总数据量大于3000条时,把积存样本总数据量条数重置为0,同时把这些积存的所有样本数据传入到预测模型中在原有预测模型的基础上重新继续训练模型。
本发明第二方面还提供了基于mq端口和redis数据库的模型训练系统,包括:
数据处理模块,用于将现有医疗数据的数据格式进行统一,并作为训练集;
模型构建模块,用于构建预测模型,利用训练集对预测模型进行训练,所述预测模型包括:linear层、多头矩阵计算层以及softmax层;
预测模块,用于根据用户输入,利用预测模型输出预测结果,同时利用人工审核得到审核结果,并将预测结果和审核结果存储于redis数据库;
样本积存模块,用于判断审核结果是否进行过修改,若进行过修改,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1;
自动训练模块,用于当积存数据量大于预设数据量阈值时,将积存数据库中的样本作为自训练集输入预测模型,对预测模型重新训练,并将积存数据量重置为零,重复预测模块、样本积存模块以及自动训练模块中的步骤。
在一些实施例中,所述数据处理模块包括:
格式统一子模块,用于采用问题和回答的形式,对现有医疗数据进行格式统一;
训练集构建子模块,用于将问题作为输入数据,回答作为输出数据,形成训练集。
在一些实施例中,所述模型构建模块包括:
向量转化子模块,用于在linear层对输入数据进行多维向量转化,具体计算为:
;
其中,表示输入的字符Token的数字id表示,W代表linear层的权重矩阵,T代表进行矩阵转置,b代表linear层的偏置权重矩阵,/>为linear层的输出结果;
多头矩阵计算子模块,用于将linear层的计算结果输入输入多头矩阵计算层,具体计算为:
;
其中,、/>、/>分别表示不同的权重矩阵,/>、/>、/>分别为不同的偏置矩阵,/>表示多头矩阵计算层的输出;
归一化计算子模块,用于通过softmax层进行归一化计算:
;
其中,表示softmax层的输出,/>代表/>以自然常数e为底的指数函数,i和j分别代表第i和第j个输入。
在一些实施例中,所述预测模块包括:
输入子模块,用于通过mq端口将用户输入发送至redis数据库,通过异步消费队列将用户输入发送至预测模型并返回记录;
输出预测子模块,用于预测模型根据用户输入预测用户输出,将预测结果存储于redis数据库,并返回前端进行人工审核;
人工审核子模块,用于将人工审核的审核结果返回至redis数据库存储。
在一些实施例中,所述样本积存模块包括:
结果判断子模块,用于判断预测结果和审核结果中的中英文词汇单元数量以及中英文词汇内容是否一致;
训练集积存子模块,用于在预测结果和审核结果不完全一致的情况下,将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1。
本发明第三方面还提供了一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的计算方法。
本发明第四方面还提供了一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述中任意一项所述的计算方法。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
在本公开所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。
本领域的技术人员能够理解,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
虽然结合附图描述了本申请的实施方式,但是本领域技术人员可以在不脱离本申请的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (8)
1.基于mq端口和redis数据库的模型训练方法,其特征在于,包括以下步骤:
S1:将现有医疗数据的数据格式进行统一,并作为训练集;
S2:构建预测模型,利用训练集对预测模型进行训练,所述预测模型包括:linear层、多头矩阵计算层以及softmax层;
S3:根据用户输入,利用预测模型输出预测结果,同时对预测结果进行人工审核得到审核结果,并将预测结果和审核结果存储于redis数据库;
S4:判断审核结果是否进行过修改,若进行过修改,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1;
S5:当积存数据量大于预设数据量阈值时,将积存数据库中的样本作为自训练集输入预测模型,对预测模型重新训练,并将积存数据量重置为零,重复S3-S5;
所述S2包括:
S21:在linear层对输入数据进行多维向量转化,具体计算为:
;
其中,表示输入的字符Token的数字id表示,W代表linear层的权重矩阵,T代表进行矩阵转置,b代表linear层的偏置权重矩阵,/>为linear层的输出结果;
S22:将linear层的计算结果输入多头矩阵计算层,具体计算为:
;
其中,、/>、/>分别表示不同的权重矩阵,/>、/>、/>分别为不同的偏置矩阵,/>表示多头矩阵计算层的输出;
S23:通过softmax层进行归一化计算:
;
其中,表示softmax层的输出,/>代表/>以自然常数e为底的指数函数,i和j分别代表第i和第j个输入。
2.根据权利要求1所述的基于mq端口和redis数据库的模型训练方法,其特征在于,所述S1包括:
S11:采用问题和回答的形式,对现有医疗数据进行格式统一;
S12:将问题作为输入数据,回答作为输出数据,形成训练集。
3.根据权利要求1所述的基于mq端口和redis数据库的模型训练方法,其特征在于,所述S3包括:
S31:通过mq端口将用户输入发送至redis数据库,通过异步消费队列将用户输入发送至预测模型并返回记录;
S32:预测模型根据用户输入预测用户输出,将预测结果存储于redis数据库,并返回前端进行人工审核;
S33:将人工审核的审核结果返回至redis数据库存储。
4.根据权利要求1所述的基于mq端口和redis数据库的模型训练方法,其特征在于,所述S4中包括:
S41:判断预测结果和审核结果中的中英文词汇单元数量以及中英文词汇内容是否一致;
S42:若不完全一致,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1。
5.基于mq端口和redis数据库的模型训练系统,其特征在于,包括:
数据处理模块,用于将现有医疗数据的数据格式进行统一,并作为训练集;
模型构建模块,用于构建预测模型,利用训练集对预测模型进行训练,所述预测模型包括:linear层、多头矩阵计算层以及softmax层;
预测模块,用于根据用户输入,利用预测模型输出预测结果,同时对预测结果进行人工审核得到审核结果,并将预测结果和审核结果存储于redis数据库;
样本积存模块,用于判断审核结果是否进行过修改,若进行过修改,则将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1;
自动训练模块,用于当积存数据量大于预设数据量阈值时,将积存数据库中的样本作为自训练集输入预测模型,对预测模型重新训练,并将积存数据量重置为零,重复预测模块、样本积存模块以及自动训练模块中的步骤;
所述模型构建模块包括:
向量转化子模块,用于在linear层对输入数据进行多维向量转化,具体计算为:
;
其中,表示输入的字符Token的数字id表示,W代表linear层的权重矩阵,T代表进行矩阵转置,b代表linear层的偏置权重矩阵,/>为linear层的输出结果;
多头矩阵计算子模块,用于将linear层的计算结果输入多头矩阵计算层,具体计算为:
;
其中,、/>、/>分别表示不同的权重矩阵,/>、/>、/>分别为不同的偏置矩阵,/>表示多头矩阵计算层的输出;
归一化计算子模块,用于通过softmax层进行归一化计算:
;
其中,表示softmax层的输出,/>代表/>以自然常数e为底的指数函数,i和j分别代表第i和第j个输入。
6.根据权利要求5所述的基于mq端口和redis数据库的模型训练系统,其特征在于,所述数据处理模块包括:
格式统一子模块,用于采用问题和回答的形式,对现有医疗数据进行格式统一;
训练集构建子模块,用于将问题作为输入数据,回答作为输出数据,形成训练集。
7.根据权利要求5所述的基于mq端口和redis数据库的模型训练系统,其特征在于,所述预测模块包括:
输入子模块,用于通过mq端口将用户输入发送至redis数据库,通过异步消费队列将用户输入发送至预测模型并返回记录;
输出预测子模块,用于预测模型根据用户输入预测用户输出,将预测结果存储于redis数据库,并返回前端进行人工审核;
人工审核子模块,用于将人工审核的审核结果返回至redis数据库存储。
8.根据权利要求5所述的基于mq端口和redis数据库的模型训练系统,其特征在于,所述样本积存模块包括:
结果判断子模块,用于判断预测结果和审核结果中的中英文词汇单元数量以及中英文词汇内容是否一致;
训练集积存子模块,用于在预测结果和审核结果不完全一致的情况下,将审核结果作为正例数据,预测结果作为负例数据,并将所述正例数据和对应的负例数据作为一条样本存储于积存数据库中,积存数据量+1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311650060.3A CN117349676B (zh) | 2023-12-05 | 2023-12-05 | 基于mq端口和redis数据库的模型训练方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311650060.3A CN117349676B (zh) | 2023-12-05 | 2023-12-05 | 基于mq端口和redis数据库的模型训练方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117349676A CN117349676A (zh) | 2024-01-05 |
CN117349676B true CN117349676B (zh) | 2024-03-12 |
Family
ID=89359843
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311650060.3A Active CN117349676B (zh) | 2023-12-05 | 2023-12-05 | 基于mq端口和redis数据库的模型训练方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117349676B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197737A (zh) * | 2017-12-29 | 2018-06-22 | 山大地纬软件股份有限公司 | 一种建立医保住院费用预测模型的方法及系统 |
CN109948730A (zh) * | 2019-03-29 | 2019-06-28 | 中诚信征信有限公司 | 一种数据分类方法、装置、电子设备及存储介质 |
CN113434688A (zh) * | 2021-08-23 | 2021-09-24 | 南京擎盾信息科技有限公司 | 用于舆情分类模型训练的数据处理方法和装置 |
CN115688779A (zh) * | 2022-10-11 | 2023-02-03 | 杭州瑞成信息技术股份有限公司 | 一种基于自监督深度学习的地址识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230214671A1 (en) * | 2021-12-31 | 2023-07-06 | Schneider Electric Systems Usa, Inc. | Systems and methods for building a knowledge base for industrial control and design applications |
-
2023
- 2023-12-05 CN CN202311650060.3A patent/CN117349676B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197737A (zh) * | 2017-12-29 | 2018-06-22 | 山大地纬软件股份有限公司 | 一种建立医保住院费用预测模型的方法及系统 |
CN109948730A (zh) * | 2019-03-29 | 2019-06-28 | 中诚信征信有限公司 | 一种数据分类方法、装置、电子设备及存储介质 |
CN113434688A (zh) * | 2021-08-23 | 2021-09-24 | 南京擎盾信息科技有限公司 | 用于舆情分类模型训练的数据处理方法和装置 |
CN115688779A (zh) * | 2022-10-11 | 2023-02-03 | 杭州瑞成信息技术股份有限公司 | 一种基于自监督深度学习的地址识别方法 |
Non-Patent Citations (1)
Title |
---|
张琴 ; 林伟龙 ; 王军辉 ; 杨雅婷 ; 马匡宇 ; 郭强 ; 洪娜.《面向临床决策支持的肿瘤知识图谱构建与应用研究》.《医学信息学杂志》.2021,第1-6页. * |
Also Published As
Publication number | Publication date |
---|---|
CN117349676A (zh) | 2024-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7801837B2 (en) | Network analyzer | |
US20150379429A1 (en) | Interactive interfaces for machine learning model evaluations | |
US11410644B2 (en) | Generating training datasets for a supervised learning topic model from outputs of a discovery topic model | |
CN111125266A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111179055B (zh) | 授信额度调整方法、装置和电子设备 | |
US20190026637A1 (en) | Method and virtual data agent system for providing data insights with artificial intelligence | |
WO2024040817A1 (zh) | 基于大数据的债券风险信息处理方法及相关设备 | |
US11688393B2 (en) | Machine learning to propose actions in response to natural language questions | |
US20140129561A1 (en) | Risk analysis using unstructured data | |
US11521601B2 (en) | Detecting extraneous topic information using artificial intelligence models | |
CN117349676B (zh) | 基于mq端口和redis数据库的模型训练方法及系统 | |
WO2023185125A1 (zh) | 产品资源的数据处理方法及装置、电子设备、存储介质 | |
CN116402166A (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN114723239A (zh) | 一种多方协同建模方法、装置、设备、介质及程序产品 | |
CN114138743A (zh) | 基于机器学习的etl任务自动配置方法及装置 | |
CN111382246B (zh) | 文本的匹配方法、匹配装置、终端及计算机可读存储介质 | |
CN112308294A (zh) | 违约概率预测方法及装置 | |
CN112016004A (zh) | 一种基于多粒度信息融合的职务犯罪筛查系统及方法 | |
CN116934182B (zh) | 一种企业数据协同观测方法、系统及介质 | |
CN112907037A (zh) | 指标数据的智能分析方法、装置、终端设备及存储介质 | |
CN116468531A (zh) | 账户信息处理方法、装置、计算机设备和存储介质 | |
CN117764712A (zh) | 一种用户标签确定方法及装置 | |
CN115186757A (zh) | 自注意力模型的训练方法及装置 | |
CN118114982A (zh) | 一种基于图特征的企业风险传导预测方法、系统及介质 | |
CN113537794A (zh) | 对目标对象的分析方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |