CN117077671A - 一种交互数据生成方法及系统 - Google Patents
一种交互数据生成方法及系统 Download PDFInfo
- Publication number
- CN117077671A CN117077671A CN202311339134.1A CN202311339134A CN117077671A CN 117077671 A CN117077671 A CN 117077671A CN 202311339134 A CN202311339134 A CN 202311339134A CN 117077671 A CN117077671 A CN 117077671A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- parameter
- weight
- interaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 30
- 230000004913 activation Effects 0.000 claims abstract description 13
- 238000010606 normalization Methods 0.000 claims abstract description 13
- 238000013461 design Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 54
- 230000003993 interaction Effects 0.000 claims description 53
- 238000007781 pre-processing Methods 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 claims description 9
- 230000011218 segmentation Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 230000009471 action Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种交互数据生成方法及系统,方法包括数据采集、数据预处理、基于神经网络建立交互模型、模型参数调整和实时交互。本发明属于数据处理技术领域,具体是指一种交互数据生成方法及系统,本方案基于权重归一化加快模型收敛速度,提高模型的稳定性和准确性;基于设计可学习的分段式激活函数和加入衰减网络权值的损失函数提高模型的拟合能力,同时避免过拟合,提高模型的泛化能力,利用基于衰减项的梯度调整参数提高模型性能;采用计算移动概率以达到高效搜索,基于自适应步长和控制调节参数灵活调整参数位置,根据条件判定机制提高搜索精准性。
Description
技术领域
本发明涉及数据处理技术领域,具体是指一种交互数据生成方法及系统。
背景技术
交互数据生成方法是指利用技术手段生成逼真且可用于模型训练或系统测试的人机对话数据。但是一般交互模型存在过拟合,收敛速度慢,无法适应复杂的数据分布从而导致模型性能差的问题;一般参数搜索方法存在搜索范围过大导致搜索速度慢,搜索容易陷入局部最优从而搜索不精准的问题。
发明内容
针对上述情况,为克服现有技术的缺陷,本发明提供了一种交互数据生成方法及系统,针对一般交互模型存在过拟合,收敛速度慢,无法适应复杂的数据分布从而导致模型性能差的问题,本方案基于权重归一化加快模型收敛速度,提高模型的稳定性和准确性;基于设计可学习的分段式激活函数和加入衰减网络权值的损失函数提高模型的拟合能力,同时避免过拟合,提高模型的泛化能力,利用基于衰减项的梯度调整参数提高模型性能;针对一般参数搜索方法存在搜索范围过大导致搜索速度慢,搜索容易陷入局部最优从而搜索不精准的问题,本方案采用计算移动概率以达到高效搜索,基于自适应步长和控制调节参数灵活调整参数位置,根据条件判定机制提高搜索精准性。
本发明采取的技术方案如下:本发明提供的一种交互数据生成方法,该方法包括以下步骤:
步骤S1:数据采集,采集用户对话语句和回复语句;
步骤S2:数据预处理,基于数据清洗、分词和文本向量化对数据预处理;
步骤S3:基于神经网络建立交互模型,利用权重归一化,设计可学习的分段式激活函数和加入衰减网络权值的损失函数,并利用基于衰减项的梯度调整参数,共同构建神经网络,以此建立交互模型;
步骤S4:模型参数调整,将改进的sigmoid函数加入参数更新公式,结合移动概率对参数位置更新,基于条件阈值判断是否达到全局最优;
步骤S5:实时交互。
进一步地,在步骤S1中,将采集的对话语句作为样本数据,回复语句作为对应标签。
进一步地,在步骤S2中,所述数据预处理是将采集的数据进行数据清洗、分词,并基于词袋模型将文本向量化,将文本向量化后的样本数据集及对应标签作为样本集。
进一步地,在步骤S3中,所述基于神经网络构建交互模型具体包括以下步骤:
步骤S31:步骤S31:权重归一化,将权重归一化到区间[-c1,c1],c1的计算公式如下:
;
式中,是归一化数值常数,Gm和Gm+1分别是权重前后的隐藏层大小;
步骤S32:设计可学习的分段式激活函数h(),所用公式如下:
;
式中,x是输入,Sn是分段数,s是分段索引,是第s个正分段的参数化系数,max()是max函数,bs是偏移量,/>是第s个负分段的参数化系数;
步骤S33:计算初始损失函数T,所用公式如下:
;
式中,αT和βT是损失权重系数,i是样本索引,n是样本的数量,b是真实的标签值,c是模型预测的标签值,A是样本x的特征,P()是条件概率;
步骤S34:设计总损失函数,设置衰减网络权值γ,将T1正则化和T2正则化的损失函数加权求和作为总损失函数,T1正则化和T2正则化的损失函数计算公式如下式所示:
;
;
式中,nm是权重参数的数量,J是权重参数;
步骤S35:清零,当返回梯度更新权值时,连接到该节点的权值不再更新,执行清零操作,过程表示如下:
g=dk(Lg);
式中,g是连接节点的权重,d是节点输出的梯度,k是清零操作,Lg是损失函数在节点的梯度;
步骤S36:调整参数,步骤如下:
步骤S361:计算梯度的衰减项,所用公式如下:
;
;
式中,pt和qt是衰减项,t是迭代次数,S是最终的损失函数,λ是可学习参数的集合,是参数的梯度,α1和α2是衰减系数;
步骤S362:更新权重,所用公式如下:
;
式中,k是平滑项,ε是学习率;
步骤S37:交互模型建立,预先设有损失阈值,基于上述构建神经网络,当损失函数低于损失阈值时,交互模型建立完成。
进一步地,在步骤S4中,所述模型参数调整具体包括以下步骤:
步骤S41:初始化,初始化参数搜索空间,初始化参数位置,将参数位置对步骤S3建立的神经网络预测正确率作为适应度值;
步骤S42:计算移动概率,所用公式如下:
;
式中,Pij(t)是参数个体i向参数个体j移动的概率,lj(t)、li(t)和lk(t)分别是个体j、个体i和个体k的适应度值,Ni(t)是个体i的邻域,k是邻域个体的索引;
步骤S43:更新参数位置,预先设有最大迭代次数,所用公式如下:
;
式中,s0是步长,Xi(t+1)是参数更新后的位置,Xi(t)是参数更新前的位置,t是当前迭代次数,ζ是避免为零的极小的正数,Γ是控制更新速率的调节参数;Xj(t)是个体j的位置,tmax是最大迭代次数;
步骤S44:条件判定,预先设有判定阈值,当存在参数个体的适应度值高于判定阈值时,基于当前个体的参数建立交互模型;若达到最大迭代次数,则返回步骤S41重新初始化参数位置进行搜索;否则返回步骤S42继续搜索。
进一步地,在步骤S5中,所述实时交互是将客户的对话语句输入至交互模型中,将模型的输出作为回复语句,以此达到交互数据生成。
本发明提供的一种交互数据生成系统,包括数据采集模块、数据预处理模块、交互模型建立模块、模型参数调整模块和实时交互模块;
所述数据采集模块采集用户对话语句和回复语句,并将数据发送至数据预处理模块;
所述数据预处理模块接收数据采集模块发送的数据,基于数据清洗、分词和文本向量化对数据预处理,并将数据发送至交互模型建立模块;
所述交互模型建立模块接收数据预处理模块发送的数据,利用权重归一化,设计可学习的分段式激活函数和加入衰减网络权值的损失函数,并利用基于衰减项的梯度调整参数,共同构建神经网络,以此建立交互模型,并将数据发送至模型参数调整模块;
所述模型参数调整模块接收交互模型建立模块发送的数据,将改进的sigmoid函数加入参数更新公式,结合移动概率对参数位置更新,基于条件阈值判断是否达到全局最优,并将数据发送至实时交互模块;
所述实时交互模块接收模型参数调整模块发送的数据,将客户的对话语句输入至交互模型中,将模型的输出作为回复语句,以此达到交互数据生成。
采用上述方案本发明取得的有益效果如下:
(1)针对一般交互模型存在过拟合,收敛速度慢,无法适应复杂的数据分布从而导致模型性能差的问题,本方案基于权重归一化加快模型收敛速度,提高模型的稳定性和准确性;基于设计可学习的分段式激活函数和加入衰减网络权值的损失函数提高模型的拟合能力,同时避免过拟合,提高模型的泛化能力,利用基于衰减项的梯度调整参数提高模型性能。
(2)针对一般参数搜索方法存在搜索范围过大导致搜索速度慢,搜索容易陷入局部最优从而搜索不精准的问题,本方案采用计算移动概率以达到高效搜索,基于自适应步长和控制调节参数灵活调整参数位置,根据条件判定机制提高搜索精准性。
附图说明
图1为本发明提供的一种交互数据生成方法的流程示意图;
图2为本发明提供的一种交互数据生成系统的示意图;
图3为步骤S3的流程示意图;
图4为步骤S4的流程示意图。
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
实施例一,参阅图1,本发明提供的一种交互数据生成方法,该方法包括以下步骤:
步骤S1:数据采集,采集用户对话语句和回复语句;
步骤S2:数据预处理,基于数据清洗、分词和文本向量化对数据预处理;
步骤S3:基于神经网络建立交互模型,利用权重归一化,设计可学习的分段式激活函数和加入衰减网络权值的损失函数,并利用基于衰减项的梯度调整参数,共同构建神经网络,以此建立交互模型;
步骤S4:模型参数调整,将改进的sigmoid函数加入参数更新公式,结合移动概率对参数位置更新,基于条件阈值判断是否达到全局最优;
步骤S5:实时交互。
实施例二,参阅图1,该实施例基于上述实施例,在步骤S1中,将采集的对话语句作为样本数据,回复语句作为对应标签。
实施例三,参阅图1,该实施例基于上述实施例,在步骤S2中,所述数据预处理是将采集的数据进行数据清洗、分词,并基于词袋模型将文本向量化,将文本向量化后的样本数据集及对应标签作为样本集。
实施例四,参阅图1和图3,该实施例基于上述实施例,在步骤S3中,基于神经网络构建交互模型具体包括以下步骤:
步骤S31:步骤S31:权重归一化,将权重归一化到区间[-c1,c1],c1的计算公式如下:
;
式中,是归一化数值常数,Gm和Gm+1分别是权重前后的隐藏层大小;
步骤S32:设计可学习的分段式激活函数h(),所用公式如下:
;
式中,x是输入,Sn是分段数,s是分段索引,是第s个正分段的参数化系数,max()是max函数,bs是偏移量,/>是第s个负分段的参数化系数;
步骤S33:计算初始损失函数T,所用公式如下:
;
式中,αT和βT是损失权重系数,i是样本索引,n是样本的数量,b是真实的标签值,c是模型预测的标签值,A是样本x的特征,P()是条件概率;
步骤S34:设计总损失函数,设置衰减网络权值γ,将T1正则化和T2正则化的损失函数加权求和作为总损失函数,T1正则化和T2正则化的损失函数计算公式如下式所示:
;
;
式中,nm是权重参数的数量,J是权重参数;
步骤S35:清零,当返回梯度更新权值时,连接到该节点的权值不再更新,执行清零操作,过程表示如下:
g=dk(Lg);
式中,g是连接节点的权重,d是节点输出的梯度,k是清零操作,Lg是损失函数在节点的梯度;
步骤S36:调整参数,步骤如下:
步骤S361:计算梯度的衰减项,所用公式如下:
;
;
式中,pt和qt是衰减项,t是迭代次数,S是最终的损失函数,λ是可学习参数的集合,是参数的梯度,α1和α2是衰减系数;
步骤S362:更新权重,所用公式如下:
;
式中,k是平滑项,ε是学习率;
步骤S37:交互模型建立,预先设有损失阈值,基于上述构建神经网络,当损失函数低于损失阈值时,交互模型建立完成。
通过执行上述操作,针对一般交互模型存在过拟合,收敛速度慢,无法适应复杂的数据分布从而导致模型性能差的问题,本方案基于权重归一化加快模型收敛速度,提高模型的稳定性和准确性;基于设计可学习的分段式激活函数和加入衰减网络权值的损失函数提高模型的拟合能力,同时避免过拟合,提高模型的泛化能力,利用基于衰减项的梯度调整参数提高模型性能。
实施例五,参阅图1和图4,该实施例基于上述实施例,在步骤S4中,模型参数调整具体包括以下步骤:
步骤S41:初始化,初始化参数搜索空间,初始化参数位置,将参数位置对步骤S3建立的神经网络预测正确率作为适应度值;
步骤S42:计算移动概率,所用公式如下:
;
式中,Pij(t)是参数个体i向参数个体j移动的概率,lj(t)、li(t)和lk(t)分别是个体j、个体i和个体k的适应度值,Ni(t)是个体i的邻域,k是邻域个体的索引;
步骤S43:更新参数位置,预先设有最大迭代次数,所用公式如下:
;
式中,s0是步长,Xi(t+1)是参数更新后的位置,Xi(t)是参数更新前的位置,t是当前迭代次数,ζ是避免为零的极小的正数,Γ是控制更新速率的调节参数;Xj(t)是个体j的位置,tmax是最大迭代次数;
步骤S44:条件判定,预先设有判定阈值,当存在参数个体的适应度值高于判定阈值时,基于当前个体的参数建立交互模型;若达到最大迭代次数,则返回步骤S41重新初始化参数位置进行搜索;否则返回步骤S42继续搜索。
通过执行上述操作,针对一般参数搜索方法存在搜索范围过大导致搜索速度慢,搜索容易陷入局部最优从而搜索不精准的问题,本方案采用计算移动概率以达到高效搜索,基于自适应步长和控制调节参数灵活调整参数位置,根据条件判定机制提高搜索精准性。
实施例六,参阅图1,该实施例基于上述实施例,在步骤S5中,实时交互是将客户的对话语句输入至交互模型中,将模型的输出作为回复语句,以此达到交互数据生成。
实施例七,参阅图2,该实施例基于上述实施例,本发明提供的一种交互数据生成系统,包括数据采集模块、数据预处理模块、交互模型建立模块、模型参数调整模块和实时交互模块;
所述数据采集模块采集用户对话语句和回复语句,并将数据发送至数据预处理模块;
所述数据预处理模块接收数据采集模块发送的数据,基于数据清洗、分词和文本向量化对数据预处理,并将数据发送至交互模型建立模块;
所述交互模型建立模块接收数据预处理模块发送的数据,利用权重归一化,设计可学习的分段式激活函数和加入衰减网络权值的损失函数,并利用基于衰减项的梯度调整参数,共同构建神经网络,以此建立交互模型,并将数据发送至模型参数调整模块;
所述模型参数调整模块接收交互模型建立模块发送的数据,将改进的sigmoid函数加入参数更新公式,结合移动概率对参数位置更新,基于条件阈值判断是否达到全局最优,并将数据发送至实时交互模块;
所述实时交互模块接收模型参数调整模块发送的数据,将客户的对话语句输入至交互模型中,将模型的输出作为回复语句,以此达到交互数据生成。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
以上对本发明及其实施方式进行了描述,这种描述没有限制性,附图中所示的也只是本发明的实施方式之一,实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示,在不脱离本发明创造宗旨的情况下,不经创造性的设计出与该技术方案相似的结构方式及实施例,均应属于本发明的保护范围。
Claims (6)
1.一种交互数据生成方法,其特征在于:该方法包括以下步骤:
步骤S1:数据采集,采集用户对话语句和回复语句;
步骤S2:数据预处理,基于数据清洗、分词和文本向量化对数据预处理;
步骤S3:基于神经网络建立交互模型,利用权重归一化,设计可学习的分段式激活函数和加入衰减网络权值的损失函数,并利用基于衰减项的梯度调整参数,共同构建神经网络,以此建立交互模型;
步骤S4:模型参数调整,将改进的sigmoid函数加入参数更新公式,结合移动概率对参数位置更新,基于条件阈值判断是否达到全局最优;
步骤S5:实时交互。
2.根据权利要求1所述的一种交互数据生成方法,其特征在于:在步骤S3中,所述基于神经网络构建交互模型具体包括以下步骤:
步骤S31:权重归一化,将权重归一化到区间[-c1,c1],c1的计算公式如下:
;
式中,是归一化数值常数,Gm和Gm+1分别是权重前后的隐藏层大小;
步骤S32:设计可学习的分段式激活函数h(),所用公式如下:
;
式中,x是输入,Sn是分段数,s是分段索引,是第s个正分段的参数化系数,max()是max函数,bs是偏移量,/>是第s个负分段的参数化系数;
步骤S33:计算初始损失函数T,所用公式如下:
;
式中,αT和βT是损失权重系数,i是样本索引,n是样本的数量,b是真实的标签值,c是模型预测的标签值,A是样本x的特征,P()是条件概率;
步骤S34:设计总损失函数,设置衰减网络权值γ,将T1正则化和T2正则化的损失函数加权求和作为总损失函数,T1正则化和T2正则化的损失函数计算公式如下式所示:
;
;
式中,nm是权重参数的数量,J是权重参数;
步骤S35:清零,当返回梯度更新权值时,连接到该节点的权值不再更新,执行清零操作,过程表示如下:
g=dk(Lg);
式中,g是连接节点的权重,d是节点输出的梯度,k是清零操作,Lg是损失函数在节点的梯度;
步骤S36:调整参数,步骤如下:
步骤S361:计算梯度的衰减项,所用公式如下:
;
;
式中,pt和qt是衰减项,t是迭代次数,S是最终的损失函数,λ是可学习参数的集合,是参数的梯度,α1和α2是衰减系数;
步骤S362:更新权重,所用公式如下:
;
式中,k是平滑项,ε是学习率;
步骤S37:交互模型建立,预先设有损失阈值,基于上述构建神经网络,当损失函数低于损失阈值时,交互模型建立完成。
3.根据权利要求1所述的一种交互数据生成方法,其特征在于:在步骤S4中,所述模型参数调整具体包括以下步骤:
步骤S41:初始化,初始化参数搜索空间,初始化参数位置,将参数位置对步骤S3建立的神经网络预测正确率作为适应度值;
步骤S42:计算移动概率,所用公式如下:
;
式中,Pij(t)是参数个体i向参数个体j移动的概率,lj(t)、li(t)和lk(t)分别是个体j、个体i和个体k的适应度值,Ni(t)是个体i的邻域,k是邻域个体的索引;
步骤S43:更新参数位置,预先设有最大迭代次数,所用公式如下:
;
式中,s0是步长,Xi(t+1)是参数更新后的位置,Xi(t)是参数更新前的位置,t是当前迭代次数,ζ是避免为零的极小的正数,Γ是控制更新速率的调节参数;Xj(t)是个体j的位置,tmax是最大迭代次数;
步骤S44:条件判定,预先设有判定阈值,当存在参数个体的适应度值高于判定阈值时,基于当前个体的参数建立交互模型;若达到最大迭代次数,则返回步骤S41重新初始化参数位置进行搜索;否则返回步骤S42继续搜索。
4.根据权利要求1所述的一种交互数据生成方法,其特征在于:在步骤S2中,所述数据预处理是将采集的数据进行数据清洗、分词,并基于词袋模型将文本向量化,将文本向量化后的样本数据集及对应标签作为样本集。
5.根据权利要求1所述的一种交互数据生成方法,其特征在于:在步骤S1中,将采集的对话语句作为样本数据,回复语句作为对应标签;
在步骤S5中,所述实时交互是将客户的对话语句输入至交互模型中,将模型的输出作为回复语句,以此达到交互数据生成。
6.一种交互数据生成系统,用于实现如权利要求1-5中任一项所述的一种交互数据生成方法,其特征在于:包括数据采集模块、数据预处理模块、交互模型建立模块、模型参数调整模块和实时交互模块;
所述数据采集模块采集用户对话语句和回复语句,并将数据发送至数据预处理模块;
所述数据预处理模块接收数据采集模块发送的数据,基于数据清洗、分词和文本向量化对数据预处理,并将数据发送至交互模型建立模块;
所述交互模型建立模块接收数据预处理模块发送的数据,利用权重归一化,设计可学习的分段式激活函数和加入衰减网络权值的损失函数,并利用基于衰减项的梯度调整参数,共同构建神经网络,以此建立交互模型,并将数据发送至模型参数调整模块;
所述模型参数调整模块接收交互模型建立模块发送的数据,将改进的sigmoid函数加入参数更新公式,结合移动概率对参数位置更新,基于条件阈值判断是否达到全局最优,并将数据发送至实时交互模块;
所述实时交互模块接收模型参数调整模块发送的数据,将客户的对话语句输入至交互模型中,将模型的输出作为回复语句,以此达到交互数据生成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311339134.1A CN117077671B (zh) | 2023-10-17 | 2023-10-17 | 一种交互数据生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311339134.1A CN117077671B (zh) | 2023-10-17 | 2023-10-17 | 一种交互数据生成方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117077671A true CN117077671A (zh) | 2023-11-17 |
CN117077671B CN117077671B (zh) | 2024-01-05 |
Family
ID=88717662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311339134.1A Active CN117077671B (zh) | 2023-10-17 | 2023-10-17 | 一种交互数据生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117077671B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117594192A (zh) * | 2024-01-15 | 2024-02-23 | 广东工业大学 | 一种与运动处方相结合的户外健身设备服务系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107195299A (zh) * | 2016-03-14 | 2017-09-22 | 株式会社东芝 | 训练神经网络声学模型的方法和装置及语音识别方法和装置 |
CN109002942A (zh) * | 2018-09-28 | 2018-12-14 | 河南理工大学 | 一种基于随机神经网络的短期负荷预测方法 |
US20200226460A1 (en) * | 2019-01-14 | 2020-07-16 | Capital One Services, Llc | Neural embeddings of transaction data |
CN111753761A (zh) * | 2020-06-28 | 2020-10-09 | 北京百度网讯科技有限公司 | 模型生成方法、装置、电子设备及存储介质 |
-
2023
- 2023-10-17 CN CN202311339134.1A patent/CN117077671B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107195299A (zh) * | 2016-03-14 | 2017-09-22 | 株式会社东芝 | 训练神经网络声学模型的方法和装置及语音识别方法和装置 |
CN109002942A (zh) * | 2018-09-28 | 2018-12-14 | 河南理工大学 | 一种基于随机神经网络的短期负荷预测方法 |
US20200226460A1 (en) * | 2019-01-14 | 2020-07-16 | Capital One Services, Llc | Neural embeddings of transaction data |
CN111753761A (zh) * | 2020-06-28 | 2020-10-09 | 北京百度网讯科技有限公司 | 模型生成方法、装置、电子设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117594192A (zh) * | 2024-01-15 | 2024-02-23 | 广东工业大学 | 一种与运动处方相结合的户外健身设备服务系统 |
CN117594192B (zh) * | 2024-01-15 | 2024-04-30 | 广东工业大学 | 一种与运动处方相结合的户外健身设备服务系统 |
Also Published As
Publication number | Publication date |
---|---|
CN117077671B (zh) | 2024-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022121289A1 (en) | Methods and systems for mining minority-class data samples for training neural network | |
CN113326731B (zh) | 一种基于动量网络指导的跨域行人重识别方法 | |
Angelov et al. | A new type of simplified fuzzy rule-based system | |
CN113905391B (zh) | 集成学习网络流量预测方法、系统、设备、终端、介质 | |
CN110674323B (zh) | 基于虚拟标签回归的无监督跨模态哈希检索方法及系统 | |
CN110046252B (zh) | 一种基于注意力机制神经网络与知识图谱的医疗文本分级方法 | |
CN117077671B (zh) | 一种交互数据生成方法及系统 | |
CN114841257B (zh) | 一种基于自监督对比约束下的小样本目标检测方法 | |
US20200285940A1 (en) | Machine learning systems with memory based parameter adaptation for learning fast and slower | |
CN114564596A (zh) | 一种基于图注意力机制的跨语言知识图谱链接预测方法 | |
CN116992779B (zh) | 基于数字孪生模型的光伏储能系统仿真方法及系统 | |
CN112765461A (zh) | 一种基于多兴趣胶囊网络的会话推荐方法 | |
CN112766603A (zh) | 一种交通流量预测方法、系统、计算机设备及存储介质 | |
CN111353534B (zh) | 一种基于自适应分数阶梯度的图数据类别预测方法 | |
CN112215412A (zh) | 溶解氧预测方法及装置 | |
CN115905855A (zh) | 一种改进的元学习算法MG-Reptile | |
CN111144443A (zh) | 一种基于智能优化算法改进超限学习机解决分类问题的方法 | |
CN110569985A (zh) | 基于在线和离线决策集成学习的在线异构迁移学习的方法 | |
CN113627240A (zh) | 一种基于改进ssd学习模型的无人机树木种类识别方法 | |
CN117408735A (zh) | 一种基于物联网的客户管理方法及系统 | |
CN115630566B (zh) | 一种基于深度学习和动力约束的资料同化方法和系统 | |
CN116415177A (zh) | 一种基于极限学习机的分类器参数辨识方法 | |
CN116821436A (zh) | 一种面向模糊查询的字符串谓词准确选择估计方法 | |
Wu et al. | High-accuracy handwriting recognition based on improved CNN algorithm | |
CN115242428B (zh) | 一种基于优化cw-rnn的网络安全态势预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |