发明内容
本发明的目的是为了解决上述问题,设计了一种利用个人著作库与其智能会话的系统。
实现上述目的本发明的技术方案为,进一步,在上述一种利用个人著作库与其智能会话的系统中,所述所述智能会话的系统包括字词整理模块、模型建立模块、模型优化模块、会话请求模块、智能会话模块、会话反馈模块:
字词整理模块,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,将所述个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;
模型建立模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;
模型训练模块,用于将个人词语数据信息集输入至所述初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;
会话请求模块,用于通过语音信息采集装置获取用户的实时语音会话请求,将所述实时语音会话请求进行数据预处理,得到实时会话字词数据;
智能会话模块,用于将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
会话反馈模块,用于获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过所述正向反馈会话数据库对相似会话请求进行会话。
进一步,在上述智能会话的系统中,所述字词整理模块包括作品获取单元、段落整理单元、字词切割单元、语义整理单元:
作品获取单元,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,所述个人作品文字数据集至少包括文章作品集、小说作品集和信件作品集;
段落整理单元,用于获取所述个人作品文字数据集中的文字段落数据,所述文字段落数据至少包括人物对话段落、人物情感描述段落、人物心理描述段落、人物行为描述段落、事物描述段落和其他描述段落;
字词切割单元,用于将所述文字段落数据中的关键词进行字词切割,得到文字语句数据;
语义整理单元,用于对所述文字语句数据进行字词语义整理,得到个人词语数据信息集,所述个人词语数据信息集至少包括对话场景数据集、对话情感数据集、对话行文数据集和对话心理数据集。
进一步,在上述智能会话的系统中,所述模型建立模块包括建立子模块、复制子模块、解码器子模块、解码子模块、剪枝子模块:
建立子模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型;
复制子模块,用于所述SAE个人词库智能会话模型利用全局多跳注意机制从对话场景数据集、对话情感数据集和对话心理数据集中复制词语;
解码器子模块,用于所述SAE个人词库智能会话模型至少包括人物行为解码器、人物情感解码器和人物对话解码器;
解码子模块,用于基于所述人物行为解码器、所述人物情感解码器和所述人物对话解码器对个人词语数据信息集进行解码;
剪枝子模块,用于利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型。
进一步,在上述智能会话的系统中,所述模型训练模块包括编码组成单元、特征提取单元、调整优化单元:
编码组成单元,用于确定所述目标SAE个人词库智能会话模型包含多层编码器和解码器,所述编码器都由多个输入节点和少量隐藏节点组成,
特征提取单元,用于所述编码器中的隐藏节点负责提取所述个人词语数据信息集中的特征;
调整优化单元,用于将所述个人词语数据信息集输入至所述目标SAE个人词库智能会话模型中训练时,利用反向传播算法对训练过程进行调整和优化。
进一步,在上述智能会话的系统中,所述会话请求模块包括滤波子模块、分帧子模块、相乘子模块、变换子模块、转化子模块、计算子模块:
滤波子模块,用于通过语音信息采集装置获取用户的实时语音会话请求,得到实时会话语音数据,通过高斯数字滤波算法对所述实时会话语音数据进行预加重处理,得到滤波会话语音数据;
分帧子模块,用于将滤波会话语音数据进行分段处理,得到分帧会话语音数据,所述分帧会话语音数据的分段时间为10-30ms;
相乘子模块,用于基于汉明窗函数,利用汉明窗函数对所有的分帧会话语音数据依次相乘,得到加窗会话语音数据;
变换子模块,用于利用快速傅里叶变换算法对所述加窗会话语音数据中的时域数据变换为频域数据,得到频域会话语音数据;
转化子模块,用于基于梅尔滤波器组将频域会话语音数据转化为梅尔频率会话语音数据,得到梅尔频率会话语音数据;
计算子模块,用于计算梅尔频率会话语音数据经过梅尔滤波器组后每个频谱的能量频谱,得到声学特征语音数据,基于声学特征语音数据进行字词识别得到实时会话字词数据。
进一步,在上述智能会话的系统中,所述智能会话模块包括会话判断单元、类型确定单元、智能会话单元、会话调用单元、模式改变单元:
会话判断单元,用于将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式;
类型确定单元,用于确定所述会话类型模式至少包括问答型会话请求、任务型会话请求和聊天型会话请求;
智能会话单元,用于根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
会话调用单元,用于若判断为问答型会话请求,则调用所述目标SAE个人词库智能会话模型中的问答会话模块,利用问答回话模块对所述实时会话字词数据进行会话;
模式改变单元,用于若会话中改变会话类型模式,则通过所述目标SAE个人词库智能会话模型改变会话类型模块进行会话。
进一步,在上述智能会话的系统中,所述会话反馈模块包括判断子模块、结果子模块、训练子模块、聚类子模块、会话子模块:
判断子模块,用于获取用户会话反馈信息,对所述用户会话反馈信息进行判断,得到正向会话反馈信息和负向会话反馈信息;
结果子模块,用于所述正向会话反馈信息为用户反馈满意的会话结果,所述负向会话反馈信息为用户反馈不满意的会话结果;
训练子模块,用于将所述正向会话反馈信息和所述负向会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练;
聚类子模块,用于获取历史会话记录中所有的正向会话反馈信息,得到正向会话反馈信息集,通过FCM模糊聚类算法对所述正向会话反馈信息集进行聚类,得到会话内容出现次数最多的正向会话反馈信息;
会话子模块,用于基于会话内容出现次数最多的正向会话反馈信息建立正向反馈会话数据库,通过正向反馈会话数据库对相似会话请求进行会话。
进一步,在上述一种利用个人著作库与其智能会话的系统中,所述智能会话的系统包括以下步骤:
获取个人著作库中的个人作品集,得到个人作品文字数据集,将所述个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;
基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;
将个人词语数据信息集输入至所述初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;
通过语音信息采集装置获取用户的实时语音会话请求,将所述实时语音会话请求进行数据预处理,得到实时会话字词数据;
将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过所述正向反馈会话数据库对相似会话请求进行会话。
进一步,在上述一种利用个人著作库与其智能会话的系统中,所述智能会话的系统包括以下步骤:
基于SAE堆栈自编码网络建立SAE个人词库智能会话模型;
所述SAE个人词库智能会话模型利用全局多跳注意机制从对话场景数据集、对话情感数据集和对话心理数据集中复制词语;
所述SAE个人词库智能会话模型至少包括人物行为解码器、人物情感解码器和人物对话解码器;
基于所述人物行为解码器、所述人物情感解码器和所述人物对话解码器对个人词语数据信息集进行解码;
利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型。
进一步,在上述一种利用个人著作库与其智能会话的系统中,所述智能会话的系统包括以下步骤:
将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式;
所述会话类型模式至少包括问答型会话请求、任务型会话请求和聊天型会话请求;
根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
若判断为问答型会话请求,则调用所述目标SAE个人词库智能会话模型中的问答会话模块,利用问答回话模块对所述实时会话字词数据进行会话;
若会话中改变会话类型模式,则通过所述目标SAE个人词库智能会话模型改变会话类型模块进行会话。
其有益效果在于,通过字词整理模块,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,将所述个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;模型建立模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;模型训练模块,用于将个人词语数据信息集输入至所述初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;会话请求模块,用于通过语音信息采集装置获取用户的实时语音会话请求,将所述实时语音会话请求进行数据预处理,得到实时会话字词数据;智能会话模块,用于将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;会话反馈模块,用于获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过所述正向反馈会话数据库对相似会话请求进行会话。可以提升对作者著作的理解,提高阅读效率,同时还能建立和作者进行交流的渠道,节约作者本身的时间和需要会话沟通的读者时间。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“所述”也可包括复数形式。应所述进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
下面结合附图对本发明进行具体描述,如图1所示,一种利用个人著作库与其智能会话的系统,智能会话的系统包括:
字词整理模块,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,将个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;
具体的,本实施例中包括作品获取单元,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,个人作品文字数据集至少包括文章作品集、小说作品集和信件作品集;段落整理单元,用于获取个人作品文字数据集中的文字段落数据,文字段落数据至少包括人物对话段落、人物情感描述段落、人物心理描述段落、人物行为描述段落、事物描述段落和其他描述段落;字词切割单元,用于将文字段落数据中的关键词进行字词切割,得到文字语句数据;语义整理单元,用于对文字语句数据进行字词语义整理,得到个人词语数据信息集,个人词语数据信息集至少包括对话场景数据集、对话情感数据集、对话行文数据集和对话心理数据集。
模型建立模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;
具体的,本实施例中包括建立子模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型;复制子模块,用于SAE个人词库智能会话模型利用全局多跳注意机制从对话场景数据集、对话情感数据集和对话心理数据集中复制词语;解码器子模块,用于SAE个人词库智能会话模型至少包括人物行为解码器、人物情感解码器和人物对话解码器;解码子模块,用于基于人物行为解码器、人物情感解码器和人物对话解码器对个人词语数据信息集进行解码;剪枝子模块,用于利用MaskACC卷积加速滤波器对SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型。
具体的,本实施例中堆栈自编码网络(Stacked Autoencoder Network, SAE)是一种常用的深度学习模型,具有非常强的特征提取和表达能力。相比于传统的自编码网络,SAE模型中包含多层编码器和解码器,可以自动学习数据中的高阶特征,从而提高模型的准确性和泛化能力。在 SAE模型中,每个编码器都由多个输入节点和少量隐藏节点组成,其中隐藏节点负责提取输入数据的特征。每个编码器的输出都是下一层编码器的输入,并且每个解码器的输入都是对应编码器的输出。在训练过程中,SAE模型使用反向传播算法进行调整和优化,从而实现对每一层参数的更新。在自然语言处理任务中,SAE模型可以通过学习文本中的语义特征,提高词语的表达能力。
模型训练模块,用于将个人词语数据信息集输入至初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;
具体的,本实施例中包括编码组成单元,用于确定目标SAE个人词库智能会话模型包含多层编码器和解码器,编码器都由多个输入节点和少量隐藏节点组成,特征提取单元,用于编码器中的隐藏节点负责提取个人词语数据信息集中的特征;调整优化单元,用于将个人词语数据信息集输入至目标SAE个人词库智能会话模型中训练时,利用反向传播算法对训练过程进行调整和优化。
会话请求模块,用于通过语音信息采集装置获取用户的实时语音会话请求,将实时语音会话请求进行数据预处理,得到实时会话字词数据;
具体的,本实施例中包括滤波子模块,用于通过语音信息采集装置获取用户的实时语音会话请求,得到实时会话语音数据,通过高斯数字滤波算法对实时会话语音数据进行预加重处理,得到滤波会话语音数据;分帧子模块,用于将滤波会话语音数据进行分段处理,得到分帧会话语音数据,分帧会话语音数据的分段时间为10-30ms;相乘子模块,用于基于汉明窗函数,利用汉明窗函数对所有的分帧会话语音数据依次相乘,得到加窗会话语音数据;变换子模块,用于利用快速傅里叶变换算法对加窗会话语音数据中的时域数据变换为频域数据,得到频域会话语音数据;转化子模块,用于基于梅尔滤波器组将频域会话语音数据转化为梅尔频率会话语音数据,得到梅尔频率会话语音数据;计算子模块,用于计算梅尔频率会话语音数据经过梅尔滤波器组后每个频谱的能量频谱,得到声学特征语音数据,基于声学特征语音数据进行字词识别得到实时会话字词数据。
智能会话模块,用于将实时会话字词数据输入至目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用会话类型模块进行会话;
具体的,本实施例中包括会话判断单元,用于将实时会话字词数据输入至目标SAE个人词库智能会话模型中判断会话类型模式;类型确定单元,用于确定会话类型模式至少包括问答型会话请求、任务型会话请求和聊天型会话请求;智能会话单元,用于根据会话请求调用对应的会话类型模块,利用会话类型模块进行会话;会话调用单元,用于若判断为问答型会话请求,则调用目标SAE个人词库智能会话模型中的问答会话模块,利用问答回话模块对实时会话字词数据进行会话;模式改变单元,用于若会话中改变会话类型模式,则通过目标SAE个人词库智能会话模型改变会话类型模块进行会话。
会话反馈模块,用于获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过正向反馈会话数据库对相似会话请求进行会话。
具体的,本实施例中包括判断子模块,用于获取用户会话反馈信息,对用户会话反馈信息进行判断,得到正向会话反馈信息和负向会话反馈信息;结果子模块,用于正向会话反馈信息为用户反馈满意的会话结果,负向会话反馈信息为用户反馈不满意的会话结果;训练子模块,用于将正向会话反馈信息和负向会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练;聚类子模块,用于获取历史会话记录中所有的正向会话反馈信息,得到正向会话反馈信息集,通过FCM模糊聚类算法对正向会话反馈信息集进行聚类,得到会话内容出现次数最多的正向会话反馈信息;会话子模块,用于基于会话内容出现次数最多的正向会话反馈信息建立正向反馈会话数据库,通过正向反馈会话数据库对相似会话请求进行会话。
具体的,本实施例中模糊c-均值聚类算法fuzzyc-means algorithm(FCMA)或称(FCM)通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。
其有益效果在于,通过字词整理模块,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,将个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;模型建立模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;模型训练模块,用于将个人词语数据信息集输入至初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;会话请求模块,用于通过语音信息采集装置获取用户的实时语音会话请求,将实时语音会话请求进行数据预处理,得到实时会话字词数据;智能会话模块,用于将实时会话字词数据输入至目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用会话类型模块进行会话;会话反馈模块,用于获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过正向反馈会话数据库对相似会话请求进行会话。可以提升对作者著作的理解,提高阅读效率,同时还能建立和作者进行交流的渠道,节约作者本身的时间和需要会话沟通的读者时间。
本实施例中,请参阅图2,本发明实施例中一种利用个人著作库与其智能会话的系统的第二个实施例,模型建立模块包括建立子模块、复制子模块、解码器子模块、解码子模块、剪枝子模块:
建立子模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型;
复制子模块,用于SAE个人词库智能会话模型利用全局多跳注意机制从对话场景数据集、对话情感数据集和对话心理数据集中复制词语;
解码器子模块,用于SAE个人词库智能会话模型至少包括人物行为解码器、人物情感解码器和人物对话解码器;
解码子模块,用于基于人物行为解码器、人物情感解码器和人物对话解码器对个人词语数据信息集进行解码;
剪枝子模块,用于利用MaskACC卷积加速滤波器对SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型。
本实施例中,请参阅图3,本发明实施例中一种利用个人著作库与其智能会话的系统的第三个实施例,会话请求模块包括滤波子模块、分帧子模块、相乘子模块、变换子模块、转化子模块、计算子模块:
滤波子模块,用于通过语音信息采集装置获取用户的实时语音会话请求,得到实时会话语音数据,通过高斯数字滤波算法对实时会话语音数据进行预加重处理,得到滤波会话语音数据;
分帧子模块,用于将滤波会话语音数据进行分段处理,得到分帧会话语音数据,分帧会话语音数据的分段时间为10-30ms;
相乘子模块,用于基于汉明窗函数,利用汉明窗函数对所有的分帧会话语音数据依次相乘,得到加窗会话语音数据;
变换子模块,用于利用快速傅里叶变换算法对加窗会话语音数据中的时域数据变换为频域数据,得到频域会话语音数据;
转化子模块,用于基于梅尔滤波器组将频域会话语音数据转化为梅尔频率会话语音数据,得到梅尔频率会话语音数据;
计算子模块,用于计算梅尔频率会话语音数据经过梅尔滤波器组后每个频谱的能量频谱,得到声学特征语音数据,基于声学特征语音数据进行字词识别得到实时会话字词数据。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应所述了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变和改进,这些变和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。