CN117034953B - 一种利用个人著作库与其智能会话的系统 - Google Patents

一种利用个人著作库与其智能会话的系统 Download PDF

Info

Publication number
CN117034953B
CN117034953B CN202311278196.6A CN202311278196A CN117034953B CN 117034953 B CN117034953 B CN 117034953B CN 202311278196 A CN202311278196 A CN 202311278196A CN 117034953 B CN117034953 B CN 117034953B
Authority
CN
China
Prior art keywords
session
conversation
personal
module
intelligent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311278196.6A
Other languages
English (en)
Other versions
CN117034953A (zh
Inventor
李颖悟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Yingwu Digital Technology Co ltd
Original Assignee
Hunan Dongliang Shuzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Dongliang Shuzhi Technology Co ltd filed Critical Hunan Dongliang Shuzhi Technology Co ltd
Priority to CN202311278196.6A priority Critical patent/CN117034953B/zh
Publication of CN117034953A publication Critical patent/CN117034953A/zh
Application granted granted Critical
Publication of CN117034953B publication Critical patent/CN117034953B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及人工智能领域,特别是一种利用个人著作库与其智能会话的系统。通过获取个人著作库中的个人作品集,得到个人作品文字数据集,将个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;基于SAE堆栈自编码网络建立目标SAE个人词库智能会话模型;通过语音信息采集装置获取用户的实时语音会话请求,将实时语音会话请求进行数据预处理,得到实时会话字词数据;将实时会话字词数据输入至目标SAE个人词库智能会话模型中判断会话类型模式,利用会话类型模块进行会话;建立正向反馈会话信息数据库,通过正向反馈会话数据库对相似会话请求进行会话。可以提升对作者著作的理解,提高阅读效率。

Description

一种利用个人著作库与其智能会话的系统
技术领域
本发明涉及人工智能领域,特别是一种利用个人著作库与其智能会话的系统。
背景技术
随着人工智能技术兴起,很多行业都开始应用智能对话系统。个人著作集会伴随着作者本身的思想、情感、对话方式、对话场景等信息,而随着人工智能化的今天,越来越多的需求被挖掘,和文章作者进行交谈并和其进行精神层面的交流,而且还能获取作者著作中的文章内容,可以有效提升阅读效率,但是作者不可能和每个人都进行交流,因此如何利用人工智能对作者的书籍著作进行分析,从而和人进行智能对话是现阶段丞待解决的技术问题。
发明内容
本发明的目的是为了解决上述问题,设计了一种利用个人著作库与其智能会话的系统。
实现上述目的本发明的技术方案为,进一步,在上述一种利用个人著作库与其智能会话的系统中,所述所述智能会话的系统包括字词整理模块、模型建立模块、模型优化模块、会话请求模块、智能会话模块、会话反馈模块:
字词整理模块,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,将所述个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;
模型建立模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;
模型训练模块,用于将个人词语数据信息集输入至所述初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;
会话请求模块,用于通过语音信息采集装置获取用户的实时语音会话请求,将所述实时语音会话请求进行数据预处理,得到实时会话字词数据;
智能会话模块,用于将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
会话反馈模块,用于获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过所述正向反馈会话数据库对相似会话请求进行会话。
进一步,在上述智能会话的系统中,所述字词整理模块包括作品获取单元、段落整理单元、字词切割单元、语义整理单元:
作品获取单元,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,所述个人作品文字数据集至少包括文章作品集、小说作品集和信件作品集;
段落整理单元,用于获取所述个人作品文字数据集中的文字段落数据,所述文字段落数据至少包括人物对话段落、人物情感描述段落、人物心理描述段落、人物行为描述段落、事物描述段落和其他描述段落;
字词切割单元,用于将所述文字段落数据中的关键词进行字词切割,得到文字语句数据;
语义整理单元,用于对所述文字语句数据进行字词语义整理,得到个人词语数据信息集,所述个人词语数据信息集至少包括对话场景数据集、对话情感数据集、对话行文数据集和对话心理数据集。
进一步,在上述智能会话的系统中,所述模型建立模块包括建立子模块、复制子模块、解码器子模块、解码子模块、剪枝子模块:
建立子模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型;
复制子模块,用于所述SAE个人词库智能会话模型利用全局多跳注意机制从对话场景数据集、对话情感数据集和对话心理数据集中复制词语;
解码器子模块,用于所述SAE个人词库智能会话模型至少包括人物行为解码器、人物情感解码器和人物对话解码器;
解码子模块,用于基于所述人物行为解码器、所述人物情感解码器和所述人物对话解码器对个人词语数据信息集进行解码;
剪枝子模块,用于利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型。
进一步,在上述智能会话的系统中,所述模型训练模块包括编码组成单元、特征提取单元、调整优化单元:
编码组成单元,用于确定所述目标SAE个人词库智能会话模型包含多层编码器和解码器,所述编码器都由多个输入节点和少量隐藏节点组成,
特征提取单元,用于所述编码器中的隐藏节点负责提取所述个人词语数据信息集中的特征;
调整优化单元,用于将所述个人词语数据信息集输入至所述目标SAE个人词库智能会话模型中训练时,利用反向传播算法对训练过程进行调整和优化。
进一步,在上述智能会话的系统中,所述会话请求模块包括滤波子模块、分帧子模块、相乘子模块、变换子模块、转化子模块、计算子模块:
滤波子模块,用于通过语音信息采集装置获取用户的实时语音会话请求,得到实时会话语音数据,通过高斯数字滤波算法对所述实时会话语音数据进行预加重处理,得到滤波会话语音数据;
分帧子模块,用于将滤波会话语音数据进行分段处理,得到分帧会话语音数据,所述分帧会话语音数据的分段时间为10-30ms;
相乘子模块,用于基于汉明窗函数,利用汉明窗函数对所有的分帧会话语音数据依次相乘,得到加窗会话语音数据;
变换子模块,用于利用快速傅里叶变换算法对所述加窗会话语音数据中的时域数据变换为频域数据,得到频域会话语音数据;
转化子模块,用于基于梅尔滤波器组将频域会话语音数据转化为梅尔频率会话语音数据,得到梅尔频率会话语音数据;
计算子模块,用于计算梅尔频率会话语音数据经过梅尔滤波器组后每个频谱的能量频谱,得到声学特征语音数据,基于声学特征语音数据进行字词识别得到实时会话字词数据。
进一步,在上述智能会话的系统中,所述智能会话模块包括会话判断单元、类型确定单元、智能会话单元、会话调用单元、模式改变单元:
会话判断单元,用于将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式;
类型确定单元,用于确定所述会话类型模式至少包括问答型会话请求、任务型会话请求和聊天型会话请求;
智能会话单元,用于根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
会话调用单元,用于若判断为问答型会话请求,则调用所述目标SAE个人词库智能会话模型中的问答会话模块,利用问答回话模块对所述实时会话字词数据进行会话;
模式改变单元,用于若会话中改变会话类型模式,则通过所述目标SAE个人词库智能会话模型改变会话类型模块进行会话。
进一步,在上述智能会话的系统中,所述会话反馈模块包括判断子模块、结果子模块、训练子模块、聚类子模块、会话子模块:
判断子模块,用于获取用户会话反馈信息,对所述用户会话反馈信息进行判断,得到正向会话反馈信息和负向会话反馈信息;
结果子模块,用于所述正向会话反馈信息为用户反馈满意的会话结果,所述负向会话反馈信息为用户反馈不满意的会话结果;
训练子模块,用于将所述正向会话反馈信息和所述负向会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练;
聚类子模块,用于获取历史会话记录中所有的正向会话反馈信息,得到正向会话反馈信息集,通过FCM模糊聚类算法对所述正向会话反馈信息集进行聚类,得到会话内容出现次数最多的正向会话反馈信息;
会话子模块,用于基于会话内容出现次数最多的正向会话反馈信息建立正向反馈会话数据库,通过正向反馈会话数据库对相似会话请求进行会话。
进一步,在上述一种利用个人著作库与其智能会话的系统中,所述智能会话的系统包括以下步骤:
获取个人著作库中的个人作品集,得到个人作品文字数据集,将所述个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;
基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;
将个人词语数据信息集输入至所述初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;
通过语音信息采集装置获取用户的实时语音会话请求,将所述实时语音会话请求进行数据预处理,得到实时会话字词数据;
将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过所述正向反馈会话数据库对相似会话请求进行会话。
进一步,在上述一种利用个人著作库与其智能会话的系统中,所述智能会话的系统包括以下步骤:
基于SAE堆栈自编码网络建立SAE个人词库智能会话模型;
所述SAE个人词库智能会话模型利用全局多跳注意机制从对话场景数据集、对话情感数据集和对话心理数据集中复制词语;
所述SAE个人词库智能会话模型至少包括人物行为解码器、人物情感解码器和人物对话解码器;
基于所述人物行为解码器、所述人物情感解码器和所述人物对话解码器对个人词语数据信息集进行解码;
利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型。
进一步,在上述一种利用个人著作库与其智能会话的系统中,所述智能会话的系统包括以下步骤:
将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式;
所述会话类型模式至少包括问答型会话请求、任务型会话请求和聊天型会话请求;
根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
若判断为问答型会话请求,则调用所述目标SAE个人词库智能会话模型中的问答会话模块,利用问答回话模块对所述实时会话字词数据进行会话;
若会话中改变会话类型模式,则通过所述目标SAE个人词库智能会话模型改变会话类型模块进行会话。
其有益效果在于,通过字词整理模块,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,将所述个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;模型建立模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;模型训练模块,用于将个人词语数据信息集输入至所述初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;会话请求模块,用于通过语音信息采集装置获取用户的实时语音会话请求,将所述实时语音会话请求进行数据预处理,得到实时会话字词数据;智能会话模块,用于将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;会话反馈模块,用于获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过所述正向反馈会话数据库对相似会话请求进行会话。可以提升对作者著作的理解,提高阅读效率,同时还能建立和作者进行交流的渠道,节约作者本身的时间和需要会话沟通的读者时间。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。
图1为本发明实施例中一种利用个人著作库与其智能会话的系统的第一个实施例示意图;
图2为本发明实施例中一种利用个人著作库与其智能会话的系统的第二个实施例示意图;
图3为本发明实施例中一种利用个人著作库与其智能会话的系统的第三个实施例示意图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“所述”也可包括复数形式。应所述进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
下面结合附图对本发明进行具体描述,如图1所示,一种利用个人著作库与其智能会话的系统,智能会话的系统包括:
字词整理模块,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,将个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;
具体的,本实施例中包括作品获取单元,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,个人作品文字数据集至少包括文章作品集、小说作品集和信件作品集;段落整理单元,用于获取个人作品文字数据集中的文字段落数据,文字段落数据至少包括人物对话段落、人物情感描述段落、人物心理描述段落、人物行为描述段落、事物描述段落和其他描述段落;字词切割单元,用于将文字段落数据中的关键词进行字词切割,得到文字语句数据;语义整理单元,用于对文字语句数据进行字词语义整理,得到个人词语数据信息集,个人词语数据信息集至少包括对话场景数据集、对话情感数据集、对话行文数据集和对话心理数据集。
模型建立模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;
具体的,本实施例中包括建立子模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型;复制子模块,用于SAE个人词库智能会话模型利用全局多跳注意机制从对话场景数据集、对话情感数据集和对话心理数据集中复制词语;解码器子模块,用于SAE个人词库智能会话模型至少包括人物行为解码器、人物情感解码器和人物对话解码器;解码子模块,用于基于人物行为解码器、人物情感解码器和人物对话解码器对个人词语数据信息集进行解码;剪枝子模块,用于利用MaskACC卷积加速滤波器对SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型。
具体的,本实施例中堆栈自编码网络(Stacked Autoencoder Network, SAE)是一种常用的深度学习模型,具有非常强的特征提取和表达能力。相比于传统的自编码网络,SAE模型中包含多层编码器和解码器,可以自动学习数据中的高阶特征,从而提高模型的准确性和泛化能力。在 SAE模型中,每个编码器都由多个输入节点和少量隐藏节点组成,其中隐藏节点负责提取输入数据的特征。每个编码器的输出都是下一层编码器的输入,并且每个解码器的输入都是对应编码器的输出。在训练过程中,SAE模型使用反向传播算法进行调整和优化,从而实现对每一层参数的更新。在自然语言处理任务中,SAE模型可以通过学习文本中的语义特征,提高词语的表达能力。
模型训练模块,用于将个人词语数据信息集输入至初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;
具体的,本实施例中包括编码组成单元,用于确定目标SAE个人词库智能会话模型包含多层编码器和解码器,编码器都由多个输入节点和少量隐藏节点组成,特征提取单元,用于编码器中的隐藏节点负责提取个人词语数据信息集中的特征;调整优化单元,用于将个人词语数据信息集输入至目标SAE个人词库智能会话模型中训练时,利用反向传播算法对训练过程进行调整和优化。
会话请求模块,用于通过语音信息采集装置获取用户的实时语音会话请求,将实时语音会话请求进行数据预处理,得到实时会话字词数据;
具体的,本实施例中包括滤波子模块,用于通过语音信息采集装置获取用户的实时语音会话请求,得到实时会话语音数据,通过高斯数字滤波算法对实时会话语音数据进行预加重处理,得到滤波会话语音数据;分帧子模块,用于将滤波会话语音数据进行分段处理,得到分帧会话语音数据,分帧会话语音数据的分段时间为10-30ms;相乘子模块,用于基于汉明窗函数,利用汉明窗函数对所有的分帧会话语音数据依次相乘,得到加窗会话语音数据;变换子模块,用于利用快速傅里叶变换算法对加窗会话语音数据中的时域数据变换为频域数据,得到频域会话语音数据;转化子模块,用于基于梅尔滤波器组将频域会话语音数据转化为梅尔频率会话语音数据,得到梅尔频率会话语音数据;计算子模块,用于计算梅尔频率会话语音数据经过梅尔滤波器组后每个频谱的能量频谱,得到声学特征语音数据,基于声学特征语音数据进行字词识别得到实时会话字词数据。
智能会话模块,用于将实时会话字词数据输入至目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用会话类型模块进行会话;
具体的,本实施例中包括会话判断单元,用于将实时会话字词数据输入至目标SAE个人词库智能会话模型中判断会话类型模式;类型确定单元,用于确定会话类型模式至少包括问答型会话请求、任务型会话请求和聊天型会话请求;智能会话单元,用于根据会话请求调用对应的会话类型模块,利用会话类型模块进行会话;会话调用单元,用于若判断为问答型会话请求,则调用目标SAE个人词库智能会话模型中的问答会话模块,利用问答回话模块对实时会话字词数据进行会话;模式改变单元,用于若会话中改变会话类型模式,则通过目标SAE个人词库智能会话模型改变会话类型模块进行会话。
会话反馈模块,用于获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过正向反馈会话数据库对相似会话请求进行会话。
具体的,本实施例中包括判断子模块,用于获取用户会话反馈信息,对用户会话反馈信息进行判断,得到正向会话反馈信息和负向会话反馈信息;结果子模块,用于正向会话反馈信息为用户反馈满意的会话结果,负向会话反馈信息为用户反馈不满意的会话结果;训练子模块,用于将正向会话反馈信息和负向会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练;聚类子模块,用于获取历史会话记录中所有的正向会话反馈信息,得到正向会话反馈信息集,通过FCM模糊聚类算法对正向会话反馈信息集进行聚类,得到会话内容出现次数最多的正向会话反馈信息;会话子模块,用于基于会话内容出现次数最多的正向会话反馈信息建立正向反馈会话数据库,通过正向反馈会话数据库对相似会话请求进行会话。
具体的,本实施例中模糊c-均值聚类算法fuzzyc-means algorithm(FCMA)或称(FCM)通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。
其有益效果在于,通过字词整理模块,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,将个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;模型建立模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;模型训练模块,用于将个人词语数据信息集输入至初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;会话请求模块,用于通过语音信息采集装置获取用户的实时语音会话请求,将实时语音会话请求进行数据预处理,得到实时会话字词数据;智能会话模块,用于将实时会话字词数据输入至目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用会话类型模块进行会话;会话反馈模块,用于获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过正向反馈会话数据库对相似会话请求进行会话。可以提升对作者著作的理解,提高阅读效率,同时还能建立和作者进行交流的渠道,节约作者本身的时间和需要会话沟通的读者时间。
本实施例中,请参阅图2,本发明实施例中一种利用个人著作库与其智能会话的系统的第二个实施例,模型建立模块包括建立子模块、复制子模块、解码器子模块、解码子模块、剪枝子模块:
建立子模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型;
复制子模块,用于SAE个人词库智能会话模型利用全局多跳注意机制从对话场景数据集、对话情感数据集和对话心理数据集中复制词语;
解码器子模块,用于SAE个人词库智能会话模型至少包括人物行为解码器、人物情感解码器和人物对话解码器;
解码子模块,用于基于人物行为解码器、人物情感解码器和人物对话解码器对个人词语数据信息集进行解码;
剪枝子模块,用于利用MaskACC卷积加速滤波器对SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型。
本实施例中,请参阅图3,本发明实施例中一种利用个人著作库与其智能会话的系统的第三个实施例,会话请求模块包括滤波子模块、分帧子模块、相乘子模块、变换子模块、转化子模块、计算子模块:
滤波子模块,用于通过语音信息采集装置获取用户的实时语音会话请求,得到实时会话语音数据,通过高斯数字滤波算法对实时会话语音数据进行预加重处理,得到滤波会话语音数据;
分帧子模块,用于将滤波会话语音数据进行分段处理,得到分帧会话语音数据,分帧会话语音数据的分段时间为10-30ms;
相乘子模块,用于基于汉明窗函数,利用汉明窗函数对所有的分帧会话语音数据依次相乘,得到加窗会话语音数据;
变换子模块,用于利用快速傅里叶变换算法对加窗会话语音数据中的时域数据变换为频域数据,得到频域会话语音数据;
转化子模块,用于基于梅尔滤波器组将频域会话语音数据转化为梅尔频率会话语音数据,得到梅尔频率会话语音数据;
计算子模块,用于计算梅尔频率会话语音数据经过梅尔滤波器组后每个频谱的能量频谱,得到声学特征语音数据,基于声学特征语音数据进行字词识别得到实时会话字词数据。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应所述了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的仅为本发明的优选例,并不用来限制本发明,在不脱离本发明精神和范围的前提下,本发明还会有各种变和改进,这些变和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.一种利用个人著作库与其智能会话的系统,其特征在于,所述智能会话的系统包括字词整理模块、模型建立模块、模型优化模块、会话请求模块、智能会话模块、会话反馈模块:
字词整理模块,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,将所述个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;
模型建立模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;
模型训练模块,用于将个人词语数据信息集输入至所述初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;
会话请求模块,用于通过语音信息采集装置获取用户的实时语音会话请求,将所述实时语音会话请求进行数据预处理,得到实时会话字词数据;
智能会话模块,用于将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
会话反馈模块,用于获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过所述正向反馈会话信息数据库对相似会话请求进行会话;
所述字词整理模块包括作品获取单元、段落整理单元、字词切割单元、语义整理单元:
作品获取单元,用于获取个人著作库中的个人作品集,得到个人作品文字数据集,所述个人作品文字数据集至少包括文章作品集、小说作品集和信件作品集;
段落整理单元,用于获取所述个人作品文字数据集中的文字段落数据,所述文字段落数据至少包括人物对话段落、人物情感描述段落、人物心理描述段落、人物行为描述段落、事物描述段落和其他描述段落;
字词切割单元,用于将所述文字段落数据中的关键词进行字词切割,得到文字语句数据;
语义整理单元,用于对所述文字语句数据进行字词语义整理,得到个人词语数据信息集,所述个人词语数据信息集至少包括对话场景数据集、对话情感数据集、对话行文数据集和对话心理数据集;所述模型建立模块包括建立子模块、复制子模块、解码器子模块、解码子模块、剪枝子模块:
建立子模块,用于基于SAE堆栈自编码网络建立SAE个人词库智能会话模型;
复制子模块,用于所述SAE个人词库智能会话模型利用全局多跳注意机制从对话场景数据集、对话情感数据集和对话心理数据集中复制词语;
解码器子模块,用于所述SAE个人词库智能会话模型至少包括人物行为解码器、人物情感解码器和人物对话解码器;
解码子模块,用于基于所述人物行为解码器、所述人物情感解码器和所述人物对话解码器对个人词语数据信息集进行解码;
剪枝子模块,用于利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型。
2.如权利要求1所述的一种利用个人著作库与其智能会话的系统,其特征在于,所述模型训练模块包括编码组成单元、特征提取单元、调整优化单元:
编码组成单元,用于确定所述目标SAE个人词库智能会话模型包含多层编码器和解码器,所述编码器都由多个输入节点和少量隐藏节点组成,
特征提取单元,用于所述编码器中的隐藏节点负责提取所述个人词语数据信息集中的特征;
调整优化单元,用于将所述个人词语数据信息集输入至所述目标SAE个人词库智能会话模型中训练时,利用反向传播算法对训练过程进行调整和优化。
3.如权利要求1所述的一种利用个人著作库与其智能会话的系统,其特征在于,所述会话请求模块包括滤波子模块、分帧子模块、相乘子模块、变换子模块、转化子模块、计算子模块:
滤波子模块,用于通过语音信息采集装置获取用户的实时语音会话请求,得到实时会话语音数据,通过高斯数字滤波算法对所述实时会话语音数据进行预加重处理,得到滤波会话语音数据;
分帧子模块,用于将滤波会话语音数据进行分段处理,得到分帧会话语音数据,所述分帧会话语音数据的分段时间为10-30ms;
相乘子模块,用于基于汉明窗函数,利用汉明窗函数对所有的分帧会话语音数据依次相乘,得到加窗会话语音数据;
变换子模块,用于利用快速傅里叶变换算法对所述加窗会话语音数据中的时域数据变换为频域数据,得到频域会话语音数据;
转化子模块,用于基于梅尔滤波器组将频域会话语音数据转化为梅尔频率会话语音数据,得到梅尔频率会话语音数据;
计算子模块,用于计算梅尔频率会话语音数据经过梅尔滤波器组后每个频谱的能量频谱,得到声学特征语音数据,基于声学特征语音数据进行字词识别得到实时会话字词数据。
4.如权利要求1所述的一种利用个人著作库与其智能会话的系统,其特征在于,所述智能会话模块包括会话判断单元、类型确定单元、智能会话单元、会话调用单元、模式改变单元:
会话判断单元,用于将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式;
类型确定单元,用于确定所述会话类型模式至少包括问答型会话请求、任务型会话请求和聊天型会话请求;
智能会话单元,用于根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
会话调用单元,用于若判断为问答型会话请求,则调用所述目标SAE个人词库智能会话模型中的问答会话模块,利用问答回话模块对所述实时会话字词数据进行会话;
模式改变单元,用于若会话中改变会话类型模式,则通过所述目标SAE个人词库智能会话模型改变会话类型模块进行会话。
5.如权利要求1所述的一种利用个人著作库与其智能会话的系统,其特征在于,所述会话反馈模块包括判断子模块、结果子模块、训练子模块、聚类子模块、会话子模块:
判断子模块,用于获取用户会话反馈信息,对所述用户会话反馈信息进行判断,得到正向会话反馈信息和负向会话反馈信息;
结果子模块,用于所述正向会话反馈信息为用户反馈满意的会话结果,所述负向会话反馈信息为用户反馈不满意的会话结果;
训练子模块,用于将所述正向会话反馈信息和所述负向会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练;
聚类子模块,用于获取历史会话记录中所有的正向会话反馈信息,得到正向会话反馈信息集,通过FCM模糊聚类算法对所述正向会话反馈信息集进行聚类,得到会话内容出现次数最多的正向会话反馈信息;
会话子模块,用于基于会话内容出现次数最多的正向会话反馈信息建立正向反馈会话数据库,通过正向反馈会话数据库对相似会话请求进行会话。
6.如权利要求1所述的一种利用个人著作库与其智能会话的系统,其特征在于,所述智能会话的系统包括以下步骤:
获取个人著作库中的个人作品集,得到个人作品文字数据集,将所述个人作品文字数据集进行字词切割和字词语义整理,得到个人词语数据信息集;
基于SAE堆栈自编码网络建立SAE个人词库智能会话模型,利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型;
将个人词语数据信息集输入至所述初始SAE个人词库智能会话模型中进行训练,得到目标SAE个人词库智能会话模型;
通过语音信息采集装置获取用户的实时语音会话请求,将所述实时语音会话请求进行数据预处理,得到实时会话字词数据;
将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式,根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
获取用户会话反馈信息,将用户会话反馈信息输入至目标SAE个人词库智能会话模型中进行训练,建立正向反馈会话信息数据库,通过所述正向反馈会话信息数据库对相似会话请求进行会话。
7.如权利要求1所述的一种利用个人著作库与其智能会话的系统,其特征在于,所述智能会话的系统包括以下步骤:
基于SAE堆栈自编码网络建立SAE个人词库智能会话模型;
所述SAE个人词库智能会话模型利用全局多跳注意机制从对话场景数据集、对话情感数据集和对话心理数据集中复制词语;
所述SAE个人词库智能会话模型至少包括人物行为解码器、人物情感解码器和人物对话解码器;
基于所述人物行为解码器、所述人物情感解码器和所述人物对话解码器对个人词语数据信息集进行解码;
利用MaskACC卷积加速滤波器对所述SAE个人词库智能会话模型中的卷积层进行剪枝,得到初始SAE个人词库智能会话模型。
8.如权利要求1所述的一种利用个人著作库与其智能会话的系统,其特征在于,所述智能会话的系统包括以下步骤:
将所述实时会话字词数据输入至所述目标SAE个人词库智能会话模型中判断会话类型模式;
所述会话类型模式至少包括问答型会话请求、任务型会话请求和聊天型会话请求;
根据会话请求调用对应的会话类型模块,利用所述会话类型模块进行会话;
若判断为问答型会话请求,则调用所述目标SAE个人词库智能会话模型中的问答会话模块,利用问答回话模块对所述实时会话字词数据进行会话;
若会话中改变会话类型模式,则通过所述目标SAE个人词库智能会话模型改变会话类型模块进行会话。
CN202311278196.6A 2023-10-07 2023-10-07 一种利用个人著作库与其智能会话的系统 Active CN117034953B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311278196.6A CN117034953B (zh) 2023-10-07 2023-10-07 一种利用个人著作库与其智能会话的系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311278196.6A CN117034953B (zh) 2023-10-07 2023-10-07 一种利用个人著作库与其智能会话的系统

Publications (2)

Publication Number Publication Date
CN117034953A CN117034953A (zh) 2023-11-10
CN117034953B true CN117034953B (zh) 2023-12-19

Family

ID=88632105

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311278196.6A Active CN117034953B (zh) 2023-10-07 2023-10-07 一种利用个人著作库与其智能会话的系统

Country Status (1)

Country Link
CN (1) CN117034953B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004070876A (ja) * 2002-08-09 2004-03-04 Casio Comput Co Ltd 会話システム及び会話処理プログラム
JP2008310784A (ja) * 2007-06-13 2008-12-25 Shinichiro Okude 意味的ネットワークをベースとして用いる対話装置、対話プログラム、及び対話プログラムを記録した記録媒体
CN108304561A (zh) * 2018-02-08 2018-07-20 北京信息职业技术学院 一种基于有限数据的语义理解方法、设备及机器人
WO2019000326A1 (en) * 2017-06-29 2019-01-03 Microsoft Technology Licensing, Llc GENERATION OF ANSWERS IN AN AUTOMATED ONLINE CONVERSATION SERVICE
CN112818105A (zh) * 2021-02-05 2021-05-18 江苏实达迪美数据处理有限公司 一种融合上下文信息的多轮对话方法及系统
CN114328866A (zh) * 2021-12-24 2022-04-12 李长山 应答流畅准确的强拟人化智能对话机器人
CN115809669A (zh) * 2022-12-30 2023-03-17 联通智网科技股份有限公司 一种对话管理方法和电子设备
CN116361510A (zh) * 2022-10-24 2023-06-30 中国传媒大学 一种利用影视类作品和剧本建立剧本场景片段视频自动提取和检索的方法和装置
CN116825088A (zh) * 2023-08-25 2023-09-29 深圳市国硕宏电子有限公司 一种基于深度学习的会议语音检测方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200335089A1 (en) * 2019-04-16 2020-10-22 International Business Machines Corporation Protecting chat with artificial intelligence
US20230253124A1 (en) * 2022-11-23 2023-08-10 OptraHEALTH Inc. Method for machine-assisted automated continuation of conversations between the user, software system, and health expert.

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004070876A (ja) * 2002-08-09 2004-03-04 Casio Comput Co Ltd 会話システム及び会話処理プログラム
JP2008310784A (ja) * 2007-06-13 2008-12-25 Shinichiro Okude 意味的ネットワークをベースとして用いる対話装置、対話プログラム、及び対話プログラムを記録した記録媒体
WO2019000326A1 (en) * 2017-06-29 2019-01-03 Microsoft Technology Licensing, Llc GENERATION OF ANSWERS IN AN AUTOMATED ONLINE CONVERSATION SERVICE
CN108304561A (zh) * 2018-02-08 2018-07-20 北京信息职业技术学院 一种基于有限数据的语义理解方法、设备及机器人
CN112818105A (zh) * 2021-02-05 2021-05-18 江苏实达迪美数据处理有限公司 一种融合上下文信息的多轮对话方法及系统
CN114328866A (zh) * 2021-12-24 2022-04-12 李长山 应答流畅准确的强拟人化智能对话机器人
CN116361510A (zh) * 2022-10-24 2023-06-30 中国传媒大学 一种利用影视类作品和剧本建立剧本场景片段视频自动提取和检索的方法和装置
CN115809669A (zh) * 2022-12-30 2023-03-17 联通智网科技股份有限公司 一种对话管理方法和电子设备
CN116825088A (zh) * 2023-08-25 2023-09-29 深圳市国硕宏电子有限公司 一种基于深度学习的会议语音检测方法及系统

Also Published As

Publication number Publication date
CN117034953A (zh) 2023-11-10

Similar Documents

Publication Publication Date Title
CN111144131B (zh) 一种基于预训练语言模型的网络谣言检测方法
CN107315737B (zh) 一种语义逻辑处理方法及系统
CN101645064B (zh) 一种浅层自然口语理解系统及方法
CN111477216A (zh) 一种用于对话机器人的音意理解模型的训练方法及系统
CN108170848B (zh) 一种面向中国移动智能客服的对话场景分类方法
CN111832293B (zh) 基于头实体预测的实体和关系联合抽取方法
CN113178193A (zh) 一种基于智能语音芯片的中文自定义唤醒与物联交互方法
CN113254620B (zh) 基于图神经网络的应答方法、装置、设备及存储介质
CN111144097B (zh) 一种对话文本的情感倾向分类模型的建模方法和装置
CN112131359A (zh) 一种基于图形化编排智能策略的意图识别方法及电子设备
CN116110405B (zh) 一种基于半监督学习的陆空通话说话人识别方法及设备
CN109977402A (zh) 一种命名实体识别方法及系统
CN114020906A (zh) 基于孪生神经网络的中文医疗文本信息匹配方法及系统
CN109933773A (zh) 一种多重语义语句解析系统及方法
CN115064154A (zh) 混合语言语音识别模型的生成方法及装置
CN114428850A (zh) 一种文本检索匹配方法和系统
CN115759071A (zh) 基于大数据的政务敏感信息识别系统和方法
CN117195872A (zh) 一种基于上下文感知提示的生成式事件论元抽取方法
CN112489651B (zh) 语音识别方法和电子设备、存储装置
CN117034953B (zh) 一种利用个人著作库与其智能会话的系统
CN116911252A (zh) 基于关系注意力增强和词性掩码的实体关系联合抽取方法
CN114120973B (zh) 一种语音语料生成系统训练方法
CN113590768B (zh) 一种文本关联度模型的训练方法及装置、问答方法及装置
CN118333636B (zh) 一种自动化客服处理系统
CN118433311B (zh) 基于个性化机器人的电话客服处理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240424

Address after: Room 30, Room 108, Building 3, Yangchenghu International Science and Technology Entrepreneurship Park, No. 116 Chengyang Road, Chengyang Street, Economic and Technological Development Zone, Xiangcheng District, Suzhou City, Jiangsu Province, 215100 (Cluster Registration)

Patentee after: Suzhou Yingwu Digital Technology Co.,Ltd.

Country or region after: China

Address before: 410000 Building 7, 101, R&D Headquarters, Zhongnan University Science Park, Yingzuo Road, Yuelu Street, Yuelu District, Changsha City, Hunan Province

Patentee before: Hunan Dongliang Shuzhi Technology Co.,Ltd.

Country or region before: China