CN112052686A

CN112052686A - 一种用户交互式教育的语音学习资源推送方法

Info

Publication number: CN112052686A
Application number: CN202010909653.7A
Authority: CN
Inventors: 杨峰; 韩忠国; 彭岸青; 秦建明
Original assignee: Hefei Decibel Workshop Technology Co ltd
Current assignee: Hefei Decibel Workshop Technology Co ltd
Priority date: 2020-09-02
Filing date: 2020-09-02
Publication date: 2020-12-08
Anticipated expiration: 2040-09-02
Also published as: CN112052686B

Abstract

本发明属于信息化教育技术领域，具体涉及一种用户交互式教育的语音学习资源推送方法，包括：预先建立数据库；获取用户语音数据、对语音数据进行处理、识别目标关键词得到识别结果，并结合预设推送程序配置初始学习资源进行推送，最终迭代进行生成最终学习资源进行推送并更新该用户学习进度数据。本发明操作简单、智能化程度高，能够根据每个用户的学习情况提供个性化的学习资源，极大地提高了学习效率。

Description

一种用户交互式教育的语音学习资源推送方法

技术领域

本发明属于信息化教育技术领域，具体涉及一种用户交互式教育的语音学习资源推送方法。

背景技术

语言是人们进行思维、情感和观点交流的主要方式。随着计算技术和网络技术的发展，人工智能时代的即将来临，人机交互在生活生产中的所使用十分广泛，身份识别技术变得日益重要。而简单快捷的身份证验证是声纹识别(Voiceprint Recognition，VPR)，随着技术的发展，语音交互越来越受到广泛的欢迎。

另外随着电子化学习的展开，个性化学习有着日趋提高的需求。所谓个性化学习，是指学员可以依据本人的背景、偏好等主客观属性，选取与之匹配的学习资源进行学习。作为提供学习资源的网站，不仅要满足学员选取学习资源的需求，而且还要做到快速和准确。

如何将语音交互与教育资源准确推送结合起来是亟需解决的问题。

发明内容

针对现有技术中的问题，本发明的目的是设计一个新的技术方案，提供一种用户交互式教育的语音学习资源推送方法，用以解决上述问题。

以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览，并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。

为了达到上述目的，本发明是通过以下技术方案来实现的：

预先建立数据库，所述数据库中存储有用户身份数据、用户学习属性数据、学习资源数据、学习进度数据、用户身份数据和学习资源数据之间的关联数据；

获取用户语音数据，对语音数据进行处理，采用声纹识别用户身份并从所述语音数据中提取目标关键词；

识别目标关键词所对应的学习资源数据中的科目类别，得到识别结果，并结合预设推送程序配置初始学习资源进行推送，其中配置的初始资源包括：知识点配置数据、知识点考察比重配置数据、题型配置数据、题型数量配置数据、难度配置数据中的至少一种；

所述预设推送程序包括：

采用协同过滤推荐算法对待推送用户在数据库中进行目标用户匹配，包括首先计算各用户的学习属性相似性，然后选择相似性最高的若干用户作为待推送用户的目标用户，根据目标用户的学习属性数据和学习进度数据，预测待推送用户对未选择和访问的学习资源数据的兴趣度，并将兴趣度高于设定阈值的类别资源结合所述目标关键词所对应的学习资源数据配置初始学习资源；

接收用户针对初始学习资源的反馈语音数据，继续提取目标关键词对初始学习资源进行修改并继续推送，迭代进行生成最终学习资源进行推送并更新该用户学习进度数据。

优选地，所述采用声纹识别用户身份包括：

预先经过前端处理输出用户纯净的语音，再提取用户语音的特征参数，进行模型训练，得到每一个用户的模型参数，建立全部用户的模板库；

识别时对待识别语音作前端处理，再提取说话者语音的特征，后使用模板库中的参数进行匹配，将匹配度最高的作为识别的最终结果。

优选地，所述提取用户语音的特征参数包括：

对于语音做包括分帧、加窗和预加重在内的预处理，；

计算出每一帧语音信号的线性预测系数(LPC)；

对每帧的LPC作短时傅里叶变换，后求谱线能量；

将每帧的谱线能量通过Bark滤波器组，计算出巴克滤波器组能量；

对每帧巴克滤波器能量取对数，后作离散余弦变换得到线性预测巴克倒谱系数LPBFCC。

优选地，所述提取用户语音的特征参数还包括在线性预测巴克倒谱系数LPBFCC的基础上加入每帧的短时能量，组成组合特征参数ELPBFCC，其中短时能量是每帧采样点幅值的加权平方和,短时能量定义如下：

上式中，T为窗的长度。

优选地，还包括对学习资源数据进行分类标记，具体为：

对学习资源数据进行行业分类、岗位分类、知识级别、适龄人群和难易程度不同维度的标记，对知识课件进行资源分类，并对知识课件时长区间进行标记；所述学习资源数据包括课程、课件和知识点。

优选地，还包括对分类标记后的学习资源数据进行优化建网,具体为：

对标记分类后的学习资源数据进行数据清洗，对知识点进行Hash散列操作，建立HashMap映射关系网状图。

优选地，还包括对用户所需学习的知识点集成化建模，并根据建模结果进行结构变换，抽取学习活动序列LAS，对序列LAS进行优化求解，得到学习过程和学习资源中的用户掌控不足的知识点，匹配得到的得到的映射关系网状图进行聚类分析，得到最优的辅导知识点作为阶段性学习资源推送给用户。

优选地，所述用户掌控不足的知识点判定包括根据用户对学习资源的评价以及知识点阶段测试结果来确定学习者掌握度不足的知识点。

本发明还提供一种用户交互式教育的语音学习资源推送系统，包括：

服务器模块，用于预先建立数据库，所述数据库中存储有用户身份数据、用户学习属性数据、学习资源数据、学习进度数据、用户身份数据和学习资源数据之间的关联数据；

语音采集处理模块，用于获取用户语音数据，对语音数据进行处理，采用声纹识别用户身份并从所述语音数据中提取目标关键词；

所述预设推送程序包括：

接收用户针对初始学习资源的反馈语音数据，继续提取目标关键词对初始学习资源进行修改并继续推送，迭代进行生成最终学习资源进行推送并更新该用户学习进度数据；

推送反馈模块，用于将学习学习资源以语音、图像、文字形式反馈至用户。

本发明还提供一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求前述的方法步骤。

本发明具有如下的有益效果：

本发明不仅能够获取到每个用户的学习情况，还能够根据每个用户的学习情况提供个性化的教育学习资源，可以让用户更快速、更方便、更准确地在海量的学习资源清单中找到合适的学习资源，并结合用户的学习活动做到快速和准确的推送学习资源，有效提升资源推荐服务效果，极大地提高了学习效率。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本实施例中用户交互式教育的语音学习资源推送系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在说明书及权利要求书当中使用了某些名称来指称特定组件。应当理解，本领域普通技术人员可能会用不同名称来指称同一个组件。本申请说明书及权利要求书并不以名称的差异作为区分组件的方式，而是以组件在功能上的实质性差异作为区分组件的准则。如在本申请说明书和权利要求书中所使用的“包含”或“包括”为一开放式用语，其应解释为“包含但不限定于”或“包括但不限定于”。具体实施方式部分所描述的实施例为本发明的较佳实施例，并非用以限定本发明的范围。

此外，所属技术领域的技术人员知道，本发明的各个方面可以实现为系统、方法或计算机程序产品。因此，本发明的各个方面可以具体实现为软硬件结合的形式，这里可以统称为“电路”、“模块”或“系统”。此外，在一些实施例中，本发明的各个方面还可以实现为在一个或多个微控制器可读介质中的计算机程序产品的形式，该微控制器可读介质中包含微控制器可读的程序代码。

首先要说明的是对于交互式语音推送，用户以语音输入的形式提出需求。为了资源推送，交互式语音推送的后台处理主要包括两个部分：语音语义识别和资源整合推送部分。其中语音识别部分的作用是对用户的语音输入进行语音识别，以获得文字形式的用户需求。语义识别部分是基于该文字形式的用户需求从数据库中寻找对应的目标关键词。语音识别技术主要由语言模型训练阶段和使用语言模型的识别阶段构成。

实施例1

本实施例提供一种用户交互式教育的语音学习资源推送方法，包括：

所述预设推送程序包括：

本实施例中采用声纹识别用户身份包括：

本实施例中提取用户语音的特征参数包括：

对于语音做包括分帧、加窗和预加重在内的预处理，；

计算出每一帧语音信号的线性预测系数(LPC)；

对每帧的LPC作短时傅里叶变换，后求谱线能量；

本实施例中提取用户语音的特征参数还包括在线性预测巴克倒谱系数LPBFCC的基础上加入每帧的短时能量，组成组合特征参数ELPBFCC，其中短时能量是每帧采样点幅值的加权平方和,短时能量定义如下：

上式中，T为窗的长度。

本实施例中还包括对学习资源数据进行分类标记，具体为：

对学习资源数据进行行业分类、岗位分类、知识级别、适龄人群和难易程度不同维度的标记，对知识课件进行资源分类，并对知识课件时长区间进行标记；所述学习资源数据包括课程、课件和知识点；

对分类标记后的学习资源数据进行优化建网,具体为：

对标记分类后的学习资源数据进行数据清洗，对知识点进行Hash散列操作，建立HashMap映射关系网状图；

对用户所需学习的知识点集成化建模，并根据建模结果进行结构变换，抽取学习活动序列LAS，对序列LAS进行优化求解，得到学习过程和学习资源中的用户掌控不足的知识点，匹配得到的得到的映射关系网状图进行聚类分析，得到最优的辅导知识点作为阶段性学习资源推送给用户。

上述中用户掌控不足的知识点判定包括根据用户对学习资源的评价以及知识点阶段测试结果来确定学习者掌握度不足的知识点。

实施例2

本实施例中的一种用户交互式教育的语音学习资源推送系统，包括：

所述预设推送程序包括：

实施例3

本实施例的一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现实施例1所述的方法步骤。

本领域技术人员将进一步领会，结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性，各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性，但这样的实现决策不应被解读成导致脱离了本发明的范围。

结合本文所公开的实施例描述的各种解说性逻辑模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器，但在替换方案中，该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合，例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。

结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中，存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中，处理器和存储介质可作为分立组件驻留在用户终端中。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种用户交互式教育的语音学习资源推送方法，其特征在于：包括：

所述预设推送程序包括：

2.根据权利要求1所述的一种用户交互式教育的语音学习资源推送方法，其特征在于：所述采用声纹识别用户身份包括：

3.根据权利要求2所述的一种用户交互式教育的语音学习资源推送方法，其特征在于：所述提取用户语音的特征参数包括：

对于语音做包括分帧、加窗和预加重在内的预处理，；

计算出每一帧语音信号的线性预测系数(LPC)；

对每帧的LPC作短时傅里叶变换，后求谱线能量；

4.根据权利要求3所述的一种用户交互式教育的语音学习资源推送方法，其特征在于：所述提取用户语音的特征参数还包括在线性预测巴克倒谱系数LPBFCC的基础上加入每帧的短时能量，组成组合特征参数ELPBFCC，其中短时能量是每帧采样点幅值的加权平方和,短时能量定义如下：

上式中，T为窗的长度。

5.根据权利要求1所述的一种用户交互式教育的语音学习资源推送方法，其特征在于：还包括对学习资源数据进行分类标记，具体为：

6.根据权利要求5所述的一种用户交互式教育的语音学习资源推送方法，其特征在于：还包括对分类标记后的学习资源数据进行优化建网,具体为：

7.根据权利要求6所述的一种用户交互式教育的语音学习资源推送方法，其特征在于：还包括对用户所需学习的知识点集成化建模，并根据建模结果进行结构变换，抽取学习活动序列LAS，对序列LAS进行优化求解，得到学习过程和学习资源中的用户掌控不足的知识点，匹配得到的得到的映射关系网状图进行聚类分析，得到最优的辅导知识点作为阶段性学习资源推送给用户。

8.根据权利要求7所述的一种用户交互式教育的语音学习资源推送方法，其特征在于：所述用户掌控不足的知识点判定包括根据用户对学习资源的评价以及知识点阶段测试结果来确定学习者掌握度不足的知识点。

9.一种用户交互式教育的语音学习资源推送系统，其特征在于，包括：

所述预设推送程序包括：

10.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-8任一所述的方法步骤。