CN112052686A - 一种用户交互式教育的语音学习资源推送方法 - Google Patents

一种用户交互式教育的语音学习资源推送方法 Download PDF

Info

Publication number
CN112052686A
CN112052686A CN202010909653.7A CN202010909653A CN112052686A CN 112052686 A CN112052686 A CN 112052686A CN 202010909653 A CN202010909653 A CN 202010909653A CN 112052686 A CN112052686 A CN 112052686A
Authority
CN
China
Prior art keywords
learning
user
data
voice
resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010909653.7A
Other languages
English (en)
Other versions
CN112052686B (zh
Inventor
杨峰
韩忠国
彭岸青
秦建明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Decibel Workshop Technology Co ltd
Original Assignee
Hefei Decibel Workshop Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Decibel Workshop Technology Co ltd filed Critical Hefei Decibel Workshop Technology Co ltd
Priority to CN202010909653.7A priority Critical patent/CN112052686B/zh
Publication of CN112052686A publication Critical patent/CN112052686A/zh
Application granted granted Critical
Publication of CN112052686B publication Critical patent/CN112052686B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Educational Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明属于信息化教育技术领域,具体涉及一种用户交互式教育的语音学习资源推送方法,包括:预先建立数据库;获取用户语音数据、对语音数据进行处理、识别目标关键词得到识别结果,并结合预设推送程序配置初始学习资源进行推送,最终迭代进行生成最终学习资源进行推送并更新该用户学习进度数据。本发明操作简单、智能化程度高,能够根据每个用户的学习情况提供个性化的学习资源,极大地提高了学习效率。

Description

一种用户交互式教育的语音学习资源推送方法
技术领域
本发明属于信息化教育技术领域,具体涉及一种用户交互式教育的语音学习资源推送方法。
背景技术
语言是人们进行思维、情感和观点交流的主要方式。随着计算技术和网络技术的发展,人工智能时代的即将来临,人机交互在生活生产中的所使用十分广泛,身份识别技术变得日益重要。而简单快捷的身份证验证是声纹识别(Voiceprint Recognition,VPR),随着技术的发展,语音交互越来越受到广泛的欢迎。
另外随着电子化学习的展开,个性化学习有着日趋提高的需求。所谓个性化学习,是指学员可以依据本人的背景、偏好等主客观属性,选取与之匹配的学习资源进行学习。作为提供学习资源的网站,不仅要满足学员选取学习资源的需求,而且还要做到快速和准确。
如何将语音交互与教育资源准确推送结合起来是亟需解决的问题。
发明内容
针对现有技术中的问题,本发明的目的是设计一个新的技术方案,提供一种用户交互式教育的语音学习资源推送方法,用以解决上述问题。
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
为了达到上述目的,本发明是通过以下技术方案来实现的:
预先建立数据库,所述数据库中存储有用户身份数据、用户学习属性数据、学习资源数据、学习进度数据、用户身份数据和学习资源数据之间的关联数据;
获取用户语音数据,对语音数据进行处理,采用声纹识别用户身份并从所述语音数据中提取目标关键词;
识别目标关键词所对应的学习资源数据中的科目类别,得到识别结果,并结合预设推送程序配置初始学习资源进行推送,其中配置的初始资源包括:知识点配置数据、知识点考察比重配置数据、题型配置数据、题型数量配置数据、难度配置数据中的至少一种;
所述预设推送程序包括:
采用协同过滤推荐算法对待推送用户在数据库中进行目标用户匹配,包括首先计算各用户的学习属性相似性,然后选择相似性最高的若干用户作为待推送用户的目标用户,根据目标用户的学习属性数据和学习进度数据,预测待推送用户对未选择和访问的学习资源数据的兴趣度,并将兴趣度高于设定阈值的类别资源结合所述目标关键词所对应的学习资源数据配置初始学习资源;
接收用户针对初始学习资源的反馈语音数据,继续提取目标关键词对初始学习资源进行修改并继续推送,迭代进行生成最终学习资源进行推送并更新该用户学习进度数据。
优选地,所述采用声纹识别用户身份包括:
预先经过前端处理输出用户纯净的语音,再提取用户语音的特征参数,进行模型训练,得到每一个用户的模型参数,建立全部用户的模板库;
识别时对待识别语音作前端处理,再提取说话者语音的特征,后使用模板库中的参数进行匹配,将匹配度最高的作为识别的最终结果。
优选地,所述提取用户语音的特征参数包括:
对于语音做包括分帧、加窗和预加重在内的预处理,;
计算出每一帧语音信号的线性预测系数(LPC);
对每帧的LPC作短时傅里叶变换,后求谱线能量;
将每帧的谱线能量通过Bark滤波器组,计算出巴克滤波器组能量;
对每帧巴克滤波器能量取对数,后作离散余弦变换得到线性预测巴克倒谱系数LPBFCC。
优选地,所述提取用户语音的特征参数还包括在线性预测巴克倒谱系数LPBFCC的基础上加入每帧的短时能量,组成组合特征参数ELPBFCC,其中短时能量是每帧采样点幅值的加权平方和,短时能量定义如下:
Figure BDA0002662777530000021
上式中,T为窗的长度。
优选地,还包括对学习资源数据进行分类标记,具体为:
对学习资源数据进行行业分类、岗位分类、知识级别、适龄人群和难易程度不同维度的标记,对知识课件进行资源分类,并对知识课件时长区间进行标记;所述学习资源数据包括课程、课件和知识点。
优选地,还包括对分类标记后的学习资源数据进行优化建网,具体为:
对标记分类后的学习资源数据进行数据清洗,对知识点进行Hash散列操作,建立HashMap映射关系网状图。
优选地,还包括对用户所需学习的知识点集成化建模,并根据建模结果进行结构变换,抽取学习活动序列LAS,对序列LAS进行优化求解,得到学习过程和学习资源中的用户掌控不足的知识点,匹配得到的得到的映射关系网状图进行聚类分析,得到最优的辅导知识点作为阶段性学习资源推送给用户。
优选地,所述用户掌控不足的知识点判定包括根据用户对学习资源的评价以及知识点阶段测试结果来确定学习者掌握度不足的知识点。
本发明还提供一种用户交互式教育的语音学习资源推送系统,包括:
服务器模块,用于预先建立数据库,所述数据库中存储有用户身份数据、用户学习属性数据、学习资源数据、学习进度数据、用户身份数据和学习资源数据之间的关联数据;
语音采集处理模块,用于获取用户语音数据,对语音数据进行处理,采用声纹识别用户身份并从所述语音数据中提取目标关键词;
识别目标关键词所对应的学习资源数据中的科目类别,得到识别结果,并结合预设推送程序配置初始学习资源进行推送,其中配置的初始资源包括:知识点配置数据、知识点考察比重配置数据、题型配置数据、题型数量配置数据、难度配置数据中的至少一种;
所述预设推送程序包括:
采用协同过滤推荐算法对待推送用户在数据库中进行目标用户匹配,包括首先计算各用户的学习属性相似性,然后选择相似性最高的若干用户作为待推送用户的目标用户,根据目标用户的学习属性数据和学习进度数据,预测待推送用户对未选择和访问的学习资源数据的兴趣度,并将兴趣度高于设定阈值的类别资源结合所述目标关键词所对应的学习资源数据配置初始学习资源;
接收用户针对初始学习资源的反馈语音数据,继续提取目标关键词对初始学习资源进行修改并继续推送,迭代进行生成最终学习资源进行推送并更新该用户学习进度数据;
推送反馈模块,用于将学习学习资源以语音、图像、文字形式反馈至用户。
本发明还提供一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求前述的方法步骤。
本发明具有如下的有益效果:
本发明不仅能够获取到每个用户的学习情况,还能够根据每个用户的学习情况提供个性化的教育学习资源,可以让用户更快速、更方便、更准确地在海量的学习资源清单中找到合适的学习资源,并结合用户的学习活动做到快速和准确的推送学习资源,有效提升资源推荐服务效果,极大地提高了学习效率。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本实施例中用户交互式教育的语音学习资源推送系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在说明书及权利要求书当中使用了某些名称来指称特定组件。应当理解,本领域普通技术人员可能会用不同名称来指称同一个组件。本申请说明书及权利要求书并不以名称的差异作为区分组件的方式,而是以组件在功能上的实质性差异作为区分组件的准则。如在本申请说明书和权利要求书中所使用的“包含”或“包括”为一开放式用语,其应解释为“包含但不限定于”或“包括但不限定于”。具体实施方式部分所描述的实施例为本发明的较佳实施例,并非用以限定本发明的范围。
此外,所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为软硬件结合的形式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个微控制器可读介质中的计算机程序产品的形式,该微控制器可读介质中包含微控制器可读的程序代码。
首先要说明的是对于交互式语音推送,用户以语音输入的形式提出需求。为了资源推送,交互式语音推送的后台处理主要包括两个部分:语音语义识别和资源整合推送部分。其中语音识别部分的作用是对用户的语音输入进行语音识别,以获得文字形式的用户需求。语义识别部分是基于该文字形式的用户需求从数据库中寻找对应的目标关键词。语音识别技术主要由语言模型训练阶段和使用语言模型的识别阶段构成。
实施例1
本实施例提供一种用户交互式教育的语音学习资源推送方法,包括:
预先建立数据库,所述数据库中存储有用户身份数据、用户学习属性数据、学习资源数据、学习进度数据、用户身份数据和学习资源数据之间的关联数据;
获取用户语音数据,对语音数据进行处理,采用声纹识别用户身份并从所述语音数据中提取目标关键词;
识别目标关键词所对应的学习资源数据中的科目类别,得到识别结果,并结合预设推送程序配置初始学习资源进行推送,其中配置的初始资源包括:知识点配置数据、知识点考察比重配置数据、题型配置数据、题型数量配置数据、难度配置数据中的至少一种;
所述预设推送程序包括:
采用协同过滤推荐算法对待推送用户在数据库中进行目标用户匹配,包括首先计算各用户的学习属性相似性,然后选择相似性最高的若干用户作为待推送用户的目标用户,根据目标用户的学习属性数据和学习进度数据,预测待推送用户对未选择和访问的学习资源数据的兴趣度,并将兴趣度高于设定阈值的类别资源结合所述目标关键词所对应的学习资源数据配置初始学习资源;
接收用户针对初始学习资源的反馈语音数据,继续提取目标关键词对初始学习资源进行修改并继续推送,迭代进行生成最终学习资源进行推送并更新该用户学习进度数据。
本实施例中采用声纹识别用户身份包括:
预先经过前端处理输出用户纯净的语音,再提取用户语音的特征参数,进行模型训练,得到每一个用户的模型参数,建立全部用户的模板库;
识别时对待识别语音作前端处理,再提取说话者语音的特征,后使用模板库中的参数进行匹配,将匹配度最高的作为识别的最终结果。
本实施例中提取用户语音的特征参数包括:
对于语音做包括分帧、加窗和预加重在内的预处理,;
计算出每一帧语音信号的线性预测系数(LPC);
对每帧的LPC作短时傅里叶变换,后求谱线能量;
将每帧的谱线能量通过Bark滤波器组,计算出巴克滤波器组能量;
对每帧巴克滤波器能量取对数,后作离散余弦变换得到线性预测巴克倒谱系数LPBFCC。
本实施例中提取用户语音的特征参数还包括在线性预测巴克倒谱系数LPBFCC的基础上加入每帧的短时能量,组成组合特征参数ELPBFCC,其中短时能量是每帧采样点幅值的加权平方和,短时能量定义如下:
Figure BDA0002662777530000061
上式中,T为窗的长度。
本实施例中还包括对学习资源数据进行分类标记,具体为:
对学习资源数据进行行业分类、岗位分类、知识级别、适龄人群和难易程度不同维度的标记,对知识课件进行资源分类,并对知识课件时长区间进行标记;所述学习资源数据包括课程、课件和知识点;
对分类标记后的学习资源数据进行优化建网,具体为:
对标记分类后的学习资源数据进行数据清洗,对知识点进行Hash散列操作,建立HashMap映射关系网状图;
对用户所需学习的知识点集成化建模,并根据建模结果进行结构变换,抽取学习活动序列LAS,对序列LAS进行优化求解,得到学习过程和学习资源中的用户掌控不足的知识点,匹配得到的得到的映射关系网状图进行聚类分析,得到最优的辅导知识点作为阶段性学习资源推送给用户。
上述中用户掌控不足的知识点判定包括根据用户对学习资源的评价以及知识点阶段测试结果来确定学习者掌握度不足的知识点。
实施例2
本实施例中的一种用户交互式教育的语音学习资源推送系统,包括:
服务器模块,用于预先建立数据库,所述数据库中存储有用户身份数据、用户学习属性数据、学习资源数据、学习进度数据、用户身份数据和学习资源数据之间的关联数据;
语音采集处理模块,用于获取用户语音数据,对语音数据进行处理,采用声纹识别用户身份并从所述语音数据中提取目标关键词;
识别目标关键词所对应的学习资源数据中的科目类别,得到识别结果,并结合预设推送程序配置初始学习资源进行推送,其中配置的初始资源包括:知识点配置数据、知识点考察比重配置数据、题型配置数据、题型数量配置数据、难度配置数据中的至少一种;
所述预设推送程序包括:
采用协同过滤推荐算法对待推送用户在数据库中进行目标用户匹配,包括首先计算各用户的学习属性相似性,然后选择相似性最高的若干用户作为待推送用户的目标用户,根据目标用户的学习属性数据和学习进度数据,预测待推送用户对未选择和访问的学习资源数据的兴趣度,并将兴趣度高于设定阈值的类别资源结合所述目标关键词所对应的学习资源数据配置初始学习资源;
接收用户针对初始学习资源的反馈语音数据,继续提取目标关键词对初始学习资源进行修改并继续推送,迭代进行生成最终学习资源进行推送并更新该用户学习进度数据;
推送反馈模块,用于将学习学习资源以语音、图像、文字形式反馈至用户。
实施例3
本实施例的一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现实施例1所述的方法步骤。
本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。
结合本文所公开的实施例描述的各种解说性逻辑模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种用户交互式教育的语音学习资源推送方法,其特征在于:包括:
预先建立数据库,所述数据库中存储有用户身份数据、用户学习属性数据、学习资源数据、学习进度数据、用户身份数据和学习资源数据之间的关联数据;
获取用户语音数据,对语音数据进行处理,采用声纹识别用户身份并从所述语音数据中提取目标关键词;
识别目标关键词所对应的学习资源数据中的科目类别,得到识别结果,并结合预设推送程序配置初始学习资源进行推送,其中配置的初始资源包括:知识点配置数据、知识点考察比重配置数据、题型配置数据、题型数量配置数据、难度配置数据中的至少一种;
所述预设推送程序包括:
采用协同过滤推荐算法对待推送用户在数据库中进行目标用户匹配,包括首先计算各用户的学习属性相似性,然后选择相似性最高的若干用户作为待推送用户的目标用户,根据目标用户的学习属性数据和学习进度数据,预测待推送用户对未选择和访问的学习资源数据的兴趣度,并将兴趣度高于设定阈值的类别资源结合所述目标关键词所对应的学习资源数据配置初始学习资源;
接收用户针对初始学习资源的反馈语音数据,继续提取目标关键词对初始学习资源进行修改并继续推送,迭代进行生成最终学习资源进行推送并更新该用户学习进度数据。
2.根据权利要求1所述的一种用户交互式教育的语音学习资源推送方法,其特征在于:所述采用声纹识别用户身份包括:
预先经过前端处理输出用户纯净的语音,再提取用户语音的特征参数,进行模型训练,得到每一个用户的模型参数,建立全部用户的模板库;
识别时对待识别语音作前端处理,再提取说话者语音的特征,后使用模板库中的参数进行匹配,将匹配度最高的作为识别的最终结果。
3.根据权利要求2所述的一种用户交互式教育的语音学习资源推送方法,其特征在于:所述提取用户语音的特征参数包括:
对于语音做包括分帧、加窗和预加重在内的预处理,;
计算出每一帧语音信号的线性预测系数(LPC);
对每帧的LPC作短时傅里叶变换,后求谱线能量;
将每帧的谱线能量通过Bark滤波器组,计算出巴克滤波器组能量;
对每帧巴克滤波器能量取对数,后作离散余弦变换得到线性预测巴克倒谱系数LPBFCC。
4.根据权利要求3所述的一种用户交互式教育的语音学习资源推送方法,其特征在于:所述提取用户语音的特征参数还包括在线性预测巴克倒谱系数LPBFCC的基础上加入每帧的短时能量,组成组合特征参数ELPBFCC,其中短时能量是每帧采样点幅值的加权平方和,短时能量定义如下:
Figure FDA0002662777520000021
上式中,T为窗的长度。
5.根据权利要求1所述的一种用户交互式教育的语音学习资源推送方法,其特征在于:还包括对学习资源数据进行分类标记,具体为:
对学习资源数据进行行业分类、岗位分类、知识级别、适龄人群和难易程度不同维度的标记,对知识课件进行资源分类,并对知识课件时长区间进行标记;所述学习资源数据包括课程、课件和知识点。
6.根据权利要求5所述的一种用户交互式教育的语音学习资源推送方法,其特征在于:还包括对分类标记后的学习资源数据进行优化建网,具体为:
对标记分类后的学习资源数据进行数据清洗,对知识点进行Hash散列操作,建立HashMap映射关系网状图。
7.根据权利要求6所述的一种用户交互式教育的语音学习资源推送方法,其特征在于:还包括对用户所需学习的知识点集成化建模,并根据建模结果进行结构变换,抽取学习活动序列LAS,对序列LAS进行优化求解,得到学习过程和学习资源中的用户掌控不足的知识点,匹配得到的得到的映射关系网状图进行聚类分析,得到最优的辅导知识点作为阶段性学习资源推送给用户。
8.根据权利要求7所述的一种用户交互式教育的语音学习资源推送方法,其特征在于:所述用户掌控不足的知识点判定包括根据用户对学习资源的评价以及知识点阶段测试结果来确定学习者掌握度不足的知识点。
9.一种用户交互式教育的语音学习资源推送系统,其特征在于,包括:
服务器模块,用于预先建立数据库,所述数据库中存储有用户身份数据、用户学习属性数据、学习资源数据、学习进度数据、用户身份数据和学习资源数据之间的关联数据;
语音采集处理模块,用于获取用户语音数据,对语音数据进行处理,采用声纹识别用户身份并从所述语音数据中提取目标关键词;
识别目标关键词所对应的学习资源数据中的科目类别,得到识别结果,并结合预设推送程序配置初始学习资源进行推送,其中配置的初始资源包括:知识点配置数据、知识点考察比重配置数据、题型配置数据、题型数量配置数据、难度配置数据中的至少一种;
所述预设推送程序包括:
采用协同过滤推荐算法对待推送用户在数据库中进行目标用户匹配,包括首先计算各用户的学习属性相似性,然后选择相似性最高的若干用户作为待推送用户的目标用户,根据目标用户的学习属性数据和学习进度数据,预测待推送用户对未选择和访问的学习资源数据的兴趣度,并将兴趣度高于设定阈值的类别资源结合所述目标关键词所对应的学习资源数据配置初始学习资源;
接收用户针对初始学习资源的反馈语音数据,继续提取目标关键词对初始学习资源进行修改并继续推送,迭代进行生成最终学习资源进行推送并更新该用户学习进度数据;
推送反馈模块,用于将学习学习资源以语音、图像、文字形式反馈至用户。
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-8任一所述的方法步骤。
CN202010909653.7A 2020-09-02 2020-09-02 一种用户交互式教育的语音学习资源推送方法 Active CN112052686B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010909653.7A CN112052686B (zh) 2020-09-02 2020-09-02 一种用户交互式教育的语音学习资源推送方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010909653.7A CN112052686B (zh) 2020-09-02 2020-09-02 一种用户交互式教育的语音学习资源推送方法

Publications (2)

Publication Number Publication Date
CN112052686A true CN112052686A (zh) 2020-12-08
CN112052686B CN112052686B (zh) 2023-08-18

Family

ID=73606777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010909653.7A Active CN112052686B (zh) 2020-09-02 2020-09-02 一种用户交互式教育的语音学习资源推送方法

Country Status (1)

Country Link
CN (1) CN112052686B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113781854A (zh) * 2021-09-06 2021-12-10 浙江工商大学 一种用于自动远程教学的小组讨论方法和系统
CN115660913A (zh) * 2022-11-09 2023-01-31 读书郎教育科技有限公司 一种为用户定制学习内容的系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100306249A1 (en) * 2009-05-27 2010-12-02 James Hill Social network systems and methods
CN103956166A (zh) * 2014-05-27 2014-07-30 华东理工大学 一种基于语音关键词识别的多媒体课件检索系统
CN106601259A (zh) * 2016-12-13 2017-04-26 北京奇虎科技有限公司 一种基于声纹搜索的信息推荐方法及装置
CN108198040A (zh) * 2018-01-23 2018-06-22 广州屏美网络科技有限公司 教育资源分配方法、装置、计算机设备及存储介质
CN110162605A (zh) * 2018-02-15 2019-08-23 阿尔派株式会社 检索结果提供装置及检索结果提供方法
CN111177413A (zh) * 2019-12-30 2020-05-19 北京谦仁科技有限公司 学习资源推荐方法、装置和电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100306249A1 (en) * 2009-05-27 2010-12-02 James Hill Social network systems and methods
CN103956166A (zh) * 2014-05-27 2014-07-30 华东理工大学 一种基于语音关键词识别的多媒体课件检索系统
CN106601259A (zh) * 2016-12-13 2017-04-26 北京奇虎科技有限公司 一种基于声纹搜索的信息推荐方法及装置
CN108198040A (zh) * 2018-01-23 2018-06-22 广州屏美网络科技有限公司 教育资源分配方法、装置、计算机设备及存储介质
CN110162605A (zh) * 2018-02-15 2019-08-23 阿尔派株式会社 检索结果提供装置及检索结果提供方法
CN111177413A (zh) * 2019-12-30 2020-05-19 北京谦仁科技有限公司 学习资源推荐方法、装置和电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113781854A (zh) * 2021-09-06 2021-12-10 浙江工商大学 一种用于自动远程教学的小组讨论方法和系统
CN115660913A (zh) * 2022-11-09 2023-01-31 读书郎教育科技有限公司 一种为用户定制学习内容的系统及方法

Also Published As

Publication number Publication date
CN112052686B (zh) 2023-08-18

Similar Documents

Publication Publication Date Title
CN110377911B (zh) 对话框架下的意图识别方法和装置
CN111368024A (zh) 文本语义相似度的分析方法、装置及计算机设备
CN110544481B (zh) 一种基于声纹识别的s-t分类方法、装置及设备终端
CN110457432A (zh) 面试评分方法、装置、设备及存储介质
CN108960269B (zh) 数据集的特征获取方法、装置及计算设备
CN112468659B (zh) 应用于电话客服的质量评价方法、装置、设备及存储介质
CN110990685A (zh) 基于声纹的语音搜索方法、设备、存储介质及装置
CN112487139A (zh) 基于文本的自动出题方法、装置及计算机设备
CN107967280B (zh) 一种标签推荐歌曲的方法及系统
CN112052686B (zh) 一种用户交互式教育的语音学习资源推送方法
CN109741734A (zh) 一种语音评测方法、装置和可读介质
CN112671985A (zh) 基于深度学习的坐席质检方法、装置、设备及存储介质
CN108710653B (zh) 一种绘本朗读点播方法、装置及系统
CN114048327A (zh) 一种基于知识图谱的主观题自动评分方法及系统
CN111128240B (zh) 一种基于对抗语义擦除的语音情感识别方法
CN115394318A (zh) 一种音频检测方法和装置
KR20130068624A (ko) 화자 그룹 기반 음성인식 장치 및 방법
CN116738250A (zh) 提示文本扩展方法、装置、电子设备和存储介质
CN115618415A (zh) 敏感数据识别方法、装置、电子设备和存储介质
CN109086387A (zh) 一种音频流评分方法、装置、设备及存储介质
CN111489736B (zh) 座席话术自动评分装置及方法
CN109389493A (zh) 基于语音识别的自定义测试题目录入方法、系统及设备
CN114822557A (zh) 课堂中不同声音的区分方法、装置、设备以及存储介质
CN114358579A (zh) 评阅方法、评阅装置、电子设备以及计算机可读存储介质
CN113673237A (zh) 模型训练、意图识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant