CN111681143A - 基于课堂语音的多维度分析方法、装置、设备及存储介质 - Google Patents
基于课堂语音的多维度分析方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111681143A CN111681143A CN202010343834.8A CN202010343834A CN111681143A CN 111681143 A CN111681143 A CN 111681143A CN 202010343834 A CN202010343834 A CN 202010343834A CN 111681143 A CN111681143 A CN 111681143A
- Authority
- CN
- China
- Prior art keywords
- classroom
- initial
- target
- preset
- question
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004141 dimensional analysis Methods 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000004458 analytical method Methods 0.000 claims abstract description 84
- 238000011156 evaluation Methods 0.000 claims abstract description 72
- 238000007781 pre-processing Methods 0.000 claims abstract description 13
- 238000007405 data analysis Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 21
- 230000011218 segmentation Effects 0.000 claims description 16
- 238000012935 Averaging Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000013473 artificial intelligence Methods 0.000 abstract 1
- 238000001303 quality assessment method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06398—Performance of employee with respect to a job function
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Educational Technology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明涉及人工智能领域,公开了基于课堂语音的多维度分析方法、装置、设备及存储介质,所述方法包括:获取目标教师的初始课堂音频;对初始课堂音频进行预处理,生成目标教师的上课音量和语调评价值;调用自动语音识别ASR算法对初始课堂音频进行识别,生成目标教师的目标课堂文本;基于多个预置维度对目标课堂文本进行数据分析,得到每个预置维度的分析结果,多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量;基于每个预置维度的分析结果、上课音量、语调评价值和对应的标准参考值对初始课堂文本进行评分,得到目标教师的总评分值。此外,本发明还涉及区块链技术,初始课堂音频可存储于区块链中。
Description
技术领域
本发明涉及音频转换领域,尤其涉及一种基于课堂语音的多维度分析方法、装置、设备及存储介质。
背景技术
课后评价对于老师提高教学质量有着重大意义,老师上完课后往往不能清楚了解自己的讲课情况,例如语速过快、音量过小等等,一般需要通过其他老师旁听后给到自己上课评价才能清楚知道自己的一些讲课指标。但是,通过其他老师旁听的方法,一方面需要花费时间进行旁听记录,浪费人力。另一方面,对于不同老师的课后评价,带有一定主观色彩,给出的评价也会有所差异。结合软硬件进行智能语音分析,能够精确客观的给出老师上课评价,帮助老师提升上课质量。
传统的课堂语音分析方法往往是单一维度的分析,对于老师全方面了解自己上课情况有着很大局限性。同时,给出老师课上的分析结果后,并不能给出相应的最适合学生的分析结果范围,这样的分析结果给到老师的参考价值有限。
发明内容
本发明提供了一种基于课堂语音的多维度分析方法、装置、设备及存储介质,用于对老师课堂语音进行多维度分析,识别出老师上课所讲知识点,确保需要讲解的知识点没有遗漏,能够让老师全方面了解到自己的讲课详情,减轻老师评课工作量,提高课堂质量的评价效率。
本发明实施例的第一方面提供一种基于课堂语音的多维度分析方法,包括:获取目标教师的初始课堂音频,所述初始课堂音频为所述目标教师的任意一堂课程的音频,所述初始课堂音频用于评价所述目标教师的教学质量;对所述初始课堂音频进行预处理,生成目标教师的上课音量和语调评价值;调用自动语音识别ASR算法对所述初始课堂音频进行识别,生成所述目标教师的目标课堂文本;基于多个预置维度对所述目标课堂文本进行数据分析,得到每个预置维度的分析结果,所述多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量;基于每个预置维度的分析结果、所述上课音量、所述语调评价值和对应的标准参考值对所述初始课堂文本进行评分,得到目标教师的总评分值。
可选的,在本发明实施例第一方面的第一种实现方式中,所述基于多个预置维度对所述目标课堂文本进行数据分析,得到每个预置维度的分析结果,所述多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量,包括:根据初始课堂文本和预置的口头禅词库确定目标教师对应的口头禅;基于预置词库和所述目标教师对应的口头禅对初始课堂文本进行匹配,得到初始课堂文本的提问次数和对应的疑问句,其中疑问句的个数与提问次数相同;基于预置ASR语料对每个对应的疑问句进行分类,得到每个疑问句的类型;基于预置ASR语料对每个对应的疑问句进行识别,得到每个疑问句的平均候答时长;对初始课堂文本进行分词处理并确定所述初始课堂文本中涉及的知识点数量;得到多个预置维度的分析结果,多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量。
可选的,在本发明实施例第一方面的第二种实现方式中,所述根据初始课堂文本和预置的口头禅词库确定目标教师对应的口头禅,包括:将预置口头禅库中的每一个口头禅与目标课堂文本进行比对,得到每个口头禅的出现频次;判断每个口头禅的出现频次是否大于对应的阈值;若目标口头禅的出现频次大于对应的阈值,则确定所述目标口头禅为所述目标教师的对应的口头禅。
可选的,在本发明实施例第一方面的第三种实现方式中,所述基于预置词库和所述目标教师对应的口头禅对初始课堂文本进行匹配,得到初始课堂文本的提问次数和对应的疑问句,其中疑问句的个数与提问次数相同,包括:从预置词库中删除所述目标教师对应的口头禅,得到待匹配词库;根据所述待匹配词库和预置匹配算法判断所述初始课堂文本中的每个句子是否含有提问关键字,所述待匹配词库包括多个提问关键字;若目标句子中含有提问关键字,则确定所述目标句子属于疑问句;统计所述初始课堂文本中所有疑问句的数量,得到初始课堂文本的提问次数和对应的疑问句。
可选的,在本发明实施例第一方面的第四种实现方式中,所述基于预置ASR语料对每个对应的疑问句进行识别,得到每个疑问句的平均候答时长,包括:基于预置ASR语料对每个对应的疑问句进行识别,得到多个疑问句;确定每个疑问句的结束时刻和开始时刻;计算所述多个疑问句中连续两个疑问句之间的时间间隔,所述时间间隔为前一个疑问句的结束时刻与后一个疑问句的开始时刻之差,得到多个时间间隔;对所述多个时间间隔取平均值,生成每个疑问句的平均候答时长。
可选的,在本发明实施例第一方面的第五种实现方式中,所述对初始课堂文本进行分词处理并确定所述初始课堂文本中涉及的知识点数量,包括:对所述初始课堂文本进行分词处理,得到多个初始词语;获取所述多个初始词语中每个词语对应的词向量,得到多个初始词向量;计算每个初始词向量分别与所述初始预置的知识点库中对应的知识点的预置词向量之间的余弦相似度,得到多个余弦相似度;若目标余弦相似度大于阈值,则确定有涉及到所述目标余弦相似度对应的知识点;计算所有涉及到的知识点数量。
可选的,在本发明实施例第一方面的第六种实现方式中,所述基于每个预置维度的分析结果、所述上课音量、所述语调评价值和对应的标准参考值对所述初始课堂文本进行评分,得到目标教师的总评分值,包括:对每个预置维度的分析结果进行筛选,生成多个评价维度的初始分值,多个评价维度至少包括语速、上课音量、语调评价值、提问次数、平均候答时长;确定每个评价维度的分析结果与对应的标准参考值之间的误差范围,得到多个误差值;根据所述多个误差值对所述每个评价维度的初始分值进行调整,得到每个评价维度的目标评分值;基于每个评价维度的目标评分值得到目标教师的总评分值。
本发明实施例的第二方面提供了一种基于课堂语音的多维度分析装置,包括:获取模块,用于获取目标教师的初始课堂音频,所述初始课堂音频为所述目标教师的任意一堂课程的音频,所述初始课堂音频用于评价所述目标教师的教学质量;预处理模块,用于对所述初始课堂音频进行预处理,生成目标教师的上课音量和语调评价值;识别模块,用于调用自动语音识别ASR算法对所述初始课堂音频进行识别,生成所述目标教师的目标课堂文本;分析模块,用于基于多个预置维度对所述目标课堂文本进行数据分析,得到每个预置维度的分析结果,所述多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量;评分模块,用于基于每个预置维度的分析结果、所述上课音量、所述语调评价值和对应的标准参考值对所述初始课堂文本进行评分,得到目标教师的总评分值。
可选的,在本发明实施例第二方面的第一种实现方式中,分析模块包括:确定单元,用于根据初始课堂文本和预置的口头禅词库确定目标教师对应的口头禅;匹配单元,用于基于预置词库和所述目标教师对应的口头禅对初始课堂文本进行匹配,得到初始课堂文本的提问次数和对应的疑问句,其中疑问句的个数与提问次数相同;分类单元,用于基于预置ASR语料对每个对应的疑问句进行分类,得到每个疑问句的类型;识别单元,用于基于预置ASR语料对每个对应的疑问句进行识别,得到每个疑问句的平均候答时长;分词处理单元,用于对初始课堂文本进行分词处理并确定所述初始课堂文本中涉及的知识点数量;分析单元,用于得到多个预置维度的分析结果,多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量。
可选的,在本发明实施例第二方面的第二种实现方式中,确定单元具体用于:将预置口头禅库中的每一个口头禅与目标课堂文本进行比对,得到每个口头禅的出现频次;判断每个口头禅的出现频次是否大于对应的阈值;若目标口头禅的出现频次大于对应的阈值,则确定所述目标口头禅为所述目标教师的对应的口头禅。
可选的,在本发明实施例第二方面的第三种实现方式中,匹配单元具体用于:从预置词库中删除所述目标教师对应的口头禅,得到待匹配词库;根据所述待匹配词库和预置匹配算法判断所述初始课堂文本中的每个句子是否含有提问关键字,所述待匹配词库包括多个提问关键字;若目标句子中含有提问关键字,则确定所述目标句子属于疑问句;统计所述初始课堂文本中所有疑问句的数量,得到初始课堂文本的提问次数和对应的疑问句。
可选的,在本发明实施例第二方面的第四种实现方式中,识别单元具体用于:基于预置ASR语料对每个对应的疑问句进行识别,得到多个疑问句;确定每个疑问句的结束时刻和开始时刻;计算所述多个疑问句中连续两个疑问句之间的时间间隔,所述时间间隔为前一个疑问句的结束时刻与后一个疑问句的开始时刻之差,得到多个时间间隔;对所述多个时间间隔取平均值,生成每个疑问句的平均候答时长。
可选的,在本发明实施例第二方面的第五种实现方式中,分词处理单元具体用于:对所述初始课堂文本进行分词处理,得到多个初始词语;获取所述多个初始词语中每个词语对应的词向量,得到多个初始词向量;计算每个初始词向量分别与所述初始预置的知识点库中对应的知识点的预置词向量之间的余弦相似度,得到多个余弦相似度;若目标余弦相似度大于阈值,则确定有涉及到所述目标余弦相似度对应的知识点;计算所有涉及到的知识点数量。
可选的,在本发明实施例第二方面的第六种实现方式中,评分模块具体用于:对每个预置维度的分析结果进行筛选,生成多个评价维度的初始分值,多个评价维度至少包括语速、上课音量、语调评价值、提问次数、平均候答时长;确定每个评价维度的分析结果与对应的标准参考值之间的误差范围,得到多个误差值;根据所述多个误差值对所述每个评价维度的初始分值进行调整,得到每个评价维度的目标评分值;基于每个评价维度的目标评分值得到目标教师的总评分值。
本发明实施例的第三方面提供了一种基于课堂语音的多维度分析设备,存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于课堂语音的多维度分析设备执行上述的基于课堂语音的多维度分析方法。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时实现上述任一实施方式所述的基于课堂语音的多维度分析方法的步骤。
本发明实施例提供的技术方案中,获取目标教师的初始课堂音频,初始课堂音频为目标教师的任意一堂课程的音频,初始课堂音频用于评价目标教师的教学质量;对初始课堂音频进行预处理,生成目标教师的上课音量和语调评价值;调用自动语音识别ASR算法对初始课堂音频进行识别,生成目标教师的目标课堂文本;基于多个预置维度对目标课堂文本进行数据分析,得到每个预置维度的分析结果,多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量;基于每个预置维度的分析结果、上课音量、语调评价值和对应的标准参考值对初始课堂文本进行评分,得到目标教师的总评分值。本发明实施例,对老师课堂语音进行多维度分析,识别出老师上课所讲知识点,确保需要讲解的知识点没有遗漏,能够让老师全方面了解到自己的讲课详情,减轻老师评课工作量,提高课堂质量的评价效率。
附图说明
图1为本发明实施例中基于课堂语音的多维度分析方法的一个实施例示意图;
图2为本发明实施例中基于课堂语音的多维度分析方法的另一个实施例示意图;
图3为本发明实施例中基于课堂语音的多维度分析装置的一个实施例示意图;
图4为本发明实施例中基于课堂语音的多维度分析装置的另一个实施例示意图;
图5为本发明实施例中基于课堂语音的多维度分析设备的一个实施例示意图。
具体实施方式
本发明提供了一种基于课堂语音的多维度分析方法、装置、设备及存储介质,用于对老师课堂语音进行多维度分析,识别出老师上课所讲知识点,确保需要讲解的知识点没有遗漏,能够让老师全方面了解到自己的讲课详情,减轻老师评课工作量,提高课堂质量的评价效率。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例进行描述。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参阅图1,本发明实施例提供的基于课堂语音的多维度分析方法的流程图,具体包括:
101、获取目标教师的初始课堂音频,初始课堂音频为目标教师的任意一堂课程的音频,初始课堂音频用于评价目标教师的教学质量。
服务器获取目标教师的初始课堂音频,该初始课堂音频为目标教师的任意一堂课程的音频,初始课堂音频用于评价目标教师的教学质量。
服务器可以通过音频采集装置给目标教师的多堂课程都进行录音,得到多个课堂音频,然后随机选择任意一节课堂的课堂音频作为此次进行分析的初始课堂音频,其中,录音设备可以是教室安装的多阵列拾音器,也可以是其他音频采集装置,具体此处不做限定。
可以理解的是,本发明的执行主体可以为基于课堂语音的多维度分析装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。需要强调的是,为进一步保证上述初始课堂音频的私密和安全性,上述初始课堂音频还可以存储于一区块链的节点中。
102、对初始课堂音频进行预处理,生成目标教师的上课音量和语调评价值。
具体的,服务器基于蛇佬腔Parselmouth开源库对初始课堂音频进行降噪,得到降噪后的音频;对降噪后的音频进行音量提取和语调提取,得到目标音量和目标语调;根据目标音量和目标语调分别按照预置音量标准和预置语调标准确定目标教师的上课音量和语调评价值。
其中,通过预置的语调识别模型和预置的音量识别模型对初始课堂音频进行识别,分别得到目标语调和目标音量,预置的语调识别模型和预置的音量识别模型有多种,属于本领域常规技术,此处不再赘述。
103、调用自动语音识别ASR算法对初始课堂音频进行识别,生成目标教师的目标课堂文本。
服务器调用自动语音识别(automatic speech recognition,ASR)算法对初始课堂音频进行识别,生成目标教师的目标课堂文本。
需要说明的是,目标课堂文本中包括时间戳信息,其中,ASR算法,可以是任意具备语音转文本功能的算法。例如,可以基于讯飞ASR,或者其他任何带有时间戳信息的ASR都可以,其中,时间戳信息指的是每一句话的时间起点和时间终点信息,用于语速、候答时间分析。
104、基于多个预置维度对目标课堂文本进行数据分析,得到每个预置维度的分析结果,多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量。
具体的,服务器根据初始课堂文本和预置的口头禅词库确定目标教师对应的口头禅;服务器基于预置词库和目标教师对应的口头禅对初始课堂文本进行匹配,得到初始课堂文本的提问次数和对应的疑问句,其中疑问句的个数与提问次数相同;服务器基于预置ASR语料对每个对应的疑问句进行分类,得到每个疑问句的类型;服务器基于预置ASR语料对每个对应的疑问句进行识别,得到每个疑问句的平均候答时长;服务器对初始课堂文本进行分词处理并确定初始课堂文本中涉及的知识点数量;服务器得到多个预置维度的分析结果,多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量。
105、基于每个预置维度的分析结果、上课音量、语调评价值和对应的标准参考值对初始课堂文本进行评分,得到目标教师的总评分值。
服务器基于每个预置维度的分析结果和对应的标准参考值对初始课堂文本进行评分,得到目标教师的总评分值。具体的,服务器对每个预置维度的分析结果进行筛选,生成多个评价维度的初始分值,多个评价维度至少包括语速、上课音量、语调评价值、提问次数、平均候答时长;服务器确定每个评价维度的分析结果与对应的标准参考值之间的误差范围,得到多个误差值;服务器根据多个误差值对每个评价维度的初始分值进行调整,得到每个评价维度的目标评分值;服务器基于每个评价维度的目标评分值得到目标教师的总评分值。
需要说明的是,可以选择5个维度,初始设定为100分,每一个维度为20分,如果相应维度的初始分值偏离了正常范围的上下限的5%,则扣1分,得到每个维度的目标评分值,最终5个维度的目标评分值相加后为目标教师上课的总评分值。
例如,杨老师在一堂课上,平均语速为100字/分钟,平均音量为60分贝,平均语调为78Hz,平均提问次数为100次,平均候答时间为1s,则杨老师这堂课的评分情况具体包括:
语速评分:由于语速100偏离了正常范围下限,所以先计算偏离范围:
偏离范围=(正常范围值下限-杨老师语速值)/正常范围中心值
=(160-100)/195=30.76%,每偏离5%扣1分,所以一共扣7分,那么语速得分为20-7=13分。
上课音量评分:音量没有偏离正常范围,所以音量得分为20分。
语调评价值评分:语调没有偏离正常范围,所以语调得分为20分。
提问次数评分:偏离范围:(100-60)/45=88.9%,每偏离%5扣1分,所以一共扣18分,所以提问次数得分为2分。
平均候答时长评分:候答时间没有偏离正常范围,所以候答时间为20分。
总得分为5个维度得分相加:13+20+20+2+20=75分。
本发明实施例,对老师课堂语音进行多维度分析,能识别出老师上课所讲知识点,确保需要讲解的知识点没有遗漏,能够让老师全方面了解到自己的讲课详情,减轻老师评课工作量,提高了课堂质量的评价效率。
请参阅图2,本发明实施例提供的基于课堂语音的多维度分析方法的另一个流程图,具体包括:
201、获取目标教师的初始课堂音频,初始课堂音频为目标教师的任意一堂课程的音频,初始课堂音频用于评价目标教师的教学质量。
服务器获取目标教师的初始课堂音频,该初始课堂音频为目标教师的任意一堂课程的音频,初始课堂音频用于评价目标教师的教学质量。
服务器可以通过音频采集装置给目标教师的多堂课程都进行录音,得到多个课堂音频,然后随机选择任意一节课堂的课堂音频作为此次进行分析的初始课堂音频,其中,录音设备可以是教室安装的多阵列拾音器,也可以是其他音频采集装置,具体此处不做限定。
可以理解的是,本发明的执行主体可以为基于课堂语音的多维度分析装置,还可以是终端或者服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
202、对初始课堂音频进行预处理,生成目标教师的上课音量和语调评价值。
具体的,服务器基于蛇佬腔Parselmouth开源库对初始课堂音频进行降噪,得到降噪后的音频;对降噪后的音频进行音量提取和语调提取,得到目标音量和目标语调;根据目标音量和目标语调分别按照预置音量标准和预置语调标准确定目标教师的上课音量和语调评价值。
其中,通过预置的语调识别模型和预置的音量识别模型对初始课堂音频进行识别,分别得到目标语调和目标音量,预置的语调识别模型和预置的音量识别模型有多种,属于本领域常规技术,此处不再赘述。
203、调用自动语音识别ASR算法对初始课堂音频进行识别,生成目标教师的目标课堂文本。
服务器调用自动语音识别(automatic speech recognition,ASR)算法对初始课堂音频进行识别,生成目标教师的目标课堂文本。
需要说明的是,目标课堂文本中包括时间戳信息,其中,ASR算法,可以是任意具备语音转文本功能的算法。例如,可以基于讯飞ASR,或者其他任何带有时间戳信息的ASR都可以,其中,时间戳信息指的是每一句话的时间起点和时间终点信息,用于语速、候答时间分析。
204、根据初始课堂文本和预置的口头禅词库确定目标教师对应的口头禅;
具体的,服务器将预置口头禅库中的每一个口头禅与目标课堂文本进行比对,得到每个口头禅的出现频次;服务器判断每个口头禅的出现频次是否大于对应的阈值;若目标口头禅的出现频次大于对应的阈值,则服务器确定目标口头禅为目标教师的对应的口头禅。其中,预置的口头禅库是根据经验总结的一些教师常见的口头禅,例如“是吧”、“对吧”,“是不是”,“对不对”,“听懂了吗”,具体此处不再赘述。
可选的,阈值可以根据经验设定,例如将口头禅出现频次的平均值(通过分析多位老师的ASR数据获得平均值)的5倍作为阈值,该阈值可调节,具体此处不做限定。
205、基于预置词库和目标教师对应的口头禅对初始课堂文本进行匹配,得到初始课堂文本的提问次数和对应的疑问句,其中疑问句的个数与提问次数相同;
具体的,服务器从预置词库中删除目标教师对应的口头禅,得到待匹配词库;服务器根据待匹配词库和预置匹配算法判断初始课堂文本中的每个句子是否含有提问关键字,待匹配词库包括多个提问关键字;若目标句子中含有提问关键字,则服务器确定目标句子属于疑问句;服务器统计初始课堂文本中所有疑问句的数量,得到初始课堂文本的提问次数和对应的疑问句。
需要说明的是,预置匹配算法包括关键字匹配算法和正则匹配算法。当使用的是关键字匹配算法时,对应的预置词库为关键字词库,当使用的是正则匹配算法时,对应的预置词库为正则匹配模式词库。
例如,预置词库为关键字词库,若关键字词库为:(吗,哪,谁,什么,多少,几,请问,了没有,怎么),设定关键字词库的用法,即只要包含以上关键词中的任意一个,就认为是一个提问,例如:“这道题你们听懂了吗”中包括关键字“吗”,可以确认该句子为一个疑问句;“二次方程怎么解”中包括关键字“怎么”,也可以确认该句子为一个疑问句;“请问你上节课为什么没有认真听讲”,中包括关键字“请问”和“什么”,也可以确认该句子为一个疑问句。
又例如,预置词库为正则匹配模式词库,正则匹配模式库(包含相应的正则模式即认为疑问句):
具体的,当模式满足“*不*”(*代表字或词)时,确定为提问句。
比如,“你觉得对不对?”满足“*不*”的格式要求,该句子确定为疑问句;“是不是这样?”满足“*不*”的格式要求,该句子确定为疑问句;“可不可以这么做?”,满足“*不*”的格式要求,确定为疑问句。
可以理解的是,正则匹配模式库的模式还可以包括:“还有*没”“哪*要”“是*还是”“还有*没”。例如,对于“还有*没”模式,“还有哪道题没讲”满足要求,该局子可以确定为疑问句,“还有几道题没讲”也满足要求,该局子也可以确定为疑问句;对于“哪*要”模式,“哪道题还要讲”满足要求,该局子可以确定为疑问句;对于“是*还是”模式,“这堂课你们是想做练习还是想上课?”满足要求,该局子可以确定为疑问句。
206、基于预置ASR语料对每个对应的疑问句进行分类,得到每个疑问句的类型;
服务器收集多堂课的ASR语料,先识别出提问,然后基于TextCnn模型对提问文本进行分类。其中,问题类型包括:引导型提问、记忆型提问、理解型提问。
引导型提问:教师在讲课或者讲题过程中提出的引导性问题,主要用于推进讲述节奏;
记忆型提问:考察学生概念,字、词、公式、法则等基础知识记忆情况的提问;
理解型提问:需要学生就已学过的知识进行解释、概况、推论、比较或说明等认知过程的提问。
具体分类过程如下:
1)获得需要进行问题分类的文本,例如“一元二次方程有三种解法对不对?”;
2)采用随机的方式,将每个字(包括标点)转换成768维度的向量,所以该问题转换成15*768的向量矩阵;
3)利用8个独立的卷积核对向量矩阵进行一维卷积操作:
卷积核的size分别为:3*768、4*768、...、10*768,得到8个卷积结果,尺寸分别为:13*768、12*768、...、6*768;
4)对上述结果采用MaxPolling操作,得到8个池化结果:1*768、1*768...、1*768,最后拼接成1*6144的向量;
5)对上述结果采用全连接网络,全连接尺寸为6144*3,最终转换成3*1的向量,然后采用softmax进行分类,得到每个疑问句的类型。
207、基于预置ASR语料对每个对应的疑问句进行识别,得到每个疑问句的平均候答时长;
具体的,服务器基于预置ASR语料对每个对应的疑问句进行识别,得到多个疑问句;服务器确定每个疑问句的结束时刻和开始时刻;服务器计算多个疑问句中连续两个疑问句之间的时间间隔,时间间隔为前一个疑问句的结束时刻与后一个疑问句的开始时刻之差,得到多个时间间隔;服务器对多个时间间隔取平均值,生成每个疑问句的平均候答时长。
208对初始课堂文本进行分词处理并确定初始课堂文本中涉及的知识点数量;
具体的,(1)、服务器对初始课堂文本进行分词处理,得到多个初始词语;(2)、服务器获取多个初始词语中每个词语对应的词向量,得到多个初始词向量;其中,词向量可以用word2vec中的CBOW技术进行训练得到,例如腾讯开源词向量,还可以是其他技术,具体此处不做限定。(3)、服务器计算每个初始词向量分别与初始预置的知识点库中对应的知识点的预置词向量之间的余弦相似度,得到多个余弦相似度;(4)若目标余弦相似度大于阈值,则服务器确定有涉及到目标余弦相似度对应的知识点;(5)服务器计算所有涉及到的知识点数量。
209、得到多个预置维度的分析结果,多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量。
服务器得到多个预置维度的分析结果,多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量。
210、基于每个预置维度的分析结果、上课音量、语调评价值和对应的标准参考值对初始课堂文本进行评分,得到目标教师的总评分值。
服务器基于每个预置维度的分析结果和对应的标准参考值对初始课堂文本进行评分,得到目标教师的总评分值。具体的,服务器对每个预置维度的分析结果进行筛选,生成多个评价维度的初始分值,多个评价维度至少包括语速、上课音量、语调评价值、提问次数、平均候答时长;服务器确定每个评价维度的分析结果与对应的标准参考值之间的误差范围,得到多个误差值;服务器根据多个误差值对每个评价维度的初始分值进行调整,得到每个评价维度的目标评分值;服务器基于每个评价维度的目标评分值得到目标教师的总评分值。
需要说明的是,可以选择5个维度,初始设定为100分,每一个维度为20分,如果相应维度的初始分值偏离了正常范围的上下限的5%,则扣1分,得到每个维度的目标评分值,最终5个维度的目标评分值相加后为目标教师上课的总评分值。
例如,杨老师在一堂课上,平均语速为100字/分钟,平均音量为60分贝,平均语调为78Hz,平均提问次数为100次,平均候答时间为1s,则杨老师这堂课的评分情况具体包括:
语速评分:由于语速100偏离了正常范围下限,所以先计算偏离范围:
偏离范围=(正常范围值下限-杨老师语速值)/正常范围中心值
=(160-100)/195=30.76%,每偏离5%扣1分,所以一共扣7分,那么语速得分为20-7=13分。
上课音量评分:音量没有偏离正常范围,所以音量得分为20分。
语调评价值评分:语调没有偏离正常范围,所以语调得分为20分。
提问次数评分:偏离范围:(100-60)/45=88.9%,每偏离%5扣1分,所以一共扣18分,所以提问次数得分为2分。
平均候答时长评分:候答时间没有偏离正常范围,所以候答时间为20分。
总得分为5个维度得分相加:13+20+20+2+20=75分。
可选的,对应的标准参考值的获取过程如下:
1)挑选多个课程视频发到专业老师;
2)由专业老师确定每一个分析维度最优秀的视频,例如找出语速最优秀的视频;
3)分析语速最优视频,计算得出该视频的老师语速;
4)将计算出来的语速的上下幅度10%作为语速的标准参考值,例如由3)得到语速值是200,则认为语速的正常范围为180~220。其他维度也都可以这么操作。
本发明实施例,对老师课堂语音进行多维度分析,能识别出老师上课所讲知识点,确保需要讲解的知识点没有遗漏,能够让老师全方面了解到自己的讲课详情,减轻老师评课工作量,提高了课堂质量的评价效率。
上面对本发明实施例中基于课堂语音的多维度分析方法进行了描述,下面对本发明实施例中基于课堂语音的多维度分析装置进行描述,请参阅图3,本发明实施例中基于课堂语音的多维度分析装置的一个实施例包括:
获取模块301,用于获取目标教师的初始课堂音频,所述初始课堂音频为所述目标教师的任意一堂课程的音频,所述初始课堂音频用于评价所述目标教师的教学质量;
预处理模块302,用于对所述初始课堂音频进行预处理,生成目标教师的上课音量和语调评价值;
识别模块303,用于调用自动语音识别ASR算法对所述初始课堂音频进行识别,生成所述目标教师的目标课堂文本;
分析模块304,用于基于多个预置维度对所述目标课堂文本进行数据分析,得到每个预置维度的分析结果,所述多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量;
评分模块305,用于基于每个预置维度的分析结果、所述上课音量、所述语调评价值和对应的标准参考值对所述初始课堂文本进行评分,得到目标教师的总评分值。
本发明实施例,对老师课堂语音进行多维度分析,能识别出老师上课所讲知识点,确保需要讲解的知识点没有遗漏,能够让老师全方面了解到自己的讲课详情,减轻老师评课工作量,提高了课堂质量的评价效率。
请参阅图4,本发明实施例中基于课堂语音的多维度分析装置的另一个实施例包括:
获取模块301,用于获取目标教师的初始课堂音频,所述初始课堂音频为所述目标教师的任意一堂课程的音频,所述初始课堂音频用于评价所述目标教师的教学质量;
预处理模块302,用于对所述初始课堂音频进行预处理,生成目标教师的上课音量和语调评价值;
识别模块303,用于调用自动语音识别ASR算法对所述初始课堂音频进行识别,生成所述目标教师的目标课堂文本;
分析模块304,用于基于多个预置维度对所述目标课堂文本进行数据分析,得到每个预置维度的分析结果,所述多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量;
评分模块305,用于基于每个预置维度的分析结果、所述上课音量、所述语调评价值和对应的标准参考值对所述初始课堂文本进行评分,得到目标教师的总评分值。
可选的,分析模块304包括:
确定单元3041,用于根据初始课堂文本和预置的口头禅词库确定目标教师对应的口头禅;
匹配单元3042,用于基于预置词库和所述目标教师对应的口头禅对初始课堂文本进行匹配,得到初始课堂文本的提问次数和对应的疑问句,其中疑问句的个数与提问次数相同;
分类单元3043,用于基于预置ASR语料对每个对应的疑问句进行分类,得到每个疑问句的类型;
识别单元3044,用于基于预置ASR语料对每个对应的疑问句进行识别,得到每个疑问句的平均候答时长;
分词处理单元3045,用于对初始课堂文本进行分词处理并确定所述初始课堂文本中涉及的知识点数量;
分析单元3046,用于得到多个预置维度的分析结果,多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量。
可选的,确定单元3041具体用于:
将预置口头禅库中的每一个口头禅与目标课堂文本进行比对,得到每个口头禅的出现频次;判断每个口头禅的出现频次是否大于对应的阈值;若目标口头禅的出现频次大于对应的阈值,则确定所述目标口头禅为所述目标教师的对应的口头禅。
可选的,匹配单元3042具体用于:
从预置词库中删除所述目标教师对应的口头禅,得到待匹配词库;根据所述待匹配词库和预置匹配算法判断所述初始课堂文本中的每个句子是否含有提问关键字,所述待匹配词库包括多个提问关键字;若目标句子中含有提问关键字,则确定所述目标句子属于疑问句;统计所述初始课堂文本中所有疑问句的数量,得到初始课堂文本的提问次数和对应的疑问句。
可选的,识别单元3044具体用于:
基于预置ASR语料对每个对应的疑问句进行识别,得到多个疑问句;确定每个疑问句的结束时刻和开始时刻;计算所述多个疑问句中连续两个疑问句之间的时间间隔,所述时间间隔为前一个疑问句的结束时刻与后一个疑问句的开始时刻之差,得到多个时间间隔;对所述多个时间间隔取平均值,生成每个疑问句的平均候答时长。
可选的,分词处理单元3045具体用于:
对所述初始课堂文本进行分词处理,得到多个初始词语;获取所述多个初始词语中每个词语对应的词向量,得到多个初始词向量;计算每个初始词向量分别与所述初始预置的知识点库中对应的知识点的预置词向量之间的余弦相似度,得到多个余弦相似度;若目标余弦相似度大于阈值,则确定有涉及到所述目标余弦相似度对应的知识点;计算所有涉及到的知识点数量。
可选的,评分模块305具体用于:
对每个预置维度的分析结果进行筛选,生成多个评价维度的初始分值,多个评价维度至少包括语速、上课音量、语调评价值、提问次数、平均候答时长;确定每个评价维度的分析结果与对应的标准参考值之间的误差范围,得到多个误差值;根据所述多个误差值对所述每个评价维度的初始分值进行调整,得到每个评价维度的目标评分值;基于每个评价维度的目标评分值得到目标教师的总评分值。
本发明实施例,对老师课堂语音进行多维度分析,能识别出老师上课所讲知识点,确保需要讲解的知识点没有遗漏,能够让老师全方面了解到自己的讲课详情,减轻老师评课工作量,提高了课堂质量的评价效率。
上面图3至图4从模块化功能实体的角度对本发明实施例中的基于课堂语音的多维度分析装置进行详细描述,下面从硬件处理的角度对本发明实施例中基于课堂语音的多维度分析设备进行详细描述。
图5是本发明实施例提供的一种基于课堂语音的多维度分析设备的结构示意图,该基于课堂语音的多维度分析设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对基于课堂语音的多维度分析设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在基于课堂语音的多维度分析设备500上执行存储介质530中的一系列指令操作。
基于课堂语音的多维度分析设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的基于课堂语音的多维度分析设备结构并不构成对基于课堂语音的多维度分析设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。处理器501可以执行上述实施例中获取模块301、预处理模块302、识别模块303、分析模块304和评分模块305的功能。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述基于课堂语音的多维度分析方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于课堂语音的多维度分析方法,其特征在于,包括:
获取目标教师的初始课堂音频,所述初始课堂音频为所述目标教师的任意一堂课程的音频,所述初始课堂音频用于评价所述目标教师的教学质量;
对所述初始课堂音频进行预处理,生成目标教师的上课音量和语调评价值;
调用自动语音识别ASR算法对所述初始课堂音频进行识别,生成所述目标教师的目标课堂文本;
基于多个预置维度对所述目标课堂文本进行数据分析,得到每个预置维度的分析结果,所述多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量;
基于每个预置维度的分析结果、所述上课音量、所述语调评价值和对应的标准参考值对所述初始课堂文本进行评分,得到目标教师的总评分值。
2.根据权利要求1所述的基于课堂语音的多维度分析方法,其特征在于,所述基于多个预置维度对所述目标课堂文本进行数据分析,得到每个预置维度的分析结果,所述多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量,包括:
根据初始课堂文本和预置的口头禅词库确定目标教师对应的口头禅;
基于预置词库和所述目标教师对应的口头禅对初始课堂文本进行匹配,得到初始课堂文本的提问次数和对应的疑问句,其中疑问句的个数与提问次数相同;
基于预置ASR语料对每个对应的疑问句进行分类,得到每个疑问句的类型;
基于预置ASR语料对每个对应的疑问句进行识别,得到每个疑问句的平均候答时长;
对初始课堂文本进行分词处理并确定所述初始课堂文本中涉及的知识点数量;
得到多个预置维度的分析结果,多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量。
3.根据权利要求2所述的基于课堂语音的多维度分析方法,其特征在于,所述根据初始课堂文本和预置的口头禅词库确定目标教师对应的口头禅,包括:
将预置口头禅库中的每一个口头禅与目标课堂文本进行比对,得到每个口头禅的出现频次;
判断每个口头禅的出现频次是否大于对应的阈值;
若目标口头禅的出现频次大于对应的阈值,则确定所述目标口头禅为所述目标教师的对应的口头禅。
4.根据权利要求2所述的基于课堂语音的多维度分析方法,其特征在于,所述基于预置词库和所述目标教师对应的口头禅对初始课堂文本进行匹配,得到初始课堂文本的提问次数和对应的疑问句,其中疑问句的个数与提问次数相同,包括:
从预置词库中删除所述目标教师对应的口头禅,得到待匹配词库;
根据所述待匹配词库和预置匹配算法判断所述初始课堂文本中的每个句子是否含有提问关键字,所述待匹配词库包括多个提问关键字;
若目标句子中含有提问关键字,则确定所述目标句子属于疑问句;
统计所述初始课堂文本中所有疑问句的数量,得到初始课堂文本的提问次数和对应的疑问句。
5.根据权利要求2所述的基于课堂语音的多维度分析方法,其特征在于,所述基于预置ASR语料对每个对应的疑问句进行识别,得到每个疑问句的平均候答时长,包括:
基于预置ASR语料对每个对应的疑问句进行识别,得到多个疑问句;
确定每个疑问句的结束时刻和开始时刻;
计算所述多个疑问句中连续两个疑问句之间的时间间隔,所述时间间隔为前一个疑问句的结束时刻与后一个疑问句的开始时刻之差,得到多个时间间隔;
对所述多个时间间隔取平均值,生成每个疑问句的平均候答时长。
6.根据权利要求2所述的基于课堂语音的多维度分析方法,所述初始课堂音频存储于区块链中,其特征在于,所述对初始课堂文本进行分词处理并确定所述初始课堂文本中涉及的知识点数量,包括:
对所述初始课堂文本进行分词处理,得到多个初始词语;
获取所述多个初始词语中每个词语对应的词向量,得到多个初始词向量;
计算每个初始词向量分别与所述初始预置的知识点库中对应的知识点的预置词向量之间的余弦相似度,得到多个余弦相似度;
若目标余弦相似度大于阈值,则确定有涉及到所述目标余弦相似度对应的知识点;
计算所有涉及到的知识点数量。
7.根据权利要求1-6中任一项所述的基于课堂语音的多维度分析方法,其特征在于,所述基于每个预置维度的分析结果、所述上课音量、所述语调评价值和对应的标准参考值对所述初始课堂文本进行评分,得到目标教师的总评分值,包括:
对每个预置维度的分析结果进行筛选,生成多个评价维度的初始分值,多个评价维度至少包括语速、上课音量、语调评价值、提问次数、平均候答时长;
确定每个评价维度的分析结果与对应的标准参考值之间的误差范围,得到多个误差值;
根据所述多个误差值对所述每个评价维度的初始分值进行调整,得到每个评价维度的目标评分值;
基于每个评价维度的目标评分值得到目标教师的总评分值。
8.一种基于课堂语音的多维度分析装置,其特征在于,包括:
获取模块,用于获取目标教师的初始课堂音频,所述初始课堂音频为所述目标教师的任意一堂课程的音频,所述初始课堂音频用于评价所述目标教师的教学质量;
预处理模块,用于对所述初始课堂音频进行预处理,生成目标教师的上课音量和语调评价值;
识别模块,用于调用自动语音识别ASR算法对所述初始课堂音频进行识别,生成所述目标教师的目标课堂文本;
分析模块,用于基于多个预置维度对所述目标课堂文本进行数据分析,得到每个预置维度的分析结果,所述多个预置维度包括语速、口头禅、提问次数、提问类型、平均候答时长和知识点数量;
评分模块,用于基于每个预置维度的分析结果、所述上课音量、所述语调评价值和对应的标准参考值对所述初始课堂文本进行评分,得到目标教师的总评分值。
9.一种基于课堂语音的多维度分析设备,其特征在于,所述基于课堂语音的多维度分析设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于课堂语音的多维度分析设备执行如权利要求1-7中任意一项所述的基于课堂语音的多维度分析方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时实现如权利要求1-7中任意一项所述的基于课堂语音的多维度分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010343834.8A CN111681143A (zh) | 2020-04-27 | 2020-04-27 | 基于课堂语音的多维度分析方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010343834.8A CN111681143A (zh) | 2020-04-27 | 2020-04-27 | 基于课堂语音的多维度分析方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111681143A true CN111681143A (zh) | 2020-09-18 |
Family
ID=72452168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010343834.8A Pending CN111681143A (zh) | 2020-04-27 | 2020-04-27 | 基于课堂语音的多维度分析方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111681143A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112232166A (zh) * | 2020-10-10 | 2021-01-15 | 中国平安人寿保险股份有限公司 | 基于人工智能的讲师动态评价方法、装置、计算机设备 |
CN112257457A (zh) * | 2020-10-27 | 2021-01-22 | 上海汉图科技有限公司 | 一种学员课堂表现的评价方法、装置和电子设备 |
CN112331211A (zh) * | 2021-01-06 | 2021-02-05 | 北京世纪好未来教育科技有限公司 | 学情信息获取方法、装置、设备和存储介质 |
CN112507294A (zh) * | 2020-10-23 | 2021-03-16 | 重庆交通大学 | 一种基于人机交互的英语教学系统及教学方法 |
CN113314108A (zh) * | 2021-06-16 | 2021-08-27 | 深圳前海微众银行股份有限公司 | 语音数据的处理方法、装置、设备、存储介质和程序产品 |
CN116453543A (zh) * | 2023-03-31 | 2023-07-18 | 华南师范大学 | 一种基于语音识别的教学语言规范分析方法及系统 |
CN116523371A (zh) * | 2023-03-23 | 2023-08-01 | 华南师范大学 | 教学语言规范水平分析方法、系统、装置及介质 |
CN117994098A (zh) * | 2024-03-05 | 2024-05-07 | 江苏薪传科技有限公司 | 一种教学指标数据确定方法、装置、计算机设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108108903A (zh) * | 2017-12-26 | 2018-06-01 | 重庆大争科技有限公司 | 课堂教学质量评估系统 |
CN108288240A (zh) * | 2017-06-29 | 2018-07-17 | 广州华多网络科技有限公司 | 一种基于在线教育提问显示的方法及装置 |
CN108920513A (zh) * | 2018-05-31 | 2018-11-30 | 深圳市图灵机器人有限公司 | 一种多媒体数据处理方法、装置和电子设备 |
CN109697577A (zh) * | 2019-02-01 | 2019-04-30 | 北京清帆科技有限公司 | 一种基于语音的课堂质量评价方法 |
CN110600033A (zh) * | 2019-08-26 | 2019-12-20 | 北京大米科技有限公司 | 学习情况的评估方法、装置、存储介质及电子设备 |
CN110796338A (zh) * | 2019-09-24 | 2020-02-14 | 北京谦仁科技有限公司 | 在线教学监控方法、装置、服务器及存储介质 |
-
2020
- 2020-04-27 CN CN202010343834.8A patent/CN111681143A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108288240A (zh) * | 2017-06-29 | 2018-07-17 | 广州华多网络科技有限公司 | 一种基于在线教育提问显示的方法及装置 |
CN108108903A (zh) * | 2017-12-26 | 2018-06-01 | 重庆大争科技有限公司 | 课堂教学质量评估系统 |
CN108920513A (zh) * | 2018-05-31 | 2018-11-30 | 深圳市图灵机器人有限公司 | 一种多媒体数据处理方法、装置和电子设备 |
CN109697577A (zh) * | 2019-02-01 | 2019-04-30 | 北京清帆科技有限公司 | 一种基于语音的课堂质量评价方法 |
CN110600033A (zh) * | 2019-08-26 | 2019-12-20 | 北京大米科技有限公司 | 学习情况的评估方法、装置、存储介质及电子设备 |
CN110796338A (zh) * | 2019-09-24 | 2020-02-14 | 北京谦仁科技有限公司 | 在线教学监控方法、装置、服务器及存储介质 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112232166B (zh) * | 2020-10-10 | 2023-12-01 | 中国平安人寿保险股份有限公司 | 基于人工智能的讲师动态评价方法、装置、计算机设备 |
CN112232166A (zh) * | 2020-10-10 | 2021-01-15 | 中国平安人寿保险股份有限公司 | 基于人工智能的讲师动态评价方法、装置、计算机设备 |
CN112507294A (zh) * | 2020-10-23 | 2021-03-16 | 重庆交通大学 | 一种基于人机交互的英语教学系统及教学方法 |
CN112257457A (zh) * | 2020-10-27 | 2021-01-22 | 上海汉图科技有限公司 | 一种学员课堂表现的评价方法、装置和电子设备 |
CN112257457B (zh) * | 2020-10-27 | 2024-05-28 | 上海汉图科技有限公司 | 一种学员课堂表现的评价方法、装置和电子设备 |
CN112331211A (zh) * | 2021-01-06 | 2021-02-05 | 北京世纪好未来教育科技有限公司 | 学情信息获取方法、装置、设备和存储介质 |
CN112331211B (zh) * | 2021-01-06 | 2021-05-07 | 北京世纪好未来教育科技有限公司 | 学情信息获取方法、装置、设备和存储介质 |
CN113314108B (zh) * | 2021-06-16 | 2024-02-13 | 深圳前海微众银行股份有限公司 | 语音数据的处理方法、装置、设备、存储介质和程序产品 |
CN113314108A (zh) * | 2021-06-16 | 2021-08-27 | 深圳前海微众银行股份有限公司 | 语音数据的处理方法、装置、设备、存储介质和程序产品 |
CN116523371A (zh) * | 2023-03-23 | 2023-08-01 | 华南师范大学 | 教学语言规范水平分析方法、系统、装置及介质 |
CN116523371B (zh) * | 2023-03-23 | 2024-09-03 | 华南师范大学 | 教学语言规范水平分析方法、系统、装置及介质 |
CN116453543A (zh) * | 2023-03-31 | 2023-07-18 | 华南师范大学 | 一种基于语音识别的教学语言规范分析方法及系统 |
CN117994098A (zh) * | 2024-03-05 | 2024-05-07 | 江苏薪传科技有限公司 | 一种教学指标数据确定方法、装置、计算机设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111681143A (zh) | 基于课堂语音的多维度分析方法、装置、设备及存储介质 | |
Schuller et al. | The INTERSPEECH 2021 computational paralinguistics challenge: COVID-19 cough, COVID-19 speech, escalation & primates | |
Donnelly et al. | Words matter: automatic detection of teacher questions in live classroom discourse using linguistics, acoustics, and context | |
WO2021082982A1 (zh) | 基于图谱化知识库的问答方法、设备、存储介质及装置 | |
US8682241B2 (en) | Method and system for improving the quality of teaching through analysis using a virtual teaching device | |
EP2815398B1 (en) | Audio human interactive proof based on text-to-speech and semantics | |
CN112487139B (zh) | 基于文本的自动出题方法、装置及计算机设备 | |
CN110175229B (zh) | 一种基于自然语言进行在线培训的方法和系统 | |
CN111785275A (zh) | 语音识别方法及装置 | |
JP2002544570A (ja) | 話し方認識モデル化を使用する自動化された言語査定 | |
CN112468659A (zh) | 应用于电话客服的质量评价方法、装置、设备及存储介质 | |
CN114048327A (zh) | 一种基于知识图谱的主观题自动评分方法及系统 | |
Lee et al. | Off-Topic Spoken Response Detection Using Siamese Convolutional Neural Networks. | |
EP1398758B1 (en) | Method and apparatus for generating decision tree questions for speech processing | |
CN117252259A (zh) | 基于深度学习的自然语言理解方法及ai助教系统 | |
CN112767940B (zh) | 一种语音培训识别方法、系统、设备及存储介质 | |
CN110598041A (zh) | 一种FlACS实时分析方法与装置 | |
CN112052686B (zh) | 一种用户交互式教育的语音学习资源推送方法 | |
CN113486970A (zh) | 阅读能力评测方法及装置 | |
CN114822557A (zh) | 课堂中不同声音的区分方法、装置、设备以及存储介质 | |
CN109086387A (zh) | 一种音频流评分方法、装置、设备及存储介质 | |
CN108629024A (zh) | 一种基于声音识别的教学考勤方法 | |
CN114241835A (zh) | 一种学生口语质量评测方法和设备 | |
CN114360586A (zh) | 一种大学生心理健康教育示教系统和方法 | |
US7454337B1 (en) | Method of modeling single data class from multi-class data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |