CN105528578A - 一种基于声像过程跟踪的在线培训监视方法 - Google Patents

一种基于声像过程跟踪的在线培训监视方法 Download PDF

Info

Publication number
CN105528578A
CN105528578A CN201510878517.5A CN201510878517A CN105528578A CN 105528578 A CN105528578 A CN 105528578A CN 201510878517 A CN201510878517 A CN 201510878517A CN 105528578 A CN105528578 A CN 105528578A
Authority
CN
China
Prior art keywords
user
face
online
online training
data code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510878517.5A
Other languages
English (en)
Inventor
梁昭
朱卫民
李玉香
王永朝
唐南
庄磊
杨秀娥
张磊
赵昭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Training Center of State Grid Hebei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Training Center of State Grid Hebei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Training Center of State Grid Hebei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201510878517.5A priority Critical patent/CN105528578A/zh
Publication of CN105528578A publication Critical patent/CN105528578A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/167Detection; Localisation; Normalisation using comparisons between temporally consecutive images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/70Multimodal biometrics, e.g. combining information from different biometric modalities
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • G10L15/25Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于声像过程跟踪的在线培训监视方法,其属于远程监控方法,其包括如下步骤:1.搭建声像过程跟踪平台,设置后台模块;2.进行身份认证;3.进行过程跟踪:在线学习视频播放过程中随时启动网络摄像头抓拍用户面部信息,且在线学习视频播放过程中启动收音设备,定时采集用户的声音指令,根据定时采集到的声音指令和面部信息,实现用户的定位,如声音指令和面部信息不符,则对用户做出提醒并暂停播放。本发明的优点是不仅在开启时启动人脸识别,且在线培训中每隔一段时间进行人脸识别监视,通过声音指令操作在线视频的相关操作,能够有效监控在线用户的在线时间且能确保进行在线培训的过程中均是本人,避免作弊和替他人学习的情况。

Description

一种基于声像过程跟踪的在线培训监视方法
技术领域
本发明涉及一种基于声像过程跟踪的在线培训监视方法,适用于在线培训的同步监视,属于远程监控方法。
背景技术
随着在线培训、在线学习系统的普及化和实际应用,企业用户对现有系统也产生了诸多的质疑与问题,在实操中,往往存在重形象、请实效,重硬件、轻软件,重统计、轻结果的情况,没有对客车内容建设和培训体系建设、培训的手段方法及培训的效果进行评估,导致在线培训常常流于形式,或者只在开始时进行身份识别,没有在在线培训过程中实现有效的监督。
发明内容
本发明所要解决的技术问题是提供了一种使用方便、行之有效的基于声像过程跟踪的在线培训监视方法。
本发明所采用的技术方案如下:
一种基于声像过程跟踪的在线培训监视方法,其包括如下步骤:
步骤1.搭建声像过程跟踪平台,设置后台模块:
提前通过人脸扫描设备拍摄用户的面部特征,并与用户声明的身份信息绑定;将面部特征分析处理后转化成图像数据代码,并将所述图像数据代码存储到位于在线培训平台上的图像数据代码数据库中;提前利用收音设备录制声音指令,将声音指令分析处理后转化成音频数据代码,并将所述音频数据代码存储到位于在线培训平台上的音频数据库中;
步骤2.进行身份认证:
通过通信网络接受用户终端的登录请求,进行身份认证,同时启动网络摄像头扫描用户面部信息,传输至后台进行人脸识别,若人脸识别结果成功,可正常开始在线培训学习,后台自动调取与该用户学习内容相关的学习资料;若人脸识别结果未成功,提示用户未成功并重新扫描;
步骤3.进行过程跟踪:
在线学习视频播放过程中随时启动网络摄像头抓拍用户面部信息,且在线学习视频播放过程中启动收音设备,定时采集用户的声音指令,根据定时采集到的声音指令和面部信息,实现用户的定位,如声音指令和面部信息不符,则对用户做出提醒并暂停播放。
进一步的,所述步骤2中的人脸识别包括基于静态图像的人脸识别和基于视频图像的人脸识别,基于静态图像的人脸识别算法同样适用于基于视频图像的人脸识别,只有使用了时间信息的识别算法才属于基于视频图像的人脸识别算法。
所述人脸识别的算法可以为特征脸方法,所述特征脸方法可以利用主分量分析方法进行降维和提取特征,所述主分量分析方法选择与原数据协方差矩阵的若干个最大特征值对应的特征向量构成一组基,以达到最佳表征原数据的目的;在人脸识别中,由一组特征脸基图象张成一个特征脸子空间,任何一幅人脸图象都可投影到该子空间,得到一个权值向量。计算此向量和训练集中每个人的权值向量之间的欧式距离,取最小距离所对应的人脸图像的身份作为用户人脸图像的身份。所述主分量是指向数据能量分布最大的轴线方向,可以从最小均方误差意义下对数据进行最优的表达。
所述特征脸方法也可以用线性鉴别分析方法,属于模式识别方法,通过将样本线性变换到一个新的空间,使样本的类内散布程度达到最小,同时类间散布程度达到最大,即Fisher准则。
进一步的,所述步骤1中将声音指令分析处理后转化成音频数据代码的方法如下:
(1)将声音指令进行预处理,即先进行预加重,再进行分帧加窗处理,最后再进行端点检测;所述分帧加窗处理采用Hamming窗;
(2)用Mel频率的倒谱系数作为语音特征识别孤立词语语音,最后组合成音频数据代码,具体方法如下:
首先,将预处理后的声音指令输入Hamming窗帧选,经过Hamming窗帧选的数据进行傅里叶变换;
然后,将傅里叶变换后的数据以滤波组能量的形式输出至进行离散余弦变换,最终输出可识别的音频数据代码。
本发明的有益效果如下:
本方法不仅在开启时启动人脸识别,且在线培训过程中一定时间间隔下进行人脸识别监视,能够有效监控在线用户的在线时间且能确保进行在线培训的过程中均是本人,避免作弊和替他人学习的情况;另外通过声音指令操作在线视频的相关操作,例如播放、停止、快进、截图及选集等等;不仅方便使用,而且能实时通过声音指令确认用户在线,且通过声音指令还能提升用户体验,提高用户在线培训的兴趣。
具体实施方式
为使本发明要解决的技术问题、技术方案和有益效果更加清楚,下面将结合具体实施例进行详细描述。
本实施例的实现方法如下:
步骤1.搭建声像过程跟踪平台,设置后台模块:
提前通过人脸扫描设备拍摄用户的面部特征,并与用户声明的身份信息绑定;将面部特征分析处理后转化成图像数据代码,并将所述图像数据代码存储到位于在线培训平台上的图像数据代码数据库中;提前利用收音设备录制声音指令,将声音指令分析处理后转化成音频数据代码,并将所述音频数据代码存储到位于在线培训平台上的音频数据库中;
步骤2.进行身份认证:
通过通信网络接受用户终端的登录请求,进行身份认证,同时启动网络摄像头扫描用户面部信息,传输至后台进行人脸识别,若人脸识别结果成功,可正常开始在线培训学习,后台自动调取与该用户学习内容相关的学习资料;若人脸识别结果未成功,提示用户未成功并重新扫描;
步骤3.进行过程跟踪:
在线学习视频播放过程中随时启动网络摄像头抓拍用户面部信息,且在线学习视频播放过程中启动收音设备,定时采集用户的声音指令,根据定时采集到的声音指令和面部信息,实现用户的定位,如声音指令和面部信息不符,则对用户做出提醒并暂停播放。
进一步的,所述步骤2中的人脸识别包括基于静态图像的人脸识别和基于视频图像的人脸识别,基于静态图像的人脸识别算法同样适用于基于视频图像的人脸识别,只有使用了时间信息的识别算法才属于基于视频图像的人脸识别算法。
所述人脸识别的算法可以为特征脸方法,所述特征脸方法可以利用主分量分析方法进行降维和提取特征,所述主分量分析方法选择与原数据协方差矩阵的若干个最大特征值对应的特征向量构成一组基,以达到最佳表征原数据的目的;在人脸识别中,由一组特征脸基图象张成一个特征脸子空间,任何一幅人脸图象都可投影到该子空间,得到一个权值向量。计算此向量和训练集中每个人的权值向量之间的欧式距离,取最小距离所对应的人脸图像的身份作为用户人脸图像的身份。所述主分量是指向数据能量分布最大的轴线方向,可以从最小均方误差意义下对数据进行最优的表达。
所述特征脸方法也可以用线性鉴别分析方法,属于模式识别方法,通过将样本线性变换到一个新的空间,使样本的类内散布程度达到最小,同时类间散布程度达到最大,即Fisher准则。
进一步的,所述步骤1中将声音指令分析处理后转化成音频数据代码的方法如下:
(1)将声音指令进行预处理,即先进行预加重,再进行分帧加窗处理,最后再进行端点检测;所述分帧加窗处理采用Hamming窗;
(2)用Mel频率的倒谱系数作为语音特征识别孤立词语语音,最后组合成音频数据代码,具体方法如下:
首先,将预处理后的声音指令输入Hamming窗帧选,经过Hamming窗帧选的数据进行傅里叶变换;
然后,将傅里叶变换后的数据以滤波组能量的形式输出至进行离散余弦变换,最终输出可识别的音频数据代码。
以上利用具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;对于本领域技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (5)

1.一种基于声像过程跟踪的在线培训监视方法,其特征在于,包括如下步骤:
步骤1.搭建声像过程跟踪平台,设置后台模块:
提前通过人脸扫描设备拍摄用户的面部特征,并与用户声明的身份信息绑定;将面部特征分析处理后转化成图像数据代码,并将所述图像数据代码存储到位于在线培训平台上的图像数据代码数据库中;提前利用收音设备录制声音指令,将声音指令分析处理后转化成音频数据代码,并将所述音频数据代码存储到位于在线培训平台上的音频数据库中;
步骤2.进行身份认证:
通过通信网络接受用户终端的登录请求,进行身份认证,同时启动网络摄像头扫描用户面部信息,传输至后台进行人脸识别,若人脸识别结果成功,可正常开始在线培训学习,后台自动调取与该用户学习内容相关的学习资料;若人脸识别结果未成功,提示用户未成功并重新扫描;
步骤3.进行过程跟踪:
在线学习视频播放过程中随时启动网络摄像头抓拍用户面部信息,且在线学习视频播放过程中启动收音设备,定时采集用户的声音指令,根据定时采集到的声音指令和面部信息,实现用户的定位,如声音指令和面部信息不符,则对用户做出提醒并暂停播放。
2.根据权利要求1所述一种基于声像过程跟踪的在线培训监视方法,其特征在于:所述步骤2中的人脸识别包括基于静态图像的人脸识别和基于视频图像的人脸识别。
3.根据权利要求1所述一种基于声像过程跟踪的在线培训监视方法,其特征在于:所述步骤1中将声音指令分析处理后转化成音频数据代码的方法如下:
(1)将声音指令进行预处理,即先进行预加重,再进行分帧加窗处理,最后再进行端点检测;
(2)用Mel频率的倒谱系数作为语音特征识别孤立词语语音,最后组合成音频数据代码。
4.根据权利要求3所述一种基于声像过程跟踪的在线培训监视方法,其特征在于:所述分帧加窗处理采用Hamming窗。
5.根据权利要求3所述一种基于声像过程跟踪的在线培训监视方法,其特征在于:所述用Mel频率的倒谱系数作为语音特征识别孤立词语语音的方法如下:
首先,将预处理后的声音指令输入Hamming窗帧选,经过Hamming窗帧选的数据进行傅里叶变换;
然后,将傅里叶变换后的数据以滤波组能量的形式输出至进行离散余弦变换,最终输出可识别的音频数据代码。
CN201510878517.5A 2015-12-04 2015-12-04 一种基于声像过程跟踪的在线培训监视方法 Pending CN105528578A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510878517.5A CN105528578A (zh) 2015-12-04 2015-12-04 一种基于声像过程跟踪的在线培训监视方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510878517.5A CN105528578A (zh) 2015-12-04 2015-12-04 一种基于声像过程跟踪的在线培训监视方法

Publications (1)

Publication Number Publication Date
CN105528578A true CN105528578A (zh) 2016-04-27

Family

ID=55770792

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510878517.5A Pending CN105528578A (zh) 2015-12-04 2015-12-04 一种基于声像过程跟踪的在线培训监视方法

Country Status (1)

Country Link
CN (1) CN105528578A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850667A (zh) * 2017-03-03 2017-06-13 杭州智贝信息科技有限公司 一种持续认证安全防护系统及其方法
CN108647509A (zh) * 2018-05-11 2018-10-12 北京北信源信息安全技术有限公司 一种防止敏感文件泄露的方法及装置
CN111104882A (zh) * 2019-12-09 2020-05-05 曹玉平 一种扫描识别方法
CN117670616A (zh) * 2023-12-18 2024-03-08 中国矿业大学 基于图像识别及位置匹配的在线学习状态监测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102013176A (zh) * 2010-12-01 2011-04-13 曹乃承 在线学习系统
US20120268580A1 (en) * 2011-04-12 2012-10-25 Hyun Kim Portable computing device with intelligent robotic functions and method for operating the same
CN102905185A (zh) * 2012-10-26 2013-01-30 四川长虹电器股份有限公司 全语音控制html5视频播放的方法
CN103218763A (zh) * 2013-03-26 2013-07-24 陈秀成 一种高可信度的远程在线面试的方法与系统
CN103546452A (zh) * 2013-08-22 2014-01-29 国家电网公司 基于网络平台的分布式考试防作弊系统和防作弊方法
CN104376250A (zh) * 2014-12-03 2015-02-25 优化科技(苏州)有限公司 基于音型像特征的真人活体身份验证方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102013176A (zh) * 2010-12-01 2011-04-13 曹乃承 在线学习系统
US20120268580A1 (en) * 2011-04-12 2012-10-25 Hyun Kim Portable computing device with intelligent robotic functions and method for operating the same
CN102905185A (zh) * 2012-10-26 2013-01-30 四川长虹电器股份有限公司 全语音控制html5视频播放的方法
CN103218763A (zh) * 2013-03-26 2013-07-24 陈秀成 一种高可信度的远程在线面试的方法与系统
CN103546452A (zh) * 2013-08-22 2014-01-29 国家电网公司 基于网络平台的分布式考试防作弊系统和防作弊方法
CN104376250A (zh) * 2014-12-03 2015-02-25 优化科技(苏州)有限公司 基于音型像特征的真人活体身份验证方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106850667A (zh) * 2017-03-03 2017-06-13 杭州智贝信息科技有限公司 一种持续认证安全防护系统及其方法
CN108647509A (zh) * 2018-05-11 2018-10-12 北京北信源信息安全技术有限公司 一种防止敏感文件泄露的方法及装置
CN111104882A (zh) * 2019-12-09 2020-05-05 曹玉平 一种扫描识别方法
CN117670616A (zh) * 2023-12-18 2024-03-08 中国矿业大学 基于图像识别及位置匹配的在线学习状态监测方法及系统

Similar Documents

Publication Publication Date Title
CN111488433B (zh) 一种适用于银行的提升现场体验感的人工智能交互系统
CN105702263B (zh) 语音重放检测方法和装置
WO2018166187A1 (zh) 服务器、身份验证方法、系统及计算机可读存储介质
US11068571B2 (en) Electronic device, method and system of identity verification and computer readable storage medium
CA2898779C (en) User authentication method and apparatus based on audio and video data
CN104834849B (zh) 基于声纹识别和人脸识别的双因素身份认证方法及系统
CN104575504A (zh) 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN107767861B (zh) 语音唤醒方法、系统及智能终端
CN108766446A (zh) 声纹识别方法、装置、存储介质及音箱
CN105528578A (zh) 一种基于声像过程跟踪的在线培训监视方法
CN106251874A (zh) 一种语音门禁和安静环境监控方法及系统
WO2017206375A1 (zh) 声纹注册、认证方法及装置
CN102592116A (zh) 一种云计算应用方法、系统及终端设备、云计算平台
CN103794207A (zh) 一种双模语音身份识别方法
WO2019228091A1 (zh) 考勤管理的方法和考勤管理设备
CN109410911A (zh) 基于语音识别的人工智能学习方法
WO2021082941A1 (zh) 视频人物识别方法、装置、存储介质与电子设备
US10984795B2 (en) Electronic apparatus and operation method thereof
US20220328050A1 (en) Adversarially robust voice biometrics, secure recognition, and identification
CN109949798A (zh) 基于音频的广告检测方法以及装置
CN104732972A (zh) 一种基于分组统计的hmm声纹识别签到方法及系统
CN108694952B (zh) 电子装置、身份验证的方法及存储介质
WO2019101099A1 (zh) 视频节目识别方法、设备、终端、系统和存储介质
CN107809665A (zh) 基于声像的在线培训监视方法
CN110889009B (zh) 一种声纹聚类方法、装置、处理设备以及计算机存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160427

RJ01 Rejection of invention patent application after publication