CN105528578A - 一种基于声像过程跟踪的在线培训监视方法 - Google Patents
一种基于声像过程跟踪的在线培训监视方法 Download PDFInfo
- Publication number
- CN105528578A CN105528578A CN201510878517.5A CN201510878517A CN105528578A CN 105528578 A CN105528578 A CN 105528578A CN 201510878517 A CN201510878517 A CN 201510878517A CN 105528578 A CN105528578 A CN 105528578A
- Authority
- CN
- China
- Prior art keywords
- user
- face
- online
- online training
- data code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012549 training Methods 0.000 title claims abstract description 34
- 238000012544 monitoring process Methods 0.000 title abstract description 6
- 238000012545 processing Methods 0.000 claims abstract description 7
- 230000001815 facial effect Effects 0.000 claims description 15
- 238000009432 framing Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000006467 substitution reaction Methods 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 8
- 239000006185 dispersion Substances 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/166—Detection; Localisation; Normalisation using acquisition arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/167—Detection; Localisation; Normalisation using comparisons between temporally consecutive images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/70—Multimodal biometrics, e.g. combining information from different biometric modalities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
- G10L15/25—Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于声像过程跟踪的在线培训监视方法,其属于远程监控方法,其包括如下步骤:1.搭建声像过程跟踪平台,设置后台模块;2.进行身份认证;3.进行过程跟踪:在线学习视频播放过程中随时启动网络摄像头抓拍用户面部信息,且在线学习视频播放过程中启动收音设备,定时采集用户的声音指令,根据定时采集到的声音指令和面部信息,实现用户的定位,如声音指令和面部信息不符,则对用户做出提醒并暂停播放。本发明的优点是不仅在开启时启动人脸识别,且在线培训中每隔一段时间进行人脸识别监视,通过声音指令操作在线视频的相关操作,能够有效监控在线用户的在线时间且能确保进行在线培训的过程中均是本人,避免作弊和替他人学习的情况。
Description
技术领域
本发明涉及一种基于声像过程跟踪的在线培训监视方法,适用于在线培训的同步监视,属于远程监控方法。
背景技术
随着在线培训、在线学习系统的普及化和实际应用,企业用户对现有系统也产生了诸多的质疑与问题,在实操中,往往存在重形象、请实效,重硬件、轻软件,重统计、轻结果的情况,没有对客车内容建设和培训体系建设、培训的手段方法及培训的效果进行评估,导致在线培训常常流于形式,或者只在开始时进行身份识别,没有在在线培训过程中实现有效的监督。
发明内容
本发明所要解决的技术问题是提供了一种使用方便、行之有效的基于声像过程跟踪的在线培训监视方法。
本发明所采用的技术方案如下:
一种基于声像过程跟踪的在线培训监视方法,其包括如下步骤:
步骤1.搭建声像过程跟踪平台,设置后台模块:
提前通过人脸扫描设备拍摄用户的面部特征,并与用户声明的身份信息绑定;将面部特征分析处理后转化成图像数据代码,并将所述图像数据代码存储到位于在线培训平台上的图像数据代码数据库中;提前利用收音设备录制声音指令,将声音指令分析处理后转化成音频数据代码,并将所述音频数据代码存储到位于在线培训平台上的音频数据库中;
步骤2.进行身份认证:
通过通信网络接受用户终端的登录请求,进行身份认证,同时启动网络摄像头扫描用户面部信息,传输至后台进行人脸识别,若人脸识别结果成功,可正常开始在线培训学习,后台自动调取与该用户学习内容相关的学习资料;若人脸识别结果未成功,提示用户未成功并重新扫描;
步骤3.进行过程跟踪:
在线学习视频播放过程中随时启动网络摄像头抓拍用户面部信息,且在线学习视频播放过程中启动收音设备,定时采集用户的声音指令,根据定时采集到的声音指令和面部信息,实现用户的定位,如声音指令和面部信息不符,则对用户做出提醒并暂停播放。
进一步的,所述步骤2中的人脸识别包括基于静态图像的人脸识别和基于视频图像的人脸识别,基于静态图像的人脸识别算法同样适用于基于视频图像的人脸识别,只有使用了时间信息的识别算法才属于基于视频图像的人脸识别算法。
所述人脸识别的算法可以为特征脸方法,所述特征脸方法可以利用主分量分析方法进行降维和提取特征,所述主分量分析方法选择与原数据协方差矩阵的若干个最大特征值对应的特征向量构成一组基,以达到最佳表征原数据的目的;在人脸识别中,由一组特征脸基图象张成一个特征脸子空间,任何一幅人脸图象都可投影到该子空间,得到一个权值向量。计算此向量和训练集中每个人的权值向量之间的欧式距离,取最小距离所对应的人脸图像的身份作为用户人脸图像的身份。所述主分量是指向数据能量分布最大的轴线方向,可以从最小均方误差意义下对数据进行最优的表达。
所述特征脸方法也可以用线性鉴别分析方法,属于模式识别方法,通过将样本线性变换到一个新的空间,使样本的类内散布程度达到最小,同时类间散布程度达到最大,即Fisher准则。
进一步的,所述步骤1中将声音指令分析处理后转化成音频数据代码的方法如下:
(1)将声音指令进行预处理,即先进行预加重,再进行分帧加窗处理,最后再进行端点检测;所述分帧加窗处理采用Hamming窗;
(2)用Mel频率的倒谱系数作为语音特征识别孤立词语语音,最后组合成音频数据代码,具体方法如下:
首先,将预处理后的声音指令输入Hamming窗帧选,经过Hamming窗帧选的数据进行傅里叶变换;
然后,将傅里叶变换后的数据以滤波组能量的形式输出至进行离散余弦变换,最终输出可识别的音频数据代码。
本发明的有益效果如下:
本方法不仅在开启时启动人脸识别,且在线培训过程中一定时间间隔下进行人脸识别监视,能够有效监控在线用户的在线时间且能确保进行在线培训的过程中均是本人,避免作弊和替他人学习的情况;另外通过声音指令操作在线视频的相关操作,例如播放、停止、快进、截图及选集等等;不仅方便使用,而且能实时通过声音指令确认用户在线,且通过声音指令还能提升用户体验,提高用户在线培训的兴趣。
具体实施方式
为使本发明要解决的技术问题、技术方案和有益效果更加清楚,下面将结合具体实施例进行详细描述。
本实施例的实现方法如下:
步骤1.搭建声像过程跟踪平台,设置后台模块:
提前通过人脸扫描设备拍摄用户的面部特征,并与用户声明的身份信息绑定;将面部特征分析处理后转化成图像数据代码,并将所述图像数据代码存储到位于在线培训平台上的图像数据代码数据库中;提前利用收音设备录制声音指令,将声音指令分析处理后转化成音频数据代码,并将所述音频数据代码存储到位于在线培训平台上的音频数据库中;
步骤2.进行身份认证:
通过通信网络接受用户终端的登录请求,进行身份认证,同时启动网络摄像头扫描用户面部信息,传输至后台进行人脸识别,若人脸识别结果成功,可正常开始在线培训学习,后台自动调取与该用户学习内容相关的学习资料;若人脸识别结果未成功,提示用户未成功并重新扫描;
步骤3.进行过程跟踪:
在线学习视频播放过程中随时启动网络摄像头抓拍用户面部信息,且在线学习视频播放过程中启动收音设备,定时采集用户的声音指令,根据定时采集到的声音指令和面部信息,实现用户的定位,如声音指令和面部信息不符,则对用户做出提醒并暂停播放。
进一步的,所述步骤2中的人脸识别包括基于静态图像的人脸识别和基于视频图像的人脸识别,基于静态图像的人脸识别算法同样适用于基于视频图像的人脸识别,只有使用了时间信息的识别算法才属于基于视频图像的人脸识别算法。
所述人脸识别的算法可以为特征脸方法,所述特征脸方法可以利用主分量分析方法进行降维和提取特征,所述主分量分析方法选择与原数据协方差矩阵的若干个最大特征值对应的特征向量构成一组基,以达到最佳表征原数据的目的;在人脸识别中,由一组特征脸基图象张成一个特征脸子空间,任何一幅人脸图象都可投影到该子空间,得到一个权值向量。计算此向量和训练集中每个人的权值向量之间的欧式距离,取最小距离所对应的人脸图像的身份作为用户人脸图像的身份。所述主分量是指向数据能量分布最大的轴线方向,可以从最小均方误差意义下对数据进行最优的表达。
所述特征脸方法也可以用线性鉴别分析方法,属于模式识别方法,通过将样本线性变换到一个新的空间,使样本的类内散布程度达到最小,同时类间散布程度达到最大,即Fisher准则。
进一步的,所述步骤1中将声音指令分析处理后转化成音频数据代码的方法如下:
(1)将声音指令进行预处理,即先进行预加重,再进行分帧加窗处理,最后再进行端点检测;所述分帧加窗处理采用Hamming窗;
(2)用Mel频率的倒谱系数作为语音特征识别孤立词语语音,最后组合成音频数据代码,具体方法如下:
首先,将预处理后的声音指令输入Hamming窗帧选,经过Hamming窗帧选的数据进行傅里叶变换;
然后,将傅里叶变换后的数据以滤波组能量的形式输出至进行离散余弦变换,最终输出可识别的音频数据代码。
以上利用具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;对于本领域技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (5)
1.一种基于声像过程跟踪的在线培训监视方法,其特征在于,包括如下步骤:
步骤1.搭建声像过程跟踪平台,设置后台模块:
提前通过人脸扫描设备拍摄用户的面部特征,并与用户声明的身份信息绑定;将面部特征分析处理后转化成图像数据代码,并将所述图像数据代码存储到位于在线培训平台上的图像数据代码数据库中;提前利用收音设备录制声音指令,将声音指令分析处理后转化成音频数据代码,并将所述音频数据代码存储到位于在线培训平台上的音频数据库中;
步骤2.进行身份认证:
通过通信网络接受用户终端的登录请求,进行身份认证,同时启动网络摄像头扫描用户面部信息,传输至后台进行人脸识别,若人脸识别结果成功,可正常开始在线培训学习,后台自动调取与该用户学习内容相关的学习资料;若人脸识别结果未成功,提示用户未成功并重新扫描;
步骤3.进行过程跟踪:
在线学习视频播放过程中随时启动网络摄像头抓拍用户面部信息,且在线学习视频播放过程中启动收音设备,定时采集用户的声音指令,根据定时采集到的声音指令和面部信息,实现用户的定位,如声音指令和面部信息不符,则对用户做出提醒并暂停播放。
2.根据权利要求1所述一种基于声像过程跟踪的在线培训监视方法,其特征在于:所述步骤2中的人脸识别包括基于静态图像的人脸识别和基于视频图像的人脸识别。
3.根据权利要求1所述一种基于声像过程跟踪的在线培训监视方法,其特征在于:所述步骤1中将声音指令分析处理后转化成音频数据代码的方法如下:
(1)将声音指令进行预处理,即先进行预加重,再进行分帧加窗处理,最后再进行端点检测;
(2)用Mel频率的倒谱系数作为语音特征识别孤立词语语音,最后组合成音频数据代码。
4.根据权利要求3所述一种基于声像过程跟踪的在线培训监视方法,其特征在于:所述分帧加窗处理采用Hamming窗。
5.根据权利要求3所述一种基于声像过程跟踪的在线培训监视方法,其特征在于:所述用Mel频率的倒谱系数作为语音特征识别孤立词语语音的方法如下:
首先,将预处理后的声音指令输入Hamming窗帧选,经过Hamming窗帧选的数据进行傅里叶变换;
然后,将傅里叶变换后的数据以滤波组能量的形式输出至进行离散余弦变换,最终输出可识别的音频数据代码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510878517.5A CN105528578A (zh) | 2015-12-04 | 2015-12-04 | 一种基于声像过程跟踪的在线培训监视方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510878517.5A CN105528578A (zh) | 2015-12-04 | 2015-12-04 | 一种基于声像过程跟踪的在线培训监视方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105528578A true CN105528578A (zh) | 2016-04-27 |
Family
ID=55770792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510878517.5A Pending CN105528578A (zh) | 2015-12-04 | 2015-12-04 | 一种基于声像过程跟踪的在线培训监视方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105528578A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106850667A (zh) * | 2017-03-03 | 2017-06-13 | 杭州智贝信息科技有限公司 | 一种持续认证安全防护系统及其方法 |
CN108647509A (zh) * | 2018-05-11 | 2018-10-12 | 北京北信源信息安全技术有限公司 | 一种防止敏感文件泄露的方法及装置 |
CN111104882A (zh) * | 2019-12-09 | 2020-05-05 | 曹玉平 | 一种扫描识别方法 |
CN117670616A (zh) * | 2023-12-18 | 2024-03-08 | 中国矿业大学 | 基于图像识别及位置匹配的在线学习状态监测方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102013176A (zh) * | 2010-12-01 | 2011-04-13 | 曹乃承 | 在线学习系统 |
US20120268580A1 (en) * | 2011-04-12 | 2012-10-25 | Hyun Kim | Portable computing device with intelligent robotic functions and method for operating the same |
CN102905185A (zh) * | 2012-10-26 | 2013-01-30 | 四川长虹电器股份有限公司 | 全语音控制html5视频播放的方法 |
CN103218763A (zh) * | 2013-03-26 | 2013-07-24 | 陈秀成 | 一种高可信度的远程在线面试的方法与系统 |
CN103546452A (zh) * | 2013-08-22 | 2014-01-29 | 国家电网公司 | 基于网络平台的分布式考试防作弊系统和防作弊方法 |
CN104376250A (zh) * | 2014-12-03 | 2015-02-25 | 优化科技(苏州)有限公司 | 基于音型像特征的真人活体身份验证方法 |
-
2015
- 2015-12-04 CN CN201510878517.5A patent/CN105528578A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102013176A (zh) * | 2010-12-01 | 2011-04-13 | 曹乃承 | 在线学习系统 |
US20120268580A1 (en) * | 2011-04-12 | 2012-10-25 | Hyun Kim | Portable computing device with intelligent robotic functions and method for operating the same |
CN102905185A (zh) * | 2012-10-26 | 2013-01-30 | 四川长虹电器股份有限公司 | 全语音控制html5视频播放的方法 |
CN103218763A (zh) * | 2013-03-26 | 2013-07-24 | 陈秀成 | 一种高可信度的远程在线面试的方法与系统 |
CN103546452A (zh) * | 2013-08-22 | 2014-01-29 | 国家电网公司 | 基于网络平台的分布式考试防作弊系统和防作弊方法 |
CN104376250A (zh) * | 2014-12-03 | 2015-02-25 | 优化科技(苏州)有限公司 | 基于音型像特征的真人活体身份验证方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106850667A (zh) * | 2017-03-03 | 2017-06-13 | 杭州智贝信息科技有限公司 | 一种持续认证安全防护系统及其方法 |
CN108647509A (zh) * | 2018-05-11 | 2018-10-12 | 北京北信源信息安全技术有限公司 | 一种防止敏感文件泄露的方法及装置 |
CN111104882A (zh) * | 2019-12-09 | 2020-05-05 | 曹玉平 | 一种扫描识别方法 |
CN117670616A (zh) * | 2023-12-18 | 2024-03-08 | 中国矿业大学 | 基于图像识别及位置匹配的在线学习状态监测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111488433B (zh) | 一种适用于银行的提升现场体验感的人工智能交互系统 | |
CN107527620B (zh) | 电子装置、身份验证的方法及计算机可读存储介质 | |
WO2021082941A1 (zh) | 视频人物识别方法、装置、存储介质与电子设备 | |
WO2018166187A1 (zh) | 服务器、身份验证方法、系统及计算机可读存储介质 | |
CN105702263B (zh) | 语音重放检测方法和装置 | |
CA2898779C (en) | User authentication method and apparatus based on audio and video data | |
CN104834849B (zh) | 基于声纹识别和人脸识别的双因素身份认证方法及系统 | |
CN105528578A (zh) | 一种基于声像过程跟踪的在线培训监视方法 | |
WO2017206375A1 (zh) | 声纹注册、认证方法及装置 | |
CN102592116A (zh) | 一种云计算应用方法、系统及终端设备、云计算平台 | |
Baloul et al. | Challenge-based speaker recognition for mobile authentication | |
CN103794207A (zh) | 一种双模语音身份识别方法 | |
CN109410911A (zh) | 基于语音识别的人工智能学习方法 | |
WO2019228091A1 (zh) | 考勤管理的方法和考勤管理设备 | |
US10984795B2 (en) | Electronic apparatus and operation method thereof | |
CN105872619A (zh) | 一种视频播放记录的匹配方法及匹配装置 | |
CN104732972A (zh) | 一种基于分组统计的hmm声纹识别签到方法及系统 | |
CN108694952B (zh) | 电子装置、身份验证的方法及存储介质 | |
WO2019101099A1 (zh) | 视频节目识别方法、设备、终端、系统和存储介质 | |
CN107809665A (zh) | 基于声像的在线培训监视方法 | |
KR102714096B1 (ko) | 전자 장치 및 그 동작 방법 | |
Ghaemmaghami et al. | Complete-linkage clustering for voice activity detection in audio and visual speech | |
CN111611437A (zh) | 一种防止人脸声纹验证替换攻击的方法及装置 | |
CN113436633B (zh) | 说话人识别方法、装置、计算机设备及存储介质 | |
CN204576520U (zh) | 基于声纹识别和人脸识别的双因素身份认证装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160427 |
|
RJ01 | Rejection of invention patent application after publication |