CN103247197A - 一种基于声纹识别的用户在线学习监测方法 - Google Patents

一种基于声纹识别的用户在线学习监测方法 Download PDF

Info

Publication number
CN103247197A
CN103247197A CN 201310108850 CN201310108850A CN103247197A CN 103247197 A CN103247197 A CN 103247197A CN 201310108850 CN201310108850 CN 201310108850 CN 201310108850 A CN201310108850 A CN 201310108850A CN 103247197 A CN103247197 A CN 103247197A
Authority
CN
China
Prior art keywords
user
voice
sigma
voiceprint recognition
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201310108850
Other languages
English (en)
Inventor
许东星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI ZHONGSHI TECHNOLOGY DEVELOPMENT Co Ltd
Original Assignee
SHANGHAI ZHONGSHI TECHNOLOGY DEVELOPMENT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI ZHONGSHI TECHNOLOGY DEVELOPMENT Co Ltd filed Critical SHANGHAI ZHONGSHI TECHNOLOGY DEVELOPMENT Co Ltd
Priority to CN 201310108850 priority Critical patent/CN103247197A/zh
Publication of CN103247197A publication Critical patent/CN103247197A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于声纹识别的用户在线学习监测方法,包括如下步骤:a)当用户通过在线学习系统注册账户时,采集该用户的语音并提取声纹特征;b)在通用的用户声纹模型基础上,根据该用户语音的声纹特征,为当前帐号建立一个该用户的声纹模型;c)用户每次登录系统进行口语学习时,先将监测到登录用户的语音上传到服务器;d)提取该段语音的声纹特征并与该用户注册的声纹模型进行匹配,若匹配成功,则证明是用户本人在学习;反之及时报警并提醒用户。本发明提供的基于声纹识别的用户在线学习监测方法,通过采集用户口语学习中的语音并提取声纹特征,能够对用户的身份进行实时监测,保护用户的账户安全,监测用户的口语学习状况。

Description

一种基于声纹识别的用户在线学习监测方法
技术领域
本发明涉及一种用户在线学习监测方法,尤其涉及一种基于声纹识别的用户在线学习监测方法。
背景技术
计算机辅助语言教学(computer-assisted language learning,简称CALL),按照人们事先安排的语言教学计划和内容进行课堂教学和辅助课外操。早在1955年左右就有人探讨如何把计算机用于教育。现在,计算机辅助语言教学和远程网络结合起来广泛应用于口语学习。在线口语学习平台因时间自由,费用低廉,越来越得到普通用户的青睐;而对于口语学习平台来说,用户的增加,若不增加师资力量,必然导致单个用户资源的不足,而当今社会,人力成本越来越高,如何有效的监管用户的学习情况,已成为摆在口语学习平台的一个重要问题。
同时,用户帐号是用户在线学习的重要凭证,传统的帐号保护如密码、安全卡都是一次认证,即用户登录的时候进行一次认证,后续使用过程将不需要再次认证,存在一定的安全隐患;利用口语学习通常需要语音的特点,可以通过对语音对用户帐号安全进行实时监控,以进一步保障帐号安全。
发明内容
本发明所要解决的技术问题是提供一种基于声纹识别的用户在线学习监测方法,能够对用户的身份进行实时监测,保护用户的账户安全,监测用户的口语学习状况。
本发明为解决上述技术问题而采用的技术方案是提供一种基于声纹识别的用户在线学习监测方法,包括如下步骤:a)当用户通过在线学习系统注册账户时,采集该用户的语音并提取声纹特征;b)在通用的用户声纹模型基础上,根据该用户语音的声纹特征,为当前帐号建立一个该用户的声纹模型;c)用户每次登录系统进行口语学习时,先将监测到登录用户的语音上传到服务器;d)提取该段语音的声纹特征并与该用户注册的声纹模型进行匹配,若匹配成功,则证明是用户本人在学习;反之,若匹配不成功,及时报警并提醒用户。
上述的基于声纹识别的用户在线学习监测方法,其中,所述声纹特征为梅尔倒谱参数:(X0,…,Xi,…XN-1),其中,Xi代表第i帧梅尔倒谱参数,N为总帧数,i为自然数,1≤i≤N-1。
上述的基于声纹识别的用户在线学习监测方法,其中,所述梅尔倒谱参数中语音帧长度为100~500帧,每帧100毫秒。
上述的基于声纹识别的用户在线学习监测方法,其中,所述通用的用户声纹模型λubm和用户的声纹模型λuser都为高斯混合模型:
λubm={ωmmm,m=1…M};
λuser={ω′m,μ′m,Σ′m,m=1…M};
所述步骤d)中匹配过程包括计算声纹匹配度score,若声纹匹配度score大于预设阈值则匹配成功,所述声纹匹配度score计算如下:
score = 1 N Σ i = 0 N - 1 log ( Σ m = 1 M ω m ′ 1 ( 2 π ) D / 2 | Σ m ′ | 1 / 2 exp { - 1 2 ( X i - μ m ′ ) T Σ m ′ - 1 ( X i - μ m ′ ) } )
- 1 N Σ i = 0 N - 1 log ( Σ m = 1 M ω m 1 ( 2 π ) D / 2 | Σ m | 1 / 2 exp { - 1 2 ( X i - μ m ) T Σ m - 1 ( X i - μ m ) } )
式中M为高斯混合模型的个数,D为维数;ωm、μm、Σm表示所述通用的用户声纹模型中第m个混合度的权重、均值、方差;ω′m、μ′m、Σ′m表示所述用户的声纹户模型中第m个混合度的权重、均值、方差,m为自然数,1≤m≤M。
上述的基于声纹识别的用户在线学习监测方法,其中,还包括实时采集用户口语学习中的语音送到服务器用于身份验证,重复步骤d)进行当前学习用户的身份识别监控。
上述的基于声纹识别的用户在线学习监测方法,其中,对于声纹模型匹配成功的用户语音进行口语自动评测统计,并将评测结果相关信息记录到用户的个人数据库中。
上述的基于声纹识别的用户在线学习监测方法,其中,所述评测结果相关信息包括发音标准度、发音单元的时长、发音单元之间的停顿、声调和语速信息。
本发明对比现有技术有如下的有益效果:本发明提供的基于声纹识别的用户在线学习监测方法,通过采集用户口语学习中的语音并提取声纹特征,能够对用户的身份进行实时监测,保护用户的账户安全,监测用户的口语学习状况。
附图说明
图1为本发明基于声纹识别的用户在线学习监测流程示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
图1为本发明基于声纹识别的用户在线学习监测流程示意图。
请参见图1,本发明提供的基于声纹识别的用户在线学习监测方法包括如下步骤:
S101:当用户通过在线学习系统注册账户时,采集该用户的语音并提取声纹特征。声纹指人的语音所蕴含的身份信息,声纹认证又称说话人确认,属于自动说话人识别的一种,即通过语音自动对说话人的身份进行确认。声纹特征可采用短时倒谱参数,如梅尔倒谱参数:(X0,…,Xi,…XN-1),其中,Xi代表第i帧梅尔倒谱参数,N为总帧数,i为自然数,1≤i≤N-1。综合考虑识别速度和准确率,所述倒谱参数中语音帧长度为100~500帧,每帧100毫秒。
S102:根据该用户语音的声纹特征,利用通用的用户声纹模型,自适应为当前帐号建立一个该用户的声纹模型。通用的用户声纹模型是通过采集大量语音建立的一个与说话人无关、与具体环境无关的通用的声纹模型。如通用背景模型(UBM),本质上是一个高斯混合模型,其参数可描述为λubm={ωmmm,m=1...M},M为高斯混合模型的个数,根据经验,优选取值1024,其中ωm、μm、Σm表示第m个混合度的权重、均值、方差,模型的参数可以通过LBG算法获取一个初值,并利用最大期望(EM)算法重估参数。
LBG算法由Linde,Buzo和Gray于1980年提出,又称为K-means算法。该算法是基于最近邻原则把训练矢量分配到与它欧式距离最小的码字的簇中。码书设计是基于以下两条优化准则:1)最近领域准则。即对于给定码书,训练矢量集的最优分类可通过把每个训练矢量映射为离它最近的码字而得到;训练矢量xi按最近领域的准则,聚类到码字yj中,该隶属度函数μj(xi)定义为:
Figure BDA00002989400000031
2)质心条件。即对于给定的训练矢量分类,其对应的最优码书中各码字是通过求各簇的中心矢量而获得,即:
y j = Σ i = 1 M μ j ( x i ) x i μ j ( x i )
在通用背景模型的基础上,利用用户的语音自适应更新得到用户模型;用户模型λuser={ω′m,μ′m,Σ′m,m=1…M},M为高斯混合模型的个数,与UBM的M相同,其中ω′m,μ′m,Σ′m表示第m个混合度的权重、均值、方差;可通过MAP算法从UBM的参数更新获得。
S103:用户每次登录系统进行口语学习时,先将监测到登录用户的语音上传到服务器。
S104:提取该段语音的声纹特征并与该用户注册的声纹模型进行匹配,若匹配成功,则证明是用户本人在学习;反之,若匹配不成功,则表示采集的语音非注册账户的,用户账户可能存在危险,及时提醒用户。声纹模型匹配可以通过计算声纹匹配度score实现。从用户语音中提取声纹特征Xi,(0≤i<N),假设通用背景模型为λubm,用户模型为λuser,声纹匹配度score计算如下:
score=log(P(X|λuser))–log(P(X|λubm))
对于本发明采用的高斯混合模型,将参数代入可得到:
score = 1 N Σ i = 0 N - 1 log ( Σ m = 1 M ω m ′ 1 ( 2 π ) D / 2 | Σ m ′ | 1 / 2 exp { - 1 2 ( X i - μ m ′ ) T Σ m ′ - 1 ( X i - μ m ′ ) } )
- 1 N Σ i = 1 N - 1 log ( Σ m = 1 M ω m 1 ( 2 π ) D / 2 | Σ m | 1 / 2 exp { - 1 2 ( X i - μ m ) T Σ m - 1 ( X i - μ m ) } )
score为浮点数,取值一般在0附近,也可通过一些评分规则的方式进行进一步的处理,如均值规则、模型规则等;阈值为θ,其值在开发集合上训练获取,若score≥θ,则判定匹配成功,若score<θ,则判定匹配不成功。
为了实现对用户的身份进行实时监测,在用户学习口语的过程中,可以实时采集用户口语学习中的语音送到服务器用于身份验证,重复步骤S104进行当前学习用户的身份识别监控,若匹配不成功,则表示当前采集的语音非注册账户的,不是本人在学习。最后,根据用户需要,可以对匹配成功的口语发音进行口语自动评测,得到用户此段发音的评测结果,比如获取用户发音单元的发音标准度、发音单元的时长、发音单元之间的停顿、声调、语速等信息,并将评测结果相关信息记录到用户的个人数据库中。比如统计分析用户历史学习的口语评测结果,判定用户口语学习的问题所在,如经常发错的音素有哪些等等。
综上所述,本发明提供的基于声纹识别的用户在线学习监测方法,通过采集用户口语学习中的语音并提取声纹特征,能够对用户的身份进行实时监测,保护用户的账户安全,监测用户的口语学习状况。
虽然本发明已以较佳实施例揭示如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围内,当可作些许的修改和完善,因此本发明的保护范围当以权利要求书所界定的为准。

Claims (7)

1.一种基于声纹识别的用户在线学习监测方法,其特征在于,包括如下步骤:
a)当用户通过在线学习系统注册账户时,采集该用户的语音并提取声纹特征;
b)在通用的用户声纹模型基础上,根据该用户语音的声纹特征,为当前帐号建立一个该用户的声纹模型;
c)用户每次登录系统进行口语学习时,先将监测到登录用户的语音上传到服务器;
d)提取该段语音的声纹特征并与该用户注册的声纹模型进行匹配,若匹配成功,则证明是用户本人在学习;反之,若匹配不成功,及时报警并提醒用户。
2.如权利要求1所述的基于声纹识别的用户在线学习监测方法,其特征在于,所述声纹特征为梅尔倒谱参数:(X0,…,Xi,…XN-1),其中,Xi代表第i帧梅尔倒谱参数,N为总帧数,i为自然数,1≤i≤N-1。
3.如权利要求2所述的基于声纹识别的用户在线学习监测方法,其特征在于,所述梅尔倒谱参数中语音帧长度为100~500帧,每帧100毫秒。
4.如权利要求2所述的基于声纹识别的用户在线学习监测方法,其特征在于,所述通用的用户声纹模型λubm和用户的声纹模型λuser都为高斯混合模型:
λubm={ωmmm,m=1…M};
λuser={ω′m,μ′m,Σ′m,m=1…M};
所述步骤d)中匹配过程包括计算声纹匹配度score,若声纹匹配度score大于预设阈值则匹配成功,所述声纹匹配度score计算如下:
score = 1 N &Sigma; i = 0 N - 1 log ( &Sigma; m = 1 M &omega; m &prime; 1 ( 2 &pi; ) D / 2 | &Sigma; m &prime; | 1 / 2 exp { - 1 2 ( X i - &mu; m &prime; ) T &Sigma; m &prime; - 1 ( X i - &mu; m &prime; ) } )
- 1 N &Sigma; i = 0 N - 1 log ( &Sigma; m = 1 M &omega; m 1 ( 2 &pi; ) D / 2 | &Sigma; m | 1 / 2 exp { - 1 2 ( X i - &mu; m ) T &Sigma; m - 1 ( X i - &mu; m ) } )
式中M为高斯混合模型的个数,D为维数;ωm、μm、Σm表示所述通用的用户声纹模型中第m个混合度的权重、均值、方差;ω′m、μ′m、Σ′m表示所述用户的声纹户模型中第m个混合度的权重、均值、方差,m为自然数,1≤m≤M。
5.如权利要求1~4任一项所述的基于声纹识别的用户在线学习监测方法,其特征在于,还包括实时采集用户口语学习中的语音送到服务器用于身份验证,重复步骤d)进行当前学习用户的身份识别监控。
6.如权利要求5所述的基于声纹识别的用户在线学习监测方法,其特征在于,对于声纹模型匹配成功的用户语音进行口语自动评测统计,并将评测结果相关信息记录到用户的个人数据库中。
7.如权利要求6所述的基于声纹识别的用户在线学习监测方法,其特征在于,所述评测结果相关信息包括发音标准度、发音单元的时长、发音单元之间的停顿、声调和语速信息。
CN 201310108850 2013-03-29 2013-03-29 一种基于声纹识别的用户在线学习监测方法 Pending CN103247197A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201310108850 CN103247197A (zh) 2013-03-29 2013-03-29 一种基于声纹识别的用户在线学习监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201310108850 CN103247197A (zh) 2013-03-29 2013-03-29 一种基于声纹识别的用户在线学习监测方法

Publications (1)

Publication Number Publication Date
CN103247197A true CN103247197A (zh) 2013-08-14

Family

ID=48926694

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201310108850 Pending CN103247197A (zh) 2013-03-29 2013-03-29 一种基于声纹识别的用户在线学习监测方法

Country Status (1)

Country Link
CN (1) CN103247197A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104064062A (zh) * 2014-06-23 2014-09-24 中国石油大学(华东) 一种基于声纹和语音识别的在线听力学习方法及系统
CN104821882A (zh) * 2015-05-08 2015-08-05 南京财经大学 一种基于语音生物特征的网络安全验证方法
CN105227557A (zh) * 2015-10-10 2016-01-06 北京云知声信息技术有限公司 一种帐号处理方法及装置
CN105869644A (zh) * 2016-05-25 2016-08-17 百度在线网络技术(北京)有限公司 基于深度学习的声纹认证方法和装置
CN106100846A (zh) * 2016-06-02 2016-11-09 百度在线网络技术(北京)有限公司 声纹注册、认证方法及装置
CN107195077A (zh) * 2017-07-19 2017-09-22 浙江联运环境工程股份有限公司 瓶子智能回收机
CN107251033A (zh) * 2014-12-22 2017-10-13 迈克菲公司 用于在在线教育中进行实时用户验证的系统和方法
CN107945808A (zh) * 2017-12-08 2018-04-20 广州势必可赢网络科技有限公司 一种基于声纹识别的客户管理方法及装置
CN108922278A (zh) * 2018-08-20 2018-11-30 广东小天才科技有限公司 一种人机交互方法及学习设备
CN108921745A (zh) * 2018-07-02 2018-11-30 上海东巍体育科技有限公司 一种用于私教训练的账户登录管理系统及方法
CN108932185A (zh) * 2018-06-22 2018-12-04 江苏乐知音网络营销有限公司 一种智能警戒识别语音系统
CN109032885A (zh) * 2018-06-21 2018-12-18 江苏乐知音网络营销有限公司 一种人员信息控制系统
CN109637543A (zh) * 2018-12-12 2019-04-16 平安科技(深圳)有限公司 语音卡的语音数据处理方法和装置
CN109637097A (zh) * 2018-12-12 2019-04-16 深圳市沃特沃德股份有限公司 学习状态监测方法、装置及智能设备
CN110412368A (zh) * 2019-06-27 2019-11-05 安徽继远软件有限公司 基于声纹识别的电力设备在线监测方法及系统
CN110689894A (zh) * 2019-08-15 2020-01-14 深圳市声扬科技有限公司 自动注册方法及装置、智能设备
CN110797029A (zh) * 2019-10-24 2020-02-14 秒针信息技术有限公司 一种基于语音识别的在岗监测的方法、系统及设备

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104064062A (zh) * 2014-06-23 2014-09-24 中国石油大学(华东) 一种基于声纹和语音识别的在线听力学习方法及系统
CN111611908B (zh) * 2014-12-22 2023-08-29 迈克菲有限责任公司 用于在在线教育中进行实时用户验证的系统和方法
CN107251033B (zh) * 2014-12-22 2020-06-12 迈克菲有限责任公司 用于在在线教育中进行实时用户验证的系统和方法
CN111611908A (zh) * 2014-12-22 2020-09-01 迈克菲有限责任公司 用于在在线教育中进行实时用户验证的系统和方法
US10909354B2 (en) 2014-12-22 2021-02-02 Mcafee, Llc Systems and methods for real-time user verification in online education
CN107251033A (zh) * 2014-12-22 2017-10-13 迈克菲公司 用于在在线教育中进行实时用户验证的系统和方法
CN104821882A (zh) * 2015-05-08 2015-08-05 南京财经大学 一种基于语音生物特征的网络安全验证方法
CN105227557A (zh) * 2015-10-10 2016-01-06 北京云知声信息技术有限公司 一种帐号处理方法及装置
WO2017059679A1 (zh) * 2015-10-10 2017-04-13 北京云知声信息技术有限公司 一种帐号处理方法及装置
CN105869644A (zh) * 2016-05-25 2016-08-17 百度在线网络技术(北京)有限公司 基于深度学习的声纹认证方法和装置
CN106100846A (zh) * 2016-06-02 2016-11-09 百度在线网络技术(北京)有限公司 声纹注册、认证方法及装置
CN107195077A (zh) * 2017-07-19 2017-09-22 浙江联运环境工程股份有限公司 瓶子智能回收机
CN107945808A (zh) * 2017-12-08 2018-04-20 广州势必可赢网络科技有限公司 一种基于声纹识别的客户管理方法及装置
CN109032885A (zh) * 2018-06-21 2018-12-18 江苏乐知音网络营销有限公司 一种人员信息控制系统
CN108932185A (zh) * 2018-06-22 2018-12-04 江苏乐知音网络营销有限公司 一种智能警戒识别语音系统
CN108921745A (zh) * 2018-07-02 2018-11-30 上海东巍体育科技有限公司 一种用于私教训练的账户登录管理系统及方法
CN108922278A (zh) * 2018-08-20 2018-11-30 广东小天才科技有限公司 一种人机交互方法及学习设备
CN109637097A (zh) * 2018-12-12 2019-04-16 深圳市沃特沃德股份有限公司 学习状态监测方法、装置及智能设备
CN109637543A (zh) * 2018-12-12 2019-04-16 平安科技(深圳)有限公司 语音卡的语音数据处理方法和装置
CN110412368A (zh) * 2019-06-27 2019-11-05 安徽继远软件有限公司 基于声纹识别的电力设备在线监测方法及系统
CN110689894A (zh) * 2019-08-15 2020-01-14 深圳市声扬科技有限公司 自动注册方法及装置、智能设备
CN110689894B (zh) * 2019-08-15 2022-03-29 深圳市声扬科技有限公司 自动注册方法及装置、智能设备
CN110797029A (zh) * 2019-10-24 2020-02-14 秒针信息技术有限公司 一种基于语音识别的在岗监测的方法、系统及设备

Similar Documents

Publication Publication Date Title
CN103247197A (zh) 一种基于声纹识别的用户在线学习监测方法
AU2013203139B2 (en) Voice authentication and speech recognition system and method
CN107222865A (zh) 基于可疑行为识别的通讯诈骗实时检测方法和系统
EP3435374A1 (en) Method and device for voice data processing and storage medium
CN110750774B (zh) 身份识别的方法及装置
CN104765996B (zh) 声纹密码认证方法及系统
CN102238190A (zh) 身份认证方法及系统
CN107492382A (zh) 基于神经网络的声纹信息提取方法及装置
CN110782921A (zh) 语音测评方法和装置、存储介质及电子装置
CN101241699A (zh) 一种远程汉语教学中的说话人确认系统
CN107368971A (zh) 一种个人信用的评分方法及装置
CN112435673A (zh) 一种模型训练方法及电子终端
CN109326162A (zh) 一种口语练习自动评测方法及装置
CN110349586B (zh) 电信诈骗检测方法及装置
US20240169994A1 (en) Method and system for user voice identification using ensembled deep learning algorithms
CN107133709A (zh) 一种客户服务的质量检验方法、装置及系统
CN103207961A (zh) 用户验证方法和装置
CN110704618B (zh) 确定对话数据对应的标准问题的方法及装置
US20210166715A1 (en) Encoded features and rate-based augmentation based speech authentication
Zhang et al. Voice biometric identity authentication system based on android smart phone
CN108806686B (zh) 一种语音搜题应用的启动控制方法及家教设备
US11514815B1 (en) System, method, and device for generating flight training scheme oriented to individual difference
CN106991312A (zh) 基于声纹识别的互联网反欺诈认证方法
CN115205764B (zh) 基于机器视觉的在线学习专注度监测方法、系统及介质
CN112951215B (zh) 语音的智能客服回答方法、装置以及计算机设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130814